CN114240505B - 一种基于大数据的空气净化器推荐系统及方法 - Google Patents
一种基于大数据的空气净化器推荐系统及方法 Download PDFInfo
- Publication number
- CN114240505B CN114240505B CN202111570390.2A CN202111570390A CN114240505B CN 114240505 B CN114240505 B CN 114240505B CN 202111570390 A CN202111570390 A CN 202111570390A CN 114240505 B CN114240505 B CN 114240505B
- Authority
- CN
- China
- Prior art keywords
- purifier
- candidate
- webpage
- module
- browsing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0255—Targeted advertisements based on user history
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0255—Targeted advertisements based on user history
- G06Q30/0256—User search
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于大数据的空气净化器推荐系统及方法,所述推荐系统包括数据池建立模块、候选净化器选取模块和排序推送模块,所述数据池建立模块获取用户终端的网页浏览信息,根据其中的关键字信息建立净化器商品数据池,所述候选净化器选取模块采集用户习惯特征,并据此从净化器商品数据池中选取净化器作为候选净化器,所述排序推送模块将各个候选净化器进行优先级排序,将各个候选净化器按照优先级排序从前到后的顺序推送给用户终端;本发明通过采集分析多个因素选取合适的净化器型号进行推送,从而使得推送给用户的候选净化器更加具有针对性,提高用户的使用体验。
Description
技术领域
本发明涉及大数据技术领域,具体为一种基于大数据的空气净化器推荐系统及方法。
背景技术
空气中含有大量的污染物,是引发呼吸系统疾病的重要原因之一。这些污染物比如细菌、灰尘、二氧化碳、甲醛等有害物质在人体吸入后,对身体的器官、呼吸道、肺部等造成或多或少的影响,空气净化器能够吸附、分解或转化各种空气污染物包括PM2.5、粉尘、花粉、异味、甲醛之类的装修污染、细菌、过敏原等,有效提高空气清洁度的产品,使得空气变得清新和健康。随着经济的快速发展,人们生活水平的提高,人们对于生活的品质也逐渐提高,购买使用空气净化器的用户越来越多,但是市面上的空气净化器种类繁多,如何给用户推送推荐合适的空气净化器是一个问题。
发明内容
本发明的目的在于提供一种基于大数据的空气净化器推荐系统及方法,以解决上述背景技术中提出的问题。
为了解决上述技术问题,本发明提供如下技术方案:一种基于大数据的空气净化器推荐系统,所述推荐系统包括数据池建立模块、候选净化器选取模块和排序推送模块,所述数据池建立模块获取用户终端的网页浏览信息,根据其中的关键字信息建立净化器商品数据池,所述候选净化器选取模块采集用户习惯特征,并据此从净化器商品数据池中选取净化器作为候选净化器,所述排序推送模块将各个候选净化器进行优先级排序,将各个候选净化器按照优先级排序从前到后的顺序推送给用户终端。
进一步的,所述数据池建立模块包括候选网页选取模块、第一有效值获取模块、优选网页选取模块、篇幅划分模块、浏览时长比较模块、篇幅分类模块、第二有效比值获取模块、第二有效比值比较模块和型号筛选模块,所述候选网页选取模块当某个网页浏览信息中包含关键字信息时,那么该网页为候选网页,其中,关键字信息包括空气净化器或者净化器,所述第一有效值获取模块采集用户浏览某个候选网页信息时的浏览内容篇幅,获取该个候选网页信息时的浏览内容篇幅占整个候选网页的信息篇幅的比值为该个候选网页的第一有效比值,所述优选网页选取模块将各个候选网页信息的第一有效值与第一比值阈值进行比较,在某个候选网页信息的第一有效比值大于第一比值阈值,那么令该个候选网页为优选网页,所述篇幅划分模块将各个优选网页内容中的浏览内容篇幅按照预设篇幅大小进行划分,得到若干个分篇幅,所述浏览时长比较模块分别获取优选网页的内容中的各个分篇幅的浏览时长,如果某个优选网页的内容中的所有分篇幅的浏览时长的平均值大于等于平均阈值,那么该个优选网页为有效网页,如果某个优选网页的内容中的所有分篇幅的浏览时长的平均值小于平均阈值,令所述篇幅分类模块设该个优选网页中浏览时长大于等于浏览时长的平均值的分篇幅为第一分篇幅,浏览时长小于浏览时长的平均值的分篇幅为第二分篇幅,所述第二有效比值获取模块统计某个优选网页中连续为第一分篇幅的分篇幅个数的最大值和与该连续为第一分篇幅相邻的第二分篇幅的连续个数的比值为该个优选网页的第二有效比值,所述第二有效比值比较模块将某个优选网页的第二有效比值与第二比值阈值进行比较,在该个优选网页的第二有效比值大于第二比值阈值时,令该个优选网页为有效网页,所述型号筛选模块提取有效网页中出现的净化器的型号加入净化器商品数据池内。
进一步的,所述候选净化器选取模块包括购买信息获取模块、试新指数计算模块、方差计算模块、方差比较模块、个数统计模块和个数比较模块,所述购买信息获取模块获取用户最近k次的电器购买信息,所述电器购买信息包括电器上市时间、电器购买时间,所述试新指数计算模块计算某个电器的电器购买时间与电器上市时间之差为该个电器的试新指数,所述方差计算模块计算最近k次购买的电器的试新指数的方差,所述方差比较模块将方差与方差阈值进行比较,在方差大于等于方差阈值时,将净化器商品数据池中的净化器均为候选净化器,在方差小于方差阈值时,所述个数统计模块将各个电器的试新指数与试新阈值进行比较,统计试新指数小于试新阈值的电器的个数n,所述个数比较模块在n大于等于(k-n)时,从净化器商品数据池选取电器上市时间与当前时间间隔小于预设时间间隔的净化器为候选净化器,在n小于(k-n)时,从净化器商品数据池选取电器上市时间与当前时间间隔大于等于预设时间间隔的净化器为候选净化器。
进一步的,所述排序推送模块包括第一属性获取模块、第二属性获取模块、综合属性计算模块和综合属性排序模块,所述第一属性获取模块采集某个候选净化器的最大风量与最大噪音的比值为参考比值,对该个候选净化器的参考比值进行归一化处理得到该个候选净化器的第一属性Sx,所述第二属性获取模块获取用户所在地理区域,分别获取某个候选净化器在用户所在地理区域的销量数据,对该个候选净化器的销量数据进行归一化处理得到该个候选净化器的第二属性Sy,所述综合属性计算模块计算某个型号候选净化器的综合属性U=0.62*Sx+0.38*Sy,所述综合属性排序模块将各个候选净化器的综合属性按照从大到小的顺序排序得到优先级排序,将各个候选净化器按照优先级排序从前到后的顺序推送给用户终端。
一种基于大数据的空气净化器推荐方法,所述推荐方法包括以下步骤:
获取用户终端的网页浏览信息,根据其中的关键字信息建立净化器商品数据池,
采集用户习惯特征,并据此从净化器商品数据池中选取净化器作为候选净化器;
将各个候选净化器进行优先级排序,将各个候选净化器按照优先级排序从前到后的顺序推送给用户终端。
进一步的,所述根据其中的关键字信息建立净化器商品数据池包括:
当某个网页浏览信息中包含关键字信息时,那么该网页为候选网页,其中,关键字信息包括空气净化器或者净化器,
采集用户浏览某个候选网页信息时的浏览内容篇幅,获取该个候选网页信息时的浏览内容篇幅占整个候选网页的信息篇幅的比值为该个候选网页的第一有效比值,
如果某个候选网页信息的第一有效比值大于第一比值阈值,那么该候选网页为优选网页;
将各个优选网页内容中的浏览内容篇幅按照预设篇幅大小进行划分,得到若干个分篇幅,分别获取优选网页的内容中的各个分篇幅的浏览时长,如果某个优选网页的内容中的所有分篇幅的浏览时长的平均值大于等于平均阈值,那么该个优选网页为有效网页,
如果某个优选网页的内容中的所有分篇幅的浏览时长的平均值小于平均阈值,设该个优选网页中浏览时长大于等于浏览时长的平均值的分篇幅为第一分篇幅,浏览时长小于浏览时长的平均值的分篇幅为第二分篇幅,
统计某个优选网页中连续为第一分篇幅的分篇幅个数的最大值和与该连续为第一分篇幅相邻的第二分篇幅的连续个数的比值为该个优选网页的第二有效比值,
如果某个优选网页的第二有效比值大于第二比值阈值,那么该个优选网页为有效网页;
提取有效网页中出现的净化器的型号加入净化器商品数据池内。
进一步的,所述从净化器商品数据池中选取净化器作为候选净化器包括:
获取用户最近k次的电器购买信息,所述电器购买信息包括电器上市时间、电器购买时间,计算某个电器的电器购买时间与电器上市时间之差为该个电器的试新指数,
计算最近k次购买的电器的试新指数的方差,
当方差大于等于方差阈值时,净化器商品数据池中的净化器均为候选净化器;
当方差小于方差阈值时,将各个电器的试新指数与试新阈值进行比较,统计试新指数小于试新阈值的电器的个数n,
如果n大于等于(k-n),那么从净化器商品数据池选取电器上市时间与当前时间间隔小于预设时间间隔的净化器为候选净化器,
否则,从净化器商品数据池选取电器上市时间与当前时间间隔大于等于预设时间间隔的净化器为候选净化器。
进一步的,所述将各个候选净化器进行优先级排序包括:
采集某个候选净化器的最大风量与最大噪音的比值为参考比值,对该个候选净化器的参考比值进行归一化处理得到该个候选净化器的第一属性Sx,
获取用户所在地理区域,分别获取某个候选净化器在用户所在地理区域的销量数据,对该个候选净化器的销量数据进行归一化处理得到该个候选净化器的第二属性Sy;
计算某个型号候选净化器的综合属性U=0.62*Sx+0.38*Sy,
将各个候选净化器的综合属性按照从大到小的顺序排序得到优先级排序。
与现有技术相比,本发明所达到的有益效果是:本发明通过采集分析用户的历史浏览记录、用户历史购买电器的偏好情况以及各个空气净化器自身的特征情况等多个因素选取合适的净化器型号进行推送,从而使得推送给用户的候选净化器更加具有针对性,提高用户的使用体验。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1是本发明基于大数据的空气净化器推荐系统的模块示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,本发明提供技术方案:一种基于大数据的空气净化器推荐系统,所述推荐系统包括数据池建立模块、候选净化器选取模块和排序推送模块,所述数据池建立模块获取用户终端的网页浏览信息,根据其中的关键字信息建立净化器商品数据池,所述候选净化器选取模块采集用户习惯特征,并据此从净化器商品数据池中选取净化器作为候选净化器,所述排序推送模块将各个候选净化器进行优先级排序,将各个候选净化器按照优先级排序从前到后的顺序推送给用户终端。
所述数据池建立模块包括候选网页选取模块、第一有效值获取模块、优选网页选取模块、篇幅划分模块、浏览时长比较模块、篇幅分类模块、第二有效比值获取模块、第二有效比值比较模块和型号筛选模块,所述候选网页选取模块当某个网页浏览信息中包含关键字信息时,那么该网页为候选网页,其中,关键字信息包括空气净化器或者净化器,所述第一有效值获取模块采集用户浏览某个候选网页信息时的浏览内容篇幅,获取该个候选网页信息时的浏览内容篇幅占整个候选网页的信息篇幅的比值为该个候选网页的第一有效比值,所述优选网页选取模块将各个候选网页信息的第一有效值与第一比值阈值进行比较,在某个候选网页信息的第一有效比值大于第一比值阈值,那么令该个候选网页为优选网页,所述篇幅划分模块将各个优选网页内容中的浏览内容篇幅按照预设篇幅大小进行划分,得到若干个分篇幅,所述浏览时长比较模块分别获取优选网页的内容中的各个分篇幅的浏览时长,如果某个优选网页的内容中的所有分篇幅的浏览时长的平均值大于等于平均阈值,那么该个优选网页为有效网页,如果某个优选网页的内容中的所有分篇幅的浏览时长的平均值小于平均阈值,令所述篇幅分类模块设该个优选网页中浏览时长大于等于浏览时长的平均值的分篇幅为第一分篇幅,浏览时长小于浏览时长的平均值的分篇幅为第二分篇幅,所述第二有效比值获取模块统计某个优选网页中连续为第一分篇幅的分篇幅个数的最大值和与该连续为第一分篇幅相邻的第二分篇幅的连续个数的比值为该个优选网页的第二有效比值,所述第二有效比值比较模块将某个优选网页的第二有效比值与第二比值阈值进行比较,在该个优选网页的第二有效比值大于第二比值阈值时,令该个优选网页为有效网页,所述型号筛选模块提取有效网页中出现的净化器的型号加入净化器商品数据池内。
所述候选净化器选取模块包括购买信息获取模块、试新指数计算模块、方差计算模块、方差比较模块、个数统计模块和个数比较模块,所述购买信息获取模块获取用户最近k次的电器购买信息,所述电器购买信息包括电器上市时间、电器购买时间,所述试新指数计算模块计算某个电器的电器购买时间与电器上市时间之差为该个电器的试新指数,所述方差计算模块计算最近k次购买的电器的试新指数的方差,所述方差比较模块将方差与方差阈值进行比较,在方差大于等于方差阈值时,将净化器商品数据池中的净化器均为候选净化器,在方差小于方差阈值时,所述个数统计模块将各个电器的试新指数与试新阈值进行比较,统计试新指数小于试新阈值的电器的个数n,所述个数比较模块在n大于等于(k-n)时,从净化器商品数据池选取电器上市时间与当前时间间隔小于预设时间间隔的净化器为候选净化器,在n小于(k-n)时,从净化器商品数据池选取电器上市时间与当前时间间隔大于等于预设时间间隔的净化器为候选净化器。
所述排序推送模块包括第一属性获取模块、第二属性获取模块、综合属性计算模块和综合属性排序模块,所述第一属性获取模块采集某个候选净化器的最大风量与最大噪音的比值为参考比值,对该个候选净化器的参考比值进行归一化处理得到该个候选净化器的第一属性Sx,所述第二属性获取模块获取用户所在地理区域,分别获取某个候选净化器在用户所在地理区域的销量数据,对该个候选净化器的销量数据进行归一化处理得到该个候选净化器的第二属性Sy,所述综合属性计算模块计算某个型号候选净化器的综合属性U=0.62*Sx+0.38*Sy,所述综合属性排序模块将各个候选净化器的综合属性按照从大到小的顺序排序得到优先级排序,将各个候选净化器按照优先级排序从前到后的顺序推送给用户终端。
一种基于大数据的空气净化器推荐方法,所述推荐方法包括以下步骤:
获取用户终端的网页浏览信息,根据其中的关键字信息建立净化器商品数据池,所述根据其中的关键字信息建立净化器商品数据池包括:
当某个网页浏览信息中包含关键字信息时,那么该网页为候选网页,其中,关键字信息包括空气净化器或者净化器,关键字信息进一步的还可以包括空气净化器的参数信息,通过网页浏览信息是否包含空气净化器的相关内容判断用户是否在为购买空气净化器做功课;很多用户在购买某个产品之前都会在网页上搜索信息对产品进行做功课,通过采集用户在浏览净化器的信息时的浏览数据来对用户进行推荐推送,针对性更强;
采集用户浏览某个候选网页信息时的浏览内容篇幅,获取该个候选网页信息时的浏览内容篇幅占整个候选网页的信息篇幅的比值为该个候选网页的第一有效比值,当第一有效比值越大,说明用户看的这个候选网页信息的内容比较多,自然用户对该个候选网页里面的信息内容兴趣很大,该候选网页内容所提到的空气净化器的类型也更容易符合用户的需求;
如果某个候选网页信息的第一有效比值大于第一比值阈值,那么该候选网页为优选网页;
将各个优选网页内容中的浏览内容篇幅按照预设篇幅大小进行划分,得到若干个分篇幅,分别获取优选网页的内容中的各个分篇幅的浏览时长,如果某个优选网页的内容中的所有分篇幅的浏览时长的平均值大于等于平均阈值,那么该个优选网页为有效网页,本申请考虑到当用户看了某个网页内容的大部分篇幅,也有可能是用户快速的扫了全部内容,但其实对该个网页内容并没有兴趣,所以本申请通过各个分篇幅的浏览时长的平均值来判断用户是否对该个网页内容兴趣较大,当浏览时长的平均值大于等于平均阈值,说明用户仔细看了该网页内容,对该网页内容兴趣加大,因此将其作为有效网页,当浏览时长的平均值小于平均阈值,可能是用户对该网页的内容一点儿兴趣也没有,也有可能是该网页的内容与之前用户看到的净化器的相关内容部分重叠了,对于重叠部分用户快速的扫读过,对于不重叠的部分用户仔细的阅读,因此本申请中将网页的内容进行篇幅划分,便于进行深度分析用户是否对网页内容感兴趣;
如果某个优选网页的内容中的所有分篇幅的浏览时长的平均值小于平均阈值,设该个优选网页中浏览时长大于等于浏览时长的平均值的分篇幅为第一分篇幅,浏览时长小于浏览时长的平均值的分篇幅为第二分篇幅,
统计某个优选网页中连续为第一分篇幅的分篇幅个数的最大值和与该连续为第一分篇幅相邻的第二分篇幅的连续个数的比值为该个优选网页的第二有效比值,当第二有效比值较大时,说明优选网页中连续为第一分篇幅的分篇幅个数的最大值相对较大,用户对连续为第一分篇幅的分篇幅进行了仔细的阅读并且该个网页中存在用户感兴趣的信息较多,将其作为有效网页,当第二有效比值较小时,说明优选网页中连续为第一分篇幅的分篇幅个数的最大值相对较小,用户在这一块篇幅看的时间较长的原因是为了判断该篇幅中是否存在感兴趣的信息,并且用户是不感兴趣,所以连续为第一分篇幅的分篇幅个数的最大值较小;与该连续为第一分篇幅相邻的第二分篇幅的连续个数是指第一分篇幅之后的第二分篇幅的个数,比如某个优选网页内容的篇幅划分下来为:第二分篇幅、第二分篇幅、第一分篇幅、第一分篇幅、第一分篇幅、第一分篇幅、第二分篇幅,那么该连续为第一分篇幅的分篇幅个数的最大值为4个,与该连续为第一分篇幅相邻的第二分篇幅的连续个数的比值为1个,那么该优选网页的第二有效值为4/1=4;
如果某个优选网页的第二有效比值大于第二比值阈值,那么该个优选网页为有效网页,
提取有效网页中出现的净化器的型号加入净化器商品数据池内,
采集用户习惯特征,并据此从净化器商品数据池中选取净化器作为候选净化器;所述从净化器商品数据池中选取净化器作为候选净化器包括:
获取用户最近k次的电器购买信息,所述电器购买信息包括电器上市时间、电器购买时间,计算某个电器的电器购买时间与电器上市时间之差为该个电器的试新指数,试新指数用于判断用户对新上市产品和上市比较久的产品的倾向性,试新指数比较小,说明该电器购买时是新上市产品,当试新指数比较大,说明该电器购买时是上市比较久的产品,
计算最近k次购买的电器的试新指数的方差,当方差比较大的时候,说明用户无论是新上市产品还是上市比较久的产品都愿意接受,当方差比较小的时候,说明用户对新上市产品或者上市比较久的产品中的其中一种有倾向性;
当方差大于等于方差阈值时,净化器商品数据池中的净化器均为候选净化器;
当方差小于方差阈值时,将各个电器的试新指数与试新阈值进行比较,统计试新指数小于试新阈值的电器的个数n,n是用户最近k次购买的电器中电器属于新上市购买时的产品的购买次数,(k-n)是用户最近k次购买的电器中电器属于上市比较久时买的产品的购买次数,
如果n大于等于(k-n),说明用户在购买电器时倾向于买新上市的产品,那么从净化器商品数据池选取电器上市时间与当前时间间隔小于预设时间间隔的净化器为候选净化器,
否则,说明用户在购买电器时倾向于买上市比较久的产品,从净化器商品数据池选取电器上市时间与当前时间间隔大于等于预设时间间隔的净化器为候选净化器,从而基于用户的习惯特征来推荐空气净化器给用户,针对性更强,更加智能化的选取空气净化器;
将各个候选净化器进行优先级排序,所述将各个候选净化器进行优先级排序包括:
采集某个候选净化器的最大风量与最大噪音的比值为参考比值,对该个候选净化器的参考比值进行归一化处理得到该个候选净化器的第一属性Sx,当空气净化器的噪音较响时,会影响用户的生活,如果仅仅考虑噪音的影响,会导致所选取的候选净化器的风量偏小,无法达到相应的空气净化效果,因此本申请中将最大风量与最大噪音的比值为参考比值,当参考比值越大时,候选净化器的空气净化效果较好的同时噪音也相对较小;
获取用户所在地理区域,分别获取某个候选净化器在用户所在地理区域的销量数据,对该个候选净化器的销量数据进行归一化处理得到该个候选净化器的第二属性Sy;本申请考虑到了不同地理区域的环境特征不同,所以本申请在推荐空气净化器时将用户所在地理区域的销量数据作为参考因素,使得推送给用户终端的空气净化器区域针对性更强;
对某类数据进行归一化处理时,获取该类数据中的最大值Jmax和最小Jmin,那么该类数据中某个数据Js归一化处理得到的值Jc=(Js-Jmin)/(Jmax-Jmin),比如对某个候选净化器的参考比值Hs进行归一化处理得到Sx=(Hs-Hmin)/(Hmax-Hmin),其中,Hmin为所有候选净化器的参考比值中的最小值,Hmax为所有候选净化器的参考比值中的最大值;
计算某个型号候选净化器的综合属性U=0.62*Sx+0.38*Sy,
将各个候选净化器的综合属性按照从大到小的顺序排序得到优先级排序;
将各个候选净化器按照优先级排序从前到后的顺序推送给用户终端,供用户进行选择查看信息或者进行购买等等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (2)
1.一种基于大数据的空气净化器推荐系统,其特征在于,所述推荐系统包括数据池建立模块、候选净化器选取模块和排序推送模块,所述数据池建立模块获取用户终端的网页浏览信息,根据其中的关键字信息建立净化器商品数据池,所述候选净化器选取模块采集用户习惯特征,并据此从净化器商品数据池中选取净化器作为候选净化器,所述排序推送模块将各个候选净化器进行优先级排序,将各个候选净化器按照优先级排序从前到后的顺序推送给用户终端;
所述数据池建立模块包括候选网页选取模块、第一有效值获取模块、优选网页选取模块、篇幅划分模块、浏览时长比较模块、篇幅分类模块、第二有效比值获取模块、第二有效比值比较模块和型号筛选模块,所述候选网页选取模块当某个网页浏览信息中包含关键字信息时,那么该网页为候选网页,其中,关键字信息包括空气净化器或者净化器,所述第一有效值获取模块采集用户浏览某个候选网页信息时的浏览内容篇幅,获取该个候选网页信息时的浏览内容篇幅占整个候选网页的信息篇幅的比值为该个候选网页的第一有效比值,所述优选网页选取模块将各个候选网页信息的第一有效值与第一比值阈值进行比较,在某个候选网页信息的第一有效比值大于第一比值阈值,那么令该个候选网页为优选网页,所述篇幅划分模块将各个优选网页内容中的浏览内容篇幅按照预设篇幅大小进行划分,得到若干个分篇幅,所述浏览时长比较模块分别获取优选网页的内容中的各个分篇幅的浏览时长,如果某个优选网页的内容中的所有分篇幅的浏览时长的平均值大于等于平均阈值,那么该个优选网页为有效网页,如果某个优选网页的内容中的所有分篇幅的浏览时长的平均值小于平均阈值,令所述篇幅分类模块设该个优选网页中浏览时长大于等于浏览时长的平均值的分篇幅为第一分篇幅,浏览时长小于浏览时长的平均值的分篇幅为第二分篇幅,所述第二有效比值获取模块统计某个优选网页中连续为第一分篇幅的分篇幅个数的最大值和与该连续为第一分篇幅相邻的第二分篇幅的连续个数的比值为该个优选网页的第二有效比值,所述第二有效比值比较模块将某个优选网页的第二有效比值与第二比值阈值进行比较,在该个优选网页的第二有效比值大于第二比值阈值时,令该个优选网页为有效网页,所述型号筛选模块提取有效网页中出现的净化器的型号加入净化器商品数据池内;
所述候选净化器选取模块包括购买信息获取模块、试新指数计算模块、方差计算模块、方差比较模块、个数统计模块和个数比较模块,所述购买信息获取模块获取用户最近k次的电器购买信息,所述电器购买信息包括电器上市时间、电器购买时间,所述试新指数计算模块计算某个电器的电器购买时间与电器上市时间之差为该个电器的试新指数,所述方差计算模块计算最近k次购买的电器的试新指数的方差,所述方差比较模块将方差与方差阈值进行比较,在方差大于等于方差阈值时,将净化器商品数据池中的净化器均为候选净化器,在方差小于方差阈值时,所述个数统计模块将各个电器的试新指数与试新阈值进行比较,统计试新指数小于试新阈值的电器的个数n,所述个数比较模块在n大于等于(k-n)时,从净化器商品数据池选取电器上市时间与当前时间间隔小于预设时间间隔的净化器为候选净化器,在n小于 (k-n)时,从净化器商品数据池选取电器上市时间与当前时间间隔大于等于预设时间间隔的净化器为候选净化器;
所述排序推送模块包括第一属性获取模块、第二属性获取模块、综合属性计算模块和综合属性排序模块,所述第一属性获取模块采集某个候选净化器的最大风量与最大噪音的比值为参考比值,对该个候选净化器的参考比值进行归一化处理得到该个候选净化器的第一属性Sx,所述第二属性获取模块获取用户所在地理区域,分别获取某个候选净化器在用户所在地理区域的销量数据,对该个候选净化器的销量数据进行归一化处理得到该个候选净化器的第二属性Sy,所述综合属性计算模块计算某个型号候选净化器的综合属性U=0.62*Sx+0.38*Sy,所述综合属性排序模块将各个候选净化器的综合属性按照从大到小的顺序排序得到优先级排序,将各个候选净化器按照优先级排序从前到后的顺序推送给用户终端。
2.一种基于大数据的空气净化器推荐方法,其特征在于:所述推荐方法包括以下步骤:
获取用户终端的网页浏览信息,根据其中的关键字信息建立净化器商品数据池,
采集用户习惯特征,并据此从净化器商品数据池中选取净化器作为候选净化器;
将各个候选净化器进行优先级排序,将各个候选净化器按照优先级排序从前到后的顺序推送给用户终端;
所述根据其中的关键字信息建立净化器商品数据池包括:
当某个网页浏览信息中包含关键字信息时,那么该网页为候选网页,其中,关键字信息包括空气净化器或者净化器,
采集用户浏览某个候选网页信息时的浏览内容篇幅,获取该个候选网页信息时的浏览内容篇幅占整个候选网页的信息篇幅的比值为该个候选网页的第一有效比值,
如果某个候选网页信息的第一有效比值大于第一比值阈值,那么该候选网页为优选网页;
将各个优选网页内容中的浏览内容篇幅按照预设篇幅大小进行划分,得到若干个分篇幅,分别获取优选网页的内容中的各个分篇幅的浏览时长,如果某个优选网页的内容中的所有分篇幅的浏览时长的平均值大于等于平均阈值,那么该个优选网页为有效网页,
如果某个优选网页的内容中的所有分篇幅的浏览时长的平均值小于平均阈值,设该个优选网页中浏览时长大于等于浏览时长的平均值的分篇幅为第一分篇幅,浏览时长小于浏览时长的平均值的分篇幅为第二分篇幅,
统计某个优选网页中连续为第一分篇幅的分篇幅个数的最大值和与该连续为第一分篇幅相邻的第二分篇幅的连续个数的比值为该个优选网页的第二有效比值,
如果某个优选网页的第二有效比值大于第二比值阈值,那么该个优选网页为有效网页;
提取有效网页中出现的净化器的型号加入净化器商品数据池内;
所述从净化器商品数据池中选取净化器作为候选净化器包括:
获取用户最近k次的电器购买信息,所述电器购买信息包括电器上市时间、电器购买时间,计算某个电器的电器购买时间与电器上市时间之差为该个电器的试新指数,
计算最近k次购买的电器的试新指数的方差,
当方差大于等于方差阈值时,净化器商品数据池中的净化器均为候选净化器;
当方差小于方差阈值时,将各个电器的试新指数与试新阈值进行比较,统计试新指数小于试新阈值的电器的个数n,
如果n大于等于(k-n),那么从净化器商品数据池选取电器上市时间与当前时间间隔小于预设时间间隔的净化器为候选净化器,
否则,从净化器商品数据池选取电器上市时间与当前时间间隔大于等于预设时间间隔的净化器为候选净化器;
所述将各个候选净化器进行优先级排序包括:
采集某个候选净化器的最大风量与最大噪音的比值为参考比值,对该个候选净化器的参考比值进行归一化处理得到该个候选净化器的第一属性Sx,
获取用户所在地理区域,分别获取某个候选净化器在用户所在地理区域的销量数据,对该个候选净化器的销量数据进行归一化处理得到该个候选净化器的第二属性Sy;
计算某个型号候选净化器的综合属性U=0.62*Sx+0.38*Sy,
将各个候选净化器的综合属性按照从大到小的顺序排序得到优先级排序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111570390.2A CN114240505B (zh) | 2021-12-21 | 2021-12-21 | 一种基于大数据的空气净化器推荐系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111570390.2A CN114240505B (zh) | 2021-12-21 | 2021-12-21 | 一种基于大数据的空气净化器推荐系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114240505A CN114240505A (zh) | 2022-03-25 |
CN114240505B true CN114240505B (zh) | 2022-07-26 |
Family
ID=80760177
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111570390.2A Active CN114240505B (zh) | 2021-12-21 | 2021-12-21 | 一种基于大数据的空气净化器推荐系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114240505B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102768685A (zh) * | 2012-07-24 | 2012-11-07 | 杭州东方网升科技有限公司 | 一种基于关键字匹配的内容推荐方法 |
CN102938123A (zh) * | 2012-10-24 | 2013-02-20 | 江苏乐买到网络科技有限公司 | 一种向用户推荐商品信息的方法 |
CN105894332A (zh) * | 2016-04-22 | 2016-08-24 | 深圳市永兴元科技有限公司 | 基于用户行为分析的商品推荐方法、装置及系统 |
CN110197415A (zh) * | 2019-04-23 | 2019-09-03 | 北京三快在线科技有限公司 | 一种推荐方法、装置、电子设备及可读存储介质 |
WO2019205804A1 (zh) * | 2018-04-23 | 2019-10-31 | 中兴通讯股份有限公司 | 网页预下载方法及装置、存储介质和电子装置 |
CN112288517A (zh) * | 2019-12-23 | 2021-01-29 | 北京来也网络科技有限公司 | 结合rpa与ai的商品推荐方法和装置 |
CN113313539A (zh) * | 2021-07-29 | 2021-08-27 | 广东联讯科技发展股份有限公司 | 一种基于大数据的数字化营销服务管理平台 |
CN113507623A (zh) * | 2021-07-09 | 2021-10-15 | 广东蕾特恩科技发展有限公司 | 一种基于数据分析的商品智能选品系统及方法 |
CN113645488A (zh) * | 2021-10-18 | 2021-11-12 | 南京聚通时讯科技有限公司 | 一种基于用户数据的互联网电视视频推荐系统及方法 |
-
2021
- 2021-12-21 CN CN202111570390.2A patent/CN114240505B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102768685A (zh) * | 2012-07-24 | 2012-11-07 | 杭州东方网升科技有限公司 | 一种基于关键字匹配的内容推荐方法 |
CN102938123A (zh) * | 2012-10-24 | 2013-02-20 | 江苏乐买到网络科技有限公司 | 一种向用户推荐商品信息的方法 |
CN105894332A (zh) * | 2016-04-22 | 2016-08-24 | 深圳市永兴元科技有限公司 | 基于用户行为分析的商品推荐方法、装置及系统 |
WO2019205804A1 (zh) * | 2018-04-23 | 2019-10-31 | 中兴通讯股份有限公司 | 网页预下载方法及装置、存储介质和电子装置 |
CN110197415A (zh) * | 2019-04-23 | 2019-09-03 | 北京三快在线科技有限公司 | 一种推荐方法、装置、电子设备及可读存储介质 |
CN112288517A (zh) * | 2019-12-23 | 2021-01-29 | 北京来也网络科技有限公司 | 结合rpa与ai的商品推荐方法和装置 |
CN113507623A (zh) * | 2021-07-09 | 2021-10-15 | 广东蕾特恩科技发展有限公司 | 一种基于数据分析的商品智能选品系统及方法 |
CN113313539A (zh) * | 2021-07-29 | 2021-08-27 | 广东联讯科技发展股份有限公司 | 一种基于大数据的数字化营销服务管理平台 |
CN113645488A (zh) * | 2021-10-18 | 2021-11-12 | 南京聚通时讯科技有限公司 | 一种基于用户数据的互联网电视视频推荐系统及方法 |
Non-Patent Citations (1)
Title |
---|
《基于用户搜索状态的动态推荐模型研究》;李广明,付剑锋;《情报理论与实践》;20210204;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN114240505A (zh) | 2022-03-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Parlina et al. | Naive Bayes algorithm analysis to determine the percentage level of visitors the most dominant zoo visit by age category | |
CN102880712B (zh) | 一种用于对搜索的网络视频进行排序的方法和系统 | |
Krishna Reddy et al. | A graph based approach to extract a neighborhood customer community for collaborative filtering | |
CN108650532B (zh) | 有线电视点播节目推荐方法及系统 | |
CN103870454A (zh) | 数据推荐方法及系统 | |
CN106997358A (zh) | 信息推荐方法及装置 | |
CN104281956A (zh) | 基于时间信息的适应用户兴趣变化的动态推荐方法 | |
EP2846271A1 (en) | Method and device for obtaining product information and computer storage medium | |
CN104462336A (zh) | 信息推送方法和装置 | |
CN105183727A (zh) | 一种图书推荐方法及其系统 | |
CN109241451B (zh) | 一种内容组合推荐方法、装置及可读存储介质 | |
CN108132964A (zh) | 一种基于用户对项目类评分的协同过滤方法 | |
CN106919669B (zh) | 一种对网页信息展示位置进行排序的方法 | |
CN114240505B (zh) | 一种基于大数据的空气净化器推荐系统及方法 | |
Cremonesi et al. | Top-n recommendations on unpopular items with contextual knowledge | |
CN114880560A (zh) | 内容的推荐方法和装置、存储介质及电子装置 | |
CN114764732A (zh) | 一种商品推荐方法、设备及计算机可读存储介质 | |
CN114065038A (zh) | 基于大数据的头条资讯推荐方法及装置 | |
CN104462597B (zh) | 一种综合用户正负性评分和评分偏好因子的协同过滤方法 | |
CN113077320A (zh) | 一种基于用户行为采集分析的商机推荐方法 | |
CN116861063B (zh) | 一种发掘社媒热搜商业价值度的方法 | |
CN112052378A (zh) | 智能终端、智能家居应用的推荐方法及系统 | |
CN115965439A (zh) | 数据召回方法、数据召回装置、电子设备及存储介质 | |
CN111859150B (zh) | 基于大数据的终端信息推荐方法 | |
JP2963033B2 (ja) | サンプル分類支援装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |