CN113222697A - 商品信息推送方法、装置计算机设备及可读存储介质 - Google Patents
商品信息推送方法、装置计算机设备及可读存储介质 Download PDFInfo
- Publication number
- CN113222697A CN113222697A CN202110514977.5A CN202110514977A CN113222697A CN 113222697 A CN113222697 A CN 113222697A CN 202110514977 A CN202110514977 A CN 202110514977A CN 113222697 A CN113222697 A CN 113222697A
- Authority
- CN
- China
- Prior art keywords
- commodity
- label
- initial
- type identification
- identification model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000003064 k means clustering Methods 0.000 claims abstract description 89
- 238000012360 testing method Methods 0.000 claims description 17
- 238000012549 training Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 6
- 230000006870 function Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/55—Push-based network services
Abstract
本发明提供一种商品信息推送方法、装置计算机设备及可读存储介质,所述方法包括获取历史用户的商品历史数据,并生成多个商品历史标签;基于小批量K均值聚类算法和K均值聚类算法对多个商品历史标签进行多次聚类,生成标签类型识别模型,标签类型识别模型中包括多种不同类型的商品目标标签;获取新用户的商品浏览数据,并根据商品浏览数据生成与新用户对应的商品初始标签;将商品初始标签输入到标签类型识别模型中,根据预设的相似度算法确定商品初始标签与商品目标标签的相似度;基于相似度,向新用户推送商品信息。本发明通过基于小批量K均值聚类算法和K均值聚类算法进行多次聚类,生成标签类型识别模型,提高商品信息推送时效性。
Description
技术领域
本发明涉及大数据信息处理技术领域,具体涉及一种商品信息推送方法、装置计算机设备及可读存储介质。
背景技术
在竞争日益激烈的销售行业中,快速对新用户类别判别分析尤为重要。基于人工智能不断发展,例如淘宝,京东、苏宁等类似行业中利用广大的商品数据信息,从而精准的对顾客的兴趣爱好进行判断,来进行商品的推销,从而解放了人工,又获得了用户的好评。因此迅速抓住顾客的需求,针对性的对顾客进行推销,不断积累用户,迅速占领市场,增大商品销量,捕捉用户的商品浏览数据显得尤为重要。
现有技术中,很多对于用户的商品浏览数据挖掘基本上都是用的聚类算法,具体地,对于初始数据分类基本上采用K均值聚类算法进行聚类。K均值聚类算法过于繁琐,花费时间大,导致商品信息的推送不够及时,从而使得丢失大量新老用户。
因此,急需提出一种商品信息推送方法、装置计算机设备及可读存储介质解决现有技术中存在的由于使用K均值聚类算法对初始数据进行聚类导致商品信息的推送不够及时,导致丢失大量新老用户的技术问题。
发明内容
本发明提供一种商品信息推送方法、装置计算机设备及可读存储介质,旨在解决现有技术中存在的由于使用K均值聚类算法对初始数据进行聚类导致信息的推送不够及时,导致丢失大量新老用户的技术问题。
一方面,本发明提供一种商品信息推送方法,包括:
获取历史用户的商品历史数据,并根据所述商品历史数据生成多个商品历史标签;
基于小批量K均值聚类算法和K均值聚类算法对所述多个商品历史标签进行多次聚类,生成标签类型识别模型,所述标签类型识别模型中包括多种不同类型的商品目标标签;
获取新用户的商品浏览数据,并根据所述商品浏览数据生成与所述新用户对应的商品初始标签;
将所述商品初始标签输入到所述标签类型识别模型中,根据预设的相似度算法确定所述商品初始标签与所述多种不同类型的商品目标标签中商品目标标签的相似度;
基于所述相似度,向所述新用户推送商品信息。
在本发明一种可能的实现方式中,所述基于小批量K均值聚类算法和K均值聚类算法对所述多个商品历史标签进行多次聚类,生成标签类型识别模型包括:
基于小批量K均值聚类算法和K均值聚类算法对所述多个商品历史标签进行多次聚类,生成初始标签类型识别模型,所述初始标签类型识别模型中包括多种不同类型的商品初始目标标签;
判断所述商品初始目标标签的类型数是否小于阈值标签数量;
若所述商品初始目标标签的类型数小于所述阈值标签数量,则基于所述K均值聚类算法和/或小批量K均值聚类算法对所述商品初始目标标签再次进行至少一次聚类,生成包括多种不同类型的商品二次目标标签的二次标签类型识别模型,所述商品二次目标标签的类型数大于或等于所述阈值标签数量,所述二次标签类型识别模型为所述标签类型识别模型;
若所述商品初始目标标签的类型数大于或等于所述阈值标签数量,则所述初始标签类型识别模型为所述标签类型识别模型。
在本发明一种可能的实现方式中,所述基于小批量K均值聚类算法和K均值聚类算法对所述多个商品历史标签进行多次聚类,生成初始标签类型识别模型包括:
基于所述小批量K均值聚类算法对所述多个商品历史标签进行初次聚类,生成多种不同类型的商品初始聚类标签;
判断所述多种不同类型的商品初始聚类标签中每一商品初始聚类标签中所述商品历史数据的个数是否大于阈值聚类数量;
若所述商品初始聚类标签中所述商品历史数据的个数大于阈值聚类数量,则基于所述小批量K均值聚类算法对所述进行商品初始聚类标签进行二次聚类,生成所述初始标签类型识别模型;
若所述初始聚类标签中所述商品历史数据的个数小于或等于所述阈值聚类数量,则基于所述K均值聚类算法对所述商品初始聚类标签进行二次聚类,生成所述初始标签类型识别模型。
在本发明一种可能的实现方式中,所述商品历史数据包括:商品浏览内容、商品浏览时长、商品浏览区域以及商品检索内容中的至少一种。
在本发明一种可能的实现方式中,所述预设的相似度算法为K最近邻算法。
在本发明一种可能的实现方式中,在所述基于小批量K均值聚类算法和K均值聚类算法对所述多个商品历史标签进行多次聚类,生成标签类型识别模型之后还包括:
基于所述商品历史数据构建商品测试集;
将所述商品测试集输入到所述标签类型识别模型中,并获得所述商品测试集的标签类型识别结果;
判断所述标签类型识别结果的可信度,若所述标签类型识别结果的可信度小于阈值可信度,则对所述商品历史数据重新进行多次聚类。
在本发明一种可能的实现方式中,所述方法还包括:
基于所述新用户的商品浏览数据对所述标签类型识别模型进行优化。
另一方面,本发明提供一种商品信息推送装置,所述商品信息推送装置包括:
数据获取模块,用于获取历史用户的商品历史数据,并根据所述商品历史数据生成多个商品历史标签;
模型训练模块,用于基于小批量K均值聚类算法和K均值聚类算法对所述多个商品历史标签进行多次聚类,生成标签类型识别模型,所述标签类型识别模型中包括多种不同类型的商品目标标签;
标签识别模块,用于获取新用户的商品浏览数据,并根据所述商品浏览数据生成与所述新用户对应的商品初始标签;
相似度确认模块,用于将所述商品初始标签输入到所述标签类型识别模型中,根据预设的相似度算法确定所述商品初始标签与所述多种不同类型的商品目标标签中商品目标标签的相似度;
推送模块,用于基于所述相似度,向所述新用户推送商品信息。
在本发明一种可能的实现方式中,所述模型训练模块具体用于:基于小批量K均值聚类算法和K均值聚类算法对所述多个商品历史标签进行多次聚类,生成初始标签类型识别模型,所述初始标签类型识别模型中包括多种不同类型的商品初始目标标签;判断所述商品初始目标标签的类型数是否小于阈值标签数量;若所述商品初始目标标签的类型数小于所述阈值标签数量,则基于所述K均值聚类算法和/或小批量K均值聚类算法对所述商品初始目标标签再次进行至少一次聚类,生成包括多种不同类型的商品二次目标标签的二次标签类型识别模型,所述商品二次目标标签的类型数大于或等于所述阈值标签数量,所述二次标签类型识别模型为所述标签类型识别模型;若所述商品初始目标标签的类型数大于或等于所述阈值标签数量,则所述初始标签类型识别模型为所述标签类型识别模型。
在本发明一种可能的实现方式中,所述模型训练模块具体还用于:基于所述小批量K均值聚类算法对所述多个商品历史标签进行初次聚类,生成多种不同类型的商品初始聚类标签;判断所述多种不同类型的商品初始聚类标签中每一商品初始聚类标签中所述商品历史数据的个数是否大于阈值聚类数量;若所述商品初始聚类标签中所述商品历史数据的个数大于阈值聚类数量,则基于所述小批量K均值聚类算法对所述进行商品初始聚类标签进行二次聚类,生成所述初始标签类型识别模型;若所述初始聚类标签中所述商品历史数据的个数小于或等于所述阈值聚类数量,则基于所述K均值聚类算法对所述商品初始聚类标签进行二次聚类,生成所述初始标签类型识别模型。
在本发明一种可能的实现方式中,所述信息推送装置还包括测试模块,用于基于所述商品历史数据构建商品测试集;将所述商品测试集输入到所述标签类型识别模型中,并获得所述商品测试集的标签类型识别结果;判断所述标签类型识别结果的可信度,若所述标签类型识别结果的可信度小于阈值可信度,则对所述商品历史数据重新进行多次聚类。
在本发明一种可能的实现方式中,所述信息推送装置还包括优化模块,用于基于所述新用户的商品浏览数据对所述标签类型识别模型进行优化。
另一方面,本发明还提供一种计算机设备,所述计算机设备包括:
一个或多个处理器;
存储器;以及
一个或多个应用程序,其中所述一个或多个应用程序被存储于所述存储器中,并配置为由所述处理器执行以实现上述任一项所述的商品信息推送方法。
另一方面,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器进行加载,以执行上述任一项所述的商品信息推送方法中的步骤。
本发明通过基于小批量K均值聚类算法和K均值聚类算法对多个商品历史标签进行多次聚类,生成标签类型识别模型,提高标签类型识别模型的生成效率,降低标签类型识别模型建立的时间,实现提高商品信息推送时效性的技术效果,进而可提高新老用户的体验度,有利于积累客户。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的商品信息推送系统的场景示意图;
图2是本发明实施例提供的商品信息推送方法的一个实施例流程示意图;
图3是本发明实施例提供的S202的一个实施例流程示意图;
图4是本发明实施例提供的S301的一个实施例流程示意图;
图5是本发明实施例提供的标签类型识别模型的可信度一个实施例流程示意图;
图6是本发明实施例提供的商品信息推送装置的一个实施例结构示意图;
图7是本发明实施例提供的服务器的一个实施例流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
本发明提供了一种商品信息推送方法、装置、计算机设备及可读存储设备,以下分别进行详细说明。
图1为本发明实施例所提供的商品信息推送系统的场景示意图,该系统可以包括服务器100,服务器100中集成有商品信息推送装置,如图1中的服务器。
本发明实施例中服务器100主要用于:获取历史用户的商品历史数据,并根据所述商品历史数据生成多个商品历史标签;基于小批量K均值聚类算法和K均值聚类算法对所述多个商品历史标签进行多次聚类,生成标签类型识别模型,所述标签类型识别模型中包括多种不同类型的商品目标标签;获取新用户的商品浏览数据,并根据所述商品浏览数据生成与所述新用户对应的商品初始标签;将所述商品初始标签输入到所述标签类型识别模型中,根据预设的相似度算法确定所述商品初始标签与所述多种不同类型的商品目标标签中商品目标标签的相似度;基于所述相似度,向所述新用户推送商品信息。
本发明实施例中,该服务器100可以是独立的服务器,也可以是服务器组成的服务器网络或服务器集群,例如,本发明实施例中所描述的服务器100,其包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云服务器。其中,云服务器由基于云计算(Cloud Computing)的大量计算机或网络服务器构成。
可以理解的是,本发明实施例中所使用的终端200可以是既包括接收和发射硬件的设备,即具有能够在双向通信链路上,执行双向通信的接收和发射硬件的设备。这种设备可以包括:蜂窝或其他通信设备,其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备。具体的终端200可以是台式机、便携式电脑、网络服务器、掌上电脑(Personal Digital Assistant,PDA)、移动手机、平板电脑、无线终端设备、通信设备、嵌入式设备等,本实施例不限定终端200的类型。
本领域技术人员可以理解,图1中示出的应用环境,仅仅是与本发明方案一种应用场景,并不构成对本发明方案应用场景的限定,其他的应用环境还可以包括比图1中所示更多或更少的终端,例如图1中仅示出2个终端,可以理解的,该商品信息推送系统还可以包括一个或多个其他终端,具体此处不作限定。
另外,如图1所示,该商品信息推送系统还可以包括存储器300,用于存储数据,如存储商品历史数据以及新用户的商品浏览数据等。
需要说明的是,图1所示的商品信息推送系统的场景示意图仅仅是一个示例,本发明实施例描述的商品信息推送系统以及场景是为了更加清楚的说明本发明实施例的技术方案,并不构成对于本发明实施例提供的技术方案的限定,本领域普通技术人员可知,随着商品信息推送系统的演变和新业务场景的出现,本发明实施例提供的技术方案对于类似的技术问题,同样适用。
首先,本发明实施例提供了一种商品信息推送方法,该商品信息推送方法包括:获取历史用户的商品历史数据,并根据所述商品历史数据生成多个商品历史标签;基于小批量K均值聚类算法和K均值聚类算法对所述多个商品历史标签进行多次聚类,生成标签类型识别模型,所述标签类型识别模型中包括多种不同类型的商品目标标签;获取新用户的商品浏览数据,并根据所述商品浏览数据生成与所述新用户对应的商品初始标签;将所述商品初始标签输入到所述标签类型识别模型中,根据预设的相似度算法确定所述商品初始标签与所述多种不同类型的商品目标标签中商品目标标签的相似度;基于所述相似度,向所述新用户推送商品信息。
如图2所示,为本发明实施例提供的商品信息推送方法的一个实施例流程示意图,该方法包括:
S201、获取历史用户的商品历史数据,并根据商品历史数据生成多个商品历史标签;
其中,商品历史数据包括:商品浏览内容、商品浏览时长、商品浏览区域以及商品检索内容中的至少一种。商品浏览内容、商品浏览时长以及商品浏览区域可以是历史用户通过应用软件浏览过的视频、音频、图片、网页等中的内容、时长和区域;商品检索内容可以是历史用户在各种在线或离线搜索引擎中输入的关键词、检索式等。
标签用于表征历史数据中数据特征,例如:当商品历史数据的其中一个商品数据为球鞋的图片时,标签可为文字“李宁球鞋”。
S202、基于小批量K均值(Mini Batch K-Means)聚类算法和K均值(K-Means)聚类算法对多个商品历史标签进行多次聚类,生成标签类型识别模型,标签类型识别模型中包括多种不同类型的商品目标标签。
具体地,以商品历史标签为“李宁球鞋”为例,若其他商品历史数据中包括“李宁运动鞋”、“耐克休闲鞋”等商品历史标签,则经过聚类后的商品目标标签为“鞋”。
S203、获取新用户的商品浏览数据,并根据商品浏览数据生成与新用户对应的商品初始标签。
S204、将商品初始标签输入到标签类型识别模型中,根据预设的相似度算法确定商品初始标签与多种不同类型的商品目标标签中商品目标标签的相似度。
S205、基于相似度,向新用户推送商品信息。
本发明提供的商品信息推送方法,在建立标签类型识别模型时,基于小批量K均值聚类算法和K均值聚类算法对多个商品历史标签进行多次聚类,生成标签类型识别模型,提高标签类型识别模型的生成效率,降低标签类型识别模型建立的时间,实现提高商品信息推送时效性的技术效果,进而可提高新老用户的体验度。
在本发明的一些实施例中,预设的相似度算法为K最近邻(k-Nearest Neighbor,KNN)算法。
通过设置相似度算法为KNN算法,可提高对新用户推送商品信息的准确性,并进一步提高商品推送信息的时效性,进而提高新用户的体验感,有利于累计用户。
进一步地,如图3所示,为本发明实施例提供的S202的一个实施例流程示意图,S202包括:
S301、基于小批量K均值聚类算法和K均值聚类算法对多个商品历史标签进行多次聚类,生成初始标签类型识别模型,初始标签类型识别模型中包括多种不同类型的商品初始目标标签;
S302、判断商品初始目标标签的个数是否小于阈值标签数量;
S303、若商品初始目标标签的个数小于阈值标签数量,则基于K均值聚类算法和/或小批量K均值聚类算法对商品初始目标标签再次进行至少一次聚类,生成包括多种不同类型的商品二次目标标签的二次标签类型识别模型,商品二次目标标签的类型数大于或等于阈值标签数量,所述二次标签类型识别模型为标签类型识别模型;
S304、若商品初始目标标签的类型数大于或等于阈值标签数量,则初始标签类型识别模型为标签类型识别模型。
通过上述设置,可保证标签类型识别模型中标签的多样性,避免在聚类过程中商品历史数据的特征丢失,有利于对历史用户的商品历史数据进行精准细分,提高商品信息推送的精确性。
在本发明的一些具体实施例中,阈值标签数量为10-15。进一步地,当商品初始目标标签的个数小于阈值标签数量时,商品初始目标标签的其中一个为“鞋”,即可通过再次聚类,将“鞋”拆分为“休闲系”,“球鞋”,“运动鞋”等多个商品二次目标标签。
进一步地,如图4所示,S301包括:
S401、基于小批量K均值聚类算法对多个商品历史标签进行初次聚类,生成多种不同类型的商品初始聚类标签;
S402、判断多种不同类型的商品初始聚类标签中每一商品初始聚类标签中商品历史数据的个数是否大于阈值聚类数量;
S403、若商品初始聚类标签中商品历史数据的个数大于阈值聚类数量,则基于小批量K均值聚类算法对进行商品初始聚类标签进行二次聚类,生成初始标签类型识别模型;
S404、若商品初始聚类标签中商品历史数据的个数小于或等于所述阈值聚类数量,则基于K均值聚类算法对初始聚类标签进行二次聚类,生成初始标签类型识别模型。
其中,阈值聚类数量为8000-10000。
基于小批量K均值聚类算法对多个商品历史标签进行初次聚类,生成多种不同类型的商品初始聚类标签,并根据商品初始聚类标签中商品历史数据的个数与阈值聚类数量之间的关系,选择K均值聚类算法或小批量K均值聚类算法对商品初始聚类标签进行二次聚类,生成初始标签类型识别模型,可在提高初始标签类型识别模型生成效率的同时保证其准确性。这是由于:商品历史标签的数量往往较多,初次聚类使用小批量K均值聚类算法对商品历史标签进行聚类,可提高聚类的效率;当后续商品初始聚类标签中的商品历史数据的个数小于阈值聚类数量时,通过K均值聚类算法可提高聚类的准确性。
需要说明的是:为了保证生成的标签类型识别模型的准确性,在本发明的一些实施例中,如图5所示,在S202之后还包括:
S501、基于商品历史数据构建商品测试集;
S502、将商品测试集输入到标签类型识别模型中,并获得商品测试集的标签类型识别结果;
S503、判断标签类型识别结果的可信度,若标签类型识别结果的可信度小于阈值可信度,则对商品历史数据重新进行多次聚类。
通过上述设置,可确保标签类型识别结果的可靠性,进而提高商品信息推送的精确性。
进一步地,随着新用户的增多,新用户的商品初始标签与商品历史数据生成的商品目标标签之间差别较大,导致商品信息推送的不准确,为了解决以上为题,在本发明的一些实施例中,如图2所示,商品信息推动方法还包括:
206、基于新用户的商品浏览数据对标签类型识别模型进行优化。
具体地:基于新用户的商品浏览数据生成多个商品新标签,基于小批量K均值聚类算法和K均值聚类算法对多个商品历史标签和多个商品新标签进行多次聚类,优化标签类型识别模型。
通过上述设置,可实现随着新用户的增多,对商品历史数据和商品浏览数据打上更加准确的标签,对标签类型识别模型进行优化,进一步提高商品信息推送的精确性。
另一方面,为了更好实施本发明实施例中的商品信息推送方法,在商品信息推送方法基础之上,对应的,如图6所示,本发明实施例中还提供一种商品信息推送装置,商品信息推送装置600包括:
数据获取模块601,用于获取历史用户的商品历史数据,并根据商品历史数据生成多个商品历史标签;
模型训练模块602,用于基于小批量K均值聚类算法和K均值聚类算法对多个商品历史标签进行多次聚类,生成标签类型识别模型,标签类型识别模型中包括多种不同类型的商品目标标签;
标签识别模块603,用于获取新用户的商品浏览数据,并根据商品浏览数据生成与新用户对应的商品初始标签;
相似度确认模块604,用于将商品初始标签输入到标签类型识别模型中,根据预设的相似度算法确定商品初始标签与所述多种不同类型的商品目标标签中商品目标标签的相似度;
推送模块605,用于基于相似度,向新用户推送商品信息。
本发明实施例提供的商品信息推送装置600,模型训练模块602在建立标签类型识别模型时,基于小批量K均值聚类算法和K均值聚类算法对多个商品历史标签进行多次聚类,生成标签类型识别模型,提高标签类型识别模型的生成效率,降低标签类型识别模型建立的时间,实现提高商品信息推送时效性的技术效果,进而可提高新老用户的体验度。
在本发明的一些实施例中,预设的相似度算法为K最近邻(k-Nearest Neighbor,KNN)算法。
通过设置相似度算法为KNN算法,可提高对新用户推送商品信息的准确性,进而提高新用户的体验感,有利于累计用户。
在本发明一些实施例中,模型训练模块602具体用于:基于小批量K均值聚类算法和K均值聚类算法对多个商品历史标签进行多次聚类,生成初始标签类型识别模型,初始标签类型识别模型中包括多种不同类型的商品初始目标标签;判断商品初始目标标签的个数是否小于阈值标签数量;若商品初始目标标签的个数小于阈值标签数量,则基于K均值聚类算法和/或小批量K均值聚类算法对商品初始目标标签再次进行至少一次聚类,生成包括多种不同类型的商品二次目标标签的二次标签类型识别模型,二商品次目标标签的类型数大于或等于阈值标签数量,二次标签类型识别模型为标签类型识别模型;若商品初始目标标签的类型数大于或等于阈值标签数量,则初始标签类型识别模型为标签类型识别模型。
通过上述设置,可保证标签类型识别模型中标签的多样性,避免在聚类过程中商品历史数据的特征丢失,有利于对历史用户的商品历史数据进行精准细分,提高信息商品推送的精确性。
在本发明的一些实施例中,模型训练模块602具体还用于:基于小批量K均值聚类算法对多个商品历史标签进行初次聚类,生成多种不同类型的商品初始聚类标签;判断多种不同类型的商品初始聚类标签中每一商品初始聚类标签中商品历史数据的个数是否大于阈值聚类数量;若商品初始聚类标签中商品历史数据的个数大于阈值聚类数量,则基于小批量K均值聚类算法对商品初始聚类标签进行二次聚类,生成初始标签类型识别模型;若商品初始聚类标签中商品历史数据的个数小于或等于所述阈值聚类数量,则基于K均值聚类算法对商品初始聚类标签进行二次聚类,生成初始标签类型识别模型。
基于小批量K均值聚类算法对多个商品历史标签进行初次聚类,生成多种不同类型的商品初始聚类标签,并根据商品初始聚类标签中商品历史数据的个数与阈值聚类数量之间的关系,选择K均值聚类算法或小批量K均值聚类算法对商品初始聚类标签进行二次聚类,生成初始标签类型识别模型,可在提高初始标签类型识别模型生成效率的同时保证其准确性。
在本发明的一些实施例中,如图6所示,商品信息推送装置600还包括测试模块605,用于基于商品历史数据构建商品测试集;将商品测试集输入到标签类型识别模型中;并获得商品测试集的标签类型识别结果;判断标签类型识别结果的可信度,若标签类型识别结果的可信度小于阈值可信度,则对商品历史数据重新进行多次聚类。
通过上述设置,可确保标签类型识别结果的可靠性,进而提高商品信息推送的精确性。
在本发明的一些实施例中,商品信息推送装置600还包括优化模块606,用于基于新用户的商品浏览数据对标签类型识别模型进行优化。
本发明实施例还提供一种计算机设备,其集成了本发明实施例所提供的任一种商品信息推送装置,所述计算机设备包括:
一个或多个处理器;
存储器;以及
一个或多个应用程序,其中所述一个或多个应用程序被存储于所述存储器中,并配置为由所述处理器执行上述商品信息推送方法实施例中任一实施例中所述的商品信息推送方法中的步骤。
本发明实施例提供的一种计算机设备,其集成了本发明实施例所提供的任一种商品信息推送装置。如图7所示,其示出了本发明实施例所涉及的计算机设备的结构示意图,具体来讲:
该计算机设备可以包括一个或者一个以上处理核心的处理器701、一个或一个以上计算机可读存储介质的存储器702、电源703和输入单元704等部件。本领域技术人员可以理解,图7中示出的计算机设备结构并不构成对计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
处理器701是该计算机设备的控制中心,利用各种接口和线路连接整个计算机设备的各个部分,通过运行或执行存储在存储器702内的软件程序和/或模块,以及调用存储在存储器702内的数据,执行计算机设备的各种功能和处理数据,从而对计算机设备进行整体监控。可选的,处理器701可包括一个或多个处理核心;优选的,处理器701可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、操作用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器701中。
存储器702可用于存储软件程序以及模块,处理器701通过运行存储在存储器702的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器702可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据计算机设备的使用所创建的数据等。此外,存储器702可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器702还可以包括存储器控制器,以提供处理器701对存储器702的访问。
计算机设备还包括给各个部件供电的电源703,优选的,电源703可以通过电源管理系统与处理器701逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源703还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
该计算机设备还可包括输入单元704,该输入单元704可用于接收输入的数字或字符信息,以及产生与操作用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
尽管未示出,计算机设备还可以包括显示单元等,在此不再赘述。具体在本实施例中,计算机设备中的处理器701会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器702中,并由处理器701来运行存储在存储器702中的应用程序,从而实现各种功能,如下:
获取历史用户的商品历史数据,并根据所述商品历史数据生成多个商品历史标签;
基于小批量K均值聚类算法和K均值聚类算法对所述多个商品历史标签进行多次聚类,生成标签类型识别模型,所述标签类型识别模型中包括多种不同类型的商品目标标签;
获取新用户的商品浏览数据,并根据所述商品浏览数据生成与所述新用户对应的商品初始标签;
将所述商品初始标签输入到所述标签类型识别模型中,根据预设的相似度算法确定所述商品初始标签与所述多种不同类型的商品目标标签中商品目标标签的相似度;
基于所述相似度,向所述新用户推送商品信息。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本发明实施例提供一种计算机可读存储介质,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。其上存储有计算机程序,所述计算机程序被处理器进行加载,以执行本发明实施例所提供的任一种商品信息推送方法中的步骤。例如,所述计算机程序被处理器进行加载可以执行如下步骤:
获取历史用户的商品历史数据,并根据所述商品历史数据生成多个商品历史标签;
基于小批量K均值聚类算法和K均值聚类算法对所述多个商品历史标签进行多次聚类,生成标签类型识别模型,所述标签类型识别模型中包括多种不同类型的商品目标标签;
获取新用户的商品浏览数据,并根据所述商品浏览数据生成与所述新用户对应的商品初始标签;
将所述商品初始标签输入到所述标签类型识别模型中,根据预设的相似度算法确定所述商品初始标签与所述多种不同类型的商品目标标签中商品目标标签的相似度;
基于所述相似度,向所述新用户推送商品信息。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见上文针对其他实施例的详细描述,此处不再赘述。
具体实施时,以上各个单元或结构可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个单元或结构的具体实施可参见前面的方法实施例,在此不再赘述。
以上对本发明所提供的商品信息推送方法、装置计算机设备及可读存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种商品信息推送方法,其特征在于,包括:
获取历史用户的商品历史数据,并根据所述商品历史数据生成多个商品历史标签;
基于小批量K均值聚类算法和K均值聚类算法对所述多个商品历史标签进行多次聚类,生成标签类型识别模型,所述标签类型识别模型中包括多种不同类型的商品目标标签;
获取新用户的商品浏览数据,并根据所述商品浏览数据生成与所述新用户对应的商品初始标签;
将所述商品初始标签输入到所述标签类型识别模型中,根据预设的相似度算法确定所述商品初始标签与所述多种不同类型的商品目标标签中商品目标标签的相似度;
基于所述相似度,向所述新用户推送商品信息。
2.根据权利要求1所述的商品信息推送方法,其特征在于,所述基于小批量K均值聚类算法和K均值聚类算法对所述多个商品历史标签进行多次聚类,生成标签类型识别模型包括:
基于小批量K均值聚类算法和K均值聚类算法对所述多个商品历史标签进行多次聚类,生成初始标签类型识别模型,所述初始标签类型识别模型中包括多种不同类型的商品初始目标标签;
判断所述商品初始目标标签的类型数是否小于阈值标签数量;
若所述商品初始目标标签的类型数小于所述阈值标签数量,则基于所述K均值聚类算法和/或小批量K均值聚类算法对所述商品初始目标标签再次进行至少一次聚类,生成包括多种不同类型的商品二次目标标签的二次标签类型识别模型,所述商品二次目标标签的类型数大于或等于所述阈值标签数量,所述二次标签类型识别模型为所述标签类型识别模型;
若所述商品初始目标标签的类型数大于或等于所述阈值标签数量,则所述初始标签类型识别模型为所述标签类型识别模型。
3.根据权利要求2所述的商品信息推送方法,其特征在于,所述基于小批量K均值聚类算法和K均值聚类算法对所述多个商品历史标签进行多次聚类,生成初始标签类型识别模型包括:
基于所述小批量K均值聚类算法对所述多个商品历史标签进行初次聚类,生成多种不同类型的商品初始聚类标签;
判断所述多种不同类型的商品初始聚类标签中每一商品初始聚类标签中所述商品历史数据的个数是否大于阈值聚类数量;
若所述商品初始聚类标签中所述商品历史数据的个数大于阈值聚类数量,则基于所述小批量K均值聚类算法对所述进行商品初始聚类标签进行二次聚类,生成所述初始标签类型识别模型;
若所述初始聚类标签中所述商品历史数据的个数小于或等于所述阈值聚类数量,则基于所述K均值聚类算法对所述商品初始聚类标签进行二次聚类,生成所述初始标签类型识别模型。
4.根据权利要求1所述的商品信息推送方法,其特征在于,所述商品历史数据包括:商品浏览内容、商品浏览时长、商品浏览区域以及商品检索内容中的至少一种。
5.根据权利要求1所述的商品信息推送方法,其特征在于,所述预设的相似度算法为K最近邻算法。
6.根据权利要求1所述的商品信息推送方法,其特征在于,在所述基于小批量K均值聚类算法和K均值聚类算法对所述多个商品历史标签进行多次聚类,生成标签类型识别模型之后还包括:
基于所述商品历史数据构建商品测试集;
将所述商品测试集输入到所述标签类型识别模型中,并获得所述商品测试集的标签类型识别结果;
判断所述标签类型识别结果的可信度,若所述标签类型识别结果的可信度小于阈值可信度,则对所述商品历史数据重新进行多次聚类。
7.根据权利要求1所述的商品信息推送方法,其特征在于,所述方法还包括:
基于所述新用户的商品浏览数据对所述标签类型识别模型进行优化。
8.一种商品信息推送装置,其特征在于,包括:
数据获取模块,用于获取历史用户的商品历史数据,并根据所述商品历史数据生成多个商品历史标签;
模型训练模块,用于基于小批量K均值聚类算法和K均值聚类算法对所述多个商品历史标签进行多次聚类,生成标签类型识别模型,所述标签类型识别模型中包括多种不同类型的商品目标标签;
标签识别模块,用于获取新用户的商品浏览数据,并根据所述商品浏览数据生成与所述新用户对应的商品初始标签;
相似度确认模块,用于将所述商品初始标签输入到所述标签类型识别模型中,根据预设的相似度算法确定所述商品初始标签与所述多种不同类型的商品目标标签中商品目标标签的相似度;
推送模块,用于基于所述相似度,向所述新用户推送商品信息。
9.一种计算机设备,其特征在于,所述计算机设备包括:
一个或多个处理器;
存储器;以及
一个或多个应用程序,其中所述一个或多个应用程序被存储于所述存储器中,并配置为由所述处理器执行以实现权利要求1-7任意一项所述的商品信息推送方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器进行加载,以执行权利要求1-7任意一项所述的商品信息推送方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110514977.5A CN113222697A (zh) | 2021-05-11 | 2021-05-11 | 商品信息推送方法、装置计算机设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110514977.5A CN113222697A (zh) | 2021-05-11 | 2021-05-11 | 商品信息推送方法、装置计算机设备及可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113222697A true CN113222697A (zh) | 2021-08-06 |
Family
ID=77094901
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110514977.5A Pending CN113222697A (zh) | 2021-05-11 | 2021-05-11 | 商品信息推送方法、装置计算机设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113222697A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116308650A (zh) * | 2023-03-13 | 2023-06-23 | 北京农夫铺子技术研究院 | 基于人工智能的智慧社区商品大数据沉浸式团购系统 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160292578A1 (en) * | 2015-04-03 | 2016-10-06 | BigML, Inc. | Predictive modeling of data clusters |
WO2017016059A1 (zh) * | 2015-07-24 | 2017-02-02 | 成都云堆移动信息技术有限公司 | 基于文本挖掘的互联网媒体用户属性分析方法 |
CN106919619A (zh) * | 2015-12-28 | 2017-07-04 | 阿里巴巴集团控股有限公司 | 一种商品聚类方法、装置及电子设备 |
CN107360222A (zh) * | 2017-06-30 | 2017-11-17 | 广东欧珀移动通信有限公司 | 商品信息推送方法、装置、存储介质以及服务器 |
CN108363821A (zh) * | 2018-05-09 | 2018-08-03 | 深圳壹账通智能科技有限公司 | 一种信息推送方法、装置、终端设备及存储介质 |
CN110704657A (zh) * | 2019-09-27 | 2020-01-17 | 网易(杭州)网络有限公司 | 图像标签的推荐方法、装置及电子设备 |
CN111062757A (zh) * | 2019-12-17 | 2020-04-24 | 山大地纬软件股份有限公司 | 基于多路径寻优匹配的信息推荐方法及系统 |
CN111080398A (zh) * | 2019-11-19 | 2020-04-28 | 浙江大搜车软件技术有限公司 | 商品推荐方法、装置、计算机设备和存储介质 |
WO2020098156A1 (zh) * | 2018-11-15 | 2020-05-22 | 平安科技(深圳)有限公司 | 产品数据推送方法及装置、计算机非易失性可读存储介质 |
CN112417131A (zh) * | 2020-11-25 | 2021-02-26 | 上海创米科技有限公司 | 信息推荐方法和装置 |
CN112750012A (zh) * | 2021-01-13 | 2021-05-04 | 叮当快药科技集团有限公司 | 商品推荐方法、装置、设备和存储介质 |
-
2021
- 2021-05-11 CN CN202110514977.5A patent/CN113222697A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160292578A1 (en) * | 2015-04-03 | 2016-10-06 | BigML, Inc. | Predictive modeling of data clusters |
WO2017016059A1 (zh) * | 2015-07-24 | 2017-02-02 | 成都云堆移动信息技术有限公司 | 基于文本挖掘的互联网媒体用户属性分析方法 |
CN106919619A (zh) * | 2015-12-28 | 2017-07-04 | 阿里巴巴集团控股有限公司 | 一种商品聚类方法、装置及电子设备 |
CN107360222A (zh) * | 2017-06-30 | 2017-11-17 | 广东欧珀移动通信有限公司 | 商品信息推送方法、装置、存储介质以及服务器 |
CN108363821A (zh) * | 2018-05-09 | 2018-08-03 | 深圳壹账通智能科技有限公司 | 一种信息推送方法、装置、终端设备及存储介质 |
WO2020098156A1 (zh) * | 2018-11-15 | 2020-05-22 | 平安科技(深圳)有限公司 | 产品数据推送方法及装置、计算机非易失性可读存储介质 |
CN110704657A (zh) * | 2019-09-27 | 2020-01-17 | 网易(杭州)网络有限公司 | 图像标签的推荐方法、装置及电子设备 |
CN111080398A (zh) * | 2019-11-19 | 2020-04-28 | 浙江大搜车软件技术有限公司 | 商品推荐方法、装置、计算机设备和存储介质 |
CN111062757A (zh) * | 2019-12-17 | 2020-04-24 | 山大地纬软件股份有限公司 | 基于多路径寻优匹配的信息推荐方法及系统 |
CN112417131A (zh) * | 2020-11-25 | 2021-02-26 | 上海创米科技有限公司 | 信息推荐方法和装置 |
CN112750012A (zh) * | 2021-01-13 | 2021-05-04 | 叮当快药科技集团有限公司 | 商品推荐方法、装置、设备和存储介质 |
Non-Patent Citations (1)
Title |
---|
李静: "基于大众点评网餐饮业商家分类探究", 《中国优秀硕士学位论文全文数据库经济与管理科学辑》, no. 06, 15 June 2019 (2019-06-15), pages 27 - 29 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116308650A (zh) * | 2023-03-13 | 2023-06-23 | 北京农夫铺子技术研究院 | 基于人工智能的智慧社区商品大数据沉浸式团购系统 |
CN116308650B (zh) * | 2023-03-13 | 2024-02-06 | 北京农夫铺子技术研究院 | 基于人工智能的智慧社区商品大数据沉浸式团购系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11037060B2 (en) | Analyzing sequence data using neural networks | |
CN110297935A (zh) | 图像检索方法、装置、介质及电子设备 | |
US11645585B2 (en) | Method for approximate k-nearest-neighbor search on parallel hardware accelerators | |
CN110309377B (zh) | 语义归一化、提问模式的生成、应答确定方法及装置 | |
CN111209173A (zh) | 一种性别预测方法、装置、存储介质、以及电子设备 | |
CN114444619A (zh) | 样本生成方法、训练方法、数据处理方法以及电子设备 | |
CN115564486A (zh) | 一种数据推送方法、装置、设备和介质 | |
CN110018845B (zh) | 元数据版本对比方法及装置 | |
CN111708942A (zh) | 多媒体资源推送方法、装置、服务器及存储介质 | |
CN114662006A (zh) | 端云协同推荐系统、方法以及电子设备 | |
CN113222697A (zh) | 商品信息推送方法、装置计算机设备及可读存储介质 | |
CN111291564B (zh) | 一种用于词向量获取的模型训练方法、装置和存储介质 | |
CN116030375A (zh) | 视频特征提取、模型训练方法、装置、设备及存储介质 | |
CN115632874A (zh) | 一种实体对象的威胁检测方法、装置、设备及存储介质 | |
CN112905885B (zh) | 向用户推荐资源的方法、装置、设备、介质和程序产品 | |
CN112257812B (zh) | 一种标注样本确定方法、装置、机器可读介质及设备 | |
CN113094584A (zh) | 推荐学习资源的确定方法和装置 | |
CN112561412A (zh) | 目标对象标识的确定方法、装置、服务器及存储介质 | |
CN113312521B (zh) | 内容检索方法、装置、电子设备和介质 | |
CN112597363B (zh) | 一种用户处理方法、装置、电子设备及存储介质 | |
CN113761379B (zh) | 商品推荐方法及装置、电子设备和介质 | |
CN117851546A (zh) | 资源检索方法、训练方法、装置、电子设备、存储介质及程序产品 | |
CN113849688A (zh) | 资源处理方法、资源处理装置、电子设备以及存储介质 | |
CN114328987A (zh) | 媒体内容的召回方法、装置、设备、存储介质和产品 | |
CN115204961A (zh) | 隐式评价对象识别方法、装置、设备和计算机存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |