CN113590935B - 信息推荐方法、装置、计算机设备及存储介质 - Google Patents

信息推荐方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN113590935B
CN113590935B CN202110744130.6A CN202110744130A CN113590935B CN 113590935 B CN113590935 B CN 113590935B CN 202110744130 A CN202110744130 A CN 202110744130A CN 113590935 B CN113590935 B CN 113590935B
Authority
CN
China
Prior art keywords
information
buried
buried point
candidate
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110744130.6A
Other languages
English (en)
Other versions
CN113590935A (zh
Inventor
刘杨
熊焕卫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Donson Times Information Technology Co ltd
Original Assignee
Donson Times Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Donson Times Information Technology Co ltd filed Critical Donson Times Information Technology Co ltd
Priority to CN202110744130.6A priority Critical patent/CN113590935B/zh
Publication of CN113590935A publication Critical patent/CN113590935A/zh
Application granted granted Critical
Publication of CN113590935B publication Critical patent/CN113590935B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种信息推荐方法、装置、计算机设备及介质,包括:采集针对目标用户的埋点触发信息,并将埋点触发信息中包含的被触发的埋点,作为第一埋点,将预设埋点集合中,未触发的埋点作为第二埋点,对埋点触发信息进行解析,得到目标用户针对每个第一埋点的行为信息,对所有第一埋点的行为信息进行聚类,得到若干聚类簇,根据每个聚类簇中包含的第一埋点数量,生成第一权重信息,采用第一权重信息对第一埋点进行加权,采用预设的第二权重信息对第二埋点进行加权排序,得到埋点排序序列,基于埋点排序序列和聚类簇,确定目标用户的偏好产品和偏好类别,并基于偏好产品和偏好类别,进行产品信息推荐,采用本发明可提高产品信息推荐的精准性。

Description

信息推荐方法、装置、计算机设备及存储介质
技术领域
本发明涉及数据处理领域,尤其涉及一种信息推荐方法、装置、计算机设备及介质。
背景技术
互联网能够给用户提供丰富的信息资源,随着互联网技术的飞速发展,越来越多的用户通过互联网获取信息,不同人群,其感兴趣的目标对象不一样,为给用户进行精准地信息推荐,需要获取用户的兴趣偏好。
在当前,获取用户兴趣偏好主要是通过埋点的方式,即统计用户点击各个埋点应用的频率来确定用户偏好,但这种方式受到埋点应用本身的数量和分布限制,具有一定的局限性,对用户定位的精准程度不高,使得信息推荐的针对性较弱。
发明内容
本发明实施例提供一种信息推荐方法、装置、计算机设备和存储介质,以提高当前信息推荐的精准性。
为了解决上述技术问题,本申请实施例提供一种信息推荐方法,包括:
采集针对目标用户的埋点触发信息,并将所述埋点触发信息中包含的被触发的埋点,作为第一埋点,将预设埋点集合中,未触发的埋点作为第二埋点,其中,所述预设埋点集合包括所述第一埋点和所述第二埋点;
对所述埋点触发信息进行解析,得到所述目标用户针对每个所述第一埋点的行为信息,所述行为信息包括行为类别、行为时间和行为频率;
对所有所述第一埋点的行为信息进行聚类,得到若干聚类簇,根据每个所述聚类簇中包含的第一埋点数量,生成第一权重信息;
采用第一权重信息对第一埋点进行加权,采用预设的第二权重信息对所述第二埋点进行加权,并对加权后的第一埋点信息和加权后的第二埋点信息进行排序,得到埋点排序序列;
基于所述埋点排序序列和聚类簇,确定所述目标用户的偏好产品和偏好类别,并基于所述偏好产品和所述偏好类别,进行产品信息推荐。
可选地,在所述采集针对目标用户的埋点触发信息之前,所述方法还包括:
从预设的维度集合中,选取至少两个基础维度,作为候选维度;
基于所述候选维度进行特征选取,得到候选特征集;
根据预设的特征甄选方式,从所述候选特征集中,选取目标特征;
将每个所述目标特征作为一个埋点,得到所述预设埋点集合。
可选地,其中一个候选维度为用户群体,所述基于所述候选维度进行特征选取,得到候选特征集包括:
获取所述目标用户的基础信息;
基于所述基础信息,判断所述目标用户所属的用户群体,作为目标用户群体;
获取所述目标群体的偏好产品和偏好类别,并基于所述目标群体的偏好产品和偏好类别进行特征提取,并将提取到的特征加入到所述候选特征集中。
可选地,所述根据预设的特征甄选方式,从所述候选特征集中,选取目标特征包括:
动态生成每个所述候选维度的选取比例;
获取预设埋点数量,并基于所述预设埋点数量,确定所述目标特征的数量;
根据每个所述候选维度的选取比例和所述目标特征的数量,确定每个所述候选维度对应的特征数量;
针对每个所述候选维度,从所述候选维度对应的候选特征集中,选取所述候选维度对应的特征数量的特征,作为所述目标特征。
可选地,在所述根据预设的特征甄选方式,从所述候选特征集中,选取目标特征之后,并且,在所述将每个所述目标特征作为一个埋点,得到所述预设埋点集合之前,所述方法还包括:
将所述预设的维度集合中不属于所述候选维度的基础维度,作为补充维度;
从每个所述补充维度中,获取预设数量的特征,作为补充特征;
将所述补充特征添加到所述目标特征中。
可选地,所述对所有所述第一埋点的行为信息进行聚类,得到若干聚类簇包括:
生成所述行为信息对应的词向量,作为每个埋点信息的用户标签;
基于K-Means聚合算法对所述用户标签进行聚类,得到若干所述聚类簇。
为了解决上述技术问题,本申请实施例还提供一种信息推荐装置,包括:
埋点分类模块,用于采集针对目标用户的埋点触发信息,并将所述埋点触发信息中包含的被触发的埋点,作为第一埋点,将预设埋点集合中,未触发的埋点作为第二埋点,其中,所述预设埋点集合包括所述第一埋点和所述第二埋点;
第一埋点分析模块,用于对所述埋点触发信息进行解析,得到所述目标用户针对每个所述第一埋点的行为信息,所述行为信息包括行为类别、行为时间和行为频率;
第一权重生成模块,用于对所有所述第一埋点的行为信息进行聚类,得到若干聚类簇,根据每个所述聚类簇中包含的第一埋点数量,生成第一权重信息;
加权排序模块,用于采用第一权重信息对第一埋点进行加权,采用预设的第二权重信息对所述第二埋点进行加权,并对加权后的第一埋点信息和加权后的第二埋点信息进行排序,得到埋点排序序列;
产品信息推荐模块,用于基于所述埋点排序序列和聚类簇,确定所述目标用户的偏好产品和偏好类别,并基于所述偏好产品和所述偏好类别,进行产品信息推荐。
可选地,所述信息推荐装置还包括:
候选维度选取模块,用于从预设的维度集合中,选取至少两个基础维度,作为候选维度;
特征选取模块,用于基于所述候选维度进行特征选取,得到候选特征集;
目标特征确定模块,用于根据预设的特征甄选方式,从所述候选特征集中,选取目标特征;
埋点集合生成模块,用于将每个所述目标特征作为一个埋点,得到所述预设埋点集合。
可选地,所述特征选取模块包括:
基础信息获取单元,用于获取所述目标用户的基础信息;
目标群体确定单元,用于基于所述基础信息,判断所述目标用户所属的用户群体,作为目标用户群体;
获取所述目标群体的偏好产品和偏好类别,并基于所述目标群体的偏好产品和偏好类别进行特征提取,并将提取到的特征加入到所述候选特征集中。
可选地,所述目标特征确定模块包括:
比例生成单元,用于动态生成每个所述候选维度的选取比例;
目标特征数量确定单元,用于获取预设埋点数量,并基于所述预设埋点数量,确定所述目标特征的数量;
维度特征数量确定单元,用于根据每个所述候选维度的选取比例和所述目标特征的数量,确定每个所述候选维度对应的特征数量;
特征选取单元,用于针对每个所述候选维度,从所述候选维度对应的候选特征集中,选取所述候选维度对应的特征数量的特征,作为所述目标特征。
可选地,所述信息推荐装置还包括:
补充维度确定模块,用于将所述预设的维度集合中不属于所述候选维度的基础维度,作为补充维度;
补充特征确定单元,用于从每个所述补充维度中,获取预设数量的特征,作为补充特征;
目标特征更新单元,用于将所述补充特征添加到所述目标特征中。
可选地,所述第一权重生成模块包括:
向量转化单元,用于生成所述行为信息对应的词向量,作为每个埋点信息的用户标签;
聚类单元,用于基于K-Means聚合算法对所述用户标签进行聚类,得到若干所述聚类簇。
为了解决上述技术问题,本申请实施例还提供一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述信息推荐方法的步骤。
为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述信息推荐方法的步骤。
本发明实施例提供的信息推荐方法、装置、计算机设备及存储介质,通过采集针对目标用户的埋点触发信息,并将埋点触发信息中包含的被触发的埋点,作为第一埋点,将预设埋点集合中,未触发的埋点作为第二埋点,其中,预设埋点集合包括第一埋点和第二埋点,对埋点触发信息进行解析,得到目标用户针对每个第一埋点的行为信息,行为信息包括行为类别、行为时间和行为频率,对所有第一埋点的行为信息进行聚类,得到若干聚类簇,根据每个聚类簇中包含的第一埋点数量,生成第一权重信息,采用第一权重信息对第一埋点进行加权,采用预设的第二权重信息对第二埋点进行加权,并对加权后的第一埋点信息和加权后的第二埋点信息进行排序,得到埋点排序序列,基于埋点排序序列和聚类簇,确定目标用户的偏好产品和偏好类别,并基于偏好产品和偏好类别,进行产品信息推荐,实现通过对埋点解析的方式,对用户偏好产品和偏好类别进行精准定位,提高产品信息推荐的精准性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请可以应用于其中的示例性系统架构图;
图2是本申请的信息推荐方法的一个实施例的流程图;
图3是根据本申请的信息推荐装置的一个实施例的结构示意图;
图4是根据本申请的计算机设备的一个实施例的结构示意图。
具体实施方式
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture EpertsGroup Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving PictureEperts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的页面提供支持的后台服务器。
需要说明的是,本申请实施例所提供的信息推荐方法由服务器执行,相应地,信息推荐装置设置于服务器中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器,本申请实施例中的终端设备101、102、103具体可以对应的是实际生产中的应用系统。
请参阅图2,图2示出本发明实施例提供的一种信息推荐方法,以该方法应用在图1中的服务端为例进行说明,详述如下:
S201:采集针对目标用户的埋点触发信息,并将埋点触发信息中包含的被触发的埋点,作为第一埋点,将预设埋点集合中,未触发的埋点作为第二埋点,其中,预设埋点集合包括第一埋点和第二埋点。
具体地,服务端预先选取一些相对于目标用户具有针对性的埋点进行设置,构成预设埋点集合,并定期对埋点触发信息进行检查,从埋点触发信息中获取被触发的埋点,作为第一埋点,并将预设埋点集合中未触发的埋点作为第二埋点。
其中,埋点触发信息具体可以是从后台日志文件中获取,也可以是在埋点被触发时,自动生成相应埋点触发信息。
S202:对埋点触发信息进行解析,得到目标用户针对每个第一埋点的行为信息,行为信息包括行为类别、行为时间和行为频率。
具体地,对埋点触发信息进行解析,得到目标用户针对每个第一埋点的行为信息,行为信息包括但不限于行为类别、行为时间和行为频率等。
S203:对所有第一埋点的行为信息进行聚类,得到若干聚类簇,根据每个聚类簇中包含的第一埋点数量,生成第一权重信息。
对所有第一埋点的行为信息进行聚类,得到若干聚类簇的具体实现细节,可参考后续实施例的描述,为避免重复此处不再赘述。
S204:采用第一权重信息对第一埋点进行加权,采用预设的第二权重信息对第二埋点进行加权,并对加权后的第一埋点信息和加权后的第二埋点信息进行排序,得到埋点排序序列。
其中,预设的第二权重信息可根据实际或经验值需要进行设定,例如设定为0.2,此处不做限定。
S205:基于埋点排序序列和聚类簇,确定目标用户的偏好产品和偏好类别,并基于偏好产品和偏好类别,进行产品信息推荐。
本实施例中,采集针对目标用户的埋点触发信息,并将埋点触发信息中包含的被触发的埋点,作为第一埋点,将预设埋点集合中,未触发的埋点作为第二埋点,对埋点触发信息进行解析,得到目标用户针对每个第一埋点的行为信息,行为信息包括行为类别、行为时间和行为频率,对所有第一埋点的行为信息进行聚类,得到若干聚类簇,根据每个聚类簇中包含的第一埋点数量,生成第一权重信息,采用第一权重信息对第一埋点进行加权,采用预设的第二权重信息对第二埋点进行加权,并对加权后的第一埋点信息和加权后的第二埋点信息进行排序,得到埋点排序序列,基于埋点排序序列和聚类簇,确定目标用户的偏好产品和偏好类别,并基于偏好产品和偏好类别,进行产品信息推荐,实现通过对埋点解析的方式,对用户偏好产品和偏好类别进行精准定位,提高产品信息推荐的精准性。
可选地,步骤S201之前,也即,在采集针对目标用户的埋点触发信息之前,该方法还包括:
从预设的维度集合中,选取至少两个基础维度,作为候选维度;
基于候选维度进行特征选取,得到候选特征集;
根据预设的特征甄选方式,从候选特征集中,选取目标特征;
将每个目标特征作为一个埋点,得到预设埋点集合。
根据预设的特征甄选方式,从候选特征集中,选取目标特征的具体实现方式,可参考后续实施例的描述,为避免重复,此处不再赘述。
可选地,其中一个候选维度为用户群体,基于候选维度进行特征选取,得到候选特征集包括:
获取目标用户的基础信息;
基于基础信息,判断目标用户所属的用户群体,作为目标用户群体;
获取目标群体的偏好产品和偏好类别,并基于目标群体的偏好产品和偏好类别进行特征提取,并将提取到的特征加入到候选特征集中。
本实施例中,根据获取目标用户的基础信息,判断目标用户所属的用户群体,进而根据用户群体的偏好产品和偏好类别,进行特征提取并加入到候选特征集中,得到的候选特征集更有针对性,在后续通过候选特征集生成埋点时,有利于提高埋点的精准性。
可选地,根据预设的特征甄选方式,从候选特征集中,选取目标特征包括:
动态生成每个候选维度的选取比例;
获取预设埋点数量,并基于预设埋点数量,确定目标特征的数量;
根据每个候选维度的选取比例和目标特征的数量,确定每个候选维度对应的特征数量;
针对每个候选维度,从候选维度对应的候选特征集中,选取候选维度对应的特征数量的特征,作为目标特征。
其中,预设埋点数量可以根据实际需求进行设定,例如设置埋点数量为200个,此处不作具体限定。
进一步地,基于预设埋点数量,确定目标特征的数量包括:根据实际应用中每个埋点包含的特征数量,确定目标特征的数量,需要说明的是,通常情况下,一个埋点包含一个特征,但也有些应用场景,一个埋点可包含两个或者两个以上的特征,具体根据不同应用场景,存在区别。
本实施例中,通过生成每个候选维度的选取比例,进而从每个维度选取一定比例的目标特征,确定根据目标特征设置的埋点分布的合理性,提高埋点被触发的几率,有利于精准地挖掘用户偏好。
可选地,在根据预设的特征甄选方式,从候选特征集中,选取目标特征之后,并且,在将每个目标特征作为一个埋点,得到预设埋点集合之前,该方法还包括:
将预设的维度集合中不属于候选维度的基础维度,作为补充维度;
从每个补充维度中,获取预设数量的特征,作为补充特征;
将补充特征添加到目标特征中。
本实施例中,通过将候选维度之外的基础维度中的特征作为补充特征,添加到目标特征中,防止漏掉目标用户的兴趣偏好类别。
可选地,对所有第一埋点的行为信息进行聚类,得到若干聚类簇包括:
生成行为信息对应的词向量,作为每个埋点信息的用户标签;
基于K-Means聚合算法对用户标签进行聚类,得到若干聚类簇。
具体地,在行为信息较长时,可对行为信息进行分词和关键词提取。分词可采用第三方分词工具或者分词算法来实现。
其中,常见的第三方分词工具包括但不限于:Stanford NLP分词器、ICTClAS分词系统、ansj分词工具和HanLP中文分词工具等。
其中,分词算法包括但不限于:最大正向匹配(Maximum Matching,MM)算法、逆向最大匹配(ReverseDirectionMaximum Matching Method,RMM)算法、双向最大匹配(Bi-directction Matching method,BM)算法、隐马尔科夫模型(Hidden Markov Model,HMM)和N-gram模型等。
进一步地,生成行为信息对应的词向量,具体实现为:将每个生成行为信息对应的关键词按照预设的语料库映射到向量中,将这些向量联系在一起,形成一个词向量空间,每个向量相当于是这个空间中的一个点,将每个向量作为一个空间词向量。
其中,K-means算法是基于距离的聚类算法,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。该算法认为簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最终目标。
在本实施例中,每个用户标签为一个空间词向量,使用K-Means聚合算法对用户标签进行聚类分析详叙如下:
将预设的各个词性对应的词向量,作为聚类中心;
针对有效评价中的每个空间词向量,计算该空间词向量与当前每个聚类中心之间的第一距离,将该空间词向量放入最小第一距离对应的聚类中心所在的聚类中,得到m个临时聚类;
针对每个临时聚类,计算该临时聚类的均值,以及该临时聚类中每个空间词向量和该均值之间的第二距离,选取最小第二距离对应的该空间词向量作为该临时聚类的新的聚类中心,得到更新后的m个临时聚类;
按照如下公式计算每个更新后的临时聚类的标准差:
Figure BDA0003142278980000131
其中,σ为标准差,Ai为更新后的临时聚类中第i个空间词向量,n为更新后的临时聚类中空间词向量的数量,μ为空间词向量Ai所在的更新后的临时聚类的平均值,i∈[1,n],且i和n为正整数;
若m个更新后的临时聚类的标准差中至少存在一个标准差大于或者等于预设的标准差阈值,则返回执行针对有效评价中的每个空间词向量,计算该空间词向量与当前每个聚类中心之间的第一距离,将该空间词向量放入最小第一距离对应的聚类中心所在的聚类中,得到m个临时聚类的步骤;
若m个更新后的临时聚类的标准差均小于标准差阈值,则将该m个更新后的临时聚类的聚类中心作为聚类分析结果。
本实施例中,通过生成行为信息对应的词向量,作为每个埋点信息的用户标签,基于K-Means聚合算法对用户标签进行聚类,得到若干聚类簇,实现对行为信息的聚类,有利于后续根据得到的聚类簇确定用户的偏好产品和偏好类别。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
图3示出与上述实施例信息推荐方法一一对应的信息推荐装置的原理框图。如图3所示,该信息推荐装置包括埋点分类模块31、第一埋点分析模块32、第一权重生成模块33、加权排序模块34和产品信息推荐模块35。各功能模块详细说明如下:
埋点分类模块31,用于采集针对目标用户的埋点触发信息,并将埋点触发信息中包含的被触发的埋点,作为第一埋点,将预设埋点集合中,未触发的埋点作为第二埋点,其中,预设埋点集合包括第一埋点和第二埋点;
第一埋点分析模块32,用于对埋点触发信息进行解析,得到目标用户针对每个第一埋点的行为信息,行为信息包括行为类别、行为时间和行为频率;
第一权重生成模块33,用于对所有第一埋点的行为信息进行聚类,得到若干聚类簇,根据每个聚类簇中包含的第一埋点数量,生成第一权重信息;
加权排序模块34,用于采用第一权重信息对第一埋点进行加权,采用预设的第二权重信息对第二埋点进行加权,并对加权后的第一埋点信息和加权后的第二埋点信息进行排序,得到埋点排序序列;
产品信息推荐模块35,用于基于埋点排序序列和聚类簇,确定目标用户的偏好产品和偏好类别,并基于偏好产品和偏好类别,进行产品信息推荐。
可选地,信息推荐装置还包括:
候选维度选取模块,用于从预设的维度集合中,选取至少两个基础维度,作为候选维度;
特征选取模块,用于基于候选维度进行特征选取,得到候选特征集;
目标特征确定模块,用于根据预设的特征甄选方式,从候选特征集中,选取目标特征;
埋点集合生成模块,用于将每个目标特征作为一个埋点,得到预设埋点集合。
可选地,特征选取模块包括:
基础信息获取单元,用于获取目标用户的基础信息;
目标群体确定单元,用于基于基础信息,判断目标用户所属的用户群体,作为目标用户群体;
获取目标群体的偏好产品和偏好类别,并基于目标群体的偏好产品和偏好类别进行特征提取,并将提取到的特征加入到候选特征集中。
可选地,目标特征确定模块包括:
比例生成单元,用于动态生成每个候选维度的选取比例;
目标特征数量确定单元,用于获取预设埋点数量,并基于预设埋点数量,确定目标特征的数量;
维度特征数量确定单元,用于根据每个候选维度的选取比例和目标特征的数量,确定每个候选维度对应的特征数量;
特征选取单元,用于针对每个候选维度,从候选维度对应的候选特征集中,选取候选维度对应的特征数量的特征,作为目标特征。
可选地,信息推荐装置还包括:
补充维度确定模块,用于将预设的维度集合中不属于候选维度的基础维度,作为补充维度;
补充特征确定单元,用于从每个补充维度中,获取预设数量的特征,作为补充特征;
目标特征更新单元,用于将补充特征添加到目标特征中。
可选地,第一权重生成模块33包括:
向量转化单元,用于生成行为信息对应的词向量,作为每个埋点信息的用户标签;
聚类单元,用于基于K-Means聚合算法对用户标签进行聚类,得到若干聚类簇。
关于信息推荐装置的具体限定可以参见上文中对于信息推荐方法的限定,在此不再赘述。上述信息推荐装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
为解决上述技术问题,本申请实施例还提供计算机设备。具体请参阅图4,图4为本实施例计算机设备基本结构框图。
所述计算机设备4包括通过系统总线相互通信连接存储器41、处理器42、网络接口43。需要指出的是,图中仅示出了具有组件连接存储器41、处理器42、网络接口43的计算机设备4,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
所述存储器41至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或D界面显示存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器41可以是所述计算机设备4的内部存储单元,例如该计算机设备4的硬盘或内存。在另一些实施例中,所述存储器41也可以是所述计算机设备4的外部存储设备,例如该计算机设备4上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,所述存储器41还可以既包括所述计算机设备4的内部存储单元也包括其外部存储设备。本实施例中,所述存储器41通常用于存储安装于所述计算机设备4的操作系统和各类应用软件,例如电子文件的控制的程序代码等。此外,所述存储器41还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器42在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器42通常用于控制所述计算机设备4的总体操作。本实施例中,所述处理器42用于运行所述存储器41中存储的程序代码或者处理数据,例如运行电子文件的控制的程序代码。
所述网络接口43可包括无线网络接口或有线网络接口,该网络接口43通常用于在所述计算机设备4与其他电子设备之间建立通信连接。
本申请还提供了另一种实施方式,即提供一种计算机可读存储介质,所述计算机可读存储介质存储有界面显示程序,所述界面显示程序可被至少一个处理器执行,以使所述至少一个处理器执行如上述的信息推荐方法的步骤。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
显然,以上所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例,附图中给出了本申请的较佳实施例,但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现,相反地,提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本申请专利保护范围之内。

Claims (7)

1.一种信息推荐方法,其特征在于,所述信息推荐方法包括:
从预设的维度集合中,选取至少两个基础维度,作为候选维度,其中一个所述候选维度为用户群体;
基于所述候选维度进行特征选取,得到候选特征集;
根据预设的特征甄选方式,从所述候选特征集中,选取目标特征;
将每个所述目标特征作为一个埋点,得到所述预设埋点集合;
采集针对目标用户的埋点触发信息,并将所述埋点触发信息中包含的被触发的埋点,作为第一埋点,将预设埋点集合中,未触发的埋点作为第二埋点,其中,所述预设埋点集合包括所述第一埋点和所述第二埋点;
对所述埋点触发信息进行解析,得到所述目标用户针对每个所述第一埋点的行为信息,所述行为信息包括行为类别、行为时间和行为频率;
对所有所述第一埋点的行为信息进行聚类,得到若干聚类簇,根据每个所述聚类簇中包含的第一埋点数量,生成第一权重信息;
采用第一权重信息对第一埋点进行加权,采用预设的第二权重信息对所述第二埋点进行加权,并对加权后的第一埋点信息和加权后的第二埋点信息进行排序,得到埋点排序序列;
基于所述埋点排序序列和聚类簇,确定所述目标用户的偏好产品和偏好类别,并基于所述偏好产品和所述偏好类别,进行产品信息推荐;
其中,所述基于所述候选维度进行特征选取,得到候选特征集包括:
获取所述目标用户的基础信息;
基于所述基础信息,判断所述目标用户所属的用户群体,作为目标用户群体;
获取所述目标群体的偏好产品和偏好类别,并基于所述目标群体的偏好产品和偏好类别进行特征提取,并将提取到的特征加入到所述候选特征集中。
2.如权利要求1所述的信息推荐方法,其特征在于,所述根据预设的特征甄选方式,从所述候选特征集中,选取目标特征包括:
动态生成每个所述候选维度的选取比例;
获取预设埋点数量,并基于所述预设埋点数量,确定所述目标特征的数量;
根据每个所述候选维度的选取比例和所述目标特征的数量,确定每个所述候选维度对应的特征数量;
针对每个所述候选维度,从所述候选维度对应的候选特征集中,选取所述候选维度对应的特征数量的特征,作为所述目标特征。
3.如权利要求1所述的信息推荐方法,其特征在于,在所述根据预设的特征甄选方式,从所述候选特征集中,选取目标特征之后,并且,在所述将每个所述目标特征作为一个埋点,得到所述预设埋点集合之前,所述方法还包括:
将所述预设的维度集合中不属于所述候选维度的基础维度,作为补充维度;
从每个所述补充维度中,获取预设数量的特征,作为补充特征;
将所述补充特征添加到所述目标特征中。
4.如权利要求1至3任一项所述的信息推荐方法,其特征在于,所述对所有所述第一埋点的行为信息进行聚类,得到若干聚类簇包括:
生成所述行为信息对应的词向量,作为每个埋点信息的用户标签;
基于K-Means聚合算法对所述用户标签进行聚类,得到若干所述聚类簇。
5.一种信息推荐装置,其特征在于,所述信息推荐装置包括:
候选维度选取模块,用于从预设的维度集合中,选取至少两个基础维度,作为候选维度,其中一个所述候选维度为用户群体;
特征选取模块,用于基于所述候选维度进行特征选取,得到候选特征集;
目标特征确定模块,用于根据预设的特征甄选方式,从所述候选特征集中,选取目标特征;
埋点集合生成模块,用于将每个所述目标特征作为一个埋点,得到所述预设埋点集合;
埋点分类模块,用于采集针对目标用户的埋点触发信息,并将所述埋点触发信息中包含的被触发的埋点,作为第一埋点,将预设埋点集合中,未触发的埋点作为第二埋点,其中,所述预设埋点集合包括所述第一埋点和所述第二埋点;
第一埋点分析模块,用于对所述埋点触发信息进行解析,得到所述目标用户针对每个所述第一埋点的行为信息,所述行为信息包括行为类别、行为时间和行为频率;
第一权重生成模块,用于对所有所述第一埋点的行为信息进行聚类,得到若干聚类簇,根据每个所述聚类簇中包含的第一埋点数量,生成第一权重信息;
加权排序模块,用于采用第一权重信息对第一埋点进行加权,采用预设的第二权重信息对所述第二埋点进行加权,并对加权后的第一埋点信息和加权后的第二埋点信息进行排序,得到埋点排序序列;
产品信息推荐模块,用于基于所述埋点排序序列和聚类簇,确定所述目标用户的偏好产品和偏好类别,并基于所述偏好产品和所述偏好类别,进行产品信息推荐;
其中,所述特征选取模块包括:
基础信息获取单元,用于获取所述目标用户的基础信息;
目标群体确定单元,用于基于所述基础信息,判断所述目标用户所属的用户群体,作为目标用户群体;
获取所述目标群体的偏好产品和偏好类别,并基于所述目标群体的偏好产品和偏好类别进行特征提取,并将提取到的特征加入到所述候选特征集中。
6.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至4任一项所述的信息推荐方法。
7.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述的信息推荐方法。
CN202110744130.6A 2021-06-30 2021-06-30 信息推荐方法、装置、计算机设备及存储介质 Active CN113590935B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110744130.6A CN113590935B (zh) 2021-06-30 2021-06-30 信息推荐方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110744130.6A CN113590935B (zh) 2021-06-30 2021-06-30 信息推荐方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN113590935A CN113590935A (zh) 2021-11-02
CN113590935B true CN113590935B (zh) 2022-04-19

Family

ID=78245711

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110744130.6A Active CN113590935B (zh) 2021-06-30 2021-06-30 信息推荐方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN113590935B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112699311A (zh) * 2020-12-31 2021-04-23 上海博泰悦臻网络技术服务有限公司 信息推送方法、存储介质及电子设备

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102654860B (zh) * 2011-03-01 2015-05-06 北京彩云在线技术开发有限公司 一种个性化音乐推荐方法及系统
CN106471491A (zh) * 2015-05-29 2017-03-01 深圳市汇游智慧旅游网络有限公司 一种时变的协同过滤推荐方法
CN107862022B (zh) * 2017-10-31 2020-12-11 中国科学院自动化研究所 文化资源推荐系统
CN109271420B (zh) * 2018-09-03 2023-07-11 深圳平安医疗健康科技服务有限公司 信息推送方法、装置、计算机设备和存储介质
CN110866181B (zh) * 2019-10-12 2022-04-22 平安国际智慧城市科技股份有限公司 资源推荐的方法、装置及存储介质
CN111666492A (zh) * 2020-04-30 2020-09-15 中国平安财产保险股份有限公司 基于用户行为的信息推送方法、装置、设备及存储介质

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112699311A (zh) * 2020-12-31 2021-04-23 上海博泰悦臻网络技术服务有限公司 信息推送方法、存储介质及电子设备

Also Published As

Publication number Publication date
CN113590935A (zh) 2021-11-02

Similar Documents

Publication Publication Date Title
CN109271512B (zh) 舆情评论信息的情感分析方法、装置及存储介质
CN109634698B (zh) 菜单显示方法、装置、计算机设备及存储介质
CN112148987B (zh) 基于目标对象活跃度的消息推送方法及相关设备
CN112632385A (zh) 课程推荐方法、装置、计算机设备及介质
CN111368043A (zh) 基于人工智能的事件问答方法、装置、设备及存储介质
CN114780727A (zh) 基于强化学习的文本分类方法、装置、计算机设备及介质
CN112328909B (zh) 信息推荐方法、装置、计算机设备及介质
CN112035549B (zh) 数据挖掘方法、装置、计算机设备及存储介质
CN113220734A (zh) 课程推荐方法、装置、计算机设备及存储介质
CN114780746A (zh) 基于知识图谱的文档检索方法及其相关设备
CN112181835A (zh) 自动化测试方法、装置、计算机设备及存储介质
CN112446209A (zh) 一种意图标签的设置方法、设备、装置及存储介质
CN114817478A (zh) 基于文本的问答方法、装置、计算机设备及存储介质
CN113569118B (zh) 自媒体推送方法、装置、计算机设备及存储介质
CN113360788A (zh) 一种地址推荐方法、装置、设备及存储介质
CN114547257B (zh) 类案匹配方法、装置、计算机设备及存储介质
CN113590935B (zh) 信息推荐方法、装置、计算机设备及存储介质
CN114742058B (zh) 一种命名实体抽取方法、装置、计算机设备及存储介质
CN113821596A (zh) 信息推荐方法、装置、计算机设备及存储介质
CN113343713B (zh) 意图识别方法、装置、计算机设备及存储介质
CN112084408A (zh) 名单数据筛选方法、装置、计算机设备及存储介质
CN113743721A (zh) 营销策略生成方法、装置、计算机设备及存储介质
CN113505293A (zh) 信息推送方法、装置、电子设备及存储介质
CN113505595A (zh) 文本短语抽取方法、装置、计算机设备及存储介质
CN112784046A (zh) 文本聚簇的方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant