CN111639263B - 笔记推荐方法、装置及系统 - Google Patents

笔记推荐方法、装置及系统 Download PDF

Info

Publication number
CN111639263B
CN111639263B CN202010493852.4A CN202010493852A CN111639263B CN 111639263 B CN111639263 B CN 111639263B CN 202010493852 A CN202010493852 A CN 202010493852A CN 111639263 B CN111639263 B CN 111639263B
Authority
CN
China
Prior art keywords
user terminals
user terminal
note
recommending
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010493852.4A
Other languages
English (en)
Other versions
CN111639263A (zh
Inventor
徐彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiaohongshu Technology Co ltd
Original Assignee
Xiaohongshu Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiaohongshu Technology Co ltd filed Critical Xiaohongshu Technology Co ltd
Priority to CN202010493852.4A priority Critical patent/CN111639263B/zh
Publication of CN111639263A publication Critical patent/CN111639263A/zh
Application granted granted Critical
Publication of CN111639263B publication Critical patent/CN111639263B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了一种笔记推荐方法、装置及系统,其中方法包括:获取A个用户终端一一对应的A个特征向量;对所述A个用户终端一一对应的A个特征向量执行预设次数的列采样及聚类操作,分别获得A个用户终端一一对应的、由所述预设次数的聚类操作获得的中心点组成的A个中心点集;基于所述A个用户终端一一对应的A个中心点集执行归类操作获得K个聚类,分别确定A个用户终端一一对应的A个聚类组;其中,所述每个聚类组包括用户终端所归属的一个或多个聚类;对每个用户终端而言,向用户终端推荐该用户终端对应聚类组中用户终端的历史浏览笔记。本申请可以降低笔记推荐过程试错率。

Description

笔记推荐方法、装置及系统
技术领域
本申请涉及互联网技术领域,尤其涉及笔记推荐方法、装置及系统。
背景技术
目前一些笔记推荐软件,可以依据用户终端浏览笔记过程确定用户终端的喜好属性,从而推荐至用户终端与喜好属性对应的笔记,以供用户终端显示笔记。
但是,上述笔记推荐方法仅仅只能依据用户终端已浏览笔记来推荐笔记,所以只能推荐给用户终端与已浏览笔记类似的笔记。
在需要向用户终端推荐其它类型笔记的情况下,会随机推荐其它类型笔记,但是,随机推荐其它类型的笔记其随机较大,通常不适合用户终端,所以现有技术中笔记推荐过程具有一定限制性且试错率较高。
发明内容
鉴于此,本申请提供笔记推荐方法、装置及系统,可以降低笔记推荐过程试错率。
为了实现上述目的,本申请提供了下述技术特征:
一种笔记推荐方法,包括:
获取A个用户终端一一对应的A个特征向量;
对所述A个用户终端一一对应的A个特征向量执行预设次数的列采样及聚类操作,分别获得A个用户终端一一对应的、由所述预设次数的聚类操作获得的中心点组成的A个中心点集;
基于所述A个用户终端一一对应的A个中心点集执行归类操作获得K个聚类,分别确定A个用户终端一一对应的A个聚类组;其中,所述每个聚类组包括用户终端所归属的一个或多个聚类;
对每个用户终端而言,向用户终端推荐该用户终端对应聚类组中用户终端的历史浏览笔记。
可选的,对所述A个用户终端一一对应的A个特征向量执行预设次数的列采样及聚类操作,分别获得A个用户终端一一对应的、由所述预设次数的聚类操作获得的中心点组成的A个中心点集,包括:
对所述A个用户终端一一对应的A个特征向量执行列采样及聚类操作,获得A个用户终端对应的中心点;
若列采样及聚类操作的次数未达到预设次数,则继续执行所述对所述A个用户终端一一对应的A个特征向量执行列采样及聚类操作,获得A个用户终端对应的中心点的步骤,直到列采样及聚类操作的次数达到预设次数;
对于每个用户终端而言:利用预设次数个中心点组成该用户终端的中心点集。
可选的,每个特征向量包括B个列向量,B个列向量分别一一对应B个用户终端属性;
则所述对所述A个用户终端一一对应的A个特征向量执行列采样及聚类操作,获得A个用户终端对应的中心点,包括:
随机从B个属性中筛选出C个属性;其中,B大于C;
分别从A个特征向量中采样所述C个属性对应的C个列向量,每个特征向量的所述C个列向量组成一个子特征向量,获得A个子特征向量;
对于每个用户终端的子特征向量:计算子特征向量与预设K个中心点之间的距离,将最小距离对应的中心点确定为该用户终端对应的中心点。
可选的,所述利用预设次数个中心点组成该用户终端的中心点集,包括:
对预设次数个中心点执行分类计数操作,获得多个中心点的出现次数;
按出现次数由高至低的顺序,筛选预设数量及以下的中心点;
将筛选获得的预设数量及以下的中心点,组成该用户终端的中心点集。
可选的,基于所述A个用户终端一一对应的A个中心点集执行归类操作获得K个聚类,分别确定A个用户终端一一对应的A个聚类组,包括:
基于所述A个用户终端一一对应的A个中心点集,按预设K个中心点,对A个用户终端执行归类操作,获得K个聚类;
对于每个用户终端而言,确定用户终端所归属的一个或多个聚类,一个或多个聚类组形成一个聚类组。
可选的,所述对每个用户终端而言,向用户终端推荐该用户终端对应聚类组中用户终端的历史浏览笔记,包括:
对于该用户终端对应聚类组中每个聚类而言:获取该聚类中各个用户终端一一对应的各个历史浏览笔记集,对各个历史浏览笔记集执行合并计数操作,按交互行为数量由高至低的顺序确定多个笔记,由所述多个笔记组成推荐笔记集;
向用户终端推荐该用户终端对应的一个或多个聚类一一对应的一个或多个推荐笔记集。
可选的,向用户终端推荐该用户终端对应的一个或多个聚类一一对应的一个或多个推荐笔记集,包括:
合并所述一个或多个推荐笔记集并执行去重操作,获得综合推荐笔记集;
向用户终端推荐综合推荐笔记集中的笔记。
一种笔记推荐装置,包括:
获取单元,用于获取A个用户终端一一对应的A个特征向量;
聚类单元,用于对所述A个用户终端一一对应的A个特征向量执行预设次数的列采样及聚类操作,分别获得A个用户终端一一对应的、由所述预设次数的聚类操作获得的中心点组成的A个中心点集;
归类单元,用于基于所述A个用户终端一一对应的A个中心点集执行归类操作获得K个聚类,分别确定A个用户终端一一对应的A个聚类组;其中,所述每个聚类组包括用户终端所归属的一个或多个聚类;
推荐单元,用于对每个用户终端而言,向用户终端推荐该用户终端对应聚类组中用户终端的历史浏览笔记。
可选的,聚类单元包括:
列采样聚类单元,用于对所述A个用户终端一一对应的A个特征向量执行列采样及聚类操作,获得A个用户终端对应的中心点;
判断单元,用于判断列采样及聚类操作的次数是否未达到预设次数,若列采样及聚类操作的次数未达到预设次数,则进入列采样聚类单元,直到列采样及聚类操作的次数达到预设次数;
组成单元,用于对于每个用户终端而言:利用预设次数个中心点组成该用户终端的中心点集。
一种笔记推荐系统,包括:
A个用户终端,与所述A个用户终端相连的服务器;
其中,服务器用于获取A个用户终端一一对应的A个特征向量;
对所述A个用户终端一一对应的A个特征向量执行预设次数的列采样及聚类操作,分别获得A个用户终端一一对应的、由所述预设次数的聚类操作获得的中心点组成的A个中心点集;
基于所述A个用户终端一一对应的A个中心点集执行归类操作获得K个聚类,分别确定A个用户终端一一对应的A个聚类组;其中,所述每个聚类组包括用户终端所归属的一个或多个聚类;
对每个用户终端而言,向用户终端推荐该用户终端对应聚类组中用户终端的历史浏览笔记。
通过以上技术手段,可以实现以下有益效果:
本申请可以通过预设次数列采样及聚类操作,确定用户的中心点集。中心点集中每个中心点即为用户的一个喜好属性。后续,可以基于用户中心点集执行归类操作并获得用户的聚类组,聚类组中每个聚类均为一个喜好属性对应的用户群。
本申请可以向用户终端推荐该用户终端对应聚类组中用户终端的历史浏览笔记,由于同一聚类中的用户其喜好属性相同,所以用户的历史浏览笔记也适用于同样适用于聚类中的其它用户。这样可以降低笔记推荐过程试错率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例公开的一种供笔记推荐系统的结构示意图;
图2为本申请实施例公开的一种供笔记推荐方法的流程图;
图3为本申请实施例公开的一种供笔记推荐装置的流程图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请提供了一种笔记推荐系统,参见图1,包括:
多个用户终端100,与所述多个用户终端相连的服务器200。
首先介绍本申请的一些预先执行过程,本申请预先设定用户组成特征向量的若干用户属性,用户属性主要包括:性别、年龄、已浏览笔记内容的标签、已浏览笔记绑定商品等,当然还可以包括其它属性,本申请对此不做限定。
本申请提供笔记推荐方法可以周期性执行,例如,一天执行一次,当然可以依据实际情况来确定执行频率,本申请对此不做限定。由于每次执行过程均是一致的,所以下面以一次执行过程为例,进行说明。
本申请提供了一种笔记推荐方法,应用于图1所示的笔记推荐系统中的服务器。参见图2,包括以下步骤:
步骤S200:服务器获取A个用户终端一一对应的A个初始特征向量。
为了清楚说明本实施例,以A个用户终端为例,A可以为非零自然数,对于A的具体数量不做限定。
服务器基于A个用户终端的历史浏览笔记行为,对于每个用户终端而言,采集预先设定的若干用户属性对应的属性值,由若干属性和属性值组成用户终端对应的初始特征向量,其中一个属性和属性值作为一个列向量。
例如,在实际应用中初始特征向量可以包括65000列的稀疏向量。
步骤S201:服务器对所述A个初始特征向量执行降维操作,获得降维后的A个特征向量。即,获取A个用户终端一一对应的A个特征向量。
由于初始特征向量的稀疏性,可以通过SVD降维方式分别对A个初始特征向量进行降维操作,例如,将65000列的稀疏向量降维到400列特征向量,以保证特征向量多样性的基础上,降低特征向量的稀疏性。
对所述A个用户终端一一对应的A个特征向量执行预设次数的列采样及聚类操作,分别获得A个用户终端一一对应的、由所述预设次数的聚类操作获得的中心点组成的A个中心点集。本步骤可以包括步骤S203~S205。
步骤S202:服务器从所述A个特征向量中随机选择K个中心点。
为了方便后续采用K-means执行聚类操作,可以先确定K个聚类的中心点。在A个特征向量中使用K-means算法选择K个特征向量作为K个中心点。
步骤S203:服务器对所述A个用户终端一一对应的A个特征向量执行列采样及聚类操作,获得A个用户终端对应的中心点。
为了发现用户的多个喜好属性,对用户进行多次列采样及聚类操作,以获得用户不同的喜好属性。可以理解的是,不同的中心点代表不同的喜好属性。每次对特征向量进行列采样后获得的子特征向量不尽一致,所以通过列采样获得子特征向量的方式,可以发现用户不同的喜好属性。
本步骤具体可以采用如下步骤实现:
为了不失一般性,假设每个特征向量包括B个列向量,B个列向量分别一一对应B个用户终端属性。
步骤S2031:服务器随机从B个属性中筛选出C个属性;其中,B大于C。
服务器随机从B个属性中筛选出C个属性,或者,从B个属性中采样出C个属性。例如,在B个属性为400列特征向量的情况下,可以从400列属性中采样得到240列属性,具体C个属性的数量可以根据实际情况而设定,本实施例对此不做限定。
步骤S2032:分别从A个特征向量中采样所述C个属性对应的C个列向量,每个特征向量的所述C个列向量组成一个子特征向量,获得A个子特征向量。
对于A个特征向量中每个特征向量,均执行下述操作:
在确定C个属性后,从特征向量中采用C个属性对应的C个列向量,在不改变列向量顺序的情况下,将C个列向量重新组成一个特征向量,由于该特征向量为用户特征向量的子向量,为了区分所以称为子特征向量。
步骤S2033:对于每个用户终端的子特征向量:计算子特征向量与预设K个中心点之间的距离。
由于子特征向量中具有C列,为了便于计算距离,对于K个中心点也执行采样操作:即从中心点中采样C个属性对应的C个列向量,从而确定K个中心点的子特征向量。
分别计算每个用户终端的子特征向量与K个中心点的子特征向量的K个距离,计算子特征向量与预设K个中心点之间的距离。
步骤S2034:将最小距离对应的中心点确定为该用户终端对应的中心点。
对K个距离执行排序操作获得最小距离。将最小距离对应的中心点确定为用户所归属的中心点。
步骤S204:服务器判断列采样及聚类操作的次数是否达到预设次数,若是,则进入步骤S205,若否则进入步骤S203。
为了尽可能多的发现用户的喜好属性,可以执行多次列采样及聚类操作,若列采样及聚类操作的次数未达到预设次数,则继续执行所述对所述A个用户终端一一对应的A个特征向量执行列采样及聚类操作,获得A个用户终端对应的中心点的步骤,直到列采样及聚类操作的次数达到预设次数。例如,预设次数为100次。
步骤S205:对于每个用户终端而言:利用预设次数个中心点组成该用户终端的中心点集。
本步骤具体可以包括以下步骤:
步骤S2051:对预设次数个中心点执行分类计数操作,获得多个中心点的出现次数。
可以理解的是,执行预设次数的列采样及聚类操作后,可以获得预设次数个中心点,在预设次数个中心点中可以包含多个一致的中心点。可以统计统计不同中心点的出现次数。
可以理解的是,出现次数最高为用户最感兴趣的喜好属性,出现次数为零的,为用户几乎不感兴趣的喜好属性。
步骤S2052:按出现次数由高至低的顺序,筛选预设数量及以下的中心点;
由于用户兴趣点通常为3~7个,所以可以预先确定预设数量,例如,预设数量为5个,按照中心点出现次数由高至低的顺序,筛选出预设数量个中心点。
当然,若统计预设次数的中心点后,发现其中心点的数量不足预设数量的情况下,则获取小于预设数量个中心点即可。例如,某一个用户终端预设次数的中心点为中心点1和中心点2,中心点数量为2小于预设数量5,则直接选择中心点1和中心点2组成该用户终端的中心集。
步骤S2053:将筛选获得的预设数量及以下的中心点,组成该用户终端的中心点集。
步骤S206:基于所述A个用户终端一一对应的A个中心点集执行归类操作获得K个聚类,分别确定A个用户终端一一对应的A个聚类组;其中,所述每个聚类组包括用户终端所归属的一个或多个聚类。
本步骤具体可以采用下述步骤来实现:
步骤S2061:基于所述A个用户终端一一对应的A个中心点集,按预设K个中心点,对A个用户终端执行归类操作,获得K个聚类。
为了便于理解,以三个中心点为例进行解释说明。
例如,用户终端1包括中心点1和中心点2;用户终端2包括中心点1和中心点3;用户终端3包括中心点2和中心点3。
则在以中心点执行归类操作后,中心点1对应的聚类1为用户终端1和用户终端2;中心点2对应的聚类2为用户终端1和用户终端3;中心点3对应的聚类3为用户终端2和用户终端3。
步骤S2062:对于每个用户终端而言,确定用户终端所归属的一个或多个聚类,一个或多个聚类组形成一个聚类组。
延续上述举例,以用户终端1为例,其对应两个聚类:聚类1和聚类2。
步骤S207:对每个用户终端而言,向用户终端推荐该用户终端对应聚类组中用户终端的历史浏览笔记。
步骤S2071:对于该用户终端对应聚类组中每个聚类而言:获取该聚类中各个用户终端一一对应的各个历史浏览笔记集,对各个历史浏览笔记集执行合并计数操作,按交互行为数量由高至低的顺序确定多个笔记,由所述多个笔记组成推荐笔记集。
服务器会统计历史浏览笔记集中每个笔记的交互行为数量,交互行为可以包括点赞、收藏、分享、关注等操作。
服务器会记录每个用户在一段时间内的历史浏览笔记集,例如一个月内的历史浏览笔记集,可以理解的是,每个笔记具有唯一标识。
对于每个聚类而言:获得该聚类中各个用户的历史浏览笔记集,合并对各个历史浏览笔记集执行合并计数操作,从而获得该聚类中所有用户笔记交互行为数量由高至低的顺序。
服务器可以按交互行为数量由高至低的顺序确定多个笔记,由所述多个笔记组成该聚类的推荐笔记集。
步骤S2072:向用户终端推荐该用户终端对应的一个或多个聚类一一对应的一个或多个推荐笔记集。
服务器可以向用户推荐聚类对应的推荐笔记集,在聚类组包括一个聚类的情况下,推荐一个聚类对应的推荐笔记集。在聚类组包括两个及以上聚类的情况下,推荐两个及以上的聚类对应的两个及以上的推荐笔记集。
可以理解的是,可以一次性推荐给用户终端一个推荐笔记集,也可以,将一个或多个推荐笔记集合并在一起推荐给用户终端。
通常情况下,不同聚类中笔记不重复,但是,不可避免的会出现一个笔记属于两个及以上聚类的情况,为了避免用户查看重复的笔记。提供了下述方案:
S1:合并所述一个或多个推荐笔记集并执行去重操作,获得综合推荐笔记集。
对于一个或多个推荐笔记集,执行合并去重操作,在去重操作后,便保证同一笔记仅出现一次,将剩余笔记组成综合推荐笔记集。
S2:向用户终端推荐综合推荐笔记集中的笔记。
向用户终端推荐综合推荐笔记集中的笔记,可以一次性推荐给用户终端,或者,分批量逐渐推荐给用户终端。
通过以上技术手段,可以实现以下有益效果:
本申请可以通过预设次数列采样及聚类操作,确定用户的中心点集。中心点集中每个中心点即为用户的一个喜好属性。后续,可以基于用户中心点集执行归类操作并获得用户的聚类组,聚类组中每个聚类均为一个喜好属性对应的用户群。
本申请可以向用户终端推荐该用户终端对应聚类组中用户终端的历史浏览笔记,由于同一聚类中的用户其喜好属性相同,所以用户的历史浏览笔记也适用于同样适用于聚类中的其它用户。这样可以降低笔记推荐过程试错率。
参见图3,本申请提供了一种笔记推荐装置,包括:
获取单元31,用于获取A个用户终端一一对应的A个特征向量;
聚类单元32,用于对所述A个用户终端一一对应的A个特征向量执行预设次数的列采样及聚类操作,分别获得A个用户终端一一对应的、由所述预设次数的聚类操作获得的中心点组成的A个中心点集;
归类单元33,用于基于所述A个用户终端一一对应的A个中心点集执行归类操作获得K个聚类,分别确定A个用户终端一一对应的A个聚类组;其中,所述每个聚类组包括用户终端所归属的一个或多个聚类;
推荐单元34,用于对每个用户终端而言,向用户终端推荐该用户终端对应聚类组中用户终端的历史浏览笔记。
其中,聚类单元32包括:
列采样聚类单元321,用于对所述A个用户终端一一对应的A个特征向量执行列采样及聚类操作,获得A个用户终端对应的中心点;
判断单元322,用于判断列采样及聚类操作的次数是否未达到预设次数,若列采样及聚类操作的次数未达到预设次数,则进入列采样聚类单元,直到列采样及聚类操作的次数达到预设次数;
组成单元323,用于对于每个用户终端而言:利用预设次数个中心点组成该用户终端的中心点集。
其中,每个特征向量包括B个列向量,B个列向量分别一一对应B个用户终端属性;则列采样聚类单元321包括:
筛选单元3211,用于随机从B个属性中筛选出C个属性;其中,B大于C;
采样单元3212,用于分别从A个特征向量中采样所述C个属性对应的C个列向量,每个特征向量的所述C个列向量组成一个子特征向量,获得A个子特征向量;
确定单元3213,用于对于每个用户终端的子特征向量:计算子特征向量与预设K个中心点之间的距离,将最小距离对应的中心点确定为该用户终端对应的中心点。
其中,组成单元323包括:
分类计数单元3231,用于对预设次数个中心点执行分类计数操作,获得多个中心点的出现次数;
筛选中心点单元3232,用于按出现次数由高至低的顺序,筛选预设数量及以下的中心点;
组成中心点集单元3233,用于将筛选获得的预设数量及以下的中心点,组成该用户终端的中心点集。
其中,归类单元33,包括:
归类操作单元331,用于基于所述A个用户终端一一对应的A个中心点集,按预设K个中心点,对A个用户终端执行归类操作,获得K个聚类;
形成单元332,用于对于每个用户终端而言,确定用户终端所归属的一个或多个聚类,一个或多个聚类组形成一个聚类组。
其中,推荐单元34包括:
推荐笔记集组成单元341,用于对于该用户终端对应聚类组中每个聚类而言:获取该聚类中各个用户终端一一对应的各个历史浏览笔记集,对各个历史浏览笔记集执行合并计数操作,按交互行为数量由高至低的顺序确定多个笔记,由所述多个笔记组成推荐笔记集;
推荐笔记集单元342,用于向用户终端推荐该用户终端对应的一个或多个聚类一一对应的一个或多个推荐笔记集。
推荐笔记集单元342,包括:
去重单元3421,用于合并所述一个或多个推荐笔记集并执行去重操作,获得综合推荐笔记集;
综合推荐单元3422,用于向用户终端推荐综合推荐笔记集中的笔记。
参见图1,本申请提供了一种笔记推荐系统,包括:
A个用户终端,与所述A个用户终端相连的服务器;
其中,服务器用于获取A个用户终端一一对应的A个特征向量;
对所述A个用户终端一一对应的A个特征向量执行预设次数的列采样及聚类操作,分别获得A个用户终端一一对应的、由所述预设次数的聚类操作获得的中心点组成的A个中心点集;
基于所述A个用户终端一一对应的A个中心点集执行归类操作获得K个聚类,分别确定A个用户终端一一对应的A个聚类组;其中,所述每个聚类组包括用户终端所归属的一个或多个聚类;
对每个用户终端而言,向用户终端推荐该用户终端对应聚类组中用户终端的历史浏览笔记。
关于服务器的具体执行过程可以详见图2所示的实施例,在此不再赘述。
本实施例方法所述的功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算设备可读取存储介质中。基于这样的理解,本申请实施例对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一台计算设备(可以是个人计算机,服务器,移动计算设备或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROA,Read-OBCy AeAory)、随机存取存储器(RAA,RaBdoA Access AeAory)、磁碟或者光盘等各种可以存储程序代码的介质。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (8)

1.一种笔记推荐方法,其特征在于,包括:
获取A个用户终端一一对应的A个特征向量;每个特征向量包括B个列向量,B个列向量分别一一对应B个用户终端属性;
从所述A个特征向量中随机选择K个中心点;
对所述A个用户终端一一对应的A个特征向量执行列采样及聚类操作,获得A个用户终端对应的中心点;
若列采样及聚类操作的次数未达到预设次数,则继续执行所述对所述A个用户终端一一对应的A个特征向量执行列采样及聚类操作,获得A个用户终端对应的中心点的步骤,直到列采样及聚类操作的次数达到预设次数;
对于每个用户终端而言:利用预设次数个中心点组成该用户终端的中心点集;
基于所述A个用户终端一一对应的A个中心点集,按预设K个中心点,对所述A个用户终端执行归类操作获得K个聚类;
对于每个用户终端而言,确定用户终端所归属的一个或多个聚类,一个或多个聚类组成一个聚类组;
对每个用户终端而言,向用户终端推荐该用户终端对应聚类组中用户终端的历史浏览笔记。
2.如权利要求1所述的笔记推荐方法,其特征在于,所述对所述A个用户终端一一对应的A个特征向量执行列采样及聚类操作,获得A个用户终端对应的中心点,包括:
随机从B个属性中筛选出C个属性;其中,B大于C;
分别从A个特征向量中采样所述C个属性对应的C个列向量,每个特征向量的所述C个列向量组成一个子特征向量,获得A个子特征向量;
对于每个用户终端的子特征向量:计算子特征向量与预设K个中心点之间的距离,将最小距离对应的中心点确定为该用户终端对应的中心点。
3.如权利要求1所述的笔记推荐方法,其特征在于,所述利用预设次数个中心点组成该用户终端的中心点集,包括:
对预设次数个中心点执行分类计数操作,获得多个中心点的出现次数;
按出现次数由高至低的顺序,筛选预设数量及以下的中心点;
将筛选获得的预设数量及以下的中心点,组成该用户终端的中心点集。
4.如权利要求1所述的笔记推荐方法,其特征在于,所述对每个用户终端而言,向用户终端推荐该用户终端对应聚类组中用户终端的历史浏览笔记,包括:
对于该用户终端对应聚类组中每个聚类而言:获取该聚类中各个用户终端一一对应的各个历史浏览笔记集,对各个历史浏览笔记集执行合并计数操作,按交互行为数量由高至低的顺序确定多个笔记,由所述多个笔记组成推荐笔记集;
向用户终端推荐该用户终端对应的一个或多个聚类一一对应的一个或多个推荐笔记集。
5.如权利要求4所述的笔记推荐方法,其特征在于,向用户终端推荐该用户终端对应的一个或多个聚类一一对应的一个或多个推荐笔记集,包括:
合并所述一个或多个推荐笔记集并执行去重操作,获得综合推荐笔记集;
向用户终端推荐综合推荐笔记集中的笔记。
6.一种笔记推荐装置,其特征在于,所述笔记推荐装置用于执行如权利要求1所述的笔记推荐方法,所述笔记推荐装置包括:
获取单元,用于获取A个用户终端一一对应的A个特征向量;
聚类单元,用于对所述A个用户终端一一对应的A个特征向量执行预设次数的列采样及聚类操作,分别获得A个用户终端一一对应的、由所述预设次数的聚类操作获得的中心点组成的A个中心点集;
归类单元,用于基于所述A个用户终端一一对应的A个中心点集执行归类操作获得K个聚类,分别确定A个用户终端一一对应的A个聚类组;其中,每个聚类组包括用户终端所归属的一个或多个聚类;
推荐单元,用于对每个用户终端而言,向用户终端推荐该用户终端对应聚类组中用户终端的历史浏览笔记。
7.根据权利要求6所述的笔记推荐装置,其特征在于,所述聚类单元包括:
列采样聚类单元,用于对所述A个用户终端一一对应的A个特征向量执行列采样及聚类操作,获得A个用户终端对应的中心点;
判断单元,用于判断列采样及聚类操作的次数是否未达到预设次数,若列采样及聚类操作的次数未达到预设次数,则进入列采样聚类单元,直到列采样及聚类操作的次数达到预设次数;
组成单元,用于对于每个用户终端而言:利用预设次数个中心点组成该用户终端的中心点集。
8.一种笔记推荐系统,其特征在于,所述笔记推荐系统用于执行如权利要求1所述的笔记推荐方法,所述笔记推荐系统包括:
A个用户终端,与所述A个用户终端相连的服务器;
其中,服务器用于获取A个用户终端一一对应的A个特征向量;
对所述A个用户终端一一对应的A个特征向量执行预设次数的列采样及聚类操作,分别获得A个用户终端一一对应的、由所述预设次数的聚类操作获得的中心点组成的A个中心点集;
基于所述A个用户终端一一对应的A个中心点集执行归类操作获得K个聚类,分别确定A个用户终端一一对应的A个聚类组;其中,所述每个聚类组包括用户终端所归属的一个或多个聚类;
对每个用户终端而言,向用户终端推荐该用户终端对应聚类组中用户终端的历史浏览笔记。
CN202010493852.4A 2020-06-03 2020-06-03 笔记推荐方法、装置及系统 Active CN111639263B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010493852.4A CN111639263B (zh) 2020-06-03 2020-06-03 笔记推荐方法、装置及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010493852.4A CN111639263B (zh) 2020-06-03 2020-06-03 笔记推荐方法、装置及系统

Publications (2)

Publication Number Publication Date
CN111639263A CN111639263A (zh) 2020-09-08
CN111639263B true CN111639263B (zh) 2023-11-24

Family

ID=72329706

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010493852.4A Active CN111639263B (zh) 2020-06-03 2020-06-03 笔记推荐方法、装置及系统

Country Status (1)

Country Link
CN (1) CN111639263B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112506406B (zh) * 2020-12-03 2021-08-17 中国地质大学(北京) 一种基于用户习惯自学习控制的目标控制方法与系统

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1694099A (zh) * 2004-04-15 2005-11-09 微软公司 开采产品支持服务请求
CN1773516A (zh) * 2005-07-08 2006-05-17 天津大学 基于毛笔和宣纸的水墨传输模型与仿真算法
WO2014101579A1 (zh) * 2012-12-28 2014-07-03 国家电网公司 基于奇异值分解算法的变压器局部放电模式识别方法
CN104063801A (zh) * 2014-06-23 2014-09-24 广州优蜜信息科技有限公司 一种基于聚类的移动广告推荐方法
WO2014198052A1 (en) * 2013-06-14 2014-12-18 Microsoft Corporation Fast grouping of time series
CN105022840A (zh) * 2015-08-18 2015-11-04 新华网股份有限公司 一种新闻信息处理方法、新闻推荐方法和相关装置
CN105808743A (zh) * 2016-03-11 2016-07-27 中国联合网络通信集团有限公司 终端推荐方法和终端推荐系统
CN109166017A (zh) * 2018-10-12 2019-01-08 平安科技(深圳)有限公司 基于重聚类的推送方法、装置、计算机设备及存储介质
WO2019089116A1 (en) * 2017-11-06 2019-05-09 Google Llc Duplicative data detection
CN110096607A (zh) * 2019-04-17 2019-08-06 广州思德医疗科技有限公司 一种标签图片的获取方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5224868B2 (ja) * 2008-03-28 2013-07-03 株式会社東芝 情報推薦装置および情報推薦方法
US10838968B2 (en) * 2018-01-10 2020-11-17 International Business Machines Corporation Recommending exemplars of an unlabeled data-set

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1694099A (zh) * 2004-04-15 2005-11-09 微软公司 开采产品支持服务请求
CN1773516A (zh) * 2005-07-08 2006-05-17 天津大学 基于毛笔和宣纸的水墨传输模型与仿真算法
WO2014101579A1 (zh) * 2012-12-28 2014-07-03 国家电网公司 基于奇异值分解算法的变压器局部放电模式识别方法
WO2014198052A1 (en) * 2013-06-14 2014-12-18 Microsoft Corporation Fast grouping of time series
CN104063801A (zh) * 2014-06-23 2014-09-24 广州优蜜信息科技有限公司 一种基于聚类的移动广告推荐方法
CN105022840A (zh) * 2015-08-18 2015-11-04 新华网股份有限公司 一种新闻信息处理方法、新闻推荐方法和相关装置
CN105808743A (zh) * 2016-03-11 2016-07-27 中国联合网络通信集团有限公司 终端推荐方法和终端推荐系统
WO2019089116A1 (en) * 2017-11-06 2019-05-09 Google Llc Duplicative data detection
CN109166017A (zh) * 2018-10-12 2019-01-08 平安科技(深圳)有限公司 基于重聚类的推送方法、装置、计算机设备及存储介质
CN110096607A (zh) * 2019-04-17 2019-08-06 广州思德医疗科技有限公司 一种标签图片的获取方法及装置

Also Published As

Publication number Publication date
CN111639263A (zh) 2020-09-08

Similar Documents

Publication Publication Date Title
CN105224699B (zh) 一种新闻推荐方法及装置
CN110503531B (zh) 时序感知的动态社交场景推荐方法
US9088811B2 (en) Information providing system, information providing method, information providing device, program, and information storage medium
WO2015148422A1 (en) Recommendation system with dual collaborative filter usage matrix
CN109460519B (zh) 浏览对象推荐方法及装置、存储介质、服务器
CN112488863B (zh) 一种在用户冷启动场景下的险种推荐方法及相关设备
CN110647995A (zh) 规则训练方法、装置、设备及存储介质
CN112070577A (zh) 一种商品推荐方法、系统、设备及介质
CN105718951A (zh) 用户相似度的估算方法及估算系统
WO2016049034A1 (en) Guided data exploration
CN111639263B (zh) 笔记推荐方法、装置及系统
CN114780606B (zh) 一种大数据挖掘方法及系统
CN112579822A (zh) 一种视频数据的推送方法、装置、计算机设备和存储介质
CN110472659B (zh) 数据处理方法、装置、计算机可读存储介质和计算机设备
CN110968802A (zh) 一种用户特征的分析方法、分析装置及可读存储介质
CN111582967A (zh) 内容搜索方法、装置、设备及存储介质
CN107844536B (zh) 应用程序选择的方法、装置和系统
CN113327132A (zh) 多媒体推荐方法、装置、设备及存储介质
CN111429200B (zh) 一种内容关联方法及装置、存储介质、计算机设备
CN112258285A (zh) 一种内容推荐方法及装置、设备、存储介质
CN116955817A (zh) 内容推荐方法、装置、电子设备以及存储介质
CN108595395B (zh) 一种昵称的生成方法、装置及设备
CN115587875A (zh) 基于均衡感知注意力网络的纺织品电商推荐方法及装置
KR102495011B1 (ko) 상품 코드와 구매 패턴에 따른 회귀분석을 이용한 상품 추천 방법 및 장치
CN115795156A (zh) 物料召回和神经网络训练方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant