CN108460073A - 群组推荐方法、存储介质和服务器 - Google Patents
群组推荐方法、存储介质和服务器 Download PDFInfo
- Publication number
- CN108460073A CN108460073A CN201711446425.5A CN201711446425A CN108460073A CN 108460073 A CN108460073 A CN 108460073A CN 201711446425 A CN201711446425 A CN 201711446425A CN 108460073 A CN108460073 A CN 108460073A
- Authority
- CN
- China
- Prior art keywords
- group
- user
- feature vector
- list
- recommending method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 230000003542 behavioural effect Effects 0.000 claims abstract description 25
- 238000004590 computer program Methods 0.000 claims description 19
- 238000009825 accumulation Methods 0.000 claims description 13
- 238000003780 insertion Methods 0.000 claims 1
- 230000037431 insertion Effects 0.000 claims 1
- 238000004891 communication Methods 0.000 description 11
- 230000006399 behavior Effects 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 239000002344 surface layer Substances 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 238000000205 computational method Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
- G06F16/337—Profile generation, learning or modification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Primary Health Care (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种群组推荐方法、存储介质和服务器,包括步骤:收集用户访问群组的行为数据;根据所述行为数据,得到所述用户的特征向量;根据同一群组内各用户的特征向量,得到该群组的整体特征向量;计算所述用户的特征向量与各群组的整体特征向量的距离,得到所述用户与群组的距离的映射列表;根据所述映射列表,得到向所述用户推荐的群组列表。该技术方案极大地提升了群组内容的个性化推荐效率与精准度。
Description
技术领域
本发明涉及计算机技术领域,具体而言,本发明涉及一种群组推荐方法、存储介质和服务器。
背景技术
随着互联网技术的快速发展,越来越多的用户选择通过各种内容平台获取信息,而由于目前社会发展形式下,不仅推送信息的内容平台多,各内容平台推荐的信息也因为多而呈现杂乱的现象,致使用户通过各种内容平台获取的常常是海量的信息,并且不断浏览的过程中耗费了大量的时间与精力。由于在上述现象下,用户在内容平台中筛选信息的使用成本过高,容易导致用户的流失。
为解决上述问题,现有技术中,很多内容平台通过大数据、机器学习等,通过获取用户行为数据对其进行“千人千面”的个性化内容推荐。但是,基于群组内容推荐时,此种解决方式仍然停留在用户特征与群组名称或内容的匹配上,针对用户个人而言,该推荐群组的内容仍然过于表层,且无法适应用户个人而形成匹配度高的个性化推荐。
发明内容
本发明提出一种群组推荐方法、存储介质和服务器,用以实现满足用户深层次群组推荐需求的更高效、更精准的个性化推荐。
第一方面,本发明提供一种群组推荐方法,包括步骤:
收集用户访问群组的行为数据;
根据所述行为数据,得到所述用户的特征向量;
根据同一群组内各用户的特征向量,得到该群组的整体特征向量;
计算所述用户的特征向量与各群组的整体特征向量的距离,得到所述用户与群组的距离的映射列表;
根据所述映射列表,得到向所述用户推荐的群组列表。
结合第一方面,本发明第一方面的第一种实施方式中,所述用户访问群组的行为数据包括:用户有效访问群组的群组内容的分词及其频次计数累加值。
结合第一方面的第一种实施方式,本发明第一方面的第二种实施方式中,所述用户有效访问群组为用户访问时长超过预设阈值的群组;所述群组内容包括标题、正文。
结合第一方面的第一种实施方式,本发明第一方面的第三种实施方式中,所述根据所述行为数据,得到所述用户的特征向量,包括步骤:
按预设分类规则,对所述分词进行归类,每个类别对应一个标签;
统计同一标签内,预设时间段内所有分词的频次计数累加值的总和,得到该标签的频次特征向量;
对各标签的频次特征向量进行归一化计算,得到所述用户的特征向量。
结合第一方面,本发明第一方面的第四种实施方式中,所述根据同一群组内各用户的特征向量,得到该群组的整体特征向量,包括步骤:
获取同一群组内各用户的特征向量,将各用户的特征向量相加后除以所述同一群组内的用户数量,得到该群组的整体特征向量。
结合第一方面,本发明第一方面的第五种实施方式中,所述计算所述用户的特征向量与各群组的整体特征向量的距离,包括步骤:
通过向量距离算法,计算所述用户的特征向量与各群组的整体特征向量的距离。
结合第一方面,本发明第一方面的第六种实施方式中,所述根据所述映射列表,得到向所述用户推荐的群组列表,包括步骤:
对所述映射列表进行逆序排序,获取预置数量的排在映射列表前面的群组,根据所述获取的群组生成向所述用户推荐的群组列表。
结合第一方面第六种实施方式,本发明第一方面的第七种实施方式中,所述根据所述获取的群组生成向所述用户推荐的群组列表,包括步骤:
把所述获取的群组作为列表的内容,把预设数量的新创建或活跃的其他群组随机插入所述列表中,生成向所述用户推荐的群组列表。
结合第一方面,本发明第一方面的第八种实施方式中,所述得到向所述用户推荐的群组列表之后,还包括:
向所述用户推送所述群组列表中的群组。
第二方面,本发明提供一种计算机可读的存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面中任意一种实施方式所述的群组推荐方法。
第三方面,本发明提供一种服务器,包括:
一个或多个处理器;
存储器;
以及一个或多个计算机程序,所述一个或多个计算机程序存储在所述存储器中;所述一个或多个计算机程序被所述一个或多个处理器执行时实现如第一方面中任意一实施方式所述的群组推荐方法。
上述的群组推荐方法、存储介质和服务器,区别于现有技术,具有以下优势:
(1)本发明提供的群组推荐方法中,通过计算得到用户的特征向量,挖掘用户个人与群组的深度匹配关系,实现了更高效更精确的基于群组本质特征而形成的用户个人推荐,其极大提供群组本质特征获取的效率及精度。
(2)本发明提供的群组推荐方法中,通过计算群组中所有用户的特征向量,得到群组与用户个人的同维度特征,优化了计算群组与用户个人的匹配度计算方式,提高了基于群组特征用户个人在海量的信息中获取所需信息的效率以及精度。
(3)本发明提供的群组推荐方法中,在满足用户个性化推荐需求的同时,通过预设数量/比例地插入其他如新创建/活跃的其他群组,使内容平台推荐给用户的群组列表不会因为过于单一而造成内容集中化,使得推荐的群组更具多样性。
本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明实施例一的第一个群组推荐方法的流程图;
图2为本发明实施例一的第二个群组推荐方法的流程图;
图3为本发明实施例一的第三个群组推荐方法的流程图;
图4为本发明实施例一的第四个群组推荐方法的流程图;
图5为本发明实施例一的第五个群组推荐方法的流程图;
图6为本发明实施例三的用于执行根据本发明方法的服务器的框图;
图7为本发明实施例三的用于保持或者携带实现根据本发明方法的程序代码的存储单元示意图;
图8为本发明实施例四的群组推荐方法对应的终端界面显示图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
本技术领域技术人员可以理解,这里所使用的“终端”、“终端设备”既包括无线信号接收器的设备,其仅具备无发射能力的无线信号接收器的设备,又包括接收和发射硬件的设备,其具有能够在双向通讯链路上,执行双向通讯的接收和发射硬件的设备。这种设备可以包括:蜂窝或其他通讯设备,其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通讯设备;PCS(Personal Communications Service,个人通讯系统),其可以组合语音、数据处理、传真和/或数据通讯能力;PDA(Personal Digital Assistant,个人数字助理),其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日历和/或GPS(Global Positioning System,全球定位系统)接收器;常规膝上型和/或掌上型计算机或其他设备,其具有和/或包括射频接收器的常规膝上型和/或掌上型计算机或其他设备。这里所使用的“终端”、“终端设备”可以是便携式、可运输、安装在交通工具(航空、海运和/或陆地)中的,或者适合于和/或配置为在本地运行,和/或以分布形式,运行在地球和/或空间的任何其他位置运行。这里所使用的“终端”、“终端设备”还可以是通讯终端、上网终端、音乐/视频播放终端,例如可以是PDA、MID(Mobile Internet Device,移动互联网设备)和/或具有音乐/视频播放功能的移动电话,也可以是智能电视、机顶盒等设备。
本技术领域技术人员可以理解,这里所使用的远端网络设备,其包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云。在此,云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。本发明的实施例中,远端网络设备、终端设备与WNS服务器之间可通过任何通讯方式实现通讯,包括但不限于,基于3GPP、LTE、WIMAX的移动通讯、基于TCP/IP、UDP协议的计算机网络通讯以及基于蓝牙、红外传输标准的近距无线传输方式。
下面结合附图对本发明所提及的群组推荐方法、存储介质和服务器的具体实施方式进行详细介绍。在此,本发明的示意性实施例及其说明用于解释本发明,但不作为对本发明的限定。本发明实施例适用于各类基于群组的社交或内容平台,如公会内容平台、通讯群组社交平台等。
实施例一
如图1所示,本发明提供的一种群组推荐方法,包括步骤:
S01收集用户访问群组的行为数据;
其中,所述用户访问群组的行为数据包括:用户有效访问群组的群组内容的分词及其频次计数累加值。所述用户有效访问群组为用户访问时长超过预设阈值的群组;所述群组内容包括标题、正文。
具体地,本实施例中,服务器收集的行为数据主要由终端上报;用户在终端上登录内容平台,由于用户基于对内容平台中群组内容的需求程度不同,访问不同群组的时间则有所不同。在本实施例中,为通过计算群组内用户的特征,深入挖掘用户与群组的匹配关系,优化原有用户与群组依据表层的内容特征的个性化计算方法,优选对用户访问群组的情况设置有效预设阈值。具体如,当用户访问某一群组的时长超过预设阈值(如3分钟)时,则确定本次访问为有效访问,并标注该群组为用户喜欢的群组。通过进一步确定用户对群组的每次访问是否有效访问,先从基础上筛选出需要进行数据分析的群组,提高了后期处理的效率与精确度。
当确定用户当前对群组的访问为有效访问时,将针对该群组的群组内容进行分词(分词依据预设规则进行),所述群组内容包括但不局限于标题、正文。以下举例说明分词情况:
(1)如用户访问群组行为第一次被确定为有效访问的群组A标题为“超酷的嘻哈音乐”,对该标题进行分词可获得如“超酷的”“嘻哈”“音乐”等的词语,在本实施例中,上述分词获得的词语仅作为实例,其可具有其他不同的分词结果。
(2)如用户访问群组行为第二次被确定为有效访问的群组B标题为“超酷的嘻哈舞者”,对该标题进行分词可获得如“超酷的”“嘻哈”“舞者”等的词语,在本实施例中,上述分词获得的词语仅作为实例,其可具有其他不同的分词结果。
由于每个群组对应有其独一的标识,当终端向服务器上报行为数据时,服务器可根据标识识别出对应的各个群组。
终端在对确定为有效方访问群组的群组内容进行分词时,每次用户触发的有效访问对应的分词行为都将进行频次计数累加。最终,终端将该用户每次有效访问群组触发的对应每次分词累加的行为数据上报至服务器进行信息收据。亦即,在本步骤中,服务器获得终端上报的用户有效访问群组的群组内容的分词及其频次计数累加值。如上述举例情况中,服务器将收集到下述列表1所示的信息:
分词 | 频次计数累加值 |
超酷的 | 2 |
嘻哈 | 2 |
音乐 | 1 |
舞者 | 1 |
表1服务器收集的用户访问群组的行为数据
S02根据所述行为数据,得到所述用户的特征向量;
通过步骤S01,服务器收集到行为数据后,将对所述行为数据进行预处理,获得用户个人的特征向量。
具体地,结合附图2,步骤S02中,所述根据所述行为数据,得到所述用户的特征向量,包括步骤:
S021按预设分类规则,对所述分词进行归类,每个类别对应一个标签;其中,所述预设分类规则可预先处理为一个计算程序的规则,或者在归类分词的步骤下,加入人工干预;其主要为将不同分词按需求进行归类,使每个类别对应一个标签,并按照不同内容平台的需求进行对若干标签的梳理。其中,不同内容平台的需求为适应于不同内容平台的功能性需求有所不同,如社交内容平台需求可能为交友等。
S022统计同一标签内,预设时间段内所有分词的频次计数累加值的总和,得到该标签的频次特征向量;
通过步骤S021对标签进行梳理后,统计在预设时间段内(如,30个工作日内)同一标签内所有分词的频次计数累加值的总和,得出该标签的频次特征向量。
如:归类后,某一标签a1包括如下列表2的分词以及对应的频次计数累加值数据:
分词 | 频次计数累加值 |
超酷的 | 7 |
嘻哈 | 11 |
总和 | 18 |
表2同一标签内所有分词的频次计数累加值示例
对应的,可根据所述同一标签内所有分词的频次计数累加值的总和,对应得出标签a1的频次特征向量。
S023对各标签的频次特征向量进行归一化计算,得到所述用户的特征向量。
当通过步骤S022对单个用户在预设时间段内分类后的某一标签对应的频次特征向量后,对用户在最近的预设时间段内的有效访问的所有标签对应的各个频次特征向量进行归一化计算,获得单个用户在预设时间段内的特征向量,如:单个用户a在30个工作日内产生有效访问对应的预处理
S03根据同一群组内各用户的特征向量,得到该群组的整体特征向量;
具体地,结合图3,步骤S03中,所述根据同一群组内各用户的特征向量,得到该群组的整体特征向量,包括步骤:
S031获取同一群组内各用户的特征向量,将各用户的特征向量相加后除以所述同一群组内的用户数量,得到该群组的整体特征向量。
具体地,例如某一群组A中,包括用户a,用户b…用户z,服务器将首先获取用户a的特征向量,用户b的特征向量…以及用户z的特征向量,首先将所述群组A中所有的各个用户的特征向量相加后除以群组A中包括的用户数量m,如:
此时,步骤S031得到的是群组A的整体特征向量,亦即在本实施例中,通过步骤S03可计算得出各个群组的整体特征向量。
S04计算所述用户的特征向量与各群组的整体特征向量的距离,得到所述用户与各群组的距离的映射列表;
具体地,步骤S04中,所述计算所述用户的特征向量与各群组的整体特征向量的距离,包括步骤:
通过向量距离算法,计算所述用户的特征向量与各群组的整体特征向量的距离。
在本步骤中,通过向量距离算法计算的是所述用户的特征向量与各群组的整体特征向量间的自然长度。通过向量间的自热长度,可对应生成所述用户与各群组的距离的映射列表,如表3所示(主要用于表示映射关系,不对本实施例提供的方法进行限定):
用户 | 群组 | 距离 |
用户A | 群组a | 7 |
用户A | 群组b | 3 |
… | … | |
用户A | 群组n | 1 |
表3用户与各群组间向量的距离的映射列表
在所述映射列表中,用户与群组的距离越小代表用户与该群组的匹配度越高。
在本实施例中,所述向量距离算法可选用欧式距离算法,但该算法不应作为本实施例保护范围的限定。在步骤S04中,主要计算得出所述用户与各群组间距离的映射列表。
S05根据所述映射列表,得到向所述用户推荐的群组列表。
具体地,结合图4,步骤S05,所述根据所述映射列表,得到向所述用户推荐的群组列表,包括步骤:
S051对所述映射列表进行逆序排序,获取预置数量的排在映射列表前面的群组,根据所述获取的群组生成向所述用户推荐的群组列表。
以上述表3为例,所述对所述映射列表进行逆序排序后的表3-1如下:
用户 | 群组 | 距离 |
用户A | 群组n | 1 |
用户A | 群组b | 3 |
… | … | |
用户A | 群组a | 7 |
表3-1逆序排序的映射列表
所述获取预置数量的排在映射列表前面的群组为优选预置数量下,所述用户与各群组间匹配度高的群组生成向所述用户推荐的群组列表。其中,所述预置数量为一个预设阈值,在更多的实施方式中,其可为预置比例,以及将所述映射列表逆序排序后,服务器将对应预置数量或预置比例获取排序后映射列表中的部分群组。
进一步地,所述根据所述获取的群组生成向所述用户推荐的群组列表,包括步骤:
把所述获取的群组作为列表的内容,把预设数量的新创建或活跃的其他群组随机插入所述列表中,生成向所述用户推荐的群组列表。
具体地,基于上述群组推荐实施方式下,为使内容平台推荐的群组更具多样性,在服务器根据逆序排序后的映射列表生成向所述用户推荐的群组列表时,对应插入预设数量的其他群组至所述向所述用户推荐的群组列表中,其有效避免由于推荐的群组内容集中,导致用户有效访问的行为更为集中而没有机会接触新的其他群组内容的问题。其中,插入的其他群组在本实施例中优选为新创建或活跃度较高的,不存在于所述映射列表中的群组。
其中,结合图5,在本发明实施例中,所述得到向所述用户推荐的群组列表之后,还包括步骤:
S06向所述用户推送所述群组列表中的群组。
本实施例中提供的群组推荐方法中,服务器收集到的行为数据是持续性进行的,当持续性收集到更多的行为数据时,服务器可以对特征进行修正,并对推荐群组的数据进行刷新,从而进一步实现实时用户个性化特征更新及群组推荐。
实施例二
本发明实施例提供一种可读的存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如实施例一所述的群组推荐方法。
其中,所述存储介质包括但不限于任何类型的盘(包括软盘、硬盘、光盘、CD-ROM、和磁光盘)、ROM(Read-Only Memory,只读存储器)、RAM(Random AcceSS Memory,随即存储器)、EPROM(EraSable Programmable Read-Only Memory,可擦写可编程只读存储器)、EEPROM(Electrically EraSable Programmable Read-Only Memory,电可擦可编程只读存储器)、闪存、磁性卡片或光线卡片。也就是,存储介质包括由设备(例如,计算机)以能够读的形式存储或传输信息的任何介质。可以是只读存储器,磁盘或光盘等。
实施例三
结合图6,本发明实施例提供一种服务器,包括:
一个或多个处理器;
存储器;
以及一个或多个计算机程序,所述一个或多个计算机程序存储在所述存储器中;所述一个或多个计算机程序被所述一个或多个处理器执行时实现如实施例一所述的群组推荐方法。
图6示出了可以实现根据本发明的群组推荐的服务器(下述称为服务器)。该服务器传统上包括处理器610和以存储器620形式的计算机程序产品或者计算机可读介质。存储器620可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。存储器620具有用于执行上述方法中的任何方法步骤的程序代码631的存储空间630。例如,用于程序代码的存储空间630可以包括分别用于实现上面的方法中的各种步骤的各个程序代码631。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。这些计算机程序产品包括诸如硬盘,紧致盘(CD)、存储卡或者软盘之类的程序代码载体。这样的计算机程序产品通常为如参考图7所述的便携式或者固定存储单元。该存储单元可以具有与图6中的存储器620类似布置的存储段或者存储空间等。程序代码可以例如以适当形式进行压缩。通常,存储单元包括用于执行根据本发明的方法步骤的程序代码631’,即可以由例如诸如610之类的处理器读取的代码,这些代码当由服务器运行时,导致该服务器执行上面所描述的方法中的各个步骤。
在本发明实施例中,该服务器所包括的处理器610具有以下功能:
收集用户访问群组的行为数据;
根据所述行为数据,得到所述用户的特征向量;
根据同一群组内各用户的特征向量,得到所述同一群组的整体特征向量;
计算所述用户的特征向量与各群组的整体特征向量的距离,得到所述用户与群组的距离的映射列表;
根据所述映射列表,得到向所述用户推荐的群组列表。
也即处理器610具备执行上述的实施例一群组推荐方法的功能,在此不再赘述。
实施例四(应用例)
结合图8,当用户A通过终端经内容平台获取信息时,对应的终端显示界面将显示如图8所示,当用户A点击某一群组,如“孤”进入访问,并逗留的访问时长超过预设时长(如3分钟)时,用户A对“孤”的群组访问则被终端记录为有效访问,并进行对“孤”群组的群组内容进行分词,以及分词频次计数累加等,并将该行为数据上报至服务器,实时更新服务器收集到的用户A的行为数据。
当用户A不想浏览或已经浏览完当前显示界面所显示的群组时,可通过主动刷新的方式,获取新的群组推荐列表,并显示在当前显示界面上。进一步地,所述新的群组推荐列表可定时向用户A推荐,而无需用户A主动触发更新。其中,所述新的群组推荐列表为服务器根据实时收集到的用户A的行为数据,与其他各个收集到的群组信息进行匹配后生成的群组推荐列表。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (11)
1.一种群组推荐方法,其特征在于,包括步骤:
收集用户访问群组的行为数据;
根据所述行为数据,得到所述用户的特征向量;
根据同一群组内各用户的特征向量,得到该群组的整体特征向量;
计算所述用户的特征向量与各群组的整体特征向量的距离,得到所述用户与各群组的距离的映射列表;
根据所述映射列表,得到向所述用户推荐的群组列表。
2.根据权利要求1所述的群组推荐方法,其特征在于,所述用户访问群组的行为数据包括:用户有效访问群组的群组内容的分词及其频次计数累加值。
3.根据权利要求2所述的群组推荐方法,其特征在于,所述用户有效访问群组为用户访问时长超过预设阈值的群组;所述群组内容包括标题、正文。
4.根据权利要求2所述的群组推荐方法,其特征在于,所述根据所述行为数据,得到所述用户的特征向量,包括步骤:
按预设分类规则,对所述分词进行归类,每个类别对应一个标签;
统计同一标签内,预设时间段内所有分词的频次计数累加值的总和,得到该标签的频次特征向量;
对各标签的频次特征向量进行归一化计算,得到所述用户的特征向量。
5.根据权利要求1所述的群组推荐方法,其特征在于,所述根据同一群组内各用户的特征向量,得到该群组的整体特征向量,包括步骤:
获取同一群组内各用户的特征向量,将各用户的特征向量相加后除以所述同一群组内的用户数量,得到该群组的整体特征向量。
6.根据权利要求1所述的群组推荐方法,其特征在于,所述计算所述用户的特征向量与各群组的整体特征向量的距离,包括步骤:
通过向量距离算法,计算所述用户的特征向量与各群组的整体特征向量的距离。
7.根据权利要求1所述的群组推荐方法,其特征在于,所述根据所述映射列表,得到向所述用户推荐的群组列表,包括步骤:
对所述映射列表进行逆序排序,获取预置数量的排在映射列表前面的群组,根据所述获取的群组生成向所述用户推荐的群组列表。
8.根据权利要求7所述的群组推荐方法,其特征在于,所述根据所述获取的群组生成向所述用户推荐的群组列表,包括步骤:
把所述获取的群组作为列表的内容,把预设数量的新创建或活跃的其他群组随机插入所述列表中,生成向所述用户推荐的群组列表。
9.根据权利要求1所述的群组推荐方法,其特征在于,所述得到向所述用户推荐的群组列表之后,还包括:
向所述用户推送所述群组列表中的群组。
10.一种计算机可读的存储介质,其上存储有计算机程序,其特征在于:
所述计算机程序被处理器执行时实现如权利要求1-9中任意一项所述的群组推荐方法。
11.一种服务器,其特征在于,包括:
一个或多个处理器;
存储器;
以及一个或多个计算机程序,所述一个或多个计算机程序存储在所述存储器中;所述一个或多个计算机程序被所述一个或多个处理器执行时实现如权利要求1-9中任意一项所述的群组推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711446425.5A CN108460073A (zh) | 2017-12-27 | 2017-12-27 | 群组推荐方法、存储介质和服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711446425.5A CN108460073A (zh) | 2017-12-27 | 2017-12-27 | 群组推荐方法、存储介质和服务器 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108460073A true CN108460073A (zh) | 2018-08-28 |
Family
ID=63220130
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711446425.5A Pending CN108460073A (zh) | 2017-12-27 | 2017-12-27 | 群组推荐方法、存储介质和服务器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108460073A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109241090A (zh) * | 2018-09-29 | 2019-01-18 | 北京惠每云科技有限公司 | 一种用户确定方法和装置 |
CN110795625A (zh) * | 2019-10-25 | 2020-02-14 | 腾讯科技(深圳)有限公司 | 推荐方法、装置、计算机设备及存储介质 |
CN112182360A (zh) * | 2019-07-03 | 2021-01-05 | 国际商业机器公司 | 具有有限数据可用性的个性化推荐器 |
CN113746648A (zh) * | 2021-09-09 | 2021-12-03 | 武汉夜莺科技有限公司 | 信息处理方法、装置及存储介质 |
CN113730921A (zh) * | 2021-09-17 | 2021-12-03 | 腾讯科技(深圳)有限公司 | 虚拟组织的推荐方法和装置、存储介质及电子设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101431485A (zh) * | 2008-12-31 | 2009-05-13 | 深圳市迅雷网络技术有限公司 | 一种自动推荐互联网上信息的方法及系统 |
CN103391302A (zh) * | 2012-05-08 | 2013-11-13 | 阿里巴巴集团控股有限公司 | 一种信息发送的方法及系统 |
CN105574045A (zh) * | 2014-10-17 | 2016-05-11 | 深圳市腾讯计算机系统有限公司 | 一种视频推荐方法和服务器 |
CN106326369A (zh) * | 2016-08-12 | 2017-01-11 | 广州优视网络科技有限公司 | 应用专题推荐方法、装置及服务器 |
-
2017
- 2017-12-27 CN CN201711446425.5A patent/CN108460073A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101431485A (zh) * | 2008-12-31 | 2009-05-13 | 深圳市迅雷网络技术有限公司 | 一种自动推荐互联网上信息的方法及系统 |
CN103391302A (zh) * | 2012-05-08 | 2013-11-13 | 阿里巴巴集团控股有限公司 | 一种信息发送的方法及系统 |
CN105574045A (zh) * | 2014-10-17 | 2016-05-11 | 深圳市腾讯计算机系统有限公司 | 一种视频推荐方法和服务器 |
CN106326369A (zh) * | 2016-08-12 | 2017-01-11 | 广州优视网络科技有限公司 | 应用专题推荐方法、装置及服务器 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109241090A (zh) * | 2018-09-29 | 2019-01-18 | 北京惠每云科技有限公司 | 一种用户确定方法和装置 |
CN112182360A (zh) * | 2019-07-03 | 2021-01-05 | 国际商业机器公司 | 具有有限数据可用性的个性化推荐器 |
CN110795625A (zh) * | 2019-10-25 | 2020-02-14 | 腾讯科技(深圳)有限公司 | 推荐方法、装置、计算机设备及存储介质 |
CN110795625B (zh) * | 2019-10-25 | 2021-11-23 | 腾讯科技(深圳)有限公司 | 推荐方法、装置、计算机设备及存储介质 |
CN113746648A (zh) * | 2021-09-09 | 2021-12-03 | 武汉夜莺科技有限公司 | 信息处理方法、装置及存储介质 |
CN113730921A (zh) * | 2021-09-17 | 2021-12-03 | 腾讯科技(深圳)有限公司 | 虚拟组织的推荐方法和装置、存储介质及电子设备 |
CN113730921B (zh) * | 2021-09-17 | 2023-08-25 | 腾讯科技(深圳)有限公司 | 虚拟组织的推荐方法和装置、存储介质及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108460073A (zh) | 群组推荐方法、存储介质和服务器 | |
CN104933049B (zh) | 生成数字人的方法及系统 | |
US20100082427A1 (en) | System and Method for Context Enhanced Ad Creation | |
US8386506B2 (en) | System and method for context enhanced messaging | |
CN105631707A (zh) | 基于决策树的广告点击率预估方法与应用推荐方法及装置 | |
CN105187237B (zh) | 查找相关联的用户标识的方法和装置 | |
CN102999562B (zh) | 路由查询结果 | |
US20090216773A1 (en) | Device, System, and Method of Creating Virtual Social Networks Based On Web-Extracted Features | |
CN105023165A (zh) | 社交网络平台中投放任务的控制方法、装置及系统 | |
CN104077415B (zh) | 搜索方法及装置 | |
CN103942221B (zh) | 检索方法及设备 | |
CN103620595A (zh) | 用于情境感知角色建模和推荐的方法和装置 | |
CN101192235A (zh) | 一种基于用户特征推送广告的方法、系统及设备 | |
CN102939604A (zh) | 用于上下文索引的网络资源的方法和装置 | |
CN108140041A (zh) | 针对视频搜索的观看时间聚类 | |
CN102323933A (zh) | 一种面向即时通信的信息嵌入和交互系统及方法 | |
CN106708858A (zh) | 一种信息推荐方法及装置 | |
CN105120004A (zh) | 信息的推送方法及装置 | |
CN103248677B (zh) | 互联网行为分析系统及其工作方法 | |
CN104217030A (zh) | 一种根据服务器搜索日志数据进行用户分类的方法和装置 | |
CN104424187B (zh) | 一种向客户端用户推荐好友的方法及装置 | |
CN107085600A (zh) | Poi推荐方法、装置、设备及计算机可读存储介质 | |
CN107977678A (zh) | 用于输出信息的方法和装置 | |
CN109086318A (zh) | 用户画像模板的定义方法和装置 | |
CN107818156A (zh) | 一种实时个性化新闻推荐方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180828 |