CN105608627A - 基于社交网络平台的信息更新方法及装置 - Google Patents

基于社交网络平台的信息更新方法及装置 Download PDF

Info

Publication number
CN105608627A
CN105608627A CN201610070728.0A CN201610070728A CN105608627A CN 105608627 A CN105608627 A CN 105608627A CN 201610070728 A CN201610070728 A CN 201610070728A CN 105608627 A CN105608627 A CN 105608627A
Authority
CN
China
Prior art keywords
information
client
aggregate
module
content similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610070728.0A
Other languages
English (en)
Inventor
王伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Oppo Mobile Telecommunications Corp Ltd
Original Assignee
Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Oppo Mobile Telecommunications Corp Ltd filed Critical Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority to CN201610070728.0A priority Critical patent/CN105608627A/zh
Publication of CN105608627A publication Critical patent/CN105608627A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于社交网络平台的信息更新方法及装置,该方法包包括:在接收到客户端的更新请求中,若该更新请求中包含的账号已设置过滤重复信息的标识,则从待推送给该客户端的第一信息集合中,删除与已推送的信息具有重复内容的信息,得到第二信息集合,并将第二信息集合发送给客户端,使得能够基于已设置的过滤重复信息的标识,对待发送给客户端的第一信息集合进行处理,删除与已推送的信息具有重复内的信息,能够有效的避免发送重复的内容,降低发送的数据量,减少流量消耗,且避免相同的内容看到多次,改善用户体验。

Description

基于社交网络平台的信息更新方法及装置
技术领域
本发明属于社交网络技术领域,尤其涉及一种基于社交网络平台的信息更新方法及装置。
背景技术
随着互联网技术的发展,如今的社交网络平台广泛应用于人们的生活,朋友间可以通过社交网络平台来进行沟通及信息的共享,了解彼此的生活状态等。例如:智能手机等设备上的微信、微博、QQ说说等等社交网络平台。
然而,用户在使用社交网络平台的过程中,经常会遇到同一个信息(文章或图片等)有多个人分享,用户经常看到重复的内容,不仅仅浪费了用户的流量,还给用户带来视觉上的压力,用户体验不好。
发明内容
本发明提供一种基于社交网络平台的信息更新方法及装置,用以解决现有技术中社交网络平台给用户推送的内容中包含很多重复信息,浪费了用户的流量且给用户带来视觉上的压力。
本发明第一方面提供一种基于社交网络平台的信息更新方法,所述方法包括:
接收客户端的更新请求,所述更新请求中包含所述客户端上已登录的账号;
若所述账号已设置过滤重复信息的标识,则从待推送给所述客户端的第一信息集合中,删除与已推送的信息具有重复内容的信息,得到第二信息集合;
将所述第二信息集合发送给所述客户端。
在第一方面第一种可行的实现方式中,所述从待推送给所述客户端的第一信息集合中,删除与已推送的信息具有重复内容的信息,得到第二信息集合包括:
获取待推送给所述客户端的第一信息集合,及获取预置时间段内已推送给所述客户端的第三信息集合;
遍历所述第一信息集合中的每一条信息,计算遍历到的第一信息分别与所述第三信息集合中的每一条信息的内容相似度,并确定所述第一信息的内容相似度的最大值;
若所述第一信息的内容相似度的最大值大于预先设置的第一数值,则从所述第一信息集合中删除所述第一信息,使得在遍历完成后,得到第二信息集合。
结合第一方面第一种可行的实现方式,在第一方面第二种可行的实现方式中,所述计算遍历到的第一信息分别与所述第三信息集合中的每一条信息的内容相似度,并确定所述第一信息的内容相似度的最大值,包括:
提取遍历到的所述第一信息中的关键字;
根据预置的内容相似度算法,将所述第一信息中的关键字分别与所述第三信息集合中的每条信息已提取的关键字进行相似度计算,确定所述第一信息分别与所述第三信息集合中的每条信息的内容相似度构成的相识度集合;
从所述相似度集合中查找内容相似度的最大值作为所述第一信息的内容相似度的最大值。
结合第一方面第一种可行的实现方式,在第一方面第三种可行的实现方式中,所述获取待推送给所述客户端的第一信息集合,包括:
获取从上一次推送的时间点至当前时间点之间的时间段内,所述账户对应的未推送信息的第四集合;
根据预置的内容相似度算法,确定所述第四集合中的信息子集,其中,所述信息子集中的每一条信息与该信息子集中的其他信息的内容相似度均大于所述第二数值;
在所述信息子集中包含n条信息时,删除所述信息子集中的n-1条信息,以得到所述第一信息集合。
结合第一方面或者第一方面第一种可行的实现方式或者第一方面第二种可行的实现方式或者第一方面第三种可行的实现方式,在第一方面第四种可行的实现方式中,所述方法还包括:
若接收到所述客户端发送的过滤请求,所述过滤请求中包含所述账号,则为所述账号设置过滤重复信息的标识。
本发明第二方面提供一种基于社交网络平台的信息更新装置,所述装置包括:
接收模块,用于接收客户端的更新请求,所述更新请求中包含所述客户端上已登录的账号;
删除模块,用于若所述账号已设置过滤重复信息的标识,则从待推送给所述客户端的第一信息集合中,删除与已推送的信息具有重复内容的信息,得到第二信息集合;
发送模块,用于将所述第二信息集合发送给所述客户端。
在第二方面第一种可行的实现方式中,所述删除模块包括:
第一获取模块,用于获取待推送给所述客户端的第一信息集合,
第二获取模块,用于获取预置时间段内已推送给所述客户端的第三信息集合;
遍历计算模块,用于遍历所述第一信息集合中的每一条信息,计算遍历到的第一信息分别与所述第三信息集合中的每一条信息的内容相似度,并确定所述第一信息的内容相似度的最大值;
第一删除模块,用于若所述第一信息的内容相似度的最大值大于预先设置的第一数值,则从所述第一信息集合中删除所述第一信息,使得在遍历完成后,得到第二信息集合。
结合第二方面第一种可行的实现方式,在第二方面第二种可行的实现方式中,所述遍历计算模块包括:
提取模块,用于提取遍历到的所述第一信息中的关键字;
相似度计算模块,用于根据预置的内容相似度算法,将所述第一信息中的关键字分别与所述第三信息集合中的每条信息已提取的关键字进行相似度计算,确定所述第一信息分别与所述第三信息集合中的每条信息的内容相似度构成的相识度集合;
查找模块,用于从所述相似度集合中查找内容相似度的最大值作为所述第一信息的内容相似度的最大值。
结合第二方面第一种可行的实现方式,在第二方面第三种可行的实现方式中,所述第一获取模块包括:
集合获取模块,用于获取从上一次推送的时间点至当前时间点之间的时间段内,所述账户对应的未推送信息的第四集合;
子集确定模块,用于根据预置的内容相似度算法,确定所述第四集合中的信息子集,其中,所述信息子集中的每一条信息与该信息子集中的其他信息的内容相似度均大于所述第二数值;
第二删除模块,用于在所述信息子集中包含n条信息时,删除所述信息子集中的n-1条信息,以得到所述第一信息集合。
结合第二方面或者第二方面第一种可行的实现方式或者第一方面第二种可行的实现方式或者第二方面第三种可行的实现方式,在第二方面第四种可行的实现方式中,所述装置还包括:
设置模块,用于若接收到所述客户端发送的过滤请求,所述过滤请求中包含所述账号,则为所述账号设置过滤重复信息的标识。
从上述本发明实施例可知,本发明在接收到客户端的更新请求中,若该更新请求中包含的账号已设置过滤重复信息的标识,则从待推送给该客户端的第一信息集合中,删除与已推送的信息具有重复内容的信息,得到第二信息集合,并将第二信息集合发送给客户端,使得能够基于已设置的过滤重复信息的标识,对待发送给客户端的第一信息集合进行处理,删除与已推送的信息具有重复内的信息,能够有效的避免发送重复的内容,降低发送的数据量,减少流量消耗,且避免相同的内容看到多次,改善用户体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明第一实施例中的基于社交网络平台的信息更新方法实现流程示意图;
图2是本发明图1所示第一实施例中步骤102的细化步骤的流程示意图;
图3是本发明图2所示步骤201中获取发送给客户端的第一信息集合的细化步骤的流程示意图;
图4是本发明第二实施例中基于社交网络平台的信息更新装置的结构示意图;
图5为本发明图4所示第二实施例中删除模块的细化功能模块的结构示意图;
图6位本发明图5所示第一获取模块501的细化功能模块的结构示意图。
具体实施方式
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而非全部实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,图1为本发明第一实施例中的基于社交网络平台的信息更新方法的流程示意图。其中,实施本发明上述方法的是基于社交网络平台的信息更新装置(以下简称:更新装置)可以是社交网络平台的服务器,也可以是社交网络的服务器中的部分装置。
其中,本发明第一实施例中的上述方法包括:
步骤101、接收客户端的更新请求,更新请求中包含客户端上已登录的账号;
在本发明实施例中,移动终端上可安装多种类型的社交网络平台的客户端,例如、微信、微博、QQ等,且该多种类型的社交网络平台的客户端可以用于信息的分享及用户状态的发布,例如:微博中可以发布微博内容、微信中可以发布朋友圈、QQ也可以发布朋友圈。
其中,社交网络平台中各个用户都需要通过其注册的账号登录社交网络平台的客户端,且用户可以通过添加或者关注其他用户的账号的方式,成为其他用户的好友,且在其他用户在该社交网络平台上发布或者转发信息之后,该用户都可以通过更新客户端显示的信息的方式获取其他用户发布或转发的内容。
由于存在相同的文章或者图片可能会被用户的多个好友发布或分享,为了减少用户在使用过社交网络的过程中重复看到相同的内容造成用户体验不好及流量浪费,用户可以使用移动终端的过滤重复信息的功能。
具体的,用户在通过社交网络平台的账号登录客户端之后,可进入该客户端的设置界面,并在设置界面上选择该过滤重复信息的选项,并保存,且用户在选择及保存之后,该客户端将向该社交网络平台的服务器发送过滤请求,该过滤请求中包含用户的账号,服务器在接收到该过滤请求之后,将为该过滤请求中包含的账号设置过滤重复信息的标识,使得用户在后续请求更新时,能够对推送给该客户端的信息进行过滤冲重复信息的处理,减少发送给客户端的数据量,降低流量使用,且用户将不会看到重复的内容,改善用户体验。
步骤102、若账号已设置过滤重复信息的标识,则从待发送给客户端的第一信息集合中,删除与已推送的信息具有重复内容的信息,得到第二信息集合;
在本发明实施例中,更新装置在接收到客户端发送的更新请求之后,将从该更新请求中获取账号,并查找已保存的信息,确定该账号是否已经设置过滤重复信息的标识,且若该账号已设置过滤重复信息的标识,则更新装置从待发送给客户端的第一信息集合中,删除与已推送的信息具有重复内容的信息,得到第二信息集合。例如:若第一信息集合中包含信息A,已推送的信息中也包含信息A,则从第一信息集合中删除信息A。
其中,删除与已推送的信息重复内的信息即是过滤重复信息,以减少重复信息的发送。
在本发明实施例中,待发送给客户端的第一信息集合中包含了从上一次推送时间点至当前时间点,该账号对应的好友发布或者转发的信息的集合,或者对该账号对应的好友发布或者转发的信息进行处理后的信息的集合。其中,该处理也可以是过滤重复信息,具体的将在后面的实施例中具体介绍,此处不做赘述。
步骤103、将第二信息集合发送给客户端。
在本发明实施例中,更新装置在得到第二信息集合之后,将该第二信息集合发送给客户端,使得客户端能够显示该第二信息集合中的信息。
在本发明实施例中,更新装置接收客户端的更新请求,并利用已登录该客户端的账号确定该账号是否已设置过滤重复信息的标识,若是,则从待推送给该客户端第一信息集合中,删除与已推送的信息具有重复内容的信息,得到第二信息集合,并将该第二信息集合发送给该客户端,使得能够通过删除与已推送的信息具有重复内容的信息的方式,避免向用户使用的客户端推送重复内容,改善用户的体验,且能够降低推送的数据量,为用户节省流量。
请参阅图2,为本发明图1所示第一实施例中步骤102的细化步骤的流程示意图,该步骤102的细化步骤包括:
步骤201、获取待发送给客户端的第一信息集合,及获取预置时间段内已发送给客户端的第三信息集合;
在本发明实施例中,更新装置在接收到更新请求之后,若确定该更新请求中的账号已设置过滤重复信息的标识,则获取待发送给客户端的第一信息集合,及获取预置时间段内已发送给客户端的第三信息集合。
其中,第三信息集合是指预置时间段内推送给该账号的客户端的信息的集合,该预置时间段可以是当前时间点往前的一个时间段,例如:若当前时间为18:00,则预置时间段可以是12:00至18:00。或者,该预置时间段可以是当前时间点往前的任意一个时间段,例如,当前时间为18:00,则预置时间段可以是12:00-15:00。
步骤202、遍历第一信息集合中的每一条信息,计算遍历到的第一信息分别与第三信息集合中的每一条信息的内容相似度,并确定第一信息的内容相似度的最大值;
在本发明实施例中,更新装置在获取第一信息集合和第三信息集合之后,将遍历该第一信息集合中的每一条信息,且在遍历到第一信息时,计算该第一信息分别与第三信息集合中的每一条信息的内容相似度,将得到多个内容相似度,且将从该多个内容相似度中确定该第一信息的内容相似度的最大值。
在本发明实施例中,可以通过关键字匹配的方式计算内容相似度,即步骤202中的计算遍历到的第一信息分别与第三信息集合中的每一条信息的内容相似度,具体可以包括:
步骤A:提取遍历到的第一信息中的关键字;
步骤B:根据预置的内容相似度算法,将第一信息中的关键字分别与第三信息集合中的每条信息已提取的关键字进行相似度计算,确定第一信息分别与第三信息集合中的每条信息的内容相似度构成的相识度集合;
步骤C:从相似度集合中查找内容相似度的最大值作为第一信息的内容相似度的最大值。
需要说明的是,预置的内容相似度算法可以为确定第一信息与待匹配的信息具有相同的关键字的个数,并将该个数乘以2并除以第一信息的关键字的个数与待匹配的信息的关键字的个数的和,得到的值即为第一信息与待匹配信息的内容相似度。
为了更好的理解,下面将详细以确定第一信息集合中的第一信息与第三信息集合中的第三信息的内容相似度为列,描述内容相似度的确定过程,具体的:
若第一信息为:“真正的强大就是让自己保持成长”,则第一信息提取的关键字为:真正的、强大、自己、保持、成长,若第三信息为:“妈妈告诉我:真正的强大就是让自己保持成长”,则第三信息提取的关键字为:妈妈、告诉、我、真正的、强大、自己、保持、成长。
可确定第一信息与第三信息中相同的关键字为:真正的、强大、自己、保持、成长,即有5个相同的关键字,可确定该第一信息与该第三信息的内容相似度为:2*5/(5+8)=0.77=77%。
步骤203、若第一信息的内容相似度的最大值大于预先设置的第一数值,则从第一信息集合中删除第一信息,使得在遍历完成后,得到第二信息集合。
在本发明实施例中,在得到第一信息的内容相似度的最大值之后,将判断该第一信息的内容相似度的最大值是否大于预先设置的第一数值,若该第一信息的内容相似度的最大值大于该预先设置的第一数值,则从该第一信息集合中删除该第一信息。例如,第一信息的内容相似度的最大值为97%,预先设置的第一数值为95%,则可确定该第一信息在第三集合中存在相同或者相似的信息,更新装置将从第一信息集合中删除该第一信息,以避免向客户端推送已经推送过的信息。
在本发明实施例中,在第一信息的内容相似度的最大值大于预先设置的第一数值时,则可确定在第三集合中存在与该第一信息重复内容的信息。
通过上述方式,能够将所述第一信息集合中,与已推送的第三信息集合中的信息内容相似度的最大值大于预先设置的第一数值的第一信息删除,使得能够避免推送重复内容的信息。
在本发明实施例中,更新装置获取待发送给客户端的第一信息集合及获取预置时间段内已发送给客户端的第三信息集合,并遍历第一信息集合中的每一条信息,计算遍历到的第一信息分别与第三信息集合中的每一条信息的内容相似度,并确定该第一信息的内容相似度的最大值,若该第一信息的内容相似度的最大值大于预先设置的第一数值,则从第一信息集合中删除第一信息,使得在遍历第一信息集合后,能够删除第一信息集合中的所有与第三信息集合中的信息具有重复内容的信息,避免将重复的内容发送给第一信息集合。
在本发明实施例中,图1所示第一实施例中描述的是将第一信息集合中的信息与第三信息集合中的进行内容相似度的匹配,并从第一信息集合中删除重复内容的信息。
进一步的,为了避免第一信息集合中本身就包含具有重复内容的信息,例如第一信息集合中的信息A和信息B中的内容相同,更新装置在确定第一信息集合时就可以先过滤重复信息,请参阅图3,为本发明图1所示第一实施例中步骤201中获取发送给客户端的第一信息集合的细化步骤的流程示意图,该细化步骤包括:
步骤301、获取从上一次推送的时间点至当前时间点之间的时间段内,账户对应的未推送信息的第四集合;
在本发明实施例中,更新装置在接收到客户端的更新请求之后,若确定该更新请求中的账号已设置过滤重复信息的标识,则获取从上一次推送时间点至当前时间点之间的时间段内,账号对应的未推送信息的第四集合。
其中,服务器中在每次有用户发布或者转发信息时,其都将记录用户发布或者转发的信息及发布或者转发信息的时间,因此,更新装置可以根据信息的时间确定哪些是为推送的信息。
步骤302、根据预置的内容相似度算法,确定第四集合中的信息子集,其中,信息子集中的每一条信息与该信息子集中的其他信息的内容相似度均大于第二数值;
在本发明实施例中,更新装置将根据预置的内容相似度算法,确定第四集合中的信息子集,其中,信息子集中的每一条信息与该信息子集中的其他信息的内容相似度均大于第二数值。其中,该内容相似度算法与图2所示实施例中描述的内容相似度算法相同,此处不做赘述。
步骤303、在信息子集中包含n条信息时,删除信息子集中的n-1条信息,以得到第一信息集合。
在本发明实施例中,在确定第四集合中的信息子集之后,将对每一个信息子集进行删除,具体的:在信息子集中包含n条信息时,删除该信息子集中的n-1条信息,得到待推送的信息集合,即第一信息集合。其中,每一条信息都具有发布或者转发时的时间,则对于信息子集中的n条信息,可以删除除发布或者转发时间最早的一条信息以外的其他n-1条信息,或者删除除发布或者转发时间最晚的一条信息以外的其他的n-1条信息,或者,可以随机删除n条信息中的n-1条信息。
在本发明实施例中,通过对未发送给客户端的信息进行重复内容删除处理,使得能够在进一步的删除重复内容,减少推送的数据量,达到降低流量消耗及改善用户体验的目的。
请参阅图4,图4是本发明第二实施例中基于社交网络平台的信息更新装置的结构示意图,该装置主要包括:接收模块401、删除模块402以及发送模块403。各功能模块详细说明如下:
接收模块401,用于接收客户端的更新请求,更新请求中包含客户端上已登录的账号;
在本发明实施例中,移动终端上可安装多种类型的社交网络平台的客户端,例如、微信、微博、QQ等,且该多种类型的社交网络平台的客户端可以用于信息的分享及用户状态的发布,例如:微博中可以发布微博内容、微信中可以发布朋友圈、QQ也可以发布朋友圈。
其中,社交网络平台中各个用户都需要通过其注册的账号登录社交网络平台的客户端,且用户可以通过添加或者关注其他用户的账号的方式,成为其他用户的好友,且在其他用户在该社交网络平台上发布或者转发信息之后,该用户都可以通过更新客户端显示的信息的方式获取其他用户发布或转发的内容。
由于存在相同的文章或者图片可能会被用户的多个好友发布或分享,为了减少用户在使用过社交网络的过程中重复看到相同的内容造成用户体验不好及流量浪费,用户可以使用移动终端的过滤重复信息的功能。
具体的,用户在通过社交网络平台的账号登录客户端之后,可进入该客户端的设置界面,并在设置界面上选择该过滤重复信息的选项,并保存,且用户在选择及保存之后,该客户端将向该社交网络平台的服务器发送过滤请求,该过滤请求中包含用户的账号,服务器在接收到该过滤请求之后,将为该过滤请求中包含的账号设置过滤重复信息的标识,使得用户在后续请求更新时,能够对推送给该客户端的信息进行过滤冲重复信息的处理,减少发送给客户端的数据量,降低流量使用,且用户将不会看到重复的内容,改善用户体验。
即本发明实施例中的更新装置还包括设置模块(未示出),用于若接收到客户端发送的过滤请求,过滤请求中包含账号,则为账号设置过滤重复信息的标识。
在本发明实施例中,用户在使用社交网络平台的客户端时,可通过执行更新触发操作,生成更新指令,客户端在检测到该更新指令之后,将生成更新请求,并将该更新请求发送给更新装置,更新装置中的接收模块401接收客户端的更新请求,更新请求中包含客户端上已登录的账号。
删除模块402,用于若账号已设置过滤重复信息的标识,则从待发送给客户端的第一信息集合中,删除与已推送的信息具有重复内容的信息,得到第二信息集合;
在本发明实施例中,更新装置在接收到客户端发送的更新请求之后,将从该更新请求中获取账号,并查找已保存的信息,确定该账号是否已经设置过滤重复信息的标识,且若该账号已设置过滤重复信息的标识,则删除模块402从待发送给客户端的第一信息集合中,删除与已推送的信息具有重复内容的信息,得到第二信息集合。例如:若第一信息集合中包含信息A,已推送的信息中也包含信息A,则从第一信息集合中删除信息A。
其中,删除与已推送的信息重复内的信息即是过滤重复信息,以减少重复信息的发送。
在本发明实施例中,待发送给客户端的第一信息集合中包含了从上一次推送时间点至当前时间点,该账号对应的好友发布或者转发的信息的集合,或者对该账号对应的好友发布或者转发的信息进行处理后的信息的集合。其中,该处理也可以是过滤重复信息,具体的将在后面的实施例中具体介绍,此处不做赘述。
发送模块403,用于将第二信息集合发送给客户端。
在本发明实施例中,删除模块402在得到第二信息集合之后,发送模块403将该第二信息集合发送给客户端,使得客户端能够显示该第二信息集合中的信息。
在本发明实施例中,更新装置接收客户端的更新请求,并利用已登录该客户端的账号确定该账号是否已设置过滤重复信息的标识,若是,则从待推送给该客户端第一信息集合中,删除与已推送的信息具有重复内容的信息,得到第二信息集合,并将该第二信息集合发送给该客户端,使得能够通过删除与已推送的信息具有重复内容的信息的方式,避免向用户使用的客户端推送重复内容,改善用户的体验,且能够降低推送的数据量,为用户节省流量。
请参阅图5,为本发明图4所示第二实施例中删除模块402的细化功能模块的结构示意图,该删除模块402包括:
第一获取模块501,用于获取待发送给客户端的第一信息集合,
第二获取模块502,用于获取预置时间段内已发送给客户端的第三信息集合;
在本发明实施例中,在接收到更新请求之后,若确定该更新请求中的账号已设置过滤重复信息的标识,则第一获取模块501获取待发送给客户端的第一信息集合,及第二获取模块502获取预置时间段内已发送给客户端的第三信息集合。
其中,第三信息集合是指预置时间段内推送给该账号的客户端的信息的集合,该预置时间段可以是当前时间点往前的一个时间段,例如:若当前时间为18:00,则预置时间段可以是12:00至18:00。或者,该预置时间段可以是当前时间点往前的任意一个时间段,例如,当前时间为18:00,则预置时间段可以是12:00-15:00。
遍历计算模块503,用于遍历第一信息集合中的每一条信息,计算遍历到的第一信息分别与第三信息集合中的每一条信息的内容相似度,并确定第一信息的内容相似度的最大值;
其中,遍历计算模块503包括:
提取模块5031,用于提取遍历到的第一信息中的关键字;
相似度计算模块5032、根据预置的内容相似度算法,将第一信息中的关键字分别与第三信息集合中的每条信息已提取的关键字进行相似度计算,确定第一信息分别与第三信息集合中的每条信息的内容相似度构成的相识度集合;
查找模块5033,用于从相似度集合中查找内容相似度的最大值作为第一信息的内容相似度的最大值。
在本发明实施例中,更新装置在获取第一信息集合和第三信息集合之后,遍历计算模块503将遍历该第一信息集合中的每一条信息,且在遍历到第一信息时,计算该第一信息分别与第三信息集合中的每一条信息的内容相似度,将得到多个内容相似度,且将从该多个内容相似度中确定该第一信息的内容相似度的最大值。
在本发明实施例中,可以通过关键字匹配的方式计算内容相似度,即遍历计算模块503具体可以由提取模块5031提取遍历到的第一信息中的关键字;并由相似度计算模块5032根据预置的内容相似度算法,将第一信息中的关键字分别与第三信息集合中的每条信息已提取的关键字进行相似度计算,确定第一信息分别与第三信息集合中的每条信息的内容相似度构成的相识度集合;最后由查找模块5033从相似度集合中查找内容相似度的最大值作为第一信息的内容相似度的最大值。
需要说明的是,预置的内容相似度算法可以为确定第一信息与待匹配的信息具有相同的关键字的个数,并将该个数乘以2并除以第一信息的关键字的个数与待匹配的信息的关键字的个数的和,得到的值即为第一信息与待匹配信息的内容相似度。
为了更好的理解,下面将详细以确定第一信息集合中的第一信息与第三信息集合中的第三信息的内容相似度为列,描述内容相似度的确定过程,具体的:
若第一信息为:“真正的强大就是让自己保持成长”,则第一信息提取的关键字为:真正的、强大、自己、保持、成长,若第三信息为:“妈妈告诉我:真正的强大就是让自己保持成长”,则第三信息提取的关键字为:妈妈、告诉、我、真正的、强大、自己、保持、成长。
可确定第一信息与第三信息中相同的关键字为:真正的、强大、自己、保持、成长,即有5个相同的关键字,可确定该第一信息与该第三信息的内容相似度为:2*5/(5+8)=0.77=77%。
第一删除模块504,用于若第一信息的内容相似度的最大值大于预先设置的第一数值,则从第一信息集合中删除第一信息,使得在遍历完成后,得到第二信息集合。
在本发明实施例中,在得到第一信息的内容相似度的最大值之后,将判断该第一信息的内容相似度的最大值是否大于预先设置的第一数值,若该第一信息的内容相似度的最大值大于该预先设置的第一数值,则第一删除模块504从该第一信息集合中删除该第一信息。例如,第一信息的内容相似度的最大值为97%,预先设置的第一数值为95%,则可确定该第一信息在第三集合中存在相同或者相似的信息,第一删除模块504将从第一信息集合中删除该第一信息,以避免向客户端推送已经推送过的信息。
在本发明实施例中,在第一信息的内容相似度的最大值大于预先设置的第一数值时,则可确定在第三集合中存在与该第一信息重复内容的信息。
通过上述方式,能够将所述第一信息集合中,与已推送的第三信息集合中的信息内容相似度的最大值大于预先设置的第一数值的第一信息删除,使得能够避免推送重复内容的信息。
在本发明实施例中,更新装置获取待发送给客户端的第一信息集合及获取预置时间段内已发送给客户端的第三信息集合,并遍历第一信息集合中的每一条信息,计算遍历到的第一信息分别与第三信息集合中的每一条信息的内容相似度,并确定该第一信息的内容相似度的最大值,若该第一信息的内容相似度的最大值大于预先设置的第一数值,则从第一信息集合中删除第一信息,使得在遍历第一信息集合后,能够删除第一信息集合中的所有与第三信息集合中的信息具有重复内容的信息,避免将重复的内容发送给第一信息集合。
请参阅图6,为本发明图5所示第一获取模块501的细化功能模块的结构示意图,该第一获取模块501包括:
集合获取模块601,用于获取从上一次推送的时间点至当前时间点之间的时间段内,账户对应的未推送信息的第四集合;
在本发明实施例中,在接收到客户端的更新请求之后,若确定该更新请求中的账号已设置过滤重复信息的标识,则集合获取模块601获取从上一次推送时间点至当前时间点之间的时间段内,账号对应的未推送信息的第四集合。
其中,服务器中在每次有用户发布或者转发信息时,其都将记录用户发布或者转发的信息及发布或者转发信息的时间,因此,更新装置可以根据信息的时间确定哪些是为推送的信息。
子集确定模块602,用于根据预置的内容相似度算法,确定第四集合中的信息子集,其中,信息子集中的每一条信息与该信息子集中的其他信息的内容相似度均大于第二数值;
在本发明实施例中,子集确定模块602将根据预置的内容相似度算法,确定第四集合中的信息子集,其中,信息子集中的每一条信息与该信息子集中的其他信息的内容相似度均大于第二数值。其中,该内容相似度算法与图2所示实施例中描述的内容相似度算法相同,此处不做赘述。
第二删除模块603,用于在信息子集中包含n条信息时,删除信息子集中的n-1条信息,以得到第一信息集合。
在本发明实施例中,在确定第四集合中的信息子集之后,第二删除模块603将对每一个信息子集进行删除,具体的:在信息子集中包含n条信息时,第二删除模块603删除该信息子集中的n-1条信息,得到待推送的信息集合,即第一信息集合。其中,每一条信息都具有发布或者转发时的时间,则对于信息子集中的n条信息,可以删除除发布或者转发时间最早的一条信息以外的其他n-1条信息,或者删除除发布或者转发时间最晚的一条信息以外的其他的n-1条信息,或者,可以随机删除n条信息中的n-1条信息。
在本发明实施例中,通过对未发送给客户端的信息进行重复内容删除处理,使得能够在进一步的删除重复内容,减少推送的数据量,达到降低流量消耗及改善用户体验的目的。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上为对本发明所提供的一种基于社交网络平台的信息更新方法及装置的描述,对于本领域的技术人员,依据本发明实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种基于社交网络平台的信息更新方法,其特征在于,所述方法包括:
接收客户端的更新请求,所述更新请求中包含所述客户端上已登录的账号;
若所述账号已设置过滤重复信息的标识,则从待推送给所述客户端的第一信息集合中,删除与已推送的信息具有重复内容的信息,得到第二信息集合;
将所述第二信息集合发送给所述客户端。
2.根据权利要求1所述的方法,其特征在于,所述从待推送给所述客户端的第一信息集合中,删除与已推送的信息具有重复内容的信息,得到第二信息集合包括:
获取待推送给所述客户端的第一信息集合,及获取预置时间段内已推送给所述客户端的第三信息集合;
遍历所述第一信息集合中的每一条信息,计算遍历到的第一信息分别与所述第三信息集合中的每一条信息的内容相似度,并确定所述第一信息的内容相似度的最大值;
若所述第一信息的内容相似度的最大值大于预先设置的第一数值,则从所述第一信息集合中删除所述第一信息,使得在遍历完成后,得到第二信息集合。
3.根据权利要求2所述的方法,其特征在于,所述计算遍历到的第一信息分别与所述第三信息集合中的每一条信息的内容相似度,并确定所述第一信息的内容相似度的最大值,包括:
提取遍历到的所述第一信息中的关键字;
根据预置的内容相似度算法,将所述第一信息中的关键字分别与所述第三信息集合中的每条信息已提取的关键字进行相似度计算,确定所述第一信息分别与所述第三信息集合中的每条信息的内容相似度构成的相识度集合;
从所述相似度集合中查找内容相似度的最大值作为所述第一信息的内容相似度的最大值。
4.根据权利要求2所述的方法,其特征在于,所述获取待推送给所述客户端的第一信息集合,包括:
获取从上一次推送的时间点至当前时间点之间的时间段内,所述账户对应的未推送信息的第四集合;
根据预置的内容相似度算法,确定所述第四集合中的信息子集,其中,所述信息子集中的每一条信息与该信息子集中的其他信息的内容相似度均大于所述第二数值;
在所述信息子集中包含n条信息时,删除所述信息子集中的n-1条信息,以得到所述第一信息集合。
5.根据权利要求1至4任意一项所述的方法,其特征在于,所述方法还包括:
若接收到所述客户端发送的过滤请求,所述过滤请求中包含所述账号,则为所述账号设置过滤重复信息的标识。
6.一种基于社交网络平台的信息更新装置,其特征在于,所述装置包括:
接收模块,用于接收客户端的更新请求,所述更新请求中包含所述客户端上已登录的账号;
删除模块,用于若所述账号已设置过滤重复信息的标识,则从待推送给所述客户端的第一信息集合中,删除与已推送的信息具有重复内容的信息,得到第二信息集合;
发送模块,用于将所述第二信息集合发送给所述客户端。
7.根据权利要求6所述的装置,其特征在于,所述删除模块包括:
第一获取模块,用于获取待推送给所述客户端的第一信息集合,
第二获取模块,用于获取预置时间段内已推送给所述客户端的第三信息集合;
遍历计算模块,用于遍历所述第一信息集合中的每一条信息,计算遍历到的第一信息分别与所述第三信息集合中的每一条信息的内容相似度,并确定所述第一信息的内容相似度的最大值;
第一删除模块,用于若所述第一信息的内容相似度的最大值大于预先设置的第一数值,则从所述第一信息集合中删除所述第一信息,使得在遍历完成后,得到第二信息集合。
8.根据权利要求7所述的装置,其特征在于,所述遍历计算模块包括:
提取模块,用于提取遍历到的所述第一信息中的关键字;
相似度计算模块,用于根据预置的内容相似度算法,将所述第一信息中的关键字分别与所述第三信息集合中的每条信息已提取的关键字进行相似度计算,确定所述第一信息分别与所述第三信息集合中的每条信息的内容相似度构成的相识度集合;
查找模块,用于从所述相似度集合中查找内容相似度的最大值作为所述第一信息的内容相似度的最大值。
9.根据权利要求7所述的装置,其特征在于,所述第一获取模块包括:
集合获取模块,用于获取从上一次推送的时间点至当前时间点之间的时间段内,所述账户对应的未推送信息的第四集合;
子集确定模块,用于根据预置的内容相似度算法,确定所述第四集合中的信息子集,其中,所述信息子集中的每一条信息与该信息子集中的其他信息的内容相似度均大于所述第二数值;
第二删除模块,用于在所述信息子集中包含n条信息时,删除所述信息子集中的n-1条信息,以得到所述第一信息集合。
10.根据权利要求6至9任意一项所述的装置,其特征在于,所述装置还包括:
设置模块,用于若接收到所述客户端发送的过滤请求,所述过滤请求中包含所述账号,则为所述账号设置过滤重复信息的标识。
CN201610070728.0A 2016-02-01 2016-02-01 基于社交网络平台的信息更新方法及装置 Pending CN105608627A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610070728.0A CN105608627A (zh) 2016-02-01 2016-02-01 基于社交网络平台的信息更新方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610070728.0A CN105608627A (zh) 2016-02-01 2016-02-01 基于社交网络平台的信息更新方法及装置

Publications (1)

Publication Number Publication Date
CN105608627A true CN105608627A (zh) 2016-05-25

Family

ID=55988545

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610070728.0A Pending CN105608627A (zh) 2016-02-01 2016-02-01 基于社交网络平台的信息更新方法及装置

Country Status (1)

Country Link
CN (1) CN105608627A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106533899A (zh) * 2016-09-30 2017-03-22 宇龙计算机通信科技(深圳)有限公司 一种信息显示处理的方法、装置及系统
WO2018023805A1 (zh) * 2016-08-05 2018-02-08 王志强 根据关键字屏蔽朋友圈消息的方法以及权限系统
WO2018023807A1 (zh) * 2016-08-05 2018-02-08 王志强 屏蔽信息时的技术权属展示方法以及权限系统
CN107704613A (zh) * 2017-10-23 2018-02-16 深圳市金立通信设备有限公司 一种信息管理方法、终端及计算机可读存储介质
CN108985805A (zh) * 2017-05-31 2018-12-11 北京京东尚科信息技术有限公司 一种选择性执行推送任务的方法和装置
CN109903089A (zh) * 2019-02-18 2019-06-18 珠海天燕科技有限公司 一种信息的处理方法和装置
CN111666484A (zh) * 2019-03-07 2020-09-15 腾讯科技(深圳)有限公司 内容推送方法、推送装置及计算机可读存储介质
CN114943036A (zh) * 2022-06-10 2022-08-26 盐城金堤科技有限公司 push推送相似文章判定方法和装置、及存储介质和电子设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102833146A (zh) * 2011-06-17 2012-12-19 华为技术有限公司 一种网络去重的方法和设备
US20130031093A1 (en) * 2011-07-25 2013-01-31 Sony Computer Entertainment Inc. Information processing system, information processing method, program, and non-transitory information storage medium
CN103378978A (zh) * 2012-04-16 2013-10-30 腾讯科技(深圳)有限公司 推送消息的方法和服务器
CN104035941A (zh) * 2013-03-08 2014-09-10 腾讯科技(深圳)有限公司 一种信息筛选方法及装置
CN104142940A (zh) * 2013-05-08 2014-11-12 华为技术有限公司 信息推荐处理方法及装置
CN104579912A (zh) * 2013-10-29 2015-04-29 深圳市腾讯计算机系统有限公司 数据推送的方法及装置
CN104572736A (zh) * 2013-10-23 2015-04-29 北大方正集团有限公司 基于社交网络的关键词提取方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102833146A (zh) * 2011-06-17 2012-12-19 华为技术有限公司 一种网络去重的方法和设备
US20130031093A1 (en) * 2011-07-25 2013-01-31 Sony Computer Entertainment Inc. Information processing system, information processing method, program, and non-transitory information storage medium
CN103378978A (zh) * 2012-04-16 2013-10-30 腾讯科技(深圳)有限公司 推送消息的方法和服务器
CN104035941A (zh) * 2013-03-08 2014-09-10 腾讯科技(深圳)有限公司 一种信息筛选方法及装置
CN104142940A (zh) * 2013-05-08 2014-11-12 华为技术有限公司 信息推荐处理方法及装置
CN104572736A (zh) * 2013-10-23 2015-04-29 北大方正集团有限公司 基于社交网络的关键词提取方法及装置
CN104579912A (zh) * 2013-10-29 2015-04-29 深圳市腾讯计算机系统有限公司 数据推送的方法及装置

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018023805A1 (zh) * 2016-08-05 2018-02-08 王志强 根据关键字屏蔽朋友圈消息的方法以及权限系统
WO2018023807A1 (zh) * 2016-08-05 2018-02-08 王志强 屏蔽信息时的技术权属展示方法以及权限系统
CN106533899A (zh) * 2016-09-30 2017-03-22 宇龙计算机通信科技(深圳)有限公司 一种信息显示处理的方法、装置及系统
CN106533899B (zh) * 2016-09-30 2019-12-10 宇龙计算机通信科技(深圳)有限公司 一种信息显示处理的方法、装置及系统
CN108985805A (zh) * 2017-05-31 2018-12-11 北京京东尚科信息技术有限公司 一种选择性执行推送任务的方法和装置
CN108985805B (zh) * 2017-05-31 2021-04-30 北京京东尚科信息技术有限公司 一种选择性执行推送任务的方法和装置
CN107704613A (zh) * 2017-10-23 2018-02-16 深圳市金立通信设备有限公司 一种信息管理方法、终端及计算机可读存储介质
CN109903089A (zh) * 2019-02-18 2019-06-18 珠海天燕科技有限公司 一种信息的处理方法和装置
CN111666484A (zh) * 2019-03-07 2020-09-15 腾讯科技(深圳)有限公司 内容推送方法、推送装置及计算机可读存储介质
CN111666484B (zh) * 2019-03-07 2023-10-13 腾讯科技(深圳)有限公司 内容推送方法、推送装置及计算机可读存储介质
CN114943036A (zh) * 2022-06-10 2022-08-26 盐城金堤科技有限公司 push推送相似文章判定方法和装置、及存储介质和电子设备

Similar Documents

Publication Publication Date Title
CN105608627A (zh) 基于社交网络平台的信息更新方法及装置
CN110543586B (zh) 多重用户身份融合方法、装置、设备及存储介质
CN106570008B (zh) 推荐方法及装置
CN107330522B (zh) 用于更新深度学习模型的方法、装置及系统
CN105095211B (zh) 多媒体数据的获取方法和装置
CN104424229B (zh) 一种多维度拆分的计算方法及系统
CN105931123B (zh) 基于网络账号的好友推荐方法及装置
CN106294418B (zh) 检索方法和检索系统
CN104834695A (zh) 基于用户兴趣度和地理位置的活动推荐方法
CN110020086A (zh) 一种用户画像查询方法及装置
CN104331772A (zh) 云数据中心实现资源审批的流程管理方法及系统
CN104462273A (zh) 提取轨迹的方法及系统
CN112885099A (zh) 用于确定车辆轨迹关键点的方法、装置及设备
CN114205690A (zh) 流量预测、模型训练方法及装置、电子设备、存储介质
CN113422801A (zh) 边缘网络节点内容分配方法、系统、装置及计算机设备
CN105335408B (zh) 一种搜索词白名单的扩展方法及相关系统
CN113361618A (zh) 一种基于联邦学习的工业数据联合建模方法及系统
CN111767419B (zh) 图片搜索方法、装置、设备及计算机可读存储介质
US20200004795A1 (en) Method, apparatus, storage medium and electronic device for establishing question and answer system
CN106384292A (zh) 社交网络用户关系采集系统及方法
CN117493671A (zh) 信息处理方法、装置、电子设备及计算机存储介质
CN104063456A (zh) 基于向量查询的自媒体传播图谱分析方法和装置
CN112433757A (zh) 一种确定接口调用关系的方法和装置
CN111860655B (zh) 用户的处理方法、装置和设备
CN110557351A (zh) 用于生成信息的方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160525

RJ01 Rejection of invention patent application after publication