CN105930539A - 话题订阅方法和装置 - Google Patents

话题订阅方法和装置 Download PDF

Info

Publication number
CN105930539A
CN105930539A CN201610481888.4A CN201610481888A CN105930539A CN 105930539 A CN105930539 A CN 105930539A CN 201610481888 A CN201610481888 A CN 201610481888A CN 105930539 A CN105930539 A CN 105930539A
Authority
CN
China
Prior art keywords
topic
persistence
resource
user
coupling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610481888.4A
Other languages
English (en)
Inventor
�田�浩
李大任
黄波
戴岱
刘呈祥
魏安军
任可欣
袁海光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201610481888.4A priority Critical patent/CN105930539A/zh
Priority to PCT/CN2016/097477 priority patent/WO2018000569A1/zh
Publication of CN105930539A publication Critical patent/CN105930539A/zh
Priority to US16/234,337 priority patent/US11429680B2/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/174Redundancy elimination performed by the file system
    • G06F16/1748De-duplication implemented within the file system, e.g. based on file segments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3347Query execution using vector based model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Abstract

本发明实施例公开了一种话题订阅方法及装置。该方法包括:根据用户的检索关键词,结合用户的历史行为和/或订阅记录,为所述检索关键词匹配持续性话题;将所述持续性话题返回客户端显示,以供所述用户进行订阅;保存所述用户订阅的持续性话题,并在所述用户订阅的持续性话题对应的匹配资源有更新时,将更新的匹配资源推荐给用户。本发明实施例由于能够根据用户实时的行为结合历史行为及时的调整推荐的策略,增加了命中用户感兴趣的话题的概率。

Description

话题订阅方法和装置
技术领域
本发明实施例涉及互联网技术,尤其涉及一种话题订阅方法及装置。
背景技术
现有技术中的话题订阅方式大致分成两种,一种是以资源为主,一种是以需求订阅为主,分别介绍如下:
以资源为主的推荐方式以今日头条为例,通过记录用户日常的点击资源来猜测用户的兴趣,隐式的推荐相关的资源,例如,某个用户经常点击NBA相关的文章,则该用户在持续使用“今日头条”的过程中,会发现其它NBA相关的文章明显的增多。“今日头条”的资源主要由合作媒体来提供,技术上通过一定的筛选过滤出满足要求的资源,通过计算资源之间的相似度来进行隐式推荐。“今日头条”也支持订阅的功能,一是用户主要通过实体词来订阅话题,这种方式的需求粒度太粗,该订阅中的文章命中用户真正需求的概率就会比较低;二是用户通过媒体号来订阅话题,这种方式太依赖该媒体号,不能持续的命中某个用户的需求。
以需求订阅为主的推荐方式以“即刻”为例,如图1所示,在“即刻”首页是一些需求话题订阅的推荐,用户可以分类查找,或者直接搜索自己感兴趣的话题。当用户订阅某些需求话题之后,“即刻”通过推送来提醒用户这些订阅有新的资源,用户也可以通过点击“消息”来查看订阅需求里的最新的资源,如图2所示。
综上所述,以资源为主和以需求订阅为主的方式都存在着相同的缺陷,即没有考虑用户自身的属性或者行为,不能很好的表示用户真正的兴趣点。
发明内容
有鉴于此,本发明实施例提供一种话题订阅方法及装置,以增加命中用户感兴趣的话题的概率。
第一方面,本发明实施例提供了一种话题订阅方法,所述方法包括:
根据用户的检索关键词,结合用户的历史行为和/或订阅记录,为所述检索关键词匹配持续性话题;
将所述持续性话题返回客户端显示,以供所述用户进行订阅;
保存所述用户订阅的持续性话题,并在所述用户订阅的持续性话题对应的匹配资源有更新时,将更新的匹配资源推荐给用户。
第二方面,本发明实施例还提供了一种话题订阅装置,所述装置包括:
话题匹配模块,用于根据用户的检索关键词,结合用户的历史行为和/或订阅记录,为所述检索关键词匹配持续性话题;
话题显示模块,用于将所述持续性话题返回客户端显示,以供所述用户进行订阅;
资源推荐模块,用于保存所述用户订阅的持续性话题,并在所述用户订阅的持续性话题对应的匹配资源有更新时,将更新的匹配资源推荐给用户。
本发明实施例的技术方案,通过将用户的检索关键词结合用户的历史行为和/或订阅记录来匹配持续性话题,将该持续性话题返回客户端显示以供用户进行订阅,并在用户订阅的持续性话题对应的匹配资源有更新时,将更新的匹配资源推荐给用户,由于能够根据用户实时的行为结合历史行为及时的调整推荐的策略,增加了命中用户感兴趣的话题的概率。
附图说明
图1是现有技术中的即刻的订阅页面的示例图;
图2是现有技术中的即刻推送的消息的示例图;
图3是本发明实施例一提供的一种话题订阅方法的流程图;
图4a-4c是本发明实施例提供的话题订阅方法中的订阅页面的示例图;
图5是本发明实施例二提供的一种话题订阅方法的流程图;
图6是本发明实施例提供的话题订阅方法中的根据用户的检索关键词为用户推荐的匹配资源和相应的持续性话题的示例图;
图7是本发明实施例提供的话题订阅方法中的更新的匹配资源的示例图;
图8是本发明实施例三提供的一种话题订阅方法的流程图;
图9是本发明实施例四提供的一种话题订阅方法中的建立持续性话题与资源的关联的流程图;
图10是本发明实施例五提供的一种话题订阅装置的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。
实施例一
图3是本发明实施例一提供的一种话题订阅方法的流程图,本实施例可适用于根据用户的历史行为匹配话题并供用户订阅的情况,该方法可以由话题订阅装置来执行,该话题订阅装置可以做配置在服务器中,该方法具体包括如下:
S310,根据用户的检索关键词,结合用户的历史行为和/或订阅记录,为所述检索关键词匹配持续性话题。
当用户使用话题检索的应用程序(如百度度秘明星八卦服务)时,可以输入检索关键词来检索相关的话题及对应的资源。在接收到用户输入的检索关键词时,为了更好的命中用户的兴趣点,将所述检索关键词结合用户的历史行为(如用户的点击资源和用户的检索历史等,即用户的会话历史)和/或订阅记录(用户的订阅的话题),为所述检索关键词匹配用户感兴趣的持续性话题,该持续性话题对用户来说是有持续性需求的话题。其中,匹配的持续性话题包括至少一项持续性话题。
在匹配持续性话题时,还可以匹配与用户输入的检索关键词相关的持续性话题,作为相关的推荐。与检索关键词相关包括主体相关或关键词相关两种情况。例如,用户搜索“鹿晗女朋友”时,首先精准匹配出用户需求的持续性话题,然后推荐主体相关的“鹿晗跑男4的”、“王祖蓝身高”(与鹿晗共同参与跑男,好朋友关系)等话题,和关键词相关的“吴亦凡女朋友”、“郑恺女朋友”等话题。这些相关的推荐会帮助用户发现主需求周边的需求,进而让更多需求和其关联的优质资源被用户看见,激发出用户潜在的其它需求。
其中,所述持续性话题包括设定时间区间内,直接或者间接相关的至少一项用户查询,是存储在持续性话题检索库中的话题。
S320,将所述持续性话题返回客户端显示,以供所述用户进行订阅。
将所述持续性话题返回给用户的客户端,在客户端的显示界面进行显示,如果用户点击其中的一个持续性话题,则在预先建立的持续性话题检索库中查询与该持续性话题对应的匹配资源,并返回客户端显示,以供用户浏览该持续性话题对应的匹配资源。
S330,保存所述用户订阅的持续性话题,并在所述用户订阅的持续性话题对应的匹配资源有更新时,将更新的匹配资源推荐给用户。
接收所述用户订阅的持续性话题,并保存在所述用户的账户下。当有资源更新时,建立该资源与持续性话题检索库中的持续性话题的关联,确定该资源是用户订阅的持续性话题对应的匹配资源时,可以以消息的形式将该更新的匹配资源推送到客户端。
图4a-4c是本发明实施例提供的话题订阅方法中的订阅页面的示例图。如图4a所示,在订阅页面的热门订阅中,每个订阅项由持续性话题和对应的最新的资源的标题构成,所述订阅项还可以包括图片,订阅页面还支持用户搜索自己想要的订阅内容。如图4b所示,当用户订阅其中一些持续性话题时,可以点开“我的”查看已经订阅的持续性话题。如图4c所示,用户还可以点开“消息”以瀑布流的方式查看已经订阅的持续性话题的最新资源。
本实施例的技术方案,通过将用户的检索关键词结合用户的历史行为和/或订阅记录来匹配持续性话题,将该持续性话题返回客户端显示以供用户进行订阅,并在用户订阅的持续性话题对应的匹配资源有更新时,将更新的匹配资源推荐给用户,由于能够根据用户实时的行为结合历史行为及时的调整推荐的策略,增加了命中用户感兴趣的话题概率,提升了用户发现更多的持续性话题的体验。
在上述技术方案的基础上,所述话题订阅方法还优选包括:
根据所述用户的历史行为及持续性话题的订阅行为,确定向所述用户推荐的持续性话题并推荐给所述用户。
根据当前用户的历史行为以及所有用户中持续性话题的订阅人数,确定向当前用户推荐的持续性话题,并将该持续性话题推荐给当前用户,在检测到用户点击该持续性话题时,将该持续性话题对应的匹配资源返回给客户端进行显示。例如,当前用户刚刚打开应用程序时,根据当前用户的历史行为以及持续性话题的订阅人数,向当前用户推荐相应的持续性话题。实现了向用户推荐用户感兴趣且热度高的话题的目的。
在上述技术方案的基础上,根据用户的检索关键词,结合用户的历史行为和/或订阅记录,为所述检索关键词匹配持续性话题优选包括:
根据用户的检索关键词,结合用户的历史行为和/或订阅记录,确定所述检索关键词的持续性话题;
根据所述持续性话题的点击记录和用户的历史行为,对所述持续性话题进行排序。
首先根据用户的检索关键词结合用户的历史行为和/或订阅记录,确定与所述检索关键词匹配的持续性话题,再根据确定的持续性话题的点击记录和所述用户的历史行为,对所述持续性话题进行排序,将点击记录次数多且和用户的历史行为最接近的持续性话题排在前面,从而可以按照排序结果为用户推荐热度高且用户感兴趣的持续性话题,进一步增加了命中用户感兴趣的话题的概率。
实施例二
图5是本发明实施例二提供的一种话题订阅方法的流程图,本实施例在上述实施例的基础上进行了优化,进一步增加了“在接收到用户点击的持续性话题时,在预先建立的持续性话题检索库中查询相应的匹配资源,并返回客户端显示”,该方法具体包括如下:
S510,根据用户的检索关键词,结合用户的历史行为和/或订阅记录,为所述检索关键词匹配持续性话题。
S520,将所述持续性话题返回客户端显示,以供所述用户进行订阅。
S530,保存所述用户订阅的持续性话题,并在所述用户订阅的持续性话题对应的匹配资源有更新时,将更新的匹配资源推荐给用户。
S540,在接收到用户点击的持续性话题时,在预先建立的持续性话题检索库中查询相应的匹配资源,并返回客户端显示。
其中,所述持续性话题检索库包括持续性话题和匹配资源的关联关系。所述持续性话题检索库中的持续性话题是根据所有用户的检索日志,挖掘出的满足预设条件的用户查询(query)。
在客户端中显示所述持续性话题(通过检索关键词匹配的持续性话题返回客户端显示或者显示用户订阅的持续性话题)时,客户端实时检测用户点击的持续性话题,在检测到用户点击的持续性话题时,客户端将用户点击的持续性话题发送给服务器,服务器在预先建立的持续性话题检索库中查询与该持续性话题对应的匹配资源,将查询到的匹配资源返回客户端显示。
其中,在接收到用户点击的持续性话题时,在预先建立的持续性话题检索库中查询相应的匹配资源,并返回客户端显示优选包括:
在接收到用户点击的持续性话题时,在预先建立的持续性话题检索库中查询相应的匹配资源;
根据所述匹配资源的点击记录、资源属性和用户的历史行为,对所述匹配资源进行排序;
按照排序结果,将所述匹配资源返回客户端显示。
在接收到用户点击的持续性话题时,在预先建立的持续性话题检索库中查询与该持续性话题对应的匹配资源,根据查询到的匹配资源各自的点击记录、资源属性(如价值得分等)和用户的历史行为,对所述匹配资源进行降序排序,并按照排序结果,将所述匹配资源返回客户端显示,从而用户可以最先获取到热度高、质量好且用户感兴趣的资源,进一步增加了命中用户感兴趣的资源的概率。
本发明实施例提供的话题订阅方法,还可以根据用户的检索关键词直接将最接近的匹配资源和相关的持续性话题推荐给用户。图6是本发明实施例提供的话题订阅方法中的根据用户的检索关键词为用户推荐的匹配资源和相应的持续性话题的示例图,如图6所示,当用户输入“明星八卦”时,首先推荐一些比较热门明星的满足资源610,然后推荐出比较热门的具有持续性需求的明星的持续性话题620;当持续性话题“明星八卦”有更新时,可以通过图7所示的中间页来浏览相关资源。图7是本发明实施例提供的话题订阅方法中的更新的匹配资源的示例图。
本实施例的技术方案,在上述实施例的基础上,通过在接收到用户点击的持续性话题时,在预先建立的持续性话题检索库中查询相应的匹配资源,并返回客户端显示,供用户查看持续性话题对应的匹配资源。
实施例三
图8是本发明实施例三提供的一种话题订阅方法的流程图,本实施例在上述实施例的基础上进行了优化,增加了在线下建立持续性话题检索库的操作,该方法具体包括如下:
S810,根据用户检索日志,挖掘出满足预设条件的用户查询作为持续性话题。
其中,所述预设条件优选包括:在第一预设天数内超过预设人数连续搜索第二预设天数,和/或包括预设关键词。
根据用户检索日志(如百度全网的用户检索日志),挖掘出满足预设条件的用户查询作为持续性话题。例如,在2周内有10个用户连续超过3天都搜索过“黄晓明angelababy”,则“黄晓明angelababy”为持续性话题;带有预设关键词的用户查询,如“最新电视剧”带有预设关键词“最新”,则“最新电视剧”为持续性话题。将挖掘出的持续性话题进行字面去重后,作为所有的持续性话题的结果。还可以结合所有用户最新的检索日志,例行挖掘最新的持续性话题。
S820,根据预先配置网站和所述持续性话题的点击资源,建立资源库。
通过资源挖掘来建立资源库,资源挖掘的来源包括预先配置网站和所述持续性话题的点击资源。预先配置网站为一些比较优质的话题网站,如“今日头条”、“知乎”等,从这些话题网站来获取资源,以及本网站中所述持续性话题的点击资源,综合这两种来源的资源,建立资源库。
其中,根据预先配置网站和所述持续性话题的点击资源,建立资源库优选包括:
获取所述预先配置网站中的资源和所述持续性话题的点击资源,作为原始资源;
根据所述原始资源的标题和正文,对字面内容一致的原始资源进行去重,得到资源;
提取所述资源的资源属性,所述资源属性包括标题、摘要、配图和价值得分;
将所述资源和对应的资源属性存入资源库。
其中,所述资源属性中的标题可以直接抓取资源的标题来获得;摘要通过提取标题和正文中的关键句获得;根据资源的原始图片来确定资源主体,然后通过对主图进行预设尺寸的裁剪得到配图;资源的价值得分主要依赖资源内容的信息量和深度,以及资源的来源来确定,一般而言,内容新颖有深度且图文并茂的资源的价值得分越高。通过对资源进行字面去重,可以防止资源明显的重复,通过将资源和对应的资源属性存入资源库,有利于后续跟进资源属性来建立资源与持续性话题的关联,提高关联速度。
S830,建立所述持续性话题和所述资源库中的资源的关联,存入持续性话题检索库。
根据持续性话题的词分布和所述资源库中的资源的词分布,来建立所述持续性话题和所述资源库中的资源的关联。通过计算持续性话题的词分布和所述资源库中的资源的词分布的相似度,在相似度大于预设阈值时,确定持续性话题与资源是关联的,将所述持续性话题和所述资源库中的资源的关联关系,存入持续性话题检索库,以向用户推荐持续性话题和与该持续性话题相关的资源。
S840,根据用户的检索关键词,结合用户的历史行为和/或订阅记录,为所述检索关键词匹配持续性话题。
S850,将所述持续性话题返回客户端显示,以供所述用户进行订阅。
S860,保存所述用户订阅的持续性话题,并在所述用户订阅的持续性话题对应的匹配资源有更新时,将更新的匹配资源推荐给用户。
本实施例的技术方案,在上述技术方案的基础上,通过以用户检索日志和预先配置网站为基础,自动的挖掘出有用户潜在可能的持续性需求的持续性话题,并挖掘出有价值的资源,建立所述持续性话题与资源的关联,存入持续性话题检索库,便于后续向用户推荐用户感兴趣的持续性话题和对应的资源,而且通过话题挖掘相对于现有技术中的人工整理话题的方式,可以提供更多的可订阅的持续性话题,且具备更多的相关资源来支持和满足用户订阅。
实施例四
图9是本发明实施例四提供的一种话题订阅方法中的建立持续性话题与资源的关联的流程图,本实施例在实施例三的基础上,对“建立所述持续性话题和所述资源库中的资源的关联,存入持续性话题检索库”进行了进一步优化,如图9所示,本实施例中的“建立所述持续性话题和所述资源库中的资源的关联,存入持续性话题检索库”具体包括如下:
S831,分别提取所述持续性话题和所述资源的词分布,所述持续性话题的统计语料包括所述持续性话题的点击资源和所述资源库中标题包含所述持续性话题的资源。
所述资源的词分布通过统计该资源的标题和正文中的词频来得到。
S832,根据所述持续性话题的词分布和词向量特征,对所述持续性话题进行去重和聚类处理。
根据所述持续性话题的词分布和词向量(word-embedding)特征,计算持续性话题之间的相似度,根据所述相似度对所述持续性话题进行去重和聚类处理。
其中,根据所述持续性话题的词分布和词向量特征,对所述持续性话题进行去重和聚类处理包括:
根据所述持续性话题的词分布和词向量特征,计算所述持续性话题之间的相似度;
保留所述相似度大于第一预设阈值的持续性话题中的一个持续性话题;
将所述相似度大于第二预设阈值且小于或等于第一预设阈值的持续性话题归为一类。
其中,所述第一预设阈值大于所述第二预设阈值。去重即将所述多个持续性话题的相似度大于第一预设阈值的持续性话题去掉,即去掉语义意思一致的持续性话题去掉,例如“跑男4”和“奔跑吧兄弟4”,只保留其一即可。聚类是指把语义意思相似的持续性话题归为一类,例如“王源照片”和“王源街拍”。通过持续性话题之间的相似度来对持续性话题进行去重和聚类处理,可以提高处理的准确度。
S833,建立处理后的持续性话题和资源的关联关系,存入持续性话题检索库。
建立进行去重和聚类处理后的持续性话题和资源的关联关系,并将持续性话题、资源和对应的关联关系存入持续性话题检索库。
其中,建立处理后的持续性话题和资源的关联关系,存入持续性话题检索库优选包括:
对所述处理后的持续性话题建立词分布的倒排索引;
根据资源的词分布和所述倒排索引,确定与该资源对应的候选持续性话题;
计算该资源正文的词分布和所述候选持续性话题的词分布的相似度;
将所述相似度大于预设阈值的候选持续性话题作为与该资源关联的持续性话题,存入持续性话题检索库。
其中,倒排索引(Inverted index),也常被称为反向索引、置入档案或反向档案,是一种索引方法,被用来存储在全文搜索下某个单词在一个文档或者一组文档中的存储位置的映射。通过倒排索引,可以根据单词快速获取包含这个单词的文档列表。
对处理后的持续性话题建立词分布的倒排索引,即确定词在持续性话题的位置,然后根据资源标题的词分布以及正文中出行次数较多的词,在所述倒排索引中检索出对应的持续性话题,作为候选持续性话题,该候选持续性话题包括至少一项,计算资源正文中的出行次数较多的词和该候选持续性话题的词分布之间的相似度,将所述相似度大于预设阈值的候选持续性话题作为与该资源关联的持续性话题,将所有的持续性话题与资源的关联关系确定后存入持续性话题检索库。通过上述方法建立持续性话题与资源的关联关联,能够更加及时的将新增的资源挂接到持续性话题下,进而展现到线上。
例如,标题为“太阳的后裔中的面膜”的资源,正文中多次提到了“面膜”、“补水”,这些词与持续性话题“太阳的后裔”的相似度就会非常低,故确定该资源与“太阳的后裔”不匹配;标题为“重温太阳的后裔的经典画面”的资源,正文中多次提到了“太阳的后裔”、“宋仲基”、“宋慧乔”,这些词跟持续性话题“太阳的后裔”的相关性都比较高,故确定该资源与“太阳的后裔”能够匹配。
S834,根据持续性话题关联的资源的词分布,对处理后的持续性话题关联的资源进行去重。
由于资源量比较大,直接在全量资源上对资源进行去重代价会比较高,因此,基于持续性话题和资源的匹配结果,对每个持续性话题所关联的资源进行去重。在对每个持续性话题所关联的资源进行去重时,主要考虑两个资源之间的资源标题的词分布、资源正文的词分布的相似度,来进行去重。
其中,根据持续性话题关联的资源的词分布,对处理后的持续性话题关联的资源进行去重优选包括:
采用流式比较的方式,当所述持续性话题关联的两个资源的相似度大于预设相似度阈值时,保留所述两个资源中价值得分较高的资源。
例如,已经保留了资源A、B、C,流式输入资源D,发现D跟A比较相似,且D的价值得分高于A的价值得分,则将资源D替换资源A,即保留资源D、B、C。通过流式比较的方式,可以提高比较速度。
本实施例的技术方案,通过分别提取持续性话题和资源的词分布,基于持续性话题和资源的词分布建立持续性话题与资源的关联关系,能够及时的将新增的资源挂接到持续性话题下,并及时推送给用户,通过在建立持续性话题与资源的关联关系后,对持续性话题关联的资源进行去重,可以提高去重的速度。
实施例五
图10是本发明实施例五提供的一种话题订阅装置的结构示意图,如图10所示,本实施例所述的话题订阅装置包括:话题匹配模块1010、话题显示模块1020和资源推荐模块1030。
其中,话题匹配模块1010用于根据用户的检索关键词,结合用户的历史行为和/或订阅记录,为所述检索关键词匹配持续性话题;
话题推荐模块1020用于将所述持续性话题返回客户端显示,以供所述用户进行订阅;
资源推荐模块1030用于保存所述用户订阅的持续性话题,并在所述用户订阅的持续性话题对应的匹配资源有更新时,将更新的匹配资源推荐给用户。
优选的,还包括:
话题推荐模块,用于根据所述用户的历史行为及持续性话题的订阅行为,确定向所述用户推荐的持续性话题并推荐给所述用户。
优选的,还包括:
匹配资源显示模块,用于在接收到用户点击的持续性话题时,在预先建立的持续性话题检索库中查询相应的匹配资源,并返回客户端显示,其中,所述持续性话题检索库包括持续性话题和匹配资源的关联关系。
优选的,所述匹配资源显示模块包括:
匹配资源查询单元,用于在接收到用户点击的持续性话题时,在预先建立的持续性话题检索库中查询相应的匹配资源;
匹配资源排序单元,用于根据所述匹配资源的点击记录、资源属性和用户的历史行为,对所述匹配资源进行排序;
匹配资源推荐单元,用于按照排序结果,将所述匹配资源返回客户端显示。
优选的,所述话题匹配模块包括:
话题确定单元,根据用户的检索关键词,结合用户的历史行为和/或订阅记录,确定所述检索关键词的持续性话题;
话题排序单元,用于根据所述持续性话题的点击记录和用户的历史行为,对所述持续性话题进行排序。
优选的,还包括:
话题挖掘模块,用于在根据用户的检索关键词,结合用户的历史行为和/或订阅记录,为所述检索关键词匹配持续性话题之前,根据用户检索日志,挖掘出满足预设条件的用户查询作为持续性话题;
资源挖掘模块,用于根据预先配置网站和所述持续性话题的点击资源,建立资源库;
话题资源关联模块,用于建立所述持续性话题和所述资源库中的资源的关联,存入持续性话题检索库。
其中,所述预设条件优选包括:在第一预设天数内超过预设人数连续搜索第二预设天数,和/或包括预设关键词。
优选的,所述资源挖掘模块包括:
原始资源获取单元,用于获取所述预先配置网站中的资源和所述持续性话题的点击资源,作为原始资源;
资源字面去重单元,用于根据所述原始资源的标题和正文,对字面内容一致的原始资源进行去重,得到资源;
资源属性提取单元,用于提取所述资源的资源属性,所述资源属性包括标题、摘要、配图和价值得分;
资源库建立单元,用于将所述资源和对应的资源属性存入资源库。
优选的,所述话题资源关联模块包括:
词分布提取单元,用于分别提取所述持续性话题和所述资源的词分布,所述持续性话题的统计语料包括所述持续性话题的点击资源和所述资源库中标题包含所述持续性话题的资源;
话题处理单元,用于根据所述持续性话题的词分布和词向量特征,对所述持续性话题进行去重和聚类处理;
话题资源关联单元,用于建立处理后的持续性话题和资源的关联关系,存入持续性话题检索库;
资源词分布去重单元,用于根据持续性话题关联的资源的词分布,对处理后的持续性话题关联的资源进行去重。
优选的,所述话题处理单元具体用于:
根据所述持续性话题的词分布和词向量特征,计算所述持续性话题之间的相似度;
保留所述相似度大于第一预设阈值的持续性话题中的一个持续性话题;
将所述相似度大于第二预设阈值且小于或等于第一预设阈值的持续性话题归为一类。
优选的,所述话题资源关联单元具体用于:
对所述处理后的持续性话题建立词分布的倒排索引;
根据资源的词分布和所述倒排索引,确定与该资源对应的候选持续性话题;
计算该资源正文的词分布和所述候选持续性话题的词分布的相似度;
将所述相似度大于预设阈值的候选持续性话题作为与该资源关联的持续性话题,存入持续性话题检索库。
优选的,所述资源词分布去重单元具体用于:
采用流式比较的方式,当所述持续性话题关联的两个资源的相似度大于预设相似度阈值时,保留所述两个资源中价值得分较高的资源。
上述产品可执行本发明任意实施例所提供的方法,具备执行方法相应的功能模块和有益效果。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (24)

1.一种话题订阅方法,其特征在于,所述方法包括:
根据用户的检索关键词,结合用户的历史行为和/或订阅记录,为所述检索关键词匹配持续性话题;
将所述持续性话题返回客户端显示,以供所述用户进行订阅;
保存所述用户订阅的持续性话题,并在所述用户订阅的持续性话题对应的匹配资源有更新时,将更新的匹配资源推荐给用户。
2.根据权利要求1所述的方法,其特征在于,还包括:
根据所述用户的历史行为及持续性话题的订阅行为,确定向所述用户推荐的持续性话题并推荐给所述用户。
3.根据权利要求1所述的方法,其特征在于,还包括:
在接收到用户点击的持续性话题时,在预先建立的持续性话题检索库中查询相应的匹配资源,并返回客户端显示,其中,所述持续性话题检索库包括持续性话题和匹配资源的关联关系。
4.根据权利要求3所述的方法,其特征在于,在接收到用户点击的持续性话题时,在预先建立的持续性话题检索库中查询相应的匹配资源,并返回客户端显示包括:
在接收到用户点击的持续性话题时,在预先建立的持续性话题检索库中查询相应的匹配资源;
根据所述匹配资源的点击记录、资源属性和用户的历史行为,对所述匹配资源进行排序;
按照排序结果,将所述匹配资源返回客户端显示。
5.根据权利要求1所述的方法,其特征在于,根据用户的检索关键词,结合用户的历史行为和/或订阅记录,为所述检索关键词匹配持续性话题包括:
根据用户的检索关键词,结合用户的历史行为和/或订阅记录,确定所述检索关键词的持续性话题;
根据所述持续性话题的点击记录和用户的历史行为,对所述持续性话题进行排序。
6.根据权利要求1-5任一所述的方法,其特征在于,在根据用户的检索关键词,结合用户的历史行为和/或订阅记录,为所述检索关键词匹配持续性话题之前,还包括:
根据用户检索日志,挖掘出满足预设条件的用户查询作为持续性话题;
根据预先配置网站和所述持续性话题的点击资源,建立资源库;
建立所述持续性话题和所述资源库中的资源的关联,存入持续性话题检索库。
7.根据权利要求6所述的方法,其特征在于,所述预设条件包括:在第一预设天数内超过预设人数连续搜索第二预设天数,和/或包括预设关键词。
8.根据权利要求6所述的方法,其特征在于,根据预先配置网站和所述持续性话题的点击资源,建立资源库包括:
获取所述预先配置网站中的资源和所述持续性话题的点击资源,作为原始资源;
根据所述原始资源的标题和正文,对字面内容一致的原始资源进行去重,得到资源;
提取所述资源的资源属性,所述资源属性包括标题、摘要、配图和价值得分;
将所述资源和对应的资源属性存入资源库。
9.根据权利要求6所述的方法,其特征在于,建立所述持续性话题和所述资源库中的资源的关联,存入持续性话题检索库包括:
分别提取所述持续性话题和所述资源的词分布,所述持续性话题的统计语料包括所述持续性话题的点击资源和所述资源库中标题包含所述持续性话题的资源;
根据所述持续性话题的词分布和词向量特征,对所述持续性话题进行去重和聚类处理;
建立处理后的持续性话题和资源的关联关系,存入持续性话题检索库;
根据持续性话题关联的资源的词分布,对处理后的持续性话题关联的资源进行去重。
10.根据权利要求9所述的方法,其特征在于,根据所述持续性话题的词分布和词向量特征,对所述持续性话题进行去重和聚类处理包括:
根据所述持续性话题的词分布和词向量特征,计算所述持续性话题之间的相似度;
保留所述相似度大于第一预设阈值的持续性话题中的一个持续性话题;
将所述相似度大于第二预设阈值且小于或等于第一预设阈值的持续性话题归为一类。
11.根据权利要求9所述的方法,其特征在于,建立处理后的持续性话题和资源的关联关系,存入持续性话题检索库包括:
对所述处理后的持续性话题建立词分布的倒排索引;
根据资源的词分布和所述倒排索引,确定与该资源对应的候选持续性话题;
计算该资源正文的词分布和所述候选持续性话题的词分布的相似度;
将所述相似度大于预设阈值的候选持续性话题作为与该资源关联的持续性话题,存入持续性话题检索库。
12.根据权利要求9所述的方法,其特征在于,根据持续性话题关联的资源的词分布,对处理后的持续性话题关联的资源进行去重包括:
采用流式比较的方式,当所述持续性话题关联的两个资源的相似度大于预设相似度阈值时,保留所述两个资源中价值得分较高的资源。
13.一种话题订阅装置,其特征在于,所述装置包括:
话题匹配模块,用于根据用户的检索关键词,结合用户的历史行为和/或订阅记录,为所述检索关键词匹配持续性话题;
话题显示模块,用于将所述持续性话题返回客户端显示,以供所述用户进行订阅;
资源推荐模块,用于保存所述用户订阅的持续性话题,并在所述用户订阅的持续性话题对应的匹配资源有更新时,将更新的匹配资源推荐给用户。
14.根据权利要求13所述的装置,其特征在于,还包括:
话题推荐模块,用于根据所述用户的历史行为及持续性话题的订阅行为,确定向所述用户推荐的持续性话题并推荐给所述用户。
15.根据权利要求13所述的装置,其特征在于,还包括:
匹配资源显示模块,用于在接收到用户点击的持续性话题时,在预先建立的持续性话题检索库中查询相应的匹配资源,并返回客户端显示,其中,所述持续性话题检索库包括持续性话题和匹配资源的关联关系。
16.根据权利要求15所述的装置,其特征在于,所述匹配资源显示模块包括:
匹配资源查询单元,用于在接收到用户点击的持续性话题时,在预先建立的持续性话题检索库中查询相应的匹配资源;
匹配资源排序单元,用于根据所述匹配资源的点击记录、资源属性和用户的历史行为,对所述匹配资源进行排序;
匹配资源推荐单元,用于按照排序结果,将所述匹配资源返回客户端显示。
17.根据权利要求13所述的装置,其特征在于,所述话题匹配模块包括:
话题确定单元,用于根据用户的检索关键词,结合用户的历史行为和/或订阅记录,确定所述检索关键词的持续性话题;
话题排序单元,用于根据所述持续性话题的点击记录和用户的历史行为,对所述持续性话题进行排序。
18.根据权利要求13-17任一所述的装置,其特征在于,还包括:
话题挖掘模块,用于在根据用户的检索关键词,结合用户的历史行为和/或订阅记录,为所述检索关键词匹配持续性话题之前,根据用户检索日志,挖掘出满足预设条件的用户查询作为持续性话题;
资源挖掘模块,用于根据预先配置网站和所述持续性话题的点击资源,建立资源库;
话题资源关联模块,用于建立所述持续性话题和所述资源库中的资源的关联,存入持续性话题检索库。
19.根据权利要求18所述的装置,其特征在于,所述预设条件包括:在第一预设天数内超过预设人数连续搜索第二预设天数,和/或包括预设关键词。
20.根据权利要求18所述的装置,其特征在于,所述资源挖掘模块包括:
原始资源获取单元,用于获取所述预先配置网站中的资源和所述持续性话题的点击资源,作为原始资源;
资源字面去重单元,用于根据所述原始资源的标题和正文,对字面内容一致的原始资源进行去重,得到资源;
资源属性提取单元,用于提取所述资源的资源属性,所述资源属性包括标题、摘要、配图和价值得分;
资源库建立单元,用于将所述资源和对应的资源属性存入资源库。
21.根据权利要求18所述的装置,其特征在于,所述话题资源关联模块包括:
词分布提取单元,用于分别提取所述持续性话题和所述资源的词分布,所述持续性话题的统计语料包括所述持续性话题的点击资源和所述资源库中标题包含所述持续性话题的资源;
话题处理单元,用于根据所述持续性话题的词分布和词向量特征,对所述持续性话题进行去重和聚类处理;
话题资源关联单元,用于建立处理后的持续性话题和资源的关联关系,存入持续性话题检索库;
资源词分布去重单元,用于根据持续性话题关联的资源的词分布,对处理后的持续性话题关联的资源进行去重。
22.根据权利要求21所述的装置,其特征在于,所述话题处理单元具体用于:
根据所述持续性话题的词分布和词向量特征,计算所述持续性话题之间的相似度;
保留所述相似度大于第一预设阈值的持续性话题中的一个持续性话题;
将所述相似度大于第二预设阈值且小于或等于第一预设阈值的持续性话题归为一类。
23.根据权利要求21所述的装置,其特征在于,所述话题资源关联单元具体用于:
对所述处理后的持续性话题建立词分布的倒排索引;
根据资源的词分布和所述倒排索引,确定与该资源对应的候选持续性话题;
计算该资源正文的词分布和所述候选持续性话题的词分布的相似度;
将所述相似度大于预设阈值的候选持续性话题作为与该资源关联的持续性话题,存入持续性话题检索库。
24.根据权利要求21所述的装置,其特征在于,所述资源词分布去重单元具体用于:
采用流式比较的方式,当所述持续性话题关联的两个资源的相似度大于预设相似度阈值时,保留所述两个资源中价值得分较高的资源。
CN201610481888.4A 2016-06-27 2016-06-27 话题订阅方法和装置 Pending CN105930539A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201610481888.4A CN105930539A (zh) 2016-06-27 2016-06-27 话题订阅方法和装置
PCT/CN2016/097477 WO2018000569A1 (zh) 2016-06-27 2016-08-31 话题订阅方法、装置和存储介质
US16/234,337 US11429680B2 (en) 2016-06-27 2018-12-27 Topic subscription method and apparatus, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610481888.4A CN105930539A (zh) 2016-06-27 2016-06-27 话题订阅方法和装置

Publications (1)

Publication Number Publication Date
CN105930539A true CN105930539A (zh) 2016-09-07

Family

ID=56828203

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610481888.4A Pending CN105930539A (zh) 2016-06-27 2016-06-27 话题订阅方法和装置

Country Status (3)

Country Link
US (1) US11429680B2 (zh)
CN (1) CN105930539A (zh)
WO (1) WO2018000569A1 (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107122397A (zh) * 2017-03-15 2017-09-01 百度在线网络技术(北京)有限公司 内容推荐方法及装置
CN107346336A (zh) * 2017-06-29 2017-11-14 北京百度网讯科技有限公司 基于人工智能的信息处理方法和装置
WO2018000569A1 (zh) * 2016-06-27 2018-01-04 北京百度网讯科技有限公司 话题订阅方法、装置和存储介质
CN108305051A (zh) * 2018-02-09 2018-07-20 网易(杭州)网络有限公司 邮件展示方法、介质、系统和电子设备
CN109106352A (zh) * 2018-08-30 2019-01-01 缤刻普达(北京)科技有限责任公司 血压监控方法、系统及血压计
CN109582852A (zh) * 2018-12-05 2019-04-05 中国银行股份有限公司 一种全文检索结果的排序方法及系统
CN110472021A (zh) * 2018-05-11 2019-11-19 微软技术许可有限责任公司 会话中推荐新闻的技术
CN110737694A (zh) * 2019-09-17 2020-01-31 中电万维信息技术有限责任公司 一种政务数据资源目录智能订阅方法
CN112464084A (zh) * 2020-11-17 2021-03-09 崔海燕 基于大数据定位和人工智能的业务优化方法及云计算中心
CN112765464A (zh) * 2021-01-13 2021-05-07 中国地质大学(武汉) 面向主题的新内容检索推送方法、装置、设备及存储介质
WO2023098348A1 (zh) * 2021-12-01 2023-06-08 北京字节跳动网络技术有限公司 一种内容订阅方法、装置、计算机设备及存储介质

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110083774B (zh) * 2019-05-10 2023-11-03 腾讯科技(深圳)有限公司 应用推荐列表的确定方法、装置、计算机设备及存储介质
CN112784147A (zh) * 2019-11-04 2021-05-11 阿里巴巴集团控股有限公司 信息处理方法、装置、设备及系统
CN110955816B (zh) * 2019-11-08 2022-11-08 广州坚和网络科技有限公司 基于内容标签的聚合主题内容的方法
CN111680152B (zh) * 2020-06-10 2023-04-18 创新奇智(成都)科技有限公司 目标文本的摘要提取方法及装置、电子设备、存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102129452A (zh) * 2011-03-04 2011-07-20 李丽平 未来信息获取系统及获取方法
CN102945244A (zh) * 2012-09-24 2013-02-27 南京大学 基于句号特征字串的中文网页重复文档检测和过滤方法
CN103177024A (zh) * 2011-12-23 2013-06-26 微梦创科网络科技(中国)有限公司 一种话题信息展现方法和装置
CN103593418A (zh) * 2013-10-30 2014-02-19 中国科学院计算技术研究所 一种面向大数据的分布式主题发现方法及系统
CN104636402A (zh) * 2013-11-13 2015-05-20 阿里巴巴集团控股有限公司 一种业务对象的分类、搜索、推送方法和系统
CN104869439A (zh) * 2015-05-14 2015-08-26 无锡天脉聚源传媒科技有限公司 一种视频推送方法及装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10635723B2 (en) * 2004-02-15 2020-04-28 Google Llc Search engines and systems with handheld document data capture devices
US8010545B2 (en) * 2008-08-28 2011-08-30 Palo Alto Research Center Incorporated System and method for providing a topic-directed search
US8539359B2 (en) * 2009-02-11 2013-09-17 Jeffrey A. Rapaport Social network driven indexing system for instantly clustering people with concurrent focus on same topic into on-topic chat rooms and/or for generating on-topic search results tailored to user preferences regarding topic
CN103577478B (zh) * 2012-08-06 2015-07-29 腾讯科技(深圳)有限公司 网页推送方法及系统
CN103577501B (zh) * 2012-08-10 2019-03-19 深圳市世纪光速信息技术有限公司 热点话题搜索系统及热点话题搜索方法
US20140059452A1 (en) * 2012-08-24 2014-02-27 Chia Lung Kao Cumulative encyclopedia method,system and device
US10228819B2 (en) * 2013-02-04 2019-03-12 602531 British Cilumbia Ltd. Method, system, and apparatus for executing an action related to user selection
US20140280241A1 (en) * 2013-03-15 2014-09-18 MediaGraph, LLC Methods and Systems to Organize Media Items According to Similarity
US9767099B2 (en) * 2013-09-12 2017-09-19 Zappylab, Inc. System and method for dynamic interaction with a research publication database
CN105930539A (zh) * 2016-06-27 2016-09-07 北京百度网讯科技有限公司 话题订阅方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102129452A (zh) * 2011-03-04 2011-07-20 李丽平 未来信息获取系统及获取方法
CN103177024A (zh) * 2011-12-23 2013-06-26 微梦创科网络科技(中国)有限公司 一种话题信息展现方法和装置
CN102945244A (zh) * 2012-09-24 2013-02-27 南京大学 基于句号特征字串的中文网页重复文档检测和过滤方法
CN103593418A (zh) * 2013-10-30 2014-02-19 中国科学院计算技术研究所 一种面向大数据的分布式主题发现方法及系统
CN104636402A (zh) * 2013-11-13 2015-05-20 阿里巴巴集团控股有限公司 一种业务对象的分类、搜索、推送方法和系统
CN104869439A (zh) * 2015-05-14 2015-08-26 无锡天脉聚源传媒科技有限公司 一种视频推送方法及装置

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018000569A1 (zh) * 2016-06-27 2018-01-04 北京百度网讯科技有限公司 话题订阅方法、装置和存储介质
US11429680B2 (en) 2016-06-27 2022-08-30 Beijing Baidu Netcom Science And Technology Co., Ltd. Topic subscription method and apparatus, and storage medium
CN107122397A (zh) * 2017-03-15 2017-09-01 百度在线网络技术(北京)有限公司 内容推荐方法及装置
CN107346336A (zh) * 2017-06-29 2017-11-14 北京百度网讯科技有限公司 基于人工智能的信息处理方法和装置
US11620321B2 (en) 2017-06-29 2023-04-04 Beijing Baidu Netcom Science And Technology Co., Ltd. Artificial intelligence based method and apparatus for processing information
CN108305051A (zh) * 2018-02-09 2018-07-20 网易(杭州)网络有限公司 邮件展示方法、介质、系统和电子设备
CN110472021A (zh) * 2018-05-11 2019-11-19 微软技术许可有限责任公司 会话中推荐新闻的技术
CN109106352A (zh) * 2018-08-30 2019-01-01 缤刻普达(北京)科技有限责任公司 血压监控方法、系统及血压计
CN109582852B (zh) * 2018-12-05 2021-04-09 中国银行股份有限公司 一种全文检索结果的排序方法及系统
CN109582852A (zh) * 2018-12-05 2019-04-05 中国银行股份有限公司 一种全文检索结果的排序方法及系统
CN110737694A (zh) * 2019-09-17 2020-01-31 中电万维信息技术有限责任公司 一种政务数据资源目录智能订阅方法
CN110737694B (zh) * 2019-09-17 2022-09-23 中电万维信息技术有限责任公司 一种政务数据资源目录智能订阅方法
CN112464084A (zh) * 2020-11-17 2021-03-09 崔海燕 基于大数据定位和人工智能的业务优化方法及云计算中心
CN112765464A (zh) * 2021-01-13 2021-05-07 中国地质大学(武汉) 面向主题的新内容检索推送方法、装置、设备及存储介质
WO2023098348A1 (zh) * 2021-12-01 2023-06-08 北京字节跳动网络技术有限公司 一种内容订阅方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
US11429680B2 (en) 2022-08-30
US20190155856A1 (en) 2019-05-23
WO2018000569A1 (zh) 2018-01-04

Similar Documents

Publication Publication Date Title
CN105930539A (zh) 话题订阅方法和装置
US20220020056A1 (en) Systems and methods for targeted advertising
CN106156127B (zh) 选择数据内容向终端推送的方法及装置
US8977644B2 (en) Collaborative search results
US9305113B2 (en) Contextual query revision
CN103823844B (zh) 社区问答服务中基于主客观上下文的问题转发系统和方法
US10255353B2 (en) Individualized detailed program recommendations with active updating of viewer preferences
US10180979B2 (en) System and method for generating suggestions by a search engine in response to search queries
US20230281664A1 (en) Serving advertisements based on partial queries
US8452760B2 (en) Relevancy presentation apparatus, method, and program
US20070143176A1 (en) Advertising keyword cross-selling
CN103455487B (zh) 一种搜索词的提取方法及装置
WO2009006234A2 (en) Automatic video recommendation
TW200917070A (en) System and method to facilitate matching of content to advertising information in a network
CN109597904A (zh) 用于提供社交网络的方法和系统
US8812602B2 (en) Identifying conversations in a social network system having relevance to a first file
CN104685495A (zh) 一种从多个微博中自动生成信息丰富的内容的系统和方法,每个微博仅包含稀疏信息
US20130262593A1 (en) Identifying message threads of a message storage system having relevance to a first file
Chiny et al. Netflix recommendation system based on TF-IDF and cosine similarity algorithms
US9141629B2 (en) Identifying video files of a video file storage system having relevance to a first file
CN103164472A (zh) 在社交网络系统中对用户生成内容的处理方法和装置
CN106021430A (zh) 基于Lucence自定义词库的全文检索匹配方法及系统
Liao et al. Improving farm management optimization: Application of text data analysis and semantic networks
Zhao et al. Research on recommendation algorithms based on collaborative filtering
Prando et al. Modular Architecture for Recommender Systems Applied in a Brazilian e-Commerce.

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160907