CN111858915A - 基于标签相似度的信息推荐方法及系统 - Google Patents

基于标签相似度的信息推荐方法及系统 Download PDF

Info

Publication number
CN111858915A
CN111858915A CN202010789845.9A CN202010789845A CN111858915A CN 111858915 A CN111858915 A CN 111858915A CN 202010789845 A CN202010789845 A CN 202010789845A CN 111858915 A CN111858915 A CN 111858915A
Authority
CN
China
Prior art keywords
news
user
similarity
label
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010789845.9A
Other languages
English (en)
Inventor
李冬芬
何菊兰
刘明哲
王惠明
唐小川
王林平
钟豪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Univeristy of Technology
Original Assignee
Chengdu Univeristy of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Univeristy of Technology filed Critical Chengdu Univeristy of Technology
Priority to CN202010789845.9A priority Critical patent/CN111858915A/zh
Publication of CN111858915A publication Critical patent/CN111858915A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了基于标签相似度的信息推荐方法及系统,方法包括:新闻标签向量化,获取新闻源数据并进行新闻预处理,提取出每个新闻的标签,采用词袋模型生成对应的新闻的标签向量;用户属性向量化,从用户属性表中获取用户属性,并生成对应用户的属性向量;相似度计算,基于相似度计算模型,得到与每个用户的属性最相近的若干个新闻作为推荐候选集;热度排序,采用新闻热度排序的方式选出热度最高的N个新闻作为最终候选集,并写入推荐候选表。本发明还提供基于标签相似度的信息推荐系统,用于实现上述推荐方法。通过本方案能根据用户的属性和行为进行向量化分析处理,将热度最高且符合用户属性的新闻推荐给用户,解决推荐系统冷启动的问题。

Description

基于标签相似度的信息推荐方法及系统
技术领域
本发明涉及文章推荐技术领域,尤其涉及基于标签相似度的信息推荐方法及系统。
背景技术
随着信息技术和互联网的发展,人们逐渐从信息匮乏的时代走入了信息过载的时代。与此同时,无论是信息消费者还是信息生产者都遇到了很大的挑战:对于信息消费者,从海量信息中寻找到自己感兴趣的信息是一件非常困难的事; 对于信息生产者,让自己生产的信息脱颖而出,受到用户的广泛关注,也是一件十分困难的事情。新闻是信息的重要载体之一,随着互联网的发展,浏览网络上即时发布的新闻成为人们获取信息的重要手段。而新闻推荐系统或新闻推荐装置就是解决这个矛盾的重要工具。它的任务是联系用户和信息,既帮助用户发现对自己有价值的信息,又让信息能够展现在对它感兴趣的用户面前,实现信息消费者和生产者的双赢。
当前的信息推荐系统虽然能根据用户的兴趣为用户提供个性化的信息推荐服务,但是不能很好的解决推荐系统冷启动的问题。
发明内容
本发明的目的在于克服现有技术的不足,提供基于标签相似度的信息推荐方法及系统,能根据用户的属性和行为进行向量化分析处理,将热度最高且符合用户属性的新闻推荐给用户,解决了推荐系统冷启动的问题。
本发明的目的是通过以下技术方案来实现的:
基于标签相似度的信息推荐方法,包括以下步骤:
S1,新闻标签向量化,获取新闻源数据并进行新闻预处理,提取出每个新闻的标签,采用词袋模型生成对应的新闻的标签向量;
S2,用户属性向量化,从用户属性表中获取用户属性,并生成对应用户的属性向量;
S3,相似度计算,基于相似度计算模型,得到与每个用户的属性最相近的若干个新闻作为推荐候选集;
S4,热度排序,采用新闻热度排序的方式选出热度最高的N个新闻作为最终候选集,并写入推荐候选表。
具体的,所述步骤S1中新闻预处理过程具体包括以下子步骤:
S101,利用爬虫机制并发从新闻数据库中爬取出半结构化或纯文本新闻源数据,并进行数据清洗和组织,生成结构化数据;
S102,采用TF-IDF算法对结构化数据进行关键字提取,将提取出的关键词进行重复检测,并作为每篇新闻的标签生成预处理后的新闻数据存入数据库中。
具体的,所述步骤S3中相似度计算过程具体包括:将用户自定义的标签作为该用户的兴趣表征,遍历新闻列表,采用余弦相似度的计算得到用户和新闻标签的相似距离,若相似距离超过设定阈值,则将新闻加入到推荐候选集中,直至所有新闻数据遍历完成。
具体的,所述采用余弦相似度的计算得到用户和新闻标签的相似距离过程具体包括:
S301,定义标签类别,首先对可能出现的新闻标签进行所属类别定义;
S302,添加标签,通过用户自定义标签和文章关键字提取,分别为用户和新闻添加标签;
S303,标签向量化,采用oneHot编码的方式将用户和新闻标签编码为向量形式,将定义的所有标签设定为一个向量中的一位,对于用户或新闻中如果包含某个标签,那么对应向量中的那一位标签置为1,否则置为0;
S304,利用余弦相似度函数计算所有标签向量中每两个标签向量之间夹角的余弦值,值越大相似度越高。
基于标签相似度的信息推荐系统,包括
新闻预处理模块,用于从各个新闻源中爬取新闻信息,并对获取的新闻数据进行数据清洗和去重,生成结构化数据;
向量化模块,用于对结构化的新闻数据进行标签向量化,同时对用户属性进行向量化,获得对应的新闻的标签向量和用户的属性向量;
相似度计算模块,用于根据新闻的标签向量和用户的属性向量进行相似度计算,将与每个用户的属性最相近的新闻作为推荐候选集;
热度排序模块,用于根据热度排序算法从推荐候选集中选出热度最高的N个新闻作为最终候选集,并写入推荐候选表;
新闻推荐模块,用于根据推荐候选表中的新闻ID,在新闻数据库中进行匹配,得到对应的新闻内容数据,反馈给用户。
本发明的有益效果:本方案能在用户初始访问时提供标签选择界面,根据用户的选择结果调用基于标签推荐的算法生成输出推荐结果,解决了现有新闻推荐系统的冷启动问题。
附图说明
图1是本发明的方法流程图。
图2是本发明的标签推荐功能数据图。
图3是本发明的新闻预处理流程图。
图4是本发明的标签推荐生成流程图。
图5是本发明的系统功能模块图。
具体实施方式
为了对本发明的技术特征、目的和效果有更加清楚的理解,现对照附图说明本发明的具体实施方式。
本实施例中,如图1所示,基于标签相似度的信息推荐方法,主要包括以下步骤:
步骤1,新闻标签向量化,获取新闻源数据并进行新闻预处理,提取出每个新闻的标签,采用词袋模型生成对应的新闻的标签向量;
步骤2,用户属性向量化,从用户属性表中获取用户属性,并生成对应用户的属性向量;
步骤3,相似度计算,基于相似度计算模型,得到与每个用户的属性最相近的若干个新闻作为推荐候选集;
步骤4,热度排序,采用新闻热度排序的方式选出热度最高的N个新闻作为最终候选集,并写入推荐候选表。
如图2所示,基于标签推荐功能主要包括新闻标签向量化、用户属性向量化、相似度计算和热度排序四个子功能。这里采用基于标签的推荐是为了解决冷启动问题,为初始用户提供基于初始化标签的推荐。从数据库中获取新闻数据,并提取出每个新闻的标签,采用词袋模型生成对应新闻的标签向量;同样从用户属性表(在用户体验功能部分生成)中获取用户属性,并生成对应用户的属性向量;然后经过相似度计算模型,得到与每个用户的属性最相近的若干个新闻作为推荐候选集;这里为了避免生成过多推荐候选集,采用新闻热度排序的方式选出热度最高的N个新闻作为最终候选集,并写入推荐候选表。
其中,在进行新闻标签向量化的操作之前,还需对新闻数据进行预处理,新闻预处理过程主要利用爬虫获取实时新闻和文本数据预处理,使用的核心算法包含文本处理算法(数据清洗、关键字提取和重复检测),如图3所示,具体预处理过程如下:首先客户端输入想要获取的新闻源名称和url作为新闻源信息输入。系统需要判断数据库中是否有该新闻源的新闻输入,若不存在则为该新闻源创建一张表;若存在则调用爬虫机制进行新闻爬取。爬取后的新闻数据经过数据清洗、关键字提取和重复检测等机制,最终被存储到系统数据库中,作为系统的数据来源。
爬虫采用scrapy框架进行爬取。在爬取新闻的过程中,可能会遇到IP检测、代理重复访问、cookies封锁和ajax异步传输等问题,使得对于某些新闻网站无法正常获取数据。具体的解决方案包括:
针对IP检测问题,首先爬取免费代理网站的IP,利用状态码返回值来检测IP的可用性,最终生成一个可用代理IP列表。
针对代理重复访问的问题,采用随机User-Agent的方式,利用fake_useragent库,伪装请求头。
针对cookies封锁,采取禁用cookies,COOKIES_ENABLED = False的方式。
针对ajax异步传输,在浏览器开发者界面选择network标签,再次刷新,我们会发现异步请求的文件展现在name文件列表,找到它之后获取headers中的url并向其发送post请求即可爬取信息。
新闻预处理结束后,进行新闻标签向量化操作,如图4所示,将用户自定义的标签作为该用户的兴趣表征,遍历新闻列表,采用余弦相似度的计算得到用户和新闻标签的相似距离,若相似距离超过设定阈值,则将新闻加入到推荐候选集中,直至所有新闻数据遍历完成。由于这样计算完成后,可能会造成某些用户的推荐结果过多,因此这里采用热度排序的方式,选出匹配度最高的10个新闻作为最终推荐。
其中,余弦相似度算法通过计算在同一个向量空间中两个向量的夹角余弦值,来表征两个个体(用向量表示)之间差异距离的大小。具体来说就是,如果得出的余弦值越接近1,那么夹角就越接近0,这样的结果就能够说明两个向量越相似;反之亦然。
本方法将利用余弦相似度计算的方法来基于标签来计算用户和新闻之间的相似程度,具体计算过程包括四个步骤:1、定义标签类别,首先对可能出现的新闻标签进行所属类别定义。
2、添加标签,通过用户自定义标签和文章关键字提取,分别为用户和新闻添加标签。3、标签向量化,采用oneHot编码的方式将用户和新闻标签编码为向量形式,将定义的所有标签设定为一个向量中的一位,对于用户或新闻中如果包含某个标签,那么对应向量中的那一位标签置为1,否则置为0。4、利用余弦相似度函数计算所有标签向量中每两个标签向量之间夹角的余弦值,值越大相似度越高。
本实施例中,如图5所示,基于标签相似度的信息推荐系统,主要包括新闻预处理模块、向量化模块、相似度计算模块、热度排序模块和新闻推荐模块。其中,新闻预处理模块,用于从各个新闻源中爬取新闻信息,并对获取的新闻数据进行数据清洗和去重,生成结构化数据。向量化模块,用于对结构化的新闻数据进行标签向量化,同时对用户属性进行向量化,获得对应的新闻的标签向量和用户的属性向量。相似度计算模块,用于根据新闻的标签向量和用户的属性向量进行相似度计算,将与每个用户的属性最相近的新闻作为推荐候选集。热度排序模块,用于根据热度排序算法从推荐候选集中选出热度最高的N个新闻作为最终候选集,并写入推荐候选表。新闻推荐模块,用于根据推荐候选表中的新闻ID,在新闻数据库中进行匹配,得到对应的新闻内容数据,反馈给用户。
本实施例中,系统中的新闻预处理模块的主要作用是从第三方库爬取新闻源数据,并进行新闻内容的清洗和深度分析,最终输出为经过预处理的结构化新闻数据。接口设计包括向外提供爬虫接口和新闻输出接口,由系统内核调用并连接数据库。
向量化模块和相似度计算模块的主要作用是分别从数据库和用户属性表中提取新闻标签和用户属性,并将其向量化,经过余弦相似度的计算得出与该用户属性最相近的新闻推荐。其接口设计包括调用数据库和用户属性表两个数据接口;向外提供基于标签的推荐候选表接口,由用户调用。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护的范围由所附的权利要求书及其等效物界定。

Claims (5)

1.基于标签相似度的信息推荐方法,其特征在于,包括以下步骤:
S1,新闻标签向量化,获取新闻源数据并进行新闻预处理,提取出每个新闻的标签,采用词袋模型生成对应的新闻的标签向量;
S2,用户属性向量化,从用户属性表中获取用户属性,并生成对应用户的属性向量;
S3,相似度计算,基于相似度计算模型,得到与每个用户的属性最相近的若干个新闻作为推荐候选集;
S4,热度排序,采用新闻热度排序的方式选出热度最高的N个新闻作为最终候选集,并写入推荐候选表。
2.根据权利要求1所述的基于标签相似度的信息推荐方法,其特征在于,所述步骤S1中新闻预处理过程具体包括以下子步骤:
S101,利用爬虫机制并发从新闻数据库中爬取出半结构化或纯文本新闻源数据,并进行数据清洗和组织,生成结构化数据;
S102,采用TF-IDF算法对结构化数据进行关键字提取,将提取出的关键词进行重复检测,并作为每篇新闻的标签生成预处理后的新闻数据存入数据库中。
3.根据权利要求1所述的基于标签相似度的信息推荐方法,其特征在于,所述步骤S3中相似度计算过程具体包括:将用户自定义的标签作为该用户的兴趣表征,遍历新闻列表,采用余弦相似度的计算得到用户和新闻标签的相似距离,若相似距离超过设定阈值,则将新闻加入到推荐候选集中,直至所有新闻数据遍历完成。
4.根据权利要求3所述的基于标签相似度的信息推荐方法,其特征在于,所述采用余弦相似度的计算得到用户和新闻标签的相似距离过程具体包括:
S301,定义标签类别,首先对可能出现的新闻标签进行所属类别定义;
S302,添加标签,通过用户自定义标签和文章关键字提取,分别为用户和新闻添加标签;
S303,标签向量化,采用oneHot编码的方式将用户和新闻标签编码为向量形式,将定义的所有标签设定为一个向量中的一位,对于用户或新闻中如果包含某个标签,那么对应向量中的那一位标签置为1,否则置为0;
S304,利用余弦相似度函数计算所有标签向量中每两个标签向量之间夹角的余弦值,值越大相似度越高。
5.基于标签相似度的信息推荐系统,其特征在于,包括
新闻预处理模块,用于从各个新闻源中爬取新闻信息,并对获取的新闻数据进行数据清洗和去重,生成结构化数据;
向量化模块,用于对结构化的新闻数据进行标签向量化,同时对用户属性进行向量化,获得对应的新闻的标签向量和用户的属性向量;
相似度计算模块,用于根据新闻的标签向量和用户的属性向量进行相似度计算,将与每个用户的属性最相近的新闻作为推荐候选集;
热度排序模块,用于根据热度排序算法从推荐候选集中选出热度最高的N个新闻作为最终候选集,并写入推荐候选表;
新闻推荐模块,用于根据推荐候选表中的新闻ID,在新闻数据库中进行匹配,得到对应的新闻内容数据,反馈给用户。
CN202010789845.9A 2020-08-07 2020-08-07 基于标签相似度的信息推荐方法及系统 Pending CN111858915A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010789845.9A CN111858915A (zh) 2020-08-07 2020-08-07 基于标签相似度的信息推荐方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010789845.9A CN111858915A (zh) 2020-08-07 2020-08-07 基于标签相似度的信息推荐方法及系统

Publications (1)

Publication Number Publication Date
CN111858915A true CN111858915A (zh) 2020-10-30

Family

ID=72972376

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010789845.9A Pending CN111858915A (zh) 2020-08-07 2020-08-07 基于标签相似度的信息推荐方法及系统

Country Status (1)

Country Link
CN (1) CN111858915A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112231593A (zh) * 2020-12-15 2021-01-15 上海朝阳永续信息技术股份有限公司 一种金融资讯智能推荐系统
CN112579896A (zh) * 2020-12-16 2021-03-30 中国平安人寿保险股份有限公司 一种信息推荐方法、装置、电子设备及存储介质
CN112685516A (zh) * 2021-01-12 2021-04-20 上海微问家信息技术有限公司 一种多路召回推荐方法、装置、电子设备及介质
CN112765480A (zh) * 2021-04-12 2021-05-07 腾讯科技(深圳)有限公司 一种信息推送方法、装置及计算机可读存储介质
CN115271851A (zh) * 2022-07-04 2022-11-01 天翼爱音乐文化科技有限公司 一种视频彩铃推荐方法、系统、电子设备及存储介质

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104156450A (zh) * 2014-08-15 2014-11-19 同济大学 一种基于用户网络数据的物品信息推荐方法
CN106599174A (zh) * 2016-12-12 2017-04-26 国云科技股份有限公司 一种新闻实时推荐系统及其方法
CN107025310A (zh) * 2017-05-17 2017-08-08 长春嘉诚信息技术股份有限公司 一种自动实时新闻推荐方法
CN107943812A (zh) * 2017-05-24 2018-04-20 成都明途科技有限公司 为用户集中整合资源的新闻推荐方法
CN108875092A (zh) * 2018-08-22 2018-11-23 成都理工大学 一种基于协方差的商品推荐方法
CN109062994A (zh) * 2018-07-04 2018-12-21 平安科技(深圳)有限公司 推荐方法、装置、计算机设备和存储介质
CN109948040A (zh) * 2017-12-04 2019-06-28 北京京东尚科信息技术有限公司 对象信息的存储、推荐方法及系统、设备和存储介质
CN110147499A (zh) * 2019-05-21 2019-08-20 智者四海(北京)技术有限公司 打标签方法、推荐方法及记录介质
CN111104606A (zh) * 2019-12-06 2020-05-05 成都理工大学 一种基于权重的条件游走图推荐方法
CN111259143A (zh) * 2020-01-15 2020-06-09 山东劳动职业技术学院(山东劳动技师学院) 一种基于lda模型的新闻自动标签方法
CN111428138A (zh) * 2020-03-26 2020-07-17 中国建设银行股份有限公司 一种课程推荐方法、系统、设备及存储介质

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104156450A (zh) * 2014-08-15 2014-11-19 同济大学 一种基于用户网络数据的物品信息推荐方法
CN106599174A (zh) * 2016-12-12 2017-04-26 国云科技股份有限公司 一种新闻实时推荐系统及其方法
CN107025310A (zh) * 2017-05-17 2017-08-08 长春嘉诚信息技术股份有限公司 一种自动实时新闻推荐方法
CN107943812A (zh) * 2017-05-24 2018-04-20 成都明途科技有限公司 为用户集中整合资源的新闻推荐方法
CN109948040A (zh) * 2017-12-04 2019-06-28 北京京东尚科信息技术有限公司 对象信息的存储、推荐方法及系统、设备和存储介质
CN109062994A (zh) * 2018-07-04 2018-12-21 平安科技(深圳)有限公司 推荐方法、装置、计算机设备和存储介质
CN108875092A (zh) * 2018-08-22 2018-11-23 成都理工大学 一种基于协方差的商品推荐方法
CN110147499A (zh) * 2019-05-21 2019-08-20 智者四海(北京)技术有限公司 打标签方法、推荐方法及记录介质
CN111104606A (zh) * 2019-12-06 2020-05-05 成都理工大学 一种基于权重的条件游走图推荐方法
CN111259143A (zh) * 2020-01-15 2020-06-09 山东劳动职业技术学院(山东劳动技师学院) 一种基于lda模型的新闻自动标签方法
CN111428138A (zh) * 2020-03-26 2020-07-17 中国建设银行股份有限公司 一种课程推荐方法、系统、设备及存储介质

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112231593A (zh) * 2020-12-15 2021-01-15 上海朝阳永续信息技术股份有限公司 一种金融资讯智能推荐系统
CN112579896A (zh) * 2020-12-16 2021-03-30 中国平安人寿保险股份有限公司 一种信息推荐方法、装置、电子设备及存储介质
CN112685516A (zh) * 2021-01-12 2021-04-20 上海微问家信息技术有限公司 一种多路召回推荐方法、装置、电子设备及介质
CN112765480A (zh) * 2021-04-12 2021-05-07 腾讯科技(深圳)有限公司 一种信息推送方法、装置及计算机可读存储介质
CN112765480B (zh) * 2021-04-12 2021-06-18 腾讯科技(深圳)有限公司 一种信息推送方法、装置及计算机可读存储介质
CN115271851A (zh) * 2022-07-04 2022-11-01 天翼爱音乐文化科技有限公司 一种视频彩铃推荐方法、系统、电子设备及存储介质
CN115271851B (zh) * 2022-07-04 2023-10-10 天翼爱音乐文化科技有限公司 一种视频彩铃推荐方法、系统、电子设备及存储介质

Similar Documents

Publication Publication Date Title
US11314823B2 (en) Method and apparatus for expanding query
Yuan et al. Video summarization by learning deep side semantic embedding
Zhao et al. Connecting social media to e-commerce: Cold-start product recommendation using microblogging information
US8352396B2 (en) Systems and methods for improving web site user experience
CN111858915A (zh) 基于标签相似度的信息推荐方法及系统
US8370358B2 (en) Tagging content with metadata pre-filtered by context
US7917514B2 (en) Visual and multi-dimensional search
US9910930B2 (en) Scalable user intent mining using a multimodal restricted boltzmann machine
US10210179B2 (en) Dynamic feature weighting
KR102281186B1 (ko) 검색 결과에 대한 애니메이션 스니핏
US8393002B1 (en) Method and system for testing an entity
US8909703B2 (en) System and computer program product for facilitating a real-time virtual interaction
CN109145280A (zh) 信息推送的方法和装置
US9665647B2 (en) System and method for indexing mobile applications
CN109241403B (zh) 项目推荐方法、装置、机器设备和计算机可读存储介质
CN107526718B (zh) 用于生成文本的方法和装置
CN110069713B (zh) 一种基于用户上下文感知的个性化推荐方法
US20170316100A1 (en) Retrieval of Content Using Link-Based Search
WO2014158834A1 (en) Identifying salient items in documents
CN113039539A (zh) 使用ai模型推荐来扩展搜索引擎能力
JP2010072727A (ja) 履歴処理装置、履歴処理方法および履歴処理プログラム
US20130230248A1 (en) Ensuring validity of the bookmark reference in a collaborative bookmarking system
TWI680666B (zh) 網路使用者身份辨識方法與系統
Kherwa et al. Data preprocessing: A milestone of web usage mining
US9530094B2 (en) Jabba-type contextual tagger

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20201030