CN104391843A - 文件推荐系统及方法 - Google Patents

文件推荐系统及方法 Download PDF

Info

Publication number
CN104391843A
CN104391843A CN201310360154.7A CN201310360154A CN104391843A CN 104391843 A CN104391843 A CN 104391843A CN 201310360154 A CN201310360154 A CN 201310360154A CN 104391843 A CN104391843 A CN 104391843A
Authority
CN
China
Prior art keywords
sample
user
file
reading
users
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310360154.7A
Other languages
English (en)
Inventor
强振雄
林奇玲
李建纬
李宜臻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jetta Software (shenzhen) Co Ltd
Hon Hai Precision Industry Co Ltd
Original Assignee
Jetta Software (shenzhen) Co Ltd
Hon Hai Precision Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jetta Software (shenzhen) Co Ltd, Hon Hai Precision Industry Co Ltd filed Critical Jetta Software (shenzhen) Co Ltd
Priority to CN201310360154.7A priority Critical patent/CN104391843A/zh
Priority to TW102129996A priority patent/TW201508508A/zh
Priority to US14/460,724 priority patent/US20150052141A1/en
Publication of CN104391843A publication Critical patent/CN104391843A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/11File system administration, e.g. details of archiving or snapshots
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/06Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]

Abstract

本发明提供一种文件推荐方法,该方法利用聚类演算法将用户划分为不同的群组,相同群组内的所有用户阅读的文件进行互相推荐。该方法包括:将文件解析为具有标题和正文的文字信息,并对文字信息进行断词和过滤断词结果;收集所有用户在一段时间内的阅读行为,每个用户作为一个采样样本,计算每个用户在该时间段内的阅读习惯和标题词的频数;根据聚类演算法对所有样本进行演算,将所有样本划分为不同群组;根据用户所在群组,将同群组内所有用户阅读的文件进行相互推荐。此外,本发明还提供一种文件推荐系统。

Description

文件推荐系统及方法
技术领域
本发明涉及文字采矿和信息挖掘技术,尤其涉及一种文件推荐系统及方法。
背景技术
借助于互联网的快速普及,人们每天通过网络可以浏览各种信息资讯。然而信息资讯日益膨胀,庞大的信息量反而会导致人们无法从过多的网页或文件中快速筛选到符合个人需求的信息。
目前大多数的新闻门户网站或是资讯类系统,根据用户已经阅读的网页或是文件中的关键词,利用关键词找出该用户的阅读需求以推送出相关新闻或文件。该方法是分析单一用户的阅读行为,以关键词作为推送的依据,推送的新闻或文件具有一定局限性。
发明内容
鉴于上述内容,有必要提供一种文件推荐系统及方法,可以充分利用并分析所有用户的阅读行为,划分用户群组,以群组为依据推送文件给用户。
所述文件推荐系统,该系统包括:文本处理模块,用于将文件解析为具有标题和正文的文字信息,并对文字信息进行断词和过滤断词结果;样本采集模块,用于收集所有用户在一段时间内的阅读行为,每个用户作为一个采样样本,计算每个用户在该时间段内的阅读习惯和标题词的频数;群组划分模块,用于根据聚类演算法对所有样本进行演算,将所有样本划分为不同群组;及文件推荐模块,用于根据用户所在群组,将同群组内所有用户阅读的文件进行相互推荐。
所述文件推荐方法,该方法包括步骤:将文件解析为具有标题和正文的文字信息,并对文字信息进行断词和过滤断词结果;收集所有用户在一段时间内的阅读行为,每个用户作为一个采样样本,计算每个用户在该时间段内的阅读习惯和标题词的频数;根据聚类演算法对所有样本进行演算,将所有样本划分为不同群组;根据用户所在群组,将同群组内所有用户阅读的文件进行相互推荐。
相比于现有技术,本发明中所述文件推荐系统及方法,分析所有用户的阅读行为,利用聚类演算法将所有用户划分为不同群组且不同群组存在明显差异,相同群组内的所有用户阅读的文件进行互相推荐。
附图说明
图1是本发明所述文件推荐系统的较佳实施例的运行环境图。
图2是本发明所述文件推荐系统的较佳实施例的功能模块图。
图3是本发明所述文件推荐方法的方法流程图。
图4是本发明中文件断词表的示意图。
图5是对所有用户一段时间内的阅读行为采样后的样本示意图。
主要元件符号说明
服务器 1
数据库 2
用户终端设备 3
文件推荐系统 10
处理器 20
存储器 30
文本处理模块 101
样本采集模块 102
群组划分模块 103
文件推荐模块 104
定期更新模块 105
如下具体实施方式结合上述附图进一步说明本发明的技术方案。
具体实施方式
参阅图1所示,是本发明所述文件推荐系统的较佳实施例的运行环境图。所述文件推荐系统10运行于服务器1中。所述服务器1通过互联网或是局域网与一个数据库2和多个用户终端3进行通讯连接。所述服务器1是一个应用程序服务器,提供网络服务和应用程序服务,处理用户终端3发送的服务请求等。所述数据库2用于存储文件、断词词库和常用词词库以及和各类表数据等。所述用户终端3可以是个人电脑或是平板电脑等。所述断词词库和常用词词库是所述文件推荐系统10对数据库中的文件进行断词和过滤断词结果时的参照词库。
本较佳实施例中,所述服务器1提供一个文件阅读平台(例如新闻门户网站),用户注册该平台后,可以自由阅读各类文件等。
参阅图2所示,是本发明所述文件推荐系统的较佳实施例的功能模块图。所述文件推荐系统10的程序代码存储于服务器1的存储器30中,由处理器20控制执行。所述文件推荐系统10包括多个程序代码组成的功能模块:文本处理模块101、样本采集模块102、群组划分模块103、文件推荐模块104及定期更新模块105。所述功能模块是完成特定功能的程序段,比程序更适合描述软件在处理器中的执行过程。以下结合图3方法流程图,进一步详细说明各模块的功能。
本较佳实施例中,所述文件推荐系统10基于EM聚类演算法(Expectation Maximization Algorithm,期望最大化算法)实现了基于群组的协同式文件推荐。所述协同式文件推荐是指,将所有用户划分为不同的群组,相同群组内的某个用户阅读的文件可以推荐给该群组内的其他用户。
参阅图3所示,是本发明所述文件推荐方法的方法流程图。
步骤S01,文本处理模块101将文件解析为具有文件标题和文字正文的结构性的文字信息,采用混合式断词法对解析后的文字信息断词并过滤断词结果中无任何意义的词或常用词。
所述文件可以是网页、Word文件、PDF文件或是文本文件等。所述文件解析是用于剔除文件中非文字的内容,例如当文件为网页时,剔除网页原始文件中的网页标签或是其他脚本语言等,当文件为含图片的Word文件或是PDF文件时,剔除其中的图片等。所述混合式断词法是指结合词库式断词和统计式断词法将文字内容断开为具有语法意义的有限多个关键词。所述过滤断词结果是指剔除断词结果中无意义的词和常用词,例如,“的”、“吗”等无意义的词和例如“我们”、“今天”、“非常”等人称、时间和程度等性质的常用词。
本较佳实施例中,服务器1设定文本处理的周期性排程,选择每天用户访问量不多的某几个时段,将数据库中新增的文件进行解析并断词。文本处理模块101对每个文件的断词结果以图4所示的文件断词表存储,标题和正文经断词及过滤后的每个词都以逗点隔开存储在该表格中的标题断词和正文断词的栏位中。
步骤S02,样本采集模块102收集每个用户在一个时间段(如60天内)的阅读行为,以每个用户作为一个采样单位,计算每个用户在该时间段内的阅读习惯和所有标题词的频数,保存所有用户采样的样本。
本较佳实施例中,服务器1会记录每个用户每次登陆文件阅读平台后的所有阅读行为(也称之为历史记录)。所述阅读行为包括用户ID、登陆时间、阅读文件ID、文件字数、阅读时间(即阅读文件的时间点,如12:00等)、阅读时长(即阅读文件的时长且以分钟为单位计时)、退出时间等信息。所述文件ID为区分文件的唯一标识。
本较佳实施例中,所述阅读习惯包括三个习惯变量,分别是:用户平均每日阅读时长、平均每日阅读时段和平均阅读速度。所述平均每日阅读时长为用户一段时间内(如60天内)阅读时长累加的平均值。所述平均每日阅读时段是指用户平均每天阅读文件的时段,该时段值分为上午、中午、晚上,分别取数字1、2、3表示。所述平均每日阅读时段的计算过程如下:指定各时间段的时间区间,例如06:00~12:00为上午时段、12:00~18:00为中午时段、18:00~06:00为晚上时段;汇总用户一段时间内(如60天内)各时段阅读文件的篇数;根据汇总结果,选取阅读文件篇数最多的时段作为用户在该时间段内的平均每日阅读时段。所述平均阅读速度是指用户每分钟阅读字数,汇总用户在一段时间内(如60天内)阅读的所有文件的总字数和阅读文件总时长,总字数与总时长的比值即为用户在该时间段内的平均阅读速度。
所述的标题词是指文件的标题经过断词及过滤后的各个词。所述的标题词的频数是指用户在一个时间段内(如60天内)阅读的文件中,标题词在该时间段内阅读的所有文件的标题中出现的次数。本较佳实施例中,根据每个用户在一个时间段内的阅读行为并结合文件的断词结果,汇总计算每个用户在该时间段内所有标题词的频数。
需要说明的是,所述阅读习惯并不仅限于上述的三个习惯变量,可根据不同实施例进行设定,如阅读习惯还可包括平均阅读篇数、累计阅读时长等,需注意的是设定阅读习惯所包括的习惯变量时必须要明确定义该变量量化为数值的计算过程。
以下结合图5所示的所有用户样本的示意图,具体说明采样过程:
a)汇总一个时间段内(如60天内)所有用户阅读文件的所有标题词作为所有样本的标题词特征,如图5中每个样本包括标题词1至标题词k的k个标题词特征,即阅读平台上的所有用户在该时间段内(如60天内)阅读文件的所有标题词为标题关键词1至标题关键词k;
b)计算每个样本的所有标题词特征的特征值(或称为“标题词特征值”),每个标题词特征的特征值为该用户在该时间段内(如60天内)阅读的文件中该标题词的频数,若用户在该时间段内阅读的所有文件的标题中均未出现某标题词,则该标题词的频数为0,相应的该标题词特征的特征值为0,如图5所示,样本1的标题词1的特征值f11为在60天内用户1阅读文件中标题词1的频数,样本2的标题词1的特征值f21为用户2在60天内阅读所有文件中标题词1的频数;
c)以每个用户的阅读习惯的各习惯变量作为样本的习惯特征,计算每个用户在该时间段内各习惯变量的变量值,作为每个样本中对应习惯特征的特征值,如图5所示,样本1中习惯特征1的特征值b11为用户1在60天内的平均阅读时长,样本2中习惯特征1的特征值b21为用户2在60天内的平均阅读时长;
d)保存所有用户采样的样本,该样本包括有用户ID、标题词特征的特征值和习惯特征的特征值。
步骤S03,群组划分模块103通过EM聚类演算法对所有样本进行迭代演算,将所有样本划分为有限多个类别以实现对用户分群。
本较佳实施例中,利用微软公司的SSAS(SQL Server Analysis Service,SSAS)中实现EM聚类演算法的聚类分析模型对所有样本进行聚类演算,实现分群。
利用该聚类分析模型进行分群的具体过程为:设定隐含聚类数,本较佳实施例中设定该聚类数为4,即所有样本聚类成4个簇(cluster);将所有样本作为EM聚类演算法的输入;对所有样本进行迭代运算并输出最终的聚类结果。经EM聚类演算法对所有用户分群后,每个用户则分属于不同的群组且仅属于一个群组中。
需要说明的是,由于设定的聚类数、用户样本采样的时间段的长短或样本特征都会影响到分群的效果,在具体实施过程中,需要反复多次设定不同的聚类数或不同的采样时间段(如30天、60天等)或不同的样本特征(如取消计算习惯特征中的平均阅读时段等),验证每次的分群结果,选取各群组间最具差异性的分群结果的设定作为最优的设定,以便后续依据该设定定期更新用户分群群组。
本较佳实施例中,可通过以下两种方法进行验证分群结果的优劣:
方法1:根据分群结果,选取某个样本特征作为衡量依据,计算各群组内所有用户该样本特征的平均特征值,比较各群组样本特征的平均特征值的差异,若存在明显差异,则分群结果较佳;
方法2:基于方差分析(Analysis of Variance)的思想,计算各群组内的组内差异SSE(Sum of Squares Error,误差项离差平方和),该值越小表示群组内用户的一致性高,分群效果较佳。
本较佳实施例中,利用EM聚类演算法对所有用户进行群组划分,以实现基于群组的协同式推荐。在其他实施例中可以利用K-means演算法或Clara演算法等其他聚类演算法对采样后的用户样本进行聚类演算,划分为不同用户群组。
步骤S04,文件推荐模块104根据分群结果将同一群组内各用户所阅读的文件进行相互推荐。
本较佳实施例中,当某个用户在阅读文件平台上阅读了某个文件后,则文件推荐模块104查找该用户所属的群组,将该文件推送给该查找到的群组内的其他用户。
步骤S05,定期更新模块105设定周期性的群组更新排程,每间隔一定时间周期(如60天),抓取该时间周期内的所有用户的阅读行为,重新进行采样和群组划分。
每个用户随着时间推移,各自的阅读习惯也会有所改变,此外,使用阅读文件平台的用户也会有增减,因此,本较佳实施例中,定期更新模块105设定了周期性的排程,重新执行步骤S02、S03,以根据阅读文件平台中当前所有用户在最近一段时间段内的阅读行为进行重新采样和分群。本较佳实施例中,设定相隔60天的事件执行群组更新排程,在执行排程时,抓取前60天内的所有用户的阅读行为进行采样和分群。
最后需要指出,以上较佳实施例仅用于说明本发明的技术方案而非限制,尽管参照以上较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,都不应脱离本发明的精神和范围。

Claims (8)

1.一种文件推荐系统,运行于服务器中,其特征在于,该系统包括:
文本处理模块:用于将文件解析为具有标题和正文的文字信息,并对文字信息进行断词和过滤断词结果;
样本采集模块:用于收集所有用户在一段时间内的阅读行为,每个用户作为一个采样样本,计算每个用户在该时间段内的阅读习惯和标题词的频数;
群组划分模块:用于根据聚类演算法对所有样本进行演算,将所有样本划分为不同群组;及
文件推荐模块:用于根据用户所在群组,将同群组内所有用户阅读的文件进行相互推荐。
2.如权利要求1所述的文件推荐系统,其特征在于,该系统还包括一个定期更新模块,用于设定周期性的群组更新排程,每间隔一定时间周期,抓取该时间周期内的所有用户的阅读行为,重新采样及利用聚类演算法对采样样本重新进行群组划分。
3.如权利要求1所述的文件推荐系统,其特征在于,所述样本采集模块通过如下方式进行采样:
汇总所有用户在一个时间段内阅读文件的所有标题词作为样本的标题词特征;
以每个用户作为采样单位,计算每个用户在该时间段内阅读文件中各标题词的频数,作为每个样本中对应标题词特征的特征值;
以每个用户的阅读习惯的各习惯变量作为样本的习惯特征,计算每个用户在该时间段内各习惯变量的变量值,作为每个样本中对应习惯特征的特征值;
保存所有用户采样的样本,该样本包括用户ID、标题词特征的特征值和习惯特征的特征值。
4.如权利要求3所述的文件推荐系统,其特征在于,所述阅读习惯的习惯变量包括:平均每日阅读时长、平均每日阅读时段和平均阅读速度。
5.一种文件推荐方法,其特征在于,该方法包括:
文本处理步骤:将文件解析为具有标题和正文的文字信息,并对文字信息进行断词和过滤断词结果;
样本采集步骤:收集所有用户在一段时间内的阅读行为,每个用户作为一个采样样本,计算每个用户在该时间段内的阅读习惯和标题词的频数;
群组划分步骤:根据聚类演算法对所有样本进行演算,将所有样本划分为不同群组;及
文件推荐步骤:根据用户所在群组,将同群组内所有用户阅读的文件进行相互推荐。
6.如权利要求5所述的文件推荐方法,其特征在于,该方法还包括定期更新步骤:设定周期性的群组更新排程,每间隔一定时间周期,抓取该时间周期内的所有用户的阅读行为,重新采样及利用聚类演算法对采样样本重新进行群组划分。
7.如权利要求5所述的文件推荐方法,其特征在于,所述样本采集步骤包括:
汇总所有用户在一个时间段内阅读文件的所有标题词作为样本的标题词特征;
以每个用户作为采样单位,计算每个用户在该时间段内阅读文件中各标题词的频数,作为每个样本中对应标题词特征的特征值;
以每个用户的阅读习惯的各习惯变量作为样本的习惯特征,计算每个用户在该时间段内各习惯变量的变量值,作为每个样本中对应习惯特征的特征值;
保存所有用户采样的样本,该样本包括用户ID、标题词特征的特征值和习惯特征的特征值。
8.如权利要求7所述的文件推荐方法,其特征在于,所述阅读习惯的习惯变量包括平均每日阅读时长、平均每日阅读时段和平均阅读速度。
CN201310360154.7A 2013-08-19 2013-08-19 文件推荐系统及方法 Pending CN104391843A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201310360154.7A CN104391843A (zh) 2013-08-19 2013-08-19 文件推荐系统及方法
TW102129996A TW201508508A (zh) 2013-08-19 2013-08-22 文檔推薦系統及方法
US14/460,724 US20150052141A1 (en) 2013-08-19 2014-08-15 Electronic device and method for transmitting files

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310360154.7A CN104391843A (zh) 2013-08-19 2013-08-19 文件推荐系统及方法

Publications (1)

Publication Number Publication Date
CN104391843A true CN104391843A (zh) 2015-03-04

Family

ID=52467581

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310360154.7A Pending CN104391843A (zh) 2013-08-19 2013-08-19 文件推荐系统及方法

Country Status (3)

Country Link
US (1) US20150052141A1 (zh)
CN (1) CN104391843A (zh)
TW (1) TW201508508A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106126621A (zh) * 2016-06-22 2016-11-16 腾讯科技(深圳)有限公司 文章推荐方法和装置
CN106372098A (zh) * 2015-07-24 2017-02-01 三星Sds株式会社 反映用户模式的文件提供方法及其装置
CN106383887A (zh) * 2016-09-22 2017-02-08 深圳市博安达信息技术股份有限公司 一种环保新闻数据采集和推荐展示的方法及系统
CN107690638A (zh) * 2015-06-07 2018-02-13 苹果公司 提供推荐同时保持用户隐私的具有个性化馈源的阅读器应用程序和方法
WO2020181479A1 (en) * 2019-03-12 2020-09-17 Citrix Systems, Inc. Intelligent file recommendation engine

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI676110B (zh) * 2018-08-21 2019-11-01 良知股份有限公司 以讀者為中心進行文章分析的語意特徵分析系統
CN112465658A (zh) * 2020-10-30 2021-03-09 中国石油天然气集团有限公司 自媒体文件用户粘度的确定方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101576928A (zh) * 2009-06-11 2009-11-11 腾讯科技(深圳)有限公司 一种相关文章的选取方法和装置
CN101685458A (zh) * 2008-09-27 2010-03-31 华为技术有限公司 一种基于协同过滤的推荐方法和系统
CN102956009A (zh) * 2011-08-16 2013-03-06 阿里巴巴集团控股有限公司 一种基于用户行为的电子商务信息推荐方法与装置
CN103198418A (zh) * 2013-03-15 2013-07-10 北京亿赞普网络技术有限公司 一种应用推荐方法和系统

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2003233859A1 (en) * 2002-04-10 2003-10-27 Accenture Global Services Gmbh Determination of attributes based on product descriptions
US6915297B2 (en) * 2002-05-21 2005-07-05 Bridgewell, Inc. Automatic knowledge management system
US7698170B1 (en) * 2004-08-05 2010-04-13 Versata Development Group, Inc. Retail recommendation domain model
US20070168350A1 (en) * 2006-01-17 2007-07-19 Tom Utiger Management of non-traditional content repositories
US8065254B1 (en) * 2007-02-19 2011-11-22 Google Inc. Presenting a diversity of recommendations
US8549497B2 (en) * 2008-05-05 2013-10-01 University Of New Brunswick High-level hypermedia synthesis for adaptive web
US8468158B2 (en) * 2008-11-06 2013-06-18 Yahoo! Inc. Adaptive weighted crawling of user activity feeds
US20150095145A1 (en) * 2009-03-25 2015-04-02 Matthew A. Shulman Advertisement effectiveness measurement
US9225772B2 (en) * 2011-09-26 2015-12-29 Knoa Software, Inc. Method, system and program product for allocation and/or prioritization of electronic resources
US8965830B2 (en) * 2012-05-17 2015-02-24 Xerox Corporation Systems and methods for self-adaptive episode mining under the threshold using delay estimation and temporal division
US20140074649A1 (en) * 2012-09-13 2014-03-13 Coupons.Com Incorporated Grocery recommendation engine

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101685458A (zh) * 2008-09-27 2010-03-31 华为技术有限公司 一种基于协同过滤的推荐方法和系统
CN101576928A (zh) * 2009-06-11 2009-11-11 腾讯科技(深圳)有限公司 一种相关文章的选取方法和装置
CN102956009A (zh) * 2011-08-16 2013-03-06 阿里巴巴集团控股有限公司 一种基于用户行为的电子商务信息推荐方法与装置
CN103198418A (zh) * 2013-03-15 2013-07-10 北京亿赞普网络技术有限公司 一种应用推荐方法和系统

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107690638A (zh) * 2015-06-07 2018-02-13 苹果公司 提供推荐同时保持用户隐私的具有个性化馈源的阅读器应用程序和方法
CN107690638B (zh) * 2015-06-07 2022-01-04 苹果公司 提供推荐同时保持用户隐私的具有个性化馈源的阅读器应用程序和方法
CN106372098A (zh) * 2015-07-24 2017-02-01 三星Sds株式会社 反映用户模式的文件提供方法及其装置
CN106126621A (zh) * 2016-06-22 2016-11-16 腾讯科技(深圳)有限公司 文章推荐方法和装置
CN106383887A (zh) * 2016-09-22 2017-02-08 深圳市博安达信息技术股份有限公司 一种环保新闻数据采集和推荐展示的方法及系统
CN106383887B (zh) * 2016-09-22 2023-04-07 深圳博沃智慧科技有限公司 一种环保新闻数据采集和推荐展示的方法及系统
WO2020181479A1 (en) * 2019-03-12 2020-09-17 Citrix Systems, Inc. Intelligent file recommendation engine
CN113557503A (zh) * 2019-03-12 2021-10-26 思杰系统有限公司 智能文件推荐引擎
US11500816B2 (en) 2019-03-12 2022-11-15 Citrix Systems, Inc. Intelligent file recommendation engine

Also Published As

Publication number Publication date
TW201508508A (zh) 2015-03-01
US20150052141A1 (en) 2015-02-19

Similar Documents

Publication Publication Date Title
CN104391843A (zh) 文件推荐系统及方法
US11580104B2 (en) Method, apparatus, device, and storage medium for intention recommendation
CN107862022B (zh) 文化资源推荐系统
KR101463974B1 (ko) 마케팅을 위한 빅데이터 분석 시스템 및 방법
CN103914478B (zh) 网页训练方法及系统、网页预测方法及系统
CN101477554A (zh) 基于用户兴趣的个性化元搜索引擎及搜索结果处理方法
WO2015035864A1 (en) Method, apparatus and system for data analysis
CN108874812B (zh) 一种数据处理方法及服务器、计算机存储介质
CN112307762B (zh) 搜索结果的排序方法及装置、存储介质、电子装置
CN111914159B (zh) 一种信息推荐方法及终端
US10467255B2 (en) Methods and systems for analyzing reading logs and documents thereof
CN106228178A (zh) 网络用户行为预测系统
CN109299740A (zh) 一种逻辑回归模型的构建方法及系统
CN104536830A (zh) 一种基于MapReduce的KNN文本分类方法
CN112765150A (zh) 大数据异构融合提取方法及装置
CN109526027B (zh) 一种小区容量优化方法、装置、设备及计算机存储介质
CN103946840A (zh) 非监督检测及在文本数据中字簇集的分类
CN111027771A (zh) 景区客流量预估方法、系统、装置及可存储介质
CN110598126A (zh) 基于行为习惯的跨社交网络用户身份识别方法
CN104376021A (zh) 文件推荐系统及方法
CN115062013A (zh) 信息推荐方法、装置、设备及存储介质
CN113408207A (zh) 基于社会网络分析技术的数据挖掘的一种方法
KR101718599B1 (ko) 소셜 미디어 데이터 분석 시스템 및 이를 이용한 소셜 미디어 데이터 분석 방법
CN112818215A (zh) 产品数据的处理方法、装置、设备及存储介质
CN113641654B (zh) 一种基于实时事件的营销处置规则引擎方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20150304

WD01 Invention patent application deemed withdrawn after publication