CN112632398A - 一种基于数据采集的社区热门信息推荐系统 - Google Patents

一种基于数据采集的社区热门信息推荐系统 Download PDF

Info

Publication number
CN112632398A
CN112632398A CN202110038429.XA CN202110038429A CN112632398A CN 112632398 A CN112632398 A CN 112632398A CN 202110038429 A CN202110038429 A CN 202110038429A CN 112632398 A CN112632398 A CN 112632398A
Authority
CN
China
Prior art keywords
information
retrieval
click
recommendation
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110038429.XA
Other languages
English (en)
Inventor
赵其峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Tianyuandike Data Technology Co ltd
Original Assignee
Wuhan Tianyuandike Data Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Tianyuandike Data Technology Co ltd filed Critical Wuhan Tianyuandike Data Technology Co ltd
Priority to CN202110038429.XA priority Critical patent/CN112632398A/zh
Publication of CN112632398A publication Critical patent/CN112632398A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • G06F16/24534Query rewriting; Transformation
    • G06F16/24539Query rewriting; Transformation using cached or materialised query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于数据采集的社区热门信息推荐系统,包括检索信息采集模块、点击信息采集模块、数据接收模块、数据处理模块、总控模块与信息展示模块;所述检索信息采集模块用于采集大众的检索记录信息与单个用户的检索记录信息,所述点击信息采集模块用于采集社区所有信息的点击次数信息与个人用户的点击内容信息;所述数据接收模块用于接收大众的检索记录信息、单个用户的检索记录信息、所有信息的点击次数信息与个人用户的点击内容信息,并将大众的检索记录信息、单个用户的检索记录信息、所有信息的点击次数信息与个人用户的点击内容信息发送到数据处理模块进行处理。本发明能够更好进行社区热门信息推荐,更加值得推广使用。

Description

一种基于数据采集的社区热门信息推荐系统
技术领域
本发明涉及热门推荐领域,具体涉及一种基于数据采集的社区热门信息推荐系统。
背景技术
热门,比喻兴盛的、吸引人注意力的事物,如热门商品。现引申到网络,比喻在网络上引起人们很大关注、兴趣的事件(物),如新闻信息、帖子、电影、事件等,热门信息,即关注度高大众感兴趣度高的信息,在进行热门信息推荐时,即需要使用到热门信息推荐系统。
现有的热门信息推荐系统,在使用过程中,采集数据较为单一,导致推荐的热门信息不符合大众和个人的需求,给人们信息推荐系统的使用带来了一定的影响,因此,提出一种基于数据采集的社区热门信息推荐系统。
发明内容
本发明所要解决的技术问题在于:如何解决现有的热门信息推荐系统,在使用过程中,采集数据较为单一,导致推荐的热门信息不符合大众和个人的需求,给人们信息推荐系统的使用带来了一定的影响的问题,提供了一种基于数据采集的社区热门信息推荐系统。
本发明是通过以下技术方案解决上述技术问题的,本发明包括检索信息采集模块、点击信息采集模块、数据接收模块、数据处理模块、总控模块与信息展示模块;
所述检索信息采集模块用于采集大众的检索记录信息与单个用户的检索记录信息,所述点击信息采集模块用于采集社区所有信息的点击次数信息与个人用户的点击内容信息;
所述数据接收模块用于接收大众的检索记录信息、单个用户的检索记录信息、所有信息的点击次数信息与个人用户的点击内容信息,并将大众的检索记录信息、单个用户的检索记录信息、所有信息的点击次数信息与个人用户的点击内容信息发送到数据处理模块进行处理;
所述数据处理模块对大众的检索记录信息、单个用户的检索记录信息、所有信息的点击次数信息与个人用户的点击内容信息进行处理,所述数据处理模块对大众的检索记录信息进行处理生成大众检索推荐信息,所述数据处理模块对单个用户的检索记录信息与个人用户的点击内容信息进行处理生成个人推荐信息,所述数据处理模块对所有信息的点击次数信息进行处理生成大众点击推荐信息;
所述大众检索推荐信息、个人推荐信息与大众点击推荐信息均被发送到总控模块,所述总控模块控制信息展示模块将检索推荐信息、个人推荐信息与大众点击推荐信息展示在信息展示模块的首页上。
优选的,所述数据处理模块处理出大众检索推荐信息的具体处理过程如下:
步骤一:提取出所有用户的检索记录,记录下相同内容的检索次数,并设置检索阈值M;
步骤二:从获取到的用户检索记录中提取出检索次数大于检索阈值M的信息,将其标记为Ki;
步骤三:将检索次数大于检索阈值M的信息Ki按照检索次数进行从大到小的排序,提取出检索次数最多的前三个检索信息Kmax、Kmax-1和Kmax-2为大众检索推荐信息。
优选的,所述数据处理模块处理出大众点击推荐信息的具体过程如下:提取出所有信息的点击次数信息,记录下每个内容的点击次数,并提取出各个信息的日期信息,将距离提取日前x日的信息提取出,并将其按照点击次数进行从多到少的排名,提取出点击次数最多点击信息为大众点击推荐信息。
优选的,数据处理模块对单个用户的检索记录信息与个人用户的点击内容信息进行处理生成个人推荐信息的具体过程如下:
S1:提取出个用户的检索记录信息对应的内容种类信息,将其标记为P,再提取出个人用户的点击内容信息获取到其种类信息,将其标记为T;
S2:提取出用户的检索记录信息对应的内容种类信息P,通过公式
Figure BDA0002894304940000031
得到对应的内容种类信息P对应的推荐指数W1ij,其中N1(i)为P,N1j为检索P的用户数量信息,提取出W1ij最大的检索信息为个人推荐信息;
S3:提取出用户的点击内容信息获取到其种类信息T,通过公式
Figure BDA0002894304940000032
得到的内容种类信息T对应的推荐指数W2ij,其中N2(i)为T,N1j为点击T的用户数量信息,提取出W2ij最大的点击信息为个人推荐信息。
本发明相比现有技术具有以下优点:该基于数据采集的社区热门信息推荐系统,能够通过对大众检索数据、大众点击数据和个人检索数据与个人电机数据进行分析处理,从而生成对应的大众检索推荐信息、大众点击信息与个人推荐信息,该种设置,不仅实现了对大众数据的分析推荐,还能够更好针对不同的个人生成不同个人推荐,满足了使用者的不同使用需求,让该系统能够更好的社区热门信息推荐,让该系统更加值得推广使用。
附图说明
图1是本发明的系统框图。
具体实施方式
下面对本发明的实施例作详细说明,本实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
如图1所示,本实施例提供一种技术方案:一种基于数据采集的社区热门信息推荐系统,包括检索信息采集模块、点击信息采集模块、数据接收模块、数据处理模块、总控模块与信息展示模块;
所述检索信息采集模块用于采集大众的检索记录信息与单个用户的检索记录信息,所述点击信息采集模块用于采集社区所有信息的点击次数信息与个人用户的点击内容信息;
所述数据接收模块用于接收大众的检索记录信息、单个用户的检索记录信息、所有信息的点击次数信息与个人用户的点击内容信息,并将大众的检索记录信息、单个用户的检索记录信息、所有信息的点击次数信息与个人用户的点击内容信息发送到数据处理模块进行处理;
所述数据处理模块对大众的检索记录信息、单个用户的检索记录信息、所有信息的点击次数信息与个人用户的点击内容信息进行处理,所述数据处理模块对大众的检索记录信息进行处理生成大众检索推荐信息,所述数据处理模块对单个用户的检索记录信息与个人用户的点击内容信息进行处理生成个人推荐信息,所述数据处理模块对所有信息的点击次数信息进行处理生成大众点击推荐信息;
所述大众检索推荐信息、个人推荐信息与大众点击推荐信息均被发送到总控模块,所述总控模块控制信息展示模块将检索推荐信息、个人推荐信息与大众点击推荐信息展示在信息展示模块的首页上。
所述数据处理模块处理出大众检索推荐信息的具体处理过程如下:
步骤一:提取出所有用户的检索记录,记录下相同内容的检索次数,并设置检索阈值M;
步骤二:从获取到的用户检索记录中提取出检索次数大于检索阈值M的信息,将其标记为Ki;
步骤三:将检索次数大于检索阈值M的信息Ki按照检索次数进行从大到小的排序,提取出检索次数最多的前三个检索信息Kmax、Kmax-1和Kmax-2为大众检索推荐信息。
所述数据处理模块处理出大众点击推荐信息的具体过程如下:提取出所有信息的点击次数信息,记录下每个内容的点击次数,并提取出各个信息的日期信息,将距离提取日前x日的信息提取出,并将其按照点击次数进行从多到少的排名,提取出点击次数最多点击信息为大众点击推荐信息。
数据处理模块对单个用户的检索记录信息与个人用户的点击内容信息进行处理生成个人推荐信息的具体过程如下:
S1:提取出个用户的检索记录信息对应的内容种类信息,将其标记为P,再提取出个人用户的点击内容信息获取到其种类信息,将其标记为T;
S2:提取出用户的检索记录信息对应的内容种类信息P,通过公式
Figure BDA0002894304940000051
得到对应的内容种类信息P对应的推荐指数W1ij,其中N1(i)为P,N1j为检索P的用户数量信息,提取出W1ij最大的检索信息为个人推荐信息;
S3:提取出用户的点击内容信息获取到其种类信息T,通过公式
Figure BDA0002894304940000061
得到的内容种类信息T对应的推荐指数W2ij,其中N2(i)为T,N1j为点击T的用户数量信息,提取出W2ij最大的点击信息为个人推荐信息。
综上,本发明在使用时,检索信息采集模块会采集大众的检索记录信息与单个用户的检索记录信息,点击信息采集模块会采集社区所有信息的点击次数信息与个人用户的点击内容信息,数据接收模块会接收大众的检索记录信息、单个用户的检索记录信息、所有信息的点击次数信息与个人用户的点击内容信息,并将大众的检索记录信息、单个用户的检索记录信息、所有信息的点击次数信息与个人用户的点击内容信息发送到数据处理模块进行处理,数据处理模块对大众的检索记录信息、单个用户的检索记录信息、所有信息的点击次数信息与个人用户的点击内容信息进行处理,数据处理模块对大众的检索记录信息进行处理生成大众检索推荐信息,数据处理模块对单个用户的检索记录信息与个人用户的点击内容信息进行处理生成个人推荐信息,数据处理模块对所有信息的点击次数信息进行处理生成大众点击推荐信息,大众检索推荐信息、个人推荐信息与大众点击推荐信息均被发送到总控模块,总控模块控制信息展示模块将检索推荐信息、个人推荐信息与大众点击推荐信息展示在信息展示模块的首页上。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (4)

1.一种基于数据采集的社区热门信息推荐系统,其特征在于,包括检索信息采集模块、点击信息采集模块、数据接收模块、数据处理模块、总控模块与信息展示模块;
所述检索信息采集模块用于采集大众的检索记录信息与单个用户的检索记录信息,所述点击信息采集模块用于采集社区所有信息的点击次数信息与个人用户的点击内容信息;
所述数据接收模块用于接收大众的检索记录信息、单个用户的检索记录信息、所有信息的点击次数信息与个人用户的点击内容信息,并将大众的检索记录信息、单个用户的检索记录信息、所有信息的点击次数信息与个人用户的点击内容信息发送到数据处理模块进行处理;
所述数据处理模块对大众的检索记录信息、单个用户的检索记录信息、所有信息的点击次数信息与个人用户的点击内容信息进行处理,所述数据处理模块对大众的检索记录信息进行处理生成大众检索推荐信息,所述数据处理模块对单个用户的检索记录信息与个人用户的点击内容信息进行处理生成个人推荐信息,所述数据处理模块对所有信息的点击次数信息进行处理生成大众点击推荐信息;
所述大众检索推荐信息、个人推荐信息与大众点击推荐信息均被发送到总控模块,所述总控模块控制信息展示模块将检索推荐信息、个人推荐信息与大众点击推荐信息展示在信息展示模块的首页上。
2.根据权利要求1所述的一种基于数据采集的社区热门信息推荐系统,其特征在于:所述数据处理模块处理出大众检索推荐信息的具体处理过程如下:
步骤一:提取出所有用户的检索记录,记录下相同内容的检索次数,并设置检索阈值M;
步骤二:从获取到的用户检索记录中提取出检索次数大于检索阈值M的信息,将其标记为Ki;
步骤三:将检索次数大于检索阈值M的信息Ki按照检索次数进行从大到小的排序,提取出检索次数最多的前三个检索信息Kmax、Kmax-1和Kmax-2为大众检索推荐信息。
3.根据权利要求1所述的一种基于数据采集的社区热门信息推荐系统,其特征在于:所述数据处理模块处理出大众点击推荐信息的具体过程如下:提取出所有信息的点击次数信息,记录下每个内容的点击次数,并提取出各个信息的日期信息,将距离提取日前x日的信息提取出,并将其按照点击次数进行从多到少的排名,提取出点击次数最多点击信息为大众点击推荐信息。
4.根据权利要求1所述的一种基于数据采集的社区热门信息推荐系统,其特征在于:所述数据处理模块对处理生成个人推荐信息的具体过程如下:
S1:提取出个用户的检索记录信息对应的内容种类信息,将其标记为P,再提取出个人用户的点击内容信息获取到其种类信息,将其标记为T;
S2:提取出用户的检索记录信息对应的内容种类信息P,通过公式
Figure FDA0002894304930000021
得到对应的内容种类信息P对应的推荐指数W1ij,其中N1(i)为P,N1j为检索P的用户数量信息,提取出W1ij最大的检索信息为个人推荐信息;
S3:提取出用户的点击内容信息获取到其种类信息T,通过公式
Figure FDA0002894304930000022
得到的内容种类信息T对应的推荐指数W2ij,其中N2(i)为T,N1j为点击T的用户数量信息,提取出W2ij最大的点击信息为个人推荐信息。
CN202110038429.XA 2021-01-12 2021-01-12 一种基于数据采集的社区热门信息推荐系统 Pending CN112632398A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110038429.XA CN112632398A (zh) 2021-01-12 2021-01-12 一种基于数据采集的社区热门信息推荐系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110038429.XA CN112632398A (zh) 2021-01-12 2021-01-12 一种基于数据采集的社区热门信息推荐系统

Publications (1)

Publication Number Publication Date
CN112632398A true CN112632398A (zh) 2021-04-09

Family

ID=75294580

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110038429.XA Pending CN112632398A (zh) 2021-01-12 2021-01-12 一种基于数据采集的社区热门信息推荐系统

Country Status (1)

Country Link
CN (1) CN112632398A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6493702B1 (en) * 1999-05-05 2002-12-10 Xerox Corporation System and method for searching and recommending documents in a collection using share bookmarks
CN104991962A (zh) * 2015-07-22 2015-10-21 无锡天脉聚源传媒科技有限公司 一种生成推荐信息的方法及装置
CN110232586A (zh) * 2019-05-05 2019-09-13 浙江华坤道威数据科技有限公司 一种基于大数据的广告推送系统
CN110517112A (zh) * 2019-08-20 2019-11-29 合肥英泽信息科技有限公司 一种基于大数据的智能导购处理系统
CN111143692A (zh) * 2019-12-31 2020-05-12 亳州职业技术学院 基于用户需求的药膳推荐电子商务平台

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6493702B1 (en) * 1999-05-05 2002-12-10 Xerox Corporation System and method for searching and recommending documents in a collection using share bookmarks
CN104991962A (zh) * 2015-07-22 2015-10-21 无锡天脉聚源传媒科技有限公司 一种生成推荐信息的方法及装置
CN110232586A (zh) * 2019-05-05 2019-09-13 浙江华坤道威数据科技有限公司 一种基于大数据的广告推送系统
CN110517112A (zh) * 2019-08-20 2019-11-29 合肥英泽信息科技有限公司 一种基于大数据的智能导购处理系统
CN111143692A (zh) * 2019-12-31 2020-05-12 亳州职业技术学院 基于用户需求的药膳推荐电子商务平台

Similar Documents

Publication Publication Date Title
US7451161B2 (en) Compatibility scoring of users in a social network
CN104754413B (zh) 基于图像搜索识别电视信号并推荐信息的方法和设备
JP5105802B2 (ja) 情報処理装置
KR100886767B1 (ko) 지유아이 검색 서비스 제공 방법 및 시스템
US9195679B1 (en) Method and system for the contextual display of image tags in a social network
CN102054003B (zh) 网络信息推荐、建立网络资源索引的方法及系统
US20090259606A1 (en) Diversified, self-organizing map system and method
CN110430476A (zh) 直播间搜索方法、系统、计算机设备和存储介质
JP2010067175A (ja) ハイブリッド型コンテンツ推薦サーバ、推薦システムおよび推薦方法
CN101763597A (zh) 基于信息定制推送的农村信息化服务平台及其运行方法
CN103001994B (zh) 好友推荐方法及装置
CN101739407A (zh) 自动构建用于相关信息浏览的信息组织结构的方法和系统
CN102880712A (zh) 一种用于对搜索的网络视频进行排序的方法和系统
CN103780677A (zh) 信息分类推送的方法及系统
CN105378730A (zh) 社交媒体分析与输出
CN104111935A (zh) 一种推送微博的方法及系统、服务器
KR101682659B1 (ko) 키워드 기반 맞춤 뉴스 알림 방법 및 그를 위한 뉴스 검색 관리 서버
CN104933135A (zh) 一种多媒体数据的聚类方法及装置
CN107958070B (zh) 一种基于用户偏好的个性化消息推送方法
US20090157670A1 (en) Contents-retrieving apparatus and method
CN112015972A (zh) 一种信息推荐方法、装置、电子设备以及存储介质
JP2013092911A (ja) 情報処理装置、情報処理方法、および、プログラム
JP2000242652A (ja) 情報潮流検索方法、装置、および情報潮流検索プログラムを記録した記録媒体
JP2012038333A (ja) 情報処理装置
CN112632398A (zh) 一种基于数据采集的社区热门信息推荐系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210409

RJ01 Rejection of invention patent application after publication