CN107203588A - 一种数据分类管理系统 - Google Patents
一种数据分类管理系统 Download PDFInfo
- Publication number
- CN107203588A CN107203588A CN201710267478.4A CN201710267478A CN107203588A CN 107203588 A CN107203588 A CN 107203588A CN 201710267478 A CN201710267478 A CN 201710267478A CN 107203588 A CN107203588 A CN 107203588A
- Authority
- CN
- China
- Prior art keywords
- module
- category information
- domestic news
- news category
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种数据分类管理系统,应用于新闻资讯类信息的管理,其中,服务端包括:信息采集模块,用以于第三方信息平台采集新闻类资讯信息;数据库,用以保存新闻资讯类信息;分类模块,用以将新闻资讯类信息进行分类保存并通过发布模块发布于服务端中以供客户端在线浏览,访问统计模块,用以记录客户端于服务端中访问不同类别的新闻资讯类信息的次数,排序模块,根据访问次数将新闻资讯类类信息进行降序排列;推送模块用以将访问次数最高的新闻资讯类信息推送至服务端。其克服了现有技术中需要维护人员进行人工编辑排序带来的费时费力,且不能准确的区分关注度较高的新闻资讯类信息的缺陷。
Description
技术领域
本发明涉及通信技术领域,尤其涉及一种数据分类管理系统。
背景技术
随着互联网发的不断发展,搜索引擎、电子商务、社交平台充斥了整个网络世界。新闻资讯类信息是传播信息的一种重要手段,人们可以通过获取的新闻资讯类信息了解国家经济政策,以及最新的时政内容,了解周边发生的热点事件等,现有的获取新闻资讯类信息包括通过电视,网络视频传播,还包括各类的第三方平台,如各种资讯类网站,其中门户类网站的报道,可以展示更多的信息内容,方便使用者获取不同类别的新闻资讯类信息,在门户类网站中由于排版页面的限制,在有首页的版页面只能显示数量有限的新闻资讯类信息,为了使使用者第一眼就能获取最新,关注最高的信息,需要网站的维护人员及时的作出排版,将关注最高的新闻类信息排版与网站的首页,如此不仅费时费力且维护人员并不能及时的判读出关注最高的新闻类信息。
发明内容
针对现有技术中新闻资讯类信息在门户网站上发布展示存在的上述问题,现提供一种旨在于多渠道获取新闻资讯类信息,并且对获取的新闻类资讯类信息进行分类,还可根据新闻资讯类信息的访问数量对不同类别的新闻资讯类信息做出自动排序的数据分类管理系统。
具体技术方案如下:
一种数据分类管理系统,应用于新闻资讯类信息的管理,其中包括:
服务端,以及与所述信息搜索服务端连接的多个客户端;
所述服务端包括:
信息采集模块,用以于第三方信息平台采集所述新闻资讯类信息;
数据库,与所述信息采集模块连接,用以保存所述新闻资讯类信息;
分类模块,与所述信息采集模块以及所述数据库连接,用以将所述新闻资讯类信息进行分类保存;
发布模块,与所述分类模块连接,用以将分类保存的所述新闻资讯类信息发布于所述服务端中,以供所述客户端在线浏览;
访问统计模块,用以记录所述客户端于所述服务端中访问不同类别的所述新闻资讯类信息的次数,以及记录每个所述客户端的访问地址;
排序模块,与所述访问统计模块连接,用以于同一类别中根据发布的所述新闻资讯类信息的访问次数,将所述新闻资讯类信息进行降序排列;
推送模块,与所述访问统计模块连接,用以将访问次数最高的所述新闻资讯类信息推送至所述服务端。
优选的,所述访问地址为所述客户端的IP地址。
优选的,所述数据库为基于Redis的爬虫数据库。
优选的,所述客户端还包括查询模块,所述查询模块用以根据关键词于所述数据库中获取对应的所述新闻资讯类信息。
优选的,所述服务端还包括一编辑模块,所述编辑模块与所述数据库连接,用以对获取的所述新闻类资讯信息进行编辑保存。
优选的,所述分类模块包括:
分割模块,所述分割模块提供一预设分词算法对获取的所述新闻资讯类信息的内容进行分割;
提取模块,与所述分割模块连接,所述提取模块于分割的所述新闻资讯类信息的内容中提取关键词;
比较模块,与所述提取模块连接,所述比较模块将分割的所述关键词与预设关键词库进行比较,以获取最终的所述关键词;
保存模块,与所述比较模块连接,所述保存模块根据最终的所述关键词对当前的所述新闻资讯类信息进行分类保存。
优选的,所述预设分词算法采用逆向最大匹配法。
上述技术方案具有如下优点或有益效果:可通过于多各第三方平台获取新闻资讯类信息,并对获取的新闻资讯类信息按照预设的分类规则进行分类,分类发布的新闻资讯类信息根据客户端使用者的访问数量,自动进行降序排列,克服了现有技术中需要维护人员进行人工编辑排序带来的费时费力,且不能准确的区分关注度较高的新闻资讯类信息的缺陷。
附图说明
参考所附附图,以更加充分的描述本发明的实施例。然而,所附附图仅用于说明和阐述,并不构成对本发明范围的限制。
图1为本发明一种数据分类管理系统实施例的结构示意图;
图2为本发明一种数据分类管理系统的实施例中,关于服务端的结构示意图;
图3为本发明一种数据分类管理系统的实施例中,关于分类模块的结构示意图;
附图标记表示:
1、服务端,2、客户端;11、信息采集模块;12、数据库、13、分类模块;14、发布模块;15、访问统计模块;16、排序模块;17、推送模块;18、编辑模块。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
下面结合附图和具体实施例对本发明作进一步说明,但不作为本发明的限定。
本发明的技术方案中包括一种数据分类管理系统。
如图1所示,一种数据分类管理系统的实施例,应用于新闻资讯类信息的管理,其中,包括:
服务端1,以及与信息搜索服务端1连接的多个客户端2;
服务端1包括:
信息采集模块11,用以于第三方信息平台采集新闻资讯类信息;
数据库12,与信息采集模块11连接,用以保存新闻资讯类信息;
分类模块13,与信息采集模块11和所述处理连接,用以根据预设的分类规则将新闻资讯类信息进行分类保存;
发布模块14,与分类模块13连接,用以将分类保存的新闻资讯类信息发布于服务端1中,以供客户端2在线浏览;
访问统计模块15,用以记录客户端2于服务端1中访问不同类别的新闻资讯类信息的次数,以及记录每个客户端2的访问地址;
排序模块16,与访问统计模块15连接,用以于同一类别中根据发布的新闻资讯类信息的访问次数,将新闻资讯类类信息进行降序排列;
推送模块17,与访问统计模块15连接,用以将访问次数最高的新闻资讯类信息推送至服务端1。
在一种较优的实施方式中,访问地址为客户端2的IP地址。
在一种较优的实施方式中,数据库12为基于Redis的爬虫数据库12。
在一种较优的实施方式中,如图2所示,客户端2还包括查询模块,查询模块用以根据关键词于数据库12中获取对应的新闻资讯类信息。
在一种较优的实施方式中,数据库12保存的新闻类资讯类信息的类别包括,体育类,名人类,建筑类,历史类,文学类,教育类。
在一种较优的实施方式中,服务端1还包括一编辑模块18,编辑模块18与数据库12连接,用以对获取的新闻类资讯信息进行编辑保存。
在一种较优的实施方式中,如图3所示,分类模块13包括:
分割模块131,分割模块提供一预设分词算法对获取的新闻资讯类信息的内容进行分割;
提取模块132,与分割模块131连接,提取模块于分割的新闻资讯类信息的内容中提取关键词;
比较模块133,与提取模块132连接,比较模块将分割的关键词与预设关键词库进行比较,以获取最终的关键词;
保存模块134,与比较模块133连接,保存模块根据最终的关键词对当前的新闻资讯类信息进行分类保存。
在一种较优的实施方式中,预设分词算法采用逆向最大匹配法。
以上所述仅为本发明较佳的实施例,并非因此限制本发明的实施方式及保护范围,对于本领域技术人员而言,应当能够意识到凡运用本发明说明书及图示内容所作出的等同替换和显而易见的变化所得到的方案,均应当包含在本发明的保护范围内。
Claims (7)
1.一种数据分类管理系统,应用于新闻资讯类信息的管理,其特征在于,包括:
服务端,以及与所述信息搜索服务端连接的多个客户端;
所述服务端包括:
信息采集模块,用以于第三方信息平台采集所述新闻资讯类信息;
数据库,与所述信息采集模块连接,用以保存所述新闻资讯类信息;
分类模块,与所述信息采集模块以及所述数据库连接,用以将所述新闻资讯类信息进行分类保存;
发布模块,与所述分类模块连接,用以将分类保存的所述新闻资讯类信息发布于所述服务端中,以供所述客户端在线浏览;
访问统计模块,用以记录所述客户端于所述服务端中访问不同类别的所述新闻资讯类信息的次数,以及记录每个所述客户端的访问地址;
排序模块,与所述访问统计模块连接,用以于同一类别中根据发布的所述新闻资讯类信息的访问次数,将所述新闻资讯类信息进行降序排列;
推送模块,与所述访问统计模块连接,用以将访问次数最高的所述新闻资讯类信息推送至所述服务端。
2.根据权利要求1所述的数据分类管理系统,其特征在于,所述访问地址为所述客户端的IP地址。
3.根据权利要求1所述的数据分类管理系统,其特征在于,所述数据库为基于Redis的爬虫数据库。
4.根据权利要求1所述的数据分类管理系统,其特征在于,所述客户端还包括查询模块,所述查询模块用以根据关键词于所述数据库中获取对应的所述新闻资讯类信息。
5.根据权利要求1所述的数据分类管理系统,其特征在于,所述服务端还包括一编辑模块,所述编辑模块与所述数据库连接,用以对获取的所述新闻类资讯信息进行编辑保存。
6.根据权利要求1所述的数据分类管理系统,其特征在于,所述分类模块包括:
分割模块,所述分割模块提供一预设分词算法对获取的所述新闻资讯类信息的内容进行分割;
提取模块,与所述分割模块连接,所述提取模块于分割的所述新闻资讯类信息的内容中提取关键词;
比较模块,与所述提取模块连接,所述比较模块将分割的所述关键词与预设关键词库进行比较,以获取最终的所述关键词;
保存模块,与所述比较模块连接,所述保存模块根据最终的所述关键词对当前的所述新闻资讯类信息进行分类保存。
7.根据权利要求6所述的数据分类管理系统,其特征在于,所述预设分词算法采用逆向最大匹配法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710267478.4A CN107203588A (zh) | 2017-04-21 | 2017-04-21 | 一种数据分类管理系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710267478.4A CN107203588A (zh) | 2017-04-21 | 2017-04-21 | 一种数据分类管理系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107203588A true CN107203588A (zh) | 2017-09-26 |
Family
ID=59905036
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710267478.4A Pending CN107203588A (zh) | 2017-04-21 | 2017-04-21 | 一种数据分类管理系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107203588A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108304507A (zh) * | 2018-01-18 | 2018-07-20 | 宁波公众信息产业有限公司 | 一种门户网站的管理系统 |
CN109388640A (zh) * | 2018-10-10 | 2019-02-26 | 上海找油信息科技有限公司 | 一种资讯管理系统 |
CN111400589A (zh) * | 2020-03-06 | 2020-07-10 | 孙月华 | 一种体育信息智能服务平台 |
CN111523027A (zh) * | 2020-04-16 | 2020-08-11 | 武汉有牛科技有限公司 | 基于区块链技术的数据新闻自动撰写机器人 |
CN111768274A (zh) * | 2020-06-24 | 2020-10-13 | 中国地质大学(武汉) | 一种基于人工智能数据分类存储系统 |
CN112099912A (zh) * | 2020-08-31 | 2020-12-18 | 安徽永旋通讯科技有限公司 | 一种计算机系统集成平台 |
CN114676745A (zh) * | 2022-01-18 | 2022-06-28 | 北京国信网联科技有限公司 | 一种大数据智能分析系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101997933A (zh) * | 2009-08-18 | 2011-03-30 | 阿里巴巴集团控股有限公司 | 一种网址提供方法、装置及系统 |
CN104462578A (zh) * | 2014-12-29 | 2015-03-25 | 北京邮电大学 | 新闻推送方法 |
CN105117484A (zh) * | 2015-09-17 | 2015-12-02 | 广州银讯信息科技有限公司 | 一种互联网舆情监测方法和系统 |
US20160050247A1 (en) * | 2014-08-04 | 2016-02-18 | Media Group Of America Holdings, Llc | Sorting information by relevance to individuals with passive data collection and real-time injection |
CN106202501A (zh) * | 2016-07-20 | 2016-12-07 | 宁波公众信息产业有限公司 | 一种信息分析系统 |
CN106446189A (zh) * | 2016-09-29 | 2017-02-22 | 广州艾媒数聚信息咨询股份有限公司 | 一种资讯推荐方法及系统 |
-
2017
- 2017-04-21 CN CN201710267478.4A patent/CN107203588A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101997933A (zh) * | 2009-08-18 | 2011-03-30 | 阿里巴巴集团控股有限公司 | 一种网址提供方法、装置及系统 |
US20160050247A1 (en) * | 2014-08-04 | 2016-02-18 | Media Group Of America Holdings, Llc | Sorting information by relevance to individuals with passive data collection and real-time injection |
CN104462578A (zh) * | 2014-12-29 | 2015-03-25 | 北京邮电大学 | 新闻推送方法 |
CN105117484A (zh) * | 2015-09-17 | 2015-12-02 | 广州银讯信息科技有限公司 | 一种互联网舆情监测方法和系统 |
CN106202501A (zh) * | 2016-07-20 | 2016-12-07 | 宁波公众信息产业有限公司 | 一种信息分析系统 |
CN106446189A (zh) * | 2016-09-29 | 2017-02-22 | 广州艾媒数聚信息咨询股份有限公司 | 一种资讯推荐方法及系统 |
Non-Patent Citations (2)
Title |
---|
罗杰: "基于新的关键词提取方法的快速文本分类系统", 《计算机应用研究》 * |
道简: "一个基于概念的中文文本分类模型", 《HTTPS://WWW.CNBLOGS.COM/JORBIN/ARTICLES/1915878. HTML》 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108304507A (zh) * | 2018-01-18 | 2018-07-20 | 宁波公众信息产业有限公司 | 一种门户网站的管理系统 |
CN109388640A (zh) * | 2018-10-10 | 2019-02-26 | 上海找油信息科技有限公司 | 一种资讯管理系统 |
CN111400589A (zh) * | 2020-03-06 | 2020-07-10 | 孙月华 | 一种体育信息智能服务平台 |
CN111523027A (zh) * | 2020-04-16 | 2020-08-11 | 武汉有牛科技有限公司 | 基于区块链技术的数据新闻自动撰写机器人 |
CN111523027B (zh) * | 2020-04-16 | 2023-08-01 | 武汉有牛科技有限公司 | 基于区块链技术的数据新闻自动撰写机器人 |
CN111768274A (zh) * | 2020-06-24 | 2020-10-13 | 中国地质大学(武汉) | 一种基于人工智能数据分类存储系统 |
CN112099912A (zh) * | 2020-08-31 | 2020-12-18 | 安徽永旋通讯科技有限公司 | 一种计算机系统集成平台 |
CN114676745A (zh) * | 2022-01-18 | 2022-06-28 | 北京国信网联科技有限公司 | 一种大数据智能分析系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107203588A (zh) | 一种数据分类管理系统 | |
CN108776671A (zh) | 一种网络舆情监控系统及方法 | |
CN108334489B (zh) | 文本核心词识别方法和装置 | |
CN107203589A (zh) | 一种信息推送系统 | |
CN109658062A (zh) | 一种基于深度学习的电子档案智能处理方法 | |
CN104536956A (zh) | 一种基于微博平台的事件可视化方法及系统 | |
CN104615627B (zh) | 一种基于微博平台的事件舆情信息提取方法及系统 | |
Kim et al. | Talking about bio-fuel in the news: Newspaper framing of ethanol stories in the United States | |
CN102890698A (zh) | 微博话题标签自动化描述方法 | |
CN106372847A (zh) | 基于移动互联网的招聘或应聘系统 | |
CN104462096B (zh) | 舆情监测分析方法和装置 | |
CN102253939A (zh) | 一种基于云计算技术的搜索方法及系统 | |
CN104834739B (zh) | 互联网信息存储系统 | |
CN103559315A (zh) | 资讯筛选推送方法及装置 | |
WO2019080910A1 (zh) | 一种信息处理系统及其实现信息处理的方法 | |
CN111723256A (zh) | 一种基于信息资源库的政务用户画像构建方法及其系统 | |
CN108038506A (zh) | 一种图书自动分类方法 | |
CN104809252A (zh) | 互联网数据提取系统 | |
CN112149422B (zh) | 一种基于自然语言的企业新闻动态监测方法 | |
CN110968571A (zh) | 面向金融信息服务的大数据分析与处理平台 | |
CN106202501A (zh) | 一种信息分析系统 | |
CN103970800A (zh) | 网页相关关键词的抽取处理方法和系统 | |
CN106817407A (zh) | 一种教学信息资源推送方法及系统 | |
CN103914534B (zh) | 基于专家系统url分类知识库的文本内容分类方法 | |
CN113792195B (zh) | 跨系统的数据获取方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170926 |
|
RJ01 | Rejection of invention patent application after publication |