CN103268350B - 一种互联网舆情信息监测系统及监测方法 - Google Patents
一种互联网舆情信息监测系统及监测方法 Download PDFInfo
- Publication number
- CN103268350B CN103268350B CN201310206112.8A CN201310206112A CN103268350B CN 103268350 B CN103268350 B CN 103268350B CN 201310206112 A CN201310206112 A CN 201310206112A CN 103268350 B CN103268350 B CN 103268350B
- Authority
- CN
- China
- Prior art keywords
- module
- word
- internet
- information
- threshold value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种互联网舆情信息监测系统及监测方法,该系统包括采集模块、数据预处理模块、存储处理模块、服务监控模块与显示模块;所述采集模块的输出端与数据预处理模块的输入端通过有线连接,所述数据预处理模块与存储处理模块通过有线连接,所述服务监控模块与存储处理模块通过有线连接,所述存储处理模块与显示模块通过有线连接。本发明还提供一种互联网舆情信息监测方法。本发明集信息采集、分析处理、服务监控、存储、显示于一体,自动发现并深入分析互联网信息热点,帮助用户方便快捷地了解舆情事件的来龙去脉。
Description
技术领域
本发明涉及互联网信息智能分析处理技术领域,具体是一种互联网舆情信息监测系统及监测方法。
背景技术
近几年来,随着互联网的快速发展,网络媒体作为一种新的信息传播形式,已深入人们的日常生活。由于互联网具有虚拟性、隐蔽性、发散性、渗透性和随意性等特点,越来越多的网民乐意通过这种渠道来表达观点、传播思想,进而产生巨大的舆论压力,达到任何部门、机构都无法忽视的地步。可以说,互联网已成为思想文化信息的集散地和社会舆论的放大器。
根据中国互联网络信息中心(CNNIC)最新发布的《中国互联网络发展状况统计报告》显示,截至2011年底,我国的网民规模已经突破5亿,互联网普及率也进一步提升。随着网络普及率的上升和网民规模的持续扩大,互联网平台的信息量大幅度增加。然而,互联网的开放性、及时性和互动性,产生了大量的包含虚假、色情、暴力和反动的垃圾信息和不良信息。在信息类型多、数据量大的互联网平台中,如何获取有效的舆情信息以及如何对获取的舆情信息进行快速精确的分析和处理,是目前亟待解决的重要问题。
发明内容
本发明要解决的技术问题是提供一种能够获取有效的舆情信息并对获取的舆情信息进行快速精确的分析处理的互联网舆情信息监测系统及监测方法。
本发明的技术方案为:
一种互联网舆情信息监测系统,该系统包括采集模块、数据预处理模块、存储处理模块、服务监控模块与显示模块;所述采集模块的输出端与数据预处理模块的输入端通过有线连接,所述数据预处理模块与存储处理模块通过有线连接,所述服务监控模块与存储处理模块通过有线连接,所述存储处理模块与显示模块通过有线连接;
所述采集模块,用于对互联网上的舆情信息进行采集,获取网页数据;
所述数据预处理模块,用于对采集模块获取的网页数据进行分词及语义分析预处理并将预处理结果传输至存储处理模块进行存储;
所述服务监控模块,用于对存储处理模块存储的预处理结果进行统计,形成统计图表,并将形成的统计图表传输至存储处理模块进行存储,以及对达到预警阈值的信息进行预警通知;
所述存储处理模块,用于对数据预处理模块和服务监控模块传输过来的数据进行存储并通过有线传输至显示模块进行结果显示。
所述的互联网舆情信息监测系统,所述数据预处理模块包括分词子模块与语义分析子模块;
所述分词子模块,用于对采集模块获取的网页数据进行分词处理及词性标注,对词语的倾向性、主题属性进行解析;
所述语义分析子模块,用于对分词处理后的网页数据的句法进行分析,对每个网页上的文章热点指数、情感倾向性指数、文章主题进行分析判断。
所述的互联网舆情信息监测系统,所述服务监控模块包括计算子模块、统计图表形成子模块、参数设置子模块以及预警子模块;
所述计算子模块,用于对每个网页上的文章热点指数、情感倾向性指数的判断结果进行汇总计算;
所述统计图表形成子模块,用于形成文章热度排行报表、预警信息分布报表、舆情站点分布报表、舆情状态统计报表以及舆情趋势走向分析图;
所述参数设置子模块,用于对预警话题以及情感倾向性指数的预警阈值进行预先设置;
所述预警子模块,用于对达到预警阈值的信息进行预警通知。
所述的互联网舆情信息监测系统,显示模块进一步包括显示端语义分析子模块,所述显示端语义分析子模块用于对用户输入的文本和检索问题进行分析处理,并将分析处理结果传输至存储处理模块。
所述的互联网舆情信息监测系统,所述采集模块、数据预处理模块、存储处理模块和服务监控模块运行在服务器上,所述显示模块运行在客户端上。
一种互联网舆情信息监测方法,包括以下步骤:
1)对互联网上的舆情信息进行采集,获取网页数据;
2)对获取的网页数据进行分词及语义分析预处理并将预处理结果进行存储;
3)对存储的预处理结果进行统计,形成统计图表,并将形成的统计图表进行存储,以及对达到预警阈值的信息进行预警通知;
4)对存储的数据进行结果显示。
所述的互联网舆情信息监测方法,步骤1)中,具体采用规则采集与搜索引擎以及蜘蛛爬行相结合的方法对互联网上的舆情信息进行采集。
所述的互联网舆情信息监测方法,步骤2)中,对获取的网页数据进行分词及语义分析预处理,具体包括以下步骤:
1)采用基于球面四叉树的多级Hash结构的分词机制对获取的网页数据进行分词处理,分词的同时根据词的语法属性、情感属性、词类属性进行词性标注,解析出词语的倾向性、主题属性;
2)根据汉语句子的构造原则,对分词处理后的网页数据文本进行句子切分,抽取文本的每一个句子,然后对每个句子进行句法分析,将整个文本的句子的语法形成语法网状规则图;根据语义建立语义规则库,根据语义规则库将语法网状规则图通过点对点映射,转换为语义概念图;根据语义概念图判断每个网页上的文章热点指数、情感倾向性指数,分析文章主题。
所述的互联网舆情信息监测方法, 步骤3)中,对存储的预处理结果进行统计,形成统计图表,并将形成的统计图表进行存储,以及对达到预警阈值的信息进行预警通知,包括以下步骤:
1)对每个网页上的文章热点指数、情感倾向性指数的判断结果进行汇总计算;
2)形成文章热度排行报表、预警信息分布报表、舆情站点分布报表、舆情状态统计报表以及舆情趋势走向分析图;
3)对预警话题以及情感倾向性指数的预警阈值进行预先设置;
4)对达到预警阈值的信息通过邮件、短信进行预警通知。
所述的互联网舆情信息监测方法,所述基于球面四叉树的多级Hash结构的分词机制的构建包括以下步骤:
1)依次对每个字建立Hash索引,构成多级TRIE树;
2)所述TRIE树的结点构成Hash桶,将每个Hash桶内存放多个具有相同的前N个字的词,N为正整数;
3)用循环算法对建立的每一级Hash桶内的词的个数进行计算,若计算结果大于预先设定的阈值,则以该Hash桶为基础建立下一级的Hash桶,直至每个Hash桶内的词的数量均小于或等于阈值。
本发明集信息采集、分析处理、服务监控、存储、显示于一体,自动发现并深入分析互联网信息热点,帮助用户方便快捷地了解舆情事件的来龙去脉。针对互联网海量数据信息具有增长性和变动性的特点,采用规则采集为主,其他采集方式包括爬虫技术、搜索引擎技术相结合的方法对互联网舆情信息进行采集,具有全面性和时效性;采用基于球面四叉树的多级Hash结构的高速分词技术,不仅可以标注常用词语的词法,还能够标注自然语言中关键情感词类与情感程度,其速度比一般的分词技术提高10—100倍;对文章主题、热点指数、情感倾向性指数进行分析计算,达到对舆情的高效管理和正确引导;对预警话题以及情感倾向性指数的预警阈值进行预先设置,对达到预警阈值的信息通过邮件、短信进行预警通知,达到实时监控实时反馈通讯的效果;舆情分析处理的结果以网页的形式呈现给用户,为用户提供决策支持。
附图说明
图1是本发明具体实施方式提供的一种互联网舆情信息监测系统的模块示意图。
具体实施方式
下面结合附图及具体实施例进一步说明本发明。
如图1所示,一种互联网舆情信息监测系统,其特征在于:该系统包括采集模块1、数据预处理模块2、存储处理模块3、服务监控模块4与显示模块5;所述采集模块1的输出端与数据预处理模块2的输入端通过有线连接,所述数据预处理模块2与存储处理模块3通过有线连接,所述服务监控模块4与存储处理模块3通过有线连接,所述存储处理模块3与显示模块5通过有线连接;所述采集模块1,用于对互联网上的舆情信息进行采集,获取网页数据;所述数据预处理模块2,用于对采集模块1获取的网页数据进行分词及语义分析预处理并将预处理结果传输至存储处理模块3进行存储;所述服务监控模块4,用于对存储处理模块3存储的预处理结果进行统计,形成统计图表,并将形成的统计图表传输至存储处理模块3进行存储,以及对达到预警阈值的信息进行预警通知;所述存储处理模块3,用于对数据预处理模块2和服务监控模块4传输过来的数据进行存储并通过有线传输至显示模块5进行结果显示;所述采集模块1、数据预处理模块2、服务监控模块4和存储处理模块3运行在服务器上,所述显示模块5运行在客户端上。
所述预处理模块2包括分词子模块21与语义分析子模块22;所述分词子模块21,用于采用基于球面四叉树的多级Hash结构的分词机制对采集模块1获取的网页数据进行分词处理,分词的同时根据词的语法属性、情感属性、词类属性进行词性标注,解析出词语的倾向性、主题属性;所述语义分析子模块22,用于对分词处理后的网页数据的句法进行分析,形成语法网状规则图,并将语法网状规则图转换为语义概念图,根据语义概念图判断每个网页上的文章热点指数、情感倾向性指数,分析文章主题。
基于球面四叉树的多级Hash结构的分词机制:依次对每个字建立Hash索引,构成多级TRIE树,在TRIE树的结点处存放了一系列的词,这些词的共同点在于它们的前N个字是相同的,该一系列的词组成一个Hash桶;对建立的每一级Hash桶内的词的个数进行计算,若计算结果大于预先设定的阈值,则以该Hash桶为基础建立下一级的Hash桶,如此往复下去,直至每个Hash桶内的词的数量均小于或等于阈值。如“一代人”、“一代代”、“一代宗师”这三个词就在一个Hash桶里,因为它们的前两个字都是“一代”,这样使得查找速度大大加快。
词性标注分为两项:自然语义词性标注和情感语义词性标注,之间用“.”分隔,自然语义词性指语法上的名词n、动词v、形容词adj、副词adv、转折词t等,而情感语义词性分为四类:情感实词r(包括名词、动词、形容词、副词等)、程度副词d(加深后面词语效果的)、否定词n、转折词t,如非情感语义词,则不做标注。
所述服务监控模块4包括计算子模块41、统计图表形成子模块42、参数设置子模块43以及预警子模块44;所述计算子模块41,用于对每个网页上的文章热点指数、情感倾向性指数的判断结果进行汇总计算;所述统计图表形成子模块42,用于形成文章热度排行报表、预警信息分布报表、舆情站点分布报表、舆情状态统计报表以及舆情趋势走向分析图;所述参数设置子模块43,用于对预警话题以及情感倾向性指数的预警阈值进行预先设置;所述预警子模块44,用于对达到预警阈值的信息进行预警通知。
显示模块5进一步包括显示端语义分析子模块51,所述显示端语义分析子模块51用于对用户输入的文本和检索问题进行分析处理,形成用户输入文本和输入检索问题的语义概念图,并将所述语义概念图传输至存储处理模块3进行概念相似度和概念相关度计算,从而进行匹配。
本发明的工作原理:
采集模块1采用规则采集与搜索引擎以及蜘蛛爬行相结合的方法对互联网上的舆情信息进行采集,获取网页数据;
数据预处理模块2对获取的网页数据进行分词及语义分析预处理并将预处理结果传输至存储处理模块3进行存储:分词子模块21采用基于球面四叉树的多级Hash结构的分词机制对获取的网页数据进行分词处理,分词的同时根据词的语法属性、情感属性、词类属性进行词性标注,解析出词语的倾向性、主题属性;语法分析子模块22根据汉语句子的构造原则,对分词处理后的网页数据文本进行句子切分,抽取文本的每一个句子,然后对每个句子进行句法分析,将整个文本的句子的语法形成语法网状规则图;根据语义建立语义规则库,根据语义规则库将语法网状规则图通过点对点映射,转换为语义概念图;根据语义概念图判断每个网页上的文章热点指数、情感倾向性指数,分析文章主题;
服务监控模块4对存储处理模块3存储的预处理结果进行统计,形成统计图表,并将形成的统计图表传输至存储处理模块3进行存储,以及对达到预警阈值的信息进行预警通知:计算子模块41对每个网页上的文章热点指数、情感倾向性指数的判断结果进行汇总计算;统计图表形成子模块42形成文章热度排行报表、预警信息分布报表、舆情站点分布报表、舆情状态统计报表以及舆情趋势走向分析图;参数设置子模块43对预警话题以及情感倾向性指数的预警阈值进行预先设置;预警子模块44对达到预警阈值的信息进行预警通知;
存储处理模块3对数据预处理模块2和服务监控模块4传输过来的数据进行存储并通过有线传输至显示模块5进行结果显示,用户可以通过浏览器浏览,显示模块5提供信息检索功能,根据指定条件,用户可以对热点话题、情感倾向性进行查询,并浏览信息的具体内容,为决策提供支持。结果展示以网页的形式呈现给用户,包括:按照分类,显示最新的数据信息,包括文章热点指数、情感倾向性指数等;检索采集的文章信息,并浏览;形成的各种统计图表,包括文章热度排行报表、预警信息分布报表、舆情站点分布报表、舆情状态统计报表以及舆情趋势走向分析图等。
显示端语义分析子模块51对用户输入的文本和检索问题进行分析处理,形成输入文本的语义概念图和输入检索问题的语义概念图,然后将其传输至存储处理模块3,由存储处理模块3进行概念相似度计算和概念相关度计算,从而进行匹配。
以上所述实施方式仅仅是对本发明的优选实施方式进行描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案作出的各种变形和改进,均应落入本发明的权利要求书确定的保护范围内。
Claims (3)
1.一种互联网舆情信息监测方法,其特征在于:包括以下步骤:
1)对互联网上的舆情信息进行采集,获取网页数据;
2)对获取的网页数据进行分词及语义分析预处理并将预处理结果进行存储;
3)对存储的预处理结果进行统计,形成统计图表,并将形成的统计图表进行存储,以及对达到预警阈值的信息进行预警通知;
4)对存储的数据进行结果显示;
步骤2)中,对获取的网页数据进行分词及语义分析预处理,具体包括以下步骤:
采用基于球面四叉树的多级Hash结构的分词机制对获取的网页数据进行分词处理,分词的同时根据词的语法属性、情感属性、词类属性进行词性标注,解析出词语的倾向性、主题属性;
根据汉语句子的构造原则,对分词处理后的网页数据文本进行句子切分,抽取文本的每一个句子,然后对每个句子进行句法分析,将整个文本的句子的语法形成语法网状规则图;根据语义建立语义规则库,根据语义规则库将语法网状规则图通过点对点映射,转换为语义概念图;根据语义概念图判断每个网页上的文章热点指数、情感倾向性指数,分析文章主题;
所述基于球面四叉树的多级Hash结构的分词机制的构建包括以下步骤:依次对每个字建立Hash索引,构成多级TRIE树;所述TRIE树的结点构成Hash桶,将每个Hash桶内存放多个具有相同的前N个字的词,N为正整数;用循环算法对建立的每一级Hash桶内的词的个数进行计算,若计算结果大于预先设定的阈值,则以该Hash桶为基础建立下一级的Hash桶,直至每个Hash桶内的词的数量均小于或等于阈值。
2.根据权利要求1所述的互联网舆情信息监测方法,其特征在于:步骤1)中,具体采用规则采集与搜索引擎以及蜘蛛爬行相结合的方法对互联网上的舆情信息进行采集。
3.根据权利要求1所述的互联网舆情信息监测方法,其特征在于:
步骤3)中,对存储的预处理结果进行统计,形成统计图表,并将形成的统计图表进行存储,以及对达到预警阈值的信息进行预警通知,包括以下步骤:对每个网页上的文章热点指数、情感倾向性指数的判断结果进行汇总计算;形成文章热度排行报表、预警信息分布报表、舆情站点分布报表、舆情状态统计报表以及舆情趋势走向分析图;对预警话题以及情感倾向性指数的预警阈值进行预先设置;对达到预警阈值的信息通过邮件、短信进行预警通知。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310206112.8A CN103268350B (zh) | 2013-05-29 | 2013-05-29 | 一种互联网舆情信息监测系统及监测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310206112.8A CN103268350B (zh) | 2013-05-29 | 2013-05-29 | 一种互联网舆情信息监测系统及监测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103268350A CN103268350A (zh) | 2013-08-28 |
CN103268350B true CN103268350B (zh) | 2017-02-08 |
Family
ID=49011979
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310206112.8A Expired - Fee Related CN103268350B (zh) | 2013-05-29 | 2013-05-29 | 一种互联网舆情信息监测系统及监测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103268350B (zh) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104636386A (zh) * | 2013-11-14 | 2015-05-20 | 华为技术有限公司 | 信息监控方法及装置 |
CN103744877A (zh) * | 2013-12-20 | 2014-04-23 | 潘大庆 | 部署于互联网的舆情监测应用系统及运用方法 |
CN105893368A (zh) * | 2014-11-19 | 2016-08-24 | 北京航天长峰科技工业集团有限公司 | 多语种网络舆情分析方法 |
CN104504081A (zh) * | 2014-12-25 | 2015-04-08 | 北京东方剪报国际信息咨询有限公司 | 全媒体检测及监播大数据行为智能分析系统 |
CN104504151B (zh) * | 2015-01-09 | 2017-08-25 | 成都布林特信息技术有限公司 | 微信舆情监测系统 |
CN104678868B (zh) * | 2015-01-23 | 2017-11-10 | 贾新勇 | 一种业务及设备运维监控系统 |
CN104933093B (zh) * | 2015-05-19 | 2018-08-07 | 武汉泰迪智慧科技有限公司 | 基于大数据的地区舆情监控及决策辅助系统和方法 |
CN106339392A (zh) * | 2015-07-09 | 2017-01-18 | 北大方正集团有限公司 | 一种舆情信息获取方法及装置 |
CN106777124B (zh) * | 2016-05-26 | 2018-06-22 | 中科鼎富(北京)科技发展有限公司 | 语义认知方法、装置及系统 |
CN106446224A (zh) * | 2016-09-30 | 2017-02-22 | 广州特道信息科技有限公司 | 一种基于大数据信息发现方法 |
CN106886916A (zh) * | 2017-01-20 | 2017-06-23 | 电通公共关系顾问(北京)有限公司 | 声誉管理系统及方法 |
CN107168943B (zh) * | 2017-04-07 | 2018-07-03 | 平安科技(深圳)有限公司 | 话题预警的方法和装置 |
CN107203641A (zh) * | 2017-06-19 | 2017-09-26 | 北京易华录信息技术股份有限公司 | 一种互联网交通舆情信息采集和处理的方法 |
CN107578193A (zh) * | 2017-10-12 | 2018-01-12 | 国家计算机网络与信息安全管理中心 | 互联网金融风险分析可视化展示系统 |
CN108446270B (zh) * | 2018-03-06 | 2021-06-08 | 平安科技(深圳)有限公司 | 电子装置、系统敏感内容的预警方法及存储介质 |
CN108776671A (zh) * | 2018-05-12 | 2018-11-09 | 苏州华必讯信息科技有限公司 | 一种网络舆情监控系统及方法 |
CN110083701B (zh) * | 2019-03-20 | 2023-07-21 | 重庆邮电大学 | 一种基于平均影响力的网络空间群体性事件预警系统 |
CN111241828A (zh) * | 2020-01-10 | 2020-06-05 | 平安科技(深圳)有限公司 | 情感智能识别方法、装置及计算机可读存储介质 |
CN116128546A (zh) * | 2023-01-06 | 2023-05-16 | 河北科迪新能源科技有限公司 | 一种电力行业对外服务窗口的ai舆情监测系统和方法 |
CN116910231B (zh) * | 2023-09-11 | 2023-11-17 | 社治无忧(成都)智慧科技有限公司 | 一种基于自然语言处理的微信群舆情预警方法和系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101488150A (zh) * | 2009-03-04 | 2009-07-22 | 哈尔滨工程大学 | 一种实时多角度网络热点事件分析装置及分析方法 |
CN101763401A (zh) * | 2009-12-30 | 2010-06-30 | 暨南大学 | 一种网络舆情的热点预测和分析方法 |
CN102708096A (zh) * | 2012-05-29 | 2012-10-03 | 代松 | 一种基于语义的网络智能舆情监测系统及其工作方法 |
-
2013
- 2013-05-29 CN CN201310206112.8A patent/CN103268350B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101488150A (zh) * | 2009-03-04 | 2009-07-22 | 哈尔滨工程大学 | 一种实时多角度网络热点事件分析装置及分析方法 |
CN101763401A (zh) * | 2009-12-30 | 2010-06-30 | 暨南大学 | 一种网络舆情的热点预测和分析方法 |
CN102708096A (zh) * | 2012-05-29 | 2012-10-03 | 代松 | 一种基于语义的网络智能舆情监测系统及其工作方法 |
Also Published As
Publication number | Publication date |
---|---|
CN103268350A (zh) | 2013-08-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103268350B (zh) | 一种互联网舆情信息监测系统及监测方法 | |
CN103324665B (zh) | 一种基于微博的热点信息提取的方法和装置 | |
CN106980692B (zh) | 一种基于微博特定事件的影响力计算方法 | |
CN104182389B (zh) | 一种基于语义的大数据分析商业智能服务系统 | |
CN103365924B (zh) | 一种互联网信息搜索的方法、装置和终端 | |
CN103874994B (zh) | 用于自动概括电子文档的内容的方法和装置 | |
CN103294778B (zh) | 一种推送资讯信息的方法及系统 | |
CN103294815B (zh) | 基于关键字分类并有多种呈现方式的搜索引擎装置与方法 | |
CN104268148B (zh) | 一种基于时间串的论坛页面信息自动抽取方法及系统 | |
KR101623052B1 (ko) | 사용자 질의 처리 방법 및 시스템 | |
Ishikawa et al. | Hot topic detection in local areas using Twitter and Wikipedia | |
CN112434226A (zh) | 一种网络舆情监测预警方法 | |
CN103810162B (zh) | 推荐网络信息的方法和系统 | |
CN102088419A (zh) | 一种在社交网络中查找好友信息的方法和系统 | |
TW201435628A (zh) | 內容推薦系統及方法 | |
CN107609103A (zh) | 一种基于推特的事件检测方法 | |
CN104978332B (zh) | 用户生成内容标签数据生成方法、装置及相关方法和装置 | |
CN102033919A (zh) | 文本关键词提取方法及系统 | |
CN104298732B (zh) | 一种面向网络用户的个性化文本排序及推荐方法 | |
CN109299277A (zh) | 舆情分析方法、服务器及计算机可读存储介质 | |
CN108563667A (zh) | 基于新词识别的热门话题采集系统及其方法 | |
CN106021351B (zh) | 针对新闻事件的聚合提取方法及装置 | |
CN105447144B (zh) | 基于大数据分析技术的微博转发可视化分析方法及系统 | |
JP4774081B2 (ja) | 文書検索システム、文書検索方法、及びプログラム | |
CN103177076A (zh) | 一种基于定点网站的舆情监测系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20170208 |