CN107085608A - 一种有效的网络热点监测系统 - Google Patents
一种有效的网络热点监测系统 Download PDFInfo
- Publication number
- CN107085608A CN107085608A CN201710267685.XA CN201710267685A CN107085608A CN 107085608 A CN107085608 A CN 107085608A CN 201710267685 A CN201710267685 A CN 201710267685A CN 107085608 A CN107085608 A CN 107085608A
- Authority
- CN
- China
- Prior art keywords
- mrow
- msub
- characteristic item
- mfrac
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Abstract
一种有效的网络热点监测系统,包括信息采集模块、舆情预处理模块、舆情分析模块和管理模块,所述信息采集模块用于对网络上的舆情信息进行采集,获取网页数据,所述舆情预处理模块用于对获取的网页数据进行噪声处理以及中文分词,所述舆情分析模块用于从所述中文分词结果中提取网页的特征项并计算特征项的权重,进而进行网页主题归类,所述管理模块用于对采集得到的文档进行存储,并向用户显示系统的监测结果,本发明的有益效果为:提出一种有效的网络热点监测系统,通过对网络上的信息的抓取和科学有效的分析,实现了对网络热点的有效监测。
Description
技术领域
本发明创造涉及舆情监控领域,具体涉及一种有效的网络热点监测系统。
背景技术
随着社会的发展,科技的进步,人类步入了飞速发展的互联网时代,各种各样的资源以互联网为载体进行汇聚、整合,形成了一个庞大的信息库。因为网络的传播是自由的、开放的,每个人都有机会成为网络信息的发布者,因此更能直接、真实、全面地反映民众的观点和态度,但是正是网上发表言论的自由性和无限制性,使得舆情很大程度上取决于网民的情绪状态等非主观因素,因此,为了保证舆论的正确导向,同时便于了解当今网民较为关注的热点领域,对网络舆情的监测有着重要的现实意义。
发明内容
针对上述问题,本发明旨在提供一种有效的网络热点监测系统。
本发明创造的目的通过以下技术方案实现:
一种有效的网络热点监测系统,包括信息采集模块、舆情预处理模块、舆情分析模块和管理模块,所述信息采集模块用于对网络上的舆情信息进行采集,获取网页数据,所述舆情预处理模块用于对获取的网页数据进行噪声处理以及中文分词,所述舆情分析模块用于从所述中文分词结果中提取网页的特征项并计算所述特征项的权重,从而进行网页主题的划分,所述管理模块用于对采集得到的文档进行存储,并向用户显示系统的监测结果。
本发明创造的有益效果:提出一种有效的网络热点监测系统,通过对网络上的信息的抓取和科学有效的分析,实现了对网络热点的有效监测。
附图说明
利用附图对发明创造作进一步说明,但附图中的实施例不构成对本发明创造的任何限制,对于本领域的普通技术人员,在不付出创造性劳动的前提下,还可以根据以下附图获得其它的附图。
图1是本发明结构示意图;
图2是本发明舆情分析模块结构示意图
图3是本发明管理模块结构示意图。
附图标记:
信息采集模块1;舆情预处理模块2;舆情分析模块3;管理模块4;网页表示单元31;主题划分单元32;信息存储单元41;信息显示单元42。
具体实施方式
结合以下实施例对本发明作进一步描述。
参见图1、图2和图3,本实施例的一种有效的网络热点监测系统,包括信息采集模块1、舆情预处理模块2、舆情分析模块3和管理模块4,所述信息采集模块1用于对网络上的舆情信息进行采集,获取网页数据,所述舆情预处理模块2用于对获取的网页数据进行噪声处理以及中文分词,所述舆情分析模块3用于从所述中文分词结果中提取网页的特征项并计算所述特征项的权重,进而进行网页主题归类,所述管理模块4用于对采集得到的文档进行存储,并向用户显示系统的监测结果。
优选地,所述管理模块4包括信息存储单元41和信息显示单元42,所述信息存储单元41用于根据主题归类结果对采集得到的文档进行分类存储,所述信息显示单元42用于向用户显示系统的监测结果。
本优选实施例提出一种有效的网络热点监测系统,通过对网络上的信息的抓取和科学有效的分析,实现了对网络热点的有效监测。
优选地,所述舆情分析模块3包括网页表示单元31和主题划分单元32,所述网页表示单元31用于从所述中文分词结果中提取能够反映网页主题的特征项并计算所述特征项的权重,所述主题划分单元32用于根据计算所得的相似性系数进行采集得到的网页主题的划分。
优选地,所述网页表示单元31用于从所述中文分词结果中提取能够反映网页主题的特征项并计算所述特征项的权重,具体包括:
(1)定义采集得到的网页中类别为Lk(1≤k≤u)的文本有{ck1,ck2,……ckr},则采用一种改进的信息增益计算方法进行特征项ti的选择,具体为:
式中,p(ti)为特征词ti出现的概率,则为ti不出现的概率,P(ti|Li)为特征词ti存在的文本属于Lk类的概率,为ti不存在的文本属于Lk类的概率,u为类别数,p(Lk)为Lk类文本出现的概率,c(ti,Lk)为Lk类文本出现的特征项ti的次数,为特征项ti在采集得到的网页中出现次数的平均数;
将所得的特征词的信息增益值按从大到小的顺序进行排列,选取前g个特征词作为采集得到的文档的特征项;
(2)定义文本cl的特征项为{tl1,tl2,……tlg},则对应特征项的权重{ql1,ql2,……qlg}的计算公式为:
式中,ulr表示特征项tr在文本cl中出现的频数,max(ur)表示特征项tr在文本集中出现的频数的最大值,min(ur)表示特征项tr在文本集中出现的频数的最小值,qlr表示特征项tr在文本cl中的权重,D表示文本集中的文本数量,dr表示文本集中包含特征项tr的文本数。
本优选实施例采用一种改进的信息增益的计算方法,增加了特征项的分类能力,有助于选出较有效的特征项,此外,采用一种改进的权重计算方法,相较于传统的TFIDF计算权重方法,对特征项在文本集中出现的频数进行处理,综合考虑了特征项在文本集中的总体价值,充分体现了特征项权重的重要性。
优选地,所述主题划分单元32用于根据计算所得的相似性系数对采集得到的网页进行主题划分,具体包括:
(1)创建待监测的网络热点领域集合R={r1,r2,……rw},分别定义网络热点领域ri(i=1,2,……w)的主题文档为ri=(ti1,ti2,……tib),采集得到的文档为cj=(tj1,tj2,……tjg);
a.计算采集得到的文档cj和热点领域集中的各个主题文档ri之间的相似性系数θi,θi的计算表达式如下:
式中,sim(tj,ti)为采集得到的文档cj中的特征项和主题文档ri中的各个特征项之间的概念词语相似度的加权平均值,θi为采集得到的文档cj和主题文档ri之间的相似性系数,qjh为文档cj中特征项tjh的权重,g为文档cj中的特征项个数,b为主题文档中特征项的个数;
b.计算采集文档和各个主题相似性系数中的最大相似性系数θmax,具体为:
(2)定义主题阈值τ,当最大相似性系数θmax大于主题阈值τ时,则θmax对应的主题ri即为采集得到的文档的主题,当最大相似性系数θmax小于主题阈值τ时,则判断为主题不相关网页,即舍弃采集得到的文档。
本优选实施例通过计算采集得到的文档与热点领域集合中主题的相似性系数的计算,实现了对采集得到的文档的主题的有效划分。
最后应当说明的是,以上实施例仅用以说明本发明的技术方案,而非对本发明保护范围的限制,尽管参照较佳实施例对本发明作了详细地说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的实质和范围。
Claims (5)
1.一种有效的网络热点监测系统,其特征是,包括信息采集模块、舆情预处理模块、舆情分析模块和管理模块,所述信息采集模块用于对网络上的舆情信息进行采集,获取网页数据,所述舆情预处理模块用于对获取的网页数据进行噪声处理以及中文分词,所述舆情分析模块用于从所述中文分词结果中提取网页的特征项并计算所述特征项的权重,进而进行网页主题的划分,所述管理模块用于对采集得到的文档进行存储,并向用户显示系统的监测结果。
2.根据权利要求1所述的一种有效的网络热点监测系统,其特征是,所述管理模块包括信息存储单元和信息显示单元,所述信息存储单元用于根据主题划分结果对采集得到的文档进行分类存储,所述信息显示单元用于向用户显示系统的监测结果。
3.根据权利要求2所述的一种有效的网络热点监测系统,其特征是,所述舆情分析模块包括网页表示单元和主题划分单元,所述网页表示单元用于从所述中文分词结果中提取能够反映网页主题的特征项并计算所述特征项的权重,所述主题划分单元用于根据计算所得的相似性系数进行采集得到的网页的主题的划分。
4.根据权利要求3所述的一种有效的网络热点监测系统,其特征是,所述网页表示单元用于从所述中文分词结果中提取能够反映网页主题的特征项并计算所述特征项的权重,具体包括:
(1)定义采集得到的网页中类别为Lk(1≤k≤u)的文本有{ck1,ck2,……ckr},则采用一种改进的信息增益计算方法进行特征项ti的选择,具体为:
<mrow>
<mi>I</mi>
<mi>G</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>L</mi>
<mi>k</mi>
</msub>
<mo>,</mo>
<msub>
<mi>t</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mrow>
<mo>(</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>k</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>u</mi>
</munderover>
<mo>&lsqb;</mo>
<mi>P</mi>
<mo>(</mo>
<mrow>
<msub>
<mi>t</mi>
<mi>i</mi>
</msub>
<mo>|</mo>
<msub>
<mi>L</mi>
<mi>k</mi>
</msub>
</mrow>
<mo>)</mo>
<mi>ln</mi>
<mfrac>
<mrow>
<mi>p</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>t</mi>
<mi>i</mi>
</msub>
<mo>|</mo>
<msub>
<mi>L</mi>
<mi>k</mi>
</msub>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<mi>p</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>t</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
<mi>p</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>L</mi>
<mi>k</mi>
</msub>
<mo>)</mo>
</mrow>
</mrow>
</mfrac>
<mo>+</mo>
<mi>p</mi>
<mo>(</mo>
<mrow>
<msub>
<mover>
<mi>t</mi>
<mo>&OverBar;</mo>
</mover>
<mi>i</mi>
</msub>
<mo>|</mo>
<msub>
<mi>L</mi>
<mi>k</mi>
</msub>
</mrow>
<mo>)</mo>
<mi>ln</mi>
<mfrac>
<mrow>
<mi>p</mi>
<mrow>
<mo>(</mo>
<msub>
<mover>
<mi>t</mi>
<mo>&OverBar;</mo>
</mover>
<mi>i</mi>
</msub>
<mo>|</mo>
<msub>
<mi>L</mi>
<mi>k</mi>
</msub>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<mi>p</mi>
<mrow>
<mo>(</mo>
<msub>
<mover>
<mi>t</mi>
<mo>&OverBar;</mo>
</mover>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
<mi>p</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>L</mi>
<mi>k</mi>
</msub>
<mo>)</mo>
</mrow>
</mrow>
</mfrac>
<mo>)</mo>
</mrow>
<msup>
<mi>e</mi>
<mfrac>
<mrow>
<mi>c</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>t</mi>
<mi>i</mi>
</msub>
<mo>,</mo>
<msub>
<mi>L</mi>
<mi>k</mi>
</msub>
<mo>)</mo>
</mrow>
</mrow>
<mover>
<mrow>
<mi>c</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>t</mi>
<mi>i</mi>
</msub>
<mo>,</mo>
<msub>
<mi>L</mi>
<mi>k</mi>
</msub>
<mo>)</mo>
</mrow>
</mrow>
<mo>&OverBar;</mo>
</mover>
</mfrac>
</msup>
</mrow>
<mrow>
<mi>I</mi>
<mi>G</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>t</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfrac>
<mrow>
<msubsup>
<mi>&Sigma;</mi>
<mrow>
<mi>k</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>u</mi>
</msubsup>
<mi>I</mi>
<mi>G</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>L</mi>
<mi>k</mi>
</msub>
<mo>,</mo>
<msub>
<mi>t</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
</mrow>
<mi>u</mi>
</mfrac>
</mrow>
式中,p(ti)为特征词ti出现的概率,则为ti不出现的概率,P(ti|Li)为特征词ti存在的文本属于Lk类的概率,为ti不存在的文本属于Lk类的概率,u为类别数,p(Lk)为Lk类文本出现的概率,c(ti,Lk)为Lk类文本出现的特征项ti的次数,为特征项ti在采集得到的网页中出现次数的平均数;
将所得的特征词的信息增益值按从大到小的顺序进行排列,选取前g个特征词作为采集得到的文档的特征项;
(2)定义文本cl的特征项为{tl1,tl2,……tlg},则对应特征项的权重{ql1,ql2,……qlg}的计算公式为:
<mrow>
<msub>
<mi>q</mi>
<mrow>
<mi>l</mi>
<mi>r</mi>
</mrow>
</msub>
<mo>=</mo>
<mfrac>
<mrow>
<mfrac>
<msub>
<mi>u</mi>
<mrow>
<mi>l</mi>
<mi>r</mi>
</mrow>
</msub>
<mrow>
<mi>m</mi>
<mi>a</mi>
<mi>x</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>u</mi>
<mi>r</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>+</mo>
<mi>m</mi>
<mi>i</mi>
<mi>n</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>u</mi>
<mi>r</mi>
</msub>
<mo>)</mo>
</mrow>
</mrow>
</mfrac>
<mo>*</mo>
<mi>l</mi>
<mi>n</mi>
<mrow>
<mo>(</mo>
<mfrac>
<mi>D</mi>
<msub>
<mi>d</mi>
<mi>r</mi>
</msub>
</mfrac>
<mo>+</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
</mrow>
<msqrt>
<mrow>
<msubsup>
<mi>&Sigma;</mi>
<mrow>
<mi>r</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>g</mi>
</msubsup>
<msup>
<mrow>
<mo>(</mo>
<msub>
<mi>u</mi>
<mrow>
<mi>l</mi>
<mi>r</mi>
</mrow>
</msub>
<mo>*</mo>
<mi>l</mi>
<mi>n</mi>
<mo>(</mo>
<mrow>
<mfrac>
<mi>D</mi>
<msub>
<mi>d</mi>
<mi>r</mi>
</msub>
</mfrac>
<mo>+</mo>
<mn>1</mn>
</mrow>
<mo>)</mo>
<mo>)</mo>
</mrow>
<mn>2</mn>
</msup>
</mrow>
</msqrt>
</mfrac>
<mo>,</mo>
<mrow>
<mo>(</mo>
<mi>r</mi>
<mo>=</mo>
<mn>1</mn>
<mo>,</mo>
<mn>2</mn>
<mo>...</mo>
<mo>...</mo>
<mn>9</mn>
<mo>)</mo>
</mrow>
</mrow>
式中,ulr表示特征项tr在文本cl中出现的频数,max(ur)表示特征项tr在文本集中出现的频数的最大值,min(ur)表示特征项tr在文本集中出现的频数的最小值,qlr表示特征项tr在文本cl中的权重,D表示文本集中的文本数量,dr表示文本集中包含特征项tr的文本数。
5.根据权利要求4所述的一种有效的网络热点监测系统,其特征是,所述主题划分单元用于根据计算所得的相似性系数对采集得到的网页进行主题划分,具体包括:
(1)创建待监测的网络热点领域集合R={r1,r2,……rw},分别定义网络热点领域ri(i=1,2,……w)的主题文档为ri=(ti1,ti2,……tib),采集得到的文档为cj=(tj1,tj2,……tjg);
a.计算采集得到的文档cj和热点领域集中的各个主题文档ri之间的相似性系数θi,θi的计算表达式如下:
<mrow>
<mi>s</mi>
<mi>i</mi>
<mi>m</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>t</mi>
<mi>j</mi>
</msub>
<mo>,</mo>
<msub>
<mi>t</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfrac>
<mrow>
<msubsup>
<mi>&Sigma;</mi>
<mrow>
<mi>h</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>g</mi>
</msubsup>
<mrow>
<mo>(</mo>
<msub>
<mi>q</mi>
<mrow>
<mi>j</mi>
<mi>h</mi>
</mrow>
</msub>
<msubsup>
<mi>&Sigma;</mi>
<mrow>
<mi>u</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>b</mi>
</msubsup>
<mi>s</mi>
<mi>i</mi>
<mi>m</mi>
<mo>(</mo>
<mrow>
<msub>
<mi>t</mi>
<mrow>
<mi>j</mi>
<mi>h</mi>
</mrow>
</msub>
<mo>,</mo>
<msub>
<mi>t</mi>
<mrow>
<mi>i</mi>
<mi>u</mi>
</mrow>
</msub>
</mrow>
<mo>)</mo>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<mi>g</mi>
<mo>*</mo>
<mi>b</mi>
</mrow>
</mfrac>
</mrow>
<mrow>
<msub>
<mi>&theta;</mi>
<mi>i</mi>
</msub>
<mo>=</mo>
<msup>
<mi>e</mi>
<msqrt>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>+</mo>
<mi>s</mi>
<mi>i</mi>
<mi>m</mi>
<mo>(</mo>
<mrow>
<msub>
<mi>t</mi>
<mi>j</mi>
</msub>
<mo>,</mo>
<msub>
<mi>t</mi>
<mi>i</mi>
</msub>
</mrow>
<mo>)</mo>
<mo>)</mo>
</mrow>
</msqrt>
</msup>
<mo>,</mo>
<mrow>
<mo>(</mo>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
<mo>,</mo>
<mn>2</mn>
<mo>,</mo>
<mo>...</mo>
<mo>...</mo>
<mi>w</mi>
<mo>)</mo>
</mrow>
</mrow>
式中,sim(tj,ti)为采集得到的文档cj中的特征项和主题文档ri中的各个特征项之间的概念词语相似度的加权平均值,θi为采集得到的文档cj和主题文档ri之间的相似性系数,qjh为文档cj中特征项tjh的权重,g为文档cj中的特征项个数,b为主题文档中特征项的个数;
b.计算采集文档cj和各个主题文档的相似性系数中的最大相似性系数θmax,具体为:
<mrow>
<msub>
<mi>&theta;</mi>
<mrow>
<mi>m</mi>
<mi>a</mi>
<mi>x</mi>
</mrow>
</msub>
<mo>=</mo>
<munder>
<mrow>
<mi>m</mi>
<mi>a</mi>
<mi>x</mi>
</mrow>
<mrow>
<mn>1</mn>
<mo>&le;</mo>
<mi>i</mi>
<mo>&le;</mo>
<mi>w</mi>
</mrow>
</munder>
<msub>
<mi>&theta;</mi>
<mi>i</mi>
</msub>
</mrow>
(2)定义主题阈值τ,当最大相似性系数θmax大于主题阈值τ时,则θmax对应的主题ri即为采集得到的文档的主题,当最大相似性系数θmax小于主题阈值τ时,则判断为主题不相关网页,即舍弃采集得到的文档。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710267685.XA CN107085608A (zh) | 2017-04-21 | 2017-04-21 | 一种有效的网络热点监测系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710267685.XA CN107085608A (zh) | 2017-04-21 | 2017-04-21 | 一种有效的网络热点监测系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107085608A true CN107085608A (zh) | 2017-08-22 |
Family
ID=59612097
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710267685.XA Withdrawn CN107085608A (zh) | 2017-04-21 | 2017-04-21 | 一种有效的网络热点监测系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107085608A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019227710A1 (zh) * | 2018-05-31 | 2019-12-05 | 平安科技(深圳)有限公司 | 网络舆情的分析方法、装置及计算机可读存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101751458A (zh) * | 2009-12-31 | 2010-06-23 | 暨南大学 | 一种网络舆情监控系统及方法 |
CN101763401A (zh) * | 2009-12-30 | 2010-06-30 | 暨南大学 | 一种网络舆情的热点预测和分析方法 |
CN102622373A (zh) * | 2011-01-31 | 2012-08-01 | 中国科学院声学研究所 | 一种基于tf*idf算法的统计学文本分类系统及方法 |
CN102663001A (zh) * | 2012-03-15 | 2012-09-12 | 华南理工大学 | 基于支持向量机的博客作者兴趣与性格自动识别方法 |
CN103544255A (zh) * | 2013-10-15 | 2014-01-29 | 常州大学 | 基于文本语义相关的网络舆情信息分析方法 |
CN103841216A (zh) * | 2014-04-01 | 2014-06-04 | 深圳市科盾科技有限公司 | 一种基于云平台的网络舆情监控系统 |
-
2017
- 2017-04-21 CN CN201710267685.XA patent/CN107085608A/zh not_active Withdrawn
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101763401A (zh) * | 2009-12-30 | 2010-06-30 | 暨南大学 | 一种网络舆情的热点预测和分析方法 |
CN101751458A (zh) * | 2009-12-31 | 2010-06-23 | 暨南大学 | 一种网络舆情监控系统及方法 |
CN102622373A (zh) * | 2011-01-31 | 2012-08-01 | 中国科学院声学研究所 | 一种基于tf*idf算法的统计学文本分类系统及方法 |
CN102663001A (zh) * | 2012-03-15 | 2012-09-12 | 华南理工大学 | 基于支持向量机的博客作者兴趣与性格自动识别方法 |
CN103544255A (zh) * | 2013-10-15 | 2014-01-29 | 常州大学 | 基于文本语义相关的网络舆情信息分析方法 |
CN103841216A (zh) * | 2014-04-01 | 2014-06-04 | 深圳市科盾科技有限公司 | 一种基于云平台的网络舆情监控系统 |
Non-Patent Citations (1)
Title |
---|
杨琳: "粮食网络舆情分析技术研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019227710A1 (zh) * | 2018-05-31 | 2019-12-05 | 平安科技(深圳)有限公司 | 网络舆情的分析方法、装置及计算机可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106980692B (zh) | 一种基于微博特定事件的影响力计算方法 | |
CN103678670B (zh) | 一种微博热词与热点话题挖掘系统及方法 | |
CN106940732A (zh) | 一种面向微博的疑似水军发现方法 | |
CN105045857A (zh) | 一种社交网络谣言识别方法及系统 | |
CN104268197A (zh) | 一种行业评论数据细粒度情感分析方法 | |
CN106570008A (zh) | 推荐方法及装置 | |
CN103745000A (zh) | 一种中文微博客的热点话题检测方法 | |
CN110674407A (zh) | 基于图卷积神经网络的混合推荐方法 | |
CN107291886A (zh) | 一种基于增量聚类算法的微博话题检测方法及系统 | |
CN102110140A (zh) | 基于网络离散文本的舆情信息分析方法 | |
CN103870474A (zh) | 一种新闻话题组织方法及装置 | |
CN107506402A (zh) | 搜索结果的排序方法、装置、设备及计算机可读存储介质 | |
CN103678659A (zh) | 一种基于随机森林算法的电子商务网站欺诈用户识别方法及系统 | |
CN103778186A (zh) | 一种“网络马甲”的检测方法 | |
CN113962293B (zh) | 一种基于LightGBM分类与表示学习的姓名消歧方法和系统 | |
CN104462286A (zh) | 一种基于改进的lda的微博话题发现方法 | |
Thakur et al. | Rumor detection on Twitter using a supervised machine learning framework | |
CN104572877A (zh) | 游戏舆情的检测方法及系统 | |
CN105930507A (zh) | 一种获得用户的Web浏览兴趣的方法及装置 | |
CN102298589A (zh) | 情感倾向性模板的生成方法和装置以及应用方法和装置 | |
CN109272440A (zh) | 一种联合文本和图像内容的缩略图生成方法及系统 | |
Islam et al. | Review analysis of ride-sharing applications using machine learning approaches: Bangladesh perspective | |
CN105869058A (zh) | 一种多层潜变量模型用户画像提取的方法 | |
Sitorus et al. | Sensing trending topics in twitter for greater Jakarta area | |
CN107085608A (zh) | 一种有效的网络热点监测系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20170822 |