CN104035960A - 互联网资讯信息热点预测方法 - Google Patents
互联网资讯信息热点预测方法 Download PDFInfo
- Publication number
- CN104035960A CN104035960A CN201410192780.4A CN201410192780A CN104035960A CN 104035960 A CN104035960 A CN 104035960A CN 201410192780 A CN201410192780 A CN 201410192780A CN 104035960 A CN104035960 A CN 104035960A
- Authority
- CN
- China
- Prior art keywords
- event
- information
- clicks
- internet
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及网络信息采集和分析方法,具体涉及互联网资讯信息热点预测方法,本发明提供的互联网资讯信息热点预测方法,是基于目前资讯信息热点预测的广泛需求及遇到的瓶颈,针对Web2.0下互联网信息活动中用户高度参与的特点,建立了热点资讯信息评价模型,并给出了互联网热度评价算法。实验结果表明算法能够综合利用用户反馈和网页等信息来准确的评价信息热度。
Description
技术领域
本发明涉及网络信息采集和分析方法,具体涉及互联网资讯信息热点预测方法。
背景技术
互联网上每时每刻都有数十亿条的资讯信息被用户发布、获取、评价与传播,如何在这动态而分散信息活动中挖掘其中的热点话题成为互联网的研究重点,在互联网信息舆情监控和引导方面有着重要的意义,传统的互联网热点资讯的挖掘方法主要针对资讯数据本身进行挖掘,如基于基本资讯内容进行分类和聚类,然后基于热点或敏感的关键字的进行分析和预测,但网民才是互联网的主角,缺少用户对资讯信息的反馈数据的深入挖掘,热点预测的精确性较低,但热点的资讯信息容易引起了大量网民的关注和讨论,话题参与者集思广益,纷纷提出了自己的观点和看法,往往可以延伸到很多其它的社会问题。正因如此,有很多不良或不法的言论就会借机滋生出来,如不加以扼制,可能会对社会造成不良的影响。舆情调控要实现因地制宜,有的放矢,所以就需要对这种“热点资讯”进行重点和有力度的调控。
发明内容
针对上述技术问题,本发明提供一种热点资讯信息评价模型,具体的技术方案为:
互联网资讯信息热点预测方法,包括以下步骤,
(1)通过网络爬虫定期采集互联网上的资讯信息及该资讯信息相关的网民的参与情况,所述资讯信息包括标题、关键字、摘要、正文内容,所述的资讯信息相关的网民参与情况包括参与数和点击时间,所述的参与数包括点击数、评论数;
(2)对上述采集到的资讯信息进行预处理,所述的预处理包括过滤垃圾信息和数据排重,最后将预处理后的资讯信息保存到数据库中;
(3)对预处理后的资讯信息进行聚类分析,把内容有关联的信息运用聚类算法聚合到一起形成一个事件,最终输出为一系列事件集合;
(4)循环第(3)步骤输出的结果事件集合,汇总每一个事件中资讯信息的点击数和评论数,把汇总后的点击数和评论数作为该事件的点击数和评论数,保存到数据库;
(5)循环第(3)步骤输出的结果事件集合,计算每一个事件的得分,然后保存到数据库;
(6)循环第(5)步骤输出的结果事件集合,按照事件得分的高低进行倒序排序,其中得分最高的为最热事件;
(7)选择第(6)步骤计算的结果中排序靠前的n条事件,然后根据预测模型预测事件未来的发展趋势和热度,如果事件的热度处于上升趋势则作为重点事件进行分析和监控。
具体的,第(3)步骤所述的聚类算法使用single-pass算法,具体步骤如下:
(a)接收一篇互联网资讯信息的文本向量d;
(b)文本向量d逐一与已有的事件中的各资讯信息进行相似度计算,并取最大者作为与该话题的相似度;
(c)在所有事件间选出与文本向量d相似度最大的一个,以及此时的相似度值;
(d)如果相似度大于阈值TC,文本向量d所对应的互联网资讯信息被分配给这个事件,跳转至步骤(f);
(e)如果相似度小于阈值TC,文本向量d所对应的互联网资讯信息不属于已有的事件,创建新事件,同时把这篇资讯归属创建的新的事件下;
(f)本次聚类结束,等待新的资讯信息到来。
具体的,第(5)步骤所述计算每一个事件的得分步骤为:
(a)从数据库中获取事件的点击数、评论数,其中点击数标记为C,评论数标记为R;
(b)循环计算事件集合中所有事件的点击数平均值、评论数平均值,其中点击数平均值标记为average(C),评论数平均值标记为average(R);
(c)循环计算事件集合中所有事件的评论数和点击数比值,然后以比值大小排序比较,计算出最大的比值,其中评论数和点击数最大比值标记为max(R/C);
(d)计算每一个事件的得分的公式为:
S(E)=a1(C/average(C))+a2(R/average(R))+a3((R/C)/max(R/C))
其中S(E)为事件的总分,a1、a2、a3为权重因子,a1的值是0.2,a2的值是0.3,a3的值是0.8,/符号表示两个数字相除。
具体的,第(7)步骤所述的预测模型的预测算法包括以下步骤:
(a)按第(1)步骤采集间隔的时间,每段间隔时间划分为一个槽,从数据库中获取这段时间中事件点击的总数,对应到这个槽中,用数组这种数据结构存储数据,其中数组的下标是时间,表示距离最新点击查看事件的时间;数组元素的值是点击数,表示间隔时间内的点击数,最后把数组对应到平面直角坐标系中,其中数组的下标做为横坐标,数组元素的值作为纵坐标,在平面直角坐标系中得到离散的点,使用高斯函数拟合经过这些离散点的曲线;
以上所述的高斯函数公式为:
经过每条事件的实际数据可推导出高斯函数公式a,b,c的值;
(b)对y=f(x)关于自变量x求导,得y'(x),令y'(x)=0,求出最大的极值点,设其为xm;如果满足以下两种情况之一,则认为该事件在未来一定时间内很有可能变得活跃:
(1)y=f(x)没有极值点,且使得y'(x)>0;
(2)若使y'(x)>0;
当条件(1)成立时,说明y'(x)>0,即y(x)单调性递增,表示事件的活跃度上升;
当条件(2)成立时,说明当到达xm后的某时刻x时,y'(x)>0,y(x)开始单调递增,同样以说明事件热度正处于上升的状态;
如果存在点xn,使得y'(xn)=0,说明xn是热度走势中的一个转折点,此时,找出最大的使得y'(x)=0成立的点xmax,考察满足xt>xmax的xt,如果y'(xt)<0,说明该事件热度正处于下降的状态;相反地,如果y'(xt)>0,说明热度正处于上升的状态。
本发明提供的互联网资讯信息热点预测方法,是基于目前资讯信息热点预测的广泛需求及遇到的瓶颈,针对Web2.0下互联网信息活动中用户高度参与的特点,建立了热点资讯信息评价模型,并给出了互联网热度评价算法。实验结果表明算法能够综合利用用户反馈和网页等信息来准确的评价信息热度。
附图说明
图1是本发明的流程图。
图2是本发明高斯函数拟合离散点的曲线。
具体实施方式
结合实施例说明本发明的具体实施方式。
互联网资讯信息热点预测方法,本实施例以资讯信息中的新闻信息为例,如图1所示,包括以下步骤,
(1)通过网络爬虫定期采集互联网上的新闻信息及该新闻信息相关的网民的参与情况,所述新闻信息包括标题、关键字、摘要、正文内容,所述的新闻信息相关的网民参与情况包括参与数和点击时间,所述的参与数包括点击数、评论数,所述的点击数标记为C,所述的评论数标记为R;
(2)对上述采集到的新闻信息进行预处理,所述的预处理包括过滤 垃圾信息和数据排重,最后将预处理后的新闻信息保存到数据库中;
(3)对预处理后的新闻信息进行聚类分析,把内容有关联的信息运用聚类算法聚合到一起形成一个事件,最终输出为一系列事件集合;所述事件标记为E,事件集合标记为N;
所述的聚类算法使用single-pass算法,具体步骤如下:
(a)接收一篇互联网新闻信息的文本向量d;
(b)文本向量d逐一与已有的事件中的各新闻信息进行相似度计算,并取最大者作为与该话题的相似度;
所述的相似度计算是对新闻信息的标题、关键字、摘要的智能分词,提取文本特征词,然后用文本特征词的权重组合为一个空间向量来数值化文本,进行相似计算。
(c)在所有事件间选出与文本向量d相似度最大的一个,以及此时的相似度值;
(d)如果相似度大于阈值TC,文本向量d所对应的互联网新闻信息被分配给这个事件,跳转至步骤(f);
(e)如果相似度小于阈值TC,文本向量d所对应的互联网新闻信息不属于已有的事件,创建新事件,同时把这篇新闻归属创建的新的事件下;
(f)本次聚类结束,等待新的新闻信息到来。
(4)循环第(3)步骤输出的结果事件集合,汇总每一个事件中新闻信息的点击数和评论数,把汇总后的点击数和评论数作为该事件的点击数和评论数,保存到数据库;
(5)循环第(3)步骤输出的结果事件集合,计算每一个事件的得分,然后保存到数据库;
其中,所述计算每一个事件得分的步骤为:
(a)从数据库中获取事件的点击数、评论数,其中点击数标记为C,评论数标记为R;
(b)循环计算事件集合中所有事件的点击数平均值、评论数平均值,其中点击数平均值标记为average(C),评论数平均值标记为average(R);
(c)循环计算事件集合中所有事件的评论数和点击数比值,然后以比值大小排序比较,计算出最大的比值,其中评论数和点击数最大比值标记为max(R/C);
(d)计算每一个事件的得分的公式为:
S(E)=a1(C/average(C))+a2(R/average(R))+a3((R/C)/max(R/C))
其中S(E)为事件的总分,a1、a2、a3为权重因子,a1的值是0.2,a2的值是0.3,a3的值是0.8,/符号表示两个数字相除。
(6)循环第(5)步骤输出的结果事件集合,按照事件得分的高低进行倒序排序,其中得分最高的为最热事件;
(7)选择第(6)步骤计算的结果中排序靠前的n条事件,然后根据预测模型预测事件未来的发展趋势和热度,如果事件的热度处于上升趋势则作为重点事件进行分析和监控。
以上所述的每一个事件的预测算法包括以下步骤:
(a)按第(1)步骤采集间隔的时间,每段间隔30分钟划分为 一个槽,从数据库中获取这段时间中事件点击的总数,对应到这个槽中,用数组这种数据结构存储数据,其中数组的下标是时间,表示距离最新点击查看事件的时间;数组元素的值是点击数,表示间隔时间内的点击数,最后把数组对应到平面直角坐标系中,如图2所示,其中数组的下标作为横坐标,数组元素的值作为纵坐标,在平面直角坐标系中得到离散的点,使用高斯函数拟合经过这些离散点的曲线;
以上所述的高斯函数公式为:
经过每条事件的实际数据可推导出高斯函数公式a,b,c的值;
(b)对y=f(x)关于自变量x求导,得y'(x),令y'(x)=0,求出最大的极值点,设其为xm;如果满足以下两种情况之一,则认为该事件在未来一定时间内很有可能变得活跃:
(1)y=f(x)没有极值点,且使得y'(x)>0;
(2)若使y'(x)>0;
当条件(1)成立时,说明y'(x)>0,即y(x)单调性递增,表示事件的活跃度上升;
当条件(2)成立时,说明当到达xm后的某时刻x时,y'(x)>0,y(x)开始单调递增,同样以说明事件热度正处于上升的状态;
如果存在点xn,使得y'(xn)=0,说明xn是热度走势中的一个转折点,此时,找出最大的使得y'(x)=0成立的点xmax,考察满足xt>xmax的xt,如果y'(xt)<0,说明该事件热度正处于下降的状态;相反地,如果y'(xt)>0,说明热度正处于上升的状态。
Claims (4)
1.互联网资讯信息热点预测方法,其特征在于:包括以下步骤,
(1)通过网络爬虫定期采集互联网上的资讯信息及该资讯信息相关的网民的参与情况,所述资讯信息包括标题、关键字、摘要、正文内容,所述的资讯信息相关的网民参与情况包括参与数和点击时间,所述的参与数包括点击数、评论数;
(2)对上述采集到的资讯信息进行预处理,所述的预处理包括过滤垃圾信息和数据排重,最后将预处理后的资讯信息保存到数据库中;
(3)对预处理后的资讯信息进行聚类分析,把内容有关联的信息运用聚类算法聚合到一起形成一个事件,最终输出为一系列事件集合;
(4)循环第(3)步骤输出的结果事件集合,汇总每一个事件中资讯信息的点击数和评论数,把汇总后的点击数和评论数作为该事件的点击数和评论数,保存到数据库;
(5)循环第(3)步骤输出的结果事件集合,计算每一个事件的得分,然后保存到数据库;
(6)循环第(5)步骤输出的结果事件集合,按照事件得分的高低进行倒序排序,其中得分最高的为最热事件;
(7)选择第(6)步骤计算的结果中排序靠前的n条事件,然后根据预测模型预测事件未来的发展趋势和热度,如果事件的热度处于上升趋势则作为重点事件进行分析和监控。
2.根据权利要求1所述的互联网资讯信息的热点预测方法,其特征在于:第(3)步骤所述的聚类算法使用single-pass算法,具体步骤如下:
(a)接收一篇互联网资讯信息的文本向量d;
(b)文本向量d逐一与已有的事件中的各资讯信息进行相似度计算,并取最大者作为与该话题的相似度;
(c)在所有事件间选出与文本向量d相似度最大的一个,以及此时的相似度值;
(d)如果相似度大于阈值TC,文本向量d所对应的互联网资讯信息被分配给这个事件,跳转至步骤(f);
(e)如果相似度小于阈值TC,文本向量d所对应的互联网资讯信息不属于已有的事件,创建新事件,同时把这篇资讯归属创建的新的事件下;
(f)本次聚类结束,等待新的资讯信息到来。
3.根据权利要求1所述的互联网资讯信息的热点预测方法,其特征在于:第(5)步骤所述计算每一个事件的得分步骤为:
(a)从数据库中获取事件的点击数、评论数,其中点击数标记为C,评论数标记为R;
(b)循环计算事件集合中所有事件的点击数平均值、评论数平均值,其中点击数平均值标记为average(C),评论数平均值标记为average(R);
(c)循环计算事件集合中所有事件的评论数和点击数比值,然 后以比值大小排序比较,计算出最大的比值,其中评论数和点击数最大比值标记为max(R/C);
(d)计算每一个事件的得分的公式为:
S(E)=a1(C/average(C))+a2(R/average(R))+a3((R/C)/max(R/C))
其中S(E)为事件的总分,a1、a2、a3为权重因子,a1的值是0.2,a2的值是0.3,a3的值是0.8,/符号表示两个数字相除。
4.根据权利要求1所述的互联网资讯信息的热点预测方法,其特征在于:第(7)步骤所述的预测模型的预测算法包括以下步骤:
(a)按第(1)步骤采集间隔的时间,每段间隔时间划分为一个槽,从数据库中获取这段时间中事件点击的总数,对应到这个槽中,用数组这种数据结构存储数据,其中数组的下标是时间,表示距离最新点击查看事件的时间;数组元素的值是点击数,表示间隔时间内的点击数,最后把数组对应到平面直角坐标系中,其中数组的下标做为横坐标,数组元素的值作为纵坐标,在平面直角坐标系中得到离散的点,使用高斯函数拟合经过这些离散点的曲线;
以上所述的高斯函数公式为:
经过每条事件的实际数据可推导出高斯函数公式a,b,c的值;
(b)对y=f(x)关于自变量x求导,得y'(x),令y'(x)=0,求出最大的极值点,设其为xm;如果满足以下两种情况之一,则认为该事件在未来一定时间内很有可能变得活跃:
(1)y=f(x)没有极值点,且使得y'(x)>0;
(2)若使y'(x)>0;
当条件(1)成立时,说明y'(x)>0,即y(x)单调性递增,表示事件的活跃度上升;
当条件(2)成立时,说明当到达xm后的某时刻x时,y'(x)>0,y(x)开始单调递增,同样以说明事件热度正处于上升的状态;
如果存在点xn,使得y'(xn)=0,说明xn是热度走势中的一个转折点,此时,找出最大的使得y'(x)=0成立的点xmax,考察满足xt>xmax的xt,如果y'(xt)<0,说明该事件热度正处于下降的状态;相反地,如果y'(xt)>0,说明热度正处于上升的状态。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410192780.4A CN104035960A (zh) | 2014-05-08 | 2014-05-08 | 互联网资讯信息热点预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410192780.4A CN104035960A (zh) | 2014-05-08 | 2014-05-08 | 互联网资讯信息热点预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104035960A true CN104035960A (zh) | 2014-09-10 |
Family
ID=51466730
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410192780.4A Pending CN104035960A (zh) | 2014-05-08 | 2014-05-08 | 互联网资讯信息热点预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104035960A (zh) |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104484329A (zh) * | 2014-10-31 | 2015-04-01 | 浙江工商大学 | 基于评论中心词时序变化分析的消费热点追踪方法及装置 |
CN104657496A (zh) * | 2015-03-09 | 2015-05-27 | 杭州朗和科技有限公司 | 一种计算信息热度值的方法和设备 |
CN105138577A (zh) * | 2015-07-30 | 2015-12-09 | 成都布林特信息技术有限公司 | 一种基于大数据的事件演化分析方法 |
CN105718590A (zh) * | 2016-01-27 | 2016-06-29 | 福州大学 | 面向多租户的SaaS舆情监控系统及方法 |
CN105824959A (zh) * | 2016-03-31 | 2016-08-03 | 首都信息发展股份有限公司 | 舆情监控方法及系统 |
CN106096017A (zh) * | 2016-06-24 | 2016-11-09 | 百度在线网络技术(北京)有限公司 | 搜索结果提供方法以及装置 |
CN107038193A (zh) * | 2016-11-17 | 2017-08-11 | 阿里巴巴集团控股有限公司 | 一种文本信息的处理方法和装置 |
CN107122481A (zh) * | 2017-05-04 | 2017-09-01 | 成都华栖云科技有限公司 | 新闻热度实时在线预测方法 |
CN107908616A (zh) * | 2017-10-18 | 2018-04-13 | 北京京东尚科信息技术有限公司 | 预测趋势词的方法和装置 |
CN108153914A (zh) * | 2018-01-25 | 2018-06-12 | 北京东方科诺科技发展有限公司 | 一种基于感知最大化的网络突发热点的感知方法 |
CN108197112A (zh) * | 2018-01-19 | 2018-06-22 | 成都睿码科技有限责任公司 | 一种从新闻中提取事件的方法 |
CN108205589A (zh) * | 2017-12-29 | 2018-06-26 | 成都优易数据有限公司 | 一种热度迭代计算方法 |
CN108376175A (zh) * | 2018-03-02 | 2018-08-07 | 成都睿码科技有限责任公司 | 一种展示新闻事件的可视化方法 |
CN108959479A (zh) * | 2018-06-21 | 2018-12-07 | 成都睿码科技有限责任公司 | 一种基于文本相似度的事件情感分类方法 |
CN109472415A (zh) * | 2018-11-15 | 2019-03-15 | 成都智库二八六信息技术有限公司 | 一种通过动力学特性预测社交媒体中事件规模的方法 |
CN109509558A (zh) * | 2018-11-20 | 2019-03-22 | 河南省疾病预防控制中心 | 基于b/s架构的发热疫情快速反应智能公卫服务系统 |
CN109960756A (zh) * | 2019-03-19 | 2019-07-02 | 国家计算机网络与信息安全管理中心 | 新闻事件信息归纳方法 |
CN111078867A (zh) * | 2018-10-19 | 2020-04-28 | 北京国双科技有限公司 | 一种文本分类方法及装置 |
CN111416741A (zh) * | 2020-03-17 | 2020-07-14 | 李惠芳 | 一种基于互联网技术的事件热点预测方法 |
CN113946736A (zh) * | 2021-10-18 | 2022-01-18 | 北京清博智能科技有限公司 | 一种计算事件热度系统及方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101394311A (zh) * | 2008-11-12 | 2009-03-25 | 北京交通大学 | 一种基于时间序列的网络舆情预测方法 |
CN101477556A (zh) * | 2009-01-22 | 2009-07-08 | 苏州智讯科技有限公司 | 一种从互联网海量信息中发现热点的方法 |
CN101556582A (zh) * | 2008-04-09 | 2009-10-14 | 上海复旦光华信息科技股份有限公司 | 论坛网民兴趣分析预测系统 |
US8005703B2 (en) * | 2008-07-18 | 2011-08-23 | International Business Machines Corporation | Event scheduling forecasting for a calendaring system using historically collected event data |
CN102708153A (zh) * | 2012-04-18 | 2012-10-03 | 中国信息安全测评中心 | 自适应在线社交网络热点话题发现预测方法及系统 |
CN102937960A (zh) * | 2012-09-06 | 2013-02-20 | 北京邮电大学 | 突发事件热点话题的识别与评估装置和方法 |
-
2014
- 2014-05-08 CN CN201410192780.4A patent/CN104035960A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101556582A (zh) * | 2008-04-09 | 2009-10-14 | 上海复旦光华信息科技股份有限公司 | 论坛网民兴趣分析预测系统 |
US8005703B2 (en) * | 2008-07-18 | 2011-08-23 | International Business Machines Corporation | Event scheduling forecasting for a calendaring system using historically collected event data |
CN101394311A (zh) * | 2008-11-12 | 2009-03-25 | 北京交通大学 | 一种基于时间序列的网络舆情预测方法 |
CN101477556A (zh) * | 2009-01-22 | 2009-07-08 | 苏州智讯科技有限公司 | 一种从互联网海量信息中发现热点的方法 |
CN102708153A (zh) * | 2012-04-18 | 2012-10-03 | 中国信息安全测评中心 | 自适应在线社交网络热点话题发现预测方法及系统 |
CN102937960A (zh) * | 2012-09-06 | 2013-02-20 | 北京邮电大学 | 突发事件热点话题的识别与评估装置和方法 |
Non-Patent Citations (2)
Title |
---|
卢珺珈: ""基于BBS的热点话题发现与态势预测技术的研究"", 《智能计算机与应用》 * |
殷风景 等: ""一种面向网络话题发现的增量文本聚类算法"", 《计算机应用研究》 * |
Cited By (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104484329B (zh) * | 2014-10-31 | 2018-07-06 | 浙江工商大学 | 基于评论中心词时序变化分析的消费热点追踪方法及装置 |
CN104484329A (zh) * | 2014-10-31 | 2015-04-01 | 浙江工商大学 | 基于评论中心词时序变化分析的消费热点追踪方法及装置 |
CN104657496A (zh) * | 2015-03-09 | 2015-05-27 | 杭州朗和科技有限公司 | 一种计算信息热度值的方法和设备 |
CN104657496B (zh) * | 2015-03-09 | 2018-08-14 | 杭州朗和科技有限公司 | 一种计算信息热度值的方法和设备 |
CN105138577A (zh) * | 2015-07-30 | 2015-12-09 | 成都布林特信息技术有限公司 | 一种基于大数据的事件演化分析方法 |
CN105718590A (zh) * | 2016-01-27 | 2016-06-29 | 福州大学 | 面向多租户的SaaS舆情监控系统及方法 |
CN105824959A (zh) * | 2016-03-31 | 2016-08-03 | 首都信息发展股份有限公司 | 舆情监控方法及系统 |
CN105824959B (zh) * | 2016-03-31 | 2021-09-10 | 首都信息发展股份有限公司 | 舆情监控方法及系统 |
CN106096017A (zh) * | 2016-06-24 | 2016-11-09 | 百度在线网络技术(北京)有限公司 | 搜索结果提供方法以及装置 |
CN107038193A (zh) * | 2016-11-17 | 2017-08-11 | 阿里巴巴集团控股有限公司 | 一种文本信息的处理方法和装置 |
CN107122481A (zh) * | 2017-05-04 | 2017-09-01 | 成都华栖云科技有限公司 | 新闻热度实时在线预测方法 |
CN107122481B (zh) * | 2017-05-04 | 2020-06-30 | 成都华栖云科技有限公司 | 新闻热度实时在线预测方法 |
CN107908616B (zh) * | 2017-10-18 | 2022-01-28 | 北京京东尚科信息技术有限公司 | 预测趋势词的方法和装置 |
CN107908616A (zh) * | 2017-10-18 | 2018-04-13 | 北京京东尚科信息技术有限公司 | 预测趋势词的方法和装置 |
CN108205589A (zh) * | 2017-12-29 | 2018-06-26 | 成都优易数据有限公司 | 一种热度迭代计算方法 |
CN108197112A (zh) * | 2018-01-19 | 2018-06-22 | 成都睿码科技有限责任公司 | 一种从新闻中提取事件的方法 |
CN108153914A (zh) * | 2018-01-25 | 2018-06-12 | 北京东方科诺科技发展有限公司 | 一种基于感知最大化的网络突发热点的感知方法 |
CN108153914B (zh) * | 2018-01-25 | 2021-03-23 | 北京东方科诺科技发展有限公司 | 一种基于感知最大化的网络突发热点的感知方法 |
CN108376175A (zh) * | 2018-03-02 | 2018-08-07 | 成都睿码科技有限责任公司 | 一种展示新闻事件的可视化方法 |
CN108376175B (zh) * | 2018-03-02 | 2022-05-13 | 成都睿码科技有限责任公司 | 一种展示新闻事件的可视化方法 |
CN108959479A (zh) * | 2018-06-21 | 2018-12-07 | 成都睿码科技有限责任公司 | 一种基于文本相似度的事件情感分类方法 |
CN108959479B (zh) * | 2018-06-21 | 2022-03-25 | 成都睿码科技有限责任公司 | 一种基于文本相似度的事件情感分类方法 |
CN111078867A (zh) * | 2018-10-19 | 2020-04-28 | 北京国双科技有限公司 | 一种文本分类方法及装置 |
CN109472415B (zh) * | 2018-11-15 | 2021-11-19 | 成都智库二八六一信息技术有限公司 | 一种通过动力学特性预测社交媒体中事件规模的方法 |
CN109472415A (zh) * | 2018-11-15 | 2019-03-15 | 成都智库二八六信息技术有限公司 | 一种通过动力学特性预测社交媒体中事件规模的方法 |
CN109509558A (zh) * | 2018-11-20 | 2019-03-22 | 河南省疾病预防控制中心 | 基于b/s架构的发热疫情快速反应智能公卫服务系统 |
CN109960756A (zh) * | 2019-03-19 | 2019-07-02 | 国家计算机网络与信息安全管理中心 | 新闻事件信息归纳方法 |
CN111416741A (zh) * | 2020-03-17 | 2020-07-14 | 李惠芳 | 一种基于互联网技术的事件热点预测方法 |
CN113946736A (zh) * | 2021-10-18 | 2022-01-18 | 北京清博智能科技有限公司 | 一种计算事件热度系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104035960A (zh) | 互联网资讯信息热点预测方法 | |
Li et al. | An influence maximization method based on crowd emotion under an emotion-based attribute social network | |
De Choudhury et al. | What makes conversations interesting? themes, participants and consequences of conversations in online social media | |
Zhou et al. | Preference-based mining of top-K influential nodes in social networks | |
CN103617169B (zh) | 一种基于Hadoop的微博热点话题提取方法 | |
CN107943905B (zh) | 一种热点话题分析方法及系统 | |
CN103812872A (zh) | 一种基于混合狄利克雷过程的网络水军行为检测方法及系统 | |
CN103914491B (zh) | 对优质用户生成内容的数据挖掘方法和系统 | |
CN103838819A (zh) | 一种信息发布方法及系统 | |
CN102004774A (zh) | 基于统一概率模型的个性化用户标签建模与推荐方法 | |
CN104536956A (zh) | 一种基于微博平台的事件可视化方法及系统 | |
CN105608200A (zh) | 一种网络舆论趋势预测分析方法 | |
CN105550275A (zh) | 一种微博转发量预测方法 | |
Tang et al. | Social media-based disaster research: Development, trends, and obstacles | |
CN103729388A (zh) | 用于网络用户发表状态的实时热点检测方法 | |
Badache et al. | Fresh and Diverse Social Signals: any impacts on search? | |
Farseev et al. | bbridge: A big data platform for social multimedia analytics | |
CN102663027A (zh) | 一种网页人群属性的预测方法 | |
CN103744958B (zh) | 一种基于分布式计算的网页分类方法 | |
CN105117466A (zh) | 一种互联网信息筛选系统及方法 | |
Chen et al. | Cost-effective node monitoring for online hot eventdetection in sina weibo microblogging | |
CN107729569B (zh) | 一种融合网络结构和文本信息的社交关系预测方法 | |
Wang et al. | When to make a topic popular again? a temporal model for topic rehotting prediction in online social networks | |
Zhang et al. | SKIF: a data imputation framework for concept drifting data streams | |
CN105468669A (zh) | 一种融合用户关系的自适应微博话题追踪方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20140910 |