CN105608200A - 一种网络舆论趋势预测分析方法 - Google Patents
一种网络舆论趋势预测分析方法 Download PDFInfo
- Publication number
- CN105608200A CN105608200A CN201510993710.3A CN201510993710A CN105608200A CN 105608200 A CN105608200 A CN 105608200A CN 201510993710 A CN201510993710 A CN 201510993710A CN 105608200 A CN105608200 A CN 105608200A
- Authority
- CN
- China
- Prior art keywords
- public opinion
- network public
- prediction analysis
- analysis method
- trend prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Abstract
本发明涉及互联网信息分析技术领域,特别是一种网络舆论趋势预测分析方法,包括以下步骤,步骤S101:确定指标体系,爬取网络舆论信息,通过预处理获得所需指标的时间序列;步骤S102:建立模型,在获取得到的时间序列上建立候选模型;步骤S103:选取最优模型,从建立的候选模型中比较选取最优模型;步骤S104:网络舆论趋势预测分析,基于选择的最优模型对网络舆论趋势进行预测分析。采用上述方法后,本发明滞后参数的可调性能够灵活的适应实际需求,同时引入MVE来作为模型选择的判断标准,提高了对特定舆情发展趋势波动的预测能力。最终,可通过新的数据对模型进行修正,为长期追踪预测创造了可能。
Description
技术领域
本发明涉及互联网信息分析技术领域,特别是一种网络舆论趋势预测分析方法。
背景技术
网络舆情是以网络为载体,以事件为核心,是广大网民情感、态度、意见、观点的表达,传播与互动,以及后续影响力的集合。随着信息时代的发展与普及,网络已渗入到社会的各个层次。截至2014年12月,我国网民规模达6.49亿。网民可以通过多种途径迅速地从网络上获取社会各类信息,并将自己的主观意见发布与互联网上,与他人进行交流。通过这种快速以及广泛的信息交流,事件得以扩张形成舆情。特别是微博的发展,增加了社会事件的透明度,加快了热点事件的传播速度。在这种舆论自由的环境下,不良的谣言或者攻击性的评论很容易激发社会矛盾,进一步导致重大社会事件,因此舆情监控显得尤为重要。
舆情监控能帮助有关部门及时了解热点舆情信息,提高对于舆情的应对能力,根据舆情发展趋势采取相应措施避免网络暴力带来的负面影响,从而构建和谐的网络言论环境。
目前国内市场主要的舆情产品具有的功能有:热点识别能力、倾向性分析与统计、主题跟踪、信息自动摘要功能、趋势分析、突发事件分析、统计报告等。
趋势分析是在历史舆情发展的基础上对未来发展进行预测。目前有效的预测方法包括大致3类:
1)通过舆情的历史数据预测热点的爆发。
2)对历史事件进行聚类,获取同类别热点的发展变化趋势。
3)对舆论数进行数据挖掘如时间序列分析、人工神经网络等,预测未来舆论数。
这些方法在一定程度上能够预测舆情的发展,但也存在各自的局限性。前两种方法对于热点的爆发能够有预见性,但是对于特定舆情的未来发展趋势并不能做出解释。类二的分析也只是考虑了单纯的时间序列,并没有结合考虑影响舆论发展的推动因素。同时均方误差最小的判断标准也不适用于预测舆情的发展波动趋势。因此需要一种快速可靠的网络舆情预测方法来预测舆情事件的发展波动趋势。
中国发明专利申请CN103198078A公开了一种互联网新闻事件报道趋势分析方法,包括以下步骤:
(1)根据配置的新闻事件的特征信息,实时采集互联网中的新闻信息;
(2)预处理所述新闻信息,筛选出发布时间在设置的新闻事件的统计周期内的新闻信息;
(3)分析筛选出的新闻信息的征文信息,得到新闻信息的主题及主题信息;所述主题包括存在主题信息的主题和不存在主题信息的源主题;
(4)分析当前统计周期与前一统计周期的主题,得出当前统计周期与前一统计周期之间的相同主题以及各相同主题的关联信息数;
(5)根据所述关联信息数,得出转化主题;所述转化主题是指当前统计周期该相同主题的关联信息数大于或等于前一统计周期该相同主题的关联信息数;
(6)获取设定时间段内的源主题和转化主题的关联信息数,并展现源主题和转化主题的关联信息数随时间的分布趋势。
发明内容
本发明需要解决的技术问题是提供一种微博舆论趋势分析方法。
为解决上述的技术问题,本发明的一种微博舆论趋势分析方法,包括以下步骤,
步骤S101:确定指标体系,爬取网络舆论信息,通过预处理获得所需指标的时间序列;
步骤S102:建立模型,在获取得到的时间序列上建立候选模型;
步骤S103:选取最优算法,从建立的候选模型中比较选取最优模型;
步骤S104:网络舆论趋势预测分析,基于选择的最优模型对网络舆论趋势进行预测分析。
进一步的,步骤S101还包括以下步骤,
步骤S1011:确定指标体系;
步骤S1012:爬取网络舆论信息,抽样爬取网络舆情数据;
步骤S1013:关键字匹配网络舆情;
步骤S1014:数据预处理;
步骤S1015:获取相关指标时间序列,整理出符合标准的以每小时信息为单位的各指标时间序列:日期、时点、原创帖评论数、原创帖转发数、转发贴评论数、转发贴转发数、平均活跃度、平均影响力、综合贴数,并将上述指标作为建模的自变量。
更进一步的,所述步骤S1015中同时纳入根据历史数据折算的作者活跃度和影响力指标作为建模的自变量。
更进一步的,步骤S102中根据步骤S101获得所需指标的时间序列作为自变量,另外将当前时刻为止,根据关键字索引出的舆论的评论文数作为因变量;根据滞后参数和选择的算法得到相应的映射,具体表示如下:
其中n:n个时间点m:m个自变量t:滞后参数。
更进一步的,所述步骤S102中的算法包括为简单线性回归、决策树回归、随机森林回归、支持向量机、bagging回归算法中的一种。
更进一步的,所述步骤S102中的简单线性回归、决策树回归、随机森林回归、支持向量机、bagging回归算法中引入MVE来作为算法选择的判断标准。
更进一步的,所述步骤S103中选择随机森林回归算法建立的模型为最优模型。
更进一步的,所述步骤S102中随机森林回归算法中采取基尼不纯度作为随机森林节点分割的标准。
进一步的,步骤S103之后还包括步骤S104模型修正,当有新的时点数据出现时,可将其纳入指标体系作为参数,进行模型修正。
采用上述方法后,本发明活跃度与影响力作为间接获取的指标,能从侧面上反映舆情事件的扩张潜能,对预测有较大帮助。滞后参数的可调性能够灵活的适应实际需求,同时引入MVE(平均误差方差)来作为模型选择的判断标准,提高了对特定舆情发展趋势波动的预测能力。最终,可通过新的数据对模型进行修正,为长期追踪预测创造了可能。
附图说明
下面将结合附图和具体实施方式对本发明作进一步详细的说明。
图1为本发明一种网络舆论趋势预测分析方法的流程图。
图2为本发明建立最优模型的选择过程。
图3a为本发明通过简单线性回归算法模拟得到的走势图。
图3b为本发明通过随机森林算法模拟得到的走势图。
图3c为本发明通过bagging回归算法模拟得到的走势图。
图3d为本发明通过决策树回归算法模拟得到的走势图。
图3e为本发明通过支持向量机算法模拟得到的走势图。
图4a为本发明随机森林回归算法中采取基尼不纯度作为随机森林节点分割标准的示意图。
图4b为本发明将新时点数据纳入指标体系进行模型修正的示意图。
具体实施方式
如图1所示,本发明的一种网络舆论趋势预测分析方法,包括以下步骤,
步骤S101:确定指标体系,爬取网络舆论信息,通过预处理获得所需指标的时间序列;具体还包括以下步骤,
步骤S1011:确定指标体系;
步骤S1012:爬取网络舆论信息,抽样爬取网络舆情数据;
步骤S1013:关键字匹配网络舆情;
步骤S1014:数据预处理;
步骤S1015:获取相关指标时间序列,整理出符合标准的以每小时信息为单位的各指标时间序列:日期、时点、原创帖评论数、原创帖转发数、转发贴评论数、转发贴转发数、平均活跃度、平均影响力、综合贴数,并将上述指标作为建模的自变量。所述步骤S1015中同时纳入根据历史数据折算的作者活跃度和影响力指标作为建模的自变量。
步骤S102:建立模型,在获取得到的时间序列上建立候选模型。步骤S102中根据步骤S101获得所需指标的时间序列作为自变量,另外将当前时刻为止,根据关键字索引出的舆论的评论文数作为因变量;根据滞后参数和选择的算法得到相应的映射,具体表示如下:
其中n:n个时间点m:m个自变量t:滞后参数。
滞后参数t可根据需求进行调节,一般而言滞后参数越大,表示可预测的时间跨度越大,但预测的准度会下降。通过抽取5类舆情信息,本实施方式选择的最优滞后参数t为12小时。
如图2所示,本实施方式中,根据测试样本,简单线性回归确定滞后参数,然后根据滞后参数规整数据结构,进而进行交叉验证预处理,继而通过选择算法得到相应的映射。采取交叉验证的方法来减小抽样方法所伴随的过度拟合,从而提高模型的可适度。如图2所示,这里算法包括为简单线性回归、决策树回归、随机森林回归、支持向量机、bagging回归算法中的一种。
更进一步的,所述步骤S102中的简单线性回归、决策树回归、随机森林回归、支持向量机、bagging回归算法中引入MVE(平均误差方差)来作为算法选择的判断标准。MSE(均方误差)是来衡量平均误差的重要指标。在模型比较中一般选择MSE最小的定为最优模型。此发明旨在预测舆情事件的发展趋势,与数据值的接近程度相比更看重走势(波动)的接近程度,因此引入新的判断标准MVE。MVE主要衡量的是预测误差的波动情况,MVE越大说明真实值的走向与预测值的走向偏移较大,MVE越小则说明预测的走向与真实走向越接近,
步骤S103:选取最优算法,从建立的候选模型中比较选取最优模型。如图3a-图3e所示,随机深林回归算法得到的建立模型所生成的预测走势与实际走势最贴近,所以通过引入MVE(平均误差方差)得到步骤S102中最佳选择随机森林回归算法建立模型。如图4a所示,所述步骤S102中随机森林回归算法中采取基尼不纯度作为随机森林节点分割的标准。
步骤S104:网络舆论趋势预测分析,基于选择的最优模型对网络舆论趋势进行预测分析。
进一步的,步骤S104之后还包括步骤S105模型修正,如图4b所示,当有新的时点数据出现时,可将其纳入指标体系作为参数,进行模型修正。
虽然以上描述了本发明的具体实施方式,但是本领域熟练技术人员应当理解,这些仅是举例说明,可以对本实施方式作出多种变更或修改,而不背离发明的原理和实质,本发明的保护范围仅由所附权利要求书限定。
Claims (9)
1.一种网络舆论趋势预测分析方法,其特征在于,包括以下步骤,
步骤S101:确定指标体系,爬取网络舆论信息,通过预处理获得所需指标的时间序列;
步骤S102:建立模型,在获取得到的时间序列上建立候选模型;
步骤S103:选取最优模型,从建立的候选模型中比较选取最优模型;
步骤S104:网络舆论趋势预测分析,基于选择的最优模型对网络舆论趋势进行预测分析。
2.按照权利要求1所述的一种网络舆论趋势预测分析方法,其特征在于,步骤S101还包括以下步骤,
步骤S1011:确定指标体系;
步骤S1012:爬取网络舆论信息,抽样爬取网络舆情数据;
步骤S1013:关键字匹配网络舆情;
步骤S1014:数据预处理;
步骤S1015:获取相关指标时间序列,整理出符合标准的以每小时信息为单位的各指标时间序列:日期、时点、原创帖评论数、原创帖转发数、转发贴评论数、转发贴转发数、平均活跃度、平均影响力、综合贴数,并将上述指标作为建模的自变量。
3.按照权利要求2所述的一种网络舆论趋势预测分析方法,其特征在于:所述步骤S1015中同时纳入根据历史数据折算的作者活跃度和影响力指标作为建模的自变量。
4.按照权利要求1至3中任一项所述的一种网络舆论趋势预测分析方法,其特征在于,步骤S102中根据步骤S101获得所需指标的时间序列作为自变量,另外将当前时刻为止,根据关键字索引出的舆论的评论文数作为因变量;根据滞后参数和选择的算法得到相应的映射,具体表示如下:
其中n:n个时间点m:m个自变量t:滞后参数。
5.按照权利要求4所述的一种网络舆论趋势预测分析方法,其特征在于:所述步骤S102中的算法包括为简单线性回归、决策树回归、随机森林回归、支持向量机、bagging回归算法中的一种。
6.按照权利要求5所述的一种网络舆论趋势预测分析方法,其特征在于:所述步骤S103中的简单线性回归、决策树回归、随机森林回归、支持向量机、bagging回归算法中引入MVE来作为选取最优模型的判断标准。
7.按照权利要求6所述的一种网络舆论趋势预测分析方法,其特征在于:步骤S103中选择随机森林回归算法建立的模型为最优模型。
8.按照权利要求7所述的一种网络舆论趋势预测分析方法,其特征在于,所述步骤S102中随机森林回归算法中采取基尼不纯度作为随机森林节点分割的标准。
9.按照权利要求8所述的一种网络舆论趋势预测分析方法,其特征在于:步骤S104之后还包括步骤S105模型修正,当有新的时点数据出现时,可将其纳入指标体系作为参数,进行模型修正。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510993710.3A CN105608200A (zh) | 2015-12-28 | 2015-12-28 | 一种网络舆论趋势预测分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510993710.3A CN105608200A (zh) | 2015-12-28 | 2015-12-28 | 一种网络舆论趋势预测分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105608200A true CN105608200A (zh) | 2016-05-25 |
Family
ID=55988139
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510993710.3A Pending CN105608200A (zh) | 2015-12-28 | 2015-12-28 | 一种网络舆论趋势预测分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105608200A (zh) |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106651030A (zh) * | 2016-12-21 | 2017-05-10 | 重庆邮电大学 | 一种改进的rbf神经网络热点话题用户参与行为预测方法 |
CN106844765A (zh) * | 2017-02-22 | 2017-06-13 | 中国科学院自动化研究所 | 基于卷积神经网络的显著信息检测方法及装置 |
CN107391712A (zh) * | 2017-07-28 | 2017-11-24 | 王亚迪 | 一种网络舆论趋势预测分析方法 |
CN107451689A (zh) * | 2017-07-25 | 2017-12-08 | 中国联合网络通信集团有限公司 | 基于微博的话题趋势预测方法及装置 |
CN107516279A (zh) * | 2017-08-15 | 2017-12-26 | 皑沐(上海)文化传媒有限公司 | 一种网络舆情自动预警的方法 |
CN107742256A (zh) * | 2017-09-18 | 2018-02-27 | 中国农业大学 | 一种基于组合优化决策树的网络伪舆情识别方法 |
CN108074116A (zh) * | 2016-11-09 | 2018-05-25 | 阿里巴巴集团控股有限公司 | 信息提供方法及装置 |
CN108563686A (zh) * | 2018-03-14 | 2018-09-21 | 中国科学院自动化研究所 | 基于混合神经网络的社交网络谣言识别方法及系统 |
CN110110250A (zh) * | 2018-01-18 | 2019-08-09 | 北京京东尚科信息技术有限公司 | 信息输出方法和装置 |
CN110166275A (zh) * | 2018-05-22 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 信息处理方法、装置及存储介质 |
CN110675959A (zh) * | 2019-08-19 | 2020-01-10 | 平安科技(深圳)有限公司 | 数据智能分析方法、装置、计算机设备及存储介质 |
CN111986763A (zh) * | 2020-09-03 | 2020-11-24 | 平安国际智慧城市科技股份有限公司 | 疾病数据分析方法、装置、电子设备及存储介质 |
CN108241625B (zh) * | 2016-12-23 | 2021-10-01 | 科大讯飞股份有限公司 | 预测学生成绩变化趋势的方法及系统 |
CN113821729A (zh) * | 2021-11-19 | 2021-12-21 | 湖北橙才教育研究院有限公司 | 一种大数据安全评估分析系统及方法 |
CN115564101A (zh) * | 2022-09-22 | 2023-01-03 | 上海研途标准化技术服务有限公司 | 一种基于互联网的修订管理系统及方法 |
CN116187094A (zh) * | 2023-04-18 | 2023-05-30 | 中国标准化研究院 | 一种基于工作情况实时分析的质量工作预测系统 |
CN116990465A (zh) * | 2023-09-25 | 2023-11-03 | 北京金水永利科技有限公司 | 一种空气质量数据异常预警方法及其系统 |
CN117473144A (zh) * | 2023-12-27 | 2024-01-30 | 深圳市活力天汇科技股份有限公司 | 一种航线数据的存储方法、计算机设备及可读存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101826090A (zh) * | 2009-09-15 | 2010-09-08 | 电子科技大学 | 基于最优模型的web舆情趋势预测方法 |
CN102012929A (zh) * | 2010-11-26 | 2011-04-13 | 北京交通大学 | 网络舆情预测方法及系统 |
US20110170793A1 (en) * | 2008-09-24 | 2011-07-14 | Kazushi Sato | Image processing apparatus and method |
CN104834737A (zh) * | 2015-05-19 | 2015-08-12 | 无锡天脉聚源传媒科技有限公司 | 一种基于电视报道的舆情处理方法和装置 |
-
2015
- 2015-12-28 CN CN201510993710.3A patent/CN105608200A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110170793A1 (en) * | 2008-09-24 | 2011-07-14 | Kazushi Sato | Image processing apparatus and method |
CN101826090A (zh) * | 2009-09-15 | 2010-09-08 | 电子科技大学 | 基于最优模型的web舆情趋势预测方法 |
CN102012929A (zh) * | 2010-11-26 | 2011-04-13 | 北京交通大学 | 网络舆情预测方法及系统 |
CN104834737A (zh) * | 2015-05-19 | 2015-08-12 | 无锡天脉聚源传媒科技有限公司 | 一种基于电视报道的舆情处理方法和装置 |
Cited By (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108074116B (zh) * | 2016-11-09 | 2022-02-22 | 阿里巴巴集团控股有限公司 | 信息提供方法及装置 |
CN108074116A (zh) * | 2016-11-09 | 2018-05-25 | 阿里巴巴集团控股有限公司 | 信息提供方法及装置 |
CN106651030A (zh) * | 2016-12-21 | 2017-05-10 | 重庆邮电大学 | 一种改进的rbf神经网络热点话题用户参与行为预测方法 |
CN108241625B (zh) * | 2016-12-23 | 2021-10-01 | 科大讯飞股份有限公司 | 预测学生成绩变化趋势的方法及系统 |
CN106844765B (zh) * | 2017-02-22 | 2019-12-20 | 中国科学院自动化研究所 | 基于卷积神经网络的显著信息检测方法及装置 |
CN106844765A (zh) * | 2017-02-22 | 2017-06-13 | 中国科学院自动化研究所 | 基于卷积神经网络的显著信息检测方法及装置 |
CN107451689A (zh) * | 2017-07-25 | 2017-12-08 | 中国联合网络通信集团有限公司 | 基于微博的话题趋势预测方法及装置 |
CN107391712A (zh) * | 2017-07-28 | 2017-11-24 | 王亚迪 | 一种网络舆论趋势预测分析方法 |
CN107516279A (zh) * | 2017-08-15 | 2017-12-26 | 皑沐(上海)文化传媒有限公司 | 一种网络舆情自动预警的方法 |
CN107516279B (zh) * | 2017-08-15 | 2021-04-20 | 皑沐(上海)文化传媒有限公司 | 一种网络舆情自动预警的方法 |
CN107742256A (zh) * | 2017-09-18 | 2018-02-27 | 中国农业大学 | 一种基于组合优化决策树的网络伪舆情识别方法 |
CN110110250A (zh) * | 2018-01-18 | 2019-08-09 | 北京京东尚科信息技术有限公司 | 信息输出方法和装置 |
CN108563686A (zh) * | 2018-03-14 | 2018-09-21 | 中国科学院自动化研究所 | 基于混合神经网络的社交网络谣言识别方法及系统 |
CN110166275A (zh) * | 2018-05-22 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 信息处理方法、装置及存储介质 |
CN110166275B (zh) * | 2018-05-22 | 2021-06-11 | 腾讯科技(深圳)有限公司 | 信息处理方法、装置及存储介质 |
CN110675959A (zh) * | 2019-08-19 | 2020-01-10 | 平安科技(深圳)有限公司 | 数据智能分析方法、装置、计算机设备及存储介质 |
CN111986763A (zh) * | 2020-09-03 | 2020-11-24 | 平安国际智慧城市科技股份有限公司 | 疾病数据分析方法、装置、电子设备及存储介质 |
CN113821729A (zh) * | 2021-11-19 | 2021-12-21 | 湖北橙才教育研究院有限公司 | 一种大数据安全评估分析系统及方法 |
CN115564101A (zh) * | 2022-09-22 | 2023-01-03 | 上海研途标准化技术服务有限公司 | 一种基于互联网的修订管理系统及方法 |
CN116187094A (zh) * | 2023-04-18 | 2023-05-30 | 中国标准化研究院 | 一种基于工作情况实时分析的质量工作预测系统 |
CN116187094B (zh) * | 2023-04-18 | 2023-07-04 | 中国标准化研究院 | 一种基于工作情况实时分析的质量工作预测系统 |
CN116990465A (zh) * | 2023-09-25 | 2023-11-03 | 北京金水永利科技有限公司 | 一种空气质量数据异常预警方法及其系统 |
CN116990465B (zh) * | 2023-09-25 | 2023-12-19 | 北京金水永利科技有限公司 | 一种空气质量数据异常预警方法及其系统 |
CN117473144A (zh) * | 2023-12-27 | 2024-01-30 | 深圳市活力天汇科技股份有限公司 | 一种航线数据的存储方法、计算机设备及可读存储介质 |
CN117473144B (zh) * | 2023-12-27 | 2024-03-29 | 深圳市活力天汇科技股份有限公司 | 一种航线数据的存储方法、计算机设备及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105608200A (zh) | 一种网络舆论趋势预测分析方法 | |
Swathi et al. | An optimal deep learning-based LSTM for stock price prediction using twitter sentiment analysis | |
CN103177090B (zh) | 一种基于大数据的话题检测方法及装置 | |
CN108287858A (zh) | 自然语言的语义提取方法及装置 | |
CN103544255A (zh) | 基于文本语义相关的网络舆情信息分析方法 | |
CN107688576B (zh) | 一种cnn-svm模型的构建及倾向性分类方法 | |
CN104978332B (zh) | 用户生成内容标签数据生成方法、装置及相关方法和装置 | |
CN103870001A (zh) | 一种生成输入法候选项的方法及电子装置 | |
CN104965931A (zh) | 一种基于大数据的舆情分析方法 | |
CN107870957A (zh) | 一种基于信息增益和bp神经网络的热门微博预测方法 | |
CN104679738A (zh) | 互联网热词挖掘方法及装置 | |
Alabbas et al. | Classification of colloquial Arabic tweets in real-time to detect high-risk floods | |
CN105138577A (zh) | 一种基于大数据的事件演化分析方法 | |
Yan et al. | An improved single-pass algorithm for chinese microblog topic detection and tracking | |
CN108228808A (zh) | 确定热点事件的方法、装置和存储介质以及电子设备 | |
Kathuria et al. | Real time sentiment analysis on twitter data using deep learning (Keras) | |
CN104965930A (zh) | 一种基于大数据的突发事件演化分析方法 | |
Demirbaga | HTwitt: a hadoop-based platform for analysis and visualization of streaming Twitter data | |
Arif et al. | A machine learning based approach for opinion mining on social network data | |
KR101575779B1 (ko) | 시청자 의견의 감정 분석을 통한 프로그램 시청률 예측 방법 및 장치 | |
Ashraf et al. | Author profiling on bi-lingual tweets | |
Gyódi et al. | Informing policy with text mining: technological change and social challenges | |
US10614100B2 (en) | Semantic merge of arguments | |
Kim et al. | Comparing machine learning classifiers for movie WOM opinion mining | |
Carta et al. | Dynamic industry-specific lexicon generation for stock market forecast |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160525 |