CN107315778A - 一种基于大数据情感分析的自然语言舆情分析方法 - Google Patents
一种基于大数据情感分析的自然语言舆情分析方法 Download PDFInfo
- Publication number
- CN107315778A CN107315778A CN201710405071.3A CN201710405071A CN107315778A CN 107315778 A CN107315778 A CN 107315778A CN 201710405071 A CN201710405071 A CN 201710405071A CN 107315778 A CN107315778 A CN 107315778A
- Authority
- CN
- China
- Prior art keywords
- analysis
- sentiment
- text
- word
- natural language
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Abstract
本发明提出了一种基于大数据情感分析的自然语言舆情分析方法,其特征在于,所述自然语言舆情分析方法利用网络爬虫技术对微博平台进行原始语料信息采集,获取发布者发布的内容及抽取回复评论的内容,存盘后预处理得到短文本,文本聚类处理后的信息再筛选热点事件,采用情感词分析法得到整个文本的情感倾向。通过对热点话题的评论采用情感词分析,了解网民对这热点话题的观点及态度,识别出其情感倾向及演化规律,更好地理解用户的行为,分析热点舆情,从而为政府、企业或其他机构的决策提供重要的依据。
Description
技术领域
本发明涉及一种基于大数据情感分析的自然语言舆情分析方法,通过对热点话题的评论采用情感词分析,了解网民对这热点话题的观点及态度,识别出其情感倾向及演化规律,更好地理解用户的行为,分析热点舆情,从而为政府、企业或其他机构的决策提供重要的依据。
背景技术
舆情是“舆论情况”的简称,是指在一定的社会空间内,围绕中介性社会事件的发生、发展和变化,作为主体的民众对作为客体的社会管理者、企业、个人及其他各类组织及其政治、社会、道德等方面的取向产生和持有的社会态度。它是较多群众关于社会中各种现象、问题所表达的信念、态度、意见和情绪等等表现的总和。在某个事件发生后,广大群众会通过各种途径了解到事情的真相,随后而来的便是纷纷如雨下的评论,或支持或反对、或理性或感性、或热情参与或冷眼旁观。当一种论调得到大家的认同后,舆情甚至可以对事件的走向发生重大的影响。而一旦有心人可以从这舆情中分析出些什么,得到些什么,那么就可以做出一个正确的决定。舆情分析十分复杂,从早期从不同平台、媒介的海量数据中发掘出潜在的舆情焦点、进行预测,到大规模舆情爆发后的监控、风险评估,再到结合以往类似事件的分析数据建立风险阈值,对可能演变为行为舆情(例如游行、集会等)的事件进行防控。涉及了统计学、语义学、自然语言处理、信息检索、Web信息发掘等多方面的知识。
微博通过简洁的文字更新信息,并实现对种工具发布、分享,使信息在微博中呈现出碎片化、即时化、移动化的特征,而不再是完整的信息内容,再加上互联网微内容具有的来源广、更新快、参与性及互动性强的特点,一些过激的言谈很容易传染,甚至被盲目地操纵或利用,如果不能积极控制及回应,小的负面情绪也会像滚雪球一样慢慢变大,将政府、企业或其他机构推向风口浪尖,因此,加强微博中热点事件的发生、监控及管理等方面的研究工作也越发显得重要。
发明内容
基于上述问题,本发明目的在于提供一种基于大数据情感分析的自然语言舆情分析方法,通过对热点话题的评论采用情感词分析,了解网民对这热点话题的观点及态度,识别出其情感倾向及演化规律,更好地理解用户的行为,分析热点舆情,从而为政府、企业或其他机构的决策提供重要的依据。
针对以上问题,提供了如下技术方案:一种基于大数据情感分析的自然语言舆情分析方法,其特征在于,所述自然语言舆情分析方法利用网络爬虫技术对微博平台进行原始语料信息采集,获取发布者发布的内容及抽取回复评论的内容,存盘后预处理得到短文本,文本聚类处理后的信息再筛选热点事件,采用情感词分析法得到整个文本的情感倾向;具体包括:
采用网络爬虫软件从微博上抓取采集有效微博数据;
对采集的信息进行数据清洗、数据转化、分词处理加工得到热点事件微博及其相关的评论的短文本;
采用混合聚类算法对短文本相似度度量后进行文本聚类,筛选热点事件;
提取情感词,建立情感倾向语义模式库,将情感词与语义模式库进行模式匹配,得到整个文本的情感倾向。
本发明进一步设置为:所述自然语言舆情分析方法具体包括以下步骤:
步骤一:利用网络爬虫技术根据一定的相关性度量标准从信息流中抽取某一时间段内关于某一主题的所有信息,将短消息组合为不同主题的会话,抽取的信息保存在文本数据库;
步骤二:对采集到的文本信息去除空格、重复及无意义的词,然后对发布及评论内容进行统一的编码,采用ICTCLAS进行分词处理得到短文本;
步骤三:根据混合聚类算法对短文本由聚类模块根据其内容特征生成不同的簇,并对其提供描述信息筛选出热点事件;
步骤四:对热点事件提取情感词,建立情感倾向语义模式库,将情感词参照语义模式库进行模式匹配,计算得到一系列情感倾向值,最后将倾向值进行累加得到整个文本的情感倾向。
本发明进一步设置为:所述混合聚类算法流程如下:
(1)对分词、筛选后得到的短文本即关键词集合作为特征项;
(2)把所有特征项集合起来,计算每一个词的出现频率,作为参考词频;
(3)采用TF-IDF相似性度量方法计算特征项的权重;
(4)采用parTFT产生top-k频繁词集生成的初始聚类中心;
(5)利用k-means算法对初始聚类进行精化。
本发明进一步设置为:所述步骤(5)中的k-means算法包括两大基本步骤:(1)取得多个聚簇中心并将文档聚类;(2)重新计算聚簇中心,通过多次迭代,重复(1)、(2)的方法,得到最优的聚簇。
本发明进一步设置为:所述情感词分析法包括以下步骤:
(1)建立情感倾向语义模式库;
(2)将从热点事件中提取的情感词汇与情感倾向语义模式库中的每个词进行模式匹配,
计算其与语义模式库中每个词的语义倾向相似度,得到该情感词的一系列情感倾向值;
(3)将该情感词的一系列倾向值进行累加得到其整个文本的情感倾向。
本发明进一步设置为:所述情感倾向语义模式库综合“知网”、《学生褒贬词典》和网络流行进行语构建。
本发明的有益效果:微博作为一个新兴的网络媒体和社交平台,是网络热点重要的发源地和传播途径。本发明设计了基于大数据情感分析的自然语言舆情分析方法,短文本聚类能够有效地针对微博信息量短、稀疏性、实用性、不规范性及交互性等特点,将全部微博语料分词后产生的关键词集合在一起,统计词频,并使用常用的文本特征加权方法得到特征项的权重,对文本信息聚类,聚类出大家广泛关注、争议、议论的事件。情感词分析法,能进一步了解网民对这些热点话题持有的态度、观点、评论,识别出其情感倾向及演化规律,可以更好地理解用户的行为,分析热点舆情,也可以为政府、企业和其他机构在决策时提供重要依据。
附图说明
图1为本发明基于大数据情感分析的自然语言舆情分析方法的流程示意图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
如图1所示,一种基于大数据情感分析的自然语言舆情分析方法,所述自然语言舆情分析方法利用网络爬虫技术对微博平台进行原始语料信息采集,获取发布者发布的内容及抽取回复评论的内容,存盘后预处理得到短文本,文本聚类处理后的信息再筛选热点事件,采用情感词分析法得到整个文本的情感倾向。
上述自然语言舆情分析方法的具体包括一下步骤:
步骤一:采用网络爬虫软件从微博上抓取采集有效微博数据;
利用网络爬虫技术根据一定的相关性度量标准从信息流中抽取某一时间段内关于某一主题的所有信息,将短消息组合为不同主题的会话,抽取的信息保存在文本数据库;
步骤二:对采集的信息进行数据清洗、数据转化、分词处理加工得到热点事件微博及其相关的评论的短文本;即对采集到的文本信息去除空格、重复及无意义的词,然后对发布及评论内容进行统一的编码,采用ICTCLAS进行分词处理得到短文本;
步骤三:采用混合聚类算法对短文本相似度度量后进行文本聚类,筛选热点事件;
根据混合聚类算法对短文本由聚类模块根据其内容特征生成不同的簇,并对其提供描述信息筛选出热点事件;所述混合聚类算法流程如下:
(1)对分词、筛选后得到的短文本即关键词集合作为特征项;
(2)把所有特征项集合起来,计算每一个词的出现频率,作为参考词频;
(3)采用TF-IDF相似性度量方法计算特征项的权重;
(4)采用parTFT产生top-k频繁词集生成的初始聚类中心;
(5)利用k-means算法对初始聚类进行精化;
上述步骤(5)中的k-means算法包括两大基本步骤:①取得多个聚簇中心并将文档聚类;②重新计算聚簇中心,通过多次迭代,重复(1)、(2)的方法,得到最优的聚簇。
步骤四:提取情感词,建立情感倾向语义模式库,将情感词与语义模式库进行模式匹配,得到整个文本的情感倾向。
对热点事件提取情感词,建立情感倾向语义模式库,将情感词参照语义模式库进行模式匹配,计算得到一系列情感倾向值,最后将倾向值进行累加得到整个文本的情感倾向。所述情感词分析法具体包括以下步骤:
(1)建立情感倾向语义模式库;本发明中使用的情感倾向语义模式库综合“知网”、《学生褒贬词典》和网络流行进行语构建。
(2)将从热点事件中提取的情感词汇与情感倾向语义模式库中的每个词进行模式匹配,
计算其与语义模式库中每个词的语义倾向相似度,得到该情感词的一系列情感倾向值;
(3)将该情感词的一系列倾向值进行累加得到其整个文本的情感倾向。
微博作为一个新兴的网络媒体和社交平台,是网络热点重要的发源地和传播途径。本发明设计了基于大数据情感分析的自然语言舆情分析方法,短文本聚类能够有效地针对微博信息量短、稀疏性、实用性、不规范性及交互性等特点,将全部微博语料分词后产生的关键词集合在一起,统计词频,并使用常用的文本特征加权方法得到特征项的权重,对文本信息聚类,聚类出大家广泛关注、争议、议论的事件。情感词分析法,能进一步了解网民对这些热点话题持有的态度、观点、评论,识别出其情感倾向及演化规律,可以更好地理解用户的行为,分析热点舆情,也可以为政府、企业和其他机构在决策时提供重要依据。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变型,上述假设的这些改进和变型也应视为本发明的保护范围。
Claims (6)
1.一种基于大数据情感分析的自然语言舆情分析方法,其特征在于,所述自然语言舆情分析方法利用网络爬虫技术对微博平台进行原始语料信息采集,获取发布者发布的内容及抽取回复评论的内容,存盘后预处理得到短文本,文本聚类处理后的信息再筛选热点事件,采用情感词分析法得到整个文本的情感倾向;具体包括:
采用网络爬虫软件从微博上抓取采集有效微博数据;
对采集的信息进行数据清洗、数据转化、分词处理加工得到热点事件微博及其相关的评论的短文本;
采用混合聚类算法对短文本相似度度量后进行文本聚类,筛选热点事件;
提取情感词,建立情感倾向语义模式库,将情感词与语义模式库进行模式匹配,得到整个文本的情感倾向。
2.根据权利要求1所述的一种基于大数据情感分析的自然语言舆情分析方法,其特征在于:所述自然语言舆情分析方法具体包括以下步骤:
步骤一:利用网络爬虫技术根据一定的相关性度量标准从信息流中抽取某一时间段内关于某一主题的所有信息,将短消息组合为不同主题的会话,抽取的信息保存在文本数据库;
步骤二:对采集到的文本信息去除空格、重复及无意义的词,然后对发布及评论内容进行统一的编码,采用ICTCLAS进行分词处理得到短文本;
步骤三:根据混合聚类算法对短文本由聚类模块根据其内容特征生成不同的簇,并对其提供描述信息筛选出热点事件;
步骤四:对热点事件提取情感词,建立情感倾向语义模式库,将情感词参照语义模式库进行模式匹配,计算得到一系列情感倾向值,最后将倾向值进行累加得到整个文本的情感倾向。
3.根据权利要求1或2所述的一种基于大数据情感分析的自然语言舆情分析方法,其特征在于:所述混合聚类算法流程如下:
(1)对分词、筛选后得到的短文本即关键词集合作为特征项;
(2)把所有特征项集合起来,计算每一个词的出现频率,作为参考词频;
(3)采用TF-IDF相似性度量方法计算特征项的权重;
(4)采用parTFT产生top-k频繁词集生成的初始聚类中心;
(5)利用k-means算法对初始聚类进行精化。
4.根据权利要求3所述的一种基于大数据情感分析的自然语言舆情分析方法,其特征在于:所述步骤(5)中的k-means算法包括两大基本步骤:(1)取得多个聚簇中心并将文档聚类;(2)重新计算聚簇中心,通过多次迭代,重复(1)、(2)的方法,得到最优的聚簇。
5.根据权利要求3所述的一种基于大数据情感分析的自然语言舆情分析方法,其特征在于:所述情感词分析法包括以下步骤:
建立情感倾向语义模式库;
将从热点事件中提取的情感词汇与情感倾向语义模式库中的每个词进行模式匹配,
计算其与语义模式库中每个词的语义倾向相似度,得到该情感词的一系列情感倾向值;
将该情感词的一系列倾向值进行累加得到其整个文本的情感倾向。
6.根据权利要求5所述的一种基于大数据情感分析的自然语言舆情分析方法,其特征在于:所述情感倾向语义模式库综合“知网”、《学生褒贬词典》和网络流行进行语构建。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710405071.3A CN107315778A (zh) | 2017-05-31 | 2017-05-31 | 一种基于大数据情感分析的自然语言舆情分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710405071.3A CN107315778A (zh) | 2017-05-31 | 2017-05-31 | 一种基于大数据情感分析的自然语言舆情分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107315778A true CN107315778A (zh) | 2017-11-03 |
Family
ID=60181614
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710405071.3A Pending CN107315778A (zh) | 2017-05-31 | 2017-05-31 | 一种基于大数据情感分析的自然语言舆情分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107315778A (zh) |
Cited By (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108197271A (zh) * | 2018-01-04 | 2018-06-22 | 郑州云海信息技术有限公司 | 一种基于大数据的影视作品市场分析方法 |
CN108363699A (zh) * | 2018-03-21 | 2018-08-03 | 浙江大学城市学院 | 一种基于百度贴吧的网民学业情绪分析方法 |
CN108363784A (zh) * | 2018-01-20 | 2018-08-03 | 西北工业大学 | 一种基于文本机器学习的舆情走向预测方法 |
CN108733816A (zh) * | 2018-05-21 | 2018-11-02 | 重庆人文科技学院 | 一种微博突发事件检测方法 |
CN108959479A (zh) * | 2018-06-21 | 2018-12-07 | 成都睿码科技有限责任公司 | 一种基于文本相似度的事件情感分类方法 |
CN109214008A (zh) * | 2018-09-28 | 2019-01-15 | 珠海中科先进技术研究院有限公司 | 一种基于关键词提取的情感分析方法及系统 |
CN109271512A (zh) * | 2018-08-29 | 2019-01-25 | 中国平安保险(集团)股份有限公司 | 舆情评论信息的情感分析方法、装置及存储介质 |
CN109446405A (zh) * | 2018-09-12 | 2019-03-08 | 中国科学院自动化研究所 | 基于大数据的旅游产业推广方法及系统 |
CN109635107A (zh) * | 2018-11-19 | 2019-04-16 | 北京亚鸿世纪科技发展有限公司 | 多数据源的语义智能分析及事件场景还原的方法及装置 |
CN109670095A (zh) * | 2018-11-19 | 2019-04-23 | 成都电科成研企业管理有限公司 | 一种基于自然语义的舆情相关度匹配方法 |
CN109740042A (zh) * | 2018-11-27 | 2019-05-10 | 平安科技(深圳)有限公司 | 舆论信息的监控方法、装置及存储介质、计算机设备 |
CN109783586A (zh) * | 2019-01-21 | 2019-05-21 | 福州大学 | 基于聚类重采样的水军评论检测系统及方法 |
CN109902287A (zh) * | 2019-01-10 | 2019-06-18 | 上海言通网络科技有限公司 | 电话机器人语义理解方法及其系统 |
CN110263238A (zh) * | 2019-06-21 | 2019-09-20 | 浙江华坤道威数据科技有限公司 | 一种基于大数据的舆情聆听系统 |
CN110297986A (zh) * | 2019-06-21 | 2019-10-01 | 山东科技大学 | 一种微博热点话题的情感倾向分析方法 |
CN110533212A (zh) * | 2019-07-04 | 2019-12-03 | 西安理工大学 | 基于大数据的城市内涝舆情监测预警方法 |
CN110705288A (zh) * | 2019-09-29 | 2020-01-17 | 武汉海昌信息技术有限公司 | 一种基于大数据的舆情分析系统 |
CN110728140A (zh) * | 2018-06-30 | 2020-01-24 | 天津大学 | 基于情感分析与主题特征的突发事件舆情演化分析方法 |
CN111027328A (zh) * | 2019-11-08 | 2020-04-17 | 广州坚和网络科技有限公司 | 通过语料训练判断评论情绪正负及感情色彩的方法 |
CN111143549A (zh) * | 2019-06-20 | 2020-05-12 | 东华大学 | 一种基于主题的舆情情感演化的方法 |
CN111160019A (zh) * | 2019-12-30 | 2020-05-15 | 中国联合网络通信集团有限公司 | 一种舆情监测的方法、装置及系统 |
CN111292167A (zh) * | 2020-02-03 | 2020-06-16 | 山东爱城市网信息技术有限公司 | 基于大数据的竞品分析方法、系统、存储介质及电子设备 |
CN111401074A (zh) * | 2020-04-03 | 2020-07-10 | 山东爱城市网信息技术有限公司 | 一种基于Hadoop的短文本情感倾向性分析方法、系统及装置 |
CN111414455A (zh) * | 2020-03-20 | 2020-07-14 | 北京百度网讯科技有限公司 | 舆情分析方法、装置、电子设备及可读存储介质 |
CN111538888A (zh) * | 2020-06-05 | 2020-08-14 | 国网山东省电力公司检修公司 | 基于主动监测引擎和大数据的网络舆情烈度演化分析系统 |
CN111563190A (zh) * | 2020-04-07 | 2020-08-21 | 中国电子科技集团公司第二十九研究所 | 一种区域网络用户行为的多维度分析与监管方法及系统 |
CN111984931A (zh) * | 2020-08-20 | 2020-11-24 | 上海大学 | 一种社会事件网络文本的舆情计算与推演方法及系统 |
CN112183093A (zh) * | 2020-11-02 | 2021-01-05 | 杭州安恒信息安全技术有限公司 | 一种企业舆情分析方法、装置、设备及可读存储介质 |
CN112347230A (zh) * | 2020-11-16 | 2021-02-09 | 上海品见智能科技有限公司 | 一种基于Word2Vec的企业舆情数据分析方法 |
CN113127611A (zh) * | 2019-12-31 | 2021-07-16 | 北京中关村科金技术有限公司 | 对问句语料进行处理的方法、装置以及存储介质 |
CN113254777A (zh) * | 2021-06-07 | 2021-08-13 | 武汉卓尔数字传媒科技有限公司 | 信息推荐方法、装置、电子设备及存储介质 |
CN112612895B (zh) * | 2020-12-29 | 2021-12-07 | 中科院计算技术研究所大数据研究院 | 一种主体话题态度指数的计算方法 |
CN114090756A (zh) * | 2022-01-11 | 2022-02-25 | 杭银消费金融股份有限公司 | 一种舆情信息的智能化处理方法、设备、存储介质 |
CN114661974A (zh) * | 2022-03-21 | 2022-06-24 | 重庆市规划和自然资源信息中心 | 利用自然语言语义分析的政务网站舆情分析与预警的方法 |
CN114692593A (zh) * | 2022-03-21 | 2022-07-01 | 中国刑事警察学院 | 一种网络信息安全监测预警方法 |
CN116340511A (zh) * | 2023-02-16 | 2023-06-27 | 深圳市深弈科技有限公司 | 结合深度学习与语言逻辑推理的舆情分析方法 |
CN116361472A (zh) * | 2023-05-02 | 2023-06-30 | 周维 | 社交网络评论热点事件舆情大数据分析系统 |
CN113127611B (zh) * | 2019-12-31 | 2024-05-14 | 北京中关村科金技术有限公司 | 对问句语料进行处理的方法、装置以及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101408883A (zh) * | 2008-11-24 | 2009-04-15 | 电子科技大学 | 一种网络舆情观点收集方法 |
CN103544255A (zh) * | 2013-10-15 | 2014-01-29 | 常州大学 | 基于文本语义相关的网络舆情信息分析方法 |
-
2017
- 2017-05-31 CN CN201710405071.3A patent/CN107315778A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101408883A (zh) * | 2008-11-24 | 2009-04-15 | 电子科技大学 | 一种网络舆情观点收集方法 |
CN103544255A (zh) * | 2013-10-15 | 2014-01-29 | 常州大学 | 基于文本语义相关的网络舆情信息分析方法 |
Non-Patent Citations (1)
Title |
---|
李 岩,韩 斌,赵 剑: "基于短文本及情感分析的微博舆情分析", 《计算机应用与软件》 * |
Cited By (52)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108197271A (zh) * | 2018-01-04 | 2018-06-22 | 郑州云海信息技术有限公司 | 一种基于大数据的影视作品市场分析方法 |
CN108363784A (zh) * | 2018-01-20 | 2018-08-03 | 西北工业大学 | 一种基于文本机器学习的舆情走向预测方法 |
CN108363699A (zh) * | 2018-03-21 | 2018-08-03 | 浙江大学城市学院 | 一种基于百度贴吧的网民学业情绪分析方法 |
CN108733816A (zh) * | 2018-05-21 | 2018-11-02 | 重庆人文科技学院 | 一种微博突发事件检测方法 |
CN108733816B (zh) * | 2018-05-21 | 2022-02-01 | 重庆人文科技学院 | 一种微博突发事件检测方法 |
CN108959479B (zh) * | 2018-06-21 | 2022-03-25 | 成都睿码科技有限责任公司 | 一种基于文本相似度的事件情感分类方法 |
CN108959479A (zh) * | 2018-06-21 | 2018-12-07 | 成都睿码科技有限责任公司 | 一种基于文本相似度的事件情感分类方法 |
CN110728140A (zh) * | 2018-06-30 | 2020-01-24 | 天津大学 | 基于情感分析与主题特征的突发事件舆情演化分析方法 |
CN109271512A (zh) * | 2018-08-29 | 2019-01-25 | 中国平安保险(集团)股份有限公司 | 舆情评论信息的情感分析方法、装置及存储介质 |
CN109271512B (zh) * | 2018-08-29 | 2023-11-24 | 中国平安保险(集团)股份有限公司 | 舆情评论信息的情感分析方法、装置及存储介质 |
CN109446405B (zh) * | 2018-09-12 | 2021-04-30 | 中国科学院自动化研究所 | 基于大数据的旅游产业推广方法及系统 |
CN109446405A (zh) * | 2018-09-12 | 2019-03-08 | 中国科学院自动化研究所 | 基于大数据的旅游产业推广方法及系统 |
CN109214008A (zh) * | 2018-09-28 | 2019-01-15 | 珠海中科先进技术研究院有限公司 | 一种基于关键词提取的情感分析方法及系统 |
CN109670095A (zh) * | 2018-11-19 | 2019-04-23 | 成都电科成研企业管理有限公司 | 一种基于自然语义的舆情相关度匹配方法 |
CN109635107A (zh) * | 2018-11-19 | 2019-04-16 | 北京亚鸿世纪科技发展有限公司 | 多数据源的语义智能分析及事件场景还原的方法及装置 |
CN109740042A (zh) * | 2018-11-27 | 2019-05-10 | 平安科技(深圳)有限公司 | 舆论信息的监控方法、装置及存储介质、计算机设备 |
CN109902287A (zh) * | 2019-01-10 | 2019-06-18 | 上海言通网络科技有限公司 | 电话机器人语义理解方法及其系统 |
CN109783586B (zh) * | 2019-01-21 | 2022-10-21 | 福州大学 | 基于聚类重采样的水军评论检测方法 |
CN109783586A (zh) * | 2019-01-21 | 2019-05-21 | 福州大学 | 基于聚类重采样的水军评论检测系统及方法 |
CN111143549A (zh) * | 2019-06-20 | 2020-05-12 | 东华大学 | 一种基于主题的舆情情感演化的方法 |
CN110297986A (zh) * | 2019-06-21 | 2019-10-01 | 山东科技大学 | 一种微博热点话题的情感倾向分析方法 |
CN110263238A (zh) * | 2019-06-21 | 2019-09-20 | 浙江华坤道威数据科技有限公司 | 一种基于大数据的舆情聆听系统 |
CN110263238B (zh) * | 2019-06-21 | 2021-10-15 | 浙江华坤道威数据科技有限公司 | 一种基于大数据的舆情聆听系统 |
CN110533212A (zh) * | 2019-07-04 | 2019-12-03 | 西安理工大学 | 基于大数据的城市内涝舆情监测预警方法 |
CN110705288A (zh) * | 2019-09-29 | 2020-01-17 | 武汉海昌信息技术有限公司 | 一种基于大数据的舆情分析系统 |
CN111027328A (zh) * | 2019-11-08 | 2020-04-17 | 广州坚和网络科技有限公司 | 通过语料训练判断评论情绪正负及感情色彩的方法 |
CN111160019B (zh) * | 2019-12-30 | 2023-08-15 | 中国联合网络通信集团有限公司 | 一种舆情监测的方法、装置及系统 |
CN111160019A (zh) * | 2019-12-30 | 2020-05-15 | 中国联合网络通信集团有限公司 | 一种舆情监测的方法、装置及系统 |
CN113127611B (zh) * | 2019-12-31 | 2024-05-14 | 北京中关村科金技术有限公司 | 对问句语料进行处理的方法、装置以及存储介质 |
CN113127611A (zh) * | 2019-12-31 | 2021-07-16 | 北京中关村科金技术有限公司 | 对问句语料进行处理的方法、装置以及存储介质 |
CN111292167A (zh) * | 2020-02-03 | 2020-06-16 | 山东爱城市网信息技术有限公司 | 基于大数据的竞品分析方法、系统、存储介质及电子设备 |
CN111414455B (zh) * | 2020-03-20 | 2024-03-01 | 北京百度网讯科技有限公司 | 舆情分析方法、装置、电子设备及可读存储介质 |
CN111414455A (zh) * | 2020-03-20 | 2020-07-14 | 北京百度网讯科技有限公司 | 舆情分析方法、装置、电子设备及可读存储介质 |
CN111401074A (zh) * | 2020-04-03 | 2020-07-10 | 山东爱城市网信息技术有限公司 | 一种基于Hadoop的短文本情感倾向性分析方法、系统及装置 |
CN111563190A (zh) * | 2020-04-07 | 2020-08-21 | 中国电子科技集团公司第二十九研究所 | 一种区域网络用户行为的多维度分析与监管方法及系统 |
CN111538888A (zh) * | 2020-06-05 | 2020-08-14 | 国网山东省电力公司检修公司 | 基于主动监测引擎和大数据的网络舆情烈度演化分析系统 |
CN111984931A (zh) * | 2020-08-20 | 2020-11-24 | 上海大学 | 一种社会事件网络文本的舆情计算与推演方法及系统 |
CN111984931B (zh) * | 2020-08-20 | 2022-06-03 | 上海大学 | 一种社会事件网络文本的舆情计算与推演方法及系统 |
CN112183093A (zh) * | 2020-11-02 | 2021-01-05 | 杭州安恒信息安全技术有限公司 | 一种企业舆情分析方法、装置、设备及可读存储介质 |
CN112347230B (zh) * | 2020-11-16 | 2024-04-19 | 上海品见智能科技有限公司 | 一种基于Word2Vec的企业舆情数据分析方法 |
CN112347230A (zh) * | 2020-11-16 | 2021-02-09 | 上海品见智能科技有限公司 | 一种基于Word2Vec的企业舆情数据分析方法 |
CN112612895B (zh) * | 2020-12-29 | 2021-12-07 | 中科院计算技术研究所大数据研究院 | 一种主体话题态度指数的计算方法 |
CN113254777A (zh) * | 2021-06-07 | 2021-08-13 | 武汉卓尔数字传媒科技有限公司 | 信息推荐方法、装置、电子设备及存储介质 |
CN114090756B (zh) * | 2022-01-11 | 2022-04-15 | 杭银消费金融股份有限公司 | 一种舆情信息的智能化处理方法、设备、存储介质 |
CN114090756A (zh) * | 2022-01-11 | 2022-02-25 | 杭银消费金融股份有限公司 | 一种舆情信息的智能化处理方法、设备、存储介质 |
CN114692593A (zh) * | 2022-03-21 | 2022-07-01 | 中国刑事警察学院 | 一种网络信息安全监测预警方法 |
CN114661974B (zh) * | 2022-03-21 | 2024-03-08 | 重庆市规划和自然资源信息中心 | 利用自然语言语义分析的政务网站舆情分析与预警的方法 |
CN114661974A (zh) * | 2022-03-21 | 2022-06-24 | 重庆市规划和自然资源信息中心 | 利用自然语言语义分析的政务网站舆情分析与预警的方法 |
CN116340511B (zh) * | 2023-02-16 | 2023-09-15 | 深圳市深弈科技有限公司 | 结合深度学习与语言逻辑推理的舆情分析方法 |
CN116340511A (zh) * | 2023-02-16 | 2023-06-27 | 深圳市深弈科技有限公司 | 结合深度学习与语言逻辑推理的舆情分析方法 |
CN116361472A (zh) * | 2023-05-02 | 2023-06-30 | 周维 | 社交网络评论热点事件舆情大数据分析系统 |
CN116361472B (zh) * | 2023-05-02 | 2024-05-03 | 脉讯在线(北京)信息技术有限公司 | 社交网络评论热点事件舆情大数据分析方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107315778A (zh) | 一种基于大数据情感分析的自然语言舆情分析方法 | |
CN105740228B (zh) | 一种互联网舆情分析方法及系统 | |
Haidar et al. | A multilingual system for cyberbullying detection: Arabic content detection using machine learning | |
Haidar et al. | Multilingual cyberbullying detection system: Detecting cyberbullying in Arabic content | |
Wakade et al. | Text mining for sentiment analysis of Twitter data | |
CN103793503A (zh) | 一种基于web文本的观点挖掘与分类的方法 | |
Haidar et al. | Cyberbullying detection: A survey on multilingual techniques | |
Miah et al. | Detection of child exploiting chats from a mixed chat dataset as a text classification task | |
CN105912576A (zh) | 情感分类方法及系统 | |
Sharma et al. | Detecting hate speech and insults on social commentary using nlp and machine learning | |
Gupta et al. | Psychological analysis for depression detection from social networking sites | |
Pota et al. | A subword-based deep learning approach for sentiment analysis of political tweets | |
Gautam et al. | Performance analysis of supervised machine learning techniques for cyberstalking detection in social media | |
Setty et al. | Classification of facebook news feeds and sentiment analysis | |
Edouard | Event detection and analysis on short text messages | |
Kholodna et al. | A Machine Learning Model for Automatic Emotion Detection from Speech. | |
CN105159879A (zh) | 一种网络个体或群体价值观自动判别方法 | |
Andriotis et al. | Smartphone message sentiment analysis | |
Shambour | Analyzing perceptions of a global event using CNN-LSTM deep learning approach: the case of Hajj 1442 (2021) | |
Krithika et al. | A detailed survey on cyberbullying in social networks | |
Atoum | Detecting cyberbullying from tweets through machine learning techniques with sentiment analysis | |
Cavaliere et al. | Emotion-Aware Monitoring of Users’ Reaction With a Multi-Perspective Analysis of Long-and Short-Term Topics on Twitter | |
Hajare et al. | A machine learning pipeline to examine political bias with congressional speeches | |
ul Mustafa et al. | Prediction of user’s interest based on urdu tweets | |
Hernandez Urbano Jr et al. | A bert-based hate speech classifier from transcribed online short-form videos |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20171103 |