CN111078888A - 一种自动分类社交网络用户评论数据的方法 - Google Patents
一种自动分类社交网络用户评论数据的方法 Download PDFInfo
- Publication number
- CN111078888A CN111078888A CN201911329160.XA CN201911329160A CN111078888A CN 111078888 A CN111078888 A CN 111078888A CN 201911329160 A CN201911329160 A CN 201911329160A CN 111078888 A CN111078888 A CN 111078888A
- Authority
- CN
- China
- Prior art keywords
- category
- characteristic
- feature
- comment data
- keywords
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 239000013598 vector Substances 0.000 claims abstract description 31
- 238000013145 classification model Methods 0.000 claims abstract description 23
- 238000012549 training Methods 0.000 claims abstract description 12
- 238000007781 pre-processing Methods 0.000 claims abstract description 5
- 238000012545 processing Methods 0.000 claims description 9
- 239000000126 substance Substances 0.000 claims description 6
- 238000002372 labelling Methods 0.000 claims description 5
- 238000012935 Averaging Methods 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims description 3
- 230000008901 benefit Effects 0.000 abstract description 3
- 230000000694 effects Effects 0.000 abstract description 2
- 238000013507 mapping Methods 0.000 abstract description 2
- 230000008451 emotion Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 5
- 230000006855 networking Effects 0.000 description 5
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 238000003058 natural language processing Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000010224 classification analysis Methods 0.000 description 2
- 238000007418 data mining Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种自动分类社交网络用户评论数据的方法,通过在网络社交平台中采集评论数据,进行预处理后生成一个包含关键词的文本特征词项集合;再将包含关键词的文本特征词项集合与预先生成的类别特征关键词之间建立映射,判断文本特征词项集合中的词项是否出现在所属类中类别特征关键词库中,从而计算出文本特征词项集合中每一个词项与所属类别特征关键词库的特征值,然后生成特征向量,利用预先训练得到的分类模型进行分类,从而完成该评论数据的自动分类;具有实时性、分类效果好,且包含了更多的有效信息。
Description
技术领域
本发明属于自然语言处理技术领域,更为具体地讲,涉及一种自动分类社交网络用户评论数据的方法。
背景技术
随着计算机尤其是智能手机在我国的普遍发展,互联网已经成为绝大多数人们获取各种信息的主要途径。知乎、微博作为其中一种信息类互联网产品,提供了一种供用户使用、参与的网络社交平台。人们可以在网络社交平台中获取各类信息,并通过关注、评论、点赞等不同方式参与。随着多年的发展,知乎、微博已经多次证明它具有将社会、娱乐、新闻类等信息快速发酵、快速传播、然后达到大众普遍关注的一种能力。而其中,用户往往会通过评论的方式在网络社交事件参与中发表个人看法或言论,其用户评论往往具有很大的研究和参考价值。
对文本数据进行自动化分类是文本数据挖掘、自然语言处理等人工智能技术的重要应用领域,其主要功能是把以数字化形式存储的非结构化文本数据,通过自然语言处理技术、文本数据挖掘技术,自动按照事先组织好的与具体业务相关的类别进行分类。随着信息时代技术的不断发展,对文本数据进行自动化分类是提高企业生产效率和竞争优势的一种重要技术措施。
由于用户在关注网络社交事件过程中,往往会产生个人倾向性情感,在参与中发表的评论数据亦带有这种具备自我倾向性的情感。比如:对某个发生的争议事件的看法,或者是对某部影片的影评、对某款手机的用户体验等。对这些用户的评论数据进行分析,能够识别出现或者隐含在其中的情感信息,并发现大多数用户对该网络社交事件的一种舆情信息。基于此现象,对用户评论数据的分类也可以是对评论数据带有的情感进行分类。情感文本是主观性文本,它是与主要陈述事实的客观性文本相对应的对于实体、事件的一种主观性表达意见或者评论文本。情感文本自动化分类是对文本数据中的情感进行多层级分类,挖掘文本数据潜在的情感表达含义,进而可以发掘用户的兴趣和需求,对事件舆情的掌握、相关产品的丰富都有很重要的意义。具体讲,由于知乎、微博上充斥了各类并且大量的实时性的新闻信息,人们在使用知乎或者微博产品时,若想要看到其他人对某一网络社交事件的评价或反响时,由于当前缺乏这种有效解决对网络社交平台中的用户评论数据实行自动化分类分析的方法和系统,并在传统新闻媒体参与之前,用户只能通过不停的刷新其他用户评论来达到想要的目的。这种纯靠人力达到目的的方式既浪费用户时间也并不能保证取得良好的效果。
目前缺少实际有效的解决网络社交平台中对中文评论数据进行自动分类分析的方法和系统,因此找到一种针对中文的基于自动文本分类技术的网络社交事件用户评论数据自动分类分析方法与系统,在最大程度上减轻数据处理人员的工作量并提高产品服务质量就是一个显得迫切的任务。
发明内容
本发明的目的在于克服现有技术的不足,提供一种自动分类社交网络用户评论数据的方法,通过对网络社交事件用户评论数据自动分类,便能方便用户快速浏览设计网络,增强用户的体验,同时也能方便平台更好的了解大众看法。
为实现上述发明目的,本发明一种自动分类社交网络用户评论数据的方法,其特征在于,包括以下步骤:
(1)、设置分类类别
设置朴素贝叶斯分类模型的分类类别数为N;
(2)、数据采集
采集社交网络中某一事件主题下所有用户的评论数据;
(3)、数据预处理
将评论数据中的表情符号替换为汉文字符,并标注为类别特征关键词及所属类别;去除评论数据中不能识别的图片,以及特殊符号和非中文字符;对评论数据进行分词操作,再删除停用词和功能词;
每一条评论数据预处理完成后,生成对应的文本词项集合;
(4)、构建类别特征关键词库
(4.1)、在每一个文本词项集合中,计算每个类别特征关键词与每一个普通词项之间的互信息值;
(4.2)、将所有互信息值进行降序排列,再选出排名靠前的前M个词项,并标注为类别特征关键词及所属类别;
(4.3)、将同一类别的类别特征关键词存放在同一类别特征关键词库中,从而构建出N个类别特征关键词库;
(5)、计算特征值并构建特征向量
(5.1)、统计每个文本词项集合中的每个词项在每个类别特征关键词库中出现的次数;
(5.2)、将每个类别特征关键词库中均未出现的词项的特征值设置为0;
(5.3)、对于类别特征关键词库中出现的词项,利用如下公式计算该词项的特征值;
其中,表示第i个文本词项集合中第τ个类别特征关键词相对于第j个类别特征关键词库的特征值,Mi表示第i个文本词项集合中词项的总个数,表示第i个文本词项集合中第τ个类别特征关键词在第j个类别特征关键词库中出现的次数,表示第i个文本词项集合中第τ个类别特征关键词在第j'个类别特征关键词库中出现的次数,j≠j',N分类类别数,τ=1,2,…,mi,mi表示第i个文本词项集合中类别特征关键词的个数;
(5.6)、将第i个文本词项集合中所有类别特征关键词相对于第k个类别特征关键词库的特征值作为各个类别特征关键词的最终特征值;
(5.7)、对剩余的文本词项集合按照步骤(5.2)~(5.6)所述方法进行处理,从而得到每个文本词项集合中各个类别特征关键词的最终特征值;
(5.8)、构建特征向量
第i个文本词项集合的特征向量形式为:
(6)、训练朴素贝叶斯分类模型
将特征向量作为输入数据,输入至朴素贝叶斯分类模型,模型输出为对应特征向量所属类别,通过利用所有的特征向量进行反复训练,使每一次输出的分类结果与对应特征向量所属类别一致时,结束分类模型训练;
(7)、利用朴素贝叶斯分类模型对数据进行分类
将待分类的评论数据按照上述方法处理成特征向量的形式,再将该特征向量输入至朴素贝叶斯分类模型,朴素贝叶斯分类模型则完成该评论数据的自动分类。
本发明的发明目的是这样实现的:
本发明一种自动分类社交网络用户评论数据的方法,通过在网络社交平台中采集评论数据,进行预处理后生成一个包含关键词的文本特征词项集合;再将包含关键词的文本特征词项集合与预先生成的类别特征关键词之间建立映射,判断文本特征词项集合中的词项是否出现在所属类中类别特征关键词库中,从而计算出文本特征词项集合中每一个词项与所属类别特征关键词库的特征值,然后生成特征向量,利用预先训练得到的分类模型进行分类,从而完成该评论数据的自动分类;具有实时性、分类效果好,且包含了更多的有效信息。
附图说明
图1是本发明一种自动分类社交网络用户评论数据的方法流程图;
图2是构建特征向量的具体流程图。
具体实施方式
下面结合附图对本发明的具体实施方式进行描述,以便本领域的技术人员更好地理解本发明。需要特别提醒注意的是,在以下的描述中,当已知功能和设计的详细描述也许会淡化本发明的主要内容时,这些描述在这里将被忽略。
实施例
图1是本发明一种自动分类社交网络用户评论数据的方法流程图。
在本实施例中,适用于微博对一主题事件的舆论情况信息查询,还适用于对于论坛、贴吧、知乎等网络社交事件平台。下面以微博平台中某一网络热点事件的评论为例。如图1所示,本发明一种自动分类社交网络用户评论数据的方法,包括以下步骤:
S1、设置分类类别
设置朴素贝叶斯分类模型的分类类别数为N;
S2、数据采集
采集社交网络中某一事件主题下所有用户的评论数据;在本实施例中,在微博平台上根据当前预设的主题事件,启动一种网络社交事件用户评论数据自动分类分析系统,它首先会自动通过微博的后台系统抓取到微博平台上关于这一主题下所有用户的评论数据。
S3、数据预处理
评论数据中包含有大量对分类没有直接帮助的内容信息,所以需要进行数据处理工作,具体处理为:将评论数据中的表情符号替换为汉文字符,并标注为类别特征关键词及所属类别;去除评论数据中不能识别的图片,以及特殊符号和非中文字符;训练数据文本中依然存在许多功能词,如“并且、而且、还”,“是、在、有”等,这些词使用频率虽高,却不能为文本分类提供判别信息,因此对评论数据进行分词操作,再删除停用词和功能词;
每一条评论数据预处理完成后,生成对应的文本词项集合;
S4、构建类别特征关键词库
S4.1、在每一个文本词项集合中,计算每个类别特征关键词与每一个普通词项之间的互信息值;
S4.2、将所有互信息值进行降序排列,再选出排名靠前的前M个词项,并标注为类别特征关键词及所属类别;
S4.3、将同一类别的类别特征关键词存放在同一类别特征关键词库中,从而构建出N个类别特征关键词库;
S5、如图2所示,计算特征值并构建特征向量
S5.1、统计每个文本词项集合中的每个词项在每个类别特征关键词库中出现的次数;
S5.2、将每个类别特征关键词库中均未出现的词项的特征值设置为0;
S5.3、对于类别特征关键词库中出现的词项,利用如下公式计算该词项的特征值;
其中,表示第i个文本词项集合中第τ个类别特征关键词相对于第j个类别特征关键词库的特征值,Mi表示第i个文本词项集合中词项的总个数,表示第i个文本词项集合中第τ个类别特征关键词在第j个类别特征关键词库中出现的次数,表示第i个文本词项集合中第τ个类别特征关键词在第j'个类别特征关键词库中出现的次数,j≠j',N分类类别数,τ=1,2,…,mi,mi表示第i个文本词项集合中类别特征关键词的个数;
S5.6、将第i个文本词项集合中所有类别特征关键词相对于第k个类别特征关键词库的特征值作为各个类别特征关键词的最终特征值;
S5.7、对剩余的文本词项集合按照步骤S5.2~S5.6所述方法进行处理,从而得到每个文本词项集合中各个类别特征关键词的最终特征值;
S5.8、构建特征向量
第i个文本词项集合的特征向量形式为:
在本实施例中,假设类别数量为3个;
第一个文本词项集合中有三个类别特征关键词为:甲、乙、丙;
甲相对类别1的特征值为:3;
乙相对类别1的特征值为:5;
丙相对类别1的特征值为:7;
所以,第一个文本词项集合相对于类别1的均值为:5;
甲相对类别2的特征值为:3;
乙相对类别2的特征值为:6;
丙相对类别2的特征值为:9;
所以,第一个文本词项集合相对于类别2的均值为:6;
甲相对类别3的特征值为:1;
乙相对类别3的特征值为:2;
丙相对类别3的特征值为:3;
所以,第一个文本词项集合相对于类别3的均值为:2;
最大均值为6,故选择类别2。所以,第一个文本词项集合的特征向量为:[(甲,3),(乙,6)、(丙,9)];
S6、训练朴素贝叶斯分类模型
将特征向量作为输入数据,输入至朴素贝叶斯分类模型,模型输出为对应特征向量所属类别,通过利用所有的特征向量进行反复训练,使每一次输出的分类结果与对应特征向量所属类别一致时,结束分类模型训练;
S7、利用朴素贝叶斯分类模型对数据进行分类
将待分类的评论数据按照上述方法处理成特征向量的形式,再将该特征向量输入至朴素贝叶斯分类模型,朴素贝叶斯分类模型则完成该评论数据的自动分类。
尽管上面对本发明说明性的具体实施方式进行了描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
Claims (1)
1.一种自动分类社交网络用户评论数据的方法,其特征在于,包括以下步骤:
(1)、设置分类类别
设置朴素贝叶斯分类模型的分类类别数为N;
(2)、数据采集
采集社交网络中某一事件主题下所有用户的评论数据;
(3)、数据预处理
将评论数据中的表情符号替换为汉文字符,并标注为类别特征关键词及所属类别;去除评论数据中不能识别的图片,以及特殊符号和非中文字符;对评论数据进行分词操作,再删除停用词和功能词;
每一条评论数据预处理完成后,生成对应的文本词项集合;
(4)、构建类别特征关键词库
(4.1)、在每一个文本词项集合中,计算每个类别特征关键词与每一个普通词项之间的互信息值;
(4.2)、将所有互信息值进行降序排列,再选出排名靠前的前M个词项,并标注为类别特征关键词及所属类别;
(4.3)、将同一类别的类别特征关键词存放在同一类别特征关键词库中,从而构建出N个类别特征关键词库;
(5)、计算特征值并构建特征向量
(5.1)、统计每个文本词项集合中的每个词项在每个类别特征关键词库中出现的次数;
(5.2)、将每个类别特征关键词库中均未出现的词项的特征值设置为0;
(5.3)、对于类别特征关键词库中出现的词项,利用如下公式计算该词项的特征值;
其中,表示第i个文本词项集合中第τ个类别特征关键词相对于第j个类别特征关键词库的特征值,Mi表示第i个文本词项集合中词项的总总个数,表示第i个文本词项集合中第τ个类别特征关键词在第j个类别特征关键词库中出现的次数,表示第i个文本词项集合中第τ个类别特征关键词在第j'个类别特征关键词库中出现的次数,j≠j',N分类类别数,τ=1,2,…,mi;
(5.6)、将第i个文本词项集合中所有类别特征关键词相对于第k个类别特征关键词库的特征值作为各个类别特征关键词的最终特征值;
(5.7)、对剩余的文本词项集合按照步骤(5.2)~(5.6)所述方法进行处理,从而得到每个文本词项集合中各个类别特征关键词的最终特征值;
(5.8)、构建特征向量
第i个文本词项集合的特征向量形式为:
(6)、训练朴素贝叶斯分类模型
将特征向量作为输入数据,输入至朴素贝叶斯分类模型,模型输出为对应特征向量所属类别,通过利用所有的特征向量进行反复训练,使每一次输出的分类结果与对应特征向量所属类别一致时,结束分类模型训练;
(7)、利用朴素贝叶斯分类模型对数据进行分类
将待分类的评论数据按照上述方法处理成特征向量的形式,再将该特征向量输入至朴素贝叶斯分类模型,朴素贝叶斯分类模型则完成该评论数据的自动分类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911329160.XA CN111078888B (zh) | 2019-12-20 | 2019-12-20 | 一种自动分类社交网络用户评论数据的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911329160.XA CN111078888B (zh) | 2019-12-20 | 2019-12-20 | 一种自动分类社交网络用户评论数据的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111078888A true CN111078888A (zh) | 2020-04-28 |
CN111078888B CN111078888B (zh) | 2021-12-10 |
Family
ID=70316433
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911329160.XA Active CN111078888B (zh) | 2019-12-20 | 2019-12-20 | 一种自动分类社交网络用户评论数据的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111078888B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113254595A (zh) * | 2021-06-22 | 2021-08-13 | 北京沃丰时代数据科技有限公司 | 闲聊识别方法、装置、电子设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170351954A1 (en) * | 2016-06-03 | 2017-12-07 | Fmr Llc | Data Classification with Social Profile Data |
CN109739985A (zh) * | 2018-12-26 | 2019-05-10 | 斑马网络技术有限公司 | 文本自动分类方法、设备及存储介质 |
CN110390018A (zh) * | 2019-07-25 | 2019-10-29 | 哈尔滨工业大学 | 一种基于lstm的社交网络评论生成方法 |
-
2019
- 2019-12-20 CN CN201911329160.XA patent/CN111078888B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170351954A1 (en) * | 2016-06-03 | 2017-12-07 | Fmr Llc | Data Classification with Social Profile Data |
CN109739985A (zh) * | 2018-12-26 | 2019-05-10 | 斑马网络技术有限公司 | 文本自动分类方法、设备及存储介质 |
CN110390018A (zh) * | 2019-07-25 | 2019-10-29 | 哈尔滨工业大学 | 一种基于lstm的社交网络评论生成方法 |
Non-Patent Citations (2)
Title |
---|
JINGHUAN ZHANG等: "The prediction role of feeling of injustice on network social mobilization", 《INTERNATIONAL JOURNAL OF CROWD SCIENCE》 * |
黄永文等: "用户评论的分类获取", 《计算机应用》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113254595A (zh) * | 2021-06-22 | 2021-08-13 | 北京沃丰时代数据科技有限公司 | 闲聊识别方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111078888B (zh) | 2021-12-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107515873B (zh) | 一种垃圾信息识别方法及设备 | |
CN109933664B (zh) | 一种基于情感词嵌入的细粒度情绪分析改进方法 | |
CN105488092B (zh) | 一种时间敏感和自适应的子话题在线检测方法及系统 | |
CN103745000B (zh) | 一种中文微博客的热点话题检测方法 | |
CN105183717B (zh) | 一种基于随机森林和用户关系的osn用户情感分析方法 | |
CN107273348B (zh) | 一种文本的话题和情感联合检测方法及装置 | |
CN110888990A (zh) | 文本推荐方法、装置、设备及介质 | |
CN104077407B (zh) | 一种智能数据搜索系统及方法 | |
CN106126605B (zh) | 一种基于用户画像的短文本分类方法 | |
CN102385579A (zh) | 互联网信息分类方法和系统 | |
CN111309864B (zh) | 一种微博热点话题的用户群体情感倾向迁移动态分析方法 | |
CN105630768A (zh) | 一种基于层叠条件随机场的产品名识别方法及装置 | |
CN111177559A (zh) | 文旅服务推荐方法、装置、电子设备及存储介质 | |
CN113032557A (zh) | 一种基于频繁词集与bert语义的微博热点话题发现方法 | |
Hariguna et al. | Survey opinion using sentiment analysis | |
Bach et al. | Big data text mining in the financial sector | |
CN111078888B (zh) | 一种自动分类社交网络用户评论数据的方法 | |
CN105468780A (zh) | 一种微博文本中产品名实体的规范化方法及装置 | |
CN108932247A (zh) | 一种优化文本搜索的方法及装置 | |
Xue et al. | Evaluation and emotional analysis of mobile phone sales of JD E-commerce platform based on LDA model | |
CN115391522A (zh) | 一种基于社交平台元数据的文本主题建模方法及系统 | |
Khan et al. | Exploring Links between Online Activism and Real‐World Events: A Case Study of the# FeesMustFall | |
Shankar et al. | An approach for extracting tweets from social media factors | |
US20160335325A1 (en) | Methods and systems of knowledge retrieval from online conversations and for finding relevant content for online conversations | |
Ye et al. | Cross cultural Comparative Study on Emotional Analysis of Social Media |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |