CN110059183B - 一种基于大数据的汽车行业用户观点情感分类方法 - Google Patents
一种基于大数据的汽车行业用户观点情感分类方法 Download PDFInfo
- Publication number
- CN110059183B CN110059183B CN201910221691.0A CN201910221691A CN110059183B CN 110059183 B CN110059183 B CN 110059183B CN 201910221691 A CN201910221691 A CN 201910221691A CN 110059183 B CN110059183 B CN 110059183B
- Authority
- CN
- China
- Prior art keywords
- data
- word
- matching
- model
- emotion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000008451 emotion Effects 0.000 title claims abstract description 37
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000010276 construction Methods 0.000 claims abstract description 18
- 238000007637 random forest analysis Methods 0.000 claims abstract description 16
- 230000004927 fusion Effects 0.000 claims abstract description 10
- 238000010801 machine learning Methods 0.000 claims abstract description 9
- 238000007781 pre-processing Methods 0.000 claims abstract description 7
- 238000012549 training Methods 0.000 claims description 13
- 239000013598 vector Substances 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 11
- 238000012216 screening Methods 0.000 claims description 8
- 238000002790 cross-validation Methods 0.000 claims description 7
- 238000012360 testing method Methods 0.000 claims description 7
- 230000000694 effects Effects 0.000 claims description 3
- 238000011156 evaluation Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 claims description 3
- 238000007689 inspection Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims description 3
- 230000002159 abnormal effect Effects 0.000 claims description 2
- 238000001914 filtration Methods 0.000 claims description 2
- 230000007935 neutral effect Effects 0.000 claims description 2
- 230000008569 process Effects 0.000 claims description 2
- 238000010200 validation analysis Methods 0.000 claims description 2
- 230000006872 improvement Effects 0.000 abstract description 2
- 238000013075 data extraction Methods 0.000 abstract 1
- 230000002996 emotional effect Effects 0.000 abstract 1
- 238000000546 chi-square test Methods 0.000 description 5
- 230000007547 defect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/316—Indexing structures
- G06F16/325—Hash tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/374—Thesaurus
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Machine Translation (AREA)
Abstract
Description
因 | 0 |
为 | 1 |
森 | 2 |
林 | 3 |
人 | 4 |
即 | 5 |
将 | 6 |
换 | 7 |
代 | 8 |
词语 | 向量 |
因为 | [1 1 0 0 0 0 0 0 0] |
森林 | [0 0 1 1 0 0 0 0 0] |
人 | [0 0 0 0 1 0 0 0 0] |
即将 | [0 0 0 0 0 1 1 0 0] |
换代 | [0 0 0 0 0 0 0 1 1] |
模型 | ω |
LightGBM | 0.4 |
随机森林 | 0.2 |
Catboost | 0.4 |
Claims (4)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910221691.0A CN110059183B (zh) | 2019-03-22 | 2019-03-22 | 一种基于大数据的汽车行业用户观点情感分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910221691.0A CN110059183B (zh) | 2019-03-22 | 2019-03-22 | 一种基于大数据的汽车行业用户观点情感分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110059183A CN110059183A (zh) | 2019-07-26 |
CN110059183B true CN110059183B (zh) | 2022-08-23 |
Family
ID=67316266
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910221691.0A Active CN110059183B (zh) | 2019-03-22 | 2019-03-22 | 一种基于大数据的汽车行业用户观点情感分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110059183B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110837561A (zh) * | 2019-11-18 | 2020-02-25 | 苏州朗动网络科技有限公司 | 文本的分析方法、设备和存储介质 |
CN111476281B (zh) * | 2020-03-27 | 2020-12-22 | 北京微播易科技股份有限公司 | 一种信息流行度预测方法和装置 |
CN113254596B (zh) * | 2021-06-22 | 2021-10-08 | 湖南大学 | 基于规则匹配和深度学习的用户质检需求分类方法及系统 |
CN113393276B (zh) * | 2021-06-25 | 2023-06-16 | 食亨(上海)科技服务有限公司 | 评论数据的分类方法、装置和计算机可读介质 |
CN114154561B (zh) * | 2021-11-15 | 2024-02-27 | 国家电网有限公司 | 一种基于自然语言处理和随机森林的电力数据治理方法 |
CN114089033B (zh) * | 2022-01-24 | 2022-04-26 | 天津安力信通讯科技有限公司 | 一种基于频谱分析的异常信号检测方法及系统 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103365997A (zh) * | 2013-07-12 | 2013-10-23 | 华东师范大学 | 一种基于集成学习的观点挖掘方法 |
CN105243129A (zh) * | 2015-09-30 | 2016-01-13 | 清华大学深圳研究生院 | 商品属性特征词聚类方法 |
CN105893410A (zh) * | 2015-11-18 | 2016-08-24 | 乐视网信息技术(北京)股份有限公司 | 一种关键词提取方法和装置 |
CN106776982A (zh) * | 2016-12-02 | 2017-05-31 | 深圳市唯特视科技有限公司 | 一种采用机器学习的社交媒体情感分析方法 |
CN107247703A (zh) * | 2017-06-08 | 2017-10-13 | 天津大学 | 基于卷积神经网络和集成学习的微博情感分析方法 |
CN107894979A (zh) * | 2017-11-21 | 2018-04-10 | 北京百度网讯科技有限公司 | 用于语义挖掘的复合词处理方法、装置及其设备 |
CN107895283A (zh) * | 2017-11-07 | 2018-04-10 | 重庆邮电大学 | 一种基于时间序列分解的商家客流量大数据预测方法 |
CN107908715A (zh) * | 2017-11-10 | 2018-04-13 | 中国民航大学 | 基于Adaboost和分类器加权融合的微博情感极性判别方法 |
CN108304884A (zh) * | 2018-02-23 | 2018-07-20 | 华东理工大学 | 一种基于特征逆映射的代价敏感堆叠集成学习框架 |
CN108984523A (zh) * | 2018-06-29 | 2018-12-11 | 重庆邮电大学 | 一种基于深度学习模型的商品评论情感分析方法 |
CN109255651A (zh) * | 2018-08-22 | 2019-01-22 | 重庆邮电大学 | 一种基于大数据的搜索广告转化智能预测方法 |
CN109460474A (zh) * | 2018-11-22 | 2019-03-12 | 合肥工业大学 | 用户偏好趋势挖掘方法 |
CN109491914A (zh) * | 2018-11-09 | 2019-03-19 | 大连海事大学 | 基于不平衡学习策略高影响缺陷报告预测方法 |
-
2019
- 2019-03-22 CN CN201910221691.0A patent/CN110059183B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103365997A (zh) * | 2013-07-12 | 2013-10-23 | 华东师范大学 | 一种基于集成学习的观点挖掘方法 |
CN105243129A (zh) * | 2015-09-30 | 2016-01-13 | 清华大学深圳研究生院 | 商品属性特征词聚类方法 |
CN105893410A (zh) * | 2015-11-18 | 2016-08-24 | 乐视网信息技术(北京)股份有限公司 | 一种关键词提取方法和装置 |
CN106776982A (zh) * | 2016-12-02 | 2017-05-31 | 深圳市唯特视科技有限公司 | 一种采用机器学习的社交媒体情感分析方法 |
CN107247703A (zh) * | 2017-06-08 | 2017-10-13 | 天津大学 | 基于卷积神经网络和集成学习的微博情感分析方法 |
CN107895283A (zh) * | 2017-11-07 | 2018-04-10 | 重庆邮电大学 | 一种基于时间序列分解的商家客流量大数据预测方法 |
CN107908715A (zh) * | 2017-11-10 | 2018-04-13 | 中国民航大学 | 基于Adaboost和分类器加权融合的微博情感极性判别方法 |
CN107894979A (zh) * | 2017-11-21 | 2018-04-10 | 北京百度网讯科技有限公司 | 用于语义挖掘的复合词处理方法、装置及其设备 |
CN108304884A (zh) * | 2018-02-23 | 2018-07-20 | 华东理工大学 | 一种基于特征逆映射的代价敏感堆叠集成学习框架 |
CN108984523A (zh) * | 2018-06-29 | 2018-12-11 | 重庆邮电大学 | 一种基于深度学习模型的商品评论情感分析方法 |
CN109255651A (zh) * | 2018-08-22 | 2019-01-22 | 重庆邮电大学 | 一种基于大数据的搜索广告转化智能预测方法 |
CN109491914A (zh) * | 2018-11-09 | 2019-03-19 | 大连海事大学 | 基于不平衡学习策略高影响缺陷报告预测方法 |
CN109460474A (zh) * | 2018-11-22 | 2019-03-12 | 合肥工业大学 | 用户偏好趋势挖掘方法 |
Non-Patent Citations (3)
Title |
---|
Sun K W 等.Multilabel classification via co-evolutionary multilabel hypernetwork.《IEEE transactions on knowledge and data engineering》.2016,第28卷(第09期),2438-2451. * |
刘楠.面向微博短文本的情感分析研究.《中国博士学位论文全文数据库(信息科技辑)》.2014,(第05期),I138-94. * |
房满林 董超俊.改进互联网电商评论特征词典的舆情观点分类.《科技创新与应用》.2017,(第13期),18-20. * |
Also Published As
Publication number | Publication date |
---|---|
CN110059183A (zh) | 2019-07-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110059183B (zh) | 一种基于大数据的汽车行业用户观点情感分类方法 | |
CN105975573B (zh) | 一种基于knn的文本分类方法 | |
CN110335653B (zh) | 基于openEHR病历格式的非标准病历解析方法 | |
CN111125349A (zh) | 基于词频和语义的图模型文本摘要生成方法 | |
Chowdhury et al. | Analyzing sentiment of movie reviews in bangla by applying machine learning techniques | |
CN107229610A (zh) | 一种情感数据的分析方法及装置 | |
CN108763214B (zh) | 一种针对商品评论的情感词典自动构建方法 | |
CN110415071B (zh) | 一种基于观点挖掘分析的汽车竞品对比方法 | |
CN109492105B (zh) | 一种基于多特征集成学习的文本情感分类方法 | |
CN112597283B (zh) | 通知文本信息实体属性抽取方法、计算机设备及存储介质 | |
CN112905739B (zh) | 虚假评论检测模型训练方法、检测方法及电子设备 | |
CN104361037B (zh) | 微博分类方法及装置 | |
CN109960727A (zh) | 针对非结构化文本的个人隐私信息自动检测方法及系统 | |
CN110046356B (zh) | 标签嵌入的微博文本情绪多标签分类方法 | |
CN110046943B (zh) | 一种网络消费者细分的优化方法及优化系统 | |
CN110134793A (zh) | 文本情感分类方法 | |
CN110222192A (zh) | 语料库建立方法及装置 | |
CN116304020A (zh) | 一种基于义原分析和跨度特征的工业文本实体抽取方法 | |
CN113392191B (zh) | 一种基于多维度语义联合学习的文本匹配方法和装置 | |
CN114817541A (zh) | 基于双重情感感知的谣言检测方法及装置 | |
Ningsih et al. | Global recession sentiment analysis utilizing VADER and ensemble learning method with word embedding | |
CN114662477A (zh) | 基于中医对话的停用词表生成方法、装置及存储介质 | |
CN106815209B (zh) | 一种维吾尔文农业技术术语识别方法 | |
CN111191029B (zh) | 基于监督学习和文本分类的ac构建方法 | |
CN116911286A (zh) | 词典构建方法、情感分析方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20230525 Address after: Room 801, 85 Kefeng Road, Huangpu District, Guangzhou City, Guangdong Province Patentee after: Yami Technology (Guangzhou) Co.,Ltd. Address before: 400065 Chongwen Road, Nanshan Street, Nanan District, Chongqing Patentee before: CHONGQING University OF POSTS AND TELECOMMUNICATIONS |
|
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20231219 Address after: Room JT114, 4th Floor, Building 36, No. 70 Bole Road, Jiading Town, Jiading District, Shanghai, 201800 Patentee after: Shanghai Yihong Information Technology Co.,Ltd. Address before: Room 801, 85 Kefeng Road, Huangpu District, Guangzhou City, Guangdong Province Patentee before: Yami Technology (Guangzhou) Co.,Ltd. |
|
TR01 | Transfer of patent right |