CN107704558A - 一种用户意见抽取方法及系统 - Google Patents

一种用户意见抽取方法及系统 Download PDF

Info

Publication number
CN107704558A
CN107704558A CN201710896653.6A CN201710896653A CN107704558A CN 107704558 A CN107704558 A CN 107704558A CN 201710896653 A CN201710896653 A CN 201710896653A CN 107704558 A CN107704558 A CN 107704558A
Authority
CN
China
Prior art keywords
opinions
consumers
sentence
vector
term vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710896653.6A
Other languages
English (en)
Inventor
田伟伟
洪煦
朱劲松
陈伟强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Che Hui Interactive Advertising Co Ltd
Original Assignee
Beijing Che Hui Interactive Advertising Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Che Hui Interactive Advertising Co Ltd filed Critical Beijing Che Hui Interactive Advertising Co Ltd
Priority to CN201710896653.6A priority Critical patent/CN107704558A/zh
Publication of CN107704558A publication Critical patent/CN107704558A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Abstract

本发明公开了一种用户意见抽取方法及系统。该方法包括:根据词向量模型处理文本数据,得到所述文本数据中语料的词向量集合;根据所述词向量对句子进行处理得到句子向量;对所述句子向量进行聚类分析得到用户的意见聚类簇;抽取所述意见聚类簇的中心用户评论得到用户意见;通过卷积神经网络以及循环神经网络构成的深度模型给出用户情感。本发明可以自动的抽取出针对某个产品或服务的用户反馈的典型意见以及该意见的情感分析,从而避免了目前大多数采用的人工总结抽取的繁重任务,大幅度提高了生产效率。

Description

一种用户意见抽取方法及系统
技术领域
本发明涉及大数据领域,尤其涉及一种用户意见抽取方法及系统。
背景技术
随着互联网的快速发展,细分领域的网站越来越多,例如汽车、餐饮、住宿等服务的网站。很多用户在细分领域中,伴随着自己的实际经验,会针对自己的服务发表自己的观点。用户的反馈对产品或者服务提供者具有重要的意义,特别是追踪用户对产品或者服务的舆情走向以及对产品或服务的后续改进。
对用户反馈数据的意见抽取是大数据分析的重点和难点,通过自动抽取方法,从海量的用户反馈数据中抽取大多数用户的关注点以进一步改进产品或服务。
现有技术中,用户意见的抽取技术方案主要包括:
1、通过人力从网上大量浏览用户对该产品的反馈结果,然后总结抽取,得到用户意见;
2、通过自然语言处理(NLP)相关算法进行典型意见抽取,首先使用词袋模型(bag-of-words,BOW)对文本提取特征向量,然后使用k-means、AKM或自组织映射(SOM)进行聚类分析得到类簇,进而得到用户意见。
通过人工手动的收集整理某产品用户的反馈意见,并将其通过一些辅助工具,比如excel等进行人工归纳总结,抽取出用户意见需要占用大量的人力资源,并且当数据量比较大的时候,比如公众号、头条号等用户量巨大的自媒体,受到内存以及计算能力等硬件资源的限制,很难全面考虑所有样本数据并进行总结。
人工总结的方式很难应用到自动化实现中,比如时下比较流行的舆情监控,要求系统可以实时把握某产品或者某领域的舆情走势,通过自动抓取互联网上所有相关数据并进行实时分析处理,得到群众对于该产品的整体舆情,而人工总结的方式显然不能满足该应用场景。
已有的通过BOW模型结合聚类算法得到用户典型意见方法更多的适合长文本,比如新闻数据,这样文本特征才不至于过于稀疏,但用户的评论数据或者论坛的跟帖数据都是短语句表示,映射到几万维度的特征空间过于稀疏,无法用后续模型进行有效的处理,故而该方案取得的效果一般。
发明内容
有鉴于此,本发明提供一种用户意见抽取方法及系统,以提供采集用户意见以及用户情感评分的技术方案。
本发明提供了一种用户意见抽取方法,该方法包括:
根据词向量模型处理文本数据,得到所述文本数据中语料的词向量集合;
根据所述词向量对句子进行处理得到句子向量;
对所述句子向量进行聚类分析得到用户的意见聚类簇;
抽取所述意见聚类簇的中心用户评论得到用户意见。
优选地,该方法还包括:
通过网络爬虫从网络抓取文本数据;
对文本数据进行预处理。
优选地,所述根据所述词向量对句子进行处理得到句子向量包括:
将句子中的词向量相加,或者对句子中的词向量进行加权平均。
优选地,该方法还包括:
根据循环神经网络模型处理所述句子向量得到用户意见的情感评分。
优选地,所述根据循环神经网络模型处理所述句子向量得到用户意见的情感评分包括:
根据所述词向量模型处理用户意见,得到所述用户意见的词向量;
对所述用户意见的词向量进行一维卷积;
对所述一维卷积的结果进行最大池化;
将所述最大池化的结果输入循环神经网络模型;
对所述循环神经网络模型输出的结果进行分类,得到用户意见的情感评分。
本发明提供了一种用户意见抽取系统,该系统包括:
词向量模块,用于根据词向量模型处理文本数据,得到所述文本数据中语料的词向量集合;
句子向量模块,用于根据所述词向量对句子进行处理得到句子向量;
聚类模块,用于对所述句子向量进行聚类分析得到用户的意见聚类簇;
抽取模块,用于抽取所述意见聚类簇的中心用户评论得到用户意见。
优选地,该系统还包括:
抓取模块,用于通过网络爬虫从网络抓取文本数据;
预处理模块,用于对文本数据进行预处理。
优选地,所述句子向量模块还用于将句子中的词向量相加,或者对句子中的词向量进行加权平均。
优选地,该系统还包括评分模块,用于根据循环神经网络模型处理所述句子向量得到用户意见的情感评分。
优选地,所述评分模块,用于根据所述词向量模型处理用户意见,得到所述用户意见的词向量;对所述用户意见的词向量进行一维卷积;对所述一维卷积的结果进行最大池化;将所述最大池化的结果输入循环神经网络模型;对所述循环神经网络模型输出的结果进行分类,得到用户意见的情感评分。
本发明可以自动的抽取出针对某个产品或服务的用户反馈的典型意见以及该意见的情感分析,从而避免了目前大多数采用的人工总结抽取的繁重任务,大幅度提高了生产效率。本发明依托于大数据,在数据的处理以及模型的训练过程中,通过分布式集群可以容纳更大规模的数据,使用了千万级别的数据进行模型学习,远远超出了单机的处理能力。
附图说明
附图是用来提供对本发明的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本发明,但并不构成对本发明的限制。在附图中:
图1是本发明提供的用户意见抽取的流程图;
图2a是本发明提供的基于词向量模型的用户意见抽取流程图;
图2b是基于循环神经网络的情感分类流程图;
图3是基于本发明的抽取用户意见及情感评分示意图;
图4a和图4b是基于本发明的两种车型动力的用户意见示意图;
图5是本发明提供的用户意见抽取系统示意图。
具体实施方式
以下结合附图对本发明的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明,并不用于限制本发明。
如图1所示,本发明提供了用户意见的抽取方法,具体包括:
步骤105,通过网络爬虫从网络抓取文本数据;具体而言,可以通过网络爬虫抓取门户网站、自媒体、垂直媒体领域抓取用户对某个产品或者服务或者某个关键词的所有文本数据,比如对汽车领域某车型用户的论坛数据、口碑数据,并整理存入数据库,例如mongoDB数据库;门户网站例如新浪、搜狐等网站,自媒体例如微信中的公众号、视频网站中的个人频道等,垂直媒体例如知乎、今日头条等。
步骤110,对文本数据进行预处理。具体而言,对抓取的文本数据进行分词,词与词之间用分隔符进行分隔,并虑无意义词,比如“的”、“了”等文字。分词可以采用现有的分词算法,例如基于字符串匹配的分词算法,基于理解的分词算法,基于统计的分词算法等。
步骤115,根据词向量模型处理文本数据,得到所述文本数据中语料的词向量集合;具体而言,用预处理后的语料数据训练深度神经网络word2vec模型,得到所有语料的词向量集合;将预处理后得到的分词输入深度神经网络word2vec模型可以得到词的向量。
步骤120,根据词向量对句子进行处理得到句子向量;在进行分词之后,每个句子可以对应若干个词,可以通过对句子中词的向量进行加和或者加和平均得到句子向量。
步骤125,对句子向量进行聚类分析得到用户的意见聚类簇;具体而言,将得句子向量通过k-means聚类算法或者AKM算法等进行聚类分析,人为指定聚类中心个数(例如1个),得到用户对产品或服务的意见聚类簇;
步骤130,抽取所述意见聚类簇的中心用户评论得到用户意见。具体而言,根据聚类中心个数,例如1个,则抽取意见聚类簇中的1个意见作为用户意见。
步骤135,根据循环神经网络模型处理句子向量得到用户意见的情感评分。具体而言,将句子向量作为循环神经网络GRU的输入,得到用户评论的情感评分,评分结果为正面、负面或者中性。
本发明主要侧重于两个方面,一个方面是基于词向量模型的用户意见抽取,另一个方面是基于深度神经网络的情感分析。
图2a示出了基于词向量模型的用户意见抽取流程,具体包括:
步骤205,抓取文本数据;
步骤210,对文本数据和新闻数据进行分词;
步骤215,将分词结果输入word2vec模型,输出分词的向量表示模型,即每个中文词在语义特征空间都有一个多维向量表示,相关语义的词特征向量距离更小,而不相关词则距离较大,该模型还有更加高层语义特征表示,比如vec(“中国”)-vec(“北京”)=vec(“美国”)–vec(“华盛顿”)。词向量A与词向量B之间的距离度量采用余弦距离,公式如下:
其中n为向量长度,Ai,Bi为向量元素。Word2vec模型通过学习输入语料得到词与词之间的相关性并把每个词映射到多维的语义空间中。在Word2vec模型的训练过程中,通过词的上下文信息预测该词,并且在计算过程中结合了哈弗曼编码,大幅度提高了运算速度。若已知某词的上下文词,推测该词的出现概率如公式(2):
其中lw表示在哈弗曼树中节点经过的路径节点,p(w|content(w))表示由词w的上下文推导w的概率,p(d|v,θ)为节点处分类概率,σ为sigmod函数,每个节点都可以表示成逻辑回归的二分类问题,对每个节点,求解最大似然函数,得到最终所有节点的分类参数以及词的向量表示。
步骤220,根据词向量计算句子向量。计算句子向量可以有不同的方法,例如将词向量相加,或者将词向量相加后计算均值。计算均值的公式如下:
其中vec(sentence)表示句向量,vec(w)表示词w的词向量,len(sentence)为句子长度,即词个数。
步骤225,将句子向量通过k-means聚类算法进行聚类。在进行聚类时,可以根据不同领域或者应用场景,可以选择不同的聚类中心个数,比如针对汽车垂直领域,词向量维度为200,聚类中心数300,训练语料可以为千万条用户评论语料。
步骤230,根据聚类中心个数得到的用户意见聚类簇,从而获得用户意见。
图2b示出了基于循环神经网络的情感分类流程,具体包括:
步骤235,输入数据,例如用户意见的分词结果;
步骤240,对输入的数据进行词向量编码;
步骤245,对词向量进行一维卷积;
步骤250,将卷积结果进行最大池化;
步骤255,将最大池化结果输入GRU循环神经网络单元;
步骤260,将神经网络输出结果进行分类,例如使用softmax函数进行分类,得到用户的情感分类,并给出置信度。情感分类可以为正面情感、负面情感、中性情感,可以用情感评分来表达为1、-1、0。
图3示出了本发明提供的技术方案提取的用户意见以及用户的情感评分示意图。从图3可以看到,在汽车领域的应用中,本发明能够从海量的用户文本数据中抽取出用户意见,比如“性价比不好”,并且通过深度神经网络算法把该意见作了负面的情感分类,不需要耗费大量的人力对海量的用户评论数据进行人工整理总结,非常便捷的满足其他业务线以及相应产品的需求。
图4a和图4b是利用本发明对两个不同的车型上市后,对其动力方面的评论的自动抽取用户意见的结果。可以看出,图4a中用户对动力方面的意见是“动力还是很好”、“动力充足”,图4b中用户对动力方面的意见是“起步有点肉”。通过本发明能够直观地获取市场对新上市车型动力的反馈。
图5是本发明提供的用户意见抽取系统示意图,具体包括:抓取模块505,用于通过网络爬虫从网络抓取文本数据;预处理模块510,用于对文本数据和新闻数据进行预处理;词向量模块515,用于根据词向量模型处理文本数据,得到文本数据中语料的词向量集合;句子向量模块520,用于根据词向量对句子进行处理得到句子向量;聚类模块525,用于对句子向量进行聚类分析得到用户的意见聚类簇;抽取模块530,用于抽取意见聚类簇的中心用户评论得到用户意见;评分模块535,用于根据循环神经网络模型处理句子向量得到用户意见的情感评分。
以上结合附图详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种简单变型,这些简单变型均属于本发明的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合。为了避免不必要的重复,本发明对各种可能的组合方式不再另行说明。
此外,本发明的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明的思想,其同样应当视为本发明所公开的内容。

Claims (10)

1.一种用户意见抽取方法,其特征在于,该方法包括:
根据词向量模型处理文本数据,得到所述文本数据中语料的词向量集合;
根据所述词向量对句子进行处理得到句子向量;
对所述句子向量进行聚类分析得到用户的意见聚类簇;
抽取所述意见聚类簇的中心用户评论得到用户意见。
2.根据权利要求1所述的方法,其特征在于,该方法还包括:
通过网络爬虫从网络抓取文本数据;
对文本数据进行预处理。
3.根据权利要求1所述的方法,其特征在于,所述根据所述词向量对句子进行处理得到句子向量包括:
将句子中的词向量相加,或者对句子中的词向量进行加权平均。
4.根据权利要求1所述的方法,其特征在于,该方法还包括:
根据循环神经网络模型处理所述句子向量得到用户意见的情感评分。
5.根据权利要求1所述的方法,其特征在于,所述根据循环神经网络模型处理所述句子向量得到用户意见的情感评分包括:
根据所述词向量模型处理用户意见,得到所述用户意见的词向量;
对所述用户意见的词向量进行一维卷积;
对所述一维卷积的结果进行最大池化;
将所述最大池化的结果输入循环神经网络模型;
对所述循环神经网络模型输出的结果进行分类,得到用户意见的情感评分。
6.一种用户意见抽取系统,其特征在于,该系统包括:
词向量模块,用于根据词向量模型处理文本数据,得到所述文本数据中语料的词向量集合;
句子向量模块,用于根据所述词向量对句子进行处理得到句子向量;
聚类模块,用于对所述句子向量进行聚类分析得到用户的意见聚类簇;
抽取模块,用于抽取所述意见聚类簇的中心用户评论得到用户意见。
7.根据权利要求6所述的系统,其特征在于,该系统还包括:
抓取模块,用于通过网络爬虫从网络抓取文本数据;
预处理模块,用于对文本数据进行预处理。
8.根据权利要求6所述的系统,其特征在于,所述句子向量模块还用于将句子中的词向量相加,或者对句子中的词向量进行加权平均。
9.根据权利要求6所述的系统,其特征在于,该系统还包括评分模块,用于根据循环神经网络模型处理所述句子向量得到用户意见的情感评分。
10.根据权利要求6所述的系统,其特征在于,所述评分模块,用于根据所述词向量模型处理用户意见,得到所述用户意见的词向量;对所述用户意见的词向量进行一维卷积;对所述一维卷积的结果进行最大池化;将所述最大池化的结果输入循环神经网络模型;对所述循环神经网络模型输出的结果进行分类,得到用户意见的情感评分。
CN201710896653.6A 2017-09-28 2017-09-28 一种用户意见抽取方法及系统 Pending CN107704558A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710896653.6A CN107704558A (zh) 2017-09-28 2017-09-28 一种用户意见抽取方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710896653.6A CN107704558A (zh) 2017-09-28 2017-09-28 一种用户意见抽取方法及系统

Publications (1)

Publication Number Publication Date
CN107704558A true CN107704558A (zh) 2018-02-16

Family

ID=61175898

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710896653.6A Pending CN107704558A (zh) 2017-09-28 2017-09-28 一种用户意见抽取方法及系统

Country Status (1)

Country Link
CN (1) CN107704558A (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108536674A (zh) * 2018-03-21 2018-09-14 上海蔚界信息科技有限公司 一种基于语义的典型意见聚合方法
CN109145215A (zh) * 2018-08-29 2019-01-04 中国平安保险(集团)股份有限公司 网络舆情分析方法、装置及存储介质
CN109145216A (zh) * 2018-08-29 2019-01-04 中国平安保险(集团)股份有限公司 网络舆情监控方法、装置及存储介质
CN109325165A (zh) * 2018-08-29 2019-02-12 中国平安保险(集团)股份有限公司 网络舆情分析方法、装置及存储介质
CN109461037A (zh) * 2018-12-17 2019-03-12 北京百度网讯科技有限公司 评论观点聚类方法、装置和终端
CN109800307A (zh) * 2019-01-18 2019-05-24 深圳壹账通智能科技有限公司 产品评价的分析方法、装置、计算机设备及存储介质
CN110210024A (zh) * 2019-05-28 2019-09-06 腾讯科技(深圳)有限公司 一种信息处理方法、装置及存储介质
CN110297907A (zh) * 2019-06-28 2019-10-01 谭浩 生成访谈报告的方法、计算机可读存储介质和终端设备
CN110414819A (zh) * 2019-07-19 2019-11-05 中国电信集团工会上海市委员会 一种工单评分方法
CN110457472A (zh) * 2019-07-16 2019-11-15 天津大学 基于som聚类算法的针对电商产品评论的情感关联分析方法
CN110457424A (zh) * 2019-06-28 2019-11-15 谭浩 生成访谈报告的方法、计算机可读存储介质和终端设备
CN110472040A (zh) * 2019-06-26 2019-11-19 平安科技(深圳)有限公司 评价信息的提取方法及装置、存储介质、计算机设备
CN113449927A (zh) * 2021-07-13 2021-09-28 广东电网有限责任公司 基于自然语言故障抢修的评价方法、设备及存储介质
CN116541523A (zh) * 2023-04-28 2023-08-04 重庆邮电大学 一种基于大数据的法律判决舆情分类方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104933130A (zh) * 2015-06-12 2015-09-23 百度在线网络技术(北京)有限公司 评论信息的标注方法及装置
CN106372208A (zh) * 2016-09-05 2017-02-01 东南大学 一种基于语句相似度的话题观点聚类方法
CN107038480A (zh) * 2017-05-12 2017-08-11 东华大学 一种基于卷积神经网络的文本情感分类方法
CN107145503A (zh) * 2017-03-20 2017-09-08 中国农业大学 基于word2vec的远监督非分类关系提取方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104933130A (zh) * 2015-06-12 2015-09-23 百度在线网络技术(北京)有限公司 评论信息的标注方法及装置
CN106372208A (zh) * 2016-09-05 2017-02-01 东南大学 一种基于语句相似度的话题观点聚类方法
CN107145503A (zh) * 2017-03-20 2017-09-08 中国农业大学 基于word2vec的远监督非分类关系提取方法及系统
CN107038480A (zh) * 2017-05-12 2017-08-11 东华大学 一种基于卷积神经网络的文本情感分类方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CYNTHIA_H: "深度学习之word2vec.ppt", 《HTTPS://MAX.BOOK118.COM/HTML/2016/0719/48659998.SHTM》 *
六月麦茬: "Word2Vec概述与基于Hierarchical Softmax的CBOW和Skip-gram模型公式推导", 《HTTPS://BLOG.CSDN.NET/LIUYUEMAICHA/ARTICLE/DETAILS/52611219/,第1-10》 *
文哥的学习日记: "探秘Word2Vec(四)-CBOW模型", 《HTTPS://WWW.JIANSHU.COM/P/D534570272A6》 *

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108536674A (zh) * 2018-03-21 2018-09-14 上海蔚界信息科技有限公司 一种基于语义的典型意见聚合方法
CN109145216B (zh) * 2018-08-29 2023-08-25 中国平安保险(集团)股份有限公司 网络舆情监控方法、装置及存储介质
CN109145216A (zh) * 2018-08-29 2019-01-04 中国平安保险(集团)股份有限公司 网络舆情监控方法、装置及存储介质
CN109325165A (zh) * 2018-08-29 2019-02-12 中国平安保险(集团)股份有限公司 网络舆情分析方法、装置及存储介质
CN109145215B (zh) * 2018-08-29 2023-11-07 中国平安保险(集团)股份有限公司 网络舆情分析方法、装置及存储介质
CN109145215A (zh) * 2018-08-29 2019-01-04 中国平安保险(集团)股份有限公司 网络舆情分析方法、装置及存储介质
CN109325165B (zh) * 2018-08-29 2023-08-22 中国平安保险(集团)股份有限公司 网络舆情分析方法、装置及存储介质
CN109461037A (zh) * 2018-12-17 2019-03-12 北京百度网讯科技有限公司 评论观点聚类方法、装置和终端
CN109461037B (zh) * 2018-12-17 2022-10-28 北京百度网讯科技有限公司 评论观点聚类方法、装置和终端
CN109800307A (zh) * 2019-01-18 2019-05-24 深圳壹账通智能科技有限公司 产品评价的分析方法、装置、计算机设备及存储介质
CN109800307B (zh) * 2019-01-18 2022-08-02 深圳壹账通智能科技有限公司 产品评价的分析方法、装置、计算机设备及存储介质
CN110210024A (zh) * 2019-05-28 2019-09-06 腾讯科技(深圳)有限公司 一种信息处理方法、装置及存储介质
CN110210024B (zh) * 2019-05-28 2024-04-02 腾讯科技(深圳)有限公司 一种信息处理方法、装置及存储介质
CN110472040A (zh) * 2019-06-26 2019-11-19 平安科技(深圳)有限公司 评价信息的提取方法及装置、存储介质、计算机设备
CN110457424A (zh) * 2019-06-28 2019-11-15 谭浩 生成访谈报告的方法、计算机可读存储介质和终端设备
CN110297907B (zh) * 2019-06-28 2022-03-08 谭浩 生成访谈报告的方法、计算机可读存储介质和终端设备
CN110297907A (zh) * 2019-06-28 2019-10-01 谭浩 生成访谈报告的方法、计算机可读存储介质和终端设备
CN110457472A (zh) * 2019-07-16 2019-11-15 天津大学 基于som聚类算法的针对电商产品评论的情感关联分析方法
CN110414819A (zh) * 2019-07-19 2019-11-05 中国电信集团工会上海市委员会 一种工单评分方法
CN113449927B (zh) * 2021-07-13 2022-09-30 广东电网有限责任公司 基于自然语言故障抢修的评价方法、设备及存储介质
CN113449927A (zh) * 2021-07-13 2021-09-28 广东电网有限责任公司 基于自然语言故障抢修的评价方法、设备及存储介质
CN116541523A (zh) * 2023-04-28 2023-08-04 重庆邮电大学 一种基于大数据的法律判决舆情分类方法

Similar Documents

Publication Publication Date Title
CN107704558A (zh) 一种用户意见抽取方法及系统
Dahou et al. Word embeddings and convolutional neural network for arabic sentiment classification
CN104573046B (zh) 一种基于词向量的评论分析方法及系统
WO2019080863A1 (zh) 文本情感分类方法、存储介质及计算机
CN110765260A (zh) 一种基于卷积神经网络与联合注意力机制的信息推荐方法
CN109413028A (zh) 基于卷积神经网络算法的sql注入检测方法
CN107025284A (zh) 网络评论文本情感倾向的识别方法及卷积神经网络模型
Mendsaikhan et al. Identification of cybersecurity specific content using the Doc2Vec language model
CN110362819B (zh) 基于卷积神经网络的文本情感分析方法
CN107153640A (zh) 一种面向初等数学领域的分词方法
CN105631468A (zh) 一种基于rnn的图片描述自动生成方法
CN110175221B (zh) 利用词向量结合机器学习的垃圾短信识别方法
CN104281653A (zh) 一种针对千万级规模微博文本的观点挖掘方法
CN107679110A (zh) 结合文本分类与图片属性提取完善知识图谱的方法及装置
CN107688576A (zh) 一种cnn‑svm模型的构建及倾向性分类方法
CN108733675A (zh) 基于大量样本数据的情感评价方法及装置
CN110134934A (zh) 文本情感分析方法和装置
CN110879834A (zh) 一种基于循环卷积网络的观点检索系统及其观点检索方法
CN110321918A (zh) 基于微博的舆论机器人系统情感分析和图像标注的方法
Thakkar et al. Improving the performance of sentiment analysis using enhanced preprocessing technique and Artificial Neural Network
CN104573030A (zh) 一种文本情绪预测方法及装置
Parveen et al. Twitter sentiment analysis using hybrid gated attention recurrent network
Eke et al. The significance of global vectors representation in sarcasm analysis
CN106776539A (zh) 一种多维度短文本特征提取方法及系统
Mohiyaddeen et al. Automatic hate speech detection: A literature review

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 100044 Tengda Building, 168 Xizhimenwai Street, Haidian District, Beijing, 2101-2103 and 2105-2111 on the 21st floor

Applicant after: Beijing Chehui Technology Co., Ltd.

Address before: 100044 01-07, 29 story, Tengda tower, 168 west gate, Haidian District, Beijing.

Applicant before: Beijing Che Hui Interactive Advertising Co., Ltd.

CB02 Change of applicant information
RJ01 Rejection of invention patent application after publication

Application publication date: 20180216

RJ01 Rejection of invention patent application after publication