CN116579351A - 一种用户评价信息的分析方法及装置 - Google Patents
一种用户评价信息的分析方法及装置 Download PDFInfo
- Publication number
- CN116579351A CN116579351A CN202310864393.XA CN202310864393A CN116579351A CN 116579351 A CN116579351 A CN 116579351A CN 202310864393 A CN202310864393 A CN 202310864393A CN 116579351 A CN116579351 A CN 116579351A
- Authority
- CN
- China
- Prior art keywords
- evaluation
- user
- information
- semantic
- keywords
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 252
- 238000004458 analytical method Methods 0.000 title claims description 24
- 238000000034 method Methods 0.000 claims abstract description 40
- 238000004140 cleaning Methods 0.000 claims description 18
- 239000011159 matrix material Substances 0.000 claims description 14
- 238000012216 screening Methods 0.000 claims description 11
- 238000003062 neural network model Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 abstract description 15
- 239000013598 vector Substances 0.000 description 11
- 238000004364 calculation method Methods 0.000 description 5
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000013145 classification model Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Entrepreneurship & Innovation (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Game Theory and Decision Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种用户评价信息的分析方法及装置,所述方法包括:在获取用户的评价信息和评分值后,根据所述评分值的大小确定所述评价信息对应的评分类别;基于所述评分类别查找特征词库,所述特征词库是拆分并提取多条在先用户评价信息的词组后组合成的词库;按照所述特征词库包含的词组从所述评价信息提取若干个评价关键词,根据若干个所述评价关键词分析用户的评价语意。本发明可以在根据评价信息的评分进行分类后,按照每个类别的特征词库从评价信息中特征词,根据特征词确定用户评价的语意并反馈给后台人员,从而减少查看的信息数量,以缩短处理耗时,提升处理效率。
Description
技术领域
本发明涉及用户消费评价信息分析的技术领域,尤其涉及一种用户评价信息的分析方法及装置。
背景技术
随着互联网技术的发展,各大电商网购平台普及,越来越多的用户在网上平台消费,并在消费后留下商品评价及相关的评分信息。对于商品销售者而言,可以通过买家的评价及评分信息了解买家的消费热点、消费倾向及消费体验等,以调整其商品服务,从而更有针对性地提供商品和服务。
由于网络评论数量庞大,一般会基于评分的高低对信息第一次分类,再将不同类别的信息传输给后台管理人员,对信息进行分析,以确定买家的消费体验并从中发掘有意义和有价值的热点商品信息。
但现有的分析方法有如下技术问题:由于信息量庞大,后台人员需要逐一查看每条信息的内容并对其进行分析,处理耗时长,降低了处理效率。
发明内容
本发明提出一种用户评价信息的分析方法及装置,所述方法可以在根据评价信息的评分进行分类后,按照每个类别的特征词库从评价信息中特征词,根据特征词确定用户评价的语意并反馈给后台人员,从而减少查看的信息数量,以缩短处理耗时,提升处理效率。
本发明实施例的第一方面提供了一种用户评价信息的分析方法,所述方法包括:
在获取用户的评价信息和评分值后,根据所述评分值的大小确定所述评价信息对应的评分类别;
基于所述评分类别查找特征词库,所述特征词库是拆分并提取多条在先用户评价信息的词组后组合成的词库;
按照所述特征词库包含的词组从所述评价信息提取若干个评价关键词,根据若干个所述评价关键词分析用户的评价语意。
在第一方面的一种可能的实现方式中,所述根据若干个所述评价关键词分析用户的评价语意,包括:
统计每个所述评价关键词在所述评价信息的词频值;
从若干个所述评价关键词中筛选词频值大于第一预设频率值的目标关键词;
识别并集合每个所述目标关键词的语意得到用户的评价语意。
在第一方面的一种可能的实现方式中,所述根据若干个所述评价关键词分析用户的评价语意,还包括:
若每个所述评价关键词的词频值均小于第一预设频率值,则按照所述词频值对若干个所述评价关键词进行排序,形成关键词列表,以供后台人员查看。
在第一方面的一种可能的实现方式中,所述根据若干个所述评价关键词分析用户的评价语意,包括:
识别每个所述评价关键词的语意,得到若干个词组语意;
对所述若干个词组语意进行聚合分类,得到若干个语意类别;
计算每个所述语意类别包含的评价关键词的数量,并筛选包含评价关键词的数量最多的语意类别为目标语意类别,以所述目标语意类别的语意为用户的评价语意。
在第一方面的一种可能的实现方式中,在所述获取用户的评价信息和评分值的步骤后,所述方法还包括:
利用预设的Subwrod词表将所述评价信息的每个文本转换成文本矩阵;
将所述文本矩阵输入至预设的神经网络模型进行清洗处理得到清洗信息。
在第一方面的一种可能的实现方式中,所述预设的Subwrod词表的构建方式,包括:
录入多个评价样本信息,并对每个所述评价样本信息进行字符粒度级别的分割,得到多个分割字符,其中,每个所述评价样本信息是消费同一商品的在先用户添加的评价;
统计每个所述分割字符与相邻字符组成字符对的频率,得到多个字符对频率值;
从所述多个字符对频率值中筛选若干个大于第二预设频率值的目标字符对频率值,并采用每个所述目标字符对频率值对应的字符对构建生成Subwrod词表。
在第一方面的一种可能的实现方式中,在所述根据若干个所述评价关键词分析用户的评价语意的步骤后,所述方法还包括:
若所述评价语意为负面语意,标注并展示所述评价信息,以供后台人员查看。
本发明实施例的第二方面提供了一种用户评价信息的分析装置,所述装置包括:
评分分类模块,用于在获取用户的评价信息和评分值后,根据所述评分值的大小确定所述评价信息对应的评分类别;
查找词库模块,用于基于所述评分类别查找特征词库,所述特征词库是拆分并提取多条在先用户评价信息的词组后组合成的词库;
分析语意模块,用于按照所述特征词库包含的词组从所述评价信息提取若干个评价关键词,根据若干个所述评价关键词分析用户的评价语意。
在第二方面的一种可能的实现方式中,所述分析语意模块,还用于:
统计每个所述评价关键词在所述评价信息的词频值;
从若干个所述评价关键词中筛选词频值大于第一预设频率值的目标关键词;
识别并集合每个所述目标关键词的语意得到用户的评价语意。
在第二方面的一种可能的实现方式中,所述分析语意模块,还用于:
若每个所述评价关键词的词频值均小于第一预设频率值,则按照所述词频值对若干个所述评价关键词进行排序,形成关键词列表,以供后台人员查看。
在第二方面的一种可能的实现方式中,所述分析语意模块,还用于:
识别每个所述评价关键词的语意,得到若干个词组语意;
对所述若干个词组语意进行聚合分类,得到若干个语意类别;
计算每个所述语意类别包含的评价关键词的数量,并筛选包含评价关键词的数量最多的语意类别为目标语意类别,以所述目标语意类别的语意为用户的评价语意。
在第二方面的一种可能的实现方式中,所述装置还包括:
文本转换模块,用于利用预设的Subwrod词表将所述评价信息的每个文本转换成文本矩阵;
文本清洗模块,用于将所述文本矩阵输入至预设的神经网络模型进行清洗处理得到清洗信息。
在第二方面的一种可能的实现方式中,所述预设的Subwrod词表的构建方式,包括:
录入多个评价样本信息,并对每个所述评价样本信息进行字符粒度级别的分割,得到多个分割字符,其中,每个所述评价样本信息是消费同一商品的在先用户添加的评价;
统计每个所述分割字符与相邻字符组成字符对的频率,得到多个字符对频率值;
从所述多个字符对频率值中筛选若干个大于第二预设频率值的目标字符对频率值,并采用每个所述目标字符对频率值对应的字符对构建生成Subwrod词表。
在第二方面的一种可能的实现方式中,在所述根据若干个所述评价关键词分析用户的评价语意的步骤后,所述装置还包括:
标注与展示模块,用于若所述评价语意为负面语意,标注并展示所述评价信息,以供后台人员查看。
相比于现有技术,本发明实施例提供的一种用户评价信息的分析方法及装置,其有益效果在于:本发明可以在根据评价信息的评分进行分类后,按照每个类别的特征词库从评价信息中特征词,根据特征词确定用户评价的语意并反馈给后台人员,从而减少查看的信息数量,以缩短处理耗时,提升处理效率。
附图说明
图1是本发明一实施例提供的一种用户评价信息的分析方法的流程示意图;
图2是本发明一实施例提供的一种用户评价信息的分析装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了解决上述问题,下面将通过以下具体的实施例对本申请实施例提供的一种用户评价信息的分析方法进行详细介绍和说明。
参照图1,示出了本发明一实施例提供的一种用户评价信息的分析方法的流程示意图。
在一实施例中,所述方法适用于设有线上商铺的云端平台或后台服务器。该后台服务器可以与不同技术人员或管理人员的智能终端通信连接。
其中,作为示例的,所述用户评价信息的分析方法,可以包括:
S11、在获取用户的评价信息和评分值后,根据所述评分值的大小确定所述评价信息对应的评分类别。
在一实施例中,评价信息可以是用户对其购买的商品添加的评价,可以是使用评价、购买体验评价、商品评价等等。评分值可以是对商品的评分值,例如90分、60分等。
不同的评分值可能对应的评论大致相同,例如,90分,这一高分给的评价大多数是好评,满意的评价;20分,这一低分给的评价一般是差评,不满意的评价。
由于分值相近的评价一般是相类似的评价,可以先根据分值对评价信息进行分类,确定该评价信息的类别,进而能根据其类别对其进行后续的关键词提取以及语意分析,以提升语意分析的准确率。
在一实施例中,确定其类别的方式可以是用户预先设定多个不同的分值区间段,例如0-10分为一个区间段,10-20分为另一个区间段,90-100分为另一个区间段,如此类推。每个区间段对应一个类别,类别也可以是用户预先设定的。可以先判断评分值所在的区间段,然后查找其所在区间段,基于该区间段确定评价信息的类别,得到评分类别。
在一实施例中,可能数据的评价信息有多条,且信息量大。例如,包含其购买商品的购买历程、过程中客户的沟通内容、商品的物流相关内容、个人对商品的评价、使用体验、购买数量、议价心得、如何获取优惠券以及对不同用户的推销用语等等。
但其中并非每条内容都有用,获取每条信息均涉及用户对商品的评价,因此,若对所有信息均进行后续的分析处理,所要处理的数据量非常庞大,且耗时非常长。为了减少处理的数据量,缩短处理的耗时,其中,作为示例的,在步骤S11后,所述方法还可以包括以下步骤:
S21、利用预设的Subwrod词表将所述评价信息的每个文本转换成文本矩阵。
在本实施例中,可以利用字符粒度级别的Subwrod词表对评价信息的句子和序号提取,并将提取的句子和序号转换成模型的文本矩阵,再将文本矩阵输入至预设的神经网络模型进行清洗处理得到清洗后的数据,由于Subwrod词表是字符粒度级别,不但规模小而且转换处理不会损失数据的信息量,进而能节省后续清洗计算的数据量,以缩短计算的处理耗时,提升数据的处理效率。
在一实施例中,预设的Subwrod词表可以是包含多个文本字符或词语的列表,可以利用列表所包含的字符和词语,从评价信息的文本中提取相关或有用的信息,并将其转换成对应的向量,再根据转换的向量进行清洗。
由于Subwrod词表是以字符粒度级别存储字符,后续提取信息也是按照字符粒度级别对能源数据进行分割后,使得后续的操作能尽可能多地保留评价信息的信息量,避免出现遗漏的情况,确保数据不会丢失。同时,由于存储的字符级别低,使得Subwrod词表的规模更小,后续计算时也可以节省计算资源,进而能大大节省后续数据清洗时的计算量,在确保数据清洗的准确率的情况下,大大提升后续数据清洗处理的效率。
具体地,转换成文本矩阵的方式可以是先识别评论信息内每个文本对应句子以及每个句子所包含的序号,并利用所述预设的Subwrod词表将每个文本对应句子以及每个句子所包含的序号转换成向量,分别得到每个所述文本对应的句子向量和序号向量。
接着可以将句子向量与序号向量相加得到评估信息中每一句文本对应的评论向量。
然后拼接若干个评论向量得到评估信息的文本向量,对文本向量进行矩阵嵌入操作,得到文本矩阵。
S22、将所述文本矩阵输入至预设的神经网络模型进行清洗处理得到清洗信息。
在一实施例中,可以将文本矩阵输入预设的神经网络模型,预设的神经网络模型对文本进行清洗后,可以输出清洗后的数据。
在一实施例中,所述预设的神经网络模型是利用关于评论的样本数据进行模型训练后得到BERT模型。
在一实施例中,所述预设的Subwrod词表的构建方式,包括:
S31、录入多个评价样本信息,并对每个所述评价样本信息进行字符粒度级别的分割,得到多个分割字符,其中,每个所述评价样本信息是消费同一商品的在先用户添加的评价。
在一实施例中,评价样本信息也可以是用户的评价信息,具体可以如上述评价信息包含的各种内容。
接下来需要对该录入的评价样本信息进行字符粒度级别的分割。此处所谓的“字符粒度级别”,是指按照每个汉字、每个字母或每个数字进行分割。例如,用户的评价样本信息可以是“这件衣服非常合身,姊妹们非常满足”,以上述样本中的“这件衣服非常合身”为例,需要将其分割为单个字符,分别是“这”、“件”、“衣”、“服”、“非”、“常”、“合”“身”这八个字符,其他所有字符以此类推。
S32、统计每个所述分割字符与相邻字符组成字符对的频率,得到多个字符对频率值。
可以统计每一个分割后的字符,与其相邻的字符组合字符对的频率值,从而可以得到多个字符对频率值。
S33、从所述多个字符对频率值中筛选若干个大于第二预设频率值的目标字符对频率值,并采用每个所述目标字符对频率值对应的字符对构建生成Subwrod词表。
可以从多个字符对频率值筛选大于预设频率值的目标字符对频率值,若干个大于预设频率值的目标字符对频率值对应的字符对,就是出现频率高的字符对,可以合并这些字符对,从而构建生成Subwrod词表。
在一可选的实施例中,在统计出现频率高的字符对时,可以考虑到有些单词拥有相同的特征词。例如,“姊”“妹”;“非”和“常”。
本步骤就是用于提取共同的词组。对分割后的字符进行频率的筛查和统计,相邻字符组合后合并成新的词组,再统计词组出现的频率,直到词组收敛。提取出单词中的公共词组后,例如“姊妹”、“非常”、“满意”等,利用词组构建Subword词表。
在构建并更新Subwrod词表时,将本文按照字符粒度级别进行分割后并根据字符与其前后字符组成字符对出现的频率高低来进行构建、更新Subwrod词表,出现频率高的字符对被纳入,出现频率低的字符对不被纳入,这样使得Subwrod词表的规模更小,在节省了计算资源的同时不损失信息量,进而大大节省后续数据清洗时的计算量,数据清洗的准确率更高。
S12、基于所述评分类别查找特征词库,所述特征词库是拆分并提取多条在先用户评价信息的词组后组合成的词库。
在确定评价信息的评分类别后,可以查找该评分类别功能的特征词库。其中,特征词库也可以是用户预先设定的,特征词库内容可以包含多个此类别的词或词库。这些词或词库可以是先获取多条在先的用户评价信息后,对在先的评价信息进行拆分,再从拆分后的词语中提取处理,最后组成一个词库。
可选地,可以由用户输入若干条此类别对应的用户评价信息,然后对其进行拆分和提取,利用提取的词组成词库。
在一可选的实施例中,可以按照上述步骤S31的方式进行拆分,再将拼接每个字符组成一些词形成词库。
在又一可选的实施例中,用户可以自行添加一些词组进入词库内,以适配不同的识别需要。
S13、按照所述特征词库包含的词组从所述评价信息提取若干个评价关键词,根据若干个所述评价关键词分析用户的评价语意。
在一实施例中,在确定特征词库后,可以按照特征词库内的词组对评价信息进行识别,确定这条评价信息中是否包含特征词库内的词组或词语,若有,则可以提取与特征词库内的词组或词语相同的词,得到若干个评价关键词。
接着,可以利用这些评价关键词,确定用户的此条评价信息的评价语意,进而能确定用户评价的目的是什么,到底是好评还是差评或者是恶意评论。
在一可选的实施例中,可以统计所筛选得到评价关键词的数量,若评价关键词的数量小于预设数量值,说明此条评论与其对应的评分类别不符,可以直接将此评价信息发送给后台技术人员,供其查看。
为了准确确定用户的语意,在其中一种的实施例中,步骤S13可以包括以下子步骤:
S41、统计每个所述评价关键词在所述评价信息的词频值。
具体地,可以统计每个评价关键词在这条评价信息中出现的次数,得到该评价关键词的词频值。
S42、从若干个所述评价关键词中筛选词频值大于第一预设频率值的目标关键词。
可以将每个评价关键词的词频值与第一预设频率值进行比较,确定评价关键词的词频值是否大于第一预设频率值。若评价关键词的词频值大于第一预设频率值,则确定该评价关键词为目标关键词。
S43、识别并集合每个所述目标关键词的语意得到用户的评价语意。
接着,可以识别每个目标关键词的语意,将多个语意集合在一起,形成用户的评价语意。
例如,目标关键词包含:“满意”,“合适”,“开心”,则可以识别其语意为好评,可以以“好评”为用户的评价语意。
S44、若每个所述评价关键词的词频值均小于第一预设频率值,则按照所述词频值对若干个所述评价关键词进行排序,形成关键词列表,以供后台人员查看。
如果每个评价关键词的词频值均小于第一预设频率值,说明评价关键词可能出现得非常小,若采用这些出现次数非常小的词进行语意识别,可能与用户实际的评价意图有偏差,为了避免上述偏差,可以按照词频值对若干个评价关键词进行排序,形成关键词列表。
后台人员可以通过查看该关键词列表,确定用户的语意。
具体地,可以将关键词列表发送给管理人员的智能终端,管理人员可以通过其智能终端查看列表,确定用户评价的语意。
由于列表中仅包含数个关键词,管理人员查看的信息数量小,可以缩短其查看时间,提升处理效率。
为了准确确定用户的语意,在又一种的实施例中,步骤S13可以包括以下子步骤:
S51、识别每个所述评价关键词的语意,得到若干个词组语意。
S52、对所述若干个词组语意进行聚合分类,得到若干个语意类别。
S53、计算每个所述语意类别包含的评价关键词的数量,并筛选包含评价关键词的数量最多的语意类别为目标语意类别,以所述目标语意类别的语意为用户的评价语意。
在一实施例中,可以直接识别每个评价关键词的语意,得到若干个词组语意。在对若干个关键词的语意进行聚合分类,确定其语意的类别。
在本实施例中,可以聚合分类的方式可以是调用预设的分类模型进行聚合分类,分类模型也可以是利用用户预先设定的多个评分类别进行训练的模型。在具体实现时,用户在预先设定好评分值的区间以及其对应的评分类别后,可以这些评分类别的信息对其进行训练,使得模型可以对各个词组语意进行分类。
因为识别得到的语意可能是其他的语意,因此,通过不同类别训练得到的模型,可以更加准确确定评价关键词的语意类别,进而能结合不同的语意确定用户的实际语意。
最后,可以统计每个语意类别包含的评价关键词的数量,得到每个语意类别对应的词数,然后筛选数值最大的词数,筛选得到包含评价关键词的数量最多的语意类别,以该语意类别为目标语意类别,再获取该目标语意类别的语意,从而得到用户的评价语意。
用户的评价语意可能是负面的,可能是对商品不满,为了了解用户的不满,其中,作为示例的,所述方法还可以包括:
S14、若所述评价语意为负面语意,标注并展示所述评价信息,以供后台人员查看。
具体地,可以确定评价语意是否为负面语意,若评价语意为负面语意,则可以将该负面语意的用户评价信息添加至对应的信息列表中,然后添加高亮显示的标注,再将其发送给后台人员的智能终端,智能终端在接收该列表后可以展示处理,供后台人员查看,以了解信息的实际内容。
在本实施例中,本发明实施例提供了一种用户评价信息的分析方法,其有益效果在于:本发明可以在根据评价信息的评分进行分类后,按照每个类别的特征词库从评价信息中特征词,根据特征词确定用户评价的语意并反馈给后台人员,从而减少查看的信息数量,以缩短处理耗时,提升处理效率。
本发明实施例还提供了一种用户评价信息的分析装置,参见图2,示出了本发明一实施例提供的一种用户评价信息的分析装置的结构示意图。
其中,作为示例的,所述用户评价信息的分析装置可以包括:
评分分类模块201,用于在获取用户的评价信息和评分值后,根据所述评分值的大小确定所述评价信息对应的评分类别;
查找词库模块202,用于基于所述评分类别查找特征词库,所述特征词库是拆分并提取多条在先用户评价信息的词组后组合成的词库;
分析语意模块203,用于按照所述特征词库包含的词组从所述评价信息提取若干个评价关键词,根据若干个所述评价关键词分析用户的评价语意。
可选地,所述分析语意模块,还用于:
统计每个所述评价关键词在所述评价信息的词频值;
从若干个所述评价关键词中筛选词频值大于第一预设频率值的目标关键词;
识别并集合每个所述目标关键词的语意得到用户的评价语意。
可选地,所述分析语意模块,还用于:
若每个所述评价关键词的词频值均小于第一预设频率值,则按照所述词频值对若干个所述评价关键词进行排序,形成关键词列表,以供后台人员查看。
可选地,所述分析语意模块,还用于:
识别每个所述评价关键词的语意,得到若干个词组语意;
对所述若干个词组语意进行聚合分类,得到若干个语意类别;
计算每个所述语意类别包含的评价关键词的数量,并筛选包含评价关键词的数量最多的语意类别为目标语意类别,以所述目标语意类别的语意为用户的评价语意。
可选地,所述装置还包括:
文本转换模块,用于利用预设的Subwrod词表将所述评价信息的每个文本转换成文本矩阵;
文本清洗模块,用于将所述文本矩阵输入至预设的神经网络模型进行清洗处理得到清洗信息。
可选地,所述预设的Subwrod词表的构建方式,包括:
录入多个评价样本信息,并对每个所述评价样本信息进行字符粒度级别的分割,得到多个分割字符,其中,每个所述评价样本信息是消费同一商品的在先用户添加的评价;
统计每个所述分割字符与相邻字符组成字符对的频率,得到多个字符对频率值;
从所述多个字符对频率值中筛选若干个大于第二预设频率值的目标字符对频率值,并采用每个所述目标字符对频率值对应的字符对构建生成Subwrod词表。
可选地,在所述根据若干个所述评价关键词分析用户的评价语意的步骤后,所述装置还包括:
标注与展示模块,用于若所述评价语意为负面语意,标注并展示所述评价信息,以供后台人员查看。
所属技术领域的技术人员可以清楚地了解到,为方便的描述和简洁,上述描述的装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
进一步的,本申请实施例还提供了一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述实施例所述的用户评价信息的分析方法。
进一步的,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行程序,所述计算机可执行程序用于使计算机执行如上述实施例所述的用户评价信息的分析方法。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
Claims (10)
1.一种用户评价信息的分析方法,其特征在于,所述方法包括:
在获取用户的评价信息和评分值后,根据所述评分值的大小确定所述评价信息对应的评分类别;
基于所述评分类别查找特征词库,所述特征词库是拆分并提取多条在先用户评价信息的词组后组合成的词库;
按照所述特征词库包含的词组从所述评价信息提取若干个评价关键词,根据若干个所述评价关键词分析用户的评价语意。
2.根据权利要求1所述的用户评价信息的分析方法,其特征在于,所述根据若干个所述评价关键词分析用户的评价语意,包括:
统计每个所述评价关键词在所述评价信息的词频值;
从若干个所述评价关键词中筛选词频值大于第一预设频率值的目标关键词;
识别并集合每个所述目标关键词的语意得到用户的评价语意。
3.根据权利要求2所述的用户评价信息的分析方法,其特征在于,所述根据若干个所述评价关键词分析用户的评价语意,还包括:
若每个所述评价关键词的词频值均小于第一预设频率值,则按照所述词频值对若干个所述评价关键词进行排序,形成关键词列表,以供后台人员查看。
4.根据权利要求1所述的用户评价信息的分析方法,其特征在于,所述根据若干个所述评价关键词分析用户的评价语意,包括:
识别每个所述评价关键词的语意,得到若干个词组语意;
对所述若干个词组语意进行聚合分类,得到若干个语意类别;
计算每个所述语意类别包含的评价关键词的数量,并筛选包含评价关键词的数量最多的语意类别为目标语意类别,以所述目标语意类别的语意为用户的评价语意。
5.根据权利要求1所述的用户评价信息的分析方法,其特征在于,在所述获取用户的评价信息和评分值的步骤后,所述方法还包括:
利用预设的Subwrod词表将所述评价信息的每个文本转换成文本矩阵;
将所述文本矩阵输入至预设的神经网络模型进行清洗处理得到清洗信息。
6.根据权利要求5所述的用户评价信息的分析方法,其特征在于,所述预设的Subwrod词表的构建方式,包括:
录入多个评价样本信息,并对每个所述评价样本信息进行字符粒度级别的分割,得到多个分割字符,其中,每个所述评价样本信息是消费同一商品的在先用户添加的评价;
统计每个所述分割字符与相邻字符组成字符对的频率,得到多个字符对频率值;
从所述多个字符对频率值中筛选若干个大于第二预设频率值的目标字符对频率值,并采用每个所述目标字符对频率值对应的字符对构建生成Subwrod词表。
7.根据权利要求1所述的用户评价信息的分析方法,其特征在于,在所述根据若干个所述评价关键词分析用户的评价语意的步骤后,所述方法还包括:
若所述评价语意为负面语意,标注并展示所述评价信息,以供后台人员查看。
8.一种用户评价信息的分析装置,其特征在于,所述装置包括:
评分分类模块,用于在获取用户的评价信息和评分值后,根据所述评分值的大小确定所述评价信息对应的评分类别;
查找词库模块,用于基于所述评分类别查找特征词库,所述特征词库是拆分并提取多条在先用户评价信息的词组后组合成的词库;
分析语意模块,用于按照所述特征词库包含的词组从所述评价信息提取若干个评价关键词,根据若干个所述评价关键词分析用户的评价语意。
9.一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-7任意一项所述的用户评价信息的分析方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行程序,所述计算机可执行程序用于使计算机执行如权利要求1-7任意一项所述的用户评价信息的分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310864393.XA CN116579351B (zh) | 2023-07-14 | 2023-07-14 | 一种用户评价信息的分析方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310864393.XA CN116579351B (zh) | 2023-07-14 | 2023-07-14 | 一种用户评价信息的分析方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116579351A true CN116579351A (zh) | 2023-08-11 |
CN116579351B CN116579351B (zh) | 2024-03-19 |
Family
ID=87541748
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310864393.XA Active CN116579351B (zh) | 2023-07-14 | 2023-07-14 | 一种用户评价信息的分析方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116579351B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117453965A (zh) * | 2023-10-19 | 2024-01-26 | 广州国家现代农业产业科技创新中心 | 一种基于花生性状信息分类的适应度计算方法及装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103870973A (zh) * | 2012-12-13 | 2014-06-18 | 阿里巴巴集团控股有限公司 | 基于电子信息的关键词提取的信息推送、搜索方法及装置 |
CN105893432A (zh) * | 2015-12-09 | 2016-08-24 | 乐视网信息技术(北京)股份有限公司 | 视频评论分类方法、视频评论显示系统以及服务器 |
CN110276065A (zh) * | 2018-03-15 | 2019-09-24 | 北京京东尚科信息技术有限公司 | 一种处理物品评论的方法和装置 |
CN110597988A (zh) * | 2019-08-28 | 2019-12-20 | 腾讯科技(深圳)有限公司 | 一种文本分类方法、装置、设备及存储介质 |
CN111898918A (zh) * | 2020-08-07 | 2020-11-06 | 上海明略人工智能(集团)有限公司 | 一种设备使用跟踪管理方法、装置、设备及存储介质 |
CN112541077A (zh) * | 2020-11-26 | 2021-03-23 | 深圳供电局有限公司 | 一种用于电网用户服务评价的处理方法及系统 |
CN112650848A (zh) * | 2020-12-30 | 2021-04-13 | 交控科技股份有限公司 | 基于文本语义相关乘客评价的城铁舆情信息分析方法 |
-
2023
- 2023-07-14 CN CN202310864393.XA patent/CN116579351B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103870973A (zh) * | 2012-12-13 | 2014-06-18 | 阿里巴巴集团控股有限公司 | 基于电子信息的关键词提取的信息推送、搜索方法及装置 |
CN105893432A (zh) * | 2015-12-09 | 2016-08-24 | 乐视网信息技术(北京)股份有限公司 | 视频评论分类方法、视频评论显示系统以及服务器 |
CN110276065A (zh) * | 2018-03-15 | 2019-09-24 | 北京京东尚科信息技术有限公司 | 一种处理物品评论的方法和装置 |
CN110597988A (zh) * | 2019-08-28 | 2019-12-20 | 腾讯科技(深圳)有限公司 | 一种文本分类方法、装置、设备及存储介质 |
CN111898918A (zh) * | 2020-08-07 | 2020-11-06 | 上海明略人工智能(集团)有限公司 | 一种设备使用跟踪管理方法、装置、设备及存储介质 |
CN112541077A (zh) * | 2020-11-26 | 2021-03-23 | 深圳供电局有限公司 | 一种用于电网用户服务评价的处理方法及系统 |
CN112650848A (zh) * | 2020-12-30 | 2021-04-13 | 交控科技股份有限公司 | 基于文本语义相关乘客评价的城铁舆情信息分析方法 |
Non-Patent Citations (1)
Title |
---|
张俊伟;杨柳;王硕宁;王忠建;: "基于文本挖掘的商品推荐", 哈尔滨商业大学学报(自然科学版), no. 04 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117453965A (zh) * | 2023-10-19 | 2024-01-26 | 广州国家现代农业产业科技创新中心 | 一种基于花生性状信息分类的适应度计算方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN116579351B (zh) | 2024-03-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107391493B (zh) | 一种舆情信息提取方法、装置、终端设备及存储介质 | |
CN110175325B (zh) | 基于词向量和句法特征的评论分析方法及可视化交互界面 | |
CN109872162B (zh) | 一种处理用户投诉信息的风控分类识别方法及系统 | |
CN110705286A (zh) | 一种基于评论信息的数据处理方法及装置 | |
CN111260437A (zh) | 一种基于商品方面级情感挖掘和模糊决策的产品推荐方法 | |
CN112699645B (zh) | 语料标注方法、装置及设备 | |
CN111324698B (zh) | 深度学习方法、评价观点提取方法、装置和系统 | |
CN111667337A (zh) | 一种商品评价的排序方法和系统 | |
CN116579351B (zh) | 一种用户评价信息的分析方法及装置 | |
CN111782793A (zh) | 智能客服处理方法和系统及设备 | |
CN113822071A (zh) | 一种背景信息推荐方法、装置、电子设备及介质 | |
CN113095723A (zh) | 优惠券的推荐方法及装置 | |
CN111984764A (zh) | 流单原因分析方法、装置、计算机设备及可读存储介质 | |
CN116303951A (zh) | 对话处理方法、装置、电子设备和存储介质 | |
CN111985226A (zh) | 标注数据生成方法及装置 | |
JP2021043530A (ja) | 入力支援方法、入力支援システム、及びプログラム | |
CN114048294B (zh) | 相似人群扩展模型训练方法、相似人群扩展方法和装置 | |
CN107886233B (zh) | 客服的服务质量评价方法和系统 | |
CN112732908B (zh) | 试题新颖度评估方法、装置、电子设备和存储介质 | |
CN113343714B (zh) | 信息提取方法、模型训练方法及相关设备 | |
CN115392787A (zh) | 企业的风险评估方法、装置、设备、存储介质及程序产品 | |
CN111625619A (zh) | 查询省略方法、装置、计算机可读介质及电子设备 | |
CN114155057A (zh) | 一种用于电子商务平台的商品推荐系统 | |
CN113591004A (zh) | 游戏标签生成方法、装置、存储介质及电子设备 | |
CN113052686A (zh) | 一种数据处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20240531 Address after: 510000, Room 05, Room 1701, No. 31 Tianshou Road, Tianhe District, Guangzhou City, Guangdong Province (for office use only) Patentee after: Guangzhou Think Tank Software Co.,Ltd. Country or region after: China Address before: 510000 room A202, No. 97, Gaopu Road, Tianhe District, Guangzhou, Guangdong Province Patentee before: Guangzhou Taotong Technology Co.,Ltd. Country or region before: China |