CN110795537B - 一种确定目标商品的改进策略的方法、装置、设备和介质 - Google Patents
一种确定目标商品的改进策略的方法、装置、设备和介质 Download PDFInfo
- Publication number
- CN110795537B CN110795537B CN201911044497.6A CN201911044497A CN110795537B CN 110795537 B CN110795537 B CN 110795537B CN 201911044497 A CN201911044497 A CN 201911044497A CN 110795537 B CN110795537 B CN 110795537B
- Authority
- CN
- China
- Prior art keywords
- fine
- matrix
- grained
- emotion
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000006872 improvement Effects 0.000 title claims abstract description 42
- 238000000034 method Methods 0.000 title claims abstract description 38
- 239000011159 matrix material Substances 0.000 claims abstract description 112
- 230000008451 emotion Effects 0.000 claims abstract description 100
- 238000011156 evaluation Methods 0.000 claims abstract description 82
- 238000001914 filtration Methods 0.000 claims description 48
- 230000006870 function Effects 0.000 claims description 17
- 230000015654 memory Effects 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 13
- 238000012216 screening Methods 0.000 claims description 12
- 230000009467 reduction Effects 0.000 claims description 11
- 230000008033 biological extinction Effects 0.000 claims description 6
- 238000004458 analytical method Methods 0.000 claims description 5
- 230000007787 long-term memory Effects 0.000 abstract description 6
- 230000006403 short-term memory Effects 0.000 abstract description 6
- 235000019580 granularity Nutrition 0.000 description 51
- 230000002996 emotional effect Effects 0.000 description 17
- 239000013598 vector Substances 0.000 description 14
- 230000011218 segmentation Effects 0.000 description 9
- 238000012549 training Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 230000007935 neutral effect Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000006855 networking Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Data Mining & Analysis (AREA)
- Finance (AREA)
- General Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Computing Systems (AREA)
- Game Theory and Decision Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Tourism & Hospitality (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种确定目标商品的改进策略的方法、装置、设备和介质,所述方法包括:将获取到的针对目标商品的评价文本转换为语句序列;将所述语句序列输入到长短期记忆网络层,得到所述待测文本的隐含层矩阵;所述隐含层矩阵用于表征所述待测文本中每个词与上下文之间的关联关系;将所述隐含层矩阵分别输入到每个细粒度独占单元,以得到每一个细粒度独占单元所输出的情感矩阵;将所述每一个细粒度独占单元所对应的情感矩阵同时输入至分类层,得到每一个细粒度对应的情感结果;根据每一个细粒度对应的情感结果确定所述目标商品的改进策略。
Description
技术领域
本申请涉及文本挖掘领域,尤其涉及一种确定目标商品的改进策略的方法、装置、设备和介质。
背景技术
在社会不断发展的过程中,越来越多的用户可以在各个网络社交平台中发表他们对产品、服务、价格等方面的观点或看法。而对于商家来说,对各个用户观点或者看法进行分析,可以不断的吸取经验,根据吸取的经验提升产品的质量、或者提高服务水平、或者提高产品的性价比等,不断对产品进行改进。
在分析用户观点或者看法的过程中,通过基本上是通过用户编辑评分来确定该用户所发表的观点或者看法的情感倾向。但是上述确定情感倾向的方法,并不准确,很可能会因用户的误操作导致评分不准确,使得情感倾向确定不准确,进而导致商家不能准确的对商品进行改进。
发明内容
有鉴于此,本申请的目的在于提供了一种确定目标商品的改进策略的方法、装置、设备和介质,以解决现有技术中如何提高对商品进行改进的准确度的问题。
第一方面,本申请实施例提供了一种确定目标商品的改进策略的方法,包括:
将获取到的针对目标商品的评价文本转换为语句序列;
将所述语句序列输入到长短期记忆网络层,得到所述待测文本的隐含层矩阵;所述隐含层矩阵用于表征所述待测文本中每个词与上下文之间的关联关系;
将所述隐含层矩阵分别输入到每个细粒度独占单元,以得到每一个细粒度独占单元所输出的情感矩阵;
将所述每一个细粒度独占单元所对应的情感矩阵同时输入至分类层,得到每一个细粒度对应的情感结果;
根据每一个细粒度对应的情感结果确定所述目标商品的改进策略。
可选的,所述将所述隐含层矩阵分别输入到每个细粒度独占单元,以得到每一个细粒度独占单元所输出的情感矩阵,包括:
针对每一个细粒度独占单元,增加所述隐含层矩阵中的每一个值的权重,以得到关联度矩阵;
针对每一个细粒度独占单元,对所述关联度矩阵进行降噪处理,以得到该细粒度独占单元所输出的情感矩阵。
可选的,所述针对每一个细粒度独占单元,对所述关联度矩阵进行降噪处理,以得到该细粒度独占单元所输出的情感矩阵,包括:
针对每一个细粒度独占单元,通过横向过滤窗口以第一预设步长值对关联度矩阵中的每一行进行过滤,以得到第一矩阵;其中,所述横向过滤窗口用于筛选出所述横向过滤窗口中的最大值;
针对每一个细粒度独占单元,通过纵向过滤窗口以第二预设步长值对第一矩阵中的每一个列进行过滤,以得到情感矩阵;其中,所述纵向过滤窗口用于筛选出所述纵向过滤窗口中的最大值。
可选的,所述根据每一个细粒度对应的情感结果确定所述目标商品的改进策略,包括:
针对每一个细粒度,计算消极值所对应的评价文本的数量与该细粒度所对应的评价文本的数量的比值;其中,所述消极值为所述情感结果中的一个值,所述消极值是表征对目标商品的消极评价;
针对每一个细粒度,如果计算得到的比值超过预设阈值,则对所述目标商品的该细粒度对应的功能进行改进。
第二方面,本是申请实施例提供了一种确定目标商品的改进策略的装置,包括:
获取模块,用于将获取到的针对目标商品的评价文本转换为语句序列;
第一输出模块,用于将所述语句序列输入到长短期记忆网络层,得到所述待测文本的隐含层矩阵;所述隐含层矩阵用于表征所述待测文本中每个词与上下文之间的关联关系;
第二输出模块,用于将所述隐含层矩阵分别输入到每个细粒度独占单元,以得到每一个细粒度独占单元所输出的情感矩阵;
第三输出模块,用于将所述每一个细粒度独占单元所对应的情感矩阵同时输入至分类层,得到每一个细粒度对应的情感结果;
分析模块,用于根据每一个细粒度对应的情感结果确定所述目标商品的改进策略。
可选的,所述第二输出模块,包括:第一输出单元和第二输出单元;
所述第一输出单元,用于针对每一个细粒度独占单元,增加所述隐含层矩阵中的每一个值的权重,以得到关联度矩阵;
所述第二输出单元,用于针对每一个细粒度独占单元,对所述关联度矩阵进行降噪处理,以得到该细粒度独占单元所输出的情感矩阵。
可选的,所述第二输出单元,在针对每一个细粒度独占单元,对所述关联度矩阵进行降噪处理,以得到该细粒度独占单元所输出的情感矩阵时,包括:
针对每一个细粒度独占单元,通过横向过滤窗口以第一预设步长值对关联度矩阵中的每一行进行过滤,以得到第一矩阵;其中,所述横向过滤窗口用于筛选出所述横向过滤窗口中的最大值;
针对每一个细粒度独占单元,通过纵向过滤窗口以第二预设步长值对第一矩阵中的每一个列进行过滤,以得到情感矩阵;其中,所述纵向过滤窗口用于筛选出所述纵向过滤窗口中的最大值。
可选的,所述分析模块,在根据每一个细粒度对应的情感结果确定所述目标商品的改进策略时,包括:
针对每一个细粒度,计算消极值所对应的评价文本的数量与该细粒度所对应的评价文本的数量的比值;其中,所述消极值为所述情感结果中的一个值,所述消极值是表征对目标商品的消极评价;
针对每一个细粒度,如果计算得到的比值超过预设阈值,则对所述目标商品的该细粒度对应的功能进行改进。
第三方面,本申请实施例提供了一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述方法的步骤。
本申请实施例提供的一种确定目标商品的改进策略的方法,首先,将获取到的针对目标商品的评价文本转换为语句序列;然后,将所述语句序列输入到长短期记忆网络层,得到所述待测文本的隐含层矩阵;所述隐含层矩阵用于表征所述待测文本中每个词与上下文之间的关联关系;再然后,将所述隐含层矩阵分别输入到每个细粒度独占单元,以得到每一个细粒度独占单元所输出的情感矩阵;再然后,将所述每一个细粒度独占单元所对应的情感矩阵同时输入至分类层,得到每一个细粒度对应的情感结果;最后,根据每一个细粒度对应的情感结果确定所述目标商品的改进策略。
在现有技术中,针对网络社交平台上用户所发表的评价文本,一般的分析方法是根据用户在编辑评价文本时,所填写的评分来确定该评价文本的情感倾向,以及根据用户所选择的标签来确定该评价文本的细粒度。但是,上述方法经常会出现由于用户疏忽导致该评价文本的细粒度不准确,以及情感倾向出现偏差的情况,导致商家不能准确的对商品进行改进。而本申请中,设置了多个细粒度独占单元,通过多个细粒度独占单元分别对同一个评价文本进行分析,以确定出该评价文本中体现出了那些细粒度,以及该评价文本所体现的每个细粒度所对应的情感倾向,根据确定出的每个细粒度对应的情感倾向,商家可以准确的确定出每个细粒度所对应的改进策略,提高了对商品改进的准确度。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种确定目标商品的改进策略的方法的流程示意图;
图2为本申请实施例提供的一种计算情感矩阵的方法的流程示意图;
图3为本申请实施例提供的一种确定目标商品的改进策略的装置的结构示意图;
图4为本申请实施例提供的一种计算机设备400的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
用户在购买完商品后,用户会在平台上编辑针对该商品的评价文本,以及编辑对该商品的评分,而后台系统会根据用户所编辑的评分对用户的评价文本进行分类,评分较高的评价文本被分为好评,评分较低的评价文本被分为差评等。进而,商家根据分类后的评价文本对商品进行改进。但是上述对评价文本进行分类的方法准确率较低,有时可能会因用户的误操作导致原本属于好评的评价文本被分为差评,或将原本属于差评的评价文本被分为好评,对评价文本的分类混乱,降低了商家对商品进行改进的准确度。
针对上述情况,本申请提供了一种确定目标商品的改进策略的方法,包括:
如图1所示,上述确定目标商品的改进策略的方法包括如下步骤:
S101,将获取到的针对目标商品的评价文本转换为语句序列;
S102,将所述语句序列输入到长短期记忆网络层,得到所述待测文本的隐含层矩阵;其中,所述隐含层矩阵用于表征所述待测文本中每个词与上下文之间的关联关系;
S103,将所述隐含层矩阵分别输入到每个细粒度独占单元,以得到每一个细粒度独占单元所输出的情感矩阵;
S104,将所述每一个细粒度独占单元所对应的情感矩阵同时输入至分类层,得到每一个细粒度对应的情感结果;
S105,根据每一个细粒度对应的情感结果确定所述目标商品的改进策略。
在上述步骤S101中,目标商品可以是用户所购买的商品,评价文本可以是用户对所购买的商品做出的评价,针对目标商品的评价文本可以是一个,也可以是多个(两个或两个以上),语句序列可以是由评价文本中每个词的词向量组成的。
其中,语句序列可以通过以下步骤实现:
将获取到的目标商品的评价文本通过正则表达式去除该待测语句中的特殊字符,其中,特殊字符可以包括表情符、数学符号等;
利用自定义词库、基本词库和分词算法对所述评价文本进行分词,得到分词结果;其中,基本词库可以是分词算法所携带的词库,基本词库存储有常用的词汇,基本词库可以包括百度词库、搜狗词库、英文词库等;自定义词库中存储有基本词库中不存在的新型词汇(如,打call、强行水逆、彩虹天等);
针对分词结果中的每一个分词,将该分词输入至词向量模型,得到该分词的词向量;其中,词向量模型可以是word2vec工具;
将分词结果中每一个分词的词向量进行堆叠,组成所述评价文本的语句序列。
本申请给出了由多个词向量组成语句序列的示例,如,每一个分词的词向量是1*200的矩阵,评价文本有5个词,则评价文本对应的语句序列为5*200的矩阵。
在上述步骤S102中,长短期记忆网络层可以是用于确定评价文本中每个词与评价文本的上下文之间的关联关系。
隐含层矩阵是长短期记忆网络层计算过程中的中间量。
在上述步骤S103中,针对每个细粒度独占单元,该细粒度独占单元包含有针对该细粒度对应的处理过程。
针对不同的细粒度独占单元,不同的细粒度独占单元中的处理过程中的计算参数是不同的。
在上述步骤S104中,情感结果中可以包括每个情感倾向对应的概率值。情感结果可以包括消极值、积极值和中性值等,消极值可以表征对目标商品的消极评价,积极值可以表征对目标商品的积极评价,中性值可以表征对目标商品的中性评价。情感倾向可以包括积极值所对应的积极情绪、中性值所对应的中性情绪、消极值所对应的消极情绪等。分类层包含有全连接层和softmax函数。
具体的,将每一个独占单元所输出的情感矩阵同时输入到分类层,通过分类层中的全连接层将每一个情感矩阵映射成向量,该向量包含元素个数是情感结果中所包含的情感倾向的个数,然后将该向量输入至softmax函数,计算出每个细粒度的情感倾向所对应的概率,根据每个细粒度的情感倾向所对应的概率确定每个细粒度对应的情感结果。
本申请提供了情感结果的示例,如,目标商品为汽车,细粒度为售后服务态度和汽车外观,情感倾向包括好评、中评和差评,其中,好评为A、中评为B、差评为C。将每个独占单元输出的结果输入至分类层后,分类层中的全连接层将售后服务态度和汽车外观分别对应的情感矩阵转换为两个行向量,将两个行向量输入至softmax函数,得到售后服务态度对应的行向量[0.8,0.12,0.08]和汽车外观对应的行向量[0.12,0.82,0.06],则即细粒度为售后服务态度的好评的概率值为0.8、中评的概率值为0.12、差评的概率值为0.08,细粒度为汽车外观的好评的概率值为0.12、中评的概率值为0.82、差评的概率值为0.06。根据售后服务态度的每个情感倾向对应的概率值,确定出售后服务态度的情感结果为A(好评),根据汽车外观的每个情感倾向的概率值,确定出汽车外观的情感结果为B(中评)。
在上述步骤S105中,改进策略可以为删除商品中给用户带来麻烦的功能,或者优化商品中存在故障的功能。
具体的,在得到评价文本针对一个细粒度对应的情感结果后,根据情感结果中的概率值确定该评价文本针对该细粒度的情感倾向,根据确定出的情感倾向生成对目标商品的改进策略。当情感倾向是消极情绪的话,针对该细粒度生成改进策略,比如,在目标商品中删除该细粒度对应的功能,或者在确定出该细粒度对应的功能存在故障后消除该细粒度对应的功能存在的故障。
在本申请实施例中,上述步骤S101-S102共同组成了情感结果模型,在情感结果模型中,设置了多个细粒度独占单元,每个细粒度独占单元之间的互不影响的,在将目标商品的评价文本输入至情感结果模型后,情感结果输出的是各个细粒度分别对应的情感结果。通过情感结果模型可以对用户对目标商品的评价文本做出全面的分析,一次性的得到目标商品的评价文本中所涉及的各个细粒度对应的情感结果,根据各个细粒度对应的情感结果,得到对目标商品的更加全面的改进策略,提高了对目标商品改进的效率。
本申请中所提到的情感结果模型用于确定出评价文本中所提高的细粒度所对应的情感结果,该情感结果在应用之前是需要进行训练的,实现情感结果模型的构建包括如下步骤:
通过爬虫算法在网络平台中获取训练样本集;其中,训练样本集中包括至少一个训练样本;
针对每一个训练样本,将该训练样本作为待训练的情感结果模型的输入,将该训练样本每个细粒度对应的真实情感结果作为待训练的情感结果模型的输出,对待训练的情感结果模型进行训练。
具体的,在上述待训练的情感结果模型的训练过程中,通过待训练的情感结果模型计算训练样本对应的实际输出结果,根据实际输出结果与真实情感结果之间的损失,反向调整待训练的情感结果模型中的参数。
本申请所提供的实施例中,为了提高对目标商品的评价文本进行分析的准确度,将目标商品所涉及的细粒度都设置了对应的独占单元,以使目标商品的评价文本会被每个细粒度独占单元进行计算一次。在每一个细粒度独占单元对目标商品的评价文本的计算过程,步骤S103,包括:
步骤1031,针对每一个细粒度独占单元,增加所述隐含层矩阵中的每一个值的权重,以得到关联度矩阵;
步骤1032,针对每一个细粒度独占单元,对所述关联度矩阵进行降噪处理,以得到该细粒度独占单元所输出的情感矩阵。
在上述步骤1031中,在隐含层矩阵中,一个值表征的是该值随对应的分词与上下文之间的关联度。在对隐含层中的每一个值增加权重后,可以将与细粒度相关性较大的词对应的关联度进行增强,将与细粒度相关性较小的词对应的关联度进行弱化,得到与细粒度关联性较强的关联度矩阵。
在上述步骤1032中,降噪处理可以指去除关联度矩阵中与细粒度关联性较弱的值。
为了详细的了解对关联度矩阵的降噪处理,如图2所示,本是申请实施例提供了一种计算情感矩阵的方法,步骤1032,包括:
S201,针对每一个细粒度独占单元,通过横向过滤窗口以第一预设步长值对关联度矩阵中的每一行进行过滤,以得到第一矩阵;其中,所述横向过滤窗口用于筛选出所述横向过滤窗口中的最大值;
S202,针对每一个细粒度独占单元,通过纵向过滤窗口以第二预设步长值对第一矩阵中的每一个列进行过滤,以得到情感矩阵;其中,所述纵向过滤窗口用于筛选出所述纵向过滤窗口中的最大值。
通过上述步骤S201和S202计算得到的情感矩阵可以消除关联度矩阵中与细粒度关联性较小的值,保留了与细粒度关联性较大的值,突出了目标商品的评价文本与细粒度之间特征。同时,情感矩阵与关联度矩阵相比,降低了维度,提高了后续的计算效率。
在网络社交平台中,针对目标商品会有多个评价文本,在对每个评价文本计算出情感结果后,通过大数据的统计,来确定目标上篇的改进策略。也就是,步骤S105,包括:
步骤1051,针对每一个细粒度,计算消极值所对应的评价文本的数量与该细粒度所对应的评价文本的数量的比值;其中,所述消极值为所述情感结果中的一个值,所述消极值是表征对目标商品的消极评价;
步骤1052,针对每一个细粒度,如果计算得到的比值超过预设阈值,则对所述目标商品的该细粒度对应的功能进行改进。
在上述步骤1051中,具体的,针对一个细粒度,消极值所对应的评价文本的数量与该细粒度所对应的评价文本的数量的比值可以表征使用目标商品的用户对目标商品的恶感概率。
在上述步骤1052中,针对一个细粒度,预设阈值可以是预先设置好的。在计算得到消极值所对应的评价文本的数量与该细粒度所对应的评价文本的数量的比值查过预设阈值,说明目标商品的该细粒度对应的功能被大多数用户所厌弃,为了改善用户对该目标商品的该细粒度对应的功能的太度,需要对目标商品的该细粒度所对应的功能进行改善或者优化。
如图3所示,本申请实施例还提供了一种确定目标商品的改进策略的装置,包括:
获取模块301,用于将获取到的针对目标商品的评价文本转换为语句序列;
第一输出模块302,用于将所述语句序列输入到长短期记忆网络层,得到所述待测文本的隐含层矩阵;所述隐含层矩阵用于表征所述待测文本中每个词与上下文之间的关联关系;
第二输出模块303,用于将所述隐含层矩阵分别输入到每个细粒度独占单元,以得到每一个细粒度独占单元所输出的情感矩阵;
第三输出模块304,用于将所述每一个细粒度独占单元所对应的情感矩阵同时输入至分类层,得到每一个细粒度对应的情感结果;
分析模块305,用于根据每一个细粒度对应的情感结果确定所述目标商品的改进策略。
可选的,所述第二输出模块303,包括:第一输出单元和第二输出单元;
所述第一输出单元,用于针对每一个细粒度独占单元,增加所述隐含层矩阵中的每一个值的权重,以得到关联度矩阵;
所述第二输出单元,用于针对每一个细粒度独占单元,对所述关联度矩阵进行降噪处理,以得到该细粒度独占单元所输出的情感矩阵。
可选的,所述第二输出单元,在针对每一个细粒度独占单元,对所述关联度矩阵进行降噪处理,以得到该细粒度独占单元所输出的情感矩阵时,包括:
针对每一个细粒度独占单元,通过横向过滤窗口以第一预设步长值对关联度矩阵中的每一行进行过滤,以得到第一矩阵;其中,所述横向过滤窗口用于筛选出所述横向过滤窗口中的最大值;
针对每一个细粒度独占单元,通过纵向过滤窗口以第二预设步长值对第一矩阵中的每一个列进行过滤,以得到情感矩阵;其中,所述纵向过滤窗口用于筛选出所述纵向过滤窗口中的最大值。
可选的,所述分析模块305,在根据每一个细粒度对应的情感结果确定所述目标商品的改进策略时,包括:
针对每一个细粒度,计算消极值所对应的评价文本的数量与该细粒度所对应的评价文本的数量的比值;其中,所述消极值为所述情感结果中的一个值,所述消极值是表征对目标商品的消极评价;
针对每一个细粒度,如果计算得到的比值超过预设阈值,则对所述目标商品的该细粒度方向进行改进。
对应于图1中的确定目标商品的改进策略的方法,本申请实施例还提供了一种计算机设备400,如图4所示,该设备包括存储器401、处理器402及存储在该存储器401上并可在该处理器402上运行的计算机程序,其中,上述处理器402执行上述计算机程序时实现上述确定目标商品的改进策略的方法的步骤。
具体地,上述存储器401和处理器402能够为通用的存储器和处理器,这里不做具体限定,当处理器402运行存储器401存储的计算机程序时,能够执行上述确定目标商品的改进策略的方法,用于解决现有技术中如何提高对商品进行改进的准确度问题,在构建实体识别模型的过程中,通过设置了多个细粒度独占单元,通过多个细粒度独占单元分别对一个评价文本进行分析,以确定出该评价文本中体现出了那些细粒度,以及该评价文本的细粒度所对应的情感倾向,根据根据确定出的每个细粒度对应的情感倾向,商家可以准确的确定出每个细粒度所对应的改进策略,提高了对商品改进的准确度。
对应于图1中的确定目标商品的改进策略的方法,本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述确定目标商品的改进策略的方法的步骤。
具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该存储介质上的计算机程序被运行时,能够执行上述确定目标商品的改进策略的方法,用于解决现有技术中如何提高对商品进行改进的准确度的问题,在构建实体识别模型的过程中,通过设置了多个细粒度独占单元,通过多个细粒度独占单元分别对一个评价文本进行分析,以确定出该评价文本中体现出了那些细粒度,以及该评价文本的细粒度所对应的情感倾向,根据根据确定出的每个细粒度对应的情感倾向,商家可以准确的确定出每个细粒度所对应的改进策略,提高了对商品改进的准确度。
在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请提供的实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释,此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围。都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。
Claims (8)
1.一种确定目标商品的改进策略的方法,其特征在于,包括:
将获取到的针对目标商品的评价文本转换为语句序列;
将所述语句序列输入到长短期记忆网络层,得到所述评价文本的隐含层矩阵;所述隐含层矩阵用于表征所述评价文本中每个词与上下文之间的关联关系;
将所述隐含层矩阵分别输入到每个细粒度独占单元,针对每一个细粒度独占单元,增加所述隐含层矩阵中的每一个值的权重,以得到关联度矩阵;
针对每一个细粒度独占单元,对所述关联度矩阵进行降噪处理,以得到该细粒度独占单元所输出的情感矩阵;
将所述每一个细粒度独占单元所对应的情感矩阵同时输入至分类层,得到每一个细粒度对应的情感结果;
根据每一个细粒度对应的情感结果确定所述目标商品的改进策略。
2.如权利要求1所述的方法,其特征在于,所述针对每一个细粒度独占单元,对所述关联度矩阵进行降噪处理,以得到该细粒度独占单元所输出的情感矩阵,包括:
针对每一个细粒度独占单元,通过横向过滤窗口以第一预设步长值对关联度矩阵中的每一行进行过滤,以得到第一矩阵;其中,所述横向过滤窗口用于筛选出所述横向过滤窗口中的最大值;
针对每一个细粒度独占单元,通过纵向过滤窗口以第二预设步长值对第一矩阵中的每一个列进行过滤,以得到情感矩阵;其中,所述纵向过滤窗口用于筛选出所述纵向过滤窗口中的最大值。
3.如权利要求1所述的方法,其特征在于,所述根据每一个细粒度对应的情感结果确定所述目标商品的改进策略,包括:
针对每一个细粒度,计算消极值所对应的评价文本的数量与该细粒度所对应的评价文本的数量的比值;其中,所述消极值为所述情感结果中的一个值,所述消极值是表征对目标商品的消极评价;
针对每一个细粒度,如果计算得到的比值超过预设阈值,则对所述目标商品的该细粒度对应的功能进行改进。
4.一种确定目标商品的改进策略的装置,其特征在于,包括:
获取模块,用于将获取到的针对目标商品的评价文本转换为语句序列;
第一输出模块,用于将所述语句序列输入到长短期记忆网络层,得到所述评价文本的隐含层矩阵;所述隐含层矩阵用于表征所述评价文本中每个词与上下文之间的关联关系;
第二输出模块,用于将所述隐含层矩阵分别输入到每个细粒度独占单元,针对每一个细粒度独占单元,增加所述隐含层矩阵中的每一个值的权重,以得到关联度矩阵,针对每一个细粒度独占单元,对所述关联度矩阵进行降噪处理,以得到该细粒度独占单元所输出的情感矩阵;
第三输出模块,用于将所述每一个细粒度独占单元所对应的情感矩阵同时输入至分类层,得到每一个细粒度对应的情感结果;
分析模块,用于根据每一个细粒度对应的情感结果确定所述目标商品的改进策略。
5.如权利要求4所述的装置,其特征在于,所述第二输出模块,在针对每一个细粒度独占单元,对所述关联度矩阵进行降噪处理,以得到该细粒度独占单元所输出的情感矩阵时,包括:
针对每一个细粒度独占单元,通过横向过滤窗口以第一预设步长值对关联度矩阵中的每一行进行过滤,以得到第一矩阵;其中,所述横向过滤窗口用于筛选出所述横向过滤窗口中的最大值;
针对每一个细粒度独占单元,通过纵向过滤窗口以第二预设步长值对第一矩阵中的每一个列进行过滤,以得到情感矩阵;其中,所述纵向过滤窗口用于筛选出所述纵向过滤窗口中的最大值。
6.如权利要求4所述的装置,其特征在于,所述分析模块,在根据每一个细粒度对应的情感结果确定所述目标商品的改进策略时,包括:
针对每一个细粒度,计算消极值所对应的评价文本的数量与该细粒度所对应的评价文本的数量的比值;其中,所述消极值为所述情感结果中的一个值,所述消极值是表征对目标商品的消极评价;
针对每一个细粒度,如果计算得到的比值超过预设阈值,则对所述目标商品的该细粒度对应的功能进行改进。
7.一种计算机设备,包括存储器、处理器及存储在所述存储器上并在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1-3中任一项所述的方法的步骤。
8.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器运行时执行上述权利要求1-3中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911044497.6A CN110795537B (zh) | 2019-10-30 | 2019-10-30 | 一种确定目标商品的改进策略的方法、装置、设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911044497.6A CN110795537B (zh) | 2019-10-30 | 2019-10-30 | 一种确定目标商品的改进策略的方法、装置、设备和介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110795537A CN110795537A (zh) | 2020-02-14 |
CN110795537B true CN110795537B (zh) | 2022-10-25 |
Family
ID=69442255
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911044497.6A Active CN110795537B (zh) | 2019-10-30 | 2019-10-30 | 一种确定目标商品的改进策略的方法、装置、设备和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110795537B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111339295A (zh) * | 2020-02-19 | 2020-06-26 | 北京字节跳动网络技术有限公司 | 用于展示信息的方法、装置、电子设备和计算机可读介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108446813A (zh) * | 2017-12-19 | 2018-08-24 | 清华大学 | 一种电商服务质量综合评价的方法 |
CN110096587A (zh) * | 2019-01-11 | 2019-08-06 | 杭州电子科技大学 | 基于注意力机制的lstm-cnn词嵌入的细粒度情感分类模型 |
CN110110323A (zh) * | 2019-04-10 | 2019-08-09 | 北京明略软件系统有限公司 | 一种文本情感分类方法和装置、计算机可读存储介质 |
CN110321563A (zh) * | 2019-06-28 | 2019-10-11 | 浙江大学 | 基于混合监督模型的文本情感分析方法 |
-
2019
- 2019-10-30 CN CN201911044497.6A patent/CN110795537B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108446813A (zh) * | 2017-12-19 | 2018-08-24 | 清华大学 | 一种电商服务质量综合评价的方法 |
CN110096587A (zh) * | 2019-01-11 | 2019-08-06 | 杭州电子科技大学 | 基于注意力机制的lstm-cnn词嵌入的细粒度情感分类模型 |
CN110110323A (zh) * | 2019-04-10 | 2019-08-09 | 北京明略软件系统有限公司 | 一种文本情感分类方法和装置、计算机可读存储介质 |
CN110321563A (zh) * | 2019-06-28 | 2019-10-11 | 浙江大学 | 基于混合监督模型的文本情感分析方法 |
Non-Patent Citations (3)
Title |
---|
A Comparison of Word-Embeddings in Emotion Detection from Text using BiLSTM, CNN and Self-Attention;Marco Polignano等;《ACM》;20190606;第63-68页 * |
基于深层注意力的LSTM的特定主题情感分析;胡朝举等;《计算机应用研究》;20190430;第36卷(第04期);第1075-1079页 * |
基于深度学习的情感分类与评价对象判别;陈楠;《中国优秀博硕士学位论文全文数据库(硕士) 信息科技辑》;20190815;第I138-1275页 * |
Also Published As
Publication number | Publication date |
---|---|
CN110795537A (zh) | 2020-02-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107025596B (zh) | 一种风险评估方法和系统 | |
CN107391493B (zh) | 一种舆情信息提取方法、装置、终端设备及存储介质 | |
CN111753082A (zh) | 基于评论数据的文本分类方法及装置、设备和介质 | |
CN110913354A (zh) | 短信分类方法、装置及电子设备 | |
CN111666757A (zh) | 商品评论情感倾向分析方法、装置、设备和可读存储介质 | |
CN110909540B (zh) | 短信垃圾新词识别方法、装置及电子设备 | |
CN111179051A (zh) | 金融目标客户确定方法、装置及电子设备 | |
CN110659926A (zh) | 一种数据价值评估系统以及方法 | |
Kasztelnik et al. | Data analytics and social media as the innovative business decision model with natural language processing | |
CN113535813A (zh) | 一种数据挖掘方法、装置、电子设备以及存储介质 | |
CN113806660B (zh) | 数据评估方法、训练方法、装置、电子设备以及存储介质 | |
CN111488456A (zh) | 一种商家用户评价分析方法及系统 | |
CN111209480A (zh) | 一种推送文本的确定方法、装置、计算机设备和介质 | |
CN110795537B (zh) | 一种确定目标商品的改进策略的方法、装置、设备和介质 | |
CN112434862B (zh) | 上市企业财务困境预测方法及装置 | |
CN114969498A (zh) | 一种行业龙头信息的推荐方法及装置 | |
CN112651493A (zh) | 基于联合训练模型的事故车判别方法和装置 | |
CN115018613A (zh) | 报告分析方法、装置、设备、存储介质及产品 | |
CN115080741A (zh) | 一种问卷调查分析方法、装置、存储介质及设备 | |
CN114493250A (zh) | 一种异常行为检测方法、计算设备及可读存储介质 | |
CN113722487A (zh) | 用户情感分析方法、装置、设备及存储介质 | |
CN113850523A (zh) | 基于数据补全的esg指数确定方法及相关产品 | |
CN113157993A (zh) | 一种基于时序图极化分析的网络水军行为预警模型 | |
CN112417858A (zh) | 一种实体权重评分方法、系统、电子设备及存储介质 | |
CN110929123A (zh) | 一种电商产品竞争分析方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |