CN109902180A - 一种电商评论多类目多客户快速定制化模型的方法和装置 - Google Patents
一种电商评论多类目多客户快速定制化模型的方法和装置 Download PDFInfo
- Publication number
- CN109902180A CN109902180A CN201910161179.1A CN201910161179A CN109902180A CN 109902180 A CN109902180 A CN 109902180A CN 201910161179 A CN201910161179 A CN 201910161179A CN 109902180 A CN109902180 A CN 109902180A
- Authority
- CN
- China
- Prior art keywords
- label
- client
- multiclass
- electric business
- mesh
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000012549 training Methods 0.000 claims abstract description 20
- 238000003062 neural network model Methods 0.000 claims abstract description 8
- 238000002372 labelling Methods 0.000 claims abstract description 7
- 238000006243 chemical reaction Methods 0.000 claims description 6
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 3
- 230000002776 aggregation Effects 0.000 claims description 3
- 238000004220 aggregation Methods 0.000 claims description 3
- 238000013527 convolutional neural network Methods 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 238000004321 preservation Methods 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims description 3
- 230000008901 benefit Effects 0.000 abstract description 3
- 238000012545 processing Methods 0.000 abstract description 3
- 239000000047 product Substances 0.000 description 7
- 238000011156 evaluation Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 210000003608 fece Anatomy 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- 108091068161 06 family Proteins 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 238000005194 fractionation Methods 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种电商评论多类目多客户快速定制化模型的方法和装置,所述的电商评论多类目多客户快速定制化模型方法和装置包括以下主要步骤:第一:最低粒度标签的构建,第二:深度神经网络模型训练模块的构建,第三:深度神经网络模型标注模块的构建。其优点表现在:本发明为商家定制模型时中遇到的问题,按照本发明的方法处理,满足了商家对自有品牌定制化的需求,高效的解决了快速训练,标注,标签命名不同等问题。
Description
技术领域
本发明涉及自然语言处理技术领域,具体地说,是一种电商评论多类目多客户快速定制化模型的方法和装置。
背景技术
近年来,随着信息技术以及互联网的蓬勃发展,我国网购市场发展迅猛,越来越多的人通过电商网站来了解产品信息、购买商品并通过评价表达自己购买商品过程的感受、对购买商品的满意程度和对所购商品的建议和要求等。一方面,消费者在网购时无法直接接触实际商品,只能根据电商平台提供的文字、图片等描述性信息以及历史消费者发表的评论文本了解商品、商家、品牌的基本特征。另一方面,用户产生的商品评论对于消费者购买商品改进商品都有着很重要的参考价值,但是商家、品牌方也无法直接接触消费者,只能根据历史消费者发表评论文本分析消费者的喜好,对产品设计、销售策略进行调整。然而,随着时间及历史的推移,电商平台积聚的评论文本信息不断膨胀,碎片化、海量化特征日趋明显,采用人工的方式对电商评论文本进行情感分析需要消耗大量的人力、物力,而现有的评论总结技术大多是基于评论中高频词语的聚类和相应评论的情感词标注,来生成重要的总结性词语或者短语,借以概括大家对某个商品的观点、反映某商品的特性,从而为消费者购买和商家改进产品提供参考。因此大多现有的评论总结技术还停留在短语级别,对于消费者和商家的参考价值有限,现有的电商平台对产品的评论的挖掘利用尚不充分。
通过关键词,否定词和程度副词,领域词典来构建模型,并通过词性,语法成分分词后生成特征向量,通过模型训练得到观点结果。该方案遇到的问题是每个商家拥有自己独特的评论数据,例如斯凯奇用户有形容产品“踩屎感”的标签,在其他鞋类不具有这类特性,那么在斯凯奇品牌就需要加入该标签。运动类对于有型属于外观漂亮,而服饰类有型属于设计好。现有的解决方案只能解决通用问题,不能服务于商家独特的标签以及不同类目分类定义。
中国专利文献:CN108256968A,公开日:2018.07.06,公开了一种电商平台商品专家评论生成方法,提出一种基于序列到序列生成模型的专家评论总结生成技术,提取某商品所有用户评论中的重要信息,生成一段总结性的话语来描述商品的特性。消费者可以根据生成的专家评论来了解商品的优缺点,考虑是否购买;商家可根据生成的专家评论来改进自己的商品。
中国专利文献:CN109101478A,公开日:2018.12.28,公开了一种面向电商评论文本的Aspect级情感分析方法。首先,对电商评论文本进行预处理,并按照其所属的商品、商家、品牌进行分批;接着,在一批电商评论文本内部,综合考虑词性、句法及共现性特征,对候选评价对象的重要性进行排序,抽取电商评论文本中的评价对象;然后,利用动态滑动窗口机制将词项间共现限定在评论段级,并基于LDA模型对这一批电商评论文本中的评价对象进行聚类,得到评论Aspect-评价对象间对应关系;最后,基于构建的情感词典、否定词典,对电商评论文本进行情感分析。
但是关于本发明一种电商评论多类目多客户快速定制化模型的方法和装置目前还未见报道。
发明内容
本发明的目的是在于帮助商家定制化和快速建模。商家希望通过客户反馈来有针对性的的迭代产品,然而现有解决方案都是一个问题一个解决方案,开发周期较长,不能快速有效的解决用户少量的定制化需求,本发明要解决的课题就是快速帮助不同用户建模,例如:运动类目定义为外观漂亮,服饰类目对其中一部分定义为设计好,另一部分依旧是外观漂亮;A客户认为脱胶需要单独标签,B客户认为统一放到做工粗糙;A客户关注“踩屎感”标签,B客户根本没有关注该标签;这些不同的客户不同的要求,本发明可以满足各个客户不同的要求。
为实现上述目的,本发明采取的技术方案是:
所述的电商评论多类目多客户快速定制化模型方法和装置包括以下主要步骤:
第一:最低粒度标签的构建:
S11.根据实际情况将训练集拆分成最低粒度标签,任意类目店铺需要的标签都可由最低粒度的标签组合而成,若不能组合,说明非最低粒度,需要继续拆分;
S12.根据新类目的引入会提出新的需求,导致原先最低粒度的标签不再是最低粒度,需按照11的方式拆分成最低粒度,例:AB是配送快,当前最低粒度;新用户提出发货快和送货快的概念,则需要将原AB分拆成A发货快,B送货快;A和B就是新的最低粒度,AB不是;
第二:深度神经网络模型训练模块的构建:
S21.将S12的数据使用卷积神经网络进行训练,使用训练好的词向量,将分词结果转换为词向量;
S22.将转换后的词向量,使用2,3,4,5四种过滤器,分别做卷积与最大池化;
S23.定义损失函数,做全连接层进行sigmoid回归输出多分类概率;
S24.使用Adam优化算法训练,保存模型;
第三:深度神经网络模型标注模块的构建:
S31.将评论数据分句,每个子句做为输入文本;
S32.读取训练模型,将子句文本转化为标签分类概率,取大于0.5概率的标签;
S33.将子句组合成原句,并保存子句标签;
第四:标签聚合模块的构建:
S41.根据类目按图2所示构建pool表,通过最低粒度汇聚成标签。通过flag表示哪些是类目通用标签,包含所有店铺的,flag为N表示辅助标签不显示;
S42.构建change_name表,根据不同店铺需要设定转换需要改名的标签;
S43.构建label_hide表,根据不同店铺,隐藏非本店关注的类目通用标签。
所述步骤S12中,根据新增的定制化标签,检测是否含有当前最低粒度不可汇聚而成的标签,有则需要将原有粒度拆分至最低粒度至可汇聚成新标签。
所述步骤S41中,设计了一个方法,按每个类目设定具体的标签汇总方案,并显示通用标签模型,隐藏辅助标签。
所述步骤S42中,设计了一个方法,通过change_name表找到哪些客户需要对通用标签改名成符合自己的名字。
所述步骤S43中,设计了一个方法,通过label_hide表找到哪些标签对客户隐藏。
本发明优点在于:
1、本发明为商家定制模型时中遇到的问题,按照本发明的方法处理,满足了商家对自有品牌定制化的需求,高效的解决了快速训练,标注,标签命名不同等问题。
2、一次模型训练,适用多个定制化模型,而不是建立多个训练模型,简化了训练过程,不同类目使用不同的类目标签,更贴合类目现状,能给消费者一个方向的保证,也能给消费商家减少更多的商品纠纷。
3、解决了不同客户提出不同的命名方式,无需让客户强制接受当前命名,使客户想要的名字更加多元化,使客户和商家更容易接受的命名。
4、店铺有自己独有的标签,其他店铺隐藏不可见,反映出商品的本质特性,对于深入了解商品的特性有着重要意义,节省了大量开支,从而减低了商品的成本。
5、层次性好,逻辑性强,符合传统应用的习惯,使消费者更容易接受,又便于计算机处理,使用过范围最为广泛。
附图说明
附图1是一种电商评论多类目多客户快速定制化模型方法和装置的整体流程图。
附图2是一种电商评论多类目多客户快速定制化模型方法和装置的pool表。
具体实施方式
下面结合附图对本发明提供的具体实施方式作详细说明。
附图中涉及的附图标记和组成部分如下所示:
实施例1
请参照附图1、2,附图1是一种电商评论多类目多客户快速定制化模型方法和装置的整体流程图,附图2是一种电商评论多类目多客户快速定制化模型方法和装置的pool表。本发明提供的一种电商评论多类目多客户快速定制化模型方法的实现,包括以下主要步骤:
第一:最低粒度标签的构建:
S11.根据实际情况将训练集拆分成最低粒度标签,任意类目店铺需要的标签都可由最低粒度的标签组合而成,若不能组合,说明非最低粒度,需要继续拆分;
S12、根据新类目的引入会提出新的需求,导致原先最低粒度的标签不再是最低粒度,需按照S11的方式拆分成最低粒度,例:AB是配送快,当前最低粒度。新用户提出发货快和送货快的概念,则需要将原AB分拆成A发货快,B送货快。A和B就是新的最低粒度,AB不是;
第二:深度神经网络模型训练模块的构建:
S21、将S12的数据使用卷积神经网络进行训练,使用训练好的词向量,将分词结果转换为词向量;
S22、将转换后的词向量,使用2,3,4,5四种过滤器,分别做卷积与最大池化;
S23、定义损失函数,做全连接层进行sigmoid回归输出多分类概率;
S24、使用Adam优化算法训练,保存模型;
第三:深度神经网络模型标注模块的构建:
S31、将评论数据分句,每个子句做为输入文本;
S32、读取训练模型,将子句文本转化为标签分类概率,取大于0.5概率的标签;
S33、将子句组合成原句,并保存子句标签;
第四:标签聚合模块的构建:
S41、根据类目按图2所示构建pool表,通过最低粒度汇聚成标签;通过flag表示哪些是类目通用标,包含所有店铺的,flag为N表示辅助标签不显示;
S42、构建change_name表,根据不同店铺需要设定转换需要改名的标签;
S43、构建label_hide表,根据不同店铺,隐藏非本店关注的类目通用标签。
需要说明的是:所述步骤S12中,根据新增的定制化标签,检测是否含有当前最低粒度不可汇聚而成的标签,有则需要将原有粒度拆分至最低粒度至可汇聚成新标签,这样可以使商品更容易客户寻找,更加让客户理解了解商品的品质特性;所述步骤S41中,设计了一个方法,按每个类目设定具体的标签汇总方案,并显示通用标签模型,隐藏辅助标签,店铺有自己独有的标签,其他店铺隐藏不可见;所述步骤42中,设计了一个方法,通过change_name表找到哪些客户需要对通用标签改名成符合自己的名字,满足了商家对自有品牌定制化的需求,高效的解决了快速训练,标注,标签命名不同等问题;所述步骤S43中,设计了一个方法,通过label_hide表找到哪些标签对客户隐藏,解决了不同客户提出不同的命名方式,无需让客户强制接受当前命名,使客户想要的名字更加多元化,使客户和商家更容易接受的命名。
实施例2
请参照附图1、2,附图1是一种电商评论多类目多客户快速定制化模型方法和装置的整体流程图,附图2是一种电商评论多类目多客户快速定制化模型方法和装置的pool表。本发明实现电商评论多类目多客户快速定制化模型的主体流程如下:
1.训练集做到足够细,不同类目对同一标签有拆分,以最低粒度的标签为准。
2.建立pool表,用于存放最低粒度在每个类目对应mapping的名称,可2个最低粒度行组合成类目粒度标签;flag用来表示该标签在该类目是否显示。
3.建立change_name表,用户存放店铺对应标签修正的名字。
4.建立label_hide表里,针对特定标签,商家及flag字段用与表示是否对商家隐藏。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员,在不脱离本发明方法的前提下,还可以做出若干改进和补充,这些改进和补充也应视为本发明的保护范围。
Claims (5)
1.一种电商评论多类目多客户快速定制化模型的方法和装置,其特征在于,所述的一种电商评论多类目多客户快速定制化模型方法和装置包括以下主要步骤:
第一:最低粒度标签的构建:
S11.根据实际情况将训练集拆分成最低粒度标签,任意类目店铺需要的标签都可由最低粒度的标签组合而成,若不能组合,说明非最低粒度,需要继续拆分;
S12.根据新类目的引入会提出新的需求,导致原先最低粒度的标签不再是最低粒度,需按照S11的方式拆分成最低粒度,例:AB是配送快,当前最低粒度;新用户提出发货快和送货快的概念,则需要将原AB分拆成A发货快,B送货快;A和B就是新的最低粒度,AB不是;
第二:深度神经网络模型训练模块的构建:
S21.将S12的数据使用卷积神经网络进行训练,使用训练好的词向量,将分词结果转换为词向量;
S22.将转换后的词向量,使用2,3,4,5四种过滤器,分别做卷积与最大池化;
S23.定义损失函数,做全连接层进行sigmoid回归输出多分类概率;
S24.使用Adam优化算法训练,保存模型;
第三:深度神经网络模型标注模块的构建:
S31.将评论数据分句,每个子句做为输入文本;
S32.读取训练模型,将子句文本转化为标签分类概率,取大于0.5概率的标签;
S33.将子句组合成原句,并保存子句标签;
第四:标签聚合模块的构建:
S41.根据类目按图2所示构建pool表,通过最低粒度汇聚成标签。通过flag表示哪些是类目通用标签,包含所有店铺的,flag为N表示辅助标签不显示;
S42.构建change_name表,根据不同店铺需要设定转换需要改名的标签;
S43.构建label_hide表,根据不同店铺,隐藏非本店关注的类目通用标签。
2.根据权利要求1所述的电商评论多类目多客户快速定制化模型方法,其特征在于,所述步骤S12中,根据新增的定制化标签,检测是否含有当前最低粒度不可汇聚而成的标签,有则需要将原有粒度拆分至最低粒度至可汇聚成新标签。
3.根据权利要求1所述的电商评论多类目多客户快速定制化模型方法,其特征在于,所述步骤S41中,设计了一个方法,按每个类目设定具体的标签汇总方案,并显示通用标签模型,隐藏辅助标签。
4.根据权利要求1所述的电商评论多类目多客户快速定制化模型方法,其特征在于,所述步骤S42中,设计了一个方法,通过change_name表找到哪些客户需要对通用标签改名成符合自己的名字。
5.根据权利要求1所述的电商评论多类目多客户快速定制化模型方法,其特征在于,所述步骤S43中,设计了一个方法;通过label_hide表找到哪些标签对客户隐藏。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910161179.1A CN109902180A (zh) | 2019-03-04 | 2019-03-04 | 一种电商评论多类目多客户快速定制化模型的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910161179.1A CN109902180A (zh) | 2019-03-04 | 2019-03-04 | 一种电商评论多类目多客户快速定制化模型的方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109902180A true CN109902180A (zh) | 2019-06-18 |
Family
ID=66946285
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910161179.1A Pending CN109902180A (zh) | 2019-03-04 | 2019-03-04 | 一种电商评论多类目多客户快速定制化模型的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109902180A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111488457A (zh) * | 2020-04-13 | 2020-08-04 | 上海枫河软件科技有限公司 | 一种电商评论标签分类方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105469291A (zh) * | 2014-09-04 | 2016-04-06 | 口碑控股有限公司 | 用户信息提供方法及装置 |
CN107302726A (zh) * | 2017-06-30 | 2017-10-27 | 环球智达科技(北京)有限公司 | 节目信息的标签生成方法 |
CN109255027A (zh) * | 2018-08-27 | 2019-01-22 | 上海宝尊电子商务有限公司 | 一种电商评论情感分析降噪的方法和装置 |
-
2019
- 2019-03-04 CN CN201910161179.1A patent/CN109902180A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105469291A (zh) * | 2014-09-04 | 2016-04-06 | 口碑控股有限公司 | 用户信息提供方法及装置 |
CN107302726A (zh) * | 2017-06-30 | 2017-10-27 | 环球智达科技(北京)有限公司 | 节目信息的标签生成方法 |
CN109255027A (zh) * | 2018-08-27 | 2019-01-22 | 上海宝尊电子商务有限公司 | 一种电商评论情感分析降噪的方法和装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111488457A (zh) * | 2020-04-13 | 2020-08-04 | 上海枫河软件科技有限公司 | 一种电商评论标签分类方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110909176B (zh) | 数据推荐方法、装置、计算机设备以及存储介质 | |
Wang et al. | Extracting and summarizing affective features and responses from online product descriptions and reviews: A Kansei text mining approach | |
CN102902691B (zh) | 推荐方法及系统 | |
CN111784455A (zh) | 一种物品推荐方法及推荐设备 | |
Bhonde et al. | Sentiment analysis based on dictionary approach | |
CN109033284A (zh) | 基于知识图谱的电力信息运维系统数据库构建方法 | |
CN108256119A (zh) | 一种资源推荐模型的构建方法及基于该模型的资源推荐方法 | |
CN106062730A (zh) | 用于主动构成内容以便在连续社交通信中使用的系统和方法 | |
CN101114295A (zh) | 检索在线广告资源的方法和装置 | |
CN103617230A (zh) | 一种基于微博的广告推荐方法及系统 | |
CN104268130B (zh) | 一种面向Twitter的社交广告可投放性分析方法 | |
CN108874783A (zh) | 电力信息运维知识模型构建方法 | |
JP4796664B1 (ja) | 感性分析システム及びプログラム | |
Dragoni | A three-phase approach for exploiting opinion mining in computational advertising | |
CN107944911A (zh) | 一种基于文本分析的推荐系统的推荐方法 | |
CN106294500A (zh) | 内容项目的推送方法、装置及系统 | |
CN110096587A (zh) | 基于注意力机制的lstm-cnn词嵌入的细粒度情感分类模型 | |
Zhu et al. | Prompt-learning for short text classification | |
Bashar et al. | A bibliometric review of online impulse buying behaviour | |
CN109460462A (zh) | 一种中文相似问题生成系统与方法 | |
Suresh et al. | Mining of customer review feedback using sentiment analysis for smart phone product | |
Zhao et al. | Modeling customer satisfaction and revisit intention from online restaurant reviews: An attribute-level analysis | |
Beheshti-Kashi et al. | Trendfashion-a framework for the identification of fashion trends | |
CN109902180A (zh) | 一种电商评论多类目多客户快速定制化模型的方法和装置 | |
CN113158670A (zh) | 一种基于实体情感识别的电商评论意见抽取方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190618 |
|
RJ01 | Rejection of invention patent application after publication |