CN111488457A - 一种电商评论标签分类方法 - Google Patents

一种电商评论标签分类方法 Download PDF

Info

Publication number
CN111488457A
CN111488457A CN202010286496.9A CN202010286496A CN111488457A CN 111488457 A CN111488457 A CN 111488457A CN 202010286496 A CN202010286496 A CN 202010286496A CN 111488457 A CN111488457 A CN 111488457A
Authority
CN
China
Prior art keywords
commerce
comment
level
label
commerce comment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010286496.9A
Other languages
English (en)
Inventor
王航
王永明
林博
吴磊彬
郑圆
仇文彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Fenghe Software Technology Co ltd
Original Assignee
Shanghai Fenghe Software Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Fenghe Software Technology Co ltd filed Critical Shanghai Fenghe Software Technology Co ltd
Priority to CN202010286496.9A priority Critical patent/CN111488457A/zh
Publication of CN111488457A publication Critical patent/CN111488457A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/06Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
    • G06N3/061Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using biological neurons, e.g. biological neurons connected to an integrated circuit
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/082Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation
    • G06Q30/0625Directed, with specific intent or strategy
    • G06Q30/0627Directed, with specific intent or strategy using item specifications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Business, Economics & Management (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Finance (AREA)
  • Neurology (AREA)
  • Accounting & Taxation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Microelectronics & Electronic Packaging (AREA)

Abstract

本发明涉及一种电商评论标签分类方法,通过包括剪枝算法的深度神经网络将电商评论进行标签分类,上述剪枝算法是电商评论权值剪枝算法,上述电商评论标签分类方法包括如下步骤:S1、拉取大量电商评论样本,建立电商评论行业数据池;S2、通过深度神经网络分析电商评论行业数据池,建立包括服务、物流和产品三个大维度的第一层级标签;S3、通过深度神经网络将第一层级标签进行领域细分,对三个大维度下同类电商评论整合分类建立第二层级标签;S4、通过深度神经网络为第二层级标签建立应用场景限定关键词,建立可覆盖各个具体电商评论维度的第三层级标签。有益效果是帮助电商行业用户建立科学完善的电商评论标签体系。

Description

一种电商评论标签分类方法
【技术领域】
本发明涉及电子商务技术领域,具体涉及一种电商评论标签分类方法。
【背景技术】
电商评论的标签体系是用于针对某类电商行业繁多的用户评论而建立的标签分类系统。用于对用户评论进行合理、系统的分类标注,标签分类可以统一输出信息格式,标准化评论的情感和立场,得到较为标准统一的信息输出。目前已有很多针对电商评论的标签体系建立方法,这些方法主要是基于各个常见的用户关注点而创建,创建的标签体系通常是扁平化的,标签与标签关系独立,标签之间的逻辑关系无法准确表达。商家希望通过客户反馈来有针对性的迭代产品,然而传统的标签体系建立方法过于平铺,对于商家来说往往能看到多个独立的标签,但是无法迅速直观的从中获取标签间的逻辑关系以及重点标签的相关数据。
剪枝是最常用的神经网络压缩方法。剪枝(Pruning)是深度学习的一种技术,目标是为了开发更小、更高效的神经网络。这是一种包括去掉权重张量中多余的值的模型优化技术。压缩后的神经网络运行速度更快,还减少了训练网络的计算成本。传统剪枝过程的三个阶段包括预训练、剪枝和微调。
例如有报道,一种利用深度神经网络(Deep Neural Network,简称DNN)从数据中学习的机器学习算法,在最近几年正成为图像分类、语音识别和自然语言处理等领域的主流算法。然而现有的深度网络模型参数众多,导致其具有占用存储空间大和推断速度慢等缺点,从而限制了DNN的应用。为了解决这个问题研究者提出了很多压缩和加速DNN的方法,其中剪枝(Pruning)是一类简单但非常有效的方法。剪枝即在维持DNN性能不下降的条件下删除某些不重要的部分。根据删除对象的不同,剪枝可分为权值剪枝和神经元剪枝,前者删除DNN中不重要的权值,而后者删除DNN中不重要的神经元。如何在特定任务上应用DNN剪枝的问题,比如电商评论标签上应用DNN剪枝还未见相关文献报道。
【发明内容】
本发明的目的是,利用深度神经网络帮助电商行业用户建立科学完善的电商评论标签体系。
为实现上述目的,本发明采取的技术方案是一种电商评论标签分类方法,通过包括剪枝算法的深度神经网络将电商评论进行标签分类,上述剪枝算法是电商评论权值剪枝算法,上述电商评论标签分类方法包括如下步骤:
S1、拉取大量电商评论样本,建立电商评论行业数据池;
S2、通过深度神经网络分析电商评论行业数据池,建立包括服务、物流和产品三个大维度的第一层级标签;
S3、通过深度神经网络将第一层级标签进行领域细分,对三个大维度下同类电商评论整合分类建立第二层级标签;
S4、通过深度神经网络为第二层级标签建立应用场景限定关键词,建立可覆盖各个具体电商评论维度的第三层级标签。
优选地,上述电商评论权值剪枝算法包括电商评论情感标准化剪枝算法和电商评论降噪剪枝算法。
优选地,上述步骤S1中拉取至少5万条当前行业用户评论数据,建立电商评论行业数据池。
优选地,上述步骤S3中第二层级标签为了有利于通用场景和专用场景下的区别使用分类出第二层级通用型标签和第二层级专用型标签。
优选地,上述步骤S4中第三层级标签是电商评论中出现的具体场景分类,可以覆盖常见电商评论场景,为了有利于通用场景和专用场景下的区别使用分类出第三层级通用型标签和第三层级专用型标签。
优选地,上述通用型标签不区分行业类目,在任何电商评论行业均可使用;上述专用型标签根据不同电商行业类目制定;在不同行业类目中,通用型标签完全一致,但专用型标签存在部分的重叠。
本发明有如下有益效果:1、去除了重复情感评论,使评论结果更合理;2、立体展现用户评论关键信息,直观显示用户对商品的意见状态分布,多维度展现商家的优缺点;3、便于商家快速高效掌握用户评价信息;4、对用户情感调整权重,修正少数用户情感丰富的问题。
【附图说明】
图1是一种电商评论标签分类方法步骤图。
【具体实施方式】
下面结合实施例并参照附图对本发明作进一步描述。
实施例1
本实施例实现一种电商评论标签分类方法。
图1是一种电商评论标签分类方法步骤图。如附图1所示,本实施例一种电商评论标签分类方法,通过包括剪枝算法的深度神经网络将电商评论进行标签分类,上述剪枝算法是电商评论权值剪枝算法,上述电商评论标签分类方法包括如下步骤:
S1、拉取大量电商评论样本,建立电商评论行业数据池;
S2、通过深度神经网络分析电商评论行业数据池,建立包括服务、物流和产品三个大维度的第一层级标签;
S3、通过深度神经网络将第一层级标签进行领域细分,对三个大维度下同类电商评论整合分类建立第二层级标签;
S4、通过深度神经网络为第二层级标签建立应用场景限定关键词,建立可覆盖各个具体电商评论维度的第三层级标签。
优选地,上述电商评论权值剪枝算法包括电商评论情感标准化剪枝算法和电商评论降噪剪枝算法。
优选地,上述步骤S1中拉取至少5万条当前行业用户评论数据,建立电商评论行业数据池。
优选地,上述步骤S3中第二层级标签为了有利于通用场景和专用场景下的区别使用分类出第二层级通用型标签和第二层级专用型标签。
优选地,上述步骤S4中第三层级标签是电商评论中出现的具体场景分类,可以覆盖常见电商评论场景,为了有利于通用场景和专用场景下的区别使用分类出第三层级通用型标签和第三层级专用型标签。
优选地,上述通用型标签不区分行业类目,在任何电商评论行业均可使用;上述专用型标签根据不同电商行业类目制定;在不同行业类目中,通用型标签完全一致,但专用型标签存在部分的重叠。
本实施例设计电商评论标签分类体系的主体流程如下:拉取大量的评论样本,构建数据池;根据对数据池中数据的分析和统计,建立三层标签体系,由上到下分别为一级标签、二级标签和三级标签,一级标签表示该用户评论的所谓服务范围,包括物流、服务和产品三个维度,二级标签是在一级标签下的子分类,三级标签是在二级标签下的子分类;其中三级标签是该标签体系的最细粒度,表示用户评论在某一个具体维度的情感;分别制定三层级标签体系的标签覆盖范围、对应关键内容及命名主体。
本实施例的核心价值在于帮助用户评论分析系统建立科学完善的标签体系。使用分类算法对用户评论进行分类后,基于标签分类体系对分类结果进行标注,以从粗到细、从面到点的金字塔模式建立立体的标签分类结构,从而对用户的评论进行准确的标注与管理,进而对电商用户评论进行科学分类。本实施例标签体系的建立目的就是要解决评论分类算法在分类完成后可以更加科学直观的展现分类结果,便于商家快速有效的从分类结果中提取信息。这里面有几个挑战需要解决:如何划定标签层级,如何建立标签标准,如何定义标签覆盖范围。
实施例2
本实施例实现一种电商评论标签分类方法。
本实施例提供的一种电商评论标签分类方法,采用一种剪枝的神经网络模型建立电商评论标签分类体系,包括以下主要步骤:
T1、建立行业数据池,容量限定为至少5万条当前行业用户评论数据;
T2、建立行业标签体系层级;
T21、分析行业数据池,建立第一层级标签,表示电商评论所包含的商品评价大类,一般指服务、物流和产品三个大维度;
T22、建立第二层级标签,第二层级标签是将一级标签进行领域细分,是对电商评论某一个大维度下同类评论的整合;划分二级通用标签和二级专用标签类,通用标签不会区分行业类目,在任何电商评论行业均可使用;专用类标签则要根据不同电商行业类目来制定,在不同行业类目中,通用型标签完全一致,但专用型标签会存在部分的重叠,差别程度将根据行业差别程度来区分,本实施例陈述的标签体系将以电商中的运动行业类目为主体;
T23、建立第三层级标签,第三层级标签指的是电商评论中出现的具体场景分类,是基于第二层级标签进行的进一步类别细分,基本可以覆盖常见的绝大多数电商评论场景。
第二层级通用类型标签分类主要如下:
物流类包括配送情况和物流服务;
服务类包括服务态度、服务咨询、潜在客户、服务评价;
产品类包括产品价格、产品描述、货品异同、其他信息。
第二层级专用类标签分类主要如下:
产品类包括质量情况、个人感受、产品功能。
第三层级标签分类细致,通用类第三层级标签分类如下:
服务态度包括回复速度慢、机器人回复、回复机械、业务知识熟练、业务知识欠缺、处理积极、处理不积极;
服务咨询包括发票问题、退换货;
潜在客户包括意向客户;
服务评价包括整体满意度佳、整体满意度差;
产品价格包括促销赠品、期待赠品、优惠活动、期待降价、性价比低、性价比高、价格波动、商家补偿;
产品描述包括与详情页一致、与详情页不一致、新品与否;
货品异同包括与实体店一致、与实体店不一致、正品与否、原装正品;
其他信息包括产地信息、缺货、清洁保养;
专用类第三层级标签分类如下:
质量情况包括脱线、瑕疵、变形、线头、掉毛、起球、掉色、缩水、做工粗糙、脱胶、溢胶、弹性差、气味问题、材质欠佳、褶皱、无异味、弹性佳、清洗方便、做工优良、舒适度佳、轻巧轻便、透气、存在污渍、粘毛、粘灰;
个人感受包括不耐脏、不耐磨、穿着不适、闷气、磨脚、抓地力差、包裹性差、穿脱困难、耐脏、耐磨、抓地力强、包裹性强、无色差、有色差、偏薄、偏厚、偏长、偏短、偏大、偏小、偏软、偏硬、偏窄、偏宽、偏松、尺码合适、尺码偏差、轻薄、厚实、柔软、宽松、舒适度欠佳、偏重、鞋跟偏高;
产品功能包括吸汗、速干、保暖、防水、支撑效果好、气垫效果好、缓震、气垫效果差、支撑效果差。
上述步骤T21中,将各类电商评论区分为三大类型、三大层级,并在下一层级上进行进一步的细分,利于对电商评论进行标准化情感,利于用户信息的收集和统计,可以过滤重复评论信息和无效评论信息。
上述步骤T22中,建立二级标签分类,并分类出通用型标签和专用型标签,有利于通用场景和专用场景下的区别使用。
上述步骤T23中,建立可覆盖各个具体电商评论维度的三级标签,并分类出通用型标签和专用型标签,同时为其建立应用场景限定关键词。
本领域普通技术人员可以理解,实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Acess Memory,RAM)等。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员,在不脱离本发明原理的前提下,还可以做出若干改进和补充,这些改进和补充也应视为本发明的保护范围。

Claims (6)

1.一种电商评论标签分类方法,通过包括剪枝算法的深度神经网络将电商评论进行标签分类,其特征在于:所述剪枝算法是电商评论权值剪枝算法,所述电商评论标签分类方法包括如下步骤:
S1、拉取大量电商评论样本,建立电商评论行业数据池;
S2、通过深度神经网络分析电商评论行业数据池,建立包括服务、物流和产品三个大维度的第一层级标签;
S3、通过深度神经网络将第一层级标签进行领域细分,对三个大维度下同类电商评论整合分类建立第二层级标签;
S4、通过深度神经网络为第二层级标签建立应用场景限定关键词,建立可覆盖各个具体电商评论维度的第三层级标签。
2.根据权利要求1所述的一种电商评论标签分类方法,其特征在于:所述电商评论权值剪枝算法包括电商评论情感标准化剪枝算法和电商评论降噪剪枝算法。
3.根据权利要求1所述的一种电商评论标签分类方法,其特征在于:所述步骤S1中拉取至少5万条当前行业用户评论数据,建立电商评论行业数据池。
4.根据权利要求1所述的一种电商评论标签分类方法,其特征在于:所述步骤S3中第二层级标签为了有利于通用场景和专用场景下的区别使用分类出第二层级通用型标签和第二层级专用型标签。
5.根据权利要求1所述的一种电商评论标签分类方法,其特征在于:所述步骤S4中第三层级标签是电商评论中出现的具体场景分类,可以覆盖常见电商评论场景,为了有利于通用场景和专用场景下的区别使用分类出第三层级通用型标签和第三层级专用型标签。
6.根据权利要求4或权利要求5任一权利要求所述的一种电商评论标签分类方法,其特征在于:所述通用型标签不区分行业类目,在任何电商评论行业均可使用;所述专用型标签根据不同电商行业类目制定;在不同行业类目中,通用型标签完全一致,但专用型标签存在部分的重叠。
CN202010286496.9A 2020-04-13 2020-04-13 一种电商评论标签分类方法 Pending CN111488457A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010286496.9A CN111488457A (zh) 2020-04-13 2020-04-13 一种电商评论标签分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010286496.9A CN111488457A (zh) 2020-04-13 2020-04-13 一种电商评论标签分类方法

Publications (1)

Publication Number Publication Date
CN111488457A true CN111488457A (zh) 2020-08-04

Family

ID=71794767

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010286496.9A Pending CN111488457A (zh) 2020-04-13 2020-04-13 一种电商评论标签分类方法

Country Status (1)

Country Link
CN (1) CN111488457A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112837091A (zh) * 2021-01-28 2021-05-25 邱戴飞 基于分类器的信息处理方法、装置及存储介质
CN113220893A (zh) * 2021-07-09 2021-08-06 北京邮电大学 基于情感分析的产品反馈分析系统及方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109255027A (zh) * 2018-08-27 2019-01-22 上海宝尊电子商务有限公司 一种电商评论情感分析降噪的方法和装置
CN109902180A (zh) * 2019-03-04 2019-06-18 上海宝尊电子商务有限公司 一种电商评论多类目多客户快速定制化模型的方法和装置
CN110059181A (zh) * 2019-03-18 2019-07-26 中国科学院自动化研究所 面向大规模分类体系的短文本标签方法、系统、装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109255027A (zh) * 2018-08-27 2019-01-22 上海宝尊电子商务有限公司 一种电商评论情感分析降噪的方法和装置
CN109902180A (zh) * 2019-03-04 2019-06-18 上海宝尊电子商务有限公司 一种电商评论多类目多客户快速定制化模型的方法和装置
CN110059181A (zh) * 2019-03-18 2019-07-26 中国科学院自动化研究所 面向大规模分类体系的短文本标签方法、系统、装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘增良: "模糊技术与神经网络技术选编 5", 北京航空航天大学出版社 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112837091A (zh) * 2021-01-28 2021-05-25 邱戴飞 基于分类器的信息处理方法、装置及存储介质
CN113220893A (zh) * 2021-07-09 2021-08-06 北京邮电大学 基于情感分析的产品反馈分析系统及方法

Similar Documents

Publication Publication Date Title
CN111444236B (zh) 一种基于大数据的移动终端用户画像构建方法及系统
CN109977413B (zh) 一种基于改进cnn-lda的情感分析方法
CN108492118B (zh) 汽车售后服务质量评价回访文本数据的两阶段抽取方法
CN110717654B (zh) 基于用户评论的产品质量评价方法和系统
CN107632984A (zh) 一种聚类数据表的展现方法、装置和系统
CN112990973B (zh) 线上店铺画像构建方法及系统
CN108921602B (zh) 一种基于集成神经网络的用户购买行为预测方法
CN111488457A (zh) 一种电商评论标签分类方法
Daoud et al. Combining RFM model and clustering techniques for customer value analysis of a company selling online
CN110008376A (zh) 用户画像向量生成方法及装置
Liu et al. Customer classification and market basket analysis using K-means clustering and association rules: evidence from distribution big data of korean retailing company
CN113987112B (zh) 表格信息抽取方法、装置、存储介质及电子设备
CN117786103B (zh) 一种基于电商数据和社交媒体营销内容数据建立内容标签的方法
CN115017320A (zh) 结合词袋模型和深度学习模型的电商文本聚类方法及系统
Hadju et al. Sentiment analysis of indonesian e-commerce product reviews using support vector machine based term frequency inverse document frequency
CN114860941A (zh) 一种基于数据大脑的行业数据治理方法及系统
CN108009847B (zh) 外卖场景下店铺embedding特征提取的方法
Srivastava Identification of customer clusters using RFM model: a case of diverse purchaser classification
Anderson et al. Facial attractiveness classification using deep learning
CN115470322B (zh) 一种基于人工智能的关键词生成系统及方法
CN113298179B (zh) 一种海关商品异常价格检测方法和装置
CN115048503A (zh) 一种基于内容分析的用户偏好标签设计方法
Miao et al. How Perceived Factors of Review Contents Influence Consumers' Purchase Decision
Srinivasarao et al. Enhanced Movie Recommendation and Sentiment Analysis Model Achieved by Similarity Method through Cosine and Jaccard Similarity algorithms
Sadarina et al. Implementing data mining techniques for marketing of pharmaceutical products

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200804

RJ01 Rejection of invention patent application after publication