CN114049142A - 商品质量数据处理方法、装置、计算机设备和存储介质 - Google Patents

商品质量数据处理方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN114049142A
CN114049142A CN202111254064.0A CN202111254064A CN114049142A CN 114049142 A CN114049142 A CN 114049142A CN 202111254064 A CN202111254064 A CN 202111254064A CN 114049142 A CN114049142 A CN 114049142A
Authority
CN
China
Prior art keywords
commodity
processed
quality data
commodities
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111254064.0A
Other languages
English (en)
Inventor
杜嘉忠
陈海华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chuangyou Digital Technology Guangdong Co Ltd
Original Assignee
Chuangyou Digital Technology Guangdong Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chuangyou Digital Technology Guangdong Co Ltd filed Critical Chuangyou Digital Technology Guangdong Co Ltd
Priority to CN202111254064.0A priority Critical patent/CN114049142A/zh
Publication of CN114049142A publication Critical patent/CN114049142A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation

Landscapes

  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及一种商品质量数据处理方法、装置、计算机设备和存储介质。该方法包括:获取待处理商品质量数据,将待处理商品质量数据输入至情感倾向判断模型中,通过情感倾向判断模型对待处理商品质量数据进行分析,得到待处理商品质量数据对应的商品情感倾向结果,将待处理商品质量数据输入至信息品类分类模型中,通过信息品类分类模型对待处理商品质量数据进行分类,得到待处理商品质量数据对应的商品品类类别,建立待处理商品质量数据与商品情感倾向结果、商品品类类别之间的映射关系,映射关系用于查询目标商品品类的相关数据以构造目标商品质量画像。采用本方法能够提高商品质量数据的提取效率。

Description

商品质量数据处理方法、装置、计算机设备和存储介质
技术领域
本申请涉及计算机技术领域,特别是涉及一种商品质量数据处理方法、装置、计算机设备和存储介质。
背景技术
零售企业往往需要管理数百个品类及数千个商品,如何把有限的商品质量管理资源发挥最大的价值,是每个企业都需要面临的难题。企业往往按照商品品类垂直划分投入资源,来完成商品质量管理工作。随着电商、社交媒体等应用发展,企业内外部数据体量及复杂度与日俱增。质量管理在大数据环境下,提取有效质量情报变得日渐低效,其中质量情报是反映商品质量数据的。目前,提取有效质量都是依靠人工经验或者人工阅读资讯,需要花费大量的时间,导致商品质量数据的提取效率低,进一步造成从商品质量数据中提取有效质量情报的效率低。
发明内容
基于此,有必要针对上述技术问题,提供一种商品质量数据处理方法、装置、计算机设备和存储介质,无需人工提取有效的商品质量数据,能够提高商品质量数据的提取效率,以及提高商品质量数据的有效性。
一种商品质量数据处理方法,该方法包括:
获取待处理商品质量数据;
将待处理商品质量数据输入至情感倾向判断模型中,通过情感倾向判断模型对待处理商品质量数据进行分析,得到待处理商品质量数据对应的商品情感倾向结果;
将待处理商品质量数据输入至信息品类分类模型中,通过信息品类分类模型对待处理商品质量数据进行分类,得到待处理商品质量数据对应的商品品类类别;
建立待处理商品质量数据与商品情感倾向结果、商品品类类别之间的映射关系,映射关系用于查询目标商品品类的相关数据以构造目标商品质量画像。
在其中一个实施例中,商品质量数据处理方法还包括:获取待处理商品质量数据对应的数据源信息,在根据数据源信息确定待处理商品质量数据来源于目标数据源时,获取待处理商品质量数据中的商品口碑数据,对商品口碑数据进行特征提取,得到商品口碑数据对应的关键信息标签,关键信息标签指至少由描述性关键词、评价性关键词和情感倾向标签组成的多元素组,建立待处理商品质量数据与商品情感倾向结果、商品品类类别之间的映射关系,包括:建立待处理商品质量数据和关键信息标签、商品品类类别、商品情感倾向结果之间的映射关系。
在其中一个实施例中,对商品口碑数据进行特征提取,得到商品口碑数据对应的关键信息标签,包括:对待处理商品质量数据进行分割,得到多个词语,从多个词语中确定描述性关键词和评价性关键词,根据评价性关键词确定匹配的通用评价性关键词,根据通用评价性关键词确定匹配的通用情感词,根据预设抽取规则查找与通用情感词匹配的正负面情感倾向标签,根据描述性关键词、评价性关键词和正负面情感倾向标签组成三元组的关键信息标签。
在其中一个实施例中,获取待处理商品质量数据,包括:从至少一个应用的应用数据中爬取得到待清洗商品质量数据集,对待清洗商品质量数据集进行数据清洗,得到待处理商品质量数据。
在其中一个实施例中,信息品类分类模型包括通用语言模型和通用信息分类模型,将待处理商品质量数据输入至信息品类分类模型中,通过信息品类分类模型对待处理商品质量数据进行分类,得到待处理商品质量数据对应的商品品类类别,包括:将待处理商品质量数据输入至通用语言模型,得到通用语言模型输出的品类关键词向量,将品类关键词向量输入至通用信息分类模型,通过信息分类模型对品类关键词向量进行识别,得到待处理商品质量数据对应的商品品类类别。
在其中一个实施例中,商品质量数据处理方法还包括:获取商品情感倾向结果对应的商品预警级别,在商品预警级别达到预设的商品预警门限级别时,将已处理商品质量数据推送至商品品类类别对应的商品品类管理设备,使得商品品类管理设备展示商品品类类别对应的商品质量画像,商品质量画像包括带有商品情感倾向结果的商品质量数据。
在其中一个实施例中,商品质量数据处理方法还包括:接收目标商品品类查找请求,目标商品品类查找请求携带目标商品品类标识,根据目标品类标识确定匹配的目标商品标识,根据目标商品标识获取对应的目标相关数据,根据目标相关数据构造得到目标商品质量画像,目标商品质量画像携带目标商品情感倾向结果。
一种商品质量数据处理装置,该装置包括:
质量数据获取模块,用于获取待处理商品质量数据;
情感倾向判断模型分析模块,用于将待处理商品质量数据输入至情感倾向判断模型中,通过情感倾向判断模型对待处理商品质量数据进行分析,得到待处理商品质量数据对应的商品情感倾向结果;
信息品类分类模型分类模块,用于将待处理商品质量数据输入至信息品类分类模型中,通过信息品类分类模型对待处理商品质量数据进行分类,得到待处理商品质量数据对应的商品品类类别;
映射关系建立模块,用于建立待处理商品质量数据与商品情感倾向结果、商品品类类别之间的映射关系,映射关系用于查询目标商品品类的相关数据以构造目标商品质量画像。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取待处理商品质量数据;
将待处理商品质量数据输入至情感倾向判断模型中,通过情感倾向判断模型对待处理商品质量数据进行分析,得到待处理商品质量数据对应的商品情感倾向结果;
将待处理商品质量数据输入至信息品类分类模型中,通过信息品类分类模型对待处理商品质量数据进行分类,得到待处理商品质量数据对应的商品品类类别;
建立待处理商品质量数据与商品情感倾向结果、商品品类类别之间的映射关系,映射关系用于查询目标商品品类的相关数据以构造目标商品质量画像。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取待处理商品质量数据;
将待处理商品质量数据输入至情感倾向判断模型中,通过情感倾向判断模型对待处理商品质量数据进行分析,得到待处理商品质量数据对应的商品情感倾向结果;
将待处理商品质量数据输入至信息品类分类模型中,通过信息品类分类模型对待处理商品质量数据进行分类,得到待处理商品质量数据对应的商品品类类别;
建立待处理商品质量数据与商品情感倾向结果、商品品类类别之间的映射关系,映射关系用于查询目标商品品类的相关数据以构造目标商品质量画像。
上述商品质量数据处理方法、装置、计算机设备和存储介质,获取待处理商品质量数据,将待处理商品质量数据输入至情感倾向判断模型中,通过情感倾向判断模型对待处理商品质量数据进行分析,得到待处理商品质量数据对应的商品情感倾向结果,将待处理商品质量数据输入至信息品类分类模型中,通过信息品类分类模型对待处理商品质量数据进行分类,得到待处理商品质量数据对应的商品品类类别,建立待处理商品质量数据与商品情感倾向结果、商品品类类别之间的映射关系,映射关系用于查询目标商品品类的相关数据以构造目标商品质量画像。
因此,通过情感倾向判断模型和信息品类分类模型对待处理商品质量数据进行精准分类,得到商品情感倾向结果和商品品类类别,并将待处理商品质量数据与商品情感倾向结果、商品品类类别进行绑定,绑定之后,可以通过查询目标商品品类的相关数据以构造目标商品质量画像,全程无需人工提取有效的商品质量数据,不仅能够提高商品质量数据的提取效率,而且全程不需要人工参与,避免人工造成的错误,能够提升商品质量数据的有效性。
附图说明
图1为一个实施例中商品质量数据处理方法的应用环境图;
图2为一个实施例中商品质量数据处理方法的流程示意图;
图3为一个实施例中商品质量数据处理方法的流程示意图;
图4为一个实施例中商品口碑数据特征提取步骤的流程示意图;
图5为一个实施例中待处理商品质量数据获取步骤的流程示意图;
图6为一个实施例中信息品类分类模型处理步骤的流程示意图;
图7为一个实施例中商品质量数据处理方法的流程示意图;
图7A为一个实施例中商品品类管理设备的展示界面示意图;
图8为一个实施例中商品质量数据处理方法的流程示意图;
图8A为一个实施例中目标商品质量画像的界面示意图;
图8B为一个实施例中目标商品质量画像的界面示意图;
图8C为一个实施例中商品质量画像的界面示意图;
图9为一个实施例中商品质量数据处理装置的结构框图;
图10为一个实施例中计算机设备的内部结构图;
图11为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的商品质量数据处理方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
具体地,终端102获取到待处理商品质量数据,并通过网络通信发送至服务器104,服务器104接收到待处理商品质量数据后,将待处理商品质量数据输入至情感倾向判断模型中,通过情感倾向判断模型对待处理商品质量数据进行分析,得到待处理商品质量数据对应的商品情感倾向结果,将待处理商品质量数据输入至信息品类分类模型中,通过信息品类分类模型对待处理商品质量数据进行分类,得到待处理商品质量数据对应的商品品类类别,建立待处理商品质量数据与商品情感倾向结果、商品品类类别之间的映射关系,映射关系用于查询目标商品品类的相关数据以构造目标商品质量画像。
在另一个实施例中,终端102获取到待处理商品质量数据,将待处理商品质量数据输入至情感倾向判断模型中,通过情感倾向判断模型对待处理商品质量数据进行分析,得到待处理商品质量数据对应的商品情感倾向结果,将待处理商品质量数据输入至信息品类分类模型中,通过信息品类分类模型对待处理商品质量数据进行分类,得到待处理商品质量数据对应的商品品类类别,建立待处理商品质量数据与商品情感倾向结果、商品品类类别之间的映射关系,映射关系用于查询目标商品品类的相关数据以构造目标商品质量画像。
在一个实施例中,如图2所示,提供了一种商品质量数据处理方法,以该方法应用于图1中的终端或服务器为例进行说明,包括以下步骤:
步骤202,获取待处理商品质量数据。
其中,待处理商品质量数据是等待处理的商品质量数据,商品质量数据是与商品质量相关的数据,可以是用来描述商品质量的文本,也可以是用来描述商品质量的图像等。而商品质量是衡量商品使用价值的尺度。故商品质量数据可以包括商品不良品数、商品合格率、商品返修率等。
具体地,可以利用大数据爬虫技术从外部应用或外部平台中爬取与商品质量相关的数据,作为待处理商品质量数据,其中,外部应用或外部平台可以是社交媒体、新闻网站、投诉、市场监督局等应用或平台。
步骤204,将待处理商品质量数据输入至情感倾向判断模型中,通过情感倾向判断模型对待处理商品质量数据进行分析,得到待处理商品质量数据对应的商品情感倾向结果。
其中,情感倾向判断模型是用来判断待处理商品质量数据对应的正负面情感倾向的模型,通过情感倾向判断模型去判断待处理商品质量数据的情感倾向结果,情感倾向包括但不限于正面情感倾向、负面情感倾向。其中,可以通过情感倾向结果快速地了解商品的使用者的主观情绪,情感倾向结果还可以用于舆情监控、信息预测或用于判断商品的口碑,有利于帮助商品生产者改进商品。
其中,情感倾向判断模型可以预先通过大量外部商品质量数据进行训练得到的,具体可以是,获取大量带有正负面情感倾向标签的外部商品质量数据,正负面情感倾向标签包括正面情感倾向标签和负面情感倾向标签,通过该外部商品质量数据对未训练的情感倾向判断模型进行有监督训练,根据输出结果与本身携带的正负面情感倾向标签,不断地修改情感倾向判断模型的模型参数,直至满足模型收敛条件,得到已训练好的情感倾向判断模型。
具体地,在得到待处理商品质量数据后,将待处理商品质量数据作为已训练好的情感倾向判断模型的输入,通过情感倾向判断模型对输入的待处理商品质量数据进行分析,确定该待处理商品质量数据对应的商品情感倾向结果,并输出。
步骤206,将待处理商品质量数据输入至信息品类分类模型中,通过信息品类分类模型对待处理商品质量数据进行分类,得到待处理商品质量数据对应的商品品类类别。
其中,信息品类分类模型是用来判断待处理商品质量数据对应的商品品类类别的模型,通过信息品类分类模型预测待处理商品质量数据隶属于哪个商品品类类别。信息品类分类模型可输出至少一个与待处理商品质量数据对应的商品品类类别,根据商品品类类别可以准确地将待处理商品质量数据推送至该商品品类的相关负责人员进行查看。
在一种具体实现方式中,信息品类分类模型可以基于预设的一个分类网络训练得到,该分类网络可以为残差网络ResNet、视觉几何群网络VGG-16、GoogleNet、NasNet等网络中的任意一个,通过大量携带商品品类类别的外部商品质量数据对未训练的分类网络进行有监督训练,根据输出结果与自身携带的商品品类类别计算出训练损失值,根据训练损失值不断地调整未训练好的分类网络的模型参数,直至满足模型收敛条件,得到已训练好的分类网络作为信息品类分类模型。
具体地,在得到待处理商品质量数据后,将待处理商品质量数据输入至已训练好的信息品类分类模型,通过信息品类分类模型对该待处理商品质量数据进行分类,输出待处理商品质量数据对应的至少一个商品品类类别。
步骤208,建立待处理商品质量数据与商品情感倾向结果、商品品类类别之间的映射关系,映射关系用于查询目标商品品类的相关数据以构造目标商品质量画像。
具体地,在得到待处理商品质量数据对应的商品情感倾向结果、商品品类类别后,将待处理商品质量数据与对应的商品情感倾向结果、商品品类类别进行绑定,即建立待处理商品质量数据与商品情感倾向结果、商品品类类别之间的映射关系,在建立好映射关系后,可以通过映射关系来查询目标商品品类的相关数据,具体可以是,获取目标商品品类类别,根据建立好的映射关系查找与目标商品品类类别匹配的相关数据。其中,任一类别的商品品类均可作为目标商品品类,而相关数据可以是商品品类相关的所有商品数据,可以包括商品质量数据、商品情感倾向结果、商品品类类别、商品名称等,通过这些相关数据可以构建得到目标商品质量数据。而构建得到的目标商品质量画像可以包括目标商品品类对应的所有目标商品的质量画像,质量画像包括商品不良数量、客诉量、某时段内验货量、某时段内检测不合格量、政府抽检量、负面舆情声量、商品负面评价量等。
在另一个实施例中,可以将待处理商品质量数据所描述的商品也与商品情感倾向结果、商品品类类别进行关联,具体可以是确定待处理商品质量数据对应的商品标识,商品标识是用来唯一标识商品的,不同的商品对应不同的商品标识,建立待处理商品质量数据与商品标识、商品情感倾向结果、商品品类类别之间的映射关系,在建立好该映射关系后,获取目标商品标识,其中任一商品的商品标识均可作为目标商品标识,根据建立好的映射关系查找与目标商品标识对应的相关数据,通过相关数据构建得到商品质量画像。其中,相关数据可以包括商品质量数据、商品情感倾向结果、商品品类类别、商品名称、商品标识等。因此,通过商品标识具体定位到商品对应的商品情感倾向结果,方便从更具体的商品中去挖掘出正面商品情感倾向结果,例如,方便挖掘出“爆款”的具体商品,相对于通过商品品类类别定位到商品品类对应的商品情感倾向结果,这种通过商品标识定位的方式,能够更加具体地查找到商品的相关数据,进行商品质量画像的构建。
上述商品质量数据处理方法中,获取待处理商品质量数据,将待处理商品质量数据输入至情感倾向判断模型中,通过情感倾向判断模型对待处理商品质量数据进行分析,得到待处理商品质量数据对应的商品情感倾向结果,将待处理商品质量数据输入至信息品类分类模型中,通过信息品类分类模型对待处理商品质量数据进行分类,得到待处理商品质量数据对应的商品品类类别,建立待处理商品质量数据与商品情感倾向结果、商品品类类别之间的映射关系,映射关系用于查询目标商品品类的相关数据以构造目标商品质量画像。
因此,通过情感倾向判断模型和信息品类分类模型对待处理商品质量数据进行精准分类,得到商品情感倾向结果和商品品类类别,并将待处理商品质量数据与商品情感倾向结果、商品品类类别进行绑定,绑定之后,可以通过查询目标商品品类的相关数据以构造目标商品质量画像,全程无需人工参与,不仅能够提高商品质量数据的提取效率,而且避免人工造成的错误,从而提升商品质量数据的有效性。
在一个实施例中,如图3所示,商品质量数据处理方法还包括:
步骤302,获取待处理商品质量数据对应的数据源信息。
步骤304,在根据数据源信息确定待处理商品质量数据来源于目标数据源时,获取待处理商品质量数据中的商品口碑数据。
步骤306,对商品口碑数据进行特征提取,得到商品口碑数据对应的关键信息标签,关键信息标签指至少由描述性关键词、评价性关键词和情感倾向标签组成的多元素组。
其中,这里数据源信息是指待处理商品质量的来源信息,可以通过数据源信息确定待处理商品质量从哪里爬取得到的,获取待处理商品质量数据对应的数据源信息后,需要进行筛选,只有来自目标数据源的待处理商品质量数据才能获得商品口碑数据,因此需要根据数据源信息确定待处理商品质量数据是否来源于目标数据源,这里的目标数据源可以根据实际业务需求、实际产品需求或实际应用场景预先确定得到,例如,目标数据源可以是电商数据源等。
进一步地,在确定待处理商品质量数据来源于目标数据源时,获取待处理商品质量数据中的商品口碑数据,所谓商品口碑数据是与商品口碑相关的数据,可以是用来描述商品口碑的文本内容,也可以是用来描述商品口碑的图像等等。商品口碑,指消费者根据具体的商品性能、规格、材质、使用寿命、外观等内在价值在使用过程中给出的综合评价。其中,获取待处理商品质量数据中商品口碑数据具体可以是对待处理商品质量数据进行拆分,根据拆分后的描述的内容筛选出商品口碑数据,例如,如果待处理商品质量数据为描述商品质量的文本内容,则可以对该文本内容进行句子拆分,得到多个句子,根据句子描述的内容筛选出商品口碑数据。又例如,待处理商品质量数据为描述商品质量的商品图像,则可以利用文本内容提取技术,如OCR(Optical Character Recognition,光学字符识别)技术,提取出待处理商品质量数据中的文本内容,再通过对提取出来的文本内容进行句子拆分,得到多个句子,再通过各句子描述的句子内容确定得到商品口碑数据。
最后,在得到商品口碑数据后,对商品口碑数据进行特征提取,得到关键信息标签,关键信息标签指的是至少由描述性关键词、评价性关键词和情感倾向标签组成的多元素组。其中,对商品口碑数据进行特征提取,可以是对商品口碑数据进行拆分,得到商品口碑数据中的描述性关键词和评价性关键词,再根据评价性关键词查找匹配的情感倾向标签,由描述性关键词、评价性关键词和情感倾向标签组成多元素组,即多元素组为关键信息标签。
本实施例中,建立待处理商品质量数据与商品情感倾向结果、商品品类类别之间的映射关系,包括:建立待处理商品质量数据和关键信息标签、商品品类类别、商品情感倾向结果之间的映射关系。
本实施例中,在得到关键信息标签后,将待处理商品质量数据与关键信息标签、商品品类类别、商品情感倾向结果进行绑定,即建立待处理商品质量数据和关键信息标签、商品品类类别、商品情感倾向结果之间的映射关系,在建立好映射关系后,在进行商品标识和商品品类类别查询时,通过映射关系查询到商品相关数据,这里的商品相关数据除了包括商品质量数据、商品品类类别、商品标识、商品情感倾向结果等之外,还包括商品的关键信息标签,关键信息标签包括商品的描述性关键词、商品的评价性关键词和情感倾向标签,关键信息标签中的情感倾向标签是商品质量数据中商品口碑数据有关的情感倾向标签,与商品情感倾向结果不同,商品情感倾向结果是商品质量数据整体的情感倾向结果。因此,通过建立新的映射关系,查找到的相关数据的数据内容更加丰富、更加具体,构建的商品质量画像也更加丰富。
在一个实施例中,如图4所示,待处理商品质量数据为描述待处理商品质量的文本内容,对商品口碑数据进行特征提取,得到商品口碑数据对应的关键信息标签,包括:
步骤402,对待处理商品质量数据进行分割,得到多个词语。
步骤404,从多个词语中确定描述性关键词和评价性关键词,根据评价性关键词确定匹配的通用评价性关键词。
其中,对商品口碑数据进行特征提取,得到商品口碑数据对应的关键信息标签,具体可以是,先对待处理商品质量数据进行分割,得到分割后的多个词语,其中,待处理商品质量数据是用来描述商品质量的文本内容,在进行文本内容的分割时,可以根据各个词语之间的搭配习惯,各个词语之间的词语含义等进行分割,得到多个词语。
进一步地,再从多个词语中查找描述性关键词和评价性关键词,描述性关键词可以是用来描述商品特性的关键词,评价性关键词可以是用来描述商品质量的关键词,在得到分割后的多个词语后,可以通过各个词语描述的内容中筛选出描述性关键词和评价性关键词,例如,分割后的多个词语分别为:这个,耳机,外包装,非常,精致,完美,因此可以从各个词语描述的内容中筛选出描述性关键词为:耳机外包装,评价性关键词为:精致完美。
最后,可以根据评价性关键词确定匹配的通用评价性关键词,具体可以是,获取各候选通用评价性关键词以及各候选通用评价性关键词对应的候选评价性关键词,可以通过计算评价性关键词与候选评价性关键词之间的相似度,根据相似度从各候选通用评价行关键词中确定与评价性关键词匹配的通用评价性关键词,例如,将相似度最大的候选评价性关键词对应的候选通用评价性关键词,确定为与评价性关键词匹配的通用评价性关键词。其中,还可以是,获取各候选通用评价性关键词,直接计算评价性关键词与各候选通用评价性关键词之间的相似度,将相似度最大的候选通用评价性关键词确定为评价性关键词匹配的通用评价性关键词。
步骤406,根据通用评价性关键词确定匹配的通用情感词,根据预设抽取规则查找与通用情感词匹配的正负面情感倾向标签。其中,正负面情感倾向标签包括正面情感倾向标签和负面情感倾向标签。
步骤408,根据描述性关键词、评价性关键词和正负面情感倾向标签组成三元组的关键信息标签。
具体地,在得到通用评价性关键词后,根据通用评价性关键词确定匹配的通用情感词,具体可以是,获取预先设置的候选通用评价性关键词与候选通用情感词的映射表,根据映射表查找与通用评价性关键词匹配的通用情感词;可以理解的是,通用评价性关键词属于候选通用评价性关键词所组成的词库,通用情感词属于候选通用情感词所组成的词库,因此根据由候选通用评价性关键词与候选通用情感词相互匹配的映射表可以查找到与通用评价性关键词匹配的通用情感词。在另一个实施例中,根据通用评价性关键词确定匹配的通用情感词,具体还可以是,获取各通用情感词对应的各候选通用评价性关键词,计算通用评价性关键词和各候选通用评价性关键词之间的相似度,根据相似度确定通用评价性关键词匹配的通用情感词。
进一步地,再根据预设抽取规则查找与通用情感词匹配的正负面情感倾向标签,这里的预设抽取规则是预先设置的抽取规则,抽取规则描述了各通用情感词与对应的正面情感倾向标签或负面情感倾向标签之间的对应关系,因此,在得到通用情感词后,可以根据对应关系查找与通用情感词匹配的正面情感倾向标签或负面情感倾向标签。最终,由描述性关键词、评价性关键词和正负面情感倾向标签组成三元组的关键信息标签。例如,三元组的关键信息标签可以为:[耳机外包装-精致完美-正面],“耳机外包装”为描述性关键词、“精致完美”为评价性关键词、“正面”为正面情感倾向标签。
在一个实施例中,如图5所示,获取待处理商品质量数据,包括:
步骤502,从至少一个应用的应用数据中爬取得到待清洗商品质量数据集。
步骤504,对待清洗商品质量数据集进行数据清洗,得到待处理商品质量数据。
其中,这里的至少一个应用可以是社交媒体、新闻网站、投诉、市场监督局等应用或平台,可以利用大数据爬虫技术从至少一个应用的应用数据中爬取得到待清洗商品质量数据集,这里的待清洗商品质量数据是未进行清洗的,为了提高商品质量数据的准确性,避免出现了无效的商品质量数据,因此,需要对待清洗商品质量数据集进行数据清洗,数据清洗可以是剔除无效的商品质量数据或者是剔除重复的商品质量数据,还可以是对残缺的商品质量数据进行修订等,最终得到待处理商品质量数据。
在一个实施例中,如图6所示,信息品类分类模型包括通用语言模型和通用信息分类模型,将待处理商品质量数据输入至信息品类分类模型中,通过信息品类分类模型对待处理商品质量数据进行分类,得到待处理商品质量数据对应的商品品类类别,包括:
步骤602,将待处理商品质量数据输入至通用语言模型,得到通用语言模型输出的品类关键词向量。
步骤604,将品类关键词向量输入至通用信息分类模型,通过信息分类模型对品类关键词向量进行识别,得到待处理商品质量数据对应的商品品类类别。
其中,信息品类分类模型包括通用语言模型和通用信息分类模型,通用语言模型是用来形成品类关键词向量,主要是将待处理商品质量数据转换成品类关键词向量。具体可以是,将待处理商品质量数据输入至通用语言模型中,通过通用语言模型对待处理商品质量数据进行提取转换,输出对应的品类关键词向量。
其中,通用信息分类模型是用来输出商品品类类别的,主要是根据将通用语言模型输出的品类关键词向量来判断待处理商品质量数据对应的商品品类类别的。具体地,将通用语言模型输出的品类关键词向量,输入至通用信息分类模型中,通过通用信息分类模型对品类关键词向量进行识别,输出待处理商品质量数据对应的商品品类类别。因此,通过通用语言模型可以将待处理商品质量数据进行提取,得到品类关键词向量,再结合通用信息分类模型对品类关键词向量进行识别,得到最终的商品品类类别。
在一个实施例中,如图7所示,商品质量数据处理方法还包括:
步骤702,获取商品情感倾向结果对应的商品预警级别。
步骤704,在商品预警级别达到预设的商品预警门限级别时,将已处理商品质量数据推送至商品品类类别对应的商品品类管理设备,使得商品品类管理设备展示商品品类类别对应的商品质量画像,商品质量画像包括带有商品情感倾向结果的商品质量数据。
其中,商品预警级别是商品质量异常的预警等级,商品预警级别越高,说明商品质量异常程度越大,需要引起重大关注,反之,商品预警级别越低,说明商品质量异常程度越低。其中,商品预警级别可以根据商品情感倾向结果确定得到,具体可以是,预先建立各候选商品预警级别与对应的候选商品情感倾向结果之间的关联关系,根据该关联关系查找与情感倾向判断模型输出的商品情感倾向结果对应的商品预警级别。
其中,预设的商品预警门限级别是一个临界值,可预先根据实际业务需求、产品需求或实际应用场景进行确定得到,具体地,获取预设的商品预警门限级别,检测商品情感倾向结果对应的商品预警级别是否达到预设的商品预警门限级别,如果未达到,说明可以暂时不作任何处理。
其中,如果达到,说明已处理的商品质量数据存在严重的商品质量问题,为了保证商品的质量,因此,需要将已处理商品质量数据推送至商品品类类别对应的商品品类管理设备,商品品类管理设备的使用者是专门来管理该商品品类类别下的所有商品的质量问题,最后,商品品类管理设备接收到已处理商品质量数据,可以根据已处理商品质量数据构造对应的商品质量滑行,并进行展示。其中,商品质量画像包括带有商品情感倾向结果的商品质量数据。
例如,如图7A所示,图7A示出一个实施例中商品品类管理设备的展示界面示意图,在商品预警级别达到预设的商品预警门限级别时,将已处理商品质量数据推送至商品品类类别对应的商品品类管理设备,商品品类管理设备会显示商品情感倾向结果以及对应的商品预警级别,并显示已处理商品质量数据构成的商品质量画像,商品质量画像为:上海路地铁站这边,尤其是一号口附件很多人在游走……
在一个实施例中,如图8所示,商品质量数据处理方法还包括:
步骤802,接收目标商品品类查找请求,目标商品品类查找请求携带目标商品品类标识。
步骤804,根据目标品类标识确定匹配的目标商品标识,根据目标商品标识获取对应的目标相关数据,根据目标相关数据构造得到目标商品质量画像,目标商品质量画像携带目标商品情感倾向结果。
其中,目标商品品类查找请求是用来请求查找目标商品品类对应的目标商品质量画像的,目标商品品类查找请求携带目标商品品类标识,目标商品品类标识用来唯一标识商品品类类别的,不同的商品品类类别对应不同的商品品类标识。
进一步地,接收到目标商品品类查找请求后,根据目标品类标识确定匹配的目标商品标识,再通过目标商品标识查找对应的相关数据,通过相关数据构造得到目标商品质量画像,其中,目标商品质量画像携带有相应的目标商品情感倾向结果。
例如,如图8A和图8B所示所示,图8A和图8B示出一个实施例中目标商品质量画像的界面示意图,图8A中的电子电器类为目标商品品类标识,通过目标商品品类标识获取目标商品标识,如图8B中的移动电源、头戴式蓝牙耳机、键盘等,再获取目标商品标识获取对应的目标相关数据,构成目标商品质量画像,目标商品质量画像携带目标商品情感倾向结果,例如负面舆情声量等,目标商品质量画像中还可以包括数据来源,例如图8A中的政府监督为数据来源。
在另一个实施例中,可以通过查询请求携带的商品标识,获取商品标识相关的商品质量数据,构造得到商品质量画像。例如图8C所示,图8C示出一个实施例中商品质量画像的界面示意图,图8C的商品标识为经典真无线蓝牙耳机,构造的商品质量画像为负评:耳机仓的质感不怎么好,而且戴久了耳朵难受,耳朵盖感觉很塑料,但是音质还是不错的。
在一个具体的实施例中,提供了一种商品质量数据处理方法,具体包括以下步骤:
1、获取待处理商品质量数据。
1-1、从至少一个应用的应用数据中爬取得到待清洗商品质量数据集。
1-2、对待清洗商品质量数据集进行数据清洗,得到待处理商品质量数据。
2、将待处理商品质量数据输入至情感倾向判断模型中,通过情感倾向判断模型对待处理商品质量数据进行分析,得到待处理商品质量数据对应的商品情感倾向结果。
3、将待处理商品质量数据输入至信息品类分类模型中,通过信息品类分类模型对待处理商品质量数据进行分类,得到待处理商品质量数据对应的商品品类类别。
3-1、信息品类分类模型包括通用语言模型和通用信息分类模型,将待处理商品质量数据输入至通用语言模型,得到通用语言模型输出的品类关键词向量。
3-2、将品类关键词向量输入至通用信息分类模型,通过信息分类模型对品类关键词向量进行识别,得到待处理商品质量数据对应的商品品类类别。
4、获取待处理商品质量数据对应的数据源信息。
5、在根据数据源信息确定待处理商品质量数据来源于目标数据源时,获取待处理商品质量数据中的商品口碑数据。
6、对商品口碑数据进行特征提取,得到商品口碑数据对应的关键信息标签,关键信息标签指至少由描述性关键词、评价性关键词和情感倾向标签组成的多元素组。
6-1、待处理商品质量数据为描述待处理商品质量的文本内容,对待处理商品质量数据进行分割,得到多个词语。
6-2、从多个词语中确定描述性关键词和评价性关键词,根据评价性关键词确定匹配的通用评价性关键词。
6-3、根据评价性关键词确定匹配的通用情感词,根据预设抽取规则查找与通用情感词匹配的正负面情感倾向标签。
6-4、根据描述性关键词、评价性关键词和正负面情感倾向标签组成三元组的关键信息标签。
7、建立待处理商品质量数据和关键信息标签、商品品类类别、商品情感倾向结果之间的映射关系,映射关系用于查询目标商品品类的相关数据以构造目标商品质量画像。
8、获取商品情感倾向结果对应的商品预警级别。
9、在商品预警级别达到预设的商品预警门限级别时,将已处理商品质量数据推送至商品品类类别对应的商品品类管理设备,使得商品品类管理设备展示商品品类类别对应的商品质量画像,商品质量画像包括带有商品情感倾向结果的商品质量数据。
10、接收目标商品品类查找请求,目标商品品类查找请求携带目标商品品类标识。
11、根据目标品类标识确定匹配的目标商品标识,根据目标商品标识获取对应的目标相关数据,根据目标相关数据构造得到目标商品质量画像,目标商品质量画像携带目标商品情感倾向结果。
应该理解的是,虽然上述流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,上述流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图9所示,提供了一种商品质量数据处理装置900,包括:质量数据获取模块902、情感倾向判断模型分析模块904、信息品类分类模型分类模块906和映射关系建立模块908,其中:
质量数据获取模块902,用于获取待处理商品质量数据。
情感倾向判断模型分析模块904,用于将待处理商品质量数据输入至情感倾向判断模型中,通过情感倾向判断模型对待处理商品质量数据进行分析,得到待处理商品质量数据对应的商品情感倾向结果。
信息品类分类模型分类模块906,用于将待处理商品质量数据输入至信息品类分类模型中,通过信息品类分类模型对待处理商品质量数据进行分类,得到待处理商品质量数据对应的商品品类类别。
映射关系建立模块908,用于建立待处理商品质量数据与商品情感倾向结果、商品品类类别之间的映射关系,映射关系用于查询目标商品品类的相关数据以构造目标商品质量画像。
在一个实施例中,商品质量数据处理装置900获取待处理商品质量数据对应的数据源信息,在根据数据源信息确定待处理商品质量数据来源于目标数据源时,获取待处理商品质量数据中的商品口碑数据,对商品口碑数据进行特征提取,得到商品口碑数据对应的关键信息标签,关键信息标签指至少由描述性关键词、评价性关键词和情感倾向标签组成的多元素组,映射关系建立模块908建立待处理商品质量数据和关键信息标签、商品品类类别、商品情感倾向结果之间的映射关系。
在一个实施例中,商品质量数据处理装置900对待处理商品质量数据进行分割,得到多个词语,从多个词语中确定描述性关键词和评价性关键词,根据评价性关键词确定匹配的通用评价性关键词,根据评价性关键词确定匹配的通用情感词,根据预设抽取规则查找与通用情感词匹配的正负面情感倾向标签,根据描述性关键词、评价性关键词和正负面情感倾向标签组成三元组的关键信息标签。
在一个实施例中,质量数据获取模块902从至少一个应用的应用数据中爬取得到待清洗商品质量数据集,对待清洗商品质量数据集进行数据清洗,得到待处理商品质量数据。
在一个实施例中,信息品类分类模型包括通用语言模型和通用信息分类模型,信息品类分类模型分类模块906将待处理商品质量数据输入至通用语言模型,得到通用语言模型输出的品类关键词向量,将品类关键词向量输入至通用信息分类模型,通过信息分类模型对品类关键词向量进行识别,得到待处理商品质量数据对应的商品品类类别。
在一个实施例中,商品质量数据处理装置900获取商品情感倾向结果对应的商品预警级别,在商品预警级别达到预设的商品预警门限级别时,将已处理商品质量数据推送至商品品类类别对应的商品品类管理设备,使得商品品类管理设备展示商品品类类别对应的商品质量画像,商品质量画像包括带有商品情感倾向结果的商品质量数据。
在一个实施例中,商品质量数据处理装置900接收目标商品品类查找请求,目标商品品类查找请求携带目标商品品类标识,根据目标品类标识确定匹配的目标商品标识,根据目标商品标识获取对应的目标相关数据,根据目标相关数据构造得到目标商品质量画像,目标商品质量画像携带目标商品情感倾向结果。
关于商品质量数据处理装置的具体限定可以参见上文中对于商品质量数据处理方法的限定,在此不再赘述。上述商品质量数据处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储情感倾向判断模型和信息品类分类模型。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种商品质量数据处理方法。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图11所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种商品质量数据处理方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图10或图11中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:获取待处理商品质量数据;将待处理商品质量数据输入至情感倾向判断模型中,通过情感倾向判断模型对待处理商品质量数据进行分析,得到待处理商品质量数据对应的商品情感倾向结果,将待处理商品质量数据输入至信息品类分类模型中,通过信息品类分类模型对待处理商品质量数据进行分类,得到待处理商品质量数据对应的商品品类类别,建立待处理商品质量数据与商品情感倾向结果、商品品类类别之间的映射关系,映射关系用于查询目标商品品类的相关数据以构造目标商品质量画像。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取待处理商品质量数据对应的数据源信息,在根据数据源信息确定待处理商品质量数据来源于目标数据源时,获取待处理商品质量数据中的商品口碑数据,对商品口碑数据进行特征提取,得到商品口碑数据对应的关键信息标签,关键信息标签指至少由描述性关键词、评价性关键词和情感倾向标签组成的多元素组,建立待处理商品质量数据与商品情感倾向结果、商品品类类别之间的映射关系,包括:建立待处理商品质量数据和关键信息标签、商品品类类别、商品情感倾向结果之间的映射关系。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:对待处理商品质量数据进行分割,得到多个词语,从多个词语中确定描述性关键词和评价性关键词,根据评价性关键词确定匹配的通用评价性关键词,根据通用评价性关键词确定匹配的通用情感词,根据预设抽取规则查找与通用情感词匹配的正负面情感倾向标签,根据描述性关键词、评价性关键词和正负面情感倾向标签组成三元组的关键信息标签。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:从至少一个应用的应用数据中爬取得到待清洗商品质量数据集,对待清洗商品质量数据集进行数据清洗,得到待处理商品质量数据。
在一个实施例中,信息品类分类模型包括通用语言模型和通用信息分类模型,处理器执行计算机程序时还实现以下步骤:将待处理商品质量数据输入至通用语言模型,得到通用语言模型输出的品类关键词向量,将品类关键词向量输入至通用信息分类模型,通过信息分类模型对品类关键词向量进行识别,得到待处理商品质量数据对应的商品品类类别。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取商品情感倾向结果对应的商品预警级别,在商品预警级别达到预设的商品预警门限级别时,将已处理商品质量数据推送至商品品类类别对应的商品品类管理设备,使得商品品类管理设备展示商品品类类别对应的商品质量画像,商品质量画像包括带有商品情感倾向结果的商品质量数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:接收目标商品品类查找请求,目标商品品类查找请求携带目标商品品类标识,根据目标品类标识确定匹配的目标商品标识,根据目标商品标识获取对应的目标相关数据,根据目标相关数据构造得到目标商品质量画像,目标商品质量画像携带目标商品情感倾向结果。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取待处理商品质量数据;将待处理商品质量数据输入至情感倾向判断模型中,通过情感倾向判断模型对待处理商品质量数据进行分析,得到待处理商品质量数据对应的商品情感倾向结果,将待处理商品质量数据输入至信息品类分类模型中,通过信息品类分类模型对待处理商品质量数据进行分类,得到待处理商品质量数据对应的商品品类类别,建立待处理商品质量数据与商品情感倾向结果、商品品类类别之间的映射关系,映射关系用于查询目标商品品类的相关数据以构造目标商品质量画像。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取待处理商品质量数据对应的数据源信息,在根据数据源信息确定待处理商品质量数据来源于目标数据源时,获取待处理商品质量数据中的商品口碑数据,对商品口碑数据进行特征提取,得到商品口碑数据对应的关键信息标签,关键信息标签指至少由描述性关键词、评价性关键词和情感倾向标签组成的多元素组,建立待处理商品质量数据与商品情感倾向结果、商品品类类别之间的映射关系,包括:建立待处理商品质量数据和关键信息标签、商品品类类别、商品情感倾向结果之间的映射关系。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:对待处理商品质量数据进行分割,得到多个词语,从多个词语中确定描述性关键词和评价性关键词,根据评价性关键词确定匹配的通用评价性关键词,根据通用评价性关键词确定匹配的通用情感词,根据预设抽取规则查找与通用情感词匹配的正负面情感倾向标签,根据描述性关键词、评价性关键词和正负面情感倾向标签组成三元组的关键信息标签。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:从至少一个应用的应用数据中爬取得到待清洗商品质量数据集,对待清洗商品质量数据集进行数据清洗,得到待处理商品质量数据。
在一个实施例中,信息品类分类模型包括通用语言模型和通用信息分类模型,处理器执行计算机程序时还实现以下步骤:将待处理商品质量数据输入至通用语言模型,得到通用语言模型输出的品类关键词向量,将品类关键词向量输入至通用信息分类模型,通过信息分类模型对品类关键词向量进行识别,得到待处理商品质量数据对应的商品品类类别。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取商品情感倾向结果对应的商品预警级别,在商品预警级别达到预设的商品预警门限级别时,将已处理商品质量数据推送至商品品类类别对应的商品品类管理设备,使得商品品类管理设备展示商品品类类别对应的商品质量画像,商品质量画像包括带有商品情感倾向结果的商品质量数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:接收目标商品品类查找请求,目标商品品类查找请求携带目标商品品类标识,根据目标品类标识确定匹配的目标商品标识,根据目标商品标识获取对应的目标相关数据,根据目标相关数据构造得到目标商品质量画像,目标商品质量画像携带目标商品情感倾向结果。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种商品质量数据处理方法,所述方法包括:
获取待处理商品质量数据;
将所述待处理商品质量数据输入至情感倾向判断模型中,通过所述情感倾向判断模型对所述待处理商品质量数据进行分析,得到所述待处理商品质量数据对应的商品情感倾向结果;
将所述待处理商品质量数据输入至信息品类分类模型中,通过所述信息品类分类模型对所述待处理商品质量数据进行分类,得到所述待处理商品质量数据对应的商品品类类别;
建立所述待处理商品质量数据与所述商品情感倾向结果、所述商品品类类别之间的映射关系,所述映射关系用于查询目标商品品类的相关数据以构造目标商品质量画像。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述待处理商品质量数据对应的数据源信息;
在根据所述数据源信息确定所述待处理商品质量数据来源于目标数据源时,获取所述待处理商品质量数据中的商品口碑数据;
对所述商品口碑数据进行特征提取,得到所述商品口碑数据对应的关键信息标签,所述关键信息标签指至少由描述性关键词、评价性关键词和情感倾向标签组成的多元素组;
所述建立所述待处理商品质量数据与所述商品情感倾向结果、所述商品品类类别之间的映射关系,包括:
建立所述待处理商品质量数据和所述关键信息标签、所述商品品类类别、所述商品情感倾向结果之间的映射关系。
3.根据权利要求2所述的方法,其特征在于,所述待处理商品质量数据为描述待处理商品质量的文本内容,所述对所述商品口碑数据进行特征提取,得到所述商品口碑数据对应的关键信息标签,包括:
对所述待处理商品质量数据进行分割,得到多个词语;
从所述多个词语中确定描述性关键词和评价性关键词,根据所述评价性关键词确定匹配的通用评价性关键词;
根据所述评价性关键词确定匹配的通用情感词,根据预设抽取规则查找与所述通用情感词匹配的正负面情感倾向标签;
根据所述描述性关键词、所述评价性关键词和所述正负面情感倾向标签组成三元组的关键信息标签。
4.根据权利要求1或2或3所述的方法,其特征在于,所述获取待处理商品质量数据,包括:
从至少一个应用的应用数据中爬取得到待清洗商品质量数据集;
对所述待清洗商品质量数据集进行数据清洗,得到所述待处理商品质量数据。
5.根据权利要求1或2或3所述的方法,其特征在于,所述信息品类分类模型包括通用语言模型和通用信息分类模型;
所述将所述待处理商品质量数据输入至信息品类分类模型中,通过所述信息品类分类模型对所述待处理商品质量数据进行分类,得到所述待处理商品质量数据对应的商品品类类别,包括:
将所述待处理商品质量数据输入至通用语言模型,得到所述通用语言模型输出的品类关键词向量;
将所述品类关键词向量输入至通用信息分类模型,通过所述信息分类模型对所述品类关键词向量进行识别,得到所述待处理商品质量数据对应的商品品类类别。
6.根据权利要求1或2或3所述的方法,其特征在于,所述方法还包括:
获取所述商品情感倾向结果对应的商品预警级别;
在所述商品预警级别达到预设的商品预警门限级别时,将已处理商品质量数据推送至所述商品品类类别对应的商品品类管理设备,使得所述商品品类管理设备展示所述商品品类类别对应的商品质量画像,所述商品质量画像包括带有商品情感倾向结果的商品质量数据。
7.根据权利要求1或2或3所述的方法,其特征在于,所述方法还包括:
接收目标商品品类查找请求,所述目标商品品类查找请求携带目标商品品类标识;
根据所述目标品类标识确定匹配的目标商品标识,根据所述目标商品标识获取对应的目标相关数据,根据所述目标相关数据构造得到目标商品质量画像,所述目标商品质量画像携带目标商品情感倾向结果。
8.一种商品质量数据处理装置,其特征在于,所述装置包括:
质量数据获取模块,用于获取待处理商品质量数据;
情感倾向判断模型分析模块,用于将所述待处理商品质量数据输入至情感倾向判断模型中,通过所述情感倾向判断模型对所述待处理商品质量数据进行分析,得到所述待处理商品质量数据对应的商品情感倾向结果;
信息品类分类模型分类模块,用于将所述待处理商品质量数据输入至信息品类分类模型中,通过所述信息品类分类模型对所述待处理商品质量数据进行分类,得到所述待处理商品质量数据对应的商品品类类别;
映射关系建立模块,用于建立所述待处理商品质量数据与所述商品情感倾向结果、所述商品品类类别之间的映射关系,所述映射关系用于查询目标商品品类的相关数据以构造目标商品质量画像。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN202111254064.0A 2021-10-27 2021-10-27 商品质量数据处理方法、装置、计算机设备和存储介质 Pending CN114049142A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111254064.0A CN114049142A (zh) 2021-10-27 2021-10-27 商品质量数据处理方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111254064.0A CN114049142A (zh) 2021-10-27 2021-10-27 商品质量数据处理方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN114049142A true CN114049142A (zh) 2022-02-15

Family

ID=80206367

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111254064.0A Pending CN114049142A (zh) 2021-10-27 2021-10-27 商品质量数据处理方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN114049142A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103678335A (zh) * 2012-09-05 2014-03-26 阿里巴巴集团控股有限公司 商品标识标签的方法、装置及商品导航的方法
CN109359244A (zh) * 2018-10-30 2019-02-19 中国科学院计算技术研究所 一种个性化信息推荐方法和装置
CN110097250A (zh) * 2019-03-20 2019-08-06 平安直通咨询有限公司上海分公司 产品风险预测方法、装置、计算机设备和存储介质
CN110751533A (zh) * 2019-09-09 2020-02-04 上海陆家嘴国际金融资产交易市场股份有限公司 产品画像生成方法、装置、计算机设备和存储介质
CN111666757A (zh) * 2019-02-21 2020-09-15 北京京东尚科信息技术有限公司 商品评论情感倾向分析方法、装置、设备和可读存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103678335A (zh) * 2012-09-05 2014-03-26 阿里巴巴集团控股有限公司 商品标识标签的方法、装置及商品导航的方法
CN109359244A (zh) * 2018-10-30 2019-02-19 中国科学院计算技术研究所 一种个性化信息推荐方法和装置
CN111666757A (zh) * 2019-02-21 2020-09-15 北京京东尚科信息技术有限公司 商品评论情感倾向分析方法、装置、设备和可读存储介质
CN110097250A (zh) * 2019-03-20 2019-08-06 平安直通咨询有限公司上海分公司 产品风险预测方法、装置、计算机设备和存储介质
CN110751533A (zh) * 2019-09-09 2020-02-04 上海陆家嘴国际金融资产交易市场股份有限公司 产品画像生成方法、装置、计算机设备和存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陶莉娜等: "基于商品评论文本的情感分析研究", 《现代信息科技》 *

Similar Documents

Publication Publication Date Title
CN109829628B (zh) 基于大数据的风险预警方法、装置和计算机设备
CN109165840B (zh) 风险预测处理方法、装置、计算机设备和介质
CN108874992B (zh) 舆情分析方法、系统、计算机设备和存储介质
CN109272396B (zh) 客户风险预警方法、装置、计算机设备和介质
CN109829629B (zh) 风险分析报告的生成方法、装置、计算机设备和存储介质
CN109543925B (zh) 基于机器学习的风险预测方法、装置、计算机设备和存储介质
CN109376237B (zh) 客户稳定性的预测方法、装置、计算机设备和存储介质
CN110688454A (zh) 咨询对话处理的方法、装置、设备及存储介质
CN109582876B (zh) 旅游行业用户画像构造方法、装置和计算机设备
CN108363821A (zh) 一种信息推送方法、装置、终端设备及存储介质
CN108563734B (zh) 制度信息查询方法、装置、计算机设备和存储介质
CN108520041B (zh) 文本的行业分类方法、系统、计算机设备和存储介质
CN108509424B (zh) 制度信息处理方法、装置、计算机设备和存储介质
CN110472114B (zh) 异常数据预警方法、装置、计算机设备及存储介质
CN109710918B (zh) 舆情关系识别方法、装置、计算机设备和存储介质
CN112035611B (zh) 目标用户推荐方法、装置、计算机设备和存储介质
CN112395500A (zh) 内容数据推荐方法、装置、计算机设备及存储介质
CN108334625B (zh) 用户信息的处理方法、装置、计算机设备和存储介质
CN110362798B (zh) 裁决信息检索分析方法、装置、计算机设备和存储介质
KR102146546B1 (ko) 상황인지 기반의 기업주가예측 알고리즘 제공 방법
CN110751533A (zh) 产品画像生成方法、装置、计算机设备和存储介质
CN113223532A (zh) 客服通话的质检方法、装置、计算机设备及存储介质
CN114399396A (zh) 保险产品推荐方法、装置、计算机设备及存储介质
CN112949297A (zh) 意图识别方法、装置、计算机设备和计算机可读存储介质
CN115311042A (zh) 商品推荐方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20220215