CN108389006A - 基于维权行为与维权方式的网购用户维权指数模型生成方法及系统 - Google Patents
基于维权行为与维权方式的网购用户维权指数模型生成方法及系统 Download PDFInfo
- Publication number
- CN108389006A CN108389006A CN201810238534.6A CN201810238534A CN108389006A CN 108389006 A CN108389006 A CN 108389006A CN 201810238534 A CN201810238534 A CN 201810238534A CN 108389006 A CN108389006 A CN 108389006A
- Authority
- CN
- China
- Prior art keywords
- maintaining
- online shopping
- comment
- platform
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 18
- 238000003058 natural language processing Methods 0.000 claims abstract description 5
- 230000006399 behavior Effects 0.000 claims description 50
- 238000004364 calculation method Methods 0.000 claims description 37
- 238000004458 analytical method Methods 0.000 claims description 36
- 239000013598 vector Substances 0.000 claims description 30
- 238000012423 maintenance Methods 0.000 claims description 22
- 238000012549 training Methods 0.000 claims description 18
- 238000000605 extraction Methods 0.000 claims description 12
- 230000011218 segmentation Effects 0.000 claims description 12
- 238000012552 review Methods 0.000 claims description 8
- 230000008451 emotion Effects 0.000 claims description 7
- 230000002996 emotional effect Effects 0.000 claims description 7
- 238000011156 evaluation Methods 0.000 claims description 6
- 238000005259 measurement Methods 0.000 claims description 6
- 238000011161 development Methods 0.000 abstract description 5
- 238000012544 monitoring process Methods 0.000 abstract description 5
- 239000000606 toothpaste Substances 0.000 description 7
- 229940034610 toothpaste Drugs 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000013461 design Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 206010027940 Mood altered Diseases 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 239000002537 cosmetic Substances 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000007943 implant Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012821 model calculation Methods 0.000 description 1
- 230000007510 mood change Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Educational Administration (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种基于维权行为与维权方式的网购用户维权指数模型生成方法及系统,通过平台文本数据的获取;维权评论文本识别,对获取的平台文本数据进行文本分析,包括平台商品评论数据、平台商品投诉数据以及线下商品投诉数据,分类判断出网购用户的平台文本数据是否为维权评论,并采用自然语言处理中的余弦计算相似度度量算法来识别平台文本数据中总的网购用户进行维权的数量Nbase;生成网购用户维权指数模型;该方法所生成的网购用户维权指数模型的计算数据易获取,模型输出结果唯一、较为稳定,且可动态实时监测与预测某段时间内,特定商品、特定消费群体的进行网络消费后可能产生的维权行为与维权方式选择随时间动态变化的整体发展状态。
Description
技术领域
本发明涉及一种基于维权行为与维权方式的网购用户维权指数模型生成方法及系统。
背景技术
据相关搜索与比对发现,现有的网购用户大指数设计与编制技术包括:
一、由青岛市工商局创立的,于2011年9月23日首发的消费者维权指数。其数据主要来源于该市局12315投诉举报指挥中心受理的消费者投诉举报案件数据,重点关注的是八大重点商品的维权案件数量和涉案金额的统计分析。
二、由国家工商行政管理总局消保局、中国消费者协会和各地消协的支持下,中国消费网与阿里巴巴合作,利用阿里巴巴的网络零售市场数据,编制的一个反映网络消费者的喜怒哀乐情绪变化、消费心理变化与电商消费环境的维权指数。
需要注意的是,国家工商行政管理总局构建的维权指数的构建是从维权情绪的视角来构建维权指数的,并非直接从网格用户维权行为的视角来构建相关指数。目前尚未有针对网购用户进行维权行为与维权方式的变化监测与预测的公开文献。
发明内容
本发明的目的是提供一种基于维权行为与维权方式的网购用户维权指数模型生成方法及系统,解决现有技术中存在的如何监测与预测网购用户面临网络消费维权事件时维权方式与方式选择类型、频率和规模随时间变化的发生与发展趋势的问题。
本发明的技术解决方案是:
一种基于维权行为与维权方式的网购用户维权指数模型生成方法,包括以下步骤,
S1、平台文本数据的获取,采集平台文本数据,包括平台商品评论数据、平台商品投诉数据以及线下商品投诉数据;
S2、维权评论文本识别,对步骤S1获取的平台文本数据进行文本分析,包括平台商品评论数据、平台商品投诉数据以及线下商品投诉数据,分类判断出网购用户的平台文本数据是否为维权评论,并采用自然语言处理中的余弦计算相似度度量算法来识别平台文本数据中总的网购用户进行维权的数量Nbase;
S3、生成三个网购用户维权子指数模型,包括评论维权指数的编制与计算、投诉维权指数的编制与计算、社会维权指数的编制与计算。
S4、生成网购用户维权综合指数模型,在网购用户维权行为子指数模型生成的基础上,编制与计算网购用户维权综合指数模型。
进一步地,步骤S2中,判断平台商品评论数据是否为维权评论,具体为,
S21、将获取的平台商品评论数据划分出训练文本与被试文本;
S22、对训练文本进行评论维权词集的训练,从电商平台上获取不同类别商品的平台商品评论数据,然后进行分词、词性分析、情感分析、实体识别和关键词提取,得出特征向量,并形成适用与每一类目商品的评论维权词集库;
S23、被试文本的特征向量计算,将被试文本数据录入后,同样要进行分词、词性分析、情感分析、实体识别和关键词提取,然后得出被试特征向量;
S24、维权评论的判断,通过比较被试特征向量与评论维权词集库的特征向量,来计算任意商品网购用户评论是否属于维权性的评论文本;若评价实体与情感倾向相一致,表明被试网购用户评论属于维权性评论文本。
进一步地,步骤S3中,评论维权指数为采用评论维权方式进行维权的用户数量与总的网购维权用户数量的比值,具体计算公式为:
其中,和分别是t期的网购用户采用评论方式进行维权的比例和基期网购用户采用评论方式进行维权的比例,和分别为t期和基期网购用户采用评论方式进行维权的用户数量,Nt和Nbase分别为t期和基期总的网购用户进行维权的数量。
进一步地,步骤S3中,投诉维权指数为采用平台投诉方式进行维权的用户数量与总的网购维权用户数量的比值,具体计算公式为:
其中,和分别是t期的网购用户采用平台投诉方式的维权比例和基期网购用户采用平台投诉方式维权比例,和分别为t期和基期网购用户采用平台投诉方式进行维权的用户数量,Nt和Nbase分别为t期和基期总的网购用户进行维权的数量。
进一步地,步骤S3中,社会维权指数为采用线下投诉的方式的网购用户数量与总的网购维权用户数量的比值,具体计算公式为:
其中,和分别是t期的网购用户采用社会投诉方式的维权比例和基期网购用户采用社会投诉方式维权比例,和分别为t期和基期网购用户采用社会投诉方式进行维权的用户数量,Mt和Mbase分别为t期和基期总的网购用户社会投诉方式进行维权的数量。
进一步地,步骤S4中,网购维权综合指数等于评论维权指数、投诉维权指数和社会维权指数的加权平均值,具体计算公式为:
其中,和分别是t期的网购用户评论维权指数、投诉维权指数和社会维权指数,和分别是t期的网购用户评论维权行为比例、投诉维权行为比例和社会维权行为比例。
在步骤S1中,还获取网购用户基础信息,包括ID、年龄、网购平台名称、商品收货地址。
进一步地,步骤S2中,将平台商品评论数据依据步骤S2判断出属于维权评论文本,与网购用户基础信息进行对应显示。
一种采用上述任一项所述基于维权行为与维权方式的网购用户维权指数模型生成方法的基于维权行为与维权方式的网购用户维权指数模型生成系统,包括以下步骤,
数据采集模块:进行平台文本数据的获取,采集平台文本数据,包括平台商品评论数据、平台商品投诉数据以及线下商品投诉数据;
文本识别模块:进行维权评论文本识别,对步骤S1获取的平台文本数据进行文本分析,包括平台商品评论数据、平台商品投诉数据以及线下商品投诉数据,分类判断出网购用户的平台文本数据是否为维权评论,并采用自然语言处理中的余弦计算相似度度量算法来识别平台文本数据中总的网购用户进行维权的数量Nbase;
模型生成模块:生成网购用户维权子指数模型,包括评论维权指数的编制与计算、投诉维权指数的编制与计算、社会维权指数的编制与计算,最后由加权平均算法计算得到维权综合指数的编制与计算。
进一步地,文本识别模块中,判断平台商品评论数据是否为维权评论,具体为,
将获取的平台商品评论数据划分出训练文本与被试文本;
对训练文本进行评论维权词集的训练,从电商平台上获取不同类别商品的平台商品评论数据,然后进行分词、词性分析、情感分析、实体识别和关键词提取,得出特征向量,并形成适用与每一类目商品的评论维权词集库;
被试文本的特征向量计算,将被试文本数据录入后,同样要进行分词、词性分析、情感分析、实体识别和关键词提取,然后得出被试特征向量;
维权评论文本的判断,通过比较被试特征向量与评论维权词集库的特征向量,来计算任意商品网购用户评论是否属于维权性的评论文本;若评价实体与情感倾向相一致,表明被试网购用户评论属于维权性评论文本。
本发明的有益效果是:该种基于维权行为与维权方式的网购用户维权指数模型生成方法及系统,所生成的网购用户维权指数模型的计算数据易获取,模型输出结果唯一、较为稳定,且可动态实时监测与预测某段时间内,特定商品、特定消费群体的进行网络消费后可能产生的维权行为与维权方式选择随时间动态变化的整体发展状态。可用于网络电商企业的平台注册用户消费维权行为检测、风险评估与态势预测,也可用于政府职能部门的特定时间、特定地区与特定消费商品的网络消费宏观状态的监测与预测。
附图说明
图1是本发明实施例基于维权行为与维权方式的网购用户维权指数模型生成方法的流程示意图。
图2是实施例中维权评论文本识别流程示意图。
图3是实施例中维权评论词性分析的示意图。
图4是实施例中维权评论情感分析的示意图。
图5是实施例中维权评论自动摘要的示意图。
图6是实施例中网购用户维权指数指标体系的说明示意图。
图7是实施例中网购商品类目表的示意图。
具体实施方式
下面结合附图详细说明本发明的优选实施例。
实施例
实施例中,网购用户维权指数模型是一个能综合反映不同平台、不同地区、不同商品类目、不同人群的消费者维权行为与方式选择随时间变化的模型。其重点关注的是网购用户维权行为与维权方式的时空变化,即重点监测与预测网购用户面临网络消费维权事件时维权行为与方式选择类型、频率和规模随时间变化的发生与发展趋势。
实施例中,所构建的网购用户维权指数模型针对的是,网购用户维权行为与维权方式的变化监测与预测,这些维权行为与方式包括平台评论维权方式、平台投诉维权方式与社会维权方式。其中:平台评论维权是指消费者面临网络消费维权事件时,通过公开的商品评论栏,给予某商家某商品负面评论的维权方式。平台投诉维权是指消费者面临维权事件时,采用退换货申诉或直接向平台客服投诉的方式来维护自身权益的维权方式。社会维权水平是指消费者通过向当地消费者权益保护协会或政府职能部门投诉或控告的方式来维护自身合法权益。
一种基于维权行为与维权方式的网购用户维权指数模型生成方法,如图1,包括以下步骤,
S1、平台文本数据的获取,采集平台文本数据,包括平台商品评论数据、平台商品投诉数据以及线下商品投诉数据;
S2、维权评论文本识别,对步骤S1获取的平台文本数据进行文本分析,包括平台商品评论数据、平台商品投诉数据以及线下商品投诉数据,分类判断出网购用户的平台文本数据是否为维权评论,并采用自然语言处理中的余弦计算相似度度量算法来识别平台文本数据中总的网购用户进行维权的数量Nbase;
步骤S2中,判断平台商品评论数据是否为维权评论,具体为,
S21、将获取的平台商品评论数据划分出训练文本与被试文本;
S22、对训练文本进行评论维权词集的训练,从电商平台上获取不同类别商品的平台商品评论数据,然后进行分词、词性分析、情感分析、实体识别和关键词提取,得出特征向量,并形成适用与每一类目商品的评论维权词集库;
S23、被试文本的特征向量计算,将被试文本数据录入后,同样要进行分词、词性分析、情感分析、实体识别和关键词提取,然后得出被试特征向量;
S24、维权评论的判断,通过比较被试特征向量与评论维权词集库的特征向量,来计算任意商品网购用户评论是否属于维权性的评论文本;若评价实体与情感倾向相一致,表明被试网购用户评论属于维权性评论文本。这里的相似性算法有很多,最简单的是余弦相似度算法。对应一些复制的评论文本而言,其维权性评论文本判断需要借助一些机器学习算法。如Rocchio算法、朴素贝叶斯分类算法、K-近邻算法、决策树算法、神经网络算法和支持向量机算法。
为更加直观说明这样的维权评论文本识别过程:
实施例摘取一段淘宝上一个牙膏商品的江苏网购用户评论信息,该信息是:“只是为了卖家别来骚扰我,给的中评,和我之前买的相当不一样,本人认为这家店的植雅牙膏不是正品,再也不相信网上卖的植雅了,一个三十几块钱的牙膏还要作假,真不知道那些说是正品的是怎么看的,整个包装颜色都比我之前买的要淡很多,这个连卫生许可标志都没有,我之前买的就有。这个的生产许可证号和我之前买的也不一样,牙膏打开来还有一点点水,还是应该相信之前那些给差评的人的。本来想退货的,但因为拆了,卖家说影响二次销售,只能退一半钱,那我还不如不退,留着刷鞋也比退给他强。望之后想要买的人谨慎再谨慎!如果你在乎真假就别买,如果你无所谓真假可以买。”。
对该信息得到如下词性分析结果,如图3所示。
其次由该文本的情感倾向性计算结果可知,该网购用户的评论为负面评论,属于一类维权性质评论,如图4所示。
最后,获取该文本的自动摘要“和我之前买的相当不一样,本人认为这家店的植雅牙膏不是正品,”、“我之前买的就有。这个的生产许可证号和我之前买的也不一样,”、“卖家说影响二次销售”。由该文本的自动摘要计算结果可知,该用户面临购买到假冒化妆品纠纷文本,并采用平台用户评论的方式进行维权,如图5所示。
关于投诉维权指数与社会维权指数的计算,因存在结构化统计数据,相关指数的计算不需要这种深度的文本分析,也可以计算出。其中,平台商品投诉数据和线下商品投诉数据,因是投诉内容,均为维权评论。
S3、生成三个网购用户维权子指数模型,包括评论维权指数的编制与计算、投诉维权指数的编制与计算、社会维权指数的编制与计算。
步骤S3中,评论维权指数为采用评论维权方式进行维权的用户数量与总的网购维权用户数量的比值,具体计算公式为:
其中,和分别是t期的网购用户采用评论方式进行维权的比例和基期网购用户采用评论方式进行维权的比例,和分别为t期和基期网购用户采用评论方式进行维权的用户数量,Nt和Nbase分别为t期和基期总的网购用户进行维权的数量。
步骤S3中,投诉维权指数为采用平台投诉方式进行维权的用户数量与总的网购维权用户数量的比值,具体计算公式为:
其中,和分别是t期的网购用户采用平台投诉方式的维权比例和基期网购用户采用平台投诉方式维权比例,和分别为t期和基期网购用户采用平台投诉方式进行维权的用户数量,Nt和Nbase分别为t期和基期总的网购用户进行维权的数量。
步骤S3中,社会维权指数为采用线下投诉的方式的网购用户数量与总的网购维权用户数量的比值,具体计算公式为:
其中,和分别是t期的网购用户采用社会投诉方式的维权比例和基期网购用户采用社会投诉方式维权比例,和分别为t期和基期网购用户采用社会投诉方式进行维权的用户数量,Mt和Mbase分别为t期和基期总的网购用户社会投诉方式进行维权的数量。
S4、生成网购用户维权综合指数模型,在网购用户维权行为子指数模型生成的基础上,编制与计算网购用户维权综合指数模型。
步骤S4中,网购维权综合指数等于评论维权指数、投诉维权指数和社会维权指数的加权平均值,具体计算公式为:
其中,和分别是t期的网购用户评论维权指数、投诉维权指数和社会维权指数,和分别是t期的网购用户评论维权行为比例、投诉维权行为比例和社会维权行为比例。
在步骤S1中,还获取网购用户基础信息,包括ID、年龄、网购平台名称和商品收货地址。
步骤S2中,将平台商品评论数据依据步骤S2判断出属于维权评论文本,与网购用户基础信息进行对应显示。
实施例中,网购用户维权指数模型首先划分为平台评论维权、平台投诉维权和社会维权三个二级指标,其中每个二级指标又划为总指数和分组指数,且可从地区归属、平台归属、类目归属和人群归属这四个横向指标进行交叉,具体内容如图6所示。其中分指数和总指数是相对而言的,其主要是指明按什么分类维度进行划分,而总指数仅仅是其分指数的累加平均。例如,模型计算的输入数据,经地区标签识别后,都指向用户的商品收货地址都是来自某个相同地区i,并按步骤S1、S2、S3及其他们的分步骤分别计算出来维权行为指数Ai,即为i地区网购用户维权指数。通过上述多个地区的Ai指数累加平均数学计算,即计算出来所有地区维权行为总指数A。诸如此类,按平台归属、商品类目归属和用户人群归属所定义的分指数和总指数的关系的计算逻辑也是相同的。
需要注意的是,地区归属,是按国家省、市、县地区区域划分,划分到县一级;平台归属划分,是按照苏宁、京东和阿里等平台企业名称进行划分,商品类目归属是按照国家工商局给出的商品类目以及几个电商平台的商品类目进行修正之后得到的划分标准,如图7;人群归属划分,主要是从用户的年龄和性别两个维度进行划分。
关于网购用户维权行为指数模型设计与编制技术最大的难点在于相关维权行为指标选择、细化、具体化与具体子指标的计算模型设计与编制。实施例针对这些技术难点,给出各指标设计与详细计算模型,解决了具体子指标与总指数计算的技术难点。
一种采用上述任一项所述基于维权行为与维权方式的网购用户维权指数模型生成方法的基于维权行为与维权方式的网购用户维权指数模型生成系统,包括以下步骤,
数据采集模块:进行平台文本数据的获取,采集平台文本数据,包括平台商品评论数据、平台商品投诉数据以及线下商品投诉数据;
文本识别模块:进行维权评论文本识别,对步骤S1获取的平台文本数据进行文本分析,包括平台商品评论数据、平台商品投诉数据以及线下商品投诉数据,分类判断出网购用户的平台文本数据是否为维权评论,并采用自然语言处理中的余弦计算相似度度量算法来识别平台文本数据中总的网购用户进行维权的数量Nbase;
模型生成模块:生成网购用户维权子指数模型,包括评论维权指数的编制与计算、投诉维权指数的编制与计算、社会维权指数的编制与计算,最后由加权平均算法计算得到维权综合指数的编制与计算。
本识别模块中,判断平台商品评论数据是否为维权评论,具体为,
将获取的平台商品评论数据划分出训练文本与被试文本;
对训练文本进行评论维权词集的训练,从电商平台上获取不同类别商品的平台商品评论数据,然后进行分词、词性分析、情感分析、实体识别和关键词提取,得出特征向量,并形成适用与每一类目商品的评论维权词集库;
被试文本的特征向量计算,将被试文本数据录入后,同样要进行分词、词性分析、情感分析、实体识别和关键词提取,然后得出被试特征向量;
维权评论文本的判断,通过比较被试特征向量与评论维权词集库的特征向量,来计算任意商品网购用户评论是否属于维权性的评论文本;若评价实体与情感倾向相一致,表明被试网购用户评论属于维权性评论文本。
该种基于维权行为与维权方式的网购用户维权指数模型生成方法及系统,所生成的网购用户维权指数模型的计算数据易获取,模型输出结果唯一、较为稳定,且可动态实时监测与预测某段时间内,特定商品、特定消费群体的进行网络消费后可能产生的维权行为与维权方式选择随时间动态变化的整体发展状态。可用于网络电商企业的平台注册用户消费维权行为检测、风险评估与态势预测,也可用于政府职能部门的特定时间、特定地区与特定消费商品的网络消费宏观状态的监测与预测。
Claims (10)
1.一种基于维权行为与维权方式的网购用户维权指数模型生成方法,其特征在于:包括以下步骤,
S1、平台文本数据的获取,采集平台文本数据,包括平台商品评论数据、平台商品投诉数据以及线下商品投诉数据;
S2、维权评论文本识别,对步骤S1获取的平台文本数据进行文本分析,包括平台商品评论数据、平台商品投诉数据以及线下商品投诉数据,分类判断出网购用户的平台文本数据是否为维权评论,并采用自然语言处理中的余弦计算相似度度量算法来识别平台文本数据中总的网购用户进行维权的数量Nbase;
S3、生成三个网购用户维权子指数模型,包括评论维权指数的编制与计算、投诉维权指数的编制与计算、社会维权指数的编制与计算。
S4、生成网购用户维权综合指数模型,在网购用户维权行为子指数模型生成的基础上,编制与计算网购用户维权综合指数模型。
2.如权利要求1所述的基于维权行为与维权方式的网购用户维权指数模型生成方法,其特征在于:步骤S2中,判断平台商品评论数据是否为维权评论,具体为,
S21、将获取的平台商品评论数据划分出训练文本与被试文本;
S22、对训练文本进行评论维权词集的训练,从电商平台上获取不同类别商品的平台商品评论数据,然后进行分词、词性分析、情感分析、实体识别和关键词提取,得出特征向量,并形成适用与每一类目商品的评论维权词集库;
S23、被试文本的特征向量计算,将被试文本数据录入后,同样要进行分词、词性分析、情感分析、实体识别和关键词提取,然后得出被试特征向量;
S24、维权评论文本的判断,通过比较被试特征向量与评论维权词集库的特征向量,来计算任意商品网购用户评论是否属于维权性的评论文本;若评价实体与情感倾向相一致,表明被试网购用户评论属于维权性评论文本。
3.如权利要求1所述的基于维权行为与维权方式的网购用户维权指数模型生成方法,其特征在于:步骤S3中,评论维权指数为采用评论维权方式进行维权的用户数量与总的网购维权用户数量的比值,具体计算公式为:
其中,和分别是t期的网购用户采用评论方式进行维权的比例和基期网购用户采用评论方式进行维权的比例,和分别为t期和基期网购用户采用评论方式进行维权的用户数量,Nt和Nbase分别为t期和基期总的网购用户进行维权的数量。
4.如权利要求3所述的基于维权行为与维权方式的网购用户维权指数模型生成方法,其特征在于:步骤S3中,投诉维权指数为采用平台投诉方式进行维权的用户数量与总的网购维权用户数量的比值,具体计算公式为:
其中,和分别是t期的网购用户采用平台投诉方式的维权比例和基期网购用户采用平台投诉方式维权比例,和分别为t期和基期网购用户采用平台投诉方式进行维权的用户数量,Nt和Nbase分别为t期和基期总的网购用户进行维权的数量。
5.如权利要求4所述的基于维权行为与维权方式的网购用户维权指数模型生成方法,其特征在于:步骤S3中,社会维权指数为采用线下投诉的方式的网购用户数量与总的网购维权用户数量的比值,具体计算公式为:
其中,和分别是t期的网购用户采用社会投诉方式的维权比例和基期网购用户采用社会投诉方式维权比例,和分别为t期和基期网购用户采用社会投诉方式进行维权的用户数量,Mt和Mbase分别为t期和基期总的网购用户社会投诉方式进行维权的数量。
6.如权利要求4所述的基于维权行为与维权方式的网购用户维权指数模型生成方法,其特征在于:步骤S4中,网购维权综合指数等于评论维权指数、投诉维权指数和社会维权指数的加权平均值,具体计算公式为:
其中,和分别是t期的网购用户评论维权指数、投诉维权指数和社会维权指数,和分别是t期的网购用户评论维权行为比例、投诉维权行为比例和社会维权行为比例。
7.如权利要求1所述的基于维权行为与维权方式的网购用户维权指数模型生成方法,其特征在于:在步骤S1中,还获取网购用户基础信息,包括ID、年龄、网购平台名称、商品收货地址。
8.如权利要求7所述的基于维权行为与维权方式的网购用户维权指数模型生成方法,其特征在于:步骤S2中,将平台商品评论数据依据步骤S2判断出属于维权评论文本,与网购用户基础信息进行对应显示。
9.一种采用1-8任一项所述基于维权行为与维权方式的网购用户维权指数模型生成方法的基于维权行为与维权方式的网购用户维权指数模型生成系统,其特征在于:包括以下步骤,
数据采集模块:进行平台文本数据的获取,采集平台文本数据,包括平台商品评论数据、平台商品投诉数据以及线下商品投诉数据;
文本识别模块:进行维权评论文本识别,对步骤S1获取的平台文本数据进行文本分析,包括平台商品评论数据、平台商品投诉数据以及线下商品投诉数据,分类判断出网购用户的平台文本数据是否为维权评论,并采用自然语言处理中的余弦计算相似度度量算法来识别平台文本数据中总的网购用户进行维权的数量Nbase;
模型生成模块:生成网购用户维权子指数模型,包括评论维权指数的编制与计算、投诉维权指数的编制与计算、社会维权指数的编制与计算,最后由加权平均算法计算得到维权综合指数的编制与计算。
10.如权利要求9所述的基于维权行为与维权方式的网购用户维权指数模型生成系统,其特征在于:文本识别模块中,判断平台商品评论数据是否为维权评论,具体为,
将获取的平台商品评论数据划分出训练文本与被试文本;
对训练文本进行评论维权词集的训练,从电商平台上获取不同类别商品的平台商品评论数据,然后进行分词、词性分析、情感分析、实体识别和关键词提取,得出特征向量,并形成适用与每一类目商品的评论维权词集库;
被试文本的特征向量计算,将被试文本数据录入后,同样要进行分词、词性分析、情感分析、实体识别和关键词提取,然后得出被试特征向量;
维权评论文本的判断,通过比较被试特征向量与评论维权词集库的特征向量,来计算任意商品网购用户评论是否属于维权性的评论文本;若评价实体与情感倾向相一致,表明被试网购用户评论属于维权性评论文本。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810238534.6A CN108389006A (zh) | 2018-03-21 | 2018-03-21 | 基于维权行为与维权方式的网购用户维权指数模型生成方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810238534.6A CN108389006A (zh) | 2018-03-21 | 2018-03-21 | 基于维权行为与维权方式的网购用户维权指数模型生成方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108389006A true CN108389006A (zh) | 2018-08-10 |
Family
ID=63067934
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810238534.6A Withdrawn CN108389006A (zh) | 2018-03-21 | 2018-03-21 | 基于维权行为与维权方式的网购用户维权指数模型生成方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108389006A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112115262A (zh) * | 2020-09-07 | 2020-12-22 | 上海晶确科技有限公司 | 网络评论数据收集与分析方法 |
CN113837784A (zh) * | 2020-06-24 | 2021-12-24 | 西安赋能区块链技术咨询服务有限公司 | 一种基于区块链智能合约的可信评价方法 |
CN114003954A (zh) * | 2021-11-02 | 2022-02-01 | 中国联合网络通信集团有限公司 | 用户评价管理方法、系统、计算机设备及存储介质 |
-
2018
- 2018-03-21 CN CN201810238534.6A patent/CN108389006A/zh not_active Withdrawn
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113837784A (zh) * | 2020-06-24 | 2021-12-24 | 西安赋能区块链技术咨询服务有限公司 | 一种基于区块链智能合约的可信评价方法 |
CN112115262A (zh) * | 2020-09-07 | 2020-12-22 | 上海晶确科技有限公司 | 网络评论数据收集与分析方法 |
CN114003954A (zh) * | 2021-11-02 | 2022-02-01 | 中国联合网络通信集团有限公司 | 用户评价管理方法、系统、计算机设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Majumder et al. | Perceived usefulness of online customer reviews: A review mining approach using machine learning & exploratory data analysis | |
Fan et al. | Product sales forecasting using online reviews and historical sales data: A method combining the Bass model and sentiment analysis | |
Kim et al. | Analyzing the discriminative attributes of products using text mining focused on cosmetic reviews | |
Cai et al. | Multimodal Data Guided Spatial Feature Fusion and Grouping Strategy for E‐Commerce Commodity Demand Forecasting | |
Chen et al. | Exploring determinants of attraction and helpfulness of online product review: A consumer behaviour perspective | |
Alsubari et al. | Fake reviews identification based on deep computational linguistic | |
CN108389006A (zh) | 基于维权行为与维权方式的网购用户维权指数模型生成方法及系统 | |
KR20210090035A (ko) | 온라인 쇼핑몰 관리 시스템 및 방법 | |
Karthik et al. | A recommendation system for online purchase using feature and product ranking | |
Lee et al. | A hybrid collaborative filtering-based product recommender system using search keywords | |
Xu et al. | Potential buyer identification and purchase likelihood quantification by mining user-generated content on social media | |
Lee et al. | A Study on Customer Satisfaction Analysis of Public Institutions using Social Textmining | |
Kausar et al. | Sentiment Classification based on Machine Learning Approaches in Amazon Product Reviews | |
Chkoniya | Challenges in decoding consumer behavior with data science | |
Zhang et al. | Describe the house and I will tell you the price: House price prediction with textual description data | |
Shou et al. | Predictions on usefulness and popularity of online reviews: evidence from mobile phones for older adults | |
CN108428156A (zh) | 网购用户买假指数模型的生成方法及系统 | |
Sultan | Sentiment Analysis of Amazon Product Reviews using Supervised Machine Learning Techniques. | |
Kaur et al. | Multi-layered sentiment analytical model for product review mining | |
Thorleuchter et al. | Using Webcrawling of Publicly Available Websites to Assess E-commerce Relationships | |
Reddy et al. | Classification of Hotel Reviews using Machine Learning Techniques | |
Pinto et al. | Hybrid recommendation system based on collaborative filtering and fuzzy numbers | |
Zhang et al. | Research on factors influencing the consumer repurchase intention: Data mining of consumers’ online reviews based on machine learning | |
Wikamulia et al. | Predictive business intelligence dashboard for food and beverage business | |
KR20210126473A (ko) | 소비 데이터와 소셜 데이터를 이용한 소비동향 예측 지수 생성 방법과 이를 적용한 소비동향 예측 지수 생성 시스템 및 이를 위한 컴퓨터 프로그램 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20180810 |
|
WW01 | Invention patent application withdrawn after publication |