CN108389006A - 基于维权行为与维权方式的网购用户维权指数模型生成方法及系统 - Google Patents

基于维权行为与维权方式的网购用户维权指数模型生成方法及系统 Download PDF

Info

Publication number
CN108389006A
CN108389006A CN201810238534.6A CN201810238534A CN108389006A CN 108389006 A CN108389006 A CN 108389006A CN 201810238534 A CN201810238534 A CN 201810238534A CN 108389006 A CN108389006 A CN 108389006A
Authority
CN
China
Prior art keywords
safeguarding
comment
net purchase
platform
purchase user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201810238534.6A
Other languages
English (en)
Inventor
陈瑞义
江烨
钱鹏程
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Post and Telecommunication University
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing Post and Telecommunication University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Post and Telecommunication University filed Critical Nanjing Post and Telecommunication University
Priority to CN201810238534.6A priority Critical patent/CN108389006A/zh
Publication of CN108389006A publication Critical patent/CN108389006A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Educational Administration (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种基于维权行为与维权方式的网购用户维权指数模型生成方法及系统,通过平台文本数据的获取;维权评论文本识别,对获取的平台文本数据进行文本分析,包括平台商品评论数据、平台商品投诉数据以及线下商品投诉数据,分类判断出网购用户的平台文本数据是否为维权评论,并采用自然语言处理中的余弦计算相似度度量算法来识别平台文本数据中总的网购用户进行维权的数量Nbase;生成网购用户维权指数模型;该方法所生成的网购用户维权指数模型的计算数据易获取,模型输出结果唯一、较为稳定,且可动态实时监测与预测某段时间内,特定商品、特定消费群体的进行网络消费后可能产生的维权行为与维权方式选择随时间动态变化的整体发展状态。

Description

基于维权行为与维权方式的网购用户维权指数模型生成方法 及系统
技术领域
本发明涉及一种基于维权行为与维权方式的网购用户维权指数模型生成方法及系统。
背景技术
据相关搜索与比对发现,现有的网购用户大指数设计与编制技术包括:
一、由青岛市工商局创立的,于2011年9月23日首发的消费者维权指数。其数据主要来源于该市局12315投诉举报指挥中心受理的消费者投诉举报案件数据,重点关注的是八大重点商品的维权案件数量和涉案金额的统计分析。
二、由国家工商行政管理总局消保局、中国消费者协会和各地消协的支持下,中国消费网与阿里巴巴合作,利用阿里巴巴的网络零售市场数据,编制的一个反映网络消费者的喜怒哀乐情绪变化、消费心理变化与电商消费环境的维权指数。
需要注意的是,国家工商行政管理总局构建的维权指数的构建是从维权情绪的视角来构建维权指数的,并非直接从网格用户维权行为的视角来构建相关指数。目前尚未有针对网购用户进行维权行为与维权方式的变化监测与预测的公开文献。
发明内容
本发明的目的是提供一种基于维权行为与维权方式的网购用户维权指数模型生成方法及系统,解决现有技术中存在的如何监测与预测网购用户面临网络消费维权事件时维权方式与方式选择类型、频率和规模随时间变化的发生与发展趋势的问题。
本发明的技术解决方案是:
一种基于维权行为与维权方式的网购用户维权指数模型生成方法,包括以下步骤,
S1、平台文本数据的获取,采集平台文本数据,包括平台商品评论数据、平台商品投诉数据以及线下商品投诉数据;
S2、维权评论文本识别,对步骤S1获取的平台文本数据进行文本分析,包括平台商品评论数据、平台商品投诉数据以及线下商品投诉数据,分类判断出网购用户的平台文本数据是否为维权评论,并采用自然语言处理中的余弦计算相似度度量算法来识别平台文本数据中总的网购用户进行维权的数量Nbase
S3、生成三个网购用户维权子指数模型,包括评论维权指数的编制与计算、投诉维权指数的编制与计算、社会维权指数的编制与计算。
S4、生成网购用户维权综合指数模型,在网购用户维权行为子指数模型生成的基础上,编制与计算网购用户维权综合指数模型。
进一步地,步骤S2中,判断平台商品评论数据是否为维权评论,具体为,
S21、将获取的平台商品评论数据划分出训练文本与被试文本;
S22、对训练文本进行评论维权词集的训练,从电商平台上获取不同类别商品的平台商品评论数据,然后进行分词、词性分析、情感分析、实体识别和关键词提取,得出特征向量,并形成适用与每一类目商品的评论维权词集库;
S23、被试文本的特征向量计算,将被试文本数据录入后,同样要进行分词、词性分析、情感分析、实体识别和关键词提取,然后得出被试特征向量;
S24、维权评论的判断,通过比较被试特征向量与评论维权词集库的特征向量,来计算任意商品网购用户评论是否属于维权性的评论文本;若评价实体与情感倾向相一致,表明被试网购用户评论属于维权性评论文本。
进一步地,步骤S3中,评论维权指数为采用评论维权方式进行维权的用户数量与总的网购维权用户数量的比值,具体计算公式为:
其中,分别是t期的网购用户采用评论方式进行维权的比例和基期网购用户采用评论方式进行维权的比例,分别为t期和基期网购用户采用评论方式进行维权的用户数量,Nt和Nbase分别为t期和基期总的网购用户进行维权的数量。
进一步地,步骤S3中,投诉维权指数为采用平台投诉方式进行维权的用户数量与总的网购维权用户数量的比值,具体计算公式为:
其中,分别是t期的网购用户采用平台投诉方式的维权比例和基期网购用户采用平台投诉方式维权比例,分别为t期和基期网购用户采用平台投诉方式进行维权的用户数量,Nt和Nbase分别为t期和基期总的网购用户进行维权的数量。
进一步地,步骤S3中,社会维权指数为采用线下投诉的方式的网购用户数量与总的网购维权用户数量的比值,具体计算公式为:
其中,分别是t期的网购用户采用社会投诉方式的维权比例和基期网购用户采用社会投诉方式维权比例,分别为t期和基期网购用户采用社会投诉方式进行维权的用户数量,Mt和Mbase分别为t期和基期总的网购用户社会投诉方式进行维权的数量。
进一步地,步骤S4中,网购维权综合指数等于评论维权指数、投诉维权指数和社会维权指数的加权平均值,具体计算公式为:
其中,分别是t期的网购用户评论维权指数、投诉维权指数和社会维权指数,分别是t期的网购用户评论维权行为比例、投诉维权行为比例和社会维权行为比例。
在步骤S1中,还获取网购用户基础信息,包括ID、年龄、网购平台名称、商品收货地址。
进一步地,步骤S2中,将平台商品评论数据依据步骤S2判断出属于维权评论文本,与网购用户基础信息进行对应显示。
一种采用上述任一项所述基于维权行为与维权方式的网购用户维权指数模型生成方法的基于维权行为与维权方式的网购用户维权指数模型生成系统,包括以下步骤,
数据采集模块:进行平台文本数据的获取,采集平台文本数据,包括平台商品评论数据、平台商品投诉数据以及线下商品投诉数据;
文本识别模块:进行维权评论文本识别,对步骤S1获取的平台文本数据进行文本分析,包括平台商品评论数据、平台商品投诉数据以及线下商品投诉数据,分类判断出网购用户的平台文本数据是否为维权评论,并采用自然语言处理中的余弦计算相似度度量算法来识别平台文本数据中总的网购用户进行维权的数量Nbase
模型生成模块:生成网购用户维权子指数模型,包括评论维权指数的编制与计算、投诉维权指数的编制与计算、社会维权指数的编制与计算,最后由加权平均算法计算得到维权综合指数的编制与计算。
进一步地,文本识别模块中,判断平台商品评论数据是否为维权评论,具体为,
将获取的平台商品评论数据划分出训练文本与被试文本;
对训练文本进行评论维权词集的训练,从电商平台上获取不同类别商品的平台商品评论数据,然后进行分词、词性分析、情感分析、实体识别和关键词提取,得出特征向量,并形成适用与每一类目商品的评论维权词集库;
被试文本的特征向量计算,将被试文本数据录入后,同样要进行分词、词性分析、情感分析、实体识别和关键词提取,然后得出被试特征向量;
维权评论文本的判断,通过比较被试特征向量与评论维权词集库的特征向量,来计算任意商品网购用户评论是否属于维权性的评论文本;若评价实体与情感倾向相一致,表明被试网购用户评论属于维权性评论文本。
本发明的有益效果是:该种基于维权行为与维权方式的网购用户维权指数模型生成方法及系统,所生成的网购用户维权指数模型的计算数据易获取,模型输出结果唯一、较为稳定,且可动态实时监测与预测某段时间内,特定商品、特定消费群体的进行网络消费后可能产生的维权行为与维权方式选择随时间动态变化的整体发展状态。可用于网络电商企业的平台注册用户消费维权行为检测、风险评估与态势预测,也可用于政府职能部门的特定时间、特定地区与特定消费商品的网络消费宏观状态的监测与预测。
附图说明
图1是本发明实施例基于维权行为与维权方式的网购用户维权指数模型生成方法的流程示意图。
图2是实施例中维权评论文本识别流程示意图。
图3是实施例中维权评论词性分析的示意图。
图4是实施例中维权评论情感分析的示意图。
图5是实施例中维权评论自动摘要的示意图。
图6是实施例中网购用户维权指数指标体系的说明示意图。
图7是实施例中网购商品类目表的示意图。
具体实施方式
下面结合附图详细说明本发明的优选实施例。
实施例
实施例中,网购用户维权指数模型是一个能综合反映不同平台、不同地区、不同商品类目、不同人群的消费者维权行为与方式选择随时间变化的模型。其重点关注的是网购用户维权行为与维权方式的时空变化,即重点监测与预测网购用户面临网络消费维权事件时维权行为与方式选择类型、频率和规模随时间变化的发生与发展趋势。
实施例中,所构建的网购用户维权指数模型针对的是,网购用户维权行为与维权方式的变化监测与预测,这些维权行为与方式包括平台评论维权方式、平台投诉维权方式与社会维权方式。其中:平台评论维权是指消费者面临网络消费维权事件时,通过公开的商品评论栏,给予某商家某商品负面评论的维权方式。平台投诉维权是指消费者面临维权事件时,采用退换货申诉或直接向平台客服投诉的方式来维护自身权益的维权方式。社会维权水平是指消费者通过向当地消费者权益保护协会或政府职能部门投诉或控告的方式来维护自身合法权益。
一种基于维权行为与维权方式的网购用户维权指数模型生成方法,如图1,包括以下步骤,
S1、平台文本数据的获取,采集平台文本数据,包括平台商品评论数据、平台商品投诉数据以及线下商品投诉数据;
S2、维权评论文本识别,对步骤S1获取的平台文本数据进行文本分析,包括平台商品评论数据、平台商品投诉数据以及线下商品投诉数据,分类判断出网购用户的平台文本数据是否为维权评论,并采用自然语言处理中的余弦计算相似度度量算法来识别平台文本数据中总的网购用户进行维权的数量Nbase
步骤S2中,判断平台商品评论数据是否为维权评论,具体为,
S21、将获取的平台商品评论数据划分出训练文本与被试文本;
S22、对训练文本进行评论维权词集的训练,从电商平台上获取不同类别商品的平台商品评论数据,然后进行分词、词性分析、情感分析、实体识别和关键词提取,得出特征向量,并形成适用与每一类目商品的评论维权词集库;
S23、被试文本的特征向量计算,将被试文本数据录入后,同样要进行分词、词性分析、情感分析、实体识别和关键词提取,然后得出被试特征向量;
S24、维权评论的判断,通过比较被试特征向量与评论维权词集库的特征向量,来计算任意商品网购用户评论是否属于维权性的评论文本;若评价实体与情感倾向相一致,表明被试网购用户评论属于维权性评论文本。这里的相似性算法有很多,最简单的是余弦相似度算法。对应一些复制的评论文本而言,其维权性评论文本判断需要借助一些机器学习算法。如Rocchio算法、朴素贝叶斯分类算法、K-近邻算法、决策树算法、神经网络算法和支持向量机算法。
为更加直观说明这样的维权评论文本识别过程:
实施例摘取一段淘宝上一个牙膏商品的江苏网购用户评论信息,该信息是:“只是为了卖家别来骚扰我,给的中评,和我之前买的相当不一样,本人认为这家店的植雅牙膏不是正品,再也不相信网上卖的植雅了,一个三十几块钱的牙膏还要作假,真不知道那些说是正品的是怎么看的,整个包装颜色都比我之前买的要淡很多,这个连卫生许可标志都没有,我之前买的就有。这个的生产许可证号和我之前买的也不一样,牙膏打开来还有一点点水,还是应该相信之前那些给差评的人的。本来想退货的,但因为拆了,卖家说影响二次销售,只能退一半钱,那我还不如不退,留着刷鞋也比退给他强。望之后想要买的人谨慎再谨慎!如果你在乎真假就别买,如果你无所谓真假可以买。”。
对该信息得到如下词性分析结果,如图3所示。
其次由该文本的情感倾向性计算结果可知,该网购用户的评论为负面评论,属于一类维权性质评论,如图4所示。
最后,获取该文本的自动摘要“和我之前买的相当不一样,本人认为这家店的植雅牙膏不是正品,”、“我之前买的就有。这个的生产许可证号和我之前买的也不一样,”、“卖家说影响二次销售”。由该文本的自动摘要计算结果可知,该用户面临购买到假冒化妆品纠纷文本,并采用平台用户评论的方式进行维权,如图5所示。
关于投诉维权指数与社会维权指数的计算,因存在结构化统计数据,相关指数的计算不需要这种深度的文本分析,也可以计算出。其中,平台商品投诉数据和线下商品投诉数据,因是投诉内容,均为维权评论。
S3、生成三个网购用户维权子指数模型,包括评论维权指数的编制与计算、投诉维权指数的编制与计算、社会维权指数的编制与计算。
步骤S3中,评论维权指数为采用评论维权方式进行维权的用户数量与总的网购维权用户数量的比值,具体计算公式为:
其中,分别是t期的网购用户采用评论方式进行维权的比例和基期网购用户采用评论方式进行维权的比例,分别为t期和基期网购用户采用评论方式进行维权的用户数量,Nt和Nbase分别为t期和基期总的网购用户进行维权的数量。
步骤S3中,投诉维权指数为采用平台投诉方式进行维权的用户数量与总的网购维权用户数量的比值,具体计算公式为:
其中,分别是t期的网购用户采用平台投诉方式的维权比例和基期网购用户采用平台投诉方式维权比例,分别为t期和基期网购用户采用平台投诉方式进行维权的用户数量,Nt和Nbase分别为t期和基期总的网购用户进行维权的数量。
步骤S3中,社会维权指数为采用线下投诉的方式的网购用户数量与总的网购维权用户数量的比值,具体计算公式为:
其中,分别是t期的网购用户采用社会投诉方式的维权比例和基期网购用户采用社会投诉方式维权比例,分别为t期和基期网购用户采用社会投诉方式进行维权的用户数量,Mt和Mbase分别为t期和基期总的网购用户社会投诉方式进行维权的数量。
S4、生成网购用户维权综合指数模型,在网购用户维权行为子指数模型生成的基础上,编制与计算网购用户维权综合指数模型。
步骤S4中,网购维权综合指数等于评论维权指数、投诉维权指数和社会维权指数的加权平均值,具体计算公式为:
其中,分别是t期的网购用户评论维权指数、投诉维权指数和社会维权指数,分别是t期的网购用户评论维权行为比例、投诉维权行为比例和社会维权行为比例。
在步骤S1中,还获取网购用户基础信息,包括ID、年龄、网购平台名称和商品收货地址。
步骤S2中,将平台商品评论数据依据步骤S2判断出属于维权评论文本,与网购用户基础信息进行对应显示。
实施例中,网购用户维权指数模型首先划分为平台评论维权、平台投诉维权和社会维权三个二级指标,其中每个二级指标又划为总指数和分组指数,且可从地区归属、平台归属、类目归属和人群归属这四个横向指标进行交叉,具体内容如图6所示。其中分指数和总指数是相对而言的,其主要是指明按什么分类维度进行划分,而总指数仅仅是其分指数的累加平均。例如,模型计算的输入数据,经地区标签识别后,都指向用户的商品收货地址都是来自某个相同地区i,并按步骤S1、S2、S3及其他们的分步骤分别计算出来维权行为指数Ai,即为i地区网购用户维权指数。通过上述多个地区的Ai指数累加平均数学计算,即计算出来所有地区维权行为总指数A。诸如此类,按平台归属、商品类目归属和用户人群归属所定义的分指数和总指数的关系的计算逻辑也是相同的。
需要注意的是,地区归属,是按国家省、市、县地区区域划分,划分到县一级;平台归属划分,是按照苏宁、京东和阿里等平台企业名称进行划分,商品类目归属是按照国家工商局给出的商品类目以及几个电商平台的商品类目进行修正之后得到的划分标准,如图7;人群归属划分,主要是从用户的年龄和性别两个维度进行划分。
关于网购用户维权行为指数模型设计与编制技术最大的难点在于相关维权行为指标选择、细化、具体化与具体子指标的计算模型设计与编制。实施例针对这些技术难点,给出各指标设计与详细计算模型,解决了具体子指标与总指数计算的技术难点。
一种采用上述任一项所述基于维权行为与维权方式的网购用户维权指数模型生成方法的基于维权行为与维权方式的网购用户维权指数模型生成系统,包括以下步骤,
数据采集模块:进行平台文本数据的获取,采集平台文本数据,包括平台商品评论数据、平台商品投诉数据以及线下商品投诉数据;
文本识别模块:进行维权评论文本识别,对步骤S1获取的平台文本数据进行文本分析,包括平台商品评论数据、平台商品投诉数据以及线下商品投诉数据,分类判断出网购用户的平台文本数据是否为维权评论,并采用自然语言处理中的余弦计算相似度度量算法来识别平台文本数据中总的网购用户进行维权的数量Nbase
模型生成模块:生成网购用户维权子指数模型,包括评论维权指数的编制与计算、投诉维权指数的编制与计算、社会维权指数的编制与计算,最后由加权平均算法计算得到维权综合指数的编制与计算。
本识别模块中,判断平台商品评论数据是否为维权评论,具体为,
将获取的平台商品评论数据划分出训练文本与被试文本;
对训练文本进行评论维权词集的训练,从电商平台上获取不同类别商品的平台商品评论数据,然后进行分词、词性分析、情感分析、实体识别和关键词提取,得出特征向量,并形成适用与每一类目商品的评论维权词集库;
被试文本的特征向量计算,将被试文本数据录入后,同样要进行分词、词性分析、情感分析、实体识别和关键词提取,然后得出被试特征向量;
维权评论文本的判断,通过比较被试特征向量与评论维权词集库的特征向量,来计算任意商品网购用户评论是否属于维权性的评论文本;若评价实体与情感倾向相一致,表明被试网购用户评论属于维权性评论文本。
该种基于维权行为与维权方式的网购用户维权指数模型生成方法及系统,所生成的网购用户维权指数模型的计算数据易获取,模型输出结果唯一、较为稳定,且可动态实时监测与预测某段时间内,特定商品、特定消费群体的进行网络消费后可能产生的维权行为与维权方式选择随时间动态变化的整体发展状态。可用于网络电商企业的平台注册用户消费维权行为检测、风险评估与态势预测,也可用于政府职能部门的特定时间、特定地区与特定消费商品的网络消费宏观状态的监测与预测。

Claims (10)

1.一种基于维权行为与维权方式的网购用户维权指数模型生成方法,其特征在于:包括以下步骤,
S1、平台文本数据的获取,采集平台文本数据,包括平台商品评论数据、平台商品投诉数据以及线下商品投诉数据;
S2、维权评论文本识别,对步骤S1获取的平台文本数据进行文本分析,包括平台商品评论数据、平台商品投诉数据以及线下商品投诉数据,分类判断出网购用户的平台文本数据是否为维权评论,并采用自然语言处理中的余弦计算相似度度量算法来识别平台文本数据中总的网购用户进行维权的数量Nbase
S3、生成三个网购用户维权子指数模型,包括评论维权指数的编制与计算、投诉维权指数的编制与计算、社会维权指数的编制与计算。
S4、生成网购用户维权综合指数模型,在网购用户维权行为子指数模型生成的基础上,编制与计算网购用户维权综合指数模型。
2.如权利要求1所述的基于维权行为与维权方式的网购用户维权指数模型生成方法,其特征在于:步骤S2中,判断平台商品评论数据是否为维权评论,具体为,
S21、将获取的平台商品评论数据划分出训练文本与被试文本;
S22、对训练文本进行评论维权词集的训练,从电商平台上获取不同类别商品的平台商品评论数据,然后进行分词、词性分析、情感分析、实体识别和关键词提取,得出特征向量,并形成适用与每一类目商品的评论维权词集库;
S23、被试文本的特征向量计算,将被试文本数据录入后,同样要进行分词、词性分析、情感分析、实体识别和关键词提取,然后得出被试特征向量;
S24、维权评论文本的判断,通过比较被试特征向量与评论维权词集库的特征向量,来计算任意商品网购用户评论是否属于维权性的评论文本;若评价实体与情感倾向相一致,表明被试网购用户评论属于维权性评论文本。
3.如权利要求1所述的基于维权行为与维权方式的网购用户维权指数模型生成方法,其特征在于:步骤S3中,评论维权指数为采用评论维权方式进行维权的用户数量与总的网购维权用户数量的比值,具体计算公式为:
其中,分别是t期的网购用户采用评论方式进行维权的比例和基期网购用户采用评论方式进行维权的比例,分别为t期和基期网购用户采用评论方式进行维权的用户数量,Nt和Nbase分别为t期和基期总的网购用户进行维权的数量。
4.如权利要求3所述的基于维权行为与维权方式的网购用户维权指数模型生成方法,其特征在于:步骤S3中,投诉维权指数为采用平台投诉方式进行维权的用户数量与总的网购维权用户数量的比值,具体计算公式为:
其中,分别是t期的网购用户采用平台投诉方式的维权比例和基期网购用户采用平台投诉方式维权比例,分别为t期和基期网购用户采用平台投诉方式进行维权的用户数量,Nt和Nbase分别为t期和基期总的网购用户进行维权的数量。
5.如权利要求4所述的基于维权行为与维权方式的网购用户维权指数模型生成方法,其特征在于:步骤S3中,社会维权指数为采用线下投诉的方式的网购用户数量与总的网购维权用户数量的比值,具体计算公式为:
其中,分别是t期的网购用户采用社会投诉方式的维权比例和基期网购用户采用社会投诉方式维权比例,分别为t期和基期网购用户采用社会投诉方式进行维权的用户数量,Mt和Mbase分别为t期和基期总的网购用户社会投诉方式进行维权的数量。
6.如权利要求4所述的基于维权行为与维权方式的网购用户维权指数模型生成方法,其特征在于:步骤S4中,网购维权综合指数等于评论维权指数、投诉维权指数和社会维权指数的加权平均值,具体计算公式为:
其中,分别是t期的网购用户评论维权指数、投诉维权指数和社会维权指数,分别是t期的网购用户评论维权行为比例、投诉维权行为比例和社会维权行为比例。
7.如权利要求1所述的基于维权行为与维权方式的网购用户维权指数模型生成方法,其特征在于:在步骤S1中,还获取网购用户基础信息,包括ID、年龄、网购平台名称、商品收货地址。
8.如权利要求7所述的基于维权行为与维权方式的网购用户维权指数模型生成方法,其特征在于:步骤S2中,将平台商品评论数据依据步骤S2判断出属于维权评论文本,与网购用户基础信息进行对应显示。
9.一种采用1-8任一项所述基于维权行为与维权方式的网购用户维权指数模型生成方法的基于维权行为与维权方式的网购用户维权指数模型生成系统,其特征在于:包括以下步骤,
数据采集模块:进行平台文本数据的获取,采集平台文本数据,包括平台商品评论数据、平台商品投诉数据以及线下商品投诉数据;
文本识别模块:进行维权评论文本识别,对步骤S1获取的平台文本数据进行文本分析,包括平台商品评论数据、平台商品投诉数据以及线下商品投诉数据,分类判断出网购用户的平台文本数据是否为维权评论,并采用自然语言处理中的余弦计算相似度度量算法来识别平台文本数据中总的网购用户进行维权的数量Nbase
模型生成模块:生成网购用户维权子指数模型,包括评论维权指数的编制与计算、投诉维权指数的编制与计算、社会维权指数的编制与计算,最后由加权平均算法计算得到维权综合指数的编制与计算。
10.如权利要求9所述的基于维权行为与维权方式的网购用户维权指数模型生成系统,其特征在于:文本识别模块中,判断平台商品评论数据是否为维权评论,具体为,
将获取的平台商品评论数据划分出训练文本与被试文本;
对训练文本进行评论维权词集的训练,从电商平台上获取不同类别商品的平台商品评论数据,然后进行分词、词性分析、情感分析、实体识别和关键词提取,得出特征向量,并形成适用与每一类目商品的评论维权词集库;
被试文本的特征向量计算,将被试文本数据录入后,同样要进行分词、词性分析、情感分析、实体识别和关键词提取,然后得出被试特征向量;
维权评论文本的判断,通过比较被试特征向量与评论维权词集库的特征向量,来计算任意商品网购用户评论是否属于维权性的评论文本;若评价实体与情感倾向相一致,表明被试网购用户评论属于维权性评论文本。
CN201810238534.6A 2018-03-21 2018-03-21 基于维权行为与维权方式的网购用户维权指数模型生成方法及系统 Withdrawn CN108389006A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810238534.6A CN108389006A (zh) 2018-03-21 2018-03-21 基于维权行为与维权方式的网购用户维权指数模型生成方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810238534.6A CN108389006A (zh) 2018-03-21 2018-03-21 基于维权行为与维权方式的网购用户维权指数模型生成方法及系统

Publications (1)

Publication Number Publication Date
CN108389006A true CN108389006A (zh) 2018-08-10

Family

ID=63067934

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810238534.6A Withdrawn CN108389006A (zh) 2018-03-21 2018-03-21 基于维权行为与维权方式的网购用户维权指数模型生成方法及系统

Country Status (1)

Country Link
CN (1) CN108389006A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112115262A (zh) * 2020-09-07 2020-12-22 上海晶确科技有限公司 网络评论数据收集与分析方法
CN113837784A (zh) * 2020-06-24 2021-12-24 西安赋能区块链技术咨询服务有限公司 一种基于区块链智能合约的可信评价方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113837784A (zh) * 2020-06-24 2021-12-24 西安赋能区块链技术咨询服务有限公司 一种基于区块链智能合约的可信评价方法
CN112115262A (zh) * 2020-09-07 2020-12-22 上海晶确科技有限公司 网络评论数据收集与分析方法

Similar Documents

Publication Publication Date Title
Kim et al. Analyzing the discriminative attributes of products using text mining focused on cosmetic reviews
CN107977798B (zh) 一种电子商务产品质量的风险评价方法
RU2012127407A (ru) Система, устройство и способы использования вероятностных технологий при определении тенденции, составлении профиля и основанных на шаблонах предсказаний поведения пользователя с целью предложения рекомендаций
KR20140053444A (ko) 시장규모예측장치, 시장규모예측방법 및 시장규모를 예측하는 프로그램을 저장하는 저장매체
KR20210090035A (ko) 온라인 쇼핑몰 관리 시스템 및 방법
CN108389006A (zh) 基于维权行为与维权方式的网购用户维权指数模型生成方法及系统
Loukili et al. Sentiment Analysis of Product Reviews for E-Commerce Recommendation based on Machine Learning.
Yoon et al. A big data based cosmetic recommendation algorithm
Kantha et al. Analyzing the growing factor of Financial Markets Using Sentimental Analysis Algorithms
CN112214663A (zh) 获取舆情声量的方法、系统、装置、存储介质及移动终端
KR20150144916A (ko) 소비자 프로파일링을 통한 맞춤형 쇼핑정보 제공 시스템 및 방법
Chang et al. Fashion trend forecasting using machine learning techniques: a review
CN108681912A (zh) 网购用户大指数模型的生成方法及系统
Li et al. Impact of data-driven online financial consumption on supply chain services
Park et al. Relations between reputation and social media marketing communication in cryptocurrency markets: Visual analytics using Tableau
OH Determinants of online review helpfulness for Korean skincare products in online retailing
Kim et al. Do SEC filings indicate any trends? Evidence from the sentiment distribution of forms 10-K and 10-Q with FinBERT
Reddy et al. Classification of Hotel Reviews using Machine Learning Techniques
Kikuchi et al. Gathering user reviews for an opinion dictionary
Chen et al. Phrase-based topic and sentiment detection and tracking model using incremental HDP
Pinelli et al. Social news aggregations and the Bitcoin: mapping their correlation through the three dimensions of content, sentiment and time
Putatunda et al. A BERT based Ensemble Approach for Sentiment Classification of Customer Reviews and its Application to Nudge Marketing in e-Commerce
MAZAN et al. Examining eWOM reviews of the hotel enterprises on Tripadvisor: The case of Usak province
Wang et al. Building High Usability Consumer-oriented Linked Data Mobile Apps.
Ko et al. Suspicious online product reviews: An empirical analysis of brand and product characteristics using Amazon data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20180810

WW01 Invention patent application withdrawn after publication