CN107944761A - 基于人工智能消费维权指数企业投诉预警监测分析方法 - Google Patents
基于人工智能消费维权指数企业投诉预警监测分析方法 Download PDFInfo
- Publication number
- CN107944761A CN107944761A CN201711361299.3A CN201711361299A CN107944761A CN 107944761 A CN107944761 A CN 107944761A CN 201711361299 A CN201711361299 A CN 201711361299A CN 107944761 A CN107944761 A CN 107944761A
- Authority
- CN
- China
- Prior art keywords
- mrow
- msub
- mtd
- data
- early warning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/01—Customer relationship services
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Educational Administration (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Finance (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Accounting & Taxation (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种基于人工智能消费维权指数企业投诉预警监测分析方法,包括如下步骤:步骤1)包括数据采集模块,利用所述数据采集模块获取12345热线的工单内容;步骤2)对将步骤1)建立分类模块,通过步骤1)数据采集模块采集的12345热线按照工单内容,按照关键字通过嵌入式分类模块进行分类,得到二级指标,以及重要等级进行分组分类;步骤3)专家评分模型建立计算二级指标的得分率,包括如下:步骤4)构建SVM分类器;步骤5)构建训练分类模型;步骤6)构建分类梳理模块,对工单数据进行业务分类梳理;步骤7)构建监测模块,该构建监测模块用于指数与业务数据结合的企业投诉预警监测分析。
Description
技术领域
本发明涉及消费维权指数计算技术,具体涉及一种基于人工智能消费维权指数企业投诉预警监测分析方法,该方法主要应用于政府维稳监控系统、投诉举报数据分析研判系统、12345政务服务热线系统、公安系统、工商局系统、企业征信系统。
背景技术
工商行政管理机关12345政务服务热线中心直接面对广大消费者,贴近人民群众,贴近市场,每天都会产生大量数据信息(工单:对象,事件,时间,涉及单位)。这些数据信息是广大消费者对当下市场存在问题的实时反馈,能够及时、准确地反映消费热点的变化特点和规律,反映市场主体诚信经营状况、商品和服务质量状况,以及市场公平交易秩序状况,是市场监管质量的“温度计”、“晴雨表”,更是评价工商行政管理机关市场监管成效的“主考官”。
因此,用消费维权指数来体现市场总体情况,结合维权指数和工单业务内容,建立企业投诉预警检测分析,坚持用数据说话,对于指导相关部门执法的针对性、时效性,维护社会稳定有重大意义。
消费维权指数可以某一时期确立为“基期”,选择服装鞋帽、美容美发、家居用品、家用电器及计算机产品、通讯器材类、交通工具、农业生产资料、网络交易这八大重点商品和服务作为监测领域,计算得出消费者投诉举报的商品和服务涉案总金额,然后建立数学模型:消费维权指数=当月八大类别商品或服务各涉案金额除以基期(某一时期)同类商品或服务涉案总金额乘以100。
缺点1,仅仅考虑了涉案金额为唯一指标,计算结果往往会被某涉案金额高的数据影响,缺少了其他方面的考虑:立案比例、涉及人员人数、投诉人比例、异常企业投诉比例等等;
缺点2,由于涉及的数据量巨大,新增了多个数据维度,给人工计算带来了若干困难。
缺点3,该指标仅仅是体现某一区域的整体消费市场运行健康情况,无法针对性的给予执法人员详细的执法建议。
所以本发明是为了解决以上算法的缺点,将消费维权指数体系涉及的其他维度纳入计算范围,运用大数据分类算法、专家评分模型保证结果的准确和科学,同时在计算消费维权指数计算的基础上,结合工单业务数据,以企业为分析对象,建立企业投诉预警检测分析模型,为执法部门靶向治理提供决策辅助。
发明内容
有鉴于此,本发明的主要目的是提供一种基于人工智能消费维权指数企业投诉预警监测分析方法。
具体的方案如下:
基于人工智能消费维权指数企业投诉预警监测分析方法,包括如下步骤:
步骤1)包括数据采集模块,利用所述数据采集模块获取12345热线的工单内容;
步骤2)对将步骤1)建立分类模块,通过步骤1)数据采集模块采集的12345热线按照工单内容,按照关键字通过嵌入式分类模块进行分类,得到二级指标,以及重要等级进行分组分类;
步骤3)专家评分模型建立计算二级指标的得分率,包括如下:
S1:专家评分模型建立;
S2:指标得分率计算;
S3:数据集获取模块的建立:构建所设定项目的多维向量,通过向量得到投诉工单的评分情况,计算所有投诉工单评分情况向量,构成全体数据集;
S4:根据数据集获取模块得到的全体数据集,得到训练数据集,由训练数据集获取等分率;
步骤4)构建SVM分类器;
步骤5)构建训练分类模型;
步骤6)构建分类梳理模块,对工单数据进行业务分类梳理;
步骤7)构建监测模块,该构建监测模块用于指数与业务数据结合的企业投诉预警监测分析。
作为一种优选,步骤3)中S1步骤的具体评分方法及对评分的处理如下:
对数量和时间答案的处理如下表述:
式中为评价结果,p为正整数,n为专家数,专家评分值从大到小排列,则Xp+1公式表示奇数个专家评分的中位数,(Xp+Xp+1)/2表示偶数个专家评分的中位数。
作为一种优选,步骤3)中步骤S2指标得分率计算的具体步骤如下:
设消费维权指数有m个评价领域,有n个专家参与评价,设某一专家k给出的评分值集合为{Xi(j)}(k),式中{Xi(j)}(k)表示第k=1,2,···,n个专家对第i(i=1,2,···,n)领域的评分序分值,其值为j(j=1,2,···,m);根据 可将序分值集合转化为基分值集合{Bi(j)}(k),其中
根据可将序分值集合转化为基分值集合{Bi(j)}(k),其中{Bi(j)}(k)表示第k个专家对第i个领域排在第j位时所对应的基数分值。然后,用下述公式计算每个研究领域的重要程度:
在(2)以及(3)式中,m在(2)以及(3)式中,m表示领域数;Si表示i领域得分值;n表示专家数;Bi(j)表示i领域排在j位得分值;Ni表示赞同某一领域排在第j位的人
作为一种优选,步骤3)中步骤S3数据集获取模块的建立具体包括:将s2中计算得到的所有m个项目得分率Si组合成一个m维的向量x=[a1,a2,…,am],该向量即表示一个投诉工单的评分情况,计算所有投诉工单评分情况向量,构成全体数据集Z={zn,n∈R}。
作为一种优选,步骤3)中步骤S4根据数据集获取模块得到的全体数据集具体包括:对步骤s3获取的全体数据集Z中的数据进行标号分类,所有高得分率工单标注为1,非高得分率工单标注为-1;并将标注结果后全体数据集中随机取出的60-80%数据组合构成训练数据集Strain={(zn,yn)|zn∈Z,zn∈{-1,1},n=1,2,3…}其中zn为第n个工单的得分率向量,yn为对应第n个工单的得分率结果,其余20-40%作为测试数据集Stest={(zm,ym)|zm∈Z,ym∈{-1,1},m=1,2,3…}其中zm为第m个工单的得分率向量,ym为对应第m个工单的得分率结果。
作为一种优选,步骤4)具体步骤如下:
S1:设给定的训练集为{(z1,y1),(z2,y2),…,(zn,yn)}其中zi∈Rn为输入向量,yi∈{-1,1}为输出向量,假设该训练集可被一个超平面W·Z+b=0线性划分,问题转化为求最优化超平面问题:
S2:对于非线性可分的情况,可以通过一个映射函数(在SVM称核函数),将低维的输入空间Rn映射到高维的特征空间H,使线性可分;则优化问题转化为
S3:解出式(2)最优化函数为:
从式(2)最小化问题可以得出,选择合适的函数K(·)和C即可以确定SVM分类器;
S4:选用RBF径向基核函数,即K(Zi,Zj)=exp(-γ||Zi-Zj||)2,则分类器的优化问题最终转化为参数对(C,Υ)的选择问题。
作为一种优选,步骤5)具体步骤如下:
S1.以1≤C≤1000和0≤Υ≤100为范围,构建取值范围内所有C和γ组成的参数对;
S2.依次取参数对(C,γ)作为基于RBF核函数的SVM分类器参数初始值,训练数据向量集Strain和测试数据向量集Stest,记这一分类模型下对测试数据集预测的准确率为pt;
S3.针对测试集准确率,用计算机程序调整测试SVM算法中不同的C值和γ值参数对,使准确率pt达到预定要求的准确率p0,并保存记录这一准确率p0下的模型参数对(C0,γ0)。即这一参数对为所求SVM分类模型的模型参数。
8.根据权利要求1所述的基于人工智能消费维权指数企业投诉预警监测分析方法,其特征在于,
步骤6)具体步骤如下:
S1:建立连词和否定词词典库;
S2:根据连词和否定词词典库从规范化数据中抽取连词和否定词,并标记相应词在规范化数据中的位置;
S3:匹配现有的情感词典库,获得词汇的极性及其情感评分值;
S4:通过连词位置,确定前句与后句所占比重,再根据否定词位置判断双重否定以及邻近词汇的极性反转;
S5:利用词汇的极性及其情感评分值带入连词和否定词后对规范化数据进行累加获得情感计算评分;
S6:循环步骤S2至S5,若情感计算评分为正则为积极,为负则为消极,否则为中心;
S7:投诉风险等级规则用于根据聚类结果将投诉风险等级划分为高危极、危险级、一般投诉级、投诉倾向级以及无投诉倾向级这五个风险等级;
S8:提高限定结果的精确性:在制定投诉风险等级规则需要对规则进行验证,将验证集数据输入建立的分类学习模型,获得验证集数据中各文本数据的投诉风险等级,并将结果集与验证集数据中对应的等级数据进行比对,计算模型预测的正确率∈{-1,1}。
作为一种优选,步骤7)具体步骤如下:
S1:构建不含标记结果的工单得分率数据向量x’;
S2:采用步骤三中训练所得的模型参数(C0,γ0)对x’进行SVM分类预测,得到输出结果y’∈{-1,1}
S3:y’*x’即为某企业在当前消费市场环境下的预警指数。
S4:对于不同时期的消费市场,建立不同的预警临界值。
作为一种优选,所述预警临界值包括优秀值α1、良好值α2、一般值α3、较差值α4、危险值α5;当某企业预警指数超过较差值α4时,黄灯预警,建议执法部门解决,当超过危险值α5时,红灯预警,说明某企业信誉差、涉嫌损害社会公民利益,损害消费市场安全等情况。
本发明提供的方法基于统计学理论,结合最新的数据挖掘理论实施方法,采用SVM支持向量机构建标准化的消费维权计算模型,并实时提取业务工单数据,提取业务数据。计算模型和业务数据相结合在现今计算机运算速度的支持下,能达到快速、科学、标准、客观的计算结果。
附图说明
图1为本发明的方法流程图;
图2为本发明对工单数据进行业务分类梳理流程图;
图3为本发明模型验证流程图。
具体实施方式
以下结合实例对本发明做进一步详细说明。
术语解释:
大数据分类算法:
大数据分类算法指的是以支持向量机、神经网络等为主的,以找出数据库中的一组数据对象的共同特点并按照分类模式将其划分为不同的类的算法。其目的是通过分类模型,将数据库中的数据项映射到某个给定的类别中。
支持向量机:
在机器学习中,支持向量机(SVM,还支持矢量网络)是与相关的学习算法有关的监督学习模型,可以分析数据,识别模式,用于分类和回归分析。给定一组训练样本,每个标记为属于两类,一个SVM训练算法建立了一个模型,分配新的实例为一类或其他类,使其成为非概率二元线性分类。
专家评分模型:
所谓评分就是对事物的某些属性或影响做出衡量。其实质是主体(评价者或评分专家)对客体(评价对象)本质属性及发展规律的认识。评价的过程是评价者根据对客体的认识程度及评价者本身的认识水平、价值观和心理因素对评价对象的属性加以描述的过程。联系主体与客体的桥梁和纽带是比较,即用某种确定的标准与评价对象相比较,专家评分的根本原则和手段也是比较。
参照图1至图3,本发明的具体操作步骤如下:
基于人工智能消费维权指数企业投诉预警监测分析方法,
包括如下步骤:步骤1)包括数据采集模块,利用所述数据采集模块获取12345热线的工单内容;
步骤2)对将步骤1)建立分类模块,通过步骤1)数据采集模块采集的12345热线按照工单内容,按照关键字通过嵌入式分类模块进行分类,得到二级指标,以及重要等级进行分组分类;(对一个系统中的不同子项进行分类,总体按照项目对消费维权指标结果影响大小分为三级,分别为:较大影响项目、一般影响项目、较小影响项目)进行分组分类。
参照表1,表1提供了一种分类的方法。
表1为按照14个评价领域提供的实施例示意表。
步骤3)专家评分模型建立并计算二级指标的得分率,包括如下:
S1:专家评分模型建立;
所谓评分就是对事物的某些属性或影响做出衡量。其实质是主体(评价者或评分专家)对客体(评价对象)本质属性及发展规律的认识。评价的过程是评价者根据对客体的认识程度及评价者本身的认识水平、价值观和心理因素对评价对象的属性加以描述的过程。联系主体与客体的桥梁和纽带是比较,即用某种确定的标准与评价对象相比较,专家评分的根本原则和手段也是比较。消费维权指标体系中不同的二级指标对消费维权指数的的的重要性不同。要对消费维权指数进行定量的综合评价,就必须对各个指标重要性程度的大小用具体的数字来度量,通常用指标的权重来表示各指标在整个消费维权指标体系中的相对重要性程度。这就需要专家评分法来评定。
我们所用的专家评分法是专家调查法的一种应用。实际上就是一个由工作小组所组织的集体交流思想的过程,是在专家个人思考、判断的基础上对消费维权指数权重所开展的一种讨论,也就是充分发挥每个专家对消费维权指数的具体判断和分析,具体评分方法及对评分的处理如下:对数量和时间答案的处理如下表述:
式中为评价结果,p为正整数,n为专家数,专家评分值从大到小排列,则Xp+1公式表示奇数个专家评分的中位数,(Xp+Xp+1)/2表示偶数个专家评分的中位数。
S2:指标得分率计算;
具体步骤如下:
设消费维权指数有m个评价领域,有n个专家参与评价,设某一专家k给出的评分值集合为{Xi(j)}(k),式中{Xi(j)}(k)表示第k=1,2,···,n个专家对第i(i=1,2,···,n)领域的评分序分值,其值为j(j=1,2,···,m);根据 可将序分值集合转化为基分值集合{Bi(j)}(k),其中
根据可将序分值集合转化为基分值集合{Bi(j)}(k),其中{Bi(j)}(k)表示第k个专家对第i个领域排在第j位时所对应的基数分值。然后,用下述公式计算每个研究领域的重要程度:
在(2)以及(3)式中,m在(2)以及(3)式中,m表示领域数;Si表示i领域得分值;n表示专家数;Bi(j)表示i领域排在j位得分值;Ni表示赞同某一领域排在第j位的人
所有m个项目得分率Si组合成一个m维的向量x=[a1,a2,…,am],该向量即表示一个投诉工单的评分情况,计算所有投诉工单评分情况向量,构成全体数据集Z={zn,n∈R}。
对获取的全体数据集Z中的数据进行标号分类,所有高得分率工单标注为1,非高得分率工单标注为-1;并将标注结果后全体数据集中随机取出的60-80%数据组合构成训练数据集Strain={(zn,yn)|zn∈Z,zn∈{-1,1},n=1,2,3…}其中zn为第n个工单的得分率向量,yn为对应第n个工单的得分率结果,其余20-40%作为测试数据集Stest={(zm,ym)|zm∈Z,ym∈{-1,1},m=1,2,3…}其中zm为第m个工单的得分率向量,ym为对应第m个工单的得分率结果。
步骤4)构建SVM分类器;具体步骤如下:
S1:设给定的训练集为{(z1,y1),(z2,y2),…,(zn,yn)}其中zi∈Rn为输入向量,yi∈{-1,1}为输出向量,假设该训练集可被一个超平面W·Z+b=0线性划分,问题转化为求最优化超平面问题:
S2:对于非线性可分的情况,可以通过一个映射函数(在SVM称核函数),将低维的输入空间Rn映射到高维的特征空间H,使线性可分;则优化问题转化为
S3:解出式(2)最优化函数为:
从式(2)最小化问题可以得出,选择合适的函数K(·)和C即可以确定SVM分类器;
S4:选用RBF径向基核函数,即K(Zi,Zj)=exp(-γ||Zi-Zj||)2,则分类器的优化问题最终转化为参数对(C,γ)的选择问题。
步骤5)具体步骤如下:
S1.以1≤C≤1000和0≤γ≤100为范围,构建取值范围内所有C和γ组成的参数对;
S2.依次取参数对(C,γ)作为基于RBF核函数的SVM分类器参数初始值,训练数据向量集Strain和测试数据向量集Stest,记这一分类模型下对测试数据集预测的准确率为pt;
S3.针对测试集准确率,用计算机程序调整测试SVM算法中不同的C值和Υ值参数对,使准确率pt达到预定要求的准确率p0,并保存记录这一准确率p0下的模型参数对(C0,γ0)。即这一参数对为所求SVM分类模型的模型参数。
步骤6)具体步骤如下:
S1:建立连词和否定词词典库;
S2:根据连词和否定词词典库从规范化数据中抽取连词和否定词,并标记相应词在规范化数据中的位置;
S3:匹配现有的情感词典库,获得词汇的极性及其情感评分值;
S4:通过连词位置,确定前句与后句所占比重,再根据否定词位置判断双重否定以及邻近词汇的极性反转;
S5:利用词汇的极性及其情感评分值带入连词和否定词后对规范化数据进行累加获得情感计算评分;
S6:循环步骤S2至S5,若情感计算评分为正则为积极,为负则为消极,否则为中心;
S7:投诉风险等级规则用于根据聚类结果将投诉风险等级划分为高危极、危险级、一般投诉级、投诉倾向级以及无投诉倾向级这五个风险等级;
S8:提高限定结果的精确性:在制定投诉风险等级规则需要对规则进行验证,将验证集数据输入建立的分类学习模型,获得验证集数据中各文本数据的投诉风险等级,并将结果集与验证集数据中对应的等级数据进行比对,计算模型预测的正确率∈{-1,1}。
步骤7)具体步骤如下:
S1:构建不含标记结果的工单得分率数据向量x’;
S2:采用步骤三中训练所得的模型参数(C0,γ0)对x’进行SVM分类预测,得到输出结果y’∈{-1,1}
S3:y’*x’即为某企业在当前消费市场环境下的预警指数。
S4:对于不同时期的消费市场,建立不同的预警临界值;所述预警临界值包括优秀值α1、良好值α2、一般值α3、较差值α4、危险值α5;当某企业预警指数超过较差值α4时,黄灯预警,建议执法部门解决,当超过危险值α时,红灯预警,说明某企业信誉差、涉嫌损害社会公民利益,损害消费市场安全等情况。
传统方式中对消费维权指数的计算极大地依赖于消费维权涉及的金额数据,数据维度单一,不具备现实普遍性。本发明提供的方法基于统计学理论,结合最新的数据挖掘理论实施方法,采用SVM支持向量机构建标准化的消费维权计算模型,并实时提取业务工单数据,提取业务数据。计算模型和业务数据相结合在现今计算机运算速度的支持下,能达到快速、科学、标准、客观的计算结果。
Claims (10)
1.基于人工智能消费维权指数企业投诉预警监测分析方法,其特征在于,包括如下步骤:
步骤1)包括数据采集模块,利用所述数据采集模块获取12345热线的工单内容;
步骤2)对将步骤1)建立分类模块,通过步骤1)数据采集模块采集的12345热线按照工单内容,按照关键字通过嵌入式分类模块进行分类,得到二级指标,以及重要等级进行分组分类;
步骤3)专家评分模型建立计算二级指标的得分率,包括如下:
S1:专家评分模型建立;
S2:指标得分率计算;
S3:数据集获取模块的建立:构建所设定项目的多维向量,通过向量得到投诉工单的评分情况,计算所有投诉工单评分情况向量,构成全体数据集;
S4:根据数据集获取模块得到的全体数据集,得到训练数据集,由训练数据集获取等分率;
步骤4)构建SVM分类器;
步骤5)构建训练分类模型;
步骤6)构建分类梳理模块,对工单数据进行业务分类梳理;
步骤7)构建监测模块,该构建监测模块用于指数与业务数据结合的企业投诉预警监测分析。
2.根据权利要求1所述的基于人工智能消费维权指数企业投诉预警监测分析方法,其特征在于,
步骤3)中S1步骤的具体评分方法及对评分的处理如下:
对数量和时间答案的处理如下表述:
<mrow>
<mover>
<mi>x</mi>
<mo>&OverBar;</mo>
</mover>
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<msub>
<mi>X</mi>
<mrow>
<mi>p</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
</mtd>
<mtd>
<mrow>
<mi>n</mi>
<mo>=</mo>
<mn>2</mn>
<mi>p</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mo>(</mo>
<msub>
<mi>X</mi>
<mi>p</mi>
</msub>
<mo>+</mo>
<msub>
<mi>X</mi>
<mrow>
<mi>p</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
<mo>)</mo>
<mo>/</mo>
<mn>2</mn>
</mrow>
</mtd>
<mtd>
<mrow>
<mi>n</mi>
<mo>=</mo>
<mn>2</mn>
<mi>p</mi>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
</mrow>
式中为评价结果,p为正整数,n为专家数,专家评分值从大到小排列,则Xp+1公式表示奇数个专家评分的中位数,(Xp+Xp+1)/2表示偶数个专家评分的中位数。
3.根据权利要求1所述的基于人工智能消费维权指数企业投诉预警监测分析方法,其特征在于,
步骤3)中步骤S2指标得分率计算的具体步骤如下:
设消费维权指数有m个评价领域,有n个专家参与评价,设某一专家k给出的评分值集合为{Xi(j)}(k),式中{Xi(j)}(k)表示第k=1,2,···,n个专家对第i(i=1,2,···,n)领域的评分序分值,其值为j(j=1,2,···,m);根据 可将序分值集合转化为基分值集合{Bi(j)}(k),其中
根据可将序分值集合转化为基分值集合{Bi(j)}(k),其中{Bi(j)}(k)表示第k个专家对第i个领域排在第j位时所对应的基数分值;然后,用下述公式计算每个研究领域的重要程度:
<mrow>
<msub>
<mi>S</mi>
<mi>i</mi>
</msub>
<mo>=</mo>
<msubsup>
<mi>&Sigma;</mi>
<mrow>
<mi>j</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>m</mi>
</msubsup>
<msub>
<mi>B</mi>
<mrow>
<mi>i</mi>
<mrow>
<mo>(</mo>
<mi>j</mi>
<mo>)</mo>
</mrow>
</mrow>
</msub>
<msub>
<mi>N</mi>
<mi>j</mi>
</msub>
<mo>,</mo>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
<mo>,</mo>
<mn>2</mn>
<mo>,</mo>
<mo>...</mo>
<mo>...</mo>
<mo>,</mo>
<mi>m</mi>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>2</mn>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<msub>
<mi>K</mi>
<mi>i</mi>
</msub>
<mo>=</mo>
<mfrac>
<msub>
<mi>s</mi>
<mi>i</mi>
</msub>
<mi>n</mi>
</mfrac>
<msubsup>
<mi>&Sigma;</mi>
<mrow>
<mi>j</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>m</mi>
</msubsup>
<mi>J</mi>
<mo>,</mo>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
<mo>,</mo>
<mn>2</mn>
<mo>,</mo>
<mo>...</mo>
<mo>...</mo>
<mo>,</mo>
<mi>m</mi>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>3</mn>
<mo>)</mo>
</mrow>
</mrow>
在(2)以及(3)式中,m在(2)以及(3)式中,m表示领域数;Si表示i领域得分值;n表示专家数;Bi(j)表示i领域排在j位得分值;Ni表示赞同某一领域排在第j位的人
4.根据权利要求1所述的基于人工智能消费维权指数企业投诉预警监测分析方法,其特征在于,
步骤3)中步骤S3数据集获取模块的建立具体包括:将s2中计算得到的所有m个项目得分率Si组合成一个m维的向量x=[a1,a2,…,am],该向量即表示一个投诉工单的评分情况,计算所有投诉工单评分情况向量,构成全体数据集Z={zn,n∈R}。
5.根据权利要求1所述的基于人工智能消费维权指数企业投诉预警监测分析方法,其特征在于,
步骤3)中步骤S4根据数据集获取模块得到的全体数据集具体包括:对步骤s3获取的全体数据集Z中的数据进行标号分类,所有高得分率工单标注为1,非高得分率工单标注为-1;并将标注结果后全体数据集中随机取出的60-80%数据组合构成训练数据集Strain={(zn,yn)|zn∈Z,zn∈{-1,1},n=1,2,3…}其中zn为第n个工单的得分率向量,yn为对应第n个工单的得分率结果,其余20-40%作为测试数据集Stest={(zm,ym)|zm∈Z,ym∈{-1,1},m=1,2,3…}其中zm为第m个工单的得分率向量,ym为对应第m个工单的得分率结果。
6.根据权利要求1所述的基于人工智能消费维权指数企业投诉预警监测分析方法,其特征在于,
步骤4)具体步骤如下:
S1:设给定的训练集为{(z1,y1),(z2,y2),…,(zn,yn)}其中zi∈Rn为输入向量,yi∈{-1,1}为输出向量,假设该训练集可被一个超平面W·Z+b=0线性划分,问题转化为求最优化超平面问题:
<mrow>
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<mrow>
<mi>m</mi>
<mi>i</mi>
<mi>n</mi>
<mi>&Phi;</mi>
<mrow>
<mo>(</mo>
<mi>W</mi>
<mo>,</mo>
<mi>&xi;</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfrac>
<mn>1</mn>
<mn>2</mn>
</mfrac>
<mo>|</mo>
<mo>|</mo>
<mi>W</mi>
<mo>|</mo>
<msup>
<mo>|</mo>
<mn>2</mn>
</msup>
<mo>+</mo>
<mi>c</mi>
<munderover>
<mi>&Sigma;</mi>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>n</mi>
</munderover>
<msub>
<mi>&xi;</mi>
<mi>i</mi>
</msub>
<mo>,</mo>
<mi>c</mi>
<mo>&GreaterEqual;</mo>
<mn>0</mn>
<mo>,</mo>
<mrow>
<mo>(</mo>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
<mo>,</mo>
<mn>2</mn>
<mo>,</mo>
<mo>...</mo>
<mo>,</mo>
<mi>n</mi>
<mo>)</mo>
</mrow>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mtable>
<mtr>
<mtd>
<mrow>
<mi>s</mi>
<mo>.</mo>
<mi>t</mi>
</mrow>
</mtd>
<mtd>
<mrow>
<msub>
<mi>y</mi>
<mi>i</mi>
</msub>
<mo>&lsqb;</mo>
<mrow>
<mo>(</mo>
<mi>W</mi>
<mo>&CenterDot;</mo>
<msub>
<mi>Z</mi>
<mn>1</mn>
</msub>
<mo>)</mo>
</mrow>
<mo>+</mo>
<mi>b</mi>
<mo>&rsqb;</mo>
<mo>&GreaterEqual;</mo>
<mn>1</mn>
<mo>-</mo>
<msub>
<mi>&xi;</mi>
<mi>i</mi>
</msub>
<mo>,</mo>
<msub>
<mi>&xi;</mi>
<mi>i</mi>
</msub>
<mo>&GreaterEqual;</mo>
<mn>0</mn>
</mrow>
</mtd>
</mtr>
</mtable>
</mtd>
</mtr>
</mtable>
</mfenced>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>4</mn>
<mo>)</mo>
</mrow>
</mrow>
S2:对于非线性可分的情况,可以通过一个映射函数(在SVM称核函数),将低维的输入空间Rn映射到高维的特征空间H,使线性可分;则优化问题转化为
<mrow>
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<mrow>
<munder>
<mi>min</mi>
<mi>a</mi>
</munder>
<mfrac>
<mn>1</mn>
<mn>2</mn>
</mfrac>
<munderover>
<mi>&Sigma;</mi>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>n</mi>
</munderover>
<munderover>
<mi>&Sigma;</mi>
<mrow>
<mi>j</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>n</mi>
</munderover>
<msub>
<mi>y</mi>
<mi>i</mi>
</msub>
<msub>
<mi>y</mi>
<mi>j</mi>
</msub>
<msub>
<mi>a</mi>
<mi>i</mi>
</msub>
<msub>
<mi>a</mi>
<mi>j</mi>
</msub>
<mi>K</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>Z</mi>
<mi>i</mi>
</msub>
<mo>,</mo>
<msub>
<mi>Z</mi>
<mi>j</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>-</mo>
<munderover>
<mi>&Sigma;</mi>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>n</mi>
</munderover>
<msub>
<mi>a</mi>
<mi>i</mi>
</msub>
<mo>,</mo>
<mrow>
<mo>(</mo>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
<mo>,</mo>
<mn>2</mn>
<mo>,</mo>
<mn>...</mn>
<mo>,</mo>
<mi>n</mi>
<mo>)</mo>
</mrow>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mtable>
<mtr>
<mtd>
<mrow>
<mi>s</mi>
<mo>.</mo>
<mi>t</mi>
<mo>.</mo>
</mrow>
</mtd>
<mtd>
<mrow>
<munderover>
<mi>&Sigma;</mi>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>n</mi>
</munderover>
<msub>
<mi>y</mi>
<mi>i</mi>
</msub>
<msub>
<mi>a</mi>
<mi>i</mi>
</msub>
<mo>=</mo>
<mn>0</mn>
<mo>,</mo>
<mn>0</mn>
<mo>&le;</mo>
<msub>
<mi>a</mi>
<mi>i</mi>
</msub>
<mo>&le;</mo>
<mi>C</mi>
</mrow>
</mtd>
</mtr>
</mtable>
</mtd>
</mtr>
</mtable>
</mfenced>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>5</mn>
<mo>)</mo>
</mrow>
</mrow>
S3:解出式(2)最优化函数为:
<mrow>
<mi>f</mi>
<mrow>
<mo>(</mo>
<mi>X</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mi>s</mi>
<mi>i</mi>
<mi>g</mi>
<mi>n</mi>
<mo>&lsqb;</mo>
<munderover>
<mi>&Sigma;</mi>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>n</mi>
</munderover>
<msub>
<mi>y</mi>
<mi>i</mi>
</msub>
<msub>
<mi>a</mi>
<mi>i</mi>
</msub>
<mi>K</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>Z</mi>
<mi>i</mi>
</msub>
<mo>,</mo>
<msub>
<mi>Z</mi>
<mi>j</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>+</mo>
<msup>
<mi>b</mi>
<mo>*</mo>
</msup>
<mo>&rsqb;</mo>
</mrow>
从式(2)最小化问题可以得出,选择合适的函数K(·)和C即可以确定SVM分类器;
S4:选用RBF径向基核函数,即K(Zi,Zj)=exp(-γ||Zi-Zj||)2,则分类器的优化问题最终转化为参数对(C,γ)的选择问题。
7.根据权利要求1所述的基于人工智能消费维权指数企业投诉预警监测分析方法,其特征在于,
步骤5)具体步骤如下:
S1.以1≤C≤1000和0≤γ≤100为范围,构建取值范围内所有C和Υ组成的参数对;
S2.依次取参数对(C,Υ)作为基于RBF核函数的SVM分类器参数初始值,训练数据向量集Strain和测试数据向量集Stest,记这一分类模型下对测试数据集预测的准确率为pt;
S3.针对测试集准确率,用计算机程序调整测试SVM算法中不同的C值和Υ值参数对,使准确率pt达到预定要求的准确率p0,并保存记录这一准确率p0下的模型参数对(C0,Υ0),即这一参数对为所求SVM分类模型的模型参数。
8.根据权利要求1所述的基于人工智能消费维权指数企业投诉预警监测分析方法,其特征在于,
步骤6)具体步骤如下:
S1:建立连词和否定词词典库;
S2:根据连词和否定词词典库从规范化数据中抽取连词和否定词,并标记相应词在规范化数据中的位置;
S3:匹配现有的情感词典库,获得词汇的极性及其情感评分值;
S4:通过连词位置,确定前句与后句所占比重,再根据否定词位置判断双重否定以及邻近词汇的极性反转;
S5:利用词汇的极性及其情感评分值带入连词和否定词后对规范化数据进行累加获得情感计算评分;
S6:循环步骤S2至S5,若情感计算评分为正则为积极,为负则为消极,否则为中心;
S7:投诉风险等级规则用于根据聚类结果将投诉风险等级划分为高危极、危险级、一般投诉级、投诉倾向级以及无投诉倾向级这五个风险等级;
S8:提高限定结果的精确性:在制定投诉风险等级规则需要对规则进行验证,将验证集数据输入建立的分类学习模型,获得验证集数据中各文本数据的投诉风险等级,并将结果集与验证集数据中对应的等级数据进行比对,计算模型预测的正确率∈{-1,1}。
9.根据权利要求1所述的基于人工智能消费维权指数企业投诉预警监测分析方法,其特征在于,
步骤7)具体步骤如下:
S1:构建不含标记结果的工单得分率数据向量x’;
S2:采用步骤三中训练所得的模型参数(C0,γ0)对x’进行SVM分类预测,得到输出结果y’∈{-1,1};
S3:y’*x’即为某企业在当前消费市场环境下的预警指数;
S4:对于不同时期的消费市场,建立不同的预警临界值。
10.根据权利要求9所述的基于人工智能消费维权指数企业投诉预警监测分析方法,其特征在于,所述预警临界值包括优秀值α1、良好值α2、一般值α3、较差值α4、危险值α5;当某企业预警指数超过较差值α4时,黄灯预警,建议执法部门解决,当超过危险值α5时,红灯预警,说明某企业信誉差、涉嫌损害社会公民利益,损害消费市场安全等情况。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711361299.3A CN107944761A (zh) | 2017-12-18 | 2017-12-18 | 基于人工智能消费维权指数企业投诉预警监测分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711361299.3A CN107944761A (zh) | 2017-12-18 | 2017-12-18 | 基于人工智能消费维权指数企业投诉预警监测分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107944761A true CN107944761A (zh) | 2018-04-20 |
Family
ID=61944506
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711361299.3A Pending CN107944761A (zh) | 2017-12-18 | 2017-12-18 | 基于人工智能消费维权指数企业投诉预警监测分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107944761A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111325422A (zh) * | 2018-12-14 | 2020-06-23 | 中国移动通信集团河南有限公司 | 一种工单派发方法及系统 |
CN112711768A (zh) * | 2021-03-27 | 2021-04-27 | 北京数安行科技有限公司 | 一种基于人工智能的核心数据轨迹画像生成方法及系统 |
TWI731397B (zh) * | 2018-08-24 | 2021-06-21 | 宏達國際電子股份有限公司 | 驗證訓練資料的方法、訓練系統以及電腦程式產品 |
CN113256256A (zh) * | 2021-05-28 | 2021-08-13 | 北京软通智慧城市科技有限公司 | 一种工单预警方法、装置、设备及存储介质 |
CN113554366A (zh) * | 2021-09-23 | 2021-10-26 | 山东大学 | 消毒产品生产企业的分类监督方法及相关设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105095396A (zh) * | 2015-07-03 | 2015-11-25 | 北京京东尚科信息技术有限公司 | 模型创建方法、质量评估方法及装置 |
CN106530127A (zh) * | 2016-11-09 | 2017-03-22 | 国网江苏省电力公司南京供电公司 | 基于文本挖掘技术的客户投诉预警监测分析系统 |
CN106897792A (zh) * | 2017-01-10 | 2017-06-27 | 广东广业开元科技有限公司 | 一种建筑消防风险等级预测方法及系统 |
CN106980929A (zh) * | 2017-01-05 | 2017-07-25 | 国网福建省电力有限公司 | 一种基于随机森林的停电投诉风险预测方法 |
US10157347B1 (en) * | 2013-11-04 | 2018-12-18 | Predii, Inc. | Adaptable systems and methods for processing enterprise data |
-
2017
- 2017-12-18 CN CN201711361299.3A patent/CN107944761A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10157347B1 (en) * | 2013-11-04 | 2018-12-18 | Predii, Inc. | Adaptable systems and methods for processing enterprise data |
CN105095396A (zh) * | 2015-07-03 | 2015-11-25 | 北京京东尚科信息技术有限公司 | 模型创建方法、质量评估方法及装置 |
CN106530127A (zh) * | 2016-11-09 | 2017-03-22 | 国网江苏省电力公司南京供电公司 | 基于文本挖掘技术的客户投诉预警监测分析系统 |
CN106980929A (zh) * | 2017-01-05 | 2017-07-25 | 国网福建省电力有限公司 | 一种基于随机森林的停电投诉风险预测方法 |
CN106897792A (zh) * | 2017-01-10 | 2017-06-27 | 广东广业开元科技有限公司 | 一种建筑消防风险等级预测方法及系统 |
Non-Patent Citations (1)
Title |
---|
鞠姗: "贸易保护主义压力下的我国贸易摩擦预警模型", 《山东财政学院学报》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI731397B (zh) * | 2018-08-24 | 2021-06-21 | 宏達國際電子股份有限公司 | 驗證訓練資料的方法、訓練系統以及電腦程式產品 |
CN111325422A (zh) * | 2018-12-14 | 2020-06-23 | 中国移动通信集团河南有限公司 | 一种工单派发方法及系统 |
CN111325422B (zh) * | 2018-12-14 | 2023-10-27 | 中国移动通信集团河南有限公司 | 一种工单派发方法及系统 |
CN112711768A (zh) * | 2021-03-27 | 2021-04-27 | 北京数安行科技有限公司 | 一种基于人工智能的核心数据轨迹画像生成方法及系统 |
CN112711768B (zh) * | 2021-03-27 | 2021-06-04 | 北京数安行科技有限公司 | 一种基于人工智能的核心数据轨迹画像生成方法及系统 |
CN113256256A (zh) * | 2021-05-28 | 2021-08-13 | 北京软通智慧城市科技有限公司 | 一种工单预警方法、装置、设备及存储介质 |
CN113554366A (zh) * | 2021-09-23 | 2021-10-26 | 山东大学 | 消毒产品生产企业的分类监督方法及相关设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107944761A (zh) | 基于人工智能消费维权指数企业投诉预警监测分析方法 | |
CN108108352A (zh) | 一种基于机器学习文本挖掘技术的企业投诉风险预警方法 | |
CN108038240A (zh) | 基于内容、用户多因素分析的社交网络谣言检测方法 | |
CN110417721A (zh) | 安全风险评估方法、装置、设备及计算机可读存储介质 | |
bin Md Rodzi et al. | Integrated Single-Valued Neutrosophic Normalized Weighted Bonferroni Mean (SVNNWBM)-DEMATEL for Analyzing the Key Barriers to Halal Certification Adoption in Malaysia | |
CN106663302A (zh) | 知识产权的评估方法、系统及程序 | |
CN113989019A (zh) | 识别风险的方法、装置、设备及存储介质 | |
CN108320798A (zh) | 病症结果生成方法与装置 | |
CN103823880A (zh) | 一种基于属性加权计算检测机构相似度的方法 | |
CN111583033A (zh) | 基于上市公司和股东之间联系的关联分析方法及装置 | |
CN108573339A (zh) | 一种多指标投影决策法的消费者网购风险评估方法 | |
CN107992613A (zh) | 一种基于机器学习的文本挖掘技术消费维权指标分析方法 | |
Yuen | Cognitive network process with fuzzy soft computing technique in collective decision aiding | |
CN111861507A (zh) | 一种用于实时分析网络餐饮店铺风险的识别方法及系统 | |
CN107590733A (zh) | 基于地理经济和社交关系的网贷平台风险评估方法 | |
CN107368941A (zh) | 一种湿地生态系统服务价值大数据评估方法及装置 | |
CN104301330B (zh) | 基于异常行为监测和成员亲密度测量的陷阱网络检测方法 | |
CN108062392A (zh) | 一种基于大数据分类算法的消费维权指数计算方法 | |
González et al. | Typologies of Colombian off-grid localities using pca and clustering analysis for a better understanding of their situation to meet sdg-7 | |
JAMSHIDNEZHAD et al. | A Fuzzy Ranking Model to Performance Assessment of Cooperative Companies. | |
El Mouna et al. | A Comparative Study of Urban House Price Prediction using Machine Learning Algorithms | |
Liang et al. | Research on higher education evaluation system based on AHP-NBM comprehensive evaluation model | |
Maohua et al. | The application of AHP in SRID evaluation framework of Chinese agricultural enterprise | |
Zhu et al. | Identification of Impoverished College Students Based on LR-RF Dual Indicators | |
Sallan et al. | Prediction of Student Dropout Using Enhanced Machine Learning Algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180420 |
|
RJ01 | Rejection of invention patent application after publication |