CN112541077B - 一种用于电网用户服务评价的处理方法及系统 - Google Patents

一种用于电网用户服务评价的处理方法及系统 Download PDF

Info

Publication number
CN112541077B
CN112541077B CN202011344576.1A CN202011344576A CN112541077B CN 112541077 B CN112541077 B CN 112541077B CN 202011344576 A CN202011344576 A CN 202011344576A CN 112541077 B CN112541077 B CN 112541077B
Authority
CN
China
Prior art keywords
user
service
text information
final
keywords
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011344576.1A
Other languages
English (en)
Other versions
CN112541077A (zh
Inventor
廖家敏
李颖杰
陈喆
孙涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Power Supply Bureau Co Ltd
Original Assignee
Shenzhen Power Supply Bureau Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Power Supply Bureau Co Ltd filed Critical Shenzhen Power Supply Bureau Co Ltd
Priority to CN202011344576.1A priority Critical patent/CN112541077B/zh
Publication of CN112541077A publication Critical patent/CN112541077A/zh
Application granted granted Critical
Publication of CN112541077B publication Critical patent/CN112541077B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0282Rating or review of business operators or products
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Evolutionary Computation (AREA)
  • Development Economics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Finance (AREA)
  • Mathematical Physics (AREA)
  • Accounting & Taxation (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Primary Health Care (AREA)
  • Human Resources & Organizations (AREA)
  • Water Supply & Treatment (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Public Health (AREA)
  • Game Theory and Decision Science (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种用于电网用户服务评价的处理方法,包括步骤S1,获取多个数据源的候选关键词和用户输入的服务评价信息;获取最终关键词,将所有最终关键词组成词库;步骤S2,获取多个所述最终关键词的语义相关参数,根据预设的语义分类器对每一组数组的词语进行排列,得到最终的语义意图;步骤S3,获取所述最终的语义意图的文本信息,根据预设的独热维度字典确定所述文本信息对应的字嵌入向量序列;以数值最高的概率值对应的用户画像为用户标签;步骤S4,根据所述用户标签确定从反馈服务列表中查找到对应的反馈服务项目,提供用户标签对应的反馈服务项目。本发明提高了服务评价信息的处理效率,减少人为出错概率。

Description

一种用于电网用户服务评价的处理方法及系统
技术领域
本发明涉及电网的服务信息技术领域,特别是涉及一种用于电网用户服务评价的处理方法及系统。
背景技术
为用户提供电网各种服务(例如,电费代缴,用电统计与查询、业务办理、停电/报修或服务诉求等)后,会接收到用户在服务后的各种评价信息,例如服务评价信息、回访评价信息、满意度评价信息等。
现有的服务系统会保存用户在服务诉求的处理过程中发送的服务评价信息、回访评价信息、满意度评价信息等,再由人工进行排查、筛选、分类和统计,再由人工挑选个别用户进行服务反馈,以辅助和解决用户的后续诉求。
现有技术存在诸多缺点,如:由于服务评价信息仅限于用来做简单的统计分析,并未真正发掘这部分数据的使用价值,未对这部分数据实现充分的运用,大大浪费了这部分的信息资源。采用人工进行排查、筛选、分类和统计,筛选和统计的时间长,而且容易受人为因素影响。人工挑选反馈只能对部分用户进行服务反馈,难以对全部用户进行服务反馈,服务效率低。
发明内容
本发明的目的在于,提出一种用于电网用户服务评价的处理方法及系统,解决现有方法对用户评价筛选和统计的时间长、效率低及数据发掘率低的技术问题。
本发明的一方面,提供一种用于电网用户服务评价的处理方法,包括以下步骤:
步骤S1,获取多个数据源的候选关键词和用户输入的服务评价信息;并根据第一预设规则对所述服务评价信息进行分词处理,获取多个分词,将所述候选关键词与所述多个分词进行配对,获取所述候选关键词配对的分词数;以及将所述分词数大于预设阈值的候选关键词作为最终关键词,将所有最终关键词组成词库;
步骤S2,获取多个所述最终关键词的语义相关参数,将所述语义相关参数超过预设的相关度阙值的最终关键词归于同一个数组,根据预设的语义分类器对每一组数组的词语进行排列,得到最终的语义意图;
步骤S3,获取所述最终的语义意图的文本信息,根据预设的独热维度字典确定所述文本信息对应的字嵌入向量序列;将字嵌入向量序列输入卷积神经网络,获得对应的每个预设用户画像的概率值,以数值最高的概率值对应的用户画像为用户标签;其中,所述最终的语义意图的文本信息包括多个字符;所述用户标签至少包括满意、良好、不满意和待解决;
步骤S4,根据所述用户标签确定从反馈服务列表中查找到对应的反馈服务项目,提供用户标签对应的反馈服务项目。
优选地,所述步骤S1包括:通过网络获取敏感词或行业的相关词汇或根据以往的用户评价由用户挑选的关键词,作为候选关键词。
优选地,所述步骤S1还包括:获取用户的服务评价信息作为训练集,根据预设的模型对训练集进行训练,划分服务评价信息中的每个词的状态信息,生成状态值集合,获取多个分词。
优选地,所述步骤S3包括:将所述最终语义意图的文本信息中的各个字符与独热维度字典进行匹配,确定独热维度字典中是否存在与所述文本信息相同的字符;若存在相同的字符,获取所述文本信息中的字符对应的独热维度向量,作为所述文本信息对应的独热维度向量,将所述文本信息对应的独热维度向量组成所述文本信息对应的字嵌入向量序列。
优选地,所述步骤S4包括:若用户标签为满意标签,则记录历史数据中为该用户提供的服务的操作流程,以用作下一次提供相同服务的标准操作;
若用户标签为良好标签,则查询提供的服务的操作流程是否出错;
若用户标签为不满意标签,则查询用户相应的服务项目的历史数据,生成服务项目的历史列表并发送给用户终端,获取用户对每一项服务项目的评分并统计低于预设分数的服务项目,生成对应的不及格项目列表作为修改参考;
若用户标签为待解决标签,则通知相关人员跟进处理。
优选地,所述步骤S1还包括:对用户的服务评价信息进行预处理,根据预设的规范编码进行格式转化,过滤格式转化后的服务评价信息的无关信息、停用词、英文及出现频率最高的词或单词组合;其中,所述无关信息至少包括标点符号,网址信息和表情信息。
本发明的还提供一种用于电网用户服务评价的处理系统,用以实现所述的用于电网用户服务评价的处理方法,包括:
词库处理模块,用以获取多个数据源的候选关键词和用户输入的服务评价信息;并根据第一预设规则对所述服务评价信息进行分词处理,获取多个分词,将所述候选关键词与所述多个分词进行配对,获取所述候选关键词配对的分词数;以及将所述分词数大于预设阈值的候选关键词作为最终关键词,将所有最终关键词组成词库;
语义处理模块,用以获取多个所述最终关键词的语义相关参数,将所述语义相关参数超过预设的相关度阙值的最终关键词归于同一个数组,根据预设的语义分类器对每一组数组的词语进行排列,得到最终的语义意图;
用户标签模块,用以获取所述最终的语义意图的文本信息,根据预设的独热维度字典确定所述文本信息对应的字嵌入向量序列;将字嵌入向量序列输入卷积神经网络,获得对应的每个预设用户画像的概率值,以数值最高的概率值对应的用户画像为用户标签;其中,所述最终的语义意图的文本信息包括多个字符;所述用户标签至少包括满意、良好、不满意和待解决;
反馈服务模块,用以根据所述用户标签确定从反馈服务列表中查找到对应的反馈服务项目,提供用户标签对应的反馈服务项目。
优选地,所述词库处理模块通过网络获取敏感词或行业的相关词汇或根据以往的用户评价由用户挑选的关键词,作为候选关键词。
优选地,所述词库处理模块获取用户的服务评价信息作为训练集,根据预设的模型对训练集进行训练,划分服务评价信息中的每个词的状态信息,生成状态值集合,获取多个分词。
优选地,所述语义处理模块将所述最终语义意图的文本信息中的各个字符与独热维度字典进行匹配,确定独热维度字典中是否存在与所述文本信息相同的字符;若存在相同的字符,获取所述文本信息中的字符对应的独热维度向量,作为所述文本信息对应的独热维度向量,将所述文本信息对应的独热维度向量组成所述文本信息对应的字嵌入向量序列。
优选地,所述反馈服务模块获取的用户标签为满意标签,则记录历史数据中为该用户提供的服务的操作流程,以用作下一次提供相同服务的标准操作;
获取的用户标签为良好标签,则查询提供的服务的操作流程是否出错;
获取的用户标签为不满意标签,则查询用户相应的服务项目的历史数据,生成服务项目的历史列表并发送给用户终端,获取用户对每一项服务项目的评分并统计低于预设分数的服务项目,生成对应的不及格项目列表作为修改参考;
获取的用户标签为待解决标签,则通知相关人员跟进处理。
综上,实施本发明的实施例,具有如下的有益效果:
本发明提供的用于电网用户服务评价的处理方法及系统,通过对服务评价信息进行整合处理,生成对应的标签,从而可以通过标签对服务评价信息进行筛选分类,提高了服务评价信息的处理效率,减少人为出错概率。基于语义向量的权重,获取对应的语义,在由语义分类器进行分类排列,不会割裂上下文的文意,也不会损失掉因强行拆分导致的含义的丢失,从而可以选择出最有可能的备选语义意图作为最终语义意图输出,而且通过神经网络的处理,可以再次确保语义提取的正确率和精确度;基于特征序列确定用户意图分数值,根据分数值确定对应的各个标签,可以使得为视频确定的标签更加精准和丰富。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,根据这些附图获得其他的附图仍属于本发明的范畴。
图1为本发明实施例中一种用于电网用户服务评价的处理方法的主流程示意图。
图2为本发明实施例中一种用于电网用户服务评价的处理系统的示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述。
如图1所示,为本发明提供的一种用于电网用户服务评价的处理方法的一个实施例的示意图。在该实施例中,所述方法包括以下步骤:
步骤S1,获取多个数据源的候选关键词和用户输入的服务评价信息;并根据第一预设规则对所述服务评价信息进行分词处理,获取多个分词,将所述候选关键词与所述多个分词进行配对,获取所述候选关键词配对的分词数;以及将所述分词数大于预设阈值的候选关键词作为最终关键词,将所有最终关键词组成词库。
具体实施例中,通过网络获取敏感词或行业的相关词汇或根据以往的用户评价由用户挑选的关键词,作为候选关键词。以及获取用户的服务评价信息作为训练集,根据预设的模型对训练集进行训练,划分服务评价信息中的每个词的状态信息,生成状态值集合,获取多个分词。可以理解的是,先把以用户以往的服务评价信息作为训练集,使用HMM算法模型训练集进行训练,当训练完成后,将服务评价信息输入至HMM模型中,进行分词操作;具体地,可以将HMM模型看作五元组,HMM模型可以划分文本中的每个词的状态,并生成状态值集合,这个生成状态值集合为 (B,M,E,S):{B:begin,M:middle,E:end,S:single},其中,B,M,E,S分别代表每个状态代表的是该字在词语中的位置,B代表该字是词语中的起始字,M代表是词语中的中间字,E代表是词语中的结束字,S 则代表是单字成词。服务评价信息输入至HMM模型后,HMM模型可以采用Viterbi算法,对服务评价信息进行遍历,去确定服务评价信息中各个词语对应的状态集(B,M,E,S),从而来完成服务评价信息的分词工作。
具体的实施例中,还包括,对用户的服务评价信息进行预处理,根据预设的规范编码进行格式转化,过滤格式转化后的服务评价信息的无关信息、停用词、英文及出现频率最高的词或单词组合;其中,所述无关信息至少包括标点符号,网址信息和表情信息。可以理解的是,为了提高关键词提取的准确率,在分词之前,可以会先对用户的各种服务评价信息作预处理,预处理可以包括处理文本编码格式问题,例如使用统一规范的编码,避免出现中英文乱码情况;去除文本的无关信息,无关信息包括标点符号,网址和表情;去除文本数据中的停用词和英文;去除出现频率最高的词或单词组合,减少提取关键词的个数,提高效率。
步骤S2,获取多个所述最终关键词的语义相关参数,将所述语义相关参数超过预设的相关度阙值的最终关键词归于同一个数组,根据预设的语义分类器对每一组数组的词语进行排列,得到最终的语义意图;可以理解的是,通过PMI点互信息算法可以将多个关键词进行归纳分类,从而筛选出对应的相关联的关键词,提高识别的效率;而语义分类器可以对相关的词语进行排列最终识别得到用户的意图。具体地,关键词包括“电费,缴纳,电量,收据,成功,完成,转账,本月,账单,代缴,账户,名称,年份”等,采用PMI点互信息算法计算每个关键词的语义相关度,对应分别为“6、5、2、1、3、1、 4、2、2、1、0、0、1”,然后查到大于语义相关度阙值3的关键词,分别对应为“缴纳,电费,成功,转账”将多个超过语义相关度阙值3的关键词放入同一数组A中,A{“缴纳,电费,成功,转账”},然后将数组A输入至语义分类器中分类排列后得到最终的语义意图“电费成功转账缴纳”。
步骤S3,获取所述最终的语义意图的文本信息,根据预设的独热维度字典确定所述文本信息对应的字嵌入向量序列;将字嵌入向量序列输入卷积神经网络,获得对应的每个预设用户画像的概率值,以数值最高的概率值对应的用户画像为用户标签;其中,所述最终的语义意图的文本信息包括多个字符;所述用户标签至少包括满意、良好、不满意和待解决;可以理解的是,获取最终的语义意图的文本信息,其中文本信息中包含多个字符;基于预设的独热维度字典,确定文本信息对应的字嵌入向量序列;该独热维度字典是记录了多个字符以及各个字符对应的独热维度向量的字典库。
具体实施例中,将所述最终语义意图的文本信息中的各个字符与独热维度字典进行匹配,确定独热维度字典中是否存在与所述文本信息相同的字符;若存在相同的字符,获取所述文本信息中的字符对应的独热维度向量,作为所述文本信息对应的独热维度向量,将所述文本信息对应的独热维度向量组成所述文本信息对应的字嵌入向量序列。具体地,该字嵌入向量序列表示为:P=(p1,…,pi,…,pn)。
步骤S4,根据所述用户标签确定从反馈服务列表中查找到对应的反馈服务项目,提供用户标签对应的反馈服务项目。可以理解的是,每个标签对应一种反馈服务,四种标签分别对应的四种反馈服务项目,具体地,满意、良好、不满意和待解决四种标签分别对应为记录操作、查询、项目评分和问题咨询四种反馈服务项目。四种反馈服务项目可以设置在反馈服务列表中,在确定用户的标签后,可以根据标签确定从反馈服务列表中查找到对应的反馈服务项目。
具体实施例中,若用户标签为满意标签,则记录历史数据中为该用户提供的服务的操作流程,以用作下一次提供相同服务的标准操作;若用户标签为良好标签,则查询提供的服务的操作流程是否出错;若用户标签为不满意标签,则查询用户相应的服务项目的历史数据,生成服务项目的历史列表并发送给用户终端,获取用户对每一项服务项目的评分并统计低于预设分数的服务项目,生成对应的不及格项目列表作为修改参考;还可以生成此前服务项目的列表并发送给用户终端,用户可以从终端中对每一项服务项目作评分并返回给服务器,服务器可以记录并统计低于预设分数的服务项目,从而生成对应的不及格项目列表,供服务人员作参考修改;若用户标签为待解决标签,说明用户此前的问题并未能解决,则通知相关人员跟进处理,。
如图2所示,为本发明提供的一种用于电网用户服务评价的处理系统的一个实施例的示意图。在该实施例中,包括:
词库处理模块,用以获取多个数据源的候选关键词和用户输入的服务评价信息;并根据第一预设规则对所述服务评价信息进行分词处理,获取多个分词,将所述候选关键词与所述多个分词进行配对,获取所述候选关键词配对的分词数;以及将所述分词数大于预设阈值的候选关键词作为最终关键词,将所有最终关键词组成词库;具体地,所述词库处理模块通过网络获取敏感词或行业的相关词汇或根据以往的用户评价由用户挑选的关键词,作为候选关键词;以及获取用户的服务评价信息作为训练集,根据预设的模型对训练集进行训练,划分服务评价信息中的每个词的状态信息,生成状态值集合,获取多个分词。
语义处理模块,用以获取多个所述最终关键词的语义相关参数,将所述语义相关参数超过预设的相关度阙值的最终关键词归于同一个数组,根据预设的语义分类器对每一组数组的词语进行排列,得到最终的语义意图;具体地,所述语义处理模块将所述最终语义意图的文本信息中的各个字符与独热维度字典进行匹配,确定独热维度字典中是否存在与所述文本信息相同的字符;若存在相同的字符,获取所述文本信息中的字符对应的独热维度向量,作为所述文本信息对应的独热维度向量,将所述文本信息对应的独热维度向量组成所述文本信息对应的字嵌入向量序列。
用户标签模块,用以获取所述最终的语义意图的文本信息,根据预设的独热维度字典确定所述文本信息对应的字嵌入向量序列;将字嵌入向量序列输入卷积神经网络,获得对应的每个预设用户画像的概率值,以数值最高的概率值对应的用户画像为用户标签;其中,所述最终的语义意图的文本信息包括多个字符;所述用户标签至少包括满意、良好、不满意和待解决。
反馈服务模块,用以根据所述用户标签确定从反馈服务列表中查找到对应的反馈服务项目,提供用户标签对应的反馈服务项目。具体地,所述反馈服务模块获取的用户标签为满意标签,则记录历史数据中为该用户提供的服务的操作流程,以用作下一次提供相同服务的标准操作;获取的用户标签为良好标签,则查询提供的服务的操作流程是否出错;获取的用户标签为不满意标签,则查询用户相应的服务项目的历史数据,生成服务项目的历史列表并发送给用户终端,获取用户对每一项服务项目的评分并统计低于预设分数的服务项目,生成对应的不及格项目列表作为修改参考;获取的用户标签为待解决标签,则通知相关人员跟进处理。
综上,实施本发明的实施例,具有如下的有益效果:
本发明提供的用于电网用户服务评价的处理方法及系统,通过对服务评价信息进行整合处理,生成对应的标签,从而可以通过标签对服务评价信息进行筛选分类,提高了服务评价信息的处理效率,减少人为出错概率。基于语义向量的权重,获取对应的语义,在由语义分类器进行分类排列,不会割裂上下文的文意,也不会损失掉因强行拆分导致的含义的丢失,从而可以选择出最有可能的备选语义意图作为最终语义意图输出,而且通过神经网络的处理,可以再次确保语义提取的正确率和精确度;基于特征序列确定用户意图分数值,根据分数值确定对应的各个标签,可以使得为视频确定的标签更加精准和丰富。以上所揭露的仅为本发明一种较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (10)

1.一种用于电网用户服务评价的处理方法,其特征在于,包括以下步骤:
步骤S1,获取多个数据源的候选关键词和用户输入的服务评价信息;并根据第一预设规则对所述服务评价信息进行分词处理,获取多个分词,将所述候选关键词与所述多个分词进行配对,获取所述候选关键词配对的分词数;以及将所述分词数大于预设阈值的候选关键词作为最终关键词,将所有最终关键词组成词库;
步骤S2,获取多个所述最终关键词的语义相关参数,将所述语义相关参数超过预设的相关度阙值的最终关键词归于同一个数组,根据预设的语义分类器对每一组数组的词语进行排列,得到最终的语义意图;
步骤S3,获取所述最终的语义意图的文本信息,根据预设的独热维度字典确定所述文本信息对应的字嵌入向量序列;将字嵌入向量序列输入卷积神经网络,获得对应的每个预设用户画像的概率值,以数值最高的概率值对应的用户画像为用户标签;其中,所述最终的语义意图的文本信息包括多个字符;所述用户标签至少包括满意、良好、不满意和待解决;
步骤S4,根据所述用户标签确定从反馈服务列表中查找到对应的反馈服务项目,提供用户标签对应的反馈服务项目。
2.如权利要求1所述的方法,其特征在于,所述步骤S1包括:
通过网络获取敏感词或行业的相关词汇或根据以往的用户评价由用户挑选的关键词,作为候选关键词。
3.如权利要求2所述的方法,其特征在于,所述步骤S1还包括:
获取用户的服务评价信息作为训练集,根据预设的模型对训练集进行训练,划分服务评价信息中的每个词的状态信息,生成状态值集合,获取多个分词。
4.如权利要求3所述的方法,其特征在于,所述步骤S3包括:
将所述最终语义意图的文本信息中的各个字符与独热维度字典进行匹配,确定独热维度字典中是否存在与所述文本信息相同的字符;若存在相同的字符,获取所述文本信息中的字符对应的独热维度向量,作为所述文本信息对应的独热维度向量,将所述文本信息对应的独热维度向量组成所述文本信息对应的字嵌入向量序列。
5.如权利要求4所述的方法,其特征在于,所述步骤S4包括:
若用户标签为满意标签,则记录历史数据中为该用户提供的服务的操作流程,以用作下一次提供相同服务的标准操作;
若用户标签为良好标签,则查询提供的服务的操作流程是否出错;
若用户标签为不满意标签,则查询用户相应的服务项目的历史数据,生成服务项目的历史列表并发送给用户终端,获取用户对每一项服务项目的评分并统计低于预设分数的服务项目,生成对应的不及格项目列表作为修改参考;
若用户标签为待解决标签,则通知相关人员跟进处理。
6.如权利要求1所述的方法,其特征在于,所述步骤S1还包括:
对用户的服务评价信息进行预处理,根据预设的规范编码进行格式转化,过滤格式转化后的服务评价信息的无关信息、停用词、英文及出现频率最高的词或单词组合;其中,所述无关信息至少包括标点符号,网址信息和表情信息。
7.一种用于电网用户服务评价的处理系统,用以实现如权利要求1-6任一所述的方法,其特征在于,包括:
词库处理模块,用以获取多个数据源的候选关键词和用户输入的服务评价信息;并根据第一预设规则对所述服务评价信息进行分词处理,获取多个分词,将所述候选关键词与所述多个分词进行配对,获取所述候选关键词配对的分词数;以及将所述分词数大于预设阈值的候选关键词作为最终关键词,将所有最终关键词组成词库;
语义处理模块,用以获取多个所述最终关键词的语义相关参数,将所述语义相关参数超过预设的相关度阙值的最终关键词归于同一个数组,根据预设的语义分类器对每一组数组的词语进行排列,得到最终的语义意图;
用户标签模块,用以获取所述最终的语义意图的文本信息,根据预设的独热维度字典确定所述文本信息对应的字嵌入向量序列;将字嵌入向量序列输入卷积神经网络,获得对应的每个预设用户画像的概率值,以数值最高的概率值对应的用户画像为用户标签;其中,所述最终的语义意图的文本信息包括多个字符;所述用户标签至少包括满意、良好、不满意和待解决;
反馈服务模块,用以根据所述用户标签确定从反馈服务列表中查找到对应的反馈服务项目,提供用户标签对应的反馈服务项目。
8.如权利要求7所述的系统,其特征在于,所述词库处理模块通过网络获取敏感词或行业的相关词汇或根据以往的用户评价由用户挑选的关键词,作为候选关键词;以及获取用户的服务评价信息作为训练集,根据预设的模型对训练集进行训练,划分服务评价信息中的每个词的状态信息,生成状态值集合,获取多个分词。
9.如权利要求8所述的系统,其特征在于,所述语义处理模块将所述最终语义意图的文本信息中的各个字符与独热维度字典进行匹配,确定独热维度字典中是否存在与所述文本信息相同的字符;若存在相同的字符,获取所述文本信息中的字符对应的独热维度向量,作为所述文本信息对应的独热维度向量,将所述文本信息对应的独热维度向量组成所述文本信息对应的字嵌入向量序列。
10.如权利要求9所述的系统,其特征在于,所述反馈服务模块获取的用户标签为满意标签,则记录历史数据中为该用户提供的服务的操作流程,以用作下一次提供相同服务的标准操作;
获取的用户标签为良好标签,则查询提供的服务的操作流程是否出错;
获取的用户标签为不满意标签,则查询用户相应的服务项目的历史数据,生成服务项目的历史列表并发送给用户终端,获取用户对每一项服务项目的评分并统计低于预设分数的服务项目,生成对应的不及格项目列表作为修改参考;
获取的用户标签为待解决标签,则通知相关人员跟进处理。
CN202011344576.1A 2020-11-26 2020-11-26 一种用于电网用户服务评价的处理方法及系统 Active CN112541077B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011344576.1A CN112541077B (zh) 2020-11-26 2020-11-26 一种用于电网用户服务评价的处理方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011344576.1A CN112541077B (zh) 2020-11-26 2020-11-26 一种用于电网用户服务评价的处理方法及系统

Publications (2)

Publication Number Publication Date
CN112541077A CN112541077A (zh) 2021-03-23
CN112541077B true CN112541077B (zh) 2023-11-17

Family

ID=75016826

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011344576.1A Active CN112541077B (zh) 2020-11-26 2020-11-26 一种用于电网用户服务评价的处理方法及系统

Country Status (1)

Country Link
CN (1) CN112541077B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113220985B (zh) * 2021-04-06 2022-07-19 天津大学 基于健康养老环境下嵌入式用户画像模型的服务推荐方法
CN115879901B (zh) * 2023-02-22 2023-07-28 陕西湘秦衡兴科技集团股份有限公司 一种智能人事自助服务平台
CN116579351B (zh) * 2023-07-14 2024-03-19 广州淘通科技股份有限公司 一种用户评价信息的分析方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1991976A (zh) * 2005-12-31 2007-07-04 潘建强 基于音素的语音识别方法与系统
CN107277630A (zh) * 2017-07-20 2017-10-20 海信集团有限公司 语音提示信息的显示方法及装置
CN108960402A (zh) * 2018-06-11 2018-12-07 上海乐言信息科技有限公司 一种面向聊天机器人的混合策略式情感安抚系统
CN110517121A (zh) * 2019-09-23 2019-11-29 重庆邮电大学 基于评论文本情感分析的商品推荐方法及商品推荐装置
CN110705286A (zh) * 2019-09-24 2020-01-17 青木数字技术股份有限公司 一种基于评论信息的数据处理方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1991976A (zh) * 2005-12-31 2007-07-04 潘建强 基于音素的语音识别方法与系统
CN107277630A (zh) * 2017-07-20 2017-10-20 海信集团有限公司 语音提示信息的显示方法及装置
CN108960402A (zh) * 2018-06-11 2018-12-07 上海乐言信息科技有限公司 一种面向聊天机器人的混合策略式情感安抚系统
CN110517121A (zh) * 2019-09-23 2019-11-29 重庆邮电大学 基于评论文本情感分析的商品推荐方法及商品推荐装置
CN110705286A (zh) * 2019-09-24 2020-01-17 青木数字技术股份有限公司 一种基于评论信息的数据处理方法及装置

Also Published As

Publication number Publication date
CN112541077A (zh) 2021-03-23

Similar Documents

Publication Publication Date Title
CN112541077B (zh) 一种用于电网用户服务评价的处理方法及系统
CN109947909B (zh) 智能客服应答方法、设备、存储介质及装置
WO2020244073A1 (zh) 基于语音的用户分类方法、装置、计算机设备及存储介质
CN110580308B (zh) 信息审核方法及装置、电子设备、存储介质
US10019492B2 (en) Stop word identification method and apparatus
CN109858626B (zh) 一种知识库构建方法及装置
CN111797202B (zh) 一种基于人工智能的客服对话方法
CN112035599A (zh) 基于垂直搜索的查询方法、装置、计算机设备及存储介质
JP2012198684A (ja) 情報処理装置、帳票種別推定方法および帳票種別推定用プログラム
CN112116168B (zh) 一种用户行为的预测方法、装置及电子设备
CN110866102A (zh) 检索处理方法
CN114398891B (zh) 基于日志关键词生成kpi曲线并标记波段特征的方法
CN110472057B (zh) 话题标签的生成方法及装置
CN111325019A (zh) 词库的更新方法及装置、电子设备
CN113343701B (zh) 一种电力设备故障缺陷文本命名实体的抽取方法及装置
CN112395881B (zh) 物料标签的构建方法、装置、可读存储介质及电子设备
CN116628173B (zh) 一种基于关键字提取的智能客服信息生成系统及生成方法
CN116579351B (zh) 一种用户评价信息的分析方法及装置
CN111104422A (zh) 一种数据推荐模型的训练方法、装置、设备及存储介质
CN114022086B (zh) 基于bom识别的采购方法、装置、设备及存储介质
CN115269998A (zh) 信息推荐方法、装置、电子设备及存储介质
CN115994531A (zh) 一种多维度文本综合辨识方法
CN112579666A (zh) 智能问答系统和方法及相关设备
CN113139106B (zh) 一种保密检查的事件审核方法和装置
CN117496545B (zh) 一种面向pdf文档的表格数据融合处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant