CN112685559B - 计量自动化系统的监测方法、装置、计算机设备和介质 - Google Patents

计量自动化系统的监测方法、装置、计算机设备和介质 Download PDF

Info

Publication number
CN112685559B
CN112685559B CN202011517186.XA CN202011517186A CN112685559B CN 112685559 B CN112685559 B CN 112685559B CN 202011517186 A CN202011517186 A CN 202011517186A CN 112685559 B CN112685559 B CN 112685559B
Authority
CN
China
Prior art keywords
user
quantization
quantized
index
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011517186.XA
Other languages
English (en)
Other versions
CN112685559A (zh
Inventor
伍少成
刘涛
曹小洪
孙文龙
陈晓伟
姜和芳
赵杰
马越
李瑾
陆月明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Power Supply Co ltd
Original Assignee
Shenzhen Power Supply Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Power Supply Co ltd filed Critical Shenzhen Power Supply Co ltd
Priority to CN202011517186.XA priority Critical patent/CN112685559B/zh
Publication of CN112685559A publication Critical patent/CN112685559A/zh
Application granted granted Critical
Publication of CN112685559B publication Critical patent/CN112685559B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及一种计量自动化系统的监测方法、装置、计算机设备和介质,该方法通过获取用户针对计量自动化系统的用户量化数据,并通过情感分析提取该用户量化数据中的多个负面情绪量化数据,根据该多个负面情绪量化数据建立用户量化表,最后将该用户量化表和针对该计量自动化系统预设的固有量化表进行融合,得到目标量化表。该目标量化表中的量化指标不仅包括历史经验量化指标,也包含有通过用户量化表引入的多个用户量化指标,大大消除了原始历史经验量化指标的局限性,从而有效解决现有技术中存在的采用专家制定的部分评价指标无法对计量自动化系统进行全面的监控的技术问题,达到提高对于计量自动化系统监控全面性的技术效果。

Description

计量自动化系统的监测方法、装置、计算机设备和介质
技术领域
本申请涉及电能计量技术领域,特别是涉及一种计量自动化系统的监测方法、装置、计算机设备和介质。
背景技术
计量自动化系统是一种集多种技术为一体的用电需求侧综合性的实时信息采集与分析处理系统,相比于传统电能计量体系,计量自动化系统具有工作效率高、工作成本低、智能化程度高、稳定性强、安全性高等优点,因此被广泛应用于各大电网中。
计量自动化系统作为一种信息处理系统,在对信息处理过程中不可避免的存在一系列安全隐患,而信息安全问题关系到社会稳定和国计民生,因此,需要对计量自动化系统的状态信息进行实时监控。传统技术中通常采用是通过专家根据经验制定部分评价指标,根据该评价指标对计量自动化系统中对应的状态信息进行监控。
但是,由于计量自动化系统的状态信息过于繁杂,采用专家制定的部分评价指标无法对计量自动化系统进行全面的监控。
发明内容
基于此,有必要针对上述技术问题,提供一种计量自动化系统的监测方法、装置、计算机设备和介质。
第一方面,提供了一种计量自动化系统的监测方法,该方法包括:
获取用户针对计量自动化系统的用户量化数据;
采用情感分析模型对用户量化数据进行情感分析,得到多个负面情绪量化数据;
根据多个负面情绪量化数据建立用户量化表,用户量化表中包括分别与每个负面情绪量化数据对应的多个用户量化指标;
对用户量化表和针对计量自动化系统预设的固有量化表进行融合,得到目标量化表,并根据目标量化表对计量自动化系统的性能进行监控;其中,固有量化表中包括多个历史经验量化指标。
在本申请的一个可选实施例中,获取用户针对计量自动化系统的用户量化数据,包括:获取用户针对计量自动化系统的原始用户量化数据;其中,原始用户量化数据包括多个用户量化句子;采用词频-逆向文本频率模型确定每个用户量化句子的句子向量;根据每个用户量化句子的句子向量,对原始用户量化数据进行聚类,得到用户量化数据;其中,用户量化数据包括多个句子分组,每个句子分组中的任意两个句子之间的相似度大于预设的相似度阈值。
在本申请的一个可选实施例中,采用词频-逆向文本频率模型确定每个用户量化句子的句子向量,包括:对原始用户量化数据中的每个用户量化句子进行分词处理,得到每个用户量化句子的分词;获取每个分词在多个用户量化句子中出现的频次;获取每个分词在多个用户量化句子中的逆向文本频率;根据每个分词在多个用户量化句子中出现的频次,以及每个分词在多个用户量化句子中的逆向文本频率,从多个用户量化句子中确定热词以及确定每个用户量化句子中热词的词向量;对每个用户量化句子中热词的词向量进行加权求和,得到每个用户量化句子的句子向量。
在本申请的一个可选实施例中,根据每个分词在多个用户量化句子中出现的频次,以及每个分词在多个用户量化句子中的逆向文本频率,从多个用户量化句子中确定热词,包括:将在多个用户量化句子中出现的频次大于预设频次阈值,且逆向文本频率大于预设频率的分词,确定为热词。
在本申请的一个可选实施例中,根据每个用户量化句子的句子向量,对原始用户量化数据进行聚类,得到用户量化数据,包括:计算两两句子向量之间的向量余弦值,得到任意两个用户量化句子之间的相似度;根据相似度对原始用户量化数据中的多个用户量化句子进行聚类,得到用户量化数据,其中,用户量化数据包括多个句子分组。
在本申请的一个可选实施例中,根据多个负面情绪量化数据建立用户量化表,包括:基于文本摘要算法提取每个负面情绪量化数据的摘要文本;根据摘要文本确定每个负面情绪量化数据对应的用户量化指标;根据多个用户量化指标建立用户量化表。
在本申请的一个可选实施例中,对用户量化表和针对计量自动化系统预设的固有量化表进行融合,得到目标量化表,包括:根据用户量化表以及预设的评分模型,确定用户量化绩效表;其中,用户量化绩效表中包括多个用户量化指标与指标重要度之间的对应关系;根据针对计量自动化系统预设的固有量化表以及评分模型,确定固有量化绩效表;其中,固有量化绩效表中包括多个历史经验量化指标与指标重要度之间的对应关系;从用户量化绩效表确定第一量化指标以及从固有量化绩效表中确定第二量化指标;其中,第一量化指标与第二量化指标的指标语义相同;对第一量化指标对应的指标重要度和第二量化指标对应的指标重要度进行加和计算,得到目标量化指标的指标重要度;其中,目标量化指标为第一量化指标和第二量化指标中的任一个;根据目标量化指标、目标量化指标的指标重要度、用户量化绩效表中除第一量化指标之外的其他用户量化指标以及其他用户量化指标的指标重要度,以及固有量化表中除第二量化指标之外的其他历史经验量化指标以及其他历史经验量化指标的指标重要度,确定目标量化表。
第二方面,提供了一种计量自动化系统的监测装置,该装置包括:获取模块、分析模块、量化表建立模块和监控模块。
该获取模块用于获取用户针对计量自动化系统的用户量化数据;
该分析模块用于采用情感分析模型对用户量化数据进行情感分析,得到多个负面情绪量化数据;
该量化表建立模块用于根据多个负面情绪量化数据建立用户量化表,用户量化表中包括分别与每个负面情绪量化数据对应的多个用户量化指标;
该监控模块用于对用户量化表和针对计量自动化系统预设的固有量化表进行融合,得到目标量化表,并根据目标量化表对计量自动化系统的性能进行监控;其中,固有量化表中包括多个历史经验量化指标。
在本申请的一个可选实施例中,该获取模块具体用于,获取用户针对计量自动化系统的原始用户量化数据;其中,原始用户量化数据包括多个用户量化句子;采用词频-逆向文本频率模型确定每个用户量化句子的句子向量;根据每个用户量化句子的句子向量,对原始用户量化数据进行聚类,得到用户量化数据;其中,用户量化数据包括多个句子分组,每个句子分组中的任意两个句子之间的相似度大于预设的相似度阈值。
在本申请的一个可选实施例中,该获取模块具体用于,对原始用户量化数据中的每个用户量化句子进行分词处理,得到每个用户量化句子的分词;获取每个分词在多个用户量化句子中出现的频次;获取每个分词在多个用户量化句子中的逆向文本频率;根据每个分词在多个用户量化句子中出现的频次,以及每个分词在多个用户量化句子中的逆向文本频率,从多个用户量化句子中确定热词以及确定每个用户量化句子中热词的词向量;对每个用户量化句子中热词的词向量进行加权求和,得到每个用户量化句子的句子向量。
在本申请的一个可选实施例中,该获取模块具体用于,将在多个用户量化句子中出现的频次大于预设频次阈值,且逆向文本频率大于预设频率的分词,确定为热词。
在本申请的一个可选实施例中,该获取模块具体用于,计算两两句子向量之间的向量余弦值,得到任意两个用户量化句子之间的相似度;根据相似度对原始用户量化数据中的多个用户量化句子进行聚类,得到用户量化数据,其中,用户量化数据包括多个句子分组。
在本申请的一个可选实施例中,该量化表建立模块具体用于,基于文本摘要算法提取每个负面情绪量化数据的摘要文本;根据摘要文本确定每个负面情绪量化数据对应的用户量化指标;根据多个用户量化指标建立用户量化表。
在本申请的一个可选实施例中,该监控模块具体用于,根据用户量化表以及预设的评分模型,确定用户量化绩效表;其中,用户量化绩效表中包括多个用户量化指标与指标重要度之间的对应关系;根据针对计量自动化系统预设的固有量化表以及评分模型,确定固有量化绩效表;其中,固有量化绩效表中包括多个历史经验量化指标与指标重要度之间的对应关系;从用户量化绩效表确定第一量化指标以及从固有量化绩效表中确定第二量化指标;其中,第一量化指标与第二量化指标的指标语义相同;对第一量化指标对应的指标重要度和第二量化指标对应的指标重要度进行加和计算,得到目标量化指标的指标重要度;其中,目标量化指标为第一量化指标和第二量化指标中的任一个;根据目标量化指标、目标量化指标的指标重要度、用户量化绩效表中除第一量化指标之外的其他用户量化指标以及其他用户量化指标的指标重要度,以及固有量化表中除第二量化指标之外的其他历史经验量化指标以及其他历史经验量化指标的指标重要度,确定目标量化表。
第三方面,提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现如上的方法的步骤。
第四方面,提供了一种计算机可读介质,其上存储有计算机程序,计算机程序被处理器执行时实现如上的方法的步骤。
本申请实施例提供的计量自动化系统的监测方法,通过获取用户针对计量自动化系统的用户量化数据,并通过情感分析提取该用户量化数据中的多个负面情绪量化数据,然后根据该多个负面情绪量化数据建立用户量化表,最后将该用户量化表和针对该计量自动化系统预设的固有量化表进行融合,得到用于对该计量自动化系统进行监控的目标量化表。该目标量化表中的量化指标不仅包括历史经验量化指标,也包含有通过用户量化表引入的多个用户量化指标,大大消除了原始历史经验量化指标的局限性。因此,本申请实施例提供的计量自动化系统的监测方法,可以有效解决现有技术中存在的采用专家制定的部分评价指标无法对计量自动化系统进行全面的监控的技术问题,达到大大提高对于计量自动化系统监控全面性的技术效果。
附图说明
图1为一个实施例中计量自动化系统的监测方法的流程示意图;
图2为一个实施例中计量自动化系统的监测方法的流程示意图;
图3为一个实施例中计量自动化系统的监测方法的流程示意图;
图4为一个实施例中计量自动化系统的监测方法的流程示意图;
图5为一个实施例中计量自动化系统的监测方法的流程示意图;
图6为一个实施例中计量自动化系统的监测装置的结构框图;
图7为一个实施例中计算机设备的结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
计量自动化系统是一种集多种技术为一体的用电需求侧综合性的实时信息采集与分析处理系统,相比于传统电能计量体系,计量自动化系统具有工作效率高、工作成本低、智能化程度高、稳定性强、安全性高等优点,因此被广泛应用于各大电网中。计量自动化系统作为一种信息处理系统,在对信息处理过程中不可避免的存在一系列安全隐患,而信息安全问题关系到社会稳定和国计民生,因此,需要对计量自动化系统的状态信息进行实时监控。传统技术中通常采用是通过专家根据经验制定部分评价指标,根据该评价指标对计量自动化系统中对应的状态信息进行监控。但是,由于计量自动化系统的状态信息过于繁杂,采用专家制定的部分评价指标无法对计量自动化系统进行全面的监控。
有鉴于此,本申请实施例提供了一种计量自动化系统的监测方法,通过获取用户针对计量自动化系统的用户量化数据,并通过情感分析提取该用户量化数据中的多个负面情绪量化数据,然后根据该多个负面情绪量化数据建立用户量化表,最后将该用户量化表和针对该计量自动化系统预设的固有量化表进行融合,得到用于对该计量自动化系统进行监控的目标量化表。该目标量化表中的量化指标不仅包括历史经验量化指标,也包含有通过用户量化表引入的多个用户量化指标,大大消除了原始历史经验量化指标的局限性。因此,本申请实施例提供的计量自动化系统的监测方法,可以有效解决现有技术中存在的采用专家制定的部分评价指标无法对计量自动化系统进行全面的监控的技术问题,达到大大提高对于计量自动化系统监控全面性的技术效果。
下面,将对本申请实施例提供的计量自动化系统的监测方法所涉及的实施环境进行简要地说明。
本申请实施例提供的计量自动化系统的监测方法的执行主体为计算机设备,该计算机设备可以包括但不限于是工业计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备等。以下实施例以计算机设备为执行主体进行具体说明,但需要指出的是,本申请实施例对该计算机设备的具体类型不作任何限定。
请参见图1,本申请一个实施例提供了一种计量自动化系统的监测方法,可以应用于上述的计算机设备,以下实施例以该方法应用于计算机设备,对计量自动化系统进行监控为例进行说明,包括如下步骤101-步骤104:
步骤101、计算机设备获取用户针对计量自动化系统的用户量化数据。
其中,用户量化数据可以是用户针对计量自动化系统的直接用户评价数据,也可以是通过合情推理得到的间接用户评价数据,还可以是其他的涉及到对于计量自动化系统的用户评价数据。本实施例中计算机获取用户针对计量自动化系统的用户量化数据的途径包括但不限于以下四个方面:第一方面,计算机设备通过爬虫等信息获取程序直接从网络各大生活论坛、微博、贴吧等中爬取关于计量自动化系统的评价信息。第二方面,计算机设备从官方邮箱获取用户发送的电子邮件,从该电子邮件内提取得到关于计量自动化系统的评价信息。第三方面,工作人员从线下意见箱中收集意见反馈表,并将意见反馈表中的用户评价信息整理出来输入至计算机设备。第四方面,工作人员通过线上和线下问卷调查的形式,对用户主动发起线上或线下的问卷调查,并将通过问卷调查获得的用户评价信息导入计算机设备。本实施例通过上述四个方面获取用户针对计量自动化系统的用户评价数据,可以大大提高用户评价数据的丰富性与全面性,在一定程度上也可以有效提高本申请实施例提供的计量自动化系统的监测方法的全面性和准确性。
步骤102、计算机设备采用情感分析模型对用户量化数据进行情感分析,得到多个负面情绪量化数据。
计算机设备内部预先存储有情感分析模型,例如朴素贝叶斯中文情感分类模型等,计算机设备将通过上述步骤101获取得到的用户量化数据输入至该朴素贝叶斯中文情感分类模型,该朴素贝叶斯中文情感分类模型对用户量化数据中的每条数据进行情感分析,得到每条数据的情感属性,例如为积极情绪、消极情绪或中性情绪。计算机设备将所有情感属性为消极情绪的用户量化数据进行提取整合,即可得到上述的多个负面情绪量化数据。
步骤103、计算机设备根据多个负面情绪量化数据建立用户量化表,用户量化表中包括分别与每个负面情绪量化数据对应的多个用户量化指标。
计算机设备通过上述步骤102得到多个负面情绪量化数据,可以通过如下两种方式建立用户量化表:第一方面,计算机设备可以直接将每个负面情绪量化数据作为一条对应的用户量化指标,将该多个负面情绪量化数据的集合作为该用户量化表。第二方面,计算机设备对每个负面情绪量化数据进行关键词提取,得到每个负面情绪量化数据中的关键短句、短语、甚至关键词语等。每个负面情绪量化数据对应的关键短句、关键短语、关键词语等构成该负面情绪量化数据对应的用户量化指标,将得到的多个负面情绪量化数据对应的关键短句、关键短语或者关键词语的集合作为该用户量化表。
步骤104、计算机设备对用户量化表和针对计量自动化系统预设的固有量化表进行融合,得到目标量化表,并根据目标量化表对计量自动化系统的性能进行监控。
计算机设备内部预先存储有针对计量自动化系统预设的固有量化表,该固有量化表中包括多个历史经验量化指标,该多个历史经验量化指标可以是由行业专家制定的关于计量自动化系统在应用层面较为薄弱的节点,例如用户隐私、安全性等,该固有量化表可以不限定于是专家设定的,也可以由计量自动化系统的研发人员等设定,还可以是计量自动化系统自带的固有量化指标。计算机设备通过上述步骤101-103得到用户量化表,将该用户量化表和上述固有量化表进行融合,即将该用户量化表中的多个用户量化指标和上述固有量化表中的多个历史经验量化指标进行融合。换句话说,也就是形成该多个用户量化指标和该多个历史经验量化指标集合,然后根据该集合中的所有量化指标建立目标量化表。该目标量化表中的量化指标包含有所有的历史经验量化指标,也包含有所有的用户量化指标,全面性更高。最后,计算机设备将该目标量化表以图标等形式输出,工作人员根据该目标量化表中的多个量化指标对该计量自动化系统的性能进行监控,监控全面性更高。
本申请实施例提供的计量自动化系统的监测方法,通过获取用户针对计量自动化系统的用户量化数据,并通过情感分析提取该用户量化数据中的多个负面情绪量化数据,然后根据该多个负面情绪量化数据建立用户量化表,最后将该用户量化表和针对该计量自动化系统预设的固有量化表进行融合,得到用于对该计量自动化系统进行监控的目标量化表。该目标量化表中的量化指标不仅包括历史经验量化指标,也包含有通过用户量化表引入的多个用户量化指标,大大消除了原始历史经验量化指标的局限性。因此,本申请实施例提供的计量自动化系统的监测方法,可以有效解决现有技术中存在的采用专家制定的部分评价指标无法对计量自动化系统进行全面的监控的技术问题,大大提高了对于计量自动化系统监控的全面性。
请参见图2,在本申请的一个可选实施例中,图2涉及的是步骤101计算机设备获取用户针对计量自动化系统的用户量化数据的具体过程,步骤101包括如下步骤201-步骤203:
步骤201、计算机设备获取用户针对计量自动化系统的原始用户量化数据。
计算机设备可以通过如步骤101中四种不同的途径获取得到针对计量自动化系统的原始用户量化数据,该原始用户量化数据是指计算机设备从网页、电子邮件、意见反馈表和问卷调查中直接获取得到的量化数据。其中,每个该原始用户量化数据中包括多个用户量化句子,例如“计量自动化系统容易泄露我的手机号”、“计量自动化系统用户界面操作太麻烦了”等,本实施例对于该原始用户量化数据的具体内容和数量不作任何限定。
步骤202、计算机设备采用词频-逆向文本频率模型确定每个用户量化句子的句子向量。
原始用户量化数据中包括有多个用户量化句子,计算机设备采用词频-逆向文本频率模型确定每个用户量化句子的句子向量。词频-逆向文本频率模型即TF-IDF(termfrequency–inverse document frequency)模型,TF-IDF模型用于对多个用户量化句子中的信息进行检索与挖掘,其中,TF为词频(Term Frequency),用于表征目标分词在该多个用户量化句子中出现的频率;IDF为逆向文本频率指数(Inverse Document Frequency),用于表征目标分词在该多个用户量化句子中的重要程度,也就是目标分词在该多个用户量化句子中的权重。计算机设备将该多个用户量化句子,即上述的原始用户量化数据输入至该TF-IDF模型,即可得到每个用户量化句子的句子向量,该句子向量用于表征每个用户量化句子的语义特征,每个用户量化句子利用对应的句子向量进行表征可以大大方便不同语义的用户量化句子之间的综合比较,以进一步提高数据处理效率。
步骤203、计算机设备根据每个用户量化句子的句子向量,对原始用户量化数据进行聚类,得到用户量化数据。
计算机设备通过上述步骤202得到每个用户量化句子的句子向量V,每个用户量化句子对应有一个句子向量V,计算机设备对得到的多个句子向量V进行两两相似度比对,以确定每两个用户量化句子之间的相似度。
在一个具体的实施例中,计算机设备计算两两句子向量之间的向量余弦值,得到任意两个用户量化句子之间的相似度。
计算机设备可以通过如下公式(1)计算第一句子向量V1和第二句子向量V2之间的向量余弦值以确定第一用户量化句子和第二用户量化句子之间的相似度:
(1)式中,SimilarityV1,V2是指第一句子向量和第二句子向量之间的向量余弦值,V1是指第一用户量化句子的句子向量,V2是指第二用户量化句子的句子向量。
计算机设备通过公式(1)计算得到第一用户量化句子和第二用户量化句子之间的向量余弦值SimilarityV1,V2,然后通过该向量余弦值确定第一用户量化句子和第二用户量化句子之间相似度,将相似度较高的用户量化句子聚为一类,可以有效提高本申请实施例提供的计量自动化系统的监测方法的数据处理效率。
在一个具体的实施例中,计算机设备根据相似度对原始用户量化数据中的多个用户量化句子进行聚类,得到用户量化数据。
计算机设备通过公式(1)得到每两个用户量化句子之间的向量余弦值,即得到了每两个用户量化句子之间的相似度。例如上述第一用户量化句子和第二用户量化句子,若第一用户量化句子和第二用户量化句子之间的向量余弦值SimilarityV1,V2大于相似度阈值时,则将第一用户量化句子和第二用户量化句子聚为一类,形成一个句子分组。需要指出的是,该相似度阈值可以根据实际情况具体设定,例如0.8等,本实施例不作具体限定。同理,计算机设备分别计算多个句子向量两两之间的向量余弦值,并将该向量余弦值大于相似度阈值的用户量化句子聚为一类,形成多个句子分组,也就是得到了上述的用户量化数据。需要指出的是,其中,用户量化数据包括多个句子分组,每个句子分组中的任意两个句子之间的相似度大于预设的相似度阈值。通过相似度对原始用户量化数据中的多个用户量化句子进行聚类,可以将相似度高的用户量化句子归为一类,进行统一处理,从而大大提高本申请实施例提供的计量自动化系统的监测方法的数据处理效率。
请参见图3,在本申请的一个可选实施例中,图3涉及的是步骤202计算机设备采用词频-逆向文本频率模型确定每个用户量化句子的句子向量的具体过程,步骤202包括如下步骤301-步骤305:
步骤301、计算机设备对原始用户量化数据中的每个用户量化句子进行分词处理,得到每个用户量化句子的分词。
计算机设备通过上述步骤201获取得到原始用户量化数据,该原始用户量化数据中包括多个用户量化句子,计算机设备通过预先存储的分词算法对每个用户量化句子进行分词处理,得到每个用户量化句子中的多个分词。例如对上述的其中一个用户量化句子“计量自动化系统容易泄露我的手机号”进行拆分,拆分为“计量自动化系统”、“容易”、“泄露”、“我的”、“手机号”;将另一个用户量化句子“计量自动化系统用户界面操作太麻烦了”拆分为“计量自动化系统”、“用户界面”、“操作”、“太”、“麻烦”、“了”,总计拆分出11个分词。该分词算法例如可以通过机械分词算法、n元语法的分词算法、或者基于隐马尔可夫模型的分词算法对每个用户量化句子进行分词处理,需要指出的是,本实施例对于分出处理的具体算法或者模型等均不作任何限定,可根据实际情况进行选择或者设定,只需要可以实现将每个用户量化句子拆分为不同的分词的功能即可。
步骤302、计算机设备获取每个分词在多个用户量化句子中出现的频次。
计算机设备通过TF-IDF(term frequency–inverse document frequency)算法计算多个用户量化句子中每个分词出现的频次,例如针对步骤301中对于“计量自动化系统容易泄露我的手机号”、“计量自动化系统用户界面操作太麻烦了”的分词拆分结果,分别统计“计量自动化系统”、“泄露”、“手机号”、“操作”等词在中的分词中出现的频次,例如“计量自动化系统”的频次为2次,“泄露”的频次为1次。
在一个可选的实施例中,可以通过如下公式(2)对每个频次进行归一化处理:
(2)式中,tfi,j是指对第j个用户量化句子中的第i个分词的频次进行归一化后的特征频次,ni,j表示第j个用户量化句子中第i个分词出现的频次,∑knk,j表示k个用户量化句子中所有分词的频次加和。
通过上述归一化处理,使得每个分词的特征频次均除以0~1之间,以避免频次过大而出现偏长文件,从而大大提高数据处理效率。
步骤303、计算机设备获取每个分词在多个用户量化句子中的逆向文本频率。
计算机设备通过TF-IDF(term frequency–inverse document frequency)算法确定每个分词的逆向文本频率,即该分词在该用户量化句子中的重要程度。例如“计量自动化系统容易泄露我的手机号”中“泄漏”和“手机号”的权重分别为0.4,“计量自动化系统”的权重为“0.1”,甚至为“0”。具体的,在本实施例中,可以通过如下公式(3)确定每个分词的逆向文本频率:
(3)式中,idfi是指第i个分词对应的逆向文本频率,|D|是指语料库中,也就是所有的用户量化句子中所有的分词总数,例如上述步骤301中的分词总数为12个;|{j:ti∈dj}|表示包含第i个分词ti的用户量化句子的特征数量,例如针对分词“计量自动化系统”,该分词同时在两个用户量化句子中出现,即该分词的特征数量为2。
进一步的,为防止某一个分词不在语料库中,导致分母为零,则将上述公式(3)修改为公式(4):
通过公式(4)计算确定每个分词的逆向文本频率,可以大大提高对于原始用户量化数据处理的稳定性,从而在一定程度上提高本申请实施例提供的计量自动化系统的监测方法的监测效果。
步骤304、计算机设备根据每个分词在多个用户量化句子中出现的频次,以及每个分词在多个用户量化句子中的逆向文本频率,从多个用户量化句子中确定热词以及确定每个用户量化句子中热词的词向量。
计算机设备通过步骤302确定得出了每个分词的频次,通过步骤303计算得出了每个分词的逆向文本频率。计算机设备将在多个用户量化句子中出现的频次大于预设频次阈值,且逆向文本频率大于预设频率的分词,确定为热词,该热词是指在多个用户量化句子中既重要,且出现频率也高的词语。例如针对上述的两个用户量化句子“计量自动化系统容易泄露我的手机号”和“计量自动化系统用户界面操作太麻烦了”,根据每个分词的频次和逆向文本频率确定得出的热词为“泄漏”、“手机号”、“操作界面”、“麻烦”。在确定热词之后,通过TF-IDF算法确定每个用户量化句子中各热词的词向量,例如针对用户量化句子“计量自动化系统容易泄露我的手机号”,确定“泄漏”和“手机号”的词向量,针对用户量化句子“计量自动化系统用户界面操作太麻烦了”确定“操作界面”和“麻烦”的词向量。
步骤305、计算机设备对每个用户量化句子中热词的词向量进行加权求和,得到每个用户量化句子的句子向量。
计算机设备通过上述步骤304确定得到了每个用户量化句子中各热词的词向量,然后分别对每个热词的词向量按照其重要程度赋予不同的权重,并针对每个用户量化句子计算该用户量化句子中所有热词的词向量的权重加和,即可得到每个用户量化句子对应的句子向量。本实施例通过对每个用户量化句子中热词的词向量进行加权求和,提取关键信息,避免了无用信息的处理过程,大大提高了数据的有效性和数据处理的效率。
请参见图4,在本申请的一个可选实施例中,图4涉及的是步骤103计算机设备根据多个负面情绪量化数据建立用户量化表,用户量化表中包括分别与每个负面情绪量化数据对应的多个用户量化指标的具体过程,步骤103包括如下步骤401-步骤403:
步骤401、计算机设备基于文本摘要算法提取每个负面情绪量化数据的摘要文本。
计算机设备内预先存储有文本摘要算法,该文本摘要算法用于提取负面情绪量化数据中的摘要文本,即关键词。例如针对上述的负面情绪量化数据“计量自动化系统容易泄露我的手机号”,提取得到关键词“泄漏”和“手机号”;针对上述的负面情绪量化数据“计量自动化系统用户界面操作太麻烦了”,提取得到关键词“操作界面”和“麻烦”。在本实施例中,通过文本摘要算法进行摘要文本的提取可以有效避免无用信息对后续数据处理造成干扰,提高对于用户量化数据处理结果的准确性,从而进一步提高本申请实施例中对于计量自动化系统监测的准确性。
步骤402、根据摘要文本确定每个负面情绪量化数据对应的用户量化指标。
计算机设备通过步骤401获取得到每个负面情绪量化数据的摘要文本,然后基于该摘要文本确定用户量化指标。第一方面,计算机设备可以直接将提取得到的摘要文本作为用户量化指标,例如上述的“泄漏”和“手机号”,形成“手机号泄漏”的用户量化指标;上述的“操作界面”和“麻烦”形成“操作界面麻烦”的用户量化指标。第二方面,计算机设备内预先存储有量化指标数据库,计算机设备对提取到的摘要文本进行语义分析,然后根据语义分析结果从量化指标数据库中查询找到与该语义分析结果相同或相近的特定量化指标,将该特定量化指标作为用户量化指标。
步骤403、计算机设备根据多个用户量化指标建立用户量化表。
计算机设备通过上述步骤402得到多个用户量化指标,然后形成该多个用户量化指标的集合,并将该多个用户量化指标以表格的形式进行可视化输出,以方便后续工作人员使用。该用户量化表是根据多个负面情绪量化数据建立而成,里面主要包括用户针对计量自动化系统的负面情绪量化,相比于其他情绪的量化数据,更有利于对计量自动化系统进行监控和改进,从而提高对于计量自动化系统监控的有效性和全面性。同时,该用户量化表中包括有多个用户量化指标,后续工作人员即通过该用户量化表中的多个用户量化指标对计量自动化系统进行监控,用户量化指标针对性强,监控效果更佳。
请参见图5,在本申请的一个可选实施例中,图5涉及的是步骤104计算机设备对用户量化表和针对计量自动化系统预设的固有量化表进行融合,得到目标量化表,并根据目标量化表对计量自动化系统的性能进行监控的具体过程,步骤104包括如下步骤501-步骤505:
步骤501、计算机设备根据用户量化表以及预设的评分模型,确定用户量化绩效表。
计算机设备内预先存储有评分模型,该评分模型用以表征量化指标的重要程度,例如该评分模型包括有五个量度“完全不重要”、“不重要”、“一般”、“重要”、“十分重要”,该五个量度分别对应的绩效成绩为1、2、3、4、5。计算机设备通过上述步骤得到用户量化表,该用户量化表中包含有多个用户量化指标,计算机设备按照该评分模型对该用户量化表中的每一个用户量化指标进行打分。例如上述的用户量化指标“手机号泄漏”为“十分重要”的量级,则打分为5分;上述的用户量化指标“操作界面麻烦”为“重要”的量级,则打分为4分。计算机设备通过对该用户量化表中的每一个用户量化指标进行绩效打分后,并将打分成绩添加到对应的用户量化指标中去,即可形成用户量化绩效表。其中,该用户量化绩效表中包括多个用户量化指标与指标重要度之间的对应关系,即包括多个用户量化指标与绩效成绩之间的对应关系。
步骤502、计算机设备根据针对计量自动化系统预设的固有量化表以及评分模型,确定固有量化绩效表。
计算机设备通过上述步骤104得到固有量化表,该固有量化表中包括多个历史经验量化指标,计算机设备根据评分模型对固有量化表中的每个历史经验量化指标进行打分。例如历史经验量化指标包括“泄漏用户隐私”,根据该评分模型对该历史经验量化指标打分为4分。以此类推,对固有量化表中的每个历史经验量化指标进行打分,并将打分成绩添加到对应的历史经验量化指标中去,即可形成固有量化绩效表。其中,该固有量化绩效表中包括多个历史经验量化指标与指标重要度之间的对应关系,即包括多个历史经验量化指标与绩效成绩之间的对应关系。
步骤503、计算机设备从用户量化绩效表确定第一量化指标以及从固有量化绩效表中确定第二量化指标。
其中,第一量化指标与第二量化指标的指标语义相同。计算机设备通过语义分析,分别得到用户量化绩效表中的每个用户量化指标和固有量化指标中的每个历史经验量化指标的语义分析结果,然后提取用户量化绩效表和固有量化绩效表中语义分析结果相同或相近的指标分别作为第一量化指标和第二量化指标。例如,语义分析结果显示,用户量化绩效表中的“手机号泄漏”这一用户量化指标和固有量化绩效表中的“泄漏用户隐私”历史经验量化指标语义分析结果基本相同,则确定该“手机号泄漏”作为第一量化指标,确定该“泄漏用户隐私”作为第二量化指标。
步骤504、计算机设备对第一量化指标对应的指标重要度和第二量化指标对应的指标重要度进行加和计算,得到目标量化指标的指标重要度。
计算机设备通过步骤503得到第一量化指标和第二量化指标,在第一量化指标和第二量化指标中任选一个量化指标作为目标量化指标。其中,该第一量化指标在用户量化绩效表对应有一个第一绩效成绩,例如该第一量化指标“手机号泄漏”在用户量化绩效表中对应的第一绩效成绩为5分,该第二量化指标“泄漏用户隐私”在固有量化绩效表中对应的第二绩效成绩为4分。计算机设备按照指标重要度对第一绩效成绩和第二绩效成绩进行加和计算,例如用户量化绩效表的重要度,也就是加权系数为0.7,固有量化绩效表的加权系数为0.3,则得到第一绩效成绩和第二绩效成绩的加权成绩为:(5×0.7)+(4×0.3)=4.7分。本实施例对个指标对应的绩效成绩进行加和计算,可以根据实际情况进行调整,从而提高本申请实施例提供的计量自动化系统的监测方法的灵活性以及监测准确度。
同时,在一个可选的实施例中,计算机设备可以直接将第一量化指标对应的指标重要度和第二量化指标对应的指标重要度进行加和,例如将上述第一绩效成绩5分和第二绩效成绩4分进行直接加和,得到总绩效成绩为9分。本实施例通过直接将第一量化指标对应的指标重要度和第二量化指标对应的指标重要度进行加和可以大大减小运算量,从而提高本申请实施例提供的计量自动化系统的监测方法数据处理效率。
步骤505、计算机设备根据目标量化指标、目标量化指标的指标重要度、用户量化绩效表中除第一量化指标之外的其他用户量化指标以及其他用户量化指标的指标重要度,以及固有量化表中除第二量化指标之外的其他历史经验量化指标以及其他历史经验量化指标的指标重要度,确定目标量化表。
计算机设备根据步骤504确定得到多个目标量化指标,并根据该目标量化指标在用户量化绩效表和固有量化表中的指标重要程度,也就是绩效成绩,计算得到每个目标量化指标的目标指标重要度,即绩效成绩总和。最后,计算机设备将该多个目标量化指标和多个总绩效成绩的集合以表格的形式进行可视化输出,即可得到目标量化表。本实施例对于用户量化表和固有量化表中每一个量化指标进行绩效打分,从而调整每个量化指标在计量自动化系统量化体系中的占比,以使本实施例建立的目标量化表更加贴合实际,提高本实施例目标量化表的精确度和适用性。同时,工作人员根据该目标量化表中的目标量化指标以及对应的指标重要程度对计量自动化系统按照指标重要程度进行优先级监控,从而使得本申请实施例提供的计量自动化系统的监测方法更具针对性,且监控效率更高。
应该理解的是,虽然流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
请参见图6,本申请一个实施例提供了一种计量自动化系统的监测装置600,装置包括:获取模块601、分析模块602、量化表建立模块603和监控模块604。
该获取模块601用于获取用户针对计量自动化系统的用户量化数据。
该分析模块602用于采用情感分析模型对用户量化数据进行情感分析,得到多个负面情绪量化数据。
该量化表建立模块603用于根据多个负面情绪量化数据建立用户量化表,用户量化表中包括分别与每个负面情绪量化数据对应的多个用户量化指标。
该监控模块604用于对用户量化表和针对计量自动化系统预设的固有量化表进行融合,得到目标量化表,并根据目标量化表对计量自动化系统的性能进行监控;其中,固有量化表中包括多个历史经验量化指标。
在本申请的一个可选实施例中,该获取模块601具体用于,获取用户针对计量自动化系统的原始用户量化数据;其中,原始用户量化数据包括多个用户量化句子;采用词频-逆向文本频率模型确定每个用户量化句子的句子向量;根据每个用户量化句子的句子向量,对原始用户量化数据进行聚类,得到用户量化数据;其中,用户量化数据包括多个句子分组,每个句子分组中的任意两个句子之间的相似度大于预设的相似度阈值。
在本申请的一个可选实施例中,该获取模块601具体用于,对原始用户量化数据中的每个用户量化句子进行分词处理,得到每个用户量化句子的分词;获取每个分词在多个用户量化句子中出现的频次;获取每个分词在多个用户量化句子中的逆向文本频率;根据每个分词在多个用户量化句子中出现的频次,以及每个分词在多个用户量化句子中的逆向文本频率,从多个用户量化句子中确定热词以及确定每个用户量化句子中热词的词向量;对每个用户量化句子中热词的词向量进行加权求和,得到每个用户量化句子的句子向量。
在本申请的一个可选实施例中,该获取模块601具体用于,将在多个用户量化句子中出现的频次大于预设频次阈值,且逆向文本频率大于预设频率的分词,确定为热词。
在本申请的一个可选实施例中,该获取模块601具体用于,计算两两句子向量之间的向量余弦值,得到任意两个用户量化句子之间的相似度;根据相似度对原始用户量化数据中的多个用户量化句子进行聚类,得到用户量化数据,其中,用户量化数据包括多个句子分组。
在本申请的一个可选实施例中,该量化表建立模块603具体用于,基于文本摘要算法提取每个负面情绪量化数据的摘要文本;根据摘要文本确定每个负面情绪量化数据对应的用户量化指标;根据多个用户量化指标建立用户量化表。
在本申请的一个可选实施例中,该监控模块604具体用于,根据用户量化表以及预设的评分模型,确定用户量化绩效表;其中,用户量化绩效表中包括多个用户量化指标与指标重要度之间的对应关系;根据针对计量自动化系统预设的固有量化表以及评分模型,确定固有量化绩效表;其中,固有量化绩效表中包括多个历史经验量化指标与指标重要度之间的对应关系;从用户量化绩效表确定第一量化指标以及从固有量化绩效表中确定第二量化指标;其中,第一量化指标与第二量化指标的指标语义相同;对第一量化指标对应的指标重要度和第二量化指标对应的指标重要度进行加和计算,得到目标量化指标的指标重要度;其中,目标量化指标为第一量化指标和第二量化指标中的任一个;根据目标量化指标、目标量化指标的指标重要度、用户量化绩效表中除第一量化指标之外的其他用户量化指标以及其他用户量化指标的指标重要度,以及固有量化表中除第二量化指标之外的其他历史经验量化指标以及其他历史经验量化指标的指标重要度,确定目标量化表。
关于计量自动化系统的监测装置600的具体限定可以参见上文中对于计量自动化系统的监测方法的限定,在此不再赘述。上述计量自动化系统的监测装置600中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
图7为本申请一个实施例中计算机设备的内部结构示意图,该计算机设备可以为服务器。如图7所示,该计算机设备包括通过系统总线连接的处理器、存储器以及通信组件。其中,该处理器用于提供计算和控制能力,支撑整个计算机设备的运行。存储器可包括非易失性介质及内存储器。非易失性介质存储有操作系统和计算机程序。该计算机程序可被处理器所执行,以用于实现以上各个实施例所提供的一种计量自动化系统的监测方法。内存储器为非易失性介质中的操作系统以及计算机程序提供高速缓存的运行环境。计算机设备可以通过通信组件与其他的计算机设备(例如STA)进行通信。
本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括:包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现如下步骤:
获取用户针对计量自动化系统的用户量化数据;
采用情感分析模型对用户量化数据进行情感分析,得到多个负面情绪量化数据;
根据多个负面情绪量化数据建立用户量化表,用户量化表中包括分别与每个负面情绪量化数据对应的多个用户量化指标;
对用户量化表和针对计量自动化系统预设的固有量化表进行融合,得到目标量化表,并根据目标量化表对计量自动化系统的性能进行监控;其中,固有量化表中包括多个历史经验量化指标。
在本申请的一个实施例中,处理器执行计算机程序时还实现以下步骤:获取用户针对计量自动化系统的原始用户量化数据;其中,原始用户量化数据包括多个用户量化句子;采用词频-逆向文本频率模型确定每个用户量化句子的句子向量;根据每个用户量化句子的句子向量,对原始用户量化数据进行聚类,得到用户量化数据;其中,用户量化数据包括多个句子分组,每个句子分组中的任意两个句子之间的相似度大于预设的相似度阈值。
在本申请的一个实施例中,处理器执行计算机程序时还实现以下步骤:对原始用户量化数据中的每个用户量化句子进行分词处理,得到每个用户量化句子的分词;获取每个分词在多个用户量化句子中出现的频次;获取每个分词在多个用户量化句子中的逆向文本频率;根据每个分词在多个用户量化句子中出现的频次,以及每个分词在多个用户量化句子中的逆向文本频率,从多个用户量化句子中确定热词以及确定每个用户量化句子中热词的词向量;对每个用户量化句子中热词的词向量进行加权求和,得到每个用户量化句子的句子向量。
在本申请的一个实施例中,处理器执行计算机程序时还实现以下步骤:将在多个用户量化句子中出现的频次大于预设频次阈值,且逆向文本频率大于预设频率的分词,确定为热词。
在本申请的一个实施例中,处理器执行计算机程序时还实现以下步骤:计算两两句子向量之间的向量余弦值,得到任意两个用户量化句子之间的相似度;根据相似度对原始用户量化数据中的多个用户量化句子进行聚类,得到用户量化数据,其中,用户量化数据包括多个句子分组。
在本申请的一个实施例中,处理器执行计算机程序时还实现以下步骤:基于文本摘要算法提取每个负面情绪量化数据的摘要文本;根据摘要文本确定每个负面情绪量化数据对应的用户量化指标;根据多个用户量化指标建立用户量化表。
在本申请的一个实施例中,处理器执行计算机程序时还实现以下步骤:根据用户量化表以及预设的评分模型,确定用户量化绩效表;其中,用户量化绩效表中包括多个用户量化指标与指标重要度之间的对应关系;根据针对计量自动化系统预设的固有量化表以及评分模型,确定固有量化绩效表;其中,固有量化绩效表中包括多个历史经验量化指标与指标重要度之间的对应关系;从用户量化绩效表确定第一量化指标以及从固有量化绩效表中确定第二量化指标;其中,第一量化指标与第二量化指标的指标语义相同;对第一量化指标对应的指标重要度和第二量化指标对应的指标重要度进行加和计算,得到目标量化指标的指标重要度;其中,目标量化指标为第一量化指标和第二量化指标中的任一个;根据目标量化指标、目标量化指标的指标重要度、用户量化绩效表中除第一量化指标之外的其他用户量化指标以及其他用户量化指标的指标重要度,以及固有量化表中除第二量化指标之外的其他历史经验量化指标以及其他历史经验量化指标的指标重要度,确定目标量化表。
本申请实施例提供的计算机设备,其实现原理和技术效果与上述方法实施例类似,在此不再赘述。
在一个实施例中,提供了一种计算机可读介质,其上存储有计算机程序,计算机程序被处理器执行时实现如下步骤:
获取用户针对计量自动化系统的用户量化数据;
采用情感分析模型对用户量化数据进行情感分析,得到多个负面情绪量化数据;
根据多个负面情绪量化数据建立用户量化表,用户量化表中包括分别与每个负面情绪量化数据对应的多个用户量化指标;
对用户量化表和针对计量自动化系统预设的固有量化表进行融合,得到目标量化表,并根据目标量化表对计量自动化系统的性能进行监控;其中,固有量化表中包括多个历史经验量化指标。
在本申请的一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取用户针对计量自动化系统的原始用户量化数据;其中,原始用户量化数据包括多个用户量化句子;采用词频-逆向文本频率模型确定每个用户量化句子的句子向量;根据每个用户量化句子的句子向量,对原始用户量化数据进行聚类,得到用户量化数据;其中,用户量化数据包括多个句子分组,每个句子分组中的任意两个句子之间的相似度大于预设的相似度阈值。
在本申请的一个实施例中,计算机程序被处理器执行时还实现以下步骤:对原始用户量化数据中的每个用户量化句子进行分词处理,得到每个用户量化句子的分词;获取每个分词在多个用户量化句子中出现的频次;获取每个分词在多个用户量化句子中的逆向文本频率;根据每个分词在多个用户量化句子中出现的频次,以及每个分词在多个用户量化句子中的逆向文本频率,从多个用户量化句子中确定热词以及确定每个用户量化句子中热词的词向量;对每个用户量化句子中热词的词向量进行加权求和,得到每个用户量化句子的句子向量。
在本申请的一个实施例中,计算机程序被处理器执行时还实现以下步骤:将在多个用户量化句子中出现的频次大于预设频次阈值,且逆向文本频率大于预设频率的分词,确定为热词。
在本申请的一个实施例中,计算机程序被处理器执行时还实现以下步骤:计算两两句子向量之间的向量余弦值,得到任意两个用户量化句子之间的相似度;根据相似度对原始用户量化数据中的多个用户量化句子进行聚类,得到用户量化数据,其中,用户量化数据包括多个句子分组。
在本申请的一个实施例中,计算机程序被处理器执行时还实现以下步骤:基于文本摘要算法提取每个负面情绪量化数据的摘要文本;根据摘要文本确定每个负面情绪量化数据对应的用户量化指标;根据多个用户量化指标建立用户量化表。
在本申请的一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据用户量化表以及预设的评分模型,确定用户量化绩效表;其中,用户量化绩效表中包括多个用户量化指标与指标重要度之间的对应关系;根据针对计量自动化系统预设的固有量化表以及评分模型,确定固有量化绩效表;其中,固有量化绩效表中包括多个历史经验量化指标与指标重要度之间的对应关系;从用户量化绩效表确定第一量化指标以及从固有量化绩效表中确定第二量化指标;其中,第一量化指标与第二量化指标的指标语义相同;对第一量化指标对应的指标重要度和第二量化指标对应的指标重要度进行加和计算,得到目标量化指标的指标重要度;其中,目标量化指标为第一量化指标和第二量化指标中的任一个;根据目标量化指标、目标量化指标的指标重要度、用户量化绩效表中除第一量化指标之外的其他用户量化指标以及其他用户量化指标的指标重要度,以及固有量化表中除第二量化指标之外的其他历史经验量化指标以及其他历史经验量化指标的指标重要度,确定目标量化表。
本实施例提供的计算机可读介质,其实现原理和技术效果与上述方法实施例类似,在此不再赘述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以M种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(SyMchliMk)DRAM(SLDRAM)、存储器总线(RaMbus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种计量自动化系统的监测方法,其特征在于,包括:
获取用户针对计量自动化系统的用户量化数据;
采用情感分析模型对所述用户量化数据进行情感分析,得到多个负面情绪量化数据;
根据所述多个负面情绪量化数据建立用户量化表,所述用户量化表中包括分别与每个所述负面情绪量化数据对应的多个用户量化指标;
对所述用户量化表和针对所述计量自动化系统预设的固有量化表进行融合,得到目标量化表,并根据所述目标量化表对所述计量自动化系统的性能进行监控;其中,所述固有量化表中包括多个历史经验量化指标;
所述获取用户针对计量自动化系统的用户量化数据,包括:
获取用户针对所述计量自动化系统的原始用户量化数据;其中,所述原始用户量化数据包括多个用户量化句子;
采用词频-逆向文本频率模型确定每个所述用户量化句子的句子向量;
根据每个所述用户量化句子的句子向量,对所述原始用户量化数据进行聚类,得到所述用户量化数据;其中,所述用户量化数据包括多个句子分组,每个句子分组中的任意两个句子之间的相似度大于预设的相似度阈值;
所述根据所述多个负面情绪量化数据建立用户量化表,包括:
基于文本摘要算法提取每个所述负面情绪量化数据的摘要文本;
根据所述摘要文本确定每个所述负面情绪量化数据对应的所述用户量化指标;
根据多个所述用户量化指标建立所述用户量化表;
所述对所述用户量化表和针对所述计量自动化系统预设的固有量化表进行融合,得到目标量化表,包括:
根据所述用户量化表以及预设的评分模型,确定用户量化绩效表;其中,所述用户量化绩效表中包括多个用户量化指标与指标重要度之间的对应关系;
根据针对所述计量自动化系统预设的所述固有量化表以及所述评分模型,确定固有量化绩效表;其中,所述固有量化绩效表中包括多个历史经验量化指标与指标重要度之间的对应关系;
从所述用户量化绩效表确定第一量化指标以及从所述固有量化绩效表中确定第二量化指标;其中,所述第一量化指标与所述第二量化指标的指标语义相同;
对所述第一量化指标对应的指标重要度和所述第二量化指标对应的指标重要度进行加和计算,得到目标量化指标的指标重要度;其中,所述目标量化指标为所述第一量化指标和所述第二量化指标中的任一个;
根据所述目标量化指标、所述目标量化指标的指标重要度、所述用户量化绩效表中除所述第一量化指标之外的其他用户量化指标以及所述其他用户量化指标的指标重要度,以及所述固有量化表中除第二量化指标之外的其他历史经验量化指标以及所述其他历史经验量化指标的指标重要度,确定所述目标量化表。
2.根据权利要求1所述的计量自动化系统的监测方法,其特征在于,所述采用词频-逆向文本频率模型确定每个所述用户量化句子的句子向量,包括:
对所述原始用户量化数据中的每个所述用户量化句子进行分词处理,得到每个所述用户量化句子的分词;
获取每个分词在多个所述用户量化句子中出现的频次;
获取每个分词在多个所述用户量化句子中的逆向文本频率;
根据每个分词在多个所述用户量化句子中出现的频次,以及每个分词在多个所述用户量化句子中的逆向文本频率,从多个所述用户量化句子中确定热词以及确定每个所述用户量化句子中所述热词的词向量;
对每个所述用户量化句子中热词的词向量进行加权求和,得到每个所述用户量化句子的句子向量。
3.根据权利要求2所述的计量自动化系统的监测方法,其特征在于,所述根据每个分词在多个所述用户量化句子中出现的频次,以及每个分词在多个所述用户量化句子中的逆向文本频率,从多个所述用户量化句子中确定热词,包括:
将在多个所述用户量化句子中出现的频次大于预设频次阈值,且所述逆向文本频率大于预设频率的分词,确定为所述热词。
4.根据权利要求1所述的计量自动化系统的监测方法,其特征在于,所述根据每个所述用户量化句子的句子向量,对所述原始用户量化数据进行聚类,得到所述用户量化数据,包括:
计算两句子向量之间的向量余弦值,得到任意两个所述用户量化句子之间的相似度;
根据所述相似度对所述原始用户量化数据中的多个用户量化句子进行聚类,得到所述用户量化数据,其中,所述用户量化数据包括多个句子分组。
5.一种计量自动化系统的监测装置,其特征在于,所述装置包括:
获取模块,用于获取用户针对计量自动化系统的用户量化数据;
分析模块,用于采用情感分析模型对所述用户量化数据进行情感分析,得到多个负面情绪量化数据;
量化表建立模块,用于根据所述多个负面情绪量化数据建立用户量化表,所述用户量化表中包括分别与每个所述负面情绪量化数据对应的多个用户量化指标;
监控模块,用于对所述用户量化表和针对所述计量自动化系统预设的固有量化表进行融合,得到目标量化表,并根据所述目标量化表对所述计量自动化系统的性能进行监控;其中,所述固有量化表中包括多个历史经验量化指标;
所述获取模块,具体用于获取用户针对计量自动化系统的原始用户量化数据;其中,原始用户量化数据包括多个用户量化句子;采用词频-逆向文本频率模型确定每个用户量化句子的句子向量;根据每个用户量化句子的句子向量,对原始用户量化数据进行聚类,得到用户量化数据;其中,用户量化数据包括多个句子分组,每个句子分组中的任意两个句子之间的相似度大于预设的相似度阈值;
所述量化表建立模块,具体用于基于文本摘要算法提取每个负面情绪量化数据的摘要文本;根据摘要文本确定每个负面情绪量化数据对应的用户量化指标;根据多个用户量化指标建立用户量化表;
所述监控模块,具体用于根据用户量化表以及预设的评分模型,确定用户量化绩效表;其中,用户量化绩效表中包括多个用户量化指标与指标重要度之间的对应关系;根据针对计量自动化系统预设的固有量化表以及评分模型,确定固有量化绩效表;其中,固有量化绩效表中包括多个历史经验量化指标与指标重要度之间的对应关系;从用户量化绩效表确定第一量化指标以及从固有量化绩效表中确定第二量化指标;其中,第一量化指标与第二量化指标的指标语义相同;对第一量化指标对应的指标重要度和第二量化指标对应的指标重要度进行加和计算,得到目标量化指标的指标重要度;其中,目标量化指标为第一量化指标和第二量化指标中的任一个;根据目标量化指标、目标量化指标的指标重要度、用户量化绩效表中除第一量化指标之外的其他用户量化指标以及其他用户量化指标的指标重要度,以及固有量化表中除第二量化指标之外的其他历史经验量化指标以及其他历史经验量化指标的指标重要度,确定目标量化表。
6.根据权利要求5所述的计量自动化系统的监测装置,其特征在于,所述获取模块,具体用于对所述原始用户量化数据中的每个所述用户量化句子进行分词处理,得到每个所述用户量化句子的分词;获取每个分词在多个所述用户量化句子中出现的频次;获取每个分词在多个所述用户量化句子中的逆向文本频率;根据每个分词在多个所述用户量化句子中出现的频次,以及每个分词在多个所述用户量化句子中的逆向文本频率,从多个所述用户量化句子中确定热词以及确定每个所述用户量化句子中所述热词的词向量;对每个所述用户量化句子中热词的词向量进行加权求和,得到每个所述用户量化句子的句子向量。
7.根据权利要求6所述的计量自动化系统的监测装置,其特征在于,所述获取模块,具体用于将在多个用户量化句子中出现的频次大于预设频次阈值,且逆向文本频率大于预设频率的分词,确定为热词。
8.根据权利要求5所述的计量自动化系统的监测装置,其特征在于,所述获取模块,具体用于计算两句子向量之间的向量余弦值,得到任意两个用户量化句子之间的相似度;根据相似度对原始用户量化数据中的多个用户量化句子进行聚类,得到用户量化数据,其中,用户量化数据包括多个句子分组。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至4中任一项所述的方法的步骤。
10.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至4中任一项所述的方法的步骤。
CN202011517186.XA 2020-12-21 2020-12-21 计量自动化系统的监测方法、装置、计算机设备和介质 Active CN112685559B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011517186.XA CN112685559B (zh) 2020-12-21 2020-12-21 计量自动化系统的监测方法、装置、计算机设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011517186.XA CN112685559B (zh) 2020-12-21 2020-12-21 计量自动化系统的监测方法、装置、计算机设备和介质

Publications (2)

Publication Number Publication Date
CN112685559A CN112685559A (zh) 2021-04-20
CN112685559B true CN112685559B (zh) 2024-01-23

Family

ID=75449724

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011517186.XA Active CN112685559B (zh) 2020-12-21 2020-12-21 计量自动化系统的监测方法、装置、计算机设备和介质

Country Status (1)

Country Link
CN (1) CN112685559B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102637203A (zh) * 2012-03-15 2012-08-15 广西电网公司电力科学研究院 电量数据处理方法和电能计量自动化系统监控主站
CN108764596A (zh) * 2018-03-28 2018-11-06 广州供电局有限公司 计量自动化系统的停电状态的监测方法和监测系统
CN109948148A (zh) * 2019-02-28 2019-06-28 北京学之途网络科技有限公司 一种文本信息情感判定方法和判定装置
CN110297915A (zh) * 2019-06-20 2019-10-01 苏州点对点信息科技有限公司 一种基于投资者情绪的is量化交易系统及方法
CN110909529A (zh) * 2019-11-27 2020-03-24 国网能源研究院有限公司 一种公司形象提升系统的用户情感分析和预判系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8725462B2 (en) * 2011-05-13 2014-05-13 Fujitsu Limited Data aggregation platform
IT201900005326A1 (it) * 2019-04-08 2020-10-08 Regione Lombardia Sistema e metodo automatizzato di estrazione e presentazione di informazioni quantitative tramite analisi predittiva di dati

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102637203A (zh) * 2012-03-15 2012-08-15 广西电网公司电力科学研究院 电量数据处理方法和电能计量自动化系统监控主站
CN108764596A (zh) * 2018-03-28 2018-11-06 广州供电局有限公司 计量自动化系统的停电状态的监测方法和监测系统
CN109948148A (zh) * 2019-02-28 2019-06-28 北京学之途网络科技有限公司 一种文本信息情感判定方法和判定装置
CN110297915A (zh) * 2019-06-20 2019-10-01 苏州点对点信息科技有限公司 一种基于投资者情绪的is量化交易系统及方法
CN110909529A (zh) * 2019-11-27 2020-03-24 国网能源研究院有限公司 一种公司形象提升系统的用户情感分析和预判系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"基于层次分析法的电能计量装置运行状态评价方法";卢健豪等;《电测与仪表》;全文 *

Also Published As

Publication number Publication date
CN112685559A (zh) 2021-04-20

Similar Documents

Publication Publication Date Title
Xiao et al. Real-time identification of urban rainstorm waterlogging disasters based on Weibo big data
CN110781679A (zh) 一种基于关联语义链网络的新闻事件关键词挖掘方法
Patil et al. Sumgraph: Text summarization using centrality in the pathfinder network
Liu et al. Improving ranking-based recommendation by social information and negative similarity
Huang et al. Research on content-based MOOC recommender model
Tsai et al. Redundancy and novelty mining in the business blogosphere
Gu et al. Profiling Web users using big data
Badr et al. Social media sentiment analysis using machine learning and optimization techniques
Sukumar et al. Semantic based sentence ordering approach for multi-document summarization
CN113449508B (zh) 一种基于事件链的网络舆情关联推演预测分析方法
Ruambo et al. Towards enhancing information retrieval systems: A brief survey of strategies and challenges
Rawte et al. A comparative analysis of temporal long text similarity: Application to financial documents
Bashir Combining pre-retrieval query quality predictors using genetic programming
CN112685559B (zh) 计量自动化系统的监测方法、装置、计算机设备和介质
Wu et al. Sub-event discovery and retrieval during natural hazards on social media data
Ding et al. Improved mutual information method for text feature selection
Khan et al. Semantic based features selection and weighting method for text classification
Snidaro et al. Distributional memory explainable word embeddings in continuous space
Shirgave et al. Semantically Enriched Variable Length Markov Chain Model for Analysis of User Web Navigation Sessions
Li et al. A service mode of expert finding in social network
Masdisornchote A sentiment analysis framework in implicit opinions for Thai language
CN113590755A (zh) 词权重的生成方法、装置、电子设备及存储介质
Lytvyn et al. Searching the relevant precedents in dataspaces based on adaptive ontology
Arezki et al. Information retrieval model based on user profile
Chen et al. Research on similarity calculation of citation semantic link network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant