CN112200465B

CN112200465B - 基于多媒体信息智能分析的电力ai方法及系统

Info

Publication number: CN112200465B
Application number: CN202011097958.9A
Authority: CN
Inventors: 徐海青; 陈是同; 陶俊; 梁翀; 邱镇; 浦正国; 程琳; 余江斌; 胡心颖; 郭庆; 王雷; 徐鸿
Original assignee: State Grid Corp of China SGCC; State Grid Information and Telecommunication Co Ltd; Anhui Jiyuan Software Co Ltd
Current assignee: State Grid Corp of China SGCC; State Grid Information and Telecommunication Co Ltd; Anhui Jiyuan Software Co Ltd
Priority date: 2020-10-14
Filing date: 2020-10-14
Publication date: 2024-04-19
Anticipated expiration: 2040-10-14
Also published as: CN112200465A

Abstract

本发明公开了基于多媒体信息智能分析的电力AI方法及系统，包括：获取电力的多媒体数据信息样本，根据多媒体数据种类和使用场景匹配数据的预处理方法和标注方法；基于不同AI能力搭建AI模型进行AI能力迭代训练；基于训练完成的AI模型按照接口识别、API请求规范、返回值规范进行AI能力模块标准化封装；接收用户端提供的多媒体数据信息和AI能力需求；匹配数据预处理方法进行预处理操作；调取至少一种AI能力，进行多媒体信息分析，输出分析结果。本发明通过构建规范化的人工智能关键数据采集、标注、学习、评测所需要的全链条处理能力和闭环，解决电力智能业务应用零散、缺乏统一基础支撑服务平台等问题。

Description

基于多媒体信息智能分析的电力AI方法及系统

技术领域

本发明涉及人工智能技术领域，具体涉及基于多媒体信息智能分析的电力AI方法及系统。

背景技术

人工智能是未来智能电网的核心部分，是构建高效、协同、共享、“物-物-人”互联互通的电网智能化建设的重要手段，是电力系统发展的必然选择。

围绕设备运检、运行控制、企业管理和用电服务等领域开展人工智能自主创新，但仍存在以下问题：1、随着客服中心全业务集中运营，录音、工单及电话呼入量逐年递增，显现海量之势，语音人工质量检测、自助语音服务和少数民族语言服务等业务不能完全支撑客服中心全面满足用户需求、实现全方位服务的发展；2、电力主设备内部状态监测仍以周期性停电检测为主，缺乏有效在线监测手段；3、设备故障智能诊断准确率不高，数据价值挖掘不充分；4、人工智能技术业务应用零散，导致可移植性差、重复建设、统一评测缺乏，智能化提升未形成闭环，缺乏统一服务化支撑平台体系。

发明内容

针对上述现有技术存在的问题，本发明提供了基于多媒体信息智能分析的电力AI方法，包括如下步骤：

（1）生成多种AI能力，包括：

获取电力的多媒体数据信息样本，根据多媒体数据种类和使用场景获取不同数据约束以及数据集规范并匹配数据的预处理方法；

基于预处理数据进行标注；

对标注后的数据通过预设数据导入方法存储到资源库；

基于不同AI能力搭建AI模型并输入标注后的多媒体数据进行AI能力迭代训练；

基于训练完成的AI模型按照接口识别、API请求规范和返回值规范依次进行AI能力模块标准化封装；

（2）调用至少一种AI能力模块获取数据分析结果，包括：

接收用户端提供的多媒体数据信息和AI能力需求；

匹配数据预处理方法进行预处理操作；

调取至少一种AI能力，进行多媒体信息分析，输出分析结果。

作为上述方案的进一步优化，所述根据多媒体数据种类和使用场景获取不同数据约束以及数据集规范并匹配数据的预处理方法，具体包括：

（1）获取数据约束条件，包括获取计算时效约束、通用数据规范约束、物理存储约束、模型平台约束以及基于数据种类获取特征维度约束条件；

（2）基于数据约束条件，获取匹配的数据预处理的基本规范标准；

（3）基于数据使用场景，获取匹配的数据预处理的特别规范标准；

（4）基于基本规范标准和特别规范标准进行数据预处理。

作为上述方案的进一步优化，所述基于预处理数据进行标注具体为，根据数据的不同业务场景和数据特征选择匹配不同数据集的标注类别、标注策略与标注工具。

作为上述方案的进一步优化，所述基于预处理数据进行标注，还包括采用基于专家和机器协同的半机器化标注方法对数据进行标注。

作为上述方案的进一步优化，所述对标注后的数据通过预设数据导入方法存储到资源库，包括：

读取多种数据格式，并基于数据库的约束条件对待导入数据进行检验和转换，对满足约束条件的数据存储到资源库。

作为上述方案的进一步优化，所述基于不同AI能力搭建AI模型并输入标注后的多媒体数据进行AI能力迭代训练，AI能力包括：

（1）基础AI能力：包括

语音识别与合成，包括基于电力设备声纹特征识别的故障检测和语音与文本相互转换；

人脸识别，包括人脸基本特征获取和人脸特征对比匹配；

自然语言处理，包括对文本数据的识别处理；

（2）专业AI能力，包括：

输电线路缺陷图像识别，

变电站智能监控，包括变电站内电力设备的状态识别和人员轨迹及行为识别。

作为上述方案的进一步优化，所述步骤（2）之前还包括：对用户的身份鉴别和授权判断，对于信息内网和信息外网用户的身份鉴别和权限控制通过统一权限平台实现；对于通过APP端登录的互联网用户的身份鉴别和权限控制通过I型信息网络安全接入网关和国网CA系统实现。

本发明还提供了基于多媒体信息智能分析的电力AI系统，包括：

AI能力生成模块，用于生成多种AI能力，包括：

基于预处理数据进行标注；

对标注后的数据通过预设数据导入方法存储到资源库；

AI能力使用模块，用于调用至少一种AI能力模块获取数据分析结果，包括：

接收用户端提供的多媒体数据信息和AI能力需求；

匹配数据预处理方法进行预处理操作；

调取至少一种AI能力，进行多媒体信息分析，输出分析结果；

所述根据多媒体数据种类和使用场景获取不同数据约束以及数据集规范并匹配数据的预处理方法，具体包括：

（11）获取数据约束条件，包括获取计算时效约束、通用数据规范约束、物理存储约束、模型平台约束以及基于数据种类获取特征维度约束条件；

（12）基于数据约束条件，获取匹配的数据预处理的基本规范标准；

（13）基于数据使用场景，获取匹配的数据预处理的特别规范标准；

（14）基于基本规范标准和特别规范标准进行数据预处理；

所述数据标注方法，具体步骤包括：

（21）获取待标注数据；

（22）基于每个机器学习模型获得数据多种标注类别的概率值；

（23）将多个机器学习模型获得的多种标注类别的概率值进行归一化处理，获取最大概率值对应的标注类别记为机器学习输出的标注值；

（24）判断概率分值是否大于第一预设阈值，若是，则进入步骤（25），否则，进入步骤（26）；

（25）对标注后的数据选择部分检验，验证机器学习标注的数值和人工标注的数值的相同度，若相同度大于第二预设阈值，则机器学习输出的标签为数据的实际标签数据，并对机器学习标注的数值和人工标注的数值相同的数据记为第0待选数据，对两种标记不同的数据记为第1待选数据，否则对该部分数据进行人工标注修正，并进行下一部分选择数据的检验；

（26）对数据以人工标注方法获取标注值，并验证机器学习标注的数值和人工标注的数值的相同度，并对机器学习标注的数值和人工标注的数值相同的数据记为第2待选数据，对两种标记不同的数据记为第1待选数据，其中，第1待选数据为机器学习模型标注不准确的数据；

（27）根据步骤（25）和（26）获取的相同度修正第一预设阈值，并进入步骤（14）直至机器学习标注的数值和人工标注的数值完全相同。

本发明还提供了一种电子设备,所述电子设备包括:

存储器,用于存储可执行指令；

处理器，用于运行所述存储器存储的可执行指令时,实现上述的基于多媒体信息智能分析的电力AI方法。

本发明还提供了一种计算机可读存储介质,存储有可执行指令,所述可执行指令被处理器执行时实现上述的基于多媒体信息智能分析的电力AI方法。

本发明的基于多媒体信息智能分析的电力AI方法及系统，具备如下有益效果：

1、本发明的基于多媒体信息智能分析的电力AI方法，通过构建规范化的人工智能关键数据采集、标注、学习、评测、反馈所需要的全链条处理能力和闭环，打造智能语音质检、智能语音导航、输电线路巡检、变电站智能监控、变压器运行状态声纹监测以及现场作业安全管控等基于云-边-端协同的多元化智能业务应用形态，解决电力智能业务应用零散、缺乏统一基础支撑服务平台等问题。

2、本发明中通过对针对不同来源、不同应用场景、不同类型的数据，不同的AI能力模型训练目的，不同的训练平台与物理计算资源，分别制定基本规范标准和特别规范标准，实现电力数据制作与整合的统一规范化预处理操作。

3、本发明中通过多种AI能力的训练并封装，实现对外提供统一AI能力服务接口，避免人工智能技术业务应用零散和重复建设的问题。

4、本发明中根据不同数据、数据特征以及标注需求为多种数据类型分别进行标注，实现数据在特定场景下的数据集特征分类与对应的标注方法，提高数据标注的精度与效率。

附图说明

图1为本发明的基于多媒体信息智能分析的电力AI方法的整体流程框图；

图2为本发明的基于多媒体信息智能分析的电力AI方法的语音识别能力封装后的调用流程框图。

实施方式

为了使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明作进一步地详细描述，所描述的实施例不应视为对本发明的限制，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

本发明实施例针对电力领域智能业务应用零散、缺乏统一基础支撑服务平台等问题，搭建电力“人工智能+”平台，结合电力各业务领域已有的智能应用以及实现电力各个业务领域的AI能力，形成统一智能服务体系，实现对电网智能运检、运行控制、企业管理和用电服务等领域的全面支撑，避免了重复投入，节约成本，创效增收，全面提高电网的智能化水平。

该电力“人工智能+”平台的服务层通过Spring Web作为容器管理前端展现与数据层之间的工作，借助其AOP与IOC进行逻辑、事物的实现。并基于sg-uap微服务开发框架和SpringCloud搭建运营监控分布式微服务，通过sg-uap与Qurtz搭建任务调度服务，其中微服务架构中，采用Zuul和Ribbon以及Eureka相结合，实现智能路由和负载均衡的功能，可以将流量按照策略分发到集群中的多个实例。

本发明实施例提供的基于多媒体信息智能分析的电力AI方法，包括如下步骤：

（1）生成多种AI能力，包括：

基于预处理数据进行标注；

对标注后的数据通过预设数据导入方法存储到资源库；

基于训练完成的AI模型按照接口识别、API请求规范和返回值规范依次进行AI能力模块标准化封装，对外提供API接口；

接收用户端的AI服务请求，并对用户的身份鉴别和授权判断，对于信息内网和信息外网用户的身份鉴别和权限控制通过统一权限平台实现；对于通过APP端登录的互联网用户的身份鉴别和权限控制通过I型信息网络安全接入网关和国网CA系统实现。

（2）调用至少一种AI能力模块获取数据分析结果，包括：

接收用户端提供的多媒体数据信息和AI能力需求；

匹配数据预处理方法进行预处理操作；

本发明实施例中多媒体数据包括但不限于文本、图像、视频和语音，该语音包括电力设备的声纹数据和人机交互时产生的语音。

针对不同来源、不同应用场景、不同类型的数据，不同的AI能力模型训练目的，不同的训练平台与物理计算资源，制定一套合理的数据集规范。其中，数据集规范包括基本基本规范标准和特别规范标准，根据计算时效约束、通用数据规范约束、物理存储约束、模型平台约束以及基于数据种类获取特征维度约束条件确定多媒体数据的预处理的基本规范标准，再根据数据使用场景及具体业务场景使用需求的约束，制定不同业务场景的规范标准即特别规范标准，通过分析业务内在逻辑，为电力数据制作与整合提供规范依据。对于数据的预处理，基于基本规范标准和特别规范标准的不同，预处理方法也不同。

具体来说，对于语音数据类型的基本规范标准包括格式与采集规范:比如语音语料库制定采样音频频率,采样率，格式录音，文件大小，时长，录音环境，男声、女声比例等具体标准。语音识别与声纹识别的不同数据规范，故障识别的声音数据规范等。语音数据的特别规范标准包括内容与应用场景约束：比如电力行业声纹故障识别的语音语料，客户客服对话的语音识别等角度制定规范。

对于文本数据类型，基本规范标准包括文本属性：比如需制定文本大小、文本来源、文本语言等多种文本类别标准，以及文本格式：需制定文本存储格式、编码格式、文本输入格式、文本训练样本格式、文本测试样本格式、文本输出格式等，如html、txt、csv、doc等等。特别规范标准包括应用场景：词向量的训练，知识图谱的实体识别与关系抽取，客服对话的内容，文档的主题等进行相应的标准制定。

对于人脸图像数据的基本规范标准包括，人脸图像采集规范：比如需按照不同的人脸图像采集各类角度、表情的图像、制定可作为人脸识别的图像的大小尺寸、图像分辨率、可识别特征的大小尺寸和分辨率的各项标准以及人脸属性类别规范:比如需制定识别多种人脸属性大类标准，例如性别、年龄、种族、表情、饰品、胡须、面部动作状态等。

对于图像和视频数据的基本规范标准包括图像大小:比如需制定图片存储格式、图像大小、需识别特征的最大最小分辨率等的具体标准。

对于视频数据的基本规范标准包括视频格式：需制定视频存储格式、视频传输格式、视频尺寸大小、需识别特征的最大最小分辨率等的具体标准。

本发明实施例中的数据标注方法，采用基于专家和机器协同，实现递增式数据标注的半机器化标注。并且在机器标注时根据数据的不同业务场景和数据特征选择匹配不同数据集的标注类别、标注策略与标注工具。

通过业务场景的具体分析，根据不同的业务场景来构建不同的数据集的标注类别，通过数据集的数据特征进行特征选择，实现数据在特定场景下的数据集特征分类与对应的标注方法。在选择标注工具时，根据不同数据、数据特征以及标注需求，基于多种标注工具和标注方式进行比较分析，然后以最优标注策略和标注工具进行，提高数据标注的精度与效率。

本申请实施例中的数据标注方法，具体步骤包括：

（11）获取待标注数据；

（12）基于每个机器学习模型获得数据多种标注类别的概率值；

（13）将多个机器学习模型获得的多种标注类别的概率值进行归一化处理，获取最大概率值对应的标注类别记为机器学习输出的标注值；

（14）判断概率分值是否大于第一预设阈值，若是，则进入步骤（15），否则，进入步骤（16）；

（15）对标注后的数据选择部分检验，验证机器学习标注的数值和人工标注的数值的相同度，若相同度大于第二预设阈值，则机器学习输出的标签为数据的实际标签数据，并对机器学习标注的数值和人工标注的数值相同的数据记为第0待选数据，对两种标记不同的数据记为第1待选数据，否则对该部分数据进行人工标注修正，并进行下一部分选择数据的检验；

（16）对数据以人工标注方法获取标注值，并验证机器学习标注的数值和人工标注的数值的相同度，并对机器学习标注的数值和人工标注的数值相同的数据记为第2待选数据，对两种标记不同的数据记为第1待选数据，其中，第1待选数据为机器学习模型标注不准确的数据；

（17）根据步骤（15）和（16）获取的相同度修正第一预设阈值，并进入步骤（14）直至机器学习标注的数值和人工标注的数值完全相同。

本发明实施例中的标注方法，基于半机器化标注，通过对机器学习输出的标注值和人工标注数据的比较，并通过迭代修正过程，实现机器学习标注的数值和人工标注的数值完全相同，从而实现电力各个业务场景的数据的自动标注。

基于标注后的数据，通过高效的导入工具存储到预设的数据库，形成电力语音、图像、文本资源库。基于本申请实施例数据存储的需求，采用HBase作为语音，图像、文本的资源库。HBase存储，其特点是具备很好的伸缩性，并且支持10亿+的文件，上百PB数据，上千节点的集群。

当然，本申请实施例中，在数据导入时，读取多种数据格式，并基于数据库的约束条件对待导入数据进行检验和转换，对满足约束条件的数据存储到资源库，并对提示异常导入数据发出告警提示。

基于电力应用场景，本申请实施例中所述的AI能力包括：

（a）通用AI能力，包括：（a1）对于语音类型的数据，具有的AI能力包括语音识别并转化为文本数据、文书数据识别并合成语音、电力设备声纹特征分析，（a2）对于人脸图像数据，具有的AI能力包括年龄、性别、头部朝向、情绪等特征的识别分析、以及在此基础上对多个人脸的匹配判断获取多个人脸图像的相似度；（a3）对于文本类型的数据，具有的AI能力包括分词及词性标注、新词发现、依存句法分析（“主谓宾”、“定状补”语法成分识别）、命名实体识别（3大类（实体类、时间类和数字类）和7小类（人名、地名、组织机构名、时间、日期、货币和百分比））、文本自动摘要提取、文本主题词提取、文本聚类、情感倾向性分析、关键信息抽取、文本纠错等。

（b）专业AI能力，包括：（b1）对输电线路缺陷图像识别，包括输电线路9大类、22小类缺陷，比如绝缘子类、鸟巢异、导地线、细小金具类等的AI识别能力，（b2）对于变电站中各种应用场景的图像和视频数据，具有的AI能力包括变电站设备状态（仪表仪器数值）识别、变电站内设备、表计缺陷识别（仪表仪器故障）识别，基于视频、图像红外测温识别对变电站内设备缺陷检测，对实时视频的人员状态和异常行为识别、基于实时视频区域入侵检测、基于实时视频的运动检测、基于深度学习技术研发变压器故障声纹识别等。

对于上述AI能力的模型训练过程和具体的模型搭建，本申请在此不做限制，可以在原有AI能力模型的基础上进行改进，或者采用迁移学习进行模型的训练获取，为了提供更高效准确的AI能力，在本申请的各种AI能力确定之前，经过多种数据特征选择、网络模型搭建选择以及训练过程选择，并进行具体训练模拟，通过对应的判断方法获得最优选的AI能力模型并进行训练完成后的封装，以实现对外开放，下面以语音识别能力的封装为例进行说明。

语音识别功能AI接口如下表1所示：

AI语音识别能力封装后对外提供的API接口其形式为：

AI语音识别能力被调用后的返回值包括如下表3所示：

在调用该 AI语音识别能力时，其流程参见图2，分别进行接口的识别，依次调用SCYMTInitializeEx、SCYMTSessionBeginEx，然后调用SCYMTAudioWritEx接口获取多媒体数据，通过SCYMTGetResultEx接口函数获取AI语音识别分析结果，然后通过SCYMTSessionEndEX、SCYMTUninitializeEX接口函数结束本次调用过程。

本发明实施例基于上述基于多媒体信息智能分析的电力AI方法提供的电力AI系统，包括：

AI能力生成模块，用于生成多种AI能力，包括：

基于预处理数据进行标注；

对标注后的数据通过预设数据导入方法存储到资源库；

接收用户端提供的多媒体数据信息和AI能力需求；

匹配数据预处理方法进行预处理操作；

（14）基于基本规范标准和特别规范标准进行数据预处理；

所述数据标注方法，具体步骤包括：

（21）获取待标注数据；

本发明实施例提供的基于多媒体信息智能分析的电力AI系统可以采用软硬件结合的方式，作为本发明实施例提供的图像处理装置采用软硬件结合实施的示例，本发明实施例所提供的图像处理装置可以直接体现为由处理器执行的软件模块组合，软件模块可以位于存储介质中，存储介质位于存储器，处理器读取存储器中软件模块包括的可执行指令，结合必要的硬件完成本发明实施例提供的基于多媒体信息智能分析的电力AI方法。

本发明实施例还提供了一种电子设备,所述电子设备包括:

存储器，用于存储可执行指令；

处理器，用于运行所述存储器存储的可执行指令时,实现上述基于多媒体信息智能分析的电力AI方法。

本发明实施例的电子设备，可以各种形式来实施，如带有上述基于多媒体信息智能分析的电力AI方法的专用终端，也可以为带有上述基于多媒体信息智能分析的电力AI方法的服务器。可以理解，存储器可以是易失性存储器或非易失性存储器，也可包括易失性和非易失性存储器两者。本发明实施例中的存储器能够存储数据以支持终端的操作，这些数据的示例包括：用于在终端上操作的任何计算机程序，如操作系统和应用程序。其中，操作系统包含各种系统程序，例如框架层、核心库层、驱动层等，用于实现各种基础业务以及处理基于硬件的任务。应用程序可以包含各种应用程序。

本发明实施例还提供了一种计算机可读存储介质,存储有可执行指令,所述可执行指令被处理器执行时实现上述的基于多媒体信息智能分析的电力AI方法。

本发明不局限于上述具体的实施方式，本领域的普通技术人员从上述构思出发，不经过创造性的劳动，所做出的种种变换，均落在本发明的保护范围之内。

Claims

1.基于多媒体信息智能分析的电力AI方法，其特征在于：包括如下步骤：

（1）生成多种AI能力，包括：

基于预处理数据进行标注；

对标注后的数据通过预设数据导入方法存储到资源库；

（2）调用至少一种AI能力模块获取数据分析结果，包括：

接收用户端提供的多媒体数据信息和AI能力需求；

匹配数据预处理方法进行预处理操作；

（14）基于基本规范标准和特别规范标准进行数据预处理；

所述数据标注方法，具体步骤包括：

（21）获取待标注数据；

2.根据权利要求1所述的基于多媒体信息智能分析的电力AI方法，其特征在于：所述基于预处理数据进行标注具体为，根据数据的不同业务场景和数据特征选择匹配不同数据集的标注类别、标注策略与标注工具。

3.根据权利要求2所述的基于多媒体信息智能分析的电力AI方法，其特征在于：所述基于预处理数据进行标注，还包括采用基于专家和机器协同的半机器化标注方法对数据进行标注。

4.根据权利要求1所述的基于多媒体信息智能分析的电力AI方法，其特征在于：所述对标注后的数据通过预设数据导入方法存储到资源库，包括：

5.根据权利要求1所述的基于多媒体信息智能分析的电力AI方法，其特征在于：所述基于不同AI能力搭建AI模型并输入标注后的多媒体数据进行AI能力迭代训练，AI能力包括：

（1）基础AI能力：包括

人脸识别，包括人脸基本特征获取和人脸特征对比匹配；

自然语言处理，包括对文本数据的识别处理；

（2）专业AI能力，包括：

输电线路缺陷图像识别，

6.根据权利要求1所述的基于多媒体信息智能分析的电力AI方法，其特征在于：所述步骤（2）之前还包括：对用户的身份鉴别和授权判断，对于信息内网和信息外网用户的身份鉴别和权限控制通过统一权限平台实现；对于通过APP端登录的互联网用户的身份鉴别和权限控制通过I型信息网络安全接入网关和国网CA系统实现。

7.基于多媒体信息智能分析的电力AI系统，其特征在于，包括：

AI能力生成模块，用于生成多种AI能力，包括：

基于预处理数据进行标注；

对标注后的数据通过预设数据导入方法存储到资源库；

接收用户端提供的多媒体数据信息和AI能力需求；

匹配数据预处理方法进行预处理操作；

（14）基于基本规范标准和特别规范标准进行数据预处理；

所述数据标注方法，具体步骤包括：

（21）获取待标注数据；

8.一种电子设备,其特征在于,所述电子设备包括:

存储器,用于存储可执行指令；

处理器，用于运行所述存储器存储的可执行指令时,实现权利要求1至6任一项所述的基于多媒体信息智能分析的电力AI方法。

9.一种计算机可读存储介质,存储有可执行指令,其特征在于,所述可执行指令被处理器执行时实现权利要求1至6任一项所述的基于多媒体信息智能分析的电力AI方法。