CN112200465B - 基于多媒体信息智能分析的电力ai方法及系统 - Google Patents
基于多媒体信息智能分析的电力ai方法及系统 Download PDFInfo
- Publication number
- CN112200465B CN112200465B CN202011097958.9A CN202011097958A CN112200465B CN 112200465 B CN112200465 B CN 112200465B CN 202011097958 A CN202011097958 A CN 202011097958A CN 112200465 B CN112200465 B CN 112200465B
- Authority
- CN
- China
- Prior art keywords
- data
- labeling
- value
- machine learning
- acquiring
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 65
- 238000004458 analytical method Methods 0.000 title claims abstract description 51
- 238000002372 labelling Methods 0.000 claims abstract description 96
- 238000007781 pre-processing Methods 0.000 claims abstract description 42
- 238000012549 training Methods 0.000 claims abstract description 18
- 238000012545 processing Methods 0.000 claims abstract description 7
- 238000004806 packaging method and process Methods 0.000 claims abstract description 6
- 238000010801 machine learning Methods 0.000 claims description 51
- 238000003860 storage Methods 0.000 claims description 15
- 238000001514 detection method Methods 0.000 claims description 9
- 238000012937 correction Methods 0.000 claims description 7
- 238000012544 monitoring process Methods 0.000 claims description 7
- 230000005540 biological transmission Effects 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000007405 data analysis Methods 0.000 claims description 6
- 230000007547 defect Effects 0.000 claims description 6
- 238000013475 authorization Methods 0.000 claims description 5
- 230000015572 biosynthetic process Effects 0.000 claims description 3
- 238000003786 synthesis reaction Methods 0.000 claims description 3
- 230000006399 behavior Effects 0.000 claims description 2
- 238000003058 natural language processing Methods 0.000 claims description 2
- 238000013473 artificial intelligence Methods 0.000 description 6
- 238000005457 optimization Methods 0.000 description 6
- 238000010276 construction Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 238000005538 encapsulation Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 230000005611 electricity Effects 0.000 description 2
- 230000008451 emotion Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 206010000117 Abnormal behaviour Diseases 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 235000005770 birds nest Nutrition 0.000 description 1
- 238000009529 body temperature measurement Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 239000012212 insulator Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
- 235000005765 wild carrot Nutrition 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Software Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Public Health (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Educational Administration (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Artificial Intelligence (AREA)
- Quality & Reliability (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Game Theory and Decision Science (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了基于多媒体信息智能分析的电力AI方法及系统,包括:获取电力的多媒体数据信息样本,根据多媒体数据种类和使用场景匹配数据的预处理方法和标注方法;基于不同AI能力搭建AI模型进行AI能力迭代训练;基于训练完成的AI模型按照接口识别、API请求规范、返回值规范进行AI能力模块标准化封装;接收用户端提供的多媒体数据信息和AI能力需求;匹配数据预处理方法进行预处理操作;调取至少一种AI能力,进行多媒体信息分析,输出分析结果。本发明通过构建规范化的人工智能关键数据采集、标注、学习、评测所需要的全链条处理能力和闭环,解决电力智能业务应用零散、缺乏统一基础支撑服务平台等问题。
Description
技术领域
本发明涉及人工智能技术领域,具体涉及基于多媒体信息智能分析的电力AI方法及系统。
背景技术
人工智能是未来智能电网的核心部分,是构建高效、协同、共享、“物-物-人”互联互通的电网智能化建设的重要手段,是电力系统发展的必然选择。
围绕设备运检、运行控制、企业管理和用电服务等领域开展人工智能自主创新,但仍存在以下问题:1、随着客服中心全业务集中运营,录音、工单及电话呼入量逐年递增,显现海量之势,语音人工质量检测、自助语音服务和少数民族语言服务等业务不能完全支撑客服中心全面满足用户需求、实现全方位服务的发展;2、电力主设备内部状态监测仍以周期性停电检测为主,缺乏有效在线监测手段;3、设备故障智能诊断准确率不高,数据价值挖掘不充分;4、人工智能技术业务应用零散,导致可移植性差、重复建设、统一评测缺乏,智能化提升未形成闭环,缺乏统一服务化支撑平台体系。
发明内容
针对上述现有技术存在的问题,本发明提供了基于多媒体信息智能分析的电力AI方法,包括如下步骤:
(1)生成多种AI能力,包括:
获取电力的多媒体数据信息样本,根据多媒体数据种类和使用场景获取不同数据约束以及数据集规范并匹配数据的预处理方法;
基于预处理数据进行标注;
对标注后的数据通过预设数据导入方法存储到资源库;
基于不同AI能力搭建AI模型并输入标注后的多媒体数据进行AI能力迭代训练;
基于训练完成的AI模型按照接口识别、API请求规范和返回值规范依次进行AI能力模块标准化封装;
(2)调用至少一种AI能力模块获取数据分析结果,包括:
接收用户端提供的多媒体数据信息和AI能力需求;
匹配数据预处理方法进行预处理操作;
调取至少一种AI能力,进行多媒体信息分析,输出分析结果。
作为上述方案的进一步优化,所述根据多媒体数据种类和使用场景获取不同数据约束以及数据集规范并匹配数据的预处理方法,具体包括:
(1)获取数据约束条件,包括获取计算时效约束、通用数据规范约束、物理存储约束、模型平台约束以及基于数据种类获取特征维度约束条件;
(2)基于数据约束条件,获取匹配的数据预处理的基本规范标准;
(3)基于数据使用场景,获取匹配的数据预处理的特别规范标准;
(4)基于基本规范标准和特别规范标准进行数据预处理。
作为上述方案的进一步优化,所述基于预处理数据进行标注具体为,根据数据的不同业务场景和数据特征选择匹配不同数据集的标注类别、标注策略与标注工具。
作为上述方案的进一步优化,所述基于预处理数据进行标注,还包括采用基于专家和机器协同的半机器化标注方法对数据进行标注。
作为上述方案的进一步优化,所述对标注后的数据通过预设数据导入方法存储到资源库,包括:
读取多种数据格式,并基于数据库的约束条件对待导入数据进行检验和转换,对满足约束条件的数据存储到资源库。
作为上述方案的进一步优化,所述基于不同AI能力搭建AI模型并输入标注后的多媒体数据进行AI能力迭代训练,AI能力包括:
(1)基础AI能力:包括
语音识别与合成,包括基于电力设备声纹特征识别的故障检测和语音与文本相互转换;
人脸识别,包括人脸基本特征获取和人脸特征对比匹配;
自然语言处理,包括对文本数据的识别处理;
(2)专业AI能力,包括:
输电线路缺陷图像识别,
变电站智能监控,包括变电站内电力设备的状态识别和人员轨迹及行为识别。
作为上述方案的进一步优化,所述步骤(2)之前还包括:对用户的身份鉴别和授权判断,对于信息内网和信息外网用户的身份鉴别和权限控制通过统一权限平台实现;对于通过APP端登录的互联网用户的身份鉴别和权限控制通过I型信息网络安全接入网关和国网CA系统实现。
本发明还提供了基于多媒体信息智能分析的电力AI系统,包括:
AI能力生成模块,用于生成多种AI能力,包括:
获取电力的多媒体数据信息样本,根据多媒体数据种类和使用场景获取不同数据约束以及数据集规范并匹配数据的预处理方法;
基于预处理数据进行标注;
对标注后的数据通过预设数据导入方法存储到资源库;
基于不同AI能力搭建AI模型并输入标注后的多媒体数据进行AI能力迭代训练;
基于训练完成的AI模型按照接口识别、API请求规范和返回值规范依次进行AI能力模块标准化封装;
AI能力使用模块,用于调用至少一种AI能力模块获取数据分析结果,包括:
接收用户端提供的多媒体数据信息和AI能力需求;
匹配数据预处理方法进行预处理操作;
调取至少一种AI能力,进行多媒体信息分析,输出分析结果;
所述根据多媒体数据种类和使用场景获取不同数据约束以及数据集规范并匹配数据的预处理方法,具体包括:
(11)获取数据约束条件,包括获取计算时效约束、通用数据规范约束、物理存储约束、模型平台约束以及基于数据种类获取特征维度约束条件;
(12)基于数据约束条件,获取匹配的数据预处理的基本规范标准;
(13)基于数据使用场景,获取匹配的数据预处理的特别规范标准;
(14)基于基本规范标准和特别规范标准进行数据预处理;
所述数据标注方法,具体步骤包括:
(21)获取待标注数据;
(22)基于每个机器学习模型获得数据多种标注类别的概率值;
(23)将多个机器学习模型获得的多种标注类别的概率值进行归一化处理,获取最大概率值对应的标注类别记为机器学习输出的标注值;
(24)判断概率分值是否大于第一预设阈值,若是,则进入步骤(25),否则,进入步骤(26);
(25)对标注后的数据选择部分检验,验证机器学习标注的数值和人工标注的数值的相同度,若相同度大于第二预设阈值,则机器学习输出的标签为数据的实际标签数据,并对机器学习标注的数值和人工标注的数值相同的数据记为第0待选数据,对两种标记不同的数据记为第1待选数据,否则对该部分数据进行人工标注修正,并进行下一部分选择数据的检验;
(26)对数据以人工标注方法获取标注值,并验证机器学习标注的数值和人工标注的数值的相同度,并对机器学习标注的数值和人工标注的数值相同的数据记为第2待选数据,对两种标记不同的数据记为第1待选数据,其中,第1待选数据为机器学习模型标注不准确的数据;
(27)根据步骤(25)和(26)获取的相同度修正第一预设阈值,并进入步骤(14)直至机器学习标注的数值和人工标注的数值完全相同。
本发明还提供了一种电子设备,所述电子设备包括:
存储器,用于存储可执行指令;
处理器,用于运行所述存储器存储的可执行指令时,实现上述的基于多媒体信息智能分析的电力AI方法。
本发明还提供了一种计算机可读存储介质,存储有可执行指令,所述可执行指令被处理器执行时实现上述的基于多媒体信息智能分析的电力AI方法。
本发明的基于多媒体信息智能分析的电力AI方法及系统,具备如下有益效果:
1、本发明的基于多媒体信息智能分析的电力AI方法,通过构建规范化的人工智能关键数据采集、标注、学习、评测、反馈所需要的全链条处理能力和闭环,打造智能语音质检、智能语音导航、输电线路巡检、变电站智能监控、变压器运行状态声纹监测以及现场作业安全管控等基于云-边-端协同的多元化智能业务应用形态,解决电力智能业务应用零散、缺乏统一基础支撑服务平台等问题。
2、本发明中通过对针对不同来源、不同应用场景、不同类型的数据,不同的AI能力模型训练目的,不同的训练平台与物理计算资源,分别制定基本规范标准和特别规范标准,实现电力数据制作与整合的统一规范化预处理操作。
3、本发明中通过多种AI能力的训练并封装,实现对外提供统一AI能力服务接口,避免人工智能技术业务应用零散和重复建设的问题。
4、本发明中根据不同数据、数据特征以及标注需求为多种数据类型分别进行标注,实现数据在特定场景下的数据集特征分类与对应的标注方法,提高数据标注的精度与效率。
附图说明
图1为本发明的基于多媒体信息智能分析的电力AI方法的整体流程框图;
图2为本发明的基于多媒体信息智能分析的电力AI方法的语音识别能力封装后的调用流程框图。
实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,所描述的实施例不应视为对本发明的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本发明实施例针对电力领域智能业务应用零散、缺乏统一基础支撑服务平台等问题,搭建电力“人工智能+”平台,结合电力各业务领域已有的智能应用以及实现电力各个业务领域的AI能力,形成统一智能服务体系,实现对电网智能运检、运行控制、企业管理和用电服务等领域的全面支撑,避免了重复投入,节约成本,创效增收,全面提高电网的智能化水平。
该电力“人工智能+”平台的服务层通过Spring Web作为容器管理前端展现与数据层之间的工作,借助其AOP与IOC进行逻辑、事物的实现。并基于sg-uap微服务开发框架和SpringCloud搭建运营监控分布式微服务,通过sg-uap与Qurtz搭建任务调度服务,其中微服务架构中,采用Zuul和Ribbon以及Eureka相结合,实现智能路由和负载均衡的功能,可以将流量按照策略分发到集群中的多个实例。
本发明实施例提供的基于多媒体信息智能分析的电力AI方法,包括如下步骤:
(1)生成多种AI能力,包括:
获取电力的多媒体数据信息样本,根据多媒体数据种类和使用场景获取不同数据约束以及数据集规范并匹配数据的预处理方法;
基于预处理数据进行标注;
对标注后的数据通过预设数据导入方法存储到资源库;
基于不同AI能力搭建AI模型并输入标注后的多媒体数据进行AI能力迭代训练;
基于训练完成的AI模型按照接口识别、API请求规范和返回值规范依次进行AI能力模块标准化封装,对外提供API接口;
接收用户端的AI服务请求,并对用户的身份鉴别和授权判断,对于信息内网和信息外网用户的身份鉴别和权限控制通过统一权限平台实现;对于通过APP端登录的互联网用户的身份鉴别和权限控制通过I型信息网络安全接入网关和国网CA系统实现。
(2)调用至少一种AI能力模块获取数据分析结果,包括:
接收用户端提供的多媒体数据信息和AI能力需求;
匹配数据预处理方法进行预处理操作;
调取至少一种AI能力,进行多媒体信息分析,输出分析结果。
本发明实施例中多媒体数据包括但不限于文本、图像、视频和语音,该语音包括电力设备的声纹数据和人机交互时产生的语音。
针对不同来源、不同应用场景、不同类型的数据,不同的AI能力模型训练目的,不同的训练平台与物理计算资源,制定一套合理的数据集规范。其中,数据集规范包括基本基本规范标准和特别规范标准,根据计算时效约束、通用数据规范约束、物理存储约束、模型平台约束以及基于数据种类获取特征维度约束条件确定多媒体数据的预处理的基本规范标准,再根据数据使用场景及具体业务场景使用需求的约束,制定不同业务场景的规范标准即特别规范标准,通过分析业务内在逻辑,为电力数据制作与整合提供规范依据。对于数据的预处理,基于基本规范标准和特别规范标准的不同,预处理方法也不同。
具体来说,对于语音数据类型的基本规范标准包括格式与采集规范:比如语音语料库制定采样音频频率,采样率,格式录音,文件大小,时长,录音环境,男声、女声比例等具体标准。语音识别与声纹识别的不同数据规范,故障识别的声音数据规范等。语音数据的特别规范标准包括内容与应用场景约束:比如电力行业声纹故障识别的语音语料,客户客服对话的语音识别等角度制定规范。
对于文本数据类型,基本规范标准包括文本属性:比如需制定文本大小、文本来源、文本语言等多种文本类别标准,以及文本格式:需制定文本存储格式、编码格式、文本输入格式、文本训练样本格式、文本测试样本格式、文本输出格式等,如html、txt、csv、doc等等。特别规范标准包括应用场景:词向量的训练,知识图谱的实体识别与关系抽取,客服对话的内容,文档的主题等进行相应的标准制定。
对于人脸图像数据的基本规范标准包括,人脸图像采集规范:比如需按照不同的人脸图像采集各类角度、表情的图像、制定可作为人脸识别的图像的大小尺寸、图像分辨率、可识别特征的大小尺寸和分辨率的各项标准以及人脸属性类别规范:比如需制定识别多种人脸属性大类标准,例如性别、年龄、种族、表情、饰品、胡须、面部动作状态等。
对于图像和视频数据的基本规范标准包括图像大小:比如需制定图片存储格式、图像大小、需识别特征的最大最小分辨率等的具体标准。
对于视频数据的基本规范标准包括视频格式:需制定视频存储格式、视频传输格式、视频尺寸大小、需识别特征的最大最小分辨率等的具体标准。
本发明实施例中的数据标注方法,采用基于专家和机器协同,实现递增式数据标注的半机器化标注。并且在机器标注时根据数据的不同业务场景和数据特征选择匹配不同数据集的标注类别、标注策略与标注工具。
通过业务场景的具体分析,根据不同的业务场景来构建不同的数据集的标注类别,通过数据集的数据特征进行特征选择,实现数据在特定场景下的数据集特征分类与对应的标注方法。在选择标注工具时,根据不同数据、数据特征以及标注需求,基于多种标注工具和标注方式进行比较分析,然后以最优标注策略和标注工具进行,提高数据标注的精度与效率。
本申请实施例中的数据标注方法,具体步骤包括:
(11)获取待标注数据;
(12)基于每个机器学习模型获得数据多种标注类别的概率值;
(13)将多个机器学习模型获得的多种标注类别的概率值进行归一化处理,获取最大概率值对应的标注类别记为机器学习输出的标注值;
(14)判断概率分值是否大于第一预设阈值,若是,则进入步骤(15),否则,进入步骤(16);
(15)对标注后的数据选择部分检验,验证机器学习标注的数值和人工标注的数值的相同度,若相同度大于第二预设阈值,则机器学习输出的标签为数据的实际标签数据,并对机器学习标注的数值和人工标注的数值相同的数据记为第0待选数据,对两种标记不同的数据记为第1待选数据,否则对该部分数据进行人工标注修正,并进行下一部分选择数据的检验;
(16)对数据以人工标注方法获取标注值,并验证机器学习标注的数值和人工标注的数值的相同度,并对机器学习标注的数值和人工标注的数值相同的数据记为第2待选数据,对两种标记不同的数据记为第1待选数据,其中,第1待选数据为机器学习模型标注不准确的数据;
(17)根据步骤(15)和(16)获取的相同度修正第一预设阈值,并进入步骤(14)直至机器学习标注的数值和人工标注的数值完全相同。
本发明实施例中的标注方法,基于半机器化标注,通过对机器学习输出的标注值和人工标注数据的比较,并通过迭代修正过程,实现机器学习标注的数值和人工标注的数值完全相同,从而实现电力各个业务场景的数据的自动标注。
基于标注后的数据,通过高效的导入工具存储到预设的数据库,形成电力语音、图像、文本资源库。基于本申请实施例数据存储的需求,采用HBase作为语音,图像、文本的资源库。HBase存储,其特点是具备很好的伸缩性,并且支持10亿+的文件,上百PB数据,上千节点的集群。
当然,本申请实施例中,在数据导入时,读取多种数据格式,并基于数据库的约束条件对待导入数据进行检验和转换,对满足约束条件的数据存储到资源库,并对提示异常导入数据发出告警提示。
基于电力应用场景,本申请实施例中所述的AI能力包括:
(a)通用AI能力,包括:(a1)对于语音类型的数据,具有的AI能力包括语音识别并转化为文本数据、文书数据识别并合成语音、电力设备声纹特征分析,(a2)对于人脸图像数据,具有的AI能力包括年龄、性别、头部朝向、情绪等特征的识别分析、以及在此基础上对多个人脸的匹配判断获取多个人脸图像的相似度;(a3)对于文本类型的数据,具有的AI能力包括分词及词性标注、新词发现、依存句法分析(“主谓宾”、“定状补”语法成分识别)、命名实体识别(3大类(实体类、时间类和数字类)和7小类(人名、地名、组织机构名、时间、日期、货币和百分比))、文本自动摘要提取、文本主题词提取、文本聚类、情感倾向性分析、关键信息抽取、文本纠错等。
(b)专业AI能力,包括:(b1)对输电线路缺陷图像识别,包括输电线路9大类、22小类缺陷,比如绝缘子类、鸟巢异、导地线、细小金具类等的AI识别能力,(b2)对于变电站中各种应用场景的图像和视频数据,具有的AI能力包括变电站设备状态(仪表仪器数值)识别、变电站内设备、表计缺陷识别(仪表仪器故障)识别,基于视频、图像红外测温识别对变电站内设备缺陷检测,对实时视频的人员状态和异常行为识别、基于实时视频区域入侵检测、基于实时视频的运动检测、基于深度学习技术研发变压器故障声纹识别等。
对于上述AI能力的模型训练过程和具体的模型搭建,本申请在此不做限制,可以在原有AI能力模型的基础上进行改进,或者采用迁移学习进行模型的训练获取,为了提供更高效准确的AI能力,在本申请的各种AI能力确定之前,经过多种数据特征选择、网络模型搭建选择以及训练过程选择,并进行具体训练模拟,通过对应的判断方法获得最优选的AI能力模型并进行训练完成后的封装,以实现对外开放,下面以语音识别能力的封装为例进行说明。
语音识别功能AI接口如下表1所示:
AI语音识别能力封装后对外提供的API接口其形式为:
AI语音识别能力被调用后的返回值包括如下表3所示:
在调用该 AI语音识别能力时,其流程参见图2,分别进行接口的识别,依次调用SCYMTInitializeEx、SCYMTSessionBeginEx,然后调用SCYMTAudioWritEx接口获取多媒体数据,通过SCYMTGetResultEx接口函数获取AI语音识别分析结果,然后通过SCYMTSessionEndEX、SCYMTUninitializeEX接口函数结束本次调用过程。
本发明实施例基于上述基于多媒体信息智能分析的电力AI方法提供的电力AI系统,包括:
AI能力生成模块,用于生成多种AI能力,包括:
获取电力的多媒体数据信息样本,根据多媒体数据种类和使用场景获取不同数据约束以及数据集规范并匹配数据的预处理方法;
基于预处理数据进行标注;
对标注后的数据通过预设数据导入方法存储到资源库;
基于不同AI能力搭建AI模型并输入标注后的多媒体数据进行AI能力迭代训练;
基于训练完成的AI模型按照接口识别、API请求规范和返回值规范依次进行AI能力模块标准化封装;
AI能力使用模块,用于调用至少一种AI能力模块获取数据分析结果,包括:
接收用户端提供的多媒体数据信息和AI能力需求;
匹配数据预处理方法进行预处理操作;
调取至少一种AI能力,进行多媒体信息分析,输出分析结果;
所述根据多媒体数据种类和使用场景获取不同数据约束以及数据集规范并匹配数据的预处理方法,具体包括:
(11)获取数据约束条件,包括获取计算时效约束、通用数据规范约束、物理存储约束、模型平台约束以及基于数据种类获取特征维度约束条件;
(12)基于数据约束条件,获取匹配的数据预处理的基本规范标准;
(13)基于数据使用场景,获取匹配的数据预处理的特别规范标准;
(14)基于基本规范标准和特别规范标准进行数据预处理;
所述数据标注方法,具体步骤包括:
(21)获取待标注数据;
(22)基于每个机器学习模型获得数据多种标注类别的概率值;
(23)将多个机器学习模型获得的多种标注类别的概率值进行归一化处理,获取最大概率值对应的标注类别记为机器学习输出的标注值;
(24)判断概率分值是否大于第一预设阈值,若是,则进入步骤(25),否则,进入步骤(26);
(25)对标注后的数据选择部分检验,验证机器学习标注的数值和人工标注的数值的相同度,若相同度大于第二预设阈值,则机器学习输出的标签为数据的实际标签数据,并对机器学习标注的数值和人工标注的数值相同的数据记为第0待选数据,对两种标记不同的数据记为第1待选数据,否则对该部分数据进行人工标注修正,并进行下一部分选择数据的检验;
(26)对数据以人工标注方法获取标注值,并验证机器学习标注的数值和人工标注的数值的相同度,并对机器学习标注的数值和人工标注的数值相同的数据记为第2待选数据,对两种标记不同的数据记为第1待选数据,其中,第1待选数据为机器学习模型标注不准确的数据;
(27)根据步骤(25)和(26)获取的相同度修正第一预设阈值,并进入步骤(14)直至机器学习标注的数值和人工标注的数值完全相同。
本发明实施例提供的基于多媒体信息智能分析的电力AI系统可以采用软硬件结合的方式,作为本发明实施例提供的图像处理装置采用软硬件结合实施的示例,本发明实施例所提供的图像处理装置可以直接体现为由处理器执行的软件模块组合,软件模块可以位于存储介质中,存储介质位于存储器,处理器读取存储器中软件模块包括的可执行指令,结合必要的硬件完成本发明实施例提供的基于多媒体信息智能分析的电力AI方法。
本发明实施例还提供了一种电子设备,所述电子设备包括:
存储器,用于存储可执行指令;
处理器,用于运行所述存储器存储的可执行指令时,实现上述基于多媒体信息智能分析的电力AI方法。
本发明实施例的电子设备,可以各种形式来实施,如带有上述基于多媒体信息智能分析的电力AI方法的专用终端,也可以为带有上述基于多媒体信息智能分析的电力AI方法的服务器。可以理解,存储器可以是易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。本发明实施例中的存储器能够存储数据以支持终端的操作,这些数据的示例包括:用于在终端上操作的任何计算机程序,如操作系统和应用程序。其中,操作系统包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序可以包含各种应用程序。
本发明实施例还提供了一种计算机可读存储介质,存储有可执行指令,所述可执行指令被处理器执行时实现上述的基于多媒体信息智能分析的电力AI方法。
本发明不局限于上述具体的实施方式,本领域的普通技术人员从上述构思出发,不经过创造性的劳动,所做出的种种变换,均落在本发明的保护范围之内。
Claims (9)
1.基于多媒体信息智能分析的电力AI方法,其特征在于:包括如下步骤:
(1)生成多种AI能力,包括:
获取电力的多媒体数据信息样本,根据多媒体数据种类和使用场景获取不同数据约束以及数据集规范并匹配数据的预处理方法;
基于预处理数据进行标注;
对标注后的数据通过预设数据导入方法存储到资源库;
基于不同AI能力搭建AI模型并输入标注后的多媒体数据进行AI能力迭代训练;
基于训练完成的AI模型按照接口识别、API请求规范和返回值规范依次进行AI能力模块标准化封装;
(2)调用至少一种AI能力模块获取数据分析结果,包括:
接收用户端提供的多媒体数据信息和AI能力需求;
匹配数据预处理方法进行预处理操作;
调取至少一种AI能力,进行多媒体信息分析,输出分析结果;
所述根据多媒体数据种类和使用场景获取不同数据约束以及数据集规范并匹配数据的预处理方法,具体包括:
(11)获取数据约束条件,包括获取计算时效约束、通用数据规范约束、物理存储约束、模型平台约束以及基于数据种类获取特征维度约束条件;
(12)基于数据约束条件,获取匹配的数据预处理的基本规范标准;
(13)基于数据使用场景,获取匹配的数据预处理的特别规范标准;
(14)基于基本规范标准和特别规范标准进行数据预处理;
所述数据标注方法,具体步骤包括:
(21)获取待标注数据;
(22)基于每个机器学习模型获得数据多种标注类别的概率值;
(23)将多个机器学习模型获得的多种标注类别的概率值进行归一化处理,获取最大概率值对应的标注类别记为机器学习输出的标注值;
(24)判断概率分值是否大于第一预设阈值,若是,则进入步骤(25),否则,进入步骤(26);
(25)对标注后的数据选择部分检验,验证机器学习标注的数值和人工标注的数值的相同度,若相同度大于第二预设阈值,则机器学习输出的标签为数据的实际标签数据,并对机器学习标注的数值和人工标注的数值相同的数据记为第0待选数据,对两种标记不同的数据记为第1待选数据,否则对该部分数据进行人工标注修正,并进行下一部分选择数据的检验;
(26)对数据以人工标注方法获取标注值,并验证机器学习标注的数值和人工标注的数值的相同度,并对机器学习标注的数值和人工标注的数值相同的数据记为第2待选数据,对两种标记不同的数据记为第1待选数据,其中,第1待选数据为机器学习模型标注不准确的数据;
(27)根据步骤(25)和(26)获取的相同度修正第一预设阈值,并进入步骤(14)直至机器学习标注的数值和人工标注的数值完全相同。
2.根据权利要求1所述的基于多媒体信息智能分析的电力AI方法,其特征在于:所述基于预处理数据进行标注具体为,根据数据的不同业务场景和数据特征选择匹配不同数据集的标注类别、标注策略与标注工具。
3.根据权利要求2所述的基于多媒体信息智能分析的电力AI方法,其特征在于:所述基于预处理数据进行标注,还包括采用基于专家和机器协同的半机器化标注方法对数据进行标注。
4.根据权利要求1所述的基于多媒体信息智能分析的电力AI方法,其特征在于:所述对标注后的数据通过预设数据导入方法存储到资源库,包括:
读取多种数据格式,并基于数据库的约束条件对待导入数据进行检验和转换,对满足约束条件的数据存储到资源库。
5.根据权利要求1所述的基于多媒体信息智能分析的电力AI方法,其特征在于:所述基于不同AI能力搭建AI模型并输入标注后的多媒体数据进行AI能力迭代训练,AI能力包括:
(1)基础AI能力:包括
语音识别与合成,包括基于电力设备声纹特征识别的故障检测和语音与文本相互转换;
人脸识别,包括人脸基本特征获取和人脸特征对比匹配;
自然语言处理,包括对文本数据的识别处理;
(2)专业AI能力,包括:
输电线路缺陷图像识别,
变电站智能监控,包括变电站内电力设备的状态识别和人员轨迹及行为识别。
6.根据权利要求1所述的基于多媒体信息智能分析的电力AI方法,其特征在于:所述步骤(2)之前还包括:对用户的身份鉴别和授权判断,对于信息内网和信息外网用户的身份鉴别和权限控制通过统一权限平台实现;对于通过APP端登录的互联网用户的身份鉴别和权限控制通过I型信息网络安全接入网关和国网CA系统实现。
7.基于多媒体信息智能分析的电力AI系统,其特征在于,包括:
AI能力生成模块,用于生成多种AI能力,包括:
获取电力的多媒体数据信息样本,根据多媒体数据种类和使用场景获取不同数据约束以及数据集规范并匹配数据的预处理方法;
基于预处理数据进行标注;
对标注后的数据通过预设数据导入方法存储到资源库;
基于不同AI能力搭建AI模型并输入标注后的多媒体数据进行AI能力迭代训练;
基于训练完成的AI模型按照接口识别、API请求规范和返回值规范依次进行AI能力模块标准化封装;
AI能力使用模块,用于调用至少一种AI能力模块获取数据分析结果,包括:
接收用户端提供的多媒体数据信息和AI能力需求;
匹配数据预处理方法进行预处理操作;
调取至少一种AI能力,进行多媒体信息分析,输出分析结果;
所述根据多媒体数据种类和使用场景获取不同数据约束以及数据集规范并匹配数据的预处理方法,具体包括:
(11)获取数据约束条件,包括获取计算时效约束、通用数据规范约束、物理存储约束、模型平台约束以及基于数据种类获取特征维度约束条件;
(12)基于数据约束条件,获取匹配的数据预处理的基本规范标准;
(13)基于数据使用场景,获取匹配的数据预处理的特别规范标准;
(14)基于基本规范标准和特别规范标准进行数据预处理;
所述数据标注方法,具体步骤包括:
(21)获取待标注数据;
(22)基于每个机器学习模型获得数据多种标注类别的概率值;
(23)将多个机器学习模型获得的多种标注类别的概率值进行归一化处理,获取最大概率值对应的标注类别记为机器学习输出的标注值;
(24)判断概率分值是否大于第一预设阈值,若是,则进入步骤(25),否则,进入步骤(26);
(25)对标注后的数据选择部分检验,验证机器学习标注的数值和人工标注的数值的相同度,若相同度大于第二预设阈值,则机器学习输出的标签为数据的实际标签数据,并对机器学习标注的数值和人工标注的数值相同的数据记为第0待选数据,对两种标记不同的数据记为第1待选数据,否则对该部分数据进行人工标注修正,并进行下一部分选择数据的检验;
(26)对数据以人工标注方法获取标注值,并验证机器学习标注的数值和人工标注的数值的相同度,并对机器学习标注的数值和人工标注的数值相同的数据记为第2待选数据,对两种标记不同的数据记为第1待选数据,其中,第1待选数据为机器学习模型标注不准确的数据;
(27)根据步骤(25)和(26)获取的相同度修正第一预设阈值,并进入步骤(14)直至机器学习标注的数值和人工标注的数值完全相同。
8.一种电子设备,其特征在于,所述电子设备包括:
存储器,用于存储可执行指令;
处理器,用于运行所述存储器存储的可执行指令时,实现权利要求1至6任一项所述的基于多媒体信息智能分析的电力AI方法。
9.一种计算机可读存储介质,存储有可执行指令,其特征在于,所述可执行指令被处理器执行时实现权利要求1至6任一项所述的基于多媒体信息智能分析的电力AI方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011097958.9A CN112200465B (zh) | 2020-10-14 | 2020-10-14 | 基于多媒体信息智能分析的电力ai方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011097958.9A CN112200465B (zh) | 2020-10-14 | 2020-10-14 | 基于多媒体信息智能分析的电力ai方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112200465A CN112200465A (zh) | 2021-01-08 |
CN112200465B true CN112200465B (zh) | 2024-04-19 |
Family
ID=74008658
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011097958.9A Active CN112200465B (zh) | 2020-10-14 | 2020-10-14 | 基于多媒体信息智能分析的电力ai方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112200465B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113158044B (zh) * | 2021-04-20 | 2022-04-26 | 科技日报社 | 全媒体在线审读的方法、系统、终端设备和存储介质 |
CN113553465B (zh) * | 2021-06-15 | 2023-12-19 | 深圳供电局有限公司 | 声音数据入库方法、装置、计算机设备和存储介质 |
Citations (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0340039A2 (en) * | 1988-04-29 | 1989-11-02 | Xerox Corporation | Search tree data structure encoding for textual substitution data compression systems |
CN101441677A (zh) * | 2008-12-25 | 2009-05-27 | 上海交通大学 | 基于产品全语义模型的自然交互式虚拟装配系统 |
CN104850857A (zh) * | 2015-05-15 | 2015-08-19 | 浙江大学 | 基于视觉空间显著性约束的跨摄像机行人目标匹配方法 |
EP3240284A1 (en) * | 2014-12-24 | 2017-11-01 | LG Electronics Inc. | Digital device and method for processing data by same digital device |
CN107577760A (zh) * | 2017-09-01 | 2018-01-12 | 北京神州泰岳软件股份有限公司 | 一种基于约束规范的文本分类方法及装置 |
CN107958510A (zh) * | 2017-11-06 | 2018-04-24 | 哈尔滨理工大学 | 基于arm的智能门禁系统及其控制方法 |
CN108881446A (zh) * | 2018-06-22 | 2018-11-23 | 深源恒际科技有限公司 | 一种基于深度学习的人工智能平台系统 |
WO2019010686A1 (zh) * | 2017-07-14 | 2019-01-17 | 深圳市元征科技股份有限公司 | 一种数据处理方法及数据处理设备 |
CN109447048A (zh) * | 2018-12-25 | 2019-03-08 | 苏州闪驰数控系统集成有限公司 | 一种人工智能预警系统 |
CN110263934A (zh) * | 2019-05-31 | 2019-09-20 | 中国信息通信研究院 | 一种人工智能数据标注方法和装置 |
CN110472114A (zh) * | 2019-07-03 | 2019-11-19 | 平安科技(深圳)有限公司 | 异常数据预警方法、装置、计算机设备及存储介质 |
CN110598075A (zh) * | 2019-08-21 | 2019-12-20 | 成都信息工程大学 | 一种基于人工智能的互联网媒体内容安全监测系统及方法 |
CN110705712A (zh) * | 2018-12-24 | 2020-01-17 | 杭州中软安人网络通信股份有限公司 | 面向第三方社会服务的人工智能基础资源与技术开放平台 |
CN110795703A (zh) * | 2019-09-20 | 2020-02-14 | 华为技术有限公司 | 数据防窃取方法和相关产品 |
CN110808962A (zh) * | 2019-10-17 | 2020-02-18 | 奇安信科技集团股份有限公司 | 一种畸形数据包检测方法及装置 |
CN111260075A (zh) * | 2020-01-10 | 2020-06-09 | 厦门驿全智能科技有限公司 | 机器模拟待模拟目标学习和工作的人工智能方法及系统 |
CN111476837A (zh) * | 2019-01-23 | 2020-07-31 | 上海科技大学 | 自适应立体匹配优化方法及其装置、设备和存储介质 |
CN111598190A (zh) * | 2020-07-21 | 2020-08-28 | 腾讯科技(深圳)有限公司 | 图像目标识别模型的训练方法、图像识别方法及装置 |
CN111708534A (zh) * | 2020-06-11 | 2020-09-25 | 深圳市昌卓科技有限公司 | 一种支持语音识别及搜索和图像识别的系统 |
-
2020
- 2020-10-14 CN CN202011097958.9A patent/CN112200465B/zh active Active
Patent Citations (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0340039A2 (en) * | 1988-04-29 | 1989-11-02 | Xerox Corporation | Search tree data structure encoding for textual substitution data compression systems |
CN101441677A (zh) * | 2008-12-25 | 2009-05-27 | 上海交通大学 | 基于产品全语义模型的自然交互式虚拟装配系统 |
EP3240284A1 (en) * | 2014-12-24 | 2017-11-01 | LG Electronics Inc. | Digital device and method for processing data by same digital device |
CN104850857A (zh) * | 2015-05-15 | 2015-08-19 | 浙江大学 | 基于视觉空间显著性约束的跨摄像机行人目标匹配方法 |
WO2019010686A1 (zh) * | 2017-07-14 | 2019-01-17 | 深圳市元征科技股份有限公司 | 一种数据处理方法及数据处理设备 |
CN107577760A (zh) * | 2017-09-01 | 2018-01-12 | 北京神州泰岳软件股份有限公司 | 一种基于约束规范的文本分类方法及装置 |
CN107958510A (zh) * | 2017-11-06 | 2018-04-24 | 哈尔滨理工大学 | 基于arm的智能门禁系统及其控制方法 |
CN108881446A (zh) * | 2018-06-22 | 2018-11-23 | 深源恒际科技有限公司 | 一种基于深度学习的人工智能平台系统 |
CN110705712A (zh) * | 2018-12-24 | 2020-01-17 | 杭州中软安人网络通信股份有限公司 | 面向第三方社会服务的人工智能基础资源与技术开放平台 |
CN109447048A (zh) * | 2018-12-25 | 2019-03-08 | 苏州闪驰数控系统集成有限公司 | 一种人工智能预警系统 |
CN111476837A (zh) * | 2019-01-23 | 2020-07-31 | 上海科技大学 | 自适应立体匹配优化方法及其装置、设备和存储介质 |
CN110263934A (zh) * | 2019-05-31 | 2019-09-20 | 中国信息通信研究院 | 一种人工智能数据标注方法和装置 |
CN110472114A (zh) * | 2019-07-03 | 2019-11-19 | 平安科技(深圳)有限公司 | 异常数据预警方法、装置、计算机设备及存储介质 |
CN110598075A (zh) * | 2019-08-21 | 2019-12-20 | 成都信息工程大学 | 一种基于人工智能的互联网媒体内容安全监测系统及方法 |
CN110795703A (zh) * | 2019-09-20 | 2020-02-14 | 华为技术有限公司 | 数据防窃取方法和相关产品 |
CN110808962A (zh) * | 2019-10-17 | 2020-02-18 | 奇安信科技集团股份有限公司 | 一种畸形数据包检测方法及装置 |
CN111260075A (zh) * | 2020-01-10 | 2020-06-09 | 厦门驿全智能科技有限公司 | 机器模拟待模拟目标学习和工作的人工智能方法及系统 |
CN111708534A (zh) * | 2020-06-11 | 2020-09-25 | 深圳市昌卓科技有限公司 | 一种支持语音识别及搜索和图像识别的系统 |
CN111598190A (zh) * | 2020-07-21 | 2020-08-28 | 腾讯科技(深圳)有限公司 | 图像目标识别模型的训练方法、图像识别方法及装置 |
Non-Patent Citations (1)
Title |
---|
语义物联网中事件驱动的服务发现关键问题研究;邓达成;《中国博士学位论文全文数据库 信息科技辑》(第05期);第I136-65页 * |
Also Published As
Publication number | Publication date |
---|---|
CN112200465A (zh) | 2021-01-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112200465B (zh) | 基于多媒体信息智能分析的电力ai方法及系统 | |
CN108270640B (zh) | 一种智能营配信息集成系统信息互操作一致性测试方法 | |
CN112836018A (zh) | 应急预案的处理方法及装置 | |
CN117271767A (zh) | 基于多智能体的运维知识库的建立方法 | |
CN111143404B (zh) | 一种业务处理方法及装置 | |
CN112396437A (zh) | 一种基于知识图谱的贸易合同验证方法及装置 | |
CN115062117A (zh) | 一种基于自然语言处理技术的文档自动生成分类的方法 | |
CN112417852B (zh) | 一种代码片段重要性的判断方法和装置 | |
CN116739408A (zh) | 基于数据标签的电网调度安全监控方法、系统及电子设备 | |
CN111353728A (zh) | 一种风险分析方法和系统 | |
CN115827885A (zh) | 一种运维知识图谱的构建方法、装置及电子设备 | |
CN113342987B (zh) | 配电dtu验收专用语料库的复合网络构建方法 | |
CN115905574A (zh) | 一种面向船舶电力系统设计任务的知识图谱构建方法及装置 | |
CN115409104A (zh) | 用于识别对象类型的方法、装置、设备、介质和程序产品 | |
CN115102852B (zh) | 物联网业务开通方法、装置、电子设备及计算机介质 | |
CN118037250B (zh) | 应用文字信息化系统的数据挖掘方法及系统 | |
CN111324706B (zh) | 一种标注方法、装置及电子设备 | |
CN116739646B (zh) | 网络交易大数据分析方法及分析系统 | |
CN116684529A (zh) | 外呼处理方法、装置、计算机设备及存储介质 | |
CN114648206A (zh) | 一种组织流程管理方法、装置、电子设备及存储介质 | |
CN117521028A (zh) | 一种内容检测方法、系统、存储介质和电子设备 | |
CN115221381A (zh) | 一种基于深度学习技术的企业kyc舆情监控方法及系统 | |
CN117407441A (zh) | 一种应用于领域数据治理的人工智能平台 | |
CN117057733A (zh) | 一种基于智能大脑的电子政务管理平台及方法 | |
CN116932771A (zh) | 一种fmea知识图谱构建方法、装置和设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |