CN117576632A

CN117576632A - 基于多模态ai大模型的电网监控火灾预警系统及方法

Info

Publication number: CN117576632A
Application number: CN202410057541.1A
Authority: CN
Inventors: 刘忠祖; 王文强; 刘艳晓; 王爱民; 刘天喜; 李增辉
Original assignee: Shandong Jinqiao Security Equipment Co ltd
Current assignee: Shandong Jinqiao Security Equipment Co ltd
Priority date: 2024-01-16
Filing date: 2024-01-16
Publication date: 2024-02-20
Anticipated expiration: 2044-01-16
Also published as: CN117576632B

Abstract

本发明涉及电网环境中的火灾预警技术领域，尤其涉及一种基于多模态AI大模型的电网监控火灾预警系统及方法。包括以下步骤：采集电网运行状态下的环境视频，进行抽帧图像质量增强，并将其按照标准参数进行封装，保存为统一的格式；将处理好的图像使用视觉大模型进行智能分析，得到对图像内容的文字化描述；将得到的图像内容的文字化描述作为输入，使用文本大模型对其进行进行语义分析，研判火灾风险；当存在火灾风险时，使用音频大模型生成预警语音，以告警的形式传播给相关职能人员，实现电网环境下的火灾智能预警。能够对电网环境下采集到的图像质量进行增强，利用多模态AI大模型对增强后的电网监控图像进行分析、研判。

Description

基于多模态AI大模型的电网监控火灾预警系统及方法

技术领域

本发明涉及电网环境中的火灾预警技术领域，尤其涉及一种基于多模态AI大模型的电网监控火灾预警系统及方法。

背景技术

电网是国家基础设施的重要组成部分，其安全运行对社会经济活动至关重要，由于电网环境的复杂性和易燃性材料的普遍存在，火灾风险一直是电网安全管理中的一个主要问题。传统的火灾预警系统依赖于简单的传感器和人工监控，这在处理复杂的环境和迅速变化的情况时，常常显示出反应迟缓和识别不准确的问题，此外，传统系统在分析大规模视频数据时面临着巨大的挑战，包括数据处理效率低下和误报率高等。在这种背景下，AI大模型的应用提供了明显的优势，这些模型利用先进的机器学习算法，能够从复杂的视频数据中提取关键信息，并进行高效的实时分析。

因此，本发明利用大模态AI大模型的综合能力，克服传统火灾预警系统的局限性，为电网环境提供一个更智能、更可靠的火灾预警解决方案。

发明内容

本发明针对现有技术的不足，研制一种基于多模态AI大模型的电网监控火灾预警系统及方法，主要目的在于实现电网环境中利用视频监控对火灾风险进行智能预警。

本发明解决技术问题的技术方案为：一方面，本发明提供了一种基于多模态AI大模型的电网监控火灾预警方法，其包括以下步骤：

S1.采集电网运行状态下的环境视频，按照一定频率进行抽帧，结合图像增强技术提升弱光条件下的图像质量，并将其按照标准参数进行封装，保存为统一的格式；

S2.将处理好的图像使用视觉大模型进行智能分析，得到对图像内容的文字化描述；

S3. 将得到的图像内容的文字化描述作为输入，使用文本大模型对其进行进行语义分析，研判火灾风险；

S4.当存在火灾风险时，使用音频大模型生成预警语音，以告警的形式传播给相关职能人员，实现电网环境下的火灾智能预警。

上述基于多模态AI大模型的电网监控火灾预警方法优选方案，S1具体包括以下步骤：

S1.1视频采集与抽帧：视频通过可见光摄像机实时采集，按照预定的频率从视频中抽取关键帧，在满足实时性预警的前提下减少数据量和处理需求:

，

其中，表示抽取的帧集合，/>表示第/>个抽取的帧，/>表示根据采集频率和视频持续时间确定的总帧数；

S1.2图像质量增强：

（1）自适应直方图均衡化：

a. 分割图像:通过将图像分割成多个小的、重叠的区块，来保证区块覆盖整个图像，以及每个像素都在某个区块的中心；

b. 计算局部直方图: 在每个区块中通过统计该区块内每个亮度级出现的频率，计算其直方图 />：

，

其中，表示区块中第i个像素的亮度值，/>表示计算集合中元素数量的函数;

c. 计算累积分布函数：对于每个小区块的直方图，计算其累积分布函数：

，

其中，表示亮度级/>及其以下的累积频次，/>表示亮度级为/>的直方图;

d. 应用均衡化：通过每个区块的累积分布函数对该区块内每个像素的亮度值进行调整，得到新的亮度值/>，计算公式为：

,

其中，L表图像中亮度级别的数量，表示该区块中最小的累积频率，表示该区块中的最大累积频率，/>表示取整操作；

e. 应用均衡化:通过在每个小区块上应用上述均衡化过程，并将所有区块的结果进行组合来重建整个图像，通过取平均值决定最终像素值；

（2）非局部均值去噪：

a. 定义邻域和搜索窗口：对于图像中的每个像素，定义一个围绕该像素的小区块，称为邻域/>,邻域/>通常是一个小的正方形窗口，包含中心像素/>及其周围的像素，然后对每个邻域/>,定义一个更大的围绕/>的搜索窗口/>,搜索窗口/>包含邻域/>及其周围的更多像素；

b. 计算权重：计算像素中邻域/>和搜索窗口/>中邻域/>的权重/>,

该权重反映了和/>之间的相似度，权重计算过程如下：

,

其中，表示/>和/>之间的欧几里得距离，/>表示用于调整相似性敏感度的平滑参数，q表示邻域/>中的像素；

c. 计算去噪后的像素值：搜索窗口内所有邻域的加权平均，通过权重/>估计每个像素/>的去噪值：

,

其中，表示原始图像中像素/>的值，/>表示去噪后像素/>的值；

d. 重建图像：将上述步骤应用于图像中的每个像素，通过计算每个像素的去噪值来重建整个去噪后的图像；

S1.3图像封装：完成图像质量增强和去噪处理后，将处理后的图像封装成最终的文件格式。

上述基于多模态AI大模型的电网监控火灾预警方法优选方案，S2具体如下：使用视觉大模型对处理后的图像/>进行分析，输出描述图像内容的文字化描述，计算公式为：

，

其中，表示输入的预处理后的图像，/>表示用于图像理解的AI模型。

上述基于多模态AI大模型的电网监控火灾预警方法优选方案，S3具体如下：将视觉模型生成的文字描述作为输入，使用文本大模型/>进行语义分析，进行评估火灾风险/>，计算公式为:

,

其中，表示关于火灾风险的评估，对应火灾风险的分类,包括“高风险”、“中风险”、“低风险”、“无风险”。

上述基于多模态AI大模型的电网监控火灾预警方法优选方案，S4具体如下：使用文本大模型结合火灾风险的评估/>和文字描述/>生成告警内容/>，使用音频大模型/>将告警内容转换为告警语音/>,计算公式为：

,

其中，示由文本大模型生成的告警内容，包括火灾风险等级和图像内容的综合描述，/>表示火灾风险的评估/>和文字描述/>进行字符串合并。

另一方面，本发明的实施例提供了一种基于多模态AI大模型的电网监控火灾预警系统，其包括监控视频采集与处理模块、多模态AI大型智能分析模块和火灾风险预警模块；

监控视频采集与处理模块通过可见光摄像头获取实时的监控视频，得到电网运行状态下的环境视频数据，并对这些视频数据进行初步处理，对获取的视频数据进行抽帧，并通过自适应直方图均衡化和非局部均值去噪进行图像质量增强；

智能分析模块采用视觉大模型进行智能分析，得到对图像内容的文字化描述，将其作为输入使用文本大模型进行语义分析，研判火灾风险；

火灾风险预警模块用于基于智能分析模块的分析结果，结合文本大模型和音频大模型，生成并发出语音预警信号。

发明内容中提供的效果仅仅是实施例的效果，而不是发明所有的全部效果，上述技术方案具有如下优点或有益效果：

本发明提供了一种基于多模态AI大模型的电网监控火灾预警系统及方法，通过自适应直方图均衡化和非局部均值去噪技术，实现对电网环境下可见光摄像机采集到的图像质量进行增强；利用多模态AI大模型技术，包括视觉大模型、文本大模型，对增强后的电网监控图像进行分析、研判，并实现智能告警。

附图说明

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。

图1为本发明的方法流程示意图。

图2为本发明的系统结构示意图。

具体实施方式

为了能清楚说明本方案的技术特点，下面通过具体实施方式，并结合其附图，对本发明进行详细阐述。下文的公开提供了许多不同的实施例或例子用来实现本发明的不同结构。为了简化本发明的公开，下文中对特定例子的部件和设置进行描述。

实施例1 如图1所示，一种基于多模态AI大模型的电网监控火灾预警方法，其包括以下步骤：

，

其中，表示抽取的帧集合，/>表示第/>个抽取的帧，/>示根据采集频率和视频持续时间确定的总帧数；

S1.2图像质量增强：

（1）自适应直方图均衡化：

b. 计算局部直方图: 在每个区块中通过统计该区块内每个亮度级出现的频率，计算其直方图/>：

,

其中，L表图像中亮度级别的数量，表示该区块中最小的累积频率，表示该区块中的最大累积频率，/>表示；

（2）非局部均值去噪：

a. 定义邻域和搜索窗口：对于图像中的每个像素，定义一个围绕该像素的小区块，称为邻域/>，邻域/>通常是一个小的正方形窗口，包含中心像素/>及其周围的像素，然后对每个邻域/>,定义一个更大的围绕/>的搜索窗口/>，搜索窗口/>包含邻域/>及其周围的更多像素；

b. 计算权重：计算像素中邻域/>和搜索窗口/>中邻域/>的权重/>，该权重反映了/>和/>之间的相似度，权重计算过程如下：

，

其中，表示/>和/>之间的欧几里得距离，/>表示用于调整相似性敏感度的平滑参数，q表示/>中的像素；

，

上述基于多模态AI大模型的电网监控火灾预警方法优选方案，S2具体如下：使用视觉大模型对处理后的图像/>进行分析，输出描述图像内容的文字化描述/>，计算公式为：

，

其中，表示输入的预处理后的图像，/>示用于图像理解的AI模型。

，

上述基于多模态AI大模型的电网监控火灾预警方法优选方案，S4具体如下：使用文本大模型结合火灾风险的评估/>和文字描述/>生成告警内容/>，使用音频大模型/>将告警内容转换为告警语音/>，计算公式为：

，

其中，表示由文本大模型生成的告警内容，包括火灾风险等级和图像内容的综合描述，/>表示火灾风险的评估/>和文字描述/>进行字符串合并，随后，文本内容通过音频大模型/>转换为语音形式，通过声音告警系统传播预警信息。

实施例2 如图2所示，本实施例中，提供了一种基于多模态AI大模型的电网监控火灾预警系统，其包括监控视频采集与处理模块、多模态AI大型智能分析模块和火灾风险预警模块；

实施例3 如表1所示，本研究利用KMU Fire & Smoke火灾视频数据集，分别使用现有基于特征的对象识别单一模型的视频分析技术和本发明提出的基于多模态AI大模型的电网火灾监控技术进行火灾风险检测，结果显示，相较现有技术，本发明所提出的技术具有更高的准确率和适应性。

表1 本发明中的方法与其他方法的对比结果

性能指标	本发明（基于多模态AI大模型）	基于单一模型的视频分析技术
			准确性（综合）	94%	83%
误报率	5%	13%
			测试环境适应性（不同光照下的准确性）	93%（低光照）、96%（标准光照）	73%（低光照）、85%（标准光照）

上述虽然结合附图对发明的具体实施方式进行了描述，但并非对本发明保护范围的限制，在本发明的技术方案的基础上，本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims

1.一种基于多模态AI大模型的电网监控火灾预警方法，其特征是：包括以下步骤：

S3.将得到的图像内容的文字化描述作为输入，使用文本大模型对其进行进行语义分析，研判火灾风险；

2.根据权利要求1所述基于多模态AI大模型的电网监控火灾预警方法，其特征是，

S1.具体包括以下步骤：

，

其中，表示抽取的帧集合，/>表示第 /> 个抽取的帧，/>表示根据采集频率和视频持续时间确定的总帧数；

S1.2图像质量增强：

（1）自适应直方图均衡化：

,

其中，表示区块中第i个像素的亮度值，/>表示计算集合中元素数量的函数，/>表示亮度级;

,

d. 应用均衡化：通过每个区块的累积分布函数对该区块内每个像素的亮度值进行调整，得到新的亮度值/>,计算公式为：

,

（2）非局部均值去噪：

a. 定义邻域和搜索窗口：对于图像中的每个像素,定义一个围绕该像素的小区块，称为邻域/>,邻域/>通常是一个小的正方形窗口，包含中心像素/>及其周围的像素，然后对每个邻域/>,定义一个更大的围绕/>的搜索窗口/>，搜索窗口/>包含邻域/>及其周围的更多像素；

b. 计算权重：计算像素中邻域/>和搜索窗口/>中邻域/>的权重/>,权重计算过程如下：

,

c. 计算去噪后的像素值：搜索窗口内所有邻域的加权平均，通过权重/>估计每个像素 /> 的去噪值：

,

3.根据权利要求2所述基于多模态AI大模型的电网监控火灾预警方法，其特征是，S2具体如下：使用视觉大模型对处理后的图像/>进行分析，输出描述图像内容的文字化描述/>，计算公式为：

，

4.根据权利要求3所述基于多模态AI大模型的电网监控火灾预警方法，其特征是，S3具体如下：将视觉模型生成的文字描述作为输入，使用文本大模型/>进行语义分析，进行火灾风险评估/>，计算公式为:

,

5.根据权利要求4所述基于多模态AI大模型的电网监控火灾预警方法，其特征是，S4具体如下：使用文本大模型结合火灾风险的评估/>和文字描述/>生成告警内容,使用音频大模型/>将告警内容转换为告警语音/>，计算公式为：，/>，

其中，表示由文本大模型生成的告警内容，包括火灾风险等级和图像内容的综合描述，/>表示火灾风险的评估/>和文字描述/>进行字符串合并。

6.一种基于多模态AI大模型的电网监控火灾预警系统，其特征是，其包括监控视频采集与处理模块、多模态AI大型智能分析模块和火灾风险预警模块；