CN116320538A - 变电站巡检图像的语义通信传输方法及系统 - Google Patents

变电站巡检图像的语义通信传输方法及系统 Download PDF

Info

Publication number
CN116320538A
CN116320538A CN202310106702.7A CN202310106702A CN116320538A CN 116320538 A CN116320538 A CN 116320538A CN 202310106702 A CN202310106702 A CN 202310106702A CN 116320538 A CN116320538 A CN 116320538A
Authority
CN
China
Prior art keywords
semantic
inspection image
image
coding
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310106702.7A
Other languages
English (en)
Inventor
范森然
王秋苏
孙哲
董辰
刘庚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Posts and Telecommunications
Original Assignee
Beijing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Posts and Telecommunications filed Critical Beijing University of Posts and Telecommunications
Priority to CN202310106702.7A priority Critical patent/CN116320538A/zh
Publication of CN116320538A publication Critical patent/CN116320538A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234309Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by transcoding between formats or standards, e.g. from MPEG-2 to MPEG-4 or from Quicktime to Realvideo
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440218Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by transcoding between formats or standards, e.g. from MPEG-2 to MPEG-4
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本申请提供一种变电站巡检图像的语义通信传输方法及系统,所述方法包括:在变电站中将自身采集的目标巡检图像输入预设的语义编码模型,以使该语义编码模型输出所述目标巡检图像对应的语义特征向量;将所述目标巡检图像的语义特征向量经无线信道传输至图像接收端,以使该图像接收端将该目标巡检图像的语义特征向量输入预设的语义解码模型,以得到所述目标巡检图像对应的传输巡检图像,其中,所述语义编码模型和所述语义解码模型预先采用信源信道联合编码的方式训练得到。本申请能够在低信噪比情况下传输巡检图像并有效提升巡检图像的传输质量。

Description

变电站巡检图像的语义通信传输方法及系统
技术领域
本申请涉及通信技术领域,尤其涉及一种变电站巡检图像的语义通信传输方法及系统。
背景技术
语义通信是一种可将用户的需求和信息含义融入通信过程中的全新架构,可以通过探索语义信息来显着提高传输效率。而近年来人工智能技术不断发展,在算法、算力、数据方面的巨大进步,使得其能够进行提取图像、文本、语音等语义信息的精准高效提取,使语义通信在工程层面成为可能。在变电站巡检过程中,图像采集端如巡检机器人遇到信号较弱的情况或者进入信号弱的区域时,将难以进行巡检图片的正常回传,降低了变电站日常巡检的质量。
现有技术主要运用了传统的通信方式,即对待回传图片进行传统的图像编码,再对编码后的结果进行信源编码,将其通过信道传输后再依次解码。传统的图像编码一般是熵编码,其尽量保存全部信息的性质,导致其难以达到较高的信息压缩率。同时传统的图像传输技术,利用了信源编码加上信道编码的形式,这样的形式在高信噪比下具有良好的特征,然而随着信噪比的降低,该方式传输的图片质量将极速下降,甚至在极低信噪比时,传统的传输方式将不能工作。
因此,现有通信方式在低信噪比情况下图片传输质量差或难以传输。
发明内容
鉴于此,本申请实施例提供了一种变电站巡检图像的语义通信传输方法及系统,以消除或改善现有技术中存在的一个或更多个缺陷。
本申请的第一个方面提供了一种变电站巡检图像的语义通信传输方法,该方法包括:
在变电站中将自身采集的目标巡检图像输入预设的语义编码模型,以使该语义编码模型输出所述目标巡检图像对应的语义特征向量;
将所述目标巡检图像的语义特征向量经无线信道传输至图像接收端,以使该图像接收端将该目标巡检图像的语义特征向量输入预设的语义解码模型,以得到所述目标巡检图像对应的传输巡检图像,其中,所述语义编码模型和所述语义解码模型预先采用信源信道联合编码的方式训练得到。
在本申请的一些实施例中,所述语义编码模型包括:编码器和重点语义增强系统;
相对应的,所述在变电站中将自身采集的目标巡检图像输入预设的语义编码模型,以使该语义编码模型输出所述目标巡检图像对应的语义特征向量,包括:
在变电站中将自身采集的目标巡检图像输入所述重点语义增强系统,以使该重点语义增强系统基于预设的重点特征识别规则自所述目标巡检图像中识别并提取重点特征子图,而后将所述目标巡检图像和所述重点特征子图均输入所述编码器进行语义编码,以得到所述目标巡检图像和所述重点特征子图各自对应的语义特征编码向量,根据所述重点特征子图对应的语义特征编码向量对所述目标巡检图像对应的语义特征编码向量进行语义增强得到所述目标巡检图像对应的语义特征向量。
在本申请的一些实施例中,在所述在变电站中将自身采集的目标巡检图像输入预设的语义编码模型,以使该语义编码模型输出所述目标巡检图像对应的语义特征向量之前,还包括:
获取包含有设有语义编码标签的历史巡检图像的训练集;
采用信源信道联合编码的方式,应用所述训练集对预设的机器学习网络架构进行训练,以分别得到用于对巡检图像进行语义编码的语义编码模型和用于对巡检图像对应的语义特征向量进行语义解码的语义解码模型,其中,所述机器学习网络架构包括依次连接的语义编码模型、预设的信道仿真模型、判别器及语义解码模型;所述语义编码模型包括:编码器和重点语义增强系统;所述语义解码模型包括:解码器;本地存储用于对巡检图像进行语义编码的语义编码模型。
在本申请的一些实施例中,所述采用信源信道联合编码的方式,应用所述训练集对预设的机器学习网络架构进行训练,以分别得到用于对巡检图像进行语义编码的语义编码模型和用于对巡检图像对应的语义特征向量进行语义解码的语义解码模型,包括:
在离线状态下采用所述重点语义增强系统中的目标神经检测网络对所述训练集中设有语义编码标签的历史巡检图像基于预设的重点特征识别规则进行检测并剪切得到所述训练集中设有语义编码标签的历史巡检图像对应的区域图像;根据所述编码器对所述训练集中设有语义编码标签的历史巡检图像和所述区域图像分别进行编码得到所述训练集中设有语义编码标签的历史巡检图像的语义编码和所述区域图像对应的语义编码,将所述训练集中设有语义编码标签的历史巡检图像的语义编码和所述区域图像对应的语义编码分别进行量化得到整体压缩编码和区域压缩编码;根据信道仿真模型模拟仿真噪声向量以将该仿真噪声向量分别叠加至所述整体压缩编码和所述区域压缩编码以得到整体仿真编码和区域仿真编码;根据所述重点语义增强系统中的语义增强系统将所述区域仿真编码对所述整体仿真编码进行增强以得到所述训练集中设有语义编码标签的历史巡检图像对应的语义特征增强向量;根据所述目标神经检测网络、编码器和语义增强系统的训练过程得到对所述巡检图像进行语义编码的语义编码模型。
在离线状态下根据所述判别器将所述整体仿真编码和所述区域仿真编码分别与设有语义编码标签的历史巡检图像进行向量拼接并输入预先训练的VGG网络以分别得到整体浮点数和区域浮点数,将所述整体浮点数和所述区域浮点数分别与自然图像标签值进行交叉熵计算得到整体对抗生成损失函数和区域对抗生成损失函数以用于提高解码器的图像生成质量;根据所述解码器将所述整体仿真编码和所述区域仿真编码分别进行解码得到整体巡检图像和区域巡检图像;根据所述判别器和解码器的训练过程得到对所述巡检图像进行语义解码的语义解码模型。
在本申请的一些实施例中,所述语义编码模型中的重点语义增强系统包括:
目标神经检测网络,用于对所述目标巡检图像基于预设的重点特征识别规则进行检测并剪切得到所述目标巡检图像对应的区域图像;
语义增强系统,用于根据所述重点特征子图对应的语义特征编码向量对所述目标巡检图像对应的语义特征编码向量进行语义增强得到所述目标巡检图像对应的语义特征向量;
所述语义编码模型中的编码器,用于对所述目标巡检图像编码得到所述目标巡检图像对应的语义特征向量。
本申请的第二个方面提供了一种变电站巡检图像的语义通信传输方法,该方法包括:
经无线信道接收变电站中的图像采集端发送的目标巡检图像对应的语义特征向量,其中,所述目标巡检图像对应的语义特征向量为所述图像采集端在变电站中将自身采集的目标巡检图像输入预设的语义编码模型后由该语义编码模型输出的;
将所述目标巡检图像的语义特征向量输入预设的语义解码模型,以得到所述目标巡检图像对应的传输巡检图像,其中,所述语义编码模型和所述语义解码模型预先采用信源信道联合编码的方式训练得到。
在本申请的一些实施例中,在所述经无线信道接收变电站中的图像采集端发送的目标巡检图像对应的语义特征向量之前,还包括:
获取包含有设有语义编码标签的历史巡检图像的训练集;
采用信源信道联合编码的方式,应用所述训练集对预设的机器学习网络架构进行训练,以分别得到用于对巡检图像进行语义编码的语义编码模型和用于对巡检图像对应的语义特征向量进行语义解码的语义解码模型,其中,所述机器学习网络架构包括依次连接的语义编码模型、预设的信道仿真模型、判别器及语义解码模型;所述语义编码模型包括:编码器和重点语义增强系统;所述语义解码模型包括:解码器;本地存储用于对巡检图像对应的语义特征向量进行语义解码的语义解码模型。
本申请的第三个方面提供了一种变电站巡检图像的语义通信传输系统,该系统包括:
基于无线网络通信连接的图像采集端和图像接收端;
所述图像采集端,用于执行前述第一个方面所述的变电站巡检图像的语义通信传输方法;
所述图像接收端,用于执行前述第二个方面所述的变电站巡检图像的语义通信传输方法。
本申请的第四个方面还提供了一种图像采集端,包括:
图像编码模块,用于在变电站中将自身采集的目标巡检图像输入预设的语义编码模型,以使该语义编码模型输出所述目标巡检图像对应的语义特征向量;
图像发送模块,用于将所述目标巡检图像的语义特征向量经无线信道传输至图像接收端,以使该图像接收端将该目标巡检图像的语义特征向量输入预设的语义解码模型,以得到所述目标巡检图像对应的传输巡检图像,其中,所述语义编码模型和所述语义解码模型预先采用信源信道联合编码的方式训练得到。
本申请的第五个方面还提供了一种图像接收端,包括:
图像编码接收模块,用于经无线信道接收变电站中的图像采集端发送的目标巡检图像对应的语义特征向量,其中,所述目标巡检图像对应的语义特征向量为所述图像采集端在变电站中将自身采集的目标巡检图像输入预设的语义编码模型后由该语义编码模型输出的;
图像生成模块,用于将所述目标巡检图像的语义特征向量输入预设的语义解码模型,以得到所述目标巡检图像对应的传输巡检图像,其中,所述语义编码模型和所述语义编码模型预先采用信源信道联合编码的方式训练得到。
本申请的第六个方面提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现前述的第一方面所述的变电站巡检图像的语义通信传输方法,或者,实现前述的第二方面所述的变电站巡检图像的语义通信传输方法。
本申请的第七个方面提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现前述的第一方面所述的变电站巡检图像的语义通信传输方法,或者,实现前述的第二方面所述的变电站巡检图像的语义通信传输方法。
本申请提供一种变电站巡检图像的语义通信传输方法及系统,所述方法包括:在变电站中将自身采集的目标巡检图像输入预设的语义编码模型,以使该语义编码模型输出所述目标巡检图像对应的语义特征向量;将所述目标巡检图像的语义特征向量经无线信道传输至图像接收端,以使该图像接收端将该目标巡检图像的语义特征向量输入预设的语义解码模型,以得到所述目标巡检图像对应的传输巡检图像,其中,所述语义编码模型和所述语义解码模型预先采用信源信道联合编码的方式训练得到。本申请能够在低信噪比情况下传输巡检图像并有效提升巡检图像的传输质量。
本申请的附加优点、目的,以及特征将在下面的描述中将部分地加以阐述,且将对于本领域普通技术人员在研究下文后部分地变得明显,或者可以根据本申请的实践而获知。本申请的目的和其它优点可以通过在说明书以及附图中具体指出的结构实现到并获得。
本领域技术人员将会理解的是,能够用本申请实现的目的和优点不限于以上具体所述,并且根据以下详细说明将更清楚地理解本申请能够实现的上述和其他目的。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,并不构成对本申请的限定。附图中的部件不是成比例绘制的,而只是为了示出本申请的原理。为了便于示出和描述本申请的一些部分,附图中对应部分可能被放大,即,相对于依据本申请实际制造的示例性装置中的其它部件可能变得更大。在附图中:
图1为本申请一实施例中的第一变电站巡检图像的语义通信传输方法的流程示意图。
图2为本申请另一实施例中的第二变电站巡检图像的语义通信传输方法的流程示意图。
图3为本申请另一实施例中的巡检图像采集端的结构示意图。
图4为本申请另一实施例中的巡检图像接收端的结构示意图。
图5为本申请另一实施例中的整体系统架构图。
图6为本申请另一实施例中的基础系统架构图。
图7为本申请另一实施例中的重点语义增强系统架构图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚明白,下面结合实施方式和附图,对本申请做进一步详细说明。在此,本申请的示意性实施方式及其说明用于解释本申请,但并不作为对本申请的限定。
在此,还需要说明的是,为了避免因不必要的细节而模糊了本申请,在附图中仅仅示出了与根据本申请的方案密切相关的结构和/或处理步骤,而省略了与本申请关系不大的其他细节。
应该强调,术语“包括/包含”在本文使用时指特征、要素、步骤或组件的存在,但并不排除一个或更多个其它特征、要素、步骤或组件的存在或附加。
在此,还需要说明的是,如果没有特殊说明,术语“连接”在本文不仅可以指直接连接,也可以表示存在中间物的间接连接。
在下文中,将参考附图描述本申请的实施例。在附图中,相同的附图标记代表相同或类似的部件,或者相同或类似的步骤。
具体通过下述实施例进行详细说明。
本申请实施例提供一种可以由图像采集端执行的第一变电站巡检图像的语义通信传输方法,参见图1,所述的第一变电站巡检图像的语义通信传输方法具体包含有如下内容:
步骤110:在变电站中将自身采集的目标巡检图像输入预设的语义编码模型,以使该语义编码模型输出所述目标巡检图像对应的语义特征向量。
步骤120:将所述目标巡检图像的语义特征向量经无线信道传输至图像接收端,以使该图像接收端将该目标巡检图像的语义特征向量输入预设的语义解码模型,以得到所述目标巡检图像对应的传输巡检图像,其中,所述语义编码模型和所述语义解码模型预先采用信源信道联合编码的方式训练得到。
具体来说,为了使变电站在低信噪比情况下能够传输巡检图像,图像采集端(如巡检机器人)在变电站中将自身采集的目标巡检图像输入预设的语义编码模型,以使该语义编码模型输出目标巡检图像对应的语义特征向量;然后将目标巡检图像的语义特征向量经无线信道传输至图像接收端,以使该图像接收端将该目标巡检图像的语义特征向量输入预设的语义解码模型,以得到目标巡检图像对应的传输巡检图像,从而能够在低信噪比情况下传输巡检图像。
其中,语义编码模型和语义解码模型预先采用信源信道联合编码的方式训练得到,通过信源信道联合编码在图像传输过程加入模拟噪声,从而能够增强巡检图像的传输质量。
为了在低信噪比情况下提升传输巡检图像的质量,在步骤110中,所述语义编码模型包括:编码器和重点语义增强系统;
相对应的,所述在变电站中将自身采集的目标巡检图像输入预设的语义编码模型,以使该语义编码模型输出所述目标巡检图像对应的语义特征向量,包括:
步骤010:在变电站中将自身采集的目标巡检图像输入所述重点语义增强系统,以使该重点语义增强系统基于预设的重点特征识别规则自所述目标巡检图像中识别并提取重点特征子图,而后将所述目标巡检图像和所述重点特征子图均输入所述编码器进行语义编码,以得到所述目标巡检图像和所述重点特征子图各自对应的语义特征编码向量,根据所述重点特征子图对应的语义特征编码向量对所述目标巡检图像对应的语义特征编码向量进行语义增强得到所述目标巡检图像对应的语义特征向量。
具体来说,图像采集端在变电站中将自身采集的目标巡检图像输入重点语义增强系统,以使该重点语义增强系统基于预设的重点特征识别规则自目标巡检图像中识别并提取重点特征子图,而后将目标巡检图像和重点特征子图均输入编码器进行语义编码,以得到目标巡检图像和重点特征子图各自对应的语义特征编码向量,根据重点特征子图对应的语义特征编码向量对目标巡检图像对应的语义特征编码向量进行语义增强得到目标巡检图像对应的语义特征向量,从而能够在低信噪比情况下有效提升传输巡检图像的质量。
其中,重点特征识别规则是由巡检的工作人员事先划定的。比如在巡检过程中需要机器人收集一些仪表盘中的数据。那么为了收集这些仪表的图片,工作人员需要预先使用一些包含仪表的图片,并手动标记出其中的仪表位置作为数据去训练机器人中的YOLO目标神经检测网络模型。按照这个流程,机器人就能具备寻找、锁定重点语义内容区域的能力。
为了提高模型应用有效性及可靠性,在步骤110之前,还包括:
步骤011:获取包含有设有语义编码标签的历史巡检图像的训练集。
步骤012:采用信源信道联合编码的方式,应用所述训练集对预设的机器学习网络架构进行训练,以分别得到用于对巡检图像进行语义编码的语义编码模型和用于对巡检图像对应的语义特征向量进行语义解码的语义解码模型,其中,所述机器学习网络架构包括依次连接的语义编码模型、预设的信道仿真模型、判别器及语义解码模型;所述语义编码模型包括:编码器和重点语义增强系统;所述语义解码模型包括:解码器;本地存储用于对巡检图像进行语义编码的语义编码模型。
具体来说,图像采集端获取包含有设有语义编码标签的历史巡检图像的训练集;然后采用信源信道联合编码的方式,应用训练集对预设的机器学习网络架构进行训练,以分别得到用于对巡检图像进行语义编码的语义编码模型和用于对巡检图像对应的语义特征向量进行语义解码的语义解码模型,从而能够提高模型应用的有效性及可靠性。
其中,机器学习网络架构包括依次连接的语义编码模型、预设的信道仿真模型、判别器及语义解码模型;语义编码模型包括:编码器和重点语义增强系统;语义解码模型包括:解码器;本地存储用于对巡检图像进行语义编码的语义编码模型。
为了进一步提高模型应用有效性及可靠性,步骤012还包括:
步骤013:在离线状态下采用所述重点语义增强系统中的目标神经检测网络对所述训练集中设有语义编码标签的历史巡检图像基于预设的重点特征识别规则进行检测并剪切得到所述训练集中设有语义编码标签的历史巡检图像对应的区域图像;根据所述编码器对所述训练集中设有语义编码标签的历史巡检图像和所述区域图像分别进行编码得到所述训练集中设有语义编码标签的历史巡检图像的语义编码和所述区域图像对应的语义编码,将所述训练集中设有语义编码标签的历史巡检图像的语义编码和所述区域图像对应的语义编码分别进行量化得到整体压缩编码和区域压缩编码;根据信道仿真模型模拟仿真噪声向量以将该仿真噪声向量分别叠加至所述整体压缩编码和所述区域压缩编码以得到整体仿真编码和区域仿真编码;根据所述重点语义增强系统中的语义增强系统将所述区域仿真编码对所述整体仿真编码进行增强以得到所述训练集中设有语义编码标签的历史巡检图像对应的语义特征增强向量;根据所述目标神经检测网络、编码器和语义增强系统的训练过程得到对所述巡检图像进行语义编码的语义编码模型。
步骤014:在离线状态下根据所述判别器将所述整体仿真编码和所述区域仿真编码分别与设有语义编码标签的历史巡检图像进行向量拼接并输入预先训练的VGG网络以分别得到整体浮点数和区域浮点数,将所述整体浮点数和所述区域浮点数分别与自然图像标签值进行交叉熵计算得到整体对抗生成损失函数和区域对抗生成损失函数以用于提高解码器的图像生成质量;根据所述解码器将所述整体仿真编码和所述区域仿真编码分别进行解码得到整体巡检图像和区域巡检图像;根据所述判别器和解码器的训练过程得到对所述巡检图像进行语义解码的语义解码模型。
参见图5整体系统架构具体来说,图像采集端在离线状态下通过YOLO目标神经检测网络对训练集中设有语义编码标签的历史巡检图像基于预设的重点特征识别规则进行检测并剪切得到区域图像;编码过程参见图6基础系统,根据编码器对设有语义编码标签的历史巡检图像和区域图像分别进行编码得到设有语义编码标签的历史巡检图像的语义编码和区域图像对应的语义编码,编码器是一个由若干卷积层构成的卷积神经网络,其输入为一张图片(也看作是高维空间的向量),其输出为语义向量(经过卷积层特征提取并降维后的低维向量)令编码器(Encoder)网络的计算过程为函数E,输入的图片记为x,输出的语义向量为Y,则有编码过程:Y=E(x);将训练集中设有语义编码标签的历史巡检图像的语义编码和所述区域图像对应的语义编码分别进行量化得到整体压缩编码和区域压缩编码;根据信道仿真模型模拟仿真噪声向量以将该仿真噪声向量分别叠加至所述整体压缩编码和所述区域压缩编码以得到整体仿真编码和区域仿真编码,具体操作为令量化后的语义编码向量为Yq,而经过信道仿真模型后的语义编码向量为Yq’,而随机生成的噪声向量为n(即上一个注释中所提及的随机生成的n)则有:Yq’=h*Yq+n,其中h为信道增益,n为随机生成的噪声向量;根据重点语义增强系统中的语义增强系统将区域仿真编码对整体仿真编码进行增强以得到训练集中设有语义编码标签的历史巡检图像对应的语义特征向量,具体操作为:语义增强系统将设有语义编码标签的历史巡检图像对应的整体仿真编码和区域图像对应的区域仿真编码输入卷积神经网络,采用设有语义编码标签的历史巡检图像中的区域图像部分作为数据标签,然后利用区域仿真编码相较于数据标签多出来的信息对整体仿真编码进行矫正得到设有语义编码标签的历史巡检图像对应的语义特征增强向量;最后根据所述目标神经检测网络、编码器和语义增强系统的训练过程得到对巡检图像进行语义编码的语义编码模型,从而能够进一步提高语义编码模型应用的有效性及可靠性。
同时,图像采集端在离线状态下根据所述判别器将整体仿真编码和区域仿真编码分别与设有语义编码标签的历史巡检图像进行向量拼接并输入预先训练的VGG网络以分别得到整体浮点数和区域浮点数,将整体浮点数和区域浮点数分别与自然图像标签值进行交叉熵计算得到整体对抗生成损失函数和区域对抗生成损失函数以用于提高解码器的图像生成质量,自然图像标签值1代表判别器认为图像是自然拍摄的,0代表判别器认为图像是生成的:根据所述解码器将所述整体仿真编码和所述区域仿真编码分别进行解码得到整体巡检图像和区域巡检图像,其中,解码器是一个由若干残差块与上采样卷积网络构成的卷积神经网络,其输入为语义向量,其输出为一张图片。向量输入残差块(一系列卷积层构成)将不改变向量大小,这部分卷积层的作用是为了充分学习提炼语义向量中的信息,增强网络的表达能力。向量输入上采样卷积网络将改变向量的形状,提升向量的维度,通过设置合适的上采样卷积核大小、上采样卷积步长,我们可以使得整个解码器的输入大小与语义向量的大小匹配,而输出的大小则为一张图片(HxWx3)。令解码器(Decoder)网络的计算过程为函数D,输入的语义向量记为Yq’,输出的图片为X’,则有编码过程:X’=D(Yq’);根据所述判别器和解码器的训练过程得到对所述巡检图像进行语义解码的语义解码模型,从而能够进一步提高语义解码模型应用的有效性及可靠性。
其中,巡检图像在模型训练过程中指代训练集中设有语义编码标签的历史巡检图像,在模型应用过程中指代目标巡检图像。
为了进一步在低信噪比情况下提升传输巡检图像的质量,步骤010中的重点语义增强系统包括:
目标神经检测网络,用于对所述目标巡检图像基于预设的重点特征识别规则进行检测并剪切得到所述目标巡检图像对应的区域图像;
语义增强系统,用于根据所述重点特征子图对应的语义特征编码向量对所述目标巡检图像对应的语义特征编码向量进行语义增强得到所述目标巡检图像对应的语义特征向量;
所述语义编码模型中的编码器,用于对所述目标巡检图像编码得到所述目标巡检图像对应的语义特征向量。
具体来说,参见图7,目标神经检测网络采用YOLO目标神经检测网络,用于对目标巡检图像基于预设的重点特征识别规则进行检测并剪切得到目标巡检图像对应的区域图像;语义增强系统,用于根据重点特征子图对应的语义特征编码向量对目标巡检图像对应的语义特征编码向量进行语义增强得到目标巡检图像对应的语义特征向量;语义编码模型中的编码器,用于对目标巡检图像编码得到目标巡检图像对应的语义特征向量,从而进一步在低信噪比情况下提升传输巡检图像的质量。
本申请实施例还提供一种可以由图像接收端执行的第二变电站巡检图像的语义通信传输方法,参见图2,所述的第二变电站巡检图像的语义通信传输方法具体包含有如下内容:
步骤210:经无线信道接收变电站中的图像采集端发送的目标巡检图像对应的语义特征向量,其中,所述目标巡检图像对应的语义特征向量为所述图像采集端在变电站中将自身采集的目标巡检图像输入预设的语义编码模型后由该语义编码模型输出的。
步骤220:将所述目标巡检图像的语义特征向量输入预设的语义解码模型,以得到所述目标巡检图像对应的传输巡检图像,其中,所述语义编码模型和所述语义解码模型预先采用信源信道联合编码的方式训练得到。
具体来说,图像接收端(如变电站客户端)经无线信道接收变电站中的图像采集端发送的目标巡检图像对应的语义特征向量,其中,目标巡检图像对应的语义特征向量为图像采集端在变电站中将自身采集的目标巡检图像输入预设的语义编码模型后由该语义编码模型输出的;然后将目标巡检图像的语义特征向量输入预设的语义解码模型,以得到目标巡检图像对应的传输巡检图像,从而能够在低信噪比情况下传输巡检图像。
其中,语义编码模型和语义解码模型预先采用信源信道联合编码的方式训练得到,从而能够增强巡检图像的传输质量。
为了提高模型应用有效性及可靠性,在步骤210之前,还包括:
步骤211:获取包含有设有语义编码标签的历史巡检图像的训练集。
步骤212:采用信源信道联合编码的方式,应用所述训练集对预设的机器学习网络架构进行训练,以分别得到用于对巡检图像进行语义编码的语义编码模型和用于对巡检图像对应的语义特征向量进行语义解码的语义解码模型,其中,所述机器学习网络架构包括依次连接的语义编码模型、预设的信道仿真模型、判别器及语义解码模型;所述语义编码模型包括:编码器和重点语义增强系统;所述语义解码模型包括:解码器;本地存储用于对巡检图像对应的语义特征向量进行语义解码的语义解码模型。
具体来说,图像接收端获取包含有设有语义编码标签的历史巡检图像的训练集;采用信源信道联合编码的方式,应用训练集对预设的机器学习网络架构进行训练,以分别得到用于对巡检图像进行语义编码的语义编码模型和用于对巡检图像对应的语义特征向量进行语义解码的语义解码模型,其中,所述机器学习网络架构包括依次连接的语义编码模型、预设的信道仿真模型、判别器及语义解码模型;语义编码模型包括:编码器和重点语义增强系统;语义解码模型包括:解码器;本地存储用于对巡检图像对应的语义特征向量进行语义解码的语义解码模型,从而能够有效提高语义解码模型应用的有效性及可靠性。
本申请实施例还提供了一种变电站巡检图像的语义通信传输系统,该系统包括:
基于无线网络通信连接的图像采集端和图像接收端。
所述图像采集端,用于执行前述的第一变电站巡检图像的语义通信传输方法。
所述图像接收端,用于执行前述的第二变电站巡检图像的语义通信传输方法。
本申请还提供一种用于执行前述的第一变电站巡检图像的语义通信传输方法中全部或部分内容的图像采集端的实施例,参见图3,所述图像采集端具体包含有如下内容:
图像编码模块10,用于在变电站中将自身采集的目标巡检图像输入预设的语义编码模型,以使该语义编码模型输出所述目标巡检图像对应的语义特征向量。
图像发送模块20,用于将所述目标巡检图像的语义特征向量经无线信道传输至图像接收端,以使该图像接收端将该目标巡检图像的语义特征向量输入预设的语义解码模型,以得到所述目标巡检图像对应的传输巡检图像,其中,所述语义编码模型和所述语义解码模型预先采用信源信道联合编码的方式训练得到。
本申请提供的图像采集端的实施例具体可以用于前述的第一变电站巡检图像的语义通信传输方法的实施例的处理流程,其功能在此不再赘述,可以参照上述的变电站巡检图像的语义通信传输方法实施例的详细描述。
本申请还提供一种用于执行前述的第二变电站巡检图像的语义通信传输方法中全部或部分内容的图像接收端的实施例,参见图4,所述图像接收端具体包含有如下内容:
图像编码接收模块30,用于经无线信道接收变电站中的图像采集端发送的目标巡检图像对应的语义特征向量,其中,所述目标巡检图像对应的语义特征向量为所述图像采集端在变电站中将自身采集的目标巡检图像输入预设的语义编码模型后由该语义编码模型输出的。
图像生成模块40,用于将所述目标巡检图像的语义特征向量输入预设的语义解码模型,以得到所述目标巡检图像对应的传输巡检图像,其中,所述语义编码模型和所述语义编码模型预先采用信源信道联合编码的方式训练得到。
本申请提供的图像接收端的实施例具体可以用于执行前述的第二变电站巡检图像的语义通信传输方法的实施例的处理流程,其功能在此不再赘述,可以参照上述的变电站巡检图像的语义通信传输方法实施例的详细描述。
本申请提供一种变电站巡检图像的语义通信传输方法及系统,所述方法包括:在变电站中将自身采集的目标巡检图像输入预设的语义编码模型,以使该语义编码模型输出所述目标巡检图像对应的语义特征向量;将所述目标巡检图像的语义特征向量经无线信道传输至图像接收端,以使该图像接收端将该目标巡检图像的语义特征向量输入预设的语义解码模型,以得到所述目标巡检图像对应的传输巡检图像,其中,所述语义编码模型和所述语义解码模型预先采用信源信道联合编码的方式训练得到。本申请能够在低信噪比情况下传输巡检图像并有效提升巡检图像的传输质量。
本申请实施例还提供了一种电子设备(也即电子设备),例如中心服务器,该电子设备可以包括处理器、存储器、接收器及发送器,处理器用于执行上述实施例提及的变电站巡检图像的语义通信传输方法,其中处理器和存储器可以通过总线或者其他方式连接,以通过总线连接为例。该接收器可通过有线或无线方式与处理器、存储器连接。
处理器可以为中央处理器(CentralProcessingUnit,CPU)。处理器还可以为其他通用处理器、数字信号处理器(DigitalSignalProcessor,DSP)、专用集成电路(Application SpecificIntegratedCircuit,ASIC)、现场可编程门阵列(Field-ProgrammableGateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如本申请实施例中的变电站巡检图像的语义通信传输方法对应的程序指令/模块。处理器通过运行存储在存储器中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及数据处理,即实现上述方法实施例中的基于强化联邦域泛化的图像分类模型训练方法。
存储器可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储处理器所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述一个或者多个模块存储在所述存储器中,当被所述处理器执行时,执行实施例中的变电站巡检图像的语义通信传输方法。
在本申请的一些实施例中,用户设备可以包括处理器、存储器和收发单元,该收发单元可包括接收器和发送器,处理器、存储器、接收器和发送器可通过总线系统连接,存储器用于存储计算机指令,处理器用于执行存储器中存储的计算机指令,以控制收发单元收发信号。
作为一种实现方式,本申请中接收器和发送器的功能可以考虑通过收发电路或者收发的专用芯片来实现,处理器可以考虑通过专用处理芯片、处理电路或通用芯片实现。
作为另一种实现方式,可以考虑使用通用计算机的方式来实现本申请实施例提供的服务器。即将实现处理器,接收器和发送器功能的程序代码存储在存储器中,通用处理器通过执行存储器中的代码来实现处理器,接收器和发送器的功能。
本申请实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时以实现前述的变电站巡检图像的语义通信传输方法的步骤。该计算机可读存储介质可以是有形存储介质,诸如随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、软盘、硬盘、可移动存储盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质。
本领域普通技术人员应该可以明白,结合本文中所公开的实施方式描述的各示例性的组成部分、系统和方法,能够以硬件、软件或者二者的结合来实现。具体究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本申请的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。
需要明确的是,本申请并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本申请的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本申请的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
本申请中,针对一个实施方式描述和/或例示的特征,可以在一个或更多个其它实施方式中以相同方式或以类似方式使用,和/或与其他实施方式的特征相结合或代替其他实施方式的特征。
以上所述仅为本申请的优选实施例,并不用于限制本申请,对于本领域的技术人员来说,本申请实施例可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种变电站巡检图像的语义通信传输方法,其特征在于,包括:
在变电站中将自身采集的目标巡检图像输入预设的语义编码模型,以使该语义编码模型输出所述目标巡检图像对应的语义特征向量;
将所述目标巡检图像的语义特征向量经无线信道传输至图像接收端,以使该图像接收端将该目标巡检图像的语义特征向量输入预设的语义解码模型,以得到所述目标巡检图像对应的传输巡检图像,其中,所述语义编码模型和所述语义解码模型预先采用信源信道联合编码的方式训练得到。
2.根据权利要求1所述的变电站巡检图像的语义通信传输方法,其特征在于,
所述语义编码模型包括:编码器和重点语义增强系统;
相对应的,所述在变电站中将自身采集的目标巡检图像输入预设的语义编码模型,以使该语义编码模型输出所述目标巡检图像对应的语义特征向量,包括:
在变电站中将自身采集的目标巡检图像输入所述重点语义增强系统,以使该重点语义增强系统基于预设的重点特征识别规则自所述目标巡检图像中识别并提取重点特征子图,而后将所述目标巡检图像和所述重点特征子图均输入所述编码器进行语义编码,以得到所述目标巡检图像和所述重点特征子图各自对应的语义特征编码向量,根据所述重点特征子图对应的语义特征编码向量对所述目标巡检图像对应的语义特征编码向量进行语义增强得到所述目标巡检图像对应的语义特征向量。
3.根据权利要求1所述的变电站巡检图像的语义通信传输方法,其特征在于,在所述在变电站中将自身采集的目标巡检图像输入预设的语义编码模型,以使该语义编码模型输出所述目标巡检图像对应的语义特征向量之前,还包括:
获取包含有设有语义编码标签的历史巡检图像的训练集;
采用信源信道联合编码的方式,应用所述训练集对预设的机器学习网络架构进行训练,以分别得到用于对巡检图像进行语义编码的语义编码模型和用于对巡检图像对应的语义特征向量进行语义解码的语义解码模型,其中,所述机器学习网络架构包括依次连接的语义编码模型、预设的信道仿真模型、判别器及语义解码模型;所述语义编码模型包括:编码器和重点语义增强系统;所述语义解码模型包括:解码器;本地存储用于对巡检图像进行语义编码的语义编码模型。
4.根据权利要求3所述的变电站巡检图像的语义通信传输方法,其特征在于,所述采用信源信道联合编码的方式,应用所述训练集对预设的机器学习网络架构进行训练,以分别得到用于对巡检图像进行语义编码的语义编码模型和用于对巡检图像对应的语义特征向量进行语义解码的语义解码模型,包括:
在离线状态下采用所述重点语义增强系统中的目标神经检测网络对所述训练集中设有语义编码标签的历史巡检图像基于预设的重点特征识别规则进行检测并剪切得到所述训练集中设有语义编码标签的历史巡检图像对应的区域图像;根据所述编码器对所述训练集中设有语义编码标签的历史巡检图像和所述区域图像分别进行编码得到所述训练集中设有语义编码标签的历史巡检图像的语义编码和所述区域图像对应的语义编码,将所述训练集中设有语义编码标签的历史巡检图像的语义编码和所述区域图像对应的语义编码分别进行量化得到整体压缩编码和区域压缩编码;根据信道仿真模型模拟仿真噪声向量以将该仿真噪声向量分别叠加至所述整体压缩编码和所述区域压缩编码以得到整体仿真编码和区域仿真编码;根据所述重点语义增强系统中的语义增强系统将所述区域仿真编码对所述整体仿真编码进行增强以得到所述训练集中设有语义编码标签的历史巡检图像对应的语义特征增强向量;根据所述目标神经检测网络、编码器和语义增强系统的训练过程得到对所述巡检图像进行语义编码的语义编码模型;
在离线状态下根据所述判别器将所述整体仿真编码和所述区域仿真编码分别与设有语义编码标签的历史巡检图像进行向量拼接并输入预先训练的VGG网络以分别得到整体浮点数和区域浮点数,将所述整体浮点数和所述区域浮点数分别与自然图像标签值进行交叉熵计算得到整体对抗生成损失函数和区域对抗生成损失函数以用于提高解码器的图像生成质量;根据所述解码器将所述整体仿真编码和所述区域仿真编码分别进行解码得到整体巡检图像和区域巡检图像;根据所述判别器和解码器的训练过程得到对所述巡检图像进行语义解码的语义解码模型。
5.根据权利要求2所述的变电站巡检图像的语义通信传输方法,其特征在于,所述语义编码模型中的重点语义增强系统包括:
目标神经检测网络,用于对所述目标巡检图像基于预设的重点特征识别规则进行检测并剪切得到所述目标巡检图像对应的区域图像;
语义增强系统,用于根据所述重点特征子图对应的语义特征编码向量对所述目标巡检图像对应的语义特征编码向量进行语义增强得到所述目标巡检图像对应的语义特征向量;
所述语义编码模型中的编码器,用于对所述目标巡检图像编码得到所述目标巡检图像对应的语义特征向量。
6.一种变电站巡检图像的语义通信传输方法,其特征在于,包括:
经无线信道接收变电站中的图像采集端发送的目标巡检图像对应的语义特征向量,其中,所述目标巡检图像对应的语义特征向量为所述图像采集端在变电站中将自身采集的目标巡检图像输入预设的语义编码模型后由该语义编码模型输出的;
将所述目标巡检图像的语义特征向量输入预设的语义解码模型,以得到所述目标巡检图像对应的传输巡检图像,其中,所述语义编码模型和所述语义解码模型预先采用信源信道联合编码的方式训练得到。
7.根据权利要求6所述的变电站巡检图像的语义通信传输方法,其特征在于,在所述经无线信道接收变电站中的图像采集端发送的目标巡检图像对应的语义特征向量之前,还包括:
获取包含有设有语义编码标签的历史巡检图像的训练集;
采用信源信道联合编码的方式,应用所述训练集对预设的机器学习网络架构进行训练,以分别得到用于对巡检图像进行语义编码的语义编码模型和用于对巡检图像对应的语义特征向量进行语义解码的语义解码模型,其中,所述机器学习网络架构包括依次连接的语义编码模型、预设的信道仿真模型、判别器及语义解码模型;所述语义编码模型包括:编码器和重点语义增强系统;所述语义解码模型包括:解码器;本地存储用于对巡检图像对应的语义特征向量进行语义解码的语义解码模型。
8.一种变电站巡检图像的语义通信传输系统,其特征在于,包括:基于无线网络通信连接的图像采集端和图像接收端;
所述图像采集端,用于执行权利要求1至5任一项所述的变电站巡检图像的语义通信传输方法;
所述图像接收端,用于执行权利要求6或7所述的变电站巡检图像的语义通信传输方法。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-5任一项所述的变电站巡检图像的语义通信传输方法,或者,实现权利要求6-7任一项所述的变电站巡检图像的语义通信传输方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-5任一项所述的变电站巡检图像的语义通信传输方法,或者,实现权利要求6-7任一项所述的变电站巡检图像的语义通信传输方法。
CN202310106702.7A 2023-02-13 2023-02-13 变电站巡检图像的语义通信传输方法及系统 Pending CN116320538A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310106702.7A CN116320538A (zh) 2023-02-13 2023-02-13 变电站巡检图像的语义通信传输方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310106702.7A CN116320538A (zh) 2023-02-13 2023-02-13 变电站巡检图像的语义通信传输方法及系统

Publications (1)

Publication Number Publication Date
CN116320538A true CN116320538A (zh) 2023-06-23

Family

ID=86814085

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310106702.7A Pending CN116320538A (zh) 2023-02-13 2023-02-13 变电站巡检图像的语义通信传输方法及系统

Country Status (1)

Country Link
CN (1) CN116320538A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116978011A (zh) * 2023-08-23 2023-10-31 广州新华学院 一种用于智能目标识别的图像语义通信方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116978011A (zh) * 2023-08-23 2023-10-31 广州新华学院 一种用于智能目标识别的图像语义通信方法及系统
CN116978011B (zh) * 2023-08-23 2024-03-15 广州新华学院 一种用于智能目标识别的图像语义通信方法及系统

Similar Documents

Publication Publication Date Title
Qin et al. Semantic communications: Principles and challenges
CN110290387B (zh) 一种基于生成模型的图像压缩方法
CN114448563B (zh) 语义编码传输方法及电子设备
CN116320538A (zh) 变电站巡检图像的语义通信传输方法及系统
CN116978011B (zh) 一种用于智能目标识别的图像语义通信方法及系统
CN110991298B (zh) 图像的处理方法和装置、存储介质及电子装置
CN113723344A (zh) 视频的识别方法、装置、可读介质和电子设备
CN114581920A (zh) 一种双分支多层次特征解码的分子图像识别方法
CN116503876A (zh) 图像识别模型的训练方法及装置、图像识别方法及装置
CN113961710A (zh) 基于多模态分层融合网络的细粒度化论文分类方法及装置
CN117292146A (zh) 一种面向工业场景的构建多模态大语言模型的方法、系统和应用方法
CN104767998B (zh) 一种面向视频的视觉特征编码方法及装置
CN114092931B (zh) 场景文字识别方法、装置、电子设备及存储介质
CN115496134A (zh) 基于多模态特征融合的交通场景视频描述生成方法和装置
Dong et al. Innovative semantic communication system
CN114495081A (zh) 文本识别的方法、装置、可读介质和电子设备
Williams et al. Analysis of lossy generative data compression for robust remote deep inference
CN115242293B (zh) 一种图片特征的传输方法、装置、电子设备及存储介质
CN115471875B (zh) 一种多码率的行人识别视觉特征编码压缩方法和装置
Popel Compact graph model of handwritten images: Integration into authentification and recognition
CN117409431B (zh) 一种多模态大型语言模型训练方法、电子设备及存储介质
CN116304560B (zh) 一种轨迹表征模型训练方法、表征方法及装置
Safaeipour et al. Semantic-Aware and Goal-Oriented Communications for Object Detection in Wireless End-to-End Image Transmission
CN110868615B (zh) 一种视频处理方法、装置、电子设备以及存储介质
Wan et al. A Semantic Communication Method for Intelligent Internet of Things Based on Images

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination