CN116029340B - 一种基于深度学习网络的图像及语义信息传输方法 - Google Patents
一种基于深度学习网络的图像及语义信息传输方法 Download PDFInfo
- Publication number
- CN116029340B CN116029340B CN202310039257.7A CN202310039257A CN116029340B CN 116029340 B CN116029340 B CN 116029340B CN 202310039257 A CN202310039257 A CN 202310039257A CN 116029340 B CN116029340 B CN 116029340B
- Authority
- CN
- China
- Prior art keywords
- image
- neural network
- feature vector
- semantic information
- parameters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 230000005540 biological transmission Effects 0.000 title claims abstract description 22
- 238000013135 deep learning Methods 0.000 title claims abstract description 14
- 239000013598 vector Substances 0.000 claims abstract description 65
- 238000013528 artificial neural network Methods 0.000 claims abstract description 62
- 230000006870 function Effects 0.000 claims abstract description 38
- 238000012545 processing Methods 0.000 claims abstract description 29
- 238000012549 training Methods 0.000 claims abstract description 28
- 238000009826 distribution Methods 0.000 claims abstract description 11
- 239000000284 extract Substances 0.000 claims abstract description 4
- 238000013527 convolutional neural network Methods 0.000 claims description 10
- 238000004422 calculation algorithm Methods 0.000 claims description 7
- 230000001537 neural effect Effects 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000009827 uniform distribution Methods 0.000 claims description 2
- 238000013139 quantization Methods 0.000 claims 1
- 238000011084 recovery Methods 0.000 abstract description 10
- 230000000694 effects Effects 0.000 abstract description 5
- 238000004891 communication Methods 0.000 description 7
- 230000004913 activation Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000013461 design Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000004088 simulation Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种基于深度学习网络的图像及语义信息传输方法,包括以下步骤:S1.给定发射端的数据处理模型:发射端基于神经网络,对图像进行特征向量提取后对特征向量进行量化,然后结合概率密度函数进行编码得到符号序列传输给接收端;S2.给定接收端的数据处理模型:接收端接收符号序列,进行解码并获取特征向量,根据特征向量恢复出图像信息,然后恢复出图像的语义信息;S3.进行神经网络参数训练;S4.对图像及语义信息进行传输。本发明在点对点信道条件下,基于神经网络对图像信息和图像的语义信息进行联合恢复,能够自适应的学习图像特征的分布,具有良好的图像恢复效果,并引入和训练了语义神经网络,具有较好的语义恢复效果。
Description
技术领域
本发明涉及信息传输,特别是涉及一种基于深度学习网络的图像及语义信息传输方法。
背景技术
随着5G通信时代的到来,多媒体应用的爆发式增长使得通信频谱资源的利用面临巨大挑战,因此需要从传统的比特级通讯升级到语义级通讯。
传统的比特级通信方式,只是对数据进行简单的压缩和发送,无法高效的完成众多的语义任务,如人脸识别,物体识别等。语义通信技术是利用先进的深度学习技术,对原始数据的语义信息进行提取,压缩与编码,具有更高的频谱利用效率。然而,目前的语义通信技术,缺少对于图像及其语义信息联合传输的分析,使得图像的传输和语义任务的性能远远没有达到最优。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于深度学习网络的图像及语义信息传输方法,能够实现图像信息和图像的语义信息进行联合恢复。
本发明的目的是通过以下技术方案来实现的:一种基于深度学习网络的图像及语义信息传输方法,包括以下步骤:
S1.给定发射端的数据处理模型:
发射端基于神经网络,对图像进行特征向量提取后对特征向量进行量化,然后结合概率密度函数进行编码得到符号序列传输给接收端;
S2.给定接收端的数据处理模型:
接收端接收符号序列,进行解码并基于神经网络得到特征向量,根据特征向量恢复出图像信息,然后恢复出图像的语义信息;
S3.神经网络参数训练:
构建训练样本,对图像及语义信息传输过程中,发射端和接收端的数据处理模型中包含的神经网络参数进行训练,训练结束后将得到的神经网络参数更新到发射端和接收端的数据处理模型中;
S4.图像及语义信息传输:
利用更新后发射端的数据处理模型,对待传输的图像及语义信息进行处理,然后传输给接收端;
然后利用更新接收端的数据处理模型,对接收到的信息进行处理,实现图像及语义信息的恢复,从而完成图像及语义传输。
本发明的有益效果是:本发明在点对点信道条件下,基于神经网络对图像信息和图像的语义信息进行联合恢复,并设计的一种分布学习模块,能够自适应的学习图像特征的分布,因此该方法能够比传统的图像恢复算法具有更好的图像恢复效果。同时通过引入和训练语义神经网络,使得该方法具有更好的语义恢复效果。
附图说明
图1为本发明的具体流程图;
图3为分布学习模块的框架图;
图7为图像峰值信噪比随压缩信道带宽率变化的仿真图;
图8为语义恢复准确率随压缩信道带宽率变化的仿真图。
具体实施方式
下面结合附图进一步详细描述本发明的技术方案,但本发明的保护范围不局限于以下所述。
如图1所示,一种基于深度学习网络的图像及语义信息传输方法,包括以下步骤:
S1.给定发射端的数据处理模型:发射端基于神经网络,对图像进行特征向量提取后对特征向量进行量化,然后结合概率密度函数进行编码得到符号序列传输给接收端;
S101. 图像数据先通过函数/>提取特征,输出为特征向量/>,/>代表所有维度为K的实数向量。其中,函数/>是由神经网络构成的函数,神经网络参数为/>,其具体结构如图2所示。详细说明如下:首先,图像/>先通过一个归一化函数,使得图像的每个元素取值范围在/>之间;然后,再通过一个卷积神经网络,其卷积核为/>,通道数为162,下采样数为2,激活函数为generalized divisive normalization (GDN) 函数;接着,再通过一个卷积神经网络,其卷积核为/>,通道数为162,下采样数为2,激活函数为GDN; 最后通过一个卷积神经网络,其卷积核为/>,通道数为162,下采样数为1,激活函数为GDN.
S103. 接下来详细介绍S102中第二步中分布学习模块的设计:如图3所示,首先,输入特征向量通过一个参数为/>的神经网络/>,输出为特征向量/>。其中神经网络/>的设计如图4所示,由三个卷积神经网络级联得到,卷积核分别为/>,/>和/>, 通道数统一为162,下采样数分别为1,2和2。接着,特征向量/>通过量化得到/>;然后,/>输入参数为的神经网络/>,输出为向量/>, 其中D是维度。其中,神经网络/>的详细设计如图5所示,由三个卷积神经网络级联得到,卷积核分别为/>,/>和/>, 通道数统一为162,上采样数分别为2,2和1,激活函数为 inverse generalized divisivenormalization (IGDN) 函数;最后概率分布函数/>可以计算为:
其中,,/>是参数化神经网络(non-parametricfully-factorized density model)参数为/>,我们设/>。利用概率计算值/>,采用算数编码技术将特征向量/>编码为比特序列,得到比特流/>。
S2.给定接收端的的数据处理模型:接收端接收符号序列,进行解码并基于神经网络得到特征向量,根据特征向量恢复出图像信息,然后恢复出图像的语义信息;
S203. 在这一步骤中,我们通过S202中得到的特征向量,恢复出图像信息/>。首先,将特征向量/>通过神经网络/>得到/>,神经网络参数为/>。如图6所示,/>是由四个级联的卷积神经网络加一个去归一化函数组成的。前三个级联的卷积神经网络的卷积核分别为,/>和/>, 通道数前两个为162,最后一个是3, 上采样数分别为1,2和2,激活函数统一为 inverse generalized divisive normalization (IGDN) 函数。最后一个卷积神经网络的卷积核为,通道数为3,激活函数为Relu函数。去归一化函数是将四个卷积神经网络的输出的每一个元素乘以255。
步骤S1,S2介绍了发射机和接收机的具体步骤,然而神经网络的参数需要经过训练之后才能使用。为此,我们在S3中详细介绍了如何训练神经网络。
S3.神经网络参数训练:
构建训练样本,对图像及语义信息传输过程中,发射端和接收端的数据处理模型中包含的神经网络参数进行训练,训练结束后将得到的神经网络参数更新到发射端和接收端的数据处理模型中;
S4.图像及语义信息传输:
利用更新后发射端的数据处理模型,对待传输的图像及语义信息进行处理,然后传输给接收端;
然后利用更新接收端的数据处理模型,对接收到的信息进行处理,实现图像及语义信息的恢复,从而完成图像及语义传输。
在图7的实验中,我们将所提出的方法与现有的BPG,NTSCC,DJSCC,做了对比。其中横坐标是压缩比率,它是由信道编码后发送的符号数除以图像维度得到的。纵坐标是峰值信噪比,常用于衡量图像的恢复质量。从图中我们可以看到,我们所提出的算法在容量可达的编码下优于现有的所有方法,在LDPC信道编码下依旧拥有很好的性能。
在图8中,我们给出了该方法在语义恢复上的性能。这里我们选择的图像语义为图像的类别信息,如花,鸟,鱼等,所以我们用分类准确率来衡量语义恢复效果。如图8所示,我们提出的方法,使得恢复出的图像能够很好的保留语义信息。相比于现有图像算法和分类算法,我们的设计方法,能够拥有更高的分类准确率。
上述说明示出并描述了本发明的一个优选实施例,但如前所述,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。
Claims (6)
1.一种基于深度学习网络的图像及语义信息传输方法,其特征在于:包括以下步骤:
S1.给定发射端的数据处理模型:
发射端基于神经网络,对图像进行特征向量提取后对特征向量进行量化,然后结合概率密度函数进行编码得到符号序列传输给接收端;
S2.给定接收端的数据处理模型:
接收端接收符号序列,进行解码并基于神经网络得到特征向量,根据特征向量恢复出图像信息,然后恢复出图像的语义信息;
S3.神经网络参数训练:
构建训练样本,对图像及语义信息传输过程中,发射端和接收端的数据处理模型中包含的神经网络参数进行训练,训练结束后将得到的神经网络参数更新到发射端和接收端的数据处理模型中;
S4.图像及语义信息传输:
利用更新后发射端的数据处理模型,对待传输的图像及语义信息进行处理,然后传输给接收端;
然后利用更新接收端的数据处理模型,对接收到的信息进行处理,实现图像及语义信息的恢复,从而完成图像及语义传输。
4.根据权利要求1所述的一种基于深度学习网络的图像及语义信息传输方法,其特征在于:所述步骤S2包括:
6.根据权利要求1所述的一种基于深度学习网络的图像及语义信息传输方法,其特征在于:所述步骤S3包括:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310039257.7A CN116029340B (zh) | 2023-01-13 | 2023-01-13 | 一种基于深度学习网络的图像及语义信息传输方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310039257.7A CN116029340B (zh) | 2023-01-13 | 2023-01-13 | 一种基于深度学习网络的图像及语义信息传输方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116029340A CN116029340A (zh) | 2023-04-28 |
CN116029340B true CN116029340B (zh) | 2023-06-02 |
Family
ID=86070405
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310039257.7A Active CN116029340B (zh) | 2023-01-13 | 2023-01-13 | 一种基于深度学习网络的图像及语义信息传输方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116029340B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022204392A1 (en) * | 2021-03-26 | 2022-09-29 | Dolby Laboratories Licensing Corporation | Multi-distribution entropy modeling of latent features in image and video coding using neural networks |
WO2022265627A1 (en) * | 2021-06-16 | 2022-12-22 | Google Llc | End-to-end learning-based, eg neural network, pre-processing and post-processing optimization for image and video coding |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106559636A (zh) * | 2015-09-25 | 2017-04-05 | 中兴通讯股份有限公司 | 一种视频通信方法、装置及系统 |
US11526808B2 (en) * | 2019-05-29 | 2022-12-13 | The Board Of Trustees Of The Leland Stanford Junior University | Machine learning based generation of ontology for structural and functional mapping |
CN113473149A (zh) * | 2021-05-14 | 2021-10-01 | 北京邮电大学 | 用于无线图像传输的语义信道联合编码方法及装置 |
CN113255830A (zh) * | 2021-06-21 | 2021-08-13 | 上海交通大学 | 基于变分自编码器与高斯混合模型的无监督目标检测方法及系统 |
CN115412202B (zh) * | 2022-08-01 | 2023-06-16 | 鹏城实验室 | 一种基于医学图像的语义通信方法及相关设备 |
CN115695810A (zh) * | 2022-10-21 | 2023-02-03 | 哈尔滨工业大学 | 一种基于语义通信的低比特率图像压缩编码方法 |
-
2023
- 2023-01-13 CN CN202310039257.7A patent/CN116029340B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022204392A1 (en) * | 2021-03-26 | 2022-09-29 | Dolby Laboratories Licensing Corporation | Multi-distribution entropy modeling of latent features in image and video coding using neural networks |
WO2022265627A1 (en) * | 2021-06-16 | 2022-12-22 | Google Llc | End-to-end learning-based, eg neural network, pre-processing and post-processing optimization for image and video coding |
Also Published As
Publication number | Publication date |
---|---|
CN116029340A (zh) | 2023-04-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111787323B (zh) | 一种基于对抗学习的可变比特率生成式压缩方法 | |
CN107832837B (zh) | 一种基于压缩感知原理的卷积神经网络压缩方法及解压缩方法 | |
CN111818346B (zh) | 图像编码方法和装置、图像解码方法和装置 | |
CN109889839B (zh) | 基于深度学习的感兴趣区域图像编码、解码系统及方法 | |
CN111641832B (zh) | 编码方法、解码方法、装置、电子设备及存储介质 | |
CN111641826B (zh) | 对数据进行编码、解码的方法、装置与系统 | |
CN114581544A (zh) | 图像压缩方法、计算机设备及计算机存储介质 | |
CN111835364B (zh) | 一种极化码的低复杂度神经bp译码方法 | |
Li et al. | Multiple description coding based on convolutional auto-encoder | |
CN114422784A (zh) | 一种基于卷积神经网络的无人机多光谱遥感影像压缩方法 | |
CN116029340B (zh) | 一种基于深度学习网络的图像及语义信息传输方法 | |
Yilmaz et al. | High perceptual quality wireless image delivery with denoising diffusion models | |
CN111479286B (zh) | 一种边缘计算系统减少通信流量的数据处理方法 | |
Shehab et al. | Recurrent neural network based prediction to enhance satellite telemetry compression | |
US20230154053A1 (en) | System and method for scene graph lossless compression by context-based graph convolution | |
Dong et al. | Innovative semantic communication system | |
US9369315B2 (en) | Digital communication system using real-time capacity achieving encoder design for channels with memory and feedback | |
CN116911360B (zh) | 一种利用神经网络求解语义信息最小压缩速率的方法 | |
CN115314156B (zh) | 基于自编码网络的ldpc编译码方法及系统 | |
Wang et al. | SNN-SC: A Spiking Semantic Communication Framework for Feature Transmission | |
Yang et al. | Unequal error protection based on expanding window fountain for object-based 3D audio | |
CN115761020B (zh) | 一种基于神经网络自动构建的影像数据压缩方法 | |
CN115114928B (zh) | 一种基于特征选择的可解释性语义通信系统 | |
Ullrich et al. | Neural communication systems with bandwidth-limited channel | |
CN117220826B (zh) | 一种基于语义通信的农业物联网感知数据预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |