CN111028303A - 一种图像编码方法、装置、计算机设备和存储介质 - Google Patents

一种图像编码方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN111028303A
CN111028303A CN201911365482.XA CN201911365482A CN111028303A CN 111028303 A CN111028303 A CN 111028303A CN 201911365482 A CN201911365482 A CN 201911365482A CN 111028303 A CN111028303 A CN 111028303A
Authority
CN
China
Prior art keywords
training
vector
vectors
mode
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201911365482.XA
Other languages
English (en)
Inventor
任云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AI Speech Ltd
Original Assignee
AI Speech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AI Speech Ltd filed Critical AI Speech Ltd
Priority to CN201911365482.XA priority Critical patent/CN111028303A/zh
Publication of CN111028303A publication Critical patent/CN111028303A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/008Vector quantisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了一种图像编码方法、装置、计算机设备和存储介质。该方法包括:对训练图像进行分块处理,得到L个训练矢量,在L个训练矢量中选择N个训练矢量作为模式矢量,将N个模式矢量以三维立体结构排列,其中,N小于L;根据所述L个训练矢量,以及预设的邻域函数NE(t),对N个模式矢量的权重值进行学习训练,得到最佳模式库;获取待编码的目标图像,并对所述目标图像进行分块处理,得到至少一个测试矢量;根据所述最佳模式库,对所述至少一个测试矢量进行编码,得到与所述目标图像对应的编码结果。使用本发明的技术方案,可以提高模式库训练的速度和效率,提高SOM算法的性能。

Description

一种图像编码方法、装置、计算机设备和存储介质
技术领域
本发明实施例涉及图像处理技术,尤其涉及一种图像编码方法、装置、计算机设备和存储介质。
背景技术
图像编码也称图像压缩,是指在满足一定质量的条件下,以较少比特数表示图像或图像中所包含信息的技术。图像编码在图像处理、特征提取等领域都有广泛的应用。
SOM(Self-organizing map,自组织映射)算法是应用于图像编码的一种常见算法,在SOM算法中,用随机值或从输入中随机采样对连接权重进行初始化,网格中的每个节点都被赋予一个位置。数据输入后,测量输入向量和所有节点权向量之间的距离,与输入向量距离最小的节点为获胜节点。在训练的过程中,不断对获胜结点的连接权值作调整,同时对获胜结点的邻域结点的连接权值作调整;随着训练的进行,这个邻域范围不断缩小,直到最后,只对获胜结点进行细微的连接权值调整。其中,邻域函数的作用就是确定邻域节点的范围,现有技术中邻域函数多采用指数函数。但是,在输入的样本图像较为复杂的情况下,邻域函数采用指数函数收敛较慢,容易导致过调整,使模式库训练速度慢,训练效率低,影响SOM算法的性能。
发明内容
本发明实施例提供一种图像编码方法、装置、计算机设备和存储介质,以实现提高模式库训练的速度和效率,提高SOM算法性能。
第一方面,本发明实施例提供了一种图像编码方法,该方法包括:
对训练图像进行分块处理,得到L个训练矢量,在L个训练矢量中选择N个训练矢量作为模式矢量,将N个模式矢量以三维立体结构排列,其中,N小于L;
根据所述L个训练矢量,以及预设的邻域函数NE(t),对N个模式矢量进行学习训练,得到最佳模式库;
其中NE(t)=NE(t-1)*(C1-C2*t);C1和C2为常数,t为训练次数;
获取待编码的目标图像,并对所述目标图像进行分块处理,得到至少一个测试矢量;
根据所述最佳模式库,对所述至少一个测试矢量进行编码,得到与所述目标图像对应的编码结果。
第二方面,本发明实施例还提供了一种图像编码装置,该装置包括:
训练图像分块模块,用于对训练图像进行分块处理,得到L个训练矢量,在L个训练矢量中选择N个训练矢量作为模式矢量,将N个模式矢量以三维立体结构排列,其中,N小于L;
模式矢量训练模块,用于根据所述L个训练矢量,以及预设的邻域函数NE(t),对N个模式矢量进行学习训练,得到最佳模式库;
其中NE(t)=NE(t-1)*(C1-C2*t);C1和C2为常数,t为训练次数;
目标图像分块模块,用于获取待编码的目标图像,并对所述目标图像进行分块处理,得到至少一个测试矢量;
测试矢量编码模块,用于根据所述最佳模式库,对所述至少一个测试矢量进行编码,得到与所述目标图像对应的编码结果。
第三方面,本发明实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本发明实施例中任一所述的图像编码方法。
第四方面,本发明实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如本发明实施例中任一所述的图像编码方法。
本发明实施例通过在训练图像分块后的L个训练矢量中选择N个模式矢量,并根据L个训练矢量和邻域函数NE(t)=NE(t-1)*(C1-C2*t),对N个模式矢量的权重值进行调整,最终得到最佳模式库,将待编码的图像进行分块处理,根据最佳模式库对测试矢量进行编码,最终得到待编码图像的编码结果。解决了现有技术中邻域函数选用指数函数时收敛较慢,影响模式库训练的速度和效率的问题,实现了提高模式库训练的速度和效率,以及提高SOM算法性能的效果。
附图说明
图1是本发明实施例一中的一种图像编码方法的流程图;
图2是本发明实施例二中的一种图像编码方法的流程图;
图3是本发明实施例三中的一种图像编码方法的流程图;
图4a是适用于本发明实施例中的一种最佳模式库的训练方法的流程图;
图4b是适用于本发明实施例中的一种根据最佳模式库进行图像压缩的方法的流程图;
图5是本发明实施例四中的一种图像编码装置的结构示意图;
图6是本发明实施例五中的一种计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1是本发明实施例一提供的一种图像编码方法的流程图,本实施例可适用于对复杂的样本图像进行训练,并根据训练出的模式库进行图像编码的情况,该方法可以由图像编码装置来执行,该装置可以由软件和/或硬件实现,并一般可以集成在服务器中。
如图1所示,本发明实施例的技术方案,具体包括如下步骤:
S110、对训练图像进行分块处理,得到L个训练矢量,在L个训练矢量中选择N个训练矢量作为模式矢量,将N个模式矢量以三维立体结构排列,其中,N小于L。
其中,训练图像可以为用于训练最佳模式库的样本图像,在一个具体的示例中,训练图像可以选用Lena图像、Boat图像以及Peppers图像等,但本实施例对训练图像的具体类型不进行限制。分块处理可以为将图像切分为图像块,以对图像块进行后续处理,本实施例对分块处理的具体策略不进行限制。训练矢量可以为对训练图像进行分块处理后得到的图像块,模式矢量可以为从训练矢量中选取用于训练得到模式库的图像块。
在本发明实施例中,将训练图像分块后得到的图像块作为训练矢量,选择若干训练矢量作为模式矢量。将获得的模式矢量以三维立体结构排列。其中,模式矢量的数量远远小于训练矢量的数量。
在本发明一个可选的实施例中,在L个训练矢量中选择N个训练矢量作为模式矢量,可以包括:在L个训练矢量中,随机选择,或者按序间隔选择N个训练矢量作为模式矢量。
在本发明实施例中,对选择模式矢量的方式不进行限制,可以在训练矢量中随机选择若干训练矢量作为模式矢量,也可以按照一定的顺序规则间隔选择若干训练矢量作为模式矢量。
S120、根据所述L个训练矢量,以及预设的邻域函数NE(t),对N个模式矢量进行学习训练,得到最佳模式库。
其中NE(t)=NE(t-1)*(C1-C2*t);C1和C2为常数,t为训练次数;
其中,邻域函数的作用可以是确定邻域矢量的范围,也即邻域半径。在训练的初始阶段,邻域半径较大,随着训练过程中训练次数的增加,邻域半径开始缩小,最终在训练后期,只需对获胜模式矢量进行细微的调整。邻域函数的选择对于最佳模式库的训练效果有较大的影响,为了适应图像编码的需求,需要适当提高训练的速度和效率,因此需要适当加快邻域函数的收敛速度。但是邻域函数收敛过快,会导致邻域函数失效,只能调整获胜模式矢量,降低了模式矢量的典型性。但是如果邻域函数收敛较慢,又会导致过调整,影响模式库训练的速度和效率。
其中,将邻域函数设置为NE(t)=NE(t-1)*(C1-C2*t),这样设置的好处在于,采用一次函数作为邻域函数可以在保持高学习率的同时,使收敛速度更快,同时引入记忆性,某次训练时的邻域结果依赖于上次训练的邻域结果,可以使邻域结果的变化更加具备稳定性,从而可以提高最佳模式库训练的速度和效率。
其中,最佳模式库可以由训练后的模式矢量组成,用于对输入的图像进行编码。在一个具体的示例中,在训练矢量中获取模式矢量后,可以将模式矢量以三维立体结构排列,因此,训练好的最佳模式库中各个模式矢量也是按照一定的顺序以三维立体结构排列的。
在本发明实施例中,根据训练矢量以及邻域函数,对模式矢量进行训练得到最佳模式库。
S130、获取待编码的目标图像,并对所述目标图像进行分块处理,得到至少一个测试矢量。
其中,目标图像可以为需要进行图像编码的图像。在本发明实施例中,对目标图像进行分块处理得到若干测试矢量,以对得到的测试矢量进行处理。
在本发明一个可选的实施例中,对所述目标图像进行分块处理,得到至少一个测试矢量,可以包括:采用对所述训练图像进行分块处理所采用的分块策略,对所述目标图像进行分块处理,得到至少一个测试矢量;其中,所述测试矢量的与所述训练矢量的图像尺寸相匹配。
在本发明实施例中,对训练图像行业目标图像进行分块处理的分块处理策略可以相同,以保证训练矢量与目标图像的测试矢量尺寸相匹配。
S140、根据所述最佳模式库,对所述至少一个测试矢量进行编码,得到与所述目标图像对应的编码结果。
其中,对测试矢量进行编码可以为以编码来替代输入的测试矢量,编码结果可以为对目标图像进行编码后得到的结果。对各个测试矢量都进行编码处理之后,即可得到编码结果。
在本发明实施例中,对目标图像进行分块得到测试矢量之后,根据最佳模式库对各个测试矢量进行编码,最终得到目标图像的编码结果。
本实施例的技术方案,通过在训练图像分块后的L个训练矢量中选择N个模式矢量,并根据L个训练矢量和邻域函数NE(t)=NE(t-1)*(C1-C2*t),对N个模式矢量的权重值进行调整,最终得到最佳模式库,将待编码的图像进行分块处理,根据最佳模式库对测试矢量进行编码,最终得到待编码图像的编码结果。解决了现有技术中邻域函数选用指数函数时收敛较慢,影响模式库训练的速度和效率的问题,实现了提高模式库训练的速度和效率,以及提高SOM算法性能的效果。
实施例二
图2是本发明实施例二提供的一种图像编码方法的流程图,本发明实施例在上述实施例的基础上,对对模式矢量进行训练得到最佳模式库的过程进行了进一步的具体化。
相应的,如图2所示,本发明实施例的技术方案,具体包括如下步骤:
S210、对训练图像进行分块处理,得到L个训练矢量,在L个训练矢量中选择N个训练矢量作为模式矢量,将N个模式矢量以三维立体结构排列,其中,N小于L。
S220、依次获取一个训练矢量作为当前处理矢量。
其中,当前处理矢量可以为本轮次进行处理的训练矢量。在本发明实施例中,对于训练图像分块得到的所有训练矢量,都进行S220-S240中获取当前处理矢量、获取获胜模式矢量以及调整权重值的操作。
S230、在所述N个模式矢量中获取与所述当前处理矢量的欧式距离最短的模式矢量,作为所述当前处理矢量的获胜模式矢量。
其中,欧氏距离(Euclidean Distance)也称欧几里得距离或欧几里得度量,是一个通常采用的距离定义,它是在m维空间中两个点之间的真实距离。在二维和三维空间中的欧氏距离的就是两点之间的距离。获胜模式矢量可以为在模式矢量的竞争中获胜的模式矢量,只对获胜模式矢量及其邻域范围内的模式矢量的权值进行调整,使得网络的权值逐渐趋向于输入的训练矢量,获胜模式矢量对将来再次出现的相似训练矢量容易再次赢得胜利,最终实现了对输入的训练矢量的分类。
在本发明实施例中,对于当前处理矢量,在模式矢量中获取与其欧氏距离最短的模式矢量,作为当前处理轮次中,与当前处理矢量对应的获胜模式矢量。
S240、根据下述公式,对所述获胜模式矢量,以及所述获胜模式矢量邻域范围内的其他模式矢量进行权重值的调整;
Figure BDA0002338283100000081
其中,Wj(t)为第t次训练时的模式矢量j的权值,j*为获胜模式矢量,α(t)为第t次训练的学习率,
Figure BDA0002338283100000082
为获胜模式矢量j*在第t次训练时的邻域函数值,j的取值范围为{0,1,2……N-1};
其中NE(t)=NE(t-1)*(C1-C2*t);C1和C2为常数,t为训练次数;
其中,所述α(t)通过下式进行计算:
Figure BDA0002338283100000091
其中,B0为最大学习率,C0为衰减常数,t为训练次数。
其中,α(t)为学习函数,用于计算学习率,反映了模式矢量调整的幅度大小。
S250、判断是否完成对全部L个训练矢量的处理,如果是,则执行S260,否则执行S220。
S260、获取待编码的目标图像,并对所述目标图像进行分块处理,得到至少一个测试矢量。
S270、根据所述最佳模式库,对所述至少一个测试矢量进行编码,得到与所述目标图像对应的编码结果。
本发明实施例的技术方案,通过在训练图像分块后的L个训练矢量中选择N个模式矢量,并对每个训练矢量,都在N个模式矢量中选择与其欧式距离最短的模式矢量作为获胜模式矢量,根据邻域函数NE(t)=NE(t-1)*(C1-C2*t)计算邻域范围,对获胜模式矢量以及其邻域范围内的模式矢量的权重值进行调整,最终得到最佳模式库,将待编码的图像进行分块处理,根据最佳模式库对测试矢量进行编码,最终得到待编码图像的编码结果。解决了现有技术中,采用指数函数作为邻域函数收敛较慢,从而导致的模式库训练效率和训练速度低的问题。选用收敛更快的一次函数作为邻域函数,实现了保证模式矢量典型性的同时,加快模式库的训练速度和效率,提高SOM算法的性能。
实施例三
图3是本发明实施例三提供的一种图像编码方法的流程图,本发明实施例在上述实施例的基础上,对根据最佳模式库对目标图像进行编码的过程进行了进一步的具体化。
相应的,如图3所示,本发明实施例的技术方案,具体包括如下步骤:
S310、对训练图像进行分块处理,得到L个训练矢量,在L个训练矢量中选择N个训练矢量作为模式矢量,将N个模式矢量以三维立体结构排列,其中,N小于L。
S320、依次获取一个训练矢量作为当前处理矢量。
S330、在所述N个模式矢量中获取与所述当前处理矢量的欧式距离最短的模式矢量,作为所述当前处理矢量的获胜模式矢量。
S340、根据下述公式,对所述获胜模式矢量,以及所述获胜模式矢量邻域范围内的其他模式矢量进行权重值的调整;
Figure BDA0002338283100000101
其中,Wj(t)为第t次训练时的模式矢量j的权值,j*为获胜模式矢量,α(t)为第t次训练的学习率,
Figure BDA0002338283100000102
为获胜模式矢量j*在第t次训练时的邻域函数值,j的取值范围为{0,1,2……N-1};
其中NE(t)=NE(t-1)*(C1-C2*t);C1和C2为常数,t为训练次数;
其中,所述α(t)通过下式进行计算:
Figure BDA0002338283100000103
其中,B0为最大学习率,C0为衰减常数,t为训练次数。
S350、判断是否完成对全部L个训练矢量的处理,如果是,则执行S360,否则执行S320。
S360、判断是否需要对目标图像进行编码处理,如果是,执行S370,否则执行S3140。
S370、采用对所述训练图像进行分块处理所采用的分块策略,对所述目标图像进行分块处理,得到至少一个测试矢量。
其中,所述测试矢量的与所述训练矢量的图像尺寸相匹配。
S380、依次获取一个测试矢量作为当前处理测试矢量。
其中,当前处理测试矢量可以为本轮次进行处理的测试矢量。在本发明实施例中,对于目标图像分块得到的所有测试矢量,都进行S380-S2110中获取当前处理测试矢量、计算欧式距离、获取目标模式矢量对应的存储索引值以及将索引值作为当前处理测试矢量的编码值的操作。
S390、计算所述当前处理测试矢量与所述最佳模式库中各模式矢量之间的欧氏距离。
在本发明实施例中,对于当前处理测试矢量,计算最佳模式库中的各个模式矢量分别与其之间的欧氏距离。
S3100、获取与当前处理的测试矢量的欧式距离最短的目标模式矢量,根据所述目标模式矢量在所述最佳模式库中的存储位置,获取与所述目标模式矢量对应的存储索引值。
其中,存储索引值可以对应模式矢量在最佳模式库中的存储位置,模式矢量以三维立体结构进行排列。
在本发明实施例中,对于当前处理测试矢量,将与其欧氏距离最短的模式矢量作为目标模式矢量,并获取目标模式矢量的存储索引值。
S3110、将所述存储索引值作为与所述当前处理测试矢量对应的编码值。
S3120、判断是否完成对所述目标图像中全部测试矢量的处理,如果是,则执行S3130,否则执行S380。
S3130、根据所述目标图像的各个测试矢量的编码值,获取所述目标图像的码流作为所述编码结果。
在本发明实施例中,对所有测试矢量进行处理之后,可以得到各个测试矢量对应的编码值,将各个编码值进行汇总,即可得到目标图像对应的码流,也即编码结果。
S3140、判断是否完成对全部目标图像的编码处理,如果是,则执行S3150,否则执行S360。
在一个具体的实施例中,图4a是适用于本发明实施例中的一种最佳模式库的训练方法的流程图。如图4a所示,输入训练图像样本,对训练图像样本进行分块处理,得到L个图像块,也即L个训练矢量。从L个训练矢量中按序间隔选择N个模式矢量构成初始模式库,其中,N远小于L,将N个模式矢量以三维结构按序排列。采用欧氏距离作为距离度量函数,将L个训练矢量依次输入,在初始模式库中寻找与当前输入的训练矢量距离最短的模式矢量,作为获胜模式矢量。根据邻域函数NE(t)=NE(t-1)*(C1-C2*t)计算邻域范围,C1和C2为常数,t为训练次数。对获胜模式矢量以及获胜模式矢量邻域范围内的其他模式矢量按照以下公式进行权值的调整。对L个训练矢量依次输入,获得最终的最佳模式库。
Figure BDA0002338283100000121
其中,Wj(t)为第t次训练时的模式矢量j的权值,j*为获胜模式矢量,α(t)为第t次训练的学习率,
Figure BDA0002338283100000122
为获胜模式矢量j*在第t次训练时的邻域函数值,j的取值范围为{0,1,2……N-1}。
α(t)通过下式进行计算,B0为最大学习率,C0为衰减常数,t为训练次数。
Figure BDA0002338283100000131
图4b是适用于本发明实施例中的一种根据最佳模式库进行图像压缩的方法的流程图。如图4b所示,输入测试图像,对测试图像进行分块处理,形成若干测试矢量。距离度量同样采用欧氏距离,将最佳模式库中距当前测试矢量距离最短的模式矢量的索引值,作为当前测试矢量的编码,对各个测试矢量进行处理后,即可得到测试图像的码流。
在一个具体的实施例中,为了说明本发明实施例的性能,测试图像选择Lena、Boat以及Peppers,图像块大小定义为8*8bit,模式库大小定义为1024。图像压缩比为:
Figure BDA0002338283100000132
其中M为模式矢量的维数,B0为原始图像的每像素比特数,BC为模式矢量地址比特数。重建图像质量的衡量标准采用峰值信噪比(Peak signal-to-noiseratio,PSNR):
Figure BDA0002338283100000133
PSNR为原始图像与重建图像之间的均方误差。
本实施例中分别选用基于原始邻域函数的和基于本申请技术方案的邻域函数的三维SOM算法设置最佳模式库,并通过编码后重建图像的质量来比较采用不同邻域函数的算法的性能。
学习函数
Figure BDA0002338283100000134
中B0设置为1,C0取值为40960,邻域函数NE(t)=NE(t-1)*(C1-C2*t)中NE(0)设置为4,C1取值为0.01,表1为选取不同的测试图像时,基于原始邻域函数的三维SOM算法和基于本申请技术方案的邻域函数的三维SOM算法用于图像编码的重建图像的峰值信噪比。如表1所示,基于本申请技术方案的邻域函数的三维SOM算法性能可提高0.5914-0.7551dB。
表1重建图像的峰值信噪比
Figure BDA0002338283100000141
本发明实施例的技术方案,通过在训练图像分块后的L个训练矢量中选择N个模式矢量,并对每个训练矢量,都在N个模式矢量中选择与其欧式距离最短的模式矢量作为获胜模式矢量,根据邻域函数NE(t)=NE(t-1)*(C1-C2*t)计算邻域范围,对获胜模式矢量以及其邻域范围内的模式矢量的权重值进行调整,最终得到最佳模式库,将待编码的图像进行分块处理,对于每个测试矢量,将最佳模式库中与其距离最近的模式矢量的存储索引值,作为其编码值,根据各个测试矢量的编码值形成码流。解决了现有技术中,采用指数函数作为邻域函数收敛较慢,从而导致的模式库训练效率和训练速度低的问题。选用收敛更快的一次函数作为邻域函数,实现了保证模式矢量典型性的同时,加快模式库的训练速度和效率,提高SOM算法性能的效果。
实施例四
图5是本发明实施例四提供的一种图像编码装置的结构示意图,该装置包括:训练图像分块模块410、模式矢量训练模块420、目标图像分块模块430以及测试矢量编码模块440。其中:
训练图像分块模块410,用于对训练图像进行分块处理,得到L个训练矢量,在L个训练矢量中选择N个训练矢量作为模式矢量,将N个模式矢量以三维立体结构排列,其中,N小于L;
模式矢量训练模块420,用于根据所述L个训练矢量,以及预设的邻域函数NE(t),对N个模式矢量的权重值进行学习训练,得到最佳模式库;
其中NE(t)=NE(t-1)*(C1-C2*t);C1和C2为常数,t为训练次数;
目标图像分块模块430,用于获取待编码的目标图像,并对所述目标图像进行分块处理,得到至少一个测试矢量;
测试矢量编码模块440,用于根据所述最佳模式库,对所述至少一个测试矢量进行编码,得到与所述目标图像对应的编码结果。
本发明实施例的技术方案,通过在训练图像分块后的L个训练矢量中选择N个模式矢量,并根据L个训练矢量和邻域函数NE(t)=NE(t-1)*(C1-C2*t),对N个模式矢量的权重值进行调整,最终得到最佳模式库,将待编码的图像进行分块处理,根据最佳模式库对测试矢量进行编码,最终得到待编码图像的编码结果。解决了现有技术中邻域函数选用指数函数时收敛较慢,影响模式库训练的速度和效率的问题,实现了提高模式库训练的速度和效率,以及提高SOM算法性能的效果。
在上述实施例的基础上,所述模式矢量训练模块420,包括:
当前处理矢量获取单元,用于依次获取一个训练矢量作为当前处理矢量;
获胜模式矢量获取单元,用于在所述N个模式矢量中获取与所述当前处理矢量的欧式距离最短的模式矢量,作为所述当前处理矢量的获胜模式矢量;
权重值调整单元,用于根据下述公式,对所述获胜模式矢量,以及所述获胜模式矢量邻域范围内的其他模式矢量进行权重值的调整;
Figure BDA0002338283100000161
其中,Wj(t)为第t次训练时的模式矢量j的权值,j*为获胜模式矢量,α(t)为第t次训练的学习率,
Figure BDA0002338283100000162
为获胜模式矢量j*在第t次训练时的邻域函数值,j的取值范围为{0,1,2……N-1};
处理完成判断单元,用于在完成调整后,返回执行依次获取一个训练矢量作为当前处理矢量的操作,直至完成对全部L个训练矢量的处理。
在上述实施例的基础上,所述α(t)通过下式进行计算:
Figure BDA0002338283100000163
其中,B0为最大学习率,C0为衰减常数,t为训练次数。
在上述实施例的基础上,所述测试矢量编码模块440,包括:
当前处理测试矢量获取单元,用于依次获取一个测试矢量作为当前处理测试矢量;
距离计算单元,用于计算所述当前处理测试矢量与所述最佳模式库中各模式矢量之间的欧氏距离;
编码值确定单元,用于获取与当前处理的测试矢量的欧式距离最短的目标模式矢量,根据所述目标模式矢量在所述最佳模式库中的存储位置,确定与所述当前处理测试矢量对应的编码值;
测试矢量处理完成确定单元,用于返回执行依次获取一个测试矢量作为当前处理测试矢量的操作,直至完成对所述目标图像中全部测试矢量的处理;
编码结果获取单元,用于根据所述目标图像的各个测试矢量的编码值,获取所述目标图像的码流作为所述编码结果。
在上述实施例的基础上,所述编码值确定单元,包括:
存储索引值获取子单元,用于根据所述目标模式矢量在所述最佳模式库中的存储位置,获取与所述目标模式矢量对应的存储索引值;
编码值确定子单元,用于将所述存储索引值作为与所述当前处理测试矢量对应的编码值。
在上述实施例的基础上,所述目标图像分块模块430,包括:
目标图像分块处理单元,用于采用对所述训练图像进行分块处理所采用的分块策略,对所述目标图像进行分块处理,得到至少一个测试矢量;
其中,所述测试矢量的与所述训练矢量的图像尺寸相匹配。
在上述实施例的基础上,所述训练图像分块模块410,包括:
模式矢量选择单元,用于在L个训练矢量中,随机选择,或者按序间隔选择N个训练矢量作为模式矢量。
本发明实施例所提供的图像编码装置可执行本发明任意实施例所提供的图像编码方法,具备执行方法相应的功能模块和有益效果。
实施例五
图6为本发明实施例五提供的一种计算机设备的结构示意图,如图6所示,该计算机设备包括处理器70、存储器71、输入装置72和输出装置73;计算机设备中处理器70的数量可以是一个或多个,图6中以一个处理器70为例;计算机设备中的处理器70、存储器71、输入装置72和输出装置73可以通过总线或其他方式连接,图6中以通过总线连接为例。
存储器71作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的图像编码方法对应的模块(例如,图像编码装置中的训练图像分块模块410、模式矢量训练模块420、目标图像分块模块430以及测试矢量编码模块440)。处理器70通过运行存储在存储器71中的软件程序、指令以及模块,从而执行计算机设备的各种功能应用以及数据处理,即实现上述的图像编码方法。该方法包括:
对训练图像进行分块处理,得到L个训练矢量,在L个训练矢量中选择N个训练矢量作为模式矢量,将N个模式矢量以三维立体结构排列,其中,N小于L;
根据所述L个训练矢量,以及预设的邻域函数NE(t),对N个模式矢量进行学习训练,得到最佳模式库;
其中NE(t)=NE(t-1)*(C1-C2*t);C1和C2为常数,t为训练次数;
获取待编码的目标图像,并对所述目标图像进行分块处理,得到至少一个测试矢量;
根据所述最佳模式库,对所述至少一个测试矢量进行编码,得到与所述目标图像对应的编码结果。
存储器71可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器71可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器71可进一步包括相对于处理器70远程设置的存储器,这些远程存储器可以通过网络连接至计算机设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置72可用于接收输入的数字或字符信息,以及产生与计算机设备的用户设置以及功能控制有关的键信号输入。输出装置73可包括显示屏等显示设备。
实施例六
本发明实施例六还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种图像编码方法,该方法包括:
对训练图像进行分块处理,得到L个训练矢量,在L个训练矢量中选择N个训练矢量作为模式矢量,将N个模式矢量以三维立体结构排列,其中,N小于L;
根据所述L个训练矢量,以及预设的邻域函数NE(t),对N个模式矢量的权重值进行学习训练,得到最佳模式库;
其中NE(t)=NE(t-1)*(C1-C2*t);C1和C2为常数,t为训练次数;
获取待编码的目标图像,并对所述目标图像进行分块处理,得到至少一个测试矢量;
根据所述最佳模式库,对所述至少一个测试矢量进行编码,得到与所述目标图像对应的编码结果。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的图像编码方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述图像编码装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种图像编码方法,其特征在于,包括:
对训练图像进行分块处理,得到L个训练矢量,在L个训练矢量中选择N个训练矢量作为模式矢量,将N个模式矢量以三维立体结构排列,其中,N小于L;
根据所述L个训练矢量,以及预设的邻域函数NE(t),对N个模式矢量进行学习训练,得到最佳模式库;
其中NE(t)=NE(t-1)*(C1-C2*t);C1和C2为常数,t为训练次数;
获取待编码的目标图像,并对所述目标图像进行分块处理,得到至少一个测试矢量;
根据所述最佳模式库,对所述至少一个测试矢量进行编码,得到与所述目标图像对应的编码结果。
2.根据权利要求1所述的方法,其特征在于,根据所述L个训练矢量,以及预设的邻域函数NE(t),对N个模式矢量进行学习训练,得到最佳模式库,包括:
依次获取一个训练矢量作为当前处理矢量;
在所述N个模式矢量中获取与所述当前处理矢量的欧式距离最短的模式矢量,作为所述当前处理矢量的获胜模式矢量;
根据下述公式,对所述获胜模式矢量,以及所述获胜模式矢量邻域范围内的其他模式矢量进行权重值的调整;
Figure FDA0002338283090000011
其中,Wj(t)为第t次训练时的模式矢量j的权值,j*为获胜模式矢量,α(t)为第t次训练的学习率,
Figure FDA0002338283090000021
为获胜模式矢量j*在第t次训练时的邻域函数值,j的取值范围为{0,1,2……N-1};
在完成调整后,返回执行依次获取一个训练矢量作为当前处理矢量的操作,直至完成对全部L个训练矢量的处理。
3.根据权利要求2所述的方法,其特征在于,所述α(t)通过下式进行计算:
Figure FDA0002338283090000022
其中,B0为最大学习率,C0为衰减常数,t为训练次数。
4.根据权利要求1所述的方法,其特征在于,根据所述最佳模式库,对所述至少一个测试矢量进行编码,得到与所述目标图像对应的编码结果,包括:
依次获取一个测试矢量作为当前处理测试矢量;
计算所述当前处理测试矢量与所述最佳模式库中各模式矢量之间的欧氏距离;
获取与当前处理的测试矢量的欧式距离最短的目标模式矢量,根据所述目标模式矢量在所述最佳模式库中的存储位置,确定与所述当前处理测试矢量对应的编码值;
返回执行依次获取一个测试矢量作为当前处理测试矢量的操作,直至完成对所述目标图像中全部测试矢量的处理;
根据所述目标图像的各个测试矢量的编码值,获取所述目标图像的码流作为所述编码结果。
5.根据权利要求4所述的方法,其特征在于,根据所述目标模式矢量在所述最佳模式库中的存储位置,确定与所述当前处理测试矢量对应的编码值,包括:
根据所述目标模式矢量在所述最佳模式库中的存储位置,获取与所述目标模式矢量对应的存储索引值;
将所述存储索引值作为与所述当前处理测试矢量对应的编码值。
6.根据权利要求1所述的方法,其特征在于,对所述目标图像进行分块处理,得到至少一个测试矢量,包括:
采用对所述训练图像进行分块处理所采用的分块策略,对所述目标图像进行分块处理,得到至少一个测试矢量;
其中,所述测试矢量的与所述训练矢量的图像尺寸相匹配。
7.根据权利要求1所述的方法,其特征在于,在L个训练矢量中选择N个训练矢量作为模式矢量,包括:
在L个训练矢量中,随机选择,或者按序间隔选择N个训练矢量作为模式矢量。
8.一种图像编码装置,其特征在于,包括:
训练图像分块模块,用于对训练图像进行分块处理,得到L个训练矢量,在L个训练矢量中选择N个训练矢量作为模式矢量,将N个模式矢量以三维立体结构排列,其中,N小于L;
模式矢量训练模块,用于根据所述L个训练矢量,以及预设的邻域函数NE(t),对N个模式矢量进行学习训练,得到最佳模式库;
其中NE(t)=NE(t-1)*(C1-C2*t);C1和C2为常数,t为训练次数;
目标图像分块模块,用于获取待编码的目标图像,并对所述目标图像进行分块处理,得到至少一个测试矢量;
测试矢量编码模块,用于根据所述最佳模式库,对所述至少一个测试矢量进行编码,得到与所述目标图像对应的编码结果。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7中任一所述的图像编码方法。
10.一种包含计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-7中任一所述的图像编码方法。
CN201911365482.XA 2019-12-26 2019-12-26 一种图像编码方法、装置、计算机设备和存储介质 Withdrawn CN111028303A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911365482.XA CN111028303A (zh) 2019-12-26 2019-12-26 一种图像编码方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911365482.XA CN111028303A (zh) 2019-12-26 2019-12-26 一种图像编码方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN111028303A true CN111028303A (zh) 2020-04-17

Family

ID=70213739

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911365482.XA Withdrawn CN111028303A (zh) 2019-12-26 2019-12-26 一种图像编码方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN111028303A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115955574A (zh) * 2023-03-10 2023-04-11 宁波康达凯能医疗科技有限公司 一种基于权重网络的帧内图像编码方法、装置及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115955574A (zh) * 2023-03-10 2023-04-11 宁波康达凯能医疗科技有限公司 一种基于权重网络的帧内图像编码方法、装置及存储介质
CN115955574B (zh) * 2023-03-10 2023-07-04 宁波康达凯能医疗科技有限公司 一种基于权重网络的帧内图像编码方法、装置及存储介质

Similar Documents

Publication Publication Date Title
US11250591B2 (en) Target detection method, system, and non-volatile storage medium
CN111462261B (zh) 针对h.266/vvc的快速cu分区和帧内决策方法
CN107170019B (zh) 一种快速低存储图像压缩感知方法
JP2006014343A (ja) 画像の符号化および復号化
JP2006014343A5 (zh)
WO2021073066A1 (zh) 图像处理方法及装置
Kim et al. Deep blind image quality assessment by employing FR-IQA
CN115118977B (zh) 针对360度视频的帧内预测编码方法、系统及介质
CN111028303A (zh) 一种图像编码方法、装置、计算机设备和存储介质
CN111669593A (zh) 视频编码方法、装置、电子设备和存储介质
CN115019128A (zh) 图像生成模型训练方法、图像生成方法及相关装置
WO2024067036A1 (zh) 帧内预测模式的决策方法、装置及视频编码设备
CN110599487A (zh) 物品检测方法、装置以及存储介质
JP2000172852A (ja) 画像処理方法、装置および記録媒体
CN116506627A (zh) 一种多特征哈希值构建哈希表进行搜索的编码方法及装置
CN112182382B (zh) 数据处理方法、电子设备及介质
CN111179238B (zh) 面向水下图像集指导一致性增强评价的子集置信比例动态选取方法
JP5043849B2 (ja) ビデオシーケンスにおける可変形状動き推定
TWI450591B (zh) 視訊處理晶片組及其中移動評估的資料讀取之方法
CN110505485B (zh) 运动补偿方法、装置、计算机设备以及存储介质
CN114022357A (zh) 图像重建方法、图像重建模型的训练方法、装置和设备
CN112100446A (zh) 搜索方法、可读存储介质和电子设备
TWI450590B (zh) 嵌入式系統及其中移動評估的資料讀取之方法
CN110738638A (zh) 视觉显著性检测算法适用性预测与性能盲评价方法
CN109068140B (zh) 视频编码中运动向量的确定方法、装置及视频编解码设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 215021 building 14, Tengfei Science Park, No. 388, Xinping street, Suzhou Industrial Park, Suzhou City, Jiangsu Province

Applicant after: Sipic Technology Co.,Ltd.

Address before: 215021 building 14, Tengfei Science Park, No. 388, Xinping street, Suzhou Industrial Park, Suzhou City, Jiangsu Province

Applicant before: AI SPEECH Ltd.

CB02 Change of applicant information
WW01 Invention patent application withdrawn after publication

Application publication date: 20200417

WW01 Invention patent application withdrawn after publication