CN117392416A

CN117392416A - 多目标优化方法、装置、设备以及存储介质

Info

Publication number: CN117392416A
Application number: CN202311344605.8A
Authority: CN
Inventors: 柳费洋
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2023-10-17
Filing date: 2023-10-17
Publication date: 2024-01-12

Abstract

本公开提供了一种多目标优化方法、装置、设备以及存储介质，涉及人工智能技术领域，具体为深度学习和计算机视觉领域。该方法包括：获取待量化值集合和待优化目标集合；对于待量化值集合中的每个待量化值，获取该待量化值对应的量化系数，确定量化系数的相邻量化系数集合；基于相邻量化系数集合对应的重建值集合，确定重建失真值集合；基于重建失真值集合以及待优化目标集合，确定目标量化系数。本公开提供的多目标优化方法在保证传统优化目标性能的基础上，实现了其他优化目标的性能提升。

Description

多目标优化方法、装置、设备以及存储介质

技术领域

本公开涉及人工智能技术领域，具体涉及深度学习和计算机视觉领域，尤其涉及一种多目标优化方法、装置、设备以及存储介质。

背景技术

从视觉信息数字化开始，如何高效地对其压缩以便于存储和分发就是一个关键技术问题。为了使压缩后的码流可以互通和规范解码，国际组织对视频编码建立了国际标准，逐渐形成了以预测、变换、量化、熵编码和后处理滤波等技术为基础的混合编码框架。

发明内容

本公开提供了一种多目标优化方法、装置、设备以及存储介质。

根据本公开的第一方面，提供了一种多目标优化方法，包括：获取待量化值集合和待优化目标集合；对于待量化值集合中的每个待量化值，获取该待量化值对应的量化系数，确定量化系数的相邻量化系数集合；基于相邻量化系数集合对应的重建值集合，确定重建失真值集合；基于重建失真值集合以及待优化目标集合，确定目标量化系数。

根据本公开的第二方面，提供了一种多目标优化装置，包括：第一获取模块，被配置成获取待量化值集合和待优化目标集合；第一确定模块，被配置成对于待量化值集合中的每个待量化值，获取该待量化值对应的量化系数，确定量化系数的相邻量化系数集合；第二确定模块，被配置成基于相邻量化系数集合对应的重建值集合，确定重建失真值集合；第三确定模块，被配置成基于重建失真值集合以及待优化目标集合，确定目标量化系数。

根据本公开的第三方面，提供了一种电子设备，包括：至少一个处理器；以及与至少一个处理器通信连接的存储器；其中，存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使至少一个处理器能够执行如第一方面中任一实现方式描述的方法。

根据本公开的第四方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，计算机指令用于使计算机执行如第一方面中任一实现方式描述的方法。

根据本公开的第五方面，提供了一种计算机程序产品，包括计算机程序，计算机程序在被处理器执行时实现如第一方面中任一实现方式描述的方法。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本公开的限定。其中：

图1是本公开可以应用于其中的示例性系统架构图；

图2是根据本公开的多目标优化方法的一个实施例的流程图；

图3是根据本公开的多目标优化方法的另一个实施例的流程图；

图4是根据本公开的多目标优化方法的再一个实施例的流程图；

图5是根据本公开的多目标优化装置的一个实施例的结构示意图；

图6是用来实现本公开实施例的多目标优化方法的电子设备的框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

需要说明的是，在不冲突的情况下，本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。

图1示出了可以应用本公开的多目标优化方法或多目标优化装置的实施例的示例性系统架构100。

如图1所示，系统架构100可以包括终端设备101、102、103，网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备101、102、103通过网络104与服务器105交互，以接收或发送信息等。终端设备101、102、103上可以安装有各种客户端应用。

终端设备101、102、103可以是硬件，也可以是软件。当终端设备101、102、103为硬件时，可以是各种电子设备，包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时，可以安装在上述电子设备中。其可以实现成多个软件或软件模块，也可以实现成单个软件或软件模块。在此不做具体限定。

服务器105可以提供各种服务。例如，服务器105可以对从终端设备101、102、103获取的待量化值和待优化目标集合进行分析和处理，并生成处理结果(例如目标量化系数)。

需要说明的是，服务器105可以是硬件，也可以是软件。当服务器105为硬件时，可以实现成多个服务器组成的分布式服务器集群，也可以实现成单个服务器。当服务器105为软件时，可以实现成多个软件或软件模块(例如用来提供分布式服务)，也可以实现成单个软件或软件模块。在此不做具体限定。

需要说明的是，本公开实施例所提供的多目标优化方法一般由服务器105执行，相应地，多目标优化装置一般设置于服务器105中。

应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。

继续参考图2，其示出了根据本公开的多目标优化方法的一个实施例的流程200。该多目标优化方法包括以下步骤：

步骤201，获取待量化值集合和待优化目标集合。

在本实施例中，多目标优化方法的执行主体(例如图1所示的服务器105)会先获取待量化值集合和待优化目标集合，这里的待量化值集合可以包括多个待量化值。待优化目标集合中可以包括多个待优化目标。例如，在对图像视频编码时，待优化目标可以是图像视频编码时的任意参数，如分辨率、码率、帧率和编码格式等。也即上述待优化目标集合可以包括分辨率、码率、帧率和编码格式等中的多个。需要说明的是，本实施例中的多目标优化方法不局限于率失真优化量化中使用的最小化码率优化目标，可以优化任意个其他优化目标，例如更符合人眼主观特性的客观评价指标。

步骤202，对于待量化值集合中的每个待量化值，获取该待量化值对应的量化系数，确定量化系数的相邻量化系数集合。

在本实施例中，对于待量化值集合中的每个待量化值，上述执行主体会获取该待量化值对应的量化系数，确定量化系数的相邻量化系数集合。在传统图像视频编码框架中，量化技术用于将变换后的残差变换域信号进一步离散化，从而降低编码需要的比特数。广义上讲，量化是一种满射映射关系，其将多个值或一段区间映射到某个索引值。在这里，上述执行主体会先利用传统量化器将待量化值量化为系数(即量化系数)。需要说明的是，对于标量量化器，量化系数的个数通常等于待量化值的个数；而对于矢量量化器，则量化系数的个数通常为1。之后，上述执行主体会确定该量化系数的相邻量化系数集合，相邻量化系数集合即为量化系数集合相邻的量化系数集合。

步骤203，基于相邻量化系数集合对应的重建值集合，确定重建失真值集合。

在本实施例中，上述执行主体会基于相邻量化系数集合对应的重建值集合，确定重建失真值集合。在这里，在确定了相邻量化系数集合后，对于相邻量化系数集合中的每一个相邻量化系数，上述执行主体会利用反量化器将相邻量化系数重建为量化值所在空间的重建值，从而得到相邻量化系数集合对应的重建值集合。对于重建值集合中的每个重建值，上述执行主体会计算该重建值与待量化值之间的距离，并根据失真函数来计算其重建失真值，从而得到重建失真值集合。

步骤204，基于重建失真值集合以及待优化目标集合，确定目标量化系数。

在本实施例中，上述执行主体会基于重建失真值集合以及待优化目标集合来确定目标量化系数。一般地，在得到重建失真值集合后，上述执行主体会在重建失真值集合中找到失真最小的元素，从而得到失真最小的元素所构成的子集，然后再从相邻量化系数集合中确定该子集对应的相邻量化系数，从而得到对应的相邻量化系数子集。此外，上述执行主体会根据定义的待优化目标集合，获得对应量化器的导向量化信息。之后，再计算相邻量化系数子集中的每个元素到量化系数的方向矢量与导向量化信息之间的余弦相似度，并将余弦相似度最大的相邻量化系数确定为最终的量化系数，也即目标量化系数。

本公开实施例提供的多目标优化方法，首先，获取待量化值集合和待优化目标集合；然后，对于待量化值集合中的每个待量化值，获取该待量化值对应的量化系数，确定量化系数的相邻量化系数集合；之后，基于相邻量化系数集合对应的重建值集合，确定重建失真值集合；最后，基于重建失真值集合以及待优化目标集合确定目标量化系数。本实施例中的多目标优化方法，该方法不局限于某个单一的优化目标，在对待量化值量化的时候实现量化系数的直接获取，避免率失真优化理论引起的多次编码所带来的高复杂度，使其能应用在实际编码，尤其是延迟敏感的应用场景下。同时，在保证传统优化目标性能的基础上，实现了其他优化目标的性能提升。

继续参考图3，图3示出了根据本公开的多目标优化方法的另一个实施例的流程300。该多目标优化方法包括以下步骤：

步骤301，获取待量化值集合和待优化目标集合。

在本实施例中，多目标优化方法的执行主体(例如图1所示的服务器105)会获取待量化值集合和待优化目标集合。步骤301与前述实施例的步骤201基本一致，具体实现方式可以参考前述对步骤201的描述，此处不再赘述。

步骤302，对于待量化值集合中的每个待量化值，利用量化器将该待量化值量化为系数，记为量化系数。

在本实施例中，上述执行主体会利用量化器将该待量化值量化为系数，记为量化系数。例如，待量化值集合为【10，8，6，4】，如果用量化步长为4的标量量化器，也就是对于【10，8，6，4】中的每一个待量化值，希望能用一个整数值乘以4再用来表示它，这个整数值就是量化系数。

步骤303，确定与量化系数相邻的量化系数集合，记为相邻量化系数集合。

在本实施例中，上述执行主体会确定与量化系数相邻的量化系数集合，记为相邻量化系数集合。从而确定了相邻量化系数集合，实现了量化系数的直接获取。

步骤304，对于相邻量化系数集合对应的重建值集合中的每个重建值，计算该重建值与待量化值之间的距离。

在本实施例中，在确定了相邻量化系数集合后，对于相邻量化系数集合中的每一个相邻量化系数，上述执行主体会利用反量化器将相邻量化系数重建为量化值所在空间的重建值，从而得到相邻量化系数集合对应的重建值集合。对于重建值集合中的每个重建值，上述执行主体会计算该重建值与待量化值之间的距离。需要说明的是，量化系数乘以量化步长就是重建值，如在步骤302的例子中，4就是量化步长。比如说对于第一个数值10，4的整数倍数可以是4，8，12，16，20等等，可以用任意一个去表示重建值，但是不同的重建值相比源值(10)，失真(重建值和源值的差异程度)是不一样的。以1范数作为失真度量为例，重建值为4/8/12/16/20的情况下，和源值之间的失真分别是6/2/2/6/10。一般来说，以最小化该失真度量为目标的最优解是选择失真最小的重建值，那这个例子里就可以选择8和12作为重建值，对应的量化系数就是2和3。从最小化1范数失真来看，这两个量化系数是等价的，任意一个都可以使重建失真最小，也就是无偏的。

在本实施例的一些可选的实现方式中，重建值集合包括：每个相邻量化系数对应的重建值；以及重建值基于以下步骤得到：对于相邻量化系数集合中的每一个相邻量化系数，利用反量化器得到该相邻量化系数对应的重建值。也即对于相邻量化系数集合中的每一个相邻量化系数，上述执行主体会利用反量化器将相邻量化系数重建为量化值所在空间的重建值，从而得到相邻量化系数集合对应的重建值集合。

步骤305，基于失真函数以及距离计算重建失真，得到重建失真值集合。

在本实施例中，上述执行主体会基于失真函数以及距离计算重建失真，得到重建失真值集合。也即上述执行主体会根据失真函数dist来计算重建值与待量化值之间的重建失真值，从而得到重建失真值集合。从而使得后续可以快速确定目标量化系数，提高了目标量化系数的确定效率。

步骤306，基于重建失真值集合以及待优化目标集合，确定目标量化系数。

在本实施例中，上述执行主体会基于重建失真值集合以及待优化目标集合来确定目标量化系数。步骤306与前述实施例的步骤204基本一致，具体实现方式可以参考前述对步骤204的描述，此处不再赘述。

从图3中可以看出，与图2对应的实施例相比，本实施例中的多目标优化方法，该方法突出了确定量化系数的相邻量化系数集合，以及确定重建失真值集合的步骤，从而进一步提高了多目标优化的效率，实现了多目标优化的性能提升。

继续参考图4，图4示出了根据本公开的多目标优化方法的再一个实施例的流程400。该多目标优化方法包括以下步骤：

步骤401，获取待量化值集合和待优化目标集合。

步骤402，对于待量化值集合中的每个待量化值，利用量化器将该待量化值量化为系数，记为量化系数。

步骤403，确定与量化系数相邻的量化系数集合，记为相邻量化系数集合。

步骤404，对于重建值集合中的每个重建值，计算该重建值与待量化值之间的距离。

步骤405，基于失真函数以及距离计算重建失真，得到重建失真值集合。

步骤406，获取重建失真值集合中满足目标条件的元素，得到目标子集。

在本实施例中，多目标优化方法的执行主体(例如图1所示的服务器105)会获取重建失真值集合中满足目标条件的元素，这里的目标条件可以是重建失真值最小，也即获取重建失真值集合中重建失真值最小的元素，从而得到目标子集。

步骤407，从相邻量化系数集合中确定目标子集对应的相邻量化系数，得到相邻量化系数子集。

在本实施例中，在得到目标子集后，上述执行主体会从相邻量化系数集合中确定目标子集对应的相邻量化系数，从而得到相邻量化系数子集。

步骤408，根据待优化目标集合计算得到导向量化信息。

在本实施例中，上述执行主体会根据待优化目标集合计算得到导向量化信息。

步骤409，计算相邻量化系数子集中的每个元素到量化系数的方向矢量与导向量化信息的余弦相似度。

在本实施例中，上述执行主体会计算相邻量化系数子集中的每个元素到量化系数的方向矢量与导向量化信息的余弦相似度。

步骤410，将余弦相似度最大的相邻量化系数确定为目标量化系数。

在本实施例中，上述执行主体会将余弦相似度最大的相邻量化系数确定为最终的量化系数，也即目标量化系数。

需要说明的是，量化技术根据最小失真作为判决依据进行整个数值空间的分割，边界的确定就是空间的聚类。边界内的数据统一使用相同的重建值，即量化中心。越远离量化边界的点，重建失真越小；反之，处于边界的点则达到重建失真的峰值。同时，边界上的点还有一个特征即到其相邻的量化中心的失真相同，就意味着从失真的角度而言，无论采用哪一个量化中心都是相同的失真度。虽然一般来说，为了实现更低的码率，会采用更靠近0的量化中心，这意味着可以使用更少的比特数储存对应的索引值，但由于编码器是一个复杂的系统，要实现整体的编码性能最优，这种量化中心的判决依据并不可靠。理论上来说，边界上的点具有多个选择这个特点提供了多目标优化的基础，即在某个优化目标不变的情况下，有可能获取到使另一个目标更优的解，在多目标优化的上下文中，这意味着可以获取到支配解。本实施例中的多目标优化方法基于量化技术的特点以及多目标优化的原理，提出了导向量化技术。该技术可以根据预定的优化目标集合，获得在量化时的偏好，即量化导向信号。在量化时，满足失真的限制条件下，选择对应量化导向信号方向的量化中心作为目标量化系数，实现多目标优化下的帕累托最优编码。

从图4中可以看出，与图3对应的实施例相比，本实施例中的多目标优化方法，该方法突出了确定目标量化系数的步骤，从而根据预定的优化目标集合，获得在量化时的偏好，即量化导向信号。在量化时，满足失真的限制条件下，选择对应量化导向信号方向的量化中心作为量化值，实现多目标优化下的帕累托最优编码。

进一步地，根据本公开的多目标优化方法的一个技术流程如下所示：

(1)定义优化目标集合为T＝[t₁,t₂,t₃,...,t_M]，其中，M为优化目标的个数。

(2)对于一个待优化目标对应的一组待量化值X＝[x₁,x₂,x₃,...,x_N]，其中，N为待量化的系数个数。

传统量化器Q:X→C待量化值X量化为系数C＝[c₁,c₂,c₃,...,c_L]，其中，L为量化系数的个数。这里，对于标量量化器，L通常等于N；对于矢量量化器，则L通常为1。

对应的反量化器Q^-1:C→X将系数C重建为待量化值X所在空间的重建值

(3)获取与待量化值X应用量化器Q得到的量化系数C_X相邻的量化系数集合C＝{C₁,C₂,C₃,...,C_K}，其中，K为相邻量化系数的个数。

(4)对量化系数集合C中的每一个量化系数应用反量化器Q^-1得到重建值集合

(5)对重建值集合中的每一个重建值/>计算与待量化值X之间的距离，根据失真函数dist()计算其重建失真d_i，得到失真集合D＝[d₁,d₂,d₃,...,d_K]。

(6)在失真集合D中找到失真最小的元素构成的子集D_min，得到对应的相邻量化系数子集其中，J≤K，为失真集合D中满足d＝min(D)的元素的个数。

(7)若J≥1，则根据定义的优化目标集T，得到对应量化器Q的导向量化信息G＝[g₁,g₂,g₃,...,g_L]，和集合中的每一个元素到量化系数C_X的方向矢量计算余弦相似度，并将余弦相似度最大的量化系数C作为最终的量化系数。

本公开的多目标优化方法可以达到以下技术效果：

(1)不局限于率失真优化量化中使用的最小化码率优化目标，可以优化任意个其他优化目标，例如更符合人眼主观特性的客观评价指标。需要说明的是，率失真优化量化原理为基于率失真优化理论，对量化后的系数进行实际编码和重建，从而获得真实的码率和失真，结合率失真优化理论，计算出某个量化系数值对应的开销(Cost)，并从所有可选的量化系数集合中选择Cost最小的系数作为最终量化后的系数

(2)率失真优化量化是一种后验的基于暴力搜索的启发式算法，得到待搜索集合中的每一个实际编码后的码率-失真数据对，利用率失真优化技术，计算每一个数据对所对应的Cost，最终从中选取最优的量化中心。本公开的多目标优化方法所提出的理论是一种先验的量化方法，无需多次编码，在先验知识(导向信息)的指引下直接获得量化值，没有额外的复杂度。

(3)率失真优化量化无法保证在优化码率的情况下不降低平均质量，因此不能保证获得支配解。本公开的多目标优化方法基于边界上的点有多个选择的实际情况，可从中选择优化其他目标的量化中心，并不对传统量化器所使用的失真度量有任何妥协，是一种获得支配解的优化算法。

进一步参考图5，作为对上述各图所示方法的实现，本公开提供了一种多目标优化装置的一个实施例，该装置实施例与图2所示的方法实施例相对应，该装置具体可以应用于各种电子设备中。

如图5所示，本实施例的多目标优化装置500包括：第一获取模块501、第一确定模块502、第二确定模块503和第三确定模块504。其中，第一获取模块501，被配置成获取待量化值集合和待优化目标集合；第一确定模块502，被配置成对于待量化值集合中的每个待量化值，获取该待量化值对应的量化系数，确定量化系数的相邻量化系数集合；第二确定模块503，被配置成基于相邻量化系数集合对应的重建值集合，确定重建失真值集合；第三确定模块504，被配置成基于重建失真值集合以及待优化目标集合，确定目标量化系数。

在本实施例中，多目标优化装置500中：第一获取模块501、第一确定模块502、第二确定模块503和第三确定模块504的具体处理及其所带来的技术效果可分别参考图2对应实施例中的步骤201-204的相关说明，在此不再赘述。

在本实施例的一些可选的实现方式中，第一确定模块被进一步配置成：利用量化器将该待量化值量化为系数，记为量化系数；确定与量化系数相邻的量化系数集合，记为相邻量化系数集合。

在本实施例的一些可选的实现方式中，重建值集合包括：每个相邻量化系数对应的重建值；以及重建值基于以下步骤得到：对于相邻量化系数集合中的每一个相邻量化系数，利用反量化器得到该相邻量化系数对应的重建值。

在本实施例的一些可选的实现方式中，第二确定模块被进一步配置成：对于重建值集合中的每个重建值，计算该重建值与待量化值之间的距离；基于失真函数以及距离计算重建失真，得到重建失真值集合。

在本实施例的一些可选的实现方式中，上述多目标优化装置还包括：第二获取模块，被配置成获取重建失真值集合中满足目标条件的元素，得到目标子集；第四确定模块，被配置成从相邻量化系数集合中确定目标子集对应的相邻量化系数，得到相邻量化系数子集。

在本实施例的一些可选的实现方式中，第三确定模块被进一步配置成：根据待优化目标集合计算得到导向量化信息；计算相邻量化系数子集中的每个元素到量化系数的方向矢量与导向量化信息的余弦相似度；将余弦相似度最大的相邻量化系数确定为目标量化系数。

根据本公开的实施例，本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

图6示出了可以用来实施本公开的实施例的示例电子设备600的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图6所示，设备600包括计算单元601，其可以根据存储在只读存储器(ROM)602中的计算机程序或者从存储单元608加载到随机访问存储器(RAM)603中的计算机程序，来执行各种适当的动作和处理。在RAM 603中，还可存储设备600操作所需的各种程序和数据。计算单元601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。

设备600中的多个部件连接至I/O接口605，包括：输入单元606，例如键盘、鼠标等；输出单元607，例如各种类型的显示器、扬声器等；存储单元608，例如磁盘、光盘等；以及通信单元609，例如网卡、调制解调器、无线通信收发机等。通信单元609允许设备600通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元601可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元601的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元601执行上文所描述的各个方法和处理，例如多目标优化方法。例如，在一些实施例中，多目标优化方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元608。在一些实施例中，计算机程序的部分或者全部可以经由ROM 602和/或通信单元609而被载入和/或安装到设备600上。当计算机程序加载到RAM 603并由计算单元601执行时，可以执行上文描述的多目标优化方法的一个或多个步骤。备选地，在其他实施例中，计算单元601可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行多目标优化方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

云计算(cloud computer)，指的是通过网络接入弹性可扩展的共享物理或虚拟资源池，资源可以包括服务器、操作系统、网络、软件、应用或存储设备等，并可以以按需、自服务的方式对资源进行部署和管理的技术体系。通过云计算技术，可以为人工智能、区块链等技术应用、模型训练提供高效强大的数据处理能力。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，也可以为分布式系统的服务器，或者是结合了区块链的服务器。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

1.一种多目标优化方法，包括：

获取待量化值集合和待优化目标集合；

对于所述待量化值集合中的每个待量化值，获取该待量化值对应的量化系数，确定所述量化系数的相邻量化系数集合；

基于所述相邻量化系数集合对应的重建值集合，确定重建失真值集合；

基于所述重建失真值集合以及所述待优化目标集合，确定目标量化系数。

2.根据权利要求1所述的方法，其中，所述获取该待量化值对应的量化系数，确定所述量化系数的相邻量化系数集合，包括：

利用量化器将所述该待量化值量化为系数，记为量化系数；

确定与所述量化系数相邻的量化系数集合，记为相邻量化系数集合。

3.根据权利要求2所述的方法，其中，所述重建值集合包括：每个相邻量化系数对应的重建值；以及

所述重建值基于以下步骤得到：

对于所述相邻量化系数集合中的每一个相邻量化系数，利用反量化器得到该相邻量化系数对应的重建值。

4.根据权利要求3所述的方法，其中，所述基于所述相邻量化系数集合对应的重建值集合，确定重建失真值集合，包括：

对于所述重建值集合中的每个重建值，计算该重建值与所述待量化值之间的距离；

基于失真函数以及所述距离计算重建失真，得到重建失真值集合。

5.根据权利要求4所述的方法，其中，还包括：

获取所述重建失真值集合中满足目标条件的元素，得到目标子集；

从所述相邻量化系数集合中确定所述目标子集对应的相邻量化系数，得到相邻量化系数子集。

6.根据权利要求1所述的方法，其中，所述基于所述重建失真值集合以及所述待优化目标集合，确定目标量化系数，包括：

根据所述待优化目标集合计算得到导向量化信息；

计算所述相邻量化系数子集中的每个元素到所述量化系数的方向矢量与所述导向量化信息的余弦相似度；

将余弦相似度最大的相邻量化系数确定为目标量化系数。

7.一种多目标优化装置，包括：

第一获取模块，被配置成获取待量化值集合和待优化目标集合；

第一确定模块，被配置成对于所述待量化值集合中的每个待量化值，获取该待量化值对应的量化系数，确定所述量化系数的相邻量化系数集合；

第二确定模块，被配置成基于所述相邻量化系数集合对应的重建值集合，确定重建失真值集合；

第三确定模块，被配置成基于所述重建失真值集合以及所述待优化目标集合，确定目标量化系数。

8.根据权利要求7所述的装置，其中，所述第一确定模块被进一步配置成：

利用量化器将所述该待量化值量化为系数，记为量化系数；

9.根据权利要求8所述的装置，其中，所述重建值集合包括：每个相邻量化系数对应的重建值；以及

所述重建值基于以下步骤得到：

10.根据权利要求9所述的装置，其中，所述第二确定模块被进一步配置成：

11.根据权利要求10所述的装置，其中，还包括：

第二获取模块，被配置成获取所述重建失真值集合中满足目标条件的元素，得到目标子集；

第四确定模块，被配置成从所述相邻量化系数集合中确定所述目标子集对应的相邻量化系数，得到相邻量化系数子集。

12.根据权利要求7所述的装置，其中，所述第三确定模块被进一步配置成：

根据所述待优化目标集合计算得到导向量化信息；

将余弦相似度最大的相邻量化系数确定为目标量化系数。

13.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-6中任一项所述的方法。

14.一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行权利要求1-6中任一项所述的方法。

15.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-6中任一项所述的方法。