CN111045325A

CN111045325A - 优化装置及优化装置的控制方法

Info

Publication number: CN111045325A
Application number: CN201910949444.2A
Authority: CN
Inventors: 宫泽俊之; 高津求; 松原聪
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2018-10-11
Filing date: 2019-10-08
Publication date: 2020-04-21
Also published as: JP7193707B2; JP2020061012A; EP3637202A1; US20200117697A1; EP3637202B1

Abstract

本发明涉及优化装置及其控制方法，其包括：状态保持单元，其保持包括在表示能量的评估函数中的多个状态变量的值；计算单元，其计算响应于多个状态变量的值中的任何值的变化而发生的多个状态转换中的每一个的能量的变化值；温度控制单元，其控制指示温度的温度值；以及转换控制单元，其包括：多个第一选择电路，其中每个基于对预定数量的状态转换中的每一个的接受的适当性从预定数量的状态转换中随机选择中间候选者，该适当性是通过比较热激发能量与针对相应状态转换的能量变化而获得的，热激发能量是使用数量与预定数量相同的独立随机数中的每一个来计算的；以及第二选择电路，其从由多个第一选择电路选择的中间候选者中随机选择一个状态转换。

Description

优化装置及优化装置的控制方法

技术领域

本文讨论的实施方式涉及优化装置和优化装置的控制方法。

背景技术

在当前社会中，所有领域中都进行信息处理。使用诸如计算机的算术装置执行信息处理，并且计算和处理各种数据以获得有意义的结果，从而执行预测、决策和控制。作为信息处理的这些领域之一，优化问题是重要的领域。例如，使执行某种处理所需的资源和成本最小化的问题，或寻找用于使处理的效果最大化的解决方案的问题等。显然，这些问题非常重要。

线性规划问题是优化问题的代表。线性规划问题在于找到在由多个连续变量的线性和表示的约束条件下使由线性和表示的评估函数最大化或最小化的变量的值，并且线性规划问题用于诸如产品生产计划的各个领域。诸如单纯形法和内点法之类的优秀解法被称为线性规划问题的解法，并且可以有效地求解具有成千上万个变量的问题。

同时，已知其中变量采用离散值而不是连续值的许多优化问题。例如，可能存在旅行推销员问题和背包问题等，在旅行推销员问题中，在依次行进经过多个城市之后回到初始位置的情况下寻找最短路线，背包问题是在将不同物品打包在背包中时寻找使这些值的和最大化的组合。这样的问题称为离散优化问题、组合优化问题等，并且已知难以获得针对这些问题的最优解。

求解离散优化问题困难的最大原因是，由于每个变量仅可以采用离散值，因此可能不会使用在改进评估函数以达到最优解的方向上连续改变变量的方法。此外，除了给出真实最优值(即最优解、全局解)的变量的值外，还有许多局部地给出评估函数的极值(即最小(大)解、局部解)的值。因此，可以利用穷举法可靠地获得最优解，这会导致计算时间延长。离散优化问题具有在计算复杂度理论中称为NP(非确定性多项式)难度问题的许多问题，其中，预期用于寻找最优解的计算时间将随着问题的规模(即变量数量)指数地增加。上述的旅行推销员问题和背包问题也是NP难度问题。

如上所描述的，难以可靠地获得离散优化问题的最优解。因此，针对对于实际使用重要的离散优化问题，已经设计出使用该问题固有的性质的解法。如上所描述的，由于预期许多离散的优化问题需要指数地增加的计算时间来获得精确解，所以大多数实际解法不是最优解法而是近似解法，近似解法可以获得其中评估函数的值接近最优值的解。

关于特定于这些问题的近似解法，还已知可以解决广泛问题以在不使用问题的性质的情况下求解问题的近似解法。这些解法被称为元启发式解法，并且可以包括模拟退火方法(SA方法)、遗传算法、神经网络等。尽管这些方法可能比利用问题的性质的解法更低效，但可以预期，与获得精确解的解法相比，这些方法更快地给出解。

下面将描述模拟退火方法。模拟退火方法是一种蒙特卡洛方法，并且是使用随机数值随机获得解的方法。下面以使待优化的评估函数的值最小化的问题为例进行描述，并且将该评估函数的值称为能量。在最大化的情况下，可以改变评估函数的符号。

从以离散值中的一个代替每个变量的初始状态开始，从当前状态(变量值的组合)中选择接近初始状态的状态(例如，仅一个变量被改变的状态)，并考虑其状态转换。计算针对状态转换的能量变化，并根据值采用状态转换，以随机地确定是改变状态还是保持原始状态而不采用该状态。在将能量下降时的接受概率选择为大于能量上升时的接受概率的情况下，平均而言，在能量降低的方向上发生状态变化，并且可以预期，随着时间的流逝，将发生至更合适的状态的状态转换。最后，有可能获得给出接近最优值的能量的最优解或近似解。在能量确定性地下降时采用它或在能量升高时不采用它的情况下，能量变化将随时间而广泛地单调减少，但是一旦能量变化达到局部解，将不会发生更多变化。如上所描述的，因为离散优化问题具有大量的局部解，所以状态通常被不接近最优值的局部解所捕获。因此，可以随机地做出关于是否采用该状态的确定。

在模拟退火方法中，已经证明，当如下确定状态转换的接受概率时，状态在无穷大的时间限制(迭代次数)下达到最优解。对于伴随状态转换的能量变化值(ΔE)，状态转换的接受概率p由等式(1)表示的以下函数f(x)确定。等式(2)是Metropolis方法。等式(3)是吉布斯(Gibbs)方法。

(等式1)

(等式2)

f_metro(x)＝min(1，e^x) (2)

(等式3)

这里，符号“T”是称为温度值的参数，并且如下改变。即，温度值T与迭代次数t成对数地减小，如下面的等式所表示的。

(等式4)

此处，符号“T₀”是初始温度值，其中根据问题，初始温度值需要足够大。当使用由等式(1)至等式(3)表示的接受概率时，假设状态在充分重复之后达到稳定状态，则相对于热力学中的热平衡状态，每个状态的占有概率都遵循玻耳兹曼分布。另外，由于当温度逐渐从高温降低时低能量状态的占有概率增加，因此当温度充分降低时可以获得低能量状态。这种方法称为模拟退火方法，因为该方法类似于材料退火时的状态变化。此时，能量升高的状态转换的随机发生对应于物理学中的热激发。

在如上所描述的模拟退火方法中，当无限地采用迭代次数时，可以获得最优解，但是实际上，由于需要利用有限迭代次数来获得解，因此可能无法可靠地确定最优解。在以上等式中，由于温度缓慢下降，因此温度在有限时间内没有充分下降。因此，在实际的模拟退火方法中，温度通常比对数温度变化更快地降低。

在例如日本特开专利公开第2017-219948号和日本特开专利公开第2016-051350号中公开了相关技术。

实施方式的一个方面中的目的是提供一种优化装置和该优化装置的控制方法，其中，通过使搜索过程中的状态的能量分布尽可能接近玻尔兹曼(Boltzmann)分布，来确保到最佳解的收敛，并抑制解质量的劣化。

发明内容

根据实施方式的一个方面，优化装置包括：状态保持单元，其保持包括在表示能量的评估函数中的多个状态变量的值；计算单元，其计算响应于多个状态变量的值中的任何值的变化而发生的多个状态转换中的每一个的能量的变化值；温度控制单元，其控制指示温度的温度值；以及转换控制单元，其包括：多个第一选择电路，多个第一选择电路中的每一个基于对预定数量的状态转换中的每一个的接受的适当性从预定数量的状态转换中随机选择中间候选者，该适当性是通过将热激发能量与针对相应状态转换的能量变化进行比较而获得的，热激发能量是使用数量与预定数量相同的独立随机数中的每一个来计算的；以及第二选择电路，其从由多个第一选择电路选择的中间候选者中随机选择一个状态转换。

附图说明

图1是示出根据第一实施方式的转换控制器的示例的图；

图2是示出部分选择器单元的电路配置的示例的图；

图3是示出转换控制器的操作流程的图；

图4是示出根据第二实施方式的转换控制器的示例的图；

图5是示出部分选择器单元的示例的图；

图6是示出选择电路单元的示例(第一部分)的图；

图7是示出选择器的示例的图；

图8是示出选择电路单元的示例(第二部分)的图；

图9是示出第一部分选择器的示例的图；

图10是示出第二部分选择器的示例的图；

图11是示出转换控制器的比较示例的图；

图12是示出由于热噪声的共享而引起的分布偏差的示例的图；

图13是示出关于玻尔兹曼分布的对偏差的改善的示例的图；以及

图14是示出通过模拟退火方法进行的优化装置的概念配置的图。

具体实施方式

图14示出了通过模拟退火方法进行的优化装置的概念配置。在下面的描述中将描述生成多个状态转换候选者的情况，但是基本的模拟退火方法针对每个转换生成一个转换候选者。

优化装置10首先包括状态保持单元11，状态保持单元11保持当前状态S(多个状态变量的值)。优化装置10还包括评估函数计算单元12，当由于多个状态变量的值之一的变化而发生从当前状态S的状态转换时，该评估函数计算单元12计算每个状态转换的能量变化值{ΔEi}。优化装置10还包括控制温度值T的温度控制器13和控制状态变化的转换控制器14。基于温度值T、能量变化值{ΔEi}和随机数值，转换控制器14根据能量变化值{ΔEi}与热激发能量之间的相对关系随机地确定是否接受多个状态转换中的任何一个。优化装置10还包括能量比较单元15，该能量比较单元15识别通过状态转换生成的状态中的最低能量状态S。

一次迭代中的操作如下。首先，转换控制器14生成针对从状态保持单元11中保持的当前状态S到下一状态的状态转换的一个或更多个候选者(候选者编号{Ni})。评估函数计算单元12使用当前状态S和状态转换候选者来计算针对被提及为候选者的每个状态转换的能量变化值{ΔEi}。转换控制器14响应于每个状态转换的能量变化值{ΔEi}，使用由温度控制器13生成的温度值T和由转换控制器14中的随机数生成器生成的概率变量(随机数值)以上述等式(1)至等式(3)的接受概率允许状态转换。然后，转换控制器14输出指示是否接受每个状态转换的转换适当性{fi}(下文中，也称为状态转换的适当性)。当存在多个允许状态转换时，转换控制器14使用随机数值随机地选择允许状态转换之一。然后，转换控制器14输出所选择的状态转换的转换编号N和转换适当性F。当存在多个允许状态转换时，根据所选择的状态转换来更新存储在状态保持单元11中的状态变量的值。

从初始状态开始，温度控制器13在降低温度值时重复上述一次重复，并且在重复次数达到一定数目时或者在满足结束确定条件——诸如能量下降到一定值以下的条件——时结束操作。优化装置10输出的答案是结束的状态。然而，实际上，由于温度值在有限的迭代次数中不会变为0，因此状态的占有即使在最后也具有由玻尔兹曼分布表示的分布等，这不一定是最优值或好的解。因此，保持在迭代期间到目前为止获得的最低能量状态并最终输出该状态是一个现实的解决方案。

这里，到目前为止，尚未描述通过转换控制器14以等式(1)至(3)表示的接受概率允许状态转换的机制，因此将对其进行补充描述。可以通过如下比较器来实现以接受概率p输出1并且以接受概率(1-p)输出0的电路，该比较器具有两个输入a和b，并且当a>b时输出1，当a<b时输出0，在该比较器中，将接受概率p输入至输入a中，将取区间[0,1]的值的均匀随机数输入至输入b中。因此，可以通过将根据能量变化值和温度值T使用等式(1)计算出的接受概率p的值输入至比较器的输入a中来实现上述函数。

也就是说，当符号“f”是在等式(1)中使用的函数并且符号“u”是取区间[0,1]的值的均匀随机数时，上述函数可以在f(ΔE/T)大于u时输出1的电路中实现。

这可以保留原样，但是即使作出以下修改，也可以实现同样的函数。即使将相同的单调递增函数应用于两个数字时，幅度关系也不会改变。因此，即使将相同的单调递增函数应用于比较器的两个输入，比较器的输出也不会改变。当f的反函数f^-1被用作单调递增函数时，当-ΔE/T大于f^-1(u)时或者当ΔE/T等于或小于f^-1(u)时输出1的电路就足够了。此外，由于温度值T为正，所以当-ΔE大于Tf^-1(u)时或者当ΔE等于或小于Tf^-1(u)时输出1的电路就足够了。转换控制器14生成均匀随机数u，并使用将均匀随机数u变换成f^-1(u)的值的变换表来输出f^-1(u)的值。当应用Metropolis方法时，f^-1(u)由以下等式(5)给出。当应用吉布斯方法时，f^-1(u)由以下等式(6)给出。

(等式5)

(等式6)

在上面的描述中，已经说明了可以通过使用基于Metropolis标准等接受状态转换的马尔可夫过程来获得优化装置。然而，获得了如下采样装置，该采样装置通过输出在马尔可夫过程中生成的状态本身来生成根据玻尔兹曼分布的状态。采样装置可以用于计算机器学习等中的期望值。

如上所描述的，转换控制器基于温度值T、能量变化值{ΔEi}以及随机数值，根据能量变化值{ΔEi}与热激发能量之间的相对关系来确定是否接受目标转换。在基本的模拟退火方法中，通过适当的方法从一开始就将转换候选者的数量缩小为一个，然后确定是否接受转换。在这种情况下，当温度变化足够缓慢时，确保在搜索过程中的状态的能量分布渐近于该温度下的玻耳兹曼分布。然而，通过将转换候选者的数量缩小为一个，在一个搜索步骤中找到可接受的转换的概率变得更低，这可能会导致找到好的解需要大量的步骤的问题。

为了更快地获得更好的解，首先，根据以上接受准则随机地确定是否接受多个状态转换中的每一个，并且当存在多个允许状态转换时，选择允许状态转换之一。

此时，可以产生用于随机确定状态转换接受适当性的随机数，以便对于所有状态转换都是独立的。然而，出于对电路规模的限制、操作速度的提高等的目的，转换控制器可以针对多个状态转换候选者共享随机数值并且可以确定是否接受状态转换。在这种情况下，取决于通过转换控制器选择状态转换候选者的方法，每个状态在每个温度下的占有概率可能大大偏离玻尔兹曼分布。结果，可能改变到最优解的收敛并且解的质量可能劣化。

此外，当使用通过在恒定温度下重复状态转换而获得的状态来执行采样时，存在以下可能性：当应用假设玻尔兹曼分布的应用时，由于偏离玻尔兹曼分布，误差可能会变大。

根据以上描述可以理解，可以将使用马尔可夫过程的根据玻尔兹曼分布的优化装置用作采样装置，因此，在下文中，为了简化将描述该优化装置。

另外，不仅上面描述的模拟退火方法，而且对于多个温度同时执行马尔可夫过程状态转换的副本交换方法(也称为交换蒙特卡洛方法)，对于使用马尔可夫过程的优化装置或采样装置是有效的，并且可以照原样应用本公开内容。然而，为了简单起见，将给出模拟退火方法的以下描述。

在下文中，将参照附图描述实施方式。

(第一实施方式)

将描述第一实施方式。

图1是示出根据第一实施方式的转换控制器的示例的图。

转换控制器20根据多个状态变量中的每一个的状态转换的能量变化值{ΔEi}以上面的等式(1)至等式(3)的接受概率来允许状态转换。然后，转换控制器20输出指示是否接受每个状态转换的转换适当性{fi}。当存在多个允许状态转换时，转换控制器20使用随机数值随机选择允许状态转换之一。转换控制器20输出所选择的状态转换的转换编号(称为索引)和转换适当性F。

因此，转换控制器20可以通过对多个状态变量中的每一个进行并行搜索来增加转换概率。例如，当通过N个状态变量的模拟退火方法在优化装置10中的并行搜索期间的状态的转换概率足够小时，该转换变量的转换概率约为具有一个状态变量的转换概率的N倍，如等式(7)和等式(8)所指示的。

(等式7)

(等式8)

其中，符号“N”是状态变量的数量。A(ΔE_i)是第i个变量的转换的接受概率，A(ΔE_i)足够小。符号“P_single”是单独搜索一个状态变量时的转换概率。“P_parallel”是并行搜索N个状态变量时的转换概率。

为了执行并行搜索，转换控制器20具有以下电路配置。作为示例，将利用32个状态变量给出描述。一个状态变量用一比特表示。在这种情况下，状态变量可以被称为“比特”、“旋转比特”等。在该示例中，由于仅一比特被反转作为转换候选者，所以转换候选者的数量是32，其数量与比特的数量相同，并且转换候选者的数量可以与反转比特的数量相同。在下面的描述中，假定转换的数量与反转比特的数量相同。

此外，在该示例中，使用二叉树作为从多个转换候选者中选择一个转换的选择电路。转换控制器20包括热噪声生成电路21、22、23和24、比较电路单元25、26、27和28以及选择器单元30。

热噪声生成电路21将热噪声提供给比较电路单元25。热噪声生成电路22将热噪声提供给比较电路单元26。热噪声生成电路23将热噪声提供给比较电路单元27。热噪声生成电路24将热噪声提供给比较电路单元28。

热噪声对应于上述热激发能量并通过Tf^-1(u)计算。作为Tf^-1(u)，根据应用规则使用等式(5)和等式(6)中的任何一个。从温度控制器13向热噪声生成电路21、22、23和24中的每一个提供共同温度值T作为温度值T。将由随机数生成器(未示出)生成的独立均匀随机数u分别提供给热噪声生成电路21、22、23和24，作为均匀随机数u。在图1的示例中，转换控制器20生成四个独立的随机数。

当多个状态变量中的每一个被转换时，比较电路单元25、26、27和28从评估函数计算单元12接收能量变化值{ΔEi}。比较电路单元25、26、27和28基于{ΔEi}来确定是否接受每个状态转换，并且输出转换适当性{fi}。比较电路单元25、26、27和28中的每一个包括八个(＝32/4)比较器。比较电路单元25、26、27和28中包括的所有比较器的总数为32。

具体地，比较电路单元25包括比较器C0、C1、……、C7。比较电路单元26包括比较器C8、C9、……、C15。比较电路单元27包括比较器C16、C17、……、C23。比较电路单元28包括比较器C24、C25、……、C31。比较器Ci(在图1的示例中，i是0至31的整数)接收ΔE_i，并且根据基于ΔE_i的确定来输出转换适当性fi。在由比较器Ci进行的确定中，将能量变化值ΔE_i与热噪声进行比较。

比较器C0、……、C7共享由热噪声生成电路21生成的热噪声，以确定是否接受状态转换。可以说，热噪声生成电路21使用由与热噪声生成电路21相对应的随机数生成器生成的随机数值u来将相同的热噪声提供给比较器C0、……、C7。

比较器C8、……、C15共享由热噪声生成电路22生成的热噪声，以确定是否接受状态转换。比较器C16、……、C23共享由热噪声生成电路23生成的热噪声，以确定是否接受状态转换。比较器C24、……、C31共享由热噪声生成电路24生成的热噪声，以确定是否接受状态转换。在图1的示例中，一个热噪声(或一个随机数值)被共享用于八个比较器。也可以说，一个热噪声(或一个随机数值)被共享用于八个状态转换或八个能量变化值。

选择器单元30根据热激发能量(热噪声)与能量变化值之间的相对关系来选择并输出多个状态转换候选者之一，其中热激发能量基于随机数值和被共享用于预定数量的能量变化值的温度值。选择器单元30具有执行选择的n级(n是2或更大的整数)选择器树。在图1的示例中，n＝5。

选择器树的第一级包括部分选择器单元30a和30b。选择器树的第二级包括部分选择器单元30c。选择器树的第三级包括部分选择器单元30d。选择器树的第四级包括部分选择器单元30e。选择器树的第五级包括部分选择器单元30f。

部分选择器单元30a、30b、……、30f中的每一个包括例如根据选择随机数来选择并输出两个输入之一的多个选择器。选择器31是多个选择器之一，并且其他选择器与选择器31具有相同的配置。选择器31的两个输入是标识转换编号i和j的标识值N_i和N_j以及转换适当性信息f_i和f_j。选择器31的输出是作为转换适当性信息f_i和f_j的逻辑和而获得的适当性信息f₀以及标识转换编号i或j——无论选择其中哪一个——的标识值N₀。此外，当转换适当性信息f_i和f_j之一为1(可接受)且另一个为0(不可接受)时，总是选择可接受的那一个，当两者均为1时，通过选择信号来选择转换适当性信息f_i和f_j之一。当两者均为0时，选择两者中的任何一个都不要紧。然后，生成并输出通过选择结果选择的转换的标识值N₀。在这种情况下，由第一级选择器生成一比特标识值，每当经过一级，标识值的比特长度都会增加1比特，在最后一级(部分选择器单元30f的选择器)中生成并输出5比特索引。

具体而言，在图1的示例中，由于在第一级处在第一部分选择器单元30a和30b中比较具有以8分隔的编号的转换，因此生成索引的比特3。类似地，在第二级处生成比特4，在第三级处生成比特0，在第四级处生成比特1，在第五级处生成比特2。当输出通过将所生成的比特添加至所选择的转换的标识值而获得的结果时，获得表示最终选择的转换编号的索引。

在图1中缩写除选择器31以外的选择器。图1中由黑圈表示的部分对应于一个选择器。部分选择器单元30a、30b和30c中的每一个包括八个选择器。部分选择器单元30d包括四个选择器。部分选择器单元30e包括两个选择器。

如图1所示，转换控制器20执行对状态转换的并行搜索以及热噪声共享，并使用所有比较器输出的选择器的二叉树结构作为击倒(knockdown)方法(或者也称为竞赛方法)来将状态转换候选者的数量缩小为一个。转换控制器20被布置成使得共享热噪声的候选者在选择器单元30中的n级选择器树的初始级中彼此不接触。在该示例中，第一级和第二级形成第一部分选择器组，该第一部分选择器组使用四个独立的随机数从四个转换候选者中选择一个中间候选者。第三级至第五级形成第二部分选择器，该第二部分选择器从八个中间候选者中选择一个转换。

接下来，将描述其中详细说明部分选择器单元30a中的选择器的电路配置示例。图2是示出部分选择器单元的电路配置的示例的图。部分选择器单元30a包括与选择器31相对应的选择器31a0、31al、……、31a7。

从比较器C0输出的转换适当性(或转换适当性信息)f₀和标识值以及从比较器C8输出的转换适当性f₈和标识值均被输入至选择器31a0。从比较器C1输出的转换适当性f₁和标识值以及从比较器C9输出的转换适当性f9和标识值均被输入至选择器31a1。从比较器C2输出的转换适当性f₂和标识值以及从比较器C10输出的转换适当性f₁₀和标识值均被输入至选择器31a2。从比较器C3输出的转换适当性f₃和标识值以及从比较器C11输出的转换适当性f₁₁和标识值均被输入至选择器31a3。从比较器C4输出的转换适当性f₄和标识值以及从比较器C12输出的转换适当性f₁₂和标识值均被输入至选择器31a4。从比较器C5输出的转换适当性f₅和标识值以及从比较器C13输出的转换适当性f₁₃和标识值均被输入至选择器31a5。从比较器C6输出的转换适当性f₆和标识值以及从比较器C14输出的转换适当性f₁₄和标识值均被输入至选择器31a6。从比较器C7输出的转换适当性f₇和标识值以及从比较器C15输出的转换适当性f₁₅和标识值均被输入至选择器31a7。选择器31a0、……、31a7的输出均被输入至部分选择器单元30c中的八个不同的选择器。

如部分选择器单元30a一样，部分选择器单元30b、……、30f也由对应于选择器31的选择器来实现。具体地，如部分选择器单元30a的八个选择器一样，通过不同的热噪声确定的两个转换适当性被输入至部分选择器单元30b的八个选择器中的每一个。部分选择器单元30a的八个选择器的输出被输入至部分选择器单元30c的八个不同选择器。

由于这个原因，在图1的示例中，共享热噪声的候选者从5级选择器树的第一级到第二级彼此不接触。从5级选择器树的第三级开始，共享热噪声的候选者可以相互接触。

接下来，将描述转换控制器20的操作流程。图3是示出转换控制器的操作流程的图。(S1)转换控制器20接收与多个状态转换中的每个状态转换相对应的能量变化值{ΔEi}。

(S2)转换控制器20根据能量变化值{ΔEi}和热噪声来确定每个状态转换的适当性。此时，热噪声被共享用于预定数量的能量变化值以确定每个状态转换的适当性。

(S3)转换控制器20从可接受的转换候选者中选择要实际采用的一个转换。转换控制器20输出与所选择的状态转换相对应的索引以及转换适当性F。

然后，状态保持单元11基于由转换控制器20选择的一个状态转换来改变由状态保持单元11保持的状态变量的值。评估函数计算单元12计算当前状态转换之后的状态的能量，并将计算出的能量输出至能量比较单元15。另外，评估函数计算单元12计算与多个状态转换中的每一个相对应的能量变化值，并且将计算出的能量变化值输出至转换控制器20。转换控制器20重复执行步骤S1至步骤S3。例如，假设温度变化的次数为N1，并且针对每个温度的状态转换的试验次数为N2，则重复次数为N1*N2。基于由评估函数计算单元12计算出的能量，能量比较单元15保持直到那时在迭代中获得的多个能量中的最低能量以及与该最低能量相对应的状态变量的值，并且在迭代完成时输出最低能量和与该最低能量相对应的状态变量的值作为解。

在步骤S3中，转换控制器20通过第一部分选择器——即，n级选择器树中的第一级至第m级(m是1以上且n以下的整数)的多个第一部分选择器树(多个第一选择电路的示例)中的每一个——从与由不同随机数生成器生成的随机数值相对应的状态转换候选者组中选择一个中间候选者。在图1的示例中，转换控制器20具有从第一级到第二级的八个第一部分选择器树。转换控制器20通过第二部分选择器——即，n级选择器树中的第(m+1)级以及后续级的第二部分选择器树(第二选择电路的示例)——从多个中间候选者中选择一个状态转换。在图1的示例中，转换控制器20具有从第三级至第五级的第二部分选择器树。第一部分选择器树中的每一个选择总共八个中间候选者，并且第二部分选择器树选择八个中间候选者中的一个。以这种方式，转换控制器20防止共享热噪声的候选者在至少第一级(初始级)选择器树中彼此接触。

例如，可以考虑使共享热噪声的候选者在初始级中接触彼此的选择方法。然而，当使用该选择方法时，如稍后将参考图11和图12描述的，每个状态在每个温度下的占有概率大大偏离玻尔兹曼分布，从而导致收敛特性的改变和解质量的劣化。这是因为，由于热噪声的共享，当具有低转换概率的状态变量成为转换候选者时，许多候选者可能从同一个峰(共享热噪声的比较器集合)站立，并且当共享热噪声的候选者在初始状态下彼此接触时，难以选择具有低转换概率的转换候选者。

因此，如上所描述的，转换控制器20使得选择器单元30防止共享热噪声的候选者在n级选择器树的初始级中彼此接触，从而减小每个状态在每个温度下的占有概率与玻尔兹曼分布的偏差。结果，可以通过优化装置10抑制收敛特性的改变和解质量的劣化。

这里，可以将使用马尔可夫过程的根据玻尔兹曼分布的优化装置10用作采样装置。即，可以通过与优化装置10相同的配置来实现采样装置。采样装置以根据状态的能量的概率从状态空间中选择状态并且输出状态。

[第二实施方式]

接下来，将描述第二实施方式。第二实施方式例示了1024个状态变量的使用。随着优化装置10中的状态变量的数量增加，优化装置10可以用于计算更大的优化问题。

图4是示出根据第二实施方式的转换控制器的示例的图。在该示例中，转换控制器40针对16个比较器共享一个热噪声。即，一个随机数值由16个比较器共享。在图4中，一个热噪声生成电路和16个比较器进行组合并且通过诸如“rand0”的字符串“rand”和数值(例如，“0”)的组合缩写。在下文中，将组合一个热噪声生成电路和16个比较器的电路称为“比较块”。转换控制器40具有64个比较块。

转换控制器40具有10级选择器树。10级选择器树包括部分选择器单元50a和部分选择器单元50b。部分选择器单元50a是从第一级到第六级的选择器组。在部分选择器单元50a中，仅独立的热噪声候选者彼此接触。部分选择器单元50b是从第七级到第十级的选择器组。在部分选择器单元50b中，共享的热噪声候选者可以彼此接触。

转换控制器40执行对状态转换的并行搜索以及热噪声共享，并且通过使用选择器的二叉树结构的击倒方法(或竞赛方法)将所有比较器输出缩小为一个。在图4的示例中，省略了选择器的描述。

图5是示出部分选择器单元的示例的图。部分选择器单元50a包括63个选择电路单元。一个选择电路单元包括16个选择器。

部分选择器单元50a在第一级中包括32个选择电路单元51a0、51al、……、51a31。在选择电路单元51a0中，输入比较块rand0的16个转换适当性f₀至f₁₅和比较块rand1的16个转换适当性f₁₆到f₃₁。在选择电路单元51a1中，输入比较块rand2的16个转换适当性f₃₂至f₄₇和比较块rand3的16个转换适当性f₄₈至f₆₃。类似地，来自两个比较块的转换适当性被输入至选择电路单元51a2、……、51a31中的每一个。

部分选择器单元50a在第二级中包括16个选择电路单元52a0、52al、……、52a15。在选择电路单元52a0中，输入来自选择电路单元51a0的16个转换适当性和标识值以及来自选择电路单元51a1的16个转换适当性和标识值。在选择电路单元52a1中，输入来自选择电路单元51a2的16个转换适当性和标识值以及来自选择电路单元51a3的16个转换适当性和标识值。类似地，来自第一级中的两个选择电路单元的转换适当性和标识值被输入至选择电路单元52a2、……、52a15中的每一个。

部分选择器单元50a在第三级包括8个选择电路单元53a0、53a1、……、53a7(在图5中，省略选择电路单元53a2之后的单元)。在选择电路单元53a0中，输入来自选择电路单元52a0的16个转换适当性和标识值以及来自选择电路单元52a1的16个转换适当性和标识值。在选择电路单元53a1中，输入来自选择电路单元52a2的16个转换适当性和标识值以及来自选择电路单元52a3的16个转换适当性和标识值。类似地，来自第二级中的两个选择电路单元的转换适当性和标识值被输入至选择电路单元53a2、……、53a7中的每一个。

部分选择器单元50a在第四级中包括4个选择电路单元54a0、54a1、54a2和54a4(在图5中，省略了选择电路单元54a2和54a4)。在选择电路单元54a0中，输入来自选择电路单元53a0的16个转换适当性和标识值以及来自选择电路单元53a1的16个转换适当性和标识值。在选择电路单元54a1中，输入来自选择电路单元53a2的16个转换适当性和标识值以及来自选择电路单元53a3的16个转换适当性和标识值。类似地，来自第三级中的两个选择电路单元的转换适当性和标识值被输入至选择电路单元54a2和54a3中的每一个。

部分选择器单元50a在第五级中包括2个选择电路单元55a0和55a1。在选择电路单元55a0中，输入来自选择电路单元54a0的16个转换适当性和标识值以及来自选择电路单元54a1的16个转换适当性和标识值。在选择电路单元55a1中，输入来自选择电路单元54a2的16个转换适当性和标识值以及来自选择电路单元54a3的16个转换适当性和标识值。

部分选择器单元50a在第六级中包括一个选择电路单元56a0。在选择电路单元56a0中，输入来自选择电路单元55a0的16个转换适当性和标识值以及来自选择电路单元55a1的16个转换适当性和标识值。

图6是示出选择电路单元的示例(部分1)的图。这里，尽管将描述选择电路单元51a0的电路配置示例，但是选择电路单元51a1、……、51a31也具有相同的电路配置。假设比较块rand0包括比较器C0、C1、……、C15。假设比较块rand1包括比较器C16、C17、……、C31。

选择电路单元51a0包括16个选择器100、100a、……、100n和100o。将来自属于比较块rand0的一个比较器的转换适当性和标识值以及来自属于比较块rand1的一个比较器的转换适当性和标识值输入至选择器100、……、100o中的每一个。

例如，从比较器C0输出的转换适当性f₀和标识值以及从比较器C16输出的转换适当性f₁₆和标识值被输入至选择器100。从比较器C1输出的转换适当性f₁和标识值以及从比较器C17输出的转换适当性f₁₇和标识值被输入至选择器100a。类似地，从使用不同的热噪声的两个比较器输出的两个转换适当性和标识值也被输入至选择器100b、……、100o。

以这种方式，对于部分选择器单元50a的第一级选择电路单元51a0、……、51a31的选择器，仅使得独立的热噪声候选者能够彼此接触。图7是示出选择器的示例的图。

这里，例示了选择器100。然而，其他选择器具有与选择器100的配置相同的配置。选择器100接收两个输入。所述输入是指示转换适当性f_i和标识值N_i的集合以及转换适当性f_j和标识值N_j的集合的两个信号。选择器100还接收候选者选择随机数。选择器100基于候选者选择随机数来选择转换适当性f_i和f_j之一，并且输出表示所选择的一个转换适当性的转换适当性f₀以及与所选择的转换适当性相对应的标识值N₀。当转换适当性f_i和f_j中的仅一个指示转换是可能的时，选择器100优先选择转换是可能的转换适当性。选择器100的选择方法与上面描述的选择器31的选择方法相同。

图8是示出选择电路单元的示例(部分2)的图。这里，尽管将描述选择电路单元52a0的电路配置示例，但是选择电路单元52a1、……、56a0也具有相同的电路配置。选择电路单元52a0包括16个选择器200、200a、……、200n和200o。从选择电路单元51a0输出的16个转换适当性和标识值中的一个以及从选择电路单元51a1输出的16个转换适当性和标识值中的一个被输入至选择器200、……、200o中的每一个。以这种方式，对于部分选择器单元50a的第二级及后续级的选择电路单元的选择器，仅使得独立的热噪声候选者能够彼此接触。

根据转换控制器40中的选择器单元50的电路配置，可以说转换控制器40具有以下16个第一部分选择器树。图9是示出第一部分选择器的示例的图。

转换控制器40具有16个第一部分选择器树T0、T1、……、T15。第一部分选择器树T1、……、T15是多个第一选择电路的示例。尽管以下描述集中于第一部分选择器树T0，但是第一部分选择器树T1、……、T15也与第一部分选择器树T0具有相同的选择器配置。连接至第一部分选择器树T0的比较器C0、C16、C32、C48、……、C1008(64个比较器)属于不同的比较块(比较块rand0、……、rand63)。

第一部分选择器树T0包括：第一级选择器100、101、……、131，第二级选择器200、201、……、215，第三级选择器300、301、……、307(未示出选择器307)，第四级选择器400、401、……、403(未示出选择器403)，第五级选择器500和501以及第六级选择器600。

从比较器C0输出的转换适当性f₀和标识值以及从比较器C16输出的转换适当性f₁₆和标识值被输入至选择器100。从比较器C32输出的转换适当性f₃₂和标识值以及从比较器C48输出的转换适当性f₄₈和标识值被输入至选择器101。从比较器C64输出的转换适当性f₆₄和标识值以及从比较器C80输出的转换适当性f₈₀和标识值被输入至选择器102。类似地，通过独立热噪声确定的候选者被输入至第一级选择器103、……、131。选择器100、……、131的数量为32。

由选择器100选择的转换适当性和标识值以及由选择器101选择的转换适当性和标识值被输入至选择器200。由选择器102选择的转换适当性和标识值以及由选择器103选择的转换适当性和标识值被输入至选择器201。由选择器104选择的转换适当性和标识值以及由选择器105选择的转换适当性和标识值被输入至选择器202。类似地，通过独立热噪声确定的候选者的缩小结果被输入至第二级选择器203、……、215。选择器200、……、215的数量为16。

由选择器200选择的转换适当性和标识值以及由选择器201选择的转换适当性和标识值被输入至选择器300。由选择器202选择的转换适当性和标识值以及由选择器203选择的转换适当性和标识值被输入至选择器301。类似地，通过独立热噪声确定的候选者的缩小结果被输入至第三级选择器302、……、307。选择器300、……、307的数量为8。

由选择器300选择的转换适当性和标识值以及由选择器301选择的转换适当性和标识值被输入至选择器400。由选择器302选择的转换适当性和标识值以及由选择器303选择的转换适当性和标识值被输入至选择器401。类似地，通过独立热噪声确定的候选者的缩小结果被输入至第四级选择器402和403。选择器400、401、402和403的数量是4。

由选择器400选择的转换适当性和标识值以及由选择器401选择的转换适当性和标识值被输入至选择器500。由选择器402选择的转换适当性和标识值以及由选择器403选择的转换适当性和标识值被输入至选择器501。

由选择器500选择的转换适当性和标识值以及由选择器501选择的转换适当性和标识值被输入至选择器600。选择器600从两个输入中选择一个中间候选者，并输出所选择的中间候选者。

根据第一部分选择器树T0、T1、……、T15，输出16个中间候选者作为通过独立热噪声确定的候选者的缩小结果。通过部分选择器单元50b中的第二部分选择器树将16个中间候选者缩小为一个候选者。

图10是示出第二部分选择器的示例的图。部分选择器单元50b包括第二部分选择器树T20。第二部分选择器树T20是第二选择电路的示例。这里，将第二部分选择器树T20中的选择器的级的数量描述为第一部分选择器树T0、……、T15中的第六级之后的级的数量。

第二部分选择器树T20包括：第七级选择器700、701、……、707，第八级选择器800、801、802和803，第九级选择器900和901以及第十级选择器1000。

由属于选择电路单元56a0的两个选择器输出的两个中间候选者被输入至选择器700、……、707中的每一个。由前级两个选择器选择的两个中间候选者被输入至选择器800、801、802和803中的每一个。例如，由前级选择器700选择的中间候选者和由前级选择器701选择的中间候选者被输入至选择器800。

由前级两个选择器输出的两个中间候选者被输入至选择器900和901中的每一个。例如，由前级选择器800选择的中间候选者和由前级选择器801选择的中间候选者被输入至选择器900。

由选择器900选择的中间候选者和由选择器901选择的中间候选者被输入至选择器1000。选择器1000从两个中间候选者中选择一个状态转换并输出所选择的一个状态转换。

在第二部分选择器树T20的每个选择器中，共享热噪声并且具有确定的转换适当性的候选者可以彼此接触。属于选择器单元50的选择器中的每一个生成并输出一比特的标识值，该一比特的标识值标识所选择的状态变量以及转换适当性f_i的生成和标识值的选择。因此，每当经过一级，标识值的比特长度就增加1比特，并且在最后一级(选择器1000)中生成并输出10比特的索引。

如上所描述的，转换控制器40防止共享热噪声的候选者在选择器树的至少第一级(初始级)中彼此接触。这里，例如，也可以如下考虑使共享热噪声的候选者在初始级中彼此接触的选择方法。

图11是示出转换控制器的比较示例的图。在比较示例中，如在第二实施方式中一样，假定状态变量的数量为1024，并且热噪声被16个比较器共享。比较示例的转换控制器包括选择器单元90。在选择器单元90的选择器树中，在从第一级至第四级的选择器中，共享热噪声并且具有确定的转换适当性的候选者彼此接触。然而，在这种情况下，如以下将详细描述的，每个状态在每个温度下的占有概率大大偏离玻尔兹曼分布，并且解质量劣化。

图12是示出由于热噪声的共享而引起的分布的偏差的示例的图。曲线图G10表示由于热噪声的共享而引起的与玻尔兹曼分布的偏差。曲线图G10的水平轴表示温度。曲线图G10的纵轴表示能量(平均能量)。

系列G11表示不共享热噪声时的温度与能量之间的关系。可以说系列G11是当每个状态在每个温度下的占有概率遵循玻尔兹曼分布时的温度与能量之间的关系。

系列G12表示当共享热噪声时的温度与能量之间的关系，系列G12对应于图11的比较示例。根据系列G12，可以看出，热噪声的共享使得可能状态的平均能量远低于针对玻尔兹曼分布所预期的平均能量。因此，当没有根据玻尔兹曼分布生成由多个状态变量表示的状态时，由优化装置10获得的解的质量劣化。可替选地，可以说解的可靠性降低了，因为没有根据解推导所依赖的分布(即，玻耳兹曼分布)生成状态。

可以如下考虑由于热噪声的共享而引起的与玻耳兹曼分布偏离的原因。由于热噪声的共享，因此当具有低转换概率的状态变量成为转换候选者时，许多候选者可能从同一个峰(共享热噪声的比较器集合)站立。出于这种原因，当共享热噪声的候选者在初始状态下彼此接触时，难以选择具有低转换概率的转换候选者，并且转换候选者的转换之后的状态的占有概率偏离玻尔兹曼分布。

因此，如上所描述的，在选择器单元50中，转换控制器40使不共享热噪声的候选者在n级选择器树的初始级中彼此接触，并使共享热噪声的候选者彼此接触。

图13是示出改善与玻耳兹曼分布的偏差的示例的图。曲线图G20表示在第二实施方式中改善与玻耳兹曼分布的偏差的示例。曲线图G20的水平轴表示温度。曲线图G20的纵轴表示能量(平均能量)。

曲线图G20包括图12所示的系列G11和系列G12。系列G21指示当独立热噪声的候选者仅在初始级(第一级)中相互接触时的温度与平均能量之间的关系。系列G22指示当独立热噪声候选者从第一级到第二级相互接触时的温度与平均能量之间的关系。系列G23指示当独立热噪声的候选者从第一级到第三级相互接触时的温度与平均能量之间的关系。系列G24指示当独立热噪声的候选者从第一级到第四级相互接触时的温度与平均能量之间的关系。

根据系列G21，仅通过使独立热噪声的候选者在第一级中彼此接触，与玻尔兹曼分布的偏差与系列G12的与玻尔兹曼分布的偏差相比减小得更多。此外，随着第二级、第三级、第四级以及第一级的级的数量的增加，并且初始级不使公共热噪声的候选者彼此接触，极大地改善与玻耳兹曼分布的偏差。在该示例的情况下，通过将不使公共热噪声的候选者彼此接触的初始级的级数设置为4或更大，将与玻尔兹曼分布的偏差提高到1/10或更小。因此，通过减小与玻耳兹曼分布的偏差，可以抑制收敛特性的改变和解质量的劣化。另外，可以抑制解的可靠性的降低。

例如，可以考虑针对2^k(k为1或更大的整数)能量变化值(或比较器)共享热噪声(或随机数值)的情况。在这种情况下，在n级选择器树中，使独立热噪声的候选者从第一级至第(n-k)级彼此接触，并且使公共热噪声的候选者彼此不接触。结果，可以使从同一个峰站立的候选者(公共热噪声的候选者)之间的接触的可能性最小化，这可以导致与玻尔兹曼分布的偏离的最大改善效果。

在以上示例中，选择和输出两个输入之一的选择器被例示为用于转换控制器20和40的选择器，但是其可以是选择和输出三个或更多个输入之一的选择器。同样，在这种情况下，通过由选择器使独立热噪声的候选者至少在选择器树的第一级中彼此接触，可以抑制收敛特性的改变和解质量的劣化。例如，使用选择并输出q(q是3或更大的整数)个输入之一的选择器，可以针对q^k个能量变化值共享热噪声(或随机数值)。此外，在这种情况下，在n级选择器树中，使独立热噪声的候选者从第一级至第(n-k)级彼此接触，而不使公共热噪声的候选者彼此接触。

在第一实施方式和第二实施方式中，第一部分选择器和第二部分选择器中的每一个被布置为二叉树。然而，只要配置方法可以随机且可靠地选择可接受的转换候选者之一并输出其转换编号，则可以利用其他配置方法获得相同的效果。

此外，不仅可以使用温度缓慢降低的模拟退火方法，还可以使用搜索多个温度的副本交换方法，来将本公开内容用于优化装置和采样装置。

根据实施方式，通过使搜索过程中的状态的能量分布足够接近理论上期望的玻耳兹曼分布，可以确保到最优解的收敛并且可以抑制解质量的劣化。随着与玻耳兹曼分布的偏差的减小，收敛特性的理论分析、仿真、与非平行情况相比的检查等可以变得更容易。在到采样的应用中，可以通过利用恒定温度值进行解搜索来获得更接近玻尔兹曼分布的解。

Claims

1.一种优化装置，包括：

状态保持单元，其保持包括在表示能量的评估函数中的多个状态变量的值；

计算单元，其计算响应于所述多个状态变量的值中的任何值的变化而发生的多个状态转换中的每一个的能量的变化值；

温度控制单元，其控制指示温度的温度值；以及

转换控制单元，其包括：

多个第一选择电路，每个第一选择电路基于对预定数量的状态转换中的每一个的接受的适当性从所述预定数量的状态转换中随机选择中间候选者，所述适当性是通过将热激发能量与针对相应状态转换的能量变化进行比较而获得的，所述热激发能量是使用数量与所述预定数量相同的独立随机数中的每一个来计算的；以及

第二选择电路，其从由所述多个第一选择电路选择的中间候选者中随机选择一个状态转换。

2.根据权利要求1所述的优化装置，其中：

所述多个第一选择电路由被布置为二叉树的第一部分选择器树形成，以及

所述第二选择电路由被布置为二叉树的第二部分选择器树形成。

3.根据权利要求2所述的优化装置，其中：

所述第一部分选择器树包括多个选择器，所述多个选择器中的每一个根据选择随机数来选择并输出两个输入之一，以及

所述第二部分选择器树包括选择器中的一个或更多个选择器。

4.根据权利要求1所述的优化装置，其中：

所述状态保持单元基于由所述转换控制单元选择的所述一个状态转换来改变所述多个状态变量的值之一。

5.根据权利要求1所述的优化装置，还包括：

能量比较单元，其输出与由所述计算单元计算的多个能量中的最低能量相对应的所述多个状态变量的值。

6.一种根据权利要求1所述的优化装置的控制方法，所述控制方法包括：

通过状态保持单元保持包括在表示能量的评估函数中的多个状态变量的值；

通过计算单元计算响应于所述多个状态变量的值中的任何值的变化而发生的多个状态转换中的每一个的能量的变化值；

通过温度控制单元控制指示温度的温度值；

通过多个第一选择电路中的每一个基于对预定数量的状态转换中的每一个的接受的适当性从所述预定数量的状态转换中随机选择中间候选者，所述适当性是通过将热激发能量与针对相应状态转换的能量变化进行比较而获得的，所述热激发能量是使用数量与所述预定数量相同的独立随机数中的每一个来计算的；以及

通过第二选择电路从由所述多个第一选择电路选择的中间候选者中随机选择一个状态转换。