WO2017037859A1 - 情報処理装置及び方法 - Google Patents

情報処理装置及び方法 Download PDF

Info

Publication number
WO2017037859A1
WO2017037859A1 PCT/JP2015/074813 JP2015074813W WO2017037859A1 WO 2017037859 A1 WO2017037859 A1 WO 2017037859A1 JP 2015074813 W JP2015074813 W JP 2015074813W WO 2017037859 A1 WO2017037859 A1 WO 2017037859A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
similarity
unit
interaction model
information processing
Prior art date
Application number
PCT/JP2015/074813
Other languages
English (en)
French (fr)
Inventor
泰幸 工藤
地尋 吉村
真人 林
純一 宮越
加藤 猛
水野 弘之
Original Assignee
株式会社日立製作所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社日立製作所 filed Critical 株式会社日立製作所
Priority to PCT/JP2015/074813 priority Critical patent/WO2017037859A1/ja
Priority to JP2017537115A priority patent/JP6629864B2/ja
Publication of WO2017037859A1 publication Critical patent/WO2017037859A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N99/00Subject matter not provided for in other groups of this subclass

Definitions

  • the present invention relates to an information processing apparatus and method and, for example, is applied to an information processing apparatus that obtains solutions of problems that are input continuously and that changes every moment by searching for the ground state of an interaction model. Is preferred.
  • Patent Document 1 proposes an apparatus using a laser as means for realizing the calculation.
  • Patent Document 2 there is a method disclosed in Patent Document 2 as a method for facilitating the manufacture of a computing device. This method realizes a device for obtaining the ground state of the Ising model using a CMOS (Complementary Metal-Oxide-Semiconductor) integrated circuit.
  • CMOS Complementary Metal-Oxide-Semiconductor
  • Patent Document 1 and Patent Document 2 do not consider efficient ground state search in such a case, that is, improvement in follow-up of a solution.
  • the present invention has been made in consideration of the above points, and intends to propose an information processing apparatus and method capable of improving the follow-up ability of a solution to an ever-changing problem and shortening the convergence time of the solution. It is.
  • the problem conversion unit for generating coefficient data representing the value of the coefficient that determines the strength of the interaction between the elements constituting the action model, A similarity analysis unit that generates similarity data representing similarity between the preceding and following problems, and an initial state of the interaction model are determined, and setting data for setting the interaction model in the determined initial state
  • a setting data generation unit to be generated and an operation for simulating the interaction between the elements in the interaction model and searching for a ground state of the interaction model
  • An arithmetic unit, and the setting data generation unit indicates that the state of the interaction model should be reset when the similarity between the previous problem and the current problem is equal to or less than a predetermined threshold
  • an information processing method executed in an information processing apparatus for obtaining a solution of a problem that is continuously input and changes from time to time, wherein the information processing apparatus includes each element in the interaction model.
  • An operation unit that performs an operation for simulating the interaction between them and searching for a ground state of the interaction model, and configures the interaction model when the input problem is mapped to a predetermined interaction model
  • a third step in which the calculation unit starts the calculation from an initial state corresponding to the setting data.
  • the previous problem and the current time are provided. If the similarity of the problem is less than or equal to a predetermined threshold, the setting data indicating that the state of the interaction model should be reset is generated. If the similarity is greater than the threshold, Generating the setting data indicating that the state of the interaction model is not reset, and in the fourth step, the value indicating that the value of the setting data is to reset the state of the interaction model in the fourth step If it is, the state of each element given from the problem converter is set to the initial state of the interaction model, and the value of the setting data resets the state of the interaction model. When the a value indicating that no bets were the state of each said element immediately before as the initial state of the interaction model for the current problem.
  • FIG. 1st Embodiment It is a block diagram which shows the structure of the information processing system by 1st Embodiment.
  • (A)-(G) are timing charts for explaining the configuration and operation of the information processing apparatus of FIG.
  • (A)-(G) are timing charts for explaining application examples.
  • (A)-(G) are timing charts for explaining application examples.
  • a feature of the information processing system is that the similarity of problems input continuously is analyzed, and the initial setting of the Ising model is adjusted according to the analysis result. For example, if the degree of similarity when the problem changes is high, the search for a solution is started by setting the immediately preceding spin value as the initial value without performing the reset operation and setting the system temperature lower than that at the time of reset. Thereby, the convergence time of a solution can be shortened.
  • FIG. 1 shows an information processing system 1 according to this embodiment.
  • the information processing system 1 includes an information processing device 2 that executes arithmetic processing for finding a solution to an optimization problem by searching for a ground state of an Ising model, a problem output device 3 that gives a problem to the information processing device 2, and information And a result output device 4 for displaying the solution of the problem obtained by the processing device 2.
  • the problem output device 3 is an interface for providing a problem to the information processing device 2, and problem data (problem data) based on user settings, sensor data output from sensors, information obtained from the Internet, or the like. And the generated problem data is output to the information processing apparatus 2.
  • the problem output device 3 uses the distance specified by the user for the former and the travel distance obtained from the map information for the latter.
  • the problem data is generated by calculating the movement cost based on the above.
  • traffic information such as VICS (registered trademark) (Vehicle Information and Communication System) in the travel cost, it is possible to generate a problem that changes from moment to moment.
  • FIG. 2A shows the output timing of the problem data to the information processing apparatus by the problem output apparatus.
  • the entire operation includes a set period (time t0 to time t1, time t2 to time t3, time t4 to time t5, time t6 to time t7, time t8 to time t9) and a calculation period (time t1 to time t2,
  • Each of the problem data (A1, A2, A3, B1, B2) is stored in the calculation unit in different set periods.
  • the cycle is composed of a cycle of time t3 to time t4, time t5 to time t6, and time t7 to time t8). Is output.
  • the problem data changes from moment to moment, and in FIG. 2, the same alphabetic characters mean data having a high degree of similarity.
  • the information processing apparatus 2 includes a problem conversion unit 10, a similarity analysis unit 11, a spin setting unit 12, an annealing setting unit 13, a calculation unit 14, and a calculation result acquisition unit 15.
  • the problem conversion unit 10 maps the problem data given from the problem output device 3 to the Ising model, and the coefficient data (a1, a2, a3, b1, b2, b3) shown in FIG. Is output to the calculation unit 14 during the set period.
  • mapping means converting a cost function of a problem to be optimized into an energy function form. By this conversion, the value of each coefficient (interaction coefficient and external magnetic field coefficient of each spin) of the Ising model is calculated.
  • mapping factorization is a well-known technique.
  • the similarity analysis unit 11 analyzes the similarity of the coefficient data by comparing the coefficient data of the previous cycle and the current coefficient data, and uses the result as the similarity data, and the spin setting unit 12 and annealing. Output to the setting unit 13.
  • a specific analysis method of the similarity between coefficient data for example, the number of spins whose values of interaction coefficient and external magnetic field coefficient have changed is counted, and the similarity is calculated from the ratio of the count value to the total number of spins Can be used.
  • the similarity data is also output in the set period like the other data.
  • similarity data “60” from time t2 to time t3 is similarity data obtained as a result of comparing coefficient data “a1” and coefficient data “a2”.
  • the similarity data “5” from time t6 to time t7 is similarity data obtained as a result of comparing the coefficient data “a3” with the coefficient data “b1”.
  • the value of the similarity data is normalized in the range of 0 to 100, and the similarity data becomes closer to 0 as the similarity between the coefficient data of the previous cycle and the current coefficient data is lower, and the similarity The higher the degree, the closer the similarity data is to 100.
  • the spin setting unit 12 compares the similarity data given from the similarity analysis unit 11 with a first threshold value set in advance. When the similarity data is larger than the first threshold value, a value indicating reset (“1 2) When the similarity data is equal to or lower than the first threshold value, spin setting data as shown in FIG. 2D, which is a value indicating non-reset (“0”), is generated, and the generated spin setting data is calculated. 14 for output.
  • FIG. 2D shows an example in which the threshold value is “50”.
  • the annealing setting unit 13 generates annealing data as shown in FIG. 2E for determining the annealing schedule based on the similarity data, and outputs the generated annealing data to the calculation unit.
  • the type of annealing data is temperature in the case of classical annealing and transverse magnetic field strength in the case of quantum annealing.
  • the annealing data is set by comparison with a preset second threshold value, similar to the spin setting data.
  • a preset second threshold value similar to the spin setting data.
  • the value of the similarity data when the value of the similarity data is equal to or less than the second threshold value, the value is set to a value indicating “start from high temperature” (time t0 to time t1, time t6 to time t7), and the value of the similarity data is When the value is larger than the threshold value, a value indicating “start from low temperature” is set (time t2 to time t3, time t4 to time t5, time t8 to time t9).
  • FIG. 2E shows an example in which two types of temperature schedules are generated by setting the second threshold value to “50”. As shown in FIG. 2E, the temperature schedule is set such that the start temperature is maintained during the set period and cooling gradually proceeds during the calculation period.
  • the calculation unit 14 is composed of, for example, a circuit that simulates the spin operation. As a specific example of the calculation unit 14, for example, a semiconductor device described in Patent Document 2 can be applied.
  • the calculation unit 14 executes the ground state search of the Ising model in the calculation period, and outputs the spin state obtained in the process as the spin arrangement data in the next set period.
  • the initial state of the spin array is controlled by the spin setting data. If the value of the spin setting data is a value indicating “reset”, the spin arrangement given from the problem conversion unit 10 is set.
  • the spin array in the initial state is, for example, a spin array randomly generated with random numbers, and may be data output from the problem output device 3 or data generated in the problem conversion unit 10. . If the value of the spin setting data represents “non-reset”, the immediately preceding spin array (the Ising model ground state for the previous problem) is used as it is. Further, the interaction coefficient between spins and the external magnetic field coefficient are set in accordance with coefficient data given from the problem conversion unit 10.
  • the calculation unit 14 controls the spin fluctuation (for example, the inversion probability of the spin value (+1, ⁇ 1)) required when searching the ground state of the Ising model based on the annealing data. If the annealing data is “start from high temperature”, the search is started from a state where the spin fluctuation is large, and if it is “start from low temperature”, the search is started from a state where the fluctuation is small.
  • the spin fluctuation for example, the inversion probability of the spin value (+1, ⁇ 1)
  • spin array data described as “R” means a random array
  • spin arrays described as “s1” to “s4” mean arrays obtained by ground state search.
  • means a change in spin arrangement.
  • the calculation result acquisition unit 15 acquires the spin array data output from the calculation unit 14 at the time of convergence of the ground state search of the Ising model, in other words, at the end of the calculation period, and the acquired spin array data is shown in FIG. It converts into calculation result data (S1, S2, S3,%) As shown and outputs it.
  • the conversion method to the calculation result data differs depending on the problem. For example, in the case of a traveling salesman, conversion can be performed by following the spins in the same direction in order.
  • the result output device 4 is an interface for outputting operation result data according to the use. Possible applications include, for example, presenting results to the user via a monitor and realizing feedback control by output to the system.
  • the similarity of continuously input problems is analyzed as the similarity between coefficient data, and the similarity of coefficient data when the problem changes is high.
  • the solution search is started by setting the immediately preceding spin value as the initial value without performing the reset operation, and setting the system temperature lower than that at the time of resetting.
  • the information processing system 1 it can be expected that the solution of the next problem similar to the previous problem can be obtained in a shorter time compared with the case where the search of the ground state is started from the reset state. It is possible to improve the follow-up ability of the solution to the problem that changes every moment, and to shorten the convergence time of the solution.
  • the calculation period in each cycle has the same length.
  • the next problem having a high similarity to the previous problem is shown.
  • the calculation period for example, time t3 ′ to time t4 ′, time t5 ′ to time t6 ′, time t9 ′ to time t10 ′
  • arbitration processing with the problem output device 3 is required.
  • a method of predicting the convergence time of the solution search based on the similarity data and sending this information to the problem output device 3 to determine the timing at which the next problem data is output can be considered.
  • the timing at which the next problem data is output may be determined.
  • a plurality of second threshold values for similarity data in the annealing setting unit 13 are provided, and “start from high temperature”, “start from medium temperature” It is also effective to diversify the temperature scheduling such as “start” and “start from low temperature” (see FIG. 4E) and to control the calculation period more finely according to the set value of the annealing data.
  • FIG. 5 in which the same reference numerals are assigned to corresponding parts to FIG. 1 shows an information processing system 20 according to the second embodiment that can perform such similarity analysis.
  • the information processing system 20 is different in the configuration of the similarity analysis unit 22 of the information processing device 21 and the point that the problem data output from the problem output device 3 is also given to the similarity analysis unit of the information processing device 21.
  • the configuration is the same as that of the information processing system 1 according to the first embodiment.
  • the similarity analysis unit 22 of the present embodiment is one based on the coefficient data given from the problem conversion unit 10 as in the similarity analysis unit 11 (FIG. 1) of the first embodiment.
  • the coefficient data of the previous cycle is compared with the current coefficient data, and the similarity is calculated.
  • the similarity analysis unit 22 compares the problem data of the previous cycle with the current problem data based on the problem data given from the problem output device 3, and also compares the similarity.
  • the feature quantity of the problem data As a method for efficiently analyzing the similarity of the problem data, it is conceivable to extract the feature quantity of the problem data and compare the feature quantity data. For example, in the case where the problem data is an image, it is possible to use the color, brightness, contour, shape, eigenvalue, etc. as the feature amount. It should be noted that it is desirable to extract a plurality of feature amounts, and the similarity of each feature amount data is analyzed using the data change rate, etc., and the sum is multiplied by an appropriate weight to calculate the total similarity. It becomes possible.
  • the similarity analysis unit 22 calculates the similarity between the problem of the previous cycle and the current problem based on the similarity of the coefficient data and the similarity of the problem data.
  • a method for calculating the similarity for example, a method of calculating by combining the similarity of coefficient data and the similarity of problem data by multiplying them by appropriate weights can be applied.
  • the similarity analysis unit 22 outputs the calculation result thus obtained to the spin setting unit 12 and the annealing setting unit 13 as similarity data.
  • the accuracy of problem similarity analysis can be improved as compared with the information processing system 1 of the first embodiment.
  • the convergence time of the solution can be further shortened.
  • the value of similarity data is used as a criterion. Furthermore, the method for predicting the calculation time based on the value of the similarity data is also mentioned. However, depending on the problem, there may be cases where it is difficult to properly grasp the judgment criteria in advance, and in such a case, the intended effect may not be sufficiently obtained. Therefore, in this embodiment, the judgment criterion is optimized by learning the log data.
  • FIG. 6 in which the same reference numerals are assigned to corresponding parts to FIG. 1 shows an information processing system 30 according to this embodiment.
  • This information processing system 30 is different from the configuration of the problem output device 31 and the configuration of the spin setting unit 33 and the annealing setting unit 34 of the information processing device 32 in that the information processing device 32 includes an operation time setting unit 35, a convergence rate.
  • the configuration is the same as the information processing system 1 of the first embodiment except that the estimation unit 36 and the log collection unit 37 are provided.
  • the calculation time setting unit 35 generates calculation time data for setting the calculation time (calculation period) of one problem in the calculation unit 14 based on the similarity data output from the similarity analysis unit 11. Then, the generated calculation time data is output to the problem output device 31 and the log collection unit 37.
  • the calculation time data is, for example, a numerical value calculated using a function that shortens the calculation time as the similarity is higher.
  • the problem output apparatus 31 stores problem data according to the calculation time data given from the calculation time setting unit 35. It has an arbitration function that determines the output timing. Specifically, the problem output device 31 outputs the previous problem data until the current problem data is output as the value of the calculation time data increases as the value of the calculation time data increases. The problem data is output to the problem conversion unit 10 at such a timing that the time becomes long (that is, the calculation time in the calculation unit 14 is extended).
  • the log collection unit 37 is configured to include a storage device such as a memory or a hard disk device, for example, and has a function of collecting and holding various types of information related to past processing in the information processing device 32.
  • the log collection unit 37 includes at least coefficient data output from the problem conversion unit 10, similarity data output from the similarity analysis unit 11, spin array data output from the spin setting unit 33, The calculation time data output from the calculation time setting unit 35 is collected for each problem, and the collected data is held.
  • the convergence rate estimation unit 36 includes similarity data representing the similarity between the coefficient data of the previous cycle given from the similarity analysis unit 11 and the current coefficient data, and past processing held by the log collection unit 37. Based on the coefficient data, similarity data, spin array data, and calculation time data acquired at this time, the convergence rate of the calculation executed by the calculation unit 14 in the next calculation period is estimated.
  • the convergence rate estimation unit 36 includes an energy calculation unit 40, a convergence rate calculation unit 41, a convergence rate learning unit 42, and a setting correction unit 43. . Further, the convergence rate estimation unit 36 has a learning mode and a practice mode as operation modes. In the learning mode, only the energy calculating unit 40, the convergence rate calculating unit 41, and the convergence rate learning unit 42 operate as shown in FIG. 7, and in the practical mode, the convergence rate learning unit 42 and the convergence rate learning unit 42 as shown in FIG. Only the setting correction unit 43 operates. That is, in FIG.7 and FIG.8, the site
  • the learning mode is an operation mode in which the relationship between the similarity between the coefficient data of the previous cycle and the current coefficient data and the calculation rate in the calculation unit 14 is learned based on the past operation results.
  • the energy calculation unit 40 calculates the Hamiltonian from the past coefficient data and spin array data held by the log collection unit 37, and calculates the convergence rate as the energy data. Output to the unit 41. Then, the convergence rate calculation unit 41 analyzes the convergence rate from the energy data, and outputs the result to the convergence rate learning unit 42 as convergence rate data.
  • a calculation method of the convergence rate data for example, a method of calculating using a function in which the convergence rate is higher as the energy data is closer to 0 can be applied.
  • the convergence rate learning unit 42 uses the corresponding similarity data and calculation time data held by the log collection unit 37 as input data, and uses the convergence rate data given from the convergence rate calculation unit 41 as teacher data, and uses the similarity and calculation time. Study the relationship with convergence rate. There are several methods for learning the relationship, and one example is a neural network. Note that it is desirable to periodically execute the learning mode because the contents of the log change.
  • the practice mode is an operation mode for predicting the convergence rate of the computation of the computation unit for the current problem based on the current similarity data and computation time data.
  • the convergence rate estimation unit 36 outputs the similarity data regarding the problem to be solved currently output from the similarity analysis unit 11 (FIG. 6) and the calculation time setting unit 35 (FIG. 6).
  • the calculation time data is given to the convergence rate learning unit 42.
  • the convergence rate learning unit 42 Based on these data, the convergence rate learning unit 42 generates convergence rate data representing the convergence rate of the calculation unit 14 for the current problem, and outputs the generated convergence rate data to the setting correction unit 43.
  • the setting correction unit 43 analyzes the convergence rate data. For example, when the value of the convergence rate data is equal to or less than a third threshold set in advance for the convergence rate data, the setting correction unit 43 guides the convergence rate in a direction to improve.
  • the correction data is generated, and the generated correction data is output to the calculation time setting unit 35, the spin setting unit 33, and the annealing setting unit 34 as shown in FIG.
  • the calculation time setting unit 35, the spin setting unit 33, and the annealing setting unit 34 each have a function of modifying a rule relating to current data generation based on the correction data. Specifically, when such correction data is given, the calculation time setting unit 35 generates calculation time data that extends the calculation period by a time corresponding to the correction data (that is, sets the value of the calculation time data to a large value). . Further, the spin setting unit 33 lowers the first threshold value so as to promote the reset in the calculation unit 14, and the annealing setting unit 34 sets the second threshold value so as to increase the starting temperature in the calculation unit 14. Increase the value.
  • the information processing system 30 of the present embodiment having the above configuration, it is possible to analyze the similarity of problems input continuously and adjust the initial setting of the Ising model according to the analysis result. Further, according to the information processing system 30, since the adjustment accuracy of the initial setting can be improved as compared with the information processing system 1 (FIG. 1) of the first embodiment, the efficiency of the solution is further improved and the solution is further solved. The convergence time can be shortened.
  • the spin setting data and the annealing data given to the arithmetic unit 14 are one type. However, if the spin setting data and the annealing data are multiplexed and the magnitude of the spin arrangement and the fluctuation of the spin can be set in the area unit or the spin unit in the calculation unit 14, a more efficient search of the ground state becomes possible. .
  • FIG. 10 in which the same reference numerals are assigned to the parts corresponding to those in FIG. 1, shows the present embodiment in which the calculation unit 62 of the information processing device 61 can set the spin arrangement and the fluctuation magnitude of the spin in area units as described above.
  • the information processing system 60 by a form is shown.
  • the information processing system 60 is different in the configuration of the similarity analysis unit 63 and the calculation unit 62 of the information processing device 61 and is provided with a plurality of spin setting units 12 and annealing setting units 13 of the information processing device 61, respectively. Is configured in the same manner as the information processing system 1 (FIG. 1) of the first embodiment.
  • the calculation unit 62 of the information processing device 61 is composed of a plurality of areas AR, and the initial state of the spin arrangement and the magnitude of the spin fluctuation are determined for each area AR. Each can be set individually.
  • a method for setting the area AR for example, information corresponding to the position coordinates may be added to the spin, and the boundary coordinates may be set so that an approximately equal number of spins are included in each area AR.
  • the information processing apparatus 61 is provided with a spin setting unit 12 and an annealing setting unit 13 dedicated to each area AR corresponding to each area AR of the calculation unit 62.
  • the similarity analysis unit 63 compares the coefficient data of the previous cycle with the current coefficient data in the same manner as the similarity analysis unit 11 (FIG. 1) of the first embodiment. It has a function of generating similarity data representing data similarity. In this case, the similarity analysis unit 63 performs the comparison for each area AR of the calculation unit 62 and generates similarity data for each area AR. Then, the similarity analysis unit 63 outputs the similarity data for each area AR of the calculation unit 62 generated in this way to the spin setting unit 12 and the annealing setting unit 13 associated with the area AR.
  • Each spin setting unit 12 generates spin setting data by the method described above for the first embodiment based on the similarity data given from the similarity analysis unit 63, and the generated spin setting data is calculated by the calculation unit.
  • Each annealing setting unit 13 also generates annealing data by the method described above for the first embodiment based on the similarity data given from the similarity analysis unit 63, and the generated annealing data is used as the calculation unit 62. Output to.
  • the arithmetic unit 62 sets the initial state of the spin arrangement for each area AR based on the spin setting data given from the corresponding spin setting unit 12 and spins based on the annealing data given from the corresponding annealing setting unit 13. Set the amount of fluctuation. Then, the calculation unit 62 performs a ground state search of the Ising model in this state, and outputs the search result to the calculation result acquisition unit 15. Note that the area AR of the arithmetic unit 62 does not necessarily need to be physically in contact with the boundary, and may be composed of a plurality of semiconductor chips, for example.
  • the information processing system 60 of the present embodiment having the above configuration, it is possible to analyze the similarity of problems input continuously and adjust the initial setting of the Ising model according to the analysis result. Furthermore, since the ground state search performance can be improved compared to the information processing systems 1, 20, and 30 of the first to third embodiments, the efficiency of the solution is further improved and the convergence time of the solution is further reduced. Can be made.
  • the annealing method is assumed as the ground state search method.
  • the present invention is not limited to this, and other search algorithms can be applied. It is.
  • the values of the crossover rate and the mutation rate may be adaptively changed according to the calculated value of the similarity data.
  • the arithmetic units 14 and 62 may be in various forms.
  • the arithmetic units 14 and 62 are SRAM (Static Random Access Memory) based circuits configured with CMOS circuits.
  • SRAM Static Random Access Memory
  • the Ising model is applied as the interaction model.
  • the present invention is not limited to this, and various other interaction models may be applied. it can.
  • the interaction between the elements (spin) constituting the interaction model when the input problem is mapped to the predetermined interaction model (Ising model).
  • Problem conversion unit 10 that generates coefficient data representing the value of the coefficient that determines the strength of the problem, and similarity data that represents the similarity between the preceding and following problems based on the coefficient data of the problem generated by the problem conversion unit 10
  • Spin setting as a setting data generating unit that generates setting data for determining the initial state of the interaction model and setting the interaction model in the determined initial state
  • Information processing apparatus such as a unit 33 and a calculation unit 14 that performs an operation of simulating the interaction between elements in the interaction model and searching for a ground state of the interaction model
  • the present invention is not limited to this, and a part or all of them may be configured as a software configuration. good.
  • the present invention can be widely applied to information processing apparatuses that obtain solutions to problems that are input continuously and change from moment to moment.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】 求解の収束時間を短縮させ得る情報処理装置及び方法を提案する。 【解決手段】 連続して入力され、時々刻々と変化する問題の解を求める情報処理装置及び方法において、相互作用モデルにおける各素子間の相互作用を模擬し、当該相互作用モデルの基底状態を探索する演算を実行する演算部を情報処理装置に設け、入力される問題を所定の相互作用モデルにマッピングしたときの当該相互作用モデルを構成する各素子間の相互作用の強さを決定する係数の値を表す係数データを生成し、生成した問題の係数データに基づいて、前後する問題間の類似度を表す類似度データを生成し、1つ前の問題及び今回の問題の類似度が所定の閾値以下の場合には、問題変換部から与えられた各素子の状態を相互作用モデルの初期状態に設定し、当該類似度が閾値よりも大きい場合には、直前の各素子の状態を今回の問題に対する相互作用モデルの初期状態とするようにした。

Description

情報処理装置及び方法
 本発明は情報処理装置及び方法に関し、例えば、連続して入力され、時々刻々と変化する各問題の解を、それぞれ相互作用モデルの基底状態を探索するようにして求める情報処理装置に適用して好適なものである。
 組合せ最適化問題を高速に求解することは計算機における重要課題であり、この課題を解決するための方法として、従来、特許文献1に開示された方法が知られている。この方法は、問題をイジングモデルに変換し、その基底状態を探索することで求解するものであり、特許文献1には計算の実現手段としてレーザを用いた装置が提案されている。
 また、計算装置の製造をより容易にする方法として、特許文献2に開示された方法がある。この方法は、イジングモデルの基底状態を求める装置を、CMOS(Complementary Metal-Oxide-Semiconductor)集積回路を用いて実現するものである。
国際公開第2012/118064号 国際公開第2014/192153号
 組合せ最適化問題を実社会に応用する場合、時間の経過と共に問題が刻々と変化するケースが考えられる。例えば、巡回セールスマン問題において、渋滞等によって一部の移動コストが変化する場合などはその典型である。しかしながら、特許文献1及び特許文献2では、このようなケースにおける効率的な基底状態の探索、つまりは求解の追従性向上に対しては考慮されていなかった。
 本発明は以上の点を考慮してなされたもので、時々刻々と変化する問題に対する求解の追従性を向上させて、求解の収束時間を短縮させ得る情報処理装置及び方法を提案しようとするものである。
 かかる課題を解決するため本発明においては、連続して入力され、時々刻々と変化する問題の解を求める情報処理装置において、入力される前記問題を所定の相互作用モデルにマッピングしたときの当該相互作用モデルを構成する各素子間の相互作用の強さを決定する係数の値を表す係数データを生成する問題変換部と、前記問題変換部により生成された前記問題の前記係数データに基づいて、前後する前記問題間の類似度を表す類似度データを生成する類似度解析部と、前記相互作用モデルの初期状態を決定し、決定した初期状態に前記相互作用モデルを設定するための設定データを生成する設定データ生成部と、前記相互作用モデルにおける各前記素子間の相互作用を模擬し、当該相互作用モデルの基底状態を探索する演算を実行する演算部とを設け、前記設定データ生成部が、1つ前の前記問題及び今回の前記問題の類似度が所定の閾値以下の場合には、前記相互作用モデルの状態をリセットすべきことを表す前記設定データを生成し、当該類似度が前記閾値よりも大きい場合には、前記相互作用モデルの状態をリセットしないことを表す前記設定データを生成し、前記演算部が、前記設定データの値が前記相互作用モデルの状態をリセットすべきことを表す値であった場合には、前記問題変換部から与えられた各前記素子の状態を前記相互作用モデルの初期状態に設定し、前記設定データの値が前記相互作用モデルの状態をリセットしないことを表す値であった場合には、直前の各前記素子の状態を前記今回の問題に対する前記相互作用モデルの初期状態とするようにした。
 また本発明においては、連続して入力され、時々刻々と変化する問題の解を求める情報処理装置において実行される情報処理方法であって、前記情報処理装置は、前記相互作用モデルにおける各前記素子間の相互作用を模擬し、当該相互作用モデルの基底状態を探索する演算を実行する演算部を有し、入力される前記問題を所定の相互作用モデルにマッピングしたときの当該相互作用モデルを構成する各素子間の相互作用の強さを決定する係数の値を表す係数データを生成する第1のステップと、生成した前記問題の前記係数データに基づいて、前後する前記問題間の類似度を表す類似度データを生成する第2のステップと、前記相互作用モデルの初期状態を決定し、決定した初期状態に前記相互作用モデルを設定するための設定データを生成する第3のステップと、前記演算部が、前記設定データに応じた初期状態から前記演算を開始する第4のステップとを設け、前記第3のステップでは、1つ前の前記問題及び今回の前記問題の類似度が所定の閾値以下の場合には、前記相互作用モデルの状態をリセットすべきことを表す前記設定データを生成し、当該類似度が前記閾値よりも大きい場合には、前記相互作用モデルの状態をリセットしないことを表す前記設定データを生成し、前記第4のステップにおいて、前記演算部が、前記設定データの値が前記相互作用モデルの状態をリセットすべきことを表す値であった場合には、前記問題変換部から与えられた各前記素子の状態を前記相互作用モデルの初期状態に設定し、前記設定データの値が前記相互作用モデルの状態をリセットしないことを表す値であった場合には、直前の各前記素子の状態を前記今回の問題に対する前記相互作用モデルの初期状態とするようにした。
 以上の本情報処理装置及び方法によれば、時々刻々と変化する問題に対する求解の追従性を向上させることができる。
 本発明によれば、求解の収束時間を短縮させ得る情報処理装置及び方法を実現できる。
第1の実施の形態による情報処理システムの構成を示すブロック図である。 (A)-(G)は、図8の情報処理装置の構成及び動作の説明に供するタイミングチャートである。 (A)-(G)は、応用例の説明に供するタイミングチャートである。 (A)-(G)は、応用例の説明に供するタイミングチャートである。 第2の実施の形態による情報処理システムの構成を示すブロック図である。 第3の実施の形態による情報処理システムの構成を示すブロック図である。 収束率推定部の構成及び動作の説明に供するブロック図である。 収束率推定部の構成及び動作の説明に供するブロック図である。 第3の実施の形態の応用例の説明に供するブロック図である。 第3の実施の形態による情報処理システムの構成を示すブロック図である。
 以下図面について、本発明の一実施の形態を詳述する。
(1)第1の実施の形態
 本情報処理システムの特徴は、連続して入力される問題の類似度を解析し、その解析結果に応じてイジングモデルの初期設定を調整する点にある。例えば、問題が変化した際の類似度が高い場合は、リセット動作を行わずに直前のスピン値を初期値とし、系の温度をリセット時よりも低く設定して解探索を開始する。これにより、求解の収束時間を短縮することができる。
 図1は、本実施の形態による情報処理システム1を示す。この情報処理システム1は、イジングモデルの基底状態を探索することにより最適化問題の解を求める演算処理を実行する情報処理装置2と、情報処理装置2に問題を与える問題出力装置3と、情報処理装置2により得られた問題の解を表示する結果出力装置4とを備えて構成される。
 問題出力装置3は、情報処理装置2に対して問題を提供するためのインタフェースであり、ユーザ設定や、センサから出力されるセンサデータ又はインターネットなどから得られる情報に基づき問題のデータ(問題データ)を生成し、生成した問題データを情報処理装置2に出力する。
 例えば、巡回セールスマン問題の場合、問題データとして巡回都市と移動コストとに関する情報が必要となるが、問題出力装置3は、前者についてはユーザによる指定、後者については地図情報などから得られる移動距離に基づいて移動コストを算出することにより問題データを生成する。なお、VICS(登録商標)(Vehicle Information and Communication System)などの渋滞情報を移動コストに反映させることにより、時々刻々と変化する問題を生成することができる。
 図2(A)は、問題出力装置による問題データの情報処理装置への出力タイミングを示す。図2において、全体動作は設定期間(時刻t0~時刻t1、時刻t2~時刻t3、時刻t4~時刻t5、時刻t6~時刻t7、時刻t8~時刻t9)と演算期間(時刻t1~時刻t2、時刻t3~時刻t4、時刻t5~時刻t6、時刻t7~時刻t8)とからなるサイクルから構成され、個々の問題データ(A1,A2、A3,B1,B2)はそれぞれ異なる設定期間に演算部に出力される。以下においては、問題データが時々刻々と変化しており、図2において同じ英字同士は、類似度が高いデータであることを意味するものとする。
 情報処理装置2は、問題変換部10、類似度解析部11、スピン設定部12、焼きなまし設定部13、演算部14及び演算結果取得部15を備えて構成される。
 問題変換部10は、問題出力装置3から与えられる問題データをイジングモデルにマッピングし、その結果として得られた図2(B)に示す係数データ(a1,a2,a3,b1,b2,b3)を設定期間に演算部14に出力する。ここでマッピングとは、最適化したい問題のコスト関数を、エネルギ関数の形式に変換することを意味する。この変換によって、イジングモデルの各係数(各スピンの相互作用係数及び外部磁場係数)の値が算出される。
 このようなマッピングは公知の技術であり、例えば上述した特許文献2には因数分解をマッピングする方法が開示され、「Lucas, A. “Ising formulations of many NP problems.” Name: Frontiers in Physics 2.5 (2014)」には、幾つかの最適化問題をエネルギ関数の形式に変換する方法が開示されている。
 類似度解析部11は、1つ前のサイクルの係数データと、現在の係数データとを比較することによりこれら係数データの類似度を解析し、その結果を類似度データとしてスピン設定部12及び焼きなまし設定部13に出力する。係数データ間の類似度の具体的な解析方法としては、例えば、相互作用係数や外部磁場係数の値が変化したスピンの数をカウントし、スピン総数に対するカウント値の割合から類似度を算出する方法を利用できる。
 なお図2(C)に示すように、類似度データも他のデータと同様に設定期間で出力される。ここで、図2(C)において、時刻t2~時刻t3の「60」という類似度データは、「a1」という係数データと、「a2」という係数データとを比較した結果得られた類似度データであり、時刻t6~時刻t7の「5」という類似度データは、「a3」という係数データと、「b1」という係数データとを比較した結果得られた類似度データである。類似度データの値は、0~100の範囲で正規化され、1つ前のサイクルの係数データと、現在の係数データとの類似度が低いほど類似度データが0に近い値となり、かかる類似度が高いほど類似度データが100に近い値となる。
 スピン設定部12は、類似度解析部11から与えられた類似度データを予め設定された第1の閾値と比較し、類似度データが第1の閾値よりも大きいときにはリセットを表す値(「1」)、類似度データが第1の閾値以下のときには非リセットを表す値(「0」)となる図2(D)に示すようなスピン設定データを生成し、生成したスピン設定データを演算部14に出力する。なお図2(D)は、閾値を「50」とした場合の例を示している。
 また焼きなまし設定部13は、類似度データに基づき、焼きなましスケジュールを決定するための図2(E)に示すような焼きなましデータを生成し、生成した焼きなましデータを演算部に出力する。焼きなましデータの種類は、古典アニーリングの場合には温度、量子アニーリングの場合には横磁場強度となる。
 焼なましデータは、スピン設定データと同様に、予め設定された第2の閾値との比較によりその値が設定される。例えば温度スケジュールの場合、類似度データの値が第2の閾値以下のときには「高温から開始」を示す値に設定され(時刻t0~時刻t1、時刻t6~時刻t7)、類似度データの値が閾値よりも大きいときには「低温から開始」を示すような値に設定される(時刻t2~時刻t3、時刻t4~時刻t5、時刻t8~時刻t9)。図2(E)においては、第2の閾値が「50」に設定されることにより、2種類の温度スケジュールが生成された例を示す。なお図2(E)に示すように、温度スケジュールは、設定期間では開始温度を維持し、演算期間で徐々に冷却が進むように設定される。
 演算部14は、例えばスピンの動作を模擬した回路から構成される。演算部14の具体例として、例えば特許文献2に記載された半導体装置を適用することができる。演算部14は、イジングモデルの基底状態探索を演算期間に実行し、その過程で得られるスピンの状態をスピン配列データとして次の設定期間に出力する。
 演算部14において、スピン配列の初期状態はスピン設定データで制御される。スピン設定データの値が「リセット」を表す値であれば、問題変換部10より与えられたスピン配列が設定される。この初期状態のスピン配列は、例えば、乱数でランダムに生成されたスピン配列であり、問題出力装置3より出力されたデータであっても、問題変換部10において生成されたデータであってもよい。スピン設定データの値が「非リセット」を表す値であれば、直前のスピン配列(1つ前の問題に対するイジングモデルの基底状態)をそのまま利用する。また、スピン間の相互作用係数及び外部磁場係数は、問題変換部10より与えられた係数データに従って設定される。
 さらに、演算部14は、イジングモデルの基底状態の探索時に必要となるスピンの揺らぎ(例えば、スピン値(+1、-1)の反転確率)を焼なましデータに基づいて制御する。焼なましデータが「高温から開始」であれば、スピンの揺らぎの大きい状態から探索を開始し、「低温から開始」であれば、揺らぎの小さい状態から探索を開始する。
 ここで、演算部14から出力されるスピン配列データの一例を、図2(F)に示す。図2(F)において、「R」と記載したスピン配列データはランダムな配列を意味し、「s1」~「s4」と記載されたスピン配列は基底状態探索によって得られた配列を意味する。なお、図2(F)において、「→」はスピン配列の変化を意味する。
 演算結果取得部15は、イジングモデルの基底状態探索の収束時、言い換えれば演算期間の終了時に演算部14から出力されるスピン配列データを取得し、取得したスピン配列データを図2(G)に示すような演算結果データ(S1,S2,S3,……)に変換して出力する。演算結果データへの変換方法は問題によって異なるが、例えば巡回セールスマンの場合は、同じ向きのスピンを順番に辿って行く方法により変換が可能である。
 一方、結果出力装置4は、演算結果データを用途に応じて出力するためのインタフェースである。用途としては、例えばモニタを介したユーザへの結果提示や、システムへの出力によるフィードバック制御の実現などが考えられる。
 以上の構成を有する本実施の形態による情報処理システム1では、連続して入力される問題の類似度を係数データ間の類似度として解析し、問題が変化した際の係数データの類似度が高い場合は、リセット動作を行わずに直前のスピン値を初期値とし、系の温度をリセット時よりも低く設定して解探索を開始する。
 従って、本情報処理システム1によれば、前の問題と類似する次の問題の解をリセット状態から基底状態の探索を開始する場合と比べて短時間で得ることが期待でき、その分、時々刻々と変化する問題に対する求解の追従性を向上させて、求解の収束時間を短縮することができる。
 なお、本情報処理システム1では、図2に示すように、各サイクルにおける演算期間を同じ長さとしているが、例えば図3に示すように、前の問題との類似度が高い次の問題の演算期間(例えば、時刻t3´~時刻t4´、時刻t5´~時刻t6´、時刻t9´~時刻t10´)を短く設定した方が、より効率的な求解が可能である。この動作を実現する場合、問題出力装置3との調停処理が必要となる。その実現方法として、類似度データに基づいて解探索の収束時間を予測し、この情報を問題出力装置3に送ることで、次の問題データが出力されるタイミングを決定させる方法が考えられる。あるいは、基底状態探索の収束を検知し、この情報を問題出力装置3に送ることで、次の問題データが出力されるタイミングを決定させても良い。
 一方、さらなる求解の効率化を考えた場合、例えば図4に示すように、焼きなまし設定部13(図1)における類似度データに対する第2の閾値を複数設け、「高温から開始」、「中温から開始」及び「低温から開始」などのように温度スケジューリングを多種化し(図4(E)参照)、焼きなましデータの設定値に応じて演算期間をよりきめ細かく制御する方法も有効である。
(2)第2の実施の形態
 第1の実施の形態においては、問題の類似性を解析する際、係数データの変化量を判断基準とした。しかし問題によっては、係数データの類似度が高いにもかかわらず、解となるスピン配列が大きく異なるケースも想定され、そのような場合には目的とする効果が十分に得られない可能性もある。そこで本実施の形態においては、係数データの変化量のみならず、元となる問題データの変化量も解析に加えることで、より確度の高い類似性解析を行う。
 図1との対応部分に同一符号を付した図5は、このような類似性解析を行い得るようになされた第2の実施の形態による情報処理システム20を示す。この情報処理システム20は、情報処理装置21の類似度解析部22の構成が異なる点と、問題出力装置3から出力された問題データが情報処理装置21の類似度解析部にも与えられる点とを除いて第1の実施の形態による情報処理システム1と同様に構成されている。
 実際上、本実施の形態の類似度解析部22は、第1の実施の形態の類似度解析部11(図1)と同様に、問題変換部10から与えられる係数データに基づいて、1つ前のサイクルの係数データと現在の係数データとの比較を行い、その類似度を算出する。加えて、類似度解析部22は、問題出力装置3から与えられる問題データに基づいて、1つ前のサイクルの問題データと現在の問題データとの比較を行い、その類似度についても比較する。
 ここで、問題データの類似度を効率的に解析する方法として、問題データの特徴量を抽出し、特徴量データの比較を行うことが考えられる。例えば問題データが画像の場合、色や輝度、輪郭や形状、固有値などを特徴量にすることが可能である。なお、特徴量は複数抽出することが望ましく、各特徴量データの類似度をデータの変化率等を用いて解析し、適当な重みを乗じて合算することで、総合的な類似度を算出することが可能となる。
 そして類似度解析部22は、係数データの類似度と、問題データの類似度とに基づいて、1つ前のサイクルの問題と、今回の問題との類似度を算出する。この類似度の算出方法としては、例えば係数データの類似度と、問題データの類似度とを適当な重みを乗じて合算することにより算出する方法を適用することができる。そして類似度解析部22は、このようにして得られた算出結果を類似度データとしてスピン設定部12及び焼きなまし設定部13に出力する。
 以上の構成を有する本実施の形態の情報処理システム20によれば、第1の実施の形態の情報処理システム1と比べて問題の類似度の解析精度を向上できるため、さらなる求解の効率化を図り、より一層と求解の収束時間を短縮させることができる。
(3)第3の実施の形態
 第1の実施の形態においては、焼なましデータを生成する際、類似度データの値を判断基準とした。さらに、類似度データの値を判断基準に演算時間を予測する方法についても言及した。しかし問題によっては、事前に判断基準を適切に把握することが困難なケースも想定され、そのような場合には目的とする効果が十分に得られない可能性もある。そこで本実施の形態において、ログデータを学習することにより、判断基準を適正化する。
 図1との対応部分に同一符号を付して示す図6は、本実施の形態による情報処理システム30を示す。この情報処理システム30は、問題出力装置31の構成、並びに、情報処理装置32のスピン設定部33及び焼きなまし設定部34の構成が異なる点と、情報処理装置32に演算時間設定部35、収束率推定部36及びログ収集部37が設けられている点とを除いて第1の実施の形態の情報処理システム1と同様に構成されている。
 この場合、演算時間設定部35は、類似度解析部11から出力される類似度データに基づいて、演算部14における1つの問題の演算時間(演算期間)を設定するための演算時間データを生成し、生成した演算時間データを問題出力装置31及びログ収集部37に出力する。演算時間データは、例えば、類似性が高いほど演算時間が短くなるような関数を利用して算出された数値である。
 問題出力装置31は、第1の実施の形態の問題出力装置3(図1)と同様にして問題データを生成する機能に加えて、演算時間設定部35から与えられる演算時間データに従って問題データの出力タイミングを決定する調停機能を備える。具体的に、問題出力装置31は、生成した問題データを演算時間データの値に応じて、演算時間データの値が大きいほど前回の問題データを出力してから今回の問題データを出力するまでの時間が長くなるような(つまり演算部14における演算時間を延長するような)タイミングで問題データを問題変換部10に出力する。
 ログ収集部37は、例えばメモリやハードディスク装置等の記憶装置を備えて構成され、情報処理装置32における過去の処理に関する各種情報を収集して保持する機能を有する。具体的に、ログ収集部37は、少なくとも問題変換部10から出力された係数データと、類似度解析部11から出力された類似度データと、スピン設定部33から出力されたスピン配列データと、演算時間設定部35から出力された演算時間データとを問題ごとにそれぞれ収集し、収集したこれらのデータを保持する。
 収束率推定部36は、類似度解析部11から与えられる1つ前のサイクルの係数データと現在の係数データとの類似度を表す類似度データと、ログ収集部37が保持する過去の処理の際に取得した係数データ、類似度データ、スピン配列データ及び演算時間データとに基づいて、次の演算期間に演算部14で実行される演算の収束率を推定する。
 具体的に、収束率推定部36は、図7及び図8に示すように、エネルギ算出部40、収束率算出部41、収束率学習部42、及び、設定補正部43を備えて構成される。また収束率推定部36は、動作モードとして、学習モード及び実践モードを有している。そして、学習モード時には、図7に示すようにエネルギ算出部40、収束率算出部41及び収束率学習部42のみが動作し、実践モードには、図8に示すように収束率学習部42及び設定補正部43のみが動作する。つまり図7及び図8では、動作する部位については実線で表し、動作しない部位については破線で表している。
 学習モードは、過去の動作実績に基づき、1つ前のサイクルの係数データ及び現在の係数データの類似度と、演算部14における演算時間とに対する収束率の関係を学習する動作モードである。
 実際上、学習モード時、収束率推定部36では、エネルギ算出部40が、ログ収集部37が保持する過去の係数データ及びスピン配列データからハミルトニアンを算出し、算出結果をエネルギデータとして収束率算出部41に出力する。そして収束率算出部41は、エネルギデータから収束率を解析し、その結果を収束率データとして収束率学習部42に出力する。収束率データの算出方法としては、例えば、エネルギデータが0に近いほど収束率が高くなるような関数を用いて算出する方法を適用することができる。
 収束率学習部42は、ログ収集部37が保持する対応する類似度データ及び演算時間データを入力データとし、収束率算出部41から与えられる収束率データを教師データとして、類似度及び演算時間と収束率との関係性の学習を実施する。関係性の学習には幾つかの方法が考えられるが、その一例としてニューラルネットワークを挙げることができる。なお、学習モードは、ログの内容が変化するため、定期的に実施することが望ましい。
 一方、実践モードは、現在の類似度データ及び演算時間データに基づいて、現在の問題に対する演算部の演算の収束率を予測する動作モードである。
 実際上、実践モード時、収束率推定部36では、類似度解析部11(図6)から出力される現在解くべき問題に関する類似度データと、演算時間設定部35(図6)から出力される演算時間データとが収束率学習部42に与えられる。そして収束率学習部42は、これらのデータに基づいて、現在の問題に対する演算部14の収束率を表す収束率データを生成し、生成した収束率データを設定補正部43に出力する。
 設定補正部43は、収束率データを解析し、例えば収束率データの値が当該収束率データについて予め設定された第3の閾値以下の場合には、収束率を向上させる方向に誘導するための補正データを生成し、生成した補正データを図6に示すように演算時間設定部35、スピン設定部33及び焼なまし設定部34に出力する。
 演算時間設定部35、スピン設定部33、焼なまし設定部34は、それぞれ補正データに基づき、現在のデータ生成に関するルールを改変する機能を有する。具体的に、演算時間設定部35は、かかる補正データが与えられると、補正データに応じた時間だけ演算期間を延長させるような演算時間データを生成(つまり演算時間データの値を大きく設定)する。またスピン設定部33は、演算部14におけるリセットを促進するよう上述の第1の閾値の値を下げ、焼きなまし設定部34は、演算部14における開始温度を上昇させるよう上述の第2の閾値の値を上げる。
 以上の構成を有する本実施の形態の情報処理システム30によれば、連続して入力される問題の類似度を解析し、その解析結果に応じてイジングモデルの初期設定を調整可能である。また本情報処理システム30によれば、第1の実施の形態の情報処理システム1(図1)と比べて初期設定の調整精度を向上できるため、さらなる求解の効率化を図り、より一層と求解の収束時間を短縮させることができる。
 なお、ログ収集部37が保持する各データを活用することで、問題の類似度の変化パターンを学習することも可能である。応用例として、例えば図6との対応部分に同一符号を付した図9に示すように、連続して入力する問題同士の類似度を問題先読み部52で予測し、予測結果を演算時間設定部35に与える構成が考えられる。これにより、問題出力装置31との出力タイミングの調停において、より長期に渡る予約が可能となり、求解処理の連続性を向上可能である。さらには、かかる予測結果を問題変換部にも与える構成することで、問題データが入力される前に演算を開始することも可能となる。これにより、さらなる演算時間の短縮が可能である。
(4)第4の実施の形態
 先の第1~第3の実施の形態においては、演算部14に与えるスピン設定データ及び焼なましデータは一種類であった。しかし、これらスピン設定データ及び焼なましデータを多重化し、演算部14においてエリア単位又はスピン単位でスピン配列及びスピンの揺らぎの大きさを設定できれば、より効率的な基底状態の探索が可能となる。
 図1との対応部分に同一符号を付して示す図10は、上述のように情報処理装置61の演算部62においてエリア単位でスピン配列及びスピンの揺らぎの大きさを設定可能な本実施の形態による情報処理システム60を示す。この情報処理システム60は、情報処理装置61の類似度解析部63及び演算部62の構成が異なる点と、情報処理装置61のスピン設定部12及び焼きなまし設定部13がそれぞれ複数設けられている点とを除いて第1の実施の形態の情報処理システム1(図1)と同様に構成されている。
 実際上、本実施の形態の情報処理システム60の場合、情報処理装置61の演算部62は、複数のエリアARから構成され、スピン配列の初期状態及びスピンの揺らぎの大きさをエリアARごとにそれぞれ個別に設定できるようになされている。エリアARの設定方法としては、例えば、位置座標に相当する情報をスピンに付加し、エリアARごとにほぼ等数のスピンが含まれるように、境界となる座標を設定すれば良い。また情報処理装置61には、演算部62の各エリアARとそれぞれ対応させ、そのエリアARに専用のスピン設定部12及び焼きなまし設定部13が設けられている。
 また類似度解析部63は、第1の実施の形態の類似度解析部11(図1)と同様にして、1つ前のサイクルの係数データと現在の係数データとの比較を行い、これら係数データの類似度を表す類似度データを生成する機能を有する。この場合、類似度解析部63は、演算部62のエリアARごとにかかる比較を行い、当該エリアARごとの類似度データをそれぞれ生成する。そして類似度解析部63は、このようにして生成した演算部62のエリアARごとの類似度データを、それぞれそのエリアARと対応付けられたスピン設定部12及び焼きなまし設定部13に出力する。
 各スピン設定部12は、類似度解析部63から与えられた類似度データに基づいて、第1の実施の形態について上述した手法によりスピン設定データをそれぞれ生成し、生成したスピン設定データを演算部62に出力する。また各焼きなまし設定部13も、類似度解析部63から与えられた類似度データに基づいて、第1の実施の形態について上述した手法により焼きなましデータをそれぞれ生成し、生成した焼きなましデータを演算部62に出力する。
 演算部62は、エリアARごとに、対応するスピン設定部12から与えられるスピン設定データに基づいてスピン配列の初期状態を設定する共に、対応する焼きなまし設定部13から与えられる焼きなましデータに基づいてスピンの揺らぎの大きさを設定する。そして演算部62は、この状態でイジングモデルの基底状態探索を行い、その探索結果を演算結果取得部15に出力する。なお演算部62のエリアARは、必ずしも境界が物理的に接している必要はなく、例えば、複数の半導体チップで構成されていても良い。
 ここで、動作の一例として、演算部62のあるエリアARのみ類似度データの値が低く、他のエリアARの類似度データの値が高いケースを考える。このケースにおいては、類似度が低いエリアARのみに“リセット”が適用され、そのエリアARにおけるスピン配列の組合せ探索が重点的に実行される。一般的に、類似度データの値が低いエリアARのスピン配列を積極的に変更した方が、基底状態探索を高速化できるため、本情報処理システム60により演算時間の短縮が可能であると言える。
 以上の構成を有する本実施の形態の情報処理システム60によれば、連続して入力される問題の類似度を解析し、その解析結果に応じてイジングモデルの初期設定を調整可能である。さらに、第1~第3の実施の形態の情報処理システム1,20,30と比べて基底状態探索の性能を向上できるため、さらなる求解の効率化を図り、より一層と求解の収束時間を短縮させることができる。
(5)他の実施の形態
 なお上述の第1~第4の実施の形態においては、それぞれの特徴的構成を別々の情報処理システム1,20,30,50,60に搭載する場合について述べたが、本発明はこれに限らず、これら第1~第4の実施の形態の特徴的構成の一部又は全部を組み合わせて1つの情報処理システムに搭載するようにしても良い。
 また上述の第1~第4の実施の形態においては、基底状態の探索方法として焼なまし法を前提とする場合について述べたが、本発明はこれに限らず、他の探索アルゴリズムも適応可能である。例えば、遺伝アルゴリズムを適用する場合は、類似度データの算出値に応じて、交叉率や突然変異率の値を適応的に変化させれば良い。また、演算部14,62は様々な形態が考えられるが、その一例を挙げるのであれば、CMOS回路で構成されたSRAM(Static Random Access Memory)ベースの回路である。さらに、例えばSRAMのメモリセルを用いてスピンを構成する共に、メモリセル間に演算回路を追加することで相互作用と外部磁場を形成することが可能である。
 さらに上述に第1~第4の実施の形態においては、相互作用モデルとしてイジングモデルを適用した場合について述べたが、本発明はこれに限らず、この他種々の相互作用モデルを適用することができる。
 さらに上述の第1~第4の実施の形態においては、入力される問題を所定の相互作用モデル(イジングモデル)にマッピングしたときの当該相互作用モデルを構成する各素子(スピン)間の相互作用の強さを決定する係数の値を表す係数データを生成する問題変換部10と、問題変換部10により生成された問題の係数データに基づいて、前後する問題間の類似度を表す類似度データを生成する類似度解析部11,22,63と、相互作用モデルの初期状態を決定し、決定した初期状態に相互作用モデルを設定するための設定データを生成する設定データ生成部としてのスピン設定部33と、相互作用モデルにおける各素子間の相互作用を模擬し、当該相互作用モデルの基底状態を探索する演算を実行する演算部14となどの情報処理装置2,21,32,51,61の各構成要素をハードウェア構成とするようにした場合について述べたが、本発明はこれに限らず、これらの一部又は全部をソフトウェア構成とするようにしても良い。
 本発明は、連続して入力され、時々刻々と変化する問題の解を求める情報処理装置に広く適用することができる。
 1,20,30,50,60……情報処理システム、2,21,32,51,61……情報処理装置、3……問題出力装置、4……結果出力装置、10……問題変換部、11,22,63……類似度解析部、12,33……スピン設定部、13,34……焼きなまし設定部、14,62……演算部、15……演算結果取得部、35……演算時間設定部、36……収束率推定部、37……ログ収集部、40……エネルギ算出部、41……収束率算出部、収束率学習部、43……設定補正部、52……問題先読み部、AR……エリア。

Claims (12)

  1.  連続して入力され、時々刻々と変化する問題の解を求める情報処理装置において、
     入力される前記問題を所定の相互作用モデルにマッピングしたときの当該相互作用モデルを構成する各素子間の相互作用の強さを決定する係数の値を表す係数データを生成する問題変換部と、
     前記問題変換部により生成された前記問題の前記係数データに基づいて、前後する前記問題間の類似度を表す類似度データを生成する類似度解析部と、
     前記相互作用モデルの初期状態を決定し、決定した初期状態に前記相互作用モデルを設定するための設定データを生成する設定データ生成部と、
     前記相互作用モデルにおける各前記素子間の相互作用を模擬し、当該相互作用モデルの基底状態を探索する演算を実行する演算部と
     を備え、
     前記設定データ生成部は、
     1つ前の前記問題及び今回の前記問題の類似度が所定の閾値以下の場合には、前記相互作用モデルの状態をリセットすべきことを表す前記設定データを生成し、当該類似度が前記閾値よりも大きい場合には、前記相互作用モデルの状態をリセットしないことを表す前記設定データを生成し、
     前記演算部は、
     前記設定データの値が前記相互作用モデルの状態をリセットすべきことを表す値であった場合には、前記問題変換部から与えられた各前記素子の状態を前記相互作用モデルの初期状態に設定し、前記設定データの値が前記相互作用モデルの状態をリセットしないことを表す値であった場合には、直前の各前記素子の状態を前記今回の問題に対する前記相互作用モデルの初期状態とする
     ことを特徴とする情報処理装置。
  2.  前記類似度データに基づいて、前記素子の揺らぎの大きさを制御する焼きなましデータを生成する焼きなまし設定部を備え、
     前記演算部は、
     前記焼きなましデータの値に応じた前記素子の揺らぎの大きさの状態から、前記相互作用モデルの基底状態の探索を開始する
     ことを特徴とする請求項1に記載の情報処理装置。
  3.  前記類似度解析部は、
     前後する前記問題の前記係数データの類似度と、当該前後する前記問題のデータの類似度とに基づいて、前記類似度データを生成する
     ことを特徴とする請求項1に記載の情報処理装置。
  4.  前記演算部における前記演算の時間を設定するための演算時間データを生成する演算時間設定部と、
     前記演算時間データに基づくタイミングで前記問題変換部に前記問題を出力する問題出力部と、
     過去の前記問題の前記演算時間データ、前記設定データ、前記係数データ及び前記前記類似度データと、今回の前記問題の前記類似度データとに基づいて、今回の前記問題について前記演算部で実行される前記演算の時間の収束率を推定する収束率推定部と
     をさらに備え、
     前記演算時間設定部は、
     前記収束率推定部により推定された前記収束率に応じた時間に前記演算部における前記演算の時間を設定するように前記演算時間データを生成する
     ことを特徴とする請求項1に記載の情報処理装置。
  5.  過去の前記問題に関する前記係数データ、前記類似度データ、前記設定データ及び前記演算時間を収集して保持するログ収集部をさらに備え、
     前記収束率推定部は、
     前記ログ収集部に保持された前記係数データ、前記類似度データ、前記設定データ及び前記演算時間と、今回の前記問題の前記類似度データとに基づいて、今回の前記問題について前記演算部で実行される前記演算の時間の前記収束率を推定する
     ことを特徴とする請求項4に記載の情報処理装置。
  6.  前記演算部は、
     前記相互作用モデルの初期状態を、当該相互作用モデルを複数のエリアに分割したエリアごとに設定でき、
     前記類似度解析部は、
     前記相互作用モデルの前記エリアごとの前記類似度データをそれぞれ生成し、
     前記設定データ生成部は、
     前記相互作用モデルの各前記エリアにそれぞれ対応させて設けられ、前記類似度解析部により生成された前記類似度データのうちの対応する前記類似度データに基づいて、前記相互作用モデルの対応する前記エリアの初期状態を決定し、決定した初期状態に前記相互作用モデルの当該エリアを設定するための前記設定データを生成する
     ことを特徴とする請求項1に記載の情報処理装置。
  7.  連続して入力され、時々刻々と変化する問題の解を求める情報処理装置において実行される情報処理方法であって、
     前記情報処理装置は、
     前記相互作用モデルにおける各前記素子間の相互作用を模擬し、当該相互作用モデルの基底状態を探索する演算を実行する演算部
     を有し、
     入力される前記問題を所定の相互作用モデルにマッピングしたときの当該相互作用モデルを構成する各素子間の相互作用の強さを決定する係数の値を表す係数データを生成する第1のステップと、
     生成した前記問題の前記係数データに基づいて、前後する前記問題間の類似度を表す類似度データを生成する第2のステップと、
     前記相互作用モデルの初期状態を決定し、決定した初期状態に前記相互作用モデルを設定するための設定データを生成する第3のステップと、
     前記演算部が、前記設定データに応じた初期状態から前記演算を開始する第4のステップと
     を備え、
     前記第3のステップでは、
     1つ前の前記問題及び今回の前記問題の類似度が所定の閾値以下の場合には、前記相互作用モデルの状態をリセットすべきことを表す前記設定データを生成し、当該類似度が前記閾値よりも大きい場合には、前記相互作用モデルの状態をリセットしないことを表す前記設定データを生成し、
     前記第4のステップにおいて、前記演算部は、
     前記設定データの値が前記相互作用モデルの状態をリセットすべきことを表す値であった場合には、前記問題変換部から与えられた各前記素子の状態を前記相互作用モデルの初期状態に設定し、前記設定データの値が前記相互作用モデルの状態をリセットしないことを表す値であった場合には、直前の各前記素子の状態を前記今回の問題に対する前記相互作用モデルの初期状態とする
     ことを特徴とする情報処理方法。
  8.  前記第3のステップでは、
     前記類似度データに基づいて、前記素子の揺らぎの大きさを制御する焼きなましデータを生成し、
     前記第4のステップでは、
     前記演算部が、前記焼きなましデータの値に応じた前記素子の揺らぎの大きさの状態から、前記相互作用モデルの基底状態の探索を開始する
     ことを特徴とする請求項7に記載の情報処理方法。
  9.  前記第2のステップでは、
     前後する前記問題の前記係数データの類似度と、当該前後する前記問題のデータの類似度とに基づいて、前記類似度データを生成する
     ことを特徴とする請求項7に記載の情報処理方法。
  10.  過去の前記問題の前記演算時間データ、前記設定データ、前記係数データ及び前記前記類似度データと、今回の前記問題の前記類似度データとに基づいて、今回の前記問題について前記演算部で実行される前記演算の時間の収束率を推定する第5のステップと、
     推定した前記収束率に応じた時間に前記演算部における前記演算の時間を設定するように前記演算時間データを生成する第6のステップと、
     前記演算時間データに基づいて、前記問題を入力するタイミングを制御する第7のステップと
     を備えることを特徴とする請求項7に記載の情報処理方法。
  11.  前記情報処理装置は、
     過去の前記問題に関する前記係数データ、前記類似度データ、前記設定データ及び前記演算時間を収集して保持し、
     前記第5のステップでは、
     保持した前記係数データ、前記類似度データ、前記設定データ及び前記演算時間と、今回の前記問題の前記類似度データとに基づいて、今回の前記問題について前記演算部で実行される前記演算の時間の前記収束率を推定する
     ことを特徴とする請求項10に記載の情報処理方法。
  12.  前記演算部は、
     前記相互作用モデルの初期状態を、当該相互作用モデルを複数のエリアに分割したエリアごとに設定でき、
     前記第2のステップでは、
     前記相互作用モデルの前記エリアごとの前記類似度データをそれぞれ生成し、
     前記第3のステップでは、
     前記相互作用モデルの前記エリアごとに、対応する前記類似度データに基づいて当該エリアの初期状態を決定し、決定した初期状態に当該エリアをそれぞれ設定するための設定データを生成する
     ことを特徴とする請求項7に記載の情報処理方法。
PCT/JP2015/074813 2015-08-31 2015-08-31 情報処理装置及び方法 WO2017037859A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
PCT/JP2015/074813 WO2017037859A1 (ja) 2015-08-31 2015-08-31 情報処理装置及び方法
JP2017537115A JP6629864B2 (ja) 2015-08-31 2015-08-31 情報処理装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2015/074813 WO2017037859A1 (ja) 2015-08-31 2015-08-31 情報処理装置及び方法

Publications (1)

Publication Number Publication Date
WO2017037859A1 true WO2017037859A1 (ja) 2017-03-09

Family

ID=58187247

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2015/074813 WO2017037859A1 (ja) 2015-08-31 2015-08-31 情報処理装置及び方法

Country Status (2)

Country Link
JP (1) JP6629864B2 (ja)
WO (1) WO2017037859A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109523029A (zh) * 2018-09-28 2019-03-26 清华大学深圳研究生院 用于训练智能体的自适应双自驱动深度确定性策略梯度强化学习方法
JP7187972B2 (ja) 2018-10-24 2022-12-13 富士通株式会社 装置、方法およびプログラム
US11853658B2 (en) 2019-12-20 2023-12-26 Nec Corporation Information processing apparatus, information processing method, and non-transitory computer readable medium
JP7491032B2 (ja) 2020-04-13 2024-05-28 富士通株式会社 最適化装置、最適化方法及び最適化プログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007280059A (ja) * 2006-04-06 2007-10-25 Sony Corp 認識生成装置および認識生成方法、並びにプログラム
JP2013171327A (ja) * 2012-02-17 2013-09-02 Kddi Corp サポートベクトルマシンを構築する方法及び装置
WO2014192153A1 (ja) * 2013-05-31 2014-12-04 株式会社日立製作所 半導体装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007280059A (ja) * 2006-04-06 2007-10-25 Sony Corp 認識生成装置および認識生成方法、並びにプログラム
JP2013171327A (ja) * 2012-02-17 2013-09-02 Kddi Corp サポートベクトルマシンを構築する方法及び装置
WO2014192153A1 (ja) * 2013-05-31 2014-12-04 株式会社日立製作所 半導体装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109523029A (zh) * 2018-09-28 2019-03-26 清华大学深圳研究生院 用于训练智能体的自适应双自驱动深度确定性策略梯度强化学习方法
CN109523029B (zh) * 2018-09-28 2020-11-03 清华大学深圳研究生院 自适应双自驱动深度确定性策略梯度强化学习方法
JP7187972B2 (ja) 2018-10-24 2022-12-13 富士通株式会社 装置、方法およびプログラム
US11853658B2 (en) 2019-12-20 2023-12-26 Nec Corporation Information processing apparatus, information processing method, and non-transitory computer readable medium
JP7491032B2 (ja) 2020-04-13 2024-05-28 富士通株式会社 最適化装置、最適化方法及び最適化プログラム

Also Published As

Publication number Publication date
JP6629864B2 (ja) 2020-01-15
JPWO2017037859A1 (ja) 2018-07-12

Similar Documents

Publication Publication Date Title
Ding et al. Multimodal safety-critical scenarios generation for decision-making algorithms evaluation
US20230252327A1 (en) Neural architecture search for convolutional neural networks
Modi et al. Estimation of energy consumption of electric vehicles using deep convolutional neural network to reduce driver’s range anxiety
Osorio et al. A simulation-based optimization framework for urban transportation problems
US9152746B2 (en) Quantum annealing simulator
KR20190069582A (ko) 보조 작업들을 통한 강화 학습
US20210027197A1 (en) Dynamic placement of computation sub-graphs
US20180373995A1 (en) Computer
TW201539335A (zh) 實現神經網路處理器
Tong et al. Optimal sensor placement for mode shapes using improved simulated annealing
Yan et al. Efficient selection of a set of good enough designs with complexity preference
WO2017037859A1 (ja) 情報処理装置及び方法
US20200027013A1 (en) Model estimation system, method, and program
KR102533460B1 (ko) 시계열 예측을 위한 어텐션 기반 스태킹 방법
Tenne An optimization algorithm employing multiple metamodels and optimizers
Muhsen et al. Enhancing NoC-Based MPSoC performance: A predictive approach with ANN and guaranteed convergence arithmetic optimization algorithm
CN114648103A (zh) 用于处理深度学习网络的自动多目标硬件优化
US20220187772A1 (en) Method and device for the probabilistic prediction of sensor data
KR102059902B1 (ko) 교통 속도 추정 방법 및 시스템
Bode Parameter calibration in crowd simulation models using approximate Bayesian computation
Singh et al. A hybrid surrogate based algorithm (HSBA) to solve computationally expensive optimization problems
Zhao et al. Traffic signal timing via parallel reinforcement learning
Wang et al. Hybrid neural network modeling for multiple intersections along signalized arterials-current situation and some new results
JP7207531B2 (ja) 経路別交通量推定装置、経路別交通量推定方法、及び経路別交通量推定プログラム
Ozkan et al. Trust-Aware Control of Automated Vehicles in Car-Following Interactions with Human Drivers

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 15902980

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2017537115

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 15902980

Country of ref document: EP

Kind code of ref document: A1