WO2006019337A2 - Method for computer evaluation of a game position - Google Patents

Method for computer evaluation of a game position Download PDF

Info

Publication number
WO2006019337A2
WO2006019337A2 PCT/RU2005/000424 RU2005000424W WO2006019337A2 WO 2006019337 A2 WO2006019337 A2 WO 2006019337A2 RU 2005000424 W RU2005000424 W RU 2005000424W WO 2006019337 A2 WO2006019337 A2 WO 2006019337A2
Authority
WO
WIPO (PCT)
Prior art keywords
game
evaluation
computer
moves
positions
Prior art date
Application number
PCT/RU2005/000424
Other languages
French (fr)
Russian (ru)
Other versions
WO2006019337A3 (en
Inventor
Vladimir Aleksandrovich Bazenov
Original Assignee
Bazenov Vladimir Aleksandrovic
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bazenov Vladimir Aleksandrovic filed Critical Bazenov Vladimir Aleksandrovic
Publication of WO2006019337A2 publication Critical patent/WO2006019337A2/en
Publication of WO2006019337A3 publication Critical patent/WO2006019337A3/en

Links

Classifications

    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07FCOIN-FREED OR LIKE APPARATUS
    • G07F17/00Coin-freed apparatus for hiring articles; Coin-freed facilities or services
    • G07F17/32Coin-freed apparatus for hiring articles; Coin-freed facilities or services for games, toys, sports, or amusements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Definitions

  • the invention relates to the field of intelligent gaming tasks, specifically, to methods for evaluating gaming positions in terms of the parties' possible chances in a future game and probabilistic prediction of its outcome.
  • game positions are understood not only as game situations in the traditional, everyday sense, i.e. situations that arise in games of a sports or entertainment nature, such as, for example, chess, drafts of various varieties, go, sports card games (bridge, etc.), but also any game situations, in the broad, logical and mathematical sense of the word, in which parties must find the optimal strategy and make moves that lead, after each move, to a change in the game situation.
  • Examples of such a wider understanding of the gaming position include air traffic control, war games, commercial games, and the like.
  • the prior art Closest to the technical nature of the proposed method is a computer-based evaluation of the game position, mainly for games in which the parties involved in the game make moves leading to a change in the game position, including setting the position to be studied and the order of the moves in the computer’s memory, followed by a computer the generation and evaluation of positions arising in the variants of the further game, the number of which is limited only by the technical capabilities of computer tools, with the determination of the estimated values functions, at least for a part of these positions, and processing an array of values of the obtained evaluation functions (see, for example, E. Geek computer clocks, M., Agency FAIR, 1997, pp. 8-11).
  • each variant has branches at least in part of the moves, and the evaluation function is determined for all or for some branches of those variants whose final positions allow such a definition.
  • the fundamental disadvantage of this method is the avalanche-like growth of branches in the tree of options and, in this regard, the extremely limited depth of options, which is associated with the limited capabilities of modern, even the most high-speed computers.
  • the accuracy of the assessment of the game position is also limited, since, as you know, this accuracy is higher, the greater the depth of enumeration of options.
  • the objective of the invention is to increase the accuracy of the assessment of the gaming position, in the expression of this assessment in the form of a numerical value.
  • the deterministic evaluation function is determined in numerical form.
  • evaluation functions defined in numerical form are grouped according to specified ranges before statistical processing of the array.
  • the deterministic evaluation function is determined in a logical form.
  • a deterministic evaluation function in a logical form can take the following meanings: “mat on one side”, “mat on another side”, “pa”.
  • the evaluation function is determined using a separate computer program.
  • the invention consists in the following.
  • the computer in the initial (investigated) position goes through all possible options (i.e., it looks through all the first moves of that side, which is the turn of the move, then all possible return moves in each variant, etc.), then it is clear that the number of moves viewed in this enumeration increases rapidly, like an avalanche.
  • the number of possible moves of the side beyond which the turn is equal to 20 then the number of reciprocal moves will be of the order of 20 square, i.e. about 400.
  • the first side again has about 20 possible moves, i.e. the number of second moves of the first side approaches 8000, etc.
  • Such a rapid increase in the number of branches in variants since the performance of even the most modern computers is limited, as a result, limits the depth (i.e., the number of consecutive moves viewed) of variants.
  • the generation of options from the initial position is done by random the choice of moves of both sides in each of the successively occurring positions, so that each option has the form of a non-branching chain of moves.
  • the evaluation function is usually a certain number attributed to the estimated position based on a number of criteria. The wider the set of these criteria, the more it takes into account position factors, the more accurately the OB characterizes the odds of the parties.
  • the evaluation function in the process of enumeration or generation characterizes the positions arising during the virtual game, as a rule, these are the final positions arising at the end of the variant.
  • minimax this procedure leads to the choice of optimal evaluation functions and, as consequence, to the selection and recommendation of the course from which the option begins corresponding to this optimal evaluation function.
  • the objective of this invention does not include the recommendation of the best move (or a series of best moves) in the position being studied, but only its assessment in terms of the ratio of the odds of the parties in the further game.
  • the processing of the array of the obtained values of the evaluation function of the options is carried out in a fundamentally different way.
  • This array is processed statistically, grouping the values of the estimated function that are of the same type or close in magnitude (for example, located in certain specified ranges), and then, based on this processing, the final numerical estimate of the initial position is derived, for example, as the weighted average of the obtained estimated values function options.
  • the evaluation function can be expressed not only in numerical, but also in a logical form.
  • Evaluation functions may also be approximate or deterministic.
  • examples of deterministic logical evaluation functions can be: “mat black”, “pat”, “mat white”. Another example: in a game situation related to the work of an air traffic controller, a deterministic logical evaluation function may look like this: a plane collision)).
  • Such evaluation functions can be taken into account during statistical processing of the array of values of the evaluation function of variants, along with numerical evaluation functions of variants, which are also deterministic.
  • Examples of approximate logical evaluation functions, as applied to chess, are, for example, such as: “y white is a little better)),“ y black is an advantage)), etc.
  • the depth of options should be limited. In each game, there is an average number of moves, this number of moves can be used as an initial parameter when setting the length of chains, which should be at least no less than this average number of moves.
  • the invention is further illustrated by a specific use case for a chess game.
  • Any chess position can be correlated with a certain evaluation function, the value of which is obtained by one of the developed methods.
  • chess pieces are given a certain value (for example, if, as is customary, the value of a pawn is considered to be 1, then the value of a knight will be 3, an elephant - 3.5, a rook - 5 and a queen - 9), then the primary and simplest criterion for evaluating a chess position there may be a comparative assessment of the total costs of the material of the parties.
  • the position assessment can be further substantially refined if we consider a certain number of possible options for the development of the further game and evaluate the positions obtained at the end of these options in the manner described above, and then process these estimates using a specific technique.
  • the proposed method involves setting the studied position in the computer’s memory (if it is already recorded there, for example, during the game, then you just need to fix it in the computer’s memory as the initial task — an object for evaluation).
  • this depth can significantly exceed the average length of a chess game. This means that viewing options for the described method is carried out almost to the end of the party. It is clear that this is directly related to improving the accuracy of the assessment of the position under study.
  • O cp . (0.15 m + 0.25 n + ...) / (m + n + 7), where: t, n ... - respectively, the number of RP values in each interval, in our case it is 19500 , 30600 ...
  • chess In a chess game (as in other games, including logical and mathematical ones), not only numerical values of the evaluation functions are possible, but also logical evaluation functions. In chess, for example, the following can be assigned:
  • this ratio of logical OFs (respectively “mat black)),“ mat white)))) and “pat”) amounted to 112000: 45000: 16000.
  • Non-deterministic evaluation functions such as “y whites are slightly better” are used in well-known methods for evaluating chess positions, however, it is very difficult to formalize and subject, along with the rest of the array, further statistical processing, therefore, when using the described method, it is recommended to avoid using such methods for obtaining evaluation functions in which such non-deterministic valuation functions are provided.
  • the know-how of the invention includes the development of such computer programs that determine only the deterministic values of the evaluation function.
  • the technical result of the invention is to increase the accuracy of assessing the chances of the parties in the playing position, and therefore, the possibility of a more informed choice of the optimal strategy for the further game.
  • the described method is tested, the obtained results confirmed the achievement of the specified technical result.

Abstract

The invention relates to mind game-theory problems, more specifically to methods for evaluating game positions in terms of a possible chance of success of parties in a subsequent game and a probabilistic forecasting of the result thereof. The game positions are defined as sports and recreative games such as, for example chess, various types of checks, go, sports card games (bridge etc) and any game situations as a the air controller operation, military game, commercial games and the like. The inventive method for computer evaluation of a game position, mainly for games in which the participating parties make moves resulting in the change of a game position, for example for chess, consists in storing the examined position and the order of the moves in the computer memory, afterwards in carrying out a computer generation and evaluation of the positions occurred in the variants of a further game positions, whose number is limited by technical capabilities of computer means. The method also consists in determining the valuation function value for at lest one part of said positions and in subsequently processing the array of obtained valuation functions.

Description

СПОСОБ КОМПЬЮТЕРНОЙ ОЦЕНКИ ИГРОВОЙ ПОЗИЦИИ METHOD FOR COMPUTER EVALUATION OF THE GAME POSITION
Область техникиTechnical field
Изобретение относится к области интеллектуальных игровых задач, конкретно, к способам оценки игровых позиций с точки зрения возможных шансов сторон в дальнейшей игре и вероятностного прогнозирования ее исхода.The invention relates to the field of intelligent gaming tasks, specifically, to methods for evaluating gaming positions in terms of the parties' possible chances in a future game and probabilistic prediction of its outcome.
При этом под игровыми позициями здесь понимаются не только игровые ситуации в традиционном, обиходном смысле, т.е. ситуации, возникающие в играх спортивного или развлекательного характера, таких, например, как шахматы, шашки разных разновидностей, го, спортивные карточные игры (бридж и др.), но и любые игровые ситуации, в широком, логико-математическом смысле этого слова, в которых стороны должны находить оптимальную стратегию и делать ходы, приводящие после каждого хода к изменению игровой ситуации.At the same time, game positions here are understood not only as game situations in the traditional, everyday sense, i.e. situations that arise in games of a sports or entertainment nature, such as, for example, chess, drafts of various varieties, go, sports card games (bridge, etc.), but also any game situations, in the broad, logical and mathematical sense of the word, in which parties must find the optimal strategy and make moves that lead, after each move, to a change in the game situation.
Примерами такого более широкого понимания игровой позиции может служить работа авиадиспетчера, военная игра, коммерческие игры и тому подобные ситуации.Examples of such a wider understanding of the gaming position include air traffic control, war games, commercial games, and the like.
Предшествующий уровень техники. Наиболее близким по технической сущности к предлагаемому способу является способ компьютерной оценки игровой позиции, преимущественно для игр, в которых стороны, участвующие в игре, делают ходы, приводящие к изменению игровой позиции, включающий задание исследуемой позиции и порядка очередности ходов в памяти компьютера, последующую компьютерную генерацию и оценку возникающих в вариантах дальнейшей игры позиций, число которых ограничено только техническими возможностями компьютерных средств, с определением значений оценочной функции, по меньшей мере, для части этих позиций, и обработку массива значений полученных оценочных функций (см., например, E. Гик компьютерные шaxмaты», M., Агентство «ФAИP», 1997, с. 8- 11). /1/ В известном способе при переборе вариантов строят так называемое «дepeвo вариантов)), т.е. каждый вариант имеет разветвления, по меньшей мере, на части ходов, и оценочную функцию определяют для всех или для некоторых разветвлений тех вариантов, конечные позиции которых допускают такое определение. Принципиальным недостатком известного способа является лавинообразный рост разветвлений в дереве вариантов и, в связи с этим, крайне ограниченная глубина вариантов, что связано с ограниченными возможностями современных, даже самых быстродействующих компьютеров. В связи с этим и точность оценки игровой позиции также ограничена, поскольку, как известно, эта точность тем выше, чем больше глубина перебора вариантов.The prior art. Closest to the technical nature of the proposed method is a computer-based evaluation of the game position, mainly for games in which the parties involved in the game make moves leading to a change in the game position, including setting the position to be studied and the order of the moves in the computer’s memory, followed by a computer the generation and evaluation of positions arising in the variants of the further game, the number of which is limited only by the technical capabilities of computer tools, with the determination of the estimated values functions, at least for a part of these positions, and processing an array of values of the obtained evaluation functions (see, for example, E. Geek computer clocks, M., Agency FAIR, 1997, pp. 8-11). / 1 / In the known method, when enumerating options, a so-called “tree of options) is built)), i.e. each variant has branches at least in part of the moves, and the evaluation function is determined for all or for some branches of those variants whose final positions allow such a definition. The fundamental disadvantage of this method is the avalanche-like growth of branches in the tree of options and, in this regard, the extremely limited depth of options, which is associated with the limited capabilities of modern, even the most high-speed computers. In this regard, the accuracy of the assessment of the game position is also limited, since, as you know, this accuracy is higher, the greater the depth of enumeration of options.
Раскрытие сущности изобретения.Disclosure of the invention.
Задачей изобретения является повышение точности оценки игровой позиции, при выражении этой оценки в виде численного значения.The objective of the invention is to increase the accuracy of the assessment of the gaming position, in the expression of this assessment in the form of a numerical value.
Указанная задача решается тем, что в способе компьютерной оценки игровой позиции, преимущественно для игр, в которых стороны, участвующие в игре, делают ходы, приводящие к изменению игровой позиции, включающем задание исследуемой позиции и порядка очередности ходов в памяти компьютера, последующую компьютерную генерацию и оценку возникающих в вариантах дальнейшей игры позиций, число которых ограничено только техническими возможностями компьютерных средств, с определением значений оценочной функции, по меньшей мере, для части этих позиций, и обработку массива значений полученных оценочных функций, согласно изобретению, варианты генерируют в виде не разветвляющихся цепочек ходов сторон, каждую цепочку образуют путем случайного выбора ходов сторон в каждой из последовательно возникающих в варианте позиций, а оценку исследуемой позиции дают в виде, по меньшей мере, одного численного значения, определяемого путем статистической обработки массива значений полученных оценочных функций, с учетом их величины или иной характеристики и сравнительной частоты появления в массиве.This problem is solved by the fact that in the method of computer evaluation of the game position, mainly for games in which the parties involved in the game make moves that lead to a change in the game position, including setting the position to be studied and the order of the moves in the computer’s memory, subsequent computer generation and assessment of the positions arising in the variants of the further game, the number of which is limited only by the technical capabilities of computer tools, with the determination of the values of the evaluation function, at least for parts of these positions, and processing the array of values of the obtained evaluation functions, according to the invention, the options are generated in the form of non-branching chains of moves of the sides, each chain is formed by randomly choosing the moves of the sides in each of the positions successively appearing in the variant, and the assessment of the position under study is given in the form, at least one numerical value, determined by statistical processing of the array of values of the obtained evaluation functions, taking into account their size or other characteristics and the comparative frequency occurrences in the array.
Кроме того, оценочные функции в вариантах получают в численной и/или логической форме.In addition, the evaluation functions in the variants are obtained in numerical and / or logical form.
Кроме того, оценку исследуемой позиции дают с учетом только тех полученных в ходе генерации оценочных функций, которые детерминированы.In addition, an assessment of the position under study is given taking into account only those evaluation functions obtained during the generation that are determined.
Кроме того, детерминированную оценочную функцию определяют в численной форме.In addition, the deterministic evaluation function is determined in numerical form.
Кроме того, оценочные функции, определенные в численной форме, перед статистической обработкой массива группируют по заданным диапазонам.In addition, evaluation functions defined in numerical form are grouped according to specified ranges before statistical processing of the array.
Кроме того, детерминированную оценочную функцию определяют в логической форме.In addition, the deterministic evaluation function is determined in a logical form.
Кроме того, применительно к шахматам, детерминированная оценочная функция в логической форме может принимать следующие значения: «мaт одной cтopoнe», «мaт другой cтopoнe», «пaт».In addition, in relation to chess, a deterministic evaluation function in a logical form can take the following meanings: “mat on one side”, “mat on another side”, “pa”.
Кроме того, оценочную функцию определяют с использованием отдельной компьютерной программы.In addition, the evaluation function is determined using a separate computer program.
Кроме того, задают максимальное количество ходов в цепочке. Кроме того, задаваемое количество ходов в цепочке превышает среднестатистическое количество ходов в игре. Сущность изобретения заключается в следующем.In addition, set the maximum number of moves in the chain. In addition, the set number of moves in the chain exceeds the average number of moves in the game. The invention consists in the following.
Вариант использования предлагаемого изобретения. Если в известном способе компьютер в начальной (исследуемой) позиции перебирает все возможные варианты, (т. е. просматривает все первые ходы той стороны, за которой очередь хода, затем все возможные ответные ходы в каждом варианте и т.д.), то ясно, что количество просматриваемых ходов при таком переборе возрастает стремительно, лавинообразно.Variant of use of the invention. If, in the known method, the computer in the initial (investigated) position goes through all possible options (i.e., it looks through all the first moves of that side, which is the turn of the move, then all possible return moves in each variant, etc.), then it is clear that the number of moves viewed in this enumeration increases rapidly, like an avalanche.
Если, допустим, в исходной позиции число возможных ходов стороны, за которой очередь хода, равно 20, то число ответных ходов будет порядка квадрата 20, т.е. порядка 400.If, for example, in the starting position, the number of possible moves of the side beyond which the turn is equal to 20, then the number of reciprocal moves will be of the order of 20 square, i.e. about 400.
На каждый ответный ход первая сторона имеет опять порядка 20 возможных ходов, т.е. число вторых ходов первой стороны приближается к 8000, и т.д. Такой стремительный рост числа разветвлений в вариантах, поскольку быстродействие даже самых современных компьютеров ограничено, как следствие, приводит к ограничению глубины (т.е. количества просматриваемых последовательных ходов) вариантов.For each return move, the first side again has about 20 possible moves, i.e. the number of second moves of the first side approaches 8000, etc. Such a rapid increase in the number of branches in variants, since the performance of even the most modern computers is limited, as a result, limits the depth (i.e., the number of consecutive moves viewed) of variants.
Ясно, что точность оценки игровой позиции, в общем случае, напрямую связана с этой глубиной, т.е. дальностью расчета вариантов.It is clear that the accuracy of the assessment of the game position, in the general case, is directly related to this depth, i.e. range of calculation options.
При разумном ограничении времени современные шахматные компьютеры, например, способны, в общем случае (если речь не идет о «фopcиpoвaнныx» вариантах, т.е. о вариантах, где стороны делают вынужденные, обязательные ходы), обеспечить просмотр вариантов на глубину 6-7 ходов.With a reasonable time limit, modern chess computers, for example, are capable, in the general case (if we are not talking about “fixed” options, that is, options where the parties make forced, compulsory moves), to ensure that options are viewed to a depth of 6-7 moves.
Напротив, в предлагаемом способе, согласно изобретению, генерацию вариантов из начальной позиции делают путем случайного выбора ходов обеих сторон в каждой из последовательно возникающих позиций, так что каждый вариант имеет вид не разветвляющейся цепочки ходов.On the contrary, in the proposed method according to the invention, the generation of options from the initial position is done by random the choice of moves of both sides in each of the successively occurring positions, so that each option has the form of a non-branching chain of moves.
Это позволяет резко увеличить глубину вариантов при том же быстродействии компьютера. Этому способствует и то, что при случайном выборе ходов время, затрачиваемое на выбор хода, существенно уменьшается, поскольку из процедуры исключается определение оценочных функций на каждом ходу.This allows you to dramatically increase the depth of options at the same computer speed. This is also facilitated by the fact that with a random choice of moves, the time spent on choosing a move is significantly reduced, since the definition of evaluation functions at each move is excluded from the procedure.
Случайный выбор ходов, конечно, не может адекватно отразить возможный ход дальнейшей игры. Но здесь вступает в действие закон больших чисел. При очень большом числе просмотренных вариантов среди случайных исходов игры в достаточно большом их числе встретятся и закономерные исходы, характеризуемые достаточно определенными оценочными функциями. Оценочная функция обычно представляет собой некое число, приписываемое оцениваемой позиции на основании целого ряда критериев. Чем более широк набор этих критериев, чем больше он учитывает факторов позиции, тем точнее ОФ характеризует шансы сторон. Однако, оценочная функция в процессе перебора или генерации характеризуют позиции, возникающие в ходе виртуальной игры, как правило, это заключительные, возникающие в конце варианта, позиции.The random choice of moves, of course, cannot adequately reflect the possible course of the further game. But here the law of large numbers comes into effect. With a very large number of scanned options among random outcomes of the game, in a sufficiently large number of them there will also be regular outcomes characterized by sufficiently defined evaluation functions. The evaluation function is usually a certain number attributed to the estimated position based on a number of criteria. The wider the set of these criteria, the more it takes into account position factors, the more accurately the OB characterizes the odds of the parties. However, the evaluation function in the process of enumeration or generation characterizes the positions arising during the virtual game, as a rule, these are the final positions arising at the end of the variant.
Чтобы перейти к оценке исходной, исследуемой позиции, необходима процедура обработки полученного массива значений оценочной функции .In order to proceed to the assessment of the initial, investigated position, a procedure for processing the resulting array of values of the evaluation function is necessary.
В известном способе эта процедура (называемая минимаксной) приводит к выбору оптимальных оценочных функций и, как следствие, к выбору и рекомендации хода, с которого начинается вариант, соответствующий этой оптимальной оценочной функции.In the known method, this procedure (called minimax) leads to the choice of optimal evaluation functions and, as consequence, to the selection and recommendation of the course from which the option begins corresponding to this optimal evaluation function.
В задачу данного изобретения не входит рекомендация наилучшего хода (или ряда наилучших ходов) в исследуемой позиции, а лишь ее оценка с точки зрения соотношения шансов сторон в дальнейшей игре.The objective of this invention does not include the recommendation of the best move (or a series of best moves) in the position being studied, but only its assessment in terms of the ratio of the odds of the parties in the further game.
Поэтому обработка массива полученных значений оценочной функции вариантов ведется принципиально иным путем. Этот массив обрабатывают статистически, группируя находящиеся в нем однотипные или близкие по величине (например, находящиеся в неких заданных диапазонах) значения оценочной функции, и затем, на основе этой обработки, выводят итоговую численную оценку исходной позиции, например, как средневзвешенное значение полученных значений оценочной функции вариантов.Therefore, the processing of the array of the obtained values of the evaluation function of the options is carried out in a fundamentally different way. This array is processed statistically, grouping the values of the estimated function that are of the same type or close in magnitude (for example, located in certain specified ranges), and then, based on this processing, the final numerical estimate of the initial position is derived, for example, as the weighted average of the obtained estimated values function options.
При такой статистической обработке большого массива значений оценочной функции, фактор случайности, (не закономерности) возникающих в вариантах заключительных позиций нивелируется, и шансы сторон оцениваются более точно, чем при использовании известного способа.With such statistical processing of a large array of values of the evaluation function, the randomness factor (not regularities) arising in the final positions variants is leveled, and the odds of the parties are estimated more accurately than when using the known method.
Оценочная функция может быть выражена не только в численном, но и в логическом виде.The evaluation function can be expressed not only in numerical, but also in a logical form.
Оценочные функции могут быть также приблизительными или детерминированными.Evaluation functions may also be approximate or deterministic.
Применительно к шахматам, например, примерами детерминированных логических оценочных функций могут быть такие: «мaт чepным», «пaт», «мaт бeлым». Другой пример: в игровой ситуации, связанной с работой авиадиспетчера, детерминированная логическая оценочная функция может выглядеть так: столкновение самолетов)).In relation to chess, for example, examples of deterministic logical evaluation functions can be: “mat black”, “pat”, “mat white”. Another example: in a game situation related to the work of an air traffic controller, a deterministic logical evaluation function may look like this: a plane collision)).
Такие оценочные функции могут учитываться при статистической обработке массива значений оценочной функции вариантов наряду с численными оценочными функциями вариантов, которые также являются детерминированными.Such evaluation functions can be taken into account during statistical processing of the array of values of the evaluation function of variants, along with numerical evaluation functions of variants, which are also deterministic.
Примерами приблизительных логических оценочных функций, применительно к шахматам, являются, например, такие как: «y белых чуть лучше)), «y черных преимущество)) и пр.Examples of approximate logical evaluation functions, as applied to chess, are, for example, such as: “y white is a little better)),“ y black is an advantage)), etc.
Математическая, в том числе, статистическая обработка таких оценочных функций затруднительна, если вообще возможна, поэтому предпочтительно при такой обработке исключать их из массива, т.е. учитывать при обработке только ту часть массива, которая содержит значения детерминированных оценочных функций. Для возможности статистической обработки массива численных значений оценочных функций целесообразно группировать их по заданным диапазонам значений, с тем, чтобы затем учитывать их количество в каждом диапазоне. Что касается оценочных функций, выраженных в логической форме, то их, как правило, сравнительно немного, и необходимости в их группировке по диапазонам нет.Mathematical, including statistical processing of such estimation functions is difficult, if at all possible, therefore it is preferable to exclude them from the array during such processing, i.e. when processing, consider only that part of the array that contains the values of deterministic evaluation functions. To enable statistical processing of the array of numerical values of the evaluation functions, it is advisable to group them according to the given ranges of values, so as to then take into account their number in each range. As for the evaluation functions, expressed in logical form, there are usually relatively few of them, and there is no need to group them by ranges.
Можно условиться, например, придавать и таким функциям некое численное значение, с тем, чтобы упростить математическую обработку полученного массива значений оценочных функций.It is possible to agree, for example, to give such functions a certain numerical value in order to simplify the mathematical processing of the resulting array of values of the evaluation functions.
Вопросы, относящиеся к определению значения оценочных функций для некоей игровой позиции, применительно, например, к шахматам, достаточно глубоко разработаны /1/. Существует множество специальных компьютерных программ для определения значения оценочной функции, поэтому здесь эти вопросы не будут рассматриваться.Issues related to the determination of the value of evaluation functions for a certain game position, as applied, for example, to chess, are rather deeply developed / 1 /. There are many special computer programs for determining the value of the evaluation function, therefore, these issues will not be considered here.
Глубину вариантов (длину цепочек) целесообразно ограничить. В каждой игре существует среднестатистическое количество ходов, это количество ходов может использоваться как исходный параметр при задании длины цепочек, которая должна быть, по крайней мере, не меньше этого среднестатистического количества ходов.The depth of options (length of chains) should be limited. In each game, there is an average number of moves, this number of moves can be used as an initial parameter when setting the length of chains, which should be at least no less than this average number of moves.
Такая глубина существенно превышает соответствующую глубину вариантов для существующих способов оценки, что, как очевидно, ведет к повышению точности оценки.This depth significantly exceeds the corresponding depth of options for existing methods of assessment, which, obviously, leads to an increase in the accuracy of the assessment.
Далее изобретение поясняется на конкретном примере использования, применительно к шахматной игре.The invention is further illustrated by a specific use case for a chess game.
Любой шахматной позиции может быть соотнесена некая оценочная функция, значение которой получают по одной из разработанных методик.Any chess position can be correlated with a certain evaluation function, the value of which is obtained by one of the developed methods.
Если шахматным фигурам придать определенную стоимость (например, если, как принято, стоимость пешки считать за 1, тогда стоимость коня будет 3, слона - 3,5, ладьи - 5 и ферзя - 9), то первичным и самым простым критерием оценки шахматной позиции может быть сравнительная оценка суммарных стоимостей материала сторон.If chess pieces are given a certain value (for example, if, as is customary, the value of a pawn is considered to be 1, then the value of a knight will be 3, an elephant - 3.5, a rook - 5 and a queen - 9), then the primary and simplest criterion for evaluating a chess position there may be a comparative assessment of the total costs of the material of the parties.
Такую составляющую оценки шахматной позиции можно назвать материальной. Однако, разумеется, этим не может исчерпываться оценка шахматной позиции, т.к. существует множество чисто позиционных критериев, более или менее существенно влияющих на шансы сторон.This component of the evaluation of a chess position can be called material. However, of course, this cannot be the only assessment of the chess position, because there are many purely positional criteria that more or less significantly affect the odds of the parties.
К ним относятся, например, степень развития фигур (в дебюте или миттельшпиле), активность короля (в эндшпиле), взаимная защищенность фигур, наличие у них возможных ходов, наличие открытых линий, пешечная структура, например, наличие проходных или сдвоенных пешек, наличие форсированных ходов с угрозами королю, открытость или, наоборот, безопасное укрытие короля и многие другие.These include, for example, the degree of development of the figures (in the opening or middlegame), the activity of the king (in the endgame), mutual security of pieces, the presence of possible moves, the presence of open lines, the pawn structure, for example, the presence of passed or double pawns, the presence of forced moves with threats to the king, openness or, conversely, the safe shelter of the king and many others.
Эти критерии оценки позиции могут быть условно названы позиционными.These criteria for evaluating a position can be conditionally called positional.
Наконец, оценка позиции может быть еще существенно уточнена, если осуществить рассмотрение некоего числа возможных вариантов развития дальнейшей игры и оценить описанным уже образом получаемые в конце этих вариантов позиции, а затем обработать эти оценки по определенной методике.Finally, the position assessment can be further substantially refined if we consider a certain number of possible options for the development of the further game and evaluate the positions obtained at the end of these options in the manner described above, and then process these estimates using a specific technique.
Совокупность всех критериев, присущих выбранной методике оценки, позволяет определить результирующее значение оценки для исследуемой шахматной позиции. Это может быть либо численная характеристика (выражающая вероятность того или иного исхода партии при продолжении игры, начиная с данной позиции), либо логическая характеристика типа: «мaт чepным» или «пaт)).The combination of all the criteria inherent in the selected evaluation methodology allows you to determine the resulting value of the evaluation for the chess position under study. This can be either a numerical characteristic (expressing the probability of a particular outcome of the game during the continuation of the game, starting from this position), or a logical characteristic of the type: “mat black” or “pat”).
Итак, предлагаемый способ предполагает задание исследуемой позиции в памяти компьютера (если она там уже записана - например, в ходе игры - то ее необходимо просто зафиксировать в памяти компьютера в качестве исходного задания - объекта для оценки).So, the proposed method involves setting the studied position in the computer’s memory (if it is already recorded there, for example, during the game, then you just need to fix it in the computer’s memory as the initial task — an object for evaluation).
Далее проводят компьютерную процедуру генерации вариантов дальнейшей игры, в каждой из возникающих при этом позиций (включая исходную), выбирая ход каждой стороны случайным образом, и образуя при этом множество не разветвляющихся цепочек ходов, приводящих в итоге в каждой цепочке к некой позиции, которой может быть сопоставлено значение оценочных функций. Важно, что количество ходов в получаемых при этом цепочках многократно превышает, при тех же технических возможностях компьютерных средств, количество ходов, получаемых при построении дерева вариантов по известному способу. Т.е., иначе говоря, глубина просмотра вариантов в описываемом способе существенно больше, чем в известном.Next, we carry out a computer procedure for generating options for further games in each of the resulting positions (including the initial one), choosing a random move on each side, and forming a set of non-branching chains of moves, resulting in each chain to a certain position, which be compared the value of the evaluation functions. It is important that the number of moves in the resulting chains is many times greater, with the same technical capabilities of computer tools, the number of moves obtained when constructing a tree of variants according to the known method. That is, in other words, the depth of viewing options in the described method is significantly greater than in the known.
Фактически, эта глубина может существенно превышать среднестатистическую длину шахматной партии. Это означает, что просмотр вариантов по описываемому способу ведется практически до конца партии. Ясно, что это напрямую связано с повышением точности оценки исследуемой позиции.In fact, this depth can significantly exceed the average length of a chess game. This means that viewing options for the described method is carried out almost to the end of the party. It is clear that this is directly related to improving the accuracy of the assessment of the position under study.
Полученный в результате описанной процедуры массив значений оценочных функций - весь или в некоторой его части, опуская те значения, которые явно выпадают из принятой шкалы оценок, или не детерминированы (например: «y черных небольшое преимущество))), а также опуская те позиции, которым компьютер не смог сопоставить значение оценочных функций, - подвергают затем статистической обработке.The resulting array of values of the evaluation functions obtained as a result of the described procedure - all or in some part of it, omitting those values that clearly fall out of the accepted rating scale or are not determinate (for example: “black is a slight advantage))), and also omitting those positions, which the computer could not match the value of the evaluation functions, is then subjected to statistical processing.
Здесь возможны два случая. В первом случае, если при оценке позиций в конце цепочек вариантов оперировали численными значениями оценочных функций, тогда процедура обработки массива полученных оценочных функций может выглядеть следующим образом.Two cases are possible here. In the first case, if when evaluating the positions at the end of the variant chains, the numerical values of the evaluation functions were operated on, then the procedure for processing the array of the obtained evaluation functions may look as follows.
Группируют значения оценочных функций, помещая их в заданные интервалы. Например, 19500 полученных значений ОФ от 0,1 до 0,2 помещают в один интервал, 30600 значений ОФ от 0,2 до 0,3 помещают в следующий интервал и т.д.Group the values of the evaluation functions, placing them at predetermined intervals. For example, 19,500 obtained PF values from 0.1 to 0.2 are placed in one interval, 30,600 PF values from 0.2 to 0.3 are placed in the next interval, etc.
Затем вычисляют результирующее значение и его принимают в качестве оценки исследуемой позиции. Здесь возможны различные методики. Например, можно вычислять результирующее значение как средневзвешенное значение оценочной функции, и подсчитывать его, например, по формуле:Then calculate the resulting value and take it as an assessment of the investigated position. Various techniques are possible here. For example, you can calculate the resulting value as the weighted average value of the evaluation function, and calculate it, for example, by the formula:
Ocp. = (0,15 m + 0,25 n + ...) / (m + n + ...) , гдe: т, п ... - соответственно количества значений ОФ в каждом интервале, в нашем случае это 19500, 30600 ...O cp . = (0.15 m + 0.25 n + ...) / (m + n + ...), where: t, n ... - respectively, the number of RP values in each interval, in our case it is 19500 , 30600 ...
0, 15; 0, 25 ... - средние значения ОФ в каждом интервале. Полученное значение оценки и будет искомым. Второй случай связан с использованием логических оценочных функций0, 15; 0, 25 ... are the average OF values in each interval. The resulting evaluation value will be the desired one. The second case involves the use of logical evaluation functions
В шахматной игре (как и в других играх, в том числе логико- математических) возможны не только численные значения оценочных функций, но и логические оценочные функции. В шахматах к таким, например, может быть отнесена оценка:In a chess game (as in other games, including logical and mathematical ones), not only numerical values of the evaluation functions are possible, but also logical evaluation functions. In chess, for example, the following can be assigned:
«мaт чepным»."Mat Black."
Для того чтобы учесть такие оценки при статистической обработке массива оценочных функций, также группируют одинаковые логические оценочные функции, подсчитывают количества оценочных функций в каждой группе и затем шансы сторон оценивают в соответствии с соотношением этих количеств.In order to take into account such estimates in statistical processing of an array of evaluation functions, identical logical evaluation functions are also grouped, the number of evaluation functions in each group is calculated, and then the odds of the parties are evaluated in accordance with the ratio of these amounts.
Промышленная применимость.Industrial applicability.
В одном из апробированных случаев это соотношение логических ОФ (соответственно «мaт черным)), «мaт белым)))) и «пaт») составило 112000:45000:16000.In one of the tested cases, this ratio of logical OFs (respectively “mat black)),“ mat white)))) and “pat”) amounted to 112000: 45000: 16000.
Отсюда легко вывести численные вероятностные характеристики различных исходов игры, они и будут заключать в себе оценку исходной позиции. В принципе возможен и случай совместного применения численных и логических оценочных функций.From here it is easy to derive numerical probabilistic characteristics of various outcomes of the game, they will comprise an assessment of the initial position. In principle, the case of the combined use of numerical and logical evaluation functions is also possible.
В этом случае проще всего придать логическим оценочным функциям также численные значения, например, оценочной функции «мaт чepным» может быть придано численное значение 100.In this case, the easiest way is to give logical evaluation functions numerical values as well, for example, a numerical value of 100 can be assigned to the evaluation function “black”.
Возможны и другие пути учета логических оценочных функций .There are other possible ways of accounting for logical evaluation functions.
Подробное описание всех возможных методов обработки массива, значений полученных оценочных функций, составляет ноу- хау изобретения. Не детерминированные оценочные функции типа «y белых чуть лyчшe» используются в известных методиках оценки шахматных позиций, однако, их весьма затруднительно формализовать и подвергнуть, наряду с остальным массивом, дальнейшей статистической обработке, поэтому рекомендуется при применении описываемого способа избегать использования таких методик получения оценочных функций, в которых предусмотрены такие не детерминированные оценочные функции .A detailed description of all possible methods of processing the array, the values of the resulting evaluation functions, is the know-how of the invention. Non-deterministic evaluation functions such as “y whites are slightly better” are used in well-known methods for evaluating chess positions, however, it is very difficult to formalize and subject, along with the rest of the array, further statistical processing, therefore, when using the described method, it is recommended to avoid using such methods for obtaining evaluation functions in which such non-deterministic valuation functions are provided.
В ноу-хау изобретения входит разработка таких компьютерных программ, которые определяют только детерминированные значения оценочной функции.The know-how of the invention includes the development of such computer programs that determine only the deterministic values of the evaluation function.
Технический результат изобретения заключается в повышении точности оценки шансов сторон в игровой позиции, а следовательно, и в возможности более обоснованного выбора оптимальной стратегии дальнейшей игры. Описанный способ опробован, полученные результаты подтвердили достижение указанного технического результата. The technical result of the invention is to increase the accuracy of assessing the chances of the parties in the playing position, and therefore, the possibility of a more informed choice of the optimal strategy for the further game. The described method is tested, the obtained results confirmed the achievement of the specified technical result.

Claims

ФОРМУЛА ИЗОБРЕТЕНИЯ. CLAIM.
1. Способ компьютерной оценки игровой позиции, преимущественно для игр, в которых стороны, участвующие в игре, делают ходы, приводящие к изменению игровой позиции, включающий задание исследуемой позиции и порядка очередности ходов в памяти компьютера, последующую компьютерную генерацию и оценку возникающих в вариантах дальнейшей игры позиций, число которых ограничено только техническими возможностями компьютерных средств, с определением значений оценочной1. A method of computer assessment of the game position, mainly for games in which the parties involved in the game make moves leading to a change in the game position, including setting the position to be studied and the order of the moves in the computer’s memory, subsequent computer generation and evaluation of the options that arise game positions, the number of which is limited only by the technical capabilities of computer tools, with the determination of the values of the estimated
Ю функции, по меньшей мере, для части этих позиций, и обработку массива значений полученных оценочных функций, отличающийся тем, что варианты генерируют в виде не разветвляющихся цепочек ходов сторон, каждую цепочку образуют путем случайного выбора ходов сторон в каждой из последовательно возникающих в вариантеФункции functions, at least for a part of these positions, and processing an array of values of the obtained evaluation functions, characterized in that the variants are generated in the form of non-branching chains of moves of the sides, each chain is formed by randomly choosing the moves of the sides in each of the successively occurring variants
15 позиций, а оценку исследуемой позиции дают в виде, по меньшей мере, одного численного значения, определяемого путем статистической обработки массива значений полученных оценочных функций, с учетом их величины или иной характеристики и сравнительной частоты появления в массиве. 0 2. Способ компьютерной оценки игровой позиции по п. 1, отличающийся тем, что оценочные функции в вариантах получают в численной и/или логической форме.15 positions, and the assessment of the studied position is given in the form of at least one numerical value, determined by statistical processing of the array of values of the obtained evaluation functions, taking into account their size or other characteristics and the comparative frequency of occurrence in the array. 0 2. The method of computer assessment of a game position according to claim 1, characterized in that the evaluation functions in the variants are obtained in numerical and / or logical form.
3. Способ компьютерной оценки игровой позиции по п. 1, отличающийся тем, что оценку исследуемой позиции дают с учетом5 только тех полученных в ходе генерации оценочных функций, которые детерминированы. 3. A method for computer-based evaluation of a game position according to claim 1, characterized in that the evaluation of the position being studied is given taking into account5 only those evaluation functions that are determined during generation.
4. Способ компьютерной оценки игровой позиции по п. 3, отличающийся тем, что детерминированную оценочную функцию определяют в численной форме.4. A method for computer-based evaluation of a game position according to claim 3, characterized in that the deterministic evaluation function is determined in numerical form.
5. Способ компьютерной оценки игровой позиции по п. 4, отличающийся тем, что оценочные функции, определенные в численной форме, перед статистической обработкой массива группируют по заданным диапазонам.5. A method for computer-based evaluation of a game position according to claim 4, characterized in that the evaluation functions defined in numerical form are grouped according to predetermined ranges before statistical processing of the array.
6. Способ компьютерной оценки игровой позиции по п. 3, отличающийся тем, что детерминированную оценочную функцию определяют в логической форме.6. A method for computer-based evaluation of a gaming position according to claim 3, characterized in that the deterministic evaluation function is determined in a logical form.
7. Способ компьютерной оценки игровой позиции по п. 6, отличающийся тем, что применительно к шахматам детерминированная оценочная функция в логической форме может принимать следующие значения: «мaт одной cтopoнe», «мaт другой cтopoнe», «пaт».7. A method for computer-based evaluation of a game position according to claim 6, characterized in that, as applied to chess, a deterministic evaluation function in logical form can take the following values: “mat one way”, “mat another way”, “pat”.
8. Способ компьютерной оценки игровой позиции по п. 1, отличающийся тем, что оценочную функцию определяют с использованием отдельной компьютерной программы.8. The method of computer assessment of the gaming position according to claim 1, characterized in that the evaluation function is determined using a separate computer program.
9. Способ компьютерной оценки игровой позиции по п. I5 отличающийся тем, что задают максимальное количество ходов в цепочке.9. A method for computer-based evaluation of a gaming position according to claim I 5, characterized in that the maximum number of moves in the chain is set.
10. Способ компьютерной оценки игровой позиции по п. 1, отличающийся тем, что задаваемое количество ходов в цепочке превышает среднестатистическое количество ходов в игре. 10. The method of computer evaluation of the game position according to claim 1, characterized in that the set number of moves in the chain exceeds the average statistical number of moves in the game.
PCT/RU2005/000424 2004-08-12 2005-08-12 Method for computer evaluation of a game position WO2006019337A2 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
RU2004124505 2004-08-12
RU2004124505/09A RU2004124505A (en) 2004-08-12 2004-08-12 METHOD FOR COMPUTER EVALUATION OF THE GAME POSITION

Publications (2)

Publication Number Publication Date
WO2006019337A2 true WO2006019337A2 (en) 2006-02-23
WO2006019337A3 WO2006019337A3 (en) 2006-04-20

Family

ID=35907815

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/RU2005/000424 WO2006019337A2 (en) 2004-08-12 2005-08-12 Method for computer evaluation of a game position

Country Status (2)

Country Link
RU (1) RU2004124505A (en)
WO (1) WO2006019337A2 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998058714A1 (en) * 1997-06-23 1998-12-30 Craig Garlin Carmichael Educational game for teaching chess through example
RU2145730C1 (en) * 1999-06-02 2000-02-20 Переверзев Алексей Ростиславович Automatic system that controls chess game
US20030090057A1 (en) * 2000-11-02 2003-05-15 Benett Nicholas Luke Gaming machine with chess game feature

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2180137C2 (en) * 2000-05-19 2002-02-27 Переверзев Алексей Ростиславович Computer-aided system for controlling chess play

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998058714A1 (en) * 1997-06-23 1998-12-30 Craig Garlin Carmichael Educational game for teaching chess through example
RU2145730C1 (en) * 1999-06-02 2000-02-20 Переверзев Алексей Ростиславович Automatic system that controls chess game
US20030090057A1 (en) * 2000-11-02 2003-05-15 Benett Nicholas Luke Gaming machine with chess game feature

Also Published As

Publication number Publication date
RU2004124505A (en) 2006-01-27
WO2006019337A3 (en) 2006-04-20

Similar Documents

Publication Publication Date Title
Ciancarini et al. Monte Carlo tree search in Kriegspiel
US7604541B2 (en) System and method for detecting collusion in online gaming via conditional behavior
Lefgren et al. Sticking with what (barely) worked: A test of outcome bias
Hinckley Coalitions in Congress: Size and ideological distance
US20090069088A1 (en) System and method for detection, classification, and management of collusion in online activity
O’Donoghue et al. Predictive models of the 2015 Rugby World Cup: accuracy and application
WO2006019337A2 (en) Method for computer evaluation of a game position
Teófilo et al. Building a No Limit Texas Hold’em Poker Agent Based on Game Logs Using Supervised Learning
Archibald et al. Success, strategy and skill: an experimental study
KR102306385B1 (en) A method of predicting a lotto lottery winning number using artificial intelligence and a system for thereof
Baker et al. Can opponent models aid poker player evolution?
Klingemann et al. The impact of the global economic crisis on support for democracy
Hausken On the impossibility of deterrence in sequential colonel blotto games
Guhe et al. Persuasion in complex games
Cabot et al. Gaming regulation and mathematics: A marriage of necessity
Trojanowski et al. Are you lucky or skilled in Slay The Spire?: An analysis of randomness.
Berdondini The professional trader's paradox
Chen et al. Monte-Carlo Go with knowledge-guided simulations
Zopf A comparison between the usage of flat and structured game trees for move evaluation in Hearthstone
Arjonilla et al. Mixture of Public and Private Distributions in Imperfect Information Games
Johansson et al. Fish or Shark: Data mining online poker
Bettker et al. Towards playing AIs for 7 Wonders: main patterns and strategies for 3-player games
Sonawane et al. A Survey on Game Theory Optimal Poker
Blank et al. Creating an svm to play strong poker
Croissant et al. Stateness and Democracy: Evidence from Asia and cross-regional comparisons

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A2

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BW BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE EG ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KM KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NA NG NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SM SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A2

Designated state(s): BW GH GM KE LS MW MZ NA SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LT LU LV MC NL PL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

NENP Non-entry into the national phase in:

Ref country code: DE

121 Ep: the epo has been informed by wipo that ep was designated in this application
122 Ep: pct application non-entry in european phase