RU2791840C2 - Decision-making system in a multi-agent environment - Google Patents

Decision-making system in a multi-agent environment Download PDF

Info

Publication number
RU2791840C2
RU2791840C2 RU2021138122A RU2021138122A RU2791840C2 RU 2791840 C2 RU2791840 C2 RU 2791840C2 RU 2021138122 A RU2021138122 A RU 2021138122A RU 2021138122 A RU2021138122 A RU 2021138122A RU 2791840 C2 RU2791840 C2 RU 2791840C2
Authority
RU
Russia
Prior art keywords
decision
data
block
library
making
Prior art date
Application number
RU2021138122A
Other languages
Russian (ru)
Other versions
RU2021138122A (en
Inventor
Владимир Германович Крюков
Original Assignee
Владимир Германович Крюков
Filing date
Publication date
Application filed by Владимир Германович Крюков filed Critical Владимир Германович Крюков
Priority to RU2021138122A priority Critical patent/RU2791840C2/en
Publication of RU2021138122A publication Critical patent/RU2021138122A/en
Priority to PCT/RU2022/050391 priority patent/WO2023121514A1/en
Application granted granted Critical
Publication of RU2791840C2 publication Critical patent/RU2791840C2/en

Links

Images

Abstract

FIELD: computer engineering.
SUBSTANCE: technical result consists in the adaptive configuration of the multi-agent system depending on the received data of external influence from the system sensors or devices. The technical result is achieved due to the receipt by the computing system of external influence data from sensors or devices of the system; formation of internal images of the system based on the received data of external influence, and the internal images of the system is stored in the internal images library; selection of operating internal images corresponding to the current state of the system at the present time; calculation of the priority matrix for active internal images; making a decision based on the execution of a plurality of processes, and the input data for this stage are the current internal images and the priority matrix; execution of the decision made by the computer system; formation of the experience of the system based on the decisions made.
EFFECT: adaptive configuration of the multi-agent system depending on the received data of external influence from the system sensors or devices.
24 cl, 5 dwg

Description

ОБЛАСТЬ ТЕХНИКИFIELD OF TECHNOLOGY

Реализации изобретения в целом относятся к области вычислительных систем, а более конкретно к системам, предназначенным для принятия решений без участия человека.Implementations of the invention generally relate to the field of computing systems, and more specifically to systems designed to make decisions without human intervention.

УРОВЕНЬ ТЕХНИКИBACKGROUND OF THE INVENTION

В настоящее время мультиагентные (многоцелевые, многоагентные) системы имеют большую актуальность и широкое применение в различных областях, например, таких как: робототехника, безопасность, медицина, логистика, бизнес, маркетинг и т.д. Система принятия решений является ключевым элементом и основой всего функционирования для создания «Сильного» Искусственного Интеллекта (Сильный ИИ / AGI). Мышление - непрерывное принятие решений на различном уровне в отношении разных целей или задач. Одной из целей изобретения является реализация системы, способной принимать совокупное решение с учётом актуальности целей. При этом решение должно быть оптимальным, дающим лучшее развитие системы как в текущем моменте времени, так и в будущем. Currently, multi-agent (multi-purpose, multi-agent) systems are of great relevance and are widely used in various fields, such as robotics, security, medicine, logistics, business, marketing, etc. The decision-making system is the key element and basis of all functioning to create a "Strong" Artificial Intelligence (Strong AI / AGI). Thinking is the continuous decision-making at different levels in relation to different goals or objectives. One of the goals of the invention is the implementation of a system capable of making an aggregate decision, taking into account the relevance of the goals. In this case, the solution must be optimal, giving the best development of the system both at the current time and in the future.

Современные попытки создать ИИ сводятся в общем случае к разработке отдельных фрагментов интеллекта, каждый из которых решает одноцелевую задачу, пригодную для формализации. Однако существует множество сложностей при сборке общей/целой многозадачной системы. Если сравнивать процесс мышления человека с ИИ, то человек способен ставить перед собой определенные цели на будущее и намечать планы их реализации. Человек способен принимать различные решения в каждый момент времени. Однако не все решения доступны сознательному контролю и пониманию. То есть решения могут приниматься и исполняться независимо от сознания человека/параллельно, что не всегда выглядит логичным решением со стороны ИИ. Modern attempts to create AI are generally reduced to the development of individual fragments of intelligence, each of which solves a single-purpose problem suitable for formalization. However, there are many complexities when assembling a general/entire multitasking system. If we compare the process of human thinking with AI, then a person is able to set certain goals for the future and outline plans for their implementation. A person is capable of making different decisions at any given time. However, not all decisions are available to conscious control and understanding. That is, decisions can be made and executed independently of human consciousness / in parallel, which does not always look like a logical decision on the part of AI.

Мышление имеет аналитическую и прогностическую функцию, соответственно мышление о прошлом и о будущем. Мышление также отвечает за управление текущим моментом (оперативные решения и их исполнение). Задача идеального мышления - находить оптимальные решения для текущего момента времени с учётом будущего развития событий. Thinking has an analytical and prognostic function, respectively, thinking about the past and about the future. Thinking is also responsible for managing the current moment (operational decisions and their implementation). The task of ideal thinking is to find optimal solutions for the current moment of time, taking into account the future development of events.

Основная задача системы принятия решений - адекватно реагировать как на внешние воздействия, выбирая правильное решение в каждый момент времени, так и на внутренние изменения, происходящие в самой системе как таковой. При этом, система должна неуклонно стремиться к достижению одной или нескольких стоящих перед ней и конкурирующих между собой целей. Цели или задачи системы имеют иерархическую структуру. Из целей разного уровня образуются планы. Система принятия решений главным образом стремится к достижению поставленных целей и сохранению/ поддержанию равновесного состояния с наибольшей эффективностью. The main task of the decision-making system is to adequately respond both to external influences, choosing the right decision at every moment of time, and to internal changes occurring in the system itself as such. At the same time, the system must steadily strive to achieve one or more of its competing goals. The goals or objectives of the system have a hierarchical structure. Plans are formed from the goals of different levels. The decision-making system mainly seeks to achieve the set goals and maintain / maintain the equilibrium state with the greatest efficiency.

Конкретные цели задаются на этапе проектирования системы, основываясь на иерархии целей. Цели или задачи системы в некотором смысле можно сопоставить с потребностями человека (Иерархия потребностей Маслоу). Каждая потребность – это отдельная цель. Взаимоотношение целей между собой является самой сложной проблемой, которая может быть решена, например, через систему приоритетов при принятии решений. Результатом чего становится строка или матрица состояний (в зависимости от сложности проектируемой системы). В контексте настоящего описания помимо всего предлагаются решения для формирования многоуровневых иерархических целей и потребностей системы для принятия оптимальных решений. Specific goals are set at the system design stage, based on a hierarchy of goals. The goals or objectives of the system can in some sense be compared with human needs (Maslow's Hierarchy of Needs). Each need is a separate goal. The relationship of goals to each other is the most difficult problem that can be solved, for example, through a system of priorities in decision-making. The result of which is a line or a matrix of states (depending on the complexity of the system being designed). In the context of the present description, in addition to everything, solutions are proposed for the formation of multi-level hierarchical goals and system needs for making optimal decisions.

Каждая цель отражается в строке (матрице) состояния и реализуется одним отдельным процессом. Процесс или отдельная задача, способная реализовать одну цель, может быть сделана в виде нейронной сети различного типа либо в виде универсального аналитического процесса. Each goal is reflected in the status line (matrix) and is implemented by one separate process. A process or a separate task capable of realizing one goal can be made in the form of a neural network of various types or in the form of a universal analytical process.

РАСКРЫТИЕ ИЗОБРЕТЕНИЯDISCLOSURE OF THE INVENTION

Варианты реализации настоящего изобретения описывают механизмы принятия решений.Embodiments of the present invention describe decision mechanisms.

Автономная система для принятия решений включает: блок получения внешних воздействий (102), сконфигурированный для получения данных внешнего воздействия от датчиков или устройств системы; блок обработки внешних воздействий (104), сконфигурированный для формирования внутренних образов (ВО) системы, на основании полученных данных внешнего воздействия; библиотеку ВО (106), которая хранит (в процессе обучения) и корректирует ВО системы, получаемые от блока обработки внешних воздействий; блок текущего состояния системы (108), который на основании данных от блока знаний (118) отбирает действующие ВО, соответствующие текущему состоянию системы в настоящий момент времени; супервизор состояний (110), сконфигурированный для расчета матрицы приоритетов для действующих ВО; блок принятия решений (112), связанный с супервизором состояний (110) и сконфигурированный для принятия оптимального решения на основании выполнения множества процессов, причем входными данными блока принятия решений являются действующие ВО и матрица приоритетов; исполнительный блок (114), сконфигурированный для реализации принятого решения; блок оперативного обучения (116), сконфигурированный для формирования опыта системы на основании принимаемых решений; и общий блок обучения (120), сконфигурированный для обучения библиотеки ВО (106) и библиотеки знаний (118).The autonomous decision-making system includes: an external influence receiving unit (102) configured to receive external influence data from sensors or devices of the system; an external impact processing unit (104) configured to generate internal images (IN) of the system based on the received external impact data; the VO library (106), which stores (in the process of learning) and corrects the VO of the system received from the block for processing external influences; a block of the current state of the system (108), which, based on data from the block of knowledge (118), selects the active VO corresponding to the current state of the system at the present time; a state supervisor (110) configured to calculate a priority matrix for active VOs; a decision block (112) associated with the state supervisor (110) and configured to make an optimal decision based on the execution of a plurality of processes, the input of the decision block being the active VO and the priority matrix; execution unit (114), configured to implement the decision; an operational learning unit (116) configured to generate a system experience based on the decisions made; and a common learning unit (120) configured to train the VO library (106) and the knowledge library (118).

Способ принятия решений реализуется вычислительной системой и включает в себя такие этапы, как: получение вычислительной системой данных внешнего воздействия от датчиков или устройств системы; формирование внутренних образов (ВО) системы, на основании полученных данных внешнего воздействия, причем ВО системы хранятся в библиотеке ВО; отбор действующих ВО, соответствующих текущему состоянию системы в настоящий момент времени; вычисление матрицы приоритетов для действующих ВО; принятие оптимального решения на основании выполнения множества процессов, причем входными данными для данного этапа являются действующие ВО и матрица приоритетов; исполнение вычислительной системой принятого решения; формирования опыта системы на основании принимаемых решений.The decision-making method is implemented by the computer system and includes such steps as: obtaining by the computer system data of external influence from sensors or devices of the system; formation of internal images (IO) of the system, based on the received data of external influence, and the IO of the system is stored in the VO library; selection of operating VOs corresponding to the current state of the system at the present time; calculation of the priority matrix for active VOs; making an optimal decision based on the execution of a set of processes, and the input data for this stage are the current VO and the priority matrix; execution by the computer system of the decision made; formation of the experience of the system based on the decisions made.

Машиночитаемый энергонезависимый носитель данных содержит исполняемые инструкции, которые при исполнении компьютерной системой заставляют компьютерную систему выполнять способ принятия решений, включающий в себя такие этапы, как: получение вычислительной системой данных внешнего воздействия от датчиков или устройств системы; формирование внутренних образов (ВО) системы, на основании полученных данных внешнего воздействия, причем ВО системы хранятся в библиотеке ВО; отбор действующих ВО, соответствующих текущему состоянию системы в настоящий момент времени; вычисление матрицы приоритетов для действующих ВО; принятие оптимального решения на основании выполнения множества процессов, причем входными данными для данного этапа являются действующие ВО и матрица приоритетов; исполнение вычислительной системой принятого решения; формирования опыта системы на основании принимаемых решений.The computer-readable, non-volatile storage medium contains executable instructions that, when executed by a computer system, cause the computer system to perform a decision-making method, including steps such as: receiving by the computing system external influence data from sensors or devices of the system; formation of internal images (IO) of the system, based on the received data of external influence, and the IO of the system is stored in the VO library; selection of operating VOs corresponding to the current state of the system at the present time; calculation of a matrix of priorities for active VOs; making an optimal decision based on the execution of a set of processes, and the input data for this stage are the current VO and the priority matrix; execution by the computer system of the decision made; formation of the experience of the system based on the decisions made.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙBRIEF DESCRIPTION OF THE DRAWINGS

Изобретение станет более понятным благодаря приведенному ниже подробному описанию и прилагаемым чертежам различных вариантов реализации изобретения. Однако чертежи не должны использоваться для ограничения изобретения конкретными вариантами реализации, а предназначены только для пояснения и понимания сущности настоявшего изобретения.The invention will be better understood by the following detailed description and the accompanying drawings of various embodiments of the invention. However, the drawings are not to be used to limit the invention to specific embodiments, but are only intended to explain and understand the essence of the present invention.

На Фиг. 1 представлена примерная блок-схема системы для принятия решений.On FIG. 1 is an exemplary block diagram of a decision making system.

На Фиг. 2 представлена блок-схема функционирования системы принятия решений.On FIG. 2 shows a block diagram of the functioning of the decision-making system.

На Фиг. 3 представлена блок-схема одного из возможных вариантов реализации настоящего изобретения, при котором применяется облачное хранилище данных.On FIG. 3 is a block diagram of one of the possible implementations of the present invention, which uses cloud storage.

На Фиг. 4 представлена блок-схема способа принятия решений в соответствии с некоторыми вариантами реализации настоящего изобретения.On FIG. 4 is a flow diagram of a decision making process in accordance with some embodiments of the present invention.

На Фиг. 5 представлена блок-схема компьютерной системы, которая может использоваться для реализации вариантов способов принятия решений.On FIG. 5 is a block diagram of a computer system that can be used to implement variants of decision methods.

ПОДРОБНОЕ ОПИСАНИЕDETAILED DESCRIPTION

В настоящем документе описана вычислительная система для принятия решений в мультиагентной среде и соответствующий способ принятия решений. Данная система может найти применение в различных областях науки и техники, помимо описанного ниже конкретного примера реализации заявленного изобретения. Система принятия решений является универсальными механизмами для принятия оптимальных решений и может использоваться (или являться конкретной реализацией системы как таковой), например, в финансовых или экономических системах, например, для оптимизации прибыли/доходов (биржевой брокер), маркетинговых системах, сложных диагностических системах различной направленности (например, система автоматического жизнеобеспечения и др.).The present document describes a computing system for decision making in a multi-agent environment and a corresponding decision making method. This system can find application in various fields of science and technology, in addition to the specific example of the implementation of the claimed invention described below. The decision-making system is a universal mechanism for making optimal decisions and can be used (or be a specific implementation of the system as such), for example, in financial or economic systems, for example, for profit / income optimization (stock broker), marketing systems, complex diagnostic systems of various orientation (for example, an automatic life support system, etc.).

Кроме того, система принятия решений или реализуемый способ могут быть использованы в системах автоматического/автоматизированного управления для транспортных средств, роботов (автопилоты, дроны (БПЛА) и т.п.). Чаще всего автопилоты используются для пилотирования летательных аппаратов (поскольку там меньше всего препятствий), однако современные технологии постепенно внедряют автономные функции в повседневные транспортные средства. Рассмотрим чуть подробнее одну из возможных систем автоматизированного управления для транспортных средств (ТС). In addition, the decision-making system or implemented method can be used in automatic/automated control systems for vehicles, robots (autopilots, drones (UAVs), etc.). Most often, autopilots are used to pilot aircraft (because there are the fewest obstacles), but modern technologies are gradually introducing autonomous functions into everyday vehicles. Let us consider in more detail one of the possible automated control systems for vehicles (TC).

Многие современные автомобили оснащены всем необходимым оборудованием для автономного движения и планирования пути, как минимум, на основе систем глобального позиционирования. При помощи беспроводного взаимодействия и систем позиционирования современные ТС способны образовывать многоагентную систему. Концепция автономного дорожно-транспортного движения подразумевает использование принципов известных многоагентных систем (МАС). Автомобили, как агенты могут обмениваться сообщениями с навигационным устройством, расположенным, например, на перекрестке и состоящим из компьютера и беспроводного передатчика. При приближении к перекрестку ТС налаживает контакт с таким навигационным устройством. Many modern cars are equipped with all the necessary equipment for autonomous movement and path planning, at least based on global positioning systems. With the help of wireless communication and positioning systems, modern vehicles are able to form a multi-agent system. The concept of autonomous road traffic implies the use of the principles of well-known multi-agent systems (MAS). Cars, as agents, can exchange messages with a navigation device located, for example, at an intersection and consisting of a computer and a wireless transmitter. When approaching an intersection, the vehicle establishes contact with such a navigation device.

Основным элементом МАС является универсальный агент. Поэтому для создания транспортной системы на основе МАС необходимо выделить как минимум следующие агенты: агент-водитель и агент-менеджер. Агент-водитель – это транспортное средство, управляемое человеком или автономное транспортное средство. Причем, в случае ТС, управляемого человеком, агент-водитель может выдавать подсказки водителю для достижения поставленной цели (звуковые, визуальные подсказки и т.д). Агент-менеджер – это система, которая может быть установлена, например, в светофор (или на перекрестке) и осуществляющая управление агентами-водителями.The main element of the MAC is the universal agent. Therefore, to create a transport system based on MAS, it is necessary to select at least the following agents: agent-driver and agent-manager. A driver agent is a human-driven or autonomous vehicle. Moreover, in the case of a vehicle controlled by a person, the agent-driver can give hints to the driver to achieve the goal (sound, visual prompts, etc.). An agent manager is a system that can be installed, for example, at a traffic light (or at an intersection) and manages driver agents.

Основная цель для агента-водителя – достигнуть пункта назначения за минимальное время, при этом, по возможности, использовать самый короткий маршрут, чтобы затратить меньше топлива на поездку. Основная цель агента-менеджера управление агентами-водителями, подъезжающими к перекрестку, их перестроение и создание на перекрестке безостановочного и бесконфликтного проезда транспортных средств, за минимально возможное время. Для выполнения поставленных целей агенты должны согласовывать свои цели, стратегии поведения, координировать свои действия и разрешать конфликты.The main goal for the driver agent is to reach the destination in the shortest possible time, while using the shortest route, if possible, in order to use less fuel for the trip. The main goal of the agent-manager is to control the agent-drivers approaching the intersection, rebuild them and create a non-stop and conflict-free passage of vehicles at the intersection in the shortest possible time. To achieve the set goals, agents must coordinate their goals, behavior strategies, coordinate their actions and resolve conflicts.

Агенты-водители и агенты-менеджеры могут обмениваться полученными знаниями, используя некоторый специальный язык и подчиняясь установленным правилам/протоколам системы. МАС должна находить оптимальное решение задачи без внешнего вмешательства. В данном случае под оптимальным решением понимается решение, на которое будет потрачено наименьшее количество времени и топлива. Driver agents and manager agents can exchange knowledge gained using some special language and following the established rules/protocols of the system. MAC should find the optimal solution to the problem without external intervention. In this case, the optimal solution is understood as the solution for which the least amount of time and fuel will be spent.

Таким образом, набор базовых характеристик агента может включать, например, такие свойства как: 1) активность – агент-менеджер должен быть способен организовать и реализовать проезд на перекрестке без конфликтов и без остановок, за минимальное время; 2) реактивность – агенты-водители должны воспринимать всю необходимую информацию от окружающей среды. При этом окружающая среда для агента-водителя включает: дорожные знаки, дорожную разметку, других агентов-водителей, различные препятствия для движения, погодные явления (дождь, туман) и т.д. 3) автономность – агенты-водители и агенты-менеджеры должны достигать поставленных целей без участия человека; и 4) общительность – для достижения своих целей агенты-водители должны активно обмениваться информацией между собой по специально установленным протоколам коммуникации.Thus, the set of basic characteristics of an agent may include, for example, such properties as: 1) activity - the agent-manager must be able to organize and implement passage at the intersection without conflicts and without stops, in the minimum time; 2) reactivity - driver agents must perceive all the necessary information from the environment. At the same time, the environment for the driver agent includes: road signs, road markings, other driver agents, various traffic obstacles, weather phenomena (rain, fog), etc. 3) autonomy - agent-drivers and agent-managers must achieve their goals without human intervention; and 4) sociability - in order to achieve their goals, agent-drivers must actively exchange information among themselves using specially established communication protocols.

Далее для примера рассмотрим экономическую мультиагентную систему управления фондовым рынком. Открытый характер современного информационного общества и глобальной рыночной экономики приводит к активному развитию научно-технического прогресса, повышению уровня конкуренции на рынках, расширению доступа к ресурсам глобальной сети Интернет, что стимулирует развитие Интернет-экономики, частью которой является электронный рынок ценных бумаг.Next, as an example, consider an economic multi-agent stock market management system. The open nature of the modern information society and the global market economy leads to the active development of scientific and technological progress, increasing the level of competition in the markets, expanding access to the resources of the global Internet, which stimulates the development of the Internet economy, of which the electronic securities market is a part.

Рост процессов глобализации выдвигает новые требования к инновационной управленческой деятельности, в частности в контексте того, что на реальном рынке ценных бумаг основную роль играют люди-торговцы (брокеры, трейдеры и др.), а на электронном рынке им соответствуют интеллектуальные агенты, которые могут принимать решения, объединяться в группы и учиться в процессе функционирования рынка, то есть выполнять почти все действия, которые выполняют реальные люди. В связи с этим возникает потребность в интеллектуальных методах, способных непрерывно получать новые знания и менять свою структуру и функции, развиваясь и адаптируясь к решаемым задачам и условиях внешней среды.The growth of globalization processes puts forward new requirements for innovative management activities, in particular in the context of the fact that in the real securities market the main role is played by human traders (brokers, traders, etc.), and in the electronic market they correspond to intelligent agents who can accept make decisions, join groups and learn from the functioning of the market, that is, to perform almost all the actions that real people perform. In this regard, there is a need for intelligent methods that can continuously acquire new knowledge and change their structure and functions, developing and adapting to the tasks being solved and environmental conditions.

Для достижения обозначенных целей управления в распределенном взаимодействии различных участников могут быть применены мультиагентные системы. Основу мультиагентного подхода составляет понятие агента, который функционирует в качестве самостоятельного алгоритма/программы или адаптивного элемента системы искусственного интеллекта.To achieve the designated management goals in the distributed interaction of various participants, multi-agent systems can be used. The basis of the multi-agent approach is the concept of an agent that functions as an independent algorithm/program or an adaptive element of an artificial intelligence system.

В отличие от традиционного метода, когда производится поиск некоторого строго определенного алгоритма, позволяющего найти лучшее решение проблемы, в мультиагентных системах решение является результатом взаимодействия некоторого множества самостоятельных модулей – агентов или процессов. Главная особенность в данном случае - динамика и непредсказуемость процесса принятия решений. На практике это означает, что оптимизация решения достигается за счет многочисленных взаимодействий, которые практически невозможно отследить. Агентам системы ставят цели, которых они должны достигать, при этом не определяют жестких сценариев их достижения.Unlike the traditional method, when a certain strictly defined algorithm is searched for, which allows finding the best solution to the problem, in multi-agent systems, the solution is the result of the interaction of a certain set of independent modules - agents or processes. The main feature in this case is the dynamics and unpredictability of the decision-making process. In practice, this means that solution optimization is achieved through numerous interactions that are almost impossible to trace. The agents of the system are assigned goals that they must achieve, while they do not define strict scenarios for their achievement.

Кроме того, мультиагентная система принятия решений позволяет учитывать поведение отдельно взятых агентов, в результате чего становится возможным выявлять достаточно тонкие особенности коллективного поведения элементов системы, учитывать их взаимосвязи друг с другом и с окружающей средой. Такая система может быть предназначена, например, для: 1) поиска данных о финансовых инструментах; 2) мониторинга статуса ценных бумаг и управления рисками; 3) поддержки принятия решений о купле-продаже финансовых активов. И в каждом отдельном случае будут свои агенты.In addition, a multi-agent decision-making system makes it possible to take into account the behavior of individual agents, as a result of which it becomes possible to identify rather subtle features of the collective behavior of system elements, take into account their interconnections with each other and with the environment. Such a system can be designed, for example, to: 1) search for data on financial instruments; 2) monitoring the status of securities and risk management; 3) support for decision-making on the purchase and sale of financial assets. And in each case there will be agents.

Приведенные выше примеры применения мультиагентных систем объединяет общая концепция и цель - принятие оптимального решения в данный момент времени для конкретной задачи. Описываемая в настоящем изобретении автономная система принятия решений имеет структуру, которая может быть оптимально спроектирована для любой вышеприведенной в качестве примера цели или ситуации. В данном случае будет меняться только набор агентов или процессов в соответствии с поставленными перед системой задачами.The above examples of the use of multi-agent systems are united by a common concept and goal - making the optimal decision at a given time for a specific task. The autonomous decision system described in the present invention has a structure that can be optimally designed for any of the above exemplary purpose or situation. In this case, only the set of agents or processes will change in accordance with the tasks assigned to the system.

На Фиг. 1 представлена блок-схема системы принятия решений. В примерном варианте система (100) содержит: блок получения внешних воздействий (ВВ) (102), выход которого соединен со входом блока обработки внешних воздействий (104), выход которого соединен с входом библиотеки внутренних образов (ВО) (106), выход которого соединен с входом блока текущего состояния системы (108), со вторым входом которого соединена библиотека знаний (118); выход блока текущего состояния системы (108) соединен с входом супервизора состояний (110) и со входом блока принятия решений (112), причем супервизор состояний (110) и блок принятия решений (112) имеют двустороннюю связь и их соответствующие выходы соединены с входами исполнительного блока (114), который имеет двухстороннюю связь с блоком оперативного обучения (116), имеющего дополнительную двухстороннюю связь с супервизором состояний (110); при этом библиотека знаний (118) и библиотека ВО (106) имеют двухстороннюю связь с общим блоком обучения (120), вход которого соединен с выходом супервизора состояний (110). On FIG. 1 is a block diagram of a decision making system. In an exemplary embodiment, the system (100) contains: a block for obtaining external influences (BB) (102), the output of which is connected to the input of the block for processing external influences (104), the output of which is connected to the input of the library of internal images (IB) (106), the output of which connected to the input of the block of the current state of the system (108), the second input of which is connected to the knowledge library (118); the output of the current state block of the system (108) is connected to the input of the state supervisor (110) and to the input of the decision block (112), moreover, the state supervisor (110) and the decision block (112) have two-way communication and their respective outputs are connected to the inputs of the executive block (114), which has two-way communication with the operational learning block (116), having additional two-way communication with the state supervisor (110); in this case, the knowledge library (118) and the VO library (106) have a two-way connection with a common learning block (120), the input of which is connected to the output of the state supervisor (110).

Взаимодействие между упомянутыми блоками системы реализуется путем передачи пакетов данных по сети связи. Данная система (100) реализует несколько формализуемых одноцелевых процессов (задач, агентов), что приводит к принятию системой оптимального решения, о чем подробнее будет указано ниже. Следует обратить внимание на то, что в принципе построения системы (100) применен блочный/модульный подход. Блоки системы являются автономными, что обеспечивает возможность замены каждого из них под конкретную прикладную задачу, а также возможность исключения некоторых блоков и возможность добавления новых блоков. Каждый процесс/агент системы имеет свою цель, которая задается на этапе проектирования. Простые процессы собираются под конкретную задачу.The interaction between the mentioned blocks of the system is implemented by transmitting data packets over the communication network. This system (100) implements several formalized single-purpose processes (tasks, agents), which leads to the adoption of an optimal decision by the system, which will be discussed in more detail below. Attention should be paid to the fact that, in principle, the construction of system (100) uses a block/modular approach. The system blocks are autonomous, which makes it possible to replace each of them for a specific application task, as well as the ability to exclude some blocks and add new blocks. Each process/agent of the system has its own goal, which is set at the design stage. Simple processes are assembled for a specific task.

Внешние воздействия (ВВ) на систему регистрируются блоком получения внешних воздействий (102), который содержит множество датчиков и/или устройств системы. Примерами упомянутых датчиков и/или устройств могут выступать, по меньшей мере известные, как: видеокамера, микрофон, устройства ввода данных (клавиатура, мышь и т.д.), сенсорный датчик, датчик движения, датчик температуры, датчик влажности, датчик дыма, датчик освещенности, газоанализатор, сейсмический датчик и т.п. Специалисту в данной области техники будет понятно, что для каждой конкретной системы будет использоваться свой индивидуальный набор датчиков и/или устройств для регистрации внешних воздействий. External influences (IE) on the system are recorded by the block for receiving external influences (102), which contains a plurality of sensors and/or system devices. Examples of said sensors and/or devices can be at least known as: video camera, microphone, data input devices (keyboard, mouse, etc.), touch sensor, motion sensor, temperature sensor, humidity sensor, smoke sensor, light sensor, gas analyzer, seismic sensor, etc. It will be clear to a person skilled in the art that for each particular system, its own individual set of sensors and/or devices for recording external influences will be used.

Полученные блоком получения внешних воздействий (102) данные поступают в блок обработки внешних воздействий (104), который может быть реализован, например, искусственной нейронной сетью. В другом альтернативном варианте может применяться множество обученных известными методами нейронных сетей, каждая из которых обучена на формирование конкретных внутренних образов, присущих конкретному внешнему воздействию (ВВ), согласно его сущности. В другом альтернативном варианте вместо нейронной сети может быть использована аналитическая система или иной механизм обработки ВВ, если ВВ является «простым» и не требуется сложного механизма для формирования внутреннего образа (ВО). Нейронная сеть идентифицирует поступающие на её вход данные и применяет к ним набор функциональных преобразований для формирования внутренних образов (ВО) системы (получения внутренней информации). The data received by the block for receiving external influences (102) is sent to the block for processing external influences (104), which can be implemented, for example, by an artificial neural network. In another alternative, a plurality of neural networks trained by known methods can be used, each of which is trained to form specific internal images inherent in a specific external influence (IE), according to its essence. In another alternative, instead of a neural network, an analytical system or other mechanism for processing the IU can be used if the IU is "simple" and no complex mechanism is required to form the internal image (IN). The neural network identifies the data coming to its input and applies a set of functional transformations to them to form internal images (IN) of the system (obtaining internal information).

Например, в одном из альтернативных вариантов реализации изобретения, полученный видеоряд может быть разбит на последовательности кадров, идентифицированные обученной моделью нейронной сети в качестве относящихся к одному событию (например, проезд автомобиля через перекресток, продвижение железнодорожного состава через контрольный пункт и др.).For example, in one of the alternative embodiments of the invention, the resulting video sequence can be divided into sequences of frames identified by the trained neural network model as related to one event (for example, a car passing through an intersection, a train moving through a checkpoint, etc.).

В другом альтернативном варианте, например, если в качестве данных внешних воздействий (102) используются фото, например, полученные с помощью фотокамеры, оснащённой датчиком присутствия, то данные могут быть идентифицированы обученной моделью нейронной сети, например, посредством выявления области интереса на изображении и идентификации и классификации объекта, содержащегося в границах детектированной области интереса. Стоит отметить, что указанные выше примеры не являются ограничивающими применение настоящего изобретения. Для каждого вида/типа внешних воздействий (102) при получении данных системой могут быть применены специализированные средства, характерные для обработки таких данных и присущие соответствующему типу данных. Заявленное изобретение является масштабируемым/расширяемым/адаптивным и универсальным средством для принятия решений.In another alternative, for example, if photographs are used as data of external influences (102), for example, obtained using a camera equipped with a presence sensor, then the data can be identified by a trained neural network model, for example, by identifying an area of interest in the image and identifying and classifying an object contained within the boundaries of the detected region of interest. It should be noted that the above examples are not limiting the application of the present invention. For each kind/type of external influences (102), when data is received by the system, specialized tools can be applied that are specific to the processing of such data and inherent in the corresponding data type. The claimed invention is a scalable/expandable/adaptive and versatile decision tool.

В некоторых реализациях нейронная сеть (НС) может быть представлена рекуррентной нейронной сетью. В других реализациях нейронная сеть может быть представлена сверточной нейронной сетью, которая в различных реализациях системы может включать в себя любое подходящее количество сверточных слоев, слоев ReLU, слоев пула и/или любые другие слои. Порядок расположения слоев, количество слоев, количество фильтров или любой другой параметр сверточной нейронной сети может быть отрегулирован, например, с использованием эмпирических данных. В других вариантах реализации, не ограничиваясь, могут использоваться модели полносвязных нейронных сетей, модели глубинного обучение и др., в зависимости от конкретной задачи. In some implementations, a neural network (NN) may be represented by a recurrent neural network. In other implementations, the neural network may be represented by a convolutional neural network, which in various implementations of the system may include any suitable number of convolutional layers, ReLU layers, pooling layers, and/or any other layers. The order of the layers, the number of layers, the number of filters, or any other parameter of the convolutional neural network can be adjusted, for example, using empirical data. In other implementations, but not limited to, fully connected neural network models, deep learning models, etc., may be used, depending on the specific task.

Однако, указанные выше варианты не ограничивают применение других моделей нейронных сетей для получения внутренних образов системы (ВО). Например, конкретная модель НС может зависеть от внешних воздействий (ВВ). Так же стоит учесть, что помимо одной модели НС может применяться, например, ансамбль разного рода обученных известными методами НС для получения консолидированной информации внешних воздействий при их многообразии. Предположим, что на систему оказывается множество разнородных воздействий и каждый тип воздействия подлежит обработке для выделения значимых для системы признаков внешних воздействий (ВВ) и их последующей консолидации для обеспечения работы заявляемой системы. However, the above options do not limit the use of other neural network models to obtain internal system images (IS). For example, a specific NN model may depend on external influences (IE). It is also worth considering that in addition to one NN model, for example, an ensemble of various kinds of NNs trained by known methods can be used to obtain consolidated information from external influences in their diversity. Let us assume that the system is exposed to many heterogeneous impacts and each type of impact is subject to processing in order to isolate signs of external influences (IE) significant for the system and their subsequent consolidation to ensure the operation of the proposed system.

Ансамбль НС может включать, но не ограничиваясь, например, модели полносвязных НС, рекуррентных НС, НС прямого прохода, автоэнкодеров, деконволюционных НС и моделей нейронных сетей другого вида.An ensemble of NNs may include, but are not limited to, for example, fully connected NNs, recurrent NNs, forward pass NNs, autoencoders, deconvolutional NNs, and other kinds of neural network models.

Указанный ансамбль НС может быть скомбинирован, например, исходя из видов внешних воздействий (ВВ) на систему принятия решений. Данный ансамбль может быть расширен/сужен в зависимости от внешних воздействий для конкретной имплементационной задачи системы. Все данные полученные в таком варианте реализации системы принятия решений подлежат конкатенации известными методами для дальнейшей обработки в рамках обеспечения работы указанной заявленной системы принятия решений.The specified ensemble of NS can be combined, for example, based on the types of external influences (IE) on the decision-making system. This ensemble can be expanded / narrowed depending on external influences for a specific implementation task of the system. All data received in such an implementation of the decision-making system is subject to concatenation by known methods for further processing in the framework of ensuring the operation of the said declared decision-making system.

Внутренние образы (ВО), полученные блоком обработки внешних воздействий (104), поступают в библиотеку ВО (106), где хранятся и постоянно корректируются на основании текущего состояния системы (ассоциативная память/база данных системы). Для способствования идентификации ВО внутри системы могут применяться, но не ограничиваясь, например, метаданные, присвоенные ВО и иные атрибуты. Internal images (IO) received by the external influences processing unit (104) enter the VO library (106), where they are stored and constantly updated based on the current state of the system (associative memory/database of the system). To help identify VOs within a system, for example, metadata assigned to VOs and other attributes can be used, but not limited to.

Каждый ВО системы имеет свой идентификатор и набор ассоциаций (ассоциативных/обратных связей). В контексте данного изобретения ассоциация — это отношение ВО (значимость или приоритет) к конкретной цели или потребности системы. В общем, в контексте настоящего изобретения, можно сказать, что в совокупности ВО содержит в себе отношение «образа» объекта к целям системы, подлежащим достижению. Каждый ВО из библиотеки ВО (106) способен оказывать влияние на текущее состояние системы, то есть на состояние системы в настоящий момент времени. Каждому ВО соответствует свое значение значимости (или приоритет), которое отличается для различных макросостояний системы, с учетом коэффициентов коррекции. В процессе работы системы и внутренних алгоритмов обучения системы, ВО наполняются содержанием: ассоциациями (изменения состояния системы) и причинно-следственными связями, закономерностями (реакции системы, принятие решений).Each VO of the system has its own identifier and a set of associations (associative/feedback). In the context of this invention, an association is the relationship of VO (significance or priority) to a specific goal or need of the system. In general, in the context of the present invention, it can be said that in the aggregate VO contains the relation of the "image" of the object to the goals of the system to be achieved. Each VO from the VO library (106) is capable of influencing the current state of the system, that is, the state of the system at the present time. Each VO has its own significance value (or priority), which differs for different macrostates of the system, taking into account the correction factors. During the operation of the system and internal algorithms for training the system, VOs are filled with content: associations (changes in the state of the system) and cause-and-effect relationships, patterns (system reactions, decision-making).

В качестве указанных значений значимости ВО могут применяться, например, заданные в системе коэффициенты (К), на основании которых возможна корректировка указанных приоритетов (например, в диапазоне от 0 до 1). Указанные коэффициенты значимости могут быть получены на основании экспертного опыта системы или, например, эмпирическим путем, или в процессе обучения (накопления опыта) в системе. Примерами таких коэффициентов могут выступать, например, такие, но не ограничиваясь, как коэффициент незначимости ВО (КНЗ), коэффициент важности ВО (КВ), коэффициент значимости ВО (КЗ), коэффициент малозначимости ВО (КМЗ).Например, в одном варианте можно принять, что если К меньше КНЗ, имеющего значение 0,1 (или иное значение), то такой ВО не имеет отношения к цели, решаемой на настоящий момент времени и, следовательно, такой ВО может быть отброшен. Если К больше КВ и имеет значение 0,85 и более, то чем больше К, тем большую важность он имеет для конкретной цели и принятия решения в текущий момент времени. Однако, стоит учесть, что максимальный К, больший КВ (например, 1,0 или значение крайне близкое к 1,0) приводит к возможности подавления других целей для настоящего момента времени (выживание). В качестве примера максимального К и его влияния для системы автоматического пилотирования можно предположить принятие решения об аварийной посадке в случае полного исчерпания запаса топлива; столкновения с препятствием, дающее большую возможность на выживание системы (автономное автотранспортное средство принимает решение уйти от столкновения в снег, нежели таранить встречный автомобиль при неизбежности столкновения). Так же заданный КЗ равный 0,5, или иное значение, при К большем КЗ свидетельствует об обязательном участии ВО для принятия конкретного решения. Далее, можно предположить, что при К большем КМЗ (то есть К в правильно пределах 0,1 – 0,5), он малозначим для конкретного решения и имеет маленький приоритет. При этом, в данном случае, чем больше К, тем больший приоритет имеет ВО. As the indicated values of the significance of the VO, for example, the coefficients (K) specified in the system can be used, on the basis of which the indicated priorities can be adjusted (for example, in the range from 0 to 1). The indicated coefficients of significance can be obtained on the basis of the expert experience of the system or, for example, empirically, or in the process of learning (accumulation of experience) in the system. Examples of such coefficients can be, for example, but not limited to, the coefficient of insignificance of VO (KNZ), the coefficient of importance of VO (KV), the coefficient of significance of VO (KZ), the coefficient of insignificance of VO (KMZ). For example, in one embodiment, you can take that if K is less than the KHZ having a value of 0.1 (or some other value), then such a VO is not relevant to the goal being solved at the present time and, therefore, such a VO can be discarded. If K is greater than KV and has a value of 0.85 or more, then the larger K, the more important it is for a specific goal and decision making at the current time. However, it is worth considering that a maximum K greater than the KV (for example, 1.0 or a value very close to 1.0) leads to the possibility of suppressing other targets for the present time (survival). As an example of the maximum K and its influence on the automatic piloting system, one can assume the decision to make an emergency landing in the event of a complete exhaustion of the fuel supply; collision with an obstacle, which gives a greater opportunity for the survival of the system (an autonomous vehicle decides to avoid a collision in the snow, rather than ram an oncoming vehicle when a collision is inevitable). Also, the given CV equal to 0.5, or another value, with K greater than the CV, indicates the mandatory participation of the VO for making a specific decision. Further, it can be assumed that when K is larger than the KMZ (that is, K is in the correct range of 0.1 - 0.5), it is of little importance for a particular solution and has a small priority. At the same time, in this case, the more K, the greater the priority of the VO.

Целью указанных коэффициентов является детерминация принадлежности ВО для принятия решения/несоответствие или неприменимость ВО конкретной задаче, принимаемому решению и цели как таковой. Таким образом, незначительный или малозначительный ВО может не приниматься во внимание системой, что обеспечивает снижение ресурсных затрат системой. Однако, стоит учесть, что малозначимый ВО может иметь больший приоритет для другого решения в другой момент времени. The purpose of these coefficients is to determine whether the VO belongs to the decision-making / inconsistency or inapplicability of the VO to a specific task, the decision being made and the goal as such. Thus, an insignificant or insignificant VO can be ignored by the system, which reduces the resource costs of the system. However, it is worth considering that an insignificant VO may have a higher priority for another decision at another point in time.

В одном из вариантов реализации системы библиотека ВО (106) может быть сконфигурирована для самообучения, например, на основании данных, получаемых от супервизора состояний (110) через общий блок обучения (120). В альтернативном варианте общий блок обучения (120) предназначен для взаимного обучения библиотеки ВО (106) и для обучения библиотеки знаний (118). Общий блок обучения (120) обучается/учит распознавать ВО, описывать ВО и формировать для них соответствующий контекст/содержание.In one embodiment of the system, the VO library (106) may be configured to learn itself, for example, based on data received from the state supervisor (110) via a common learning block (120). Alternatively, the common learning block (120) is for mutual learning of the VO library (106) and for learning of the knowledge library (118). The general learning block (120) learns/teaches to recognize VOs, describe VOs and form appropriate context/content for them.

В одном из вариантов реализации, контекст, например, может быть представлен в текстовой форме, например, с применением методов дистрибутивной семантики. В другом, альтернативном варианте реализации, контекст может быть представлен, например, в качестве метаданных. Еще в одном альтернативном варианте реализации, контекст может быть представлен в комбинированной форме. Данное утверждение не призвано ограничивать способы и методы формирования контекста. В любом варианте реализации способ формирования контекста можно подобрать, например, на основании экспертного опыта и знаний, в зависимости от сущности ВО (множества разнородных ВО) и его атрибутов, присущих конкретному ВО. При этом, если заявленной системе принятия решений присуще множество разнородных ВО, то каждой группе однородных ВО присуще формирование контекста схожим образом.In one implementation, the context, for example, can be represented in textual form, for example, using methods of distributive semantics. In another, alternative implementation, the context can be represented, for example, as metadata. In yet another alternative implementation, the context may be presented in a combined form. This statement is not intended to limit the ways and methods of context formation. In any implementation option, the context formation method can be selected, for example, based on expert experience and knowledge, depending on the essence of the VO (set of heterogeneous VO) and its attributes inherent in a particular VO. At the same time, if the declared decision-making system has many heterogeneous VOs, then each group of homogeneous VOs is characterized by the formation of a context in a similar way.

Следует отметить, что в библиотеке ВО (106) внутренние образы подвергаются кластеризации. Алгоритм кластеризации может представлять собой стандартную статистическую процедуру, реализующую сбор данных, содержащих информацию о выборке ВО и анализ ВО. Далее выполняется процесс упорядочивания/группировки схожих ВО в сравнительно однородные кластеры. В данном случае могут быть применены такие классические алгоритмы кластеризации как: к-средних, ЕМ алгоритм, иерархическая кластеризация и т.п.It should be noted that in the VO library (106) internal images are subjected to clustering. The clustering algorithm can be a standard statistical procedure that implements the collection of data containing information about the sample of VO and analysis of VO. Next, the process of ordering/grouping similar VOs into relatively homogeneous clusters is performed. In this case, such classical clustering algorithms as k-means, EM algorithm, hierarchical clustering, etc. can be applied.

ВО из библиотеки образов (106) поступают в блок текущего состояния системы (108), который на основании данных из библиотеки знаний (118) закономерности кластеров преобразует ВО в ΔВО (дельта ВО), соответствующие текущему состоянию системы. В данном блоке (106) формируется текущая картина окружающего мира (оперативная память системы). То есть отбираются только действующие в настоящий момент времени ВО, имеющие наивысший приоритет, не ниже значения КЗ.VO from the library of images (106) enter the block of the current state of the system (108), which, based on the data from the knowledge library (118), the patterns of clusters, converts the VO into ΔVO (delta VO), corresponding to the current state of the system. In this block (106) the current picture of the surrounding world (system RAM) is formed. That is, only the currently operating VOs with the highest priority, not lower than the SC value, are selected.

Полученные ΔВО поступают далее в супервизор состояний (110), а также и в блок принятия решений (112). Супервизор состояний (110) отвечает за определение, управление и коррекцию текущего состояния системы (100), которое влияет на последующее принятие системой оптимального решения. Супервизор состояний (110) разделяет действующие ВО на значимые и незначимые для каждого определенного последующего процесса с учетом коэффициентов значимости. Таким образом, в текущем состоянии для каждого ВО формируется значимость/приоритет самого ВО при воздействии на систему (100). The received ΔBOs are further sent to the state supervisor (110), as well as to the decision block (112). The state supervisor (110) is responsible for determining, managing and correcting the current state of the system (100), which influences the system's subsequent adoption of an optimal decision. The state supervisor (110) separates the active VOs into significant and insignificant for each determined subsequent process, taking into account the coefficients of significance. Thus, in the current state, for each VO, the significance/priority of the VO itself is formed when acting on the system (100).

В одном дополнительном варианте реализации системы, супервизор состояний (110) может включать в себя корректор ценностей ВО (на чертежах не показан). Корректор ценностей ВО предназначен для пересчета коэффициентов значимости ВО при каждом такте работы системы методами, подробно раскрытыми в настоящем описании. In one additional embodiment of the system, the state supervisor (110) may include a VO value corrector (not shown in the drawings). The VO values corrector is designed to recalculate the VO significance coefficients at each cycle of the system operation by the methods described in detail in this description.

Для последующей обработки с учетом значимости и матрицы приоритетов отбираются только те ВО, которые превышают установленный порог значимости, который может быть предустановлен или же подобран эмпирическим путем. Например, порог может быть выбран от 0 до 1 (например, 0,5 или иное значение), как это подробно описано выше в отношении коэффициентов значимости ВО. Состояние или матрица приоритетов отражают не только текущее, но и увязывают между собой понятия полезности/ценности, что можно выразить через понятие «энергия». Энергия в контексте настоящего изобретения представляет собой определенную метрику. Например, значение энергии может быть предзадано диапазоном значений, в зависимости от конкретной реализации системы принятия решений. Энергия может иметь как положительные, так и отрицательные значения (например, -1, 0, 1 или иное значение из предзаданного диапазона).. При этом отрицательное значение энергии означает неверный «путь» системы принятия решений. Система принятия решений должна стремиться к оптимальному равновесному энергетическому состоянию, то есть к фундаментальному состоянию. В данном случае можно принять во внимание принцип свободной энергии Фристона, призванный формализовать процесс принятия решений методом, в каком-то смысле схожим с принципом наименьшего действия в классической механике, который описывает эволюцию физических систем. В целом, базовым принципом любой автоматической системы является ее стремление к достижению равновесного состояния, аналогично принципам психики человека. Супервизор состояний (110) может быть реализован как стандартный вычислительный алгоритм или программа. В другом альтернативном варианте, супервизор состояний (110) может быть реализован в качестве обучаемой определенной модели нейронной сети, которая обучается пересчитывать и детерминировать взаимосвязи между значениями матриц приоритетов в разные момент времени.For further processing, taking into account the significance and the priority matrix, only those VOs are selected that exceed the established threshold of significance, which can be preset or selected empirically. For example, the threshold may be selected from 0 to 1 (eg, 0.5 or other value), as detailed above with respect to the VO significance factors. The state or priority matrix reflects not only the current one, but also links the concepts of usefulness/value, which can be expressed through the concept of "energy". Energy in the context of the present invention is a certain metric. For example, the energy value may be predefined by a range of values, depending on the particular implementation of the decision system. Energy can have both positive and negative values (for example, -1, 0, 1 or another value from a predefined range). In this case, a negative energy value means the wrong "path" of the decision system. The decision-making system should tend to the optimal equilibrium energy state, that is, to the fundamental state. In this case, one can take into account Friston's free energy principle, which is designed to formalize the decision-making process by a method similar in some sense to the principle of least action in classical mechanics, which describes the evolution of physical systems. In general, the basic principle of any automatic system is its desire to achieve an equilibrium state, similar to the principles of the human psyche. The state supervisor (110) may be implemented as a standard computational algorithm or program. In another alternative, the state supervisor (110) may be implemented as a trainable defined neural network model that is trained to recalculate and determine relationships between priority matrix values at different points in time.

Текущее состояние системы определяется в супервизоре состояний (110) набором приоритетов (матрица приоритетов). Микросостояния системы изменяются, если происходят действия в рамках текущего набора ВО. Макросостояние системы может меняться только в случае появления нового ВО или существенных внутренних изменений в системе. При этом стоит учесть, что переход в другое макросостояние системы возможен лишь при достаточном количестве энергии, в зависимости от изменений приоритетов.The current state of the system is determined in the state supervisor (110) by a set of priorities (priority matrix). The microstates of the system change if actions occur within the current set of VOs. The macrostate of the system can change only in the event of a new VO or significant internal changes in the system. At the same time, it should be taken into account that the transition to another macrostate of the system is possible only with a sufficient amount of energy, depending on changes in priorities.

Как было отмечено выше, полученные ΔВО также поступают на вход блока принятия решений (112), который непосредственно взаимодействует с супервизором состояний (110) путем взаимных обратных связей для генерации множества процессов, каждый из которых имеет свой приоритет, о чем более подробно будет указано ниже.As noted above, the received ΔBOs are also fed to the input of the decision block (112), which directly interacts with the state supervisor (110) through mutual feedback to generate a set of processes, each of which has its own priority, which will be discussed in more detail below. .

Полученное оптимальное решение в блоке принятия решений (112) для текущего момента времени отправляется далее в исполнительный блок (114), результатом которого является определенное действие системы. Под действием в контексте данного описания понимается единичная исполнительная программа/алгоритм, передаваемая на выход системы. Созданная информация в системе, а также имеющаяся в виде текущего состояния, обрабатываются, результатом чего становится ответное действие системы в соответствии с правильным оптимальным решением. Важно отметить, что конкретное действие является правильным и оптимальным для системы только в текущем моменте времени и только для такой конфигурации системы.The optimal solution obtained in the decision block (112) for the current time is sent further to the execution unit (114), the result of which is a certain system action. Under the action in the context of this description is understood a single executive program/algorithm transmitted to the output of the system. The created information in the system, as well as the information available in the form of the current state, are processed, resulting in the response of the system in accordance with the correct optimal solution. It is important to note that a specific action is correct and optimal for the system only at the current moment in time and only for such a system configuration.

Данные о принятом решении из исполнительного блока (114) дополнительно поступают в блок оперативного обучения (116), который связан двухсторонней связью с супервизором состояний (110). Блок оперативного обучения (116) сконфигурирован для формирования опыта.Data on the decision made from the execution unit (114) is additionally fed to the operational learning unit (116), which is connected by two-way communication with the state supervisor (110). The operational learning unit (116) is configured to generate an experience.

Чтобы понять принцип работы системы рассмотрим его более подробно с раскрытием процессов/агентов системы. На Фиг. 2 представленная блок-схема функционирования системы принятия решений (200). Работа блока принятия решений (112), соответствующего фиг. 1, базируется на обработке, выполнении и анализе множества сформированных системой процессов. To understand the principle of the system, let's consider it in more detail with the disclosure of the processes / agents of the system. On FIG. 2 is a block diagram of the operation of the decision making system (200). The operation of the decision block (112) corresponding to FIG. 1 is based on the processing, execution and analysis of a plurality of processes generated by the system.

Каждый отдельный процесс — это некоторая подзадача, являющаяся частью общей задачи/цели системы. Разделение на отдельные процессы - единственная возможность построения прикладной системы. Простые процессы легко поддаются формализации и автоматизации. Система приоритетов для параллельных процессов позволяет переключаться на наиболее значимый в настоящий момент процесс и соответственно задачу, что позволяет системе принимать единственно верное оптимальное решение. Each individual process is some subtask that is part of the overall task/goal of the system. Separation into separate processes is the only way to build an applied system. Simple processes are easy to formalize and automate. The system of priorities for parallel processes allows you to switch to the most significant process at the moment and, accordingly, the task, which allows the system to make the only correct optimal decision.

Основная характеристика простого процесса - единственная целевая функция. Именно по этому принципу и происходит разделение на процессы. Одна цель - один процесс (или агент). Каждому выделенного процессу присваивается ячейка приоритета в строке или матрице состояния. Каждая задача отражается в строке (матрице) состояния и реализуется одним отдельным процессом. The main characteristic of a simple process is a single objective function. It is on this principle that the division into processes occurs. One goal - one process (or agent). Each highlighted process is assigned a priority cell in a row or status matrix. Each task is reflected in the status line (matrix) and is implemented by one separate process.

Процесс (или отдельная задача) может быть реализован в виде нейронной сети различного типа (рекуррентная нейронная сеть, сверточная нейронная сеть и т.д.) либо в виде универсального аналитического процесса. Как уже было указано ранее, процесс может представлять из себя универсального агента. Универсальным агентом или интеллектуальным агентом в контексте настоящего описания является программно-техническое средство, автономно действующее в некоторой среде (физической или информационной) и решающее конкретную задачу, в соответствии с поставленными перед системой целями. A process (or a separate task) can be implemented as a neural network of various types (recurrent neural network, convolutional neural network, etc.) or as a universal analytical process. As mentioned earlier, a process can be a universal agent. A universal agent or an intelligent agent in the context of the present description is a software and hardware tool that operates autonomously in some environment (physical or informational) and solves a specific task in accordance with the goals set for the system.

Как показано на фиг. 2, все ВО системы хранятся в библиотеке ВО (106). Библиотека ВО хранит все новые ВО, старые ВО, данные о ВО процессов изменения, а также закономерности кластеризации ВО. При этом в системе может быть предусмотрена фильтрация старых ВО, для снижения затрат на обработку. Так, например, при поступлении идентичного старому нового ВО, старый ВО может быть удален и, например, могут остаться лишь данные о том, что поступил ВО идентичный старому. Новому ВО может быть присвоен аналогичный строму ВО контекст/метаданные и временная метка о поступлении старого ВО и, например, количество поступивших старых ВО. Эти данные могут быть добавлены, например, в метаданные нового поступившего ВО в качестве исторических данных. Как было указано ранее, ВО в библиотеке (106) могут быть разделены на кластеры по схожести. Внутренние образы поступают на вход блока текущего состояния системы (108). Один выход упомянутого блока (108) идет к супервизору состояний (110), откуда на основании матрицы приоритетов и текущего состояния системы отбираются/формируются ΔВО целевого состояния системы. Затем ΔВО попадают в фильтр целей (212), который фильтрует цели и задачи системы по степени их важности для текущего момента и строит оперативно-тактические планы работы системы по принятию решений. Фильтр целей может содержать подблок мышления (не показан на фиг. 2), который отвечает за разработку планов и стратегий. As shown in FIG. 2, all VO systems are stored in the VO library (106). The VO library stores all new VOs, old VOs, data on VOs of change processes, as well as VO clustering patterns. At the same time, filtering of old VOs can be provided in the system to reduce processing costs. So, for example, when a new VO identical to the old one arrives, the old VO can be deleted and, for example, only data can remain that the VO has arrived identical to the old one. The new VO can be assigned a context/metadata similar to the VO stroma and a timestamp about the arrival of the old VO and, for example, the number of old VOs that arrived. This data can be added, for example, to the metadata of a new incoming VO as historical data. As stated earlier, the VOs in the library (106) can be divided into clusters based on similarity. Internal images are input to the block of the current state of the system (108). One output of the mentioned block (108) goes to the state supervisor (110), from where, based on the priority matrix and the current state of the system, ΔVO of the target state of the system are selected/formed. Then ΔVO fall into the goals filter (212), which filters the goals and objectives of the system according to their degree of importance for the current moment and builds operational and tactical plans for the decision-making system. The goal filter may contain a thinking subblock (not shown in Figure 2) that is responsible for developing plans and strategies.

Подблок мышления выполняет анализ предыдущего опыта системы (анализ реакций системы на внешнее воздействие) и моделирования будущих целей и задач системы. Работа системы моделируется в фоновом режиме для прошедшего и будущего времени. То есть моделируются/прогнозируются реакции и действия системы (прошлые или возможные в будущем) на внешние воздействия. Прогнозирование может быть основано, но не ограниваясь на методах экстраполяции, методах корреляционного и факторного анализа, причинно-следственных методах прогнозирования. Моделирование будущих действий системы с учетом имеющегося опыта. Моделирование может выполняться, но не ограничиваясь, например на основании подходов моделирования Лотки-Вольтерры, Бохёффера – ван дер Поля, модели Мальтуса, финансово-экономических математических моделей (например, расчет оптимального расходования ограниченных ресурсов; оптимизации прибыли от размера капиталовложений и др., в зависимости от конкретной реализации системы принятия решений). Результаты моделирования анализируются и корректируются. The thinking sub-block performs an analysis of the previous experience of the system (analysis of the system's reactions to external influences) and modeling of the future goals and objectives of the system. The operation of the system is simulated in the background for past and future tenses. That is, the reactions and actions of the system (past or possible in the future) to external influences are modeled/predicted. Forecasting can be based on, but not limited to, extrapolation methods, correlation and factor analysis methods, causal forecasting methods. Modeling future actions of the system, taking into account existing experience. Modeling can be performed, but not limited to, for example, based on the Lotka-Volterra, Bohoeffer-van der Pol modeling approaches, the Malthus model, financial and economic mathematical models (for example, calculating the optimal use of limited resources; optimizing profit from the size of capital investments, etc., in depending on the specific implementation of the decision-making system). Simulation results are analyzed and corrected.

Фактически подблок мышления реализует внутреннюю деятельность системы, как реакцию на возможные возникающие ситуации (входные данные). Подблок мышления помогает расставлять приоритеты целей и создавать планы и стратегии, однако в самом подблоке не принимаются окончательные решения по дальнейшим действиям системы. In fact, the sub-block of thinking implements the internal activity of the system as a reaction to possible emerging situations (input data). The thinking sub-box helps prioritize goals and create plans and strategies, but the sub-box itself does not make the final decisions on how the system will proceed.

Процесс работы подблока мышления можно свести к моделированию или анализу последовательности действий. При этом результатом подблока мышления является не конкретное действие, а план, стратегия действий, подчинённых глобальной/общей задаче. Цель - задача для действия в текущий момент. План - направление действий в перспективе. План задает вектор (совокупность) целей (целевых состояний). При этом подблок мышления косвенно принимает участие в обучении системы, поскольку в нем анализируются нетипичные/нестандартных ситуаций, после чего такие ситуации переводятся в стандартные – то есть формируется опыт. Формируемый опыт может динамически кластеризоваться известными методами (например, метод к-средних или иной метод динамической кластеризации). The process of work of the thinking sub-block can be reduced to modeling or analyzing the sequence of actions. At the same time, the result of the sub-block of thinking is not a specific action, but a plan, a strategy of actions subordinate to a global/general task. Goal - a task for the action at the current moment. A plan is a direction of action in the future. The plan sets a vector (set) of goals (goal states). At the same time, the sub-block of thinking indirectly takes part in the training of the system, since atypical / non-standard situations are analyzed in it, after which such situations are translated into standard ones - that is, experience is formed. The generated experience can be dynamically clustered by known methods (for example, the k-means method or another dynamic clustering method).

После фильтра целей (212) на вход каждого процесса (или агента) в качестве входных данных поступают отфильтрованные в соответствии с актуальными целями и планами действующие ΔВО. В данном контексте Δ-дельта - это метрика отличия одного ВО от другого (в предыдущий момент времени). Каждый процесс-агент является простым и быстрым, а также универсальным, способным решать разные задачи при соответствующем обучении, поскольку он будет применяться множество раз во всей системе для решения любых частных задач или процессов.After the goals filter (212), the input of each process (or agent) is filtered in accordance with the current goals and plans, the operating ΔVO. In this context, Δ-delta is a metric of the difference between one VO and another (at the previous point in time). Each agent process is simple and fast, as well as versatile, capable of solving different problems with appropriate training, since it will be used many times throughout the system to solve any particular tasks or processes.

Разделение конкретной задачи по созданию прикладной системы на простые параллельные процессы проводится на этапе проектирования и создания конкретной прикладной системы. Перед работой система предварительно конфигурируется и тестируется, например, вручную для проверки правильности разделения на процессы. Для тестирования работы могут быть использованы так же автоматические методы тестирования, например, с ручной валидацией. Цель отдельного процесса - найти максимально ценное решение в рамках своей локальной задачи. При этом каждый процесс должен быть максимально быстрым. The division of a specific task of creating an application system into simple parallel processes is carried out at the stage of designing and creating a specific application system. Before operation, the system is pre-configured and tested, for example manually, to verify that the process division is correct. To test the work, automated testing methods can also be used, for example, with manual validation. The goal of a separate process is to find the most valuable solution within its local problem. Moreover, each process should be as fast as possible.

Следует также отметить, что, когда процессы-агенты системы сформированы, их требуется обучить, например, стандартными методами глубокого обучения до требуемого рабочего уровня. При этом в процессе работы системы в фоновом режиме будет реализовано бесконечное дообучение в режиме реального времени (самосовершенствование).It should also be noted that when the system agent processes are formed, they need to be trained, for example, by standard deep learning methods, to the required working level. At the same time, in the process of system operation in the background, endless additional training in real time (self-improvement) will be implemented.

Каждый отдельный процесс или агент поддается формализации. По каждому процессу может быть принято правильное для него решение. Результаты каждого выполненного процесса системы сохраняются в блок результатов процессов (214) вместе с приоритетом решения. Однако отдельные решения по каждому процессу необходимо интегрировать в совокупное решение, где каждый процесс будет иметь текущую значимость/приоритет, действительную в реальном времени. Each individual process or agent lends itself to formalization. For each process, the right decision can be made for it. The results of each executed system process are stored in the process results block (214) along with the decision priority. However, the individual decisions for each process need to be integrated into the overall solution, where each process will have a current real-time value/priority.

Общее оптимальное решение для системы определяется в интеграторе решений (216), в том числе с учетом приоритетов, и представляет собой объединение и корреляцию совокупности правильных решений, полученных из отдельных процессов для достижения поставленной цели. Далее полученное оптимальное решение поступает в исполнительный блок системы (114), который инициирует выполнение системой соответствующего действия.The overall optimal solution for the system is determined in the decision integrator (216), including taking into account priorities, and represents the union and correlation of the set of correct solutions obtained from individual processes to achieve the goal. Further, the obtained optimal solution enters the execution unit of the system (114), which initiates the execution of the corresponding action by the system.

Данные, хранящиеся в блоке результатов процессов (214), также поступают на вход супервизора состояний (110), который на основании прошлых решений корректирует текущую матрицу приоритетов. Обновленные данные от супервизора состояний поступают в библиотеку ВО (106) для своевременного изменения содержания ВО на основании процессов системы.The data stored in the process results block (214) is also input to the state supervisor (110), which, based on past decisions, corrects the current priority matrix. Updated data from the state supervisor is sent to the VO library (106) to change the content of the VO in a timely manner based on the system processes.

Далее рассмотрим один такт работы системы принятия решений (100). В ответ на изменение внешних воздействий в системе предусмотрено два типа реакций. Разные реакции соответствуют следующим ситуациям: (1) появление нового ВО и (2) изменение значимости/состояния актуальных ВО (в ответ на некоторое действие в окружающем мире). Один такт работы системы составляет приблизительно 1 секунду, или иное значение, в рамках требования к конкретной прикладной задаче. Next, consider one cycle of the decision-making system (100). In response to a change in external influences, two types of reactions are provided in the system. Different reactions correspond to the following situations: (1) the emergence of a new VO and (2) a change in the significance/state of actual VOs (in response to some action in the surrounding world). One cycle of the system is approximately 1 second, or another value, within the requirements of a particular application.

Первая ситуация - когда нет нового ВО или каких-либо кардинальных изменений в действующих ВО. В таком случае системой вычисляется незначительное изменение действий, на основании чего выполняется коррекция выходных решений системы. Макросостояние системы в таком случае не меняется, а для микросостояний системы в супервизоре состояний (110) вычисляются колебания. Такой такт быстрый и простой. The first situation is when there is no new VO or any fundamental changes in existing VOs. In this case, the system calculates a slight change in the actions, on the basis of which the correction of the output decisions of the system is performed. In this case, the macrostate of the system does not change, and oscillations are calculated for the microstates of the system in the state supervisor (110). This move is quick and easy.

На основании вычисленных колебаний в супервизоре состояний (110) в фоновом режиме продолжает работать фильтр целей (212), расположенный в блоке принятия решений (112), а точнее его подблок мышления. Мышление системы актуально для текущего состояния (соответствует макросостоянию системы) и изменяется в режиме реального времени в связи с внешними воздействиями на систему. Подблок мышления реализует обработку информации в пространстве системы.Based on the calculated fluctuations in the state supervisor (110), the goal filter (212) located in the decision block (112), or rather its thinking subblock, continues to work in the background. The thinking of the system is relevant for the current state (corresponds to the macrostate of the system) and changes in real time due to external influences on the system. The thinking subblock implements information processing in the system space.

Вторая ситуация - появление нового ВО для системы. Новый ВО характеризуется своим содержанием (набором ассоциаций и причинно-следственных связей, атрибутов), которое может влиять как на микросостояния, так и на макросостояние системы. Упомянутые состояния в таком случае подвергаются пересчету. В основе расчетов/перерасчетов состояний может лежать подход по принципу цепи Маркова, математические методы нечеткой логики (например, адаптивная нейро-нечеткая система вывода, описанная в универсальной форме аппроксиматоров и др.).The second situation is the emergence of a new VO for the system. A new VO is characterized by its content (a set of associations and causal relationships, attributes), which can affect both the microstates and the macrostate of the system. The mentioned states in this case are recalculated. State calculations/recalculations can be based on the Markov chain approach, mathematical methods of fuzzy logic (for example, an adaptive neuro-fuzzy inference system described in the universal form of approximators, etc.).

Цепь Маркова — последовательность случайных событий с конечным или счётным числом исходов, где вероятность наступления каждого события зависит только от состояния, достигнутого в предыдущем событии. Цепь Маркова характеризуется тем, что при фиксированном настоящем будущее независимо от прошлого. Каждый отдельный процесс в каждый момент времени находится в одном из n состояний. При этом, если он находится в состоянии с номером i, то он перейдет в состояние j с вероятностью pij. Матрицу Р=|| pij || называют матрицей переходов. Марковскую цепь можно также представить в виде графа, в котором вершины — это состояния процесса, а ребра — переходы между состояниями, и на ребре из i в j написана вероятность перехода из i в j, то есть pij.A Markov chain is a sequence of random events with a finite or countable number of outcomes, where the probability of each event occurring depends only on the state reached in the previous event. The Markov chain is characterized by the fact that with a fixed present, the future is independent of the past. Each individual process is in one of n states at any given time. Moreover, if it is in state number i, then it will go to state j with probability pij. Matrix P=|| pij || is called the transition matrix. The Markov chain can also be represented as a graph in which the vertices are the states of the process, and the edges are the transitions between states, and the probability of transition from i to j is written on the edge from i to j, that is, pij.

Возвращаясь ко второй ситуации, если меняется макросостояние системы, то в блок текущего состояния системы (108), отражающий картину мира, подгружаются внутренние образы (ВО), соответствующие этому состоянию. Для прошлой ситуации новые подгруженные ВО были незначимыми, а для текущего состояния они становятся действующими. Микросостояние системы соответственно тоже вычисляется заново. Новое/текущее микросостояние становится некоторой стартовой/исходной точкой для последующего анализа новых микросостояний. Returning to the second situation, if the macrostate of the system changes, then the block of the current state of the system (108), which reflects the picture of the world, is loaded with internal images (IO) corresponding to this state. For the past situation, the newly loaded VOs were insignificant, and for the current state they become active. The microstate of the system is also recalculated accordingly. The new/current microstate becomes some starting/starting point for further analysis of new microstates.

Если же новый ВО недостаточно "силен", чтобы изменить макросостояние системы, то в таком случае изменяются только микросостояния, причем изменения могут быть достаточно кардинальными.If the new VO is not "strong" enough to change the macrostate of the system, then only the microstates change, and the changes can be quite dramatic.

В каждом такте системы вычисляется текущее оптимальное решение. Оно вычисляется на основе состояния, в котором начинался данный такт. То есть на основе матрицы приоритетов, которая сформирована супервизором состояний (110) по результатам работы предыдущего такта. Новая матрица приоритетов с текущего такта будет использована только в следующем такте. Аналогичным образом рассчитывается в каждом новом такте матрица значимости внутренних образов для следующего момента времени. In each cycle of the system, the current optimal solution is calculated. It is calculated based on the state in which the given measure began. That is, based on the priority matrix, which is formed by the state supervisor (110) based on the results of the previous cycle. The new priority matrix from the current cycle will only be used in the next cycle. In a similar way, in each new cycle, the matrix of the significance of internal images for the next time moment is calculated.

На Фиг. 3 представлена блок-схема одного из возможных вариантов реализации настоящего изобретения, при котором применяется облачное хранилище данных. Проиллюстрирована передача данных между системой принятия решений (100) и облаком (302). Важно отметить, что библиотека ВО (106) и библиотека знаний (118) могут располагаться в облаке. Такой известный подход организации распределенного хранения библиотек в некоторых вариантах реализации позволяет сократить ресурсы системы на локальное хранение данных и позволить быстрее обращаться системе принятия решений (100) к указанным библиотекам из любой точки мира. Однако, такой подход организации хранения библиотек не является приоритетным, а лишь одним из возможных вариантов реализации. Упомянутый подход хранения требует постоянного доступа к сети, что не всегда возможно, в случае реализации системы в качестве локальной и не предполагающей доступа к сети, либо имеющей ограничения на доступ к сети (например, автономная система автоматического пилотирования и принятия решений подводной лодки, космического корабля и др.). С другой стороны, в перспективе совершенствования технологий доступа к сети интернет и техники, распределенный облачный подход хранения данных может быть возможен в качестве базового для системы принятия решений при некоторых конкретных вариантах ее реализации.On FIG. 3 is a block diagram of one of the possible implementations of the present invention, which uses cloud storage. Illustrated is the transfer of data between the decision system (100) and the cloud (302). It is important to note that the VO library (106) and the knowledge library (118) can be located in the cloud. Such a well-known approach to the organization of distributed storage of libraries in some implementations can reduce system resources for local data storage and allow the decision system (100) to access the specified libraries from anywhere in the world faster. However, this approach to organizing library storage is not a priority, but only one of the possible implementation options. The mentioned storage approach requires constant access to the network, which is not always possible if the system is implemented as a local system and does not require network access, or has restrictions on network access (for example, an autonomous system for automatic piloting and decision-making of a submarine, spacecraft and etc.). On the other hand, in the perspective of improving Internet access technologies and technology, a distributed cloud data storage approach may be possible as a base for a decision-making system with some specific implementation options.

На Фиг. 4 представлена блок-схема примерного способа принятия решений 400. Способ 400 и/или каждая из его отдельных функций, программ, подпрограмм или операций могут выполняться одним или несколькими процессорами компьютерной системы (в частности, компьютерной системы 500, изображенной на Фиг. 5), реализующей способ 400. В некоторых вариантах осуществления способ 400 может выполняться с помощью одного потока обработки. В альтернативном варианте осуществления способ 400 может выполняться двумя или несколькими потоками обработки, каждый из которых выполняет одну или несколько отдельных функций, программ, подпрограмм или операций, относящихся к данному способу. В одном из вариантов реализации потоки обработки, реализующие способ 400, могут быть синхронизированы (например, с использованием семафоров, критических секций и/или других механизмов синхронизации потоков). В альтернативном варианте осуществления потоки обработки, реализующие способ 400, могут выполняться асинхронно по отношению друг к другу. Поэтому, несмотря на то что на Фиг. 4 и в связанных с ним описаниях, операции способа 400 выполняются в определенном порядке, в различных вариантах осуществления данного способа как минимум некоторые из описанных операций могут выполняться параллельно и/или в произвольно выбранном порядке. On FIG. 4 is a flowchart of an exemplary decision making process 400. Method 400 and/or each of its individual functions, programs, subroutines, or operations may be executed by one or more processors of a computer system (in particular, computer system 500 depicted in FIG. 5), implementing method 400. In some embodiments, method 400 may be performed using a single processing thread. In an alternative embodiment, method 400 may be executed by two or more processing threads, each of which performs one or more separate functions, programs, subroutines, or operations related to the method. In one embodiment, the processing threads implementing method 400 may be synchronized (eg, using semaphores, critical sections, and/or other thread synchronization mechanisms). In an alternative embodiment, the processing threads implementing method 400 may execute asynchronously with respect to each other. Therefore, although in FIG. 4 and associated descriptions, the steps of method 400 are performed in a specific order, in various embodiments of the method, at least some of the described steps may be performed in parallel and/or in an arbitrary order.

Способ 400 в одном из примерных вариантов реализации содержит следующие этапы:Method 400, in one exemplary embodiment, comprises the following steps:

Этап 402. Получение вычислительной системой данных внешнего воздействия от датчиков или устройств системы.Step 402. Receipt by the computing system of data of external influence from sensors or devices of the system.

Этап 404. Формирование внутренних образов (ВО) системы, на основании полученных данных внешнего воздействия, при этом ВО хранятся в библиотеке ВО.Step 404. Formation of internal images (VO) of the system, based on the received data of external influence, while the VO is stored in the VO library.

Этап 406. Отбор действующих ВО, соответствующих текущему состоянию системы в настоящий момент времени.Step 406. Selection of active VOs corresponding to the current state of the system at the present time.

Этап 408. Вычисление матрицы приоритетов для действующих ВО.Step 408: Compute a priority matrix for active VOs.

Этап 410. Принятие оптимального решения на основании выполнения множества процессов, причем входными данными для данного этапа являются действующие ВО и матрица приоритетов. Step 410: Making an optimal decision based on the execution of a plurality of processes, the input to this step being the live VOs and a priority matrix.

Этап 412. Исполнение вычислительной системой принятого решения.Step 412: Execution of the decision made by the computing system.

Этап 414. Формирование опыта системы на основании принимаемых решений.Step 414. Formation of the experience of the system based on the decisions made.

Следует отметить, что способ принятия решений 400 может быть расширен и уточнен всеми частными вариантами исполнения, которые уже были описаны выше для вариантов реализаций системы принятия решений 100.It should be noted that the decision making method 400 can be extended and refined by all of the particular implementations that have already been described above for the implementations of the decision making system 100.

На Фиг. 5 представлена блок-схема компьютерной системы в соответствии с некоторыми вариантами реализации настоящего изобретения. Компьютерная система может быть подключена (например, по сети) к другим компьютерным системам в локальной сети, интрасети, экстрасети или сети Интернет. Компьютерная система может работать в качестве сервера в сетевой среде клиент-сервер. Компьютерная система может быть персональным компьютером (PC), планшетным компьютером, ТВ-приставкой (STB), персональным цифровым помощником (PDA), мобильным телефоном или любым устройством, способным выполнять набор инструкций (последовательных или иных), определяющих действия, которые должны выполняться этим устройством. Кроме того, несмотря на то что проиллюстрирована только одна компьютерная система, термин «компьютер» также следует понимать как любую совокупность компьютеров, которые индивидуально или совместно выполняют набор (или несколько наборов) инструкций для выполнения любого одного или нескольких способов, описанных в настоящем описании. В качестве компьютера так же может выступать суперкомпьютер, например, под управлением Linux.On FIG. 5 is a block diagram of a computer system in accordance with some embodiments of the present invention. The computer system may be connected (eg, over a network) to other computer systems on a local area network, an intranet, an extranet, or the Internet. The computer system may operate as a server in a client-server network environment. A computer system may be a personal computer (PC), a tablet computer, a set-top box (STB), a personal digital assistant (PDA), a mobile phone, or any device capable of executing a set of instructions (sequential or otherwise) that specifies actions to be performed by that system. device. In addition, while only one computer system is illustrated, the term "computer" should also be understood as any collection of computers that individually or collectively execute a set (or multiple sets) of instructions to perform any one or more of the methods described herein. A supercomputer, for example, running Linux, can also act as a computer.

Примерная компьютерная система 500 состоит из устройства 502 обработки данных, оперативного запоминающего устройства 504 (например, постоянного запоминающего устройства (ROM), флеш-памяти, динамической памяти с произвольным доступом (DRAM), такой как синхронная динамическая память с произвольным доступом (SDRAM)), и устройства 508 хранения данных, которые взаимодействуют друг с другом через шину 522.An exemplary computer system 500 consists of a data processing device 502, random access memory 504 (e.g., read only memory (ROM), flash memory, dynamic random access memory (DRAM) such as synchronous dynamic random access memory (SDRAM)) , and storage devices 508 that communicate with each other via bus 522.

Устройство 502 обработки данных представляет собой одно или несколько устройств обработки общего назначения, таких как микропроцессор, центральный процессор и т.п. Устройство 502 обработки данных может быть микропроцессором с полным наборов команд (CISC), микропроцессором для вычисления сокращенных наборов команд (RISC), микропроцессором с очень длинным командным словом (VLIW), процессором, реализующим другие наборы команд, или процессором, реализующим сочетание наборов команд. The data processing device 502 is one or more general purpose processing devices such as a microprocessor, a central processing unit, and the like. Processing device 502 may be a full instruction set computing (CISC) microprocessor, a reduced instruction set computing (RISC) microprocessor, a very long instruction word (VLIW) microprocessor, a processor implementing other instruction sets, or a processor implementing a combination of instruction sets.

Устройство 502 обработки данных также может представлять собой одно или несколько устройств обработки специального назначения, таких как специализированная интегральная схема (ASIC), программируемая на месте матрица логических элементов (FPGA), цифровой сигнальный процессор (DSP), сетевой процессор и т.п. Устройство 502 обработки данных сконфигурировано для выполнения инструкций 530 с целью реализации способа принятия решений 400 (Фиг. 4), а также для выполнения любых описанных выше операций.The data processing device 502 may also be one or more special purpose processing devices such as an application specific integrated circuit (ASIC), a field programmable gate array (FPGA), a digital signal processor (DSP), a network processor, and the like. Data processor 502 is configured to execute instructions 530 to implement decision method 400 (FIG. 4) as well as to perform any of the operations described above.

Компьютерная система 500 может дополнительно включать сетевой интерфейс 506, устройство 512 визуального отображения (например, жидкокристаллический дисплей), буквенно-цифровое устройство 514 ввода (например, клавиатуру), устройство 516 управления курсором и устройство принятия внешнего воздействия 518. В одном варианте реализации устройство 512 визуального отображения, устройство 514 буквенно-цифрового ввода и устройство 516 управления курсором могут быть объединены в единый компонент или устройство (например, сенсорный жидкокристаллический дисплей). The computer system 500 may further include a network interface 506, a visual display device 512 (eg, a liquid crystal display), an alphanumeric input device 514 (eg, a keyboard), a cursor control device 516, and an stimulus acceptor 518. In one embodiment, the device 512 display, the alphanumeric input device 514, and the cursor control device 516 may be combined into a single component or device (eg, a touch-sensitive liquid crystal display).

Устройство принятия внешнего воздействия 518 представляет собой одно или несколько устройств или датчиков для принятия внешнего воздействия. В качестве устройства принятия внешнего воздействия может выступать видеокамера, микрофон, сенсорный датчик, датчик движения, датчик температуры, датчик влажности, датчик дыма, датчик освещенности и т.п.An stimulus receiving device 518 is one or more devices or sensors for receiving an external stimulus. A video camera, a microphone, a touch sensor, a motion sensor, a temperature sensor, a humidity sensor, a smoke sensor, a light sensor, etc. can act as a device for receiving external influences.

Устройство 508 хранения данных может включать машиночитаемый носитель 510 данных, на котором хранятся инструкции 530, воплощающие любую одну или несколько методик или функций, описанных в настоящем документе (способ 400). Инструкции 530 также могут полностью или, по крайней мере, частично находиться в оперативной памяти 504 и/или на устройстве 502 обработки данных во время их выполнения компьютерной системой 500. Оперативная память 504 и устройство обработки 502 данных также представляют собой машиночитаемые носители данных. В некоторых реализациях инструкции 530 могут дополнительно передаваться или приниматься по сети 520 через сетевое интерфейсное устройство 506.Storage device 508 may include a computer-readable storage medium 510 that stores instructions 530 embodying any one or more of the techniques or functions described herein (method 400). The instructions 530 may also reside wholly or at least partially in RAM 504 and/or on data processor 502 while being executed by computer system 500. RAM 504 and data processor 502 are also computer-readable storage media. In some implementations, instructions 530 may additionally be transmitted or received over network 520 via network interface device 506.

Несмотря на то, что в иллюстративных примерах машиночитаемый носитель 410 данных представлен в единственном числе, термин «машиночитаемый носитель» следует понимать как включающий в себя один или несколько носителей (например, централизованную или распределенную базу данных и (или) связанные с ней кэши и серверы), в которых хранится один или несколько наборов инструкций. Термин «машиночитаемый носитель» также следует понимать как включающий в себя какой-либо носитель, способный хранить, кодировать или переносить набор инструкций для выполнения машиной и вынуждающий машину выполнять любую одну или несколько методик настоящего изобретения. Следовательно, термин «машиночитаемый носитель» должен включать, помимо прочего, твердотельные запоминающие устройства, оптические и магнитные носители данных.Although in the illustrative examples the computer-readable storage medium 410 is represented in the singular, the term "machine-readable medium" should be understood as including one or more media (for example, a centralized or distributed database and/or its associated caches and servers). ) that store one or more instruction sets. The term "machine-readable medium" should also be understood to include any medium capable of storing, encoding, or carrying a set of instructions for execution by a machine and causing the machine to perform any one or more of the techniques of the present invention. Therefore, the term "computer-readable medium" should include, but is not limited to, solid-state storage devices, optical and magnetic storage media.

Несмотря на то, что операции описанных в настоящем документе способов показаны и описаны в определенном порядке, порядок операций каждого способа может быть изменен таким образом, чтобы определенные операции могли выполняться в обратном порядке или чтобы определенные операции могли выполняться по меньшей мере частично одновременно с другими операциями. В некоторых реализациях инструкции или подоперации отдельных операций могут быть прерывающимися и (или) чередующимися.While the steps of the methods described herein are shown and described in a particular order, the order of steps of each method can be changed so that certain steps can be performed in reverse order, or so that certain steps can be performed at least partially simultaneously with other steps. . In some implementations, instructions or sub-operations of individual operations may be intermittent and/or interleaved.

Следует понимать, что приведенное выше описание является иллюстративным, а не ограничительным. Специалистам в данной области техники станут очевидны многие другие варианты реализации после прочтения и понимания приведенного выше описания. Поэтому объем изобретения определяется со ссылкой на прилагаемую формулу изобретения, а также на полный объем эквивалентов, в отношении которых такая формула изобретения дает право предъявлять претензии.It should be understood that the above description is illustrative and not restrictive. Many other embodiments will become apparent to those skilled in the art upon reading and understanding the above description. Therefore, the scope of the invention is determined by reference to the appended claims as well as to the full scope of equivalents against which such claims give rise to claims.

В приведенном выше описании излагаются многочисленные детали. Однако специалисту в данной области техники будет очевидно, что аспекты настоящего изобретения могут быть реализованы на практике без этих конкретных деталей. В некоторых случаях, чтобы избежать затруднения понимания настоящего изобретения, хорошо известные структуры и устройства представлены в виде блок-схемы, а не подробно.In the above description, numerous details are set forth. However, one skilled in the art will appreciate that aspects of the present invention may be practiced without these specific details. In some cases, to avoid obscuring the present invention, well-known structures and devices are presented in block diagram form rather than in detail.

Следует отметить, что при отсутствии других конкретных указаний, как стало очевидно из последующего обсуждения, на протяжении всего описания такие термины в обсуждении, как «получение», «определение», «выбор», «хранение», «анализ» и т. п., относятся к действиям и процессам компьютерной системы или аналогичного электронного вычислительного устройства, которое манипулирует данными и преобразует данные, представленные в виде физических (электронных) величин в регистрах и памяти компьютерной системы, в другие данные, аналогичным образом представленные в виде физических величин в памяти или регистрах компьютерной системы или других таких устройствах хранения, передачи или отображения информации.It should be noted that in the absence of other specific indications, as became apparent from the following discussion, throughout the description, such terms in the discussion as "obtaining", "determining", "selection", "storage", "analysis", etc. ., refers to the activities and processes of a computer system or similar electronic computing device that manipulates data and converts data represented as physical (electronic) quantities in the registers and memory of a computer system into other data similarly represented as physical quantities in memory or registers of a computer system or other such devices for storing, transmitting or displaying information.

Настоящее изобретение также относится к устройству для выполнения операций, описанных в настоящем документе. Это устройство может быть специально сконструировано для требуемых целей или может содержать компьютер общего назначения, избирательно активируемый или реконфигурируемый компьютерной программой, хранящейся в компьютере. Такая компьютерная программа может храниться на машиночитаемом носителе данных, например, на дисках любого типа, включая дискеты, оптические диски, компакт-диски и магнитно-оптические диски, постоянные запоминающие устройства (ROM), оперативную память (RAM), программируемые постоянные запоминающие устройства (EPROM), электронно-перепрограммируемые постоянные запоминающие устройства (EEPROM), магнитные или оптические карты или носители любого типа, пригодные для хранения электронных инструкций, каждый из которых подключен к компьютерной системной шине.The present invention also relates to a device for performing the operations described in this document. This device may be specially designed for the desired purpose or may include a general purpose computer selectively activated or reconfigured by a computer program stored in the computer. Such a computer program may be stored on a computer-readable storage medium, such as any type of disk, including floppy disks, optical disks, compact disks and magnetic optical disks, Read Only Memory (ROM), Random Access Memory (RAM), Programmable Read Only Memory (RAM). EPROM), electronically programmable read-only memory (EEPROM), magnetic or optical cards, or any type of media suitable for storing electronic instructions, each connected to a computer system bus.

Представленные в настоящем документе алгоритмы, по своей сути, не связаны с конкретным компьютером или другим устройством. Различные системы общего назначения могут использоваться с программами в соответствии с приведенными в настоящем документе положениями, либо же будет удобнее создать более специализированное устройство для выполнения требуемых этапов способа. Требуемая структура для разнообразных таких систем будет выглядеть так, как указано в описании. Кроме того, аспекты настоящего изобретения не описаны со ссылкой на конкретный язык программирования. Следует иметь в виду, что для реализации положений настоящего изобретения могут использоваться различные языки программирования, как описано в настоящем документе.The algorithms presented in this document are not inherently associated with a specific computer or other device. Various general purpose systems may be used with programs in accordance with the teachings herein, or it may be more convenient to create a more specialized device to perform the required method steps. The required structure for a variety of such systems will be as indicated in the description. In addition, aspects of the present invention are not described with reference to a specific programming language. It should be borne in mind that various programming languages can be used to implement the provisions of the present invention, as described in this document.

Варианты реализации настоящего изобретения могут быть представлены в виде программного продукта или программного обеспечения, включающего машиночитаемый носитель с сохраненными на нем инструкциями, которые могут использоваться для программирования компьютерной системы (или других электронных устройств) с целью выполнения процесса в соответствии с настоящим изобретением. Машиночитаемый носитель включает любой механизм для хранения или передачи информации в форме, читаемой машиной (например, компьютером). К примеру, машиночитаемый (например, читаемый компьютером) носитель включает машиночитаемый (например, читаемый компьютером) носитель информации (например, постоянное запоминающее устройство (ROM), оперативную память (RAM), носитель информации на магнитных дисках, оптический носитель информации, устройства флэш-памяти). Embodiments of the present invention may be in the form of a software product or software including a computer-readable medium with instructions stored thereon, which may be used to program a computer system (or other electronic devices) to perform the process in accordance with the present invention. A computer-readable medium includes any mechanism for storing or transmitting information in a form that is readable by a machine (eg, computer). For example, computer-readable (e.g., computer-readable) media includes computer-readable (e.g., computer-readable) storage media (e.g., read-only memory (ROM), random access memory (RAM), magnetic disk storage media, optical storage media, flash memory).

Слова «пример» или «приведенный в качестве примера» в настоящем документе означают пример, случай или иллюстрацию. Любой аспект или решение, описанные в настоящем документе как «пример» или «приведенный в качестве примера», необязательно должны рассматриваться как предпочтительный или преимущественный по сравнению с другими аспектами или решениями. Скорее, использование слов «пример» или «приведенный в качестве примера» предназначено для представления концепций с практической точки зрения. При использовании в настоящей заявке термин «или» предназначен для обозначения включающего «или», а не исключающего «или». Кроме того, использование термина «реализация», «один вариант реализации», «пример реализации» или «один пример реализации» во всем тексте не означает один и тот же вариант или пример реализации, если только они не описаны как таковые. Кроме того, термины «первый», «второй», «третий», «четвертый» и т. д., используемые в настоящем документе, предназначены для обозначения различных элементов и необязательно имеют порядковое значение в соответствии с их числовым обозначением.The words "example" or "given as an example" in this document means an example, case or illustration. Any aspect or solution described herein as "example" or "given as an example" should not necessarily be construed as preferable or advantageous over other aspects or solutions. Rather, the use of the words "example" or "exemplary" is intended to present concepts from a practical point of view. As used in this application, the term "or" is intended to mean an inclusive "or" and not an exclusive "or". In addition, the use of the terms "implementation", "single implementation", "exemplary implementation" or "single implementation" throughout the text does not mean the same implementation or implementation, unless they are described as such. In addition, the terms "first", "second", "third", "fourth", etc., used in this document are intended to refer to various elements and do not necessarily have an ordinal value in accordance with their numerical designation.

В то время как многие изменения и модификации изобретения без сомнения станут очевидными для специалиста, обладающего обычной квалификацией в данной области техники, после прочтения приведенного выше описания следует понимать, что любой конкретный вариант реализации, показанный и описанный в качестве иллюстрации, никоим образом не должен рассматриваться как ограничивающий. While many changes and modifications to the invention will no doubt become apparent to one of ordinary skill in the art, upon reading the foregoing description it should be understood that any particular embodiment shown and described by way of illustration should not be construed in any way. as limiting.

Поэтому ссылки на детали различных вариантов реализации не предназначены для ограничения объема формулы изобретения, которая сама по себе содержит только признаки, рассматриваемые как раскрытие изобретения.Therefore, references to the details of the various embodiments are not intended to limit the scope of the claims, which by themselves contain only the features considered as a disclosure of the invention.

Claims (40)

1. Автономная система принятия решений, содержащая: 1. Autonomous decision-making system, containing: блок получения внешних воздействий (102), сконфигурированный для получения данных внешнего воздействия от датчиков или устройств системы;an external influence receiving unit (102) configured to receive external influence data from sensors or devices of the system; блок обработки внешних воздействий (104), сконфигурированный для формирования внутренних образов (ВО) системы, на основании полученных данных внешнего воздействия;an external impact processing unit (104) configured to generate internal images (IN) of the system based on the received external impact data; библиотеку ВО (106), которая хранит и корректирует ВО системы, получаемые от блока обработки внешних воздействий;the VO library (106), which stores and corrects the VO of the system received from the external influence processing unit; блок текущего состояния системы (108), который на основании данных от блока знаний (118) отбирает действующие ВО, соответствующие текущему состоянию системы в настоящий момент времени;a block of the current state of the system (108), which, based on data from the block of knowledge (118), selects the active VO corresponding to the current state of the system at the present time; супервизор состояний (110), сконфигурированный для расчета матрицы приоритетов для действующих ВО;a state supervisor (110) configured to calculate a priority matrix for active VOs; блок принятия решений (112), связанный с супервизором состояний (110) и сконфигурированный для принятия решения на основании выполнения множества процессов, причем входными данными блока принятия решений являются действующие ВО и матрица приоритетов;a decision block (112) associated with the state supervisor (110) and configured to make a decision based on the execution of a plurality of processes, the input of the decision block being the active VO and the priority matrix; исполнительный блок (114), сконфигурированный для реализации принятого решения;execution unit (114), configured to implement the decision; блок оперативного обучения (116), сконфигурированный для формирования опыта системы на основании принимаемых решений; и an operational learning unit (116) configured to generate a system experience based on the decisions made; And общий блок обучения (120), сконфигурированный для обучения библиотеки ВО (106) и библиотеки знаний (118).a common learning unit (120) configured to train the VO library (106) and the knowledge library (118). 2. Система по п.1, в которой блок получения ВВ реализован нейронной сетью, выполняющей распознавание ВО.2. The system according to claim 1, in which the block for obtaining IE is implemented by a neural network that performs VO recognition. 3. Система по п.1, в которой внутренние образы (ВО) в библиотеке ВО разбиваются на группы однородных ВО, соответствующих гомогенному контексту.3. The system according to claim 1, in which the internal images (IO) in the IO library are divided into groups of homogeneous VO corresponding to a homogeneous context. 4. Система по п.1, в которой внутренние образы в библиотеке ВО разбиваются на кластеры по схожести.4. The system according to claim 1, in which the internal images in the VO library are divided into clusters by similarity. 5. Система по п.1, в которой супервизор состояний (110) дополнительно сконфигурирован для изменения макросостояния и микросостояний системы на основании внешних воздействий.5. The system of claim 1, wherein the state supervisor (110) is further configured to change the macro state and micro states of the system based on external influences. 6. Система по п.4, в которой при появлении нового ВО супервизор состояний (110) выполняет перерасчет состояний.6. The system according to claim 4, in which, when a new VO appears, the state supervisor (110) recalculates the states. 7. Система по п.5, в которой для расчета и перерасчета состояний используются цепи Маркова. 7. The system of claim 5, wherein Markov chains are used to calculate and recalculate states. 8. Система по п.1, в которой блок принятия решений включает в себя фильтр целей (212), блок результатов процессов (214) и интегратор решений (216).8. The system of claim 1, wherein the decision block includes a goal filter (212), a process results block (214), and a decision integrator (216). 9. Система по п.7, в которой фильтр целей (212) содержит подблок мышления.9. The system of claim 7, wherein the goal filter (212) comprises a thinking subblock. 10. Система по п.1, в которой блок принятия решений (112) реализует множество параллельных процессов.10. The system of claim 1, wherein the decision block (112) implements a plurality of parallel processes. 11. Система по п.1, в которой каждый процесс из множества процессов реализован универсальным агентом или универсальным аналитическим процессом.11. The system of claim 1, wherein each process of the plurality of processes is implemented by a universal agent or universal analytic process. 12. Система по п.10, дополнительно сконфигурированная для обучения универсальных агентов.12. The system of claim 10, further configured to train universal agents. 13. Система по п.1, в которой блок результатов процессов (214) имеет обратную связь с супервизором состояний (110).13. The system of claim 1, wherein the process results block (214) has feedback to the state supervisor (110). 14. Способ автоматизированного принятия решений, реализуемый вычислительной системой, включающий такие этапы, как: 14. A method for automated decision-making implemented by a computer system, including steps such as: получение вычислительной системой данных внешнего воздействия от датчиков или устройств системы;receipt by the computing system of data of external influence from sensors or devices of the system; формирование внутренних образов (ВО) системы на основании полученных данных внешнего воздействия, причем ВО системы хранятся в библиотеке ВО;formation of internal images (IO) of the system based on the received data of external influence, and the IO of the system is stored in the VO library; отбор действующих ВО, соответствующих текущему состоянию системы в настоящий момент времени;selection of operating VOs corresponding to the current state of the system at the present time; вычисление матрицы приоритетов для действующих ВО;calculation of the priority matrix for active VOs; принятие решения на основании выполнения множества процессов, причем входными данными для данного этапа являются действующие ВО и матрица приоритетов;making a decision based on the execution of a plurality of processes, and the input data for this stage are the current VO and the priority matrix; исполнение вычислительной системой принятого решения; иexecution by the computer system of the decision made; And формирование опыта системы на основании принимаемых решений.formation of the experience of the system based on the decisions made. 15. Способ по п.14, в котором полученные данные внешнего воздействия обрабатываются нейронной сетью, выполняющей распознавание ВО.15. The method according to claim 14, in which the received external influence data is processed by a neural network that performs VO recognition. 16. Способ по п.14, в котором внутренние образы (ВО) разбиваются на группы однородных ВО, соответствующих гомогенному контексту.16. The method according to claim 14, in which the internal images (IR) are divided into groups of homogeneous IRs corresponding to a homogeneous context. 17. Способ по п.14, в котором внутренние образы разбиваются на кластеры по схожести.17. The method of claim 14, wherein the internal patterns are clustered by similarity. 18. Способ по п.14, дополнительно сконфигурирован для изменения макросостояния и микросостояний системы на основании внешних воздействий.18. The method of claim 14 is further configured to change the macrostate and microstates of the system based on external influences. 19. Способ по п.18, в котором при появлении нового ВО выполняется перерасчет состояний.19. The method of claim 18, wherein when a new VO appears, the states are recalculated. 20. Способ по п.19, в котором для расчета и перерасчета состояний используются цепи Маркова. 20. The method of claim 19, wherein Markov chains are used to calculate and recalculate the states. 21. Способ по п.14, выполненный с возможностью реализации множества параллельных процессов для принятия решения.21. The method of claim 14, configured to implement a plurality of parallel decision processes. 22. Способ по п.14, в котором каждый процесс из множества процессов реализован универсальным агентом или универсальным аналитическим процессом.22. The method of claim 14, wherein each of the plurality of processes is implemented by a generic agent or generic analytic process. 23. Способ по п.22, выполненный с возможностью обучения универсальных агентов.23. The method of claim 22, configured to train universal agents. 24. Машиночитаемый энергонезависимый носитель данных, содержащий исполняемые инструкции, которые при исполнении компьютерной системой заставляют компьютерную систему выполнять способ принятия решений по любому из пп. 14-23.24. A computer-readable, non-volatile storage medium containing executable instructions that, when executed by a computer system, cause the computer system to execute the decision-making method of any one of claims. 14-23.
RU2021138122A 2021-12-21 2021-12-21 Decision-making system in a multi-agent environment RU2791840C2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
RU2021138122A RU2791840C2 (en) 2021-12-21 Decision-making system in a multi-agent environment
PCT/RU2022/050391 WO2023121514A1 (en) 2021-12-21 2022-12-14 System for making decisions in a multi-agent environment

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2021138122A RU2791840C2 (en) 2021-12-21 Decision-making system in a multi-agent environment

Publications (2)

Publication Number Publication Date
RU2021138122A RU2021138122A (en) 2022-04-01
RU2791840C2 true RU2791840C2 (en) 2023-03-13

Family

ID=

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2601150C2 (en) * 2014-08-18 2016-10-27 Публичное акционерное общество "Татнефть" им. В.Д. Шашина (ПАО "Татнефть" им. В.Д. Шашина) System and method of creating solution base
US10795737B2 (en) * 2013-02-01 2020-10-06 Introspective Power, Inc. Generic distributed processing for multi-agent systems
CN109844653B (en) * 2016-05-13 2020-10-30 维利通阿尔法公司 Controlling a target system using prediction
CN109947567B (en) * 2019-03-14 2021-07-20 深圳先进技术研究院 Multi-agent reinforcement learning scheduling method and system and electronic equipment
US11093829B2 (en) * 2017-10-12 2021-08-17 Honda Motor Co., Ltd. Interaction-aware decision making
RU2755520C1 (en) * 2020-03-27 2021-09-16 Федеральное государственное автономное образовательное учреждение высшего образования "Балтийский федеральный университет имени Иммануила Канта" (БФУ им. И. Канта) Automated logistical intelligent information decision-making system in manufacturing and logistical complex

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10795737B2 (en) * 2013-02-01 2020-10-06 Introspective Power, Inc. Generic distributed processing for multi-agent systems
RU2601150C2 (en) * 2014-08-18 2016-10-27 Публичное акционерное общество "Татнефть" им. В.Д. Шашина (ПАО "Татнефть" им. В.Д. Шашина) System and method of creating solution base
CN109844653B (en) * 2016-05-13 2020-10-30 维利通阿尔法公司 Controlling a target system using prediction
US11093829B2 (en) * 2017-10-12 2021-08-17 Honda Motor Co., Ltd. Interaction-aware decision making
CN109947567B (en) * 2019-03-14 2021-07-20 深圳先进技术研究院 Multi-agent reinforcement learning scheduling method and system and electronic equipment
RU2755520C1 (en) * 2020-03-27 2021-09-16 Федеральное государственное автономное образовательное учреждение высшего образования "Балтийский федеральный университет имени Иммануила Канта" (БФУ им. И. Канта) Automated logistical intelligent information decision-making system in manufacturing and logistical complex

Similar Documents

Publication Publication Date Title
US11899411B2 (en) Hybrid reinforcement learning for autonomous driving
Choi et al. Unmanned aerial vehicles using machine learning for autonomous flight; state-of-the-art
Louati et al. Deep learning and case-based reasoning for predictive and adaptive traffic emergency management
Brittain et al. Autonomous separation assurance with deep multi-agent reinforcement learning
Sahadevan et al. Ground-based 4d trajectory prediction using bi-directional LSTM networks
Osanlou et al. Learning-based preference prediction for constrained multi-criteria path-planning
Pham et al. A generative adversarial imitation learning approach for realistic aircraft taxi-speed modeling
Alhroob et al. Adaptive fuzzy map approach for accruing velocity of big data relies on fireflies algorithm for decentralized decision making
Liu et al. Cooperative Decision-Making for CAVs at Unsignalized Intersections: A MARL Approach with Attention and Hierarchical Game Priors
RU2791840C2 (en) Decision-making system in a multi-agent environment
Saraiva et al. Mobile multirobot manipulation by image recognition
Khamis et al. Deep learning for unmanned autonomous vehicles: A comprehensive review
WO2023121514A1 (en) System for making decisions in a multi-agent environment
Ponomaryova et al. DEVISING AN APPROACH FOR THE AUTOMATED RESTORATION OF SHIPMASTER’S NAVIGATIONAL QUALIFICATION PARAMETERS UNDER RISK CONDITIONS
KR102474974B1 (en) Method, device and system for analyzing brand based on artificial intelligence
Villagra et al. Decision-Making Techniques for Autonomous Vehicles
Wang et al. Brain-inspired intelligence and visual perception
Ayar et al. Image processing methods decision mechanism for surveillance applications with UAVs
Nozarian et al. Uncertainty quantification and calibration of imitation learning policy in autonomous driving
Ramírez-Bedoya et al. Implementation of reinforcement-learning algorithms in autonomous robot navigation
Mu et al. E-Commerce Intelligent Logistics Data Based on Neural Network Model
Scheel Using deep neural networks for scene understanding and behaviour prediction in autonomous driving
Miraftabzadeh et al. Machine learning models in smart cities–data-driven perspective
Hamadouche et al. Online reward adaptation for MDP-based distributed missions
Pradhan et al. Artificial intelligence empowered models for UAV communications