RU2774625C1 - Модифицированный интеллектуальный контроллер с нечеткими правилами и блоком обучения нейросети - Google Patents

Модифицированный интеллектуальный контроллер с нечеткими правилами и блоком обучения нейросети Download PDF

Info

Publication number
RU2774625C1
RU2774625C1 RU2021122322A RU2021122322A RU2774625C1 RU 2774625 C1 RU2774625 C1 RU 2774625C1 RU 2021122322 A RU2021122322 A RU 2021122322A RU 2021122322 A RU2021122322 A RU 2021122322A RU 2774625 C1 RU2774625 C1 RU 2774625C1
Authority
RU
Russia
Prior art keywords
block
neural network
output
input
control
Prior art date
Application number
RU2021122322A
Other languages
English (en)
Inventor
Евгений Александрович Шумков
Original Assignee
Федеральное государственное бюджетное образовательное учреждение высшего образования «Кубанский государственный технологический университет» (ФГБОУ ВО «КубГТУ»)
Filing date
Publication date
Application filed by Федеральное государственное бюджетное образовательное учреждение высшего образования «Кубанский государственный технологический университет» (ФГБОУ ВО «КубГТУ») filed Critical Федеральное государственное бюджетное образовательное учреждение высшего образования «Кубанский государственный технологический университет» (ФГБОУ ВО «КубГТУ»)
Application granted granted Critical
Publication of RU2774625C1 publication Critical patent/RU2774625C1/ru

Links

Images

Abstract

Изобретение относится к интеллектуальным контроллерам. Техническим результатом является повышение адаптационных свойств системы управления на базе интеллектуального контроллера, увеличение скорости работы контролера. Модифицированный интеллектуальный контроллер с нечеткими правилами и блоком обучения нейросети содержит объект управления, блок коэффициента эффективности, блок фаззификации, блок нечеткого вывода, блок дефаззификации, блок истории работы системы, управляющую нейросеть и дополнительно введены блок оценки производительности нейросети, блок обучения нейросети. 2 ил., 1 табл.

Description

Изобретение относится к интеллектуальным контроллерам, использующим принцип обучения с подкреплением, нечеткую логику и может использоваться для управления сложными системами в недетерминированной среде.
Известен «интеллектуальный контроллер с нейронной сетью и правилами самомодификации» по патенту РФ МПК G06F 9/00 №2266558. Контроллер по данному патенту состоит из объекта управления, обучающей нейронной сети, управляющей нейронной сети, блока коэффициента эффективности, блока правил самообучения управляющей нейронной сети, блока истории работы системы. Выходы состояния и действия объекта управления связаны с первым и вторым входами управляющей нейронной сети, выход управляющей нейронной сети связан с входом объекта управления. Выходы действия и состояния объекта управления также связаны с первым и вторым входом блока коэффициента эффективности. Блок коэффициента эффективности связан с первым входом обучающей нейронной сети, второй вход обучающей нейронной сети связан с первым выходом блока истории работы системы, который также связан со вторым входом блока правил самообучения управляющей нейронной сети. Блок истории работы системы по первому и второму входам соединен с объектом управления, а по третьему входу с блоком правил самообучения управляющей нейронной сети. Второй выход блока истории работы системы связан с выходом управляющей нейронной сети, третий и четвертый выходы связаны с первым и вторым входами управляющей нейронной сети. Выход обучающей нейронной сети связан с первым входом блока правил самообучения управляющей нейронной сети. На более детальных схемах также присутствуют блоки: блок функции коэффициента эффективности, стек коэффициента эффективности, стек параметра адаптации и стек работы объекта управления, а также связи между ними и вышеописанными блоками. В качестве управляющей и обучающей нейронных сетей используется многослойный персептрон. В качестве метода обучения обучающей и управляющей нейронных сетей авторами рекомендуется метод обратного распространения ошибки.
Недостатками устройства по патенту РФ МПК G06F 9/00 №2266558 являются: недостаточные адаптационные свойства, невозможность изменения правил самообучения обучающей нейронной сети, ограниченное изменение правил самообучения управляющей нейронной сети.
Наиболее близким техническим решением является патент на изобретение РФ G06F 15/18 №2458390 «Модифицированный интеллектуальный контроллер с нечеткими правилами». Контроллер по данному патенту состоит из объекта управления, блока коэффициента эффективности, блока фаззификации, блока нечеткого вывода, блока дефаззификации, блока правил самообучения управляющей нейросети, блока истории работы системы, управляющей нейросети. При этом блок коэффициента эффективности состоит из блока формулы коэффициента эффективности и стека коэффициента эффективности, а блок истории работы системы состоит из стека параметров адаптации и стека работы объекта управления. Также в контроллере присутствуют следующие связи: от объекта управления идут сигналы состояния и действия, соответственно на блок формулы коэффициента эффективности, на стек работы объекта управления и на управляющую нейросеть. От блока формулы коэффициента эффективности идет сигнал соответственно на блок фаззификации и на стек коэффициента эффективности, от блока фаззификации идет сигнал на блок нечеткого вывода, от блока нечеткого вывода идет сигнал на блок дефаззификации. От блока фаззификации идет сигнал, соответственно на стек параметров адаптации и блок правил самообучения управляющей нейросети. От стека параметров адаптации идет сигнал соответственно на блок правил самообучения управляющей нейросети и блок фаззификации. От стека работы управляющей нейросети идут сигналы на блок правил самообучения управляющей нейросети, а от стека работы управляющей нейросети идет сигнал соответственно на стек параметров адаптации и на стек работы объекта управления. От выхода управляющей нейросети идет сигнал на стек работы объекта управления. От блока истории работы системы идут сигналы на управляющую нейросеть и два сигнала на входы управляющей нейросети. От управляющей нейросети идет сигнал управления на объект управления.
Недостатками данного контроллера являются - невысокая скорость работы и ограниченная возможность переобучения управляющей нейросети под новые данные.
Задача - разработка модифицированного интеллектуального контроллера с нечеткими правилами.
Техническим результатом предлагаемого устройства является повышение адаптационных свойств системы управления на базе интеллектуального контроллера, увеличение скорости работы контролера и добавление возможности переобучения управляющей нейросети под новые данные.
Технический результат достигается тем, что в модифицированном интеллектуальном контроллере с нечеткими правилами и блоком обучения нейросети, содержащем объект управления, блок коэффициента эффективности, блок фаззификации, блок нечеткого вывода, блок дефаззификации, блок истории работы системы, управляющую нейросеть, первый выход управляющей нейросети связан с третьим входом блока истории работы системы и первым входом объекта управления, первый и второй выходы объекта управления связаны с первым и вторым входами блока коэффициента эффективности, седьмым и восьмым входами блока истории работы системы, а также с четвертым и пятым входами управляющей нейросети, первый выход блока коэффициента эффективности связан с первым входом блока фаззификации, второй выход блока фаззификации связан с первым входом блока нечеткого вывода, первый выход блока нечеткого выхода связан с первым входом блока фаззификации, первый выход блока фаззификации связан с четвертым входом блока истории работы системы, третий выход блока истории работы системы связан со вторым входом блока фаззификации, введены блок оценки производительности нейросети, блок обучения нейросети, при этом первый выход блока коэффициента эффективности также связан шестым входом блока истории работы системы, первый выход блока фаззификации связан с пятым входом блока истории работы системы, первый выход блока дефаззификации также связан со вторым входом блока обучения нейросети, первый выход блока оценки производительности нейросети связан со вторым входом блока истории работы системы, второй выход блока оценки производительности нейросети связан с пятым входом управляющей нейросети, третий выход блока оценки производительности нейросети связан с четвертым входом управляющей нейросети, четвертый выход блока оценки производительности нейросети связан с третьим входом управляющей нейросети, пятый выход блока оценки производительности нейросети связан с третьим входом блока обучения нейросети, первый выход блока обучения нейросети связан с третьим входом блока оценки производительности нейросети, второй выход блока обучения нейросети связан с первым входом блока истории работы системы, третий выход блока обучения нейросети связан с пятым входом управляющей нейросети, четвертый выход блока обучения нейросети связан с четвертым входом управляющей нейросети, пятый выход блока обучения нейросети связан со вторым входом управляющей нейросети, шестой выход блока обучения нейросети связан с первым входом управляющей нейросети, первый выход управляющей нейросети также связан с первым входом блока обучения нейросети и первым входом блока оценки производительности нейросети, первый выход блока истории работы системы связан с четвертым входом блока обучения нейросети, второй выход блока истории работы системы связан со вторым входом блока оценки производительности нейросети.
Задача повышения скоростных характеристик работы устройства достигается за счет переноса функционала стека коэффициента эффективности, стека параметров адаптации, стека работы объекта управления в единый блок истории работы системы, что сокращает временные затраты на передачу данных. Переобучение управляющей нейросети под новые данные достигается за счет добавления блока обучения нейросети и блока оценки производительности нейросети.
Таким образом, совокупность существенных признаков изложенных в формуле изобретения, позволяет достигнуть желаемый результат.
На фиг. 1 изображена общая схема интеллектуального контроллера с нечеткими правилами и блоком обучения нейросети.
На фиг. 2 показана схема нечеткого вывода адаптационного параметра (справочно, источник - патент на изобретение РФ G06F 15/18 №2458390 «Модифицированный интеллектуальный контроллер с нечеткими правилами»).
Система состоит из нескольких структурных компонент: объекта управления 1, блока коэффициента эффективности 2, блока фаззификации 3, блока нечеткого вывода 4, блока дефаззификации 5, блока оценки производительности нейросети 6, блока обучения нейросети 7, блока истории работы системы 8, управляющей нейросети 9.
Также в системе присутствуют следующие связи - от управляющей нейросети 9 идет сигнал 10, который соединен связью 10.1 с объектом управления 1, связью 10.2 с блоком истории работы системы 8, связью 10.3 с блоком оценки производительности нейросети 6 и связью 10.4 с блоком обучения нейросети 7, от объекта управления 1 идут сигналы состояния 11 и действия 12, которые соответственно соединены по связям 11.1 и 12.1 с блоком коэффициента эффективности 2, по связям 11.2 и 12.2 с блоком истории работы системы 8, а также по связям 11.3 и 12.3 с управляющей нейросетью 9, выход 13 блока коэффициента эффективности 2 соединен связью 13.1 с блоком фаззификации 3 и по связи 13.2 с блоком истории работы системы 8, от блока фаззификации 3 идет связь 14 на блок истории работы системы 8, от блока фаззификации 3 идет связь 15 на блок нечеткого вывода 4, от блока нечеткого вывода 4 идет связь 16 на блок дефаззификации 5, выход 17 блока дефаззификации 5 соединен по связи 17.1 с блоком обучения нейросети 7 и по связи 17.2 с блоком истории работы системы 8, блок истории работы системы 8 по связи 18 соединен с блоком фаззификации 3, от блока истории работы системы 8 идет связь 19 на блок оценки производительности нейросети 6, от блока оценки производительности нейросети 6 идет связь 20 на блок истории работы системы 8, от блока оценки производительности нейросети 6 идут связи 21, 22 и 23 на управляющую нейросеть 9, выход 24 блока оценки производительности нейросети 6 связан с блоком обучения нейросети 7, выход 25 блока обучения нейросети 7 связан с блоком оценки производительности нейросети 6, блок истории работы системы 8 связан по сигналу 26 с блоком обучения нейросети 7, блок обучения нейросети 7 соединен по связи 27 с блоком истории работы системы 8, выходы 28, 29, 30, 31 блока обучения нейросети 7 соединены с управляющей нейросетью 9.
Блок фаззификации 3 состоит из узлов входных термов 32 (нумерация 32.1-32.9), количество которых равно количеству учитываемых итераций по коэффициенту эффективности и адаптационным параметрам. На Фиг. 2 показан вариант с двумя последовательными итерациями по коэффициенту эффективности (t) и (t-1), и одному по адаптационному параметру (t-1). Блок нечеткого вывода 4 состоит из Т - узлов 33.1-33.27, N - узлов 35.1-35.27 и узлов нормализации силы правил 37.1-37.27. Т - узлы связаны с N - узлами сигналами 34.1-34.27, а с узлами нормализации силы правил сигналами 36.1-36.27. N - узлы связаны с узлами нормализации силы правил сигналами 38.1-38.27. На Фиг. 2 показан вариант с 27 нечеткими правилами.
Блок коэффициента эффективности 2 предназначен для расчета текущего коэффициента эффективности работы системы (формула расчета задается разработчиком, варианты формул см. [Шумков Е.А. Система поддержки принятия решений предприятия на основе нейросетевых технологий. Дисс. канд. техн. наук. Краснодар: КубГТУ. 2004. 158 с.]).
Блок фаззификации 3 предназначен для вычисления степеней функций принадлежности.
Блок нечеткого вывода 4 предназначен для вычисления сил правил нечеткого вывода.
Блок деффазицикации 5 предназначен для расчета четкого значения адаптационного параметра на следующем шаге управления.
Блок оценки производительности нейросети 6 предназначен для расчета качества работы и точности обучения управляющей нейросети 9.
Блок обучения нейросети 7 предназначен для обучения управляющей нейросети 9 методом обратного распространения ошибки (см. Rumelhart D.Е., Hinton G.Е., Williams R.J., "Learning representations by back-propagating errors," Nature, vol. 323, pp. 533-536, 1986).
Блок истории работы системы 8 предназначен для хранения информации о работе объекта управления 1, управляющей нейросети 9, коэффициенте эффективности и параметров адаптации.
Управляющая нейросеть 9 предназначена для формирования управляющего сигнала для объекта управления 1. Данная нейросеть реализована на базе многослойного персептрона. Количество нейронов во входном слое управляющей нейросети 9 равно R+N, где R - размерность вектора состояния, а N - размерность вектора действия объекта управления. У управляющей нейросети 9 может быть F скрытых слоев, количество которых задается разработчиком (рекомендованное значение F=2). Количество нейронов в выходном слое равно размерности вектора управления объекта управления 1. Числа R, N, F и количество нейронов в каждом скрытом слое задается разработчиком в зависимости от решаемой устройством задачи.
Заявленное устройство работает следующим образом. Выделим два режима работы системы:
- режим «А» - работа в режиме реального времени
- режим «Б» - режим обучения управляющей нейросети.
Алгоритм режима работы А):
А.1. Объект управления 1 формирует сигналы состояния 11 и действия 12 и отправляет их по связям 11.1 и 12.1 в блок коэффициента эффективности 2, по связям 11.3 и 12.3 соответственно в управляющую нейросеть 9, а также по связям 11.2 и 12.2 в блок истории работы системы 8. По данным сигналам блок коэффициента эффективности 2 рассчитывает по заданной формуле получившееся значение коэффициента эффективности на текущей итерации управления. Получившееся значение коэффициента эффективности по сигналу 13.1 идет в блок фаззификации 3 и заносится в блок истории работы системы 8 по сигналу 13.2.
А.2. Блок фаззификации 3 получая значение текущего коэффициента эффективности, синхронно запрашивает по связи 14 от блока истории работы системы 8 предыдущие значения коэффициента эффективности и адаптационного параметра, получает их по сигналу 18. Глубина погружения по коэффициенту эффективности и параметрам адаптации, то есть, за сколько предыдущих итераций управления учитывать данные сигналы, задаются разработчиком. Глубина погружения по коэффициенту эффективности и параметрам адаптации могут быть не равны друг другу. Принцип работы связки блок фаззификации 3 - блок нечеткого вывода 4 - блок дефаззификации 5 следующий (см. также Ярушкина Н.Г. «Основы теории нечетких и гибридных систем». М.: Финансы и статистика, 2004 г.). На узлы входных термов 32.1-32.9 подаются четкие значения коэффициента эффективности за последнюю и предыдущие итерации управления и адаптационного параметра за предыдущие итерации управления. На выходе узлов 32.1-32.9 степени, с которыми заданные входы удовлетворяют функциям принадлежности, ассоциированных с этими узлами. Каждый Т - узел 33.1-33.27 вычисляет силу правила. Выход верхнего Т - узла 33.1 равен:
Figure 00000001
Выход нижнего Т - узла 31.27:
Figure 00000002
Для остальных аналогично (см. Таблицу 1 ниже). N - узлы 35.1-35.27 нормализуют силу правил с выходов Т - узлов 32.1-32.9. Выход каждого N - узла равен:
Figure 00000003
Выходы узлов нормализации силы правил 37.1-37.27 равны произведению нормализованной силы правил и индивидуального выхода соответствующего правила. Например, для первого узла 37.1 нормализации силы правил выход равен
Figure 00000004
а для последнего
Figure 00000005
Блок деффазификации 5 вычисляет общее значение параметра адаптации 17 по формуле:
Figure 00000006
где biYi вычисляются по формулам аналогично (2) и (3).
А.3. Далее сигналы параметра адаптации 17 идут в блок истории работы системы 8 по связи 17.2 и по связи 17.1 в блок обучения нейросети 7. В случае, если значение сигнала 17 лежит в пределах «не изменять» процесс переобучения управляющей нейросети 9 не запускается, в случаях «увеличился» и «уменьшился» запускается режим «Б» работы системы.
А.4. Управляющая нейросеть 9, если устройство работает в режиме «А», отрабатывает поступившие сигналы состояния 11 и действия 12 от объекта управления 1 и рассчитывает управляющий сигнал 10, который поступает на вход объекта управления 1 по связи 10.1. Параллельно сигнал 10 идет по связи 10.2 в блок истории работы системы 8.
Режим «Б». Переобучение управляющей нейросети 9 происходит следующим образом. Если устройство находилось в режиме «А», то переключение в режим «Б» происходит подачей сигнала 31 от блока обучения нейросети 7, размыкающего входы 11.3 и 12.3 управляющей нейросети 9 от выходов объекта управления 1 и выход 10.1 от решающей нейросети 9 от объекта управления 1. Далее:
Б.1. Блок обучения нейросети 7 по связи 27 в блок истории работы системы 8 передает номер обучающего примера, выбранного случайным образом.
Б.2. Блок истории работы системы 8 получив по связи 27 номер примера, обратно в блок обучения нейросети 7 передает обучающий пример по связи 26.
Б.3. Блок обучения нейросети 7, получив обучающий пример (входы; выход), передает обучающий пример на управляющую нейросеть 9, при этом данные передаются по связям 28 и 29 на входы 11.3 и 12.3.
Б.4. Управляющая нейросеть 9, получив данные на входы 11.3 и 12.3, рассчитывает выход и передает значение в блок обучения нейросети 7 по связи 10.4.
Б.5. Блок обучения нейросети 7, получив выход управляющей нейросети 9, сравнивает его с тем, что должно получиться по данному обучающему примеру. После расчета ошибки по алгоритму обратного распространения ошибки происходит расчет и корректировка весов синаптических связей управляющей нейросети 9. Корректировка синаптических весов управляющей нейросети 9 идет по связи 30.
Б.6. После того, как решающая нейросеть 9 обучилась, т.е. ошибка на выходе стала меньше заданной разработчиком, блок обучения нейросети 7 выдает сигнал по связи 25 на блок оценки производительности нейросети 6.
Б.7. Блок оценки производительности нейросети 6 после получения сигнала 25, запрашивает у блока истории работы системы 8 валидационную выборку по связи 20 (валидационная выборка см. [Шумков Е.А. Система поддержки принятия решений предприятия на основе нейросетевых технологий. Дисс. канд. техн. наук. Краснодар: КубГТУ. 2004. 158 с.]).
Б.8. Блок истории работы системы 8, получая сигнал от блока оценки производительности нейросети 6, выдает валидационную выборку по связи 19 на блок оценки производительности нейросети 6.
Б.9. Блок оценки производительности нейросети 6 проверяет работу управляющей нейросети 9 на валидационной выборке, последовательно подавая данные по сигналам 21 и 22 на входы 11.3 и 12.3 управляющей нейросети 9 и после расчета выхода управляющей нейросетью 9, получает выход по сигналу 10.3. Сравнивая ответы управляющей нейросети 9 с тем, что должно получиться но выходам валидационной выборки, в случае, если ошибка меньше заданной разработчиком, блок оценки производительности нейросети 6 подает сигнал 23 на управляющую нейросеть 9, тем самым выставляя режим работы «А» устройства. В случае, если ошибка на валидационной выборке больше заданной разработчиком, блок оценки производительности нейросети 6 подает сигнал 24 на блок обучения нейросети 7 о переобучении управляющей нейросети 9, т.е. происходит переход на шаг Б.1.
Вычисление сигналов управляющей нейросетью 9 происходит стандартным образом.
Эффект от применения данного контроллера заключается в том, что предлагаемое устройство за счет использования блоков нечеткой логики - блока фаззификации, блока нечеткого вывода и блока деффазификации адаптивно подстраивается под изменения состояния внешней среды и объекта управления. При этом при выработке значения адаптационного параметра используется нечеткая логика, позволяющая не жестко, а мягко подстраивать адаптационный параметр и соответственно правила самообучения управляющей нейросети.
Figure 00000007
Figure 00000008
В таблице 1 введены обозначения:
«-1» - «снизился»
«0» - «не изменился»
«1» - увеличился

Claims (1)

  1. Модифицированный интеллектуальный контроллер с нечеткими правилами и блоком обучения нейросети, содержащий объект управления, блок коэффициента эффективности, блок фаззификации, блок нечеткого вывода, блок дефаззификации, блок истории работы системы, управляющую нейросеть, первый выход управляющей нейросети связан с третьим входом блока истории работы системы и первым входом объекта управления, первый и второй выходы объекта управления связаны с первым и вторым входами блока коэффициента эффективности, седьмым и восьмым входами блока истории работы системы, а также с четвертым и пятым входами управляющей нейросети, первый выход блока коэффициента эффективности связан с первым входом блока фаззификации, второй выход блока фаззификации связан с первым входом блока нечеткого вывода, первый выход блока нечеткого вывода связан с первым входом блока фаззификации, первый выход блока фаззификации связан с четвертым входом блока истории работы системы, третий выход блока истории работы системы связан со вторым входом блока фаззификации, отличающийся тем, что в него дополнительно введены блок оценки производительности нейросети, блок обучения нейросети, при этом первый выход блока коэффициента эффективности также связан с шестым входом блока истории работы системы, первый выход блока фаззификации связан с пятым входом блока истории работы системы, первый выход блока дефаззификации также связан со вторым входом блока обучения нейросети, первый выход блока оценки производительности нейросети связан со вторым входом блока истории работы системы, второй выход блока оценки производительности нейросети связан с пятым входом управляющей нейросети, третий выход блока оценки производительности нейросети связан с четвертым входом управляющей нейросети, четвертый выход блока оценки производительности нейросети связан с третьим входом управляющей нейросети, пятый выход блока оценки производительности нейросети связан с третьим входом блока обучения нейросети, первый выход блока обучения нейросети связан с третьим входом блока оценки производительности нейросети, второй выход блока обучения нейросети связан с первым входом блока истории работы системы, третий выход блока обучения нейросети связан с пятым входом управляющей нейросети, четвертый выход блока обучения нейросети связан с четвертым входом управляющей нейросети, пятый выход блока обучения нейросети связан со вторым входом управляющей нейросети, шестой выход блока обучения нейросети связан с первым входом управляющей нейросети, первый выход управляющей нейросети также связан с первым входом блока обучения нейросети и первым входом блока оценки производительности нейросети, первый выход блока истории работы системы связан с четвертым входом блока обучения нейросети, второй выход блока истории работы системы связан со вторым входом блока оценки производительности нейросети.
RU2021122322A 2021-07-27 Модифицированный интеллектуальный контроллер с нечеткими правилами и блоком обучения нейросети RU2774625C1 (ru)

Publications (1)

Publication Number Publication Date
RU2774625C1 true RU2774625C1 (ru) 2022-06-21

Family

ID=

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2266558C2 (ru) * 2003-12-31 2005-12-20 Кубанский государственный технологический университет Интеллектуальный контроллер с нейронной сетью и правилами самомодификации
RU2450336C1 (ru) * 2011-01-11 2012-05-10 Государственное образовательное учреждение высшего профессионального образования "Кубанский государственный технологический университет" (ГОУ ВПО "КубГТУ") Модифицированный интеллектуальный контроллер с адаптивным критиком
RU2602973C1 (ru) * 2015-09-30 2016-11-20 Федеральное государственное бюджетное образовательное учреждение высшего образования "Кубанский государственный технологический университет" (ФГБОУ ВО "КубГТУ") Контроллер управления обучением нейронной сети с генетическим алгоритмом
US20170024643A1 (en) * 2015-07-24 2017-01-26 Google Inc. Continuous control with deep reinforcement learning
US20200307577A1 (en) * 2019-03-26 2020-10-01 Ford Global Technologies, Llc Interpreting data of reinforcement learning agent controller

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2266558C2 (ru) * 2003-12-31 2005-12-20 Кубанский государственный технологический университет Интеллектуальный контроллер с нейронной сетью и правилами самомодификации
RU2450336C1 (ru) * 2011-01-11 2012-05-10 Государственное образовательное учреждение высшего профессионального образования "Кубанский государственный технологический университет" (ГОУ ВПО "КубГТУ") Модифицированный интеллектуальный контроллер с адаптивным критиком
US20170024643A1 (en) * 2015-07-24 2017-01-26 Google Inc. Continuous control with deep reinforcement learning
RU2602973C1 (ru) * 2015-09-30 2016-11-20 Федеральное государственное бюджетное образовательное учреждение высшего образования "Кубанский государственный технологический университет" (ФГБОУ ВО "КубГТУ") Контроллер управления обучением нейронной сети с генетическим алгоритмом
US20200307577A1 (en) * 2019-03-26 2020-10-01 Ford Global Technologies, Llc Interpreting data of reinforcement learning agent controller

Similar Documents

Publication Publication Date Title
Saadat et al. Training echo state neural network using harmony search algorithm
US11543787B2 (en) Networked control system time-delay compensation method based on predictive control
Chiang et al. A self-learning fuzzy logic controller using genetic algorithms with reinforcements
KR20160136381A (ko) 신경 네트워크들에서의 차분 인코딩
Pillai et al. Extreme learning ANFIS for control applications
CN113298231A (zh) 用于脉冲神经网络的图表示时空反向传播算法
Ikemoto et al. Continuous deep Q-learning with a simulator for stabilization of uncertain discrete-time systems
RU2774625C1 (ru) Модифицированный интеллектуальный контроллер с нечеткими правилами и блоком обучения нейросети
RU2266558C2 (ru) Интеллектуальный контроллер с нейронной сетью и правилами самомодификации
International Neural Network Society (INNS), the IEEE Neural Network Council Cooperating Societies et al. The discrete neuronal model and the probabilistic discrete neuronal model
CN111582470B (zh) 基于stdp的自适应非监督学习图像识别方法及系统
Chan et al. Evolutionary computation for on-line and off-line parameter tuning of evolving fuzzy neural networks
Malagon et al. Evolving neural networks in reinforcement learning by means of UMDAc
RU2447494C1 (ru) Интеллектуальный контроллер с правилами самомодификации обучающей и управляющей нейронных сетей
Chung et al. A self‐learning and tuning fuzzy logic controller based on genetic algorithms and reinforcements
RU2504002C1 (ru) Модифицированный интеллектуальный контроллер с нечеткими правилами
Todorov et al. Intuitionistic fuzzy radial basis functions network for modeling of nonlinear dynamics
Alonso-Rodriguez Forecasting economic magnitudes with neural network models
RU2755339C1 (ru) Модифицированный интеллектуальный контроллер с адаптивным критиком
Jun et al. Fuzzy inference-based reinforcement learning of dynamic recurrent neural networks
RU2523218C1 (ru) Модифицированный интеллектуальный контроллер с адаптивным критиком
Chaturvedi Factors affecting the performance of artificial neural network models
Frean et al. Implementing Gaussian process inference with neural networks
KR20230134286A (ko) 시냅틱 가중치 학습을 위한 뉴런 회로
Su et al. A self-organizing cascade neural network for nonlinear system modeling