RU2679225C2

RU2679225C2 - Способ и устройство для определения градиента основанной на данных функциональной модели

Info

Publication number: RU2679225C2
Application number: RU2014148490A
Authority: RU
Inventors: Михаэль ХАНЗЕЛЬМАНН; Ян Матиас КЁЛЕР; Хайнер МАРКЕРТ
Original assignee: Роберт Бош Гмбх
Priority date: 2013-12-03
Filing date: 2014-12-02
Publication date: 2019-02-06
Also published as: US10402509B2; US20150154329A1; CN104699658B; CN104699658A; RU2014148490A3; DE102013224694A1; RU2014148490A; KR102257530B1; KR20150064673A

Abstract

Группа изобретений относится к вычислительной технике и может быть использована для вычисления градиента. Техническим результатом является обеспечение вычисления градиента основанной на данных функциональной модели. Устройство содержит главный вычислительный узел (2) и аппаратный узел (3) вычисления модели, выполненный для аппаратного вычисления значений функции основанной на данных функциональной модели, включающей экспоненциальную функцию, по меньшей мере одну функцию суммирования и по меньшей мере одну функцию умножения, за две операции организации цикла, причем узел (3) вычисления модели имеет вычислительное ядро, обеспечивающее аппаратное вычисление значения функции основанной на данных функциональной модели, и вычислительное ядро, обеспечивающее вычисление градиента основанной на данных функциональной модели для требуемого значения заданной входной переменной, причем одно вычислительное ядро выполняет вычисление значения функции основанной на данных функциональной модели параллельно с вычислением градиента основанной на данных функциональной модели другим вычислительным ядром. 5 н. и 5 з.п. ф-лы, 4 ил.

Description

Изобретение относится к способу определения градиента основанной на данных функциональной модели, в частности с использованием модуля управления, имеющего аппаратный узел, жестко (на аппаратном уровне) запрограммированный для вычисления основанной на данных функциональной модели.

Для реализации функциональных моделей в блоках управления, прежде всего в блоках управления для двигателей внутреннего сгорания, могут предусматриваться основанные на данных функциональные модели. Основанные на данных функциональные модели также называют непараметрическими моделями, и такие модели можно строить без использования специальных заданных значений и установок, по обучающим данным, т.е. по определенному множеству точек таких обучающих данных.

Из уровня техники известны модули управления, имеющие главный вычислительный узел и отдельный узел вычисления модели для вычисления основанных на данных функциональных моделей в блоке управления. Так, например, в публикации DE 102010028259 А1 раскрыт блок управления с дополнительной логической схемой, используемой в качестве узла вычисления модели, выполненного для вычисления экспоненциальных функций, чтобы поддерживать выполнение байесовских регрессионных методов, необходимых, в частности, для вычисления моделей гауссовского процесса.

Узел вычисления модели в целом рассчитан на выполнение математических процессов для того, чтобы вычислять, или выполнять, основанную на данных функциональную модель, исходя из параметров и опорных точек, т.е. обучающих данных. В частности, для эффективного вычисления экспоненциальных функций и функций суммирования функции узла вычисления модели реализованы чисто аппаратными средствами, т.е. только на аппаратном уровне, что позволяет вычислять модели гауссовского процесса с более высокой скоростью, чем это может происходить в главном вычислительном узле, работающим под управлением программного обеспечения.

Для многих случаев применения в блоках управления, в частности в блоках управления для двигателей внутреннего сгорания, вычисление значений функций основанных на данных функциональных моделей является достаточным. Однако известны случаи применения, в которых необходим градиент основанной на данных функциональной модели, в частности, чтобы таким образом вычислить модель, обратную основанной на данных функциональной модели.

Предложены способ определения (нахождения) градиента основанной на данных функциональной модели, прежде всего модели гауссовского процесса, охарактеризованный в пункте 1 формулы изобретения, а также устройство, охарактеризованное в другом независимом пункте формулы изобретения.

Частные случаи осуществления изобретения охарактеризованы в зависимых пунктах формулы.

Одним объектом изобретения является способ вычисления градиента основанной на данных функциональной модели, включающей одну или несколько аккумулированных основанных на данных функциональных подмоделей, характеризующийся тем, что используют аппаратный узел вычисления модели, имеющий первое и второе вычислительные ядра, одно из которых используют для аппаратного вычисления значения функции основанной на данных функциональной модели, включающей экспоненциальную функцию, по меньшей мере одну функцию суммирования и по меньшей мере одну функцию умножения, за две операции организации цикла, а другое - для вычисления градиента основанной на данных функциональной модели для требуемого значения заданной входной переменной, причем вычисление значения функции основанной на данных функциональной модели и вычисление градиента основанной на данных функциональной модели в соответствующих вычислительных ядрах выполняют параллельно.

Идея, положенная в основу описанного выше способа, заключается в том, чтобы выполнять вычисление градиента основанной на данных функциональной модели, используя в основном существующие аппаратно реализованные алгоритмы вычисления значения функции основанной на данных функциональной модели. Это позволяет проводить вычисление градиента для основанной на данных функциональной модели в аппаратном узле вычисления модели, в котором алгоритм вычисления основанной на данных функциональной модели по существу жестко зашит, т.е. реализован аппаратными средствами. Упрощенное вычисление градиента основанной на данных функциональной модели позволяет вычислять, в частности с помощью итерационного метода Ньютона, обратную (инверсную) модель, в которой для данного целевого значения в отношении заданной входной размерности может локально выполняться численное обращение.

Далее может быть предусмотрен вариант осуществления изобретения, в котором основанная на данных функциональная модель определена данными опорных точек, гиперпараметрами и вектором параметров, содержащим число элементов, соответствующее числу опорных точек, причем для вычисления градиента основанной на данных функциональной модели для требуемого значения заданной входной переменной основанную на данных функциональную модель модифицируют, прикладывая к вектору параметров зависящий от данных опорных точек вектор взвешивания.

В еще одном варианте осуществления изобретения градиент основанной на данных функциональной модели может вычисляться в узле вычисления модели как значение функции модифицированной основанной на данных функциональной модели для требуемого значения заданной входной переменной и может прибавляться значение смещения.

Далее, когда опорные точки нормированы, для получения градиента основанной на данных функциональной модели результат суммирования значения функции модифицированной основанной на данных функциональной модели и значения смещения может умножаться на коэффициент, основывающийся на стандартном отклонении данных опорных точек в отношении выходных данных.

Во время вычисления модифицированной основанной на данных функциональной модели приложение зависящего от данных опорных точек вектора взвешивания к вектору параметров может выполняться повторно.

В одном варианте осуществления изобретения основанная на данных функциональная модель определена данными опорных точек, гиперпараметрами и вектором параметров, содержащим число элементов, соответствующее числу опорных точек, причем для вычисления градиента основанной на данных функциональной модели в отношении заданной входной переменной основанную на данных функциональную модель модифицируют, вычисляя в узле вычисления модели для требуемого значения заданной входной переменной значение функции основанной на данных функциональной модели, умножая результат вычисления на требуемое значение заданной входной переменной и затем выполняя в узле вычисления модели повторное вычисление основанной на данных функциональной модели с измененным вектором параметров.

Еще одним объектом изобретения является способ выполнения итерационного метода Ньютона для основанной на данных функциональной модели в модуле управления, содержащем главный вычислительный узел и узел вычисления модели, выполненный для аппаратного вычисления значений функции основанной на данных функциональной модели, включающей экспоненциальную функцию, по меньшей мере одну функцию суммирования и по меньшей мере одну функцию умножения, за две операции организации цикла, предусматривающий определение градиента основанной на данных функциональной модели и вычисление основанную на данных функциональную модель с помощью узла вычисления модели описанным выше способом.

Далее, градиент основанной на данных функциональной модели может вычисляться в первом вычислительном ядре узла вычисления модели, а значение функции основанной на данных функциональной модели - во втором вычислительном ядре узла вычисления модели.

Еще одним объектом изобретения является модуль управления, в частности для осуществления описанного выше способа, содержащий главный вычислительный узел и аппаратный узел вычисления модели, выполненный для аппаратного вычисления значений функции основанной на данных функциональной модели, включающей экспоненциальную функцию, по меньшей мере одну функцию суммирования и по меньшей мере одну функцию умножения, за две операции организации цикла, причем узел вычисления модели имеет вычислительное ядро, обеспечивающее аппаратное вычисление значения функции основанной на данных функциональной модели, и вычислительное ядро, обеспечивающее вычисление градиента основанной на данных функциональной модели для требуемого значения заданной входной переменной, причем одно вычислительное ядро выполняет вычисление значения функции основанной на данных функциональной модели параллельно с вычислением градиента основанной на данных функциональной модели другим вычислительным ядром.

Ниже варианты осуществления изобретения рассматриваются более подробно со ссылкой на чертежи, на которых показано:

на фиг. 1 - схематическое изображение интегрального модуля управления с главным вычислительным узлом и отдельным узлом вычисления модели;

на фиг. 2 - блок-схема, иллюстрирующая выполнение способа определения градиента основанной на данных функциональной модели;

на фиг. 3 - блок-схема, иллюстрирующая выполнение альтернативного способа определения градиента основанной на данных функциональной модели; и

на фиг. 4 - блок-схема, иллюстрирующая выполнение альтернативного способа определения градиента основанной на данных функциональной модели.

На фиг. 1 схематически представлена архитектура аппаратных средств интегрального модуля 1 управления, который выполнен, например, в виде микроконтроллера и в состав которого интегрально входят главный вычислительный узел 2 и отдельный узел 3 вычисления модели, предназначенный для чисто аппаратного вычисления основанной на данных функциональной модели. Главный вычислительный узел 2 и узел 3 вычисления модели связаны между собой внутренним соединением 4, обеспечивающим возможность передачи сигналов, например системной шиной.

В принципе, узел 3 вычисления модели является по существу жестко запрограммированным и соответственно этому не рассчитан на то, чтобы выполнять программный код, как главный вычислительный узел 2. В качестве альтернативы возможно решение, согласно которому для вычисления основанной на данных функциональной модели узел 3 вычисления модели располагает ограниченным высокоспециализированным набором команд. Узел 3 вычисления модели как специализированное вычислительное устройство рассчитан только на выполнение заранее заданных вычислительных процессов. Это создает возможность для оптимизированной в плане ресурсоемкости реализации подобного узла 3 вычисления модели или оптимизированной по занимаемой площади структуре в интегральной компоновке.

Узел 3 вычисления модели имеет несколько вычислительных ядер, так, например, в показанном на фиг. 1 варианте он имеет первое вычислительное ядро 31 и второе вычислительное ядро 32, каждое из которых чисто аппаратными средствами реализует вычисление заданного алгоритма. Узел 3 вычисления модели также может содержать локальное статическое запоминающее устройство 33 с произвольной выборкой для хранения конфигурационных данных. Узел 3 вычисления модели также может содержать локальный блок 34 прямого доступа к памяти. Посредством локального блока 34 прямого доступа к памяти можно обращаться к встроенным ресурсам модуля 1 управления, в частности к внутреннему запоминающему устройству 5.

Модуль 1 управления может содержать внутреннее запоминающее устройство 5 и дополнительный блок 6 прямого доступа к памяти. Внутреннее запоминающее устройство 5 и дополнительный блок 6 прямого доступа к памяти связаны между собой соответствующим образом, например внутренним соединением 4, обеспечивающим возможность передачи сигналов. Внутреннее запоминающее устройство 5 может включать в себя общее (для главного вычислительного узла 2, узла 3 вычисления модели, а при необходимости, и для других узлов) статическое запоминающее устройство с произвольной выборкой, а также флэш-память для конфигурационных данных (параметров и данных опорных точек).

Применение непараметрических, основанных на данных функциональных моделей основывается на методе байесовской регрессии. Основы байесовской регрессии изложены, например, в публикации С.Е. Rasmussen и др. "Gaussian Processes for Machine Learning" (Гауссовские процессы для обучения машин), MIT Press 2006. Байесовская регрессия -это основанный на данных метод, в основе которого лежит модель. Для построения модели необходимы точки измеренных обучающих данных, а также относящиеся к ним выходные данные моделируемой выходной переменной. Построение модели выполняют с применением данных опорных точек, полностью или частично соответствующих обучающим данным или генерируемых на их основе. Кроме того, задают абстрактные гиперпараметры, которые параметризуют пространство функций модели и по сути взвешивают влияние отдельных точек измеренных обучающих данных на результат последующего прогнозирования с помощью модели.

Абстрактные гиперпараметры определяют методом оптимизации. Одна возможность такого метода оптимизации заключается в оптимизации маргинального правдоподобия

. Маргинальное правдоподобие

описывает правдоподобие измеренных значений у обучающих данных, представленных вектором Y при данных параметрах Н модели и значениях х обучающих данных. В процессе обучения модели максимизируют

, для чего ищут подходящие гиперпараметры, приводящие к определенной форме функции модели, определяемой гиперпараметрами и обучающими данными, и максимально точно отображающие обучающие данные. Для упрощения вычисления максимизируют логарифм

, поскольку логарифм не меняет непрерывности функция правдоподобия.

Вычисление модели гауссовского процесса производится в соответствии с шагами, схематически представленными на фиг. 2. Сначала входные значения

для контрольной точки х (вектор входных переменных) могут быть отнормированы, а именно по следующей формуле:

При этом m_x соответствует функции, дающей среднее значение входных значений данных опорных точек, s_x соответствует дисперсии входных значений данных опорных точек, a d соответствует индексу размерности D контрольной точки х.

В результате построения непараметрической, основанной на данных функциональной модели получают:

Полученное таким образом значение v модели нормируют с помощью выходного нормирования, а именно по формуле:

При этом v соответствует нормированному значению модели (выходное значение) в нормированной контрольной точке х (вектор входных переменных, имеющий размерность D),

соответствует (ненормированному) значению модели (выходное значение) в (ненормированной) контрольной точке

(вектор входных переменных, имеющий размерность D), x_i соответствует одной из опорных точек, N соответствует числу опорных точек, D соответствует размерности пространства входных/обучающих данных, или опорных точек, a l_d и σ_f соответствуют гиперпараметрам из процесса обучения модели, а именно масштабам длин и амплитудному коэффициенту. Вектор Q_y представляет собой величину, вычисленную на основании гиперпараметров и обучающих данных. Далее, m_y соответствует функции, дающей среднее значение выходных значений опорных точек, a s_y соответствует дисперсии выходных значений опорных точек.

Входное и выходное нормирование выполняется, поскольку вычисление модели гауссовского процесса обычно происходит в нормированном пространстве.

Для начала вычисления вычислительное устройство 2 может, в частности, дать команду локальному блоку 34 прямого доступа к памяти или дополнительному блоку 6 прямого доступа к памяти на передачу в узел 3 вычисления модели конфигурационных данных, относящихся к вычисляемой функциональной модели, и на запуск вычисления, которое выполняется с помощью конфигурационных данных. Конфигурационные данные включают в себя гиперпараметры модели гауссовского процесса, а также данные опорных точек, указываемые преимущественно с помощью указателя адреса, ссылающегося на выделенную узлу 3 вычисления модели адресную область внутреннего запоминающего устройства 5. Для этого, в частности, также может использоваться статическое запоминающее устройство 33 с произвольной выборкой для узла 3 вычисления модели, которое может быть расположено, в частности, в узле 3 вычисления модели или у него. Кроме того, внутреннее запоминающее устройство 5 и статическое запоминающее устройство 33 с произвольной выборкой могут использоваться в сочетании друг с другом.

Процесс вычисления в узле 3 вычисления модели осуществляется в архитектуре аппаратных средств узла 3 вычисления модели, реализованной приведенным ниже псевдокодом и соответствующей рассмотренному выше правилу вычисления. Из этого псевдокода видно, что вычисления выполняются во внутреннем цикле и внешнем цикле, и их частичные (промежуточные) результаты аккумулируются (накапливаются). В начале вычисления модели типичным значением параметра запуска счетчика является Nstart 0.

Таким образом, данные, необходимые для вычисления основанной на данных функциональной модели, включают гиперпараметры и опорные точки, сохраняемые в относящейся к соответствующей основанной на данных функциональной модели области запоминающего устройства. Соответственно приведенному выше псевдокоду, переменные для вычисления основанных на данных функциональных моделей включают: определенные для каждой размерности параметры нормирования s_x (соответствует s_x), m_x (соответствует m_x), s_y (соответствует s_y), m_y (соответствует m_y), вектор параметров Q_y (соответствует Q_y), нормализованные обучающие данные X, число N опорных точек, число D размерностей входных переменных, начальное значение nStart внешнего цикла, индекс цикла vInit при возобновлении вычисления внутреннего цикла (обычно = 0), а также масштабы длин l для каждой из размерностей входных переменных.

В интегральных модулях управления вычисляются, как правило, значения функции модели гауссовского процесса, определенной гиперпараметрами и данными опорных точек. Далее, в зависимости от функции, реализованной в интегральном модуле 1 управления, может потребоваться вычисление обращенной (инвертированной) функции, причем для данного выходного значения y_a и заданных входных данных x₁, x₂, …, x_p-1, x_p+i, …, x_D необходимо вычислить значение х_р, при котором

.

Поскольку функция y(x), как правило, не является обратимой, для решения обратной задачи может использоваться метод определения нулей, в частности метод Ньютона. Метод Ньютона предусматривает отыскание нулей функции

.

Для нахождения нулей действительнозначной функции метод Ньютона предусматривает итерационный процесс, в котором n соответствует n-ой итерации:

За счет этого на n-ой итерации достигается актуализация

. Таким образом во входной точке

анализируется функция f(x) и ее производная f'(*). При вычислении значения функции основанной на данных функциональной модели и первой производной основанной на данных функциональной модели на входном векторе x можно выделить три случая.

Первый случай относится к ситуации, в которой множества опорных точек X^(k) и Y^(k) для k-ой основанной на данных функциональной подмодели не нормализованы. Исходя из конкретного примера с линейной функцией, дающей среднее значение, и двумя основанными на данных функциональными подмоделями (моделями гауссовского процесса) вычисляют градиент основанной на данных функциональной модели. Этот порядок действий можно произвольным образом распространить на более чем две функциональные подмодели. Основанная на данных функциональная модель описывается следующим образом:

где g_i(x) и h_j(x) соответствуют основанным на данных функциональным подмоделям,

соответствуют гиперпараметрам или производным от них параметрам k-ой модели гауссовского процесса, y_a соответствует целевому значению, m₁(x)=a ₁x₁+a ₂x₂+a ₃x₃ + с соответствует функции, дающей среднее значение, а х^(k) соответствует данным опорных точек. Первая частная производная f'(x) при х_р имеет вид:

Во втором случае наборы обучающих данных нормализованы. Сложность при использовании нормализованных данных для обучения общей модели, состоящей из отдельных моделей гауссовского процесса, заключается в том, что для каждой такой подмодели параметры нормализации, т.е. стандартное отклонение

и среднее значение данных

для различных моделей k различны, что ведет различиям в нормализации. Поэтому проводить весь процесс вычислений в нормализованном пространстве значений, а затем преобразовать результат вычислений обратно невозможно, поскольку для всех измеренных данных

опорных точек не существует единых σ_X, σ_Y или

Поскольку модели гауссовского процесса обучают нормализованными данными, вычисления необходимо выполнять в нормализованном пространстве значений, так как их гиперпараметры были обучены для нормализованных данных. При различных параметрах нормализации для каждой модели гауссовского процесса х^(k) указывает, что входной вектор х нормализован с использованием

и

При использовании для обучения модели гауссовского процесса ненормализованных данных получают значение

. При использовании для обучения модели гауссовского процесса нормализованных данных значение функции f(x) вычисляют путем обратной нормализации каждого значения функции модели гауссовского процесса с помощью ее соответствующих параметров нормализации. Линейная функция, дающая среднее значение, не использует нормализованные данные, поэтому обратная нормализация для нее не требуется. Таким образом, для значения функции f(x) получают:

Здесь различие между y₂(х) и y₂(x⁽²⁾) заключается в том, что первое из этих выражений означает, что первая модель гауссовского процесса имеет ненормализованный входной вектор x, и эта модель была обучена на ненормализованных данных, тогда как второе выражение означает, что входной вектор x⁽²⁾ нормализован с использованием параметров нормализации

. Соответствующая модель гауссовского процесса обучена с использованием нормализованных данных, а результат y₂(x⁽²⁾) является нормализованным оценочным значением.

Тогда первая производная f'(x) имеет вид:

Входы обеих моделей x⁽²⁾ и x⁽³⁾ гауссовского процесса различаются, поскольку каждая модель гауссовского процесса имеет свою собственную нормализацию. Поскольку вектор X является D-мерным, стандартное отклонение размерности р второй функциональной подмодели определяется выражением

.

В третьем случае набор обучающих данных преобразован в отношении выходов по методу Бокса-Кокса функцией b(y), а X нормализован. В третьем случае вычисление также может выполняться с любым числом основанных на данных функциональных подмоделей.

Функция f(x) в этом случае имеет вид:

.

Аддитивные модели гауссовского процесса обучались с использованием нормализованных и преобразованных по методу Бокса-Кокса обучающих данных. Линейная функция m₁(х), дающая среднее значение, в качестве входа использует ненормализованный входной вектор х. Это приводит к выражению:

При этом

соответствуют стандартному отклонению и среднему значению данных

, преобразованных по методу Бокса-Кокса. Первая производная зависит от преобразования Бокса-Кокса

и обратного ему преобразования

и поэтому не может быть представлена в общей форме. По этой причине производную f'(x) получают для различных преобразований Бокса-Кокса. В дальнейшем не нормализуют только x, тогда как другие данные x⁽²⁾ и x⁽³⁾ нормализуют соответственно их параметрам нормализации. Функции

обучают с помощью нормализованных X и преобразованного по методу Бокса-Кокса и нормализованного Y.

В результате получают:

при

Это соответствует преобразованию Бокса-Кокса с log(y). Для других преобразований Бокса-Кокса f'(x) берут аналогично.

Для алгоритма Ньютона вычислению подлежат два существенных выражения, а именно f(x) и f'(x). Для первого случая, в котором данные опорных точек X и Y не нормализованы, вычисление f(x) возможно путем вычисления в узле 3 вычисления модели интегрального модуля 1 управления. Нужно лишь вычесть y_a, т.е. заданное значение y_a для обратной задачи. В качестве альтернативы у_а можно включить в параметры а и с модели средних значений, уменьшив с на y_a.

Формула

соответствует формуле для вычисления производной значения функции, включающей в себя линейную функцию, дающую среднее значение, и две аддитивных модели гауссовского процесса. Для каждой основанной на данных функциональной подмодели (модель ошибок) производная может вычисляться путем выполняемого в узле 3 вычисления модели взвешенного вычисления модели ошибок в контрольной точке х, причем используемые при этом весы (весовые коэффициенты) зависят от х. Вектор параметров Q_y отражает произведение матрицы, обратной ковариационной матрице обучающих данных с приложенными по диагонали шумами, и вектора соответствующих выходных значений, и при необходимости может быстро подставляться в процессе вычислений в узле 3 вычисления модели. Поэтому для вычисления производной (в случае двух аддитивных основанных на данных функциональных подмоделей) может использоваться следующая формула:

Каждый из членов (*) и (**) приведенного выше выражения может вычисляться узлом 3 вычисления модели. Между этими вычислениями необходимо лишь подгонять вектор параметров

k-ой основанной на данных функциональной подмодели, причем

имеется в g₁(х) или в h_j(x). Для этого i-ую запись вектора параметров

адаптируют, умножая ее на весовой коэффициент w_i(x), причем:

Поскольку w_i(x) зависит от x, а р-ая компонента x меняется в процессе итераций, w_i(x), а значит, и вектор параметров

, нужно изменять на каждом шаге i вычислений. Вследствие этого необходимо, чтобы вектор параметров

во время вычисления можно было быстро изменять. Таким образом, для вычисления в узле 3 вычисления модели получаем:

причем вычисление проводят с помощью изменяющихся векторов параметров

.

Если (выполняемая "на лету") актуализация вектора параметров

невозможна, то вычисление может быть проведено путем переписывания формулы

в следующее выражение

При этом, как показано на фиг. 2, в узле 3 вычисления модели происходят два вычисления, выполняемые следующим образом. Ниже рассматривается вычисление для первой модели ошибок. Вычисления для других моделей ошибок проходят аналогично:

За первым вычислением (шаг S1)

в одном вычислительных ядер 31, 32 следуют выполняемое программными средствами умножение на -х_р в главном вычислительном узле 2 (шаг S2)

и последующее вычисление (шаг S3) в узле 3 вычисления модели с измененным вектором параметров

, который находят путем поэлементного умножения существующего вектора параметров

на

:

Вычисления в узле 3 вычисления модели необходимы для выполнения вычислительного шага. Благодаря этому не требуется изменять параметры модели в процессе выполнения вычисления.

При вычислении по методу Ньютона вычисление f(x) проводят для каждой итерации. Поэтому член

требует лишь умножения и не требует дополнительного вычисления в узле 3 вычисления модели. Поскольку возможны два вычисления модели, вычисления f(x) и f'(x) могут выполняться для каждой итерации в вычислительных ядрах 31, 32 параллельно.

Для второго случая, в котором обучающие данные Х^(k), Y^(k)нормализованы, формула

может вычисляться, как пояснялось выше, посредством

При этом коэффициент w_i(x) вычисляется под нормализованное значение х, т.е. под X⁽²⁾ в приведенной форме записи, в частности путем вычисления с использованием

. Таким образом параметр денормализации используется, чтобы умножить полученный результат на соответствующий коэффициент.

Если актуализация параметров вычисления модели в реальном времени (онлайн-актуализация) невозможна, то, переписав приведенную выше формулу в следующее выражение:

вычисление можно провести аналогично тому, как пояснялось выше, с единственным отличием умножения на

или подходящий член выражения для других моделей гауссовского процесса. Вычисление выполняют для каждой основанной на данных функциональной подмодели с помощью двух вычислений согласно шагам вычислений, схематически представленным на фиг. 3 и рассматриваемым ниже. Нижеследующее представление шагов вычислений относится к первой модели ошибок, вычисление других моделей ошибок происходит аналогично:

вычисление в первом вычислительном ядре 31 (шаг S11)

умножение в главном вычислительном узле 2 (шаг S12)

вычисление во втором вычислительном ядре 32 с измененным Q_y (шаг S13)

умножение результата на этот коэффициент программными средствами (шаг S14)

Для третьего случая, в котором для каждой основанной на данных функциональной подмодели выходы у обучающих данных преобразованы по методу Бокса-Кокса с использованием b(y), а выходы обучающих данных X нормализованы, выражения для f(x) и f'(x) имеют вид:

при

причем преобразование Бокса-Кокса соответствует b(y)=log(y). Функцию f(x) вычисляют следующим образом:

А вычисление в первом вычислительном ядре 31

ехр(A) вычисление в главном вычислительном узле 2 программными средствами

(ах+с) вычисление функции, дающей среднее значение, в главном вычислительном узле 2 программными средствами

Градиент f'(x) функциональной модели вычисляют, как схематически представлено на фиг. 4, следующим образом:

А вычисление в первом вычислительном ядре 31 (шаг S21)

ехр(А) вычисление в главном вычислительном узле 2 программными средствами (шаг S22)

(ах+с) вычисление функции, дающей среднее значение, в главном вычислительном узле 2 программными средствами (шаг S23)

умножение результата на этот коэффициент программными средствами (шаг S24)

Поскольку в частности, член А используют для вычисления как f(x), так и f'(x), вычисление в узле 3 вычисления модели достаточно выполнить лишь однократно.

Claims

1. Способ вычисления градиента основанной на данных функциональной модели, включающей одну или несколько аккумулированных основанных на данных функциональных подмоделей, характеризующийся тем, что используют аппаратный узел (3) вычисления модели, имеющий первое и второе вычислительные ядра, одно из которых используют для аппаратного вычисления значения функции основанной на данных функциональной модели, включающей экспоненциальную функцию, по меньшей мере одну функцию суммирования и по меньшей мере одну функцию умножения, за две операции организации цикла, а другое - для вычисления градиента основанной на данных функциональной модели для требуемого значения заданной входной переменной, причем вычисление значения функции основанной на данных функциональной модели и вычисление градиента основанной на данных функциональной модели в соответствующих вычислительных ядрах выполняют параллельно.

2. Способ по п. 1, характеризующийся тем, что каждая из основанных на данных функциональных подмоделей основанной на данных функциональной модели определена данными опорных точек, гиперпараметрами и вектором параметров с числом элементов, соответствующим числу опорных точек этой основанной на данных функциональной подмодели, причем для вычисления градиента основанной на данных функциональной модели ее модифицируют, прикладывая к вектору параметров зависящий от данных опорных точек вектор взвешивания.

3. Способ по п. 2, характеризующийся тем, что градиент основанной на данных функциональной модели вычисляют как значение функции модифицированной основанной на данных функциональной модели для требуемого значения заданной входной переменной и прибавляют значение смещения.

4. Способ по п. 2, характеризующийся тем, что опорные точки нормированы, а для получения градиента основанной на данных функциональной модели сумму значения функции модифицированной основанной на данных функциональной модели и значения смещения умножают на коэффициент, основывающийся на стандартном отклонении данных опорных точек в отношении выходных данных.

5. Способ по одному из пп. 2-4, характеризующийся тем, что во время вычисления модифицированной основанной на данных функциональной модели приложение зависящего от данных опорных точек вектора взвешивания к вектору параметров выполняют повторно.

6. Способ по п. 1, характеризующийся тем, что каждая из основанных на данных функциональных подмоделей основанной на данных функциональной модели определена данными опорных точек, гиперпараметрами и вектором параметров, содержащим число элементов, соответствующее числу опорных точек, причем для вычисления градиента основанной на данных функциональной модели в отношении заданной входной переменной основанную на данных функциональную модель модифицируют, вычисляя в узле (3) вычисления модели для требуемого значения заданной входной переменной значение функции основанной на данных функциональной модели, умножая результат вычисления на требуемое значение заданной входной переменной и затем выполняя в узле (3) вычисления модели повторное вычисление основанной на данных функциональной модели с измененным вектором параметров.

7. Способ выполнения итерационного метода Ньютона для основанной на данных функциональной модели в модуле (1) управления, содержащем главный вычислительный узел (2) и узел (3) вычисления модели, выполненный для аппаратного вычисления значений функции основанной на данных функциональной модели, включающей экспоненциальную функцию, по меньшей мере одну функцию суммирования и по меньшей мере одну функцию умножения, за две операции организации цикла, характеризующийся тем, что способом по одному из пп. 1-6 определяют градиент основанной на данных функциональной модели и с помощью узла (3) вычисления модели вычисляют основанную на данных функциональную модель.

8. Модуль (1) управления, содержащий главный вычислительный узел (2) и аппаратный узел (3) вычисления модели, выполненный для аппаратного вычисления значений функции основанной на данных функциональной модели, включающей экспоненциальную функцию, по меньшей мере одну функцию суммирования и по меньшей мере одну функцию умножения, за две операции организации цикла, причем узел (3) вычисления модели имеет вычислительное ядро, обеспечивающее аппаратное вычисление значения функции основанной на данных функциональной модели, и вычислительное ядро, обеспечивающее вычисление градиента основанной на данных функциональной модели для требуемого значения заданной входной переменной, причем одно вычислительное ядро выполняет вычисление значения функции основанной на данных функциональной модели параллельно с вычислением градиента основанной на данных функциональной модели другим вычислительным ядром.

9. Электронный носитель данных, в котором хранится компьютерная программа, при выполнении которой осуществляются все шаги способа по одному из пп. 1-7.

10. Электронный блок управления, содержащий электронный носитель данных по п. 9.