RU2643620C2 - Method of planning assignments of preparing data of internet of things for analyzing systems - Google Patents

Method of planning assignments of preparing data of internet of things for analyzing systems Download PDF

Info

Publication number
RU2643620C2
RU2643620C2 RU2016118326A RU2016118326A RU2643620C2 RU 2643620 C2 RU2643620 C2 RU 2643620C2 RU 2016118326 A RU2016118326 A RU 2016118326A RU 2016118326 A RU2016118326 A RU 2016118326A RU 2643620 C2 RU2643620 C2 RU 2643620C2
Authority
RU
Russia
Prior art keywords
node
messages
devices
cluster
tasks
Prior art date
Application number
RU2016118326A
Other languages
Russian (ru)
Other versions
RU2016118326A (en
Inventor
Петр Дмитриевич Зегжда
Дарья Сергеевна Лаврова
Александр Игоревич Печенкин
Мария Анатольевна Полтавцева
Original Assignee
федеральное государственное автономное образовательное учреждение высшего образования "Санкт-Петербургский политехнический университет Петра Великого" (ФГАОУ ВО "СПбПУ")
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by федеральное государственное автономное образовательное учреждение высшего образования "Санкт-Петербургский политехнический университет Петра Великого" (ФГАОУ ВО "СПбПУ") filed Critical федеральное государственное автономное образовательное учреждение высшего образования "Санкт-Петербургский политехнический университет Петра Великого" (ФГАОУ ВО "СПбПУ")
Priority to RU2016118326A priority Critical patent/RU2643620C2/en
Publication of RU2016118326A publication Critical patent/RU2016118326A/en
Application granted granted Critical
Publication of RU2643620C2 publication Critical patent/RU2643620C2/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]

Abstract

FIELD: information technology.
SUBSTANCE: in method it is allocated sets of related tasks for preliminary data processing, which are operations of processing messages and highlighting their parameters, aggregating and normalizing the parameters of messages from devices, then on the nodes in the database of each node, intermediate data stores are allocated; allocate a handler node on which the intellectual rules of scheduling tasks between nodes of the cluster are formalized, according to which the computational tasks are evenly distributed to the least loaded nodes of the cluster; accumulate on one node-processor all messages from each device, aggregating the values of the message parameters; on each cluster node, priority planning is proposed with dynamic priorities within each node for each computational task by specifying priority weight formula; perform binding in the hierarchy of devices that have the same type; accumulate messages connected to the hierarchy of devices on one node-handler, forming one aggregated message from the hierarchy devices instead of a set of messages from each of the devices in the hierarchy.
EFFECT: automating task scheduling between cluster nodes.
1 dwg

Description

Изобретение относится к области компьютерных систем, а именно к Интернету Вещей и организации обработки данных в Интернете Вещей.The invention relates to the field of computer systems, namely to the Internet of Things and the organization of data processing on the Internet of Things.

Известны электронное передающее устройство высокопроизводительного межсоединения (патент РФ №2579140, G06F 13/42, опубл. 27.03.2016), в котором решается задача аппаратного распределения задач в многопроцессорном кластере. Устройство включает в себя синхронизирующий счетчик, предназначенный для локального выравнивания передачи сигналов определенным устройством с передачей сигналов в системе, содержащей одно или несколько других устройств, сопряженных с возможностью обмена информацией, посредством межсоединения; и многоуровневый стек, содержащий логику физического уровня, логику канального уровня и логику уровня протокола, при этом логика физического уровня по меньшей мере частично выполнена в аппаратном средстве и предназначена для синхронизирования сброса синхронизирующего счетчика с некоторым внешним детерминированным сигналом, глобально поддерживаемым для системы и синхронизирования с этим детерминированным сигналом вхождения в передающее состояние канала передачи данных на основании синхронизирующего счетчика.Known electronic transmission device high-performance interconnect (RF patent No. 2579140, G06F 13/42, publ. 03/27/2016), which solves the problem of hardware distribution of tasks in a multiprocessor cluster. The device includes a synchronization counter designed to locally equalize signal transmission by a specific device with signal transmission in a system containing one or more other devices coupled to the possibility of exchanging information through an interconnect; and a multi-level stack containing physical layer logic, link layer logic and protocol layer logic, while the physical layer logic is at least partially implemented in hardware and is designed to synchronize the reset of the synchronization counter with some external deterministic signal globally supported for the system and synchronization with this deterministic signal of entry into the transmitting state of the data channel based on the synchronization counter.

Недостатками этого устройства для решения поставленной задачи предобработки данных интернета вещей для систем анализа являются:The disadvantages of this device for solving the task of preprocessing the data of the Internet of things for analysis systems are:

1) Отсутствие ориентированности на конкретную решаемую задачу, и, как следствие, более низкая производительность универсальных алгоритмов при решении поставленной задачи на вычислительном кластере.1) Lack of focus on a specific problem being solved, and, as a result, lower performance of universal algorithms when solving a task on a computing cluster.

2) Отсутствие интеллектуальных средств планирования, ориентированных на предобработку данных в задачах нормализации и агрегации сообщений Интернета вещей, позволяющих избегать перегрузки системы.2) Lack of intelligent planning tools focused on data preprocessing in the tasks of normalization and aggregation of messages of the Internet of things, allowing to avoid system overload.

Известны универсальные методы и аппаратное обеспечение для обработки данных интернета вещей, в том числе, в облачной системе (US 2014297210, G01R 21/133, US 2014303935, G01D 21/00). В обоих вариантах предложены оборудование и методы для анализа данных, поступающих из интернета вещей. В одном случае рассматриваются методы для агрегации, фильтрации и распространения данных для анализа, получая первичную информацию из интернета вещей. Согласно методу аналоговые данные интернета вещей переводятся в цифровой вид и передаются по третьим сетям с использованием соответствующих протоколов. Второй метод, ориентированный на использование облаков для анализа данных, принимает данные от датчиков (включая косвенную информацию, чем сходен с рассматриваемой системой) и анализирует ее с учетом облачных технологий. На основе анализа данных согласно рассматриваемому методу генерируется сигнал управления.Universal methods and hardware are known for processing the Internet of things data, including in the cloud system (US 2014297210, G01R 21/133, US 2014303935, G01D 21/00). In both cases, equipment and methods for analyzing data from the Internet of things are proposed. In one case, methods are considered for aggregating, filtering and disseminating data for analysis, obtaining primary information from the Internet of things. According to the method, the analog data of the Internet of things is digitized and transmitted over third networks using the appropriate protocols. The second method, focused on the use of clouds for data analysis, receives data from sensors (including indirect information, which is similar to the system under consideration) and analyzes it taking into account cloud technologies. Based on the analysis of the data according to the method under consideration, a control signal is generated.

Недостатком этих методов является:The disadvantage of these methods is:

1) Низкая эффективность, выражающаяся в низкой скорости работы. Общие (универсальные) подходы методов не учитывают особенности процессов предобработки данных, таких как нормализация и агрегация информации, и связанных с ними этапов процессинга и планирования, необходимых для анализа данных интернета вещей в частности, при решении задач информационной безопасности.1) Low efficiency, expressed in low speed. General (universal) approaches of the methods do not take into account the features of data preprocessing processes, such as normalization and aggregation of information, and the associated stages of processing and planning necessary for the analysis of the Internet of things, in particular, when solving information security problems.

2) Пониженная надежность, вызванная возможными перегрузками вычислительного кластера в силу отсутствия интеллектуальных алгоритмов планирования задач внутри самого облака, ориентированных на специфику обработки агрегируемых и нормализуемых данных.2) Reduced reliability caused by possible overloads of the computing cluster due to the lack of intelligent algorithms for scheduling tasks within the cloud itself, focused on the specifics of processing aggregated and normalized data.

В основу изобретения положена задача интеллектуального планирования на вычислительном кластере задач предварительной обработки данных Интернета Вещей, включая процессы нормализации и агрегации данных, для систем анализа, в котором обеспечивается повышение быстродействия обработки узлами кластера вычислительных задач и оптимизация распределения этих задач между узлами кластера путем представления вычислительных задач в виде графа задач, удобном для хранения в базе данных и получения быстрого доступа к данным; формализации интеллектуальных правил планирования задач при произвольном потоке поступающих сообщений между узлами кластера, обеспечивающих равномерную загрузку всех узлов кластера вычислительными задачами за счет автоматического направления вновь поступающих вычислительных задач на наименее загруженный узел кластера и перенаправляющих накопившиеся на узле кластера вычислительные задачи на освободившиеся узлы; задания формул весовых коэффициентов приоритетов вычислительных задач в рамках одного узла кластера, в соответствии с которыми обеспечивается приоритетное динамическое планирование вычислительных задач, при котором в каждый момент времени каждой вычислительной задаче, поступившей на узел кластера, назначается динамическое значение приоритета, тем самым, наиболее приоритетные вычислительные задачи обрабатываются раньше, вне зависимости от времени, когда они поступили на вычислительный узел кластера.The basis of the invention is the task of intelligent planning on the computing cluster of tasks for the preliminary processing of Internet data of Things, including normalization and data aggregation processes, for analysis systems, which provide increased processing speed of cluster tasks by computing nodes and optimizing the distribution of these tasks between cluster nodes by presenting computing problems in the form of a task graph, convenient for storing in a database and gaining quick access to data; formalization of intelligent rules for scheduling tasks with an arbitrary flow of incoming messages between cluster nodes, ensuring uniform loading of all cluster nodes by computational tasks by automatically sending newly arriving computational tasks to the least loaded cluster node and redirecting computational tasks accumulated on the cluster node to the free nodes; setting formulas for weighting coefficients of priorities of computational problems within a single cluster node, in accordance with which priority dynamic planning of computational tasks is provided, in which at every moment of time each computational task arriving at a cluster node is assigned a dynamic priority value, thereby, the highest priority computational tasks are processed earlier, regardless of the time when they arrived at the computing node of the cluster.

Поставленная задача решается за счет заявляемого способа планирования задач предобработки данных Интернета Вещей для систем анализа, включающего равномерное распределение и динамическое планирование вычислительных задач по предварительной обработке данных, включающей операции обработки сообщений и выделения их параметров, агрегации и нормализации параметров сообщений от устройств, агрегации параметров сообщений от разных устройств между узлами кластера и задание способа их выполнения в рамках каждого вычислительного узла кластера, в отличие от прототипа, выделяют наборы связанных задач по предварительной обработке данных, типовых для обработки каждого сообщения и представляющих собой операции обработки сообщений и выделения их параметров, агрегации и нормализации параметров сообщений от устройств, агрегации сообщений от разных устройств, затем на узлах в базе данных каждого узла выделяют промежуточные хранилища данных, представляющих собой области памяти базы данных; определяют потоки данных внутри системы при проведении вычислений, представляющих собой очередность связанных задач по предварительной обработке данных над сообщениями от устройств; выделяют среди всех узлов кластера узел-обработчик, на котором отдельно формализуют интеллектуальные правила планирования задач между узлами кластера, в соответствии с которыми вычислительные задачи равномерно поступают на наименее загруженные узлы кластера для обработки за кратчайшее время; аккумулируют на одном узле-обработчике все сообщения с каждого устройства, агрегируя значения параметров сообщений; на каждом узле кластера предлагают приоритетное планирование с динамическими приоритетами в рамках каждого узла, назначаемыми каждой вычислительной задаче предварительной обработки данных путем задания формул весовых коэффициентов приоритетов; выполняют связывание в иерархию устройств, обладающих одинаковым типом и находящихся близко друг к другу; аккумулируют сообщения связанных в иерархию устройств на одном узле-обработчике, формируя одно агрегированное сообщение от устройств иерархии вместо множества сообщений от каждого из устройств в иерархии.The problem is solved by the proposed method for planning the tasks of preprocessing the Internet of Things for analysis systems, including the uniform distribution and dynamic planning of computational tasks for data preprocessing, including processing messages and extracting their parameters, aggregating and normalizing message parameters from devices, aggregating message parameters from different devices between cluster nodes and setting the method of their execution within each computing node of the cluster RA, in contrast to the prototype, distinguish sets of related tasks for data preprocessing, typical for processing each message and representing operations of processing messages and extracting their parameters, aggregating and normalizing message parameters from devices, aggregating messages from different devices, then on nodes in the database of each node is allocated intermediate data storages, which are database memory areas; determine the data flows within the system during the calculations, which are a sequence of related tasks for the preliminary processing of data over messages from devices; allocate a processor node among all cluster nodes, on which the intelligent rules for scheduling tasks between cluster nodes are separately formalized, according to which computational tasks uniformly arrive at the least loaded cluster nodes for processing in the shortest time; accumulate on a single processor node all messages from each device, aggregating the values of message parameters; at each node of the cluster, priority planning is offered with dynamic priorities within each node assigned to each computational task of data preprocessing by setting priority weighting formulas; linking to a hierarchy of devices of the same type and located close to each other; accumulate messages related to the hierarchy of devices on one handler node, forming one aggregated message from devices in the hierarchy instead of many messages from each of the devices in the hierarchy.

Изобретение поясняется фиг. 1, на которой приведено разбиение процесса предобработки данных на набор взаимосвязанных типовых задач и взаимодействие между этими задачами. На фиг. 1 показаны внутренние потоки данных, входной и выходной потоки данных, обращения к наборам метаданных.The invention is illustrated in FIG. 1, which shows the breakdown of the data preprocessing process into a set of interrelated typical tasks and the interaction between these tasks. In FIG. 1 shows internal data streams, input and output data streams, access to metadata sets.

Согласно разработанному способу, хранилище DB0 должно представлять собой in memory (постоянно находящийся в памяти) объект, реплицироваться и быть доступно на каждом узле кластера. Хранилища DB1-DB2 являются локальными для каждого узла кластера. Хранилище DB3 развернуто на отдельном узле и обслуживает остальные сообщения всех узлов кластера. Может быть реплицировано. Для повышения скорости работы хранилищ DB1-DB3 и минимизации обмена данными между узлами разработаны следующие правила:According to the developed method, DB0 storage should be an in memory object (permanently in memory), replicated, and accessible on each node of the cluster. DB1-DB2 storages are local to each cluster node. DB3 repository is deployed on a separate node and serves the remaining messages of all nodes in the cluster. It can be replicated. The following rules have been developed to increase the speed of DB1-DB3 storages and minimize data exchange between nodes:

1. Все сообщения с одного устройства поступают на один узел-обработчик.1. All messages from one device go to one processor node.

2. Все сообщения связанных в иерархию устройств направляются на один узел - обработчик.2. All messages connected to the hierarchy of devices are sent to one node - the processor.

Реализация данных правил обеспечивает повышение скорости работы хранилищ и минимизацию обмена данными по следующим причинам:The implementation of these rules provides an increase in the speed of storage and minimization of data exchange for the following reasons:

1. Поскольку сообщения от одного устройства аккумулируются на одном узле-обработчике, в системе не происходит пересылки сообщений между узлами для агрегации. Следовательно, не происходит пересылки сообщений между узлами кластера, за счет этого:1. Since messages from one device are accumulated on one processor node, the system does not forward messages between nodes for aggregation. Therefore, messages are not forwarded between the cluster nodes, due to this:

а) повышается скорость процесса предварительной обработки данных в системе, потому что нет временных затрат на пересылку сообщений (минимизация обмена данными);a) the speed of the data preprocessing process in the system increases, because there is no time spent on sending messages (minimizing data exchange);

б) уменьшается число пересылаемых и хранимых сообщений, так как нет пересылки сообщений одного источника между узлами кластера (минимизация обмена данными и повышение скорости работы хранилищ).b) the number of forwarded and stored messages is reduced, since there is no forwarding of messages from one source between cluster nodes (minimizing data exchange and increasing the speed of storage operations).

2. Поскольку сообщения связанных в иерархию устройств направляются на один узел-обработчик, то агрегация сообщений от этих устройств идет уже не над отдельными сообщениями каждого устройства, а над агрегированными сообщениями каждого устройства. Таким образом, в одном агрегированном сообщении каждого устройства содержатся значения нескольких отдельных сообщений от данного устройства. При этом каждое агрегированное сообщение содержит одно значение того же типа, что и в каждом отдельном. При агрегации сообщений от иерархии устройств происходит формирование единого агрегированного сообщения от нескольких устройств вместо нескольких сообщений от каждого устройства в отдельности. Поэтому пересылка такого сообщения происходит быстрее, а размер передаваемого сообщения при этом не увеличивается, что является существенным для увеличения скорости работы обмена сообщениями и за счет чего достигается минимизация обмена данными между узлами. Кроме этого, увеличивается скорость работы хранилищ, так как осуществляется одно обращение к хранилищам за агрегированным сообщением вместо нескольких обращений для получения сообщений от каждого устройства.2. Since the messages of devices connected to the hierarchy are sent to one processor node, the aggregation of messages from these devices is no longer on individual messages of each device, but on the aggregated messages of each device. Thus, in one aggregated message of each device contains the values of several separate messages from this device. Moreover, each aggregated message contains one value of the same type as in each individual. When aggregating messages from a device hierarchy, a single aggregated message is generated from several devices instead of several messages from each device separately. Therefore, the forwarding of such a message is faster, but the size of the transmitted message does not increase, which is essential for increasing the speed of the message exchange and thereby minimizing the exchange of data between nodes. In addition, the storage operation speed is increased, since one access to the storage is carried out for an aggregated message instead of several calls to receive messages from each device.

При выполнении этих правил задачи распределяются между кластерами в зависимости от загруженности узлов. Загрузка узла кластера определяется по перечню привязанных к нему устройств (сначала физических, потом агрегирующих):When these rules are fulfilled, tasks are distributed between clusters depending on the workload of nodes. The cluster node load is determined by the list of devices attached to it (first physical, then aggregating):

Figure 00000001
Figure 00000001

где Z - загрузка кластера, Nf - число физических устройств, привязанных к кластеру, Na - число агрегирующих устройств, привязанных к кластеру.where Z is the cluster load, Nf is the number of physical devices tied to the cluster, Na is the number of aggregating devices tied to the cluster.

Разработаны профили задач, входящих в процесс предобработки.Profiles of tasks included in the preprocessing process are developed.

Описание профилей задач включает:Description of task profiles includes:

1. Модуль разбора сообщений (Т1) инициируется приходом нового сообщения. Его назначение: обработка сообщения, выделение параметров. На вход ему поступает сообщение, на выходе предоставляются извлеченные параметры.1. The message parsing module (T1) is initiated by the arrival of a new message. Its purpose: message processing, selection of parameters. A message is received at the input, the extracted parameters are provided at the output.

2. Диспетчер агрегации по времени (Т2) инициируется постоянно, его назначение заключается в просмотре очереди параметров и в агрегации параметров при достижении временной отметки. На вход подается выборка из Q1, на выходе предоставляется агрегированный параметр. Активация Т2 осуществляется при:2. The time aggregation manager (T2) is constantly initiated, its purpose is to view the parameter queue and to aggregate the parameters when the time stamp is reached. The input is a sample of Q1, the output is an aggregated parameter. T2 activation is carried out with:

- наступлении момента времени (t);- the onset of time (t);

- занесении очередного параметра в очередь (Т1).- entering the next parameter into the queue (T1).

3. Модуль нормализации (Т3) инициируется модулем Т1 (при передаче параметра) или модулем Т2 (при передаче агрегированного параметра). Его назначение в нормализации параметров. На вход поступает параметр, на выходе получается нормализованный параметр.3. The normalization module (T3) is initiated by the T1 module (when transmitting a parameter) or by the T2 module (when transmitting an aggregated parameter). Its purpose is to normalize parameters. A parameter is input, a normalized parameter is output.

4. Диспетчер (Т4) предназначен для формирования агрегатных и составных событий. На вход поступает параметр (или параметры), на выходе получается событие. Т4 инициируется модулями Т3, Т5, Т6 при поступлении параметра.4. The dispatcher (T4) is designed to form aggregate and compound events. The input (or parameters) is received, the event is output. T4 is initiated by modules T3, T5, T6 upon receipt of the parameter.

5. Модуль формирования составных сообщений (Т5) предназначен для формирования составных событий из нескольких сообщений. На вход поступает выборка из Q2, на выходе предоставляется параметр. Т5 инициируется:5. The module for generating composite messages (T5) is intended for the formation of compound events from several messages. The input receives a sample from Q2, the parameter is provided at the output. T5 is initiated:

- модулем Т4 при поступлении параметра, последнего в цепочке для формирования составного события;- module T4 upon receipt of the parameter, the last in the chain to form a composite event;

- по таймауту для проверки «зависших» событий, на которые не пришли завершающие или продолжающие сообщения.- by timeout to check for “hung” events for which no final or continuing messages have arrived.

6. Модуль формирования агрегатных (составных) устройств (Т6) предназначен для формирования параметров составных устройств. На вход поступает выборка из Q3, на выходе предоставляется параметр составного устройства. Т6 инициируется:6. The module for the formation of aggregate (composite) devices (T6) is intended for the formation of parameters of composite devices. The input is a sample from Q3, the output is a parameter of the composite device. T6 initiated:

- модулем Т4 при поступлении параметра составного устройства;- module T4 upon receipt of the parameter of the composite device;

- при истечении таймаута для составного устройства.- when the timeout for the composite device expires.

В соответствии с разработанным способом, интеллектуальное планирование в задаче обработки больших данных на узле кластера реализуется в виде приоритетной очереди с динамическим назначением приоритетов в зависимости от состояния системы и выполняемой задачи. Изменение приоритетов для балансировки выполнения задач должно происходить в моменты нарушения стабильности системы. Стабильность рассматриваемой системы, исходя из профиля задач, определяется следующими положениями:In accordance with the developed method, intelligent planning in the task of processing big data on a cluster node is implemented as a priority queue with dynamic priority assignment depending on the state of the system and the task being performed. Changing priorities for balancing the execution of tasks should occur at times of instability in the system. The stability of the system in question, based on the profile of the tasks, is determined by the following provisions:

Figure 00000002
Figure 00000002

Figure 00000003
Figure 00000003

Figure 00000004
Figure 00000004

где N - количество задач.where N is the number of tasks.

Также важными статистическими показателями работы узла являются:Also important statistical indicators of the node are:

1. Ni - количество задач каждого типа в системе;1. Ni - the number of tasks of each type in the system;

2. Ti - среднее время прохождения задачи каждого типа в системе;2. Ti is the average time taken to complete each type of task in the system;

3. Nin0 - количество задач, поступающих в систему (Т1) за Δt (за предшествующий период)3. Nin0 - the number of tasks entering the system (T1) for Δt (for the previous period)

4. Nin1 - количество задач, поступающих в систему (Т1) за Δt (за текущей период)4. Nin1 - the number of tasks entering the system (T1) for Δt (for the current period)

5. Q01-Q03 - длины очередей Q1-Q3 на момент Δt (за предшествующий период);5. Q01-Q03 - the length of the queues Q1-Q3 at the time Δt (for the previous period);

6. Q1-Q3 - длины очередей Q1-Q36. Q1-Q3 - Q1-Q3 queue lengths

7. Qp1-Qp3 - пороговые значения длин.7. Qp1-Qp3 - threshold values of lengths.

Таким образом, профиль узла будет иметь вид: {N={N1, … N6}, Т={Т1, … Т6}, Nin0, Nin1, Q01, Q02, Q03, Q1, Q2, Q3, Qp1, Qp2, Qp3}.Thus, the node profile will be: {N = {N1, ... N6}, T = {T1, ... T6}, Nin0, Nin1, Q01, Q02, Q03, Q1, Q2, Q3, Qp1, Qp2, Qp3} .

На основе вышеприведенных положений были выделены следующие правила функционирования системы:Based on the above provisions, the following system operation rules have been identified:

1. Количество задач каждого типа в системе за время функционирования (определенный период функционирования, определяемый по принципу сдвигаемого окна) подчиняется правилам 2-4.1. The number of tasks of each type in the system during the operation (a certain period of operation, determined by the principle of a movable window) is subject to rules 2-4.

2. Соотношение прироста дин очередей должно соответствовать динамике входящих сообщений.2. The ratio of the growth of the queue din should correspond to the dynamics of incoming messages.

Соотношение динамик определяется следующими правилами:The speaker ratio is determined by the following rules:

Figure 00000005
Figure 00000005

Figure 00000006
Figure 00000006

Figure 00000007
Figure 00000007

Figure 00000008
Figure 00000008

Хранилище DB0 является реплицированным по узлам кластера (и, возможно, фрагментированным в соответствии с каталогом отображения Устройство - Узел кластера).The DB0 storage is replicated over the cluster nodes (and possibly fragmented in accordance with the display directory Device - Cluster Node).

Хранилища DB1-DB2 являются локальными для каждого кластера.DB1-DB2 storages are local to each cluster.

Хранилище DB3 развернуто на отдельном узле и обслуживает остальные сообщения всех узлов кластера. Может быть реплицировано.DB3 repository is deployed on a separate node and serves the remaining messages of all nodes in the cluster. It can be replicated.

Новизна предлагаемого решения заключается в аккумулировании сообщений от каждого устройства на одном узле-обработчике в соответствии с интеллектуальными правилами планирования, которые данный узел применяет для обеспечения быстрого равномерного распределения вычислительных задач по предварительной обработке данных между узлами кластера и уменьшения числа пересылаемых между узлами сообщений; в аккумулировании сообщений от иерархий устройств на одном узле-обработчике, за счет чего будут обеспечены получение и дальнейшая пересылка одного агрегированного сообщения, хранящего в себе значения от нескольких устройств, входящих в иерархию. Таким образом, будет обеспечена минимизация передачи сообщений между узлами кластера и будет повышена скорость работы хранилищ за счет сокращения числа обращений к ним и минимизации хранимых данных. При этом указанный способ позволит локальное ведение промежуточных хранилищ DB1-DB2.The novelty of the proposed solution lies in the accumulation of messages from each device on one processor node in accordance with the intelligent planning rules that this node applies to ensure fast uniform distribution of computational tasks on preliminary data processing between cluster nodes and reduce the number of messages sent between nodes; in the accumulation of messages from device hierarchies on a single processor node, which will ensure the receipt and further forwarding of one aggregated message that stores values from several devices included in the hierarchy. Thus, minimizing the transfer of messages between cluster nodes will be ensured and the speed of storage will be increased by reducing the number of calls to them and minimizing the stored data. At the same time, this method will allow local maintenance of intermediate DB1-DB2 storages.

Новизна в контексте планирования задач в рамках одного узла вычислительного кластера выражается в разработанных формулах расчета динамических приоритетов при приоритетном планировании. Использованные при разработанном способе планирования статистические показатели также применимы для установления устойчивости (устойчивого функционирования) системы.Novelty in the context of task planning within one node of a computing cluster is expressed in the developed formulas for calculating dynamic priorities in priority planning. The statistical indicators used in the developed planning method are also applicable to establish the stability (stable functioning) of the system.

Claims (1)

Способ планирования задач предобработки данных Интернета Вещей для систем анализа, включающий равномерное распределение и динамическое планирование вычислительных задач по предварительной обработке данных, включающей операции обработки сообщений и выделения их параметров, агрегации и нормализации параметров сообщений от устройств, агрегации параметров сообщений от разных устройств между узлами кластера и задание способа их выполнения в рамках каждого вычислительного узла кластера, отличающийся тем, что выделяют наборы связанных задач по предварительной обработке данных, типовых для обработки каждого сообщения и представляющих собой операции обработки сообщений и выделения их параметров, агрегации и нормализации параметров сообщений от устройств, агрегации сообщений от разных устройств, затем на узлах в базе данных каждого узла выделяют промежуточные хранилища данных, представляющих собой области памяти базы данных; определяют потоки данных внутри системы при проведении вычислений, представляющих собой очередность связанных задач по предварительной обработке данных над сообщениями от устройств; выделяют среди всех узлов кластера узел-обработчик, на котором отдельно формализуют интеллектуальные правила планирования задач между узлами кластера, в соответствии с которыми вычислительные задачи равномерно поступают на наименее загруженные узлы кластера для обработки за кратчайшее время; аккумулируют на одном узле-обработчике все сообщения с каждого устройства, агрегируя значения параметров сообщений; на каждом узле кластера предлагают приоритетное планирование с динамическими приоритетами в рамках каждого узла, назначаемыми каждой вычислительной задаче предварительной обработки данных путем задания формул весовых коэффициентов приоритетов; выполняют связывание в иерархию устройств, обладающих одинаковым типом и находящихся близко друг к другу; аккумулируют сообщения связанных в иерархию устройств на одном узле-обработчике, формируя одно агрегированное сообщение от устройств иерархии вместо множества сообщений от каждого из устройств в иерархии.A method for scheduling Internet data preprocessing tasks of Things for analysis systems, including uniform distribution and dynamic planning of computational tasks for data preprocessing, including message processing and extraction of their parameters, aggregation and normalization of message parameters from devices, aggregation of message parameters from different devices between cluster nodes and setting the method of their implementation within each computing node of the cluster, characterized in that they distinguish sets of related tasks for the preliminary processing of data typical for processing each message and representing the operations of processing messages and extracting their parameters, aggregating and normalizing message parameters from devices, aggregating messages from different devices, then intermediate nodes storing data on nodes in the database of each node, representing Database memory areas determine the data flows within the system during the calculations, which are a sequence of related tasks for the preliminary processing of data over messages from devices; allocate a processor node among all cluster nodes, on which the intelligent rules for scheduling tasks between cluster nodes are separately formalized, according to which computational tasks uniformly arrive at the least loaded cluster nodes for processing in the shortest time; accumulate on a single processor node all messages from each device, aggregating the values of message parameters; at each node of the cluster, priority planning is offered with dynamic priorities within each node assigned to each computational task of data preprocessing by setting priority weighting formulas; linking to a hierarchy of devices of the same type and located close to each other; accumulate messages related to the hierarchy of devices on one handler node, forming one aggregated message from devices in the hierarchy instead of many messages from each of the devices in the hierarchy.
RU2016118326A 2016-05-11 2016-05-11 Method of planning assignments of preparing data of internet of things for analyzing systems RU2643620C2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2016118326A RU2643620C2 (en) 2016-05-11 2016-05-11 Method of planning assignments of preparing data of internet of things for analyzing systems

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2016118326A RU2643620C2 (en) 2016-05-11 2016-05-11 Method of planning assignments of preparing data of internet of things for analyzing systems

Publications (2)

Publication Number Publication Date
RU2016118326A RU2016118326A (en) 2017-11-16
RU2643620C2 true RU2643620C2 (en) 2018-02-02

Family

ID=60328217

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2016118326A RU2643620C2 (en) 2016-05-11 2016-05-11 Method of planning assignments of preparing data of internet of things for analyzing systems

Country Status (1)

Country Link
RU (1) RU2643620C2 (en)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013054150A1 (en) * 2011-10-11 2013-04-18 Telefonaktiebolaget Lm Ericsson (Publ) Management of data flows between user equipment nodes and clusters of networked resource nodes
US20140297210A1 (en) * 2011-04-22 2014-10-02 Expanergy, Llc Universal internet of things apparatus and methods
US20140303935A1 (en) * 2011-06-15 2014-10-09 Expanergy, Llc Universal internet of things cloud apparatus and methods
WO2015006080A1 (en) * 2013-07-11 2015-01-15 Neura, Inc. Physical environment profiling through internet of things integration platform
WO2015061976A1 (en) * 2013-10-30 2015-05-07 Nokia Technologies Oy Methods and apparatus for task management in a mobile cloud computing environment
EP2977901A2 (en) * 2014-07-02 2016-01-27 Samsung Electronics Co., Ltd Method for assigning priority to multiprocessor tasks and electronic device supporting the same
RU2579140C1 (en) * 2012-10-22 2016-03-27 Интел Корпорейшн Physical layer of high-efficiency interconnection

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140297210A1 (en) * 2011-04-22 2014-10-02 Expanergy, Llc Universal internet of things apparatus and methods
US20140303935A1 (en) * 2011-06-15 2014-10-09 Expanergy, Llc Universal internet of things cloud apparatus and methods
WO2013054150A1 (en) * 2011-10-11 2013-04-18 Telefonaktiebolaget Lm Ericsson (Publ) Management of data flows between user equipment nodes and clusters of networked resource nodes
RU2579140C1 (en) * 2012-10-22 2016-03-27 Интел Корпорейшн Physical layer of high-efficiency interconnection
WO2015006080A1 (en) * 2013-07-11 2015-01-15 Neura, Inc. Physical environment profiling through internet of things integration platform
WO2015061976A1 (en) * 2013-10-30 2015-05-07 Nokia Technologies Oy Methods and apparatus for task management in a mobile cloud computing environment
EP2977901A2 (en) * 2014-07-02 2016-01-27 Samsung Electronics Co., Ltd Method for assigning priority to multiprocessor tasks and electronic device supporting the same

Also Published As

Publication number Publication date
RU2016118326A (en) 2017-11-16

Similar Documents

Publication Publication Date Title
US10474504B2 (en) Distributed node intra-group task scheduling method and system
US10055262B1 (en) Distributed load balancing with imperfect workload information
WO2019001092A1 (en) Load balancing engine, client, distributed computing system, and load balancing method
CN104580396B (en) A kind of method for scheduling task, node and system
US20130268678A1 (en) Method and Apparatus for Facilitating Fulfillment of Requests on a Communication Network
Ivanisenko et al. Survey of major load balancing algorithms in distributed system
US10110464B2 (en) Method of monitoring and warning for configuring routing in a cluster comprising static communication links and computer program implementing that method
CN104298550A (en) Hadoop-oriented dynamic scheduling method
EP3295629B1 (en) Query plan and operation-aware communication buffer management
WO2018076238A1 (en) Heterogeneous system, computation task assignment method and device
WO2015131699A1 (en) Load balancing method and device
Simoncelli et al. Stream-monitoring with blockmon: convergence of network measurements and data analytics platforms
KR101656706B1 (en) Job distribution system in high-performance computing environment
CN104346220B (en) A kind of method for scheduling task and system
RU2643620C2 (en) Method of planning assignments of preparing data of internet of things for analyzing systems
US20140040903A1 (en) Queue and operator instance threads to losslessly process online input streams events
Poltavtseva et al. Planning of aggregation and normalization of data from the Internet of Things for processing on a multiprocessor cluster
Wang et al. Model-based scheduling for stream processing systems
Shahid et al. Some New Observations on SLO-aware Edge Stream Processing
Huang et al. Dynamic tuple scheduling with prediction for data stream processing systems
Kumarasinghe et al. Visiri-distributed complex event processing system for handling large number of queries
Kuppusamy et al. Switch bandwidth congestion prediction in cloud environment
Safvati et al. Analytical review on queuing theory in clouds environments
Miskeen Modeling and Performance Evaluation of MapReduce in Cloud Computing Systems Using Queueing Network Model
Selim et al. Balanced Schedule on Storm for Performance Enhancement

Legal Events

Date Code Title Description
QB4A Licence on use of patent

Free format text: LICENCE FORMERLY AGREED ON 20200212

Effective date: 20200212