RU2374684C1 - Parallel-conveyor device for vectorisation of aerospace images of earth surface - Google Patents

Parallel-conveyor device for vectorisation of aerospace images of earth surface Download PDF

Info

Publication number
RU2374684C1
RU2374684C1 RU2008117656/09A RU2008117656A RU2374684C1 RU 2374684 C1 RU2374684 C1 RU 2374684C1 RU 2008117656/09 A RU2008117656/09 A RU 2008117656/09A RU 2008117656 A RU2008117656 A RU 2008117656A RU 2374684 C1 RU2374684 C1 RU 2374684C1
Authority
RU
Russia
Prior art keywords
output
input
address
processor
image
Prior art date
Application number
RU2008117656/09A
Other languages
Russian (ru)
Inventor
Сергей Юрьевич Мирошниченко (RU)
Сергей Юрьевич Мирошниченко
Виталий Семенович Титов (RU)
Виталий Семенович Титов
Максим Игоревич Труфанов (RU)
Максим Игоревич Труфанов
Original Assignee
Государственное образовательное учреждение высшего профессионального образования Курский государственный технический университет
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Государственное образовательное учреждение высшего профессионального образования Курский государственный технический университет filed Critical Государственное образовательное учреждение высшего профессионального образования Курский государственный технический университет
Priority to RU2008117656/09A priority Critical patent/RU2374684C1/en
Application granted granted Critical
Publication of RU2374684C1 publication Critical patent/RU2374684C1/en

Links

Images

Abstract

FIELD: information technologies.
SUBSTANCE: invention may be used to build vector description of urban development elements on the basis of aerospace images of Earth surface in creation of electronic maps for geoinformation systems. Device comprises processor module, comprising control processor and unit of vectorisation, information interface, main memory controller, main memory, the first graphical module, comprising the first graphical processor and the first buffer memory, the second graphical module, comprising the second graphical processor and the second buffer memory, the third graphical module, comprising the third graphical processor and the third buffer memory, controller of image input-output, external memory.
EFFECT: reduction of time expenses.
3 dwg

Description

Изобретение относится к вычислительной технике и может быть использовано для построения векторного описания элементов городской застройки по аэрокосмическим изображениям земной поверхности при создании электронных карт для геоинформационных систем.The invention relates to computer technology and can be used to build a vector description of urban development elements from aerospace images of the earth's surface when creating electronic maps for geographic information systems.

Известно устройство для выделения контуров изображения (SU 1253337 А1), содержащее последовательно расположенные матрицу светочувствительных элементов, матрицу пороговых дискриминаторов, блок обработки сигналов и блок отображения информации.A device for isolating image contours (SU 1253337 A1), comprising a sequentially arranged matrix of photosensitive elements, a matrix of threshold discriminators, a signal processing unit and an information display unit, is known.

Недостатком устройства является низкая точность выделения контуров, обусловленная независимой обработкой при выделении контуров каждого пикселя в отдельности без учета расположения соседних пикселей анализируемого контура, а также отсутствие возможности формирования векторного описания контуров элементов (объектов) на изображении.The disadvantage of this device is the low accuracy of the contour selection, due to the independent processing when selecting the contours of each pixel individually, without taking into account the location of neighboring pixels of the analyzed circuit, as well as the inability to form a vector description of the contours of elements (objects) in the image.

Наиболее близким устройством является многопроцессорная векторная ЭВМ (RU 2113010 С1), содержащая векторную главную внутреннюю память, связанную с помощью многосвязного широкоформатного информационного интерфейса с центральным управляющим процессором, подсистемой ввода вывода и по крайней мере с одной центральной процессорной частью, включающей векторное арифметическое устройство, содержащее 2m (m=0,1…) многоформатных конвейерных арифметических процессоров, каждый из которых содержит узел управления, регистровую память и конвейерное арифметическое устройство.The closest device is a multiprocessor vector computer (RU 2113010 C1) containing a vector main internal memory connected via a multiply connected wide format information interface with a central control processor, an input input subsystem and at least one central processor part including a vector arithmetic device containing 2m (m = 0.1 ...) multi-format pipelined arithmetic processors, each of which contains a control node, register memory and pipelined arith metic device.

Недостатком данного устройства является низкая скорость обработки изображения в случае использования устройства для векторизации изображения, что вызвано неэффективным использованием вычислительных ресурсов одинаковых по структуре арифметических процессоров при выполнении данной задачи.The disadvantage of this device is the low speed of image processing in the case of using a device for vectorization of the image, which is caused by the inefficient use of computing resources of the same structure arithmetic processors when performing this task.

Технической задачей устройства является снижение временных затрат на построение векторного описания элементов городской застройки по аэрокосмическим изображениям земной поверхности.The technical task of the device is to reduce the time spent on constructing a vector description of the elements of urban development from aerospace images of the earth's surface.

Задача решается тем, что в многопроцессорную векторную ЭВМ, содержащую управляющий процессор и информационный интерфейс, дополнительно введены блок векторизации, контроллер ОЗУ, ОЗУ, первый графический модуль, состоящий из первого графического процессора и первой буферной памяти, второй графический модуль, состоящий из второго графического процессора и второй буферной памяти, третий графический модуль, состоящий из третьего графического процессора и третьей буферной памяти, контроллер ввода-вывода изображения, внешнее ЗУ, причем первый вход-выход CI управляющего процессора подключен к входу-выходу управления CI блока векторизации, выход адреса А и вход-выход данных D которого соединены с первым входом адреса АР и первым входом-выходом данных DP контроллера ОЗУ соответственно; выход адреса AM и второй вход-выход данных DM контроллера ОЗУ соединены со входом адреса А и входом-выходом данных D ОЗУ соответственно; второй вход адреса А контроллера ОЗУ через информационный интерфейс подключен к первому выходу адреса А первого графического процессора, к первому выходу адреса А второго графического процессора, к первому выходу адреса А третьего графического процессора и к первому выходу адреса А контроллера ввода-вывода изображения; третий вход-выход данных D контроллера ОЗУ через информационный интерфейс подключен к первому входу-выходу данных D первого графического процессора, к первому входу-выходу данных D второго графического процессора, к первому входу-выходу данных D третьего графического процессора и к первому входу-выходу данных D контроллера ввода-вывода изображения; второй выход адреса AM и второй вход-выход данных DM первого графического процессора соединены со входом адреса А и входом-выходом данных D первой буферной памяти соответственно; второй выход адреса AM и второй вход-выход данных DM второго графического процессора соединены со входом адреса А и входом-выходом данных D второй буферной памяти соответственно; второй выход адреса AM и второй вход-выход данных DM третьего графического процессора соединены со входом адреса А и входом-выходом данных D третьей буферной памяти соответственно; второй выход адреса АЕ и второй вход-выход данных DE контроллера ввода-вывода изображения подключены ко входу адреса А и входу-выходу данных D внешнего ЗУ соответственно; второй вход-выход С управляющего процессора с помощью информационного интерфейса соединен с входом-выходом управления С первого графического процессора, с входом-выходом управления С второго графического процессора, с входом-выходом управления С третьего графического процессора и с входом-выходом управления С контроллера ввода-вывода изображения.The problem is solved in that a vectorization unit, a RAM controller, RAM, a first graphic module consisting of a first graphic processor and a first buffer memory, a second graphic module consisting of a second graphic processor are additionally introduced into a multiprocessor vector computer containing a control processor and an information interface and a second buffer memory, a third graphics module consisting of a third graphics processor and a third buffer memory, an image input-output controller, an external memory, the first the input-output CI of the control processor is connected to the control input-output CI of the vectorization unit, the output of address A and the data input-output D of which are connected to the first input of the address AR and the first data input-output DP of the RAM controller, respectively; the output of the address AM and the second data input-output DM of the RAM controller are connected to the input of the address A and the data input-output D of the RAM, respectively; the second input of the address A of the RAM controller via the information interface is connected to the first output of the address A of the first GPU, to the first output of the address A of the second GPU, to the first output of the address A of the third GPU and to the first output of the address A of the image input-output controller; the third input-output data D of the RAM controller through the information interface is connected to the first input-output data D of the first GPU, to the first input-output data D of the second GPU, to the first input-output data D of the third GPU and to the first input-output data D of an image input-output controller; the second output of the address AM and the second data input-output DM of the first GPU are connected to the input of the address A and the data input-output D of the first buffer memory, respectively; the second output of the address AM and the second data input-output DM of the second GPU are connected to the input of the address A and the data input-output D of the second buffer memory, respectively; the second output of the address AM and the second data input-output DM of the third GPU are connected to the input of the address A and the data input-output D of the third buffer memory, respectively; the second output of the address AE and the second data input-output DE of the image input-output controller are connected to the input of the address A and the data input-output D of the external memory, respectively; the second input-output C of the control processor using the information interface is connected to the control input-output C of the first graphic processor, with the control input-output C of the second graphic processor, with the control input-output C of the third graphic processor and the control input-output C of the input controller - image output.

Сущность изобретения поясняется чертежами, где на фиг.1 представлена структурная схема устройства для векторизации аэрокосмических изображений земной поверхности, на фиг.2 - алгоритм функционирования устройства в последовательном режиме, на фиг.3 - алгоритм работы устройства в конвейерном режиме.The invention is illustrated by drawings, where Fig. 1 shows a block diagram of a device for vectorizing aerospace images of the earth's surface, Fig. 2 shows an algorithm for operating the device in serial mode, and Fig. 3 shows an algorithm for operating the device in a conveyor mode.

Устройство для векторизации аэрокосмических изображений земной поверхности содержит процессорный модуль 1, состоящий из управляющего процессора 1.1 и блока векторизации 1.2, контроллер ОЗУ 2, ОЗУ 3, первый графический модуль 4, состоящий из первого графического процессора 4.1 и первой буферной памяти 4.2, второй графический модуль 5, состоящий из второго графического процессора 5.1 и второй буферной памяти 5.2, третий графический модуль 6, состоящий из третьего графического процессора 6.1 и третьей буферной памяти 6.2, контроллер ввода-вывода изображения 7, внешнее ЗУ 8, информационный интерфейс 9, причем первый вход-выход CI управляющего процессора 1.1 подключен к входу-выходу управления CI блока векторизации 1.2, выход адреса А и вход-выход данных D которого соединены с первым входом адреса АР и первым входом-выходом данных DP контроллера ОЗУ 2 соответственно; выход адреса AM и второй вход-выход данных DM контроллера ОЗУ 2 соединены со входом адреса А и входом-выходом данных D ОЗУ 3 соответственно; второй вход адреса А контроллера ОЗУ 2 через информационный интерфейс 9 подключен к первому выходу адреса А первого графического процессора 4.1, к первому выходу адреса А второго графического процессора 5.1, к первому выходу адреса А третьего графического процессора 6.1 и к первому выходу адреса А контроллера ввода-вывода изображения 7; третий вход-выход данных D контроллера ОЗУ 2 через информационный интерфейс 9 подключен к первому входу-выходу данных D первого графического процессора 4.1, к первому входу-выходу данных D второго графического процессора 5.1, к первому входу-выходу данных D третьего графического процессора 6.1 и к первому входу-выходу данных D контроллера ввода-вывода изображения 7; второй выход адреса AM и второй вход-выход данных DM первого графического процессора 4.1 соединены со входом адреса А и входом-выходом данных D первой буферной памяти 4.2 соответственно; второй выход адреса AM и второй вход-выход данных DM второго графического процессора 5.1 соединены со входом адреса А и входом-выходом данных D второй буферной памяти 5.2 соответственно; второй выход адреса AM и второй вход-выход данных DM третьего графического процессора 6.1 соединены со входом адреса А и входом-выходом данных D третьей буферной памяти 6.2 соответственно; второй выход адреса АЕ и второй вход-выход данных DE контроллера ввода-вывода изображения 7 подключены ко входу адреса А и входу-выходу данных D внешнего ЗУ 8 соответственно; второй вход-выход С управляющего процессора 1.1 с помощью информационного интерфейса 9 соединен с входом-выходом управления С первого графического процессора 4.1, с входом-выходом управления С второго графического процессора 5.1, с входом-выходом управления С третьего графического процессора 6.1 и с входом-выходом управления С контроллера ввода-вывода изображения 7.A device for vectorizing aerospace images of the earth's surface contains a processor module 1, consisting of a control processor 1.1 and a vectorization block 1.2, a RAM controller 2, RAM 3, a first graphic module 4, consisting of a first graphic processor 4.1 and a first buffer memory 4.2, a second graphic module 5 consisting of a second graphics processor 5.1 and a second buffer memory 5.2, a third graphics module 6, consisting of a third graphics processor 6.1 and a third buffer memory 6.2, an image input-output controller 7, external memory 8, information interface 9, and the first input-output CI of the control processor 1.1 is connected to the input-output of the control CI of the vectorization block 1.2, the output of address A and data input-output D of which are connected to the first input of the address AP and the first input - data output of the DP controller RAM 2, respectively; the output of the address AM and the second data input-output DM of the RAM controller 2 are connected to the input of the address A and the data input-output D of the RAM 3, respectively; the second input of address A of the RAM controller 2 through the information interface 9 is connected to the first output of address A of the first GPU 4.1, to the first output of address A of the second GPU 5.1, to the first output of address A of the third GPU 6.1 and to the first output of address A of the input controller- image output 7; the third data input-output D of the RAM controller 2 is connected via an information interface 9 to the first data input-output D of the first GPU 4.1, to the first data input-output D of the second GPU 5.1, to the first data input-output D of the third GPU 6.1 and to the first input-output data D of the controller input-output image 7; the second output of the address AM and the second data input-output DM of the first GPU 4.1 are connected to the input of the address A and the data input-output D of the first buffer memory 4.2, respectively; the second output of the address AM and the second data input-output DM of the second GPU 5.1 are connected to the input of the address A and the data input-output D of the second buffer memory 5.2, respectively; the second output of the address AM and the second data input-output DM of the third GPU 6.1 are connected to the input of the address A and the data input-output D of the third buffer memory 6.2, respectively; the second output of the address AE and the second data input-output DE of the image input-output controller 7 are connected to the input of the address A and the data input-output D of the external memory 8, respectively; the second input-output C of the control processor 1.1 using the information interface 9 is connected to the input-output of the control From the first GPU 4.1, with the input-output of the control From the second GPU 5.1, with the input-output of the control From the third GPU 6.1 and with the input- control output From the image I / O controller 7.

Устройство работает следующим образом.The device operates as follows.

При запуске устройства обработка первого изображения выполняется в последовательном режиме. Для этого управляющий процессор 1.1 выставляет на втором входе-выходе С код команды ввода изображения, поступающий информационный интерфейс 9 на вход-выход управления С контроллера ввода-вывода изображения 7. По получении кода команды ввода изображения контроллер ввода-вывода изображения 7 выполняет построчное считывание изображения из внешнего ЗУ 8 (блок 1 алгоритма на фиг.2), выставляя адрес строки изображения на втором выходе адреса АЕ, который поступает на вход адреса А внешнего ЗУ 8. При получении адреса внешнее ЗУ 8 поэлементно выдает соответствующую строку изображения через вход-выход данных D на второй вход-выход данных DE контроллера ввода-вывода изображения 7. Контроллер ввода-вывода 7 поэлементно передает полученную строку изображения через контроллер ОЗУ 2 в ОЗУ 3, для чего на первом выходе адреса А формирует адрес строки изображения, поступающий через информационный интерфейс 9 на второй вход адреса А контроллера ОЗУ 2, а на первый вход-выход данных D поэлементно подает строку изображения, которая через информационный интерфейс 9 поступает на третий вход-выход данных D контроллера ОЗУ 2. Контроллер ОЗУ 2 передает полученный адрес на вход адреса А ОЗУ 3 и элементы строки изображения на вход-выход данных D ОЗУ 3, записывающего полученную строку изображения по указанному адресу. По завершении операции считывания изображения контроллер ввода-вывода изображения 7 через вход-выход управления С выдает код подтверждения получения данных на второй вход-выход С управляющего процессора 1.1, по которому управляющий процессор 1.1 выставляет на второй вход-выход С код команды копирования изображения первым графическим процессором, поступающий через информационный интерфейс 9 на вход-выход управления С первого графического процессора 4.1.When the device starts up, the first image is processed in sequential mode. For this, the control processor 1.1 sets the image input command code at the second input-output C, the incoming information interface 9 to the control input-output C of the image input-output controller 7. Upon receipt of the image input command code, the image input-output controller 7 performs line-by-line image reading from the external memory 8 (block 1 of the algorithm in figure 2), setting the address of the image line at the second output of the address AE, which is input to the address A of the external memory 8. Upon receipt of the address, the external memory 8 gives the corresponding image line through the data input-output D to the second data input-output DE of the image input-output controller 7. The input-output controller 7 transfers the received image line-by-bit through the RAM controller 2 to RAM 3, for which the address A forms the address at the first output image lines coming through the information interface 9 to the second input of the address A of the RAM controller 2, and to the first data input-output D sends an image line element, which through the information interface 9 goes to the third data input-output D RAM controller 2. The RAM controller 2 transfers the received address to the input of the address A of RAM 3 and the image line elements to the data input / output D of RAM 3, which writes the received image line to the specified address. Upon completion of the image reading operation, the image input / output controller 7 through the control input-output C gives a confirmation code for receiving data to the second input-output C of the control processor 1.1, by which the control processor 1.1 sets the image copy command code to the first graphic on the second input-output C the processor arriving through the information interface 9 to the input-output control From the first graphic processor 4.1.

Первый графический процессор 4.1 с использованием контроллера ОЗУ 2 в режиме прямого доступа к памяти (ПДП) осуществляет построчное чтение изображения из ОЗУ 3 и его запись в первую буферную память 4.2 (блок 2 алгоритма на фиг.2), для чего первый графический процессор 4.1 на первом выходе адреса А формирует адрес строки изображения, поступающий через информационный интерфейс 9 и контроллер ОЗУ 2 на вход адреса А ОЗУ 3. После получения адреса ОЗУ 3 поэлементно выдает указанную строку изображения на вход-выход данных D, откуда строка поступает на второй вход-выход данных DM контроллера ОЗУ 2, подающего получаемые данные через третий вход-выход данных D на первый вход-выход данных D первого графического процессора 4.1. Первый графический процессор 4.1 поэлементно передает строку изображения на вход-выход данных D первой буферной памяти 4.2, формируя на входе адреса А первой буферной памяти 4.2 адрес копируемой строки, после чего первая буферная память 4.2 записывает строку изображения по указанному адресу. По окончании операции копирования изображения первый графический процессор 4.1 подает через информационный интерфейс 9 на второй вход-выход С управляющего процессора 1.1 код подтверждения копирования данных. Аналогично выполняется копирование изображения из ОЗУ 3 во вторую буферную память 5.2 (блок 3 алгоритма на фиг.2) и третью буферную память 6.2 (блок 4 алгоритма на фиг.2). По завершении копирования изображения всеми графическими процессорами управляющий процессор 1.1 выдает на втором входе-входе С код команды обработки, который через информационный интерфейс 9 поступает на вход-выход управления С первого графического процессора 4.1, вход-выход управления С второго графического процессора 5.1, вход-выход управления С третьего графического процессора 6.1. При получении кода команды обработки каждый из графических процессоров выполняет обработку копии изображения, хранимой в буферной памяти соответствующего графического модуля.The first GPU 4.1 using the RAM controller 2 in direct access to memory (DAP) mode reads the image from RAM 3 line by line and writes it to the first buffer memory 4.2 (algorithm block 2 in FIG. 2), for which the first GPU 4.1 the first output of address A generates the address of the image line coming through the information interface 9 and the RAM controller 2 to the input of the address A of the RAM 3. After receiving the address of the RAM 3, it element-wise outputs the indicated image line to the data input-output D, from where the line goes to the second th input-output data DM controller RAM 2, which feeds the received data through the third input-output data D to the first input-output data D of the first GPU 4.1. The first graphics processor 4.1 transfers the image line by element to the input / output of data D of the first buffer memory 4.2, forming the address of the line to be copied at the input of the address A of the first buffer memory 4.2, after which the first buffer memory 4.2 writes the image line to the specified address. At the end of the image copy operation, the first graphic processor 4.1 submits a data copy confirmation code to the second input-output C of the control processor 1.1 through the information interface 9. Similarly, the image is copied from RAM 3 to the second buffer memory 5.2 (block 3 of the algorithm in FIG. 2) and the third buffer memory 6.2 (block 4 of the algorithm in FIG. 2). Upon completion of the copying of the image by all the GPUs, the control processor 1.1 issues a processing command code at the second input-input C, which through the information interface 9 is fed to the control input-output C of the first graphic processor 4.1, control input-output C of the second graphic processor 5.1, input- control output From the third GPU 6.1. Upon receipt of the processing command code, each of the GPUs processes a copy of the image stored in the buffer memory of the corresponding graphics module.

Первый графический процессор 4.1 производит дифференцирование аэрокосмического изображения (блок 5 алгоритма на фиг.2) путем его свертки с масками, представляющими дискретные аппроксимации частных производных функции Гаусса [Elder J.H. Local Scale Control for Edge Detection and Blur Estimation [Text] / James. H. Elder, Steven W. Zuckler // IEEE Transactions on Pattern Analysis and Machine Intelligence. - Vol.20, No7. - 1998. - pp.699-716]. Второй графический процессор 5.1 выполняет создание кластерного представления аэрокосмического изображения (блок 6 алгоритма на фиг.2) в пространстве, содержащем яркостные и геометрические признаки [Гонсалес Р. Цифровая обработка изображений [Текст] / Р.Гонсалес, Р.Вудз // М.: Техносфера, 2006, 1072 с.]. Третий графический процессор 6.1 производит вычисление коэффициентов дискретного преобразования Фурье аэрокосмического изображения (блок 7 алгоритма на фиг.2) [Сойфер В.А. Методы компьютерной обработки изображений / Под ред. В.А.Сойфера - 2-е изд., испр. - М.: ФИЗМАТЛИТ, 2003. - 784 с.]. По окончании обработки каждый графический процессор через информационный интерфейс 9 подает на второй вход-выход С управляющего процессора 1.1 код завершения обработки.The first graphic processor 4.1 differentiates the aerospace image (block 5 of the algorithm in FIG. 2) by convolution with masks representing discrete approximations of partial derivatives of the Gauss function [Elder J.H. Local Scale Control for Edge Detection and Blur Estimation [Text] / James. H. Elder, Steven W. Zuckler // IEEE Transactions on Pattern Analysis and Machine Intelligence. - Vol.20, No7. - 1998. - pp. 699-716]. The second graphic processor 5.1 performs the creation of a cluster representation of the aerospace image (block 6 of the algorithm in figure 2) in a space containing brightness and geometric features [R. Gonzalez Digital image processing [Text] / R. Gonzalez, R. Woods // M .: Technosphere, 2006, 1072 pp.]. The third graphics processor 6.1 performs the calculation of the coefficients of the discrete Fourier transform of the aerospace image (block 7 of the algorithm in figure 2) [Soifer VA Methods of computer image processing / Ed. V.A.Soyfera - 2nd ed., Rev. - M .: FIZMATLIT, 2003. - 784 p.]. At the end of the processing, each graphic processor through the information interface 9 supplies to the second input-output C of the control processor 1.1 a processing completion code.

Получив коды завершения обработки от всех графических процессоров, управляющий процессор 1.1 на втором входе-выходе С выставляет код команды копирования результатов обработки первого графического процессора, который через с помощью информационного интерфейса 9 поступает на вход-выход управления С первого графического процессора 4.1. При получении данного кода первый графический процессор 4.1 с использованием контроллера ОЗУ 2 в режиме ПДЛ осуществляет построчную запись полученного в результате дифференцирования контурного изображения в ОЗУ 3 из буферной памяти 4.2 (блок 8 алгоритма на фиг.2). Для этого первый графический процессор 4.1 выставляет на втором выходе адреса AM адрес строки контурного изображения, который поступает на вход адреса А первой буферной памяти 4.2. По получении адреса строки буферная память 4.2 поэлементно выдает на вход-выход данных D соответствующую строку изображения, поступающую на второй вход-выход DM первого графического процессора 4.1, который поэлементно передает строку изображения через информационный интерфейс 9 на третий вход-выход данных D контроллера ОЗУ 2 и выставляет соответствующий адрес на втором входе адреса А контроллера ОЗУ 2. Контроллер ОЗУ 2 передает полученный адрес на вход адреса А и элементы строки изображения на вход-выход данных D ОЗУ 3, которое записывает полученную строку контурного изображения по указанному адресу. По окончании копирования контурного изображения в ОЗУ 3 первый графический процессор 4.1 через информационный интерфейс 9 подает на второй вход-выход С управляющего процессора 1.1 код подтверждения копирования результатов. Аналогично производится запись кластерного изображения из второй буферной памяти 5.2 в ОЗУ 3 (блок 9 алгоритма на фиг.2) и частотного представления изображения из третьей буферной памяти 6.2 в ОЗУ 3 (блок 10 алгоритма на фиг.2).Having received the processing completion codes from all the GPUs, the control processor 1.1 at the second input-output C sets the command code for copying the processing results of the first GPU, which through the information interface 9 is fed to the control input-output C of the first GPU 4.1. Upon receipt of this code, the first graphics processor 4.1 using the RAM controller 2 in the PDL mode performs line-by-line recording of the resulting contour image in RAM 3 from the buffer memory 4.2 (block 8 of the algorithm in FIG. 2). To do this, the first graphics processor 4.1 sets the second address of the address AM to the line address of the contour image, which is fed to the input of address A of the first buffer memory 4.2. Upon receipt of the address of the line, the buffer memory 4.2 element-by-element outputs the corresponding image line D to the second input-output DM of the first GPU 4.1, which transfers the image line-by-element through the information interface 9 to the third data input-output D of the RAM controller 2 and sets the corresponding address on the second input of the address A of the RAM controller 2. The RAM controller 2 transfers the received address to the input of the address A and the image line elements to the data input-output D of the RAM 3, which records the received The specified line of the contour image at the specified address. At the end of copying the contour image in RAM 3, the first graphics processor 4.1 through the information interface 9 provides the second input-output C of the control processor 1.1 with a confirmation code for copying the results. Similarly, the cluster image is recorded from the second buffer memory 5.2 in RAM 3 (block 9 of the algorithm in FIG. 2) and the frequency representation of the image from the third buffer memory 6.2 in RAM 3 (block 10 of the algorithm in FIG. 2).

После получения кодов подтверждения копирования результатов от всех графических процессоров управляющий процессор 1.1 через первый вход-выход CI подает на вход-выход управления CI блока векторизации 1.2 код команды обработки результатов, по получении которого блок векторизации 1.2 производит создание векторного представления объектов на основании контурного, кластерного и частотного описаний аэрокосмического изображения, хранимых в ОЗУ 3 (блок 11 алгоритма на фиг.2). Векторное представление объектов [Мирошниченко С.Ю. Распознающий аппаратно-программный диагностирующий комплекс [Текст] / С.Ю.Мирошниченко, В.Н.Мишустин, С.В.Дегтярев // Изв. ВУЗов. Приборостроение. - Т.48, №2. - 2005. - С.22-27] строится как множество замкнутых векторных последовательностей, каждая из которых представляет контур объекта, границу кластера или область изображения с близкими значениями коэффициентов преобразования Фурье. Сформированное таким образом векторное представление объектов на аэрокосмическом изображении с помощью контроллера ОЗУ 2 записывается в ОЗУ 3. По завершении построения векторного описания блок векторизации 1.2 подает на первый вход-выход CI управляющего процессора 1.1 код завершения векторизации, при получении которого управляющий процессор 1.1 выставляет на втором входе-выходе С код команды выдачи результатов, поступающий через информационный интерфейс на вход-выход управления С контроллера ввода-вывода изображения 7. Контроллер ввода-вывода изображения 7 при помощи контроллера ОЗУ 2 считывает векторное представление изображения из ОЗУ 3 в режиме ПДП и записывает его во внешнее ЗУ 8 (блок 12 алгоритма на фиг.2) аналогично тому, как производится считывание изображения из внешнего ЗУ 8.After receiving confirmation codes for copying the results from all the GPUs, the control processor 1.1 sends the result processing code to the CI control input vector output 1.2 through the first CI input / output, upon receipt of which the vectorization block 1.2 creates a vector representation of objects based on the contour, cluster and frequency descriptions of the aerospace image stored in RAM 3 (block 11 of the algorithm in figure 2). Vector representation of objects [Miroshnichenko S.Yu. Recognizing hardware-software diagnostic complex [Text] / S.Yu. Miroshnichenko, V.N. Mishustin, S.V. Degtyarev // Izv. Universities. Instrument making. - T. 48, No. 2. - 2005. - P.22-27] is constructed as a set of closed vector sequences, each of which represents the contour of the object, the boundary of the cluster or image area with close values of the Fourier transform coefficients. The vector representation of objects formed in this way on an aerospace image using the RAM 2 controller is written to RAM 3. Upon completion of the construction of the vector description, vectorization block 1.2 provides the vectorization completion code to the first input-output CI of the control processor 1.1, upon receipt of which the control processor 1.1 sets the second input-output C code of the command for the issuance of results coming through the information interface to the input-output of the control From the image input-output controller 7. Input-output controller image water 7 using the RAM controller 2 reads a vector representation of the image from RAM 3 in the DAP mode and writes it to the external memory 8 (block 12 of the algorithm in figure 2) in the same way as the image is read from the external memory 8.

Обработку второго и последующих изображений устройство выполняет в конвейерном режиме, что позволяет повысить загрузку вычислительных блоков. После копирования изображения из ОЗУ 3 в буферную память каждого из трех графических модулей (блоки 1, 2, 3 алгоритма на фиг.3) помимо дифференцирования текущего изображения первым графическим процессором 4.1 (блок 4 алгоритма на фиг.3), кластеризации текущего изображения вторым графическим процессором 5.1 (блок 5 алгоритма на фиг.3), преобразования Фурье текущего изображения третьим графическим процессором 6.1 (блок 6 алгоритма на фиг.3) также производятся чтение следующего изображения из внешнего ЗУ 8 в ОЗУ 3 (блок 8 алгоритма на фиг.3) и создание блоком векторизации 1.2 векторного представления предыдущего изображения (блок 7 алгоритма на фиг.3), результаты дифференцирования, кластеризации и преобразования Фурье которого хранятся в ОЗУ 3. По окончании всех указанных операций контурное, кластерное и частотное представления текущего изображения последовательно копируются из буферной памяти каждого графического модуля в ОЗУ 3 с помощью контроллера ОЗУ 2 (блоки 9, 10, 11 алгоритма на фиг.3), после чего векторное представление предыдущего изображения записывается из ОЗУ 3 во внешнее ЗУ 8 (блок 12 алгоритма на фиг.3).The device performs the processing of the second and subsequent images in the pipelined mode, which allows to increase the loading of computing units. After copying the image from RAM 3 to the buffer memory of each of the three graphic modules (blocks 1, 2, 3 of the algorithm in FIG. 3), in addition to differentiating the current image with the first GPU 4.1 (block 4 of the algorithm in FIG. 3), clustering the current image with the second graphic the processor 5.1 (block 5 of the algorithm in FIG. 3), the Fourier transform of the current image by the third graphics processor 6.1 (block 6 of the algorithm in FIG. 3) also reads the next image from the external memory 8 into RAM 3 (block 8 of the algorithm in FIG. 3) and creating a block m vectorization 1.2 of the vector representation of the previous image (block 7 of the algorithm in figure 3), the results of differentiation, clustering and Fourier transforms of which are stored in RAM 3. At the end of all these operations, the contour, cluster and frequency representations of the current image are sequentially copied from the buffer memory of each graphic module in RAM 3 using the controller RAM 2 (blocks 9, 10, 11 of the algorithm in figure 3), after which the vector representation of the previous image is written from RAM 3 to external memory 8 (block 12 a goritma in Figure 3).

Процессорный модуль 1 может быть реализован на двуядерных процессорах Intel Core 2 Duo или AMD Athlon x2, причем первое ядро процессора выполняет функции управляющего процессора 1.1, второе ядро - функции блока векторизации 1.2. Для реализации процессорного модуля также могут быть использованы трехядерные процессоры AMD Phenom х3 и четырехядерные процессоры Intel Core 2 Quad или AMD Phenom, где первое ядро выполняет функции управляющего процессора 1.1, а другие два или три ядра-функции блока векторизации 1.2.The processor module 1 can be implemented on dual-core Intel Core 2 Duo or AMD Athlon x2 processors, with the first processor core serving as the control processor 1.1, the second core as a vectorization block 1.2. To implement the processor module, AMD Phenom x3 tri-core processors and Intel Core 2 Quad or AMD Phenom quad-core processors can also be used, where the first core functions as a control processor 1.1 and the other two or three core function as a vectorization block 1.2.

Графические модули 4, 5, 6 реализуются на трех графических ускорителях nVidia GeForce 8800/9600/9800, объединенных с использованием технологии nVidia SLI, или на трех графических ускорителях AMD ATI HD 3850/3870, объединенных при помощи технологии ATI CrossFire.Graphics modules 4, 5, 6 are implemented on three nVidia GeForce 8800/9600/9800 graphics accelerators combined using nVidia SLI technology, or on three AMD ATI HD 3850/3870 graphics accelerators combined using ATI CrossFire technology.

Таким образом, предложенное решение позволяет снизить временные затраты на построение векторного описания элементов городской застройки по аэрокосмическим изображениям земной поверхности счет введения в устройство первого графического процессора 4.1, второго графического процессора 5.1, третьего графического процессора 6.1 и блока векторизации 1.2, которые в конвейерном режиме параллельно выполняют дифференцирование, кластеризацию, преобразование Фурье текущего изображения и векторное кодирование объектов на предыдущем изображении.Thus, the proposed solution allows to reduce the time spent on building a vector description of urban development elements from aerospace images of the earth’s surface by introducing into the device the first GPU 4.1, the second GPU 5.1, the third GPU 6.1 and the vectorization block 1.2, which parallelly execute in the conveyor mode differentiation, clustering, Fourier transform of the current image and vector encoding of objects in the previous image.

Claims (1)

Устройство для векторизации аэрокосмических изображений земной поверхности, содержащее управляющий процессор и информационный интерфейс, отличающееся тем, что в устройство введены блок векторизации, контроллер ОЗУ, ОЗУ, первый графический модуль, состоящий из первого графического процессора и первой буферной памяти, второй графический модуль, состоящий из второго графического процессора и второй буферной памяти, третий графический модуль, состоящий из третьего графического процессора и третьей буферной памяти, контроллер ввода-вывода изображения, внешнее ЗУ, причем первый вход-выход управляющего процессора подключен к входу-выходу управления блока векторизации, выход адреса и вход-выход данных которого соединены с первым входом адреса и первым входом-выходом данных контроллера ОЗУ соответственно; выход адреса и второй вход-выход данных контроллера ОЗУ соединены со входом адреса и входом-выходом данных ОЗУ соответственно; второй вход адреса контроллера ОЗУ через информационный интерфейс подключен к первому выходу адреса первого графического процессора, к первому выходу адреса второго графического процессора, к первому выходу адреса третьего графического процессора и к первому выходу адреса контроллера ввода-вывода изображения; третий вход-выход данных контроллера ОЗУ через информационный интерфейс подключен к первому входу-выходу данных первого графического процессора, к первому входу-выходу данных второго графического процессора, к первому входу-выходу данных третьего графического процессора и к первому входу-выходу данных контроллера ввода-вывода изображения; второй выход адреса и второй вход-выход данных первого графического процессора соединены со входом адреса и входом-выходом данных первой буферной памяти соответственно; второй выход адреса и второй вход-выход данных второго графического процессора соединены со входом адреса и входом-выходом данных второй буферной памяти соответственно; второй выход адреса и второй вход-выход данных третьего графического процессора соединены со входом адреса и входом-выходом данных третьей буферной памяти соответственно; второй выход адреса и второй вход-выход данных контроллера ввода-вывода изображения подключены ко входу адреса и входу-выходу данных внешнего ЗУ соответственно; второй вход-выход управляющего процессора с помощью информационного интерфейса соединен с входом-выходом управления первого графического процессора, с входом-выходом управления второго графического процессора, с входом-выходом управления третьего графического процессора и с входом-выходом управления контроллера ввода-вывода изображения. A device for vectorizing aerospace images of the earth's surface, containing a control processor and an information interface, characterized in that a vectorization unit, a RAM controller, RAM, a first graphic module consisting of a first graphic processor and a first buffer memory, a second graphic module consisting of a second graphics processor and a second buffer memory, a third graphics module consisting of a third graphics processor and a third buffer memory, an input-output controller yes, external memory, and the first input-output of the control processor is connected to the input-output of the control unit of the vectorization, the output of the address and the input-output of the data of which are connected to the first input of the address and the first data input-output of the RAM controller, respectively; the output of the address and the second data input / output of the RAM controller are connected to the address input and the input / output of the RAM data, respectively; the second input of the address of the RAM controller through the information interface is connected to the first output of the address of the first graphic processor, to the first output of the address of the second graphic processor, to the first output of the address of the third graphic processor and to the first output of the address of the image input-output controller; the third input-output of data of the RAM controller through the information interface is connected to the first input-output of data of the first graphic processor, to the first input-output of data of the second graphic processor, to the first input-output of data of the third graphic processor and to the first input-output of data of the input- image output; the second address output and the second data input-output of the first GPU are connected to the address input and data input-output of the first buffer memory, respectively; the second address output and the second data input-output of the second GPU are connected to the address input and data input-output of the second buffer memory, respectively; the second address output and the second data input-output of the third GPU are connected to the address input and data input-output of the third buffer memory, respectively; the second address output and the second data input-output controller of the image input-output controller are connected to the address input and data input-output of the external memory, respectively; the second input-output of the control processor using the information interface is connected to the control input-output of the first graphic processor, to the control input-output of the second graphic processor, to the control input-output of the third graphic processor and to the control input-output of the image input-output controller.
RU2008117656/09A 2008-05-04 2008-05-04 Parallel-conveyor device for vectorisation of aerospace images of earth surface RU2374684C1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2008117656/09A RU2374684C1 (en) 2008-05-04 2008-05-04 Parallel-conveyor device for vectorisation of aerospace images of earth surface

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2008117656/09A RU2374684C1 (en) 2008-05-04 2008-05-04 Parallel-conveyor device for vectorisation of aerospace images of earth surface

Publications (1)

Publication Number Publication Date
RU2374684C1 true RU2374684C1 (en) 2009-11-27

Family

ID=41476864

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2008117656/09A RU2374684C1 (en) 2008-05-04 2008-05-04 Parallel-conveyor device for vectorisation of aerospace images of earth surface

Country Status (1)

Country Link
RU (1) RU2374684C1 (en)

Cited By (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013100783A1 (en) * 2011-12-29 2013-07-04 Intel Corporation Method and system for control signalling in a data path module
US10331583B2 (en) 2013-09-26 2019-06-25 Intel Corporation Executing distributed memory operations using processing elements connected by distributed channels
US10380063B2 (en) 2017-09-30 2019-08-13 Intel Corporation Processors, methods, and systems with a configurable spatial accelerator having a sequencer dataflow operator
US10387319B2 (en) 2017-07-01 2019-08-20 Intel Corporation Processors, methods, and systems for a configurable spatial accelerator with memory system performance, power reduction, and atomics support features
US10402168B2 (en) 2016-10-01 2019-09-03 Intel Corporation Low energy consumption mantissa multiplication for floating point multiply-add operations
US10417175B2 (en) 2017-12-30 2019-09-17 Intel Corporation Apparatus, methods, and systems for memory consistency in a configurable spatial accelerator
US10416999B2 (en) 2016-12-30 2019-09-17 Intel Corporation Processors, methods, and systems with a configurable spatial accelerator
US10445234B2 (en) 2017-07-01 2019-10-15 Intel Corporation Processors, methods, and systems for a configurable spatial accelerator with transactional and replay features
US10445451B2 (en) 2017-07-01 2019-10-15 Intel Corporation Processors, methods, and systems for a configurable spatial accelerator with performance, correctness, and power reduction features
US10445250B2 (en) 2017-12-30 2019-10-15 Intel Corporation Apparatus, methods, and systems with a configurable spatial accelerator
US10445098B2 (en) 2017-09-30 2019-10-15 Intel Corporation Processors and methods for privileged configuration in a spatial array
US10459866B1 (en) 2018-06-30 2019-10-29 Intel Corporation Apparatuses, methods, and systems for integrated control and data processing in a configurable spatial accelerator
US10467183B2 (en) 2017-07-01 2019-11-05 Intel Corporation Processors and methods for pipelined runtime services in a spatial array
US10469397B2 (en) 2017-07-01 2019-11-05 Intel Corporation Processors and methods with configurable network-based dataflow operator circuits
US10474375B2 (en) 2016-12-30 2019-11-12 Intel Corporation Runtime address disambiguation in acceleration hardware
US10496574B2 (en) 2017-09-28 2019-12-03 Intel Corporation Processors, methods, and systems for a memory fence in a configurable spatial accelerator
US10515046B2 (en) 2017-07-01 2019-12-24 Intel Corporation Processors, methods, and systems with a configurable spatial accelerator
US10515049B1 (en) 2017-07-01 2019-12-24 Intel Corporation Memory circuits and methods for distributed memory hazard detection and error recovery
US10558575B2 (en) 2016-12-30 2020-02-11 Intel Corporation Processors, methods, and systems with a configurable spatial accelerator
US10564980B2 (en) 2018-04-03 2020-02-18 Intel Corporation Apparatus, methods, and systems for conditional queues in a configurable spatial accelerator
US10565134B2 (en) 2017-12-30 2020-02-18 Intel Corporation Apparatus, methods, and systems for multicast in a configurable spatial accelerator
US10572376B2 (en) 2016-12-30 2020-02-25 Intel Corporation Memory ordering in acceleration hardware
US10678724B1 (en) 2018-12-29 2020-06-09 Intel Corporation Apparatuses, methods, and systems for in-network storage in a configurable spatial accelerator
US10817291B2 (en) 2019-03-30 2020-10-27 Intel Corporation Apparatuses, methods, and systems for swizzle operations in a configurable spatial accelerator
US10853073B2 (en) 2018-06-30 2020-12-01 Intel Corporation Apparatuses, methods, and systems for conditional operations in a configurable spatial accelerator
US10891240B2 (en) 2018-06-30 2021-01-12 Intel Corporation Apparatus, methods, and systems for low latency communication in a configurable spatial accelerator
US10915471B2 (en) 2019-03-30 2021-02-09 Intel Corporation Apparatuses, methods, and systems for memory interface circuit allocation in a configurable spatial accelerator
US10965536B2 (en) 2019-03-30 2021-03-30 Intel Corporation Methods and apparatus to insert buffers in a dataflow graph
US11029927B2 (en) 2019-03-30 2021-06-08 Intel Corporation Methods and apparatus to detect and annotate backedges in a dataflow graph
US11037050B2 (en) 2019-06-29 2021-06-15 Intel Corporation Apparatuses, methods, and systems for memory interface circuit arbitration in a configurable spatial accelerator
US11086816B2 (en) 2017-09-28 2021-08-10 Intel Corporation Processors, methods, and systems for debugging a configurable spatial accelerator
US11200186B2 (en) 2018-06-30 2021-12-14 Intel Corporation Apparatuses, methods, and systems for operations in a configurable spatial accelerator
US11307873B2 (en) 2018-04-03 2022-04-19 Intel Corporation Apparatus, methods, and systems for unstructured data flow in a configurable spatial accelerator with predicate propagation and merging
US11907713B2 (en) 2019-12-28 2024-02-20 Intel Corporation Apparatuses, methods, and systems for fused operations using sign modification in a processing element of a configurable spatial accelerator

Cited By (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10157060B2 (en) 2011-12-29 2018-12-18 Intel Corporation Method, device and system for control signaling in a data path module of a data stream processing engine
US10942737B2 (en) 2011-12-29 2021-03-09 Intel Corporation Method, device and system for control signalling in a data path module of a data stream processing engine
WO2013100783A1 (en) * 2011-12-29 2013-07-04 Intel Corporation Method and system for control signalling in a data path module
US10331583B2 (en) 2013-09-26 2019-06-25 Intel Corporation Executing distributed memory operations using processing elements connected by distributed channels
US10853276B2 (en) 2013-09-26 2020-12-01 Intel Corporation Executing distributed memory operations using processing elements connected by distributed channels
US10402168B2 (en) 2016-10-01 2019-09-03 Intel Corporation Low energy consumption mantissa multiplication for floating point multiply-add operations
US10474375B2 (en) 2016-12-30 2019-11-12 Intel Corporation Runtime address disambiguation in acceleration hardware
US10572376B2 (en) 2016-12-30 2020-02-25 Intel Corporation Memory ordering in acceleration hardware
US10416999B2 (en) 2016-12-30 2019-09-17 Intel Corporation Processors, methods, and systems with a configurable spatial accelerator
US10558575B2 (en) 2016-12-30 2020-02-11 Intel Corporation Processors, methods, and systems with a configurable spatial accelerator
US10515049B1 (en) 2017-07-01 2019-12-24 Intel Corporation Memory circuits and methods for distributed memory hazard detection and error recovery
US10515046B2 (en) 2017-07-01 2019-12-24 Intel Corporation Processors, methods, and systems with a configurable spatial accelerator
US10445234B2 (en) 2017-07-01 2019-10-15 Intel Corporation Processors, methods, and systems for a configurable spatial accelerator with transactional and replay features
US10467183B2 (en) 2017-07-01 2019-11-05 Intel Corporation Processors and methods for pipelined runtime services in a spatial array
US10469397B2 (en) 2017-07-01 2019-11-05 Intel Corporation Processors and methods with configurable network-based dataflow operator circuits
US10445451B2 (en) 2017-07-01 2019-10-15 Intel Corporation Processors, methods, and systems for a configurable spatial accelerator with performance, correctness, and power reduction features
US10387319B2 (en) 2017-07-01 2019-08-20 Intel Corporation Processors, methods, and systems for a configurable spatial accelerator with memory system performance, power reduction, and atomics support features
US10496574B2 (en) 2017-09-28 2019-12-03 Intel Corporation Processors, methods, and systems for a memory fence in a configurable spatial accelerator
US11086816B2 (en) 2017-09-28 2021-08-10 Intel Corporation Processors, methods, and systems for debugging a configurable spatial accelerator
US10380063B2 (en) 2017-09-30 2019-08-13 Intel Corporation Processors, methods, and systems with a configurable spatial accelerator having a sequencer dataflow operator
US10445098B2 (en) 2017-09-30 2019-10-15 Intel Corporation Processors and methods for privileged configuration in a spatial array
US10445250B2 (en) 2017-12-30 2019-10-15 Intel Corporation Apparatus, methods, and systems with a configurable spatial accelerator
US10565134B2 (en) 2017-12-30 2020-02-18 Intel Corporation Apparatus, methods, and systems for multicast in a configurable spatial accelerator
US10417175B2 (en) 2017-12-30 2019-09-17 Intel Corporation Apparatus, methods, and systems for memory consistency in a configurable spatial accelerator
US11307873B2 (en) 2018-04-03 2022-04-19 Intel Corporation Apparatus, methods, and systems for unstructured data flow in a configurable spatial accelerator with predicate propagation and merging
US10564980B2 (en) 2018-04-03 2020-02-18 Intel Corporation Apparatus, methods, and systems for conditional queues in a configurable spatial accelerator
US10853073B2 (en) 2018-06-30 2020-12-01 Intel Corporation Apparatuses, methods, and systems for conditional operations in a configurable spatial accelerator
US10891240B2 (en) 2018-06-30 2021-01-12 Intel Corporation Apparatus, methods, and systems for low latency communication in a configurable spatial accelerator
US11200186B2 (en) 2018-06-30 2021-12-14 Intel Corporation Apparatuses, methods, and systems for operations in a configurable spatial accelerator
US10459866B1 (en) 2018-06-30 2019-10-29 Intel Corporation Apparatuses, methods, and systems for integrated control and data processing in a configurable spatial accelerator
US11593295B2 (en) 2018-06-30 2023-02-28 Intel Corporation Apparatuses, methods, and systems for operations in a configurable spatial accelerator
US10678724B1 (en) 2018-12-29 2020-06-09 Intel Corporation Apparatuses, methods, and systems for in-network storage in a configurable spatial accelerator
US10915471B2 (en) 2019-03-30 2021-02-09 Intel Corporation Apparatuses, methods, and systems for memory interface circuit allocation in a configurable spatial accelerator
US10817291B2 (en) 2019-03-30 2020-10-27 Intel Corporation Apparatuses, methods, and systems for swizzle operations in a configurable spatial accelerator
US10965536B2 (en) 2019-03-30 2021-03-30 Intel Corporation Methods and apparatus to insert buffers in a dataflow graph
US11029927B2 (en) 2019-03-30 2021-06-08 Intel Corporation Methods and apparatus to detect and annotate backedges in a dataflow graph
US11693633B2 (en) 2019-03-30 2023-07-04 Intel Corporation Methods and apparatus to detect and annotate backedges in a dataflow graph
US11037050B2 (en) 2019-06-29 2021-06-15 Intel Corporation Apparatuses, methods, and systems for memory interface circuit arbitration in a configurable spatial accelerator
US11907713B2 (en) 2019-12-28 2024-02-20 Intel Corporation Apparatuses, methods, and systems for fused operations using sign modification in a processing element of a configurable spatial accelerator

Similar Documents

Publication Publication Date Title
RU2374684C1 (en) Parallel-conveyor device for vectorisation of aerospace images of earth surface
US10984545B2 (en) Estimating depth for a video stream captured with a monocular rgb camera
US20220343174A1 (en) Optimized compute hardware for machine learning operations
EP3671439B1 (en) Compute optimizations for neural networks
US11556772B2 (en) Incremental precision networks using residual inference and fine-grain quantization
US11321805B2 (en) Dynamic precision management for integer deep learning primitives
US10210419B2 (en) Convolution operation apparatus
Pauwels et al. A comparison of FPGA and GPU for real-time phase-based optical flow, stereo, and local image features
RU2424561C2 (en) Training convolutional neural network on graphics processing units
US20210350215A1 (en) Training with adaptive runtime and precision profiling
DE102018119225A1 (en) System and method for optimized Winograd convolution accelerator
US20200234130A1 (en) Slimming of neural networks in machine learning environments
US20180314926A1 (en) Smart memory handling and data management for machine learning networks
EP3723043A1 (en) Segmentation using an unsupervised neural network training technique
CN109859178B (en) FPGA-based infrared remote sensing image real-time target detection method
US20210158155A1 (en) Average power estimation using graph neural networks
CN110751676A (en) Heterogeneous computing system and method based on target detection and readable storage medium
US11494879B2 (en) Convolutional blind-spot architectures and bayesian image restoration
DE102020108476A1 (en) Mechanism for performing nonlinear functions in a machine learning accelerator
Sui et al. GPU-accelerated MRF segmentation algorithm for SAR images
CN108388527A (en) Direct memory access (DMA) engine and its method
Iakovidis et al. FPGA architecture for fast parallel computation of co-occurrence matrices
Aguilar-González et al. An FPGA 2D-convolution unit based on the CAPH language
Haryanto et al. Conditional sliding windows: An approach for handling data limitation in colorectal histopathology image classification
Jensen et al. A two-level real-time vision machine combining coarse-and fine-grained parallelism

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20100505