RU2818987C2 - Способ динамического резервирования встроенной системы летательного аппарата - Google Patents

Способ динамического резервирования встроенной системы летательного аппарата Download PDF

Info

Publication number
RU2818987C2
RU2818987C2 RU2022109377A RU2022109377A RU2818987C2 RU 2818987 C2 RU2818987 C2 RU 2818987C2 RU 2022109377 A RU2022109377 A RU 2022109377A RU 2022109377 A RU2022109377 A RU 2022109377A RU 2818987 C2 RU2818987 C2 RU 2818987C2
Authority
RU
Russia
Prior art keywords
failure
isps
icps
channel
command
Prior art date
Application number
RU2022109377A
Other languages
English (en)
Other versions
RU2022109377A (ru
Inventor
Максим Станиславович Голобоков
Дмитрий Сергеевич Викторов
Original Assignee
Федеральное государственное казённое военное образовательное учреждение высшего образования "Военная академия воздушно-космической обороны имени Маршала Советского Союза Г.К. Жукова" Министерства обороны Российской Федерации
Filing date
Publication date
Application filed by Федеральное государственное казённое военное образовательное учреждение высшего образования "Военная академия воздушно-космической обороны имени Маршала Советского Союза Г.К. Жукова" Министерства обороны Российской Федерации filed Critical Федеральное государственное казённое военное образовательное учреждение высшего образования "Военная академия воздушно-космической обороны имени Маршала Советского Союза Г.К. Жукова" Министерства обороны Российской Федерации
Publication of RU2022109377A publication Critical patent/RU2022109377A/ru
Application granted granted Critical
Publication of RU2818987C2 publication Critical patent/RU2818987C2/ru

Links

Images

Abstract

Изобретение относится к области обработки цифровых данных с помощью электрических устройств, а именно реагирования на наличие ошибки, обнаружение ошибок, исправление ошибок, контроль. Техническим результатом является повышение надежности встроенной системы летательного аппарата, основу которой составляет цифровая интегральная схема с программируемой структурой (далее ЦИСПС) с поддержкой частичной реконфигурации. Технический результат достигается путем создания нового способа динамического резервирования встроенной системы летательного аппарата, основанного на ЦИСПС с поддержкой частичной реконфигурации, с числом блоков, большим, чем требуется для загрузки алгоритма функционирования встроенной системы (ВсС). При этом используется возможность реконфигурации и частичной реконфигурации ЦИСПС в реальном времени путем загрузки в «теневое» ЗУ подготовленных конфигурационных файлов с помощью внешнего устройства загрузки и контроля. Отказавшая область ЦИСПС после проведения диагностирования и локализации поврежденных ячеек перестает использоваться, и ВсС загружает новый конфигурационный файл, размещающий алгоритм обработки информации в заведомо исправную область ЦИСПС. 5 ил.

Description

Изобретение относится к области обработки цифровых данных с помощью электрических устройств, а именно реагирование на наличие ошибки; обнаружение ошибок; исправление ошибок; контроль. Заявленный способ направлен на достижение технического результата, выраженного в повышении надежности работы встроенного устройства за счет осуществления динамического резервирования встроенной системы летательного аппарата, основанного на интегральных схемах с программируемой структурой (ИСПС) с поддержкой частичной реконфигурации, при обнаружении отказа.
Изобретение может найти применение в бортовом вычислителе летательного аппарата, которому присущи ограничения на массогабаритные, энергетические характеристики и время восстановления работы, но может быть адаптировано для применения и во множестве потребительских электронных устройств, использующих интегральные схемы с программируемой структурой с поддержкой частичной реконфигурации, для повышения их надежности.
Имеет место устойчивая тенденция к возрастанию отказов встроенных систем (ВсС) на интегральных схемах с программируемой структурой (ИСПС). При классификации отказов по месту проявления следует выделить следующие отказы:
- отказ при конфигурировании системы - отказы катастрофичны;
- отказ функциональных блоков, доступных пользователю -катастрофичность отказа зависит от структуры проекта и времени появления отказа;
- отказы нерезервированной части интегральной схемы с программируемой структурой - неконтролируемые, не детектируемые, катастрофичные отказы.
Анализ подходов к решению проблемы обеспечения надежного функционирования ВсС на основе пространственного разнесения компонентов показал, что при современном уровне отказов λO=10-9…10-7 и сбоев
λC=10-8…10-6, отказы ВсС обусловленные комплексным влиянием технических средств (ТС) и программного обеспечения (ПО) неизбежны. Элементная база ВсС функционирует на предельных тактовых частотах. Это является причиной того, что интенсивность сбоев на порядок выше интенсивности отказов.
Из этого следует, что необходим способ резервирования ВсС, который обеспечит устойчивость к отказам внутрикристальных элементов и позволит осуществлять замещение отказавших областей кристалла ИСПС в реальном времени.
Одним из подходов к решению проблемы обеспечения надежного функционирования ВсС является пространственное разнесение компонентов. Этот же подход может быть реализован во ВсС на ИСПС с возможностью реконфигурации, так как современная элементная база обладает избыточной структурой. Конструктивные особенности ИСПС, позволяют резервировать элементы внутренней структуры, не вводя избыточность, на уровне кристалла.
Так же следует отметить, что отказы, вносимые дефектами проектирования и производства с использованием различных языков программирования и инструментальных средств, не могут быть нейтрализованы в рамках традиционных способов резервирования. Для компенсации данного недостатка целесообразно применять версионную избыточность. Использование версионной избыточности (многоверсионности) позволяет снизить риски возникновения отказов и сбоев, т.к. снижается вероятность их одновременного и однотипного появления в системе.
Дальними прототипами изобретения являются патенты:
- Пат. SU 1635260 А1, МПК G06F 11/00. Устройство для исправления ошибок в структурных кодах [Текст] / Ткаченко А. В.
- Пат. SU 1830575 А1, МПК G06F 11/00. Резервированное устройство [Текст] / Мамедли Э. М.
- Пат. SU 1837292 А1, МПК G06F 11/00. Устройство для восстановления информации о состоянии системы / Чернышев М.А.
Наиболее близким прототипом изобретения является:
- Пат. SU 1679505 А1, МПК G06F 11/26, G06F 11/07, G06F 11/18. Способ контроля правильности функционирования дискретных устройств [Текст] / Терещенко М.А. Способ заключается в организации пар параллельно работающих устройств из устройств, подлежащих контролю. В случае несовпадения выходных сигналов в паре проводят организацию новых пар параллельно работающих устройств. Отказавшее устройство отключают. Устройство, оставшееся без пары, один интервал времени работает самостоятельно.
Данный способ позволяет повысить надежность контролируемых устройств, но он не учитывает то, что в случае возникновения неразличимых сбоев и неразличимых отказов во внутренних каналах обработки информации, эти ошибки и сбои будут проигнорированы системой, и данные из устройства будут переданы как заведомо исправные. Также устройство будет обладать большим энергопотреблением и массогабаритными характеристиками, т.к. для его реализации требуется создать восемь однотипных устройств, работающих в параллели попарно.
Предлагаемый способ резервирования ВсС реализуется двумя способами, отличающимися уровнем резервирования:
а) при переносе в другую область всего внутреннего канала обработки информации (ВКО)-реализуется способ замещения (Фиг. 1);
б) при замене в ВКО отказавших функциональных блоков - реализуется способ скользящего резервирования (Фиг. 2).
Способ динамического резервирования встроенной системы (ВсС) летательного аппарата, содержащей ИСПС с поддержкой частичной реконфигурации, с числом функциональных блоков (ФБ), системы межсоединений (СМ) и блоков ввода/вывода (БВВ) большим, чем требуется для загрузки алгоритма функционирования встроенной системы (ВсС) и устройство защиты и контроля (УЗК). Обмен данными между устройствами происходит через согласующий интерфейс.Внутри устройств обмен данными происходит по шинам данных. В процессе функционирования встроенные средства контроля (СК) ИСПС и внешнее УЗК контролируют работоспособность вычислителя. В УЗК передается информация о наличии ресурса ИСПС (оставшемся количестве функциональных блоков в резервной области).
Этапы способа:
разделяют конфигурируемую область ИСПС на рабочую и резервную, находящуюся в ненагруженном резерве;
загружают с помощью УЗК в «теневое» ПЗУ заранее подготовленные конфигурационные файлы;
получают два идентичных по предназначению, но с различными признаками версионной избыточности, внутренних канала обработки информации (ВКО);
контролируют работоспособность вычислителя с помощью встроенных в ИСПС средств контроля (СК) и внешнего УЗК, и выявляют неисправность внутреннего канала обработки ИСПС путем сравнения в УЗК данных на выходе этих каналов;
в случае возникновения неисправности, производят проверку на наличие сбоя;
если сбой, произошедший в пределах одного цикла работы, не влияет на готовность системы, производят повторные вычисления в каналах обработки, выводят данные и уходят на новый цикл работы;
в случае если сбой повторяется, УЗК формирует команду на запуск общего тестирование всей системы и поиск отказа;
если отказ найден в программном обеспечении.вычислителя, УЗК подает команду на полную реконфигурацию ИСПС;
при неисправности внутренней области и определении неисправной части ВКО, часть ВКО, в которой был обнаружен отказ, заменяется из резервной области путем частичной реконфигурации только неисправного канала;
в случае отсутствия резерва, неисправный канал исключается и продолжается работа в одноканальном варианте;
если программное обеспечение и внутренние каналы обработки исправны, но сбой, влияющий на готовность системы, не устранен, подается команда на перезапуск системы с выставлением исходных параметров;
если данные каналов одинаковы, подают команду на выборочное тестирование одного из каналов для выявления неразличимого сбоя.
Конфигурационные файлы заранее готовятся средствами САПР и располагаются в «теневом» ПЗУ УЗК.
Команда на реконфигурацию ВсС формируется при обнаружении отказа встроенными средствами контроля (СК) или после проведения очередного цикла тестирования внутренней структуры внешним УЗК.
Для лучшего понимания заявленного изобретения далее приводится подробное описание основных компонентов изобретения и его схемы:
Фиг. 3 - Блок-схема способа согласно изобретению;
Фиг. 4 - Структурная схема основных компонентов системы, в которой выполняется способ, согласно изобретению.
Изобретение содержит:
а) Вычислитель, основу которого составляет ИСПС с функцией частичной реконфигурации, выполняющий обработку информации согласно задания;
б) Блок УЗК, контролирующий работу вычислителя и, в случае возникновения сбоев или ошибок в работе вычислителя, выдающий соответствующие инструкции.
Вычислитель содержит:
а) ВКО - внутренний канал обработки информации;
б) НРК - нерезервированная часть канала;
в) АК - автомат конфигурации ИСПС, отвечающий за полную и частичную реконфигурацию ИСПС;
г) СК - встроенное средство контроля ИСПС;
д) ВУВ - внутреннее устройство вывода;
е) Резервная область - область не задействованных функциональных блоков системы межсоединений и блоков ввода/вывода.
Блок УЗК содержит:
а) Канальность - определяет количество каналов в вычислителе, формирует инструкции на дальнейшую работу в двухканальном либо одноканальном варианте работы;
б) Тест К - формирует инструкции в случае возникновения сбоев (в случае различия данных в каналах обработки) при работе устройства и формирует инструкцию для запуска тестирования на неразличимость сбоев (отказов);
в) Тест Общ - управляет проведением полного тестирования всей системы.
г) Тест ПО - определяет сбой (отказ), произошедший в программном обеспечении (ПО) блока вычислителя;
д) Тест ТС1 - определяет сбой (отказ) технического средства (ТС), произошедший в первом канале обработки информации в блоке вычислителя;
е) Тест ТС2 - определяет сбой (отказ) ТС, произошедший во втором канале обработки информации в блоке вычислителя;
ж) Тест Неразличимость - определяет наличие неразличимого сбоя (отказа), произошедшего в каналах обработки информации в блоке вычислителя;
з) Восстановление - в случае возникновения отказов ПО или ТС формирует инструкции для АК на частичную реконфигурацию с переносом каналов в резервную область кристалла, исключение неисправных каналов, полную реконфигурацию вычислителя, перезапуск работы;
и) Перезапуск - формирует инструкции, подготавливает вычислитель для перезагрузки;
к) Вывод - определяет, повлияли ли сбои на готовность вычислителя, выводит данные вычислений из исправного канала;
л) Завершение - определяет условия аварийного завершения работы, подготавливает изобретение к завершению работы;
м) ЗУ - запоминающее устройство.

Claims (13)

  1. Способ динамического резервирования встроенной системы (ВсС) летательного аппарата, содержащей: вычислитель, основанный на интегральной схеме с программируемой структурой (ИСПС), и устройство защиты и контроля (УЗК), включающий этапы:
  2. разделяют конфигурируемую область ИСПС на рабочую и резервную, находящуюся в ненагруженном резерве;
  3. загружают с помощью УЗК в «теневое» ПЗУ заранее подготовленные конфигурационные файлы;
  4. получают два идентичных по предназначению, но с различными признаками версионной избыточности, внутренних канала обработки информации (ВКО);
  5. контролируют работоспособность вычислителя с помощью встроенных в ИСПС средств контроля (СК) и внешнего УЗК, и выявляют неисправность внутреннего канала обработки ИСПС путем сравнения в УЗК данных на выходе этих каналов;
  6. в случае возникновения неисправности производят проверку на наличие сбоя;
  7. если сбой, произошедший в пределах одного цикла работы, не влияет на готовность системы, производят повторные вычисления в каналах обработки, выводят данные и уходят на новый цикл работы;
  8. в случае если сбой повторяется, УЗК формирует команду на запуск общего тестирования всей системы и поиск отказа;
  9. если отказ найден в программном обеспечении вычислителя, УЗК подает команду на полную реконфигурацию ИСПС;
  10. при неисправности внутренней области и определении неисправной части ВКО часть ВКО, в которой был обнаружен отказ, заменяется из резервной области путем частичной реконфигурации только неисправного канала;
  11. в случае отсутствия резерва неисправный канал исключается и продолжается работа в одноканальном варианте;
  12. если программное обеспечение и внутренние каналы обработки исправны, но сбой, влияющий на готовность системы, не устранен, подается команда на перезапуск системы с выставлением исходных параметров;
  13. если данные каналов одинаковы, подают команду на выборочное тестирование одного из каналов для выявления неразличимого сбоя.
RU2022109377A 2022-04-07 Способ динамического резервирования встроенной системы летательного аппарата RU2818987C2 (ru)

Publications (2)

Publication Number Publication Date
RU2022109377A RU2022109377A (ru) 2023-10-09
RU2818987C2 true RU2818987C2 (ru) 2024-05-08

Family

ID=

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1996036140A1 (en) * 1995-05-12 1996-11-14 Crosspoint Solutions, Inc. Fpga redundancy
US20020157071A1 (en) * 2001-04-13 2002-10-24 Schiefele Walter P. Method for creating circuit redundancy in programmable logic devices
US20100169886A1 (en) * 2008-12-31 2010-07-01 Seakr Engineering, Incorporated Distributed memory synchronized processing architecture
RU2439674C1 (ru) * 2010-07-02 2012-01-10 Федеральное государственное унитарное предприятие "Московское опытно-конструкторское бюро "Марс" (ФГУП МОКБ "Марс") Способ формирования отказоустойчивой вычислительной системы и отказоустойчивая вычислительная система
KR101379818B1 (ko) * 2012-07-12 2014-04-01 한국원자력연구원 자기진단 기능을 포함하는 fpga에 기반한 이중화 제어장치 및 이중화 절체 방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1996036140A1 (en) * 1995-05-12 1996-11-14 Crosspoint Solutions, Inc. Fpga redundancy
US20020157071A1 (en) * 2001-04-13 2002-10-24 Schiefele Walter P. Method for creating circuit redundancy in programmable logic devices
US20100169886A1 (en) * 2008-12-31 2010-07-01 Seakr Engineering, Incorporated Distributed memory synchronized processing architecture
RU2439674C1 (ru) * 2010-07-02 2012-01-10 Федеральное государственное унитарное предприятие "Московское опытно-конструкторское бюро "Марс" (ФГУП МОКБ "Марс") Способ формирования отказоустойчивой вычислительной системы и отказоустойчивая вычислительная система
KR101379818B1 (ko) * 2012-07-12 2014-04-01 한국원자력연구원 자기진단 기능을 포함하는 fpga에 기반한 이중화 제어장치 및 이중화 절체 방법

Similar Documents

Publication Publication Date Title
US8442702B2 (en) Fault diagnosis device and method for optimizing maintenance measures in technical systems
US8935569B2 (en) Control computer system, method for controlling a control computer system, and use of a control computer system
CN111352338B (zh) 一种双余度飞控计算机及余度管理方法
CN109976141B (zh) Uav传感器信号余度表决系统
US8930752B2 (en) Scheduler for multiprocessor system switch with selective pairing
EP1703401A2 (en) Information processing apparatus and control method therefor
CN108710673B (zh) 实现数据库高可用方法、系统、计算机设备和存储介质
US5144230A (en) Method and system for testing integrated circuits by cycle stealing
KR101723932B1 (ko) 이중화 채널을 포함하는 비행조종컴퓨터의 고장 진단 방법
CN110955571B (zh) 面向车规级芯片功能安全的故障管理系统
US9285424B2 (en) Method and system for logic built-in self-test
Dubrova et al. Hardware redundancy
Trivedi et al. Modeling high availability
US7017074B2 (en) System architecture providing redundant components to improve die yields and system reliability
Györök et al. Duplicated control unit based embedded fault-masking systems
CN105209982A (zh) 用于控制自动化系统中的物理单元的方法和设备
RU2818987C2 (ru) Способ динамического резервирования встроенной системы летательного аппарата
Paulsson et al. Methods for run-time failure recognition and recovery in dynamic and partial reconfigurable systems based on Xilinx Virtex-II Pro FPGAs
CN108833209A (zh) 一种云计算系统可用性确定方法及装置
US20040199824A1 (en) Device for safety-critical applications and secure electronic architecture
CN107992018B (zh) 控制系统
Nedeljković et al. A Survey of Hardware Fault Tolerance Techniques
CN209343321U (zh) 一种计算机故障检测装置
CN110633176B (zh) 工作系统切换方法、立方星和切换装置
EP3296874B1 (en) Apparatus and associated method