KR20040004536A - 고장 발생 시 완전한 성능을 유지하는 파일 서버의 트윈테일드 고장 복구 - Google Patents

고장 발생 시 완전한 성능을 유지하는 파일 서버의 트윈테일드 고장 복구 Download PDF

Info

Publication number
KR20040004536A
KR20040004536A KR10-2003-7011089A KR20037011089A KR20040004536A KR 20040004536 A KR20040004536 A KR 20040004536A KR 20037011089 A KR20037011089 A KR 20037011089A KR 20040004536 A KR20040004536 A KR 20040004536A
Authority
KR
South Korea
Prior art keywords
file server
file
storage devices
storage device
server
Prior art date
Application number
KR10-2003-7011089A
Other languages
English (en)
Other versions
KR100553145B1 (ko
Inventor
코튜스폴더블유
가라앨런쥐
지암파파마크이
하이델버거필립
스타인마처-버로우버크하드디
Original Assignee
인터내셔널 비지네스 머신즈 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 인터내셔널 비지네스 머신즈 코포레이션 filed Critical 인터내셔널 비지네스 머신즈 코포레이션
Publication of KR20040004536A publication Critical patent/KR20040004536A/ko
Application granted granted Critical
Publication of KR100553145B1 publication Critical patent/KR100553145B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05KPRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
    • H05K7/00Constructional details common to different types of electric apparatus
    • H05K7/20Modifications to facilitate cooling, ventilating, or heating
    • H05K7/20709Modifications to facilitate cooling, ventilating, or heating for server racks or cabinets; for data centers, e.g. 19-inch computer racks
    • H05K7/20836Thermal management, e.g. server temperature control
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F04POSITIVE - DISPLACEMENT MACHINES FOR LIQUIDS; PUMPS FOR LIQUIDS OR ELASTIC FLUIDS
    • F04DNON-POSITIVE-DISPLACEMENT PUMPS
    • F04D25/00Pumping installations or systems
    • F04D25/16Combinations of two or more pumps ; Producing two or more separate gas flows
    • F04D25/166Combinations of two or more pumps ; Producing two or more separate gas flows using fans
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F04POSITIVE - DISPLACEMENT MACHINES FOR LIQUIDS; PUMPS FOR LIQUIDS OR ELASTIC FLUIDS
    • F04DNON-POSITIVE-DISPLACEMENT PUMPS
    • F04D27/00Control, e.g. regulation, of pumps, pumping installations or pumping systems specially adapted for elastic fluids
    • F04D27/004Control, e.g. regulation, of pumps, pumping installations or pumping systems specially adapted for elastic fluids by varying driving speed
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • G06F15/163Interprocessor communication
    • G06F15/173Interprocessor communication using an interconnection network, e.g. matrix, shuffle, pyramid, star, snowflake
    • G06F15/17356Indirect interconnection networks
    • G06F15/17368Indirect interconnection networks non hierarchical topologies
    • G06F15/17381Two dimensional, e.g. mesh, torus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/141Discrete Fourier transforms
    • G06F17/142Fast Fourier transforms, e.g. using a Cooley-Tukey type algorithm
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/52Program synchronisation; Mutual exclusion, e.g. by means of semaphores
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/52Program synchronisation; Mutual exclusion, e.g. by means of semaphores
    • G06F9/526Mutual exclusion algorithms
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G5/00Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
    • G09G5/003Details of a display terminal, the details relating to the control arrangement of the display terminal and to the interfaces thereto
    • G09G5/006Details of the interface to the display terminal
    • G09G5/008Clock recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L7/00Arrangements for synchronising receiver with transmitter
    • H04L7/02Speed or phase control by the received code signals, the signals containing no special synchronisation information
    • H04L7/033Speed or phase control by the received code signals, the signals containing no special synchronisation information using the transitions of the received signal to control the phase of the synchronising-signal-generating means, e.g. using a phase-locked loop
    • H04L7/0337Selecting between two or more discretely delayed clocks or selecting between two or more discretely delayed received code signals
    • H04L7/0338Selecting between two or more discretely delayed clocks or selecting between two or more discretely delayed received code signals the correction of the phase error being performed by a feed forward loop
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F24HEATING; RANGES; VENTILATING
    • F24FAIR-CONDITIONING; AIR-HUMIDIFICATION; VENTILATION; USE OF AIR CURRENTS FOR SCREENING
    • F24F11/00Control or safety arrangements
    • F24F11/70Control systems characterised by their outputs; Constructional details thereof
    • F24F11/72Control systems characterised by their outputs; Constructional details thereof for controlling the supply of treated air, e.g. its pressure
    • F24F11/74Control systems characterised by their outputs; Constructional details thereof for controlling the supply of treated air, e.g. its pressure for controlling air flow rate or air velocity
    • F24F11/77Control systems characterised by their outputs; Constructional details thereof for controlling the supply of treated air, e.g. its pressure for controlling air flow rate or air velocity by controlling the speed of ventilators
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02BCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO BUILDINGS, e.g. HOUSING, HOUSE APPLIANCES OR RELATED END-USER APPLICATIONS
    • Y02B30/00Energy efficient heating, ventilation or air conditioning [HVAC]
    • Y02B30/70Efficient control or regulation technologies, e.g. for control of refrigerant flow, motor or heating

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mechanical Engineering (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Discrete Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Algebra (AREA)
  • Thermal Sciences (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Hardware Redundancy (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 장애 발생 시 파일 시스템(100)의 성능을 모니터링하는 방법에 관한 것이다. 파일 시스템은 N개의 스토리지 디바이스(108)(여기서, N은 0 보다 큰 정수)와, N개의 주파일 서버(104)(각각의 주파일 서버가 그안에서 파일에 엑세스하기 위해 대응 스토리지 디바이스에 동작 가능하게 접속된다)를 포함한다. 파일 시스템은 N개의 스토리지 디바이스 중 적어도 하나에 동작 가능하게 접속되는 보조 파일 서버(104a)를 더 포함하다. 상기 방법은 N개의 주파일 서버 중 하나의 고장 시 N개의 스토리지 디바이스 중 하나의 접속을 보조 파일 서버로 전환하는 단계와, 하나 이상의 나머지 스토리지 디바이스의 접속을 고장 파일 서버 이외의 주파일 서버로 전환하여 성능의 손상을 방지하고 각 스토리지 디바이스에 오퍼레이팅 파일 서버를 제공하는 단계를 포함한다.

Description

고장 발생 시 완전한 성능을 유지하는 파일 서버의 트윈 테일드 고장 복구{TWIN-TAILED FAIL-OVER FOR FILESERVERS MAINTAINING FULL PERFORMANCE IN THE PRESENCE OF A FAILURE}
병렬 컴퓨터 설계 있어서 파일 서버의 장애(고장) 시 그 장애를 복구하는 종래 기술의 시스템 및 방법들이 공지되어 있다. 그러나 이러한 시스템 및 방법들은 시스템 성능의 저하를 희생하여 장애 복구를 제공한다. 그 결과 종래 기술의 장애 복구 시스템 및 방법은 전체 성능 또는 입출력(I/O) 연결성에 비추어서 컴퓨터가 실행하는 응용 프로그램에는 투명하지 않다.
(관련 출원 상호 참조)
본 발명은 2001년 2월 24일자로 출원된 "MASSIVELY PARALLEL SUPERCOMPUTER"라는 제목의 공유되고 동시에 계류 중인 미국 가특허 출원 일련 번호 60/271,124의 우선권을 주장하고 있으며, 이 가특허 출원의 전체 내용 및 개시 사항은 본 명세서에 완전히 개시되어 있는 것처럼 본 명세서에 참조로서 명백히 통합되어 있다. 이 가특허 출원은 추가적으로 동일자로 출원된 다음의 공유되고 동시에 계류 중인 미국 특허 출원들에 관련되어 있으며, 이러한 특허 출원들 각각의 전체 내용 및 개시 사항은 본 명세서에 완전히 개시되어 있는 것처럼 본 명세서에 참조로서 명백히 통합되어 있다: "Class Networking Routing"이라는 제목의 미국 특허 출원 일련 번호( YOR920020027US1, YOR920020044US1(15270)); "A Global Tree Network For Computing Structures"라는 제목의 미국 특허 출원 일련 번호( YOR920020028US1(15271)); "Global Interrupt and Barrier Network"라는 제목의 미국 특허 출원 일련 번호(YOR920020029US1(15272)); "Optimized Scalable Network Switch"라는 제목의 미국 특허 출원 일련 번호(YOR920020030US1(15273));"Arithmetic Functions in Torus and Tree Networks"라는 제목의 미국 특허 출원 일련 번호(YOR920020031US1, YOR920020032US1(15258)); "Data Capture Technique for High Speed Signaling"이라는 제목의 미국 특허 출원 일련 번호(YOR920020033US1,YOR920020034US1(15259)); "Managing Coherence via Put/Get Windows"라는 제목의 미국 특허 출원 일련 번호(YOR920020035US1(15260)); "Low Latency Memory Access And Synchronization"이라는 제목의 미국 특허 출원 일련 번호(YOR920020036US1,YOR920020037US1(15261)); "Twin-Tailed Fail-Over for Fileservers Maintaining Full Performance in the Presence of Failure"라는 제목의 미국 특허 출원 일련 번호(YOR920020038US1(15276)); "Fault Isolation Through No-Overhead Link Level Checksums"라는 제목의 미국 특허 출원 일련 번호(YOR920020039US1(15277)); "Ethernet Addressing Via Physical Location for Massively Parallel Systems"라는 제목의 미국 특허 출원 일련 번호(YOR920020040US1(15278)); "Fault Tolerance in a Supercomputer Through Dynamic Repartitioning"이라는 제목의 미국 특허 출원 일련 번호(YOR920020041US1(15274)); "Checkpointing Filesystem"이라는 제목의 미국 특허 출원 일련 번호(YOR920020042US1(15279)); "Efficient Implementation of Multidimensional Fast Fourier Transform on a Distributed-Memory Parallel Multi-Node Computer"라는 제목의 미국 특허 출원 일련 번호(YOR920020043US1(15262)); "A Novel Massively Parallel Supercomputer"라는 제목의 미국 특허 출원 일련 번호(YOR9-20010211US2(15275)); "Smart Fan Modulesand System"이라는 제목의 미국 특허 출원 일련 번호(YOR920020045US1(15263)).
본 발명은 일반적으로 파일 서버의 장애 복구 시스템(a fail-over system) 및 방법에 관한 것으로서, 특히 예컨대 생명 과학 분야에서의 계산에 응용되는 것으로서 분산형 메모리 메시지 패싱 병렬 컴퓨터 설계 및 시스템 소프트웨어에 관한 것이다.
이후, 본 발명의 보다 상세한 설명을 위해 첨부된 도면을 참조하여 본원 발명의 장치 및 방법의 특징, 형태 및 이점에 대해서 설명하기로 한다.
도 1은 본 발명의 양호한 실시예에 따른 컴퓨팅 시스템의 파일 시스템 및 I/O 노드의 정상적인 오퍼레이팅 모드를 도시한다.
도 2는 파일 시스템의 파일 서버의 장애가 있는 경우의 도 1의 컴퓨팅 시스템을 도시한다.
도 3은 5개의 파일 서버 및 4개의 스토리지 디바이스를 가진 도 1의 파일 시스템의 개략도이다.
도 4는 모든 주파일 서버가 적절히 동작하는 경우의 도 3의 파일 시스템을 도시한다.
도 5는 엔드 파일 서버의 장애가 있는 경우의 도 3의 파일 시스템을 도시한다.
도 6은 미들 파일 서버가 고장난 경우의 도 3의 파일 시스템을 도시한다.
그러므로, 본 발명의 목적은 종래 기술과 관련된 단점을 극복한 파일 시스템의 장애 복구 시스템 및 방법을 제공하는 것이다.
따라서, 컴퓨터의 파일 시스템이 제공된다. 파일 시스템은 N개의 스토리지 디바이스(storage devices)(기억 장치)(여기서, N은 0 보다 큰 정수임)와, N개의 주파일 서버(primary file servers)(각 파일 서버는 파일에 엑세스하기 위한 대응 스토리지 디바이스에 동작 가능하게 연결된다)와, N개의 스토리지 디바이스 중 적어도 하나에 동작 가능하게 연결된 보조 파일 서버(secondary file server)를 구비하고 있으며, N개의 주 파일 서버 중 하나의 파일 서버 고장 시, N개의 스토리지디바이스 중 하나는 그의 접속을 보조 파일 서버로 전환하고 하나 이상의 나머지 스토리지 디바이스는 그들의 접속을 필요에 따라 고장 파일 서버 이외의 주파일 서버로 전환함으로써 성능의 손실을 방지하고 각 스토리지 디바이스에 오퍼레이팅 파일 서버를 제공한다.
파일 시스템의 양호한 구현예에 있어서, 각각의 N개의 스토리지 디바이스는 복수의 디스크 드라이브를 구비한다. 복수의 디스크 드라이브는 레이드(RAID)를 양호하게 포함한다. 파일 시스템의 또 다른 양호한 구현예에 있어서, 각각의 N개의 주파일 서버 및 보조 파일 서버는 PC이다.
N개의 스토리지 디바이스 중 적어도 하나는 제1 및 제2 접속부를 가지며, 제1 접속부는 하나의 주파일 서버에 스토리지 디바이스를 동작 가능하게 연결하며, 제2 접속부는 스토리지 디바이스를 보조 파일 서버에 동작 가능하게 접속한다. 제1 및 제2 접속부는 양호한 SCSI 버스 접속부이다. 주파일 서버 및 보조 파일 서버 중 적어도 하나는 2 개의 채널 SCSI 제어기를 구비하고 있으며, 두 채널 중 하나는 N개의 스토리지 디바이스 중 하나에 동작 가능하게 접속되며 두 채널 중 다른 하나는 N개의 스토리지 디바이스 중 또 다른 하나에 동작 가능하게 접속된다.
또한 컴퓨터 시스템이 제공된다. 컴퓨터 시스템은 파일 시스템에 동작 가능하게 접속된 I/O 노드와, N 개의 주파일 서버와, 보조 파일 서버를 포함하며, 파일 시스템은 N개의 스토리지 디바이스를 구비하며, 여기서 N은 0보다 큰 정수이고, 각각의 주파일 서버는 그안에서 파일에 엑세스하기 위해 대응 스토리지 디바이스에 동작 가능하게 접속되며, 보조 파일은 N개의 스토리지 디바이스 중 적어도 하나에동작 가능하게 접속되고, N개의 주파일 서버 중 하나의 주파일 서버의 고장 시 N개의 스토리지 디바이스 중 하나는 그의 접속을 보조 파일 서버로 전환하고 하나 이상의 나머지 스토리지 디바이스는 그들의 접속을 필요에 따라 장애 파일 서버 이외의 주파일 서버로 전환함으로써 각 스토리지 디바이스에 오퍼레이팅 파일 서버를 제공하고 성능의 손상을 방지한다.
컴퓨터 시스템의 양호한 구현예에 있어서, N 개의 스토리지 디바이스 각각은 복수의 디스크 드라이브를 포함한다. 복수의 디스크 드라이브는 양호하게 레이드(RAID)를 포함한다. 또 다른 양호한 컴퓨터 시스템의 구현예에 있어서, N개의 주파일 서버 및 보조 파일 서버 각각은 PC이다.
N개의 스토리지 디바이스 중 적어도 하나는 제1 및 제2 접속부를 양호하게 가지며, 제1 접속부는 스토리지 디바이스를 주파일 서버들 중 하나에 동작 가능하게 접속하며 제2 접속부는 스토리지 디바이스를 보조 파일 서버에 동작 가능하게 접속한다. 제1 및 제2 접속부는 양호한 SCSI 버스 접속부이다. 주파일 서버 및 보조 파일 서버 중 적어도 하나는 2 채널 SCSI 제어기를 구비하는데, 두 채널 중 하나는 N개의 스토리지 디바이스 중 하나에 동작 가능하게 접속되며, 두 채널 중 다른 하나는 N개의 스토리지 디바이스 중 또 다른 하나에 동작 가능하게 접속된다.
또한, 장애 발생 시 파일 시스템의 완전한 성능을 유지하기 위한 방법이 제공된다. 파일 시스템은 N개의 스토리지 디바이스(여기서, N은 0 보다 큰 정수)와, N개의 주 파일 서버(각각의 주파일 서버가 그안에서 파일에 엑세스하기 위해 대응 스토리지 디바이스에 동작 가능하게 접속된다)를 포함한다. 파일 시스템은 N개의스토리지 디바이스 중 적어도 하나에 동작 가능하게 접속되는 보조 파일 서버를 더 포함하다. 상기 방법은 N개의 주파일 서버 중 하나의 고장 시 N개의 스토리지 디바이스 중 하나의 접속을 보조 파일 서버로 전환하는 단계와, 하나 이상의 나머지 스토리지 디바이스의 접속을 고장 파일 서버 이외의 주파일 서버로 전환하여 성능의 손상을 방지하고 각 스토리지 디바이스에 오퍼레이팅 파일 서버를 제공하는 단계를 포함한다. 따라서, 상기 방법은 성능의 손상이 없고 파일 서버상에 결과의 부하가 동등한 방식으로 접속을 전환한다.
또한, 고장 발생 시 파일 시스템의 완전한 성능를 유지하기 위한 컴퓨터 판독 가능한 매체로 구현되는 컴퓨터 프로그램 제품이 제공된다. 파일 시스템은 N개의 스토리지 디바이스(여기서, N은 0 보다 큰 정수)와 N개의 주파일 서버를 구비하며, 각 주파일 서버는 그안에서 파일에 엑세스하기 위해 대응 스토리지 디바이스에 동작 가능하게 접속된다. 파일 시스템은 N개의 스토리지 디바이스 중 적어도 하나에 동작 가능하게 접속된 보조 파일 서버를 더 구비하고 있다. 컴퓨터 프로그램 제품은 N개의 주파일 서버 중 하나의 파일 서버의 고장 시 N개의 스토리지 디바이스 중 하나의 접속을 보조 파일 서버로 전환하는 컴퓨터 판독 가능한 프로그램 코드 수단과 성능의 손상을 방지하고 각 스토리지 디바이스에 오퍼레이팅 파일 서버를 제공하기 위해 필요에 따라 고장 파일 서버 이외의 주파일 서버로 하나 이상의 나머지 스토리지 디바이스의 접속을 전환하기 위한 컴퓨터 판독 가능한 프로그램 코드 수단을 포함한다. 따라서 전술한 바와 같이, 상기 접속들은 성능의 손실을 발생시키지 않고 파일 서버에 가해지는 부하가 동등해지는 방식으로 전환한다.
비록 본 발명은 각종 타입의 고장 복구 시스템에 적용 가능할지라도, 초병렬 컴퓨터의 고장 복구 시스템의 환경에서 특히 유용하다. 그러므로, 초병렬 컴퓨터의 장애 복구 시스템에 대한 본 발명의 응용에 제한 없이 본 발명은 이러한 환경에서 기술될 것이다. 이러한 초병렬 컴퓨터 시스템은 동시 계류중인 미국 특허 출원 --------- (대리인 문서 번호 제15258호);ㅡㅡㅡㅡㅡㅡ(대리인 문서 번호 제15259호);ㅡㅡㅡㅡㅡㅡ(대리인 문서 번호 제15260호);ㅡㅡㅡㅡㅡㅡ(대리인 문서 번호 제15261호);ㅡㅡㅡㅡㅡㅡ(대리인 문서 번호 제15262호);ㅡㅡㅡㅡㅡㅡ(대리인 문서 번호 제15263호);ㅡㅡㅡㅡㅡㅡ(대리인 문서 번호 제15270호);ㅡㅡㅡㅡㅡㅡ(대리인 문서 번호 제15271호);ㅡㅡㅡㅡㅡㅡ(대리인 문서 번호 제15272호);ㅡㅡㅡㅡㅡㅡ(대리인 문서 번호 제15273호);ㅡㅡㅡㅡㅡㅡ(대리인 문서 번호 제15274호);ㅡㅡㅡㅡㅡㅡ(대리인 문서 번호 제15275호);ㅡㅡㅡㅡㅡㅡ(대리인 문서 번호 제15278호);ㅡㅡㅡㅡㅡㅡ(대리인 문서 번호 제15279호); 여기서 전체 개시 내용은 참조 문헌으로 결합되고 있다.
이제부터 도 1을 참조하여 설명하기로 한다. 도 1에는 참조 부호(100)로 표시된 컴퓨터 시스템이 도시되고 있다. 컴퓨터 시스템(100)은 전술한 종래 기술과 관련된 문제점들을 해결하기 위해 하드웨어 및 소프트웨어 아키텍쳐와 알고리즘의 조합을 이용한다. 컴퓨터 시스템(100)은 다수의 "N/N+1 고장 복구 클러스터"로 정렬된 파일 시스템을 포함하며, 각 파일 복구 클러스터는 I/O 노드(106)에 대해서 파일 서버(104)라 지칭되는 하나의 프로세서에 적어도 하나의 온라인 스페어 파일 서버(104a)가 더해진 구조이다. 양호한 구현예에 있어서, 컴퓨터(100)는 초병렬 시스템이며 파일 시스템은 랙마운트 상품의 PC를 채용하고 있다.
스페어 파일 서버(104a)를 포함하는 각 파일 서버(104)는 2개 이상의 스토리지 디바이스(108)에 직접 엑세스한다. 비록 도 1은 2개의 스토리지 디바이스(108)에 직접 엑세스하는 각 파일 서버(104)를 도시하고 있지만, 이러한 구성은 양호한 구현예로서 도시된 것이며, 본 발명의 범위 또는 사상을 제한하려는 의도는 아니다. 그러나, 이후 설명되는 바와 같이, 각 파일 서버(104)는 2개 이상의 스토리지 디바이스(108)에 직접 엑세스할 수 있다. 각 파일 서버(104)는 2개의 채널 SCSI 제어기를 포함하는 것이 좋다. 이러한 양호한 구성에 있어서, SCSI 채널 중 하나는 스토리지 디바이스(108)에 대한 "주" 인터페이스로 지정되며 다른 채널은 그 스토리지 디바이스(108)에 대한 주파일 서버(104)가 고장이면 파일 시스템 인터페이스를 취할 준비가 되어 있는 보조 스토리지 디바이스(108)에 대한 "장애 복구" 모드 또는 핫스탠바이 상태로 놓여질 수가 있다.
각 파일 서버(104)는 "원격 관리" 인터페이스를 양호하게 포함하고 있다. 이러한 인터페이스의 일례는 인텔 서버 상의 "베이스 관리 제어기(BMC)"이며, 이는 이더넷 또는 각 파일 서버(104)에 대한 시리얼 접속을 통해 파일 서버(104)를 구성하고, 부팅하며, 가동하고, 모니터링하기 위한 기능을 제공한다. 더욱이, 각 파일 서버(104)는 기가비트의 이더넷 접속부와 같은 데이터 접속부를 양호하게 갖는다. 이러한 접속부는 멀티포트 기가비트 이더넷 스위치를 컴퓨터의 100개의 I/O 노드(106)를 제공한다.
스토리지 디바이스들(108)은 핫스왑 SCSI 디스크 케이지(disk cage)를 양호하게 가지며, 각 장치는 표준 랙마운트 프레임으로 다중 디스크 드라이브를 수용하고 있다. 디스크 케이지는 다채널 하드웨어 RAID(레이드) 제어기, 리던던트 전원 공급 장치 및 2개의 외부 SCSI 버스 접속부를 양호하게 구비하고 있다. 하드웨어 RAID 제어기는 다중 디스크 드라이브를 RAID "스트립 세트"로 그룹화하고 RAID-0(보호 기능이 없는 단순 스트립핑) 내지 RAID-5(패리티 보호 기능이 있는 블록 회전스트립핑) 범위에 이르는 수개의 스트립 세트 구조를 지원한다. 상위 레벨의 RAID는 또한 다중 RAID 스트립 세트가 디스크 드라이브의 대형 어레이와 함께 스트립 "스패닝(spanning)"이라 불리는 하드웨어 구조에 의해서 지원 가능하다. 그 일례는 RAID-50이며, 여기서 2개 이상의 RAID-5 스트립 세트는 그자체가 디스크 드라이브의 대형 클러스터를 가로질러 스트립된다. 그러나, RAID-5가 바람직한 제어기인데, 왜냐하면 이는 작은 신뢰성의 증가에 대해서 RAID-50 시스템의 단가 및 복잡성의 부가를 야기함이 없이 필요한 신뢰성을 제공하기 때문이다.
각 파일 서버(104)는 내부 SCSI 버스가 상이한 호스트에 대한 각 단말에서 인터페이스함을 의미하는 "트윈-테일드(Twin-Tailed)" SCSI 상호접속부를 통해 엑세스되는 2개 이상의 스토리지 디바이스(108)에 접속된다. 이러한 파일 서버들 중 어느 하나가 고장난 경우, 특정 스토리지 디바이스(108)에 대한 직접 상호 접속부를 가진 파일 서버 노드(110)에 대한 컴퓨터 I/O 노드(106)의 일대일 관계는 I/O 노드(106) 및 나머지 파일 서버 노드(110)의 조정을 통해 유지된다. 이러한 조정은 주요 트윈 테일드 접속부(직선으로 표시)에서 보조 접속부(점선으로 표시)로 소요 갯수의 파일 서버 노드(110)를 동시에 스위칭함으로써 달성된다.
다음의 실시예의 설명으로부터 알 수 있는 바와 같이, 파일 서버(104)의 고장 여부에 따라서, 0 내지 나머지 파일 서버 노드의 갯수 마이너스 1의 노드(110)가 그들의 보조 접속부로 전환할 것이다. 즉, 장애 복구할 것이다. 평균적으로 파일 서버 노드(110) 중 절반이 전환을 필요로 할 것이다. 이런 식으로, 각 스토리지 디바이스(108)는 그에 대응하는 하나의 작업 파일 서버(104)를 계속해서 가진다.파일 서버 노드(110)의 장애 복구와 동시에, 컴퓨터 I/O 노드(106)는 또한 그의 특정 파일 시스템에 대한 I/O를 수행하기 위해 사용하는 파일 서버를 스위칭함으로서 논리적인 접속을 특정 스토리지 디바이스(108)로 전환할 것이다. 도 2에 도시한 바와 같이, 파일 서버(104b)의 장애 시, 스페어 파일 서버(104a)에 대한 보조 접속이 주접속이 되며 스토리지 디바이스(108a)는 장애 파일 서버(104b)로 주접속을 전환한다. 당업자라면 컴퓨터 I/O 노드에서 발생된 부하가 동일하다는 가정 하에 성능에 있어 손실이 없고 각각의 파일 서버(104)에 대한 부하가 동일함을 알 수 있을 것이다. 당업자라면 또한 전체 장애 복구 방법이 전체 성능 및 I/O 접속성에 비추어 응용 프로그램에 투명하게 실현할 것이다. 이것은 컴퓨터 I/O 노드(106)가 각 스토리지 디바이스(108)에 대한 직접 접속을 투명하게 유지하고 어떤 고장 시 조정된 형태로 그 접속성의 방향을 다시 바꾸기 때문이다.
도 3에 있어서, 본 발명의 파일 시스템(102)의 일례가 도시되며, 파일 시스템은 4(N)개의 스토리지 디바이스(108)와 5(N+1)개의 파일 서버(104)를 구비하고 있다. 각 파일 서버(104)는 PC이며, 각 스토리지 디바이스(108)는 독립 RAID-5 유닛인 것이 좋다. 스토리지 디바이스(108)의 수는 I/O 노드(106)의 수와 매칭한다. 각 스토리지 디바이스(108)는 전술한 바와 같이 2개의 외부 SCSI 버스 접속부를 가진다. 하나의 SCSI 접속부는 주파일 서버(104)와 연결되고, 다른 하나의 SCSI 접속부는 다른 보조 파일 서버(104)와 연결된다. 따라서 미들 파일 서버(104)는 하나의 스토리지 디바이스(108)의 주파일 서버(104)와 또 다른 스토리지 디바이스(108)의 보조 파일 서버로서 기능한다. 오직 하나의 주파일 서버(104) 만이 능동적으로스토리지 디바이스로서 기능하나, 주파일 서버가 고장이면, 보조 파일 서버(104a)가 이를 떠 맡는다. 따라서 파일 서버(104)는 스토리지 디바이스(108)의 다른 디스크 프로토콜 또는 SCSI와 I/O 노드(106)의 네트워킹 프로토콜 또는 이더넷 사이에서 신뢰할 수 있게 변환한다. 4(N)개의 파일 서버(104)가 이용되었다면, 하나의 파일 서버(104)의 장애 시 그의 보조 파일 서버(104)는 또 다른 스토리지 디바이스(108)의 주파일 서버(104)로서 계속해서 기능할 것이다. 따라서 영향을 받은 스토리지 디바이스(108)의 성능은 2의 인수씩 저하된다. 이러한 성능의 저하를 회피하기 위해 전술한 바와 같이, "N/N+1 고장 복구 클러스터" 방법을 사용한다. 여기서 N은 스토리지 디바이스(108)의 수이며, N+1은 파일 서버(104)의 수이다.
N=4라 가정하면, 4/5 고장 복구 클러스터의 파일 서버 및 스토리지 디바이스(108)는 도 3에 도시한 바와 같이 정렬되며, 여기서 직선은 주접속부를 가리키며 점선은 각 스토리지 디바이스(108)의 보조 접속부를 가리킨다. 모든 주파일 서버(104)가 적절히 동작하고 있는 경우, 능동 파일 서버는 도 4에 도시한 바와 같다. 가장 좌측의 파일 서버(104b)가 고장이면, 도 5에 도시한 바와 같이 보조 파일 서버(104)가 이용된다. 미들 파일 서버(104b)가 고장이면, 접속은 도 6에 도시한 바와 같다.
상기 실시예들에 의해서 입증되는 바와 같이, 각 스토리지 디바이스(108)에 대해 파일 서버(104)에 대한 오직 하나의 SCSI 접속만이 활성화된다. 파일 서버(104b)가 고장이면, 그의 대응 스토리지 디바이스(108)는 또 다른 파일로 전환한다. 그 파일 서버(104)가 또 다른 스토리지 디바이스(108)를 서비스하고 있으면,그 서비스는 인접 파일 서버(104)로 이동된다. 필요하다면, 그의 인접 파일 서버도 마찬가지이며, 그 결과 각 파일 서버(104)는 오직 하나의 스토리지 디바이스(108) 만을 서비스한다. 따라서 N/N+1 고장 복구 클러스터에서의 위치에 따라 파일 서버(104)의 장애는 1과 N 스토리지 디바이스(1080 사이에서 다른 파일 서버(104)로의 이동을 초래한다. 따라서 이러한 파일 서버(104) 중 어느 하나의 I/O 노드(106)는 다른 파일 서버(104)를 이용하여야 한다.
당업자라면 파일 시스템(102)이 본 발명에 따라 구성될 수 있고, 각 스토리지 디바이스(108)는 2개의 파일 서버(104) 이외에, 예컨대 3 개의 파일 서버(104), 즉 주파일 서버 및 2개의 보조 파일 서버에 접속된다. 당업자라면 이러한 구성에서 파일 서버(104)가 고장이면, 그의 대응 스토리지 디바이스(108)는 또 다른 파일 서버(104)로 전환할 수 있고 나머지 스토리지 디바이스(108) 중에서 스위칭의 최소 크기를 야기함을 알 수 있다.
지금까지 본 발명의 양호한 실시예가 도시되고 기술되었지만, 당업자라면 본 발명의 사상을 일탈함이 없이 형태 및 상세의 각종 수정 및 변경이 행해질 수 있음을 이해할 수 있다. 따라서 본 발명은 여기서 기술되고 예증된 정확한 형태에 한정되지 않고 첨부된 청구범위의 범위에 속하는 모든 변형례를 망라하도록 구성되어야 한다.
본 발명의 방법은 컴퓨터 소프트웨어 프로그램으로 실행하기 특히 적합하며, 이러한 컴퓨터 소프트웨어 프로그램은 양호하게 방법의 개개의 단계들에 대응하는모듈을 포함하고 있다. 이러한 소프트웨어는 물론 집적칩 또는 주변 장치 등의 컴퓨터 판독 가능한 매체로 실시될 수 있다.

Claims (17)

  1. 컴퓨터의 파일 시스템으로,
    ① N개의 스토리지 디바이스-여기서, N은 0 이상의 정수-와,
    ② N개의 주파일 서버-각각의 주파일 서버는 그안에서 파일에 엑세스하기 위해 대응 스토리지 디바이스에 동작 가능하게 접속된다-와,
    ③ 상기 N개의 스토리지 디바이스 중 적어도 하나에 동작 가능하게 접속되는 보조 파일 서버를 포함하며,
    상기 N개의 주파일 서버 중 하나의 서버의 고장 시, 상기 N개의 스토리지 디바이스 중 하나는 그의 접속을 상기 보조 파일 서버로 전환하며, 하나 이상의 나머지 스토리지 디바이스는 그들의 접속을 필요에 따라 고장난 파일 서버 이외의 주파일 서버로 전환함으로써 성능의 손실을 막고 각 스토리지 디바이스에 오퍼레이팅 파일 서버를 제공하는 것인 컴퓨터의 파일 시스템.
  2. 제1항에 있어서, 상기 N개의 스토리지 디바이스 각각은 복수의 디스크 드라이브를 포함하는 것인 컴퓨터의 파일 시스템.
  3. 제2항에 있어서, 상기 복수의 디스크 드라이브는 레이드(RAID)를 포함하는 것인 컴퓨터의 파일 시스템.
  4. 제1항에 있어서, 상기 N개의 주파일 서버 및 보조 파일 서버 각각은 PC인 것인 컴퓨터의 파일 시스템.
  5. 제1항에 있어서, 상기 N개의 기억장치 중 적어도 하나는 제1 접속부 및 제2 접속부를 가지며, 상기 제1 접속부는 상기 스토리지 디바이스를 상기 주파일 서버중 하나의 주파일 서버에 동작 가능하게 접속하며, 상기 제2 접속부는 상기 스토리지 디바이스를 상기 보조 파일 서버에 동작 가능하게 접속하는 것인 컴퓨터의 파일 시스템.
  6. 제5항에 있어서, 상기 제1 접속부 및 상기 제2 접속부는 SCSI 버스 접속부인 것인 컴퓨터의 파일 시스템.
  7. 제6항에 있어서, 상기 주파일 서버 및 보조 파일 서버 중 적어도 하나는 2채널 SCSI 제어기를 구비하며, 상기 2채널 중 하나는 상기 N개의 스토리지 디바이스 중 하나에 동작 가능하게 접속되며, 상기 2채널 중 다른 하나는 상기 N개의 스토리지 디바이스 중 또 다른 하나에 동작 가능하게 접속되는 것인 컴퓨터의 파일 시스템.
  8. 컴퓨터 시스템으로,
    파일 시스템에 동작 가능하게 접속된 I/O 노드를 포함하며,
    상기 파일 시스템은,
    N개의 스토리지 디바이스(여기서, N은 0 보다 큰 정수임)와, N개의 주 파일 서버(각 주파일 서버는 그 안에서 파일에 엑세스하기 위한 대응 스토리지 디바이스에 동작 가능하게 접속된다)와, 상기 N개의 스토리지 디바이스 중 적어도 하나에 동작 가능하게 접속된 제2 보조 파일 서버를 구비하며, 상기 N개의 주파일 서버 중 하나의 주파일 서버의 고장 시, 상기 N개의 스토리지 디바이스 중 하나는 그의 접속을 상기 보조 파일 서버로 전환하고 하나 이상의 나머지 스토리지 디바이스는 그들의 접속을 필요에 따라 상기 고장 파일 서버 이외의 주파일 서버로 전환함으로써 성능의 손실을 방지하고 각 스토리지 디바이스에 오퍼레이팅 파일 서버를 제공하는 것인 컴퓨터 시스템.
  9. 제8항에 있어서, 상기 N개의 스토리지 디바이스 각각은 복수의 디스크 드라이브를 포함하는 것인 컴퓨터 시스템.
  10. 제9항에 있어서, 상기 복수의 디스크 드라이브는 레이드(RAID)를 포함하는 것인 컴퓨터 시스템.
  11. 제8항에 있어서, 상기 N개의 주파일 서버 및 보조 파일 서버 각각은 PC인 것인 컴퓨터 시스템.
  12. 제8항에 있어서, 상기 N개의 기억장치 중 적어도 하나는 제1 접속부 및 제2 접속부를 가지며, 상기 제1 접속부는 상기 스토리지 디바이스를 상기 주파일 서버중 하나의 주파일 서버에 동작 가능하게 접속하며, 상기 제2 접속부는 상기 스토리지 디바이스를 상기 보조 파일 서버에 동작 가능하게 접속하는 것인 컴퓨터 시스템.
  13. 제12항에 있어서, 상기 제1 접속부 및 상기 제2 접속부는 SCSI 버스 접속부인 것인 컴퓨터의 파일 시스템.
  14. 제13항에 있어서, 상기 주파일 서버 및 보조 파일 서버 중 적어도 하나는 2채널 SCSI 제어기를 구비하며, 상기 2채널 중 하나는 상기 N개의 스토리지 디바이스 중 하나에 동작 가능하게 접속되며, 상기 2채널 중 다른 하나는 상기 N개의 스토리지 디바이스 중 또 다른 하나에 동작 가능하게 접속되는 것인 컴퓨터 시스템.
  15. 장애 발생 시 파일 서버의 완전한 성능을 유지하기 위한 방법으로, 상기 파일 시스템은 N개의 스토리지 디바이스(여기서, N은 0 보다 큰 정수)와, N개의 주파일 서버(각 주파일 서버는 그 안에서 파일에 엑세스하기 위해 대응 스토리지 디바이스에 동작 가능하게 접속됨)와, 상기 N개의 스토리지 디바이스 중 적어도 하나에 동작 가능하게 접속되는 보조 파일 서버를 가지며, 상기 방법은
    상기 N개의 주파일 서버 중 하나의 주파일 서버 고장 시 상기 N개의 스토리지 디바이스 중 하나의 접속을 상기 보조 파일 서버로 전환하는 단계와,
    하나 이상의 나머지 스토리지 디바이스의 접속을 상기 고장 파일 서버 이외의 주파일 서버로 전환하여 성능의 손실을 방지하고 각 스토리지 디바이스에 오퍼레이팅 파일 서버를 제공하는 단계를 포함하는 것인 방법.
  16. 장애 발생 시 파일 시스템의 완전한 성능을 유지하기 위한 컴퓨터 판독 가능한 매체로 구현된 컴퓨터 프로그램 제품으로, 상기 파일 시스템은 N개의 스토리지 디바이스(여기서, N은 0 보다 큰 정수)와, N개의 주파일 서버(각 주파일 서버는 그 안에서 파일에 엑세스하기 위해 대응 스토리지 디바이스에 동작 가능하게 접속됨)와, 상기 N개의 스토리지 디바이스 중 적어도 하나에 동작 가능하게 접속되는 보조 파일 서버를 가지며, 상기 컴퓨터 프로그램 제품은,
    상기 N개의 주파일 서버 중 하나의 주파일 서버 고장 시 상기 N개의 스토리지 디바이스 중 하나의 접속을 상기 보조 파일 서버로 전환하기 위한 컴퓨터 판독 가능한 프로그램 코드 수단과,
    하나 이상의 나머지 스토리지 디바이스의 접속을 상기 고장 파일 서버 이외의 주파일 서버로 전환하여 성능의 손실을 방지하고 각 스토리지 디바이스에 오퍼레이팅 파일 서버를 제공하기 위한 컴퓨터 판독 가능한 프로그램 코드 수단을 포함하는 것인 컴퓨터 프로그램 제품.
  17. 장애 발생 시 파일 시스템의 완전한 성능을 유지하기 위한 방법을 수행하도록 머신에 의해 실행 가능한 프로그램 명령을 유형적으로 구현하는, 머신에 의해서 판독 가능한 프로그램 스토리지 디바이스로, 상기 파일 시스템은 N개의 스토리지 디바이스(여기서, N은 0 보다 큰 정수)와, N개의 주파일 서버(각 파일 서버는 그 안에서 파일에 엑세스하기 위해 대응 스토리지 디바이스에 동작 가능하게 접속됨)와, 상기 N개의 스토리지 디바이스 중 적어도 하나에 동작 가능하게 접속되는 보조 파일 서버를 가지며, 상기 방법은
    상기 N개의 주파일 서버 중 하나의 주파일 서버 고장 시 상기 N개의 스토리지 디바이스 중 하나의 접속을 상기 보조 파일 서버로 전환하는 단계와,
    하나 이상의 나머지 스토리지 디바이스의 접속을 상기 고장 파일 서버 이외의 주파일 서버로 전환하여 성능의 손실을 방지하고 각 스토리지 디바이스에 오퍼레이팅 파일 서버를 제공하는 단계를 포함하는 것인 머신에 의해서 판독 가능한 프로그램 스토리지 디바이스.
KR1020037011089A 2001-02-24 2002-02-25 고장 발생 시 완전한 성능을 유지하는 컴퓨터 파일 시스템, 컴퓨터 파일 시스템을 포함하는 컴퓨터 시스템, 컴퓨터 파일 서버의 유지 방법, 컴퓨터 파일 시스템의 완전한 성능을 유지하기 위한 프로그램을 수록한 컴퓨터 판독 가능한 기록 매체 및 프로그램 스토리지 디바이스 KR100553145B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US27112401P 2001-02-24 2001-02-24
US60/271,124 2001-02-24
PCT/US2002/005614 WO2002069162A1 (en) 2001-02-24 2002-02-25 Twin-tailed fail-over for fileservers maintaining full performance in the presence of a failure

Publications (2)

Publication Number Publication Date
KR20040004536A true KR20040004536A (ko) 2004-01-13
KR100553145B1 KR100553145B1 (ko) 2006-02-22

Family

ID=68499839

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020037011089A KR100553145B1 (ko) 2001-02-24 2002-02-25 고장 발생 시 완전한 성능을 유지하는 컴퓨터 파일 시스템, 컴퓨터 파일 시스템을 포함하는 컴퓨터 시스템, 컴퓨터 파일 서버의 유지 방법, 컴퓨터 파일 시스템의 완전한 성능을 유지하기 위한 프로그램을 수록한 컴퓨터 판독 가능한 기록 매체 및 프로그램 스토리지 디바이스

Country Status (6)

Country Link
US (1) US7330996B2 (ko)
EP (1) EP1402381A4 (ko)
JP (1) JP4107651B2 (ko)
KR (1) KR100553145B1 (ko)
CN (1) CN1232916C (ko)
WO (1) WO2002069162A1 (ko)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6654241B2 (en) * 2001-06-29 2003-11-25 Intel Corporation High availability small foot-print server
JP4039276B2 (ja) * 2003-03-05 2008-01-30 富士ゼロックス株式会社 サービス処理システム及びプログラム
US7376859B2 (en) * 2003-10-20 2008-05-20 International Business Machines Corporation Method, system, and article of manufacture for data replication
US7707282B1 (en) 2004-06-29 2010-04-27 American Megatrends, Inc. Integrated network and management controller
US7668941B1 (en) * 2004-06-29 2010-02-23 American Megatrends, Inc. Systems and methods for implementing a TCP/IP stack and web interface within a management module
CN100364266C (zh) * 2004-07-23 2008-01-23 北京数码大方科技有限公司 一种混合分布式文件管理仓储系统及相关方法
US20060143502A1 (en) * 2004-12-10 2006-06-29 Dell Products L.P. System and method for managing failures in a redundant memory subsystem
US7480816B1 (en) * 2005-08-04 2009-01-20 Sun Microsystems, Inc. Failure chain detection and recovery in a group of cooperating systems
JP4839841B2 (ja) * 2006-01-04 2011-12-21 株式会社日立製作所 スナップショット再起動方法
US7461289B2 (en) * 2006-03-16 2008-12-02 Honeywell International Inc. System and method for computer service security
KR100922584B1 (ko) 2006-12-01 2009-10-21 한국전자통신연구원 객체 기반 분산 공유 시스템 및 그의 방법
TW200832128A (en) * 2007-01-26 2008-08-01 Rdc Semiconductor Co Ltd Redundant system
US20080201524A1 (en) * 2007-02-15 2008-08-21 Harris Corporation System and method for increasing video server storage bandwidth
JP2009104300A (ja) * 2007-10-22 2009-05-14 Denso Corp データ処理装置及びプログラム
US8544065B2 (en) * 2008-01-23 2013-09-24 International Business Machines Corporation Dataspace protection utilizing virtual private networks on a multi-node computer system
JP5232602B2 (ja) 2008-10-30 2013-07-10 株式会社日立製作所 ストレージ装置、及びストレージコントローラ内部ネットワークのデータ経路フェイルオーバー方法
US8327186B2 (en) * 2009-03-10 2012-12-04 Netapp, Inc. Takeover of a failed node of a cluster storage system on a per aggregate basis
US8145838B1 (en) 2009-03-10 2012-03-27 Netapp, Inc. Processing and distributing write logs of nodes of a cluster storage system
US8069366B1 (en) 2009-04-29 2011-11-29 Netapp, Inc. Global write-log device for managing write logs of nodes of a cluster storage system
CN102541693A (zh) * 2011-12-31 2012-07-04 曙光信息产业股份有限公司 数据的多副本存储管理方法和系统
JP5910117B2 (ja) * 2012-01-30 2016-04-27 富士通株式会社 ファイルシステム
NL1039562C2 (nl) * 2012-04-24 2013-10-28 Fusion Electronics B V Werkwijze, aansturing, berichtenontvangstmodule, databerichtformaat en netwerkprotocol voor een agrarisch systeem.
JP6036190B2 (ja) * 2012-11-07 2016-11-30 富士通株式会社 情報処理装置、情報処理システムの制御方法及び情報処理システムの制御プログラム
CN105376289A (zh) * 2014-09-01 2016-03-02 重庆好吃狗云计算科技有限公司 一种无损快速恢复数据和系统运行的方法
CN106055276A (zh) * 2016-05-25 2016-10-26 极道科技(北京)有限公司 一种非集中式集群存储系统
CN109783280A (zh) * 2019-01-15 2019-05-21 上海海得控制系统股份有限公司 共享存储系统和共享存储方法
CN110417922A (zh) * 2019-09-11 2019-11-05 北京搜狐新动力信息技术有限公司 一种数据传输方法、装置及系统
CN111026585B (zh) * 2019-12-05 2023-03-17 四川湖山电器股份有限公司 一种录播系统中的存储服务器热备切换方法
CN113566391A (zh) * 2020-04-29 2021-10-29 青岛海尔空调电子有限公司 空调运行控制方法、装置及空调系统

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04271454A (ja) * 1991-02-27 1992-09-28 Toshiba Corp 疎結合計算機システム
US5812748A (en) * 1993-06-23 1998-09-22 Vinca Corporation Method for improving recovery performance from hardware and software errors in a fault-tolerant computer system
US5978565A (en) * 1993-07-20 1999-11-02 Vinca Corporation Method for rapid recovery from a network file server failure including method for operating co-standby servers
US5652839A (en) * 1994-03-29 1997-07-29 The United States Of America As Represented By The Secretary Of The Navy Method of non-intrusively sensing status in a computer peripheral
US5566297A (en) * 1994-06-16 1996-10-15 International Business Machines Corporation Non-disruptive recovery from file server failure in a highly available file system for clustered computing environments
US5696895A (en) * 1995-05-19 1997-12-09 Compaq Computer Corporation Fault tolerant multiple network servers
US5675723A (en) * 1995-05-19 1997-10-07 Compaq Computer Corporation Multi-server fault tolerance using in-band signalling
US5852724A (en) * 1996-06-18 1998-12-22 Veritas Software Corp. System and method for "N" primary servers to fail over to "1" secondary server
JP2830857B2 (ja) * 1996-09-09 1998-12-02 三菱電機株式会社 データストレージシステム及びデータストレージ管理方法
US5996086A (en) * 1997-10-14 1999-11-30 Lsi Logic Corporation Context-based failover architecture for redundant servers
JPH11163970A (ja) * 1997-11-28 1999-06-18 Oki Electric Ind Co Ltd 装置内基盤制御システム
US5954694A (en) * 1998-08-07 1999-09-21 Embol-X, Inc. Nested tubing sections and methods for making same
US6412079B1 (en) * 1998-10-09 2002-06-25 Openwave Systems Inc. Server pool for clustered system
JP3545252B2 (ja) * 1999-03-30 2004-07-21 富士通株式会社 情報処理装置
US6728897B1 (en) * 2000-07-25 2004-04-27 Network Appliance, Inc. Negotiating takeover in high availability cluster
US6990547B2 (en) * 2001-01-29 2006-01-24 Adaptec, Inc. Replacing file system processors by hot swapping
US6845467B1 (en) * 2001-02-13 2005-01-18 Cisco Systems Canada Co. System and method of operation of dual redundant controllers
US6874103B2 (en) * 2001-11-13 2005-03-29 Hewlett-Packard Development Company, L.P. Adapter-based recovery server option

Also Published As

Publication number Publication date
JP4107651B2 (ja) 2008-06-25
WO2002069162A1 (en) 2002-09-06
EP1402381A1 (en) 2004-03-31
EP1402381A4 (en) 2007-07-04
CN1493031A (zh) 2004-04-28
CN1232916C (zh) 2005-12-21
US20040073830A1 (en) 2004-04-15
US7330996B2 (en) 2008-02-12
KR100553145B1 (ko) 2006-02-22
JP2004530972A (ja) 2004-10-07

Similar Documents

Publication Publication Date Title
KR100553145B1 (ko) 고장 발생 시 완전한 성능을 유지하는 컴퓨터 파일 시스템, 컴퓨터 파일 시스템을 포함하는 컴퓨터 시스템, 컴퓨터 파일 서버의 유지 방법, 컴퓨터 파일 시스템의 완전한 성능을 유지하기 위한 프로그램을 수록한 컴퓨터 판독 가능한 기록 매체 및 프로그램 스토리지 디바이스
US7565566B2 (en) Network storage appliance with an integrated switch
CN103064769B (zh) 双热备服务器系统
US7028218B2 (en) Redundant multi-processor and logical processor configuration for a file server
US6553408B1 (en) Virtual device architecture having memory for storing lists of driver modules
US20050027751A1 (en) Network, storage appliance, and method for externalizing an internal I/O link between a server and a storage controller integrated within the storage appliance chassis
EP2590068A2 (en) Server direct attached storage shared through virtual SAS expanders
US20050289386A1 (en) Redundant cluster network
JP2010287212A (ja) 任意のコントローラから任意のコントローラにn通りに直接接続されるアーキテクチャ
JP2008140387A (ja) クラスタ化されたストレージネットワーク
JP2008524725A (ja) 記憶システム用多機能拡張スロット
JP2003131953A (ja) メモリシステムおよびその使用方法
US7797394B2 (en) System and method for processing commands in a storage enclosure
US20100312964A1 (en) Embedded private scale out network
JP2003330626A (ja) 常時稼働コントローラ相互接続を介してのコントローラ通信
US7631143B1 (en) Data storage system employing virtual disk enclosure
CN203070274U (zh) 双热备服务器系统
US20050081086A1 (en) Method, apparatus and program storage device for optimizing storage device distribution within a RAID to provide fault tolerance for the RAID
Dell
US11341073B2 (en) Redundant paths to single port storage devices
US6549979B1 (en) Address mapping in mass storage device mounting system
RU2716040C2 (ru) Метод построения высокопроизводительных отказоустойчивых систем хранения данных на основе распределенных файловых систем и технологии NVMe over Fabrics
US7346674B1 (en) Configurable fibre channel loop system
JP2000347812A (ja) 情報処理装置およびディスクアレイ装置
US11567834B2 (en) Data center storage availability architecture using rack-level network fabric

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20110110

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee