KR20040004536A - 고장 발생 시 완전한 성능을 유지하는 파일 서버의 트윈테일드 고장 복구 - Google Patents
고장 발생 시 완전한 성능을 유지하는 파일 서버의 트윈테일드 고장 복구 Download PDFInfo
- Publication number
- KR20040004536A KR20040004536A KR10-2003-7011089A KR20037011089A KR20040004536A KR 20040004536 A KR20040004536 A KR 20040004536A KR 20037011089 A KR20037011089 A KR 20037011089A KR 20040004536 A KR20040004536 A KR 20040004536A
- Authority
- KR
- South Korea
- Prior art keywords
- file server
- file
- storage devices
- storage device
- server
- Prior art date
Links
- 238000003860 storage Methods 0.000 claims abstract description 119
- 238000000034 method Methods 0.000 claims abstract description 19
- 238000004590 computer program Methods 0.000 claims description 4
- 230000014759 maintenance of location Effects 0.000 claims 1
- 238000012544 monitoring process Methods 0.000 abstract 1
- 238000011084 recovery Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 230000015556 catabolic process Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000006855 networking Effects 0.000 description 2
- 230000004888 barrier function Effects 0.000 description 1
- 238000013481 data capture Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
-
- H—ELECTRICITY
- H05—ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
- H05K—PRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
- H05K7/00—Constructional details common to different types of electric apparatus
- H05K7/20—Modifications to facilitate cooling, ventilating, or heating
- H05K7/20709—Modifications to facilitate cooling, ventilating, or heating for server racks or cabinets; for data centers, e.g. 19-inch computer racks
- H05K7/20836—Thermal management, e.g. server temperature control
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F04—POSITIVE - DISPLACEMENT MACHINES FOR LIQUIDS; PUMPS FOR LIQUIDS OR ELASTIC FLUIDS
- F04D—NON-POSITIVE-DISPLACEMENT PUMPS
- F04D25/00—Pumping installations or systems
- F04D25/16—Combinations of two or more pumps ; Producing two or more separate gas flows
- F04D25/166—Combinations of two or more pumps ; Producing two or more separate gas flows using fans
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F04—POSITIVE - DISPLACEMENT MACHINES FOR LIQUIDS; PUMPS FOR LIQUIDS OR ELASTIC FLUIDS
- F04D—NON-POSITIVE-DISPLACEMENT PUMPS
- F04D27/00—Control, e.g. regulation, of pumps, pumping installations or pumping systems specially adapted for elastic fluids
- F04D27/004—Control, e.g. regulation, of pumps, pumping installations or pumping systems specially adapted for elastic fluids by varying driving speed
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/16—Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
- G06F15/163—Interprocessor communication
- G06F15/173—Interprocessor communication using an interconnection network, e.g. matrix, shuffle, pyramid, star, snowflake
- G06F15/17356—Indirect interconnection networks
- G06F15/17368—Indirect interconnection networks non hierarchical topologies
- G06F15/17381—Two dimensional, e.g. mesh, torus
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/14—Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
- G06F17/141—Discrete Fourier transforms
- G06F17/142—Fast Fourier transforms, e.g. using a Cooley-Tukey type algorithm
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/52—Program synchronisation; Mutual exclusion, e.g. by means of semaphores
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/52—Program synchronisation; Mutual exclusion, e.g. by means of semaphores
- G06F9/526—Mutual exclusion algorithms
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09G—ARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
- G09G5/00—Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
- G09G5/003—Details of a display terminal, the details relating to the control arrangement of the display terminal and to the interfaces thereto
- G09G5/006—Details of the interface to the display terminal
- G09G5/008—Clock recovery
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L7/00—Arrangements for synchronising receiver with transmitter
- H04L7/02—Speed or phase control by the received code signals, the signals containing no special synchronisation information
- H04L7/033—Speed or phase control by the received code signals, the signals containing no special synchronisation information using the transitions of the received signal to control the phase of the synchronising-signal-generating means, e.g. using a phase-locked loop
- H04L7/0337—Selecting between two or more discretely delayed clocks or selecting between two or more discretely delayed received code signals
- H04L7/0338—Selecting between two or more discretely delayed clocks or selecting between two or more discretely delayed received code signals the correction of the phase error being performed by a feed forward loop
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F24—HEATING; RANGES; VENTILATING
- F24F—AIR-CONDITIONING; AIR-HUMIDIFICATION; VENTILATION; USE OF AIR CURRENTS FOR SCREENING
- F24F11/00—Control or safety arrangements
- F24F11/70—Control systems characterised by their outputs; Constructional details thereof
- F24F11/72—Control systems characterised by their outputs; Constructional details thereof for controlling the supply of treated air, e.g. its pressure
- F24F11/74—Control systems characterised by their outputs; Constructional details thereof for controlling the supply of treated air, e.g. its pressure for controlling air flow rate or air velocity
- F24F11/77—Control systems characterised by their outputs; Constructional details thereof for controlling the supply of treated air, e.g. its pressure for controlling air flow rate or air velocity by controlling the speed of ventilators
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02B—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO BUILDINGS, e.g. HOUSING, HOUSE APPLIANCES OR RELATED END-USER APPLICATIONS
- Y02B30/00—Energy efficient heating, ventilation or air conditioning [HVAC]
- Y02B30/70—Efficient control or regulation technologies, e.g. for control of refrigerant flow, motor or heating
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computer Hardware Design (AREA)
- Data Mining & Analysis (AREA)
- Computational Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Mechanical Engineering (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Discrete Mathematics (AREA)
- Databases & Information Systems (AREA)
- Algebra (AREA)
- Thermal Sciences (AREA)
- Microelectronics & Electronic Packaging (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Hardware Redundancy (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
본 발명은 장애 발생 시 파일 시스템(100)의 성능을 모니터링하는 방법에 관한 것이다. 파일 시스템은 N개의 스토리지 디바이스(108)(여기서, N은 0 보다 큰 정수)와, N개의 주파일 서버(104)(각각의 주파일 서버가 그안에서 파일에 엑세스하기 위해 대응 스토리지 디바이스에 동작 가능하게 접속된다)를 포함한다. 파일 시스템은 N개의 스토리지 디바이스 중 적어도 하나에 동작 가능하게 접속되는 보조 파일 서버(104a)를 더 포함하다. 상기 방법은 N개의 주파일 서버 중 하나의 고장 시 N개의 스토리지 디바이스 중 하나의 접속을 보조 파일 서버로 전환하는 단계와, 하나 이상의 나머지 스토리지 디바이스의 접속을 고장 파일 서버 이외의 주파일 서버로 전환하여 성능의 손상을 방지하고 각 스토리지 디바이스에 오퍼레이팅 파일 서버를 제공하는 단계를 포함한다.
Description
병렬 컴퓨터 설계 있어서 파일 서버의 장애(고장) 시 그 장애를 복구하는 종래 기술의 시스템 및 방법들이 공지되어 있다. 그러나 이러한 시스템 및 방법들은 시스템 성능의 저하를 희생하여 장애 복구를 제공한다. 그 결과 종래 기술의 장애 복구 시스템 및 방법은 전체 성능 또는 입출력(I/O) 연결성에 비추어서 컴퓨터가 실행하는 응용 프로그램에는 투명하지 않다.
(관련 출원 상호 참조)
본 발명은 2001년 2월 24일자로 출원된 "MASSIVELY PARALLEL SUPERCOMPUTER"라는 제목의 공유되고 동시에 계류 중인 미국 가특허 출원 일련 번호 60/271,124의 우선권을 주장하고 있으며, 이 가특허 출원의 전체 내용 및 개시 사항은 본 명세서에 완전히 개시되어 있는 것처럼 본 명세서에 참조로서 명백히 통합되어 있다. 이 가특허 출원은 추가적으로 동일자로 출원된 다음의 공유되고 동시에 계류 중인 미국 특허 출원들에 관련되어 있으며, 이러한 특허 출원들 각각의 전체 내용 및 개시 사항은 본 명세서에 완전히 개시되어 있는 것처럼 본 명세서에 참조로서 명백히 통합되어 있다: "Class Networking Routing"이라는 제목의 미국 특허 출원 일련 번호( YOR920020027US1, YOR920020044US1(15270)); "A Global Tree Network For Computing Structures"라는 제목의 미국 특허 출원 일련 번호( YOR920020028US1(15271)); "Global Interrupt and Barrier Network"라는 제목의 미국 특허 출원 일련 번호(YOR920020029US1(15272)); "Optimized Scalable Network Switch"라는 제목의 미국 특허 출원 일련 번호(YOR920020030US1(15273));"Arithmetic Functions in Torus and Tree Networks"라는 제목의 미국 특허 출원 일련 번호(YOR920020031US1, YOR920020032US1(15258)); "Data Capture Technique for High Speed Signaling"이라는 제목의 미국 특허 출원 일련 번호(YOR920020033US1,YOR920020034US1(15259)); "Managing Coherence via Put/Get Windows"라는 제목의 미국 특허 출원 일련 번호(YOR920020035US1(15260)); "Low Latency Memory Access And Synchronization"이라는 제목의 미국 특허 출원 일련 번호(YOR920020036US1,YOR920020037US1(15261)); "Twin-Tailed Fail-Over for Fileservers Maintaining Full Performance in the Presence of Failure"라는 제목의 미국 특허 출원 일련 번호(YOR920020038US1(15276)); "Fault Isolation Through No-Overhead Link Level Checksums"라는 제목의 미국 특허 출원 일련 번호(YOR920020039US1(15277)); "Ethernet Addressing Via Physical Location for Massively Parallel Systems"라는 제목의 미국 특허 출원 일련 번호(YOR920020040US1(15278)); "Fault Tolerance in a Supercomputer Through Dynamic Repartitioning"이라는 제목의 미국 특허 출원 일련 번호(YOR920020041US1(15274)); "Checkpointing Filesystem"이라는 제목의 미국 특허 출원 일련 번호(YOR920020042US1(15279)); "Efficient Implementation of Multidimensional Fast Fourier Transform on a Distributed-Memory Parallel Multi-Node Computer"라는 제목의 미국 특허 출원 일련 번호(YOR920020043US1(15262)); "A Novel Massively Parallel Supercomputer"라는 제목의 미국 특허 출원 일련 번호(YOR9-20010211US2(15275)); "Smart Fan Modulesand System"이라는 제목의 미국 특허 출원 일련 번호(YOR920020045US1(15263)).
본 발명은 일반적으로 파일 서버의 장애 복구 시스템(a fail-over system) 및 방법에 관한 것으로서, 특히 예컨대 생명 과학 분야에서의 계산에 응용되는 것으로서 분산형 메모리 메시지 패싱 병렬 컴퓨터 설계 및 시스템 소프트웨어에 관한 것이다.
이후, 본 발명의 보다 상세한 설명을 위해 첨부된 도면을 참조하여 본원 발명의 장치 및 방법의 특징, 형태 및 이점에 대해서 설명하기로 한다.
도 1은 본 발명의 양호한 실시예에 따른 컴퓨팅 시스템의 파일 시스템 및 I/O 노드의 정상적인 오퍼레이팅 모드를 도시한다.
도 2는 파일 시스템의 파일 서버의 장애가 있는 경우의 도 1의 컴퓨팅 시스템을 도시한다.
도 3은 5개의 파일 서버 및 4개의 스토리지 디바이스를 가진 도 1의 파일 시스템의 개략도이다.
도 4는 모든 주파일 서버가 적절히 동작하는 경우의 도 3의 파일 시스템을 도시한다.
도 5는 엔드 파일 서버의 장애가 있는 경우의 도 3의 파일 시스템을 도시한다.
도 6은 미들 파일 서버가 고장난 경우의 도 3의 파일 시스템을 도시한다.
그러므로, 본 발명의 목적은 종래 기술과 관련된 단점을 극복한 파일 시스템의 장애 복구 시스템 및 방법을 제공하는 것이다.
따라서, 컴퓨터의 파일 시스템이 제공된다. 파일 시스템은 N개의 스토리지 디바이스(storage devices)(기억 장치)(여기서, N은 0 보다 큰 정수임)와, N개의 주파일 서버(primary file servers)(각 파일 서버는 파일에 엑세스하기 위한 대응 스토리지 디바이스에 동작 가능하게 연결된다)와, N개의 스토리지 디바이스 중 적어도 하나에 동작 가능하게 연결된 보조 파일 서버(secondary file server)를 구비하고 있으며, N개의 주 파일 서버 중 하나의 파일 서버 고장 시, N개의 스토리지디바이스 중 하나는 그의 접속을 보조 파일 서버로 전환하고 하나 이상의 나머지 스토리지 디바이스는 그들의 접속을 필요에 따라 고장 파일 서버 이외의 주파일 서버로 전환함으로써 성능의 손실을 방지하고 각 스토리지 디바이스에 오퍼레이팅 파일 서버를 제공한다.
파일 시스템의 양호한 구현예에 있어서, 각각의 N개의 스토리지 디바이스는 복수의 디스크 드라이브를 구비한다. 복수의 디스크 드라이브는 레이드(RAID)를 양호하게 포함한다. 파일 시스템의 또 다른 양호한 구현예에 있어서, 각각의 N개의 주파일 서버 및 보조 파일 서버는 PC이다.
N개의 스토리지 디바이스 중 적어도 하나는 제1 및 제2 접속부를 가지며, 제1 접속부는 하나의 주파일 서버에 스토리지 디바이스를 동작 가능하게 연결하며, 제2 접속부는 스토리지 디바이스를 보조 파일 서버에 동작 가능하게 접속한다. 제1 및 제2 접속부는 양호한 SCSI 버스 접속부이다. 주파일 서버 및 보조 파일 서버 중 적어도 하나는 2 개의 채널 SCSI 제어기를 구비하고 있으며, 두 채널 중 하나는 N개의 스토리지 디바이스 중 하나에 동작 가능하게 접속되며 두 채널 중 다른 하나는 N개의 스토리지 디바이스 중 또 다른 하나에 동작 가능하게 접속된다.
또한 컴퓨터 시스템이 제공된다. 컴퓨터 시스템은 파일 시스템에 동작 가능하게 접속된 I/O 노드와, N 개의 주파일 서버와, 보조 파일 서버를 포함하며, 파일 시스템은 N개의 스토리지 디바이스를 구비하며, 여기서 N은 0보다 큰 정수이고, 각각의 주파일 서버는 그안에서 파일에 엑세스하기 위해 대응 스토리지 디바이스에 동작 가능하게 접속되며, 보조 파일은 N개의 스토리지 디바이스 중 적어도 하나에동작 가능하게 접속되고, N개의 주파일 서버 중 하나의 주파일 서버의 고장 시 N개의 스토리지 디바이스 중 하나는 그의 접속을 보조 파일 서버로 전환하고 하나 이상의 나머지 스토리지 디바이스는 그들의 접속을 필요에 따라 장애 파일 서버 이외의 주파일 서버로 전환함으로써 각 스토리지 디바이스에 오퍼레이팅 파일 서버를 제공하고 성능의 손상을 방지한다.
컴퓨터 시스템의 양호한 구현예에 있어서, N 개의 스토리지 디바이스 각각은 복수의 디스크 드라이브를 포함한다. 복수의 디스크 드라이브는 양호하게 레이드(RAID)를 포함한다. 또 다른 양호한 컴퓨터 시스템의 구현예에 있어서, N개의 주파일 서버 및 보조 파일 서버 각각은 PC이다.
N개의 스토리지 디바이스 중 적어도 하나는 제1 및 제2 접속부를 양호하게 가지며, 제1 접속부는 스토리지 디바이스를 주파일 서버들 중 하나에 동작 가능하게 접속하며 제2 접속부는 스토리지 디바이스를 보조 파일 서버에 동작 가능하게 접속한다. 제1 및 제2 접속부는 양호한 SCSI 버스 접속부이다. 주파일 서버 및 보조 파일 서버 중 적어도 하나는 2 채널 SCSI 제어기를 구비하는데, 두 채널 중 하나는 N개의 스토리지 디바이스 중 하나에 동작 가능하게 접속되며, 두 채널 중 다른 하나는 N개의 스토리지 디바이스 중 또 다른 하나에 동작 가능하게 접속된다.
또한, 장애 발생 시 파일 시스템의 완전한 성능을 유지하기 위한 방법이 제공된다. 파일 시스템은 N개의 스토리지 디바이스(여기서, N은 0 보다 큰 정수)와, N개의 주 파일 서버(각각의 주파일 서버가 그안에서 파일에 엑세스하기 위해 대응 스토리지 디바이스에 동작 가능하게 접속된다)를 포함한다. 파일 시스템은 N개의스토리지 디바이스 중 적어도 하나에 동작 가능하게 접속되는 보조 파일 서버를 더 포함하다. 상기 방법은 N개의 주파일 서버 중 하나의 고장 시 N개의 스토리지 디바이스 중 하나의 접속을 보조 파일 서버로 전환하는 단계와, 하나 이상의 나머지 스토리지 디바이스의 접속을 고장 파일 서버 이외의 주파일 서버로 전환하여 성능의 손상을 방지하고 각 스토리지 디바이스에 오퍼레이팅 파일 서버를 제공하는 단계를 포함한다. 따라서, 상기 방법은 성능의 손상이 없고 파일 서버상에 결과의 부하가 동등한 방식으로 접속을 전환한다.
또한, 고장 발생 시 파일 시스템의 완전한 성능를 유지하기 위한 컴퓨터 판독 가능한 매체로 구현되는 컴퓨터 프로그램 제품이 제공된다. 파일 시스템은 N개의 스토리지 디바이스(여기서, N은 0 보다 큰 정수)와 N개의 주파일 서버를 구비하며, 각 주파일 서버는 그안에서 파일에 엑세스하기 위해 대응 스토리지 디바이스에 동작 가능하게 접속된다. 파일 시스템은 N개의 스토리지 디바이스 중 적어도 하나에 동작 가능하게 접속된 보조 파일 서버를 더 구비하고 있다. 컴퓨터 프로그램 제품은 N개의 주파일 서버 중 하나의 파일 서버의 고장 시 N개의 스토리지 디바이스 중 하나의 접속을 보조 파일 서버로 전환하는 컴퓨터 판독 가능한 프로그램 코드 수단과 성능의 손상을 방지하고 각 스토리지 디바이스에 오퍼레이팅 파일 서버를 제공하기 위해 필요에 따라 고장 파일 서버 이외의 주파일 서버로 하나 이상의 나머지 스토리지 디바이스의 접속을 전환하기 위한 컴퓨터 판독 가능한 프로그램 코드 수단을 포함한다. 따라서 전술한 바와 같이, 상기 접속들은 성능의 손실을 발생시키지 않고 파일 서버에 가해지는 부하가 동등해지는 방식으로 전환한다.
비록 본 발명은 각종 타입의 고장 복구 시스템에 적용 가능할지라도, 초병렬 컴퓨터의 고장 복구 시스템의 환경에서 특히 유용하다. 그러므로, 초병렬 컴퓨터의 장애 복구 시스템에 대한 본 발명의 응용에 제한 없이 본 발명은 이러한 환경에서 기술될 것이다. 이러한 초병렬 컴퓨터 시스템은 동시 계류중인 미국 특허 출원 --------- (대리인 문서 번호 제15258호);ㅡㅡㅡㅡㅡㅡ(대리인 문서 번호 제15259호);ㅡㅡㅡㅡㅡㅡ(대리인 문서 번호 제15260호);ㅡㅡㅡㅡㅡㅡ(대리인 문서 번호 제15261호);ㅡㅡㅡㅡㅡㅡ(대리인 문서 번호 제15262호);ㅡㅡㅡㅡㅡㅡ(대리인 문서 번호 제15263호);ㅡㅡㅡㅡㅡㅡ(대리인 문서 번호 제15270호);ㅡㅡㅡㅡㅡㅡ(대리인 문서 번호 제15271호);ㅡㅡㅡㅡㅡㅡ(대리인 문서 번호 제15272호);ㅡㅡㅡㅡㅡㅡ(대리인 문서 번호 제15273호);ㅡㅡㅡㅡㅡㅡ(대리인 문서 번호 제15274호);ㅡㅡㅡㅡㅡㅡ(대리인 문서 번호 제15275호);ㅡㅡㅡㅡㅡㅡ(대리인 문서 번호 제15278호);ㅡㅡㅡㅡㅡㅡ(대리인 문서 번호 제15279호); 여기서 전체 개시 내용은 참조 문헌으로 결합되고 있다.
이제부터 도 1을 참조하여 설명하기로 한다. 도 1에는 참조 부호(100)로 표시된 컴퓨터 시스템이 도시되고 있다. 컴퓨터 시스템(100)은 전술한 종래 기술과 관련된 문제점들을 해결하기 위해 하드웨어 및 소프트웨어 아키텍쳐와 알고리즘의 조합을 이용한다. 컴퓨터 시스템(100)은 다수의 "N/N+1 고장 복구 클러스터"로 정렬된 파일 시스템을 포함하며, 각 파일 복구 클러스터는 I/O 노드(106)에 대해서 파일 서버(104)라 지칭되는 하나의 프로세서에 적어도 하나의 온라인 스페어 파일 서버(104a)가 더해진 구조이다. 양호한 구현예에 있어서, 컴퓨터(100)는 초병렬 시스템이며 파일 시스템은 랙마운트 상품의 PC를 채용하고 있다.
스페어 파일 서버(104a)를 포함하는 각 파일 서버(104)는 2개 이상의 스토리지 디바이스(108)에 직접 엑세스한다. 비록 도 1은 2개의 스토리지 디바이스(108)에 직접 엑세스하는 각 파일 서버(104)를 도시하고 있지만, 이러한 구성은 양호한 구현예로서 도시된 것이며, 본 발명의 범위 또는 사상을 제한하려는 의도는 아니다. 그러나, 이후 설명되는 바와 같이, 각 파일 서버(104)는 2개 이상의 스토리지 디바이스(108)에 직접 엑세스할 수 있다. 각 파일 서버(104)는 2개의 채널 SCSI 제어기를 포함하는 것이 좋다. 이러한 양호한 구성에 있어서, SCSI 채널 중 하나는 스토리지 디바이스(108)에 대한 "주" 인터페이스로 지정되며 다른 채널은 그 스토리지 디바이스(108)에 대한 주파일 서버(104)가 고장이면 파일 시스템 인터페이스를 취할 준비가 되어 있는 보조 스토리지 디바이스(108)에 대한 "장애 복구" 모드 또는 핫스탠바이 상태로 놓여질 수가 있다.
각 파일 서버(104)는 "원격 관리" 인터페이스를 양호하게 포함하고 있다. 이러한 인터페이스의 일례는 인텔 서버 상의 "베이스 관리 제어기(BMC)"이며, 이는 이더넷 또는 각 파일 서버(104)에 대한 시리얼 접속을 통해 파일 서버(104)를 구성하고, 부팅하며, 가동하고, 모니터링하기 위한 기능을 제공한다. 더욱이, 각 파일 서버(104)는 기가비트의 이더넷 접속부와 같은 데이터 접속부를 양호하게 갖는다. 이러한 접속부는 멀티포트 기가비트 이더넷 스위치를 컴퓨터의 100개의 I/O 노드(106)를 제공한다.
스토리지 디바이스들(108)은 핫스왑 SCSI 디스크 케이지(disk cage)를 양호하게 가지며, 각 장치는 표준 랙마운트 프레임으로 다중 디스크 드라이브를 수용하고 있다. 디스크 케이지는 다채널 하드웨어 RAID(레이드) 제어기, 리던던트 전원 공급 장치 및 2개의 외부 SCSI 버스 접속부를 양호하게 구비하고 있다. 하드웨어 RAID 제어기는 다중 디스크 드라이브를 RAID "스트립 세트"로 그룹화하고 RAID-0(보호 기능이 없는 단순 스트립핑) 내지 RAID-5(패리티 보호 기능이 있는 블록 회전스트립핑) 범위에 이르는 수개의 스트립 세트 구조를 지원한다. 상위 레벨의 RAID는 또한 다중 RAID 스트립 세트가 디스크 드라이브의 대형 어레이와 함께 스트립 "스패닝(spanning)"이라 불리는 하드웨어 구조에 의해서 지원 가능하다. 그 일례는 RAID-50이며, 여기서 2개 이상의 RAID-5 스트립 세트는 그자체가 디스크 드라이브의 대형 클러스터를 가로질러 스트립된다. 그러나, RAID-5가 바람직한 제어기인데, 왜냐하면 이는 작은 신뢰성의 증가에 대해서 RAID-50 시스템의 단가 및 복잡성의 부가를 야기함이 없이 필요한 신뢰성을 제공하기 때문이다.
각 파일 서버(104)는 내부 SCSI 버스가 상이한 호스트에 대한 각 단말에서 인터페이스함을 의미하는 "트윈-테일드(Twin-Tailed)" SCSI 상호접속부를 통해 엑세스되는 2개 이상의 스토리지 디바이스(108)에 접속된다. 이러한 파일 서버들 중 어느 하나가 고장난 경우, 특정 스토리지 디바이스(108)에 대한 직접 상호 접속부를 가진 파일 서버 노드(110)에 대한 컴퓨터 I/O 노드(106)의 일대일 관계는 I/O 노드(106) 및 나머지 파일 서버 노드(110)의 조정을 통해 유지된다. 이러한 조정은 주요 트윈 테일드 접속부(직선으로 표시)에서 보조 접속부(점선으로 표시)로 소요 갯수의 파일 서버 노드(110)를 동시에 스위칭함으로써 달성된다.
다음의 실시예의 설명으로부터 알 수 있는 바와 같이, 파일 서버(104)의 고장 여부에 따라서, 0 내지 나머지 파일 서버 노드의 갯수 마이너스 1의 노드(110)가 그들의 보조 접속부로 전환할 것이다. 즉, 장애 복구할 것이다. 평균적으로 파일 서버 노드(110) 중 절반이 전환을 필요로 할 것이다. 이런 식으로, 각 스토리지 디바이스(108)는 그에 대응하는 하나의 작업 파일 서버(104)를 계속해서 가진다.파일 서버 노드(110)의 장애 복구와 동시에, 컴퓨터 I/O 노드(106)는 또한 그의 특정 파일 시스템에 대한 I/O를 수행하기 위해 사용하는 파일 서버를 스위칭함으로서 논리적인 접속을 특정 스토리지 디바이스(108)로 전환할 것이다. 도 2에 도시한 바와 같이, 파일 서버(104b)의 장애 시, 스페어 파일 서버(104a)에 대한 보조 접속이 주접속이 되며 스토리지 디바이스(108a)는 장애 파일 서버(104b)로 주접속을 전환한다. 당업자라면 컴퓨터 I/O 노드에서 발생된 부하가 동일하다는 가정 하에 성능에 있어 손실이 없고 각각의 파일 서버(104)에 대한 부하가 동일함을 알 수 있을 것이다. 당업자라면 또한 전체 장애 복구 방법이 전체 성능 및 I/O 접속성에 비추어 응용 프로그램에 투명하게 실현할 것이다. 이것은 컴퓨터 I/O 노드(106)가 각 스토리지 디바이스(108)에 대한 직접 접속을 투명하게 유지하고 어떤 고장 시 조정된 형태로 그 접속성의 방향을 다시 바꾸기 때문이다.
도 3에 있어서, 본 발명의 파일 시스템(102)의 일례가 도시되며, 파일 시스템은 4(N)개의 스토리지 디바이스(108)와 5(N+1)개의 파일 서버(104)를 구비하고 있다. 각 파일 서버(104)는 PC이며, 각 스토리지 디바이스(108)는 독립 RAID-5 유닛인 것이 좋다. 스토리지 디바이스(108)의 수는 I/O 노드(106)의 수와 매칭한다. 각 스토리지 디바이스(108)는 전술한 바와 같이 2개의 외부 SCSI 버스 접속부를 가진다. 하나의 SCSI 접속부는 주파일 서버(104)와 연결되고, 다른 하나의 SCSI 접속부는 다른 보조 파일 서버(104)와 연결된다. 따라서 미들 파일 서버(104)는 하나의 스토리지 디바이스(108)의 주파일 서버(104)와 또 다른 스토리지 디바이스(108)의 보조 파일 서버로서 기능한다. 오직 하나의 주파일 서버(104) 만이 능동적으로스토리지 디바이스로서 기능하나, 주파일 서버가 고장이면, 보조 파일 서버(104a)가 이를 떠 맡는다. 따라서 파일 서버(104)는 스토리지 디바이스(108)의 다른 디스크 프로토콜 또는 SCSI와 I/O 노드(106)의 네트워킹 프로토콜 또는 이더넷 사이에서 신뢰할 수 있게 변환한다. 4(N)개의 파일 서버(104)가 이용되었다면, 하나의 파일 서버(104)의 장애 시 그의 보조 파일 서버(104)는 또 다른 스토리지 디바이스(108)의 주파일 서버(104)로서 계속해서 기능할 것이다. 따라서 영향을 받은 스토리지 디바이스(108)의 성능은 2의 인수씩 저하된다. 이러한 성능의 저하를 회피하기 위해 전술한 바와 같이, "N/N+1 고장 복구 클러스터" 방법을 사용한다. 여기서 N은 스토리지 디바이스(108)의 수이며, N+1은 파일 서버(104)의 수이다.
N=4라 가정하면, 4/5 고장 복구 클러스터의 파일 서버 및 스토리지 디바이스(108)는 도 3에 도시한 바와 같이 정렬되며, 여기서 직선은 주접속부를 가리키며 점선은 각 스토리지 디바이스(108)의 보조 접속부를 가리킨다. 모든 주파일 서버(104)가 적절히 동작하고 있는 경우, 능동 파일 서버는 도 4에 도시한 바와 같다. 가장 좌측의 파일 서버(104b)가 고장이면, 도 5에 도시한 바와 같이 보조 파일 서버(104)가 이용된다. 미들 파일 서버(104b)가 고장이면, 접속은 도 6에 도시한 바와 같다.
상기 실시예들에 의해서 입증되는 바와 같이, 각 스토리지 디바이스(108)에 대해 파일 서버(104)에 대한 오직 하나의 SCSI 접속만이 활성화된다. 파일 서버(104b)가 고장이면, 그의 대응 스토리지 디바이스(108)는 또 다른 파일로 전환한다. 그 파일 서버(104)가 또 다른 스토리지 디바이스(108)를 서비스하고 있으면,그 서비스는 인접 파일 서버(104)로 이동된다. 필요하다면, 그의 인접 파일 서버도 마찬가지이며, 그 결과 각 파일 서버(104)는 오직 하나의 스토리지 디바이스(108) 만을 서비스한다. 따라서 N/N+1 고장 복구 클러스터에서의 위치에 따라 파일 서버(104)의 장애는 1과 N 스토리지 디바이스(1080 사이에서 다른 파일 서버(104)로의 이동을 초래한다. 따라서 이러한 파일 서버(104) 중 어느 하나의 I/O 노드(106)는 다른 파일 서버(104)를 이용하여야 한다.
당업자라면 파일 시스템(102)이 본 발명에 따라 구성될 수 있고, 각 스토리지 디바이스(108)는 2개의 파일 서버(104) 이외에, 예컨대 3 개의 파일 서버(104), 즉 주파일 서버 및 2개의 보조 파일 서버에 접속된다. 당업자라면 이러한 구성에서 파일 서버(104)가 고장이면, 그의 대응 스토리지 디바이스(108)는 또 다른 파일 서버(104)로 전환할 수 있고 나머지 스토리지 디바이스(108) 중에서 스위칭의 최소 크기를 야기함을 알 수 있다.
지금까지 본 발명의 양호한 실시예가 도시되고 기술되었지만, 당업자라면 본 발명의 사상을 일탈함이 없이 형태 및 상세의 각종 수정 및 변경이 행해질 수 있음을 이해할 수 있다. 따라서 본 발명은 여기서 기술되고 예증된 정확한 형태에 한정되지 않고 첨부된 청구범위의 범위에 속하는 모든 변형례를 망라하도록 구성되어야 한다.
본 발명의 방법은 컴퓨터 소프트웨어 프로그램으로 실행하기 특히 적합하며, 이러한 컴퓨터 소프트웨어 프로그램은 양호하게 방법의 개개의 단계들에 대응하는모듈을 포함하고 있다. 이러한 소프트웨어는 물론 집적칩 또는 주변 장치 등의 컴퓨터 판독 가능한 매체로 실시될 수 있다.
Claims (17)
- 컴퓨터의 파일 시스템으로,① N개의 스토리지 디바이스-여기서, N은 0 이상의 정수-와,② N개의 주파일 서버-각각의 주파일 서버는 그안에서 파일에 엑세스하기 위해 대응 스토리지 디바이스에 동작 가능하게 접속된다-와,③ 상기 N개의 스토리지 디바이스 중 적어도 하나에 동작 가능하게 접속되는 보조 파일 서버를 포함하며,상기 N개의 주파일 서버 중 하나의 서버의 고장 시, 상기 N개의 스토리지 디바이스 중 하나는 그의 접속을 상기 보조 파일 서버로 전환하며, 하나 이상의 나머지 스토리지 디바이스는 그들의 접속을 필요에 따라 고장난 파일 서버 이외의 주파일 서버로 전환함으로써 성능의 손실을 막고 각 스토리지 디바이스에 오퍼레이팅 파일 서버를 제공하는 것인 컴퓨터의 파일 시스템.
- 제1항에 있어서, 상기 N개의 스토리지 디바이스 각각은 복수의 디스크 드라이브를 포함하는 것인 컴퓨터의 파일 시스템.
- 제2항에 있어서, 상기 복수의 디스크 드라이브는 레이드(RAID)를 포함하는 것인 컴퓨터의 파일 시스템.
- 제1항에 있어서, 상기 N개의 주파일 서버 및 보조 파일 서버 각각은 PC인 것인 컴퓨터의 파일 시스템.
- 제1항에 있어서, 상기 N개의 기억장치 중 적어도 하나는 제1 접속부 및 제2 접속부를 가지며, 상기 제1 접속부는 상기 스토리지 디바이스를 상기 주파일 서버중 하나의 주파일 서버에 동작 가능하게 접속하며, 상기 제2 접속부는 상기 스토리지 디바이스를 상기 보조 파일 서버에 동작 가능하게 접속하는 것인 컴퓨터의 파일 시스템.
- 제5항에 있어서, 상기 제1 접속부 및 상기 제2 접속부는 SCSI 버스 접속부인 것인 컴퓨터의 파일 시스템.
- 제6항에 있어서, 상기 주파일 서버 및 보조 파일 서버 중 적어도 하나는 2채널 SCSI 제어기를 구비하며, 상기 2채널 중 하나는 상기 N개의 스토리지 디바이스 중 하나에 동작 가능하게 접속되며, 상기 2채널 중 다른 하나는 상기 N개의 스토리지 디바이스 중 또 다른 하나에 동작 가능하게 접속되는 것인 컴퓨터의 파일 시스템.
- 컴퓨터 시스템으로,파일 시스템에 동작 가능하게 접속된 I/O 노드를 포함하며,상기 파일 시스템은,N개의 스토리지 디바이스(여기서, N은 0 보다 큰 정수임)와, N개의 주 파일 서버(각 주파일 서버는 그 안에서 파일에 엑세스하기 위한 대응 스토리지 디바이스에 동작 가능하게 접속된다)와, 상기 N개의 스토리지 디바이스 중 적어도 하나에 동작 가능하게 접속된 제2 보조 파일 서버를 구비하며, 상기 N개의 주파일 서버 중 하나의 주파일 서버의 고장 시, 상기 N개의 스토리지 디바이스 중 하나는 그의 접속을 상기 보조 파일 서버로 전환하고 하나 이상의 나머지 스토리지 디바이스는 그들의 접속을 필요에 따라 상기 고장 파일 서버 이외의 주파일 서버로 전환함으로써 성능의 손실을 방지하고 각 스토리지 디바이스에 오퍼레이팅 파일 서버를 제공하는 것인 컴퓨터 시스템.
- 제8항에 있어서, 상기 N개의 스토리지 디바이스 각각은 복수의 디스크 드라이브를 포함하는 것인 컴퓨터 시스템.
- 제9항에 있어서, 상기 복수의 디스크 드라이브는 레이드(RAID)를 포함하는 것인 컴퓨터 시스템.
- 제8항에 있어서, 상기 N개의 주파일 서버 및 보조 파일 서버 각각은 PC인 것인 컴퓨터 시스템.
- 제8항에 있어서, 상기 N개의 기억장치 중 적어도 하나는 제1 접속부 및 제2 접속부를 가지며, 상기 제1 접속부는 상기 스토리지 디바이스를 상기 주파일 서버중 하나의 주파일 서버에 동작 가능하게 접속하며, 상기 제2 접속부는 상기 스토리지 디바이스를 상기 보조 파일 서버에 동작 가능하게 접속하는 것인 컴퓨터 시스템.
- 제12항에 있어서, 상기 제1 접속부 및 상기 제2 접속부는 SCSI 버스 접속부인 것인 컴퓨터의 파일 시스템.
- 제13항에 있어서, 상기 주파일 서버 및 보조 파일 서버 중 적어도 하나는 2채널 SCSI 제어기를 구비하며, 상기 2채널 중 하나는 상기 N개의 스토리지 디바이스 중 하나에 동작 가능하게 접속되며, 상기 2채널 중 다른 하나는 상기 N개의 스토리지 디바이스 중 또 다른 하나에 동작 가능하게 접속되는 것인 컴퓨터 시스템.
- 장애 발생 시 파일 서버의 완전한 성능을 유지하기 위한 방법으로, 상기 파일 시스템은 N개의 스토리지 디바이스(여기서, N은 0 보다 큰 정수)와, N개의 주파일 서버(각 주파일 서버는 그 안에서 파일에 엑세스하기 위해 대응 스토리지 디바이스에 동작 가능하게 접속됨)와, 상기 N개의 스토리지 디바이스 중 적어도 하나에 동작 가능하게 접속되는 보조 파일 서버를 가지며, 상기 방법은상기 N개의 주파일 서버 중 하나의 주파일 서버 고장 시 상기 N개의 스토리지 디바이스 중 하나의 접속을 상기 보조 파일 서버로 전환하는 단계와,하나 이상의 나머지 스토리지 디바이스의 접속을 상기 고장 파일 서버 이외의 주파일 서버로 전환하여 성능의 손실을 방지하고 각 스토리지 디바이스에 오퍼레이팅 파일 서버를 제공하는 단계를 포함하는 것인 방법.
- 장애 발생 시 파일 시스템의 완전한 성능을 유지하기 위한 컴퓨터 판독 가능한 매체로 구현된 컴퓨터 프로그램 제품으로, 상기 파일 시스템은 N개의 스토리지 디바이스(여기서, N은 0 보다 큰 정수)와, N개의 주파일 서버(각 주파일 서버는 그 안에서 파일에 엑세스하기 위해 대응 스토리지 디바이스에 동작 가능하게 접속됨)와, 상기 N개의 스토리지 디바이스 중 적어도 하나에 동작 가능하게 접속되는 보조 파일 서버를 가지며, 상기 컴퓨터 프로그램 제품은,상기 N개의 주파일 서버 중 하나의 주파일 서버 고장 시 상기 N개의 스토리지 디바이스 중 하나의 접속을 상기 보조 파일 서버로 전환하기 위한 컴퓨터 판독 가능한 프로그램 코드 수단과,하나 이상의 나머지 스토리지 디바이스의 접속을 상기 고장 파일 서버 이외의 주파일 서버로 전환하여 성능의 손실을 방지하고 각 스토리지 디바이스에 오퍼레이팅 파일 서버를 제공하기 위한 컴퓨터 판독 가능한 프로그램 코드 수단을 포함하는 것인 컴퓨터 프로그램 제품.
- 장애 발생 시 파일 시스템의 완전한 성능을 유지하기 위한 방법을 수행하도록 머신에 의해 실행 가능한 프로그램 명령을 유형적으로 구현하는, 머신에 의해서 판독 가능한 프로그램 스토리지 디바이스로, 상기 파일 시스템은 N개의 스토리지 디바이스(여기서, N은 0 보다 큰 정수)와, N개의 주파일 서버(각 파일 서버는 그 안에서 파일에 엑세스하기 위해 대응 스토리지 디바이스에 동작 가능하게 접속됨)와, 상기 N개의 스토리지 디바이스 중 적어도 하나에 동작 가능하게 접속되는 보조 파일 서버를 가지며, 상기 방법은상기 N개의 주파일 서버 중 하나의 주파일 서버 고장 시 상기 N개의 스토리지 디바이스 중 하나의 접속을 상기 보조 파일 서버로 전환하는 단계와,하나 이상의 나머지 스토리지 디바이스의 접속을 상기 고장 파일 서버 이외의 주파일 서버로 전환하여 성능의 손실을 방지하고 각 스토리지 디바이스에 오퍼레이팅 파일 서버를 제공하는 단계를 포함하는 것인 머신에 의해서 판독 가능한 프로그램 스토리지 디바이스.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US27112401P | 2001-02-24 | 2001-02-24 | |
US60/271,124 | 2001-02-24 | ||
PCT/US2002/005614 WO2002069162A1 (en) | 2001-02-24 | 2002-02-25 | Twin-tailed fail-over for fileservers maintaining full performance in the presence of a failure |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20040004536A true KR20040004536A (ko) | 2004-01-13 |
KR100553145B1 KR100553145B1 (ko) | 2006-02-22 |
Family
ID=68499839
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020037011089A KR100553145B1 (ko) | 2001-02-24 | 2002-02-25 | 고장 발생 시 완전한 성능을 유지하는 컴퓨터 파일 시스템, 컴퓨터 파일 시스템을 포함하는 컴퓨터 시스템, 컴퓨터 파일 서버의 유지 방법, 컴퓨터 파일 시스템의 완전한 성능을 유지하기 위한 프로그램을 수록한 컴퓨터 판독 가능한 기록 매체 및 프로그램 스토리지 디바이스 |
Country Status (6)
Country | Link |
---|---|
US (1) | US7330996B2 (ko) |
EP (1) | EP1402381A4 (ko) |
JP (1) | JP4107651B2 (ko) |
KR (1) | KR100553145B1 (ko) |
CN (1) | CN1232916C (ko) |
WO (1) | WO2002069162A1 (ko) |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6654241B2 (en) * | 2001-06-29 | 2003-11-25 | Intel Corporation | High availability small foot-print server |
JP4039276B2 (ja) * | 2003-03-05 | 2008-01-30 | 富士ゼロックス株式会社 | サービス処理システム及びプログラム |
US7376859B2 (en) * | 2003-10-20 | 2008-05-20 | International Business Machines Corporation | Method, system, and article of manufacture for data replication |
US7707282B1 (en) | 2004-06-29 | 2010-04-27 | American Megatrends, Inc. | Integrated network and management controller |
US7668941B1 (en) * | 2004-06-29 | 2010-02-23 | American Megatrends, Inc. | Systems and methods for implementing a TCP/IP stack and web interface within a management module |
CN100364266C (zh) * | 2004-07-23 | 2008-01-23 | 北京数码大方科技有限公司 | 一种混合分布式文件管理仓储系统及相关方法 |
US20060143502A1 (en) * | 2004-12-10 | 2006-06-29 | Dell Products L.P. | System and method for managing failures in a redundant memory subsystem |
US7480816B1 (en) * | 2005-08-04 | 2009-01-20 | Sun Microsystems, Inc. | Failure chain detection and recovery in a group of cooperating systems |
JP4839841B2 (ja) * | 2006-01-04 | 2011-12-21 | 株式会社日立製作所 | スナップショット再起動方法 |
US7461289B2 (en) * | 2006-03-16 | 2008-12-02 | Honeywell International Inc. | System and method for computer service security |
KR100922584B1 (ko) | 2006-12-01 | 2009-10-21 | 한국전자통신연구원 | 객체 기반 분산 공유 시스템 및 그의 방법 |
TW200832128A (en) * | 2007-01-26 | 2008-08-01 | Rdc Semiconductor Co Ltd | Redundant system |
US20080201524A1 (en) * | 2007-02-15 | 2008-08-21 | Harris Corporation | System and method for increasing video server storage bandwidth |
JP2009104300A (ja) * | 2007-10-22 | 2009-05-14 | Denso Corp | データ処理装置及びプログラム |
US8544065B2 (en) * | 2008-01-23 | 2013-09-24 | International Business Machines Corporation | Dataspace protection utilizing virtual private networks on a multi-node computer system |
JP5232602B2 (ja) | 2008-10-30 | 2013-07-10 | 株式会社日立製作所 | ストレージ装置、及びストレージコントローラ内部ネットワークのデータ経路フェイルオーバー方法 |
US8327186B2 (en) * | 2009-03-10 | 2012-12-04 | Netapp, Inc. | Takeover of a failed node of a cluster storage system on a per aggregate basis |
US8145838B1 (en) | 2009-03-10 | 2012-03-27 | Netapp, Inc. | Processing and distributing write logs of nodes of a cluster storage system |
US8069366B1 (en) | 2009-04-29 | 2011-11-29 | Netapp, Inc. | Global write-log device for managing write logs of nodes of a cluster storage system |
CN102541693A (zh) * | 2011-12-31 | 2012-07-04 | 曙光信息产业股份有限公司 | 数据的多副本存储管理方法和系统 |
JP5910117B2 (ja) * | 2012-01-30 | 2016-04-27 | 富士通株式会社 | ファイルシステム |
NL1039562C2 (nl) * | 2012-04-24 | 2013-10-28 | Fusion Electronics B V | Werkwijze, aansturing, berichtenontvangstmodule, databerichtformaat en netwerkprotocol voor een agrarisch systeem. |
JP6036190B2 (ja) * | 2012-11-07 | 2016-11-30 | 富士通株式会社 | 情報処理装置、情報処理システムの制御方法及び情報処理システムの制御プログラム |
CN105376289A (zh) * | 2014-09-01 | 2016-03-02 | 重庆好吃狗云计算科技有限公司 | 一种无损快速恢复数据和系统运行的方法 |
CN106055276A (zh) * | 2016-05-25 | 2016-10-26 | 极道科技(北京)有限公司 | 一种非集中式集群存储系统 |
CN109783280A (zh) * | 2019-01-15 | 2019-05-21 | 上海海得控制系统股份有限公司 | 共享存储系统和共享存储方法 |
CN110417922A (zh) * | 2019-09-11 | 2019-11-05 | 北京搜狐新动力信息技术有限公司 | 一种数据传输方法、装置及系统 |
CN111026585B (zh) * | 2019-12-05 | 2023-03-17 | 四川湖山电器股份有限公司 | 一种录播系统中的存储服务器热备切换方法 |
CN113566391A (zh) * | 2020-04-29 | 2021-10-29 | 青岛海尔空调电子有限公司 | 空调运行控制方法、装置及空调系统 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04271454A (ja) * | 1991-02-27 | 1992-09-28 | Toshiba Corp | 疎結合計算機システム |
US5812748A (en) * | 1993-06-23 | 1998-09-22 | Vinca Corporation | Method for improving recovery performance from hardware and software errors in a fault-tolerant computer system |
US5978565A (en) * | 1993-07-20 | 1999-11-02 | Vinca Corporation | Method for rapid recovery from a network file server failure including method for operating co-standby servers |
US5652839A (en) * | 1994-03-29 | 1997-07-29 | The United States Of America As Represented By The Secretary Of The Navy | Method of non-intrusively sensing status in a computer peripheral |
US5566297A (en) * | 1994-06-16 | 1996-10-15 | International Business Machines Corporation | Non-disruptive recovery from file server failure in a highly available file system for clustered computing environments |
US5696895A (en) * | 1995-05-19 | 1997-12-09 | Compaq Computer Corporation | Fault tolerant multiple network servers |
US5675723A (en) * | 1995-05-19 | 1997-10-07 | Compaq Computer Corporation | Multi-server fault tolerance using in-band signalling |
US5852724A (en) * | 1996-06-18 | 1998-12-22 | Veritas Software Corp. | System and method for "N" primary servers to fail over to "1" secondary server |
JP2830857B2 (ja) * | 1996-09-09 | 1998-12-02 | 三菱電機株式会社 | データストレージシステム及びデータストレージ管理方法 |
US5996086A (en) * | 1997-10-14 | 1999-11-30 | Lsi Logic Corporation | Context-based failover architecture for redundant servers |
JPH11163970A (ja) * | 1997-11-28 | 1999-06-18 | Oki Electric Ind Co Ltd | 装置内基盤制御システム |
US5954694A (en) * | 1998-08-07 | 1999-09-21 | Embol-X, Inc. | Nested tubing sections and methods for making same |
US6412079B1 (en) * | 1998-10-09 | 2002-06-25 | Openwave Systems Inc. | Server pool for clustered system |
JP3545252B2 (ja) * | 1999-03-30 | 2004-07-21 | 富士通株式会社 | 情報処理装置 |
US6728897B1 (en) * | 2000-07-25 | 2004-04-27 | Network Appliance, Inc. | Negotiating takeover in high availability cluster |
US6990547B2 (en) * | 2001-01-29 | 2006-01-24 | Adaptec, Inc. | Replacing file system processors by hot swapping |
US6845467B1 (en) * | 2001-02-13 | 2005-01-18 | Cisco Systems Canada Co. | System and method of operation of dual redundant controllers |
US6874103B2 (en) * | 2001-11-13 | 2005-03-29 | Hewlett-Packard Development Company, L.P. | Adapter-based recovery server option |
-
2002
- 2002-02-25 KR KR1020037011089A patent/KR100553145B1/ko not_active IP Right Cessation
- 2002-02-25 US US10/468,990 patent/US7330996B2/en not_active Expired - Fee Related
- 2002-02-25 WO PCT/US2002/005614 patent/WO2002069162A1/en active IP Right Grant
- 2002-02-25 JP JP2002568216A patent/JP4107651B2/ja not_active Expired - Fee Related
- 2002-02-25 CN CNB028054229A patent/CN1232916C/zh not_active Expired - Fee Related
- 2002-02-25 EP EP02707874A patent/EP1402381A4/en not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
JP4107651B2 (ja) | 2008-06-25 |
WO2002069162A1 (en) | 2002-09-06 |
EP1402381A1 (en) | 2004-03-31 |
EP1402381A4 (en) | 2007-07-04 |
CN1493031A (zh) | 2004-04-28 |
CN1232916C (zh) | 2005-12-21 |
US20040073830A1 (en) | 2004-04-15 |
US7330996B2 (en) | 2008-02-12 |
KR100553145B1 (ko) | 2006-02-22 |
JP2004530972A (ja) | 2004-10-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100553145B1 (ko) | 고장 발생 시 완전한 성능을 유지하는 컴퓨터 파일 시스템, 컴퓨터 파일 시스템을 포함하는 컴퓨터 시스템, 컴퓨터 파일 서버의 유지 방법, 컴퓨터 파일 시스템의 완전한 성능을 유지하기 위한 프로그램을 수록한 컴퓨터 판독 가능한 기록 매체 및 프로그램 스토리지 디바이스 | |
US7565566B2 (en) | Network storage appliance with an integrated switch | |
CN103064769B (zh) | 双热备服务器系统 | |
US7028218B2 (en) | Redundant multi-processor and logical processor configuration for a file server | |
US6553408B1 (en) | Virtual device architecture having memory for storing lists of driver modules | |
US20050027751A1 (en) | Network, storage appliance, and method for externalizing an internal I/O link between a server and a storage controller integrated within the storage appliance chassis | |
EP2590068A2 (en) | Server direct attached storage shared through virtual SAS expanders | |
US20050289386A1 (en) | Redundant cluster network | |
JP2010287212A (ja) | 任意のコントローラから任意のコントローラにn通りに直接接続されるアーキテクチャ | |
JP2008140387A (ja) | クラスタ化されたストレージネットワーク | |
JP2008524725A (ja) | 記憶システム用多機能拡張スロット | |
JP2003131953A (ja) | メモリシステムおよびその使用方法 | |
US7797394B2 (en) | System and method for processing commands in a storage enclosure | |
US20100312964A1 (en) | Embedded private scale out network | |
JP2003330626A (ja) | 常時稼働コントローラ相互接続を介してのコントローラ通信 | |
US7631143B1 (en) | Data storage system employing virtual disk enclosure | |
CN203070274U (zh) | 双热备服务器系统 | |
US20050081086A1 (en) | Method, apparatus and program storage device for optimizing storage device distribution within a RAID to provide fault tolerance for the RAID | |
Dell | ||
US11341073B2 (en) | Redundant paths to single port storage devices | |
US6549979B1 (en) | Address mapping in mass storage device mounting system | |
RU2716040C2 (ru) | Метод построения высокопроизводительных отказоустойчивых систем хранения данных на основе распределенных файловых систем и технологии NVMe over Fabrics | |
US7346674B1 (en) | Configurable fibre channel loop system | |
JP2000347812A (ja) | 情報処理装置およびディスクアレイ装置 | |
US11567834B2 (en) | Data center storage availability architecture using rack-level network fabric |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20110110 Year of fee payment: 6 |
|
LAPS | Lapse due to unpaid annual fee |