SE9703132A0 - Mjukvarumodell för ett distribuerat processorsystem - Google Patents

Mjukvarumodell för ett distribuerat processorsystem

Info

Publication number
SE9703132A0
SE9703132A0 SE9703132A SE9703132A SE9703132A0 SE 9703132 A0 SE9703132 A0 SE 9703132A0 SE 9703132 A SE9703132 A SE 9703132A SE 9703132 A SE9703132 A SE 9703132A SE 9703132 A0 SE9703132 A0 SE 9703132A0
Authority
SE
Sweden
Prior art keywords
processor
software
processors
objects
hardware
Prior art date
Application number
SE9703132A
Other languages
English (en)
Other versions
SE9703132L (sv
SE9703132D0 (sv
Inventor
Lars Ulrik Jensen
Original Assignee
Ericsson Telefon Ab L M
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Publication of SE9703132L publication Critical patent/SE9703132L/xx
Application filed by Ericsson Telefon Ab L M filed Critical Ericsson Telefon Ab L M
Priority to SE9703132A priority Critical patent/SE9703132D0/sv
Publication of SE9703132A0 publication Critical patent/SE9703132A0/sv
Publication of SE9703132D0 publication Critical patent/SE9703132D0/sv

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/22Arrangements for supervision, monitoring or testing
    • H04M3/24Arrangements for supervision, monitoring or testing with provision for checking the normal operation
    • H04M3/241Arrangements for supervision, monitoring or testing with provision for checking the normal operation for stored program controlled exchanges
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/203Failover techniques using migration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2035Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant without idle spare hardware
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q3/00Selecting arrangements
    • H04Q3/42Circuit arrangements for indirect selecting controlled by common circuits, e.g. register controller, marker
    • H04Q3/54Circuit arrangements for indirect selecting controlled by common circuits, e.g. register controller, marker in which the logic circuitry controlling the exchange is centralised
    • H04Q3/545Circuit arrangements for indirect selecting controlled by common circuits, e.g. register controller, marker in which the logic circuitry controlling the exchange is centralised using a stored programme
    • H04Q3/54575Software application
    • H04Q3/54591Supervision, e.g. fault localisation, traffic measurements, avoiding errors, failure recovery, monitoring, statistical analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2048Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant where the redundant components share neither address space nor persistent storage

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Hardware Redundancy (AREA)
  • Exchange Systems With Centralized Control (AREA)

Abstract

SAMMANFATTNING AV UPPFINNINGEN Ett dndamal med uppfinningen är att tillhandahalla en metod for automatisk aterhdmtning frail multipla permanenta fel i processorer i ett distribuerat processorsystem anvdnt i en applika- tionsmilja i ett telekomsystem som har hoga krav pa tillgdnglighet samtidigt som telekomsystemet skall medge systemunderhall, vare sig detta är planlagt eller ej. Ett annat dndamal med uppfinningen är att utnyttja tillgdngliga processorresurser samtidigt som uppfinningen medger en heterogen processormiljo, till faljd dels av infOrande av fly teknologi i ett system som vdxer med tiden och dels av de enskilda krav som stalls av olika delar av en applikation som kar pa processorsystemet. Annu ett dndamal med uppfinningen är att tillhandahalla en metod far snabb aterhdmtning i hdndelse av att flera processorer gar sander i ett distribuerat processorsystem som anvdnds i en telekomsystemmiljo genom att tillhandahalla en initial konfigu- rering av samtliga processorer och genom att tillhandahalla, for varje processor i systemet, en katastrofplan som skall anvdndas i hdndelse av att ifragavarande processor gar sander. En katastrofplan är det organ med vars hjdlp mjukvaruobjekt, som finns installerade pa en trasig processor, distribueras till . 25 ett antal processorer i systemet sa att lasten delas mellan . • • •• • processorerna.

Description

UPPFINNINGENS BENAMNING Mjukvarumodell for en distribuerat processorsystem SOKANDE Namn och adress.
Om ombud saknas ange aven Ert telefonnummer.
For juridisk person anges organisationsnummer. TELEFONAKTIEBOLAGET LM ERICSSON 126 25 Stockholm Organisationsnummer UPPFINNARE Namn och adress Lars Ulrik Jensen Erik Dahbergsgatan 55,115 57 Stockholm OMBUD Namn, adress och telefonnummer x Undertecknad sOkande befullmaktigar harmed nedanstaende upptagna svenska ombud aft fore- trada mig i alit som r6r denna patentansokning och i alit som ror det eventuellt beviljade patentet.
Sokande befullmaktigar nedanstaende svenska ombud genom separat fullmakt.
DR LUDWIG BRANN PATENTBYRA AB Box 1344,751 43 UppsalaTel- 018-568900 Ombudets ref nrLM 6674SE/II BEGARAN OM PRIORITET Datum, land och ansokningsnummer 1995-12-08Sverige - 9504396-4 VID DEPOSITION AV MIKROORGANISM Depositionsmyndighet DepositionsdatumI Depositionsnr VID AVDELAD ELLER UTBRUTEN ANSOKNING StamansokningarI Begard lopdag 9504396-41995-12-08 BEGARAN OM ITSGRANSKNING Nyhetsgranskning av internationellt slag x x x x BILAGOR IBeskrivning, patentkrav och sammandrag i tre exemplar Uppsala 1997-08-29 AVGIFT ..6ritningari3exemplarOrt, datum O verlatelsehandlingkopiaorig.ml.stam—ans.
Fullmaktkopian — — Sekvenslista pa diskett EPOs program Patent In Prioritetsbevis I K DR LUDWIG BRANN D Gi,v0 Cu, PATENTBYRA AB -,4,-- x 7 BETALNINGSSATT Ansokningsavgift 3.800 kr Ansokningsavgift med ITS-granskning 7.000 kr Tillaggsavgift, 100 kr for varje patentkrav utover tio,kr Diariebevis: 20 kr Postgiron Bankgiro x Underskrift Hans-1Ake Svanfeldt Check ri Kontant PostadressBesoksadressTelefonTelexTelefaxTelegramPostgiroBankgiro Box 505Valhallavagen 13608-782 25 001797808-666 02 86PATOREG1 56 84-45050-0241 rin-rnocn c ••• ••• •••••••: •••••••• •••••••• • •• • • • •• • • ••• •• •• ••• • • • • • ••• : ".• ••• •••••••• :•• ••• Mjukvarumodell for ett distribuerad processorsystem TEKNINSKT OMRADE Foreliggande uppfinning avser en mjukvarumodell for ett distri5 buerat, feltolerant, rekonfigurerbart processorsystem i ett telekommunikationsnat.
TEKNISK BAKGRUND I publika telekammunikations system finns manga olika processo- 10 rer som utfor olika uppgifter, sasom t ex overvakning av aktivitet pa abonnentlinjer, uppstallning och frigoring av forbindelser, trafikstyrning, systemunderhall och taxering. Grupper av processorer är hopkopplade med varandra med hjalp av ett nat som at skilt frAn telekommunikationsnatet eller som bildar en 15 del av detta. I moderna telekommunikationsnat finns natelement, sasom t ex en valjare, en databas, en processor, som är distribuerade pa flera fysiska element i det fysiska natet som bildar telekommunikationsnatet. FOr en applikation sasom t ex POTS (Plain Old Telephony Service), GSM (Globalt System for Mobil- 20 kommunikation), VLL (virtuella hyrda forbindelser), BISDN (bredbandigt digitalt nat med integrerade tjanster) set en distribuerad processor eller en distribuerad databas ut som en enda enhet. De distribuerade enheterna sags vara transparenta ur distributionssynpunkt.
• • •• • • • • • • • •• • •• • • • • • • Ett huvudkrav som stalls pa processorbaserade styrsystem for publika telekommunikationssystem är systemtillganglighet. Med detta avses att systemet skall vara tillgangligt for att betjana sina anvandare. I telefonsystemet AXE-10 tillats systemet vara otillgangligt endast tva timmar under 40 Ai.. Omvandlat • till minuter per ar motsvarar detta ca 3 minuterfar. Moderna .. ••• •• • •• ••• • • • • telekommunikationssystem har avsevart hogre krav pa tillgang- ••• • ••• • •• 41;•••••••: • • • •••••••• •• •••••••• •• • •• •• •• ••• • •• •• •• • ••• 2 : ••• : •••••••• :•• ••• lighet. Icke desto mindre krdvs av moderna telekommunikationssystem att planerat underhallsarbete, som kan ta rang tid, skall kunna utforas med langa tidsintervall, t ex med tidsintervall i storleksordningen ca 1 manad.
Allmdnt sett efterstrdvas bade forbdttrad systemtillganglighet och ldngre medeltid mellan reparation (MTTR). Lang medeltid mellan reparation är onskvdrt och medger att reparation kan utforas pa arbetsdagar (mandag till fredag) och pa arbetstid (fran 08.00 till 17.00) samt medger schemalagt underhall. Dessa krav leder till att telekommunikationssystemet maste kunna tolerera att en processor gar ned och att, innan den har reparerats, dven en andra processor tillats att gá ned men att systemet skall kunna tolerera detta och fortfarande vara 15 driftsdugligt. I det vArsta fallet, och innan de forsta andra havererade processorerna har reparerats, skall systemet kunna tolerera att dven en tredje, fjdrde och tillkommande processorer gar ned, men att systemet fortfarande skall vara tillgdngligt trots de trasiga processorerna.
Amerikanska patentskriften 4 710 926 avser ett felaterhdmtningsforfarande i ett distribuerat processorsystem enligt vilket forfarande reservprocessorer tar over trasiga processorers funktioner. En reservprocessor tjdnstgor som ersdttare fOr en 25 eller flera aktiva processorer. Ndr en reservprocessor tas i ••• • •• • drift tjdnstgor den inte ldngre sasom reservprocessor for flagon • •• •annan processor i systemet. Vid felaterhdmtning overfors alla • •• • •• • • •funktioner som exekverar pa den trasig processorn till reserv- • • •processorn. Den gamla reservprocessorns funktion att vara re- " • servprocessor overfors till en andra reservprocessor i • ". •• • systemet. ". •• • •• • • • • •• ••• • 4• • • 006 000• •64•• • • • • ••006 3 Detta kanda system kraver saledes tva eller flera reservprocessorer. Nar en reservprocessor är inaktiv utfOr den inte nagra jobb. Nar den aktiveras borjar den utfora jobb - forutsatt att den fungerar d v s inte uppvisar nagra fel. Det är nodvandigt 5 att kora testprogram som verifierar att reservprocessorerna fungerar. Detta omnamns dock inte patentskriften.
Det amerikanska patentet 4 412 281 beskriver ett distribuerat, feltolerant, rekonfigurerbart signalbehandlingssystem som inne- 10 fattar manga identiska, med varandra forbundna sub-systemelement som delar pa det stora behandlingsjobbet. Sub-systemelementen är redundant hopkopplade med varandra med dubbla bussar. Vissa sub-systemelement tjanstgor som reservsystemelement och är redo ta over de jobb som utfors pa ett trasigt sub- 15 systemelement. Ett reservsub-systemelement har alien till uppgift att utfora kontroll av alla de egna funktionerna for att verifiera att dessa fungerar. Genom att periodiskt rotera reservsub-systemelement och aktiva sub-systemelement sakerstaller ett distribuerat operativsystem att samtliga sub-systemelement 20 utfor den namnda kontrollen av de egna funktionerna, varvid Aven mindre fel kan detekteras. Trasiga element i sub-systemet tas ur drift och ersatts med ett reservelement utan att systemet gar ned. . ?5 Signalbehandlingssystemet anvander saledes reserv sub-system- • • •• • element som inte deltar i de overgripande behandlingsuppgifter- • • • • •• • 66 • • • • • • .. • :•() kontaktdonadress associeras med en virtuell adress, som ersat- ." •• •ter kontaktdonadressen nar ett feltillstand detekteras. ". na. Den meted som anvands for rekonfigurering nar ett trasigt element detekteras och byts ut mot ett reservelement, utnyttjar distinkta kontaktdonadresser fOr varje element i systemet. En ••• •••• •••I: .41% •••• •••• •••• • • • • • • • • •• • • •• ••• • • ••• • • • • • • ••• 4 : ..• : •••• •• :•• ••• SAMMANFATTNING AV UPPFINNINGEN Ett dndamal med uppfinningen är att tillhandahalla en metod for automatisk aterhdmtning frail multipla permanenta fel i processorer i ett distribuerat processorsystem anvdnt i en applika- 5 tionsmilja i ett telekomsystem som har hoga krav pa tillgdnglighet samtidigt som telekomsystemet skall medge systemunderhall, vare sig detta är planlagt eller ej.
Ett annat dndamal med uppfinningen är att utnyttja tillgdngliga 10 processorresurser samtidigt som uppfinningen medger en heterogen processormiljo, till faljd dels av infOrande av fly teknologi i ett system som vdxer med tiden och dels av de enskilda krav som stalls av olika delar av en applikation som kar pa processorsystemet.
Annu ett dndamal med uppfinningen är att tillhandahalla en metod far snabb aterhdmtning i hdndelse av att flera processorer gar sander i ett distribuerat processorsystem som anvdnds i en telekomsystemmiljo genom att tillhandahalla en initial konfigu- 20 rering av samtliga processorer och genom att tillhandahalla, for varje processor i systemet, en katastrofplan som skall anvdndas i hdndelse av att ifragavarande processor gar sander. En katastrofplan är det organ med vars hjdlp mjukvaruobjekt, som finns installerade pa en trasig processor, distribueras till . 25 ett antal processorer i systemet sa att lasten delas mellan . • • •• • processorerna.
• • • •• • •• • • • • • Annu ett dndamal med uppfinningen är att tillhandahalla nya katastrofplaner for systemet med fungerande processorer, av vilka " • :*10 nagra pa sig kan ha installerade mjukvaruobjekt fran en trasig • ". •• •processor, for att pa sã sdtt farbereda systemet for snabb ". • • • • •• • • • • • ••• • •• •• • • •• : • •• •• •• *.* •• • • ••• ..• •••• • • • : •• • • •• •••••••• •• •• •• •• • •• •• •• •• • :•• •• • • ••• ••• aterhamtning i handelse av att annu en processor i systemet gar sander.
Annu ett andamal med uppfinningen är att tillhandahalla en me- 5 tod av ovanstaende slag vilken tar tillbaka systemet till dess ursprungliga konfigurering av processorer och mjukvaruobjekt nar systemets trasiga processor eller trasiga processorer efter reparation eller utbyte satts in i systemet igen. 10 Annu ett andamal med uppfinningen är att tillhandahalla en mjukvarumodell som medger att mjukvaruobjekt kan flyttas frail en trasig processor till en fungerande processor genom att mjukvaruobjekten omstartas pa den fungerande processorn. En mjukvarumodell kan ocksa dada ett mjukvaruobjekt som finns in- 15 stallerat pa en processor och kan omstarta mjukvaruobjektet pa en reparerad, tidigare trasig, processor som har satts tillbaka i systemet. Det sistnamnda andamalet intraffar i forsta hand nar systemet atergar till sin initial konfigurering och det pa de fungerande processorerna finns installerade objekt som skall 20 lamnas tillbaka till de reparerade processorerna.
I enlighet med uppfinningen skapas en modell av telekommunikationssystemet, vilken modell innefattar en hardvarumodell av de styrande processorerna och av den styrda hArdvarutrustningen 25 samt aven en mjukvarumodell som stoder och passar i hardvarumo- • • " • dellen i telekommunikationssystemet.
• • • • •• • •• • • • • I enlighet med uppfinningen anvands en forsta algoritm for att rakna ut katastrofplanerna for var och en av de fungerande pro- " • cessorerna antingen med ledning av den initiala konfigurationen . . eller med ledning av nagon av de konfigurationer som forekommer efter det att annu en processor har gatt sander. ••• • • ••• ••• • • • • • • 41.0 • • •• ••• • ••• • • • • • • ••• 6 *.* : ..• : •••• •••• :•• ••• I enlighet med uppfinningen anvands en andra algoritm som med ledning av en aktuell konfiguration beraknar en deltakonfiguration, som out den tillampas pa den aktuella konfigurationen, ger 5 tillbaka den initiala konfigurationen av systemet.
I den mjukvarumodell som anvands for mjukvaruobjekten finns inga konfigurationsberoenden inkapslade i mjukvaruobjekten vilket gor att mjukvaruobjekten kan flyttas fran en processor till 10 en annan i vilken processorkonfiguration som heist.
KORT BESKRIVNING AV RITNINGARNA En belysande utforingsform av uppfinningen kommer att beskrivas 15 nedan i anslutning till de bifogade ritningarna, i vilka .
•• . • • • • •• • • • Z • • " • • •• • • • • • Fig.
Fig.
Fig.
Fig. 1 2 3 4 •• • • • • är ett blockschema som visar ett distribuerat processorsystem i en initial konfiguration, är ett blockschema som visar processorsystemet i Fig. 1 i en aktuell konfiguration efter det att en av processorerna gatt sonder, är ett blockschema av processorsystemet i Fig.1 i en andra aktuell konfiguration efter det att tva processorer Ott sOnder, är ett flodesschema som visar metoden i enlighet med uppfinningen, 7 ••• •• •• • • •• : • •• •• • ••• •• • • ••• ••• •••• • • • : • • • • •• • • • • •• •• • It • • •• • • • •• • • • • • •••• •• • • ••• ••• Fig. är ett blockschema av ett distribuerat processorsys- tem i vilket vissa av processorerna styr hardvaruutrustning, 5 Fig. 6Aär en schematisk vy av ett modulariserat mjukvaruob- jekt, Fig. 6B-D är blockscheman av visande tre olika typer av mjukvaruobjekt, 10 Fig. 7är ett blockschema som visar hur hardvaru- och mjuk- varumodellerna i enlighet med uppfinningen passar i hop i en enda modell av telekommunikationssystemet, och 15 Fig. 8är ett blockschema som visar hardvarumodellen i en- lighet med uppfinningen.
DETALJERAD BESKRIVNING AV UPPFINNINGEN I Fig. 1 visas ett antal distribuerade processorer Pl, P2, P3 20 och P4 vilka kommunicerar med varandra over ett nat Ni. Processorerna bildar del av ett ej visat telekommunikationsnat. Natet Ni kan bilda en del av det namnda ej visade telekommunikationsnatet. Varje processor innehaller en processorenhet PE och mine M. Mjukvaruobjekt 1, 2, 3 ... 18 är installerade pa pro- 25 cessorerna; objekten 1, 2, 3 pa processor P1, objekten 4-7 pa • • • •• • • • • • • •• • •• • • • • • Mjukvaran for en applikation som k6r i telekommunikationsnatet innefattar mjukvaruobjekt (Fig. 6B-D), vilka ingar i mjukvaru- . moduler (Fig. 6A). De modulariserade mjukvaruobjekten är allo- • • kationsoberoende objekt vilka kan forflyttas fritt mellan pro- cessorerna. Ett modulariserat mjukvaruobjekt är oberoende av processor P2, objekten 8-12 pa P3 och objekten 13-18 pa P4. 8•• •• • •• ••• • • • • • 000 000 0000 •• • • • • ••000 ::• • OS•• • • •• 000000.0 00 • ovriga modulariserade mjukvaruobjekt. Ett mjukvarurobjekt innehailer typiskt en process och persistent data. Persistent data är data som overlever en omstart av mjukvaruobjektet. Mjukvaruobjekt kan kommunicera med varandra. Ett av en applikation 5 begart jobb involverar typiskt manga mjukvaruobjekt pa olika processorer och exekveras av vissa eller av alla processer. Applikationen kanner inte till hur mjukvaruobjektena är distribuerade pa de olika processorerna. Modulariserat persistent data kan vara lagrat i en databas. PA samma satt som processor- 10 systemet är distribuerat kan ocksa databasen vara distribuerad Over ett antal minnen M pA manga processorer, fOretradesvis pa minnena i samtliga processorer Pl, P2, P3 och P4. Dessa databaspartitioner betecknas DB1, DB2, DB3 och DB4 och innefattar ett arbetsminne (RAM). [Jr en applikations synpunkt är databa- 15 sens distribuerade natur transparent. Persistent data maste kunna lagras pa sAker satt. Detta kan Astadkommas genam konventionell backup-teknik, t ex genom att lagra datat pa en skiva. Ett nytt och f6redraget alternativ är emellertid att lagra en spegelkopia av varje modulariserat mjukvaruobjekt i en databas- 20 partition pa en processor som är skild fran den pa vilken objektet är installerat. Narmare bestAmt lagras spegelkopian av vane modulariserat mjukvaruobjekt i databaspartitionen pa den processor som utpekas i katastrofplanen for den processor pa vilken det modulariserade mjukvaruobjektet, originalet, exekve- 25 rar. PA detta satt kan kopior av det modulariserade persistenta . . • • ••datat lagras pa sAkert sAtt pa en annan processor i hAndelse av . • den processor pa vilken originalet finns lagrat gar sander. 4 • • • • • . • Det satt pa vilket objekten 1-18 är distribuerade pa processo- . • . 30 rerna P1-P4 kallas den initiala konfigureringen av det distri- • • .. • .. • • • • • • • • • • • • • 8 • • • • • * • buerade processorsystemet och visas i bifogade Tabell 1, ur • ••• • ••••••••••••:••••••••.••••••• ••••••••••• • •• ••••••••••••••• ••• 9 :..*:•••••••••:•• ••• vilken framgar att objekten 1, 2 och 3 är installerade pa pro- cessorn Pl.
Den initiala konfigureringen far inte fOrsvinna om flagon pro-5 cessor gar sander. Av denna anledning lagras den initiala konfigurationen och spegelkopian av denna pa det ovan beskrivna sattet. I stallet for att implementera den initiala konfigurationen i form av en tabell kan den implementeras i form av sã kallade par. Exempelvis motsvarar paren (1,1), (1,2), (1,3) den 10 information som framgar ur den forsta raden i Tabell 1.
For att aterhamtningstiden fOr processorsystemet, och darfor aven av telekommunikationssystemet, skall vara kort om en processor gar sander skall det finna en katastrofplan for varje 15 processor som gar solider. Eftersom man inte kan forutse vilken processor som gar sander maste det finnas en katastrofplan for varje processor. En katastrofplan innehaller direktiv avseende de processorer till vilka mjukvaruobjekten pa den trasiga processorn skall flyttas. En katastrofplan, visad i Tabell 2, 20 utpekar de processorer till vilka de pa processorn P1 installerade objekten skall flyttas i handelse av att processorn P1 gar sOnder. En annan katastrofplan innehaller information som talar om vart de pa processorn P2 installerade objekten skall flyttas om P2 gAr solider. Pa likartat satt finns en katastrofplan som . 25 skall foljas om processor P3 gar sander. Denna katastrofplan . • • •• •visas i Tabell 4. Slutligen finns en katastrofplan, Tabell 5, •som tar hand om det fall som intraf far i handelse av att pro- • • •• • •• • . • •cessor P4 gar sonder.
• . • Processor P1 gar sonder . .
Antag, att processor P1 gar sonder. Processorsystemet maste aterhamta sig snabbt fran felet och darfor skall de pA proces- ••• • • ••• 10 SID • • •• ••• II 4• ••• • • • •• •• • •• • 4.0 • • ••• • t ••■•• • II • • • • • • I •• • • • • •• 00 • IS • • • • • • •• • • • • • •••• •• • • ••• • • sorn P1 installerade mjukvaruobjekten 1, 2, 3 flyttas over till processorerna P2 och P4 i enlighet med katastrofplanen for Pl. Narmare bestamt skall mjukvaruobjekten 1 och 3 flyttas till processorn P2 och mjukvaruobjektet 2 skall flyttas till proces- 5 sorn P4. Detta astadkoms genom att mjukvaruobjekten 1-3 tas bort fran processorn P1 och genom att man pa processorn P2 skapar och startar mjukvaruobjekten 1, 3 och pa processorn P4 skapar och startar mjukvaruobjektet 2. Detta kraver givetvis att exekveringskapacitet finns tillganglig pa processorerna P2 10 och P4. Finns inte sadan kapacitet tillganglig kan systemet inte aterhamta sig fran processorfelet. I det foljande antas att den nodvandiga processorkapaciteten finns tillganglig och att systemet saledes aterhamtar sig fran felet. Systemet kommer nu att ha den kofiguration som visas i Fig. 2 och Tabell 6. Utga- 15 ende fran denna konfiguration, vilken nu kallas den aktuella konfigurationen, maste nya katastrofplaner skapas for att systemet snabbt skall kunna aterhamta sig om nagon av de ovriga processorerna gar sander. For detta andamal framstalls nya katastrofplaner vilka ger direktiv om till vilka processorer de 20 pA en trasig processor installerade mjukvaruobjekten skall flyttas. Eftersom man inte kan forutsaga vilken av de tre driftsdugliga processorerna P2-P4 som kommer att ga sonder är det nodvandigt att skapa katastrofplaner for var och en av de driftsdugliga processorerna. Tabell 8 är den nya katastofplanen . 5 (CP-P2') for processor P2, Tabell 9 den nya katastrofplanen • • •• • (CP-P3') for processor P3 och Tabell 10 den nya katastrofplanen • • • •(CP-P4') for processor P4.
• • •• . • • • • • • • PA samma satt som de ursprungliga katastrofplanerna lagras de • - • :°310 nya katastrofplanerna och deras spegelkopior pa det ovan be- • skrivna sattet. ••• ••••• : •••••••: •••••••• •••••••• ••• • •• • • • •• •• • •• • •• •• ••• • • • •• • •• •• •• • • • ••• • • 11 • •• • •• •• •••• •• Det bor observeras att framstallningen av nya katastrofplaner for den aktuella konfigurationen sparar minne jamfort med det foljande teoretsikt tankbara schema: antag att systemet bestAr av fyra processorer och att systemet är sá designat att det to- 5 lererar att tvA processorer gAr sonder. Eftersom man inte kan forutse vilken processor som gAr sonder forst och vilken processor gAr sonder som nummer tvA, mAste man skapa lika mAnga katastrofplaner som antalet olika satt pA vilket tvA element kan valjas ur en grupp av fyra element. Dessa katastrofplaner 10 mAste lagras i databasen. SAledes mAste tjugofyra katastrofplaner skapas och lagras. Denna lagring kraver mycket minnesutrymme. Minnesutrymmet vaxer snabbare an exponentiellt med antalet processor systemet kan tolerera gá sonder. 15 Under perioden frAn det att systemet Aterhamtat sig fram till dess att nya katastrofplaner utarbetats och lagrats i databasen är systemet sArbart. Under denna period fAr inga processorer gA sander. Skulle en processor haverera under denna period kommer systemet inte att vara tillgangligt. .2 • •• • : • Nar en processor PI efter att ha tagits bort och reparerats Ater installeras i systemet, skall systemet Aterga till den initiala konfigurationen. Detta kan ske antingen genom att cloth alla mjukvaruobjekt i den aktuella konfigurationen och genom att skapa och starta alla mjukvaruobjekt pA processorerna i systemet. I den foreslagna utforingsformen av uppfinningen cloths forst endast de objekt som flyttats bort frAn den forsta processorn och som nu exekverar pA andra processorer. Darefter Aterskapas och startas dessa pA processorn Pl. For att hitta dessa objekt skapas en deltakonfigurationstabell genom att sub- • ." •trahera den initiala konfigurationen frAn den aktuella konfi- ." gurationen med uteslutande av processorn Pl. Genom att subtra- •• • •• ••• • • • • . 12 ••• ••• ••.: : : 7 .••."': ••• .• : .••..•'. •••••••• :•••.. • :•• •• •• hera Tabell 1 frAn Tabell 6 erhAlls den i Fig. 7 visade deltakonfigurationen. Den rad som avser den trasiga processorn- P1 ingAr inte i subtraktionen. Deltakonfigurationen visar att objekten 1 och 3 pA processorn P2 och att objektet P2 pA pro- 5 cessorns P4 skall cloths pA de respektive processorerna. Darefter skall de Aterskapas och startas p& den reparerade processorn Pl. Nar objekten Aterskapats kommer systemet att kora pA samma satt som det gjorde i den initiala konfigurationen och systemets Aterhamtiningstid blir kort. 10 Processor P1 havererar och dar efter havererar processor P2. I det foljande exemplet antas att processorn P1 gar sonder och darefter att processorn P2 gAr sonder. Med anknytning till det fOregAende exemplet antas forst att systemet är i drift med 15 samma konfiguration som i Fig. 1, att katastrofplaner har skapats for var och en av processorerna P1-P4, att processorn P1 havererar, att mjukvaruobjekten pa processorn P1 flyttas Over till de driftsdugliga processorerna i enlighet med katastrofplanen i Tabell 2, att systemet Aterhamtar sig och är i drift, 20 att nya katastrofplaner skapas for processorerna P2, P3-och P4, att processorn P1 tas bort och lamnas till reparation. Nu antas att processorn P2 havererar. SAledes skall den nya katastrofplanen som her ihop med processorn P2, d v s den nya katastrofplanen i Tabell 8, foljas. Enligt denna katastrofplan 25 skall objekten 1, 3 och 4 flyttas till processorn P3 och objek••• • •• • ten 5-7 skall flyttas till processorn P4. Pa samma satt som • • ▪ •tidigare tas mjukvaruobjekten pa processorn 2 bort och flyttas •• • • •Over till processorerna P3 och P4. Systemet kommer nu att vara •• • • • I funktion och kora med den konfiguration som visas i Fig. 3 " . och Tabell 11. I enlighet med uppfinningen är det nu nodvandigt • " • •att utarbeta nya katastrofplaner for var och en av processorer- na P3 och P4. ••• • • • • 13 • Of • .60 : • • • • • 000• : • • • • •••••••• • • • • • • ■•• • 000 ••• Under perioden frAn processorns P2 haven i till det att nya ka- tastrofplaner for processorerna P3 och P4 har utarbetats och lagrats i systemet kommer systemet vara sArbart. Om sAledes en- 5 dera P3 eller P4 havererar kommer systemet att vara otillgdngligt. Nu antas att detta inte intrdffar. Istdllet an systemet i drift med den konfiguration som visas i Fig. 3 och Tabell 11.
Nu tas processorn P2 bort frAn systemet och ldmnas till repara- 10 tion. Darefter antas att processorerna P1 och P2 blir reparerade och att de sdtts tillbaka in i systemet. Det kommer nu att bli nodvdndigt att dada objekten 1-7 och processorerna P3 och P4 och att Aterskapa och starta dem pA sina respektive usprungliga processorer P1 och P2. Genom att anvanda en deltakon- 15 figuration, som erhAlls genom att subtrahera den initiala konfigurationen frAn den aktuella konfigurationen i Fig. 1, med undantagande av de trasiga processorerna P1 och P2 denna gang, kommer de objekt som mAste cloths identifieras; ± detta fall 17. Narmare bestamt skall objekten 1, 3, 4 pA processor P3 och 20 objekten 2, 5, 6, 7 pA processorn P4 flyttas Over. Det satt pa vilket dessa objekt skall distribueras pA processorerna P1 och P2 ges av den initiala konfigurationstabellen. SAledes skapas och startas objekten 1, 2, 3 pA processorn P1 och objekten 4-7 skapas och startas pA processorn P2. Systemet har nu Aterhdmtat 25 sig frAn inkopplingen av de tvA reparerade processorerna och • . • • " •antas nu vara i drift.
• • • • •• • •• • • • • • I de ovanstAende exemplen har ett processorsystem med fyra pro- cessorer beskrivits. Uppfinningen An lika val tillampbar pA • :%39 processor system som innehAller tvA, tre, fern eller flera pro- • ••• • • ••• •• • •• • ••• • • • • • cessorer. I det sista exemplet beskrevs ett processor system som tolererade tvA processorhaverier. Uppf innings forfarandet •• .*:.".. : 7..• :•••••••• •:•• ••• är lika val tillampbart pa processorsystem som tolererar tre eller flera processorhaverier. Varje gang -en processor havererar flyttas dess mjukvaruobjekt till andra funktionsdugliga processorer i systemet och nya katastrofplaner for de funk- 5 tionsdugliga processorerna skapas. Det sista exemplet illustrerar att ett av fyra processorer bestaende processorsystem kan vara i drift med 50% av processorerna havererade. Applikationen kommer fortfarande att exekvera ehuru med ett nedsatt kapacitet. Om processorsystemet är en valjare i en telefonstation 10 kommer telefontrafiken fortfarande att vara i gang och sparr kommer att intraffa vid lag trafikvolym. Detta är ett nytt och unikt sardrag som inte finns i flagon av de ovan namnda amerikanska patenten och, savitt sokanden är bekant, har ingen tidigare kunnat astadkomma detta.
En fOrsta algoritm anvands till att skapa katastrofplaner fran den initiala konfigurationen i det fall att en forsta processor havererar eller fran den aktuella konfigurationen i det fall att en tillkommande processor havererar. Den forsta algoritmen 20 innehaller parametrar som avser kapaciteten for en processor, parametrar som avser storleken av minnet av en processor, parametrar som avser hur mycket processorkapacitet (maskincykler per process som skall exekvera) och minne de enskilda flyttade objekten erfordrar, samt parametrar avseende tjanstens kvalite.
• • •• • • • • • En andra algoritm anvands for att aterfOra systemet till dess initiala konfiguration. Denna andra algoritm har redan beskrivits ovan och kallades for deltakonfiguration. • • • •• • •• • • • • • •• " • :•50 Olika metoder kan anvandas for att detektera en trasig proces- • ••• • • ••• •• • •• ••• • • • • sor, t ex "hjartslagsmetoden" i enlighet med den ovan namnda amerikanska patentskriften 4 710 926. En foredragen metod i ett 14 • ..•.°:.".. ::•••••••• •:•• ••• typiskt telekomnat är emellertid att overvaka de lankar som kopplar ihop processorerna med varandra i natet Ni. I samband med de tva ovan beskrivna exemplen beskrevs att mjukvaruobjekt som fanns installerade pa en havererad processor overflyttades 5 till tva processorer. Naturligtvis kan den havererade processorns objekt aven distribueras pa tre eller flera processorer i systemet. I undantagsfall kan samtliga mjukvaruobjekt flyttas Over till en enda processor i det fall att systemet bestar av tva driftsdugliga processorer och den ena av dessa havererar.
Nar systemet är i drift är alla processorerna är driftsdugliga och har mer kapacitet och mer minne an vad som erfordras for att de skall utfOra sina jobb med beraknad kapacitet, d v s de skall ha kapacitet och minne Over for att ta over objekt fran 15 en eller flera processorer och for att ta Over applikationsjobb som är under exekvering. Pa sá satt sakerstalls att samtliga processorer är driftsdugliga och inget testprogram behover koras for att verifiera detta. Vidare kommer systemets kapacitet att overskrida den beraknade kapaciteten, vilket betyder att 20 systemet kommer att ha "reservkapacitet" som kan anvandas for att ta hand om ytterligare applikationsjobb; det finns ingen clod "reserv"-kapacitet. FOr applikationen kommer en havererad processor endast medfora att systemet kapacitet nedsatts; have-net kommer inte att cloth systemet.
• . •• . Sasom ett alternativ till att dimensionera systemet med en ak- ••• • • •tiv "reserv"-kapacitet som kan anvandas for att ta hand om •• . •••tillkommande applikationsjobb, kan systemet designas med ingen • . • • •aktiv "reserv"-kapacitet och med samtliga processorer arbetande med dimensionerad kapacitet. Nar en processor havererar kommer . . ••• • • ••• •• • •• • ••• • • • • systemet att arbeta med nedsatt kapacitet. 16 ••• ••• ••••• • •• • • •• •• •• • :•••••••:.
• ••• • •• • • • • • •• • •• •••••••• •• •• •• •• •• • •••••••• •• • • •••• • ••• • •• Fig. 4 ar ett flodesschema som visar de metodsteg som utfOrs i enlighet med uppfinningen. Det finns alltid en initial konfiguration i vilken samtliga modulariserade Mjukvaruobjekt är mappade pa enskilda processorer. Den initiala konfigurationen 5 skapas av systemsaljaren eller systemoperatoren och lagras i systemet. Detta anges i ruta 20. Darefter skall katastrofplaner skapas ± enlighet med den forsta algoritmen. Det skall finnas lika manga katastrofplaner som processorer i systemet. Vidare skall spegelkopior av persistenta databasobjekt skapas. Detta 10 anges i ruta 21. I en foredragen utfOringsform skapar vane processor sin egen katastrofplan, d v s den katastrofplan som systemet skall anvanda i handelse av processorn havererar. At-garden sakerstaller att arbetet med att skapa katastrofplanerna blir fullstandigt distribuerat. Darefter havererar en proces- 15 sor, ruta 22. Mjukvaruobjekten pa den havererade processorn skall flyttas over till driftsdugliga processorer med utnyttjande av katastrofplanen for den havererade processorn. Med uttrycket "flytta Over" objekt avses att nya kopior av mjukvaruobjekten pa den havererade processorn skapas och startas pa 20 de processorer till vilka de skall flyttas Over i enlighet med katastrofplanen. Detta anges i ruta 23. Ruta 23 representerar saledes systemets Aterhamtning frail den havererade processorn. Systemet är nu i drift och en ny konfiguration, benamnd den aktuella konfigurationen, uppstar. Den aktuella konfigurationen 25 lagras ocksa i ett minne av en distribuerad processor. Medan • • • •• •systemet är i drift skapas nya katastrofplaner for de funk- . • •tionsdugliga processorerna, ruta 24. Nu har systemet atervunnit • • • . - •sin formaga att motsta ett nytt processorhaveri. Aven spegelko- • . • • .• . • pior av de ny katastrofplanerna lagras i databasen. Om en ny • F..30 processor havererar sker atergang till operation 22, visat av • • •pilen 25. Darefter repareras den eller de havererade processo- -- • ••rerna ruta 26, och satts tillbaka i systemet, ruta 26. Om tva ••• • • • • •• • • •• •••• •• •••• •• • • • •• • • • • • • • • • •• ••• • ••• • • •• • •••• •• • • • • ••••• ••• •• • • ••• ••• ••• •• •••• •• eller flera processorer har havererat antas att de repareras och sdtts tillbaka i systemet samtidigt. Teoretiskt sett är det naturligtvis mojligt att reparera havererade processorer en och en At gAngen och att de sdtts tillbaka i systemet en och en At 5 gAngen. Ur praktisk synpunkt är detta emellertid en omvdg. Det sista steget i processen, ruta 27, är att ta tillbaka systemet till dess initiala konfiguration med anvdndande av den andra algoritmen. 10 I de ovan beskrivna exemplen har antagits att mjukvaruobjekten 1-18 inte styr nAgon hArdvaruutrustning. Exempel pA hArdvaruutrustning som styrs av mjukvarumoduler är I/O-anordningar, grdnssnitt mot abonnentlinje, processorer mot abonnentlinjer, tonavkodare, talbeskedsutrustningar, konferensutrustning. Hard- 15 varuberoenden av detta slag skapar restriktioner pA mjukvarumodulerna. En mjukvarumodul som är involverad i styrning av en hArdvaruutrustning som är ansluten till en eller flera processorer kan inte flyttas over till en godtycklig processor i systemet utan maste flyttas Over till en processor som har access 20 till denna hArdvaruutrustning. Katastrofplaner mAste skapas med detta i Atanke.
Ett telekomsystem kan vanligen fortsdtta sin drift trots for-lust av vissa organ men de tjdnster telekomsystemet tillhanda25 hAller kan hdmmas. • 17 • • •• • • • • • • • •• • • • • • Till den grad det är mojligt mAste sAledes en katastrofplan allokera organstyrande mjukvaruobjekt till processorer som har access till de styrda organen. Om detta inte är mOjligt mAste F-10 de modulariserade mjukvaruobjekten som styr organen uteslutas • ur katastrofplanen. Ett uteslutet mjukvaruobjekt är alltid av den typ som visas i Fig. 6C.
•• • • ••• •• • • •• •••• •• •••• •• • •• •• • • • • • • • • • •• ••• • ••• • • ••• •••• •• • • • • ••••• :• •• • • •• •• ••• •• •••• •• Fig. 6B illustrerar ett mjukvaruobjekt som innehAller en funktionsdel (exekveringsdel) och en del med persistent data (persistentdata-del). Mjukvaruobjektet i Fig. 6C innehAller 5 funktionsdelen av mjukvaruobjektet i Fig. 6B och mjukvaruobjek- tet i Fig. 6D innehAller persistentdata-delen av samma mjukvaruobjekt som visas i Fig. 6B. Mjukvaruobjekten i Fig. 6C och 6D bildar tillsammans ett par och de har samma nyckel. Nyckeln ax det i Fig. 6B visade mjukvaruobjektets logiska adress till 10 databasen och nyckeln kommer darfor aven att vara den logiska adressen till de tvA mjukvaruobjekten i Fig. 6C och 6D i databasen. Det är mjukvaruobjektet i Fig. 6C som styr en anordning. Det dr i detta mjukvaruobjekt som det finns ett hArdvaruberoende.
Ett exkluderat mjukvaruobjekt i en aktuell konfiguration mAste blockeras, d v s andra mjukvaruobjekt skall inte kunna kommunicera med det. I en foredragen utforingsform Astadkoms blockering genom att satta persistentdata-delen av mjukvaruobjektet i 20 Fig. 6D i blockerat tillstand. Ett blockerat tillstand markeras genom att stalla en flagga i mjukvaruobjektet. Det bor observeras att det inte är det organstyrande mjukvaruobjektet 6C som blockeras utan dess persistenta tvilling-mjukvaruobjekt i Fig. 6D. Genom att undersoka tillstAndet av ett mjukvaruobjekt innan 25 applikationen borjar kommunicera med mjukvaruobjektet kan ap- • • • " •plikationen hantera blockerade organ RA ett ordnat satt. • • • 18 • • • •• •• • • • •nsom ett alternativ till att blockera mjukvaruobjekt med s • •stand flagga i databasrepresentationen av mjukvaruobjektet kan r.8.0 mjukvaruobjektet blockeras i de adresstabeller som finns i de • •• ••• to • ••• •• • •• •• • • • • respektive processorernas operativsystem. Operativsystemet av en processor har en adresstabell till sina egna mjukvaruobjekt. 19 • .0 9 SOO :: t •• O. • 0.0 00. • • : 000:...I. • • 9 • • e .4..
•• • • • • • • ID 0 .0.. • 00.
Adresstabellerna anvands nar meddelanden skickas till operativsystemets mjukvaruobjekt.
I begreppet kvalite av en tjanst inkluderas det faktum att pro- 5 cessorerna i ett processorsystem kan vara av tva slag, feltoleranta processorer (FTP-processorer) och icke-FTP-processorer. En FTP processor, som vanligen innefattar dubbla processorer, fortsatter att exekvera sina jobb aven om det uppstar ett enkelt hardvarufel i den hardvara som FTP-processorn styr. Nar 10 felet uppstAr triggas ett alarm men programmet havererar inte. Med hjalp av organ, vilka inte beskrivs i foreliggande uppfinning eftersom de inte bildar flagon del av denna uppfinning, är det mOjligt att ta en FTP-processor ur tjanst, sá att de kan repareras, pA ett kontrollerat satt med anvandande av katastro- 15 fplanerna. De tjanster applikationen tillhandahaller kommer inte att avbrytas. SAsom ett exempel kan namnas att i ett telekomsystem kommer inga trafikstorningar att intraffa; pagaende koppel ej att brytas. SystemAterhamtning till foljd av borttagning av en FTP-processor kommer saledes inte att bryta levere- 20 rade tjanster. Genom att kombinera den fOreliggande uppfinningen med de ovan beskrivna FTP-processorerna, är det mojligt att Astadkomma mycket hog systemtillganglighet samt mycket hog tjanstetillforlitlighet nar hardvarufel intraffar. Kort sammanfattat är syftet med parametern tjanstekvalite att stOdja FTP- 25 processorer fOr programvara som kraver mycket hog tjanstetill- . • • . .forlitlighet. En FTP-processor kommer saledes att maskera ett •• internt hardvarufel men FTP-processorn maste repareras innan • • • • nya interna hardvarufel uppstar. • r.e.0 I Fig. 5 visas ett processor system likartat det i Fig. 1, var- • vid det forekommer ett nat Ni till vilket processorer P1-P4 har access och kan kommunicera med varandra. Ehuru ej visat i Fig. •• •• •• • • • • •• • • • • • • • 0 • • •• • • ••_ ••• •••• •••: .41% •••• •• • • •• • •• • ••• : • • • ••• ..• • • : • • •••• • • •• • •••• • • • :•• • ••• ••• 5 antas att mjukvaruobjekten 1-18 är distribuerade pa processoxerna P1-P4 pa samma satt som visas i Fig. 1. Vidare visas ett organ D1 vara ansluten till processorn Pl. Det finns ocksa ett andra nat N2 till vilket processorer P2 och P4 har access. En 5 organprocessor D6 är en anordning som anvands for att ansluta organ D2 och D3 till natet N2. Organprocessorn D6 styr saledes anordningarna D2 och D3. En annan organprocessor D7 ansluter anordningar D4 och D5 till natet N2 och styr saledes dessa. Det finns mjukvaruobjekt som ansluter anordningarna Dl, D2, D3 ... 10 D7 till processorsystemet. Sasom ett exempel antas mjukvaruob- jektet 1 styra organet Dl. Om P1 havererar kan ingen av processorerna P2-P4 styra organet Dl. Saledes kan objektet 1 inte flyttas Over till nagon av processorerna P2-P4. Vad betraffar organen D2-D7 galler emellertid att mjukvaruobjekt som 15 styr nagot eller nagra av dessa organ maste vara installerade pa en processor som kan kommunicera med dessa organ. Organen D2-D5 kan styras via natet N2 och saledes kan mjukvaruobjekt som styr nagot eller nagra av dessa organ installeras pa nagon av processorerna P2 och P4. Processorerna P1 och P3 kan daremot 20 inte komma i fraga. Sammanfattningsvis galler saledes att ett mjukvaruobjekt som ansluter hardvara till systemet maste installeras pa en processor som har access till denna hardvara.
Typiska exempel pa ett organ av slaget D1 är processorn P1 25 sjalv. Ett annat exempel är en hardvaruanordning, t ex en UART- • • • •• • anordning. Om processorn PI havererar eller cm den hardvaruanordning som processorn P1 styr havererar kan inte det mjukvaruobjekt som representerar processorn P1 eller ett mjukvaruobjekt som representerar den havererade hardvaran flyttas • • • • • • • •• • •• • • • • • • • . 00 Over till nagon av processorerna P2-P4 eftersom de sistnamnda ••• .. - • 4041 • • .094t •processorn Pl. Likval maste processorsystemet tolerera att PI " ••• • • • • • inte kan fá kontroll over den havererade hardvaran eller Over 21 ••• • •• ••••• • •• : •• •• •••••••: • ••• ••• • • : • •• •••• •••••••• •• •• :• .••••••• •• •••• • ••1: •• havererar om systemet skall vara redundant. Om det mjukvaruobjekt som representerar processorn P1 havererar maste det mjukvaruobjekt som representerar processorn P1 blockeras och att det inte kan accessas av nagot annat mjukvaruobjekt.
Betrakta Fig. 1. Varje processor Pl-P4 har varsitt objekt som beskriver processorn. Narmare bestamt representerar objekt 1 processorn P1, objekt 4 processorn P2, objekt 8 processorn P3 och objekt 13 processorn P4. Alla dessa hardvaruberoenden be- 10 skrivs exakt av den hardvarumodell pa vilken mjukvarumodellen i Fig. 7 är installerad. Saledes visar modellen att inget av dessa objekt 1, 4, 8 och 13 kan flyttas Over till flagon annan processor i systemet. Den fOrsta algoritmen arbetar pa hardvarumodellen med installerad mjukvara och kommer saledes att ta 15 hansyn till alla hardvaruberoenden nar den skapar nya katastrofplaner. Processorns 1 katastrofplan, visad i Tabell 1, kommer darfor att forbli densamma med undantag for att objektet 1 forsvinner. I katastrofplanen for processor 2 (Tabell 3) kommer objektet 4 att forsvinna och katastrofplanen for processorn 3 20 kommer objektet 8 att forsvinna. I katastrofplanen for processorn P4 kommer objektet 13 att forsvinna. Ett farre antal objekt an vad som beskrivits tidigare kommer saledes att finnas kvar pa de respektive processorerna nar en processor havererar. 25 Om t ex processorn P1 havererar maste objektet 1 blockeras mot • • •• • • access fran andra mjukvaruobjekt. Detta betyder att inga andra mjukvaruobjekt tillats kommunicera med mjukvaruobjektet 1.
Modellen enligt uppfinningen kommer alltid att latsas att sys- • • • •• • •• • • • • • temet ar i drift aven om hardvaruutrustning gar sonder och inte • ." • •kan kontrolleras av sitt eller sina mjukvaruobjekt. Om emeller- ". tid det pa den hogre niva i systemet visar sig att systemet 22 ••• • •• • •• •• •• :.••.'"•: • ••• ..• • • • • •••••••• •• • • •• • • • • ■•■•• •• • • ••• ••• inte är i drift, inte ens kan leverera tjdnster med nedsatt kvalite, dá är orsaken till detta att finna i bristande redundans och modellen kan inte dndra pa detta faktum. 5 I Fig. EA visas mjukvarumodellen av det modulariserade mjukvaruobjektet. Mjukvarumodellen bestar av en klass bendmnd configObj som har operationerna construct() och destruct(). Construct() och destruct() anvdnds for att skapa respektive doda ett enskilt moduldrt mjukvaruobjekt. Det moduldra mjuk- 10 varuobjektet har beskrivits ovan i samband med Fig. 6B-6D.
Det i Fig. 1 visade systemets hardvarumodell beskrivs med hanvisning till Fig. 8. Hardvarumodellen 30 beskriver de fysiska organen och deras platser i systemet. Hardvarumodellen 30 inne- 15 fattar en klass Processor 31 vilken alstrar objekt som representerar processorerna P1-P4, en klass CPPool 32 vilken genererar objekt som representerar ndtet Ni, en klass DevX 33 som genererar objekt vilka representerar natet N2 och en klass ConfigObj 34 som genererar objekt vilka representerar mjuk- 20 varuobjekten, visade i Fig. 6B, av de ovan ndmnda organen; inklusive organprocessorerna. Klassen ConfigObj 35 alstrar objekt som representerar mjukvaruobjekten av det modulariserade mjukvaruobjektet i Fig.6A men bildar inte nagon del av hardvarumodellen.
Modellen visar att processorerna är anslutna till Ni och till N2. Modellen visar ocksa att mjukvara som inte har nagra organ kan installeras pa alla processorer som kan anslutas till Ni, medan mjukvara som styr organ maste installeras pa processorer • • • •• • • • • • • • • •• • •• • • • • • • rsom kan anslutas till N2. Modellen definierar restriktionerna • • ••• • • ••• •• • •• ••• • • • • for vane hardvaruberoende mjukvaruobjekt. Genom att ansluta ConfigObj till DevX (Organ X) inkluderas inte bara hardvaru- 23 :"":: • .' ": • • •00 •00 00 0000 00 anordningarna i hardvarumodellen utan samtidigt installeras de organstyrande mjukvaruobjekten i modellen.
• • ••• •••••••••• •••• • •• •• • • • • • • • ••••III• IS• II... •• 11.•••• I;.11 • : •••••• ••• •••• Tabell 1 INITIAL KONFIGURATON PROCESSOR-ID OBJEKT-ID 1 1,2,3 2 4,5,6,7 3 8,9,10,11, 12 4 13, 14,15,16, 17, 18 Tabell 2 KATASTROFPLAN for processor 1(KP-P1) OBJEKT-ID PROCESSOR-ID 1 2 2 4 3 2 Tabell 3 KATASTROFPLAN for processor 2(KP-P2) OBJEKT-ID PROCESSOR-ID 4 1 3 6 3 7 4 • • • • • • 24 ••• ••••• •••••••: •••• •••••••• • •• • • • •• •• • •• •• : •• *.* ••• ..• • : • •••••••• • • • :•• ••• ••• Tabell 4 KATASTROFPLAN for processor 3(KP-P3) OBJEKT-ID PROCESSOR-ID 8 1 9 1 2 11 4 12 4 Tabell KATASTROFPLAN for processor 4(KP-P4) OBJEKT-ID PROCESSOR-ID 13 2 14 1 2 ' 16 1 17 2 18 1 • •• • • • • • ••• • • ••• ••••••••••••: •••••••• •• •• •• • •• ••• •••• • ••• • • • •• •• •• •• •• • • ••• 26 :*.• : •••••••• :•• ••• Tabell 6 AKTUELL KONFIGURATIONSTABELL nar processor 1 är trasig PROCESSOR-ID OBJEKT-ID 2 1, 3,4,5,6, 7 3 8, 9,10,11 12 4 2, 13, 14,15,16, 17, 18 Tabell 7 DELTAKONFIGURATION for processor 1 PROCESSOR-ID OBJEKT-ID 2 1,3, 3 - 4 2 •• • • • • • ••• • • • • :••• •• • • •• •• • •••• • •• • •• •• • •• •• •• • 27 • •• : •• •• 7 • ••• • • • •• •••••••• •• •• • •• • :•• • ••• ••• Tabell 8 Ny KATASTROFPLAN fOr processor 2(KP-P2' ) OBJEKT-ID PROCESSOR-ID 1 3 3 3 4 3 4 6 4 7 4 Tabell 9 • • • •• • •• • • • • • • •• • • • • • ••• • • ••• ••• • • • • Ny KATASTROFPLAN for processor 3(KP-P3' ) - OBJEKT-ID PROCESSOR-ID 8 2 9 2 4 11 4 12 4 • • • •• ••• • ••• • • •• ••• • •••• •• • • • • ••••• 28 4001• • • • • • • • • .• • •• • • •• •• 0 • • • Tabell Ny KATASTROFPLAN for processor 4(KP-4') OBJEKT-ID PROCESSOR-ID 2 2 13 2 14 2 2 16 3 17 3 18 3 Tabell 11 Ny AKTUELL KONFIGURATIONSTABELL nar processor 2 är trasig PROCESSOR-ID OBJEKT-ID 3 1, 3, 4, 8,9,10, 11, 12 4 2, 5, 6, 7, 13,14,15, 16, 17, 18 ••• VI%•••: •••• •••• •••• •••• • • • •• ••• • ••• • • •• •••• •••• •• • • • • ••••• : : 7..••••• •:•• •••

Claims (21)

PATENTKRAV 1. Mjukvarumodell for ett distribuerat processorsystem i ett mjukvarudrivet telekommunikationssystem, som innefattar saval- hardvara, daribland forsta processorer, andra organstyrande processorer och organ styrda av de andra processorerna som mjukvara kannetecknat av en i mjukvara framstalld modell av systemets hardvara som samverkar med en i mjukvara framstalld modell av systemnets mjukvara. 2. Mjukvarumodell enligt patentkrav 1, kannetecknad av att mjukvarumodellens mjukvara ar uppdelad i mjukvarumoduler, kallade mjukvaruobjekt, att mjukvarumodulerna är forsedda med egenskaper som gor dem flyttbara mellan processorer i processorsystemet, att mjukvarumodulerna är tilldelade individuella identiteter, att processorsystemet är uppdelat i individuella processorer, att vane processor uppvisar en egen identitet, samt att mjukvarumodulerna är installerade pa olika av namnda forsta och andra processorer for framstallande av en initial konfiguration. 3. Mjukvarumodell i enlighet med patentkrav 2, kannetecknat av att vane mjukvarumodul forses Atminstone tva funktioner, av vilka den ena skapar mjukvaruobjektet och den andra dodar mjukvaruobjektet. 29 1. • • 2. •• 3. • • 4. • 5. • • 6. •• 7. • •• • 8. • • 9. • 10. • ..... 11. • 4. Mjukvarumodell i enlighet med patentkrav 3, kannetecknat av att mjukvarumoduler som är oberoende av hardvara innefattar ett resursobjekt. 5. Mjukvarumodell i enlighet med patentkrav 1, kannetecknat av 1. . 2. • • .•. •att den initiala konfigurationen skapas genom att mjukvaruob- 3. • ••• •• 4. • 5. •• • ••• 6. • • 7. • • jekt, som exekverar pa enskild processor, mappas pa namnda ••• •• ••• ••• : • • •• ••• 00. •••• 8. • : •• •• •• • 9. • 10. • .• •••• ■■• 11. • enskilda processor och att namnda mappning upprepas for var och en av processorerna i processorsystmet. 6. Mjukvarumodell i enlighet med patentkrav kannetecknat av att omfOrdelningssteget innefattar skapande och start av de i enlighet med katastrofplanen fOr den havererade processorn omfordelade mjukvaruobjekten. 7. Mjukvarumodell i enlighet med patentkrav 6, kannetecknat av att forst omfOrdelas mjukvaruobjekt som styr hArdvaruutrustning, vilken den havererade processorn styr, och att ddrefter mjukvaruobjekt som inte styr hArdvaruutrustning omfordelas. 8. Mjukvarumodell i enligt patentkrav 7, lannetecknat av block- ering av mjukvaruobjekt som uppvisar ett hardvaruberoende och som exekverar pA en havererad processor mot access frAn mjukvaruobjekt som exekverar pa Ovriga driftsdugliga processorer i processorsystemet. 9. Mjukvarumodell i enligt patentkrav 8 lannetecknat av att en processor som har ett hardvaruberoende representeras av ett mjukvaruobjekt.
1. • •
2. • •
3. • •
4. • • • •• ••• • ••• • • •• -Go,.• ••••• •• •• •• ••••• : : •••••• :• • • ••• •• •• •••• •• SAMMANDRAG Ett forfarande for automatisk aterhamtning frail multipla perma5 nenta processorhaverier i ett distribuerat processorsystem, i synnerhet mjukvarudrivet telekommunikationsystem. Forfarandet innebar alstring av en initial konfiguration som beskriver var- je processor och mjukvaruobjekt som exekverar pa denna, samt, for varje processor, upprattande av en katastrofplan som skall 10 foljas i handelse av att processorn havererar. En katastrofplan innehaller information som anger hur de mjukvaruobjekt som exekverar pa den havererade processorn skall omfordelas pa funktionsdugliga processorer i systemet. Om en processor havererar flyttas dess mjukvaruobjekt till driftsdugliga processorer i enlighet med katastrofplanen for den havererade processorn. En hardvaru- och mjukvarumodell av processorsystemet och dess mjukvara beskrivs. Ett mjukvaruobjekt som bar ett hardvaruberoende hanteras av modellen. 31
5. •
6. • •
7. • •
8. • • • • •
9. •
10. • •
11. ••
12. • •• •
13. • •
14. •
15. • •• •
16. • •
17. • •
18. ••
19. •
20. • ••• :••::••• % it .••: •••.: :••:.::. •••::••: ••••••
21. • ••• • • :::: • ••: .• ::: 7 ..' : •••• ••••••
SE9703132A 1995-12-08 1997-08-29 Mjukvarumodell för en distribuerat processorsystem SE9703132D0 (sv)

Priority Applications (1)

Application Number Priority Date Filing Date Title
SE9703132A SE9703132D0 (sv) 1995-12-08 1997-08-29 Mjukvarumodell för en distribuerat processorsystem

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
SE9504396A SE515348C2 (sv) 1995-12-08 1995-12-08 Processorredundans i ett distribuerat system
SE9703132A SE9703132D0 (sv) 1995-12-08 1997-08-29 Mjukvarumodell för en distribuerat processorsystem

Publications (3)

Publication Number Publication Date
SE9703132L SE9703132L (sv)
SE9703132A0 true SE9703132A0 (sv) 1997-08-29
SE9703132D0 SE9703132D0 (sv) 1997-08-29

Family

ID=20400521

Family Applications (2)

Application Number Title Priority Date Filing Date
SE9504396A SE515348C2 (sv) 1995-12-08 1995-12-08 Processorredundans i ett distribuerat system
SE9703132A SE9703132D0 (sv) 1995-12-08 1997-08-29 Mjukvarumodell för en distribuerat processorsystem

Family Applications Before (1)

Application Number Title Priority Date Filing Date
SE9504396A SE515348C2 (sv) 1995-12-08 1995-12-08 Processorredundans i ett distribuerat system

Country Status (3)

Country Link
AU (1) AU1048897A (sv)
SE (2) SE515348C2 (sv)
WO (1) WO1997022054A2 (sv)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6029168A (en) 1998-01-23 2000-02-22 Tricord Systems, Inc. Decentralized file mapping in a striped network file system in a distributed computing environment
US6055227A (en) * 1998-04-02 2000-04-25 Lucent Technologies, Inc. Method for creating and modifying similar and dissimilar databases for use in network configurations for telecommunication systems
DE19836347C2 (de) 1998-08-11 2001-11-15 Ericsson Telefon Ab L M Fehlertolerantes Computersystem
US6449731B1 (en) 1999-03-03 2002-09-10 Tricord Systems, Inc. Self-healing computer system storage
US6725392B1 (en) 1999-03-03 2004-04-20 Adaptec, Inc. Controller fault recovery system for a distributed file system
US6530036B1 (en) * 1999-08-17 2003-03-04 Tricord Systems, Inc. Self-healing computer system storage
FI108599B (sv) * 1999-04-14 2002-02-15 Ericsson Telefon Ab L M Återhämtning i mobilkommunikationssystem
GB2359384B (en) * 2000-02-16 2004-06-16 Data Connection Ltd Automatic reconnection of partner software processes in a fault-tolerant computer system
US7715837B2 (en) * 2000-02-18 2010-05-11 Telefonaktiebolaget Lm Ericsson (Publ) Method and apparatus for releasing connections in an access network
US7058847B1 (en) * 2002-12-30 2006-06-06 At&T Corporation Concept of zero network element mirroring and disaster restoration process
US7287179B2 (en) 2003-05-15 2007-10-23 International Business Machines Corporation Autonomic failover of grid-based services
DE10328661A1 (de) * 2003-06-26 2005-01-13 Deutsche Telekom Ag Verfahren und System zur Organisation eines Telekommunikationsnetzwerkes in Ausnahmefällen

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4371754A (en) * 1980-11-19 1983-02-01 Rockwell International Corporation Automatic fault recovery system for a multiple processor telecommunications switching control
US4710926A (en) * 1985-12-27 1987-12-01 American Telephone And Telegraph Company, At&T Bell Laboratories Fault recovery in a distributed processing system

Also Published As

Publication number Publication date
WO1997022054A2 (en) 1997-06-19
SE9703132L (sv)
AU1048897A (en) 1997-07-03
SE515348C2 (sv) 2001-07-16
SE9504396L (sv) 1997-06-09
SE9504396D0 (sv) 1995-12-08
WO1997022054A3 (en) 1997-09-04
SE9703132D0 (sv) 1997-08-29

Similar Documents

Publication Publication Date Title
KR100326982B1 (ko) 높은 크기 조정 가능성을 갖는 고 가용성 클러스터 시스템 및 그 관리 방법
SE9703132A0 (sv) Mjukvarumodell för ett distribuerat processorsystem
US6154853A (en) Method and apparatus for dynamic sparing in a RAID storage system
JP3631442B2 (ja) アレイ記憶システム
US7412479B2 (en) Highly scalable and highly available cluster system management scheme
CN103942112B (zh) 磁盘容错方法、装置及系统
US9201747B2 (en) Real time database system
US8726261B2 (en) Zero downtime hard disk firmware update
US20010013104A1 (en) Loosely coupled mass storage computer cluster
JP2020021277A (ja) 情報処理システム、情報処理システムの管理方法及びプログラム
EP0521924B1 (en) Methods and apparatus for assigning signatures to members of a set of mass storage devices
JPH09231016A (ja) Raid記憶サブシステムにおけるデ−タのスナップショットコピ−作成方法とその装置
CN109819004A (zh) 用于部署多活数据中心的方法和系统
WO1997015942A9 (en) Loosely coupled mass storage computer cluster
EP3513296B1 (en) Hierarchical fault tolerance in system storage
CN110383251A (zh) 存储系统、计算机可读记录介质、系统的控制方法
US12013758B2 (en) Methods and systems for power failure resistance for a distributed storage system
CN104035836A (zh) 集群检索平台中的自动容灾恢复方法及系统
US9148430B2 (en) Method of managing usage rights in a share group of servers
US11868623B2 (en) Database management system with coding cluster and methods for use therewith
CN108833189A (zh) 一种存储节点管理系统及方法
CN112256201B (zh) 一种分布式块存储系统及其卷信息管理方法
Dell
CN103929320A (zh) 一种针对it系统灾难恢复的集成平台
JP3351469B2 (ja) 情報処理システム及びそれに用いるデータコピーを伴う障害処理方式

Legal Events

Date Code Title Description
NAV Patent application has lapsed

Ref document number: 9703132-2