WO2009010277A1 - Verfahren und vorrichtung zur administration von computern - Google Patents

Verfahren und vorrichtung zur administration von computern Download PDF

Info

Publication number
WO2009010277A1
WO2009010277A1 PCT/EP2008/005796 EP2008005796W WO2009010277A1 WO 2009010277 A1 WO2009010277 A1 WO 2009010277A1 EP 2008005796 W EP2008005796 W EP 2008005796W WO 2009010277 A1 WO2009010277 A1 WO 2009010277A1
Authority
WO
WIPO (PCT)
Prior art keywords
host computer
sensors
plug
card
network
Prior art date
Application number
PCT/EP2008/005796
Other languages
English (en)
French (fr)
Inventor
Lord Hess
Original Assignee
Certon Systems Gmbh
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Certon Systems Gmbh filed Critical Certon Systems Gmbh
Priority to US12/669,729 priority Critical patent/US8806278B2/en
Publication of WO2009010277A1 publication Critical patent/WO2009010277A1/de

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0748Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a remote unit communicating with a single-box computer node experiencing an error/fault
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2294Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing by remote test

Definitions

  • the invention relates to a method and a device for the administration of computers, in particular a method and a device in the field of remote maintenance of computer-aided systems and fault-tolerant autonomous systems.
  • the proposed solution according to the invention defines an intelligent, low-cost device that autonomously monitors all relevant system features and functions and reacts autonomously to conditions that could lead to dangerous operating conditions. This increases system availability while minimizing human intervention requirements.
  • DE 100 07 511 A1 relates to a method and a device for the remote maintenance of computers with master-capable bus.
  • the method known from DE 100 07 511 A1 is implemented on computers with a master-capable bus, in particular on personal computers (PCs), in which a computer serving maintenance purposes uses the computer to be maintained via a communication network and an intermediate control device in order to trigger activities there and to control these.
  • PCs personal computers
  • This access is made waiving software resources of the computer to be maintained, waiving its bus bound I / O areas and / or memory areas and / or configuration areas and / or its non-bus terminals of the control and / or connection panel.
  • the control device maps address areas of the computer to be maintained on address areas of their local bus and makes them available to the remote maintenance computer in a writable and / or readable manner.
  • the maintenance computer accesses the refresh memory of the computer to be maintained to visualize its status and / or activity.
  • the remote maintenance computer accesses bus-external connections of the control and connection field of the computer to be maintained, in order to set and / or to boot and / or to visualize the status of the sleep, standby, sleep, and / or sleep modes.
  • DE 100 07 511 A1 also discloses a device for remote maintenance of computers with master-capable bus, which are in particular personal computers.
  • These include first means having, in addition to a CPU, memory means and a local bus, a communication interface to a communication network connectable to a maintenance computer and a master-capable bus interface to the bus of the computer to be maintained.
  • Second means cause the first means to access the computer to be maintained in accordance with the remote maintenance computer's instructions transmitted over the communication network to initiate and control activities of the remote computer from the remote maintenance computer.
  • third means are provided which connect the first means to bus-external terminals of the control and / or terminal panel of the computer to be maintained, the second means, dispensing with software resources of the computer to be maintained, bound to the bus I / O areas and / or memory areas and / or configuration areas and / or non-bus ports.
  • Corresponding preventive measures can be events such. the early power down in the event of failure of a cooling infrastructure, the early detection of an impending failure of a hard disk, the verification and correct (re) configuration of the BIOS and the like.
  • Another functionality can be seen in the fact that an automatic detection of abnormal operating conditions and the automatic initiation of appropriate countermeasures is performed without the need of a system administrator intervene. In rare cases of hardware failure, the device is able to automatically identify and diagnose misconduct. This allows the generation of a detailed error report, which anticipates an on-site diagnosis and thus allows a targeted and thus cost-saving replacement of failed components.
  • plug-in cards that are able to export the local screen content via a device into a network.
  • the signals from the monitor, keyboard and mouse are exported via a communication channel, allowing remote access.
  • the abbreviation KVM stands for keyboard, video and mouse and identifies these plug-in cards.
  • a graphics card in the computer is available, which can be connected by means of an external cable to the plug-in card.
  • the signals are usually present on the graphics card as analog signals and must first be digitized by the plug-in card. Thereafter, they are transported via a proprietary, unpublished protocol to the administrator's workstation over the network.
  • Other plug-in cards are only able to enable a screen export only if this data has been prepared for the serial interface.
  • the present invention has for its object to increase the availability of a computer system and to simplify its maintenance.
  • an autonomously operating device which is preferably designed as a plug-in card, and a method implementable on this device, which is able to work in any computer-aided system.
  • the device includes open software interfaces and is thus easy to implement in existing computers, self-service terminals (self-service terminals), vending machines and maintenance environments. Even a necessary, necessary, complete replacement of a computer infrastructure does not change the - A -
  • Plug-in cards that support the IPMI standard are limited to a few computers and offer no active support for errors. With the IPMI standard, computers can be switched on and off remotely and monitoring can be performed.
  • IPMI-enabled cards and KVM plug-in cards extend the keyboard, video and mouse functionalities, without autonomous functionality, for example to improve the RAS (Reliability, Availability, Support).
  • RAS Reliability, Availability, Support
  • the abbreviation RAS stands for Reliability, Availability and Support, which means the availability of a
  • the inventively proposed device preferably designed as plug-in card, and easy in PC's, self-service terminals, ATMs with deposit or withdrawal function,
  • the plug-in card makes it possible, for example, to restart the host computer, and the plug-in card proposed according to the invention can be implemented as a firewall in the form of a hardware by connecting the network to the preferred device as a plug-in card by means of suitable wiring of the network ,
  • the inventively proposed, preferably designed as a plug-in device is included, filtered and infection and effective virus or Troyaner protection can be guaranteed.
  • remote computing units implemented e.g. operated on drilling rigs, wind turbines at sea or in inhospitable, difficult to access areas built pumping stations for gas pipelines or pipelines or the like remotely.
  • errors may be logged via the inventively proposed device to be designated as RAS optimizer, which is preferably in the form of a plug-in card, systems autonomously restarted as needed, and even, as far as possible, repaired independently of the operating system ,
  • FIG. 1 shows the schematic functional blocks of the device proposed according to the invention in the installed state
  • Figure 2 is a grosser overview of the individual components of the network. embodiments
  • FIG. 1 shows a schematic representation of the functional blocks of the device 72 proposed according to the invention, which is referred to below as RAS
  • the device 72 is in the illustration of Figure 1 in a
  • Integrated network is preferably implemented as a plug-in card and communicates with a host computer 74, a primary network port 64 for data exchange, e.g. with the Internet, as well as optionally via a secondary network port 65 for filtering the network, the host computer 74, or for implementing redundant
  • An optional additional graphics card 4 e.g. can be connected via a AGB bus, and a main processor 1, a working memory 2 communicate by means of a bus controller module 5, which is connected to a bus 7, with the device preferably designed as Einsteck badge 72.
  • This local bus 7 is typically both master and slave capable. However, only the slave functionality of the bus 7 is required for the pure KVM and remote maintenance functionality. For the extended. Features, such as the diagnostics of the host system 74, as further explained below, the master properties of the bus 7 are additionally required.
  • the plug-in card 72 communicates with the host computer 74.
  • Several types of communication are made possible via the bus 7.
  • an SNOOP unit of the plug-in card 72 identified by reference numeral 20 general, non-target-specific, transmitted data can be read from the bus 7 of the host computer 74 through the plug-in card 74.
  • Item 30 denotes a PCI, PCI-X or PCI Express slave unit of the plug-in card 72 with which bidirectional communication is established.
  • Position 35 denotes a bus master unit of the plug-in card 72 for the bus 7 of the host computer 74, which is provided by the plug-in card 72 itself.
  • This can control over take over the bus 7 of the host computer 74 and communicate directly with other devices that are connected to the bus 7 of the host computer 74.
  • Reference numeral 48 denotes the USB master / slave unit over which the device 72, which is preferably designed as a plug-in card, can simulate any USB devices, e.g. a keyboard, a CD-ROM drive, a mouse, a floppy drive and other devices.
  • the device 72 which is preferably designed as a plug-in card, can simulate any USB devices, e.g. a keyboard, a CD-ROM drive, a mouse, a floppy drive and other devices.
  • a generic input and output unit 47 further components can be connected, such as e.g. an on / off switch of the host computer 74, a reset switch or a serial connection to the host computer 74 or a serial connection to other self-sufficient systems such.
  • Money recognition and money counting systems in self-service terminals to give an example.
  • Reference numeral 41 designates a network connection with at least one connection with which the device 72, which is preferably designed as a plug-in card, can firstly be connected to a network and, on the other hand, data can be forwarded, e.g. to the network port of the host computer 74.
  • Numeral 60 designates an external power supply, which is e.g. internally provided a plurality of different redundant power supply units 61 supplied within the device preferably designed as a plug-in card 72 with voltage.
  • a processor 40 of the device 72 which is preferably designed as a plug-in card, accesses a non-volatile memory 45 (flash memory) by means of the master / slave-capable bus 7, which serves to exchange data within the device 72 preferably designed as a plug-in card. to, which contains the operating system and its configuration of the device preferably designed as a plug-in card.
  • the master / slave functionality having bus 7 is used to control all other components of the preferably designed as a plug-in device 72 via the
  • Processor 40 e.g. a graphics processor 34 and any other available graphics processors.
  • Sensors 73 which may be arranged on a sensor array to connect sensors 68, 69, 70.
  • the sensors 68, 69, 70 and 71 additionally include generic ones
  • Acceleration detectors, digital and analogue temperature sensors and detectors for example, a state "housing has been opened", sensors for detecting the Fan speed, noise sensors, such as microphones, vibration sensors and the like more; Furthermore, an interface 70 for transmitting and receiving EPMI data and control sequences and indicated by reference numeral 71, at least one terminal, for detecting the fan speed and optionally regulate intervene.
  • Data which is read in via the SNOOP unit 20 of the device 72 which is preferably in the form of a plug-in card, can be distinguished in a tracer unit 21 and a filter 24 depending on the type and subsequently via a first in / first out port 22 and a ridge In / First Out port 23, each of the tracer unit 21 and the filter 24 associated stored.
  • the tracer unit 21 of the device 72 which is preferably designed as a plug-in card, serves to be able to read commands, data and addresses, which are not intended for the device 72 preferably designed as a plug-in card, from the bus 7 of the host computer 74.
  • the purpose of the filter 24 is to read and evaluate generic error messages of the host computer 74.
  • the data differentiated in the tracer unit 21 or the filter 24 according to the data type are stored in the memories 22, 23 (principle FIFO) and are picked up from there at corresponding cycle times by the CPU (processor 40) and evaluated.
  • the processor 40 Via the master / slave-capable local bus 50, the processor 40 can access a drive unit 46 of a volatile memory 42, which represents the main memory.
  • the graphic unit identified by reference numeral 34 receives image data via the PCI, PCI-X or PCI Express slave unit of the device 72, which is preferably designed as a plug-in card, and configuration data from the control and status register 33 (graphics data FIFO).
  • the graphics processor 34 of the device 72 which is preferably designed as a plug-in card, fulfills all common graphics standards (VGAS, VGA and others).
  • the image data are evaluated in the processor 40 and possible error messages for export from the network (Ethernet, intranet or Internet) are converted via the network connection 41.
  • an interface to the administered hardware which operates independently of the hardware to be administered and has a minimal influence on the working operation of the hardware.
  • the main functions that need to be accessed are screen output, keyboard and mouse input, system reset (reset) signals, on / off signals, and various sensors for measuring voltage, temperature, Current consumption, supply voltage, fan speed, noise and other sensors at different points within the administered system, such as an ATM with deposit and / or payout function, as it is set up in financial institutions and publicly accessible places, point-of-sale terminals in supermarkets, gas station cash register systems, rigs, wind turbines at sea or on land, remote pipelines, pumping stations, gas compressor stations, etc.
  • the graphics functionality is particularly important to ensure the monitoring and control of operations of the operating system of the host computer 74 or the basic VO system (BIOS) in flash memory or non-volatile RAM, in the computerized system.
  • BIOS basic VO system
  • the preferred implementation is a resident graphics card in the PCI, PCI-X or PCI Express bus device.
  • the keyboard and mouse functionality is implemented as a minimally affecting USB subsystem. Many of the system parameters can be obtained by reading a desktop management interface (DMI) data structure; for guaranteed and extended functionality, additional sensors may be provided on the preferred device 72 as a plug-in card.
  • DMI desktop management interface
  • the intelligent and autonomous device 72 in this case includes a complete
  • Single-board computer 66 under an operating system such as e.g. Linux, which can be equipped with a non-volatile memory 45 (flash memory), and an Ethernet
  • the processor 40 boots from the non-volatile memory 45 with the aid of the drive unit 44 and initializes the volatile main memory 42 and the latter
  • Control unit 46 After a successfully completed hardware self-test and completely executed boot process, all corresponding necessary software processes are started and requests of one or more Ethernet connections are answered.
  • the device 72 which is preferably in the form of a plug-in card, can also be used by the host computer
  • BIOS-ROM 49 (virtual bootflash). The contents of this BIOS ROM
  • the host computer 74 which receives the device 72 preferably designed as a plug-in card according to the invention, comprises an interface which is provided by the bus 7.
  • the preferred embodied device 72 includes a set of registers used for communication with the host computer 74.
  • Several host computer 74 parameters such as system utilization, rage fault rate, that have occurred in memory 2 of host computer 74, and similar other data, are not directly available. Although this parameter may be recorded by the host computer 74 operating system, it is more convenient to manage and evaluate these parameters along with the device's own sensor data.
  • the necessary communication between the preferably designed as a plug-in card device 72 and the host computer 74 requires device drivers that work on the host computer 74 and thus are dependent on the operating system used. There are different ways to do this; from a simple mailbox principle to the implementation of a virtual network to the implementation of an encrypted private local network and a software process that answers the network requests. All methods query the values at certain time intervals in order to detect a failure on the host computer 74 as promptly as possible and to be able to initiate automatically remedial steps.
  • the Ethernet protocol is implemented for primary remote access. The access to preferably designed as a plug-in device 72 is ensured by software-internal security mechanisms and standardized security mechanisms.
  • the device 72 which is preferably designed as a plug-in card, is installed behind firewalls and is difficult to address directly.
  • the plug-in card 72 allows IP packet filters to be limited to certain MAC addresses.
  • an encrypted VPN tunnel (communication protocol for encrypting data) is provided, whereby the plug-in card 72 as a client establishes the connection to a defined server.
  • this connection does not persistently exist, but can be initiated as needed or can be set up at previously precisely defined times.
  • a control and status register 32 for the bus 7 of the host computer 74 are required, which are provided by the preferably designed as a plug-in card device 72 for the graphics unit 34. Furthermore, there is a memory 33 which manages graphics data according to the principle of first in / first out and the graphics processor 34 of the plug-in card 72.
  • the graphics card is to be identified by the BIOS (basic I / O system), whereby a minimum functionality is supported, eg at least the VGA graphic standard.
  • the solution proposed according to the invention with its optional functionalities implements the VGA standard at least as graphics standard and uses the generic bus interface 30 to the PCI, PCI-X or PCI Express slave unit of the device 72, which is preferably designed as a plug-in card
  • the graphic support is less in the speed and functionality of the graphics adapter, but in the simple remote access and the highest possible recognition rate within the host computer 74. For this reason, is implemented on the preferred designed as a plug-in card 72 device no special graphics memory, but it is rather a portion of the volatile memory 42, that is, a portion of the main memory used for the graphics data.
  • Each PCI, PCI-Express or PCI-X triggered access to the area of the volatile memory 42 in which the graphics data is stored traverses the local master / slave-enabled bus 50 for data exchange within the device preferably embodied as a plug-in card 72 and thus provides access to the volatile memory 42, ie to the main memory 42. To avoid conflicts, these accesses via a regulating unit 46, such as the drive unit of the volatile memory 42 out and administered accordingly.
  • the overall set of graphics control registers 33 is implemented as part of a PCI, PCI-Express or PCI-X subsystem for integration into the bus 7 of the host computer 74.
  • a minimal amount of hardware is required to run the graphics commands.
  • the commands are received by the Graphics CSR (Control and Status Register for controlling and reading hardware components) and processed by the processor 34, ie the graphics processor. Its CPU, on the one hand, generates the corresponding update of the graphic memory 43, which is implemented as an area within the volatile main memory 42.
  • a message queue with abstract commands is maintained, which keeps the processor of the plug-in card 72 informed about any changes occurring in the graphic and updated.
  • the graphics memory area 43 which is implemented as an area within a graphics-only area within the volatile memory 42, may also be accessed remotely, such as by implementing small server protocols, VNC or Remote Desktop.
  • the VNC server on the plug-in card 72 uses the graphics memory area 43 as a graphics buffer and exports the screen content to any standard VNC client or remote desktop.
  • the keyboard and the mouse of the host computer 74 can be controlled. It can be selected from a number of possible interfaces, such as a PS / 2 standard or the direct access to the corresponding control and status register CSR structures within the host computer 74. At least the latter method can cause problems because not at connected keyboard, the interface can be switched off by the basic I / O system (BIOS).
  • BIOS basic I / O system
  • Current computers currently support very general and widespread USB input interface.
  • the keyboard and mouse commands will be e.g. recorded by a VNC client and forwarded to the VNC server and the corresponding USB device driver.
  • the USB interface 48 of the device 72 which is preferably designed as a plug-in card, is connected to an internal or external bridging cable or directly to a USB interface of the host computer 74. At least one USB interface is required to support one or more USB multifunction devices.
  • USB standard allows connections with the ability to add additional dynamic devices at any time or remove devices that are no longer needed.
  • a virtual USB mass storage or a CD-ROM / DVD drive through the
  • Plug-in card 72 can be dynamically added to the system, with the appropriate
  • Devices are provided as a file which is located within the administration network on another server 100 which can collect and display information about a plurality of preferably plug-in devices 72 and for the preferably plug-in device 72 via the primary network connection 41
  • a monitoring system which manages a plurality of decentralized devices 72, preferably designed as plug-in cards. Their possibly transmitted error logs are stored there and to others within the monitoring system in others
  • the additional devices can be activated in "read” or "read-write” mode.
  • the size of the data memory is determined by the size of the file and is freely configurable.
  • a file may be transmitted by a host computer 74 through the interface 30 and addressed by another computer via the local network.
  • a USB mass storage device can be made available to the Basic I / O system at system startup and used to provide another operating system through plug-in cards 72, or to access another operating system if necessary.
  • An Ethernet interface 64 is given the standard interface intended for the implementation of remote maintenance, but other interfaces (such as UMTS, ISDN, etc.) may be used if this proves necessary. Also in this context, the USB standard is a generic interface that allows, with the corresponding device drivers, access to a wide variety of other external devices, which means their connection allows.
  • the device 72 preferably embodied as a plug-in card can under normal operating conditions internally obtain the necessary operating power from the host computer 74 in several different ways via a plurality of internally provided redundant power supply units 61.
  • the supply voltage can be obtained internally by the "stand-by" mode of the host computer 74.
  • This can be either by a wake-on-lan (WOL) connection, or a USB master connection or by a connection "stand-by" Furthermore, it is possible to supply the device 72, which is preferably designed as a plug-in card, by a battery or a rechargeable battery which can be charged by the host computer 74, to thereby possibly shorter power failures to bridge.
  • WOL wake-on-lan
  • USB master USB master
  • stand-by it is possible to supply the device 72, which is preferably designed as a plug-in card, by a battery or a rechargeable battery which can be charged by the host computer 74, to thereby possibly shorter power failures to bridge.
  • the preferably designed as a plug-in card device 72 is in the external standard cable looped in, that is electrically connected. This is made possible, for example, by a "Y-bridging cable” or a plug to the plug-in card 72.
  • the device 72 which is preferably in the form of a plug-in card, supports a number of different sensors in order to observe different operating states of the computer-aided system or of the host computer 74 and to point out impending failures at an early stage.
  • a standard set of sensors is already implemented on the plug-in card 72 or on an external sensor board 66.
  • the standard set of sensors 68, 69 allows the measurement of temperature or fan speeds, to name two examples.
  • the temperature of plug-in card 72 itself is measured by a sensor near the power supply.
  • the plug-in card 72 allows additional sensors to be added by simple expansion cards.
  • the additional sensors are managed by a microprocessor and communicate via the generic input and output unit 47 with the plug-in card 72.
  • the following sensors are currently available:
  • Temperature sensors for specific measuring points in the host computer 74 include high performance add-on cards, power supplies, fan cooling fans, vibration meters, smoke detectors, etc .;
  • the tachometer signals may also be capacitively achieved by simply pairing a sensor wire or a corresponding sensor antenna with the tachometer signal. The original wiring of the host computer 74 is not changed here.
  • Noise sensors such as microphones, to detect certain unusual noises, including the rotors of hard drives and fans whose bearings have worn out, and could thus indicate a speedy failure; Sensors for detecting a possible failure of redundant power supply units.
  • an internal supply voltage reference signal is passed out from each redundant network. These signals are connected to the device 72's internal ADC. Should a power supply fail, the host computer 74 will continue to run, but the corresponding reference signal will disappear, allowing the device 72 to respond quickly.
  • motion sensors are to be mentioned with which it can be detected whether a computer-aided system or a host computer 74 has been physically moved.
  • the measured values of all sensors 68, 69 listed above by way of example are measured periodically and compared with previously stored reference values. If one of the measured values falls below or exceeds a previously programmed threshold value, this is transmitted to a centralized system 100 by the device 72, which is preferably in the form of a plug-in card. If this problem can not be remedied by the system 100 itself, appropriate measures can be initiated by the apparatus 72, which help prevent permanent damage to the host computer 74. In the simplest case, this host computer 74 is turned off.
  • the mass storage media in computer systems is one of the places that are often affected by outages. This is partly due to the relatively frequent data access and partly due to the fact that these media have moving parts.
  • the lifetime of a hard disk is influenced mainly by the operating temperature. Many hard drives therefore have factory-installed internal sensors to measure the operating status. However, the reading out of files is only possible in practice through targeted additional software, which is often manufacturer-specific or not available for every operating system.
  • the inventively proposed, preferably designed as plug-in card device 72 (RAS optimizer) allows own sensors 68, 69 to read out important status information from hard drives externally. For this purpose, a temperature sensor and a microphone can be mechanically connected directly to the hard disk.
  • Hot swap housings In the event that "hot swap" housings are used, the sensors are mounted on the connectors with a spring system to ensure a direct and firm fit on the hard disk.
  • "Hot swap" housing refers in this context to a housing that the removal of hard disks during operation of a computer system allows. This mounting form thus allows independent measurement of the temperature and noise emission of a hard disk. Due to the direct contact of the Microphones with the hard disk do not cause the ambient noise to significantly affect the noise level to be measured. It is sufficient if the sound is recorded for only a short time (only a few seconds) and then the spectrum is analyzed by a Fast Fourier Transformation (FFT) in the processor 40. Any mechanical deviation will lead to a change in the noise spectrum and thus allow the detection of an approaching failure.
  • FFT Fast Fourier Transformation
  • IPMI Intelligent Platform Management Interface
  • a dedicated interface 70 for sending and receiving IPMI-relevant data and taxiing sequences is implemented on at least one expansion unit 66 for connecting further sensors or drive units, which has a functionality similar to the Has sensor extensions.
  • a corresponding database for the parameters of specific host computers 74 as well as those of IPMI protocols has been set up and maintained.
  • the guest system represented by the host computer 74 in which the preferred plug-in card 72 is installed, produces a number of boot messages that are output to the standardized port 80, the filter 24.
  • These transactions ie bus-relevant transactions, represent broadcasts which are output by the host computer 74 without flow control with a terminal on the bus 7 of the host computer 74 and which are read from the plug-in card 72 via the SNOOP unit 20.
  • the SNOOP unit 20 has the task, as described above, of recording general, non-destination-specific data from the bus 7 of the host computer 74.
  • the respective coding of the messages provided for the filter 24 (port 80) is not standardized and therefore manufacturer-specific.
  • a corresponding information-receiving database is periodically updated so that the correct associations are ensured in order to generate automatic interpretations of the messages.
  • the respectively detected port 80-relevant messages, ie messages that are intended for the filter 24 are listed by the preferred designed as a plug-in device 72, stored and provided for analysis.
  • the SNOOP unit 20 Via the SNOOP unit 20, which could also be referred to as a read-only unit, a configuration is possible such that this SNOOP unit 20 records PCI or PCI-X signals and states corresponding to them, and thus a PCI signal recorder in the Sense of a tracer works. Similar to Filter 24 (equivalent to Port-80 Scanner), the PCI, PCI Express, or PCI-X signals are held in internal memories.
  • Corresponding triggering states (triggers) for addresses or data values on the address line of the bus 7 can be implemented very simply, so that the plug-in card 72 can also function as a low-level bus monitor or debugging unit. Because of this property, any activity on the host computer 74 which relates to the peripheral bus 7 can be recorded without affecting operation. In each case, the bus traffic can be recorded, which is sent on the same PCI, PCI Express or PCI-X bus segment.
  • Position 35 denotes a bus master unit of the apparatus 72 for the bus 7 of the host computer 74, which is provided by the plug-in card 72.
  • the interface 35 is not required for remote maintenance functionality, but may be used to access any hardware expansion of the host computer 74.
  • Memory tests in the memory 2 of the host computer 74 are performed directly on the host computer 74.
  • Corresponding drivers can be loaded and loaded onto the components in the host computer.74.
  • the plug-in card 72 assumes host functionality by turning off the processor of the host computer 74 so that it does not interfere with the communication. So it is e.g.
  • the correct basic I / O system (B ⁇ OS) configuration of the host computer 74 is a prerequisite for the correct functioning and successful completion of the
  • BIOS Basic I / O system
  • HBD USB Human Interface Devices
  • the USB boot process can be used to update the basic I / O system (BIOS) with manufacturer updates and keep them there. If the BIOS itself is no longer functional, the host computer 74 can not start. In this case, the bus master interface 34 can be used for recovery.
  • the bus master 35 allows direct reading and writing to all devices, including the BIOS flash memory installed on the host computer 74.
  • BIOS flash memory of the host computer 74 allows a detailed examination of its contents and the configuration compared to already set settings. This procedure is orders of magnitude faster than the method described above by means of HID (Human Interface Device) -USB. If the BIOS operating system should be completely inoperable, this read / write capability can be used to rewrite the BIOS flash memory of the host computer 74 through the plug-in card 72.
  • the programming sequences for the BIOS flash memory are usually well documented and follow a standardized procedure.
  • a multi-port Ethernet bridge 41 can optionally be used.
  • the use of a multi-port Ethernet bridge 41 supports several functions: first, the network of the host computer 74 can be directly connected and thus a local subnet can be generated, which has a connection to the outside world and at least two internal interfaces 64, 65 for the host computer. Calculator 74 and the plug-in card 72 has. With this method, it may be necessary to configure the upstream network components accordingly.
  • the plug-in card 72 can be used as a hardware-implemented firewall of the computer, since the plug-in card 72 analyzes each data packet intended for the host computer 74 and examines for viruses, harmful software, Trojans, etc.
  • the disadvantage of this method is the fact that both units share the same physical network connection, which can lead to access conflicts.
  • the plug-in card 72 supports an encrypted VPN connection, which eliminates this disadvantage.
  • Another typical configuration is, for example, the installation of a large number of host computers 74 with associated plug-in cards 72, for example in a 19-inch cabinet.
  • An option is a local switch for the network of a number of plug-in cards 72 decentralized arranged, the switch then connects via redundant ports to higher network layers.
  • the plug-in cards 72 are interconnected in a computer cabinet. This is done by pairing the devices 72, preferably embodied as plug-in cards, over the Ethernet bridge 41. Typically, the beginning and the end of the chain are connected to the superordinate network layer for redundancy, with the plug-in card 72 being configured to interrupt the chain, to prevent a network loop. In the event of a failure in the chain, the breaker bridge will be moved to the last position accessible from both sides. This configuration is checked by periodically running software processes and adjusted automatically if necessary. The configuration is equivalent to the version with separate switches, as long as less than two cards or network connections are disturbed.
  • Ethernet bridge 41 allows an elegant implementation of additional security aspects on the host computer 74, since all data packets of the host computer 74 pass through the Ethernet bridge 41. A packet filtering mechanism is implemented on each network layer without affecting the host computer 74 or even installing additional software on the system. In addition, the host computer 74 does not have to be assigned security task.
  • the plug-in card 72 is typically set up to allow very secure and limited access. In addition, the configuration can be made static by setting the flash configuration memory 44 as read-only, that is, operating unidirectionally.
  • Reference numeral 65 denotes a second network connection of the RAS optimizer 72 proposed according to the invention, preferably designed as a plug-in card. This is the host computer 74 is connected.
  • the second network port 65 of the host computer 74 is connected to the second network port 65.
  • the path in the other direction is analogous, ie the data or data packets that are determined for the host computer 74 are routed via the primary network port 74 to the RAS optimizer 72, checked there and optionally via the further second network port 64th transmitted to the host computer 74.
  • Tunnel design such as VPN connections to defined computers or networks.
  • Host computer 74 and there is also no way for host computer 74 to directly change any security or network-related configuration unless it is made by network 100.
  • the Ethernet bridge 41 also referred to as a network bridge, allows the complete separation of the security and network infrastructure from the configuration of the host computer 74.
  • a corresponding monitoring functionality can be implemented that eliminates any potential threat to the guest, whether through viruses or others Malware recognizes and independently initiates countermeasures, such as restricting the blocking of the affected host computer 74 from the network or its access or access.
  • a host computer 74 may not boot. In most cases, this is caused by various errors of the startup or basic I / O system parameters.
  • a checksum error in the BIOS configuration normally requires user intervention by initiating an HID (eg, the keyboard) to restore or reconstruct BIOS parameters based on historical parameters.
  • HID eg, the keyboard
  • Many other startup problems can be eliminated directly by resetting the machine.
  • the plug-in card 72 dictates the reset counter of the Start the process. In the event of a startup error, which leads to the stoppage of the starting process, countermeasures are automatically initiated by the device 72, which is preferably designed as a plug-in card, in order to restore the system to the operating state.
  • the host computer 74 is configured to remain off when power is restored.
  • the plug-in card 72 starts automatically if it has not been kept in operation by a UPS (Uninterruptible Power Supply) device. Since the plug-in card 72 (RAS optimizer) has at least one nonvolatile mass memory 45 (flash), interrupted start processes usually have no negative influence.
  • UPS Uninterruptible Power Supply
  • the plug-in card 72 After the switch-on process, the plug-in card 72 begins to check the power supply and if this is stable for a defined period of time, the power supply for the host computer 74 is switched on. In larger scenarios, the plug-in card 72, through an auto-negotiation scheme, ensures that only a predetermined number of host computers 74 can be powered on at a time. This switch-on scheme takes into account the existing infrastructure of the power supply in terms of performance and segmentation.
  • the graphics function of the RAS optimizer 72 is implemented as a combination of a freely programmable processor 34 and software drivers executing commands of the overall system and writing the corresponding data to the graphics memory 43.
  • the command queue 24 serves to Generic error messages from the host computer 74 read and evaluate.
  • the plug-in card 72 does not have to search the entire graphics memory, ie the area reserved for the graphics data in the volatile memory 42, but gets all commands directly. This mode is particularly advantageous when the graphics output is in ASCII mode, and the commands can be interpreted directly. Also in other graphics modes, the plug-in card (RAS optimizer) can read 72 update commands directly and, for example, limit the updating only to partial areas of the graphics memory 43.
  • a text message should be in the graphics command, it can be read by reading the pixels in the graphics memory and interpreting them with OCR (Optical Character Recognition) software. This reduces the graphics content to the actual text message.
  • OCR Optical Character Recognition
  • This method has the advantage over standard OCR methods that the interpretation of the direct digital graphics has no distortions or smudges and the area in which the text lies is already known. Furthermore, it is not necessary to re-search the entire graphics page to decode individual letters or short word sequences, which drastically reduces the overhead of OCR calculation.
  • the device 72 which is preferably a plug-in card, automatically produces an ASCH output stream for all graphics outputs containing text passages.
  • a particular character may be recognized at its constant update sequence, thus providing a way to perform intelligent word matching using the CPU 34, i. of the graphics processor 34 of the plug-in card 72.
  • This can be implemented either by a microprogram or as an extended coprocessor instruction.
  • new fonts should occur, their pattern can be recognized by the OCR functionality and the list of known word patterns can be supplemented with the newly added patterns.
  • the device 72 preferably designed as a plug-in card, can adapt to each character set and graphic text in a type of learning mode. The generated text may then be based on predefined words or terms such as e.g. Kernel panic or fatal error.
  • the memory 2 may be restored to a predefined secure communication status
  • all relevant diagnostics information and system statuses of the system for fault diagnostics are output for example, to the monitoring system, which makes these error logs accessible to other RAS optimizers 72, so as to generate a learning system, corresponding messages or bursts indicative of the crash of the host computer 74, are escalated and the host computer 74 is automatically restarted after performing a complete self-test.
  • the plug-in card 72 supports - as already stated above several times - a hierarchical system analysis.
  • the port-80 functionality of the filter 24 and the PCI bus master mode 35 may include any important host computer hardware component 74 including the BIOS flash memory and the dynamic memory 42, i. of the volatile memory are tested for their operating condition.
  • Each error at this level is either automatically repaired (eg BIOS CRC error) or, if the error can not be remedied automatically (eg errors in the SEVI memory), a detailed error report is output so that the system administrator has to create without own diagnoses which can replace the defective components directly.
  • the host computer 74 may be instructed to load a test operating system.
  • the normal boot device such as an internal hard disk or a network interface, is started by a virtualized by the plug-in card 72 drive.
  • a proven medium for such a test operating system is - to give an example - KNOPPIX, which allows the start of a complete Linux system without changing the start parameters of the host computer 74. After starting the test operating system, a series of test routines are started.
  • tests include the detailed check of memory 2, reading all blocks of disks, comparing startup parameters with stored reference parameters, the testing of network connections and the test of all additional hardware components.
  • the use of an independent operating system allows for detailed testing and error diagnostics of the hardware infrastructure of the host computer 74 under the supervision and management of the plug-in card 72. After a successful test and possible repairs, the system is restarted. Here, the results of the previously performed self-test are recorded. This functionality is not only suitable for troubleshooting, but also for quality control or virus scanning can be performed in the host computer 74.
  • the next step of commissioning is the installation of the host computer 74.
  • the system parameters such as MAC address and process identification are known. These parameters are used to automatically register the host computer 74 with the network infrastructure.
  • the Basic VO system is configured and an installation agent is started or initialized via the USB mass storage functionality. This agent initiates the disks, copies the selected software, and then personalizes them. Thereafter, the start of the host computer 74 takes place with the internal operating system.
  • the sequence in the implementation of acceptance test, configuration and installation is fully automated and it is only the installation and wiring of the plug-in card 72 itself necessary.
  • the plug-in card 72 (RAS optimizer) includes at least one serial port for tapping activities on a serial channel.
  • RAS optimizer includes at least one serial port for tapping activities on a serial channel.
  • other sensors that are addressed via a serial protocol, to the inventively proposed RAS optimizers in the form of a plug-in card 72 are connected.
  • the screen output is redirected to the serial console.
  • the plug-in card 72 can function as a multifunction device with a virtual USB chipset and a simultaneous graphics card.
  • the USB slave interface simulates a connection with the HID-USB. If supported by the host computer 74, the device will be detected during the boot phase and integrated into the system.
  • Another functionality that can be adopted by the plug-in card 72 is that of a host network interface. The device acts as a generic PCI, PCI Express or PCI-X network card, which forwards all network traffic to its private interface. In this mode it may be necessary to use operating system dependent drivers.
  • a temperature exceeding the set, predetermined limit value can be detected.
  • the speed of a fan can be increased in order to achieve a lowering of the temperature and send via the monitoring system 100 corresponding information.
  • the monitoring system 100 may send corresponding information either via e-mail or via the issuing of an SMS to a system administrator and requests the connected RAS optimizers 72, if necessary, to shut down the host computer or computers 74 in order to avoid further damage.
  • the plug-in card 72 will inform the system administrator accordingly and, depending on the specification, a self-test of the at least one host computer 74 or the host computer. This is done by the plug-in card 72 starting a test operating system on the at least one host computer 74 and testing the individual hardware components, eg CPUs, memory units and the like. A resulting test report is provided to the administrator on the workstation 101 and in case of a hardware defect, the defective component is named. If, on the other hand, there is no hardware defect, the operating system of the at least one host computer 74 is autonomously renewed, as required, and the application programs are reinstalled.
  • the plug-in card 72 will inform the system administrator accordingly and, depending on the specification, a self-test of the at least one host computer 74 or the host computer. This is done by the plug-in card 72 starting a test operating system on the at least one host computer 74 and testing the individual hardware components, eg CPUs, memory units and the like. A resulting test report is provided to the administrator on the workstation
  • the autonomously operating plug-in card is enabled to draw conclusions about new interfering factors:
  • an excess temperature determined by means of a temperature sensor, of a storage medium, e.g. a hard disk, as well as on the detection of a changed background noise, which via a sound sensor, such. a microphone can be detected, within a host computer 74 can be closed to an approaching hard drive failure and, as a precaution, a backup on this particular hard drive can be started.
  • Host computer which are provided by the apparatus for the graphics unit
  • Non-volatile memory that can hold data without power 46
  • Control unit of the volatile memory
  • microprocessor to process sensor data additional generic interface with digital and analog inputs and outputs

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Debugging And Monitoring (AREA)

Abstract

Die Erfindung bezieht sich auf ein Verfahren und eine Vorrichtung (72) Diagnose und Fernsteuerung eines Host-Rechners (74), insbesondere eines in ein Netzwerk eingebundenen Rechners mit einem lokalen Bus (50). Die Vorrichtung (72) umfasst einen Netzwerkanschluss (41), über den eine bidirektionale Datenübertragung aus dem Netzwerk an und in das Netzwerk durch den Host-Rechner (74) erfolgt.

Description

Verfahren und Vorrichtung zur Administration von Computern
Technisches Gebiet
Die Erfindung bezieht sich auf ein Verfahren und eine Vorrichtung zur Administration von Computern, insbesondere ein Verfahren und eine Vorrichtung im Bereich der Fernwartung computergestützter Systeme und fehlertoleranter autonomer Systeme. Die erfindungsgemäß vorgeschlagene Lösung definiert eine intelligente preiswerte Vorrichtung, die autonom alle relevanten Systemeigenschaften und Funktionen überwacht und selbstständig auf Bedingungen reagiert, die zu gefährlichen Betriebsbedingungen führen könnten. Dadurch wird die Systemverfügbarkeit erhöht mit gleichzeitiger Minimierung von menschlichem Interventionserfordernis.
Stand der Technik
DE 100 07 511 Al bezieht sich auf ein Verfahren und eine Vorrichtung zur Fernwartung von Computern mit masterfähigem Bus. Das aus DE 100 07 511 Al bekannte Verfahren wird an Computern mit einem masterfähigen Bus implementiert, so insbesondere an Personalcomputern (PC's), bei denen ein Wartungszwecken dienender Computer über ein Kommunikationsnetz und eine zwischengeschaltete Steuervorrichtung auf den fernzuwartenden Computer zurückgreift, um dort Aktivitäten auszulösen und diese zu kontrollieren. Dieser Zugriff erfolgt unter Verzicht auf Softwareressourcen des fernzuwartenden Computers, unter Verzicht auf dessen Bus gebundener I/O-Bereiche und/oder Speicherbereiche und/oder Konfigurationsbereiche und/oder dessen busfremde Anschlüsse des Bedien- und/oder Anschlussfeldes. Die Steuervorrichtung bildet Adressbereiche des fernzuwartenden Computers auf Adressbereiche ihres lokalen Busses ab und stellt diese dem fernen Wartungscomputer schreibbar und/oder lesbar zur Verfügung. Der Wartungscomputer greift auf den Bildwiederholspeicher des fernzuwartenden Computers zu, um dessen Status und/oder Aktivitäten sichtbar zu machen. Des weiteren greift der ferne Wartungscomputer auf busfremde Anschlüsse des Bedien- und Anschlussfeldes des fernzuwartenden Computers zu, um diesen in den Ar- beit-, Standby-, Schlaf- und/oder Ausmodus zu versetzen und/oder zu booten und/oder dessen Status sichtbar zu machen.
DE 100 07 511 Al offenbart darüber hinaus eine Vorrichtung zur Femwartung von Computern mit masterfähigem Bus, bei denen es sich insbesondere um Personalcomputer handelt. Diese umfassen erste Mittel, die neben einer CPU, Speichermitteln und einem lokalen Bus eine Kommunikationsschnittstelle zu einem mit einem Wartungscomputer verbindbaren Kommunikationsnetz und einer masterfähigen Busschnittstelle zum Bus des fernzuwartenden Computers aufweisen. Zweite Mittel veranlassen die ersten Mittel, entsprechend der über das Kommunikationsnetz übertragenen Anweisungen des fernen Wartungscomputers auf den fernzuwartenden Computer zuzugreifen, um vom fernen Wartungscomputer aus Aktivitäten des fernzuwartenden Computers auszulösen und zu kontrollieren. Es sind bedarfsweise dritte Mittel vorgesehen, die die ersten Mittel mit busfremden Anschlüssen des Bedien- und/oder Anschlussfeldes des fernzuwartenden Computers verbinden, wobei die zweiten Mittel unter Verzicht auf Softwareressourcen des fernzuwartenden Computers auf dessen Bus gebundene I/O-Bereiche und/oder Speicherbereiche und/oder Konfigurationsbereiche und/oder busfremde Anschlüsse zugreifen.
Es existiert eine Reihe von Parametern, die bei geeigneter Überwachung benutzt werden können, um Hardware und Daten durch präventive Maßnahmen zu schützen. Entsprechende präventive Maßnahmen können dabei Ereignisse, wie z.B. die zeitige Stromabschaltung im Falle des Ausfalls einer Kühlungsinfrastruktur, die frühzeitige Erkennung eines nahenden Ausfalls einer Festplatte, die Verifizierung und korrekte (Re)Konfigurierung des BIOS und ähnliches sein. Eine weitere Funktionalität ist darin zu erblicken, dass eine automatische Erkennung von abnormalen Betriebszuständen und die automatische Einleitung entsprechender Gegenmaßnahmen vorgenommen wird, ohne dass ein Systembetreuer einzugreifen braucht. In den selten eintretenden Fällen des tatsächlichen Ausfalls von Hardware ist das Gerät in der Lage, das Fehlverhalten automatisch zu identifizieren und zu diagnostizieren. Dies erlaubt die Generierung eines detaillierten Fehlerberichtes, die eine Vorort-Diagnose vorwegnimmt und somit einen zielgerichteten und damit Kosten sparenden Austausch ausgefallener Komponenten ermöglicht.
Es gibt eine Reihe von Produkten, die einige der oben genannten Funktionalitäten in bestimmten Bereichen abdecken. Dies erfolgt jedoch typischerweise nur in Verbindung mit einer sehr spezifischen auf das jeweilige Endgerät ausgerichteten Hard- und Softwareimplementierung.
Es gibt Einsteckkarten, die in der Lage sind, den lokalen Bildschirminhalt über eine Vorrichtung in ein Netzwerk zu exportieren. Bei diesen werden die Signale von Monitor, Tastatur und Maus über einen Kommunikationskanal exportiert und ermöglichen somit einen Remote-Zugriff. Die Abkürzung KVM steht für Keyboard, Video und Maus und kennzeichnet diese Einsteckkarten. Dazu ist eine Grafikkarte im Rechner vorhanden, die mittels eines externen Kabels mit der Einsteckkarte verbunden werden kann. Die Signale liegen an der Grafikkarte in der Regel als analoge Signale vor und müssen von der Einsteckkarte zuvor digitalisiert werden. Danach werden sie mittels eines proprietären, nicht-veröffentlichten Protokolls zum Arbeitsplatz des Administrators über das Netzwerk transportiert. Weitere Einsteckkarten sind nur in der Lage, einen Bildschirmexport ausschließlich dann zu ermöglichen, wenn diese Daten für die serielle Schnittstelle aufbereitet wurden.
Die Möglichkeit, Tastatureingaben über das Netzwerk als lokale Eingabe vor Ort zu emulieren, wird von den existierenden Lösungen derzeit auf zweierlei Arten gelöst: Zum einen muss der Tastaturausgang des Rechner mit einem Eingang der Steckkarte verbunden sein, was eine externe Verkabelung notwendig macht; andererseits können Vorrichtungen und Hilfsmittel im Rechner, in dem die Einsteckkarte eingebaut wird, bereits vorhanden sein, um dort die IPMI-Umbebung zu schaffen. Zurzeit ist jedoch nur ein Bruchteil der Rechner aus Kostengründen IPMI-Standard-fähig.
Offenbarung der Erfindung
Der vorliegenden Erfindung liegt die Aufgabe zugrunde, die Verfügbarkeit eines Computersystems zu erhöhen und dessen Wartung zu vereinfachen.
Erfindungsgemäß wird ein autonom arbeitendes Gerät vorgeschlagen, welches bevorzugt als eine Steckkarte ausgeführt ist, sowie ein an diesem Gerät implementierbares Verfahren, welches in der Lage ist, in jedem computergestützten System zu arbeiten. Das Gerät umfasst offene Software-Schnittstellen und ist damit einfachst in bereits bestehende Rechner, Selbstbedienungsterminals (SB-Terminal), Automaten und Wartungsumgebungen zu implementieren. Selbst eine erforderliche, notwendige, vollständige Auswechslung einer Rechnerinfrastruktur zieht keine Änderung der - A -
Wartungsinfrastruktur nach sich, wenn das Gerät mit der entsprechenden neuen Hardware installiert wird.
Es ist eine Vielzahl von Techniken und Geräten auf dem Markt erhältlich, die ansatzweise zumindest einen Fernzugriff auf Rechner erlauben. Steckkarten, die den IPMI-Standard unterstützen, sind auf wenige Rechner beschränkt und bieten keinerlei aktive Unterstützung bei Fehlern. Beim IPMI-Standard können Rechner aus der Ferne ein- und ausgeschaltet werden sowie ein Monitoring durchgeführt werden. Es sind Produkte der Firma Peppercon bekannt, die ebenfalls, um ihre volle Funktionalität entfalten zu können, auf den IPMI-Standard zurückgreifen. Diese ermöglichen in der Regel ein Ein- und Ausschalten des Rechners aus der Ferne, dies bedeutet von einem anderen Ort aus, als dem Ort, an der Rechner aufgestellt und/oder eingebaut ist sowie im begrenzten Umfang das Messen einfacher Parameter wie z.B. Spannung oder Temperatur. Im Fehlerfall wird keines der oben genannten Produkte aktiv und behebt automatisch Fehler. Auch kann kein derzeit am Markt erhältliches Produkt Komponenten, die extern an den Rechner angeschlossen werden, wie z.B. Drucker oder Sprechanlagen in Fahrkartenautomaten und sonstige SB-Serviceautomaten einbinden.
Zusammenfassend erweitern IPMI-fähige Karten sowie KVM-Einsteckkarten die Tastatur-, Video- und Maus-Funktionalitäten, ohne autonome Funktionalität, zum Beispiel zur Verbesserung der RAS- (Reliability, Availability, Support). Die Abkürzung RAS steht für Reliability, Availability und Support, was bedeutet, dass die Verfügbarkeit eines
Rechners um so höher ist, je umfassender im RAS-Standard vorgegebenen
Qualitätsmerkmale bzw. Funktionalitäten ermöglichen, oder anders ausgedrückt, desto geringer die Ausfallwahrscheinlichkeit eines derartigen Rechners anzusetzen ist. Mit dem erfindungsgemäß vorgeschlagenen Gerät, welches bevorzugt als Einsteckkarte ausgeführt ist, wird einerseits ein Fernzugriff auf einen mit der erfindungsgemäß vorgeschlagenen, bevorzugt als Einsteckkarte ausgebildeten Gerät versehenen Rechners ermöglicht und andererseits dessen Verfügbarkeit hinsichtlich einer Selbstdiagnose der Ausgabe eines Fehlerprotokolls des Ein- und Ausschaltens durch Wiederholung von Startversuchen verbessert. Das erfindungsgemäß vorgeschlagene Gerät greift dann autonom ein, wenn am
Host-Rechner ein Fehler oder instabiler Zustand auftritt oder aufgetreten ist.
Das erfindungsgemäß vorgeschlagene Gerät, bevorzugt als Einsteckkarte ausgeführt, und einfach in PC's, SB-Terminals, Geldautomaten mit Ein- oder Auszahlungsfunktion,
Kassenautomaten, Tanksäulen und dergleichen implementierbar ermöglicht, die
Sicherheitsstandards zu implementieren, die ein VPN-Netzwerk liefert. Des weiteren ist über das erfindungsgemäß vorgeschlagene Gerät in Form einer Einsteckkarte außer dem Zugriff auf Ein- und Ausschaltmodi des betreffenden Terminals mit Rechnerteil auch ein Zugriff auf das Betriebssystem (BIOS) des Host-Rechners möglich, d.h. des Rechners oder der Recheneinheit, an dem/der das erfindungsgemäß vorgeschlagene, bevorzugt als Einsteckkarte ausgebildete Gerät eingesteckt, angebracht oder auf eine andere Weise angeschlossen ist. Durch die Einsteckkarte wird z.B. der Wiederstart des Host-Rechners ermöglicht, ferner kann die erfindungsgemäß vorgeschlagene Einsteckkarte eine als Hardware beschaffene Firewall implementiert werden, indem durch eine geeignete Verkabelung des Netzwerk derart mit dem bevorzugt als Einsteckkarte ausgebildeten Gerät verbunden ist, dass alle aus dem Netzwerk, z.B. dem Internet an den Host-Rechner, an dem erfindungsgemäß vorgeschlagene, bevorzugt als Einsteckkarte ausgebildete Gerät aufgenommen ist, gefiltert werden und eine Infizierung und ein wirksamer Viren- oder Troyaner-Schutz gewährleistet werden kann.
Auch die Informationen, die aus dem mit dem erfindungsgemäß vorgeschlagenen, bevorzugt als Einsteckkarte beschaffenen Gerät versehenen Rechner in das Netzwerk z.B. das Internet übertragen werden, werden über das Gerät in Form einer Einsteckkarte gefiltert. Durch diese Lösung, können z.B. fernab von menschlichem Zugriff implementierte Recheneinheiten z.B. auf Bohrinseln, Windrädern auf See oder in unwirtlichen, nur schwer zugänglichen Landstrichen aufgestellte Pumpstationen für Gasleitungen, Pipelines oder dergleichen per Fernzugriff bedient und überwacht werden. Insbesondere können Fehler, ohne dass ein menschlicher Eingriff notwendig wäre, über das erfindungsgemäß vorgeschlagene als RAS-Optimierer zu bezeichnende Gerät, das bevorzugt in Form einer Einsteckkarte ausgebildet wird, protokolliert und Systeme bei Bedarf wieder autonom gestartet und sogar, soweit möglich, betriebsystemunabhängig repariert werden.
Kurze Beschreibung der Zeichnungen
Anhand der Zeichnungen wird die Erfindung nachstehend eingehend beschrieben.
Es zeigt:
Figur 1 die schematischen Funktionsblöcke des erfindungsgemäß vorgeschlagenen Geräts im eingebauten Zustand,
Figur 2 einen gröberen Überblick über die einzelnen Komponenten des Netzwerks. Ausführungsformen
Der Darstellung in Figur 1 sind in schematischer Wiedergabe die Funktionsblöcke des erfindungsgemäß vorgeschlagenen Gerätes 72 zu entnehmen, was im Folgenden als RAS-
Optimierer bezeichnet wird. Das Gerät 72 ist in der Darstellung gemäß Figur 1 in ein
Netzwerk integriert, wird bevorzugt als Einsteckkarte ausgeführt und kommuniziert mit einem Host-Rechner 74, einem primären Netzwerkanschluss 64 zum Datenaustausch, z.B. mit dem Internet, sowie optional über einen sekundären Netzwerkanschluss 65 zur Filterung des Netzwerkes, des Host-Rechners 74 oder zur Implementierung redundanter
Netzwerkanbindungen der erfindungsgemäß vorgeschlagenen Einsteckkarte 72.
Eine optional zusätzliche Grafikkarte 4, die z.B. über einen AGB-Bus angebunden werden kann, sowie ein Hauptprozessor 1, ein Arbeitsspeicher 2 kommunizieren mittels eines Buscontrollerbausteins 5, der an einen Bus 7 angeschlossen ist, mit dem bevorzugt als Einsteckkarte beschaffenen Gerät 72. Eine optionale zusätzliche Grafikkarte 3, kann über den Bus 7, der als PCI-, PCI-X- oder PCI-Express-Bus ausgeführt ist, an den Host-Rechner 74 angebunden sein und direkt über diesen Bus 7 von dem bevorzugt als Einsteckkarte ausgebildeten Gerät 72 aus angesprochen werden. Dieser lokale Bus 7 ist typischerweise sowohl Master- als auch Slave-fähig. Allerdings wird für die reine KVM und Fernwartungsfunktionalität nur die Slave-Funktionalität des Busses 7 benötigt. Für die erweiterten. Features, wie zum Beispiel die Diagnostik des Hostsystems 74, wie im Folgenden weiter erläutert, werden die Master-Eigenschaften des Busses 7 zusätzlich benötigt.
Mittels einer zum Bus 7 des Host-Rechners 74 kompatiblen Schnittstelle sowie über eine USB Master-/Slave-Einheit 48 kommuniziert die Einsteckkarte 72 mit dem Host-Rechner 74. Über den Bus 7 werden mehrere Arten von Kommunikation ermöglicht. Des Weiteren kann über eine durch Bezugszeichen 20 identifizierte SNOOP Einheit der Einsteckkarte 72 erreicht werden, dass allgemeine, nicht zielspezifische, gesendete Daten vom Bus 7 des Host-Rechners 74 durch die Einsteckkarte 74 mitgelesen werden können.
Position 30 bezeichnet eine PCI-, PCI-X- oder PCI-Express-Slave-Einheit der Einsteckkarte 72, mit der eine bidirektionale Kommunikation aufgebaut wird. Position 35 bezeichnet eine Busmaster-Einheit der Einsteckkarte 72 für den Bus 7 des Host-Rechners 74, der von der Einsteckkarte 72 selbst bereitgestellt wird. Über die Busmaster-Einheit 35 des bevorzugt als Einsteckkarte ausgeführten Gerätes 72 kann dieses die Kontrolle über den Bus 7 des Host-Rechners 74 übernehmen und direkt mit weiteren Geräten, die an den Bus 7 des Host-Rechners 74 angeschlossen sind, kommunizieren.
Durch Bezugszeichen 48 ist die USB Master/Slave-Einheit bezeichnet, über die das bevorzugt als Einsteckkarte ausgeführte Gerät 72 beliebige USB-Geräte zu simulieren vermag, so z.B. eine Tastatur, ein CD-ROM Laufwerk, eine Maus, ein Diskettenlaufwerk (Floppy) und weitere Geräte.
Mittels einer generischen Ein- und Ausgabeeinheit 47 können weitere Komponenten angeschlossen werden, wie z.B. ein Ein-/Ausschalter des Host-Rechners 74, ein Reset- Schalter oder eine serielle Verbindung zum Host-Rechner 74 oder eine serielle Verbindung zu weiteren autarken Systemen wie z.B. Gelderkennungs- und Geldzählsystemen in SB- Terminals, um ein Beispiel zu nennen.
An der generischen Ein- und Ausgabeeinheit 47 können weitere Serviceprozessoren oder -sensoren angeschlossen werden. Bezugszeichen 41 bezeichnet einen Netzwerkanschluss mit mindestens einem Anschluss, mit welchem das bevorzugt als Einsteckkarte ausgeführte Gerät 72 zum einen an ein Netzwerk angeschlossen werden und andererseits Daten weitergeleitet werden können, so z.B. zum Netzwerkanschluss des Host-Rechners 74. Bezugszeichen 60 bezeichnet eine externe Energieversorgung, welche z.B. intern vorgesehene mehrere verschiedene redundante Energieversorgungseinheiten 61 innerhalb des bevorzugt als Einsteckkarte ausgeführten Gerätes 72 mit Spannung versorgt. Ein Prozessor 40 des bevorzugt als Einsteckkarte ausgeführten Gerätes 72 greift mittels des Master-/Slave-fähigen Busses 7, der dem Datenaustausch innerhalb des bevorzugt als Einsteckkarte ausgeführten Gerätes 72 dient, und mittels einer Ansteuereinheit 44 auf einen nichtflüchtigen Speicher 45 (Flash-Speicher) zu, welcher das Betriebssystem und dessen Konfiguration des bevorzugt als Einsteckkarte ausgebildeten Gerätes enthält.
Der Master-/Slave-Funktionalität aufweisende Bus 7 dient der Ansteuerung sämtlicher weiterer Komponenten des bevorzugt als Einsteckkarte ausgeführten Gerätes 72 über den
Prozessor 40, so z.B. einen Grafikprozessor 34 und gegebenenfalls vorhandene weitere
Sensoren 73, die auf einem Sensorfeld angeordnet sein können, um Sensoren 68, 69, 70 anzuschließen. Die Sensoren 68, 69, 70 und 71 umfassen zusätzlich generische
Schnittstellen mit digitalen und analogen Ein- und Ausgängen, zum Anschluss beliebiger Sensoren 68, 69 als Anschlüsse für Mikrofon, Vibrationsmelder, Rauchmelder,
Beschleunigungsmelder, digitale und analog arbeitende Temperatursensoren und Melder, die z.B. einen Zustand „Gehäuse wurde geöffnet", Sensoren zur Erfassung der Lüfterdrehzahl, Geräuschsensoren, z.B. Mikrophone, Erschütterungssensoren und dergleichen mehr, anzeigen können; des Weiteren eine Schnittstelle 70 für das Senden und Empfangen von EPMI-Daten und Kontrollsequenzen und angedeutet durch Bezugszeichen 71, mindestens einen Anschluss, zur Erfassung der Lüfterdrehzahl und gegebenenfalls regulierend einzugreifen. Daten, die über die SNOOP-Einheit 20 des bevorzugt als Einsteckkarte ausgeführten Gerätes 72 eingelesen werden, können in einer Tracer-Einheit 21 und einem Filter 24 je nach Typus unterschieden werden und anschließend über einen First In/First Out-Port 22 sowie einen First In/First Out-Port 23, jeweils der Tracer-Einheit 21 bzw. dem Filter 24 zugeordnet, gespeichert werden. Die Tracer-Einheit 21 des bevorzugt als Einsteckkarte ausgeführten Gerätes 72 dient dazu, Kommandos, Daten und Adressen, die nicht für das bevorzugt als Einsteckkarte ausgeführten Gerät 72 bestimmt sind, vom Bus 7 des Host-Rechners 74 lesen zu können. Der Filter 24 hat die Aufgabe, generische Fehlermeldungen des Host-Rechners 74 lesen und auswerten zu können.
Wie bereits erwähnt, werden die in der Tracer-Einheit 21 bzw. dem Filter 24 nach Datentyp unterschiedenen Daten in den Speichern 22, 23 (Prinzip FIFO) gespeichert und von dort zu entsprechenden Taktzeiten von der CPU (Prozessor 40) abgeholt und ausgewertet. Über den Master-/Slave-fähigen lokalen Bus 50 kann der Prozessor 40 auf eine Ansteuereinheit 46 eines flüchtigen Speichers 42 zugreifen, der den Arbeitsspeicher darstellt.
Die durch Bezugszeichen 34 identifizierte Grafikeinheit erhält Bilddaten über die PCI-, PCI-X- oder PCI-Express-Slave-Einheit des bevorzugt als Einsteckkarte ausgeführten Gerätes 72 sowie Konfigurationsdaten vom Kontroll- und Statusregister 33 (FIFO für Grafikdaten). Der Grafikprozessor 34 des bevorzugt als Einsteckkarte ausgeführten Gerätes 72 erfüllt alle gängigen Grafikstandards (VGAS, VGA und weitere). Die Bilddaten werden im Prozessor 40 ausgewertet und mögliche Fehleranzeigen für einen Export aus dem Netzwerk (Ethernet, Intranet oder Internet) über den Netzwerkanschluss 41 umgewandelt.
Um eine generische, intelligente Administrierung eines Netzwerks bzw. eines Computers zu erlauben, ist es wünschenswert, eine Schnittstelle zur administrierten Hardware zu definieren, die unabhängig von der zu administrierenden Hardware operiert und einen minimalen Einfluss auf den Arbeitsbetrieb der Hardware hat. Die wichtigsten Funktionen, auf welche dabei zugegriffen werden muss, sind die Bildschirmausgabe, die Tastatur sowie Eingabe die mittels der Maus vorgenommen werden, Systemrückstellungssignale (Reset), Ein-/Aus-Signale und verschiedene Sensoren zur Messung von Spannung, Temperatur, Stromaufnahme, Versorgungsspannung, Lüfterdrehzahl, Geräuschen sowie weitere Sensoren an unterschiedlichen Stellen innerhalb des administrierten Systems, wie z.B. eines Geldautomaten mit Ein- und/oder Auszahlungsfunktion, wie er in Geldinstituten und öffentlich zugänglichen Stellen aufgestellt ist, Kassenterminals in Supermärkten, Tankstellenkassensysteme, Bohrinseln, Windrädern auf See oder zu Lande, abgelegene Pipelines, Pumpstationen, Gasverdichterstationen etc.
Die Grafikfunktionalität ist dabei insbesondere von Bedeutung, um die Überwachung und Kontrolle von Operationen des Betriebssystems des Host-Rechners 74 oder des Basic VO- Systems (BIOS) im Flash-Speicher oder non-volatile RAM, in dem rechnergestützten System zu gewährleisten. Dabei wird als bevorzugte Implementierung eine residente Grafikkarte im PCI-, PCI-X- oder PCI-Express-Bus-Gerät eingesetzt. Die Tastatur- und Mausfunktionalitäten sind als minimal beeinflussendem USB-Untersystem implementiert. Viele der Systemparameter können durch Auslesen einer Desktop-Management-Interface (DMI) Datenstruktur erhalten werden; für eine garantierte und erweiterte Funktionalität können zusätzliche Sensoren auf dem bevorzugt als Einsteckkarte ausgeführten Gerät 72 vorgehalten sein.
Das erfindungsgemäß vorgeschlagene bevorzugt als Einsteckkarte ausgeführte Gerät 72 kann z.B. als Singleboard-Computer 66 ausgebildet sein (SBC = Einplatinen-Computer).
Das intelligente und autonome Gerät 72 beinhaltet in diesem Falle einen kompletten
Einplatinen-Computer 66 unter einem Betriebssystem wie z.B. Linux, welches mit einem nichtflüchtigen Speicher 45 (Flashspeicher), ausgestattet sein kann und eine Ethernet-
Schnittstelle als eine primäre externe Schnittstelle aufweist. Neben Ethernet können auch eine Reihe weiterer anderer Protokolle zur externen Verbindung wie z.B. ISDN, GPRS, etc. implementiert sein. Der Prozessor 40 bootet mit Hilfe der Ansteuereinheit 44 vom nichtflüchtigen Speicher 45 und initialisiert den flüchtigen Hauptspeicher 42 sowie dessen
Ansteuereinheit 46. Nach erfolgreich absolvierten Hardware-Selbsttest und vollständig durchgeführtem Bootprozess werden alle entsprechenden notwendigen Softwareprozesse gestartet und Anfragen einer oder mehrerer Ethernetverbindungen beantwortet.
Das bevorzugt als Einsteckkarte ausgeführte Gerät 72 kann dem Hostrechner ebenso ein
BIOS-ROM 49 (virtuelles Bootflash) zur Verfügung stellen. Der Inhalt dieses BIOS ROMs
49 (virtuelles Bootflash) ist dabei ein reservierter Speicherbereich im flüchtigen Speicher 42 (dynamischer Speicher), der durch die bereits erwähnte Ansteuereinheit 46 gesteuert ist. Der Host-Rechner 74, welcher das erfindungsgemäß vorgeschlagene bevorzugt als Einsteckkarte ausgeführte Gerät 72 aufnimmt, umfasst eine Schnittstelle, die durch den Bus 7 gegeben ist. Das bevorzugt als Einsteckkarte ausgeführte Gerät 72 umfasst einen Satz von Registern, die für die Kommunikation mit dem Host-Rechner 74 benutzt werden. Mehrere Parameter des Host Rechners 74 wie z.B. die Systemauslastung, die Rate der Seitenfehler (rage fault rate), die im Speicher 2 des Host-Rechners 74 aufgetreten sind und ähnliche weitere Daten, sind nicht direkt verfügbar. Dieser Parameter können zwar vom Betriebssystem des Host-Rechners 74 aufgezeichnet werden, es ist jedoch sinnvoller, diese Parameter zusammen mit geräteeigenen Sensordaten zu verwalten und auszuwerten. Die dazu notwendige Kommunikation zwischen dem bevorzugt als Einsteckkarte ausgeführten Gerät 72 und dem Host-Rechner 74 erfordert Gerätetreiber, die auf dem Host-Rechner 74 arbeiten und somit vom jeweils eingesetzten Betriebssystem abhängig sind. Es gibt unterschiedliche Möglichkeiten, um dies zu gewährleisten; angefangen von einem einfachen Briefkastenprinzip über die Implementierung eines virtuellen Netzwerkes bis zur Implementierung eines verschlüsselten privaten lokalen Netzwerks und einen Softwareprozess, der die Netzwerkanfragen beantwortet. Alle Methoden fragen die Werte in bestimmten Zeitintervallen ab, um einen Ausfall auf dem Host-Rechner 74 möglichst zeitnah zu detektieren und um automatisch fehlerbehebende Schritte einleiten zu können. Im bevorzugt als Einsteckkarte ausgeführten Gerät 72 ist das Ethernetprotokoll für den primären Fernzugriff implementiert. Der Zugang zum bevorzugt als Einsteckkarte ausgeführten Gerät 72 ist dabei durch softwareinterne Sicherheits-Mechanismen und standardisierte Sicherheits-Mechanismen gewährleistet. In der Regel ist das bevorzugt als Einsteckkarte ausgeführten Gerät 72 hinter Firewalls installiert und nur schwer direkt ansprechbar. Um den derzeit höchsten Sicherheitsstandard zu gewährleisten, erlaubt die Einsteckkarte 72 die Unterstützung von IP-Paketfiltern zur Beschränkung auf bestimmte MAC-Adressen. Für den Fernzugriff ist ein verschlüsselter VPN-Tunnel (Kommunikationsprotokoll zur Verschlüsselung von Daten) vorgesehen, wobei die Einsteckkarte 72 als Klient die Verbindung zu einem definierten Server aufbaut. Als zusätzlicher Sicherheitsaspekt ist vorgesehen, dass diese Verbindung dabei nicht andauernd besteht, sondern bei Bedarf initiiert werden kann bzw. zu vorher genau festgelegten Zeiten aufgebaut werden kann.
Zur Sicherstellung der vollen Funktionsfähigkeit eines rechnergestützten Systems sind ein Kontroll- und Statusregister 32 für den Bus 7 des Host-Rechners 74 erforderlich, die vom bevorzugt als Einsteckkarte ausgeführten Gerät 72 für die Grafikeinheit 34 bereitgestellt werden. Des Weiteren gibt es einen Speicher 33, der nach dem Prinzip First In/First Out Grafikdaten verwaltet sowie den Grafikprozessor 34 der Einsteckkarte 72. Die Grafikkarte ist jeweils vom BIOS (Basic I/O-System) zu identifizieren, wobei eine minimale Funktionalität unterstützt wird, so z.B. mindestens der VGA-Grafikstandard. Die erfindungsgemäß vorgeschlagene Lösung mit ihren optionalen Funktionalitäten implementiert mindestens als Grafikstandard den VGA-Standard und benutzt die generische Bus-Schnittstelle 30 zur PCI-, PCI-X- oder PCI-Express-Slave-Einheit des bevorzugt als Einsteckkarte ausgeführten Gerätes 72. Der Schwerpunkt der Grafikunterstützung liegt hierbei weniger in der Geschwindigkeit und Funktionalität des Grafikadapters, sondern in dem einfachen Fernzugang und der höchstmöglichen Erkennungsrate innerhalb des Host-Rechners 74. Aus diesem Grunde ist auf dem bevorzugt als Einsteckkarte ausgeführten Gerät 72 kein spezieller Grafikspeicher implementiert, sondern es wird vielmehr ein Bereich des flüchtigen Speichers 42, d.h. ein Bereich des Hauptspeichers für die Grafikdaten verwendet. Jeder PCI-, PCI-Express- oder PCI-X-getriggerte Zugriff auf den Bereich des flüchtigen Speichers 42, in dem die Grafikdaten abgelegt sind, durchquert den lokalen Master-/Slave-fähigen Bus 50 zum Datenaustausch innerhalb des bevorzugt als Einsteckkarte ausgeführten Gerätes 72 und stellt damit einen Zugriff auf den flüchtigen Speicher 42, d.h. auf den Hauptspeicher 42 dar. Um Konflikte zu vermeiden, werden diese Zugriffe über eine Regulierungseinheit 46, so zum Beispiel die Ansteuereinheit des flüchtigen Speichers 42 geführt und entsprechend administriert.
Der Gesamtsatz der Grafik-Controll-Register 33 ist als ein Teil eines PCI-, PCI-Expressoder PCI-X Untersystems zur Einbindung in den Bus 7 des Host-Rechners 74 implementiert. Es ist ein minimaler Hardwareaufwand für die Ausführung der Grafikkommandos erforderlich. Die Kommandos bzw. Befehle werden vom Grafik-CSR (Control and Status Register zur Ansteuerung und Auslesung von Hardwarekomponenten) empfangen und von dem Prozessor 34, d.h. dem Grafikprozessor verarbeitet. Dessen CPU generiert zum einen die entsprechende Aktualisierung des Grafikspeichers 43, der als Bereich innerhalb des flüchtigen Hauptspeichers 42 implementiert ist. Andererseits wird eine Nachrichten-Warteschlange mit abstrakten Kommandos gepflegt, die den Prozessor der Einsteckkarte 72 über evtl. auftretende Änderungen bezüglich der Grafik informiert und aktualisiert hält. Um die Geschwindigkeit für Grafik-Schreibzugriffe zu erhöhen, können mehrere Grafikkommandos zusammengefasst werden und an die PCI-, PCI- Express- oder PCI-X-Buseinheit 7 weitergegeben werden. Um die Lesezugriffe zu optimieren, werden die jeweils zuletzt aus dem Grafikspeicher 43 gelesenen Daten von dem Grafikprozessor 34 mit entsprechenden Adresslokationen zwischengespeichert (Cache-Modus). Auf den Grafikspeicherbereich 43, der als ein Bereich innerhalb einer nur für Grafik bestimmten Bereich innerhalb des flüchtigen Speichers 42 implementiert ist, kann auch aus der Feme so z.B. durch Implementierung von kleinen Serverprotokollen, VNC oder Remote Desktop, zugegriffen werden. Der VNC-Server auf der Einsteckkarte 72 benutzt den Grafikspeicherbereich 43 wie ein Grafikpuffer und exportiert den Bildschirminhalt an jeden Standard- VNC-Klienten oder das Remote Desktop.
Um eine vollständige Kontrolle über den Host-Rechner 74 zu haben, insbesondere einen Zugriff auf das Basic I/O-System (BIOS), ist es erforderlich, dass die Tastatur und die Maus des Host-Rechners 74 angesteuert werden kann. Dabei kann aus einer Reihe möglicher Schnittstellen gewählt werden, wie etwa einem PS/2 Standard oder dem direkten Zugriff auf die entsprechende Kontroll- und Statusregister CSR-Strukturen innerhalb des Host-Rechners 74. Zumindest die letztgenannte Methode kann zu Problemen führen, da bei nicht angeschlossener Tastatur die Schnittstelle vom Basic I/O-System (BIOS) abgeschaltet werden kann. Von aktuellen Rechnern wird derzeit sehr allgemeine und weit verbreitete USB Eingabe-Schnittstelle unterstützt. Die Tastatur- und Mauskommandos werden dabei z.B. durch einen VNC-Klienten aufgenommen und an den VNC-Server und den entsprechenden USB-Gerätetreiber weitergegeben. Die USB Schnittstelle 48 des bevorzugt als Einsteckkarte ausgeführten Gerätes 72 ist dabei mit einem internen bzw. externen Überbrückungskabel oder direkt mit einer USB-Schnittstelle des Host-Rechners 74 verbunden. Zur Unterstützung eines oder mehrerer USB-Multifunktionsgerätes ist dabei mindestens eine USB-Schnittstelle erforderlich.
Der USB-Standard erlaubt Verbindungen mit der Möglichkeit, jederzeit dynamische weitere Geräte hinzuzufügen oder nicht mehr benötigte Geräte zu entfernen. So kann z.B. ein virtueller USB-Massenspeicher oder ein CD-ROM/DVD-Laufwerk durch die
Einsteckkarte 72 dynamisch zum System hinzugefügt werden, wobei die entsprechende
Gerätefunktionalität auf der Einsteckkarte 72 aktiviert wird. Die Daten des addierten
Gerätes werden als Datei bereitgestellt, die auf einem anderen Server 100, der Informationen über mehrere bevorzugt als Einsteckkarte ausgeführte Geräte 72 sammelt und anzeigen kann, innerhalb des Administrationsnetzwerkes liegt und für das bevorzugt als Einsteckkarte ausgeführte Gerät 72 über den primären Netzwerkanschluss 41 zum
Datenaustausch, vergleiche Position 64, zugänglich sind. Im Administrationsnetzwerk ist z.B. ein Überwachungssystem vorgesehen, der mehrere dezentrale, bevorzugt als Einsteckkarte ausgeführte Geräte 72 verwaltet. Deren ggf. übersandte Fehlerprotokolle werden dort gespeichert und an andere innerhalb des Überwachungssystems in anderen
Rechnersystemen installierten Einsteckkarten 72 aktualisiert, sodass ein aus einzelnen Fehleφrotokollen einzelner Einsteckkarten 72 lernendes System entsteht, was die jeweils aus einzelnen Fehler im Wege der Fehlerprotokollübermittlung gelernten Fehler an andere Einsteckkarten 72 übermittelt.
Die zusätzlichen Geräte können dabei im „Lese"- bzw. „Lese-Schreib"-Modus aktiviert werden. Die Größe des Datenspeichers wird dabei durch die Größe der Datei bestimmt und ist frei konfigurierbar. Eine Datei kann von einem Host-Rechner 74 durch die Schnittstelle 30 übermittelt werden und von einem anderen Rechner über das lokale Netzwerk angesprochen werden. Ein USB-Massenspeicher kann dem Basic I/O-System beim Systemstart zugänglich gemacht werden und dazu benutzt werden, um durch Einsteckkarten 72 bei Bedarf ein anderes Betriebssystem bereitzustellen, oder auf ein anderes Betriebssystem ggf. zuzugreifen.
Eine Ethernet-Schnittstelle 64 ist die für die Implementierung einer Fernwartung vorgesehene Standardschnittstelle gegeben, es können aber auch andere Schnittstellen (so z.B. UMTS, ISDN, etc.) benutzt werden, falls dies sich als erforderlich herausstellen sollte. Auch in diesem Kontext stellt der USB-Standard eine generische Schnittstelle dar, die mit den entsprechenden Gerätetreibern einen Zugriff auf eine große Vielzahl von weiteren externen Geräten zulässt, dies bedeutet, deren Anschluss ermöglicht.
Das bevorzugt als Einsteckkarte ausgeführte Gerät 72 kann unter normalen Betriebsbedingungen auf mehrere verschiedene Arten intern den notwendigen Betriebsstrom vom Host-Rechner 74 über mehrere verschiedene intern vorgesehene redundante Energieversorgungseinheiten 61 beziehen. Zusätzlich besteht die Möglichkeit, die Stromversorgung ausschließlich durch ein externes Netzteil, d.h. eine externe Energieversorgung 60 zu gewährleisten, falls der Host-Rechner 74 keine Versorgung leisten kann. Die Versorgungsspannung kann intern durch den „stand-by" -Modus des Host-Rechners 74 bezogen werden. Diese kann entweder durch eine Wake-On-Lan (WOL) Verbindung, oder eine USB Master Verbindung oder durch eine Verbindung „stand-by" Signal des Netzteils bzw. des „stand-by" Signals des Busses 7 stattfinden. Des Weiteren besteht die Möglichkeit, das bevorzugt als Einsteckkarte ausgeführte Gerät 72 durch eine Batterie oder einen Akkumulator zu versorgen, der durch den Host-Rechner 74 geladen werden kann, um dadurch ggf. kürzere Stromausfälle zu überbrücken.
Um eine „Reset"- und/oder „Ein-Aus"-Kontrolle des Host-Rechners 74 zu gewährleisten, wird das bevorzugt als Einsteckkarte ausgeführte Gerät 72 in die externen Standardkabel eingeschleift, d.h. elektrisch verbunden. Dies wird z.B. durch ein „Y-Überbrückungskabel" bzw. einen Stecker zur Einsteckkarte 72 ermöglicht.
Das bevorzugt als Einsteckkarte ausgeführte Gerät 72 unterstützt eine Reihe unterschiedlicher Sensoren, um verschiedene Betriebszustände des rechnergestützten Systems oder des Host-Rechners 74 zu beobachten und um frühzeitig auf bevorstehende Ausfälle hinzuweisen. Ein Standardset von Sensoren ist bereits auf der Einsteckkarte 72 bzw. auf einem externen Sensor Board 66 implementiert. Das Standardset von Sensoren 68, 69 erlaubt die Messung von Temperatur oder Lüfterdrehzahlen, um zwei Beispiele zu nennen. Die Temperatur der Einsteckkarte 72 selbst wird von einem Sensor nahe dem Netzteil gemessen. Darüber hinaus erlaubt die Einsteckkarte 72 zusätzliche Sensoren durch einfache Erweiterungskarten hinzuzufügen. Die zusätzlichen Sensoren werden durch einen Mikroprozessor verwaltet und kommunizieren über die generische Ein- und Ausgabeeinheit 47 mit der Einsteckkarte 72. Folgende Sensoren sind derzeit verfügbar:
Temperatursensoren für bestimmte Messstellen im Host-Rechner 74; hierzu zählen Zusatzkarten mit hoher Leistung, Netzteile, Ventilatoren zur Prozessorkühlung, Vibrationsmesser, Rauchmelder, etc.;
Sensoren, um die korrekte Funktionsweise von Ventilatoren zu messen; Diese sind meistens schon in Rechnern vorhanden und die Daten der üblicherweise verwendeten Drehzahlmesser werden an das Motherboard des Host-Rechners 74 verbunden. Die hier erfassten Daten sind aber nicht über standardisierte Schnittstellen zu lesen. Deshalb bietet sich an, die Drehzahlen direkt abzugreifen, um ein unabhängiges Monitoring durchzuführen. Das bedeutet aber erheblichen zusätzlichen Verkabelungsaufwand, da das vorhandene Lüfterkabel mit der Vorrichtung 72 und von dort weiter zum Motherboard des Host-Rechners 74 weiter verbunden werden muss. Hier entstehen erhebliche zusätzliche Kosten. Die Signale der Drehzahlmesser können auch kapazitiv durch einfaches Paaren eines Sensordrahtes oder einer entsprechenden Sensorantenne mit dem Drehzahlmesser- Signal erreicht werden. Die ursprüngliche Verkabelung des Host-Rechners 74 wird hier nicht verändert.
„Einbruchssensoren", um auch im ausgeschalteten Zustand des Host-Rechners 74 festzustellen ob das System geöffnet wurde;
Geräuschsensoren, z.B. Mikrophone, um bestimmte, ungewöhnliche Geräusche zu detektieren, wozu u.a. die Rotoren von Festplatten und Ventilatoren, deren Lager ausgeschlagen sind, gehören und dadurch auf einen baldigen Ausfall hinweisen könnten; Sensoren zur Erkennung eines möglichen Ausfalles redundanter Netzgeräte. Typischerweise wird von jedem redundanten Netzwerk ein internes Versorgungsspannung- Referenz Signal nach außen geführt. Diese Signale werden an den internen ADC der Vorrichtung 72 angeschlossen. Sollte ein Netzteil ausfallen, wird der Host-Rechner 74 weiter laufen, aber das entsprechende Referenzsignal verschwindet und erlaubt der Vorrichtung 72, schnell zu reagieren.
Des Weiteren sind Bewegungssensoren zu nennen, mit denen detektierbar ist, ob eine computergestützte Anlage oder ein Host-Rechner 74 physikalisch bewegt wurde.
Die Messwerte sämtlicher oben beispielhaft aufgeführter Sensoren 68, 69 werden periodisch gemessen und mit zuvor gespeicherten Referenzwerten verglichen. Wenn einer der gemessenen Werte einen vorher programmierten Schwellwert unter- bzw. überschreitet, wird dies durch das bevorzugt als Einsteckkarte ausgeführt Gerät 72 an ein zentralisiertes System 100 übermittelt. Ist dieses Problem nicht durch das System 100 selbst behebbar, können von dem Apparat 72 entsprechende Maßnahmen eingeleitet werden, die helfen, einen dauerhaften Schaden am Host-Rechner 74 zu vermeiden. Im einfachsten Falle wird dieser Host-Rechner 74 abgeschaltet.
Die Massenspeichermedien in Computersystemen stellen eine der Stellen dar, die häufig von Ausfällen betroffen sind. Dies ist zum einen auf den relativ häufigen Datenzugriff zurückzuführen und zum anderen auf die Tatsache, dass diese Medien bewegliche Teile besitzen. Die Lebenszeit einer Festplatte wird dabei vor allem durch die Betriebstemperatur beeinflusst. Viele Festplatten besitzen deshalb werkseitig interne Sensoren, um den Betriebszustand zu messen. Das Auslesen von Dateien ist aber in der Praxis nur durch gezielte Zusatzsoftware möglich, die darüber hinaus oft herstellerspezifisch ist bzw. nicht für jedes Betriebssystem verfügbar ist. Das erfindungsgemäß vorgeschlagene, bevorzugt als Einsteckkarte ausgeführte Gerät 72 (RAS- Optimierer) erlaubt durch eigene Sensoren 68, 69, wichtige Statusinformationen von Festplatten extern auszulesen. Dazu können ein Temperatursensor und ein Mikrofon mechanisch direkt mit der Festplatte verbunden werden. Im Falle, dass „hot swap"- Gehäuse verwendet werden, werden die Sensoren auf den Verbindungssteckern mit einem Federsystem befestigt, um einen direkten und festen Sitz auf der Festplatte zu gewährleisten. „Hot swap"-Gehäuse bezeichnet im vorliegenden Zusammenhang ein Gehäuse, dass das Entfernen von Festplatten im laufenden Betrieb eines Rechnersystems ermöglicht. Diese Befestigungsform erlaubt damit ein unabhängiges Messen der Temperatur und der Geräuschemission einer Festplatte. Durch den direkten Kontakt des Mikrofons mit der Festplatte führen die Umgebungsgeräusche zu keiner relevanten Beeinträchtigung des zu messenden Geräuschpegels. Es ist dabei ausreichend, wenn der Ton für jeweils nur kurze Zeit (nur einige Sekunden) aufgezeichnet wird und anschließend das Spektrum durch eine Fast Fourier Transformation (FFT) im Prozessor 40 analysiert wird. Jede mechanische Abweichung wird dabei zu einer Veränderung des Geräuschspektrum führen und damit die Detektion eines herannahenden Ausfalls erlauben.
In der Regel haben viele hochwertige Computer im Serverbereich eine generische Schnittstelle implementiert, um interne Betriebs- und Serviceparameter zu lesen und zu kontrollieren. Diese Schnittstelle basiert typischerweise auf einem seriellen Protokoll und ist über einen speziellen, in der Regel nicht standardisierten Port auf der Gastplatine, d.h. dem Host-Rechner 74 zugänglich. Die dazugehörigen Befehle, Kommandos und Meldungen sind dabei ebenfalls nicht standardisiert. Um einen Zugriff auf IPMI (Intelligent Platform Management Interface) zu erhalten, ist auf mindestens einer Expansionseinheit 66 zum Anschluss weiterer Sensoren oder Ansteuereinheiten eine dedizierte Schnittstelle 70 für das Senden und Empfangen von IPMI-relevanten Daten und Kotrollsequenzen implementiert, die eine Funktionalität ähnlich zu den Sensorerweiterungen aufweist. Eine entsprechende Datenbank für die Parameter bestimmter Host-Rechner 74 sowie diejenigen von IPMI-Protokollen ist aufgebaut und wird gepflegt.
Das Gastsystem, dargestellt durch den Host-Rechner 74, in dem das bevorzugt als Einsteckkarte ausgeführte Gerät 72 eingebaut ist, produziert eine Anzahl von Start- Nachrichten, die auf den standardisierten Port-80, den Filter 24 ausgegeben werden. Diese Transaktionen, d.h. busrelevante Transaktionen stellen Broadcasts dar, die vom Host- Rechner 74 ohne Flusskontrolle mit einem Endgerät auf dem Bus 7 des Host-Rechners 74 ausgegeben werden, und die von der Einsteckkarte 72 über die SNOOP Einheit 20 mitgelesen werden. Die SNOOP Einheit 20 hat die Aufgabe, wie eingangs geschildert, allgemeine, nicht zielspezifische Daten vom Bus 7 des Host-Rechners 74 aufzunehmen. Die jeweilige Kodierung der für den Filter 24 (Port-80) vorgesehenen Meldungen ist nicht standardisiert und daher herstellerspezifisch. Eine entsprechende Informationen aufnehmende Datenbank wird periodisch auf den neuesten Stand gebracht, so dass die richtigen Zuordnungen gewährleistet sind, um automatische Interpretationen der Meldungen zu generieren. Die jeweils detektierten Port-80-relevanten Meldungen, d.h. Meldungen, die für den Filter 24 bestimmt sind, werden vom bevorzugt als Einsteckkarte ausgeführten Gerätes 72 aufgelistet, gespeichert und zur Analyse bereit gestellt. Über die SNOOP-Einheit 20, die auch als eine Mitleseeinheit bezeichnet werden könnte, ist eine Konfiguration derart möglich, dass diese SNOOP-Einheit 20 PCI- oder PCI-X- Signale und diesen entsprechende Zustände mitschneidet und so ein PCI-Signal- Aufzeichner im Sinne eines Tracers funktioniert. Ähnlich dem Filter 24 (gleichbedeutend mit Port-80 Scanner) werden die PCI-, PCI-Express- oder PCI-X-Signale in internen Speichern vorgehalten. Entsprechende Auslösezustände (Trigger) für Adressen oder Datenwerte auf den Adressleitung des Busses 7 können sehr einfach implementiert werden, so dass die Einsteckkarte 72 auch als Low Level Bus Monitor oder Debugging-Einheit fungieren kann. Aufgrund dieser Eigenschaft kann jede Aktivität auf dem Host-Rechner 74, welche den peripheren Bus 7 betrifft, aufgezeichnet werden, ohne dabei den Betrieb zu beeinträchtigen. Dabei kann jeweils der Busverkehr mitgeschnitten werden, der auf demselben PCI-, PCI-Express- oder PCI-X- Bus Segment gesendet wird.
Zur Realisierung einer Diagnosefunktionalität der Hardware wurde ein optionales Master Interface, vergleiche Bezugszeichen 35, implementiert. Position 35 bezeichnet eine Bus Master Einheit des Apparates 72 für den Bus 7 des Host-Rechners 74, die von der Einsteckkarte 72 bereitgestellt wird. Die Schnittstelle 35 wird für eine Fernwartungsfunktionalität nicht benötigt, kann jedoch dazu verwendet werden, um auf jede Hardwareerweiterung des Host-Rechners 74 zuzugreifen. So können z.B. Speichertests im Speicher 2 des Host-Rechners 74 direkt auf dem Host-Rechner 74 durchgeführt werden. Entsprechende Treiber können geladen und auf die Komponenten im Host- Rechner.74 aufgespielt werden. In diesem Modus übernimmt die Einsteckkarte 72 eine Host-Funktionalität, indem sie den Prozessor des Host-Rechners 74 abschaltet, damit dieser nicht mit der Kommunikation interferiert. So ist es z.B. möglich, einen Netzwerkgerätetreiber zu laden und über die Netzwerkschnittstelle des Host-Rechners 74 zu kommunizieren oder die Hardwarefunktionalität zu überprüfen, einschließlich eines direkten Auslesens der Media Access Control (MAC)-Adresse des Ethernets sowie dessen Konfiguration. In entsprechender Weise ist es möglich, auf die Schnittstelle des Massenspeichers des jeweiligen Host-Rechners 74 ebenfalls zuzugreifen. Ein weiteres Merkmal der Schnittstelle zum Bus 7 ist, die Möglichkeit eines direkten Durchsuchens des Busses 7 nach verfügbaren Geräten, um damit die Identität und die derzeit vorliegende Konfiguration des Host-Rechners 74 in der Startphase festzustellen.
Die richtige Basic I/O-System (BΙOS-)Konfiguration des Host-Rechners 74 ist eine Grundvoraussetzung für korrektes Funktionieren und für eine erfolgreiche Abwicklung der
Konfiguration sowie eine erfolgreichen Datenaustausch. Die Konfiguration kann sich jedoch durch Hardware- oder Softwarefehler, so z.B. durch eine leere Batterie entscheidend verändern. Ein bekannter Weg, um die Einstellungen des Basic I/O-Systems (BIOS) zu verifizieren und eventuell zu rekonfigurieren, ist der Gebrauch eines HBD USB Gerätes (Human Interface Devices), um die Einstellungen während des Startvorganges zu setzen und die entsprechenden Einstellungen automatisch durch den Grafikoutput zu überprüfen und eventuell abzuändern. Der USB Startvorgang kann dazu benutzt werden, um das Basic I/O-System (BIOS) mittels Herstellerupdates jeweils auf den neuesten Stand zu bringen und dort zu halten. Falls das BIOS selbst nicht mehr funktionstüchtig ist, kann der Host-Rechner 74 nicht mehr starten. In diesem Falle kann das Bus-Master-Interface 34 zur Wiederherstellung eingesetzt werden. Der Bus-Master 35 erlaubt ein direktes Lesen und Schreiben auf alle Geräte, einschließlich des BIOS-Flash-Speichers, der auf dem Host- Rechner 74 installiert ist. Das Lesen des BIOS-Flash-Speichers des Host-Rechners 74 erlaubt eine detaillierte Prüfung von dessen Inhalt und die Konfiguration im Vergleich zu bereits festgesetzten Einstellungen. Diese Vorgehensweise ist dabei um Größenordnungen schneller als die oben beschriebene Methode mittels HID (Human Interface Device)-USB. Falls das BIOS-Betriebssystem komplett funktionsuntüchtig sein sollte, kann diese Lese- /Schreibmöglichkeit dazu benutzt werden, um den BIOS-Flash Speicher des Host- Rechners 74 durch die Einsteckkarte 72 neu zu beschreiben. Die Programmiersequenzen für den BIOS-Flash Speicher sind dabei in der Regel gut dokumentiert und folgen einer standardisierten Prozedur.
Viele Netzwerke, die fernadministriert werden, arbeiten in Bereichen wo zusätzliche externe Ethernet Switches oder Ports oder dergleichen entweder nicht vorhanden oder nicht gewünscht sind. Um die Notwendigkeit einer zweiten Netzwerkverbindung für die Einsteckkarte 72 zu umgehen, kann optional eine Multi-Port Ethernetbrücke 41 eingesetzt werden. Der Einsatz einer Multi-Port Ethernetbrücke 41 unterstützt mehrere Funktionen: zunächst kann das Netzwerk des Host-Rechners 74 direkt verbunden werden und somit ein lokales Unternetz generiert werden, welches einer Verbindung zur Außenwelt hat und mindestens zwei interne Schnittstellen 64, 65 für den Host-Rechner 74 und die Einsteckkarte 72 hat. Bei dieser Methode kann es notwendig sein, dass die vorgeschalteten Netzwerkkomponenten entsprechend zu konfigurieren sind. Dadurch kann die Einsteckkarte 72 als in Hardware realisierte Firewall des Rechners genutzt werden, da die Einsteckkarte 72 jedes Datenpaket, welches für den Host-Rechner 74 bestimmt ist, analysiert und auf Viren, schädliche Software, Trojaner etc. hin untersucht. Der Nachteil dieser Methode ist der Umstand, dass sich beide Einheiten denselben physikalischen Netzwerkanschluss teilen, was zu Zugriffskonflikten führen kann. Die Einsteckkarte 72 unterstützt jedoch eine verschlüsselte VPN- Verbindung, was diesen Nachteil wieder aufhebt. Eine weiterhin typische Konfiguration, ist z.B. der Einbau einer großen Zahl von Host- Rechnern 74 mit dazugehörigen Einsteckkarten 72, z.B. in einem 19-Zoll-Schrank. Eine Option ist ein lokaler Switch für das Netzwerk aus einer Anzahl von Einsteckkarten 72 dezentral angeordnet, wobei der Switch dann über redundante Ports eine Verbindung zu höher gelegenen Netzwerkschichten herstellt. Diese Konfiguration erfordert einen zusätzlichen Switch, der zwar kostengünstig sein kann, aber dennoch zusätzliche Hardware und Kosten darstellt. In einer abweichenden Konfiguration sind die Einsteckkarten 72 in einem Rechnerschrank zusammengeschaltet. Dies geschieht durch paarweises Verbinden der bevorzugt als Einsteckkarte ausgeführten Geräte 72 über die Ethernetbrücke 41. Dabei wird typischerweise der Beginn und das Ende der Kette zwecks Redundanz mit der jeweils übergeordneten Netzwerkschicht verbunden, wobei die Einsteckkarte 72 so konfiguriert wird, dass diese die Kette unterbricht, um eine Netzwerkschleife zu verhindern. Im Falle eines Ausfalls in der Kette wird die Unterbrechungsbrücke entsprechend auf die letzte Stelle verschoben, die von beiden Seiten erreichbar ist. Diese Konfiguration wird durch periodisch laufende Software-Prozesse überprüft und bei Bedarf automatisch angepasst. Die Konfiguration ist dabei gleichwertig mit der Version mit separaten Schaltern, solange weniger als zwei Karten bzw. Netzwerkverbindungen gestört sind. In der Konfiguration mit separatem Switch sind nur die gestörten bevorzugt als Einsteckkarte ausgeführten Geräte 72 nicht erreichbar, während in der Variante mit Netzwerkschleife alle Einsteckkarten 72 zwischen den beiden defekten Einsteckkarten 72 nicht mehr erreichbar wären. Bei hohen Ansprüchen an die Ausfallsicherheit, d.h. an die höchste Verfügbarkeit des Netzwerkes, können daher zwei Ports des Apparatnetzwerks benutzt werden und mit zwei unabhängigen zusätzlichen als Einsteckkarten ausgeführten Geräten (RAS- Optimierer) 72 verbunden werden.
Die Benutzung der Ethernetbrücke 41 erlaubt eine elegante Implementierung zusätzlicher Sicherheitsaspekte auf dem Host-Rechner 74, da alle Datenpakete des Host-Rechners 74 Die Ethernetbrücke 41 durchlaufen. Ein Paketfiltermechanismus wird auf jeder Netzwerkschicht eingebracht, ohne den Host-Rechner 74 zu beeinflussen oder sogar zusätzliche Software auf dem System zu installieren. Darüber hinaus muss der Host- Rechner 74 nicht mit Sicherheitsaufgabe belegt werden. Die Einsteckkarte 72 wird typischerweise so aufgesetzt, dass sie einen sehr sicheren und begrenzten Zugriff erlaubt. Zusätzlich kann die Konfiguration statisch gemacht werden, indem der Flash- Konfigurationsspeicher 44 nur als Lese-Speicher gesetzt wird, d.h. unidirektional funktioniert. Mit Bezugszeichen 65 ist ein zweiter Netzwerkanschluss des erfindungsgemäß vorgeschlagenen RAS-Optimierers 72, bevorzugt als Einsteckkarte ausgeführt, bezeichnet. Mit diesem wird der Host-Rechner 74 verbunden. Der zweite Netzwerkanschluss 65 des Host-Rechners 74 wird mit dem zweiten Netzwerkanschluss 65 verbunden. Dadurch fließen alle Daten durch die erfindungsgemäß vorgeschlagene als RAS-Optimierer dienende Einsteckkarte 72. Diese prüft die Daten auf Viren und schickt sie über den primären Netzwerkanschluss 64 ins Netzwerk. Der Weg in die andere Richtung verläuft analog, d.h. die Daten bzw. Datenpakete, die für den Host-Rechner 74 bestimmt werden, werden über den primären Netzwerkanschluss 74 auf den RAS-Optimierer 72 geleitet, dort geprüft und gegebenenfalls über den weiteren zweiten Netzwerkanschluss 64 an den Host- Rechner 74 übermittelt.
Jeder Virus oder andere Schadsoftware, die das Gastsystem infizieren würde, hat keine
Möglichkeit, das Sicherheitssystem zu modifizieren, da alle Netzwerkfunktionalitäten über die Netzwerkbrücke 41 der Einsteckkarte 72 geführt werden. Die Funktionalität der
Ethnernetbrücke 41 erlaubt weiterhin jede Art von virtueller Verbindung bzw.
Tunnelgestaltung wie VPN- Verbindungen zu definierten Rechnern oder Netzwerken.
Diese Konfiguration benötigt keine zusätzliche Software oder Zusatzeinstellungen auf dem
Host-Rechner 74 und es besteht des weiteren auch keine Möglichkeit für den Host-Rechner 74, irgendeine Sicherheits- oder Netzwerk relevante Konfiguration direkt zu ändern, es sei denn, sie wird durch das Netzwerk 100 vorgenommen.
Die Ethernetbrücke 41, die auch als Netzwerkbrücke bezeichnet wird, erlaubt die komplette Separierung der Sicherheits- und Netzwerkinfrastruktur von der Konfiguration des Host-Rechners 74. Es kann eine entsprechende Überwachungsfunktionalität implementiert werden, die jede potenzielle Gefährdung des Gastsystems, sei es durch Viren oder andere Schadsoftware erkennt und selbstständig Gegenmaßnahmen einleiten, wie das Blockieren des betroffenen Host-Rechners 74 vom Netzwerk bzw. dessen Zugang bzw. Zugriff zu beschränken.
Nach einem Netzausfall kann es sein, dass ein Host-Rechner 74 nicht mehr startet. Dies hat in den meisten Fällen verschiedene Fehler von Start- bzw. Basic I/O-System-Parametern als Ursache. Ein Prüfsummenfehler in der BIOS Konfiguration erfordert im Normalfall einen Benutzereingriff, indem über ein HID (z.B. die Tastatur) die Restaurierung bzw. Rekonstruktion der BIOS-Parameter anhand in der Vergangenheit liegender Parameter initiiert wird. Viele andere Startprobleme können durch ein Zurücksetzen (Reset) der Maschine direkt beseitigt werden. Die Einsteckkarte 72 diktiert den Reset-Zähler des Startprozesses. Im Falle eines Startfehlers, der zum Stillstand des Startprozesses führt, werden von dem bevorzugt als Einsteckkarte ausgeführten Gerät 72 automatisch Gegenmaßnahmen eingeleitet, um das System wieder in den Betriebszustand zu überführen. Dazu zählen die Wiederherstellung der BIOS-Parameter das Senden eines Reset-Impulses an den Host-Rechner 74 oder die Initiierung einer neuen Einschaltprozedur. Falls nach mehrmaligem Wiederholen kein Erfolg erzielt werden kann, erfolgt ein kompletter Selbsttest des Host-Rechners 74 und ein entsprechendes Testsystem wird auf den Host-Rechner 74 geladen. Falls möglich, werden dann Fehler behoben bzw. wenn keine Fehlerbereinigung möglich ist, wird der Fehler entsprechend den Vorgaben eskaliert, ein Systembetreuer wird via E-Mail oder SMS informiert oder der Host-Rechner 74 ausgeschaltet.
Große Installationen erfordern, dass bei einem Neustart der Host-Rechner 74 die Versorgungsspannung nicht für alle Host-Rechner 74 gleichzeitig zugeschaltet wird. Weiterhin sollten nach einem Stromausfall die Host-Rechner 74 nicht unmittelbar wieder eingeschaltet werden, sollte es sollte genügend Zeit verstrichen sein, bis sich wieder eine stabile Stromversorgung eingestellt hat. Dies ist insbesondere wichtig für alle Massenspeicher, wie z.B. Festplattensysteme. Der Host-Rechner 74 ist derart konfiguriert, dass er bei wieder verfügbarer Stromversorgung ausgeschaltet bleibt. Die Einsteckkarte 72 startet automatisch, falls sie nicht durch eine USV- (unterbrechungsfreie Stromversorgungs)-Einrichtung in Betrieb gehalten wurde. Da die Einsteckkarte 72 (RAS- Optimierer) mindestens einen nichtflüchtigen Massenspeicher 45 (Flash) besitzt, haben unterbrochene Startprozesse in der Regel keinen negativen Einfluss. Nach dem Einschaltprozess beginnt die Einsteckkarte 72 die Stromversorgung zu überprüfen und falls diese über einen definierten Zeitraum stabil ist, wird die Stromversorgung für den Host- Rechner 74 zugeschaltet. In größeren Szenarien stellt die Einsteckkarte 72 durch ein Autoverhandlungsschema sicher, dass jeweils nur eine vorher festgelegte Anzahl von Host-Rechner 74 gleichzeitig eingeschaltet werden kann. Dieses Einschaltschema berücksichtigt dabei die vorhandene Infrastruktur der Stromversorgung in Bezug auf Leistung und Segmentierung.
Die Grafikfunktion des RAS -Optimierers 72 ist als Kombination eines frei programmierbaren Prozessors 34 und Softwaretreibern implementiert, die Kommandos des Gesamtsystems ausführt und die entsprechenden Daten in den Grafikspeicher 43 schreibt.
Jeder Befehl des Host-Rechners 74 an die Grafikeinheit 64 wird dabei in einer Befehlswarteschlange aufgezeichnet. Die Befehlswarteschlange 24 (Port-80) dient dazu, generische Fehlermeldungen des Host-Rechners 74 lesen und auswerten zu können. Auf diese Weise muss die Einsteckkarte 72 nicht den kompletten Grafikspeicher, d.h. für die Grafikdaten reservierten Bereich im flüchtigen Speicher 42 durchsuchen, sondern bekommt alle Befehle auf direktem Weg. Dieser Modus ist insbesondere dann von Vorteil, wenn die Grafikausgabe im ASCII-Modus ist, und die Befehle direkt interpretiert werden können. Auch in anderen Grafikmodi kann die Einsteckkarte (RAS-Optimierer) 72 Updatebefehle direkt lesen und z.B. das Updaten nur auf Teilbereiche des Grafikspeichers 43 beschränken. Wenn sich eine Textnachricht im Grafikbefehl befinden sollte, kann diese durch das Auslesen der Pixel im Grafikspeicher und entsprechender Interpretation mit OCR-Software (Optical Character Recognition - Testerkennung) gelesen werden. Hierdurch wird der Grafikinhalt auf die eigentliche Textnachricht reduziert. Diese Methode hat den Vorteil gegenüber Standard-OCR-Methoden, dass die Interpretation der direkten digitalen Grafik keine Verzerrungen oder Verschmierungen aufweist und der Bereich, in dem der Text liegt, bereits bekannt ist. Weiterhin ist es nicht notwendig, die gesamte Grafikseite erneut zu durchsuchen, um einzelne Buchstaben oder kurze Wortsequenzen zu dekodieren, was den Aufwand für die OCR-Berechnung entsprechend drastisch reduziert. Das bevorzugt als Einsteckkarte ausgeführte Gerät 72 produziert automatisch einen ASCH-Ausgabestrom für alle Grafikausgaben, die Textpassagen enthalten.
Für einen bestimmten Zeichensatz kann ein bestimmter Buchstabe an seiner konstanten Updatesequenz erkannt werden und stellt somit eine Möglichkeit dar, einen intelligenten Wortvergleich mit Hilfe der CPU 34, d.h. des Grafikprozessors 34 der Einsteckkarte 72 durchzuführen. Dies kann entweder mittels eine Mikroprogramms oder als erweiterter Koprozessorbefehl implementiert werden. Für den Fall, dass neue Zeichensätze hinzutreten sollten, kann deren Muster durch die OCR-Funktionalität erkannt werden und die Liste der bekannten Wordmuster um die neu hinzugetretenen Muster ergänzt werden. Auf diese Weise kann sich das bevorzugt als Einsteckkarte ausgeführte Gerät 72 auf jeden Zeichensatz und Grafiktext in einer Art Lernmodus anpassen. Der generierte Text kann danach auf vordefinierte Wörter bzw. Begriffe wie z.B. „kernel panic" oder „fatal error" untersucht werden.
Verschiedene Zustände können durchaus zu einem plötzlichen Absturz des Systems führen, ohne Diagnoseinformationen wie „core dumps" herauszugeben. Diese Fehler sind im Allgemeinen typischerweise schwer zu reproduzieren, da sie erstens selten auftreten und oft erst durch eine Reihe von Umständen, die schwer reproduzierbar sind, hervorgerufen werden. Der Fall eines solchen schweren Systemfehlers kann durch die Einsteckkarte 72 entweder durch eine entsprechende Interpretation der Daten im Grafikspeicherbereich 43 des flüchtigen Speichers 42 oder durch den Verlust der „Herzschlag-Überwachung" (Heart Beat) des Host-Rechners 74 detektiert werden. Da die Einsteckkarte 72 vollen Zugriff auf den physikalischen Speicher 2 des Host-Rechners 74 hat, kann auf diese Weise ein nachträglicher kompletter Speicherauszug initiiert werden. Die Anwendung entsprechender verlustfreier Kompressionstechniken vorausgesetzt, kann der Speicher 2 wieder auf einen vordefinierten sicheren Kommunikationsstatus gesetzt werden. Zusätzlich werden alle relevanten Diagnoseinformationen und Systemzustände des Systems zur Fehlerdiagnose ausgegeben und z.B. an das Überwachungssystem übermitteln, der diese Fehlerprotokolle anderen RAS -Optimierern 72 zugänglich macht, sodass ein lernendes System generiert wird. Entsprechende Nachrichten bzw. Meldungen oder Signalfolgen, die auf den Absturz des Host-Rechners 74 hinweisen, werden eskaliert und der Host-Rechner 74 wird nach der Durchführung eines kompletten Selbsttests automatisch neu gestartet.
Die Einsteckkarte 72 unterstützt - wie oben bereits mehrfach dargelegt - eine hierarchische Systemanalyse. Auf der untersten vorhandenen Hierarchiestufe kann über die Port-80 Funktionalität des Filters 24 und den PCI-Bus Master-Modus 35 jede wichtige Hardwarekomponente des Host-Rechners.74 inklusive des BIOS-Flash-Speichers und des dynamischen Speichers 42, d.h. des flüchtigen Speichers auf deren Betriebszustand hin getestet werden. Jeder Fehler auf dieser Stufe wird entweder automatisch repariert (z.B. BIOS CRC Fehler) oder es wird, falls der Fehler nicht automatisch zu beheben ist (z.B. Fehler im SEVI-Speicher), ein detaillierter Fehlerreport ausgegeben, damit der Systembetreuer ohne eigene Diagnosen erstellen zu müssen, das beziehungsweise die defekten Bauteile direkt auswechseln kann.
Nach erfolgreichem Selbsttest kann der Host-Rechner 74 instruiert werden, ein Testbetriebssystem zu laden. Dazu ist relativ wenig Hardware notwendig, die sich im Wesentlichen auf ein Netzteil, das BIOS und den Hauptspeicher beschränkt. Weder das Netzwerk noch der Massenspeicher müssen hierzu in Betrieb sein. Anstelle des normalen Startgerätes, wie einer internen Festplatte oder einer Netzwerk-Schnittstelle, wird von einem durch die Einsteckkarte 72 virtualisierten Laufwerk aus gestartet. Ein erprobtes Medium für ein solches Testbetriebssystem ist - um ein Beispiel zu nennen - KNOPPIX, das den Start eines kompletten Linux-Systems ohne eine Änderung der Startparameter des Host-Rechners 74 erlaubt. Nach dem Start des Testbetriebssystems wird eine Reihe von Testroutinen gestartet. Diese Tests beinhalten die detaillierte Überprüfung des Speichers 2 das Lesen aller Blöcke der Festplatten, der Vergleich von Startparametern mit gespeicherten Referenzparametern, dem Testen von Netzwerkverbindungen und dem Test aller zusätzlich vorhandenen Hardwarekomponenten. Der Einsatz eines unabhängigen Betriebssystems erlaubt ein detailliertes Testen und eine genaue Fehlerdiagnose der Hardware- Infrastruktur des Host-Rechners 74 unter der Aufsicht und dem Management der Einsteckkarte 72. Nach einem erfolgreich bestandenen Test und möglicher Reparaturen wird das System erneut gestartet. Hierbei werden die Ergebnisse des zuvor durchgeführten Selbsttestes festgehalten. Diese Funktionalität eignet sich nicht nur zur Problembehandlung, sondern auch zur Qualitätskontrolle oder zum Virenscan der im Host- Rechner 74 durchgeführt werden kann.
Bei großen Installationen sollen neue Computer möglichst schnell und einfach in eine bestehende Infrastruktur eingebunden werden. Der oben beschriebene automatische Selbsttest ist dabei sehr hilfreich. Nach der Installation der Einsteckkarte 72 im Host- Rechner 74 registriert sich dieser selbständig im Netzwerk und führt automatisch alle Selbsttests und Akzeptanztests durch. Als Teil der Tests können hier die Überprüfung der vorhandenen Chipsätze oder anderer Hardware-Komponenten genannt werden. Im Falle des Auftretens von Fehlern, wird dies mitgeteilt und das System wird heruntergefahren. Des Weiteren kann die Einsteckkarte 72 als RAS -Optimierer alle vorgefundene Hardware mit einer Datenbank vergleichen und kontrollieren, ob alle bestellten Komponenten vorhanden sind.
Den nächsten Schritt der Inbetriebnahme stellt die Installation des Host-Rechners 74 dar. Als Teil des Selbsttests sind die Systemparameter wie MAC-Adresse und die Prozessidentifikation bekannt. Diese Parameter werden zu automatischen Registrierung des Host-Rechners 74 in die Netzwerkinfrastruktur benutzt. Danach wird das Basic VO- System konfiguriert und ein Installationsagent wird über die USB Massenspeicher- funktionalität gestartet bzw. initialisiert. Dieser Agent initiiert die Festplatten, kopiert die ausgewählte Software konfiguriert und personalisiert diese anschließend. Danach erfolgt der Start des Host-Rechners 74 mit dem internen Betriebssystem. Die Abfolge in der Durchführung von Akzeptanztest, Konfigurierung und Installation ist dabei voll automatisiert und es ist nur die Installation und Verkabelung der Einsteckkarte 72 selbst notwendig.
Die Einsteckkarte 72 (RAS-Optimierer) beinhaltet mindestens einen seriellen Zugang, um Aktivitäten auf einem seriellen Kanal abzugreifen. So können weitere Sensoren, die über ein serielles Protokoll angesprochen werden, an den erfindungsgemäß vorgeschlagenen RAS-Optimierer in Form einer Einsteckkarte 72 angeschlossen werden. Auch wird bei einigen Rechnern die Bildschirmausgabe auf die serielle Konsole umgeleitet.
Einige Funktionen verlangen eine zusätzliche Verkabelung, so kann z.B. für das HID-USB Interface ein Brückenkabel erforderlich sein, welches zwischen der USB Steckbrücke der Hauptplatine des Host-Rechners 74 und der Einsteckkarte 72 verläuft. Dies ist notwendig, da einige Host-Rechner 74 ein HID-USB Gerät nur dann als ihr primäres USB Gerät erkennen, wenn es beim Systemstart anwesend ist. Um das erwähnte Brückenkabel überflüssig zu machen, kann die Einsteckkarte 72 als Multifunktionsgerät mit virtuellem USB Chipsatz und gleichzeitiger Grafikkarte fungieren. Das USB-Slave-Interface täuscht dabei eine Verbindung mit dem HID-USB vor. Falls dies vom Host-Rechner 74 unterstützt wird, wird das Gerät während der Startphase erkannt und in das System eingebunden. Eine weitere Funktionalität, die von der Einsteckkarte 72 übernommen werden kann, ist die eines Host-Netzwerk-Interface. Dabei fungiert der Apparat als generische PCI-, PCI- Express- oder PCI-X Netzwerkkarte, die jeglichen Netzwerkverkehr an ihre private Schnittstelle weiterleitet. In diesem Modus kann es aber notwendig sein, betriebssystemsabhängige Treiber einzusetzen.
Die Funktionsweise der Sensoren und der Ablauf der Reparaturschritte bei der erfindungsgemäß vorgeschlagenen autonom arbeitenden Vorrichtung zur autonomen Diagnose und Fernsteuerung eines Rechners stellen sich wie folgt dar:
Werden Temperatursensoren eingesetzt, so kann eine den eingestellten, vorgegebenen Grenzwert übersteigende Temperatur erfasst werden. In diesem Falle lässt sich die Drehzahl eines Lüfters erhöhen, um eine Absenkung der Temperatur zu erreichen sowie über das Überwachungssystem 100 eine entsprechende Information senden. Sollte das Überwachungssystem 100 z.B. innerhalb einer kurzen Zeitspanne mehrere Meldungen bezüglich einer erhöhten Temperatur erhalten, so kann dies auf einen Ausfall einer Klimaanlage in einem Rechenzentrum hinweisen. Das Überwachungssystem 100 kann entsprechende Informationen entweder über E-Mail oder auch über das Absetzen einer SMS an einen Systembetreuer versenden und fordert die angeschlossenen RAS -Optimierer 72 dazu auf, die oder den Host-Rechner 74 ggf. herunterzufahren, um weiteren Schaden zu vermeiden.
Sollte der Reset-Sensor mehrfach hintereinander, d.h. innerhalb weniger Minuten, Reset- Signale erhalten, so wird die Einsteckkarte 72 den Systembetreuer dahingehend informieren und je nach Vorgabe einen Selbsttest des mindestens einen Host-Rechners 74 oder der Host-Rechner durchführen. Dies erfolgt dadurch, dass die Einsteckkarte 72 ein Testbetriebssystem auf dem mindestens einen Host-Rechner 74 startet und die einzelnen Hardwarekomponenten z.B. CPUs, Speichereinheiten und dergleichen testet. Ein sich ergebender Testbericht wird dem Administrator auf dem Arbeitsplatzrechner 101 zur Verfügung gestellt und im Fall eines Hardwaredefektes wird die defekte Komponente benannt. Sollte hingegen kein Hardwaredefekt vorliegen, so wird je nach Maßgabe das Betriebssystem des mindestens einen Host-Rechners 74 autonom erneuert sowie die Anwendungsprogramme erneut installiert.
Durch eine Kombination mehrerer Sensormeldungen wird die autonom agierende Einsteckkarte in die Lage versetzt, auf neue Störfaktoren rückzuschließen: Durch eine mittels eines Temperatursensors ermittelte Übertemperatur eines Speichermediums, wie z.B. einer Festplatte, sowie über die Detektion einer veränderten Geräuschkulisse, was über einen Geräuschsensor, wie z.B. ein Mikrophon, detektiert werden kann, innerhalb eines Host-Rechners 74 kann auf einen herannahenden Festplattendefekt geschlossen werden und vorsichtshalber eine Datensicherung auf dieser entsprechenden Festplatte gestartet werden.
Mittels eines Vibrationssensors und eines Sensors, der eine „Gehäuse steht offen"-Position feststellt, wird festgestellt, dass jemand gerade im Begriff ist, den mindestens einen Host- Rechner 74 aus seiner Verankerung zu entfernen. Sollte sich dieser mindestens eine Host- Rechner 74 z.B. in einem Geldautomat befinden, so wäre eine denkbare Aktion das Auslösen eines Alarms sowie über einen Aktuator das Versenken des Geldbestandes in einem Schutzbereich unterhalb des Geldautomaten sowie ggf. das Alarmieren entsprechender Einsatzkräfte.
Durch eine Kombination der von Gas- oder Rauchsensoren emittierten Signale sowie durch eine mittels des Temperatursensors ermittelte Übertemperatur kann auch auf ein Feuer im Aufstellraum des mindestens einen Host-Rechners 74 geschlossen werden. In diesem Fall könnte autonom je nach Vorgabe eine Stromabschaltung an dem mindestens einen Host-Rechner 74 erfolgen, um weiteren Schaden zu vermeiden. Bezugszeichenliste
1 Host-Rechner CPU
2 Host-Rechnerspeicher 3 PCI, PCI-X, PCI-Express Grafikkarte
4 AGP Grafikkarte
5 Host-Rechner Chipsatz
6 Host-Rechner USB Mater/Slave, Bestandteil von 5
7 PCI, PCI-X oder PCI-Express-Bus des Host-Rechners 74 20 SNOOP Einheit der Einsteckkarte 72, um allgemeine, nicht zielspezifische
Daten vom PCI, PCI-X oder PCI-Express-Bus des Host-Rechners 74 aufzunehmen
21 Tracer Einheit der Einsteckkarte 72, um Kommandos, Daten und Adressen, die nicht für die Einsteckkarte 72 bestimmt sind, vom PCI, PCI-X oder PCI- Express-Bus des Host-Rechners 74 lesen zu können
22 FIFO für die PCI, PCI-X oder PCI-Express-Daten, die nicht für die Einsteckkarte 72 bestimmt sind
23 FIFO für Daten des Port-80 Scans
24 Port-80 Filter, um generische Fehlermeldungen des Gastsystems lesen und auswerten zu können
30 PCI, PCI-X oder PCI-Express Slave-Einheit der Einsteckkarte 72
31 Generische Kontroll- und Status-Register für den PCI, PCI-X oder PCI- Express-Bus des Host-Rechners 74, die vom Apparat 72 bereit gestellt werden 32 Kontroll- und Statusregister für den PCI, PCI-X oder PCI-Express-Bus des
Host-Rechners, die vom Apparat für die Grafikeinheit bereit gestellt werden
33 FEFO für Grafikdaten
34 Grafikprozessor der Einsteckkarte 72
35 Busmaster Einheit der Einsteckkarte 72 für den PCI, PCI-X oder PCI- Express-Bus des Host-Rechners 74, die von der Einsteckkarte 72 bereit gestellt wird
40 Prozessor
41 Netzwerk Anschluss mit mindestens einem Anschluss
42 Flüchtiger Speicher 43 Grafikspeicher (in 42 implementiert)
44 Ansteuereinheit des nichtflüchtigen Speichers
45 Nichtflüchtiger Speicher, der ohne Stromversorgung Daten halten kann 46 Ansteuereinheit des flüchtigen Speichers
47 generische Ein- und Ausgabeeinheit
48 USB Master/Slave Einheit
49 virtuelles Bootflash, um Host-Rechner 74 mit veränderten Daten beim Starten zu versorgen (in 42 implementiert)
50 lokaler Bus im RAS-Optimierer Master/Slave-fähig
60 Externe Energieversorgung
61 drei verschiedene interne redundante Energieversorgungen
62 ein oder mehrere serielle Anschlüsse, um Verbindung zum Host-Rechner 74 oder zu externen Komponenten herzustellen
63 Anschlüsse zum Schalten von Lasten oder Reset-Signalen des Host- Rechners 74 oder dessen Komponenten
64 primärer Netzwerkanschluss zum Datenaustausch mit der Einsteckkarte 72
65 optionaler sekundärer Netzwerkanschluss zur Filterung des Netzwerkes des Host-Rechners 74 oder zur Implementation redundanter
Netzwerkanbindung der Einsteckkarte 72
66 eine oder mehrere Expansionseinheiten, um weitere Sensoren oder Ansteuereinheiten anzuschließen
67 Mikroprozessor, um Sensordaten aufzubereiten 68 zusätzliche generische Schnittstelle mit digitalen und analogen Ein- und
Ausgängen, um beliebige Sensoren anzuschließen 69 Anschlüsse für Mikrofon, Vibrationsmelder, Rauchmelder,
Beschleunigungsmelder, digitale und analoge Temperatursensoren und
„Gehäuse wurde geöffnet"-Melder 70 Schnittstelle für das Senden und Empfangen von EPMI-Daten und
Kontrollsequenzen
71 Anschluss, um Lüfterdrehzahlen zu messen und zu regulieren
72 Apparat (Einsteckkarte, RAS-Optimierer)
73 Sensorfeld auf der Einsteckkarte 72, um Sensoren 68, 69, 70 und 71 anzuschließen
74 Host-Rechner, in dem die Einsteckkarte 72 (RAS-Optimierer) eingebaut ist
100 Überwachungssystem, das Informationen mehrerer Einsteckkarten 72 sammelt, anzeigt und verteilt
101 Arbeitsplatzrechner des Administrators 110 Allgemeine Daten- und Steuerungs- und Kommunikationskanäle, Netzwerk

Claims

Patentansprüche
1. Autonome Vorrichtung (72) zur autonomen Diagnose und Fernsteuerung eines Rechners oder eines rechnergestützten Systems (74) mit einem lokalen Bus (7), an dem die autonome Vorrichtung (72) angeschlossen ist, wobei der lokale Bus (7) Slave-fähig ist, dadurch gekennzeichnet, dass die Vorrichtung (72) mit Hilfe von Sensoren (68, 69, 70, 72) den Status eines Host-Rechners (74) autonom überwacht und selbstständig Korrekturschritte einleitet.
2. Autonome Vorrichtung (72) zur Diagnose und Fernsteuerung eines Rechners oder eines rechnergestützten Systems (74) mit einem lokalen Bus (7), an dem die autonome Vorrichtung (72) angeschlossen ist, wobei der lokale Bus (7) sowohl Master- als auch Slave-fähig ist, dadurch gekennzeichnet, dass die Vorrichtung (72) mit Hilfe von Sensoren (68, 69, 70, 72) den Status eines Host-Rechners (74) autonom überwacht und selbstständig Korrekturschritte einleitet.
3. Autonome Vorrichtung (72) gemäß Anspruch 1 oder 2, dadurch gekennzeichnet, dass diese zumindest einen ersten Netzwerkanschluss (41) umfasst, über den eine bidirektionale Datenübertragung mit einem Überwachungssystem (100) erfolgt, zum
Austausch von Zustandsprotokollen und Reparaturmechanismen.
4. Autonome Vorrichtung (72) gemäß Anspruch 1 oder 2, dadurch gekennzeichnet, dass diese Verschlüsselungfunktionalität umfasst, die alle Daten, die von der Vorrichtung mit dem Netzwerk (110) ausgetauscht werden, verschlüsselt.
5. Autonome Vorrichtung (72) gemäß Anspruch 1 oder 2, dadurch gekennzeichnet, dass der Datenaustausch der Vorrichtung (72) mit dem Überwachungssystem (100) durch ein VPN (virtuelles privates Netzwerk) erfolgt.
6. Autonome Vorrichtung (72) gemäß Anspruch 1 oder 2, dadurch gekennzeichnet, dass der Netzwerkanschluss des Host-Rechners (74) an einen zweiten Netzwerkanschluss (65) der Vorrichtung (72) angeschlossen ist und die Vorrichtung (72) für den Host-Rechner (74) alle notwendigen VPN-Transaktionen abwickelt und gleichzeitig alle Netzwerkpakete zum Host-Rechner (74) filtert und somit einen
VPN-Router mit integrierter Firewall-Funktionalität darstellt, die völlig unabhängig von der Betriebssoftware des Host-Rechners (74) ist.
7. Autonome Vorrichtung (72) gemäß Anspruch 1 oder 2, dadurch gekennzeichnet, dass die Sensoren Temperatursensoren, Lüfterdrehzahlsensoren, I/O-Signalsensoren, Reset-Sensoren, Mikrophone, Vibrationssensoren, Gassensoren, Bewegungssensoren, Infrarotsensoren, Feuchtigkeitssensoren, Rauchsensoren, Aktuatoren, Abstandssensoren, Über- und Unterspannungssensoren, Stromsensoren und Sensoren Primärversorgung umfassen.
8. Autonome Vorrichtung (72) gemäß Anspruch 1 oder 2, dadurch gekennzeichnet, dass die vorhandenen Sensorsignale kapazitiv ausgelesen und verarbeitet werden.
9. Autonome Vorrichtung (72) gemäß Anspruch 1 oder 2, dadurch gekennzeichnet, dass die vorhandenen Signale redundanter Netzgeräte unabhängig ausgelesen werden, um einen Netzwerk Ausfall unabhängig zu erkennen.
10. Autonome Vorrichtung (72) gemäß Anspruch 1 oder 2, dadurch gekennzeichnet, dass diese Grafikkartenfunktionalität integriert und mindestens eine zusätzliche Schnittstelle zum Anschluss mindestens eines Multifunktionsgerätes aufweist.
11. Autonome Vorrichtung (72) gemäß Anspruch 1 oder 2, dadurch gekennzeichnet, dass die Vorrichtung (72) eine zusätzliche Schnittstelle zum Anschluss mindestens eines Multifunktionsgerätes aufweist, welches Tastatur, Maus, HID (Human
Interface Devices), USB-Massenspeicher, CD-ROM, CD-RW, DVD, DVD-RW umfasst.
12. Verfahren zur Diagnose und Fernsteuerung eines Rechners oder eines rechnergestützten Systems (74) mit einer Vorrichtung (72), die einen lokalen, Slave- fähigen Bus (7) umfasst, dadurch gekennzeichnet, dass dieser eine autonome Verifikation und gegebenenfalls eine Konfiguration oder eine Rekonfiguration des Host-Rechners (74) übernimmt.
13. Verfahren zur Diagnose und Fernsteuerung eines Rechners oder eines rechnergestützten Systems (74) mit einer Vorrichtung (72), die einen lokalen, Master/Slave-fähigen Bus (7) umfasst, dadurch gekennzeichnet, dass dieser eine autonome Verifikation und gegebenenfalls eine Konfiguration oder eine Rekonfiguration des Host-Rechners (74) übernimmt.
14. Verfahren gemäß Anspruch 12 oder 13, dadurch gekennzeichnet, dass bei Startproblemen des Host-Rechners (74) dessen Start über die Vorrichtung (72) automatisch erfolgt.
15. Verfahren gemäß Anspruch 12 oder 13, dadurch gekennzeichnet, dass eine gesteuerte Inbetriebnahme des Host-Rechners (74) nach einer Unterbrechung der Stromversorgung durch Anschaltsignale erfolgt.
16. Verfahren gemäß Anspruch 12 oder 13, dadurch gekennzeichnet, dass ein Netzwerk (HO), in welchen die Vorrichtung (72) eingebunden ist, grafikrelevante Daten zu einem Arbeitsplatzrechner (101) überträgt und umgekehrt.
17. Verfahren gemäß Anspruch 12 oder 13, dadurch gekennzeichnet, dass zusätzlich Tastatur und Maus Kommandos über das Netzwerk (110) vom Arbeitsplatzrechner (101) zur Vorrichtung (72) übertragen werden, die diese dann an den Host-Rechner
(74) weiterleitet.
18. Verfahren gemäß Anspruch 12 oder 13, dadurch gekennzeichnet, dass nach autonomer Verifikation und Konfiguration des Host-Rechners (74) eine gesteuerte Inbetriebnahme des Host-Rechners (74) durch gesteuerte Anschaltsignale durch die
Vorrichtung (72) getriggert wird.
19. Verfahren gemäß Anspruch 12 oder 13, dadurch gekennzeichnet, grafikrelevante Daten auf Textbestandteile gefiltert werden.
20. Verfahren gemäß Anspruch 12 oder 13, dadurch gekennzeichnet, dass grafikrelevante Daten durch eine Mustererkennung von Wordgruppen interpretiert werden.
21. Verfahren gemäß Anspruch 12 oder 13, dadurch gekennzeichnet, dass grafikrelevante Daten durch ein OCR-Screening auf Buchstabenebene interpretiert werden.
22. Verfahren gemäß Anspruch 12 oder 13, dadurch gekennzeichnet, dass die Vorrichtung (72) im Host-Rechner (74) mindestens einen automatisch ablaufenden
Selbsttest vornimmt.
23. Verfahren gemäß Anspruch 12 oder 13, dadurch gekennzeichnet, dass die Vorrichtung (72) am Host-Rechner (74) implementiert wird und eine automatische Inbetriebnahme des Host-Rechners (74) ermöglicht.
24. Verfahren gemäß Anspruch 12 oder 13, dadurch gekennzeichnet, dass die Vorrichtung (72) einen Post-Mortem-Speicher Abbild erzeugt.
25. Verfahren gemäß Anspruch 12 oder 13, dadurch gekennzeichnet, dass in Reaktion auf autonom erkannte abnorme Betriebsbedingungen verschiedene Diagnose und Reparatur Funktionen, einschließlich Tests und Resets des Host-Rechners (74) durchgeführt werden.
26. Verfahren gemäß einem oder mehrerer der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass mindestens ein Diagnoseprotokoll in mindestens einem permanenten Speicher des Host-Rechners (74) zwischengespeichert wird.
27. Verfahren gemäß einem oder mehrerer der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass durch die Vorrichtung (72) ein Diagnoseprotokoll an ein Überwachungssystem (101) gesandt wird.
28. Verfahren gemäß einem oder mehrerer der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass ein Diagnoseprotokoll auf der Vorrichtung (72) selbst gespeichert wird.
PCT/EP2008/005796 2007-07-16 2008-07-16 Verfahren und vorrichtung zur administration von computern WO2009010277A1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US12/669,729 US8806278B2 (en) 2007-07-16 2008-07-16 Method and device for autonomously diagnosing and remotely controlling a computer or computer-aided system

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102007033346.5 2007-07-16
DE102007033346A DE102007033346A1 (de) 2007-07-16 2007-07-16 Verfahren und Vorrichtung zur Administration von Computern

Publications (1)

Publication Number Publication Date
WO2009010277A1 true WO2009010277A1 (de) 2009-01-22

Family

ID=39863145

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2008/005796 WO2009010277A1 (de) 2007-07-16 2008-07-16 Verfahren und vorrichtung zur administration von computern

Country Status (3)

Country Link
US (1) US8806278B2 (de)
DE (1) DE102007033346A1 (de)
WO (1) WO2009010277A1 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111552615A (zh) * 2020-04-30 2020-08-18 深圳市智微智能软件开发有限公司 独立的计算机状态监测方法、装置、设备及存储介质

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010104499A1 (en) * 2009-03-09 2010-09-16 Hewlett-Packard Development Company, L.P. Determining identifying information of a cooling fan
US7934045B2 (en) * 2009-06-09 2011-04-26 International Business Machines Corporation Redundant and fault tolerant control of an I/O enclosure by multiple hosts
US8271704B2 (en) * 2009-06-16 2012-09-18 International Business Machines Corporation Status information saving among multiple computers
US20110022899A1 (en) * 2009-07-27 2011-01-27 Vitali Greenberg Producing or executing a script for an operation test of a terminal server
DE102011106497B4 (de) * 2011-06-15 2018-11-15 Messer Cutting Systems Gmbh System zur Fernwartung oder Diagnose einer computergesteuerten Brennschneidmaschine
US20130007428A1 (en) * 2011-06-30 2013-01-03 Dell Products L.P. System and method for customized configuration of information handling systems
US9015457B2 (en) 2011-11-02 2015-04-21 Dell Products L.P. System and method for configuring an information handling system by implementing a customized configuration of a personality module
CN103322908A (zh) * 2012-03-23 2013-09-25 鸿富锦精密工业(深圳)有限公司 影像测量程序生成系统及方法
US10136558B2 (en) * 2014-07-30 2018-11-20 Dell Products L.P. Information handling system thermal management enhanced by estimated energy states
CA2904455C (en) * 2014-09-22 2023-03-21 Embrionix Design Inc. Standardized hot-pluggable transceiving unit and method for controlling the unit through a web server function
US9990325B2 (en) 2015-04-10 2018-06-05 International Business Machines Corporation Universal serial bus (USB) filter hub malicious code prevention system
CN106294088B (zh) * 2015-06-12 2019-04-26 联想(北京)有限公司 一种信息处理方法及电子设备
US10303883B2 (en) * 2016-10-25 2019-05-28 Hewlett Packard Enterprise Development Lp Firmware verification through data ports
CN109117330A (zh) * 2018-07-27 2019-01-01 郑州云海信息技术有限公司 一种ssd上下电的测试方法、测试系统及相关装置
AT522657A1 (de) * 2019-05-20 2020-12-15 B & R Ind Automation Gmbh Funktionseinheit mit Recheneinheit
CN117407354B (zh) * 2023-12-15 2024-04-26 深圳市天辰防务通信技术有限公司 主控板、计算机组合装置及显示控制台

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030033466A1 (en) * 2001-08-07 2003-02-13 Larson Thane M. Server system with multiple management user interfaces
US20060023384A1 (en) * 2004-07-28 2006-02-02 Udayan Mukherjee Systems, apparatus and methods capable of shelf management
WO2006014400A1 (en) * 2004-07-06 2006-02-09 Intel Corporation System and method to detect errors and predict potential failures
US7024695B1 (en) * 1999-12-30 2006-04-04 Intel Corporation Method and apparatus for secure remote system management

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5732212A (en) * 1992-10-23 1998-03-24 Fox Network Systems, Inc. System and method for remote monitoring and operation of personal computers
US6338150B1 (en) * 1997-05-13 2002-01-08 Micron Technology, Inc. Diagnostic and managing distributed processor system
US6349393B1 (en) * 1999-01-29 2002-02-19 International Business Machines Corporation Method and apparatus for training an automated software test
DE10007511A1 (de) 2000-02-18 2001-09-27 Indakom Gmbh Verfahren und Vorrichtung zur Fernwartung von Computer mit masterfähigem Bus
US6763456B1 (en) * 2000-02-25 2004-07-13 Intel Corporation Self correcting server with automatic error handling
US6694455B1 (en) * 2000-06-16 2004-02-17 Ciena Corporation Communications network and method performing distributed processing of fault and alarm objects
US6892332B1 (en) * 2001-11-01 2005-05-10 Advanced Micro Devices, Inc. Hardware interlock mechanism using a watchdog timer
US20030115397A1 (en) * 2001-12-14 2003-06-19 Hawkins Pete A. Computer system with dedicated system management buses
US6970804B2 (en) * 2002-12-17 2005-11-29 Xerox Corporation Automated self-learning diagnostic system
JP4606273B2 (ja) * 2004-08-30 2011-01-05 株式会社リコー ログ収集装置,ログ収集プログラム
US20060085690A1 (en) * 2004-10-15 2006-04-20 Dell Products L.P. Method to chain events in a system event log
US8001527B1 (en) * 2004-12-21 2011-08-16 Zenprise, Inc. Automated root cause analysis of problems associated with software application deployments
US7614043B2 (en) * 2005-08-26 2009-11-03 Microsoft Corporation Automated product defects analysis and reporting
US8191099B2 (en) * 2006-04-28 2012-05-29 Johnson Lee R Automated analysis of collected field data for error detection
US20070293232A1 (en) * 2006-06-20 2007-12-20 Aruze Corp. Wireless communication failure monitoring system and monitoring device
US20080098357A1 (en) * 2006-10-23 2008-04-24 Candelore Brant L Phantom information commands
US8296808B2 (en) * 2006-10-23 2012-10-23 Sony Corporation Metadata from image recognition

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7024695B1 (en) * 1999-12-30 2006-04-04 Intel Corporation Method and apparatus for secure remote system management
US20030033466A1 (en) * 2001-08-07 2003-02-13 Larson Thane M. Server system with multiple management user interfaces
WO2006014400A1 (en) * 2004-07-06 2006-02-09 Intel Corporation System and method to detect errors and predict potential failures
US20060023384A1 (en) * 2004-07-28 2006-02-02 Udayan Mukherjee Systems, apparatus and methods capable of shelf management

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ANONYMOUS: "certonCHARM flyer", vol. -, no. -, March 2007 (2007-03-01), pages 1 - 2, XP002501076, Retrieved from the Internet <URL:http://studioraid.com/Info/CertonCHARM.pdf> *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111552615A (zh) * 2020-04-30 2020-08-18 深圳市智微智能软件开发有限公司 独立的计算机状态监测方法、装置、设备及存储介质

Also Published As

Publication number Publication date
US8806278B2 (en) 2014-08-12
US20100262863A1 (en) 2010-10-14
DE102007033346A1 (de) 2009-05-20

Similar Documents

Publication Publication Date Title
WO2009010277A1 (de) Verfahren und vorrichtung zur administration von computern
CN106502853B (zh) 嵌入式智能故障检测报警系统
DE102012210914B4 (de) Switch-Fabric-Management
DE102006048115B4 (de) System und Verfahren zum Aufzeichnen von behebbaren Fehlern
DE112012000772B4 (de) Anomalieerkennungssystem
DE102004039237B4 (de) Lüfter-Steuerungssystem
WO2006015633A1 (de) Vorrichtung und verfahren zum konfigurieren einer datenverarbeitungsanlage
DE102018113625A1 (de) Fehlerinjektionstestvorrichtung und -verfahren
DE102018122152A1 (de) Systeme und verfahren zur eindringungserkennung in das netzwerk im fahrzeug
US7293102B2 (en) Method and apparatus for storing data and replaying stored data in a temporally accurate manner
DE102011085335A1 (de) Auf rack-ebene modulares server- und speicher-framework
DE102018122143A1 (de) Systeme und verfahren zur eindringungserkennung in das netzwerk im fahrzeug
DE10124514A1 (de) Fehlertolerante, gemeinsam genutzte Systemressource mit einem Hochverfügbarkeitskommunikationen bereitstellenden Kommunikationsdurchgang
CN107357671A (zh) 一种故障处理方法、相关装置及计算机
CN110851320A (zh) 一种服务器宕机监管方法、系统、终端及存储介质
DE102012210582A1 (de) Verringern der Auswirkung des Ausfalls einer Vermittlungsstelle in einem Schaltnetzwerk mittels Schaltkarten
DE68922440T2 (de) Gerät und Verfahren zur gleichzeitigen Einreichung von Fehlerunterbrechung und Fehlerdaten zu einem Unterstützungsprozessor.
EP3726408A1 (de) Industrielles automatisierungsgerät umfassend eine überwachungseinheit zur überprüfung und überwachung eines integritätszustandes des industriellen automatisierungsgerätes
DE10220886A1 (de) Datenspeichersysteme mit verbesserten Netzwerkschnittstellen
DE102018120328A1 (de) Sicherheitseinrichtung mit erweiterter Zuverlässigkeit
DE102014118293A1 (de) System und Verfahren zur Überwachung eines Produktionssystems
DE102014118290A1 (de) Verfahren zum Konfigurieren einer Steuerungseinrichtung für ein Produktionssystem und ein solches Produktionssystem
DE102020114099A1 (de) Funktionale sicherheit über verfolgung-und-fehlerbeseitigung
WO2006018122A2 (de) Einbaukarte zum an-und abschalten einer datenverarbeitungseinrichtung
EP1410205A2 (de) Verfahren bzw.vorrichtung zur überwachung und steuerung des betriebsverhaltens eines computer- oder prozessorsystems

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 08784804

Country of ref document: EP

Kind code of ref document: A1

DPE1 Request for preliminary examination filed after expiration of 19th month from priority date (pct application filed from 20040101)
DPE1 Request for preliminary examination filed after expiration of 19th month from priority date (pct application filed from 20040101)
NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 12669729

Country of ref document: US

122 Ep: pct application non-entry in european phase

Ref document number: 08784804

Country of ref document: EP

Kind code of ref document: A1