WO2019162104A1 - Verfahren zum automatischen steuern zumindest eines geräts eines gebäudes mittels eines gebäudemanagementsystems und gebäudemanagementsystem - Google Patents

Verfahren zum automatischen steuern zumindest eines geräts eines gebäudes mittels eines gebäudemanagementsystems und gebäudemanagementsystem Download PDF

Info

Publication number
WO2019162104A1
WO2019162104A1 PCT/EP2019/053096 EP2019053096W WO2019162104A1 WO 2019162104 A1 WO2019162104 A1 WO 2019162104A1 EP 2019053096 W EP2019053096 W EP 2019053096W WO 2019162104 A1 WO2019162104 A1 WO 2019162104A1
Authority
WO
WIPO (PCT)
Prior art keywords
user
building
control
management system
identified
Prior art date
Application number
PCT/EP2019/053096
Other languages
English (en)
French (fr)
Inventor
Fabio Galasso
Yi Li
Herbert Kaestle
Ling Wang
Bernhard Siessegger
Original Assignee
Osram Gmbh
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Osram Gmbh filed Critical Osram Gmbh
Publication of WO2019162104A1 publication Critical patent/WO2019162104A1/de

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B15/00Systems controlled by a computer
    • G05B15/02Systems controlled by a computer electric
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/2803Home automation networks
    • H04L12/2816Controlling appliance services of a home automation network by calling their functionalities
    • H04L12/282Controlling appliance services of a home automation network by calling their functionalities based on user interaction within the home

Definitions

  • the invention relates to a method for automatic
  • Object of the present invention is therefore, a
  • Controlling at least one device of a building by means of a building management system is in a learning phase of the
  • Building management system at least one user of the building based on at least one detected first
  • At least one control input is provided by the controller
  • the building management system determines control rules which are assigned to the at least one identified user and according to which the at least one device of the building
  • the building management system is controlled while the at least one user is in the building.
  • the inventive method has several more
  • the method according to the invention makes use of a learning method, so that during a learning phase of the building management system
  • Control behavior of the user with respect to the at least one device can be observed and from these
  • Observations control rules can be derived, according to which then ultimately the building management system can control the at least one device automatically in a second phase.
  • This has the advantage that a user does not have to configure the building management system himself and must himself specify control specifications.
  • These defaults are automatically learned automatically by the building management system by observing the user in the learning phase, while the user retraces the at least one device served his preferences.
  • the operation of the at least one device by the user is considered to be the above
  • automated control of at least one device in the second phase can be made user-specific. This is made possible by the fact that the at least one user of the building based on at least a first
  • User characteristic is identified. This advantageously enables finally a user-specific and individualized control of the at least one device of the building. For example, if different users are in the building one after the other, this can be
  • Building Management System always automatically adjust the control of the at least one device to the particular user currently in the building.
  • a room-specific control is possible, as will be described in more detail below, so that in the event that individual users are in the building in different rooms of the building, the control of the at least one device in each room on the in-room User can be customized. As a result, compromises must be found much easier even with multiple users of a building.
  • no user-specific control rules can be established. These once defined control rules then always apply, regardless of which user is currently in the building or in which room of the building. If a user wishes to implement another controller, he must manually adjust and modify the control rules.
  • Control rules takes place. For example, so can the
  • Room temperature in a particular room can be regulated to a value that suits the preferences of just this
  • Room user corresponds. For example, even if multiple users are in a room at the same time, the building management system can learn rules that are present when multiple users are present
  • the method according to the invention thus makes it possible to provide an automatic control of the at least one device of a building that is significantly simplified for a user and thus significantly better in reconciling different needs of several different users, which in turn is for a particular user significantly increased comfort.
  • the at least one device of the building can do this
  • a lighting device or a part of a lighting device such as a lamp, or a device that influences the room climate, such as a heater, air conditioning, a fan or ventilation, or the like.
  • the user can do and by the
  • Control of the at least one device by the user via any control device or control element are made, such as a light switch, a Remote control, or in general with a mobile
  • Communication device via a central control terminal, on individually provided in each room control units or control terminals or the like.
  • the controls or generally detecting means for detecting
  • Operator actions or the control inputs are advantageous both in the learning phase and for providing feedback for the later described Reinforced Learning or Q-Learning, as well as in Command Mode (Manual Mode).
  • the Q-Lerner can always observe and co-simulate users and their operating behavior in the background and improve their performance.
  • the at least one first user characteristic that the building management system detects to identify the user may, for example, include at least one facial feature, at least one feature relating to the appearance of the body, at least one fingerprint, at least one
  • Voice characteristic represent at least one gear identification or gear characteristic or the like. It is particularly advantageous if for identification of the at least one user a feature concerning the
  • Appearance of the face or the body of the user is detected because by detecting such features one
  • identification based on facial recognition is particular
  • Example with a camera, implement Furthermore, the
  • Identification of the at least one user Also an identification based on the voice characteristics of the user is possible.
  • a detected activity characteristic of the user can be used to identify the user, such as the above-mentioned gait characteristic, a movement characteristic, general activities of the user or characteristic behavior patterns of the user.
  • the second described below is a detected activity characteristic of the user.
  • User characteristics also serve to identify the at least one user. These detected first user characteristics can also be combined with each other in any desired manner. Especially a combination of two or more of the first described above
  • User characteristics may increase the reliability of the identification of the at least one user.
  • At least one second user characteristic of the at least one identified user is additionally determined during the learning phase, in particular an activity of the user
  • This second user characteristic thus preferably represents a behavior of the user or an activity of the at least one user.
  • the at least one control input made by the user for controlling the device can advantageously be placed in a context, and in particular also one
  • the building management system not only uses the user input and control inputs
  • Control inputs makes.
  • the behavior of the user in particular with regard to the control of the at least one device of the building, can thus be understood and learned much more efficiently by the building management system. This will allow in the second phase of
  • the at least one second user characteristic is determined as a function of at least one detected parameter of the following parameters: a detected posture of the at least one
  • At least one user such as gestures, or the movement of individual body parts, as well as its position and position history are observed to determine what activity a user is currently pursuing.
  • the at least one device can control automated.
  • To learn the Control rules can be used in various ways, which will be discussed in more detail later.
  • a conventional machine-learning method may use the currently prevalent activity of the
  • Action a gets depends. Also, Q-learning without model but with reward based on the quadruple Q (s, a, r, s') can be used, in which case the utility function Q additionally depends on the reward r that is given in the
  • User activities may include, for example, sitting at a table, for example at a desk, a group meeting, or a group meeting, a
  • Coffee break accidental running around or even a special one Event.
  • posture a parameter indicative of the parameters described above
  • movement of the user or his body parts a parameter indicative of the parameters described above.
  • the class of special events may represent the class which
  • Activities of the user are assigned, which are uniquely associated with any other defined class. In this way it is also possible to have one or more
  • the user activities can be divided may also depend on the type of building in which the building management system is used.
  • the activity classes described above are particularly advantageous when the
  • Building management system is used for example in an office building. In a residential building, on the other hand, or
  • other or other classes may be defined for the predetermined user activities, such as sleeping, cooking, watching TV, meeting friends, game nights, sports activities, or the like.
  • User behavior can be more effectively categorized and evaluated by providing these additional classes of activity.
  • the at least one second user characteristic ie
  • recognized keywords can be used to classify activities more accurately or reliably.
  • the keyword “coffee” may indicate a coffee break, or "bed” on a subsequent bedtime of the at least one user.
  • the reliability of the correct categorization of activities of the at least one user can be determined by the use of
  • Environment information for example, temperature, brightness,
  • Air purity, volume, etc. detected by at least one sensor, while the at least one
  • At least one environment information is determined.
  • environment information is determined.
  • Such environmental or environmental information can relate to the user environment within the building, but also on
  • Environmental information outside the building such as outside temperature, humidity, wind, etc. This
  • this environment information may also serve as a foreground feature for learning appropriate control actions
  • the room temperature can be within the
  • sensors by means of which this environmental information is detected can generally be light sensors, temperature sensors, humidity sensors, smoke sensors, air quality sensors, CO 2 sensors, or the like.
  • Control inputs by the user in a learning phase of the building management system turn into a context that is provided in this case by the environment information embedded.
  • a user makes certain settings of the at least one device of the building can thus also be learned in this context. This in turn increases the
  • User and behavior-derived rules for automatically controlling the at least one device more accurately reflect the needs and intentions of the user in particular situations. For example, it can be detected in the learning phase, from which brightness in the building a user tends to turn the light on or off or dim. This realization can then be used accordingly in the second phase, then to automate the light in the building according to these from the
  • Learning phase can be obtained in a memory with a corresponding time information, for example, respectively
  • Timestamping be filed. A respective one
  • Time interval tag i. the additional information
  • Environment information to a control input can also be used as an input for determining or learning the
  • Control rules that the building management system ultimately determines based on the user's observation during and / or after the learning phase are intended to serve when or under what circumstances, such as what activities and / or in which environment conditions, which settings are usually user-friendly to the user Device to be made or should be executed.
  • the building management system can automate these
  • the user behavior can advantageously be correlated with the control inputs made by the user in a significantly more accurate manner, and the motivation behind specific operator actions by the building management system can be understood and learned much better and more accurately.
  • Control input are taken into account for determining or learning and / or adapting the control rules.
  • the evaluation of the data can thus advantageously to predetermined periods of a detected
  • User input or control input may be limited by the user.
  • the advantages described above can be achieved even more and additionally also time in the analysis and also computing capacity
  • Information is limited. Alternatively or additionally, the information obtained in a short period of time after a control input by the user, that is in turn regarding his activities and / or the environment information, can also be used
  • Determining or learning the control rules, or to be used for their adaptation is advantageous because sometimes the reasons for a user's control input may be found in an activity performed after that input, for example, when a user lowers the temperature each time he or she sleeps, or turns off the light before exiting the building.
  • the causal relationships between the user behavior, the environment information and the control input made can be derived much better and more accurate and then
  • control rules can be modified and adapted.
  • the information gained during the second phase can also be used to further adapt the control rules, to further refine the automated control and to tailor it more specifically to the needs of the user.
  • the at least one first and / or second user characteristic and / or the environment information again determined and the at least one device in response to the newly determined first and / or second user characteristics and / or
  • Control rules are assigned corresponding control input, which the user in the given situation
  • the building has several rooms and / or floors, wherein the control of the at least one device is performed separately for each room and / or for each floor.
  • the measures described above can thus separately for a
  • the building management system can learn actions depending on the location.
  • the place in the building, i. the floor and / or the room or the room can also serve as an input for learning the control rules.
  • the behavior of a user relates to the control of the at least one device different floors also varies, for example, user habits, for example, in terms of dimming or the heating, in a basement often different than the ground floor.
  • control of the at least one device is carried out depending on whether the at least one user is the only person in the building, in particular in a room of the building, or if the at least one user part is a user group of several Users are at the same time in the building, especially in a room of the building. Even in the learning phase, it is possible that
  • User behavior especially with respect to the control of the at least one device to capture and analyze, and in addition to take into account or distinguish whether the user is currently alone in a room or in the building in general, or part of a
  • control of the at least one device in the second phase can thus also be advantageously adapted to the behavior of the user, depending on whether this person is in a room as an individual or is part of a group.
  • identities of the respective group members can also be used in such an adaptation
  • control rules determined by the building management system can thus advantageously not only vary from user to user, but also from user group to user group. For example, for a specific user group consisting of several certain identified users
  • Appropriate control rules are determined, which are optimal for the respective user group and reflect the preferences of this group with respect to the control of the at least one device as well as possible.
  • control rules or learns and / or adapts the learned or learned control rules and performs the control.
  • an agent autonomously learns a strategy to maximize the rewards he receives.
  • the intelligent agent gets one
  • the method is thus to minimize the number of manual control inputs made by the user, and in particular ideally to completely eliminate them.
  • the control inputs made by the user thus provide feedback, i. a feedback for the
  • Control rules are changed, in particular such that in turn the reward is maximized. This procedure is continually repeated by the building management system until the number of manually entered control inputs by the user is reduced and ultimately none
  • Control inputs are made by the user more.
  • it can be provided, for example, that after each action that is performed by the intelligent agent, that is, for example, in each control action for controlling the at least one device by the intelligent agent.
  • Control input has been performed by the at least one identified user, for example, within a predetermined period of time after the performed by the intelligent agent and the at least one device
  • the intelligent agent gets the reward.
  • the intelligent agent can thus advantageously adapt the control rules step by step with the aim of optimizing its reward and thereby continually improve its control strategy. For this purpose, new information can always be used. Therefore, it represents a further advantageous embodiment of the invention, when the intelligent agent gradually the
  • Control rules associated with the at least one user based on newly acquired information concerning the at least one user, in particular newly determined second user characteristics and newly detected
  • Actions are resorted to, but also to novel unknown action according to the so-called off-policy Q-learning. This is beneficial because of users
  • Switch actions are explored.
  • new, i.e. Tried by a user not vorlarebte selections of action sequences and learned by this.
  • the system can start up the shutters immediately before entering the room without switching on the light, even though this sequence of actions has not been exemplified by the user. Whether this series of actions actually for
  • control rules are varied by extended Q-learning, in particular so that energy consumption and user comfort
  • the user comfort may be sized in accordance with the control inputs made by the at least one user, in particular depending on the occurrence of control inputs made by the user.
  • the energy consumption of the at least one device can, for example, in the
  • Learning phase can be determined by the energy consumption is measured by suitable detection means. In other words, it is possible to deviate from the control rules learned based on the user behavior such that this variation reduces or optimizes the energy consumption. Subsequently, the user-side acceptance of this deviation or variation is checked by checking whether within a predeterminable period of time after the
  • the building management system determines for each possible defined setting of the at least one device a Q value that reflects the probability that the
  • certain state is determined by at least one, preferably several, more preferably all of the following state parameters: a user ID corresponding to the
  • User characteristic that is, the activity currently being performed by the user, is the current state of the user
  • At least one device that is, for example, in which current setting the device is currently located, as well as the at least one environment information, for
  • Example the current room temperature, brightness, or the like.
  • the neural network determines which of the possible settings of the Users in this given situation now on
  • the Q value represents the integral R value, where the R value represents the numerical value of the reward described above.
  • the system determines which rewards can be expected from the given states by performing certain control actions to control the at least one device. For example, this will only be a one-off
  • Control action is considered, starting from the current state that is selected, which leads to the new state with the largest expected R value. If, on the other hand, a plurality of control actions are to be carried out one after the other in order to get from a given state to a specific targeted state, the path or sequence of control actions is selected which maximizes the sum of the individual R values to be expected in this way. This integral R value is described by the above Q value.
  • This conversion can additionally be linked to the further condition that the Q value calculated in this way exceeds a specific limit value.
  • the calculation of the Q value is preferably based on the control rules determined as a function of the user behavior.
  • Control actions the determination of the optimal switching sequence can be very complex, the use of a neural network is particularly advantageous.
  • control rules are determined and / or adjusted depending on at least one predetermined energy saving condition. This can be advantageously also
  • Energy saving condition for example, provide that if the at least one user, especially all users of a building, have left this building, the at least one device, such as a heater or the light, is turned off or at least reduced in its performance. Also, for example, the lights in a particular room can be turned off as soon as there is no user left in the room.
  • a further example of such an energy-saving condition may be, for example, that if two different settings for the at least one device have at least approximately the same probability according to the Q value described above
  • Building Management System implements the setting with the lower energy consumption. In addition to these additional features
  • optional energy saving conditions which allow a particularly efficient operation of the at least one device, and additionally bring this efficient operation in accordance with the preferences of a user, already by the fact that the control of the at least one device of the building automated
  • the Agent also learns advanced settings that are not pre-programmed by the user, but which are far more energy efficient and still accepted by the user, as described above, for example.
  • the intelligent agent with video sensors for tracking the position of the at least one user is connected, wherein the video sensors a sensor-integrated deep learning method for tracking the position of the at least one user, and in particular for recognizing or re-identifying of the at least one user in the event that the at least one user leaves a first field of view of a first video sensor of the video sensors and a second field of view of a second video sensor of
  • Video sensors enter, use, with the first
  • At least one camera is preferably arranged in a respective room or room of the building.
  • the above-described room-specific control of the at least one device can be implemented.
  • This camera system is particularly advantageous in particular with regard to the user-specific control of the at least one device, because in the event that several persons or users are in the building at the same time, the positions of the respective users and also their position profile are detected by means of the camera system can, especially without confusing the user.
  • These cameras can be used not only for tracking the position of the user, but also, for example, to determine the at least one second user characteristic, that is, for example, the actions currently being performed by the user. Since enormously large amounts of data can arise in the case of image or video recordings, it is particularly advantageous if the video sensors themselves have a sensor-integrated deep-learning method, by means of which the
  • the individual video sensors are designed to recognize the at least one user.
  • the individual video sensors may be accompanied by the same
  • Identification of the at least one user also suitable recognition features of this user are detected.
  • Particularly suitable for this purpose are identification features which relate to the external appearance of the user, such as the clothing, the color of the clothing, hair color or
  • Video sensor system significantly cheaper and easier to be designed.
  • the invention also relates to a
  • Building management system for automatically controlling at least one device of a building, wherein the
  • Building management system designed to automatically in a second phase of the building management system, the at least one device of the building automatically according to the determined
  • Embodiments described advantages apply in the same way for the building management system according to the invention.
  • Inventory management system by further corresponding objective features.
  • the building management system can be divided into several levels or layers. This includes, for example, a physical layer that includes the hardware within the building, including individual devices, transducers, and network hardware. Furthermore, it is preferred that most electrical components of the building management system utilize data transmission over power cables of the building.
  • the cable-based networking is based on
  • Interfaces of the various sensors for example cameras, microphones and environmental sensors, on Ethernet, RS-485 and / or CAN.
  • Networking can also be wireless
  • a wireless network or a wireless mesh network can advantageously the cost of a complex Avoid wiring in case of retrofitting and speed up the installation.
  • Another level represents the level of communication that facilitates the exchange of information and requests between the agent and the devices, or
  • Communication level also forwards actions to be performed to suitable effectors and actuators or switch actuators for execution.
  • Communication protocols such as KNX, Lonworks, Dali, BACnet, LonMark, and Modbus, i.
  • Another level represents the informational level that the
  • the task of collecting and storing the status data of the sensors takes over to generate knowledge that can be used by the agent.
  • the information layer stores the knowledge obtained in a database and updates the learned concepts to control the devices of the building.
  • the informational level also notifies the
  • the decision level includes the intelligent agent that controls the devices according to the general status at the information level.
  • the intelligent agent is the decision-making component of the building management system or the
  • the intelligent agent can also change the decision process to several different ones
  • the intelligent agent may be designed as described above and incorporate artificial intelligence and machine learning techniques that enable the analysis of comprehensive data sets of video and audio sensors as well as environmental sensors.
  • the intelligent agent uses deep learning technology, which allows the definition of features at the raw data level (video frames, audio sequences and counter readings), and
  • the artificial intelligence is now used to the discretion of the current state and not yet to decide on the subsequent decision switching action.
  • the evaluation and classification of image data and audio signals with deep-learning methods is done for the purpose of measuring the current condition.
  • the person and their activity are recognized in the picture.
  • the intelligent agent thus also recognizes the activities of the users based on their detection and tracking.
  • the intelligent agent also manages situations in which many users are in the same environment at the same time, especially with the ability to behave in the same way as a single user in a multi-user environment
  • the agent tries to learn by on-line simulation the control action that has been taken out of the context, in order subsequently to implement it in the automode, i. the second phase, to implement independently to the fullest user satisfaction, whereby as a constraint the energy consumption of the building should be kept low. User satisfaction can then be measured by the user's manual control actions.
  • the intelligent agent algorithm adapts itself, in particular by accessing multiple long-term observation data with human responses, ie the control inputs that provide training data for behavioral action patterns with the preferences and needs of the users. Also, the intelligent agent is designed to try and learn new selections of action sequences, especially through advanced Q-learning.
  • the invention also includes the combinations of the described embodiments.
  • Fig. 1 is a schematic representation of a building with
  • Fig. 2 is a schematic representation of individual
  • Fig. 3 is a schematic representation of the learning phase of
  • Fig. 4 is a schematic representation of a second phase of
  • FIG. 1 shows a schematic representation of a building 10 with a building management system 12 according to a
  • the building 10 has an entrance area 14, as well as several rooms 16, of which three are shown here by way of example.
  • the building 10 includes a plurality of devices to be controlled 18. These devices 18 are preferably the lighting and / or the
  • Lamps, heating, fans and / or air conditioning are arranged in each of the rooms, such as in the case of lamps or fans, or at least by means of such a device 18, a room-specific control is possible, for example in the case of heating or air conditioning.
  • the building management system 12 includes several
  • various sensors that are networked together. These include, for example, a camera system with a plurality of cameras. Preferably, at least one camera is arranged in a respective room. This can
  • a respective camera 20 has an associated field of view 22, which has a maximum
  • a camera 20 can also be arranged in the input area 14,
  • Microphones 26 may be arranged, as well as environmental sensors 28.
  • environmental sensors 28 may, for example, light sensors
  • the building management system 12 includes a
  • the building management system 12 also has a memory 34.
  • the building management system 12 is an identity-based, automated building management system that integrates in the
  • Mainframe 32 implemented empowering learning method used to customize the habits, preferences and
  • Entrance area 14 of the building 10 this user Bl by the user identification system 24, in particular by means of a face recognition device using the camera 20 of the user identification system 24th
  • User characteristics CI of the first user Bl shown in its user profile PI can thus be detected by the user identification system 24 as soon as a user Bl, B2, B3, B4
  • Entry area 14 enters.
  • a first user characteristic CI is detected by means of the user identification system 24, such as Example of one or more facial features, and with the in memory 34 to the respective user profiles PI, P2
  • Identification is assigned to the user Bl a corresponding and stored in his user profile PI ID ID1.
  • recognition features W1 are additionally detected in the entrance area 14, which is achieved by the aforementioned additional camera not shown here, for example, on the ceiling of the
  • Entrance 14 or can be mounted on a wall, can be accomplished.
  • Such recognition features W1 preferably do not represent facial features, but rather those that are particularly easy to detect by means of more distant cameras 20, in particular also from different angles of view, such as
  • Control inputs SE which make the user Bl, B2, B3, B4 by means of corresponding controls 36 for controlling or operating the respective devices 18 detected. But not only such control inputs SE are detected, but also the behavior of the respective users Bl, B2, B3, B4. For this purpose, both the position and the position profile of the respective user Bl, B2, B3, B4 tracked or tracked, whose posture, gestures or other movements are detected, and on the basis of this recorded behavioral information, the user behavior can be classified. In other words, one of several defined actions or actions can be assigned to the current user behavior, such as
  • Control inputs SE as well as the actions performed by the users over time can be put into the
  • Timestamps are stored. To the classification of the
  • user behavior may also be used by acoustic sensors, such as microphones 26.
  • acoustic sensors such as microphones 26.
  • the building management system 12 is able to learn user habits regarding the use of the devices 18 of the building 10.
  • the building management system 12 distinguishes the habits of a user Bl, B2, B3, B4 as an individual and the user
  • this is done without the building management system 12 any specifications must be made.
  • This automatically learns the behavior of the respective user Bl, B2, B3, B4 and then sets it accordingly in the second phase, the application phase. If a user Bl, B2, B3, B4 still takes a control input SE to change a setting on one of the devices 18 in this second phase, then this control input SE may be sent to the building management system 12 as feedback, i. Feedback, fed. Based on this feedback, the control rules RI previously determined for the relevant room 16 and the relevant user Bl, B2, B3, B4 can be adapted. This will be described later in detail.
  • Fig. 2 shows a schematic representation of individual
  • System components in particular the three main components of the building management system 12 according to a
  • Main components represent the user identification system 24, which is preferred as a face recognition system
  • a user B appears in the entrance area 14 of the building, this is identified by means of the user identification system 24 as described above and its corresponding identifier ID is assigned to the user User Recognition System 38.
  • Recognition features W1 of the user B which can be realized for example as described above by means of a camera arranged in the input area 14.
  • Recognition features W1 preferably represent features relating to the user B's appearance.
  • the user recognition system 38 now associates the identifier ID of the user B with its detected one
  • Recognition features W1 and stores them in memory 34. Now enters the user B (another) room 16 of the building, the user B is based on the stored recognition features W1 by the user B (another) room 16 of the building, the user B is based on the stored recognition features W1 by the user B (another) room 16 of the building.
  • User recognition system 38 re-identifies and retrieves the identification ID associated with the recognized user B from the memory 34 and transmits it to the reinforcing learning system 40.
  • the reinforcing learning system 40 now uses the transmitted identifier ID to in a learning phase the
  • the application phase of the reinforcing learning system 40 the identifier ID is used to now implement the control of the devices 18 in accordance with the control rules RI determined for this user B.
  • the core of this reinforcing learning is the so-called deep-Q learning, which uses an artificial neural network ANN as an intelligent agent, which will now be described with reference to FIG. 3.
  • Fig. 3 shows a schematic representation of the
  • state parameters ZI, Z2, Z3, Z4 represent the current state ZI or the current setting of a respective device 18, the sensor data Z2,
  • displayed state parameters preferably represent the room 16 and / or the floor, in which the
  • the device 18 is one
  • Illumination device so can the following
  • Possible settings ZI be provided: on, off, dimming, color and a brightness change scheme. If the device 18 is a heater, the following setting options ZI can be provided: on, off, heating degree or
  • the following setting options ZI can be provided: on, off, fan speed. If the device 18, an air conditioner, so the following settings ZI can be provided: on, off, mode, fan speed,
  • the artificial neural network ANN is additionally supplied with the control inputs SE made by the user B, Bl, B2, B3, B4 as feedback. Depending on these input variables
  • the artificial neural network ANN now determines one
  • Control information SE would have been minimized. In the learning phase LP itself, however, no automatic controls are performed and the agent only observes. However, the Agent at the same time his hypothetical activities and
  • the intelligent agent receives, that is in this case the
  • the empowering learning system 40 in which the artificial neural network ANN is used, ultimately chooses the control rules so that the reward is maximized. In other words, it tries to completely avoid the user manual B, Bl, B2, B3, B4 manual control inputs SE and thus to achieve full automation of the control of the devices 18. In the learning phase LP, therefore, the feedback of the user in the form of their done
  • Control inputs SE used to train the artificial neural network ANN are used to train the artificial neural network ANN.
  • each state Z is an R value, i. the
  • the agent can collect when he starts this state Z.
  • the quality of the states Z is explored or determined.
  • the user B, Bl, B2, B3, B4 in the learning phase LP makes a certain control input SE starting from a given state Z, in order to reach another state Z, this other state approached from the given state Z can Z be assigned a high R value.
  • the target states Z that a user B, Bl, B2, B3, B4 approaches more frequently than others starting from a given state Z are respectively rated higher in learning phase LP than others.
  • by the reward also
  • a state Z with a lower power consumption can be assigned a higher R value than a state Z with a higher energy consumption.
  • the reward can be in addition to the
  • User preferences also be dependent on the energy consumption of a state Z.
  • the intelligent agent can subsequently calculate a policy (plan) in order to arrive at intermediate states with as many R values as possible from one now state Z to another end state Z. This corresponds to a Markov
  • Fig. 4 shows a schematic representation of
  • Application phase AP which follows the learning phase LP.
  • the artificial neural network ANN again receives the already described to Fig. 3 state parameters ZI, Z2, Z3, Z4 as input parameters.
  • the artificial neural network ANN now calculates a change in the degree of dimming for each possible setting of the devices 18, that is, for example, the switching on and off of the relevant device 18
  • This Q value represents the probability that for the given input state Z the
  • the settings thus determined for the respective devices 18 can be provided as preliminary settings VE by the control unit 30.
  • these preliminary settings VE can still be compared with certain boundary conditions R, which concern the energy efficiency. This match will eventually return the final FE settings and will be replaced by a
  • the agent can also in the
  • Condition Z certainly not desirable. Accordingly, for example, the R value assigned to this state Z which has been hit by the system can be reduced.

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Air Conditioning Control Device (AREA)

Abstract

Die Erfindung betrifft ein Verfahren zum automatischen Steuern zumindest eines Geräts (18) eines Gebäudes (10) mittels eines Gebäudemanagementsystems (12), wobei in einer Lernphase (LP) mindestens ein Benutzer (B, B1, B2, B3, B4) des Gebäudes (10) auf Basis zumindest einer erfassten ersten Benutzercharakteristik (C1) identifiziert wird, mindestens eine Steuerungseingabe (SE), welche durch den mindestens einen Benutzer (B, B1, B2, B3, B4) zum Steuern des zumindest einen Geräts (18) getätigt wird, erfasst wird, während sich der mindestens eine identifizierte Benutzer (B, B1, B2, B3, B4) im Gebäude (10) befindet, und in Abhängigkeit von der mindestens einer erfassten Steuerungseingabe (SE) des mindestens einen identifizierten Benutzers (B, B1, B2, B3, B4) das Gebäudemanagementsystem (12) Steuerungsregeln (R1) ermittelt, die dem mindestens einen identifizierten Benutzer (B, B1, B2, B3, B4) zugeordnet sind und gemäß welchen das zumindest eine Gerät (18) des Gebäudes (10) automatisch in einer zweiten Phase (AP) des Gebäudemanagementsystems (12) gesteuert wird, während sich der mindestens einen Benutzer (B, B1, B2, B3, B4) im Gebäude (10) befindet.

Description

VERFAHREN ZUM AUTOMATISCHEN STEUERN ZUMINDEST EINES GERÄTS EINES GEBÄUDES MITTELS EINES GEBÄUDEMANAGEMENTSYSTEMS UND
GEBÄUDEMANAGEMENTSYSTEM
BESCHREIBUNG
Die Erfindung betrifft ein Verfahren zum automatischen
Steuern zumindest eines Geräts eines Gebäudes mittels eines Gebäudemanagementsystems, sowie ein Gebäudemanagementsystem.
Aus dem Stand der Technik sind Gebäudemanagementsysteme bekannt, mittels welchen sich Geräte eines Gebäudes, wie zum Beispiel die Heizung oder auch das Licht, automatisch steuern oder regeln lassen. Die Zielvorgaben für die Steuerung beziehungsweise Regelung, zum Beispiel die Soll- Raumtemperatur, werden dabei von den jeweiligen Benutzern eines Gebäudes vorgegeben. Aufgrund der zunehmenden
Komplexität solcher Gebäudemanagementsysteme wird es für Benutzer zunehmend schwerer, derartige Systeme richtig zu konfigurieren. Dies erfordert damit oftmals technische
Experten. Ein weiterer Nachteil besteht zudem auch darin, dass, wenn es mehrere Benutzer eines Gebäudes gibt, zum
Beispiel mehrere Bewohner eines Hauses, mitunter sehr starke Kompromisse eingegangen werden müssen, da sich
widersprechende Zielvorgaben, die zu unterschiedlichen
Bedürfnissen oder Wünschen verschiedener Personen
beziehungsweise Benutzer eines Hauses korrespondieren, nicht gleichzeitig umsetzen lassen.
Aufgabe der vorliegenden Erfindung ist es daher, ein
Verfahren zum automatischen Steuern zumindest eines Geräts eines Gebäudes und ein Gebäudemanagementsystem
bereitzustellen, welche es ermöglichen, den Komfort für die Bewohner oder Benutzer eines Gebäudes zu erhöhen.
Diese Aufgabe wird gelöst durch ein Verfahren zum
automatischen Steuern zumindest eines Geräts eines Gebäudes und durch ein Gebäudemanagementsystem mit den Merkmalen gemäß den jeweiligen unabhängigen Ansprüchen. Vorteilhafte
Ausgestaltungen der Erfindung sind Gegenstand der abhängigen Patentansprüche, der Beschreibung, sowie der Figuren.
Bei einem erfindungsgemäßen Verfahren zum automatischen
Steuern zumindest eines Geräts eines Gebäudes mittels eines Gebäudemanagementsystems wird in einer Lernphase des
Gebäudemanagementsystems mindestens ein Benutzer des Gebäudes auf Basis zumindest einer erfassten ersten
Benutzercharakteristik identifiziert. Darüber hinaus wird mindestens eine Steuerungseingabe, welche durch den
mindestens einen Benutzer zum Steuern des zumindest einen Geräts getätigt wird, erfasst, während sich der mindestens eine identifizierte Benutzer im Gebäude befindet. Weiterhin ermittelt das Gebäudemanagementsystem in Abhängigkeit von der mindestens einen erfassten Steuerungseingabe des mindestens einen identifizierten Benutzers Steuerungsregeln, die dem mindestens einen identifizierten Benutzer zugeordnet sind und gemäß welchen das zumindest eine Gerät des Gebäudes
automatisch in einer zweiten Phase des
Gebäudemanagementsystems gesteuert wird, während sich der mindestens einen Benutzer im Gebäude befindet.
Das erfindungsgemäße Verfahren hat dabei gleich mehrere
Vorteile. Zum einen macht das erfindungsgemäße Verfahren von einem lernenden Verfahren gebraucht, sodass während einer Lernphase des Gebäudemanagementsystems das
Steuerungsverhalten des Benutzers bezüglich des zumindest einen Geräts beobachtet werden kann und aus diesen
Beobachtungen Steuerungsregeln abgeleitet werden können, gemäß welchen dann letztendlich das Gebäudemanagementsystem das zumindest einen Gerät automatisch in einer zweiten Phase steuern kann. Dies hat den Vorteil, dass ein Benutzer das Gebäudemanagementsystem nicht selbst konfigurieren muss und selbst Steuerungsvorgaben spezifizieren muss. Diese Vorgaben werden automatisch von dem Gebäudemanagementsystem durch Beobachtung des Benutzers in der Lernphase selbsttätig gelernt, während der Benutzer das zumindest eine Gerät nach seinen Vorlieben bedient. Die Bedienung des zumindest einen Geräts durch den Benutzer wird als die oben genannte
Steuerungseingabe erfasst. Darunter ist insbesondere jegliche Art von Bedienhandlung des Benutzers zur Bedienung des zumindest einen Geräts zu verstehen. Besonders vorteilhaft ist es dabei aber vor allem, dass sowohl das Erlernen des Benutzerverhaltens in der Lernphase als auch die
automatisierte Steuerung des zumindest einen Geräts in der zweiten Phase benutzerspezifisch erfolgen kann. Ermöglicht wird dies dadurch, dass der mindestens eine Benutzer des Gebäudes auf Basis zumindest einer ersten
Benutzercharakteristik identifiziert wird. Diese ermöglicht vorteilhafter Weise letztendlich eine benutzerspezifische und individualisierte Steuerung des zumindest einen Geräts des Gebäudes. Befinden sich verschiedene Benutzer beispielsweise zeitlich nacheinander im Gebäude, so kann das
Gebäudemanagementsystem die Steuerung des mindestens einen Geräts immer automatisch an den jeweiligen gerade im Gebäude befindlichen Benutzer anpassen. Insbesondere ist auch eine zimmerspezifische Steuerung möglich, wie dies nachfolgend noch näher beschrieben wird, so dass für den Fall, dass sich einzelne Benutzer im Gebäude in verschiedenen Zimmern des Gebäudes befinden, die Steuerung des zumindest einen Geräts in jedem Zimmer auf den in dem Zimmer befindlichen Benutzer angepasst durchgeführt werden kann. Hierdurch müssen also auch bei mehreren Benutzern eines Gebäudes deutlich einfacher Kompromisse gefunden werden. Bei einem System dagegen, bei welchem vorab Steuerungsregeln festgelegt werden müssen, gemäß welchen dann Geräte des Gebäudes gesteuert werden, können keine benutzerspezifischen Steuerungsregeln festgelegt werden. Diese einmal festgelegten Steuerungsregeln gelten dann immer, unabhängig davon, welcher Benutzer sich gerade im Gebäude oder in welchem Zimmer des Gebäudes befindet. Möchte ein Benutzer eine andere Steuerung umgesetzt haben, so muss er die Steuerungsregeln manuell anpassen und abändern.
Die Erfindung ermöglicht es dagegen, wenn sich also
beispielsweise mehrere unterschiedliche Benutzer im Gebäude befinden, zum Beispiel auch in unterschiedlichen Zimmern, dass für die jeweiligen Zimmer des Gebäudes eine individuelle Steuerung des zumindest einen Geräts gemäß den für die jeweilige unterschiedlichen Benutzer ermittelten
Steuerungsregeln erfolgt. Beispielsweise kann also die
Zimmertemperatur in einem jeweiligen Zimmer auf einen Wert geregelt werden, der den Vorlieben des gerade in diesem
Zimmer befindlichen Benutzers entspricht. Auch wenn sich mehrere Benutzer zum gleichen Zeitpunkt in einem Zimmer befinden, kann das Gebäudemanagementsystem beispielsweise Regeln erlernen, die bei Anwesenheit mehrerer Nutzer
allgemeingültig sind, und die dann, wenn sich diese Benutzer in der zweiten Phase wiederum gemeinsam in einem Zimmer des Gebäudes befinden, können diese Regeln für die bestimmte Benutzergruppe angewandt werden. Hierdurch lassen sich die Gewohnheiten und Vorlieben mehrerer Benutzer gleichzeitig berücksichtigen .
Insgesamt ermöglicht es das erfindungsgemäße Verfahren somit, eine für einen Benutzer deutlich vereinfachte und damit deutlich komfortablere automatische Steuerung des zumindest einen Geräts eines Gebäudes bereitzustellen, sowie zudem auch unterschiedliche Bedürfnisse mehrerer verschiedener Benutzer miteinander deutlich besser in Einklang zu bringen, was wiederum für einen jeweiligen Benutzer den Komfort deutlich erhöht .
Das zumindest eine Gerät des Gebäudes kann dabei
beispielsweise eine Beleuchtungseinrichtung oder einen Teil einer Beleuchtungseinrichtung, wie zum Beispiel eine Lampe, darstellen, oder ein das Raumklima beeinflussendes Gerät, wie zum Beispiel eine Heizung, eine Klimaanlage, einen Ventilator beziehungsweise eine Lüftung, oder ähnliches. Weiterhin kann der vom Benutzer getätigte und durch das
Gebäudemanagementsystem erfasste Steuerungseingabe zur
Steuerung des zumindest einen Geräts vom Benutzer über jedes beliebige Bediengerät beziehungsweise Bedienelement getätigt werden, wie zum Beispiel einen Lichtschalter, eine Fernbedienung, oder im allgemeinen mit einem mobilen
Kommunikationsgerät, über ein zentrales Steuerterminal, über in jeweiligen Räumen einzeln vorgesehene Bedieneinheiten oder Steuerterminals oder ähnliches. Die Bedienungselemente, oder im Allgemeinen Erfassungsmittel zur Erfassung von
Bedienhandlungen bzw. der Steuerungseingaben, sind sowohl in der Lernphase und zur Bereitstellung einer Rückmeldung für das später beschriebene Reinforced Learning, bzw. Q-Learning vorteilhaft, sowie auch im Command-Mode (Manual-Mode) . Hier kann der Q-Lerner beispielsweise im Hintergrund Benutzer und ihr Bedienverhalten stets mitbeobachten bzw. mitsimulieren und seine Performance verbessern.
Die mindestens eine erste Benutzercharakteristik, die das Gebäudemanagementsystem zur Identifikation des Benutzers erfasst, kann zum Beispiel mindestens ein Gesichtsmerkmal, mindestens ein Merkmal betreffend das Aussehen des Körpers, mindestens ein Fingerabdruck, mindestens eine
Stimmencharakteristik, mindestens eine Gangidentifikation bzw. Gangcharakteristik oder ähnliches darstellen. Besonders vorteilhaft ist es dabei, wenn zur Identifikation des mindestens einen Benutzers ein Merkmal betreffend das
Aussehen des Gesichts oder des Körpers des Benutzers erfasst wird, da durch das Erfassen derartiger Merkmale eine
besonders zuverlässige und robuste Identifikation eines Benutzers möglich ist. Insbesondere eine Identifikation basierend auf einer Gesichtserkennung ist besonders
zuverlässig und lässt sich auch auf einfache Weise, zum
Beispiel mit einer Kamera, umsetzen. Weiterhin kann die
Benutzeridentifikation beispielsweise in einem
Eingangsbereich des Gebäudes erfolgen. Somit kann
vorteilhafter Weise sobald ein Benutzer das Gebäude betritt dieser als solcher identifiziert werden. Weiterhin existieren auch Haustüren beziehungsweise Eingangstüren, die als
Zugangsberechtigungsnachweis den Fingerabdruck der
entsprechenden Benutzer verwenden. Ein solcher Fingerabdruck kann damit auch vorteilhafter Weise zur Identifikation des mindestens einen Benutzers des Gebäudes vom Gebäudemanagementsystem genutzt werden. Denkbar ist
beispielsweise auch der Einsatz von Iris-Scannern zur
Identifikation des mindestens einen Benutzers. Auch eine Identifikation auf Basis der Stimmencharakteristik des Benutzers ist möglich. Alternativ oder zusätzlich kann zur Identifikation des Benutzers auch eine erfasste Aktivitäts- Charakteristik des Benutzers verwendet werden, wie die oben erwähnte Gangcharakteristik , eine Bewegungscharakteristik, allgemeine Aktivitäten des Benutzers bzw. charakteristische Verhaltensmuster des Benutzers. Insbesondere können die nachfolgend noch beschriebenen zweiten
Benutzercharakteristiken ebenfalls zur Identifikation des mindestens einen Benutzers dienen. Diese erfassten ersten Benutzercharakteristiken können auch in beliebiger Weise miteinander kombiniert werden. Gerade eine Kombination von zwei oder mehr der oben beschriebenen ersten
Benutzercharakteristiken können die Zuverlässigkeit der Identifikation des mindestens einen Benutzers erhöhen.
Bei einer weiteren vorteilhaft Ausgestaltung der Erfindung wird während der Lernphase zusätzlich zumindest eine zweite Benutzercharakteristik des mindestens einen identifizierten Benutzers bestimmt, insbesondere eine Aktivität des
mindestens einen identifizierten Benutzers, während sich der mindestens eine identifizierte Benutzer Gebäude befindet. Weiterhin werden die Steuerungsregeln durch das
Gebäudemanagementsystem zusätzlich in Abhängigkeit von der mindestens einen zweiten Benutzercharakteristik des
mindestens einen identifizierten Benutzers ermittelt bzw. erlernt .
Diese zweite Benutzercharakteristik stellt also vorzugsweise ein Verhalten des Benutzers beziehungsweise eine Aktivität des mindestens einen Benutzers dar. Hierdurch kann die vom Benutzer getätigte mindestens eine Steuerungseingabe zur Steuerung des Geräts vorteilhafter Weise in einen Kontext gesetzt werden, und insbesondere kann auch eine
Identifikation des mindestens einen Benutzers mithilfe der erfassten mindestens einen zweiten Benutzercharakteristik erfolgen. Das Gebäudemanagementsystem verwendet also nicht nur die vom Benutzer getätigten Steuerungseingaben und
Bedienvorgaben an sich, sondern es beobachtet auch, wann, unter welchen Umständen der Benutzer welche
Steuerungseingaben macht. Das Verhalten des Benutzers, insbesondere in Bezug auf die Steuerung des zumindest einen Geräts des Gebäudes, kann durch das Gebäudemanagementsystem somit deutlich effizienter verstanden und gelernt werden. Damit können in der zweiten Phase des
Gebäudemanagementsystems durch dieses deutlich präzisiere Vorhersagen gemacht werden, wann und unter welchen Umständen ein Benutzer bestimmte Einstellungen des mindestens einen Geräts wünscht, damit diese Einstellungen dann vollkommen automatisiert und auch den Wünschen und Bedürfnissen eines jeweiligen Benutzers möglichst entsprechend umgesetzt werden.
Weiterhin ist es vorteilhaft, wenn die mindestens eine zweite Benutzercharakteristik in Abhängigkeit von mindestens einem erfassten Parameter der folgenden Parameter bestimmt wird: eine erfasste Körperhaltung des mindestens einen
identifizierten Benutzers, eine erfasste Bewegung des
mindestens einen identifizierten Benutzers und/oder zumindest eines Körperteils des mindestens einen identifizierten
Benutzers und/oder eine verfolgte beziehungsweise getrackte Position des mindestens einen identifizierten Benutzers. Es kann also vorteilhafter Weise die Körperhaltung des
mindestens einen Benutzers, wie beispielsweise auch Gesten, oder auch die Bewegung einzelner Körperteile, sowie auch dessen Position und Positionsverlauf beobachtet werden, um zu bestimmen, welcher Aktivität ein Benutzer im Moment nachgeht. Dadurch ist es vorteilhafter Weise wiederum möglich, vom Benutzer getätigte Bedienhandlungen beziehungsweise
Steuerungseingaben mit seinen jeweiligen Aktivitäten in
Beziehung zu setzen und daraus letztendlich wieder die
Steuerungsregeln abzuleiten, gemäß welchen dann das
Gebäudemanagementsystem in der zweiten Phase das mindestens eine Gerät automatisiert steuern kann. Zum Erlernen der Steuerungsregeln können dabei verschiedene Verfahren zum Einsatz kommen, auf die später noch näher eingegangen wird. Beispielsweise kann ein konventionelles maschinenlernendes Verfahren mit der aktuell vorherrschenden Aktivität des
Benutzers als Vordergrund-Merkmal verwendet werden,
insbesondere ein überwachtes Lernverfahren als
modellbasiertes konventionelles maschinenlernendes Verfahren. Auch kann ein verstärkendes Lernverfahren ohne Modell und ohne Belohnung basierend auf dem Tripel Q(s, a, s') verwendet werden, wobei Q eine zu optimierende Nutzenfunktion
darstellt, die vom aktuellen Zustand s, der in diesem Zustand ausgeführten Aktion a und dem Zustand s', in welchen
ausgehend vom aktuellen Zustand s nach Durchführung der
Aktion a gelangt wird, abhängt. Auch kann , Q-Lernen ohne Modell aber mit Belohnung basierend auf dem Quadrupel Q(s, a, r, s') verwendet werden, wobei hier die Nutzenfunktion Q zusätzlich von der Belohnung r abhängt, die bei der
Ausführung der Aktion A im Zustand s erhalten wird. Auch kann das sogenannte SARSA-Lernen ohne Model und mit Belohnung basierend auf dem Quintupel Q(s, a, r, s', a') verwendet werden, wobei hier zusätzlich noch die im neuen Zustand s ' ausgeführte Aktion a' berücksichtigt wird. Im Rahmen dieses Konzepts ( Sarsa) lassen sich vom Lerner auch
Steuerungsaktionen ermitteln, die im Allgemeinen von den Benutzern des Gebäudes nicht angewendet werden oder angewandt worden sind, aber dennoch bezüglich Nutzerfreundlichkeit und weiteren Randbedingungen wie Energieeffizienz optimal sind.
Bei einer weiteren vorteilhaften Ausgestaltung der Erfindung wird basierend auf einer Analyse des mindestens einen
erfassten Parameters des mindestens einen identifizierten Benutzers die mindestens eine zweite Benutzercharakteristik als eine von mehreren verschiedenen vorbestimmten
Benutzeraktivitäten klassifiziert. Solche vorbestimmten
Benutzeraktivitäten können beispielsweise das Sitzen an einem Tisch, zum Beispiel an einem Schreibtisch, darstellen, ein Gruppentreffen beziehungsweise Gruppenmeeting, eine
Kaffeepause, zufälliges Umherlaufen oder auch ein spezielles Ereignis. Kann beispielsweise auf Basis einer Beobachtung und Analyse der oben beschriebenen Parameter wie Körperhaltung, Bewegung des Benutzers oder dessen Körperteile, seine
Position oder sein Positionsverlauf, nicht eindeutig einer der vorbestimmten Gruppen wie das Sitzen an einem Tisch, dem Gruppentreffen, der Kaffeepause oder dem zufälligen
Umherlaufen, zugeordnet werden, so kann die aktuell vom
Benutzer ausgeführte Aktivität als spezielles Ereignis klassifiziert werden. Mit anderen Worten kann die Klasse der speziellen Ereignisse die Klasse darstellen, welcher
Aktivitäten des Benutzers zugeordnet werden, die keiner anderen definierten Klasse eindeutig zuordenbar sind. Auf diese Weise ist es auch möglich, eine oder auch mehrere
Aktivitätsklassen zu erlernen, die nicht vorab definiert wurden bzw. in der anfänglichen Lernphase aufgetreten sind. Die oben beschriebenen Benutzeraktivitäten, in die das
Benutzerverhalten klassifiziert werden kann, stellen dabei lediglich nur Beispiele dar. Die definierten Klassen
beziehungsweise Kategorien, in welche die Benutzeraktivitäten eingeteilt werden können, können dabei auch von der Art des Gebäudes abhängen, in welchem das Gebäudemanagementsystem zum Einsatz kommt. Beispielsweise sind die oben beschriebenen Aktivitätsklassen besonders vorteilhaft, wenn das
Gebäudemanagementsystem zum Beispiel in einem Bürogebäude zum Einsatz kommt. In einem Wohngebäude dagegen, oder
beispielsweise auch in einem Einfamilienhaus, können weitere oder andere Klassen für die vorbestimmten Benutzeraktivitäten definiert sein, wie zum Beispiel Schlafen, Kochen, Fernsehen, Treffen mit Freunden, Spieleabend, sportliche Aktivitäten, oder ähnliches. Das Benutzerverhalten lässt sich durch das Vorsehen dieser weiteren Aktivitätsklassen effizienter kategorisieren und auswerten.
Zur Kategorisierung beziehungsweise zum Bestimmen der
aktuellen Benutzeraktivität können aber nicht nur oben beschriebene Parameter verwendet und analysiert werden, die auf einer optische Erfassung des Benutzers basieren, sondern beispielsweise auch solche, die auf einer akustischen Erfassung basieren. Daher stellt es eine weitere vorteilhafte Ausgestaltung der Erfindung dar, wenn Audiosignale mittels zumindest eines Audiosensors , zum Beispiel eines Mikrofons, aufgenommen werden, während sich der mindestens eine
identifizierte Benutzer im Gebäude befindet, wobei die mindestens eine zweite Benutzercharakteristik, also
insbesondere eine aktuelle Aktivität des Benutzers, in
Abhängigkeit von dem aufgenommenen Audiosignal bestimmt wird, insbesondere unter Verwendung von Spracherkennung. Dadurch lässt sich vorteilhafter Weise eine noch genauere Zuordnung des aktuellen Benutzerverhaltens zu einer der oben
beschriebenen Aktivitätskategorien vornehmen. Beispielsweise können hierfür erkannte Schlüsselwörter genutzt werden, um Aktivitäten genauer oder zuverlässiger zu klassifizieren. Zum Beispiel kann das Schlüsselwort „Kaffee" auf eine Kaffeepause hindeuten, oder „Bett" auf ein nachfolgendes Schlafengehen des mindestens einen Benutzers. Die Zuverlässigkeit der korrekten Kategorisierung von Aktivitäten des mindestens einen Benutzers lässt sich durch die Verwendung von
aufgenommenen Akustischen Signalen, zu welchem Zweck zum Beispiel Mikrofone im Gebäude bzw. den einzelnen Zimmern oder Räumen verbaut werden können, deutliche erhöhen.
Bei einer weiteren vorteilhaften Ausgestaltung der Erfindung wird während der Lernphase zusätzlich mindestens eine
Umfeldinformation, zum Beispiel Temperatur, Helligkeit,
Luftreinheit, Lautstärke, usw., mittels mindestens eines Sensors erfasst, während sich der mindestens eine
identifizierte Benutzer im Gebäude befindet, wobei die
Steuerungsregeln zusätzlich in Abhängigkeit von der
mindestens einen Umfeldinformationen ermittelt werden. Somit können vorteilhafter Weise auch Umfeldinformationen
berücksichtigt werden. Derartige Umgebungs- beziehungsweise Umfeldinformationen können sich dabei auf das Benutzerumfeld innerhalb des Gebäudes beziehen, aber auch auf
Umfeldinformationen außerhalb des Gebäudes, zum Beispiel Außentemperatur, Luftfeuchtigkeit, Wind, usw. Diese
Umfeldinformationen helfen dabei ebenfalls, um die von einem Benutzer durchgeführten Steuerungseingaben deutlich besser verstehen und lernen zu können. Dies ist darin begründet, dass die Motivation eines Benutzers, eine bestimmte
Steuerungseingabe zu tätigen, durch bestimmte
Umfeldbedingungen motiviert sein kann. Ist es einem Benutzer zu warm, stellt er die Heizung auf einen niedrigeren
Temperaturwert ein oder deaktiviert diese vollständig. Somit können diese Umfeldinformationen ebenfalls als Vordergrunds- Merkmal zum Erlernen geeigneter Steuerungsaktionen
herangezogen werden.
Beispielsweise kann die Raumtemperatur innerhalb des
Gebäudes, insbesondere innerhalb jeweiliger Zimmer, erfasst werden, so wie auch die Außentemperatur außerhalb des
Gebäudes. Auch Lichtverhältnisse, wie zum Beispiel die aktuelle Helligkeit oder Beleuchtungsstärke, kann hierzu innerhalb des Gebäudes, insbesondere wieder innerhalb
jeweiliger Zimmer, sowie auch außerhalb des Gebäudes erfasst werden. Im Allgemeinen können zudem Sensoren, mittels welchen diese Umfeldinformationen erfasst werden, Lichtsensoren sein, Temperatursensoren, Luftfeuchtigkeitssensoren, Rauchsensoren, Luftqualitätssensoren, C02~Sensoren, oder ähnliches. Durch die Berücksichtigung von Umfeldinformationen können
Steuerungseingaben durch den Benutzer in einer Lernphase des Gebäudemanagementsystems wiederum in einen Kontext, der in diesem Fall durch die Umfeldinformationen bereitgestellt wird, eingebettet werden. Wann und unter welchen Umständen ein Benutzer bestimmte Einstellungen des zumindest einen Geräts des Gebäudes tätigt, kann somit auch unter diesem Kontext erlernt werden. Dies wiederum erhöht die
Wahrscheinlichkeit, dass die aus der Beobachtung des
Benutzers und seines Verhaltens abgeleiteten Regeln zur automatischen Steuerung des zumindest einen Geräts deutlich zutreffender die Bedürfnisse und Absichten des Benutzers in jeweiligen Situationen wiederspiegeln. Beispielsweise kann also in der Lernphase erfasst werden, ab welcher Helligkeit im Gebäude ein Benutzer dazu tendiert, das Licht an- oder auszuschalten oder zu dimmen. Diese Erkenntnis kann dann entsprechend in der zweiten Phase genutzt werden, um dann das Licht im Gebäude automatisiert gemäß diesen aus der
Beobachtung des Benutzers hergeleiteten Regeln zu steuern.
Bei einer weiteren vorteilhaften Ausgestaltung der Erfindung werden zum Ermitteln bzw. Lernen der Steuerungsregeln durch das Gebäudemanagementsystem zweite Benutzercharakteristiken und/oder erfasste Umfeldinformationen, die einen kürzeren zeitlichen Abstand zu einer nachfolgenden Steuerungseingabe durch den mindestens einen Benutzer aufweisen, stärker gewichtet als erfasste zweite Benutzercharakteristiken und/oder Umfeldinformationen, die einen größeren zeitlichen Abstand zu der nachfolgenden Steuerungseingabe aufweisen. Die aus der Beobachtung des Benutzers gewonnen Informationen, das heißt sein Verhalten und seine Aktivitäten, sowie die
korrespondierenden Umfeldinformationen, die während der
Lernphase gewonnen wurden, können in einem Speicher mit einer entsprechenden Zeitinformation, zum Beispiel jeweiligen
Zeitstempeln, abgelegt werden. Ein jeweiliges solches
Zeitabstands-Tag, d.h. die zusätzlichen Informationen
bezüglich des zeitlichen Abstands einer Aktion und/oder
Umfeldinformation zu einer Steuerungseingabe, kann ebenfalls als Eingangsgröße für das Ermitteln bzw. Erlernen der
Steuerungsregeln dienen. Ebenso werden in diesem Speicher die erfassten Steuerungseingaben des Benutzers zur Steuerung des zumindest einen Geräts, ebenfalls mit einer entsprechenden Zeitinformation bzw. Zeitstempel, abgelegt. Die
Steuerungsregeln, die das Gebäudemanagementsystem auf Basis der Beobachtung des Benutzers letztendlich während und/oder nach der Lernphase ermittelt, sollen dazu dienen, wann beziehungsweise unter welchen Umständen, zum Beispiel bei welchen Aktivitäten und/oder in welchem Umgebungszustand für den Benutzer üblicherweise welche Einstellungen an dem Gerät vorgenommen werden sollen bzw. ausgeführt werden sollen.
Treten diese Umstände während der zweite Phase erneut auf, so kann das Gebäudemanagementsystem automatisiert diese
Einstellungen am Gerät vornehmen. Da die Motivation für eine bestimmte Einstellung des Geräts beziehungsweise für eine bestimmte Steuerungseingabe durch den Benutzer üblicherweise in einem relativ kurzen Zeitraum vor dieser Steuerungseingabe zu finden ist, ist es besonders vorteilhaft, zum Ermitteln bzw. Lernen der Steuerungsregeln durch das
Gebäudemanagementsystem gerade diese Zeiträume vor den durch den Benutzer getätigten Steuerungseingaben zu analysieren und die aus diesem Zeitraum vor einer durch den Benutzer
getätigten Steuerungseingaben gewonnenen Informationen beim Ermitteln bzw. Lernen der Steuerungsregeln stärker zu
gewichten. Hierdurch lässt sich vorteilhafter Weise das Benutzerverhalten deutlich zutreffender mit den durch den Benutzer getätigten Steuerungseingaben in Beziehung setzen und die Motivation hinter bestimmten Bedienhandlungen vom Gebäudemanagementsystem deutlich besser und zutreffender verstehen und erlernen.
Beispielsweise kann es dabei auch vorgesehen sein, dass nur Daten, welche die mindestens eine zweite
Benutzercharakteristik und/oder die mindestens eine
Umfeldinformation betreffen und die innerhalb eines
vorbestimmten Zeitintervalls vor der mindestens einen
Steuerungseingabe erfasst wurden, zum Ermitteln bzw. Lernen und/oder zum Anpassen der Steuerungsregeln berücksichtigt werden. Die Auswertung der Daten kann somit vorteilhafter Weise auf vorbestimmte Zeiträume vor einer erfassten
Benutzereingabe beziehungsweise Steuerungseingabe durch den Benutzer beschränkt sein. Dadurch lassen sich die oben beschriebenen Vorteile noch verstärkt erzielen und zusätzlich auch Zeit bei der Analyse sowie auch Rechenkapazität
einsparen, da nicht notwendigerweise alle gespeicherten Daten zum Ermitteln bzw. Lernen bzw. Anpassen der Steuerungsregeln analysiert und ausgewertet werden müssen, sondern eben nur diese, welche in den oben spezifizierten Zeitraum fallen. Hierdurch kann der Featurevektor, das heißt die einen Zustand charakterisierenden Merkmale, die dem System als
Eingangsgrößen zugeführt werden, auf die wesentlichen
Informationen beschränkt werden. Alternativ oder zusätzlich können auch die in einem kurzen Zeitraum nach einer Steuerungseingabe durch den Benutzer gewonnenen Informationen, das heißt wiederum betreffend seine Aktivitäten und/oder die Umgebungsinformationen, zum
Ermitteln bzw. Lernen der Steuerungsregeln, oder auch zu deren Anpassung genutzt werden. Dies ist vorteilhaft, da sich manchmal die Gründe für eine Steuerungseingabe des Benutzers in einer nach dieser Eingabe durchgeführten Aktivität finden lassen, zum Beispiel wenn ein Benutzer die Temperatur jedes Mal kurz von dem Schlafen gehen erniedrigt, oder das Licht vor dem Verlassen des Gebäudes ausschaltet. Durch die
gezielte Betrachtung eines bestimmten Zeitraums um eine durch den Benutzer getätigten Steuerungseingabe lassen sich die kausalen Beziehungen zwischen dem Benutzerverhalten, den Umgebungsinformationen und der getätigten Steuerungseingabe deutlich besser und zutreffender ableiten und dann
entsprechend beim Ermitteln bzw. Lernen der Steuerungsregeln für die automatische Steuerung berücksichtigen.
Die durch das Gebäudemanagementsystem ermittelten
Steuerungsregeln müssen dabei nicht notwendiger Weise fix sein. Auch während der zweiten Phase kann das
Benutzerverhalten weiterhin beobachtet werden, sowie auch die Umfeldinformationen weiterhin erfasst werden. Erfolgt dann während der automatisierten Steuerung des zumindest einen Geräts in der zweiten Phase dennoch eine durch den Benutzer getätigte Steuerungseingabe zur Steuerung des Geräts, insbesondere zum Ändern einer bestimmten Einstellung, so können die ermittelten Steuerungsregeln abgeändert und angepasst werden. Somit können auch die während der zweiten Phase weiterhin gewonnenen Informationen genutzt werden, um die Steuerungsregeln weiter anzupassen, die automatisierte Steuerung weiter zu verfeinern und noch gezielter an die Bedürfnisse des Benutzers anzupassen.
Bei einer weiteren vorteilhaften Ausgestaltung der Erfindung wird in der zweiten Phase und im Fall, dass der mindestens eine Benutzer erneut identifiziert wird, die mindestens eine erste und/oder zweite Benutzercharakteristik und/oder die Umgebungsinformation erneut bestimmt und das mindestens eine Gerät in Abhängigkeit von der erneut bestimmten ersten und/oder zweiten Benutzercharakteristik und/oder
Umgebungsinformation gesteuert. Mit anderen Worten kann also dem erneut erfassten Benutzerverhalten und den erneut
erfassten Umfeldinformationen gemäß den ermittelten
Steuerungsregeln entsprechende Steuerungseingabe zugeordnet werden, die der Benutzer in der gegebenen Situation
wahrscheinlich vornehmen würde, und diese Steuerungseingaben können dann vorteilhafter Weise automatisiert durch das
Gebäudemanagementsystem umgesetzt werden. Idealer Weise muss also der Benutzer letztendlich, das heißt nach der Lernphase, keine Steuerungseingaben mehr selbststätig vornehmen.
Bei einer weiteren vorteilhaften Ausgestaltung der Erfindung weist das Gebäude mehrere Zimmer und/oder Etagen auf, wobei die Steuerung des mindestens einen Geräts separat für jedes Zimmer und/oder für jede Etage durchgeführt wird. Die zuvor beschriebenen Maßnahmen können also separat für ein
jeweiliges Zimmer eines Gebäudes oder auch nur für eine jeweilige Etage umgesetzt werden. Mit anderen Worten kann das Gebäudemanagementsystem Aktionen in Abhängigkeit vom Ort erlernen. Der Ort im Gebäude, d.h. die Etage und/oder das Zimmer bzw. der Raum kann ebenfalls als Eingangsgröße zum Erlernen der Steuerungsregeln dienen. Somit können also jeweilige Einstellungen betreffend das Licht oder das
Raumklima zimmerspezifisch und abgestimmt auf die jeweiligen Benutzer, die sich gerade in dem jeweiligen Zimmer befinden, vorgenommen werden. Auch die Erfassung von Informationen, d.h. die Aktivitäten des Benutzers, die Umfeldinformationen und die Steuerungseingaben, können dabei zimmerspezifisch erfasst und auch zimmerspezifisch gespeichert und ausgewertet werden, um zimmerspezifische Steuerungsregeln zu ermitteln bzw. zu lernen. Gleiches gilt auch für verschiedene Etagen des Gebäudes. Dadurch lässt sich beispielsweise
berücksichtigen, dass das Verhalten eines Benutzers in Bezug auf die Steuerung des zumindest einen Geräts auf unterschiedlichen Etagen auch unterschiedlich ausfällt, zum Beispiel sind Benutzergewohnheiten, zum Beispiel bezüglich der Lichtdimmung oder auch der Heizung, in einem Keller oft anders als im Erdgeschoss.
Besonders vorteilhaft ist es auch, wenn die Steuerung des mindestens einen Geräts in Abhängigkeit davon durchgeführt wird, ob der mindestens eine Benutzer die einzige Person im Gebäude ist, insbesondere in einem Zimmer des Gebäudes ist, oder ob der mindestens eine Benutzer Teil eine Benutzergruppe aus mehreren Benutzern ist, die sich zur gleichen Zeit im Gebäude, insbesondere in einem Zimmer des Gebäudes, befinden. Auch bereits in der Lernphase ist es möglich, das
Benutzerverhalten, speziell in Bezug auf die Steuerung des zumindest einen Geräts, zu erfassen und zu analysieren, und dabei zusätzlich zu berücksichtigen bzw. zu unterschieden, ob sich der Benutzer gerade alleine in einem Zimmer oder im Allgemeinen im Gebäude befindet, oder Teil einer
Benutzergruppe darstellt. Gegebenenfalls kann sich das
Benutzerverhalten ändern, je nachdem ob der Benutzer Teil einer Gruppe ist oder nicht. Somit können auch
vorteilhafterweise die Vorlieben bzw. Präferenzen eines
Benutzers in Abhängigkeit seines Verhaltens oder seiner
Tätigkeit in der Gruppe erlernt werden. Auch dies kann nun vorteilhafter Weise durch das Gebäudemanagementsystem, insbesondere durch den intelligenten Agenten des
Gebäudemanagementsystems, der später näher beschrieben wird, erlernt werden. Die Steuerung des zumindest einen Geräts in der zweiten Phase kann somit ebenfalls vorteilhafter Weise auf das Verhalten des Benutzers angepasst werden, je nachdem ob dieser sich als Einzelperson in einem Zimmer befindet oder Teil einer Gruppe ist. Auch die Identitäten der jeweiligen Gruppenmitglieder können bei einer solchen Anpassung
berücksichtigt werden. Die durch das Gebäudemanagementsystem ermittelten Steuerungsregeln können damit vorteilhafter Weise nicht nur von Benutzer zu Benutzer variieren, sondern auch von Benutzergruppe zu Benutzergruppe. Beispielsweise könne so auch für eine bestimmte Benutzergruppe bestehend aus mehreren bestimmten identifizierten Benutzern
Verhaltenscharakteristiken und Steuerungseingaben erfasst werden und zusammen mit der Auswertung der erfassten
Umfeldinformationen entsprechende Steuerungsregeln speziell für diese Benutzergruppe ermittelt werden. Entsprechend können so vorteilhafterweise also auch für jeweilige
Benutzergruppen entsprechende Steuerungsregeln ermittelt werden, die für die jeweilige Benutzergruppe optimal sind und die Vorlieben dieser Gruppe in Bezug auf die Steuerung des zumindest einen Geräts möglichst gut wiederspiegeln.
Wie bereits eingangs erwähnt basiert das
Gebäudemanagementsystem auf einem lernenden Verfahren. Dabei ist es besonders vorteilhaft, wenn das
Gebäudemanagementsystem insbesondere mittels eines
bestärkenden Lernverfahrens, insbesondere eines Deep-Q- Lernverfahrens unter Verwendung eines künstlichen neuronalen Netzes als ein intelligenter Agent, die Steuerungsregeln ermittelt bzw. lernt und/oder die ermittelten bzw. erlernten Steuerungsregeln anpasst und die Steuerung durchführt.
Bei einem bestärkenden Lernverfahren oder auch verstärkendes Lernen genannt, wird von einem Agenten selbstständig eine Strategie erlernt, um erhaltene Belohnungen zu maximieren.
Der große Vorteil ist dabei, dass dem Agenten nicht
vorgezeigt wird, welche Aktion in welcher Situation die beste ist, sondern er erhält zu bestimmten Zeitpunkten eine
Belohnung anhand welcher er eine Nutzenfunktion approximiert, die beschreibt, welchen Wert ein bestimmter Zustand oder eine Aktion hat. Das Q-Lernen stellt dabei eine modellfreie
Technik des verstärkenden Lernens dar. Es müssen also dem System vorteilhafter Weise keinerlei Vorgaben gemacht werden. Das Gebäudemanagementsystem erarbeitet sich die
benutzerspezifischen Steuerstrategien vollkommen
selbstständig. Dies bietet einen enorm hohen Bedien- und Benutzungskomfort, da von Seiten des Benutzers oder des
Einrichters des Systems keinerlei Vorgaben oder
Spezifikationen gemacht werden müssen. Dies bedeutet, dass es keines technisch versierten Einstellers bedarf, der das Gebäudemanagementsystem kommissioniert .
Wie bereits erwähnt erhält der intelligente Agent eine
Belohnung, anhand von welcher er selbstständig die richtige Steuerungsstrategie erarbeiten kann. Dabei ist es besonders vorteilhaft, wenn diese Belohnung umso höher ist, je seltener durch den mindestens einen Benutzer Steuerungseingaben ausgeführt werden. Die Zielsetzung dieses lernenden
Verfahrens ist es also, die durch den Benutzer getätigten manuellen Steuerungseingaben in ihrer Anzahl zu minimieren und insbesondere im Idealfall vollständig zu eliminieren. Die durch den Benutzer getätigten Steuerungseingaben stellen also ein Feedback, d.h. eine Rückmeldung, für das
Gebäudemanagementsystem dar. Nimmt beispielsweise der
Benutzer in der zweiten Phase des Gebäudemanagementsystems dennoch eine Einstellungen des zumindest einen Geräts selbst manuell vor, so kann diese manuelle Einstellung wiederum als Feedback bzw. Rückmeldung für das Gebäudemanagementsystem dienen. Darauf basierend können die ermittelten
Steuerungsregeln verändert werden, insbesondere derart, dass wiederum die Belohnung maximiert wird. Diese Vorgehensweise wird vom Gebäudemanagementsystem fortwährend wiederholt, bis die Anzahl an manuell getätigten Steuerungseingaben durch den Benutzer verringert ist und letztendlich keine
Steuerungseingaben durch den Benutzer mehr getätigt werden. Hierzu kann es beispielsweise vorgesehen sein, dass nach jeder Aktion, die vom intelligenten Agenten durchgeführt wird, also beispielsweise bei jeder Steuerungsaktion zur Steuerung des zumindest einen Geräts durch das
Gebäudemanagementsystem, überprüft wird, ob eine
Steuerungseingabe durch den mindestens einen identifizierten Benutzer durchgeführt wurde, beispielsweise innerhalb eines vorbestimmten Zeitraums nach der durch den intelligenten Agenten durchgeführte und das zumindest eine Gerät
betreffende Steuerungsaktion, und falls keine
Steuerungseingabe durch den mindestens einen Benutzer
durchgeführt wurde, insbesondere innerhalb dieses vorbestimmten Zeitraums, der intelligente Agent die Belohnung erhält .
Der intelligente Agent kann also vorteilhafter Weise die Steuerungsregeln schrittweise anpassen mit dem Ziel seine Belohnung zu optimieren und dadurch seine Steuerungs- und Regelstrategie fortwährend verbessern. Hierzu können immer neu gewonnene Informationen genutzt werden. Daher stellt es eine weitere vorteilhafte Ausgestaltung der Erfindung dar, wenn der intelligente Agent schrittweise die
Steuerungsregeln, die dem mindestens eine Benutzer zugeordnet sind, basierend auf neu erfassten Informationen betreffend den mindestens eine Benutzer, insbesondere neu bestimmte zweite Benutzercharakteristiken und neu erfasste
Steuerungseingaben, insbesondere auch neu erfasste
Umfeldinformationen, mit dem Ziel, die Belohnung zu
maximieren, anpasst. Die Vorlieben jeweiliger Benutzer und Benutzergruppen können so auf besonders effiziente Weise vollkommen selbstständig vom Gebäudemanagementsystem erlernt werden und die Steuerungsstrategie im Laufe der Zeit noch weiter optimiert werden.
Dabei ist es weiterhin besonders vorteilhaft, wenn nicht nur gemäß dem sogenannten On-Policy-Q-Learning auf bekannte
Aktionen zurückgegriffen wird, sondern auch auf neuartige unbekannte Aktion gemäß dem sogenannten Off-Policy-Q- Learning. Dies ist vorteilhaft, da die von Benutzern
abgeschauten und erlernten Aktionen (Policy) nicht immer optimal in Bezug auf die Energieverbrauchsminimierung sind.
Dies kann durch folgendes Beispiel veranschaulicht werden: Beim Betreten eines abgedunkelten Raumes schaltet ein
Benutzer immer erst das Licht ein und fährt dann die
Rollläden hoch und schaltet anschließend das Licht wieder aus. Das kurzzeitige Einschalten des Lichts führt damit zu einem Energieverbrauch. Die bis dato unbekannte Aktionsfolge schon vor dem Betreten des Raumes sofort die Rollläden hochzufahren und das Licht erst gar nicht einzuschalten führt zur gleichen Benutzerzufriedenheit, aber in dieser unbekannten Schaltkombination zu keinem Energieverbrauch. Ein derartiges Trainieren ist im Rahmen einer erweiterten Q- Learning-Methode möglich bei der auch unbekannte
Schaltaktionen exploriert werden. Insbesondere können neue, d.h. von einem Benutzer so nicht vorgelebte Auswahlen von Handlungssequenzen ausprobiert und hierdurch erlernt werden. Das System kann also beispielsweise als solche unbekannte Aktionsfolge schon vor dem Betreten des Raumes sofort die Rollläden hochfahren ohne das Licht einzuschalten, obwohl diese Aktionsfolge vom Benutzer so nicht vorgelebt wurde. Ob nun diese Aktionsfolge tatsächlich auch zur
Benutzerzufriedenheit führt und damit vom Benutzer akzeptiert wird, kann wiederum daran erkannt werden, ob der Benutzer nach einer solchen „Test"-Aktionsfolge eine Steuerungseingabe durchführt oder nicht.
Daher stellt es eine weitere vorteilhafte Ausgestaltung der Erfindung dar, dass in Abhängigkeit von der mindestens einen vorbestimmten Energiespar-Bedingung die Steuerungsregeln durch erweitertes Q-Learning variiert werden, insbesondere so dass ein Energieverbrauch und ein Benutzerkomfort
gleichzeitig optimiert werden. Der Benutzerkomfort kann zum Beispiel in Abhängigkeit von den von dem mindestens einen Benutzer durchgeführten Steuerungseingaben bemessen werden, insbesondere in Abhängigkeit von dem Auftreten von durch den Benutzer getätigten Steuerungseingaben. Der Energieverbrauch des mindestens einen Geräts kann zum Beispiel in der
Lernphase ermittelt werden, indem der Energieverbrauch durch geeignete Erfassungsmittel gemessen wird. Mit anderen Worten kann von den basierend auf dem Benutzerverhalten erlernten Steuerungsregeln derart abgewichen werden, dass durch diese Variation der Energieverbrauch verringert bzw. optimiert wird. Anschließend wird die benutzerseitige Akzeptanz dieser Abweichung bzw. Variation überprüft, indem überprüft wird, ob innerhalb eines vorbestimmbaren Zeitraums nach der
automatischen Steuerung des mindestens einen Geräts gemäß den variierten Steuerungsregeln eine manuelle Steuerungseingabe durch den Benutzer erfasst wird. Falls nicht, gilt die Benutzerkomfortfunktion weiterhin als optimiert und die variierten Steuerungsregeln werden beibehalten, andernfalls nicht .
Bei einer weiteren vorteilhaften Weiterbildung der Erfindung bestimmt das Gebäudemanagementsystem für jede mögliche definierte Einstellung des mindestens einen Geräts einen Q- Wert, der die Wahrscheinlichkeit wiedergibt, dass die
jeweilige Einstellung in einem gegebenen, bestimmten Zustand, welcher als eine Eingangsgröße vom künstlichen neuronalen Netz empfangen wird, vorgenommen wird, und wobei der
bestimmte Zustand durch mindestens einen, vorzugsweise mehrere, besonders bevorzugt alle der folgenden Zustands- Parameter bestimmt wird: einer Benutzer-ID, die dem
mindestens einen Benutzer zugeordnet wird, wenn der
mindestens eine Benutzer auf der Basis der mindestens einen ersten Benutzercharakteristik identifiziert wird, der
mindestens einen zweiten Benutzercharakteristik, eines aktuellen Zustands bzw. einer aktuellen Einstellung des mindestens einen Geräts und der mindestens einen
Umfeldinformation, wobei die Einstellung, für welchen der Q- Wert oberhalb eines definierten Grenzwerts liegt und/oder für welche der Q-Wert den Höchsten darstellt, durch das
Gebäudemanagementsystem umgesetzt wird.
Mit anderen Worten kann also ein bestimmter Zustand
charakterisiert werden durch die Identität des Benutzers beziehungsweise auch die Identität mehrerer Benutzer im Falle einer Benutzergruppe, der mindestens einen zweiten
Benutzercharakteristik, das heißt also die Aktivität, die der Benutzer gerade durchführt, den aktuellen Zustand des
mindestens einen Geräts, das heißt also beispielsweise in welcher aktuellen Einstellung sich das Gerät gerade befindet, sowie auch der mindestens einen Umfeldinformation, zum
Beispiel also der aktuellen Raumtemperatur, Helligkeit, oder ähnliches. Für einen zu charakterisierenden Zustand, der dem neuronalen Netz als Eingangsgröße zugeführt wird, ermittelt das neuronale Netz, welche der möglichen Einstellungen der Benutzer in dieser gegebenen Situation nun am
wahrscheinlichsten durchführen würde. Hierzu kann für alle der möglichen Einstellungen des Geräts ein entsprechender Q- Wert berechnet werden. Der Q-Wert stellt dabei den integralen R-Wert dar, wobei der R-Wert den numerischen Wert der oben beschriebenen Belohnung darstellt. In der Lernphase ermittelt das System, welche Belohnungen sich ausgehend von gegebenen Zuständen durch Ausführen bestimmter Steuerungsaktionen zur Steuerung des mindestens einen Geräts erwarten lassen. Wird dabei beispielsweise nur eine einzeln vorzunehmende
Steuerungsaktion betrachtet, so wird ausgehend vom aktuellen Zustand diejenige gewählt, welche zu dem neuen Zustand mit dem größten zu erwartenden R-Wert führt. Sollen dagegen mehrere Steuerungsaktionen nacheinander ausgeführt werden, um ausgehend von einem gegebenen Zustand in einen bestimmten anvisierten Zustand zu kommen, so wird derjenige Weg bzw. diejenige Abfolge von Steuerungsaktionen gewählt, die die Summe der einzelnen auf diesem Weg zu erwartende R-Werte maximiert. Dieser integrale R-Wert wird durch den oben genannten Q-Wert beschrieben. Die Einstellung mit dem
höchsten Q-Wert kann dann entsprechend vom
Gebäudemanagementsystem umgesetzt werden. Diese Umsetzung kann zusätzlich auch an die weitere Bedingung geknüpft sein, dass der so berechnete Q-Wert einen bestimmten Grenzwert überschreitet. Die Berechnung des Q-Werts basiert dabei vorzugsweise auf den in Abhängigkeit vom Benutzerverhalten ermittelten Steuerungsregeln.
Da gerade bei mehreren aufeinanderfolgen auszuführenden
Steuerungsaktionen die Ermittlung der optimalen Schaltfolge sehr komplex sein kann, ist die Verwendung eines neuronalen Netzes besonders vorteilhaft.
Bei einer weiteren vorteilhaften Ausgestaltung der Erfindung werden in Abhängigkeit von mindestens einer vorbestimmten Energiesparbedingung die Steuerungsregeln ermittelt und/oder angepasst. Damit lassen sich vorteilhafter Weise auch
bestimmte Randbedingungen betreffend die Energieeffizienz definieren, wie dies bereits oben beschrieben wurde.
Vorzugsweise sind aber derartige Energieeffizienzvorgaben den Vorlieben des Benutzers und dessen Komfort untergeordnet. Neben den oben genannte Beispielen kann eine solche
Energiesparbedingung beispielsweise auch vorsehen, dass, wenn der mindestens eine Benutzer, insbesondere auch alle Benutzer eines Gebäudes, dieses Gebäude verlassen haben, das zumindest eine Gerät, wie beispielsweise eine Heizung oder das Licht, abgeschaltet wird oder zumindest in seiner Leistung reduziert wird. Auch kann beispielsweise das Licht in einem bestimmten Zimmer abgeschaltet werden, sobald sich kein Benutzer mehr in diesem Zimmer befindet. Ein weiteres Beispiel für eine solche Energiesparbedingung kann beispielsweise sein, dass, wenn zwei verschiedene Einstellungen für das zumindest eine Gerät zumindest näherungsweise die gleiche Wahrscheinlichkeit gemäß dem oben beschriebenen Q-Wert aufweisen, das
Gebäudemanagementsystem die Einstellung mit dem geringeren Energieverbrauch umsetzt. Neben diesen zusätzlichen
optionalen Energiesparbedingungen, die einen besonders effizienten Betrieb des zumindest einen Geräts erlauben, und diesen effizienten Betrieb zusätzlich vorteilhafter Weise in Einklang mit den Vorlieben eines Benutzers bringen, wird dabei bereits schon durch die Tatsache, dass die Steuerung des zumindest einen Geräts des Gebäudes automatisiert
erfolgt, Energie gespart. Dies ist dadurch bedingt, dass Situationen besser vermieden werden können, in denen Benutzer aus Bequemlichkeit oder Vergesslichkeit zur
Energieverschwendung neigen, wie zum Beispiel vergessen, das Licht beim Verlassen eines Raumes oder des Gebäudes
abzuschalten .
Besonders vorteilhaft ist es jedoch, wenn zur
Energieeinsparung der Agent per erweitertes Q-Learning auch vom Benutzer nicht vorpraktizierte Einstellungen erlernt, die aber weitaus energieeffizienter sind und vom Benutzer immer noch bzw. weiterhin akzeptiert werden, wie dies zum Beispiel oben beschrieben wurde. Bei einer weiteren vorteilhaften Ausgestaltung der Erfindung ist der intelligente Agent mit Videosensoren zum Tracken der Position des mindestens einen Benutzers verbunden, wobei die Videosensoren ein sensorintegriertes Deep-Learning-Verfahren zum Tracken der Position des mindestens einen Benutzers, und insbesondere zum Wiedererkennen beziehungsweise Re- Identifizieren des mindestens einen Benutzers im Falle, dass der mindestens eine Benutzer ein erstes Sichtfeld eines ersten Videosensors der Videosensoren verlässt und ein zweites Sichtfeld eines zweiten Videosensors der
Videosensoren betritt, verwenden, wobei sich das erstes
Sichtfeld und das zweites Sichtfeld nicht überschneiden.
Durch den Einsatz von Videosensoren, wie beispielsweise
Kameras, ist es vorteilhafter Weise möglich, die Position des Benutzers im gesamten Gebäude nachzuverfolgen. Hierzu ist vorzugsweise in einem jeweiligen Raum beziehungsweise Zimmer des Gebäudes mindestens eine Kamera angeordnet. In Kenntnis der Position des Benutzers kann beispielsweise die oben beschriebene zimmerspezifische Steuerung des zumindest einen Geräts umgesetzt werden. Dieses Kamerasystem ist dabei insbesondere in Bezug auf die benutzerspezifische Steuerung des zumindest einen Geräts besonders vorteilhaft, denn für den Fall, dass sich zum gleichen Zeitpunkt mehrere Personen beziehungsweise Benutzer im Gebäude befinden, die Positionen der jeweiligen Benutzer und auch deren Positionsverlauf mittels des Kamerasystems erfasst werden kann, insbesondere ohne die Benutzer dabei zu verwechseln. Diese Kameras können nicht nur zur Verfolgung der Position des Benutzers genutzt werden, sondern beispielsweise auch um die mindestens eine zweite Benutzercharakteristik, also beispielsweise die durch den Benutzer gerade ausgeführten Aktionen, zu bestimmen. Da gerade bei Bild- beziehungsweise Videoaufnahmen enorm große Datenmengen anfallen können, ist es besonders vorteilhaft, wenn die Videosensoren selbst über ein sensorintegriertes Deep-Learning-Verfahren verfügen, mittels welchem die
erfassten Sensordaten ausgewertet werden können. Somit ist es vorteilhafter Weise möglich, nur bestimmte Ergebnisse oder Ergebnisse der durch die Videosensoren ausgeführten Analyse an den intelligenten Agenten zu übermitteln und nicht die gesamten erfassten Videodaten. Hierdurch kann der
Datenverkehr deutlich verringert werden und das
Gebäudemanagementsystem deutlich effizienter betrieben werden. Um mittels des Kamerasystems die Position eines Benutzers, wenn dieser von Raum zu Raum geht oder zumindest einen Sichtbereich einer ersten Kamera verlässt und in den einer zweiten Kamera eintritt, zu verfolgen, selbst wenn die jeweiligen Sichtbereiche der einzelnen Kameras nicht
überlappen oder nur teilweise, jedoch nicht an allen
möglichen Übergangsbereichen, ist es besonders vorteilhaft, wenn die einzelnen Videosensoren zum Wiedererkennen des mindestens einen Benutzers ausgelegt sind. Zu diesem Zweck können zum Beispiel gleich einhergehend mit der
Identifizierung des mindestens einen Benutzers auch geeignete Wiedererkennungsmerkmale dieses Benutzers erfasst werden. Hierzu eignen sich besonders Widererkennungsmerkmale, die die äußere Erscheinung des Benutzers betreffen, wie zum Beispiel die Kleidung, die Farbe der Kleidung, Haarfarbe oder
Hautfarbe, Gangart bzw. Gangcharakteristik oder ähnliches. Derartige Merkmale lassen sich besonders einfach von einer Kamera, auch bei einer relativ großen Entfernung zum Benutzer und unter verschiedenen Blickwinkeln, leicht erkennen. Dies hat den großen Vorteil, dass sich die Sichtfelder der
einzelnen Kameras nicht notwendiger Weise vollständig
überschneiden müssen und jeden Bereich eines jeweiligen
Zimmers des Gebäudes erfassen müssen und zudem kostengünstige Kameras verwendet werden können. Hierdurch kann das
Videosensorsystem deutlich kostengünstiger und einfacher ausgestaltet werden.
Des Weiteren betrifft die Erfindung auch ein
Gebäudemanagementsystem zum automatischen Steuern zumindest eines Geräts eines Gebäudes, wobei das
Gebäudemanagementsystem dazu ausgelegt ist, in einer
Lernphase des Gebäudemanagementsystems mindestens einen
Benutzer des Gebäudes auf Basis mindestens einer erfassten ersten Benutzercharakteristik zu identifizieren, mindestens eine Steuerungseingabe, die vom mindestens einen Benutzer zum Steuern des zumindest einen Geräts ausgeführt wird, zu erfassen, während der mindestens eine identifizierte Benutzer sich innerhalb des Gebäudes befindet, und in Abhängigkeit von der mindestens einen erfassten Steuerungseingabe des
mindestens einen identifizierten Benutzers Steuerungsregeln zu ermitteln, welche dem mindestens einen identifizierten Benutzer zugeordnet werden. Weiterhin ist das
Gebäudemanagementsystem dazu ausgelegt, in einer zweiten Phase des Gebäudemanagementsystems das zumindest eine Geräte des Gebäude automatisch gemäß den ermittelten
Steuerungsregeln zu steuern, während sich der mindestens eine Benutzer im Gebäude befindet.
Die für das erfindungsgemäße Verfahren und seine
Ausführungsformen beschriebenen Vorteile gelten in gleicher Weise für das erfindungsgemäße Gebäudemanagementsystem.
Darüber hinaus ermöglichen die im Zusammenhang mit dem erfindungsgemäßen Verfahren und seinen Ausgestaltungen genannten Verfahrensschritte die Weiterbildung des
erfindungsgemäßen Gebäudemanagementsystems durch weitere korrespondierende gegenständliche Merkmale.
Das Gebäudemanagementsystem kann dabei in mehrere Ebene bzw. Layer gegliedert sein. Darunter fällt zum Beispiel eine physische Ebene, die die Hardware innerhalb des Gebäudes umfasst, einschließlich individueller Geräte, Transducer, und Netzwerk-Hardware. Weiterhin ist es bevorzugt, dass die meisten elektrischen Komponenten des Gebäudemanagementsystems Datenübertragung über Stromkabel des Gebäudes nutzen.
Insbesondere basiert die kabelbasierte Vernetzung der
Schnittstellen der verschiedenen Sensoren, zum Beispiel der Kameras, Mikrofone und der Umfeldsensoren, auf Ethernet, RS- 485 und/oder CAN. Die Vernetzung kann auch kabellos
ausgeführt sein, und basiert dann vorzugswiese auf Wi-Fi, ZigBee, sub-l-GHs ISM-Bändern und/oder proprietären Systemen. Eine kabellose Vernetzung bzw. ein kabellos vermaschtes Netz kann vorteilhafterweise die Kosten für eine aufwendige Verkabelung im Falle eines Nachrüstens vermeiden und die Installation beschleunigen. Eine weitere Ebene stellt die Kommunikationsebene dar, die den Austausch von Informationen und Anfragen zwischen dem Agenten und den Geräten bzw.
elektrischen Komponenten und Sensoren ermöglicht. Die
Kommunikationsebene leitet auch auszuführende Aktionen an geeignete Effektoren und Stellelemente bzw. Schaltaktoren zur Ausführung weiter. Dabei können Kommunikationsprotokolle wie KNX, Lonworks, Dali, BACnet, LonMark, und Modbus, d.h.
konventionelle Gebäudemanagementbusse, verwendet werden. Eine weitere Ebene stellt die Informationsebene dar, die die
Aufgabe des Sammelns und Speicherns der Status-Daten der Sensoren übernimmt, um Wissen zu generieren, dass vom Agenten genutzt werden kann. Die Informationsebene speichert das beschaffte Wissen in einer Datenbank und aktualisiert die gelernten Konzepte, um die Geräte des Gebäudes zu steuern.
Die Informationsebene benachrichtigt auch die
Entscheidungsebene über das Vorhandensein neuer Daten. Die Entscheidungsebene umfasst den intelligenten Agenten, der die Geräte gemäß dem allgemeinen Status in der Informationsebene steuert. Der intelligente Agent ist dabei die Entscheidungs- Komponente des Gebäudemanagementsystems bzw. der
Gebäudeautomatisierung. Dabei kann der intelligente Agent auch den Entscheidungsprozess auf mehrere verschiedene
Komponenten des Gebäudes verteilen. Der intelligente Agent kann wie zuvor beschrieben ausgebildet sein und Technologien künstlicher Intelligenz und maschinenlernender Verfahren vereinen, die die Analyse umfassender Datensätze der Video- und Audiosensoren sowie der Umfeldsensoren ermöglichen. Der intelligente Agent verwendet dabei Deep-Learning-Technologie, die die Definition von Merkmalen auf Rohdatenebene ermöglicht (Videoframes, Audiosequenzen und Zählerstände) , und
extrahiert automatisch die relevanten Informationen für
Klassifikationen. Hier wird die künstliche Intelligenz nun zum Ermessen des momentanen Zustandes herangezogen und noch nicht zur Entscheidung über die darauffolgenden Entscheidung Schaltaktion. Das Auswerten und Klassifizieren von Bilddaten und Audiosignalen mit Deep-Learning-Methoden geschieht dabei zum Zweck des Messens des momentanen Zustandes. Hierbei werden die Person und deren Aktivität im Bild erkannt. Der intelligente Agent erkennt somit auch die Aktivitäten der Benutzer basierend auf deren Detektion und Tracking. Der intelligente Agent bewältigt auch Situationen, in welchen sich vielzählige Benutzer gleichzeitig in derselben Umgebung befinden, insbesondere mit der Fähigkeit das Verhalten eines einzelnen Benutzers in einer Multi-User-Umgebung zu
beobachten. Der intelligente Agent benutzt dann die
beobachteten Aktionen bzw. Verhaltenssequenzen der Bewohner bzw. Benutzer, die zum Beispiel in der Lernphase über
typischerweise 15 Tage hinweg beobachtet wurden, um gemäß dem beschriebenen Verfahren das Ziel die Anzahl der manuellen Steuerungshandlungen der Benutzer zu minimieren und die
Energieeffizienz des Gebäudes dabei gleichzeitig zu
maximieren .
Während der Trainingsphase bzw. Lernphase versucht also der Agent per einhergehender Simulation (on-line) die aus dem Kontext heraus vorgenommenen Steueraktion zu erlernen, um sie anschließend im Automode, d.h. der zweiten Phase, selbständig zur vollsten Benutzerzufriedenheit umzusetzen, wobei als Nebenbedingung der Energieverbrauch des Gebäudes niedrig gehalten werden soll. Die Benutzerzufriedenheit bzw. Der Benutzerkomfort lässt sich dann anhand der vom Benutzer vorgenommen manuellen Steuerungseingriffe ermessen.
Der Algorithmus des intelligenten Agenten passt sich dabei selbst an, insbesondere durch den Zugriff auf vielzählige Langzeitbeobachtungsdaten mit menschlichen Reaktionen, d.h. den Steuerungseingaben, die Trainingsdaten für Verhaltens- Aktionsmuster mit den Vorlieben und Bedürfnissen der Benutzer liefern. Auch ist der intelligente Agent dazu ausgelegt, insbesondere mittels erweitertem Q-Learning, neue Auswahlen von Handlungssequenzen auszuprobieren und hierdurch zu lernen . Die Erfindung umfasst auch die Kombinationen der beschriebenen Ausführungsformen.
Weitere Vorteile, Merkmale und Einzelheiten der Erfindung ergeben sich aus der nachfolgenden Beschreibung bevorzugter Ausführungsbeispiele sowie anhand der Zeichnung. Dabei zeigen :
Fig. 1 eine schematische Darstellung eines Gebäudes mit
einem Gebäudemanagementsystem gemäß einem
Ausführungsbeispiel der Erfindung;
Fig. 2 eine schematische Darstellung einzelner
Systemkomponenten des Gebäudemanagementsystems gemäß einem Ausführungsbeispiel der Erfindung;
Fig. 3 eine schematische Darstellung der Lernphase des
Gebäudemanagementsystems gemäß einem
Ausführungsbeispiel der Erfindung; und
Fig. 4 eine schematische Darstellung einer zweiten Phase des
Gebäudemanagementsystems, welche eine Anwendungsphase darstellt, gemäß einem Ausführungsbeispiel der Erfindung .
Bei den im Folgenden erläuterten Ausführungsbeispielen handelt es sich um bevorzugte Ausführungsformen der
Erfindung. Bei den Ausführungsbeispielen stellen die
beschriebenen Komponenten der Ausführungsformen jeweils einzelnen, unabhängig voneinander zu betrachtende Merkmale der Erfindung dar, welche die Erfindung jeweils auch
unabhängig voneinander weiterbilden und damit auch einzeln oder in einer anderen als der gezeigten Kombination als Bestandteil der Erfindung anzusehen sind. Des Weiteren sind die beschriebenen Ausführungsformen auch durch weitere der bereits beschriebenen Merkmale der Erfindung ergänzbar. In den Fig. sind funktionsgleiche Elemente jeweils mit denselben Bezugszeichen versehen.
Fig. 1 zeigt eine schematische Darstellung eines Gebäudes 10 mit einem Gebäudemanagementsystem 12 gemäß einem
Ausführungsbeispiel der Erfindung. Das Gebäude 10 weist dabei einen Eingangsbereich 14 auf, sowie mehrere Zimmer 16, von denen hier exemplarisch drei dargestellt sind. Zudem umfasst das Gebäude 10 mehrere zu steuernde Geräte 18. Diese Geräte 18 dienen vorzugsweise der Beleuchtung und/oder der
Raumklimatisierung. Beispiele für solche Geräte 18 sind
Lampen, eine Heizung, Ventilatoren und/oder eine Klimaanlage. Dabei können in jedem der Zimmer 16 eines oder mehrere solcher Geräte angeordnet sein, wie zum Beispiel im Falle von Lampen oder Ventilatoren, oder zumindest ist mittels eines solchen Geräts 18 eine zimmerspezifische Steuerung möglich, zum Beispiel im Falle einer Heizung oder einer Klimaanlage. Das Gebäudemanagementsystem 12 umfasst mehrere
verschiedenartige Sensoren, die miteinander vernetzt sind. Dazu zählen beispielsweise ein Kamerasystem mit mehreren Kameras 20. Vorzugsweist ist in einem jeweiligen Zimmer 16 mindestens eine Kamera 20 angeordnet. Diese kann
beispielsweise in einem zentralen Bereich an der Decke eines Zimmers 16 angeordnet sein, oder es können auch vier Kameras 20 in einer jeweiligen Ecke eines Zimmers 16 des Gebäudes 10 angeordnet sein. Eine jeweilige Kamera 20 weist dabei ein ihr zugeordnetes Sichtfeld 22, welches einen maximalen
Erfassungsbereich darstellt, auf, und welches hier
exemplarisch durch eine gestrichelte Linie angedeutet ist. Diese Sichtfelder 22 der jeweiligen Kameras 20 müssen sich nicht notwendiger Weise überschneiden. Weiterhin kann auch eine Kamera 20 im Eingangsbereich 14 angeordnet sein,
insbesondere als Teil eines Benutzeridentifikationssystems 24, sowie auch eine weitere hier nicht dargestellte Kamera im Eingangsbereich 14.
Darüber hinaus können als weitere Sensoren des
Gebäudemanagementsystems 12 auch in jeweiligen Zimmern 16 Mikrofone 26 angeordnet sein, sowie Umfeldsensoren 28. Solche Umfeldsensoren 28 können zum Beispiel Lichtsensoren
darstellen, Temperatursensoren, Luftfeuchtigkeitssensoren, Rauchsensoren, Luftqualitätssensoren oder CCg-Sensoren .
Ferner umfasst das Gebäudemanagementsystem 12 eine
Steuereinheit 30 zur Steuerung der Geräte 18, sowie eine Rechnereinrichtung 32, die als Großrechner ausgebildet sein kann. Zudem weist das Gebäudemanagementsystem 12 auch einen Speicher 34 auf.
Das Gebäudemanagementsystem 12 ist ein identitätsbasiertes, automatisiertes Gebäudemanagementsystem, welches ein im
Großrechner 32 implementiertes bestärkendes Lernverfahren verwendet, um die Gewohnheiten, Vorlieben und
Verhaltensweisen von Benutzern Bl, B2, B3, B4 des Gebäudes 10 zu erlernen, insbesondere in Bezug auf die Steuerung der Geräte 18, um darauf basierend nach einer Lernphase eine vollkommen automatisierte Steuerung dieser Geräte 18
vorzunehmen. Wenn ein Benutzer, wie der hier dargestellte erste Benutzer Bl, das Gebäude 10 betritt und damit den
Eingangsbereich 14 des Gebäudes 10, wird dieser Benutzer Bl durch das Benutzeridentifikationssystem 24, insbesondere mittels einer Gesichtserkennungsvorrichtung unter Verwendung der Kamera 20 des Benutzeridentifikationssystems 24
identifiziert. Zu diesem Zweck können im Speicher 34
verschiedene Benutzerprofile PI, P2, für die jeweiligen
Benutzer Bl, B2, B3, B4 des Gebäudes 10 hinterlegt sein, in welchen jeweils zugeordnete Benutzercharakteristiken CI für die jeweiligen Benutzer Bl, B2, B3, B4 hinterlegt sind, und auf Basis von welchen die Identifikation vorgenommen wird. In der Darstellung in Fig. 1 sind exemplarisch nur die
Benutzercharakteristiken CI des ersten Benutzers Bl in dessen Benutzerprofil PI dargestellt. Diese Benutzercharakteristiken CI können also vom Benutzeridentifikationssystem 24 erfasst werden, sobald ein Benutzer Bl, B2, B3, B4 den
Eingangsbereich 14 betritt. In diesem Beispiel wird für den ersten Benutzer Bl eine erste Benutzercharakteristik CI mittels des Benutzeridentifikationssystem 24 erfasst, wie zum Beispiel eines oder mehrere Gesichtsmerkmale, und mit den im Speicher 34 zu den jeweiligen Benutzerprofilen PI, P2
hinterlegten Benutzercharakteristiken CI abgeglichen und darüber der Benutzer Bl identifiziert. Nach dessen
Identifikation wird dem Benutzer Bl eine entsprechende und in seinem Benutzerprofil PI hinterlegte Kennung ID1 zugeordnet.
Weiterhin ist es bevorzugt, dass im Eingangsbereich 14 zusätzlich auch Wiedererkennungsmerkmale W1 erfasst werden, was durch die zuvor erwähnte und hier nicht dargestellte zusätzliche Kamera, die beispielsweise an der Decke des
Eingangsbereichs 14 oder an einer Wand montiert sein kann, bewerkstelligt werden kann. Auch diese
Wiedererkennungsmerkmale W1 können entsprechend im
korrespondierenden Benutzerprofil PI, P2 gespeichert werden. Solche Wiedererkennungsmerkmale W1 stellen vorzugsweise keine Gesichtsmerkmale dar, sondern solche, die mittels weiter entfernten Kameras 20 insbesondere auch unter verschiedenen Blickwinkeln besonders leicht zu erfassen sind, wie zum
Beispiel das Aussehen der Kleidung, die Farbe der Kleidung, die Haarfarbe und/oder Hautfarbe. Läuft dieser erste Benutzer Bl nun durch verschiedene Räume beziehungsweise Zimmer 16 des Gebäudes 10, so können die in den jeweiligen Zimmern 16 angeordneten Kameras 20 auf Basis dieser
Wiedererkennungscharakteristiken W1 den Benutzer Bl
wiedererkennen beziehungsweise reidentifizieren . In einer Lernphase des Gebäudemanagementsystems 12 werden also die jeweiligen Benutzer Bl, B2, B3, B4 ab dem Zeitpunkt ab dem sie das Gebäude 10 betreten haben, durch das
Gebäudemanagementsystem 12 beobachtet. Hierzu werden
insbesondere Bedienhandlungen beziehungsweise
Steuerungseingaben SE, welche die Benutzer Bl, B2, B3, B4 mittels entsprechender Bedienelemente 36 zur Steuerung beziehungsweise Bedienung der jeweiligen Geräte 18 vornehmen, erfasst. Aber nicht nur solche Steuerungseingaben SE werden erfasst, sondern auch das Verhalten der jeweiligen Benutzer Bl, B2, B3, B4. Zu diesem Zweck kann sowohl die Position als auch der Positionsverlauf der jeweiligen Benutzer Bl, B2, B3, B4 verfolgt bzw. getrackt werden, deren Körperhaltung, Gestik oder sonstige Bewegungen erfasst werden, und auf Basis dieser erfassten Verhaltensinformationen kann das Benutzerverhalten klassifiziert werden. Mit anderen Worten kann dem aktuellen Benutzerverhalten eine von mehreren definierten Aktionen beziehungsweise Handlungen zugeordnet werden, wie
beispielsweise das Sitzen an einem Schreibtisch, ein
Gruppenmeeting, eine Kaffeepause, oder ein zufälliges
Umherlaufen. Weiterhin können Verhaltensweisen, die keinem dieser definierten Kategorien zugeordnet werden können, der Gruppe „Spezielles Ereignis" zugeordnet werden. Sowohl die von den jeweiligen Benutzern durchgeführten
Steuerungseingaben SE als auch die im Verlauf der Zeit von den Benutzern ausgeführten Aktionen Al können in den
jeweiligen Benutzerprofilen PI, P2 mit entsprechenden
Zeitstempeln abgelegt werden. Zur Klassifikation des
Benutzerverhaltens können darüber hinaus auch akustische Sensoren, wie zum Beispiel die Mikrofone 26, genutzt werden. Weiterhin können auch die jeweiligen von den Umfeldsensoren 28 bereitgestellten Umfeldinformationen, zum Beispiel
aktuelle Helligkeit und/oder Temperatur, gespeichert werden.
Zusätzlich kann bei der Beobachtung noch zwischen dem Benutzerverhalten eines einzelnen in einem Zimmer 16 befindlichen Benutzers Bl, B2, B3, B4 und einem Benutzerverhalten eines Benutzers Bl, B2, B3, B4 innerhalb einer Benutzergruppe BG unterschieden werden. Auf Basis dieser erfassten Informationen und unter Verwendung eines bestärkenden Lernverfahrens ist das Gebäudemanagementsystem 12 dazu in der Lage, die Benutzergewohnheiten bezüglich der Benutzung der Geräte 18 des Gebäudes 10 zu erlernen. Dabei unterscheidet das Gebäudemanagementsystem 12 die Gewohnheiten eines Benutzers Bl, B2, B3, B4 als Einzelperson und die
Gewohnheiten einer Benutzergruppe BG mit mehreren bestimmten Benutzern Bl, B2, B3, B4, wie in diesem Beispiel die Benutzer B3 und B4. Auf Basis dieser Beobachtungen und des gelernten Verhaltens können dann Steuerungsregeln RI für die jeweiligen Benutzer beziehungsweise Benutzergruppen BG und insbesondere auch für ein jeweilige Zimmer 16 abgeleitet und gespeichert werden. Betritt ein Benutzer Bl, B2, B3, B4 zu einem späteren Zeitpunkt das Gebäude 10 erneut, so wird dieser mittels des Benutzeridentifikationssystems 24 identifiziert, beim Betreten der Zimmer 16 durch die jeweiligen Kameras 20 reidentifziert und entsprechend unter Verwendung der für diesen Benutzer Bl, B2, B3, B4 und für das betreffende Zimmer 16 ermittelten Regeln RI das Gerät 18 des Gebäudes 10 gesteuert. Dadurch ist es vorteilhafter Weise möglich, eine vollkommen automatisierte und personalisierte Steuerung jeweiliger Geräte 18 eines Gebäudes 10 umzusetzen.
Vorteilhafter Weise erfolgt dies, ohne dass dem Gebäudemanagementsystem 12 irgendwelche Vorgaben gemacht werden müssen. Dieses erlernt selbsttätig das Verhalten der jeweiligen Benutzer Bl, B2, B3, B4 und setzt dies dann entsprechend in der zweiten Phase, der Anwendungsphase, um. Nimmt ein Benutzer Bl, B2, B3, B4 in dieser zweiten Phase dennoch eine Steuerungseingabe SE zur Änderung einer Einstellung an einem der Geräte 18 vor, so kann diese Steuerungseingabe SE dem Gebäudemanagementsystem 12 als Feedback, d.h. Rückmeldung, zugeführt werden. Basierend auf diesem Feedback können die zuvor für das betreffende Zimmer 16 und den betreffenden Benutzer Bl, B2, B3, B4 ermittelten Steuerungsregeln RI angepasst werden. Dies wird später im Detail beschrieben.
Fig. 2 zeigt eine schematische Darstellung einzelner
Systemkomponenten, insbesondere der drei Hauptkomponenten, des Gebäudemanagementsystems 12 gemäß einem
Ausführungsbeispiel der Erfindung. Diese drei
Hauptkomponenten stellen das Benutzeridentifikationssystem 24 dar, welches bevorzugt als Gesichtserkennungssystem
ausgebildet ist, das Benutzerwiedererkennungssystem 38, sowie das verstärkende Lernsystem 40. Erscheint ein Benutzer B im Eingangsbereich 14 des Gebäudes, so wird dieser mittels des Benutzeridentifikationssystems 24 wie zuvor beschrieben identifiziert und dessen entsprechende Kennung ID an das Benutzerwiedererkennungssystem 38 übermittelt. Diese
Benutzerwiedererkennungssystem 38 erfasst
Wiedererkennungsmerkmale W1 des Benutzers B, was zum Beispiel wie zuvor beschrieben mittels einer im Eingangsbereich 14 angeordneten Kamera realisiert werden kann. Diese
Wiedererkennungsmerkmale W1 stellen vorzugsweise Merkmale betreffend das äußere Erscheinungsbild des Benutzers B dar. Das Benutzerwiedererkennungssystem 38 assoziiert nun die Kennung ID des Benutzers B mit dessen erfassten
Wiedererkennungsmerkmale W1 und speichert diese im Speicher 34. Betritt nun der Benutzer B ein (anderes) Zimmer 16 des Gebäudes, so wird der Benutzer B auf Basis der gespeicherten Wiedererkennungsmerkmale W1 durch das
Benutzerwiedererkennungssystem 38 reidentifiziert und die dem wiedererkannten Benutzer B zugeordnete Kennung ID aus dem Speicher 34 abgerufen und an das bestärkende Lernsystem 40 übermittelt. Das bestärkende Lernsystem 40 benutzt nun die übermittelte Kennung ID, um in einer Lernphase die
beobachteten Verhaltensweisen des Benutzers B wie zuvor beschrieben mit dessen Kennung ID zu assoziieren und für diesen Benutzer B entsprechende Steuerungsregeln RI zur
Steuerung der Geräte 18 zu ermitteln. In einer zweiten Phase, der Anwendungsphase des bestärkenden Lernsystems 40, wird die Kennung ID verwendet, um nun die Steuerung der Geräte 18 gemäß den für diesen Benutzer B ermittelten Steuerungsregeln RI umzusetzen.
Der Kern dieses verstärkenden Lernens ist dabei das so genannten Deep-Q-Lernen, welches ein künstliches neuronales Netz ANN als intelligenten Agenten nutzt, was nun anhand von Fig. 3 beschrieben wird.
Fig. 3 zeigt dabei eine schematische Darstellung der
Lernphase LP, in welcher als Eingangsgrößen dem künstlichen neuronalen Netz ANN Zustandsparameter ZI, Z2, Z3, Z4
zugeführt werden, die einen aktuellen Zustand Z definieren. Diese Zustandsparameter ZI, Z2, Z3, Z4 stellen dabei den aktuellen Zustand ZI beziehungsweise die aktuelle Einstellung eines betreffenden Geräts 18 dar, die Sensordaten Z2,
insbesondere der Umfeldsensoren 28, die Identität bzw.
Kennung ID des im Zimmer 16 befindlichen Benutzers B, Bl, B2, B3, B4, welche hier einen dritten Zustandsparameter Z3 darstellt, sowie die Benutzeraktivitäten bzw. die
klassifizierten Aktionen Al, welche hier einen dritten
Zustandsparameter Z4 darstellen. Weitere hier nicht
dargestellte Zustandsparameter stellen vorzugsweise noch das Zimmer 16 und/oder die Etage dar, in welchem sich der
Benutzer B, Bl, B2, B3, B4 befindet und der Energieverbrauch des Geräts 18.
Stellt das Gerät 18 beispielsweise eine
Beleuchtungseinrichtung dar, so können die folgenden
Einstellmöglichkeiten ZI vorgesehen sein: An, Aus, Dimmgrad, Farbe und ein Helligkeitswechselschema. Stellt das Gerät 18 eine Heizung dar, so können folgende Einstellmöglichkeiten ZI vorgesehen sein: An, Aus, Heizgrad beziehungsweise
Temperatur. Stellt das Gerät 18 einen Ventilator dar, so können folgende Einstellmöglichkeiten ZI vorgesehen sein: An, Aus, Ventilatorgeschwindigkeit. Stellt das Gerät 18 eine Klimaanlage an, so können folgende Einstellmöglichkeiten ZI vorgesehen sein: An, Aus, Modus, Lüftergeschwindigkeit,
Temperatur. In dieser Lernphase LP werden dem künstlichen neuronalen Netz ANN zusätzlich auch die vom Benutzer B, Bl, B2, B3, B4 getätigten Steuerungseingaben SE als Feedback zugeführt. In Abhängigkeit von diesen Eingangsgrößen
ermittelt das künstliche neuronale Netz ANN nun eine
Steuerstrategie zum Steuern der Geräte 18, und zwar so, dass, wenn eine automatische Steuerung des Geräts 18 gemäß dieser Steuerstrategie in der Lernphase durchgeführt worden wäre, sich die automatischen Steuerungseingaben mit den vom
Benutzer durchgeführten Steuerungseingaben so weit wie mögliche gedeckt hätten und damit die Anzahl der vom
identifizierten Benutzer B, Bl, B2, B3, B4 getätigten
Steuerungsangaben SE minimiert worden wäre. In der Lernphase LP selbst werden jedoch noch keine automatischen Steuerungen durchgeführt und der Agent beobachtet nur. Jedoch kann der Agent gleichzeitig seine hypothetischen Aktivitäten und
Steuerungsstrategien simulieren und dann nach einem
vorbestimmbare Zeitraum, zum Beispiel 15 Tagen, selbst entscheiden, ob seine hypothetischen Aktionen sich mit den noch manuellen Aktionen bzw. Steuerungseingaben SE des
Benutzers B, Bl, B2, B3, B4 decken. Wenn der Agent dann im Laufe der Lernphase LP einen Entscheidungszustand oder eine vorbestimmte Vorhersagequalität erreicht, dass seine
simulierten Aktionen bzw. Steuerungseingaben sich mit den Aktionen bzw. Steuerungseingaben SE des Benutzers B, Bl, B2, B3, B4 decken, dann kann der Agent selbsttätig die
automatische Steuerung übernehmen und dadurch in die zweite Phase, d.h. die Anwendungsphase AP übergehen. Dabei erhält der intelligente Agent, das heißt in diesem Fall das
künstliche neuronale Netz ANN, eine Belohnung, die umso höher ausfällt, je weniger Steuerungseingaben SE vom Benutzer B,
Bl, B2, B3, B4 getätigt werden mussten.
Das bestärkende Lernsystem 40, in welchem das künstliche neuronale Netz ANN zum Einsatz kommt, wählt letztendlich die Steuerungsregeln so, dass die Belohnung maximiert wird. Mit anderen Worten, es versucht vom Benutzer B, Bl, B2, B3, B4 getätigte manuelle Steuerungseingaben SE vollständig zu vermeiden und damit zur vollen Automatisierung der Steuerung der Geräte 18 zu gelangen. In der Lernphase LP wird also das Feedback der Benutzer in Form ihrer getätigten
Steuerungseingaben SE genutzt, um das künstliche neuronale Netz ANN zu trainieren.
Als Ergebnis ist jedem Zustand Z ein R-Wert, d.h. der
numerische Wert der Belohnung, zugeordnet, den der Agent einsammeln kann, wenn er diesen Zustand Z anfährt. Mit anderen Worten wird also in der Lernphase LP die Qualität der Zustände Z ausgelotet bzw. ermittelt. Wenn also der Benutzer B, Bl, B2, B3, B4 in der Lernphase LP ausgehend von einem gegebenen Zustand Z eine bestimmte Steuerungseingabe SE macht, um in einen anderen Zustand Z zu gelangen, so kann diesem vom gegebenen Zustand Z aus angefahrene andere Zustand Z ein hoher R-Wert zugeordnet werden. Die Zielzustände Z, die ein Benutzer B, Bl, B2, B3, B4 ausgehend von einem gegebenen Zustand Z häufiger anfährt als andere werden entsprechend in der Lernphase LP mit einem höheren R-Wert bewertet als andere. Zudem können durch die Belohnung auch
energieeffizientere Zustände Z präferiert werden.
Beispielsweise kann einem Zustand Z mit einem niedrigeren Energieverbrauch ein höherer R-Wert zugeordnet werden als einem Zustand Z mit höherem Energieverbrauch. Mit anderen Worten kann die Belohnung zusätzlich zu den
Benutzerpräferenzen auch vom Energieverbrauch eines Zustands Z abhängig sein. In der Anwendungsphase AP (vgl. Fig. 4) kann anschließend der intelligente Agent eine Policy (Plan) ausrechnen, um über Zwischenzuständen mit möglichst vielen R- Werten von einem Jetzt-Zustand Z in einen anderen Endzustand Z zu gelangen. Dies entspricht einem Markov-
Entscheidungsproblem, bei welchem jeder Zustand Z des großen Zustandsraums (Zustandsmatrix) seinen R-Wert mitbeinhaltet.
Fig. 4 zeigt eine schematische Darstellung der
Anwendungsphase AP, die sich an die Lernphase LP anschließt. Auch hier erhält das künstliche neuronale Netz ANN wiederum die bereits zu Fig. 3 beschriebenen Zustandsparameter ZI, Z2, Z3, Z4 als Eingangsparameter. In Abhängigkeit von diesem Eingangszustand Z berechnet das künstliche neuronale Netz ANN nun für jede mögliche Einstellung der Geräte 18, das heißt zum Beispiel das An- und Abschalten des betreffenden Geräts 18, ein Verändern des Dimmgrads einer
Beleuchtungseinrichtung, das Erhöhen und Verringern der
Temperatur der Klimaanlage und so weiter, einen so genannten Q-Wert. Dieser Q-Wert repräsentiert die Wahrscheinlichkeit dafür, dass für den gegebenen Eingangszustand Z der
betreffende identifizierte Benutzer B, Bl, B2, B3, B4 eine bestimmte Einstellung vornehmen würde, und stellt den
integralen R-Wert dar.
Diese ermittelten und in Fig. 4 mit Q bezeichneten Q-Werte für die jeweiligen Einstellungen werden an das Steuerungszentrum, das heißt der Steuereinheit 30 (vergleiche Fig. 1) zum Steuern der jeweiligen Geräte 18 übermittelt. Dabei werden durch die Steuereinheit 30 nur diejenigen
Einstellungen umgesetzt, deren Q-Wert Q einen vorbestimmten Grenzwert überschreitet und/oder im Falle mehrerer nur alternativer Einstellmöglichkeiten, diejenige, deren Q-Wert Q am höchsten ist. Die so ermittelten Einstellungen für die jeweiligen Geräte 18 können als vorläufige Einstellungen VE durch die Steuereinheit 30 bereitgestellt werden. Optional können diese vorläufigen Einstellungen VE noch mit bestimmten Randbedingungen R, die die Energieeffizienz betreffen, abgeglichen werden. Dieser Abgleich liefert letztendlich die finalen Einstellungen FE und werden dann durch eine
entsprechende automatische Ansteuerung der jeweiligen Geräte 18 durch die Steuereinheit 30 umgesetzt. Die Optimierung des Energieverbrauchs kann jedoch, wie oben beschrieben, bereits in den R-Werten für die jeweiligen Zustände Z bereits berücksichtigt sein. Zudem kann der Agent auch in der
Anwendungsphase weiterhin lernen. Auch dies erfolgt wiederum durch die Rückmeldung des Benutzers B, Bl, B2, B3, B4. Wird beispielsweise eine automatische Ansteuerung der jeweiligen Geräte 18 durch die Steuereinheit 30 umgesetzt, kann
daraufhin überprüft werden, ob eine vom Benutzer B, Bl, B2, B3, B4 getätigte Steuerungseingabe SE erfasst wird. Wenn ein Benutzer B, Bl, B2, B3, B4 bei einem bestimmten angefahrenen Zustand Z interferiert bzw. eingreift, dann ist dieser
Zustand Z sicher nicht wünschenswert. Entsprechend kann zum Beispiel der diesem Zustand Z, der vom System angefahren wurde, zugeordnete R-Wert verringert werden. BEZUGSZEICHENLISTE
10 Gebäude
12 Gebäudemanagementsystem
14 Eingangsbereich
16 Zimmer
18 Gerät
20 Kamera
22 Sichtfeld
24 Benutzeridentifikationssystem
26 Mikrofon
28 Umfeldsensor
30 Steuereinheit
32 Rechnereinrichtung
34 Speicher
36 Bedienelement
38 BenutzerwiedererkennungsSystem
40 Bestärkendes Lernsystem
Al Aktion
ANN künstliches neuronales Netz
AP Anwendungsphase
B Benutzer
B1-B4 Benutzer
BG Benutzergruppe
C1-C2 Benutzercharakteristik
FE finale Einstellungen
ID Kennung
ID1 Kennung
LP Lernphase
P1-P2 Benutzerprofil
Q Q-Wert
RI Steuerungsregel
SE Steuerungseingaben
VE vorläufige Einstellungen W1 Wiedererkennungsmerkmal
Z Zustand
Z1-Z4 Zustandsparameter

Claims

Patentansprüche
1. Verfahren zum automatischen Steuern zumindest eines
Geräts (18) eines Gebäudes (10) mittels eines
Gebäudemanagementsystems (12), wobei
— in einer Lernphase (LP) des Gebäudemanagementsystems (12) mindestens ein Benutzer (B, Bl, B2, B3, B4) des Gebäudes (10) auf Basis zumindest einer erfassten ersten Benutzercharakteristik (CI) identifiziert wird;
— mindestens eine Steuerungseingabe (SE) , welche durch den mindestens einen Benutzer (B, Bl, B2, B3, B4) zum Steuern des zumindest einen Geräts (18) getätigt wird, erfasst wird, während sich der mindestens eine identifizierte Benutzer (B, Bl, B2, B3, B4) im Gebäude (10) befindet; und
— in Abhängigkeit von der mindestens einer erfassten Steuerungseingabe (SE) des mindestens einen
identifizierten Benutzers (B, Bl, B2, B3, B4) das Gebäudemanagementsystem (12) Steuerungsregeln (RI) ermittelt, die dem mindestens einen identifizierten Benutzer (B, Bl, B2, B3, B4) zugeordnet sind und gemäß welchen das zumindest eine Gerät (18) des
Gebäudes (10) automatisch in einer zweiten Phase (AP) des Gebäudemanagementsystems (12) gesteuert wird, während sich der mindestens einen Benutzer (B, Bl,
B2, B3, B4) im Gebäude (10) befindet.
2. Verfahren nach Anspruch 1, wobei die mindestens eine
erste Benutzercharakteristik (CI) zumindest eine der
Folgenden darstellt:
— mindestens ein Gesichtsmerkmal;
— mindestens ein Merkmal betreffend das Aussehen des
Körpers ;
— mindestens ein Fingerabdruck;
— mindestens eine Stimmencharakteristik;
— mindestens eine Gangcharakteristik.
3. Verfahren nach einem der vorhergehenden Ansprüche, wobei während der Lernphase (LP) zusätzlich zumindest eine zweite Benutzercharakteristik (Al) des mindestens einen identifizierten Benutzers (B, Bl, B2, B3, B4) bestimmt wird, insbesondere eine Aktivität (Al) des mindestens einen identifizierten Benutzers (B, Bl, B2, B3, B4), während sich der mindestens eine identifizierte Benutzer (B, Bl, B2, B3, B4) im Gebäude (10) befindet, und wobei die Steuerungsregeln (RI) zusätzlich in Abhängigkeit von der mindestens einen zweiten Benutzercharakteristik (Al) des mindestens einen identifizierten Benutzers (B, Bl,
B2, B3, B4) ermittelt werden.
4. Verfahren nach Anspruch 3, wobei die mindestens eine
zweite Benutzercharakteristik (Al) in Abhängigkeit von mindestens einem erfassten Parameter der folgenden
Parameter bestimmt wird:
— eine erfasste Körperhaltung des mindestens einen
identifizierten Benutzers (B, Bl, B2, B3, B4);
— eine erfasste Bewegung des mindestens einen
identifizierten Benutzers (B, Bl, B2, B3, B4) und/oder zumindest eines Körperteils des mindestens einen identifizierten Benutzers (B, Bl, B2, B3, B4);
— eine verfolgte Position des mindestens einen
identifizierten Benutzers (B, Bl, B2, B3, B4) .
5. Verfahren nach Anspruch 4, wobei basierend auf einer
Analyse des mindestens einen erfassten Parameters des mindestens einen identifizierten Benutzers (B, Bl, B2,
B3, B4) die mindestens eine zweite Benutzercharakteristik (Al) als eine von mehreren verschiedenen vorbestimmten Benutzeraktivitäten (Al) klassifiziert wird, die
insbesondere darstellen:
— Sitzen an einem Tisch;
— ein Gruppentreffen;
— eine Kaffeepause;
— zufälliges Umherlaufen; und
— ein spezielles Ereignis.
6. Verfahren nach einem der Ansprüche 3 bis 5, wobei
Audiosignale mittels zumindest eines Audiosensors (26) aufgenommen werden, während sich der mindestens eine identifizierte Benutzer (B, Bl, B2, B3, B4) im Gebäude (10) befindet, wobei die mindestens eine zweite
Benutzercharakteristik (Al) in Abhängigkeit von dem aufgenommenen Audiosignal bestimmt wird, insbesondere unter Verwendung von Spracherkennung.
7. Verfahren nach einem der vorhergehenden Ansprüche, wobei während der Lernphase (LP) zusätzlich mindestens eine Umfeldinformation mittels mindestens eines Sensors (28) erfasst wird, während sich der mindestens eine
identifizierte Benutzer (B, Bl, B2, B3, B4) im Gebäude (10) befindet, wobei die Steuerungsregeln (RI) zusätzlich in Abhängigkeit von der mindestens einen
Umfeldinformationen ermittelt werden.
8. Verfahren nach einer der Ansprüche 3 bis 7, wobei zum
Ermitteln der Steuerungsregeln (RI) zweite
Benutzercharakteristiken (Al) und/oder erfasste
Umfeldinformationen, die einen kürzeren zeitlichen
Abstand zu einer nachfolgenden Steuerungseingabe (SE) durch den mindestens einen Benutzer (B, Bl, B2, B3, B4) aufweisen, stärker gewichtet werden als erfasste zweite Benutzercharakteristiken (Al) und/oder
Umfeldinformationen, die einen größeren zeitlichen
Abstand zu der nachfolgenden Steuerungseingabe (SE) aufweisen .
9. Verfahren nach einem der Ansprüche 3 bis 8, wobei nur Daten, welche die mindestens eine zweite
Benutzercharakteristik (Al) und/oder die mindestens eine Umfeldinformationen betreffen und die innerhalb eines vorbestimmten Zeitintervalls vor der mindestens einen Steuerungseingabe (SE) erfasst wurden, zum Ermitteln und/oder zum Anpassen der Steuerungsregeln (RI)
berücksichtigt werden.
10. Verfahren nach einem der Ansprüche 3 bis 9, wobei in der zweiten Phase (AP) und im Fall, dass der mindestens eine Benutzer (B, Bl, B2, B3, B4) erneut identifiziert wird, die mindestens eine erste und/oder zweite
Benutzercharakteristik (CI, Al) und/oder die
Umgebungsinformation erneut bestimmt wird und das mindestens eine Gerät (18) in Abhängigkeit von der erneut bestimmten ersten (CI) und/oder zweiten
Benutzercharakteristik (C2) und/oder Umgebungsinformation gesteuert wird.
11. Verfahren nach einem der vorhergehenden Ansprüche, wobei das Gebäude (10) mehrere Zimmer (16) und/oder Etagen aufweist, und wobei die Steuerung des mindestens einen Geräts (18) separat für jedes Zimmer (16) und/oder für jede Etage durchgeführt wird.
12. Verfahren nach einem der vorhergehenden Ansprüche, wobei die Steuerung des mindestens einen Geräts (18) in
Abhängigkeit davon durchgeführt wird, ob der mindestens eine Benutzer (B, Bl, B2, B3, B4) die einzige Person im Gebäude (10), insbesondere in einem Zimmer (16) des Gebäudes (10), ist oder ob der mindestens eine Benutzer (B, Bl, B2, B3, B4) Teil eine Benutzergruppe (BG) aus mehreren Benutzern (Bl, B2, B3, B4) ist, die sich zur gleichen Zeit im Gebäude (10), insbesondere in einem Zimmer (16) des Gebäudes (10), befinden.
13. Verfahren nach einem der vorhergehenden Ansprüche, wobei das Gebäudemanagementsystem (12) mittels eines
maschinenlernenden Verfahrens, insbesondere eines bestärkenden Lernverfahrens, insbesondere eines Deep-Q- Lernverfahrens unter Verwendung eines künstlichen
neuronalen Netzes (ANN) als ein intelligenter Agent, bevorzugt mittels eines Off-Policy-Q ( s , a, r, s', a')- Lernverfahrens die Steuerungsregeln (RI) ermittelt und/oder die ermittelten Steuerungsregeln (RI) anpasst und die Steuerung durchführt.
14. Verfahren nach Anspruch 13, wobei der intelligente Agent eine Belohnung erhält, die umso höher ist, je seltener durch den mindestens einen Benutzer (B, Bl, B2, B3, B4) Steuerungseingaben (SE) ausgeführt werden, insbesondere wobei nach jeder Aktion, die vom Agenten durchgeführt wurde, überprüft wird, ob eine Steuerungseingabe (SE) durch den mindestens einen identifizierten Benutzer (B, Bl, B2, B3, B4) durchgeführt würde, und falls keine
Steuerungseingabe (SE) durch den mindestens einen
Benutzer (B, Bl, B2, B3, B4) durchgeführt wurde, der intelligente Agent die Belohnung erhält.
15. Verfahren nach einem der Ansprüche 13 oder 14, wobei der intelligente Agent schrittweise die Steuerungsregeln (RI), die dem mindestens einen Benutzer (B, Bl, B2, B3, B4) zugeordnet sind, basierend auf neu erfassten
Informationen betreffend den mindestens einen Benutzer (B, Bl, B2, B3, B4), insbesondere neu bestimmte zweite Benutzercharakteristiken (Al) und neu erfasste
Steuerungseingaben (SE) , mit dem Ziel, die Belohnung zu maximieren, anpasst.
16. Verfahren nach einem der Ansprüche 13 bis 15, wobei das Gebäudemanagementsystem (12) für jede mögliche definierte Einstellung des mindestens einen Geräts (18) einen Q-Wert (Q) bestimmt, der die Wahrscheinlichkeit wiedergibt, dass die jeweilige Einstellung in einem gegebenen bestimmten Zustand (Z) , welcher als eine Eingangsgröße vom
künstlichen neuronalen Netz (ANN) empfangen wird, vorgenommen wird, und wobei der bestimmte Zustand (Z) durch mindestens einen, vorzugsweise mehrere, besonders bevorzugt alle der folgenden Zustands-Parameter (ZI, Z2, Z3, Z4) bestimmt wird: — einer Benutzer-ID (ID, ID1), die dem mindestens einen Benutzer (B, Bl, B2, B3, B4) zugeordnet wird, wenn der mindestens eine Benutzer (B, Bl, B2, B3, B4) auf der Basis der mindestens einen ersten
Benutzercharakteristik (CI) identifiziert wird;
— der mindestens einen zweiten Benutzercharakteristik (Al) ;
— eines aktuellen Zustands des mindestens einen Geräts (18) ;
— der mindestens einen Umfeldinformation;
wobei die Einstellung, für welchen der Q-Wert (Q) oberhalb eines definierten Grenzwerts liegt und/oder für welche der Q-Wert (Q) den Höchsten darstellt, durch das Gebäudemanagementsystem (12) umgesetzt wird.
17. Verfahren nach einem der vorhergehenden Ansprüche, wobei in Abhängigkeit von mindestens einer vorbestimmten
Energiespar-Bedingung (R) die Steuerungsregeln (RI) ermittelt werden und/oder angepasst werden.
18. Verfahren nach Anspruch 17, wobei in Abhängigkeit von der mindestens einen vorbestimmten Energiespar-Bedingung (R) die Steuerungsregeln (RI) durch erweitertes Q-Learning variiert werden, insbesondere so dass ein
Energieverbrauch des mindestens einen Geräts (18) und ein Benutzerkomfort gleichzeitig optimiert werden.
19. Verfahren nach einem der Ansprüche 13 bis 18, wobei der intelligente Agent mit Videosensoren (20) zum Tracken der Position des mindestens einen Benutzers (B, Bl, B2, B3, B4) verbunden ist, wobei die Videosensoren (20) ein sensorintegriertes Deep-Learning-Verfahren zum Tracken der Position des mindestens einen Benutzers (B, Bl, B2, B3, B4), und insbesondere zum Wiedererkennen des
mindestens einen Benutzers (B, Bl, B2, B3, B4) im Falle, dass der mindestens eine Benutzer (B, Bl, B2, B3, B4) ein erstes Sichtfeld (22) eines ersten Videosensors (20) der Videosensoren (20) verlässt und ein zweites Sichtfeld (22) eines zweiten Videosensors (20) der Videosensoren (20) betritt, verwenden, wobei sich das erstes Sichtfeld (22) und das zweite Sichtfeld (22) nicht überschneiden.
20. Gebäudemanagementsystem (12) zum automatischen Steuern zumindest eines Geräts (18) eines Gebäudes (10), wobei das Gebäudemanagementsystem (12) dazu ausgelegt ist
— in einer Lernphase (LP) des Gebäudemanagementsystems (12) mindestens einen Benutzer (B, Bl, B2, B3, B4) des Gebäudes (10) auf Basis mindestens einer erfassten ersten Benutzercharakteristik (CI) zu identifizieren;
— mindestens eine Steuerungseingabe (SE) , die vom
mindestens einen Benutzer (B, Bl, B2, B3, B4) zum Steuern des zumindest einen Geräts (18) ausgeführt wird, zu erfassen, während der mindestens eine identifizierte Benutzer (B, Bl, B2, B3, B4) sich innerhalb des Gebäudes (10) befindet; und
— in Abhängigkeit von der mindestens einen erfassten Steuerungseingabe (SE) des mindestens einen
identifizierten Benutzers (B, Bl, B2, B3, B4) Steuerungsregeln (RI) zu ermitteln, welche dem mindestens einen identifizierten Benutzer (B, Bl, B2, B3, B4) zugeordnet werden, und in einer zweiten Phase (AP) des Gebäudemanagementsystems (12) das zumindest eine Gerät (18) des Gebäude (10) automatisch gemäß den ermittelten Steuerungsregeln (RI) zu steuern, während sich der mindestens eine Benutzer (B, Bl, B2, B3, B4) im Gebäude (10) befindet.
PCT/EP2019/053096 2018-02-23 2019-02-08 Verfahren zum automatischen steuern zumindest eines geräts eines gebäudes mittels eines gebäudemanagementsystems und gebäudemanagementsystem WO2019162104A1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102018202775.7 2018-02-23
DE102018202775.7A DE102018202775A1 (de) 2018-02-23 2018-02-23 Verfahren zum automatischen Steuern zumindest eines Geräts eines Gebäudes mittels eines Gebäudemanagementsystems und Gebäudemanagementsystem

Publications (1)

Publication Number Publication Date
WO2019162104A1 true WO2019162104A1 (de) 2019-08-29

Family

ID=65363297

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2019/053096 WO2019162104A1 (de) 2018-02-23 2019-02-08 Verfahren zum automatischen steuern zumindest eines geräts eines gebäudes mittels eines gebäudemanagementsystems und gebäudemanagementsystem

Country Status (2)

Country Link
DE (1) DE102018202775A1 (de)
WO (1) WO2019162104A1 (de)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102014108374A1 (de) * 2014-06-13 2015-12-17 LOEWE Technologies GmbH Verfahren zum Steuern eines Heimautomatisierungsnetzwerks, Steuereinrichtung und Heimautomatisierungsnetzwerk
US9817383B1 (en) * 2016-07-11 2017-11-14 Johnson Controls Technology Company Systems and methods for agent interaction with building management system

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
"Intelligent Building Control Systems", 13 December 2017, SPRINGER, ISBN: 978-3-319-68461-1, article JOHN T WEN ET AL: "Intelligent Building Control Systems", XP055568172 *
A PENTLAND ET AL: "Face recognition for smart environments", COMPUTER, 1 February 2000 (2000-02-01), pages 50 - 55, XP055568151, Retrieved from the Internet <URL:http://alumni.media.mit.edu/~tanzeem/computer2000_biometrics.pdf> DOI: 10.1109/2.820039 *
GIUSEPPE AMATO ET AL: "Towards Multimodal Surveillance for Smart Building Security", PROCEEDINGS, vol. 2, no. 2, 9 January 2018 (2018-01-09), pages 95, XP055568155, DOI: 10.3390/proceedings2020095 *
HYURI S. MACIEL ET AL: "An integrated access control and lighting configuration system for smart buildings", JOURNAL OF COMMUNICATIONS SOFTWARE AND SYSTEMS, vol. 13, no. 2, 1 June 2017 (2017-06-01), pages 101 - 108, XP055568154, ISSN: 1845-6421, DOI: 10.24138/jcomss.v13i2.378 *
KARLI PETROVIC: "Smart Buildings Are the Next IoT Frontier - iQ by Intel", 2 December 2016 (2016-12-02), XP055568176, Retrieved from the Internet <URL:https://iq.intel.com/smart-buildings-next-iot-frontier/> [retrieved on 20190312] *
PENTLAND A ED - JAIN A K ET AL: "Smart rooms, smart clothes", PATTERN RECOGNITION, 1998. PROCEEDINGS. FOURTEENTH INTERNATIONAL CONFE RENCE ON BRISBANE, QLD., AUSTRALIA 16-20 AUG. 1998, LOS ALAMITOS, CA, USA,IEEE COMPUT. SOC, US, vol. 2, 16 August 1998 (1998-08-16), pages 949 - 953, XP010297736, ISBN: 978-0-8186-8512-5, DOI: 10.1109/ICPR.1998.711845 *
RUI YANG ET AL: "Development of multi-agent system for building energy and comfort management based on occupant behaviors", ENERGY AND BUILDINGS, vol. 56, 1 January 2013 (2013-01-01), CH, pages 1 - 7, XP055568503, ISSN: 0378-7788, DOI: 10.1016/j.enbuild.2012.10.025 *

Also Published As

Publication number Publication date
DE102018202775A1 (de) 2019-08-29

Similar Documents

Publication Publication Date Title
EP0900417B1 (de) Heim- und gebäudeautomationssystem
EP2638442B1 (de) Gebäudeautomationssystem
DE112016000097T5 (de) Sensorsystem
EP2955599A1 (de) Verfahren zum steuern eines heimautomatisierungsnetzwerks, steuereinrichtung und heimautomatisierungsnetzwerk
EP1770454A1 (de) Hausautomationssystem
DE102010006455B4 (de) Verfahren, Steuereinrichtung und -system zur Be-und Entlüftung eines Gesamtraums mit mehreren Teilräumen, insbesondere eines eine Wohneinheit bildenden Gesamtraums
DE69817455T2 (de) Selbstkonfigurierende Methode und System zur Energieverwaltung in einem Wohnbereich
CN116358135A (zh) 风管机的控制方法、装置及风管机
DE102018204789A1 (de) Verfahren zur Klimasteuerung in Räumen
CN104315669A (zh) 空调控制系统
EP2890056A1 (de) Unterstützung von Nutzern in einer intelligenten häuslichen Umgebung
WO2019162104A1 (de) Verfahren zum automatischen steuern zumindest eines geräts eines gebäudes mittels eines gebäudemanagementsystems und gebäudemanagementsystem
WO2024046780A1 (de) Steuerung gebäudetechnischer anlagen
DE60303259T2 (de) Adaptives Steuersystem für ein vom Anwender einstellbares Fahrzeugsystem
DE102018222376A1 (de) Verfahren und Vorrichtung zur Anpassung einer Funktionalität eines Sensors eines Sensornetzwerks
DE102013008337A1 (de) Beleuchtungssystem für ein Gebäude mit einer Beleuchtungsanordnung mit einstellbarem Lichtspektrum
EP1081442A1 (de) Verfahren zum Regeln einer Zuluft-Konditionieranlage und Regelvorrichtung für eine Zuluft-Konditionieranlage
DE202015103564U1 (de) Temperaturregelungssystem
EP0991988B1 (de) Schalterelement und verfahren zu seiner steuerung
EP3709122B1 (de) Vorrichtung zur temperaturregelung von räumen in einem gebäude und verfahren zur temperaturregelung
DE102019213519A1 (de) Verfahren zum Betreiben von Sensoren
EP2367321B1 (de) Kommunikationssystem und -verfahren
DE102022214170A1 (de) Verfahren zur Verbesserung der Luft in Räumen
EP4141333A1 (de) Verfahren zum steuern eines heizungssystems, heizungssysteme und steuervorrichtungen zum steuern eines heizungssystems
DE102016222793A1 (de) Sprachsteuervorrichtung und Verfahren zum Kontrollieren wenigstens eines elektrischen Netzwerkgerätes, intelligentes Heimnetzwerk und Smart-Home

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19704307

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19704307

Country of ref document: EP

Kind code of ref document: A1