EP4661979A1 - Verfahren und vorrichtung zum einblenden eines virtuellen objekts - Google Patents

Verfahren und vorrichtung zum einblenden eines virtuellen objekts

Info

Publication number
EP4661979A1
EP4661979A1 EP23757283.9A EP23757283A EP4661979A1 EP 4661979 A1 EP4661979 A1 EP 4661979A1 EP 23757283 A EP23757283 A EP 23757283A EP 4661979 A1 EP4661979 A1 EP 4661979A1
Authority
EP
European Patent Office
Prior art keywords
user
field
virtual object
processing unit
data processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
EP23757283.9A
Other languages
English (en)
French (fr)
Inventor
Thomas PETERSEIL
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Publication of EP4661979A1 publication Critical patent/EP4661979A1/de
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/20Instruments for performing navigational calculations
    • G01C21/206Instruments for performing navigational calculations specially adapted for indoor navigation
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/20Input arrangements for video game devices
    • A63F13/21Input arrangements for video game devices characterised by their sensors, purposes or types
    • A63F13/213Input arrangements for video game devices characterised by their sensors, purposes or types comprising photodetecting means, e.g. cameras, photodiodes or infrared cells
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/20Input arrangements for video game devices
    • A63F13/21Input arrangements for video game devices characterised by their sensors, purposes or types
    • A63F13/215Input arrangements for video game devices characterised by their sensors, purposes or types comprising means for detecting acoustic signals, e.g. using a microphone
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/55Controlling game characters or game objects based on the game progress
    • A63F13/57Simulating properties, behaviour or motion of objects in the game world, e.g. computing tyre load in a car race game
    • A63F13/573Simulating properties, behaviour or motion of objects in the game world, e.g. computing tyre load in a car race game using trajectories of game objects, e.g. of a golf ball according to the point of impact
    • GPHYSICS
    • G02OPTICS
    • G02BOPTICAL ELEMENTS, SYSTEMS OR APPARATUS
    • G02B27/00Optical systems or apparatus not provided for by any of the groups G02B1/00 - G02B26/00, G02B30/00
    • G02B27/0093Optical systems or apparatus not provided for by any of the groups G02B1/00 - G02B26/00, G02B30/00 with means for monitoring data relating to the user, e.g. head-tracking, eye-tracking
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/04815Interaction with a metaphor-based environment or interaction object displayed as three-dimensional [3D], e.g. changing the user viewpoint with respect to the environment or object
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three-dimensional [3D] modelling for computer graphics
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/20Scenes; Scene-specific elements in augmented reality scenes
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F2300/00Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game
    • A63F2300/80Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game specially adapted for executing a specific type of game
    • A63F2300/8082Virtual reality
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B19/00Teaching not covered by other main groups of this subclass

Definitions

  • the invention relates to a method for fading in a computer-generated, virtual object into the field of vision of a real environment perceived by a user, in particular into the field of vision of a transparent display unit worn by the user, wherein the virtual object is faded in by means of a central data processing unit depending on the current position and the direction of view of the user, and the virtual object is additionally faded in depending on the presence of visual or movement obstacles, wherein the visual or movement obstacles are determined by the central data processing unit on the basis of a digital image of surfaces of the real environment, according to the preamble of claim 1, and a device for carrying out the inventive method according to claim 7.
  • MR mixed reality
  • AR augmented reality
  • a computer-generated, virtual object is displayed in the field of vision of a real environment as perceived by the user, depending on the user's current position and direction of view.
  • Different sensors are used to determine this in the conventional way, such as acceleration sensors (accelerometers or G-sensors), sometimes in combination with magnetometers, cameras and/or gyroscopes, as well as GPS systems.
  • the user's current position and direction of view initially determine whether a virtual object is displayed at all.
  • playback units in the form of data glasses are used, i.e. devices that are worn like glasses and are able to display virtual objects in the real world and position these objects in relation to real objects in space.
  • data glasses are also referred to as "augmented reality” glasses or “mixed reality” glasses.
  • augmented reality glasses
  • mixed reality glasses
  • a user who has put on such glasses sees the environment as if through normal glasses, but (holographically virtual) objects can be displayed in their field of vision.
  • lenses is also conceivable, which act as a playback unit and allow virtual objects to be displayed in the user's field of vision.
  • One possible area of application is in the education and training of police, fire brigade or military personnel.
  • the personnel move through an operational area in different lighting conditions and sometimes with acoustic sound, and must react correctly to different scenarios which are realized by displaying virtual objects.
  • police personnel can be trained to search a building for perpetrators.
  • the perpetrators are positioned by a training manager as virtual objects behind walls, doors, pieces of furniture and the like, and are visible or hidden depending on the position and direction of the trainee.
  • the training can consist of fighting a virtual fire in a building and in doing so recognising the dangers posed by smoke, smoke explosions or collapsing parts of a building and training the appropriate behaviour.
  • actions against enemy troops can be practiced. These troops are displayed as virtual objects in the form of advancing troops such as tanks and the like or even enemy soldiers.
  • US 2002/0196202 Al and US 2003/0210228 Al describe a procedure in which emergency personnel who are in an emergency situation in a When moving inside a building, information is displayed on data glasses based on a building plan that is available to the head of operations as a digital image. Such information can be warnings about possible dangers, or navigation aids in the form of arrows and the like. Displaying virtual objects while taking into account possible obscuration by structural features or pieces of furniture is not possible with a method according to US 2002/0196202 Al and US 2003/0210228 Al. US 2002/0191004 Al describes another method for displaying virtual objects for training emergency personnel.
  • US 2018/0330184 Al describes a method for creating a digital image of surfaces inside a building, whereby the building interior is measured using a sensor for distance measurement.
  • the result of the distance measurements is a three-dimensional data point cloud from which the course of floors, ceilings and walls of the interior is reconstructed using mathematical methods.
  • the US 2018/0330184 Al does not provide for the display of virtual objects.
  • US 2022/108535 Al describes methods for displaying a virtual object in the form of an avatar in the field of view of augmented reality glasses.
  • US 2022/130094 Al describes methods for animating an avatar, in particular for controlling movements of the avatar on the basis of a data network of polygons ("navigation mesh", "navmesh”).
  • WO 2022/004422 Al deals with displaying virtual objects in the field of view of augmented reality glasses, incorporating external data to make the display of the virtual object more realistic.
  • US 2021/038975 Al describes a system in which viewers with appropriate portable devices can take part in AR games played by other participants.
  • KR 20210069806 A a method for analyzing camera images with regard to spatial and object recognition based on neural networks is proposed, whereby the data thus obtained Room and object data can be used to improve the display of a virtual object.
  • a digital image of the interior of a building is to determine it by measuring the interior of the building with a camera capable of measuring depth information.
  • the camera capable of measuring depth information can be mounted on the playback unit used to walk through the interior of the building.
  • a camera capable of measuring depth information is also referred to as a 3D camera and can be designed as a ToF ("Time-of-Flight") camera.
  • ToF cameras are cameras that not only record a 2D image, but also measure depth information for each recording pixel.
  • Depth information is understood to mean information about the distances between the individual objects in a scene and the ToF camera.
  • a digital image can be obtained from the "scans" of depth information obtained in this way, which approximates the surfaces of the interior of the building using surface elements.
  • These surface elements can They can be in the form of planar surface elements in the form of triangles, squares or hexagons, which seamlessly reproduce the surface to be approximated.
  • the common corner points of these surface elements are also referred to as node points ("vertices"), the side of the surface elements facing the viewer is referred to as “faces" and the entirety of the node points is referred to as "mesh”.
  • Another possibility using known mathematical methods is to assign an orientation to the surface elements by calculating a surface normal to the surface element in question.
  • the above-mentioned method of AT 523 . 953 and EP 21735597 . 3 makes use of these possibilities by first determining a digital image of surfaces of the interior of the building made up of planar surface elements. Subsequently, however, only those surface elements are used which lie between a floor level of the interior of the building and an assumed eye level level which defines a maximum height for the subsequent process steps.
  • An eye level level is generally understood to be a horizontal plane which is at eye level. The exact height is not important here; it is assumed to be 1.80 m, for example.
  • the digital image of the building interior is thus "cut off" at eye level.
  • those surface elements are determined whose surface normals run horizontally or vertically, i.e. surface elements whose orientation is vertical or horizontal.
  • a horizontal layering is carried out between the floor level of the building interior and the assumed eye level with a plurality of layers of a predetermined layer thickness.
  • the categorization of the surface elements and the implementation of a layering are subsequently used to determine visual or movement obstacles by, on the one hand, interpreting vertical surface elements that are part of the digital image as visual or movement obstacles.
  • These visual or movement obstacles will usually represent walls, room dividers or tall pieces of furniture such as cupboards and the like.
  • horizontal Surface elements or a group of adjacent horizontal surface elements in the same layer are identified as obstacles to vision or movement if, in their peripheral area, horizontal secondary surface elements can be found that are more than one layer below the horizontal surface element or the group of adjacent horizontal surface elements, or in other words, if, in their peripheral area, no horizontal secondary surface elements can be found that are a maximum of one layer below or above the horizontal surface element or the group of adjacent horizontal surface elements.
  • These obstacles to vision or movement will usually represent low pieces of furniture such as tables and the like.
  • a virtual object can be displayed in a simple manner depending on the presence of the visual or movement obstacle by using a calculation algorithm to calculate connecting lines between an eye point of the user corresponding to the current position and direction of view and image points of the virtual object and determining the presence of intersection points of the connecting lines with the visual or movement obstacles present as planar surface elements within the distance between the eye point and the image points of the virtual object, whereby if there is an intersection point for an image point of the virtual object, the image point in question is not displayed or is not visibly displayed in the user's field of vision, and if there is no intersection point for an image point of the virtual object, the image point in question is visibly displayed.
  • the eye point is a term from central perspective and traditionally refers to a point in space that corresponds to the position of a user and from which the "visual rays" originate.
  • Connecting lines are first calculated between this eye point and image points of the virtual object to be displayed. It is then determined whether within the distance between the eye point and the image points of the virtual object there are intersections of the connecting lines with a visual or movement obstacle present as a planar surface element. It is therefore checked whether the connecting line of a pixel with the eye point intersects a surface element assessed as a visual or movement obstacle. If this is the case, the relevant pixel of the virtual object is not displayed or is not visibly displayed in the user's field of vision.
  • An invisible display can be achieved via a transparent display, for example, in which the relevant pixel is also not visible to the observing user. If no such intersection exists, the relevant pixel is displayed visibly.
  • the calculation process starting with the calculation of the connecting line and clarification of whether an intersection exists, only requires a few milliseconds per pixel. The calculation process can therefore be completed quickly enough to enable real-time applications and frequent repetition as the observing user moves through the interior of the building.
  • the applicant proposed an application for training emergency services based on the visual or movement obstacles present as planar surface elements of the digital image, whereby virtual objects such as representations of armed perpetrators hiding behind visual obstacles are displayed in the user's field of view of the display unit depending on the presence of a visual or movement obstacle.
  • the display of virtual objects can be accompanied by the display of navigation aids which, on the basis of the available digital image, show the emergency services the quickest route to a destination point, taking movement obstacles into account, or enable safe movement inside a building in poor visibility conditions.
  • the aim of the invention is therefore to create methods and devices using augmented reality systems with which, for example in the context of a safety-critical operation, a maximum of situation-related data can be obtained and made available to a user in as user-friendly a manner as possible.
  • Claim 1 relates to a method for fading in a computer-generated, virtual object into the field of vision of a real environment perceived by a user, in particular into the field of vision of a transparent display unit worn by the user, wherein the fading in of the virtual object takes place by means of a central data processing unit depending on the current position and the direction of view of the user, and the fading in of the virtual object additionally takes place depending on the presence of visual or movement obstacles, wherein the visual or movement obstacles are determined by the central data processing unit on the basis of a digital image of surfaces of the real environment.
  • 3D images are produced of the user's field of vision corresponding to the current position and direction of view by means of a camera capable of measuring depth information, from which 3D images are repeatedly determined by the central data processing unit with the aid of known mathematical methods at predetermined time intervals, an updated digital image of surfaces of the real environment and thus of the visual or movement obstacles in the field of vision, and field of vision-related status data are obtained by means of sensors and processed in the central data processing unit, with the virtual object being used to provide the user with an interactive and dialog-based reproduction of the sensor-supported, field of vision-related status data in the user's field of vision.
  • sensor-supported, field of vision-related status data are therefore first obtained, i.e.
  • sensors can, for example, be carried or installed specifically for safety-critical use by emergency services, or existing sensors for monitoring locations such as fire detectors, motion sensors, security cameras and the like can be used.
  • sensors can also be airborne sensors that use drones to collect data relevant to the field of vision, for example as part of aerial reconnaissance in military applications, or ground-based sensors such as surveillance cameras in an existing security architecture.
  • This status data is then made available in the user's field of vision using the virtual object in the form of a dialog-based display that is interactive for the user.
  • the display of the status data according to the invention is, on the one hand, interactive, i.e., as a display that enables mutual reference to inputs and outputs of data and commands from the user and the central data processing unit, and, on the other hand, dialog-based, i.e., through verbal expression in written or oral form.
  • This dialog-based, interactive playback is made possible according to the invention with the help of the virtual object which is displayed in the user's field of vision and which thus gives him access to the status data obtained from the external sensors and processed by the central data processing unit and prepared, for example, as a database.
  • the user can, for example, use voice control to call up the desired status data related to the field of vision, for example by asking the verbal question "How high is the current carbon monoxide concentration?" or simply "Carbon monoxide?"
  • This voice command is picked up by a microphone worn by the user and via which the verbally expressed input command is transmitted to the central data processing unit.
  • the central data processing unit calls up measurement data from a corresponding measuring device and plays it back via the virtual object in the user's field of vision.
  • the reproduction can be optical in the user's field of vision via a dialog-based written reproduction of status data, as is known from chatbots and the like, or acoustically via a playback device carried by the user, such as headphones and the like, with the acoustic reproduction taking place via a voice output assigned by the user to the virtual object.
  • the virtual object itself represents a written or other graphic representation of the reproduced status data
  • the status data is reproduced in a form supported by the virtual object, in that the user assigns the reproduction to the virtual object and the user thus perceives the virtual object as an output interface. This assignment can be made, for example, by suitable graphic preparation of the virtual object.
  • One possibility is to support the dialog-based, interactive reproduction using a virtual object with an anthropomorphic appearance.
  • a virtual object with an anthropomorphic appearance that is capable of dialog-based interaction with the user is sometimes referred to as an avatar.
  • Avatars are not shown statically, but animated as moving images, for which so-called “3D real-time engines” are generally used. In this way, interactions can also be shown visually, which reinforces the impression of interaction for the user.
  • the impression of interaction can be achieved in many different ways, for example by a voice color assigned to the virtual object, or by eye contact between an anthropomorphic virtual object and the user and corresponding mouth movements.
  • the virtual object is thus perceived by the user as a user interface, even if the physical data exchange between the user and the central data processing unit can take place with the help of a microphone and a loudspeaker, or with the help of gesture recognition and the like.
  • the user interface can also be referred to as a virtual user interface.
  • the invention further provides for combining the acquisition and reproduction of the sensor-based status data with iteratively refined spatial data of the field of vision.
  • This measure serves on the one hand to obtain an updated digital image of surfaces in the real environment and thus of the visual or movement obstacles in the user's field of vision, because the physical environment can change constantly, especially under real operational conditions of emergency forces.
  • the automated, repeated collection of spatial data and the associated recording of sources of danger and movement obstacles are crucial for creating an accurate situation report.
  • This data is transmitted to the central data processing unit, which combines and evaluates this spatial data of the field of vision with the field of vision-related status data.
  • the evaluation of these is carried out automatically by the central data processing unit, since in real-life operations there is no time to manually enter these data into a situation report, and the use of autonomous systems and automatic detection reduces the risks for infrastructures and operational teams.
  • the invention thus makes it possible to combine multimodal data from different sensor systems can be used to create an automatic situation report using spatial data collected in real time, as will be explained in more detail below.
  • This data serves as the basis for decisions by the central data processing unit in order to protect emergency personnel from dangers, calculate movement routes or give instructions.
  • the measure of iteratively specifying spatial data of the field of vision also serves to optimize the reproduction of the virtual object, especially when it is a virtual object with an anthropomorphic shape that is animated in the user's field of vision and is always obscured to different degrees by visual obstacles.
  • the repeated measurement of depth information and the creation of 3D images to obtain an updated digital image of surfaces in the real environment takes place from the user's field of vision corresponding to the current position and direction of view.
  • the user's field of vision is crucial because the user naturally focuses his attention and thus his field of vision on the scenery that is currently relevant to him and a precise analysis of the field of vision is therefore particularly important.
  • the virtual object is also displayed for the reproduction of status data in the user's field of vision, so that precise knowledge of the visual and movement obstacles is beneficial for optimal display of the virtual object, as will be explained in more detail below.
  • the field of vision is conventionally understood to be the spatial extent of the binocular field of vision of a person, i.e. the sum of the two monocular fields of vision of the right and left eye alone. In an adult, the horizontal extent of the binocular field of vision is approximately 200 ° (100 ° to the left and 100 ° to the right), and the vertical extent approximately 60 ° -70 ° upwards and 70 ° -80 ° downwards. This field of vision represents the total area in which visual perception is possible without the aid of eye and head movements.
  • the playback unit worn by the user according to the invention will preferably barely restrict this field of vision.
  • This central area of the field of vision corresponds to a horizontal and vertical viewing angle of approximately 40-55 ° each.
  • the horizontal and vertical viewing angle is the angle between two opposite edge points of an object and the eye point in a horizontal and a vertical plane. According to the invention, a precise digital image of surfaces of the field of view is repeatedly taken. This does not have to be the entire field of view.
  • the angle of view of the 3D cameras used according to the invention in the course of the imaging process for depicting a section of a scene can be in the same order of magnitude as the central area of the field of view with maximum perception quality, i.e. in the range of 40-55°.
  • the predetermined time interval for repeatedly obtaining an updated digital image according to the invention can vary and be adapted to the dynamics of the situation and the available computing power. At the time of registration, for example, time intervals of around three seconds are feasible, which means that an updated digital image of the user's field of vision is created every three seconds.
  • the process of updating the digital image can be accelerated and improved by using current 3D images ("scan") to create a difference image from an existing digital image. If significant deviations are found in some areas, the digital image is only updated in these areas using the current data.
  • the status data can be physical status data such as temperature or visibility, or chemical status data such as pollutant concentrations.
  • Status data of this type is crucial for fire services, for example, and is, as mentioned, collected either by sensors that have already been installed or by sensors carried by the emergency services.
  • security-relevant status data for example for police services.
  • Status data of this type is collected, for example, by video cameras in an existing security architecture, which are used to initially detect people and then to determine a possible field of fire by comparing this with a digital image of the real environment.
  • Safety-relevant status data could thus include, for example, the information "Field of vision crosses the possible firing range of an unknown person".
  • existing fire or smoke detectors could be used as external sensors that detect a possible source of fire.
  • Safety-relevant status data in this case could include the information "Field of vision is in the area of increasing smoke gas concentration".
  • a possible application example of airborne sensors such as drones and the like would be possible, for example, in the military sector as part of reconnaissance activities in a combat zone, where safety-relevant status data could be, for example, the information "Field of vision is in the firing range of enemy artillery”.
  • the status data could also be physiological status data such as pulse, blood pressure, oxygen saturation and the like.
  • Status data of this type are crucial for rescue teams and are collected from a patient by medical sensors.
  • the field-of-view-related status data are therefore physiological status data of a patient in the user's field of vision.
  • the status data can be reproduced acoustically via a device carried by the user, such as headphones, ear speakers and the like, with the acoustic reproduction taking place via a voice output assigned by the user to the virtual object.
  • This assignment can be made, for example, by suitable graphic processing of the virtual object, for example in the form of a virtual object with an anthropomorphic appearance.
  • the user-side command to reproduce status data or the virtual object is carried out using a voice-controlled input interface to the central data processing unit.
  • a voice-controlled input interface to the central data processing unit.
  • the user can, for example, use voice control to call up desired field-of-view-related status data, for example by asking the verbal question "How high is the current carbon monoxide concentration?" or simply "Carbon monoxide?"
  • This voice command is picked up by the input interface, which is designed as a microphone and which the user wears and via which the verbally expressed input command is transmitted to the central data processing unit.
  • the voice-controlled input interface can also be used to enter commands to reproduce the virtual object.
  • a virtual object designed as an avatar can, for example, be prompted to follow the user via the voice-controlled command "Come with me!”.
  • status data be retrieved automatically at the same predefined time intervals or at other predefined time intervals as those of the repeated updates of the digital image.
  • This allows status data to be reproduced automatically, for example via the optical or acoustic indication "Warning, pollutant concentration is increasing! or "Patient's oxygen saturation is decreasing!.
  • the retrieval can, for example, take place in time with the iterations of the updates of the digital image.
  • the field of view-related status data obtained by sensors is processed in the central data processing unit using an artificial neural network.
  • an artificial neural network is also referred to as "artificial intelligence" or "AI”.
  • the virtual object for example designed as an avatar, thus uses artificial intelligence to identify sources of danger through so-called "machine learning” and known classification processes, as well as to carry out an automated situation assessment using autonomous agent systems. All available information obtained with the help of external sensors or through repeated collection of updated spatial data can be used by the central data processing unit to make a current risk assessment and to inform emergency services accordingly via the avatar as a user interface. Furthermore, the central data processing unit can carry out indoor or outdoor navigation taking into account all recognized and recorded dangers. The user can also be informed via the avatar where objects, furniture or the like are located in the room by constantly comparing the sensors with the data only obtained during the real view.
  • the virtual object can be given an anthropomorphic appearance that is capable of dialog-based interaction with the user.
  • Avatars are usually not shown statically, but animated as moving images, for which so-called “3D real-time engines" are usually used. In this way, interactions can also be shown visually, which reinforces the impression of interaction for the user.
  • 3D real-time engines are usually used.
  • interactions can also be shown visually, which reinforces the impression of interaction for the user.
  • horizontal free areas be determined in the digital image that are free of visual or movement obstacles in vertical projection, and that a movement of the virtual object to be carried out in the user's field of vision from a starting point to a destination is calculated by the central data processing unit in the form of the shortest movement path lying within the free areas.
  • the horizontal free areas can be determined using the horizontal surface elements of the digital image, whereby a floor area is determined as the totality of adjacent horizontal surface elements of a lowest layer, which is free of visual or movement obstacles in vertical projection.
  • This free area is present in the digital image as a totality of corresponding nodes (“mesh”).
  • nodes can be made available as a so-called “navigation mesh” to the above-mentioned “3D real-time engines”, which use it in a known manner to control the movement of virtual objects animated as moving images (“avatars”).
  • the “navigation mesh” can be renewed at predetermined time intervals in accordance with the updates of the digital image provided for by the invention in order to be able to react to objects that have been moved in the meantime, such as chairs and the like.
  • a lifelike-seeming movement of the virtual object can be carried out while avoiding movement obstacles and a correct occlusion calculation can be carried out for the display of the avatar depending on visual obstacles.
  • horizontal free areas are determined in the digital image as described above, which are free of visual or movement obstacles in vertical projection, and a movement of the virtual object to be carried out in the user's field of vision from a starting point to a destination is calculated by the central data processing unit in the form of a movement path lying within the free areas, taking into account the sensor-supported status data as a boundary condition.
  • the virtual object designed as an avatar thus moves from the starting point to the destination, taking into account the status data, for example, while avoiding a source of fire.
  • an optimal movement path is determined from the multitude of possible Movement paths within the open areas by evaluating a movement path based on predefined criteria, for example a possible safety risk along a movement path that could arise from crossing a possible line of fire of an unidentified person.
  • the optimal movement path is the one that best meets the predefined criteria, for example the smallest possible safety risk.
  • This optimal movement path can be made available to the user as a navigation aid.
  • One possibility is for the virtual object designed as an avatar to move along the optimal movement path. Since the avatar moves in the person's field of vision, the person can simply follow the avatar.
  • the predefined time intervals with which the central data processing unit repeatedly determines an updated digital image of surfaces in the real environment and thus of the visual or movement obstacles in the field of vision from the measured 3D images are chosen to be correspondingly shorter, for example less than 3 seconds, approximately every second.
  • the invention further relates to a device comprising a portable, transparent display unit for displaying a computer-generated, virtual object in the field of vision of a real environment perceived by a user, in particular in the field of vision of the transparent display unit worn by the user, and a central data processing unit connected to the display unit for generating and displaying the virtual object in the field of vision of a real environment perceived by the user.
  • a portable, transparent display unit for displaying a computer-generated, virtual object in the field of vision of a real environment perceived by a user, in particular in the field of vision of the transparent display unit worn by the user
  • a central data processing unit connected to the display unit for generating and displaying the virtual object in the field of vision of a real environment perceived by the user.
  • at least one camera capable of measuring depth information is provided for producing 3D images of the field of vision of the user corresponding to the current position and direction of view
  • the central data processing unit is designed to repeatedly create an updated digital image of surfaces of the real environment in the 3D images using known mathematical methods
  • a voice-controlled input interface to the central data processing unit is provided for the user-side command to reproduce status data or the virtual object.
  • an artificial neural network is provided for processing the field of vision-related status data obtained by means of sensors in the central data processing unit.
  • Fig. 2 is a schematic view of a floor plan of a building interior being measured using data glasses to generate a digital image and reference images
  • Fig. 4 is a schematic overview of the basic process of determining visual or movement obstacles in the context of the method according to the invention
  • Fig. 5 is a schematic representation to explain the horizontal layering for determining the visual or movement obstacles
  • Fig. 6 is a schematic view of a floor plan of a building interior for explaining the method and the device according to the invention.
  • FIG. 1 first shows a schematic overview of the basic process of generating a digital image of the interior of a building within the scope of the method according to the invention. Firstly, a digital image of the surfaces of the interior of the building facing the interior of the room must be created. According to Fig.
  • a reproduction unit 1 in the form of data glasses is used for this purpose, which is equipped with a camera for recording two-dimensional images, with a 3D camera for recording images with depth information and with sensors for determining position and direction of view and is indicated in the top right of Fig. 1.
  • a display unit 1 is used to walk through the interior of the building, which has, for example, a floor plan as shown in Fig. 2.
  • Fig. 2 schematically shows some positions of a user B with such a display unit 1, which are taken up one after the other by the user B as he walks through the rooms. The result of the walk through is a large number of images of the room views provided with depth information, which are presented to the user as he walks through and which are sent to a central data processing unit 2.
  • the central data processing unit 2 is usually an external device such as a stationary or portable computer or tablet, but it could also be integrated into the display unit 1.
  • a digital image can be obtained in the central data processing unit 2 from the "scans" of depth information obtained in this way, which digital image shows the surfaces of the room facing the user.
  • the interior of the building is approximated using surface elements F.
  • These surface elements F are shown in Fig. 2 as planar surface elements F in the form of triangles, which seamlessly reproduce the surfaces to be approximated.
  • Another possibility using known mathematical methods is to assign an orientation to the surface elements F by calculating a surface normal to the relevant surface element F.
  • surface elements F can be identified as vertically oriented surface elements Fv or as horizontally oriented surface elements Fh, from which visual or movement obstacles can subsequently be reconstructed, as will be explained later using Fig. 4.
  • the result of the "scan" is a three-dimensional "mesh" of the interior of the building.
  • a new 3D model is generated, as this is interpreted as a change of floor.
  • one or more reference images can be recorded for each room, for example as RGB images, which are later to serve as recognition points ("optical markers") and stored in a database of the central data processing unit 2.
  • the respective, known recording positions are assigned to these reference images, as indicated by the diamonds in Fig. 2.
  • This process can also be used to determine which rooms are connected to one another. This means that possible room changes can be directly restricted, which can be helpful when determining the current room in the position determination process.
  • the central data processing unit 2 is ready for use to display virtual objects that are stored in a database of the central data processing unit 2 are stored.
  • the digital image can be created using a known building plan, which is supplemented with the help of 3D images from the 3D camera carried by the user.
  • the digital image can be created using a known environmental plan, which is supplemented with the help of 3D images from the 3D camera carried by the user.
  • virtual objects V can be placed on the digital image.
  • a user B moves through the interior of the building with a playback unit 1, for example in the form of data glasses, which is equipped with a camera for taking two-dimensional images, a 3D camera for taking images with depth information, and sensors for determining the position and direction of view of the user B.
  • This playback unit 1 is indicated in the top left of Fig. 1.
  • the scenario information is again transmitted from the central data processing unit 2 to the application of the playback unit 1.
  • the current coordinate system of the playback unit 1 must be synchronized with the one that was used to create the digital image.
  • the previously recorded reference images can be used for this.
  • the deviation between the two coordinate systems can be calculated.
  • the reference images can also be used to continue the scenario in a limited way if the playback unit 1 can no longer orient itself, since their recognition can be used to deduce the position and orientation of the user B.
  • the position of the playback unit 1 can be displayed on the central data processing unit 2 in the digital image of the floor plan.
  • the display of a virtual object V can now be carried out in a simple manner depending on the presence of a visual or movement obstacle by calculating, as part of a calculation algorithm, connecting lines between an eye point of the user B corresponding to the current position and direction of view of the user B and image points of the virtual object V and determining, within the distance between the eye point and the image points of the virtual object V, the existence of intersection points of the connecting lines with the visual or movement obstacles present as planar surface elements F, whereby if there is an intersection point for an image point of the virtual object V, the image point in question is not displayed or is not visibly displayed in the field of vision of the user B, and if there is no intersection point for an image point of the virtual object V, the image point in question is visibly displayed.
  • the virtual object V is thus displayed either completely, partially or not at all, depending on the presence of a visual or movement obstacle.
  • the visual or movement obstacles present as planar surface elements F of the digital image can also be used as a navigation aid, in that the virtual objects V displayed depending on the presence of a visual or movement obstacle are navigation aids that are displayed for the user B in the field of view of the playback unit 1.
  • These navigation aids can show the emergency services the quickest route to a destination point, taking movement obstacles into account, or enable safe movement inside a building in poor visibility conditions, as will be described in more detail with reference to Fig. 6.
  • an arrow can also be seen that leads back to the generation of a digital image.
  • This arrow is intended to indicate that the camera attached to the playback unit 1 and capable of measuring depth information is used to create 3D images corresponding to the current position and line of sight of the user B, from which an updated digital image can be determined. Since the current view of an area of a room can also change compared to a previously created digital image, for example if a piece of furniture is moved or a door is closed, the digital image is updated based on the real environment currently perceived by the user B. This update is carried out repeatedly at predetermined time intervals, whereby the predetermined time interval for the repeated acquisition of an updated digital image can vary and will be adapted to the dynamics of the situation and the available computing power.
  • time intervals of around three seconds are feasible, which means that an updated digital image of the user B's field of vision is taken every three seconds.
  • the process of updating the digital image can be accelerated and improved by creating a difference image from an existing digital image using current 3D images ("scan"). If significant deviations are identified in some areas, the digital image is only updated in those areas using the current data.
  • a digital image can be obtained from the previously described scans of the building interior using known mathematical methods, as a so-called “mesh”, which approximates the surfaces of the building interior using planar surface elements F ("faces").
  • faces planar surface elements
  • the meshes obtained from the playback unit 1 are processed and a digital image is created from them.
  • the vertices and faces are divided into floors based on their height. Then, for the scanned meshes per floor, all vertices and faces above an eye level A, which corresponds to the average eye level, are removed, and faulty faces are cleaned up.
  • the exact height of the eye level A is not important here; it is assumed to be, for example, 1.80 m.
  • the digital image of the interior of the building is thus, in a sense, "cut off" at eye level A. Anything at eye level or just below is considered part of a visual or movement obstacle, i.e. walls, furniture or other things. Anything close to the ground is classified as such and thus assessed as passable.
  • These visual or movement obstacles will generally represent low pieces of furniture such as tables and the like; in the example in Fig. 5, a table is indicated.
  • Horizontal faces are thus categorised as seating or table surfaces, floors and the like.
  • Vertical faces are categorised as walls and thus as impassable visual or movement obstacles.
  • a plan of the scanned environment can be created. An example of such a plan is shown in Figure 3. Based on the height and orientation of the normal vectors of the faces, the visualisation of the faces can be refined in order to highlight height differences between the visual or movement obstacles.
  • the totality of adjacent horizontal surface elements Fhi of a lowest layer can be assessed as the floor area N . That portion of the floor area N which is free of visual or movement obstacles in vertical projection is referred to below as the free area .
  • This free area is present in the digital image as a totality of corresponding nodes (“mesh”), which can then be used as a so-called “navigation mesh” to control the movement of a virtual object (“avatar”).
  • meh corresponding nodes
  • avatars so-called “3D real-time engines” are known for this purpose, which use such a “navigation mesh” to control the movement of virtual objects animated as moving images (“avatars”), as will be explained below with reference to Fig. 6.
  • Fig. 6 shows the floor plan of a building interior analogous to Fig. 2.
  • Fig. 6 also shows the current position of a user B with a display unit 1, with which a virtual object V is displayed.
  • the floor plan is available as a digital image, for example based on a known building plan, or was created by walking through it using the 3D cameras. In both cases, as mentioned, the digital image is continuously updated using the 3D cameras and made more precise by detecting the presence and positioning of objects such as furniture and the like.
  • external sensors 3 are accessed.
  • a motion sensor is shown in a room in the upper left area of the building plan, which serves as an external sensor 3.
  • This sensor 3 detects the presence of moving objects or people and delivers a signal when moving objects or people are present.
  • the external sensor 3 is connected to the central data processing unit 2, in which the signal delivered by the sensor 3 is processed.
  • the field of view-related status data obtained by means of the sensors 3 are preferably processed in the central data processing unit 2 with the help of an artificial neural network.
  • an artificial neural network is also referred to as "artificial intelligence" or "AI”.
  • the central data processing unit 2 also controls the display of the computer-generated, virtual object V in the field of view perceived by the user B in accordance with the current visual axes of the user B, taking into account the presence of visual or movement obstacles as described above.
  • One possibility is to equip the computer-generated virtual object V with an anthropomorphic appearance, which is animated as a moving image in such a way that it reacts to the input of voice commands by the user B.
  • Such a virtual object V is also referred to below as an avatar. In this way, the impression of interaction is created for the user.
  • the "navigation mesh” can be renewed at predetermined time intervals in order to be able to react to objects that have been moved in the meantime, such as chairs and the like.
  • the present example in Fig. 6 could be a scenario for police officers.
  • User B is part of the emergency services and is in a building where an armed perpetrator is suspected. The order is to search the building, evacuate any bystanders, and arrest the perpetrator.
  • User B is equipped with the playback unit 1, which is connected to the central data processing unit 2, so that his position is known to the central data processing unit 2 at all times.
  • the central data processing unit 2 is also connected to external sensors 3, for example to the motion sensor shown in Fig. 6.
  • the sensor 3 now sends a signal for the presence of a person in the upper left room of the building plan to the central data processing unit 2 .
  • the central data processing unit 2 detects the possibility that this could be the armed perpetrator, as well as the proximity of the user B, whose field of vision could enter the field of fire of the possible perpetrator if he leaves his current location shown in Fig. 6.
  • the central data processing unit 2 thus transmits a warning to the playback unit 1 as safety-relevant status data "Field of vision could cross the possible firing range of an unknown person" and controls the playback of this status data with the support of the virtual object V.
  • the virtual object V designed as an avatar, could, for example, turn to the user B while simultaneously playing the acoustic warning via an ear speaker worn by the user B.
  • the central data processing unit 2 which is equipped with artificial intelligence, can also provide support in further action planning. For example, based on the task of evacuating innocent persons and arresting the perpetrator, a better positioning of the user B can be considered.
  • the central data processing unit 2 calculates possible movement paths P within the open areas, taking into account the status data, i.e. reducing a possible safety risk along a movement path P that could arise from crossing a possible line of fire of the unidentified person.
  • the movement path P should also allow the identification of an innocent person.
  • the optimal movement path P is the one that, for example, presents the smallest possible safety risk, but still allows the person in the upper left-hand area to be identified.
  • This optimal movement path P is shown in Fig. 6 and can be suggested to the user B as a possible movement path P.
  • the playback can in turn be carried out via the virtual object V designed as an avatar, in which the avatar makes itself known, for example, through corresponding hand movements and suggests to the user B either via an acoustic playback via an ear speaker or silently via hand movements a possible departure from the position and the planned direction of movement.
  • the user B can signal his consent by verbally articulated input command "OK", which is transmitted to the central data processing unit 2 by a microphone carried by the user B.
  • the central data processing unit 2 then starts the animation of the virtual object V in the form of a movement along the calculated optimal movement path P .
  • the navigation of the user B along the calculated optimal movement path P can thus be carried out simply by the user B following the avatar .
  • the invention thus provides a method in which a maximum of situation-related data can be obtained and made available to a user B in a user-friendly manner using "augmented reality" systems, for example in the context of a safety-critical application.
  • Applications of the invention are also conceivable in the private sector, in that a personalized avatar collects field-of-view-related status data from external sensors for the user B and makes it available in the form of an interactive and dialog-based playback according to the invention.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Software Systems (AREA)
  • Geometry (AREA)
  • Computer Graphics (AREA)
  • Optics & Photonics (AREA)
  • Automation & Control Theory (AREA)
  • Processing Or Creating Images (AREA)

Abstract

Verfahren und Vorrichtung zum Einblenden eines computergenerierten, virtuellen Objektes (V) in das von einem Benutzer (B) wahrgenommene Sichtfeld einer realen Umgebung, wobei das Einblenden des virtuellen Objekts (V) mittels einer zentralen Datenverarbeitungseinheit (2) in Abhängigkeit von der momentanen Position des Benutzers (B) sowie von der Anwesenheit von Sicht- oder Bewegungshindernissen erfolgt, wobei die Sicht- oder Bewegungshindernisse von der zentralen Datenverarbeitungseinheit (2) anhand eines digitalen Abbilds von Oberflächen der realen Umgebung ermittelt werden. Es wird vorgeschlagen, dass 3D-Bilder angefertigt werden, aus denen von der zentralen Datenverarbeitungseinheit (2) in vorgegebenen Zeitabständen wiederholt ein aktualisiertes digitales Abbild von Oberflächen der realen Umgebung im Sichtfeld ermittelt wird, und mittels Sensoren (3) sichtfeldbezogene Zustandsdaten gewonnen werden, die in der zentralen Datenverarbeitungseinheit (2) verarbeitet werden, wobei mithilfe des virtuellen Objekts (V) eine für den Benutzer (B) interaktive und dialogbasierte Wiedergabe der sensorgestützten, sichtfeldbezogenen Zustandsdaten im Sichtfeld des Benutzers (B) erfolgt.

Description

Verfahren und Vorrichtung zum Einblenden eines virtuellen Obj ekts
Die Erfindung betrifft ein Verfahren zum Einblenden eines computergenerierten, virtuellen Obj ektes in das von einem Benut zer wahrgenommene Sichtfeld einer realen Umgebung, insbesondere in das Sichtfeld einer vom Benutzer getragenen, transparenten Wiedergabeeinheit , wobei das Einblenden des virtuellen Obj ekts mittels einer zentralen Datenverarbeitungseinheit in Abhängigkeit von der momentanen Position und der Blickrichtung des Benutzers erfolgt , und das Einblenden des virtuellen Obj ekts zusät zlich in Abhängigkeit von der Anwesenheit von Sicht- oder Bewegungshindernissen erfolgt , wobei die Sicht- oder Bewegungshindernisse von der zentralen Datenverarbeitungseinheit anhand eines digitalen Abbilds von Oberflächen der realen Umgebung ermittelt werden, gemäß dem Oberbegriff von Anspruch 1 , sowie eine Vorrichtung zur Durchführung des erfindungsgemäßen Verfahrens nach Anspruch 7 .
Verfahren dieser Art werden in so genannten „Mixed-Reality (MR) "-Systemen oder „Augmented Reality (AR) "-Systemen verwendet . Hierbei erfolgt das Einblenden eines computergenerierten, virtuellen Obj ektes in das vom Benut zer wahrgenommene Blickfeld einer realen Umgebung in Abhängigkeit von der momentanen Position und Blickrichtung des Benut zers , für deren Bestimmung in herkömmlicher Weise unterschiedliche Sensorik wie Beschleunigungssensoren (Accelerometer oder G- Sensorik) , mitunter auch in Kombination mit Magnetometern, Kameras und/oder Gyroskopen, sowie GPS-Systeme verwendet werden . Die momentane Position und Blickrichtung des Benutzers entscheiden zunächst darüber, ob überhaupt ein virtuelles Obj ekt eingeblendet wird . Das Einblenden des virtuellen Obj ekts in seiner Positionierung und Größe im Blickfeld des Benutzers wird in weiterer Folge maßgeblich in Abhängigkeit von der momentanen Position des beobachtenden Benut zers , insbesondere in Abhängigkeit vom Abstand zum beobachtenden Benutzer vorgenommen, um die realistisch wirkende Illusion eines virtuellen Abstandes zu erzeugen . Hierfür werden insbesondere Wiedergabeeinheiten in Form von Datenbrillen verwendet , also Vorrichtungen, die wie eine Brille getragen werden und in der Lage sind virtuelle Obj ekte in der realen Welt anzuzeigen und diese Obj ekte in Relation zu realen Obj ekten im Raum zu positionieren . Solche Datenbrillen werden auch als „Augmented-Reality"-Brillen oder „Mixed-Reality"- Brillen bezeichnet . Ein Benut zer, der eine solche Brille aufgeset zt hat , sieht die Umgebung wie durch eine normale Sehbrille , allerdings können ihm (holographisch virtuelle ) Obj ekte in das Sichtfeld eingeblendet werden . Alternativ ist auch die Verwendung von Linsen denkbar, die als Wiedergabeeinheit das Einblenden von virtuellen Obj ekten in das Blickfeld des Benut zers erlauben .
Ein möglicher Anwendungsbereich besteht etwa in der Ausbildung und im Training von Einsatz kräften der Polizei , der Feuerwehr oder des Militärs . Die Einsat zkräfte bewegen sich dabei bei unterschiedlichen Lichtverhältnissen und mitunter auch unter akustischer Beschallung durch ein Einsatzgebiet und müssen auf unterschiedliche Szenarien richtig reagieren, die durch das Einblenden virtueller Obj ekte verwirklicht werden . So können etwa im Rahmen einer Ausbildung Einsatzkräfte der Poli zei darin geschult werden ein Gebäude nach Tätern zu durchsuchen, wobei die Täter von einem Ausbildungsleiter als virtuelle Obj ekte hinter Wänden, Türen, Möbelstücken und dergleichen positioniert werden und j e nach Position und Blickrichtung des Aus zubildenden sichtbar sind oder verdeckt . Im Rahmen einer Ausbildung von Einsatzkräften der Feuerwehr kann das Training etwa darin bestehen einen virtuellen Brandherd in einem Gebäude zu bekämpfen und dabei Gefahren durch Rauchgase , Rauchgasexplosionen oder einstürzende Gebäudeteile zu erkennen und entsprechendes Verhalten zu trainieren . Im Rahmen einer Ausbildung von Einsatzkräften des Militärs kann das Vorgehen gegen feindliche Truppen trainiert werden, die als virtuelle Obj ekte in Form vorrückender Truppenteile wie Panzer und dergleichen oder auch feindlicher Soldaten eingeblendet werden .
In der US 2002 /0196202 Al und der US 2003/0210228 Al wird beispielsweise ein Verfahren beschrieben, bei dem Einsatz kräften, die sich in einer Einsatzsituation in einem Gebäudeinneren bewegen, anhand eines dem Einsatzleiter als digitales Abbild vorliegenden Gebäudeplans Informationen in eine Datenbrille eingeblendet werden . Solche Informationen können etwa Warnmeldungen über mögliche Gefahren sein, oder auch Navigationshilfen in Form von Pfeilen und dergleichen . Ein Einblenden von virtuellen Obj ekten unter Berücksichtigung einer möglichen Verdeckung durch bauliche Gegebenheiten oder Möbelstücke ist bei einem Verfahren gemäß der US 2002 /0196202 Al und der US 2003 /0210228 Al nicht möglich . In der US 2002 /0191004 Al wird ein weiteres Verfahren zum Einblenden virtueller Obj ekte zur Ausbildung von Einsat zkräften beschrieben .
In der US 2018 /0330184 Al wird ein Verfahren zur Erstellung eines digitalen Abbilds von Oberflächen eines Gebäudeinneren beschrieben, wobei das Gebäudeinnere mit einem Sensor zur Abstandsmessung vermessen wird . Das Ergebnis der Abstandsmessungen ist eine dreidimensionale Datenpunktwolke , aus der durch Anwendung mathematischer Verfahren der Verlauf von Böden, Decken und Wänden der Innenräume rekonstruiert wird . Ein Einblenden virtueller Obj ekte ist in der US 2018 /0330184 Al nicht vorgesehen .
In der US 2022 /108535 Al werden Verfahren zum Einblenden eines virtuellen Obj ekts in Form eines Avatars in das Sichtfeld einer „Augmented-Reality"-Brille beschrieben . In der US 2022 / 130094 Al werden Verfahren zur Animation eines Avatars beschrieben, insbesondere zur Steuerung von Bewegungen des Avatars auf Basis eines Datennetzes aus Polygonen ("Navigation mesh" , "navmesh" ) . Die WO 2022 /004422 Al beschäftigt sich mit dem Einblenden von virtuellen Obj ekten in das Sichtfeld einer „Augmented-Reality"-Brille , wobei externe Daten einbezogen werden, um das Einblenden des virtuellen Obj ekts realistischer zu gestalten . In der US 2021 /038975 Al wird ein System beschrieben, bei dem Zuschauer mit entsprechenden portablen Endgeräten an AR-Spielen anderer Teilnehmer teilhaben können . In der KR 20210069806 A wird ein Verfahren zur Analyse von Kamerabildern hinsichtlich Raum- und Obj ekterkennung auf Basis neuronaler Net zwerke vorgeschlagen, wobei die so gewonnenen Raum- und Obj ektdaten zur verbesserten Einblendung eines virtuellen Obj ekts verwendet werden .
In der österreichischen Patentanmeldung AT 523 . 953 des Anmelders sowie der korrespondierenden europäischen Patentanmeldung EP 21735597 . 3 des Anmelders wurde ein Verfahren zum Einblenden eines computergenerierten , virtuellen Obj ektes in das von einem Benutzer wahrgenommene Sichtfeld eines realen Gebäudeinneren vorgeschlagen, bei dem das virtuelle Obj ekt gemäß der momentanen Sichtachsen des Benutzers unter Berücksichtigung verdeckender Elemente wie Wände , Türe , Raumteiler oder auch Möbel korrekt eingeblendet werden kann . Hierbei erfolgt das Einblenden des virtuellen Obj ekts zusätzlich in Abhängigkeit von der Anwesenheit eines Sicht- oder Bewegungshindernisses für den Benutzer, wobei das Sicht- oder Bewegungshindernis anhand eines aus planaren Flächenelementen gebildeten, digitalen Abbilds von Oberflächen des Gebäudeinneren ermittelt wird . Eine Möglichkeit besteht darin, dass ein solches digitales Abbild bereits in Form eines digitalen Gebäudeplans existiert , wobei der digitale Gebäudeplan neben Wänden, Raumteiler oder Türen auch bereits die Positionierung von Möbelstücken umfasst . Eine weitere Möglichkeit zur Erstellung eines digitalen Abbilds des Gebäudeinneren besteht darin, dass es durch eine Vermessung des Gebäudeinneren mit einer zur Messung von Tiefeninformation fähigen Kamera ermittelt wird . In diesem Fall kann die zur Messung von Tiefeninformation fähige Kamera an der Wiedergabeeinheit montiert sein, mit der das Gebäudeinnere durchschritten wird . Eine zur Messung von Tiefeninformation fähige Kamera wird auch als 3D-Kamera bezeichnet und kann etwa als ToF ( "Time-of-Flight " ) -Kamera ausgeführt sein . Bei ToF- Kameras handelt es sich um Kameras , die nicht nur ein 2D-Bild aufnehmen, sondern für j edes Aufnahmepixel auch eine Tiefeninformation messen . Unter Tiefeninformation werden Informationen über die Distanzen zwischen den einzelnen Obj ekten einer Szene und der ToF-Kamera verstanden . Mithilfe bekannter mathematischer Verfahren kann aus den so gewonnenen „Scans" an Tiefeninformationen ein digitales Abbild gewonnen werden, das die Oberflächen des Gebäudeinneren mithilfe von Flächenelementen approximiert . Diese Flächenelemente können etwa als planare Flächenelemente in Form von Dreiecken, Vierecken oder Sechsecken vorliegen, die die zu approximierende Oberfläche lückenlos nachbilden . Die gemeinsamen Eckpunkte dieser Flächenelemente werden dabei auch als Knotenpunkte ( „vertices" ) bezeichnet , die dem Betrachter zugewandte Seite der Flächenelemente als „faces" und die Gesamtheit der Knotenpunkte auch als „mesh" . Eine weitere Möglichkeit bekannter mathematischer Verfahren besteht darin den Flächenelementen auch eine Orientierung zuzuschreiben, indem eine Flächennormale auf das betreffende Flächenelement errechnet wird . Das oben genannte Verfahren der AT 523 . 953 und der EP 21735597 . 3 bedient sich dieser Möglichkeiten, indem zunächst ein aus planaren Flächenelementen gebildetes digitales Abbild von Oberflächen des Gebäudeinneren ermittelt wird . In weiterer Folge werden j edoch nur j ene Flächenelemente herangezogen, die zwischen einer Bodenebene des Gebäudeinneren und einer angenommenen Augenhöhenebene liegen, die eine Maximalhöhe für die nachfolgenden Verfahrensschritte definiert . Unter einer Augenhöhenebene wird dabei in der Regel eine horizontale Ebene verstanden, die sich in Augenhöhe befindet . Die genaue Höhenlage ist dabei nicht wesentlich, sie wird beispielsweise mit einer Höhe von 1 , 80m angenommen . Das digitale Abbild des Gebäudeinneren wird somit gewissermaßen in Augenhöhenebene „abgeschnitten" . Des Weiteren werden j ene Flächenelemente ermittelt , deren Flächennormale hori zontal oder verti kal verlaufen, also Flächenelemente , deren Orientierung vertikal oder hori zontal ist . Zudem wird eine horizontale Schichtung zwischen der Bodenebene des Gebäudeinneren und der angenommenen Augenhöhenebene mit einer Mehrzahl von Schichtlagen einer vorgegebenen Schichtdicke vorgenommen .
Die Kategorisierung der Flächenelemente und die Vornahme einer Schichtung werden in weiterer Folge zur Ermittlung von Sichtoder Bewegungshindernissen verwendet , indem zum Einen vertikale Flächenelemente , die Teil des digitalen Abbilds sind, als Sicht- oder Bewegungshindernisse interpretiert werden . Diese Sicht- oder Bewegungshindernisse werden in der Regel Wände , Raumteiler oder hohe Möbelstücke wie Schränke und dergleichen repräsentieren . Zum Anderen werden hori zontale Flächenelemente oder eine Gesamtheit aneinandergrenzender horizontaler Flächenelemente in derselben Schichtlage als Sicht- oder Bewegungshindernisse ermittelt , falls in deren Umfangsbereich horizontale Nebenflächenelemente auffindbar sind, die um mehr als eine Schichtlage unterhalb des horizontalen Flächenelements oder der Gesamtheit aneinandergrenzender hori zontaler Flächenelemente liegen, oder in anderen Worten, wenn in deren Umfangsbereich keine horizontalen Nebenflächenelemente auffindbar sind, die maximal eine Schichtlage unterhalb oder oberhalb des hori zontalen Flächenelements oder der Gesamtheit aneinandergrenzender horizontaler Flächenelemente liegen . Diese Sicht- oder Bewegungshindernisse werden in der Regel niedrige Möbelstücke wie Tische und dergleichen repräsentieren .
Mithilfe der so ermittelten Flächenelemente des digitalen Abbilds als Sicht- oder Bewegungshindernisse kann das Einblenden eines virtuellen Obj ekts in Abhängigkeit von der Anwesenheit des Sicht- oder Bewegungshindernisses auf einfache Weise erfolgen, indem im Rahmen eines Berechnungsalgorithmus Verbindungslinien zwischen einem der momentanen Position und Blickrichtung entsprechenden Augpunkt des Benut zers und Bildpunkten des virtuellen Obj ekts errechnet und innerhalb des Abstandes zwischen dem Augpunkt und den Bildpunkten des virtuellen Obj ekts das Vorliegen von Schnittpunkten der Verbindungslinien mit den als planare Flächenelemente vorliegenden Sicht- oder Bewegungshindernissen ermittelt werden, wobei bei Vorliegen eines Schnittpunkts für einen Bildpunkt des virtuellen Obj ekts der betreffende Bildpunkt im Sichtfeld des Benutzers nicht oder nicht sichtbar eingeblendet wird, und bei Fehlen eines Schnittpunkts für einen Bildpunkt des virtuellen Obj ekts der betreffende Bildpunkt sichtbar eingeblendet wird . Der Augpunkt ist ein Begriff aus der Zentralperspektivität und bezeichnet in herkömmlicher Weise einen Punkt im Raum, der der Position eines Benut zers entspricht und dem die „Sehstrahlen" entspringen . Zwischen diesem Augpunkt und Bildpunkten des darzustellenden, virtuellen Obj ektes werden zunächst Verbindungslinien errechnet . In weiterer Folge wird ermittelt , ob innerhalb des Abstandes zwischen dem Augpunkt und den Bildpunkten des virtuellen Obj ekts Schnittpunkte der Verbindungslinien mit einem als planares Flächenelement vorliegenden Sicht- oder Bewegungshindernis vorliegen . Es wird somit geprüft , ob die Verbindungslinie eines Bildpunktes mit dem Augpunkt ein als Sicht- oder Bewegungshindernis bewertetes Flächenelement schneidet . Im zutref fenden Fall wird der betreffende Bildpunkt des virtuellen Obj ekts im Sichtfeld des Benut zers nicht oder nicht sichtbar eingeblendet . Eine nicht sichtbare Einblendung kann etwa über eine transparente Einblendung erfolgen, bei der der betreffende Bildpunkt für den beobachtenden Benutzer ebenfalls nicht sichtbar wird . Falls kein solcher Schnittpunkt vorliegt , wird der betreffende Bildpunkt sichtbar eingeblendet . Der Berechnungsvorgang beginnend mit der Errechnung der Verbindungslinie und der Klärung, ob ein Schnittpunkt vorliegt , benötigt pro Bildpunkt nur wenige Millisekunden . Der Berechnungsvorgang kann somit rasch genug abgeschlossen werden, um Echt zeit-Anwendungen und eine oftmalige Wiederholung im Zuge der Bewegung des beobachtenden Benutzers durch das Gebäudeinnere zu ermöglichen .
Im Rahmen eines solchen Verfahrens wurde vom Anmelder aufgrund der als planare Flächenelemente des digitalen Abbilds vorliegenden Sicht- oder Bewegungshindernisse eine Anwendung zur Schulung von Einsatzkräften vorgeschlagen, indem virtuelle Obj ekte wie beispielsweise Darstellungen bewaffneter Täter, die sich hinter Sichthindernissen verbergen, dem Benut zer in das Sichtfeld der Wiedergabeeinheit in Abhängigkeit von der Anwesenheit eines Sicht- oder Bewegungshindernisses eingeblendet werden . Die Wiedergabe virtueller Obj ekte kann durch das Einblenden von Navigationshilfen begleitet sein, die auf Basis des vorliegenden digitalen Abbilds den Einsatz kräften etwa den schnellsten Weg zu einem Zielpunkt unter Berücksichtigung von Bewegungshindernissen anzeigen, oder bei schlechten Sichtverhältnissen eine sichere Bewegung im Gebäudeinneren ermöglichen .
Das sichere Bewegen in einem Einsatzgebiet erfordert in der Praxis aber nicht nur das Auffinden eines bestimmten Zieles , sondern auch die Verarbeitung einer Fülle an situationsabhängigen Informationen, die in weiterer Folge auch als sichtfeldbezogene Zustandsdaten be zeichnet werden . Dabei handelt es sich etwa im Falle von Einsatzkräften der Feuerwehr beispielsweise um physi kalische Zustandsdaten wie Temperatur oder Sichtweite am Einsat zort , um chemische Zustandsdaten wie Schadstoffkonzentrationen oder Brandgeruch, um bauliche Zustandsdaten etwa zu Eigenschaften von Baumaterialien oder zu statischen Gegebenheiten am Einsat zort , oder bei Einsätzen im Freien beispielsweise auch um meteorologische Zustandsdaten . Die hier als Zustandsdaten bezeichneten Informationen werden in herkömmlicher Weise zumeist durch bloße Beobachtung oder auch Erfahrung der Einsat z kräfte gewonnen . Mitunter werden für spezifische Messungen auch Messgeräte von den Einsatzkräften mitgeführt . Für einen sicheren und effizienten Einsat z wäre es freilich wünschenswert über ein Maximum an solchen Zustandsdaten zu verfügen . Andererseits dürfen Einsat zkräfte durch eine Fülle an zu verarbeitenden Informationen auch nicht überfordert werden . Ein Überangebot an ungefilterter Information kann sogar hinderlich für den Einsat z sein .
Es besteht daher das Ziel der Erfindung darin unter Nutzung von „Augmented-Reality"-Systemen Verfahren und Vorrichtungen zu schaffen, mit denen beispielsweise im Rahmen eines sicherheitskritischen Einsat zes ein Maximum an situationsbezogenen Daten gewonnen und einem Benutzer so benut zerfreundlich wie möglich bereitgestellt werden kann .
Dieses Ziel wird durch die Merkmale von Anspruch 1 und Anspruch 7 erreicht . Anspruch 1 bezieht sich auf ein Verfahren zum Einblenden eines computergenerierten, virtuellen Obj ektes in das von einem Benutzer wahrgenommene Sichtfeld einer realen Umgebung , insbesondere in das Sichtfeld einer vom Benutzer getragenen, transparenten Wiedergabeeinheit , wobei das Einblenden des virtuellen Obj ekts mittels einer zentralen Datenverarbeitungseinheit in Abhängigkeit von der momentanen Position und der Blickrichtung des Benutzers erfolgt , und das Einblenden des virtuellen Obj ekts zusät zlich in Abhängigkeit von der Anwesenheit von Sicht- oder Bewegungshindernissen erfolgt , wobei die Sicht- oder Bewegungshindernisse von der zentralen Datenverarbeitungseinheit anhand eines digitalen Abbilds von Oberflächen der realen Umgebung ermittelt werden . Erfindungsgemäß wird dabei vorgeschlagen, dass mittels einer zur Messung von Tiefeninformation fähigen Kamera von dem der momentanen Position und Blickrichtung entsprechenden Sichtfeld des Benutzers 3D-Bilder angefertigt werden, aus denen von der zentralen Datenverarbeitungseinheit mithilfe bekannter mathematischer Verfahren in vorgegebenen Zeitabständen wiederholt ein aktualisiertes digitales Abbild von Oberflächen der realen Umgebung und somit der Sicht- oder Bewegungshindernisse im Sichtfeld ermittelt wird, und mittels Sensoren sichtfeldbezogene Zustandsdaten gewonnen werden, die in der zentralen Datenverarbeitungseinheit verarbeitet werden, wobei mithilfe des virtuellen Obj ekts eine für den Benutzer interaktive und dialogbasierte Wiedergabe der sensorgestützten, sichtfeldbezogenen Zustandsdaten im Sichtfeld des Benutzers erfolgt . Im Rahmen der Erfindung werden somit zunächst sensorgestützte , sichtfeldbezogene Zustandsdaten gewonnen, also Zustandsdaten, die für das j eweilige Sichtfeld relevant sind und mittels Sensoren gewonnen werden . Diese Sensoren können beispielsweise für einen sicherheitskritischen Einsatz von Einsatzkräften eigens mitgeführt oder installiert werden, oder es wird auf bereits vorhandene Sensoren zur Überwachung von Örtlichkeiten wie Brandmelder, Bewegungssensoren, Sicherheits kameras und dergleichen zurückgegriffen . Bei diesen Sensoren kann es sich auch um luftgestützte Sensoren handeln, bei denen etwa mithilfe von Drohnen sichtfeldrelevante Daten gesammelt werden, beispielsweise im Rahmen einer Luftaufklärung in militärischen Anwendungen, oder um bodengestüt zte Sensoren wie beispielsweise Überwachungs kameras einer vorhandenen Sicherheitsarchitektur . Diese Zustandsdaten werden in weiterer Folge im Sichtfeld des Benutzers mithilfe des virtuellen Obj ekts in Form einer für den Benutzer interaktiven und dialogbasierten Wiedergabe bereitgestellt . Die erfindungsgemäße Wiedergabe der Zustandsdaten ist einerseits in teraktiv ausgeführt , also als Wiedergabe , die eine wechselseitige Bezugnahme auf Ein- und Ausgaben von Daten und Befehlen von Benut zer und zentraler Datenverarbeitungseinheit ermöglicht , und andererseits dialogbasiert , also durch sprachlichen Ausdruck in schriftlicher oder mündlicher Form. Diese dialogbasierte , interaktive Wiedergabe wird erfindungsgemäß mithilfe des virtuellen Obj ekts ermöglicht , das dem Benutzer in sein Sichtfeld eingeblendet wird und das ihm somit den Zugriff auf die von den externen Sensoren gewonnenen und von der zentralen Datenverarbeitungseinheit verarbeiteten und beispielsweise als Datenbanken aufbereiteten Zustandsdaten ermöglicht . Durch den dialogbasierten Zugriff kann der Benut zer beispielsweise mithilfe einer Sprachsteuerung gewünschte sichtfeldbezogene Zustandsdaten abrufen, also etwa durch die mündlich gestellte Frage „ Wie hoch ist die momen tane Kohlenmonoxid-Konzentra tion ?" oder einfach "Kohlenmonoxid?” . Dieser Sprachbefehl wird von einem Mikrofon aufgenommen, das der Benut zer trägt , und über das der mündlich geäußerte Eingabebefehl der zentralen Datenverarbeitungseinheit übermittelt wird . Die zentrale Datenverarbeitungseinheit ruft Messdaten eines entsprechenden Messgeräts ab und gibt sie über das virtuelle Obj ekt im Sichtfeld des Benut zers wieder . Die Wiedergabe kann etwa optisch im Sichtfeld des Benut zers über eine dialogbasierte schriftliche Wiedergabe von Zustandsdaten erfolgen, wie sie von Chatbots und dergleichen bekannt ist , oder akustisch über ein vom Benut zer mitgetragenes Wiedergabegerät wie Kopfhörer und dergleichen, wobei die akustische Wiedergabe über eine vom Benutzer dem virtuellen Obj ekt zugeordnete sprachliche Ausgabe erfolgt . Im erstgenannten Fall stellt das virtuelle Obj ekt selbst eine schriftliche oder sonstige graphische Darstellung der wiedergegebenen Zustandsdaten dar, und im zweitgenannten Fall erfolgt die Wiedergabe der Zustandsdaten in einer vom virtuellen Obj ekt unterstüt zten Form, indem der Benutzer die Wiedergabe dem virtuellen Obj ekt zuordnet und der Benutzer das virtuelle Obj ekt somit als Ausgabeschnittstelle wahrnimmt . Diese Zuordnung kann etwa durch geeignete graphische Aufbereitung des virtuellen Obj ekts erfolgen . Eine Möglichkeit besteht etwa darin die dialogbasierte , interaktive Wiedergabe mithilfe eines virtuellen Obj ekts mit einem antropomorphen Aussehen zu unterstützen . Ein solches computergeneriertes Obj ekt mit einem antropomorphen Aussehen, das zu einer dialogbasierten Interaktion mit dem Benutzer fähig ist , wird mitunter auch als Avatar bezeichnet . In der Regel werden dabei Avatare nicht statisch dargestellt , sondern als Bewegtbild animiert , wofür in der Regel so genannte „3D-Echt zeit-Engines" verwendet werden . Auf diese Weise lassen sich Interaktionen auch optisch darstellen, wodurch für den Benutzer der Eindruck einer Interaktion verstärkt wird . Der Eindruck der Interaktion kann dabei auf vielfältige Weise erreicht werden, beispielsweise durch eine dem virtuellen Obj ekt zugeordnete Sprachfärbung, oder durch Augenkontakt eines antropomorph ausgeführten virtuellen Obj ekts mit dem Benut zer und entsprechende Mundbewegungen . Das virtuelle Obj ekt wird somit vom Benutzer als Benutzerschnittstelle wahrgenommen, auch wenn der physische Datenaustausch zwischen dem Benut zer und der zentralen Datenverarbeitungseinheit mithilfe eines Mikrofons und eines Lautsprechers , oder auch mithilfe von Gestenerkennung und dergleichen erfolgen kann . Die Benut zerschnittstelle kann in diesem Sinn auch als virtuelle Benut zerschnittstelle bezeichnet werden .
Die Erfindung sieht des Weiteren vor die Gewinnung und Wiedergabe der sensorgestützten Zustandsdaten mit iterativ präzisierten räumlichen Daten des Sichtfeldes zu kombinieren . Diese Maßnahme dient einerseits dazu ein aktualisiertes digitales Abbild von Oberflächen der realen Umgebung und somit der Sicht- oder Bewegungshindernisse im Sichtfeld des Benut zers zu erhalten, weil sich die physische Umgebung vor allem unter realen Einsatzbedingungen von Einsat zkräften ständig ändern kann . Die automatisiert wiederholte Erhebung räumlicher Daten und das damit verbundene Erfassen von Gefahrenquellen und von Bewegungshindernissen sind für eine genaue Lagebilderstellung entscheidend . Diese Daten werden an die zentrale Datenverarbeitungseinheit übermittelt , die diese räumlichen Daten des Sichtfeldes mit den sichtfeldbe zogenen Zustandsdaten kombiniert und auswertet . Vorzugsweise erfolgt die Bewertung derselben durch die zentrale Datenverarbeitungseinheit automatisiert , da im Echteinsat z keine Zeit besteht diese Daten manuell in ein Lagebild einzupflegen , und der Einsat z autonomer Systeme und automatischer Detektion die Risi ken für Infrastrukturen und Einsat zteams verringert . Die Erfindung ermöglicht es somit durch die Kombination von multimodalen Daten von unterschiedlichen Sensorsystemen mit den in Echt zeit erhobenen räumlichen Daten eine automatische Lagebilderstellung vorzunehmen , wie noch näher ausgeführt werden wird . Wie die praktische Erfahrung zeigt , ist es mitunter erst durch eine Kombination der vor Ort in Echt zeit gewonnenen Daten wie persönliche Wahrnehmung oder 3D-Bildern der S zenerie mit Daten externer Sensoren oder vorhandenen digitalen Plänen möglich, ein korrektes Lagebild inklusive aller erkannten Gefahren und Hindernissen zu erstellen . Diese Daten dienen als Basis für Entscheidungen der zentralen Datenverarbeitungseinheit , um Einsat z kräfte vor Gefahren zu schützen, Bewegungsrouten zu berechnen oder Anweisungen geben zu können .
Andererseits dient die Maßnahme der iterativ präzisierten räumlichen Daten des Sichtfeldes aber auch dazu die Wiedergabe des virtuellen Obj ekts zu optimieren, vor allem wenn es sich dabei um ein virtuelles Obj ekt mit antropomorpher Gestalt handelt , das im Sichtfeld des Benut zers bewegt animiert wird und von Sichthindernissen stets unterschiedlich verdeckt wird . Dabei ist darauf hinzuweisen, dass erfindungsgemäß die wiederholte Messung von Tiefeninformation und die Anfertigung von 3D-Bildern zur Gewinnung eines aktualisierten digitalen Abbildes von Oberflächen der realen Umgebung von dem der momentanen Position und Blickrichtung entsprechenden Sichtfeld des Benut zers erfolgt . Das Sichtfeld des Benut zers ist deshalb entscheidend, weil der Benut zer naturgemäß seine Aufmerksamkeit und damit sein Sichtfeld auf die für ihn momentan relevante Szenerie richtet und eine genaue Analyse des Sichtfeldes daher besonders wichtig ist . Zudem erfolgt auch das Einblenden des virtuellen Obj ekts für die Wiedergabe von Zustandsdaten im Sichtfeld des Benutzers , sodass die genaue Kenntnis der Sicht- und Bewegungshindernisse für eine optimale Einblendung des virtuellen Obj ekts förderlich ist , wie noch näher ausgeführt werden wird . Unter dem Sichtfeld wird dabei in herkömmlicher Weise die räumliche Ausdehnung des binokularen Gesichtsfelds eines Menschen verstanden, also der Summe der beiden monokularen Gesichtsfelder des j eweils rechten und linken Auges allein . Bei einem Erwachsenen beträgt die horizontale Ausdehnung des binokularen Gesichtsfelds etwa 200 ° ( 100 ° nach links und 100 ° nach rechts ) , und die vertikale Ausdehnung etwa 60 ° -70 ° nach oben und 70 ° -80 ° nach unten . Dieses Sichtfeld stellt den Gesamtbereich dar , in dem ohne Zuhilfenahme von Augen- und Kopfbewegungen visuelle Wahrnehmung möglich ist . Die vom Benut zer erfindungsgemäß getragene Wiedergabeeinheit wird dieses Sichtfeld vorzugsweise kaum einschränken . Innerhalb eines zentralen Bereichs des Sichtfeldes ist ein klares Erkennen mit maximaler Wahrnehmungsqualität hinsichtlich Sehschärfe , Mustererkennung und Farbsehen möglich . Dieser zentrale Bereich des Sichtfeldes entspricht einem hori zontalen und vertikalen Seh- oder Blickwinkel von j eweils etwa 40-55 ° . Der hori zontale und vertikale Seh- oder Blickwinkel ist dabei der Winkel zwischen zwei gegenüberliegenden Randpunkten eines Gegenstands und dem Augpunkt in einer horizontalen und einer vertikalen Ebene . Erfindungsgemäß wird wiederholt ein präzisiertes digitales Abbild von Oberflächen des Sichtfeldes erhoben . Dabei muss es sich nicht um das gesamte Sichtfeld handeln . So kann etwa der Bildwinkel der erfindungsgemäß verwendeten 3D-Kameras im Zuge des bildgebenden Verfahrens zur Abbildung eines Ausschnitts einer Szenerie in derselben Größenordnung wie der zentrale Bereich des Sichtfeldes mit maximaler Wahrnehmungsqualität liegen, also im Bereich von 40-55 ° .
Der erfindungsgemäß genannte , vorgegebene Zeitabstand der wiederholten Gewinnung eines aktualisierten digitalen Abbildes kann variieren und der Dynamik der Situation sowie der vorhandenen Rechenleistung angepasst sein . Zum Zeitpunkt der Anmeldung sind beispielsweise Zeitabstände von etwa drei Sekunden machbar, das heißt , dass alle drei Sekunden ein aktualisiertes digitales Abbild des Sichtfeldes des Benut zers erfolgt . Der Vorgang der Aktualisierung des digitalen Abbilds kann beschleunigt und verbessert werden, indem mithilfe aktueller 3D-Bilder ( „scan" ) ein Differenzbild zu einem bereits vorliegenden digitalen Abbild erstellt wird . Falls dabei in Teilbereichen signifikante Abweichungen ermittelt werden, wird das digitale Abbild lediglich in diesen Teilbereichen anhand der aktuellen Daten aktualisiert . Bei den Zustandsdaten kann es sich wie erwähnt um physikalische Zustandsdaten wie z . B . Temperatur oder Sichtweite , oder um chemische Zustandsdaten wie z . B . Schadstoff konzentrationen handeln . Zustandsdaten dieser Art sind beispielsweise für Einsatzkräfte der Feuerwehr entscheidend und werden wie erwähnt entweder von bereits installierten Sensoren erhoben, oder von Sensoren, die von den Einsat zkräften mitgeführt werden . Ein weiteres Beispiel sind sicherheitsrelevante Zustandsdaten beispielsweise für Einsat zkräfte der Polizei . Zustandsdaten dieser Art werden etwa von Videokameras einer bereits vorhandenen Sicherheitsarchitektur erhoben, mit denen zunächst Personen detektiert werden und in weiterer Folge durch Abgleich mit einem digitalen Abbild der realen Umgebung ein mögliches Schuss feld ermittelt wird . Sicherheitsrelevante Zustandsdaten könnten somit beispielsweise die Information „Sicht feld quert das mögliche Schussfeld einer unbekannten Person" beinhalten . Des Weiteren könnte im Rahmen des erfindungsgemäßen Verfahrens auf bereits vorhandene Brand- oder Rauchdetektoren als externe Sensoren zurückgegriffen werden, die einen möglichen Brandherd detektieren . Sicherheitsrelevante Zustandsdaten könnten in diesem Fall die Information „Sicht feld befindet sich im Bereich ansteigender Rauchgaskonzen tra tion" beinhalten . Ein mögliches Anwendungsbeispiel luftgestüt zter Sensoren wie Drohnen und dergleichen wäre beispielsweise im militärischen Bereich im Rahmen von Auf klärungsaktivitäten eines Gefechtsbereiches möglich, wobei sicherheitsrelevante Zustandsdaten beispielsweise die Information „Sichtfeld befindet sich im Schussfeld feindlicher Artillerie" sein können .
Des Weiteren könnte es sich bei den Zustandsdaten auch um physiologische Zustandsdaten wie z . B . Puls , Blutdruck, Sauerstoff Sättigung und dergleichen handeln . Zustandsdaten dieser Art sind für Einsat zkräfte der Rettung entscheidend und werden an einem Patienten von medizinischen Sensoren erhoben . Bei den sichtfeldbezogenen Zustandsdaten handelt es sich somit um physiologische Zustandsdaten eines Patienten im Sichtfeld des Benutzers . Wie bereits ausgeführt wurde , kann die Wiedergabe von Zustandsdaten akustisch über ein vom Benut zer mitgetragenes Gerät wie Kopfhörer, Ohrlautsprecher und dergleichen erfolgen, wobei die akustische Wiedergabe über eine vom Benutzer dem virtuellen Obj ekt zugeordnete , sprachliche Ausgabe erfolgt . Diese Zuordnung kann etwa durch geeignete graphische Aufbereitung des virtuellen Obj ekts erfolgen, beispielsweise in Form eines virtuellen Obj ekts mit einem antropomorphen Aussehen . Zudem kann vorzugsweise vorgesehen sein, dass der benutzerseitige Befehl zur Wiedergabe von Zustandsdaten oder des virtuellen Obj ekts mithilfe einer sprachgesteuerten Eingabeschnittstelle zur zentralen Datenverarbeitungseinheit erfolgt . Durch den dialogbasierten Zugriff kann der Benutzer beispielsweise mithilfe der Sprachsteuerung gewünschte sichtfeldbezogene Zustandsdaten abrufen, also etwa durch die mündlich gestellte Frage „Wie hoch ist die momentane Kohlenmonoxid-Konzentra tion ?" oder einfach "Kohlenmonoxid?" . Dieser Sprachbefehl wird von der als Mikrofon ausgeführten Eingabeschnittstelle aufgenommen, das der Benutzer trägt und über das der mündlich geäußerte Eingabebefehl der zentralen Datenverarbeitungseinheit übermittelt wird . Die sprachgesteuerte Eingabeschnittstelle kann auch zur Eingabe von Befehlen zur Wiedergabe des virtuellen Obj ekts verwendet werden . Ein als Avatar ausgeführtes virtuelles Obj ekt kann etwa über den sprachgesteuerten Befehl „Komm mi t !" dazu aufgef ordert werden dem Benutzer zu folgen .
Des Weiteren wird vorgeschlagen, dass ein automatisierter Abruf von Zustandsdaten in denselben vorgegebenen Zeitabständen oder in anderen vorgegebenen Zeitabständen wie j enen der wiederholten Aktualisierungen des digitalen Abbildes erfolgt . Somit kann eine automatisierte Wiedergabe von Zustandsdaten erfolgen, beispielsweise über den optisch oder akustisch wiedergegebenen Hinweis „Achtung , Schadstoffkonzentra tion erhöht sich !" oder „Sauerstoff Sät tigung des Pa tienten sinkt !" . Der Abruf kann beispielsweise im Takt der Iterationen der Aktualisierungen des digitalen Abbildes erfolgen . Vorzugsweise erfolgt die Verarbeitung der mittels Sensoren gewonnenen sichtfeldbezogenen Zustandsdaten in der zentralen Datenverarbeitungseinheit mithilfe eines künstlichen neuronalen Netzwerks . Ein solches künstlich neuronales Net zwerk wird auch als „Künstliche Intelligenz" oder „KI" bezeichnet . Das beispielsweise als Avatar ausgeführte virtuelle Obj ekt greift somit auf künstliche Intelligenz zurück, um durch so genanntes „Machine Learning" und an s ich bekannter Klassif ikationsverfahren Gefahrenquellen zu identifi z ieren , sowie durch autonome Agentensysteme eine Lagebewertung automatisiert durchzuführen . Alle zur Verfügung stehenden Informationen , die mithilfe der externen Sensoren oder durch wiederholte Erhebung aktualisierter räumlicher Daten gewonnen werden, können von der zentralen Datenverarbeitungseinheit verwendet werden , um eine aktuelle Gefahreneinschät zung tref fen und Einsatz kräfte über den Avatar als Benut zerschnittstelle entsprechend informieren zu können . Des Weiteren kann von der zentralen Datenverarbeitungseinheit eine Indoor- oder Outdoornavigat ion unter Berücksichtigung aller erkannten erfassten Gefahren vorgenommen werden . Ebenso kann der Benut zer über den Avatar durch den permanenten Abgleich der Sensorik mit den erst bei der Echtansicht gewonnenen Daten informiert werden, wo sich im Raum Gegenstände , Möbel oder dergleichen befinden .
Wie bereits erwähnt wurde , kann das virtuelle Obj ekt mit einem antropomorphen Aussehen versehen werden, das zu einer dialogbasierten Interaktion mit dem Benut zer fähig ist . In der Regel werden dabei Avatare nicht statisch dargestellt , sondern als Bewegtbild animiert , wofür in der Regel so genannte „3D- Echt zeit-Engines" verwendet werden . Auf diese Weise lassen sich Interaktionen auch optisch darstellen, wodurch für den Benutzer der Eindruck einer Interaktion verstärkt wird . Um eine korrekte Bewegung des Avatars im Sichtfeld des Benut zers sicherzustellen, bei der Sicht- und Bewegungshindernisse umgangen werden, wird vorgeschlagen, dass im digitalen Abbild hori zontale Freibereiche ermittelt werden, die in vertikaler Proj ektion frei von Sicht- oder Bewegungshindernissen sind, und eine im Sichtfeld des Benutzers zu vollziehende Bewegung des virtuellen Obj ekts von einem Anfangsort zu einem Zielort von der zentralen Datenverarbeitungseinheit in Form eines kürzesten und innerhalb der Freibereiche liegenden Bewegungspfades errechnet wird . Die Ermittlung der hori zontalen Freibereiche kann wie bereits erwähnt wurde anhand der horizontalen Flächenelemente des digitalen Abbilds erfolgen, wobei eine Bodenfläche als Gesamtheit aneinandergrenzender horizontaler Flächenelemente einer untersten Schichtlage ermittelt wird, die in vertikaler Proj ektion frei von Sicht- oder Bewegungshindernisse ist . Dieser Freibereich liegt im digitalen Abbild als Gesamtheit entsprechender Knotenpunkte ( „mesh" ) vor . Diese Knotenpunkte ( „mesh" ) können als so genanntes „Navigation mesh" den oben erwähnten „3D-Echt zeit-Engines" bereitgestellt werden, die es in bekannter Weise zur Bewegungssteuerung von als Bewegtbild animierten virtuellen Obj ekten ( „Avatare" ) verwenden . Das „Navigation mesh" kann dabei gemäß der erfindungsgemäß vorgesehenen Aktualisierungen des digitalen Abbilds in vorgegebenen Zeitabständen erneuert werden, um auf zwischenzeitlich verschobene Obj ekte wie Stühle und dergleichen reagieren zu können . Auf diese Weise kann aufgrund des iterativ präzisierten digitalen Abbildes eine lebensecht scheinende Bewegung des virtuellen Obj ekts unter Vermeidung von Bewegungshindernissen und eine korrekte Verdeckungsrechnung für das Einblenden des Avatars in Abhängigkeit von Sichthindernissen vorgenommen werden .
Des Weiteren kann vorgesehen sein, dass im digitalen Abbild hori zontale Freibereiche wie oben beschrieben ermittelt werden, die in vertikaler Proj ektion frei von Sicht- oder Bewegungshindernissen sind, und eine im Sichtfeld des Benutzers zu voll ziehende Bewegung des virtuellen Obj ekts von einem Anfangsort zu einem Zielort von der zentralen Datenverarbeitungseinheit in Form eines innerhalb der Freibereiche liegenden Bewegungspfades unter Einbeziehung der sensorgestüt zten Zustandsdaten als Randbedingung errechnet wird . Das als Avatar ausgeführte virtuelle Obj ekt bewegt sich somit vom Anfangsort zum Zielort unter Einbeziehung der Zustandsdaten, also beispielsweise unter Vermeidung eines Brandherdes . Mit anderen Worten erfolgt die Ermittlung eines optimalen Bewegungspfades aus der Vielzahl möglicher Bewegungspfade innerhalb der Freibereiche durch Bewertung eines Bewegungspfades anhand vorgegebener Kriterien, beispielsweise eines möglichen Sicherheitsrisikos entlang eines Bewegungspfades , das sich durch das Queren eines möglichen Schussfeldes einer nicht identifi zierten Person einstellen könnte . Der optimale Bewegungspfad ist j ener , bei dem die vorgegebenen Kriterien bestmöglich erfüllt werden, also beispielsweise ein kleinstmögliches Sicherheitsrisiko einstellt . Dieser optimale Bewegungspfad kann dem Benutzer als Navigationshilfe bereitgestellt werden . Eine Möglichkeit besteht etwa darin, dass sich das als Avatar ausgeführte virtuelle Obj ekt entlang des optimalen Bewegungspfades bewegt . Da sich die Bewegung des Avatars im Sichtfeld der Person vollzieht , kann die Person dem Avatar einfach folgen . In einem solchen Anwendungsfall werden die vorgegebenen Zeitabstände , mit denen die zentrale Datenverarbeitungseinheit aus den gemessenen 3D-Bildern wiederholt ein aktualisiertes digitales Abbild von Oberflächen der realen Umgebung und somit der Sicht- oder Bewegungshindernisse im Sichtfeld ermittelt , entsprechend kürzer gewählt werden, beispielsweise unter 3 Sekunden, etwa im Sekundentakt .
Die Erfindung bezieht sich des Weiteren auf eine Vorrichtung umfassend eine tragbare , transparente Wiedergabeeinheit zum Einblenden eines computergenerierten, virtuellen Obj ektes in das von einem Benutzer wahrgenommene Sichtfeld einer realen Umgebung, insbesondere in das Sichtfeld der vom Benutzer getragenen, transparenten Wiedergabeeinheit , sowie eine mit der Wiedergabeeinheit verbundene zentrale Datenverarbeitungseinheit zum Generieren und Einblenden des virtuellen Obj ektes in das vom Benut zer wahrgenommene Sicht feld einer realen Umgebung . Erfindungsgemäß wird hierbei vorgeschlagen, dass zumindest eine zur Messung von Tiefeninformation fähige Kamera zur Anfertigung von 3D-Bildern von dem der momentanen Position und Blickrichtung entsprechenden Sichtfeld des Benutzers vorgesehen ist , und die zentrale Datenverarbeitungseinheit ausgelegt ist aus den 3D- Bildern mithilfe bekannter mathematischer Verfahren in vorgegebenen Zeitabständen wiederholt ein aktualisiertes digitales Abbild von Oberflächen der realen Umgebung im Sichtfeld zu ermitteln, und Sensoren zur Ermittlung sichtfeldbezogener Zustandsdaten vorgesehen sind, die mit der zentralen Datenverarbeitungseinheit verbunden sind, wobei mithilfe des virtuellen Obj ekts eine für den Benutzer interaktive und dialogbasierte Benut zerschnittstelle zur Wiedergabe der sensorgestützten, sichtfeldbezogenen Zustandsdaten im Sichtfeld des Benut zers verwirklicht ist . Die obigen Ausführungen zum erfindungsgemäßen Verfahren treffen sinngemäß auch auf die erfindungsgemäße Vorrichtung zu .
Vorzugsweise wird vorgeschlagen, dass für den benutzerseitigen Befehl zur Wiedergabe von Zustandsdaten oder des virtuellen Obj ekts eine sprachgesteuerte Eingabeschnittstelle zur zentralen Datenverarbeitungseinheit vorgesehen ist .
Des Weiteren kann vorgesehen sein , dass ein künstliches neuronales Net zwerk ( KI ) zur Verarbeitung der mittels Sensoren gewonnenen sichtfeldbezogenen Zustandsdaten in der zentralen Datenverarbeitungseinheit vorgesehen ist .
Die Erfindung wird in weiterer Folge anhand von Ausführungsbeispielen mithilfe der beiliegenden Figuren näher erläutert . Es zeigen hierbei die
Fig . 1 eine schematische Übersicht über den grundsätzlichen Ablauf der Generierung eines digitalen Abbilds im Rahmen des erfindungsgemäßen Verfahrens ,
Fig . 2 eine schematische Ansicht eines Raumplans eines Gebäudeinneren, das mithilfe einer Datenbrille zur Generierung eines digitalen Abbilds und von Referenzbildern vermessen wird,
Fig . 3 ein Beispiel eines real ermittelten digitalen Abbilds eines Gebäudeinneren,
Fig . 4 eine schematische Übersicht über den grundsät zlichen Ablauf der Ermittlung von Sicht- oder Bewegungshindernissen im Rahmen des erfindungsgemäßen Verfahrens ,
Fig . 5 eine schematische Darstellung zur Erläuterung der horizontalen Schichtung zur Ermittlung der Sicht- oder Bewegungshindernisse , und die Fig . 6 eine schematische Ansicht eines Raumplans eines Gebäudeinneren zur Erläuterung des erfindungsgemäßen Verfahrens und der erfindungsgemäßen Vorrichtung .
Zunächst wird anhand der Fig . 1 bis 5 erläutert , wie im Rahmen der Erfindung ein digitales Abbild gewonnen und aktualisiert wird und daraus Sicht- und Bewegungshindernisse für das Einblenden eines virtuellen Obj ekts V ermittelt werden, und danach wird anhand der Fig . 6 mithilfe eines Aus führungsbeispiels erläutert , wie die erfindungsgemäße Wiedergabe von Zustandsdaten erfolgt . Die Fig . 1 zeigt zunächst eine schematische Übersicht über den grundsätzlichen Ablauf der Generierung eines digitalen Abbilds eines Gebäudeinneren im Rahmen des erfindungsgemäßen Verfahrens . Zunächst ist ein digitales Abbild der dem Rauminneren zugewandten Oberflächen des Gebäudeinneren zu erstellen . Gemäß Fig . 1 wird hierfür eine Wiedergabeeinheit 1 in Form einer Datenbrille verwendet , die mit einer Kamera zur Aufnahme zweidimensionaler Bilder, mit einer 3D-Kamera zur Aufnahme von mit Tiefeninformation versehenen Bildern sowie mit einer Sensorik zur Ermittlung von Position und Blickrichtung versehen ist und in der Fig . 1 oben rechts angedeutet ist . Mit einer solchen Wiedergabeeinheit 1 wird das Gebäudeinnere durchschritten, das beispielsweise einen Grundriss gemäß der Fig . 2 aufweist . Die Fig . 2 zeigt schematisch einige Positionen eines Benutzers B mit einer solchen Wiedergabeeinheit 1 , die vom Benutzer B im Zuge des Durchschreitens der Räume nacheinander eingenommen werden . Das Ergebnis des Durchschreitens ist eine Vielzahl an mit Tiefeninformation versehenen Bildern der Raumansichten, die sich dem Benutzer während des Durchschreitens bieten, und die an eine zentrale Datenverarbeitungseinheit 2 gesendet werden . Bei der zentralen Datenverarbeitungseinheit 2 handelt es sich in der Regel um ein externes Gerät wie beispielsweise ein stationärer oder tragbarer Computer oder Tablet , sie könnte aber auch in der Wiedergabeeinheit 1 integriert sein . Mithilfe bekannter mathematischer Verfahren kann in der zentralen Datenverarbeitungseinheit 2 aus den so gewonnenen „Scans" an Tiefeninformationen ein digitales Abbild gewonnen werden, das die dem Benut zer j eweils zugewandten Oberflächen des Gebäudeinneren mithilfe von Flächenelementen F approximiert . Diese Flächenelemente F sind in der Fig . 2 als planare Flächenelemente F in Form von Dreiecken angedeutet , die die zu approximierenden Oberflächen lückenlos nachbilden . Eine weitere Möglichkeit bekannter mathematischer Verfahren besteht darin den Flächenelementen F auch eine Orientierung zuzuschreiben, indem eine Flächennormale auf das betreffende Flächenelement F errechnet wird . Auf diese Weise können Flächenelemente F als vertikal orientierte Flächenelemente Fv oder als hori zontal orientierte Flächenelemente Fh identifiziert werden, aus denen in weiterer Folge Sicht- oder Bewegungshindernisse rekonstruiert werden können, wie später anhand der Fig . 4 erläutert werden soll . Das Ergebnis des „Scans" ist ein dreidimensionaler „Mesh" des Gebäudeinneren . Sobald eine gewisse Differenz der Höhenkoordinate festgestellt wird, erfolgt die Generierung eines neuen 3D-Modells , da dies als Wechsel des Stockwerkes interpretiert wird . Durch Visualisierung der bereits gescannten Flächen lässt man den Benutzer B wissen, was bereits erfasst wurde und wo noch Lücken im Scan sind . Nachdem der Benutzer B zufrieden ist , werden die 3D-Modelle für j edes Stockwerk am Server ( Tablet- Applikation) oder lokal gespeichert . Darüber hinaus können zusätzlich von j edem Raum ein oder mehrere Referenzbilder beispielsweise als RGB-Bilder aufgenommen werden, die später als Wiedererkennungs-Punkte dienen sollen ( „optische Marker" ) und in einer Datenbank der zentralen Datenverarbeitungseinheit 2 hinterlegt werden . Diesen Referenzbildern werden dabei die j eweiligen, bekannten Aufnahmepositionen zugeordnet , wie sie in der Fig . 2 durch die Rauten angedeutet sind . Anhand dieses Vorgangs kann auch festgestellt werden, welche Räume miteinander verbunden sind . Somit können direkt mögliche Raumwechsel eingeschränkt werden, was bei der Bestimmung des aktuellen Raumes im Positionsbestimmungsverf hren hilfreich sein kann .
Nachdem das digitale Abbild des Gebäudeinneren, die Referenzbilder sowie die Sicht- und Bewegungshindernisse ermittelt wurden, ist die zentrale Datenverarbeitungseinheit 2 für einen Einsatz zum Einblenden virtueller Obj ekte bereit , die in einer Datenbank der zentralen Datenverarbeitungseinheit 2 gespeichert sind . Bei einem Einsatz in einem bislang noch nicht durchschrittenen Gebäudeinneren kann das digitale Abbild anhand eines bekannten Gebäudeplans erfolgen, der mithilfe von 3D-Bildern der vom Benut zer mitgeführten 3D-Kamera ergänzt wird . Bei einem Einsatz im offenen Gelände kann das digitale Abbild anhand eines bekannten Umgebungsplans erfolgen , der mithilfe von 3D-Bildern der vom Benut zer mitgeführten 3D- Kamera ergänzt wird . Mittels eigener Software lassen sich auf dem digitalen Abbild virtuelle Obj ekte V platzieren .
Im Zuge eines Trainings oder Einsat zes bewegt sich ein Benut zer B mit einer Wiedergabeeinheit 1 etwa in Form einer Datenbrille , die mit einer Kamera zur Aufnahme zweidimensionaler Bilder , mit einer 3D-Kamera zur Aufnahme von mit Tiefeninformation versehenen Bildern sowie mit Sensorik zur Ermittlung von Position und Blickrichtung des Benutzers B versehen ist , durch das Gebäudeinnere . Diese Wiedergabeeinheit 1 ist in der Fig . 1 oben links angedeutet . Bei der Durchführung des Trainings oder Einsatzes werden die S zenario- Informationen wieder von der zentralen Datenverarbeitungseinheit 2 an die Applikation der Wiedergabeeinheit 1 übertragen . Damit das Szenario korrekt abläuft , muss das aktuelle Koordinatensystem der Wiedergabeeinheit 1 mit j enem synchronisiert werden, das für die Erstellung des digitalen Abbilds verwendet wurde . Hierfür können die zuvor auf genommenen Referenzbilder verwendet werden . Liefert die Kamera der Wiedergabeeinheit 1 für eine Ansicht ein Bild, das zuvor aufgenommen wurde , kann die Abweichung der beiden Koordinatensysteme errechnet werden . Die Referenzbilder können auch dazu verwendet werden, das Szenario in eingeschränkter Weise fort zuführen, sollte sich die Wiedergabeeinheit 1 nicht mehr orientieren können, da man durch deren Wiedererkennung auf die Position und Orientierung des Benutzers B rückschließen kann . Alternativ wäre es auch denkbar an mehreren Orten sogenannte „Spatial Anchors" zu erstellen . Durch Vergleich der Anchor-Transf ormationen lässt sich ebenfalls eine Differenz der Startpunkte und der Orientierung errechnen . Die Position der Wiedergabeeinheit 1 kann an der zentralen Datenverarbeitungseinheit 2 im digitalen Abbild des Raumplanes dargestellt werden .
Mithilfe der als planare Flächenelemente F des digitalen Abbilds vorliegenden Sicht- oder Bewegungshindernisse kann nun das Einblenden eines virtuellen Obj ekts V in Abhängigkeit von der Anwesenheit eines Sicht- oder Bewegungshindernisses auf einfache Weise erfolgen, indem im Rahmen eines Berechnungsalgorithmus Verbindungslinien zwischen einem der momentanen Position und Blickrichtung des Benut zers B entsprechenden Augpunkt des Benut zers B und Bildpunkten des virtuellen Obj ekts V errechnet und innerhalb des Abstandes zwischen dem Augpunkt und den Bildpunkten des virtuellen Obj ekts V das Vorliegen von Schnittpunkten der Verbindungslinien mit den als planare Flächenelementen F vorliegenden Sicht- oder Bewegungshindernissen ermittelt werden, wobei bei Vorliegen eines Schnittpunkts für einen Bildpunkt des virtuellen Obj ekts V der betreffende Bildpunkt im Sichtfeld des Benutzers B nicht oder nicht sichtbar eingeblendet wird, und bei Fehlen eines Schnittpunkts für einen Bildpunkt des virtuellen Obj ekts V der betreffende Bildpunkt sichtbar eingeblendet wird . Das virtuelle Obj ekt V wird somit in Abhängigkeit von der Anwesenheit eines Sichtoder Bewegungshindernisses entweder zur Gänze , teilweise oder überhaupt nicht sichtbar eingeblendet .
Mithilfe der als planare Flächenelemente F des digitalen Abbilds vorliegenden Sicht- oder Bewegungshindernisse kann aber auch eine Anwendung als Navigationshilfe erfolgen, indem es sich bei den in Abhängigkeit von der Anwesenheit eines Sicht- oder Bewegungshindernisses eingeblendeten virtuellen Obj ekten V um Navigationshilfen handelt , die dem Benut zer B in das Sichtfeld der Wiedergabeeinheit 1 eingeblendet werden . Diese Navigationshilfen können den Einsatzkräften etwa den schnellsten Weg zu einem Zielpunkt unter Berücksichtigung von Bewegungshindernissen anzeigen, oder bei schlechten Sichtverhältnissen eine sichere Bewegung im Gebäudeinneren ermöglichen, wie anhand der Fig . 6 noch genauer beschrieben wird . In der Fig . 1 ist ferner ein Pfeil zu sehen, der zurück zur Generierung eines digitalen Abbilds führt . Dieser Pfeil soll andeuten, dass mittels der an der Wiedergabeeinheit 1 befestigten und zur Messung von Tiefeninformation fähigen Kamera der momentanen Position und Blickrichtung des Benutzers B entsprechende 3D-Bilder angefertigt werden, aus denen ein aktualisiertes digitales Abbild ermittelt werden kann . Da sich die momentane Ansicht eines Raumbereiches im Vergleich zu einem vorab erstellten digitalen Abbild auch ändern kann , indem etwa ein Möbelstück verschoben oder eine Tür geschlossen wurde , wird das digitale Abbild anhand der vom Benut zer B momentan wahrgenommenen, realen Umgebung aktualisiert . Diese Aktualisierung wird in vorgegebenen Zeitabständen wiederholt durchgeführt , wobei der vorgegebene Zeitabstand der wiederholten Gewinnung eines aktualisierten digitalen Abbildes variieren kann und der Dynamik der Situation sowie der vorhandenen Rechenleistung angepasst sein wird . Zum Zeitpunkt der Anmeldung sind beispielsweise Zeitabstände von etwa drei Sekunden machbar , das heißt , dass alle drei Sekunden ein aktualisiertes digitales Abbild des Sichtfeldes des Benutzers B erfolgt . Der Vorgang der Aktualisierung des digitalen Abbilds kann beschleunigt und verbessert werden, indem mithilfe aktueller 3D-Bilder ( „scan" ) ein Differenzbild zu einem bereits vorliegenden digitalen Abbild erstellt wird . Falls dabei in Teilbereichen signifikante Abweichungen ermittelt werden, wird das digitale Abbild lediglich in diesen Teilbereichen anhand der aktuellen Daten aktualisiert .
In weiterer Folge wird anhand der Fig . 4 und 5 die Ermittlung von Sicht- und Bewegungshindernissen aus dem digitalen Abbild erläutert . Wie bereits erwähnt wurde , kann mithilfe bekannter mathematischer Verfahren aus den zuvor beschriebenen Scans des Gebäudeinneren ein digitales Abbild als so genannter „Mesh" gewonnen werden, das die Oberflächen des Gebäudeinneren mithilfe von planaren Flächenelementen F ( „Faces" ) approximiert . Mithilfe einer Applikation, die auf der zentralen Datenverarbeitungseinheit 2 läuft , werden die Meshes , die von der Wiedergabeeinheit 1 erhalten wurden, bearbeitet und daraus ein digitales Abbild erstellt . Die Vertices und Faces werden anhand ihrer Höhe in Stockwerke eingeteilt . Danach werden bei den gescannten Meshes pro Stockwerk alle Vertices und Faces oberhalb einer Augenhöhenebene A, die der durchschnittlichen Augenhöhe entspricht , entfernt , sowie um fehlerhafte Faces bereinigt . Die genaue Höhenlage der Augenhöhenebene A ist dabei nicht wesentlich, sie wird beispielsweise mit einer Höhe von 1 , 80m angenommen . Das digitale Abbild des Gebäudeinneren wird somit gewissermaßen in Augenhöhenebene A „abgeschnitten" . Was sich in Augenhöhe oder knapp darunter befindet wird als Teil eines Sicht- oder Bewegungshindernisses , also Wände , Einrichtung oder sonstiges , gewertet . Was sich in Bodennähe befindet , wird als solcher eingestuft und damit als passierbar bewertet . Hierbei wird wie folgt vorgegangen . Zunächst werden j ene Flächenelemente F ermittelt , deren Flächennormale hori zontal oder vertikal verlaufen , also Flächenelemente F, deren Orientierung vertikal oder hori zontal ist . In weiterer Folge wird eine hori zontale Schichtung zwischen der Bodenebene B des Gebäudeinneren und der angenommenen Augenhöhenebene A mit einer Mehrzahl von Schichtlagen Si ( i=l , ...N) einer vorgegebenen Schichtdicke vorgenommen . Im gezeigten Beispiel der Fig . 5 werden etwa sechs Schichtlagen Si (N=6 ) mit einer Schichtdicke von j eweils 30cm verwendet .
Zum Einen werden nun vertikale Flächenelemente FVj ( j=l , ...M) als Sicht- oder Bewegungshindernisse ermittelt . Diese Sicht- oder Bewegungshindernisse werden in der Regel Wände , Raumteiler oder hohe Möbelstücke wie Schränke und dergleichen repräsentieren . Zum Anderen werden horizontale Flächenelemente Fhk ( k=l , ...P) oder eine Gesamtheit aneinandergrenzender hori zontaler Flächenelemente Fhk in derselben Schichtlage als Sicht- oder Bewegungshindernisse ermittelt , falls in deren Umfangsbereich horizontale Nebenflächenelemente Fn auffindbar sind, die um mehr als eine Schichtlage unterhalb des horizontalen Flächenelements Fhk oder der Gesamtheit aneinandergrenzender hori zontaler Flächenelemente Fhk liegen . Diese Sicht- oder Bewegungshindernisse werden in der Regel niedrige Möbelstücke wie Tische und dergleichen repräsentieren, im Beispiel der Fig . 5 ist etwa ein Tisch angedeutet . Die so als Sicht- oder Bewegungshindernis identifizierte Gesamtheit aneinandergrenzender hori zontaler Flächenelemente Fhk können etwa einen Höhenabstand von 90-120 cm von der Bodenfläche N auf eisen, wie im Beispiel der Fig . 5 . Diese Schichtung ermöglicht es zudem, dass hori zontale Flächenelemente Fhj. ( 1=1 , ...Q) , die sich in vertikal aufeinanderfolgenden Schichtlagen Si befinden, als Stufen identifi ziert werden können, wie ebenfalls in der Fig . 5 angedeutet ist . In diesem Sonderfall werden horizontale Flächenelemente Fhi als Sichthindernisse , nicht aber als Bewegungshindernisse interpretiert .
Horizontale Faces werden somit als Sit z- oder Tischflächen, Böden und ähnliches kategorisiert . Vertikale Faces werden hingegen als Wände und somit als nicht passierbare Sicht- oder Bewegungshindernisse kategorisiert . Durch Proj ektionen der Vertices und der Faces auf eine 2D-Fläche lässt sich ein Plan der gescannten Umgebung erstellen . Ein Beispiel eines solchen Plans ist in Figur 3 zu sehen . Anhand der Höhe und Ausrichtung der Normalvektoren der Faces kann die Visualisierung der Faces verfeinert werden, um Höhenunterschiede zwischen den Sichtoder Bewegungshindernissen hervorheben .
Die Gesamtheit aneinandergrenzender horizontaler Flächenelemente Fhi einer untersten Schichtlage kann als Bodenfläche N bewertet werden . Jener Anteil der Bodenfläche N, der in vertikaler Proj ektion frei von Sicht- oder Bewegungshindernisse ist , wird in weiterer Folge als Freibereich bezeichnet . Dieser Freibereich liegt im digitalen Abbild als Gesamtheit entsprechender Knotenpunkte ( „mesh" ) vor, die in weiterer Folge als so genanntes „Navigation mesh" zur Bewegungssteuerung eines virtuellen Obj ekts ( „Avatar" ) verwendet werden kann . Hierfür sind so genannte „3D-Echt zeit- Engines" bekannt , die anhand eines solchen „Navigation mesh" die Bewegungssteuerung von als Bewegtbild animierten virtuellen Obj ekten ( „Avatare" ) vornehmen, wie in weiterer Folge anhand der Fig . 6 erläutert wird .
Die Fig . 6 zeigt den Grundriss eines Gebäudeinneren analog zur Fig . 2 . Die Fig . 6 zeigt des Weiteren die momentane Position eines Benutzers B mit einer Wiedergabeeinheit 1 , mit der ihm ein virtuelles Obj ekt V eingeblendet wird . Der Grundriss liegt als digitales Abbild beispielsweise aufgrund eines bekannten Gebäudeplans vor, oder wurde durch vorheriges Durchschreiten anhand der mitgeführten 3D-Kameras erstellt . Das digitale Abbild wird in beiden Fällen wie erwähnt anhand der mitgeführten 3D-Kameras laufend aktualisiert und durch die Detektion der Anwesenheit und Positionierung von Gegenständen wie Möbel und dergleichen präzisiert .
Des Weiteren wird auf externe Sensoren 3 zugegriffen . In der Fig . 6 ist beispielsweise ein Bewegungssensor in einem Raum im linken oberen Bereich des Gebäudeplans eingezeichnet , der als externer Sensor 3 dient . Dieser Sensor 3 detektiert die Anwesenheit sich bewegender Obj ekte oder Personen und liefert ein Signal bei Anwesenheit sich bewegender Obj ekte oder Personen . Der externe Sensor 3 ist mit der zentralen Datenverarbeitungseinheit 2 verbunden, in der das vom Sensor 3 gelieferte Signal verarbeitet wird . Vorzugsweise erfolgt die Verarbeitung der mittels der Sensoren 3 gewonnenen sichtfeldbezogenen Zustandsdaten in der zentralen Datenverarbeitungseinheit 2 mithilfe eines künstlichen neuronalen Net zwerks . Ein solches künstlich neuronales Netzwerk wird auch als „Künstliche Intelligenz" oder „KI" bezeichnet .
Die zentrale Datenverarbeitungseinheit 2 steuert ferner das Einblenden des computergenerierten, virtuellen Obj ektes V in das vom Benutzer B wahrgenommene Sichtfeld gemäß der momentanen Sichtachsen des Benutzers B unter Berücksichtigung der Anwesenheit von Sicht- oder Bewegungshindernissen wie oben beschrieben . Eine Möglichkeit besteht etwa darin das computergenerierte virtuelle Obj ekt V mit einem antropomorphen Aussehen aus zustatten, das als Bewegtbild so animiert wird, dass auf die Eingabe von Sprachbefehlen des Benutzers B reagiert wird . Ein solches virtuelles Obj ekt V wird im Folgenden auch als Avatar bezeichnet . Auf diese Weise wird für den Benutzer der Eindruck einer Interaktion erzeugt . Um eine korrekte Bewegung des virtuellen Obj ekts V im Sichtfeld des Benut zers B sicherzustellen, wird auf die oben beschriebene Bodenfläche N des digitalen Abbilds des Gebäudeplans der Fig . 6 als Gesamtheit aneinandergrenzender horizontaler Flächenelemente Fhi einer untersten Schichtlage zurückgegriffen, die in vertikaler Proj ektion frei von Sichtoder Bewegungshindernisse ist . Dieser Freibereich liegt im digitalen Abbild als „Navigation mesh" vor, mit dem mithilfe eigener Software , etwa die oben erwähnten „3D-Echt zeit- Engines" , eine Bewegungssteuerung des als Bewegtbild animierten virtuellen Obj ektes V vorgenommen wird . Das „Navigation mesh" kann dabei in vorgegebenen Zeitabständen erneuert werden, um auf zwischenzeitlich verschobene Obj ekte wie Stühle und dergleichen reagieren zu können . Auf diese Weise kann aufgrund des iterativ präzisierten digitalen Abbildes und der Animation durch die zentrale Datenverarbeitungseinheit 2 eine lebensecht scheinende Bewegung des virtuellen Obj ekts V unter Vermeidung von Bewegungshindernissen und eine korrekte Verdeckungsrechnung für das Einblenden des virtuellen Obj ekts V in Abhängigkeit von Sichthindernissen vorgenommen werden .
Im vorliegenden Beispiel der Fig . 6 könnte es sich etwa um ein Szenario für Einsat zkräfte der Polizei handeln . Der Benutzer B ist Teil der Einsatzkräfte und befindet sich in einem Gebäude , in dem ein bewaffneter Täter vermutet wird . Der Auftrag lautet das Gebäude zu durchsuchen, unbeteiligte Personen zu evakuieren und den Täter zu stellen . Der Benutzer B ist hierfür mit der Wiedergabeeinheit 1 ausgerüstet , die mit der zentralen Datenverarbeitungseinheit 2 verbunden ist , sodass auch seine Position der zentralen Datenverarbeitungseinheit 2 j ederzeit bekannt ist . Die zentrale Datenverarbeitungseinheit 2 ist des Weiteren mit externen Sensoren 3 verbunden, beispielsweise mit dem in der Fig . 6 dargestellten Bewegungssensor .
Der Sensor 3 liefert nun ein Signal für die Anwesenheit einer Person im linken oberen Raum des Gebäudeplans an die zentrale Datenverarbeitungseinheit 2 . Die zentrale Datenverarbeitungseinheit 2 detektiert die Möglichkeit , dass es sich um den bewaffneten Täter handeln könnte , sowie die Nähe des Benut zers B , dessen Sichtfeld bei Verlassen seines in der Fig . 6 gezeigten, momentanen Standortes in das Schussfeld des möglichen Täters gelangen könnte . Die zentrale Datenverarbeitungseinheit 2 übermittelt somit eine Warnung an die Wiedergabeeinheit 1 als sicherheitsrelevante Zustandsdaten „Sicht feld könn te das mögliche Schussf ld einer unbekannten Person queren" und steuert die Wiedergabe dieser Zustandsdaten mit Unterstüt zung des virtuellen Obj ekts V . Das als Avatar ausgeführte virtuelle Obj ekt V könnte sich etwa unter gleichzeitiger akustischer Wiedergabe der Warnung über einen vom Benutzer B getragenen Ohrlautsprecher zum Benut zer B wenden .
In weiterer Folge kann die mit künstlicher Intelligenz versehene zentrale Datenverarbeitungseinheit 2 auch bei der weiteren Handlungsplanung unterstützen . So kann anhand der gestellten Aufgabe unbeteiligte Personen zu evakuieren und den Täter zu stellen eine bessere Positionierung des Benut zers B überlegt werden . Die zentrale Datenverarbeitungseinheit 2 errechnet hierfür mögliche Bewegungspfade P innerhalb der Freibereiche unter Einbeziehung der Zustandsdaten, also unter Verringerung eines möglichen Sicherheitsrisikos entlang eines Bewegungspfades P , das sich durch das Queren eines möglichen Schussfeldes der nicht identifi zierten Person einstellen könnte . Andererseits sollte der Bewegungspfad P auch die Identifi zierung einer unbeteiligten Person erlauben . Der optimale Bewegungspfad P ist j ener , bei dem sich also beispielsweise ein kleinstmögliches Sicherheitsrisiko einstellt , der aber dennoch eine Identifizierung der Person im linken oberen Raum gestattet . Dieser optimale Bewegungspfad P ist in der Fig . 6 eingezeichnet und kann dem Benutzer B als möglicher Bewegungspfad P vorgeschlagen werden . Die Wiedergabe kann wiederum über das als Avatar ausgeführte virtuelle Obj ekt V erfolgen, indem sich der Avatar beispielsweise über entsprechende Handbewegungen bemerkbar macht und dem Benut zer B entweder über eine akustische Wiedergabe über einen Ohrlautsprecher oder lautlos über Handbewegungen ein mögliches Verlassen der Position und die geplante Bewegungsrichtung vorschlägt . Der Benut zer B kann seine Zustimmung durch den mündlich artikulierten Eingabebefehl „OK" signalisieren, der von einem vom Benutzer B mitgeführten Mikrofon der zentralen Datenverarbeitungseinheit 2 übermittelt wird . Die zentrale Datenverarbeitungseinheit 2 startet daraufhin die Animation des virtuellen Obj ekts V in Form einer Bewegung entlang des errechneten optimalen Bewegungspfades P . Die Navigation des Benutzers B entlang des errechneten optimalen Bewegungspfades P kann somit einfach dadurch erfolgen, indem der Benutzer B dem Avatar folgt .
Mithilfe der Erfindung wird somit ein Verfahren bereitgestellt , bei dem unter Nut zung von „Augmented-Reality" -Systemen beispielsweise im Rahmen eines sicherheits kritischen Einsatzes ein Maximum an situationsbezogenen Daten gewonnen und einem Benut zer B benut zerfreundlich bereitgestellt werden kann . Anwendungen der Erfindung sind dabei auch im privaten Bereich denkbar, indem von einem personalisierten Avatar sichtfeldbezogene Zustandsdaten von externen Sensoren für den Benut zer B erhoben werden und in Form einer interaktiven und dialogbasierten Wiedergabe erfindungsgemäß bereitgestellt werden .

Claims

Patentansprüche :
1 . Verfahren zum Einblenden eines computergenerierten, virtuellen Obj ektes (V) in das von einem Benut zer ( B) wahrgenommene Sichtfeld einer realen Umgebung, insbesondere in das Sichtfeld einer vom Benutzer ( B) getragenen, transparenten Wiedergabeeinheit ( 1 ) , wobei das Einblenden des virtuellen Obj ekts (V) mittels einer zentralen Datenverarbeitungseinheit ( 2 ) in Abhängigkeit von der momentanen Position und der Blickrichtung des Benutzers ( B ) erfolgt , und das Einblenden des virtuellen Obj ekts (V) zusätzlich in Abhängigkeit von der Anwesenheit von Sicht- oder Bewegungshindernissen erfolgt , wobei die Sicht- oder Bewegungshindernisse von der zentralen Datenverarbeitungseinheit ( 2 ) anhand eines digitalen Abbilds von Oberflächen der realen Umgebung ermittelt werden, dadurch gekennzeichnet, dass mittels einer zur Messung von Tiefeninformation fähigen Kamera von dem der momentanen Position und Blickrichtung entsprechenden Sichtfeld des Benutzers ( B) 3D-Bilder angefertigt werden, aus denen von der zentralen Datenverarbeitungseinheit ( 2 ) mithilfe bekannter mathematischer Verfahren in vorgegebenen Zeitabständen wiederholt ein aktualisiertes digitales Abbild von Oberflächen der realen Umgebung und somit der Sicht- oder Bewegungshindernisse im Sichtfeld ermittelt wird, und mittels Sensoren ( 3 ) sichtfeldbezogene Zustandsdaten gewonnen werden, die in der zentralen Datenverarbeitungseinheit ( 2 ) verarbeitet werden, wobei mithilfe des virtuellen Obj ekts (V) eine für den Benutzer ( B) interaktive und dialogbasierte Wiedergabe der sensorgestützten, sichtfeldbezogenen Zustandsdaten im Sichtfeld des Benutzers ( B ) erfolgt .
2 . Verfahren nach Anspruch 1 , dadurch gekennzeichnet, dass der benut zerseitige Befehl zur Wiedergabe von Zustandsdaten oder des virtuellen Obj ekts (V) mithilfe einer sprachgesteuerten Eingabeschnittstelle zur zentralen Datenverarbeitungseinheit ( 2 ) erfolgt .
3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass ein automatisierter Abruf von Zustandsdaten in denselben vorgegebenen Zeitabständen oder in anderen vorgegebenen Zeitabständen wie jenen der wiederholten Aktualisierungen des digitalen Abbildes erfolgt.
4. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, dass die Verarbeitung der mittels Sensoren (3) gewonnenen sichtfeldbezogenen Zustandsdaten in der zentralen Datenverarbeitungseinheit (2) mithilfe eines künstlichen neuronalen Netzwerks („KI") erfolgt.
5. Verfahren nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, dass im digitalen Abbild horizontale Freibereiche ermittelt werden, die in vertikaler Projektion frei von Sicht- oder Bewegungshindernissen sind, und eine im Sichtfeld des Benutzers (B) zu vollziehende Bewegung des virtuellen Objekts (V) von einem Anfangsort zu einem Zielort von der zentralen Datenverarbeitungseinheit (2) in Form eines kürzesten und innerhalb der Freibereiche liegenden Bewegungspfades (P) errechnet wird.
6. Verfahren nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, dass im digitalen Abbild horizontale Freibereiche ermittelt werden, die in vertikaler Projektion frei von Sicht- oder Bewegungshindernissen sind, und eine im Sichtfeld des Benutzers (B) zu vollziehende Bewegung des virtuellen Objekts (V) von einem Anfangsort zu einem Zielort von der zentralen Datenverarbeitungseinheit (2) in Form eines innerhalb der Freibereiche liegenden Bewegungspfades (P) unter Einbeziehung der sensorgestützten Zustandsdaten als Randbedingung errechnet wird.
7. Vorrichtung umfassend eine tragbare, transparente Wiedergabeeinheit (1) zum Einblenden eines computergenerierten, virtuellen Objektes (V) in das von einem Benutzer (B) wahrgenommene Sichtfeld einer realen Umgebung, insbesondere in das Sichtfeld der vom Benutzer (B) getragenen, transparenten Wiedergabeeinheit (1) , sowie eine mit der Wiedergabeeinheit (1) verbundene zentrale Datenverarbeitungseinheit (2) zum Generieren und Einblenden des virtuellen Objektes (V) in das vom Benutzer (B) wahrgenommene Sichtfeld einer realen Umgebung, dadurch gekennzeichnet, dass zumindest eine zur Messung von Tiefeninformation fähige Kamera zur Anfertigung von 3D-Bildern von dem der momentanen Position und Blickrichtung entsprechenden Sichtfeld des Benutzers (B) vorgesehen ist, und die zentrale Datenverarbeitungseinheit (2) ausgelegt ist aus den 3D- Bildern mithilfe bekannter mathematischer Verfahren in vorgegebenen Zeitabständen wiederholt ein aktualisiertes digitales Abbild von Oberflächen der realen Umgebung im Sichtfeld zu ermitteln, und Sensoren (3) zur Ermittlung sichtfeldbezogener Zustandsdaten vorgesehen sind, die mit der zentralen Datenverarbeitungseinheit (2) verbunden sind, wobei mithilfe des virtuellen Objekts (V) eine für den Benutzer (B) interaktive und dialogbasierte Benutzerschnittstelle zur Wiedergabe der sensorgestützten, sichtfeldbezogenen Zustandsdaten im Sichtfeld des Benutzers (B) verwirklicht ist.
8. Vorrichtung nach Anspruch 7, dadurch gekennzeichnet, dass für den benutzerseitigen Befehl zur Wiedergabe von Zustandsdaten oder des virtuellen Objekts (V) eine sprachgesteuerte Eingabeschnittstelle zur zentralen Datenverarbeitungseinheit (2) vorgesehen ist.
9. Vorrichtung nach Anspruch 7 oder 8, dadurch gekennzeichnet, dass ein künstliches neuronales Netzwerk („KI") zur Verarbeitung der mittels Sensoren (3) gewonnenen sichtfeldbezogenen Zustandsdaten in der zentralen Datenverarbeitungseinheit (2) vorgesehen ist.
EP23757283.9A 2023-02-07 2023-08-17 Verfahren und vorrichtung zum einblenden eines virtuellen objekts Pending EP4661979A1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
ATA50072/2023A AT526915A2 (de) 2023-02-07 2023-02-07 Verfahren und vorrichtung zum einblenden eines virtuellen objekts
PCT/EP2023/072666 WO2024165190A1 (de) 2023-02-07 2023-08-17 Verfahren und vorrichtung zum einblenden eines virtuellen objekts

Publications (1)

Publication Number Publication Date
EP4661979A1 true EP4661979A1 (de) 2025-12-17

Family

ID=87695835

Family Applications (1)

Application Number Title Priority Date Filing Date
EP23757283.9A Pending EP4661979A1 (de) 2023-02-07 2023-08-17 Verfahren und vorrichtung zum einblenden eines virtuellen objekts

Country Status (3)

Country Link
EP (1) EP4661979A1 (de)
AT (1) AT526915A2 (de)
WO (1) WO2024165190A1 (de)

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020196202A1 (en) 2000-08-09 2002-12-26 Bastian Mark Stanley Method for displaying emergency first responder command, control, and safety information using augmented reality
US20020191004A1 (en) 2000-08-09 2002-12-19 Ebersole John Franklin Method for visualization of hazards utilizing computer-generated three-dimensional representations
US20030210228A1 (en) 2000-02-25 2003-11-13 Ebersole John Franklin Augmented reality situational awareness system and method
EP3401815B1 (de) 2017-05-09 2022-12-21 Dassault Systèmes Bestimmung einer architektonischen gestaltung
WO2019141879A1 (en) 2018-01-22 2019-07-25 The Goosebumps Factory Bvba Calibration to be used in an augmented reality method and system
US11257268B2 (en) 2018-05-01 2022-02-22 Magic Leap, Inc. Avatar animation using Markov decision process policies
US10650600B2 (en) * 2018-07-10 2020-05-12 Curious Company, LLC Virtual path display
US11176757B2 (en) 2019-10-02 2021-11-16 Magic Leap, Inc. Mission driven virtual character for user interaction
KR20210069806A (ko) 2019-12-04 2021-06-14 주식회사 이토이랩 휴대단말기의 인공 지능 신경망을 이용한 실상 및 가상의 정합 방법 및 그 장치
AT523953A2 (de) 2020-06-30 2022-01-15 Thomas Peterseil Verfahren zum einblenden eines virtuellen objektes
WO2022004422A1 (ja) 2020-07-02 2022-01-06 ソニーグループ株式会社 情報処理装置、情報処理方法、及び記録媒体

Also Published As

Publication number Publication date
AT526915A2 (de) 2024-08-15
WO2024165190A1 (de) 2024-08-15

Similar Documents

Publication Publication Date Title
JP6499154B2 (ja) 拡張現実および仮想現実のためのシステムおよび方法
CN110493568B (zh) 基于室内摄像头的智能消防监控与救援方法
DE102005013225A1 (de) Objektverfolgungs- und Situationsanalysesystem
CN116820252B (zh) 一种基于vr的多人虚拟现场巡检培训系统及培训方法
CN102834848B (zh) 用于监视场景中的活动重点的可视化的方法
WO2022042802A1 (de) Fluchtleitsystem mit fluchthaube
CN108376198B (zh) 一种基于虚拟现实的人群仿真方法及系统
Bosse et al. Agent-based analysis of patterns in crowd behaviour involving contagion of mental states
DE102013100569A1 (de) Verfahren und Vorrichtung zur Anzeige einer Fahrzeugumgebung
EP1262213A1 (de) Verfahren zur Ortung eines Gegenstandes, einer Person und/oder eines Teiles davon
EP4172729B1 (de) Verfahren zum einblenden eines virtuellen objektes
WO2024165190A1 (de) Verfahren und vorrichtung zum einblenden eines virtuellen objekts
JP6811323B2 (ja) 情報処理システム、プレイヤ側装置、制御方法、及びプログラム
Roan Developing an agent-based evacuation simulation model based on the study of human behaviour in fire investigation reports
EP2940624B1 (de) Dreidimensionales virtuelles Modell einer Umgebung für Anwendungen zur Positionsbestimmung
DE102011009952A1 (de) Verfahren zum Bestimmen der Position und Lage eines Astronauten
CN117133164A (zh) 一种消防训练系统
VanVoorst et al. Fusion of LIDAR and video cameras to augment medical training and assessment
JP2021043135A (ja) 放射線量分布表示システムおよび放射線量分布表示方法
DE102020122369B3 (de) Fluchtleitsystem mit Fluchthaube
DE102004044002A1 (de) Echtzeit-Bewegungsanalysevorrichtung
DE20304906U1 (de) Vorrichtung zum Ermitteln von Objekten
EP4147439B1 (de) Kommunikationssystem und verfahren zur kommunikation zwischen wenigstens zwei orten
DE102022133163B4 (de) Multiplayer-System und Verfahren dazu
WO2005088541A1 (de) Echtzeit-bewegungsanalysevorrichtung

Legal Events

Date Code Title Description
STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: UNKNOWN

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE INTERNATIONAL PUBLICATION HAS BEEN MADE

PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: REQUEST FOR EXAMINATION WAS MADE

17P Request for examination filed

Effective date: 20250730

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC ME MK MT NL NO PL PT RO RS SE SI SK SM TR