ES2688643T3

ES2688643T3 - Aparato y método de realidad aumentada

Info

Publication number: ES2688643T3
Application number: ES13774768.9T
Authority: ES
Inventors: Christopher George KNIGHT; James Patrick RILEY
Original assignee: 2MEE Ltd
Current assignee: 2MEE Ltd
Priority date: 2012-09-12
Filing date: 2013-09-12
Publication date: 2018-11-06
Anticipated expiration: 2033-09-12
Also published as: GB201316229D0; EP2896200A1; EP2896200B1; CN104904195A; CN104904195B; US20150242688A1; WO2014041352A1; HK1212845A1; GB2508070A; GB201216210D0; US11361542B2; IN2015DN02252A; GB2508070B; US20210166030A1; US10885333B2

Abstract

Un aparato para visualizar una realidad aumentada en una pantalla de un dispositivo portátil (10) que tiene una cámara, el aparato que comprende una unidad de identificación del contexto para identificar una vista de la cámara de al menos una imagen real capturada por la cámara, una unidad de recuperación de imagen virtual para seleccionar y visualizar una imagen virtual (14) en la pantalla y una unidad de posicionamiento de imagen virtual para posicionar la imagen virtual en la pantalla, caracterizado porque el aparato se dispone durante el uso para visualizar la imagen virtual, que comprende el contenido de una imagen de video del mundo real capturada electrónicamente desde una realidad diferente, que se corta de esa realidad diferente y se trasplanta a la capturada por la cámara, mientras el usuario ve la imagen capturada por la cámara y en donde el posicionamiento de la imagen virtual por la unidad de posicionamiento incluye anclar la imagen virtual, y dimensionar la imagen virtual, con respecto a la vista de la cámara determinada por la unidad de identificación de contexto, para crear la ilusión de que el contenido de la imagen virtual está presente en el campo de visión de la cámara en tiempo real en la pantalla.

Description

5

10

15

20

25

30

35

40

45

50

55

60

65

DESCRIPCION

Aparato y método de realidad aumentada

La presente invención se refiere a un aparato y a un método para proporcionar una experiencia de realidad aumentada, y se refiere particularmente a un aparato y a un método para proporcionar una experiencia de realidad aumentada en un dispositivo portátil que tiene una cámara.

La realidad aumentada, en la cual se mejora la visualización de un entorno del mundo real mediante el uso de entradas generadas por ordenadores, está disponible en varias plataformas, que incluye pantallas de televisión, pantallas táctiles, y hasta cierto punto, dispositivos portátiles como teléfonos móviles.

El uso de dispositivos portátiles, como teléfonos móviles, como cámaras se ha mejorado con la disponibilidad de pequeños programas descargables especializados, conocidos informalmente como aplicaciones. Muchos de estos incluyen efectos visuales generados por ordenadores que pueden combinarse con una "vista en vivo" a través de la cámara, para proporcionar al usuario un grado de realidad aumentada para una imagen mejorada o entretenimiento. Sin embargo, la incorporación de secuencias de video en la vista en vivo de una cámara demuestra ser difícil debido a la capacidad de procesamiento limitada disponible en la mayoría de los dispositivos portátiles, y la falta de una base de código funcional provista con las estructuras incorporadas.

El documento WO 2012/109182 A1 describe un dispositivo informático móvil que incluye un módulo de captura de video para capturar una secuencia de video, un módulo de sistema de posicionamiento global (GPS) para generar información geográfica asociada con los cuadros de la secuencia de video que capturará el dispositivo de captura de video, y un módulo de procesamiento de video para analizar los cuadros de la secuencia de video y extraer las características de los puntos de interés incluidos en los cuadros. El procesamiento de video se configura para transmitir las características de los puntos de interés y la información geográfica a un servidor y para recibir información de aumento desde el servidor mediante el uso de comunicación inalámbrica. El módulo de procesamiento de video usa la información de aumento para superponer los cuadros de la secuencia de video para generar una secuencia de video aumentada.

El documento WO 2012/001218 A1 describe un aparato para proporcionar un nivel constante de información en un entorno de realidad aumentada que puede incluir un procesador y memoria que almacena un código de programa informático ejecutable que hace que el aparato realice al menos operaciones que incluyen la determinación de un primer número de puntos de interés asociado con un primer conjunto de objetos del mundo real de una(s) ubicación(es) actual(es). El primer conjunto de objetos del mundo real se muestra actualmente. El código de programa informático puede provocar además que el aparato determine si el primer número está por debajo de un umbral predeterminado y puede aumentar el rango de visión de un dispositivo para visualizar un segundo conjunto de objetos del mundo real. El rango de visión puede aumentarse para aumentar el primer número a un segundo número de puntos de interés que corresponde al umbral, en base a determinar que el primer número está por debajo del umbral. También se proporcionan métodos y productos de programa informático correspondientes.

El documento US 2010/0309225 A1 describe un sistema y método para la realidad aumentada móvil. En ciertas modalidades, se adquiere una primera imagen en un dispositivo. La información correspondiente con al menos una segunda imagen que coincide con la primera imagen se obtiene de un servidor. Una imagen mostrada en el dispositivo se aumenta con la información obtenida.

Las modalidades de la presente invención pretenden proporcionar un aparato y un método para incorporar una imagen aparentemente en movimiento en una vista de cámara en vivo de un dispositivo portátil.

La presente invención se define en las reivindicaciones independientes adjuntas a las que se debe hacer ahora referencia. Además, las características preferidas se pueden encontrar en las subreivindicaciones adjuntas a la misma.

De acuerdo con un aspecto de la presente invención se proporciona un aparato para visualizar una realidad aumentada en una pantalla de un dispositivo portátil que tiene una cámara, el aparato que comprende una unidad de identificación del contexto para identificar un contexto de al menos una imagen real capturada por el dispositivo, una unidad de recuperación de imagen virtual para seleccionar y visualizar una imagen virtual en la pantalla y una unidad de posicionamiento de imagen virtual para posicionar la imagen virtual en la pantalla, en donde el aparato se dispone para visualizar una imagen virtual que comprende una imagen del mundo real móvil, capturada electrónicamente.

Preferentemente la imagen virtual es una que se ha almacenado previamente.

En una disposición preferida la imagen virtual comprende una secuencia de imágenes fijas tomadas de un video en movimiento.

Alternativa o adicionalmente la imagen virtual puede comprender una imagen de video en movimiento continuo.

5

10

15

20

25

30

35

40

45

50

55

60

65

La imagen virtual puede comprender una imagen de una persona o criatura, o podría ser cualquier otro objeto o elemento del "mundo real".

En una disposición preferida, la unidad de identificación de contexto se dispone durante el uso para identificar un contexto mediante la comparación en una disposición preferida, la unidad de identificación de contexto se dispone durante el uso para identificar un contexto mediante la comparación de al menos un objeto en un campo de visión con los datos almacenados de una pluralidad de objetos. La unidad de recuperación de imágenes se dispone preferentemente para seleccionar una imagen a partir de una pluralidad de imágenes almacenadas de acuerdo con la información del contexto determinada por la unidad de identificación del contexto. La unidad de posicionamiento se dispone preferentemente durante el uso para posicionar la imagen virtual de acuerdo con la información del contexto determinada por la unidad de identificación del contexto.

El posicionamiento de la imagen por la unidad de posicionamiento incluye el dimensionamiento de la imagen en la pantalla, e incluye el anclaje de la imagen en la pantalla, con respecto a la información del contexto determinada por la unidad de identificación del contexto.

La unidad de identificación del contexto, y/o la unidad de recuperación de imagen virtual, y/o la unidad de posicionamiento de imagen virtual pueden comprender procesos dispuestos durante el uso que van a realizarse por uno o más dispositivos de procesamiento electrónico.

La invención incluye además un método para visualizar una realidad aumentada en una pantalla de un dispositivo portátil que tiene una cámara, el método que comprende identificar un contexto de al menos una imagen real capturada por el dispositivo y seleccionar y posicionar una imagen virtual en la pantalla, en donde el método comprende visualizar una imagen virtual que comprende una imagen del mundo real móvil, capturada electrónicamente.

Preferentemente la imagen virtual es una que se ha almacenado previamente.

En una disposición preferida, la imagen virtual comprende una secuencia de imágenes fijas tomadas de un video en movimiento.

En una disposición preferida el método comprende identificar un contexto comparando al menos un objeto en el campo de visión con los datos almacenados de una pluralidad de objetos. El método preferentemente comprende seleccionar una imagen de una pluralidad de imágenes almacenadas de acuerdo con la información del contexto determinada. El método comprende además posicionar la imagen virtual de acuerdo con la información del contexto determinada por la unidad de identificación del contexto.

El posicionamiento de la imagen por la unidad de posicionamiento incluye el dimensionamiento de la imagen en la pantalla e incluye el anclaje de la imagen en la pantalla con respecto a la información del contexto determinada por la unidad de identificación del contexto.

La invención comprende además un programa para hacer que un dispositivo realice un método para visualizar una realidad aumentada en una pantalla de un dispositivo portátil que tiene una cámara, el método que comprende identificar un contexto de al menos una imagen real capturada por el dispositivo y seleccionar y posicionar una imagen virtual en la pantalla, en donde el método comprende visualizar una imagen virtual que comprende una imagen del mundo real móvil, capturada electrónicamente.

El programa puede contenerse dentro de una aplicación. La aplicación también puede contener datos, tales como datos de imágenes virtuales.

La invención comprende además un producto de programa informático, que almacena, transporta o transmite a través de él o a través de un programa para hacer que un dispositivo realice un método de visualización de una realidad aumentada en una pantalla de un dispositivo portátil que tenga una cámara, el método que comprende identificar un contexto desde al menos una imagen real capturada por el dispositivo y seleccionar y posicionar una imagen virtual en la pantalla, en donde el método comprende visualizar una imagen virtual que comprende una imagen del mundo real en movimiento capturada electrónicamente.

La imagen virtual puede comprender una secuencia de imágenes fijas tomadas de un video en movimiento.

La presente invención puede comprender cualquier combinación de las características o limitaciones a las que se hace referencia en la presente descripción, excepto la combinación de características que son mutuamente excluyentes.

Las modalidades preferidas de la presente invención se describirán ahora solo a manera de ejemplo con referencia a los dibujos esquemáticos acompañantes en los que:

La Figura 1 muestra una imagen virtual superpuesta a una vista de cámara de una imagen real, de acuerdo con una modalidad preferida de la presente invención;

5

10

15

20

25

30

35

40

45

50

55

60

65

La Figura 2 muestra esquemáticamente una primera etapa en un proceso de reconocimiento del contexto de acuerdo con una modalidad de la presente invención;

Las Figuras 3 y 3a muestran esquemáticamente una primera etapa alternativa en un proceso de reconocimiento del contexto, en el que hay múltiples objetos visibles en la vista en vivo de la cámara;

La Figura 4 muestra esquemáticamente una técnica de animación para su uso con una modalidad de la presente invención;

La Figura 5 muestra esquemáticamente un proceso de posicionamiento de acuerdo con una modalidad de la presente invención;

La Figura 6 muestra los controles de usuario esquemáticamente opcionales para una imagen virtual, de acuerdo con una modalidad de la presente invención;

La Figura 7 muestra una primera etapa en un proceso de anclaje para la imagen de la Figura 6;

La Figura 8 muestra una etapa adicional en el proceso de anclaje de la Figura 7;

La Figura 9 muestra esquemáticamente un proceso de anclaje alternativo de acuerdo con una modalidad de la presente invención;

La Figura 10 muestra esquemáticamente un proceso de redimensionamiento automático para una imagen virtual, de acuerdo con una modalidad de la presente invención;

La Figura 11 muestra esquemáticamente un proceso de redimensionamiento automático para una imagen virtual en un escenario alternativo;

Las Figuras 12-15 muestran esquemáticamente diferentes etapas en un proceso para tomar una fotografía que incorpora tanto una imagen real como una imagen virtual, de acuerdo con una modalidad de la presente invención;

La Figura 16 muestra esquemáticamente un proceso para adquirir secuencias de video que incorporan imágenes tanto reales como virtuales; y

La Figura 17 es un diagrama de flujo esquemático que muestra algunas etapas clave en el proceso de visualizar una imagen virtual en la vista en vivo de una cámara, de acuerdo con una modalidad de la presente invención.

La modalidad descrita a continuación pretende proporcionar una experiencia de realidad aumentada a un usuario de un dispositivo portátil, tal como un teléfono móvil, que incorpora un procesador electrónico, una cámara y una pantalla. En particular, las imágenes tomadas de secuencias de video se muestran en una pantalla de un dispositivo portátil junto con una vista de cámara en vivo, para crear la ilusión de que el sujeto del video - es decir, la imagen en movimiento virtual - está presente en el campo de visión de la cámara en tiempo real.

En este contexto el término imagen del "mundo real" significa una imagen tomada de la realidad, tal como un escenario físico, del mundo real que utiliza una técnica de captura de fotos electrónica, por ejemplo, grabación de video.

Para lograr esto, el dispositivo debe realizar varios procesos, que incluyen adquirirla información contextual desde la vista de la cámara, obtener una imagen virtual apropiada, posicionar la imagen virtual dentro de la vista de la cámara, anclar la imagen virtual con respecto al contexto y dimensionar la imagen virtual dentro de la vista de la cámara.

Los procesos pueden realizarse por un procesador electrónico del dispositivo portátil.

Los datos necesarios para la reconstrucción de la imagen en movimiento virtual, junto con uno o más programas para facilitar los procesos necesarios para manipularlos para proporcionar la experiencia de realidad aumentada, se pueden descargar a un dispositivo portátil en la forma de un programa especializado, o una aplicación de software, conocida ampliamente como una aplicación. La aplicación puede actualizarse preferentemente para presentar al usuario nuevas experiencias de visualización.

El primer ejemplo que se describe en detalle a continuación es el de un sistema de realidad aumentada para su uso como guía de atracción para el visitante, en el que se muestra una imagen virtual de una figura dentro de la vista de la cámara del mundo real para proporcionar información, a través de un archivo de audio asociado, sobre la atracción al objeto 12. El dispositivo reconoce el objeto, en este caso una estatua, basado en un conjunto único de puntos de la matriz 12a que se han almacenado en la aplicación descargada en una etapa anterior, y que pueden proporcionar al dispositivo la información contextual necesaria para la selección posterior, visualización y manipulación de la imagen virtual 14.

Las imágenes virtuales en movimiento 14 se almacenan en el dispositivo como secuencias de imágenes fijas tomadas de un archivo de video, y se sincronizan con un archivo de audio apropiado, cuando se descarga la aplicación y se elige la apropiada después de que se haya determinado el contexto.

Volviendo a la Figura 2, esta muestra la imagen virtual elegida 14 tal como se muestra en la vista de la cámara del dispositivo, al lado del objeto 12.

La Figura 3 muestra esquemáticamente el escenario en el que se detectan múltiples objetos por el dispositivo. En este caso se detecta el objeto 12 y además otros dos objetos 16 y 18. El dispositivo muestra los tres objetos junto con los

5

10

15

20

25

30

35

40

45

50

55

60

65

respectivos botones virtuales superpuestos al mismo de manera que el usuario pueda seleccionar el objeto de interés tocando el botón apropiado en la pantalla, como se muestra en la Figura 3a.

La Figura 4 muestra esquemáticamente un método para animar una imagen virtual. Utiliza una técnica establecida desde hace mucho tiempo para cortar una imagen en movimiento en una sucesión de 20 cuadros fijos en un fondo de pantalla verde (no se muestra). Luego el dispositivo reproduce la secuencia de imágenes fijas, eliminando automáticamente el fondo de pantalla verde según sea necesario. A medida que las imágenes individuales se reemplazan a una velocidad superior a seis cuadros por segundo, el ojo humano las interpreta como una imagen en movimiento continuo. Una banda sonora, opcionalmente en formato MP3, se reproduce en sincronía con la animación para reforzar la ilusión de secuencias de video continuas. En este ejemplo la figura animada es un soldado romano, cuyos comentarios y acciones son relevantes para la atracción que se ve a través de la pantalla de la cámara.

La Figura 5 muestra esquemáticamente una técnica para posicionar la imagen 14 con respecto al objeto 12. Durante la creación de una aplicación en particular, cuando la escena particular se investiga por primera vez, un director creativo elegirá una colocación óptima para la imagen virtual, en base a una serie de factores, tanto artísticos como prácticos. Una vez que se elige la posición óptima el sistema usa la trigonometría para calcular la posición de la imagen en las coordenadas espaciales del mundo real x, y z con respecto al objeto 12. Una alternativa es decidir sobre un punto cero dentro del objeto y colocar la imagen usando las coordenadas absolutas x, y y/o z desde el punto cero.

La Figura 6 muestra esquemáticamente cómo el usuario puede redimensionar o reposicionar la imagen con respecto al objeto. La imagen puede redimensionarse usando la técnica de pellizcar y esparcir con los dedos 22 mientras se toca la pantalla. La imagen se puede mover mediante el uso de la técnica de arrastrar y soltar 24, y un sistema de anclaje (descrito a continuación) también puede activarse o desactivarse mediante la técnica de doble toque con doble dedo 26. En un modo REPRODUCIR, también se proporciona un botón de PAUSA virtual 28, que se convierte en el botón REPRODUCIR virtual (no mostrado) en modo PAUSA.

Para mantener la ilusión de que la figura está realmente presente junto a la atracción, es necesario que la posición de la Figura - es decir, la imagen 14 - esté anclada espacialmente con respecto al objeto 12. Esto se debe a que si el usuario se mueve mientras mira el objeto y la imagen virtual a través de la cámara, la imagen que se fija con respecto a la pantalla de la cámara rápidamente dejaría de mantener la ilusión de la realidad.

La Figura 7 muestra esquemáticamente un sistema de anclaje de acuerdo con una modalidad de la presente invención. El sistema usa un algoritmo predefinido para buscar objetos que son prominentes o tienen una forma definitiva dentro de la vista de la cámara. Una vez que se localizan varios objetos el sistema utiliza técnicas trigonométricas avanzadas para evaluar la escena que se muestra en la vista de la cámara y para asignar datos de proporción a la imagen virtual. Luego el sistema bloquea la imagen en las coordenadas x, y y z con respecto a su contexto del mundo real.

La Figura 8 muestra esquemáticamente en más detalle el sistema de anclaje de acuerdo con la modalidad descrita anteriormente en la presente invención. Primeramente, una etiqueta 30 indica que el sistema de anclaje se ha activado. Luego el dispositivo detecta dinámicamente el objeto más cercano 32 a la vista de la cámara. En este caso, el método utilizado es uno en el que un algoritmo busca reconocer objetos mediante la detección de un patrón, en lugar de utilizar puntos de la matriz preprocesados (según el ejemplo de la Figura 1). Esto permite que el algoritmo busque objetos del mundo real a los que se pueda anclar el rendimiento, es decir, la imagen virtual. Por ejemplo, el algoritmo podría reconocer los cuatro bordes de una mesa de billar. Esto permite una técnica de anclaje mejorada a medida que se crean reglas de reconocimiento que permiten la aplicación de umbrales más altos o más bajos en base a un objeto particular o tipo de objeto. Un algoritmo adecuado considerado previamente se conoce como FAST (Características de la Prueba de Segmento Acelerado).

A continuación el dispositivo detecta un segundo objeto 34 para proporcionar información de profundidad. La imagen se ancla al primer objeto - es decir - se determina la posición de la imagen en las coordenadas x, y y z con respecto a la ubicación del primer objeto 32. El dispositivo luego verifica regularmente para determinar si el patrón del objeto - es decir de los objetos 32 y 34 - ha cambiado, lo que ocurriría si el usuario que sostenía el dispositivo se ha movido. Si el dispositivo determina que hubo movimiento, el dispositivo vuelve a escanear el campo de visión y determina la coincidencia más cercana con el patrón inicial de los objetos 32 y 34 para garantizar que la posición de la imagen virtual 14 sigue siendo verdadera.

El enfoque descrito anteriormente permite a un usuario bloquear el anclaje a un objeto conocido dentro de la pantalla, en casi cualquier ubicación, de manera eficiente e invisible. Si no hay un objeto específico desde el que tomar una referencia tal como un campo abierto, por ejemplo, entonces el sistema se revierte primero a una biblioteca de reconocimiento precargada y luego, si no se reconoce una vista se utilizan una brújula digital y una referencia de GPS para arreglar la ubicación de la imagen en el espacio real.

El uso del GPS y las marcaciones de la brújula digital por el sistema de anclaje se representa esquemáticamente en la Figura 9. Esta configuración crea un mapa básico del mundo real mediante el uso de coordenadas de GPS junto a las marcaciones de la brújula. Las coordenadas del GPS se utilizan para bloquear una configuración de longitud y latitud conocida, mientras que las marcaciones se utilizan para detectar un movimiento circular de 360 grados por parte del

5

10

15

20

25

30

35

40

45

50

55

60

65

usuario. Si el sistema detecta tal movimiento, entonces la película vuelve a su posición original bloqueada. La animación regresa usando algoritmos que proporcionan un retorno suave y rápido a las coordenadas que reconocen la amortiguación y la velocidad de retorno en base a la distancia recorrida.

El tamaño aparente de la imagen con respecto a los objetos en la vista de la cámara también es importante para mantener la ilusión de la realidad. La Figura 10 muestra una operación de dimensionamiento automático en la que la imagen 14 se ajusta con respecto al objeto 12 cuando un usuario, que ve el objeto a través del dispositivo de cámara, se mueve más cerca o más lejos del objeto.

Se emplean sofisticados algoritmos por el dispositivo para ajustar el tamaño de la imagen sin problemas a medida que el usuario se acerca o aleja del objeto 12. La función de enfoque automático de la lente de la cámara puede emplearse para proporcionar datos relativos a un cambio en la distancia desde el objeto. Si el dispositivo no posee una función de enfoque automático la distancia al objeto reconocido se puede calcular mediante el uso de datos almacenados sobre su origen. Ambas técnicas pueden usarse, cuando estén disponibles, para proporcionar una lectura más precisa.

Alternativamente, el usuario puede cambiar manualmente el tamaño de la imagen 14 usando la técnica de pellizco 22 descrita anteriormente.

Si el sistema detecta una ubicación relativamente estrecha, tal como una ubicación interior, o una escena callejera medieval por ejemplo, el dispositivo cambia automáticamente el tamaño de la imagen a un tamaño mayor para mantener el realismo. La Figura 11 representa la imagen ampliada 14 en tal caso.

El sistema también permite la captura de imágenes fijas o de video que llevan tanto la vista real como la imagen virtual. Las Figuras 12-15 muestran esquemáticamente un proceso para tomar una fotografía con la imagen virtual 14 incluida. En la Figura 12 una persona real 36 entra en una escena en la que la imagen virtual de la Figura 14 ya está posicionada. En la Figura 13 se toma y almacena la fotografía y se graban las coordenadas de la imagen virtual. En la Figura 14 el sistema procesa posteriormente la imagen 14 y la perspectiva se detecta automáticamente. La imagen compuesta se vuelve a guardar. En la Figura 15 se invita al usuario a compartir la imagen compuesta almacenada a través de botones virtuales 38 que acceden a varios medios comunes. Una corta secuencia de video se puede grabar y compartir de manera similar.

La Figura 16 muestra esquemáticamente un ejemplo de un proceso completo de acuerdo con la modalidad descrita anteriormente.

El proceso comienza en la etapa 100. En la etapa 102 las reglas de reconocimiento de objetos se leen desde una base de datos. En la etapa 104 el dispositivo lee la vista y en la etapa 106 comprueba si hay un patrón reconocible. El dispositivo gira hasta que se detecta un patrón. Una vez que se detecta un patrón se selecciona una imagen en movimiento apropiada de una biblioteca en la etapa 108. En la etapa 110, la imagen se posiciona y comienza el juego. La etapa 112 espera una entrada del usuario. Las opciones de salir 114, cambiar el tamaño 116, anclar 118 o reposicionar 120 están disponibles. Si el usuario selecciona salir de la aplicación en la etapa 114 la aplicación se detiene en la etapa 122. De cualquier otra manera la imagen de video continúa reproduciéndose en la etapa 124.

La Figura 17 muestra una modalidad alternativa en la que una base de datos de reconocimiento de objetos 40 está dividida en varias bases de datos más pequeñas 42, 44, 46, 48 de acuerdo con la ubicación del usuario. Se verifican tres o más ángulos de un objeto 50 y una vez que se ha detectado el objeto se lanza la imagen virtual 52.

Los ejemplos anteriores describen el uso de controles táctiles, que pueden ser diferentes a los descritos. Sin embargo, cuando el aparato lo soporta, se pueden emplear gestos sin contacto para controlar el dispositivo. De manera similar, cuando el aparato lo soporta, pueden usarse comandos de voz para controlar el aparato.

La información contextual puede derivarse de una imagen del "mundo real", como se ve a través de la cámara del dispositivo, o puede derivarse de una imagen bidimensional, tal como una página impresa, una fotografía o una imagen visualizada electrónicamente. Esto permite que las técnicas descritas anteriormente se utilicen para mejorar la experiencia del usuario en una amplia variedad de circunstancias, tales como ver una publicación impresa o un anuncio. En una modalidad (no mostrada), se puede hacer que la imagen virtual parezca elevarse o "saltar" hacia arriba desde tal contexto bidimensional.

Se pueden emplear técnicas de procesamiento de imágenes para crear sombras virtuales para la imagen virtual, de esta manera mejore la percepción de que la imagen virtual es real. De manera similar, las técnicas de procesamiento de imágenes se pueden emplear para equilibrar el brillo aparente de la imagen virtual con relación al contexto del mundo real que se está viendo a través del dispositivo. Aunque los ejemplos descritos anteriormente son de una experiencia de visualización bidimensional, las técnicas descritas en la presente descripción también se pueden aplicar a una experiencia de visualización tridimensional aparente donde el aparato lo soporte, tal como en formatos de reproducción de video 3-D.

En la descripción anterior, el término "imagen virtual" pretende referirse a una imagen previamente capturada o adquirida por separado - que preferentemente es una imagen en movimiento - que se muestra en una pantalla del dispositivo

mientras el usuario ve la imagen o imágenes reales o actuales que se capturan por la cámara del dispositivo. La imagen virtual es en sí misma real, de una realidad diferente, que se corta de manera efectiva de esa otra realidad y se trasplanta a otra - la que el espectador ve en la pantalla de su dispositivo.

Claims

5

10

15

20

25

30

35

40

45

50

55

60

Reivindicaciones

1. Un aparato para visualizar una realidad aumentada en una pantalla de un dispositivo portátil (10) que tiene una cámara, el aparato que comprende una unidad de identificación del contexto para identificar una vista de la cámara de al menos una imagen real capturada por la cámara, una unidad de recuperación de imagen virtual para seleccionar y visualizar una imagen virtual (14) en la pantalla y una unidad de posicionamiento de imagen virtual para posicionar la imagen virtual en la pantalla, caracterizado porque el aparato se dispone durante el uso para visualizar la imagen virtual, que comprende el contenido de una imagen de video del mundo real capturada electrónicamente desde una realidad diferente, que se corta de esa realidad diferente y se trasplanta a la capturada por la cámara, mientras el usuario ve la imagen capturada por la cámara y en donde el posicionamiento de la imagen virtual por la unidad de posicionamiento incluye anclar la imagen virtual, y dimensionar la imagen virtual, con respecto a la vista de la cámara determinada por la unidad de identificación de contexto, para crear la ilusión de que el contenido de la imagen virtual está presente en el campo de visión de la cámara en tiempo real en la pantalla.
2. Un aparato de acuerdo con la reivindicación 1, en donde la imagen virtual comprende una secuencia de imágenes fijas tomadas de un video.
3. Un aparato de acuerdo con la reivindicación 1 o 2, en donde la imagen virtual comprende una imagen de video en movimiento continuo.
4. Un aparato de acuerdo con cualquiera de las reivindicaciones de la 1-3, en donde la imagen virtual comprende una imagen de una persona, criatura u objeto del mundo real o un artículo.
5. Un aparato de acuerdo con cualquiera de las reivindicaciones anteriores, en donde la unidad de identificación del contexto se dispone durante el uso para identificar la vista de la cámara comparando al menos un objeto en un campo de visión con los datos almacenados de una pluralidad de objetos.
6. Un aparato de acuerdo con cualquiera de las reivindicaciones anteriores, en donde la unidad de recuperación de imágenes se dispone durante el uso para seleccionar la imagen virtual de una pluralidad de imágenes almacenadas de acuerdo con la vista de la cámara determinada por la unidad de identificación del contexto.
7. Un método para visualizar una realidad aumentada en una pantalla de un dispositivo portátil que tiene una cámara, el método que comprende identificar una vista de la cámara de al menos una imagen real capturada por la cámara y seleccionar y posicionar una imagen virtual en la pantalla, caracterizado porque el método comprende visualizar la imagen virtual que comprende el contenido de una imagen de video del mundo real capturada electrónicamente de una realidad diferente, que se corta de esa realidad diferente y se trasplanta en la capturada por la cámara, mientras el usuario ve la imagen capturada por la cámara y en donde el posicionamiento de la imagen virtual incluye anclar la imagen virtual y dimensionar la imagen virtual, con respecto a la vista de cámara, para crear la ilusión de que el contenido de la imagen virtual está presente en el campo de visión de la cámara en tiempo real en la pantalla.
8. Un método de acuerdo con la reivindicación 7, en donde el método comprende visualizar una imagen virtual que comprende la secuencia de imágenes fijas tomadas de un video.
9. Un método de acuerdo con la reivindicación 7 u 8, en donde el método comprende identificar la vista de la cámara comparando al menos un objeto en el campo de visión con los datos almacenados de una pluralidad de objetos.
10. Un método de acuerdo con cualquiera de las reivindicaciones de la 7 - 9, en donde el método comprende seleccionar la imagen virtual a partir de una pluralidad de imágenes almacenadas de acuerdo con la vista de la cámara determinada.
11. Un programa para hacer que un procesador electrónico de un dispositivo portátil realice un método para visualizar una realidad aumentada en una pantalla de un dispositivo portátil que tiene una cámara, el método que comprende identificar una vista de la cámara de al menos una imagen real capturada por la cámara y seleccionar y posicionar una imagen virtual en la pantalla, caracterizado porque el método comprende visualizar la imagen virtual que comprende el contenido de una imagen de video del mundo real capturada electrónicamente de una realidad diferente, que se corta de esa realidad diferente y se trasplanta dentro de una capturada por la cámara, mientras el usuario ve la imagen capturada por la cámara, y en donde el posicionamiento de la imagen virtual incluye anclar la imagen virtual y dimensionar la imagen virtual con respecto a la vista de la cámara, para crear la ilusión de que el contenido de la imagen virtual está presente en el campo de visión de la cámara en tiempo real en la pantalla.
12. Un producto de programa informático, que almacena, transporta o transmite en el mismo o a través de un programa de acuerdo con la reivindicación 11.