ES2407105B1 - METHOD AND SYSTEM OF RECOVERY OF INFORMATION OF IMAGES IN MOBILE DEVICES USING METADATA. - Google Patents

METHOD AND SYSTEM OF RECOVERY OF INFORMATION OF IMAGES IN MOBILE DEVICES USING METADATA. Download PDF

Info

Publication number
ES2407105B1
ES2407105B1 ES201101196A ES201101196A ES2407105B1 ES 2407105 B1 ES2407105 B1 ES 2407105B1 ES 201101196 A ES201101196 A ES 201101196A ES 201101196 A ES201101196 A ES 201101196A ES 2407105 B1 ES2407105 B1 ES 2407105B1
Authority
ES
Spain
Prior art keywords
metadata
information
remote server
image
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES201101196A
Other languages
Spanish (es)
Other versions
ES2407105A1 (en
Inventor
Antonio PERTUSA IBÁÑEZ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Universidad de Alicante
Original Assignee
Universidad de Alicante
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Universidad de Alicante filed Critical Universidad de Alicante
Priority to ES201101196A priority Critical patent/ES2407105B1/en
Priority to PCT/ES2012/070743 priority patent/WO2013068619A1/en
Publication of ES2407105A1 publication Critical patent/ES2407105A1/en
Application granted granted Critical
Publication of ES2407105B1 publication Critical patent/ES2407105B1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/10Recognition assisted with metadata

Abstract

Método y sistema de recuperación de información de imágenes en dispositivos móviles usando metadatos que comprende el empleo de un teléfono móvil (100) y un servidor remoto (102), y en donde esencialmente, se emplean una pluralidad de metadatos como el giro del dispositivo, la aceleración en el momento de la toma, metadatos de audio, datos de red, precisión y cobertura GPS, tamaño de la región de interés, ángulo respecto a la horizontal, grado de luminosidad exterior, metadatos obtenidos mediante geocodificación inversa, altura sobre el suelo y condiciones climatológicas para la mejora interactiva de la identificación del objeto previamente seleccionado por el usuario.Method and system for recovering image information on mobile devices using metadata comprising the use of a mobile phone (100) and a remote server (102), and where essentially, a plurality of metadata is used as the rotation of the device, the acceleration at the time of the capture, audio metadata, network data, accuracy and GPS coverage, size of the region of interest, angle with respect to the horizontal, degree of exterior luminosity, metadata obtained by reverse geocoding, ground height and weather conditions for the interactive improvement of the identification of the object previously selected by the user.

Description

MÉTODO Y SISTEMA DE RECUPERACIÓN DE INFORMACIÓN DE IMÁGENES EN DISPOSITIVOS MÓVILES USANDO METADATOS METHOD AND SYSTEM FOR RECOVERY OF IMAGE INFORMATION ON MOBILE DEVICES USING METADATA

5 5
La presente invención está referida a un método basado en una arquitectura cliente/servidor para la recuperación de información a partir de imágenes obtenidas mediante dispositivos móviles.   The present invention relates to a method based on a client / server architecture for retrieving information from images obtained by mobile devices.

1 O 1 o
Estado de la técnica anterior Prior art

15 fifteen
La búsqueda de información sobre un objeto a partir de su fotografía es útil en aquellos problemas donde es más sencillo describir la consulta mediante una imagen que mediante una descripción textual. En la actualidad, existen multitud de sistemas de recuperación de información a partir de imágenes. Esta tarea, en la que destacan sistemas como Google images [http:/ jimages.google.com], es conocida como content-based image retrieval. The search for information about an object from its photography is useful in those problems where it is easier to describe the query through an image than through a textual description. Currently, there are many information retrieval systems from images. This task, which highlights systems such as Google images [http: / jimages.google.com], is known as content-based image retrieval.

2 O 2 5 2 or 2 5
Para llevarla a cabo, normalmente se extraen una serie de características de la imagen (locales o globales), se procesan usando técnicas de agrupación de la información, y finalmente se obtiene un ranking de imágenes similares a la consulta presentes en una base de datos de referencia. Se puede identificar o clasificar el objeto consultando, por ejemplo, la categoría de la primera imagen del ranking {para ello es imprescindible que la base de datos esté etiquetada). To carry it out, a series of image characteristics (local or global) are normally extracted, processed using information grouping techniques, and finally a ranking of images similar to the query present in a database of information is obtained. reference. You can identify or classify the object by consulting, for example, the category of the first image of the ranking {for this it is essential that the database is labeled).

3 O 3 o
La principal ventaja de los dispositivos móviles avanzados es la toma de fotografías desde cualquier punto y su envío a través de internet. La recuperación de información de imágenes obtenidas mediante estos dispositivos es un problema de reciente estudio. Actualmente, la aplicación más conocida que aborda este problema es Google Goggles [descrito en US20100260373], que es capaz de reconocer marcas de vino, libros, obras de arte, monumentos y logos comerciales. The main advantage of advanced mobile devices is the taking of photographs from any point and sending them over the internet. The recovery of image information obtained through these devices is a problem of recent study. Currently, the best known application that addresses this problem is Google Goggles [described in US20100260373], which is capable of recognizing wine brands, books, works of art, monuments and commercial logos.

3 5 3 5
A pesar de que reconocer cualquier tipo de imagen en general es un problema extremadamente complicado, este puede simplificarse en parte usando dispositivos móviles, ya que estos proporcionan datos adicionales (metadatos) sobre la localización espacio/temporal, información sobre el usuario y datos aportados por los Although recognizing any type of image in general is an extremely complicated problem, it can be simplified in part by using mobile devices, since these provide additional data (metadata) on the space / time location, user information and data provided by the

sensores para complementar la información de la imagen. sensors to complement the image information.

5 5
Estos metadatos pueden ser útiles para restringir la búsqueda. Por ejemplo, si tomamos una foto de un objeto en un exterior y conocemos la hora de la toma, podríamos mejorar el reconocimiento seleccionando sólo las imágenes que se han tomado alrededor de dicha hora, ya que las condiciones de iluminación serán similares. These metadata can be useful to narrow your search. For example, if we take a picture of an object outside and know the time of the shot, we could improve the recognition by selecting only the images that have been taken around that time, since the lighting conditions will be similar.

1 O 15 2 O 1 O 15 2 O
Podemos encontrar en la literatura diversas técnicas de extracción de características, tanto locales (SIFf, SURF, etc.) como globales (color, textura, etc.). Tras obtener las características de la imagen, se pueden aplicar métricas basadas en distancias, agrupamiento en clusters o histogramas, o usar técnicas de aprendizaje, como vecinos más cercanos, support vector machines, o boosting, para obtener la clase de la imagen, o la imagen con mayor similitud. Para mejorar los resultados en la búsqueda de imágenes, conviene restringir el número de objetos con los que comparar la imagen de la consulta. Metadatos como la fecha o la localización GPS pueden facilitar la identificación de la escena o del objeto reduciendo el espacio de búsqueda. Por ejemplo, usando únicamente metadatos de la cámara se pueden obtener buenos resultados para discriminar entre escenas de interior y de exterior [US2005/0105776]. We can find in the literature various techniques for extracting characteristics, both local (SIFf, SURF, etc.) and global (color, texture, etc.). After obtaining the characteristics of the image, distance-based metrics, clustering or histograms can be applied, or learning techniques, such as closer neighbors, support vector machines, or boosting, can be used to obtain the image class, or Image with greater similarity. To improve the results in the image search, it is convenient to restrict the number of objects with which to compare the image of the query. Metadata such as date or GPS location can facilitate the identification of the scene or object by reducing the search space. For example, using only camera metadata, good results can be obtained to discriminate between indoor and outdoor scenes [US2005 / 0105776].

2 5 2 5
En la literatura se ha estudiado el aporte de los metadatos aportados por las cámaras fotográficas [US2oosjo105776], o por los dispositivos móviles, aunque de una manera básica [US20100260373]. The literature has studied the contribution of metadata provided by cameras [US2oosjo105776], or by mobile devices, although in a basic way [US20100260373].

Explicación de la invención Explanation of the invention.

3O 35 3O 35
La presente invención tiene una serie de características diferenciadoras. La primera es la inclusión de una pluralidad de nuevos meta datos para mejorar la búsqueda, dentro de un esquema multimodal. Otra característica diferenciadora es que se trata de un sistema interactivo, en el que el usuario selecciona la región de interés alrededor del objeto y además valida la respuesta dada por el sistema, de tal forma que pueda mejorar en futuras consultas. Más concretamente, el método de recuperación de información de imágenes en dispositivos móviles usando metadatos emplea dispositivos móviles que comprenden    The present invention has a number of differentiating characteristics. The first is the inclusion of a plurality of new metadata to improve the search, within a multimodal scheme. Another distinguishing feature is that it is an interactive system, in which the user selects the region of interest around the object and also validates the response given by the system, so that it can improve in future consultations. More specifically, the method of retrieving image information on mobile devices using metadata employs mobile devices that comprise

medios para la captura de imágenes, así como medios de transmisión de dichas imágenes capturadas junto con una pluralidad de metadatos a un servidor remoto. means for capturing images, as well as means for transmitting said captured images together with a plurality of metadata to a remote server.

5 5
El método se caracteriza porque comprende una etapa de captura de una imagen mediante el dispositivo móvil, así como la selección de una región dentro de la propia imagen por parte del usuario de dicho dispositivo móvil; en donde en dicha región se encuentra un objeto del cual se quiere obtener alguna información. The method is characterized in that it comprises a step of capturing an image by means of the mobile device, as well as the selection of a region within the image itself by the user of said mobile device; where in that region there is an object from which you want to obtain some information.

1 O 1 o
Posteriormente, se produce el envío de la región seleccionada de la imagen junto con una pluralidad de metadatos. Tras ello, se identifica en el servidor remoto y se clasifica el objeto identificado, remitiendo dicha información al dispositivo móvil. Subsequently, the selected region of the image is sent together with a plurality of metadata. After that, it is identified on the remote server and the identified object is classified, sending said information to the mobile device.

15 fifteen
Por último, se valida la respuesta del servidor remoto en el dispositivo móvil por parte del usuario, indicando cuando esa información es correcta y, en caso contrario, etiquetando el objeto para su devolución y almacenamiento en una base de datos del servidor remoto. Finally, the response of the remote server on the mobile device is validated by the user, indicating when that information is correct and, otherwise, labeling the object for return and storage in a database of the remote server.

20 25 3 O 20 25 3 O
En un segundo aspecto de la invención, se reivindica el sistema que implementa el método anteriormente descrito. Como se puede observar, se trata de un sistema y un método personalizable, en el sentido de que se pretende que el usuario decida qué tipos de objeto desea clasificar, y colaborativo, en el sentido de que las imágenes que vaya añadiendo un usuario se podrán usar para mejorar las consultas de otros usuarios. A lo largo de la descripción y las reivindicaciones la palabra quot;comprendequot; y sus variantes no pretenden excluir otras características técnicas, aditivos, componentes o pasos. Para los expertos en la materia, otros objetos, ventajas y características de la invención se desprenderán en parte de la descripción y en parte de la práctica de la invención. Los siguientes ejemplos y dibujos se proporcionan a modo de ilustración, y no se pretende que sean limitativos de la presente invención. Además, la presente invención cubre todas las posibles combinaciones de realizaciones particulares y preferidas aquí indicadas. In a second aspect of the invention, the system implementing the method described above is claimed. As you can see, it is a system and a customizable method, in the sense that it is intended for the user to decide what types of object you want to classify, and collaborative, in the sense that the images that a user is adding can be use to improve the queries of other users. Throughout the description and the claims the word quot; comprehequot; and its variants are not intended to exclude other technical characteristics, additives, components or steps. For those skilled in the art, other objects, advantages and features of the invention will be derived partly from the description and partly from the practice of the invention. The following examples and drawings are provided by way of illustration, and are not intended to be limiting of the present invention. In addition, the present invention covers all possible combinations of particular and preferred embodiments indicated herein.

3 5 3 5
Breve descripción de los dibujos Brief description of the drawings

FIG 1.    FIG 1.
Muestra de forma esquemática el sistema y método de recuperación de Schematically shows the recovery system and method of

información de imágenes en dispositivos móviles usando metadatos. Image information on mobile devices using metadata.

Exposición detallada de un modo de realización Detailed presentation of an embodiment

5 5
El esquema general se puede observar en la figura adjunta. El usuario puede tomar The general scheme can be seen in the attached figure. The user can take

una fotografía mediante el dispositivo móvil (100) y seleccionar la región a photograph using the mobile device (100) and select the region

correspondiente al objeto del cual se quiere obtener información (106). La imagen corresponding to the object from which information is to be obtained (106). The picture

comprendida en esta región se envía por red al servidor remoto (102) junto con los included in this region is sent by network to the remote server (102) together with the

metadatos descritos a continuación. El servidor remoto (102) posteriormente metadata described below. The remote server (102) later

1 O 1 o
identifica o clasifica el objeto y devuelve la información al usuario, que puede validar Identifies or classifies the object and returns the information to the user, who can validate

la respuesta. El usuario puede validar la respuesta, indicando si es correcta y, en caso the answer. The user can validate the answer, indicating if it is correct and, in case

contrario, especificando el tipo o la clase de objeto. otherwise, specifying the type or class of object.

Por ejemplo, si el sistema identifica que se le está haciendo una foto a una motocicleta For example, if the system identifies that a motorcycle is being photographed

15 fifteen
pero se trata de una bicicleta, el usuario podrá indicar que la respuesta no es correcta but it is a bicycle, the user can indicate that the answer is not correct

para añadir la imagen etiquetada a la base de datos del servidor. to add the tagged image to the server database.

Se propone usar los metadatos que se describen a continuación, extraídos a partir de It is proposed to use the metadata described below, extracted from

los sensores que poseen algunos dispositivos móviles: the sensors that some mobile devices have:

20 twenty

Giro del dispositivo. Un giroscopio puede proporcionar información sobre los Device rotation. A gyroscope can provide information about

ángulos de Tait-Bryan. Estos representan los ejes de cabeceo, dirección y Tait-Bryan angles. These represent the axes of pitch, direction and

alabeo, a partir de los cuales se pueden obtener más metadatos como el ángulo warping, from which more metadata such as angle can be obtained

respecto a la horizontal. respect to the horizontal.

25 25
Orientación. Si el dispositivo móvil es rectangular, existen cuatro Orientation. If the mobile device is rectangular, there are four

orientaciones posibles. Este dato es de relevancia para rotar la imagen al Possible orientations This data is relevant to rotate the image to

enviarla al servidor, y también para calcular el ángulo respecto a la horizontal. send it to the server, and also to calculate the angle with respect to the horizontal.

Posición GPS. Las coordenadas en el momento de la toma pueden usarse para, GPS position The coordinates at the time of the shot can be used to,

por ejemplo, escoger sólo aquellos objetos cercanos a la localización del for example, choose only those objects close to the location of the

30 30
dispositivo. El verdadero potencial de la posición GPS se puede revelar device. The true potential of the GPS position can be revealed

mediante geo-codificación inversa. by reverse geo-coding.

Datos de aceleración. Usando un acelerómetro se puede obtener la aceleración Acceleration Data Using an accelerometer you can get the acceleration

respecto cada uno de los ejes en el momento de la toma. Estos datos respect each of the axes at the time of taking. These dates

proporcionan una indicación sobre la estabilidad del dispositivo, y esta they provide an indication on the stability of the device, and this

35 35
información puede usarse para seleccionar las imágenes más estables como information can be used to select the most stable images as

representativas de una clase.    representative of a class.

Fecha. Es más probable, por ejemplo, realizar una fotografía de una flor en Date. It is more likely, for example, to take a picture of a flower in

primavera, o de un muñeco de nieve en invierno, o de una piscina en verano. La información sobre la fecha puede ser de utilidad para discernir entre ciertos tipos de objetos o escenas. Hora. La hora en la que se ha realizado también puede proporcionar información de relevancia. Se puede usar, por ejemplo, para restringir la búsqueda en aquellos objetos que se han fotografiado a esa hora, comparando así imágenes con condiciones de iluminación similares. Parámetros de la cámara. Datos como la velocidad de obturación, la apertura, el tiempo de exposición, la distancia focal, la ISO, o el modo de flash son también relevantes para esta tarea. La distancia focal es un parámetro representativo de la distancia de los objetos fotografiados, pero actualmente las cámaras de los dispositivos móviles avanzados suelen tener distancias focales fijas. Metadatos de audio. El nivel de decibelios en el momento de la toma o en un intervalo de tiempo alrededor de la misma puede indicar si el usuario se encuentra en un entorno ruidoso (como un centro comercial) o silencioso (como una zona rural). Datos de red. Si existe una red WiFi cercana, lo más probable es que el dispositivo móvil se encuentre en una zona poblada. La densidad o cantidad de redes inalámbricas que se detectan en el momento de la toma puede usarse como un indicio para obtener datos sobre el entorno. Precisión y cobertura GPS. Por regla general, siempre se detecta al menos un satélite en localizaciones exteriores, pero en zonas interiores no se detectan debido a que techos y paredes impiden que la señal alcance el dispositivo. Por tanto, la precisión de la posición GPS (en metros) o la cobertura (en número de satélites detectados) también son datos relevantes para esta tarea, y pueden indicar si la escena es de interior o de exterior. Identificación del usuario. Un mismo usuario tiende a realizar fotografías de objetos similares (animales, objetos de oficina, etc.) y a repetir búsquedas sobre objetos ya fotografiados. Por tanto, es posible dar prioridad en la clasificación a las categorías de imágenes tomadas previamente por el usuario. Tamaño de la región de interés. La altura y anchura de la región de interés seleccionada por el usuario puede ayudar a conocer si el objeto es alargado o compacto. spring, or a snowman in winter, or a pool in summer. Information about the date can be useful for discerning between certain types of objects or scenes. Hour. The time it was made can also provide relevant information. It can be used, for example, to narrow the search on those objects that have been photographed at that time, thus comparing images with similar lighting conditions. Camera parameters Data such as shutter speed, aperture, exposure time, focal length, ISO, or flash mode are also relevant for this task. Focal length is a representative parameter of the distance of photographed objects, but currently the cameras of advanced mobile devices usually have fixed focal lengths. Audio metadata The decibel level at the time of taking or at a time interval around it can indicate whether the user is in a noisy environment (such as a shopping center) or quiet (such as a rural area). Network data If there is a nearby WiFi network, it is most likely that the mobile device is in a populated area. The density or quantity of wireless networks detected at the time of the capture can be used as an indication to obtain data about the environment. Accuracy and GPS coverage. As a general rule, at least one satellite is always detected in outdoor locations, but in indoor areas they are not detected because ceilings and walls prevent the signal from reaching the device. Therefore, the accuracy of the GPS position (in meters) or coverage (in number of satellites detected) are also relevant data for this task, and can indicate whether the scene is indoor or outdoor. User ID The same user tends to take photographs of similar objects (animals, office objects, etc.) and to repeat searches on objects already photographed. Therefore, it is possible to prioritize the categories of images previously taken by the user. Size of the region of interest. The height and width of the region of interest selected by the user can help to know if the object is elongated or compact.


A partir de los metadatos anteriores, se pueden derivar una serie de metadatos adicionales que revelan el auténtico potencial de los dispositivos móviles para esta tarea:

From the above metadata, a series of additional metadata can be derived that reveal the true potential of mobile devices for this task:

Ángulo respecto a la horizontal. Esta información es de relevancia para conocer el tamaño del objeto fotografiado o, por ejemplo, para discernir entre los objetos situados en el suelo o colocados en una pared. Los ángulos de Tait-Bryan obtenidos mediante un giroscopio se pueden combinar con la orientación del dispositivo móvil para calcular el ángulo respecto al suelo en el momento de la toma. Grado de luminosidad exterior. A partir de la fecha, hora y latitud GPS, se puede calcular si es de día, de noche, o si está amaneciendo o anocheciendo. Este dato se puede usar, por ejemplo, para deducir que si la toma se ha hecho de noche y sin flash, es más probable que se trate una escena de interior que de exterior. Metadatos obtenidos mediante geocodificación inversa. Usando sistemas como simplegeo, google, geonames, etc., se pueden obtener datos relevantes a partir de una localización, tales como: Angle with respect to the horizontal. This information is relevant to know the size of the photographed object or, for example, to discern between objects located on the floor or placed on a wall. The angles of Tait-Bryan obtained by means of a gyroscope can be combined with the orientation of the mobile device to calculate the angle with respect to the ground at the time of the taking. Degree of exterior brightness. From the date, time and GPS latitude, it can be calculated if it is day, night, or if it is sunrise or sunset. This data can be used, for example, to deduce that if the shot has been taken at night and without a flash, an indoor scene is more likely to be treated than outside. Metadata obtained by reverse geocoding. Using systems such as simplegeo, google, geonames, etc., relevant data can be obtained from a location, such as:

o El tipo de lugar donde se ha realizado la toma {zoo, universidad, bosque, ciudad, playa, etc.) o The type of place where the taking was made {zoo, university, forest, city, beach, etc.)

o El código postal de la zona o The zip code of the area

o La ciudad, pueblo o región o The city, town or region

o El país o The country


o La densidad demográfica en la zona Estas características son de interés para restringir la clasificación de determinados objetos. Por ejemplo, es muy improbable encontrar un elefante en una ciudad, pero sí se puede encontrar en un zoo. Altura sobre el suelo. Mediante geocodificación inversa se puede obtener la altitud sobre el mar en una determinada zona. Comparando esta altitud con la altitud obtenida mediante GPS, se puede deducir (con un cierto margen de error) si la toma se ha realizado desde, por ejemplo, un edificio de varias plantas o a nivel del suelo. Condiciones climatológicas. Los datos relativos a la temperatura, la humedad relativa o si está lloviendo o soleado también se pueden extraer a partir de la posición GPS, localizando la estación meteorológica más cercana y obteniendo su información mediante sistemas como simplegeo o geonames. Estos datos pueden ser de relevancia para conocer si la toma ha sido exterior o interior, si puede aparecer nieve en la imagen, etc. Orientación de la vista sobre el mapa. Los ángulos de Tait-Bryan en

o The population density in the area These characteristics are of interest to restrict the classification of certain objects. For example, it is very unlikely to find an elephant in a city, but it can be found in a zoo. Height above ground By reverse geocoding you can obtain the altitude above the sea in a certain area. By comparing this altitude with the altitude obtained by GPS, it can be deduced (with a certain margin of error) if the shot was made from, for example, a multi-storey building or at ground level. Weather conditions. Data relating to temperature, relative humidity or if it is raining or sunny can also be extracted from the GPS position, locating the nearest weather station and obtaining its information through systems such as simplegeo or geonames. This data can be relevant to know if the shot has been exterior or interior, if snow may appear in the image, etc. Orientation of the view on the map. The angles of Tait-Bryan in

combinación con la posición GPS permiten conocer el punto hacia el cual se Combined with the GPS position, it is possible to know the point towards which

ha hecho la fotografía. Por ejemplo, en una zona con cuatro puntos de interés, He has taken the picture. For example, in an area with four points of interest,

si la foto se ha tomado en el lugar central de los mismos se podrían usar estos if the photo has been taken in the central place of them, these could be used

ángulos para determinar a qué punto se está haciendo referencia. angles to determine which point is being referenced.

5 5
Metadatos adicionales a partir de los metadatos sobre la cámara. Por ejemplo, Additional metadata from the camera metadata. For example,

a partir del tiempo de exposición y del valor de apertura se puede obtener la from the exposure time and the aperture value you can obtain the

energía de la escena, que está directamente correlacionada con el tipo de scene energy, which is directly correlated with the type of

escena y los diferentes grados de luminosidad. scene and the different degrees of brightness.

1O 1O
En la clasificación e identificación de la imagen (103) la invención permite el uso de In the classification and identification of the image (103) the invention allows the use of

cualquier sistema existente de clasificación o identificación de imágenes. any existing system of classification or identification of images.

Normalmente, esta tarea se realiza en tres pasos: extracción de características, Normally, this task is done in three steps: feature extraction,

agrupación de la información y clasificación o identificación. En función del grouping of information and classification or identification. Depending on the

problema, las características seleccionadas pueden ser tanto puntos de interés (SIFf, problem, the selected characteristics can be both points of interest (SIFf,

15 fifteen
SURF, Harris, etc.) como descriptores de color, textura, forma, etc. SURF, Harris, etc.) as descriptors of color, texture, shape, etc.

Posteriormente, se suelen agrupar las características empleando quot;bag of wordsquot;, Subsequently, the characteristics are usually grouped using quot; bag of wordsquot ;,

histogramas, análisis de componentes principales, etc. para reducir el coste histograms, principal component analysis, etc. to reduce the cost

computacional y mejorar los resultados de la clasificación. Opcionalmente, se puede computational and improve ranking results. Optionally, you can

2O 2O
usar verificación geométrica para comprobar la coherencia espacial de las use geometric verification to check the spatial coherence of

características. features.

Por último, se comparan las características agrupadas de una imagen con los de todas Finally, the grouped characteristics of an image are compared with those of all

las imágenes de una base de datos etiquetada (o con un subconjunto de las misma) images from a tagged database (or with a subset of them)

2 5 2 5
para obtener un ranking de imágenes similares. Las etiquetas de las imágenes más to get a ranking of similar images. The most image tags

similares proporcionan la información sobre la clase del objeto. La comparación se Similar provide information about the class of the object. The comparison is

puede realizar calculando los vecinos más cercanos, dada una distancia definida o you can perform calculating the nearest neighbors, given a defined distance or

usando técnicas de aprendizaje para clasificar la muestra, tales como quot;support vector using learning techniques to classify the sample, such as quot; support vector

machinesquot;, redes de Bayes, redes neuronales, etc. machinesquot ;, Bayes networks, neural networks, etc.

30 30

Los metadatos pueden complementar la información de la imagen para mejorar la Metadata can complement the image information to improve the

clasificación. La integración se puede realizar de distintas formas: classification. Integration can be done in different ways:

Clasificación con características de imagen y filtrado posterior usando Classification with image characteristics and subsequent filtering using

meta datos. metadata

35 35
Filtrado inicial con los metadatos y posterior clasificación con características Initial filtering with metadata and subsequent classification with features

de imagen.    of image.

Clasificación conjunta uniendo características de imagen con metadatos. Joint classification linking image characteristics with metadata.

En los tres casos se pueden emplear técnicas de aprendizaje automático, y en el caso In all three cases, machine learning techniques can be used, and in the case

de from
que haya interactividad con el usuario, estas deben ser incrementales. La that there is interactivity with he Username, these must be incremental The

información information
puede integrarse usando una red Bayesiana u otras técnicas de can be integrated using a net Bayesian or other techniques from

5 5
clasificación estadística. statistical classification

En la generación de información (104), In the generation of information (104),
una vez el servidor remoto (102) haya one time the remote server (102) has

identificado o clasificado el objeto, se envía información sobre el mismo al dispositivo identified or classified the object, information about it is sent to the device

móvil (100). Esta información incluye el tipo de objeto para que el usuario pueda mobile (100). This information includes the type of object for the user to

1 O 1 o
validarlo (opcionalmente) e información adicional. Por ejemplo, si el sistema validate it (optionally) and information additional. By example, yes he system

identifica un cuadro determinado de un artista, puede proporcionar información identify a specific picture of an artist, can provide information

sobre el autor o sobre obras similares. Esta información puede ser textual, visual o about the author or similar works. This information can be textual, visual or

sonora (por ejemplo, para una audioguía). sound (for example, for an audio guide).

15 fifteen
Finalmente, se incorpora la muestra etiquetada a la base de datos (105).El usuario Finally, the tagged sample is incorporated into the database (105).

valida la respuesta del servidor, indicando si la clase es correcta o no. En caso validate the server response, indicating if the class is correct or not. In case

afirmativo, se añade la nueva imagen a la base de datos con la etiqueta obtenida. En Yes, the new image is added to the database with the label obtained. In

caso de que la respuesta case the answer
no sea correcta, el usuario puede indicar la respuesta no is correct, the user can indicate the answer

correcta y esta se añadirá a la base de datos con su nueva etiqueta para mejorar correct and this will be added to the database with its new tag to improve

2 O 2 o
futuras consultas.    Future consultations

Claims (4)

REIVINDICACIONES
1.-Método de recuperac10n de información de imágenes en dispositivos 1.-Method of recovering information from images on devices
5 5
móviles usando metadatos; en donde dichos dispositivos móviles (100) comprenden mobile using metadata; wherein said mobile devices (100) comprise
medios para la captura de imágenes y medios de transmisión de dichas imágenes means for capturing images and means for transmitting said images
capturadas más una pluralidad de metadatos a un servidor remoto (102); plus a plurality of metadata captured to a remote server (102);
que se caracteriza porque that is characterized because
(i) la captura de una imagen mediante un dispositivo móvil (100) y la (i) capturing an image using a mobile device (100) and the
1 O 1 o
selección por parte del usuario de dicho dispositivo móvil (100) de una determinada user selection of said mobile device (100) of a given
región dentro de la propia imagen, en donde dicha región se corresponde con un region within the image itself, where said region corresponds to a
objeto del cual se quiere obtener alguna información (106); purpose of which you want to obtain some information (106);
(ii) el envío de la región seleccionada de la imagen junto con una pluralidad de (ii) sending the selected region of the image along with a plurality of
metadatos; metadata;
15 fifteen
(iii) la identificación (103) en el servidor remoto (102) y clasificación del (iii) identification (103) on the remote server (102) and classification of
objeto identificado, remitiendo dicha información (104) al dispositivo móvil (too); y identified object, sending said information (104) to the mobile device (too); Y
(iv) la validación de la respuesta del servidor remoto (102) en el dispositivo (iv) validation of the response of the remote server (102) on the device
móvil (100) por parte del usuario, indicando cuando esa información es correcta y, en mobile (100) by the user, indicating when that information is correct and, in
caso contrario, etiquetando el objeto para su devolución y almacenamiento en una otherwise, labeling the object for return and storage in a
2 O 2 o
base de datos del servidor remoto (102). remote server database (102).
2.-Método de acuerdo con la reivindicación 1 en donde los metadatos 2. Method according to claim 1 wherein the metadata
comprenden al menos el giro del dispositivo, la aceleración en el momento de la They comprise at least the rotation of the device, the acceleration at the time of
toma, metadatos de audio, datos de red, precisión y cobertura GPS, tamaño de la takes, audio metadata, network data, accuracy and GPS coverage, size of the
2 5 2 5
región de interés, ángulo respecto a la horizontal, grado de luminosidad exterior, region of interest, angle to horizontal, degree of exterior brightness,
metadatos obtenidos mediante geocodificación inversa, altura sobre el suelo y metadata obtained by reverse geocoding, height above ground and
condiciones climatológicas. weather conditions.
3.-Método de acuerdo con las reivindicaciones 1 y 2 en donde la información 3. Method according to claims 1 and 2 wherein the information
3 O 3 o
remitida por el servidor remoto (102) comprende el tipo de objeto e información sent by the remote server (102) includes the type of object and information
adicional respecto a ese objeto. additional regarding that object.
4.-Sistema de recuperación de de información de imágenes en dispositivos 4.-System for retrieving image information on devices
móviles usando metadatos; en donde dichos dispositivos móviles (100) comprenden mobile using metadata; wherein said mobile devices (100) comprise
3 5 3 5
medios para la captura de imágenes y medios de transmisión de dichas imágenes means for capturing images and means for transmitting said images
capturadas más una pluralidad de metadatos a un servidor remoto (102); plus a plurality of metadata captured to a remote server (102);
que se caracteriza porque that is characterized because
implementa medios configurados para la ejecución del método de las reivindicaciones 1 a 3 y que consisten en medios para la selección por parte del usuario de dicho dispositivo móvil (100) de una región dentro de la propia imagen, que se corresponde con un objeto del cual se quiere obtener alguna información (106); medios configurados para el envío de la región seleccionada de la imagen junto con una pluralidad de metadatos, comprendiendo al menos el giro del dispositivo, la aceleración en el momento de la toma, metadatos de audio, datos de red, precisión y cobertura GPS, tamaño de la región de interés, ángulo respecto a la horizontal, grado de luminosidad exterior, metadatos obtenidos mediante geocodificación inversa, implements means configured for the execution of the method of claims 1 to 3 and consisting of means for the selection by the user of said mobile device (100) of a region within the image itself, which corresponds to an object of which you want to get some information (106); means configured for sending the selected region of the image together with a plurality of metadata, comprising at least the rotation of the device, the acceleration at the time of the capture, audio metadata, network data, accuracy and GPS coverage, size of the region of interest, angle with respect to the horizontal, degree of exterior luminosity, metadata obtained by reverse geocoding, 1 O altura sobre el suelo y condiciones climatológicas; y medios para la identificación en el servidor remoto (102) y clasificación del objeto identificado, remitiendo dicha información (104) al dispositivo móvil (100). 1 O height above ground and weather conditions; and means for identification on the remote server (102) and classification of the identified object, by sending said information (104) to the mobile device (100).
ES201101196A 2011-11-07 2011-11-07 METHOD AND SYSTEM OF RECOVERY OF INFORMATION OF IMAGES IN MOBILE DEVICES USING METADATA. Active ES2407105B1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
ES201101196A ES2407105B1 (en) 2011-11-07 2011-11-07 METHOD AND SYSTEM OF RECOVERY OF INFORMATION OF IMAGES IN MOBILE DEVICES USING METADATA.
PCT/ES2012/070743 WO2013068619A1 (en) 2011-11-07 2012-10-24 Method and system for retrieving information from images on mobile devices using metadata

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
ES201101196A ES2407105B1 (en) 2011-11-07 2011-11-07 METHOD AND SYSTEM OF RECOVERY OF INFORMATION OF IMAGES IN MOBILE DEVICES USING METADATA.

Publications (2)

Publication Number Publication Date
ES2407105A1 ES2407105A1 (en) 2013-06-11
ES2407105B1 true ES2407105B1 (en) 2014-04-29

Family

ID=48288576

Family Applications (1)

Application Number Title Priority Date Filing Date
ES201101196A Active ES2407105B1 (en) 2011-11-07 2011-11-07 METHOD AND SYSTEM OF RECOVERY OF INFORMATION OF IMAGES IN MOBILE DEVICES USING METADATA.

Country Status (2)

Country Link
ES (1) ES2407105B1 (en)
WO (1) WO2013068619A1 (en)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10977693B2 (en) 2008-11-26 2021-04-13 Free Stream Media Corp. Association of content identifier of audio-visual data with additional data through capture infrastructure
US10631068B2 (en) 2008-11-26 2020-04-21 Free Stream Media Corp. Content exposure attribution based on renderings of related content across multiple devices
US9154942B2 (en) 2008-11-26 2015-10-06 Free Stream Media Corp. Zero configuration communication between a browser and a networked media device
US10567823B2 (en) 2008-11-26 2020-02-18 Free Stream Media Corp. Relevant advertisement generation based on a user operating a client device communicatively coupled with a networked media device
US9986279B2 (en) 2008-11-26 2018-05-29 Free Stream Media Corp. Discovery, access control, and communication with networked services
US9386356B2 (en) 2008-11-26 2016-07-05 Free Stream Media Corp. Targeting with television audience data across multiple screens
US8180891B1 (en) 2008-11-26 2012-05-15 Free Stream Media Corp. Discovery, access control, and communication with networked services from within a security sandbox
US9519772B2 (en) 2008-11-26 2016-12-13 Free Stream Media Corp. Relevancy improvement through targeting of information based on data gathered from a networked device associated with a security sandbox of a client device
US10334324B2 (en) 2008-11-26 2019-06-25 Free Stream Media Corp. Relevant advertisement generation based on a user operating a client device communicatively coupled with a networked media device
US9026668B2 (en) 2012-05-26 2015-05-05 Free Stream Media Corp. Real-time and retargeted advertising on multiple screens of a user watching television
US9961388B2 (en) 2008-11-26 2018-05-01 David Harrison Exposure of public internet protocol addresses in an advertising exchange server to improve relevancy of advertisements
US10419541B2 (en) 2008-11-26 2019-09-17 Free Stream Media Corp. Remotely control devices over a network without authentication or registration
EP2899962A1 (en) * 2014-01-24 2015-07-29 Nokia Technologies OY Method and apparatus for producing an enhanced image

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102422286A (en) * 2009-03-11 2012-04-18 香港浸会大学 Automatic and semi-automatic image classification, annotation and tagging through the use of image acquisition parameters and metadata
US9195898B2 (en) * 2009-04-14 2015-11-24 Qualcomm Incorporated Systems and methods for image recognition using mobile devices
US20100309225A1 (en) * 2009-06-03 2010-12-09 Gray Douglas R Image matching for mobile augmented reality

Also Published As

Publication number Publication date
ES2407105A1 (en) 2013-06-11
WO2013068619A1 (en) 2013-05-16

Similar Documents

Publication Publication Date Title
ES2407105B1 (en) METHOD AND SYSTEM OF RECOVERY OF INFORMATION OF IMAGES IN MOBILE DEVICES USING METADATA.
Yin et al. When to use what data set for your self-driving car algorithm: An overview of publicly available driving datasets
US10818188B2 (en) Method for dispatching a vehicle to a user's location
US8831352B2 (en) Event determination from photos
US10664708B2 (en) Image location through large object detection
Chen et al. City-scale landmark identification on mobile devices
US8483519B2 (en) Mobile image search and indexing system and method
Brejcha et al. State-of-the-art in visual geo-localization
US8055081B2 (en) Image classification using capture-location-sequence information
CN104331509A (en) Picture managing method and device
US20100002941A1 (en) Method and apparatus for identifying an object captured by a digital image
JP2015501982A (en) Automatic tag generation based on image content
CN109588060A (en) Demand responsive type image and position capture systems and method
CN105516929B (en) Establish method, indoor orientation method and the corresponding intrument of indoor map data
CN103827634A (en) Logo detection for indoor positioning
CN101479741A (en) Classifying image regions based on picture location
EP2377055A1 (en) Mobile image search and indexing system and method
CN102456132A (en) Location method and electronic device applying same
CN108932275A (en) For geospatial object/Characteristics Detection bayes method
US20160171004A1 (en) Method and system for improving the location precision of an object taken in a geo-tagged photo
Christodoulakis et al. Picture Context Capturing for Mobile Databases.
US20150379040A1 (en) Generating automated tours of geographic-location related features
CN106534806A (en) Augmented reality (AR) technology-based bird identification recreation system
AU2020254128A1 (en) System and method for determining location and orientation of an object in a space
US11480438B2 (en) Identifying and displaying smooth and demarked paths

Legal Events

Date Code Title Description
FG2A Definitive protection

Ref document number: 2407105

Country of ref document: ES

Kind code of ref document: B1

Effective date: 20140429