MXPA05004679A - Metodo y sistema para identificar relevancia de imagen utilizando un analisis de enlace y diseno de pagina. - Google Patents

Metodo y sistema para identificar relevancia de imagen utilizando un analisis de enlace y diseno de pagina.

Info

Publication number
MXPA05004679A
MXPA05004679A MXPA05004679A MXPA05004679A MXPA05004679A MX PA05004679 A MXPA05004679 A MX PA05004679A MX PA05004679 A MXPA05004679 A MX PA05004679A MX PA05004679 A MXPA05004679 A MX PA05004679A MX PA05004679 A MXPA05004679 A MX PA05004679A
Authority
MX
Mexico
Prior art keywords
block
page
indicators
image
importance
Prior art date
Application number
MXPA05004679A
Other languages
English (en)
Inventor
He Xiaofei
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of MXPA05004679A publication Critical patent/MXPA05004679A/es

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Algebra (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

Se describen un metodo y sistema para determinar la relevancia de imagenes de paginas basandose en un analisis de enlace y diseno de pagina. Un sistema de analisis de enlace determina la relevancia entre imagenes identificando primero bloques dentro de paginas web, y despues analizando la importancia de los bloques para las paginas web, paginas web para bloques, e imagenes para bloques. Basandose en este analisis, el sistema de analisis de enlace determina el grado al cual cada imagen esta relacionada con otra imagen. El sistema de analisis de enlace tambien puede utilizar la relevancia de las imagenes para generar una clasificacion de las imagenes. El sistema de analisis de enlace tambien puede generar una representacion de vector de las imagenes basandose en su relevancia y aplicar un algoritmo de agrupacion a las representaciones de vector para identificar grupos de imagenes relacionadas.

Description

METODO Y SISTEMA PARA IDENTIFICAR RELEVANCIA DE IMAGEN UTILIZANDO ANALISIS DE ENLACE Y DISEÑO DE PAGINA CAMPO TÉCNICO La tecnología descrita se refiere generalmente a analizar páginas web y particularmente a la relevancia de imágenes de páginas web.
ANTECEDENTES Muchos servicios de máquina de búsqueda, tal como Google y Overture, proveen búsqueda para información que es accesible a través de Internet. Estos servicios de máquina de búsqueda permiten a usuarios buscar páginas de presentación, tal como páginas web, que pueden ser de interés a usuarios. Después de que un usuario presenta una solicitud de búsqueda que incluye términos de búsqueda, el servicio de máquina de búsqueda identifica páginas web que pueden estar relacionadas a aquellos términos de búsqueda. Para identificar rápidamente páginas web relacionadas, los servicios de máquina de búsqueda pueden mantener un mapa de palabras clave a páginas web. Este mapa puede ser generado al "navegar lentamente e indexar" la web (es decir, la Gran red Mundial) para identificar las palabras claves de cada página web. Para navegar lentamente la web, un servicio de máquina de búsqueda puede utilizar una lista de páginas web de raíz para identificar todas las páginas web que son accesibles a través de aquellas páginas web de raíz. Las palabras clave de cualquier página web particular pueden ser identificadas utilizando varias técnicas de recuperación de información bien conocidas, tal como identificar las palabras de un encabezado, las palabras provistas en los metadatos de la página web, las palabras que son resaltadas, y así sucesivamente. Después el servicio de máquina de búsqueda clasifica las páginas web del resultado de búsqueda basándose en la cercanía de cada ajuste, popularidad de página web (por ejemplo, Clasificación de Página de Google), y así sucesivamente. El servicio de máquina de búsqueda también puede generar una marca de relevancia para indicar qué tan importante puede ser la información de página web a la solicitud de búsqueda. El servicio de máquina de búsqueda después presenta al usuario enlaces a aquellas páginas web en un orden que está basado en sus clasificaciones. Aunque muchas páginas web están gráficamente orientadas en lo que pueden contener muchas imágenes, los servicios de máquina de búsqueda convencionales típicamente buscan basándose sólo en el contenido textual de una página web. Algunos intentos han sido hechos, sin embargo, para soportar búsqueda basada en imagen de páginas web. Por ejemplo, un usuario que ve una página web puede desear identificar otras páginas web que contienen imágenes relacionadas a una imagen en esa página web. Las técnicas de búsqueda basadas en imagen son típicamente ya sea basadas en contenido o basadas en enlace y adicionalmente utilizan rodear el texto para ayudarse al analizar imágenes. Las técnicas basadas en contenido utilizan información visual de bajo nivel para índice de imagen. Debido a que las técnicas de búsqueda · basadas en contenido son calculablemente costosas, no son prácticas para búsqueda de imagen en la web. Las técnicas de búsqueda basadas en enlace típicamente asumen esas imágenes en la misma página web más probablemente están relacionadas y esas imágenes en páginas web que están cada una enlazadas por la misma página web son relacionadas. Desafortunadamente, estas suposiciones son incorrectas en muchas situaciones principalmente porque una página web individual puede tener contenido que se relaciona con muchos tópicos diferentes. Por ejemplo, una página web para un sitio web de noticias puede contener contenido que se relaciona a un evento político internacional y contenido que se relaciona a un evento deportivo nacional. En tal caso, no es probable que una pintura de un equipo de deportes que se relaciona al evento deportivo nacional sea relacionada a una página web enlazada por el contenido que se relaciona al evento político internacional. Sería deseable tener una técnica de búsqueda basada en imagen que no sería calculablemente tan costosa como técnicas de búsqueda basadas en contenido y que, no como técnicas de búsqueda basadas en enlace convencionales, contarían los diversos tópicos que pueden ocurrir en una página web individual.
COMPENDIO DE LA INVENCION Se proporciona un sistema para determinar la relevancia de imágenes de páginas basadas en enlace y diseño de página. Un sistema de análisis de enlace determina la relevancia entre imágenes al identificar primero bloques dentro de páginas, y después analiza la importancia de los bloque a páginas, páginas a bloques, e imágenes a bloques. Basándose en este análisis, el sistema de análisis de enlace determina el grado al que cada imagen está relacionada con otra imagen. Debido a que la relevancia de una imagen a otra imagen está basada en importancia de nivel de bloque, que es una unidad más pequeña que una página, más que importancia de nivel de página, esta relevancia es una representación más precisa que técnicas de búsqueda basadas en enlace convencionales.
BREVE DESCRIPCION DE LOS DIBUJOS La Figura 1 es un diagrama de bloque que ilustra bloques, imágenes, y enlaces en una colección de muestra de páginas web. La Figura 2 es un diagrama de bloque que ilustra componentes del sistema de análisis de enlace en una modalidad. La Figura 3 es un diagrama de flujo que ilustra procesamiento de un componente de matriz de imagen a imagen en una modalidad. La Figura 4 es un diagrama de flujo que ilustra el procesamiento de un componente de matriz de generar un bloque a página en una modalidad. La Figura 5 es un diagrama de flujo que ilustra el procesamiento de un componente de matriz de generar página a bloque en una modalidad. La Figura 6 es un diagrama de flujo que ilustra el procesamiento de un componente de matriz de generar bloque a imagen en una modalidad.
DESCRIPCION DETALLADA Se proporcionan un método y sistema para determinar relevancia de imágenes de páginas basándose en análisis de enlace y diseño de página. En una modalidad, un sistema de análisis de enlace determina relevancia entre imágenes al identificar primero bloques dentro de páginas web, y después analizar la importancia de los bloques a páginas web, páginas web a bloques, e imágenes a bloques. Basándose en este análisis, el sistema de análisis de enlace determina el grado al que cada imagen está relacionada con otra imagen. Un bloque de página web representa un área de la página web que aparece para relacionar un tópico similar. Por ejemplo, un artículo de noticias que se refiere a un evento político internacional puede representar un bloque, y un artículo de noticias que se refiere a un evento deportivo nacional puede representar otro bloque. La importancia de un bloque a una página puede indicar una probabilidad que un usuario se enfocará en ese bloque cuando ve esa página. La importancia de una página a un bloque puede indicar la probabilidad que un usuario seleccionará de ese bloque un enlace a esa página. La importancia de una imagen a un bloque puede indicar la probabilidad que un usuario se enfocará en esa imagen cuando ve ese bloque. Después de calcular un indicador numérico de estas importancias para pares de páginas y bloques y pares de imágenes y bloques, el sistema de análisis de enlace genera un indicador de la relevancia de cada imagen con otra imagen al combinar la importancia calculada de un bloque a una página, la importancia calculada de una página a un bloque, y la importancia calculada de una imagen a un bloque. Debido a que la relevancia de una imagen a ot,ra imagen está basada en importancia de nivel de bloque más que en importancia de nivel de página, esta relevancia es una representación más precisa de relevancia que técnicas de búsqueda basadas en enlace convencionales. El sistema de análisis de enlace también puede utilizar relevancia de imágenes para generar una clasificación de las imágenes. La clasificación puede estar basada en una probabilidad que un usuario que inicia viendo una imagen arbitraria hará transición a otra imagen después de arbitrariamente un gran número de transiciones entre imágenes. El sistema de análisis de enlace también puede generar una representación de vector de las imágenes basándose en su relevancia y aplicar un algoritmo de agrupación a las representaciones de vector para identificar grupos de imágenes relacionadas. La Figura 1 es un diagrama de bloque que ilustra bloques, imágenes, y enlaces en una colección de muestra de páginas web. Esta colección de páginas web incluye páginas web 1-4. Los bloques dentro de las páginas web son representados como rectángulos, las imágenes dentro de bloques son representadas como círculos, y los enlaces dentro de bloques son representados como flechas dirigidas de un bloque a una página web enlazada. La página web 1 contiene el bloque 1, que contiene imágenes 1 y 2 y enlaces 1 y 2. La página web 2 contiene el bloque 2, que contiene imagen 3 y enlace 3, y el bloque 3, que contiene imagen 4 y enlace 4. La página web 3 contiene el bloque 4, que contiene imagen 5 y enlaces 5 y 6, y el bloque 5, que contiene imagen 6 y enlace 7. La página web 4 contiene el bloque 5, que contiene imágenes 7, 8, 9, y 10 y enlace 8. Debido a que el sistema de análisis de enlace basa relevancia de imagen en bloques más que páginas web completas, la relevancia de una imagen a otras imágenes es probablemente basada en una representación más precisa del tópico de una imagen. Por ejemplo, la página web 2 contiene los bloques 2 y 3, que pueden estar dirigidos a diferentes tópicos tal como un evento político internacional y un evento deportivo nacional, respectivamente. El sistema de análisis de enlace puede identificar que imagen 4 está más cercanamente relacionada a las imágenes de página web 4 que a las imágenes de página web 3, debido a que bloque 3, que contiene imagen 4, tiene un enlace a página web 4. Por ejemplo, página web 4 está más probablemente relacionada a deportes que la página web 3 debido a que bloque 3 contiene un enlace a página web 4, pero no a página web 3. Como tal, imagen 4 está más probablemente relacionada a imágenes 7, 8, 9, y 10 que a imágenes 5 y 6 de página web 3. Las técnicas que no están basadas en análisis de nivel de bloque pueden identificar que imagen 4 está igualmente relacionada a página web 3 y página web 4 debido a que aquellas técnicas no distinguen bloque 2 de bloque 3 en página web 2. En una modalidad, el sistema de análisis de enlace calcula la importancia de una página a un bloque, para cada cloque y combinación de página, como la probabilidad que un usuario que selecciona un enlace de ese bloque seleccionará un enlace a esa página. Si un bloque no tiene un enlace a una página, entonces la probabilidad es cero. Si un bloque tiene un enlace a una página, entonces el sistema de análisis de enlace puede asumir que un usuario seleccionará cada uno de los enlaces del bloque con igual probabilidad. Una matriz de bloque a página de probabilidades es definida por la siguiente ecuación: si hay un enlace eC6hque i a. [a página j en donde Z¡j representa la probabilidad que un usuario que selecciona un enlace de bloque i seleccionará el enlace a página j y s¡ es el número de enlaces en bloque i. La matriz de bloque a página Z para las páginas web de la Figura 1 es mostrada en el Cuadro 1. Las filas del Cuadro 1 representan los bloques y las columnas representan las páginas. En este ejemplo, las probabilidad que un usuario que selecciona un enlace de bloque 4 seleccionará un enlace a página web 2 es .5.
Cuadro 1 En una modalidad, el sistema de análisis de enlace calcula, para cada página y combinación de bloque, ia importancia de un bloque a una página como la probabilidad de ese bloque siendo el bloque más importante de la página. La probabilidad de un bloque no contenido en una página siendo el bloque más importante de esa página es cero. El sistema de análisis de enlace puede asumir que cada bloque contenido en una página es más importante con igual probabilidad. Una matriz e página a bloque de probabilidades es defienda por la siguiente ecuación: l/s¡ si (a página i contiene Síbquej onces (2) 0 ent en donde X¡j representa la probabilidad que bloque j es el bloque más importante de página i y s¡ es el número de bloques en página i.
En una modalidad, el sistema de análisis de enlace calcula una probabilidad que un bloque es el bloque más importante de una página basándose en posición, tamaño, fuente, color, y otros atributos físicos del bloque. Por ejemplo, un gran bloque que está centrado en la mitad de una página puede ser más importante que un bloque pequeño en la esquina inferior izquierda de la página. Una técnica para calcular importancia de bloque y el grado de coherencia de bloques es descrita en la solicitud de patente de E. U. A. No. , titulada "Método y Sistema para Calcular Importancia de un Bloque Dentro de una Página de Presentación" y archivada el 29 de abril, 2004, que es incorporada aquí por referencia. La matriz de página a bloque puede ser más generalmente representada como: en donde fP¡ es una función que representa la probabilidad que bloque j es el bloque más importante de página i. En una modalidad, la función fPi es definida como el tamaño de bloque j dividido por la distancia del centro del bloque del centro de la pantalla cuando página i es presentada. La función / puede ser definida por lo siguiente: tamaño de Bbque 6 en página p¡ (4) dist. deí centro de 6 Rada el centro de antaíCa en donde a es un factor de normalización que asegura que la suma de los valores de la función para un bloque es 1. La función / puede ser considerada para ser la probabilidad que un usuario está enfocado en bloque j cuando ve página i. La matriz de página a bloque X para las páginas web de la Figura 1 es mostrada en el Cuadro 2. Las filas del Cuadro 2 representan las páginas y las columnas representan los bloques. En este ejemplo, la probabilidad que bloque 4 es e! bloque más importante de página web 3 es .8.
Cuadro 2 En una modalidad, el sistema de análisis de enlace calcula, para cada bloque y combinación de imagen, la importancia de una imagen a un bloque como la probabilidad de esa imagen siendo la imagen más importante de ese bloque. Si un bloque no contiene una cierta imagen, entonces la probabilidad de esa imagen siendo la más importante de ese bloque es cero. El sistema de análisis de enlace puede asumir que cada imagen de un bloque es más importante con igual probabilidad. El sistema de análisis de enlace puede utilizar otras medidas de importancia de una imagen a un bloque, tal como basado en los tamaños relativos de las imágenes, la ubicación de las imágenes dentro de los bloques, y así sucesivamente. Una matriz de bloque a imagen de las probabilidades es definida por la siguiente ecuación: si [a Bloque i contiene imagen j entonces en donde YSi representa la probabilidad que imagen j es la imagen más importante de bloque i y s¡ es el número de imágenes en bloque i. La matriz de bloque a imagen Y para las páginas web de la Figura 1 es mostrada en Cuadro 3. Las filas de Cuadro 3 representan bloques y las columnas representan las imágenes. En este ejemplo, la probabilidad que imagen 2 es la imagen más importante de bloque 1 es .5.
Cuadro 3 En una modalidad, el sistema de análisis de enlace calcula la importancia de una página a otra página, para cada par ordenado de páginas, como la probabilidad que un usuario que ve la primer página del par seleccionará un enlace a la segunda página del par. El sistema de análisis de enlace calcula la probabilidad para cada par al sumar para cada bloque de la primer página la probabilidad de ese bloque siendo el bloque más importante de la primer página mide el tiempo de la probabilidad que la segunda página es la página más importante a ese bloque. La importancia de una página a otra página de esa forma factores en esos usuarios pueden preferir seleccionar enlaces dentro de los bloques más importantes de una página. Una matriz de página a página de estas probabilidades es representada por lo siguiente: WP = wz (6) en donde WP representa la matriz de página a página. La probabilidad de W puede alternativamente ser representada como: Probffi \ a) = Prob( \ b)Prob(b \ a) (7) en donde a representa la primer página del par y ß representa la segunda página del par. La matriz de página a página WP para las páginas web de la Figura 1 es mostrada en Cuadro 4. En este ejemplo, la probabilidad que un usuario que ve página 3 hará transición a página 2 es 4.
Cuadro 4 El sistema de análisis de enlace calcula, para cada par ordenado de bloques, la importancia de un bloque para otro bloque como la probabilidad que un usuario que ve el primer bloque del par seleccionará un enlace a la página que contiene el segundo bloque del par y encontrará ese segundo bloque para ser el más importante de su página. El sistema de análisis de enlace calcula la probabilidad para cada par al sumar las probabilidades que un usuario que selecciona un enlace del primer bloque seleccionará un enlace para la página que contiene el segundo bloque que mide el tiempo de la probabilidad de ese segundo bloque siendo el bloque más importante de su página. De esa forma, la importancia de un bloque a otro bloque representa que un usuario que ve el primer bloque seleccionará un enlace a la página que contiene el segundo bloque y enfoca su atención en el segundo bloque. Una matriz de bloque a bloque de estas probabilidades es representada por la siguiente: WB = ZX (8) en donde WB representa la matriz de bloque a bloque. Las probabilidades de W pueden alternativamente ser representadas como: WB(a,b)=Vxob{b\a) La matriz de bloque a bloque WB para las páginas web de la Figura 1 es mostrada en el Cuadro 5. En este ejemplo, la probabilidad que un usuario que ve bloque 4 brincará a página 2 y enfocará su atención en bloque 3 es .25.
Cuadro 5 En una modalidad, el sistema de análisis de enlace se divide en matriz de bloque a bloque la probabilidad que dos bloques en la misma página puedan estar relacionados. La matriz de bloque a bloque revisada es representada por lo siguiente: WE = (1-t) ZX + tDU (10) en donde D es una matriz diagonal D¡¡ = ?jU¡j, U es una matriz de coherencia, y t es un factor de peso. La matriz U es definida como sigue: TT 0 si Bloque i y Bloque f están en váainas diferentes iJ = \ LLr>>n(/rC en *tonces (11) ' en donde DOC es el grado de coherencia del bloque más pequeño que contiene ambos bloque i y bloque j. El factor de peso t típicamente puede ser establecido a un valor pequeño (por ejemplo, menos de .1) debido a que en la mayoría de los casos bloques diferentes en la misma página se refieren a tópicos diferentes. El sistema de análisis de enlace calcula para cada par ordenado de imágenes la probabilidad que la primera imagen del par está relacionado a la segunda imagen del par. El sistema de análisis de enlace calcula la probabilidad al sumar las probabilidades de bloque a bloque para la combinación de cada bloque que contiene la primera imagen a cada bloque que contiene la segunda imagen. Una matriz de imagen a imagen de estas probabilidades es representada por lo siguiente: W, = YTWBY (12) en donde W| representa la matriz de imagen a imagen. La matriz de imagen a imagen W| para las páginas web de la Figura 1 es mostrada en Cuadro 6. En este ejemplo, la probabilidad que un usuario que ve bloque 10 después verá página 3 y se enfocará en bloque 5 es .05.
Cuadro 6 En una modalidad, el sistema de análisis de enlace divide en la matriz de imagen a imagen la probabilidad que dos bloques en la misma página puedan estar relacionados. La matriz de imagen a imagen revisada es representada por lo siguiente: W, = tDYTY + (1-t) YTWBY (13) en donde t es un factor de peso y D es una matriz diagonal que representa Dn = Ej(YTY)u (14) El factor de peso t puede ser establecido a un valor grande (por ejemplo, .7-.9) debido a que dos imágenes en el mismo bloque están más probablemente relacionadas. En una modalidad, el sistema de análisis de enlace genera una representación de vector de cada imagen de la matriz de imagen a imagen. El sistema de análisis de enlace genera los vectores que utilizan un acercamiento de menos cuadros que factores en similitud entre un par de imágenes como se indicó por la matriz de imagen a imagen. El sistema de análisis de enlace inicialmente convierte la matriz de imagen a imagen a una matriz de similitud representada por lo siguiente: S=(W, + W,T)/2 (15) en donde S representa la matriz de similitud. Si y¡ es una representación de vector de imagen i, entonces el establecimiento óptimo de vectores de imagen es , ym) obtenido utilizando la siguiente función de objetivo: Si D es una matriz diagonal tai que D¡¡ es la suma de los valores de la iva fila de la matriz de similitud S, entonces el problema de minimización reduce lo siguiente: minyrZy (17) en donde L es igual a D-S. La solución es dada por la solución de valor propio mínimo al problema de valor propio general: Ly = Ay (18) Si (y°, ?°), (y1, /i1), (y"1"1, ?"1"1) son soluciones a Ecuación 16, y ?° <?1 <... <?™- entonces ?° = 0 y y° (1, 1 , .... 1). El sistema de análisis de enlace selecciona valores propios 1 a través de K para representar las imágenes en un espacio de Euclides k-dimensional. El vector para una imagen es representado como sigue: imagen j<- (y1(j),..., yk(j)) (19) en donde y'(j) jv0 elemento de y1. El sistema de análisis de enlace identifica grupos de imágenes relacionadas al representar cada imagen por un vector con el fin de que la distancia entre el vector de imagen represente su similitud semántica. Varios algoritmos de agrupamiento pueden ser aplicados a los vectores de imagen para identifica grupos de imágenes semánticamente relacionadas. Estos algoritmos de agrupamiento pueden incluir un vector de Servidor de una teoría de gráfica de espectro, un agrupamiento de k-medios, y así sucesivamente. El agrupamiento de imágenes puede ser utilizado para ayudar a la navegación. Por ejemplo, cuando se navega a una página web, un usuario puede seleccionar una imagen y solicitar ver imágenes relacionadas. Las páginas web que contienen las imágenes que son agrupadas junto con la imagen seleccionada después pueden ser presentadas como el resultado de la solicitud. En una modalidad, las páginas web pueden ser presentadas en un orden que está basado en la distancia entre el vector de imagen de cada imagen y el vector de imagen de la imagen seleccionada. El agrupamiento de imágenes también puede ser utilizado para proporcionar una visualización multidimensional de imágenes que están semánticamente relacionadas. Los vectores de imagen pueden ser generados para las imágenes de una colección de páginas web. Una vez que los grupos son identificados, el sistema puede presentar una indicación de cada grupo de una cuadrícula bidimensional que representa grupos basándose en diferentes valores propios. El sistema de análisis puede clasificar imágenes basándose en la matriz de imagen a imagen. La matriz de imagen a imagen representa la probabilidad de hacer transición de imagen a imagen. Es posible que un saurio hará transición a una imagen aleatoriamente. Para contar esto, el sistema de análisis genera una matriz de transición de probabilidad que divide esta aleatoriedad en la matriz de imagen a imagen como sigue: P= eW + (1 -e) U (20) en donde P es una matriz de transición de probabilidad, e es un factor de peso (por ejemplo, 0.1-0.2), y U es una matriz de transición de probabilidades de transición uniforme (U¡j = 1/m para todo Debido a la introducción de U, la gráfica está conectada y una distribución estacionaria de una caminata aleatoria de la gráfica existe. La clasificación de una imagen puede ser representada como sigue: ?t p = n (21) en donde n es un valor propio de PT con valor propio 1 que representa la clasificación de imagen. p = (TT-Í, TT nm) representa una distribución de probabilidad estacionaria y /r¡ representa la clasificación de imagen i. La Figura 2 es un diagrama de bloque que ilustra componentes del sistema de análisis de enlace en una modalidad. El sistema de análisis de enlace 200 incluye un almacenamiento de página web 201, un componente de clasificación de imagen calculada 202, un componente de grupos de imagen de identificación 203, y un componente de matriz de imagen a imagen para generar 211. El componente de matriz de imagen a imagen para generar 211 utiliza un componente de bloques de identificación 212, un componente de matriz de bloque a página para generar 213, un componente de matriz de página a bloque para generar 214, y un componente de matriz de bloque a imagen para generar 215 para generar una matriz que indica la relevancia de imagen a imagen. El almacenamiento de página web contiene la colección de páginas web. El componente de clasificación de imagen para calcular utiliza el componente de imagen a imagen para generar para calcular la relevancia de las imágenes y después utiliza aquellos cálculos de la relevancia para clasificar las imágenes. El componente de grupos de imagen para identificar utiliza el componente de matriz de imagen a imagen para generar para calcular la relevancia de las imágenes, genera una representación de vector de las imágenes basándose en la matriz, e identifica grupos de imágenes que utilizan los vectores generados. Aunque no es mostrado en la Figura 2, el sistema de análisis de enlace también puede incluir un componente para calcular elementos de clasificación de una página web diferente a las imágenes. Por ejemplo, el sistema de análisis de enlace puede aplicar las clasificaciones de Ecuaciones 20 a 21 para la matriz de bloque a bloque para clasificar los bloques y para la matriz de página a página para clasificar las mismas páginas. El dispositivo de cómputo en el que el sistema de análisis de enlace es implementado pude incluir una unidad de procesamiento central, memoria, dispositivos de entrada (por ejemplo, teclado y dispositivos de señalamiento), dispositivos de salida (por ejemplo, dispositivos de presentación), y dispositivos de almacenamiento (por ejemplo, unidades de disco). Los dispositivos de memoria y almacenamiento son medios legibles por computadora que pueden contener instrucciones que implementan el sistema de análisis de enlace. Además, las estructuras de datos y estructuras de mensaje pueden ser almacenadas o transmitidas a través de un medio de transmisión de datos, tal como una señal en un enlace de comunicaciones. Varios enlaces de comunicaciones pueden ser utilizados, tal como Internet, una red de área local, una red de área amplia, o una conexión de marcado de punto a punto. La Figura 2 ilustra un ejemplo de un ambiente operativo adecuado en el que el sistema de análisis de enlace puede ser implementado. El sistema operativo es sólo un ejemplo de un ambiente operativo adecuado y no pretende sugerir cualquier limitación al alcance de uso o funcionalidad del sistema de análisis de enlace. Otros sistemas, ambientes, y configuraciones de cómputo bien conocidos que pueden ser adecuados para uso incluyen computadoras personales, computadoras de servidor, dispositivos portátiles o laptop, sistemas de multiprocesador, sistemas basados de microprocesador, aparatos electrónicos programables para el consumidor, PCs de red, minicomputadoras, macrocomputadoras, ambientes de cómputo distribuidos que incluyen cualquiera de los sistemas o dispositivos anteriores, y similares. El sistema de análisis de enlace puede ser descrito en el contexto general de instrucciones ejecutables por computadora, tal como módulos de programa, ejecutados por uno o más componentes u otros dispositivos. Generalmente, módulos de programa incluyen rutinas, programas, objetos, componentes, estructuras de datos, etc. que realizan tareas particulares o ¡mplementan tipos de datos abstractos particulares. Típicamente, la funcionalidad de los módulos de programa puede ser combinada o distribuida como se desea en varias modalidades. La Figura 3 es un diagrama de flujo que ilustra procesamiento de un componente de matriz de imagen a imagen para generar en una modalidad. En bloque 301, el componente identifica los bloques dentro de las páginas web almacenadas en el almacenamiento de página web. En el bloque 302, el componente invoca el componente de matriz de bloque a página para generar. En el bloque 303, el componente invoca el componente de matriz de página a bloque para generar. En el bloque 304, el componente invoca el componente de matriz de bloque a imagen para generar. En el bloque 305, el componente genera la matriz de bloque a bloque. En el bloque 306, el componente genera la matriz de imagen a imagen y después la completa. La Figura 4 es un diagrama de flujo que ilustra el procesamiento de un componente de matriz de bloque a página para generar en una modalidad. En los bloques 401-408, el componente gira seleccionando cada página, cada bloque dentro de cada página, y cada enlace dentro de cada bloque y establece la importancia de las páginas enlazadas por ese enlace, para ese bloque. En el bloque 401, el componente selecciona la siguiente página. En bloque de decisión 402, si todas las páginas ya han sido seleccionadas, después el componente regresa la matriz de bloque a página, también el componente continúa en bloque 403. En bloque 403, el componente selecciona el siguiente bloque de la página seleccionada. En el bloque de decisión 404, si todos los bloques de la página seleccionada ya han sido seleccionados, después el componente gira a bloque 401 para seleccionar la siguiente página, también el componente continúa en bloque 405. En bloque 405, el componente cuenta el número de enlaces dentro del bloque seleccionado. En el bloque 406, el componente selecciona la página enlazada del siguiente enlace del bloque seleccionado. En el bloque de decisión 407, si todas las páginas enlazadas del bloque seleccionado ya han sido seleccionadas, después el componente gira a bloque 403 para seleccionar el siguiente bloque, también el componente continúa en bloque 408. En bloque 408, el componente establece la importancia de la página enlazada al bloque y después gira a bloque 406 para seleccionar la página enlazada al siguiente enlace del bloque seleccionado. La Figura 5 es un diagrama de flujo que ilustra el procesamiento de un componente de matriz de página a bloque para generar en una modalidad. En bloques 501-506, el componente gira seleccionando cada página y cada bloque dentro de cada página y estableciendo la importancia de ese bloque a la página seleccionada. En bloque 501, el componente selecciona la siguiente página del almacenamiento de página web. En el bloque de decisión 502, si todas las páginas ya han sido seleccionadas, después el componente regresa la matriz de página a bloque, también el componente continúa en bloque 503. En bloque 503, el componente selecciona el siguiente bloque de la página seleccionada. En el bloque de decisión 504, si todos los bloques de la página seleccionada ya han sido seleccionados, después el componente gira a bloque 501 para seleccionar la siguiente página, también el componente continúa en el bloque 505. En el bloque 505, el componente calcula la importancia del bloque seleccionado a la página seleccionada. En el bloque 506, el componente establece la importancia del bloque seleccionado a la página seleccionada y después gira a bloque 503 para seleccionar el siguiente bloque de la página seleccionada. La Figura 6 es un diagrama de flujo que ilustra el procesamiento de un componente de matriz de bloque a imagen para generar en una modalidad. En bloques 601-607, el componente gira seleccionando cada página, cada bloque dentro de cada página, y cada imagen dentro de cada bloque y estableciendo la importancia de la imagen al bloque seleccionado. En el bloque 601, el componente selecciona la siguiente página del almacenamiento de página web. En el bloque de decisión 602, si todas las páginas ya han sido seleccionadas, después el componente regresa la matriz de bloque a imagen, también el componente continúa en bloque 603. En el bloque 603, el componente selecciona el siguiente bloque de la página seleccionada. En el bloque de decisión 604, si todos los bloques de la página seleccionada ya han sido seleccionados, después el componente gira a bloque 601 para seleccionar la siguiente página, también el componente continúa en el bloque 605. En el bloque 605, el componente cuenta el número de imágenes del bloque seleccionado. En el bloque 606, el componente selecciona la siguiente imagen del bloque seleccionado. En el bloque de decisión 607, si todas las imágenes del bloque seleccionado ya han sido seleccionadas, después el componente gira a bloque 603 para seleccionar el siguiente bloque, también el componente continúa en bloque 608. En el bloque 608, el componente establece la importancia de la imagen seleccionada al bloque seleccionado y después gira a bloque 606 para seleccionar la siguiente imagen del bloque seleccionado. Un experto en la técnica apreciará que aunque las modalidades específicas del sistema de análisis de enlace han sido descritas aquí para propósitos de ilustración, varias modificaciones pueden ser hechas sin apartarse del espíritu y alcance de la invención. Por consiguiente, la invención no está imitada excepto por las reivindicaciones anexas.

Claims (39)

REIVINDICACIONES
1.- Un método en un sistema de computadora para determinar relevancia entre imágenes dentro de los bloques de páginas, el método comprende: calcular indicadores de importancia de un bloque a una página; calcular indicadores de importancia de una página a un bloque; calcular indicadores de importancia de una imagen a un bloque; y calcular indicadores de imagen a imagen de relevancia de una imagen a otra imagen al combinar los indicadores de importancia de un bloque a una página, los indicadores de importancia de una página a un bloque, y los indicadores de importancia de una imagen a un bloque.
2.- El método de acuerdo con la reivindicación 1, en donde los indicadores de importancia de una página a un bloque son probabilidades que un usuario seleccionará un enlace de cada bloque que llevará de una a otra página.
3. - El método de acuerdo con la reivindicación 1, en donde los indicadores de importancia de un bloque a una página son probabilidades que un usuario se enfocará en cada bloque de la página.
4. - El método de acuerdo con la reivindicación 1, en donde los indicadores de importancia de una imagen a un bloque son probabilidades que un usuario se enfocará en cada imagen de cada bloque.
5.- El método de acuerdo con la reivindicación 1, en donde los indicadores de importancia de una página a un bloque son probabilidades que un usuario seleccionará un enlace de cada bloque que llevará de una a otra página, los indicadores de importancia de un bloque a una página son probabilidades que un usuario se enfocará en cada bloque de la página, y los indicadores de importancia de una imagen a un bloque son probabilidades que un usuario se enfocará en cada imagen de cada bloque.
6.- El método de acuerdo con la reivindicación 1, que incluye calcular un orden de las imágenes de los indicadores de imagen a imagen.
7. - El método de acuerdo con la reivindicación 6, en donde el orden calculado está basado en una probabilidad que un usuario que inicia en una imagen arbitraria viajará a otra imagen después de un número arbitrariamente grande de transiciones entre imágenes.
8. - El método de acuerdo con la reivindicación 1, en donde los indicadores imagen a imagen son calculados como sigue: W, = YTWBY en donde W, es una matriz de los indicadores de imagen a imagen, Y es una matriz de indicadores imagen a bloque, y wB = zx en donde WB es una matriz de indicadores de bloque a bloque, Z es una matriz de los indicadores de importancia de una página a un bloque, y X es una matriz de los indicadores de importancia de un bloque a una página.
9.- El método de acuerdo con la reivindicación 1 que incluye: generar una representación de vector de cada imagen basándose en los indicadores de imagen a imagen; y identificar grupos de imágenes basándose en sus representaciones de vector en donde las imágenes en un grupo están relacionadas.
10.- Un método en un sistema de computadora para determinar relevancia entre bloques de páginas, el método comprende: calcular indicadores de importancia de una página a un bloque; calcular indicadores de importancia de un bloque a una página; y calcular indicadores de bloque a bloque de relevancia de un bloque a otro bloque al combinar los indicadores de importancia de un bloque a una página y los indicadores de importancia de una página a un bloque.
11.- El método de acuerdo con la reivindicación 10, en donde los indicadores de importancia de una página a un bloque son probabilidades que un usuario seleccionará un enlace de cada bloque que llevará de una a otra página.
12.- El método de acuerdo con la reivindicación 10, en donde los indicadores de importancia de un bloque a una página son probabilidades que un usuario se enfocará en cada bloque de la página.
13. - El método de acuerdo con la reivindicación 10, en donde los indicadores de importancia de una página a un bloque son probabilidades que un usuario seleccionará un enlace de cada bloque que llevará de una a otra página y los indicadores de importancia de un bloque a una página son probabilidades que un usuario se enfocará en cada bloque de la página.
14. - El método de acuerdo con la reivindicación 10, que incluye calcular un orden de los bloques de los indicadores de bloque a bloque.
15. - El método de acuerdo con la reivindicación 14, en donde el orden calculado está basado en una probabilidad que un usuario que inicia en un bloque arbitrario hará transición a otro bloque después de un número arbitrariamente grande de transiciones entre bloques.
16. - El método de acuerdo con la reivindicación 10, en donde los indicadores de bloque a bloque son calculados como sigue: WB = ZX en donde X es una matriz de los indicadores de importancia de un bloque a una página y Z es una matriz de los indicadores de importancia de una página a un bloque,
17.- Un método en un sistema de computadora para determinar relevancia entre páginas que tienen bloques, el método comprende: calcular indicadores de importancia de una página a un bloque; calcular indicadores de importancia de un bloque a una página; y calcular indicadores de página a página de relevancia de una página a otra página al combinar los indicadores de bloque a página y los indicadores de página a bloque.
18. - El método de acuerdo con la reivindicación 17, en donde los indicadores de importancia de una página a un bloque son probabilidades que un usuario seleccionará un enlace de cada bloque que llevará de una a otra página.
19. - El método de acuerdo con la reivindicación 17, en donde los indicadores de importancia de un bloque a una página son probabilidades que un usuario se enfocará en cada bloque de la página.
20. - El método de acuerdo con la reivindicación 17, en donde los indicadores de importancia de un bloque a una página son probabilidades que un usuario se enfocará en cada bloque de la página y los indicadores de importancia de una página a un bloque son probabilidades que un usuario seleccionará un enlace de cada bloque que llevará de una a otra página.
21. - El método de acuerdo con la reivindicación 17, que incluye calcular un orden de las páginas de los indicadores de página a página.
22.- El método de acuerdo con la reivindicación 21, en donde el orden calculado está basado en una probabilidad que un usuario que inicia en una página arbitraria hará transición a otra página después de un número arbitrariamente grande de transiciones entre páginas.
23.- El método de acuerdo con la reivindicación 17, en donde los indicadores de página a página son calculados como sigue: WP - xz en donde WP es una matriz de indicadores de página a página, X es una matriz de los indicadores de importancia de un bloque a una página, y Z es una matriz de los indicadores de importancia de una página de un bloque.
24.- Un método en un sistema de computadora para identificar imágenes relacionadas en páginas que tienen conexiones, cada enlace siendo de un bloque en una página que contiene una imagen a una página que tiene otro bloque que contiene otra imagen, el método comprende: para cada imagen, calcular una probabilidad para una y otra imagen que si un usuario está viendo la imagen el usuario seleccionará un enlace del bloque en una página que contiene esa imagen que es para otra página que tiene un bloque que contiene la otra imagen; para cada imagen, generar una representación de vector de la imagen basándose en las probabilidades calculadas; y identificar grupos de imágenes basándose en sus representaciones de vector en donde imágenes en un grupo están relacionadas.
25.- El método de acuerdo con la reivindicación 24, en donde la generación de una representación de vector incluye seleccionar representaciones de vector que minimiza una función de objetivo.
26.- El método de acuerdo con la reivindicación 26, en donde la función de objetivo es la suma del cuadro de la distancia entre las representaciones de vector para cada par de imágenes veces el tiempo de una similitud del par de imágenes que es derivado de las probabilidades calculadas.
27.- El método de acuerdo con la reivindicación 24, en donde el cálculo de la probabilidad incluye calcular probabilidades que indican una probabilidad que un usuario seleccionará un enlace de cada bloque que llevará de una a otra página, probabilidades que indican una probabilidad que un usuario se enfocará en cada bloque de la página, y probabilidades que indican una probabilidad que un usuario se enfocará en cada imagen de cada bloque.
28.- Un medio legible por computadora que contiene instrucciones para controlar un sistema de computadora para determinar la relevancia entre elementos de página, el método comprende: calcular indicadores de importancia de un primer elemento a un segundo elemento; calcular indicadores de importancia de un segundo elemento a un primer elemento; y calcular indicadores de relevancia de un primer elemento a otro primer elemento al combinar los indicadores de importancia de un primer elemento a un segundo elemento y los indicadores de importancia de un segundo elemento a un primer elemento.
29. - El medio legible por computadora de acuerdo con la reivindicación 28, en donde el primer elemento es una página y el segundo elemento es un bloque de una página.
30. - El medio legible por computadora de acuerdo con la reivindicación 28, en donde el primer elemento es un bloque de una página y el segundo elemento es una página.
31.- El medio legible por computadora de acuerdo con la reivindicación 28, en donde el primer elemento es una imagen de un bloque de una página y el segundo elemento es un bloque.
32. - El medio legible por computadora de acuerdo con la reivindicación 28, en donde los indicadores de importancia son probabilidades.
33. - Un sistema de computadora para determinar relevancia entre imágenes dentro de bloques de páginas, que comprende: indicadores de importancia de una página a un bloque; indicadores de importancia de un bloque a una página; indicadores de importancia de una imagen a un bloque; y medios para calcular indicadores de imagen a imagen de relevancia de una imagen a otra imagen al combinar los indicadores de importancia de un bloque a una página, los indicadores de importancia de una página a un bloque, y los indicadores de imagen a bloque.
34. - El sistema de computadora de acuerdo con la reivindicación 33, que incluye medios para calcular indicadores de importancia de una página a un bloque como probabilidades que un usuario seleccionará un enlace de cada bloque que llevará de una a otra página.
35. - El sistema de computadora de acuerdo con la reivindicación 33, que incluye medios para calcular indicadores de importancia de un bloque a una página como probabilidades que un usuario se enfocará en cada bloque de la página.
36.- El sistema de computadora de acuerdo con la reivindicación 33, que incluye medios para calcular los indicadores de importancia de una imagen a un bloque como probabilidades que un usuario se enfocará en cada imagen de cada bloque.
37. - El sistema de computadora de acuerdo con la reivindicación 33, que incluye medios para calcular un orden de las imágenes de los indicadores de imagen a imagen.
38. - El sistema de computadora de acuerdo con la reivindicación 37, en donde el orden calculado está basado en una probabilidad que un usuario que inicia en una imagen arbitraria hará transición a otra imagen después de un número arbitrariamente grande de transiciones entre imágenes.
39. - El sistema de computadora de acuerdo con la reivindicación 33 que incluye: medios para generar una representación de vector de cada imagen basándose en los indicadores de imagen a imagen; y medios para identificar grupos de imágenes basándose en sus representaciones de vector en donde las imágenes en un grupo están relacionadas.
MXPA05004679A 2004-04-29 2005-04-29 Metodo y sistema para identificar relevancia de imagen utilizando un analisis de enlace y diseno de pagina. MXPA05004679A (es)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/834,483 US7293007B2 (en) 2004-04-29 2004-04-29 Method and system for identifying image relatedness using link and page layout analysis

Publications (1)

Publication Number Publication Date
MXPA05004679A true MXPA05004679A (es) 2005-11-17

Family

ID=34939562

Family Applications (1)

Application Number Title Priority Date Filing Date
MXPA05004679A MXPA05004679A (es) 2004-04-29 2005-04-29 Metodo y sistema para identificar relevancia de imagen utilizando un analisis de enlace y diseno de pagina.

Country Status (10)

Country Link
US (2) US7293007B2 (es)
EP (1) EP1591921B1 (es)
JP (1) JP4634214B2 (es)
KR (1) KR101130429B1 (es)
CN (1) CN1694105B (es)
AU (1) AU2005201771A1 (es)
BR (1) BRPI0501448A (es)
CA (1) CA2505311A1 (es)
MX (1) MXPA05004679A (es)
RU (1) RU2390833C2 (es)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040193698A1 (en) * 2003-03-24 2004-09-30 Sadasivuni Lakshminarayana Method for finding convergence of ranking of web page
US7293007B2 (en) * 2004-04-29 2007-11-06 Microsoft Corporation Method and system for identifying image relatedness using link and page layout analysis
US8081827B2 (en) * 2006-02-28 2011-12-20 Ricoh Co., Ltd. Compressed data image object feature extraction, ordering, and delivery
CN100392656C (zh) * 2006-05-10 2008-06-04 南京大学 Web搜索中的图文协同方法
US7877384B2 (en) * 2007-03-01 2011-01-25 Microsoft Corporation Scoring relevance of a document based on image text
US7676520B2 (en) * 2007-04-12 2010-03-09 Microsoft Corporation Calculating importance of documents factoring historical importance
US9535810B1 (en) * 2007-04-24 2017-01-03 Wal-Mart Stores, Inc. Layout optimization
US7870130B2 (en) * 2007-10-05 2011-01-11 International Business Machines Corporation Techniques for identifying a matching search term in an image of an electronic document
US8051083B2 (en) * 2008-04-16 2011-11-01 Microsoft Corporation Forum web page clustering based on repetitive regions
US20090288034A1 (en) * 2008-05-19 2009-11-19 International Business Machines Corporation Locating and Identifying Controls on a Web Page
US20100205176A1 (en) * 2009-02-12 2010-08-12 Microsoft Corporation Discovering City Landmarks from Online Journals
US7945668B1 (en) * 2009-08-21 2011-05-17 Narus, Inc. System and method for content-aware co-clustering algorithm based on hourglass model
US9323426B2 (en) 2009-10-05 2016-04-26 Google Inc. System and method for selecting information for display based on past user interactions
JP4846071B2 (ja) * 2010-02-10 2011-12-28 パナソニック株式会社 画像評価装置、画像評価方法、プログラム、集積回路
WO2012012911A1 (en) * 2010-07-28 2012-02-02 Hewlett-Packard Development Company, L.P. Producing web page content
US9325804B2 (en) * 2010-11-08 2016-04-26 Microsoft Technology Licensing, Llc Dynamic image result stitching
US9384216B2 (en) * 2010-11-16 2016-07-05 Microsoft Technology Licensing, Llc Browsing related image search result sets
US8503769B2 (en) 2010-12-28 2013-08-06 Microsoft Corporation Matching text to images
WO2012101697A1 (ja) * 2011-01-26 2012-08-02 パナソニック株式会社 画像管理装置、画像管理方法、プログラム、記録媒体、集積回路
KR101428538B1 (ko) * 2012-05-11 2014-08-12 (주)다음소프트 콘텐츠 블록 제공 방법, 이를 수행하는 콘텐츠 블록 제공 서버 및 이를 저장한 기록매체
CN103593344B (zh) * 2012-08-13 2016-09-21 北大方正集团有限公司 一种信息采集方法和装置
US10089394B2 (en) * 2013-06-25 2018-10-02 Google Llc Personal search result identifying a physical location previously interacted with by a user
US11250203B2 (en) 2013-08-12 2022-02-15 Microsoft Technology Licensing, Llc Browsing images via mined hyperlinked text snippets
US10055433B2 (en) * 2014-09-18 2018-08-21 Microsoft Technology Licensing, Llc Referenced content indexing
CN110867241B (zh) * 2018-08-27 2023-11-03 卡西欧计算机株式会社 类似图像显示控制装置、系统及方法、以及记录介质
CN109670072B (zh) * 2018-11-01 2022-08-05 广州企图腾科技有限公司 一种基于间隔提取的商标相似度比较方法
WO2023136605A1 (en) * 2022-01-11 2023-07-20 Samsung Electronics Co., Ltd. Method and electronic device for intelligently reading displayed contents

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5546517A (en) 1994-12-07 1996-08-13 Mitsubishi Electric Information Technology Center America, Inc. Apparatus for determining the structure of a hypermedia document using graph partitioning
US6112202A (en) 1997-03-07 2000-08-29 International Business Machines Corporation Method and system for identifying authoritative information resources in an environment with content-based links between information resources
JP3694149B2 (ja) * 1997-07-07 2005-09-14 株式会社リコー 画像検索装置、画像検索用キーテキストの生成方法、並びにその装置としてコンピュータを機能させるためのプログラムおよびその方法をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
US6195622B1 (en) * 1998-01-15 2001-02-27 Microsoft Corporation Methods and apparatus for building attribute transition probability models for use in pre-fetching resources
US6154767A (en) * 1998-01-15 2000-11-28 Microsoft Corporation Methods and apparatus for using attribute transition probability models for pre-fetching resources
US6182133B1 (en) * 1998-02-06 2001-01-30 Microsoft Corporation Method and apparatus for display of information prefetching and cache status having variable visual indication based on a period of time since prefetching
US6446095B1 (en) 1998-06-09 2002-09-03 Matsushita Electric Industrial Co., Ltd. Document processor for processing a document in accordance with a detected degree of importance corresponding to a data link within the document
US6665837B1 (en) 1998-08-10 2003-12-16 Overture Services, Inc. Method for identifying related pages in a hyperlinked database
US7356530B2 (en) * 2001-01-10 2008-04-08 Looksmart, Ltd. Systems and methods of retrieving relevant information
JP2002304402A (ja) * 2001-04-06 2002-10-18 Foundation For The Promotion Of Industrial Science 情報検索システム
US6993535B2 (en) * 2001-06-18 2006-01-31 International Business Machines Corporation Business method and apparatus for employing induced multimedia classifiers based on unified representation of features reflecting disparate modalities
US7117434B2 (en) * 2001-06-29 2006-10-03 International Business Machines Corporation Graphical web browsing interface for spatial data navigation and method of navigating data blocks
US7003566B2 (en) * 2001-06-29 2006-02-21 International Business Machines Corporation Method and system for predictive directional data caching
JP2003036267A (ja) * 2001-07-23 2003-02-07 Canon Inc 情報検索装置及び情報検索方法
JP4003468B2 (ja) * 2002-02-05 2007-11-07 株式会社日立製作所 適合性フィードバックによる類似データ検索方法および装置
US6901411B2 (en) * 2002-02-11 2005-05-31 Microsoft Corporation Statistical bigram correlation model for image retrieval
US20030225763A1 (en) * 2002-04-15 2003-12-04 Microsoft Corporation Self-improving system and method for classifying pages on the world wide web
JP2004038253A (ja) * 2002-06-28 2004-02-05 Fuji Photo Film Co Ltd データベースシステム
US7680340B2 (en) * 2003-11-13 2010-03-16 Eastman Kodak Company Method of using temporal context for image classification
US7293007B2 (en) * 2004-04-29 2007-11-06 Microsoft Corporation Method and system for identifying image relatedness using link and page layout analysis

Also Published As

Publication number Publication date
US20050246623A1 (en) 2005-11-03
CN1694105B (zh) 2011-11-23
EP1591921B1 (en) 2013-04-10
CN1694102A (zh) 2005-11-09
JP2005332385A (ja) 2005-12-02
RU2390833C2 (ru) 2010-05-27
JP4634214B2 (ja) 2011-02-16
RU2005113002A (ru) 2006-11-10
CA2505311A1 (en) 2005-10-29
US7293007B2 (en) 2007-11-06
KR20060047643A (ko) 2006-05-18
BRPI0501448A (pt) 2006-01-10
EP1591921A1 (en) 2005-11-02
AU2005201771A1 (en) 2005-11-17
KR101130429B1 (ko) 2012-03-27
US20080065627A1 (en) 2008-03-13

Similar Documents

Publication Publication Date Title
MXPA05004679A (es) Metodo y sistema para identificar relevancia de imagen utilizando un analisis de enlace y diseno de pagina.
US7363279B2 (en) Method and system for calculating importance of a block within a display page
US9116921B2 (en) Grouping of image search results
JP5309155B2 (ja) イメージ検索における対話型概念学習
US8224849B2 (en) Object similarity search in high-dimensional vector spaces
US8683389B1 (en) Method and apparatus for dynamic information visualization
JP2005322245A (ja) 要約を使用して表示ページを分類する方法およびシステム
WO2005022413A1 (en) Method and apparatus for automatic file clustering into a data-driven, user-specific taxonomy
WO2008083504A1 (en) Method and system for information discovery and text analysis
Kennedy et al. Query-adaptive fusion for multimodal search
Tekli An overview of cluster-based image search result organization: background, techniques, and ongoing challenges
US7774340B2 (en) Method and system for calculating document importance using document classifications
JP6680956B1 (ja) 検索ニーズ評価装置、検索ニーズ評価システム、及び検索ニーズ評価方法
Yuan et al. Category hierarchy maintenance: a data-driven approach
Latha Experiment and Evaluation in Information Retrieval Models
KR20100013157A (ko) 연관 태그에 기반한 태그 클러스터링 장치 및 그 방법
Zhang et al. Improving image tags by exploiting web search results
Zaharieva et al. Retrieving Diverse Social Images at MediaEval 2017: Challenges, Dataset and Evaluation.
Weippl Visualizing content based relations in texts
Chen et al. Multi-modal multi-layered topic classification model for social event analysis
Gaou et al. Search Engine Optimization to detect user's intent
Lu et al. A multimedia information fusion framework for web image categorization
Azcarraga et al. Retrieving news stories from a news integration archive
Li et al. Word2Image: A System for Visual Interpretation of Concepts
Geetha et al. Diversifying Image search results

Legal Events

Date Code Title Description
FG Grant or registration