ES2657866T3 - Dispositivo de búsqueda, procedimiento de búsqueda, programa de búsqueda y medio de memoria legible por ordenador para grabar un programa de búsqueda - Google Patents

Dispositivo de búsqueda, procedimiento de búsqueda, programa de búsqueda y medio de memoria legible por ordenador para grabar un programa de búsqueda Download PDF

Info

Publication number
ES2657866T3
ES2657866T3 ES12749605.7T ES12749605T ES2657866T3 ES 2657866 T3 ES2657866 T3 ES 2657866T3 ES 12749605 T ES12749605 T ES 12749605T ES 2657866 T3 ES2657866 T3 ES 2657866T3
Authority
ES
Spain
Prior art keywords
search
specified
occurrence
frequency
period
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES12749605.7T
Other languages
English (en)
Inventor
Kazufumi Watanabe
Makoto Okabe
Rikio Onai
Masahiro Sanjo
Hiromi Hirano
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Rakuten Group Inc
Original Assignee
Rakuten Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Rakuten Inc filed Critical Rakuten Inc
Application granted granted Critical
Publication of ES2657866T3 publication Critical patent/ES2657866T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

Dispositivo de búsqueda (10) que comprende: unos medios de búsqueda (13, 15) para extraer un objetivo de búsqueda que cumple una condición de búsqueda especificada por un usuario por medio de una interfaz de usuario para búsqueda (100) basándose en datos de perfil generados basándose en un documento extraído de una base de datos especificada, conteniendo los datos de perfil un identificador para identificar un objetivo de búsqueda, fecha de creación del documento, y una frecuencia de aparición para cada tema obtenida clasificando palabras en el documento en uno o más temas; y unos medios de salida (12), que son una unidad para proporcionar una interfaz que proporciona la interfaz de usuario para búsqueda, para enviar el objetivo de búsqueda extraído por los medios de búsqueda para la presentación a un usuario, en el que la condición de búsqueda incluye una primera frecuencia de aparición para cada uno de uno o más temas especificados, especificados por el usuario en un primer periodo especificado que es un modelo de interés actual y una segunda frecuencia de aparición para cada uno de los temas especificados en un segundo periodo especificado que es posterior al primer periodo especificado que es un modelo de interés futuro, y los medios de búsqueda (13, 15) extraen, en respuesta a una transmisión única (S23) de la condición de búsqueda que contiene los modelos de interés actual y futuro de un terminal (T), el objetivo de búsqueda en el que la frecuencia de aparición para cada uno de los temas especificados obtenida a partir de los datos de perfil en un primer periodo objetivo de búsqueda es idéntica o similar a la primera frecuencia de aparición del modelo de interés actual y la frecuencia de aparición para cada uno de los temas especificados obtenida a partir de los datos de perfil en un segundo periodo objetivo de búsqueda que es posterior al primer periodo objetivo de búsqueda es idéntica o similar a la segunda frecuencia de aparición del modelo de interés futuro, en el que la identidad y similitud de los modelos de interés se determina basándose en una distancia Manhattan**Fórmula** donde x es un vector de las frecuencias de apariciones del modelo de interés actual o el futuro e y es un vector de frecuencias de apariciones del objetivo de búsqueda, y n es un número de temas principales, en un caso en el que hay una pluralidad de temas especificados, cuando se cambia un porcentaje de una 40 determinada frecuencia de aparición para cada tema especificado con respecto a un total de frecuencias de aparición para cada tema especificado en un periodo especificado, porcentajes de otras frecuencias de aparición para cada tema especificado en el periodo especificado se ajustan según el cambio, en el que los porcentajes de las otras frecuencias de aparición para cada tema especificado se ajustan basándose en un peso que indica una consistencia de una relación entre los temas especificados, el peso establecido basándose en una frecuencia con la que las palabras aparecen a lo largo de una pluralidad de temas diferentes, y una cantidad de cambio de la determinada frecuencia de aparición para cada tema especificado.

Description

5
10
15
20
25
30
35
40
45
50
55
60
65
DESCRIPCION
Dispositivo de búsqueda, procedimiento de búsqueda, programa de búsqueda y medio de memoria legible por ordenador para grabar un programa de búsqueda
Campo técnico
Un aspecto de la presente invención se refiere a un dispositivo de búsqueda, un procedimiento de búsqueda, un programa de búsqueda y un medio de memoria legible por ordenador para grabar un programa de búsqueda que realiza una búsqueda basándose en documentos acumulados.
Antecedentes de la técnica
La diseminación de información a través de documentos electrónicos tales como blogs y microblogs se ha vuelto habitual. Además, existen diversas técnicas para analizar los documentos electrónicos. Una de las técnicas de análisis de documentos es una técnica de utilización de un modelo de generación de documentos denominado modelo de temas. Por ejemplo, la siguiente bibliografía no relacionada con patentes 1 divulga una técnica que introduce información de series cronológicas en el modelo de temas y de ese modo presenta visualmente la transición de tendencias de documentos con información de tiempo.
Lista de referencias
Bibliografía no relacionada con patentes
BNDP1: Xuerui Wang y Andrew McCallum. Topics over time: a non-markov continuous-time model of topical trends. En las actas de la 12a conferencia internacional sobre descubrimiento de conocimientos y extracción de datos ACM SICKDD, KDD '06, págs.424-433. New York, NY, USA, 2006. ACM.
Sumario de la invención
Problema técnico
Por otro lado, debido a que el número de documentos electrónicos diseminados es enorme, no es fácil para la gente encontrar información necesaria. El objetivo primario de la técnica divulgada en la bibliografía no relacionada con patentes 1 anterior es encontrar escritores altamente influyentes, extraer temas y extraer comunidades, y no proporciona información sobre un cambio en las circunstancias deseado por los usuarios.
Por tanto, se demanda presentar información según un cambio deseado en las circunstancias.
Solución al problema
Un dispositivo de búsqueda según un modo de realización de la presente invención incluye unos medios de búsqueda según las características de la reivindicación independiente 1. Realizaciones adicionales preferentes se definen en las reivindicaciones dependientes respectivas.
Un procedimiento de búsqueda según un modo de realización de la presente invención es un procedimiento de búsqueda realizado por un dispositivo de búsqueda, incluyendo el procedimiento todas las características de la reivindicación independiente 8.
Un programa de búsqueda según un modo de realización de la presente invención se define en la reivindicación independiente 9.
Un medio de memoria legible por ordenador según un modo de realización de la presente invención se define en la reivindicación independiente 10.
Efectos ventajosos de la invención
Según un aspecto de la presente invención, se extrae un objetivo de búsqueda con la transición de la frecuencia de aparición para un tema especificado que es idéntico o similar a una condición de búsqueda, y de ese modo es posible presentar información que corresponde a un cambio deseado en las circunstancias.
Breve descripción de los dibujos
La figura 1 es un diagrama que muestra una configuración global de un sistema de búsqueda según un primer modo de realización.
5
10
15
20
25
30
35
40
45
50
55
60
65
La figura 2 es un diagrama que muestra una configuración funcional de un servidor de búsqueda mostrado en la figura 1.
La figura 3 es un diagrama que muestra una configuración de hardware del servidor de búsqueda mostrado en la figura 1.
La figura 4 es un diagrama que muestra un ejemplo de estructura de datos de perfil.
La figura 5 es un diagrama para describir la creación de datos de perfil.
La figura 6 es un diagrama para describir la creación de datos de perfil.
La figura 7 es un diagrama para describir el establecimiento de temas principales.
La figura 8 es un diagrama que muestra un ejemplo de una pantalla de búsqueda visualizada en un terminal de usuario mostrado en la figura 1.
La figura 9 es un diagrama para describir un ejemplo de un procedimiento de ajuste de un modelo futuro según una operación de usuario.
La figura 10 es un diagrama para describir otro ejemplo de un procedimiento de ajuste de un modelo futuro según una operación de usuario.
La figura 11 es un diagrama de flujo que muestra una operación del sistema de búsqueda mostrado en la figura 1.
La figura 12 es un diagrama que muestra una estructura de un programa de búsqueda según el primer modo de realización.
La figura 13 es un diagrama que muestra una configuración global de un sistema de búsqueda según un segundo modo de realización.
La figura 14 es un diagrama que muestra una configuración funcional de un servidor de búsqueda mostrado en la figura 13.
La figura 15 es un diagrama que muestra una estructura de un programa de búsqueda según el segundo modo de realización.
Descripción de los modos de realización
Los modos de realización de la presente invención se describirán con referencia a los dibujos. Obsérvese que, en la descripción de los dibujos, los mismos elementos se indicarán mediante los mismos símbolos de referencia y se omitirá una descripción redundante.
(Primer modo de realización)
La función y configuración de un servidor de búsqueda 10 según un primer modo de realización se describen primero con referencia a las figuras 1 a 10. El servidor de búsqueda 10 es un dispositivo de búsqueda que extrae un escritor (una persona que ha creado un documento) que cumple una condición de búsqueda especificada por un usuario y presenta el escritor extraído al usuario. Tal como se muestra en la figura 1, el servidor de búsqueda 10 se conecta para ser capaz de comunicarse con una pluralidad de bases de datos documentales D (bases de datos especificadas) y una pluralidad de terminales de usuario T a través de una red de comunicación N. El servidor de búsqueda 10, las bases de datos documentales D y los terminales de usuario T mostrados en la figura 1 constituyen un sistema de búsqueda.
Antes de describir el servidor de búsqueda 10, se describen la base de datos documental D y el terminal de usuario T. La base de datos documental D es un ordenador que almacena documentos (documentos electrónicos) existentes en Internet. Ejemplos de documentos incluyen blogs, microblogs, servicios de redes sociales (SNS), artículos publicados en páginas de compra en línea y similares, aunque el tipo y contenidos de los documentos no están particularmente limitados. Aunque se muestran dos bases de datos documentales D en la figura 1, el número de bases de datos documentales D es arbitrario. Además, los sitios para instalar las bases de datos documentales D también son arbitrarios, y pueden situarse en un sistema de gestión de blog, un sistema SNS, un sistema de compra en línea y similares, por ejemplo.
El terminal de usuario T es un ordenador que recibe entrada de una condición de búsqueda y visualiza un resultado de búsqueda que cumple la condición. Ejemplos del terminal de usuario T incluyen teléfonos móviles sofisticados (teléfonos inteligentes), asistentes digitales personales (PDA), diversos ordenadores personales (PC de tableta, PC
5
10
15
20
25
30
35
40
45
50
55
60
65
de sobremesa, PC portátil etc.) y similares, aunque un ejemplo del terminal de usuario T no se limita a los mismos. Aunque se muestran tres terminales de usuario T en la figura 1, el número de terminales de usuario T es arbitrario.
Basándose en la anterior premisa, el servidor de búsqueda 10 se describe a continuación en el presente documento. Tal como se muestra en la figura 2, el servidor de búsqueda 10 incluye, como componentes funcionales, una base de datos de perfil 11, una unidad para proporcionar una interfaz 12, una primera unidad de búsqueda 13, una unidad de ajuste de modelo 14 y una segunda unidad de búsqueda 15.
El servidor de búsqueda 10 se compone de una CPU 101 que ejecuta un sistema operativo, un programa de aplicación y similares, una unidad de almacenamiento principal 102 tal como ROM y RAM, una unidad de almacenamiento auxiliar 103 tal como un disco duro o similar, una unidad de control de comunicación 104 tal como una tarjeta de red o similar, una unidad de entrada 105 tal como un teclado y un ratón, y una unidad de salida 106 tal como un monitor tal como se muestra en la figura 3. Las funciones del servidor de búsqueda 10 se implementan cargando software dado en la CPU 101 o la unidad de almacenamiento principal 102, haciendo que la unidad de control de comunicación 104, el dispositivo de entrada 105, el dispositivo de salida 106 y similares funcionen bajo el control de la CPU 101, y realizando la lectura y escritura de datos en la unidad de almacenamiento principal 102 o la unidad de almacenamiento auxiliar 103. Los datos y la base de datos requeridos para el procesamiento se almacenan en la unidad de almacenamiento principal 102 o la unidad de almacenamiento auxiliar 103.Obsérvese que, aunque el servidor de búsqueda 10 es un ordenador único en el ejemplo de la figura 3, las funciones del servidor pueden distribuirse entre una pluralidad de ordenadores. Por ejemplo, el servidor de búsqueda 10 puede componerse de un ordenador que incluye la base de datos de perfil 11 y un ordenador que incluye los otros componentes funcionales.
Haciendo referencia de nuevo a la figura 2, la base de datos de perfil 11 es un medio de almacenamiento de datos de perfil generados basándose en documentos extraídos de la base de datos documental D.
Los datos de perfil son datos que indican qué tema (materia) trata el documento o qué tema menciona un escritor, y se crean para cada documento. Tal como se muestra en la figura 4, los datos de perfil contienen un ID de escritor que identifica unívocamente a un escritor de un documento, un ID de documento que identifica unívocamente al documento, la fecha de creación del documento, y el número de palabras asignado a cada uno de 100 temas especificados (temas 0 a 99). El número de palabras asignado a cada tema también se considera como la frecuencia de aparición del tema en un documento.
Los datos de perfil se crean mediante la determinación de una pluralidad de temas mediante el análisis de un conjunto de documentos y la comprobación de cada documento frente a esos temas. Este proceso se describe en detalle a continuación en el presente documento.
Específicamente, el procesamiento primero determina 100 temas utilizando LDA (Asignación de Dirichlet latente) y muestreo de Gibbs. Para determinar temas, un número suficiente de documentos creados para un periodo especificado de tiempo se recopilan de la base de datos documental D. Por ejemplo, se recopilan 500 millones de documentos creados durante la última semana. Para la recopilación, puede usarse una interfaz de programación de aplicación (API) específica. Por ejemplo, puede usarse una API de transmisión al recopilar artículos en Twitter (marca comercial registrada). Después, como procesamiento previo, se eliminan nombres de usuarios, etiquetas y similares contenidos en el texto del cuerpo, y solo se extraen nombres de los documentos mediante el análisis morfológico.
Después de eso, se genera una tabla de correspondencias de temas y palabras frecuentes aplicando la LDA a un conjunto de los nombres extraídos, determinando de ese modo 100 temas. En este momento, para la convergencia del procesamiento de LDA, el procesamiento se repite un número específicado de veces. El número de repeticiones también se considera como el número de muestras, y el número puede establecerse en 1000, por ejemplo. La figura 5 muestra un ejemplo de la tabla de correspondencias generada. En la figura 5, varios nombres que incluyen nombres propios tales como el nombre del elemento A y el equipo X se integran en cada tema. Obsérvese que, en el ejemplo de la figura 5, se asigna un nombre como “dispositivo digital” a cada tema por razones de conveniencia.
A continuación, el proceso recopila un número específicado de documentos de la base de datos documental D para cada uno de los usuarios requeridos para proporcionar un servicio de búsqueda, que usa una API específica en la misma manera, tal como en lo anterior. Por ejemplo, se recopilan 1000 documentos por usuario. Un periodo de recopilación en este proceso es un periodo arbitrario (por ejemplo, tres meses, un año, tres años etc.) requerido para proporcionar un servicio de búsqueda, que es diferente de un periodo que determina temas (la última semana en el ejemplo anterior). Después, aplicando la LDA y el muestreo de Gibbs a cada documento, las palabras se clasifican en el documento por temas, calculando de ese modo la frecuencia de aparición para cada tema en cada documento. Obsérvese que, en este momento, el número de muestras para cada documento se establece en 50. Debido a que existen elementos aleatorios en el muestreo de Gibbs, el resultado total obtenido por la repetición del procesamiento de 50 veces por conjunto tres veces se usa como la frecuencia de aparición para cada tema.
A continuación, se eliminan temas innecesarios según el propósito del servicio de búsqueda. Debido a que un
5
10
15
20
25
30
35
40
45
50
55
60
65
escritor que tiene el interés especificado por un usuario de terminal (buscador) se muestra al usuario como un resultado de búsqueda en este modo de realización, puede ignorarse información no relacionada con las aficiones y preferencias de un escritor. Por tanto, se eliminan temas que no son las aficiones y preferencias. Por ejemplo, pueden eliminarse los temas tal como se muestra en la figura 6. También, en el ejemplo de la figura 6, se asigna un nombre como “tiempo” a cada tema por razones de conveniencia. Mediante esta eliminación, 100 temas se reducen a 40 temas, por ejemplo. De esta manera, eliminando temas innecesarios por adelantado, puede mejorarse la precisión de una búsqueda de escritor.
Mediante el proceso descrito anteriormente, los datos de perfil que tienen la estructura de datos mostrada en la figura 4 se generan y almacenan en la base de datos de perfil 11. Obsérvese que la frecuencia de aparición que corresponde a los temas eliminados se inicializa a 0.
El número de temas que aparecen en cualquier documento es relativamente grande (por ejemplo, 40 temas), y por tanto dichos temas son integrados en varios grupos para facilitar una operación de búsqueda del usuario. Por ejemplo, como se muestra en la figura 7, los temas extraídos por el procesamiento anterior (temas dejados después de la eliminación) se asocian con cualquiera de cinco temas principales (IT, vida, política y economía, entretenimiento, juegos y animaciones), y la correspondencia se almacena en el servidor de búsqueda 10. Solo se muestran temas principales a los usuarios. Los temas principales son el concepto colocado en la jerarquía superior de los temas extraídos correspondientes.
Obsérvese que un procedimiento de preparación de los datos de perfil no se limita al ejemplo anterior, y también son posibles los ejemplos alternativos siguientes.
Primero, un procedimiento de recopilación de documentos no se limita particularmente, y pueden recopilarse documentos rastreando o pueden recopilarse a mano también. Además, los datos de perfil pueden hacerse con regularidad (en una forma dinámica).
El número y el intervalo (el intervalo temporal y el número de escritores) de documentos recopilados en cada procesamiento, el número de muestras, el número de repeticiones de procesamiento que realiza un número específicado de muestras por conjunto no se limitan a los ejemplos descritos anteriormente y pueden establecerse arbitrariamente. Además, puede omitirse la eliminación de temas innecesarios y la integración de temas extraídos (establecimiento de temas principales). Además, aunque la correspondencia entre palabras y temas se calcula en este modo de realización, el vocabulario no se limita a las palabras, y puede ser una frase compuesta de una pluralidad de palabras, por ejemplo.
Haciendo referencia de nuevo a la figura 2, la unidad para proporcionar una interfaz 12 es un medio para proporcionar una interfaz de usuario para búsqueda, que es una pantalla de búsqueda, a los terminales de usuario T. Cuando un usuario de terminal que pretende usar un servicio de búsqueda realiza una operación especificada, el terminal de usuario T transmite una señal que solicita una pantalla de búsqueda (por ejemplo, solicitud de HTTP) al servidor de búsqueda 10. En respuesta a la señal, la unidad para proporcionar una interfaz 12 transmite datos de una pantalla de búsqueda (por ejemplo, una página web) al terminal de usuario T. Una pantalla de búsqueda de ese modo se visualiza en el terminal de usuario T. Obsérvese que un procedimiento de implementación de una pantalla de búsqueda es arbitrario, y puede implementarse mediante una aplicación Java (marca comercial registrada), no una aplicación web.
La figura 8 muestra un ejemplo de una pantalla de búsqueda. Una pantalla de búsqueda 100 en general está dividida en una zona de entrada 110 para la introducción de una condición de búsqueda (consulta) y una zona de visualización 120 para la visualización de un resultado de búsqueda.
La zona de entrada 110 incluye un campo de entrada de usuario 111, un campo de entrada de periodo 112, un campo de modelo actual 113, un campo de modelo futuro 114, un botón de búsqueda 115 y un campo de visualización de documentos 116.
El campo de entrada de usuario 111 es una interfaz para la introducción de un usuario (usuario de referencia) que sirve como referencia para una búsqueda de escritor. Un usuario de terminal puede establecer a cualquiera como un usuario de referencia y, por ejemplo, puede especificar uno u otro escritor en el campo de entrada de usuario 111.
El campo de entrada de periodo 112 es una interfaz para la introducción de un periodo de documentos que va a recopilarse para la generación de un modelo actual, que se describe posteriormente (un periodo que indica cuánto tiempo atrás se deben recopilar documentos desde el presente). El periodo se describe a continuación en el presente documento como “periodo de recopilación”.
El campo de modelo actual 113 es una región que visualiza la frecuencia de aparición (primera frecuencia de aparición) para cada uno de los temas principales obtenidos compilando los datos de perfil de documentos creados por el usuario de referencia durante el periodo de recopilación especificado en una proporción tal como un porcentaje. La frecuencia de aparición para cada tema principal también se denomina “modelo de interés” o
5
10
15
20
25
30
35
40
45
50
55
60
65
“distribución de frecuencia de aparición”. A continuación en el presente documento, la frecuencia de aparición para cada tema principal mostrado en este campo se denomina “modelo actual” o “modelo de interés actual”. En este modo de realización, el modelo actual se adquiere mediante la primera unidad de búsqueda 13, que se describe posteriormente, y se visualiza en un histograma tal como se muestra en la figura 8.
El campo de modelo futuro 114 es una zona que recibe entrada de la frecuencia de aparición (segunda frecuencia de aparición) para cada tema principal por un usuario de terminal. A continuación en el presente documento, la frecuencia de aparición para cada tema principal mostrado en este campo se denomina “modelo futuro” o “modelo de interés futuro”. En este modo de realización, el modelo futuro también se muestra en una proporción, y se visualiza en un histograma.
Como valor inicial del modelo futuro, se establece y se visualiza el mismo valor que el modelo actual, y un usuario de terminal puede cambiar el modelo futuro (el valor de la frecuencia de aparición de cada tema principal) subiendo o bajando las barras visualizadas en este campo. Debido a que la frecuencia de aparición de cada tema principal se muestra en porcentaje, cuando un usuario de terminal cambia el valor de la frecuencia de aparición de un tema principal concreto, las frecuencias de aparición de los otros temas se ajustan automáticamente. Específicamente, el terminal de usuario T transmite, al servidor de búsqueda 10, datos del modelo actual, información de cambio que indica un tema principal cambiado, y un modelo futuro sin ajustar (modelo futuro antes del ajuste) que contiene la frecuencia de aparición después del cambio del tema principal. Después de eso, el terminal de usuario T recibe datos del modelo futuro que se han ajustado en la unidad de ajuste de modelo 14 (que se describirá después) del servidor de búsqueda 10 y visualiza los datos en el campo de modelo futuro 114. De esta manera, cuando la frecuencia de aparición de un tema especificado concreto se cambia, por consiguiente las frecuencias de aparición de los otros temas se ajustan, lo que mejora la conveniencia de una operación de búsqueda.
El botón de búsqueda 115 es una interfaz para dar al servidor de búsqueda 10 una instrucción para hacer una búsqueda según la condición de búsqueda especificada en la zona de entrada 110.
El campo de visualización de documentos 116 es una región para visualizar documentos usados para obtener el modelo actual en respuesta a una instrucción de un usuario de terminal. Los documentos visualizados en este campo son documentos cuyo ID de escritor es el ID de usuario de referencia y cuyo periodo de creación se incluye en el periodo de recopilación, que se leen de la base de datos documental D.
La zona de visualización 120 incluye un campo de selección de escritor 121, un campo de modelo de cambio previo 122, un modelo de cambio posterior 123 y un campo de visualización de documentos 124.
El campo de selección de escritor 121 es una interfaz para seleccionar un escritor de uno o más escritores recuperados (escritores que muestran el cambio idéntico o similar en el modelo de interés a la condición de búsqueda).
El campo de modelo de cambio previo 122 es una región para visualizar el modelo de interés que es idéntico o similar al modelo actual (que se denomina a continuación en el presente documento como “modelo de cambio previo” o “modelo de interés de cambio previo”) para el escritor seleccionado en el campo de selección de escritor.
El campo de modelo de cambio posterior 123 es una región para visualizar el modelo de interés que es idéntico o similar al modelo futuro (que se denomina a continuación en el presente documento como “modelo de cambio posterior” o “modelo de interés de cambio posterior”) para el escritor seleccionado en el campo de selección de escritor.
El campo de visualización de documentos 124 es una región para visualizar documentos del escritor seleccionado en el campo de selección de escritor 121 en respuesta a una instrucción de un usuario de terminal. Los documentos visualizados en este campo son documentos cuyo ID de escritor es el del escritor seleccionado y cuyo periodo de creación se incluye en un periodo que coincide con el modelo de cambio previo o el modelo de cambio posterior, que se leen de la base de datos documental D.
Un procedimiento de representación del modelo de interés no se limita a un histograma y puede decidirse arbitrariamente. Por ejemplo, el modelo de interés puede representarse usando un diagrama circular.
Haciendo referencia de nuevo a la figura 2, la primera unidad de búsqueda 13 es un medio de generación del modelo actual basándose en los datos de perfil en la base de datos de perfil 11. Cuando un usuario de referencia y un periodo de recopilación se introducen en la pantalla de búsqueda 100, el terminal de usuario T transmite una condición de búsqueda (que se denomina también a continuación en el presente documento como “primera condición de búsqueda”) que indica el ID de usuario del usuario de referencia y el periodo de recopilación al servidor de búsqueda 10. La primera unidad de búsqueda 13 recibe la condición de búsqueda y lee datos de perfil cuyo ID de escritor es el ID de usuario del usuario de referencia y cuyo periodo de creación se incluye en el periodo de recopilación desde la base de datos de perfil 11. La primera unidad de búsqueda 13 después compila la frecuencia de aparición para cada tema principal basándose en las frecuencias de aparición de los temas 0 a 99 indicados por
5
10
15
20
25
30
35
40
45
50
55
60
los datos de perfil extraídos y la tabla de correspondencias tal como se muestra en la figura 7. Entonces, la primera unidad de búsqueda 13 convierte el resultado de compilación de cada tema principal en una proporción y transmite el resultado convertido como el modelo de interés al terminal de usuario T. El modelo actual se visualiza de ese modo en un histograma en el campo de modelo actual 113.
La unidad de ajuste de modelo 14 es un medio de ajustar cada frecuencia de aparición en el modelo futuro según una operación para cambiar el modelo futuro en la pantalla de búsqueda 100. La unidad de ajuste de modelo 14 ajusta cada frecuencia de aparición en el modelo futuro basándose en el modelo actual, la información de cambio y el modelo futuro sin ajustar recibido del terminal de usuario T. Aunque un procedimiento del ajuste pueda decidirse arbitrariamente, se describen dos procedimientos de ajuste a continuación.
Un primer procedimiento es un procedimiento de referencia de modelo de interés similar que establece el modelo de interés más similar a un cambio especificado como el modelo futuro después del ajuste por referencia a la transición del modelo de interés de otro escritor. Este procedimiento se describe a continuación en el presente documento usando la figura 9.
Si la frecuencia de aparición del i-ésimo tema principal en el modelo actualy el modelo futuro sin ajustar es TiC y TiD, respectivamente, el modelo actual se representa como el vector TC = {ToC,T1C,T2C,T3C,T4C}t, y el modelo futuro sin ajustar (modelo futuro deseado) se representa por el vector TD = {ToD,Ti,T2D,T3D,T4D}t, donde t indica inversión. Cuando la frecuencia de aparición se cambia solo para algunos temas principales, la unidad de ajuste de modelo 14 busca en la base de datos de perfil 11 basándose en el modelo de interés actual y el modelo futuro sin ajustar TD centrándose solo en los temas principales en los que se ha cambiado la frecuencia de aparición.
Por ejemplo, cuando solo las frecuencias de aparición para el tercer y cuarto temas principales se cambian por un
usuario como se indica por las flechas A1 y A2 tal como se muestra en la figura 9, la unidad de ajuste de modelo 14
sustituye el modelo futuro sin ajustar TD = {ToD,T-iD,T2D,T3D,T4D}‘ con TD = {*,*,T2D,T3D,*}t, donde “*” es un comodín. Entonces, la unidad de ajuste de modelo 14 especifica un escritor del que el primer modelo de interés durante un
periodo dado (otro periodo de búsqueda) es idéntico o similar al modelo actual y el segundo modelo de interés TF
durante un periodo (un periodo de búsqueda) posterior al periodo dado es idéntico o similar al modelo futuro sin ajustar después de la sustitución. Obsérvese que TF = {ToF,T1F,T2FT3FT4F}t. En el momento de determinar la identidad y similitud, la unidad de ajuste de modelo 14 usa el concepto de distancia Manhattan tal y como la segunda unidad de búsqueda 15 descrita a continuación.
Al tiempo de la búsqueda del segundo modelo de interés TF que es idéntico o similar al modelo futuro sin ajustar después de la sustitución, la unidad de ajuste de modelo 14 calcula la distancia Manhattan solo para el cambio de frecuencias de aparición (en el ejemplo anterior, solo para T2D y T3D). Obsérvese que el total de las frecuencias de aparición en cada modelo necesita fijarse, y se representa como la siguiente ecuación (1).
Ecuación 1:
Y Ttc =Y T° =Y TtF = consí. ...(1)
i i i
Entonces, la unidad de ajuste de modelo 14 transmite el segundo modelo de interés TF del escritor con la similitud más alta con el modelo futuro al terminal T de usuario. Por tanto, en la pantalla de búsqueda 100, se visualiza de tal manera que el modelo actual T = {To ,Ti J2 ,T3 Ja } pasa al modelo futuro
TF = {ToF,T-iF T2F( 2°),T3F( 3°),T/}*■
En el primer procedimiento anterior, la unidad de ajuste de modelo 14 puede establecer un modelo diferente del modelo de interés más similar TF como el modelo futuro. Por ejemplo, la unidad de ajuste de modelo 14 puede transmitir el promedio de un número específicado de modelos de interés extraído en el orden ascendente de la distancia Manhattan como el modelo futuro al terminal de usuario T. Además, la unidad de ajuste de modelo 14 puede transmitir el promedio de modelos de interés cuya distancia Manhattan es un valor especificado o inferior como el modelo futuro al terminal de usuario T.
Un segundo procedimiento es un procedimiento de propagación de temas que ajusta cada frecuencia de aparición en el modelo futuro considerando la relación entre temas principales. En el momento de la asociación de cada palabra con un tema por la LDA, existe un caso en el que una palabra pertenece a una pluralidad de temas. La frecuencia de solapamiento de palabras causa una relación que surge entre temas, y de ese modo una relación surge también entre temas principales. El procedimiento de propagación de temas usa un peso que indica la consistencia de cada relación entre temas principales. Este procedimiento se describe a continuación en el presente documento usando la figura 10.
Tal como se muestra en la figura 10, se representan cinco temas principales por nodos n0 a n4, y se representa un peso entre dos temas por wy (i y j son el número de nodos adyacentes entre sí). Obsérvese que el peso w se
5
10
15
20
25
30
35
40
45
50
55
60
65
prealmacena en un medio de almacenamiento especificado en el servidor de búsqueda 10 y referido a por la unidad de ajuste de modelo 14.
Basándose en lo anterior, se asume que la frecuencia de aparición que corresponde al nodo n2 se cambia por v por una operación de usuario. Debido a que los pesos relacionados con el nodo n2 son w02, w-i2, w23 y w24, es necesario determinar la cantidad de la frecuencia de aparición a transferir a o desde cada uno de los otros nodos n0, n1, n3 y n4 con el fin de cambiar la frecuencia de aparición del nodo n2. Suponiendo que wt = w02 + w-i2 + w23 + w24, la unidad 14 de ajuste de modelo determina la cantidad de transferencia entre el nodo n2 y los otros nodos tal como sigue.
Con el nodo n0, v(w02/wt)
Con el nodo n1, v(w-i2/wr)
Con el nodo n3, v(w23/wt)
Con el nodo n4, v(w24/wt)
Obsérvese que, sin embargo, cuando v > 0, que es cuando la frecuencia de aparición se incrementa para el nodo n2, existe un caso en el que la frecuencia de aparición de otro nodo pasa a ser negativa por el cálculo anterior. En tal caso, la unidad de ajuste de modelo 14 transfiere la frecuencia de aparición de vuelta del nodo n2 a dicho nodo hasta que la frecuencia de aparición de ese nodo vuelve a 0. Entonces, la unidad de ajuste de modelo 14 realiza el procesamiento de transferencia de una cantidad insuficiente v' para el nodo n2 desde otro nodo (que excluye el nodo cuya frecuencia de aparición se ha establecido de nuevo a 0) de la misma manera que antes. Obsérvese que, cuando las frecuencias de aparición de una pluralidad de temas se cambian por una operación de usuario, la unidad de ajuste de modelo 14 puede realizar el ajuste anterior en la cantidad de cambio Vk (k es un número de nodo) de cada nodo (cada tema). La unidad de ajuste de modelo 14 transmite el modelo futuro después del ajuste al terminal de usuario T. El modelo futuro ajustado se visualiza de ese modo en la pantalla de búsqueda 100.
Haciendo referencia de nuevo a la figura 2, la segunda unidad de búsqueda 15 es un medio de búsqueda para un escritor que cumple una condición de búsqueda especificada en la zona de entrada 110 de la pantalla de búsqueda 100 (que se denomina también a continuación en el presente documento como “segunda condición de búsqueda”). La segunda unidad de búsqueda 15 incluye una unidad de recepción 15a, una unidad de extracción 15b (medios de búsqueda) y una unidad de transmisión 15c (medios de salida).
La unidad de recepción 15a es un medio de recepción de una condición de búsqueda del terminal de usuario T. Cuando el botón de búsqueda 115 en la pantalla de búsqueda 100 se pulsa por un usuario de terminal, el terminal de usuario T transmite una condición de búsqueda al servidor de búsqueda 10, y la unidad de recepción 15a recibe la condición de búsqueda. La unidad de recepción 15a envía la condición de búsqueda recibida a la unidad de extracción 15b.
Esta condición de búsqueda (segunda condición de búsqueda) contiene el ID de usuario de un usuario de terminal, el ID de usuario de un usuario de referencia, el periodo de recopilación, el modelo actual que corresponde al periodo de recopilación y el modelo futuro. El modelo actual que corresponde al periodo de recopilación es igual a una primera frecuencia de aparición para cada tema principal en el primer periodo especificado (periodo de recopilación). Además, el modelo futuro es igual a una segunda frecuencia de aparición para cada tema principal en el segundo periodo especificado (un punto concreto o periodo en el futuro). En este modo de realización, cinco temas principales se tratan como los temas especificados.
La unidad de extracción 15b es un medio de extracción un escritor que cumple la condición de búsqueda de entrada basándose en los datos de perfil en la base de datos de perfil 11. La unidad de extracción 15b establece un usuario diferente del usuario de terminal y el usuario de referencia como un escritor como un objetivo de búsqueda. En otras palabras, la unidad de extracción 15b hace una búsqueda para los datos de perfil que tienen un ID de escritor diferente de cualquiera de los dos ID de usuario de entrada. Por tanto, un identificador que especifica un objetivo de búsqueda es un ID de escritor.
La unidad de extracción 15b realiza la siguiente búsqueda para cada escritor objetivo de búsqueda. Específicamente, la unidad de extracción 15b lee datos de perfil que corresponden a un periodo arbitrario que corresponde con el periodo de recopilación de entrada (que se denomina también a continuación en el presente documento como “periodo de inicio” y que iguala a un primer periodo objetivo de búsqueda) de la base de datos de perfil 11. Aunque los puntos de inicio y final del periodo son diferentes entre el periodo de inicio y el periodo de recopilación, la longitud del periodo es la misma. La longitud exacta, sin embargo, puede ser diferente. Por ejemplo, cuando el periodo de recopilación es el último mes, que son 30 días desde el 1 de abril al 30 de abril, el periodo de inicio puede ser 31 días desde el 1 de marzo al 31 de marzo o 28 días desde el 1 de febrero al 28 de febrero.
A continuación, la unidad de extracción 15b compila las frecuencias de aparición indicadas por la lectura de uno o más datos de perfil con respecto a cada tema principal y de ese modo genera el modelo de interés en el periodo de
5
10
15
20
25
30
35
40
45
50
55
60
inicio. La unidad de extracción 15b después determina si el modelo de interés generado es idéntico o similar al modelo actual.
En el momento de determinar la identidad y similitud del modelo de interés, la unidad de extracción 15b usa la distancia Manhattan d-i(x,y) representada por la siguiente ecuación (1).
Ecuación 2:
n
dl(x,y) = 'Z\xk-yk | .*.(2)
En la ecuación anterior, x en el lado izquierdo es el vector del modelo de interés que se establece como una condición de búsqueda, e y en el lado izquierdo es el vector del modelo de interés para un escritor objetivo de búsqueda. Además, n es el número de temas principales, que es n = 5 en esta realización. xk en el lado derecho es la frecuencia de aparición (porcentaje) de un tema principal k en el modelo de interés que se establece como una condición de búsqueda, y yk en el lado derecho es la frecuencia de aparición (porcentaje) de un tema principal k en el modelo de interés para un escritor como un objetivo de búsqueda. Los vectores x e y se representan como x = {x-i,x2,x3,x4,x5} e y = {y-i,y2,y3,y4,y5}, respectivamente.
La unidad de extracción 15b determina que el modelo de interés durante el periodo de inicio es idéntico o similar al modelo actual cuando la distancia Manhattan descrita anteriormente es un umbral específico o inferior. Obsérvese que un procedimiento de decisión del umbral es arbitrario. Si la distancia Manhattan es 0, significa que se obtiene el modelo de interés idéntico al modelo actual.
Además, la unidad de extracción 15b lee datos de perfil que corresponden a un periodo arbitrario que tiene la misma longitud que el periodo de recopilación y siendo el punto de inicio posterior al periodo de inicio (que se denomina también a continuación en el presente documento “periodo de finalización” y que iguala a un segundo periodo objetivo de búsqueda) de la base de datos de perfil 11. La relación de los puntos de inicio y final y la longitud del periodo entre el periodo de finalización y el periodo de recopilación es la misma que la mencionada para el periodo de inicio. A continuación, la unidad de extracción 15b compila las frecuencias de aparición mostradas en la lectura de uno o más datos de perfil con respecto a cada tema principal y de ese modo genera el modelo de interés en el periodo de finalización. La unidad de extracción 15b después determina si el modelo de interés generado es idéntico o similar al modelo futuro. En el caso de hacer esta determinación también, la unidad de extracción 15b determina la identidad y similitud de la misma manera que el caso del periodo de inicio que usa la distancia Manhattan d-i(x,y) representada por la ecuación anterior (1).
La unidad de extracción 15b extrae una combinación de modelos de interés en los que la distancia Manhattan es un umbral específico o inferior en el periodo de inicio y el periodo de finalización, variando dichos dos periodos para un escritor. Entonces, la unidad de extracción 15b almacena dos modelos de interés que corresponden al periodo de inicio y el periodo de finalización en esta combinación como un modelo de cambio previo y un modelo de cambio posterior, respectivamente. Además, la unidad de extracción 15b también almacena el periodo de inicio y el periodo de finalización que corresponde con los modelos de interés de cambio previo y cambio posterior. Obsérvese que cuando se obtienen una pluralidad de combinaciones de modelos de interés de cambios previos y posteriores que son idénticos o similares a la condición de búsqueda, la unidad de extracción 15b puede seleccionar una combinación por un procedimiento arbitrario. Por ejemplo, la unidad de extracción 15b puede seleccionar la combinación con el total más pequeño o el promedio de la distancia Manhattan.
La unidad de extracción 15b realiza el procesamiento anterior para cada escritor y adquiere el ID de escritor, el modelo de cambio previo, el modelo de cambio posterior, y el periodo de inicio y el periodo de finalización que corresponde a dichos modelos, para uno o más escritores que cumplen la condición de búsqueda de entrada. La unidad de extracción 15b envía después aquellos datos adquiridos como resultado de búsqueda a la unidad de transmisión 15c.
La unidad de transmisión 15c es un medio de transmisión de un resultado de búsqueda de entrada al terminal de usuario T para presentar el resultado de búsqueda a un usuario de terminal. El modelo de cambio previo y el modelo de cambio posterior se visualizan de ese modo en la zona de visualización 120 de la pantalla de búsqueda 100 que se visualiza en el terminal de usuario T.
Se describe la operación del sistema de búsqueda (particularmente, el servidor de búsqueda 10), y un procedimiento de búsqueda según este modo de realización también se describe a continuación en el presente documento con referencia a la figura 11.
La siguiente descripción está basada en la suposición de que la pantalla de búsqueda 100 se visualiza en el terminal de usuario T (etapa S11). Cuando la primera condición de búsqueda para obtener el modelo actual, que es el usuario de referencia y el periodo de recopilación, se especifica por un usuario de terminal (etapa S12), el terminal
5
10
15
20
25
30
35
40
45
50
55
60
65
de usuario T transmite la primera condición de búsqueda al servidor de búsqueda 10 (etapa S13). En el servidor de búsqueda 10, la primera unidad de búsqueda 13 extrae datos de perfil de la base de datos de perfil 11 basándose en la condición de búsqueda y genera el modelo actual basándose en los datos de perfil (etapa S14). Entonces, la primera unidad de búsqueda 13 transmite el modelo actual al terminal de usuario T (etapa S15). En el terminal de usuario T, el modelo actual se visualiza en la pantalla de búsqueda 100 (etapa S16). En este momento, el mismo valor que el modelo actual se establece y se visualiza como un valor inicial del modelo futuro en este modo de realización.
Después de eso, cuando la frecuencia de aparición en el modelo futuro se cambia por un usuario de terminal (etapa S17), el terminal de usuario T transmite el modelo futuro sin ajustar que indica el cambio al servidor de búsqueda 10 (etapa S18). En el servidor de búsqueda 10, la unidad de ajuste de modelo 14 ajusta el modelo futuro aplicando una técnica tal como el procedimiento de referencia de modelo de interés similar o el procedimiento de propagación de temas al modelo futuro sin ajustar (etapa S19) y transmite el modelo futuro ajustado al terminal de usuario T (etapa S20). En el terminal de usuario T, el modelo futuro después del ajuste se visualiza en la pantalla de búsqueda 100 (etapa S21). El procesamiento de las etapas S17 a S21 puede realizarse repetidamente según una operación por un usuario de terminal.
Después de eso, cuando el usuario de terminal ordena una búsqueda pulsando el botón de búsqueda 115 (etapa
522) , el terminal de usuario T transmite una condición para la búsqueda para un escritor, que es la segunda condición de búsqueda que contiene los modelos de interés presentes y futuros, al servidor de búsqueda 10 (etapa
523) .
En el servidor de búsqueda 10, la unidad de recepción 15a recibe la condición de búsqueda. Entonces, la unidad de extracción 15b extrae datos de perfil desde la base de datos de perfil 11 basándose en la condición de búsqueda y busca un escritor basándose en los datos de perfil (etapa S24, etapa de búsqueda). Específicamente, la unidad de extracción 15b extrae un escritor del que el modelo de interés en el periodo de inicio es idéntico o similar al modelo actual y el modelo de interés en el periodo de finalización es idéntico o similar al modelo futuro mediante el uso del concepto de distancia Manhattan. En este momento, la unidad de extracción 15b almacena los modelos de interés generados y determinados como el modelo de cambio previo y el modelo de cambio posterior. Entonces, la unidad de transmisión 15c transmite el escritor extraído, junto con los modelos de interés de cambio previo y cambio posterior, como un resultado de búsqueda al terminal de usuario T (etapa S25, etapa de transmisión). En el terminal de usuario T, el resultado de búsqueda se visualiza en la pantalla de búsqueda 100 (etapa S26). Un usuario de terminal puede de ese modo obtener el resultado de búsqueda.
Un programa de búsqueda P1 para hacer que un ordenador funcione como el servidor de búsqueda 10 se describe a continuación en el presente documento con referencia a la figura 12.
El programa de búsqueda P1 incluye un módulo principal P10, un módulo de almacenamiento de perfil P11, un módulo para proporcionar una interfaz P12, un primer módulo de búsqueda P13, un módulo de ajuste de modelo P14, y un segundo módulo de búsqueda P15. El segundo módulo de búsqueda P15 incluye un módulo de recepción P15a, un módulo de extracción P15b y un módulo de transmisión P15c.
El módulo principal P10 es una parte que ejerce control sobre la función de búsqueda. Las funciones implementadas mediante la ejecución del módulo de almacenamiento de perfil P11, el módulo para proporcionar una interfaz P12, el primer módulo de búsqueda P13, el módulo de ajuste de modelo P14, y el segundo módulo de búsqueda P15 son iguales a las funciones de la base de datos de perfil 11, la unidad para proporcionar una interfaz 12, la primera unidad de búsqueda 13, la unidad de ajuste de modelo 14 y la segunda unidad de búsqueda 15 descritas anteriormente, respectivamente. Las funciones implementadas mediante la ejecución del módulo de recepción P15a, el módulo de extracción P15b, y el módulo de transmisión P15c son iguales a las funciones de la unidad de recepción 15a, la unidad de extracción 15b y la unidad de transmisión 15c descritas anteriormente, respectivamente.
El programa de búsqueda P1 se proporciona en la forma de grabarse de una manera estática en un medio de grabación tangible tal como CD-ROM, DVD-ROM o memoria de semiconductor, por ejemplo. Además, el programa de búsqueda P1 puede proporcionarse como una señal de datos superpuesta sobre una onda portadora a través de una red de comunicación.
Tal como se describió anteriormente, según este modo de realización, se extrae un escritor que tiene las dos frecuencias de aparición (los modelos de interés después del cambio y antes del cambio) que son idénticas o parecidas a las frecuencias de aparición para cada tema especificado en dos periodos (los modelos de interés presentes y futuros). Entonces, el escritor extraído se transmite como un resultado de búsqueda al terminal de usuario T y se visualiza en la pantalla de búsqueda 100. De esta manera, mediante la extracción de un escritor cuyo cambio en la frecuencia de aparición para un tema especificado es idéntico o parecido a la condición de búsqueda, es posible presentar información de un escritor cuyo interés ha cambiado tal como se indica por un usuario al usuario. Obsérvese que un cambio en el interés de un escritor es un tipo de un cambio en circunstancias.
(Segundo modo de realización)
5
10
15
20
25
30
35
40
45
50
55
60
65
La función y configuración de un servidor de búsqueda 10A según un segundo modo de realización se describen a continuación en el presente documento con referencia a las figuras 13 a 14. El servidor de búsqueda 10A es diferente del servidor de búsqueda 10 según el primer modo de realización en que se proporciona información sobre un artículo comprado por un escritor recuperado o un artículo que corresponde a un cambio en el modelo de interés del escritor al terminal de usuario, no sólo haciendo una búsqueda de escritor. La misma descripción o equivalente como en el primer modo de realización se omite a continuación.
Como se muestra en la figura 13, un sistema de búsqueda según este modo de realización incluye además una base de datos de artículos P y una base de datos del historial de compra R, que son bases de datos adicionales. La base de datos de artículos P es un medio de almacenamiento de datos de artículo que contiene un ID de artículo que identifica a un artículo y atributos de artículo arbitrarios tales como el nombre, la categoría, el precio, y la imagen del artículo. Además, la base de datos del historial de compra R es un medio de almacenamiento de datos de compra que contiene un ID de usuario que identifica a un usuario, quien ha adquirido un artículo, el ID de artículo del artículo, y la fecha y hora de compra. La base de datos de artículos P y la base de datos del historial de compra R pueden situarse en un sistema de compra en línea, por ejemplo, pero aquellas bases de datos pueden situarse en cualquier lugar y no necesariamente situarse en un sistema. Además, aunque una base de datos de artículos P y una base de datos del historial de compra R se muestran en la figura 1, el número de dichas bases de datos no está limitado particularmente. El servidor de búsqueda 10A puede comunicarse también con la base de datos de artículos P y la base de datos del historial de compra R a través de la red de comunicación N.
Tal como se muestra en la figura 14, el servidor de búsqueda 10A incluye, como componentes funcionales, una base de datos de perfil 11, una unidad para proporcionar una interfaz 12, una primera unidad de búsqueda 13, una unidad de ajuste de modelo 14, y una segunda unidad de búsqueda 15A. La segunda unidad de búsqueda 15A, que es una diferencia del primer modo de realización, se describe a continuación en el presente documento.
La segunda unidad de búsqueda 15A incluye una unidad de recepción 15a, una unidad de extracción 15b, una unidad de recomendación 15d (medios de búsqueda), y una unidad de transmisión 15c. Las funciones de la unidad de recepción 15a y la unidad de transmisión 15c son las mismas que aquellas descritas en el primer modo de realización. Además, aunque la unidad de extracción 15b es diferente de la del primer modo de realización en que esta envía un resultado de búsqueda a la unidad de recomendación 15d, los detalles de la función de obtención del resultado de búsqueda son los mismos que aquellos descritos en el primer modo de realización. Por tanto, la descripción en la unidad de recepción 15a, la unidad de extracción 15b y la unidad de transmisión 15c se omite, y sólo la unidad de recomendación 15d se describe a continuación en el presente documento.
La unidad de recomendación 15d es un medio de extracción de un artículo recomendado para mostrarse en un usuario de terminal. Dos procedimientos de extracción se describen en este ejemplo.
Un primer procedimiento es un procedimiento que extrae un artículo relacionado con un escritor recuperado. La unidad de recomendación 15d realiza el siguiente procesamiento para cada uno de escritores mostrados en el resultado de búsqueda de entrada.
La unidad de recomendación 15d se refiere al periodo de inicio y el periodo de finalización que corresponde al modelo de cambio previo y el modelo de cambio posterior de un escritor y adquiere un intervalo de tiempo entre dichos dos periodos como un periodo de transición. Obsérvese que el punto de inicio del periodo de transición es el punto de inicio o final del periodo de inicio, y el punto final del periodo de transición es el punto de inicio o final del periodo de finalización.
A continuación, la unidad de recomendación 15d lee datos de compra en los que un ID de usuario es el ID de usuario del escritor y la fecha y hora de compra se incluyen en el periodo de transición desde la base de datos del historial de compra y de ese modo adquiere el ID de artículo de un artículo comprado por el escritor durante el periodo de transición.
Cuando se adquieren uno o más ID de artículos, la unidad de recomendación 15d lee los datos de artículo que corresponden a los ID de artículo desde la base de datos de artículos P y genera información de recomendación (información adicional) que contiene un nombre de artículo, precio, imagen de artículo y similares. Obsérvese que, en este momento, la unidad de recomendación 15d puede comparar las categorías de artículos indicados por los datos de artículo con cinco temas principales y generar la información de recomendación sólo para el artículo que pertenece a la categoría que corresponde a cualquiera de los temas principales.
Por ejemplo, la unidad de recomendación 15d puede extraer sólo el artículo que pertenece a la categoría que corresponde al tema principal cuya frecuencia de aparición es la mayor de entre los modelos de cambio posterior. Además, la unidad de recomendación 15d puede extraer sólo el artículo que pertenece a la categoría que corresponde al tema principal cuya frecuencia de aparición es un valor especificado o más de entre los modelos de cambio posterior. Además, la unidad de recomendación 15d puede extraer sólo el artículo que pertenece a la categoría que corresponde al tema cuya frecuencia de aparición ha incrementado más en el procesamiento de
5
10
15
20
25
30
35
40
45
50
55
60
65
transición desde el modelo de cambio previo al modelo de cambio posterior. La correspondencia entre un tema y una categoría de artículo puede establecerse arbitrariamente, y la unidad de recomendación 15d almacena previamente datos que indican la correspondencia interna.
Después de la generación de la información de recomendación, la unidad de recomendación 15d suma la información de recomendación al resultado de búsqueda de entrada y transmite el resultado de búsqueda a la unidad de transmisión 15c.
Por otro lado, cuando no se adquiere ID de artículo, la unidad de recomendación 15d transmite el resultado de búsqueda de entrada como es a la unidad de transmisión 15c.
Un segundo procedimiento es un procedimiento que, basándose en un patrón de transición que indica la manera de pasar desde el modelo de cambio previo al modelo de cambio posterior, extrae un artículo en una categoría que corresponde a un tema indicado por dichos modelos.
Se asume que se necesita un tiempo s para alcanzar el modelo de cambio posterior desde el modelo de cambio previo, y el punto de tiempo del modelo de cambio previo es t = 0, y el punto de tiempo del modelo de cambio posterior es t = s. Entonces, los modelos de interés de cambio previos y posteriores son K(0) y K(s), respectivamente, y una función que indica el modelo de interés en un tiempo t se representa como K(t)={Küt,K1t,K2t,K3t,K4t}T, en la que T indica inversión. En este momento, el valor K(t) puede definirse como la siguiente ecuación (3) que usa una función f(t) arbitraria.
imagen1
La función f(t) puede ser una función lineal simple (t/s) o una función que cambia como una función exponencial o una función logarítmica. Por ejemplo, cuando la función f(t) es una función lineal, la función K(t) indica un modelo de transición (modelo lineal) que “se incrementa a una velocidad constante”. Además, cuando la función f(t) es una función exponencial, la función K(t) indica un modelo de transición (modelo exponencial) que “se incrementa lentamente al principio y después se incrementa exponencialmente”. Además, cuando la función f(t) es una función logarítmica, la función K(t) indica un modelo de transición (modelo logarítmico) que “se incrementa rápidamente al principio y después se incrementa lentamente”. Obsérvese que la unidad de recomendación 15d puede adquirir una pluralidad de funciones K(t).
Entonces, la unidad de recomendación 15d lee un artículo que corresponde con el modelo de transición adquirido desde la base de datos de artículos P. Se asume en este procesamiento que los datos de artículo contienen no sólo la categoría de un artículo sino también el tipo del modelo de transición correspondiente (por ejemplo, modelo lineal, modelo exponencial, modelo logarítmico etc.) y datos que indican qué punto de tiempo del modelo de transición (por ejemplo, primera mitad, punto medio, mitad posterior, etc.) corresponde al artículo. Por ejemplo, para cada uno del modelo de transición adquirido (función K(t)), la unidad de recomendación 15d lee un artículo que tiene la categoría que corresponde al tema principal indicado por el modelo de transición y para el que el tipo del modelo de transición que corresponde a la función K(t) se designa desde la base de datos de artículos P. Cuando uno o más datos de artículo se adquieren, la unidad de recomendación 15d genera información de recomendación (información adicional) para cada modelo de transición basándose en los datos de artículo. La unidad de recomendación 15d después suma la información de recomendación generada al resultado de búsqueda de entrada y transmite el resultado de búsqueda a la unidad de transmisión 15c.
El resultado de búsqueda que contiene la información de artículo recomendado se recibe y visualiza en el terminal de usuario T. La manera de visualización de la información de artículo recomendado puede decidirse arbitrariamente. Por ejemplo, una región para la visualizar los artículos recomendados puede situarse en la pantalla de búsqueda, o los artículos recomendados pueden visualizarse en otra pantalla. En cualquier caso, un usuario de terminal puede saber qué artículos ha adquirido un escritor recuperado en el proceso de que el interés del escritor ha cambiado.
Un programa de búsqueda P2 para hacer que un ordenador funcione como el servidor de búsqueda 10A se describe a continuación en el presente documento con referencia a la figura 15.
El programa de búsqueda P2 es diferente al programa de búsqueda P1 según el primer modo de realización en que este incluye un segundo módulo de búsqueda P15A que incluye un módulo de recomendación P15d en lugar del segundo módulo de búsqueda P15. Las funciones implementadas mediante la ejecución del segundo módulo de búsqueda P15A son iguales a las funciones de la segunda unidad de búsqueda 15a. Las funciones implementadas mediante la ejecución del módulo de recomendación P15d son iguales a las funciones de la unidad de recomendación 15d descritas con anterioridad. El programa de búsqueda P2 también se proporciona de la misma manera que el programa de búsqueda P1.
En este modo de realización también, pueden obtenerse las mismas ventajas que en el primer modo de realización.
5
10
15
20
25
30
35
40
45
50
55
60
65
Además, en este modo de realización, la información de recomendación que corresponde a un escritor o un patrón de transacción también se transmite como información adicional al terminal de usuario T. Por tanto, un usuario puede obtener no sólo información de un escritor cuyo modelo de interés ha cambiado como se indica en la condición de búsqueda sino también información relacionada con el escritor o el patrón de transacción.
Los modos de realización de la presente invención se describieron en detalle anteriormente. Sin embargo, la presente invención no se restringe a los modos de realización descritos anteriormente, y pueden hacerse varios cambios y modificaciones sin desviarse del alcance de la invención.
Aunque la condición de búsqueda contiene dos modelos de interés, es decir el modelo actual y el modelo futuro, en cada uno de los modos de realización descritos anteriormente, el número de modelos de interés (la frecuencia de aparición para cada tema especificado) contenidos en la condición de búsqueda puede ser tres o más. Específicamente, no sólo el modelo actual y el modelo futuro en el punto de alcance final sino también el modelo de interés en uno o más puntos intermedios entre el presente y el punto de alcance final (una tercera frecuencia de aparición para cada tema especificado en un tercer periodo especificado) pueden contenerse en la condición de búsqueda.
Aunque el periodo de recopilación que corresponde al modelo actual (primer periodo especificado) es un periodo desde un punto específico en el pasado hasta el presente, y el periodo que corresponde al modelo futuro (segundo periodo especificado) es un punto o periodo concreto en el futuro en cada uno de los modos de realización descritos anteriormente, cuyos periodos especificados pueden establecerse arbitrariamente. Por ejemplo, un mes desde el presente hasta tres a dos meses atrás puede establecerse como el primer periodo especificado, y un mes desde el presente hasta dos a un mes atrás puede establecerse como el segundo periodo especificado. En otras palabras, ambos de los periodos especificados establecidos como la condición de búsqueda pueden ser periodos en el pasado. Por el contrario, ambos de los periodos especificados pueden ser periodos en el futuro. Además, cada periodo especificado puede ser un punto concreto (tiempo), no un periodo que tiene un intervalo concreto. Por consiguiente, un periodo (periodo objetivo de búsqueda) que corresponde a cada modelo de interés mostrado en el resultado de búsqueda puede ser un punto concreto (tiempo), no un periodo.
En este caso, la unidad de extracción 15b extrae una combinación de modelos de interés en la que la distancia Manhattan es un umbral específico o inferior en el periodo de inicio, el periodo de finalización y uno o más periodos intermedios (tercer periodo objetivo de búsqueda) entre dichos periodos, variando dichos periodos por un escritor. Un procedimiento de determinación de la identidad y similitud del modelo de interés en el periodo intermedio es el igual que el procedimiento descrito anteriormente realizado en los modelos de interés de cambio previo y cambio posterior. Entonces, la unidad de extracción 15b almacena una pluralidad de modelos de interés para el periodo de inicio, el periodo de finalización y uno o más periodos intermedios en la combinación exacta como un modelo de cambio previo, un modelo de cambio posterior, y uno o más modelos de resultado intermedio, respectivamente. La unidad de extracción 15b después envía los modelos de interés recuperados, junto con los periodos correspondientes, como un resultado de búsqueda a la unidad de transmisión 15c.
Por ejemplo, se asume que tres modelos intermedios Ma, Mb y Mc que corresponden a puntos temporales Ta, Tb y Tc (en donde Ta<Tb<Tc) se introducen, además del modelo actual y el modelo futuro, como una condición de búsqueda para la unidad de extracción 15b. En este caso, la unidad de extracción 15b extrae tres modelos de resultado intermedio Ma', Mb' y Mc' que son idénticos o similares a aquellos tres modelos. En este momento, si periodos objetivo de búsqueda correspondientes a los modelos de resultado intermedio respectivos son Ta', Tb' y Tc', se establece la relación de Ta'<Tb'<Tc'. En otras palabras, una pluralidad de periodos intermedios como un objetivo de búsqueda mantiene la relación antes-después de los puntos intermedios especificados por la condición de búsqueda.
De esta manera, haciendo una búsqueda que usa tres o más modelos de interés, es posible hacer una búsqueda en consideración del procesamiento de un cambio en circunstancias, y de ese modo es posible presentar información de un escritor cuyo modelo de interés ha cambiado gradualmente tal como se indica por un usuario al usuario.
En cada uno de los modos de realización descritos anteriormente, un periodo (periodo de transición) desde el modelo actual al modelo futuro puede contenerse en el resultado de búsqueda. En este caso, la unidad de extracción 15b extrae los modelos de interés de cambio previo y de cambio posterior más allá de la condición de que el intervalo de tiempo desde el periodo inicio hasta el periodo de finalización coincide con el periodo de transición y determina la identidad y similitud de los modelos de interés que usan la distancia Manhattan. De ese modo es posible presentar información de un escritor cuyo interés ha cambiado tal como se indica por un usuario en un intervalo de tiempo especificado al usuario.
Aunque el modelo de interés que incluye una pluralidad de temas se usa en cada uno de los modos de realización descritos anteriormente, puede usarse un modelo que incluye sólo la frecuencia de aparición de un tema. En este caso, la transición de un modelo se representa no por un cambio en el porcentaje de cada frecuencia de aparición sino por la velocidad de incremento o disminución de una frecuencia de aparición. Por ejemplo, puede usarse un modelo que incluye un tema relacionado con un valor de evaluación (por ejemplo, puntuación o curva de clase) de
5
10
15
20
25
30
35
40
45
50
55
un examen de calificación específico. En el caso de tratar un modelo que incluya un sólo tema, aunque la unidad de ajuste de modelo 14 descrita anteriormente no se necesite, una técnica de una búsqueda de escritor es la misma que la descrita en los modos de realización anteriores.
Aunque cuando alguna frecuencia de aparición se cambia por una operación de usuario en el campo de modelo futuro 114 de la pantalla de búsqueda 100, las otras frecuencias de aparición se ajustan automáticamente en cada uno de los modos de realización descritos anteriormente, una función de ajuste de este tipo puede omitirse para dejar el ajuste a un usuario. En este caso, puede eliminarse la unidad de ajuste de modelo 14. Además, la frecuencia de aparición en el campo de modelo actual 113 puede cambiarse también por una operación de usuario. En este caso, la unidad de ajuste de modelo 14 puede ajustar el modelo actual aplicando el procedimiento de referencia de modelo de interés similar descrito anteriormente al modelo actual sin ajustar y el modelo futuro o puede ajustarse el modelo actual mediante la aplicación del procedimiento de propagación de tema descrito anteriormente al modelo actual sin ajustar. En el caso de sumar también el modelo intermedio a la condición de búsqueda, la unidad de ajuste de modelo 14 puede ajustar el modelo intermedio según una operación de usuario.
Aunque un escritor de un documento es un objetivo de búsqueda en cada uno de los modos de realización descritos anteriormente, no se limita particularmente el objetivo de búsqueda. Por ejemplo, un artículo, servicio o parecidos pueden ser el objetivo de búsqueda. Con respecto a ello, pueden generarse datos de perfil que tienen un tema adecuado para el objetivo de búsqueda basándose en comentarios o revisiones de artículos recopilados desde la base de datos documental. De ese modo, un usuario puede encontrar un artículo que ha ganado popularidad recientemente, un hotel que tiene una mejor reputación que antes y similares, por ejemplo.
Aunque el propósito de un usuario de terminal es buscar un escritor que ha experimentado un cambio de interés deseado en cada uno de los modos de realización descritos anteriormente, el propósito de la búsqueda es arbitrario. Con respecto a ello, puede establecerse un tema arbitrariamente. Además, la frecuencia de aparición para cada tema, que es un modelo, puede indicar un factor distinto a “interés”. Por ejemplo, pueden prepararse datos de perfil que tienen un tema adecuado para comprender la transición de la capacidad académica, y el sistema de búsqueda descrito anteriormente puede usarse con el propósito de que un profesor instruya a un estudiante para establecer una meta o el propósito de que un individuo determinado establezca una meta por sí mismo.
Aunque la identidad y similitud de modelos de interés se determina usando la distancia Manhattan en cada uno de los modos de realización descritos anteriormente, la identidad y similitud pueden determinarse usando otra escala o índice tal como la distancia euclídea.
Aunque la base de datos 11 de perfil se sitúe en el servidor de búsqueda 10, 10A en cada uno de los modos de realización descritos anteriormente, la base de datos de perfil puede situarse fuera del servidor de búsqueda o fuera del sistema que incluye el servidor de búsqueda.
Aunque un denominado sistema de búsqueda cliente-servidor se construye mediante el terminal de usuario T y el servidor de búsqueda 10, 10A en cada uno de los modos de realización anteriormente descritos, las funciones del servidor de búsqueda 10, 10A descritas anteriormente pueden incorporarse en el terminal de usuario. En este caso, un resultado de búsqueda extraído del terminal de usuario se envía (visualiza) en un monitor específico.
Lista de signos de referencia
10,10A... servidor de búsqueda (dispositivo de búsqueda), 11...base de datos de perfil, 12... unidad para proporcionar una interfaz, 13 ... primera unidad de búsqueda, 14...unidad de ajuste de modelo, 15,15A... segunda unidad de búsqueda, 15a...unidad de recepción, 15b...unidad de extracción (medios de búsqueda), 15c...unidad de transmisión (medios de salida), 15d...unidad de recomendación (medios de búsqueda), D...base de datos documental (base de datos especificada), P... base de datos de artículo (base de datos adicional), R...base de datos del historial de compra (base de datos adicional), P1,P2...programa de búsqueda, P10...módulo principal, P11...módulo de almacenamiento de perfil, P12... módulo para proporcionar una interfaz, P13... primer módulo de búsqueda, P144...módulo de ajuste de modelo, P15,P15A...módulo de búsqueda, P15a...módulo de recepción, P15b...módulo de extracción, P15c...módulo de transmisión, P15d ... módulo de recomendación, T...terminal de usuario.

Claims (6)

  1. 5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    REIVINDICACIONES
    Dispositivo de búsqueda (10) que comprende:
    unos medios de búsqueda (13, 15) para extraer un objetivo de búsqueda que cumple una condición de búsqueda especificada por un usuario por medio de una interfaz de usuario para búsqueda (100) basándose en datos de perfil generados basándose en un documento extraído de una base de datos especificada, conteniendo los datos de perfil un identificador para identificar un objetivo de búsqueda, fecha de creación del documento, y una frecuencia de aparición para cada tema obtenida clasificando palabras en el documento en uno o más temas; y
    unos medios de salida (12), que son una unidad para proporcionar una interfaz que proporciona la interfaz de usuario para búsqueda, para enviar el objetivo de búsqueda extraído por los medios de búsqueda para la presentación a un usuario, en el que
    la condición de búsqueda incluye una primera frecuencia de aparición para cada uno de uno o más temas especificados, especificados por el usuario en un primer periodo especificado que es un modelo de interés actual y una segunda frecuencia de aparición para cada uno de los temas especificados en un segundo periodo especificado que es posterior al primer periodo especificado que es un modelo de interés futuro, y
    los medios de búsqueda (13, 15) extraen, en respuesta a una transmisión única (S23) de la condición de búsqueda que contiene los modelos de interés actual y futuro de un terminal (T), el objetivo de búsqueda en el que la frecuencia de aparición para cada uno de los temas especificados obtenida a partir de los datos de perfil en un primer periodo objetivo de búsqueda es idéntica o similar a la primera frecuencia de aparición del modelo de interés actual y la frecuencia de aparición para cada uno de los temas especificados obtenida a partir de los datos de perfil en un segundo periodo objetivo de búsqueda que es posterior al primer periodo objetivo de búsqueda es idéntica o similar a la segunda frecuencia de aparición del modelo de interés futuro,
    en el que
    la identidad y similitud de los modelos de interés se determina basándose en una distancia Manhattan
    n
    di = YJ\xk~yk\
    k=1
    donde x es un vector de las frecuencias de apariciones del modelo de interés actual o el futuro e y es un vector de frecuencias de apariciones del objetivo de búsqueda, y n es un número de temas principales,
    en un caso en el que hay una pluralidad de temas especificados, cuando se cambia un porcentaje de una determinada frecuencia de aparición para cada tema especificado con respecto a un total de frecuencias de aparición para cada tema especificado en un periodo especificado, porcentajes de otras frecuencias de aparición para cada tema especificado en el periodo especificado se ajustan según el cambio,
    en el que
    los porcentajes de las otras frecuencias de aparición para cada tema especificado se ajustan basándose en un peso que indica una consistencia de una relación entre los temas especificados, el peso establecido basándose en una frecuencia con la que las palabras aparecen a lo largo de una pluralidad de temas diferentes, y una cantidad de cambio de la determinada frecuencia de aparición para cada tema especificado.
    Dispositivo de búsqueda según la reivindicación 1, en el que
    la condición de búsqueda incluye además una tercera frecuencia de aparición para cada uno de los temas especificados en cada uno de uno o más terceros periodos especificados entre el primer periodo especificado y el segundo periodo especificado, y
    los medios de búsqueda extraen el objetivo de búsqueda en el que la frecuencia de aparición en el primer periodo objetivo de búsqueda es idéntica o similar a la primera frecuencia de aparición, la frecuencia de aparición en el segundo periodo objetivo de búsqueda es idéntica o similar a la segunda frecuencia de aparición, y la frecuencia de aparición para cada uno de los temas especificados obtenida a partir de los datos de perfil en cada uno de uno o más terceros periodos objetivo de búsqueda que se corresponden con
    10
  2. 4.
    15
  3. 5.
    20
  4. 6.
    25
    30
    35
  5. 7.
    40
    45
  6. 8.
    50
    55
    60
    el uno o más terceros periodos especificados en una relación antes-después en el tiempo es idéntica o similar a la tercera frecuencia de aparición correspondiente.
    Dispositivo de búsqueda según la reivindicación 1 ó 2, en el que
    la condición de búsqueda incluye además un intervalo de tiempo entre los periodos especificados adyacentes entre sí, y
    un intervalo de tiempo entre los periodos objetivo de búsqueda adyacentes entre sí coincide con el intervalo de tiempo correspondiente entre los periodos especificados.
    Dispositivo de búsqueda según una cualquiera de las reivindicaciones 1 a 3, en el que
    el uno o más temas indicados por los datos de perfil son temas que quedan después de eliminar temas innecesarios especificados de un grupo de temas obtenido basándose en el documento extraído a partir de la base de datos especificada.
    Dispositivo de búsqueda según una cualquiera de las reivindicaciones 1 a 4, en el que
    los temas especificados son temas de jerarquía superior que incluyen uno o más temas indicados por los datos de perfil.
    Dispositivo de búsqueda según la reivindicación 1, en el que
    cuando se cambia la determinada frecuencia de aparición para cada tema especificado en el periodo especificado, el objetivo de búsqueda en el que la determinada frecuencia de aparición para cada tema especificado obtenida a partir de los datos de perfil en un periodo de búsqueda que corresponde al periodo especificado es idéntica o similar a la de determinada frecuencia de aparición cambiada para cada tema especificado y se extrae la frecuencia de aparición para cada tema especificado obtenida a partir de los datos de perfil en otro periodo de búsqueda que corresponde a otro periodo especificado es idéntica o similar a la frecuencia de aparición para cada tema especificado en el otro periodo especificado, y los porcentajes de las otras frecuencias de aparición para cada tema especificado se ajustan basándose en la frecuencia de aparición para cada tema especificado del objetivo de búsqueda en el periodo de búsqueda, y
    una relación antes-después entre el periodo de búsqueda y el otro periodo de búsqueda corresponde a una relación antes-después entre el periodo especificado y el otro periodo especificado.
    Dispositivo de búsqueda según una cualquiera de las reivindicaciones 1 a 6, en el que
    los medios de búsqueda extraen además información adicional que corresponde al objetivo de búsqueda extraído o información adicional que corresponde a la frecuencia de aparición para cada tema especificado del objetivo de búsqueda entre el primer periodo objetivo de búsqueda y el segundo periodo objetivo de búsqueda a partir de una base de datos adicional, y
    los medios de salida envían además la información adicional extraída por los medios de búsqueda para la presentación a un usuario.
    Procedimiento de búsqueda realizado por un dispositivo de búsqueda, que comprende:
    una etapa de búsqueda de extracción de un objetivo de búsqueda que cumple una condición de búsqueda especificada por un usuario por medio de una interfaz de usuario para búsqueda (100) basándose en datos de perfil generados basándose en un documento extraído de una base de datos especificada, conteniendo los datos de perfil un identificador para identificar un objetivo de búsqueda, fecha de creación del documento, y una frecuencia de aparición para cada tema obtenida clasificando palabras en el documento en uno o más temas; y
    una etapa de salida, por una unidad para proporcionar una interfaz que proporciona la interfaz de usuario para búsqueda, de enviar el objetivo de búsqueda extraído en la etapa de búsqueda para la presentación a un usuario, en el que
    la condición de búsqueda incluye una primera frecuencia de aparición para cada uno de uno o más temas especificados por el usuario en un primer periodo especificado que es un modelo de interés actual y una segunda frecuencia de aparición para cada uno de los temas especificados en un segundo periodo especificado que es posterior al primer periodo especificado que es un modelo de interés futuro, y
    la etapa de búsqueda, en respuesta a una transmisión (S23) única de la condición de búsqueda que
    5
    10
    15
    20
    25
    30
    35
    contiene los modelos de interés actual y futuro de un terminal (T), extrae el objetivo de búsqueda en el que la frecuencia de aparición para cada uno de los temas especificados obtenida a partir de los datos de perfil en un primer periodo objetivo de búsqueda es idéntica o similar a la primera frecuencia de aparición del modelo de interés actual y la frecuencia de aparición para cada uno de los temas especificados obtenida a partir de los datos de perfil en un segundo periodo objetivo de búsqueda que es posterior al primer periodo objetivo de búsqueda es idéntica o similar a la segunda frecuencia de aparición del modelo de interés futuro,
    en el que
    la identidad y similitud de los modelos de interés se determina basándose en una distancia Manhattan
    n
    di = YJ\xk~yk\
    k=1
    donde x es un vector de las frecuencias de apariciones del modelo de interés actual o el futuro e y es un vector de frecuencias de apariciones del objetivo de búsqueda, y n es un número de temas principales
    en un caso en el que hay una pluralidad de temas especificados, cuando se cambia un porcentaje de una determinada frecuencia de aparición para cada tema especificado con respecto a un total de frecuencias de aparición para cada tema especificado en un periodo especificado, porcentajes de otras frecuencias de aparición para cada tema especificado en el periodo especificado se ajustan según el cambio,
    en el que
    los porcentajes de las otras frecuencias de aparición para cada tema especificado se ajustan basándose en un peso que indica una consistencia de una relación entre los temas especificados, el peso establecido basándose en una frecuencia con la que las palabras aparecen a lo largo de una pluralidad de temas diferentes, y una cantidad de cambio de la determinada frecuencia de aparición para cada tema especificado.
    Programa de búsqueda que hace que un ordenador funcione como un dispositivo de búsqueda según la reivindicación 1.
    Medio de memoria legible por ordenador para grabar un programa de búsqueda que hace que un ordenador funcione como un dispositivo de búsqueda según la reivindicación 1.
ES12749605.7T 2011-02-25 2012-02-24 Dispositivo de búsqueda, procedimiento de búsqueda, programa de búsqueda y medio de memoria legible por ordenador para grabar un programa de búsqueda Active ES2657866T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2011040259 2011-02-25
JP2011040259A JP5048852B2 (ja) 2011-02-25 2011-02-25 検索装置、検索方法、検索プログラム、及びそのプログラムを記憶するコンピュータ読取可能な記録媒体
PCT/JP2012/054663 WO2012115254A1 (ja) 2011-02-25 2012-02-24 検索装置、検索方法、検索プログラム、及びそのプログラムを記憶するコンピュータ読取可能な記録媒体

Publications (1)

Publication Number Publication Date
ES2657866T3 true ES2657866T3 (es) 2018-03-07

Family

ID=46721026

Family Applications (1)

Application Number Title Priority Date Filing Date
ES12749605.7T Active ES2657866T3 (es) 2011-02-25 2012-02-24 Dispositivo de búsqueda, procedimiento de búsqueda, programa de búsqueda y medio de memoria legible por ordenador para grabar un programa de búsqueda

Country Status (7)

Country Link
US (1) US9058328B2 (es)
EP (1) EP2613275B1 (es)
JP (1) JP5048852B2 (es)
KR (1) KR101346927B1 (es)
CN (1) CN103262079B (es)
ES (1) ES2657866T3 (es)
WO (1) WO2012115254A1 (es)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9135311B2 (en) * 2012-03-20 2015-09-15 Tagboard, Inc. Gathering and contributing content across diverse sources
JP5857124B2 (ja) * 2012-05-24 2016-02-10 株式会社日立製作所 画像解析装置、画像解析システム、画像解析方法
US9244950B2 (en) 2013-07-03 2016-01-26 International Business Machines Corporation Method for synthetic data generation for query workloads
US10810240B2 (en) * 2015-11-06 2020-10-20 RedShred LLC Automatically assessing structured data for decision making
CN107943800A (zh) * 2016-10-09 2018-04-20 郑州大学 一种微博话题舆情计算与分析的方法
CN111723231B (zh) * 2019-03-20 2023-10-17 北京百舸飞驰科技有限公司 一种题目预测方法和装置

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000020538A (ja) * 1998-07-02 2000-01-21 Mitsubishi Electric Corp 情報検索方法、情報検索装置および情報検索プログラム記憶媒体
US6571234B1 (en) * 1999-05-11 2003-05-27 Prophet Financial Systems, Inc. System and method for managing online message board
US6493703B1 (en) * 1999-05-11 2002-12-10 Prophet Financial Systems System and method for implementing intelligent online community message board
JP2001216311A (ja) * 2000-02-01 2001-08-10 Just Syst Corp イベント分析装置、及びイベント分析プログラムが格納されたプログラム装置
US6751614B1 (en) * 2000-11-09 2004-06-15 Satyam Computer Services Limited Of Mayfair Centre System and method for topic-based document analysis for information filtering
JP4489994B2 (ja) * 2001-05-11 2010-06-23 富士通株式会社 話題抽出装置、方法、プログラム及びそのプログラムを記録する記録媒体
JP3813837B2 (ja) * 2001-05-25 2006-08-23 株式会社東芝 データ分析装置及びデータ分析方法並びにプログラム
JP4082059B2 (ja) * 2002-03-29 2008-04-30 ソニー株式会社 情報処理装置および方法、記録媒体、並びにプログラム
US7346606B2 (en) * 2003-06-30 2008-03-18 Google, Inc. Rendering advertisements with documents having one or more topics using user topic interest
US20050234877A1 (en) * 2004-04-08 2005-10-20 Yu Philip S System and method for searching using a temporal dimension
US7694311B2 (en) * 2004-09-29 2010-04-06 International Business Machines Corporation Grammar-based task analysis of web logs
KR100731283B1 (ko) * 2005-05-04 2007-06-21 주식회사 알에스엔 질의어에 따른 대량문서기반 성향 분석시스템
US20070005646A1 (en) * 2005-06-30 2007-01-04 Microsoft Corporation Analysis of topic dynamics of web search
KR20070047544A (ko) * 2005-11-02 2007-05-07 김정진 유사도를 적용하여 특허 문서를 검색하는 방법 및 그시스템
US20070214137A1 (en) * 2006-03-07 2007-09-13 Gloor Peter A Process for analyzing actors and their discussion topics through semantic social network analysis
US8296168B2 (en) * 2006-09-13 2012-10-23 University Of Maryland System and method for analysis of an opinion expressed in documents with regard to a particular topic
EP2122506A4 (en) * 2007-01-10 2011-11-30 Sysomos Inc METHOD AND SYSTEM FOR INFORMATION DISCOVERY AND TEXT ANALYSIS
US20080215607A1 (en) * 2007-03-02 2008-09-04 Umbria, Inc. Tribe or group-based analysis of social media including generating intelligence from a tribe's weblogs or blogs
US8442923B2 (en) * 2007-08-14 2013-05-14 John Nicholas Gross Temporal document trainer and method
JP5206996B2 (ja) * 2007-11-08 2013-06-12 日本電気株式会社 著者影響判定システム、著者影響判定方法、及びプログラム
JP2009187395A (ja) * 2008-02-07 2009-08-20 Nec Corp トピック分析装置、方法及びプログラム
US20110153601A1 (en) * 2008-09-24 2011-06-23 Satoshi Nakazawa Information analysis apparatus, information analysis method, and program
WO2010048430A2 (en) 2008-10-22 2010-04-29 Fwix, Inc. System and method for identifying trends in web feeds collected from various content servers
US7974983B2 (en) * 2008-11-13 2011-07-05 Buzzient, Inc. Website network and advertisement analysis using analytic measurement of online social media content
US8239397B2 (en) * 2009-01-27 2012-08-07 Palo Alto Research Center Incorporated System and method for managing user attention by detecting hot and cold topics in social indexes

Also Published As

Publication number Publication date
EP2613275B1 (en) 2017-11-22
CN103262079A (zh) 2013-08-21
CN103262079B (zh) 2015-04-01
US20140012853A1 (en) 2014-01-09
EP2613275A1 (en) 2013-07-10
WO2012115254A1 (ja) 2012-08-30
JP2012178026A (ja) 2012-09-13
KR101346927B1 (ko) 2014-01-03
US9058328B2 (en) 2015-06-16
JP5048852B2 (ja) 2012-10-17
EP2613275A4 (en) 2015-01-14
KR20130053448A (ko) 2013-05-23

Similar Documents

Publication Publication Date Title
Li et al. A bibliometric analysis of topic modelling studies (2000–2017)
ES2657866T3 (es) Dispositivo de búsqueda, procedimiento de búsqueda, programa de búsqueda y medio de memoria legible por ordenador para grabar un programa de búsqueda
US10373273B2 (en) Evaluating an impact of a user&#39;s content utilized in a social network
US20180068075A1 (en) Medical system and program
US8793254B2 (en) Methods and apparatus for classifying content
CN110765272B (zh) 基于知识图谱的签约方法、装置、计算机设备及计算机存储介质
US20170308517A1 (en) Automatic generation of templates for parsing electronic documents
Owusu Kwateng et al. Adoption of health information systems: Health professionals perspective
Spencer et al. Health experiences of children and young people who migrate–Opportunities for health education
Zhu et al. Human activity recognition using social media data
US9514495B2 (en) Creation and use of closely-matched groups to aid in initiating and sustaining behavioral change
Erbach-Schoenberg et al. A model of spatially constrained social network dynamics
CN105745684A (zh) 针对电子书的基于实体的摘要
Yamagata et al. A “Smart Lifestyle” for the re-design of the “After Corona” urban form
Jeffreys et al. Chinese–international intimate relations: An Australian case study of migrant marriage and divorce
KR101583073B1 (ko) 기사 요약 서비스 서버 및 방법
JP6191277B2 (ja) 情報処理装置、情報処理方法、プログラム
CN113707302A (zh) 基于关联信息的服务推荐方法、装置、设备及存储介质
KR20220077790A (ko) A.i 및 빅데이터에 기반한 비대면 온라인 멘토, 멘티 매칭 플랫폼 시스템
CN110348763A (zh) 一种电子阅读管理系统
Huang et al. Evolution of research on smart health: A bibliometrics analysis
Wiese Enabling an ecosystem of personal behavioral data
JP2023006482A (ja) 投稿関連用語生成装置、投稿関連用語生成端末、投稿関連用語生成システム装置、対話装置、投稿関連用語生成方法、プログラム及び記録媒体
Chauhan et al. Twitter can predict your next place of visit
JP2017199258A (ja) 関連トピック検出装置