ES2949351T3 - Sistema de traducción - Google Patents

Sistema de traducción Download PDF

Info

Publication number
ES2949351T3
ES2949351T3 ES16897834T ES16897834T ES2949351T3 ES 2949351 T3 ES2949351 T3 ES 2949351T3 ES 16897834 T ES16897834 T ES 16897834T ES 16897834 T ES16897834 T ES 16897834T ES 2949351 T3 ES2949351 T3 ES 2949351T3
Authority
ES
Spain
Prior art keywords
language
translation
text
web page
phrases
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES16897834T
Other languages
English (en)
Inventor
Takaharu Hayashi
Jeffrey Thomas Sandford
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wovn Tech Inc
Original Assignee
Wovn Tech Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wovn Tech Inc filed Critical Wovn Tech Inc
Application granted granted Critical
Publication of ES2949351T3 publication Critical patent/ES2949351T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/451Execution arrangements for user interfaces
    • G06F9/454Multi-language systems; Localisation; Internationalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Information Transfer Between Computers (AREA)
  • Machine Translation (AREA)
  • Separation By Low-Temperature Treatments (AREA)
  • Cyclones (AREA)
  • Vehicle Body Suspensions (AREA)

Abstract

La presente invención proporciona un sistema de traducción con el que es posible traducir una página web mediante una simple alteración de un sitio web. El sistema de traducción está provisto de: una unidad de recepción de solicitudes de traducción para recibir una solicitud de traducción desde un dispositivo cliente, incluyendo la solicitud de traducción la URL de una página web en la que se muestra texto en un primer idioma; una unidad de traducción para hacer referencia a una base de datos bilingüe que almacena palabras y frases en el primer idioma en asociación con palabras y frases en un segundo idioma que constituyen una oración traducida de las palabras y frases en el primer idioma, y traducir el texto en el primer idioma incluido en la página web indicada por la URL al texto en el segundo idioma; y una unidad de transmisión de traducción para transmitir el texto traducido en el segundo idioma al dispositivo cliente. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Sistema de traducción
Campo técnico
La presente invención se refiere a un sistema de traducción.
Antecedentes de la técnica
Puede accederse a los sitios web publicados en internet mediante ordenadores en cualquier lugar del mundo. Sin embargo, las páginas web que constituyen un sitio web gestionado en un país extranjero a menudo se crean en una lengua distinta de la lengua nativa de ese país. Estas páginas web se traducen para proporcionar un acceso fácil al sitio web (véase, por ejemplo, el documento de patente 1).
Lista de citas
Literatura de patentes
Documentos de patente 1: JP 2013-190975 A
El documento WO 2012/115507 A1 describe un sistema de traducción de sitios web para proporcionar una versión traducida de una página web de un sitio web en respuesta a una solicitud HTTP de un ordenador cliente. El sistema de traducción está dispuesto entre el ordenador cliente y el servidor que alberga el sitio web. El traductor de sitios web reemplaza contenido de texto en la información HTML que se recibe desde el servidor y envía información HTML modificada al ordenador cliente como la versión traducida de la página web.
El documento JP 2015 005011 A describe un aparato de procesamiento de información para estimar la precisión de la traducción de una palabra en una consulta de búsqueda que requiere traducción. Un módulo de estimación de exactitud está conectado a un módulo de almacenamiento de traducción paralelo, un módulo de almacenamiento de registro y un módulo de cambio de traducción paralelo. El módulo de estimación de exactitud usa un registro almacenado en el módulo de almacenamiento de registro para determinar la exactitud de la traducción almacenada en el módulo de almacenamiento de traducción paralelo correspondiente a la palabra en la consulta de búsqueda.
Resumen de la invención
Problema técnico
Sin embargo, en la configuración descrita en el documento de patente 1, se debe proporcionar un sistema para traducir sitios web para cada sitio web, y a veces es difícil aplicar este sistema a sitios web a pequeña escala debido a factores de coste.
Es un objeto de la presente invención proporcionar un sistema de traducción que pueda traducir una página web mediante una simple alteración de un sitio web.
Solución al problema
Según un aspecto de la presente invención, se proporciona un sistema de traducción según la reivindicación 1. Según un segundo aspecto de la presente invención, se proporciona un método de traducción según la reivindicación 6. En la presente invención, “ unidad” se refiere no solo a un medio físico, sino también a la implementación de la función de la “ unidad” usando software. Las funciones de una sola “ unidad” o dispositivo pueden implementarse con dos o más medios o dispositivos físicos, o las funciones de dos o más “ unidades” y dispositivos pueden realizarse mediante un solo medio físico o dispositivo.
Efectos ventajosos de la invención
La presente invención es capaz de proporcionar un sistema de traducción que pueda traducir una página web mediante una simple alteración de un sitio web.
Breve descripción de los dibujos
[FIG. 1]
La FIG. 1 es un diagrama que muestra una configuración del sistema de procesamiento de información en la primera realización de la presente invención.
[FIG. 2]
La FIG. 2 es un diagrama que resume el método de biblioteca en la primera realización.
[FIG. 3]
La FIG. 3 es un diagrama que resume el método de script en la primera realización.
[FIG. 4]
La FIG. 4 es un diagrama que muestra un ejemplo de una configuración del sistema de traducción 30 con la primera realización.
[FIG. 5]
La FIG. 5 es un diagrama que muestra un ejemplo de la estructura de una base de datos bilingüe 220.
[FIG. 6]
La FIG. 6 es un diagrama de flujo que muestra un ejemplo de procesamiento de traducción en la primera realización.
[FIG. 7]
La FIG. 7 es un diagrama que resume el método de biblioteca en la segunda realización.
[FIG. 8]
La FIG. 8 es un diagrama que muestra un ejemplo de una configuración del sistema de traducción 30 con la segunda realización.
[FIG. 9]
La FIG. 9 es un diagrama de flujo que muestra un ejemplo de procesamiento de traducción en la segunda realización.
[FIG. 10]
La FIG. 10 es un diagrama que resume el método de biblioteca en la tercera realización.
[FIG. 11]
La FIG. 11 es un diagrama que muestra un ejemplo de una configuración del sistema de traducción 30 con la tercera realización.
[FIG. 12]
La FIG. 12 es un diagrama que muestra un ejemplo de la estructura de una base de datos de sinónimos 1000. [FIG. 13]
La FIG. 13 es un diagrama que muestra un ejemplo de la estructura de una base de datos de puntuación 1010. [FIG. 14]
La FIG. 14 es un diagrama de flujo que muestra un ejemplo de procesamiento de traducción en la tercera realización.
Descripción de las realizaciones
Primera realización
La siguiente primera realización no es según la invención y está presente únicamente con fines ilustrativos. La FIG. 1 es un diagrama que muestra una configuración del sistema de procesamiento de información en la primera realización de la presente invención. Como se muestra en la FIG. 1, el sistema de procesamiento de información incluye sitios web 10, terminales de usuario 20 y un sistema de traducción 30. Los sitios web 10, los terminales de usuario 20 y el sistema de traducción 30 están conectados a través de una red, por ejemplo, internet, para habilitar la comunicación.
Los sitios web 10 proporcionan páginas web a los terminales de usuario 20 y están equipados con ordenadores, tales como servidores web, servidores de base de datos y servidores de aplicaciones. Cada sitio web 10 puede usar uno o más ordenadores. Los sitios web 10 pueden proporcionar páginas web a terminales de usuario 20 basándose en solicitudes de terminales de usuario 20. Usando el sistema de traducción 30, los sitios web 10 pueden proporcionar páginas traducidas a terminales de usuario 20.
Un terminal de usuario 20 es un ordenador utilizado por un usuario para acceder a un sitio web 10. El terminal de usuario 20 puede ser, por ejemplo, un ordenador personal, tableta o teléfono inteligente. El usuario puede acceder a un sitio web 10 con un navegador instalado en el terminal de usuario 20.
El sistema de traducción 30 proporciona un servicio de traducción de páginas web a sitios web 10. El sistema de traducción 30 incluye uno o más ordenadores. No se proporciona un sistema de traducción 30 para cada sitio web 10, pero se comparte con varios sitios web 10.
La siguiente es una explicación de un método de traducción para páginas web usando un sistema de traducción 30. En la presente realización, como ejemplos del método de traducción, se usan dos tipos de método de traducción, a saber, el “ método de biblioteca” y el “ método de script” .
La FIG. 2 es un diagrama que resume el método de biblioteca en la primera realización. En el método de la biblioteca, una biblioteca 200 para utilizar el sistema de traducción 30 se incorpora en un sitio web 10. El usuario introduce una URL (Localizador Universal de Recursos) que indica una página web del sitio web deseado 10 en el navegador 210 del terminal de usuario 20. Como resultado, se envía una solicitud HTTP (Protocolo de Transferencia de Hipertexto) al sitio web 10 desde el terminal de usuario 20 (S200).
Cuando el sitio web 10 recibe una solicitud HTTP de un terminal de usuario 20, el sitio web 10 envía una solicitud de traducción para traducir el texto del primer idioma (por ejemplo, japonés) incluido en las páginas web indicadas por la URL en el texto del segundo idioma (por ejemplo, inglés) (S210). El siguiente es un ejemplo del formato de esta solicitud de traducción.
url: http://website.com, src: ja, dst: es
“ url: http://website.com” es la URL de la página web que se va a traducir, “ src: ja” es el código de lengua origen de traducción, y “ dst: es” es el código de lengua destino de traducción. Si es fija la lengua destino de traducción, no es necesario incluir un código de lengua destino de traducción. Si la lengua origen se puede determinar analizando la página web, la lengua origen de la traducción no tiene que incluirse.
Cuando el sistema de traducción 30 recibió una solicitud de traducción de un sitio web 10 (dispositivo cliente), el sistema de traducción 30 obtiene el texto del primer idioma para ser traducido en la página web basándose en la URL incluida en la solicitud de traducción. Por ejemplo, el texto en la primera lengua que se va a traducir es el texto incluido en el cuerpo de la página web (<BODY>~</BODY>). El sistema de traducción 30 adquiere el texto del primer idioma y lo traduce al texto del segundo lengua haciendo referencia a una base de datos bilingüe 220 (DB) que almacena palabras y frases en la primera lengua asociadas con palabras y frases en la segunda lengua, lo que constituye el texto traducido de las palabras y frases en la primera lengua, y (S220). Entonces, el sistema de traducción 30 envía el texto traducido al sitio web 10 (S230). El siguiente es un ejemplo del formato del texto traducido enviado al sitio web 10.
src: Kon'nichiwa, dst: Hola, xpath:/body/p/text()
“ src: Kon'nichiwa” es el texto fuente de traducción en el primer idioma, “ dst: Hola” es el texto destino de traducción en el segundo idioma, y “xpath:/body/p/text()” es el código para identificar la ubicación del texto en la página web.
El sitio web 10 convierte el texto del primer idioma de la página web en el texto del segundo idioma recibido del sistema de traducción 30 y envía una respuesta HTTP al terminal del usuario 20 (S240). Como resultado, se muestra una página web traducida en el navegador 210 del terminal de usuario 20.
La FIG. 3 es un diagrama que resume el método de script en la primera realización. En el método de script, el script para utilizar el sistema de traducción 30 se incorpora en una página web. El usuario introduce una URL en el navegador 210 del terminal de usuario 20 que indica una página web del sitio web 10 de destino. Como resultado, se envía una solicitud HTTP al sitio web 10 desde el terminal de usuario 20 (S300).
Cuando el sitio web 10 recibe una solicitud HTTP de un terminal de usuario 20, el sitio web 10 envía una respuesta HTTP al terminal de usuario 20 para visualizar la página web indicada por la URL (S310). Como resultado, una página web traducida que incluye el primer texto de la fuente de traducción se muestra en el navegador 210 del terminal de usuario 20. El script se incorpora en la página web para utilizar el sistema 30 de traducción. Este script es ejecutado por el navegador 210 y se envía una solicitud de traducción desde el terminal de usuario 20 al sistema de traducción 30. El formato de las solicitudes de traducción es el mismo que el método de biblioteca.
Como en el método de biblioteca, el sistema de traducción 30 adquiere el texto del primer idioma y lo traduce al texto del segundo idioma haciendo referencia a la base de datos bilingüe (BD) 220 según la URL incluida en la solicitud de traducción recibida desde el terminal del usuario (dispositivo cliente) y (S330). Entonces, el sistema de traducción 30 envía la oración traducida al terminal de usuario 20 (S340). El formato de la oración traducida enviada a los terminales de usuario 20 es el mismo que el formato de la oración traducida enviada a los sitios web 10 en el método de biblioteca.
En el terminal de usuario 20, el texto en la página web se convierte en el segundo texto de lengua recibido del sistema de traducción 30 por la secuencia de comandos ejecutada en el navegador 210. Como resultado, se muestra una página web traducida en el navegador 210 del terminal de usuario 20.
La siguiente es una explicación de una configuración que utiliza el método de biblioteca. Esta configuración también se puede implementar usando el método de script.
La FIG. 4 es un diagrama que muestra un ejemplo de una configuración del sistema de traducción 30 con la primera realización. El sistema de traducción 30 incluye una unidad de recepción de solicitud de traducción 400, una unidad de traducción 410 y una unidad de envío de traducción 420. Cada unidad puede implementarse en un ordenador que incluye memoria y un procesador, cuando el procesador ejecuta un programa almacenado en la memoria, por ejemplo.
La unidad de recepción de solicitud de traducción 400 recibe una solicitud de traducción que incluye el URL de una página web que muestra el texto de primer idioma de un sitio web 10 (dispositivo cliente). Como se explicó anteriormente, la solicitud de traducción contiene un código de lengua para el primer idioma, que es el idioma origen de traducción, y un código de idioma para el segundo idioma, que es el idioma destino de traducción, además de la URL.
La unidad de traducción 410 traduce el texto del primer idioma en la página web indicada por la URL incluida en la solicitud de traducción al texto del segundo idioma haciendo referencia a la base de datos bilingüe 220. La FIG. 5 es un diagrama que muestra un ejemplo de la estructura de una base de datos bilingüe 220. En el ejemplo que se muestra en la FIG. 5, la base de datos bilingüe 220 incluye códigos de lengua origen de traducción, palabras y frases de origen de traducción, códigos de lengua destino de traducción, palabras y frases destino de traducción, y URL. Se proporcionan URL para personalizar las traducciones para cada sitio web. Por ejemplo, en el ejemplo que se muestra en la FIG. 5, “ kon'nichiwa” se traduce como “ hola” en http://website.com. En otro caso, la traducción puede registrarse, “ kon'nichiwa” se traduce como “ Buenos días” en http://another.com. En otras palabras, la unidad de traducción 410 puede obtener una traducción en respuesta a la URL incluida en la solicitud de traducción de la base de datos bilingüe 220.
La unidad de envío de traducción 420 envía el texto del segundo idioma traducido por la unidad de traducción al sitio web 10 (dispositivo cliente).
La FIG. 6 es un diagrama de flujo que muestra un ejemplo de procesamiento de traducción en la primera realización. En primer lugar, el navegador 210 del terminal de usuario 20 envía una solicitud HTTP para mostrar un sitio web del primer idioma al sitio web 10 (S600).
El sitio web 10 recibe la solicitud HTTP del terminal de usuario 20 (S601). Entonces, el sitio web 10 envía una solicitud de traducción para traducir el primer idioma de la página web a un segundo idioma, al sistema 30 de traducción(S602).
La unidad de recepción de solicitud de traducción 400 en el sistema de traducción 30 recibe la solicitud de traducción del sitio web 10 (S603). Basándose en esta solicitud de traducción, la unidad 410 de traducción en el sistema de traducción traduce el texto del primer idioma en la página web al texto del segundo idioma (S604). A continuación, la unidad 420 de envío de traducción en el sistema 30 de traducción envía la oración traducida al sitio web 10 (S605).
El sitio web 10 recibe la oración traducida del sistema de traducción 30 (S606). El sitio web 10 convierte el texto del primer idioma en la página web en texto del segundo idioma y luego envía la respuesta HTTP al terminal del usuario 20 (S607).
El navegador 210 en el terminal de usuario 20 recibe la respuesta HTTP del sitio web 10 (S608). Como resultado, la página web traducida en el segundo idioma se muestra en el navegador 210 (S609).
Según la primera realización anterior, es posible traducir muchos sitios web simplemente incorporando la biblioteca o el script.
Además, es posible personalizar traducciones para cada sitio web proporcionando artículos que indiquen el sitio web en una base de datos bilingüe 220.
Segunda realización
La siguiente es una explicación de una segunda realización de la presente invención. Se omite la explicación sobre partes comunes con la primera realización. La arquitectura similar con la primera realización está marcada con símbolos y se omite para simplificar la explicación.
La FIG. 7 es un diagrama que resume el método de biblioteca en la segunda realización. El proceso de la solicitud HTTP (S200) a la respuesta HTTP (S240) es el mismo que el proceso en la primera modalidad (Figura 2). En la segunda modalidad, el script se incorpora en una página web para buscar texto no traducido. Por ejemplo, existe cualquier posibilidad de texto no traducido existente en una página web mostrada en un navegador 210, en la página web actualizada dinámicamente. Cuando el script detecta un texto no traducido, el texto del primer idioma no traducido se envía al sistema 30 de traducción (S700). A continuación, el sistema 30 de traducción actualiza la base 220 de datos bilingüe según este informe (S710).
La FIG. 8 es un diagrama que muestra una configuración del sistema de traducción 30 con la segunda realización. Además de la configuración mostrada en la FIG. 4, este sistema de traducción 30 incluye la unidad de recepción de texto no traducida 800 y la unidad de actualización de traducción 810.
La unidad 800 de recepción de texto no traducido recibe texto del primer idioma no traducido incluido en la página web desde el terminal 20 de usuario que muestra la página web traducida en el segundo idioma.
La unidad de actualización de traducción 810 asocia las palabras o expresiones del primer idioma correspondientes al texto no traducido con palabras o frases del segundo idioma y registra la asociación en la base de datos bilingüe 220.
La FIG. 9 es un diagrama de flujo que muestra un ejemplo de procesamiento de traducción en la segunda realización. El proceso de la etapa S600 a la etapa S609 es el mismo que el proceso en la primera realización (FIG. 6).
En el terminal de usuario 20, el script que busca el texto no traducido en la página web se ejecuta en el navegador. Luego, cuando se busca el texto no traducido (S900), el texto del primer idioma no traducido se envía desde el terminal de usuario 20 al sistema de traducción 30 (S901).
La unidad 800 de recepción de texto no traducido del sistema 30 de traducción recibe el texto del primer idioma no traducido desde el terminal 20 de usuario (S902). La unidad de actualización de traducción 810 en el sistema de traducción 30 registra la traducción correspondiente al texto no traducido en la base de datos bilingüe 220 (S903).
según la segunda realización anterior, es posible enriquecer una traducción agregando una traducción de texto no traducido a la base de datos bilingüe 220.
Tercera realización
La siguiente es una explicación de una tercera realización de la presente invención. Se omite la explicación sobre partes comunes con la primera realización. La arquitectura similar con la primera realización está marcada con símbolos y se omite para simplificar la explicación.
La FIG. 10 es un diagrama que resume el método de biblioteca en la tercera realización. En la tercera realización, el sistema 30 de traducción adquiere texto traducido basándose en la base 220 de datos bilingüe (S220) y selecciona un sinónimo de entre distintos sinónimos del segundo idioma (por ejemplo, “ comprar” y “ compra” ) correspondientes a la palabra del primer idioma (por ejemplo, “ kónyü” ) (S1000) haciendo referencia a una base de datos de sinónimos (DB) 1000. El sinónimo puede seleccionarse en función de una puntuación almacenada en una base 1010 de datos de puntuación (DB), por ejemplo. El sistema 30 de traducción envía el texto traducido que incluye el sinónimo seleccionado del sitio web 10 (S230).
En la tercera modalidad, el script que controla el comportamiento del usuario se incorpora en una página web. Por ejemplo, el comportamiento del usuario consiste en clics en la página web, el tiempo empleado en la página web y dejar la página web. La información de comportamiento del usuario detectada por el script se envía desde el terminal de usuario 20 al sistema de traducción 30 (S1010). El sistema de traducción 30 actualiza la puntuación relacionada con el comportamiento del usuario según esta información de comportamiento (S1020).
La FIG. 11 es un diagrama que muestra la configuración del sistema de traducción 30 con la tercera realización. Además de la configuración mostrada en la FIG. 4, este sistema de traducción 30 comprende la unidad de selección de sinónimos 1100 y la unidad de actualización de puntuación 1110.
La unidad de selección de sinónimos 1100 implementa una parte de funciones en la unidad de traducción 410. La unidad 1100 de selección sinónimo hace referencia a la base 1000 de datos de sinónimos, y selecciona un primer sinónimo (por ejemplo, “ comprar” ) para una solicitud de traducción (la primera solicitud de traducción) y un segundo sinónimo (por ejemplo, “ adquirir” ) para otra solicitud de traducción (la segunda solicitud de traducción) como la traducción para una primera palabra incluida en el texto del primer idioma (por ejemplo, “ kónyü” ). La unidad 410 de traducción envía el texto traducido usando el sinónimo seleccionado del sitio web 10. La FIG. 12 es un diagrama que muestra un ejemplo de la estructura de una base de datos de sinónimos 1000. En el ejemplo que se muestra en la FIG. 12, la base de datos de sinónimos 1000 incluye palabras y frases de origen de traducción, códigos de lengua de destino de traducción y sinónimos. Por ejemplo, dos sinónimos, “ comprar” y “ adquirir” se registran como traducciones de “ kónyü” . Además, dos sinónimos “ inicio de sesión” y “ registro” están incorporados como traducciones para “ roguin” . El número de sinónimos no se limita a dos, y puede haber tres o más.
Por ejemplo, los sinónimos pueden seleccionarse con la unidad de selección de sinónimos 1100 según las puntuaciones almacenadas en una base de datos de puntuación 1010. La FIG. 13 es un diagrama que muestra un ejemplo de la estructura de una base de datos de puntuación 1010. En el ejemplo que se muestra en la FIG. 13, la base de datos de puntuación 1010 incluye palabras y frases, cuenta de visionados, número de clics, duración de permanencia y tasas de salida. “ Recuento de visionados” significa el número de veces que se muestra un sitio web que contiene una palabra o frase determinada. “ Número de clics” significa el número de veces que se hace clic en un sitio web (o el número de veces que se hace clic en el botón o la frase). “ Duración de permanencia” significa la cantidad de tiempo que un usuario permanece en un sitio web, y “tasa de salida” significa la proporción de usuarios que se mueven a otra página web o cerrado el navegador sin realizar una cierta operación en la página web (tal como hacer clic en un botón).
La unidad 1100 de selección de sinónimos puede determinar la puntuación para cada palabra o frase basándose en uno o más elementos en la base 1010 de datos de puntuación. Cuando la unidad de selección de sinónimos 1100 envía texto traducido para una página web a un sitio web 10, selecciona el sinónimo de puntuación más alta como la mejor traducción determinándolo de forma tentativa con una alta proporción; por otro lado, usa la proporción restante para medir la efectividad de cada sinónimo. Por ejemplo, en el caso de que “ comprar” , “ adquirir” y “ añadir al carrito” se registren como sinónimos para traducir “ konyu” y la puntuación de “ comprar” sea la más alta, esta opción se seleccionará con una elevada proporción (por ejemplo, 95 % del tiempo). Para medir la efectividad de cada uno de los tres sinónimos “ comprar” , “ adquirir” y “ añadir al carrito” , cada sinónimos se selecciona, por ejemplo, un tercio del tiempo en la relación restante (por ejemplo, 5 % ).
La unidad de selección de sinónimos 1100 no tiene que seleccionar un sinónimo del segundo idioma para todas las palabras y frases incluidas en el texto del primer idioma del sitio web. Por ejemplo, la unidad de selección de sinónimos 1100 puede seleccionar sinónimos del segundo idioma para palabras y frases que se muestran en una ubicación específica en el sitio web (tal como en un botón) o para palabras y frases específicas que tienen un impacto en el comportamiento del usuario (por ejemplo, “ konyu” ).
La unidad de actualización de puntuación 1110 recibe información de comportamiento de usuario en una página web desde terminales de usuario 20 que muestra la página web traducida en el segundo idioma, y actualiza la base de datos de puntuación 1010 que almacena las puntuaciones para cada sinónimo del segundo idioma basándose en la información de comportamiento.
La FIG. 14 es un diagrama de flujo que muestra un ejemplo de procesamiento de traducción en la tercera realización. Se omite la explicación acerca de las partes comunes con el diagrama de flujo mostrado en la figura 6.
La unidad de recepción de solicitud de traducción 400 en el sistema de traducción 30 recibe una solicitud de traducción de un sitio web 10 (S603). La unidad de traducción 410 en el sistema de traducción 30 traduce el texto del primer idioma en una página web al texto del segundo idioma según la solicitud de traducción (S604). Luego, la unidad de selección de sinónimos 1100 selecciona sinónimos para las palabras o frases destino incluidas en el primer texto de texto basándose en las puntuaciones almacenadas en la base de datos de puntuación 1010 (S1400). La unidad 420 de envío de traducción en el sistema 30 de traducción envía la oración traducida que incluye sinónimos seleccionados al sitio web 10 (S605). La unidad 420 de envío de traducción puede emitir información que indica que se seleccionaron sinónimos mediante la unidad 1100 de selección de sinónimos para la verificación de la efectividad con el texto traducido. Esta información se incluye en la respuesta HTTP al terminal de usuario 20.
En el terminal de usuario 20, el script para monitorear el comportamiento del usuario se ejecuta en el navegador (S1401). Luego, la información de comportamiento del usuario se envía desde el terminal de usuario 20 al sistema de traducción 36 (S1402). No es problema que el monitoreo del comportamiento del usuario por el terminal de usuario 20 se realice solo cuando un sinónimo se seleccione para la verificación de la efectividad.
La unidad de actualización de puntuación 1110 en el sistema de traducción 30 recibe información de comportamiento de usuario del terminal de usuario 20 (S1403). Luego, la unidad de actualización de puntuación 1110 actualiza la puntuación almacenada en la base de datos de puntuación 1010 (S1404) según la información de comportamiento del usuario.
según la tercera realización anterior, es posible analizar el comportamiento del usuario para cada sinónimo. Por ejemplo, al analizar el comportamiento del usuario, es posible seleccionar una traducción para la que los usuarios hagan la acción deseada (por ejemplo, comportamiento para comprar un producto).
Lista de signos de referencia
10: Sitio web
20: Terminal de usuario
30: Sistema de traducción
200: Biblioteca
210: Navegador
220: Base de datos bilingüe
400: Unidad de recepción de solicitud de traducción
410: Unidad de traducción
420: Unidad de envío de traducción
800: Unidad de recepción de texto no traducido
810: Unidad de actualización de traducción
1000: Base de datos de sinónimos
1010: Base de datos de puntuación
1100: Unidad de selección de sinónimos
1110: Unidad de actualización de puntuación

Claims (5)

REIVINDICACIONES
1. Un sistema (30) de traducción que comprende:
una unidad de recepción de solicitud de traducción (400) para recibir, desde un servidor web (10) o un terminal de usuario (20), una solicitud de traducción que incluye un Localizador Universal de Recursos, URL, de una página web en la que se muestra el texto en un primer idioma;
una unidad de traducción (410) para traducir el texto en el primer idioma incluido en la página web indicada por la URL en texto en un segundo idioma haciendo referencia a una base de datos bilingüe (220) que almacena palabras y frases en el primer lenguaje asociado con palabras y frases en el segundo lenguaje que constituye el texto traducido de las palabras y frases en el primer idioma;
una unidad de envío de traducción (420) para enviar el texto traducido en el segundo idioma al servidor web (10) o al terminal de usuario (20);
una unidad de recepción de texto (800) no traducida para recibir, desde el terminal de usuario (20), texto no traducido en el primer lenguaje incluido en la página web traducida en el segundo idioma, detectando el texto no traducido un script integrado en la página web ejecutada en el terminal de usuario (20) en la página web actualizada dinámicamente; y
una unidad de actualización de traducción (810) para asociar una palabra o frase en el primer lenguaje correspondiente al texto no traducido con una palabra o frase en el segundo lenguaje que constituye una traducción de la palabra o frase en el primer lenguaje y registrar la asociación en la base de datos bilingüe (220);
donde las URL están incluidas en la base de datos bilingüe (220), las URL que asocian palabras y frases en el primer lenguaje con palabras y frases en el segundo idioma, para personalizar de esta manera las traducciones para las URL incluidas en la base de datos bilingüe (220); y
la unidad de traducción (410) es para traducir texto en el primer idioma a texto en el segundo idioma basándose en las palabras y frases en el primer lenguaje y las palabras y frases en el segundo lenguaje asociado en la base de datos bilingüe mediante la URL incluida en la solicitud de traducción.
2. El sistema (30) de traducción según la reivindicación 1, en el que un código de lenguaje que indica el lenguaje destino de traducción está incluido en la solicitud de traducción, y la unidad de traducción es para traducir el texto en el primer lenguaje a texto en el segundo lenguaje indicado por el código de lenguaje.
3. El sistema de traducción (30) según la reivindicación 1 o 2, donde
la unidad de traducción (410) está configurada para seleccionar, para una primera solicitud de traducción, un primer sinónimo del segundo lenguaje como la traducción para una primera palabra o frase incluida en el texto en el primer lenguaje, y está configurada para seleccionar, para una segunda solicitud de traducción, un segundo sinónimo del segundo lenguaje, haciendo referencia a una base de datos sinónimo que almacena sinónimos de palabras y frases en el segundo idioma;
el sistema de traducción comprende, además, una unidad de actualización de puntuación (1110) para recibir, desde un primer terminal de usuario en el que se muestra una primera página web que incluye el primer sinónimo basándose en la primera solicitud de traducción, la primera información de comportamiento que indica el comportamiento del usuario en la primera página web, y para recibir, desde un segundo terminal de usuario en el que una segunda página web que incluye el segundo sinónimo se muestra basándose en la segunda solicitud de traducción, la segunda información de comportamiento que indica el comportamiento del usuario en la segunda página web; y
en donde la unidad de actualización de puntuación (1110) se configura para actualizar una base de datos de puntuación (1010) que almacena la puntuación para el primer sinónimo y el segundo sinónimo basándose en la primera información de comportamiento y la segunda información de comportamiento.
4. El sistema de traducción (30) según la reivindicación 3, en donde la puntuación para el primer sinónimo es mayor que la puntuación para el segundo sinónimo, y la relación a la que se selecciona el primer sinónimo es mayor que la relación a la que se selecciona el segundo sinónimo.
5. Un método de traducción que comprende las etapas ejecutadas por ordenador de:
recibir (S603) una solicitud de traducción de un servidor web (10) o un terminal de usuario (20), la solicitud de traducción incluye un Localizador Universal de Recursos, URL, de una página web en la que se muestra el texto en un primer idioma;
traducir (S604) el texto en el primer idioma incluido en la página web indicada por la URL en texto en un segundo idioma haciendo referencia una base de datos bilingüe (220) que almacena palabras y frases en el primer lenguaje asociado con palabras y frases en el segundo lenguaje que constituye el texto traducido de las palabras y frases en el primer idioma;
enviar (S605) el texto traducido en el segundo idioma al servidor web (10) o al terminal de usuario (20); recibir (S902), desde el terminal de usuario (20), texto no traducido en el primer lenguaje incluido en la página web traducida en el segundo idioma, detectando el texto no traducido un script integrado en la página web ejecutada en el terminal de usuario (20) en la página web actualizada dinámicamente; y
asociar una palabra o frase en el primer lenguaje correspondiente al texto no traducido con una palabra o frase en el segundo lenguaje que constituye una traducción de la palabra o frase en el primer lenguaje y registrar (S903) la asociación en la base de datos bilingüe (220),
donde las URL están incluidas en la base de datos bilingüe (220), las URL que asocian palabras y frases en el primer lenguaje con palabras y frases en el segundo idioma, para personalizar de esta manera las traducciones para las URL incluidas en la base de datos bilingüe (220); y
la unidad de traducción (410) es para traducir texto en el primer idioma a texto en el segundo idioma basándose en las palabras y frases en el primer lenguaje y las palabras y frases en el segundo lenguaje asociado en la base de datos bilingüe mediante la URL incluida en la solicitud de traducción.
ES16897834T 2016-04-04 2016-04-04 Sistema de traducción Active ES2949351T3 (es)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2016/061028 WO2017175275A1 (ja) 2016-04-04 2016-04-04 翻訳システム

Publications (1)

Publication Number Publication Date
ES2949351T3 true ES2949351T3 (es) 2023-09-27

Family

ID=60001007

Family Applications (1)

Application Number Title Priority Date Filing Date
ES16897834T Active ES2949351T3 (es) 2016-04-04 2016-04-04 Sistema de traducción

Country Status (8)

Country Link
US (2) US10878203B2 (es)
EP (1) EP3441887B1 (es)
JP (1) JP6332781B2 (es)
CN (1) CN109074326B (es)
ES (1) ES2949351T3 (es)
PL (1) PL3441887T3 (es)
SG (1) SG11201808470QA (es)
WO (1) WO2017175275A1 (es)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6332781B2 (ja) 2016-04-04 2018-05-30 Wovn Technologies株式会社 翻訳システム
US10162819B2 (en) * 2016-08-17 2018-12-25 Netflix, Inc. Change detection in a string repository for translated content
CN112789620A (zh) * 2018-07-31 2021-05-11 株式会社OPTiM 计算机系统、画面共享方法以及程序
US11494567B2 (en) * 2020-03-03 2022-11-08 Dell Products L.P. Content adaptation techniques for localization of content presentation
US11443122B2 (en) * 2020-03-03 2022-09-13 Dell Products L.P. Image analysis-based adaptation techniques for localization of content presentation
CN113343647B (zh) * 2021-06-29 2024-08-16 北京搜狗科技发展有限公司 一种句对匹配方法、装置和用于匹配句对的装置

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3121548B2 (ja) * 1996-10-15 2001-01-09 インターナショナル・ビジネス・マシーンズ・コーポレ−ション 機械翻訳方法及び装置
AUPQ539700A0 (en) * 2000-02-02 2000-02-24 Worldlingo.Com Pty Ltd Translation ordering system
JP2001256228A (ja) * 2000-03-10 2001-09-21 Logical Tech Co Ltd Web検索サーバ、Web検索方法およびWeb検索プログラムを記録した記録媒体
JP2001344169A (ja) * 2000-06-01 2001-12-14 Internatl Business Mach Corp <Ibm> ネットワークシステム、サーバ、ウェブサーバ、ウェブページ、データ処理方法、記憶媒体及びプログラム伝送装置
JP4017329B2 (ja) * 2000-09-14 2007-12-05 沖電気工業株式会社 機械翻訳システム
US20040205671A1 (en) * 2000-09-13 2004-10-14 Tatsuya Sukehiro Natural-language processing system
JP2003141018A (ja) * 2001-11-02 2003-05-16 Fujitsu Ltd サーバ、中継装置、情報提供方法、およびプログラム
US20020123879A1 (en) * 2001-03-01 2002-09-05 Donald Spector Translation system & method
JP2003296327A (ja) * 2002-04-02 2003-10-17 Nec Corp 翻訳サーバ、ジャンル別オンライン機械翻訳方法、およびそのプログラム
US20060100849A1 (en) * 2002-09-30 2006-05-11 Ning-Ping Chan Pointer initiated instant bilingual annotation on textual information in an electronic document
US7539619B1 (en) * 2003-09-05 2009-05-26 Spoken Translation Ind. Speech-enabled language translation system and method enabling interactive user supervision of translation and speech recognition accuracy
CN101361065B (zh) * 2006-02-17 2013-04-10 谷歌公司 分布式模型的编码和自适应、可扩展访问
US7974832B2 (en) * 2007-12-12 2011-07-05 Microsoft Corporation Web translation provider
US20090182547A1 (en) * 2008-01-16 2009-07-16 Microsoft Corporation Adaptive Web Mining of Bilingual Lexicon for Query Translation
JP5456260B2 (ja) * 2008-02-01 2014-03-26 ニフティ株式会社 翻訳処理プログラム、翻訳処理方法及び翻訳処理
US8707310B2 (en) * 2008-10-15 2014-04-22 Oracle International Corporation Batch processing of jobs on multiprocessors based on estimated job processing time
US8306806B2 (en) * 2008-12-02 2012-11-06 Microsoft Corporation Adaptive web mining of bilingual lexicon
WO2010093171A2 (ko) * 2009-02-10 2010-08-19 Oh Eui Jin 다국어 웹페이지 번역 시스템 및 다국어 웹페이지를 번역하여 제공하는 방법
CN101576878A (zh) * 2009-06-17 2009-11-11 董名垂 用户勾圈网页即时翻译系统及方法
US9710429B1 (en) * 2010-11-12 2017-07-18 Google Inc. Providing text resources updated with translation input from multiple users
NL2006294C2 (en) * 2011-02-24 2012-08-27 Exvo Com Group B V Website translator, system, and method.
KR20110093741A (ko) * 2011-06-04 2011-08-18 엄영철 번역중계 운영시스템 및 그 방법
WO2012170817A1 (en) * 2011-06-10 2012-12-13 Google Inc. Augmenting statistical machine translation with linguistic knowledge
US10096033B2 (en) * 2011-09-15 2018-10-09 Stephan HEATH System and method for providing educational related social/geo/promo link promotional data sets for end user display of interactive ad links, promotions and sale of products, goods, and/or services integrated with 3D spatial geomapping, company and local information for selected worldwide locations and social networking
JP5571112B2 (ja) 2012-03-13 2014-08-13 ヤフー株式会社 翻訳制御装置、翻訳制御方法及び翻訳制御プログラム
JP5787934B2 (ja) * 2013-06-19 2015-09-30 ヤフー株式会社 情報処理装置、情報処理方法及び情報処理プログラム
US9639526B2 (en) * 2014-01-10 2017-05-02 Microsoft Technology Licensing, Llc Mobile language translation of web content
CN104199917A (zh) * 2014-08-29 2014-12-10 北京金山安全软件有限公司 一种网页页面内容的翻译方法、装置以及客户端
CN104462074B (zh) * 2014-12-26 2018-04-10 北京奇虎科技有限公司 一种进行网页数据翻译的方法、装置和浏览器客户端
JP6332781B2 (ja) 2016-04-04 2018-05-30 Wovn Technologies株式会社 翻訳システム

Also Published As

Publication number Publication date
US20210073482A1 (en) 2021-03-11
JP6332781B2 (ja) 2018-05-30
CN109074326B (zh) 2022-02-18
CN109074326A (zh) 2018-12-21
JPWO2017175275A1 (ja) 2018-04-19
EP3441887B1 (en) 2023-06-07
SG11201808470QA (en) 2018-10-30
EP3441887C0 (en) 2023-06-07
EP3441887A4 (en) 2019-12-18
EP3441887A1 (en) 2019-02-13
US10878203B2 (en) 2020-12-29
WO2017175275A1 (ja) 2017-10-12
PL3441887T3 (pl) 2023-10-09
US20190065485A1 (en) 2019-02-28

Similar Documents

Publication Publication Date Title
ES2949351T3 (es) Sistema de traducción
US10114820B2 (en) Displaying original text in a user interface with translated text
US8468149B1 (en) Multi-lingual online community
RU2295150C2 (ru) Сегмент данных о переводе
US8898583B2 (en) Systems and methods for providing information regarding semantic entities included in a page of content
AU2010328181B2 (en) Resource search operations
JP5148278B2 (ja) テキスト分割のために言語を選択する方法およびシステム
KR101505985B1 (ko) 자동적인 검색 쿼리 보정
Malmasi et al. Location mention detection in tweets and microblogs
US9710429B1 (en) Providing text resources updated with translation input from multiple users
US9165082B2 (en) Direct navigation through browser address bar
TW200817941A (en) Multilingual data querying
US11328306B1 (en) Systems and methods for interactive tools for dynamic evaluation of online content
JP7240662B2 (ja) 検索システム及び検索システムの動作方法
US20150278188A1 (en) Input string matching for domain names
US10261989B2 (en) Method of and system for mapping a source lexical unit of a first language to a target lexical unit of a second language
US10430522B2 (en) Dynamic suggestions for content translation
KR100820899B1 (ko) 온라인 상에서 맞춤법 및 자동완성 기능을 제공하는 방법및 상기 방법을 수행하는 시스템
JP2008262383A (ja) 文書データ表示処理プログラム,処理方法,処理装置,および処理システム
JP6722953B2 (ja) 翻訳システム
JP5349557B2 (ja) 翻訳システム
JP2008171110A (ja) サイト検索システム、検索サーバ、プログラム
Nash The Atlas of Pidgin and creole language structures/The survey of Pidgin and Creole languages
KR20090052757A (ko) 웹 페이지의 특성에 기초하여 텍스트를 추출하기 위한방법, 시스템 및 컴퓨터 판독 가능한 기록 매체
JP2010039721A (ja) データ入力装置、方法、及びプログラム