MX2018011305A

MX2018011305A - Técnicas para corregir el desvío de entrenamiento lingüístico en los datos de entrenamiento.

Info

Publication number: MX2018011305A
Application number: MX2018011305A
Authority: MX
Inventors: Shroff Gautam; Vig Lovekesh; Agarwal Puneet; Patidar Mayur
Original assignee: Tata Consultancy Services Ltd
Priority date: 2017-09-18
Filing date: 2018-09-17
Publication date: 2019-07-04
Also published as: CA3017655A1; AU2018232914A1; BR102018068925A2; US20190087728A1; AU2018232914B2; JP2019057280A; US11373090B2; JP6606243B2; CA3017655C

Abstract

En los sistemas de asistente automatizado, se utiliza un modelo de aprendizaje profundo en forma de un clasificador de memoria larga a corto plazo (LSTM) para asignar preguntas a clases, con cada clase teniendo una respuesta depurada manualmente. Un equipo de expertos crea manualmente los datos de entrenamiento utilizados para entrenar a este clasificador. Confiar en la depuración humana a menudo hace que dichos desvíos de entrenamiento lingüístico se arraiguen en los datos de entrenamiento, ya que cada individuo tiene un estilo específico de escribir el lenguaje natural y usa algunas palabras en un contexto específico solamente. Los modelos profundos terminan aprendiendo estos desvíos, en lugar de las palabras conceptuales centrales de las clases objetivo. Para corregir estos desvíos, las oraciones significativas se generan automáticamente usando un modelo generativo, y luego se usan para entrenar un modelo de clasificación. Por ejemplo, se utiliza un auto-codificador variacional (VAE) como modelo generativo para generar oraciones novedosas y se utiliza un modelo de lenguaje (LM) para seleccionar oraciones basadas en la probabilidad.