WO2022105119A1

WO2022105119A1 - Procédé de génération de corpus d'apprentissage pour un modèle de reconnaissance d'intention, et dispositif associé

Info

Publication number: WO2022105119A1
Application number: PCT/CN2021/090462
Authority: WO
Inventors: 孙向欣
Original assignee: 平安科技（深圳）有限公司
Priority date: 2020-11-17
Filing date: 2021-04-28
Publication date: 2022-05-27
Also published as: CN112395390B; CN112395390A

Abstract

La présente invention se rapporte au domaine des mégadonnées et s'applique au domaine du traitement médical intelligent. L'invention concerne un procédé de génération de corpus d'apprentissage pour un modèle de reconnaissance d'intention, ainsi qu'un dispositif associé. Le procédé consiste à : recevoir un corpus de questions IA pré-annoté avec une classe de questions, ainsi qu'un corpus de réponses client pré-annoté avec une étiquette d'intention, le corpus de réponses client comprenant un corpus lié aux questions et un corpus non lié aux questions ; établir une bibliothèque de corpus liée aux questions et une bibliothèque de corpus non liée aux questions ; ajuster la bibliothèque de corpus liée aux questions et la bibliothèque de corpus non liée aux questions d'après la similarité entre le corpus non lié aux questions et la bibliothèque de corpus liée aux questions afin d'obtenir une bibliothèque de corpus liée aux questions cible et une bibliothèque de corpus non liée aux questions cible ; établir un premier échantillon d'apprentissage d'après la bibliothèque de corpus liée aux questions cible ; établir un second échantillon d'apprentissage d'après l'étiquette d'intention et la bibliothèque de corpus non liée aux questions ; et considérer le premier échantillon d'apprentissage et le second échantillon d'apprentissage comme un corpus d'apprentissage et générer celui-ci. Le corpus d'apprentissage peut être stocké dans une chaîne de blocs. Au moyen du procédé, la qualité d'un corpus d'apprentissage est améliorée.