WO2024124697A1

WO2024124697A1 - Procédé, appareil et dispositif de reconnaissance de parole, et support de stockage

Info

Publication number: WO2024124697A1
Application number: PCT/CN2023/078636
Authority: WO
Inventors: 潘嘉; 王孟之; 万根顺; 刘聪; 刘庆峰
Original assignee: 科大讯飞股份有限公司; 科大讯飞(苏州)科技有限公司
Priority date: 2022-12-12
Filing date: 2023-02-28
Publication date: 2024-06-20
Also published as: CN115910070A

Abstract

La présente demande divulgue un procédé, un appareil et un dispositif de reconnaissance de parole, ainsi qu'un support de stockage. Le procédé consiste à : sur la base d'une parole à reconnaître, obtenir un texte reconnu préliminaire constitué d'une étiquette de catégorie de mots d'entité et de caractères des mots de non-entité restants; en outre, sur la base d'un segment de parole correspondant à l'étiquette de catégorie de mots d'entité et d'un dictionnaire de prononciation prédéfini et d'un modèle de langage, obtenir des caractères de mots d'entité correspondant à l'étiquette de catégorie de mots d'entité; et remplacer l'étiquette de catégorie de mots d'entité correspondante dans le texte reconnu préliminaire par les caractères de mots d'entité de façon à obtenir un texte reconnu final. Ainsi, lorsqu'un nouveau mot d'entité de domaine apparaît, seuls le dictionnaire de prononciation et le modèle de langage doivent être mis à jour, et la mise à jour itérative d'un modèle de reconnaissance de parole n'est pas nécessaire, ce qui permet d'abaisser le coût d'apprentissage, d'éviter le problème d'oubli catastrophique provoqué par la mise à jour de modèles de reconnaissance de parole, et d'assurer la précision de reconnaissance de mots d'entité de domaine nouvellement apparus.