WO2024008215A2

WO2024008215A2 - Procédé et appareil de reconnaissance d'émotion vocale

Info

Publication number: WO2024008215A2
Application number: PCT/CN2023/117475
Authority: WO
Inventors: 刘汝洲
Original assignee: 顺丰科技有限公司
Priority date: 2022-07-08
Filing date: 2023-09-07
Publication date: 2024-01-11
Also published as: WO2024008215A3; CN117409818A

Abstract

La présente demande concerne un procédé et un appareil de reconnaissance d'émotion vocale. Le procédé consiste : à obtenir un premier codage de caractéristique audio d'une trame audio en cours et des informations de caractéristique de texte d'une trame audio historique, la trame audio historique précédant la trame audio en cours ; à prédire un codage de caractéristique de texte de la trame audio en cours en fonction des informations de caractéristique de texte de la trame audio historique ; à effectuer une fusion sur le premier codage de caractéristique audio et le codage de caractéristique de texte de la trame audio en cours afin d'obtenir un vecteur de caractéristique fusionnée ; et à effectuer une reconnaissance d'émotion vocale en fonction du vecteur de caractéristique fusionnée afin d'obtenir un résultat de reconnaissance d'émotion vocale de la trame audio en cours. La présente demande utilise les informations de caractéristique de texte de la trame audio historique pour prédire le codage de caractéristique de texte de la trame audio en cours, et après avoir effectué une fusion sur le premier codage de caractéristique audio et le codage de caractéristique de texte de la trame audio en cours, effectue une reconnaissance d'émotion vocale ; une fusion profonde est effectuée sur des informations audio et des informations de texte, et la précision de reconnaissance d'émotion vocale peut être améliorée.