WO2023197979A1

WO2023197979A1 - Procédé et appareil de traitement de données, et dispositif informatique et support des stockage

Info

Publication number: WO2023197979A1
Application number: PCT/CN2023/087208
Authority: WO
Inventors: 冯鑫
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2022-04-13
Filing date: 2023-04-10
Publication date: 2023-10-19
Also published as: CN114465737B; CN114465737A

Abstract

Les modes de réalisation de la présente demande divulguent un procédé et un appareil de traitement de données, ainsi qu'un dispositif informatique et un support de stockage, qui peuvent être appliqués à une scène d'intelligence artificielle. Le procédé consiste à : identifier des informations de caractéristiques d'image d'une trame vidéo de données multimédias, les informations de caractéristiques d'image comprenant M objets de service auxquels appartiennent les images de rôle dans la trame vidéo ; positionner et séparer, à partir d'une trame audio d'origine des données multimédias, les trames audio qui comprennent une voix humaine de façon à obtenir N trames audio d'objet, extraire respectivement les vecteurs de caractéristiques sémantiques audio correspondants à partir des N trames audio d'objet, puis effectuer un traitement de regroupement sur les vecteurs de caractéristiques sémantiques audio correspondant aux N trames audio d'objet de façon à obtenir M groupes audio ; et d'après les informations de caractéristiques d'image, les M groupes audio et une table de mappage de rôles d'objet associée aux données multimédias, identifier un rôle de service correspondant à chacun des P groupes audio. Au moyen des modes de réalisation de la présente demande, la précision, l'efficacité et l'applicabilité de l'identification des rôles audio peuvent être améliorées.