WO2022239239A1

WO2022239239A1 - Dispositif, procédé et programme d'apprentissage

Info

Publication number: WO2022239239A1
Application number: PCT/JP2021/018443
Authority: WO
Inventors: 康智大石; 邦夫柏野
Original assignee: 日本電信電話株式会社
Priority date: 2021-05-14
Filing date: 2021-05-14
Publication date: 2022-11-17
Also published as: JPWO2022239239A1

Abstract

Une unité de calcul d'une quantité caractéristique d'une vidéo (111) calcule une quantité caractéristique d'une vidéo, autrement dit une quantité caractéristique d'une vidéo faisant partie d'un ensemble de données de paires de vidéos et de paroles, en utilisant un modèle permettant de recevoir une vidéo à titre d'entrée et de sortir une quantité caractéristique obtenue en mappant la vidéo dans un premier espace intégré. Une unité de calcul d'une quantité caractéristique de paroles (121) calcule une quantité caractéristique de paroles, autrement dit une quantité caractéristique de paroles faisant partie de l'ensemble de données, en utilisant un codeur de paroles qui est un modèle permettant de recevoir des paroles à titre d'entrée et de sortir une quantité caractéristique obtenue en mappant les paroles dans un second espace intégré. Une unité de mise à jour (132) met à jour des paramètres des modèles respectivement utilisés par l'unité de calcul d'une quantité caractéristique d'une vidéo (111) et l'unité de calcul d'une quantité caractéristique de paroles (121) de manière à augmenter une similarité entre la quantité caractéristique d'une vidéo et la quantité caractéristique de paroles, similarité calculée en renforçant une proximité temporelle entre des phénomènes prédéterminés apparaissant dans la vidéo et les paroles.