WO2023249556A3

WO2023249556A3 - 基于对比学习来处理视频的方法、装置、设备和介质

Info

Publication number: WO2023249556A3
Application number: PCT/SG2023/050421
Authority: WO
Inventors: 柏松; 吴俊峰; 刘启昊; 江毅; 卢宾
Original assignee: 脸萌有限公司
Priority date: 2022-06-22
Filing date: 2023-06-14
Publication date: 2024-03-07
Also published as: WO2023249556A2; CN117315521A

Abstract

提供了基于对比学习来处理视频的方法、装置、设备和介质。从训练数据中的训练视频中的第一帧和第二帧分别提取至少一个第一对象和至少一个第二对象。针对至少一个第一对象中的第一对象，基于训练数据从至少一个第二对象中选择与第一对象相关联的至少一个正样本对象和至少一个负样本对象。基于至少一个正样本对象和至少一个负样本对象生成对比模型，对比模型描述视频中的帧中的对象与对象的对比特征之间的关联关系，对比模型使得对比特征与视频中的另一帧中的另一对象的另一对比特征之间的相似性指示对象与另一对象是否表示相同对象。对比特征区分各个帧中的对象是否表示相同对象，由此提高跨越各个帧执行对象跟踪的准确性。