WO2024000344A1

WO2024000344A1 - Procédé d'entraînement de modèle et appareil associé

Info

Publication number: WO2024000344A1
Application number: PCT/CN2022/102635
Authority: WO
Inventors: 叶德仕; 孙武杰; 徐晨; 李榕
Original assignee: 华为技术有限公司
Priority date: 2022-06-30
Filing date: 2022-06-30
Publication date: 2024-01-04

Abstract

Des modes de réalisation de la présente demande concernent un procédé d'entraînement de modèle et un appareil associé. Le procédé est appliqué à un premier nœud de sortie parmi une pluralité de nœuds de sortie, et un sous-modèle est déployé dans chaque nœud de la pluralité de nœuds. Le procédé consiste à : effectuer un raisonnement des données reçues en utilisant des sous-modèles déployés localement, pour obtenir un résultat de raisonnement du premier nœud de sortie ; recevoir des résultats de raisonnement provenant d'autres nœuds de sortie, et obtenir une étiquette souple du premier nœud de sortie sur la base des résultats de raisonnement des nœuds de sortie et du poids des résultats de raisonnement ; et entraîner les sous-modèles déployés localement sur la base de l'étiquette souple du premier nœud de sortie, d'une étiquette dure prédéfinie et d'une fonction de perte prédéfinie pour obtenir des sous-modèles entraînés. Le poids des résultats de raisonnement des nœuds de sortie est lié à la complexité de réseaux neuronaux des nœuds de sortie, de telle sorte qu'un entraînement contrôlable peut être effectué en fonction de la complexité, de la capacité, etc., des sous-modèles pour correspondre aux capacités de réseaux neuronaux de différents modèles, ce qui permet d'améliorer l'effet d'entraînement.