WO2020081122A1

WO2020081122A1 - Techniques de pré-entraînement de réseaux neuronaux à convolution profonde fondées sur l'apprentissage profond

Info

Publication number: WO2020081122A1
Application number: PCT/US2019/031621
Authority: WO
Inventors: Hong Gao; Kai-How FARH; Samskruthi REDDY PADIGEPATI
Original assignee: Illumina, Inc.
Priority date: 2018-10-15
Filing date: 2019-05-09
Publication date: 2020-04-23
Also published as: AU2021269351A1; KR102165734B1; KR20200044731A; AU2021269351B2; SG10202108013QA; NZ759665A; JP2021501923A; IL271091B; CN113705585A; JP7200294B2; JP2021152907A; AU2019272062A1; IL271091A; IL282689A; AU2019272062B2; CN111328419A; SG11201911777QA; CN111328419B; JP6888123B2; JP2023052011A

Abstract

La présente invention concerne des systèmes et des procédés permettant de réduire le surapprentissage de modèles mis en œuvre par réseau neuronal qui traitent des séquences d'acides aminés et des matrices de fréquences de position associées. Le système génère des paires de séquences supplémentaires d'exemples d'entraînement, marquées bénignes, qui comprennent un emplacement de départ, par un emplacement d'acide aminé cible, à un emplacement de fin. Une paire de séquences supplémentaires complète une paire de séquences d'exemples d'entraînement de faux-sens pathogènes ou bénins. Elle présente des acides aminés identiques dans une référence et une séquence alternée d'acides aminés. Le système comprend une logique permettant d'entrer, à l'aide de chaque paire de séquences supplémentaires, une matrice de fréquence de position (PFM) d'entraînement supplémentaire qui est identique à la PFM du faux-sens bénin ou pathogène à l'emplacement de départ et de fin correspondants. Le système comprend une logique permettant d'atténuer l'influence d'entraînement des PFM d'entraînement pendant l'entraînement du modèle mis en œuvre par réseau neuronal par inclusion des PFM d'exemples d'entraînement supplémentaires dans les données d'entraînement.