WO2018152143A1

WO2018152143A1 - Procédé et appareil pour la représentation compacte de données bioinformatiques au moyen de plusieurs descripteurs génomiques

Info

Publication number: WO2018152143A1
Application number: PCT/US2018/018092
Authority: WO
Inventors: Mohamed Khoso BALUCH; Claudio ALBERTI; Giorgio Zoia; Daniele RENZI
Original assignee: Genomsys Sa
Priority date: 2017-02-14
Filing date: 2018-02-14
Publication date: 2018-08-23
Also published as: SG11201907418YA; AU2018221458A1; KR20190113971A; AU2018221458B2; EP3583500A4; MX2019009680A; ZA201905921B; EA201991908A1; IL268651A; CA3052824A1; EP3583500A1; NZ757185A

Abstract

La présente invention concerne un procédé et un appareil destinés à la compression de données de séquences génomiques produites par des machines de séquençage du génome. Des lectures de séquences sont codées en les alignant par rapport à des séquences de référence préexistantes ou construites, le processus de codage étant composé d'une classification des lectures en classes de données suivie par le codage de chaque classe en termes d'une multiplicité de blocs de descripteurs. Des modèles de sources spécifiques et des codeurs d'entropie sont utilisés pour chaque classe de données dans laquelle les données sont divisées, et chaque bloc de descripteurs associé.