WO2019017806A1

WO2019017806A1 - Appareil et procédé d'identification d'haplotypes

Info

Publication number: WO2019017806A1
Application number: PCT/RU2017/000538
Authority: WO
Inventors: Dmitry Yurievich IGNATOV; Alexander Nikolaevich Filippov; Xuecang ZHANG
Original assignee: Huawei Technologies Co., Ltd
Priority date: 2017-07-20
Filing date: 2017-07-20
Publication date: 2019-01-24
Also published as: CN111344794B; CN111344794A

Abstract

L'invention concerne un appareil (400) permettant d'identifier des haplotypes dans une pluralité de séquences nucléotidiques d'échantillons d'après une séquence nucléotidique de référence. L'appareil (400) comprend une unité de traitement (401) configurée pour générer un ensemble initial de séquences d'allèles en extrayant une pluralité de séquences d'allèles de la pluralité de séquences nucléotidiques d'échantillon d'après la séquence nucléotidique de référence, chaque allèle de chaque séquence de la pluralité de séquences d'allèles étant associé à un site nucléotidique dans la séquence nucléotidique de référence ; générer un premier ensemble agrégé de séquences d'allèles d'après l'ensemble initial de séquences d'allèles en combinant les séquences d'allèles de l'ensemble initial de séquences d'allèles, qui possèdent les mêmes allèles dans des parties de séquence en chevauchement et appartiennent au même haplotype, dans une séquence d'allèles agrégée, le premier ensemble agrégé de séquences d'allèles comprenant les séquences d'allèles agrégées et les séquences d'allèles de l'ensemble initial des séquences d'allèles qui ne sont pas combinées dans une séquence d'allèles agrégée ; générer un second ensemble agrégé de séquences d'allèles d'après le premier ensemble agrégé de séquences d'allèles en concaténant des paires de séquences d'allèles voisines du premier ensemble agrégé de séquences d'allèles, les séquences d'allèles voisines comprenant des allèles dans des sites nucléotidiques voisins, mais pas d'allèles en chevauchement ; et identifier des haplotypes dans la pluralité de séquences nucléotidiques d'échantillon d'après le second ensemble agrégé de séquences d'allèles.