NL2023312B1 - Artificial intelligence-based base calling - Google Patents

Artificial intelligence-based base calling Download PDF

Info

Publication number
NL2023312B1
NL2023312B1 NL2023312A NL2023312A NL2023312B1 NL 2023312 B1 NL2023312 B1 NL 2023312B1 NL 2023312 A NL2023312 A NL 2023312A NL 2023312 A NL2023312 A NL 2023312A NL 2023312 B1 NL2023312 B1 NL 2023312B1
Authority
NL
Netherlands
Prior art keywords
neural network
sequencing
data
cycle
image
Prior art date
Application number
NL2023312A
Other languages
English (en)
Inventor
Jaganathan Kishore
Randall Gobbel John
Kia Amirali
Original Assignee
Illumina Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Illumina Inc filed Critical Illumina Inc
Priority to US16/826,126 priority Critical patent/US11783917B2/en
Priority to US16/826,134 priority patent/US11676685B2/en
Priority to US16/825,987 priority patent/US11347965B2/en
Priority to PCT/US2020/024088 priority patent/WO2020191387A1/en
Priority to AU2020241586A priority patent/AU2020241586A1/en
Priority to BR112020026433-4A priority patent/BR112020026433A2/pt
Priority to JP2020572715A priority patent/JP2022525267A/ja
Priority to KR1020217009877A priority patent/KR20210143154A/ko
Priority to AU2020240383A priority patent/AU2020240383A1/en
Priority to SG11202012453PA priority patent/SG11202012453PA/en
Priority to MX2020014293A priority patent/MX2020014293A/es
Priority to US16/826,168 priority patent/US11436429B2/en
Priority to MX2020014299A priority patent/MX2020014299A/es
Priority to SG11202012441QA priority patent/SG11202012441QA/en
Priority to MX2020014288A priority patent/MX2020014288A/es
Priority to BR112020026408-3A priority patent/BR112020026408A2/pt
Priority to SG11202012461XA priority patent/SG11202012461XA/en
Priority to AU2020241905A priority patent/AU2020241905A1/en
Priority to PCT/US2020/024087 priority patent/WO2020205296A1/en
Priority to AU2020256047A priority patent/AU2020256047A1/en
Priority to KR1020217003269A priority patent/KR20210145115A/ko
Priority to CN202080004547.2A priority patent/CN112585689A/zh
Priority to JP2021517978A priority patent/JP2022524562A/ja
Priority to EP20718112.4A priority patent/EP3942070A1/en
Priority to CN202080003614.9A priority patent/CN112334984A/zh
Priority to EP20719052.1A priority patent/EP3942071A1/en
Priority to KR1020207037712A priority patent/KR20210143100A/ko
Priority to EP20719294.9A priority patent/EP3942073A2/en
Priority to PCT/US2020/024090 priority patent/WO2020191389A1/en
Priority to EP23195503.0A priority patent/EP4276769A3/en
Priority to BR112020026426-1A priority patent/BR112020026426A2/pt
Priority to CN202080005431.0A priority patent/CN112789680A/zh
Priority to PCT/US2020/024091 priority patent/WO2020191390A2/en
Priority to EP20719053.9A priority patent/EP3942072B1/en
Priority to CN202080003622.3A priority patent/CN112313666A/zh
Priority to JP2020572703A priority patent/JP2022526470A/ja
Priority to JP2020572704A priority patent/JP2022532458A/ja
Priority to KR1020207037713A priority patent/KR20210142529A/ko
Priority to CA3104951A priority patent/CA3104951A1/en
Priority to BR112020026455-5A priority patent/BR112020026455A2/pt
Priority to SG11202012463YA priority patent/SG11202012463YA/en
Priority to PCT/US2020/024092 priority patent/WO2020191391A2/en
Priority to AU2020240141A priority patent/AU2020240141A1/en
Priority to EP20757979.8A priority patent/EP3942074A2/en
Priority to CN202080004529.4A priority patent/CN112689875A/zh
Priority to JP2020572706A priority patent/JP2022535306A/ja
Priority to MX2020014302A priority patent/MX2020014302A/es
Priority to KR1020217003270A priority patent/KR20210145116A/ko
Application granted granted Critical
Publication of NL2023312B1 publication Critical patent/NL2023312B1/en
Priority to IL279525A priority patent/IL279525A/en
Priority to IL279533A priority patent/IL279533A/en
Priority to IL279522A priority patent/IL279522A/en
Priority to IL279527A priority patent/IL279527A/en
Priority to IL281668A priority patent/IL281668A/en
Priority to US18/296,125 priority patent/US20240071573A1/en

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/10Signal processing, e.g. from mass spectrometry [MS] or from PCR

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Theoretical Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Biology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Computation (AREA)
  • Immunology (AREA)
  • Public Health (AREA)
  • Artificial Intelligence (AREA)
  • Signal Processing (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Microbiology (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioethics (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Image Analysis (AREA)

Claims (19)

CONCLUSIES
1. Computer geïmplementeerde werkwijze, omvattende: het verwerken van invoergegevens via een neuraal netwerk en het produceren van een alternatieve representatie van de invoergegevens, waarin de invoergegevens per-cyclus gegevens voor elk van een of meer sequencing cycli van een sequencing run omvatten en waarin de per-cyclus gegevens indicatief zijn voor een of meer analyten in een respectievelijke sequencing cyclus; het verwerken van een alternatieve representatie via een uitvoerlaag en het produceren van een uitvoer; en het base-aanroepen van een of meer analyten in een of meer van de sequencing cycli gebaseerd op de uitvoer.
2. Neuraal netwerk geïmplementeerde werkwijze volgens conclusie 1, waarin de per- cyclus gegevens indicatief zijn voor een omgevende achtergrond in de respectievelijke sequencing cyclus.
3. Neuraal netwerk geïmplementeerde werkwijze volgens een van de conclusies 1-2, waarin de invoergegevens beeldgegevens zijn en de per-cyclus gegevens intensiteitsemissies omvatten die indicatief zijn voor de een of meer analyten en voor de omgevende achtergrond die gevangen is in de respectievelijke sequencing cyclus.
4. Computer geïmplementeerde werkwijze volgens conclusie 3, verder omvattende het vergezellen van de per-cyclus gegevens van supplementele afstandinformatie die afstanden identificeert tussen pixels van de per-cyclus gegevens en die pixels die de intensiteitemissies afbeelden die indicatief zijn voor de een of meer analyten.
5. Computer geïmplementeerde werkwijze volgens conclusie 3 of 4, verder omvattende het vergezellen van de per-cyclus gegevens van supplementele schaalinformatie die schaalwaarden toewijst aan de pixels van de per-cyclus gegevens.
6. Neuraal netwerk geïmplementeerde werkwijze volgens een van de voorafgaande conclusies, waarin de per-cyclus gegevens indicatief zijn voor een spanningsverandering die gedetecteerd is in de respectievelijke sequencing cyclus.
7. Neuraal netwerk geimplementeerde werkwijze volgens een van de voorafgaande conclusies, waarin de per-cyclus gegevens indicatief zijn voor een elektrisch stroomsignaal gemeten in de respectievelijke sequencingcyclus.
8. Neuraal netwerk geïmplementeerde werkwijze voor base-aanroeping van analyten die gesynthetiseerd zijn gedurende een sequencing run omvattende een aantal sequencing cycli, de werkwijze omvattende: het convolueren van invoergegevens via een convolutie neuraal netwerk teneinde een geconvolueerde representatie van invoergegevens te genereren, waarm de invoergegevens beeldpatches omvatten die geëxtraheerd zijn uit een of meer beelden die elk van de huidige beeldset gegenereerd in een huidige sequencing cyclus van de sequencing run, van een of meer voorafgaande beeldsets die respectievelijk gegenereerd zijn in een of meer sequencing cycli van de sequencing run voorafgaand aan de huidige sequencing cyclus, van een of meer opvolgende beeldsets die respectievelijk gegenereerd zijn in een of meer sequencing cycli van de sequencing run opvolgend in de huidige sequencing cyclus, waarin elk van de beeldpatches intensiteitemissies van een doelanalyt die base- aangeroepen wordt afbeeldt, waarin de invoergegevens verder afstandinformatie omvat die indicatief is voor respectievelijke afstanden van pixels van de beeldpatch vanaf de centrumpixel van de beeldpatch; het verwerken van de geconvolueerde representatie via een uitvoerlaag teneinde een uitvoer te produceren; en base-aanroepen van het doelanalyt in de huidige sequencing cyclus gebaseerd op de uitvoer.
9. Neuraal netwerk geïmplementeerde werkwijze volgens conclusie 8, verder omvattende: het verschaffen als invoer voor het convolutionele neurale netwerk van positie coördinaten van centra van beeldgebieden die respectievelijke analyten representeren, waarin de invoer verschaft wordt aan een eerste laag van het convolutionele neurale netwerk, waarin de invoer verschaft wordt aan de een of meer tussenliggende lagen van het convolutionele neurale netwerk, en waarin de invoer verschaft wordt aan de eindlaag van het convolutionele neurale netwerk.
10. Neuraal netwerk geimplementeerde werkwijze volgens een van de conclusies 8-9, verder omvattende: het verschaffen als invoer aan het convolutionele neurale netwerk van een intensiteitschalingskanaal dat schalingswaarden heeft corresponderend met pixels van de beeldpatches, en waarin de schalingswaarden gebaseerd zijn op een gemiddelde intensiteit van centrum pixels van de beeldpatches die elk een bepaald doelanalyt bevat.
11. Neuraal netwerk geimplementeerde werkwijze volgens een van de conclusies 8-10, waarin het intensiteitschalingskanaal pixelgewijs eenzelfde schalingswaarde voor alle pixels van de beeldpatches omvat.
12. Neuraal netwerk geïmplementeerde werkwijze volgens een van de conclusies 8-11, waarin elke beeldpatch verder beeldafstandgegevens omvat die een afstand aanduiden tussen respectievelijke pixels en een meest nabije analyt van het aantal analyten waarbij het meest nabije analyt van het aantal analyten geselecteerd is gebaseerd op de centrum- tot-centrum afstanden tussen de pixel en elk van de analyten.
13. Neuraal netwerk geïmplementeerde werkwijze volgens een van de conclusies 8-12, waarin elke beeldpatch verder omvat analytafstandgegevens die een afstand identificeren van elke analytpixel vanaf een toegewezen analyt van het aantal analyten geselecteerd gebaseerd op het classificeren van elke analytpixel op slechts een van de analyten.
14. Neuraal netwerk geïmplementeerde werkwijze volgens een van de conclusies 8-13, waarin het convolueren van de invoergegevens via het convolutie neurale netwerk om de geconvolueerde representatie van de invoergegevens te genereren, omvat: het gescheiden verwerken van elk per-cyclus beeldpatchset via een eerste convolutioneel subnetwerk van het convolutionele neurale netwerk tussenliggende geconvolueerde representatie voor elke cyclus in de cyclus te forceren, omvattende het toepassen van convoluties die de intensiteit en afstandinformatie combineren en het combineren van resulterende geconvolueerde representaties slechts binnen een sequencing cyclus en niet tussen sequencing cycli; het groepsgewijs verwerken van tussenliggende geconvolueerde representaties voor successievelijke sequencing cycli die in de serie via een tweede convolutionele subnetwerk van het convolutionele neurale netwerk teneinde een eind geconvolueerde representatie voor series te produceren, omvattende het toepassen van convoluties die de tussenliggende geconvolueerde representaties combineren en die resterende geconvolueerde representaties tussen de sequencing cycli combineren; en waarin het verwerken van de geconvolueerde representatie via de uitvoerlaag teneinde de uitvoer te produceren het verwerken van de eind-geconvolueerde representatie via de uitvoerlaag omvat.
15. Neuraal netwerk geïmplementeerde werkwijze volgens een van de conclusies 8-14, verder omvattende: het reframen van pixels van elke beeldpatch om een centrum van het doelanalyt te centreren in een centrumpixel om gereframede beeldpatches te genereren; en waarin het convolueren van de invoergegevens via het convolutionele neurale netwerk om de geconvolueerde representatie van invoergegevens te genereren, het convolueren omvat van de gereframede beeldpatches via het geconvolueerde neurale netwerk teneinde de geconvolueerde representatie te genereren.
16. Neuraal netwerk geïmplementeerde werkwijze volgens conclusie 15, waarin het reframen verder omvat intensiteitinterpolatie van de pixels van elke beeldpatch om te compenseren voor de reframing.
17. Een neuraal netwerk geïmplementeerde werkwijze voor base-aanroeping, de werkwijze omvattende: het gescheiden verwerken van elke per-cyclus invoergegeven in een sequence van per- cyclus invoergegevens via een cascade van convolutielagen van het convolutionele neurale netwerk, waarin: de sequence per cyclus invoergegevens gegenereerd wordt voor een serie van sequencing cycli van een sequencing run, en elke per-cyclus invoergegevens omvat beeldkanalen die intensiteitemissies van een of meer analyten en hun omgevende achtergrond gevangen in een respectievelijke sequencingcyclus afbeelden, voor elke sequencing cyclus, gebaseerd op de gescheiden verwerking, het produceren van een geconvolueerde representatie op elk van de convolutionele lagen, daardoor een sequence van geconvolueerde representatie producerend, het mengen van de per-cyclus invoergegevens met de corresponderende sequence van geconvolueerde representaties en het produceren van een gemengde representatie, en het afvlakken van de gemengde representatie en het produceren van een afgeviakte gemengde representatie; het rangschikken van afgevlakte gemengde representaties van successievelijke sequencing cyclus als een stapel, het verwerken van de stapel in voorwaartse en achterwaartse richting via een recurrent neuraal netwerk dat, over een deelverzameling van de afgevlakte gemengde representaties in de stapel op die glijdende vensterbasis convolueert, waarbij elk glijvenster correspondeert met een respectievelijke sequencing cyclus, en successievelijk een huidige verborgen staat representatie op elke tijdstap voor elke sequencing cyclus produceert gebaseerd op 1) de deelverzameling van de afgevlakte gemengde representaties die in een huidige glij venster over de stapel en ii) een eerdere verborgen statusrepresentatie; en base-aanroeping van elk van de analyten in elk van de sequencing cycli gebaseerd op resultaten van de verwerking van de stapel in voorwaartse en achterwaartse richtingen.
18. Neuraal netwerk geïmplementeerde werkwijze volgens conclusie 17, verder omvattende: het base-aanroepen van elk van de analyten in de gegevens seguencing cyclus door het combineren van voorwaartse en achterwaartse huidige verborgen staat representaties van gegevenscyclus in cyclus op een tijdstapbasis en het produceren van een gecombineerde verborgen staat representatie, waarin het combineren omvat concatenatie of sommatie of middeling, het verwerken van de gecombineerde verborgen staat representatie via een of meer geheel verbonden netwerken en het produceren van een dichte representatie, het verwerken van de dichte representatie via een softmaxlaag teneinde waarschijnlijkheden te produceren van basen geïncorporeerd in elk van de analyten in een gegevens sequencing cyclus zijnde A, C, Den G; en het classificeren van de basen als A, C, D of G gebaseerd op de waarschijnlijkheden.
19. Neuraal netwerk gebaseerd systeem voor base-aanroeping, het systeem omvattende: een hybride neuraal netwerk met een recurrente module en een convolutionele module, waarin de recurrente module invoeren van de convolutiemodule gebruikt; waarbij de convolutiemodule beeldgegevens verwerkt van een serie van sequencing cycli van een sequencing run via een of meer convolutielagen en waarbij een of meer geconvolueerde representaties van de beeldgegevens geproduceerd worden, waarin de beeldgegevens intensiteitemissies van een of meer analyten en hun omgevende achtergrond afbeelden; waarbij de recurrente module huidige verborgen staat representaties produceert gebaseerd op het convolueren van de geconvolueerde representaties en eerdere verborgen staat representaties; en een uitvoermodule die een base-aanroeping uitvoert voor ten minste een van de analyten en voor ten minste een van de sequencing cycli gebaseerd op de huidige verborgen staat representaties.
NL2023312A 2019-03-21 2019-06-14 Artificial intelligence-based base calling NL2023312B1 (en)

Priority Applications (54)

Application Number Priority Date Filing Date Title
US16/826,126 US11783917B2 (en) 2019-03-21 2020-03-20 Artificial intelligence-based base calling
US16/826,134 US11676685B2 (en) 2019-03-21 2020-03-20 Artificial intelligence-based quality scoring
US16/825,987 US11347965B2 (en) 2019-03-21 2020-03-20 Training data generation for artificial intelligence-based sequencing
PCT/US2020/024088 WO2020191387A1 (en) 2019-03-21 2020-03-21 Artificial intelligence-based base calling
AU2020241586A AU2020241586A1 (en) 2019-03-21 2020-03-21 Training data generation for artificial intelligence-based sequencing
BR112020026433-4A BR112020026433A2 (pt) 2019-03-21 2020-03-21 chamadas de base baseadas em inteligência artificial
JP2020572715A JP2022525267A (ja) 2019-03-21 2020-03-21 人工知能ベースのシーケンスメタデータ生成
KR1020217009877A KR20210143154A (ko) 2019-03-21 2020-03-21 인공 지능 기반 품질 스코어링
AU2020240383A AU2020240383A1 (en) 2019-03-21 2020-03-21 Artificial intelligence-based quality scoring
SG11202012453PA SG11202012453PA (en) 2019-03-21 2020-03-21 Artificial intelligence-based generation of sequencing metadata
MX2020014293A MX2020014293A (es) 2019-03-21 2020-03-21 Generación de metadatos de secuenciación basada en inteligencia artificial.
US16/826,168 US11436429B2 (en) 2019-03-21 2020-03-21 Artificial intelligence-based sequencing
MX2020014299A MX2020014299A (es) 2019-03-21 2020-03-21 Generación de datos de entrenamiento para secuenciación basada en inteligencia artificial.
SG11202012441QA SG11202012441QA (en) 2019-03-21 2020-03-21 Training data generation for artificial intelligence-based sequencing
MX2020014288A MX2020014288A (es) 2019-03-21 2020-03-21 Llamada de base-basada en inteligencia artificial.
BR112020026408-3A BR112020026408A2 (pt) 2019-03-21 2020-03-21 geração de dados de treinamento para sequenciamento baseado em inteligência artificial
SG11202012461XA SG11202012461XA (en) 2019-03-21 2020-03-21 Artificial intelligence-based base calling
AU2020241905A AU2020241905A1 (en) 2019-03-21 2020-03-21 Artificial intelligence-based base calling
PCT/US2020/024087 WO2020205296A1 (en) 2019-03-21 2020-03-21 Artificial intelligence-based generation of sequencing metadata
AU2020256047A AU2020256047A1 (en) 2019-03-21 2020-03-21 Artificial intelligence-based generation of sequencing metadata
KR1020217003269A KR20210145115A (ko) 2019-03-21 2020-03-21 인공 지능 기반 염기 호출
CN202080004547.2A CN112585689A (zh) 2019-03-21 2020-03-21 基于人工智能的碱基检出
JP2021517978A JP2022524562A (ja) 2019-03-21 2020-03-21 人工知能ベースの品質スコアリング
EP20718112.4A EP3942070A1 (en) 2019-03-21 2020-03-21 Artificial intelligence-based base calling
CN202080003614.9A CN112334984A (zh) 2019-03-21 2020-03-21 基于人工智能的测序元数据生成
EP20719052.1A EP3942071A1 (en) 2019-03-21 2020-03-21 Artificial intelligence-based generation of sequencing metadata
KR1020207037712A KR20210143100A (ko) 2019-03-21 2020-03-21 인공 지능 기반 서열분석을 위한 트레이닝 데이터 생성
EP20719294.9A EP3942073A2 (en) 2019-03-21 2020-03-21 Artificial intelligence-based quality scoring
PCT/US2020/024090 WO2020191389A1 (en) 2019-03-21 2020-03-21 Training data generation for artificial intelligence-based sequencing
EP23195503.0A EP4276769A3 (en) 2019-03-21 2020-03-21 Training data generation for artificial intelligence-based sequencing
BR112020026426-1A BR112020026426A2 (pt) 2019-03-21 2020-03-21 geração de metadados de sequenciamento baseada em inteligência artificial
CN202080005431.0A CN112789680A (zh) 2019-03-21 2020-03-21 基于人工智能的质量评分
PCT/US2020/024091 WO2020191390A2 (en) 2019-03-21 2020-03-21 Artificial intelligence-based quality scoring
EP20719053.9A EP3942072B1 (en) 2019-03-21 2020-03-21 Training data generation for artificial intelligence-based sequencing
CN202080003622.3A CN112313666A (zh) 2019-03-21 2020-03-21 用于基于人工智能的测序的训练数据生成
JP2020572703A JP2022526470A (ja) 2019-03-21 2020-03-21 人工知能ベースのベースコール
JP2020572704A JP2022532458A (ja) 2019-03-21 2020-03-21 人工知能ベースの配列決定のための訓練データ生成
KR1020207037713A KR20210142529A (ko) 2019-03-21 2020-03-21 서열분석 메타데이터의 인공 지능 기반 생성
CA3104951A CA3104951A1 (en) 2019-03-21 2020-03-22 Artificial intelligence-based sequencing
BR112020026455-5A BR112020026455A2 (pt) 2019-03-21 2020-03-22 Sequenciamento baseado em inteligência artificial
SG11202012463YA SG11202012463YA (en) 2019-03-21 2020-03-22 Artificial intelligence-based sequencing
PCT/US2020/024092 WO2020191391A2 (en) 2019-03-21 2020-03-22 Artificial intelligence-based sequencing
AU2020240141A AU2020240141A1 (en) 2019-03-21 2020-03-22 Artificial intelligence-based sequencing
EP20757979.8A EP3942074A2 (en) 2019-03-21 2020-03-22 Artificial intelligence-based sequencing
CN202080004529.4A CN112689875A (zh) 2019-03-21 2020-03-22 基于人工智能的测序
JP2020572706A JP2022535306A (ja) 2019-03-21 2020-03-22 人工知能ベースの配列決定
MX2020014302A MX2020014302A (es) 2019-03-21 2020-03-22 Secuenciacion basada en inteligencia artificial.
KR1020217003270A KR20210145116A (ko) 2019-03-21 2020-03-22 인공 지능 기반 서열분석
IL279525A IL279525A (en) 2019-03-21 2020-12-17 Generation of metadata sequences by artificial intelligence
IL279533A IL279533A (en) 2019-03-21 2020-12-17 Creation through artificial intelligence
IL279522A IL279522A (en) 2019-03-21 2020-12-17 Creating training data for artificial intelligence based sequences
IL279527A IL279527A (en) 2019-03-21 2020-12-17 Naming bases using artificial intelligence
IL281668A IL281668A (en) 2019-03-21 2021-03-21 Quality scores are based on artificial intelligence
US18/296,125 US20240071573A1 (en) 2019-03-21 2023-04-05 Artificial intelligence-based quality scoring

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US201962821681P 2019-03-21 2019-03-21

Publications (1)

Publication Number Publication Date
NL2023312B1 true NL2023312B1 (en) 2020-09-28

Family

ID=67513704

Family Applications (1)

Application Number Title Priority Date Filing Date
NL2023312A NL2023312B1 (en) 2019-03-21 2019-06-14 Artificial intelligence-based base calling

Country Status (1)

Country Link
NL (1) NL2023312B1 (nl)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021226285A1 (en) 2020-05-05 2021-11-11 Illumina, Inc. Equalization-based image processing and spatial crosstalk attenuator
WO2022047038A1 (en) 2020-08-28 2022-03-03 Illumina, Inc. Detecting and filtering clusters based on artificial intelligence-predicted base calls
WO2022093865A1 (en) 2020-10-27 2022-05-05 Illumina, Inc. Systems and methods for per-cluster intensity correction and base calling
WO2023003757A1 (en) 2021-07-19 2023-01-26 Illumina Software, Inc. Intensity extraction with interpolation and adaptation for base calling
EP4276769A2 (en) 2019-03-21 2023-11-15 Illumina, Inc. Training data generation for artificial intelligence-based sequencing
WO2023239917A1 (en) 2022-06-09 2023-12-14 Illumina, Inc. Dependence of base calling on flow cell tilt

Citations (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1991006678A1 (en) 1989-10-26 1991-05-16 Sri International Dna sequencing
US5528050A (en) 1995-07-24 1996-06-18 Molecular Dynamics, Inc. Compact scan head with multiple scanning modalities
US5719391A (en) 1994-12-08 1998-02-17 Molecular Dynamics, Inc. Fluorescence imaging system employing a macro scanning objective
WO2000063437A2 (en) 1999-04-20 2000-10-26 Illumina, Inc. Detection of nucleic acid reactions on bead arrays
US6266459B1 (en) 1997-03-14 2001-07-24 Trustees Of Tufts College Fiber optic sensor with encoded microspheres
US6355431B1 (en) 1999-04-20 2002-03-12 Illumina, Inc. Detection of nucleic acid amplification reactions using bead arrays
WO2004018497A2 (en) 2002-08-23 2004-03-04 Solexa Limited Modified nucleotides for polynucleotide sequencing
US6770441B2 (en) 2000-02-10 2004-08-03 Illumina, Inc. Array compositions and methods of making same
WO2005010145A2 (en) 2003-07-05 2005-02-03 The Johns Hopkins University Method and compositions for detection and enumeration of genetic variations
US6859570B2 (en) 1997-03-14 2005-02-22 Trustees Of Tufts College, Tufts University Target analyte sensors utilizing microspheres
US20050064460A1 (en) 2001-11-16 2005-03-24 Medical Research Council Emulsion compositions
US20050100900A1 (en) 1997-04-01 2005-05-12 Manteia Sa Method of nucleic acid amplification
US20050130173A1 (en) 2003-01-29 2005-06-16 Leamon John H. Methods of amplifying and sequencing nucleic acids
WO2005065814A1 (en) 2004-01-07 2005-07-21 Solexa Limited Modified molecular arrays
US20050244870A1 (en) 1999-04-20 2005-11-03 Illumina, Inc. Nucleic acid sequencing using microsphere arrays
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
WO2006064199A1 (en) 2004-12-13 2006-06-22 Solexa Limited Improved method of nucleotide detection
US20060240439A1 (en) 2003-09-11 2006-10-26 Smith Geoffrey P Modified polymerases for improved incorporation of nucleotide analogues
US20060281471A1 (en) 2005-06-08 2006-12-14 Cisco Technology,Inc. Method and system for communicating using position information
WO2007010252A1 (en) 2005-07-20 2007-01-25 Solexa Limited Method for sequencing a polynucleotide template
WO2007010251A2 (en) 2005-07-20 2007-01-25 Solexa Limited Preparation of templates for nucleic acid sequencing
WO2007035368A2 (en) 2005-09-15 2007-03-29 Caliper Life Sciences Inc. Methods of screening for immuno-adjuvants and vaccines comprising anti-microtubule immuno-adjuvants
US7211414B2 (en) 2000-12-01 2007-05-01 Visigen Biotechnologies, Inc. Enzymatic nucleic acid synthesis: compositions and methods for altering monomer incorporation fidelity
WO2007123744A2 (en) 2006-03-31 2007-11-01 Solexa, Inc. Systems and devices for sequence by synthesis analysis
US7315019B2 (en) 2004-09-17 2008-01-01 Pacific Biosciences Of California, Inc. Arrays of optical confinements and uses thereof
US7329492B2 (en) 2000-07-07 2008-02-12 Visigen Biotechnologies, Inc. Methods for real-time single molecule sequence determination
US20080108082A1 (en) 2006-10-23 2008-05-08 Pacific Biosciences Of California, Inc. Polymerase enzymes and reagents for enhanced nucleic acid sequencing
US7405281B2 (en) 2005-09-29 2008-07-29 Pacific Biosciences Of California, Inc. Fluorescent nucleotide analogs and uses therefor
US7414116B2 (en) 2002-08-23 2008-08-19 Illumina Cambridge Limited Labelled nucleotides
US20090088327A1 (en) 2006-10-06 2009-04-02 Roberto Rigatti Method for sequencing a polynucleotide template
US7592435B2 (en) 2005-08-19 2009-09-22 Illumina Cambridge Limited Modified nucleosides and nucleotides and uses thereof
US7622294B2 (en) 1997-03-14 2009-11-24 Trustees Of Tufts College Methods for detecting target analytes and enzymatic reactions
US20120020537A1 (en) 2010-01-13 2012-01-26 Francisco Garcia Data processing system and methods
US8158926B2 (en) 2005-11-23 2012-04-17 Illumina, Inc. Confocal imaging methods and apparatus
US20120270305A1 (en) 2011-01-10 2012-10-25 Illumina Inc. Systems, methods, and apparatuses to image a sample for biological or chemical analysis
US20120316086A1 (en) 2011-06-09 2012-12-13 Illumina, Inc. Patterned flow-cells useful for nucleic acid analysis
US20130023422A1 (en) 2008-05-05 2013-01-24 Illumina, Inc. Compensator for multiple surface imaging
US20130116153A1 (en) 2011-10-28 2013-05-09 Illumina, Inc. Microarray fabrication system and method
US20130260372A1 (en) 2012-04-03 2013-10-03 Illumina, Inc. Integrated optoelectronic read head and fluidic cartridge useful for nucleic acid sequencing
WO2018129314A1 (en) * 2017-01-06 2018-07-12 Illumina, Inc. Phasing correction
US20180274023A1 (en) 2013-12-03 2018-09-27 Illumina, Inc. Methods and systems for analyzing image data
WO2019055856A1 (en) * 2017-09-15 2019-03-21 Illumina, Inc. ACCORDING AND CALIBRATION CHARACTERISTICS OF A SEQUENCE DETECTION SYSTEM
WO2019079182A1 (en) * 2017-10-16 2019-04-25 Illumina, Inc. SEMI-SUPERVISED APPRENTICESHIP FOR THE LEARNING OF A SET OF NEURONAL NETWORKS WITH DEEP CONVOLUTION
WO2019079202A1 (en) * 2017-10-16 2019-04-25 Illumina, Inc. ABERRANT CONNECTION DETECTION USING CONVOLUTION NEURAL NETWORKS (CNN)
WO2019136284A1 (en) * 2018-01-05 2019-07-11 Illumina, Inc. Predicting quality of sequencing results using deep neural networks
WO2019136388A1 (en) * 2018-01-08 2019-07-11 Illumina, Inc. Systems and devices for high-throughput sequencing with semiconductor-based detection
WO2019140402A1 (en) * 2018-01-15 2019-07-18 Illumina, Inc. Deep learning-based variant classifier

Patent Citations (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1991006678A1 (en) 1989-10-26 1991-05-16 Sri International Dna sequencing
US5719391A (en) 1994-12-08 1998-02-17 Molecular Dynamics, Inc. Fluorescence imaging system employing a macro scanning objective
US5528050A (en) 1995-07-24 1996-06-18 Molecular Dynamics, Inc. Compact scan head with multiple scanning modalities
US6859570B2 (en) 1997-03-14 2005-02-22 Trustees Of Tufts College, Tufts University Target analyte sensors utilizing microspheres
US6266459B1 (en) 1997-03-14 2001-07-24 Trustees Of Tufts College Fiber optic sensor with encoded microspheres
US7622294B2 (en) 1997-03-14 2009-11-24 Trustees Of Tufts College Methods for detecting target analytes and enzymatic reactions
US20050100900A1 (en) 1997-04-01 2005-05-12 Manteia Sa Method of nucleic acid amplification
US6355431B1 (en) 1999-04-20 2002-03-12 Illumina, Inc. Detection of nucleic acid amplification reactions using bead arrays
WO2000063437A2 (en) 1999-04-20 2000-10-26 Illumina, Inc. Detection of nucleic acid reactions on bead arrays
US20050244870A1 (en) 1999-04-20 2005-11-03 Illumina, Inc. Nucleic acid sequencing using microsphere arrays
US6770441B2 (en) 2000-02-10 2004-08-03 Illumina, Inc. Array compositions and methods of making same
US7329492B2 (en) 2000-07-07 2008-02-12 Visigen Biotechnologies, Inc. Methods for real-time single molecule sequence determination
US7211414B2 (en) 2000-12-01 2007-05-01 Visigen Biotechnologies, Inc. Enzymatic nucleic acid synthesis: compositions and methods for altering monomer incorporation fidelity
US20050064460A1 (en) 2001-11-16 2005-03-24 Medical Research Council Emulsion compositions
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
US20060188901A1 (en) 2001-12-04 2006-08-24 Solexa Limited Labelled nucleotides
US7427673B2 (en) 2001-12-04 2008-09-23 Illumina Cambridge Limited Labelled nucleotides
US7566537B2 (en) 2001-12-04 2009-07-28 Illumina Cambridge Limited Labelled nucleotides
US7414116B2 (en) 2002-08-23 2008-08-19 Illumina Cambridge Limited Labelled nucleotides
US20070166705A1 (en) 2002-08-23 2007-07-19 John Milton Modified nucleotides
WO2004018497A2 (en) 2002-08-23 2004-03-04 Solexa Limited Modified nucleotides for polynucleotide sequencing
US7541444B2 (en) 2002-08-23 2009-06-02 Illumina Cambridge Limited Modified nucleotides
US20050130173A1 (en) 2003-01-29 2005-06-16 Leamon John H. Methods of amplifying and sequencing nucleic acids
WO2005010145A2 (en) 2003-07-05 2005-02-03 The Johns Hopkins University Method and compositions for detection and enumeration of genetic variations
US20060240439A1 (en) 2003-09-11 2006-10-26 Smith Geoffrey P Modified polymerases for improved incorporation of nucleotide analogues
US20110059865A1 (en) 2004-01-07 2011-03-10 Mark Edward Brennan Smith Modified Molecular Arrays
WO2005065814A1 (en) 2004-01-07 2005-07-21 Solexa Limited Modified molecular arrays
US7315019B2 (en) 2004-09-17 2008-01-01 Pacific Biosciences Of California, Inc. Arrays of optical confinements and uses thereof
WO2006064199A1 (en) 2004-12-13 2006-06-22 Solexa Limited Improved method of nucleotide detection
US20060281471A1 (en) 2005-06-08 2006-12-14 Cisco Technology,Inc. Method and system for communicating using position information
WO2007010251A2 (en) 2005-07-20 2007-01-25 Solexa Limited Preparation of templates for nucleic acid sequencing
WO2007010252A1 (en) 2005-07-20 2007-01-25 Solexa Limited Method for sequencing a polynucleotide template
US7592435B2 (en) 2005-08-19 2009-09-22 Illumina Cambridge Limited Modified nucleosides and nucleotides and uses thereof
WO2007035368A2 (en) 2005-09-15 2007-03-29 Caliper Life Sciences Inc. Methods of screening for immuno-adjuvants and vaccines comprising anti-microtubule immuno-adjuvants
US7405281B2 (en) 2005-09-29 2008-07-29 Pacific Biosciences Of California, Inc. Fluorescent nucleotide analogs and uses therefor
US8158926B2 (en) 2005-11-23 2012-04-17 Illumina, Inc. Confocal imaging methods and apparatus
US8241573B2 (en) 2006-03-31 2012-08-14 Illumina, Inc. Systems and devices for sequence by synthesis analysis
WO2007123744A2 (en) 2006-03-31 2007-11-01 Solexa, Inc. Systems and devices for sequence by synthesis analysis
US20090088327A1 (en) 2006-10-06 2009-04-02 Roberto Rigatti Method for sequencing a polynucleotide template
US20080108082A1 (en) 2006-10-23 2008-05-08 Pacific Biosciences Of California, Inc. Polymerase enzymes and reagents for enhanced nucleic acid sequencing
US20130023422A1 (en) 2008-05-05 2013-01-24 Illumina, Inc. Compensator for multiple surface imaging
US20120020537A1 (en) 2010-01-13 2012-01-26 Francisco Garcia Data processing system and methods
US20120270305A1 (en) 2011-01-10 2012-10-25 Illumina Inc. Systems, methods, and apparatuses to image a sample for biological or chemical analysis
US20120316086A1 (en) 2011-06-09 2012-12-13 Illumina, Inc. Patterned flow-cells useful for nucleic acid analysis
US20130116153A1 (en) 2011-10-28 2013-05-09 Illumina, Inc. Microarray fabrication system and method
US20130260372A1 (en) 2012-04-03 2013-10-03 Illumina, Inc. Integrated optoelectronic read head and fluidic cartridge useful for nucleic acid sequencing
US20180274023A1 (en) 2013-12-03 2018-09-27 Illumina, Inc. Methods and systems for analyzing image data
WO2018129314A1 (en) * 2017-01-06 2018-07-12 Illumina, Inc. Phasing correction
WO2019055856A1 (en) * 2017-09-15 2019-03-21 Illumina, Inc. ACCORDING AND CALIBRATION CHARACTERISTICS OF A SEQUENCE DETECTION SYSTEM
WO2019079182A1 (en) * 2017-10-16 2019-04-25 Illumina, Inc. SEMI-SUPERVISED APPRENTICESHIP FOR THE LEARNING OF A SET OF NEURONAL NETWORKS WITH DEEP CONVOLUTION
WO2019079202A1 (en) * 2017-10-16 2019-04-25 Illumina, Inc. ABERRANT CONNECTION DETECTION USING CONVOLUTION NEURAL NETWORKS (CNN)
WO2019136284A1 (en) * 2018-01-05 2019-07-11 Illumina, Inc. Predicting quality of sequencing results using deep neural networks
WO2019136388A1 (en) * 2018-01-08 2019-07-11 Illumina, Inc. Systems and devices for high-throughput sequencing with semiconductor-based detection
WO2019140402A1 (en) * 2018-01-15 2019-07-18 Illumina, Inc. Deep learning-based variant classifier

Non-Patent Citations (9)

* Cited by examiner, † Cited by third party
Title
ANONYMOUS: "MiSeq: Imaging and Base Calling", 1 January 2013 (2013-01-01), XP055669460, Retrieved from the Internet <URL:https://support.illumina.com/content/dam/illumina-support/courses/MiSeq_Imaging_and_Base_Calling/story_content/external_files/MiSeq%20Imaging%20and%20Base%20Calling%20Script.pdf> [retrieved on 20200218] *
ANONYMOUS: "MiSEQ: Imaging and Base Calling", 1 January 2013 (2013-01-01), XP055669545, Retrieved from the Internet <URL:https://support.illumina.com/training.html> [retrieved on 20200218] *
BENTLEY ET AL., NATURE, vol. 456, 2008, pages 53 - 59
DRESSMAN ET AL., PROC. NATL. ACAD. SCI. USA, vol. 100, 2003, pages 8817 - 8822
HYUNGTAE LEE ET AL: "Fast Object Localization Using a CNN Feature Map Based Multi-Scale Search", ARXIV.ORG, CORNELL UNIVERSITY LIBRARY, 201 OLIN LIBRARY CORNELL UNIVERSITY ITHACA, NY 14853, 12 April 2016 (2016-04-12), XP080695042 *
KAROLIS MISIUNAS ET AL: "QuipuNet: convolutional neural network for single-molecule nanopore sensing", ARXIV.ORG, CORNELL UNIVERSITY LIBRARY, 201 OLIN LIBRARY CORNELL UNIVERSITY ITHACA, NY 14853, 27 March 2018 (2018-03-27), XP081232855, DOI: 10.1021/ACS.NANOLETT.8B01709 *
TIM ALBRECHT ET AL: "Deep learning for single-molecule science", NANOTECHNOLOGY, INSTITUTE OF PHYSICS PUBLISHING, GB, vol. 28, no. 42, 18 September 2017 (2017-09-18), pages 423001, XP020320531, ISSN: 0957-4484, [retrieved on 20170918], DOI: 10.1088/1361-6528/AA8334 *
VLADIM\'IR BO\V{Z}A ET AL: "DeepNano: Deep Recurrent Neural Networks for Base Calling in MinION Nanopore Reads", ARXIV.ORG, CORNELL UNIVERSITY LIBRARY, 201 OLIN LIBRARY CORNELL UNIVERSITY ITHACA, NY 14853, 30 March 2016 (2016-03-30), XP080963284, DOI: 10.1371/JOURNAL.PONE.0178751 *
ZHONG-QIU ZHAO ET AL: "Object Detection with Deep Learning: A Review", ARXIV.ORG, CORNELL UNIVERSITY LIBRARY, 201 OLIN LIBRARY CORNELL UNIVERSITY ITHACA, NY 14853, 15 July 2018 (2018-07-15), XP081117166 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4276769A2 (en) 2019-03-21 2023-11-15 Illumina, Inc. Training data generation for artificial intelligence-based sequencing
WO2021226285A1 (en) 2020-05-05 2021-11-11 Illumina, Inc. Equalization-based image processing and spatial crosstalk attenuator
WO2022047038A1 (en) 2020-08-28 2022-03-03 Illumina, Inc. Detecting and filtering clusters based on artificial intelligence-predicted base calls
WO2022093865A1 (en) 2020-10-27 2022-05-05 Illumina, Inc. Systems and methods for per-cluster intensity correction and base calling
WO2023003757A1 (en) 2021-07-19 2023-01-26 Illumina Software, Inc. Intensity extraction with interpolation and adaptation for base calling
WO2023239917A1 (en) 2022-06-09 2023-12-14 Illumina, Inc. Dependence of base calling on flow cell tilt

Similar Documents

Publication Publication Date Title
US11676685B2 (en) Artificial intelligence-based quality scoring
US20240071573A1 (en) Artificial intelligence-based quality scoring
WO2020191387A1 (en) Artificial intelligence-based base calling
NL2023312B1 (en) Artificial intelligence-based base calling
NL2023314B1 (en) Artificial intelligence-based quality scoring
NL2023316B1 (en) Artificial intelligence-based sequencing
US20210265018A1 (en) Knowledge Distillation and Gradient Pruning-Based Compression of Artificial Intelligence-Based Base Caller
NL2023310B1 (en) Training data generation for artificial intelligence-based sequencing
NL2023311B1 (en) Artificial intelligence-based generation of sequencing metadata
US20230298339A1 (en) State-based base calling
US20230087698A1 (en) Compressed state-based base calling
WO2023049215A1 (en) Compressed state-based base calling