RU2019139175A - Классификация сайта сплайсинга на основе глубокого обучения - Google Patents
Классификация сайта сплайсинга на основе глубокого обучения Download PDFInfo
- Publication number
- RU2019139175A RU2019139175A RU2019139175A RU2019139175A RU2019139175A RU 2019139175 A RU2019139175 A RU 2019139175A RU 2019139175 A RU2019139175 A RU 2019139175A RU 2019139175 A RU2019139175 A RU 2019139175A RU 2019139175 A RU2019139175 A RU 2019139175A
- Authority
- RU
- Russia
- Prior art keywords
- nucleotides
- implemented
- acnn
- computer
- paragraphs
- Prior art date
Links
- 238000013135 deep learning Methods 0.000 title 1
- 239000002773 nucleotide Substances 0.000 claims 61
- 125000003729 nucleotide group Chemical group 0.000 claims 61
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims 35
- 238000000034 method Methods 0.000 claims 34
- 108020004999 messenger RNA Proteins 0.000 claims 16
- 108020005067 RNA Splice Sites Proteins 0.000 claims 10
- 108091028043 Nucleic acid sequence Proteins 0.000 claims 8
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 claims 4
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 claims 2
- -1 abbreviated A Chemical compound 0.000 claims 2
- 238000013527 convolutional neural network Methods 0.000 claims 2
- 238000010606 normalization Methods 0.000 claims 2
- 229930024421 Adenine Natural products 0.000 claims 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 claims 1
- 229960000643 adenine Drugs 0.000 claims 1
- 238000013528 artificial neural network Methods 0.000 claims 1
- 150000001875 compounds Chemical class 0.000 claims 1
- 238000010790 dilution Methods 0.000 claims 1
- 239000012895 dilution Substances 0.000 claims 1
- 238000011156 evaluation Methods 0.000 claims 1
- 229940035893 uracil Drugs 0.000 claims 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/30—Unsupervised data analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Bioethics (AREA)
- Chemical & Material Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Analytical Chemistry (AREA)
- Epidemiology (AREA)
- Public Health (AREA)
- Genetics & Genomics (AREA)
- Probability & Statistics with Applications (AREA)
- Crystallography & Structural Chemistry (AREA)
- Image Analysis (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Error Detection And Correction (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Claims (60)
1. Реализуемый с применением нейронной сети способ предсказания правдоподобия сайтов сплайсинга в пре-мРНК геномных последовательностях, где указанный способ включает:
обучение разреженной сверточной нейронной сети, ACNN, на обучающих примерах пре-мРНК нуклеотидных последовательностей, включая по меньшей мере 50000 обучающих примеров донорных сайтов сплайсинга, по меньшей мере 50000 обучающих примеров акцепторных сайтов сплайсинга и по меньшей мере 100000 обучающих примеров сайтов, не связанных со сплайсингом, где указанное обучение включает:
ввод закодированных кодированием с одним активным состоянием обучающих примеров нуклеотидных последовательностей, причем каждая нуклеотидная последовательность содержит по меньшей мере 401 нуклеотид, с по меньшей мере одним целевым нуклеотидом и контекстом из по меньшей мере 200 фланкирующих нуклеотидов с каждой стороны, в направлении 5’ и в направлении 3’ от целевого нуклеотида; и
корректировку, путем обратного распространения, параметров фильтров в указанной ACNN для предсказания оценок правдоподобия того, что каждый целевой нуклеотид в указанной нуклеотидной последовательности является донорным сайтом сплайсинга, акцепторным сайтом сплайсинга или сайтом, не связанным со сплайсингом;
за счет чего обученная ACNN конфигурируется для приема в качестве входа пре-мРНК нуклеотидной последовательности, из по меньшей мере 401 нуклеотида, которая закодирована кодированием с одним активным состоянием и которая включает по меньшей мере один целевой нуклеотид и контекст из по меньшей мере 200 фланкирующих нуклеотидов с каждой стороны, и для оценки правдоподобия того, что целевой нуклеотид является донорным сайтом сплайсинга, акцепторным сайтом сплайсинга или сайтом, не связанным со сплайсингом.
2. Реализуемый с применением компьютера способ по п. 1, где каждый из обучающих примеров пре-мРНК нуклеотидных последовательностей и указанной входной пре-мРНК нуклеотидной последовательности включает 2500 фланкирующих нуклеотидов с каждой стороны от целевого нуклеотида, за счет чего обученная ACNN конфигурируется для приема в качестве входа пре-мРНК нуклеотидной последовательности из по меньшей мере 5001 нуклеотидов.
3. Реализуемый с применением компьютера способ по п. 1, где каждый из обучающих примеров пре-мРНК нуклеотидных последовательностей и указанной входной пре-мРНК нуклеотидной последовательности фланкирован 5000 расположенными в направлении 5’ контекстными нуклеотидами и 5000 расположенными в направлении 3’ контекстными нуклеотидами целевого нуклеотида, за счет чего обученная ACNN конфигурируется для приема в качестве входа пре-мРНК нуклеотидной последовательности из по меньшей мере 10001 нуклеотидов.
4. Реализуемый с применением компьютера способ по п. 1, где каждый из указанных обучающих примеров пре-мРНК нуклеотидных последовательностей и указанной входной пре-мРНК нуклеотидной последовательности фланкирован 500 нуклеотидами с каждой стороны от целевого нуклеотида.
5. Реализуемый с применением компьютера способ по п. 1, где каждый из указанных обучающих примеров пре-мРНК нуклеотидных последовательностей и указанной входной пре-мРНК нуклеотидной последовательности фланкирован 1000 расположенных в направлении 5’ контекстных нуклеотидов и 1000 расположенных в направлении 3’ контекстных нуклеотидов.
6. Реализуемый с применением компьютера способ по любому из пп. 1-5, дополнительно включающий обучение указанной ACNN на по меньшей мере 150000 тренировочных примеров донорных сайтов сплайсинга, 150000 тренировочных примеров акцепторных сайтов сплайсинга и 800000000 тренировочных примеров сайтов, не связанных со сплайсингом.
7. Реализуемый с применением компьютера способ по любому из пп. 1-6, где указанная ACNN содержит группы остаточных блоков.
8. Реализуемый с применением компьютера способ по п. 7, где каждая группа остаточных блоков параметризируется числом сверточных фильтров в остаточных блоках, размером окна свертки остаточных блоков и фактором разрежения остаточных блоков.
9. Реализуемый с применением компьютера способ по любому из пп. 7, 8, где фактор разряжения изменяется неэкспоненциально между группами остаточных блоков.
10. Реализуемый с применением компьютера способ по любому из пп. 8, 9, где размеры окна свертки в разных группах остаточных блоков различаются.
11. Реализуемый с применением компьютера способ по любому из пп. 1-9, где указанная ACNN дополнительно включает по меньшей мере одну группу из четырех остаточных блоков и по меньшей мере одно соединение с пропуском, причем каждый остаточный блок содержит 32 сверточных фильтра, размер окна свертки, составляющий 11, и фактор разряжения, составляющий 1.
12. Реализуемый с применением компьютера способ по п. 1, где указанная ACNN обучена на и сконфигурирована для оценки входов, включающих целевой нуклеотид, фланкированный 500 расположенными в направлении 5’ контекстными нуклеотидами и 500 расположенными в направлении 3’ контекстными нуклеотидами, дополнительно включающий:
по меньшей две группы из четырех остаточных блоков и по меньшей мере два соединения с пропусками, причем каждый остаточный блок в первой группе имеет 32 сверточных фильтра, размер окна свертки, составляющий 11, и фактор разрежения, составляющий 1, и каждый остаточный блок во второй группе имеет 32 сверточных фильтра, размер окна свертки, составляющий 11, и фактор разряжения, составляющий 4.
13. Реализуемый с применением компьютера способ по п. 1, где указанная ACNN обучена на и сконфигурирована для оценки входов, включающих целевой нуклеотид, фланкированный 1000 расположенных в направлении 5’ контекстных нуклеотидов и 1000 расположенных в направлении 3’ контекстных нуклеотидов, дополнительно включающий:
по меньшей мере три группы из четырех остаточных блоков и по меньшей мере три соединения с пропуском, где каждый остаточный блок в первой группе имеет 32 сверточных фильтра, размер окна свертки, составляющий 11, и фактор разряжения, составляющий 1, каждый остаточный блок во второй группе имеет 32 сверточных фильтра, размер окна свертки, составляющий 11, и фактор разряжения, составляющий 4, и каждый остаточный блок в третьей группе имеет 32 сверточных фильтра, размер окна свертки, составляющий 21, и фактор разряжения, составляющий 19.
14. Реализуемый с применением компьютера способ по п. 1, где указанная ACNN обучена на и сконфигурирована для оценки входов, включающих целевой нуклеотид, фланкированный 5000 расположенными в направлении 5’ контекстными нуклеотидами и 5000 расположенными в направлении 3’ контекстными нуклеотидами, дополнительно включающий:
по меньшей мере четыре группы из четырех остаточных блоков и по меньшей мере четыре соединения с пропуском, где каждый остаточный блок в первой группе имеет 32 сверточных фильтра, размер окна свертки, составляющий 11, и фактор разряжения, составляющий 1, каждый остаточный блок во второй группе имеет 32 сверточных фильтра, размер окна свертки, составляющий 11, и фактор разряжения, составляющий 4, каждый остаточный блок в третьей группе имеет 32 сверточных фильтра, размер окна свертки, составляющий 21, и фактор разряжения, составляющий 19, и каждый остаточный блок в четвертой группе имеет 32 сверточных фильтра, размер окна свертки, составляющий 41, и фактор разряжения, составляющий 25.
15. Реализуемый с применением компьютера способ по любому из пп. 1-14, где указанные оценки для каждого целевого нуклеотида экспоненциально нормированы и в сумме равны единице.
16. Реализуемый с применением компьютера способ по любому из пп. 1-15, дополнительно включающий классификацию каждого целевого нуклеотида как донорный сайт сплайсинга, акцепторный сайт сплайсинга или сайт, не связанный со сплайсингом, на основании наивысшей оценки для данного целевого нуклеотида.
17. Реализуемый с применением компьютера способ по любому из пп. 1-16, где размерность входа составляет (Cu+L+Cd)×4, где:
Cu - представляет собой число расположенных в 5’-направлении контекстных нуклеотидов;
Cd - представляет собой число расположенных в направлении 3’ контекстных нуклеотидов; и
L - представляет собой число нуклеотидов в целевой нуклеотидной последовательности.
18. Реализуемый с применением компьютера способ по п. 17, где размерность выхода составляет L×3.
19. Реализуемый с применением компьютера способ по п. 17, где размерность входа составляет (5000+5000+5000)×4.
20. Реализуемый с применением компьютера способ по п. 19, где размерность выхода составляет 5000×3.
21. Реализуемый с применением компьютера способ по любому из пп. 7-14, где каждая группа остаточных блоков выдает промежуточный выход посредством обработки предшествующего входа, причем размерность указанного промежуточного выхода составляет (I-[{(W-1)⋅D}⋅A])×N, где:
I - представляет собой размерность предшествующего входа;
W - представляет собой размер окна свертки остаточных блоков;
D - представляет собой показатель разрежения свертки остаточных блоков;
A - представляет собой число слоев разреженной свертки в указанной группе; и
N - представляет собой число сверточных фильтров в остаточных блоках.
22. Реализуемый с применением компьютера способ по любому из пп. 1-21, где указанная ACNN пакетно оценивает обучающие примеры на протяжении эпохи.
23. Реализуемый с применением компьютера способ по любому из пп. 1-22, где обучающие примеры случайным образом группируют в пакеты, причем каждый пакет имеет заранее определенный размер пакета.
24. Реализуемый с применением компьютера способ по любому из пп. 1-23, где указанная ACNN итерирует оценку обучающих примеров на протяжении по меньшей мере десяти эпох.
25. Реализуемый с применением компьютера способ по п. 24, где указанный вход включает целевую нуклеотидную последовательность, имеющую два соседних целевых нуклеотида.
26. Реализуемый с применением компьютера способ по п. 25, где указанные два соседних целевых нуклеотида представляют собой аденин, сокращенно A, и гуанин, сокращенно G.
27. Реализуемый с применением компьютера способ по п. 25, где указанные два соседних целевых нуклеотида представляют собой гуанин, сокращенно G, и урацил, сокращенно D.
28. Реализуемый с применением компьютера способ по любому из пп. 1-6 и 15-27, где указанная ACNN параметризуется числом остаточных блоков, числом соединений с пропуском и числом остаточных связей.
29. Реализуемый с применением компьютера способ по любому из пп. 1-28, где разреженные свертки сохраняют сверточные вычисления для повторного использования по мере обработки соседних нуклеотидов.
30. Реализуемый с применением компьютера способ по любому из пп. 1-29, где указанная ACNN включает сверточные меняющие размерность слои, которые изменяют пространственные размерности и размерности признаков предшествующего входа.
31. Реализуемый с применением компьютера способ по любому из пп. 7-14 и 28-30, где каждый остаточный блок содержит по меньшей мере один слой пакетной нормализации, по меньшей мере один слой блоков линейной ректификации (сокращенно ReLU), по меньшей мере один слой разреженной свертки и по меньшей мере одно остаточное соединение.
32. Реализуемый с применением компьютера способ по любому из пп. 7-14 и 28-30, где каждый остаточный блок содержит два слоя пакетной нормализации, два нелинейных слоя ReLU, два слоя разреженной свертки и одно остаточное соединение.
33. Система для предсказания правдоподобия сайтов сплайсинга в пре-мРНК геномных последовательностях, включающая один или более процессоров, связанных с памятью, причем в память загружены компьютерные команды, которые, при исполнении на указанных процессорах реализуют действия, включающие:
обучение разреженной сверточной нейронной сети, ACNN, на обучающих примерах пре-мРНК нуклеотидных последовательностей, включая по меньшей мере 50000 тренировочных примеров донорных сайтов сплайсинга, по меньшей мере 50000 тренировочных примеров акцепторных сайтов сплайсинга, и по меньшей мере 100000 тренировочных примеров сайтов, не связанных со сплайсингом, где указанное обучение включает:
ввод закодированных кодированием с одним активным состоянием примеров нуклеотидных последовательностей, где каждая нуклеотидная последовательность содержит по меньшей мере 401 нуклеотид, с по меньшей мере одним целевым нуклеотидом и контекстом из по меньшей мере 200 фланкирующих нуклеотидов с каждой стороны, в направлении 5’ и в направлении 3’; и
корректировку, путем обратного распространения, параметров фильтров в указанной ACNN для предсказания оценок правдоподобия того, что каждый целевой нуклеотид в указанной нуклеотидной последовательности является донорным сайтом сплайсинга, акцепторным сайтом сплайсинга или сайтом, не связанным со сплайсингом;
за счет чего обученная ACNN конфигурируется для приема в качестве входа пре-мРНК нуклеотидной последовательности, из по меньшей мере 401 нуклеотида, которая закодирована кодированием с одним активным состоянием и которая включает по меньшей мере один целевой нуклеотид и контекст из по меньшей мере 200 фланкирующих нуклеотидов с каждой стороны, и для оценки правдоподобия того, что целевой нуклеотид является донорным сайтом сплайсинга, акцепторным сайтом сплайсинга или сайтом, не связанным со сплайсингом.
34. Система по п. 33, где указанная ACNN обучена на 150000 тренировочных примеров донорных сайтов сплайсинга, 150000 тренировочных примеров акцепторных сайтов сплайсинга и 800000000 тренировочных примеров сайтов, не связанных со сплайсингом.
35. Система по любому из пп. 32 или 33, где ACNN содержит группы остаточных блоков.
36. Система по п. 35, где каждая группа остаточных блоков параметризируется числом сверточных фильтров в остаточных блоках, размером окна свертки остаточных блоков и фактором разрежения остаточных блоков.
37. Система по п. 37, где фактор разряжения неэкспоненциально меняется между группами остаточных блоков.
38. Система по п. 37, где размеры окна свертки в разных группах остаточных блоков различаются.
39. Система по любому из пп. 21-38, где указанная ACNN обучена на одном или более обучающих серверах.
40. Система по любому из пп. 32-39, где указанная обученная ACNN размещена на одном или большем числе рабочих серверов, которые получают входные последовательности от запрашивающих клиентов.
41. Система по любому из пп. 32-40, где указанные рабочие серверы обрабатывают входные последовательности посредством стадий ввода и вывода указанной ACNN с генерацией выходных данных, которые передаются указанным клиентам.
Applications Claiming Priority (9)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762573131P | 2017-10-16 | 2017-10-16 | |
US201762573135P | 2017-10-16 | 2017-10-16 | |
US201762573125P | 2017-10-16 | 2017-10-16 | |
US62/573,131 | 2017-10-16 | ||
US62/573,135 | 2017-10-16 | ||
US62/573,125 | 2017-10-16 | ||
US201862726158P | 2018-08-31 | 2018-08-31 | |
US62/726,158 | 2018-08-31 | ||
PCT/US2018/055915 WO2019079198A1 (en) | 2017-10-16 | 2018-10-15 | CLASSIFICATION OF A CONNECTION SITE BASED ON DEEP LEARNING |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2022124816A Division RU2022124816A (ru) | 2017-10-16 | 2018-10-15 | Классификация сайта сплайсинга на основе глубокого обучения |
Publications (3)
Publication Number | Publication Date |
---|---|
RU2019139175A true RU2019139175A (ru) | 2021-06-02 |
RU2019139175A3 RU2019139175A3 (ru) | 2021-07-27 |
RU2780442C2 RU2780442C2 (ru) | 2022-09-23 |
Family
ID=
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11295196B2 (en) | Apparatus and methods for neural network operations supporting fixed point numbers of short bit length | |
US10936284B2 (en) | Apparatus and methods for neural network operations supporting floating point numbers of short bit length | |
Stern et al. | Blockwise parallel decoding for deep autoregressive models | |
CN111684473B (zh) | 提高神经网络阵列的性能 | |
Kassahun et al. | Efficient reinforcement learning through Evolutionary Acquisition of Neural Topologies. | |
CN109886807B (zh) | 一种p2p平台上基于风险收益管理的个性化推荐方法 | |
CN107609648B (zh) | 一种结合堆叠降噪稀疏自动编码器的遗传算法 | |
CN111126562B (zh) | 基于神经网络的目标算法拟合方法、终端以及应用 | |
GB2600872A (en) | System-aware selective quantization for performance optimized distributed deep learning | |
CN110858805A (zh) | 小区网络流量预测方法及装置 | |
CN109145107B (zh) | 基于卷积神经网络的主题提取方法、装置、介质和设备 | |
CN108964671A (zh) | 一种译码方法及译码器 | |
Fu et al. | DepthShrinker: a new compression paradigm towards boosting real-hardware efficiency of compact neural networks | |
RU2019139175A (ru) | Классификация сайта сплайсинга на основе глубокого обучения | |
Kim et al. | A novel MobileNet with selective depth multiplier to compromise complexity and accuracy | |
CN103366100A (zh) | 从全基因组中过滤与复杂疾病无关snp的方法 | |
CN110674931B (zh) | 一种基于权重重要性的全连接神经网络优化方法和装置 | |
CN116975778A (zh) | 一种基于信息级联的社交网络信息传播影响力预测方法 | |
Yang et al. | Evolutionary Neural Architecture Search for Transformer in Knowledge Tracing | |
Baker et al. | Design of large-scale stochastic computing adders and their anomalous behavior | |
CN116227311A (zh) | 一种改进的基于差分进化的亨利气体溶解度优化方法 | |
Koratana et al. | Lit: Block-wise intermediate representation training for model compression | |
Azizi et al. | Sensitivity-aware mixed-precision quantization and width optimization of deep neural networks through cluster-based tree-structured parzen estimation | |
CN114943866A (zh) | 基于进化神经网络结构搜索的图像分类方法 | |
Emad et al. | Poisson group testing: A probabilistic model for Boolean compressed sensing |