RU2014135284A - Управление справочной спектральной информацией и поиск - Google Patents
Управление справочной спектральной информацией и поиск Download PDFInfo
- Publication number
- RU2014135284A RU2014135284A RU2014135284A RU2014135284A RU2014135284A RU 2014135284 A RU2014135284 A RU 2014135284A RU 2014135284 A RU2014135284 A RU 2014135284A RU 2014135284 A RU2014135284 A RU 2014135284A RU 2014135284 A RU2014135284 A RU 2014135284A
- Authority
- RU
- Russia
- Prior art keywords
- range
- intervals
- different sizes
- peaks
- sample
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/28—Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/758—Involving statistics of pixels or of feature values, e.g. histogram matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
- G06F2218/14—Classification; Matching by matching peak patterns
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Epidemiology (AREA)
- Biotechnology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Public Health (AREA)
- Biophysics (AREA)
- Bioethics (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computing Systems (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
1. Способ, включающий:прием набора пиков для каждого стандартного образца из множества стандартных образцов;выполнение разбиения спектра таким образом, чтобы оно включало множество интервалов диапазона разного размера, при этом каждый из пиков в множестве стандартных образцов принадлежит одному из множества интервалов диапазона разного размера; ииндексацию местоположений пиков, связанных с неизвестным образцом, в множестве интервалов диапазона разного размера.2. Способ по п. 1, отличающийся тем, что сравнение пиков включает:на основе проиндексированных местоположений пиков, связанных с неизвестным образцом, в множестве интервалов диапазона разного размера, определение подмножества множества стандартных образцов, которые являются кандидатами на совпадение с неизвестным образцом.3. Способ по п. 1, отличающийся тем, что разбиение спектра на множество интервалов диапазона разного размера включает:определение значений ширины каждого из множества интервалов диапазона разного размера так, чтобы в каждый из множества интервалов диапазона разного размера попадало, по существу, равное количество пиков в стандартных образцах.4. Способ по п. 1, дополнительно включающий:для соответствующего стандартного образца из множества стандартных образцов, генерирование вероятностной информации о том, что соответствующий стандартный образец представляет собой совпадение с неизвестным образцом.5. Способ по п. 4, дополнительно включающий:вычисление вероятностной информации, по меньшей мере, частично на основе двоичных арифметических операций с фиксированной запятой.6. Способ по п. 1, дополнительно включающий:прием спектральной информации, св
Claims (30)
1. Способ, включающий:
прием набора пиков для каждого стандартного образца из множества стандартных образцов;
выполнение разбиения спектра таким образом, чтобы оно включало множество интервалов диапазона разного размера, при этом каждый из пиков в множестве стандартных образцов принадлежит одному из множества интервалов диапазона разного размера; и
индексацию местоположений пиков, связанных с неизвестным образцом, в множестве интервалов диапазона разного размера.
2. Способ по п. 1, отличающийся тем, что сравнение пиков включает:
на основе проиндексированных местоположений пиков, связанных с неизвестным образцом, в множестве интервалов диапазона разного размера, определение подмножества множества стандартных образцов, которые являются кандидатами на совпадение с неизвестным образцом.
3. Способ по п. 1, отличающийся тем, что разбиение спектра на множество интервалов диапазона разного размера включает:
определение значений ширины каждого из множества интервалов диапазона разного размера так, чтобы в каждый из множества интервалов диапазона разного размера попадало, по существу, равное количество пиков в стандартных образцах.
4. Способ по п. 1, дополнительно включающий:
для соответствующего стандартного образца из множества стандартных образцов, генерирование вероятностной информации о том, что соответствующий стандартный образец представляет собой совпадение с неизвестным образцом.
5. Способ по п. 4, дополнительно включающий:
вычисление вероятностной информации, по меньшей мере, частично на основе двоичных арифметических операций с фиксированной запятой.
6. Способ по п. 1, дополнительно включающий:
прием спектральной информации, связанной с каждым из множества стандартных образцов, при этом спектральная информация включает анализ, охватывающий спектр; и
обработку спектральной информации с целью определения набора пиков для каждого из множества стандартных образцов.
7. Способ по п. 1, отличающийся тем, что разбиение спектра включает:
выбор границ интервалов диапазона разного размера в соответствии с моделью гипергеометрического распределения.
8. Способ по п. 1, дополнительно включающий:
реализацию функции гипергеометрической вероятности для генерирования вероятностной информации, указывающей на то, что неизвестный образец совпадает с соответствующим одним из множества стандартных образцов.
9. Способ по п. 1, дополнительно включающий:
определение того, что пик неизвестного образца и пик, связанный с данным стандартным образцом, принадлежат конкретному интервалу диапазона из множества интервалов диапазона и
вычисление вероятности того, что совпадение между пиком в неизвестном образце и пиком в данном стандартном образце для конкретного интервала диапазона представляет собой случайное событие.
10. Способ по п. 1, дополнительно включающий:
вычисление значения вероятности для проверки нулевой гипотезы о том, что наблюдаемые совпадения пиков между стандартным образцом и данным стандартным образцом происходят случайно.
11. Способ по п. 1, отличающийся тем, что сравнение пиков, связанных с неизвестным образцом, с множеством интервалов диапазона включает:
определение пика неизвестного образца;
определение интервала диапазона из множества интервалов диапазона разного размера, в котором лежит пик неизвестного образца; и
определение конкретного стандартного образца из множества стандартных образцов, который включает пик в определенном интервале диапазона.
12. Способ по п. 2, отличающийся тем, что индексация пиков, связанных с неизвестным образцом, в множестве интервалов диапазона разного размера включает:
для каждого соответствующего стандартного образца из множества стандартных образцов:
генерирование значения k, указывающего количество событий попадания пика неизвестного образца в интервал, в котором соответствующий стандартный образец также включает пик;
генерирование значения N, указывающего количество интервалов диапазона разного размера в множестве;
генерирование значения n, указывающего общее количество пиков, присутствующих в соответствующем стандартном образце; и
генерирование значения m, указывающего общее количество пиков, присутствующих в неизвестном образце.
14. Способ по п. 1, отличающийся тем, что сравнение пиков включает:
выработку первой двоичной строки, при этом первая двоичная строка указывает, какому из множества интервалов диапазона разного размера принадлежит неизвестный образец; и
выработку второй двоичной строки, при этом вторая двоичная строка указывает, какому из множества интервалов диапазона разного размера принадлежит пик стандартного образца; и
получение вероятностной информации на основе подобия между первой двоичной и второй двоичной строкой.
15. Система, содержащая:
процессор и
аппаратный ресурс хранения данных, связанный с процессором, при этом аппаратный ресурс хранения данных хранит в памяти команды, которые при их исполнении процессором вызывают выполнение процессором операций:
приема набора пиков для каждого стандартного образца из множества стандартных образцов;
выполнения разбиения спектра таким образом, чтобы оно включало множество интервалов диапазона разного размера, при этом каждый из пиков в множестве стандартных образцов принадлежит одному из множества интервалов диапазона разного размера; и
сравнения пиков, связанных с неизвестным образцом, с множеством интервалов диапазона разного размера.
16. Система по п. 15, отличающаяся тем, что сравнение пиков включает:
на основе индексации пиков, связанных с неизвестным образцом, в множестве интервалов диапазона разного размера, определение подмножества множества стандартных образцов, которые являются кандидатами на совпадение с неизвестным образцом.
17. Система по п. 16, в которой процессор дополнительно выполняет операции:
генерирования вероятностной информации о том, что соответствующий стандартный образец представляет собой совпадение с неизвестным образцом.
18. Система по п. 15, отличающаяся тем, что разбиение спектра на множество интервалов диапазона разного размера включает:
определение значений ширины каждого из множества интервалов диапазона разного размера так, чтобы в каждый из множества интервалов диапазона разного размера попадало, по существу, равное количество пиков в стандартных образцах.
19. Система по п. 15, в которой процессор дополнительно выполняет операции:
вычисления вероятностной информации, по меньшей мере, частично на основе двоичных арифметических операций с фиксированной запятой.
20. Машиночитаемое аппаратное обеспечение хранения данных, содержащее хранящиеся на нем команды, при этом команды при осуществлении устройством обработки данных вызывают выполнение указанным устройством обработки данных операций:
приема набора пиков для каждого стандартного образца из множества стандартных образцов;
выполнения разбиения спектра таким образом, чтобы оно включало множество интервалов диапазона разного размера, при этом каждый из пиков в множестве стандартных образцов принадлежит одному из множества интервалов диапазона разного размера; и
сравнения пиков, связанных с неизвестным образцом, с множеством интервалов диапазона разного размера.
21. Способ, включающий:
прием набора пиков для каждого стандартного образца из множества стандартных образцов;
выполнение разбиения спектра таким образом, чтобы оно включало множество интервалов диапазона разного размера, при этом каждый из пиков в множестве стандартных образцов принадлежит одному из множества интервалов диапазона разного размера; и
сохранение информации интервалов, указывающей множество интервалов диапазона разного размера, сгенерированных для спектра, подвергнутого разбиению.
22. Способ по п. 21, дополнительно включающий:
сохранение информации пиков, указывающей, какому из множества интервалов диапазона разного размера принадлежат пики в множестве стандартных образцов.
23. Способ по п. 21, отличающийся тем, что разбиение спектра на множество интервалов диапазона разного размера включает:
определение значений ширины каждого из множества интервалов диапазона разного размера так, чтобы в каждый из множества интервалов диапазона разного размера попадало, по существу, равное количество пиков в стандартных образцах.
24. Способ по п. 21, отличающийся тем, что разбиение спектра включает:
выбор границ интервалов диапазона разного размера в соответствии с моделью гипергеометрического распределения.
25. Способ, включающий:
прием информации интервалов диапазона, при этом информация интервалов диапазона указывает множество интервалов диапазона разного размера, на которые был разбит спектр;
прием информации пиков, указывающей набор пиков, связанных с каждым из множества стандартных образцов, при этом информация пиков дополнительно указывает, какому из множества интервалов диапазона разного размера принадлежит каждый из пиков; и
индексацию местоположений пиков, связанных с неизвестным образцом, в множестве интервалов диапазона разного размера.
26. Способ по п. 25, дополнительно включающий:
на основе проиндексированных местоположений пиков, связанных с неизвестным образцом, в множестве интервалов диапазона разного размера, определение подмножества множества стандартных образцов, которые являются кандидатами на совпадение с неизвестным образцом.
27. Способ по п. 25, отличающийся тем, что значения ширины каждого из множества интервалов диапазона разного размера определяют так, чтобы в каждый из множества интервалов диапазона разного размера попадало, по существу, равное количество пиков в стандартных образцах.
28. Способ по п. 25, дополнительно включающий:
для соответствующих стандартных образцов из множества стандартных образцов, генерирование вероятностной информации о том, что соответствующий стандартный образец представляет собой совпадение с неизвестным образцом.
29. Способ по п. 28, дополнительно включающий:
вычисление вероятностной информации, по меньшей мере, частично на основе двоичных арифметических операций с фиксированной запятой.
30. Способ по п. 25, дополнительно включающий:
реализацию функции гипергеометрической вероятности для генерирования вероятностной информации, указывающей на то, что неизвестный образец совпадает с соответствующим одним из множества стандартных образцов.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/363,171 | 2012-01-31 | ||
US13/363,171 US9514360B2 (en) | 2012-01-31 | 2012-01-31 | Management of reference spectral information and searching |
PCT/US2013/021847 WO2013115998A1 (en) | 2012-01-31 | 2013-01-17 | Management of reference spectral information and searching |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2014135284A true RU2014135284A (ru) | 2016-03-20 |
RU2603491C2 RU2603491C2 (ru) | 2016-11-27 |
Family
ID=47714529
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2014135284/08A RU2603491C2 (ru) | 2012-01-31 | 2013-01-17 | Управление справочной спектральной информацией и поиск |
Country Status (6)
Country | Link |
---|---|
US (1) | US9514360B2 (ru) |
EP (1) | EP2810214B1 (ru) |
CN (1) | CN104185848B (ru) |
AU (1) | AU2013215576B2 (ru) |
RU (1) | RU2603491C2 (ru) |
WO (1) | WO2013115998A1 (ru) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9697274B2 (en) * | 2013-12-27 | 2017-07-04 | International Business Machines Corporation | Stratified sampling using adaptive parallel data processing |
US10564105B2 (en) * | 2015-08-25 | 2020-02-18 | B&W Tek Llc | Variable reduction method for spectral searching |
CN109073592B (zh) * | 2016-04-11 | 2020-11-10 | 株式会社岛津制作所 | 质谱分析装置及质谱分析方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030219715A1 (en) * | 2000-08-09 | 2003-11-27 | Lam Raymond L H | Cell-based analysis of high throughput screening data for drug discovery |
US7028067B2 (en) | 2002-02-20 | 2006-04-11 | International Business Machines Corporation | Generation of mask-constrained floating-point addition and subtraction test cases, and method and system therefor |
US6906320B2 (en) * | 2003-04-02 | 2005-06-14 | Merck & Co., Inc. | Mass spectrometry data analysis techniques |
WO2005003308A2 (en) | 2003-06-25 | 2005-01-13 | Smithkline Beecham Corporation | Biological data set comparison method |
CA2566799C (en) | 2004-05-14 | 2019-02-12 | Chemometec A/S | A method and a system for the assessment of samples |
JP4620446B2 (ja) | 2004-12-24 | 2011-01-26 | 株式会社日立ハイテクノロジーズ | 質量分析方法、質量分析システム、診断システム、検査システム及び質量分析プログラム |
US20070282537A1 (en) | 2006-05-26 | 2007-12-06 | The Ohio State University | Rapid characterization of post-translationally modified proteins from tandem mass spectra |
US7555393B2 (en) | 2007-06-01 | 2009-06-30 | Thermo Finnigan Llc | Evaluating the probability that MS/MS spectral data matches candidate sequence data |
-
2012
- 2012-01-31 US US13/363,171 patent/US9514360B2/en active Active
-
2013
- 2013-01-17 EP EP13704268.5A patent/EP2810214B1/en active Active
- 2013-01-17 RU RU2014135284/08A patent/RU2603491C2/ru active
- 2013-01-17 AU AU2013215576A patent/AU2013215576B2/en active Active
- 2013-01-17 CN CN201380005162.8A patent/CN104185848B/zh active Active
- 2013-01-17 WO PCT/US2013/021847 patent/WO2013115998A1/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
AU2013215576A1 (en) | 2014-07-31 |
EP2810214B1 (en) | 2021-04-21 |
CN104185848A (zh) | 2014-12-03 |
AU2013215576B2 (en) | 2017-10-19 |
EP2810214A1 (en) | 2014-12-10 |
WO2013115998A1 (en) | 2013-08-08 |
US20130197815A1 (en) | 2013-08-01 |
RU2603491C2 (ru) | 2016-11-27 |
CN104185848B (zh) | 2018-05-18 |
US9514360B2 (en) | 2016-12-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106295250B (zh) | 二代测序短序列快速比对分析方法及装置 | |
CN108777873B (zh) | 基于加权混合孤立森林的无线传感网络异常数据检测方法 | |
CN112889042A (zh) | 机器学习中超参数的识别与应用 | |
RU2015125969A (ru) | Система и способ обнаружения вредоносных файлов на мобильных устройствах | |
CN105095686B (zh) | 基于多核cpu硬件的高通量转录组测序数据质量控制方法 | |
JP5964983B2 (ja) | 質量分析法により微生物を特定するための方法 | |
CN114088847B (zh) | 基于色谱分析的样品确定方法、装置、存储介质及服务器 | |
JP2014178203A5 (ru) | ||
Awan et al. | MS-REDUCE: an ultrafast technique for reduction of big mass spectrometry data for high-throughput processing | |
RU2014135284A (ru) | Управление справочной спектральной информацией и поиск | |
JP2018049004A5 (ru) | ||
CN110349621B (zh) | 肽段-谱图匹配可信度检验方法、系统、存储介质及装置 | |
CN106557668B (zh) | 基于lf熵的dna序列相似性检验方法 | |
US20210050071A1 (en) | Methods and systems for prediction of a dna profile mixture ratio | |
CN115616659A (zh) | 微地震事件的类型确定方法、装置和电子设备 | |
US11386340B2 (en) | Method and apparatus for performing block retrieval on block to be processed of urine sediment image | |
CN112613263B (zh) | 仿真验证方法、装置、电子设备和计算机可读存储介质 | |
WO2017107651A1 (zh) | 确定新闻之间相关性、多新闻之间相关性计算方法和装置 | |
CN108388774A (zh) | 一种多肽谱匹配数据的在线分析方法 | |
Prasad et al. | Assessment of clustering tendency through progressive random sampling and graph-based clustering results | |
Garg et al. | Android malware classification using ensemble classifiers | |
US20200202982A1 (en) | Methods and systems for assessing the presence of allelic dropout using machine learning algorithms | |
US10025831B2 (en) | Adaptive short lists and acceleration of biometric database search | |
CN112614542B (zh) | 一种微生物鉴定方法、装置、设备及存储介质 | |
CN116303473B (zh) | 一种数据库的构建方法、装置、设备及可读存储介质 |