RU2014135284A - Управление справочной спектральной информацией и поиск - Google Patents

Управление справочной спектральной информацией и поиск Download PDF

Info

Publication number
RU2014135284A
RU2014135284A RU2014135284A RU2014135284A RU2014135284A RU 2014135284 A RU2014135284 A RU 2014135284A RU 2014135284 A RU2014135284 A RU 2014135284A RU 2014135284 A RU2014135284 A RU 2014135284A RU 2014135284 A RU2014135284 A RU 2014135284A
Authority
RU
Russia
Prior art keywords
range
intervals
different sizes
peaks
sample
Prior art date
Application number
RU2014135284A
Other languages
English (en)
Other versions
RU2603491C2 (ru
Inventor
Крейг М. ГАРДНЕР
Роберт Л. ГРИН
Original Assignee
Термо Сайентифик Портабл Аналитикал Инструментс Инк.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Термо Сайентифик Портабл Аналитикал Инструментс Инк. filed Critical Термо Сайентифик Портабл Аналитикал Инструментс Инк.
Publication of RU2014135284A publication Critical patent/RU2014135284A/ru
Application granted granted Critical
Publication of RU2603491C2 publication Critical patent/RU2603491C2/ru

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/28Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/758Involving statistics of pixels or of feature values, e.g. histogram matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching
    • G06F2218/14Classification; Matching by matching peak patterns

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Epidemiology (AREA)
  • Biotechnology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Public Health (AREA)
  • Biophysics (AREA)
  • Bioethics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

1. Способ, включающий:прием набора пиков для каждого стандартного образца из множества стандартных образцов;выполнение разбиения спектра таким образом, чтобы оно включало множество интервалов диапазона разного размера, при этом каждый из пиков в множестве стандартных образцов принадлежит одному из множества интервалов диапазона разного размера; ииндексацию местоположений пиков, связанных с неизвестным образцом, в множестве интервалов диапазона разного размера.2. Способ по п. 1, отличающийся тем, что сравнение пиков включает:на основе проиндексированных местоположений пиков, связанных с неизвестным образцом, в множестве интервалов диапазона разного размера, определение подмножества множества стандартных образцов, которые являются кандидатами на совпадение с неизвестным образцом.3. Способ по п. 1, отличающийся тем, что разбиение спектра на множество интервалов диапазона разного размера включает:определение значений ширины каждого из множества интервалов диапазона разного размера так, чтобы в каждый из множества интервалов диапазона разного размера попадало, по существу, равное количество пиков в стандартных образцах.4. Способ по п. 1, дополнительно включающий:для соответствующего стандартного образца из множества стандартных образцов, генерирование вероятностной информации о том, что соответствующий стандартный образец представляет собой совпадение с неизвестным образцом.5. Способ по п. 4, дополнительно включающий:вычисление вероятностной информации, по меньшей мере, частично на основе двоичных арифметических операций с фиксированной запятой.6. Способ по п. 1, дополнительно включающий:прием спектральной информации, св

Claims (30)

1. Способ, включающий:
прием набора пиков для каждого стандартного образца из множества стандартных образцов;
выполнение разбиения спектра таким образом, чтобы оно включало множество интервалов диапазона разного размера, при этом каждый из пиков в множестве стандартных образцов принадлежит одному из множества интервалов диапазона разного размера; и
индексацию местоположений пиков, связанных с неизвестным образцом, в множестве интервалов диапазона разного размера.
2. Способ по п. 1, отличающийся тем, что сравнение пиков включает:
на основе проиндексированных местоположений пиков, связанных с неизвестным образцом, в множестве интервалов диапазона разного размера, определение подмножества множества стандартных образцов, которые являются кандидатами на совпадение с неизвестным образцом.
3. Способ по п. 1, отличающийся тем, что разбиение спектра на множество интервалов диапазона разного размера включает:
определение значений ширины каждого из множества интервалов диапазона разного размера так, чтобы в каждый из множества интервалов диапазона разного размера попадало, по существу, равное количество пиков в стандартных образцах.
4. Способ по п. 1, дополнительно включающий:
для соответствующего стандартного образца из множества стандартных образцов, генерирование вероятностной информации о том, что соответствующий стандартный образец представляет собой совпадение с неизвестным образцом.
5. Способ по п. 4, дополнительно включающий:
вычисление вероятностной информации, по меньшей мере, частично на основе двоичных арифметических операций с фиксированной запятой.
6. Способ по п. 1, дополнительно включающий:
прием спектральной информации, связанной с каждым из множества стандартных образцов, при этом спектральная информация включает анализ, охватывающий спектр; и
обработку спектральной информации с целью определения набора пиков для каждого из множества стандартных образцов.
7. Способ по п. 1, отличающийся тем, что разбиение спектра включает:
выбор границ интервалов диапазона разного размера в соответствии с моделью гипергеометрического распределения.
8. Способ по п. 1, дополнительно включающий:
реализацию функции гипергеометрической вероятности для генерирования вероятностной информации, указывающей на то, что неизвестный образец совпадает с соответствующим одним из множества стандартных образцов.
9. Способ по п. 1, дополнительно включающий:
определение того, что пик неизвестного образца и пик, связанный с данным стандартным образцом, принадлежат конкретному интервалу диапазона из множества интервалов диапазона и
вычисление вероятности того, что совпадение между пиком в неизвестном образце и пиком в данном стандартном образце для конкретного интервала диапазона представляет собой случайное событие.
10. Способ по п. 1, дополнительно включающий:
вычисление значения вероятности для проверки нулевой гипотезы о том, что наблюдаемые совпадения пиков между стандартным образцом и данным стандартным образцом происходят случайно.
11. Способ по п. 1, отличающийся тем, что сравнение пиков, связанных с неизвестным образцом, с множеством интервалов диапазона включает:
определение пика неизвестного образца;
определение интервала диапазона из множества интервалов диапазона разного размера, в котором лежит пик неизвестного образца; и
определение конкретного стандартного образца из множества стандартных образцов, который включает пик в определенном интервале диапазона.
12. Способ по п. 2, отличающийся тем, что индексация пиков, связанных с неизвестным образцом, в множестве интервалов диапазона разного размера включает:
для каждого соответствующего стандартного образца из множества стандартных образцов:
генерирование значения k, указывающего количество событий попадания пика неизвестного образца в интервал, в котором соответствующий стандартный образец также включает пик;
генерирование значения N, указывающего количество интервалов диапазона разного размера в множестве;
генерирование значения n, указывающего общее количество пиков, присутствующих в соответствующем стандартном образце; и
генерирование значения m, указывающего общее количество пиков, присутствующих в неизвестном образце.
13. Способ по п. 12, дополнительно включающий:
генерирование вероятностной информации для каждого из соответствующих стандартных образцов на основе следующего уравнения:
Figure 00000001
14. Способ по п. 1, отличающийся тем, что сравнение пиков включает:
выработку первой двоичной строки, при этом первая двоичная строка указывает, какому из множества интервалов диапазона разного размера принадлежит неизвестный образец; и
выработку второй двоичной строки, при этом вторая двоичная строка указывает, какому из множества интервалов диапазона разного размера принадлежит пик стандартного образца; и
получение вероятностной информации на основе подобия между первой двоичной и второй двоичной строкой.
15. Система, содержащая:
процессор и
аппаратный ресурс хранения данных, связанный с процессором, при этом аппаратный ресурс хранения данных хранит в памяти команды, которые при их исполнении процессором вызывают выполнение процессором операций:
приема набора пиков для каждого стандартного образца из множества стандартных образцов;
выполнения разбиения спектра таким образом, чтобы оно включало множество интервалов диапазона разного размера, при этом каждый из пиков в множестве стандартных образцов принадлежит одному из множества интервалов диапазона разного размера; и
сравнения пиков, связанных с неизвестным образцом, с множеством интервалов диапазона разного размера.
16. Система по п. 15, отличающаяся тем, что сравнение пиков включает:
на основе индексации пиков, связанных с неизвестным образцом, в множестве интервалов диапазона разного размера, определение подмножества множества стандартных образцов, которые являются кандидатами на совпадение с неизвестным образцом.
17. Система по п. 16, в которой процессор дополнительно выполняет операции:
генерирования вероятностной информации о том, что соответствующий стандартный образец представляет собой совпадение с неизвестным образцом.
18. Система по п. 15, отличающаяся тем, что разбиение спектра на множество интервалов диапазона разного размера включает:
определение значений ширины каждого из множества интервалов диапазона разного размера так, чтобы в каждый из множества интервалов диапазона разного размера попадало, по существу, равное количество пиков в стандартных образцах.
19. Система по п. 15, в которой процессор дополнительно выполняет операции:
вычисления вероятностной информации, по меньшей мере, частично на основе двоичных арифметических операций с фиксированной запятой.
20. Машиночитаемое аппаратное обеспечение хранения данных, содержащее хранящиеся на нем команды, при этом команды при осуществлении устройством обработки данных вызывают выполнение указанным устройством обработки данных операций:
приема набора пиков для каждого стандартного образца из множества стандартных образцов;
выполнения разбиения спектра таким образом, чтобы оно включало множество интервалов диапазона разного размера, при этом каждый из пиков в множестве стандартных образцов принадлежит одному из множества интервалов диапазона разного размера; и
сравнения пиков, связанных с неизвестным образцом, с множеством интервалов диапазона разного размера.
21. Способ, включающий:
прием набора пиков для каждого стандартного образца из множества стандартных образцов;
выполнение разбиения спектра таким образом, чтобы оно включало множество интервалов диапазона разного размера, при этом каждый из пиков в множестве стандартных образцов принадлежит одному из множества интервалов диапазона разного размера; и
сохранение информации интервалов, указывающей множество интервалов диапазона разного размера, сгенерированных для спектра, подвергнутого разбиению.
22. Способ по п. 21, дополнительно включающий:
сохранение информации пиков, указывающей, какому из множества интервалов диапазона разного размера принадлежат пики в множестве стандартных образцов.
23. Способ по п. 21, отличающийся тем, что разбиение спектра на множество интервалов диапазона разного размера включает:
определение значений ширины каждого из множества интервалов диапазона разного размера так, чтобы в каждый из множества интервалов диапазона разного размера попадало, по существу, равное количество пиков в стандартных образцах.
24. Способ по п. 21, отличающийся тем, что разбиение спектра включает:
выбор границ интервалов диапазона разного размера в соответствии с моделью гипергеометрического распределения.
25. Способ, включающий:
прием информации интервалов диапазона, при этом информация интервалов диапазона указывает множество интервалов диапазона разного размера, на которые был разбит спектр;
прием информации пиков, указывающей набор пиков, связанных с каждым из множества стандартных образцов, при этом информация пиков дополнительно указывает, какому из множества интервалов диапазона разного размера принадлежит каждый из пиков; и
индексацию местоположений пиков, связанных с неизвестным образцом, в множестве интервалов диапазона разного размера.
26. Способ по п. 25, дополнительно включающий:
на основе проиндексированных местоположений пиков, связанных с неизвестным образцом, в множестве интервалов диапазона разного размера, определение подмножества множества стандартных образцов, которые являются кандидатами на совпадение с неизвестным образцом.
27. Способ по п. 25, отличающийся тем, что значения ширины каждого из множества интервалов диапазона разного размера определяют так, чтобы в каждый из множества интервалов диапазона разного размера попадало, по существу, равное количество пиков в стандартных образцах.
28. Способ по п. 25, дополнительно включающий:
для соответствующих стандартных образцов из множества стандартных образцов, генерирование вероятностной информации о том, что соответствующий стандартный образец представляет собой совпадение с неизвестным образцом.
29. Способ по п. 28, дополнительно включающий:
вычисление вероятностной информации, по меньшей мере, частично на основе двоичных арифметических операций с фиксированной запятой.
30. Способ по п. 25, дополнительно включающий:
реализацию функции гипергеометрической вероятности для генерирования вероятностной информации, указывающей на то, что неизвестный образец совпадает с соответствующим одним из множества стандартных образцов.
RU2014135284/08A 2012-01-31 2013-01-17 Управление справочной спектральной информацией и поиск RU2603491C2 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/363,171 2012-01-31
US13/363,171 US9514360B2 (en) 2012-01-31 2012-01-31 Management of reference spectral information and searching
PCT/US2013/021847 WO2013115998A1 (en) 2012-01-31 2013-01-17 Management of reference spectral information and searching

Publications (2)

Publication Number Publication Date
RU2014135284A true RU2014135284A (ru) 2016-03-20
RU2603491C2 RU2603491C2 (ru) 2016-11-27

Family

ID=47714529

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2014135284/08A RU2603491C2 (ru) 2012-01-31 2013-01-17 Управление справочной спектральной информацией и поиск

Country Status (6)

Country Link
US (1) US9514360B2 (ru)
EP (1) EP2810214B1 (ru)
CN (1) CN104185848B (ru)
AU (1) AU2013215576B2 (ru)
RU (1) RU2603491C2 (ru)
WO (1) WO2013115998A1 (ru)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9697274B2 (en) * 2013-12-27 2017-07-04 International Business Machines Corporation Stratified sampling using adaptive parallel data processing
US10564105B2 (en) * 2015-08-25 2020-02-18 B&W Tek Llc Variable reduction method for spectral searching
CN109073592B (zh) * 2016-04-11 2020-11-10 株式会社岛津制作所 质谱分析装置及质谱分析方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030219715A1 (en) * 2000-08-09 2003-11-27 Lam Raymond L H Cell-based analysis of high throughput screening data for drug discovery
US7028067B2 (en) 2002-02-20 2006-04-11 International Business Machines Corporation Generation of mask-constrained floating-point addition and subtraction test cases, and method and system therefor
US6906320B2 (en) * 2003-04-02 2005-06-14 Merck & Co., Inc. Mass spectrometry data analysis techniques
WO2005003308A2 (en) 2003-06-25 2005-01-13 Smithkline Beecham Corporation Biological data set comparison method
CA2566799C (en) 2004-05-14 2019-02-12 Chemometec A/S A method and a system for the assessment of samples
JP4620446B2 (ja) 2004-12-24 2011-01-26 株式会社日立ハイテクノロジーズ 質量分析方法、質量分析システム、診断システム、検査システム及び質量分析プログラム
US20070282537A1 (en) 2006-05-26 2007-12-06 The Ohio State University Rapid characterization of post-translationally modified proteins from tandem mass spectra
US7555393B2 (en) 2007-06-01 2009-06-30 Thermo Finnigan Llc Evaluating the probability that MS/MS spectral data matches candidate sequence data

Also Published As

Publication number Publication date
AU2013215576A1 (en) 2014-07-31
EP2810214B1 (en) 2021-04-21
CN104185848A (zh) 2014-12-03
AU2013215576B2 (en) 2017-10-19
EP2810214A1 (en) 2014-12-10
WO2013115998A1 (en) 2013-08-08
US20130197815A1 (en) 2013-08-01
RU2603491C2 (ru) 2016-11-27
CN104185848B (zh) 2018-05-18
US9514360B2 (en) 2016-12-06

Similar Documents

Publication Publication Date Title
CN106295250B (zh) 二代测序短序列快速比对分析方法及装置
CN108777873B (zh) 基于加权混合孤立森林的无线传感网络异常数据检测方法
CN112889042A (zh) 机器学习中超参数的识别与应用
RU2015125969A (ru) Система и способ обнаружения вредоносных файлов на мобильных устройствах
CN105095686B (zh) 基于多核cpu硬件的高通量转录组测序数据质量控制方法
JP5964983B2 (ja) 質量分析法により微生物を特定するための方法
CN114088847B (zh) 基于色谱分析的样品确定方法、装置、存储介质及服务器
JP2014178203A5 (ru)
Awan et al. MS-REDUCE: an ultrafast technique for reduction of big mass spectrometry data for high-throughput processing
RU2014135284A (ru) Управление справочной спектральной информацией и поиск
JP2018049004A5 (ru)
CN110349621B (zh) 肽段-谱图匹配可信度检验方法、系统、存储介质及装置
CN106557668B (zh) 基于lf熵的dna序列相似性检验方法
US20210050071A1 (en) Methods and systems for prediction of a dna profile mixture ratio
CN115616659A (zh) 微地震事件的类型确定方法、装置和电子设备
US11386340B2 (en) Method and apparatus for performing block retrieval on block to be processed of urine sediment image
CN112613263B (zh) 仿真验证方法、装置、电子设备和计算机可读存储介质
WO2017107651A1 (zh) 确定新闻之间相关性、多新闻之间相关性计算方法和装置
CN108388774A (zh) 一种多肽谱匹配数据的在线分析方法
Prasad et al. Assessment of clustering tendency through progressive random sampling and graph-based clustering results
Garg et al. Android malware classification using ensemble classifiers
US20200202982A1 (en) Methods and systems for assessing the presence of allelic dropout using machine learning algorithms
US10025831B2 (en) Adaptive short lists and acceleration of biometric database search
CN112614542B (zh) 一种微生物鉴定方法、装置、设备及存储介质
CN116303473B (zh) 一种数据库的构建方法、装置、设备及可读存储介质