RU2769618C2 - Способ уменьшения вклада технических факторов в суммарный сигнал данных масс-спектрометрии с помощью фильтрации по техническим образцам - Google Patents

Способ уменьшения вклада технических факторов в суммарный сигнал данных масс-спектрометрии с помощью фильтрации по техническим образцам Download PDF

Info

Publication number
RU2769618C2
RU2769618C2 RU2020116352A RU2020116352A RU2769618C2 RU 2769618 C2 RU2769618 C2 RU 2769618C2 RU 2020116352 A RU2020116352 A RU 2020116352A RU 2020116352 A RU2020116352 A RU 2020116352A RU 2769618 C2 RU2769618 C2 RU 2769618C2
Authority
RU
Russia
Prior art keywords
samples
technical
data
biological
lipid
Prior art date
Application number
RU2020116352A
Other languages
English (en)
Other versions
RU2020116352A (ru
RU2020116352A3 (ru
Inventor
Николай Андреевич Аниканов
Анна Алексеевна Ванюшкина
Елена Алексеевна Стекольщикова
Анна Игоревна Ткачева
Филипп Ефимович Хайтович
Original Assignee
ОБЩЕСТВО С ОГРАНИЧЕННОЙ ОТВЕТСТВЕННОСТЬЮ "СберМедИИ"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ОБЩЕСТВО С ОГРАНИЧЕННОЙ ОТВЕТСТВЕННОСТЬЮ "СберМедИИ" filed Critical ОБЩЕСТВО С ОГРАНИЧЕННОЙ ОТВЕТСТВЕННОСТЬЮ "СберМедИИ"
Priority to RU2020116352A priority Critical patent/RU2769618C2/ru
Publication of RU2020116352A publication Critical patent/RU2020116352A/ru
Publication of RU2020116352A3 publication Critical patent/RU2020116352A3/ru
Application granted granted Critical
Publication of RU2769618C2 publication Critical patent/RU2769618C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/72Mass spectrometers
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/40ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis

Landscapes

  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Epidemiology (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

Изобретение относится к области медицины. Предложен компьютерно-реализуемый способ удаления липидных признаков со слабым сигналом. Получают технические образцы, в которых отсутствует биологический сигнал, и биологические образцы, в которых присутствует биологический сигнал. На вычислительном устройстве осуществляют сравнение вышеуказанных образцов, при этом установлен порог 0,5 в логарифмической шкале по основанию два, между средними значениями в технических и биологических образцах. Если по меньшей мере один липидный признак имеет разницу меньше чем 0,5 между средним значением в биологических образцах и в технических образцах, то данный липидный признак удаляют из данных. Изобретение обеспечивает уменьшение влияния технических факторов в данных жидкостной хроматографии с масс-спектрометрией посредством удаления липидных признаков со слабым сигналом. 1 ил.

Description

ОБЛАСТЬ ТЕХНИКИ
Настоящее техническое решение относится к области медицины, в частности, к способу уменьшения вклада технических факторов в суммарный сигнал данных масс-спектрометрии с помощью фильтрации по техническим образцам.
УРОВЕНЬ ТЕХНИКИ
В уровне техники предложены различные методы корректировки смещения сигнала основываясь на информации о принадлежности батчу или порядку загрузки. Например, в работах [1], [2] описываются методы линейной регрессии на номере загрузки или номере экспериментального батча. Работа [3] использует локально взвешенное сглаживание диаграммы рассеяния. Популярный метод ComBat [4], изначально разработанный для данных секвенирования, основывается на эмпирическом байесовском подходе и на данный момент является популярным методом для коррекции сдвига сигнала области масс-спектрометрии.
Несмотря на существование большого количества подходов, до сих пор не ясно, какой из многочисленных методов работает лучше для решения задачи корректировки смещения сигнала.
Описанные выше методы призваны каждый детектированный липидный признак максимально очистить от нежелательных факторов.
Предлагаемый способ позволяет фильтровать (удалять) некоторые признаки с целью избавления от основной части технического шума.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
Технической проблемой, на решение которой направлено заявленное техническое решение, является создание способа уменьшения вклада технических факторов в суммарный сигнал данных масс-спектрометрии с помощью фильтрации по техническим образцам, который охарактеризован в независимом пункте формулы.
Технический результат заключается в уменьшение влияния технических факторов в данных жидкостной хроматографии с масс-спектрометрией, посредством удаления липидных признаков со слабым или отсутствующим сигналом.
Заявленный результат достигается за счет осуществления способа уменьшения вклада технических факторов в суммарный сигнал данных масс-спектрометрии с помощью фильтрации по техническим образцам, содержащий этапы, на которых:
получают технические образцы, в которых отсутствует биологический сигнал, и биологические образцы, в которых присутствует биологический сигнал;
на вычислительном устройстве осуществляют сравнение вышеуказанных образцов, при этом установлен порог 0.5 в логарифмической шкале по основанию два, между средними значениями в технических и биологических образцах;
если по меньшей мере один липидный признак имеет разницу меньше чем 0,5 между средним значением в биологических образцах и в технических образцах, то данный липидный признак удаляют из данных.
ОПИСАНИЕ ЧЕРТЕЖЕЙ
Реализация изобретения будет описана в дальнейшем в соответствии с прилагаемыми чертежами, которые представлены для пояснения сути изобретения и никоим образом не ограничивают область изобретения. К заявке прилагаются следующие чертежи:
Фиг. 1 иллюстрирует пример общей схемы вычислительного устройства.
ДЕТАЛЬНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ
В приведенном ниже подробном описании реализации изобретения приведены многочисленные детали реализации, призванные обеспечить отчетливое понимание настоящего изобретения. Однако, квалифицированному в предметной области специалисту, будет очевидно каким образом можно использовать настоящее изобретение, как с данными деталями реализации, так и без них. В других случаях хорошо известные методы, процедуры и компоненты не были описаны подробно, чтобы не затруднять излишне понимание особенностей настоящего изобретения.
Кроме того, из приведенного изложения будет ясно, что изобретение не ограничивается приведенной реализацией. Многочисленные возможные модификации, изменения, вариации и замены, сохраняющие суть и форму настоящего изобретения, будут очевидными для квалифицированных в предметной области специалистов.
Предлагаемый метод основан на теории, что техническим факторам в большой степени подвержены липидные признаки, которые несут мало биологического сигнала. Под липидными признаками понимается количественное измерение некоторого химического соединения в каждом образце заданного эксперимента. В результате эксперимента жидкостной хроматографии с масс-спектрометрии для каждого образца получается спектр. С сырыми спектрами работать нельзя, для этого существуют специализированные программные обеспечения, которые из набора спектров, соответствующих образцам, производят таблицу с признаками. Таким образом, для каждого образца, вместо спектра имеется набор признаков, которое программное обеспечение нашло в данном спектре. Признак соответствует некоторому химическому соединению, и значение признака - количеству этого соединение в данном образце. В процессе пробоподготовки и данного экспериментального метода получаются липидные соединения.
Технические факторы валяют на липидные признаки следующим образом: например, образцы делятся на две группы по значениям какого-то липидного признака, то есть половина образцов имеет большие значения по этому признаку, а другая половина имеет меньшие значения. Однако это разделение связано не с биологическими факторами, а с техническими, такими, как, например, порядок загрузки образца в масс-спектрометр. То есть для заданного липидного признака, его значения подвержены как биологическим факторам, так и не желательным техническим факторам, а итоговый сигнал складывается как сумма этих факторов.
На первом этапе способа получают технические образцы в которых отсутствует биологический сигнал и биологические образцы в которых присутствует биологический сигнал.
Под биологическими образцами понимаются те образцы, для которых необходимо в процессе эксперимента получить липидные измерения. Это может быть образец мозга, или плазмы кровы и/или другой ткани. Биологический образец противопоставляется техническим образцам - это образцы, которые сами по себе не интересны, но добавляются в эксперимент для вспомогательных функций. Данные технические образцы подготавливаются заранее, они проходят все те же этапы пробоподготовки, что и обычные образцы, однако без добавления биологического материала. Для создания тестовых данных были использованы данные проекта Карты Мозга, и программа XCMS для их первичной обработки.
На вычислительном устройстве осуществляют сравнение вышеуказанных образцов, при этом установлен порог 0.5 в логарифмической шкале по основанию два, между средними значениями в технических и биологических образцах. Если по меньшей мере один липидный признак имеет разницу меньше чем 0,5 между средним значением в биологических образцах и в технических образцах, то данный липидный признак удаляют из данных.
Был проведен сравнительный анализ для данных “карты мозга”, это образцы разных регионов мозга человека и человекоподобных обезьян. Для сравнения работы предложенного способа использовалась популярная программа «ComBat»[4], которая призвана очищать липидные признаки от зашумляющих технических факторов. На данных выхода предложенного способа использовалась наивная коррекция, основанная на среднем значении липидных признаков в одном батче образцов (выравнивание среднего сигнала по батчу). Батч эффект возникает, когда небиологические факторы в эксперименте вызывают изменения в данных, полученных в эксперименте.
В качестве метрики использовалось количество значимых признаков между двумя интересующими группами образцов - образцов из первичной коры и вторичной коры головного мозга данных проекта Карты Мозга. В качестве поправки на множественное тестированное мы использовали поправку Бенджамини-Иекутели, а не более известную поправку Бенджамини-Хохберга в связи с тем, что предположение о неотрицательной взаимосвязи тестов может не выполняться в данных масс-спектрометрии. Из 9089 липидных признаков, которые были детектированы в наших данных, по результатам работы программы «ComBat»[4] было получено 506 значимых признаков после поправки на множественное тестирование. По результатам предложенного способа было получено 633 значимых признаков после поправки на множественное тестирование, что соответствует приросту в 25%. Таким образом, предлагаемый способ позволяет извлечь больше полезного сигнала из данных.
На Фиг. 1 далее будет представлена общая схема вычислительного устройства (100), обеспечивающего обработку данных, необходимую для реализации заявленного решения.
В общем случае устройство (100) содержит такие компоненты, как: один или более процессоров (101), по меньшей мере одну память (102), средство хранения данных (103), интерфейсы ввода/вывода (104), средство В/В (105), средства сетевого взаимодействия (106).
Процессор (101) устройства выполняет основные вычислительные операции, необходимые для функционирования устройства (100) или функциональности одного или более его компонентов. Процессор (101) исполняет необходимые машиночитаемые команды, содержащиеся в оперативной памяти (102).
Память (102), как правило, выполнена в виде ОЗУ и содержит необходимую программную логику, обеспечивающую требуемый функционал.
Средство хранения данных (103) может выполняться в виде HDD, SSD дисков, рейд массива, сетевого хранилища, флэш-памяти, оптических накопителей информации (CD, DVD, MD, Blue-Ray дисков) и т.п. Средство (103) позволяет выполнять долгосрочное хранение различного вида информации, например, вышеупомянутых файлов с наборами данных пользователей, базы данных, содержащих записи измеренных для каждого пользователя временных интервалов, идентификаторов пользователей и т.п.
Интерфейсы (104) представляют собой стандартные средства для подключения и работы с серверной частью, например, USB, RS232, RJ45, LPT, COM, HDMI, PS/2, Lightning, FireWire и т.п.
Выбор интерфейсов (104) зависит от конкретного исполнения устройства (N00), которое может представлять собой персональный компьютер, мейнфрейм, серверный кластер, тонкий клиент, смартфон, ноутбук и т.п.
В качестве средств В/В данных (105) в любом воплощении системы, реализующей описываемый способ, должна использоваться клавиатура. Аппаратное исполнение клавиатуры может быть любым известным: это может быть, как встроенная клавиатура, используемая на ноутбуке или нетбуке, так и обособленное устройство, подключенное к настольному компьютеру, серверу или иному компьютерному устройству. Подключение при этом может быть, как проводным, при котором соединительный кабель клавиатуры подключен к порту PS/2 или USB, расположенному на системном блоке настольного компьютера, так и беспроводным, при котором клавиатура осуществляет обмен данными по каналу беспроводной связи, например, радиоканалу, с базовой станцией, которая, в свою очередь, непосредственно подключена к системному блоку, например, к одному из USB-портов. Помимо клавиатуры, в составе средств В/В данных также может использоваться: джойстик, дисплей (сенсорный дисплей), проектор, тачпад, манипулятор мышь, трекбол, световое перо, динамики, микрофон и т.п.
Средства сетевого взаимодействия (106) выбираются из устройства, обеспечивающий сетевой прием и передачу данных, например, Ethernet карту, WLAN/Wi-Fi модуль, Bluetooth модуль, BLE модуль, NFC модуль, IrDa, RFID модуль, GSM модем и т.п. С помощью средств (105) обеспечивается организация обмена данными по проводному или беспроводному каналу передачи данных, например, WAN, PAN, ЛВС (LAN), Интранет, Интернет, WLAN, WMAN или GSM.
Компоненты устройства (100) сопряжены посредством общей шины передачи данных (110).
В настоящих материалах заявки было представлено предпочтительное раскрытие осуществление заявленного технического решения, которое не должно использоваться как ограничивающее иные, частные воплощения его реализации, которые не выходят за рамки испрашиваемого объема правовой охраны и являются очевидными для специалистов в соответствующей области техники.
Источники информации
[1] Kuligowski J, Pérez-Guaita D, Lliso I, Escobar J, León Z, Gombau L, Solberg R, Saugstad OD, Vento M, Quintás G. Detection of batch effects in liquid chromatography-mass spectrometry metabolomic data using guided principal component analysis. Talanta. 2014 Dec;130:442-8. doi:10.1016/j.talanta.2014.07.031. Epub 2014 Jul 18. PubMed PMID: 25159433.
[2] San-Yuan Wang, Ching-Hua Kuo, and Yufeng J. Tseng. Batch Normalizer: A Fast Total Abundance Regression Calibration Method to Simultaneously Adjust Batch and Injection Order Effects in Liquid Chromatography/Time-of-Flight Mass Spectrometry-Based Metabolomics Data and Comparison with Current Calibration Methods. Analytical Chemistry 2013 85 (2), 1037-1046.
[3] Fernández-Albert F, Llorach R, Garcia-Aloy M, Ziyatdinov A, Andres-Lacueva C, Perera A. Intensity drift removal in LC/MS metabolomics by common variance compensation. Bioinformatics. 2014 Oct 15;30(20):2899-905. doi: 10.1093/bioinformatics/btu423. Epub 2014 Jul 2. PubMed PMID: 24990606.
[4] Leek, J. T., Johnson, W. E., Parker, H. S., Jaffe, A. E., & Storey, J. D. (2012). The sva package for removing batch effects and other unwanted variation in high-throughput experiments. Bioinformatics, 28(6), 882-883. http://doi.org/10.1093/bioinformatics/bts034.

Claims (4)

  1. Компьютерно-реализуемый способ удаления липидных признаков со слабым сигналом, содержащий этапы, на которых:
  2. получают технические образцы, в которых отсутствует биологический сигнал, и биологические образцы, в которых присутствует биологический сигнал;
  3. на вычислительном устройстве осуществляют сравнение вышеуказанных образцов, при этом установлен порог 0,5 в логарифмической шкале по основанию два, между средними значениями в технических и биологических образцах;
  4. если по меньшей мере один липидный признак имеет разницу меньше чем 0,5 между средним значением в биологических образцах и в технических образцах, то данный липидный признак удаляют из данных.
RU2020116352A 2020-05-18 2020-05-18 Способ уменьшения вклада технических факторов в суммарный сигнал данных масс-спектрометрии с помощью фильтрации по техническим образцам RU2769618C2 (ru)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2020116352A RU2769618C2 (ru) 2020-05-18 2020-05-18 Способ уменьшения вклада технических факторов в суммарный сигнал данных масс-спектрометрии с помощью фильтрации по техническим образцам

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2020116352A RU2769618C2 (ru) 2020-05-18 2020-05-18 Способ уменьшения вклада технических факторов в суммарный сигнал данных масс-спектрометрии с помощью фильтрации по техническим образцам

Publications (3)

Publication Number Publication Date
RU2020116352A RU2020116352A (ru) 2021-11-18
RU2020116352A3 RU2020116352A3 (ru) 2021-11-18
RU2769618C2 true RU2769618C2 (ru) 2022-04-04

Family

ID=78595638

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2020116352A RU2769618C2 (ru) 2020-05-18 2020-05-18 Способ уменьшения вклада технических факторов в суммарный сигнал данных масс-спектрометрии с помощью фильтрации по техническим образцам

Country Status (1)

Country Link
RU (1) RU2769618C2 (ru)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2464649C1 (ru) * 2011-06-01 2012-10-20 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." Способ обработки звукового сигнала

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2464649C1 (ru) * 2011-06-01 2012-10-20 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." Способ обработки звукового сигнала

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
PARASURAMAN S. et al. An Overview of Liquid Chromatography-Mass Spectroscopy Instrumentation. Pharmaceutical Methods. 2014; 5(2): 47-55. *
STANSTRUP J. et al. The metaRbolomics Toolbox in Bioconductor and beyond. Metabolites. 2019; 9(10): 200. MOCO S. et al. A Liquid Chromatography-Mass Spectrometry-Based Metabolome Database for Tomato. Plant physiology. 2006. 141: 1205-18. *
ЛОХОВ П.Г. и др. Масс-спектрометрический анализ липидома плазмы крови, как способ диагностики заболеваний, оценки эффективности и оптимизации лекарственной терапии. Биомедицинская химия. 2015; том 61, вып.1, с.7-18. *
ЛОХОВ П.Г. и др. Масс-спектрометрический анализ липидома плазмы крови, как способ диагностики заболеваний, оценки эффективности и оптимизации лекарственной терапии. Биомедицинская химия. 2015; том 61, вып.1, с.7-18. РОККА П. Калибровка параметров генетического алгоритма для задач проектирования фазированных антенных решеток. Электротехнические и информационные комплексы и системы. 2013; 3: 89-92. STANSTRUP J. et al. The metaRbolomics Toolbox in Bioconductor and beyond. Metabolites. 2019; 9(10): 200. MOCO S. et al. A Liquid Chromatography-Mass Spectrometry-Based Metabolome Database for Tomato. Plant physiology. 2006. 141: 1205-18. PARASURAMAN S. et al. An Overview of Liquid Chromatography-Mass Spectroscopy Instrumentation. Pharmaceutical Methods. 2014; 5(2): 47-55. *
РОККА П. Калибровка параметров генетического алгоритма для задач проектирования фазированных антенных решеток. Электротехнические и информационные комплексы и системы. 2013; 3: 89-92. *

Also Published As

Publication number Publication date
RU2020116352A (ru) 2021-11-18
RU2020116352A3 (ru) 2021-11-18

Similar Documents

Publication Publication Date Title
Searle et al. Chromatogram libraries improve peptide detection and quantification by data independent acquisition mass spectrometry
Searle et al. Generating high quality libraries for DIA MS with empirically corrected peptide predictions
Broadhurst et al. Guidelines and considerations for the use of system suitability and quality control samples in mass spectrometry assays applied in untargeted clinical metabolomic studies
Rosenberger et al. Statistical control of peptide and protein error rates in large-scale targeted data-independent acquisition analyses
Tabb Quality assessment for clinical proteomics
Parsons et al. Tile-based Fisher ratio analysis of comprehensive two-dimensional gas chromatography time-of-flight mass spectrometry (GC× GC–TOFMS) data using a null distribution approach
DK2834835T3 (en) METHOD AND DEVICE FOR IMPROVED QUANTIFICATION BY MASS SPECTROMETRY
Godzien et al. From numbers to a biological sense: H ow the strategy chosen for metabolomics data treatment may affect final results. A practical example based on urine fingerprints obtained by LC‐MS
Yu et al. Hybrid feature detection and information accumulation using high-resolution LC–MS metabolomics data
Jones et al. A nano ultra-performance liquid chromatography–high resolution mass spectrometry approach for global metabolomic profiling and case study on drug-resistant multiple myeloma
Röst et al. Automated SWATH data analysis using targeted extraction of ion chromatograms
Tengstrand et al. TracMass 2 A Modular Suite of Tools for Processing Chromatography-Full Scan Mass Spectrometry Data
McDonnell et al. Mass spectrometry image correlation: quantifying colocalization
O’Connor et al. LipidFinder: a computational workflow for discovery of lipids identifies eicosanoid-phosphoinositides in platelets
Guo et al. DaDIA: Hybridizing data-dependent and data-independent acquisition modes for generating high-quality metabolomic data
Zeng et al. Ion fusion of high-resolution LC–MS-based metabolomics data to discover more reliable biomarkers
JP2005308741A (ja) 少なくとも1つの成分および生成する生成物の観点でサンプルを特性付けし、特性付けデータを提供するための2つ以上の技術に基づいた少なくとも1つのサンプルの分析;方法、システムおよび指示プログラム
Meister et al. High-precision automated workflow for urinary untargeted metabolomic epidemiology
Awan et al. MS-REDUCE: an ultrafast technique for reduction of big mass spectrometry data for high-throughput processing
Cook et al. Analysis of liquid chromatography–mass spectrometry data with an elastic net multivariate curve resolution strategy for sparse spectral recovery
Shteynberg et al. reSpect: software for identification of high and low abundance ion species in chimeric tandem mass spectra
LAZAR et al. Bioinformatics Tools for Metabolomic Data Processing and Analysis Using Untargeted Liquid Chromatography Coupled With Mass Spectrometry.
Bittremieux et al. The Human Proteome Organization–Proteomics Standards Initiative Quality Control Working Group: Making Quality Control More Accessible for Biological Mass Spectrometry
Bowling et al. Analyzing the metabolome
Fan et al. Fully automatic resolution of untargeted GC-MS data with deep learning assistance