RU2017122194A - Защищенная передача геномных данных - Google Patents

Защищенная передача геномных данных Download PDF

Info

Publication number
RU2017122194A
RU2017122194A RU2017122194A RU2017122194A RU2017122194A RU 2017122194 A RU2017122194 A RU 2017122194A RU 2017122194 A RU2017122194 A RU 2017122194A RU 2017122194 A RU2017122194 A RU 2017122194A RU 2017122194 A RU2017122194 A RU 2017122194A
Authority
RU
Russia
Prior art keywords
vcf file
data
file
vcf
annotated
Prior art date
Application number
RU2017122194A
Other languages
English (en)
Other versions
RU2753245C2 (ru
RU2017122194A3 (ru
Inventor
Вартика АГРАВАЛ
Невенка ДИМИТРОВА
Реймонд Дж. КРАСИНСКИ
Original Assignee
Конинклейке Филипс Н.В.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Конинклейке Филипс Н.В. filed Critical Конинклейке Филипс Н.В.
Publication of RU2017122194A publication Critical patent/RU2017122194A/ru
Publication of RU2017122194A3 publication Critical patent/RU2017122194A3/ru
Application granted granted Critical
Publication of RU2753245C2 publication Critical patent/RU2753245C2/ru

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/606Protecting data by securing the transmission between two devices or processes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/40Encryption of genetic data
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/50Compression of genetic data
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3059Digital compression and data reduction techniques where the original information is represented by a subset or similar information, e.g. lossy compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/04Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks
    • H04L63/0428Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks wherein the data content is protected, e.g. by encrypting or encapsulating the payload
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records

Claims (29)

1. Система для преобразования данных, полученных путем секвенирования из генома и обработанных с получением файла определения варианта (VCF), содержащая
первый модуль обработки, содержащий компьютерный процессор и компьютерочитаемый материальный носитель и выполненный с возможностью:
сжимать файл VCF до аннотированного файла VCF, который содержит первоначально неизбыточные данные варианта из файла VCF, на основе справочных данных;
кодировать аннотированный файл VCF;
сохранять кодированный файл VCF; и
второй модуль обработки, содержащий компьютерный процессор и компьютерочитаемый материальный носитель и выполненный с возможностью:
принимать кодированный файл VCF и
заполнять кодированный файл VCF с использованием справочных данных.
2. Система по п. 1, в которой справочные данные включают данные эталонного и альтернативного аллеля из базы данных коротких геномных вариаций (SNP).
3. Система по п. 1, в которой кодирование аннотированного файла VCF включает преобразование данных номера хромосомы и положения хромосом аннотированного файла VCF с использованием математической системы координат.
4. Реализуемый на компьютере способ преобразования данных, секвенированных из генома пациента и обработанных с получением файла определения варианта (VCF), включающий :
обеспечение наличия компьютерного процессора, выполненного с возможностью:
сжатия файла VCF до аннотированного файла VCF, который содержит первоначально неизбыточные данные варианта из файла VCF;
кодирования аннотированного файла VCF и
сохранения кодированного файла VCF на компьютерочитаемом материальном носителе.
5. Способ по п. 4, в котором сжатие файла VCF включает удаление определений вариантов, в которых связанные с качеством данные не соответствуют заданному пороговому значению.
6. Способ по п. 4, в котором сжатие файла VCF включает удаление известных вариантов с использованием данных из справочной базы данных коротких геномных вариаций (SNP).
7. Способ по п. 6, в котором известные варианты содержат информацию об эталонном и/или альтернативном аллеле.
8. Способ по п. 4, в котором кодирование аннотированного файла VCF включает преобразование данных номера хромосом и положения хромосом аннотированного файла VCF с использованием математической системы координат.
9. Способ по п. 8, в котором преобразование данных номера хромосом и положения хромосом аннотированного файла VCF с использованием математической системы координат включает преобразование данных номера хромосом и положения хромосом аннотированного файла VCF в системе циклических координат на основе значения модуля.
10. Способ по п. 9, дополнительно включающий шифрование значения модуля и инициирование передачи шифрованного значения модуля и закодированного файла VCF во второй терминал через сетевое подключение.
11. Способ по п. 8, в котором кодирование аннотированного файла VCF включает преобразование данных номера хромосом и положения хромосом аннотированного файла VCF с использованием прямоугольных координат, полярных координат или линейных координат.
12. Способ по п. 8, дополнительно включающий применение преобразования частотной области к аннотированному файлу VCF перед кодированием аннотированного файла VCF.
13. Способ по п. 4, дополнительно включающий передачу кодированного файла VCF во второй терминал через сетевое подключение.
14. Реализуемый на компьютере способ преобразования данных, секвенированных из генома пациента и преобразованных в файл определения варианта (VCF), включающий
обеспечение наличия компьютерного процессора, выполненного с возможностью:
приема файла VCF, кодированного с использованием математической системы координат, и
заполнения кодированного файла VCF данными эталонного и альтернативного аллеля с использованием данных справочной базы данных коротких геномных вариаций (SNP).
15. Способ по п. 14, дополнительно включающий декодирование кодированного файла VCF с использованием значения модуля.
RU2017122194A 2014-11-25 2015-11-18 Защищенная передача геномных данных RU2753245C2 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201462084146P 2014-11-25 2014-11-25
US62/084,146 2014-11-25
PCT/IB2015/058912 WO2016083949A1 (en) 2014-11-25 2015-11-18 Secure transmission of genomic data

Publications (3)

Publication Number Publication Date
RU2017122194A true RU2017122194A (ru) 2018-12-26
RU2017122194A3 RU2017122194A3 (ru) 2019-12-06
RU2753245C2 RU2753245C2 (ru) 2021-08-12

Family

ID=55022623

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2017122194A RU2753245C2 (ru) 2014-11-25 2015-11-18 Защищенная передача геномных данных

Country Status (6)

Country Link
US (1) US10957420B2 (ru)
EP (1) EP3224752B1 (ru)
JP (1) JP6788587B2 (ru)
CN (1) CN107004068B (ru)
RU (1) RU2753245C2 (ru)
WO (1) WO2016083949A1 (ru)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10395759B2 (en) 2015-05-18 2019-08-27 Regeneron Pharmaceuticals, Inc. Methods and systems for copy number variant detection
EP3526712B1 (en) * 2016-10-11 2021-03-24 Genomsys SA Method and system for the transmission of bioinformatics data
US20180314842A1 (en) * 2017-04-27 2018-11-01 Awakens, Inc. Computing system with genomic information access mechanism and method of operation thereof
CN108563923B (zh) * 2017-12-05 2020-08-18 华南理工大学 一种基因变异数据分布式存储方法及系统
CN109192245A (zh) * 2018-07-26 2019-01-11 中山大学 基因变异数据的GDS-Huffman压缩方法
JPWO2020158842A1 (ru) * 2019-02-01 2020-08-06
EP3792923A1 (en) * 2019-09-16 2021-03-17 Siemens Healthcare GmbH Method and device for exchanging information regarding the clinical implications of genomic variations
US11562057B2 (en) 2020-02-05 2023-01-24 Quantum Digital Solutions Corporation Ecosystem security platforms for enabling data exchange between members of a digital ecosystem using digital genomic data sets
JP2024507719A (ja) 2021-02-04 2024-02-21 クアンタム デジタル ソリューションズ コーポレーション サイファージェニクスベースのエコシステムセキュリティプラットフォーム
JP2023014547A (ja) * 2021-07-19 2023-01-31 国立研究開発法人情報通信研究機構 ゲノムデータ用個人情報保護管理システム

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7391816B2 (en) 2003-09-17 2008-06-24 Intel Corporation Decoding upstream V.92-encoded signals
RU2419137C2 (ru) * 2006-02-13 2011-05-20 иПостал Сервисез, Инк. Система и способ передачи документов и управления документооборотом
WO2010127045A2 (en) * 2009-04-29 2010-11-04 Complete Genomics, Inc. Method and system for calling variations in a sample polynucleotide sequence with respect to a reference polynucleotide sequence
US20110288785A1 (en) 2010-05-18 2011-11-24 Translational Genomics Research Institute (Tgen) Compression of genomic base and annotation data
CN101914628B (zh) * 2010-09-02 2013-01-09 深圳华大基因科技有限公司 检测基因组目标区域多态性位点的方法
US20120102054A1 (en) 2010-10-25 2012-04-26 Life Technologies Corporation Systems and Methods for Annotating Biomolecule Data
US20140040264A1 (en) 2011-02-04 2014-02-06 Hgh Tech Campus Method for estimation of information flow in biological networks
US20130246460A1 (en) 2011-03-09 2013-09-19 Annai Systems, Inc. System and method for facilitating network-based transactions involving sequence data
US8982879B2 (en) 2011-03-09 2015-03-17 Annai Systems Inc. Biological data networks and methods therefor
CA2841808A1 (en) 2011-07-13 2013-01-17 The Multiple Myeloma Research Foundation, Inc. Methods for data collection and distribution
EP2761518A4 (en) 2011-09-27 2016-01-27 Lawrence Ganeshalingam SYSTEM AND METHOD FOR FACILITATING NETWORK BASED TRANSACTIONS AND INVOLVING SEQUENTIAL DATA
EP3514798A1 (en) 2011-10-31 2019-07-24 The Scripps Research Institute Systems and methods for genomic annotation and distributed variant interpretation
US20130245958A1 (en) * 2012-03-15 2013-09-19 Siemens Aktiengesellschaft Accurate comparison and validation of single nucleotide variants
GB202020510D0 (en) * 2013-01-17 2021-02-03 Edico Genome Corp Bioinformatics systems, apparatuses, and methods executed on an integrated circuit processing platform
US20140278461A1 (en) * 2013-03-15 2014-09-18 Memorial Sloan-Kettering Cancer Center System and method for integrating a medical sequencing apparatus and laboratory system into a medical facility

Also Published As

Publication number Publication date
CN107004068A (zh) 2017-08-01
JP6788587B2 (ja) 2020-11-25
RU2753245C2 (ru) 2021-08-12
US10957420B2 (en) 2021-03-23
CN107004068B (zh) 2021-08-24
JP2018503167A (ja) 2018-02-01
EP3224752B1 (en) 2022-07-13
RU2017122194A3 (ru) 2019-12-06
WO2016083949A1 (en) 2016-06-02
EP3224752A1 (en) 2017-10-04
US20170262579A1 (en) 2017-09-14

Similar Documents

Publication Publication Date Title
RU2017122194A (ru) Защищенная передача геномных данных
PH12019500407A1 (en) Calculating individual carbon footprints
JP2016528796A5 (ru)
PH12017501435A1 (en) Methods and systems for pushing orders
RU2017145307A (ru) Кодирование коэффициентов преобразования
NZ733863A (en) Systems and methods for providing information for an on-demand service
MX2018008115A (es) Transmision de identificacion digital del vehiculo a bordo.
MY177309A (en) Information processing apparatus and method
JP2015516745A5 (ru)
RU2017120495A (ru) Способ и устройство для полярного кодирования
WO2014107519A3 (en) Compression and deduplication layered driver
JP2015526969A5 (ru)
HK1166162A1 (en) Method and apparatus for ordering search results
RU2015107824A (ru) Способ и устройство кодирования изображений
SG10201804753UA (en) Authentication Methods and Systems
JP2014532193A5 (ru)
JP2017538987A5 (ru)
RU2014150558A (ru) Способ кодирования изображения, способ декодирования изображения, устройство кодирования изображения, устройство декодирования изображения и устройство кодирования и декодирования изображения
RU2015102098A (ru) Способ кодирования текучего блока первого компонента изображения относительно контрольного блока по меньшей мере одного второго компонента изображения, устройство кодирования и соответствующая компьтерная программа
JP2016517588A5 (ru)
GB2550081A (en) Secure file transfer
BR112017013447A2 (pt) método e aparelho de transmissão de informação de indicação.
PH12021550655A1 (en) Image processing device and method
RU2016121867A (ru) Алгоритмы сжатия для передачи сообщений по шине транспортного средства с данными предварительного представления
SG11201906107QA (en) Data processing method, and terminal device, and network device