CN111095423A - 编码/解码方法、装置和数据处理装置 - Google Patents

编码/解码方法、装置和数据处理装置 Download PDF

Info

Publication number
CN111095423A
CN111095423A CN201780094012.7A CN201780094012A CN111095423A CN 111095423 A CN111095423 A CN 111095423A CN 201780094012 A CN201780094012 A CN 201780094012A CN 111095423 A CN111095423 A CN 111095423A
Authority
CN
China
Prior art keywords
data
information
nucleic acid
gene database
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201780094012.7A
Other languages
English (en)
Other versions
CN111095423B (zh
Inventor
杨焕明
刘斯奇
汪建
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BGI Shenzhen Co Ltd
Original Assignee
BGI Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BGI Shenzhen Co Ltd filed Critical BGI Shenzhen Co Ltd
Publication of CN111095423A publication Critical patent/CN111095423A/zh
Application granted granted Critical
Publication of CN111095423B publication Critical patent/CN111095423B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/40Encryption of genetic data

Abstract

一种编码/解码方法、装置和数据处理装置,涉及数据处理技术领域。该编码方法包括:对信息进行数字化处理生成序列数据(110);将序列数据划分为N个数据片段(120),N为大于1的整数;针对每个数据片段,在基因数据库中查找相应的核酸片段,并将核酸片段在基因数据库中的位置信息作为每个数据片段的标识(130);根据各个数据片段对应的标识生成序列编码(140)。该方法和装置能够提高加密效率和安全性。

Description

PCT国内申请,说明书已公开。

Claims (36)

  1. PCT国内申请,权利要求书已公开。
CN201780094012.7A 2017-08-25 2017-08-25 编码/解码方法、装置和数据处理装置 Active CN111095423B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2017/099152 WO2019037117A1 (zh) 2017-08-25 2017-08-25 编码/解码方法、装置和数据处理装置

Publications (2)

Publication Number Publication Date
CN111095423A true CN111095423A (zh) 2020-05-01
CN111095423B CN111095423B (zh) 2023-07-21

Family

ID=65439286

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780094012.7A Active CN111095423B (zh) 2017-08-25 2017-08-25 编码/解码方法、装置和数据处理装置

Country Status (2)

Country Link
CN (1) CN111095423B (zh)
WO (1) WO2019037117A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112687338A (zh) * 2020-12-31 2021-04-20 云舟生物科技(广州)有限公司 基因序列的存储和还原方法、计算机存储介质及电子设备
CN113380322A (zh) * 2021-06-25 2021-09-10 倍生生物科技(深圳)有限公司 人工核酸序列水印编码系统、水印字符串及编码和解码方法
CN113782102A (zh) * 2021-08-13 2021-12-10 深圳先进技术研究院 Dna数据的存储方法、装置、设备及可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05324738A (ja) * 1992-05-20 1993-12-07 Fujitsu Ltd 遺伝子データベースの相同性分類方法
CN101420614A (zh) * 2008-11-28 2009-04-29 同济大学 一种混合编码与字典编码整合的图像压缩方法及装置
CN104054316A (zh) * 2011-11-15 2014-09-17 思杰系统有限公司 用于通过网络中的字典压缩短文本的系统和方法
CN105022935A (zh) * 2014-04-22 2015-11-04 中国科学院青岛生物能源与过程研究所 一种利用dna进行信息存储的编码方法和解码方法
CN106506007A (zh) * 2015-09-08 2017-03-15 联发科技(新加坡)私人有限公司 一种无损数据压缩和解压缩装置及其方法
CN106845158A (zh) * 2017-02-17 2017-06-13 苏州泓迅生物科技股份有限公司 一种利用dna进行信息存储的方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006084391A1 (en) * 2005-02-11 2006-08-17 Smartgene Gmbh Computer-implemented method and computer-based system for validating dna sequencing data
CN103114127B (zh) * 2011-11-16 2014-07-16 中国科学院华南植物园 一种基于dna芯片的密码系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05324738A (ja) * 1992-05-20 1993-12-07 Fujitsu Ltd 遺伝子データベースの相同性分類方法
CN101420614A (zh) * 2008-11-28 2009-04-29 同济大学 一种混合编码与字典编码整合的图像压缩方法及装置
CN104054316A (zh) * 2011-11-15 2014-09-17 思杰系统有限公司 用于通过网络中的字典压缩短文本的系统和方法
CN105022935A (zh) * 2014-04-22 2015-11-04 中国科学院青岛生物能源与过程研究所 一种利用dna进行信息存储的编码方法和解码方法
CN106506007A (zh) * 2015-09-08 2017-03-15 联发科技(新加坡)私人有限公司 一种无损数据压缩和解压缩装置及其方法
CN106845158A (zh) * 2017-02-17 2017-06-13 苏州泓迅生物科技股份有限公司 一种利用dna进行信息存储的方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112687338A (zh) * 2020-12-31 2021-04-20 云舟生物科技(广州)有限公司 基因序列的存储和还原方法、计算机存储介质及电子设备
CN112687338B (zh) * 2020-12-31 2022-01-11 云舟生物科技(广州)有限公司 基因序列的存储和还原方法、计算机存储介质及电子设备
CN113380322A (zh) * 2021-06-25 2021-09-10 倍生生物科技(深圳)有限公司 人工核酸序列水印编码系统、水印字符串及编码和解码方法
CN113380322B (zh) * 2021-06-25 2023-10-24 倍生生物科技(深圳)有限公司 人工核酸序列水印编码系统、水印字符串及编码和解码方法
CN113782102A (zh) * 2021-08-13 2021-12-10 深圳先进技术研究院 Dna数据的存储方法、装置、设备及可读存储介质
CN113782102B (zh) * 2021-08-13 2022-12-13 中科碳元(深圳)生物科技有限公司 Dna数据的存储方法、装置、设备及可读存储介质

Also Published As

Publication number Publication date
CN111095423B (zh) 2023-07-21
WO2019037117A1 (zh) 2019-02-28

Similar Documents

Publication Publication Date Title
Terzian et al. PHROG: families of prokaryotic virus proteins clustered using remote homology
CN110603595B (zh) 用于从压缩的基因组序列读段重建基因组参考序列的方法和系统
US8554492B2 (en) Method and apparatus for searching nucleic acid sequence
US9098523B2 (en) Method and apparatus for compressing and decompressing genetic information obtained by using next generation sequencing (NGS)
CN111095423B (zh) 编码/解码方法、装置和数据处理装置
WO2016059610A1 (en) A biomolecule based data storage system
Patro et al. Data-dependent bucketing improves reference-free compression of sequencing reads
EP3509018A1 (en) Method for biologically storing and restoring data
Zhang et al. Light-weight reference-based compression of FASTQ data
Liu et al. High-speed and high-ratio referential genome compression
CN110088839B (zh) 用于生物信息学信息表示的有效数据结构
CN112527736A (zh) 基于dna的数据存储方法、数据恢复方法及终端设备
Al Yami et al. LFastqC: A lossless non-reference-based FASTQ compressor
CN109658981B (zh) 一种单细胞测序的数据分类方法
WO2018151786A1 (en) Method and systems for the reconstruction of genomic reference sequences from compressed genomic sequence reads
Lee et al. Reversible DNA data hiding using multiple difference expansions for DNA authentication and storage
KR20040070438A (ko) Dna 서열 부호화 장치 및 방법
CN111279422B (zh) 编码/解码方法、编码/解码器和存储方法、装置
CN110168649A (zh) 用于生物信息数据的紧凑表示的方法和设备
Kumar et al. WBMFC: Efficient and Secure Storage of Genomic Data.
Sarkar et al. Quark enables semi-reference-based compression of RNA-seq data
Roy et al. An efficient compression algorithm for forthcoming new species
Tripathi et al. Identifying DNA sequence by using stream matching techniques
Jain et al. An information security-based literature survey and classification framework of data storage in DNA
JP7089804B2 (ja) データ作成装置、データ作成方法及びデータ作成プログラムを記憶した記憶媒体

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant