TWI828700B - 用於存取使用雙鏈核酸分子設置的資料存儲的方法、電腦可讀取程式和資料結構 - Google Patents

用於存取使用雙鏈核酸分子設置的資料存儲的方法、電腦可讀取程式和資料結構 Download PDF

Info

Publication number
TWI828700B
TWI828700B TW108119665A TW108119665A TWI828700B TW I828700 B TWI828700 B TW I828700B TW 108119665 A TW108119665 A TW 108119665A TW 108119665 A TW108119665 A TW 108119665A TW I828700 B TWI828700 B TW I828700B
Authority
TW
Taiwan
Prior art keywords
nucleic acid
stranded nucleic
sites
double
address
Prior art date
Application number
TW108119665A
Other languages
English (en)
Other versions
TW202008381A (zh
Inventor
馬修詹姆士 海斯
拉寇兒瑪麗亞 桑切斯古柏
Original Assignee
英商伊門勒汀斯有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 英商伊門勒汀斯有限公司 filed Critical 英商伊門勒汀斯有限公司
Publication of TW202008381A publication Critical patent/TW202008381A/zh
Application granted granted Critical
Publication of TWI828700B publication Critical patent/TWI828700B/zh

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C13/00Digital stores characterised by the use of storage elements not covered by groups G11C11/00, G11C23/00, or G11C25/00
    • G11C13/0002Digital stores characterised by the use of storage elements not covered by groups G11C11/00, G11C23/00, or G11C25/00 using resistive RAM [RRAM] elements
    • G11C13/0009RRAM elements whose operation depends upon chemical change
    • G11C13/0014RRAM elements whose operation depends upon chemical change comprising cells based on organic memory material
    • G11C13/0019RRAM elements whose operation depends upon chemical change comprising cells based on organic memory material comprising bio-molecules
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/20Heterogeneous data integration
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01LCHEMICAL OR PHYSICAL LABORATORY APPARATUS FOR GENERAL USE
    • B01L7/00Heating or cooling apparatus; Heat insulating devices
    • B01L7/52Heating or cooling apparatus; Heat insulating devices with provision for submitting samples to a predetermined sequence of different temperatures, e.g. for treating nucleic acid samples
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B82NANOTECHNOLOGY
    • B82YSPECIFIC USES OR APPLICATIONS OF NANOSTRUCTURES; MEASUREMENT OR ANALYSIS OF NANOSTRUCTURES; MANUFACTURE OR TREATMENT OF NANOSTRUCTURES
    • B82Y10/00Nanotechnology for information processing, storage or transmission, e.g. quantum computing or single electron logic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/002Biomolecular computers, i.e. using biomolecules, proteins, cells
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/123DNA computing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C11/00Digital stores characterised by the use of particular electric or magnetic storage elements; Storage elements therefor
    • G11C11/54Digital stores characterised by the use of particular electric or magnetic storage elements; Storage elements therefor using elements simulating biological cells, e.g. neuron
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C25/00Digital stores characterised by the use of flowing media; Storage elements therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Mathematical Physics (AREA)
  • Biochemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Genetics & Genomics (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Databases & Information Systems (AREA)
  • Bioethics (AREA)
  • Medical Informatics (AREA)
  • Microbiology (AREA)
  • Clinical Laboratory Science (AREA)
  • Computer Hardware Design (AREA)
  • Neurology (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)

Abstract

使用在熱控制裝置52上設置的雙鏈核酸分子70來提供資料存儲,該熱控制裝置52包括複數個位點54和溫度控制電路56,以獨立地控制複數個位點中的每一者的溫度。溫度控制電路56控制位點溫度以在靶位點處提供與複數位點中的其他位點相比之不同的溫度。與其他位點相比,靶位點和其他位點的不同溫度提供了更大之作用於靶位點上的讀取或寫入操作的機率。基於溫度的定址有助於提高實體存儲密度。

Description

用於存取使用雙鏈核酸分子設置的資料存儲的方法、電腦可 讀取程式和資料結構
本技術與使用雙鏈核酸分子設置的資料存儲領域相關。
可用形成如DNA、RNA或XNA的核酸分子的鹼基對的序列來編碼資訊。可在工廠或實驗室中從頭合成所需的序列,以產生代表待編碼資料的分子。例如,對於DNA分子來說,序列中的每個鹼基是四種可能的選擇(腺嘌呤、胞嘧啶、鳥嘌呤或胸腺嘧啶)中之一者,因此每個鹼基可編碼兩個位元的資訊。因實體密度非常高,故基於核酸的資料存儲是一種有吸引力的選擇。密度比基於磁帶的存儲高三到四個數量級,一個艾位元組資料中心原則上可縮小到一個針頭的大小。
至少一些實例提供了一種用於存取資料存儲的方法,該資料存儲係使用在包括複數個位點和溫度控制電路的熱控制裝置上提供的雙鏈核酸分子以獨立地控制複數個位點中的每個位點的溫度來設置的,該方法包括以下步驟:使用溫度控制電路來控制複數個位點的溫度,以提供與複數個位點中的其他位點相比在靶位點處的一不同溫度;及執行讀取操作以從靶位點處的一或多個選定的雙鏈核酸分子讀取資料,或執行寫入操作以形成在靶位點處用資料編碼的一或多個新的雙鏈核酸分子,其中,在靶位點和其他位點處的不同溫度提供了更大的讀取或寫入操作作用於靶位點的機率(與其他位點相比)。
至少一些實例提供了電腦可讀取程式或資料結構,其包括用於控制設備執行上述方法的指令或控制資料。
程式或資料結構可存儲在記錄媒體上。記錄媒體可以是非暫態記錄媒體。
發明人認識到,儘管理論上基於核酸的資料存儲可提供極高存儲密度的前景,但實際上,用於解決代表經編碼資料集之核酸分子庫內的選定核酸分子的現有方案還不能實現此種高密度。當合成具有所需序列的核酸分子時所引起的摻入錯誤的機率隨著序列的長度而增加,因此實際上可被合成的核酸分子的長度可能是有限的(即使錯誤校正碼或其他錯誤檢測技術用於在資訊序列內包括一些冗餘以允許檢測這種結合錯誤)。這意味著為了使用核酸分子來表示合理大小的資料集,實際上將提供具有不同編碼的不同核酸分子庫,該等不同核酸分子一起代表整個資料集。存取此種分子庫需要能夠從分子庫中單獨選擇特定的核酸分子以讀取那些核酸分子中的資料,而不會意外地從意欲讀取的部分讀取到分子庫中代表資料集的不同部分的其他核酸分子。
可能使用如PCR的擴增方法,以選擇性地提取和擴增雙鏈核酸分子,該等雙鏈核酸分子具有與引物序列所代表的所需模式匹配的部分序列。可提供對應於要被存取的不同位址的不同引物,以區分資料集的不同部分。然而,可被維持的獨特引物的數量可限於一定數量,且這限制了可被維持的資料集的大小。因此,當需要對高於特定大小的資料集進行編碼時,通常需要保持許多實體上分離的流體體積,使得表示資料集的不同部分的分子可在不同的實體井中設置有相同的位址部分,使得相同的引物可在不同的井中重複使用。實際上,將資料集的不同部分實體分離到這些實體上分離的井中需要額外的空間,這極大地增加了存儲庫的整體大小。因此,這會降低使用核酸分子進行資料存儲的優勢。這可能使得基於核酸的資料存儲難以產生顯著的密度改善(與使用(例如)磁帶或固態存儲器的當前資料存儲方法相較下)。
在下文論述的技術中,雙鏈核酸分子設置在熱控制裝置上,該熱控制裝置具有許多位點,在該等許多位點處可設置有核酸分子。熱控制裝置包括溫度控制電路,該溫度控制電路用於獨立地控制熱控制裝置的每個位點的溫度。因此,溫度控制電路可將一個位點設置為與另一個位點不同的溫度。
當要存取資料存儲器以進行讀取操作或寫入操作時(該讀取操作係讀取來自在熱控制裝置的靶位點處的所選雙鏈核酸分子的資料及該寫入操作係形成一或多個以在靶位點處的資料編碼之新的雙鏈核酸分子),溫度控制電路用於控制熱控制裝置的位點的溫度,以在靶位點處提供不同溫度(相較於熱控制裝置的其他位點)。與其他位點相比,靶位點和其他位點的不同溫度提供了更大之讀取或寫入操作作用於靶位點的機率。
藉由使用溫度來控制熱控制裝置的哪些位點經受讀取操作或寫入操作,則即使不同的位點包括無法由讀取操作或寫入操作區分的雙鏈核酸分子(若兩個位點皆設成相同溫度),靶位點的不同溫度(與其他位點相比)意味著與其他位點相比,讀取或寫入操作更有可能作用於靶位點,從而提供對基於核酸的存儲裝置之存取的選擇性。這意味著沒有必要為每個位點提供實體上獨立的流體體積。因此,基於溫度的定址方案所提供的隨機存取提供了比其他方法可能提供之定量的存儲區域和引物數量要詢問的資訊量更大的資訊量。這使得存儲密度得以改善。
熱控制裝置的複數個位點可位於共用流體井的相應部分處,而沒有實體屏障阻止流體在相鄰位點之間通過。因此,當引入流體以執行讀取或寫入操作時,不必防止提供到靶位點以外的位點的流體被讀取或寫入。讀取或寫入操作可包括使流體流過包括靶位點的複數個位點中的至少兩個位點。藉由消除將用來執行讀取或寫入操作的流體與除靶位點之外的非選定位點實體地分離的需要,這使得能夠極大地改善裝置的存儲密度。例如,不再需要包括在每個井之間之具有屏障的實體分離的井,且也不需要包括用於選擇性地將流體引導到獨立位點上的機械結構。還有(例如)包括每個位點的整個熱控制裝置可位於單個共用流體井內,且流體可簡單地通過所有位點,基於溫度的定址提供更大之影響靶位點(與其他位點相比)的讀取或寫入操作的機率,以提供隨機存取核酸分子庫。
可將每個雙鏈核酸分子編碼為包括至少資料部分和位址部分。資料部分可代表在雙鏈核酸分子內編碼的實際資訊。位址部分可表示在讀取操作中使用的序列,以識別具有不同位址部分的多個不同分子中的哪一個對應於感興趣的資料集的靶部分。在一些情況下,雙鏈核酸分子亦可包括其他部分。例如,為了防止在合成雙鏈核酸分子期間引入摻入錯誤的風險,分子亦可包括錯誤校正部分,該錯誤校正部分提供錯誤校正碼,該錯誤校正碼提供一些冗餘以實現資料中的錯誤或要識別的錯誤校正碼。錯誤校正碼可為僅能夠檢測錯誤但不允許僅從錯誤分子中的序列恢復正確的資料值的錯誤檢測碼或可為能進行錯誤檢測且校正兩者以便可從資料部分和錯誤校正部分的組合中恢復原始值的錯誤校正碼。可使用任何已知類型的錯誤校正碼,例如Reed –Solomon碼。在一些實施方式中,資料及其錯誤校正值皆可聯合編碼成單個鹼基序列(而不是包括分別映射到資料和錯誤校正碼的單獨序列)。
可進行雙鏈核酸分子至熱控制裝置的不同位點的分配,使得在熱控制裝置的不同位點處提供具有不同資料部分但具有相同位址部分的雙鏈核酸分子。另一方面,位於給定位點之具有不同資料部分的雙鏈核酸分子亦具有不同的位址部分。藉由確保用不同資料編碼的分子具有不同的位址部分(若該等分子共享熱控制裝置的相同位點),則這使得能夠在讀取操作期間使用引物及/或測序來區分這些分子。然而,藉由使不同編碼的分子共享在熱控制裝置的不同位點處所提供的相同位址部分,可在讀取操作中在不同位點處重複使用相同的引物,使得能夠在單個共用流體井中表示的資料集的大小能夠針對可用的固定數量的引物增加,因溫度控制可用於區分在共享相同位址部分的不同位點處的哪些分子是意欲讀取的。
可用不同方式獲得存儲在熱控制裝置上的雙鏈核酸分子。在一些情況下,可使用任何已知的核酸合成技術與熱控制裝置本身分開來合成對應於意欲存儲的每個雙鏈分子的單鏈核酸分子,且接著稍後在寫入操作期間可引入到熱控制裝置上,如將在下文中更詳細地論述。或者,核酸分子可在熱控制裝置本身上生長。因此,任何用於合成核酸分子的已知技術可用於產生編碼資料所需的核酸序列。上文論述的技術提供了用於定址代表編碼資料集的核酸庫的獨立分子的手段(不論最初創建這些分子的方式如何)。
當執行讀取操作時,溫度控制可包括以下操作:在讀取操作的至少一部分期間將靶位點設定為比熱控制裝置的其他位點更高的溫度。與熱控制裝置的其他位點相比,這提供了雙鏈核酸分子在靶位點處分離成單鏈核酸分子的更大機率。這意味著作用於單鏈核酸分子的擴增技術比其他位點處的分子更可能擴增靶位點處的分子。
經分離的單鏈核酸分子可暴露於擴增混合物,該擴增混合物包含至少一種用於擴增單鏈核酸分子的引物,該單鏈核酸分子已從具有至少部分匹配靶位址部分的位址部分的雙鏈核酸分子中分離。靶位址部分可為所欲讀取的雙鏈核酸分子中的位址部分。接著可對由擴增混合物所擴增的經擴增的核酸分子進行測序,以識別經擴增的核酸分子的至少資料部分(及任選的其他部分,如錯誤校正部分及/或位址部分的一部分)。因此,由於溫度控制使得靶位點處的分子更可能分離成單鏈,且擴增混合物包括引物,該引物具有更大的機率來擴增與具有至少部分地匹配靶位址部分的位址部分的雙鏈分子分離的單鏈核酸分子,而不是擴增其他單鏈核酸分子,這增加了經測序核酸分子是具有意欲要讀取的靶位址部分的分子的機率,從而實現隨機存取。
應當理解,擴增混合物中使用的引物與意欲要讀取的雙鏈核酸分子的靶位址部分完全匹配不是必需的。為了增加給定數量引物可能的位址數量,位址部分可大於引物所匹配的序列部分,使得多個不同的位址皆可與相同引物匹配,在這種情況下,擴增實際上可擴增對應於多個不同位址的核酸分子。若測序儀仍可區分匹配相同引物的不同位址,則這是可接受的。
為了支持讀取操作,每個雙鏈核酸分子可包括在雙鏈核酸分子的相對末端處的第一標記部分和第二標記部分。第一標記部分和第二標記部分可為特定的鹼基序列,該等特定的鹼基序列獨立於編碼到資料部分內的雙鏈核酸分子中的特定資料。第一標記部分和第二標記部分中的至少一者可為特定位址標記部分,該特定位址標記部分包括雙鏈核酸分子的位址部分的至少一部分。藉由在每個雙鏈核酸分子中包含特定位址標記部分,這使得擴增混合物能夠選擇性地擴增具有特定之特定位址標記部分的分子,該特定之特定位址標記部分在分子間變化,使得能夠在隨機讀取存取中實現選擇性。
擴增混合物可包含與具有靶位址部分的雙鏈核酸分子的第一鏈的第一標記部分互補的第一引物,及具有靶位址部分的雙鏈核酸分子的第二鏈的第二標記部分互補的第二引物。藉由包括第一引物和第二引物兩者,這確保了引物可分別交替地擴增每個分子的第一鏈和第二鏈,以便快速增加所提供之經擴增分子的複製數量。
互補性是影響兩個單鏈核酸結合以形成雙鏈核酸的原理。它是兩個核酸序列之間共有的性質,使得當它們彼此反平行對準時,兩個序列中彼此相對的核苷酸將互補以實現最佳結合。在分子層級上,互補性係由特定鹼基對之間的最佳氫鍵來確定。例如,在DNA中,腺嘌呤與胸腺嘧啶互補,而鳥嘌呤與胞嘧啶互補;且在RNA中,腺嘌呤與脲嘧啶互補,及鳥嘌呤與胞嘧啶互補。鹼基的互補配對允許從一個分子複製資訊到另一個分子,且本質上,係從一代細胞複製資訊到另一代細胞。因此,兩個序列的單鏈核酸可被認為是互補的(若此些序列是使得其等彼此反平行對準時),則兩個序列中的相對核苷酸足夠互補以至於有足夠高之兩個單鏈核酸序列彼此結合的機率。單鏈核酸分子之一者中的每個鹼基與另一個單鏈核酸分子中的對應鹼基完全互補並非必需的。當序列的重疊部分足夠長時,則可容忍單個鹼基錯誤或相對少量鹼基中的錯誤,同時仍允許結合相應的單鏈核酸分子。因此,在本申請案中,術語「互補」意欲意味著足夠的互補,使得相關的鹼基序列將在相關的操作溫度下結合或雜交,以用於所進行的步驟。
在一個示例實施方式中,第一標記部分和第二標記部分中的僅一者可為如上所述的特定位址標記部分,而另一者可為與位址無關的標記部分(其與在同一位點處具有不同位址部分的雙鏈核酸分子相同)。這可使記憶體裝置的實際實施更容易實現,因為從可用於選擇的單組引物中選擇作為與特定位址標記部分匹配的引物可足以實現讀取存取的選擇性。對於對應於與位址無關的標記部分的另一個引物,無論要讀取哪個位址部分,都可使用相同的引物。因此,這可藉由啟用單個引物選擇步驟來降低加工複雜性。
在其他示例實施方式中,每個雙鏈核酸分子的第一標記部分和第二標記部分都可為特定位址標記部分,該等特定位址標記部分包括雙鏈核酸分子的位址部分的至少部分。藉由使兩個標記部分皆特定於位址,這提供了額外的選擇性從而可增加可由給定引物組區分的不同位址的數量。這是因為特定位址的選擇可接著基於選自一組可能的第一引物的特定第一引物和選自一組可能的第二引物的特定第二引物的組合。例如,使用僅在雙鏈核酸分子的一端的特定位址標記的方法可使用給定數量(例如100)的引物而實現由引物區分一定數量的位址,若在兩端都有一個特定位址標記,則僅使用20個引物可區分相同數量的位址,因選自第一組10個引物的引物和選自另外10個引物組的引物的組合接著可組合提供與上述100種引物相同的效果。因此,儘管在提供硬體元件以選擇和組合不同引物到要為給定讀取操作提供的擴增混合物中可能存在一些額外的加工複雜性,但此方法可擴展可用來表示給定數量引物的資料集的大小。
因此,第一標記部分和第二標記部分中的任何一者或兩者可為特定位址標記部分。對於任何特定位址標記部分,使用包括位址部分的至少部分的與位址相關的部分和對於在同一位點處具有不同的位址部分的雙鏈核酸分子而言相同的與位址無關的部分來編碼特定位址標記部分可能是有用的。儘管在讀取操作期間,與位址相關的部分可用於提供讀取存取的選擇性(該讀取存取的選擇性係用於提供對資料集的期望部分的隨機存取),但包括與位址無關的部分以簡化在熱控制裝置上進行的其他操作亦可能是有用的。例如,當在寫入操作期間將新的一組分子附著到靶位點時,或在讀取操作中將該組雙鏈核酸分子分離後恢復該組雙鏈核酸分子時,提供一種即使同一位點處的所有分子具有不同位址也會影響該等所有分子的操作可為有用的。藉由在特定位址標記部分中包括與位址無關的部分,這使得更加直接地實施這種共同影響不同定址的分子的操作。
在讀取操作期間,可在晶片上或晶片外進行分離的分子的擴增。因此,在一些實例中,可將擴增混合物施加於熱控制裝置,以在熱控制裝置上局部擴增經釋放的單鏈核酸分子。或者,可從熱控制裝置中除去分離的單鏈核酸分子,且接著可在晶片外施加擴增混合物。
可藉由多種方法進行擴增。在一些情況下,可藉由PCR進行擴增。或者,可使用基於等溫酶的擴增。在兩個實例中,可能存在將靶位點設定為比其他位點更高的溫度的步驟,以提供在靶位點處將雙鏈核酸分子分離成單鏈核酸分子的更大機率(相較於其他位點)。
在熱控制裝置上局部進行擴增的情況下,其中使用PCR接著在讀取操作期間控制溫度之步驟可包括以下步驟:通過重複的加熱和冷卻循環對靶部位進行熱循環。儘管靶位點的溫度是熱循環的,但其他位點可保持在低於熱循環中使用的最高溫度的溫度。靶位點處的熱循環意味著當溫度升高到循環中的最高溫度時,雙鏈分子更可能在靶位點處分離,同時將其他位點保持在較低溫度,這意味著在那些位點處的分子不太可能分離。然而,當溫度接近熱循環的最低溫度時,藉由降低靶位點處的溫度,則這意味著在擴增混合物中引入的引物更可能與單鏈分子退火,使得含有延伸酶及核苷酸的擴增混合物可延伸引物,以便產生鹼基與標記所結合的序列的互補序列,以提供引物靶向的序列的複製。
另一方面,若使用基於等溫酶的擴增方法,則可控制溫度使得在擴增期間(已在靶位點處將雙鏈核酸分子分離成單鏈核酸分子),將靶位點設定為大於或等於至少一種擴增酶的活化溫度的溫度。一旦雙鏈核酸分子在靶位點處分離,就不再需要將其他位點保持在比靶位點更冷的溫度下,因基於酶的擴增方法可擴增單鏈核酸分子(但非未分離的雙鏈分子)。一些等溫擴增方法可能需要一種以上的擴增酶,或可提供控制擴增酶活化的輔助蛋白或複合物。在M.Fakruddin等人所著的「核酸擴增:聚合酶鏈反應的替代方法(Nucleic acid amplification: Alternative methods of polymerase chain reaction)」(其發表於Journal of pharmacy & bioallied sciences 5.4(2013):245)中論述了這種基於等溫酶的擴增方法的實例。
如上所述,讀取操作包括以下操作:控制溫度以增加雙鏈核酸分子與其他位點相比在靶位點處分離成單鏈核酸分子的機率。將雙鏈核酸分子存儲在熱控制裝置上可能是有用的,因雙鏈核酸分子比單鏈分子更穩定,但可能需要分離成單鏈核酸分子以使擴增混合物起作用。然而,一旦執行讀取操作,則可能存在保留在靶位點處之分離的單鏈分子,該等分離的單鏈分子不僅包括對應於要讀取的所需位址的分子還包括對應於同一靶位點處的不同位址的其他分子。
讀取操作可包括恢復經分離成單鏈核酸分子的雙鏈核酸分子。因此,讀取操作可以是非破壞性操作。這是有用的,因為它避免了在讀取完成後重寫先前分離的分子的任何需要,這有助於減少所需的晶片外合成的核酸序列的體積,減少了先前合成分子存在於熱控制裝置上的浪費。
每個雙鏈核酸分子可包含與多個位點中的一個位點處的表面結合的結合鏈和與結合鏈雜交的另一個鏈。另一個鏈亦可稱為下文的「鬆散」鏈。當雙鏈核酸分子的單鏈分離時,結合鏈將保持與表面結合,但另一個鬆散鏈將分離且可在通過這些位點的流體內流走。恢復可包括施加恢復混合物,該恢復混合物包含用於與在每個分離的雙鏈核酸分子的結合鏈的一端處的標記部分的至少一部分退火的恢復引物。一旦恢復引物結合到結合鏈的標記部分,可提供延伸混合物(例如含有延伸酶和核苷酸)以使引物序列延伸,其中鹼基與結合鏈的剩餘部分互補,從而在讀取操作期間恢復先前與結合鏈解耦的另一條鏈。提供包含位址無關部分的標記部分可能是有用的,該標記部分對於在給定位點處具有不同位址部分的分子是相同的,其中恢復引物與位址無關部分互補,使得僅有一種類型的引物需要執行恢復操作。在恢復期間(特別是在引物退火期間),靶位點可保持在比其他位點更低的溫度。這使得恢復引物更有可能與讀取後保留在靶位點處(與其他位點相比)的結合鏈中的標記部分退火。因此,在讀取之後,分子可恢復到該等分子在執行讀取操作之前所處的狀態,以提供非破壞性的讀取處理。
另一方面,對於執行寫入操作以形成在靶位點處用資料編碼的一或多個新的雙鏈核酸分子,靶位點可保持在比其他位點更低的溫度,以提供(與其他位點相比)在靶位點處形成新的雙鏈核酸分子之更大的機率。藉由降低靶位點處的溫度,這使得引入的分子組與靶位點之間將更可能存在結合。
寫入操作可包括以下操作:提供與靶位點處的表面結合的單鏈核酸的標記片段。可藉由在靶位點自身處生長或合成標記片段、或藉由將標記片段引入穿過靶位點的流動流體及使用表面化學將標記片段附著到靶位點的表面來執行標記片段與表面的結合。在一些情況下,提供標記片段的步驟不需要在供應單鏈核酸分子本身的寫入組時進行。例如,標記片段可能早先已經供應過。例如,當熱控制裝置首先準備用於第一次寫入操作時,可在熱控制裝置的每個位點處提供標記片段並將其附著,準備好稍後執行後續的寫入操作。因此,在寫入操作時提供標記片段,但將標記片段附著到表面的實際時間可更早地完成,或可在寫入操作本身之前立即完成。
在寫入操作期間,供應一組寫入的單鏈核酸分子。單鏈核酸分子的寫入組由對應於待形成的新雙鏈核酸分子的序列編碼。如上所述,可藉由任何已知的核酸合成處理在晶片外合成單鏈核酸分子的寫入組。每組寫入的單鏈核酸分子包括標記部分,該標記部分與結合到靶位點處的表面的標記片段互補。藉由在靶位點處提供與其他位點相比不同(較低)的溫度,單鏈核酸分子的寫入組與靶位點處的標記片段退火的機率更大(與其他位點相比)。因此,即使沒有將單鏈核酸分子單獨引導至特定位點的能力,溫度控制使得分子的寫入組比其他位點更可能結合到靶位點,以提供基於核酸的記憶體裝置的隨機寫入存取所需的定址。
寫入操作可包括以下操作:應用延伸混合物以使每個標記片段延伸,其中鹼基和與標記片段退火的單鏈核酸分子的剩餘部分互補,以形成對應的雙鏈核酸分子。延伸混合物可包括延伸物質(例如聚合酶或另一種酶)及dNTP(脫氧核糖核苷酸三磷酸)。因此,一旦單鏈核酸分子的寫入組與標記片段結合,延伸混合物就可填充剩餘的鹼基,從而形成用對應於所供應的單鏈核酸分子寫入組的序列編碼的雙鏈核酸分子。如上所述,這些新的雙鏈核酸分子可具有不同的資料部分和不同的位址。因此,在寫入操作期間,可將寫入組的單鏈核酸分子和延伸混合物暴露於熱控制裝置之包括靶位點的至少兩個位點。位點之間不需要實體屏障。這提高了可用於資料存儲的密度。
在一些實例中,熱控制裝置可包括基板,且裝置的不同位點可設置在基板上的相應位置處。每個位點可包括至少一個用於附著單鏈或雙鏈核酸分子的附著表面。
在一些實施方式中,給定位點處的至少一個附著表面的總表面積可大於給定位點到基板平面上的投影的面積。這可通過不同方式實現。在一些實例中,一或多個珠可附著到基板上或就固定在基板上方(例如,使用靜電場或磁場)。在另一個實例中,與給定位點到基板平面上的投影面積相比,可用三維圖案對位點表面進行圖案化以增加表面的有效表面積。無論如何實施所增加的有效表面積,這都為核酸分子的附著提供了更多空間,這可增加所提供的資料存儲的密度。
在一個實例中,熱控制裝置可包括設置在基板上的相應位置處的多個主動性熱區域。每個主動性熱區域可包括用於將可變量的熱施加到對應的一個位點的加熱元件和設置在加熱元件和基板之間的絕熱層。一或多個被動性熱區域可設置在主動性熱區域和基板之間。每個被動性熱區域可包括用於將熱量傳導到基板的導熱層。一或多個被動性熱區域的導熱層在垂直於基板平面的方向上可具有比主動性熱區域的絕熱層低的熱阻。如上所述的熱控制裝置的每個位點可對應於主動性熱區域中之一者。
在使用時,基板可作為散熱片(若需要較低的溫度,則使基板暴露於室溫或提供基板的冷卻)。因此,被動性區域中的導熱層使得被動性區域能夠在主動性熱位點之間的區域中提供媒體的冷卻,使得可用主動性熱位點本身所提供的較少冷卻讓通過位點的流體冷卻到給定溫度。這使得主動性熱位點能夠被設計成更有效地加熱,因在加熱元件和基板之間可使用具有更高熱阻的絕熱層(因不再需要允許如此多的熱傳遞到基板上以支持冷卻)。這意味著在加熱期間,較少的熱損失到基板上,且因此裝置支持的整體溫度範圍可高於提供多個主動性位點的替代方法,該等主動性位點是加熱和冷卻的唯一來源。
可提供電腦程式或電腦可讀取資料結構,該電腦程式或該電腦可讀取資料結構包括用於控制設備執行上述方法的指令或控制資料。例如,程式或資料結構可規定要調整之相應位點處的溫度的時序和級別,以控制用於在給定靶位點處讀取或寫入資料的讀取操作或寫入操作。電腦程式亦可控制在讀取處理中使用的特定引物混合物的選擇。程式可存儲在電腦可讀取存儲媒體上,該電腦可讀取存儲媒體可為非暫態存儲媒體。
本申請案描述了一種能夠存儲和檢索在多種核酸(例如DNA、RNA或XNA)片段內編碼的數位資訊的裝置。藉由將多個核酸片段引入至裝置來寫入資訊,接著將該等多個核酸片段存儲在眾多可定址的位點中之一者中。可藉由提供所存儲的核酸的複製來自任何位點非破壞性地檢索資訊,接著可對該等所存儲的核酸的複製進行測序。可藉由從任何位點釋放所存儲的核酸來擦除資訊。基於位點的定址方案所提供的隨機存取允許比其他存儲方法可能提供之要查詢的資訊量更大的資訊量。
下文論述的實例使用DNA作為用於表示資料存儲的核酸分子的特定實例。應當理解,亦可使用其他形式的核酸,如RNA或XNA。
資訊可用包含DNA分子的鹼基對的序列編碼;每個鹼基是四種可能的選擇之一者,且因此每個鹼基編碼2位元的資訊。資訊的分子存儲是有吸引力的,因為實體密度如此之高;密度比磁帶高3到4個數量級,1E位元組的資料中心原則上可縮小到針頭的大小。圖1顯示了用於比較的方法,其中以如下所述的若干步驟寫入和檢索資訊: 1)編碼。要寫入的資料被分成小塊,該等小塊可放在DNA的片段上。編碼還必須包括用以補償讀取和寫入兩者中不可避免的錯誤的錯誤校正編碼方案及識別原始資料集中之小塊位置的定址方案。 2)合成。使用DNA合成技術實體地實現獨立DNA片段。 3)保存。使用溫度、大氣或其他方法的組合來存儲被合成的DNA以避免降解。 4)隨機存取。為了回讀資料的任何所需部分,必須識別編碼所需小塊的DNA片段。這可藉由使用引物的PCR擴增來實現,該等引物是所需小塊的位址的互補;因此,只擴增了所需的DNA。 5)測序。使用下一代測序技術來對擴增的DNA進行測序。 6)解碼。將所測量的序列重新排列成原始資料集的所需部分,使用冗餘錯誤校正碼來確保資料完整性及使用位址碼來確定順序。
這個處理的可擴展性的一個重要限制是需要為隨機存取方案中的每個位址範圍提供唯一的引物,這限制了整個資料集的大小。超過一定的尺寸,必須以大大降低了可實現的資訊密度的硬體來保持和採樣獨立流體體積。
若可在一個DNA分子中表示的位元數是b,則可藉由測序儀區分的不同位址的數量是n,且可用於執行PCR的不同引物的數量是m,則可使用圖1中所示的常規方法在DNA庫的單個實體井內表示之資料集的最大大小是n x m x b個位元數。例如,若b=100、n=1000且m=10000,則這意味著一百萬位元數/每個實體井;亦即,約122 MB/每個井。因此,為了表示顯著大小(如對應於典型資料中心的艾位元組資料量)的資料大小,DNA庫將需要許多實體井(例如,大約8x109 個井)以用於存儲的艾位元組。由於井可能比DNA分子本身的大小大10到12個數量級,故顯然地不再可能如同基於DNA的資料存儲所通常要求地將資料中心縮小到針頭的大小。需要實體分離不同的實體井,使得引物只能被引入至所選定的井而不能被引入至其他井,這意味著消除了基於DNA的存儲的存儲密度優勢。這使得難以在基於DNA的資料存儲中提供實際的存儲設施。
如圖2所示,可藉由在熱控制晶片52上提供DNA分子50來解決上文論述的問題,熱控制晶片52具有多個可獨立定址的位點54,每個位點能夠附著到多個DNA分子。提供溫度控制電路56以獨立地控制每個位點54的溫度。將給定位點54加熱到給定溫度亦加熱了設置在流體流動細胞內的該位點上方的液體體積,該流體流動細胞使流體流過熱控制晶片52的表面。如下所述,(例如)藉由將小珠固定在每個位點上方或藉由圖案化每個位點的表面以提供三維圖案可增加這些位點的有效表面積。熱控制晶片52上的相鄰位點不被任何實體屏障分離開來,且因此供應到一個位點54的流體亦可通過其他位點。因此,沒有必要使用實體分離來確保選擇給定的位點。作為替代,由溫度控制電路56提供的溫度控制可用於選擇要寫入/讀取資料的獨立位點。控制電腦58可向溫度控制電路56發送控制信號,該溫度控制電路56定義各個位點要被設置的溫度及要施加某些溫度的時序。存儲在存儲媒體59中的電腦程式或資料結構可控制控制電腦58以將適當的控制信號施加到溫度控制電路56,以執行給定的讀取操作或寫入操作。
利用圖2中所示的方法,將資料集編碼成DNA寡核苷酸之步驟可類似於圖1中所示的步驟。儘管未在圖2中明確示出序列的錯誤校正部分,但仍可設置此部分。然而,利用圖2中所示的方法,除了資料部分60(其還可包括錯誤校正部分)之外,寡核苷酸亦在單鏈DNA分子66的任一端處由第一標記部分62和第二標記部分64編碼。在此實例中,第一標記62是位址無關的標記部分,該位址無關的標記部分不包括DNA分子的任何位址部分。因此,對於每個經編碼的單鏈DNA分子66,(在每個經編碼的寡核苷酸的3'末端的)第一標記62可以是相同的。另一方面,(在5'末端的)第二標記64是位址相關的標記部分64,對於每個寡核苷酸來說,位址相關的標記部分64都不同。在此實例中,位址相關的標記包括位址相關部分68及對於每個寡核苷酸而言相同的位址無關部分69,位址相關部分68在此實例中包括識別對應的寡核苷酸的位址的完整位址部分。第一標記部分和第二標記部分用於支持讀取和寫入操作,如將在下文中更詳細地論述。
應當理解,每個資料部分60、位址部分68及第一標記62和第二標記64包括一定順序的核鹼基,例如在DNA的情況下為A、G、T或C(或在其他形式的核酸的情況下為其他類型的鹼基)。
圖3和圖4示出了可在其上執行上述資料存儲處理的裝置52。如圖3所示,提供流體流動元件(例如泵)以控制流體穿過裝置52頂部的流體流動路徑4的流動。在跨越溫度控制裝置52的平面的各個位置處提供了用於存儲核酸分子的多個位點54。每個位點54的頂部可包括支持核酸分子生長或附著的表面材料(例如金帽)。每個位點54對應於連續表面的一部分,沒有實體屏障阻止流體在相鄰的反應位點54之間通過。每個位點54具有設置在位點表面下方的加熱元件7,以將熱施加到流過該位點的流體的對應部分,以控制流體的溫度,從而調整在該位點處生效之讀取/寫入操作的機率。如圖4所示,位點54被佈置成二維矩陣(網格),被佈置成兩列或更多列(通道)9,其中通道/列方向平行於流體流過流體流動路徑4的方向。位於位點54之間的區域形成一或多個被動性熱區域8,該一或多個被動性熱區域8不包括任何加熱元件但係藉由將熱從流體導向裝置52的基板10來提供被動性冷卻。在列方向上的每個主動性熱位點6的長度x比位於同一列中的一對相鄰主動性熱位點6之間的每個被動性熱區域8的長度y長。如圖3所示,可提供冷卻機構12以冷卻基板10來作為散熱片。
位點54是主動性熱位點,在該等主動性熱位點處可提供加熱和冷卻兩者。藉由傳導到冷卻器基板10而從位點54流出的熱來提供冷卻。可控制加熱器(例如電阻式加熱元件)以改變所供應的熱量。因此,當來自加熱器7的熱流大於至基板的熱的冷卻流時,淨效應是位點54被加熱,而當來自加熱器7的熱流小於至基板的冷卻流時,淨效應是位點54被冷卻。
在垂直於基板的方向上於每個主動性熱位點54下方提供的材料的熱阻可大於在每個被動性熱區域8下方提供的材料的基板垂直的方向上的熱阻。提供被動性區域具有比主動性熱位點54更大的導熱率意味著可藉由被動性熱區域8提供更多的冷卻效果,使得主動性熱位點54可被設計成更有效地用於加熱。這允許在加熱元件和基板之間提供具有更大熱阻的絕熱層,使得加熱器7必須施加更少的熱以抵消到基板的冷卻流,且因此更大的整體溫度範圍可由用於加熱器7之給定最大功率的裝置支持。
溫度控制裝置52的設計的進一步細節可在英國Little Chesterford的Evonetix公司公開的PCT申請案WO 2018/104698 A1中找到,該PCT申請案更詳細地描述如何在每個主動性熱位點中控制到每個加熱器7的電流以便在上述流體中提供所需溫度的實例,且還描述如何在每個主動性熱位點6下方設計材料使得其在垂直於基板的方向上具有比在每個被動性熱區域8下方提供的材料(例如,可使用包括柱和空隙的材料)更大的熱阻的實例。
因此,通常熱控制裝置能夠為晶片的每個位點54設定不同的溫度。相鄰位點之間的間距x+y可能遠小於將可在根據圖1所示方法重組的DNA庫中的實體井之間的間距。例如,使用單獨實體井的方法,每個井可能需要為若干毫米的尺寸,且可能需要在每個井之間存在實體屏障,該實體屏障也可為幾毫米的尺寸,而對於熱控制裝置,位點54的間距可為亞毫米尺度,例如微米級或甚至更小。這使得存儲密度大大提高。例如,如上例所示,b=100、n=1000和m=10000,圖2所示的方法能夠在具有10000個位點54的熱控制晶片中支援1.2 TB的資料存儲,相較於若使用能夠單獨供應流體的實體分離的井,此方法使用的空間較小。
圖5顯示了如何編碼在每個位點提供的DNA分子。為簡明起見,圖5僅顯示了兩個位點,位點A和位點B。在每個位點處提供了多個雙鏈DNA分子70。每個雙鏈DNA分子包括單鏈DNA的結合鏈72,其與對應位點54處的表面73結合。結合鏈在其5'末端處與表面73結合(與最遠離表面73的結合鏈的3'末端結合)。為了便於參考,圖5中的表面73顯示為平坦表面,但從下文圖10及圖11所示的實例將可理解,表面不需要是平的。每個雙鏈DNA分子70亦包括單鏈DNA的另一條(鬆散)鏈74,其不與該位點處的表面73結合,但與結合鏈72結合(雜交)(鬆散鏈具有最靠近表面73的3'末端和最遠離表面73的5'末端)。在圖5和隨後的附圖中的圖示中,為了區分結合鏈72和鬆散鏈74,在鬆散鏈的底部和在位點54處的表面73之間示出了小的間隙。這並不意欲暗示鬆散鏈74必然是比結合鏈72更短的鹼基序列。相反,圖中所示的間隙僅用於說明目的,以幫助區分哪條鏈是結合的及哪條鏈是鬆散的。
如圖5所示,每個雙鏈DNA分子可被編碼為包括第一標記部分62、資料部分60和第二標記部分64(包括位址無關部分69和位址相關部分68,如上所論述的)。結合鏈72及鬆散鏈74具有互補的鹼基序列。相應鏈中序列的互補部分用相同的標記(例如TAG 1、DATA 1及ADD 1等)展示,但其中一條鏈包括序列的主要版本而另一條鏈包括標有撇號的互補版本。
如圖5所示,在相同位點54處提供但具有不同資料部分60的DN​​A分子亦具有不同的位址部分68。例如,圖5中用箭頭80標記的分子具有不同的資料部分(DATA 2和DATA 3)且還具有不同的位址部分(ADD 2和ADD 3)。然而,在不同位點54處具有不同資料部分的分子可具有相同的位址部分。例如,用箭頭82標記的DNA分子70,一個在位點A處而另一個在位點B處,每個分子具有相同的位址部分(ADD 3),但具有不同的資料部分(DATA 3和DATA 4)。不同位點處的分子可共享相同的位址部分,因為施加於不同位點的溫度控制可用於提供區分這些分子的隨機存取選擇性。
如圖5中用箭頭84標記的分子所示,可能在相同位點處提供完全相同的DNA分子的多個版本,其共享相同的資料部分(在此實例中為DATA 1)和相同的位址部分(ADD 1)。實際上,當將新資料寫入熱控制晶片52的給定位點時,可提供每個經編碼的單鏈序列的多個實例,使得給定位點可最終存儲相同分子的多個複製,這有助於提供對錯誤的穩健性。因此,儘管在下文論述的實例中,為了簡明起見,每個不同的DNA序列在給定位點處僅顯示一次或兩次,但應理解,這些序列中的每一者可在同一位點處重複多次。
儘管DNA分子存儲在熱控制晶片52的給定位點處,但可在晶片上應用保存技術以增加DNA分子的壽命。例如,可用於在熱控制晶片52上保存DNA分子的技術的實例可包括以下中的任何一者或多者: §  在環境溫度下乾燥和存儲(例如使用空氣乾燥或冷凍乾燥); §  使用高鹽的基於溶液的配方(例如DMSO/EDTA/飽和氯化鈉)進行保存; §  低溫存儲(例如4°C、-20°C及-80°C); §  液氮快速冷凍; §  90%乙醇,隨後進行基於二氧化矽的乾燥; §  在市售溶液(例如,foreternate、RNAlater及Allprotect Reagent)中存儲; §  使用蛋白質穩定劑(例如DNA結合蛋白,如組蛋白); §  使用惰性氣體進行保存; §  用於延長存儲時間之上述不同保存技術的組合(例如在環境溫度下)。
圖6A至圖6E顯示了將一組新DNA分子寫入熱控制晶片的靶位點的寫入操作的實例。更確切地說,這些圖顯示了用於將分子組寫入兩個不同位點之兩個單獨的寫入操作,首先是位點2接著是位點1(其中位點1和位點2可為熱控制晶片52的任何位點54)。
如圖6A所示,作為初始步驟,熱控制晶片52的每個位點54的表面塗覆有多個相同的單鏈標記片段90,其對應於與將被存儲在給定位點處之每個雙鏈DNA分子的結合鏈72之位址無關的第一標記部分62的互補序列。標記片段90通過5'末端附著到表面。可通過共價、離子或配位表面附著或通過標記片段的原位熱合成來進行標記片段90與每個位點的附著。當為在沒有DNA存儲在熱控制晶片52上時而要執行的第一次寫入操作來準備熱控制晶片52時,將標記片段90附著到每個位點的步驟可作為預備步驟進行。
準備或獲得一組寫入的單鏈DNA分子92,其中每個單鏈DNA分子用根據所需雙鏈分子70之一者的序列編碼以被寫入至靶位點。以與標記片段90互補的序列來將第一標記部分62(TAG 1')設置在每個單鏈DNA分子92的3'末端。第二標記部分64設置在每個單鏈DNA分子92的5'末端,其中第二標記部分64包括最靠近5'末端的位址無關部分(TAG 2)69及緊鄰位址無關部分69的位址相關部分68。在圖6B的實例中,靶位點是位點2。寫入組的每個單鏈分子92用資料部分60、第一標記部分62和第二標記部分64編碼(如圖5所示)及以包含在具有不同資料部分60的相應單鏈分子中的不同位址部分68編碼。使用流體流動路徑(例如流體流動細胞)使DNA分子92的寫入組流過熱控制裝置52的表面,使得其暴露到熱控制裝置52的多個位點(不僅是靶位點)。同時,控制每個位點處的溫度,使得分子92的寫入組與靶位點處的標記片段90退火的機率更高(與其他位點相比)。這是藉由以下步驟來實現的:將靶位點處的溫度T2 設定為低於預期標記片段90與第一標記部分62內的對應互補序列分離的解鏈溫度的溫度,而其他位點設定為大於標記片段90的解鏈溫度之溫度T1
如圖6C所示,將延伸混合物(例如,其包含如聚合酶和dNTP的延伸酶)引入流體流動路徑中(並暴露於包括靶位點的多個位點)。將靶位點處的溫度T2 設定為低於序列的TAG 1部分62的解鏈溫度但大於或等於延伸混合物的活化溫度的溫度。同時,其他位點處的溫度T1 仍設定為高於TAG 1序列的解鏈溫度的溫度。延伸酶延伸標記片段90,其中鹼基93與單鏈序列92的剩餘部分互補,單鏈序列92與標記片段90結合(雜交),使標記片段90在5'至3'方向上延伸,使得最初供應的單鏈分子92的寫入組成為在靶位點處提供的每個雙鏈DNA分子70的鬆散鏈74,且通過延伸每個標記片段90獲得的延伸序列成為結合鏈72。
如圖6D所示,已在位點2處寫入一組雙鏈DNA分子,接著可在位點1上執行寫入操作而不破壞已寫入位點2的分子(即使任何供應的流體都會受到已寫入位點2和新的靶位點1兩者的影響)。在流體流動路徑內再次供應另一組代表編碼資料的單鏈DNA分子使其流過靶位點1和其他位點,且再次將靶位點處的溫度T1 設定為低於序列的TAG 1部分的預期解鏈溫度,同時將任何先前寫入位點處的溫度T2 設定為大於TAG 1序列的解鏈溫度但小於整個DNA分子70的解鏈溫度的溫度。分離較長DNA分子70所需的溫度將大於分離僅由TAG 1部分(90,62)結合的DNA鏈所需的溫度,因整個DNA分子係藉由更多鹼基之間的互補性結合。因此,即使溫度升高到高於標記的解鏈溫度,在位點2處之先前寫入的DNA分子70也不會解離。
如圖6E所示,接著可再次提供延伸混合物,再次將靶位點處的溫度T1 設定為大於或等於延伸酶的活化溫度且低於TAG 1部分的解鏈溫度,而將先前寫入位點處的溫度設定為大於TAG 1序列的解鏈溫度並低於整個DNA的解鏈溫度。
在一個實例中,在寫入操作中,針對可由實際的定址引物庫容納的最大資料集完成編碼和合成處理。除了錯誤校正和定址碼之外,每個片段在分子末端具有相同的序列,稱為標記。使用單鏈DNA(寡核苷酸)代替雙鏈分子,將該等單鏈DNA組合成單個池。熱控制晶片的表面藉由化學附著或原位熱合成塗覆有相同的單鏈DNA片段。這些片段與在含有資訊的分子的末端處的標記互補。將含有資訊的分子引入流動池,除了單個位點以外的所有位點都保持在高於標記的退火溫度的溫度。含有資訊的分子將在冷位點處退火,同時標記會將該等分子保持在適當的位置(但不會在較熱的位點處)。對於具有新的含有資訊的分子的每個位點重複此處理,因此存儲最大實際資料集的倍數。
圖7是顯示執行寫入操作的方法的流程圖。在步驟100處,提供與靶位點54的表面結合的單鏈核酸的標記片段90(標記片段也在其他位點處提供)。標記片段用對應於待寫入之每個雙鏈分子70的結合鏈72的標記部分62的序列編碼。
在步驟102處,在控制電腦58的控制下,由溫度控制電路56控制位點溫度,以提供與其他位點相比,分子92的寫入組在靶位點處與標記片段90退火之更大的機率。具體來說,靶位點設置為比其他位點更低的溫度。更具體來說,將靶位點設定為低於對應於標記片段90的序列的解鏈溫度的溫度,而將其他位點設定為高於TAG 1序列的解鏈溫度的溫度。
在步驟104處,藉由使流體流過熱控制裝置來供應單鏈核酸分子的寫入組。流體暴露於多個位點,而不僅僅是靶位點。每個單鏈核酸分子用資料部分和位址部分(且也可能是錯誤校正部分)編碼且具有第一標記部分,該第一標記部分包括與步驟100中提供的標記片段90互補的序列(也是第二標記部分包括在分子的末端處)。可用根據要寫入的特定資料所選擇的編碼而藉由任何已知的DNA合成技術在晶片外合成或從編碼的DNA序列的商業提供者獲得單鏈核酸分子的寫入組。靶位點處的溫度低於其他位點意味著分子的寫入組更可能與靶位點處的標記片段退火(相較於其他位點而言)。
在步驟106處,(例如)藉由使含有延伸物質的流體流過跨越每個位點的流體流動細胞來施加延伸混合物。延伸混合物(例如,其包括如聚合酶的酶)用來延伸標記片段90,其中鹼基與經結合至標記片段90的單鏈核酸分子的剩餘部分互補。結果為藉由結合鏈72附著於靶位點上的雙鏈DNA分子70,該結合鏈72係根據所需資料編碼。
方法可通過步驟102至106多次循環。
圖8A至圖8D顯示了用於讀取在與靶位址部分匹配的特定靶位點處的雙鏈DNA分子70中編碼的資料的讀取操作及用於恢復在讀取期間分離的雙鏈DNA分子70的恢復操作的實例。例如,靶位點被認為位點2,且要讀取的靶位址部分是ADD 1。注意,圖8A的實例中的位點1亦包括具有相同位址部分ADD 1的分子,但此分子具有與要讀取之實際分子中的資料(DATA 1)不同的資料DATA 3。
如圖8A所示,將靶位點T2 設定為高於雙鏈DNA分子70的預期解鏈溫度的溫度。同時,將其他不意欲讀取的位點(如本實例中的位點1)的溫度設定為低於DNA分子的預期解鏈溫度。這意味著相較於其他位點處,靶位點(位點2)處的DNA分子70更可能分離成其結合鏈72和鬆散鏈74。每個經分離的雙鏈分子的結合鏈72保持與靶位點54處的表面結合,而鬆散鏈74在流體中自由流走或可被包圍(例如使用磁場或靜電場)以保持鬆散鏈在對應位點本端。
如圖8B所示,藉由使擴增混合物(例如PCR混合物)在流過熱控制裝置的流體中流動,將擴增混合物暴露於包括靶位點的多個位點。擴增混合物包括第一引物120和第二引物122。第一引物120與經分離的DNA分子的鬆散鏈74的第一標記部分62中的鹼基序列互補。第二引物與結合鏈72內的第二標記部分64互補。擴增混合物亦可包括延伸酶和用於活化酶的其他物質。如圖8B所示,第一引物120在圖8A中分離之單鏈DNA的鬆散鏈74的3'末端處與第一標記部分62結合。靶位處點的溫度進行熱循環以在較高溫度和較低溫度之間交替,其中循環的最高溫度高於具有對應於整體DNA分子的長度的DNA序列的解鏈溫度,及循環的最低溫度低於對應於第一標記部分62和第二標記部分64的序列的解鏈溫度。同時,除靶位點以外的位點處的溫度設定為低於具有對應於整體雙鏈核酸分子70的長度的序列長度的DNA分子的解鏈溫度的溫度。如圖8B所示,當第一引物120與每個分離的DNA分子的鬆散鏈74的第一標記部分62結合時,延伸酶接著延伸引物(其中鹼基124與鬆散鏈的剩餘部分互補),沿5'至3'方向延伸序列,以產生具有相同序列的鏈(如在仍附著於靶位點的表面的結合鏈72中)。同時,在其他位點處的DNA分子沒有分離,且因此不受引物的影響。
熱循環意味著從引物延伸的新產生的鹼基序列接著與鬆散鏈74分離,使得有效地將結合鏈72複製成另一個不含靶位點表面的單鏈DNA分子。如圖8C所示,當隨後在熱循環中再次降低溫度時,則先前複製的結合鏈72的3'末端與具有匹配靶位址部分的位址部分68的分子中的擴增混合物的第二引物122結合。因此,在圖8C的實例中,引物與具有與引物中的對應靶位址部分匹配的第一位址部分ADD 1的DNA鏈結合,但該引物不與具有不同位址部分ADD 2的另一鏈72結合。再次,第二引物122的序列(其中鹼基與經複製的結合鏈72的剩餘部分互補)在5'至3'方向上延伸。儘管圖8C中未顯示,引物122亦可與保持與表面結合的結合鏈72雜交並沿5'至3'方向延伸,以在表面處提供更多的擴增。
圖8A、圖8B和圖8C中所示的步驟實際上可同時進行且可通過這些步驟中的每一步驟的多次重複循環處理,當先前結合的雙鏈分子被分離成單鏈時之熱循環的較高溫度與當引物與當經分離的單鏈DNA鏈的相關標記部分結合時之熱循環的較低溫度之間交替,及延伸引物(其中鹼基與剩餘序列互補),以複製DNA鏈。藉由重複此步驟多次,使用特定位址引物122意味著對應於具有靶位址部分ADD 1的分子的鏈比具有不同位址部分的鏈更可能被擴增,使得提供具有靶位點序列ADD 1的分子的大量複製,該等大量複製接著可被供應給測序儀以進行測序和解碼。
在上文示出的實例中,特定位址引物122以在靶位點處從一個分子到另一個分子變化的位址部分與第二標記部分64完全匹配,第二標記部分64包括標記為TAG 2的位址無關部分和位址有關部分兩者。然而,使引物122與位址部分完全匹配並不是必需的,且在一些情況下,與靶位點處的分子中的位址部分的部分匹配可足以用藉由在測序步驟期間識別完整位址部分來區分與特定位址引物122中的位址部分共享部分匹配的剩餘分子使至少一些分子具有在擴增過程中要被丟棄的錯誤位址部分。
在圖8B及圖8C的實例中,引物120是與位址無關的引物,因此將會有具有「錯誤」位址部分的鏈的複製(但僅在一個方向上複製),因另一引物122是位址相關的引物。因此,儘管存在一些具有「錯誤」位址的鏈的複製,但具有靶位址的「正確」鏈將占主導地位(因其在兩個方向上被複製)。如下文參考圖12所論述的,若引物120、122都是位址相關的,則根本不會複製「錯誤」鏈。
此外,圖8B及圖8C顯示了一個實例,其中在擴增混合物中供應特定位址引物122,以選擇性地擴增具有至少部分匹配靶位址部分的位址部分的DNA分子。然而,讀取操作的另一選擇是供應包含兩個位址無關的引物的擴增混合物,其中第一引物120與圖8B和圖8C中的相同,但第二引物與每個分子的結合鏈72的第二標記部分64的位址無關部分(TAG 2)互補(亦即,第二引物可與下文論述的恢復引物130相同)。利用這種與位址無關的擴增混合物,可從位點提取在單個位點處的雙鏈DNA分子中編碼的所有資料(亦即,整個位址範圍),以供給測序儀。測序儀可讀取每個分子的資料和位址部分,並重​​新組裝由雙鏈DNA分子表示的二元資料集。
圖8A至圖8C的實例顯示了在晶片上局部執行擴增,但亦可能在釋放如圖8A所示的DNA的鬆散鏈74之後使鬆散鏈在流體流動通道中流出晶片,且接著執行熱循環和準備好測序的片外擴增。
圖8B及圖8C顯示了使用PCR執行擴增的實例,但亦可使用其他方法選擇性擴增DNA序列以使位址部分至少部分地與靶位址部分匹配。例如,可使用如上文所引用之Fakruddin等人的論文中所論述之基於等溫酶的擴增方法。
如圖8D所示,在分離靶位點處的雙鏈分子以準備進行任何擴增和測序及從流動細胞中去除任何複製的鏈後,可藉由供應恢復引物130(TAG2)來恢復原始雙鏈分子70,該恢復引物130與靶位點處的每個雙鏈DNA分子70的結合鏈72的位址無關部分69互補。
在恢復操作期間,除了靶位點之外的位點被設定為低於整個DNA序列的預期解鏈溫度但高於TAG2的解鏈溫度的溫度,同時靶位點被設定為比其他位點低的溫度、等於或高於活化聚合酶或其他延伸酶以延伸DNA序列所需的活化溫度。因靶位點的溫度低於其他位點,故恢復引物130更可能與保留在靶位點處的結合鏈72的第二標記部分64的地址無關部分69退火(引物130附著到結合鏈72的5'末端)。藉由提供與位址無關的引物作為恢復引物130,這使得能夠恢復在讀取過程中分離的所有雙鏈分子(而不僅是具有與要讀取的靶位址部分匹配的位址部分的分子)。引物130與結合鏈72的與位址無關的部分結合,且接著延伸酶延伸恢復引物130(其中鹼基與結合鏈72的剩餘部分互補),從而重建先前在讀取過程中與結合鏈72分離的鬆散鏈74。因此,靶位點恢復到執行讀取操作之前的狀態,使得可稍後再次讀取資料,而無需供應經編碼的單鏈DNA的新寫入組。
在一些實例中,圖8D的恢復步驟可(例如)藉由與擴增混合物同時供應恢復混合物並使用熱循環的較冷部分來進行恢復而與圖8A至圖8C中的早期步驟同時執行。
因此,在讀取操作的一個實例中,將擴增混合物(例如PCR混合物)引入流動細胞中。使單個靶位點進行熱循環、高於DNA解鏈溫度並低於引物/標記退火溫度。當位點熱時,標記將熔解而分子將會被釋放到溶液中,其中熱循環會引起擴增。當位點冷時,經擴增的分子將與標記重新退火,來確保資料保留在位點上。可從流動細胞中除去過量的擴增分子。藉由使用與所需位址互補的引物,可在片上擴增期間或在第二階段片外處理中定址單個分子。除了丟棄標記序列之外,解碼過程如前所述進行。
圖9為顯示使用其他核酸對基於DNA的資料存儲或存儲執行讀取操作的方法的流程圖。在步驟150處,將熱控制晶片的靶位點54設定為比其他位點更高的溫度,以提供與熱控制裝置52的其他位點相比,靶位點處的雙鏈核酸分子70將分離成單鏈的更大機率。
在步驟152處,在晶片上或晶片外,將經分離的單鏈核酸分子暴露於擴增混合物,該擴增混合物包括至少一種用於選擇性擴增單鏈核酸分子的引物,該等單鏈核酸分子與具有位址部分的雙鏈核酸分子分離,該位址部分至少部分匹配靶位址部分。若在晶片上進行擴增,則可藉由根據熱循環控制溫度(若藉由PCR進行擴增的話)將靶位點處的溫度設置為與其他位點不同。若正在使用基於等溫酶的方法,則一旦雙鏈核酸分子在靶位點處分離,在靶位點處繼續提供與其他位點相比不同的溫度便不是必需的,由於基於酶的方法可作用於靶位點處之經分離的單鏈核酸分子,但不作用於其他位點處仍然完整的雙鏈核酸分子(因此,在擴增期間,靶位點和任選的其他位點可設定為溫度大於或等於擴增酶的活化溫度,但低於整個DNA分子的解鏈溫度)。若在晶片外進行擴增,則可將溫度控制應用於一容器中(在從熱控制晶片52移除之後提供經分離分子至該容器中)。
使用擴增混合物來擴增經分離的單鏈,這係由於至少一個特定位址引物的存在更有可能擴增具有靶位址部分的分子(而不是具有其他位址部分的分子),及由於溫度控制更有可能擴增靶位點處(而不是其他位點處)的分子(即使分子與其他位點處的靶位址部分具有相同的位址部分),這意味著經擴增的分子是預期具有主要包含有匹配位址部分的經擴增分子的合理機率的分子池。在步驟154處,對經擴增的分子進行測序以識別那些分子的至少資料部分60(及可能還有錯誤校正部分和(可選的)位址部分,若使用擴增混合物的引物與經擴增分子的位址部分不完全匹配的話)。基於測序,可識別鹼基序列,且因此可解碼在該序列中編碼的資料以重建寫入熱控制裝置的原始資料。
在步驟156處,藉由將靶位點設定為比其它位點更低的溫度且施加包含恢復引物(其用於與在每個經分離的雙鏈核酸分子70的結合鏈72的一端處的至少一部分的標記部分退火)的恢復混合物來恢復在步驟150處分離的雙鏈核酸分子。恢復混合物亦包括延伸物質,該延伸物質用於一旦結合至結合鏈72(其中鹼基與結合鏈的剩餘部分互補)就延伸恢復引物的鹼基序列,以重建雙鏈核酸分子。
若意欲擦除基於DNA的存儲中的資料,則可藉由將位點的溫度升高到高於雙鏈DNA的解鏈溫度來從位點除去DNA 70之含有資訊的片段。鏈將熔解且可從流動細胞中移除廢棄片段。接著可使用外切核酸酶或其他方法降解經結合的單鏈DNA,且可重新引入初始標記以準備下一個寫入循環。
在每個位點處提供相對高的表面積以附著單鏈或雙鏈DNA分子可為有用的。藉由提供與靶位點到熱控制裝置的基板上的投射相比具有更大總表面積的附著表面,這可提供更多空間以用於附著DNA分子並因此提高DNA存儲密度。圖10及圖11顯示了用於增加位點的有效表面積的兩個實例。如圖10所示,多個珠200可(例如)藉由將珠實體地附著到位點或藉由使用靜電場或磁場將珠固定在位點上方而被固定在熱控制裝置的給定位點54上方。或者,如圖11所示,可用三維結構(例如,使用脊和谷)圖案化給定位點的表面,以增加有效表面積。
在上文示出的實例中,第一標記62是位址無關標記及第二標記64為位址相關標記64。然而,如圖12所示,亦可對DNA序列進行編碼,使得在DNA模組的兩個末端處的標記皆為特定位址標記,該等特定位址標記包括分子的位址部分的一部分。因此,第一標記62和第二標記64皆可包括位址部分的一部分,且DNA分子的總位址可藉由在分子任一端的位址部分(ADD1a,ADD1b)的組合形成。這種方法可有助於提高讀取存取的選擇性。當以這種方式編碼DNA時,在讀取的擴增混合物中使用的第一引物120和第二引物122兩者皆可為特定位址引物,該等特定位址引物包括與待讀取分子中的位址部分的對應部分匹配的部分。恢復混合物仍可包括位址無關引物,該位址無關引物與給定位點處的所有分子中的第二標記64的位址無關部分匹配。藉由使用兩端處之特定位址標記,這意味著可減少為了讀取給定位址集而需要維護的引物的總數量,因位址選擇係基於特定選擇之匹配靶位址部分的第一引物和特定選擇之匹配靶位址部分的第二引物的組合。例如。十種不同的第一引物和十種不同的第二引物的組合可提供一百種不同的可能組合,以僅使用20種引物來與一百種不同的位址模式匹配。在這種情況下,DNA存儲存取電路可包括用於存儲可用於選擇的不同引物庫的元件來作為第一引物120和第二引物122,及該等不同引物庫係用於在提供擴增混合物到晶片之前根據要讀取的特定位址來組合第一引物120和第二引物122。
儘管本文已參考附圖而詳細描述了本發明的說明性實施例,但應該理解的是,本發明不限於那些精確的實施例,且所屬技術領域中具有通常知識者可在不脫離由所附申請專利範圍所限定之本發明的範疇和精神的情況下在該等精確的實施例中實現各種改變和修改。
4‧‧‧流體流動路徑 7‧‧‧加熱器 8‧‧‧被動性熱區域 9‧‧‧通道 10‧‧‧基板 12‧‧‧冷卻機構 50‧‧‧DNA分子 52‧‧‧熱控制裝置 54‧‧‧位點 56‧‧‧溫度控制電路 58‧‧‧控制電腦 59‧‧‧存儲媒體 60‧‧‧資料部分 62‧‧‧第一標記部分 64‧‧‧第二標記部分 66‧‧‧單鏈DNA分子 68‧‧‧位址相關部分 69‧‧‧位址無關部分 70‧‧‧雙鏈核酸分子 72‧‧‧結合鏈 73‧‧‧表面 74‧‧‧鬆散鏈 80‧‧‧箭頭 84‧‧‧箭頭 90‧‧‧標記片段 92‧‧‧單鏈DNA分子 93‧‧‧鹼基 100‧‧‧步驟 102‧‧‧步驟 104‧‧‧步驟 106‧‧‧步驟 120‧‧‧第一引物 122‧‧‧第二引物 124‧‧‧鹼基 130‧‧‧恢復引物 150‧‧‧步驟 152‧‧‧步驟 154‧‧‧步驟 156‧‧‧步驟 200‧‧‧珠
本發明的其他態樣、特徵和優勢將從以下結合附圖閱讀的實例的描述中變得顯而易見,其中:
圖1顯示了存取使用核酸分子所設置的資料存儲的比較方法;
圖2顯示了存取使用熱控制裝置之基於核酸的資料存儲的原理,該熱控制裝置能夠對雙鏈核酸分子進行基於溫度的定址;
圖3和圖4示意性地示出了熱控制裝置;
圖5顯示了分配給熱控制裝置的不同位點的雙鏈核酸分子的實例;
圖6A至圖6E示出了用於形成一或多個用資料編碼之新的雙鏈核酸分子的寫入操作;
圖7是示出執行寫入操作的方法的流程圖;
圖8A至圖8D示出讀取操作及恢復操作,該讀取操作係讀取在選定的雙鏈核酸分子中編碼的資料,及該恢復操作係恢復在讀取操作期間分離的雙鏈核酸分子;
圖9是示出執行讀取和恢復操作的方法的流程圖;
圖10及圖11顯示了用於增加可用於在熱控制裝置的給定位點處附著核酸分子的表面積的結構的實例;及
圖12示出了在經編碼的核酸分子的兩端處使用特定位址標記部分的實例。
國內寄存資訊 (請依寄存機構、日期、號碼順序註記) 無
國外寄存資訊 (請依寄存國家、機構、日期、號碼順序註記) 無
50:DNA分子
52:熱控制裝置
54:位點
56:溫度控制電路
58:控制電腦
59:存儲媒體
60:資料部分
62:第一標記部分
64:第二標記部分
66:單鏈DNA分子
68:位址相關部分
69:位址無關部分

Claims (24)

  1. 一種用於存取資料存儲的方法,使用設置在一熱控制裝置上的雙鏈核酸分子來提供該資料存儲,該熱控制裝置包括複數個位點和溫度控制電路,以獨立地控制該複數個位點中的每個位點的一溫度;該方法包括以下步驟:使用該溫度控制電路來控制該複數個位點的溫度,以在一靶位點處提供與該複數個位點的其他位點相比之一不同的溫度;及執行一讀取操作以從附著在該靶位點的一或多個選定的雙鏈核酸分子讀取資料,或執行一寫入操作以形成附著在該靶位點的用資料編碼的一或多個新的雙鏈核酸分子,其中在該靶位點和該等其他位點處的該等不同的溫度提供相較於該等其他位點而言該讀取操作或該寫入操作作用於該靶位點上的一更大的機率;其中該讀取操作或該寫入操作包括使流體流過包括該靶位點之該複數個位點中的至少兩個位點。
  2. 如請求項1所述之方法,其中該複數個位點係在一共用流體井的相應部分處,沒有一實體屏障阻止流體在相鄰位點之間通過。
  3. 如請求項1所述之方法,其中:每個雙鏈核酸分子包括至少一資料部分及一位址部 分;在該熱控制裝置的不同位點處提供具有不同資料部分但有相同位址部分的雙鏈核酸分子;及在該熱控制裝置的一給定位點處,位於該給定位點之具有不同資料部分的該等雙鏈核酸分子也具有不同的位址部分。
  4. 如請求項1所述之方法,其中當執行一讀取操作時,該控制溫度之步驟包括以下步驟:在至少部分的該讀取操作期間將該靶位點設定成比該等其他位點更高的一溫度,以提供相較在該等其他位點處之一更大的該等雙鏈核酸分子在該靶位點處分離成單鏈核酸分子的機率。
  5. 如請求項1所述之方法,其中每個雙鏈核酸分子包括至少一資料部分和一位址部分,及該讀取操作包括以下操作:將分離的單鏈核酸分子暴露於一擴增混合物,該擴增混合物包含至少一個用於選擇性擴增從一雙鏈核酸分子分離的一單鏈核酸分子的引物,該雙鏈核酸分子具有至少部分匹配一靶位址部分的一位址部分;及對由該擴增混合物擴增的擴增核酸分子進行定序,以識別該等擴增核酸分子的至少該資料部分。
  6. 如請求項5所述之方法,其中每個雙鏈核酸 分子包含在該雙鏈核酸分子的相對末端處的第一標記部分和第二標記部分;及該第一標記部分和該第二標記部分中的至少一者是一特定定址標記部分,該特定定址標記部分包括該雙鏈核酸分子的該位址部分的至少一部分。
  7. 如請求項6所述之方法,其中該擴增混合物包含:一第一引物,該第一引物與具有一靶位址部分的一雙鏈核酸分子的一第一鏈的該第一標記部分互補;及一第二引物,該第二引物與具有該靶位址部分的該雙鏈核酸分子的一第二鏈的該第二標記部分互補。
  8. 如請求項6所述之方法,其中該第一標記部分和該第二標記部分中之一者是一與位址無關的標記部分,該與位址無關的標記部分對於在相同位點處具有不同位址部分的雙鏈核酸分子是相同的。
  9. 如請求項6所述之方法,其中該第一標記部分和該第二標記部分皆是特定定址標記部分。
  10. 如請求項6所述之方法,其中該第一標記部分和該第二標記部分中的至少一者是一特定定址標記部分包括:一與位址相關的部分,其包括至少部分的該位址部分;及 一與位址無關的部分,其對於在相同位點處具有不同位址部分的雙鏈核酸分子是相同的。
  11. 如請求項5所述之方法,其中將該擴增混合物施加於該複數個位點,以在該熱控制裝置上局部擴增該等經分離的單鏈核酸分子。
  12. 如請求項11所述之方法,其中該擴增係藉由以下步驟之一者進行:PCR,其中該控制溫度步驟包括以下步驟:通過重複的加熱及冷卻循環使該靶位點熱循環,同時保持其它位點的一溫度低於該熱循環中使用的一最高溫度;及一基於等溫酶的擴增方法,其中該控制溫度步驟包括以下步驟:將該靶位點的該溫度設定為大於或等於至少一種與擴增相關的酶的一活化溫度。
  13. 如請求項5所述之方法,其中在從該熱控制裝置中除去該等經分離的單鏈核酸分子後,將該擴增混合物施加於該等經分離的單鏈核酸分子。
  14. 如請求項4所述之方法,其中該讀取操作包括恢復經分離成單鏈核酸分子的該等雙鏈核酸分子。
  15. 如請求項14所述之方法,其中每個雙鏈核酸分子包含與該複數個位點之一位點處的一表面結合 的一結合鏈,及與該結合鏈結合的另一條鏈;及該恢復步驟包括以下步驟:施加包含一恢復引物的一恢復混合物,該恢復引物用於與每個經分離的雙鏈核酸分子的該結合鏈的一端處的一標記部分的至少一部分退火。
  16. 如請求項15所述之方法,其中該標記部分包括一與位址無關的部分,該與位址無關的部分對於在一給定位點處具有不同位址部分的雙鏈核酸分子是相同的,及該恢復引物與該與位址無關的部分互補。
  17. 如請求項14所述之方法,其中在該恢復期間,該靶位點保持在比其他位點更低的一溫度。
  18. 如請求項1所述之方法,其中當執行一寫入操作時,該靶位點保持在比其他位點更低的一溫度,以提供相較於在其他位點而言在該靶位點處形成該等新的雙鏈核酸分子之一更大的機率。
  19. 如請求項1所述之方法,其中該寫入操作包括:提供與該靶位點處的一表面結合的單鏈核酸的標記片段;及供應對應於該等新的雙鏈核酸分子的一單鏈核酸分子的寫入組,該單鏈核酸分子的寫入組中的每一者包括與該等標記片段互補的一標記部分,該靶位點處的 該不同的溫度提供相較於其他位點而言該單鏈核酸分子的寫入組在該靶位點處與該等標記片段退火之一更大的機率。
  20. 如請求項19所述之方法,其中該寫入操作亦包括施加一延伸混合物以延伸每個標記片段,該每個標記片段具有與該單鏈核酸分子之與該標記片段退火的一剩餘部分互補的鹼基,以形成一對應的雙鏈核酸分子。
  21. 如請求項19所述之方法,其中該單鏈核酸分子的寫入組暴露於該熱控制裝置之包括該靶位點的至少兩個位點。
  22. 如請求項1所述之方法,其中該熱控制裝置包括一基板,及該複數個位點設置在該基板上的相應位置處;每個位點包含用於附著單鏈核酸分子或雙鏈核酸分子之至少一個附著表面;及在一給定位點處的該至少一個附著表面的一總表面積大於該給定位點到該基板的一平面上的一投影的一面積。
  23. 如請求項1所述之方法,其中該熱控制裝置包括:複數個主動性熱區域,該複數個主動性熱區域設置 在一基板上的相應位置處,每個主動性熱區域包括一加熱元件及一絕熱層,該加熱元件被配置為將一可變量的熱施加至該複數個位點中的一對應位點,該絕熱層設置在該加熱元件和該基板之間;及一或多個被動性熱區域,該一或多個被動性熱區域設置在該基板上的該複數個主動性熱區域之間,每個被動性熱區域包括一導熱層,該導熱層被配置為將熱傳導到該基板;其中該一或多個被動性熱區域的該導熱層在垂直於該基板的一平面的一方向上具有比該複數個主動性熱區域的該絕熱層較低之一熱阻。
  24. 一種用於存取使用雙鏈核酸分子設置的資料存儲的電腦可讀取程式或資料結構,該電腦可讀取程式或資料結構包括指令或控制資料,該等指令或該控制資料用於控制一設備執行請求項1至23中的任一項所述的方法。
TW108119665A 2018-07-26 2019-06-06 用於存取使用雙鏈核酸分子設置的資料存儲的方法、電腦可讀取程式和資料結構 TWI828700B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB1812169.9A GB2576304B (en) 2018-07-26 2018-07-26 Accessing data storage provided using double-stranded nucleic acid molecules
GB1812169.9 2018-07-26

Publications (2)

Publication Number Publication Date
TW202008381A TW202008381A (zh) 2020-02-16
TWI828700B true TWI828700B (zh) 2024-01-11

Family

ID=63518297

Family Applications (1)

Application Number Title Priority Date Filing Date
TW108119665A TWI828700B (zh) 2018-07-26 2019-06-06 用於存取使用雙鏈核酸分子設置的資料存儲的方法、電腦可讀取程式和資料結構

Country Status (7)

Country Link
US (1) US11854668B2 (zh)
EP (1) EP3827435A1 (zh)
CA (1) CA3105954A1 (zh)
GB (1) GB2576304B (zh)
SG (1) SG11202100073UA (zh)
TW (1) TWI828700B (zh)
WO (1) WO2020021221A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2621385A (en) 2022-08-11 2024-02-14 Evonetix Ltd Reaction duration control for reaction performed on biomolecule samples

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102448977A (zh) * 2009-04-09 2012-05-09 加州理工学院 用于聚合物合成的多路复用位点
CN106845158A (zh) * 2017-02-17 2017-06-13 苏州泓迅生物科技股份有限公司 一种利用dna进行信息存储的方法
WO2017190297A1 (zh) * 2016-05-04 2017-11-09 深圳华大基因研究院 利用dna存储文本信息的方法、其解码方法及应用
US20180046921A1 (en) * 2014-08-08 2018-02-15 Thomson Licensing Code generation method, code generating apparatus and computer readable storage medium

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE29917313U1 (de) * 1999-10-01 2001-02-15 Mwg Biotech Ag Vorrichtung zur Durchführung chemischer oder biologischer Reaktionen
US20030228598A1 (en) * 2002-03-25 2003-12-11 The Regents Of The University Of California DNA/RNA as a write/read medium
EP2231876B1 (en) * 2007-12-24 2012-08-01 Honeywell International Inc. A programmable oligonucleotide micro array
US9208864B2 (en) * 2013-10-14 2015-12-08 Toshiba America Electronic Components, Inc. Semiconductor memory with integrated biologic element
WO2015144858A1 (en) * 2014-03-28 2015-10-01 Thomson Licensing Methods for storing and reading digital data on a set of dna strands
CN110024037B (zh) * 2016-11-30 2023-06-27 微软技术许可有限责任公司 经由连接的dna随机存取存储系统
GB2557592A (en) * 2016-12-09 2018-06-27 Evonetix Ltd Temperature control device
US10839948B2 (en) 2016-12-29 2020-11-17 Intel Corporation Microfluidic information-encoding polymer data storage
EP3542903A1 (en) * 2018-03-22 2019-09-25 IMEC vzw Memory writing
JP2022531790A (ja) * 2019-05-09 2022-07-11 カタログ テクノロジーズ, インコーポレイテッド Dnaに基づくデータ記憶における探索、算出、および索引付けのためのデータ構造および動作
SG11202012811RA (en) * 2019-05-31 2021-01-28 Illumina Inc Flow cell with one or more barrier features

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102448977A (zh) * 2009-04-09 2012-05-09 加州理工学院 用于聚合物合成的多路复用位点
US20180046921A1 (en) * 2014-08-08 2018-02-15 Thomson Licensing Code generation method, code generating apparatus and computer readable storage medium
WO2017190297A1 (zh) * 2016-05-04 2017-11-09 深圳华大基因研究院 利用dna存储文本信息的方法、其解码方法及应用
CN106845158A (zh) * 2017-02-17 2017-06-13 苏州泓迅生物科技股份有限公司 一种利用dna进行信息存储的方法

Also Published As

Publication number Publication date
EP3827435A1 (en) 2021-06-02
CA3105954A1 (en) 2020-01-30
US20210280274A1 (en) 2021-09-09
GB201812169D0 (en) 2018-09-12
GB2576304B (en) 2020-09-09
SG11202100073UA (en) 2021-02-25
GB2576304A (en) 2020-02-19
US11854668B2 (en) 2023-12-26
WO2020021221A1 (en) 2020-01-30
TW202008381A (zh) 2020-02-16

Similar Documents

Publication Publication Date Title
Organick et al. Random access in large-scale DNA data storage
JP7430701B2 (ja) 核酸鎖の大規模並列酵素合成
ES2563643T3 (es) Método de secuenciación de ácido nucleico
JP7364604B2 (ja) 核酸ベースのデータ記憶のための化学的方法
US11305527B2 (en) Printer-finisher system for data storage in DNA
Akram et al. Trends to store digital data in DNA: an overview
Zhou et al. Development of genome-wide InDel markers and their integration with SSR, DArT and SNP markers in single barley map
TWI828700B (zh) 用於存取使用雙鏈核酸分子設置的資料存儲的方法、電腦可讀取程式和資料結構
KR20210029147A (ko) 핵산-기반 데이터를 저장하기 위한 조성물 및 방법
US11795450B2 (en) Array-based enzymatic oligonucleotide synthesis
US20210309991A1 (en) Methods of gene assembly and their use in dna data storage
Wang et al. Data Storage Using DNA
US20200248254A1 (en) Error detection during hybridisation of target double-stranded nucleic acid
US11276481B2 (en) Method for writing data in nucleic acid based memories
Ichinose et al. Substitutional RNA editing in plant organelles
Yu et al. High-throughput DNA synthesis for data storage
US20190009240A1 (en) Apparatus Enabling High Density Information Storage in Molecular Chains
US20230332140A1 (en) Layered coding architectures for nucleic acid memory
Weide-Zaage Dna Digital-storage: Advantages, Approach and Technical Implementation
US20190284620A1 (en) Systems and methods for data storage in nucleic acids
KR20190082143A (ko) 데이터 기록 방법
Akhtar et al. Experimental Approaches for Genome Sequencing
WO2024027620A1 (zh) 一种数据存储介质及其应用
KR20230074153A (ko) 온도 제어 유체 반응 시스템
US20180202072A1 (en) Sequence-independent nucleic acid assembly