TW202302860A - 多重螢光原位雜交成像的稀疏編碼簿的產生與使用 - Google Patents
多重螢光原位雜交成像的稀疏編碼簿的產生與使用 Download PDFInfo
- Publication number
- TW202302860A TW202302860A TW111110273A TW111110273A TW202302860A TW 202302860 A TW202302860 A TW 202302860A TW 111110273 A TW111110273 A TW 111110273A TW 111110273 A TW111110273 A TW 111110273A TW 202302860 A TW202302860 A TW 202302860A
- Authority
- TW
- Taiwan
- Prior art keywords
- codewords
- negative control
- pixel
- codeword
- word
- Prior art date
Links
- 238000003384 imaging method Methods 0.000 title claims description 18
- 238000002509 fluorescent in situ hybridization Methods 0.000 title description 2
- 239000013642 negative control Substances 0.000 claims abstract description 148
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 92
- 238000000034 method Methods 0.000 claims abstract description 32
- 239000000523 sample Substances 0.000 claims description 27
- 230000005284 excitation Effects 0.000 claims description 22
- 239000003153 chemical reaction reagent Substances 0.000 claims description 19
- 239000007788 liquid Substances 0.000 claims description 6
- 238000013518 transcription Methods 0.000 claims description 4
- 230000035897 transcription Effects 0.000 claims description 4
- 238000012937 correction Methods 0.000 claims description 2
- 238000004590 computer program Methods 0.000 claims 10
- 239000007850 fluorescent dye Substances 0.000 claims 1
- 238000012545 processing Methods 0.000 description 20
- 210000004027 cell Anatomy 0.000 description 17
- 239000011159 matrix material Substances 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 230000002068 genetic effect Effects 0.000 description 5
- 238000009396 hybridization Methods 0.000 description 5
- 238000007901 in situ hybridization Methods 0.000 description 5
- 238000003860 storage Methods 0.000 description 5
- 101150061292 83 gene Proteins 0.000 description 4
- 238000003556 assay Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 239000012530 fluid Substances 0.000 description 3
- 239000002751 oligonucleotide probe Substances 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 238000009827 uniform distribution Methods 0.000 description 3
- 230000004075 alteration Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000002894 chemical waste Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 238000013442 quality metrics Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 101150106774 9 gene Proteins 0.000 description 1
- 102100026561 Filamin-A Human genes 0.000 description 1
- 101000913549 Homo sapiens Filamin-A Proteins 0.000 description 1
- 101000881252 Homo sapiens Spectrin beta chain, non-erythrocytic 1 Proteins 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 102100037612 Spectrin beta chain, non-erythrocytic 1 Human genes 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000002073 fluorescence micrograph Methods 0.000 description 1
- 238000000799 fluorescence microscopy Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000001000 micrograph Methods 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 230000002572 peristaltic effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000010926 purge Methods 0.000 description 1
- 239000000376 reactant Substances 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
- G16B25/10—Gene or protein expression profiling; Expression-ratio estimation or normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/751—Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/98—Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/69—Microscopic objects, e.g. biological cells or cellular parts
- G06V20/693—Acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/69—Microscopic objects, e.g. biological cells or cellular parts
- G06V20/698—Matching; Classification
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
- G16B50/20—Heterogeneous data integration
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6841—In situ hybridisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/04—Recognition of patterns in DNA microarrays
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Medical Informatics (AREA)
- Genetics & Genomics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Bioinformatics & Computational Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Biomedical Technology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Quality & Reliability (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Bioethics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Investigating Or Analysing Materials By The Use Of Chemical Reactions (AREA)
Abstract
產生編碼簿的方法包括對於編碼簿獲取第一複數個基因識別碼字。每一基因識別碼字由N個位元的一序列表示,其對應於與識別基因的像素資料值的最佳匹配。產生複數個陰性對照碼字,且每一陰性對照碼字由N個位元的序列表示。陰性對照碼字具有相同數量的開值。複數個陰性對照碼字的開值均勻分佈於N個位元中,使得N個位元的序列中之每一序數位置具有來自複數個陰性對照碼字的相同總數的開位元,且每一陰性對照碼字與每一基因識別碼字之間的漢明距離至少為距離臨界值。
Description
本說明書係關於用於多重螢光原位雜交(Multiplexed fluorescence in-situ hybridization; mFISH)成像的稀疏編碼使用。
多重螢光原位雜交(mFISH)成像為確定空間轉錄學中基因表現的強大的技術。簡而言之,將樣本曝露於靶向感興趣RNA的多個寡核苷酸探針。隨後,藉由曝露於不同波長的激發光及/或光漂白,隨後曝露於更多輪的寡核苷酸探針,獲得連續輪的螢光影像。對於每一給定的像素,不同影像的螢光強度形成訊號序列。隨後將此序列與來自編碼簿的參考碼庫比較,該編碼簿使每一碼與一基因相關。使用最佳的匹配參考碼識別在影像中的彼像素表現的相關基因。
用於識別基因的編碼簿可包括若干陰性對照碼字。此等碼字藉由隨機對一碼字的每一位元指定開或關值,建立不對應於樣本中任何基因的訊號序列來產生。使用陰性對照碼字區別在成像期間產生的影像序列中發現的真陽性、偽陽性及空白匹配。對應於最常匹配的陰性對照碼字的訊號確定最低的訊號,該最低的訊號需要另外的識別資訊以可信地匹配至一基因。
在一個態樣中,空間轉錄學的方法包括:自mFISH成像系統接收樣本的複數個影像,對於在複數個影像中暫存的複數個像素中之每一像素,自複數個影像的複數個像素中之每一像素的強度值產生一像素字,其中每一像素字由N個強度值的序列表示。對於複數個像素中之每一像素,將像素的像素字與包括複數個碼字的編碼簿比較,且複數個碼字中對像素字的最近匹配碼字得以識別。每一碼字由N個位元的序列表示。複數個碼字包括複數個基因識別碼字及複數個陰性對照碼字,且複數個陰性對照碼字具有相等數量的開值。複數個陰性對照碼字的開值均勻分佈於N個位元中,使得N個位元的序列中之每一序數位置具有來自複數個陰性對照碼字的相同總數的開位元。確定與最近匹配碼字相關的基因或誤差,且對於複數個像素中之至少一個像素,儲存像素與基因或誤差的相關性。
在另一態樣中,產生編碼簿的方法包括對於編碼簿獲取第一複數個基因識別碼字。複數個基因識別碼字中之每一基因識別碼字由N個位元的序列表示。第一子集的碼字中之每一碼字包括一位元序列,且該位元序列對應於與識別基因的像素資料值的一最佳匹配。產生複數個陰性對照碼字,複數個基因識別碼字中之每一陰性對照碼字由N個位元的序列表示。複數個陰性對照碼字具有相同數量的開值。複數個陰性對照碼字的開值均勻分佈於N個位元中,以使得N個位元的序列中之每一序數位置具有來自複數個陰性對照碼字的相同總數的開位元,並且每一陰性對照碼字與每一基因識別碼字之間的漢明距離至少為距離臨界值。
實施方式可包括以下特徵中之一或多者。
識別複數個碼字中最靠近像素字的匹配碼字可包括確定碼字與像素字之間的歐氏距離。接收樣本的複數個影像可包括接收樣本的N個影像,其中N個強度值的序列中之每一強度值對應於N個影像中之一者。N可為s 16。對於每一基因識別碼字,可計算像素字與基因識別碼字的匹配計數。對於匹配計數大於可信度臨界值的每一基因識別碼字及最近匹配碼字為基因識別碼字的每一像素,可儲存像素與基因識別碼字的相關。複數個碼字中之任兩個碼字之間的漢明距離可為相等的。漢明距離可等於4。
對於每一陰性對照碼字,可計算像素字與陰性對照字的匹配計數,以產生複數個匹配計數。可將複數個匹配計數中之最大計數選為可信度臨界值。對於每一基因識別碼字,可計算像素字與基因識別碼字的匹配計數及大於可信度臨界值的匹配計數。對於最近匹配碼字為基因識別碼字的每一像素,可儲存像素與基因識別碼字的相關性。
編碼簿可有140個碼字。可將複數個基因識別碼字及複數個陰性對照碼字儲存為編碼簿。
實施方式的優點可包括但不限於以下優點中之一或多者。
本文揭示在mFISH成像期間產生用於識別基因靶的編碼簿的方法,其中產生陰性對照碼字,每一碼字及所有碼字中的每一位置有均勻數量的開值。此方法減小陰性對照碼字位置之間的可能的簡併性,且確保碼字集在編碼簿基因碼字之間實現更均勻的漢明距離間隔。陰性對照碼字集中開關值的均勻分佈減少偽陽性匹配的出現,由此增加真陽性基因識別的訊號可信度,並允許在不增加編碼簿大小的情況下正確識別更多基因靶。
增加所收集影像的每一序列的陽性基因識別使得總試驗處理量更高且結果的可信度更高,減少非決定性資料的收集,並且提高試驗再現性。藉由過濾更少的偽陽性且提高所收集訊號的可信度,亦減少試劑的使用,從而帶來經濟收益。在更低偽陽性率及與陰性對照的序列匹配的更佳過濾方面,下游分析亦得到改良。
以下的附圖及描述中闡述了一或多個實施例的細節。其他特徵、態樣及優點將在描述、圖式及申請專利範圍中顯而易見。
目前在編碼簿中產生陰性對照碼字集的方法使用包含隨機放置的開值的稀疏二進制碼的隨機序列,漢明權重(例如開值的數量)與編碼簿中每一碼字的長度相比較低(例如總碼字長度的25%或更少)。對於每一陰性對照碼字計算與編碼簿的最近基因識別碼字的漢明距離,且廢除漢明距離小於距離臨界值的陰性對照碼字,並再次隨機產生陰性對照碼字。一旦所有所產生的陰性對照碼字超過與剩餘基因識別碼字的漢明距離臨界值,則編碼簿完整。隨後使用此編碼簿對所收集mFISH影像的序列中每一像素位置的多重訊號進行去卷積,並且將訊號序列匹配至對應於基因靶的碼字,以用於基因識別。隨機產生的陰性對照碼字用作偽陽性及與已知陰性對照碼字的匹配的過濾器。
然而,使用隨機產生的碼字的此方法可導致不一致的位元位置簡併性,其中陰性對照碼字集中給定行位置處的每一位元為所有陰性對照碼字中的開或關值(例如一位元位置中的所有開或所有關值)。如此導致不一致的訊號歸一化,且需要試驗迭代以提高資料可信度。此等問題為導致分析處理量降低的關鍵問題。識別偽陽性及高陰性對照訊號結果的低效率導致工作產出重複,導致資料輸出不一致,試劑使用增加,且試驗處理量減少。
產生陰性對照碼字集的有利方法包括兩步驟過程:產生碼字,其中每一碼字包含已知數量的開值位元(例如,1s);及產生碼字,其中開位元均勻分佈於所有行位置。此方法保持相同的漢明距離臨界值,並且提高所收集資料的總體品質,以提高試驗處理量,減少使用的試劑,且減少專案時間。
參考第1圖,多重螢光原位雜交(mFISH)成像及影像處理裝置100包括:液流槽110,其保持樣本10;螢光顯微鏡120,其獲取樣本10的影像;及控制系統140,其控制mFISH成像及影像處理裝置100的各個部件的操作。控制系統140可包括執行控制軟體的電腦142(例如具有記憶體、處理器等)。
螢光顯微鏡120包括激發光源122,其可產生多個不同波長的激發光130。特定而言,激發光源122可產生在不同時間具有不同波長的窄頻寬光束。舉例而言,激發光源122可由多波長連續波雷射系統提供,例如多個雷射模組122a,其可經獨立啟用以產生不同波長的雷射束。雷射模組122a的輸出可多路復用為共同光束路徑。
螢光顯微鏡120包括顯微鏡體124,其包括各個光學部件以將激發光自光源122引導至液流槽110。舉例而言,來自光源122的激發光可耦合為多模光纖,可由一組透鏡重聚焦且擴張,隨後藉由諸如高數值孔徑(numerical aperture; NA)物鏡136的核心成像部件將其引導至樣本中。當需要轉換激發通道時,可停用多個雷射模組122a中之一者且可啟用另一雷射模組122a,其中藉由一或多個微控制器144、146完成器件間的同步。
可將物鏡136或整個顯微鏡體124安裝於耦接至Z型驅動致動器的可垂直移動的支座上。調整Z位置(例如藉由控制Z型驅動致動器的微控制器146)可實現焦點位置的微調。替代或另外地,可藉由Z型驅動致動器118b(例如軸向壓電平臺)垂直移動液流槽110(或液流槽110中支撐樣本的平臺118)。此壓電平臺可允許進行精確且迅速的多平面影像擷取。
將待成像的樣本10安置於液流槽110中。液流槽110可為具有約2 cm乘2 cm的面積的截面積(平行於物體或顯微鏡的影像平面)的腔室。可在液流槽中的平臺118上支撐樣本10,可例如藉由允許XY運動的一對線性致動器118a使平臺118(或整個液流槽110)側向移動。如此允許以不同的側向偏置的視野(fields of view; FOV)擷取樣本10的影像。或者,可在可側向移動的平臺上攜載顯微鏡體124。
液流槽110的入口連接至一組雜交試劑源112。可藉由控制器140控制多閥定位器114以在源之間切換,以選擇將何試劑112a提供至液流槽110。每一試劑包括不同組的一或多個寡核苷酸探針。每一探針定位感興趣的不同的RNA序列,且具有不同組的一或多個螢光材料(例如磷光體),可用不同波長組合激發該等螢光材料。除試劑112a以外,可有淨化流體112b(例如去離子(deionized; DI)水)的源。
液流槽110的出口連接至泵116(例如蠕動泵),亦可藉由控制器140控制該泵116以控制液體(例如試劑或淨化流體)穿過液流槽110的流動。來自液流槽110的經使用溶液可藉由泵116傳送至化學廢料管理子系統119。
在操作中,控制器140使光源112發射激發光130,該激發光使樣本10中的螢光材料發生螢光反應,例如結合至樣本中RNA且由激發光的波長激發的探針的螢光反應。藉由顯微鏡體124的物鏡136收集所發射的螢光132以及反向傳播的激發光,例如自樣本、平臺等散射的激發光。
可藉由顯微鏡體124中的多頻帶雙色鏡138過濾收集的光,以自反向傳播的照明光分離所發射的螢光,且將發射的螢光傳輸至攝影機134。攝影機134可為高解析度(例如2048x2048像素)CMOS(例如科學CMOS)攝影機,且攝影機134可安裝於物體的直接影像平面處。當由訊號觸發時(例如自微控制器),可擷取來自攝影機的影像資料,例如發送至影像處理系統150。由此,攝影機134可自樣本收集影像的序列。
為進一步移除殘餘的激發光且使激發通道之間的串擾減至最小,可將每一雷射發射波長與對應的帶通發射過濾器128a相配對。每一過濾器128a可具有10-50 nm的波長,例如14-32 nm的波長。將過濾器安裝於可藉由致動器128b旋轉的高速濾色輪128上。可安裝濾色輪128(例如安裝於無限空間),以使成像路徑中的光學像差最小。在通過濾色輪128的發射過濾器之後,可藉由鏡筒透鏡使清潔後的螢光訊號重聚焦,且藉由攝影機134擷取該等螢光訊號。可將雙色鏡138安置於物鏡138與濾色輪128之間的光徑中。
控制軟體協調電腦142與裝置100的裝置部件之間的通信。此控制軟體可將所有裝置部件的驅動器整合於單一框架中,且從而可允許使用者將成像系統用作單一儀器(而非需單獨控制許多器件)。
對於z軸、色彩通道(激發波長)、側向FOV及試劑的可能值的每一組合,擷取螢光影像。使用資料處理系統150處理影像,且確定基因表現以產生空間轉錄資料。資料處理系統150最少包括:資料處理器件152,例如由儲存於電腦可讀媒體上的軟體控制的一或多個處理器;及局部儲存器件154,例如非揮發性電腦可讀媒體,其接收由攝影機134擷取的影像。
在一些實施方式中,在接收影像時,資料處理系統150執行運行中影像處理。特定而言,當進行資料擷取時,資料處理器件152可執行影像預處理步驟,例如過濾及去卷積,可對儲存器件154中的影像資料執行該等步驟,但其不需要整個資料集。
第2圖說明資料處理方法的流程圖,其中在擷取所有影像之後執行處理。過程開始於系統接收原始影像檔案及支援檔案,例如中繼資料(步驟202)。特定而言,資料處理系統可自攝影機接收完整的原始影像集,例如z軸、色彩通道(例如激發波長)、側向FOV及試劑的可能值的每一組合的影像。
自攝影機接收的影像檔案可視情況包括中繼資料,即獲得影像的硬體參數值(例如平臺位置、像素大小、激發通道等)。資料圖提供基於硬體參數排序影像的規則,使得按合適的次序將影像放置於一或多個影像堆疊中。若不包括中繼資料,則資料圖可使影像的次序與用於產生彼影像的z軸、色彩通道、側向FOV及試劑的值相關。
在更密集的處理之前,可使收集的影像經過一或多個品質度量(步驟203),從而篩去品質不足的影像。僅滿足品質度量的影像經傳遞以進行進一步處理。
為偵測感興趣的區域,可對所收集的每一影像確定亮度品質值。可使用亮度品質以確定影像中是否存在任何單元。舉例而言,可對影像中所有像素的強度值求和,並將其與臨界值比較。若總數小於臨界值,則此表示影像中基本無任何東西,即影像中無單元,並且無感興趣的資訊,且不需要處理影像。
隨後,處理每一影像以移除實驗假影(步驟204)。由於探針在不同激發通道時每一RNA分子將雜交多次,多通道多輪影像堆疊上的嚴格對準有益於揭示整個FOV上的RNA同一性。移除實驗假影可包括視野平坦化及/或色差校正。
處理每一影像以提供RNA影像點銳化(步驟206)。RNA影像點銳化可包括應用過濾器以移除單元背景及/或使用點散佈函數去卷積以銳化RNA點。為使RNA點與相對亮的背景區別開,對影像應用低通過濾器,例如應用於視野平坦化及色校正的影像以移除RNA點周圍的單元背景。進一步使用2D點散佈函數(point spread function; PSF)對過濾後的影像進行去卷積,以銳化RNA點,並使用具有半像素寬度的2D高斯核心進行卷積,以使點略微平坦。
註冊具有相同FOV的影像,以對準其中的特徵,例如單元或單元細胞器(步驟208)。為準確識別影像序列中的RNA物種,可將不同輪影像中的特徵對準例如至子像素精確度。特定而言,高強度區域應通常位於相同FOV的多個影像上的相同位置。可用於影像間註冊的技術包括相位相關演算法及相互資訊(mutual-information; MI)演算法。
在註冊FOV中的影像之後,可執行空間轉錄分析(步驟210)。首先,相對於影像中的最大強度值,對影像中的強度值歸一化。舉例而言,確定最大強度值,且用所有強度值除以最大值,從而強度值在0與I
MAX(例如1)之間變化。
然後分析影像中的強度值,以確定上分位數,其包括最高強度值,例如99%及更高的分位數(亦即上1%)。可確定且儲存此分位數限制的強度值。將上分位數中具有強度值的所有像素重設為具有最大強度值,例如1。隨後將剩餘像素的強度值分檔且調整以到達相同的最大值(例如1)。為此,將不在上分位數中的像素的強度值除以分位數限制所儲存的強度值。
參考第3圖解釋解碼影像。可將特定FOV的對準影像視為包括多個影像層的堆疊,每一影像層為X乘Y個像素,例如2048x2048個像素。影像層的數量B取決於色彩通道的數量(例如激發波長的數量、N_通道)及雜交的數量(例如反應物的數量、N_雜交)之組合,例如B=N_雜交*N_通道。在一些實施方式中,B=16。
在歸一化之後,將此影像堆疊評估為像素字的2D矩陣302。矩陣302具有P列304及B行306,其中P=X*Y,B為對於給定FOV的堆疊中影像的數量。每一列304對應於像素中之一者(堆疊中多個影像的同一像素),列304的強度值表示像素字310。每一行306提供字310中值中之一者,亦即對於彼像素的影像層的強度值。如上文所述,值可經歸一化,例如在0與I
MAX之間變化。第3圖將不同的強度值表示為各別單元的不同程度的陰影。
資料處理系統150儲存編碼簿322,其用於解碼影像資料以識別特定像素處表現的基因。編碼簿322包括多個參考碼字,且每一參考碼字與特定基因或陰性對照碼字相關。如第3圖所示,可將編碼簿322表示為具有R列324及B行326的2D矩陣。R個列324包括:第一群組的G列,其中G為基因識別碼字的數量,例如編碼簿322可解碼的基因的數量;及第二群組的E列,其中E為陰性對照碼字的數量。通常R=G+E。第3圖的編碼簿322包括12行(例如B=12),且在一些實施方式中,B可更大(例如B=16)。藉由之前的校準確立基因字G,且其對應於已知基因的預期的像素字。下文進一步描述陰性對照字E的設計。
每一列324包含B值(例如位元)的序列且對應於碼字330中之一者,例如基因識別碼字或陰性對照碼字,且每一行326提供參考碼字330中的值中之一者。對於每一行326,參考碼330中的值可為二元的,亦即「開」或「關」。舉例而言,每一值可為0或I
MAX,例如1。第3圖用各別單元的光及暗影表示開及關值。
B值的每一碼字具有2
B個可分配的值組合。然而,使用基因或陰性對照字的此等總可分配值的一部分並且使剩餘部分為未分配,從而允許編碼簿322的陰性對照設計。編碼簿維持所有列324的兩個參數:每一列324與其他列324共有相同的漢明權重(H
W)及最小漢明距離(H
D)。
碼字的H
W為每一列324的開值的數量,且列324之間均勻的H
W減小不成比例的像素值錯誤識別偏差。另外,與編碼簿322的總碼字長度相比維持列324中的低H
W(例如每一列四個開值)進一步減小錯誤識別頻率,由此提高準確度。
每一列324之間的H
D為位置的數量,其中相等長度的兩個數值串(例如一參考串及一碼串)不同且計算為碼串及對應參考串中每一值位置之間絕對差的和,此為量測兩個二進制串之間資訊-距離的方法。換言之,其量測將一串變為另一串所需的最小替代數,或可將一串轉換為另一數的最小誤差數。舉例而言,給定兩個六位串,
參考:010101
碼:011001
H
D為2,串需要兩個值替代(例如在第三及第四位置)來互換。可將此計算表示為:
其中將編碼簿322用作參考,H
D在0(例如相同串)與B,總行數(例如正交串)之間有包含極值。用於設計陰性對照碼字的資訊-距離準則可為編碼簿的字之間的最小值、最大值或精確值的漢明距離。若使用由2或更大的漢明距離分隔的碼字,則無單個值-誤差(例如將「0」錯誤識別為「1」)可將一碼字轉換為另一碼字,因此降低錯誤識別率。提高漢明距離分隔要求進一步降低錯誤識別率。在一些實施方式中,漢明距離至少為四(例如> 4)。
編碼簿322包括:若干碼字,其對應於陰性對照字,當匹配時,該等陰性對照字識別偽陽性或已知的陰性像素字310;及非感測字,其不對應於編碼簿322中的任何基因。陰性對照字為組成編碼簿322一部分的若干列324(E),其包括編碼簿322的總列R的5%至25%。舉例而言,包括140個列324的編碼簿322可保留對應於基因識別碼字330(G)的132列及對應於陰性對照字(E)的8列(R的~6%)。使用第3圖的實例,編碼簿322包括9個基因識別碼字330(例如總列R的75%)及3個陰性對照字(例如總列R的25%)。
可按演算法的方式,經由使用編碼語言產生編碼簿322。以下實例提供產生140字編碼簿322(例如編碼簿322中,R=10,B=16,例如X
ij其中i=1,2,…,140,j=1,2,…,16)的方法,其中包括一組M個陰性對照碼字(例如M = E < R,且B = 16,例如Y
ij中i=1,2,…,M,j=1,2,…,16)。
對於編碼簿322定義陰性對照碼字的每一位元位置(例如行)的H
W、H
D及開值(N)的數量。在一個實例中,H
W=4,H
D=4,及開值的數量為2(N=2,其中N=iY
ij(2))。為確定滿足以上條件的一組陰性對照碼字(例如Mij),定義目標陣列L
j(j=1,2,…,16)=N。自目標陣列(L
j-X
1j)減去第一碼字(i=1),且計算更新的餘數(S),使得S=L
j- X
1j。
將第一陰性對照碼字(X
1j)與該組M個陰性對照碼字(M
1j(2) = X
1j)相加。藉由自上文計算的餘數減去每一剩餘的陰性對照碼字,確定剩餘編碼簿(X
ij,其中i ≠1)中的下一陰性對照碼字,使得S’ = L
j- X
ij,其中i≠1且{ x ∈ Z | x = -1,0,1,…}(Z表示整數集)。
確定返回最小餘數值的第二陰性對照碼字(X
i),且將第二陰性對照碼字與該組陰性對照碼字相加(例如M
2j(1)= X
2j)。
重複上述步驟,直至iM
ij(2) = 1。更新編碼簿322,X’= { x | x ∈ X且x∉ y
ij1}。藉由使用更新後的編碼簿322 X’且迭代上述步驟直至n+1=N,找出n+1個子集M
ij(n+1)。最終組的陰性對照碼字(M)將為M
ij= n =iM
ij(n+1)。
低比率發生的位元轉換誤差及編碼簿322中的陰性對照字使得經由識別包括一或多個誤差的感測或非感測像素字的基因字識別的可信度提高。舉例而言,若不正確識別像素字中的值,例如將「0」識別為「1」或反之,則像素字不再處於正確基因字的資訊-距離中且由此得到錯誤的識別。這可導致基因計數缺失,且若對應的基因字在資訊-距離上離相鄰的基因字太近,則可能將像素字錯誤識別為第二個不正確的基因字。用若干準則設計陰性對照字,在每一陰性對照字之間形成最小資訊-距離,並將每一陰性對照字330中的值均勻分佈於陰性對照列E的行316中。
下文描述的產生編碼簿322的陰性對照碼字的技術可藉由在陰性對照與碼字碼字之間產生對稱資訊-距離而提供額外的資料完整性層。該計數亦可將開值的數量及排列均勻(例如平均地)分佈於編碼簿322的所有行中。第4A圖及第4B圖為用表格形式說明的編碼簿322的兩組例示性陰性對照碼字。兩個例示性組均保持碼字(例如列)之間的相同常數Hw(例如4)及最小H
D(例如> 4),而行的總數(B=16)對應於16位陰性對照碼字的每一序數位置。然而,在第4A圖中,隨機產生開位元的序數位置,但在第4B圖中,產生開位元的序數位置以保持常數行和值,例如相同總數的開位元。在第4A圖及第4B圖的表下方,對每一行求和,且各行下展示表示開位元總數的值(例如表400的第1行具有值0,而表400的第8行具有值3)。
第4A圖表示表400中具有16行(B)的六個陰性對照字400a至400f。使用隨機值分佈產生陰性對照字400a至400f。隨機產生的碼字表可包括有問題的排列,例如表400,其中將前五個值行確定為「關」值(0)。這使碼字表400的行包含攜帶字基因字704的距離計算的不等權重的開值。另外,多行中的零行和值導致序數位置開值簡併性,基本上形成位元長度減小的表,且將距離計算可用的資訊空間自16位減少至11,由此降低了陰性對照碼字識別偽陽性的解析度。
第4B圖表示表400中具有16行(B)的八個陰性對照字400a至400h。使用均勻行和值分佈產生陰性對照字400a至400h(例如平均分佈),例如所有值行中的常數和值(例如2)。此額外的陰性對照碼字產生準則確保陰性對照字410a至410h中的所有序數位置在解碼像素時具有資訊-距離計算的相同權重。
再次參考第3圖,對於待解碼的每一像素,在像素字310與每一參考碼字330之間計算距離d(p,i)。舉例而言,可將像素字310與參考碼字330之間的距離計算為歐氏距離,例如像素字中每一值與參考碼字中對應值之間的平方差之和。可將此計算表示為:
其中I
p,x為像素字的矩陣302的值,且C
i,x為參考碼字的矩陣322的值。可使用其他度量來代替歐氏距離,例如差的絕對值的和、餘弦角、相關性等。
一旦對於給定像素計算每一碼字的距離值,則確定最小距離值,將提供彼最小距離值的碼字選為最近匹配碼字。舉例而言,自將碼字與基因相關的查找表確定對應於彼最近匹配碼字的基因,並且將像素標為表現基因。
回到第2圖,資料處理裝置可過濾出偽標註。過濾出偽標註的一種技術為廢除其中基因的所指示表現大於臨界值(例如若d(p,i) > D
1MAX)的距離值d(p,i)的標記。
當影像堆疊及基因字識別完成,則與陰性對照字中空碼字相關的最大強度值(例如計數)確定自不確定基因識別中過濾陽性的確定性臨界值。可使用額外的識別資訊使低於確定性臨界值的基因碼字高於確定性臨界值。舉例而言,第5A圖在成像、像素解碼及識別之後具有83個基因字及6個陰性對照字的編碼簿的對數直方圖(例如計數與碼字)。第5A圖進一步包括圖右側的灰度,其說明範圍自1(例如100%可信度)至0(例如0%可信度)的每一個別碼字的歸一化可信度級別。將陰性對照字標為Blank1至Blank6;基因字具有其他標誌,例如FLNA、SPTBN1等。使用編碼簿322的行中隨機分佈的值產生第5A圖的編碼簿322的陰性對照字,同一過程用於產生第4A圖中的表400。具有最高相關強度值(例如「Blank4」,502a)的陰性對照字確定陽性基因識別的可信度臨界值510a。若基因字的相關強度值低於臨界值510a,則將其視為不確定且非陽性識別,若高於臨界值510a,則將其視為可信識別的。
第5A圖頂部為陽性識別基因與不確定基因匹配的總比率(例如可信度)。總共83個基因字中的65個的強度值高於可信度臨界值510a,比率為78.3%。
第5B圖描述83個基因字及8個陰性對照字的編碼簿的對數強度值(例如計數)的直方圖。使用編碼簿322的行中均勻分佈的值產生第5B圖的陰性對照字,同一過程用於產生第4B圖中的表410。均勻的分佈確保表410中的每一行具有相等的權重,並且如上文所述,具有基因及陰性對照字的像素字的識別可信度更高。Blank4為陰性對照字,其具有最高相關強度值,產生臨界值510b。
在第5B圖頂部,總可信度比率為總共83個基因字中的75個具有高於可信度臨界值510a的強度值,比率為87.9%,與第5A圖中的相同資料集相比增加了8個可信識別的基因字。
雖然以上描述集中於具有16個位元的碼字,但本技術適用於其他位元長度的碼字。
本說明書中描述的標的之實施例可在計算系統中實施,該計算系統包括諸如資料伺服器的後端部件,或包括諸如應用伺服器的中間軟體,或包括諸如客戶端電腦(具有圖形使用者介面、網路瀏覽器或應用,使用者可經由該應用與本說明書描述的標的的實施方式交互)的前端部件,或包括此等後端部件、中間軟體或前端部件中之一或多者的任何組合。系統的部件可藉由數位資料通信的任何形式或媒體(例如通信網路)互連。通信網路的實例包括區域網路(local area network; LAN)及廣域網路(wide area network; WAN),例如網際網路。
雖然本說明書包含許多具體實施細節,但不應將此等視為限於任何發明的範疇或可主張的範疇,而視為特定發明的特定實施例的特徵的描述。亦可將本說明書描述的在單獨實施例的上下文中的某些特徵組合在單一實施例中實施。相反,亦可將在單一實施例的上下文中描述的各個特徵在多個實施例中單獨實施或以任何合適的子組合實施。另外,雖然上文可將特徵描述為在某些組合中使用或最初甚至如此主張,但在一些情況下可自組合刪除所主張組合的一或多個特徵,並且所主張的組合可涉及子組合或子組合的變化。
類似而言,雖然圖中示出且在請求項中以特定次序描述操作,但不應將此理解為要求以所示的特定次序或按順序執行此等操作或執行所有所說明的操作以實現想要的結果。在某些情況下,多任務及平行處理可為有利的。另外,不應將上文描述的實施例中的各個系統模組及部件的分隔理解為所有實施例中需要此分隔,且應理解為可大體而言將所描述的程式部件及系統一起整合為單一軟體產品或封裝為多個軟體產品。
已描述標的的特定實施例。其他實施例在以下請求項的範疇內。舉例而言,可按不同的次序執行請求項所述的行為,且仍實現想要的結果。作為一實例,附圖描述的過程不一定需要所示的特定次序或順序來實現想要的結果。在一些情況下,多任務及平行處理可為有利的。
10:樣本
100:多重螢光原位雜交成像及影像處理裝置
110:液流槽
112:雜交試劑源
112a:試劑
112b:淨化流體
114:多閥定位器
116:泵
118:平臺
118a:線性致動器
118b:Z型驅動致動器
119:化學廢料管理子系統
120:螢光顯微鏡
122:激發光源
122a:雷射模組
124:顯微鏡體
128:濾色輪
128a:過濾器
128b:致動器
130:激發光
132:螢光
134:攝影機
136:物鏡
138:雙色鏡
140:控制系統
142:電腦
144:微控制器
146:微控制器
150:資料處理系統
152:資料處理器件
154:儲存器件
202:步驟
203:步驟
204:步驟
206:步驟
208:步驟
210:步驟
302:矩陣
304:列
306:行
310:字
322:編碼簿
324:列
326:行
330:碼字
400:表
400a:陰性對照字
400b:陰性對照字
400c:陰性對照字
400d:陰性對照字
400e:陰性對照字
400f:陰性對照字
410:表
410a:陰性對照字
410b:陰性對照字
410c:陰性對照字
410d:陰性對照字
410e:陰性對照字
410f:陰性對照字
410g:陰性對照字
410h:陰性對照字
502a:最高相關強度值
510a:可信度臨界值
510b:臨界值
B:數量
E:數量
G:基因字
P:數量
R:數量
第1圖為多重螢光原位雜交成像的裝置的示意圖。
第2圖為資料處理方法的流程圖。
第3圖圖示解碼的方法。
第4A圖為隨機放置開值的編碼簿的陰性對照碼字的表。
第4B圖為開值均勻分佈於碼字行中的編碼簿的陰性對照碼字的表。
第5A圖為可信度-截止值圖,其使用隨機分佈的陰性對照碼字。
第5B圖為可信度-截止值圖,其使用均勻分佈的陰性對照碼字。
各圖中的相同的元件符號及名稱表示相同的元件。
國內寄存資訊(請依寄存機構、日期、號碼順序註記)
無
國外寄存資訊(請依寄存國家、機構、日期、號碼順序註記)
無
302:矩陣
304:列
306:行
310:字
322:編碼簿
324:列
326:行
330:碼字
Claims (24)
- 一種空間轉錄方法,其包含以下步驟: 自一mFISH成像系統接收一樣本的複數個影像; 對於在該複數個影像中暫存的複數個像素中之每一像素,自該複數個影像的該複數個像素中之每一像素的強度值產生一像素字,用N個強度值的一序列表示每一像素字;及 對於該複數個像素中之每一像素, 將該像素的該像素字與包括複數個碼字的一編碼簿比較,並且識別該複數個碼字中與該像素字的一最近匹配碼字,每一碼字由N個位元的一序列表示,其中該複數個碼字包括複數個基因識別碼字及複數個陰性對照碼字,其中該複數個陰性對照碼字具有一相等數量的開值,且其中該複數個陰性對照碼字的開值均勻分佈於該N個位元中,使得N個位元的該序列中的每一序數位置具有來自該複數個陰性對照碼字的一相同總數的開位元,及 確定與該最近匹配碼字相關的一基因或誤差,及 對於該複數個像素中之至少一個像素,儲存該像素與該基因或誤差的一相關。
- 如請求項1所述之方法,包含以下步驟:確定一可信度臨界值,其包括對於每一陰性對照碼字,計算像素字與該陰性對照字的一匹配計數,由此產生複數個匹配計數,將該複數個匹配計數的一最大計數選為該可信度臨界值。
- 如請求項1所述之方法,其包含對於該複數個碼字中之每一碼字,基於該碼字與該等像素字之間的距離計算一可信度值,對此將該碼字識別為該最近匹配碼字。
- 如請求項1所述之方法,其中該複數個陰性對照碼字包含該編碼簿的5%至25%。
- 一種空間轉錄系統,其包含: 一液流槽,其包含曝露於一試劑中螢光探針的一樣本; 複數個試劑庫,每一試劑庫包括一容器以保持一液體試劑; 一閥系統,其控制自複數個試劑庫中之一者至該液流槽的流動; 一壓力源,其使該液體試劑流過該液流槽; 一螢光顯微鏡,其包括一可變頻率激發光源及一攝影機,該攝影機經安置以自該樣本接收螢光發射的光;及 一控制器,其經配置以: 自該螢光顯微鏡接收一樣本的複數個影像, 對於在該複數個影像中暫存的複數個像素中之每一像素,自該複數個影像的該複數個像素中之每一像素的強度值產生一像素字,用N個強度值的一序列表示每一像素字;且 對於該複數個像素中之每一像素, 將該像素的該像素字與包括複數個碼字的一編碼簿比較,並且識別該複數個碼字中與該像素字的一最近匹配碼字,每一碼字由N個位元的一序列表示,其中該複數個碼字包括複數個基因識別碼字及複數個陰性對照碼字,其中該複數個陰性對照碼字具有一相等數量的開值,且其中該複數個陰性對照碼字的開值均勻分佈於該N個位元中,使得N個位元的該序列中的每一序數位置具有來自該複數個陰性對照碼字的一相同總數的開位元,及 確定與該最近匹配碼字相關的一基因或誤差,及 對於該複數個像素中之至少一像素,儲存該像素與該基因或誤差的一相關。
- 如請求項5所述之系統,其中該複數個陰性對照碼字包含該編碼簿的5%至25%。
- 如請求項5所述之系統,其中該複數個碼字中之任兩個碼字之間的該漢明距離為相等的。
- 一種空間轉錄的電腦程式產品,該電腦程式產品包含具有指令的一非暫態性電腦可讀媒體,當該等指令由一或多個電腦執行時,使該一或多個電腦: 自一mFISH成像系統接收一樣本的複數個影像; 對於在該複數個影像中暫存的複數個像素中之每一像素,自該複數個影像的該複數個像素中之每一像素的強度值產生一像素字,用N個強度值的一序列表示每一像素字;及 對於該複數個像素中之每一像素, 將該像素的該像素字與包括複數個碼字的一編碼簿比較,並且識別該複數個碼字中與該像素字的一最近匹配碼字,每一碼字由N個位元的一序列表示,其中該複數個碼字包括複數個基因識別碼字及複數個陰性對照碼字,其中該複數個陰性對照碼字具有一相等數量的開值,且其中該複數個陰性對照碼字的開值均勻分佈於該N個位元中,使得N個位元的該序列中的每一序數位置具有來自該複數個陰性對照碼字的一相同總數的開位元,及 確定與該最近匹配碼字相關的一基因或誤差,及 對於該複數個像素中之至少一像素,儲存該像素與該基因或誤差的一相關。
- 如請求項8所述之電腦程式產品,其包含指令以確定一可信度臨界值,其中對於每一陰性對照碼字,計算像素字與該錯誤校正字的匹配的一計數,且產生複數個匹配計數,以將該複數個匹配計數的一最大計數選為該可信度臨界值。
- 如請求項8所述之電腦程式產品,其中該複數個陰性對照碼字包含該編碼簿的5%至25%。
- 如請求項8所述之電腦程式產品,其中該複數個碼字中之任兩個碼字之間的該漢明距離為相等的。
- 一種產生一編碼簿的方法,該方法包含以下步驟: 獲取該編碼簿的一第一複數個基因識別碼字,該複數個基因識別碼字中之每一基因識別碼字由N個位元的一序列表示,其中該第一子集的碼字中之每一碼字包含一位元序列,該位元序列對應於識別一基因的與一像素資料值的一最佳匹配;及 產生複數個陰性對照碼字,該複數個基因識別碼字中之每一陰性對照碼字由N個位元的一序列表示,其中該複數個陰性對照碼字具有一相等數量的開值,其中該複數個陰性對照碼字的開值均勻分佈於該N個位元中,使得N個位元的該序列中的每一序數位置具有與該複數個陰性對照碼字的一相同總數的開位元,每一陰性對照碼字與每一基因識別碼字之間的一漢明距離至少為一距離臨界值。
- 如請求項12所述之方法,其中該編碼簿包含100至200個碼字。
- 如請求項12所述之方法,其中該複數個陰性對照碼字包含該編碼簿的5%至25%。
- 如請求項12所述之方法,其中該複數個基因識別碼字中之每一基因識別碼字及該複數個陰性對照碼字中之每一陰性對照碼字包含4至6個開值的一漢明權重。
- 如請求項12所述之方法,其中該複數個碼字中之任兩個碼字之間的該漢明距離為相等的。
- 如請求項12所述之方法,其中產生複數個陰性對照碼字之步驟包含以下步驟:隨機選擇一第一預設數量的開值的序數位置以產生潛在的陰性對照碼字;若N個位元的該序列中的每一序數位置具有超過一第二預設數量的該複數個陰性對照碼字的開位元的一總數,則拒絕潛在的陰性對照碼字;及若該潛在陰性對照碼字與每一基因識別碼字之間的該漢明距離小於該距離臨界值,則拒絕潛在的陰性對照碼字。
- 如請求項17所述之方法,其包含以下步驟: 自一mFISH成像系統接收一樣本的複數個影像; 對於在該複數個影像中暫存的複數個像素中之每一像素,自該複數個影像的該複數個像素中之每一像素的強度值產生一像素字,用N個強度值的一序列表示每一像素字;及 對於該複數個像素中之每一像素, 將該像素的該像素字與該編碼簿比較,且識別該複數個碼字中與該像素字的一最近匹配碼字,及 確定與該最近匹配碼字相關的一基因或誤差,及 對於該複數個像素中之至少一像素,儲存該像素與該基因或誤差的一相關。
- 一種產生一編碼簿的電腦程式產品,其包含具有指令的一非暫態性電腦可讀媒體,當該等指令由一或多個電腦執行時,使該一或多個電腦: 獲取該編碼簿的第一複數個基因識別碼字,該複數個基因識別碼字中之每一基因識別碼字由N個位元的一序列表示,其中該第一子集的碼字中之每一碼字包含一位元序列,該位元序列對應於識別一基因的與一像素資料值的一最佳匹配;及 產生複數個陰性對照碼字,該複數個基因識別碼字中之每一陰性對照碼字由N個位元的一序列表示,其中該複數個陰性對照碼字具有一相等數量的開值,其中該複數個陰性對照碼字的開值均勻分佈於該N個位元中,使得N個位元的該序列中的每一序數位置具有與該複數個陰性對照碼字的一相同總數的開位元,每一陰性對照碼字與每一基因識別碼字之間的一漢明距離至少為一距離臨界值。
- 如請求項19所述之電腦程式產品,其中該編碼簿包含100至200個碼字。
- 如請求項19所述之電腦程式產品,其中該複數個陰性對照碼字包含該編碼簿的5%至25%。
- 如請求項19所述之電腦程式產品,其中該複數個基因識別碼字中之每一基因識別碼字及該複數個陰性對照碼字中之每一陰性對照碼字包含4至6個開值的一漢明權重。
- 如請求項19所述之電腦程式產品,其中產生複數個陰性對照碼字的該等指令包含如下的指令:其隨機選擇一第一預設數量的開值的序數位置以產生潛在的陰性對照碼字,且若N個位元的該序列中的每一序數位置具有超過一第二預設數量的該複數個陰性對照碼字的開位元的一總數,則拒絕潛在的陰性對照碼字;及若該潛在陰性對照碼字與每一基因識別碼字之間的該漢明距離小於該距離臨界值,則拒絕潛在的陰性對照碼字。
- 如請求項19所述之電腦程式產品,其包含如下的指令: 自一mFISH成像系統接收一樣本的複數個影像; 對於在該複數個影像中暫存的複數個像素中之每一像素,自該複數個影像的該複數個像素中之每一像素的強度值產生一像素字,用N個強度值的一序列表示每一像素字;及 對於該複數個像素中之每一像素, 將該像素的該像素字與該編碼簿比較,且識別該複數個碼字中與該像素字的一最近匹配碼字,及 確定與該最近匹配碼字相關的一基因或誤差,及 對於該複數個像素中之至少一像素,儲存該像素與該基因或誤差的一相關。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163166204P | 2021-03-25 | 2021-03-25 | |
US63/166,204 | 2021-03-25 |
Publications (1)
Publication Number | Publication Date |
---|---|
TW202302860A true TW202302860A (zh) | 2023-01-16 |
Family
ID=83364993
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW111110273A TW202302860A (zh) | 2021-03-25 | 2022-03-21 | 多重螢光原位雜交成像的稀疏編碼簿的產生與使用 |
Country Status (3)
Country | Link |
---|---|
US (2) | US20220310209A1 (zh) |
TW (1) | TW202302860A (zh) |
WO (1) | WO2022203966A1 (zh) |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4068419B2 (ja) * | 2002-09-09 | 2008-03-26 | 松永 是 | 微生物検出方法及び装置 |
US20140024024A1 (en) * | 2012-07-17 | 2014-01-23 | General Electric Company | Methods of detecting dna, rna and protein in biological samples |
EP4328322A3 (en) * | 2014-07-30 | 2024-05-22 | President and Fellows of Harvard College | Probe library construction |
EP3644044B1 (en) * | 2018-10-24 | 2020-12-23 | Leica Biosystems Imaging, Inc. | Camera exposure control when acquiring fluorescence in situ hybridization images |
US20200152289A1 (en) * | 2018-11-09 | 2020-05-14 | The Broad Institute, Inc. | Compressed sensing for screening and tissue imaging |
CA3157804A1 (en) * | 2019-10-11 | 2021-04-15 | Catalog Technologies, Inc. | Nucleic acid security and authentication |
-
2022
- 2022-03-18 US US17/698,799 patent/US20220310209A1/en active Pending
- 2022-03-18 US US17/698,769 patent/US20220310202A1/en active Pending
- 2022-03-18 WO PCT/US2022/021000 patent/WO2022203966A1/en active Application Filing
- 2022-03-21 TW TW111110273A patent/TW202302860A/zh unknown
Also Published As
Publication number | Publication date |
---|---|
WO2022203966A1 (en) | 2022-09-29 |
US20220310209A1 (en) | 2022-09-29 |
US20220310202A1 (en) | 2022-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11624708B2 (en) | Image processing techniques in multiplexed fluorescence in-situ hybridization | |
US11676247B2 (en) | Method, device, and computer program for improving the reconstruction of dense super-resolution images from diffraction-limited images acquired by single molecule localization microscopy | |
EP2660639A1 (en) | Method and apparatus for single-particle localization using wavelet analysis | |
US11169368B2 (en) | Method and system for localisation microscopy | |
US11854162B2 (en) | Microscopy with near-ideal sCMOS camera | |
CN111369601B (zh) | 一种基于孪生网络的遥感图像配准方法 | |
US11790559B2 (en) | Data compression for multidimensional time series data | |
US20230296516A1 (en) | Ai-driven signal enhancement of sequencing images | |
CN116051411A (zh) | 基于深度卷积网络的显微图像模糊核提取与离焦复原方法 | |
WO2021229668A1 (ja) | 核酸分析装置、核酸分析方法及び機械学習方法 | |
TW202302860A (zh) | 多重螢光原位雜交成像的稀疏編碼簿的產生與使用 | |
WO2017203679A1 (ja) | 発光画像符号化装置、発光画像復号化装置、及び発光画像解析システム | |
WO2019152216A1 (en) | Systems and methods for robust background correction and/or emitter localization for super-resolution localization microscopy | |
US20220028096A1 (en) | Device for generating a depth map | |
CN113227732B (zh) | 包括多个传感器的光谱学装置的校准方法和从至少两个经校准光谱学装置获得的光谱信息的传递方法 | |
CN108550128B (zh) | 一种单分子荧光散焦图像处理方法 | |
He et al. | Deep Learning for MS2 Feature Detection in Liquid Chromatography Mass Spectrometry | |
Lange et al. | A hierarchical algorithm for approximate nearest neighbor searching in a dataset of pyramid-based image representations | |
CN118259444A (zh) | 一种单相机的荧光显微成像系统及方法 | |
WO2024020655A1 (en) | A computational microscopy method and system for volumetric imaging | |
Tsiknakis et al. | Unveiling the Power of Model-Agnostic Multiscale Analysis for Enhancing Artificial Intelligence Models in Breast Cancer Histopathology Images | |
CN114972854A (zh) | 一种基于视角辅助的摄影体位识别和体表解剖标志检测两阶段方法 | |
JP2015216495A (ja) | 色収差補正方法 | |
CN118392836A (zh) | 环形LED激发大像面dPCR芯片荧光显微成像系统 | |
Daskalakis et al. | Development of a Cascade Processing Method for Microarray Spot Segmentation |