CN1609615A - 基于投影的生物芯片扫描图象点阵自动识别算法 - Google Patents

基于投影的生物芯片扫描图象点阵自动识别算法 Download PDF

Info

Publication number
CN1609615A
CN1609615A CNA200310111884XA CN200310111884A CN1609615A CN 1609615 A CN1609615 A CN 1609615A CN A200310111884X A CNA200310111884X A CN A200310111884XA CN 200310111884 A CN200310111884 A CN 200310111884A CN 1609615 A CN1609615 A CN 1609615A
Authority
CN
China
Prior art keywords
biochip
analysis
sigma
projection
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA200310111884XA
Other languages
English (en)
Inventor
段会龙
邓宁
赵晨晖
耿永尧
张文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHENZHEN YISHENGTANG BIOLOGICAL PRODUCTS Co Ltd
Original Assignee
SHENZHEN YISHENGTANG BIOLOGICAL PRODUCTS Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHENZHEN YISHENGTANG BIOLOGICAL PRODUCTS Co Ltd filed Critical SHENZHEN YISHENGTANG BIOLOGICAL PRODUCTS Co Ltd
Priority to CNA200310111884XA priority Critical patent/CN1609615A/zh
Publication of CN1609615A publication Critical patent/CN1609615A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

生物芯片图象分析是生物芯片技术的重要组成部分,分析过程中需要处理大量的数据信息。目前,过多的人工干预已成为生物芯片图象快速分析的瓶颈。针对生物芯片图象数据量大,样品点排列规则等特点,本发明提出了一种基于投影的图象点阵自动识别算法,并将该算法应用于生物芯片图象分析。投影算法具有很高的分析准确性,能实现生物芯片数据分析过程的自动化,使快速分析和处理海量生物芯片图象数据成为可能。

Description

基于投影的生物芯片扫描图象点阵自动识别算法
本发明涉及一种快速、自动分析生物芯片扫描图象的算法,该算法可用于生命科学及临床诊断领域中的生物芯片扫描图像的信号自动识别。
生物芯片的设计思想是将大量的DNA等检测配基固相结合于一块很小的固相载体上,从而实现在一块芯片上做一次实验,就可以完成以往需要多次实验所能得到的检测结果。在生物芯片研制方面有多种技术思路。包括在玻片表面,附着微凝胶颗粒,再将寡核苷酸固定在凝胶上形成DNA微阵列;DNA固相合成基因芯片。更加复杂的芯片技术,使过去在一个实验的各个实验步骤,微缩于一个芯片上的,这种技术被称为芯片实验室。目前最为简便实用的生物芯片制造方法是通过机器人点样系统生产的以玻片为固相载体的芯片。该方法不需要原位固相合成,只需要将事先合成的寡核苷酸探针、通过PCR扩增,克隆产生的cDNA文库或者基因表达的蛋白质产物,通过机器人点样系统的微型点针或喷针,按照一定的排列方式点到玻片的表面,形成微矩阵。
生物芯片技术不仅仅局限于芯片的制备过程,芯片信息的检测和分析也是其中的关键内容。生物芯片图象分析是生物芯片技术的重要组成部分,分析过程中需要处理大量的数据信息。大量的文献报道表明,当前过多的人工干预已成为生物芯片图象快速分析的瓶颈。
目前,国内外较常用的生物芯片图象分析方法都需要借助人工的干预和帮助来识别和定位点阵样品,无法对图象进行连续分析。虽然国外的许多生物芯片分析软件已经能够提供对样品斑点的部分自动识别,例如BioDiscovery公司研制的DNA阵列图象分析软件ImaGeneTM和Axon公司开发的GenePix系列,但是他们所使用的方法都需要事先人工的创建网格模板,并进行大致的人工识别与定位,然后由软件完成进一步的斑点识别和调整。这样的做法实际上也只实现了生物芯片图象分析的半自动化,与生物芯片图象数据分析领域急需解决的实现全自动分析的目标还有很大的差距。
为了实现生物芯片图象数据分析过程的完全自动化,根据生物芯片图象点阵规则排列的特点,本发明提供了一种基于投影的生物芯片扫描图象点阵自动识别方法,能够帮助医生和生命科学研究工作者在生物芯片图象数据分析过程中对样品点进行自动定位,无需进行大量的人工辅助干预,使他们从繁杂的手工操作中解脱出来,可以把更多精力集中在医疗诊断和科研工作上,极大的提高了工作效率。
下面着重介绍本发明的方法原理:
生物芯片图象的一般特点是:
1)样品点以规则的阵列形式排列,即以指定的方式规则的分布于芯片上。
2)样品点分布结构固定,芯片整体以指定方式分成一定数目的子区块,各个子区块中样品点以相同的方式排列成阵列形式。
本发明对生物芯片的图象分析过程采取如下步骤:
1)采用投影算法对每个样品点进行寻址,估计其位置。
2)采用精确搜索算法确定样品点的精确位置,并将样品点信号从背景中分割出来。
其中第一步采用投影算法对每个样品点进行寻址能够实现分析过程的自动化。
●用投影算法对样品点进行寻址的主要思路:
样品点寻址中需估计的参数包括:
1)每个相邻子区块的行间隔Dr和列间隔Dc;
2)区块内相邻样品点的行间隔dr和列间隔dc;
3)最左上角样品点的位置(x11,y11);
4)样品点的半径r;
5)区块行数I和列数J;
6)区块内样品点的行数M和列数N;
根据生物芯片阵列结构固定的特点,一般情况下,I、J、M、N和r是已知的,我们把它们作为图象阵列启动识别过程的入口参数。利用投影算法对芯片图象进行识别,我们将可以估计出(x11,y11)、Dr、Dc、dr和dc。获得如上的参数,则可算出第m行第n列区块中第i行第j列的样品点坐标(xnj,ymi),其中:
对于一个规则点样的矩形生物芯片图象来说,若其每个样品点都是大小一致的规则圆形,样品点中的染色剂均匀分布,假设杂交后样品点(xn,j,ym,i)的荧光强度为Imn,ij。其理想图象可用如下的公式表示:
Figure A20031011188400042
上式亦可写作另一种形式。假设函数:
Figure A20031011188400043
C(x,y)在x轴和y轴的投影Px[C(x,y)]和Py[C(x,y)]分别为:
Figure A20031011188400045
由式(2)和(3),f(x,y)可以表示为:
f ( x , y ) = Σ n = 1 N Σ m = 1 M Σ j = 1 J Σ i = 1 I I mn , ij C ( x - x n , j , y - y m , i ) - - - - ( 6 )
再根据式(4)和(5),可以推导出f(x,y)在x轴和y轴的投影Px[f(x,y)]和Py[f(x,y)]:
P x [ f ( x , y ) ] = Σ n = 1 N Σ m = 1 M Σ j = 1 J Σ i = 1 I I mn , ij P x [ C ( x - x n , j , y ) ] - - - - 7 )
P y [ f ( x , y ) ] = Σ n = 1 N Σ m = 1 M Σ j = 1 J Σ i = 1 I I mn , ij P y [ C ( x , y - y m , i ) ] - - - - ( 8 )
对于x轴方向,Px[f(x,y)]的数据分布会根据芯片结构出现N×J个峰。如果峰在x轴的位置集合是{xn,j|1≤n≤N,1≤j≤J},则xn,j-xn,j-1=dc,xn,1-xn-1,J=Dc。将Px[f(x,y)]以数列{ak}按xn,j从小到大排列的形式表示,则
{ak}={x1,1,x1,2,...,x1,j,...x1,J,x2,1,x2,2,...,x2,j,...,x2,J,...,数列
xn,1,xn,2,...,xn,j,...,xn,J,...,xN,1,xN,2,...,xN,j,...,xN,J,...}数列
其中Dc共有N-1个。
对于蛋白质病毒检测芯片,在一般情况下,Dc>dc。所以从数列{ak}和{ak-ak-1}中可以得到dc和Dc
对于y轴方向,同理可以算出dr和Dr
●投影算法在生物芯片图象分析过程中的作用:
投影算法为我们提供了一个自动而且快速定位生物芯片杂交样品点的方法,投影算法可以在无需人工辅助的情况下获得每个样品点的大致位置,为随后样品点的精确定位及分割提供了分析依据。由于消除了分析过程中的人工辅助干预,图象分析的各个子过程就能够连续进行,不但提高了分析速度,而且能够避免人为因素带来的外部干扰,提高了分析准确性。
综上所述,投影算法为生物芯片图象分析领域提供了一种方便有效的分析手段。
我们将基于投影的生物芯片图象点阵自动识别方法实际应用于丙型肝炎病毒分片段抗体(HCV)蛋白质检测芯片上,下面结合附图和实施例对本发明进一步说明。
实施例:
图1是丙型肝炎病毒份片段抗体检测生物芯片(HCV)的结构示意图(局部)。
图2是运用投影算法,结合目前精确定位中最常用的领域搜索方法对HCV生物芯片进行分析的全过程。其中(a)是分析前获得的扫描原始图象;(b)是对图象进行投影分析之后获得的投影波形;(c)是根据分析投影波形的变化获得的每个样品点估计位置的结果;(d)是根据阵列点样参数和样品点的估计位置获得的每个样品斑点范围的结果;(e)是运用邻域搜索法对样品点进行精确定位的结果。
在图1中,根据HCV生物芯片的点阵结构,我们能够获得如下分析的入口参数:
Figure A20031011188400061
样品点的半径r      =150(um)
Figure A20031011188400062
子区块行数I        =5
子区块列数J        =2
Figure A20031011188400064
子区块内样品点行数M=6
Figure A20031011188400065
子区块内样品点列数N=5
在图2中,给出了基于投影的生物芯片图象点阵自动识别方法的分析全过程。对于图2(a)所示的蛋白芯片图象(局部),只要给出相应的分析入口参数I、J、M、N,经过投影算法的分析,我们可以得到如图2(b)所示的投影波形,波形的波峰和波谷、依照图象中的样品点排列方式有规律的分布,投影波形的波峰位置能够与样品点的中心位置一一对应。分析每个波峰的位置,我们可以得到Dr、Dc、dr和dc,利用这些参数,根据(1)式,则可以确定每个样品点的大致位置,如图2(c)所示;分析波峰和波谷的宽度,根据分析参数r,就能将样品点信号从背景中分割出来,如图2(d)所示。最后,利用邻域搜索算法,我们可以确定每个样品点的精确位置及大小,如图2(e)所示。
由以上实施例我们可以看到,将投影法引入HCV芯片的图象分析过程,能直接得到HCV图象点阵的识别结果,整个过程连续进行,不需要借助人工的辅助定位。
附图说明:
图1:HCV生物芯片扫描图象点阵排列结构
图2:基于投影的生物芯片扫描图象点阵自动识别方法应用于HCV生物芯片扫描图象分析的全过程
图2(a):HCV扫描图象(局部)
图2(b):图象投影波形
图2(c):样品点寻址结果
图2(d):样品点杂交信号与背景分割
图2(e):样品点精确定位结果

Claims (5)

1.一种用于生物芯片扫描图象分析,自动对图象点阵进行识别的算法。该算法命名为基于投影的生物芯片扫描图象点阵自动识别算法。其特征在于消除了以往进行生物芯片图象分析的过程中需要借助人工辅助干预、分析效率低、不能适应生物芯片高通量、平行分析特点的不足,实现了生物芯片数据分析过程的自动化,使快速分析和处理海量生物芯片图象数据成为可能。
2.根据权利要求1所述的方法,该方法可以应用于分析所有规则点样的生物芯片扫描图象。
3.根据权利要求1所述的方法,投影公式Px[f(x,y)]和Py[f(x,y)]:
P x [ f ( x , y ) ] = Σ n = 1 N Σ m = 1 M Σ j = 1 J Σ i = 1 I I mn , ij P x [ C ( x - x n , j , y ) ]
P y [ f ( x , y ) ] = Σ n = 1 N Σ m = 1 M Σ j = 1 J Σ i = 1 I I mn , ij P y [ C ( x , y - y m , i ) ]
可对所有二维形态的生物芯片扫描图象进行投影计算。
4.根据权利要求1所述的方法,该方法可以应用到所有在微机上开发的生物芯片分析系统上。
5.根据权利要求1所述的方法,该方法可以应用到所有生物芯片扫描和分析设备上。
CNA200310111884XA 2003-10-21 2003-10-21 基于投影的生物芯片扫描图象点阵自动识别算法 Pending CN1609615A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNA200310111884XA CN1609615A (zh) 2003-10-21 2003-10-21 基于投影的生物芯片扫描图象点阵自动识别算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNA200310111884XA CN1609615A (zh) 2003-10-21 2003-10-21 基于投影的生物芯片扫描图象点阵自动识别算法

Publications (1)

Publication Number Publication Date
CN1609615A true CN1609615A (zh) 2005-04-27

Family

ID=34759507

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA200310111884XA Pending CN1609615A (zh) 2003-10-21 2003-10-21 基于投影的生物芯片扫描图象点阵自动识别算法

Country Status (1)

Country Link
CN (1) CN1609615A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11875549B2 (en) 2020-01-14 2024-01-16 Boe Technology Group Co., Ltd. Data processing method, device, and terminal for biochip, and readable medium

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11875549B2 (en) 2020-01-14 2024-01-16 Boe Technology Group Co., Ltd. Data processing method, device, and terminal for biochip, and readable medium

Similar Documents

Publication Publication Date Title
US6980677B2 (en) Method, system, and computer code for finding spots defined in biological microarrays
BR112020026426A2 (pt) geração de metadados de sequenciamento baseada em inteligência artificial
US8725425B2 (en) Image data efficient genetic sequencing method and system
US7992098B2 (en) System, method, and computer software product for linked window interfaces
WO2020191389A1 (en) Training data generation for artificial intelligence-based sequencing
US20030038812A1 (en) Computer software system, method, and product for scanned image alignment
US20040012633A1 (en) System, method, and computer program product for dynamic display, and analysis of biological sequence data
CA2444655A1 (en) Systems and methods for testing a biological sample
EP4147196A1 (en) Equalization-based image processing and spatial crosstalk attenuator
CA3168451A1 (en) Knowledge distillation and gradient pruning-based compression of artificial intelligence-based base caller
US20040030504A1 (en) System, method, and computer program product for the representation of biological sequence data
US20040006431A1 (en) System, method and computer software product for grid placement, alignment and analysis of images of biological probe arrays
CN1369710A (zh) 成像方法
WO1999019711A1 (en) Method for producing arrays and devices relating thereto
US20230343414A1 (en) Sequence-to-sequence base calling
CN1609615A (zh) 基于投影的生物芯片扫描图象点阵自动识别算法
US20040063221A1 (en) Method for producing arrays and devices relating thereto
Deng et al. The automatic gridding algorithm based on projection for microvirray image
US11989265B2 (en) Intensity extraction from oligonucleotide clusters for base calling
JP2006506605A (ja) mRNAの絶対量を測定する方法及びシステム
EP4374343A1 (en) Intensity extraction with interpolation and adaptation for base calling
Ringwald et al. Gene expression database for the laboratory mouse
WO2023049212A2 (en) State-based base calling
US20050226535A1 (en) Method and system for rectilinearizing an image of a microarray having a non-rectilinear feature arrangement
WO2022254250A1 (en) Method and system for integrating morphological characteristics and gene expression of single-cell

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C57 Notification of unclear or unknown address
DD01 Delivery of document by public notice

Addressee: Zhang Wen

Document name: Notice of first review

C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication