CN117237352B - 基因芯片的图像处理方法、数据处理装置及存储介质 - Google Patents

基因芯片的图像处理方法、数据处理装置及存储介质 Download PDF

Info

Publication number
CN117237352B
CN117237352B CN202311513834.8A CN202311513834A CN117237352B CN 117237352 B CN117237352 B CN 117237352B CN 202311513834 A CN202311513834 A CN 202311513834A CN 117237352 B CN117237352 B CN 117237352B
Authority
CN
China
Prior art keywords
fluorescent
fluorescence
gene
addressing
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311513834.8A
Other languages
English (en)
Other versions
CN117237352A (zh
Inventor
张迪鸣
廖雨恒
张云山
罗马
纵浩天
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Lab
Original Assignee
Zhejiang Lab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Lab filed Critical Zhejiang Lab
Priority to CN202311513834.8A priority Critical patent/CN117237352B/zh
Publication of CN117237352A publication Critical patent/CN117237352A/zh
Application granted granted Critical
Publication of CN117237352B publication Critical patent/CN117237352B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本申请提供一种基因芯片的图像处理方法、数据处理装置及存储介质。该方法包括先获取经过杂交探针荧光实验得到的多轮彩色荧光图像,将每轮彩色荧光图像根据RGB值划分成多个单色荧光子区域;然后将多轮单色荧光子区域进行基因编码和排列组合后相乘得到多个荧光寻址编码矩阵;将经过碱基识别实验得到的彩色荧光图像划分出的荧光子区域进行基因编码得到多个荧光;再将多个荧光寻址编码矩阵分别和各个荧光识别编码矩阵相乘后进行目标基因位点的提取和对比,以确定目标基因位点的类型。本申请可以实现对基因信息的表达与传递,为基因芯片领域如何快速、精准地确定目标基因位点的类型提供了新思路,适合普及推广,以满足基因芯片领域的基本需求。

Description

基因芯片的图像处理方法、数据处理装置及存储介质
技术领域
本申请涉及基因芯片技术领域,具体而言,涉及一种基因芯片的图像处理方法、数据处理装置及存储介质。
背景技术
基因芯片又被称为生物芯片或DNA芯片,基因芯片检测技术由于高通量、简便快捷、平行化和成本低廉等优点,成为了基因检测中一项代表性技术之一。基因芯片检测技术的基本原理是将基因组的生物信息转化为光学信号后被特定的设备采集和分析,通过对光学信号的识别来获知生物信息。
现如今基因芯片最为成熟的结构是微珠芯片,其包括组装于芯片上的微珠以及与微珠连接的寡核苷酸链。其中,寡核苷酸链的末端已修饰有荧光基团,荧光基团在受到特定波长的激光照射下会发出特定波长的荧光,以便于反映微珠与寡核苷酸链的匹配程度。由于芯片上的微珠数量较多,在基因检测仪采集到各个微珠上的荧光基团发出的荧光图像后,如何对荧光图像进行处理,以在成千上万的微珠中确定哪些微珠携带了哪种类型的基因位点是非常困难的。由于目前国内对于该方向的研究较少,因此如何开发一种基因芯片的图像处理方法,以快速推动基因芯片领域的发展具有重大的实际意义。
发明内容
本申请提供一种基因芯片的图像处理方法、数据处理装置及存储介质。该方法可以为基因芯片领域如何快速、精准地确定目标基因位点的类型提供了新思路,适合普及推广。
具体地,本申请是通过如下技术方案实现的:
本申请一方面提供了一种基因芯片的图像处理方法,包括:
荧光区域划分步骤:获取基因芯片在进行多轮杂交探针荧光实验后生成的多轮第一彩色荧光图像以及基因芯片在进行一轮碱基识别实验后生成的一轮第二彩色荧光图像;分别提取每轮第一彩色荧光图像和第二彩色荧光图像中每个荧光点的RGB值,根据RGB值分别对每轮第一彩色荧光图像的荧光区域和第二彩色荧光图像的荧光区域进行划分,以分别划分出具有不同RGB值的多个第一单色荧光子区域和具有不同RGB值的多个第二单色荧光子区域;
基因编码步骤:将每轮得到的第一彩色荧光图像按照各个第一单色荧光子区域分别筛选出来进行基因编码,并单独保存以获得多个第一荧光寻址矩阵;将每轮得到的各个第一荧光寻址矩阵进行排列组合并相乘得到多个荧光寻址编码矩阵;
将得到的第二彩色荧光图像按照各个第二单色荧光子区域分别筛选出来进行基因编码,并单独保存以得到多个荧光识别编码矩阵;
基因识别步骤:将多个荧光寻址编码矩阵分别与各个荧光识别编码矩阵相乘得到多个乘积矩阵,并分别对多个乘积矩阵进行目标基因位点的提取和比对,以确定目标基因位点的类型。
可选地,在所述基因编码步骤中,将每轮得到的第一彩色荧光图像按照各个第一单色荧光子区域分别筛选出来进行基因编码包括:以多个第一数码表征各个第一单色荧光子区域中的多个第一荧光,以多个第二数码表征除去第一单色荧光子区域之外其它荧光区域的多个第二荧光,得到多个第一荧光寻址矩阵。
可选地,在所述基因编码步骤中,将每轮得到的各个第一荧光寻址矩阵进行排列组合并相乘得到多个荧光寻址编码矩阵包括:
将响应于第一轮杂交探针荧光实验得到的某个第一荧光寻址矩阵和下一轮杂交探针荧光实验得到的某个第一荧光寻址矩阵在相同位置均为第一数码时,确定两者的乘积取值为第一数码;将响应于第一轮杂交探针荧光实验得到的某个第一荧光寻址矩阵和下一轮杂交探针荧光实验得到的某个第一荧光寻址矩阵在相同位置至少有一个第二数码时,确定两者的乘积取值为第二数码,以得到多个荧光寻址编码矩阵。
可选地,在所述基因编码步骤中,将得到的第二彩色荧光图像按照各个第二单色荧光子区域分别筛选出来进行基因编码包括:以多个第一数码表征各个第二单色荧光子区域中的多个第一荧光,以多个第二数码表征除去第二单色荧光子区域之外其它荧光区域的多个第二荧光,得到多个荧光识别编码矩阵。
可选地,在所述基因识别步骤中,将多个荧光寻址编码矩阵分别与各个荧光识别编码矩阵相乘得到多个乘积矩阵包括:
将响应于某个荧光寻址编码矩阵和某个荧光识别编码矩阵在相同位置均为第一数码时,确定两者的乘积取值为第一数码;将响应于某个荧光寻址编码矩阵和某个荧光识别编码矩阵在相同位置至少有一个第二数码时,确定两者的乘积取值为第二数码,以得到多个乘积矩阵。
可选地,在所述基因识别步骤中,分别对多个乘积矩阵进行目标基因位点提取和比对,以确定目标基因位点包括:
所述多个乘积矩阵包括第一乘积矩阵和第二乘积矩阵;从第一乘积矩阵中提取出第一数码的数量,从第二乘积矩阵中提取出第一数码的数量;并将两者的数量进行对比;
若第一乘积矩阵中第一数码的数量大于第二乘积矩阵中第一数码的数量,则确定目标基因点位为第一碱基类型;若第一乘积矩阵中第一数码的数量小于第二乘积矩阵中第一数码的数量,则确定目标基因点位为第二碱基类型;若两者相等,则确定目标基因点位为无效位点。
可选地,在所述荧光区域划分步骤中,所述第一彩色荧光图像由多个待拼接图像通过得到;和/或,所述第二彩色荧光图像由多个待拼接图像通过拼接得到。
可选地,在对多个待拼接图像进行拼接之前,还包括:
识别多个待拼接图像中相邻两个图像之间的重合区域;将相邻两个图像中一者存在的重合区域进行去除。
可选地,所述识别多个待拼接图像中相邻两个图像之间的重合区域包括:
先切割出多个待拼接图像中相邻两个图像在靠近彼此一侧的两个相邻区域,再识别出两个相邻区域之间的重合区域。
本申请另一方面还提供了一种数据处理装置,包括存储器和处理器,所述存储器用于存储计算机程序,所述处理器用于通过调用所述计算机程序,执行上述任一所述的基因芯片的图像处理方法。
本申请再一方面还提供了一种计算机可读存储介质,其上存储有程序指令,所述程序指令被处理器执行时实现如上述任一所述的基因芯片的图像处理方法。
本申请提供的技术方案可以达到以下有益效果:
本申请提供了一种基因芯片的图像处理方法、数据处理装置及存储介质。该处理方法通过将经过每轮杂交探针荧光实验后得到的第一彩色荧光图像进行荧光区域划分和基因编码后,再进行排列组合并相乘得到多个荧光寻址编码矩阵以完成对基因信息的表达与传递;然后将多个荧光寻址编码矩阵分别与经过碱基识别实验后得到的第二彩色荧光图像进行荧光区域划分和基因编码后得到的各个荧光识别编码矩阵相乘,并进行目标基因位点的提取和比对后确定目标基因位点的类型,为基因芯片领域如何快速、精准地确定目标基因位点的类型提供了新思路,适合普及推广,以满足基因芯片领域的基本需求。
附图说明
图1为本申请一示例性实施例示出的基因芯片图像处理方法的流程图。
图2为本申请一示例性实施例示出的四个待拼接图像的明场图。
图3为由图2所示的四个待拼接图像在去除重合区域后完成拼接的图像明场图。
图4为本申请一示例性实施例示出的由四个待拼接图像去除重合区域后拼接形成的第一彩色荧光图像转换为黑白颜色后的荧光图。
图5为本申请一示例性实施例示出的将每轮得到的各个第一荧光寻址矩阵进行排列组合并相乘得到的某个荧光寻址编码矩阵。
图6为本申请一示例性实施例示出的基因芯片在经过碱基识别实验后得到的第二彩色荧光图像的结构简图。
图7为图6的第二彩色荧光图像按照两个第二单色荧光子区域分别筛选出来进行基因编码得到两个荧光识别编码矩阵。
图8为本申请一示例性实施例示出的基因芯片图像处理方法在进行基因识别步骤的过程示意图。
图9为本申请一示例性实施例示出的基因芯片图像处理方法在进行基因识别步骤采用逻辑编码计算的简化逻辑示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式仅为呈现本申请之构思,并不代表本申请构思下的所有实施方式。相反,它们仅是呈现本申请构思的一些方面相一致的装置和方法的例子。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。除非另作定义,本申请使用的技术术语或者科学术语应当为本申请所属领域内具有一般技能的人士所理解的通常意义。本申请说明书以及权利要求书中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。同样,“一个”或者“一”等类似词语也不表示数量限制,而是表示存在至少一个。“多个”或者“若干”表示两个及两个以上。除非另行指出,“前部”、“后部”、“下部”和/或“上部”、“顶部”、“底部”等类似词语只是为了便于说明,而并非限于一个位置或者一种空间定向。“包括”或者“包含”等类似词语意指出现在“包括”或者“包含”前面的元件或者物件,涵盖出现在“包括”或者“包含”后面列举的元件或者物件及其等同元件或者物件,本申请中并不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而且可以包括电性的连接,不管是直接的还是间接的。
请参阅图1,本申请提供的基因芯片的制备方法,包括如下步骤:
S1、荧光区域划分步骤:获取基因芯片在进行多轮杂交探针荧光实验后生成的多轮第一彩色荧光图像以及基因芯片在进行一轮碱基识别实验后生成的一轮第二彩色荧光图像;分别提取每轮第一彩色荧光图像和第二彩色荧光图像中每个荧光点的RGB值,根据RGB值分别对每轮第一彩色荧光图像的荧光区域和第二彩色荧光图像的荧光区域进行划分,以分别划分出具有不同RGB值的多个第一单色荧光子区域和具有不同RGB值的多个第二单色荧光子区域;
S2、基因编码步骤:将每轮得到的第一彩色荧光图像按照各个第一单色荧光子区域分别筛选出来进行基因编码,并单独保存以获得多个第一荧光寻址矩阵;将每轮得到的各个第一荧光寻址矩阵进行排列组合并相乘得到多个荧光寻址编码矩阵;
将得到的第二彩色荧光图像按照各个第二单色荧光子区域分别筛选出来进行基因编码,并单独保存以得到多个荧光识别编码矩阵;
S3、基因识别步骤:将多个荧光寻址编码矩阵分别与各个荧光识别编码矩阵相乘得到多个乘积矩阵,并分别对多个乘积矩阵进行目标基因位点的提取和比对,以确定目标基因位点的类型。
上述方案提供的图像处理方法,通过将经过每轮杂交探针荧光实验后得到的第一彩色荧光图像进行荧光区域划分和基因编码后,再进行排列组合并相乘得到多个荧光寻址编码矩阵以完成对基因信息的表达与传递;然后将多个荧光寻址编码矩阵分别与经过碱基识别实验后得到的第二彩色荧光图像进行荧光区域划分和基因编码后得到的各个荧光识别编码矩阵相乘,并进行目标基因位点的提取和比对后确定目标基因位点的类型,为基因芯片领域如何快速、精准地确定目标基因位点的类型提供了新思路,适合普及推广,以满足基因芯片领域的基本需求。
其中,多轮杂交探针荧光实验是指:对同一基因芯片进行多轮生化处理,使代表不同基因位点的微珠连接的寡核苷酸链在经过每轮生化处理后根据实际测试需求修饰不同的荧光基团,以发出不同颜色的荧光,便于被基因芯片检测仪采集到多张第一彩色荧光图像。当然,如果基因芯片上的基因位点数量较多时,可以在进行至少某一轮生化处理后用相同的荧光基团来修饰分别代表至少两个基因位点上不同微珠连接的寡核苷酸链,只要保证代表不同基因位点的不同微珠连接的寡核苷酸链,在经过所有轮生化处理后,代表任意两种不同基因位点的不同微珠不会发出完全相同顺序的荧光即可。
碱基识别实验是指:在经过多轮杂交探针荧光实验后,对同一基因芯片再进行最后一轮生化处理,使代表不同基因位点的微珠连接的寡核苷酸链再延长一个寡核苷酸链,即总共有两个寡核苷酸链。不同寡核苷酸上修饰不同荧光基团,当寡核苷酸和目标物结合时,可利用碱基互补原理,根据荧光的不同判断目标物特定位点的碱基类型。
需要说明的是,RGB值中的R代表红色(Red)、G代表绿色(Green)、B代表蓝色(Blue)。当某个荧光的RGB值中R的数值最大时,表示为该荧光为红色荧光;当某个荧光的RGB值中G的数值最大时,表示为该荧光为绿色荧光;当某个荧光的RGB值中B的数值最大时,表示为该荧光为蓝色荧光;当某个荧光的RGB值中R的数值与G的数值同时最大且两者的比值为1:1时,表示为该荧光为黄色荧光。因此,当选取不同荧光基团发出不同颜色荧光时,可采用颜色识别算法对每种颜色荧光的RGB值进行提取,以完成所有荧光区域的划分。当然,荧光基团的种类以及发出荧光的颜色、数量可以根据实际生产需求进行任意调整。
在一个实施例中,在所述基因编码步骤中,将每轮得到的第一彩色荧光图像按照各个第一单色荧光子区域分别筛选出来进行基因编码包括:以多个第一数码表征各个第一单色荧光子区域中的多个第一荧光,以多个第二数码表征除去第一单色荧光子区域之外其它荧光区域的多个第二荧光,得到多个第一荧光寻址矩阵。由此,便于将第一彩色荧光图像中各个第一单色荧光子区域的光学信息转化成数字信息,通过“抽象数码”进行基因信息的表达与传递,为后续基因识别步骤奠定了基础。
例如,当第一彩色荧光图像包括红色荧光子区域和绿色荧光子区域时,以第一数码“1”表征红色荧光子区域发出的红色荧光,以第二数码“0”表征绿色荧光子区域发出的绿色荧光。即,第一数码“1”的数量为红色荧光的数量,第二数码“0”的数量为绿色荧光的数量。再例如,当第一彩色荧光图像包括红色荧光子区域、绿色荧光子区域和黄色荧光子区域时,以第一数码“1”表征红色荧光子区域发出的红色荧光,以第二数码“0”表征绿色荧光子区域发出的绿色荧光以及黄色荧光子区域发出的黄色荧光。即,第一数码“1”的数量为红色荧光的数量,第二数码“0”的数量为绿色荧光和黄色荧光的数量之和。
在一个实施例中,在所述基因编码步骤中,将每轮得到的各个第一荧光寻址矩阵进行排列组合并相乘得到多个荧光寻址编码矩阵包括:
将响应于第一轮杂交探针荧光实验得到的某个第一荧光寻址矩阵和下一轮杂交探针荧光实验得到的某个第一荧光寻址矩阵在相同位置均为第一数码时,确定两者的乘积取值为第一数码;将响应于第一轮杂交探针荧光实验得到的某个第一荧光寻址矩阵和下一轮杂交探针荧光实验得到的某个第一荧光寻址矩阵在相同位置至少有一个第二数码时,确定两者的乘积取值为第二数码,以得到多个荧光测试编码矩阵。由此,便于将基因芯片中成千上万数量的基因信息,利用逻辑编码计算的形式计算得到多个荧光寻址编码矩阵,使每个荧光寻址编码矩阵对应一种基因位点,以供后续基因识别步骤中确定某一种基因位点的类型使用。
需要说明的是,对每轮得到的各个第一荧光寻址矩阵进行排列组合包括:以每轮第一彩色荧光图像划分出的第一单色荧光子区域的数量m为底数,以杂交探针荧光实验的轮数n为指数,得到mn个荧光寻址编码矩阵。例如,经过2轮杂交探针荧光实验,每轮杂交探针荧光实验得到的第一彩色荧光图像中划分有3个第一单色荧光子区域,则排列组合后得到9个矩阵对,并将各个矩阵对中的两个矩阵相乘得到9个荧光寻址编码矩阵。
在一个实施例中,在所述基因编码步骤中,将得到的第二彩色荧光图像按照各个第二单色荧光子区域分别筛选出来进行基因编码包括:以多个第一数码表征各个第二单色荧光子区域中的多个第一荧光,以多个第二数码表征除去第二单色荧光子区域之外其它荧光区域的多个第二荧光,得到多个荧光识别编码矩阵。由此,便于将第二彩色荧光图像中各个第二单色荧光子区域的光学信息转化成数字信息,通过“抽象数码”进行基因信息的表达与传递,为后续基因识别步骤奠定了基础。
在一个实施例中,在所述基因识别步骤中,将多个荧光寻址编码矩阵分别与各个荧光识别编码矩阵相乘得到多个乘积矩阵包括:
将响应于某个荧光寻址编码矩阵和某个荧光识别编码矩阵在相同位置均为第一数码时,确定两者的乘积取值为第一数码;将响应于某个荧光寻址编码矩阵和某个荧光识别编码矩阵在相同位置至少有一个第二数码时,确定两者的乘积取值为第二数码,以得到多个乘积矩阵。由此,利用逻辑编码计算的形式计算得到多个乘积矩阵,以在各个乘积矩阵中提取目标基因位点,为后续基因位点类型的确定奠定基础。
在一个实施例中,在所述基因识别步骤中,分别对多个乘积矩阵进行目标基因位点的提取和比对,以确定目标基因位点包括:
所述多个乘积矩阵包括第一乘积矩阵和第二乘积矩阵;从第一乘积矩阵中提取出第一数码的数量,从第二乘积矩阵中提取出第一数码的数量;并将两者的数量进行对比;
若第一乘积矩阵中第一数码的数量大于第二乘积矩阵中第一数码的数量,则确定目标基因点位为第一碱基类型;若第一乘积矩阵中第一数码的数量小于第二乘积矩阵中第一数码的数量,则确定目标基因点位为第二碱基类型;若两者相等,则确定目标基因点位为无效位点。
在一个实施例中,在所述荧光区域划分步骤中,所述第一彩色荧光图像由多个待拼接图像通过拼接得到。由此,可以对小型便携式基因芯片检测仪在多轮杂交探针荧光实验中分区域检测得到的多个待拼接图像进行拼接,得到关于基因芯片完整的第一彩色荧光图像,以在基因芯片领域填补利用小型便携式基因芯片检测仪采集的待拼接图像处理方式的空白。在一个实施例中,所述第二彩色荧光图像由多个待拼接图像通过拼接得到。由此,可以对小型便携式基因芯片检测仪在碱基识别实验中分区域检测得到的多个待拼接图像进行拼接,得到关于基因芯片完整的第二彩色荧光图像。
其中,多个待拼接图像可以通过拼接算法进行拼接,即按照一定的扫描顺序将前后采集的相邻两张待拼接图像拼接在一起。待拼接图像的数量在此不做具体限制,可以为两张、四张甚至更多。
需要说明的是,现有的落地式大型基因检测仪能够直接完整的采集到基因芯片所有区域的荧光图像。但由于落地式大型基因检测仪体积庞大,无法满足多场景切换的检测需求,因此小型便携式基因检测仪应运而生。但由于小型便携式基因检测仪的体积有限,不能直接完整的采集到基因芯片所有区域的荧光图像,只能按照一定的扫描顺序分区域进行采集,并生成多个待拼接图像,因此需要通过拼接算法将多个待拼接图像拼接形成完整的荧光图像。
在一个实施例中,在对多个待拼接图像进行拼接之前,还包括:识别多个待拼接图像中相邻两个图像之间的重合区域;将相邻两个图像中一者存在的重合区域进行去除。由此,能够提高拼接后荧光图像的准确性。
需要说明的是,上述重合区域的识别过程可以采用图像识别算法处理得到。例如,采用图像识别算法将相邻两个图像靠近彼此的一侧区域重合后,进行相似度对比,将相似度达到一定预设相似度阈值的区域判断为重合区域。其中,预设相似度阈值的取值在此不做具体限制,例如可以取值为95%、98%、99%、100%等任一值。具体相似度阈值的取值可以根据实际重合区域的识别精度进行任意调整。
另外,将相邻两个图像中一者存在的重合区域进行去除,可以通过切割去除;也可以通过将相邻两个图像中另一者的重合区域覆盖于该重合区域后完成去除。
在一个实施例中,所述识别多个待拼接图像中相邻两个图像之间的重合区域包括:先切割出多个待拼接图像中相邻两个图像在靠近彼此一侧的两个相邻区域,再识别出两个相邻区域之间的重合区域。由于小型便携式基因检测仪采集到多个待拼接图像的荧光位点分布很相似,为了使重合区域识别的更加容易且精准,在相邻两个待拼接图像上选取一部分相邻的区域进行识别,能够更容易地识别出重合区域,也能提高重合区域识别的准确性。
需要说明的是,相邻两个待拼接图像的具体切割位置可根据小型便携式基因检测仪采集时的扫描顺序决定,例如两个相邻的待拼接图像的具体切割位置可以根据扫描顺序确定为上下相对或者左右相对。
在一个实施例中,每个相邻区域的面积占每张待拼接图像整个面积的10%~20%;优选地,每个相邻区域的面积占每张待拼接图像整个面积的15%。
需要说明的是,可以采用图形识别算法对相邻两个待拼接图像进行特征提取,以提取出具有一定面积占比的相邻区域,并完成切割。
在一个实施例中,在将相邻两个图像中一者存在的重合区域去除后,还包括采用拼接算法计算出相邻两个待拼接图像之间的相对位移,并按照采集时的扫描顺序将后采集到的待拼接图片移动至与先采集到的待拼接图片进行拼接。
本申请另一方面还提供了一种数据处理装置,包括存储器和处理器,所述存储器用于存储计算机程序,所述处理器用于通过调用所述计算机程序,执行上述任一所述的基因芯片的图像处理方法。
需要说明的是,数据处理装置可以为单片机芯片,集成有处理器和存储器。处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、现成可编程门矩阵(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。
本申请再一方面还提供了一种计算机可读存储介质,其上存储有程序指令,所述程序指令被处理器执行时实现如上述任一所述的基因芯片的图像处理方法。
需要说明的是,计算机可读存储介质可以包括:能够携带计算机程序的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、以及软件分发介质等。计算机程序包括计算机程序代码。计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。
下面以含有九种不同基因位点的基因芯片,以下简称为“九位点基因芯片”为例,介绍本申请提供的基因芯片图像处理方法的一个具体实施例。其中,九位点基因芯片中每个基因位点可以选用多个微珠。
S1、将九位点基因芯片进行两轮生化处理以完成两轮杂交探针荧光实验;其中每一轮杂交探针荧光实验均通过小型便携式基因检测仪检测出四个待拼接图像(如图2所示);
其中,九位点基因芯片在经过每一轮生化处理均采用显示红色荧光的荧光基团、显示绿色荧光的荧光基团和显示黄色荧光的荧光基团,用这三种荧光基团完成对基因芯片上所有基因位点的修饰。
S2、采用图像识别算法先切割出相邻两个待拼接图像在靠近彼此一侧各占比15%面积的两个相邻区域,再利用图像识别算法识别出两个相邻区域之间的重合区域,将相邻两个图像中按照采集时的扫描顺序先采集到的待拼接图片存在的重合区域进行去除后,再利用拼接算法预先计算出的相对位移,将按照采集时的扫描顺序后采集到的待拼接图片移动至上述已去除重合区域后的待拼接图片,以完成图像拼接(拼接后得到的图像明场图如图3所示)。由于待拼接图像的荧光图像和明场图中的荧光分布位置是相同的,因此通过拼接算法对各个待拼接图像的明场图进行拼接后得到拼接后图像的明场图后,可以按照同样的拼接算法对各个待拼接图像的荧光图像进行拼接,得到拼接后图像的第一彩色荧光图(第一彩色荧光图像转换为黑白颜色后的荧光图如图4所示)。
S3、将获取到的每张第一彩色荧光图像均按照提取各个荧光RGB值的不同,将每张第一彩色荧光图像中所有荧光区域划分为红色荧光子区域、黄色荧光子区域和绿色荧光子区域,并对红色荧光子区域、黄色荧光子区域和绿色荧光子区域进行基因编码,并各自单独保存为单通道第一荧光寻址矩阵;将每张得到的三个第一荧光寻址矩阵进行排列组合并相乘得到9个荧光寻址编码矩阵;
具体地,九位点基因芯片进行两轮杂交探针荧光实验后,每轮测试均形成有3个第一荧光寻址矩阵即红色、绿色和黄色矩阵,然后进行排列组合并相乘得到关于红红、红黄、红绿、绿红、绿黄、绿绿、黄红、黄黄、黄绿9个矩阵对,将各个矩阵对中的两个矩阵相乘后得到9个荧光寻址编码矩阵,共代表9个基因位点。其中,将红绿矩阵对中红色矩阵和绿色矩阵相乘获得的荧光寻址编码矩阵如图5所示。
S4、将九位点基因芯片进行最后一轮生化处理并完成碱基识别实验,得到第二彩色荧光图像(如图6所示的结构简图);其中,图6中R代表红色荧光(Red)、G代表绿色荧光(Green)、E代表无荧光(Empty)。其中,最后一轮生化处理是以脱氧核糖核苷酸(DNA)为例,利用红色荧光反映A(腺嘌呤)/T(胸腺嘧啶)碱基,利用绿色荧光反映C(胞嘧啶)/G(鸟嘌呤)碱基。将第二彩色荧光图像按照提取各个荧光RGB值的不同,将第二彩色荧光图像中所有荧光区域划分为红色荧光子区域和绿色荧光子区域,并对红色荧光子区域和绿色荧光子区域进行基因编码,并各自单独保存为单通道荧光矩阵,最终得到两张荧光识别编码矩阵(如图7);其中,(2)表示红色荧光子区域保存的荧光识别编码矩阵,(3)表示绿色荧光子区域保存的荧光识别编码矩阵。
需要说明的是,将碱基识别实验得到的四张待拼接图像处理成第二彩色荧光图像的处理方式请参考上述第一彩色荧光图像的处理方式,在此不做过多赘述。
S5、请参阅图8,将步骤S3得到的如图5所示代表其中一个目标基因位点的荧光寻址编码矩阵(1)分别与步骤S4得到的如图7所示的两个荧光识别编码矩阵(2)、(3)相乘,以分别得到两个乘积矩阵(4)和(5),提取乘积矩阵(4)中反映A(腺嘌呤)/T(胸腺嘧啶)碱基的红色荧光数量为59,乘积矩阵(5)中反映C(胞嘧啶)/G(鸟嘌呤)碱基的绿色荧光数量为17,因此乘积矩阵(4)中红色荧光的数量大于乘积矩阵(5)中绿色荧光的数量,则确定该目标基因位点为A/T碱基类型。
S6、按照步骤S5,可以将上述除去该基因位点的剩下八个基因位点的基因类型完成确定。
其中,上述S3步骤中红绿两个矩阵的编码逻辑可以简化为:在第一轮杂交探针荧光实验得到的第一彩色荧光图像中,采用多个第一数码“1”来表征第一轮彩色荧光图像中发出的多个红色荧光,采用多个第一数码“0”来表征第一轮彩色荧光图像中发出的多个绿色荧光和黄色荧光(请参见图9所示的[a1]矩阵)。在第二轮杂交探针测试得到的第一彩色荧光图像中,采用多个第一数码“1”来表征第二轮彩色荧光图像中发出的多个绿色荧光,采用多个第一数码“0”来表征第二轮彩色荧光图像中发出的多个红色荧光和黄色荧光(请参见图9所示的[a2]矩阵)。将[a1]矩阵与[a2]矩阵相乘得到如图9所示的[a3]矩阵。
上述S4步骤中,(2)荧光识别编码矩阵的编码逻辑可以简化为:采用多个第一数码“1”来表征最后一轮碱基识别实验得到的第二彩色荧光图像中发出的多个红色荧光,采用多个第一数码“0”来表征第二彩色荧光图像中发出的多个绿色荧光(请参见图9所示的[b1]矩阵)。(3)荧光识别编码矩阵的编码逻辑可以简化为:采用多个第一数码“1”来表征最后一轮碱基识别实验得到的第二彩色荧光图像中发出的多个绿色荧光,采用多个第一数码“0”来表征第二彩色荧光图像中发出的多个红色荧光(请参见图9所示的[c1]矩阵)。
将经过杂交探针荧光实验得到的如图9所示的[a3]矩阵与如图9所示的[b1]矩阵相乘,得到第一乘积矩阵[b2];将如图9所示的[a3]矩阵与如图9所示的[c1]矩阵相乘,得到第二乘积矩阵[c2]。并从第一乘积矩阵[b2]中提取第一数码“1”的数量为4,从第二乘积矩阵[c2]中提取第一数码“1”的数量为1,由于第一乘积矩阵[b2]中第一数码“1”的数量大于第二乘积矩阵[c2]中第一数码“1”的数量,则该基因位点为由红色荧光反映的A(腺嘌呤)/T(胸腺嘧啶)碱基。
需要说明的是,上述简化后的编码逻辑仅仅是选取了部分矩阵进行简单地解释说明。另外,当最后一轮生化处理是以核糖核苷酸链(RNA)为例时,则利用绿色荧光反映C(胞嘧啶)/G(鸟嘌呤)碱基,黄色荧光反应A(腺嘌呤)/U(尿嘧啶)碱基。
当然,本申请提供的基因芯片的图像处理方法并不仅限于处理九位点基因芯片,在其他实施例中,还可以为例如二十七位点基因芯片、八十一位点基因芯片等更多成千上万位点基因芯片。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。

Claims (8)

1.一种基因芯片的图像处理方法,其特征在于,包括:
荧光区域划分步骤:获取基因芯片在进行多轮杂交探针荧光实验后生成的多轮第一彩色荧光图像以及基因芯片在进行一轮碱基识别实验后生成的一轮第二彩色荧光图像;分别提取每轮第一彩色荧光图像和第二彩色荧光图像中每个荧光点的RGB值,根据RGB值分别对每轮第一彩色荧光图像的荧光区域和第二彩色荧光图像的荧光区域进行划分,以分别划分出具有不同RGB值的多个第一单色荧光子区域和具有不同RGB值的多个第二单色荧光子区域;
基因编码步骤:将每轮得到的第一彩色荧光图像按照各个第一单色荧光子区域分别筛选出来进行基因编码,以多个第一数码表征各个第一单色荧光子区域中的多个第一荧光,以多个第二数码表征除去第一单色荧光子区域之外其它荧光区域的多个第二荧光,并单独保存以获得多个第一荧光寻址矩阵;将每轮得到的各个第一荧光寻址矩阵进行排列组合并相乘得到多个荧光寻址编码矩阵;
将得到的第二彩色荧光图像按照各个第二单色荧光子区域分别筛选出来进行基因编码,以多个第一数码表征各个第二单色荧光子区域中的多个第一荧光,以多个第二数码表征除去第二单色荧光子区域之外其它荧光区域的多个第二荧光,并单独保存以得到多个荧光识别编码矩阵;
基因识别步骤:将多个荧光寻址编码矩阵分别与各个荧光识别编码矩阵相乘得到多个乘积矩阵,并分别对多个乘积矩阵进行目标基因位点的提取和比对,以确定目标基因位点的类型;
所述多个乘积矩阵包括第一乘积矩阵和第二乘积矩阵;从第一乘积矩阵中提取出第一数码的数量,从第二乘积矩阵中提取出第一数码的数量;并将两者的数量进行对比;
若第一乘积矩阵中第一数码的数量大于第二乘积矩阵中第一数码的数量,则确定目标基因点位为第一碱基类型;若第一乘积矩阵中第一数码的数量小于第二乘积矩阵中第一数码的数量,则确定目标基因点位为第二碱基类型;若两者相等,则确定目标基因点位为无效位点。
2.根据权利要求1所述的一种基因芯片的图像处理方法,其特征在于,在所述基因编码步骤中,将每轮得到的各个第一荧光寻址矩阵进行排列组合并相乘得到多个荧光寻址编码矩阵包括:
将响应于第一轮杂交探针荧光实验得到的某个第一荧光寻址矩阵和下一轮杂交探针荧光实验得到的某个第一荧光寻址矩阵在相同位置均为第一数码时,确定两者的乘积取值为第一数码;将响应于第一轮杂交探针荧光实验得到的某个第一荧光寻址矩阵和下一轮杂交探针荧光实验得到的某个第一荧光寻址矩阵在相同位置至少有一个第二数码时,确定两者的乘积取值为第二数码,以得到多个荧光寻址编码矩阵。
3.根据权利要求1所述的一种基因芯片的图像处理方法,其特征在于,在所述基因识别步骤中,将多个荧光寻址编码矩阵分别与各个荧光识别编码矩阵相乘得到多个乘积矩阵包括:
将响应于某个荧光寻址编码矩阵和某个荧光识别编码矩阵在相同位置均为第一数码时,确定两者的乘积取值为第一数码;将响应于某个荧光寻址编码矩阵和某个荧光识别编码矩阵在相同位置至少有一个第二数码时,确定两者的乘积取值为第二数码,以得到多个乘积矩阵。
4.根据权利要求1所述的一种基因芯片的图像处理方法,其特征在于,在所述荧光区域划分步骤中,所述第一彩色荧光图像由多个待拼接图像通过拼接得到;和/或,所述第二彩色荧光图像由多个待拼接图像通过拼接得到。
5.根据权利要求4所述的一种基因芯片的图像处理方法,其特征在于,在对多个待拼接图像进行拼接之前,还包括:
识别多个待拼接图像中相邻两个图像之间的重合区域;将相邻两个图像
中一者存在的重合区域进行去除。
6.根据权利要求5所述的一种基因芯片的图像处理方法,其特征在于,所述识别多个待拼接图像中相邻两个图像之间的重合区域包括:
先切割出多个待拼接图像中相邻两个图像在靠近彼此一侧的两个相邻区域,再识别出两个相邻区域之间的重合区域。
7.一种数据处理装置,其特征在于,包括存储器和处理器,所述存储器用于存储计算机程序,所述处理器用于通过调用所述计算机程序,执行如权利要求1至6任一项所述的基因芯片的图像处理方法。
8.一种计算机可读存储介质,其上存储有程序指令,其特征在于,所述程序指令被处理器执行时实现如权利要求1至6任一项所述的基因芯片的图像处理方法。
CN202311513834.8A 2023-11-14 2023-11-14 基因芯片的图像处理方法、数据处理装置及存储介质 Active CN117237352B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311513834.8A CN117237352B (zh) 2023-11-14 2023-11-14 基因芯片的图像处理方法、数据处理装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311513834.8A CN117237352B (zh) 2023-11-14 2023-11-14 基因芯片的图像处理方法、数据处理装置及存储介质

Publications (2)

Publication Number Publication Date
CN117237352A CN117237352A (zh) 2023-12-15
CN117237352B true CN117237352B (zh) 2024-02-09

Family

ID=89084639

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311513834.8A Active CN117237352B (zh) 2023-11-14 2023-11-14 基因芯片的图像处理方法、数据处理装置及存储介质

Country Status (1)

Country Link
CN (1) CN117237352B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000075636A1 (en) * 1999-06-04 2000-12-14 Kairos Scientific, Inc. Multispectral taxonomic identification
CN101134982A (zh) * 2007-07-09 2008-03-05 广东药学院 筛选家蝇抗菌肽基因的芯片及其制备方法
EP3465507A1 (en) * 2016-06-07 2019-04-10 Illumina, Inc. Bioinformatics systems, apparatus, and methods for performing secondary and/or tertiary processing
CN111926065A (zh) * 2020-09-18 2020-11-13 中国科学院上海高等研究院 一种高效的核酸检测和基因测序方法及其装置
CN112921074A (zh) * 2021-02-03 2021-06-08 鲲羽生物科技(江门)有限公司 一种通过组合色对基因组多位点同时检测的原位杂交方法
CN113744256A (zh) * 2021-09-09 2021-12-03 中德(珠海)人工智能研究院有限公司 一种深度图空洞填充方法、装置、服务器及可读存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220375546A1 (en) * 2021-05-24 2022-11-24 Applied Materials, Inc. Methods, mediums, and systems for identifying a gene in a flourescence in-situ hybridization experiment

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000075636A1 (en) * 1999-06-04 2000-12-14 Kairos Scientific, Inc. Multispectral taxonomic identification
CN101134982A (zh) * 2007-07-09 2008-03-05 广东药学院 筛选家蝇抗菌肽基因的芯片及其制备方法
EP3465507A1 (en) * 2016-06-07 2019-04-10 Illumina, Inc. Bioinformatics systems, apparatus, and methods for performing secondary and/or tertiary processing
CN111926065A (zh) * 2020-09-18 2020-11-13 中国科学院上海高等研究院 一种高效的核酸检测和基因测序方法及其装置
CN112921074A (zh) * 2021-02-03 2021-06-08 鲲羽生物科技(江门)有限公司 一种通过组合色对基因组多位点同时检测的原位杂交方法
CN113744256A (zh) * 2021-09-09 2021-12-03 中德(珠海)人工智能研究院有限公司 一种深度图空洞填充方法、装置、服务器及可读存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Interpretation of the fluorescence image acquired for DNA sequencing;Anna Cysewska-Sobusiak等;《SPIE》;第59-68页 *
基于频率调制和空间编码的单PMT荧光分子断层成像;陈若仲等;《中国激光》;第47卷(第01期);第240-249页 *

Also Published As

Publication number Publication date
CN117237352A (zh) 2023-12-15

Similar Documents

Publication Publication Date Title
US5795716A (en) Computer-aided visualization and analysis system for sequence evaluation
US20030219151A1 (en) Method and system for measuring a molecular array background signal from a continuous background region of specified size
CN116994246B (zh) 基于多任务联合的碱基识别方法及装置、基因测序仪及介质
CA3168451A1 (en) Knowledge distillation and gradient pruning-based compression of artificial intelligence-based base caller
CN112313750A (zh) 使用卷积的碱基识别
CN114049330A (zh) 一种荧光原位杂交图像中荧光特征融合方法及系统
EP3387613B1 (en) Background compensation
CN117237352B (zh) 基因芯片的图像处理方法、数据处理装置及存储介质
CN117274614A (zh) 基于荧光标记dNTP基因测序的碱基识别方法、测序仪及介质
EP3387617B1 (en) Method for determining the overall brightness of at least one object in a digital image
US7877213B2 (en) System and methods for automated processing of multiple chemical arrays
CN117392673B (zh) 碱基识别方法及装置、基因测序仪及介质
CN108369734B (zh) 数字图像中的对象分类方法、系统及计算机可读介质
CN116363403B (zh) 用于基因样本的图像识别方法、图像识别系统和存储介质
WO2009126495A2 (en) Method and system for processing microarray images
EP1134687B1 (en) Method for displaying results of hybridization experiments
KR100463336B1 (ko) 바이오칩 이미지 분석 시스템 및 그 방법
US20070288540A1 (en) Sorting points into neighborhoods (spin)
KR100435833B1 (ko) 바이오칩 이미지 분석 시스템 및 그 방법
CN117721191B (zh) 基因测序方法、测序装置、可读存储介质和基因测序系统
CN116343917B (zh) 一种基于ATAC-seq足迹识别转录因子共定位的方法
US20020102013A1 (en) Method for comparing signal arrays in digital images
JP4344497B2 (ja) 要素集合間相同性表示方法
WO2001027809A2 (en) Visualizing relations in data sets
US20050226535A1 (en) Method and system for rectilinearizing an image of a microarray having a non-rectilinear feature arrangement

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant