CN104215550B - 基于压缩感知的蛋白批量测定方法 - Google Patents

基于压缩感知的蛋白批量测定方法 Download PDF

Info

Publication number
CN104215550B
CN104215550B CN201410480261.8A CN201410480261A CN104215550B CN 104215550 B CN104215550 B CN 104215550B CN 201410480261 A CN201410480261 A CN 201410480261A CN 104215550 B CN104215550 B CN 104215550B
Authority
CN
China
Prior art keywords
sampling
sample
vector
albumen
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410480261.8A
Other languages
English (en)
Other versions
CN104215550A (zh
Inventor
朱松盛
王伟
李修寒
王超
吴小玲
段磊
刘宾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Medical University
Original Assignee
Nanjing Medical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Medical University filed Critical Nanjing Medical University
Priority to CN201410480261.8A priority Critical patent/CN104215550B/zh
Publication of CN104215550A publication Critical patent/CN104215550A/zh
Application granted granted Critical
Publication of CN104215550B publication Critical patent/CN104215550B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明公开了基于压缩感知的蛋白浓度批量检测方法,包括以下步骤:步骤一,将N个待检测样本顺序排列并依次编号,将其视为蛋白浓度一维分布向量;通过计算机生成采样矩阵,采样矩阵的列数为N,采样矩阵的行数为M,根据采样矩阵行向量每一行元素的输出顺序依次从N个待测样本中取液,将每行N次取液混合作为一个采样,共得到M个采样;步骤二,将M个采样按照顺序依次进行蛋白浓度检测,测得采样矩阵中不同行向量对应的采样蛋白浓度,利用质量计算公式:m=ρV,其中:m为采样蛋白的质量、ρ为采样蛋白的质量浓度、V为采样的液体体积;步骤三,选择稀疏变换,构成超完备字典;步骤四,利用恢复算法对N个待检测样本的蛋白浓度进行重建。

Description

基于压缩感知的蛋白批量测定方法
技术领域
本发明涉及一种蛋白浓度批量检测方法,特别是涉及基于压缩感知的蛋白浓度批量检测方法。
背景技术
蛋白浓度检测在各行业各领域内有着广泛的应用,如:食品检验、临床检验、医学普查、疾病诊断、生物药物分离提纯和质量检验等。随着科技的进步,现代工农业生产中对各种产品的生产过程有了更高的性能和技术要求,医学诊断对各种生物化学检验更加依赖,这就需要使得蛋白浓度检测在精度、时间和检测成本上有更大的突破。蛋白浓度检测适用于食品蛋白质含量检测、医学普查特定蛋白检测、疾病诊断特定蛋白指标检测、生物药物蛋白含量检测等领域,但在大样本批量检测中,会由于检测次数多,耗费时间长,检测试剂成本高等不足阻碍蛋白浓度检测的应用与推广。
中国专利申请201310747532.7提出了“一种纤维连接蛋白测定试剂盒及其使用方法”,虽然该方案具有所用试剂单一,内含的抗体效价高、亲和力好、特异性强、稳定性好、批间差小、有效期长,且灵敏度高、检测精度高的优点,但还存在以下明显不足:一是测量N个批量待测样本的蛋白浓度必须进行N次测量,其测量次数多,带来的系统测量误差大;二是每次测量均需使用多种试剂,耗费较多时间,增加了蛋白浓度批量检测的成本。
中国专利申请201010103429.5提出了“全量程C反应蛋白检测试剂盒”,虽然该方案具有既可以测定低含量,又可测定高含量,且灵敏度高、稳定性强、测定准确等优点,但还存在以下明显不足:一是测量N个批量待测样本的蛋白浓度必须进行N次测量,其测量次数多,带来的系统测量误差大;二是每次测量均需使用多种试剂,耗费较多时间,增加了蛋白浓度批量检测的成本。
综上所述,如何克服现有技术的不足已成为当今蛋白浓度测量技术领域中亟待解决的重大难题之一。
发明内容
发明目的:本发明所要解决的技术问题是针对现有技术的不足,提供基于压缩感知的蛋白批量测定方法。
本发明的目的是为克服现有技术存在的不足而提供基于压缩感知的蛋白浓度批量检测方法。
本发明公开了基于压缩感知的蛋白浓度批量检测方法,包括以下步骤:
步骤一,将N个待检测样本顺序排列并依次编号,将其视为蛋白浓度一维分布向量;通过计算机生成采样矩阵,采样矩阵的列数为N,采样矩阵的行数为M,M<<N,根据采样矩阵行向量每一行元素的输出顺序依次从N个待测样本中取液,将每行N次取液混合作为一个采样,共得到M个采样,N个待测样本中每次的取液量最小为0;
步骤二,将M个采样按照顺序依次进行蛋白浓度检测,测得采样矩阵中不同行向量对应的采样蛋白浓度,利用质量计算公式:m=ρV,其中:m为采样蛋白的质量、ρ为采样蛋白的质量浓度、V为采样的液体体积;
步骤三,选择稀疏变换,构成超完备字典;
步骤四,利用恢复算法对N个待检测样本的蛋白浓度进行重建。
本发明中,步骤一所述生成采样矩阵的构造式为:
Φ∈RM×N
其中,Φ为采样矩阵,RM×N代表M×N维实数集,采样矩阵满足有限等距性。
本发明中,对所述采样矩阵进行优化得到矩阵Φs,矩阵Φs中每个元素的计算公式如下:
&Phi; i , j s = V max &CenterDot; &Phi; i , j M &CenterDot; max { &Phi; } ,
Vmax为N个待测样本中的最大体积,Φs中的每一行视为一组控制向量,max{Φ}表示Φ矩阵中最大的一个元素,Φi,j表示Φ矩阵中的第i行,第j列的元素。
本发明中,蛋白的质量采样向量Y为对信号X执行一个压缩观测的结果,质量计算公式为Y=ΦX,信号X即待测蛋白浓度X,将质量计算公式进行扩展得到:
其中,x1,x2,...,xN分别为N个待测蛋白浓度X中的各个元素,N个待测蛋白浓度X为N维实信号X=[x1,x2,...,xN]T∈RN,RN代表N维实数集,T为矩阵转置符号;M个线性投影观测采样构成的蛋白的质量采样向量Y=[y1,y2,...,yM]T∈RM,y1,y2,...,yM分别为蛋白的质量采样向量Y中的各个元素,RM代表M维实数集,蛋白的质量采样向量Y,是指由采样矩阵中每个行向量对应的蛋白质量浓度采样值乘以进行归一化且将蛋白的质量浓度采样值转换为蛋白的质量采样值,其中,为第i行向量对应的蛋白质量浓度采样值,即为总的M行向量对应的蛋白质量浓度采样值。
本发明中,步骤三所述稀疏变换,是指从蛋白的质量采样向量Y中恢复N个待测样本蛋白浓度N维信号X,要求信号X为稀疏向量或信号X在一个变换域中是稀疏的。
本发明中,步骤四所述恢复算法,是指从蛋白的质量采样向量Y中恢复N个待测样本蛋白浓度N维信号X是一个求解线性方程组,在N个待测样本蛋白浓度X稀疏或可压缩的前提下的求解欠定方程组:
arg min X | | &Psi;X | | s . t . A CS &Theta; = &Phi;X = Y ,
其中,Ψ为正交基字典矩阵,ΨX为对X向量进行稀疏变换所得的稀疏系数,代表求得在ΨX的1范数最小时对应的X向量,s.t.代表约束条件,ACS=ΦΨ为CS信息算子,Θ是X在一个稀疏变换域中的投影系数,Φ为采样矩阵,X代表N个待测蛋白浓度,Y为蛋白的质量采样向量。
压缩感知(compressedsensing,简称CS)理论使信号采集突破了奈奎斯特采样定理的限制,提出了只要信号是可压缩的或在某个变换域是稀疏的,那么就可以用一个与变换基不相关的观测矩阵将变换所得高维信号投影到一个低维空间上,然后通过求解一个优化问题就可以从这些少量的投影中以高概率重构出原信号的实现原理。如果利用压缩感知原理来进行蛋白浓度的批量测量,可以将N个待测样本一部分通过可编程自动移液器集中于少量检测容器中,只通过M(M<<N)次蛋白浓度检测,再通过一定的算法恢复,快速获得更为准确的待测样本蛋白浓度。但目前还没有见到利用压缩感知原理来批量检测蛋白浓度的方法。
本发明与现有技术相比其显著优点在于:一是本发明是基于压缩感知而创造的蛋白浓度批量检测方法,仅需对通过移液器将多个待测样本集中到少量测量容器中的液体进行检测,即可进行简便可靠的测量,大大减少了测量次数,小于或等于现有测量次数的35%,从而节约了测量时间和所要用到的检测试剂成本,即0.35×N次即可高精度重建批量待测样本蛋白浓度状况;二是本发明基于压缩感知进行的测量次数少,测量速度快,明显降低了单次测量误差,为提高系统测量精度提供了保证,同时也减少了测量过程中引入的系统误差,提高了测量精度;三是本发明通过修改随机测量矩阵,既能测量批量待测样本蛋白浓度的整体情况,又能测量批量待测样本蛋白浓度随时间或空间的分布情况,拓宽了应用范围。本发明与现有技术测量方法的对比结果详见表1。本发明广泛适用于对现有蛋白浓度测量装置的升级改造,特别适用于批量待测样本蛋白浓度随时间或空间的分布情况的测量。
表1:本发明与现有技术测量方法的对比结果
本发明具有测量过程简便、测量精度高、测量快速和节约检测试剂成本等优点,适用于对现有蛋白浓度检测装置的升级改造。
附图说明
下面结合附图和具体实施方式对本发明做更进一步的具体说明,本发明的上述和/或其他方面的优点将会变得更加清楚。
图1是本发明提出的测量装置的结构示意图。
图2是采样矩阵与行向量的取出方法的示意图。
图3是实施例1利用本发明方法测得的纯牛奶中蛋白质浓度分布图。
图4是实施例2利用本发明方法测得的某地区人群血红蛋白浓度分布图。
具体实施方式
本发明提出的基于压缩感知的蛋白浓度批量检测方法,包括如下具体步骤:
步骤一,结合图1,将一组待检测样本放入检测箱中整齐排列,并依次编号,将其视为蛋白浓度一维分布向量;结合图2,通过计算机生成采样矩阵,从该矩阵中依次取出行向量,再由计算机输出行向量信号至可编程自动移液器的控制端,计算机依次输出的行向量的数值控制可编程自动移液器从多个待测样本中的取液量,可编程自动移液器按照行向量的输出顺序,将从多个待测样本中采集的液体依次集中于多个测量容器中;
步骤二,将多个测量容器按行向量输出顺序依次进行蛋白浓度检测,测得采样矩阵中不同行向量对应的采样蛋白浓度,利用质量计算公式:m=ρV,其中:m为采样蛋白的质量、ρ为所测得采样蛋白的质量浓度(蛋白的质量浓度为蛋白总质量与液体的总体积之比)、V为采样液体总体积,将得到的M个采样蛋白浓度乘以对应的总体积得到蛋白的质量采样向量;蛋白的质量浓度为蛋白总质量与液体的总体积之比;
步骤三,根据先前检验的不同的蛋白浓度分布特点选择适合的稀疏变换,构成超完备字典;
步骤四,利用恢复算法对批量待测样本蛋白浓度进行重建。
本发明的测量方法进一步的优选方案在于:
本发明步骤一所述将数百至数千个待检测样本放入检测箱中整齐排列,并依次编号,将其视为蛋白浓度的一维分布向量,是为了在移液器采样时,便于机械手根据计算机生成的采样矩阵进行定位和对采样向量进行恢复。
本发明步骤一所述生成采样矩阵的构造式为:Φ∈RM×N,其中,Φ为采样矩阵,RM×N代表M×N维实数集,即M×N维实数构成的矩阵。该矩阵需满足有限等距性(RIP)。该矩阵有多种生成方式,例如可由高斯随机矩阵、伯努利随机矩阵等构成。
由于在实际样品检测中,样品量有限,为防止在检测尚未完成时样品已耗尽,需对上述生成采样矩阵进行转化:
&Phi; i , j s = V max &CenterDot; &Phi; i , j M &CenterDot; max { &Phi; }
上式M为采样矩阵的行数与最终实际的检测次数相同,Vmax为待测样本的最大体积,需人为设定一个确定值,Φs中的每一行视为一组控制向量。计算机依次根据该矩阵的行向量的数值,控制移液器从多个待测样本中的取液量,移液器按照行向量的输出顺序,将从多个待测样本中采集的液体依次集中于多个测量容器中;
本发明步骤二所述蛋白的质量采样向量,是指由采样矩阵中不同行向量对应得到多个蛋白质量浓度采样值再将所有的乘以进行归一化且将蛋白的质量浓度采样值转换为蛋白的质量采样值,最终得到由M个线性投影观测采样值构成的蛋白的质量采样向量Y=[y1,y2,...,yM]T∈RM,y1,y2,...,yM分别为采样向量Y中的各个元素,RM代表M维实数集,T为矩阵转置符号;其中:当N个待测蛋白浓度为N维实信号X=[x1,x2,...,xN]T∈RN,x1,x2,...,xN分别为N个待测蛋白浓度X中的各个元素,RN代表N维实数集,T为矩阵转置符号。则此时的蛋白的质量采样向量Y为对信号X执行一个压缩观测的结果为Y=ΦX,将其矩阵形式中各个元素完全展开可得:
本发明步骤三所述稀疏变换,是指从蛋白的质量采样向量Y中恢复批量待测样本蛋白浓度N维信号X,要求X为稀疏向量或X在一个变换域中是稀疏的。
本发明步骤四所述恢复算法,是指从蛋白的质量采样向量Y中恢复批量待测样本蛋白浓度N维信号X是一个求解线性方程组,在批量待测样本蛋白浓度X稀疏或可压缩的前提下的求解欠定方程组:
arg min X | | &Psi;X | | s . t . A CS &Theta; = &Phi;X = Y
本发明步骤四所述恢复算法为基追踪法、匹配追踪法、正交匹配追踪法或共轭梯度法。
结合图1,根据本发明提出的基于压缩感知的蛋白浓度批量检测方法,它包括蛋白浓度测试仪、可编程自动移液器和计算机依次连接;其中,可编程自动移液器包括1个可编程控制机械手、1个可编程控制移液枪、若干个移液枪头和通信接口,且将可编程控制移液枪置于可编程控制机械手上,通过计算机控制机械手移动和移液枪的移液量;可编程自动移液器、通信接口和计算机依次连接;所述计算机为含有matlab软件、C++语言软件或java软件的计算机。
实施例1
以本实施例应用于批量测量奶制品工厂生产的纯牛奶中蛋白质浓度分布特点为例:
测量目的:批量测量奶制品工厂生产的纯牛奶中蛋白质浓度分布特点,可反映本批次产品的合格率,以此来确定本批次产品是否流入市场,并针对同种产品的不同蛋白质浓度,为以后的生产提供更合理、有效的措施使蛋白质浓度变化控制在合理的范围内。
测量装置:本实施例1的测量装置包括蛋白质浓度测试仪、可编程自动移液器和计算机依次连接,其中,蛋白质浓度测试仪采用上海洪纪仪器设备有限公司生产的ATN-100型蛋白质测定仪;可编程自动移液器采用弗科斯科技有限公司生产的Ultraspense2000,其包括1个可编程控制机械手、1个可编程控制移液枪、若干个移液枪头和通信接口。具体装配是将可编程控制移液枪置于可编程控制机械手上,通过计算机控制机械手移动和移液枪的移液量,并通过通信接口与含matlab软件的计算机进行数据通信,该通信接口采用串行接口。
测量样品:多个待测纯牛奶样品,采自同批次的产品中,从不同车间,平均抽取相同数量的产品,每个产品采集20ml,共抽取200份产品,按照抽取的先后顺序依次编号,部分采样数据如下表所示。
表2蛋白质部分采样数据
测量方法:本实施例应用于批量测量纯牛奶中蛋白质浓度的具体步骤包括如下:
步骤一,将多个待检测的纯牛奶样本放入检测箱中,按照抽取的先后顺序依次编号,将其视为蛋白质浓度一维分布向量;通过计算机生成高斯随机采样矩阵,从该矩阵中依次取出行向量,再由计算机输出行向量信号至可编程自动移液器的控制端,计算机依次输出的行向量的数值控制可编程自动移液器从多个待测样本中的取液量,可编程自动移液器按照行向量的输出顺序,将从多个待测样本中采集的液体依次集中于多个测量容器中;其中:
生成高斯随机采样矩阵的构造式为:矩阵Φ∈RM×N,其中,Φ为采样矩阵,RM×N代表M×N维实数集。该矩阵的每个元素独立地服从高斯随机分布:
&Phi; i , j ~ 1 M N ( &mu; , &sigma; 2 ) ,
在实际检测中常用标准正态分布生成随机矩阵,即位置参数μ=0,尺度参数σ=1的正态分布。
由于在实际样品检测中,样品量有限,为防止在检测尚未完成时样品已耗尽,需对上述生成矩阵进行转化:
&Phi; i , j s = V max &CenterDot; &Phi; i , j M &CenterDot; max { &Phi; } ,
上式M为待测样本采集组数且与最终实际的检测次数相同,Vmax为待测样本的最大体积,需人为设定一个确定值,Φs中的每一行视为一组控制向量。计算机依次根据该矩阵的行向量的数值,根据行向量的数值控制可编程自动移液器从多个待测样本中的取液量,可编程自动移液器按照行向量的输出顺序,将从多个待测样本中采集的液体依次集中于多个测量容器中;
需要进一步说明的是:其中每组取样次数N为批量检测中能够批量检测的样品溶液的最大个数;通过M×N阶随机矩阵控制可编程自动移液器的移液量,M为随机采集的组数(M<<N),恢复信号的正确率随M增大而增大,本实施例1的N为200、M选择60。
步骤二,利用蛋白质浓度检测仪,测得采样矩阵中不同行向量对应的蛋白质浓度采样值,利用质量计算公式:m=ρV,其中:m为采样蛋白质的质量、ρ为所测得采样蛋白质的质量浓度、V为采样液体总体积,将得到的采样蛋白质浓度乘以对应的总体积得到蛋白质的质量采样向量;其中:所述蛋白质的质量采样向量,是指由采样矩阵中不同行向量对应得到多个蛋白质浓度采样值再将所有的乘以进行归一化且将蛋白质浓度采样值转换为蛋白质的质量采样值,最终得到由M个线性投影观测采样值构成的蛋白质的质量采样向量Y=[y1,y2,...,yM]T∈RM,y1,y2,...,yM分别为采样向量Y中的各个元素,RM代表M维实数集,T为矩阵转置符号;其中:当N个待测蛋白质浓度为N维实信号X=[x1,x2,...,xN]T∈RN,x1,x2,...,xN分别为N个待测蛋白质浓度X中的各个元素,RN代表N维实数集,T为矩阵转置符号。则此时的蛋白质的质量采样向量Y为对信号X执行一个压缩观测的结果为Y=ΦX。
步骤三,选择离散余弦变换作为蛋白质浓度分布的稀疏变换,构成超完备字典;其中:稀疏变换,是指从蛋白质的质量采样向量Y中恢复批量待测样本蛋白质浓度N维信号X,要求X为稀疏向量或X在一个变换域中是稀疏的,即:X可用正交基向量的线性组合式表示:
X = &Sigma; i = 1 N &theta; i &psi; i ,
写成矩阵形式,可以得到:
X=ΨΘ,
其中:Ψ=[ψ12,...,ψN]∈RN×N为正交基字典矩阵(满足ΨΨT=ΨTΨ=I,其中T为矩阵转置符号,I为与Ψ维数相同的单位矩阵),其中,RN×N代表N×N维实数集,ψ12,...,ψN分别为N个正交基基底。Θ是X在一个稀疏变换域中的投影系数,展开稀疏系数向量Θ=[θ12,...,θN]T,其中,θ12,...,θN分别为稀疏系数的各个元素,T为矩阵转置符号。
结合对信号X的压缩观测,记CS信息算子为ACS=ΦΨ,可以得到:
Y=ΦX=ΦΨΘ=ACSΘ,
虽然从Y中恢复Θ也是一个病态问题,但是因为系数Θ是稀疏的,这样未知数个数大大减少,使得信号重构成为可能。
常用的稀疏化方法还包括小波变换、离散傅立叶变换等,由于Θ系数的稀疏度很大程度地影响最终的恢复效果。因此,为了获得最好的恢复效果,可根据不同的批量待测蛋白质选择合适的稀疏变换。
步骤四,在含matlab软件的计算机上,利用恢复算法(具体是正交匹配追踪法,即OMP)对批量待测样品蛋白质浓度分布进行重建;其中,在批量待测样品蛋白质浓度分布信号X稀疏或可压缩的前提下,正交匹配追踪法(OMP)用于求解欠定方程组:
arg min X | | &Psi;X | | s . t . A CS &Theta; = &Phi;X = Y ,
即从蛋白质的质量采样向量Y中恢复待测蛋白质浓度信号X。
最终计算得出奶制品工厂生产出的纯牛奶的批量待测样品蛋白质浓度结果,详见图3,均方误差为5.2637×10-4,由此可见,利用压缩感知理论在30%的欠采样率下能够重建得到较为精确的数据。
实施例2
以本实施例应用于批量测量某地区人群血红蛋白浓度分布特点为例:
测量目的:批量测量某地区人群血红蛋白含量分布特点,作为一种医学指标,可反映某地区人群的健康情况,以此作为理论依据,对此地区人群提供合理、有效的意见来改善健康情况,并可将其数据录入数据库,为以后的研究者提供可以信赖的资料。
测量装置:本实施例2的测量装置包括血红蛋白测试仪、可编程自动移液器和计算机依次连接,其中,血红蛋白测试仪采用上海益联医疗仪器发展有限公司生产的HB1002型血红蛋白测试仪;可编程自动移液器采用弗科斯科技有限公司生产的Ultraspense2000,其包括1个可编程控制机械手、1个可编程控制移液枪、若干个移液枪头和通信接口。具体装配是将可编程控制移液枪置于可编程控制机械手上,通过计算机控制机械手移动和移液枪的移液量,并通过通信接口与含matlab软件的计算机进行数据通信,该通信接口采用串行接口。
测量样品:多个待测血样,采自某地区成年女性,从18岁到78岁,每隔5岁作为一个年龄层,每个年龄层采集50个样本,并依次编号,每次采集20ml,共采集600个样本,部分采样数据如下表所示。
表3血红蛋白部分采样数据
测量方法:本实施例应用于批量测量某地区成年女性血红蛋白浓度的具体步骤包括如下:
步骤一,将多个待检测样本放入检测箱中,按照年龄和采样顺序整齐排列,并依次编号,将其视为血红蛋白浓度一维分布向量;通过计算机生成高斯随机采样矩阵,从该矩阵中依次取出行向量,再由计算机输出行向量信号至可编程自动移液器的控制端,计算机依次输出的行向量的数值控制可编程自动移液器从多个待测样本中的取液量,可编程自动移液器按照行向量的输出顺序,将从多个待测样本中采集的液体依次集中于多个测量容器中;其中:
生成高斯随机采样矩阵的构造式为:矩阵Φ∈RM×N,其中,Φ为采样矩阵,RM×N代表M×N维实数集。该矩阵的每个元素独立地服从伯努力分布,即:
由于在实际样品检测中,样品量有限,为防止在检测尚未完成时样品已耗尽,需对上述生成矩阵进行转化:
&Phi; i , j s = V max &CenterDot; &Phi; i , j M &CenterDot; max { &Phi; } ,
上式M为待测样本采集组数且与最终实际的检测次数相同,Vmax为待测样本的最大体积,需人为设定一个确定值,Φs中的每一行视为一组控制向量。计算机依次根据该矩阵的行向量的数值,根据行向量的数值控制可编程自动移液器从多个待测样本中的取液量,可编程自动移液器按照行向量的输出顺序,将从多个待测样本中采集的液体依次集中于多个测量容器中。
需要进一步说明的是:其中每组取样次数N为批量检测中能够批量检测的血样的最大个数;通过M×N阶随机矩阵控制可编程自动移液器的移液量,M为随机采集的组数(M<<N),恢复信号的正确率随M增大而增大,本实施例2的N为600、M选择180。
步骤二,利用血红蛋白浓度检测仪,测得采样矩阵中不同行向量对应的血红蛋白浓度采样值,利用质量计算公式:m=ρV,其中:m为采样血红蛋白的质量、ρ为所测得采样血红蛋白的质量浓度、V为采样液体总体积,将得到的采样血红蛋白浓度乘以对应的总体积得到血红蛋白的质量采样向量;其中:所述血红蛋白的质量采样向量,是指由采样矩阵中不同行向量对应得到多个血红蛋白浓度采样值再将所有的乘以进行归一化且将血红蛋白浓度采样值转换为血红蛋白的质量采样值,最终得到由M个线性投影观测采样值构成的血红蛋白的质量采样向量Y=[y1,y2,...,yM]T∈RM,y1,y2,...,yM分别为采样向量Y中的各个元素,RM代表M维实数集,T为矩阵转置符号;其中:当N个待测血红蛋白浓度为N维实信号X=[x1,x2,...,xN]T∈RN,x1,x2,...,xN分别为N个待测血红蛋白浓度X中的各个元素,RN代表N维实数集,T为矩阵转置符号。则此时的血红蛋白的质量采样向量Y为对信号X执行一个压缩观测的结果为Y=ΦX。
步骤三,选择离散余弦变换作为血红蛋白浓度分布的稀疏变换,构成超完备字典;其中:稀疏变换,是指从血红蛋白的质量采样向量Y中恢复批量待测样本血红蛋白浓度N维信号X,要求X为稀疏向量或X在一个变换域中是稀疏的,即:X可用正交基向量的线性组合式表示:
X = &Sigma; i = 1 N &theta; i &psi; i ,
写成矩阵形式,可以得到:
X=ΨΘ,
其中:Ψ=[ψ12,...,ψN]∈RN×N为正交基字典矩阵(满足ΨΨT=ΨTΨ=I,其中T为矩阵转置符号,I为与Ψ维数相同的单位矩阵),其中,RN×N代表N×N维实数集,ψ12,...,ψN分别为N个正交基基底。Θ是X在一个稀疏变换域中的投影系数,展开稀疏系数向量Θ=[θ12,...,θN]T,其中,θ12,...,θN分别为稀疏系数的各个元素,T为矩阵转置符号。
结合对信号X的压缩观测,记CS信息算子为ACS=ΦΨ,可以得到:
Y=ΦX=ΦΨΘ=ACSΘ,
虽然从Y中恢复Θ也是一个病态问题,但是因为系数Θ是稀疏的,这样未知数个数大大减少,使得信号重构成为可能。
常用的稀疏化方法还包括小波变换、离散傅立叶变换等,由于Θ系数的稀疏度很大程度地影响最终的恢复效果。因此,为了获得最好的恢复效果,可根据不同的批量待测样本选择合适的稀疏变换。
步骤四,在含matlab软件的计算机上,利用恢复算法(具体是基追踪法,即BP)对批量待测样品血红蛋白浓度分布进行重建;其中,在批量待测样品血红蛋白浓度分布信号X稀疏或可压缩的前提下,基追踪法(BP)用于求解欠定方程组:
arg min X | | &Psi;X | | s . t . A CS &Theta; = &Phi;X = Y ,
即从血红蛋白的质量采样向量Y中恢复待测血红蛋白浓度信号X。
最终计算得出采自某地区成年女性血红蛋白浓度的结果,详见图4,其均方误差为1.2434×10-6,,由此可见,利用压缩感知理论在30%的欠采样率下能够重建得到较为精确的数据。
常用的恢复算法有正交匹配追踪法,基追踪法、匹配追踪法,阈值收缩法和共轭梯度法等。
本发明的具体实施方式中凡未涉到的说明属于本领域的公知技术,可参考公知技术加以实施。以上具体实施方式及实施例是对本发明提出的一种基于压缩感知原理的蛋白浓度批量检测方法技术思想的具体支持,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在本技术方案基础上所做的任何等同变化或等效的改动,均仍属于本发明技术方案保护的范围。

Claims (4)

1.一种基于压缩感知的蛋白批量测定方法,其特征在于,包括以下步骤:
步骤一,将N个待检测样本顺序排列并依次编号,作为蛋白浓度一维分布向量;通过计算机生成采样矩阵,采样矩阵的列数为N,采样矩阵的行数为M,M<<N;根据采样矩阵行向量每一行元素的输出顺序依次从N个待测样本中取液,将每行N次取液混合作为一个采样,共得到M个采样,N个待测样本中每次的取液量最小为0;待检测样本为蛋白质溶液;
步骤二,将M个采样按照顺序依次进行蛋白浓度检测,测得采样矩阵中不同行向量对应的采样蛋白浓度,利用质量计算公式计算:m=ρV,其中:m为采样蛋白的质量、ρ为采样蛋白的质量浓度、V为采样的液体体积;
步骤三,选择稀疏变换,构成超完备字典;
步骤四,利用恢复算法对N个待检测样本的蛋白浓度进行重建;
步骤一所述生成采样矩阵的构造式为:
Φ∈RM×N
其中,Φ为采样矩阵,RM×N代表M×N维实数集,采样矩阵满足有限等距性;
对所述采样矩阵进行优化得到矩阵Φs,矩阵Φs中每个元素的计算公式如下:
&Phi; i , j s = V m a x &CenterDot; &Phi; i , j M &CenterDot; max { &Phi; } ,
Vmax为N个待测样本中的最大体积,Φs中的每一行视为一组控制向量,max{Φ}表示Φ矩阵中最大的一个元素,Φi,j表示Φ矩阵中的第i行,第j列的元素。
2.根据权利要求1所述的基于压缩感知的蛋白批量测定方法,其特征在于,蛋白的质量采样向量Y为对信号X执行一个压缩观测的结果,质量计算公式为Y=ΦX,信号X即待测蛋白浓度X,将质量计算公式进行扩展得到:
其中,x1,x2,...,xN分别为N个待测蛋白浓度X中的各个元素,N个待测蛋白浓度X为N维实信号X=[x1,x2,...,xN]T∈RN,RN代表N维实数集,T为矩阵转置符号;M个线性投影观测采样构成的蛋白的质量采样向量Y=[y1,y2,...,yM]T∈RM,y1,y2,...,yM分别为蛋白的质量采样向量Y中的各个元素,RM代表M维实数集;蛋白的质量采样向量Y,是指由采样矩阵中每个行向量对应的蛋白质量浓度采样值乘以进行归一化且将蛋白的质量浓度采样值转换为蛋白的质量采样值,其中,为第i行向量对应的蛋白质量浓度采样值,即为总的M行向量对应的蛋白质量浓度采样值。
3.根据权利要求2所述的基于压缩感知的蛋白批量测定方法,其特征在于,步骤三所述稀疏变换,是指从蛋白的质量采样向量Y中恢复N个待测样本蛋白浓度N维信号X,要求信号X为稀疏向量或信号X在一个变换域中是稀疏的。
4.根据权利要求1所述的基于压缩感知的蛋白批量测定方法,其特征在于,步骤四所述恢复算法,是指从蛋白的质量采样向量Y中恢复N个待测样本蛋白浓度N维信号X是一个求解线性方程组,在N个待测样本蛋白浓度X稀疏或可压缩的前提下的求解欠定方程组:
arg m i n X | | &Psi; X | |
s.t.ACSΘ=ΦX=Y,
其中,Ψ为正交基字典矩阵,ΨX为对X向量进行稀疏变换所得的稀疏系数,代表求得在ΨX的1范数最小时对应的X向量,s.t.代表约束条件,ACS=ΦΨ为CS信息算子,Θ是X在一个稀疏变换域中的投影系数,Φ为采样矩阵,X代表N个待测蛋白浓度,Y为蛋白的质量采样向量。
CN201410480261.8A 2014-09-18 2014-09-18 基于压缩感知的蛋白批量测定方法 Active CN104215550B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410480261.8A CN104215550B (zh) 2014-09-18 2014-09-18 基于压缩感知的蛋白批量测定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410480261.8A CN104215550B (zh) 2014-09-18 2014-09-18 基于压缩感知的蛋白批量测定方法

Publications (2)

Publication Number Publication Date
CN104215550A CN104215550A (zh) 2014-12-17
CN104215550B true CN104215550B (zh) 2016-07-06

Family

ID=52097271

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410480261.8A Active CN104215550B (zh) 2014-09-18 2014-09-18 基于压缩感知的蛋白批量测定方法

Country Status (1)

Country Link
CN (1) CN104215550B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116819086A (zh) * 2022-06-07 2023-09-29 南方科技大学 一种提高化合物与蛋白质相互作用实验通量的方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0021887D0 (en) * 2000-09-06 2000-10-18 Provalis Diagnostics Ltd Assay device
EP1637882B1 (de) * 2004-09-09 2007-08-08 Analyticon Biotechnologies AG Lateralflussmessvorrichtung und Messverfahren für Analyten
CN101742313B (zh) * 2009-12-10 2011-09-07 北京邮电大学 基于压缩感知技术的分布式信源编码的方法
US20120077874A1 (en) * 2010-02-15 2012-03-29 Yun Kau Tam Development of a phytoestrogen product for the prevention or treatment of osteoporosis using red clover
CN102291341A (zh) * 2011-07-08 2011-12-21 南京邮电大学 基于压缩感知的宽带频谱感知方法

Also Published As

Publication number Publication date
CN104215550A (zh) 2014-12-17

Similar Documents

Publication Publication Date Title
Ferketich et al. Focus on psychometrics. The multitrait–multimethod approach to construct validity
CN204666549U (zh) 基于bp神经网络的混合气体检测系统
CN203929621U (zh) 二维码自动识别校准试剂的生化分析仪
CN101699283A (zh) 智能化食品安全检测系统及检测方法
CN105528288A (zh) 一种软件测试方法以及装置
CN105488520A (zh) 基于多分辨奇异谱熵和svm的泄漏声发射信号识别方法
CN109472317A (zh) 多维信号的实时故障检测与实时故障隔离方法
CN103017954B (zh) 一种平板应力场测量方法
Du et al. Three-dimensional stress wave imaging of wood internal defects using TKriging method
CN105045220B (zh) 一种用于实验室诊断领域或工业生产领域的基于多变量z分数质量控制图的质量控制方法
CN102866256B (zh) 一种超敏c反应蛋白检测方法及检测试剂
CN103837533B (zh) 基于热成像仪的混凝土温度监测与仿真反分析方法
CN104215550B (zh) 基于压缩感知的蛋白批量测定方法
CN115791891A (zh) 一种基于压电阻抗技术的结构损伤识别方法及系统
CN109657733B (zh) 基于成分结构特征的品种鉴别方法与系统
CN104062253B (zh) 一种基于压缩感知原理的离子浓度批量检测方法
CN204405306U (zh) 疲劳寿命计标定装置
CN107817784B (zh) 一种基于并发偏最小二乘的过程故障检测方法
CN205749278U (zh) 一种呼出气体检测装置
CN103869053B (zh) 区域地球化学调查样品分析异常点抽检方法
CN201555840U (zh) 一种食品安全检测装置
CN107516014A (zh) 定性和定量测量数据的计量学处理方法
Sinaga et al. Modified length board is effectively detecting stunted children at Posyandu: A precision and accuracy test
CN117740857A (zh) 确定页岩氯仿沥青“a”含量的方法、装置及设备
CN117423214A (zh) 一种基于环境dna数据的环境生态风险评估方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant