CN107845089A - 一种基于颜色信息的测量方法、装置及系统 - Google Patents

一种基于颜色信息的测量方法、装置及系统 Download PDF

Info

Publication number
CN107845089A
CN107845089A CN201711021819.6A CN201711021819A CN107845089A CN 107845089 A CN107845089 A CN 107845089A CN 201711021819 A CN201711021819 A CN 201711021819A CN 107845089 A CN107845089 A CN 107845089A
Authority
CN
China
Prior art keywords
colouring information
aim parameter
training
information
measured
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711021819.6A
Other languages
English (en)
Inventor
张�林
刘心宇
黄绍伦
董宇涵
于东方
李承煜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua Berkeley Shenzhen College Preparatory Office
Original Assignee
Tsinghua Berkeley Shenzhen College Preparatory Office
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua Berkeley Shenzhen College Preparatory Office filed Critical Tsinghua Berkeley Shenzhen College Preparatory Office
Priority to CN201711021819.6A priority Critical patent/CN107845089A/zh
Publication of CN107845089A publication Critical patent/CN107845089A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于颜色信息的测量方法、装置及系统,该测量方法包括:基于交替条件期望ACE算法构建特征提取模型;获取颜色信息,采用所述特征提取模型对所述颜色信息进行特征提取,形成第一特征数据;将所述第一特征数据输入到预先训练的数学模型中,获取与所述颜色信息对应的待测目标量。本发明实施例解决了基于函数形式假设回归方法建立的颜色信息回归模型中存在的模型无法满足回归性能要求及模型缺乏适用性的问题,实现了提供一种在统计最优的条件下,不依赖具体函数形式假设回归方法,建立降维后的颜色信息到待测目标量的映射关系,从而使示色材料具有定量描述待测目标量的能力,同时提高了待测目标量的测量精度。

Description

一种基于颜色信息的测量方法、装置及系统
技术领域
本发明实施例涉及测量技术领域,尤其涉及一种基于颜色信息的测量方法、装置及系统。
背景技术
目前,各式各样的示色材料被应用于丰富的检测应用场景中,虽然应用场景以及示色材料本身的响应原理不同,但是存在一个共同的特点:通过示色材料响应后的颜色,来指示待测目标量。即从本质上构建了一种从颜色到待测目标量的对应关系。
现有技术中获得这种“对应关系”的方法主要基于如下两种方式,方式一,采用简单的线性拟合以及多项式拟合,用于描述量化后的颜色信息与待测目标量之间的函数关系;方式二:基于支持向量机,来构建量化后的颜色信息与待测目标量之间的回归模型。但是现有技术中的上述方法构建的颜色信息与待测目标量之间的关系,测量的待测目标量准确精度较低,不能很好的通过颜色信息确定待测目标量。
发明内容
本发明提供一种基于颜色信息的测量方法、装置及系统,实现准确获取待测目标量的效果。
第一方面,本发明实施例提供了一种基于颜色信息的测量方法,所述方法包括:
基于交替条件期望ACE算法构建特征提取模型;
获取颜色信息,采用所述特征提取模型对所述颜色信息进行特征提取,形成第一特征数据;
将所述第一特征数据输入到预先训练的数学模型中,获取与所述颜色信息对应的待测目标量。
第二方面,本发明实施例还提供了一种基于颜色信息的测量装置,应用于如本发明任意实施例所述的基于颜色信息的测量方法,所述测量装置包括:
特征提取模型生成模块,用于基于交替条件期望ACE算法构建特征提取模型;
第一特征数据生成模块,用于获取颜色信息,采用所述特征提取模型对所述颜色信息进行特征提取,形成第一特征数据;
待测目标量生成模块,用于将所述第一特征数据输入到预先训练的数学模型中,获取与所述颜色信息对应的待测目标量。
第三方面,本发明实施例还提供了一种基于颜色信息的测量系统,包括如本发明实施例所述的测量装置,所述系统还包括:
反应发生装置,用于提供目标量信息与示色材料的反应空间;
信息采集装置,用于采集颜色信息,将所述颜色信息发送给所述测量装置;
显示装置,用于将所述测量装置获取的待测目标量进行显示。
本发明通过采用基于ACE(Alternating Conditional Expectations,交替条件期望)算法构建特征提取模型,并基于特征提取模型对获取的颜色信息进行特征提取,形成第一特征数据,并将其作为输入变量输入到预先训练的数学模型中,输出与所述颜色信息对应的待测目标量,解决了基于函数形式假设回归方法建立的颜色信息回归模型中存在的模型无法满足回归性能要求及模型缺乏适用性的问题,实现了提供一种在统计最优的条件下,不依赖具体函数形式假设回归方法,建立降维后的颜色信息到待测目标量的映射关系,从而使示色材料具有定量描述待测目标量的能力,同时提高了待测目标量的测量精度。
附图说明
图1是本发明实施例一中的一种基于颜色信息的测量方法的流程图;
图2a是本发明实施例二中的一种基于颜色信息的测量方法的流程图;
图2b是本发明实施例二中的一种基于颜色信息获取待测相对湿度的方法示意图;
图2c是本发明实施例二中的一种基于颜色信息的算法性能比较的示意图;
图3a是本发明实施例三中的一种基于颜色信息的测量装置的示意图;
图3b是本发明实施例三中的一种基于颜色信息的测量装置的示意图;
图4是本发明实施例四中的一种基于颜色信息的测量系统的示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种基于颜色信息的测量方法的流程图,本实施例可适用于基于示色反应进行测量的应用场景中,将示色反应中可获取的颜色信息转化为待测目标量,建立颜色信息到待测目标量的映射关系,使得待测目标量得以通过颜色信息实现有效量化表达。该方法可以由基于颜色信息的测量装置来执行,所述装置由软件和/或硬件来执行,所述装置可配置在测量设备中,如图1所示,本实施例提供的技术方案包括如下步骤:
步骤S110、基于交替条件期望ACE算法构建特征提取模型。
其中,ACE算法是在自变量和因变量满足可加模型的条件下,求解自变量和因变量的最优非线性映射的广义算法。在实际应用中,可以利用得到的最优非线性映射关系进行自变量特征提取。特征提取(有时又称为维数约减或降维)是指将原始训练数据从原先的高维数据空间映射或变换到低维特征空间,得到最能反映训练数据本质的低维数据特征,其中,特征空间包括但不限于概率空间和数据空间。高维数据是指维数较高的数据,也即多维数据,例如,通过阵列形式的颜色传感器获取的颜色信息,其中,颜色信息采用RGB三元值进行量化,阵列共计L(L>1)个片段,进而,一组颜色信息便可表示为一个3L维向量,则上述颜色信息即为高维数据。此外,通过光谱仪获取多个波长下的颜色信息也为高维数据。示例性的,特征提取可以描述为这样一个过程,对特征矢量U=(u1,u2,...,uQ)T施行变换:vs=hs(U),s=1,2,...,P,P<Q,产生出降维的特征向量V=(v1,v2,...,vP)T
示例性的,颜色信息包括RGB信息或光谱信息,并且并不局限于RGB信息和光谱信息。
在本发明的一种实施方式中,步骤S110包括如下步骤:
步骤1、在标准数据库中,获取设定数量组的训练数据,形成训练样本集。
其中,每组训练数据包括颜色信息以及对应的目标量,每组训练数据通过如下公式进行表示:{(Xi,Yi)|Xi∈X,Yi∈Y,i=1,2,...,N},其中,Xi为第i组颜色信息,Xi=[Xi1,Xi2,...,Xim,...,XiM],Xim为Xi的第m个颜色信息,m=1,2,...,M;Yi为第i组目标量,N为所述训练集样本的容量;X为所述训练样本集中由N组颜色信息构成的集合,Y为所述训练样本集中由N组目标量构成的集合。
可选的,可以利用基于颜色变化指示待测量的传感器来采集上述颜色信息,如生物示色传感器,优选的,如噬菌体示色传感器。
步骤2、以目标量为变量生成初始映射关系gj(Yi),设定最大特征数K。
其中,j=1,i=1,2,...,N。
步骤3、采用公式fj(Xim)=E[gj(Y)|X=Xim]更新fj(Xim),并采用公式gj(Yi)=E[fj(X)|Y=Yi]更新gj(Yi)。
其中,j=1,2,...,K;fj(Xim)为当特征数为j时,Xim对应的映射关系;gj(Yi)为当特征数为j时,Yi对应的映射关系;fj(X)为由fj(Xim)构成的映射关系集合;gj(Y)为由gj(Yi)构成的映射关系集合;E[gj(Y)|X=Xim]为当X取值为Xim时,gj(Y)的数学期望;E[fj(X)|Y=Yi]为当Y取值为Yi时,fj(X)的数学期望。
步骤4、通过公式gj(Yi)={gj(Yi)-E[gj(Y)]}/{E[(gj(Y))2]}1/2对更新后的gj(Yi)进行正规化处理,以满足约束条件E[gj(Y)]=0,Var[gj(Y)]=1。
其中,E[(gj(Y))2]为(gj(Y))2的数学期望,Var[gj(Y)]为gj(Y)的方差。
步骤5、若j>1,则分别对获取的[g1(Y),g2(Y),...,gj(Y)]、[f1(X),f2(X),...,fj(X)]利用格拉姆-施密特正交化方法进行处理,得到正交化后的[g1(Y)',g2(Y)',...,gj(Y)']、[f1(X)',f2(X)',...,fj(X)'];否则,执行步骤6。
其中,gj(Y)'、fj(X)'分别为gj(Y)、fj(X)经正交化处理获取的。
步骤6、重复步骤3-步骤5,直至E[fj(X)'×gj(Y)']不再增加。
其中,E[fj(X)'×gj(Y)']为fj(X)'与gj(Y)'乘积的数学期望。根据E[fj(X)'×gj(Y)']不再增加,实现了统计意义下的条件最优。
步骤7、若j<K,则j=j+1,返回步骤3;否则,返回输出f(X)=[f1(X)',f2(X)',...,fj(X)',...,fK(X)']T
其中,fj(X)'为提取后的特征数据中的第j个,f(X)为预设的特征提取模型。
利用ACE算法建立X→f(X),Y→g(Y),可以解决无法直接利用自变量X和因变量建立“对应关系”的情况。
示例性的,构建特征提取模型的算法还包括主成分分析,并且并不局限于ACE算法和PCA(Principal Components Analysis,主成分分析)。
其中,PCA是一种将原自变量重新组合成一组新的相互无关的几个综合变量,同时根据实际需要从中提取出较少的几个综合变量,并尽可能多地反映原自变量信息的统计方法,其中,较少的几个综合变量即为主成分。PCA分析过程也就是坐标旋转过程,各主成分表达式就是新坐标与原始坐标系的转换关系,新坐标系中各坐标轴的方向就是原自变量方差最大的方向。具体实现过程为:
步骤1、在标准数据库中,获取设定数量组的颜色信息,形成训练样本集,其中,颜色信息可以表示为{Xi|Xi∈X,i=1,2,...,N},Xi为第i组颜色信息,Xi=[Xi1,Xi2,...,Xim,...,XiM],Xim为Xi的第m个颜色信息,m=1,2,...,M。
步骤2、采用公式进行标准化处理,其中,
步骤3、根据公式计算相关系数矩阵R。
步骤4、根据公式|λE-R|=0计算特征值,求出特征值λi,根据公式|λiE-R|ei=0,求出对应于λi的特征向量ei,i=1,2,...,N。
步骤5、根据公式计算主成分的贡献率。
步骤6、根据计算前i个主成分的累计贡献率,当前i个主成分的累计贡献率达到85%-95%时,取前i个主成分作为新变量。
步骤7、根据f(X)=XN×MAM×i获取特征提取模型f(X),其中,AM×i由ei构成的矩阵。
步骤S120、获取颜色信息,采用所述特征提取模型对所述颜色信息进行特征提取,形成第一特征数据。
其中,示例性的,所述颜色信息为X',Xi'∈X',Xi'为第i组颜色信息Xi'=[Xi1',Xi2',...,Xim',...,XiM'],i=1,2,...,N,XiM'为Xi'的第m个颜色信息,m=1,2,...,M,将X'输入到步骤S110建立的特征提取模型f(X)中,得到f(X')=[f1(X')',f2(X')',...,fj(X')',...,fK(X')']T,其中,fj(X')'为提取后的第一特征数据中的第j个。
通过对获取的颜色信息进行特征提取,形成第一特征数据,实现了高维颜色信息的降维,同时可以降低预先训练的数学模型的复杂度,防止数学模型出现过拟合。
步骤S130、将所述第一特征数据输入到预先训练的数学模型中,获取与所述颜色信息对应的待测目标量。
其中,预先训练的数学模型是指回归模型,所述回归模型具体是指通过回归分析对统计关系进行定量描述的一种数学模型。回归分析是研究一个变量(因变量)关于另一个或几个变量(自变量)的具体依赖关系的计算方法理论,回归分析从一组训练数据出发,确定变量之间的数学关系式,对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些变量的影响不显著。利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度。所述回归模型包括非参数回归模型,具体是指不预先设定回归函数的形式,借助回归数据以及权函数完成回归分析。待测目标量是指实际测量场景中的物理量,所述物理量主要有两种呈现形式,其一,获取待测物理量的定量数值,例如,尿液成分中各个组分的具体含量,具体相对湿度的测量数值等;其二,获取待测物理量的定性所属分类,例如,预先设定相对湿度的程度,将相对湿度在5%-15%范围内,标识为湿润,将相对湿度在1%-5%范围内,标识为干燥。当检测到相对湿度为8%时,由于该值位于5%-15%范围内,则获取分类结果为湿润。
示例性的,回归模型包括SVR(Support Vector Regression,支持向量机回归)或神经网络,并且并不局限于SVR和神经网络。由于SVR或神经网络是一类不依赖具体函数形式假设回归的方法,可以解决基于函数形式的简单的线性拟合及多项式拟合的回归方法受限于观察和经验,在校准实验采样不够充分时,会严重偏离真实值,且对于高维颜色数据难以奏效,同时也缺少泛用性的问题。
在现有技术中在基于颜色信息测量目标量时,可以采用多种方法,其一,采用简单的线性拟合以及多项式拟合,用于描述量化后的颜色RGB信息与待测目标量之间的函数关系,取得了一定的效果,但存在基于函数形式假设的建模通常受限于观察和经验,在校准实验采样不够充分时,会严重偏离真实值,且对于示色材料阵列产生的高维数据难以奏效,同时也缺少泛用性的问题。本实施例的技术方案,通过将第一特征数据作为输入变量输入到预先训练的数学模型中,输出与所述颜色信息对应的待测目标量,建立降维后的颜色信息到待测目标量的映射关系,其中,预先训练的数学模型为SVR或神经网络,由于SVR或神经网络是一类不依赖具体函数形式假设回归的方法,可以解决上述问题;其二,基于支持向量机的模型,对于回归模型的最优性缺乏有力的理论支撑。本实施例的技术方案,通过采用基于ACE算法构建在统计最优条件下的特征提取模型,解决了数学模型最优性缺乏理论支撑的问题;此外,本实施例的技术方案,通过基于特征提取模型对获取的颜色信息进行特征提取,形成第一特征数据,实现了颜色信息的降维,同时可以降低数学模型的复杂度,防止数学模型出现过拟合。从而整体上使示色材料具有定量描述待测目标量的能力,同时提高了待测目标量的测量精度。
实施例二
图2a为本发明实施例二提供的一种基于颜色信息的测量方法的流程图,在上述实施例一的基础上,本实施例还提供了基于颜色信息的测量方法的校准阶段,该方法可以由基于颜色信息的测量装置来执行,所述装置由软件和/或硬件来执行,所述装置可配置在测量设备中,如图2a所示,本实施例提供的技术方案包括如下步骤:
步骤S210、基于交替条件期望ACE算法构建特征提取模型。
步骤S220、在标准数据库中,获取设定数量组的训练数据,所述训练数据包括颜色信息以及对应的目标量。
步骤S230、采用所述ACE算法对所述训练数据中的颜色信息进行特征提取,形成第二特征数据,以所述第二特征数据为输入变量,以对应的所述目标量为输出变量,采用所述第二特征数据和对应的所述目标量对预设的数学模型进行训练,得到预先训练的数学模型。
其中,示例性的,所述颜色信息为X”,Xi”∈X”,Xi”为第i组颜色信息Xi”=[Xi1”,Xi2”,...,Xim”,...,XiM”],i=1,2,...,N,Xim”为Xi”的第m个颜色信息,m=1,2,...,M,将X”输入到步骤S210建立的特征提取模型f(X)中,得到f(X”)=[f1(X”)',f2(X”)',...,fj(X”)',...,fK(X”)']T,其中,fj(X”)'为提取后的第一特征数据中的第j个。
通过将提取的特征数据输入到数学模型中,对数学模型进行训练,可以使测量结果更加精确,提高测量精度。
步骤S240、获取颜色信息,采用所述特征提取模型对所述颜色信息进行特征提取,形成第一特征数据。
步骤S250、将所述第一特征数据输入到预先训练的数学模型中,获取与所述颜色信息对应的待测目标量。
其中,步骤S210-步骤S230为基于颜色信息的测量方法的校准阶段,利用训练数据构建特征提取模型和获取预先训练的数学模型,为使用阶段提供模型支持,其中,特征提取模型和获取预先训练的数学模型中使用的训练数据可以相同也可以不同;步骤S240-步骤S250为基于颜色信息的测量方法的使用阶段,利用特征提取模型和预先训练的数学模型将输入的获取的颜色信息转化为待测目标量并输出。
本实施例的技术方案,通过采用基于ACE算法构建特征提取模型,并基于特征提取模型对获取的颜色信息进行特征提取,形成第一特征数据,并将其作为输入变量输入到预先训练的数学模型中,输出与所述颜色信息对应的待测目标量,解决了基于函数形式假设回归方法建立的颜色信息回归模型中存在的模型无法满足回归性能要求及模型缺乏适用性的问题,实现了提供一种在统计最优的条件下,不依赖具体函数形式假设回归方法,建立降维后的颜色信息到待测目标量的映射关系,从而使示色材料具有定量描述待测目标量的能力,同时提高了待测目标量的测量精度。
在上述实施例的基础上,本实施例还提供了一个优选实施例。如图2b所示,提供了一种基于颜色信息获取待测相对湿度的方法示意图。整个技术方案分为校准阶段和使用阶段,其中,参与特征提取模型和对数学模型进行训练的的训练数据构成的训练集样本的数据均为36组。并且参与特征提取模型的训练数据可以与参与对数据模型进行训练的训练数据相同。用于评价的预测数据构成的预测集的样本数为18组,即待测的样本集数据为18组。优选的,利用噬菌体示色传感器采集颜色信息,同时利用湿度计采集对应的相对湿度,其中,传感器为4×7阵列,共计28个片段,具体实现过程为:
校准阶段:
步骤1、采集36组训练数据,每组训练数据包括颜色信息X和对应的相对湿度Y,其中,颜色信息的量化采用RGB三元值,因此,阵列在某一相对湿度下的颜色信息可以用一个28×3维行向量表示,即一个84维行向量表示,用于指示相对湿度,相对湿度的值域为离散集合5n%,n=1,2,...,18。于是,训练数据为{(Xi,Yi)|Xi∈X,Yi∈Y,i=1,2,...,36},其中,Xi=[Xi1,Xi2,...,Xi84],则X∈R36×84
步骤2、利用特征提取算法对获取的颜色信息X进行特征提取,构建特征提取模型f(X),下面分别采用主成分分析和ACE算法进行特征提取,具体地,采用主成分分析对颜色信息X进行提取,经计算前四个主成分集中了95%以上的信息,则f(X)=X36×84A84×4,上述为线性变换,A为主成分分析求得的变换矩阵,前四个主成分即为特征数据。采用ACE算法对颜色信息X进行提取,得到特征数据f1(X),f2(X),f3(X),f4(X)。采用上述两种方法获取的f(X)即为构建的特征提取模型并将其保存下来。
步骤3、利用获取的特征数据f(Xi)与其相对湿度Yi组成数据对(f(Xi),Yi),输入SVR进行训练,得到预先训练的数学模型M并将其保存下来。
使用阶段:
步骤4、利用与步骤1同样的方式,采集18组预测数据,所述预测数据为颜色信息X'。
步骤5、根据校准阶段构建的特征提取模型f(X)和预先训练的数学模型M,得到Y'=M(f(X')),即获取颜色信息X'对应的相对湿度Y'。
进一步地,利用预测数据在预先训练的数学模型下计算结果的正确率作为评价算法性能的指标,该正确率的统计基于多次训练/预测集随机划分实验结果。同时,比较不同传感器阵列片段下几种算法的性能,即不同颜色信息维度下几种算法的性能,预先训练的数学模型的预测结果在±2.5%以内视为正确。参与比较的方法包括:直接多元线性回归、SVR、PCA进行特征提取后SVR以及ACE特征提取后SVR。
如图2c所示,随着传感器阵列片段的增多,即随着颜色信息数据维度的升高,简单的多元线性回归算法已经无法满足回归性能的要求,基于SVR的方法相比于确定函数形式的回归方法有更大的优势。而在采用SVR之前,对原始颜色信息数据进行特征提取,能够进一步提高预先训练的数学模型的准确性。采用PCA进行特征提取后的SVR的效果优于SVR,而基于ACE特征提取则进一步提升了SVR性能,尤其在数据维数较高的条件下(如片段数大于20),存在显著优势,而且稳定性更高。
从上述比较结果中可以看出,在示色材料传感阵列(尤其是特性存在未知的)回归问题上,传统的多元线性回归方法已经难以奏效,SVR也存在较大误差。利用PCA进行特征提取有助于改善回归模型的性能,而基于ACE算法的特征提取进一步改善了回归模型的性能,同时相比于PCA在理论上更加一般化。
实施例三
图3a为本发明实施例三提供的一种基于颜色信息的测量装置的示意图,在上述各实施例的基础上,本实施例可适用于基于示色反应进行测量的应用场景中,将示色反应中可获取的颜色信息转化为待测目标量,建立颜色信息到待测目标量的映射关系,使得待测目标量得以通过颜色信息实现有效量化表达。该装置具体包括:
特征提取模型生成模块310,用于基于交替条件期望ACE算法构建特征提取模型。
进一步地,特征提取模型生成模块310具体用于:
步骤1、在标准数据库中,获取设定数量组的训练数据,形成训练样本集。
其中,每组训练数据包括颜色信息以及对应的目标量,每组训练数据通过如下公式进行表示:{(Xi,Yi)|Xi∈X,Yi∈Y,i=1,2,...,N},其中,Xi为第i组颜色信息,Xi=[Xi1,Xi2,...,Xim,...,XiM],Xim为Xi的第m个颜色信息,m=1,2,...,M;Yi为第i组目标量,N为所述训练集样本的容量;X为所述训练样本集中由N组颜色信息构成的集合,Y为所述训练样本集中由N组目标量构成的集合。
步骤2、以目标量为变量生成初始映射关系gj(Yi),设定最大特征数K。
其中,j=1,i=1,2,...,N。
步骤3、采用公式fj(Xim)=E[gj(Y)|X=Xim]更新fj(Xim),并采用公式gj(Yi)=E[fj(X)|Y=Yi]更新gj(Yi)。
其中,j=1,2,...,K;fj(Xim)为当特征数为j时,Xim对应的映射关系;gj(Yi)为当特征数为j时,Yi对应的映射关系;fj(X)为由fj(Xim)构成的映射关系集合;gj(Y)为由gj(Yi)构成的映射关系集合;E[gj(Y)|X=Xim]为当X取值为Xim时,gj(Y)的数学期望;E[fj(X)|Y=Yi]为当Y取值为Yi时,fj(X)的数学期望。
步骤4、通过公式gj(Yi)={gj(Yi)-E[gj(Y)]}/{E[(gj(Y))2]}1/2对更新后的gj(Yi)进行正规化处理,以满足约束条件E[gj(Y)]=0,Var[gj(Y)]=1。
其中,E[(gj(Y))2]为(gj(Y))2的数学期望,Var[gj(Y)]为gj(Y)的方差。
步骤5、若j>1,则分别对获取的[g1(Y),g2(Y),...,gj(Y)]、[f1(X),f2(X),...,fj(X)]利用格拉姆-施密特正交化方法进行处理,得到正交化后的[g1(Y)',g2(Y)',...,gj(Y)']、[f1(X)',f2(X)',...,fj(X)'];否则,执行步骤6。
其中,gj(Y)'、fj(X)'分别为gj(Y)、fj(X)经正交化处理获取的。
步骤6、重复步骤3-步骤5,直至E[fj(X)'×gj(Y)']不再增加。
其中,E[fj(X)'×gj(Y)']为fj(X)'与gj(Y)'乘积的数学期望。实现了统计意义下的条件最优。
步骤7、若j<K,则j=j+1,返回步骤3;否则,返回输出f(X)=[f1(X)',f2(X)',...,fj(X)',...,fK(X)']T
其中,fj(X)'为提取后的特征数据中的第j个,f(X)为预设的特征提取模型。
利用ACE算法建立X→f(X),Y→g(Y),可以解决无法直接利用自变量X和因变量建立“对应关系”的情况。
示例性的,构建特征提取模型的算法还包括主成分分析,并且并不局限于ACE算法和PCA(Principal Components Analysis,主成分分析)。
第一特征数据生成模块320,用于获取颜色信息,采用所述特征提取模型对所述颜色信息进行特征提取,形成第一特征数据。
其中,示例性的,所述颜色信息为X',Xi'∈X',Xi'为第i组颜色信息Xi'=[Xi1',Xi2',...,Xim',...,XiM'],i=1,2,...,N,XiM'为Xi'的第m个颜色信息,m=1,2,...,M,将X'输入到步骤S110建立的特征提取模型f(X)中,得到f(X')=[f1(X')',f2(X')',...,fj(X')',...,fK(X')']T,其中,fj(X')'为提取后的第一特征数据中的第j个。
通过对获取的颜色信息进行特征提取,形成第一特征数据,实现了高维颜色信息的降维,同时可以降低预先训练的数学模型的复杂度,防止数学模型出现过拟合。
待测目标量生成模块330,用于将所述第一特征数据输入到预先训练的数学模型中,获取与所述颜色信息对应的待测目标量。
其中,待测目标量是指实际测量场景中的物理量,例如,酸碱度、尿液成分、相对湿度等。所述数学模型为回归模型。
示例性的,回归模型包括SVR(Support Vector Regression,支持向量机回归)或神经网络,并且并不局限于SVR和神经网络。由于SVR或神经网络是一类不依赖具体函数形式假设回归的方法,可以解决基于函数形式的简单的线性拟合及多项式拟合的回归方法受限于观察和经验,在校准实验采样不够充分时,会严重偏离真实值,且对于高维颜色数据难以奏效,同时也缺少泛用性的问题。
本实施例的技术方案,通过采用基于ACE算法构建特征提取模型,并基于特征提取模型对获取的颜色信息进行特征提取,形成第一特征数据,并将其作为输入变量输入到预先训练的数学模型中,输出与所述颜色信息对应的待测目标量,解决了基于函数形式假设回归方法建立的颜色信息回归模型中存在的模型无法满足回归性能要求及模型缺乏适用性的问题,实现了提供一种在统计最优的条件下,不依赖具体函数形式假设回归方法,建立降维后的颜色信息到待测目标量的映射关系,从而使示色材料具有定量描述待测目标量的能力,同时提高了待测目标量的测量精度。
进一步地,如图3b所示,该装置还包括:
预先训练的数学模型生成模块301,用于获取设定数量组的训练数据,所述训练数据包括颜色信息以及对应的目标量;采用所述ACE算法对所述训练数据中的颜色信息进行特征提取,形成第二特征数据,以所述第二特征数据为输入变量,以对应的所述目标量为输出变量,采用所述第二特征数据和对应的所述目标量对预设的数学模型进行训练,得到预先训练的数学模型。
其中,示例性的,所述颜色信息为X”,Xi”∈X”,Xi”为第i组颜色信息Xi”=[Xi1”,Xi2”,...,Xim”,...,XiM”],i=1,2,...,N,XiM”为Xi”的第m个颜色信息,m=1,2,...,M,将X”输入到步骤S210建立的特征提取模型f(X)中,得到f(X”)=[f1(X”)',f2(X”)',...,fj(X”)',...,fK(X”)']T,其中,fj(X”)'为提取后的第一特征数据中的第j个。
通过将提取的特征数据输入到数学模型中,对数学模型进行训练,可以使测量结果更加精确,提高测量精度。
其中,特征提取模型生成模块310以及预先训练的数学模型生成模块301为基于颜色信息的测量装置的校准阶段的装置,利用训练数据构建特征提取模型和获取预先训练的数学模型,为使用阶段提供模型支持。
实施例四
图4是本发明实施例四提供的一种基于颜色信息的测量系统的示意图,在上述各实施例的基础上,所述系统包括测量装置430,还包括:
反应发生装置410,用于提供目标量信息与示色材料的反应空间。
信息采集装置420,用于采集颜色信息,将所述颜色信息发送给所述测量装置430。
显示装置440,用于将所述测量装置430获取的待测目标量进行显示。
其中,信息采集装置420还用于采集目标量信息,可选的,信息采集装置420包括摄像头、光谱仪或颜色传感器,并且并不限于摄像头、光谱仪和颜色传感器。可选的,显示装置440包括手机APP显示界面,并且并不限于手机APP显示界面。
示例性的,反应发生装置410用于存放某种噬菌体示色传感器,该种传感器以阵列形式出现,具体为4×7传感器阵列,共计28个片段,阵列表面上方有无色透明盖板以方便颜色信息的采集,该装置可密闭,配有微型的通风装置用于采集特定区域的待测气体,进行相对湿度测量。信息采集模块420为智能手机的摄像头,通过拍照获取噬菌体阵列表面颜色的变化,根据标记定位将图像中的色块转化为RGB值进行表达。测量装置430功能由手机APP软件实现,具有计算和存储参数和结果的性能,处理信息采集模块420获得的颜色信息。显示模块440为相应的手机APP显示界面。
本实施例的技术方案,通过测量装置获取与颜色信息对应的待测目标量,解决了基于函数形式假设回归方法建立的颜色信息回归模型中存在的模型无法满足回归性能要求及模型缺乏适用性的问题,实现了提供一种在统计最优的条件下,不依赖具体函数形式假设回归方法,建立降维后的颜色信息到待测目标量的映射关系,从而使示色材料具有定量描述待测目标量的能力,同时提高了待测目标量的测量精度。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种基于颜色信息的测量方法,其特征在于,包括:
基于交替条件期望ACE算法构建特征提取模型;
获取颜色信息,采用所述特征提取模型对所述颜色信息进行特征提取,形成第一特征数据;
将所述第一特征数据输入到预先训练的数学模型中,获取与所述颜色信息对应的待测目标量。
2.根据权利要求1所述的方法,其特征在于,所述基于交替条件期望ACE算法构建特征提取模型,包括:
步骤1、在标准数据库中,获取设定数量组的训练数据,形成训练样本集;
其中,每组训练数据包括颜色信息以及对应的目标量,每组训练数据通过如下公式进行表示:{(Xi,Yi)|Xi∈X,Yi∈Y,i=1,2,...,N},其中,Xi为第i组颜色信息,Xi=[Xi1,Xi2,...,Xim,...,XiM],Xim为Xi的第m个颜色信息,m=1,2,...,M;Yi为第i组目标量,N为所述训练集样本的容量;X为所述训练样本集中由N组颜色信息构成的集合,Y为所述训练样本集中由N组目标量构成的集合;
步骤2、以目标量为变量生成初始映射关系gj(Yi),设定最大特征数K;
其中,j=1,i=1,2,...,N;
步骤3、采用公式fj(Xim)=E[gj(Y)|X=Xim]更新fj(Xim),并采用公式gj(Yi)=E[fj(X)|Y=Yi]更新gj(Yi);
其中,j=1,2,...,K;fj(Xim)为当特征数为j时,Xim对应的映射关系;gj(Yi)为当特征数为j时,Yi对应的映射关系;fj(X)为由fj(Xim)构成的映射关系集合;gj(Y)为由gj(Yi)构成的映射关系集合;E[gj(Y)|X=Xim]为当X取值为Xim时,gj(Y)的数学期望;E[fj(X)|Y=Yi]为当Y取值为Yi时,fj(X)的数学期望;
步骤4、通过公式gj(Yi)={gj(Yi)-E[gj(Y)]}/{E[(gj(Y))2]}1/2对更新后的gj(Yi)进行正规化处理,以满足约束条件E[gj(Y)]=0,Var[gj(Y)]=1;
其中,E[(gj(Y))2]为(gj(Y))2的数学期望,Var[gj(Y)]为gj(Y)的方差;
步骤5、若j>1,则分别对获取的[g1(Y),g2(Y),...,gj(Y)]、[f1(X),f2(X),...,fj(X)]利用格拉姆-施密特正交化方法进行处理,得到正交化后的[g1(Y)',g2(Y)',...,gj(Y)']、[f1(X)',f2(X)',...,fj(X)'];否则,执行步骤6;
其中,gj(Y)'、fj(X)'分别为gj(Y)、fj(X)经正交化处理获取的;
步骤6、重复步骤3-步骤5,直至E[fj(X)'×gj(Y)']不再增加;
其中,E[fj(X)'×gj(Y)']为fj(X)'与gj(Y)'乘积的数学期望;
步骤7、若j<K,则j=j+1,返回步骤3;否则,返回输出f(X)=[f1(X)',f2(X)',...,fj(X)',...,fK(X)']T
其中,fj(X)'为提取后的特征数据中的第j个,f(X)为预设的特征提取模型。
3.根据权利要求1所述的方法,其特征在于,还包括:
在标准数据库中,获取设定数量组的训练数据,所述训练数据包括颜色信息以及对应的目标量;
采用所述ACE算法对所述训练数据中的颜色信息进行特征提取,形成第二特征数据,以所述第二特征数据为输入变量,以对应的所述目标量为输出变量,采用所述第二特征数据和对应的所述目标量对预设的数学模型进行训练,得到预先训练的数学模型。
4.根据权利要求1所述的方法,其特征在于,所述数学模型为回归模型,所述回归模型包括支持向量机回归或神经网络。
5.根据权利要求1所述的方法,其特征在于,所述颜色信息包括RGB信息。
6.一种基于颜色信息的测量装置,其特征在于,包括:
特征提取模型生成模块,用于基于交替条件期望ACE算法构建特征提取模型;
第一特征数据生成模块,用于获取颜色信息,采用所述特征提取模型对所述颜色信息进行特征提取,形成第一特征数据;
待测目标量生成模块,用于将所述第一特征数据输入到预先训练的数学模型中,获取与所述颜色信息对应的待测目标量。
7.根据权利要求6所述的装置,其特征在于,所述特征提取模型生成模块,用于:
步骤1、在标准数据库中,获取设定数量组的训练数据,形成训练样本集;
其中,每组训练数据包括颜色信息以及对应的目标量,每组训练数据通过如下公式进行表示:{(Xi,Yi)|Xi∈X,Yi∈Y,i=1,2,...,N},其中,Xi为第i组颜色信息,Xi=[Xi1,Xi2,...,Xim,...,XiM],Xim为Xi的第m个颜色信息,m=1,2,...,M;Yi为第i组目标量,N为所述训练集样本的容量;X为所述训练样本集中由N组颜色信息构成的集合,Y为所述训练样本集中由N组目标量构成的集合;
步骤2、以目标量为变量生成初始映射关系gj(Yi),设定最大特征数K;
其中,j=1,i=1,2,...,N;
步骤3、采用公式fj(Xim)=E[gj(Y)|X=Xim]更新fj(Xim),并采用公式gj(Yi)=E[fj(X)|Y=Yi]更新gj(Yi);
其中,j=1,2,...,K;fj(Xim)为当特征数为j时,Xim对应的映射关系;gj(Yi)为当特征数为j时,Yi对应的映射关系;fj(X)为由fj(Xim)构成的映射关系集合;gj(Y)为由gj(Yi)构成的映射关系集合;E[gj(Y)|X=Xim]为当X取值为Xim时,gj(Y)的数学期望;E[fj(X)|Y=Yi]为当Y取值为Yi时,fj(X)的数学期望;
步骤4、通过公式gj(Yi)={gj(Yi)-E[gj(Y)]}/{E[(gj(Y))2]}1/2对更新后的gj(Yi)进行正规化处理,以满足约束条件E[gj(Y)]=0,Var[gj(Y)]=1;
其中,E[(gj(Y))2]为(gj(Y))2的数学期望,Var[gj(Y)]为gj(Y)的方差;
步骤5、若j>1,则分别对获取的[g1(Y),g2(Y),...,gj(Y)]、[f1(X),f2(X),...,fj(X)]利用格拉姆-施密特正交化方法进行处理,得到正交化后的[g1(Y)',g2(Y)',...,gj(Y)']、[f1(X)',f2(X)',...,fj(X)'];否则,执行步骤6;
其中,gj(Y)'、fj(X)'分别为gj(Y)、fj(X)经正交化处理获取的;
步骤6、重复步骤3-步骤5,直至E[fj(X)'×gj(Y)']不再增加;
其中,E[fj(X)'×gj(Y)']为fj(X)'与gj(Y)'乘积的数学期望;
步骤7、若j<K,则j=j+1,返回步骤3;否则,返回输出f(X)=[f1(X)',f2(X)',...,fj(X)',...,fK(X)']T
其中,fj(X)'为提取后的特征数据中的第j个,f(X)为预设的特征提取模型。
8.根据权利要求6所述的装置,其特征在于,还包括:
预先训练的数学模型生成模块,用于获取设定数量组的训练数据,所述训练数据包括颜色信息以及对应的目标量;采用所述ACE算法对所述训练数据中的颜色信息进行特征提取,形成第二特征数据,以所述第二特征数据为输入变量,以对应的所述目标量为输出变量,采用所述第二特征数据和对应的所述目标量对预设的数学模型进行训练,得到预先训练的数学模型。
9.一种基于颜色信息的测量系统,包括如权利要求6-8任一所述的基于颜色信息的测量装置,所述系统还包括:
反应发生装置,用于提供目标量信息与示色材料的反应空间;
信息采集装置,用于采集颜色信息,将所述颜色信息发送给所述测量装置;
显示装置,用于将所述测量装置获取的待测目标量进行显示。
10.根据权利要求9所述的测量装置,其特征在于,所述信息采集装置还用于采集目标量信息;所述信息采集装置包括摄像头、光谱仪或颜色传感器。
CN201711021819.6A 2017-10-27 2017-10-27 一种基于颜色信息的测量方法、装置及系统 Pending CN107845089A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711021819.6A CN107845089A (zh) 2017-10-27 2017-10-27 一种基于颜色信息的测量方法、装置及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711021819.6A CN107845089A (zh) 2017-10-27 2017-10-27 一种基于颜色信息的测量方法、装置及系统

Publications (1)

Publication Number Publication Date
CN107845089A true CN107845089A (zh) 2018-03-27

Family

ID=61661911

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711021819.6A Pending CN107845089A (zh) 2017-10-27 2017-10-27 一种基于颜色信息的测量方法、装置及系统

Country Status (1)

Country Link
CN (1) CN107845089A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111307798A (zh) * 2018-12-11 2020-06-19 成都智叟智能科技有限公司 采用多种采集技术的物品查验方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106644162A (zh) * 2016-10-12 2017-05-10 云南大学 基于邻域保持嵌入回归算法的环网柜线芯温度软测量方法
CN106779217A (zh) * 2016-12-16 2017-05-31 北京工业大学 空气质量检测方法和空气质量检测系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106644162A (zh) * 2016-10-12 2017-05-10 云南大学 基于邻域保持嵌入回归算法的环网柜线芯温度软测量方法
CN106779217A (zh) * 2016-12-16 2017-05-31 北京工业大学 空气质量检测方法和空气质量检测系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
HUANG S L: ""An information-theoretic approach to universal feature selection in high-dimensional inference"", 《2017 IEEE INTERNATIONAL SYMPOSIUM ON INFORMATION THEORY》 *
MAKUR A: ""An efficient algorithm for information decomposition and extraction"", 《IEEE》 *
任艳: ""支持向量回归机在颜色测温中的仿真应用"", 《系统仿真学报》 *
许正松: "《经济增长、承接产业转移、结构变化与环境污染 基于中部6省的实证分析》", 31 December 2016 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111307798A (zh) * 2018-12-11 2020-06-19 成都智叟智能科技有限公司 采用多种采集技术的物品查验方法

Similar Documents

Publication Publication Date Title
Alexiou et al. Point cloud quality assessment metric based on angular similarity
CN111968080B (zh) 一种基于高光谱和深度学习的肥城桃内外品质检测方法
EP2161555B1 (en) Coating color database creating method, search method using the database, their system, program, and recording medium
Coppi et al. Fuzzy and possibilistic clustering for fuzzy data
CN105139023B (zh) 一种基于多尺度特征融合和极限学习机的种子识别方法
CN105975912B (zh) 基于神经网络的高光谱图像非线性解混方法
CN106709958A (zh) 一种基于灰度梯度和颜色直方图的图像质量评价方法
CN110659718A (zh) 基于深度卷积神经网络的小卷积核细胞计数方法及系统
CN107610110B (zh) 一种全局和局部特征相结合的跨尺度图像质量评价方法
CN101950422B (zh) 一种基于奇异值分解的图像质量评价方法
CN104867138A (zh) 基于pca和ga-elm的立体图像质量客观评价方法
CN106408561A (zh) 一种基于图像纹理特征的无参考图像质量评价方法
CN107729993A (zh) 利用训练样本及折中度量的3d卷积神经网络构建方法
CN111259954A (zh) 一种基于D-Resnet的高光谱中医舌苔舌质分类方法
CN107239477B (zh) 一种融合空间相关性的地理数据支持向量回归方法
CN108898269A (zh) 基于度量的电力图像环境影响评估方法
CN113435282A (zh) 基于深度学习的无人机影像麦穗识别方法
CN114187261B (zh) 一种基于多维注意力机制的无参考立体图像质量评价方法
CN104270640B (zh) 基于支持向量回归的光谱图像无损压缩方法
CN112364568A (zh) 一种基于计算机视觉的烤箱食物体积和质量估计算法
CN113256733B (zh) 基于置信度投票卷积神经网络的相机光谱灵敏度重建方法
CN107945154A (zh) 基于四元数离散余弦变换的彩色图像质量评价方法
CN110321528A (zh) 一种基于半监督地理空间回归分析的高光谱影像土壤重金属浓度评估方法
Lati et al. Three-dimensional image-based modelling of linear features for plant biomass estimation
CN107845089A (zh) 一种基于颜色信息的测量方法、装置及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20180731

Address after: 518055 Nanshan Zhiyuan 1001, Xue Yuan Avenue, Nanshan District, Shenzhen, Guangdong.

Applicant after: Tsinghua Berkeley Shenzhen College Preparatory Office

Applicant after: Yu Dongfang

Address before: 518000 Nanshan Zhiyuan 1001, Xue Yuan Avenue, Nanshan District, Shenzhen, Guangdong.

Applicant before: Tsinghua Berkeley Shenzhen College Preparatory Office