CN108510070A - 一种穿越不同空间的模糊事件概率测度值的获得方法 - Google Patents

一种穿越不同空间的模糊事件概率测度值的获得方法 Download PDF

Info

Publication number
CN108510070A
CN108510070A CN201710123102.6A CN201710123102A CN108510070A CN 108510070 A CN108510070 A CN 108510070A CN 201710123102 A CN201710123102 A CN 201710123102A CN 108510070 A CN108510070 A CN 108510070A
Authority
CN
China
Prior art keywords
probability
distribution
scale
space
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710123102.6A
Other languages
English (en)
Inventor
顾泽苍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201710123102.6A priority Critical patent/CN108510070A/zh
Priority to JP2018047268A priority patent/JP6998562B2/ja
Publication of CN108510070A publication Critical patent/CN108510070A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Complex Calculations (AREA)

Abstract

本发明涉及信息处理领域中的一种穿越不同空间的模糊事件概率测度值的获得方法,该方法提出的模糊事件概率测度是与穿越两种以上不同空间的距离有关,是由微观的模糊信息与微观的概率信息构成的。本发明的实施效果是:可以把穿越复数不同空间中的任意一个点的位置,与另一概率分布的位置之间的微观的模糊信息与概率信息充分利用起来,在通过积分后可获得高精度的表达两个位置关系的稳定信息,并且更加严格的定义了在穿越欧几里德空间与概率空间中的,两个数据之间的更加严格的远近关系,为进一步提高机器学习的精度,与进一步提高机器学习的效率提供了理论依据。

Description

一种穿越不同空间的模糊事件概率测度值的获得方法
【技术领域】
本发明属于人工智能领域中的一种穿越不同空间的模糊事件概率测度值的获得方法。
【背景技术】
随着谷歌投资开发的AlphaGo战胜所有人类棋手的辉煌战绩又一次掀起了全世界追捧深度学习的热潮。在过去的一年里有关人工智能的专利申请数量也几乎超出过去所有年份有关人工智能的专利总的数目。
在这方面日本著名古河机电公司发表了“图像处理方法和图像处理装置”(专利文献1)的专利申请,该专利提出通过人工智能的神经网络的算法选取图像的处理阀值,从而高精度的将图像的轮廓抽出。
在汽车自动驾驶的应用中日本著名的丰田公司发表了“驾驶指向推定装置”的专利(专利文献2),该专利提出根据汽车自动驾驶过程中,针对突发的情况,即使驾驶员没有反映的情况下,通过人工智能的逆传递神经网络的机器学习算法,自动的选择驾驶状态,以避免行车事故的发生等。
在图像分析方面的应用日本法政大学发表了“植物病诊断系统,植物病诊断方法,以及植物病诊断程序”的专利(专利文献3),该专利提出导入深度学习的CNN模型,对植物叶子的图像进行识别与分析,从而诊断植物的病变。
作为世界复印机最大制造商之一的日本的富士施乐从防伪识别的角度申请了“使用微小防伪标记的防伪装置及方法”的专利(专利文献4),该专利力图使用人工智能算法构造可以记录信息的微小防伪标记,以达到解决商品防伪识别的目的。
【专利文献】
【专利文献1】(特开2013-109762)
【专利文献2】(特开2008-225923)
【专利文献3】(特开2016-168046)
【专利文献4】(特开2012-124957)
上述(专利文献1),(专利文献2)和(专利文献3)都提到采用人工智能的神经网络算法,但是,神经网络算法中主要是通过“训练”将目标函数的信息承载在海量的加权值的参数上,加权值W,与阀值T在学习的过程中,要想得到最佳的解,需要将所有的状态都要进行测试,所要组合的总次数是{(W×T)n}×P,这里n为一层的神经网络的节点数,P为神经网络的层数,如此高指数的计算复杂度使计算量庞大,所需要的硬件开销巨大,深度学习的学习效果的损失函数所采用的概率梯度下降法简称SGD,所得到的训练值是一个局部最佳解,因此不可避免的会出现“黑箱”问题,再有神经网络的模型中的阀值属于人为定义,同人的大脑的神经网络的机理相差甚大,脑神经的刺激信号的原理不能在传统的神经网络模型中充分体现,人的头脑根据神经元的神经信号所产生的兴奋程度不同进行不同的判断的机理在目前的神经网络的模型中也不能体现等等,目前的神经网络模型只能是学术上的,代表一种方向性的理论,同达到实际应用的水平差距甚大。如今进入深度学习的阶段,同传统的神经网络相比只增加了隐藏层的数量,这更加使计算的复杂度加大,虽然在学习中导入了一些优化算法,但是并没脱离原来的神经网络的基础,传统神经网络的致命问题得不到解决,广泛应用的前景很难期待。
上述(专利文献4)提出的通过人工智能产生微小防伪标记比较牵强,首先并没有提出采用人工智能通过什么特殊手段?获得了什么突出的成果?微小防伪标记在微点阵的信息记录方法上所采用的通过点阵的大小,颜色以及不同位置的方法记录信息均已是公开的手段,导入人工智能后仍没有改变传统方法的技术特征,因此不具有先进性。在表示信息点阵的方向、位置的特征符号或基准符号的手法上,采用比信息点阵尺寸大很多的非信息点阵图形的图像,使微小防伪标记在隐蔽性方面很容易被不法者发现,不符合隐形防伪代码图像的构成规则,最大的问题是不能解决不法者通过扫描仪复制微小防伪标记的问题,因为现实中扫描仪的精度远比印刷精度要大得多,尽管该专利申请曾经提出用激光加工的方法形成微小防伪标记,但是通过微小图形防伪可以通过很多的方法实现,目前最为关注的是如何通过消费者的手机实现大众防伪识别,这个专利申请没有丝毫触及。
下面先对本专利申请所涉及到的专业术语进行定义,以下定义中包含本发明内容。
概率空间(Probability Space):
基于苏联数学家Andrey Kolmogorov的“概率论是以测度论为基础的”理论,所谓的概率空间就是一个总的测度为“1”的可测空间。
概率分布(Probability Distribution):
所谓的概率分布是针对概率函数,按其发生可能性的大小的排列。
概率尺度(Probability Scale):
在概率空间中的任意一个概率分布必然存在一个概率尺度,可标定概率分布的程度。
概率密度(Probability Density):
事件在给定面积上的概率值。
模糊事件概率的测度(Probability Measure of Fazzy Event)
在包括概率空间在内的欧几里德空间S,如果p(x)满足概率测度的可加性,μA(x)是一个隶属函数(Membership Function)同时也满足模糊测度的可加性,则模糊事件概率的集合A的测度P(A)为:
公式1
其离散表达公式为:
公式2
智能系统(Intelligent System):
智能系统是依据确定性的算法所实现的系统,是按照一种算法实现某种目标函数的处理,其处理结果是确定性的系统。
人工智能(Artificial Intelligence):
什么是人工智能?简单讲就是用计算机实现人的头脑功能,即通过计算机实现人的头脑思维所产生的效果,所要解决的问题,其处理结果往往是不确定性的,或者说是事先不可预知的。
也可以说,人工智能是将人为介入所产生的效果模型化,定式化,更具体的定义,人工智能是通过机器学习的算法实现概率模型的最深入的应用。
聚类(Clustering):
基于欧几里德空间的尺度,可让数据实现无目标的迁移,最终只可获得给定范围的数据结果。
自组织(Self-organization):
基于概率空间的尺度,可让数据自律的向高概率的方向迁移,最终可获得不可预测的目标函数。
机器学习(Machine Learning)的定义:
计算机自律的从数据中获得规律的模型。
概率尺度自组织(Self-organizing based on a Probability Scale):
设概率空间存在着如下的一个概率分布的集合G,集合中含有ζ个数据:
公式3
gf∈G(f=1,2,…,ζ)
在概率空间的这个概率分布gf(f=1,2,…,ζ)中,必然存在一个在特征值A(G),由于概率空间是测度空间,因此针对特征值A(G)必然存在一个概率尺度M[G,A(G)],满足如下概率尺度自组织的条件时,可以概率尺度为基准,让集合G(n)朝着最大概率方向迁移。
公式4
A(n)=A(G(n))
M(n)=M[G(n),A(G(n))]
G(n)=G{[A(G(n-1)),M[G(n-1),A(G(n-1))]]
当n≥β(β是一个大于4的数值)时,可以设定A(G(n))为最大概率特征值,M[G(n),A(G(n))]是以最大概率特征值为中心的最大概率尺度。
最大概率(Maximum Probability):
超越传统统计学所预测的结果,即最为接近母体的预测结果。
概率空间距离(Probability Space Distance):
设概率空间存在着两个概率分布wj∈W,vj∈V,以及对应vj∈V的概率分布的向量的各个要素的最大概率尺度Mj,这里(j=1,2,...,n)那么wj到vj两个概率分布的最大概率尺度的距离定义如下:
公式5
超深度学习(Super Deep Learning):
由感知层,神经层以及脑皮层构成的,并由层与层之间的节点之间用概率尺度自组织的机器学习所连接的,可直接针对随机分布数据进行自律的无监督的机器学习的神经网络模型。
【发明内容】
本发明的第一个目的是:提出一个多刻度的概率尺度自组织的算法,构造对抗学习模型,最大限度的通过超深度学习,将概率空间的所有概率分布信息,模糊信息获得最大限度的利用,以使图像识别语音识别的精度获得最佳水平。
本发明的第二个目的是:以多刻度的概率尺度自组织为基础,提供一个更加严格的包括概率空间在内的不同空间中的严密的距离的定义。
本发明的第三个目的是:以多刻度的概率尺度自组织为基础,提供一个可穿越包括概率空间在内的不同空间的模糊事件概率测度的定义。
本发明的第四个目的是:提供基于概率尺度自组织的超深度回归分析学习模型。
本发明的第五个目的是:提供非线性的概率尺度自组织的超深度流形学习模型。
本发明的第六个目的是:提供可以通过大众手机判别真伪标识的超深度强对抗的学习模型。
为实现上述至少一种目的,提出一种穿越不同空间的模糊事件概率测度值的获得方法,本发明提出如下技术方案:
一种穿越不同空间的模糊事件概率测度值的获得方法,其特征如下:
(1)模糊事件概率测度值是与穿越两种以上不同空间的距离有关;
(2)是由微观的模糊信息与微观的概率信息构成的。
而且,所述模糊事件概率测度是指:将微观的模糊信息与概率信息进行积分从而获得宏观的稳定的信息。
而且,所述微观的模糊信息是指:穿越不同空间的两个数据之间的距离信息;该距离越近模糊关系越大;反之距离越大模糊关系越疏远。
而且,所述微观的概率信息是指:穿越不同空间的两个数据中,一个数据在另一个数据的概率分布上的概率值。
而且,所述不同空间的距离是指:欧几里德空间;概率空间包括曼哈顿空间(Manhattan Space);切比雪夫空间(Chebyshev Space);闵可夫斯基空(MinkowskiSpace);马氏空间(Mahalanobis Space);夹角余弦空间(Cosine Space)中所定义的距离的组合。
而且,所述微观的概率信息是指:包括具有正态分布;多变量正态分布;对数正态分布;指数分布;t分布;F分布;X2分布;二项分布;负的二项分布;多项分布;泊松分布;爱尔朗分布(Erlang Distribution);超几何分布;几何分布;通信量分布;韦伯分布(WeibullDistribution);三角分布;贝塔分布(Bete Distribution);伽马分布(GammaDistribution)中任意一种或是引伸到贝叶斯方法(Bayesian Analysis);高斯过程(Gaussian Processes)中的任意概率分布中任意一种概率分布的信息。
而且,所述模糊事件概率测度可由如下公式表达:
设在欧几里德空间存在着一个概率空间的集合wj∈W(w1,w2,…,wn)中有一个元素wj的概率分布的中心点为wj,该概率分布的多概率尺度的第一个刻度为M1,第二个刻度为M2,第三个刻度为M3,中心点wj与第一个刻度M1的间距为D1j=M1j,在这区间属于集合wj的概率分布的概率值为P1j (wj),由第二个刻度到第一个刻度的间距为D2j=M2j-M1j,在这区间属于集合wj的概率分布的概率值为P2j (wj),由第三个刻度到第二个刻度的间距为D3j=M3j-M2j在这区间属于集合W的概率分布的概率值为P3j (wj),设穿越属于wj概率空间时所经过的刻度数mj (wj)=3,又设在欧几里德空间还存在另一个概率空间集合vj∈V(v1,v2,…,vn),在两个集合的中间又存在一个点任意一点rj∈R(j=1,2,…,n),求rj在wj到vj之间,rj属于wj概率分布的概率值为rpj (wj),求rj到达wj的模糊事件概率测度:
本发明提出的一种穿越不同空间的模糊事件概率测度值的获得方法,其特点是:可以把穿越复数不同空间中的任意一个点的位置,与另一概率分布的位置之间的微观的模糊信息与概率信息充分利用起来,在通过积分后可获得高精度的表达两个位置关系的稳定信息,并且更加严格的定义了在穿越欧几里德空间与概率空间中的,两个数据之间的更加严格的远近关系,为进一步提高机器学习的精度,与进一步提高机器学习的效率提供了理论依据。
附图说明
图1是针对概率分布所定义的多概率尺度的示意图
图2是多概率尺度自组织的机器学习流程图
图3是穿越包括概率空间在内的不同空间的距离的定义示意图
图4是超深度对抗学习的模式识别模型示意图
图5是超深度对抗学习的最佳分类模型的示意图
图6是超深度对抗学习的最佳分类流程图
图7是通过学习得到实际概率分布的多概率尺度的刻度的流程图
图8是超深度对抗学习神经网络的示意图
图9是超深度对抗学习神经网络的流程图
图10是针对手机防伪识别的超深度强对抗学习流程图
图11是印刷图像颜色空间与电子图像颜色空间的特性示意图
图12是利用超深度对抗学习解决回归分析的流程图
图13是两种回归分析结果的比较示意图
图14是超深度流形学习的算法与计算结果的示意图
符号说明
101是概率空间的一个概率分布
102是在某一区域中的概率分布中心值
103是第一个刻度值
104是第二个刻度值
105是第三个刻度值
106是第一个刻度值103对应着区域中的概率分布值
107是第二个刻度值104对应着区域中的概率分布值
108是第三个刻度值105对应着区域中的概率分布值
301是一个涵盖概率空间的一个欧几里德空间
302是概率空间的一个概率分布的中心点wj
303是概率空间的一个概率分布的多概率尺度的第一个刻度M1
304是概率空间的一个概率分布的多概率尺度的第二个刻度M2
305是概率空间的一个概率分布的多概率尺度的第三个刻度M3
309是欧几里德空间一个点vj
310是欧几里德空间一个点vj∈V到概率分布的中心点wj∈W之间任意的一点rj∈R(j=1,2,…,n)
4000是被识别对象向量
4001是被识别图像的特征要素sv1
4002是被识别图像的特征要素sv2
4003是被识别图像的特征要素sv3
400e是被识别图像的特征要素sve
4100是通过多概率尺度自组织后的特征向量数据FV1
4200是通过多概率尺度自组织后的特征向量数据FV2
4110是fv11的中心值
4111是特征向量数据FV1的fv11的第一个刻度
4112是fv11的第二个刻度 4113是fv11的第三个刻度
4120是fv12的中心值 4121是fv12的第一个刻度
4122是fv12的第二个刻度 4123是fv12的第三个刻度
4130是fv13的中心值 4131是fv13的第一个刻度
4132是fv13的第二个刻度 4133是fv13的第三个刻度
41e0是fv1e的中心值 41e1是fv1e的第一个刻度
41e2是fv1e的第二个刻度 41e3是fv1e的第三个刻度
4210是fv21的中心值
4211是特征向量数据FV2的fv21的第一个刻度
4212是fv21的第二个刻度 4213是fv21的第三个刻度
4220是fv22的中心值 4221是fv22的第一个刻度
4222是fv22的第二个刻度 4223是fv22的第三个刻度
4230是fv23的中心值 4231是fv23的第一个刻度
4232是fv23的第二个刻度 4233是fv23的第三个刻度
42e0是fv2e的中心值 42e1是fv2e的第一个刻度
42e2是fv2e的第二个刻度 42e3是fv2e的第三个刻度
500是任意一点
501是涵盖概率空间的欧几里德空间示意图
502是概率分布520的中心值
520是概率分布
503是概率分布520的第一个刻度
504是概率分布520的第二个刻度
505是概率分布520的第三个刻度
506是概率分布520的第一个刻度区域,设概率值为p1j (520)
507是概率分布520的第二个刻度区域,设概率值为p2j (520)
508是概率分布520的第三个刻度区域,设概率值为p3j (520)
510是概率分布530的中心值
511是概率分布530的第一个刻度
512是概率分布530的第二个刻度
513是概率分布530的第三个刻度
514是概率分布530的第一个刻度区域,设概率值为p1j (530)
515是概率分布530的第二个刻度区域,设概率值为p2j (530)
516是概率分布530的第三个刻度区域,其概率值为p3j (530)
520和530是涵盖概率空间的欧几里德空间501中的两个概率空间的概率分布
500是两个概率分布的衔接处的任意一个点在两个概率分布的中心502与510连接的直线上的投影点
801是被感知的图像的一个空间映射
802与803是分别两种不同的映射空间图像
804是图像801的一个局部区域
805是连接在被感知的对象与感知层之间的多概率尺度自组织的机器学习单元
806是神经网络的感知层
807是神经网络的感知层的一个节点
808是连接在感知层与神经层之间的具有对抗学习能力的,多概率尺度自组织的机器学习单元
809是数据库存储单元
810是神经网络的神经层
811是与感知层各个节点所对应的神经网络的神经层的节点
812是连接在神经层与脑皮层之间的一个多概率尺度自组织的机器学习单元
813是在神经层与脑皮层之间的数据库
814是神经网络的脑皮层
815是脑皮层节点
1101是原图像颜色
1102是经过扫描以后变成的图像颜色
1301是采用传统公式计算出的回归分析直线
1302与1303是给定的范围与回归分析直线所夹在一起的数据
1304是通过超深度对抗学习出的回归分析直线
1305与1306是给定的与图13的(a)相同范围的,与超深度对抗学习所得到的回归分析直线所夹在一起的数据
具体实施方式
以下结合附图对本发明实施例做进一步详述,但本发明所述的实施例是说明性的,而不是限定性的。
图1是针对概率分布所定义的多概率尺度的示意图。
如图1所示:设概率空间的一个概率分布101,必然存在着一个多概率尺度,可以表示概率分布复数位置的概率分布状况,这里对应着在某一区域中的概率分布中心值为102时,可设第一个刻度值为103,对应着区域中的概率分布值为106,可设第二个刻度值为104,对应着区域中的概率分布值为107,可设第三个刻度值为105,对应着区域中的概率分布值为108,可将复数区域的概率分布值进行定量标定的基准称为多概率尺度。
多概率尺度的标定是依据包括正态分布,多变量正态分布,对数正态分布,指数分布,t分布,F分布,X2分布,二项分布,负的二项分布,多项分布,泊松分布,爱尔朗分布(Erlang Distribution),超几何分布,几何分布,通信量分布,韦伯分布(WeibullDistribution),三角分布,贝塔分布(Bete Distribution),伽马分布(GammaDistribution)中至少一种具有概率分布的概率特性所计算出的给定复数区域的不同概率值。
概率空间的相关系数与相关距离也可作为多概率尺度。
针对非概率空间作为多概率尺度也可引伸到欧几里德空间的距离(EuclideanDistance)尺度,曼哈顿距离(Manhattan Distance)尺度,切比雪夫距离(ChebyshevDistance)尺度,闵可夫斯基距离(Minkowski Distance)尺度,马氏距离(MahalanobisDistance)尺度,夹角余弦(Cosine)尺度,W距离(Wasserstein Distance)尺度,KL距离(Kullback-Leibler Distance)尺度,PE距离(Pearson Distance)尺度。
其他空间的距离也可引伸到多概率尺度,例如:杰卡德相似系数(Jaccardsimilarity Coefficient)尺度,汉明距离(Hamming Distance)尺度,信息熵(Information Entropy)尺度。
一些概率算法如贝叶斯方法(Bayesian Analysis);高斯过程(GaussianProcesses);或高斯过程与贝叶斯混合算法可以构成基准的算法等等也可引伸到多概率尺度的定义。
为了技术特征的表述简单化,上述有关概率尺度的具体数学公式就不一一列举了,一切可以对数据进行标定的尺度都可模仿以下多概率尺度的处理方法,构成机器学习模型,都属于本发明的范围内。
总结上述用于机器学习的多概率尺度的构成方法,是一种可针对穿越复数空间的例如欧几里德空间与概率空间的数据的概率分布进行一个以上领域划分的度量方法。
所述穿越复数空间的数据是指:至少包括可穿越欧几里德空间;概率空间;曼哈顿空间(Manhattan Space);切比雪夫空间(Chebyshev Space);闵可夫斯基空(MinkowskiSpace);马氏空间(Mahalanobis Space);夹角余弦空间(Cosine Space)中的一种或几种的数据。
所述模糊事件概率测度是指:通过穿越上述至少一个空间中的距离建立数据之间的模糊关系;可将微观的模糊信息,与概率信息经过积分后得到宏观的稳定信息的可确立不同数据之间的严密关系的算法。
图2是多概率尺度自组织的机器学习流程图。
这里,依据上述多概率尺度自组织的定义,如图2所示多概率尺度自组织的机器学习的处理流程如下:
S1初始化步骤:是多概率尺度自组织的机器学习程序的初始化设定步骤,在这一步骤中首先要输入目标函数D(x,y),这个数据可以是一维的数据,也可是二维的数据,任何维数都可以。其次要预先给出初始化的多概率尺度M(0)’,以及自组织的初始中心值,或称为初始特征值(x0,y0)(0),多概率尺度自组织可以有两种方法展开,第一种由多概率尺度最大刻度开始,逐次往小的刻度进行自组织,第二种方法是由最小的多概率尺度的刻度开始,逐次往大的刻度进行自组织,因此初始化的处理也应分两种方法分别设定初始化参数。
第一种多概率尺度自组织的初始化方法:
初始化的多概率尺度M(0)’与上述定义的概率尺度M(0)不同的是M(0)只需给出最大概率范围的尺度的估值就可,而M(0)’因为是多概率尺度,要对整个概率分布的数据进行自组织,因此要给出整个概率分布的概率尺度的估值,即M(0)’>M(0),一般可取3倍左右就可。
第二种多概率尺度自组织的初始化方法:
初始化的多概率尺度M(0)’与上述定义的概率尺度M(0)相同M(0)’=M(0)就可。
上述两种方法在M(0)值的选取方法上相仿,没必要进行严密的设定,通过人工预测,以(x0,y0)(0)为中心,M(0)’为半径的范围内,一定要包括最终学习结果的数据的某一部分,因此初期M(0)’值尽可能选择得大一些。初始化概率尺度M(0)’越大计算的时间就越长,反之太小,有可能得不到正确的结果。
有关其他初始化的设定,V作为自组织的收敛值,即上一次组织的结果与本次自组织的结果是否有差距,也就是说自组织的处理结果是否已经达到要求?收敛值V太大有可能得不到正确的结果,收敛值V太小计算花费的时间越长。正确的设定方法是最初概率尺度的5-10%左右。MN作为自组织最大组织次数值,一般可设定在5-10次,以防止自组织处于无限死循环状态,多概率尺度的刻度值m的设定,m设定为多概率尺度的刻度数量,例如:多概率尺度有三个刻度,可以标定三个概率分布区域的概率值,这时m=3就可。作为反映自组织的次数n=0作为自组织的当前初始次数。
S2是多概率尺度自组织步骤:在这一步骤中要进行概率尺度的第m刻度的第n次自组织处理,针对目标函数D(x,y),把(x0,y0)m (n-1)作为自组织中心值,第m刻度的概率尺度Mm (n-1)作为半径,将半径Mm (n-1)以内目标函数数据dm (n)(xi,yj)(i=1,2,…,k;j=1,2,…,1)的数据作为新的概率空间的一个概率分布,针对新的概率分布,必然又可产生一个新的特征值为(x0,y0)m (n),以及第m刻度的概率尺度Mm (n),这里dm (n)(xi,yj)∈D(x,y),n=n+1,MN=MN-1。即在这一步骤里,每执行一回目标函数数据dm (n)(xi,yj)(i=1,2,…,k;j=1,2,…,l)向最大概率方向迁移了一步。
S3是判断步骤:是第m刻度的概率尺度自组织是否完成的判断步骤,在这一步骤要判断|Mm (n)-Mm (n-1)|≤V?或MN=0?如果有一个条件满足,多概率尺度的第m刻度的概率尺度自组织完成,如果完成转入S4步骤,如果尚未完成跳转到S2步骤,继续进行多概率尺度自组织的操作。
S4数据保存步骤:是第m刻度的概率尺度自组织完成后,需要对第m刻度的特征值(xn,yn)m (n),第m个概率尺度Mm (n)作为一个学习结果进行保存,m=m-1,修正概率尺度的刻度,将目标函数的集合即自组织的数据范围修正成上一个多概率尺度Mm (n)与特征值(x0,y0)m (n)所形成的概率分布,即
D(x,y)←dm (n)(xi,yj)(i=1,2,…,k;j=1,2,…,l),
如果是第二种多概率尺度自组织方法,由于多概率尺度是从最小刻度开始的,在多概率尺度按照正态分布设定的,由于以后的概率尺度的刻度都是同第一个最大概率尺度刻度的范围相同,因此无需继续进行多概率尺度自组织的处理,按第一个最大概率尺度刻度的间隔设置为其他刻度的间隔,并且将m=0,再转入下面的多概率尺度最终完成否的判断步骤S5
S5判断步骤:是最终完成判断步骤,在这一步骤中判断是否m=0,“是”则多概率尺度自组织处理完成转入S6,“否”则跳转到S2继续进行多概率尺度的下一个刻度的自组织处理。
S6返回步骤:是最终完成返回主程序步骤。
下面我们定义在多概率尺度下,欧几里德空间一个点与概率空间的概率分布中心点的距离的定义。
图3是穿越包括概率空间在内的不同空间的距离的定义示意图。
如图3所示:301是一个涵盖概率空间的一个欧几里德空间,302是概率空间的一个概率分布的中心点wj,303是概率空间的一个概率分布的多概率尺度的第一个刻度M1,304是概率空间的一个概率分布的多概率尺度的第二个刻度M2,305是概率空间的一个概率分布的多概率尺度的第三个刻度M3,309是欧几里德空间一个点vj,求wj到vj的距离。
在实际模式识别当中,每一个特征值都要在不同的条件下,经过复数次的学习,其学习结果形成了一个概率分布,由n个特征值构成一个特征向量,所以需要计算向量之间的距离,这里,设在集合W中有一个点302为wj∈W,集合V中有一个点309为vj∈V,在第j=1,2,…,n个向量要素中设302与303之间的尺度的刻度间距为D1j=M1j,属于wj的概率分布的概率值为P1j (wj),303与304之间的尺度间距为D2j=M2j-M1j,属于wj的概率分布的概率值为P2j (wj),304与305之间的尺度间距为D3j=M3j-M2j属于wj的概率分布的概率值为P3j (wj),从图3可以看出由vj到wj经过了属于wj的概率分布的3个刻度区域,因此mj (wj)=3,则309到302之间的概率空间距离为:
公式6
这里令,
Δj (wj)为由vj到wj的方向,当数据从欧几里德空间进入概率空间后,在概率空间内欧几里德空间所表示的距离与实际概率空间的距离之间的距离误差,用调整Δj (wj)方法就可把欧几里德空间距离与概率空间的距离统一,解决机器学习数据在穿越两个空间中的严格的距离关系的定义。
在wj到vj的之间任意的集合R有一点rj∈R 310与wj 302的模糊度为:
公式7
上式是一个隶属函数(Membership Function),当任意一点rj∈R越接近wj∈W时,Fj (wj)的结果就越接近“1”,相反rj∈R越远离wj∈W时,Fj (wj)越接近“0”,这里所涉及的远近距离由公式6可以看出是一个跨越欧几里德空间与概率空间的距离,因此Fj (wj)的模糊值也是跨越欧几里德空间与概率空间之间的数据的模糊值。
有关隶属函数(Membership Function)的定义方法不拘任何形式,按照人为介入可以定义出各种各样的公式,不管哪种定义方法,只要是能反映目标函数的两个要素之间的模糊关系,都属本发明的范围之内。
这里,再设rpj (wj)是任意一点rj∈R属于wj∈W的概率分布中的概率。模糊信息Fj (wj)与概率rpj (wj)(j=1,2,…,n)的乘积的积分构成如下的集合R到集合W的模糊事件概率的测度公式。
公式8
或者
上述定义的模糊事件概率的测度F(w)的作用是:把微观的微量模糊信息与微观的微量概率信息充分的利用起来,在积分后的宏观可以产生可观的稳定信息,可作为标定任意一个集合之间R与W之间的类似关系,这在信息理论上是最大限度的反映两个集合之间的关系的一个最佳的判断基准,这两个集合在模式识别的应用中就可把集合R看作被识别的特征向量,W可以看作是被登录的某一个模式的特征向量,通过R与W这两个集合的模糊事件概率测度值可以反映被识别的特征向量是否属于被登录的特征向量的严格的判断依据。
总结图3所提出的一种穿越欧几里德空间与概率空间的距离的获得方法,其特征是在欧几里德空间中至少存在这一个概率空间,在穿越概率空间的一个区域时,该区间的概率距离与所经过的区域的概率值有关。
上述欧几里德空间可以延伸到:包括曼哈顿空间(Manhattan Space);切比雪夫空间(Chebyshev Space);闵可夫斯基空(Minkowski Space);马氏空间(MahalanobisSpace);夹角余弦空间(Cosine Space)中的一种。
再有,概率空间的距离尺度是与在概率空间穿过时,所经过的概率分布值有关,是一定要有方向性的,不满足普通距离尺度的对称性条件。例如在考察由vj到wj的距离时,其概率空间的距离是与vj所在的位置到达wj的位置过程中,所经过的概率分布的概率的变化过程有关,这个概率分布是所要到达的终点位置的wj概率分布的概率变化过程,而与起点位置vj无关,即使vj也是一个概率分布,也与vj的概率分布无关。
图4是超深度对抗学习的模式识别模型示意图。
超深度对抗学习的问题点:如图4所示:给定4100与4200是两个通过多概率尺度自组织后的特征向量数据,fv1j∈FV1与fv1j∈FV2,在给定一个4000被识别对象的特征向量SV中的特征要素svj∈SV(j=1,2,…,e),所要解决的问题是被识别对象向量SV属于哪个特征向量?这里,设4001是sv1,4002是sv2,4003是sv3,…,400e是sve
特征向量数据FV1的fv11的第一个刻度为4111,fv11的第二个刻度为4112,fv11的第三个刻度为4113,fv11的中心值为4110。fv12的第一个刻度为4121,fv12的第二个刻度为4122,fv12的第三个刻度为4123,fv12的中心值为4120。fv13的第一个刻度为4131,fv13的第二个刻度为4132,fv13的第三个刻度为4133,fv13的中心值为4130。fv1e的第一个刻度为41e1,fv1e的第二个刻度为41e2,fv1e的第三个刻度为41e3,fv1e的中心值为41e0。
特征向量数据FV2的fv21的第一个刻度为4211,fv21的第二个刻度为4212,fv21的第三个刻度为4213,fv21的中心值为4210。fv22的第一个刻度为4221,fv22的第二个刻度为4222,fv22的第三个刻度为4223,fv22的中心值为4220。fv23的第一个刻度为4231,fv23的第二个刻度为4232,fv23的第三个刻度为4233,fv23的中心值为4230。fv2e的第一个刻度为42e1,fv2e的第二个刻度为42e2,fv2e的第三个刻度为42e3,fv2e的中心值为42e0。
设被识别对象特征向量SV中的特征要素svj∈SV在已登录的特征向量数据FV1的特征要素fv1j概率分布中的概率值为spj (fv1j)∈SP(FV1),在特征向量数据FV2的特征要素fv2j概率分布中的概率值为spj (fv2j)∈SP(FV2)(j=1,2,…,e)。
又设svj到fv2j的概率分布中心所经过的多概率尺度刻度的数量mv2j,再设svj到fv2j的概率分布中心所经过的概率领域的数量mj (fv2j)=mv2j+1,fv2j的概率分布的多概率尺度刻度间距为Dij,在间距Dij的领域上属于fv2j的概率分布的概率值为Pij (fv2j)(i=1,2,…,mj (fv2j))。
按照公式7和公式8可计算出被识别对象向量SV与特征向量数据FV2的模糊事件概率测度:
同理,设svj∈SV到fv1j的概率分布中心所经过的多概率尺度刻度的数量mv1j,mj (fv1j)=mv1j+1。可计算出被识别对象向量SV与特征向量数据FV1的模糊事件概率测度:
被识别对象向量SV属于特征向量数据Fv2对抗公式如下:
公式9
F=F(FV2)/F(FV1)
F>1时,被识别对象向量SV属于特征向量数据FV2,反之F<1时,被识别对象向量SV属于特征向量数据FV1
图5是超深度对抗学习的最佳分类模型的示意图。
如图5所示:501是涵盖概率空间的欧几里德空间示意图,在501的欧几里德空间中有两个概率空间的概率分布520与530,502是概率分布520的中心值,503是概率分布520的第一个刻度,504是概率分布520的第二个刻度,505是概率分布520的第三个刻度,506是概率分布520的第一个刻度区域,设概率值为p1j (520),507是概率分布520的第二个刻度区域,设概率值为p2j (520),508是概率分布520的第三个刻度区域,设概率值为p3j (520)
510是概率分布530的中心值,511是概率分布530的第一个刻度,512是概率分布530的第二个刻度,513是概率分布530的第三个刻度,514是概率分布530的第一个刻度区域,设概率值为p1j (530),515是概率分布530的第二个刻度区域,设概率值为p2j (530),516是概率分布530的第三个刻度区域,其概率值为p3j (530)
超深度强对抗学习的一种模型是:设欧几里德空间为501,在501的欧几里德空间里,存在着两个概率分布520和530,其中两个概率分布的中心可分别为集合W中的一个要素用wj∈W,和集合V中的一个要素用vj∈V,两个概率分布的衔接处的任意一个点在两个概率分布的中心502与510连接的直线上的投影点500,可用rj∈R来表示,求任意一点500即rj∈R是属于哪个概率分布的。
首先设mj (wj)为rj到达wj概率分布的中心之间所经过的多概率尺度所涉及的概率的区域数量,例如图5为mj (wj)=2,再设pij (520)=pij (wj),(i=1,2,…,mj (wj)),求R的集合中的任意一点500rj∈R与520概率分布中心即集合W中的一点wj之间的模糊关系,由上述公式7
这里再设mj (vj)为rj到达vj概率分布的中心之间所经过的多概率尺度所涉及的概率的区域数量,例如图5为mj (vj)=3,再设pij (530)=pij (vj),(i=1,2,…,mj (vj)),再求R的集合中的任意一点500rj∈R与530概率分布中心即集合V中的一点vj之间的模糊关系,由上述公式7
这里在考虑rj∈R属于520概率分布的测度时,其概率测度值应是“rj∈R在520概率分布中概率值Pj (Wj),同样,在考虑rj∈R属于530概率分布的测度时,其概率测度值应是rj∈R在530概率分布中概率值Pj (Vj)
参照公式7和公式8以及公式9就可得到任意一点集合R属于哪个集合的公式:
公式9’
这里,公式9’与上述公式9不同的是:对抗学习是在特征要素间通过微观的模糊信息与概率信息实现的,比宏观对抗学习效果更明显,通过微观对抗的结果,再积分形成对抗后的模糊事件概率测度,所反映宏观的两个集合的关系会更加精确,所以如果F≥100,任意一点集合R属于集合W,反之属于集合V。
将两个概率分布的中心值固定为w和v的位置,再设上式wj=w,vj=v,两个概率分布的衔接处的所有点阵集合R中的任意一个点rj∈R,(j=1,2,…,n)都通过上述计算,用Fj (w)以及Fj (v)(j=1,2,…,n)的对抗结果Fj=(Fj (w)/Fj (v))×100的结果,就可把两个具有概率分布的数据进行最佳化的分类。
与图4所介绍的超深度对抗学习所不同的是:图4的超深度对抗学习的模式识别模型是解决一组特征识别向量属于哪个特征学习向量数据的最佳化模式识别,图5是解决在两个概率分布的衔接区域如何进行点阵的最佳化分类的问题。
由上述可知一种穿越不同空间的模糊事件概率测度值是根据穿越两种以上不同空间的距离有关,是由微观的模糊信息与微观的概率信息构成的。该距离越近模糊关系越大;反之距离越大模糊关系越疏远。上述微观的概率信息是指:穿越不同空间的两个数据中,一个数据在另一个数据的概率分布上的概率值。
这里,仅以两个概率分布为例介绍其超深度对抗学习的模型构建方法,在实际应用中可以有3个概率分布,还可以有4个5个…n个概率分布相互之间通过超深度对抗学习进行最佳化分类。
图6是超深度对抗学习的最佳分类流程图。
如图6所示:结合图5对于超深度对抗学习可由如下步骤实现。
S1是初始化步骤,在这个步骤里可参考图2多概率尺度自组织的初始化内容,首先分别输入g个集合Wh中的各个数据wjh∈Wh(h=1,2,…g),以及集合Vh中的各个数据vjh∈Vh,设定多尺度概率的刻度数,例如m=3,设定概率分布的数量计数值PN=1,设定数据保存空间,以及其他需要在初始化步骤中处理的内容。
S2是多概率尺度自组织步骤,参照图2多概率尺度自组织的机器学习流程图的第二步骤S2的方法,对g个集合Wh中的各个数据wjh∈Wh,以及集合Vh中的各个数据vjh∈Vh,进行一种概率尺度自组织的机器学习。
S3是判断步骤,S2一种概率尺度自组织是否完成?“否”就跳回S2多概率尺度自组织步骤,“是”则转入数据保存步骤S4
S4是数据保存步骤,将S2一种概率尺度自组织所得到的wj∈W以及vj∈V的各个元素的最大概率中心值,多概率尺度的刻度位置,每一个刻度间的概率值等。在一种概率尺度自组织完成后的,该尺度下的两个概率分布的邻接处的点阵位置集合R中的各个数据rj∈R(j=1,2,…,n)求出并进行保存。
S5是概率分布判断步骤,多概率尺度自组织的机器学习是否完成?“否”就将概率分布的数量PN=PN+1,跳转到S2多概率尺度自组织步骤继续计算新的概率分布,“是”则转入下面的S6超深度对抗学习步骤。
S6是超深度对抗学习步骤,在这一步骤中首先取得各个分布的衔接领域的所有点阵,即集合R中的各个数据rj∈R(j=1,2,…,n),按照从S4数据库中取出的两个衔接的概率分布之间的中心位置“w”以及“v”的值连接成一直线,再将两个概率分布的衔接领域中的任意一个点rj∈R投影到这条直线上,按照公式7计算出rj∈R分别与两个概率分布的中心值“w”以及“v”的模糊关系Fj (w)与Fj (v),再由公式8,公式9,以及设Pj (w)为rj∈R在概率分布520上的概率值,设Pj (v)为rj∈R在概率分布530上的概率值,那么rj∈R针对两个概率分布之间的超深度对抗学习的微观模糊事件概率的测度为:
Fj={(Fj (w)×Pj (w))/(Fj (v)Pj (v))}100
Fj≥100则rj∈R属于概率分布520,否则属于另一个概率分布530。
为简单明了的用具体数字证明超深度对抗学习模型的有效性,下面给出一组数据:令w与v的欧氏距离为70mm,520概率分布的刻度间隔为20mm,530概率分布的刻度间隔为14mm,rj∈R距w为39mm,距v为31mm,Pj (w)为27.2,Pj (v)为4.2,则四种算法的结果见表1。
表1
学习算法 同w距离 同v距离 同w关系 同v关系 相差值 判断结果
欧氏距离 39mm 31mm 1.25倍 属于530
概率距离 21mm 13.7mm 1.53倍 属于530
模糊关系 58 76 1.31倍 属于530
测度关系 39 3 13倍 属于520
从表1的结果可以看出导入模糊事件概率测度理论的有效性是可以证明的。
上述作为超深度对抗学习中的模糊事件概率的测度理论是基于概率空间的概率分布所定义的多概率尺度实现的,在实际应用中,概率尺度还可以通过对同样的被识别图像的特征向量数据,在不同条件下的反复学习,按特征要素的实际概率分布的状况得出多概率尺度的刻度。
图7是通过学习得到实际概率分布的多概率尺度的刻度的流程图。
如图7所示:通过学习得到实际概率分布的多概率尺度的刻度的处理分四个步骤,有初始化步骤S1,记录特征向量各个特征要素数据步骤S2,计算各个特征要素的分布范围和概率步骤S3,返回主程序步骤S4
在初始化步骤S1里主要是设定特征向量数据的指针,数据规模,迭代次数,多概率尺度的刻度数量,因为是针对实际数据的概率分布计算,因此为了更高精度的计算两个概率分布中心点之间的多概率尺度的刻度应尽可能的多设定一些。
在记录特征向量各个特征要素数据步骤S2里,读取被识别对象多次的学习所产生的大量的特征向量,可以先将数据保存,离线的对数据进行处理,也可以直接对数据进行在线处理。
在计算各个特征要素的分布范围和概率步骤S3里,先通过概率尺度自组织的算法计算出数据的最大概率的中心值,然后以这个最大概率的中心值为中心计算所有的特征向量中各个特征要素的欧几里德分布距离,按照初始化所设定的多概率尺度的刻度的数量,以及刻度范围内的概率值,分别计算出特征向量的各个特征要素在哪个刻度范围内分布,用在某一刻度范围内的各个特征要素的数量与总的学习次数数量的比值作为该刻度范围内的概率值,得到各个特征要素在该刻度范围内的概率值,也可以用给定的概率值,求对应这个概率的特征要素的个数的比例的范围。
在返回步骤S4里将特征向量的各个特征要素的分布在哪个刻度范围内,以及在该刻度范围内的概率值保存,以便用于计算模糊事件概率的测度,并返回主程序。
通过学习得到实际概率分布的多概率尺度的示意图可以参照图1,只是在刻度上可以增加很多,这样可以进一步提高模糊事件概率测度的精度。
总结图7提出的一种通过学习得到实际概率分布的多概率尺度的刻度方法,是反复学习特征向量里,得到复数次的特征向量所属各个特征要素数据的分布位置,再按每一特征要素的实际分布,计算给定领域中的数据比例,或给定数据分布的比例计算所分布的区域,得到多概率尺度的刻度位置,或该刻度位置上的概率值。
也就是针对特征要素数据在给定领域所分布的数量与特征要素总的数据数量的比值,在给定特征要素的数量与总的数据数量的比值的条件下,计算所需要占用的区域。
图8是超深度对抗学习神经网络的示意图。
仅以图像识别为例介绍超深度对抗学习的构造原理。如图8所示:801被感知的图像的一个空间映射,超深度学习注重将被感知的图像,通过各种图像变换,如频率空间的图像,色彩空间的图像,能量空间图像,边缘空间图像等等,802与803分别是两种不同的映射空间图像,804是图像801的一个局部区域,这里考虑手机识别时可在360度的任意一个角度,都可实现正确识别,而设定的按照环形的区域分割方法,这个区域的大小应该根据应用的需要决定,范围取得太大虽然计算速度会很快,但是对于识别精度会有影响,反之,范围取得太小虽然识别精度会提高,但是计算速度会比较慢。可以考虑每一个区域的像素数量或面积一致,这样可以更加平衡输入的信息量。
805是连接在被感知的对象与感知层之间的一个具有自组织学习能力的,多概率尺度自组织的机器学习单元,这个学习单元主要是担负对感知目标信息的学习分析功能。806神经网络的感知层,主要起到对目标函数信息的输入作用,由于感知层是连接着大量的机器学习单元,对于目标函数信息具有分析功能,可以在最大概率的条件下将目标函数的信息的特征值抽出,还具有深层挖掘功能,可通过空间映射的方法将复杂系的问题的目标函数的深层信息挖掘出,还具有人为介入功能可按照应用的需求通过人为介入对目标函数的形式进行加工,807是神经网络的感知层的一个节点,超深度对抗学习的深入是通过增加目标函数的信息量,即增加空间变换的数量,同时增加多概率尺度自组织的机器学习单元的数量,以及增加感知层的节点数量实现的。
由于在被感知的目标与感知层之间连接的多概率尺度自组织的机器学习,可以自律的朝向最大概率的方向迁移,可以自动的获取目标,因此在对视频图像进行在线识别时,为解决图像位置严重的偏移,用固定位置的方式需要进行大量的学习的问题,特提出按照被识别图像的结构特征,让每一个多概率尺度自组织的机器学习单元自动的抓取被识别图像的一个部分的特征,即使这部分特征有很大的移动时也可以自动跟踪这部分图像的特征,比如识别对象是人脸,可以让不同的多概率尺度自组织的机器学习单元,分别进行人的轮廓位置的跟踪,人的两眼位置的跟踪,人的嘴的位置的跟踪,人的鼻子的位置的跟踪等等,这样不管人脸在图像上的哪个位置,都可以正确进行人脸识别,可以从大量的视频节目中找到所要识别的对象,这是可以反映机器学习水平的重要标志。
808是连接在感知层与神经层之间的一个具有对抗学习能力的,多概率尺度自组织的机器学习单元,主要是起到通过对抗学习实现对感知层的信息的深层挖掘的功能,808的机器学习单元的学习时的数据要依赖于历史性的存储数据,其学习结果也要作为历史数据的保存,因此设置了数据库存储单元809。
810是神经网络的神经层,是针对808的机器学习单元学习后,所产生的对抗结果的数据,为脑皮层814的最终判断提供重要参考意见的最初决策层。811是与感知层各个节点所对应的神经网络的神经层的节点。
812是连接在神经层810与脑皮层814之间的一个多概率尺度自组织的机器学习单元,主要是为脑皮层814的最终决策提供最终的学习数据。其重要功能是针对感知层所输入的大量特征要素的信息,通过机器学习判断这些特征要素对实现目标函数所具有的价值,以便使脑皮层能够作出最终的正确判断。812的概率尺度自组织的机器学习结果所产生的最大概率尺度,或者对抗结果的比例数值,都是具有神经层总体的阀值的性质的结果,作为最终脑皮层814的判断信号,813是神经层与脑皮层之间的,812机器学习结果的数据库存储单元,承担机器学习所需要的数据的提供以及存储的作用。
总结图8一种人工智能新型神经网络的构建方法,是由感知层,神经层以及脑皮层构成的,其中感知层通过复数个小数据直接输入的无监督机器学习单元连接被感知对象;对输入的感知对象进行最大概率信息的学习。神经层与感知层之间连接复数个小数据直接输入的无监督机器学习单元连;进行模糊事件概率测度的对抗学习。脑皮层与神经层连接小数据直接输入的无监督机器学习单元;进行最大信赖性的对抗决策的学习。
这里感知对象是通过空间映射后的;包括图像;人脸信息;声音;情感信息;文本信息;工业现场,农业现场或商业现场信息;物联网信息;金融与经济预测信息在内的任何需要人工智能处理的数字信息。
将复杂系的感知对象映射到可以承载感知对象信息的复数个空间,通过感知映射后的空间信息达到获取复杂系深层信息的目的。
上述最大概率信息是通过小数据直接输入的无监督学习后所得;超越传统统计学所获得的感知对象的信息,即最为接近母体的感知对象的数值信息。
上述模糊事件概率测度的对抗学习是指:针对一个感知数据需要在两个最为接近的概率分布数据中;通过属于一个概率分布数据的模糊事件概率测度的关系的学习;同时又进行不属于这个概率分布数据的模糊事件概率测度的关系的对抗学习,从中得到属于那个概率分布数据的学习方法。
上述对抗学习是建立在最大概率信赖度所属的特征要素基础上的。
在脑神经层与脑皮层之间再加入一个多概率尺度自组织的机器学习,是为了提高超深度对抗学习的精度,是对特征向量的每一个特征要素的实际识别的成功概率进行学习,并进行登录供识别时作为一种重要的信息,通过多概率尺度自组织的机器学习,可以获得最大信赖性的特征要素信息,将信赖度高的特征要素的数据起作用,这样的超深度对抗学习就可发挥最佳的识别效果。
图9是超深度对抗学习神经网络的流程图。
这里参照图4和图8图像识别的例子,具体介绍超深度对抗学习神经网络的流程。如图9所示:超深度对抗学习神经网络的流程图由如下16个步骤实现:
输入被感知图像步骤S1:在这个步骤里输入被识别的图像,但不仅是图像信息,也可以是声音信息,被预测的数据信息,快速傅立叶变换的数据信息等等各种需要人工智能感知的数据。
空间映射步骤S2:将被识别的图像通过图像处理,变换成可以承载原图像的不同信息的图像,例如a颜色空间图像,b颜色空间图像,边缘空间图像,能量空间图像,频率空间图像,哈福(Hough)空间图像等,这些变换后的图像是可以反映被识别图像的某些隐含的信息特征的图像形式或数据形式,同时可以作为被识别图像的特定信息载体,加入到识别对象中,其他类型的数据可以仿照这个方法进行空间映射处理。
图像区域分割步骤S3:在这一步骤中可以按传统的方法直接将图像分割成若干矩形区域,为了考虑通过手机拍照可以在360度的任意角度都可实现正确的识别,还可对被识别的图像采用如图8所示的环形的分割方法,每一个区域为一个环形区域,这样就可以不必考虑拍摄图像的方向了。对于分割的区域的多少,以及空间映射的图像的数量多少,由于多概率尺度自组织具有可对较大范围的图像作出最大概率的特征值的抽出的特点,本发明建议尽可能的多增加空间映射的数量,例如可在4到10个范围内进行空间映射,可以尽可能的减少图像分割的区域的数量,例如可在9到100个区域内进行图像分割,这样在同等感知层的节点数量下,以及同等的处理时间上可以获得更好的识别效果。
读取一个区域的图像步骤S4:参照图8的超深度对抗学习的神经网络图,以下的步骤可以是纵向处理与横向处理两种形式,纵向处理形式是:从一个图像区域开始,到感知层的一个节点内容处理后,再进行神经层的一个节点的处理,直到所有的图像区域完成。横向处理形式是:先将所有的图像区域与感知层的所有节点之间的内容处理完成后,再进行所有的感知层节点与所有的神经层节点之间的内容的处理。这里以纵向形式处理为例,介绍超深度对抗学习神经网络的模型处理流程。在这一步骤中先选择一个图像区域的处理。
多概率尺度自组织步骤S5:这是一个将输入图像信息直接进行机器学习,针对一个图像区域,可以去伪存真得到最大概率的特征值,在所有的特征值获得后,就可由所有的特征值构成可以承载被识别图像的整体信息的特征向量,其目的是利用图像的结构信息的组合来表达图像的整体信息。由于只是求解一个最大概率的特征值,因此在这一步骤中采用普通的概率尺度自组织算法就可。
输入一个感知层节点步骤S6:是把上述多概率尺度自组织步骤S5得到的最大概率的特征值输入到感知层的一个节点上。
读取历史数据步骤S7:超深度对抗学习采用了在线学习的形式,即图像学习与图像识别在一个系统中完成,当图8中的809数据库中的数据不足设定值z时,为学习状态,每输入一次图像就进行一次学习,把识别结果数据存入数据库中,直到数据达到z时为止,在平时识别时也会根据识别图像的数据对今后识别精度的提高具有“价值”时,也会用这种在线学习数据完善数据库中所登录的特征向量数据,这样就可解决例如人脸识别时由于年龄或气候变化,身体变化,例如戴上了眼镜等情况下,也能够自适应的进行人脸的图像识别。
为了以下叙述方便,对图4的图像识别例子所涉及的已登录在图8的809数据库中的特征向量可由如下公式表达:
公式10
公式10的特征向量中可表示每一个特征要素的概率分布信息的多概率尺度的刻度还可由如下公式表达:
公式11
M=(M1kj,M2kj,...,Mmkj)k=1,2,…,z;j=1,2,…,e
公式10的特征向量中可表示每一个特征要素的概率分布信息的多概率尺度的刻度之间的欧几里德距离的间距还可由如下公式表达:
公式12
D=(D1kj,D2kj,...,Dmkj)k=1,2,…,z;j=1,2,…,e
公式10的特征向量中可表示每一个特征要素的概率分布信息的多概率尺度的刻度之间的欧几里德距离的间距所对应的概率值还可由如下公式表达:
公式13
P=(P1kj,P2kj,...,Pmkj)k=1,2,…,z;j=1,2,…,e
被识别对象向量:
公式14
SV=(sv1,sv2,...,sve)
上述公式10,公式11,公式12,公式13以及公式14的数据是保存在图8中的809数据库中的。
多概率尺度自组织步骤S8:这是在感知层与神经层之间进行的最为重要的机器学习的处理,贯穿了超深度对抗学习的核心理论。传统的图像识别,仅仅建立在欧几里德空间的距离尺度,通过计算公式14的被识别的图像的特征向量,与公式10的登录的各个特征向量之间的欧几里德距离,以欧几里德距离最近的特征向量所对应的图像为识别结果,然而在图像识别过程中,由于摄像机拍摄的图像数据受环境因素的影响变化很大,所得到的特征向量数据是随机分布的,因此仅采用欧几里德空间的距离的方法,识别精度的提高受到一定的局限。
超深度对抗学习通过多概率尺度自组织,对相同图像的多次识别学习结果的特征向量的各个特征要素的特征值的概率分布,得出公式11到公式13所示的在不同刻度范围内的不同概率值的确切值,同时通过严密的概率空间距离的定义,求出公式14的识别对象图像的特征向量的各个特征要素的特征值svj(j=1,2,…,e),与公式10的登录的各个特征向量的特征要素的特征值之间的穿越欧几里德空间与概率空间的距离的确定值。
模糊事件概率测度计算步骤S9:在这一步骤中利用严密的穿越欧几里德空间与概率空间的距离的定义,就可求出可以反映公式14识别对象图像的特征值,与公式10的登录的各个特征向量的特征值之间的模糊关系:
公式15
这里
这里Vmax是设定的公式14中的识别对象图像的特征向量的各个特征值svj与公式10中的各个特征向量的特征值之间的最大穿过欧几里德空间与概率空间的距离。m是公式14中的识别对象图像的特征向量的第j个特征值svj与公式10中某一特征向量的第j个特征值之间穿越了几个多概率尺度的刻度,Dikj与Pikj是svj与某一特征向量的第j个特征值之间所穿越的各个多概率尺度的间隔与在此间隔上的概率值。
再按照模糊事件概率的测度的定义,将被识别的图像的每一个特征值svj所在公式10的每一特征向量的特征要素的概率分布中的第几个刻度的间隔内的概率值spj,与登录的各个特征向量的特征要素之间的模糊关系的乘积,就可得到被识别图像的某一个已经登录的特征向量的特征要素的一个微观测度值:
公式16
这里:
smkj (fvkj)=sfkj (fvkj)·spj k=1,2,…,z;j=1,2,…,e
其实将被识别的图像的特征向量中的所有的特征要素svj(j=1,2,…,e)与公式10的FV行列式里的各个特征向量中的特征要素之间的测度进行积分,所得到的模糊事件概率的测度值,可以作为衡量某一个被识别图像的特征向量与已登录的各个特征向量之间的严密关系,在FV行列式中选择与特征向量之间的模糊事件概率测度关系最为密切的已登录的特征向量所对应的图像,就可高精度的得到被识别图像的结果,这种既考虑了所有的特征向量中的各个特征要素的概率分布信息,以及在穿越包括概率空间在内的不同空间的严格的距离关系,同时又考虑了模糊事件概率的测度,把在微观的各种模糊信息与概率信息进行积分以获得宏观上的稳定的有价值的信息,同时又经过同两个已登录的不同特征向量之间的对抗,最终才得到识别结果,这是一个建立在模糊事件概率测度理论上的最佳的图像识别机器学习模型,所以把识别对象的特征向量与已登录的模糊事件概率关系最为密切的特征向量所对应的图像作为在神经网络的感知层与神经层之间的预选结果提供给脑皮层做最后的决策。
结合生物大脑神经元理论,因为大脑是概率模型,需要有一个神经触发的阀值,只有用最大概率的概率尺度来作为神经触发的阀值,才能符合大脑的机理,模糊事件概率测度是位相空间,不能作为最后的判定结果,在这一步骤中本发明提出将感知层与神经层之间的预选结果再做一次最后的决策的新型神经网络。
具体做法是:将初选的识别对象的特征要素svj与已登录的模糊事件概率关系最为密切的特征向量FVk之间所得到的特征要素的特征值fvkj,所对应的微观模糊事件概率测度值smkj (fvkj),作为神经层与脑皮层之间的多概率尺度自组织机器学习的最终决策依据。
在图8的808的多概率尺度自组织单元中,还承担了通过多概率尺度自组织的机器学习对上一个识别对象图像的特征要素svj’,与识别后的结果图像所对应的已登录的特征向量fvkj’,重新进行机器学习,求出新的最大概率中心值,多概率尺度的刻度值,将这些结果重新登录。
输入数据库步骤S10:这是指图8的809数据库的登录步骤,在这一步骤中要进行三种数据的登录与处理,第一个要通过在线概率尺度自组织的机器学习的结果例如公式10,11,12以及13进行登录。
第二个数据是将上一步骤得到的被识别图像的特征要素svj与已登录的模糊事件概率关系最为密切的特征向量之间所得到的各个特征要素的特征值fvkj,所对应的微观模糊事件概率测度值即公式16的smkj (fvkj),总的宏观的测度值:
公式17
以及所对应的图像进行登录。
全区域是否完成的判断步骤S12:如果全区域尚未完成,修改区域指针,修改感知层指针,以及神经层指针后跳转到读取一个区域的图像步骤S4,如果全区域都已完成就转入下一步骤。
多概率尺度自组织步骤S13:这是在神经层与脑皮层之间的机器学习单元,主要担负如下几个方面的机器学习功能:
1.特征要素的测度特征值的信赖度的评价。
判别神经层输入的公式10的FV所属各个特征向量的特征要素的测度特征值smkj是否具有信赖性的判断,可以使脑皮层针对有信赖的数据进行判断,以降低由于使用了没有信赖的数据所得到不正确判断的风险。
具体求出信赖度的概率值的方法是:根据平时的多次进行的机器学习,即设第k个被识别图像所对应的已经登录的第k个图像的特征向量中的第j个特征要素在实际识别时的成功率为CDkj,以及不是该图像识别时的误识别率为EDkj,信赖值可由如下公式18表示:
公式18
2.最大信赖度的特征要素的测度特征值的获得
通过本步骤的多概率尺度自组织的机器学习,针对第k个特征向量的信赖度向量Rkj进行自组织学习,在最大概率尺度的刻度里可以求出所属的第k个特征向量的最大概率的信赖度的向量Rkl(l=1,2,…,a),按照k与i所对应的测度的特征要素smkl (fvki)(l=1,2,…,a),就是最大概率的信赖度的测度的特征要素。
最大概率的信赖度还可根据已经登录的第k个图像的特征向量中的第j个特征要素的概率分布集中还是分散,可对所有的特征要素的第一刻度的范围值进行多概率尺度的自组织学习,得出最大概率的第一刻度范围值,把属于最大第一刻度范围内的特征要素值作为具有最大信赖性的测度的特征要素。
3.对抗向量的构成
在k个测度的特征向量里按照公式17的被识别向量SV与各个特征向量FVk之间的模糊事件概率测度值中找到最为密切的两个特征向量FVmax1和FVmax2,这两个向量与SV所对应的模糊事件概率测度分别为SMmax1和SMmax2,用它们的各个要素smmax1∈SMmax1和smmax2l∈SMmax2(l=1,2,…,a)作为最终的决策依据。
存入或读取数据步骤S14:在这一步骤中首先将特征要素的测度特征值的信赖值Rkj登录,下面将最大概率的信赖度的向量Rkl(l=1,2,…,a),以及将smmax1∈SMmax1和smmax2l∈SMmax2(l=1,2,…,a)登录。
输入脑皮层决策步骤S15:在这一步骤将神经层得到的被识别图像的最大概率的信赖度的测度的特征要素smmax1∈SMmax1和smmax2l∈SMmax2(l=1,2,…,a),在脑皮层步骤中就可按照如下超深度对抗学习的公式进行决策。
公式19
这里设阀值T>1,脑皮层根据公式19的结果是当AL>T时,神经层兴奋刺激脑皮层判断识别图像属于与SMmax1模糊事件概率测度值所对应的图像,否则拒绝本次识别结果。
返回步骤S16:到此识别过程结束,返回主程序。
到目前为止超深度对抗学习是针对特征向量的每一个特征要素进行的机器学习模型,下面提供可以针对特征向量的超深度强对抗学习的模型。
这里仅以手机识别光学标识在空间的成像,将空间图像通过多概率尺度自组织的超深度对抗学习变换成代码ITC(Image To Code),由于扫描仪的光源是有方向性的,对于空间上某一角度的图像是可以复制的,因此需要解决如何将光学标识在空间中的各种图像中通过超深度强对抗学习分离出扫描仪可以复制的图像的特征向量集合,以及不可以复制的图像的特征向量集合,在不可以复制的图像特征向量集合里找出与可复制的图像的特征向量集合的模糊事件概率测度关系最小的一组特征向量值作为手机大众识别的防伪认证码,就可实现通过手机进行大众真伪识别的应用目的。
图10是针对手机防伪识别的超深度强对抗学习流程图。
如图10所示:在获得扫描仪可以复制的图像的特征向量集合方面需要由读取扫描图像的步骤S1,超深度对抗学习步骤S2,保存可复制图像特征向量数据步骤S3,判别扫描图像是否完成步骤S4,四个步骤组成:
在读取扫描图像的步骤S1里,将光学标识通过扫描仪进行不同方向的扫描,读取一个方向的一个光学标识空间图像转入下一步操作。
超深度对抗学习步骤S2,在这一步骤中主要是针对上一步骤读取到的图像,通过参照图4,图8,或图9的内容进行超深度对抗学习,得到扫描图像的一个最大概率的特征向量,以及针对特征向量的各个特征要素的分布的多概率尺度的各个刻度值。
保存可复制图像特征向量数据步骤S3,将上一步骤的结果登录数据库。
判别扫描图像是否完成步骤S4,判断是否需要再输入扫描图像,这里是以过去扫描的图像已经不会产生新的特征向量为准,如果判断还需要输入扫描图像,则转入S1步骤,改变光学标识的方向继续进行扫描取得新的扫描图像。如果判断无需继续进行扫描图像则转入下一步骤。
在获得手机识别图像的特征向量集合方面需要由读取手机识别图像的步骤S5,超深度对抗学习步骤S6,保存手机识别图像特征向量数据步骤S7,判别手机识别图像是否完成步骤S8,四个步骤组成:
读取手机识别图像步骤S5,通过手机读取光学标识在空间的任意图像,转入下一步骤。
超深度对抗学习步骤S6,在这一步骤中主要是针对上一步骤手机读取到的图像,通过参照图4,图8,或图9的内容进行超深度对抗学习,得到手机识别的图像的一个最大概率的特征向量,以及针对特征向量的特征要素的分布的多概率尺度的各个刻度值。
保存手机识别图像特征向量数据步骤S7,将上一步骤的手机识别的图像的一个最大概率的特征向量,以及针对特征向量的特征要素的分布的多概率尺度的各个刻度值登录数据库。
判别手机识别图像是否完成步骤S8,判断是否需要再进行手机识别图像,这里是以过去手机识别图像已经不会产生新的特征向量为准,如果判断还需要输入手机识别图像,则转入S5步骤,手机识别图像的操作取得新的手机识别图像。如果判断无需继续进行扫描图像则转入下一步骤。
在获得大众手机识别防伪认证代码中,需要由超深度强对抗学习步骤S9,得到防伪验证码步骤S10,以及返回步骤S11,三个步骤组成:
超深度强对抗学习步骤S9,在这一步骤中参照图4,图8,或图9的超深度对抗学习的方法,通过模糊事件概率测度关系,判别保存在手机识别图像中的特征向量是否属于保存在可复制图像特征向量集合中的那一个,判断属于可复制图像特征向量集合中的任意一个时,就将这个特征向量从保存在手机识别图像的特征向量集合中剔除,直到不存在可复制图像特征向量集合中的任意一个特征向量为止。
得到防伪验证码步骤S10,在这一步骤中,再用手机识别光学标识,参照图4,图8,或图9再通过超深度对抗学习,将手机识别的图像的特征值与存储在手机识别图像特征向量进行对比,从中找到一个手机倾斜角度最小的空间图像的特征向量作为手机识别防伪代码。
返回步骤S11,上述步骤取得了可供大众手机识别的防伪代码,返回主程序。
图11是印刷图像颜色空间与电子图像颜色空间的特性示意图。
如图11所示:印刷颜色是由CMYK构成的颜色空间,电子图像是由RGB构成的颜色空间,电子图像与印刷图像的颜色空间绝大多数都是重合的,也有相互不重合的部分,由于具有这样的特性,如图11所示:1101是原图像颜色,经过扫描以后变成1102的图像颜色,因此经过扫描仪复制后的印刷图像同原图像必然会不同。
再有,微小的点阵比如0.04mm以下的点阵,通过扫描仪扫描以后必然会丢失一部分点阵,也就是说印刷图像经过扫描仪扫描以后各个颜色的灰度会有不同程度的损失。
但是,经过一些补偿可以使经过扫描仪扫描以后复制的印刷图像,做到比较接近原始的印刷图像。特别是肉眼很难分清哪个是原始图像,哪个是复制的图像,这就是目前社会上商品防伪普遍遇到的解决不了的难题。
针对这一难题,可以导入超深度强对抗学习,通过对原始图像与被复制的图像的分别机器学习,就可以分清原始图像以及复制图像,而且还可以得到一个高精度的区分原始图像与复制图像的大众手机防伪识别代码,从而解决大众手机防伪识别问题。
具体方法可参照图10,在S1-S4的步骤里扫描不同方法复制的印刷图像,取得复制后的印刷图像的特征向量,以及多概率尺度的刻度的集合。在S5-S8的步骤里用手机在不同环境下拍摄原印刷图像,取得手机拍摄原图像的特征向量,以及多概率尺度的刻度的集合。然后再在S9-S11的步骤里通过超深度强对抗学习用手机在不同环境下拍摄原印刷图像,取得手机拍摄原图像的特征向量,以及多概率尺度的刻度的集合中将不属于复制的印刷图像的特征向量,以及多概率尺度的刻度的集合中的特征向量作为防伪代码,把属于被复制的印刷图像的特征向量,以及多概率尺度的刻度的集合中的特征向量作为复制代码进行登录,将上述方法用于商品标识的处理,就可实现商品的大众手机识别真伪的效果。
同样还可以在商品标识上设置一个小的防伪识别区域,在防伪识别区域上可以设置光学标识,或如图11所示的防伪印刷区域,按照上述方法实现商品大众手机真伪识别。
仿照图10的光学标识大众手机识别真伪的原理还可扩展到OVI变色薄膜的应用,变色薄膜以及变色油墨是通过真空镀膜工艺,通过控制膜的厚度实现对某一光谱的干涉效果制成的薄膜或油墨,这种薄膜或油墨可以在改变30-60度的角度时产生不同的颜色变化,也就是可在空间中产生不同颜色的图像,与光学标识相仿可以参照图10的方法实现商品标识的手机大众识别真伪的防伪结构。
采用图10的方法还可以导入微镜头阵列薄膜实现大众手机真伪识别的效果。具体是微镜头阵列可以把表示图像投射到某一个角度,这个角度可以由微镜头阵列的衍射角度的设计决定,同时投射到空间的图像也是可以通过微镜头阵列所对应的印刷图像来决定,因此同光学标识,以及变色薄膜相比具有可控性,稳定性,因此对实现商品大众手机识别真伪的标识结构设计来讲具有得天独厚的特点。仿照图10的处理方法就可实现手机大众识别商品真伪的效果。
是否可以处理针对给出的一组离散的数据,通过上述的超深度对抗学习实现回归分析,是检验机器学习的性能的重要手段,经过实际数据的检验证明超深度对抗学习可以得到超越实际计算的结果,下面具体介绍一种利用超深度对抗学习解决回归分析的方法。
图12是利用超深度对抗学习解决回归分析的流程图。
如图12所示:利用超深度对抗学习解决回归分析是通过如下步骤实现的:
初始化步骤S1:在这个步骤里首先要给出最初的回归分析的直线,可以将给定的回归分析数据集合RD所属的点阵位置(xi,yi)∈RD(i=1,2,…,n)中,最小位置的点(xmin,ymin),与最大位置的点(xmax,ymax)连接成一条直线,作为初始的回归分析直线,因为概率尺度自组织可以自动的找到数据分布最密的地方,所以用上述方法不会因为初始回归分析直线距离数据分布比较远而影响最后的结果。在这一步骤里还要预先给出概率尺度的初始值,可参考上述多概率尺度自组织的初始化的要求,再有就是给出回归分析的最大循环次数等。
计算点到直线距离步骤S2:将给定的回归分析数据集合RD中的(xi,yi)∈RD(i=1,2,…,n),按照下式求出各个点到回归分析直线的距离:
公式20
这里,设回归分析直线为:Ax+By+C=0
概率尺度自组织步骤S3:仿照上述图2多概率尺度自组织的流程图,针对上一步骤得到的回归分析数据集合RD中的(xi,yi)∈RD(i=1,2,…,n)的各个数据与回归分析直线的距离di(i=1,2,…,n)进行概率尺度的自组织,概率尺度以内的数据保留,概率尺度以外的数据剔除。
得到回归分析结果步骤S4:将被保留的点阵数据仿照初始化的方法在最大x数据(xmax)的附近找到一个y的中心值即(x0,y0)max,最小的x数据(xmin)的附近也找到一个y的中心值即(x0,y0)min,用这两个数据构成新的回归分析直线,或者用点到直线的概率尺度所对应的中心作为新的回归分析直线,重复这样的自组织过程,就可得到最大概率的回归分析直线,以及点到直线的最大概率范围。这里同传统的回归分析公式所计算出的结果不同的是:由于是通过概率尺度自组织进行的机器学习,可以把噪声滤出,可以跨越小概率数据的障碍向大概率数据迁移。
判断是否还需要继续学习步骤S5:按照多概率尺度自组织的是否完成的判断方法,判断概率尺度自组织的结果是否已经稳定,或者是否超出最大的自组织的迭代次数,“是”就结束进入下一步骤。“否”则跳转到计算点到直线的距离步骤S2继续进行回归分析的机器学习。
返回步骤S6:机器学习完成返回主程序。
为了验证通过超深度对抗学习所得到的回归分析的效果,我们给出了表2的一个与室外温度有关的冷咖啡的销售业绩的统计的实际的例题。
表2
室外温度 22 23 23 24 24 25 25 26 26
销售数量 300 310 320 330 320 330 310 320 310
室外温度 27 27 28 29 32 28 24 31 31
销售数量 340 360 350 360 400 370 310 360 390
室外温度 33 34 34 35 35 20 20 21
销售数量 400 450 460 440 480 350 300 380
图13是两种回归分析结果的比较示意图。
如图13所示:图13的(a)是针对表2的数据通过传统的回归分析的公式计算出的回归分析结果,1301是采用传统公式计算出的回归分析的直线,1302与1303是给定的范围与回归分析直线所夹在一起的数据,这里只有17个数据在这个范围内。
图13的(b)是通过超深度对抗学习实现的回归分析结果,1304是通过超深度对抗学习实现的回归分析的直线,1305与1306是给定的与图13的(a)相同范围的,与超深度对抗学习所得到的回归分析直线所夹在一起的数据,这里共有21个数据在这个范围内。
通过对比可以看到由于通过超深度对抗学习实现的回归分析结果具有最大概率的回归分析的结果,可以剔除噪声,所以可以在相同的面积里,找到数据分布密度最大的区域,因此可称为最大概率的回归分析结果。
图14是超深度流形学习的算法与计算结果的示意图。
如图14所示:针对给出的这个流形学习的数据,导入超深度流形学习的算法,可以通过47个步骤得到图14的结果,下面分别叙述:
第一步骤S1:随机的从流形学习的任何一个位置切入,首先设定步长,步长最小为概率尺度自组织的最大概率尺度的2倍宽度,在这种情况下,可以做到适应任何数据,可以做到最高精度的计算结果,但是,计算时间比较长。为了考核超深度流形学习的能力,这里,特意采用比较长的间隔进行处理,但是按照采样定理,间隔不能大于无直接关系数据点之间的距离的一半以下,否则会出现路径上的错误。
在S1的步骤里先在两端用上述多概率尺度自组织的机器学习算法,得到两端的最大概率尺度的中心值的位置,将这两个位置连成一个直线,采用上述回归分析的算法得到一条最接近这两段分布的数据的一条直线,将这条直线作为在这两段之间逼近流形学习曲线的结果。
第二步骤S2:可以选择S1步骤的结果两端的任何一端继续进行计算,这里选择从左边开始继续处理。将S1步骤的结果向左做一个与间隔等宽度的用虚线表示的延长线,这里正好落在了流形学习数据上,所以直接对这个点按照上述的处理得到了一个最大概率尺度的中心值。同上一步骤相同用这个中心值连接成一条直线,继续进行回归分析,最终得到一个在这一步骤区间内的流形学习的最佳逼近结果。这里采用超深度对抗学习获得的回归分析结果,可以剔除噪声得到最接近于母体的回归分析结果,因此也会使流形学习的逼近效果达到去除噪声,最为接近母体的最大概率的逼近结果。
第三步骤S3:在这一步骤里延长线显然脱离了流形学习的数据,但是,涵盖在多概率尺度自组织的处理范围内,所以通过多概率尺度自组织可以自律的向着概率最大的方向迁移,最终还是找到了最大概率的中心值。
第四步骤S4:在这一步骤里延长线明显脱离了流形学习数据,但是如图14所示:有一个数据还是落在多概率尺度自组织的处理范围内了,通过这个数据的引导,多概率尺度自组织可以自律的朝向大概率的迁移作用,可以穿越这个小概率数据,直接迁移到概率密度更大的数据的位置。
第五步骤S5:在这一步骤中,延长线严重脱离了流形学习数据,在给定的多概率尺度自组织范围内包括了左边的两个分散的数据,以及右面的密度比较高的数据,不管多概率尺度自组织的结果是哪个数据,在这范围内进行回归分析,肯定会逼近右面的密度高的数据,而剔除左面密度低的数据。
第六步骤S6:在S6步骤中出现了特例,因延长线接近了没有直接关系的流形学习数据,如果按照这种情况,就会偏离流形学习的原有轨迹,出现这个问题的原因是在第一步骤中强调的为了满足采样定理,处理流形学习的间距不能大于二分之一的无直接关系的数据的跨距,因此可以在这里假设延长线的长度满足上述采样定理,就可保证不会出现偏离流形学习轨迹的问题。
第七步骤S7:这里当给定的多概率尺度范围内不存在数据时可以加大最初的多概率尺度范围。
第八到十二步骤S8-S12:一直比较顺利,通过延长线直接就可达到流形学习的终点。
第十三步骤S13:再回到第一步骤S1,从右端开始通过延长线,经过多概率尺度自组织的迁移找到了流形学习数据,并进行回归分析,得到概率最大的,最能逼近流形学习数据的直线。
第十四步骤S14:这一步骤中的主要特点是在延长线的终点严重偏离流形数据时可以通过加大多概率尺度的初期尺寸,直到涵盖流形学习的数据为止。
第十五到十六步骤S15-S16:S15没有特殊的处理要求,S16需要两次增加多概率尺度的尺寸,直到涵盖流形学习的数据为止。
第十七到十九步骤S17-S19:S17与S18没有特殊的处理要求,S19与S6相同,出现了延长线过长问题,因此也要按照采样定理,缩短延长线的尺寸。
第二十到二十三步骤S20-S23:S20与S21没有特殊的处理要求,S22与S23需要通过已经被逼近的流形学习数据,因此被逼近后的流形学习数据需要标注,这种数据不能再度参与概率尺度的自组织学习,但是可以把已经逼近的直线的节点作为二次使用。
第二十八到二十九步骤S28-S29:S28没有特殊的处理要求,S29根据延长线的走向,需要与S7的一个端点连接。
第三十到三十八步骤S30-38:S30,S31,S32,S33,S34以及S35,没有特殊的处理要求,从S36开始在很窄的空间里,流形学习要打个折线,同样针对这种流形学习的数据,按照采样定理,处理间隔不能太大,否则解决不了S36,S37以及S38的180度的转向问题,所以在这里用了三个步骤进行180度的转向。
第三十九到四十四步骤S39-S44:S39,S40,S41,S42以及S43没有特殊的处理要求,按照延长线的引导,加上多概率自组织具有自律的向高概率的方向迁移的能力,以及超深度对抗学习的回归分析,具有剔除噪声,可以做到最大概率的逼近,所以可以顺利的实现流形学习数据的最佳逼近。S44步骤根据延长线的引导,需要借助一个已经处理过的流形学习数据的节点。
第四十五到四十七步骤S45-S47:S45,S46以及S47均没有特殊的处理要求可直接逼近到流形学习的起点。
经过超深度流形学习得到了一个流形学习数据的最佳逼近的列表,采用样条函数将各个直线连接成光滑的连续函数,而且还可以求导。
上述超深度流形学习借助了已经逼近流形学习数据的直线的延长线,又借助多概率尺度自组织可以向高概率方向迁移的特点,超深度回归分析可以剔除噪声,可以做到最佳逼近的特点,以及多目的概率尺度的初始直径可以根据需要加大的规则就可实现流形学习数据的最佳逼近。超深度流形学习的处理间隔可在多概率尺度自组织后的最大多概率尺度的二倍直径到若干倍直径的范围。
最后需要说明的是:超深度流形学习适用于具有一定概率分布的流形学习大数据的处理,其结果可以通过样条函数进行拟合成为一个连续函数,甚至可以做到导数连续。
本发明的特点:
总结以上说明书的内容本发明要点与特点如下:
1.提出了一个通过概率分布特性实现的多概率尺度的定义方法。
该方法可以标定概率分布的区域,适应机器学习可获得目标函数的概率分布信息的需求,利用概率分布的特性,无需针对每一个数据的单独学习,以及无需对每一个概率分布区域的单独学习,可获得学习效率非常高的应用效果,因为是最大概率的尺度,所以适应自组织机器学习的尺度需求。
2.还提出了一个通过学习得到实际概率分布的多概率尺度的定义方法。
该方法采用非常简单的机器学习方法就可以针对概率分布的数据实现多概率分布的学习结果,具有方法简单导入硬件开销小,计算效率高,适于模式识别的应用的特点。
3.提出了可以实现朝向大概率的自律迁移的多概率尺度自组织的无监督机器学习算法,可以在概率分布的过程中跨越噪声数据的障碍,自律的向着大概率的方向迁移,直至获得最大概率分布的区域,以及可获得概率空间的整个概率分布的各个区域的刻度信息。
4.提出了可穿越欧几里德空间与概率空间的距离的严格定义,为严格得到不同概率分布之间的远近关系提供了理论依据。揭示了在概率空间的距离与概率分布的区间的概率值有关,并揭示了概率空间是在欧几里德空间中存在的,而且在一个欧几里德空间里可以存在无限个概率空间,以及概率空间的距离是不对称的,是具有方向性的等等。为提高模式识别的精度,以及机器学习结果的数据精度,以及提高机器学习的效率提供了理论依据。
5.提出了可穿越包括概率空间在内的不同空间的数据的模糊事件概率测度的定义方法,可以把在空间中的任意一个点的位置,与某一概率分布的位置之间的微观的模糊信息与概率信息充分利用起来,在通过积分后可获得可观的稳定的模糊信息与概率信息,并且更加严格的定义了在穿越欧几里德空间与概率空间中的,两个数据之间的更加严格的远近关系,为进一步提高机器学习的精度,与进一步提高机器学习的效率提供了理论依据。
6.提出了几种对抗学习的方法,针对在穿越包括概率空间在内的不同空间中的任意一个位置上的,一个数据与两个概率分布的之间所建立的严格的模糊事件概率测度关系所进行的对抗学习,可获得更加高的分类精度,可以使模式识别的精度达到最佳的水平,为无监督的机器学习提供了更高精度的,以及更高学习效果的算法。强对抗学习可以使传统上不能分类的数据,可以通过超深度强对抗的算法实现不同特征向量的分离,可以解决目前国际上解决不了的通过手机实现大众防伪识别的问题。
7.提出了一个最符合大脑机理的神经网络模型,同传统神经网络相比,避免了通过海量的参数承载目标函数的信息,回避了深度学习的在海量数据之间的,宇宙数字的组合空间里,进行数据筛选所遇到的只能得到局域最佳解的难题,解决了传统神经网络的黑箱问题,解决了传统神经网络不能实现无监督学习的问题,以及解决了传统神经网络需要庞大的硬件支持,不能在单片芯片以及无线终端上应用的难题,本发明提出的超深度对抗学习神经网络具有学习精度高,以及学习效率高的特点,还具有可以并行学习,以及标准模组的组态,可以根据应用的需要让用户自行的搭建神经网络的架构,同时也适于通过芯片进行硬件的机器学习模组的构成。
8.可对线性的以及非线性的概率分布数据进行最佳逼近,可获得最大概率的回归分析结果,以及流形学习数据的最佳逼近效果,可以剔除噪声,以及可以穿越噪声数据的障碍,自律的逼近最大概率的区域,超深度回归分析学习结果同实际公式计算出的结果具有明显的逼近效果。证明超深度对抗学习可以与传统的深度学习算法进行对抗,具有优于传统算法的优势。

Claims (7)

1.一种穿越不同空间的模糊事件概率测度值的获得方法,其特征如下:
(1)模糊事件概率测度值是与穿越两种以上不同空间的距离有关;
(2)是由微观的模糊信息与微观的概率信息构成的。
2.根据权利要求1所述的一种穿越不同空间的模糊事件概率测度值的获得方法,其特征在于:所述模糊事件概率测度是指:将微观的模糊信息与概率信息进行积分从而获得宏观的稳定的信息。
3.根据权利要求1和2所述的一种穿越不同空间的模糊事件概率测度值的获得方法,其特征在于:所述微观的模糊信息是指:穿越不同空间的两个数据之间的距离信息;该距离越近模糊关系越大;反之距离越大模糊关系越疏远。
4.根据权利要求1所述的一种穿越不同空间的模糊事件概率测度值的获得方法,其特征在于:所述微观的概率信息是指:穿越不同空间的两个数据中,一个数据在另一个数据的概率分布上的概率值。
5.根据权利要求1所述的一种穿越不同空间的模糊事件概率测度值的获得方法,其特征在于:所述不同空间的距离是指:欧几里德空间;概率空间包括曼哈顿空间(ManhattanSpace);切比雪夫空间(Chebyshev Space);闵可夫斯基空(Minkowski Space);马氏空间(Mahalanobis Space);夹角余弦空间(Cosine Space)中所定义的距离的组合。
6.根据权利要求1所述的一种穿越不同空间的模糊事件概率测度值的获得方法,其特征在于:所述微观的概率信息是指:包括具有正态分布;多变量正态分布;对数正态分布;指数分布;t分布;F分布;X2分布;二项分布;负的二项分布;多项分布;泊松分布;爱尔朗分布(Erlang Distribution);超几何分布;几何分布;通信量分布;韦伯分布(WeibullDistribution);三角分布;贝塔分布(Bete Distribution);伽马分布(GammaDistribution)中任意一种或是引伸到贝叶斯方法(Bayesian Analysis);高斯过程(Gaussian Processes)中的任意概率分布中任意一种概率分布的信息。
7.根据权利要求1所述一种穿越不同空间的模糊事件概率测度值的获得方法,其特征在于:所述模糊事件概率测度可由如下公式表达:
设在欧几里德空间存在着一个概率空间的集合wj∈W(w1,w2,…,wn)中有一个元素wj的概率分布的中心点为wj,该概率分布的多概率尺度的第一个刻度为M1,第二个刻度为M2,第三个刻度为M3,中心点wj与第一个刻度M1的间距为D1j=M1j,在这区间属于集合wj的概率分布的概率值为P1j (wj),由第二个刻度到第一个刻度的间距为D2j=M2j-M1j,在这区间属于集合wj的概率分布的概率值为P2j (wj),由第三个刻度到第二个刻度的间距为D3j=M3j-M2j在这区间属于集合W的概率分布的概率值为P3j (wj),设穿越属于wj概率空间时所经过的刻度数mj (wj)=3,又设在欧几里德空间还存在另一个概率空间集合vj∈V(v1,v2,…,vn),在两个集合的中间又存在一个点任意一点rj∈R(j=1,2,…,n),求rj在wj到vj之间,rj属于wj概率分布的概率值为rpj (wj),求rj到达wj的模糊事件概率测度:
CN201710123102.6A 2017-02-27 2017-02-27 一种穿越不同空间的模糊事件概率测度值的获得方法 Pending CN108510070A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201710123102.6A CN108510070A (zh) 2017-02-27 2017-02-27 一种穿越不同空间的模糊事件概率测度值的获得方法
JP2018047268A JP6998562B2 (ja) 2017-02-27 2018-02-27 異なる空間におけるファジィ事象確率測度のモデルの構築方法、その装置、及びそのプログラム、及びそのブログラムが搭載された汎用モバイル端末装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710123102.6A CN108510070A (zh) 2017-02-27 2017-02-27 一种穿越不同空间的模糊事件概率测度值的获得方法

Publications (1)

Publication Number Publication Date
CN108510070A true CN108510070A (zh) 2018-09-07

Family

ID=63373369

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710123102.6A Pending CN108510070A (zh) 2017-02-27 2017-02-27 一种穿越不同空间的模糊事件概率测度值的获得方法

Country Status (2)

Country Link
JP (1) JP6998562B2 (zh)
CN (1) CN108510070A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111045422A (zh) * 2018-10-11 2020-04-21 顾泽苍 一种自动驾驶导入“机智获得”模型的控制方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111192221B (zh) * 2020-01-07 2024-04-16 中南大学 基于深度卷积生成对抗网络的铝电解火眼图像修补方法
CN114021319A (zh) * 2021-10-26 2022-02-08 岭南师范学院 一种基于改进桥接系数的指挥控制网络关键边识别方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9069725B2 (en) 2011-08-19 2015-06-30 Hartford Steam Boiler Inspection & Insurance Company Dynamic outlier bias reduction system and method
JP5822411B2 (ja) 2013-08-12 2015-11-24 株式会社アポロジャパン 画像情報のコード変換装置、画像情報のコード変換方法、画像コードを用いた画像関連情報提供システム、画像情報のコード変換プログラム、及びそのプログラムを記録した記録媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111045422A (zh) * 2018-10-11 2020-04-21 顾泽苍 一种自动驾驶导入“机智获得”模型的控制方法

Also Published As

Publication number Publication date
JP2018142326A (ja) 2018-09-13
JP6998562B2 (ja) 2022-01-18

Similar Documents

Publication Publication Date Title
CN108510057A (zh) 一种超深度对抗学习的神经网络模型的构成方法
CN108510052A (zh) 一种人工智能新型神经网络的构建方法
CN108509964A (zh) 一种穿越欧几里德空间与概率空间的距离的获得方法
CN108510068A (zh) 一种超深度回归分析学习方法
CN108319972B (zh) 一种针对图像语义分割的端到端差异网络学习方法
US5519789A (en) Image clustering apparatus
Fukumi et al. Rotation-invariant neural pattern recognition system estimating a rotation angle
CN107609602A (zh) 一种基于卷积神经网络的驾驶场景分类方法
CN106920243A (zh) 改进的全卷积神经网络的陶瓷材质件序列图像分割方法
CN111681178B (zh) 一种基于知识蒸馏的图像去雾方法
CN108510070A (zh) 一种穿越不同空间的模糊事件概率测度值的获得方法
CN108509966A (zh) 一种超深度对抗学习的方法
CN108509965A (zh) 一种超深度强对抗学习的机器学习方法
CN108510079A (zh) 一种用于机器学习的多概率尺度的构成方法
CN109801225A (zh) 基于多任务全卷积神经网络的人脸网纹污迹去除方法
CN112489168A (zh) 一种图像数据集生成制作方法、装置、设备及存储介质
CN109191418A (zh) 一种基于收缩自编码器特征学习的遥感图像变化检测方法
CN112818849A (zh) 基于对抗学习的上下文注意力卷积神经网络的人群密度检测算法
CN111666852A (zh) 一种基于卷积神经网络的微表情双流网络识别方法
CN109685126A (zh) 基于深度卷积神经网络的图像分类方法及图像分类系统
CN108510053A (zh) 一个多概率尺度自组织机器学习的方法
CN115830537A (zh) 一种人群计数方法
CN108510056A (zh) 一种超深度对抗学习在线图像识别的方法
CN108510055A (zh) 另一种导入人工智能的手机大众识别真伪方法
CN108510054A (zh) 一种采用人工智能的手机大众识别真伪方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination