CN103620647A - 图像分类方法 - Google Patents
图像分类方法 Download PDFInfo
- Publication number
- CN103620647A CN103620647A CN201280030264.0A CN201280030264A CN103620647A CN 103620647 A CN103620647 A CN 103620647A CN 201280030264 A CN201280030264 A CN 201280030264A CN 103620647 A CN103620647 A CN 103620647A
- Authority
- CN
- China
- Prior art keywords
- image
- function
- expansion coefficient
- distribution
- distribution function
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5838—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5854—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5862—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using texture
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/90—Determination of colour characteristics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/52—Scale-space analysis, e.g. wavelet analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/35—Categorising the entire scene, e.g. birthday party or wedding scene
Abstract
包括:二维颜色分布函数输入步骤,输入色面的图像的二维分布函数;二维边缘分布函数建立步骤,对上述色面的图像进行过滤,依次生成由多个析像度构成的高频子带图像,使上述高频子带图像从较低的析像度依次统合,生成统合成一个的高频图像,对上述统合成一个的高频图像的各像素值进行平方,由此建立以零以上的值的分布所定义的边缘面的图像的二维分布函数;记述步骤,将上述色面的图像的二维分布函数展开成以相伴勒让德函数为x方向和y方向的正交基底函数的二维勒让德级数,通过勒让德展开系数来记述上述色面的图像的二维色分布,并且将上述边缘面的图像的二维分布函数展开成以余弦函数和正弦函数为x方向和y方向的正交基底函数的二维傅里叶级数,通过傅里叶展开系数来记述上述边缘面的图像的二维边缘分布;评估步骤,根据上述勒让德展开系数和上述傅里叶展开系数来评估上述色面的图像的分布特征;和分类步骤,根据上述评估结果将上述色面的图像分类为至少两个范畴的图像。
Description
技术领域
本发明涉及图像分类方法。
背景技术
以往,存在有对用户所提示的一幅模型图像而检索相似图像的相似图像检索的技术领域。在非专利文献1中公开有如下技术:使用颜色直方图,通过均匀地统合这些直方柱(bin)而粗略地量化(Quantization),使该值自身为特征量,在特征量空间内测量相似度的距离,由此提取相似图像。在非专利文献2中提出了从颜色、纹理和形状的各自方面来检索相似图像的系统,对于颜色定义了与非专利文献1相同的特征量,另外对于其他方面定义了完全不同的特征量。在非专利文献3中示出基于纹理特征量的相似图像检索的方法。在此,对图像进行Gabor小波变换(Gabor wavelet transform),将所生成的各个高频子带的值的平均值和标准偏差的组作为特征向量。而且,由此公开了如下技术:通过特征量空间中的距离比较而提取与向Brodatz纹理图像库(Brodatz texture database)提示的纹理相似的图像。
另一方面,与相似图像检索不同,在专利文献1中公开有通过感性形容词对照片进行分类的也称作感性检索的技术。在此,使照片与代表三色近似,并与为了创作服饰或室内设计、都市景观的色彩设计师而预先准备的记述了三色配色模型与基于形容词的印象词的关系的数据库进行对照,由此记述照片的感性。即,取代更粗略地记述非专利文献1的方法来确定代表色,而对一个术语准备了1~10个左右的多个其图案模型。
而且,在非专利文献4中明确了图像与光泽感的关系。即,指出在图像的明亮度直方图的非对称性与人类对光泽感进行感知判断的机构之间存在深刻的关联性。具体而言,阐明了明亮度直方图的失真度与光泽感的关系。为了建立进行用于验证该关系的心理实验的模拟图像,作为直方图的模型,假定容易获取与失真度的对应关系的β函数,通过改变其参数来进行心理实验。
现有技术文献
专利文献
专利文献1:日本专利第3020887号公报
非专利文献
非专利文献1:Y.Gong,C.H.Chuan,and G.Xiaoyi,″ImageIndexing and Retrieval Based on Color Histograms,″Multimedia Toolsand Applications2,133-156(1996).
非专利文献2:W.Niblack,R.Barber,W.Equitz,M.Flickner,E.Glasman,D.Petkovic,P.Ynaker,C.Faloutsos,and G.Taubin,″TheQBIC Project:Querying Images By Content Using Color,Texure,andShape,″SPIE Vol.1908,173-187(1993).
非专利文献3:B.S.Manjunath and W.Y.Ma,″Texuter Features forBrowsing and Retrieval of Image Data,″IEEE Transactions on PatternAnalysis and Machine Intelligence,Vol.18,No.8,August1996.
非专利文献4:I.Motoyoshi,S.Nishida,L.Sharan,and E.H.Adelson,″Image statistics and the perception of surface qualities,″Nature,2007,May10;Vol.447(7141),pp.206-209.
发明内容
上述非专利文献1~3的方法具有汇集与提示图像或提示图案的颜色直方图或纹理图案极其准确一致的画面的相似图像的能力,但存在如下问题:不具有掌握即使为不同颜色或纹理的画面也能唤起同一感性这样的图像所共有的特征的能力。另一方面,关于专利文献1的近似代表三色的观点,即使在某一方面通用,也很难说其准确地记述了照片的全部感性。另外,非专利文献4极其值得关注,但仅限于指出了失真度与光泽感的关系,与多种多样的感性之间的关系完全未知。
本发明的主要目的在于提供一种通过形容词对图像进行分类的图像分类方法。另外,其目的还在于,对感性的机理导入假说而以数学方式模型化,由此,探明图像观测量与心理物理量之间的关系,从而导入通过与感性机理更为切合的高级形式对感性建立特征的物理量的定量记述方法。
本发明的图像分类方法的特征在于,包括:二维颜色分布函数输入步骤,输入色面的图像的二维分布函数;二维边缘分布函数建立步骤,对上述色面的图像进行过滤,依次生成由多个析像度构成的高频子带图像,使上述高频子带图像从较低的析像度依次统合,生成统合成一个的高频图像,对上述统合成一个的高频图像的各像素值进行平方,由此建立以零以上的值的分布所定义的边缘面的图像的二维分布函数;记述步骤,将上述色面的图像的二维分布函数展开成以相伴勒让德函数为x方向和y方向的正交基底函数的二维勒让德级数,通过勒让德展开系数来记述上述色面的图像的二维色分布,并且将上述边缘面的图像的二维分布函数展开成以余弦函数和正弦函数为x方向和y方向的正交基底函数的二维傅里叶级数,通过傅里叶展开系数来记述上述边缘面的图像的二维边缘分布;评估步骤,根据上述勒让德展开系数和上述傅里叶展开系数来评估上述色面的图像的分布特征;和分类步骤,根据上述评估结果将上述色面的图像分类为至少两个范畴的图像。
发明效果
根据本发明,通过对二维分布函数使用与它们的信号分布的性质相符的正交基底函数来进行级数展开,能够实现人的形状识别和线形的作用,进行向均等识别空间的投影表达。由此,在产生同一感性的图像或引起同一认识的图像之间所共同的特征量的记述能够提供极其容易处理的线性记述的空间。
附图说明
图1是切比雪夫多项式Tn(x)中的T1(x),T2(x),T3(x)的曲线图。
图2是与球贝塞尔函数的根相关的基底函数的n=1~5的曲线图。
图3是球贝塞尔函数的j0(x),j1(x),j2(x)的曲线图。
图4是放大定义至负区域的球贝塞尔函数j0(x)~j5(x)的曲线图。
图5是表示实施方式的图像分类装置的框图。
图6是表示实施方式的图像分类装置中的处理的流程图。
图7是取Fm=2(α)(α)+的迹的对象的一个成分、即对称状态的合成波T1T3和T2T4的波形图。
图8是表示“静态”图像、“动态”图像的HVC面的颜色直方图形状的图。
图9是表示“严肃的”图像、“开朗的”图像的HVC面的颜色直方图形状的图。
图10是表示基于四级小波变换的子带分割的状况的图。
图11是表示在对感性不变量Gz,m(α)(α)+取规定的算术平均的情况下,当展开的次数为N=100且使量子数差m跳跃时,怎样的分布函数的形状与排列的图像组分布的两极端相符的例子。
图12是表示“肃静的”图像、“玄幽的”图像的HVC面的颜色直方图形状的图。
图13是表示颜色和纹理的分布函数的图。
图14是进行了傅里叶变换的情况下的高次动量空间的概念图。
图15是表示相位空间中的感性组的表象图。
图16是针对不确定性关系来说明位置与动量的关系的图。
图17是表示构成四个扩展迹的状况的矩阵图。
图18是形容词的模型图像中的能量值的分布图。
图19是金字塔层级构造的想像图。
图20是颜色及纹理中的能带图。
图21是镍的传导带中的能带图。
图22是表示投影表达和感性的线性模型的状况的图。
图23是表示基于频率记述的向均等识别空间的映射的状况的图。
图24是表示通过投影表达使心理构造作为能带构造而可视化的状况的图。
图25是表示与构图的低次不变量的构筑相关的要素的关系的图。
图26是勒让德多项式中的P2(x),P3(x),P4(x),P5(x)的曲线图。
图27是表示二维系数向一维数组的重新排序方法的种类的图。
图28是表示能量分散关系的概念上的状况的图。
图29是表示调查k空间上的特殊点和线上的能量的性质的状况的图。
图30是表示二维展开系数与动量、角动量、能量的关系的图。
具体实施方式
在具体说明本发明的实施方式之前,进行与之相关的原理说明。
[1]本申请人的基于此前实验的见解
为了应对上述那样的技术课题,本申请人在此归纳此前已公知的尝试。其中许多部分也记载于本发明人既已提出申请的日本特愿2008-23469号(在先申请1)及日本特愿2008-235578号(在先申请2)。
首先,为了准备实验环境,对大约200幅图像赋予了表达从各个图像感受到的感性的形容词。将这些图像转换成孟塞尔(Munsell)HVC颜色空间,并对全部实验图像比较调查颜色直方图及纹理PDF与附加形容词的对应关系。在此,纹理PDF是指边缘图像的直方图。PDF是Probability Density Function(概率密度函数)的略写,用于从图像提取高频带,由于已约定俗成地将其直方图称作PDF,所以使用该术语。
此外,纹理PDF不与以往存在的一个高频子带相关,是为了模仿在视觉上瞬间判断的认知机构而通过统合独自导入的由多重析像度提取的高频子带而得到的统合边缘图像的直方图。在该直方图中,反映出对比度的空间上的配置关系的关联,出现与一个普通高频带的PDF形状所取的广义高斯函数不同的各种形状。
<关于感性分类中的模糊性记述的重要性>
关于对记述用于实验的图像的感性的形容词进行命名而使之明确的方面,作为极其普通的现象而会发生如下情况:即使为平均或代表性的色调、明亮度、彩度不同的图像也会唤起相同感性,另一方面,即使平均或代表性的色调、明亮度、彩度相同但由于其他要素强烈而带来完全不同的感性。而且若从其他方面看待该事实,则在形容词中存在层级构造,作为对图像赋予的形容词,也关联于仅主要留存与最上位概念接近的形容词的情况。形容词的层级性的概念与在神经心理学等领域所公知的事实相符合,并且也示出形容词的特征量的记述不比通过相似图像检索进行处理的情况简单。
本申请人如上述那样调查了形容词与颜色直方图及纹理PDF的关系,其结果确信了从这些分布函数模糊地读取的与相似形状相关的特征和感性直接关联的可能性较高。因此,在感性图像检索中,如相似图像检索那样测量直方图的绝对形状的相似性并不重要,相对而言重要方面在于,作为符合人类的感觉那样的模糊特征,如何捕捉与某部分的形状相关的特征显著这一情况的相似性。
在上述在先申请1中,颜色直方图尤其指出同时记述V面和C面的组合中的整体上的形状差图案的倾向的重要性,在在先申请2中,纹理PDF指出非对称性的评估和微凸斜面的形状的不同的重要性。其中,关于为了提取模糊形状而临时采用的方案为,在颜色直方图的情况下,评估V面和C面的与直方图的峭度和失真度相关的统计量。由此,一个重要要素为,判断VC面是否一方为2能带构造且另一方为1能带构造而能够评估在其间形状逐渐转变的轴的情况。在纹理PDF的情况下,使用失真度和独自定义的粗面度(エボシ度)这两个指标来评估直方图形状的非对称性。其中,在评估相同的非对称性的特征时,对微凸斜面使用敏感指标和钝感指标这两个指标,由此,也得出如下结果:双面评估一个特征对于得到与具有两面性性质的形容词的关联来说是重要的。形容词的两面性表示在一个形容词所具有的意思中,同时兼有大的主要分类的要素、和与包含于其中的其他形容词之间的意思相区别的精细分类的要素这两个要素。
[2]技术课题和对策的方针
<分布函数的形状识别的多样化和定量化>
1)技术课题
在上述那样的峭度和失真度等统计学的量中,实际上存在以下这样的问题点。
a)在单独的统计量中,与形容词之间的直接关联不足。
b)在与感性相关的心理量之间不存在线形定量关系。
c)对直方图形状识别的多样化的应对存在极限。
具体进行说明,关于峭度和失真度等统计量,作为表示从高斯分布的偏离的参数,能够针对非对称性和峭度来讨论形状,但基本上不具有进一步的能力。因此,若不综合使用峭度、失真度、标准偏差、平均值等,则难以捕捉直方图的形状的特征而难以取得与形容词之间的对应。另外,即使使它们综合化,例如也不具有在峭度的值中区别两个能带构造和同样分布构造的能力。而且,处于能够说明的范围的形容词仅限于极小一部分。
另外,即使这些统计量从其定义来看通过标准偏差而标准化,不仅通过图像导出零附近的接近至±1的值,例如也导出峭度为+20的极端值。对颜色直方图试着进行实验验证的结果为,通过单独一个指标难以与高级形容词直接建立关联,不仅如此,与心理上的量表也相差甚远。
2)对策的方针
为了解决上述技术课题,导入全新的观点。即,尝试从物理学的观点捕捉感性,并进行力学展开,由此以数学方式简洁地记述感性。以下,使直方图这一通称广义,由于为能够从图像观测到的物理量,所以称作统计物理学上的术语中的分布函数。如下节所明示那样,分布函数所指的意思不限于直方图的范围。
为了使分布函数的形状识别多样化且定量化,导入量子力学的方法。在此,列举成为其根据的推论。
·照片的成像和感光过程的光子及电子依照量子论。
·人类的视觉系统也相同,而且脑内的神经回路也为量子现象。
作为第二个列举的内容的证据,存在感性不定的事实。即使观察相同视野的外界物或成为照片的图像,也经常存在由于时间不同而其印象也不同的情况。当综合考虑这样的事实时,只要能够对感性进行量子论的记述,就能够认为在感性与图像的特征之间产生线形对应关系。
[3]成为目标的感性的记述方式
<形容词构造的层级性>
通常,公知在脑内的形容词的认知机构中存在金字塔型的层级性。对于该事实,当要根据图像信号进行基于目录(Content-based)的形容词检索时,虽然应当进行推测的是捕捉与图像的感性相关的哪些特征量、这些特征量具有怎样的构造,但是能够理所当然地推测出与图像相关的特征量也同样呈金字塔型的层级性。
在此,对本申请人所设想的感性特征量及其层级构造进行记载。首先,作为最低维的最下位层的感性特征量,考虑照片图像的“代表色调、代表明亮度、代表彩度”这样的与颜色相关的标量要素。即,当以面积率最大的色调、明亮度或彩度代表照片时,存在带来整体为“偏红”或“绿色”图像、或整体曝光不足而为“较暗”图像这样的印象的极其低级的特征量。
认为位于上一位层的感性特征量是根据“HVC的颜色的分布构造”而记述的与颜色相关的向量要素。即,推断成,当HVC的直方图处于某固有的特征状态时唤起稍微高级的感性。符合该层级这样的形容词考虑为例如“清爽的”、“宁静的”。具备这些印象的图像作为比先前的低级印象更先引人注目的感性而强烈作用。但是,低级印象并没有消失,其性质还继续存续。认为位于再上一位层的感性特征量是与“边缘、纹理、对比度”相关的特征。目前,关于纹理,推断成以一维方式缩限的结构因子的向量要素与之对应。认为根据边缘和/或纹理的多少、和/或对比度的强弱而带来是“威严的”图像或是“粗野的”图像这样的印象。
然后,推断位于其上位层的感性特征量是“构图”即“空间分布”。其原因在于,先前所述的“颜色”和“纹理”只要从HVC各色面导出一维的信息就能够讨论,但空间分布必须从各面导出二维的信息来进行讨论。并且,认为能够从其中判别“轻松的”或“沉重的”等形容词。然后认为位于更上位层的感性特征量是普遍的审美意识这样的构造。但是,可以推断还在很大程度上受个人的感性影响。推断能够从其中判断出“美丽的”这样的形容词。
<感性中固有的特征量的记述方式:相加性>
作为上述的层级构造的特性,低层级的感性没有消失而存续,在存在更高级的感性的情况下,更高级的感性优先地作为对该图像的印象概念而留存。另外,若要有意排除高级概念而评定低层级下的特征的优劣,也可以说实际上是可行的。通过研究表明,关于具有这样的性质的特征量,只要在特征量之间具有相加性质就能够成功记述。其原因在于,相加性质具有始终允许进行高级因子的追加而能够维持此前的低级因子地进行替换的机构。
另外,通过后述的非相加性质的特征量的情况下的思考实验,证实了相加性质具有明显的优越性。即基于如下研究:在不同性质的特征量之间需要对特征量独立地进行欧几里得几何学方面的处理,在相乘性质的特征量中与相加性质不同而会产生怎样的事态。因此,作出了如下结论:作为在主轴合成中能够反映形容词的层级性的记述方式,必须使感性特征量具有相加性质。
当在相加性的感性特征量之间进行线性结合时,若进行将重点置于最高级特征量因子的特征量的相加,则在某种程度上也反映低级因子的平衡,并且通过形容词再现最上位概念的语言最主导地引导人类的感情机构。为此,必须生成即使感性主轴不同也具有完全同质的相加性的感性特征量。换言之,必须以具有相加性的同维的物理量记述感性特征量。其为必须在感性主轴内和主轴间同等满足的条件。
<感性的线性模型>
以如下方式定义从分布函数f读取的高级感性特征量。即,对于类别及层级不同的各个分布函数,存在多个即使分布函数发生变化也在同一感性的图像组之间共同地显现的分布函数的形状特征。使序号i取i=1,2,…的值。
颜色直方图分布…Fi
纹理PDF分布…Gi
像素值的空间分布…Hi
假设使感性的线性模型成立为下式那样。
形容词=α1F1+α2F2+…
+β1G1+β2G2+…
+γ1H1 +γ2H2 +…
在以下及实施方式中,具体地针对Fi和Gi说明具有这样的相加性质的特征量的构筑方法。在后述的实施方式中定义的感性不变量中,在色调、明亮度和彩度中分别生成同种的不变量,并在它们之间取算术平均,由此产生更稳定的实验结果,从该事实也证实相加性质顺利地发挥作用。
<与非相加的其他方式的比较>
1)特征向量的基于欧几里得距离的表达
在以往的相似图像检索技术中,单独处理颜色、纹理、形状,并在各自的特征量空间中进行相似度的距离比较。例如,以文献2的方法为例。各轴的特征量在轴间定义了形式完全不同的特征量。虽然没有明确记载合成主轴的方法,但在同时使用颜色、纹理和形状的特征量来进行相似图像检索的情况下,一般使三个主轴的全部特征量为一个向量,测定特征量空间中的欧几里得距离,从而进行对颜色、纹理和形状都尽可能接近的图像的检索。
当使用这样的欧几里得距离时,分类指标具有如下性质。例如关于颜色在某特征量中不具有相似性。此时,即使关于纹理和/或形状具有相似性,若不具有相似性的特征量发挥作用而导致在欧几里得距离中位于一度远离的距离,则也已经无法进一步接近。即,在特征量之间不存在优劣关系而全部同等地处理。由此,高级特征量无法覆盖低级特征量的结果。因此,该性质与形容词的层级性不相容。
2)基于相乘特征量的表达
使各个特征量以暂且具有相乘性质的方式被表示。这种情况下,分类指标具有如下性质。某特征量极其相似,特征量的模型和检索对象图像的值一致。该特征量的相似度的差为零,即使在其他特征量中完全不具有相似性,几何平均的结果也为零,从而最终极其相似。即,只要有一个具有相乘性质的特征量一致,则其他判断全部不发挥作用。在一个特征量突出的意义中,虽然具有基于高级因子的替换性质,但在其他低级特征不再发挥作用方面与形容词的性质不一致。也就是说,不为推翻仅通过低级的平均颜色而判断的例如“绿色的图像”这一判断的种类的特征量,该性质无论多么低级也继续存续。
[4]分布函数的量子力学的记述
<希尔伯特空间表达>
通过满足线性微分方程式的基底函数对分布函数进行级数展开。但是,这些基底函数系彼此正交,在能够完全再现原分布函数的意义上具有完全性。若以算式表示则如下所示。
分布函数的级数展开
[算式1]
基底函数的正交性
[算式2]
∫ψi(x)ψk(x)w(x)dx=δik
在此,说明成为它们的基础的观点。为了使从分布函数读取的感性特征量满足相加性质,首先必须使分布函数的构成要素满足线性微分方程式。该线性微分方程式相当于其构成要素所满足的运动方程式。以下假说成立:该运动方程式越接近在力学或电磁学、量子力学的世界中大量物理现象所满足的微分方程式,则越接近在脑内产生的物理现象。
为了与人的认知过程尽可能地接近,必须根据分布函数的特征选定最佳基底函数,由此确定用于规定正交性的加权函数。通过积分而具有正交性的函数通常称作特殊函数,其大多由作为线性微分方程式的超几何微分方程式或合流超几何微分方程式规定。另外,为了能够进行级数展开,必须在能够等价表达原函数的意义上具有完全性。由于建立这样的正交系的特殊函数不一定具有完全性,所以同时具有加权函数的选定条件和完全性这两项的特殊函数成为有限的选择。选择的第1基准为,对基底函数组是否与作为当前对象的分布函数的形状相似的判断和区间域的匹配性。
二阶齐次微分方程式
P(y)=y″+p(x)y′+q(x)y=0
的解y对于任意常数C具有线形性
P(Cy)=CP(y),P(C1y1+C2y2)=C1P(y1)+C2P(y2)。
因此,在以该形式的线性微分方程式表示的运动方程式中,由于叠加原理成立,所以以级数展开表示通解。
超几何微分方程式和合流超几何微分方程式均以上述形式的二阶线性微分方程式表示,超几何微分方程式在x=0,1,∞时具有正则奇点,合流超几何微分方程式在x=0时具有正则奇点且在x=∞时具有非正则奇点。记载各个方程式(参照文献B2)。
超几何微分方程式
x(1-x)y″(x)+[c-(a+b+1)x]y′(x)-aby(x)=0
合流超几何微分方程式
x y″(x)+[c-x]y′(x)-ay(x)=0
通过具有正交性和完全性的函数系对状态函数所满足的运动方程式的解进行级数展开的记述方式相当于与基于希尔伯特空间的表达相同。在量子力学中,通过希尔伯特空间表达,运动方程式的记述向矩阵形式转换。因此,在希尔伯特空间的构筑中,需要基于具有完全正交性的特殊函数进行的展开(参照文献B1)。
在以力学方式记述感性之后,考虑使构成分布函数的基底函数作为运动方程式而至少满足以下选定的微分方程式、即将感性的一个方面方程式化的微分方程式。即,考虑在颜色的分布函数的投影面中满足超几何微分方程式,在纹理的分布函数的投影面中满足合流超几何微分方程式。这些线性微分方程式为微分方程式的形式的总称,位于不同形式。对此,通过导入参数的设置方法和/或变量转换,能够导出大量所包含的形式的微分方程式。例如,作为超几何微分方程式的解的超几何函数将切比雪夫函数、勒让德函数等作为参数的特殊情况而处理。另外,作为合流超几何微分方程式的解的合流超几何函数将贝塞尔函数、变形贝塞尔函数、埃尔米特函数、拉盖尔函数等作为特殊情况而导出。而且,通过贝塞尔的微分方程式的变量转换,导出球贝塞尔函数、球变形贝塞尔函数(参照文献B2)。
实际上,对于颜色的一维分布函数适于使用切比雪夫函数,对于纹理的一维分布函数适于使用球贝塞尔函数。因此,若在脑内存在感性的微分方程式则满足线性微分方程式,从在其中之一的颜色的投影面上记述切比雪夫函数的超几何函数的方面、和从在另一个的边缘及纹理的投影面上记述球贝塞尔函数的合流超几何函数的方面,能够认为相当于在两个不同的投影面上进行记述。另外,各个分布函数所要满足的微分方程式的基底函数起到通过希尔伯特空间来模拟规定脑这样的波动型信号处理系统的坐标的作用。
[文献B1]希夫《量子力学》(第3版,1970),第6章“量子力学的矩阵形式”
[文献B2]乔治·阿夫肯(George Arfken)基础物理数学第3卷“特殊函数和积分方程式”(第2版,1970;日语译1978),第1章“贝塞尔函数”及第3章“特殊函数”
<各分布函数的希尔伯特空间表达>
1)颜色直方图的情况
基底函数
[算式3]
ψn(x)=Tn(x)
正交性的加权函数
[算式4]
在此,切比雪夫多项式能够以解析方式记述。取n=0,1,2,…的值。
[算式5]
Tn(x)=cos(ncos-1x)
T0(x)=1
T1(x)=x
T2(x)=2x2-1
T3(x)=4x3-3x
T4(x)=8x4-8x2+1
…
Tn+1(x)=2xTn(x)-Tn-1(x),n≥1
在此,图1示出切比雪夫多项式Tn(x)中的T1(x)、T2(x)、T3(x)的曲线图。
以下提供包含标准化条件在内的准确的正交性的关系式。
[算式6]
关于切比雪夫函数的正交性,将密度极高的重点置于分布函数的上升部和下降部。即,在处理直方图那样在有限区间急速地产生事件且该事件急速地结束这样的性质的函数系的情况下,作为该函数的形状,上升部和下降部承担非常重要的性质,表示除非将上升部和下降部准确地记述否则无法在真正意义上顺利地近似。
2)纹理PDF的情况
当球贝塞尔函数取出一个次数时,根据存在于[0,a]的区间的根的数量,从低频比例缩放至高频的函数组关于根呈正交性并形成完整系(complete system)。由于在原点具有峰值的函数为零次函数,所以基于零次函数的根进行一重级数展开。此时,必须在峰值的右区间和左区间分别展开纹理PDF的分布函数。
2-1)一重级数展开的情况
基底函数
[算式7]
在此,图2示出n=1~5的曲线图。
正交性的加权函数
[算式8]
w(x)=x2
在此能够以解析方式记述球贝塞尔函数。
[算式9]
αnk表示n次函数的根的值,取k=1,2,…的值。
[算式10]
jn(αnk)=0
在此,图3示出球贝塞尔函数的j0(x)、j1(x)、j2(x)的曲线图。
以下提供包含标准化条件的与准确的根相关的正交性的关系式。
[算式11]
在球贝塞尔函数为零次函数的情况下,由于为在原点具有最大强度的函数,所以对在原点具有最大频数的分布函数进行近似时,始终去除原点的加权而重视底部斜面的形状。
另外,各种贝塞尔函数为适于记述从原点向周边扩散光或波、或者在原点具有光源那样的奇点的情况的函数。球贝塞尔函数适于记述球面坐标系中的矢径成分(radial component)的波动,与圆柱坐标系的贝塞尔函数相比随着远离原点而其强度更迅速下降。目前,要处理的边缘图像的一维分布函数从其急剧的强度下降的速度来说与球贝塞尔函数的性质接近。其原因在于,即使考虑了透过透镜来拍摄照片的聚光过程,从半球面射入的光为球面波,其矢径成分以球贝塞尔函数记述,尤其找不到应为圆柱坐标的各向异性的理由。
当使用零次函数时,球贝塞尔函数始终在原点具有峰值,因此,对于评估如边缘图像的直方图那样始终在原点显现峰值的性质的分布函数的形状,除去原点的加权而将焦点聚于底部斜面的性质的方法为极其合适的方法。由此,起到创建在与事件的本质之间生成线形关系的基础的作用。
2-2)二重级数展开的情况
球贝塞尔函数由于通常为记述矢径方向的运动的函数,所以一般以正区域定义,但通过放大定义至负区域,在次数不同的函数之间也能够显现正交性。其原因在于在球贝塞尔函数中具有如下性质:偶数次为偶函数,奇数次为奇函数。
[算式12]
jn(x)=(-1)njn(-x)
在此,图4示出放大定义至负区域的球贝塞尔函数j0(x)~j5(x)的曲线图。
与球贝塞尔函数的次数相关的正交性
[算式13]
若同时考虑与次数相关的正交性和与根相关的正交性,则能够同时对分布函数的正区域和负区域进行展开。关于根展开由于始终具有完全性,所以展开成次数和根的二重级数。目前,由于只要具有一个提取非对称性成分的奇函数即可,所以可以为使用零阶的偶函数和一阶的奇函数这两个函数的根展开。
[算式14]
[5]展开系数与力学的对应关系
<提出问题>
展开系数表示在分布函数中,具有与基底函数对应的波形及振动数的成分较多。在此,存在“展开系数ci自身是否符合感性特征量”的问题。
<实际数据中的展开系数的倾向>
实际上,对分布函数进行展开而得到的系数ci的值容易被各个分布函数的绝对形状直接影响。因此,作为值,基于图像的变动极大。关于赋予了相同形容词的图像彼此的分布函数,若试着直接比较展开系数则发现少许的相关倾向,但更多的是离散的倾向较强。即使暂时进行在赋予了相同形容词的图像彼此之间取展开系数的统计平均的学习,并想要做出使该展开系数为与该形容词对应的模型,也存在导致大部分的展开系数消失于零、或其他形容词也收敛于没有共同意义的常数的倾向。
<构筑与力学的对应关系>
在此建立以下那样使力学和图像系统对应的假说。
力学系统:
“存在即使各个粒子的运动状态(动量pi)发生变化也会对运动系统整体建立特征的守恒量(能量E)。”
图像系统:
“应当存在即使各图像的像素值分布(状态成分ci)发生变化也会对图像整体的感性建立特征的不变量(I)。”
[算式15]
该假说作为模型而包含如下机理:当人感知到图像的信号分布、或外界的映入视野的像时,在此处感觉到某种感性的“场”的能量那样的能量,与这种场能量对应的脑内的神经状态瞬时被激发而想出形容词。
展开系数的二次形式的和表示即使分布函数发生各种变化,也能够提取出在想出同一感性的图像组的分布函数之间共同具有的特征。关于取该和的操作,由于放宽对各个要素的严格相似性的要求并汇集总体上相似的特征组,所以导出用于对照形状模糊相似的特征的功能。
<关于二次形式和加法性>
在归结至感性不变量必须取二次形式的结论的理由中,与理论物理学中的从基于最小作用原理的作用函数导出运动方程式的导出过程和哈密顿算子的构筑过程的理论背景关系密切。其原因在于,即,当假设感性场的运动方程式的一个方面满足线性微分方程式时,在作为其作用函数的被积分函数的拉格朗日算子中要求对感性场实现二次表达式。其原因在于,运动方程式根据变分原理通过使作用积分的一阶全微分与零相等而导出,此时通过将次数降低一次来确保叠加原理(参照文献A1)。而且,作为运动方程式的第1积分的力学不变量称作运动积分,在运动期间保持固定值。在感性的情况下,认为其对应于即使图像的信号分布发生变化也继续带来同一感性。
在运动积分中存在能量、动量和角动量,它们全部具有加法性这一重要性质,但通过力学而明确(参照文献A2)。另外,以感性为问题的图像的信号分布将由10的6次幂至8次幂的数量级的像素数组成的图像和由它们的几百幅、几千幅的图像组所组成的统计总体作为对象,因此需要使用统计物理学。
根据统计物理学,在相加性的运动积分中导出如下结论:在统计平均后确定系统整体的统计性质、即系统的统计分布的仅为能量。动量和角动量仅简单地归为系统整体的一致的平移运动和一致的旋转运动,无助于系统的记述(参照文献A3)。该情况与如下事实相符合:当为了记述感性而使从分布函数导出的与动量对应的展开系数ci在同一感性的图像组之间进行统计平均时存在收敛于没有意义的常数的倾向。
与上述同样地总结分布函数f与力学不变量、即具有能量维的二次形式的物理量的对应关系,
在此,由于从作为观测量的分布函数导出感性不变量,所以与力学系统为相反的表达式。另外,二次形式的感性不变量通过如下节所说明那样进行扩展定义来处理各种感性。
于是,全部感性不变量具有加法性而满足感性的线性模型的相加性的条件,从而能够在共同条件下处理颜色、纹理和构图。即,感性主轴的不同特征量全部以相加方式处理。此外,从构图导出的感性不变量也根据相同的方针通过相同的要领而构筑。
此外,其原因在于,在如上述那样归结为需要使感性不变量为二次形式的过程中,在经过了实验上的试行错误之后,才判断出上述的理论背景是固有的。即,基于如下内容:实验上,虽然建立了展开系数的绝对值和/或比等能够考虑到的多个指标来进行尝试,也无法得到在与感性之间与感觉完全一致那样的图像的排列而反复多次失败,通过二次形式的和的表达式才第一次得到与感性的匹配性较高的排列。
[文献A1]朗道=栗弗席兹理论物理学教程第2卷“场的古典论”(原书第6版,1973年),第4章“场的方程式”,第27节“电磁场的作用函数”
[文献A2]朗道=栗弗席兹理论物理学教程第1卷“力学”(增订第3版,1973年),第1章“运动方程式”和第2章“守恒定律”
[文献A3]朗道=栗弗席兹理论物理学教程第5卷“统计物理学第1部”(第3版,1976年),第1章“统计的基础原理”,第4节“能量的作用”
[6]感性不变量的二次形式表达
<两个基底状态的合成>
为了生成二次形式的感性不变量,返回到分布函数的形状识别的视点,通过两个基底状态ψi,ψk的合成系统来提取分布函数f的形状。通常,任意的函数f(α)以基于n个基底函数的展开进行表示。
f(α)=c1 (α)ψ1 (α)+c2 (α)ψ2 (α)+…+cn (α)ψn (α)
根据群论,以合成系统的直积表示的n*n个的基底状态ψiψk能够简化表达,并能够分割成以n(n+1)/2个的对称积、和n(n-1)/2个的反对称积表示的两个基底状态(参照文献A4)。
[算式16]
对称积
反对称积
当使用相同基底函数对色调面(H)、明亮度面(V)和彩度面(C)的各自的分布函数进行级数展开时,同一色面内的分布函数的形状特征能够通过对称积的基底函数所生成的波形的展开成分来测量,色面间的分布函数的形状特征能够通过对称积的基底函数所生成的波形的展开成分来测量,并且也能够通过反对称积的基底函数所生成的波形的展开成分来测量。由于保证了这些合成系统的基于波形的展开成分的合成前的基底状态相互正交,所以合成系统的基于基底状态的展开系数能够表达为呈对称积和反对称积的形式的矩阵要素。
通过使感性不变量为矩阵的迹(Spur)而进行定义。但是,通常迹仅指对角要素的和,在此定义取行和列的位置仅保持固定量子数的差的非对角成分彼此的倾斜方向之和的、新的扩展型的迹。由此,能够在可建立的全部合成波形的范围内取总和的状态下检测出基于保持固定量子数的差的两个基底状态的合成波形的成分在分布函数中存在多大比例。在色面不同的两个分布函数之间,固定量子数不同的基底状态的组合存在多大比例,通过其组合的对称状态和反对称状态者两种合成波形来评估。
[算式17]
在此,在将ci取为颜色直方图的切比雪夫展开系数的情况下,Ii=Fi,在将ci取为纹理PDF的球贝塞尔展开系数的情况下,Ii=Gi。但是,序号i没有对称、反对称的区别,按顺序分配于求出的多个不变量的要素。
在此,试着将上述定义的感性不变量与电磁场中的场的不变量进行比较。根据文献A5,作为相对于电场E与磁场H的洛伦兹变换的不变量,存在真实标量和模拟标量这两种标量。
[算式18]
FikFik=H2-E2=inv.
两者均通过四维的电磁场张量Fik的二次形式的迹而求出,后者中附带完全反对称的单位张量eiklm,前者中没有附带单位张量eiklm。但是,与张量相关的和的符号根据爱因斯坦规约而省略。
因此,即使从一幅图像转移到其他图像,带来同一感性的感性不变量也成为与从电磁场中的一个基准系转换成其他基准系时的场的不变量极其相似的构造。在上节中,使感性不变量与动能对应而进行了讨论,但反而是存在不限于两种的多种“感性场”、且场的能量传递而来这种观点比较自然。另外,电磁场的构成要素为时间和空间这四维,但推测在感性的构成要素中至少存在记述分布函数所需要的次数以上的要素。但是,自然的观点为,人脑的神经回路在成长过程的学习中,相对于这些感性场构筑由场激发的电信号回路,或者获取在能量方面瞬时激发的神经回路的能级。
[文献A4]Landau and Lifshitz,Course of Theoretical Physics,Volume3″Quantum Mechanics(Non-Relativistic Theory),″(Thirdrevised edition,1977),Chapter12″The Theory of Symmetry,″Section94″Representations of groups.″
[文献A5]朗道=栗弗席兹理论物理学教程第2卷“场的古典论”(原书第6版,1973年),第3章“场中的电荷”、第23节“电磁场张量”、第24节“洛伦兹变换”、以及第25节“场的不变量”
[第1实施方式]
(颜色直方图的希尔伯特空间表达和感性不变量的线性和)
以下,参照附图进行第1实施方式的图像分类装置的说明。图5是表示实施方式的图像分类装置的框图。在此,图像分类装置通过个人计算机10而实现。个人计算机10与数码相机或其他计算机连接,从数码相机或其他计算机接受图像数据的提供,或者从安装于存储卡插槽的存储卡接受图像数据的提供,并向硬盘装置(未图示)存储。个人计算机10对所存储的图像数据进行以下说明的图像分类处理。
图像分类程序相对于个人计算机10的加载可以从存储有程序的CD-ROM等存储介质进行,也可以经由网络12等进行。在经由网络12的情况下,加载从与服务器14连接的硬盘装置16读取的程序。个人计算机10由CPU及被CPU控制的周边电路构成,CPU根据所安装的程序进行图6的流程图所示的图像分类处理。
<对检索对象图像的处理>
1.向孟塞尔HVC颜色空间的转换(图6步骤S1)
将输入图像向人类可感知的均等色性高的孟塞尔颜色空间转换。孟塞尔颜色空间是以色调H在一周以100度分割、明亮度V分布于0~10的等级、彩度C分布于0~25左右的等级的方式刻画而成的颜色空间,是以满足C的色差2相对于V的色差1作为同等色差而感知的等差率性的方式设计的颜色空间。其中将C的值为1以下的区域、和V的值为0.5以下及9.5以上的区域定义为N(中性色调)。从以RGB空间表示的颜色空间向HVC颜色空间的转换能够经由向XYZ空间的转换而近似地进行算式转换。其利用均等颜色空间之一的L*a*b*或L*C*H*的定义并通过导入修正其均等色性的不充分之处的算式而实现。
在输入图像例如为以与输出伽马特性相关的sRGB颜色空间表示的图像的情况下,首先,在返回线形灰度后,根据sRGB标准向XYZ空间进行转换。
[算式19]
1-1.向线性灰度RGB的转换
1-2.向XYZ空间的转换
1-3.向M1、M2、M3空间的转换
M1=H1
M2=0.4*H2
M3=0.23*H3
1-4.向HVC空间的转换
H=arctan(S2/S1)
在第1实施方式中,色调面用于准备进行了N(中性)的分离的面。
2.建立颜色的一维分布函数(图6步骤S2)
建立HVC面的各自的直方图。关于直方图的直方柱数,可以将H,V,C一共设定成200左右。此时,色调面使用进行了N的分离的面。因此,即使在色调环中进行积分H面的直方图也不包含分类于N的面积率。通常N在色调环中随机分布,因此从色调面的直方图排除杂乱普通的偏斜状的分布,留存原本的有彩色的直方图形状。若为了便于说明而通过像素数将直方图的值标准化,则成为表示像素值的概率密度的一维分布函数。以如下方式表示示意地建立的分布函数。
f(H),f(V),f(C)
3.分布函数的希尔伯特空间表达(图6步骤S3)
3-1.变量转换
当使直方图的横轴的分布区域为[a,b],使纵轴的分布区域为[fa,fb]时,在将横轴收敛于[-1,1]、将纵轴收敛于[-1,1]的区间中进行变量转换。仅在该节中为了便于说明,当将横轴的变量从x向y转换而记载、将纵轴的变量从fx向fy转换而记载时,转换式如以下所示。
横轴的变量转换:y={x-(b+a)/2}/{(b-a)/2}
纵轴的变量转换:fy={fx-(fb+fa)/2}/{(fb-fa)/2}
色调面的直方图的分布区域由于是色调环所以设有起始的断点,设定从该断点环绕一周而返回同一点的分布区域。起始点a不为固定点,按各个图像寻找分布函数的密度最小的点,并在该处植入断点。
根据纵轴的变量转换的定义方法,对以下所示的级数展开系数增加某常数因素。这相当于,当认为如在概论说明中进行的那样展开系数与动量相当时,通过图像组的统计平均而残留的该常数因子根据图像组系统整体的希尔伯特空间坐标系的选择方法而成为系统整体一致的平移运动并留存。
3-2.基于切比雪夫多项式的级数展开
使进行上述变量转换而得到的横轴的分布区域与H,V,C无关而以x表示。通过N个次数的切比雪夫函数对HVC的各分布函数进行展开。
[算式20]
利用基底函数的正交性通过以下算式求出展开系数cn。
[算式21]
其中,在n=0时特殊地使c0=c0/2。
在此导入变量转换。
[算式22]
由此,以如下方式简单地求出展开系数。
[算式23]
当颜色直方图的直方柱的数量为200左右时,可以将展开的次数设定成N=50左右。
4.生成感性不变量(图6步骤S4)
根据两个切比雪夫基底函数的合成系统,提取H,V,C直方图的分布函数的形状。即,将通过HVC的分布函数采取的构造而显现的感性提取为特征量。
对于通过展开系数的二次形式而生成的矩阵要素,通过具有固定量子数的差的矩阵要素的迹来定义感性不变量。在量子数差m为对称状态的情况下,能够定义至m=0,1,2,…,N/2,在量子数差m为反对称状态的情况下,能够定义至m=1,2,…,N/2-1。示出量子数的差定义至0,1,2的生成例。在此,除一个例外以外,以不变量的值全部收敛于[-1,1]的方式进行标准化而定义。另外,在和的范围超出k=0,1,…,N-1的范围的情况下,处理成在k=N-1之后使k=0环状地相连。
基于相同色面内的基底函数的合成系统而进行的评估
[算式24]
基于不同色面间的基底函数的合成系统而进行的评估
[算式25]
标注正号的不变量示出在图像的分布函数中占据的、基于合成系统的对称状态的波形的带有符号的存在比例,标注负号的不变量示出在图像的分布函数中占据的、基于合成系统的反对称状态的波形的带有符号的存在比例。
若不变量的值接近于零则表示该合成波形的成分完全不存在,若接近于+1则表示保持该合成波形的形态的成分存在较多,若接近于-1则表示使合成波形的符号取反而成的波形的成分存在较多。作为例子,示出取Fm=2(α)(α)+的迹的对象的一个成分、即对称状态的合成波T1T3和T2T4的波形图(参照图7)。
当在其他色面间量子数差与零不同的感性不变量表示有意义的值时,可以说某色面的分布函数与其他色面的分布函数始终伴随着某些特有的形状差。与其相反,当在其他色面间量子数差为零的感性不变量表示有意义的值时,可以说两个色面的分布函数的形状极其相似。
仅Fm=0(α)(α)+无法标准化。由于将分布函数的值的区间变量转换成[-1,1],所以实际值取接近于零的值或从0.4左右至大约1.5左右的值。该值所表示的内容为,值越大,则在分布函数中高度集中于基底状态而表达的比例越高,值越小,则分散于各种基底状态而表达的比例越高。关于Fm≠0(α)(α)+也是同样地,意味着表示值的绝对值越大,则在合成系统的基底状态中向某一合成波形的高度集中度越高,值的绝对值越小,则分散于合成系统的多个基底状态而表达,或以该合成系统的基底状态表示的波形成分几乎不存在。
对称状态和反对称状态相互处于共轭关系。关于相同量子数差的对称积和反对称积的感性不变量,当试着调整与该不变量相关的图像组的排列度时,在对称积中值集中于零附近而不明确具有怎样感性的图像组在反对称积中显现于该指标的分布中的两端部。另外,其反过来也成立,在反对称积的指标中不明确的图像组在对称积的指标中显现于图像分布的两端部。若通过算式以如下方式考虑,则该事实为理所当然的结果。即,由于在对称积的值为零时ci (α)ck (β)=-ck (α)ci (β),所以反对称积的值为ci (α)ck (β)-ck (α)ci (β)=2ci (α)ck (β)=-2ck (α)ci (β),对±任一方均容易取最大值。
5.建立形容词判断指标(图6步骤S5)
5-1.感性不变量的线性结合
作为用于检索某感性形容词(i)的指标,利用感性不变量的加法性的性质,建立对各个感性不变量进行线性结合而得到的新的指标Qi。指标Qi能够表示的形容词不仅是一个形容词,而是具有完全相反性质的形容词的一对形容词。
Qi=α1F1+α2F2+…
在此,以使Qi再次成为[-1,1]范围的指标的方式将线性结合参数αi的值标准化。
5-2.检索对象形容词的参数设定
事先学习与规定形容词对应的线性结合参数,设定该模型、参数。
6.图像分类处理(图6步骤S6)
根据形容词判断指标,对图像进行分类。相对于输入的图像数据库组,对各个图像计算形容词判断指标Qi,并按Qi的值的大小顺序重新排序。由于图像组的频数分布相对于判断指标Qi呈高斯分布或泊松分布那样的形状,因此以在两端比其他图像组更有统计方面意义的等级提示相对于该形容词判断指标表示特异性的图像。
以具体例示出实际提取带来怎样感性的图像。最简单的线性结合仅针对一个感性不变量而系数参数有限,其他是全部为零的情况。仅示出这些各个性质。留存多个系数参数时的确定方法在后述的模型学习栏中说明。
实际上这样地向容易记述物理现象的希尔伯特空间投影,而且对图像的信号分布的变化不变地持续作用,根据具有相加性质的二次形式的感性不变量,能够在实验上确认表示与在色彩心理学上具有普遍性的高级形容词对(参照文献C1)之间存在极为深刻的关联性和线形性的情况。为了表示该深刻的关联性,以下记载能够从各个感性不变量排列的形容词对的术语的例子。
另外,在通过相同类型的感性不变量改变量子数差的值的感性不变量彼此之间,在实验上确认了感性轴逐渐转换的情况。其为与形容词的两面性的性质非常相符的记述方法。即,在形容词中,相对于例如“热闹的”这一大分类,存在“华丽的”、“艳丽的”、“吵闹的”等精细分类的同级表达性,该精细的分类能力对于感性检索也是不可欠缺的。
在矩阵要素的非对角成分相对于对角成分的可取值、即与±1相比相对减小时,可以认为有效的量子数差的范围已经不具有存在意义的感性分类能力。即,当作为矩阵要素的迹的感性不变量的值的分布范围较大时,能够得到与感性的对应性较高的排列,但当其分布范围减小时就已经无法预见对应关系。其在实验上也得以确认。
[文献C1]日本色彩学会编,颜色科学讲座第1卷“色彩科学”(朝仓书店,2004年),第3章“色彩的心理学”,第3.2节“感觉·感知·认知的测定法”,表3.4“色彩的印象测定中经常使用的形容词对”及第3.4节“色彩的认知”,表3.13「日美学生对颜色的因子分析的比较」
以下示出具体例。
[算式26]
Fm=0 (α)(α)+ (α)(α)=HH⊕ VV⊕ CC 「静态-动态」
其为在三个色面的每一个中生成的感性不变量的算术平均。根据该感性不变量而排列“静态-动态”这一形容词对的感性图像。在“静态”图像中集中有在远景的风景照中时间刹那停止那样的图像。在另一方的“动态”图像中集中有在节日中许多人在跳舞的照片或城市喧嚣迎面扑来的照片。
图8示出位于图像分布的两端附近的图像的HVC面的颜色直方图形状的例子。“静态”图像的颜色直方图的H,V,C面均呈集中于一个基底函数的状态成分的一个能带构造那样的形状而集中,与之相对,在“动态”图像中,H,V,C面的每一个中具有大量的复杂的峰值形状,为不太可能以简单波形记述的直方图构造而分散。
[算式27]
Fm=0 (α)(β)+ (α)(β)=VC 「严肃的-开朗的」
根据该感性不变量而排列“严肃的-开朗的”这一形容词对的感性图像。在“严肃的”图像中集中有具有较多阴影的图像。在另一方的“开朗的”图像中大量集中有整体上具有少许明亮度和空间广度的图像。
图9示出位于图像分布的两端附近位的图像的HVC面的颜色直方图形状的例子。“严肃的”图像的颜色直方图在VC间形状的相似性极高。另一方的“开朗的”图像的颜色直方图在V面和C面上呈完全不同的形状。
[算式28]
Fm=0 (α)(β)- (α)(β)=VC 「兴奋地-沉静的」
根据该感性不变量而排列“兴奋的-沉静的”这一形容词对的感性图像。该形容词对发挥与从对称积导出的“严肃的-开朗的”的形容词对处于共轭关系的作用。在“兴奋的”图像中大量集中有由颜色艳丽的银杏和枫树的枝叶组成的红叶的照片、风景照的捕捉到傍晚的刹那的粉色光辉的照片、捕捉到云层滚滚那样的刹那动作的照片。在另一方的“沉静的”图像中集中有捕捉到动作完全静止的瞬间、并且兼具深色的照片。
<感性形容词的模型学习>
感性不变量的值是根据图像的分布函数的观测量而唯一确定的。对于通过事先学习来获取与形容词的对应关系,需要对各个形容词确定线性结合参数。
1)最小二乘法
一人或多人对某形容词从学习数据用的图像组中选择具有该形容词的印象的图像。导入测量其再现性的平方误差的函数,使线性结合参数为未知,以对各个参数进行偏微分而逐渐求出极小点的形式确定各个结合参数。其为基于最小二乘法的系数拟合。
2)根据图像分布的色域(gamut)中的位置关系的确定
在根据某图像的分布函数生成多个感性不变量时,该图像在对图像数据库组的全部图像求出的感性不变量中占据哪个位置,表明该图像产生的感性的自身性质。即,能够将图像组的分布端相对于各个感性不变量的边界线,看作自然图像的信号分布的可取色域。可以认为位于该色域端的图像对于其不变量产生极其重要的信号,位于正中的图像可以说对于其不变量为无关性质。因此,只要将该色域内的该图像所存在的位置直接作为线性结合参数的值来设定[-1,1]的范围的数值即可。但是,最后进行全部线性结合参数之间的标准化。
当如上述那样对一个形容词选择学习用的多幅图像时,对于所选择的图像组,只要在各个感性不变量的色域内将简单地进行了统计平均而得到的坐标位置作为相对于该形容词的线性结合参数的学习结果即可。如果对某感性不变量所选择的图像组零乱地分布时,通过统计平均使参数αi的值接近于零,对于该形容词而言该感性不变量无关。与其相反地,在所选择的图像组中集中于相同方向的情况下,即使进行统计平均也会在参数αi中留存有意义的值,该感性不变量对于该形容词是重要的。由此,能够极其简单地导出对某形容词起到特殊作用的感性不变量。此外,上述的模型学习的方法能够在以下说明的全部实施方式中共同使用。
[第2实施方式]
(纹理PDF的希尔伯特空间表达和感性不变量的线性和)
接下来,说明第2实施方式的感性不变量的生成。此外,在第2实施方式中,将第1实施方式中的感性不变量的生成方法改变为以下方法。
<对检索对象图像的处理>
1.向孟塞尔HVC颜色空间的转换
准备色调面没有进行N的分离的面。N区域的色调面在色调面内如随机噪声那样动作,但在以下的边缘提取过程中,其起到作为与其他有彩色的色调不同的特征而被检测的作用。
色调环中的一维坐标的采取方法可以以孟塞尔色调环的原点即红色为起点环绕一周经由终点即紫红再次返回到红色,但更优选的是可以与第1实施方式同样地在各个图像中在色调的分布频数最小的点处切入并在该处设定起点和终点。其原因在于,这样,由于色调环的分断而信号强度在两端摆动,能够将在该色面内提取边缘时的由于边缘成分的过大评估而导致的不良影响抑制在最小限度。
2.生成边缘图像
2-1.多重析像度变换和边缘提取
1)小波变换
使用小波变换向进行多重析像度表达的频率空间投影,提取HVC各色面的高频的边缘成分。在此作为边缘成分,直接使用进行小波分解而得到的高频子带LH,HL,HH。若示意地记载该状况,当分解至析像度M级时,成为
[算式29]
此外,LL成分依次分解成析像度较低的高频子带,所以最终留存的LL成分仅为最低析像度。作为小波变换,使用例如如下的5/3滤波等。
<小波变换:分析/分解(Analysis/Decomposition)程序>
高通成分:d[n]=x[2n+1]-(x[2n+2]+x[2n])/2
低通成分:s[n]=x[2n]+(d[n]+d[n-1])/4
对上述定义的一维小波变换沿横向和纵向独立地进行二维分离型滤波处理,由此进行小波分解。将系数s集中于L面,将系数d集中于H面。
2)拉普拉斯金字塔
而且作为多重析像度变换的其他方法,除小波变换以外还存在使用拉普拉斯金字塔的方法。在建立拉普拉斯金字塔的情况下,暂且生成纵横(1/2)*(1/2)的缩小图像并通过双线性变倍而恢复到原大小的图像,取与缩小前的图像的差分,由此得到该析像度的高频图像(拉普拉斯成分)。此外,也可以在生成缩小图像之前进行用于防止混淆现象的平滑化。若不断重复该处理,则能够实现使高频图像相连的拉普拉斯金字塔。与小波变换的情况相同,在最低析像度中仅留存一个低频图像(高斯成分)。
在文献D1中记载有像这样通过多重析像度变换而生成的高频能带的信号值的直方图(称作概率密度函数,省略为PDF)进行高斯分布和拉普拉斯分布的情况。通常,PDF的分布形状能够通过对称的广义高斯(Generalized Gaussian)而近似。
多重析像度变换的级数M的值可以分解至具有不会使各能带的PDF的直方图变得粗糙程度的像素数。例如,对于Quad VGA尺寸(1280×960)的图像可以为五级左右,对于QVGA尺寸(320×240)的图像可以为三级左右,对于2000万像素的图像可以为七级左右。
此外,图10是表示基于四级小波变换的子带分割的状况的图。例如,在第一级小波变换中,对于实际空间的图像数据,首先沿横向对全部的行提取高通成分及低通成分的数据。其结果为,沿横向提取出二分之一的图像数量的高通成分及低通成分的数据。将这些数据例如,将高通成分存储到具有实际空间的图像数据的存储区域右侧,将低通成分存储到左侧。
接下来,对于存储于存储区域右侧的高通成分及存储于左侧的低通成分的数据,分别沿纵向对全部的列提取高通成分及低通成分的数据。其结果为,分别从存储区域右侧的高通成分及左侧的低通成分中进一步提取出高通成分及低通成分的数据。将这些数据例如,将高通成分存储到具有各个数据的存储区域下侧,将低通成分存储到上侧。
其结果为,使从沿横向提取为高通成分的数据中沿纵向作为高通成分而提取出的数据表示为HH,使从沿横向提取为高通成分的数据中沿纵向作为低通成分而提取出的数据表示为HL,使从沿横向提取为低通成分的数据中沿纵向作为高通成分而提取出的数据表示为LH,使从沿横向提取为低通成分的数据中沿纵向作为低通成分而提取出的数据表示为LL。但是,由于纵向和横向是独立的,所以即使调换提取顺序也是等效的。
接下来,在第二级小波变换中,对于在第一级小波变换中从沿横向提取为低通成分的数据沿纵向作为低通成分而提取出的数据LL,同样地进行高通成分及低通成分的提取。当将该处理重复进行至四级时,成为图10那样。
[文献D1]Michael J.Gormish,″Source coding with channel,distortion,and complexity constraints,″Doctor thesis,Stanford Univ.,March1994,Chapter5:″Quantization and Computation-Rate-Distortion.″
2-2.统合多重析像度
像上述那样提取出的高频子带表示各析像度标度中的与边缘、纹理、对比度相关的信息。为了统一处理这些信息,进行仅基于高频子带的多重析像度逆变换,从而进行边缘统合。即,在排除最低析像度的低频子带LLM并将这些值全部设定成零之后,依次对剩余的高频子带进行逆小波变换。当示意地记载该状况时,使具有与输入图像相同析像度的统合边缘成分为E,如下式所示。
[算式30]
在该统合阶段中,考虑空间位置关系向其他层级传递不同层级的边缘、纹理、对比度的信息。此外,在使用拉普拉斯金字塔的情况下,将最低析像度的高斯面设定成零,对剩余的拉普拉斯面逐次进行统合。
3.建立统合边缘的一维分布函数
建立从HVC各色面提取出的统合边缘图像的直方图(PDF)。直方图的直方柱数可以在H,V,C上均隔着原点而设定成-128~128左右。但是,HVC各色面以200直方柱左右的灰度表示。
由于PDF是边缘强度的直方图,所以成为在正负具有同等程度的频数积分面积的以原点为峰值的分布。通常,在析像度之间为不相关的无记忆信源的情况下,在各层级中呈对称的PDF分布形状的边缘强度即使统合也是直接统合为对称的PDF分布形状。但是,在析像度之间存在相关性的情况下,其相关状况能够以PDF分布形状的形式投影。
像这样,各个高频子带面的PDF通常能够近似于“广义高斯:exp(-|x|α)”,在逐次统合而成的边缘面上反映出空间上的对比度的相关性,包含非对称性而变化为多种形状。
在实验上已确认当这样的统合边缘的PDF分布的特征形状从最低析像度统合大约3级的量的边缘成分时该形状基本显现。因此,在如果要简单地完成这样的情况下,即使没有统合至最后的实际析像度,也可以评估统合中途阶段的PDF分布形状。
若为了便于说明而通过像素数将直方图的值标准化,则成为表示像素值的概率密度的一维分布函数。以如下方式表示示意地建立的分布函数。使用拉普拉斯符号△的原因在于,统合边缘图像记述了原图像的像素值的二次微分的方面。
f(△H),f(△V),f(△C)
4.分布函数的希尔伯特空间表达
能够通过球贝塞尔函数对统合边缘图像的分布函数进行级数展开,并通过展开系数来评估形状。在第2实施方式中,单独进行右展开和左展开,但在后述的第3实施方式中同时进行左右的展开。此时,在第2实施方式中,进行基于零次的球贝塞尔函数的根的展开。将展开区域的最外廓点固定,其中所包含的根的数量的增加与频率成分高的基底函数的生成对应。
4-1.变量转换
关于从直方图的峰值至右侧部分,使横轴的分布区域为[a,b](a<b),使纵轴的分布区域为[fa,fb]。在将横轴收敛于[0,1]、将纵轴收敛于[0,1]的区间中进行变量转换。关于从直方图的峰值至左侧部分也是同样地,使横轴的分布区域为[b,a](b<a),使纵轴的分布区域为[fa,fb],并进行同样的转换。通常取a~0、fa~0的值。仅在该节中为了便于说明,当将横轴的变量从x向y转换而记载、将纵轴的变量从fx向fy转换而记载时,转换式如下所示。
横轴的变量转换:y=|x-a|/|b-a|
纵轴的变量转换:fy=(fx-fa)/(fb-fa)
4-2.基于球贝塞尔函数的根的级数展开
使进行上述变量转换而得到的横轴的分布区域与△H,△V,△C无关而以x表示。通过基于N个零次的球贝塞尔函数的根的基底函数对HVC各色面的分布函数进行展开。在此使用的符号a的意思与此前不同,表示成为分布区域的展开对象的最外廓点。
[算式31]
利用基底函数的正交性并通过以下算式求出展开系数cn。
[算式32]
在此,αnm表示n次函数的第m个零点的值。
[算式33]
jn(αnm)=0
在零次函数的根的情况下,能够以解析方式提供。
α0m=πm,m=1,2,3,…
因此,用于级数展开的零次函数的第m个基底函数在[0,a]的区间内存在m个零点(根)。即,使将a设定于零次的球贝塞尔函数的第一个零点位置的函数,为其次数中的最低频率的基底函数,使该函数向原点方向收缩,在第二个零点到达a的位置时停止,使其为其次数中的频率第二低的基底函数,不断重复该处理,在分布区域内[0,a]的区间生成高频的基底函数而成为完整系。其与n次函数的情况也完全相同。
由于球贝塞尔函数关于根展开为完整系,所以当取足够大小的N的值时能够完全再现原函数。当直方图的直方柱的数量为单侧128左右时,可以将展开的次数设定成N=100左右。
5.生成感性不变量
通过两个基底函数的合成系统提取HVC各面的纹理PDF的分布函数的形状。即,将通过HVC统合边缘图像的各分布函数采取的构造而显现的感性提取为特征量。
由于对从相同色面内的边缘成分得到的一个分布函数使用相同基底函数进行右展开和左展开,所以二次形式的不变量的生成方法与第1实施方式的情况相比种类增加大约2倍以上。以下示出对称积的情况下量子数差为0和1时的不变量的生成方法、和反对称积的情况下量子数差为1时的生成方法的例子,但能够通过同样的生成方法在对称积的情况下将量子数差定义至m=0,1,…,N/2,在反对称积的情况下将量子数差定义至m=1,2,…,N/2-1。
当考虑使分布函数的右区间和左区间为不同象限时,能够根据HVC三个面的同一象限彼此的两个基底函数的组合与第1实施方式同样地建立合成系统,另外也能够根据不同象限之间的两个基底函数的组合建立合成系统。前者仅处理矢径方向因此标注符号“r”。后者在跨着零的意思下而标注符号“z”。使右侧的展开系数为ck (α+),使左侧的展开系数为ck (α-)。
在此,除一个例外以外,不变量的值以全部收敛于[-1,1]的方式进行标准化而定义。另外,在和的范围超出k=1,…,N的范围的情况下,处理成在k=N之后使k=1环状地相连。色面为(α),(β)=H,V,C。
基于相同色面内的基底函数的合成系统进行的评估
1)同一象限内的组合
[算式34]
2)不同象限的组合
[算式35]
基于不同色面之间的基底函数的合成系统进行的评估
1)同一象限内的组合
[算式36]
2)不同象限的组合
[算式37]
不变量的可取值及其性质与在第1实施方式中说明的内容完全相同,因此在此省略说明。
6.建立形容词判断指标
6-1.感性不变量的线性结合
作为用于检索某感性形容词(i)的指标,利用感性不变量的加法性的性质建立对各个感性不变量进行线性结合而得到的新的指标Qi。指标Qi能够表示的形容词不仅是一个形容词,而是具有完全相反性质的形容词的一对形容词。
Qi=β1G1+β2G2+…
在此,以使Qi再次成为[-1,1]范围的指标的方式将线性结合参数βi的值事先标准化。
6-2.设定检索对象形容词的参数
事先学习与规定形容词对应的线性结合参数,设定其模型、参数。
7.图像分类处理
根据形容词判断指标,与第1实施方式同样地对图像进行分类。以下,列举并示出提取实际带来怎样感性的图像的具体例。与第1实施方式同样地,在纹理的情况下也能够根据各个感性不变量得到与在色彩心理学上使用的高级形容词之间具有极为深刻的关联性和线形性的图像的排列。
当对感性不变量的性质概观整体时,通过组合不同象限的基底函数而带来有分布函数的非对称性的要素的不变量,相当强烈地掺入感情要素。另一方面,在组合同一象限内的基底函数的情况下,尽管能够实现图像的被拍摄物构造的多重性和一体性的这样的分离,但中性的方面也相当强烈。以下分配形容词且列举的例子主要以组合不同象限的情况为中心。
与第1实施方式的颜色的分布函数时相比情况稍微不同的是,在边缘的分布函数时,即使非对角成分的要素远离对角区域也留存大的值,与前者为当远离对角区域时强度急速下降的短距离相关相比,具有长距离相关的性质。能够解释为其示出根据纹理的分布构造而引起的感情的数量比根据颜色的分布构造而引起的感情的数量多。
图11是示出如下情况的例子,即:
[算式38]
对感性不变量GZ,m(α)(α)+,(α)(α)=VV⊕ CC
的算术平均的情况下,当展开的次数为N=100且使量子数差m在m=0,8,50之间跳跃时,怎样的分布函数的形状符合排列的图像组分布的两极端。上层示出位于一端的图像的V面的边缘图像的分布函数的状况,下层示出位于另一端的图像的同样的状况。
作为与图11对应的图像组的倾向,确认在m=0的上层集中有在图像内存在大图案要素而带来“充裕的”印象的图像、在下层集中有带来“神奇的”印象的图像的倾向。另外,根据m=8,在上层大量集中有两个被拍摄物前后重叠而存在背景和主要被拍摄物这两个要素这样的复合图像,在下层中大量集中有树木的叶子或草整面映现这样的精细的纹理构造的一体图像。
[算式39]
GZ,m=0 (α)(β)+ (α)(β)=VC 「热闹的,华丽的-寂寞的,清楚的」
根据该感性不变量而排列使“热闹的-寂寞的”和“华丽的-清楚的”这两个形容词对组合这样的感性图像。在“热闹的、华丽的”图像中集中有包含多个大图案构造和小图案构造这样的各种画面的图像。在另一方的“寂寞的、清楚的”图像中大量集中有偏黑色的构造或阴暗场面伴随具有某程度视觉影响力的面积比重而包含的照片。
[算式40]
GZ,m=4 (α)(β)- (α)(β)=VC 「肃静的-幽玄的」
根据该感性不变量而排列“肃静的-玄幽的”这一形容词对的感性图像。在“肃静的”图像中,大量集中有伴随着树木和阴影的图像。在另一方的“玄幽的”图像中大量集中有在大面积划分的风景描绘上渲染黄昏时的粉色、橙色,黄色等而成的照片、或伴随流云的连续描绘、蒸汽或烟霭弥漫这样的图像。
图12示出在两端选择的图像的典型例的边缘图像和分布函数。
根据分布函数的形状进行说明,如图12左侧那样当边缘和纹理较多时V面和C面均带来肃静的印象。另一方面,可以认为当在如图12右侧那样V面边缘图像的分布函数以微小频度示出强的值、即在分布函数中存在小的底部斜面时,原画伴随着通过山的棱线等以划分方式分断而成的图像构造,并且伴随着明亮度成分的对比度变化以上的宽对比度幅度而交织成彩度面的变化,由此带来玄幽的印象。
[算式41]
GZ,m=0(α)(α)+ (α)(α)=HH 「夏或白天的风景-秋·春或傍晚
的风景」
难以根据该感性不变量来适用形容词对,但能够明确地分离成“夏或白天的风景”和“秋·春或傍晚的风景”这一图像对。“夏或白天的风景”的图像中,绿色及蓝色的面积较多,对比度强。“秋·春或傍晚的风景”的图像包含暖色系的颜色,稍微缺乏变化的图像较多。
[第3实施方式]
(纹理PDF的希尔伯特空间表达和感性不变量的线性和)
接下来,说明第3实施方式。在第2实施方式中将统合边缘图像的直方图分为右侧和左侧而进行展开,但左右同时的展开更容易讨论对称性,由于优选因此以下仅记述其应当变更的方面。认为由此得到的感性不变量与第2实施方式相比更容易取得与感性的对应关系且排列度更高。
4.分布函数的希尔伯特空间表达
通过基于作为偶函数的零次球贝塞尔函数的根展开、和基于作为奇函数的一次球贝塞尔函数的根展开的二重级数,对分布函数进行希尔伯特空间表达。由此分布函数形状的对称成分全部集中于零次函数的展开系数,非对称成分全部集中于一次函数的展开系数。此外,还可以进一步发展,进行二重级数展开至无限次数。
4-1.变量转换
使从直方图的峰值位置p到扩展至右侧或左侧的最远处的分布区域的最端点的距离为r。横轴的分布区域为[-r+p,r+p]。使该横轴在[-1,1]的区间进行变量转换。
横轴的变量转换:y=(x-p)/r
纵轴与第2实施方式相同。
4-2.基于球贝塞尔函数的根和次数的二重级数展开
通过基于N个零次和一次的球贝塞尔函数的根的基底函数对HVC各色面的分布函数进行展开。在此使用的符号a的意思与第2实施方式同样地表示成为分布区域的展开对象的最外廓点。
[算式42]
利用基底函数的正交性并通过以下算式求出展开系数cnk。
[算式43]
在此,当导出展开系数的计算式时,零次和一次函数的积无论内部变量如何缩放也为奇函数,因此进一步考虑ρ2的偶函数性,使用当在左右对称区间进行积分时积分值为零的性质。即,与次数相关的正交性的关系式只要在偶数次与奇数次的函数之间定义则不限于加权函数为1的情况,即使加上任意偶函数的权重也成立。但是,虽然正规化的常数因子发生变化,但在ρ2的情况下既已通过基于根的关系式而提供(在概论说明的部分中记载)。
5.生成感性不变量
若将二重展开系数cnk作为一个向量以与一重展开系数相同方式处理,则能够构筑与第1实施方式的颜色的感性不变量Fi完全相同形式的感性不变量Gi。因此,只要将F置换成G即可。但是,和的可取范围为2倍,变更成k=1,2,…,N,N+1,…,2N。能够使用这样求出的感性不变量与第1及第2实施方式同样地进行图像的分类。
[第4实施方式]
(颜色和纹理的感性不变量的线性和)
接下来,说明第4实施方式。第1实施方式所示的从与图像的颜色信号分布相关的一维分布函数导出的感性不变量Fi、和第2、第3实施方式所示的从与边缘图像的颜色信号分布相关的一维分布函数导出的感性不变量Gi为完全同维的物理量且具有相加性质,因此,能够通过进行线性结合来共同处理两者。其不限于一维分布函数,对于构图要素密切相关的图像的颜色信号分布自身的二维分布函数或更高级的感性要素,只要以相同要领构筑感性不变量就能够建立完全共同的基础,并通过感性的线性模型来说明在形容词的层级构造中上位概念影响最强的性质。
<对检索对象图像的处理>
1.向孟塞尔HVC颜色空间的转换
在该第4实施方式中,色调面准备进行了N的分离的面和没有进行N的分离的面这两个面。之后的处理与第1~3的实施方式相同。
5.建立形容词判断指标
Qi=α1G1 +α2G2 +…
+β1G1+β2G2+…
<学习感性形容词模型>
通过与第1实施方式完全相同的方法来确定线性结合参数。
在此再次总结此前的说明,并且为了导入更新颖的概念而进行整体的概论说明。然后说明实现这些概念的第5~第7实施方式。
[1]感性的定式化的表象
<基本概念>
作为感性的定式化的表象,以如下方式考虑。各个图像对某感性发出共同的能量要素。用脑感知该能量要素。
<分布函数的形状特性>
图13是表示颜色和纹理的分布函数的图。如此前说明那样,图像的感性与分布函数的形状之间的关联性非常深刻,模糊相似的形状具有带来同一感性的倾向。为了使分布函数的形状识别定量化而导入了物理学的方法。
<量子力学的方法>
试着通过量子力学来记述此前说明的内容。即,能够以如下方式总结。
1)将分布函数f向希尔伯特空间投影来显示动量p。
2)使用群论构筑二次形式的相加能量En。
在此采取的方法实际上在导入量子力学的概念的同时,也包含通过分布函数f以统计力学的方式记述图像这样的具有大量像素和大量灰度的多体系统所取的状态的内容。接下来对此进行详细说明。
<统计物理学上的意义>
上述记述法的意义在于,从图像的信号值S(x,y)这一微观性质的物理量向感性这一宏观性质的物理量转换。即,通过取微观量的统计平均,仅动量、角动量和能量这些力学不变量作为有效成分而留存,通过在其中也取图像组的统计平均,起到仅能量对有效图像系统建立特征的作用。根据统计总体的作用,图像系统被信息汇集成能带构造的形式。通过像这样缩减图像系统的信息量来进行从微观性质向宏观性质的转换。统计力学上的记述法起到用于记述该统计性质的桥梁的作用。
以下,示出信息的缩减状况。构图系统未完成,但也包含预测来进行记述。
图像信号S(x,y) 部分系统信息f(p,q) 能量信息
~10^23个 颜色:(256)^3~10^7个 ~2000个
纹理:(±256)^3~10^8个 ~2000个
构图:像素数~10^7个 (~2000个)
在此,即使变量p,q在由独立变量p1,p2,…,pi,…,q1,q2,…,qi,…构成时,也能够用作代表这些独立变量的符号。
<量子统计的基于密度矩阵的记述>
在进行力学记述时,需要对图像信号S(x,y)研究什么与位置坐标q对应,什么与动量p对应。在此之前,说明图像系统与量子统计的关系。
感性为未知的哈密顿算子系统,并且处理统计总体所形成的力学系统。如在统计力学中公知那样,不可能存在记述宏观系统整体的波动函数(参照文献E1)。图像系统也记述了宏观系统。
基于与系统相关的不完全的数据组的量子力学的记述使用密度矩阵而进行。能够使用密度矩阵计算出任意物理量的期望值。与坐标相关的密度矩阵以
ρ(q,q′)=Σm,nwm,nψm*(q′)ψn(q)
表示。当与某图像的某方面相关的部分系统处于以波动函数ψ完全记述的状态时,波动函数ψ能够通过建立完整系的函数ψn(q)而展开。
ψ=Σncnψn
当将其代入密度矩阵的表达式中时,能够导出能量表示下的密度矩阵
cm*cn→wmn。
能量表示的密度矩阵的对角成分表示稳定状态。另一方的非对角成分表示非稳定状态。图像捕捉某瞬间的动态(dynamism)。并不限于始终为稳定状态。因此,从密度矩阵导出的能级也需要考虑非对角成分。其表示非对角成分的记述取决于记述密度矩阵的波动函数的选择方法。选择以对角成分的稳定状态尽可能压缩的方式记述的波动函数系,在记述感性方面是适当的选择。在统计物理学中,由于通常将稳定状态作为研究对象,所以将处于第n个稳定状态的概率记载为wn=wnn。
也对统计平均计算基于稳定状态的期望值。但是,图像的感性不限于稳定状态,也需要将非稳定状态作为研究对象。因此,也需要对统计平均来计算考虑了稳定状态和非稳定状态这两方的期望值。
在处理几个图像组均给予同一感性这样的、感性的模糊性时,采取如下方法:在感性的记述中对全部的稳定状态取对角和,由此将稳定状态作为一个能级状态(E0)来处理,另外,对非稳定状态也同样地取非对角成分彼此的倾斜和,由此根据处于从该稳定状态向非稳定状态偏离了多少的状态、即能级(En)而进行记述。向该能级的激发概率的统计分布以wn=w(En)表示。根据物理意义,可以说当n的值增大时,记述了图像系统中的运动的、更为动态状态且处于能量转换幅度大的变化过程中的图像状态。即使在构筑能量矩阵的过程中也可以直接适用该讨论结果并进行定义。
此外,当定义能量并以ρ(En)表示其状态密度分布时,与向能级的激励概率w(En)组合,实际能量的概率分布以ρ(En)w(En)表示。
[文献E]朗道、栗弗席兹理论物理学教程第5卷“统计物理学第1部”(第3版,1976年),第1章“统计的基础原理”、第2章“热力学的各量”、以及第3章“吉布斯分布”
[文献E1]朗道、栗弗席兹理论物理学教程第5卷“统计物理学第1部”(第3版,1976年),第1章“统计的基础原理”,第5节“统计矩阵”
[2]关于分布函数与感性的关联性
<部分系统和分布函数>
在记述感性时,找出相对于部分系统的统计分布为重要的技术课题。感性中的坐标和动量的力学变量q,p不限于通过力学而定义那样的唯一变量。作为感性的部分系统,定位为如下系统:在对图像的某方面进行投影并记述图像的性质时,捕捉到独立性相当高的方面的系统。
作为该方面的大分类,可以考虑颜色、纹理和构图这三个主轴。但是,由于以相同图像为基础进行投影,所以不是完全独立的,但在规定图像的信息时,若规定这三个方面的分布函数,则会具有足以大体记述统计性质的信息。
在此,限定于力学系统的简单记述水准,在需要更高级的记述时,考虑该不完全独立的记述法。在某种意义上,其为与物理学的非相对论的记述和相对论的记述之间的关系接近的关系。即,其原因在于,在非相对论的记述中,位置坐标系和自旋坐标系作为完全独立系统而记述,但在相对论的记述中,无法实现该区别,与需要变换到基于位置坐标和自旋坐标的混合坐标系的旋量的记述这一情况相似。在分别记述这些部分系统后,通过进行统合来记述图像系统的整体感性。
<部分系统的分布函数的记述和力学变量>
按部分系统使与作为力学变量的位置坐标q和动量p对应的图像变量不同而进行定义。颜色表示具有“零至正有限值”的区间宽度的信号值的分布,由于记述原信号自身的分布,所以满足适于该记述的线性微分方程式的函数为超几何函数所包含的某一函数。纹理表示提取出边缘成分的具有“负有限值至正有限值”的区间宽度的信号值的分布,由于记述原信号的去掉一个信息后的其他方面的分布,所以满足适于该记述的线性微分方程式的函数为合流超几何函数所包含的某一函数。构图表示具有“零至正有限值”的区间宽度的二维信号值的分布,由于记述原信号自身的分布,所以满足适于该记述的线性微分方程式的函数为超几何函数所包含的某一函数。
能够认为超几何函数和合流超几何函数所记述的系统捕捉到不同方面的部分系统。即,以具有三个奇点的微分方程式表示的超几何函数适于表示图像的信号值自身的分布,作为成为分布函数的自变量的图像信号,适于记述如像素值那样由零以上的值构成的图像信号能够均匀分布的性质。另一方面,以使其中的两个奇点合并成一个奇点而共计具有两个奇点的微分方程式表示的合流超几何函数适于记述将与图像的信号值相关的信息量减少一个而得到的方面,作为成为分布函数的自变量的图像信号,适于记述通过微分操作使如去掉一个信息而得到的边缘信号值那样跨着正值和负值的图像信号在零附近定域化的性质。
<力学变量的变量分离的表象>
描述物理学的物体粒子的记述中的与变量分离后的坐标系对应的表象来记述图像的部分系统的方面。适于颜色的一维分布函数的记述的超几何函数为切比雪夫函数,由于该函数通过偶函数和奇函数的一重级数而形成完整系,所以当捕捉到偶函数为角动量0、奇函数为角动量1时,能够认为记述了与光相同的玻色子、即自旋1的自旋坐标。因此,能够认为颜色的一维分布函数记述了波动函数中的自旋系的波动函数。
适于记述纹理的一维分布函数的合流超几何函数为球贝塞尔函数。通常即使在以正区域定义的矢径方向的波动函数中,球贝塞尔函数也为贝塞尔函数中的唯一能够扩展定义至负区域的函数。因此,能够将纹理的一维分布函数捕捉为记述了波动函数中的矢径方向的波动函数。矢径方向的波动函数能够通过与偶函数和奇函数的次数和根相关的两个级数的二重级数来记述,因此,能够从小到大地分配角动量0、1、2、3、…,其能够与在原子轨道中称作s、p、d、f、…轨道的定义建立对应。
关于适于记述构图的二维分布函数的超几何函数,可以认为相伴勒让德函数、或作为与其的傅里叶函数的合成积的球面谐和函数是符合的。因此,能够认为构图的二维分布函数记述了球面坐标显示中的与天顶角和方位角的二维系统坐标对应的波动函数。
<观测数据组和分布函数>
通过分布函数f(p,q)来记述图像信息的某一方面。作为图像信息而观测到的数据与分布函数之间的关系以如下方式定义。即,颜色:与采取直方图并使与像素位置相关的信息消失而得到的分布函数对应,纹理:与采取边缘方面的直方图并使与像素位置相关的信息消失而得到的分布函数对应,构图:与取区域平均并使像素数、即与像素位置相关的信息减少而得到的分布函数对应。当使这三个分布函数合并时,大体准确地反应图像S(x,y)的统计性质。印象不同的其他图像被行同值表达的概率较低。在此,不能够将说明了像素位置的信息与力学变量p,q的位置坐标q对应的情况一概而论。以下说明能够关于颜色和纹理分别对该对应关系各定义两个空间。
<坐标空间和动量空间>
(A)低次空间的方面
(A-1)颜色
能够将孟塞尔颜色空间看作表示颜色的强度分布的动量空间。
颜色直方图=f1(p)
(A-2)纹理
能够将进行多重析像度边缘统合而得到的边缘图像的HVC各色面的颜色空间看作表示边缘的强度分布的动量空间。
纹理PDF=f3(p)
(B)高次空间的方面
(B-1)颜色
在对颜色直方图进行了切比雪夫变换的情况下,能够将原颜色直方图侧看作位置坐标q,将切比雪夫展开系数侧看作动量p。作为向高次动量空间投影而得到的分布函数,需要表示概率密度,由于不取负值,所以展开系数侧取将系数平方而得到的功率谱。
颜色直方图=f2(q)=f1(p)
切比雪夫·谱=f2(p)
(B-2)纹理
在对纹理PDF进行了球贝塞尔变换的情况下,能够将原PDF侧看作位置坐标q,将球贝塞尔展开系数侧看作动量p。作为相同的高次动量空间的分布函数,取功率谱。
纹理PDF=f4(q)=f3(p)
球贝塞尔·谱=f4(p)
图14是用于容易理解它们之间的关系的概念图。在随后定义的各部分系统的熵(entropy)的计算中使用这些分布函数。此外,在通过能量构筑建立二次形式时,与通常的笛卡尔坐标(x,y,z)中的动能的记述((px^2+py^2+pz^2)/(2m))不同,在孟塞尔HVC不为完全独立的成分这一情况的作用下,除与其对应色面内的相关性以外,在色面间生成相关性的要素并进行评估也具有意义。但是,由于孟塞尔HVC颜色空间设计成对于心理量呈等差率的均等颜色空间,所以可以不带有各个二次项之间的系数。
<与统计平均相关的两个意义>
在用于导出图像系统的统计性质的统计平均中具有两个意义。即,一个意义为,颜色、纹理、构图的庞大的信息量通过统计平均而缩减成宏观物理量。另外,另一个意义为,在大量模型图像组产生共同感性的意义中,通过取图像组平均而得到确定值。
前者同时包含伴随着从微观物理量向宏观物理量的转换过程的、量子力学上的平均操作和统计上的平均操作。后者相当于主要包含用于确定与宏观物理量的波动的平均值相当的量来确定统计的性质的、统计上的平均操作。因此,前者生成通过视觉系统对脑进行宏观作用的信号,后者起到识别人所感受到的感觉在脑内的作用分布的平均要素的作用。
[3]感性的记述和吉布斯分布
<图像组所产生的能量的波动>
发现大量图像组的共同感性的统计性质的方法与统计物理学的吉布斯分布(正则分布)对应。即,是将能量的波动考虑在内的系统的记述法。另一方面,记述一幅图像的统计性质的方法与微正则分布对应。其为将能量的波动忽视了的系统的记述法。
封闭系统(一幅图像)的动量和角动量与作为该系统整体的一致的平移运动和一致的旋转运动具有关系。无法记述系统的统计性质。但是,在与其他图像所具有的一致的平移运动和旋转运动有所区别的方面具有意义。即,若一幅图像的封闭系统的平移运动和旋转运动均取静止坐标系,则确定一幅图像的统计性质的仅为能量,但通过与其他图像共同的坐标系进行记述时,由于动量和角动量也与这些图像组不同,所以识别出这些图像组为不同图像。但是,在记述大量图像所共有的宏观性质即感性时,动量和角动量为当图像组的取统计平均的量增加时消失于平均零或常数值的信息。
<感性的模糊性的记述和相位空间>
图15是表示相位空间中的感性组的表象图。感性的记述也是如何定量地记述模糊性的问题。作为其统计物理学上的记述法的表象,认为分布函数满足一定条件的相位空间的轨迹记述唤起相同感性的状态分布。一定条件表示满足如下条件的相位空间上的轨道,所述条件为:作为力学不变量的能量限制为固定值。关于感性的模糊性,虽然作为图像,分布函数能够取各种状态,但这些状态均记述为位于相同相位空间上的模糊范围的轨迹上的集合体。即,即使从分布函数导出的各个能量要素不相同,若它们的总和满足相同条件,则认为也唤起相同感性。另外,由于具有能量的波动,所以认为在相位空间上具有一定幅度的轨道属于同一感性组。该状况在图15中以用粗线扩展的方式描述。
通常分布函数的对数为作为力学不变量的运动的积分,以相加性的运动的积分记述。其原因在于,即,表示某部分系统的分布函数和其他部分系统的分布函数同时取该状态的概率的合成系统的分布函数以部分系统的分布函数的积表示,其对数具有相加的性质。这样的相加性运动的积分如在力学中公知那样,仅能量、动量和角动量与其对应。因此,分布函数的对数能够通过常数项α和与能量、动量、角动量分别相关的固定系数β、γ、δ的一次结合来记述(参照文献E2=文献A3)。
[文献E2]朗道、栗弗席兹理论物理学教程第5卷“统计物理学第1部”(第3版,1976年),第1章“统计的基础原理”,第4节“能量的作用”
<少量模型的相位空间轨道>
在唤起同一感性的图像组的总体图像在统计上足够多的情况下,限制条件仅为能量。其原因在于,在统计性质的记述中,仅能量作为相加性运动的积分而唯一留存(参照文献E2=文献A3)。
但是,在总体图像为少量的情况下,作为对应的感性的印象,需要也与这些少量模型的精细的分布状态一致那样的更强的限制条件。作为为此的附加限制条件而发挥作用的是其他作为力学不变量的动量和角动量,除能量以外,动量和角动量分别满足一定条件的相位空间上的轨迹也成为带来这些少量模型图像所共有的感性作用的分布范围。作为少量模型的极限,一幅图像的相似图像检索符合该极限。
<动量表示和不确定性原理>
图16是通过向与图像系统的颜色和纹理相关的高次空间的投影来说明位置与动量之间的关系满足不确定性原理的状况的图。即,如图16所例示的纹理PDF的情况那样,关于位置当尖锐的峰值立起而位置坐标的确定精度较高时,若要在进行了球贝塞尔·傅里叶变换的动量空间中实现该波形,如果不使所有频率广泛大量地重合就无法实现,动量变得不确定而成为非常广泛的分布。另一方面,如图16所例示的颜色直方图的情况那样,在作为动量空间的切比雪夫·傅里叶·谱极其集中地表达的情况下,若对其进行实际空间表达,则某频率的波表示该情况下低频波在整个空间范围内广泛的分布。因此,位置变得不确定,其扩展幅度较大。即,换言之能够为以下关系,记述了在图像系统中也要进行频率分析时,只要没有在实际空间中发现充分的区间宽度的波形,就无法确定包含于其中的频率成分的事实。
通过这样的位置与动量之间的扩展后的傅里叶变换的概念,位置的波束和动量的波束无法分别以固定幅度以上同时实现的不确定性关系必然是在量子力学中论述的不确定性原理。量子力学中的该原理在例如文献F1中有所说明。
普朗克常数h的值在图像系统中,与关于灰度方向的量化而规定灰度幅度的直方图的直方柱和关于空间方向的量化而规定像素间隔的一个像素的概念相关。因此,当减少图像系统的灰度数时或生成缩小图像时,普朗克常数的值需要与该系统的量化的方式相应地变更,并根据研究对象的状况而改变。该方面如物理常数那样与部分系统无关,与在整个系统中作为一定条件而处理的状况不同。但是,图像系统中的普朗克常数在将某方面投影而得到的、规定了量化幅度的部分系统中作为固定值而处理。
[文献F1]Landau and Lifshitz,Course of Theoretical Physics,Volume3″Quantum Mechanics(Non-Relativistic Theory),″(Thirdrevised edition,1977),Chapter2″Energy and Momentum,″Section16″Uncertainty relations.″
<相位空间和量子统计>
作为统计物理学的基础概念的相位空间上的轨迹能够导入状态数的概念而与量子力学对应,并能够通过从图像观测到的物理量的状态数或将其标准化而进行密度表达的状态密度,来实现图像感性的定量化。
在量子论的相位空间上,若能够定义通过普朗克常数将动量和坐标这两者的不确定量的数量分割而得到的量子状态数,则作为宏观性质在统计上必然显现以其对数表示的作为相加性物理量的熵的概念。能够说明如下内容:通过该熵的概念来确定宏观体系的能谱的能级密度这一内容,已在统计物理学上建立了理论基础,随着粒子数量(此处,在图像系统中对应的是像素数和/或灰度数)的增大而能级间隔以指数函数的方式减少,从而成为连续的能带构造(参照文献E3)。
实际上通过实验而计算出连续的能级En的结果为,在相邻的能级之间发现与表示基本相似性质的能量要素相关的图像排列,但其中针对某性质的图像开始了在能量要素的分布内达到远距离的顺序的替换,当从能级的一端到另一端按顺序观察该性质的状况时,在高能级中得到与低能级性质完全不同的图像排列。其使能级密度高密度化,而表示能级间的状态无法区分的能带构造的性质自身。此外,对于通过熵与普朗克常数的关系而结合的波尔兹曼常数,也在对某方面进行投影而得到的部分系统中作为固定值来处理,但在不同的部分系统之间通常定义不同。
[文献E3]朗道、栗弗席兹理论物理学教程第5卷“统计物理学第1部”(第3版,1976年),第1章“统计的基础原理”,第7节“熵”
<统计总体和能级的能带构造>
归结于宏观物体(在此为图像)的能量固有值的能谱中的能级分布的异常致密度(参照文献E1)。由此,图像系统在能带的构造这一形态上被信息汇总。
在此,说明物性和感性的理论构造的相似性。
纯铁与铁合金的性质的不同之处表现为电子的能带构造的不同(参照文献G1、G2、G3)。或者,能够通过阐明电子构造来记述强磁体的铁、镍、钴的性质不同是如何产生的。另外关于顺磁性金属与强磁性金属的不同、或顺磁性金属的铝和铜等的性质的不同也是同样的。而且,物质的种类由作为单质的118种元素、它们的化合物及合金等构成,作为数量以数千至一万的数量级而存在。例如,当计算从118种元素中组合2~3种元素的组合方法的数量时,成为该数量级的数字。规定元素的数量及其性质的基础的是,作为原子轨道而能够存在的矢径方向的波动函数s,p,d,f轨道和它们的状态的简并数。
同样地,感性形容词也作为表达日语的颜色感情的词语而代表性地存在473个,虽然无法通过这些词语进行区别,但认为当稍有不同时在心中感受到的区别同样以数千至一万的数量级而存在。该代表性的473个词语的意义的每一个在通常情况下不是明确地不同,表示微妙不同的表达也大量存在。例如,对于“热闹的”存在“非常热闹的”或“华丽的”、“热烈的”等不同表达。另一方面,在“清爽的”和“热闹的”这一大分类的观点上也存在相当不同的形容词组。像这样在形容词中存在大分类和精细分类的两面性。
这样的两面性的性质也存在于物质的性质中,例如从元素周期表来看,在纵轴方向上,上方为矢径方向的波动函数按s轨道、p轨道的顺序填充的轻电子类,中间地带为d轨道被填充的过渡金属类,下方为f轨道被填充的重电子类,在横轴方向上排列着这些轨道的电子的简并数分别不同的波动函数。作为物质的性质,沿纵向同列地存在的元素表示化学上极其相似的性质,沿横向相邻地存在的情况下也表示相近的性质。当物质作为固体并作为达到阿伏伽德罗数(~10^23)的大群体而聚集时,物质的性质在统计上取能带构造,作为其状态密度分布的不同,能够表现为大的性质的不同和小的性质的不同。
因此,也通过这样的能带模型来记述感性的方法成为最佳表达方法。此外,当在相位空间上表达形容词的两面性时,认为在大分类中不同的感性表达轨迹明显不同的彼此的状态分布的不同,仅在精细分类中不同的感性表达轨迹相当接近的彼此的状态分布的不同。
[文献G1]Masako Akai,Hisazumi Akai and Junjiro Kanamori,″Electronic Structure of Impurities in Ferromagnetic Iron.I.s,p ValenceImpurities,″Journal of Physical Society of Japan,Vol.54,No.11,November,1985,pp.4246-4256.
[文献G2]Masako Akai,Hisazumi Akai and Junjiro Kanamori,″Electronic Structure of Impurities in Ferromagnetic Iron.II.3d and4dImpurities,″Journal of Physical Society of Japan,Vol.54,No.11,November,1985,pp.4257-4264.
[文献G3]Masako Akai,Hisazumi Akai and Junjiro Kanamori,″Electronic Structure of Impurities in Ferromagnetic Iron.III.LightInterstitials,″Journal of Physical Society of Japan,Vol.56,No.3,November,1987,pp.1064-1077.
[4]宏观物理量的记述
<能级的表象模型>
能够根据由向部分系统的投影而定义的各个部分空间中的动量和位置的定义来定义能量。另外,也能够定义作为其他力学不变量的角动量。作为能量的构筑方法,对各感性主轴导入向低次的部分空间投影的情况和向高次的部分空间投影的情况这两种情况。在向低次的部分空间投影的情况下,采取提出能量的模型哈密顿算子的方法。在另一方的向高次的部分空间投影的情况下,采取构筑能量矩阵并定义从稳定状态到达非稳定状态的能量固有值的方法。
低次的部分空间中的能级将通过统计物理学的平均场近似而生成的场的能量捕捉为离散的能级。即,构筑离散的标量不变量。高次的部分空间中的能级将从能量矩阵的对角成分的稳定状态向非对角成分的非稳定状态逐渐离开的过程捕捉为连续的能级。即,构筑连续的向量不变量。
<颜色的低次不变量>
认为孟塞尔H,V,C的值的本身表示动量。
以如下方式构筑模型哈密顿算子。
H=(H+V+C)^2
其表示表明颜色值的强度的动能。或者表示场的能量。
对方程式
Hlψn>=Enlψn>
求出能量固有值En。
在计算能量固有值时,使用统计物理学的平均场近似。
将各动量分成平均项和波动项,波动项也通过平均的波动幅度而记述。即,作为波动项而取标准偏差,具有与平均值相同的动量p的维度。
这些动量的平均值和标准偏差值从表示动量分布的分布函数f(p)求出。即,从H,V,C的颜色直方图f(H),f(V),f(C)求出。
H=(H+V+C)^2
{(<H>+(H-<H>)+(<V>+(V-<V>)+<C>+(C-<C>)}^2
~={(<H>+σH)+(<V>+σV)+(<C>+σC)}^2
=(<H><H>+<V><V>+<C><C>)
+2(<H><V>+<V><C>+<C><H>)
+2(<H>σH+<V>σV+<C>σC)
+2(<H>σV+<V>σC+<C>σH)
+2(σH<V>+σV<C>+σC<H>)
+(σHσH+σVσV+σCσC)
+2(σHσV+σVσC+σCσH)
像这样使哈密顿算子近似于平均场和波动场而作为二次形式导出的要素与各个能量要素对应,从而建立离散的能级。这些能量要素所取的值根据各图像而不同,但在具有某感性的图像组之间,作为某能量要素共同强烈作用的因子而作用的情况通过调查图像组的分布可以观察到。
通常,像若采取图像的颜色直方图就能够知晓那样,动量的分布具有根据图像而极其随机地变化的变动性强的特性,即使在具有同一感性的图像组中取统计平均,共同因子的要素也基本没有留存。但是,若在作为能量形式的二次形式的状态下观察分布,则在具有同一感性的图像组中容易残留共同作用的因子。例如,“杀风景的”图像的平均明亮度<V>和平均彩度<C>同时取小值的概率较高,大多表示<V><C>的动能共同小的值。但是,某些情况下也存在<V>的值出现得偏大的情况,此时<C>侧示出更小的值,由此取得平衡。此时若对<V>和<C>单独取统计平均,则作为值,它们的动量平均容易作为信息而消失于普通图像的平均值。以下示出该状况。
1)动量
作为动量的要素pn,列举以下要素。
<H>,<V>,<C>,σH,σV,σC
此外,σ的部分也可以作为角动量的要素Mn来处理。
2)能量
作为能量的要素En,列举以下要素。对于能量要素En,由于要计算出不同种类的能量要素,所以作为用于区分这些要素的符号而通过如下的省略符号来表示这些状态。对α面使用符号a,对β面使用符号b,对平均值使用符号m,对标准偏差值使用符号s。
(α)(α)
amam:<H><H>,<V><V>,<C><C>,
amas:<H>σH,<V>σV,<C>σC,
asas:σHσH,σVσV,σCσC,
(α)(β)
ambm:<H><V>,<V><C>,<C><H>,
ambs:<H>σV,<V>σC,<C>σH,
asbm:σH<V>,σV<C>,σC<H>,
asbs:σHσV,σVσC,σCσH
对于颜色的低次不变量,当考虑以下所述的注意点时,将伴有<H>的项分离成两个要素。因此,作为颜色的低次不变量的能量要素,能够导出21+5=26种的标量不变量。这些标量不变量分别与离散的能级En对应,表示En的值自身。其为在颜色的低次部分系统中缩减而成的宏观物理量。
3)颜色的低次不变量的情况下的特殊事项
色调H在孟塞尔颜色空间转换时通过中性N和除此以外的色调环H(≠N)而表示。分布函数f(H)使用如在第1实施方式中已说明那样分为色调环的直方图直方柱和N的直方图直方柱而得到的直方图。另外,当通过色调环计算平均值时,与在第1实施方式中进行切比雪夫展开时的色调环的起点的定义同样地,在色调环内分布函数最小的点处切入,比其值小的区域以在色调环的角度的最大值侧的端点增加2π角度量的值的形式使值大幅延伸来确保区域,在该轴上计算出平均孟塞尔色调值。在该值超过原孟塞尔色调值的值范围的情况下,减去与2π角度量相当的值而恢复到原值。
为了表示色调环,<H>以复数表达而分离成两个成分,从而实现该记述。另外,此时通过复数的绝对值的大小来表示留存于色调环的减去了中性量的比例。
<H>=(1-pop(N))exp(2πi<H(≠N)>/100)
σH仅计算色调环内的分布函数的扩展幅度。因此,保持于一个成分。它们的强度也与<H>的绝对值的大小连动地乘以留存于色调环的频数比例来评估。即,在全部流入到中性的情况下,σH必然定义为零。
σH=(1-pop(N))σH(≠N)
<纹理的低次不变量>
作为表示纹理的边缘面,对在第2实施方式中说明的孟塞尔HVC面分别进行多重析像度变换,并仅对高频子带图像利用通过逆变换统合而成的统合边缘面。该边缘面的边缘强度示意地使用拉普拉斯算符△而表示成△H,△V,△C。
这次考虑HVC面的边缘强度△H,△V,△C的值自身表示动量。
以如下方式构筑模型哈密顿算子。
H=(△H+△V+△C)^2
其表示表明颜色的边缘成分的值的强度的动能,或者表示场的能量。
与颜色的低次不变量时同样地通过平均场近似来求出能量固有值En。动量的平均值和标准偏差值从表示动量分布的分布函数f(p)求出。即,从△H,△V,△C的边缘强度的直方图f(△H),f(△V),f(△C)求出。
通过与颜色的低次不变量时同样的过程来求出纹理的低次不变量。
1)动量
作为动量的要素pn,列举以下要素。
<△H>,<△V>,<△C>,σ△H,σ△V,σ△C
此外,σ的部分也可以作为角动量的要素Mn来处理。
2)能量
作为能量的要素En,列举以下要素。对于能量要素En,由于要计算出不同种类的能量要素,所以作为用于区分这些要素的符号而通过如下的省略符号来表示这些状态。对α面使用符号a,对β面使用符号b,对平均值使用符号m,对标准偏差值使用符号s。
(α)(α)
amam:<△H><△H>,<△V><△V>,<△C><△C>,
amas:<△H>σ△H,<△V>σ△V,<△C>σ△C,
asas:σ△Hσ△H,σ△Vσ△V,σ△Cσ△C,
(α)(β)
ambm:<△H><△V>,<△V><△C>,<△C><△H>,
ambs:<△H>σ△V,<△V>σ△C,<△C>σ△H,
asbm:σ△H<△V>,σ△V<△C>,σ△C<△H>,
asbs:σ△Hσ△V,σ△Vσ△C,σ△Cσ△H,
作为纹理的低次不变量的能量要素,能够导出21种标量不变量。这些标量不变量分别与离散的能级En对应,表示En的值自身。其为在纹理的低次部分系统中缩减而成的宏观物理量。
3)纹理的低次不变量的情况下的特殊事项
色调面的边缘成分取通过始终以孟塞尔值0的点为色调环的原点的值表示的色面的边缘。其原因在于,作为色调面的边缘,在实验上判明了,与使色调环的切入点按图像而变更为分布函数最小的点的情况相比,优选在与虹色的频谱分布相同的孟塞尔值的原点处固定地观测。另外,中性为不另行处理而分布于色调环的某一点的色调面。由此,中性成分如色调面上的随机噪声那样动作。
<颜色的高次不变量>
对颜色的分布函数进行切比雪夫展开。变量x分别取H,V,C的值。
[算式44]
在从分布函数导出作为力学不变量的动量、角动量、能量时,尽可能导出对于分布函数的形状的记述能够进行独立的形状评估的成分。即,在构筑能量和/或角动量时,也将使分布函数f(x)进行轴颠倒而成的f(-x)增加为研究对象。在颜色的情况下,轴颠倒的物理意义与灰度颠倒相当。为此导入角动量的概念。即,将基底函数组根据偶函数和奇函数的性质的不同而分成部分组,对各个部分组分配角动量量子数。
切比雪夫基底的第偶数个基底为偶函数且满足ψ(-x)=ψ(x)的关系,第奇数个基底为奇函数且满足ψ(-x)=-ψ(x)的关系。由此,在偶函数组中分配角动量量子数l=0,在奇函数组中分配角动量量子数l=1。通过进行x→-x的轴颠倒,第奇数个角动量量子数的基底函数进行符号取反,第偶数个角动量量子数的基底函数的符号不变。这样的角动量单位的与波动函数的轴颠倒相关的性质在量子力学中称作宇称性(parity)。偶函数的基底函数具有偶宇称性,相对于轴颠倒不变,奇函数的基底函数具有奇宇称性,相对于轴颠倒使符号取反。
若考虑该角动量量子数记述了自旋系,则颜色记述了自旋角动量量子数s=1的系统。切比雪夫函数能够仅通过一重级数展开而定义,偶函数和奇函数分别记述自旋0和自旋1的状态,能够通过轴颠倒来产生自旋1的状态的宇称性发生了颠倒的状态。切比雪夫函数适于记述作为玻色子的自旋1的系统。
在研究独立成分时,首先,在构筑了最初记述系统的角动量没有轴颠倒的情况下的动量的要素pn、角动量的要素Mn、能量的要素En之后,导出对这些各个要素进行了角动量的轴颠倒后的约成倍的要素。此时,在对全部要素进行线性结合时线性结合系数在是否记述具有意义的独立成分的观点下导出。即,在仅改变要素的符号时,若改变线性结合系数的符号,则由于记述相同系统而没有意义。通常动量属于该类别,角动量和能量导出其他独立成分。
为了列举具体例,使展开系数的数2N为200。即N=100。
1)动量
作为动量的要素pn,列举如下。
cn (α)在此,(α)=H,V,C。
2N=200时,由于动量的要素数量为3面的量,所以为200×3=600个。
2)角动量
以下,在将cn分成角动量单位的部分组而考虑的情况下,使角动量量子数l=0的展开系数表示为c0n,使角动量量子数l=1的展开系数表示为c1n。因此,展开系数的要素数量各等分为N个。部分组的要素序号以n=1,2,…,N计算。
作为角动量的要素Mn,列举如下。
*(c01 (α)+c02 (α)+…+c0N (α))+1*(c11 (α)+c12 (α)+…+c1N (α))
=(c11 (α)+c12 (α)+…+c1N (α))在此,(α)=H,V,C。
在角动量仅存在于l=1的情况下,独立成分仅为上述的一个。其原因在于,使角动量的轴颠倒后的
0*(c01 (α)+c02 (α)+…+c0N (α))-1*(c11 (α)+c12 (α)+…+c1N (α))=-(c11 (α)+c12 (α)+…+c1N (α))仅记述了与上述相同的系统。
像这样奇函数的展开系数的一次和能够成为用于评估分布函数的非对称性的宏观指标。古典角动量的定义为M=rxp,但当与其对比时,上述的定义对动量的部分和在使希尔伯特空间坐标的角动量量子数为距原点的距离的坐标空间上取积,由此记述了分布函数的转矩。
由于角动量的要素数量为3面的量,所以为1×3=3个。
3)能量
取α面与β面的动量的积来构筑动能。动量的积cm*cn建立在群论中称作直积或克罗内克积的矩阵,以相同基底函数表示的两个系统的积矩阵能够通过可约表达而分解成更小维度的两个表达。
即,能够分解成对称积和反对称积的矩阵表达,
能够根据(α)面与(α)面的积来构筑对称积的能量矩阵(i,k)。
ci (α)ck (α)+ck (α)ci (α)
另外,能够根据(α)面与(β)面的积来构筑对称积和反对称积的能量矩阵(i,k)。
ci (α)ck (β)+ck (α)ci (β)
ci (α)ck (β)-ck (α)ci (β)
此外,这些矩阵均为仅以基底函数的数量沿纵向和横向排列而成的方阵。
为了计算能量的固有值,取对角和、即迹。稳定状态的能量固有值纯粹地取对角和。其为n=0即i=k的情况下的能量要素En。为了计算非稳定状态的能量固有值,定义取从对角成分仅离开n=i-k的矩阵要素的和的扩展迹。由于与普通的迹不同,所以使用符号Sp’。此时取迹的要素的数量必然定义为与对角和的要素数量相同,在积的一方使用的基底函数组必然以将形成完整系的全部基底函数遍历一次的形式构筑。其为分解成对称积和反对称积时的作为规则而遵守的条件。因此,在满足n=i-k的矩阵要素组中进行取和的操作时,对于在矩阵的端部超出的要素,定义为当研究对象的矩阵或部分矩阵的大小为N时在这些矩阵内以满足n+N=i-k的方式,在隔着对角成分位于相反侧的区域仅对剩余的要素数量取倾斜和。由此能够依次计算出能量要素En。此外,具体例已经在第1实施方式和第3实施方式中记述。
能量要素的数量对于一个能量矩阵仅存在与基底函数的展开系数的数量的二分之一相当的数量。为二分之一的理由在于,由于将从矩阵超出的成分仅移动与矩阵宽度相等的数量而再次插入,故在其按顺序遍历的情况下会成为双重定义,由此有效的是减为二分之一。即,通过取扩展迹而使能量要素的数量缩减至与二维矩阵要素形成各行和各列的一维要素的数量的二分之一相等的数量。
接下来研究使角动量的轴颠倒后的状态。上述的三个能量矩阵的定义描述了基于由(α)面和(α)面组成的表面、与由(α)面和(β)面组成的表面的积的表面状态。与之相对,通过对一方的分布函数进行轴颠倒而能够建立背面的(-α)面和(-β)面。在生成矩阵积时,通过取一方为表面并取另一方为背面而能够描述背面状态。由此,能够导出独立的能量要素。即,通过导入宇称性的概念,构筑独立的合成系统的基底函数。此外,宇称性为在古典力学中没有出现的概念。
在此,能够根据(α)面与(-α)面的积来构筑对称积和反对称积的能量矩阵(i,k)。
ci (α)ck (-α)+ck (α)ci (-α)
ci (α)ck (-α)-ck (α)ci (-α)
另外,能够根据(α)面与(-β)面的积来构筑对称积和反对称积的能量矩阵(i,k)。
ci (α)ck (-β)+ck (α)ci (-β)
ci (α)ck (-β)-ck (α)ci (-β)
仅在这些能量矩阵的要素的各自的ck (-α)中的k与奇函数相当的情况下,符号取反成ck (-α)=-ck (α),在与偶函数相当的情况下,构筑如ck (-α)=ck (α)这样不改变符号的能量矩阵。像这样,在以一部分要素进行了符号取反的背面状态的矩阵内,当采取与表面状态的矩阵同样的扩展迹时,能够导出作为单独出现的能量要素的独立成分。
在取这些表面状态的能量矩阵的扩展迹和背面状态的能量矩阵的扩展迹时,认为能够定义基于角动量的部分组时的基底函数的排列方法存在两种。即,第1种为按角动量量子数低的顺序首先排列的方法。
[算式45]
第2种为按主量子数低的顺序首先排列的方法。
[算式46]
按顺序对它们提供ψi和一维的指标,当作为二维矩阵积而生成对称积和反对称积ψiψk±ψkψi时,第1项和第2项的i和k隔着对角成分而交换。当将这些能量矩阵再次以角动量单位分成部分矩阵而排列时,等价于在部分矩阵内取满足n=i-k的扩展迹。但是,在使用角动量量子数和主量子数这两个指标(index)来表示i,k的情况下,第1种排列方法的情况下单纯地通过在相同角动量量子数的组合的部分矩阵内交换主量子数的i和k的形式来表示,但在采用第2种排列方法的情况下,由于成为与其稍微不同的表达而需要加以注意。即,在存在于相同距离的非对角位置的部分矩阵的要素之间交换i,k时,在第1项的ψiψk的ψi侧为大于ψk侧的角动量量子数的情况下,必须将仅以n=i-k个位于右侧的ψ的主量子数记载为比ψi侧的主量子数仅提升一个的k+1。然后,即使在任一方重新排列的情况下,在交换了要素的两个部分矩阵之间,也进行以部分矩阵单位汇集要素的操作来进行部分矩阵表达。
实验上判明在生成(α)面与(α)面的积时第1种排列方法更为优异,在生成(α)面与(β)面的积时第2种排列方法更为优异。其表示的是,第1种排列方法以不同角动量量子数之间完全作为独立系统而处理为前提,在同一面内通过完全正交系的基底函数的展开而满足该前提。另一方面第2种排列方法表示,即使在不同角动量量子数之间,基于接近的主量子数之间的基底函数的记述也更能够记述与其密切相关的状况,可以认为是由于HVC面没有记述完全独立的系统而引起的。
作为组合这样的部分矩阵的方法,需要以使扩展迹遍历形成完整系的全部基底函数的方式在部分矩阵之间取和。即,动量的要素在角动量量子数分成由0和1的系统组成的两个部分组时,能够考虑将能量矩阵分成表示角动量的固有状态的两个部分矩阵和表示角动量的混合状态的两个部分矩阵。此时,作为以形成完整系的方式遍历的扩展迹的取法,存在使两个对角部分矩阵的迹结合的情况、和使两个非对角部分矩阵的迹结合的情况这两种情况。像这样考虑通过角动量单位将能量矩阵分开的情况更能够明确物理意义。
示意地表示该状况,如下所示。
[算式47]
当出现相同下标时,对它们取和。
示出实际用于将能量矩阵分为角动量的部分矩阵来组成扩展迹的部分矩阵和的具体例。以下以形成部分矩阵的两个基底函数的合成系统的形式表达,部分矩阵与部分矩阵的和也同时示出。各部分矩阵通过将这些基底函数ψik置换成cik而得到。因此,当以(i,k)定义各部分矩阵时,为了计算能量要素En,在各个部分矩阵内对满足n=i-k的矩阵要素取迹。
由于通过对能量要素En实施迹的部分组单位来计算不同种类的能量要素,所以作为用于区别这些要素的符号能够通过如下的省略符号来表示这些状态。对α面使用符号a,对β面使用符号b,对角动量的固有状态的(l,l′)=(0,0)+(1,1)的组合使用符号00,对角动量的混合状态的(l,l′)=(0,1)+(1,0)的组合使用符号01,对对称矩阵使用符号正p,对反对称矩阵使用符号负m,对角动量的坐标轴的标准状态使用符号e,对角动量的坐标轴的颠倒状态使用符号i。
对角动量的坐标轴的标准状态和颠倒状态使用符号±来同时进行记述。由于仅对构成矩阵的一方的基底函数进行用于记述背面状态的角动量的轴颠倒操作,所以仅一方的色面侧的奇函数进行符号取反。没有记载通过这些操作而消失的成分。
(α)(α)
a0a0p,e/i:(ψ0i (α)ψ0k (α)+ψ0k (α)ψ0i (α))±(ψ1i (α)ψ1k (α)+ψ1k (α)ψ1i (α))
a0a1p,e:(ψ0i (α)ψ1k (α)+ψ0k (α)ψ1i (α))+(ψ1i (α)ψ0k (α)+ψ1k (α)ψ0i (α))
a0a1m,i:﹣(ψ0i (α)ψ1k (α)-ψ0k (α)ψ1i (α))+(ψ1i (α)ψ0k (α)-ψ1k (α)ψ0i (α))(i≠k)
(α)(β)
a0b0p,e/i:(ψ0i (α)ψ0k (β)+ψ0k (α)ψ0i (β))±(ψ1i (α)ψ1k (β)+ψ1k (α)ψ1i (β))
a0b0m,e/i:(ψ0i (α)ψ0k (β)-ψ0k (α)ψ0i (β))±(ψ1i (α)ψ1k (β)-ψ1k (α)ψ1i (β))(i≠k)
a0b1p,e/i:±(ψ0i (α)ψ1k (β)+ψ0,k+1 (α)ψ1i (β))+(ψ1i (α)ψ0,k+1 (β)+ψ1k (α)ψ0i (β))
a0b1m,e/i:±(ψ0i (α)ψ1k (β)-ψ0,k+1 (α)ψ1i (β))+(ψ1i (α)ψ0,k+1 (β)-ψ1k (α)ψ0i (β))
在2N=200时由于各个括号所封闭的部分矩阵以100×100构成,所以从各个种类根据迹而定义的能量要素En的数量为50个。关于上述定义的种类数量,同色面间的积存在四种,异色面间的积存在八种。而且,作为(α)(α)的取法,由于存在HH、VV和CC而为三种,作为(α)(β)的取法,存在HV、VC和CH这三种。因此,以0和1记述角动量的系统的能量要素的数量为(3×4+3×8)×50=36×50=1800个。作为能带,对36种的每一种描绘具有50个能级的图。
实际试着使用图像进行实验的结果为,如上述那样以角动量的单位对能量矩阵进行部分矩阵表示,当将具有相同角动量量子数的固有状态的部分矩阵显现于对角位置、将具有不同角动量量子数的混合状态(混合(hybridization)项)的部分矩阵显现于非对角位置时,能够得到与物理意义匹配的结果。即,当对由对角部分矩阵建立的与能量要素相关的图像排列的状况和由非对角部分矩阵建立的与能量要素相关的图像排列的状况进行比较时,可知在非对角成分的混合状态下具有捕捉云层从山峦涌现那样的画面等非常富有动态的照片的能力。
<纹理的高次不变量>
对纹理的分布函数进行球贝塞尔展开。球贝塞尔函数也扩展定义至负区域,展开为形成完整系的根和次数的二重级数。由于球贝塞尔函数表示矢径方向的波动函数,所以与根相关的展开和主量子数n对应,与次数相关的展开和方位量子数(轨道角动量量子数)l对应。认为方位量子数的展开系数具有l=0,1的情况和l=0,1,2,3的情况这两种情况。在原子物理学中对与l=0,1,2,3对应的轨道赋予其他惯称而按顺序称作s轨道、p轨道、d轨道、f轨道。而且,这些轨道构成元素的周期表,d轨道与过渡金属的记述对应,f轨道与镧系元素和锕系元素的电子系的记述对应。若研究与记述物性的电子系的对应关系,则认为在记述感性的图像系统中也只要展开至f轨道就足够。变量x分别取△H,△V,△C的值。
基于s,p轨道的展开的情况
[算式48]
基于s,p,d,f轨道的展开的情况
[算式49]
此外,在此(α)用于表示色面的不同,但球贝塞尔函数中的αln用于表示根的位置。零点的位置通常不以解析方式表示,但在斯米尔诺夫“高等数学教程”中记载有贝塞尔函数的零点的近似式。若由此通过演绎而变形为用于表示球贝塞尔函数的零点的近似式并在保持第1项的状态对第2项导入1/2的修正系数,则判明在全部零点能够通过3%以内的误差进行近似,因此,为了计算p轨道以上的展开系数而使用以下算式。
[算式50]
在从分布函数导出作为力学不变量的动量、角动量、能量时,尽可能导出能够对分布函数的形状的记述进行独立的形状评估的成分。即,与颜色的情况同样地,在构筑能量和角动量时,也将使分布函数f(x)进行轴颠倒而成的f(-x)增加为研究对象。在纹理的情况下,轴颠倒的物理意义与边缘符号取反相当。轴颠倒操作与将角动量的宇称性反演的操作对应。在球贝塞尔函数中,角动量量子数根据偶函数和奇函数的性质的不同而将基底函数组分类成部分组,对各个部分组分配方位量子数。
球贝塞尔基底的具有第偶数个方位量子数的基底为偶函数且满足ψ(-x)=ψ(x)的关系,具有第奇数个方位量子数的基底为奇函数且满足ψ(-x)=-ψ(x)的关系。通过进行x→-x的轴颠倒,第奇数个方位量子数的基底函数进行符号取反,第偶数个方位量子数的基底函数的符号不变。
由此,s,d轨道的波动函数具有偶宇称性,p,f轨道的波动函数具有奇宇称性。通常,以球贝塞尔函数表示的基底函数组具有相对于坐标轴的颠倒使用角动量量子数l而以(-1)^l表示的宇称性。
与上述同样地,当研究独立成分时,首先,在构筑最初记述系统的角动量的没有进行轴颠倒的情况下的动量的要素pn、角动量的要素Mn、能量的要素En之后,导出将这些各个要素进行了角动量的轴颠倒后的约成倍的要素。为了列举具体例,使展开系数的数N取100。
1)动量
作为动量的要素pn,列举以下要素。
cln (α)在此,(α)=H,V,C。
在基于s,p轨道的展开的情况下,由于在N=100时动量的要素数量为三面的量,所以为2×100×3=600个。在基于s,p,d,f轨道的展开的情况下,由于在N=100时动量的要素数量为三面的量,所以为4×100×3=1200个。
2)角动量
作为角动量的要素Mn,列举以下要素。
(基于s,p轨道的展开的情况)
与颜色的切比雪夫展开的情况完全相同。即,
(c11 (α)+c12 (α)+…+c1N (α))在此,(α)=H,V,C。
由于角动量的要素数量具有三面的量,所以为1×3=3个。
(基于s,p,d,f轨道的展开的情况)
1(c11 (α)+c12 (α)+…+c1N (α))+2(c21 (α)+c22 (α)+…+c2N (α))+3(c31 (α)+c32 (α)+…+c3N (α))
当将角动量的轴颠倒后,其他独立成分显现。
-1(c11 (α)+c12 (α)+…+c1N (α))+2(c21 (α)+c22 (α)+…+c2N (α))-3(c31 (α)+c32 (α)+…+c3N (α))
由于角动量的要素数量具有三面的量,所以为2×3=6个。
像这样,奇函数的展开系数的一次和提供用于评估将分布函数的非对称性扩展至外侧多少来表示其性质的宏观指标,而且偶函数的展开系数的一次和提供用于评估分布函数以留有影响那样的方式向外侧扩展多少的性质的宏观指标,它们的综合扩展的性质能够成为作为角动量而守恒的宏观物理量。
3)能量
作为能量的要素En,列举以下要素。
(基于s,p轨道的展开的情况)
与颜色的切比雪夫展开的情况完全相同。因此,由于在N=100时各个括号所封闭的部分矩阵以100×100构成,所以从各个种类通过迹而定义的能量要素En的数量为50个。由此与颜色的情况完全相同,以0和1记述角动量的系统的能量要素的数量为(3×4+3×8)×50=36×50=1800个。作为能带,对36种的每一种描绘具有50个能级的图。
(基于s,p,d,f轨道的展开的情况)
使角动量单位的能量部分矩阵在对角方向相连而形成完整系的方法存在以下四种情况。第1处理方法表示角动量的固有状态。第2至第4处理方法表示角动量的混合状态。混合状态是指角动量形成混成轨道的状态,例如在sd之间建立称作sd混合(sd hybridization)的部分组。图17的(a)~(d)示出表示构成下述四个扩展迹的状况的矩阵图。它们被定义为仅包含s,p轨道的情况。即,在省略基于d,f轨道的展开的情况下,成为与基于s,p轨道的展开相同的算式。
s2+p2+d2+f2
sp+ps+df+fd
sd+ds+pf+fp
sf+fs+pd+dp
示出实际用于将能量矩阵分为角动量的部分矩阵来组成扩展迹的部分矩阵和的具体例。对角动量的固有状态的(l,l′)=(0,0)+(1,1)+(2,2)+(3,3)的组合使用符号00,对角动量的混合状态的(l,l′)=(0,1)+(1,0)+(2,3)+(3,2)的组合使用符号01,对角动量的混合状态的(l,l′)=(0,2)+(2,0)+(1,3)+(3,1)的组合使用符号02,对角动量的混合状态的(l,l′)=(0,3)+(3,0)+(1,2)+(2,1)的组合使用符号03。
(α)(α)
a0a0p,e/i:
(ψ0i (α)ψ0k (α)+ψ0k (α)ψ0i (α))±(ψ1i (α)ψ1k (α)+ψ1k (α)ψ1i (α))+(ψ2i (α)ψ2k (α)+ψ2k (α)ψ2i (α))±(ψ3i (α)ψ3k (α)+ψ3k (α)ψ3i (α))
a0a1p,e:
(ψ0i (α)ψ1k (α)+ψ0k (α)ψ1i (α))+(ψ1i (α)ψ0k (α)+ψ1k (α)ψ0i (α))+(ψ2i (α)ψ3k (α)+ψ2k (α)ψ3i (α))+(ψ3i (α)ψ2k (α)+ψ3k (α)ψ2i (α))
a0a1m,i:
-(ψ0i (α)ψ1k (α)-ψ0k (α)ψ1i (α))+(ψ1i (α)ψ0k (α)-ψ1k (α)ψ0i (α))-(ψ2i (α)ψ3k (α)-ψ2k (α)ψ3i (α))+(ψ3i (α)ψ2k (α)-ψ3k (α)ψ2i (α))(i≠k)
a0a2p,e/i:
(ψ0i (α)ψ2k (α)+ψ0k (α)ψ2i (α))+(ψ2i (α)ψ0k (α)+ψ2k (α)ψ0i (α))±(ψ1i (α)ψ3k (α)+ψ1k (α)ψ3i (α))±(ψ3i (α)ψ1k (α)+ψ3k (α)ψ1i (α))
a0a3p,e:
(ψ0i (α)ψ3k (α)+ψ0k (α)ψ3i (α))+(ψ3i (α)ψ0k (α)+ψ3k (α)ψ0i (α))+(ψ1i (α)ψ2k (α)+ψ1k (α)ψ2i (α))+(ψ2i (α)ψ1k (α)+ψ2k (α)ψ1i (α))
a0a3m,i:
-(ψ0i (α)ψ3k (α)-ψ0k (α)ψ3i (α))+(ψ3i (α)ψ0k (α)-ψ3k (α)ψ0i (α))+(ψ1i (α)ψ2k (α)-ψ1k (α)ψ2i (α))-(ψ2i (α)ψ1k (α)-ψ2k (α)ψ1i (α))(i≠k)
(α)(β)
a0b0p,e/i:
(ψ0i (α)ψ0k (β)+ψ0k (α)ψ0i (β))±(ψ1i (α)ψ1k (β)+ψ1k (α)ψ1i (β))+(ψ2i (α)ψ2k (β)+ψ2k (α)ψ2i (β))±(ψ3i (α)ψ3k (β)+ψ3k (α)ψ3i (β))
a0b0m,e/i:
(ψ0i (α)ψ0k (β)-ψ0k (α)ψ0i (β))±(ψ1i (α)ψ1k (β)-ψ1k (α)ψ1i (β))+(ψ2i (α)ψ2k (β)-ψ2k (α)ψ2i (β))±(ψ3 i (α)ψ3k (β)-ψ3k (α)ψ3i (β))(i≠k)
a0b1p,e/i:
±(ψ0i (α)ψ1k (β)+ψ0,k+1 (α)ψ1i (β))+(ψ1i (α)ψ0,k+1 (β)+ψ1k (α)ψ0i (β))±(ψ2i (α)ψ3k (β)+ψ2,k+1 (α)ψ3i (β))+(ψ3i (α)ψ2,k+1 (β)+ψ3k (α)ψ2i (β))
a0b1m,e/i:
±(ψ0i (α)ψ1k (β)-ψ0,k+1 (α)ψ1i (β))+(ψ1i (α)ψ0,k+1 (β)-ψ1k (α)ψ0i (β))±(ψ2i (α)ψ3k (β)-ψ 2,k+1 (α)ψ3 i (β))+(ψ3i (α)ψ2,k+1 (β)-ψ3k (α)ψ2i (β))
a0b2p,e/i:
(ψ0i (α)ψ2k (β)+ψ0,k+1 (α)ψ2i (β))+(ψ2i (α)ψ0,k+1 (β)+ψ2k (α)ψ0i (β))±(ψ1i (α)ψ3k (β)+ψ1,k+1 (α)ψ3i (β))±(ψ3i(α)ψ1,k+1 (β)+ψ3k (α)ψ1i (β))
a0b2m,e/i:
(ψ0i (α)ψ2k (β)-ψ0,k+1 (α)ψ2i (β))+(ψ2i (α)ψ0,k+1 (β)-ψ2k (α)ψ0i (β))±(ψ1i (α)ψ3k (β)-ψ1,k+1 (α)ψ3i ( β))±(ψ3i (α)ψ1,k+1 (β)-ψ3k (α)ψ1i (β))
a0b3p,e/i:
±(ψ0i (α)ψ3k (β)+ψ0,k+1 (α)ψ3i (β))+(ψ3i (α)ψ0,k+1 (β)+ψ3k (α)ψ0i (β))+(ψ1i (α)ψ2k (β)+ψ1,k+1 (α)ψ2i (β))±(ψ2i (α)ψ1,k+1 (β)+ψ2k (α)ψ1i (β))
a0b3m,e/i:
±(ψ0i (α)ψ3k (β)-ψ0,k+1 (α)ψ3i (β))+(ψ3i (α)ψ0,k+1 (β)-ψ3k (α)ψ0i (β))+(ψ1i (α)ψ2k (β)-ψ1,k+1 (α)ψ2 i (β))±(ψ2i (α)ψ1,k+1 (β)-ψ2k (α)ψ1i (β))
由于在N=100时各个括号所封闭的部分矩阵以100×100构成,所以从各个种类通过迹而定义的能量要素En的数量为50个。关于上述定义的种类的数量,同色面间的积存在8种,异色面间的积存在16种。而且,作为(α)(α)的取法,由于存在HH、VV和CC所以具有3种,作为(α)(β)的取法,具有HV、VC和CH这三种。因此,以0,1,2,3记述角动量的系统的能量要素的数量为(3×8+3×16)×50=72×50=3600个。作为能带,对72种的每一种描绘具有50个能级的图。
<哈密顿算子的相对论效果的修正>
1)颜色和纹理的高次系统的组合能量
假设颜色为自旋坐标系,纹理为矢径方向的位置坐标系。在非相对论的记述中自旋坐标系和位置坐标系相独立,自旋角动量和轨道角动量单独作为守恒量而作用,在相对论的记述中,无法区分自旋坐标和位置坐标。关于相对论效果的影响,即使不进行旋量记述,只要对非相对论的记述的哈密顿算子施加自旋-轨道相互作用的能量,在某种程度上也可以取入(参照文献F2)。因此,能够构筑基于由颜色的高次系统定义的自旋角动量S、与由纹理的高次系统定义的轨道角动量L的内积的能量要素En。但是,相对于此前在各部分系统中定义的角动量M,颜色的高次部分系统使用符号S,纹理的高次部分系统使用符号L。
[算式51]
在假设(α)=H,V,C独立的情况下,上述定义为(α)面与(α)面的内积,在不考虑角动量的轴颠倒的情况下,能量要素的数量仅为一个。但是,由于HVC具有不独立的方面,所以通常为(α)面与(β)面的内积,能够定义接下来的三个能量要素。
[算式52]
在进行角动量的轴颠倒的情况下,只要同样地定义其他L′向量和S′向量(=S向量)并也增加下面的哈密顿算子即可。作为能量要素的数量,与上述共计为2倍即六个要素。
[算式53]
2)颜色和纹理的低次系统的组合能量
也能够将在颜色的低次系统中导入的动量向位置坐标方向的扩展σH,σV,σC捕捉为角动量。同样地也能够将在纹理的低次系统中导入的动量的扩展σ△H,σ△V,σ△C捕捉为角动量。因此,与高次系统的情况同样地,能够定义自旋-轨道相互作用的能量。
[算式54]
在低次系统中,即使使角动量的轴颠倒也仅表示与原系统相同的系统,因此能量要素的数量为三个。
[文献F2]Landau and Lifshitz,Course of Theoretical Physics,Volume3″Quantum Mechanics(Non-Relativistic Theory),″(Thirdrevised edition,1977),Chapter10″The Atom,″Section72″FineStructure of Atomic levels.″
<旋转的内能的增加>
1)颜色的高次系统的旋转能量
与上述的自旋-轨道相互作用同样地,能够定义与自旋系的旋转能量相当的自旋-自旋相互作用。
[算式55]
作为假设(α)=H,V,C不独立的情况下的组合,能够定义以下两个能量要素。
[算式56]
2)颜色的低次系统的旋转能量
低次系统作为模型哈密顿算子的波动项的二次形式即σ与σ的积而既已导入。
3)纹理的高次系统的旋转能量
与上述的自旋-自旋相互作用同样地,能够定义基于坐标系的轨道角动量的旋转能量。
[算式57]
作为假设(α)=H,V,C不独立的情况下的组合,能够定义以下两个能量要素。
[算式58]
在进行s,p,d,f展开的情况下,规定相对于坐标轴颠倒而独立的角动量L′向量。作为该组合方法,除使一方的角动量反转的情况以外,在使两方的角动量反转的情况下也成为独立的能量要素。因此,作为能量要素的数量为3倍即六个要素。
[算式59]
4)纹理的低次系统的旋转能量
与颜色的低次系统同样地既已导入。
<感性的线性模型>
这样定义的力学不变量全部具有相加性质,因此不用将向部分系统投影的异维空间之间的世界区别开,就能够全部通过线性结合的方式结合而记述。即,通过构筑力学不变量,能够使感性的主轴间和与其中的低次-高次投影之间相关的部分系统处于共同条件。
按部分系统定义的不同的普朗克常数h等物理常数的不同作为以部分系统单位对整体进行缩放的线性结合系数而包含。即,感性能够以线性模型直接记述。
与某形容词i相关的感性的印象程度的强弱Qi以各个图像所发出的各个能量要素的线性和表示。按形容词而要重视的能量要素的大小和符号不同,其作为对形容词建立特征的性质而以线性结合系数的形式显现。即,作为图像的特征量的力学不变量纯粹地为从微观图像信息向宏观图像信息转换而成的物理量,模型化所需要的是汇集于线性结合系数中。用于确定线性结合系数的模型的事前学习也沿袭统计物理学的基础概念,基本为通过对图像组的统计总体取统计平均而进行。
Qi=α1F1+α2F2+…(颜色)
+β1G1+β2G2+…(纹理)
+γ1H1+γ2H2+…(构图)
在金字塔型的层级构造中,在各层中一度模型化的因子构造能够在保持不变的状态下直接附加其他因子。此时应当变更的内容仅为将部分系统与部分系统之间连接起来的缩放,部分系统内的比率即因子构造不变。
而且线性模型的重要内容在于,由于各部分系统以相加特征量记述,所以进行主轴间合成等部分系统的统合时,合成特征量的数量以缩减度最高的单纯和表示。该数量呈一万的数量级,与感性形容词的总数为同等程度。
不限于仅能量进行线性结合,作为其余的相加性力学不变量的动量和角动量也能够相对于Qi进行线性结合。此时线性结合系数也起到用于使能量和物理维度相应的作用。因此,在使用全部力学不变量的情况下,在模型学习时,在以能量单位、动量单位、角动量单位确定了线性结合系数的因子构造后,需要在三者之间再次确定用于缩放整体的结合系数。这不仅使维度相应,还关系到在该三者之间确定哪个不变量起到重要作用。通常,当在多个模型图像中取统计平均时,动量和角动量的作用较低。
在下节中,为了便于理解内容,限定于仅处理能量的情况。
<状态密度和形容词模型>
若从图像信息导出宏观能量并在某能级下具有值,则表示仅发出与该能级的能量相应的量,在该能级中存在状态。如果假设某能级的能量要素的值为零,则该图像完全不发出该能量要素,在该能级中不存在状态。能量的值可以取负值。
对于某形容词i,能量要素的值与线性结合系数的积的值为正的情况下,关于该要素对形容词i带来正作用,相反地在积的值为负的情况下,带来负作用。从一幅图像导出的能量要素的分布图、即表示能级的状态的存在状况的图、与线性结合的模型系数分布图的内积的总和具有正值时,该图像具有与该值相应的形容词i的印象。相反地在具有负值时,该图像能够产生与该值相应的、与形容词i的印象为相反方向的印象。因此,模型形容词的线性结合系数与能量要素的内积的总和Qi表示形容词能量。
当将能量要素的分布图以能量系统整体的状态数而标准化时,表示状态密度函数,该状态密度函数表示状态的存在概率。具有正能量值的正状态ρ+(E)具有正的存在概率。相反地,具有负能量值的负状态ρ-(E)也具有正的存在概率。标准化以
[算式60]
∫{ρ+(E)+P-(E)}dE=1
的方式进行。但是,作为图示状态密度时的状态密度的表述法、和实际在状态密度与线性结合系数之间取线性结合时的状态密度的表述法,可以不像这样分为两个部分。即,直接采用能量值的符号,作为其大小,只要使用与ρ+(E)或ρ-(E)相符方的值而表示为ρ(E),则也可以不区分符号。另外,当将线性结合系数也标准化时,如下式所示。
[算式61]
在此,分母的<>表示作为普通图像的模型的图像的统计平均,<>i表示与图像检索系统所准备的全部形容词相关的统计平均。关于此处的n,在出现相同下标时,对它们取和。
当像这样事先在尽可能的范围内使用图像组和形容词组的统计平均将分母的范数(norm)标准化时,能够通过绝对基准将某图像相对于平均图像以何种强度产生该形容词印象的情况数值化。因此,不是仅局限于一幅图像中或一个形容词中的相对印象评估,而能够评估绝对印象的感性,该绝对印象的感性也具有来自绝对图像基准的形容词之间的相互大小关系的评估基准。因此,Qi的标准化仅以在平均范围内收敛于[-1,1]的区间的方式标准化,有时也能够超过该范围。
<线性结合系数的确定方法>(参照图18)
从充分多的普通图像模型中选出某形容词i的模型图像,当对各个能量要素En试着观察与它们的能量值相关的频度分布时,通常,认为普通图像呈正态分布,模型图像也在其中呈正态分布。但是,在统计学上能够考虑到的分布不均也记述在正态分布的模型的范围内。
若通过模型图像相对于普通图像的分布的偏差值的形式来评估模型图像的分布的平均值在普通图像的分布中存在于哪个位置,则该偏差值自身直接表示该能量要素对于该形容词的重要度。此时,若使用普通图像的分布的平均值为零且两端在[-1,1]的区间内表示的偏差值,则能够直接用作线性结合系数。
假设该偏差值的幅度为普通图像分布的标准偏差值所提供的正态分布,以从普通分布的平均值至模型图像的平均值为止的区间的分布函数的积分值的形式提供该偏差值。另外,若提供普通图像分布和模型图像分布的各自的平均值和标准偏差值,则偏差值的误差也能够计算。
由于存在普通图像的分布不一定为正态分布的情况,所以在模型的分布位置的表示方法中,在统计学上除此以外还存在使用实际分布自身来定义百分等级(percentile rank)的指标。在进行实验时判明了如下情况:与从分布的中央值对实际分布进行积分的百分等级相比,基于假设正态分布的误差函数的积算值所提供的偏差值作为线性结合系数更优异,因此通常使用后者。
形容词的模型图像的能量值的分布表示能量值的波动。因此,可以说,使用大量图像组来确定感性的感性记述法与对能量值的波动分布的宏观物理量进行记述的统计物理学的吉布斯分布(正则分布)存在对应关系(参照文献E4)。
另一方面,当减少模型形容词的图像而取仅为一幅图像的极限时,置换成在普通图像分布中对确定为该图像所具有的宏观能量值的、能量值不波动的系统的宏观物理量进行比较的记述。在该意义上,一幅相似图像的检索,与分别以δ函数对该图像的宏观物理量的能量值、另外动量和角动量进行记述的统计物理学的微正则分布的记述对应。
在该意义上,以力学方式记述感性的方法具有能够从一幅相似图像检索连贯地记述由多幅构成的感性图像检索的性能。该方法仅将用于确定线性结合系数的模型图像的数量改变为目标图像集体的数量。
[文献E4]朗道、栗弗席兹理论物理学教程第5卷“统计物理学第1部”(第3版,1976年),第3章“吉布斯分布”第28节“吉布斯分布”、以及第35节“能够改变粒子数的吉布斯分布”
<部分系统的统合>
由于形容词能量以部分系统单位如上述那样确定期望值,所以接下来需要考虑其统合方法。通常,当记述整个系统的哈密顿算子以部分系统的哈密顿算子的线性结合表示时,即,当感性的线性模型成立时,作为整个系统的哈密顿算子的解的波动函数以部分系统的哈密顿算子解的波动函数的线性结合来表示。因此,对于与该波动函数对应的固有值也是同样地,整个系统的能量固有值En以部分系统的能量固有值的线性结合表示。以算式表示该关系,
H=k1H1+k2H2+k3H3+k4H4+…
H1:颜色的低次不变量
H2:颜色的高次不变量
H3:纹理的低次不变量
H4:纹理的高次不变量
图19是金字塔层级构造的想像图。
追加因子的能量要素起到解除此前的能级的简并而进行状态分离的作用。
即,精细状态的不同也能够通过实数值即能量值的表达而连续地数值化。但作为部分系统而增加与构图系统相关的能量时,解开此前与构图相关而简并的能量,能够区分由构图引起的感性的不同。
<线性结合系数k的确定方法>
按部分系统作为状态密度函数ρ(En)与线性结合系数α(En)的内积而定义的部分系统的形容词能量Pi,j(在此事先导入与整个系统的形容词能量Qi相区分的符号)能够经由与此前在部分系统内对各个能量要素进行的过程完全相同的过程来确定相对于它们的线性结合系数k。即,关于取线性结合的部分和的能量指标,调查普通图像模型的图像组如何分布,通过偏差值评估其中形容词模型的图像组分布于哪个位置,由此确定线性结合系数k。
这样求出的线性结合系数k关系着阐明部分系统的作用比例,该部分系统的作用比例为,对于某形容词而言,颜色、纹理和构图哪一个部分系统要素实际强烈地作用而决定该形容词的印象。作为方法论,能够对部分系统的线性结合系数k取[-1,1]的范围的值,但实际上进行实验观察时,提供只取正值的结果。这与仅改变因子构造的作用比例的部分系统原本所具有的作用不可思议地一致。
在像这样部分系统全部具有相加性能量的性质的情况下,通过划分部分系统,能够以部分和单位再次确定线性结合系数来统合部分系统。在仅处理能量的系统中,经由在与其他部分空间之间进行统合的二级统合。
同样的观点下,在对动量、角动量和能量全部进行处理的系统中,在这些力学不变量之间存在部分系统的划分概念,因此,需要进行三级统合。即,首先在动量内、角动量内、能量内的要素之间确定因子构造后,确定取线性和的动量、角动量和能量内的哪个力学不变量实际发挥主导作用,并确定以它们的线性和表示的部分系统的代表能量这次在部分系统之间具有怎样的重要度。
当将确定线性结合系数的过程称作学习时,也能够称作是进行部分系统单位的多级学习的系统。
<能带图>
图20是颜色及纹理中的能带图。当按能级的顺序图示状态密度函数时,低次系统的标量不变量为离散的能级,高次系统的向量不变量为连续的能级。这正如达到阿伏伽德罗数的原子的集合体、例如金属物质所实现的与具有能带构造那样的系统相似的状态密度图,在金属物质中,通过在内壳的电子轨道接近于原子轨道的离散的能级上,外壳的电子轨道与相邻的原子的电子轨道重合而成为致密的能级所构成的传导带来实现状态密度图。
例示出由某人所选择的“清爽”的形容词模型所建立的能带图的状况。为了进行比较,示出作为典型的过渡金属的镍的传导带中的能带图(参照图21)。
确定物质的电子构造的是作为其主要作用的电子为自旋1/2的费米子的系统。因此,泡利不相容原理发挥作用,向上自旋和向下自旋不会混合。因此,图21右侧的状态密度和图21左侧的状态密度不会混合,成为状态从低能级的下方按顺序填充而填补至费米能级的构造。
记述一方的图像的感性的能带图为与其不同的状况。即,允许取正能量值的状态(图21右侧的状态密度图)和取负能量值的状态(图21左侧的状态密度图)以任意能级向右侧移动或向左侧移动,该状态密度的大小也允许任意填充。其在某种意义上能够解释为记述了玻色子的性质。因此,作为图像的状态系统,也能够产生状态集中于某能级的聚集。
如果假设颜色记述了自旋系,则对颜色的高次不变量的记述优选选择的切比雪夫函数正好符合实际仅能够对角动量1的系统进行状态记述的特殊函数。形成图像的光子在量子力学上是自旋角动量为1的系统。此外,从能带图的状况能够看出颜色的自旋系记述了非常精细的因子构造的状况。
能够看出使用适于记述一方的矢径方向的波动函数的球贝塞尔函数而记述的纹理系统记述了非常粗略的能量构造的状况。其在考虑物质原子的能级时与如下关系存在非常相似的关系,所述关系为:矢径方向的波动函数决定大的能级、然后天顶角和方位角的方向的波动函数接着决定精细的能级、自旋系决定进一步精细的能级。但是,当为固体等物质的电子构造时,例如在强磁体中由于自旋系开始发挥大的作用,所以其能级的分离的大小程度的大小关系无法在原子集中的聚集系统中一概而论。
当对形容词系统所具有的金字塔构造及与其相关而预测的特征量的金字塔构造的存在方式的对应关系进行比较时,这些能级构造的关系与如下状况存在极其相似的关系,所述状况为:力学记述法中的相加性能量的性质通过追加新的主轴的能量要素而仅将此前研究的系统的能级的简并解除。
<图像的温度>
在图像系统中,定义包含稳定状态和非稳定状态这两方的系统的温度。温度相当于能量状态数的总和。因此,将使能量的量子状态En关于状态n进行向量表达时的向量的范数作为温度。其与定义能量状态密度时的分母的标准化因子相当。各个图像可取的能量状态的数量不同,温度也因各个图像而不同。因此,能够定义图像的温度这一概念。图像的温度需要通过状态数的计算方法所共同的部分系统单位进行最初定义。另外,图像的温度具有与能量相同的维度。
向量的范数由于取零以上的值而满足温度所满足的条件。另外,在能量的状态数不存在时,该图像系统为绝对零度。但是,由于作为部分系统的投影面同时记述了不确定性原理所作用的共轭空间,所以难以建立成为绝对零度的图像。
<图像的熵>
根据向部分系统投影而得到的动量p和位置q的相位空间中的分布函数f(p,q)的定义来计算状态数,以部分系统单位定义图像的熵。在该意义上能够将熵S表述成S=S(f)=S(p,q)。
由于以部分系统单位定义的熵分别具有相加性质,所以也能够定义整个系统的熵。若使a表示部分系统,则
[算式62]
熵为无维的量。
通过以下算式计算部分系统a的熵。使积分仅在分布函数的值为有限的区间内实施。跳过值为零的区间。但是,分布函数的状态数被标准化。因此,必须取零以上的值来满足熵的条件。
[算式63]
Sa=-∫∫fa(pa,qa)ln(fa(pa,qa))dpadqa
∫∫fa(pa,qa)dpadqa=1
在部分系统的分布函数f(p,q)仅向动量p的函数投影的情况下,使用下式。关于积分方法是同样的。但是,分布函数的状态数被标准化。
[算式64]
Sa=-∫fa(pa)ln(fa(pa))dpa
∫fa(pa)dpa=1
在部分系统的分布函数f(p,q)仅向位置q的函数投影的情况下也能够进行同样的定义。在全部部分系统中的分布函数集中于一个状态时,熵为零。但是,作为分布函数观察具有不确定性关系的共轭分布函数两方,因此不会轻易存在满足该条件的图像。熵是表示图像的杂乱度的物理量。
当试着进行与熵S相应地生成热量Q=TS这一热力学不变量的实验时,在例如仅处理颜色的低次不变量的能量的部分系统中,在低温系统中划分有与黑白图像接近的凉爽的印象的图像,在高温系统中划分有整面富有色彩且若存在红色系则也包含盛夏的高原风景那样的炎热的印象的图像。另外,在其他部分系统中,例如在处理纹理的高次不变量的部分系统中具有如下特性:同样的纹理紧密填充的图像集中于低温系统,伴随着合适构图和主要被拍摄物的概要图像集中于高温系统。事先对其他部分系统也说明概略,在纹理的低次不变量的部分系统中,分为平稳安静印象的低温系统、和集中大量物体和/或人物的生硬及充满情感的高温系统。在颜色的高次不变量的部分系统中,分为在日式建筑物和/或盛装等中常见的精悍的印象的低温系统和深重浓厚的颜色搭配的印象的高温系统。像这样TS不变量在分清部分系统的性质方面、在验证是否处理独立的部分系统方面均起到重要作用。
<自由能>
关于能级n以n维向量记载能量En的值,而且增加标量不变量TS来定义自由能F。
[算式65]
其为图像系统自身所具有的表示宏观性质的热力学物理量。能够通过取与成为形容词的模型的线性结合系数α向量的内积来计测从该图像的宏观性质产生了多少某形容词的性质。
[算式66]
模型形容词向量
因此,使用对说明能带的状态密度时的形容词能量Qi的定义施加了若干变更的定义。
1/<S>表示以部分系统单位定义的波尔兹曼常数k。其原因在于,由于用于以部分系统单位计算状态数的普朗克常数h的测定方法不同,所以在统合部分系统时起到用于使两者的标度相应的重要作用。像这样,在进行部分系统统合时,其分母的标准化的方法起到非常重要的作用。作为其基本观点,分母应当具有尽可能取统计平均的结果,这通过实验已是明确的事实。若目的仅为将内积收敛于[-1,1]的区间内,则也认为分母具有分子的绝对值的最大值,但实际上试着进行该处理时,作为整个系统的能量计测失败。
像这样施加变更的第1原因为,求出形容词能量时的内积运算的形式与吉布斯分布的自变量的形式酷似。即,吉布斯分布相对于能量状态En的激发概率表示成
[算式67]
自由能起到概率分布的标准化因子的作用(参照文献E5)。而且,认为感性这一图像系统的宏观性质在能量函数的限制条件E=E(p,q)的波动分布中,具有通过使相位空间上的状态数为熵S(p,q)=S(E)而由能量状态密度分布ρ(En)记述的对应关系。
第2原因为,自由能F=E-TS表示通过它们而形成的热力学的作功量(参照文献E6)。以如下方式对其进行解释。图像系统的微观状态(像素值的分布)以作为表示宏观状态的物理量的能量E、热量TS的形式对人脑产生热力学的功F,从而引起感性。因此,仅从图像系统的信号值分布计算出的能带图表示图像自身的宏观性质,与之相对,对信号值分布乘以线性结合系数α向量而成的状态分布图发挥将人脑内的感性的分布图在视觉上定量化的作用。
实际上,当试着采取这样的表象时,也能够说明视觉心理量的有趣事实。即,能够通过自由能的不同来说明使照片具有纯白背景色的边框的画、与使照片具有纯黑背景色的边框的画产生不同的印象。纯白背景色和纯黑背景色所具有的自由能的值能够分别计算,值不同。从该背景色向边框内显示画时引起与自由能的变化量相当的感性,在前者和后者中该变化量不同,因此认为所引起的感性也不同。
当试着对通过自由能而测定的形容词能量和视觉心理量实际进行实验时,确认了图像的顺序以极其线形关系排列的状况。作为其中之一的解释,认为人的视觉心理量相对于光量具有对数响应特性,相对于吉布斯分布的激发概率的自变量感受到线性缩放的印象。
[文献E5]朗道、栗弗席兹理论物理学教程第5卷“统计物理学第1部”(第3版,1976年),第3章“吉布斯分布”,第28节“吉布斯分布”、以及第31节“吉布斯分布中的自由能”
[文献E6]朗道、栗弗席兹理论物理学教程第5卷“统计物理学第1部”(第3版,1976年),第2章“热力学的各量”,第13节“功和热量”,第15节“自由能和热力学势”、以及第20节“由置于外部环境体中的物体产生的最大功”
[5]记述模型的评估和性能
<形容词的绝对印象的输出>
示出表示某图像且根据能带图对某人的形容词模型下的绝对印象进行数值评估的例子。按值的大小顺序重新排序,例如,以“清爽的”=+0.47、“潮湿的”=+0.02、“粗野的”=-0.16、“热闹的”=-0.75的方式进行记述。
<形容词的相关矩阵>
示出在第5实施方式中定义的、基于某人而阐明形容词与形容词之间的相关关系的形容词的相关矩阵wij的例子。为对直到颜色和纹理的部分系统进行了处理的范围内的值。i和j按“清爽的”、“热闹的”、“粗野的”、“潮湿的”的顺序分配形容词序号。
[算式68]
<再现性>
若事先针对由普通图像的模型组成的总体图像、和从其中选择的形容词模型的图像组准备了对心理印象程度进行例如五级评估的目录,则也能够在对各个不变量确定用于构筑形容词模型的线性结合系数中使用,而且还能够确定作为其部分和的部分系统的线性结合系数。若进一步推进该观点,则关于作为整个系统的总和的Qi,也能够计测模型形容词图像组的Qi的分布的平均值相对于普通图像的Qi的值的分布,作为偏差值在上位组中提取至哪个位置。其能够成为用于观察客观的再现率的指标。
作为模型图像的选择方法,存在符合和不符合的0、1判断方法、和对心理印象程度进行分级而评估的方法。在五级评估的情况下,根据在心理学中称作SD法(Semantic Differential(语义区别)法)的方法,以0表示不符合,以1-5的整数表示符合程度的高低。
在计算平均值和偏差值等统计数据的情况下,在0、1判断的情况下,关于模型图像以均等的权重计算平均。另一方面,在五级评估的情况下,在进行模型平均时,如0.2幅的量的权重符合心理度1,0.4幅的量的权重符合心理度2,…,那样以接受心理度5为1幅的量的权重评估的方式进行计算。
当像这样进行计算时,若通过标准偏差来评估模型图像的平均值和其分布的扩展幅度,则也能够评估平均值的误差。即,与这些值、普通图像的平均值和其标准偏差相应地,计算对模型图像的平均值相对于普通图像的分布的位置进行表示的偏差值,在该过程中,若也根据该定义评估偏差值的误差,则能够导出也与偏差值的评估可靠度相应的数据。
示出从普通图像的254幅模型中选择对于被实验者为“清爽的”、“热闹的”、“粗野的”、“潮湿的”这四个形容词模型的结果中的再现率。在第5实施方式的方法的情况下,多人的统计平均结果表示,按顺序大体为如下的偏差值,并实现极高的再现率。在分别以0-100%定义的偏差值中,为85±12%,86±7%,98±2%,84±12%。对于线形性也只要调查心理评估值与Qi值之间的关系就能够数值化。
首先,在第5实施方式中说明形容词模型的图像大量存在的情况下的稳定的感性检索系统。接着,在第6实施方式中说明也能够应对于形容词模型图像为少量的情况的感性检索系统。接着,在第7实施方式中说明一幅图像的相似图像检索系统。
[第5实施方式]
(感性检索:仅“能量”的二级统合)
1.向孟塞尔HVC颜色空间的转换
与第1~第4实施方式同样地,作为色调面的建立方法,如第4实施方式所记述那样准备进行了中性的分离的面和没有进行中性的分离的面这两方,进行了分离的面用于记述颜色的方面,没有进行分离的面用于记述纹理的方面。
作为将色调环看作一维轴的情况下的处理方法,如本实施方式前的开头说明那样,在颜色的情况下在直方图的频数最小的点处切入而一维化。在纹理的情况下,固定于孟塞尔值的原点处而切入。由此建立以下的HVC各色面的边缘面。对于第1~第4实施方式也以此为基准。
2.建立HVC面的边缘图像
与第2~第3实施方式的说明相同。
3.建立颜色的低次不变量
作为用于区分该部分系统的符号,存在对不变量使用符号Fo的情况。
3-1.建立低次系统的分布函数
与第1实施方式同样地,使直方图的直方柱数为200。由于分布函数以直方柱的单位量化,所以无法记述其以上的精度。同样地以如下方式表示分布函数。
f(H),f(V),f(C)
分布函数f(x)的变量x=H,V,C的值与直方柱数无关,在通过孟塞尔值定义之后,以在HVC之间满足等差率性的方式使用孟塞尔值的基准最大值而在[0,1]中标准化。但是,由于C的值不存在上限,所以虽然不常见但也存在超过1的值的情况。即,
H≡H/100,
V≡V/10,
C≡C/20。
另外,分布函数满足标准化的条件。由此,记述概率密度。
[算式69]
∫f(x)dx=1
关于f(H),中性色调的概率密度记述于f(N)这一个直方柱中。
3-2.熵的计算
根据分布函数f(x)计算熵S。当分布函数的值为0时,表示不取该状态,将0从积分区间排除。当以(α)区分地表示分布函数的色面时,根据H,V,C面的各个分布函数计算出熵,它们的和表示向颜色的低次系投影而得到的部分系统的熵。
[算式70]
SS(H)+S(V)+S(C)
使该值为SFo。
3-3.计算动量的要素pn
根据分布函数f(x)计算平均值<x>和标准偏差值σx。
[算式71]
<x>=∫·xf(x)dx
即使是色调面也使用去除中性成分后的分布函数,在将色调环一维化而得到的轴上计算平均值和偏差值。但是,色调的平均值<H>在半径为1的色调环上以大小始终满足l<H≠N>l=1的复数exp(2πi<H≠N>)进行两成分表述。此时,对表示色调大小的半径增加排出中性后的影响。因此,事先计算中性的比例pop(N)。即,
[算式72]
<H≠N>=∫H≠NHf(H)dH
pop(N)=∫H≠Nf(H)dH
由于x=H,V,C,所以分别作为动量的要素pn而对应。
<H>,<V>,<C>,σH,σV,σC
与色调关联的部分需要以如下方式定义。对分离成两种的成分分配其他要素序号n。
[算式73]
σH=(1-pop(N))σH≠N
此外,动量的要素的值全部在[0,1]的范围内记述。
3-4.计算能量的要素En
作为能量要素En,定义以下内容。
[算式74]
(α)(α)
amam:
<H><H>=(1-pop(N))2|<H≠N>|2
<V><V>
<C><C>
amas:
<V>σV
<C>σC
asas:
σVσV
σCσC
(β)(β):
ambm:
<V><C>
ambs:
<V>σC
<C>σH=<C>(1-pop(N))σH≠N
asbm:
σH<V>=(1-pop(N))σH≠N<V>
σV<C>
asbs:
σHσV=(1-pop(N))σH≠NσV
σVσC
σCσH=σC(1-pop(N))σH≠N
此外,能量的要素值全部在[-1,1]的范围内记述。
3-5.计算部分系统的温度
当汇集能量要素的值而进行向量表述时,能够定义部分系统的能量向量。
[算式75]
当计算部分系统的能量向量的范数时,能够定义与部分系统相关的图像的温度T。
[算式76]
3-6.计算部分系统的自由能
使用这样计算出的能量要素En的向量、图像的温度T、熵S的宏观物理量来定义作为热力学不变量的自由能。自由能是对能量向量增加一个标量而成的向量。
[算式77]
在此,<>表示与任意普通图像相关的统计平均。因此,<S>需要对事先准备的大量的任意普通图像计算图像的熵并计算出它们的平均值。物理上1/<S>起到用于根据该部分系统所规定的普朗克常数h来使相位空间上的微观状态数与熵这一宏观的物理量关联的波尔兹曼常数k的作用。即,相对于相位空间上的状态数
[算式78]
(s为系统的自由度的数量),熵以S=lnΔΓ的关系结合(参照文献E3)。而且,为了将温度与能量关联,经由波尔兹曼常数k通过kT来测量。此外,通常波尔兹曼常数包含于熵侧而定义,温度大多采用能够以与能量相同的标度大小来记述的定义(参照文献E7)。即,S=klnΔΓ。由于图像系统的量子状态根据部分系统而改变普朗克常数的定义,所以无法定义这样的绝对不变的物理常数。因此,以在该部分系统中普通图像可取的平均状态数为基准,实行操作,进行用于以绝对基准来计测各个图像所取的状态数的标准化。其起到与波尔兹曼常数相同的作用。该部分系统的波尔兹曼常数能够以下式表示。
[算式79]
[文献E7]朗道、栗弗席兹理论物理学教程第5卷“统计物理学第1部”(第3版,1976年),第2章“热力学的各量”,第9节“温度”
4.建立颜色的高次不变量
作为用于区分该部分系统的符号,存在对不变量使用符号F的情况。
4-0.低次系统的分布函数的希尔伯特空间表达
使HVC面的颜色的直方图发挥颜色的低次系统的分布函数的作用。低次系统的分布函数也能够解释成可通过原坐标系来测量的坐标空间q。对其进行切比雪夫变换而进行频率表达,并向动量空间p投影。其为原分布函数的从其他方面观察的等价表达。作为形成希尔伯特空间的基底函数,选择增加了低次系统的分布函数的性质且尽可能压缩地表达的完全正交系的函数。但是,由于坐标空间和动量空间的不确定性原理,
[算式80]
也存在当一方为压缩表达时另一方为扩展表达的关系。优选选择该两者的不确定性为最小的函数系统。
与第1实施方式同样地,此时以展开系数的值收敛于[-1,1]的范围内的方式进行定义。
[算式81]
(α)为H时x=H,(α)为V时x=V,(α)为C时x=C。N的值为N=100。
4-1.建立高次系统的分布函数
将进行切比雪夫展开而得到的系数的功率谱定义为与颜色相关的高次系统的分布函数。对于H,V,C三个面,能够定义高次系统的分布函数。为了表示概率密度而事先标准化。
[算式82]
当颜色的高次系统的分布函数也为2N=200时,k的值量化为200个直方柱。
4-2.熵的计算
根据分布函数f(k)计算熵S。当分布函数的值为0时,表示不取该状态的意思,从积分区间排除。当以(α)区分地表示分布函数的色面时,根据H,V,C面的各个分布函数计算出熵,它们的和表示向颜色的高次系统投影而得到的部分系统的熵。
[算式83]
S=S(H)+S(V)+S(C)
使该值为SF。
4-3.计算动量的要素pn
能够将切比雪夫展开系数捕捉为希尔伯特空间中的动量。因此,动量的要素pn为展开系数自身。
pn (α)=cn (α) (α)=H,V,C。
对于不同色面的动量也按顺序以pn汇总地表示。它们构成该部分系统的相位空间的动量p=(p1,p2,…,pi,…)。
4-4.计算能量的要素En
在通过动量的积来构筑表示动能的能量矩阵时,在第5实施方式中以角动量的单位建立部分矩阵,以形成完整系的方式取扩展迹。由此求出能量的固有值。这些固有值为能量的要素。通过基本与第1实施方式相同的要领来构筑能量不变量。
在定义能量的要素时,为了使这些要素分别收敛于[-1,1]的范围内,事先使用以施瓦茨不等式保证的关系并通过能量矩阵的纯粹的迹、即对角要素的和来进行标准化。因此,只通过仅由纯粹的迹构筑的稳定状态无法进行标准化操作。对于除此以外的能量要素全部进行标准化来定义扩展迹。关于纯粹的对角和的值,由于分布函数的展开系数分别在[-1,1]的范围内定义,所以即使在稍微超出时也求出大致[0,1]的范围的值。
由于能量固有值表示绝对能量的量,所以即使最终在取它们的线性结合时,在能量固有值具有有限值的情况下、和线性结合系数具有不为零的值的情况下为不同意义。能量固有值表示有无该图像自身产生的能量要素的存在,线性结合系数仅表示对于某形容词是否为重要的要素。因此,必须以绝对基准计测能量固有值。对于存在上述对角和超过[0,1]的范围而稍微超出的情况的问题,作为原本对于对角和的能量来增加零点能量ε0而得到的值,可以减去与零点能量相当的量来定义。即使导入零点能量也不会对线性结合系数产生任何影响。在此,在颜色的高次系统的切比雪夫展开系数的情况下,作为零点能量而导入1/3=0.333左右的值。另外,在后述的纹理的高次系统的球贝塞尔展开系数的情况下,由于对角和没有超过[0,1]的范围,所以不需要导入零点能量。
以下,在将cn分成角动量单位的部分组而考虑的情况下,使角动量量子数l=0的展开系数表示为c0n,使角动量量子数l=1的展开系数表示为c1n。因此,展开系数的要素数量各等分为N个。部分组的要素序号以n=1,2,…,N计算。另外,通过其它定义来仅提供表示存粹的对角和的一个能量要素。
[算式84]
(其它定义)
(α)(α)
a0a0p,e:
(一般定义)
(α)(α)
a0a0p,e/i:
a0a1p,e:
a0a1m,i:
(α)(β)
a0b0p,e/i:
a0b0m,e/i:
a0b1p,e/i:
a0b1m,e/i:
在此,当取c0k=c0,N+n那样的值时,像c0,N+n=cO,n那样在同一角动量的部分组内使向量{c0k}结合成圆环,并返回最初地点而重新定义。同样地c1,N+n=c1,n。将这些能量要素以En汇总地表示。
4-5.计算部分系统的温度
与上述同样地,能够定义部分系统的能量向量和部分系统的温度T。
[算式85]
4-6.计算部分系统的自由能
与上述同样地,能够定义部分系统的自由能。
[算式86]
该部分系统的波尔兹曼常数通过该部分系统的熵的任意图像的统计平均的倒数来测量。
[算式87]
5.生成纹理的低次不变量
作为用于区分该部分系统的符号,存在对不变量使用符号Go的情况。
5-1.建立低次系统的分布函数
与第3实施方式同样地,使直方图的直方柱数为200。分布函数以直方柱的单位量化而无法通过其以上的精度来记述。同样地以如下方式表示分布函数。
f(△H),f(△V),f(△C)
分布函数f(x)的变量x=△H,△V,△C的值与直方柱数无关,在通过孟塞尔值进行定义之后,以在HVC间满足等差率性的方式作为微分值而在[-1,1]中标准化。
即,
△H≡△H/100,
△V≡△V/10,
△C≡△C/20。
另外,分布函数满足标准化的条件。由此,记述概率密度。
[算式88]
∫f(x)dx=1
5-2.熵的计算
根据分布函数f(x)计算熵S。当分布函数的值为0时,表示不取该状态的意思,从积分区间排除。当以(α)区分地表示分布函数的色面时,从H,V,C面的各个边缘图像的分布函数计算出熵,它们的和表示向纹理的低次系统投影而得到的部分系统的熵。
[算式89]
S=S(H)+S(V)+S(C)
使该值为SGo。
5-3.计算动量的要素pn
根据分布函数f(x)计算平均值<x>和标准偏差值σx。
[算式90]
<x>=∫xf(x)dx
由于x=△H,△V,△C,所以分别作为动量的要素pn而对应。
<△H>,<△V>,<△C>,σ△H,σ△V,σ△C
此外,动量的要素的值全部在[-1,1]的范围内记述。
5-4.计算能量的要素En
作为能量要素En,定义以下内容。这些值全部以实数定义。
(α)(α)
amam:
<△H><△H>
<△V><△V>
<△C><△C>
amas:
<△H>σ△H
<△V>σ△V
<△C>σ△C
asas:
σ△Hσ△H
σ△Vσ△V
σ△Cσ△C
(β)(β):
ambm:
<△H><△V>
<△V><△C>
<△C><△H>
ambs:
<△H>σ△V
<△V>σ△C
<△C>σ△H
asbm:
σ△H<△V>
σ△V<△C>
σ△C<△H>
asbs:
σ△Hσ△V
σ△Vσ△C
σ△Cσ△H
此外,能量的要素的值全部在[-1,1]的范围内记述。
5-5.计算部分系统的温度
与上述同样地,能够定义部分系统的能量向量和部分系统的图像的温度T。
5-6.计算部分系统的自由能
与上述同样地,能够定义部分系统的自由能。
[算式91]
该部分系统的波尔兹曼常数通过该部分系统的熵的任意图像的统计平均的倒数来测量。
[算式92]
6.生成纹理的高次不变量
作为用于区分该部分系统的符号,存在对不变量使用符号G的情况。
6-0.低次系统的分布函数的希尔伯特空间表达
使HVC面的边缘图像的直方图发挥纹理的低次系统的分布函数的作用。低次系统的分布函数也能够解释成可通过原坐标系来测量的坐标空间q。对其进行球贝塞尔变换而进行频率表达,并向动量空间p投影。其为原分布函数的从其他方面观察的等价表达。作为形成希尔伯特空间的基底函数,选择增加了低次系统的分布函数的性质且尽可能压缩地表达的完全正交系的函数。但是,由于坐标空间和动量空间的不确定性原理
[算式93]
也存在当一方为压缩表达时另一方为扩展表达的关系。优选选择该两者的不确定性为最小的那样的函数系统。
与第3实施方式同样地,在本实施方式,说明基于s,p轨道的展开的情况。此外,基于s,p,d,f轨道的展开的情况也能够以开头说明的方式同样地进行展开。
[算式94]
(α)为H时x=△H,(α)为V时x=△V,(α)为C时x=△C。N的值为N=100。
6-1.建立高次系统的分布函数
将进行球贝塞尔展开而得到的系数的功率谱定义成与纹理相关的高次系统的分布函数。能够对H,V,C三个面定义高次系统的分布函数。为了表示概率密度而事先标准化。
[算式95]
纹理的高次系统的分布函数在N=100时,对一个角动量将k的值量化为100个直方柱。由于l的值取0和1所以共计量化为2×100=200个直方柱。
6-2.熵的计算
根据分布函数f(l,k)计算熵S。当分布函数的值为0时,表示不取该状态的意思,从积分区间排除。当以(α)区分地表示分布函数的色面时,根据H,V,C面的各个边缘图像的分布函数计算出熵,它们的和表示向纹理的高次系统投影而得到的部分系统的熵。
[算式96]
S=S(H)+S(V)+S(C)
使该值为SG。
6-3.计算动量的要素pn
能够将球贝塞尔展开系数捕捉为希尔伯特空间中的动量。因此,动量的要素pn为展开系数自身。
pn (α)=c0n (α)
pN+n (α)=c1n (α) (α)=H,V,C。
对于不同色面的动量也按顺序以pn汇总地表示。它们构成该部分系统的相位空间的动量p=(p1,p2,…,pi,…)。
6-4.计算能量的要素En
当展开至s,p轨道时,与对作为颜色的高次系统的切比雪夫展开系数定义的算式完全相同。将切比雪夫展开系数置换成球贝塞尔展开系数即可。此外,在纹理的高次系统的情况下,将零点能量置为ε0=0即可。
6-5.计算部分系统的温度
与上述同样地,能够定义部分系统的能量向量和部分系统的图像的温度T。
6-6.计算部分系统的自由能
与上述同样地,能够定义部分系统的自由能。
[算式97]
该部分系统的波尔兹曼常数通过该部分系统的熵的任意图像的统计平均的倒数来测量。
[算式98]
7.部分系统向形容词能量的统合
7-1.设定形容词
确定以形容词为关键词的感性检索系统所提示的形容词,作为用于区分这些形容词的符号,分配为第i个形容词。作为形容词,例如,为“清爽的”、“热闹的”、“粗野的”、“潮湿的”等。
7-2.构筑普通图像模型
随机收集多幅任意的普通图像,将这些图像作为普通图像的模型。通常,准备数百幅以上的数量级的图像。若期望更准确则准备上万的数量级的图像,图像越多则统计越稳定。使用这些图像构筑以下说明的普通模型图像组的分布函数p(x)。分布函数p(x)在实数值En所取的单位能量区间内表示普通图像可取的图像频度,若将能量区间划分成直方柱,则成为频数分布函数。
7-3.构筑形容词模型图像
对上述准备的普通图像模型分别进行是否符合第i个形容词的心理印象评估,从而生成形容词模型图像的分布数据。该生成方法存在两种,可以使用任意一种。即,在仅为符合、不符合的情况下分配1、0的整数,将被分配了1的图像用作相同权重的图像。然后,使用该图像组来构筑形容词模型图像组的分布函数q(x)。另一种方法为,在不符合的情况下为0,对该情况下的心理绝对印象程度进行1-5的五级评估。在该情况下,在构筑模型的分布数据时,对评估为5的图像施加1.0的权重,对评估为4的图像施加0.8的权重,对评估为3的图像施加0.6的权重,对评估为2的图像施加0.4的权重,对评估为1的图像施加0.2的权重,从而构筑以下说明的频数分布q(x)。
7-4.计算要素内的分布中的偏差值
对上述定义的部分系统的各个能量要素En单独地调查普通模型图像所取的En的值的分布和形容词模型图像所取的En的值的分布,当形容词模型图像相对于普通模型图像的平均分布于不同位置时,该能量要素对于该形容词起到特殊作用,以取能量和时的线性结合系数的形式提供其权重。该特殊作用的情况能够由形容词模型图像的分布相对于普通模型图像的分布所位于的偏差值提供。
以变量x表示能量要素En,普通模型图像的分布函数为p(x),形容词模型图像的分布函数为q(x)。使普通模型图像的能量要素En的平均值为mp,使其标准偏差为σp,使形容词模型图像的能量要素En的平均值为mq,使其标准偏差为σq。此时,与第i个形容词对应的相对于能量要素En的线性结合系数αi(En)能够使用误差函数erf(x)以如下方式表示。线性结合系数定义成当与普通模型图像的平均值位于同一处时为0,位于两端时为±1。另外,也能够评估形容词模型图像组的偏差值的波动、即线性结合系数的误差δαi(En)。
相对于各能量要素En,
[算式99]
∫p(x)dx=1 ∫q(x)dx=1
mp=∫xp(x)dx mq=∫xq(x)dx
偏差值及其误差
[算式100]
在此为
[算式101]
返回erf(±∞)=±1,erf(0)=0的值。
7-5.计算部分系统单位的部分能量
输入某图像,为了调查其是否具有第i个形容词的印象,对该输入的图像计算出各部分系统的能量要素,使用通过形容词模型而确定的线性结合系数来求出该形容词能量的绝对量的总和。在求出其总和时,首先以部分系统单位取部分和。在此对部分系统的自由能向量取与对线性结合系数进行向量表述而得到的模型形容词向量的内积来定义部分和。此时,作为自由能,对增加了热量-TS这一个标量而成的成分也定义对应的线性结合系数。即,
自由能向量
[算式102]
模型形容词向量
[算式103]
标注以a1,a2,…的方式区分部分系统的指标,并通过内积而求出部分系统单位的能量和Pi。a1与颜色的低次系统对应,a2与颜色的高次系统对应,a3与纹理的低次系统对应,a4与纹理的高次系统等对应。
[算式104]
…
但是,在取这些线性结合来求出全部形容词能量Qi时,仅仅在上述内积中,能够定义的能量要素的数量越多的系统则Pi的值越取大的值。部分系统记述了独立的方面,在进行部分系统的统合的时刻,需要进行均等的处理。因此需要以使部分和Pi的值大体收敛于[-1,1]的范围内的方式事先标准化。即,
[算式105]
在此<>a表示与全部部分系统之间相关的统计平均。即,当使研究的部分系统的数量为na时,
[算式106]
在此也以应当在分母的标准化中尽可能地进行统计平均的这一观点为基准。由此,吸收由根据部分系统而不同定义的分布函数的量化的直方柱数的不同所导致的状态数的不同、即熵的不同,能够使不同的部分系统处于共同条件。即,在此吸收因部分系统而不同的普朗克常数或波尔兹曼常数的定义,计算出能够进行同等处理的标度的能量物理量Pi。能够将物理上分母的平方根的项解为在因部分系统而物理常数不同时所需要的修正项。一方的平均温度或形容词向量的范数平均为用于吸收能够通过部分系统而定义的能量要素的数量不同的标准化。像这样用于使部分系统处于共同条件的基于范数的统计平均量的标准化在规定绝对物理量方面起到极为重要的作用。
为了参考而准备大量任意的普通图像,示出实验上对各个部分系统调查这些熵的值和温度的值而得到的结果。只要观察这些数值就会知道标准化的过程在统合部分系统方面如何重要。
因此,为1/<S>~0.1的数量级的数值,分母的平方根为1.1~1.6左右的值。
8.整个系统向形容词能量的统合
接下来统合部分系统的能量。为了求出整个系统的形容词能量Qi,对部分和能量Pi进行线性结合。此时的线性结合系数确定对于某形容词i而言,颜色的低次系统、颜色的高次系统、纹理的低次系统、纹理的高次系统等的哪一个系统占据重要的作用。而且在增加作为部分系统的构图时,也增加构图的要素的重要度。
用于确定线性结合系数的步骤通过与为了对上述的各个能量要素En确定αi而进行的过程同样的过程来进行。即,使部分和Pi,j为变量x,对普通模型图像的分布求出平均值为mp,求出其标准偏差为σp,对形容词模型图像的分布求出平均值为mq,求出其标准偏差为σq,同样地确定线性结合系数。
[算式107]
使用这些线性结合系数来求出与形容词i相关的整个系统的能量和Qi。此时也以大体收敛于[-1,1]的范围内的方式事先进行标准化。
[算式108]
在此<>表示与普通模型图像相关的平均,<>i表示与形容词相关的平均。此外,此前所示的能带图是对于该部分系统的加权系数k也使用内含的形式的α(En)来描述的图。另外,关于状态密度,对于在用于普通模型图像的能量要素中正负摆动最大的色域ρmax(En),使最大考虑为α(En)ρmax(En)的范围作为能带模型而展现。
9.形容词检索处理
像这样当作为学习用而组合普通模型和形容词模型来构筑能带模型时,对于其他数据库的图像,使第i个形容词为关键词,能够根据形容词能量Qi来检索印象与其接近的图像。当按Qi的顺序排列图像时,其再次成为与正态分布接近的形态,能够将上位组的偏差值高的区域作为目的图像而提示。另外,还能够将下位组的偏差值低的区域作为与该形容词具有相反构造的印象的图像而提示。即,作为用户也能够得知相反意义的感性图像的分类结果。
而且,若输入某一幅图像并对预先准备的形容词模型的形容词全部计算Qi,则对于成为该模型的人物,能够将从该图像感受到的绝对印象的程度关于全部形容词而进行数值化。若将其按值的大小重新排序而显示,则该图像为“清爽的”是0.8,“晴朗的”为0.7也较高,若“热闹的”为-0.7则因在相反方向较低所以能够提示完全感受不到该印象的结果。
作为形容词的能带模型,也能够取大众共同的平均模型,还能够根据国家、文化,语言的不同来构筑这些文化圈所特有的模型。或者,还能够构筑反映了个人级别的不同嗜好的个性能带模型。因此,该图像检索系统所采用的能带构造的模型也能够用作定量地阐明人的感性构造的工具。
实验上,当进行实验看能否区分个性的不同时,对于“粗野的”这一形容词,针对第一人选择的山表的树林直耸林立的风景和河川水流湍急而水花飞溅的状况为等分程度的模型,感性检索结果示出复合地捕捉这些要素并集中于上位组的效果。另外,相对于其他人将河川水流湍急而水花飞溅的状况选择为主要模型图像,形容词能量Qi恰好捕捉到河川水流的特征,示出了提取与模型接近的图像的性能。于是,能够说作为特征量而使用的能量要素En具有识别映入图像整体的物体的能力。
此外,扩展通过偏差值来求出线性结合系数的观点,关于最终求出的Qi的值,若再次求出模型图像组的Qi相对于普通模型的偏差值,就能确认形容词模型图像相对于普通模型图像是否集中于上位组。由此,能够验证理论模型的正当性和要处理的特征量的充分性。
[算式109]
扩展该观点,通过对最终求出的与各个形容词相关的Qi,而观察第i个形容词能量Qi的形容词模型图像分布相对于第j个形容词能量Qj的普通模型图像分布位于何处,可知对于第j个形容词,第i个形容词的绝对印象被包含多少,从而能够求出形容词间的相关矩阵wij,该相关矩阵wij表达第i个形容词属于带来与第j个形容词相近印象的同类组那样的形容词、或者第i个形容词属于带来与第j个形容词为完全相反印象的相距甚远的形容词组的形容词。由此,能够明确大众共同的形容词构造的图谱,并且也能够阐明与文化圈的不同、个性的不同相关的形容词的图谱构造。
[算式110]
调换i和j的关系,能够以其他途径同样地计算第j个形容词能量Qj的形容词模型图像分布相对于第i个形容词能量Qi的普通模型分布图像的偏差值。根据定义,形容词的相关矩阵为对称矩阵。即,
wij=wji
但是,参照其他途径而计算的结果不一定与在总体图像的性质中存在偏差的情况等一致。因此,形容词的相关矩阵提供了用于验证与以下内容相关的妥善性的良好指标:是否表示与对称矩阵相近的值、在构筑模型过程中选择的图像组是否选定了普通性较高的随机图像。另外,对角成分如上述那样优选全部为1,在没有到达1的情况下,表示用于捕捉该形容词的特征量不足、或存在导致理论模型假说不成立的部分,因此在构筑检索系统方面提供良好的评估指标。
[第6实施方式]
(感性检索:“能量+动量+角动量”的三级统合)
在第5实施方式中,说明了也能够实现反映了个性的形容词检索。但是,在构筑个人的形容词模型时,优选准备某种程度的大量图像。与之相对,在出于提示更少量的3~5幅左右的图像并想要从数据库选出与这些图像感性相近的图像的目的时,由于基于统计平均的信息的消失过程为不完全状态,所以产生将在第5实施方式中省略的力学不变量也增加为研究对象的需要。以下仅说明随之而新增加的过程。
1.向孟塞尔HVC颜色空间的变换
2.建立HVC面的边缘图像
3.生成颜色的低次不变量
3-1.建立低次系统的分布函数
3-2.熵的计算
3-3.计算动量的要素pn
在第5实施方式所定义的动量中,仅使平均值<H>、<V>、<C>为动量的要素。
3-4.计算角动量的要素Mn
在第5实施方式所定义的动量中,使标准偏差值σH、σV、σC为角动量的要素。
3-5.计算能量的要素En
3-6.计算部分系统的温度
在颜色的高次系统中沿袭与后述内容相同的过程。在此不详细说明。
3-7.计算部分系统的自由能
在颜色的高次系统中沿袭与后述内容相同的过程。在此不详细说明。
4.生成颜色的高次不变量
4-0.低次系统的分布函数的希尔伯特空间表达
4-1.建立高次系统的分布函数
4-2.熵的计算
4-3.计算动量的要素pn
4-4.计算角动量的要素Mn
由于切比雪夫展开系数分为角动量量子数l=0和l=1,所以取角动量量子数与动量的积来计算角动量。角动量的要素Mn如下所示。
(c11 (α)+c12 (α)+…+c1N (α)) (α)=H,V,C。
4-5.计算能量的要素En
4-6.计算部分系统的温度
若以能量的单位汇总地对能量要素的值进行向量表述,并同样地以动量的单位汇总地对动量的要素的值进行向量表述、以角动量的单位汇总地对角动量的要素的值进行向量表述,则能够定义部分系统的能量向量、动量向量和角动量向量。
[算式111]
当计算部分系统的能量向量、动量向量、角动量向量的各自范数时,能够以力学不变量的单位定义与部分系统相关的图像的温度TE,Tp,TM。
[算式112]
4-7.计算部分系统的自由能
根据能量的情况下的类推,定义部分系统的自由能、自由动量、自由角动量。
[算式113]
5.生成纹理的低次不变量
与在“3.生成颜色的低次不变量”中说明的要领完全相同。
6.生成纹理的高次不变量
当基于s,p轨道进行球贝塞尔展开时,由于与在“4.生成颜色的高次不变量”中说明的要领完全相同,所以省略记述。
7.统合部分系统的力学的不变量单位
7-1.设定形容词
7-2.构筑普通图像模型
7-3.构筑形容词模型图像
7-4.计算要素内的分布中的偏差值
在第5实施方式中对各能量要素En进行偏差值和其误差的计算,但在第6实施方式中对动量的要素pn和角动量的要素Mn也进行同样的计算。改变符号,使相对于能量要素的偏差值为βi,使相对于动量的要素的偏差值为γi,使相对于角动量的要素的偏差值为δi。
[算式114]
7-5.计算部分系统的力学不变量单位的部分能量、部分动量、部分角动量
如上所述,对自由能向量、自由动量向量、自由角动量向量分别确定模型形容词向量。此外,对TS不变量也经由同样的过程来确定偏差值。即,
[算式115]
取两者的内积而统合于与形容词i的印象相关的部分系统的力学不变量单位的部分能量Ei、部分动量pi、部分角动量Mi。通过标准化使全部的力学不变量的维度一致。
[算式116]
8.部分系统向形容词能量的统合
在部分系统中求出的三个力学不变量表示部分系统内的与形容词i相关的统计平均后的能量的期望值、动量的期望值、角动量的期望值。在这些宏观物理量中,在少量图像模型的情况下,通过对三个力学不变量进行线性结合时的结合系数来表示哪个物理量起到重要作用。这些结合系数同样地能够根据普通模型图像和形容词模型图像的分布函数的位置关系通过偏差值而记述。使各个结合系数由αi(Ei),αi(pi),αi(Mi)表示。
[算式117]
使三个线性结合系数记载为αi的向量,使三个力学不变量记载为E′的向量。
[算式118]
部分系统的形容词能量Pi取它们的内积来表示。
[算式119]
9.整体系统向形容词能量的统合
后面与第5实施方式完全相同。
10.形容词检索处理
[第7实施方式]
(一幅图像的相似图像检索:“能量+动量+角动量”的三级统合)
在第6实施方式中,示出了构筑基于少量模型的形容词模型的例子。若将其进行至极限,则能够用于一幅相似图像检索。即,通过作为宏观物理量的能量、动量、角动量的记述来提取与被例示的一幅图像的整体印象接近的图像。
第6实施方式的方法包含第5实施方式的方法。其原因在于,当模型图像为大量时,动量和角动量的作用减少,通过自动进行统计平均,它们的线性结合系数收敛于与零接近的值。因此,第6实施方式的方法能够连贯地实现从一幅图像检索至少量模型的感性检索、进而至大量模型的感性检索。
<向均等识别空间的投影>
对从在此前的实施方式中定义的一维分布函数导出的动量、角动量、能量的概念,再次从人的识别相关观点出发进行讨论。
此前称作低次系统、高次系统的系统,前者表示以孟塞尔颜色空间表示的实际空间记述,后者表示使用基底函数将以孟塞尔值表示的实际空间的分布函数向频率空间投影而得到的频率空间记述。
孟塞尔颜色空间是能够保证可感知的等差率性的均等颜色空间。因此,实际空间记述中的孟塞尔值自身提供了保证空间的一致性的颜色空间。另一方面,在识别一维直方图等形状时,存在该直方图的分布函数应当满足的限制条件,人在增加该限制条件之后识别出存在自由度的部分的形状的不同。当使用与该限制条件具有相同性质的基底函数来进行频率展开时,该展开系数能够发挥向均等地将存在自由度的部分的形状的不同识别出的空间变换的作用。即,频率空间记述中的基底函数空间提供了保证空间的一致性的识别空间。
因此,保证了可感知的颜色识别的一致性的孟塞尔颜色空间所提供的实际空间、和保证了分布函数的形状识别的一致性的基底函数的希尔伯特空间所提供的频率空间均能够看作形成保证了同样识别的均等识别空间。即孟塞尔颜色空间提供“颜色的感知”中的均等识别空间,希尔伯特空间提供“形状的识别”中的均等识别空间。
在物理学中,从“空间的一致性”导出“动量守恒定律”。而且从“空间的等方向性”导出“角动量守恒定律”,从“时间的一致性”导出“能量守恒定律”(参照文献A2-2)。
当使其与图像系统对应时,在图像识别中,由于实际空间记述中的孟塞尔值的坐标系保证了空间的一致性,所以能够使孟塞尔颜色空间相当于动量守恒定律成立的空间。因此孟塞尔值自身的大小和出现频度定义动量。另外,由于频率空间记述中的基底函数的坐标系也保证了空间的一致性,所以能够使频率空间相当于动量守恒定律成立的空间。因此展开系数定义动量。但是,当假设质量为常数1时,也能够捕捉成动量表示速度。因此,在图像识别中,能够将各个图像所取的孟塞尔值和频率展开系数捕捉为动量,从而能够成为在图像间使动量守恒定律成立的特征量。
由于在保证空间的一致性的空间中也保证了空间的等方向性,所以若定义了该空间中的坐标,则能够以动量与坐标的积的形式定义角动量,角动量守恒定律也成立。因此,当定义与角动量相当的物理量时,各个图像所取的孟塞尔值或从频率展开系数导出的角动量能够成为在图像间使角动量守恒定律成立的特征量。
图像系统中的时间的一致性,发挥任意图像作为捕捉任意画面所得到的图像而在任何场景均等概率地产生的作用。因此,若定义了以动量或速度的二次形式表示的能量这一物量,则由于能量守恒定律成立,所以该图像的特征量表示在唤起同一图像识别或同一图像感性的图像间能够成为具有共同值的有效特征量。
因此,使实际空间记述中的孟塞尔值和频率空间中的展开系数相当于动量,当由此定义角动量和能量时,表示在图像识别中作为记述了在多幅图像间唤起共同认识或感性的图像的特征的量,能够成为有效地守恒于图像间的物理量。它们全部为相加性的物理量,能够假设以这些物理量的线性结合表示最终图像识别的强度和感性的印象程度。其为“感性的线性模型”假说。
从图像导出表示颜色和边缘等的独立部分系统的分布函数,将该分布函数向实际空间或频率空间的均等识别空间投影,而且,与普通的大量图像的普通图像组同时地,对产生某共同感性或某共同物体识别的特定图像组分别进行向由能量、动量、角动量组成的特征量投影的操作。即,在图像识别的感知空间和线形空间中进行投影表达,通过投影面调查特定图像组在普通图像组中具有怎样的偏差而分布,若能够通过该偏差度确定在该特定图像组中特别守恒的特征量的重要程度,则能够将最终个别图像的印象程度绝对数值化。另外,在记述了可相加特征量的空间中,能够视觉地表达对人的心理构造和对物体的识别产生作用的特征构造。使该状况包含以下说明的构图系统,与图22、图23、图24相应地示出。
[文献A2-2]朗道=栗弗席兹理论物理学教程第1卷“力学”(增订第3版,1973年),第2章“守恒定律”
<存在四个主轴>
作为相互独立性高的分布函数,如图13的V面的例子所示,存在形成四个主轴的分布函数。实际上,H,V,C这三个色面作为按主轴的分布函数而存在。
灰度的一维分布存在既已处理的颜色的一维分布函数和边缘的一维分布函数这两个主轴。构图的二维分布在至第6实施方式为止的说明作为一个主轴而处理,但实际上颜色和边缘它们两个的二维分布函数作为主轴而存在。因此,将灰度的一维分布和构图的二维分布合起来而以四个主轴系统为基本。此外,此前称作纹理的部分系统在以后改称为边缘。
一维系统的颜色的直方图和边缘的直方图由于均表示频数分布,所以全部以正值定义,若通过频数的总和进行标准化则以概率密度表示并称作分布函数。二维系统的色面的值也由于全部以像素值为正的值定义,所以若通过像素值的总和进行标准化则成为分布函数。但是,由于二维系统的边缘面的值具有正值和负值这两方,所以无法单纯地成为分布函数。因此,对进行了多重析像度统合后的边缘面的值平方而全部以零以上的值来定义二维系统的边缘面的分布函数,并将使其概率密度化而得到的函数作为边缘面的分布函数。与边缘的二维分布相关的主轴取实际空间表达和频率空间表达这两种表达,但在频率空间表达时始终采用该定义。在实际空间表达时需要定义分布函数的情况下,采用该定义,在需要一方的原边缘强度的正负值的情况下使用原平方前的统合边缘面。
<实际空间表达与频率表达之间的作用>
在此,为了在各个主轴记述同一分布函数,说明进行实际空间表达和频率空间表达时的空间坐标的与取法相关的作用的不同。
在一维分布函数的实际空间记述中,起到规定灰度的可取范围的HVC值或与其边缘相关的HVC的微分值的信号的绝对量的作用。即,例如在V面的颜色直方图的情况下,即使明亮度等级没有取孟塞尔值的0-10的全部值而分布于5-10的范围,也规定0-10的范围内的平均值和波动幅度。因此,在实际空间记述中,起到确定分布函数的绝对标度下的位置关系的作用。
在一方的一维分布函数的频率空间记述中,最初分布函数仅提取作为值而实际分布的范围,在该区间定义起点和终点的坐标,在使对比度最大化之后评估分布形状。因此,在频率记述中,起到进行分布函数的形状的相对标度下的评估的作用。
在二维分布函数中,即使规定了实际空间表达和频率空间表达的作用,也从同样的观点出发进行扩展。
在二维分布函数的实际空间记述中,关于与明亮度等级的信号强度相关的坐标设定,与一维分布函数的情况同样地,直接使用灰度值的绝对信号的值。关于与x轴和y轴的空间距离相关的坐标设定,直接规定绝对长度。即,与纵横比的不同相关的信息能够确认在实际空间中规定的位置。
在一方的二维分布函数的频率记述中,关于与分布函数的值相关的坐标设定,与一维分布函数的情况同样地,仅提取最大值和最小值的范围,并评估该区间中的分布形状。而且关于x轴和y轴的空间位置坐标,即使在实际空间中纵横比不同也在频率空间中将用于纵和横的展开系数的数量设定成相同数量,并始终将二维展开系数表达为方阵。即,纵横比不同的图像也始终相对化成1:1地记述。
因此,在频率表达中,距离也纵横地相对化,对比度也在灰度的分布区域内相对化而起到评估分布函数的形状的作用。在实际空间表达中,起到规定纵横的绝对位置并在灰度域内规定绝对信号的强度的作用。
此外,在频率表达中,在相对化到分布函数的值的分布区域内之后,通过基底函数而进行频率展开的展开系数的值必然能够收敛于[-1,1]的值的范围内。当使频率空间中的展开系数相当于速度时,在速度的可取范围存在界限点,也能够考虑使其与光速对应。
<构图的低次不变量>
研究颜色的构图的低次不变量的组合方法。像从颜色的一维分布函数导出与能量相关的不变量时那样构筑模型哈密顿算子。
表示孟塞尔值的二维分布的H(x,y),V(x,y),C(x,y)示出动量的值的分布。在此,示意地使用动量的符号
[算式120]
来表示具有(明亮度强度)×(空间的位置向量)的维度的物理量。
以如下方式设定模型哈密顿算子。形式上地表示动能。
[算式121]
其将分为平均项和波动项而分解。对于平均项,通过
[算式122]
来示意地表示具有(明亮度的平均强度)×(空间的平均位置向量)的维度的物理量。对于波动项,通过
[算式123]
来示意地表示具有(明亮度的波动幅度)×(空间的扩展幅度)的维度的物理量。当对模型哈密顿算子进行展开时,为
[算式124]
进一步导入平均场近似的观点,当对该模型哈密顿算子取平均时,具有波动的一次项的被最后三个括号括起来的算式和与波动项的空间的扩展方向相关的向量成分相互抵消,波动项的期望值为
[算式125]
所以全部消失。因此,剩余的仅为被最初的四个括号括起来的算式。
[算式126]
由于平均项和波动项分别通过明亮度方向与空间方向的积来记述,所以实际上平均项通过向量来记述,波动项通过张量来记述。详细情况在实施方式中定义。
与二维平面的刚体的运动建立对应地捕捉以该模型哈密顿算子记述的运动。明亮度方向的强度值的分布发挥具有与刚体的运动相关的维度、即单位时间的变化率的维度的作用。空间方向的分布记述了刚体的静止状态下的形状因子而发挥具有与距离相关的维度的作用。
将平均项捕捉为与刚体的平移运动相关的记述,将波动项捕捉为与刚体的旋转运动相关的记述。与刚体的运动相关的动量、角动量、能量分别以具有如下维度的形式定义。即,动量和角动量为明亮度方向的强度的一次形式,能量为明亮度方向的强度的二次形式。
动量=(平均项)=(空间重心)×(明亮度平均)
角动量=(扩展项)=(空间扩展)^2×(明亮度扩展)
能量=(平均项的平移动能)+(扩展项的旋转动能)
=(空间重心的距离)^2×(明亮度平均)^2+(空间扩展)^2×(明亮度扩展)^2
将模型哈密顿算子展开,通过平均场近似而留存的被最初两个括号括起来的项表示平移动能,被最后两个括号括起来的项表示旋转动能。(空间扩展)^2通过表示来自重心位置的二次转矩的平均扩展的惯性张量而记述。当像这样使空间扩展为以重心系统为中心的记述时,能量的平均项和波动项的交叉项的成分消失。与刚体运动相关的详细说明在文献H1中进行。另外,在H,V,C间出现HV,VC,CH的组合的交叉项的原因在于,由于HVC没有记述完全独立的成分,所以以具有该交叉能量的方式构筑模型哈密顿算子。
通过模型哈密顿算子的展开而导出的项所对应的具体表达式在本实施方式中定义。图25是表示与构图的低次不变量的构筑相关的要素的关系的图。与通过一维分布所定义时同样地,在其扩展中,也在二维分布时,动量与平均项对应,角动量与扩展项对应或波动项对应。
在此,说明从灰度的一维分布函数导出的特征量、与从构图的二维分布函数导出的特征量之间的关系。一维分布函数所规定的部分系统通过明亮度因子的部分而相互具有相关性地记述。即,导出颜色的一维分布的部分系统和颜色的二维分布的部分系统在明亮度因子的部分具有重合的特征量。导出边缘的一维分布的部分系统和边缘的二维分布的部分系统也在明亮度因子的部分具有重合的特征量。但是,在从二维分布导出的特征量中新增加了与空间因子相关的信息,记述了与从一维分布导出的特征量相互独立的要素。
[文献H1]朗道=栗弗席兹理论物理学教程第1卷“力学”(增订第3版,1973年),第6章“刚体的运动”,第31节“角速度”、第32节“惯性张量”、以及第33节“刚体的角动量”
<基于频率记述的向均等识别空间的映射>
在此前的四个主轴中,在将颜色的一维分布函数向希尔伯特空间投影来进行频率记述时使用切比雪夫函数,在将边缘的一维分布函数向希尔伯特空间投影来进行频率记述时使用球贝塞尔函数。其原因在于,选定了使与分布函数的形状的可取的限制条件相适合的形状识别均等化的基底函数。以表示基底函数的频率分布的展开系数记述分布函数的形状,由此向均等识别空间映射。通常,说明了颜色的方面可以通过属于超几何函数的特殊函数来记述、边缘的方面可以通过属于合流超几何函数的特殊函数来记述的原则。
在对剩余的两个主轴即颜色的二维分布函数和边缘的二维分布函数进行希尔伯特空间表达时选定基底函数的情况下,也适用该原则。实际上作为与颜色的二维分布函数的频率表达相适合的基底函数而选择相伴勒让德函数。另外,作为与边缘的二维分布函数的频率表达相适合的基底函数而选择傅里叶函数。以下说明该选定理由。
1)对颜色的二维分布函数选定相伴勒让德函数的理由
相伴勒让德函数为超几何函数的一种,适于记述颜色的分布。相伴勒让德函数Pm l(x)通过磁量子数m和方位量子数l这两个指数来定义,在方位量子数l不同的基底函数之间,基底函数的正交性具有空间加权均一的正交性。磁量子数m=0的最低次的方位量子数l所形成的函数组P0 l(x)=Pl(x)称作勒让德函数。列举相伴勒让德函数的正交性的关系式和勒让德函数的基底函数的低频侧的具体式。
[算式127]
正交性
勒让德多项式
P0(x)=1
P1(x)=x
在此,图26是勒让德多项式中的P2(x),P3(x,)P4(x),P5(x)的曲线图。勒让德函数在两端的x=-1和x=1具有奇点。勒让德函数为适于记述将电荷置于该奇点位置时的与电多重极的分布相关的性质的函数。而且,以勒让德函数的低频侧的第一波的函数为P1(x)=x而记述层次(gradation)。
当试着将这些性质适用于图像时,对于均匀分布的被拍摄物像切入构图的框架(framing)。作为图像,该切入点成为奇点,在从图像的构图方面识别形状时作为成框架效果而作用。对于从该奇点观察到的形状分布,使用包含多重极的概念的相伴勒让德函数而能够进行空间分布的频率空间中的高维的转矩解析。作为图像,对于右端和左端、或上端和下端,若以地球为例具有与北极和南极相当那样的奇点,并且与其无关而其间的空间同样地处理。其与使空间框架化而截取构图的性质一致。而且,颜色的分布具有像蓝天那样显现层次的性质。在该方面,勒让德函数在其第一波也具有该基底函数的方面,为适于对颜色的二维分布函数极为压缩地进行频率表达的函数。
此外,与相伴勒让德函数的详细性质相关的说明参照文献B3。
[文献B3]乔治阿夫肯基础物理数学第3卷“特殊函数和积分方程式”(第2版,1970;日语译1978),第2章“勒让德函数”及第3章“特殊函数”
2)对边缘的二维分布函数选定傅里叶函数的理由
傅里叶函数与具有三个奇点的超几何函数、具有两个奇点的合流超几何函数不同,与不具有奇点的微分方程式的分类的函数相当。边缘的二维分布函数不是通过具有正值和负值的边缘面那样的性质来记述的,而是通过对这些正值和负值进行平方而得到的值的分布来记述的。在从色面检测边缘面的阶段,该图像在大部分具有接近于零的值。由于在该基础上平方,所以值的分布具有呈极为平滑的波形形状的性质。
这样得到的图像除了对比度高的边缘部分以外大部分为纯黑的图像,假设即使连接右端和左端的图像而呈圆柱形,或者连接上端和下端的图像而呈圆柱形,也为没有识别出基于分布不同的异常切入而具有平滑地连接的性质的图像。其表示适于以在图像的两端没有奇点的无限扩展的波形记述。没有奇点、两端的边界条件具有值为零或微分以零连接的性质的傅里叶函数与该图像的波形分布的特征极其一致。而且,傅里叶函数还具有在处理构图时同样地处理作为重要性质的空间的性质。事先记载基于同样加权函数的傅里叶函数的正交性的关系式。
[算式128]
<频率记述中的部分系统之间的相关性>
当排列对四个主轴的分布函数进行频率展开而得到的各个部分系统的算式时,如下所示。
[算式129]
一维颜色分布函数的切比雪夫展开
一维边缘分布函数的球贝塞尔展开
二维颜色分布函数的相伴勒让德函数展开
二维边缘分布函数的傅里叶展开
图像整体的分布函数通过同时展开来记述。
f=fχ·fγ·fθ·fφ
通过向主轴的分布函数投影的操作,图像的变量被进行变量分离,颜色的一维分布函数发挥记述与自旋系的一个独立变量相关的性质的作用,边缘的一维分布函数发挥记述与矢径方向的一个独立变量相关的性质的作用,颜色的二维分布函数发挥记述与天顶角方向的两个独立变量相关的性质的作用,边缘的二维分布函数发挥记述与方位角方向的两个独立变量相关的性质的作用。作为独立变量的轴而存在六个。
在通过二重级数进行边缘的一维分布函数的球贝塞尔展开时,与次数l相关的正交性由对颜色的二维分布进行展开而得到的与相伴勒让德函数的量子数l相关的基底函数的正交性承担。因此,球贝塞尔展开系数在该部分系统中,在封闭状态下单独地以仅满足与量子数n的根相关的正交性的方式确定。
在通过二重级数进行颜色的二维分布函数的相伴勒让德函数展开时,与次数m相关的正交性由对边缘的二维分布进行展开而得到的与傅里叶函数的量子数m相关的基底函数的正交性承担。因此,相伴勒让德函数的展开系数在该部分系统中,在封闭状态下单独地以仅满足与量子数l相关的正交性的方式确定。
像这样在频率记述中,在边缘的一维分布函数的部分系统与颜色的二维分布函数的部分系统之间,而且还在颜色的二维分布函数的部分系统与边缘的二维分布函数的部分系统之间,存在通过同时记述分布函数而使基底函数的正交性单方地反映的部分系统之间的相关性。
当对色面和边缘面它们两个的二维分布函数同时进行展开时,由于相伴勒让德函数与傅里叶函数的积为基底函数,所以这些基底函数对于x方向和y方向分别构成球面谐和函数。
<部分系统的统计的独立性和能级的分裂>
像这样由于图像整体的分布函数以部分系统的分布函数的积表示,所以各个部分系统保持统计的独立性。对于作为各个部分系统的感性的一个方面满足与能量相关的线性微分方程式,从其导出能量固有值En。在各个部分系统中从各自所满足的微分方程式导出能量的固有值。此时整个系统的能量固有值以各部分系统所导出的能量固有值的和表示。因此,在某部分系统中简并的能级通过其他部分系统的作用而解除简并状态,从而提供分裂而成的能级。
例如,在仅使用与一维系统的颜色和边缘相关的能量要素来记述图像特征的情况下,虽然对于二维的构图的分布不具有区分能力,但若以二维系统记述与构图关联的能量要素,则该能量要素使此前的一维系统的能级分裂,从而能够进行区分。
在导出轴颠倒时的能量固有值的情况下,根据部分系统的统计的独立性在各个部分系统中独立地确定能量固有值。因此,关于轴颠倒性的性质,只要调查以各部分系统单位独立地进行轴颠倒的情况下的性质来求出能量要素即可。此外,轴颠倒性的性质的调查为仅针对使用由偶函数和奇函数组成的基底函数来进行频率空间记述的部分系统所特有的事项。在实际空间记述中,不存在这样的操作。
<构图的高次不变量>
首先,关于能量要素En,从频率空间(k空间)中的能量分散关系和既约表达的观点出发进行定义。使向频率空间投影而得到的二维展开系数cij通过某些方法进行一维化而成为排列ci,根据α面的展开系数与β面的展开系数的积来定义对称积和反对称积的二次形式能量。在此为了便于理解内容仅取对称积的情况。
[算式130]
一维化cij→ci
二次形式和
在此,二次形式和取α面与β面的二维面的全部要素的积的和。
即,存在如下技术课题:选择在二维系统数面中以哪个点为起点在哪个方向上进行排列的一方的α面的排列方法,与另一方的β面的排列方法也以哪个点为起点在哪个方向上进行排列进行组合。作为此时的排列方法,提出如下问题:不存在使通过α面与β面的组合的积而记述的二维系数面的系数分布的性质最高效地压缩地表达的既约表达吗?将其比作记述固体物理学的周期晶体构造所形成的能带的性质时的方法而构筑。
能够认为进行频率展开而得到的二维展开系数扩张了以波动向量kx,ky表示的二维的k空间。
[算式131]
f(α)(x,y)=C00 (α)ψ0(y)ψ0(x)+…+C0,n-1 (α)ψ0(y)ψn-1(x)+…
+Cn-1.0 (α)ψn-1(y)ψ0(x)+…+Cn-1,n-1 (α)ψn-1(y)ψn-1(x)
定义成x轴方向的最高频的成分与x轴方向的最低频的成分连接。对于y方向也同样地,定义成y轴方向的最高频的成分与y轴方向的最低频的成分连接。即,为波的振动过多而超高频作为整体与超低频同等地识别的观点。其为也在根据一维分布函数的基底函数通过扩展迹来定义能量要素时导入的观点。
于是,c0,n-1次的高频成分为c00,能够认为这两个成分为仅移动了一个量子数的大致等价点。当以n×n个展开系数表示时,与这些展开系数的连接性相关的性质和在k空间内正方形的布里渊区的扩张相同。c00在k空间中与(kx,ky)=(0,0)对应,c0,n-1在k空间中与(kx,ky)=(2π/a,0)对应,cn-1,0在k空间中与(kx,ky)=(0,2π/a)对应,cn-1,n-1在k空间中与(2π/a,2π/a)的点对应。
在最高频之后连接低频的定义与高频成分作为低频成分而折回的性质同等,在一维的k空间的情况下,将kx=0~2π/a的频带直接留存于kx=0~π/a的区间,将kx=π/a~2π/a的区间向左侧直接移动-2π/a的量并作为kx=0=2π/a的等价点而连接,从而能够在kx=-π/a~π/a的范围的区间内重新表达。其为布里渊区的性质自身。作为二维的布里渊区,与以kx=0~2π/a,ky=0~2π/a扩张的空间、和以负区间表达正二分之一区间并以kx=-π/a~π/a,ky=-π/a~π/a扩张的空间等价。即,n×n个展开系数具有与固体物理学中的正方格子的布里渊区相同的性质。
通过空间组的既约表达的群论的观点而示出:在固体物理学中,在调查晶体构造的能带的性质、即能量分散关系E(k)时,不用调查全部k空间上的点的性质,只要仅调查某特殊点和线上的性质就足够(参照文献H1、H2)。
根据文献H2,在正方格子的布里渊区中存在六个特殊形式的点或直线。即,当布里渊区在|kx|≤π/a,|ky|≤π/a的范围内表示时,(kx,ky)=(0,0)的Γ点,(kx,ky)=(π/a,π/a)的M点,(kx,ky)=(π/a,0)的X点,连结Γ点和M点的Σ线,连结Γ点和X点的Δ线,连结M点和X点的Z线与其相当。
当根据与其同样的演绎在二维系统数面上进行一维化时,将
[算式132]
定义成规定α面的系数的重新排序的起点的位置和方向的向量。从这样重新排序的两个系数交换第i个展开系数和第j个展开系数并在彼此保持j=i+n的关系的系数之间取对称积的和,要调查对称积的和所生成的能量分散关系
[算式133]
对于反对称积的和也是同样的。
假设用于表示能够组合无数的平移向量的选择方法
[算式134]
的
[算式135]
所生成的二次形式的能量的性质的既约表达与正方格子的布里渊区所具有的空间组的既约表达一致。其重新排序的方法为包含图27所示的六种及其相反朝向的负方向在内的十二种。即,从正方格子的布里渊区的特殊点朝向特殊直线的延伸方向而重新排序。
而且,在根据两个系数面生成对称积和反对称积时,交换i和j时的移动量n=i-j只要调查仅使特殊直线上的点移动了的性质即可。当存在n×n个展开系数时,即使n×n个不全部移动,对n个的量移动后的能量分散关系求出关于各个方向组合、即,12×12种组合分别固定α面侧的起点并使β面侧的起点从特殊点逐渐沿特殊线上移动时的称积与对称积的能量分散关系。
图28是表示能量分散关系的概念上的状况的图。图29是表示调查k空间上的特殊点和线上的能量的性质的状况的图,示出了调查十二个方向的重新排序和从该处沿特殊直线上移动了i-j的量子数时的k空间上的位置的状况。在此,作为表示十二个方向的重新排序的符号,使用±v,±h,±d,±d′,+h/2±v,+v/2±h。图30是表示二维展开系数与动量、角动量、能量的关系的图。
关于像这样取展开系数的二次形式和的能量分散关系,当将展开系数自身认为是动量时,记述了取相位空间上的同一轨道的带来同一感性的图像分布的和集合。即,天空等背景容易沿横向显现平稳的层次地带,在群山中容易沿横向显现纹理带。将这样的与频率相关的性质作为即使个别的频率分布不一致也使与整体频率的分布相关的信息一致的总括指标来记述感性的模糊性。
并且,由于调查在k空间中以1/2的频率为起点的重新排序和以最低次频率、或最高次频率为起点的重新排序的组合的性质,所以也表示在纵向、横向,倾斜方向之间是否存在具有即使标度为二分之一也相似那样的频率构造的图案的性质。即,关于二维形状分布中的构造,也为评估分形性的存在的指标。
再次详细说明重新排序方法。在以下说明中使左端为第一行第一列,右端为第n行第n列。
关于+v方向的重新排序,对第一列从上方按顺序取出n个的量,接着对第二列从上方按顺序取出n个的量,重复至最后。关于-v方向的重新排序,对第n列从下方按顺序取出n个的量,接着对第n-1列从下方按顺序取出n个的量,重复至最后。
关于+h方向的重新排序,对第一行从左侧按顺序取出n个的量,接着对第二行从左则按顺序取出n个的量,重复至最后。关于-h方向的排列,对第n行从右侧按顺序取出n个的量,接着对n-1行从右侧按顺序取出n个的量,重复至最后。
关于+h/2+v方向的重新排序,对第n/2列从上方按顺序取出n个的量,接着对第n/2+1列从上方按顺序取出n个的量,在第n列结束后接下来对第一列取出,重复至第n/2-1列。关于+h/2-v方向的重新排序,对n/2-1列从下方按顺序取出n个的量,接着对n/2-2列从下方按顺序取出n个的量,在第一列结束后接下来对第n列取出,重复至第n/2列。
关于+v/2+h方向的重新排序,对第n/2行从左侧按顺序取出n个的量,接着对第n/2+1行从左侧按顺序取出n个的量,在第n行结束后接下来对第一行取出,重复至第n/2-1行。关于+h/2-v方向的重新排列,对第n/2-1行从右侧按顺序取出n个的量,接着对n/2-2行从右侧按顺序取出n个的量,在第一行结束后接下来对第n行取出,重复至第n/2行。
关于+d方向的重新排序,以第一行第一列为起点向右下方向按顺序取出n个的量,接着以第二行第一列为起点向右下方向按顺序取出n个的量,重复至以第n行第一列为起点取出n个的量。此时,在正方向上超出定义域的行序号以减去n个的量之处为对应点。关于-d方向的重新排序,以第n-1行第n列为起点向左上方向按顺序取出n个的量,接着以第n-2行第n列为起点向左上方向按顺序取出n个的量,在以第1行第n列为起点取出n个的量后,以第n行第n列为起点取出n个的量。此时,在负方向上超出定义域的行序号以加上n个的量之处为对应点。
关于+d′方向的重新排序,以第一行第n列为起点向左下方向按顺序取出n个的量,接着以第二行第n列为起点向左下方向按顺序取出n个的量,重复至以第n行第n列为起点取出n个的量。此时,在正方向上超出定义域的行序号以减去n个的量之处为对应点。关于-d′方向的重新排序,以第n-1行第一列为起点向右上方向按顺序取出n个的量,接着以第n-2行第一列为起点向右上方向按顺序取出n个的量,在以第一行第一列为起点取出n个的量后,以第n行第一列为起点取出n个的量。此时,在负方向上超出定义域的行序号以加上n个的量之处为对应点。
接下来对角动量进行定义。在物体的运动的记述中,角动量能够成为运动恒量的情况仅针对以球对称势垒表示的中心力场(参照文献H4)。当试着使其适用于图像的分布时,仅中心对称形状的特征关于空间的等方向性而成为守恒量。在二维展开系数中表示中心对称性质的仅为对角成分。
根据古典角动量的定义,将展开系数捕捉为动量,当对坐标与表示展开系数的量子数的希尔伯特空间坐标建立对应时,角动量能够以使对角成分为量子数多倍而得到的和记述。
作为角动量能够被记述为具有意义的运动恒量的图像的例子,存在像各国的国旗那样在中心具有圆圈那样的图像组和在中心配置有主要被拍摄物的撮影构图的图像。对于产生某种印象的形容词,在重视中心对称性的情况下,该特征量带来有效作用。在除此以外的情况下,由于与不具有中心对称性的图像的统计平均而导致该特征量消失。
[文献H2]基特尔“固体的量子论”(1963),第10章“布里渊区和晶体对称性”
[文献H3]朗道=栗弗席兹理论物理学教程第5卷“统计物理学第一部”(第3版,1976年),第13章“晶体的对称性”,第134节“空间组的既约表达”
[文献H4]希夫“量子力学”(第3版,1970),第4章“离散固有值:束缚状态”,第14节“三维的球对称势垒”
<高次不变量相对于轴颠倒性的不变性>
如上所述根据使用基底函数向频率空间投影而得到的展开系数建立的二次形式的能量等高次不变量由(α)(x,y)、(β)(x,y)的原二维分布面自身的展开系数构成。在二维分布的构图系统中,也与记述一维分布的频率时的导入相同的方式,在进行轴颠倒的情况下也产生独立的能量要素,因此它们也为新的特征量。
作为轴颠倒的方法,由于在α面和β面中分别存在四种,所以关于独立的能量要素,产生不考虑轴颠倒性的情况下的4×4倍的要素。
(α)(x,y)、
(α)(x,-y)=(α′)(x,y)、
(α)(-x,y)=(α″)(x,y)、
(α)(-x,-y)=(α″′)(x,y)、
(β)(x,y)、
(β)(x,-y)=(β′)(x,y)、
(β)(-x,y)=(β″)(x,y)、
(β)(-x,-y)=(β″′)(x,y)
若通过将这些能量要素全部作为固有值而具有的哈密顿算子来记述部分系统,则表示同一感性的图像组具有相对于哈密顿算子的轴颠倒性不变性而记述。即,当进行轴颠倒时,由于作为奇函数的展开系数产生不同的系数分布,所以即使偶而某图像与进行轴颠倒后的图像呈相同的系数分布,也由于仅观察轴颠倒前彼此的能量要素、和轴颠倒后彼此的能量要素的作用的不同,所以能够区分这些图像作为形容词的印象而属于其他印象。
由进行轴颠倒后的色面生成的能量分散关系具有如下记述效果:使通过没有轴颠倒的原状态的能量分散关系而没有记述的特殊点与特殊点之间的分散关系共有两端的特殊点并填入。即,在两端的特殊点处使状态简并。
此外,在此,对至第7实施方式为止的说明进行共同的补充说明。
<状态数的计算方法>
关于状态数的计算方法,在进行实际空间记述时,在生成低次不变量的能量时导入了模型哈密顿算子。当展开该模型哈密顿算子时由不同色面的(α)面与(β)面的积组成的项伴随着由相同色面的(α)面与(α)面的积组成的项的二倍因子。其伴随于在选择两个组合状态时(α)面与(β)面的积存在(α)(β)和(β)(α)这两种等价的选择方法。另外,同样地,在平均项与波动项的积中伴随着二倍因子。其更适合的是,作为本来状态为二倍存在的项,在计算能量要素的值时,采用对相同的能量要素两次定义、将能量要素的值定义为二倍的哪一种方法来进行增加了状态的简并数的量的修正。
使以(α)面与(β)面的积定义的能量要素成为二倍也适用于进行频率空间记述的高次系统不变量。
<形容词模型分布的构筑法>
将此前从图像感受到的印象在心理上通过线形标度以五级进行评估的方法构筑为形容词模型分布时,使五级的评估乘以1倍的权重、使四级的评估乘以0.8倍的权重,使3级的评估乘以0.6倍的权重,使二级的评估乘以0.4倍的权重,使一级的评估乘以0.2倍的权重。除该加权方法以外,例如,也可以将五级评估解释成自然对数的值,对五级评估的图像分别从五级的评估按顺序以exp(0)倍=1、exp(-1)倍、exp(-2)倍、exp(-3)倍、exp(-4)倍的方式加权来构筑形容词模型分布。
[第8实施方式]
在第6实施方式中,通过“感性的线性模型”来记述至由颜色和边缘的一维分布函数建立的实际空间表达和频率空间表达这四个部分系统,在第8实施方式中,记述在其基础上进一步增加与构图相关的由颜色和边缘的二维部分函数建立的实际空间表达和频率空间表达的四个部分系统。此外,在此,也将此前称作纹理的部分系统在以后改称为边缘。
仅记载与第6实施方式不同的部分。在本实施方式中标注有“一维”的前缀与在第6实施方式中没有标注“一维”的前缀对应。标注有“二维”的前缀的部分为新增加的部分。
1.向孟塞尔HVC颜色空间的转换
2.建立HVC面的边缘图像
3.生成一维颜色分布的低次不变量
4.生成一维颜色分布的高次不变量
5.生成一维边缘分布的低次不变量
6.生成一维边缘分布的高次不变量
说明进行spdf展开的情况。
6-0.低次系统的分布函数的希尔伯特空间表达
6-0-1.变量转换
与第3实施方式的顺序4-1相同。
6-0-2.基于球贝塞尔函数的级数展开
对H,V,C各色面的一维分布函数通过由基于N个根的系数和四个次数组成的球贝塞尔函数进行二重级数展开而等价表达。
[算式136]
首先,关于方位量子数l,仅使用l=0~3中的偶函数和奇函数的两个量子数,通过基于与主量子数n相关的根的二重级数展开来进行等价表达。关于从四个方位量子数中选择两个方位量子数而成的组合,若满足必须选择偶函数和奇函数的条件,则具有任意性。例如l=0,1的组合和l=2,3的组合均能够等价表达一维分布函数。此时的系数通过以下展开而规定。
[算式137]
展开系数cl n利用基底函数的正交性通过以下算式求出。此外αln通过上述[数50]所示的算式而提供。
[算式138]
进行l=0~3的二重级数展开时的方位量子数间的加权bl为均等分配的1。在通过两个分布函数的积对统合边缘图像的直方图的一维分布函数
[算式139]
和色面的二维分布函数
[算式140]
同时展开时,通过色面的二维分布函数的相伴勒让德函数的正交性来保证方位量子数l之间的正交性。
用于该部分系统的不变量的计算的展开系数cln与分别使用偶函数和奇函数的二重级数而求出的展开系数cl n相等。以后,将cl n作为cln来处理。
6-1.建立高次系统的分布函数
与第5实施方式的6-1所示的顺序相同。
6-2.熵的计算
与第5实施方式的6-2所示的顺序相同。
6-3.计算动量的要素pn
与第5实施方式的6-3所示的顺序相同。
6-4.计算角动量的要素Mn
作为角动量的要素Mn,列举以下要素。
[算式141]
(c11 (α)+c12 (α)+…+c1N (α))+2(c21 (α)+c22 (α)+…+c2N (α))+3(c31 (α)+c32 (α)
+…+c3N (α)) (α)=H,V,C。
由于角动量的要素数量具有三面的量,所以进行轴颠倒的情况下的独立成分
[算式142]
-1(c11 (α)+c12 (α)+…+c1N (α)+2(c21 (α)+c22 (α)+…+c2N (α))-3(c31 (α)+…+c3N (α))
(α)=H,V,C。
为2×3=6个。
6-5.计算能量的要素En
以下示出进行spdf展开时的包含实际使用的标准化的能量的要素。
[算式143]
(其它定义)
(α)(α)
a0a0p,e:
(一般定义)
(α)(α)
a0a0p,e/i:
a0a1p,e:
a0a1m,i:
[算式144]
a0a2p,e/i:
a0a3p,e:
a0a3m,i:
[算式145]
(α)(β)
a0b0p,e/i:
a0b0m,e/i:
a0b1p,e/i:
a0b1m,e/i:
[算式146]
a0b2p,e/i:
a0b2m,e/i:
a0b3p,e/i:
a0b3m,e/i:
此外,若采取与上述的从sp展开向spdf展开的扩展过程同样的过程,则在进一步提高二重级数中的角动量量子数的展开次数时也能够同样地定义。以下仅示出进行至角动量量子数1=0,1,…,15的展开时的α面与p面的部分矩阵(1,1′)的组合方法。
00型
(1,1′)=(0,0)+(1,1)+(2,2)+(3,3)+(4,4)+(5,5)+(6,6)+(7,7)
+(8,8)+(9,9)+(10,10)+(11,11)+(12,12)+(13,13)+(14,14)+(15,15)
01型
(l,l′)=(0,1)+(1,0)+(2,3)+(3,2)+(4,5)+(5,4)+(6,7)+(7,6)
+(8,9)+(9,8)+(10,11)+(11,10)+(12,13)+(13,12)+(14,15)+(15,14)
02型
(l,l′)=(0,2)+(2,0)+(1,3)+(3,1)+(4,6)+(6,4)+(5,7)+(7,5)
+(8,10)+(10,8)+(9,11)+(11,9)+(12,14)+(14,12)+(13,15)+(15,13)
03型
(l,l′)=(0,3)+(3,0)+(2,5)+(5,2)+(4,7)+(7,4)+(6,9)+(9,6)
+(8,11)+(11,8)+(10,13)+(13,10)+(12,15)+(15,12)+(14,1)+(1,14)
04型
(l,l′)=(0,4)+(4,0)+(1,5)+(5,1)+(2,6)+(6,2)+(3,7)+(7,3)
+(8,12)+(12,8)+(9,13)+(13,9)+(10,14)+(14,10)+(11,15)+(15,11)
05型
(l,l′)=(0,5)+(5,0)+(2,7)+(7,2)+(4,9)+(9,4)+(6,11)+(11,6)
+(8,13)+(13,8)+(10,15)+(15,10)+(12,1)+(1,12)+(14,3)+(3,14)
06型
(l,l′)=(0,6)+(6,0)+(1,7)+(7,1)+(4,10)+(10,4)+(5,11)+(11,5)
+(8,14)+(14,8)+(9,15)+(15,9)+(12,2)+(2,12)+(13,3)+(3,13)
07型
(l,l′)=(0,7)+(7,0)+(2,9)+(9,2)+(4,11)+(11,4)+(6,13)+(13,6)
+(8,15)+(15,8)+(10,1)+(1,10)+(12,3)+(3,12)+(14,5)+(5,14)
08型
(l,l′)=(0,8)+(8,0)+(1,9)+(9,1)+(2,10)+(10,2)+(3,11)+(11,3)
+(4,12)+(12,4)+(5,13)+(13,5)+(6,14)+(14,6)+(7,15)+(15,7)
09型
(l,l′)=(0,9)+(9,0)+(2,11)+(11,2)+(4,13)+(13,4)+(6,15)+(15,6)
+(8,1)+(1,8)+(10,3)+(3,10)+(12,5)+(5,12)+(14,7)+(7,14)
10型
(l,l′)=(0,10)+(10,0)+(1,11)+(11,1)+(4,14)+(14,4)+(5,15)+(15,5)
+(8,2)+(2,8)+(9,3)+(3,9)+(12,6)+(6,12)+(13,7)+(7,13)
11型
(l,l′)=(0,11)+(11,0)+(2,13)+(13,2)+(4,15)+(15,4)+(6,1)+(1,6)
+(8,3)+(3,8)+(10,5)+(5,10)+(12,7)+(7,12)+(14,9)+(9,14)
12型
(l,l′)=(0,12)+(12,0)+(1,13)+(13,1)+(2,14)+(14,2)+(3,15)+(15,3)
+(4,8)+(8,4)+(5,9)+(9,5)+(6,10)+(10,6)+(7,11)+(11,7)
13型
(l,l′)=(0,13)+(13,0)+(2,15)+(15,2)+(4,1)+(1,4)+(6,3)+(3,6)
+(8,5)+(5,8)+(10,7)+(7,10)+(12,9)+(9,12)+(14,11)+(11,14)
14型
(l,l′)=(0,14)+(14,0)+(1,15)+(15,1)+(4,2)+(2,4)+(5,3)+(3,5)
+(8,6)+(6,8)+(9,7)+(7,9)+(12,10)+(10,12)+(13,11)+(11,13)
15型
(l,l′)=(0,15)+(15,0)+(2,1)+(1,2)+(4,3)+(3,4)+(6,5)+(5,6)
+(8,7)+(7,8)+(10,9)+(9,10)+(12,11)+(11,12)+(14,13)+(13,14)
6-6.计算部分系统的温度
与第6实施方式的4-6所示的顺序相同。
6-7.计算部分系统的自由能
与第6实施方式的4-7所示的顺序相同。
7.建立二维颜色分布的低次不变量
作为用于区分该部分系统的符号,存在对不变量使用符号Ho的情况。
7-1.建立低次系统的分布函数
在第2实施方式中通过进行使用了小波变换的多重析像度变换,由于LL成分连续而生成原图像的低频成分、即与缩小图像相当的图像。多重析像度的级数由于最低析像度分解至进入40×30~80×60左右的图像范围的程度,所以将从最低析像度位于三级左右高析像度的320×240像素左右的LL成分作为缩小图像的色面而取出。对HVC各色面取出并将各个信号面表示为H(x,y),V(x,y),C(x,y)。在此使用的色调面为没有进行中性的分离的色面。即,为全部仅以色调环的值记述的图像。
以如下方式定义用于将这些色面的图像的分布捕捉为刚体面并调查与刚体所具有的空间因子相关的性质的二维分布函数。
刚体的分布函数
[算式147]
在二维系统中,上述三个分布函数为基本,但为了计算后面的在色面之间交叉定义的惯性张量,例外地定义在色面之间交叉的分布函数。
[算式148]
7-2.熵的计算
根据色面的分布函数f(x,y)计算熵S。当分布函数的值为0时,表示不取该状态,从积分区间排除。当以(α)区分地表示分布函数的色面时,根据H,V,C面的各个分布函数计算出熵,它们的和表示向二维颜色分布的低次系统投影而得到的部分系统的熵。
[算式149]
S=S(H)+S(V)+S(C)
使该值为SHo。
7-3.计算动量的要素pn
首先,调查与刚体面的空间形状因子相关的性质。即,使用分布函数求出各色面的一次转矩的平均即重心位置、和表示二次转矩的平均的惯性张量。重心是表示空间平均的指标,惯性张量是表示空间扩展的指标。此外,以H面为例而示出,但对于V面、C面也完全同样。
[算式150]
刚体的重心位置
<xH>=∫∫xf(H)(x,y)dxdy
<yH>=∫∫yf(H)(x,y)dxdy
刚体的惯性张量
对于在两个色面之间交叉的分布也是同样地,求出重心位置和惯性张量。此外,示出HV间的情况的例子,但对于VC间、CH间也完全相同。
[算式151]
刚体的重心位置
刚体的惯性张量
此外,坐标轴和坐标标度的采取方法是任意的,但若以取图像的中心为原点并使纵×横的长边侧的长度为1的方式进行定义,则由于重心位置和惯性张量的值全部收敛于[-1,1]而很方便。
接下来,调查具有速度或动量的维度的图像的与明亮度因子相关的性质。将图像的明亮度等级的平均变化分为向x轴侧投影的情况下、和向y轴侧投影的情况下的两种成分来调查。此外,在此也仅示出H面的情况的例子。
在y轴方向上进行平均操作并向x轴投影而得到的图像为H(x),在x轴方向上进行平均操作并向y轴投影而得到的图像为H(y)。而且还计算出色面整体的平均值<H>。
[算式152]
H(x)=∫H(x,y)dy/∫dy
H(y)=∫H(x,y)dx/∫dx
关于明亮度因子求出图像整体的平均值和向x,y的投影轴中的波动幅度。对于作为空间因子而计算的刚体系统,明亮度的平均值起到重心系统的平移速度的作用,明亮度的波动成分起到刚体的旋转的角速度的作用,这些明亮度因子记述刚体运动时的与运动速度相关的因子。
[算式153]
<H>=∫∫H(x,y)dxdy/∫∫dxdy
以如下方式定义角速度向量Ω。由于允许明亮度的波动成分取正值和负值中的任一方的值,所以存在四种状态被允许作为角速度向量。
[算式154]
像这样,使用所求出的刚体的静止状态下的空间因子和表示刚体的运动的明亮度因子以如下方式定义动量。
[算式155]
它们提供向量成分,但作为动量的要素pn而分解成各个标量。因此,独立的动量的要素数量存在六个。
以明亮度因子表示运动速度的物理表象为如下观点。当在纸面上提示某图像时,在照明环境漆黑时,纸面上的图像自身的性质不变,但成为人眼无法识别的状态。当向该处安装照明灯泡时,图像的印象以根据图像的颜色明亮度而不同的速度映入眼中,但作为其颜色的注目区域以图像的明亮度的重心为中心按各色面而映入。但是,在其周围如具有各种不同速度的刚体的运动那样捕捉。在V面的情况下,认为越是高亮度部而越以快的速度强烈地映入眼中。在C面的情况下,认为越是高彩度部而越以快的速度强烈地映入眼中。
7-4.计算角动量的要素Mn
使用刚体的静止状态下的空间因子和表示刚体的运动的明亮度因子以如下方式定义角动量。作为角速度向量而存在四种状态,但在其中,作为角动量向量仅留存提供独立要素的状态。即,不将仅对角动量向量整体标注+,-符号的状态看作独立的状态。张量符号表示在求出第i个向量要素时,对全部的k求和而缩减。
[算式156]
它们也提供向量成分,但作为角动量的要素Mn而分解成各个标量。因此,独立的动量的要素数量存在12个。
7-5.计算能量的要素En
使用刚体的静止状态下的空间因子和表示刚体的运动的明亮度因子以如下方式定义角动量。作为角速度向量而存在四种状态,但在其中,作为能量仅留存提供独立要素的状态。
[算式157]
也同样。
也同样。
也同样。
独立的能量的要素En的数量根据表示平移动能的部分为6个,根据表示旋转动能的部分为18个,共计为24个。
在第8实施方式的开头中,在导出模型哈密顿算子而进行展开时,作为状态的数量考虑由出现二倍的因子的(α)面与(β)面的积组成的项对这些定义使值成为二倍的状态数。
这些物理量具有成为不变量的性质的情况与如下的图像的性质的记述存在关系。在风景照的情况下,大多为群山的绵延和青空的横陈。由此,空间因子的惯性张量的表示x轴方向的扩展的I22容易取大的值,表示y轴方向的扩展的I11容易取小的值。另一方面,关于明亮度因子的波动幅度,由于青空和群山的信号大小取相当不同的值,所以向y轴投影的方向的波动幅度σ2容易取大的值,向x轴方向投影的方向的波动幅度σ1由于由同质的图像区域构成而容易取小的值。因此,I22与σ2的组合在风景照中容易取大的值,I11与σ1的组合容易取小的值。这样的倾向作为旋转能量的项或角动量的要素而记述。另外,在人物系统中它们表示不同值的倾向。因此,二维颜色分布的构图的低次不变量成为区别画面的良好特征量。
7-6.计算部分系统的温度
与第6实施方式的3-6所示的顺序相同。
7-7.计算部分系统的自由能
与第6实施方式的3-7所示的顺序相同。
该部分系统的波尔兹曼常数通过该部分系统的熵的任意图像的统计平均的倒数来测量。
[算式158]
此外,在定义自由能、自由动量、自由角动量时使用的熵用于测量共同的相位空间上的状态数,因此,与此前的定义同样地在三者之间使用共同的数。即,为了计算能量的要素,例外地导入的色面间的交叉分布函数与熵无关。
8.生成二维颜色分布的高次不变量
作为用于区分该部分系统的符号,存在对不变量使用符号H的情况。
8-0.低次系统的分布函数的希尔伯特空间表达
使HVC面的色面的二维分布函数发挥颜色的低次系统的分布函数的作用。为通过顺序7-1而求出的刚体的分布函数。低次系统的分布函数也能够解释成可通过原坐标系来测量的坐标空间q。对其通过相伴勒让德函数进行转换而进行频率表达,并向动量空间p投影。其为原分布函数的从其他方面观察的等价表达。作为形成希尔伯特空间的基底函数,选择增加了低次系统的分布函数的性质且尽可能压缩地表达的完全正交系的函数。但是,根据坐标空间和动量空间的不确定性原理
[算式159]
也存在一方为压缩表达时另一方为扩展表达的关系。优选选择该两者的不确定性为最小的函数系统。
在本实施方式中,为了便于说明,不是提供二重级数展开的相伴勒让德函数的情况,而是示出仅处理其最低次(磁量子数m=0)而提供一重级数展开的勒让德函数的情况。相伴勒让德函数的实施例在第9实施方式中扩展地示出。
8-0-1.变量转换
当使二维分布函数的x轴的坐标范围为[xa,xb]、使y轴的坐标范围为[ya,yb]、使分布函数的值(作为z轴)的范围为[fa,fb]时,在将x轴收敛于[-1,1]、将y轴收敛于[-1,1]、将z轴收敛于[-1,1]的区间进行变量转换。仅在该节中为了便于说明,将x轴的变量从X向x转换、将y轴的变量从Y向y转换、将z轴的变量从fZ向fz转换而表述,转换式如下所述。
x轴的变量转换:x={X-(xb+xa)/2}/{(xb-xa)/2}
y轴的变量转换:y={Y-(yb+ya)/2}/{(yb-ya)/2}
z轴的变量转换:fz={fZ-(fb+fa)/2}/{(fb-fa)/2}
8-0-2.基于勒让德函数的级数展开
使H,V,C各色面的二维分布函数以N×N个系数通过勒让德函数进行展开来等价表达。
[算式160]
展开系数cll′利用基底函数的正交性以如下方式求出。即,生成求出使二维分布函数相对于一维方向按各行进行正交转换而得到的展开系数的图像,此次按与该面正交的一维方向的各列重复同样的转换,得到的面为二维展开系数面cll′。按各行、各列的一维方向的展开使用以下关系式来进行。
[算式161]
通过变量转换,展开系数的值全部收敛于[-1,1]的范围内。相对于色面的图像的像素数为360×240左右,展开系数的数量可以设定成N=50左右。由于x轴和y轴的展开的数量设定成相同值,所以展开系数为方阵。
8-1.建立高次系统的分布函数
将进行勒让德展开而得到的系数的功率谱定义成与构图的颜色相关的高次系统的分布函数。对于H,V,C这三个面,能够定义高次系统的分布函数。为了表示概率密度而事先标准化。
[算式162]
8-2.熵的计算
根据分布函数f(l,l′)计算熵S。当以(α)区分地表示分布函数的色面时,根据H,V,C面的各个分布函数计算出熵,它们的和表示向二维颜色分布的高次系统投影而得到的部分系统的熵。
[算式163]
S=S(H)+S(V)+S(C)
使该值为SH。
8-3.计算动量的要素pn
能够将基于勒让德函数的展开系数捕捉为希尔伯特空间中的动量。因此,动量的要素pn为展开系数
[算式164]
自身。
当[ ]表示数组时,动量的要素数量为:
[α面的数量][l的数量][l′的数量]=3×50×50。
按顺序将它们以pn汇总地表示。
8-4.计算角动量的要素Mn
提供中心对称形状的性质的是展开系数的对角成分。由于勒让德函数的方位量子数l,l′规定希尔伯特空间坐标,所以将角动量M=r×p定义为希尔伯特空间坐标与动量的积。
[算式165]
勒让德函数具有下面的轴颠倒性。
Pl(-x)=(-1)lPl(x)
作为轴颠倒而存在四种情况,但其中提供独立要素的仅为(α)(x,y)和(α′)(x,-y)。(α″)(-x,y)仅记述与(α′)(x,-y)相同的状态,(α″′)(-x,-y)仅记述与(α)(x,y)相同的状态。通过以下算式记述将y轴颠倒而得到的另一个独立要素。
[算式166]
当[]表示数组时,角动量的要素数量为:
[α面的数量][轴颠倒性的数量]=3×2。
按顺序将它们以Mn汇总地表示。
8-5.计算能量的要素En
使二维展开系数
[算式167]
沿12方向重新排序而成的一维数组以
[算式168]
示意地表示。向量k表示重新排序的起点和方向,从分别定义的重新排序的起点位置按顺序对系数重新排序,使0~N×N-1个展开系数的第i个展开系数通过i而表示。通过交换(α)面的第i个展开系数ci和(β)面的第j个展开系数cj而建立对称积和反对称积,在具有j-i=n的固定量子数差的系数之间取全部展开系数的和,由此生成能级En的要素的值。
[算式169]
在此,在cj的值如cN×N-1+i那样从0~N×N-1个的定义域超出时,进行一维化而得到的展开系数的最后系数和第一个系数连成圆环,返回最初地点而重新定义。即,cN×N-1+i=ci。
由于仅调查二维展开系数的线上的性质,所以能级数n取量子数的差为n=0,1,…,N-1的系数。
[算式170]
该[算式170]记述如下关系式:在表示12×12种组合的能量分散关系、即ki与kj的组合的k空间上的点n=j-i处,在该k点上取怎样的能量值。
相对于(α)面与(α)面的对称积的定义,12×12方向的组合在彼此成为完全相同的方向的12种组合中,仅n=j-i=0的点的分子和分母为相同值,使其例外地仅为分子的定义。即,
[算式171]
加入有零点能量的偏移,但在即使超过1的值也直接记述状态数量的意义上,实际上可以不进行这样的修正而直接使用自相关值。相同的观点也适用于由切比雪夫展开系数或球贝塞尔展开系数生成的能量的情况。
关于轴颠倒性,相对于α面和β面的各自的四个状态,展开系数以如下方式替换,因此上述定义的能量分散关系还能够独立地定义4×4倍的能量分散关系。
[算式172]
当[]表示数组时,能量的要素数量为:
[α面与β面的组合的数量][α面的轴颠倒性的数量][β面的轴颠倒性的数量][α面的重新排序方法的数量][β面的重新排序方法的数量][对称积或反对称积的种类][能级数]
=6×4×4×12×12×2×50。
将它们按顺序以En汇总地表示。
作为α面与β面的组合而存在HH,VV,CC,HV,VC,CH这六种,但HV,VC,CH与VH,CV,HC的组合共同,所以不为独立要素,但作为状态数,相对于(α)(α)而(α)(β)为二倍存在,作为能量值,相对于定义值以后增大二倍。
可以直接使用这些能量要素,但存在如下情况:求出更缩减的能量分散关系的情况更为实用。说明该情况下的方法。
[算式173]
导出12×12种组合的能量分散关系,但关于这些方向组合,通过相同的能级En彼此来求出平均能量分散关系。当进行这样的操作时,反对称积的平均能量分散关系恒等于零。因此,仅留存对称积侧的能量分散关系。
[算式174]
由此,能量要素的数量为:
[α面与β面的组合的数量][α面的轴颠倒性的数量][β面的轴颠倒性的数量][能级数]
=6×4×4×50。
将它们按顺序以En汇总地表示。
作为例子,关于VV面彼此的对称积的能级n=0附近的能量要素,当通过图像排列试着调查具有区别怎样的图像的能力时,具有一方面神社寺院等建筑物系统的照片图像容易集中、另一方面湖泊沼泽等自然风景的照片图像容易集中的分类能力。另外,轴颠倒后的能量要素还具有对性质不同的图像进行分类的能力。
8-6.计算部分系统的温度
与第6实施方式的4-6所示的顺序相同。
8-7.计算部分系统的自由能
与第6实施方式的4-7所示的顺序相同。
该部分系统的波尔兹曼常数通过该部分系统的熵的任意图像的统计平均的倒数来测量。
[算式175]
9.生成二维边缘分布的低次不变量
作为用于区分该部分系统的符号,存在对不变量使用符号Io的情况。
9-1.建立低次系统的分布函数
在第2实施方式中说明了通过进行小波变换来生成多重析像度的高频子带,并仅对高频子带通过最低析像度进行逆小波变换来进行边缘统合。多重析像度的级数的最低析像度分解至进入40×30~80×60左右的图像范围的程度,因此将从最低析像度位于三级左右高析像度的320×240像素左右的统合边缘图像作为边缘面而取出。对HVC各色面取出并将各自的信号面表示为ΔH(x,y),ΔV(x,y),ΔC(x,y)。在此使用的色调面也为不进行中性的分离的色面。
由于这些边缘面的图像具有正值和负值,所以不称作分布函数。将对边缘面平方后的函数定义为边缘面的二维分布函数,将这些分布捕捉为刚体面,用于调查与刚体所具有的空间因子相关的性质。该刚体面与颜色的二维分布的情况不同,为仅在轮廓线上具有强度的轮廓图像。
[算式176]
刚体的分布函数
色面间的交叉的分布函数f(HV)(x,y)、f(VC)(x,y)、f(CH)(x,y)与顺序7-1同样地定义。
9-2.熵的计算
根据边缘面的分布函数f(x,y)计算熵S。当分布函数的值为0时,表示不取该状态,从积分区间排除。当以(α)区分地表示边缘面的分布函数的色面时,从H,V,C面的各个分布函数计算出熵,它们的和表示向二维边缘分布的低次系统投影而得到的部分系统的熵。
[算式177]
S=S(H) +S(V)+S(C)
使该值为SIo。
9-3.计算动量的要素pn
与空间形状因子相关的计算使用对统合边缘面进行平方而得到的面来计算,与明亮度因子相关的计算使用统合边缘面的值自身来计算。其原因在于,关于明亮度因子,正负值自身具有意义,边缘强度的正区域以正速度朝向这边映入眼中、但负区域以后退的速度朝向反方向而识别,这与感知的记述一致。
空间形状的重心位置提供作为边缘面的注目区域,但该注目区域与色面的重心位置不同。即,在颜色和边缘中注目的区域不同。
以下,罗列边缘面的情况下的对应式。继续进行至顺序9-5。
空间形状因子
与一个色面内的分布相关的重心位置和惯性张量的记述的情况。
[算式178]
刚体的重心位置
刚体的惯性张量
与在两个色面间交叉的分布相关的重心位置和惯性张量的记述的情况。
[算式179]
刚体的重心位置
刚体的惯性张量
明亮度因子
在y轴方向上进行平均操作并向x轴投影而得到的图像为△H(x)、在x轴方向上进行平均操作并向y轴投影而得到的图像为△H(y)。而且还计算出△H面整体的平均值<△H>。
[算式180]
[ΔH](x)=∫ΔH(x,y)dy/∫dy
[ΔH](y)=∫ΔH(x,y)dx/∫dx
<ΔH>=∫∫ΔH(x,y)dxdy/∫∫dxdy
角速度向量Ω
计算动量的要素
[算式181]
9-4.计算角动量的要素Mn
[算式182]
9-5.计算能量的要素En
[算式183]
也同样。
9-6.计算部分系统的温度
与第6实施方式的顺序5相同。
9-7.计算部分系统的自由能
与第6实施方式的顺序5相同。
该部分系统的波尔兹曼常数通过该部分系统的熵的任意图像的统计平均的倒数来测量。
[算式184]
10.生成二维边缘分布的高次不变量
作为用于区分该部分系统的符号,存在对不变量使用符号I的情况。
10-0.低次系统的分布函数的希尔伯特空间表达
使HVC面的边缘面的二维分布函数发挥边缘的低次系统的分布函数的作用。为通过顺序9-1而求出的刚体的分布函数。低次系统的分布函数也能够解释成可通过原坐标系来测量的坐标空间q。对其通过傅里叶函数进行转换而进行频率表达,并向动量空间p投影。其为原分布函数的从其他方面观察的等价表达。作为形成希尔伯特空间的基底函数,选择增加了低次系统的分布函数的性质且尽可能压缩地表达的完全正交系的函数。但是,根据坐标空间和动量空间的不确定性原理
[算式185]
也存在当一方为压缩表达时而另一方为扩展表达的关系。优选选择这两者的不确定性为最小那样的函数系统。
10-0-1.变量转换
当使二维分布函数的x轴的坐标范围为[xa,xb]、使y轴的坐标范围为[ya,yb]、使分布函数的值(作为z轴)的范围为[fa,fb]时,在将x轴收敛于[-π,π]、将y轴收敛于[-π,π]、将z轴收敛于[0,1]的区间中进行变量转换。仅在该节中为了便于说明,将x轴的变量从X向x转换、将y轴的变量从Y向y转换、将z轴的变量从fZ向fz转换而记载,转换式如下所示。
x轴的变量转换:x=π{X-(xb+xa)/2}/{(xb-xa)/2}
y轴的变量转换:y=π{Y-(yb+ya)/2}/{(yb-ya)/2}
z轴的变量转换:fz=(fZ-fa)/(fb-fa)
通常取fa=0的值。
10-0-2.基于傅里叶函数的级数展开
使H,V,C各色面的二维分布函数以(2M+2)×(2M+2)个系数通过由余弦函数和正弦函数的组构成的傅里叶函数进行展开来等价表达。
[算式186]
展开系数Amm′,Bmm′,Cmm′,Dmm′利用基底函数的正交性以如下方式求出。即,生成求出使二维分布函数相对于一维方向按各行进行正交转换而得到的展开系数的图像,此次按与该面正交的一维方向的各列重复同样的转换,得到的面为二维展开系数面Amm′,Bmm′,Cmm′,Dmm′。按各行、各列的一维方向的展开使用以下关系式来进行。
[算式187]
其中,使a0=a0/2。b0=0。因此,Bm0=0,C0m′=0,Dm0=D0m′=0。
通过变量转换,展开系数的值全部收敛于[-1,1]的范围内。展开系数的数量可以相对于边缘面的图像的像素数为360×240左右而设定成M=25左右。由于x轴和y轴的展开的数量设定成相同值,所以展开系数为方阵。
在此,使四个展开系数的矩阵Amm′,Bmm′,Cmm′,Dmm′作为amm′汇总于一个矩阵而很方便。作为k空间中的布里渊区的性质的重新排序方法,存在如下汇总方法,其中,该k空间中,具有x轴、y轴的各自的最高频率与最低频率连接而表示相同性质。在本实施方式中,通常使用该方法。
[算式188]
此外,也存在如下排列方法:在最左上方排列D00,在其相邻右侧排列B00,在D00的下方排列C00,在B00的下方排列A00,以这四个数为基本单位沿纵向和横向将数量分别加1,从而各增加2行2列。其也具有最低频数和最高频数连接的性质。
两者均与矩阵一起将通过以正量子数表示的k空间所表达的系数在二分之一的地点折回,即使将超出的部分作为负区域来记述也为完全等价的表达。此为布里渊区的性质。
10-1.建立高次系统的分布函数
将进行傅里叶展开而得到的系数的功率谱定义成与构图的边缘相关的高次系统的分布函数。对于H,V,C这三个面,能够定义高次系统的分布函数。为了表示概率密度而事先标准化。
[算式189]
10-2.熵的计算
根据分布函数f(m,m′)计算熵S。当以(α)区分地表示分布函数的色面时,根据H,V,C面的各个分布函数计算出熵,它们的和表示向二维边缘分布的高次系统投影而得到的部分系统的熵。
[算式190]
S=S(H)+S(V)+S(C)
使该值为SI。
10-3.计算动量的要素pn
能够将基于傅里叶函数的展开系数捕捉为希尔伯特空间中的动量。因此,动量的要素pn为展开系数Amm′,Bmm′,Cmm′,Dmm′自身。
当[]表示数组时,动量的要素数量为:
[α面的数量][ABCD的种类][m的数量][m′的数量]=3×4×26×26。将它们按顺序以pn汇总地表示。
10-4.计算角动量的要素Mn
提供中心对称形状的性质的仅为展开系数amm′的对角成分。由于傅里叶函数的磁量子数m,m′规定希尔伯特空间坐标,所以将角动量M=rxp定义成希尔伯特空间坐标与动量的积。
[算式191]
傅里叶函数具有如下轴颠倒性。
[算式192]
cos(-mx)=cos(mx)
sin(-mx)=-Sin(mx)
作为轴颠倒存在四种情况,但其中提供独立要素的仅为(α)(x,y)和(α′)(x,-y)。(α″)(-x,y)仅记述与(α′)(x,-y)相同的状态,(α″′)(-x,-y)仅记述与(α)(x,y)相同的状态。通过以下算式记载将y轴颠倒而得到的另一个独立要素。
[算式193]
当[]表示数组时,角动量的要素数量为:
[α面的数量][轴颠倒性的数量]=3×2。
将它们按顺序以Mn汇集地表示。
10-5.计算能量的要素En
使二维展开系数
[算式194]
沿12方向重新排序而得到的一维数组以
[算式195]
示意地表示。向量k表示重新排序的起点和方向,从分别定义的重新排序的起点位置按顺序对系数重新排序,使0~(2M+2)×(2M+2)-1个展开系数的第i个展开系数通过i而表示。通过交换(α)面的第i个展开系数ai和(β)面的第j个展开系数aj而建立对称积和反对称积,在具有j-i=n的固定量子数差的系数之间取全部展开系数的和,由此生成能级En的要素的值。
[算式196]
在此,当aj的值如a(2M+2)×(2m+2)-1+i那样从0~(2M+2)x(2M+2)-1个的定义域超出时,一维化而得到的展开系数的最后系数和第一个系数连成圆环,返回到最初地点而重新定义。即,使a(2M+2)x(2m+2)-1+i=ai。
由于仅调查二维展开系数的线上的性质,所以能级数n取量子数的差为n=0,1,…,(2M+2)-1的系数。
[算式197]
该[算式197]记述如下关系式:在表示12×12种组合的能量分散关系、即ki与kj的组合的k空间上的点n=j-i处,在该k点上取怎样的能量值。
相对于(α)面与(α)面的对称积的定义,12×12方向的组合在彼此成为完全相同的方向的12种组合中,仅n=j-i=0的点的分子和分母为相同值,因此例外地仅为分子的定义。即,
[算式198]
加入有零点能量的偏移,但在表示即使超过1的值也直接记述状态的数量的意义上,实际上可以不进行这样的修正而直接使用自相关值。
关于轴颠倒性,相对于α面和β面的各自的四个状态,展开系数
[算式199]
以如下方式替换,因此上述定义的能量分散关系还能够独立地定义4×4倍的能量分散关系。
[算式200]
当[]表示数组时,能量的要素数量为:
[α面与β面的组合的数量][α面的轴颠倒性的数量][β面的轴颠倒性的数量][α面的重新排序方法的数量][β面的重新排序方法的数量][对称积或反对称积的类别][能级数]
=6×4×4×12×12×2×52。
将它们按顺序以En汇总地表示。
该情况下也求出更缩减的能量分散关系。
[算式201]
导出12×12种组合的能量分散关系,但关于这些方向组合,通过相同能级En彼此而求出平均能量分散关系。当进行这样的操作时,反对称积的平均能量分散关系恒等于零。因此,仅留存对称积侧的能量分散关系。
[算式202]
由此,能量要素的数量为:
[α面与β面的组合的数量][α面的轴颠倒性的数量][β面的轴颠倒性的数量][能级数]
=6×4×4×52。
将它们按顺序以En汇总地表示。
作为例子,关于VV面彼此的对称积的能级n=0附近的能量要素,当试着通过图像排列调查具有区分怎样的图像的能力时,具有一方面风景等自然系的照片图像容易集中、另一方面人物等人群系的照片图像容易集中的分类能力。另外,进行轴颠倒而得到的要素还具有对性质不同的图像进行分类的能力。
10-6.计算部分系统的温度
与第6实施方式的4-6所示的顺序相同。
10-7.计算部分系统的自由能
与第6实施方式的4-7所示的顺序相同。
该部分系统的波尔兹曼常数通过该部分系统的熵的任意图像的统计平均的倒数来测量。
[算式203]
11.统合部分系统的力学的不变量单位
11-1.设定形容词
11-2.构筑普通图像模型
11-3.构筑形容词模型图像
11-4.计算要素内的分布中的偏差值
11-5.计算部分系统的力学的不变量单位的部分能量、部分动量,部分角动量
12.部分系统向形容词能量的统合
13.整体系统向形容词能量的统合
14.形容词检索处理
从顺序11至14,沿袭与第6实施方式完全相同的顺序。
由此,从与颜色和边缘的灰度相关的一维分布、及与颜色和边缘的构图相关的二维分布导出的感性不变量、或者与图像识别相关的不变量在共同条件下作为相加性特征量而记述。在某形容词的识别中某特征密切相关的情况下,其特征量对于普通图像具有大的偏差而记述。由于采取投影空间表达的观点,所以能够使人的识别构造、感性构造可视化。使频率记述中的能带图的一部分对两个形容词进行比较而示出。
[第9实施方式]
相对于第8实施方式,示出在记述颜色的二维分布函数的高次系统不变量时,相伴勒让德函数展开为m=0,1,2,3的情况下的例子。
8.生成二维色分布的高次不变量
8-0.低次系统的分布函数的希尔伯特空间表达
8-0-1.变量转换
8-0-2.基于相伴勒让德函数的级数展开
使H,V,C各色面的二维分布函数以N×N个系数通过相伴勒让德函数进行二重级数展开而等价表达。
[算式204]
(α)=H,V,C。
首先,进行基于与磁量子数相关的m×m′种的一重级数展开的等价表达。
[算式205]
展开系数cmm ll′利用基底函数的正交性而求出。按各行、各列的一维方向的展开使用以下关系式来进行。
[算式206]
进行二重级数展开时的磁量子数间的加权amm′为均等分配的1。在将色面的二维分布函数
[算式207]
和边缘面的二维分布函数
[算式208]
通过两个分布函数的积而同时展开时,能够通过边缘面的二维分布函数的傅里叶函数的正交性保证磁量子数m之间的正交性。
该部分系统的不变量的计算所使用的展开系数cmm′ll′与通过一重级数而求出的展开系数cmm ll′相等。由此,生成m×m′种、即关于磁量子数生成4×4种的方阵。
8-1.建立高次系统的分布函数
[算式209]
8-2.熵的计算
[算式210]
S=S(H)+S(V)+S(C)
8-3.计算动量的要素pn
动量的要素pn为展开系数
[算式211]
其自身。
当[]表示数组时,动量的要素数量为:
[α面的数量][m的数量][m′的数量][l的数量][l′的数量]=3×4×4×50×50。将它们按顺序以pn汇总地表示。
8-4.计算角动量的要素Mn
在相伴勒让德函数的展开系数中,提供中心对称形状的性质的是磁量子数m,m′均相等的、该磁量子数的组中的与方位量子数l,l′相关的展开系数的对角成分。相伴勒让德函数的方位量子数l,l′规定希尔伯特空间坐标,将角动量M=r×p定义为希尔伯特空间坐标与动量的积。
[算式212]
相伴勒让德函数具有如下轴颠倒性。
[算式213]
作为轴颠倒存在四种情况,但其中提供独立要素的仅为(α)(x,y)和(α′)(x,-y)。(α″)(-x,y)仅记述与(α′)(x,-y)相同的状态,(α″′)(-x,-y)仅记述与(α)(x,y)相同的状态。通过以下算式记述将y轴颠倒而得到的另一个独立要素。
[算式214]
当[]表示数组时,角动量的要素数量为:
[α面的数量][轴颠倒性的数量]=3×2。
将它们按顺序以Mn汇总地表示。
8-5.计算能量的要素En
使二维展开系数
[算式215]
在m,m′面上关于l,l′沿12方向重新排列而得到的一维数组以
[算式216]
示意地表示。与此前同样地生成m,m′面上的能量分散关系的能级En的值。但是,标准化的因子在后面的生成最终能级的要素时进行。
[算式217]
然后m,m′分别以遍历完整系的方式取四个面上的能量分散关系的和,认为在第8实施方式中定义的能级分裂成四个。即,最终能级的要素在磁量子数m,m′分别取至四个时分裂成四个能级。
[算式218]
分子为自相关时的例外定义如下所示。
[算式219]
关于轴颠倒性,对α面和β面的各自的四种状态以如下方式替换展开系数,因此上述定义的能量分散关系还能够独立地定义4×4倍的能量分散关系。
[算式220]
当[]表示数组时,能量的要素数量为:
[α面与β面的组合的数量][Δm型的数量][α面的轴颠倒性的数量][β面的轴颠倒性的数量][α面的重新排序方法的数量][β面的重新排序方法的数量][对称积或反对称积的种类][能级数]
=6×4×4×4×12×12×2×50。
关于向与方向组合相关的平均能量分散关系的缩减,同样的观点也成立。此时的能量要素的数量为:
[α面与β面的组合的数量][Δm型的数][α面的轴颠倒性的数量][β面的轴颠倒性的数量][能级数]
=6×4×4×4×50。
[第10实施方式]
在6×6方向组合中,通过方向组合平均而共同留存对称积、反对称积的情况
在第8实施方式的顺序8-5和第9实施方式的顺序9-5中,当从二维展开系数生成能量的要素时,对12方向取向一维数组的排列,对(α)面与(β)面的积关于12×12方向的组合而导出能量分散关系
[算式221]
但是,由于12方向的重新排序取正方向和负方向这两种,所以也存在仅选择正方向的6方向的重新排序的观点。
仅以第8实施方式的顺序8-5的情况为例进行说明。
8-5.计算能量的要素En
[算式222]
记述了6×6种组合的能量分散关系。
若[]表示数组,则此时的能量的要素数量为:
[α面与β面的组合的数量][α面的轴颠倒性的数量][β面的轴颠倒性的数量][α面的重新排序方法的数量][β面的重新排序方法的数量][对称积或反对称积的类别][能级数]
=6×4×4×6×6×2×50。
当求出与6×6方向组合相关的平均能量分散关系时,与12×12方向组合的情况不同,反对称积的平均能量分散关系也留存。
[算式223]
此时的能量要素的数量为,
[α面与β面的组合的数量][α面的轴颠倒性的数量][β面的轴颠倒性的数量][对称积或反对称积的种类][能级数]
=6×4×4×2×50。
在实验上确认时使用平均能量分散关系来定义能量要素的情况下,第8实施方式和第10的实施方式的捕捉特征的能力大致相同。
因此,可以使用任一方。
此外,在此前的实施方式中,对频率记述中的动量的定义,将使分布函数以基底函数展开而得到的展开系数自身作为动量。因此,存在与展开系数的个数相等的动量的要素数量。但是,考虑将其更为缩减,也能够使在各个部分系统中以色面单位取全部展开系数的和而得到的全动量为动量的定义。或者,若除以展开系数的数量,则也能够成为色面单位的平均动量。若不考虑轴颠倒性,则关于该情况下的动量的定义,虽然从一个色面导出一个动量的要素,但由于轴颠倒性具有意义,所以关于要素数的数量与通过角动量的导出而缩减的要素数具有相似关系。
像这样,在以全动量代表的情况下,通过轴颠倒性,能够导出其他独立的代表值。在一维分布的部分系统的情况下,由于仅能够进行单轴颠倒所以为2倍的独立要素。在二维分布的部分系统的情况下,由于能够进行二轴颠倒所以从该组合产生4倍的独立要素。
若像这样也以平均值记述频率记述中的动量,则在实际空间记述中采用的动量与从模型哈密顿算子的平均场近似的观点导出的值相同,成为将平均值采用为代表值的观点的记述法。
另外,根据上述各实施方式,
(1)一种图像分类方法,其特征在于,包括以下步骤:分布函数输入步骤,分别输入与至少两个色面α,β(包含α=β的情况)相关的图像的二维分布函数f(α)(x,y),f(β)(x,y);记述步骤,使用在x方向和y方向的各分布区域内形成完整系且相互正交的n个基底函数ψn(n:量子数)对上述两个分布函数分别进行二维级数展开
f(α)(x,y)=c00 (α)ψ0(y)ψ0(x)+…+c0,n-1 (α)ψ0(y)ψn-1(x)
+…
+cn-1,0 (α)ψn-1(y)ψ0(x)+…+cn-1,n-1 (α)ψn-1(y)ψn-1(x),
f(β)(x,y)=c00 (β)ψ0(y)ψ0(x)+…+c0,n-1 (β)ψ0(y)ψn-1(x)
+…
+cn-1,0 (β)ψn-1(y)ψ0(x)+…+cn-1,n-1 (β)ψn-1(y)ψn-1(x),
通过二维展开系数cij (α),cij (β)(i=0,1,…,n-1;j=0,1,…,n-1)来分别记述上述两个分布函数;重新排序步骤,在上述展开系数的二维平面中,在将i增加的方向定义成+ky方向、将j增加的方向定义成+kx方向、将i和j同时增加的方向定义成+kd方向、将i增加而j减小的方向定义成+kd’方向,而且将(i,j)=(0,0)的坐标点定义成(kx,ky)=(0,0)、将(i,j)=(n-1,0)的坐标点定义成(kx,ky)=(0,2π/a)、将(i,j)=(0,n-1)的坐标点定义成(kx,ky)=(2π/a,0)、将(i,j)=(n-1,n-1)的坐标点定义成(kx,ky)=(2π/a,2π/a)时,将上述二维展开系数cij (α),cij (β)分别按以下顺序,即:按
1)以(kx,ky)=(0,0)为起点的+ky方向、
2)以(kx,ky)=(0,0)为起点的+kx方向、
3)以(kx,ky)=(0,0)为起点的+kd方向、
4)以(kx,ky)=(2π/a,0)为起点的+kd’方向、
5)以(kx,ky)=(π/a,0)为起点的+ky方向、
6)以(kx,ky)=(0,π/a)为起点的+kx方向、
7)以(kx,ky)=(2π/a,2π/a)为起点的-ky方向、
8)以(kx,ky)=(2π/a,2π/a)为起点的-kx方向、
9)以(kx,ky)=(2π/a,2π/a)为起点的-kd方向、
10)以(kx,ky)=(0,2π/a)为起点的-kd’方向、
11)以(kx,ky)=(π/a,2π/a)为起点的-ky方向、
12)以(kx,ky)=(2π/a,π/a)为起点的-kx方向
的顺序重新排序成12种一维数组的展开系数ci (α),ci (β)(i=0,1,…,n×n-1);要素生成步骤,使上述两个分布函数的分别排列成12种的第i个展开系数和第k个展开系数彼此相乘,由此针对12×12种的重新排序的方向组合分别生成以对称积表示的二次形式的要素ci (α)ck (β)+ck (α)ci (β);物理量生成步骤,针对上述生成的144种二次形式的要素的每一种要素,相对于多个量子数的差分别生成取具有固定量子数的差m=i-k的全部要素的和的物理量Em=i-k (α)(β)+;评估步骤,根据上述生成的各个物理量中的至少一个来评估上述图像的二维分布函数的形状特征;和分类步骤,根据上述评估结果将上述图像分类为至少两个范畴的图像中,
(2)一种图像分类方法,其特征在于,在(1)所记载的图像分类方法中,在上述物理量生成步骤中,相对于m=0,1,…,n-1的n个量子数的差而生成物理量Em=i-k (α)(β)+,
(3)一种图像分类方法,其特征在于,在(1)所记载的图像分类方法中,使针对上述144种方向组合而分别生成的物理量Em=i-k (α)(β)+生成在具有固定量子数的差的要素彼此之间对144种方向组合进行平均后的物理量<Em=i-k (α)(β)+>,
(4)一种图像分类方法,其特征在于,在(1)所记载的图像分类方法中,在上述要素生成步骤中,还对共计四种情况的α面的展开系数和共计四种情况的β面的展开系数也同样地,生成4×4倍的二次形式的要素,在上述物理量生成步骤中,关于随着轴颠倒而增加的4×4倍的情况也同样地,针对上述144种方向组合分别生成物理量Em=i-k (α)(-β)+,其中,共计四种情况的α面的展开系数为:与上述α面的二维分布函数f(α)(x,y)的展开系数一起将y轴颠倒而得到的二维分布函数f(α)(x,-y)=f(α’)(x,y)、将x轴颠倒而得到的二维分布函数f(α)(-x,y)=f(α”)(x,y)、将x轴和y轴这两轴颠倒而得到的二维分布函数f(α)(-x,-y)=f(α”’)(x,y)的各展开系数,共计四种情况的β面的展开系数为:与上述β面的二维分布函数f(β)(x,y)的展开系数一起将y轴颠倒而得到的二维分布函数f(β)(x,-y)=f(β’)(x,y)、将x轴颠倒而得到的二维分布函数f(β)(-x,y)=f(β”)(x,y)、将x轴和y轴这两轴颠倒而得到的二维分布函数f(β)(-x,-y)=f(β”’)(x,y)的各展开系数,
(5)一种图像分类方法,其特征在于,包括以下步骤:分布函数输入步骤,分别输入与至少两个色面α,β(包含α=β的情况)相关的图像的二维分布函数f(α)(x,y),f(β)(x,y);记述步骤,使用在x方向和y方向的各分布区域内形成完整系且相互正交的n个基底函数ψn(n:量子数)对上述两个分布函数分别进行二维级数展开
f(α)(x,y)=c00 (α)ψ0(y)ψ0(x)+…+c0,n-1 (α)ψ0(y)ψn-1(x)
+…
+cn-1,0 (α)ψn-1(y)ψ0(x)+…+cn-1,n-1 (α)ψn-1(y)ψn-1(x),
f(β)(x,y)=c00 (β)ψ0(y)ψ0(x)+…+c0,n-1 (β)ψ0(y)ψn-1(x)
+…
+ccn-1,0 (β)ψn-1(y)ψ0(x)+…+cn-1,n-1 (β)ψn-1(y)ψn-1(x),
通过二维展开系数cij (α),cij (β)(i=0,1,…,n-1;j=0,1,…,n-1)来分别记述上述两个分布函数;重新排序步骤,在上述展开系数的二维平面中,在将i增加的方向定义成+ky方向、将j增加的方向定义成+kx方向、将i和j同时增加的方向定义成+kd方向、将i增加而j减小的方向定义成+kd’方向,而且将(i,j)=(0,0)的坐标点定义成(kx,ky)=(0,0)、将(i,j)=(n-1,0)的坐标点定义成(kx,ky)=(0,2π/a)、将(i,j)=(0,n-1)的坐标点定义成(kx,ky)=(2π/a,0)、将(i,j)=(n-1,n-1)的坐标点定义成(kx,ky)=(2π/a,2π/a)时,分别对上述二维展开系数cij (α),cij (β)按以下顺序,即:按
1)以(kx,ky)=(0,0)为起点的+ky方向、
2)以(kx,ky)=(0,0)为起点的+kx方向、
3)以(kx,ky)=(0,0)为起点的+kd方向、
4)以(kx,ky)=(2π/a,0)为起点的+kd’方向、
5)以(kx,ky)=(π/a,0)为起点的+ky方向、
6)以(kx,ky)=(0,π/a)为起点的+kx方向
的顺序重新排序成6种一维数组的展开系数ci (α),ci (β)(i=0,1,…,nxn-1);要素生成步骤,使上述两个分布函数的分别重新排序成6种的第i个展开系数和第k个展开系数彼此相乘,由此针对6×6种重新排序的方向组合分别生成以对称积和反对称积表示的两种类型的二次形式的要素
ci (α)ck (β)+ck (α)ci (β),
ci (α)ck (β)-ck (α)ci (β);
物理量生成步骤,针对上述生成的36种的两种类型的二次形式的要素,相对于多个量子数的差分别生成取具有固定量子数的差m=i-k的全部要素的和的物理量Em=i-k (α)(β)+,Em=i-k (α)(β)-;评估步骤,根据上述生成的各个物理量中的至少一个来评估上述图像的二维分布函数的形状特征;和分类步骤,根据上述评估结果将上述图像分类为至少两个范畴的图像,
(6)一种图像分类方法,其特征在于,在(5)所记载的图像分类方法中,在上述物理量计算步骤中,相对于m=0,1,…,n-1的n个量子数的差而生成物理量Em=i-k (α)(β)+,Em=i-k (α)(β)-,
(7)一种图像分类方法,其特征在于,在(5)所记载的图像分类方法中,使针对上述36种方向组合而分别生成的物理量Em=i-k (α)(β)+,Em=i-k (α)(β)-生成在具有固定量子数的差的要素彼此之间对36种方向组合进行平均后的物理量<Em=i-k (α)(β)+>,<Em=i-k (α)(β)->,
(8)一种图像分类方法,其特征在于,在(5)所记载的图像分类方法中,在上述要素生成步骤中,还对共计四种情况的α面的展开系数和共计四种情况的β面的展开系数也同样地,生成4×4倍的二次形式的要素,在上述物理量生成步骤中,关于随着轴颠倒而增加的4×4倍的情况也同样地,针对上述36种方向组合分别生成物理量Em=i-k (α)(-β)+,Em=i-k (α)(-β)-,其中,共计四种情况的α面的展开系数为:与上述α面的二维分布函数f(α)(x,y)的展开系数一起将y轴颠倒而得到的二维分布函数f(α)(x,-y)=f(α’)(x,y)、将x轴颠倒而得到的二维分布函数f(α)(-x,y)=f(α”)(x,y)、将x轴和y轴这两轴颠倒而得到的二维分布函数f(α)(-x,-y)=f(α”’)(x,y)的各展开系数,共计四种情况的β面的展开系数为:与上述β面的二维分布函数f(β)(x,y)的展开系数一起将y轴颠倒而得到的二维分布函数f(β)(x,-y)=f(β’)(x,y)、将x轴颠倒而得到的二维分布函数f(β)(-x,y)=f(β”)(x,y)、将x轴和y轴这两轴颠倒而得到的二维分布函数f(β)(-x,-y)=f(β”’)(x,y)的各展开系数,
(9)一种图像分类方法,其特征在于,在(1)或(5)所记载的图像分类方法中,在上述评估步骤中,根据通过上述生成的各个物理量的全部线性结合而表示的一个线性和的物理量来评估上述图像的二维分布函数的形状特征,
(10)一种图像分类方法,其特征在于,包括以下步骤:分布函数输入步骤,输入与至少一个色面α相关的图像的二维分布函数f(α)(x,y);记述步骤,使用在x方向和y方向的各分布区域内形成完整系且相互正交的n个基底函数ψn(n:量子数)对上述分布函数进行二维级数展开
f(α)(x,y)=c00 (α)ψ0(y)ψ0(x)+…+c0,n-1 (α)ψ0(y)ψn-1(x)
+…
+cn-1,0 (α)ψn-1(y)ψ0(x)+…+cn-1,n-1 (α)ψn-1(y)ψn-1(x),
通过二维展开系数cij (α)(i=0,1,…,n-1;j=0,1,…,n-1)来记述上述分布函数;物理量生成步骤,针对满足上述二维展开系数cij (α)的i=j的对角成分的全部系数,生成取对应的基底函数的量子数i与展开系数cii (α)的积的与对角和相当的物理量;评估步骤,根据上述生成的物理量来评估上述图像的二维分布函数的形状特征;和分类步骤,根据上述评估结果将上述图像分类为至少两个范畴的图像,
(11)一种图像分类方法,其特征在于,在(10)所述的图像分类方法中,在上述物理量生成步骤中,还对上述α面的二维分布函数将y轴颠倒而得到的二维分布函数f(α)(x,-y)=f(α’)(x,y)的二维展开系数cij (α’)也同样地,生成与对角和相当的物理量,
(12)一种图像分类方法,其特征在于,在(1)、(5)或(10)所记载的图像分类方法中,在上述分布函数输入步骤中,在输入色面的图像的分布函数时,上述记述步骤使用相伴勒让德函数作为上述基底函数,
(13)一种图像分类方法,其特征在于,在(1)、(5)或(10)所记载的图像分类方法中,在上述分布函数输入步骤中,在输入与色面的边缘成分相关的边缘图像的分布函数时,上述记述步骤使用傅里叶函数作为上述基底函数,
(14)提供一种图像分类方法,其特征在于,在(13)所记载的图像分类方法中,上述边缘图像的分布函数为边缘面的图像的分布函数,对上述图像进行过滤而依次生成由多个析像度组成的高频子带图像,从较低的析像度依次统合上述高频子带图像而生成统合为一个的高频图像,对上述统合成一个的高频图像的各像素值平方,由此以零以上的值定义。
根据(1)~(14)所记载的图像分类方法,对二维分布函数使用与它们的信号分布的性质相符的正交基底函数来进行级数展开,由此在进行识别形状时的向均等识别空间投影的频率表达之后,使该频率面的系数分布的性质作为展开系数的二次形式的特征量而既约表达,由此具有最压缩、范围不变且与方向性相关的不变性,并且能够转换成在唤起同一感性的图像之间或具有共同认识的物体构造所映现的图像之间守恒的、即使取同一感性的图像间的统计平均也不消失的信息量。另外,通过保证这些特征量的相加性质,也能够容易地记述关于图像的特征量的怎样的要素强烈地唤起心理印象的作用的心理构造的阐明。
而且,根据上述各实施方式,
(15)一种图像分类方法,其特征在于,包括以下步骤:图像输入步骤,输入与至少一个色面α相关的图像A(x,y);分布函数建立步骤,建立将上述α面的图像的像素值通过全部像素值的和而标准化的分布函数f(α)(x,y);空间因子记述步骤,使用上述分布函数求出空间分布的重心位置(<xA>,<yA>)、和各个表示从重心位置开始的与空间方向相关的二次转矩的平均扩展幅度<(y-<yA>)2>,-<(x-<xA>)(y-<yA>)>,-<(y-<yA>)(x-<xA>)>,<(x-<xA>)2>的惯性张量I11 (α),I12 (α),I21 (α),I22 (α),从而记述空间形状因子;一维图像建立步骤,计算出对上述α面的图像A(x,y)关于y轴方向取像素值的平均并向x轴投影而得到的一维图像A(x)、和关于x轴方向取像素值的平均并向y轴投影而得到的一维图像A(y);明亮度因子记述步骤,计算出图像整体的像素值的明亮度的平均值<A>,并且使用x轴投影的图像A(x)计算出从上述明亮度的平均值<A>观察到的x轴投影的明亮度的扩展幅度σ1 (α),使用y轴投影的图像A(y)计算出从上述明亮度的平均值<A>观察到的y轴投影的明亮度的扩展幅度σ2 (α),由此记述像素值的明亮度方向的因子;物理量计算步骤,根据在上述空间因子记述步骤和上述明亮度因子记述步骤中求出的各个量计算出与明亮度因子相关的各个二次形式的物理量
(<xA>2+<yA>2)<A><A>,
I11 (α)σ1 (α)σ1 (α)+I12 (α)σ1 (α)σ2 (α)+I21 (α)σ2 (α)σ1 (α)+I22 (α)σ2 (α)σ2 (α),
I11 (α)σ1 (α)σ1 (α)+I12 (α)σ1 (α)σ2 (α)-I21 (α)σ2 (α)σ1 (α)-I22 (α)σ2 (α)σ2 (α),
I11 (α)σ1 (α)σ1 (α)-I12 (α)σ1 (α)σ2 (α)+I21 (α)σ2 (α)σ1 (α)-I22 (α)σ2 (α)σ2 (α),
I11 (α)σ1 (α)σ1 (α)-I12 (α)σ1 (α)σ2 (α)-I21 (α)σ2 (α)σ1 (α)+I22 (α)σ2 (α)σ2 (α);
和分类步骤,根据上述计算出的至少一个物理量,将上述图像分类为至少两个范畴的图像,
(16)一种图像分类方法,其特征在于,在(15)所记载的图像分类方法中,在上述物理量计算步骤中,还计算出以上述计算出的二次形式的物理量的各个线性结合表示的一个线性和的物理量,在上述分类步骤中,根据上述计算出的一个线性和的物理量,将上述图像分类为至少两个范畴的图像,
(17)一种图像分类方法,其特征在于,在(15)所记载的图像分类方法中,在上述图像输入步骤输入与色面的边缘成分相关的具有正负值的图像时,在上述分布函数建立步骤中,对与上述边缘成分相关的图像的像素值平方而转换成以零以上的范围定义的像素值的分布之后,建立通过全部像素值的和而标准化的分布函数,
(18)一种图像分类方法,其特征在于,在(17)所述的图像分类方法中,与上述边缘成分相关的图像为高频图像,对上述图像进行过滤而依次生成由多个析像度构成的高频子带图像,对上述高频子带图像从较低的析像度依次进行统合,从而统合为一幅高频图像,
(19)一种图像分类方法,其特征在于,包括以下步骤:图像输入步骤,输入与至少两个色面α,β(α≠β)相关的图像A(x,y),B(x,y);分布函数建立步骤,建立将上述α面的图像的像素值通过α面的全部像素值的和而标准化的α面的分布函数f(α)(x,y)、和将上述β面的图像的像素值通过β面的全部像素值的和而标准化的β面的分布函数f(β)(x,y);合成分布函数建立步骤,建立将以上述α面的分布函数与上述β面的分布函数的积表示的值通过对全部像素取和得到的值而标准化的α面与β面的合成分布函数f(αβ)(x,y);合成面的空间因子记述步骤,使用上述合成分布函数求出合成色面的空间分布的重心位置(<xAB>,<yAB>)、和各个表示从重心位置开始的与空间方向相关的二次转矩的平均的扩展幅度<(y-<yAB>)2>,-<(x-<xAB>)(y-<yAB>)>,-<(y-<yAB>)(x-<xAB>)>,<(x-<xAB>)2>的惯性张量I11 (αβ),I12 (αβ),I21 (αβ),I22 (αβ),并记述合成面的空间形状因子;α面的一维图像建立步骤,计算出使上述α面的图像A(x,y)关于y轴方向取像素值的平均并向x轴投影而得到的一维图像A(x)、和关于x轴方向取像素值的平均并向y轴投影而得到的一维图像A(y);β面的一维图像建立步骤,计算出使上述β面的图像B(x,y)关于y轴方向取像素值的平均并向x轴投影而得到的一维图像B(x)、和关于x轴方向取像素值的平均并向y轴投影而得到的一维图像B(y);α面的明亮度因子记述步骤,计算出α面的图像整体的像素值的明亮度的平均值<A>,并且使用α面的x轴投影的图像A(x)计算出从上述明亮度的平均值<A>观察到的x轴投影的明亮度的扩展幅度σ1 (α),使用α面的y轴投影的图像A(y)计算出从上述明亮度的平均值<A>观察到的y轴投影的明亮度的扩展幅度σ2 (α),由此记述α面的像素值的明亮度方向的因子;β面的明亮度因子记述步骤,计算出β面的图像整体的像素值的明亮度的平均值<B>,并且使用β面的x轴投影的图像B(x)计算出从上述明亮度的平均值<B>观察到的x轴投影的明亮度的扩展幅度σ1 (β),使用β面的y轴投影的图像B(y)计算出从上述明亮度的平均值<B>观察到的y轴投影的明亮度的扩展幅度σ2 (β),由此记述β面的像素值的明亮度方向的因子;物理量计算步骤,根据在上述合成面的空间因子记述步骤、α面的上述明亮度因子记述步骤和β面的上述明亮度因子记述步骤中求出的各个量计算出与明亮度因子相关的各个二次形式的物理量
(<xAB>2+<yAB>2)<A><B>,
I11 (αβ)σ1 (α)σ1 (β)+I12 (αβ)σ1 (α)σ2 (β)+I21 (αβ)σ2 (α)σ1 (β)+I22 (αβ)σ2 (α)σ2 (β),
I11 (αβ)σ1 (α)σ1 (β)+I12 (αβ)σ1 (α)σ2 (β)-I21 (αβ)σ2 (α)σ1 (β)-I22 (αβ)σ2 (α)σ2 (β),
I11 (αβ)σ1 (α)σ1 (β)-I12 (αβ)σ1 (α)σ2 (β)+I21 (αβ)σ2 (α)σ1 (β)-I22 (αβ)σ2 (α)σ2 (β),
I11 (αβ)σ1 (α)σ1 (β)-I12 (αβ)σ1 (α)σ2 (β)-I21 (αβ)σ2 (α)σ1 (β)+I22 (αβ)σ2 (α)σ2 (β);
和分类步骤,根据上述计算出的至少一个物理量,将上述图像分类为于至少两个范畴的图像,
(20)一种图像分类方法,其特征在于,在(19)所记载的图像分类方法中,在上述物理量计算步骤中,还计算出以上述计算出的二次形式的物理量的各个线性结合表示的一个线性和的物理量,在上述分类步骤中,根据上述计算出的一个线性和的物理量,将上述图像分类为至少两个范畴的图像,
(21)一种图像分类方法,其特征在于,在(19)所记载的图像分类方法中,在上述图像输入步骤中分别输入与色面的边缘成分相关的具有正负值的图像时,在上述分布函数建立步骤中,对与上述边缘成分相关的图像的像素值平方并分别转换成以零以上的范围定义的像素值的分布之后,分别建立通过全部像素值的和而标准化的分布函数,
(22)一种图像分类方法,其特征在于,在(21)所记载的图像分类方法中,与上述边缘成分相关的图像为高频图像,对上述图像进行过滤而依次生成由多个析像度构成的高频子带图像,使上述高频子带图像从较低的析像度依次统合,从而统合成一幅高频图像,
(23)一种图像分类方法,其特征在于,包括以下步骤:图像输入步骤,输入与至少一个色面α相关的图像A(x,y);分布函数建立步骤,建立使上述α面的图像的像素值通过全部像素值的和而标准化的分布函数f(α)(x,y);空间因子记述步骤,使用上述分布函数,求出空间分布的重心位置(<xA>,<yA>)、和各个表示从重心位置开始的与空间方向相关的二次转矩的平均的扩展幅度<(y-<yA>)2>,-<(x-<xA>)(y-<yA>)>,-<(y-<yA>)(x-<xA>)>,<(x-<xA>)2>的惯性张量I11 (α),I12 (α),I21 (α),I22 (α),并记述空间形状因子;一维图像建立步骤,计算出使上述α面的图像A(x,y)关于y轴方向取像素值的平均并向x轴投影而得到的一维图像A(x)、和关于x轴方向取像素值的平均并向y轴投影而得到的一维图像A(y);明亮度因子记述步骤,计算出图像整体的像素值的明亮度的平均值<A>,并且使用x轴投影的图像A(x)计算出从上述明亮度的平均值<A>观察到的x轴投影的明亮度的扩展幅度σ1 (α),使用y轴投影的图像A(y)计算出从上述明亮度的平均值<A>观察到的y轴投影的明亮度的扩展幅度σ2 (α),由此记述像素值的明亮度方向的因子;物理量计算步骤,根据在上述空间因子记述步骤和上述明亮度因子记述步骤求出的各个量来计算出与明亮度因子相关的各个一次形式的物理量
I11 (α)σ1 (α)+I12 (α)σ2 (α),
I21 (α)σ1 (α)+I22 (α)σ2 (α),
I11 (α)σ1 (α)-I12 (α)σ2 (α),
I21 (α)σ1 (α)-I22 (α)σ2 (α);
和分类步骤,根据上述计算出的至少一个物理量,将上述图像分类为至少两个范畴的图像,
(24)一种图像分类方法,其特征在于,在(23)所记载的图像分类方法中,在上述物理量计算步骤中,还计算出以上述计算出的一次形式的物理量的每一个物理量的线性结合表示的一个线性和的物理量,在上述分类步骤中,根据上述计算出的一个线性和的物理量,将上述图像分类为至少两个范畴的图像,
(25)一种图像分类方法,其特征在于,在(24)所记载的图像分类方法中,在上述图像输入步骤中输入与色面的边缘成分相关的具有正负值的图像时,在上述分布函数建立步骤中,对与上述边缘成分相关的图像的像素值平方并转换成以零以上的范围定义的像素值的分布之后,建立通过全部像素值的和而标准化的分布函数,
(26)一种图像分类方法,其特征在于,在(25)所记载的图像分类方法中,与上述边缘成分相关的图像为高频图像,对上述图像进行过滤而依次生成由多个析像度构成的高频子带图像,使上述高频子带图像从较低的析像度依次统合,从而统合成一幅高频图像,
(27)一种图像分类方法,其特征在于,在(16)所记载的图像分类方法中,还根据上述分布函数f(α)(x,y)计算出对由-f(α)(x,y)log(f(α)(x,y))组成的值关于分布函数具有正值的像素位置(x,y)进行积分而得到的熵S,并且计算出与将上述计算出的各个二次形式的物理量汇总成一个向量而记载时的范数相当的量T,生成其积TS,在上述物理量计算步骤中,还对上述计算出的一个线性和加上使上述生成的积TS线性结合的结果,由此计算出一个线性和,
(28)提供一种图像分类方法,其特征在于,在(24)所记载的图像分类方法中,还根据上述分布函数f(α)(x,y)计算出对由-f(α)(x,y)log(f(α)(x,y))组成的值关于分布函数具有正值的像素位置(x,y)进行积分而得到的熵S,并且计算出与将上述计算出的一次形式的物理量分别汇总成一个向量而表述时的范数相当的量T,从而生成其积TS,在上述物理量计算步骤中,还对上述计算出的一个线性和加上对上述生成的积TS进行线性结合的结果,由此计算出一个线性和。
根据(15)~(28)所记载的图像分类方法,在与图像的信号分布的颜色和边缘相关的感知识别中,能够使注目区域和与扩展相关的性质作为即使物理表象以极其明快的形式在生成共同感性或共同认识的图像之间取统计平均也不会消失的特征量而定量地记述。另外,通过保证这些特征量的相加性质,也能够容易地记述关于图像的特征量的怎样的要素强烈地唤起心理印象的作用的心理构造的阐明。
Claims (6)
1.一种图像分类方法,其特征在于,包括以下步骤:
二维颜色分布函数输入步骤,对色面的图像的二维分布函数进行输入;
二维边缘分布函数建立步骤,对所述色面的图像进行过滤,依次生成由多个析像度构成的高频子带图像,使所述高频子带图像从较低的析像度依次统合而生成统合成一个的高频图像,对所述统合成一个的高频图像的各像素值进行平方,由此建立以零以上的值的分布所定义的边缘面的图像的二维分布函数;
记述步骤,将所述色面的图像的二维分布函数展开成以相伴勒让德函数为x方向和y方向的正交基底函数的二维勒让德级数,通过勒让德展开系数来记述所述色面的图像的二维颜色分布,并且将所述边缘面的图像的二维分布函数展开成以余弦函数和正弦函数为x方向和y方向的正交基底函数的二维傅里叶级数,通过傅里叶展开系数来记述所述边缘面的图像的二维边缘分布;
评估步骤,根据所述勒让德展开系数和所述傅里叶展开系数来评估所述色面的图像的分布特征;和
分类步骤,根据所述评估结果将所述色面的图像分类为至少两个范畴的图像。
2.如权利要求1所述的图像分类方法,其特征在于,还包括:
一维边缘分布函数建立步骤,使用所述统合成一个的高频图像来建立与边缘强度的值相关的一维分布函数;和
记述步骤,将与所述边缘强度相关的一维分布函数展开成以球贝塞尔函数为正交基底函数的球贝塞尔级数,通过球贝塞尔展开系数来记述所述边缘强度的一维分布,
在所述评估步骤中,与所述勒让德展开系数和所述傅里叶展开系数相配合,也使用所述球贝塞尔展开系数来评估所述色面的图像的分布特征。
3.如权利要求2所述的图像分类方法,其特征在于,还包括:
一维颜色分布函数建立步骤,使用所述色面的图像来建立与像素值相关的一维分布函数;和
记述步骤,将与所述像素值相关的一维分布函数展开成以切比雪夫函数为正交基底函数的切比雪夫级数,通过切比雪夫展开系数来记述所述像素值的一维分布,
在所述评估步骤中,与所述勒让德展开系数、所述傅里叶展开系数和所述球贝塞尔展开系数相配合,也使用所述切比雪夫展开系数来评估所述色面的图像的分布特征。
4.如权利要求1所述的图像分类方法,其特征在于,
在所述评估步骤中,根据所述勒让德展开系数生成以该展开系数的二次形式表示的特征量,根据所述傅里叶展开系数生成以该展开系数的二次形式表示的特征量,而且还生成以这些特征量的线性和表示的一个特征量,根据以所述线性和表示的一个特征量来评估所述色面的图像的分布特征。
5.如权利要求2所述的图像分类方法,其特征在于,
在所述评估步骤中,根据所述勒让德展开系数生成以该展开系数的二次形式表示的特征量,根据所述傅里叶展开系数生成以该展开系数的二次形式表示的特征量,根据所述球贝塞尔展开系数生成以该展开系数的二次形式表示的特征量,而且还生成以这些特征量的线性和表示的一个特征量,根据以所述线性和表示的一个特征量来评估所述色面的图像的分布特征。
6.如权利要求3所述的图像分类方法,其特征在于,
在所述评估步骤中,根据所述勒让德展开系数生成以该展开系数的二次形式表示的特征量,根据所述傅里叶展开系数生成以该展开系数的二次形式表示的特征量,根据所述球贝塞尔展开系数生成以该展开系数的二次形式表示的特征量,根据所述球切比雪夫展开系数生成以该展开系数的二次形式表示的特征量,而且还生成以这些特征量的线性和表示的一个特征量,根据以所述线性和表示的一个特征量来评估所述色面的图像的分布特征。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011-151622 | 2011-07-08 | ||
JP2011151622A JP2013020335A (ja) | 2011-07-08 | 2011-07-08 | 画像分類方法 |
PCT/JP2012/064975 WO2013008573A1 (ja) | 2011-07-08 | 2012-06-12 | 画像分類方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103620647A true CN103620647A (zh) | 2014-03-05 |
Family
ID=47505871
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201280030264.0A Pending CN103620647A (zh) | 2011-07-08 | 2012-06-12 | 图像分类方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20140348423A1 (zh) |
JP (1) | JP2013020335A (zh) |
CN (1) | CN103620647A (zh) |
WO (1) | WO2013008573A1 (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105426543A (zh) * | 2015-12-28 | 2016-03-23 | 辽宁师范大学 | 基于贝塞尔统计模型的图像检索方法 |
CN106503143A (zh) * | 2016-10-21 | 2017-03-15 | 广东工业大学 | 一种图像检索方法及装置 |
CN107657037A (zh) * | 2017-09-29 | 2018-02-02 | 郑州云海信息技术有限公司 | 一种高效图像检索方法 |
CN108206910A (zh) * | 2016-12-20 | 2018-06-26 | 北京小米移动软件有限公司 | 图像拍摄的方法及装置 |
CN108986180A (zh) * | 2018-06-07 | 2018-12-11 | 阿里巴巴集团控股有限公司 | 一种调色板的生成方法、装置及电子设备 |
CN110136146A (zh) * | 2019-05-17 | 2019-08-16 | 浙江理工大学 | 基于正弦spf分布和水平集模型的sar图像水域分割方法 |
CN110955830A (zh) * | 2019-11-22 | 2020-04-03 | 拉扎斯网络科技(上海)有限公司 | 信息处理方法、装置、电子设备及计算机可读存储介质 |
CN111175318A (zh) * | 2020-01-21 | 2020-05-19 | 上海悦易网络信息技术有限公司 | 屏幕划痕碎裂检测方法及设备 |
CN111426648A (zh) * | 2020-03-19 | 2020-07-17 | 甘肃省交通规划勘察设计院股份有限公司 | 一种红外谱图的相似度确定方法及系统 |
CN116360603A (zh) * | 2023-05-29 | 2023-06-30 | 中数元宇数字科技(上海)有限公司 | 基于时序信号匹配的交互方法、设备、介质及程序产品 |
CN116577061A (zh) * | 2023-07-14 | 2023-08-11 | 常州市建筑科学研究院集团股份有限公司 | 金属屋面抗风性能的检测方法、计算机设备及介质 |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11080318B2 (en) * | 2013-06-27 | 2021-08-03 | Kodak Alaris Inc. | Method for ranking and selecting events in media collections |
JP6242098B2 (ja) * | 2013-07-16 | 2017-12-06 | 株式会社キーエンス | 三次元画像処理装置、三次元画像処理方法及び三次元画像処理プログラム並びにコンピュータで読み取り可能な記録媒体及び記録した機器 |
US10120879B2 (en) * | 2013-11-29 | 2018-11-06 | Canon Kabushiki Kaisha | Scalable attribute-driven image retrieval and re-ranking |
KR20160017954A (ko) * | 2014-08-07 | 2016-02-17 | 삼성전자주식회사 | 전자장치 및 전자장치의 전송 제어 방법 |
US9401107B2 (en) * | 2014-12-31 | 2016-07-26 | Shenzhen China Star Optoelectronics Technology Co., Ltd. | Image data processing method and device thereof |
JP7403253B2 (ja) | 2019-07-19 | 2023-12-22 | Lineヤフー株式会社 | 学習装置、学習方法および学習プログラム |
CN111526371B (zh) * | 2020-04-30 | 2022-12-06 | 华侨大学 | 一种基于Gabor特征和灰度共生矩阵的视频帧内编码快速算法 |
US11616555B2 (en) * | 2021-06-18 | 2023-03-28 | Qualcomm Incorporated | Spatial misalignment tracking for orbital angular momentum beams in millimeter wave and higher frequency bands |
US11757516B2 (en) | 2021-06-18 | 2023-09-12 | Qualcomm Incorporated | Beam management procedure for OAM in MMW and higher bands |
US11849469B2 (en) | 2021-06-18 | 2023-12-19 | Qualcomm Incorporated | Orbital angular momentum capability in millimeter wave and higher frequency bands |
WO2024018590A1 (ja) * | 2022-07-21 | 2024-01-25 | 日本電信電話株式会社 | 主観補正装置、主観補正方法及び主観補正プログラム |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3708621B2 (ja) * | 1996-04-15 | 2005-10-19 | 富士写真フイルム株式会社 | 画像読み取り装置 |
JP3031613B2 (ja) * | 1996-11-12 | 2000-04-10 | 株式会社つくばソフト研究所 | カラー/濃淡画像入力出力装置と入力出力方法 |
US7457472B2 (en) * | 2005-03-31 | 2008-11-25 | Euclid Discoveries, Llc | Apparatus and method for processing video data |
US7457435B2 (en) * | 2004-11-17 | 2008-11-25 | Euclid Discoveries, Llc | Apparatus and method for processing video data |
US7436981B2 (en) * | 2005-01-28 | 2008-10-14 | Euclid Discoveries, Llc | Apparatus and method for processing video data |
US8600149B2 (en) * | 2008-08-25 | 2013-12-03 | Telesecurity Sciences, Inc. | Method and system for electronic inspection of baggage and cargo |
JP5181955B2 (ja) * | 2008-09-16 | 2013-04-10 | 株式会社ニコン | 画像分類装置および画像処理装置 |
JP4840426B2 (ja) * | 2008-09-24 | 2011-12-21 | ソニー株式会社 | 電子機器、ぼけ画像選別方法及びプログラム |
US8478053B2 (en) * | 2009-07-15 | 2013-07-02 | Nikon Corporation | Image sorting apparatus |
JP5041041B2 (ja) * | 2009-07-15 | 2012-10-03 | 株式会社ニコン | 画像分類装置 |
JP5041040B2 (ja) * | 2009-07-15 | 2012-10-03 | 株式会社ニコン | 画像分類装置 |
-
2011
- 2011-07-08 JP JP2011151622A patent/JP2013020335A/ja not_active Withdrawn
-
2012
- 2012-06-12 US US14/130,188 patent/US20140348423A1/en not_active Abandoned
- 2012-06-12 WO PCT/JP2012/064975 patent/WO2013008573A1/ja active Application Filing
- 2012-06-12 CN CN201280030264.0A patent/CN103620647A/zh active Pending
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105426543A (zh) * | 2015-12-28 | 2016-03-23 | 辽宁师范大学 | 基于贝塞尔统计模型的图像检索方法 |
CN106503143A (zh) * | 2016-10-21 | 2017-03-15 | 广东工业大学 | 一种图像检索方法及装置 |
CN108206910A (zh) * | 2016-12-20 | 2018-06-26 | 北京小米移动软件有限公司 | 图像拍摄的方法及装置 |
CN108206910B (zh) * | 2016-12-20 | 2021-04-06 | 北京小米移动软件有限公司 | 图像拍摄的方法及装置 |
CN107657037A (zh) * | 2017-09-29 | 2018-02-02 | 郑州云海信息技术有限公司 | 一种高效图像检索方法 |
CN108986180A (zh) * | 2018-06-07 | 2018-12-11 | 阿里巴巴集团控股有限公司 | 一种调色板的生成方法、装置及电子设备 |
CN110136146B (zh) * | 2019-05-17 | 2021-01-08 | 浙江理工大学 | 基于正弦spf分布和水平集模型的sar图像水域分割方法 |
CN110136146A (zh) * | 2019-05-17 | 2019-08-16 | 浙江理工大学 | 基于正弦spf分布和水平集模型的sar图像水域分割方法 |
CN110955830A (zh) * | 2019-11-22 | 2020-04-03 | 拉扎斯网络科技(上海)有限公司 | 信息处理方法、装置、电子设备及计算机可读存储介质 |
CN110955830B (zh) * | 2019-11-22 | 2021-02-19 | 拉扎斯网络科技(上海)有限公司 | 信息处理方法、装置、电子设备及计算机可读存储介质 |
CN111175318A (zh) * | 2020-01-21 | 2020-05-19 | 上海悦易网络信息技术有限公司 | 屏幕划痕碎裂检测方法及设备 |
CN111426648A (zh) * | 2020-03-19 | 2020-07-17 | 甘肃省交通规划勘察设计院股份有限公司 | 一种红外谱图的相似度确定方法及系统 |
CN116360603A (zh) * | 2023-05-29 | 2023-06-30 | 中数元宇数字科技(上海)有限公司 | 基于时序信号匹配的交互方法、设备、介质及程序产品 |
CN116577061A (zh) * | 2023-07-14 | 2023-08-11 | 常州市建筑科学研究院集团股份有限公司 | 金属屋面抗风性能的检测方法、计算机设备及介质 |
CN116577061B (zh) * | 2023-07-14 | 2023-09-15 | 常州市建筑科学研究院集团股份有限公司 | 金属屋面抗风性能的检测方法、计算机设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2013008573A1 (ja) | 2013-01-17 |
US20140348423A1 (en) | 2014-11-27 |
JP2013020335A (ja) | 2013-01-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103620647A (zh) | 图像分类方法 | |
Li et al. | Learning disentangled feature representation for hybrid-distorted image restoration | |
Saydjari et al. | Classification of magnetohydrodynamic simulations using wavelet scattering transforms | |
JP5041041B2 (ja) | 画像分類装置 | |
Wolter et al. | Wavelet-packets for deepfake image analysis and detection | |
Liu et al. | 3D model retrieval based on color+ geometry signatures | |
Fofonov et al. | Projected Field Similarity for Comparative Visualization of Multi‐Run Multi‐Field Time‐Varying Spatial Data | |
Singh et al. | Attention span prediction using head-pose estimation with deep neural networks | |
Hofmann et al. | Visualization of 4D vector field topology | |
Desmond et al. | Catalogues of voids as antihaloes in the local Universe | |
Offner et al. | The Shapes of Molecular Cloud Cores in Simulations and Observations | |
JP5041040B2 (ja) | 画像分類装置 | |
JP5007758B2 (ja) | 画像分類装置 | |
JP2013020337A (ja) | 画像分類方法 | |
Ham | The state of the art of visual analytics | |
Price et al. | Differentiable and accelerated wavelet transforms on the sphere and ball | |
JP5007757B2 (ja) | 画像分類装置 | |
CN113723008B (zh) | 基于几何非纠缠变分自动编码器学习几何解耦表示的方法 | |
JP2013020336A (ja) | 画像分類方法 | |
Zheng | Spectral techniques for heterogeneous social networks | |
Mohan et al. | Generating images of the M87* black hole using GANs | |
Xie et al. | Data Mining Method under Model-Driven Architecture (MDA) | |
Lavanya et al. | A generic frame work for image data clustering via weighted clustering ensemble | |
Christoudias et al. | Visualising the dark sky IEEE SciVis contest 2015 | |
Dong et al. | Image inpainting method based on AU-GAN |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20140305 |