JP5041041B2 - Image classification device - Google Patents

Image classification device Download PDF

Info

Publication number
JP5041041B2
JP5041041B2 JP2010147027A JP2010147027A JP5041041B2 JP 5041041 B2 JP5041041 B2 JP 5041041B2 JP 2010147027 A JP2010147027 A JP 2010147027A JP 2010147027 A JP2010147027 A JP 2010147027A JP 5041041 B2 JP5041041 B2 JP 5041041B2
Authority
JP
Japan
Prior art keywords
image
function
energy
distribution
distribution function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010147027A
Other languages
Japanese (ja)
Other versions
JP2011040050A (en
Inventor
健一 石賀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nikon Corp
Original Assignee
Nikon Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nikon Corp filed Critical Nikon Corp
Priority to JP2010147027A priority Critical patent/JP5041041B2/en
Priority to US12/834,457 priority patent/US8478053B2/en
Publication of JP2011040050A publication Critical patent/JP2011040050A/en
Application granted granted Critical
Publication of JP5041041B2 publication Critical patent/JP5041041B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、画像分類装置に関するものである。   The present invention relates to an image classification device.

従来、ユーザーが提示する1つのモデル画像に対して、類似画像を検索する類似画像検索という技術分野が存在する。非特許文献1には色ヒストグラムを用いて、それらのビンを均等に統合することによって粗く量子化し、その値自体を特徴量とし、特徴量空間で類似度の距離を測ることによって類似画像を抽出する技術が開示されている。非特許文献2では色とテキスチャと形のそれぞれの側面から類似する画像を検索するシステムを提案しており、色については非特許文献1と同様な特徴量を、また他の側面については全く異なる特徴量を定義している。非特許文献3には、テキスチャ特徴量による類似画像検索の方法が示されている。ここでは、画像をガボール・ウェーブレット変換し、生成された各々の高周波サブバンドの値の平均値と標準偏差のセットを特徴量ベクトルとする。それから、Brodatz texture databaseに示されたテキスチャに類似する画像を、特徴量空間における距離比較で抽出する技術が開示されている。   2. Description of the Related Art Conventionally, there is a technical field called similar image search that searches for a similar image for one model image presented by a user. Non-Patent Document 1 uses a color histogram to roughly quantize those bins by uniformly integrating them, and use the values themselves as feature quantities to extract similar images by measuring the distance of similarity in the feature quantity space. Techniques to do this are disclosed. Non-Patent Document 2 proposes a system that searches for similar images from the respective sides of color, texture, and shape, and features similar to non-patent document 1 for color and completely different for other aspects. A feature value is defined. Non-Patent Document 3 discloses a method for retrieving similar images based on texture feature amounts. Here, the image is subjected to Gabor wavelet transform, and a set of the average value and standard deviation of the values of each generated high-frequency subband is used as a feature vector. Then, a technique for extracting an image similar to the texture shown in Brodatz texture database by distance comparison in the feature amount space is disclosed.

一方、類似画像検索とは異なり、写真を感性的な形容詞で分類する感性検索とも呼べる技術が特許文献1に開示されている。ここでは、写真を代表3色に近似し、服飾やインテリア、都市景観を制作するカラーデザイナーのために予め用意された、3色配色モデルと形容詞による印象語との関係を記述したデータベースと照合することによって、写真の感性を記述している。すなわち、非特許文献1の方法を更に粗く記述して代表色を決める代わりに、1つの用語に対してそのパターン・モデルを1〜10個程度の複数用意している。   On the other hand, unlike similar image search, Patent Literature 1 discloses a technique that can also be called a sensitivity search that classifies a photograph by a sensitivity adjective. Here, the photograph is approximated to three representative colors, and collated with a database that describes the relationship between a three-color color model and impression words using adjectives prepared in advance for color designers who create clothing, interior, and cityscapes. This describes the sensitivity of the photo. That is, instead of describing the method of Non-Patent Document 1 more roughly and determining a representative color, a plurality of 1 to 10 pattern models are prepared for one term.

更に、非特許文献4では画像と光沢感の関係を明らかにしている。すなわち、画像の輝度ヒストグラムの非対称性と人間が光沢感を知覚判断する機構との間に深い関連性があると指摘している。具体的には、輝度ヒストグラムの歪度と光沢感の関係を解明している。そのための心理実験を行うシミュレーション画像を作るため、ヒストグラムのモデルとして歪度との対応関係がとりやすいベータ関数を仮定し、そのパラメータを変更することによって心理実験を行っている。   Further, Non-Patent Document 4 clarifies the relationship between the image and glossiness. That is, it is pointed out that there is a deep relationship between the asymmetry of the luminance histogram of an image and the mechanism by which humans perceive glossiness. Specifically, the relationship between the skewness of the luminance histogram and the glossiness is clarified. In order to create a simulation image for performing a psychological experiment for this purpose, a psychological experiment is performed by assuming a beta function that is easily correlated with the skewness as a histogram model and changing the parameters.

特許第3020887号公報Japanese Patent No. 3020887

Y. Gong, C.H. Chuan, and G. Xiaoyi, "Image Indexing and Retrieval Based on Color Histograms," Multimedia Tools and Applications 2, 133-156(1996).Y. Gong, C.H. Chuan, and G. Xiaoyi, "Image Indexing and Retrieval Based on Color Histograms," Multimedia Tools and Applications 2, 133-156 (1996). W. Niblack, R. Barber, W. Equitz, M. Flickner, E. Glasman, D. Petkovic, P. Ynaker, C. Faloutsos, and G. Taubin, "The QBIC Project: Querying Images By Content Using Color, Texure, and Shape," SPIE Vol. 1908, 173-187(1993).W. Niblack, R. Barber, W. Equitz, M. Flickner, E. Glasman, D. Petkovic, P. Ynaker, C. Faloutsos, and G. Taubin, "The QBIC Project: Querying Images By Content Using Color, Texure , and Shape, "SPIE Vol. 1908, 173-187 (1993). B. S. Manjunath and W. Y. Ma, "Texuter Features for Browsing and Retrieval of Image Data," IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.18, No.8, August 1996.B. S. Manjunath and W. Y. Ma, "Texuter Features for Browsing and Retrieval of Image Data," IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.18, No.8, August 1996. I. Motoyoshi, S. Nishida, L. Sharan, and E. H. Adelson, "Image statistics and the perception of surface qualities," Nature, 2007, May 10; Vol.447(7141), pp.206-209.I. Motoyoshi, S. Nishida, L. Sharan, and E. H. Adelson, "Image statistics and the perception of surface qualities," Nature, 2007, May 10; Vol.447 (7141), pp.206-209.

上述の非特許文献1〜3の手法は、提示画像あるいは提示パターンの色ヒストグラムやテキスチャパターンと極めて正確に一致したシーンの類似画像を集める能力は有するが、異なる色やテキスチャのシーンでも同一の感性を呼び起こすような画像に共通した特徴を捉える能力を有さないという問題があった。一方、特許文献1の代表3色近似という考え方は、ある側面では通用しても、写真の感性全体を正確に記述しているとはいいがたい。また、非特許文献4は極めて注目に値するが、歪度と光沢感の関係を指摘したにとどまり、多様な感性との関係は全く未知である。   The methods of Non-Patent Documents 1 to 3 described above have the ability to collect similar images of scenes that match the color histograms and texture patterns of the presented images or the presented patterns very accurately, but the same sensitivity is also used for scenes of different colors and textures. There is a problem that it does not have the ability to capture the features common to images that evoke the image. On the other hand, even if the concept of the representative three-color approximation in Patent Document 1 is valid in a certain aspect, it cannot be said that the entire sensitivity of a photograph is accurately described. Non-patent document 4 is extremely remarkable, but only points out the relationship between the degree of distortion and glossiness, and the relationship between various sensibilities is completely unknown.

本発明は、形容詞によって画像を分類する画像分類装置を提供することを主たる目的とする。また、感性のメカニズムについて仮説を導入して数学的にモデル化することによって、画像観測量と心理物理量との間の関係を究明し、より感性メカニズムに即した高度な形で感性を特徴づける物理量の定量的な記述方法を導入することを目的とする。   An object of the present invention is to provide an image classification device that classifies images by adjectives. In addition, by introducing a hypothesis about the mechanism of sensitivity and mathematically modeling it, the relationship between the image observation amount and the psychophysical amount is investigated, and a physical quantity that characterizes the sensitivity in a sophisticated form that more closely matches the sensitivity mechanism. The purpose is to introduce a quantitative description method.

本発明の画像分類装置は、画像を入力する画像入力手段と、前記画像の画素値の分布関数を作成する分布関数作成手段と、前記分布関数を、完全系をなし分布域内で異なる重みによって互いに直交する基底関数を用いて級数展開し、展開係数によって前記分布関数を記述する記述手段と、前記展開係数の2次形式の和を少なくとも含む指標を算出することによって、前記分布関数の形状の特徴を評価する評価手段と、前記指標を値の大きさの順に並べ替えることによって、前記画像を該指標の性質を備えた画像とそれとは反対の性質を備えた画像の少なくとも2つの範疇の画像に分類する分類手段とを備えたことを特徴とする。
本発明の画像分類装置は、画像を入力する画像入力手段と、前記画像のエッジ成分に関するエッジ画像を作成するエッジ画像作成手段と、前記エッジ画像の画素値の分布関数を作成する分布関数作成手段と、前記分布関数を、完全系をなし分布域内で異なる重みによって互いに直交する基底関数を用いて級数展開し、展開係数によって前記分布関数を記述する記述手段と、前記展開係数の2次形式の和を少なくとも含む指標を算出することによって、前記分布関数の形状の特徴を評価する評価手段と、前記指標を値の大きさの順に並び替えることによって、前記画像を該指標の性質を備えた画像とそれとは反対の性質を備えた画像の少なくとも2つの範疇の画像に分類する分類手段とを備えたことを特徴とする。
本発明の画像分類装置は、画像を入力する画像入力手段と、前記画像の画素値の分布関数を作成する分布関数作成手段と、前記分布関数を、完全系をなし互いに直交する、偶関数群と奇関数群とからなる基底関数を用いて級数展開し、展開係数によって前記分布関数を記述する記述手段と、前記基底関数群の中で偶関数と奇関数に関する性質が同じ部分群に所属する関数群に対して、それぞれ偶数の量子数(0,2,...)と奇数の量子数(1,3,...)を付与し、前記展開係数と各々に付与された量子数との積を全ての展開係数について和をとった物理量を算出する物理量算出手段と、前記物理量に基づき、前記分布関数の形状の特徴を評価する指標を算出する評価手段と、前記指標を値の大きさの順に並び替えることによって、前記画像を該指標の性質を備えた画像とそれとは反対の性質を備えた画像の少なくとも2つの範疇の画像に分類する分類手段とを備えたことを特徴とする。
An image classification apparatus according to the present invention includes an image input unit that inputs an image, a distribution function generation unit that generates a distribution function of pixel values of the image, and the distribution function that forms a complete system and has different weights within a distribution range. Characteristic features of the shape of the distribution function by calculating a series using orthogonal basis functions and describing an index including at least the sum of the quadratic form of the expansion coefficient by describing means for describing the distribution function by an expansion coefficient And by rearranging the index in order of the magnitude of the value, the image is divided into at least two categories of images, the image having the property of the index and the image having the opposite property. And a classification means for classifying.
An image classification apparatus according to the present invention includes an image input unit that inputs an image, an edge image creation unit that creates an edge image related to an edge component of the image, and a distribution function creation unit that creates a distribution function of pixel values of the edge image The distribution function is series-expanded using basis functions orthogonal to each other with different weights in a distribution area, and the distribution function is described in terms of expansion coefficients, and a quadratic form of the expansion coefficient An evaluation unit that evaluates the feature of the shape of the distribution function by calculating an index including at least the sum; and an image having the characteristics of the index by rearranging the index in order of magnitude of the value And classifying means for classifying the images having the opposite properties into at least two categories of images.
An image classification apparatus according to the present invention includes an image input unit that inputs an image, a distribution function generation unit that generates a distribution function of pixel values of the image, and an even function group that forms a complete system and is orthogonal to each other. A series expansion using a basis function consisting of and an odd function group, the description function describing the distribution function by expansion coefficients, and the properties of the even function and the odd function belong to the same subgroup in the basis function group An even number of quantum numbers (0,2, ...) and an odd number of quantum numbers (1,3, ...) are assigned to the function groups, respectively, and the expansion coefficient and the quantum number assigned to each A physical quantity calculating means for calculating a physical quantity obtained by summing all the expansion coefficients, an evaluation means for calculating an index for evaluating the feature of the shape of the distribution function based on the physical quantity, By rearranging the images in order, And images with from that characterized in that a classifying means for classifying the images of at least two categories of images with opposite properties.

本発明によれば、分布関数から感性特徴量を抽出するため、予め感性とより線形な関係を生みやすいように、自然界の多くの線形な物理現象を説明する、線型微分方程式を満たす解が張る直交基底関数群によって分布関数をヒルベルト空間表現したことで、各々の分布関数がとりうる分布の特徴に応じて、直交系をなすための重み関数の役割によって、その展開係数が人間の感性に線形なスケールで振る舞いやすい空間に射影することが可能になった。更にその展開係数と基底関数群の対称性・非対称性、及びその広がり方に関する量子数に関する情報とを合わせて用いて評価する分布関数の総体的な歪みと広がりに関する形状評価も、人間の心理に線形なスケールで振る舞いやすい量で行うことが可能になった。   According to the present invention, in order to extract a Kansei feature quantity from a distribution function, a solution satisfying a linear differential equation that explains many linear physical phenomena in the natural world is stretched in advance so that a more linear relationship with Kansei can be easily created. By expressing the distribution function in terms of the Hilbert space using a set of orthogonal basis functions, the expansion coefficient is linear to the human sensibility depending on the role of the weight function to form an orthogonal system according to the distribution characteristics that each distribution function can take. It is now possible to project into a space that is easy to behave on a large scale. Furthermore, the shape evaluation of the overall distortion and spread of the distribution function that is evaluated using the expansion coefficient and the information on the symmetry / asymmetric property of the basis function group and the quantum number related to the spread is also applied to human psychology. It has become possible to perform in a quantity that is easy to behave on a linear scale.

チェビシェフ多項式Tn(x)におけるT1(x),T2(x),T3(x)のグラフである。It is a graph of T 1 (x), T 2 (x), T 3 (x) in the Chebyshev polynomial T n (x). 球ベッセル関数の根に関する基底関数のn=1〜5のグラフである。It is a graph of n = 1-5 of the basis function regarding the root of a spherical Bessel function. 球ベッセル関数のj0(x),j1(x),j2(x)のグラフである。It is a graph of j 0 (x), j 1 (x), j 2 (x) of the spherical Bessel function. 負の領域に拡大定義された球ベッセル関数j0(x)〜j5(x)のグラフである。It is a graph of spherical Bessel functions j 0 (x) to j 5 (x) defined to be expanded in the negative region. 実施形態に係る画像分類装置を示すブロック図である。It is a block diagram which shows the image classification device which concerns on embodiment. 実施形態に係る画像分類装置における処理を示すフローチャートである。It is a flowchart which shows the process in the image classification device which concerns on embodiment. Fm=2 (α)(α)+のシュプールをとる対象の1つの成分である、対称状態の合成波T1T3とT2T4の波形図である。It is a wave form diagram of synthetic waves T 1 T 3 and T 2 T 4 in a symmetric state, which is one component to be spured with Fm = 2 (α) (α) +. 「静的な」画像、「動的な」画像のHVC面の色ヒストグラム形状を示す図である。It is a figure which shows the color histogram shape of the HVC surface of a "static" image and a "dynamic" image. 「引き締まった」画像、「開放的な」画像のHVC面の色ヒストグラム形状を示す図である。It is a figure which shows the color histogram shape of the HVC surface of an "tight" image and an "open" image. 4段のウェーブレット変換によるサブバンド分割の様子を示す図である。It is a figure which shows the mode of the subband division | segmentation by 4 steps | paragraphs of wavelet transformation. 感性不変量Gz,m (α)(α)+について所定の相加平均をとった場合に、展開の次数がN=100で量子数差mをずらしたとき、整列させた画像群分布の両極端にはどのような分布関数の形状が該当するかを示した例である。When the predetermined arithmetic mean is taken for the sensitivity invariant Gz, m (α) (α) +, when the expansion order is N = 100 and the quantum number difference m is shifted, the extremes of the aligned image group distribution Is an example showing the shape of the distribution function. 「しみじみとした」画像、「幽玄な」画像のHVC面の色ヒストグラム形状を示す図である。It is a figure which shows the color histogram shape of the HVC surface of a "striking" image and a "mysterious" image. 色とテキスチャの分布関数を示す図である。It is a figure which shows the distribution function of a color and a texture. フーリエ変換を行った場合の高次運動量空間の概念図である。It is a conceptual diagram of the higher order momentum space at the time of performing a Fourier transform. 位相空間における感性群を示す描像図である。It is an image figure which shows the sensitivity group in a phase space. 位置と運動との関係が不確定性関係について説明する図である。It is a figure explaining the relationship between a position and a motion about uncertainty. 4つの拡張シュプールを構成する様子を表す行列図である。It is a matrix diagram showing a mode that four expansion spurs are comprised. 形容詞のモデル画像におけるエネルギー値の分布図である。It is a distribution map of the energy value in the model image of an adjective. ピラミッドの階層構造の想像図である。It is an imaginary figure of the hierarchical structure of a pyramid. 色及びテキスチャにおけるエネルギーバンド図である。It is an energy band figure in a color and a texture. ニッケルの伝導帯におけるエネルギーバンド図である。It is an energy band figure in the conduction band of nickel.

本発明の実施の形態についての具体的な説明の前にそれに至る原理説明を行う。
[1]本出願人のこれまでの実験による知見
上述のような課題に対応すべく、本出願人がこれまでに明らかにしてきた試みをここに要約する。その中の多くの部分は本発明者が既に出願した特願2008−23469号(先願1)及び特願2008−235578号(先願2)にも記載されている。
Prior to a specific description of the embodiment of the present invention, a principle explanation will be given.
[1] Applicant's findings from previous experiments In order to address the above-mentioned problems, the applicant's previous attempts have been summarized here. Many of them are also described in Japanese Patent Application No. 2008-23469 (prior application 1) and Japanese Patent Application No. 2008-235578 (prior application 2) already filed by the present inventor.

まず実験環境を整えるため、画像約200枚に対して各々の画像から受ける感性を言い表す形容詞を付与した。それらの画像をマンセルHVC色空間に変換し、色ヒストグラム、及びテキスチャPDFと付加形容詞との対応関係を全ての実験画像について比較調査した。ここに、テキスチャPDFとは、エッジ画像のヒストグラムのことを指す。PDFはProbability Density Functionの略で、画像から高周波帯域を抽出し、そのヒストグラムをPDFと呼ぶことが慣用的にあるので、その用語を用いた。   First, in order to prepare the experimental environment, an adjective expressing the sensitivity received from each image was assigned to about 200 images. These images were converted to Munsell HVC color space, and the correspondence between color histogram and texture PDF and additional adjectives was compared for all experimental images. Here, the texture PDF refers to a histogram of edge images. PDF is an abbreviation of Probability Density Function, and the term is used because a high frequency band is extracted from an image and its histogram is conventionally called PDF.

なお、テキスチャPDFは従来から存在する1つの高周波サブバンドに関するものではなく、視覚的に一瞬で判断する認知機構を模するべく、独自に導入した多重解像度で抽出した高周波サブバンドを統合することによって得た統合エッジ画像のヒストグラムである。そのヒストグラムには、コントラストの空間的な配置関係の相関が反映され、通常の1つの高周波帯域のPDF形状がとる一般化されたガウシアン関数とは異なる様々な形状が出現することになる。   Note that texture PDF is not related to one existing high-frequency sub-band, but by integrating the high-frequency sub-band extracted with multi-resolution that was originally introduced in order to mimic a cognitive mechanism that makes visual judgment in an instant. It is a histogram of the obtained integrated edge image. In the histogram, the correlation of the spatial arrangement relationship of the contrast is reflected, and various shapes different from the generalized Gaussian function taken by the normal PDF shape of one high frequency band appear.

<感性分類に於ける曖昧性の記述の重要性について>
実験用に用いた画像の感性を記述する形容詞を命名して明確になった点は、平均的あるいは代表的な色相・輝度・彩度が違う画像であっても同じ感性を呼び起こす一方で、平均的あるいは代表的な色相・輝度・彩度が同じであっても他の要素が強いために全く異なる感性を与えることが、ごく普通の事象として生じるということである。更にこの事実を別の側面から見れば、形容詞には階層構造があり、画像に付与する形容詞としては最上位概念に近いものだけが主に残るということにも関連する。形容詞の階層性の概念は、神経心理学等の分野で知られている事実と符合するとともに、形容詞の特徴量の記述が、類似画像検索で扱うような場合に比べて単純でないことも示している。
<Importance of description of ambiguity in sensitivity classification>
The adjective describing the sensitivity of the image used for the experiment was clarified in that the average sensitivity or the typical sensitivity of the images with different hues, brightness, and saturation is evoked. Even if the hue or brightness / saturation is the same or typical, it is an ordinary phenomenon that gives a completely different sensitivity because other elements are strong. Further, from another aspect, this fact is related to the fact that adjectives have a hierarchical structure, and that only adjectives that are close to the highest concept remain as adjectives to be given to images. The concept of adjective hierarchies is consistent with facts known in fields such as neuropsychology and also shows that the description of adjective features is not as simple as when dealing with similar image retrieval. Yes.

本出願人が上述のように形容詞と色ヒストグラム及びテキスチャPDFとの関係を調査した結果、これらの分布関数から曖昧に読みとれる似通った形状に関する特徴が、感性と直接的に結びついている可能性が高いとの確信を持つに至った。したがって、感性画像検索では、類似画像検索のようにヒストグラムの絶対的な形状の類似性を測るのが重要なのではなく、相対的にある部分の形状に関する特徴が際立っているということの類似性を、人間の感覚と合うように曖昧な特徴としてどのようにして捉えるかが重要な点である。   As a result of the applicant's investigation of the relationship between adjectives, color histograms, and texture PDFs as described above, there is a possibility that characteristics related to similar shapes that can be read vaguely from these distribution functions are directly linked to sensitivity. I came to have confidence that it was expensive. Therefore, in the sensitivity image search, it is not important to measure the similarity of the absolute shape of the histogram as in the case of the similar image search. The important point is how to understand it as an ambiguous feature to match the human sense.

上述の先願1では、特に色ヒストグラムはV面とC面の組み合せにおける全体的な形状差パターンの傾向の同時記述の重要性を指摘し、先願2ではテキスチャPDFは非対称性の評価や裾野の形の違いの重要性を指摘している。その中で、曖昧な形状抽出のために暫定的に採った方策は、色ヒストグラムの場合、V面とC面のヒストグラムの尖度と歪度に関する統計量を評価した。それによって、VC面の一方が2バンド構造で一方が1バンド構造であるか否かを判断し、その間を徐々に形状が遷移する軸の様子が評価できるかが、1つの重要な要素となっていた。テキスチャPDFの場合は、ヒストグラム形状の非対称性を歪度と独自定義のエボシ度の2つの指標を用いて評価した。この中で、同じ非対称性という特徴を評価するにあたって、裾野に敏感な指標と鈍感な指標の2つの指標を用いることによって、1つの特徴を2面的に評価することが2面性の性質を持つ形容詞との結びつきを得るには、重要であるとの帰結も導いた。形容詞の2面性とは、1つの形容詞が持つ意味には、大きな主要分類的な要素と、その中に含まれる他の形容詞との間の意味を区別する微細分類的な要素の2つを同時に兼ね備えていることを意味する。   In the above-mentioned prior application 1, in particular, the color histogram points out the importance of simultaneous description of the trend of the overall shape difference pattern in the combination of the V and C planes. Points out the importance of the difference in shape. Among them, the measure tentatively taken to extract the ambiguous shape was a statistic on the kurtosis and skewness of the V-plane and C-plane histograms in the case of color histograms. One important factor is whether it is possible to judge whether one of the VC planes has a two-band structure and one of them has a one-band structure, and the shape of the axis gradually changing between them. It was. In the case of texture PDF, the asymmetry of the histogram shape was evaluated using two indices, skewness and uniquely defined eviction. In evaluating the characteristics of the same asymmetry, the evaluation of one characteristic in two dimensions by using two indices, the index sensitive to the base and the insensitive index, shows the property of the duality. It also led to the consequence that it was important to get a connection with the adjectives that it had. The duality of adjectives is that the meaning of one adjective is divided into two major classification elements that distinguish the meaning between a major major classification element and the other adjectives contained in it. It means having both at the same time.

[2]課題と対策の指針
<分布関数の形状認識の多様化と定量化>
1)課題
上述のような、尖度や歪度等の統計学的な量には、実際には以下のような問題点がある。
a)単独の統計量では、形容詞との間の直接的な結びつきが希薄である。
b)感性に関する心理量との間で線型な定量関係にない。
c)ヒストグラム形状認識の多様化への対応には限界がある。
[2] Guidelines for issues and countermeasures <Diversification and quantification of shape recognition of distribution function>
1) Problems The above-described statistical quantities such as kurtosis and skewness actually have the following problems.
a) In a single statistic, the direct link between adjectives is sparse.
b) There is no linear quantitative relationship with the psychological quantity related to sensitivity.
c) There is a limit in dealing with diversification of histogram shape recognition.

具体的に説明を行うと、尖度や歪度といった統計量は、ガウス分布からのずれを表すパラメータとして、非対称性や尖り度に関して形状を議論することができるが、それ以上の能力を基本的に備えていない。したがって、尖度、歪度、標準偏差、平均値等を複合的に用いなければ、ヒストグラムの形状の特徴をつかんで形容詞との間で対応をとりにくい。また、それらを複合化したとしても、例えば尖度の値には、2つのバンド構造と一様な分布構造とを区別する能力がない。その上、説明できる範囲の形容詞はごく一部に限られる。   More specifically, statistics such as kurtosis and skewness can be used to discuss the shape of asymmetry and kurtosis as parameters that represent deviations from the Gaussian distribution. Not prepared for. Therefore, unless the kurtosis, skewness, standard deviation, average value, etc. are used in combination, it is difficult to grasp the characteristics of the shape of the histogram and deal with the adjectives. Even if they are combined, for example, the kurtosis value does not have the ability to distinguish between two band structures and a uniform distribution structure. In addition, only a few adjectives can be explained.

また、これらの統計量は、その定義からして標準偏差で規格化されていても、零近辺の±1近くまでの値のみならず、例えば尖り度では+20といった極端な値も画像によっては導き出す。試しに色ヒストグラムについて実験的に検証した結果、1つの指標単独では高次の形容詞とは直接的に結びつきにくいばかりでなく、心理的なスケールともかけ離れていた。   Even if these statistics are standardized by standard deviation from the definition, not only values close to ± 1 near zero, but also extreme values such as +20 for kurtosis, depending on the image. derive. As a result of experimentally verifying the color histogram as a trial, one index alone was not only directly linked to higher adjectives, but also far from the psychological scale.

2)対応策の方針
上述の課題を解決するため、全く新しい考え方を導入する。すなわち、物理学的な見地から感性を捉え、力学を展開することにより、数学的に簡潔に感性を記述しようと試みるものである。以下、ヒストグラムという呼び名を一般化して、画像から観測可能な物理量であることから、統計物理学的な用語である分布関数と呼ぶ。次節で明示されるように分布関数の指す意味は、ヒストグラムの範囲に留まらない。
2) Policy of countermeasures In order to solve the above-mentioned problems, a completely new concept is introduced. In other words, it tries to describe sensibilities mathematically and concisely by capturing sensibilities from a physical point of view and developing dynamics. In the following, the name of histogram is generalized and referred to as a distribution function which is a statistical physics term because it is a physical quantity that can be observed from an image. As specified in the next section, the meaning of the distribution function is not limited to the range of the histogram.

分布関数の形状認識を多様化かつ定量化するため、量子力学的な手法を導入する。ここで、その根拠となる推論を列記する。
・写真の像形成と感光過程の光子と電子は量子論に従う。
・人間の視覚系も同じで、更に脳内の神経回路も量子現象である。
In order to diversify and quantify the shape recognition of distribution functions, we introduce quantum mechanical techniques. Here, the inferences that serve as the basis are listed.
• Photons and electrons in photographic image formation and exposure follow quantum theory.
・ The human visual system is the same, and the neural circuit in the brain is also a quantum phenomenon.

2つ目に挙げた内容の証拠として感性はゆらぐという事実が存在する。同じ視界の外界物や写真となった画像を見ても日によってその印象は違うことがよくある。このような事実を考え合わせると、感性について量子論的記述ができれば感性と画像の特徴との間に線型な対応関係が生まれると考えられる。   There is a fact that sensibility fluctuates as evidence of the second content. Even if you look at an image of an external object or photo with the same field of view, the impression often varies from day to day. Considering these facts, it is considered that a linear correspondence between sensibility and image characteristics will be created if the quantum description of sensibility can be described.

[3]目標とする感性の記述形態
<形容詞構造の階層性>
一般に、脳内の形容詞の認知機構にはピラミッド型の階層性があることが知られている。この事実に対して、画像信号からContent-basedの形容詞検索を行おうとするとき、画像の感性に関する特徴量は何を捉えて、それらは如何なる構造を持つべきかであるが、画像に関する特徴量もやはりピラミッド型の階層性をなしていると推測するのが自然である。
[3] Descriptive form of target sensitivity <hierarchy of adjective structure>
In general, it is known that the recognition mechanism of adjectives in the brain has a pyramid-type hierarchy. In response to this fact, when performing a content-based adjective search from an image signal, what are the features related to the sensibility of the image and what structure should they have? It is natural to guess that it has a pyramid hierarchy.

ここに、本出願人が想定する感性特徴量とその階層構造について記す。まず、最も低次元の最下位層の感性特徴量として、写真画像の「代表色相、代表輝度、代表彩度」のような色に関するスカラー量的な要素が考えられる。すなわち、写真を最も面積率の大きい色相や輝度や彩度で代表させると、全体的に「赤っぽい」とか「緑色の」画像であるとか、全体的に露出不足で「暗い」画像とかの印象を呼び起こす極めて低次の特徴量がある。   Here, the sensitivity feature quantity assumed by the present applicant and its hierarchical structure will be described. First, as a sensitivity feature amount in the lowest layer in the lowest dimension, there can be considered a scalar quantity-related element such as “representative hue, representative luminance, representative saturation” of a photographic image. In other words, if a photograph is represented by the hue, brightness, and saturation with the largest area ratio, it is an overall “red” or “green” image, or an overall “under-exposed” “dark” image. There are very low-order features that evoke the impression.

次に「HVCの色の分布構造」によって記述される、色に関するベクトル量的な要素が位置すると考えられる。すなわち、HVCのヒストグラムがある固有の特徴的な状態にあるとき、やや高次の感性を呼び起こすと推定される。この階層に該当するような形容詞は例えば「爽やかな」であったり、「のどかな」であると考えられる。これらの印象を備える画像は先ほどの低次の印象よりも先に目立った感性として強く振る舞う。ただし、低次の印象が消滅するわけではなくその性質も残り続ける。その次に位置するのは「エッジ、テキスチャ、コントラスト」に関する特徴であると考えられる。現時点では、テキスチャに関して一次元的に縮約した構造因子のベクトル的な要素が対応していると推定している。エッジやテキスチャの多さやコントラストの強さによって「凛々しい」画像であるとか、「荒々しい」画像であるというような印象を与えると考えられる。   Next, it is considered that a vector quantity element related to color described by “HVC color distribution structure” is located. That is, when the HVC histogram is in a specific characteristic state, it is estimated that a slightly higher order sensitivity is evoked. Adjectives that fall under this hierarchy are considered to be “fresh” or “slow”, for example. An image having these impressions behaves strongly as a conspicuous sensibility prior to the previous low-order impression. However, the low-order impressions do not disappear and their properties remain. It is considered that the next feature is related to “edge, texture, contrast”. At the present time, it is estimated that the vector elements of the structure factor reduced one-dimensionally with respect to the texture correspond. Depending on the number of edges and textures and the strength of the contrast, it is thought that it gives an impression that the image is a “brilliant” image or a “rough” image.

そしてその上に位置するのは「構図」すなわち「空間分布」であると推定する。先に述べた「色」と「テキスチャ」はHVC各色面から一次元の情報を引き出せば議論できるが、空間分布は各面から2次元の情報を引き出して議論しなければならないからである。そして、そのような中から「のびやかな」や「どっしりとした」といった形容詞が判別できるようになると考えられる。そして更に上に位置するのは普遍的な美意識のような構造が存在していると考えられる。ただし、個人の感性にも大きく作用されると推定している。その中から「美しい」というような形容詞が判別できるようになると推定される。   Then, it is estimated that “composition”, that is, “spatial distribution” is located above the above. This is because “color” and “texture” described above can be discussed by extracting one-dimensional information from each color plane of HVC, but the spatial distribution must be discussed by extracting two-dimensional information from each plane. Then, it is considered that adjectives such as “noisy” and “dense” can be discriminated. It is thought that there is a structure like a universal aesthetic sense that is located above. However, it is presumed that it greatly affects the individual's sensitivity. It is estimated that an adjective such as “beautiful” can be discriminated from among them.

<感性に固有の特徴量の記述形態:相加性>
上述の階層構造の特質として、低次の段階の感性は消滅せずに残存し続け、更に高次の感性がある場合はそれが優先してその画像に対する印象概念として残るということができる。また、高次の概念を意図的に排除して、低次の段階での特徴の優劣をつけようと思えば、実際には可能であるともいえる。このような性質をもつ特徴量は、特徴量の間で相加的な性質を備えていれば見事に記述できることが考察によって示される。相加的な性質は、高次の因子追加を行うことを常に許し、それまでの低次の因子を凌ぐ入れ替えを可能にする機構を備えるからである。
<Descriptive form of features unique to sensitivity: Additivity>
As a characteristic of the above-mentioned hierarchical structure, it can be said that the sensitivity at the lower level continues without disappearing, and if there is a higher sensitivity, it preferentially remains as an impression concept for the image. In addition, it can be said that it is actually possible to intentionally eliminate the higher-order concept and to give the superiority or inferiority of the features at the lower-order stage. Consideration shows that a feature amount having such a property can be described wonderfully if it has an additive property among the feature amounts. This is because the additive nature always has a mechanism that allows the addition of higher-order factors and allows replacement that surpasses the previous lower-order factors.

また、後述する相加的でない性質の特徴量の場合の思考実験によって、明らかな相加的な性質の優位性が立証される。すなわち、性質の異なる特徴量間では特徴量を独立にユークリッド幾何学的に扱う必要があり、相乗的な性質の特徴量では相加的な性質と違ってどのような事態が生じうるか、ということを考察することによる。したがって、主軸合成において形容詞の階層性を反映しうる記述形態としては、感性特徴量が相加的な性質を持たなければならないと結論される。   Moreover, the superiority of an apparent additive property is proved by a thought experiment in the case of a feature amount having an additive property that will be described later. In other words, it is necessary to treat Euclidean geometric features independently between features with different properties, and what kinds of situations can occur with feature values with synergistic properties, unlike additive properties. By considering. Therefore, it is concluded that the affective feature quantity must have an additive property as a description form that can reflect the hierarchy of adjectives in principal axis synthesis.

相加的な感性特徴量の間で線形結合を行うとき、最高次の特徴量因子に重点を置いた特徴量の加算を行えば、低次の因子のバランスもある程度反映しつつ、形容詞で最上位概念の言葉がもっとも支配的に導かれる人の感情の機構を再現するようになる。そのためには、感性主軸が異なっても全く同質の相加性を備えた感性特徴量を生み出さなければならない。換言すると、感性特徴量は相加性を備えた同じ次元の物理量で記述されなければならない。これは感性主軸内においても主軸間においても等しく満たされなければならない条件である。   When performing linear combination between additive sensibility features, adding features with emphasis on the highest-order feature factor will also reflect the balance of the lower-order factors to some extent, while the adjective is the best. It reproduces the mechanism of human emotions, where the words of the superordinate concept are most dominantly guided. To that end, it is necessary to create Kansei feature quantities with the same quality of additivity even if the Kansei main axes are different. In other words, the affective feature quantity must be described by a physical quantity of the same dimension with additiveness. This is a condition that must be satisfied equally both within the sensitivity main axis and between the main axes.

<感性の線型モデル>
分布関数fから読みとれる高次の感性特徴量を以下のように定義する。すなわち、分布関数が変化しても同一の感性の画像群の間で共通に現れる分布関数の形状の特徴が、種別及び階層の異なる各々の分布関数について複数個あるものとする。番号iはi=1,2,...の値をとるものとする。
<Sensitive linear model>
A high-order emotional feature amount that can be read from the distribution function f is defined as follows. That is, it is assumed that there are a plurality of distribution function shape features that appear in common among image groups having the same sensitivity even if the distribution function changes, for each distribution function of different types and levels. It is assumed that the number i takes values of i = 1, 2,.

色ヒストグラム分布・・・Fi
テキスチャPDF分布 ・・・Gi
画素値の空間分布 ・・・Hi
感性の線型モデルを次式のように成り立つと仮定する。
Color histogram distribution F i
Texture PDF distribution ・ ・ ・ G i
Spatial distribution of pixel values ・ ・ ・ H i
Assume that a linear model of sensibility is established as follows.

形容詞=α1F12F2+・・・
1G12G2+・・・
1H12H2+・・・
このような相加的な性質をもつ特徴量を構築する方法を、具体的にFiとGiについて、以下及び実施形態で説明する。後述の実施形態で定義する感性不変量において、相加的な性質がうまく機能することが、同種の不変量を色相と輝度と彩度の各々で生成し、それらの間で相加平均をとることによって、より安定した実験結果が生まれてくる事実からも実証される。
Adjective = α 1 F 1 + α 2 F 2 + ...
+ β 1 G 1 + β 2 G 2 + ...
+ γ 1 H 1 + γ 2 H 2 + ...
A method for constructing a feature quantity having such an additive property will be specifically described below with respect to F i and G i in the following embodiments. In the sensitivity invariants defined in the embodiments described later, the fact that the additive properties work well generates the same kind of invariants in each of hue, luminance, and saturation, and takes an arithmetic average among them. This also proves from the fact that more stable experimental results are born.

<相加的でない他の方式との比較>
1)特徴量ベクトルのユークリッド距離による表現
従来の類似画像検索技術では色、テキスチャ、形を個別に扱い、各々の特徴量空間で類似度の距離比較を行っている。例えば、文献2の方法を例にとる。各軸の特徴量は軸間で全く異なる形式の特徴量を定義している。主軸合成する方法の明確な記載はないが、色とテキスチャと形の特徴量を併用して類似画像検索を行う場合は、3つの主軸の全ての特徴量を1つのベクトルにし、特徴量空間におけるユークリッド距離を測って、色とテキスチャと形が共になるべく近い画像を検索を行うのが普通である。
<Comparison with other non-additive methods>
1) Representation of feature vector by Euclidean distance The conventional similar image search technique handles colors, textures, and shapes individually, and compares distances of similarities in each feature space. For example, the method of Document 2 is taken as an example. The feature quantity of each axis defines a completely different type of feature quantity between the axes. Although there is no clear description of the method of synthesizing the main axes, when similar image retrieval is performed using color, texture, and shape feature quantities together, all the feature quantities of the three principal axes are made into one vector, and in the feature quantity space It is common to measure the Euclidean distance and search for images that are as close as possible in color, texture, and shape.

このようなユークリッド距離を用いると分類指標は次のような性質を持つことになる。ある特徴量に例えば、色について類似性がないとする。そのとき、たとえテキスチャや形に類似性があったとしても、類似性のない特徴量が作用して、ユークリッド距離の中で一度離れた距離に置いてしまうと、もはやそれ以上近づくことができない。すなわち、特徴量の間に優劣関係はなく、全てが同列に扱われる。よって、高次の特徴量が低次の特徴量の結果を覆すことができない。したがって、この性質は形容詞の階層性とは相容れない。   If such a Euclidean distance is used, the classification index has the following properties. For example, it is assumed that a certain feature amount has no similarity in color. At that time, even if the texture and the shape are similar, if the feature amount having no similarity acts and is placed at a distance away from the Euclidean distance, it can no longer be approached. That is, there is no superiority or inferiority relationship between feature amounts, and all are treated in the same row. Therefore, the higher-order feature quantity cannot overturn the result of the lower-order feature quantity. This property is therefore incompatible with the hierarchy of adjectives.

2)相乗的な特徴量による表現
各々の特徴量が仮に相乗的な性質をもって表されたとする。このような場合、分類指標は次のような性質を持つことになる。ある特徴量が極めて類似していて、特徴量のモデルと検索対象画像の値が一致したとする。その特徴量の類似度の差がゼロとなり、他の特徴量に類似性が全くなくても相乗平均の結果はゼロで、最終的に極めて類似となる。すなわち、相乗的な性質をもつ特徴量は1つでも合致すれば、他の判断は全て作用しなくなる。1つの特徴量が突出する意味では高次因子による入れ替えの性質をもつが、他の低次の特徴が作用しなくなるところは形容詞の性質に合致しない。つまり、低次の平均色だけで判断された、例えば「緑色の画像」という判断が覆される類いのものではなく、その性質はいくら低次であっても残り続ける。
2) Representation by synergistic feature amount Assume that each feature amount is expressed with a synergistic property. In such a case, the classification index has the following properties. It is assumed that a certain feature amount is very similar, and the feature amount model matches the value of the search target image. The difference in similarity between the feature quantities is zero, and even if there is no similarity between other feature quantities, the result of the geometric mean is zero, and finally, the similarity is extremely similar. In other words, if even one feature quantity having a synergistic property matches, all other judgments will not work. In the sense that one feature quantity is prominent, it has the property of replacement by high-order factors, but the place where other low-order features stop working does not match the property of adjectives. In other words, it is not a kind of overrule of the determination of, for example, “green image”, which is determined only by the low-order average color, and the property continues to remain no matter how low-order.

[4]分布関数の量子力学的記述
<ヒルベルト空間表現>
線型微分方程式を満たす基底関数によって分布関数を級数展開する。ただし、これらの基底関数系は相互に直交し、もとの分布関数を完全に再現できる意味で完全性を備えるものとする。数式で表せば以下のようになる。
[4] Quantum mechanical description of distribution function <Hilbert space representation>
The distribution function is expanded in series by a basis function that satisfies the linear differential equation. However, these basis function systems are orthogonal to each other and have completeness in the sense that the original distribution function can be completely reproduced. It can be expressed as the following formula.

分布関数の級数展開

Figure 0005041041
Series expansion of distribution function
Figure 0005041041

基底関数の直交性

Figure 0005041041
Orthogonality of basis functions
Figure 0005041041

ここに、これらの根底にある考えを述べる。分布関数から読みとれる感性特徴量が相加的な性質を満たすためには、まず分布関数の構成要素が線型微分方程式を満足していなければならない。この線型微分方程式は、その構成要素が満たす運動方程式と位置づけられる。この運動方程式が、力学や電磁気学、量子力学の世界で多くの物理現象が満たす微分方程式に近いほど、脳内で起きている物理現象に近いという仮説に立っている。   Here are the ideas behind these. In order for the sensibility feature value read from the distribution function to satisfy an additive property, first, the components of the distribution function must satisfy the linear differential equation. This linear differential equation is positioned as the equation of motion that the constituent elements satisfy. This equation of motion is based on the hypothesis that the closer to the differential equation that many physical phenomena satisfy in the world of mechanics, electromagnetism, and quantum mechanics, the closer to the physical phenomenon occurring in the brain.

直交性を規定する重み関数は、人間の認識過程にできるだけ近くなるようにするために、分布関数の特質に応じて最適な基底関数を選定することによって決めなければならない。積分によって直交性を持つ関数は一般に特殊関数と呼ばれ、その多くは線型微分方程式である超幾何微分方程式か、もしくは合流型超幾何微分方程式によって規定される。また、級数展開できるためには、元の関数を等価表現しうるという意味で完全性を持ち合わせていなければならない。このような直交系を作る特殊関数は必ずしも完全性を持ち合わせていないので、重み関数の選定条件と完全性の2つを兼ね備えた特殊関数は、限られた選択になる。選択の第1の目安となるのは、基底関数群が現在対象としている分布関数の形状に似ているかどうかという判断と区間域の整合性である。   The weight function that defines the orthogonality must be determined by selecting an optimal basis function according to the characteristics of the distribution function so as to be as close as possible to the human recognition process. Functions that are orthogonal by integration are generally called special functions, and many of them are defined by hypergeometric differential equations that are linear differential equations or confluent hypergeometric differential equations. Also, in order to be able to expand series, it must have completeness in the sense that the original function can be represented equivalently. Since the special function that forms such an orthogonal system does not necessarily have completeness, the special function that has both the selection function of the weight function and the completeness is limited. The first guideline for selection is the determination of whether the basis function group is similar to the shape of the distribution function currently targeted and the consistency of the interval region.

2階同次微分方程式
P(y)=y"+p(x)y'+q(x)y=0
の解yは、任意の定数Cに対して線型性
P(Cy)=CP(y), P(C1y1+C2y2)=C1P(y1)+C2P(y2)
をもつ。したがって、この形の線型微分方程式で表される運動方程式には、重ね合わせの原理が成り立つため、一般解は級数展開で表される。
Second order homogeneous differential equations
P (y) = y "+ p (x) y '+ q (x) y = 0
The solution y is linear for any constant C
P (Cy) = CP (y), P (C 1 y 1 + C 2 y 2 ) = C 1 P (y 1 ) + C 2 P (y 2 )
It has. Therefore, since the principle of superposition holds in the equation of motion represented by this type of linear differential equation, the general solution is represented by series expansion.

超幾何微分方程式と合流型超幾何微分方程式は共に上述の型の2階線型微分方程式で表され、超幾何微分方程式はx=0,1,∞に確定特異点を、合流型超幾何微分方程式はx=0に確定特異点をx=∞に不確定特異点を有する。各々の方程式を記載する(文献B2参照)。   Both hypergeometric differential equations and confluent hypergeometric differential equations are represented by the above-mentioned second-order linear differential equations, hypergeometric differential equations have definite singularities at x = 0,1, ∞, and confluent hypergeometric differential equations Has a definite singularity at x = 0 and an uncertain singularity at x = ∞. Each equation is described (see Document B2).

超幾何微分方程式
x(1-x) y"(x)+[c-(a+b+1)x]y'(x)-aby(x)=0
合流型超幾何微分方程式
x y"(x)+[c-x]y'(x)-ay(x)=0
直交性と完全性をもつ関数系によって、状態関数が満たす運動方程式の解を級数展開する記述形態は、ヒルベルト空間による表現と同じであると位置づけられる。量子力学では、ヒルベルト空間表現によって、運動方程式の記述が行列形式に移行する。ゆえに、ヒルベルト空間の構築には、完全直交性を持つ特殊関数による展開を必要とする(文献B1参照)。
Hypergeometric differential equation
x (1-x) y "(x) + [c- (a + b + 1) x] y '(x) -aby (x) = 0
Confluent hypergeometric differential equation
xy "(x) + [cx] y '(x) -ay (x) = 0
The description form of series expansion of the solution of the equation of motion satisfied by the state function by the function system having orthogonality and completeness is regarded as being the same as the expression in the Hilbert space. In quantum mechanics, the description of the equation of motion shifts to a matrix form by Hilbert space representation. Therefore, the construction of a Hilbert space requires expansion by a special function with complete orthogonality (see Document B1).

感性を力学的に記述する上で、分布関数を構成する基底関数が、少なくとも以下に選定する微分方程式を運動方程式として満足しているという、感性の1つの側面を方程式化しているものと考える。すなわち、色の分布関数の射影面では超幾何微分方程式を、テキスチャの分布関数の射影面では合流超幾何微分方程式を満たしていると考える。これらの線型微分方程式は、微分方程式の型の総称であり、異なる型に位置する。それらに対して、パラメータの置き方や変数変換を導入することによって、多くの包含する型の微分方程式を導くことができる。例えば、超幾何微分方程式の解である超幾何関数は、チェビシェフ関数、ルジャンドル関数などをパラメータの特別な場合として扱える。また、合流型超幾何微分方程式の解である合流超幾何関数は、ベッセル関数や変形ベッセル関数、エルミート関数、ラゲール関数等を特別な場合として導く。さらにベッセルの微分方程式の変数変換によって、球ベッセル関数、球変形ベッセル関数を導く(文献B2参照)。   In describing the sensibility dynamically, it is considered that the basis function constituting the distribution function formulates one aspect of the sensibility that at least the differential equation selected below is satisfied as the equation of motion. That is, it is considered that the hypergeometric differential equation is satisfied in the projection surface of the color distribution function and the confluent hypergeometric differential equation is satisfied in the projection surface of the texture distribution function. These linear differential equations are generic names of differential equation types and are located in different types. On the other hand, many inclusive types of differential equations can be derived by introducing parameter placement and variable transformation. For example, a hypergeometric function that is a solution of a hypergeometric differential equation can handle a Chebyshev function, a Legendre function, or the like as a special case of parameters. Further, the confluent hypergeometric function that is the solution of the confluent hypergeometric differential equation leads to a Bessel function, a modified Bessel function, a Hermitian function, a Laguerre function, and the like as special cases. Furthermore, a spherical Bessel function and a spherical deformation Bessel function are derived by variable transformation of the Bessel differential equation (see Document B2).

実際には、色の一次元分布関数にはチェビシェフ関数を、テキスチャの一次元分布関数には球ベッセル関数を用いるのが適切である。したがって、脳内で感性の微分方程式が存在しているならば線型微分方程式を満足し、その1つである色の射影面ではチェビシェフ関数を記述する超幾何関数の側面から、もう1つのエッジ・テキスチャの射影面では球ベッセル関数を記述する合流超幾何関数の側面から、2つの異なる投影面で記述していることに相当している、ということができる。また、各々の分布関数が満たすべき微分方程式の基底関数は、脳という波動型の信号処理系の座標を、模擬的にヒルベルト空間によって規定する役割を果たす。   In practice, it is appropriate to use the Chebyshev function for the one-dimensional distribution function of the color and the spherical Bessel function for the one-dimensional distribution function of the texture. Therefore, if a sensuous differential equation exists in the brain, the linear differential equation is satisfied, and one of the projected surfaces of the color is a hypergeometric function describing the Chebyshev function, and another edge From the side of the confluent hypergeometric function that describes the spherical Bessel function, it can be said that the texture projection surface corresponds to the description on two different projection planes. The basis functions of the differential equations to be satisfied by the respective distribution functions play a role of simulating the coordinates of the wave type signal processing system called the brain by the Hilbert space.

[文献B1]シッフ「量子力学」(第3版、1970)、第6章「量子力学の行列形式」
[文献B2]ジョージ・アルフケン基礎物理数学第3巻「特殊関数と積分方程式」(第2版、1970;日本語訳1978)、第1章「ベッセル関数」及び第3章「特殊関数」
<各分布関数のヒルベルト空間表現>
1)色ヒストグラムの場合
基底関数

Figure 0005041041
[Document B1] Schiff "Quantum Mechanics" (3rd edition, 1970), Chapter 6 "Matrix Form of Quantum Mechanics"
[Reference B2] George Alfken, Basic Physics Mathematics, Volume 3 “Special Functions and Integral Equations” (2nd edition, 1970; Japanese translation 1978), Chapter 1 “Bessel functions” and Chapter 3 “Special functions”
<Hilbert space representation of each distribution function>
1) Color histogram Basis function
Figure 0005041041

直交性の重み関数

Figure 0005041041
Orthogonal weight function
Figure 0005041041

ここにチェビシェフ多項式は解析的に記述できる。n=0,1,2,...の値をとる。

Figure 0005041041
Here Chebyshev polynomials can be described analytically. Takes the values n = 0,1,2, ...
Figure 0005041041

ここで図1にチェビシェフ多項式Tn(x)におけるT1(x),T2(x),T3(x)のグラフを示す。
規格化条件を含めた正確な直交性の関係式は以下で与えられる。

Figure 0005041041
Here, FIG. 1 shows a graph of T 1 (x), T 2 (x), and T 3 (x) in the Chebyshev polynomial T n (x).
The exact orthogonal relationship including normalization conditions is given below.
Figure 0005041041

チェビシェフ関数の直交性は、分布関数の立ち上がり部と立ち下がり部に極めて密度の高い重点を置いている。すなわち、ヒストグラムのように有限の区間で急激に事象が生じて急激にその事象が終わるような性質の関数系を扱う場合、その関数の形状として立ち上がり部と立ち下がり部が非常に重要な性質を担っており、そこを正確に記述しない限り本当の意味でうまく近似することができないことを示している。   The orthogonality of the Chebyshev function places a very high density emphasis on the rising and falling parts of the distribution function. That is, when dealing with a function system that has a characteristic that suddenly occurs in a finite interval and ends suddenly like a histogram, the rising and falling parts are very important as the shape of the function. It shows that it cannot be approximated in a true sense unless it is accurately described.

2)テキスチャPDFの場合
球ベッセル関数は1つの次数について取り出すと、[0,a]の区間に存在す根の数によって低周波から高周波までスケーリングされた関数群は根に関して直交性をなすとともに完全系をなす。原点にピークがあるのは0次関数であるので、0次関数の根による一重級数展開を行う。そのとき、テキスチャPDFの分布関数をピークの右区間と左区間の別々に展開をしなければならない。
2) In the case of texture PDF When the spherical Bessel function is extracted for one order, the function group scaled from the low frequency to the high frequency by the number of roots existing in the interval [0, a] is orthogonal and complete with respect to the roots. Make a system. Since a zero-order function has a peak at the origin, a single series expansion is performed using the root of the zero-order function. At that time, the distribution function of the texture PDF must be developed separately for the right section and the left section of the peak.

2−1)一重級数展開の場合
基底関数

Figure 0005041041
2-1) Single series expansion Basis function
Figure 0005041041

ここで図2に、n=1〜5のグラフを示す。   Here, FIG. 2 shows a graph of n = 1-5.

直交性の重み関数

Figure 0005041041
Orthogonal weight function
Figure 0005041041

ここに球ベッセル関数は解析的に記述できる。

Figure 0005041041

Figure 0005041041
Here, the spherical Bessel function can be described analytically.
Figure 0005041041

Figure 0005041041

ここで図3に球ベッセル関数のj0(x),j1(x),j2(x)のグラフを示す。
規格化条件を含めた正確な根に関する直交性の関係式は以下で与えられる。

Figure 0005041041
Here, FIG. 3 shows a graph of j 0 (x), j 1 (x), j 2 (x) of the spherical Bessel function.
The orthogonality relation for the exact root including the normalization conditions is given below.
Figure 0005041041

球ベッセル関数は0次関数の場合、原点に最大強度をもつ関数だから、原点に最大度数をもつ分布関数を近似したとき、常に原点の重みを外して、裾野の形を重視する。   Since the spherical Bessel function is a function having a maximum intensity at the origin in the case of a zero-order function, when the distribution function having the maximum frequency at the origin is approximated, the weight of the origin is always removed and the shape of the base is emphasized.

ところで、種々のベッセル関数は原点から周辺に向かって光や波が拡散したり、原点に光源のような特異点がある場合の記述に適した関数である。球ベッセル関数は球面座標系における動径成分の波動を記述するのに適しており、円筒座標系のベッセル関数に比べ原点から離れるに従ってその強度の低下が速い。今、扱おうとしているエッジ画像の一次元分布関数は、その急激な強度の低下速度からいって球ベッセル関数の性質に近い。なぜならば、レンズを通して写真が撮られる集光過程を考えても、半球面から降り注いでくる光は球面波であり、それの動径成分は球ベッセル関数で記述され、とくに円筒座標にすべき非等方性の理由が見つからないからである。   By the way, various Bessel functions are functions suitable for description when light or waves diffuse from the origin toward the periphery, or when there is a singular point such as a light source at the origin. The spherical Bessel function is suitable for describing the wave of the radial component in the spherical coordinate system, and its strength decreases more rapidly as the distance from the origin is larger than that of the cylindrical coordinate system. The one-dimensional distribution function of the edge image to be handled now is close to the property of a spherical Bessel function because of its rapid intensity decrease rate. This is because even if we consider the condensing process in which a photograph is taken through a lens, the light falling from the hemisphere is a spherical wave, and its radial component is described by a spherical Bessel function, especially non-cylindrical coordinates. This is because the reason for isotropicity cannot be found.

球ベッセル関数は、0次関数を用いると常に原点にピークが存在するので、エッジ画像のヒストグラムのように常に原点にピークが現れる性質の分布関数の形状を評価するのに、原点の重みを外して、裾野の性質に焦点を当てるというのは、極めて相性のよい方法となる。それによって、事象の本質との間に線型な関係を生む素地をつくる役割を果たす。   Since the spherical Bessel function always has a peak at the origin when a zero-order function is used, the weight of the origin is removed in order to evaluate the shape of the distribution function with the property that the peak always appears at the origin as in the histogram of the edge image. Therefore, focusing on the nature of the base is a very compatible method. As a result, it plays the role of creating a foundation that creates a linear relationship with the essence of the event.

2−2)二重級数展開の場合
球ベッセル関数は、通常動径方向の運動を記述する関数であるので、普通は正の領域で定義されるが、負の領域に拡大定義することによって、異なる次数の関数の間でも直交性が現れるようになる。これは球ベッセル関数には偶数次は偶関数となり、奇数次は奇関数となる性質があるためである。

Figure 0005041041
2-2) In case of double series expansion Since the spherical Bessel function is a function that usually describes the motion in the radial direction, it is usually defined in the positive region, but by expanding it to the negative region, Orthogonality also appears between functions of different orders. This is because the spherical Bessel function has the property that the even order is an even function and the odd order is an odd function.
Figure 0005041041

ここで図4に負の領域に拡大定義された球ベッセル関数j0(x)〜j5(x)のグラフを示す。
球ベッセル関数の次数に関する直交性

Figure 0005041041
Here, FIG. 4 shows a graph of spherical Bessel functions j 0 (x) to j 5 (x) defined to be enlarged in the negative region.
Orthogonality of the order of spherical Bessel functions
Figure 0005041041

次数に関する直交性と根に関する直交性を合わせて考えれば、分布関数の正の領域と負の領域は同時に展開することができる。根展開に関しては常に完全性を持っていることから、次数と根の二重級数に展開する。差し当たり、非対称性の成分を抽出する奇関数が1つあればよいので、0次の偶関数と1次の奇関数の2つを用いた根展開でよい。

Figure 0005041041
If the orthogonality regarding the order and the orthogonality regarding the root are considered together, the positive region and the negative region of the distribution function can be developed simultaneously. Since root expansion always has completeness, it expands into a double series of orders and roots. For the time being, there is only one odd function for extracting the asymmetric component, so root expansion using two of the zeroth-order even function and the first-order odd function is sufficient.
Figure 0005041041

[5]展開係数と力学との対応関係
<問題提起>
展開係数は分布関数のなかで、基底関数に対応する波形及び振動数をもった成分が多いことを意味する。ここで、「展開係数ciそのものは感性特徴量にふさわしいか」という問題がある。
[5] Correspondence between expansion coefficient and dynamics <Problem raising>
The expansion coefficient means that there are many components having a waveform and a frequency corresponding to the basis function in the distribution function. Here, there is a problem that “the expansion coefficient c i itself is suitable for the sensitivity feature quantity”.

<実データにおける展開係数の傾向>
実際に分布関数を展開した係数ciの値は、各々の分布関数の絶対的な形状に直接的に左右されやすい。したがって、値としては画像による変動が極めて大きい。同じ形容詞を付与したもの同士の画像の分布関数について、展開係数を直接比べてみると少しの相関傾向は認められるものの、それ以上にばらつく傾向が強い。仮に同じ形容詞が付与された画像同士で展開係数の統計平均をとる学習を行って、その展開係数をその形容詞に対応するモデルとしようとしても、ほとんどの展開係数がゼロに消滅するか、他の形容詞でも共通の意味のないある定数に収束してしまいそうな傾向である。
<Trend of expansion coefficient in actual data>
The value of the coefficient c i that actually expands the distribution function is likely to be directly influenced by the absolute shape of each distribution function. Therefore, the value varies greatly depending on the image. When the expansion coefficients of the distribution functions of images assigned with the same adjectives are compared directly, a slight correlation tendency is recognized, but a tendency to vary more than that is strong. Even if you try to take a statistical average of expansion coefficients between images with the same adjective and try to make the expansion coefficient a model corresponding to that adjective, most expansion coefficients disappear to zero, Even adjectives tend to converge to a constant that has no common meaning.

<力学との対応関係の構築>
ここで以下のような力学と画像系を対応させた仮説を立てる。
<Building correspondence with mechanics>
Here, we make a hypothesis that associates the following dynamics with the image system.

力学系:
「各々の粒子の運動状態(運動量pi)が変化しても運動系全体を特徴づける保存量(エネルギーE)が存在する。」
画像系:
「各画像の画素値分布(状態成分ci)が変化しても画像全体の感性を特徴づける不変量(I)が存在するはずである。」

Figure 0005041041
Dynamical system:
“Even if the motion state (momentum pi ) of each particle changes, there is a conserved amount (energy E) that characterizes the entire motion system.”
Image system:
“Even if the pixel value distribution (state component c i ) of each image changes, there should be an invariant (I) that characterizes the sensitivity of the entire image.”
Figure 0005041041

画像の信号分布、あるいは外界の視覚野に映った像を人が知覚したとき、そこにある種の感性の「場」のエネルギーのようなものを感じとって、瞬時にその種類の場のエネルギーに対応する脳内の神経状態が励起されて形容詞が想起されるというメカニズムを、この仮説はモデルとして含んでいる。   When a person perceives the signal distribution of an image or an image reflected in the visual field of the outside world, it feels something like a “field” energy of a certain sensibility, and instantly converts it to that kind of field energy. This hypothesis includes as a model the mechanism by which the corresponding neural state in the brain is excited and an adjective is recalled.

展開係数の2次形式の和が、分布関数が様々に変化しても、同一の感性を想起させる画像群の分布関数の間で共通に備えた特徴を抽出しうることを意味する。この和をとる操作が、個々の要素の厳密な類似性の要求を緩和し、総体的に類似した特徴群を集約するため、曖昧に形状が似通った特徴を照合する機能を導き出す。   The sum of the expansion coefficients in the quadratic form means that even if the distribution function changes variously, it is possible to extract the common features among the distribution functions of the image groups that recall the same sensitivity. This summing operation alleviates the requirement for strict similarity between individual elements and aggregates a group of generally similar features, thereby deriving a function that collates features that are vaguely similar in shape.

<2次形式と加法性について>
感性不変量が2次形式をとらなければならないとの結論に至った理由には、理論物理学における最小作用の原理に基づく作用関数からの運動方程式の導出過程やハミルトニアンの構築過程における理論的背景とに深く関わっている。すなわち、感性の場の運動方程式の1つの側面が線型微分方程式を満足していると仮定するとき、その作用関数の被積分関数であるラグランジアンには感性の場について2次の表式がくることを要求されるからである。なぜならば、運動方程式は変分原理に基づいて作用積分の一階の全微分がゼロに等しいと置くことによって導かれ、その時に次数を1つ落とすことによって重ね合わせの原理が保たれるからである(文献A1参照)。そして、運動方程式の第1積分である力学的不変量は運動の積分と呼ばれ、運動の間一定の値を保つ。これが感性の場合は、画像の信号分布が変わっても同一の感性を与え続けることに対応すると考える。
<Secondary Form and Additivity>
The reason for the conclusion that Kansei invariants must take the quadratic form is that the theoretical background in the process of deriving the equation of motion from the action function based on the principle of minimum action in theoretical physics and the process of building the Hamiltonian Is deeply involved. That is, assuming that one aspect of the kinematic field equation of motion satisfies the linear differential equation, the Lagrangian, which is the integrand of the action function, has a quadratic expression for the sensitivity field. Because it is required. This is because the equation of motion is derived based on the variational principle by putting the first derivative of the action integral equal to zero, and the superposition principle is maintained by dropping one order at that time. Yes (see Document A1). The mechanical invariant that is the first integral of the equation of motion is called the integral of the motion, and keeps a constant value during the motion. If this is sensitivity, it is considered that it corresponds to continuing to give the same sensitivity even if the signal distribution of the image changes.

運動の積分にはエネルギーと運動量と角運動量があり、これらは全て加法性という重要な性質を持っていることが、力学によって明らかにされている(文献A2参照)。また、感性が問題とするような画像の信号分布は、10の6乗から8乗のオーダーの画素数からなる画像とそれらの何百枚、何千枚という画像群からなる統計集団を相手とするので、統計物理学を用いる必要がある。   There are energy, momentum, and angular momentum in the integral of motion, and it is clarified by mechanics that these all have an important property of additivity (see Document A2). In addition, the signal distribution of an image whose sensitivity is a problem is an image having a number of pixels on the order of 10 6 to 8 and a statistical group consisting of hundreds and thousands of images. It is necessary to use statistical physics.

統計物理学によると相加的な運動の積分の中で、統計平均後に系全体の統計的な性質、すなわち系の統計分布を決めるのはエネルギーだけであるとの結論が導かれている。運動量と角運動量は、単に系全体の一様な並進運動と一様な回転運動だけに帰されて、系の記述には役立たない(文献A3参照)。この事情は、感性を記述するために分布関数から導いた運動量に対応する展開係数ciが、同一感性の画像群の間で統計平均を行うと、意味のない定数に収束する傾向にある事実と符合する。 According to statistical physics, in the integration of additive motion, the conclusion is that after statistical averaging, only the energy determines the statistical properties of the entire system, that is, the statistical distribution of the system. The momentum and angular momentum are simply attributed to the uniform translational motion and uniform rotational motion of the entire system, and are not useful for describing the system (see Document A3). This is because the expansion coefficient c i corresponding to the momentum derived from the distribution function to describe the sensibility tends to converge to a meaningless constant when statistical averaging is performed between image groups of the same sensibility. Matches.

分布関数fと力学的不変量、すなわちエネルギーの次元を有した2次形式の物理量との対応関係を上記と同じくまとめると、
力学系 画像系
f=f(E) ⇔ I=I(f)
ここでは、観測量である分布関数から感性不変量を導出することになるので、力学系とは逆の表式となる。また、2次形式の感性不変量は、次節で説明するように拡張定義することにより種々の感性を扱えるようにした。
When the correspondence between the distribution function f and the mechanical invariant, that is, the physical quantity of the quadratic form having the energy dimension is summarized as above,
Dynamical system Image system
f = f (E) ⇔ I = I (f)
Here, the sensitivity invariant is derived from the distribution function that is the observed quantity, so that the expression is opposite to that of the dynamical system. In addition, the Kansei invariant of the secondary form can handle various sensibilities by extending the definition as explained in the next section.

こうして、全ての感性不変量は加法性を備え、感性の線型モデルの相加性の要件を満たすことになり、色もテキスチャも構図も共通の土俵で扱えるようになる。すなわち、感性主軸の異なる特徴量が全て相加的に扱えるようになる。なお、構図から導出する感性不変量も同じ指針に基づいて同じ要領で構築するものとする。   In this way, all sensibility invariants are additive, satisfy the additivity requirement of the sensibility linear model, and the color, texture, and composition can be handled in a common manner. That is, all feature quantities having different sensitivity principal axes can be handled additively. The sensitivity invariants derived from the composition are also constructed in the same manner based on the same guidelines.

なお、上述のように感性不変量を2次形式にする必要があると至った過程には、実験的な試行錯誤を経てきた上で、上述の理論的な背景が内在すると判断したためである。すなわち、実験的に、展開係数の絶対値や比など考えられうる多くの指標を作って試してみても、全く感性との間で感覚に合致するような画像の整列が得られず何度も失敗を繰り返し、2次形式の和の表式によって初めて感性との整合性の高い整列が得られたことに基づく。   This is because it has been determined that the above-described theoretical background is inherent in the process where the sensitivity invariant needs to be in the quadratic form as described above after experimental trial and error. In other words, even if experimentally creating many possible indicators such as the absolute value and ratio of the expansion coefficient and trying them, the image alignment that matches the sensibility with the sensitivity is not obtained many times. It is based on the fact that alignment with high sensitivity and alignment is obtained for the first time by the expression of the sum of the quadratic form repeatedly failing.

[文献A1]ランダウ=リフシッツ理論物理学教程第2巻「場の古典論」(原書第6版、1973年)、第4章「場の方程式」、第27節「電磁場の作用関数」
[文献A2]ランダウ=リフシッツ理論物理学教程第1巻「力学」(増訂第3版、1973年)、第1章「運動方程式」と第2章「保存法則」
[文献A3]ランダウ=リフシッツ理論物理学教程第5巻「統計物理学第1部」(第3版、1976年)、第1章「統計の基礎原理」、第4節「エネルギーの役割」
[6]感性不変量の2次形式表現
<2つの基底状態の合成>
2次形式の感性不変量を作るには、分布関数の形状認識するという視点に立ち返って、2つの基底状態ψikの合成系によって分布関数fの形状を抽出する。一般に、任意の関数f(α)がn個の基底関数による展開で表されるものとする。
[Literature A1] Landau-Lifschitz Theory of Physics, Volume 2, “Theory of Field Classical” (6th edition, 1973), Chapter 4, “Equation for Fields”, Section 27 “Functions of Electromagnetic Fields”
[Literature A2] Landau-Lifschitz School of Theoretical Physics Vol. 1 “Mechanics” (Amendment 3rd Edition, 1973), Chapter 1 “Equation of Motion” and Chapter 2 “Conservation Law”
[Reference A3] Landau-Lifschitz Theoretical Physics, Vol. 5, "Statistical Physics Part 1" (3rd edition, 1976), Chapter 1, "Basic Principles of Statistics", Section 4, "Role of Energy"
[6] Quadratic expression of Kansei invariant <Composition of two ground states>
In order to create a quadratic form sensitivity invariant, returning to the viewpoint of recognizing the shape of the distribution function, the shape of the distribution function f is extracted by a synthesis system of the two ground states ψ i and ψ k . In general, it is assumed that an arbitrary function f (α) is expressed by expansion by n basis functions.

f(α)=c1 (α)ψ1 (α)+c2 (α)ψ2 (α)+...+cn (α)ψn (α)
群論によれば、合成系の直積で表されるn*n個の基底状態ψiψkは簡約可能な表現で、n(n+1)/2個の対称積とn(n-1)/2個の反対称積で表される2つの基底状態に分割することができる(文献A4参照)。

Figure 0005041041
f (α) = c 1 (α) ψ 1 (α) + c 2 (α) ψ 2 (α) + ... + c n (α) ψ n (α)
According to group theory, n * n ground states ψ i ψ k represented by the direct product of a composite system are reducible expressions, and n (n + 1) / 2 symmetric products and n (n-1) It can be divided into two ground states represented by / 2 antisymmetric products (see Document A4).
Figure 0005041041

色相面(H)と輝度面(V)と彩度面(C)の各々の分布関数を同じ基底関数を用いて級数展開すると、同一色面内の分布関数の形状の特徴は、対称積の基底関数が作る波形の展開成分によって測ることができ、色面間の分布関数の形状の特徴は、対称積の基底関数が作る波形の展開成分とともに、反対称積の基底関数が作る波形の展開成分によっても測ることができる。これらの合成系の波形による展開成分は、合成前の基底状態が相互に直交することが保証されているから、合成系の基底状態による展開係数は、対称積と反対称積の形をした行列要素として表現できる。   When the distribution functions of the hue plane (H), luminance plane (V), and saturation plane (C) are expanded in series using the same basis function, the characteristics of the shape of the distribution function in the same color plane are The shape of the distribution function between the color planes can be measured by the waveform expansion component created by the basis function, and the waveform expansion generated by the basis function of the antisymmetric product is combined with the waveform expansion component generated by the basis function of the symmetric product. It can also be measured by ingredients. Since the expansion components due to the waveforms of these synthesis systems are guaranteed to be orthogonal to each other in the ground state before synthesis, the expansion coefficients due to the ground state of the synthesis system are matrices in the form of symmetric products and antisymmetric products. It can be expressed as an element.

感性不変量を行列のシュプール(跡)をとることによって定義する。ただし、通常シュプールは対角要素の和のみを指すが、ここでは行と列の位置が一定の量子数の差だけを保った非対角成分同士の斜め方向の和をとる新たな拡張型のシュプールを定義する。これによって、一定の量子数の差を保った2つの基底状態による合成波形の成分が、分布関数のなかにどれだけの割合で存在しているかが、作りうる全ての合成波形に渡って総和をとった状態で検出することができる。色面の異なる2つの分布関数の間では、一定の量子数の異なった基底状態の組み合せが、どの程度の割合で存在しているかということを、その組み合わせの対称状態と反対称状態の2種類の合成波形で評価していることになる。

Figure 0005041041
Kansei invariants are defined by taking a matrix spur. However, spur usually refers only to the sum of diagonal elements, but here it is a new extended type that takes the diagonal sum of non-diagonal components with only a constant quantum number difference between the row and column positions. Define a spur. As a result, the ratio of the components of the composite waveform of the two ground states that maintain a constant quantum number difference in the distribution function can be summed over all the composite waveforms that can be created. It can be detected in the taken state. Between two distribution functions with different color planes, the proportion of combinations of different ground states with a certain quantum number is present in two proportions: symmetric state and antisymmetric state of the combination. It is evaluated with the composite waveform.
Figure 0005041041

ここに、ciを色ヒストグラムのチェビシェフ展開係数にとった場合は、Ii=Fiとなり、ciをテキスチャPDFの球ベッセル展開係数にとった場合は、Ii=Giとなる。ただし、番号iは対称、反対称の区別なく、複数個求まった不変量の要素に対して順番に割り当てるものとする。 Here, when c i is taken as the Chebyshev expansion coefficient of the color histogram, I i = F i , and when c i is taken as the spherical Bessel expansion coefficient of the texture PDF, I i = G i . However, the number i is assigned in order to the invariant elements obtained in plural, without distinguishing between symmetric and antisymmetric.

ここで上記定義の感性不変量を、電磁場における場の不変量と比較してみることにする。文献A5によると、電場Eと磁場Hのローレンツ変換に対する不変量として、真のスカラーと擬スカラーの2種類が存在する。

Figure 0005041041
Here, the sensitivity invariant defined above will be compared with the field invariant in the electromagnetic field. According to the document A5, there are two types of invariants for the Lorentz transformation of the electric field E and the magnetic field H: a true scalar and a pseudoscalar.
Figure 0005041041

両者とも4次元の電磁場テンソルFikの2次形式のシュプールで求められ、後者には完全反対称な単位テンソルeiklmが付随し、前者にはそれが付随しない。ただし、テンソルに関する和の記号は、アインシュタイン規約によって省略されている。 Both are determined by a quadratic spur of the four-dimensional electromagnetic field tensor F ik , the latter accompanied by a completely antisymmetric unit tensor e iklm , and the former not accompanied by it. However, the sum symbol for the tensor is omitted by the Einstein convention.

したがって、1つの画像から別の画像に移っても同一の感性を与える感性不変量は、電磁場における1つの基準系から他の基準系に変換したときの場の不変量と極めて似た構成になる。前節では、感性不変量を運動エネルギーに対応させて議論したが、むしろ2種類にとどまらない複数種類の「感性場」というものが存在し、場のエネルギーが伝わってくると考えた方が素直である。また、電磁場の構成要素は時間と空間の4次元であるが、感性の構成要素には少なくとも分布関数の記述に必要な次数以上の要素が存在していると推測される。しかし、人間の脳の神経回路が成育過程の学習の中で、これらの感性場に対して、場に誘起される電気信号回路が構築される、あるいはエネルギー的に瞬時に励起される神経回路のエネルギー準位を獲得していくというのは自然な考えである。   Therefore, a sensitivity invariant that gives the same sensitivity even when moving from one image to another has a configuration very similar to the field invariant when converted from one reference system to another reference system in an electromagnetic field. . In the previous section, we discussed sensitivity invariants corresponding to kinetic energy, but there are more than two types of “sensitivity fields”, and it is more straightforward to think that field energy is transmitted. is there. In addition, the components of the electromagnetic field are four-dimensional in time and space, but it is presumed that there are at least elements of the order necessary for describing the distribution function in the sensitivity component. However, as the neural circuit of the human brain learns about the growth process, an electric signal circuit induced in the field is constructed against these sensitive fields, or the neural circuit that is excited instantaneously in energy. It is a natural idea to acquire energy levels.

[文献A4]Landau and Lifshitz, Course of Theoretical Physics, Volume 3 "Quantum Mechanics (Non-Relativistic Theory)," (Third revised edition, 1977), Chapter 12 "The Theory of Symmetry," Section 94 "Representations of groups."
[文献A5]ランダウ=リフシッツ理論物理学教程第2巻「場の古典論」(原書第6版、1973年)、第3章「場のなかの電荷」、第23節「電磁場テンソル」、第24節「ローレンツ変換」、及び第25節「場の不変量」
[第1の実施形態]
(色ヒストグラムのヒルベルト空間表現と感性不変量の線形和)
以下、図面を参照して、第1の実施形態に係る画像分類装置の説明を行う。図5は、実施の形態に係る画像分類装置を示すブロック図である。ここで画像分類装置は、パーソナルコンピュータ10により実現される。パーソナルコンピュータ10は、デジタルカメラや他のコンピュータと接続され、デジタルカメラや他のコンピュータから画像データの提供を受け、またはメモリーカードスロットに装着されたメモリカードから画像データの提供を受け、ハードディスク装置(図示せず)へ蓄積する。パーソナルコンピュータ10は、蓄積された画像データに対して以下に説明する画像分類処理を行う。
[Document A4] Landau and Lifshitz, Course of Theoretical Physics, Volume 3 "Quantum Mechanics (Non-Relativistic Theory)," (Third revised edition, 1977), Chapter 12 "The Theory of Symmetry," Section 94 "Representations of groups. "
[Literature A5] Landau-Lifschitz Theory of Physics Theory Volume 2, “Classical Theory of Fields” (Original 6th edition, 1973), Chapter 3, “Charges in Fields”, Section 23 “Electromagnetic Field Tensors”, Section Section 24 “Lorentz transformation” and Section 25 “Field invariants”
[First embodiment]
(Hilbert space representation of color histogram and linear sum of sensitivity invariants)
The image classification apparatus according to the first embodiment will be described below with reference to the drawings. FIG. 5 is a block diagram illustrating an image classification apparatus according to the embodiment. Here, the image classification device is realized by the personal computer 10. The personal computer 10 is connected to a digital camera or another computer, receives image data from the digital camera or another computer, or receives image data from a memory card installed in a memory card slot, and receives a hard disk device ( (Not shown). The personal computer 10 performs image classification processing described below on the stored image data.

パーソナルコンピュータ10に対する画像分類プログラムのローディングは、プログラムを格納したCD−ROMなどの記憶媒体から行ってもよいし、ネットワーク12などを介して行ってもよい。ネットワーク12を介する場合には、サーバ14に接続されているハードディスク装置16から読み出したプログラムをローディングする。パーソナルコンピュータ10は、CPU及びCPUにより制御される周辺回路から構成され、CPUがインストールされたプログラムに基づいて図6のフローチャートに示す画像分類処理を行う。   The loading of the image classification program into the personal computer 10 may be performed from a storage medium such as a CD-ROM storing the program, or may be performed via the network 12 or the like. When the network 12 is used, the program read from the hard disk device 16 connected to the server 14 is loaded. The personal computer 10 includes a CPU and peripheral circuits controlled by the CPU, and performs image classification processing shown in the flowchart of FIG. 6 based on a program in which the CPU is installed.

<検索対象画像への処理>
1.マンセルHVC色空間への変換(図6ステップS1)
入力画像を人間の知覚的な均等色性が高いマンセル色空間へ変換する。マンセル色空間は、色相Hが一周100度で分割され、輝度Vが0〜10のレベルに、彩度Cが0〜25程度のレベルに分布するように刻まれた色空間で、Vの色差1に対してCの色差2が同等の色差として知覚する等歩度性を満たすように設計された色空間である。その内のCの値が1以下の領域とVの値が0.5以下、及び9.5以上の領域がN(ニュートラル色相)と定義されている。RGB空間で表された色空間からHVC色空間へはXYZ空間への変換を介して近似的に数式変換できる。これは、均等色空間の1つであるL*a*b*ないしはL*C*H*の定義を利用して、その均等色性の不十分であるところを修正する式を導入することによって実現されている。
<Processing for search target images>
1. Conversion to Munsell HVC color space (step S1 in FIG. 6)
The input image is converted into a Munsell color space with high human perceptual color uniformity. Munsell color space is a color space that is divided so that the hue H is divided by 100 degrees around the circle, the luminance V is distributed to the level of 0 to 10, and the saturation C is distributed to the level of about 0 to 25. This is a color space designed so as to satisfy an equal rate of perceiving C color difference 2 as 1 as an equivalent color difference. Among them, the region where the C value is 1 or less, the V value is 0.5 or less, and the region where 9.5 or more is defined as N (neutral hue). From the color space expressed in the RGB space to the HVC color space, mathematical conversion can be performed approximately through conversion to the XYZ space. This is achieved by introducing an expression that corrects the lack of uniform color by using the definition of L * a * b * or L * C * H *, which is one of the uniform color spaces. It has been realized.

入力画像が例えば出力ガンマ特性の掛かったsRGB色空間で表された画像である場合、まず、線形階調に戻した後、XYZ空間へsRGB規格に従って変換する。

Figure 0005041041
When the input image is, for example, an image expressed in an sRGB color space with an output gamma characteristic, it is first converted to a linear gradation and then converted into an XYZ space according to the sRGB standard.
Figure 0005041041

第1の実施形態では、色相面はN(ニュートラル)の分離を行った面を用意するものとする。   In the first embodiment, it is assumed that a hue surface is prepared as an N (neutral) separation surface.

2.色の一次元分布関数の作成(図6ステップS2)
HVC面各々のヒストグラムを作成する。ヒストグラムのビン数はH,V,C共に200程度に設定するとよい。このとき、色相面はNの分離を行った面を使う。したがって、H面のヒストグラムは、色相環で積分してもNに分類された面積率は含まれないことになる。通常Nは色相環ではランダムに分布するから、乱雑に一様なオフセット状の分布が色相面のヒストグラムから除外され、本来の有彩色のヒストグラム形状が残ることになる。便宜上、画素数でヒストグラムの値を規格化しておけば、画素値の確率密度を表す一次元分布関数になる。模式的に作成した分布関数を次のように表す。
f(H), f(V), f(C)
3.分布関数のヒルベルト空間表現(図6ステップS3)
3−1.変数変換
ヒストグラムの横軸の分布域を[a,b]、縦軸の分布域を[fa,fb]とすると、横軸を[-1,1]に、縦軸を[-1,1]に収まる区間に変数変換を行う。この節の中だけ便宜的に、横軸の変数をxからyへ、縦軸の変数をfxからfyへ変換して表記すると、変換式は以下のようになる。
2. Creation of color one-dimensional distribution function (step S2 in FIG. 6)
Create a histogram for each HVC plane. The number of bins in the histogram should be set to about 200 for all of H, V, and C. At this time, the hue surface is a surface on which N separation is performed. Therefore, the area ratio classified into N is not included in the histogram of the H plane even if it is integrated with the hue circle. Normally, N is distributed randomly in the hue circle, so a random and uniform offset distribution is excluded from the histogram of the hue plane, and the original chromatic color histogram shape remains. For convenience, if the histogram value is normalized by the number of pixels, a one-dimensional distribution function representing the probability density of the pixel value is obtained. The distribution function schematically created is expressed as follows.
f (H), f (V), f (C)
3. Hilbert space representation of distribution function (step S3 in FIG. 6)
3-1. Variable transformation If the horizontal axis of the histogram is [a, b] and the vertical axis is [fa, fb], the horizontal axis is [-1,1] and the vertical axis is [-1,1]. Variable conversion is performed in the interval that fits in. For convenience only in this section, if the variable on the horizontal axis is converted from x to y and the variable on the vertical axis is converted from fx to fy, the conversion formula is as follows.

横軸の変数変換:y={x-(b+a)/2}/{(b-a)/2}
縦軸の変数変換:fy={fx-(fb+fa)/2}/{(fb-fa)/2}
色相面のヒストグラムの分布域は色相環のため、始まりの区切り点を設け、そこから一周して同じ点に戻る分布域を設定する。始まり点aは固定点ではなく、各々の画像毎に分布関数の密度が最小となる点を探して、そこに区切り点を入れるものとする。
Variable transformation on the horizontal axis: y = {x- (b + a) / 2} / {(ba) / 2}
Variable conversion on the vertical axis: fy = {fx- (fb + fa) / 2} / {(fb-fa) / 2}
Since the distribution area of the histogram of the hue plane is a hue circle, a starting breakpoint is provided, and a distribution area that goes around from there and returns to the same point is set. The starting point a is not a fixed point, but a point at which the density of the distribution function is minimum is searched for each image, and a breakpoint is inserted therein.

縦軸の変数変換の定義の仕方によって、以下に示す級数展開係数にある定数要因が加わる。これは概論説明で行ったように展開係数が運動量に相当すると考えると、画像群の統計平均によって残留するその定数因子は、画像群系全体のヒルベルト空間座標系の選択の仕方によって系全体の一様な並進運動となって残ることに相当する。   Depending on how to define the variable transformation on the vertical axis, the following constant factors are added to the series expansion coefficient. Assuming that the expansion coefficient corresponds to the momentum as explained in the introduction, the constant factor remaining by the statistical average of the image group depends on how the Hilbert space coordinate system of the entire image group is selected. It is equivalent to remaining as a translational movement.

3−2.チェビシェフ多項式による級数展開
上述の変数変換がなされた横軸の分布域をH,V,Cに関係なくxで表す。HVCの各分布関数をN個の次数のチェビシェフ関数で展開する。

Figure 0005041041
3-2. Series expansion by Chebyshev polynomials The distribution range of the horizontal axis subjected to the above variable transformation is represented by x regardless of H, V, and C. Each distribution function of HVC is expanded with N-order Chebyshev functions.
Figure 0005041041

展開係数cnは、基底関数の直交性を利用して、以下の式で求められる。

Figure 0005041041
The expansion coefficient c n is obtained by the following equation using the orthogonality of the basis functions.
Figure 0005041041

ただし、n=0のときは特別にc0=c0/2とする。 However, when n = 0, specially to c 0 = c 0/2.

ここで変数変換を導入する。

Figure 0005041041
Here, variable conversion is introduced.
Figure 0005041041

こうすると展開係数は以下のように簡略に求まる。

Figure 0005041041
In this way, the expansion coefficient can be obtained simply as follows.
Figure 0005041041

色ヒストグラムのビンの数が200程度のときは、展開の次数をN=50程度に設定するとよい。   When the number of bins in the color histogram is about 200, the expansion order may be set to about N = 50.

4.感性不変量の生成(図6ステップS4)
2つのチェビシェフ基底関数の合成系によって、H,V,Cヒストグラムの分布関数の形状を抽出する。すなわち、HVCの分布関数がとる構造によって現れる感性を特徴量として抽出する。
4). Generation of Kansei Invariant (Step S4 in FIG. 6)
The shape of the distribution function of the H, V, C histogram is extracted by a synthesis system of two Chebyshev basis functions. That is, the sensibilities that appear due to the structure taken by the HVC distribution function are extracted as feature quantities.

展開係数の2次形式によって作られる行列要素に対して、一定の量子数の差を持つ行列要素のシュプールによって感性不変量を定義する。量子数差mは対称状態の場合、m=0,1,2,...,N/2まで定義でき、反対称状態の場合、m=1,2,...,N/2-1まで定義できる。量子数の差が0,1,2までの作成例を示す。ここに、1つの例外を除いては、不変量の値が全て[-1,1]に収まるように規格化して定義する。また、和の範囲がk=0,1,...,N-1の範囲をはみ出した場合は、k=N-1の次にk=0が環状につながっているものとして扱う。   The sensitivity invariant is defined by the spur of matrix elements having a certain quantum number difference for matrix elements created by the quadratic form of the expansion coefficient. Quantum difference m can be defined up to m = 0,1,2, ..., N / 2 in the symmetric state, and m = 1,2, ..., N / 2-1 in the antisymmetric state Can be defined. An example of creating quantum numbers up to 0, 1, 2 is shown. Here, with one exception, it is standardized and defined so that all invariant values fall within [-1,1]. Further, when the sum range exceeds the range of k = 0, 1,..., N−1, it is treated that k = 0 is connected in a ring shape after k = N−1.

同じ色面内の基底関数の合成系による評価

Figure 0005041041
Evaluation of basis functions in the same color plane by a synthesis system
Figure 0005041041

異なる色面間の基底関数の合成系による評価

Figure 0005041041
Evaluation of basis functions between different color planes by synthesis system
Figure 0005041041

プラス記号のついた不変量は、画像の分布関数の中に占める、合成系の対称状態による波形の符号付きの存在割合を示し、マイナス記号のついた不変量は、画像の分布関数の中に占める、合成系の反対称状態による波形の符号付きの存在割合を示す。   An invariant with a plus sign indicates the proportion of the waveform that is signed due to the symmetry of the composite system in the distribution function of the image, and an invariant with a minus sign is in the distribution function of the image. It shows the existence ratio of the waveform with the sign due to the antisymmetric state of the synthetic system.

不変量の値がゼロに近ければその合成波形の成分が全く存在しないということを意味し、+1に近ければその合成波形の形のままの成分が多く存在していることを意味し、-1に近ければ合成波形の符号を反転させた波形の成分が多く存在していることを意味する。例として、Fm=2 (α)(α)+のシュプールをとる対象の1つの成分である、対称状態の合成波T1T3とT2T4の波形図(図7参照)を示す。 If the value of the invariant is close to zero, it means that there is no component of the composite waveform, and if it is close to +1, it means that there are many components in the form of the composite waveform. If it is close to 1, it means that there are many components of the waveform obtained by inverting the sign of the composite waveform. As an example, a waveform diagram (see FIG. 7) of the symmetric composite waves T 1 T 3 and T 2 T 4 , which is one component to be spurted with Fm = 2 (α) (α) +, is shown.

別の色面間で量子数差がゼロと異なる感性不変量が有意な値を示すとき、ある色面の分布関数と別の色面の分布関数は常に何らかの特有の形状差を伴っているといえる。その反対に、別の色面間で量子数差がゼロの感性不変量が有意な値を示すとき、2つの色面の分布関数の形状は極めて似ているといえる。   When a sensitivity invariant with a quantum number difference of zero between different color planes shows a significant value, the distribution function of one color plane and the distribution function of another color plane always have some specific shape difference. I can say that. On the other hand, when the sensitivity invariant with a quantum number difference of zero between different color planes shows a significant value, it can be said that the shapes of the distribution functions of the two color planes are very similar.

Fm=0 (α)(α)+だけは規格化ができない。分布関数の値の区間を[-1,1]に変数変換しているので、実際の値はゼロに近い値、あるいは0.4程度から約1.5程度までの値をとる。この値が意味する内容は、値が大きいほど、分布関数の中である基底状態に一極集中して表現される割合が高く、値が小さいほどいろんな基底状態に分散して表現される割合が高いということを示す。Fm≠0 (α)(α)+についても同様に、値の絶対値が大きければ合成系の基底状態の内、ある1つの合成波形への一極集中度が高く、値の絶対値が小さければ合成系の基底状態の多くに分散して表現されるか、もしくは、この合成系の基底状態で表される波形成分はあまり存在していないことを意味する。   Only Fm = 0 (α) (α) + cannot be normalized. Since the interval of the value of the distribution function is variable-converted to [-1,1], the actual value takes a value close to zero or a value from about 0.4 to about 1.5. The meaning of this value is that the higher the value, the higher the proportion expressed in the ground state in the distribution function, and the smaller the value, the more the proportion expressed in various ground states. Indicates that it is expensive. Similarly, for Fm ≠ 0 (α) (α) +, if the absolute value of the value is large, the degree of unipolar concentration on one composite waveform in the ground state of the composite system is high, and the absolute value of the value is small. For example, it is expressed in a distributed manner in many of the ground states of the synthetic system, or it means that there are not many waveform components represented by the ground state of the synthetic system.

対称状態と反対称状態は互いに共役な関係にある。同じ量子数差の対称積と反対称積の感性不変量について、その不変量に関する画像群の整列度を調べてみると、対称積では値が零付近に集まって何の感性をもっているのか不明であった画像群が、反対称積ではその指標の分布の中の両端部に現れる。また、その逆も真で、反対称積の指標では不明な画像群が対称積の指標では画像分布の両端部に現れる。この事実は数式的に次のように考えれば当然の帰結である。すなわち、対称積の値がゼロのときci (α)ck (β)=-ck (α)ci (β)であるので、反対称積の値ci (α)ck (β)-ck (α)ci (β)=2ci (α)ck (β)=-2ck (α)ci (β)となって±のどちらかにもっとも大きな値をとりやすい。 The symmetric state and the antisymmetric state are conjugated with each other. Regarding the sensitivity invariants of the symmetric product and antisymmetric product of the same quantum number difference, when examining the degree of alignment of the image group related to the invariant, it is unclear what sensitivity is gathered near zero in the symmetric product. A group of images appears at both ends of the index distribution in the antisymmetric product. The opposite is also true, and an image group that is unknown in the anti-symmetric product index appears at both ends of the image distribution in the symmetric product index. This fact is a natural consequence of the following mathematical formula. That is, when the value of the symmetric product is zero, c i (α) c k (β) = −c k (α) c i (β) , so that the value of the anti-symmetric product c i (α) c k (β ) -c k (α) c i (β) = 2c i (α) c k (β) = -2c k (α) c i (β), and it is easy to take the largest value of either ±.

5.形容詞判別指標の作成(図6ステップS5)
5−1.感性不変量の線形結合
ある感性形容詞(i)を検索するための指標として、感性不変量の加法性の性質を利用して、各々の感性不変量を線形結合した新たな指標Qiを作成する。指標Qiが表しうる形容詞は、1つの形容詞だけではなく、正反対の性質の形容詞を備えた一対の形容詞であるものとする。
Qi1F12F2+...
ここで、Qiは再度[-1,1]の範囲の指標となるように、線型結合パラメータαiの値を規格化する。
5−2.検索対象形容詞のパラメータ設定
所定の形容詞に対応する線形結合パラメータを事前に学習しておき、そのモデル・パラメータを設定する。
5. Creating an adjective discrimination index (step S5 in FIG. 6)
5-1. Linear combination of Kansei invariants Creates a new index Q i that linearly combines Kansei invariants using the additive property of Kansei invariants as an index for searching for Kansei adjectives (i) . The adjectives that can be represented by the index Q i are not only one adjective but also a pair of adjectives that have adjectives of the opposite nature.
Q i = α 1 F 1 + α 2 F 2 + ...
Here, the value of the linear coupling parameter α i is normalized so that Q i becomes an index in the range of [−1, 1] again.
5-2. Parameter setting for search target adjectives Linear combination parameters corresponding to predetermined adjectives are learned in advance, and the model parameters are set.

6.画像分類処理(図6ステップS6)
形容詞判別指標に基づいて、画像を分類する。入力する画像データベース群に対して各々の画像について、形容詞判別指標Qiを計算し、Qiの値の大きさ順に並び替える。判別指標Qiに対して画像群の度数分布は、ガウス分布やポアッソン分布のような形をするので、両端で他の画像群よりも統計的に有意なレベルでその形容詞判別指標に対して特異性を示す画像を提示する。
6). Image classification process (step S6 in FIG. 6)
The images are classified based on the adjective discrimination index. For each image in the image database group to be input, an adjective discrimination index Q i is calculated and rearranged in order of the value of Q i . The frequency distribution of the image group with respect to the discriminant index Q i is shaped like a Gaussian distribution or Poisson distribution, so it is unique to the adjective discrimination index at a statistically significant level at both ends than the other image groups. An image showing sex is presented.

実際にどのような感性を与える画像が抽出されるか具体例を示す。最も単純な線形結合は、1つの感性不変量に対してのみ係数パラメータが有限で、その他は全て零となる場合である。それらの各々の性質についてのみ示す。複数の係数パラメータが残るときの決め方は、後述のモデル学習の欄で説明する。   A specific example of how an image that gives an actual feeling is extracted will be shown. The simplest linear combination is when the coefficient parameter is finite only for one sensitivity invariant and all others are zero. Only their respective properties are shown. A method of determining when a plurality of coefficient parameters remain will be described in the model learning section described later.

実際にこのようにして物理現象の記述がしやすいヒルベルト空間に投影され、さらに画像の信号分布の変化に対して不変に作用し続け、相加的な性質を備えた2次形式の感性不変量からは、色彩心理学で一般性のある高次の形容詞対(文献C1参照)と極めて深い関連性と線型性を示すことが実験的に確認することができた。その深い関連性を示すために、以下に各々の感性不変量から整列することのできる形容詞対の用語の例を記載する。   In fact, it is projected on the Hilbert space where physical phenomena are easy to describe in this way, and continues to act invariantly on changes in the signal distribution of the image. From the above, it was experimentally confirmed that high-order adjective pairs (see C1), which are general in color psychology, show extremely deep association and linearity. In order to show its deep relevance, examples of adjective pair terms that can be aligned from each of the sensitivity invariants are given below.

また、同じ型の感性不変量で量子数差の値を変えたもの同士の間では、感性軸が段々と遷移していく様子が実験的に認められた。これは形容詞の2面性の性質と非常に相性のよい記述方法になっている。すなわち、形容詞には例えば「賑やかな」という大分類に対して、「華やかな」や「派手な」や「騒がしい」といった微細分類の同次表現性が存在し、その細やかな分類能力も感性検索には不可欠となる。   It was also experimentally observed that the sensitivity axis gradually changed between the same types of sensitivity invariants with different quantum number differences. This is a description method very compatible with the two-faced nature of adjectives. In other words, adjectives, for example, have a subtle class of expressiveness such as “gorgeous”, “flashy”, and “noisy” for a major classification of “lively”, and their detailed classification ability is also a Kansei search. It becomes indispensable.

有効な量子数差の範囲は、行列要素の非対角成分が対角成分のとりうる値に対して、すなわち±1に比べて相対的に小さくなるところでは、もはや意味のある感性分類能力がないと考えるのが適当である。すなわち、行列要素のシュプールである感性不変量の値の分布範囲が広いと、感性との対応性が高い整列が得られるが、その分布範囲が小さくなるともはや対応関係は見えてこない。これは実験的にも確認している。   The range of the effective quantum number difference is that when the non-diagonal component of the matrix element is smaller than the value that the diagonal component can take, that is, when it is relatively smaller than ± 1, there is no longer a meaningful sensitivity classification ability. It is appropriate to think of it not. That is, when the distribution range of the values of the sensitivity invariant, which is a spur of the matrix elements, is wide, alignment with high correspondence with sensitivity can be obtained, but when the distribution range becomes small, the correspondence relationship can no longer be seen. This has been confirmed experimentally.

[文献C1]日本色彩学会編、色科学講座第1巻「カラーサイエンス」(朝倉書店、2004年)、第3章「色彩の心理学」、第3.2節「感覚・知覚・認知の測定法」、表3.4「色彩のイメージ測定によく使用される形容詞対」及び第3.4節「色彩の認知」、表3.13「日米学生の色に対する因子分析の比較」
以下に具体例を示す。

Figure 0005041041
[Reference C1] Color Society of Japan, Volume 1 “Color Science” (Asakura Shoten, 2004), Chapter 3 “Psychology of Color”, Section 3.2 “Measurement of Sensory, Perception and Cognition” ”, Table 3.4“ Adjective Pairs Commonly Used for Color Image Measurement ”and Section 3.4“ Color Recognition ”, Table 3.13“ Comparison of Factor Analysis for Color of Japanese and American Students ”
Specific examples are shown below.
Figure 0005041041

これは、3つの色面の各々で生成した感性不変量の相加平均である。この感性不変量からは「静的−動的」という形容詞対の感性画像が整列する。「静的な」画像には遠景の風景写真で時が一瞬止まったような画像が集まる。一方の「動的な」画像にはお祭りで多数の人物が踊っていたりする写真や都会の喧騒が伝わってくる写真が集まる。   This is the arithmetic mean of the sensitivity invariants generated on each of the three color planes. From the sensitivity invariants, the sensitivity images of the adjective pair “static-dynamic” are aligned. “Static” images include distant landscape photographs that seem to stop for a moment. On the other hand, “dynamic” images include photos of a large number of people dancing at a festival and photos of the bustle of the city.

図8に画像分布の両端近くに位置する画像のHVC面の色ヒストグラム形状の例を示す。「静的な」画像の色ヒストグラムはH,V,C面のいずれもが1つの基底関数の状態成分に集まった1つのバンド構造のような形状をして集団的であるのに対し、「動的な」画像ではH,V,C面の各々で多くの複雑なピーク形状を有し、単純な波形では記述できそうにもないヒストグラム構造をしていて分散的である。

Figure 0005041041
FIG. 8 shows an example of the color histogram shape of the HVC plane of an image located near both ends of the image distribution. The color histogram of a “static” image is collective with a shape like one band structure in which all of the H, V, and C planes are collected in one basis function state component. A “dynamic” image has many complex peak shapes on each of the H, V, and C planes, and has a histogram structure that is unlikely to be described with a simple waveform and is dispersive.
Figure 0005041041

この感性不変量からは「引き締まった−開放的な」という形容詞対の感性画像が整列する。「引き締まった」画像には陰影を多くもつ画像が集まる。一方の「開放的な」画像には全体的に少し明るさと空間的な広がりをもった画像が多く集まる。   From the sensitivity invariant, the sensitivity images of the adjective pair “tightened-open” are aligned. In the “tightened” image, images having many shadows are collected. On the other hand, a lot of images with a little brightness and spatial extent are gathered in the “open” image as a whole.

図9に画像分布の両端近くに位置する画像のHVC面の色ヒストグラム形状の例を示す。「引き締まった」画像の色ヒストグラムは、VC間で極めて形状の類似性が高い。一方の「開放的な」画像の色ヒストグラムはV面とC面で全く異なる形状をしている。

Figure 0005041041
FIG. 9 shows an example of the color histogram shape of the HVC plane of an image located near both ends of the image distribution. The color histogram of the “tight” image is very similar in shape between VCs. On the other hand, the color histogram of the “open” image has completely different shapes on the V and C planes.
Figure 0005041041

この感性不変量からは「興奮した−沈静した」という形容詞対の感性画像が整列する。この形容詞対は対称積から導き出された「引き締まった−開放的な」の形容詞対と共役な関係にあると位置づけられる。「興奮した」画像には色が派手な銀杏やもみじの木や葉からなる紅葉の写真であったり、風景写真の夕方の一瞬のピンク色の輝きを捉えた写真や雲が湧き立つような一瞬の動きを捉えた写真が多く集まる。一方の「沈静した」画像には動きが完全に止まった瞬間を捉え、更に深い色を兼ね備えた写真が集まる。   From this sensitivity invariant, the sensitivity images of the adjective pair “excited-sedated” are aligned. This adjective pair is positioned in a conjugate relationship with the "tight-open" adjective pair derived from the symmetric product. “Excited” images include fancy gingko and maple trees and leaves, or a photo that captures the pink glow of a moment in the evening of a landscape photo and a moment when clouds appear. Many photographs that capture the movement of On the other hand, the “calm” image captures the moment when the movement is completely stopped and collects photographs with deeper colors.

<感性形容詞のモデル学習>
感性不変量の値は、画像の分布関数の観測量から一意的に決まるものである。事前学習することによって形容詞との対応関係をとるのに必要なのは、各々の形容詞について線形結合パラメータを決めることである。
<Model learning of sensitivity adjectives>
The value of the sensitivity invariant is uniquely determined from the observed amount of the distribution function of the image. It is necessary to determine a linear combination parameter for each adjective in order to obtain a correspondence with the adjective by pre-learning.

1)最小二乗法
一人もしくは複数人がある形容詞に対して、その印象を備える画像を学習データ用の画像群の中から選択する。それの再現性を測る二乗誤差の関数を導入し、線形結合パラメータを未知であるとして、1つ1つのパラメータを偏微分して極小点を求めていく形で、各々の結合パラメータを決める。これは最小自乗法による係数のフィッティングである。
1) Least square method For one or more adjectives, an image having the impression is selected from a group of images for learning data. A square error function for measuring the reproducibility of the parameters is introduced, and each coupling parameter is determined in such a manner that each parameter is partially differentiated to find a minimum point, assuming that the linear coupling parameter is unknown. This is a coefficient fitting by the least square method.

2)画像分布のガマットにおける位置関係からの決定
ある画像の分布関数から複数の感性不変量を生成したとき、その画像が画像データベース群全ての画像についても求めた感性不変量のなかで、どの位置を占めていているかということは、その画像が発する感性そのものの性質を表している。すなわち、1つ1つの感性不変量に対する画像群の分布の端の境界線を、自然画像の信号分布がとりうるガマットと見なすことができる。このガマットの端に位置している画像は、その不変量に対しては極めて重要な信号を発していると考えてよく、真ん中に位置している画像はその不変量に対して無関係な性質であるといえる。したがって、そのガマット内におけるその画像が存在している位置をそのまま、線型結合パラメータの値として[-1,1]の範囲の数値を設定すればよい。ただし、全線型結合パラメータの間の規格化は最後に行うものとする。
2) Determination from positional relationship in image distribution gamut When multiple sensitivity invariants are generated from the distribution function of an image, which position is among the sensitivity invariants obtained for all images in the image database group. Is the nature of the sensibility itself produced by the image. That is, the boundary line of the distribution of the image group for each sensitivity invariant can be regarded as a gamut that the signal distribution of the natural image can take. The image located at the edge of the gamut may be considered to emit an extremely important signal for the invariant, and the image located in the middle is irrelevant to the invariant. It can be said that there is. Therefore, it is only necessary to set a numerical value in the range of [−1, 1] as the value of the linear combination parameter with the position where the image exists in the gamut as it is. However, normalization between all linear coupling parameters shall be performed last.

前述のように1つの形容詞に対して複数の画像が学習用として選択されているとき、選択された画像群について、各々の感性不変量のガマット内で単純に統計平均した座標位置を、その形容詞に対する線形結合パラメータの学習結果とすればよい。もしある感性不変量に対して選択された画像群がバラバラに散らばっているときは統計平均によってパラメータαiの値はゼロに近づき、その形容詞にとってその感性不変量は無関係であるということになる。その反対に、選択された画像群で同じ方向に集まってくる場合は、統計平均してもパラメータαiには有意な値が残り、その感性不変量はその形容詞にとって重要である。こうして、ある形容詞にとって特別な働きをする感性不変量が極めて単純に導き出される。なお、上述のモデル学習の方法は以下に説明する全ての実施形態で共通に使用することができる。 As described above, when a plurality of images are selected for learning with respect to one adjective, the coordinate position obtained by simply statistically averaging the selected image group within each sensibility invariant gamut is used as the adjective. The learning result of the linear combination parameter for. If a group of images selected for a given sensitivity invariant is scattered, the value of the parameter α i approaches zero by statistical averaging, which means that the sensitivity invariant is irrelevant for the adjective. On the other hand, when the selected images are gathered in the same direction, even if statistical averaging is performed, a significant value remains in the parameter α i , and the sensitivity invariant is important for the adjective. In this way, a sensibility invariant that works specially for an adjective can be derived very simply. The model learning method described above can be commonly used in all the embodiments described below.

[第2の実施形態]
(テキスチャPDFのヒルベルト空間表現と感性不変量の線形和)
次に、第2の実施形態に係る感性不変量の生成について説明する。なお、第2の実施形態においては、第1の実施形態における感性不変量の生成方法を以下の方法に変更した。
[Second Embodiment]
(Linear sum of texture PDF Hilbert space representation and sensitivity invariant)
Next, generation of a sensitivity invariant according to the second embodiment will be described. In the second embodiment, the method for generating the sensitivity invariant in the first embodiment is changed to the following method.

<検索対象画像への処理>
1.マンセルHVC色空間への変換
色相面はNの分離を行わない面を用意するものとする。N領域の色相面は、色相面内でランダムノイズのように振る舞うことになるが、以下のエッジ抽出過程ではそれが他の有彩色の色相と異なる特徴として検知される役割を果たす。
<Processing for search target images>
1. Conversion to Munsell HVC color space As the hue plane, a plane that does not separate N is prepared. The hue plane of the N region behaves like random noise in the hue plane, but in the following edge extraction process, it plays a role of being detected as a feature that is different from other chromatic hues.

色相環における一次元座標の採り方は、マンセル色相環の原点である赤色を始点に一周して終点を赤紫を経てもう一度赤色にしてもよいが、より望ましくは第1の実施形態と同様に各々の画像で色相の分布度数が最小となる点に切り込みを入れてそこに始点と終点を設定するとよい。そうすると色相環の分断によって信号強度が両端に振れ、その色面内でエッジ抽出したときのエッジ成分の過大評価による悪影響が最小限に抑えられるためである。   The way of taking the one-dimensional coordinates in the hue circle may be to make red the origin of the Munsell hue circle around the start point and make the end point red magenta again, but more preferably as in the first embodiment. It is preferable to cut a point where the hue distribution frequency is minimum in each image and set a start point and an end point there. This is because the signal intensity fluctuates at both ends due to the division of the hue ring, and adverse effects due to overestimation of edge components when edges are extracted within the color plane are minimized.

2.エッジ画像の作成
2−1.多重解像度変換とエッジ抽出
1)ウェーブレット変換
ウェーブレット変換を用いて多重解像度表現された周波数空間に射影して、HVC各色面の高周波のエッジ成分を抽出する。ここではエッジ成分として、ウェーブレット分解された高周波サブバンドLH,HL,HHをそのまま使うものとする。この様子を模式的に書けば、解像度M段まで分解するとき

Figure 0005041041
となる。なお、LL成分は順次解像度の低い高周波サブバンドに分解されていくので、最終的に残るLL成分は最低解像度のみとなる。ウェーブレット変換としては、例えば以下のような5/3フィルタなどを用いる。 2. Creation of edge image 2-1. Multi-resolution transformation and edge extraction 1) Wavelet transformation The wavelet transformation is used to project a high-frequency edge component of each color plane of HVC by projecting to the frequency space expressed in multi-resolution. Here, it is assumed that the wavelet-decomposed high-frequency subbands LH, HL, and HH are used as they are as edge components. If you write this state schematically, when disassembling to resolution M stages
Figure 0005041041
It becomes. Since the LL component is sequentially decomposed into high-frequency subbands with low resolution, the only remaining LL component is the lowest resolution. For example, the following 5/3 filter is used as the wavelet transform.

<ウェーブレット変換:Analysis/Decompositionプロセス>
ハイパス成分:d[n]=x[2n+1]-(x[2n+2]+x[2n])/2
ローパス成分:s[n]=x[2n]+(d[n]+d[n-1])/4
上記定義の1次元ウェーブレット変換を、横方向と縦方向に独立に2次元分離型フィルタ処理を行うことによって、ウェーブレット分解する。係数sをL面に集め、係数dをH面に集める。
<Wavelet transform: Analysis / Decomposition process>
High-pass component: d [n] = x [2n + 1]-(x [2n + 2] + x [2n]) / 2
Low-pass component: s [n] = x [2n] + (d [n] + d [n-1]) / 4
The one-dimensional wavelet transform defined above is subjected to wavelet decomposition by performing two-dimensional separation filter processing independently in the horizontal and vertical directions. The coefficient s is collected on the L plane, and the coefficient d is collected on the H plane.

2)ラプラシアン・ピラミッド
さらに多重解像度変換の別の方法として、ウェーブレット変換以外にラプラシアン・ビラミッドを使う方法もある。ラプラシアン・ピラミッドを作る場合は、一旦縦横(1/2)*(1/2)の縮小画像を作ってバイリニア変倍により元の大きさの画像に戻し、縮小前の画像との差分をとることによりその解像度の高周波画像(ラプラシアン成分)を得る。なお、縮小画像を作る前にエイリアジングを防ぐための平滑化を行ってもよい。これを次々に繰り返せば、高周波画像が連なったラプラシアン・ピラミッドができる。ウェーブレット変換の場合と同じく、最低解像度に1つだけ低周波画像(ガウシアン成分)が残る。
こうして多重解像度変換によって生成された高周波バンドの信号値のヒストグラム(確率密度関数と呼ばれ、PDFで略される)が、ガウス分布やラプラス分布をすることが文献D1に記載されている。一般に、PDFの分布形状は対称なGeneralized Gaussianで近似できる
2) Laplacian pyramid As another method of multiresolution conversion, there is a method using Laplacian pyramid in addition to wavelet conversion. When creating a Laplacian pyramid, once create a reduced image (vertical / horizontal) * (1/2), restore it to the original size by bilinear scaling, and take the difference from the image before reduction. To obtain a high-frequency image (Laplacian component) of that resolution. Note that smoothing for preventing aliasing may be performed before a reduced image is created. If this is repeated one after another, a Laplacian pyramid with a series of high-frequency images is formed. As with the wavelet transform, only one low frequency image (Gaussian component) remains at the lowest resolution.
Document D1 describes that a histogram of high-frequency band signal values generated by multi-resolution conversion in this manner (called a probability density function, abbreviated as PDF) has a Gaussian distribution or a Laplace distribution. In general, PDF distribution can be approximated by symmetrical Generalized Gaussian.

多重解像度変換の段数Mの値は、各バンドのPDFのヒストグラムが荒れない程度の画素数を有するところまで分解するとよい。例えば、Quad VGAサイズ(1280x960)の画像に対しては5段程度、QVGAサイズ(320x240)の画像に対しては3段程度、2000万画素の画像に対しては7段程度にするとよい。
なお、図10は4段のウェーブレット変換によるサブバンド分割の様子を示す図である。たとえば、第1段のウェーブレット変換では、実空間の画像データに対し、まず横方向にすべての行についてハイパスの成分及びローパス成分のデータを抽出する。その結果、横方向に半分の画像数のハイパス成分及びローパス成分のデータが抽出される。それを、たとえば実空間の画像データがあったメモリ領域右側にハイパス成分、左側にローパス成分を格納する。
The value of the multi-resolution conversion stage number M may be decomposed to a point where the PDF histogram of each band has a pixel number that is not rough. For example, it may be about 5 stages for Quad VGA size (1280x960) images, about 3 stages for QVGA size (320x240) images, and about 7 stages for 20 million pixel images.
FIG. 10 is a diagram showing a state of subband division by four-stage wavelet transform. For example, in the first-stage wavelet transform, high-pass component data and low-pass component data are first extracted from all rows in the horizontal direction with respect to real space image data. As a result, the data of the high-pass component and the low-pass component with half the number of images in the horizontal direction are extracted. For example, the high-pass component is stored on the right side of the memory area where the real-space image data was stored, and the low-pass component is stored on the left side.

次に、メモリ領域右側に格納されたハイパス成分及び左側に格納されたローパス成分のデータに対して、それぞれ縦方向にすべての列について、ハイパス成分及びローパス成分のデータを抽出する。その結果、メモリ領域右側のハイパス成分及び左側のローパス成分のそれぞれから、さらにハイパス成分及びローパス成分のデータが抽出される。それらを、それぞれのデータがあったメモリ領域下側にハイパス成分、上側にローパス成分を格納する。   Next, high pass component data and low pass component data are extracted for all columns in the vertical direction with respect to the high pass component data stored on the right side of the memory area and the low pass component data stored on the left side. As a result, data of a high-pass component and a low-pass component are further extracted from each of the high-pass component on the right side of the memory area and the low-pass component on the left side. The high-pass component and the low-pass component are stored in the lower side and the upper side of the memory area where the respective data exist.

その結果、横方向にハイパス成分として抽出されたデータから縦方向にハイパス成分として抽出されたデータをHHと表し、横方向にハイパス成分として抽出されたデータから縦方向にローパス成分として抽出されたデータをHLと表し、横方向にローパス成分として抽出されたデータから縦方向にハイパス成分として抽出されたデータをLHと表し、横方向にローパス成分として抽出されたデータから縦方向にローパス成分として抽出されたデータをLLと表す。ただし、縦方向と横方向は独立であるので、抽出の順序を入れ替えても等価である。   As a result, the data extracted as the high-pass component in the vertical direction from the data extracted as the high-pass component in the horizontal direction is represented as HH, and the data extracted as the low-pass component in the vertical direction from the data extracted as the high-pass component in the horizontal direction Is represented as HL, data extracted as a high-pass component in the vertical direction from data extracted as a low-pass component in the horizontal direction is represented as LH, and is extracted as a low-pass component in the vertical direction from data extracted as the low-pass component in the horizontal direction. The data is denoted as LL. However, since the vertical direction and the horizontal direction are independent, it is equivalent even if the order of extraction is changed.

次に、第2段のウェーブレット変換では、第1段のウェーブレット変換で横方向にローパス成分として抽出されたデータから縦方向にローパス成分として抽出されたデータLLに対し、同様にハイパス成分及びローパス成分の抽出を行う。これを4段まで繰り返し行うと図10のようになる。   Next, in the second-stage wavelet transform, the high-pass component and the low-pass component are similarly applied to the data LL extracted as the low-pass component in the vertical direction from the data extracted as the low-pass component in the horizontal direction in the first-stage wavelet transform. Perform extraction. If this is repeated up to four stages, the result is as shown in FIG.

[文献D1]Michael J. Gormish, "Source coding with channel, distortion, and complexity constraints," Doctor thesis, Stanford Univ., March 1994, Chapter 5: "Quantization and Computation-Rate- Distortion."
2−2.多重解像度統合
上述のようにして抽出された高周波サブバンドは、各解像度スケールにおけるエッジ、テキスチャ、コントラストに関する情報を表している。これらの情報を統括的に扱うため、高周波サブバンドのみによる多重解像度逆変換を行い、エッジ統合を行なう。すなわち、最低解像度の低周波サブバンドLLMを除外し、それらの値を全て零に設定した後に、残りの高周波サブバンドを順次逆ウェーブレット変換を行なう。この様子を模式的に書くと、入力画像と同じ解像度を持つ統合エッジ成分をEとして、以下のような式になる。

Figure 0005041041
[Reference D1] Michael J. Gormish, "Source coding with channel, distortion, and complexity constraints," Doctor thesis, Stanford Univ., March 1994, Chapter 5: "Quantization and Computation-Rate- Distortion."
2-2. Multi-resolution integration The high-frequency subbands extracted as described above represent information about edges, textures, and contrasts at each resolution scale. In order to handle this information in an integrated manner, multi-resolution inverse transform using only high-frequency subbands is performed to perform edge integration. That is, the low-frequency subband LLM with the lowest resolution is excluded and all of these values are set to zero, and then the remaining high-frequency subbands are sequentially subjected to inverse wavelet transform. When this state is schematically written, an integrated edge component having the same resolution as the input image is set as E, and the following equation is obtained.
Figure 0005041041

この統合段階において、階層の異なるエッジ、テキスチャ、コントラストの情報が空間的な位置関係を考慮して別の階層へ伝達されることになる。なお、ラプラシアン・ピラミッドを用いた場合は、最低解像度のガウシアン面を零に設定し、残りのラプラシアン面を逐次統合することになる。   In this integration stage, information on edges, textures, and contrasts in different layers is transmitted to another layer in consideration of the spatial positional relationship. When the Laplacian pyramid is used, the Gaussian surface with the lowest resolution is set to zero, and the remaining Laplacian surfaces are sequentially integrated.

3.統合エッジの一次元分布関数の作成
HVC各色面から抽出された統合エッジ画像のヒストグラム(PDF)を作成する。ヒストグラムのビン数はH,V,C共に、原点を挟んで-128〜128程度に設定するとよい。ただし、HVC各色面が200ビン程度の階調で表されているものとする。
3. Create one-dimensional distribution function of integrated edge
Create a histogram (PDF) of the integrated edge image extracted from each color plane of HVC. The number of histogram bins should be set to about -128 to 128 for the H, V, and C with the origin in between. However, it is assumed that each color surface of the HVC is represented by a gradation of about 200 bins.

PDFはエッジ強度のヒストグラムであるので、正と負に同程度の度数積分面積をもつ原点をピークとする分布になる。一般に、解像度間で無相関のメモリレス・ソースである場合、各階層で対称なPDF分布形状をしていたものは、統合してもそのまま対称なPDF分布形状となって統合される。しかしながら、解像度間で相関がある場合、その相関の様子がPDF分布の形状という形で投影されうる。   Since PDF is a histogram of edge strength, it has a distribution with a peak at the origin having a frequency integration area of the same degree as positive and negative. In general, in the case of a memoryless source having no correlation between resolutions, a symmetric PDF distribution shape in each layer is integrated into a symmetric PDF distribution shape as it is. However, when there is a correlation between resolutions, the state of the correlation can be projected in the form of a PDF distribution shape.

このように各々の高周波サブバンド面のPDFは、通常「一般化されたガウシアン:exp(-|x|α)」に近似できるが、逐次統合したエッジ面には空間的なコントラストの相関が反映されて、非対称性を含めて多様な形状に変化する。 In this way, the PDF of each high-frequency subband surface can be approximated by “generalized Gaussian: exp (-| x | α )”, but the spatial contrast correlation is reflected on the sequentially integrated edge surfaces. It changes to various shapes including asymmetry.

このような統合エッジのPDF分布の特徴的な形状は、最低解像度からおよそ3段分ぐらいのエッジ成分を統合するとほぼその形が現れてくることが実験的に確認された。したがって、もし簡略に済ませたいような場合は、最後の実解像度まで統合しなくても、統合途中段階のPDF分布形状を評価するようにしてもよい。   It has been experimentally confirmed that such a characteristic shape of the PDF distribution of the integrated edge appears almost when the edge components of about three steps from the lowest resolution are integrated. Therefore, if it is desired to simplify the process, the PDF distribution shape in the middle of the integration may be evaluated without integrating the final actual resolution.

便宜上、画素数でヒストグラムの値を規格化しておけば、画素値の確率密度を表す一次元分布関数になる。模式的に作成した分布関数を次のように表す。ラプラシアン記号△を用いたのは、統合エッジ画像が元画像の画素値の2次微分の側面を記述しているからである。
f(△H), f(△V), f(△C)
4.分布関数のヒルベルト空間表現
統合エッジ画像の分布関数を球ベッセル関数で級数展開し、展開係数によって形状を評価できるようにする。第2の実施形態では、右展開と左展開を個別に行うが、後述する第3の実施形態では左右同時展開を行う。そのとき、第2の実施形態では、0次の球ベッセル関数の根による展開を行う。展開区域の最外郭点を固定して、その中に含まれる根の数を増やすことが周波数成分の高い基底関数を生むことに対応する。
For convenience, if the histogram value is normalized by the number of pixels, a one-dimensional distribution function representing the probability density of the pixel value is obtained. The distribution function schematically created is expressed as follows. The Laplacian symbol Δ is used because the integrated edge image describes the secondary differential aspect of the pixel value of the original image.
f (△ H), f (△ V), f (△ C)
4). Hilbert space representation of distribution function The distribution function of the integrated edge image is series-expanded with a spherical Bessel function, and the shape can be evaluated by the expansion coefficient. In the second embodiment, right development and left development are performed separately, but in the third embodiment described later, left and right simultaneous development is performed. At that time, in the second embodiment, expansion by the root of the zero-order spherical Bessel function is performed. Fixing the outermost points of the development area and increasing the number of roots contained therein corresponds to generating a basis function having a high frequency component.

4−1.変数変換
ヒストグラムのピークから右側の部分について、横軸の分布域を[a,b](a<b)、縦軸の分布域を[fa,fb]とする。横軸を[0,1]に、縦軸を[0,1]に収まる区間に変数変換を行う。ヒストグラムのピークから左側の部分についても同様に、横軸の分布域を[b,a](b<a)、縦軸の分布域を[fa,fb]とし、同様な変換を行う。通例a〜0、fa〜0の値をとる。この節の中だけ便宜的に、横軸の変数をxからyへ、縦軸の変数をfxからfyへ変換すると表記すると、変換式は以下のようになる。
横軸の変数変換:y=|x-a|/|b-a|
縦軸の変数変換:fy=(fx-fa)/(fb-fa)
4−2.球ベッセル関数の根による級数展開
上述の変数変換がなされた横軸の分布域を△H,△V,△Cに関係なくxで表す。HVC各色面の分布関数をN個の0次の球ベッセル関数の根による基底関数で展開する。ここで用いる記号aの意味は前述までと異なり、分布域の展開対象となる最外郭点を意味する。

Figure 0005041041
4-1. Variable transformation For the portion on the right side of the peak of the histogram, the distribution area on the horizontal axis is [a, b] (a <b), and the distribution area on the vertical axis is [fa, fb]. Variable conversion is performed in the interval where the horizontal axis is in [0,1] and the vertical axis is in [0,1]. Similarly, the left side of the histogram peak is set to [b, a] (b <a) on the horizontal axis and [fa, fb] on the vertical axis, and the same conversion is performed. Usually takes values of a to 0, fa to 0. For convenience only in this section, if the variable on the horizontal axis is converted from x to y and the variable on the vertical axis is converted from fx to fy, the conversion formula is as follows.
Variable transformation on the horizontal axis: y = | xa | / | ba |
Variable conversion on the vertical axis: fy = (fx-fa) / (fb-fa)
4-2. Series expansion by the root of the spherical Bessel function The distribution range of the horizontal axis subjected to the above-described variable transformation is represented by x regardless of ΔH, ΔV, and ΔC. The distribution function of each HVC color plane is expanded with a basis function based on the roots of N zeroth-order spherical Bessel functions. The meaning of the symbol a used here is different from the above, and means the outermost contour point that is the target of development of the distribution area.
Figure 0005041041

展開係数cnは、基底関数の直交性を利用して、以下の式で求められる。

Figure 0005041041
The expansion coefficient c n is obtained by the following equation using the orthogonality of the basis functions.
Figure 0005041041

ここに、αnmはn次関数のm番目の零点の値を意味する。

Figure 0005041041
Here, α nm means the value of the mth zero of the nth order function.
Figure 0005041041

0次関数の根の場合は、解析的に与えることができる。
α0m=πm, m=1,2,3,...
したがって、級数展開に用いた0次関数のm番目の基底関数は、[0,a]の区間内にm個の零点(根)が存在する。すなわち、0次の球ベッセル関数の最初の零点の位置にaを設定したものをその次数における最低周波数の基底関数とし、その関数を原点方向に向かって縮め、2番目の零点がaの位置に来たときに止め、それをその次数における2番目に周波数の低い基底関数とし、これを次々に繰り返して、分布域内[0,a]の区間で高周波の基底関数を生成し、完全系をなすようにする。これはn次関数の場合も全く同様である。
The root of the zeroth order function can be given analytically.
α 0m = πm, m = 1,2,3, ...
Therefore, the m-th basis function of the zeroth order function used for the series expansion has m zeros (roots) in the interval [0, a]. That is, the first zero point position of the 0th order spherical Bessel function with a set as the basis function of the lowest frequency in that order, the function is reduced toward the origin, and the second zero point is at the position of a When it comes, stop it and make it the second lowest frequency basis function in that order, and repeat this one after another to generate a high-frequency basis function in the interval [0, a] in the distribution range, forming a complete system Like that. This is exactly the same for the n-order function.

球ベッセル関数は根展開に関しては完全系であるので、十分な大きさのNの値をとると元の関数を完全に再現できる。ヒストグラムのビンの数が片側128程度のときは、展開の次数をN=100程度に設定するとよい。   Since the spherical Bessel function is a complete system in terms of root expansion, the original function can be completely reproduced by taking a sufficiently large value of N. When the number of bins in the histogram is about 128 on one side, the expansion order may be set to about N = 100.

5.感性不変量の生成
2つの基底関数の合成系によって、HVC各面のテキスチャPDFの分布関数の形状を抽出する。すなわち、HVC統合エッジ画像の各分布関数がとる構造によって現れる感性を特徴量として抽出する。
5. Generation of Kansei Invariant Extract the shape of the distribution function of the texture PDF on each face of the HVC by the synthesis system of two basis functions. That is, the sensibility that appears due to the structure of each distribution function of the HVC integrated edge image is extracted as a feature amount.

同じ色面内のエッジ成分から得た1つの分布関数を、同じ基底関数を用いて右展開と左展開を行ったので、2次形式の不変量の作り方は第1の実施形態の場合よりも種類が約2倍以上に増える。以下に対称積の場合は量子数差が0と1のとき不変量の作り方を、反対称積の場合は量子数差が1のときの作り方の例を示すが、同様な生成方法によって、対称積は量子数差がm=0,1,...,N/2まで、反対称積は量子数差がm=1,2,...,N/2-1まで定義できる。   Since one distribution function obtained from edge components in the same color plane is expanded to the right and left using the same basis function, the method of creating a quadratic invariant is more than that of the first embodiment. The number of types increases more than twice. The following shows an example of how to create an invariant when the quantum difference is 0 and 1 in the case of a symmetric product, and how to make an invariant when the difference is 1 in the case of an antisymmetric product. Products can be defined with quantum difference up to m = 0,1, ..., N / 2, and antisymmetric products with quantum difference up to m = 1,2, ..., N / 2-1.

分布関数の右区間と左区間を異なる象限と考えると、HVC3面の同一象限同士の2つの基底関数の組み合せから合成系を第1の実施形態と同様に作ることができ、また異なる象限間の2つの基底関数の組み合せからも合成系を作ることができる。前者は動径方向のみを扱うので記号「r」を付与する。後者はゼロをまたぐという意味で記号「z」を付与する。右側の展開係数をck (α+)、左側の展開係数をck (α-)とする。
ここに、1つの例外を除いては、不変量の値が全て[-1,1]に収まるように規格化して定義する。また、和の範囲がk=1,...,Nの範囲をはみ出した場合は、k=Nの次にk=1が環状につながっているものとして扱う。色面は(α),(β)=H,V,Cとする。
Considering the right and left sections of the distribution function as different quadrants, a composite system can be created in the same way as in the first embodiment from the combination of two basis functions in the same quadrant on the HVC3 plane, and between different quadrants. A composite system can also be created from a combination of two basis functions. Since the former handles only the radial direction, the symbol “r” is given. The latter gives the symbol “z” in the sense that it crosses zero. Let the expansion coefficient on the right be c k (α +) and the expansion coefficient on the left be c k (α−) .
Here, with one exception, it is standardized and defined so that all invariant values fall within [-1,1]. Further, when the sum range exceeds the range of k = 1,..., N, it is treated that k = 1 is connected in a ring shape after k = N. The color plane is (α), (β) = H, V, C.

同じ色面内の基底関数の合成系による評価
1)同一象限内の組み合せ

Figure 0005041041
Evaluation of basis functions in the same color plane by the synthesis system 1) Combinations in the same quadrant
Figure 0005041041

2)異なる象限の組み合せ

Figure 0005041041
2) Combination of different quadrants
Figure 0005041041

異なる色面間の基底関数の合成系による評価
1)同一象限内の組み合せ

Figure 0005041041
Evaluation of basis functions between different color planes by synthesis system 1) Combinations in the same quadrant
Figure 0005041041

2)異なる象限の組み合せ

Figure 0005041041
2) Combination of different quadrants
Figure 0005041041

不変量のとりうる値とその性質は、第1の実施形態で説明した内容と全く同じであるので、ここでは省略する。   The values that can be taken by the invariants and their properties are the same as those described in the first embodiment, and are therefore omitted here.

6.形容詞判別指標の作成
6−1.感性不変量の線形結合
ある感性形容詞(i)を検索するための指標として、感性不変量の加法性の性質を利用して、各々の感性不変量を線形結合した新たな指標Qiを作成する。指標Qiが表しうる形容詞は、1つの形容詞だけではなく、正反対の性質の形容詞を備えた一対の形容詞であるものとする。
Qi1G12G2+...
ここに、Qiは再度[-1,1]の範囲の指標となるように、線型結合パラメータβiの値を規格化しておく。
6). Creation of adjective discrimination index 6-1. Linear combination of Kansei invariants Creates a new index Q i that linearly combines Kansei invariants using the additive property of Kansei invariants as an index for searching for Kansei adjectives (i) . The adjectives that can be represented by the index Q i are not only one adjective but also a pair of adjectives that have adjectives of the opposite nature.
Q i = β 1 G 1 + β 2 G 2 + ...
Here, the value of the linear coupling parameter β i is normalized so that Q i becomes an index in the range of [−1, 1] again.

6−2.検索対象形容詞のパラメータ設定
所定の形容詞に対応する線形結合パラメータを事前に学習しておき、そのモデル・パラメータを設定する。
6-2. Parameter setting for search target adjectives Linear combination parameters corresponding to predetermined adjectives are learned in advance, and the model parameters are set.

7.画像分類処理
形容詞判別指標に基づいて、第1の実施形態と同様にして画像を分類する。以下に、実際にどのような感性を与える画像が抽出されるか具体例を挙げて示す。第1の実施形態と同様にテキスチャの場合も各々の感性不変量からは色彩心理学で用いられる高次の形容詞対と極めて深い関連性と線型性がある画像の整列を得ることができた。
7). Image Classification Processing Based on the adjective discrimination index, images are classified as in the first embodiment. In the following, a specific example is given to show what kind of sensibility is actually given. Similarly to the first embodiment, in the case of texture, from each sensitivity invariant, it was possible to obtain an image alignment having a very deep relationship and linearity with high-order adjective pairs used in color psychology.

感性不変量の性質について全体を概観すると、異なる象限の基底関数を組み合わせることによって、分布関数の非対称性の要素が入った不変量の方が、感情的な要素が相当強く入ってくる。他方、同一象限内の基底関数を組み合わせた場合は、画像の被写体構造の多重性や一体性のような分離は可能であるものの、かなり中性的な側面も強い。以下に形容詞を割り当てながら例に挙げるのは主に異なる象限を組み合わせた場合を中心とする。   An overview of the nature of sensibility invariants shows that the invariant that contains the asymmetry of the distribution function is considerably stronger in emotional elements by combining basis functions in different quadrants. On the other hand, when the basis functions in the same quadrant are combined, separation such as multiplicity and unity of the object structure of the image is possible, but a fairly neutral aspect is also strong. In the following, examples are given mainly by combining different quadrants while assigning adjectives.

第1の実施形態の色の分布関数のときと少し事情が異なるのは、エッジの分布関数のときは非対角成分の要素が対角域から離れたところでも大きな値が残り、前者が対角域から離れると急速に強度が低下する短距離相関であるのに比べ、長距離相関の性質をもっているということである。これはテキスチャの分布構造によって誘起される感情の数のほうが色の分布構造によって誘起される感情の数よりも多いということを示していると解釈できる。   The situation is slightly different from that of the color distribution function of the first embodiment. In the case of the edge distribution function, a large value remains even when the element of the off-diagonal component is away from the diagonal region, and the former is Compared to the short-range correlation whose strength decreases rapidly when leaving the angular range, it has a long-range correlation property. This can be interpreted as indicating that the number of emotions induced by the texture distribution structure is greater than the number of emotions induced by the color distribution structure.

図11には

Figure 0005041041
の相加平均をとった場合に、展開の次数がN=100で量子数差mをm=0,8,50とずらしたとき、整列させた画像群分布の両極端にはどのような分布関数の形状が該当するかを示した例である。上段は一方の端に位置する画像のV面のエッジ画像の分布関数の様子を、下段はもう一方の端に位置する画像の同様の様子を示している。 In FIG.
Figure 0005041041
What is the distribution function at the extremes of the aligned image group distribution when the expansion order is N = 100 and the quantum number difference m is shifted to m = 0,8,50 when the arithmetic mean of is taken? It is an example which shows whether the shape of corresponds. The upper row shows the distribution function of the edge image of the V plane of the image located at one end, and the lower row shows the same state of the image located at the other end.

図11に対応する画像群の傾向として、m=0の上段には画像内で大柄な要素が存在して「豊かな」印象を与える画像が集まり、下段には「神妙な」印象を与える画像が集まる傾向が認められた。また、m=8からは上段には前後に2つの被写体が重なり、背景と主要被写体の2つの要素が存在するような複合的な画像が多く、下段には木々の葉や草が全面に映ったような細かなテキスチャ構造の一体的な画像が多く集まる。

Figure 0005041041
As the tendency of the image group corresponding to FIG. 11, images with large elements in the image at the upper stage of m = 0 gather together to give a “rich” impression, and images at the lower stage give a “mysterious” impression. The tendency to gather was recognized. Also, from m = 8, there are many composite images in which two subjects overlap in the front and back in the upper part, and there are two elements of the background and the main subject, and the leaves and grass are reflected on the entire bottom part. Many integrated images with a fine texture structure are collected.
Figure 0005041041

この感性不変量からは「賑やかな−寂しい」と「華やかな−清楚な」という2つの形容詞対を合わせたような感性画像が整列する。「賑やかな、華やかな」画像には大柄な構造と小柄な構造が多数含まれるような様々なシーンの画像が集まる。一方の「寂しい、清楚な」画像には黒っぽい色の構造や暗い陰のシーンがある程度視覚的な影響力のある面積比重を伴って含まれている写真が多く集まる。

Figure 0005041041
From the sensitivity invariant, the sensitivity images are arranged such that the two adjective pairs “lively-lonely” and “gorgeous-clean” are combined. “Buzzy, gorgeous” images are a collection of images of various scenes that include many large and small structures. On the other hand, the “lonely, neat” image contains many photographs that contain dark-colored structures and dark shaded scenes with an area specific gravity that has some visual influence.
Figure 0005041041

この感性不変量からは「しみじみとした−幽玄な」という形容詞対の感性画像が整列する。「しみじみとした」画像には木立と陰を伴った画像が多く集まる。一方の「幽玄な」画像には大面積の区分的な風景描写の上に、夕暮れ時のピンク色、オレンジ色、黄色などに染まった写真や、変わった雲の連なりの描写を伴っていたり、蒸気やもやが立ちこめたような画像が多く集まる。   From the sensitivity invariant, the sensitivity images of the adjective pair “smudged-mysterious” are aligned. Many images with trees and shades are gathered in the “smeared” image. On the other hand, the "mysterious" image is accompanied by a picture of a large area, a section of landscape, a dyed pink, orange, yellow, etc. at dusk, or a series of strange clouds. Many images like steam and haze are collected.

図12に両端に選ばれた画像の典型例のエッジ画像と分布関数を示す。分布関数の形状から解説すると図12左側のようにV面とC面が共にエッジやテキスチャが多いとしみじみとした印象を与える。一方、図12右側のようにV面エッジ画像の分布関数がわずかな頻度で強い値を示す、すなわち分布関数に小さな裾野が存在していると元絵は山の稜線などで区分的に分断された画像構造を伴い、その上に輝度成分のコントラスト変化以上の太いコントラスト幅を伴って彩度面の変化が織りなすことによって幽玄な印象を与えると考えられる。

Figure 0005041041
FIG. 12 shows a typical edge image and distribution function of images selected at both ends. Explaining from the shape of the distribution function, as shown on the left side of FIG. 12, the V plane and the C plane both have a lot of edges and textures, giving a familiar impression. On the other hand, as shown in the right side of FIG. 12, the distribution function of the V-plane edge image shows a strong value with a slight frequency, that is, if there is a small base in the distribution function, the original picture is divided into sections such as mountain ridges. It is considered that a ghostly impression is given by the fact that the change of the saturation plane is woven with a thick contrast width larger than the contrast change of the luminance component.
Figure 0005041041

この感性不変量からは形容詞対を当てはめにくいが、「夏や昼の風景」と「秋・春や夕方の風景」という画像の対に明確に分離される。「夏や昼の風景」の画像は緑色や青色の面積が多く、コントラストが強い。「秋・春や夕方の風景」の画像は暖色系の色が含まれ、やや変化に乏しい画像が多い。   Although it is difficult to apply an adjective pair from this sensitivity invariant, it is clearly separated into a pair of images of “summer and day scenery” and “autumn, spring and evening scenery”. The image of “summer and daytime scenery” has a lot of green and blue areas and a strong contrast. “Autumn / Spring / Evening scenery” images contain warm colors, and there are many images with little change.

[第3の実施形態]
(テキスチャPDFのヒルベルト空間表現と感性不変量の線形和)
次に、第3の実施形態について説明する。第2の実施形態では統合エッジ画像のヒストグラムを右側と左側に分けて展開したが、左右同時展開するほうが対称性の議論もしやすく、望ましいので以下にその変更すべき点だけを記述する。そこから得られる感性不変量は、第2の実施形態よりも、感性との対応関係がとりやすく、より整列度の高いものとなると考えられる。
[Third embodiment]
(Linear sum of texture PDF Hilbert space representation and sensitivity invariant)
Next, a third embodiment will be described. In the second embodiment, the histogram of the integrated edge image is developed separately on the right side and the left side. However, it is easier to discuss the symmetry when the left and right sides are developed simultaneously, so only the points to be changed are described below. It is considered that the sensitivity invariant obtained therefrom is more easily correlated with sensitivity than in the second embodiment and has a higher degree of alignment.

4.分布関数のヒルベルト空間表現
偶関数である0次の球ベッセル関数による根展開と、奇関数である1次の球ベッセル関数による根展開の二重級数によって、分布関数をヒルベルト空間表現する。そうすると分布関数形状の対称な成分は全て0次関数の展開係数に集まり、非対称な成分は全て1次関数の展開係数に集まることになる。なお、更に発展させて無限次数まで二重級数展開してもよい。
4). Hilbert Space Representation of Distribution Function A distribution function is represented in Hilbert space by a double series of root expansion by a zero-order spherical Bessel function that is an even function and a root expansion by a first-order spherical Bessel function that is an odd function. Then, all the symmetric components of the distribution function shape are collected in the expansion coefficient of the zero-order function, and all the asymmetric components are collected in the expansion coefficient of the linear function. Further, the double series may be expanded to an infinite order by further development.

4−1.変数変換
ヒストグラムのピーク位置pから右側ないしは左側の最も遠くまで広がっている分布域の最端点までの距離をrとする。横軸の分布域は[-r+p, r+p]となる。この横軸を[-1,1]の区間に変数変換を行う。
横軸の変数変換:y=(x-p)/r
縦軸は第2の実施形態と同様。
4-1. Variable transformation Let r be the distance from the peak position p of the histogram to the extreme end of the distribution area that extends to the farthest right or left. The distribution range on the horizontal axis is [-r + p, r + p]. Variable transformation is performed on the horizontal axis in the interval [-1,1].
Variable transformation on the horizontal axis: y = (xp) / r
The vertical axis is the same as in the second embodiment.

4−2.球ベッセル関数の根と次数による二重級数展開
HVC各色面の分布関数をN個の0次と1次の球ベッセル関数の根による基底関数で展開する。ここで用いる記号aの意味は第2の実施形態と同様に、分布域の展開対象となる最外郭点を意味する。

Figure 0005041041
4-2. Double series expansion of roots and orders of spherical Bessel functions
The distribution function of each HVC color plane is expanded with basis functions based on the roots of N zeroth-order and first-order spherical Bessel functions. The meaning of the symbol a used here means the outermost contour point that is the target of development of the distribution area, as in the second embodiment.
Figure 0005041041

展開係数cnkは、基底関数の直交性を利用して、以下の式で求められる。

Figure 0005041041
The expansion coefficient c nk is obtained by the following equation using the orthogonality of the basis functions.
Figure 0005041041

ここに、展開係数の算出式を導くにあたり、0次と1次関数の積は内部変数がいかにスケーリングされていても奇関数であることから、更にρ2の偶関数性を考慮して、左右対称区間で積分すると積分値がゼロになる性質を用いた。すなわち、次数に関する直交性の関係式は、偶数次と奇数次の関数の間で定義する限りにおいては重み関数が1の場合に留まらず、任意の偶関数の重みを加えても成り立つ。ただし、正規化の定数因子は変わるが、ρ2の場合は既に根による関係式で与えられている(概論説明の部分で記載)。 Here, when guiding the equation for calculating expansion coefficients, the product of the zero-order and first-order function since the internal variable is an odd function be how scaled, and further consideration of the even function of [rho 2, left and right We used the property that the integration value becomes zero when integrating over a symmetrical interval. That is, the relational expression of the orthogonality regarding the order is not limited to the case where the weighting function is 1 as long as it is defined between the even-order function and the odd-order function, and can be applied even if the weight of an arbitrary even function is added. However, the constant factor of normalization will vary but, (described in the portion of the outline description) that already have been given by the equation according to the roots in the case of [rho 2.

5.感性不変量の生成
二重展開係数cnkを1つのベクトルとして一重展開係数と同じように扱えば、第1の実施形態の色の感性不変量Fiと全く同様の形式の感性不変量Giを構築することができる。したがって、FをGに置き換えるだけでよい。ただし、和のとる範囲が2倍になり、k=1,2,...,N,N+1,...,2Nと変更することになる。このようにして求めた感性不変量を用いて第1及び第2の実施形態と同様に画像の分類を行うことができる。
5. Generating Kansei Invariants If the double expansion coefficient c nk is treated as one vector in the same way as the single expansion coefficient, the Kansei invariant G i in the same form as the color Kansei invariant F i of the first embodiment is used. Can be built. Therefore, it is only necessary to replace F with G. However, the range taken by the sum is doubled and changed to k = 1, 2,..., N, N + 1,. Image classification can be performed in the same manner as in the first and second embodiments using the sensitivity invariant thus obtained.

[第4の実施形態]
(色とテキスチャの感性不変量の線形和)
次に、第4の実施形態について説明する。第1の実施形態で示した、画像の色信号分布に関する一次元分布関数から導いた感性不変量Fiと、第2、第3の実施形態で示した、エッジ画像の色信号分布に関する一次元分布関数から導いた感性不変量Giは、全く同じ次元の物理量であり相加的な性質を持っていることから、線形結合をすることにより両者は共通に扱うことができる。これは一次元分布関数に留まらず、構図の要素が絡んだ画像の色信号分布自体の2次元分布関数や更に高次の感性要素についても、同じ要領で感性不変量を構築すれば全く共通の土台に乗り、形容詞の階層構造で上位概念が最も強く残るという性質を感性の線型モデルによって説明することができるようになる。
[Fourth Embodiment]
(Linear sum of color and texture sensitivity invariants)
Next, a fourth embodiment will be described. The sensitivity invariant F i derived from the one-dimensional distribution function related to the color signal distribution of the image shown in the first embodiment, and the one-dimensional value related to the color signal distribution of the edge image shown in the second and third embodiments. Kansei invariant G i led from distribution function, from having There additive nature in exactly the physical quantity of the same dimension, both by the linear combination can be handled in common. This is not just a one-dimensional distribution function, but the two-dimensional distribution function of the image color signal distribution itself and the higher-order sensitivity elements of the image entangled with the composition elements are completely the same if the sensitivity invariants are constructed in the same way. It becomes possible to explain the property that the superordinate concept remains strongest in the hierarchical structure of adjectives by using a linear model of sensitivity.

<検索対象画像への処理>
1.マンセルHVC色空間への変換
この第4の実施形態においては、色相面はNの分離を行った面と行わない面の2つを用意する。その後の処理は第1〜3の実施形態と同様である。
<Processing for search target images>
1. Conversion to Munsell HVC color space In this fourth embodiment, two hue planes are prepared: a plane with N separation and a plane without. Subsequent processing is the same as in the first to third embodiments.

5.形容詞判別指標の作成
Qi1G12G2+...
1G12G2+...
<感性形容詞モデル学習>
第1の実施形態とまったく同様の手法によって線型結合パラメータを決定する。
5. Creating an adjective discrimination index
Q i = α 1 G 1 + α 2 G 2 + ...
+ β 1 G 1 + β 2 G 2 + ...
<Sensitive adjective model learning>
The linear coupling parameter is determined by the same method as in the first embodiment.

ここでもう一度、これまでの説明を総括するとともに、更に新たな概念を導くための全体の概論説明を行う。その後にそれらを実現する第5〜第7の実施形態について説明する。
[1]感性の定式化の描像
<基本概念>
感性の定式化の描像として次のように考える。1つ1つの画像がある感性に共通のエネルギー要素を発する。それを脳が知覚する。
Here, we will summarize the previous explanations and give a general overview to guide new concepts. After that, fifth to seventh embodiments for realizing them will be described.
[1] Image of Kansei Formulation <Basic Concept>
Consider the following as a picture of Kansei formulation. Each image emits an energy element common to the sensibility. The brain perceives it.

<分布関数の形状特性>
図13は、色とテキスチャの分布関数を示す図である。これまで説明してきたように、画像の感性と分布関数の形状とは非常に関連性が深く、曖昧に似た形状が同一の感性を与える傾向にある。この分布関数の形状認識の定量化するために物理学的手法を導入してきた。
<Shape characteristics of distribution function>
FIG. 13 is a diagram illustrating a distribution function of color and texture. As described so far, the sensitivity of the image and the shape of the distribution function are very related, and the shape similar to the ambiguity tends to give the same sensitivity. Physical techniques have been introduced to quantify the shape recognition of this distribution function.

<量子力学的手法>
これまでに説明してきた内容は、量子力学によって記述を試みるというものである。すなわち、次のように要約することができる。
1)分布関数fをヒルベルト空間に投影して運動量pを表示する。
2)群論を用いて2次形式の相加的なエネルギーEnを構築する。
ここでとった方法は実際には量子力学の概念を導入するとともに、画像という多数の画素と多数の階調を持った多体系のとる状態を、分布関数fを通して統計力学的に記述するという内容も含んでいる。それについて次に詳述する。
<Quantum mechanical method>
The contents explained so far are to try to describe by quantum mechanics. That is, it can be summarized as follows.
1) The distribution function f is projected onto the Hilbert space and the momentum p is displayed.
2) constructing an additive energy E n of the quadratic form with group theory.
The method adopted here actually introduces the concept of quantum mechanics, and describes the state of a multi-system with a large number of pixels and a large number of gradations as a statistical mechanics through a distribution function f. Also included. This will be described in detail below.

<統計物理学的な意味>
上述の記述法の意味は、画像の信号値S(x,y)というミクロな性質の物理量から、感性という巨視的な性質の物理量への変換である。すなわち、ミクロな量の統計平均をとることによって、運動量と角運動量とエネルギーという力学的不変量のみが有効な成分として残り、その中でも画像群の統計平均をとることによって、エネルギーのみが有効な画像系を特徴づける役割を果たす。統計集団の作用によって、画像系はエネルギーバンドの構造とういう形に情報集約される。このように画像系のインフォメーションボリュームを縮約することによって、ミクロな性質からマクロな性質への変換を行う。統計力学的な記述法が、その統計的性質を記述するための橋渡しの役割を担う。
以下に、情報の縮約の様子を示す。構図系は未完であるが予測も含めて記述する。
<Statistical physics>
The meaning of the above description method is conversion from a physical quantity having a micro property of image signal value S (x, y) to a physical quantity having a macro property of sensitivity. In other words, by taking a statistical average of micro quantities, only mechanical invariants such as momentum, angular momentum, and energy remain as effective components. Among them, by taking a statistical average of a group of images, an image in which only energy is effective is obtained. Plays a role in characterizing the system. By the action of the statistical group, the image system is aggregated in the form of energy band structure. By reducing the information volume of the image system in this way, conversion from the micro property to the macro property is performed. Statistical mechanical description serves as a bridge to describe its statistical properties.
The state of information reduction is shown below. The composition system is incomplete, but the prediction is included.

画像信号S(x,y) 部分系情報f(p,q) エネルギー情報
〜10^23個 色:(256)^3〜10^7個 〜2000個
テキスチャ:(±256)^3〜10^8個 〜2000個
構図:画素数〜10^7個 (〜2000個)
ここに、変数p,qは独立変数p1,p2,...,pi,...,q1,q2,...,qi,...から構成されているときでも、それらを代表する記号として用いる。
Image signal S (x, y) Sub system information f (p, q) Energy information ~ 10 ^ 23 colors: (256) ^ 3 ~ 10 ^ 7 ~ 2000
Texture: (± 256) ^ 3 ~ 10 ^ 8 ~ 2000
Composition: Number of pixels ~ 10 ^ 7 (~ 2000)
Here, the variables p and q are symbols that represent the independent variables p1, p2, ..., pi, ..., q1, q2, ..., qi, ... Used as

<量子統計の密度行列による記述>
力学的記述をするに当たり、画像信号S(x,y)に対して何が位置座標q、運動量pに対応するかの考察が必要になる。その前に、画像系と量子統計との関わりについて説明する。
感性は、未知のハミルトニアン系で、かつ統計集団がなす力学系を取り扱う。統計力学で知られているように、巨視的な系全体を記述する波動関数は存在し得ない(文献E1参照)。画像系も巨視的な系を記述している。
<Description of quantum statistics by density matrix>
In describing the dynamics, it is necessary to consider what corresponds to the position coordinate q and the momentum p with respect to the image signal S (x, y). Before that, the relationship between the image system and quantum statistics will be explained.
Sensitivity deals with unknown Hamiltonian systems and dynamical systems made up of statistical groups. As known in statistical mechanics, there cannot be a wave function that describes the entire macroscopic system (see reference E1). The image system also describes a macroscopic system.

系に関する不完全なデータの組に基づく量子力学的記述は、密度行列を使って行われる。密度行列を使って任意の物理量の期待値が計算できるようになる。座標に関する密度行列は
ρ(q,q')=Σm,n wm,nψm*(q')ψn(q)
で表される。ある画像のある側面に関する部分系は、波動関数ψで完全に記述される状態にあるとすると、波動関数ψは完全系を作る関数ψn(q)で展開できる。
ψ=Σn cnψn
これを密度行列の表式に代入すると、エネルギー表示における密度行列
cm*cn → wmn
を導くことができる。
A quantum mechanical description based on an incomplete set of data about a system is done using a density matrix. The expected value of any physical quantity can be calculated using the density matrix. The density matrix for coordinates is
ρ (q, q ') = Σ m, n w m, n ψ m * (q') ψ n (q)
It is represented by If a subsystem related to a certain aspect of an image is in a state completely described by a wave function ψ, the wave function ψ can be expanded by a function ψ n (q) that forms a complete system.
ψ = Σ n c n ψ n
Substituting this into the density matrix expression gives the density matrix in the energy display.
c m * c n → w mn
Can guide you.

エネルギー表示の密度行列の対角成分は定常状態を表す。一方の非対角成分は非定常状態を表す。画像はある瞬間のダイナミズムを捉えている。常に定常状態とは限らない。したがって、密度行列から導くエネルギー準位は非対角成分も考慮する必要がある。これは、非対角成分の記述は、密度行列を記述する波動関数の選び方に依存することを意味する。対角成分の定常状態ができるだけコンパクトに記述される波動関数系を選ぶのが、感性を記述する上で適切な選択である。統計物理学では、通常定常状態を考察の対象とするので、n番目の定常状態にある確率をwn=wnnと書く。 The diagonal component of the energy display density matrix represents a steady state. One off-diagonal component represents an unsteady state. The image captures the dynamism of a moment. It is not always steady state. Therefore, the energy levels derived from the density matrix must also take into account off-diagonal components. This means that the description of the off-diagonal component depends on how to select the wave function that describes the density matrix. Choosing a wave function system in which the steady state of the diagonal component is described as compactly as possible is an appropriate choice for describing sensitivity. In statistical physics, the steady state is usually considered, so the probability of being in the nth steady state is written as w n = w nn .

統計平均も定常状態による期待値を計算する。しかしながら、画像の感性は、定常状態にとどまらず、非定常状態も考察の対象とする必要がある。したがって、統計平均も定常状態と非定常状態の両方を考慮した期待値の計算が必要となる。   The statistical average also calculates the expected value in steady state. However, the sensitivity of the image is not limited to the steady state, and the non-steady state needs to be considered. Therefore, it is necessary to calculate the expected value in consideration of both the steady state and the unsteady state.

幾つもの画像群が同一の感性を与えるという、感性の曖昧性を扱うに当たり、感性の記述では全ての定常状態を対角和をとることによって定常状態を1つのエネルギー準位状態(E0)として扱い、また、非定常状態も同様に非対角成分同士の斜め和をとることによって、その定常状態から非定常状態へどれだけ離れた状態にあるかというエネルギー準位(En)によって記述する方法をとる。そのエネルギー準位への励起確率の統計分布をwn=w(En)で表す。物理的意味から、nの値が大きくなると画像系の中の運動の、より動的な状態、エネルギー遷移幅の大きい変化過程にある画像状態を記述しているといえる。この議論は、エネルギー行列を構築する過程においてもそのまま当てはめて定義を行う。
なお、エネルギーを定義してそれらの状態密度分布がρ(En)で表されたとすると、エネルギー準位への励起確率w(En)と合わせて、実際のエネルギーの確率分布はρ(En)w(En)で表される。
When dealing with the ambiguity of sensibility that several image groups give the same sensibility, in the description of sensibility, the steady state is defined as one energy level state (E 0 ) by taking the diagonal sum of all steady states. Similarly, the unsteady state is described by the energy level (E n ) of how far away from the steady state to the unsteady state by taking the diagonal sum of the non-diagonal components. Take the way. The statistical distribution of the excitation probability to the energy level is represented by w n = w (E n ). From a physical point of view, it can be said that as the value of n increases, it describes a more dynamic state of motion in the image system and an image state in a changing process with a large energy transition width. This argument is applied as it is in the process of building the energy matrix.
If energy is defined and their state density distribution is expressed by ρ (E n ), the actual energy probability distribution is ρ (E n ) along with the excitation probability w (E n ) to the energy level. n ) w (E n ).

[文献E]ランダウ、リフシッツ理論物理学教程第5巻「統計物理学第1部」(第3版、1976年)、第1章「統計の基礎原理」、第2章「熱力学的諸量」、及び第3章「ギブス分布」
[文献E1]ランダウ、リフシッツ理論物理学教程第5巻「統計物理学第1部」(第3版、1976年)、第1章「統計の基礎原理」、第5節「統計行列」
[2]分布関数と感性の関連性について
<部分系と分布関数>
感性の記述にあたり、部分系に対する統計分布を見つけ出すことが重要な課題となる。感性における座標と運動量の力学変数q,pは、力学で定義されるような唯一のものとは限らない。感性の部分系として、画像のある側面を射影して、画像の性質を記述するに当たり、かなり独立性の高い側面を捉えた系と位置づける。
[Literature E] Landau, Lifschitz Theoretical Physics, Vol. 5 "Statistical Physics Part 1" (3rd edition, 1976), Chapter 1 "Basic Principles of Statistics", Chapter 2 "Thermodynamic quantities" , And Chapter 3, “Gibbs Distribution”
[Literature E1] Landau, Lifschitz Theoretical Physics, Vol. 5, "Statistical Physics Part 1" (3rd edition, 1976), Chapter 1, "Basic Principles of Statistics", Section 5, "Statistics Matrix"
[2] Relationship between distribution function and Kansei <Subsystem and distribution function>
In describing sensitivity, finding an statistical distribution for a subsystem is an important issue. Coordinates and momentum dynamic variables q and p in sensitivity are not necessarily the only ones defined by dynamics. As a sensibility sub-system, we project a certain aspect of the image and describe the nature of the image as a system that captures the highly independent aspect.

その側面の大分類として、色とテキスチャと構図の3主軸が考えられる。ただし、同じ画像を元に射影しているので、完全に独立ではないが、画像の情報を規定するに当たり、これらの3つの側面の分布関数が規定されると、統計的性質はほぼ記述するに足る情報を備えることになる。   Three major axes of color, texture, and composition can be considered as a major classification of that aspect. However, since the projection is based on the same image, it is not completely independent. However, in defining the image information, if the distribution functions of these three aspects are defined, the statistical properties are almost described. You will have enough information.

ここでは、力学系の素朴な記述レベルにとどめ、更に高度な記述が必要となったときに、その完全独立でない記述法を考案する。これはある意味で、物理学の非相対論的な記述と相対論的な記述の関係に近い関係にある。すなわち、非相対論的記述では、位置座標系とスピン座標系は完全な独立系として記述されるが、相対論的記述ではその区別が不可能になり、位置座標とスピン座標が混合する座標系のスピノールによる記述に移行する必要があるという事情に相似しているためである。これらの部分系を各々記述した後に、統合することによって画像系の全体の感性を記述する。   Here, we will keep the simple description level of dynamical systems and devise a description method that is not completely independent when a more advanced description is required. In a sense, this is close to the relationship between a non-relativistic description of physics and a relativistic description. In other words, in the non-relativistic description, the position coordinate system and the spin coordinate system are described as completely independent systems, but in the relativistic description, the distinction is impossible, and the coordinate system in which the position coordinate and the spin coordinate are mixed. It is because it is similar to the situation that it is necessary to shift to the description by Spinor. After describing each of these subsystems, the overall sensitivity of the image system is described by integrating them.

<部分系の分布関数の記述と力学変数>
部分系毎に、力学変数である位置座標qと運動量pに対応する画像変数が異なって定義される。色は「零から正の有限値」の区間幅をもつ信号値の分布を表し、原信号そのものの分布を記述するから、その記述に適した線形微分方程式を満足する関数は、超幾何関数に含まれる何れかの関数である。テキスチャはエッジ成分を抽出した「負の有限値から正の有限値」の区間幅をもつ信号値の分布を表し、原信号の情報を1つ落とした別の側面の分布を記述するから、その記述に適した線形微分方程式を満足する関数は、合流型超幾何関数に含まれる何れかの関数である。構図は「零から正の有限値」の区間幅をもつ2次元的な信号値の分布を表し、原信号そのものの分布を記述するから、その記述に適した線形微分方程式を満足する関数は、超幾何関数に含まれる何れかの関数である。
<Description of distribution function and dynamic variables of subsystem>
The image variables corresponding to the position coordinates q and the momentum p, which are mechanical variables, are defined differently for each sub-system. The color represents the distribution of signal values with an interval width of "zero to positive finite value" and describes the distribution of the original signal itself. Therefore, a function that satisfies the linear differential equation suitable for the description is a hypergeometric function. Any function included. The texture represents the distribution of the signal value with the interval width from “negative finite value to positive finite value” from which the edge component is extracted, and describes the distribution of another aspect from which the original signal information is dropped. The function satisfying the linear differential equation suitable for description is any function included in the confluent hypergeometric function. Since the composition represents a two-dimensional distribution of signal values with an interval width of “zero to positive finite value” and describes the distribution of the original signal itself, the function satisfying the linear differential equation suitable for the description is Any function included in the hypergeometric function.

超幾何関数と合流型超幾何関数で記述される系は、側面の違う部分系を捉えていると考えることができる。すなわち、3つの特異点をもつ微分方程式で表される超幾何関数は、画像の信号値そのものの分布を表すのに適しており、分布関数の引数に来る画像信号として、画素値のように零以上の値で構成される画像信号が均質に分布しうる性質の記述に適している。一方、その内の2つの特異点を1つに合流させて合計2つの特異点をもつ微分方程式で表される合流型超幾何関数は、画像の信号値に関する情報量を1つ減らした側面を記述するのに適しており、分布関数の引数に来る画像信号として、微分操作によって1つの情報が落とされたエッジ信号値のように正と負の値にまたがる画像信号が零付近に局在化する性質の記述に適している。   It can be considered that the system described by the hypergeometric function and the confluent hypergeometric function captures subsystems with different aspects. That is, the hypergeometric function represented by a differential equation having three singular points is suitable for representing the distribution of the signal value of the image itself, and the image signal that comes to the argument of the distribution function is zero as the pixel value. It is suitable for describing the property that an image signal composed of the above values can be uniformly distributed. On the other hand, the confluent hypergeometric function expressed by a differential equation having two singularities in total by merging the two singularities into one has the aspect of reducing the amount of information about the signal value of the image by one. Suitable for description, as an image signal that comes to the argument of the distribution function, an image signal that spans positive and negative values, such as an edge signal value from which one piece of information has been dropped by differentiation, is localized near zero. Suitable for describing properties to be

<力学変数の変数分離の描像>
画像の部分系の側面を、物理学の物体粒子の記述における変数分離した座標系に対応させた描像を描いて記述する。色の一次元分布関数の記述に適した超幾何関数は、チェビシェフ関数であり、この関数は偶関数と奇関数の一重級数で完全系をなすため、偶関数を角運動量0、奇関数を角運動量1と捉えると、光と同じボーズ粒子であるスピン1のスピン座標を記述していると考えることができる。したがって、色の一次元分布関数は、波動関数のうちスピン系の波動関数を記述していると考えることができる。
<Image of variable separation of mechanical variables>
Describe the side of the image sub-system by drawing a picture corresponding to the coordinate system with variable separation in the description of physical particles. The hypergeometric function suitable for describing the one-dimensional color distribution function is the Chebyshev function. Since this function forms a complete system with a single series of even and odd functions, the even function is angular momentum 0 and the odd function is angular. If it is regarded as momentum 1, it can be considered that the spin coordinates of spin 1, which is the same Bose particle as light, are described. Therefore, it can be considered that the one-dimensional distribution function of color describes a wave function of a spin system among the wave functions.

テキスチャの一次元分布関数の記述に適した合流型超幾何関数は、球ベッセル関数である。通常正の領域で定義される動径方向の波動関数の中でも、球ベッセル関数はベッセル関数のうち唯一負の領域に拡張定義できる関数である。したがって、テキスチャの一次元分布関数は、波動関数のうち動径方向の波動関数を記述していると捉えることができる。動径方向の波動関数は、偶関数と奇関数の次数と根に関する2つの級数の二重級数で記述することができるから、小さい方から角運動量0、1、2、3、...と割り当てることができ、それらは原子軌道ではs、p、d、f、...軌道と呼ばれているものに対応づけることができる。   A confluent hypergeometric function suitable for describing a one-dimensional distribution function of a texture is a spherical Bessel function. Of the radial wave functions normally defined in the positive region, the spherical Bessel function is the only function that can be expanded and defined in the negative region of the Bessel function. Therefore, it can be understood that the one-dimensional distribution function of the texture describes the radial wave function among the wave functions. Since the radial wavefunction can be described by a double series of two series related to the order and root of the even and odd functions, the angular momentum 0, 1, 2, 3, ... They can be mapped to what are called s, p, d, f, ... orbitals in atomic orbitals.

構図の2次元分布関数の記述に適した超幾何関数は、ルジャンドル陪関数、ないしはそれとのフーリエ関数との合成積である球面調和関数が該当すると考えられる。したがって、構図の2次元分布関数は、球面座標表示における天頂角と方位角の2次元系座標に対応した波動関数を記述していると考えることができる。   The hypergeometric function suitable for describing the two-dimensional distribution function of the composition is considered to be a Legendre power function or a spherical harmonic function that is a product of a Fourier function with the Legendre function. Therefore, it can be considered that the two-dimensional distribution function of the composition describes a wave function corresponding to the two-dimensional system coordinates of the zenith angle and the azimuth in the spherical coordinate display.

<観測データの組と分布関数>
画像情報のある側面は、分布関数f(p,q)によって記述される。画像情報として観測されるデータと分布関数との間の関係を、次のように位置づける。すなわち、色:ヒストグラムをとって画素位置に関する情報を消失した分布関数、テキスチャ:エッジの側面のヒストグラムをとって画素位置に関する情報を消失した分布関数、構図:領域平均をとって画素数、すなわち画素位置に関する情報を減らした分布関数のように位置づける。この3つの分布関数を併せると、ほぼ画像S(x,y)というものの統計的性質を正確に反映する。印象の異なる別の画像が同値表現される確率は低い。ここに、画素位置と述べたものは力学変数p,qの位置座標qに対応するものとは一概には言えない。その対応関係を色とテキスチャについて、それぞれ2つずつの空間が定義できることを以下に述べる。
<Observation data set and distribution function>
Certain aspects of the image information are described by the distribution function f (p, q). The relationship between the data observed as image information and the distribution function is positioned as follows. That is, color: a distribution function in which information on pixel positions is lost by taking a histogram, texture: a distribution function in which information on pixel positions is lost by taking a histogram on the side of an edge, and composition: the number of pixels by taking a region average, that is, pixels Position like a distribution function with reduced information about position. Together, these three distribution functions accurately reflect the statistical nature of the image S (x, y). There is a low probability that another image with a different impression will be represented in the same value. Here, what is described as a pixel position cannot be generally said to correspond to the position coordinate q of the dynamic variables p and q. It will be described below that two spaces can be defined for each color and texture.

<座標空間と運動量空間>
(A)低次空間の側面
(A-1)色
マンセル色空間は色の強度分布を表す運動量空間とみなすことができる。
色ヒストグラム = f1(p)
(A-2)テキスチャ
多重解像度エッジ統合したエッジ画像のHVC各色面の色空間は、エッジの強度分布を表す運動量空間とみなすことができる。
テキスチャPDF = f3(p)
(B)高次空間の側面
(B-1)色
色ヒストグラムをチェビシェフ変換した場合、元の色ヒストグラム側を位置座標q、チェビシェフ展開係数側を運動量pとみなすことができる。高次運動量空間に投影した分布関数としては確率密度を表す必要があり、負の値をとらないので、展開係数側は係数を自乗したパワースペクトルをとる。
色ヒストグラム = f2(q) = f1(p)
チェビシェフ・スペクトル = f2(p)
(B-2)テキスチャ
テキスチャPDFを球ベッセル変換した場合、元のPDF側を位置座標q、球ベッセル展開係数側を運動量pとみなすことができる。同じく高次運動量空間の分布関数としては、パワースペクトルをとる。
テキスチャPDF = f4(q) = f3(p)
球ベッセル・スペクトル = f4(p)
図14は、これらの間の関係を分かりやすくするための概念図である。後に定義する各部分系のエントロピーの計算には、これらの分布関数を用いる。なお、エネルギー構築で2次形式を作る際に、通常のデカルト座標(x,y,z)における運動エネルギーの記述((px^2+py^2+pz^2)/(2m))とは違って、それに対応する色面内の相関の他に、色面間でも相関の要素を作って評価することに意味があるのは、マンセルHVCが完全に独立な成分ではないという事情が働いている。ただし、マンセルHVC色空間は心理量に対して等歩度になる均等色空間に設計されているので、各々の2次項の間の係数は伴わずに済む。
<Coordinate space and momentum space>
(A) Side surface of low-order space
(A-1) Color Munsell color space can be regarded as a momentum space representing the intensity distribution of colors.
Color histogram = f 1 (p)
(A-2) Texture The color space of each color plane of the HVC of the edge image obtained by integrating the multi-resolution edges can be regarded as a momentum space representing the edge intensity distribution.
Texture PDF = f 3 (p)
(B) Side of higher space
(B-1) Color When the color histogram is subjected to Chebyshev transformation, the original color histogram side can be regarded as the position coordinate q, and the Chebyshev expansion coefficient side can be regarded as the momentum p. The distribution function projected onto the higher-order momentum space needs to represent the probability density and does not take a negative value, so the expansion coefficient side takes a power spectrum obtained by squaring the coefficient.
Color histogram = f 2 (q) = f 1 (p)
Chebyshev spectrum = f 2 (p)
(B-2) Texture When texture PDF is transformed into a spherical Bessel, the original PDF side can be regarded as position coordinate q, and the spherical Bessel expansion coefficient side can be regarded as momentum p. Similarly, a power spectrum is taken as a distribution function of the higher-order momentum space.
Texture PDF = f 4 (q) = f 3 (p)
Spherical Bessel spectrum = f 4 (p)
FIG. 14 is a conceptual diagram for easy understanding of the relationship between them. These distribution functions are used to calculate the entropy of each subsystem defined later. When creating a quadratic form in energy construction, the description of kinetic energy in the usual Cartesian coordinates (x, y, z) ((p x ^ 2 + p y ^ 2 + p z ^ 2) / (2m) In contrast to the correlation within the corresponding color plane, it is meaningful to create and evaluate correlation elements between color planes, because Munsell HVC is not a completely independent component. Is working. However, since the Munsell HVC color space is designed as a uniform color space having an equal rate with respect to the psychological quantity, there is no need for a coefficient between each quadratic term.

<統計平均に関する2つの意味>
画像系の統計的性質を導くための統計平均には2つの意味がある。すなわち、色、テキスチャ、構図の膨大な情報量が統計平均によって巨視的な物理量に縮約される点が1つである。また、多数のモデル画像群が共通の感性をなす意味において、画像群平均をとることによって、確定値を得る点がもう1つである。
<Two meanings regarding statistical average>
The statistical average for deriving the statistical properties of the image system has two meanings. That is, one point is that a huge amount of information on color, texture, and composition is reduced to a macroscopic physical quantity by a statistical average. Another point is that a definite value is obtained by taking an average of image groups in the sense that a large number of model image groups have a common sensitivity.

前者は微視的な物理量から巨視的な物理量への変換過程に伴う、量子力学的な平均操作と統計的な平均操作を同時に含むものである。後者は巨視的な物理量のゆらぎの平均値に相当する量を決めて統計的性質を確定するための、統計的な平均操作を主に含むものと位置づけられる。したがって、前者は視覚系を通して脳に対して巨視的な働きかけを行う信号を作り、後者は人が受けた感覚の脳内の働きの分布の平均的要素を知る役割を担う。   The former includes a quantum mechanical average operation and a statistical average operation at the same time, accompanied by a conversion process from a microscopic physical quantity to a macroscopic physical quantity. The latter is mainly regarded as including a statistical averaging operation for determining a statistical property by determining an amount corresponding to an average value of fluctuations of a macroscopic physical quantity. Therefore, the former makes a signal that makes a macroscopic action on the brain through the visual system, and the latter plays a role of knowing the average element of the distribution of actions in the brain of the sensation received by a person.

[3]感性の記述とギブス分布
<画像群がなすエネルギーのゆらぎ>
多数画像群の共通感性の統計的性質を見いだす方法は、統計物理学のギブス分布(カノニカル分布)に対応する。すなわち、エネルギーのゆらぎを考慮した系の記述法である。一方、一枚画像の統計的性質を記述する方法は、ミクロカノニカル分布に対応する。これは、エネルギーのゆらぎを無視した系の記述法である。
[3] Description of sensibility and Gibbs distribution <Fluctuation of energy created by images>
The method of finding the statistical properties of the common sensibility of a large number of images corresponds to the Gibbs distribution (canonical distribution) of statistical physics. In other words, it is a system description method that takes into account energy fluctuations. On the other hand, the method for describing the statistical properties of a single image corresponds to the microcanonical distribution. This is a system description method that ignores fluctuations in energy.

閉じた系(一枚画像)の運動量と角運動量はその系全体としての一様な並進運動と一様な回転運動に関係する。系の統計的性質を記述することにはならない。しかし、他の画像がもつ一様な並進運動と回転運動と区別する意味では意味を持つ。すなわち、一枚画像の閉じた系の並進運動と回転運動が静止する座標系をとれば、一枚画像の統計的性質を決定するのはエネルギーのみになるが、他の画像と共通の座標系で記述するとき、それらの画像群とは運動量と角運動量も異なっているので、それらが異なる画像と認識される。ただし、多数画像に共通の巨視的性質、すなわち、感性を記述するときには、運動量と角運動量は画像群の統計平均をとる量が増えると平均零あるいは定数値へと消滅する情報である。   The momentum and angular momentum of a closed system (single image) are related to uniform translational motion and uniform rotational motion of the entire system. It does not describe the statistical properties of the system. However, it is meaningful in the sense to distinguish it from the uniform translational motion and rotational motion of other images. That is, if a coordinate system in which the translational and rotational motions of a closed system of a single image are stationary is taken, only the energy determines the statistical properties of the single image, but the coordinate system common to other images Since the momentum and the angular momentum are different from those of the image group, they are recognized as different images. However, when describing the macroscopic properties common to many images, that is, sensibility, the momentum and angular momentum are information that disappears to zero or a constant value when the statistical average of the image group increases.

<感性の曖昧性の記述と位相空間>
図15は、位相空間における感性群を示す描像図である。感性の記述は曖昧性を如何に定量的に記述するかという問題でもある。その統計物理学的な記述法の描像として、分布関数が一定の条件を満たす位相空間の軌跡が、同じ感性を呼び起こす状態分布を記述すると考える。一定の条件とは、力学的不変量であるエネルギーが一定値に拘束された条件を満たす位相空間上の軌道を表す。感性の曖昧性は、画像としては分布関数は様々な状態をとりうるが、それらが何れも同じ位相空間上のぼやけた範囲の軌跡上にある集合体として記述する。すなわち、分布関数から導かれる1つ1つのエネルギー要素が同じでなくても、それらの総和が同じ条件を満たしていれば、同じ感性を呼び起こすと考える。また、エネルギーのゆらぎをもつので、位相空間上では一定の幅をもったトラジェクトリーが同一の感性群に該当すると考える。その様子が図15では太線で広がるようにして描かれている。
<Description of sensitivity ambiguity and phase space>
FIG. 15 is a pictorial diagram showing the sensitivity group in the phase space. Sensitivity description is also a question of how to describe ambiguity quantitatively. As a picture of the statistical physics description method, the locus of the phase space where the distribution function satisfies a certain condition describes the state distribution that evokes the same sensitivity. The constant condition represents a trajectory on the phase space that satisfies a condition in which energy, which is a mechanical invariant, is constrained to a constant value. The ambiguity of sensibility is described as a collection in which the distribution function can take various states as an image, but they are all on the locus of a blurred range in the same phase space. That is, even if the energy elements derived from the distribution function are not the same, if the sum of the energy elements satisfies the same condition, the same sensitivity is evoked. Moreover, since it has energy fluctuations, it is considered that trajectories having a certain width in the phase space correspond to the same sensitivity group. In FIG. 15, the state is drawn so as to be widened with a thick line.

一般に分布関数の対数は、力学的不変量である運動の積分であり、相加的な運動の積分で記述される。すなわち、ある部分系の分布関数と別の部分系の分布関数が同時にその状態をとる確率を表す合成系の分布関数は部分系の分布関数の積で表され、その対数は相加的な性質を持つからである。そのような相加的な運動の積分は、力学で知られているように、エネルギーと運動量と角運動量のみが対応する。従って、分布関数の対数は、定数項αとそれらの各々にかかる定係数β、γ、δの一次結合によって記述されうる(文献E2=文献A3参照)。   In general, the logarithm of a distribution function is an integral of motion, which is a mechanical invariant, and is described by an integral of additive motion. In other words, the distribution function of a composite system, which represents the probability that the distribution function of one subsystem and the distribution function of another subsystem simultaneously take that state, is represented by the product of the distribution functions of the subsystem, and its logarithm is an additive property. Because it has. Such additive integration of motion corresponds only to energy, momentum and angular momentum, as is known in mechanics. Accordingly, the logarithm of the distribution function can be described by a constant term α and a linear combination of the constant coefficients β, γ, and δ applied to each of them (see document E2 = document A3).

[文献E2]ランダウ、リフシッツ理論物理学教程第5巻「統計物理学第1部」(第3版、1976年)、第1章「統計の基礎原理」、第4節「エネルギーの役割」
<少数モデルの位相空間軌道>
同一の感性を呼び起こす画像群の母集団画像が統計的に十分多い場合は、拘束条件はエネルギーのみとなる。これは、統計的性質の記述にはエネルギーだけが唯一相加的な運動の積分として残ることに由来する(文献E2=文献A3参照)。
[Literature E2] Landau, Lifshitz Theory of Physics, Vol. 5, "Statistical Physics Part 1" (3rd edition, 1976), Chapter 1, "Basic Principles of Statistics", Section 4, "Role of Energy"
<Phase space orbit of a small number of models>
When the population image of the image group that evokes the same sensitivity is statistically sufficiently large, the constraint condition is only energy. This comes from the fact that only the energy remains as an integral of the additive motion in the description of the statistical properties (see document E2 = document A3).

しかしながら、それらが少数の場合は、対応する感性の印象としては、それらの少数のモデルの細かな分布状態にも合致するような更に強い拘束条件が必要となる。そのための付加的拘束条件として役割を果たすのが、他の力学的不変量である運動量と角運動量であり、エネルギーに加えて運動量と角運動量もそれぞれが一定を満たす位相空間上の軌跡が、それら少数モデル画像に共通する感性作用を及ぼす分布範囲となる。少数モデルの極限として、一枚画像の類似画像検索が該当することになる。   However, in the case of a small number of them, the corresponding impression of sensibility requires a stronger constraint that matches the fine distribution of the few models. The momentum and angular momentum, which are other mechanical invariants, play a role as additional constraints for that purpose, and in addition to energy, the trajectories on the phase space satisfying the constant momentum and angular momentum respectively. The distribution range exerts a sensibility effect common to a small number of model images. As a limit of the minority model, a similar image search of a single image is applicable.

<運動量表示と不確定性原理>
図16は、画像系の色とテキスチャに関する高次空間への投影で、位置と運動量の間の関係が不確定性原理を満たしている状況を説明する図である。すなわち、図16に例示したテキスチャPDFの場合のように、位置に関して鋭いピークが立って位置座標の確定精度が高いと、その波形を球ベッセル・フーリエ変換した運動量空間で実現しようとすると、あらゆる周波数を広く多く重ね合わせなければ達成できないため、運動量は不確定になり非常に広がった分布となる。一方、図16に例示した色ヒストグラムの場合のように、運動量空間であるチェビシェフ・フーリエ・スペクトルが極めて集中して表現されている場合、それを実空間表現すると、ある周波数の波が、この場合は低周波の波が全空間に渡って広がっている分布を表すことになる。したがって、位置が不確定となり、その広がり幅は大きい。すなわち、画像系においても周波数解析を行おうとすると、実空間において十分な区間幅の波形を見ない限り、そこに含まれる周波数成分は特定し得なくなる事実を記述した関係であると言い換えることができる。
<Momentum display and uncertainty principle>
FIG. 16 is a diagram for explaining a situation where the relationship between the position and the momentum satisfies the uncertainty principle in the projection onto the higher-order space regarding the color and texture of the image system. That is, as in the case of the texture PDF illustrated in FIG. 16, when a sharp peak is raised with respect to the position and the accuracy of position coordinates is high, any frequency can be obtained by trying to realize the waveform in a momentum space obtained by spherical Bessel-Fourier transform. Since it cannot be achieved without overlapping a large number of momentums, the momentum becomes uncertain and has a very wide distribution. On the other hand, when the Chebyshev Fourier spectrum, which is a momentum space, is expressed in a highly concentrated manner as in the case of the color histogram illustrated in FIG. 16, if it is expressed in real space, a wave of a certain frequency is generated in this case. Represents a distribution of low-frequency waves spread throughout the entire space. Therefore, the position becomes uncertain and the spread width is large. In other words, if frequency analysis is also performed in an image system, it can be rephrased as a relationship that describes the fact that the frequency components contained therein cannot be specified unless a waveform with a sufficient interval width is seen in real space. .

このような位置と運動量との間の拡張されたフーリエ変換の概念を通して、位置における波束と運動量における波束がそれぞれ一定幅以上に同時に実現することができないという不確定性関係は、量子力学において論じられている不確定性の原理に他ならない。量子力学におけるこの原理の説明は、例えば文献F1においてなされている。   Through such an extended Fourier transform concept between position and momentum, the uncertainty relation that the wave packet at the position and the wave packet at the momentum cannot be realized simultaneously beyond a certain width is discussed in quantum mechanics. This is nothing but the principle of uncertainty. An explanation of this principle in quantum mechanics is given, for example, in document F1.

プランク定数hの値は、画像系では、階調方向の量子化に関しては階調幅を規定するヒストグラムのビンが、空間方向の量子化に関しては画素間隔を規定する1画素という概念が関係している。したがって、画像系の階調数を減らしたり、縮小画像を生成したりするとプランク定数の値はその系の量子化の仕方に合わせて変更する必要があり、考察対象の状況によって変わる。この点は、物理定数のように部分系に関わらず、全系で一定として扱える状況とは異なる。しかし、画像系におけるプランク定数は、ある側面を投影した、量子化幅の規定された部分系においては固定値として扱える。   In the image system, the value of the plank constant h is related to the concept of a histogram bin that defines the gradation width with respect to quantization in the gradation direction and one pixel that defines the pixel interval with respect to quantization in the spatial direction. . Therefore, when the number of gradations of an image system is reduced or a reduced image is generated, the Planck constant value needs to be changed according to the quantization method of the system, and changes depending on the situation to be considered. This is different from the situation where the entire system can be treated as a constant regardless of the subsystem, such as physical constants. However, the Planck's constant in the image system can be treated as a fixed value in a sub-system in which a certain width is projected and the quantization width is defined.

[文献F1] Landau and Lifshitz, Course of Theoretical Physics, Volume 3 "Quantum Mechanics (Non-Relativistic Theory)," (Third revised edition, 1977), Chapter 2 "Energy and Momentum," Section 16 "Uncertainty relations."
<位相空間と量子統計>
統計物理学の基礎的概念である位相空間上の軌跡は、量子力学的対応として状態数の概念を導入することが可能となり、画像から観測される物理量の状態数、あるいはそれらを規格化して密度表現した状態密度によって、画像感性の定量化が可能となる。
[Reference F1] Landau and Lifshitz, Course of Theoretical Physics, Volume 3 "Quantum Mechanics (Non-Relativistic Theory)," (Third revised edition, 1977), Chapter 2 "Energy and Momentum," Section 16 "Uncertainty relations."
<Phase space and quantum statistics>
The trajectory in the phase space, which is a basic concept of statistical physics, allows the introduction of the concept of the number of states as a quantum mechanical correspondence. Image sensitivity can be quantified by the expressed density of states.

量子論的に位相空間上で、プランク定数で運動量と座標の両者の不確定量の数を割った量子状態数が定義できるようになると、巨視的な性質としてその対数で表される相加的な物理量であるエントロピーという概念が必然的に統計的に現れる。このエントロピーの概念を通して、巨視的体系のエネルギースペクトルの準位密度を決定することが、統計物理学的に理論的基礎づけされており、粒子数(ここでは画像系では画素数や階調数が対応)の増大に伴って準位間隔が指数関数的に減少し、連続的なエネルギーバンド構造になることが説明できる(文献E3参照)。   When the number of quantum states divided by the Planck constant divided by the number of uncertainties in both momentum and coordinates can be defined on the phase space in terms of quantum theory, the additive property represented by the logarithm as its macroscopic property The concept of entropy, which is a complex physical quantity, inevitably appears statistically. Through this concept of entropy, the determination of the density density of the energy spectrum of a macroscopic system is based on statistical physics, and the number of particles (here, the number of pixels and the number of gradations in an image system) It can be explained that the level interval decreases exponentially as the response increases, resulting in a continuous energy band structure (see document E3).

実際に実験によって連続的なエネルギー準位Enを算出した結果は、隣り合うエネルギー準位との間ではほとんど似通った性質を示すエネルギー要素に関する画像整列が見られるが、その中でもある性質の画像についてはエネルギー要素の分布内で遠距離に及ぶ順序の入れ替えが始まっており、エネルギー準位を端から端まで順にこの性質の様子を見て行くと、高エネルギー準位では低エネルギー準位とは全く異なる性質の画像整列が得られる。これはエネルギー準位密度が高密度化して、準位間の状態の区別がつかないエネルギーバンド構造の性質そのものを表している。なお、エントロピーとプランク定数との関係で結ばれるボルツマン定数に関しても、ある側面を投影した部分系においては固定値として扱えるが、異なる部分系の間では一般に定義は異なってくる。 As a result of actually calculating the continuous energy level E n by experiment, there is an image alignment for energy elements that show almost similar properties between adjacent energy levels. In the distribution of energy elements, the change of order over long distances has begun, and when looking at the state of this property in order from end to end, the high energy level is completely different from the low energy level. Image alignment with different properties is obtained. This represents the nature of the energy band structure itself in which the energy level density is increased and the state between levels cannot be distinguished. Note that the Boltzmann constant connected by the relationship between the entropy and the Planck constant can also be treated as a fixed value in a partial system on which a certain side surface is projected, but in general, the definition differs between different subsystems.

[文献E3]ランダウ、リフシッツ理論物理学教程第5巻「統計物理学第1部」(第3版、1976年)、第1章「統計の基礎原理」、第7節「エントロピー」
<統計集団とエネルギー準位のバンド構造>
巨視的物体(ここでは画像)のエネルギー固有値のスペクトルにおける準位分布の異常な緻密さに帰着する(文献E1参照)。よって、画像系はエネルギーバンドの構造という形に情報集約される。
[Literature E3] Landau, Lifschitz Theoretical Physics, Vol. 5, "Statistical Physics Part 1" (3rd edition, 1976), Chapter 1, "Basic Principles of Statistics", Section 7, "Entropy"
<Band structure of statistical group and energy level>
This results in an unusually dense level distribution in the spectrum of the energy eigenvalue of a macroscopic object (here, an image) (see reference E1). Therefore, information is gathered in the form of an energy band structure in the image system.

ここで、物性と感性の理論構造の類似性について説明する。
純鉄と鉄の合金との性質の違いは、電子のエネルギーバンド構造の違いとして表現される(文献G1、G2、G3参照)。あるいは、強磁性体の鉄、ニッケル、コバルトの性質の違いがどのようにして生まれるのかは、電子構造を解明することによって記述することができる。また更に常磁性金属と強磁性金属の違い、あるいは常磁性金属のアルミニウムや銅などの性質の違いについても同様である。そして、物質の種類は、単体としては118種類の元素、それらの化合物、及び合金などからなり、数としては数千から一万個のオーダーで存在する。例えば、118個の元素の中から2〜3個の元素の組み合わせ方の数を計算するとこのオーダーの数字になる。元素の数とその性質の根底を規定しているのが、原子軌道として存在しうる動径方向の波動関数s,p,d,f軌道とそれらの状態の縮退数である。
Here, the similarity between the theoretical structure of physical properties and sensitivity will be described.
Differences in properties between pure iron and iron alloys are expressed as differences in the energy band structure of electrons (see references G1, G2, and G3). Alternatively, how the differences in properties of ferromagnetic iron, nickel, and cobalt are born can be described by elucidating the electronic structure. The same applies to the difference between paramagnetic metal and ferromagnetic metal, or the difference in properties of paramagnetic metal such as aluminum and copper. The kind of substance is composed of 118 kinds of elements, their compounds, alloys, etc. as a simple substance, and exists in the order of thousands to 10,000. For example, if the number of combinations of 2 to 3 elements out of 118 elements is calculated, this number is obtained. The number of elements and the basis of their properties are defined by the radial wave functions s, p, d, f orbits that can exist as atomic orbitals and the degenerate numbers of those states.

同様に、感性形容詞も日本語の色感情を表す言葉として473語が代表的に存在し、それらの言葉で区別し得ないが、わずかに違うと心の中で感じる区別は、同様に数千から一万のオーダーで存在すると考えられる。この代表的473語の言葉の意味は、常にそれぞれが明確に違っているというものではなく、微妙な違いを表す表現も多く存在している。例えば、「賑やかな」に対しては「賑々しい」や「華やかな」、「華々しい」といった違う表現が存在する。一方、「爽やかな」と「賑やかな」という大分類の観点でかなり違う形容詞群も存在している。このように形容詞には大分類と微細分類の2面性が存在している。   Similarly, there are typically 473 sensual adjectives that represent Japanese color emotions, which cannot be distinguished by those words. It is thought that it exists in the order of 10,000. The meanings of these representative 473 words are not always clearly different, and there are many expressions that express subtle differences. For example, there are different expressions for “lively” such as “lively”, “gorgeous”, and “brilliant”. On the other hand, there are adjective groups that are quite different from the viewpoint of the broad classification of “fresh” and “lively”. In this way, there are two types of adjectives: major classification and fine classification.

このような2面性の性質は、物質の性質にも存在し、例えば元素の周期表でみれば、縦軸方向には上の方が、動径方向の波動関数がs軌道、p軌道と順に詰まった軽い電子系で、中間地帯はd軌道が詰まった遷移金属系、下の方はf軌道が詰まった重い電子系で、横軸方向にはそれらの軌道の電子の縮退数が1つずつ違うものが並ぶ。物質的な性質としては、縦方向に同列に存在する元素は化学的に極めて似た性質を示し、横方向に隣接して存在する場合も近い性質を示す。これらは、物質が固体としてアボガドロ数(〜10^23)に及ぶ大集団として凝集するとき、統計的にエネルギーバンド構造をとり、それらの状態密度分布の違いとして、大きな性質の違いも小さな性質の違いも表現しうる。
したがって、感性もこのようなエネルギーバンドモデルで記述されることが最適な表現方法となる。なお、形容詞の2面性を位相空間上で表現すると、大分類で異なっている感性は、大きく軌跡が異なっているもの同士の状態分布の違い、微細分類でのみ異なっている感性は軌跡がかなり近いもの同士の状態分布の違いを表現しているものと考えられる。
Such dihedral properties also exist in the properties of materials. For example, in the periodic table of elements, the vertical wave function is higher in the vertical direction, and the radial wave function is the s orbit and p orbit. Light electron systems packed in sequence, the intermediate zone is a transition metal system packed with d orbitals, the lower is a heavy electron system packed with f orbitals, and the horizontal axis shows one degenerate number of electrons in those orbitals. Different things are lined up. In terms of material properties, elements present in the same row in the vertical direction exhibit chemically very similar properties, and exhibit similar properties when present adjacent in the horizontal direction. These are statistically energy band structures when substances are aggregated as a large population that spans the Avogadro number (up to 10 ^ 23) as solids. Differences can also be expressed.
Therefore, it is an optimal expression method that the sensitivity is described by such an energy band model. In addition, when expressing the two-sidedness of adjectives in the phase space, the sensibilities that are different in the large classification are different in the state distribution between those that are greatly different in the trajectory, and the sensitivities that are different only in the fine classification have a considerable trajectory It is thought that it expresses the difference in the state distribution between close ones.

[文献G1]Masako Akai, Hisazumi Akai and Junjiro Kanamori, "Electronic Structure of Impurities in Ferromagnetic Iron. I. s, p Valence Impurities," Journal of Physical Society of Japan, Vol.54, No.11, November, 1985, pp.4246-4256.
[文献G2]Masako Akai, Hisazumi Akai and Junjiro Kanamori, "Electronic Structure of Impurities in Ferromagnetic Iron. II. 3d and 4d Impurities," Journal of Physical Society of Japan, Vol.54, No.11, November, 1985, pp.4257-4264.
[文献G3]Masako Akai, Hisazumi Akai and Junjiro Kanamori, "Electronic Structure of Impurities in Ferromagnetic Iron. III. Light Interstitials," Journal of Physical Society of Japan, Vol.56, No.3, November, 1987, pp.1064-1077.
[4]巨視的物理量の記述
<エネルギー準位の描像モデル>
部分系への射影によって定義されるそれぞれの部分空間における運動量と位置の定義に基づいて、エネルギーを定義することができる。また、他の力学的不変量である角運動量も定義できる。エネルギーの構築方法として、低次の部分空間への射影の場合と高次の部分空間への射影の場合の2通りを各感性主軸について導入する。低次の部分空間への射影の場合は、エネルギーのモデルハミルトニアンを提案する方法をとる。一方の高次の部分空間への射影の場合は、エネルギー行列を構築し、定常状態から非定常状態に至るエネルギー固有値を定義する方法をとる。
[Reference G1] Masako Akai, Hisazumi Akai and Junjiro Kanamori, "Electronic Structure of Impurities in Ferromagnetic Iron.I.s, p Valence Impurities," Journal of Physical Society of Japan, Vol.54, No.11, November, 1985, pp.4246-4256.
[Reference G2] Masako Akai, Hisazumi Akai and Junjiro Kanamori, "Electronic Structure of Impurities in Ferromagnetic Iron. II. 3d and 4d Impurities," Journal of Physical Society of Japan, Vol.54, No.11, November, 1985, pp .4257-4264.
[Publication G3] Masako Akai, Hisazumi Akai and Junjiro Kanamori, "Electronic Structure of Impurities in Ferromagnetic Iron. III. Light Interstitials," Journal of Physical Society of Japan, Vol.56, No.3, November, 1987, pp.1064 -1077.
[4] Description of macroscopic physical quantity <Image level imaging model>
Energy can be defined based on the definition of momentum and position in each subspace defined by projection onto the subsystem. Also, angular momentum, which is another mechanical invariant, can be defined. As energy building methods, two methods are introduced for each sensitivity principal axis: projection into a lower-order subspace and projection into a higher-order subspace. In the case of projection onto a lower-order subspace, a method is proposed in which a model Hamiltonian of energy is proposed. In the case of projection onto one higher-order subspace, an energy matrix is constructed and an energy eigenvalue from a steady state to an unsteady state is defined.

低次の部分空間におけるエネルギー準位は、統計物理学の平均場近似によって作られる場のエネルギーを離散的なエネルギー準位と捉える。すなわち、離散的なスカラー不変量を構築する。高次の部分空間におけるエネルギー準位は、エネルギー行列の対角成分の定常状態から非対角成分の非定常状態へと徐々に離していく過程を、連続的なエネルギー準位と捉える。すなわち、連続的なベクトル不変量を構築する。   The energy levels in the lower-order subspaces take the field energy created by the mean field approximation of statistical physics as discrete energy levels. That is, construct a discrete scalar invariant. The energy level in the higher-order subspace is considered as a continuous energy level in the process of gradually separating from the stationary state of the diagonal component of the energy matrix to the unsteady state of the non-diagonal component. That is, construct a continuous vector invariant.

<色の低次不変量>
マンセルH,V,Cの値そのものが運動量を表していると考える。
モデル・ハミルトニアンを次のように構築する。
H=(H+V+C)^2
これは色の値の強度を表す運動エネルギーを表している。あるいは場のエネルギーを表している。
方程式
Hlψn>=Enlψn>
に対し、エネルギー固有値Enを求める。
エネルギー固有値の算出にあたり、統計物理学の平均場近似を用いる。
各運動量を平均項とゆらぎ項に分けて、ゆらぎ項も平均的なゆらぎ幅によって記述する。すなわち、ゆらぎ項として標準偏差をとり、平均値と同じ運動量pの次元を持つようにする。
√<(H-<H>)^2> 〜= σH
√<(V-<V>)^2> 〜= σV
√<(C-<C>)^2> 〜= σC
これらの運動量の平均値と標準偏差値は、運動量分布を表す分布関数f(p)から求める。すなわち、H,V,Cの色ヒストグラムf(H),f(V),f(C)から求める。
H=(H+V+C)^2
={(<H>+(H-<H>)+(<V>+(V-<V>)+<C>+(C-<C>)}^2
〜={(<H>+σH)+(<V>+σV)+(<C>+σC)}^2
=(<H><H>+<V><V>+<C><C>)
+2(<H><V>+<V><C>+<C><H>)
+2(<H>σH+<V>σV+<C>σC)
+2(<H>σV+<V>σC+<C>σH)
+2(σH<V>+σV<C>+σC<H>)
+(σHσHVσVCσC)
+2(σHσVVσCCσH)
このようにハミルトニアンを平均場とゆらぎ場に近似して2次形式として導出される要素が、1つ1つのエネルギー要素に対応し、離散的なエネルギー準位を作る。各画像によって、それらのエネルギー要素がとる値は異なってくるが、ある感性をもつ画像群の間では、あるエネルギー要素が共通に強く作用する因子として、作用していることが画像群の分布を調べることによって見えてくることになる。
<Low-order invariants of color>
The Munsell H, V, and C values themselves represent momentum.
The model Hamiltonian is constructed as follows.
H = (H + V + C) ^ 2
This represents the kinetic energy representing the intensity of the color value. Or it represents the energy of the field.
equation
Hlψ n > = E nn >
The other hand, finds the energy eigenvalues E n.
In calculating the energy eigenvalue, the mean field approximation of statistical physics is used.
Each momentum is divided into an average term and a fluctuation term, and the fluctuation term is also described by an average fluctuation width. That is, the standard deviation is taken as the fluctuation term, and the dimension of the momentum p is the same as the average value.
√ <(H- <H>) ^ 2> 〜 = σ H
√ <(V- <V>) ^ 2> 〜 = σ V
√ <(C- <C>) ^ 2> 〜 = σ C
The average value and standard deviation value of these momentums are obtained from the distribution function f (p) representing the momentum distribution. That is, it is obtained from the color histograms f (H), f (V), f (C) of H, V, C.
H = (H + V + C) ^ 2
= {(<H> + (H- <H>) + (<V> + (V- <V>) ++ C> + (C- <C>)} ^ 2
~ = {(<H> + σ H ) + (<V> + σ V ) + (<C> + σ C )} ^ 2
= (<H><H> + <V><V> + <C><C>)
+2 (<H><V> + <V><C> + <C><H>)
+2 (<H> σ H + <V> σ V + <C> σ C )
+2 (<H> σ V + <V> σ C + <C> σ H )
+2 (σ H <V> + σ V <C> + σ C <H>)
+ (σ H σ H + σ V σ V + σ C σ C )
+2 (σ H σ V + σ V σ C + σ C σ H )
Thus, the elements derived as a quadratic form by approximating the Hamiltonian to the mean field and the fluctuation field correspond to each energy element, and create discrete energy levels. The values of these energy elements vary depending on the image, but the image group distribution is that the energy element acts as a factor that strongly acts in common among images with a certain sensitivity. It becomes visible by examining it.

一般に、画像の色ヒストグラムをとってみれば分かるように、運動量の分布は画像によって極めてランダムに変化する変動性の強い特性をもち、同一の感性をもつ画像群で統計平均をとっても、共通因子の要素はほとんど残らない。しかしながら、エネルギーの形である2次形式という状態で分布を観察すると、同一の感性を持つ画像群で共通に作用する因子が残留しやすくなる。例えば、「殺風景な」という画像は、平均輝度<V>と平均彩度<C>が同時に小さな値をとっている確率が高く、<V><C>という運動エネルギーは共通に小さな値を示していることが多い。ただし、ある場合は<V>の値が大きめに出ている場合もあり、そのときは<C>側がもっと小さな値を示すことによってバランスをとる。このようなとき<V>と<C>を個別に統計平均をとると、それらの運動量平均は、値として一般画像の平均値に情報として消滅してしまいやすい。この様子を以下に示す。
運動量p エネルギーEn
色相H 統計平均 <V><C>
輝度V ⇒ <V><V>
彩度C 残存情報 <H>σV
σCσC
...
(ランダム分布) (同時性の整列)
1)運動量
運動量の要素pnとしては以下のものが挙げられる。
<H>, <V>, <C>, σH, σV, σC
なお、σの部分は角運動量の要素Mnとして扱ってもよい。
In general, as can be seen by taking a color histogram of the image, the momentum distribution has a highly variable characteristic that varies very randomly depending on the image, and even if a statistical average is taken for a group of images with the same sensitivity, a common factor Almost no elements remain. However, when the distribution is observed in a secondary form that is the form of energy, factors that act in common on image groups having the same sensitivity tend to remain. For example, an image that is “killing scenery” has a high probability that the average luminance <V> and the average saturation <C> have a small value at the same time, and the kinetic energy <V><C> shows a small value in common. There are many. However, in some cases, the value of <V> may be larger, in which case <C> is balanced by showing a smaller value. In such a case, if <V> and <C> are individually statistically averaged, those momentum averages tend to disappear as information in the average value of the general image. This is shown below.
Momentum p energy E n
Hue H Statistical average <V><C>
Luminance V ⇒ <V><V>
Saturation C Residual information <H> σ V
σ C σ C
...
(Random distribution) (Simultaneous alignment)
1) Momentum Examples of the momentum element pn include the following.
<H>, <V>, <C>, σ H , σ V , σ C
Note that the portion of σ may be treated as an element M n of angular momentum.

2)エネルギー
エネルギーの要素Enとしては以下のものが挙げられる。エネルギー要素Enについて、種類の異なるエネルギー要素が算出されるので、それらを区別するための記号として以下のような省略記号でそれらの状態を表すことにする。α面にはa、β面にはb、平均値にはm、標準偏差値にはsの記号を用いる。
(α)(α)
amam: <H><H>, <V><V>, <C><C>,
amas: <H>σH, <V>σV, <C>σC,
asas: σHσH, σVσV, σCσC,
(α)(β)
ambm: <H><V>, <V><C>, <C><H>,
ambs: <H>σV, <V>σC, <C>σH,
asbm: σH<V>, σV<C>, σC<H>,
asbs: σHσV, σVσC, σCσH
色の低次不変量に関しては、下記に記す注意点を考慮すると<H>を伴う項は、2つの要素に分離する。したがって、色の低次不変量のエネルギー要素としては、21+5=26種類のスカラー不変量が導出される。これらは各々、離散的なエネルギー準位Enに対応し、Enの値そのものを表す。これが、色の低次部分系で縮約されてきた巨視的な物理量である。
2) The elements E n of Energy Energy include the following. Energy elements E n, because different energy elements are calculated, will be represented their state ellipsize the following as a symbol for distinguishing them. The symbol a is used for the α plane, b for the β plane, m for the average value, and s for the standard deviation value.
(α) (α)
amam: <H><H>,<V><V>,<C><C>,
amas: <H> σ H , <V> σ V , <C> σ C ,
asas: σ H σ H , σ V σ V , σ C σ C ,
(α) (β)
ambm: <H><V>,<V><C>,<C><H>,
ambs: <H> σ V , <V> σ C , <C> σ H ,
asbm: σ H <V>, σ V <C>, σ C <H>,
asbs: σ H σ V , σ V σ C , σ C σ H
Regarding the low-order invariants of color, the term with <H> is separated into two elements in consideration of the precautions described below. Therefore, 21 + 5 = 26 types of scalar invariants are derived as energy elements of low-order invariants of color. These are each correspond to discrete energy levels E n, represents the value itself of E n. This is a macroscopic physical quantity that has been reduced in the lower-order subsystem of the color.

3)色の低次不変量の場合の特殊事項
色相Hはマンセル色空間変換時にニュートラルNとそれ以外の色相環H(≠N)によって表される。分布関数f(H)は、第1の実施形態で説明したように色相環のヒストグラム・ビンとNのヒストグラム・ビンに分かれたヒストグラムを用いる。また、色相環で平均値を算出するとき、第1の実施形態でチェビシェフ展開するときの色相環の起点を定義したのと同様に、色相環内で分布関数が最小となる点に切り込みを入れ、それより値の小さい領域は、色相環の角度の最大値側の端点に2π角度分の値を追加する形で値を大きく延ばして領域を確保し、その軸上で平均マンセル色相値を算出する。その値が元のマンセル色相値の値範囲を超えている場合は、2π角度分に相当する値を引いて元に戻す。
3) Special matters in the case of low-order invariants of color Hue H is represented by neutral N and other hue ring H (≠ N) during Munsell color space conversion. As described in the first embodiment, the distribution function f (H) uses a histogram divided into hue ring histogram bins and N histogram bins. In addition, when calculating the average value in the hue circle, in the same way as defining the starting point of the hue circle when the Chebyshev expansion is performed in the first embodiment, a cut is made at the point where the distribution function is minimum in the hue circle. In the region with a smaller value than that, the value is extended by adding a value of 2π angle to the end point on the maximum value of the hue ring angle to secure the region, and the average Munsell hue value is calculated on that axis To do. If the value exceeds the original Munsell hue value range, the value corresponding to the 2π angle is subtracted and restored.

色相環を表すために<H>は複素数表現して2成分に分離し、その記述を実現する。また、そのときに複素数の絶対値の大きさによって色相環に残っているニュートラル分を差し引いた割合を表す。
<H>=(1-pop(N))exp(2πi<H(≠N)>/100)
σHは色相環内の分布関数のみの広がり幅を計算する。したがって、1成分のままである。こちらの強度も<H>の絶対値の大きさと連動して、色相環に残っている度数割合を掛け算して評価する。すなわち、全てがニュートラルに流れ込んだ場合は、必ずσHが零になるように定義する。
σH=(1-pop(N)) σH(≠N)
<テキスチャの低次不変量>
テキスチャを表すエッジ面として、第2の実施形態で説明した、マンセルHVC面の各々を多重解像度変換し、高周波サブバンド画像だけを逆変換によって統合した統合エッジ面を利用する。そのエッジ面のエッジ強度は、模式的にラプラシアン記号△を用いて、△H,△V,△Cと表す。
今度はHVC面のエッジ強度△H,△V,△Cの値そのものが運動量を表していると考える。
モデル・ハミルトニアンを次のように構築する。
H=(△H+△V+△C)^2
これは色のエッジ成分の値の強度を表す運動エネルギー、あるいは場のエネルギーを表している。
In order to express the hue circle, <H> is expressed as a complex number and separated into two components to realize the description. Moreover, the ratio which subtracted the neutral part which remains in the hue ring at the time of the absolute value of a complex number at that time is represented.
<H> = (1-pop (N)) exp (2πi <H (≠ N)> / 100)
σ H calculates the spread width of only the distribution function in the hue circle. Therefore, it remains one component. This intensity is also evaluated by multiplying the frequency ratio remaining in the hue ring in conjunction with the absolute value of <H>. That is, when everything flows in neutral, σ H is always defined to be zero.
σ H = (1-pop (N)) σ H (≠ N)
<Lower-order invariants of texture>
As the edge surface representing the texture, the integrated edge surface described in the second embodiment, in which each Munsell HVC surface is subjected to multi-resolution conversion and only high-frequency subband images are integrated by inverse conversion, is used. The edge strength of the edge surface is schematically expressed as ΔH, ΔV, ΔC using a Laplacian symbol Δ.
Now consider that the values of the edge strengths ΔH, ΔV, and ΔC on the HVC surface represent the momentum.
The model Hamiltonian is constructed as follows.
H = (△ H + △ V + △ C) ^ 2
This represents the kinetic energy representing the intensity of the value of the color edge component, or the energy of the field.

エネルギー固有値Enを色の低次不変量のときと同様に平均場近似によって求める。運動量の平均値と標準偏差値は、運動量分布を表す分布関数f(p)から求める。すなわち、△H,△V,△Cのエッジ強度のヒストグラムf(△H),f(△V),f(△C)から求める。
色の低次不変量のときと同様の手続きによって、テキスチャの低次不変量が求まる。
1)運動量
運動量の要素pnとしては以下のものが挙げられる。
<△H>, <△V>, <△C>, σ△H, σ△V, σ△C
なお、σの部分は角運動量の要素Mnとして扱ってもよい。
Similar to when the energy eigenvalue E n lower order invariants color determined by the mean-field approximation. The average value and the standard deviation value of the momentum are obtained from the distribution function f (p) representing the momentum distribution. That is, it is obtained from the histograms f (ΔH), f (ΔV), and f (ΔC) of the edge intensity of ΔH, ΔV, and ΔC.
The low-order invariant of the texture is obtained by the same procedure as that for the low-order invariant of color.
1) Momentum Examples of the momentum element pn include the following.
<△ H>, <△ V>, <△ C>, σ △ H , σ △ V , σ △ C
Note that the portion of σ may be treated as an element M n of angular momentum.

2)エネルギー
エネルギーの要素Enとしては以下のものが挙げられる。エネルギー要素Enについて、種類の異なるエネルギー要素が算出されるので、それらを区別するための記号として以下のような省略記号でそれらの状態を表すことにする。α面にはa、β面にはb、平均値にはm、標準偏差値にはsの記号を用いる。
(α)(α)
amam: <△H><△H>, <△V><△V>, <△C><△C>,
amas: <△H>σ△H, <△V>σ△V, <△C>σ△C,
asas: σ△Hσ△H, σ△Vσ△V, σ△Cσ△C,
(α)(β)
ambm: <△H><△V>, <△V><△C>, <△C><△H>,
ambs: <△H>σ△V, <△V>σ△C, <△C>σ△H,
asbm: σ△H<△V>, σ△V<△C>, σ△C<△H>,
asbs: σ△Hσ△V, σ△Vσ△C, σ△Cσ△H,
テキスチャの低次不変量のエネルギー要素としては、21種類のスカラー不変量が導出される。これらは各々、離散的なエネルギー準位Enに対応し、Enの値そのものを表す。これが、テキスチャの低次部分系で縮約されてきた巨視的な物理量である。
2) The elements E n of Energy Energy include the following. Energy elements E n, because different energy elements are calculated, will be represented their state ellipsize the following as a symbol for distinguishing them. The symbol a is used for the α plane, b for the β plane, m for the average value, and s for the standard deviation value.
(α) (α)
amam: <△ H><△H>,<△V><△V>,<△C><△C>,
amas: <△ H> σ △ H , <△ V> σ △ V , <△ C> σ △ C ,
asas: σ △ H σ △ H , σ △ V σ △ V , σ △ C σ △ C ,
(α) (β)
ambm: <△ H><△V>,<△V><△C>,<△C><△H>,
ambs: <△ H> σ △ V , <△ V> σ △ C , <△ C> σ △ H ,
asbm: σ △ H <△ V>, σ △ V <△ C>, σ △ C <△ H>,
asbs: σ △ H σ △ V , σ △ V σ △ C , σ △ C σ △ H ,
Twenty-one types of scalar invariants are derived as the energy elements of the low-order invariants of the texture. These are each correspond to discrete energy levels E n, represents the value itself of E n. This is a macroscopic physical quantity that has been reduced in the lower order subsystem of the texture.

3)テキスチャの低次不変量の場合の特殊事項
色相面のエッジ成分は、マンセル値が0の点を常に色相環の原点とした値で表示した色面のエッジをとるものとする。なぜならば、実験的に色相環の切り込み点を画像毎に分布関数が最小となる点に変化させるよりも、虹色のスペクトル分布と同じマンセル値の原点で固定的に観測した方が色相面のエッジとしては好ましいことが判明したからである。また、ニュートラルは別扱いせずに色相環の何れかの点に分布する色相面とする。よって、ニュートラル成分は色相面上のランダムノイズのように振る舞う。
3) Special matters in the case of low-order invariants of texture The edge component of the hue plane shall take the edge of the color plane displayed with a value where the Munsell value is always 0 as the origin of the hue circle. This is because, rather than experimentally changing the cut point of the hue ring to a point where the distribution function is minimized for each image, it is better to observe the hue plane in a fixed manner at the origin of the same Munsell value as the iridescent spectrum distribution. This is because it has been found preferable as an edge. Further, neutral is not treated separately, but is a hue plane distributed at any point of the hue circle. Therefore, the neutral component behaves like random noise on the hue plane.

<色の高次不変量>
色の分布関数をチェビシェフ展開する。変数xは、H,V,Cの各々の値をとる。

Figure 0005041041
分布関数から力学的不変量である運動量、角運動量、エネルギーを導くにあたり、分布関数の形状を記述するのに独立な形状評価をしうる成分を可能な限り導き出す。すなわち、エネルギーや角運動量を構築するに当たり、分布関数f(x)を軸反転したf(-x)も考察対象に加える。色の場合は、軸反転することの物理的意味は階調反転することに相当する。そのために角運動量の概念を導入する。すなわち、基底関数群を偶関数と奇関数の性質の違いによって部分群に分け、各々の部分群に角運動量量子数を割り当てる。 <Higher-order invariants of color>
The Chebyshev expansion of the color distribution function. The variable x takes each value of H, V, and C.
Figure 0005041041
When deriving momentum, angular momentum, and energy, which are mechanical invariants, from the distribution function, components that can be independently evaluated for describing the shape of the distribution function are derived as much as possible. That is, in constructing energy and angular momentum, f (−x) obtained by inverting the axis of the distribution function f (x) is added to the consideration. In the case of color, the physical meaning of axis inversion corresponds to gradation inversion. For this purpose, the concept of angular momentum is introduced. That is, the basis function group is divided into subgroups according to the difference between the even function and the odd function, and an angular momentum quantum number is assigned to each subgroup.

チェビシェフ基底は、偶数番目の基底が偶関数でψ(-x)=ψ(x)の関係を満たし、奇数番目の基底が奇関数でψ(-x)=-ψ(x)の関係を満たす。よって、偶関数群には角運動量量子数l=0、奇関数群には角運動量量子数l=1を割り当てる。軸反転x→-xすることによって、奇数番目の角運動量量子数の基底関数は符号反転し、偶数番目の角運動量子数の基底関数は符号は不変である。このような角運動量単位の波動関数の軸反転に関する性質を量子力学ではパリティと呼ぶ。偶関数の基底関数は偶のパリティを持ち、軸反転に対して不変であり、奇関数の基底関数は奇のパリティを持ち、軸反転に対して符号を反転する。   The Chebyshev basis is an even-numbered basis satisfying the relationship ψ (-x) = ψ (x), and the odd-numbered basis an odd function satisfying the relationship ψ (-x) =-ψ (x) . Therefore, the angular momentum quantum number l = 0 is assigned to the even function group, and the angular momentum quantum number l = 1 is assigned to the odd function group. By performing axis inversion x → −x, the basis functions of odd-numbered angular momentum quantum numbers are inverted in sign, and the basis functions of even-numbered angular momentum quantum numbers are unchanged. Such a property relating to the axis inversion of the wave function of the angular momentum unit is called parity in quantum mechanics. Even-function basis functions have even parity and are invariant to axis inversion, and odd-function basis functions have odd parity and invert the sign with respect to axis inversion.

この角運動量量子数がスピン系を記述していると考えると、色はスピン角運動量量子数s=1の系を記述していることになる。チェビシェフ関数は、一重級数展開のみで定義され、偶関数と奇関数はそれぞれスピン0とスピン1の状態を記述し、軸反転によりスピン1の状態のパリティが反転した状態を生み出すことができる。チェビシェフ関数はボーズ粒子であるスピン1の系の記述に適している。   If this angular momentum quantum number is considered to describe a spin system, the color describes a system having a spin angular momentum quantum number s = 1. The Chebyshev function is defined only by a single series expansion, the even function and the odd function describe the states of spin 0 and spin 1, respectively, and a state in which the parity of the state of spin 1 is inverted by axis inversion can be generated. The Chebyshev function is suitable for describing a spin-1 system that is a Bose particle.

独立な成分を考察するにあたり、まず最初に系を記述する角運動量の軸反転しない場合の運動量の要素pn、角運動量の要素Mn、エネルギーの要素Enを構築した上で、それらの各々を角運動量の軸反転した約倍の要素を導く。そのとき、全要素を線形結合したときに線形結合係数が意味のある独立成分を記述する否かの観点で導く。すなわち、要素の符号が変わるだけのときは、線形結合係数の符号を変えれば同じ系を記述するため、意味をなさない。一般に運動量はこの部類に入るが、角運動量とエネルギーは別の独立な成分が導き出せる。
具体例を挙げるために、展開係数の数2Nを200とする。すなわちN=100とする。
In considering the independent components, first, the momentum element p n , the angular momentum element M n , and the energy element E n when the axis of the angular momentum describing the system is not reversed are constructed, and then each of them is constructed. The element of about twice the angular momentum inversion is derived. At that time, when all elements are linearly combined, the linear combination coefficient is derived from the viewpoint of describing a meaningful independent component. That is, when only the sign of an element changes, it does not make sense because the same system is described if the sign of the linear combination coefficient is changed. In general, momentum falls into this category, but angular momentum and energy can be derived as separate components.
To give a specific example, the expansion coefficient number 2N is set to 200. That is, N = 100.

1)運動量
運動量の要素pnとしては以下のものが挙げられる。
cn (α) ここに、(α)=H,V,C。
2N=200のとき運動量の要素の数は3面分あるから、200x3=600個である。
1) Momentum Examples of the momentum element pn include the following.
c n (α) where (α) = H, V, C.
When 2N = 200, there are three momentum elements, so 200x3 = 600.

2)角運動量
以下では、cnを角運動量単位の部分群に分けて考える場合は、角運動量量子数l=0の展開係数をc0n、角運動量量子数l=1の展開係数をc1nと表すことにする。したがって、展開係数の要素数は半々のN個ずつに分かれる。部分群の要素番号はn=1,2,...,Nで数えるものとする。
角運動量の要素Mnとしては以下のものが挙げられる。
0*(c01 (α)+c02 (α)+...+c0N (α))+1*(c11 (α)+c12 (α)+...+c1N (α))
=(c11 (α)+c12 (α)+...+c1N (α)) ここに、(α)=H,V,C。
2) Angular momentum In the following, when c n is divided into subgroups of angular momentum units, the expansion coefficient of angular momentum quantum number l = 0 is c 0n , and the expansion coefficient of angular momentum quantum number l = 1 is c 1n. It will be expressed as Therefore, the number of elements of the expansion coefficient is divided into N half. The element numbers of the subgroups shall be counted by n = 1, 2, ..., N.
Examples of the angular momentum element M n include the following.
0 * (c 01 (α) + c 02 (α) + ... + c 0N (α) ) + 1 * (c 11 (α) + c 12 (α) + ... + c 1N (α) )
= (c 11 (α) + c 12 (α) + ... + c 1N (α) ) where (α) = H, V, C.

角運動量がl=1までしか存在しない場合は、独立な成分は上記の1つだけとなる。なぜならば、角運動量の軸を反転した
0*(c01 (α)+c02 (α)+...+c0N (α))-1*(c11 (α)+c12 (α)+...+c1N (α))=-(c11 (α)+c12 (α)+...+c1N (α))は上と同じ系を記述しているにすぎないからである。
When the angular momentum exists only up to l = 1, there is only one independent component as described above. Because the axis of angular momentum is reversed
0 * (c 01 (α) + c 02 (α) + ... + c 0N (α) ) -1 * (c 11 (α) + c 12 (α) + ... + c 1N (α) ) =-(c 11 (α) + c 12 (α) + ... + c 1N (α) ) only describes the same system as above.

このように奇関数の展開係数の一次和は、分布関数の非対称性を評価するための巨視的な指標となりうる。古典的な角運動量の定義はM=rxpであるが、それと対比すると上述の定義は運動量の部分和に対してヒルベルト空間座標の角運動量量子数を原点からの距離とする座標空間で積をとることで、分布関数のモーメントを記述していることになる。
角運動量の要素の数は3面分あるから1x3=3個である。
As described above, the linear sum of the expansion coefficient of the odd function can be a macroscopic index for evaluating the asymmetry of the distribution function. The classical definition of angular momentum is M = rxp, but in contrast, the above definition takes the product in a coordinate space where the angular momentum quantum number of the Hilbert space coordinates is the distance from the origin for the partial sum of the momentum. Thus, the moment of the distribution function is described.
Since there are three elements of angular momentum, 1x3 = 3.

3)エネルギー
α面とβ面の運動量の積をとって、運動エネルギーを構築する。運動量の積cm*cnは群論では直積あるいはクロネッカー積と呼ばれる行列を作るが、同じ基底関数で表された2つの系の積行列は可約な表現で、より小さな次元の2つの表現に分解することができる。すなわち、対称積と反対称積の行列表現に分解することができ、
(α)面と(α)面の積からは対称積のエネルギー行列(i,k)が構築できる。
ci (α)ck (α)+ck (α)ci (α)
また、(α)面と(β)面の積からは対称積と反対称積のエネルギー行列(i,k)が構築できる。
ci (α)ck (β)+ck (α)ci (β)
ci (α)ck (β)-ck (α)ci (β)
なお、これらは何れも基底関数の数だけ縦と横に並んだ正方行列である。
3) Energy Build the kinetic energy by taking the product of the momentum of the α and β planes. The momentum product c m * c n creates a matrix called the direct product or the Kronecker product in group theory, but the product matrix of two systems represented by the same basis function is a reducible representation, and is expressed in two representations of smaller dimensions. Can be disassembled. That is, it can be decomposed into a matrix representation of a symmetric product and an antisymmetric product,
From the product of the (α) plane and the (α) plane, a symmetrical product energy matrix (i, k) can be constructed.
c i (α) c k (α) + c k (α) c i (α)
Also, an energy matrix (i, k) of a symmetric product and an antisymmetric product can be constructed from the product of the (α) plane and the (β) plane.
c i (α) c k (β) + c k (α) c i (β)
c i (α) c k (β) -c k (α) c i (β)
Each of these is a square matrix arranged vertically and horizontally by the number of basis functions.

エネルギーの固有値を算出するため、対角和、すなわちシュプールをとるものとする。定常状態のエネルギー固有値は純粋に対角和をとったものである。これがn=0すなわちi=kの場合のエネルギー要素Enである。非定常状態のエネルギー固有値を算出するため、n=i-kだけ対角成分から離れた行列要素の和をとる拡張シュプールを定義する。通常のシュプールとは異なるためSp’という記号を用いる。このときシュプールをとる要素の数は、必ず対角和の要素の数と同じになるように定義して、積の一方で用いられる基底関数群は、必ず完全系をなす基底関数を全て一度なめる形で構築する。これは対称積と反対称積に分解するときの規則として課される要件である。そのために、n=i-kを満たす行列要素群で和をとる操作をしたとき、行列の端ではみ出してしまう要素については、考察対象の行列あるいは部分行列の大きさをNとするとそれらの行列内でn+N=i-kとなるように対角成分を挟んで反対側の領域で残りの要素数だけ斜め和をとるように定義する。こうしてエネルギー要素Enが順次算出される。なお、具体例は第1の実施形態と第3の実施形態に記述済みである。 In order to calculate an eigenvalue of energy, a diagonal sum, that is, a spur is taken. The steady state energy eigenvalues are purely diagonal sums. This is the energy elements E n in the case of n = 0 i.e. i = k. In order to calculate the energy eigenvalue of the unsteady state, an extended spur that takes the sum of matrix elements separated from the diagonal component by n = ik is defined. Since it is different from normal spurs, the symbol Sp 'is used. At this time, the number of elements to be spured must be defined to be the same as the number of elements in the diagonal sum, and the basis functions used in one of the products must lick all the basis functions that make up the complete system once. Build in shape. This is a requirement imposed as a rule when decomposing into symmetric and antisymmetric products. For this reason, when the sum operation is performed with matrix elements satisfying n = ik, the elements that protrude at the end of the matrix are assumed to be within the matrix if the size of the matrix or submatrix to be considered is N. In order to satisfy n + N = ik, the diagonal component is defined so that the diagonal sum is taken for the remaining number of elements in the opposite region. Thus the energy elements E n are sequentially calculated. Specific examples have been described in the first embodiment and the third embodiment.

エネルギー要素の数は、1つのエネルギー行列に対して基底関数の展開係数の数の半分に相当する数だけ存在する。半分になる理由は行列からはみ出した成分を行列幅に等しい数だけずらしてもう一度織り込んでくるから、それらが順になめていった場合2重定義となるから、有効なのは半分に減ずるためである。すなわち、拡張シュプールをとることによって2次元の行列要素は各行と列をなす一次元の要素の数の半分に等しい数にまでエネルギー要素の数は縮約する。   There are as many energy elements as one half of the number of expansion coefficients of the basis function for one energy matrix. The reason for the halving is that the component protruding from the matrix is shifted by the number equal to the matrix width and is woven again, so if they are licked in order, the definition is double, so that the effective is reduced to half. That is, by taking an expanded spur, the number of energy elements is reduced to a number equal to half of the number of one-dimensional elements forming each row and column.

次に角運動量の軸を反転した状態を考察する。上述の3つのエネルギー行列の定義は、(α)面と(α)面、及び(α)面と(β)面からなる表面と表面の積による表の姿の描写をしている。それに対して一方の分布関数を軸反転することによって裏面の(-α)面や(-β)面を作ることができる。行列積を作るときに一方を表面にとりもう一方を裏面にとることによって、裏の姿の描写をすることが可能になる。これによって、独立なエネルギー要素の導出が可能になる。すなわち、パリティの概念を導入することによって、独立な合成系の基底関数を構築する。なお、パリティは古典力学では出てこない概念である。   Next, consider the state in which the axis of angular momentum is reversed. The definition of the three energy matrices described above describes the appearance of the table by the product of the surface comprising the (α) plane and the (α) plane, and the (α) plane and the (β) plane. On the other hand, the (−α) plane or the (−β) plane on the back surface can be created by reversing the axis of one distribution function. When making a matrix product, it is possible to depict the back by taking one on the front and the other on the back. This makes it possible to derive independent energy components. That is, by introducing the concept of parity, an independent synthetic basis function is constructed. Parity is a concept that does not appear in classical mechanics.

ここで、(α)面と(-α)面の積からは対称積と反対称積のエネルギー行列(i,k)が構築できる。
ci (α)ck (-α)+ck (α)ci (-α)
ci (α)ck (-α)-ck (α)ci (-α)
また、(α)面と(-β)面の積からは対称積と反対称積のエネルギー行列(i,k)が構築できる。
ci (α)ck (-β)+ck (α)ci (-β)
ci (α)ck (-β)-ck (α)ci (-β)
これらのエネルギー行列の要素の各々はck (-α)のうちのkが奇関数に相当している場合だけは、ck (-α)=-ck (α)と符号が反転し、偶関数に相当している場合はck (-α)=ck (α)のように符号を変えないようなエネルギー行列を構築する。このように一部の要素で符号反転した裏の姿の行列内で、表の姿の行列と同様な拡張シュプールをとっていくと、個別に出てくるエネルギー要素として独立な成分が導出できる。
Here, an energy matrix (i, k) of a symmetric product and an antisymmetric product can be constructed from the product of the (α) plane and the (−α) plane.
c i (α) c k (-α) + c k (α) c i (-α)
c i (α) c k (-α) -c k (α) c i (-α)
Also, an energy matrix (i, k) of a symmetric product and an antisymmetric product can be constructed from the product of the (α) plane and the (−β) plane.
c i (α) c k (-β) + c k (α) c i (-β)
c i (α) c k (-β) -c k (α) c i (-β)
Only if k of each of the elements of the energy matrix c k (-.alpha.) is equivalent to odd function, c k (-α) = -c k (α) the sign is inverted, When it corresponds to an even function, an energy matrix that does not change the sign is constructed such as c k (−α) = c k (α) . In this way, if an extended spur similar to that of the front matrix is taken in the matrix of the reverse figure in which the sign of some elements is reversed, an independent component can be derived as an energy element that appears individually.

これらの表の姿のエネルギー行列の拡張シュプールや、裏の姿のエネルギー行列の拡張シュプールをとるに当たり、角運動量による部分群が定義できるときの基底関数の並べ方には2通りが考えられる。すなわち、第1番目は角運動量量子数の低い順から先に並べる方法である。

Figure 0005041041
第2番目は主量子数の低い順番から先に並べる方法である。
Figure 0005041041
これらを順番にψiと一次元の指標を与え、2次元の行列積として対称積と反対称積ψiψk±ψkψiを作ると、第1番目の項と第2番目の項のiとkは対角成分を挟んで交換することになる。これらのエネルギー行列をもう一度、角運動量単位で部分行列に分けて並べると、部分行列内でn=i-kを満たす拡張シュプールをとることと等価になる。ただし、i,kを角運動量量子数と主量子数の2つのインデックスを用いて表した場合、第1番目の並べ方の場合は単純に同じ角運動量量子数の組み合せの部分行列内で主量子数のiとkを交換した形で表せるが、第2番目の並べ方を採用した場合、少しそれとは異なる表現となるので注意を要する。すなわち、同じ距離の非対角位置に存在する部分行列の要素との間でi,kを交換するとき、第1項目のψiψkのψi側がψk側よりも大きな角運動量量子数の場合は、n=i-k個だけ右側に来るψの主量子数はψi側の主量子数よりも1つだけ繰り上がったk+1として表記しなければならない。その後に、どちらの並べ替えをした場合であっても、要素を交換した2つの部分行列の間で、部分行列単位で要素をまとめる操作を行って部分行列表現する。 There are two ways to arrange the basis functions when subgroups based on angular momentum can be defined when taking the extended spur of the energy matrix shown in the table or the extended spur of the energy matrix of the back. That is, the first is a method in which the angular momentum quantum numbers are arranged in ascending order.
Figure 0005041041
The second is a method in which the main quantum numbers are arranged in ascending order.
Figure 0005041041
Given these in turn, ψ i and a one-dimensional index, and creating a symmetric product and an anti-symmetric product ψ i ψ k ± ψ k ψ i as a two-dimensional matrix product, the first and second terms I and k are exchanged across a diagonal component. If these energy matrices are divided into sub-matrices in units of angular momentum, they are equivalent to taking an extended spur that satisfies n = ik in the sub-matrix. However, when i and k are expressed using two indexes of angular momentum quantum number and main quantum number, in the case of the first arrangement, the main quantum number is simply within the submatrix of the same combination of angular momentum quantum numbers. However, if the second arrangement is adopted, the expression will be slightly different from this, so care must be taken. That is, when exchanging i and k with submatrix elements existing at off-diagonal positions at the same distance, the angular momentum quantum number in which the ψ i side of ψ i ψ k of the first item is larger than the ψ k side In this case, the main quantum number of ψ coming to the right by n = ik pieces must be expressed as k + 1 which is one higher than the main quantum number on the ψ i side. Thereafter, regardless of which rearrangement is performed, an operation for grouping elements in units of partial matrix is performed between the two partial matrices whose elements have been exchanged, and the partial matrix is expressed.

実験的に(α)面と(α)面の積を作るときは第1番目の並べ方の方が優れ、(α)面と(β)面の積を作るときは第2番目の並べ方の方が優れるということが判明した。これは、第1番目の並べ方は異なる角運動量量子数の間は完全に独立系と扱えることを前提としており、同一面内では完全直交系の基底関数の展開によってそれが満たされていることを意味する。一方の第2番目の並べ方は異なる角運動量量子数との間であっても近接した主量子数の間の基底関数で記述した方がその密接に関与し合っている様子を記述できることを表しており、HVC面が完全な独立な系を記述していないことに起因すると考えられる。   Experimentally, the first arrangement is better when creating the product of the (α) and (α) planes, and the second arrangement when creating the product of the (α) and (β) planes. Turned out to be excellent. This is based on the premise that the first arrangement can be treated as an independent system between different angular momentum quantum numbers, and that it is satisfied by the expansion of the basis function of the completely orthogonal system in the same plane. means. On the other hand, the second way of arrangement shows that even if it is between different angular momentum quantum numbers, it is possible to describe how the basis functions between the adjacent main quantum numbers are more closely related. This is probably because the HVC surface does not describe a completely independent system.

このような部分行列を組み合わせる方法としては、拡張シュプールが完全系をなす全ての基底関数をなめるように部分行列の間で和をとる必要がある。すなわち、運動量の要素が、角運動量量子数が0と1の系からなる2つの部分群に分かれているときは、エネルギー行列は角運動量の固有状態を表す2つの部分行列と角運動量の混合状態を表す2つの部分行列に分けて考えることができる。このとき、完全系をなすようになめる拡張シュプールの取り方として、2つの対角部分行列のシュプールをつなげる場合と、2つの非対角部分行列のシュプールをつなげる場合と2通りが存在する。このように角運動量単位でエネルギー行列を分けて考えた方が物理的意味が明確になる。
この様子を模式的に表すと以下のようになる。

Figure 0005041041
As a method for combining such sub-matrices, it is necessary to take a sum between the sub-matrices so that the extended spurs lick all the basis functions forming the complete system. That is, when the momentum element is divided into two subgroups consisting of systems of angular momentum quantum numbers 0 and 1, the energy matrix is a mixture of two submatrices representing the eigenstates of angular momentum and angular momentum. Can be divided into two sub-matrices representing. At this time, there are two ways of taking the extended spurs that lick to form a complete system: connecting two spurs of diagonal sub-matrices and connecting two spurs of non-diagonal sub-matrices. Thus, the physical meaning becomes clearer when the energy matrix is divided into units of angular momentum.
This state is schematically shown as follows.
Figure 0005041041

同じサフィックスが出てきたときには、それらについて和をとるものとする。
実際にエネルギー行列を角運動量の部分行列に分けて拡張シュプールを組むための部分行列和の具体例を示す。以下には部分行列をなす2つの基底関数の合成系の形式で表現し、部分行列と部分行列の和も同時に示す。各部分行列はこれらの基底関数ψikをcikに置き換えるだけで得られる。したがって、各部分行列が(i,k)で定義されると、エネルギー要素Enを算出するには、それぞれの部分行列内でn=i-kを満たす行列要素についてシュプールをとる。
When the same suffix appears, it shall be summed up.
A specific example of a submatrix sum for actually dividing an energy matrix into submatrices of angular momentum to form an extended spur will be shown. The following is expressed in the form of a composite system of two basis functions forming a submatrix, and the sum of the submatrix and submatrix is also shown. Each submatrix can be obtained by simply replacing these basis functions ψ ik with c ik . Therefore, when each submatrix is defined by (i, k), in order to calculate the energy element En, a spur is performed on the matrix elements satisfying n = ik in each submatrix.

エネルギー要素Enについてシュプールを実行する部分群単位で、種類の異なるエネルギー要素が算出されるので、それらを区別するための記号として以下のような省略記号でそれらの状態を表すことにする。α面にはa、β面にはb、角運動量が固有状態の(l,l')=(0,0)+(1,1)の組み合せに対しては00記号を、角運動量が混合状態の(l,l')=(0,1)+(1,0)の組み合せに対しては01記号を、対称行列にはプラスのp記号を、反対称行列にはマイナスのm記号を、角運動量の座標軸が標準状態に対してはe記号を、角運動量の座標軸が反転状態に対してはi記号を用いる。
角運動量の座標軸が標準状態と反転状態に関しては±記号を用いて、同時に記述することにする。裏の姿を記述するための角運動量の軸反転操作は行列を構成する一方の基底関数のみに対して行うので、一方の色面側の奇関数のみが符号反転する。これらの操作を通じて消滅してしまう成分は記載しない。
In subgroup units to perform spur the energy elements E n, because different energy elements are calculated, it will be represented their state ellipsize the following as a symbol for distinguishing them. a for the α plane, b for the β plane, 00 symbol for the combination of (l, l ') = (0,0) + (1,1) where the angular momentum is an eigenstate, and the angular momentum is mixed Use the 01 symbol for the (l, l ') = (0,1) + (1,0) combination of states, the positive p symbol for symmetric matrices, and the negative m symbol for antisymmetric matrices. The symbol e is used when the angular momentum coordinate axis is in the standard state, and the symbol i is used when the angular momentum coordinate axis is inverted.
Regarding the angular momentum coordinate axis, the standard state and the inverted state will be described simultaneously using ± symbols. Since the axis inversion operation of the angular momentum for describing the back side is performed only on one basis function constituting the matrix, only the odd function on one color plane side is inverted in sign. Components that disappear through these operations are not described.

(α)(α)
a0a0p,e/i: (ψ0i (α)ψ0k (α)0k (α)ψ0i (α))±(ψ1i (α)ψ1k (α)1k (α)ψ1i (α))
a0a1p,e : (ψ0i (α)ψ1k (α)0k (α)ψ1i (α))+(ψ1i (α)ψ0k (α)1k (α)ψ0i (α))
a0a1m,i : -(ψ0i (α)ψ1k (α)0k (α)ψ1i (α))+(ψ1i (α)ψ0k (α)1k (α)ψ0i (α)) (i≠k)
(α)(β)
a0b0p,e/i: (ψ0i (α)ψ0k (β)0k (α)ψ0i (β))±(ψ1i (α)ψ1k (β)1k (α)ψ1i (β))
a0b0m,e/i: (ψ0i (α)ψ0k (β)0k (α)ψ0i (β))±(ψ1i (α)ψ1k (β)1k (α)ψ1i (β)) (i≠k)
a0b1p,e/i: ±(ψ0i (α)ψ1k (β)0,k+1 (α)ψ1i (β))+(ψ1i (α)ψ0,k+1 (β)1k (α)ψ0i (β))
a0b1m,e/i: ±(ψ0i (α)ψ1k (β)0,k+1 (α)ψ1i (β))+(ψ1i (α)ψ0,k+1 (β)1k (α)ψ0i (β))
2N=200のときそれぞれの括弧で閉じられた部分行列は100x100で構成されるから、それぞれの種類からシュプールによって定義されてくるエネルギー要素Enの数は、50個である。上記に定義した種類の数は、同色面間の積が4種類、異色面間の積が8種類ある。さらに、(α)(α)の取り方としては、HHとVVとCCがあるから3種類、(α)(β)の取り方としてはHVとVCとCHの3種類がある。したがって、角運動量が0と1で記述される系のエネルギー要素の数は、(3x4+3x8)x50=36x50=1800個となる。エネルギーバンドとしては、36種類について、それぞれが50個のエネルギー準位をもった図が描けることになる。
(α) (α)
a0a0p, e / i: (ψ 0i (α) ψ 0k (α) + ψ 0k (α) ψ 0i (α) ) ± (ψ 1i (α) ψ 1k (α) + ψ 1k (α) ψ 1i ( α) )
a0a1p, e: (ψ 0i (α) ψ 1k (α) + ψ 0k (α) ψ 1i (α) ) + (ψ 1i (α) ψ 0k (α) + ψ 1k (α) ψ 0i (α) )
a0a1m, i:-(ψ 0i (α) ψ 1k (α)0k (α) ψ 1i (α) ) + (ψ 1i (α) ψ 0k (α)1k (α) ψ 0i (α ) ) (i ≠ k)
(α) (β)
a0b0p, e / i: (ψ 0i (α) ψ 0k (β) + ψ 0k (α) ψ 0i (β) ) ± (ψ 1i (α) ψ 1k (β) + ψ 1k (α) ψ 1i ( β) )
a0b0m, e / i: (ψ 0i (α) ψ 0k (β)0k (α) ψ 0i (β) ) ± (ψ 1i (α) ψ 1k (β)1k (α) ψ 1i ( β) ) (i ≠ k)
a0b1p, e / i: ± (ψ 0i (α) ψ 1k (β) + ψ 0, k + 1 (α) ψ 1i (β) ) + (ψ 1i (α) ψ 0, k + 1 (β) + ψ 1k (α) ψ 0i (β) )
a0b1m, e / i: ± (ψ 0i (α) ψ 1k (β)0, k + 1 (α) ψ 1i (β) ) + (ψ 1i (α) ψ 0, k + 1 (β)1k (α) ψ 0i (β) )
The number of energy elements E n coming defined from consisting of partial matrix 100x100 closed with respective brackets, the spurs from each type when the 2N = 200 is 50. The number of types defined above has four types of products between the same color surfaces and eight types of products between the different color surfaces. Further, there are three types of (α) (α) taking HH, VV, and CC, and there are three types of (α) (β) taking HV, VC, and CH. Therefore, the number of energy elements of the system described by the angular momentum of 0 and 1 is (3 × 4 + 3 × 8) × 50 = 36 × 50 = 1800. As for the energy bands, for each of the 36 types, a diagram having 50 energy levels can be drawn.

実際に画像を用いて実験してみた結果は、上述のようにエネルギー行列を、角運動量の単位で部分行列表示し、同じ角運動量量子数をもつ固有状態の部分行列を対角位置に、異なる角運動量子数をもつ混合状態(hybridization項)の部分行列は非対角位置に現れるようにすると、物理的な意味と整合する結果を得ることができた。すなわち、対角部分行列から作ったエネルギー要素に関する画像整列の様子と非対角部分行列から作ったエネルギー要素に関する画像整列の様子を比較すると、非対角成分の混合状態では山並みから雲が湧き立つようなシーンなどの非常にダイナミズムのある写真を捉える能力を備えていることが分かった。   As a result of actually experimenting with images, the energy matrix is displayed as a partial matrix in the unit of angular momentum as described above, and the submatrix of the eigenstate with the same angular momentum quantum number is different in the diagonal position. If the submatrix of the mixed state (hybridization term) with the angular motion quantum number appears in the off-diagonal position, the results consistent with the physical meaning can be obtained. In other words, when comparing the image alignment for energy elements made from diagonal submatrices and the image alignment for energy elements made from off-diagonal submatrices, clouds emerge from the mountains in the mixed state of off-diagonal components. It was found that it has the ability to capture very dynamic pictures such as scenes.

<テキスチャの高次不変量>
テキスチャの分布関数を球ベッセル展開する。球ベッセル関数は負の領域にも拡張定義し、完全系をなす根と次数の二重級数に展開する。球ベッセル関数は動径方向の波動関数を表すので、根に関する展開は主量子数nが対応し、次数に関する展開は方位量子数(軌道角運動量量子数)lが対応する。方位量子数の展開係数がl=0,1の場合とl=0,1,2,3の場合の2通りを考える。原子物理学ではl=0,1,2,3に対応する軌道には別の呼び名を付けてs軌道、p軌道、d軌道、f軌道と順に呼ぶ。そして、これらの軌道が元素の周期表を形作り、d軌道は遷移金属を、f軌道はランタノイド元素やアクチノイド元素の電子系を記述することに対応する。物性を記述する電子系との対応関係を考察すれば、感性を記述する画像系でもf軌道まで展開すれば十分であると考えられる。変数xは、△H,△V,△Cの各々の値をとる。
<Higher-order invariants of texture>
Expand the texture distribution function into a spherical Bessel. The spherical Bessel function is extended to the negative region and expanded to a double series of roots and orders that form a complete system. Since the spherical Bessel function represents a radial wave function, the expansion relating to the root corresponds to the principal quantum number n, and the expansion relating to the order corresponds to the orientation quantum number (orbital angular momentum quantum number) l. Consider two cases, when the expansion coefficient of the orientation quantum number is l = 0,1, and when l = 0,1,2,3. In atomic physics, the orbits corresponding to l = 0,1,2,3 are given different names and are called s-orbital, p-orbital, d-orbital, and f-orbital in that order. These orbits form the periodic table of elements, the d orbital corresponds to the transition metal, and the f orbit corresponds to the description of the electron system of the lanthanoid and actinoid elements. Considering the correspondence with the electronic system describing physical properties, it is considered sufficient to expand to the f orbit even in the image system describing sensibility. The variable x takes the values of ΔH, ΔV, and ΔC.

s,p軌道による展開の場合

Figure 0005041041
In case of expansion by s, p orbitals
Figure 0005041041

s,p,d,f軌道による展開の場合

Figure 0005041041
Case of expansion by s, p, d, f orbitals
Figure 0005041041

なお、ここに(α)は色面の違いを表すために用いているが、球ベッセル関数の中のαlnは根の位置を表すために用いている。零点の位置は一般に解析的には表せないが、スミルノフ「高等数学教程」にはベッセル関数の零点の近似式が載っている。そこから演繹で球ベッセル関数の零点を表すための近似式に変形して第1項はそのままで第2項に対して1/2の補正係数を導入すると、全ての零点において3%以内の誤差で近似できることが判明したので、p軌道以上の展開係数を算出するためには以下の式を用いる。

Figure 0005041041
Here, (α) is used to represent the difference in color plane, but α ln in the spherical Bessel function is used to represent the root position. In general, the position of the zero point cannot be expressed analytically, but Smirnov's "Higher Mathematics Curriculum" contains an approximate expression for the zero of the Bessel function. Then, by deducting it into an approximate expression to represent the zero point of the spherical Bessel function and introducing a correction factor of 1/2 with respect to the second term without changing the first term, an error within 3% at all zeros Since it has been found that the expansion coefficient can be approximated by the following equation, the following equation is used to calculate the expansion coefficient over the p orbit.
Figure 0005041041

分布関数から力学的不変量である運動量、角運動量、エネルギーを導くにあたり、分布関数の形状を記述するのに独立な形状評価をしうる成分を可能な限り導き出す。すなわち、色の場合と同様に、エネルギーや角運動量を構築するに当たり、分布関数f(x)を軸反転したf(-x)も考察対象に加える。テキスチャの場合は、軸反転するということの物理的意味はエッジ符号反転することに相当する。軸反転操作は角運動量のパリティを反転する操作に対応する。球ベッセル関数では、角運動量量子数が基底関数群を偶関数と奇関数の性質の違いによって部分群に分類されており、各々の部分群に方位量子数が割り当てられている。   When deriving momentum, angular momentum, and energy, which are mechanical invariants, from the distribution function, components that can be independently evaluated to describe the shape of the distribution function are derived as much as possible. That is, as in the case of color, in constructing energy and angular momentum, f (−x) obtained by axially inverting the distribution function f (x) is also added to the consideration. In the case of texture, the physical meaning of axis inversion corresponds to edge code inversion. The axis inversion operation corresponds to an operation to invert the parity of angular momentum. In the spherical Bessel function, the angular momentum quantum numbers are classified into subgroups based on the difference between the properties of the even function and the odd function, and an orientation quantum number is assigned to each subgroup.

球ベッセル基底は、偶数番目の方位量子数をもつ基底が偶関数でψ(-x)=ψ(x)の関係を満たし、奇数番目の方位量子数をもつ基底が奇関数でψ(-x)=-ψ(x)の関係を満たす。軸反転x→-xすることによって、奇数番目の方位量子数の基底関数は符号反転し、偶数番目の方位量子数の基底関数は符号は不変である。   A spherical Bessel basis has an even-numbered orientation quantum number that is an even function and satisfies the relationship ψ (-x) = ψ (x), and an odd-numbered orientation quantum number basis that is an odd function ψ (-x ) =-ψ (x). By performing the axis inversion x → −x, the basis function of the odd-numbered azimuth quantum number is inverted, and the basis function of the even-numbered azimuth quantum number has the same sign.

よって、s,d軌道の波動関数は偶のパリティを、p,f軌道の波動関数は奇のパリティを持つ。一般に、球ベッセル関数で表される基底関数群は、座標軸の反転に対して、角運動量量子数lを用いて(-1)^lで表されるパリティを持つ。   Therefore, the wave function of the s and d orbits has an even parity, and the wave function of the p and f orbits has an odd parity. In general, a basis function group represented by a spherical Bessel function has a parity represented by (−1) ^ l using an angular momentum quantum number l with respect to inversion of coordinate axes.

前述と同様に、独立な成分を考察するにあたり、まず最初に系を記述する角運動量の軸反転しない場合の運動量の要素pn、角運動量の要素Mn、エネルギーの要素Enを構築した上で、それらの各々を角運動量の軸反転した約倍の要素を導く。具体例を挙げるために、展開係数の数Nを100にとる。 As in the previous case, when considering the independent components, first, the momentum element p n , the angular momentum element M n , and the energy element E n when the axis of the angular momentum describing the system is not reversed are first constructed. Thus, each of them leads to an element of about twice the axis of angular momentum inverted. In order to give a specific example, the number N of expansion coefficients is set to 100.

1)運動量
運動量の要素pnとしては以下のものが挙げられる。
cln (α) ここに、(α)=H,V,C。
s,p軌道による展開の場合、N=100のとき運動量の要素の数は3面分あるから、2x100x3=600個である。s,p,d,f軌道による展開の場合、N=100のとき運動量の要素の数は3面分あるから、4x100x3=1200個である。
1) Momentum Examples of the momentum element pn include the following.
c ln (α) where (α) = H, V, C.
In the case of expansion by the s, p orbit, there are 3 momentum elements when N = 100, so 2x100x3 = 600. In the case of expansion by the s, p, d, f orbit, when N = 100, there are three elements of momentum, so 4 × 100 × 3 = 1200.

2)角運動量
角運動量の要素Mnとしては以下のものが挙げられる。
(s,p軌道による展開の場合)
色のチェビシェフ展開の場合と全く同様である。すなわち、
(c11 (α)+c12 (α)+...+c1N (α)) ここに、(α)=H,V,C。
角運動量の要素の数は3面分あるから1x3=3個である。
(s,p,d,f軌道による展開の場合)
1(c11 (α)+c12 (α)+...+c1N (α))+2(c21 (α)+c22 (α)+...+c2N (α))+3(c31 (α)+c32 (α)+...+c3N (α))
角運動量の軸を反転すると別の独立成分が出てくる。
-1(c11 (α)+c12 (α)+...+c1N (α))+2(c21 (α)+c22 (α)+...+c2N (α))-3(c31 (α)+c32 (α)+...+c3N (α))
角運動量の要素の数は3面分あるから2x3=6個である。
2) Angular momentum Examples of the angular momentum element M n include the following.
(In case of expansion by s, p orbit)
This is exactly the same as in the case of color Chebyshev expansion. That is,
(c 11 (α) + c 12 (α) + ... + c 1N (α) ) where (α) = H, V, C.
Since there are three elements of angular momentum, 1x3 = 3.
(In case of expansion by s, p, d, f orbit)
1 (c 11 (α) + c 12 (α) + ... + c 1N (α) ) +2 (c 21 (α) + c 22 (α) + ... + c 2N (α) ) + 3 (c 31 (α) + c 32 (α) + ... + c 3N (α) )
When the axis of angular momentum is reversed, another independent component appears.
-1 (c 11 (α) + c 12 (α) + ... + c 1N (α) ) +2 (c 21 (α) + c 22 (α) + ... + c 2N (α) ) -3 (c 31 (α) + c 32 (α) + ... + c 3N (α) )
Since there are three elements of angular momentum, 2x3 = 6.

このように奇関数の展開係数の一次和は、分布関数の非対称性をどれだけ外側にまで広がってその性質を示しているかを評価するための巨視的な指標を与え、更に偶関数の展開係数の一次和は、分布関数がどれだけ外側に尾を引くような形で広がっているかという性質を評価するための巨視的な指標を与え、それらの総合的な広がりの性質が角運動量として保存する巨視的な物理量となりうる。   In this way, the linear sum of the expansion coefficient of the odd function gives a macroscopic index for evaluating how far the asymmetry of the distribution function extends to show its properties, and further, the expansion coefficient of the even function The linear sum gives a macroscopic index for evaluating the extent to which the distribution function spreads in a tail-extracting manner, and preserves the overall spread property as angular momentum It can be a macroscopic physical quantity.

3)エネルギー
エネルギーの要素Enとしては以下のものが挙げられる。
(s,p軌道による展開の場合)
色のチェビシェフ展開の場合と全く同様である。したがって、N=100のときそれぞれの括弧で閉じられた部分行列は100x100で構成されるから、それぞれの種類からシュプールによって定義されてくるエネルギー要素Enの数は50個である。よって色の場合と全く同様に、角運動量が0と1で記述される系のエネルギー要素の数は、(3x4+3x8)x50=36x50=1800個である。エネルギーバンドとしては、36種類について、それぞれが50個のエネルギー準位をもった図が描けることになる。
3) As the elements E n of Energy Energy include the following.
(In case of expansion by s, p orbit)
This is exactly the same as in the case of color Chebyshev expansion. Therefore, submatrix closed with respective brackets when N = 100 from the consisting of 100x100, the number of energy elements E n coming defined by spurs from each type is 50. Therefore, just like the case of color, the number of energy elements of the system described by the angular momentum of 0 and 1 is (3 × 4 + 3 × 8) × 50 = 36 × 50 = 1800. As for the energy bands, for each of the 36 types, a diagram having 50 energy levels can be drawn.

(s,p,d,f軌道による展開の場合)
角運動量単位のエネルギー部分行列を対角方向につなげて完全系をなすようにする方法は、以下の4つの場合が存在する。第1の束ね方は角運動量の固有状態を表す。第2から第4の束ね方は角運動量の混合状態を表す。混合状態とは角運動量が混成軌道をなしている状態で、例えばsd間ではsd hybridizationと呼ぶ部分群を作る。下記4つの拡張シュプールを構成する様子を表す行列図を図17(a)〜(d)に示す。これらは、s,p軌道だけの場合を包含するように定義されている。すなわち、d,f軌道による展開を省略した場合にs,p軌道による展開と同じ式になる。
s2+p2+d2+f2
sp+ps+df+fd
sd+ds+pf+fp
sf+fs+pd+dp
実際にエネルギー行列を角運動量の部分行列に分けて拡張シュプールを組むための部分行列和の具体例を示す。角運動量が固有状態の(l,l')=(0,0)+(1,1)+(2,2)+(3,3)の組み合せに対しては00記号を、角運動量が混合状態の(l,l')=(0,1)+(1,0)+(2,3)+(3,2)の組み合せに対しては01記号を、角運動量が混合状態の(l,l')=(0,2)+(2,0)+(1,3)+(3,1)の組み合せに対しては02記号を、角運動量が混合状態の(l,l')=(0,3)+(3,0)+(1,2)+(2,1)の組み合せに対しては03記号を用いる。
(In case of expansion by s, p, d, f orbit)
There are the following four cases in which the energy submatrix of angular momentum units is connected diagonally to form a complete system. The first bundling method represents the intrinsic state of angular momentum. The second to fourth bundling methods represent a mixed state of angular momentum. The mixed state is a state in which the angular momentum has a hybrid orbit, for example, a subgroup called sd hybridization is created between sd. 17A to 17D are matrix diagrams showing how the following four extended spurs are configured. These are defined to include the case of only s, p orbitals. That is, when expansion by d, f orbit is omitted, the same expression as expansion by s, p orbit is obtained.
s 2 + p 2 + d 2 + f 2
sp + ps + df + fd
sd + ds + pf + fp
sf + fs + pd + dp
A specific example of a submatrix sum for actually dividing an energy matrix into submatrices of angular momentum to form an extended spur will be shown. For the combination of (l, l ') = (0,0) + (1,1) + (2,2) + (3,3) where the angular momentum is an eigenstate, the 00 symbol is mixed and the angular momentum is mixed For the combination of (l, l ') = (0,1) + (1,0) + (2,3) + (3,2) in the state, use the 01 symbol and (l , l ') = (0,2) + (2,0) + (1,3) + (3,1), use the 02 symbol, and (l, l') with a mixed angular momentum The 03 symbol is used for the combination of = (0,3) + (3,0) + (1,2) + (2,1).

(α)(α)
a0a0p,e/i: (ψ0i (α)ψ0k (α)0k (α)ψ0i (α))±(ψ1i (α)ψ1k (α)1k (α)ψ1i (α))+(ψ2i (α)ψ2k (α)2k (α)ψ2i (α))±(ψ3i (α)ψ3k (α)3k (α)ψ3i (α))
a0a1p,e : (ψ0i (α)ψ1k (α)0k (α)ψ1i (α))+(ψ1i (α)ψ0k (α)1k (α)ψ0i (α))+(ψ2i (α)ψ3k (α)2k (α)ψ3i (α))+(ψ3i (α)ψ2k (α)3k (α)ψ2i (α))
a0a1m,i : -(ψ0i (α)ψ1k (α)0k (α)ψ1i (α))+(ψ1i (α)ψ0k (α)1k (α)ψ0i (α))-(ψ2i (α)ψ3k (α)2k (α)ψ3i (α))+(ψ3i (α)ψ2k (α)3k (α)ψ2i (α)) (i≠k)
a0a2p,e/i: (ψ0i (α)ψ2k (α)0k (α)ψ2i (α))+(ψ2i (α)ψ0k (α)2k (α)ψ0i (α))±(ψ1i (α)ψ3k (α)1k (α)ψ3i (α))±(ψ3i (α)ψ1k (α)3k (α)ψ1i (α))
a0a3p,e : (ψ0i (α)ψ3k (α)0k (α)ψ3i (α))+(ψ3i (α)ψ0k (α)3k (α)ψ0i (α))+(ψ1i (α)ψ2k (α)1k (α)ψ2i (α))+(ψ2i (α)ψ1k (α)2k (α)ψ1i (α))
a0a3m,i : -(ψ0i (α)ψ3k (α)0k (α)ψ3i (α))+(ψ3i (α)ψ0k (α)3k (α)ψ0i (α))+(ψ1i (α)ψ2k (α)1k (α)ψ2i (α))-(ψ2i (α)ψ1k (α)2k (α)ψ1i (α)) (i≠k)
(α)(β)
a0b0p,e/i: (ψ0i (α)ψ0k (β)0k (α)ψ0i (β))±(ψ1i (α)ψ1k (β)1k (α)ψ1i (β))+(ψ2i (α)ψ2k (β)2k (α)ψ2i (β))±(ψ3i (α)ψ3k (β)3k (α)ψ3i (β))
a0b0m,e/i: (ψ0i (α)ψ0k (β)0k (α)ψ0i (β))±(ψ1i (α)ψ1k (β)1k (α)ψ1i (β))+(ψ2i (α)ψ2k (β)2k (α)ψ2i (β))±(ψ3i (α)ψ3k (β)3k (α)ψ3i (β)) (i≠k)
a0b1p,e/i: ±(ψ0i (α)ψ1k (β)0,k+1 (α)ψ1i (β))+(ψ1i (α)ψ0,k+1 (β)1k (α)ψ0i (β))±(ψ2i (α)ψ3k (β)2,k+1 (α)ψ3i (β))+(ψ3i (α)ψ2,k+1 (β)3k (α)ψ2i (β))
a0b1m,e/i: ±(ψ0i (α)ψ1k (β)0,k+1 (α)ψ1i (β))+(ψ1i (α)ψ0,k+1 (β)1k (α)ψ0i (β))±(ψ2i (α)ψ3k (β)2,k+1 (α)ψ3i (β))+(ψ3i (α)ψ2,k+1 (β)3k (α)ψ2i (β))
a0b2p,e/i: (ψ0i (α)ψ2k (β)0,k+1 (α)ψ2i (β))+(ψ2i (α)ψ0,k+1 (β)2k (α)ψ0i (β))±(ψ1i (α)ψ3k (β)1,k+1 (α)ψ3i (β))±(ψ3i (α)ψ1,k+1 (β)3k (α)ψ1i (β))
a0b2m,e/i: (ψ0i (α)ψ2k (β)0,k+1 (α)ψ2i (β))+(ψ2i (α)ψ0,k+1 (β)2k (α)ψ0i (β))±(ψ1i (α)ψ3k (β)1,k+1 (α)ψ3i (β))±(ψ3i (α)ψ1,k+1 (β)3k (α)ψ1i (β))
a0b3p,e/i: ±(ψ0i (α)ψ3k (β)0,k+1 (α)ψ3i (β))+(ψ3i (α)ψ0,k+1 (β)3k (α)ψ0i (β))+(ψ1i (α)ψ2k (β)1,k+1 (α)ψ2i (β))±(ψ2i (α)ψ1,k+1 (β)2k (α)ψ1i (β))
a0b3m,e/i: ±(ψ0i (α)ψ3k (β)0,k+1 (α)ψ3i (β))+(ψ3i (α)ψ0,k+1 (β)3k (α)ψ0i (β))+(ψ1i (α)ψ2k (β)1,k+1 (α)ψ2i (β))±(ψ2i (α)ψ1,k+1 (β)2k (α)ψ1i (β))
N=100のときそれぞれの括弧で閉じられた部分行列は100x100で構成されるから、それぞれの種類からシュプールによって定義されてくるエネルギー要素Enの数は、50個である。上記に定義した種類の数は、同色面間の積が8種類、異色面間の積が16種類ある。さらに、(α)(α)の取り方としては、HHとVVとCCがあるから3種類、(α)(β)の取り方としてはHVとVCとCHの3種類がある。したがって、角運動量が0,1,2,3で記述される系のエネルギー要素の数は、(3x8+3x16)x50=72x50=3600個となる。エネルギーバンドとしては、72種類についてそれぞれが50個のエネルギー準位をもった図が描けることになる。
(α) (α)
a0a0p, e / i: (ψ 0i (α) ψ 0k (α) + ψ 0k (α) ψ 0i (α) ) ± (ψ 1i (α) ψ 1k (α) + ψ 1k (α) ψ 1i ( α) ) + (ψ 2i (α) ψ 2k (α) + ψ 2k (α) ψ 2i (α) ) ± (ψ 3i (α) ψ 3k (α) + ψ 3k (α) ψ 3i (α) )
a0a1p, e: (ψ 0i (α) ψ 1k (α) + ψ 0k (α) ψ 1i (α) ) + (ψ 1i (α) ψ 0k (α) + ψ 1k (α) ψ 0i (α) ) + (ψ 2i (α) ψ 3k (α) + ψ 2k (α) ψ 3i (α) ) + (ψ 3i (α) ψ 2k (α) + ψ 3k (α) ψ 2i (α) )
a0a1m, i:-(ψ 0i (α) ψ 1k (α)0k (α) ψ 1i (α) ) + (ψ 1i (α) ψ 0k (α)1k (α) ψ 0i (α ) )-(ψ 2i (α) ψ 3k (α)2k (α) ψ 3i (α) ) + (ψ 3i (α) ψ 2k (α)3k (α) ψ 2i (α) ) (i ≠ k)
a0a2p, e / i: (ψ 0i (α) ψ 2k (α) + ψ 0k (α) ψ 2i (α) ) + (ψ 2i (α) ψ 0k (α) + ψ 2k (α) ψ 0i ( α) ) ± (ψ 1i (α) ψ 3k (α) + ψ 1k (α) ψ 3i (α) ) ± (ψ 3i (α) ψ 1k (α) + ψ 3k (α) ψ 1i (α) )
a0a3p, e: (ψ 0i (α) ψ 3k (α) + ψ 0k (α) ψ 3i (α) ) + (ψ 3i (α) ψ 0k (α) + ψ 3k (α) ψ 0i (α) ) + (ψ 1i (α) ψ 2k (α) + ψ 1k (α) ψ 2i (α) ) + (ψ 2i (α) ψ 1k (α) + ψ 2k (α) ψ 1i (α) )
a0a3m, i:-(ψ 0i (α) ψ 3k (α)0k (α) ψ 3i (α) ) + (ψ 3i (α) ψ 0k (α)3k (α) ψ 0i (α ) ) + (ψ 1i (α) ψ 2k (α)1k (α) ψ 2i (α) )-(ψ 2i (α) ψ 1k (α)2k (α) ψ 1i (α) ) (i ≠ k)
(α) (β)
a0b0p, e / i: (ψ 0i (α) ψ 0k (β) + ψ 0k (α) ψ 0i (β) ) ± (ψ 1i (α) ψ 1k (β) + ψ 1k (α) ψ 1i ( β) ) + (ψ 2i (α) ψ 2k (β) + ψ 2k (α) ψ 2i (β) ) ± (ψ 3i (α) ψ 3k (β) + ψ 3k (α) ψ 3i (β) )
a0b0m, e / i: (ψ 0i (α) ψ 0k (β)0k (α) ψ 0i (β) ) ± (ψ 1i (α) ψ 1k (β)1k (α) ψ 1i ( β) ) + (ψ 2i (α) ψ 2k (β)2k (α) ψ 2i (β) ) ± (ψ 3i (α) ψ 3k (β)3k (α) ψ 3i (β) ) (i ≠ k)
a0b1p, e / i: ± (ψ 0i (α) ψ 1k (β) + ψ 0, k + 1 (α) ψ 1i (β) ) + (ψ 1i (α) ψ 0, k + 1 (β) + ψ 1k (α) ψ 0i (β) ) ± (ψ 2i (α) ψ 3k (β) + ψ 2, k + 1 (α) ψ 3i (β) ) + (ψ 3i (α) ψ 2, k + 1 (β) + ψ 3k (α) ψ 2i (β) )
a0b1m, e / i: ± (ψ 0i (α) ψ 1k (β)0, k + 1 (α) ψ 1i (β) ) + (ψ 1i (α) ψ 0, k + 1 (β)1k (α) ψ 0i (β) ) ± (ψ 2i (α) ψ 3k (β)2, k + 1 (α) ψ 3i (β) ) + (ψ 3i (α) ψ 2, k + 1 (β)3k (α) ψ 2i (β) )
a0b2p, e / i: (ψ 0i (α) ψ 2k (β) + ψ 0, k + 1 (α) ψ 2i (β) ) + (ψ 2i (α) ψ 0, k + 1 (β) + ψ 2k (α) ψ 0i (β) ) ± (ψ 1i (α) ψ 3k (β) + ψ 1, k + 1 (α) ψ 3i (β) ) ± (ψ 3i (α) ψ 1, k +1 (β) + ψ 3k (α) ψ 1i (β) )
a0b2m, e / i: (ψ 0i (α) ψ 2k (β)0, k + 1 (α) ψ 2i (β) ) + (ψ 2i (α) ψ 0, k + 1 (β) - ψ 2k (α) ψ 0i (β) ) ± (ψ 1i (α) ψ 3k (β)1, k + 1 (α) ψ 3i (β) ) ± (ψ 3i (α) ψ 1, k +1 (β)3k (α) ψ 1i (β) )
a0b3p, e / i: ± (ψ 0i (α) ψ 3k (β) + ψ 0, k + 1 (α) ψ 3i (β) ) + (ψ 3i (α) ψ 0, k + 1 (β) + ψ 3k (α) ψ 0i (β) ) + (ψ 1i (α) ψ 2k (β) + ψ 1, k + 1 (α) ψ 2i (β) ) ± (ψ 2i (α) ψ 1, k + 1 (β) + ψ 2k (α) ψ 1i (β) )
a0b3m, e / i: ± (ψ 0i (α) ψ 3k (β)0, k + 1 (α) ψ 3i (β) ) + (ψ 3i (α) ψ 0, k + 1 (β)3k (α) ψ 0i (β) ) + (ψ 1i (α) ψ 2k (β)1, k + 1 (α) ψ 2i (β) ) ± (ψ 2i (α) ψ 1, k + 1 (β)2k (α) ψ 1i (β) )
From consisting of 100x100 is closed submatrix in each parenthesis when N = 100, the number of energy elements E n coming defined by spurs from each type is 50. The number of types defined above includes 8 types of products between the same color surfaces and 16 types of products between different color surfaces. Further, there are three types of (α) (α) taking HH, VV, and CC, and there are three types of (α) (β) taking HV, VC, and CH. Therefore, the number of energy elements of the system described by the angular momentum of 0, 1, 2, 3 is (3x8 + 3x16) x50 = 72x50 = 3600. As energy bands, 72 types can each be drawn with 50 energy levels.

<ハミルトニアンの相対論的効果の補正>
1)色とテキスチャの高次系の組み合せエネルギー
色はスピン座標系、テキスチャは動径方向の位置座標系であると仮定した。非相対論的記述ではスピン座標系と位置座標系は独立で、スピン角運動量と軌道角運動量は個別に保存量として働くが、相対論的記述では、スピン座標と位置座標の区別ができなくなる。相対論的効果の影響は、スピノール記述しなくても、非相対論的な記述のハミルトニアンに対して、スピン・軌道相互作用のエネルギーを付け加えれば、ある程度取り込める(文献F2参照)。したがって、色の高次系で定義したスピン角運動量Sと、テキスチャの高次系で定義した軌道角運動量Lとの内積によるエネルギー要素Enを構築することができる。ただし、これまで各部分系で定義してきた角運動量Mに対し、色の高次の部分系はS、テキスチャの高次の部分系はLという記号を用いる。

Figure 0005041041
<Correction of Hamiltonian relativistic effect>
1) Combination energy of higher order system of color and texture It was assumed that the color is a spin coordinate system and the texture is a radial position coordinate system. In the non-relativistic description, the spin coordinate system and the position coordinate system are independent, and the spin angular momentum and the orbital angular momentum individually act as conserved quantities, but in the relativistic description, the spin coordinate and the position coordinate cannot be distinguished. The influence of relativistic effects can be incorporated to some extent by adding spin-orbit interaction energy to the non-relativistic Hamiltonian, even without spinor description (see reference F2). Therefore, it is possible to construct the spin angular momentum S defined by the color of the higher-order system, the energy element E n by the inner product of the orbital angular momentum L defined order based texture. However, for the angular momentum M defined so far in each subsystem, the symbol S is used for the higher-order color subsystem and L is used for the higher-order texture subsystem.
Figure 0005041041

(α)=H,V,Cが独立であると仮定した場合の上述の定義は、(α)面と(α)面の内積であり、角運動量の軸反転を考慮しない場合のエネルギー要素の数は1つだけである。しかし、HVCは独立ではない側面があるので、一般的には、(α)面と(β)面の内積であり、次の3つのエネルギー要素が定義できる。

Figure 0005041041
The above definition when (α) = H, V, and C are assumed to be independent is the inner product of the (α) plane and the (α) plane, and the energy component when the axial inversion of angular momentum is not considered There is only one number. However, since HVC has non-independent aspects, it is generally the inner product of the (α) plane and the (β) plane, and the following three energy elements can be defined.
Figure 0005041041

角運動量の軸反転をした場合も、同じく別のL'ベクトルとS'ベクトル(=Sベクトル)を定義して、次のハミルトニアンも加えればよい。エネルギー要素の数として上述と合わせて2倍の6つになる。

Figure 0005041041
Even when the axis of angular momentum is reversed, another L ′ vector and S ′ vector (= S vector) may be defined and the next Hamiltonian added. The number of energy elements is doubled to 6 as described above.
Figure 0005041041

2)色とテキスチャの低次系の組み合せエネルギー
色の低次系で導入した運動量の位置座標方向への広がりσH, σV, σCは角運動量と捉えることもできる。同様にテキスチャの低次系で導入した運動量の広がりσ△H, σ△V, σ△Cも角運動量と捉えることができる。したがって、高次系の場合と同様にスピン・軌道相互作用のエネルギーが定義できる。

Figure 0005041041
2) Combination energy of low-order system of color and texture The spread σ H , σ V , and σ C of the momentum introduced in the low-order system of color in the position coordinate direction can also be regarded as angular momentum. Similarly spread sigma △ H of the introduced momentum lower order system texture, σ V, σ C may also be regarded as angular momentum. Therefore, the energy of spin-orbit interaction can be defined as in the case of higher order systems.
Figure 0005041041

低次系では角運動量の軸を反転しても元と同じ系を表すだけなので、エネルギー要素の数は3つである。   In the low-order system, even if the axis of angular momentum is inverted, it only represents the same system as the original, so the number of energy elements is three.

[文献F2]Landau and Lifshitz, Course of Theoretical Physics, Volume 3 "Quantum Mechanics (Non-Relativistic Theory)," (Third revised edition, 1977), Chapter 10 "The Atom," Section 72 "Fine Structure of Atomic levels."
<回転の内部エネルギーの追加>
1)色の高次系の回転エネルギー
上述のスピン・軌道相互作用と同様にして、スピン系の回転エネルギーに相当するスピン・スピン相互作用を定義することができる。

Figure 0005041041
[Literature F2] Landau and Lifshitz, Course of Theoretical Physics, Volume 3 "Quantum Mechanics (Non-Relativistic Theory)," (Third revised edition, 1977), Chapter 10 "The Atom," Section 72 "Fine Structure of Atomic levels. "
<Addition of internal energy of rotation>
1) Rotational energy of higher-order system of color In the same manner as the above-described spin-orbit interaction, a spin-spin interaction corresponding to the rotational energy of the spin system can be defined.
Figure 0005041041

(α)=H,V,Cが独立ではないと仮定した場合の組み合わせとして、次の2つのエネルギー要素が定義できる。

Figure 0005041041
The following two energy elements can be defined as a combination when (α) = H, V, and C are assumed not to be independent.
Figure 0005041041

2)色の低次系の回転エネルギー
低次系はモデルハミルトニアンのゆらぎ項の2次形式であるσとσの積として既に導入済みである。
3)テキスチャの高次系の回転エネルギー
上述のスピン・スピン相互作用と同様にして、座標系の軌道角運動量による回転エネルギーを定義することができる。

Figure 0005041041
2) Rotational energy of low-order color system The low-order system has already been introduced as a product of σ and σ, which is the quadratic form of the fluctuation term of the model Hamiltonian.
3) Rotational energy of higher order system of texture In the same way as the above-mentioned spin-spin interaction, rotational energy by the orbital angular momentum of the coordinate system can be defined.
Figure 0005041041

(α)=H,V,Cが独立ではないと仮定した場合の組み合わせとして、次の2つのエネルギー要素が定義できる。

Figure 0005041041
The following two energy elements can be defined as a combination when (α) = H, V, and C are assumed not to be independent.
Figure 0005041041

s,p,d,f展開している場合は、座標軸反転に対して独立な角運動量L'ベクトルが規定される。この組み合わせ方として、一方の角運動量を反転する場合の他に、両方の角運動量を反転する場合も独立なエネルギー要素となる。したがって、エネルギー要素の数としては3倍の6つになる。

Figure 0005041041
When s, p, d, f are expanded, an angular momentum L ′ vector independent of the coordinate axis inversion is defined. As a method of this combination, in addition to the case where one angular momentum is reversed, the case where both angular momentums are reversed is an independent energy element. Therefore, the number of energy elements is three times six.
Figure 0005041041

4)テキスチャの低次系の回転エネルギー
色の低次系と同様に既に導入済みである。
4) Rotational energy of the low-order system of the texture As with the low-order system of the color, it has already been introduced.

<感性の線形モデル>
このように定義した力学不変量は、全て相加的な性質を備えるので、部分系への射影という異次元空間の間の世界を分け隔てなく、全て線形結合で結んで記述することができる。すなわち、力学的不変量を構築することにより、感性の主軸間やその中の低次・高次射影の間に関する部分系を共通土俵に乗せることができる。
部分系毎に定義の異なるプランク定数hなど物理定数の違いは、部分系単位で全体をスケーリングする線形結合係数として含まれることになる。すなわち、感性は線形モデルのままで記述できる。
<Linear model of sensitivity>
Since all the mechanical invariants defined in this way have additive properties, they can be described by connecting them all with linear combinations without dividing the world between different dimensional spaces called projections onto subsystems. That is, by constructing a mechanical invariant, it is possible to place a sub-system between the main axes of sensibility and the lower-order and higher-order projections in the common earth.
Differences in physical constants such as Planck's constant h defined differently for each subsystem are included as linear coupling coefficients that scale the entire subsystem. That is, the sensitivity can be described as a linear model.

ある形容詞iに関する感性の印象度合いの強さQiは、各々の画像が発する個々のエネルギー要素の線形和で表される。形容詞毎に重要視されるエネルギー要素の大きさと符号は異なり、それが形容詞を特徴づける性質として線形結合係数という形で現れる。すなわち、画像の特徴量である力学的不変量は、純粋に微視的な画像情報から巨視的な画像情報へと変換された物理量であり、モデル化が必要なのは線形結合係数の中に集約される。線形結合係数を決定するためのモデルの事前学習も、統計物理学の基礎概念を踏襲して、画像群の統計集団に対する統計平均によって行うことを基本とする。   The intensity Qi of the impression level of a sensitivity related to a certain adjective i is expressed by a linear sum of individual energy elements emitted by each image. The size and sign of the energy element that is regarded as important for each adjective is different, and it appears in the form of a linear coupling coefficient as a property that characterizes the adjective. In other words, mechanical invariants, which are image features, are physical quantities converted from purely microscopic image information to macroscopic image information, and what needs to be modeled is aggregated in the linear combination coefficient. The The prior learning of the model for determining the linear combination coefficient is also based on the statistical average of the statistical group of the image group, following the basic concept of statistical physics.

Qi=α1F12F2+... (色)
1G12G2+... (テキスチャ)
1H12H2+... (構図)
ピラミッド型の階層構造において、各層で一度モデル化した因子構造は、そのまま不変のまま他の因子を付け加えることができる。その際に変更すべき点は、部分系と部分系の間を結ぶスケーリングのみであり、部分系内の比率、すなわち因子構造は不変である。
Qi = α 1 F 1 + α 2 F 2 + ... (color)
+ β 1 G 1 + β 2 G 2 + ... (texture)
+ γ 1 H 1 + γ 2 H 2 + ... (Composition)
In the pyramid type hierarchical structure, the factor structure once modeled in each layer can be added with other factors as it is. The only point that needs to be changed is the scaling connecting the subsystems, and the ratios within the subsystems, that is, the factor structure is unchanged.

さらに線形モデルの重要な点は、各部分系が相加的な特徴量で記述されているため、主軸間合成などの部分系の統合を行ったときの合成特徴量の数は、最も縮約度の高い単純和で表されるということである。その数は一万のオーダーとなり、感性形容詞の総数と同程度となる。   Furthermore, the important point of the linear model is that each subsystem is described with additive features, so the number of combined features when integrating subsystems such as inter-spindle synthesis is the most reduced. It is expressed by a simple simple sum. The number is on the order of 10,000, which is about the same as the total number of sensitivity adjectives.

エネルギーのみの線形結合に限らず、残りの相加的な力学的不変量である運動量と角運動量もQiに対して線形結合できる。そのとき線形結合係数はエネルギーと物理的な次元を合わせるための役割も果たす。したがって、全ての力学的不変量を用いる場合は、モデル学習時に、エネルギー単位、運動量単位、角運動量単位で線形結合係数の因子構造を決めた後、3者間で全体をスケーリングするための結合係数をもう一度決める必要がある。これは、次元を合わせることの他に、その3者間でどの不変量が重要な役割を担うかを決めることにもつながる。一般的には、多くのモデル画像で統計平均をとると運動量と角運動量の役割は低下する。   Not only the linear combination of energy but also the remaining additive mechanical invariants, momentum and angular momentum, can be linearly combined with Qi. At that time, the linear coupling coefficient also plays a role in matching energy and physical dimensions. Therefore, when all the mechanical invariants are used, after determining the factor structure of the linear coupling coefficient in energy unit, momentum unit, and angular momentum unit during model learning, the coupling coefficient for scaling the whole between the three It is necessary to decide again. In addition to matching the dimensions, this also determines which invariants play an important role among the three. In general, the role of momentum and angular momentum decreases when statistical averaging is performed on many model images.

次の節では、話を分かりやすくするためエネルギーだけを扱う場合に限定する。   In the next section, we will limit it to energy only to make the story easier to understand.

<状態密度と形容詞モデル>
画像情報から巨視的なエネルギーを導出し、あるエネルギー準位で値を持っているならば、そのエネルギー準位のエネルギーをその分だけ発しており、そのエネルギー準位に状態が存在していることを意味する。もし仮にあるエネルギー準位のエネルギー要素の値が零だとすると、その画像はそのエネルギー要素を全く発せず、その準位に状態は存在していないということになる。エネルギーの値は、負の値をとってもよい。
<State density and adjective model>
If macroscopic energy is derived from image information and has a value at a certain energy level, the energy at that energy level is emitted by that amount, and a state exists at that energy level. Means. If the value of an energy element at an energy level is zero, the image does not emit that energy element at all, and no state exists at that level. The energy value may take a negative value.

ある形容詞iにとって、エネルギー要素の値と線形結合係数の積の値が正に作用する場合は、その要素に関しては形容詞iに正の作用を及ぼし、反対に積の値が負の場合は、負の作用を及ぼす。一枚の画像から導出されるエネルギー要素の分布図、すなわち、エネルギー準位の状態の存在状況を表す図と、線形結合のモデル係数分布図との内積の総和が正の値をもつとき、その画像は形容詞iの印象をその値の分だけ持っているということになる。反対に負の値を持つとき、その画像は形容詞iの印象とは反対の方向の印象をその値の分だけ発しているということができる。したがって、モデル形容詞の線形結合係数とエネルギー要素との内積の総和Qiは、形容詞エネルギーを表している。   For an adjective i, if the value of the product of the energy element and the linear coupling coefficient acts positively, it acts positively on the adjective i for that element, and conversely if the product value is negative Has the effect of. When the sum of the inner products of a distribution diagram of energy elements derived from a single image, that is, a diagram representing the existence of energy level states and a model coefficient distribution diagram of linear combination, has a positive value, It means that the image has the impression of the adjective i by that value. On the other hand, when the image has a negative value, it can be said that the image emits an impression in the direction opposite to that of the adjective i. Therefore, the sum Qi of the inner products of the linear combination coefficient of the model adjective and the energy element represents the adjective energy.

エネルギー要素の分布図をエネルギー系全体の状態数で規格化すると、状態の存在確率を表す状態密度関数を表すことになる。正のエネルギーの値を持つものは正の状態ρ+(E)が正の存在確率を持つ。反対に、負のエネルギー値を持つものは負の状態ρ-(E)が正の存在確率も持つ。規格化は、

Figure 0005041041
となるように行う。しかし、状態密度を図示するときや、実際に状態密度と線形結合係数との間で線形結合をとるときの状態密度の表記法としては、このように2つの部分に分けなくてもよい。すなわち、エネルギー値の符号をそのまま採用して、その大きさとしてρ+(E)ないしはρ-(E)の該当する方の値を使ってρ(E)と表しておけば、記号を分けなくてもよいのである。また、線形結合係数の方も規格化しておくと下式のようになる。
Figure 0005041041
When the energy element distribution map is normalized by the number of states of the entire energy system, a state density function representing the existence probability of the state is represented. Those having a positive energy value have a positive existence probability in the positive state ρ + (E). On the other hand, the negative state ρ (E) also has a positive existence probability for those having a negative energy value. Standardization is
Figure 0005041041
To do so. However, the notation of the state density when the state density is illustrated or when the linear combination between the state density and the linear coupling coefficient is actually taken may not be divided into two parts in this way. That is, adopts the sign of the energy value as it, [rho + as its size (E) or [rho - if expressed by using the appropriate value towards that of (E) [rho and (E), not divided into symbols It may be. If the linear combination coefficient is also normalized, the following equation is obtained.
Figure 0005041041

ここに、分母の<>は、一般画像のモデルとなる画像の統計平均を、<>iは画像検索システムが用意した全ての形容詞に関する統計平均を表す。ここのnについて、同じサフィックスが出てきたときには、それらについて和をとるものとする。 Here, <> in the denominator represents a statistical average of images that are models of general images, and <> i represents a statistical average of all adjectives prepared by the image search system. When the same suffix appears for n here, the sum is taken for them.

このように分母のノルムを可能な限りの範囲に渡って画像群や形容詞群の統計平均を用いて規格化しておくと、ある画像が平均的な画像に対してどれぐらいの強度でその形容詞印象を発しているかを、絶対的な基準で数値化することが可能になる。したがって、一枚画像の中だけや、1つの形容詞の中だけに閉じた相対的な印象評価ではなく、絶対的な画像基準からの形容詞間の相互の大小関係の評価基準も備えた、絶対印象の感性を評価することが可能になる。そのため、Qiの規格化は平均的な範囲で[-1,1]の区間に収まるように規格化されるだけであり、時にはその範囲を超えることも起こりうる。   In this way, if the norm of the denominator is standardized using the statistical average of the image group and adjective group over the possible range, the adjective impression of how strong an image is with respect to the average image It is possible to quantify whether or not it is emitting on an absolute basis. Therefore, an absolute impression that includes not only a relative impression evaluation within a single image or only within one adjective but also an evaluation criterion for the mutual magnitude relationship between adjectives from an absolute image criterion. It becomes possible to evaluate the sensitivity. Therefore, the standardization of Qi is only standardized so that it falls within the [-1,1] interval in the average range, and sometimes it may exceed that range.

<線形結合係数の決め方>(図18参照)
十分に多くの一般画像モデルの中から、ある形容詞iのモデル画像を選び出して、1つ1つのエネルギー要素Enについて、それらのエネルギー値に関する頻度分布を見てみると、通常、一般画像は正規分布をし、モデル画像もその中で正規分布をしていると考えられる。ただし、統計学的に考えられうる分布の歪みも、正規分布のモデルの範囲内で記述する。
<How to determine linear combination coefficient> (see FIG. 18)
Sufficiently from among many general image model, singled out model image of a certain adjectives i, for one single energy elements E n, Looking at the frequency distribution for their energy value, usually, common image normalization The model image is considered to have a normal distribution. However, statistically possible distribution distortion is also described within the range of the normal distribution model.

モデル画像の分布の平均値が、一般画像の分布の中でどの位置に存在しているかを、一般画像の分布に対するモデル画像の偏差値という形で評価すれば、その偏差値自体が直接、そのエネルギー要素のその形容詞にとっての重要度を表す。そのとき、一般画像の分布の平均値を零として両端が[-1,1]の区間で表される偏差値を用いれば直接、線形結合係数として用いることができる。
この偏差値は、幅が一般画像分布の標準偏差値で与えられる正規分布になることを仮定し、一般分布の平均値からモデル画像の平均値までの区間の分布関数の積分値の形で与える。また、偏差値の誤差も一般画像分布とモデル画像分布のそれぞれの平均値と標準偏差値を与えれば計算できる。
If the average value of the distribution of the model image is located in the distribution of the general image in the form of the deviation value of the model image relative to the distribution of the general image, the deviation value itself is directly Represents the importance of the energy element for that adjective. At that time, if the average value of the distribution of the general image is zero and the deviation value represented by the interval [-1, 1] at both ends is used, it can be directly used as a linear combination coefficient.
This deviation value is assumed to be a normal distribution whose width is given by the standard deviation value of the general image distribution, and is given in the form of an integral value of the distribution function of the interval from the average value of the general distribution to the average value of the model image . Further, the error of the deviation value can be calculated by giving the average value and the standard deviation value of the general image distribution and the model image distribution, respectively.

一般画像の分布が必ずしも正規分布でないことがあるため、モデルの分布位置の表し方には、統計学的に他にも実際の分布そのものを使ってpercentile rankを定義する指標も存在する。実験を行ったところ、分布の中央値から実分布を積分したpercentile rankよりも、正規分布を仮定した誤差関数による積算値で与える偏差値のほうが線形結合係数として優れていることが判明したので、通常はそちらを用いる。   Since the distribution of the general image may not always be a normal distribution, there are other indicators statistically defining the percentile rank using the actual distribution itself in the manner of expressing the distribution position of the model. As a result of experiments, it turned out that the deviation value given by the integrated value by the error function assuming a normal distribution is better as the linear combination coefficient than the percentile rank that integrated the real distribution from the median of the distribution. Usually you use it.

形容詞のモデル画像のエネルギー値が分布しているということは、エネルギー値がゆらいでいることを意味する。したがって、多数の画像群を用いて感性を確定する感性の記述法は、エネルギー値のゆらぐ分布の巨視的な物理量を記述する統計物理学のギブス分布(カノニカル分布)と対応関係にあるといえる(文献E4参照)。   The distribution of the energy values of the adjective model image means that the energy values fluctuate. Therefore, it can be said that the sensitivity description method that determines the sensitivity using a large number of images has a correspondence with the Gibbs distribution (canonical distribution) of statistical physics that describes the macroscopic physical quantity of the fluctuation distribution of energy values ( Reference E4).

一方、モデル形容詞の画像を減らして一枚画像のみになる極限をとると、一般画像分布の中でその画像がもつ巨視的なエネルギー値に確定した、エネルギー値のゆらがない系の巨視的な物理量を比較する記述に置き換わる。その意味で一枚の類似画像検索は、その画像の巨視的な物理量のエネルギー値、また運動量と角運動量のそれぞれがデルタ関数で記述された統計物理学のミクロカノニカル分布の記述と対応している。
その意味で、感性を力学的に記述する方法は、一枚の類似画像検索から多数枚によって構成する感性画像検索をシームレスに記述しうる性能を備える。その方法は、線形結合係数を決めるためのモデル画像の数を目的の画像集団の数に変えるだけである。
On the other hand, if the model adjective image is reduced to the limit of only one image, the macroscopic energy of the system without the fluctuation of the energy value is fixed in the general image distribution. Replaced with a description comparing physical quantities. In that sense, a single similar image search corresponds to the macroscopic physical quantity energy value of the image, and the description of the microcanonical distribution of statistical physics where each of the momentum and angular momentum is described by a delta function. .
In that sense, the method for dynamically describing the sensibility has the capability of seamlessly describing the sensibility image search constituted by a large number of images from one similar image search. The method only changes the number of model images for determining the linear combination coefficient to the number of target image groups.

[文献E4]ランダウ、リフシッツ理論物理学教程第5巻「統計物理学第1部」(第3版、1976年)、第3章「ギブス分布」第28節「ギブス分布」、及び第35節「粒子数の変わりうるギブス分布」
<部分系の統合>
形容詞エネルギーは、部分系単位で上述のようにして期待値が確定しているので、次にその統合方法を考える必要がある。一般に、全系を記述するハミルトニアンが、部分系のハミルトニアンの線形結合で表されるとき、すなわち、感性の線形モデルが成り立っているとき、全系のハミルトニアンの解である波動関数は、部分系のハミルトニアン解の波動関数の線形結合で表される。したがって、その波動関数に対応する固有値に関しても同様に、全系のエネルギー固有値Enは部分系のエネルギー固有値の線形結合で表される。この関係を式で表すと、
H=k1H1+k2H2+k3H3+k4H4+...
H1:色の低次不変量
H2:色の高次不変量
H3:テキスチャの低次不変量
H4:テキスチャの高次不変量
図19は、ピラミッドの階層構造の想像図である。
追加因子のエネルギー要素が、これまでのエネルギー準位の縮退を解いて、状態分離する役割を果たす。
すなわち、些細な状態の違いも、実数値というエネルギー値の表現を通して、連続的に数値化することを可能とする。部分系として構図系に関するエネルギーを加えると、これまで構図に関して縮退していたエネルギーが解けて、構図に起因した感性の違いを区別することが可能になる。
[Literature E4] Landau, Lifschitz Theoretical Physics, Vol. 5, "Statistical Physics Part 1" (3rd edition, 1976), Chapter 3, "Gibbs Distribution", Section 28, "Gibbs Distribution", and Section 35 "Gibbs distribution with variable number of particles"
<Partial integration>
Since the expected value of the adjective energy is fixed as described above for each subsystem, it is necessary to consider the integration method. In general, when the Hamiltonian describing the entire system is expressed by a linear combination of the Hamiltonians of the subsystems, that is, when the Kansei linear model is established, the wave function that is the solution of the entire Hamiltonian is It is expressed as a linear combination of the wave functions of the Hamiltonian solution. Accordingly, similarly for the eigenvalue corresponding to the wave function, the energy eigenvalue En of the entire system is represented by a linear combination of the energy eigenvalues of the subsystems. This relationship is expressed by an expression:
H = k 1 H 1 + k 2 H 2 + k 3 H 3 + k 4 H 4 + ...
H 1 : Low-order invariant of color
H 2 : High-order invariant of color
H 3 : Lower order invariant of texture
H 4 : Higher-order invariant of texture FIG. 19 is an imaginary view of the hierarchical structure of the pyramid.
The energy component of the additional factor plays a role in separating states by solving the conventional energy level degeneracy.
That is, even a slight difference in state can be quantified continuously through the expression of energy values as real values. When energy related to the composition system is added as a sub-system, the energy that has been degenerated in relation to the composition can be solved, and it becomes possible to distinguish the difference in sensitivity caused by the composition.

<線形結合係数kの決め方>
部分系毎に状態密度関数ρ(En)と線形結合係数α(En)の内積として定義された部分系の形容詞エネルギーPi,j(ここでは全系の形容詞エネルギーQiと区別する記号を導入しておく)は、これまで部分系内で1つ1つのエネルギー要素に対して行ってきたのと全く同じ過程を経て、それらに対する線形結合係数kを決めることができる。すなわち、線形結合の部分和をとったエネルギー指標に関して、一般画像モデルの画像群がどのように分布するのかを調べ、その中で形容詞モデルの画像群がどの位置に分布しているのかを偏差値で評価することにより、線形結合係数kが決まる。
<How to determine linear combination coefficient k>
Subsystem adjective energy Pi, j defined here as the inner product of state density function ρ (E n ) and linear coupling coefficient α (E n ) for each subsystem The linear combination coefficient k can be determined through exactly the same process that has been performed for each energy element in the subsystem until now. In other words, regarding the energy index obtained by partial summation of the linear combination, it is examined how the image group of the general image model is distributed, and the deviation value indicates where the image group of the adjective model is distributed. Is used to determine the linear combination coefficient k.

こうして求まった線形結合係数kは、ある形容詞にとって色とテキスチャと構図のどの部分系要素が、実際には強く作用してその形容詞の印象を決定しているのかという、部分系の作用割合を解明することにつながる。方法論としては、部分系の線形結合係数kに対して[-1,1]の範囲の値をとりうるが、実際に実験を行ってみると、正の値しかとらない結果を与える。これは、因子構造の作用割合しか変えないという部分系が本来持っている役割と不思議と合致する。   The linear combination coefficient k obtained in this way elucidates the effect ratio of the subsystem, which subsystem element of color, texture, and composition actually determines the impression of the adjective by acting strongly on the adjective. Will lead to. As a methodology, a value in the range of [-1,1] can be taken for the linear combination coefficient k of the subsystem, but when an experiment is actually performed, a result that takes only a positive value is given. This is in accord with the mystery of the role inherent in the subsystem that only changes the rate of action of the factor structure.

このように部分系が全て相加的なエネルギーという性質を持っている場合は部分系を区切ることによって、部分和単位で線形結合係数を再度決定して部分系を統合することができる。エネルギーのみを扱う系では、他の部分空間との間で統合する2段階統合を経ることになる。   In this way, when all the subsystems have the property of additive energy, the subsystems can be integrated by dividing the subsystems to determine the linear coupling coefficient again in units of partial sums. In a system that handles only energy, two-stage integration is performed that integrates with other subspaces.

同様の考えで、運動量と角運動量とエネルギーの全てを扱う系では、それらの力学的不変量の間に部分系の区切り概念が存在するので、3段階統合をする必要がある。すなわち、最初に運動量内、角運動量内、エネルギー内の要素間で因子構造を決めた後、線形和をとった運動量と角運動量とエネルギーの内のどの力学的不変量が実際には支配的役割を果たすかを決定し、それらの線形和で表された部分系の代表エネルギーが、今度は部分系間でどれだけの重要度にあるかを決定することになる。
線形結合係数を決める過程を学習と呼ぶと、部分系単位の多段階学習をするシステムであるともいうことができる。
In the same way, in a system that handles all of momentum, angular momentum, and energy, there is a concept of sub-system partitioning between these mechanical invariants, so it is necessary to integrate three stages. That is, after first determining the factor structure among the elements in momentum, angular momentum, and energy, which mechanical invariant of momentum, angular momentum, and energy that is the linear sum is actually the dominant role And the importance of the representative energy of the subsystems expressed by their linear sum is now determined between the subsystems.
If the process of determining the linear combination coefficient is called learning, it can be said that it is a system that performs multi-stage learning for each subsystem.

<エネルギーバンド図>
図20は、色及びテキスチャにおけるエネルギーバンド図である。エネルギー準位の順に状態密度関数を図示すると、低次系のスカラー不変量は離散的なエネルギー準位に、高次系のベクトル不変量は連続的なエネルギー準位になる。これはあたかもアボガドロ数に及ぶ原子の集合体である、例えば金属物質が、内殼の電子軌道は原子軌道に近い離散的エネルギー準位に、外殻の電子軌道は、隣接する原子の電子軌道とが重なり合って緻密なエネルギー準位からなる伝導帯でエネルギーバンド構造をもつような系と類似した状態密度図ができあがる。
<Energy band diagram>
FIG. 20 is an energy band diagram for color and texture. If the state density function is illustrated in the order of energy levels, a scalar invariant of a lower order system becomes a discrete energy level, and a vector invariant of a higher order system becomes a continuous energy level. This is an aggregate of atoms that has an Avogadro number, for example, a metallic material, the inner electron orbit is in a discrete energy level close to the atomic orbit, and the outer electron orbit is the electron orbit of an adjacent atom. A state density diagram similar to a system with an energy band structure in a conduction band consisting of dense energy levels with overlapping layers is created.

ある人物が選択した「爽やかな」という形容詞モデルから作り上げたエネルギーバンド図の様子を例示する。比較のため典型的な遷移金属であるニッケルの伝導帯におけるエネルギーバンド図を示す(図21参照)。   An example of an energy band diagram created from an adjective model “fresh” selected by a person is illustrated. For comparison, an energy band diagram in the conduction band of nickel, which is a typical transition metal, is shown (see FIG. 21).

物質の電子構造を決めるのは、その担い手である電子がスピン1/2のフェルミ粒子の系である。したがって、パウリの排他原理が作用して、上向きスピンと下向きスピンが混合することはない。したがって、図21右側の状態密度と図21左側の状態密度が混合することなく、低いエネルギー準位の下から順に状態が詰まって行き、フェルミエネルギー準位まで埋まる構造となる。   The electronic structure of a substance is determined by a Fermi particle system whose electron is the spin 1/2. Therefore, Pauli's exclusion principle works, and upward spins and downward spins do not mix. Therefore, the state density on the right side of FIG. 21 and the state density on the left side of FIG. 21 are not mixed, and the states are sequentially packed from the bottom of the low energy level, and the structure is filled up to the Fermi energy level.

一方の画像の感性を記述するエネルギーバンド図はそれとは違った様子になっている。すなわち、正のエネルギー値をとる状態(図21右側の状態密度図)と負のエネルギー値をとる状態(図21左側の状態密度図)が任意の準位で右へ行ったり左へ行ったりすることを許し、その状態密度の大きさも任意だけ詰まることを許している。これは、ある意味でボーズ粒子の性質を記述していると解釈することができる。したがって、画像の状態系として、あるエネルギー準位に状態が集中する凝縮も生じうる。   The energy band diagram describing the sensitivity of one image looks different. That is, a state taking a positive energy value (state density diagram on the right side of FIG. 21) and a state taking a negative energy value (state density diagram on the left side of FIG. 21) go right or left at an arbitrary level. The state density is allowed to be arbitrarily packed. This can be interpreted as describing the nature of the Bose particle in a sense. Therefore, condensation in which the state concentrates at a certain energy level may occur as a state system of the image.

もし仮に色がスピン系を記述しているとするならば、色の高次不変量を記述するのに最適と選択したチェビシェフ関数は、実は角運動量1の系しか状態記述しえない特殊関数であることと丁度符合する。画像を形作る光子は、量子力学的にスピン角運動量が1の系である。なお、エネルギーバンド図の様子から、色のスピン系は非常にきめ細やかな因子構造を記述している様子が伺える。   If the color describes a spin system, the Chebyshev function chosen to be optimal for describing higher-order invariants of color is actually a special function that can only describe the state of angular momentum 1 systems. It matches exactly what is there. The photon forming the image is a system having a spin angular momentum of 1 in terms of quantum mechanics. From the state of the energy band diagram, it can be seen that the color spin system describes a very detailed factor structure.

一方の動径方向の波動関数を記述するのに適した球ベッセル関数を用いて記述したテキスチャ系は非常に大雑把なエネルギー構造を記述している様子が伺える。これは、物質原子のエネルギー準位を考えたとき、動径方向の波動関数が大きなエネルギー準位を決定し、次に天頂角と方位角の方向の波動関数が次に微細なエネルギー準位を決定し、さらに微細なエネルギー準位をスピン系が決定するという関係と非常な相似した関係にある。ただし、固体などの物質の電子構造となると、例えば強磁性体ではスピン系が大きな役割を果たし始めたりするので、そのエネルギー準位の分離の大きさの程度の大小関係は、原子が集まった凝集系では一概に述べることができない。   It can be seen that the texture system described by using a spherical Bessel function suitable for describing one radial wave function describes a very rough energy structure. This is because when considering the energy level of a material atom, the radial wave function determines the large energy level, and then the wave function in the direction of the zenith angle and azimuthal angle has the next fine energy level. This is very similar to the relationship in which the spin system determines a finer energy level. However, when it comes to the electronic structure of a substance such as a solid, the spin system begins to play a major role in ferromagnets, for example, so the magnitude relationship of the degree of separation of the energy levels is agglomeration of atoms. The system cannot be described in general.

これらのエネルギー準位構造の関係は、形容詞系が持っているとされるピラミッド構造とそれに関連して予測した特徴量のピラミッド構造の在り方との対応関係を比較すると、力学的記述法における相加的なエネルギーの性質が、新たな主軸のエネルギー要素の追加によって、今まで考察していた系のみのエネルギー準位の縮退を解いていく様子と極めて類似した関係にある。   The relationship between these energy level structures can be found by comparing the correspondence between the pyramid structure that the adjective system has and the way the pyramid structure of the predicted features is related. The nature of the general energy is very similar to the way of solving the degeneracy of the energy level of only the system considered so far by adding a new principal axis energy element.

<画像の温度>
画像系において、定常状態と非定常状態の両方を含む系の温度を定義する。温度は、エネルギー状態数の総和であると位置づけられる。したがって、エネルギーの量子状態Enを、状態nについてベクトル表現したときのベクトルのノルムを温度とする。これは、エネルギー状態密度を定義したときの分母の規格化因子に相当する。各々の画像がとりうるエネルギー状態の数は違っており、温度もそれぞれの画像で異なる。したがって、画像の温度という概念を定義できることになる。画像の温度は、状態数の勘定方法が共通な部分系単位で最初に定義する必要がある。また、画像の温度は、エネルギーと同じ次元を持つ。
<Image temperature>
In an image system, the temperature of the system including both steady state and unsteady state is defined. Temperature is positioned as the sum of the number of energy states. Therefore, the quantum state E n of the energy, the temperature norm of a vector when the vector representation for state n. This corresponds to the denominator normalization factor when the energy density of states is defined. The number of energy states that each image can take is different, and the temperature is also different for each image. Therefore, the concept of image temperature can be defined. It is necessary to first define the temperature of the image in the subsystem unit that shares the accounting method of the number of states. Also, the image temperature has the same dimension as energy.

ベクトルのノルムは、零以上の値をとるから温度が満たす条件を満足する。また、エネルギーの状態数が存在しないとき、その画像系は絶対零度となる。しかし、部分系の投影面として不確定性原理の働く共役な空間を同時に記述しているので、絶対零度になる画像を作るのは困難である。   Since the norm of the vector takes a value of zero or more, the condition that the temperature satisfies is satisfied. Also, when there is no energy state number, the image system is at absolute zero. However, since a conjugate space in which the uncertainty principle works is described as the projection plane of the subsystem at the same time, it is difficult to create an image that has absolute zero.

<画像のエントロピー>
画像のエントロピーを、部分系に射影された運動量pと位置qの位相空間における分布関数f(p,q)の定義に基づいて状態数を勘定し、部分系単位で定義する。この意味でエントロピーSをS=S(f)=S(p,q)と表記できる。
<Entropy of image>
The entropy of the image is defined in units of subsystems, counting the number of states based on the definition of the momentum p projected onto the subsystem and the distribution function f (p, q) in the phase space of position q. In this sense, the entropy S can be expressed as S = S (f) = S (p, q).

部分系単位で定義されたエントロピーは各々相加的な性質を持つので、全系のエントロピーを定義することもできる。aを部分系を表すものとすると

Figure 0005041041
Since the entropy defined in the subsystem unit has an additive property, the entropy of the entire system can be defined. If a represents a subsystem,
Figure 0005041041

エントロピーは無次元の量である。   Entropy is a dimensionless quantity.

部分系aのエントロピーを以下の式で計算する。積分は分布関数の値が有限の区間でのみ実行するものとする。値が零の区間は飛ばすものとする。ただし、分布関数の状態数は規格化されているものとする。したがって、必ず零以上の値をとり、エントロピーの要件を満たす。

Figure 0005041041
The entropy of subsystem a is calculated by the following formula. Integration is performed only in the interval where the value of the distribution function is finite. The interval with zero value shall be skipped. However, the number of states of the distribution function is assumed to be standardized. Therefore, it always takes a value greater than or equal to zero to satisfy the entropy requirement.
Figure 0005041041

部分系の分布関数f(p,q)が運動量pだけの関数に投影されている場合は、下式を用いる。積分方法については同様である。ただし、分布関数の状態数は規格化されているものとする。

Figure 0005041041
When the distribution function f (p, q) of the subsystem is projected onto a function having only momentum p, the following equation is used. The integration method is the same. However, the number of states of the distribution function is assumed to be standardized.
Figure 0005041041

部分系の分布関数f(p,q)が位置qだけの関数に投影されている場合にも同様な定義ができる。全ての部分系での分布関数が、1つの状態に集中したときエントロピーは零になる。ただし、分布関数として不確定性関係にある共役な分布関数の両方を見ているので、この条件を満足する画像は容易に存在しない。エントロピーは画像の乱雑度を表す物理量である。   A similar definition can be made when the distribution function f (p, q) of the subsystem is projected onto a function of only the position q. When the distribution functions in all subsystems are concentrated in one state, the entropy becomes zero. However, since both conjugated distribution functions that are in an uncertain relationship are viewed as distribution functions, there is no image that satisfies this condition. Entropy is a physical quantity that represents the degree of randomness of an image.

エントロピーSと合わせて熱量Q=TSという熱力学的な不変量を作る実験を行ってみると、例えば色の低次不変量のエネルギーのみを扱った部分系では、低温系ではモノクロ画像に近く涼しい印象の画像が、高温系では全面的にカラフルで、赤系のこともあれば真夏の高原風景のようなものも含む暑い印象の画像が分かれる。また、他の部分系では、例えばテキスチャの高次不変量を扱った部分系では、一様なテキスチャがびっしり詰まった画像が低温系に、適正な構図と主要被写体を伴った要約的な画像が高温系に集まるという特徴がある。他の部分系についても概略を述べておくと、テキスチャの低次不変量の部分系では、のっぺりと静かな印象の低温系と、物体や人物が多数集まったごわごわと情感のこもる高温系に分かれる。色の高次不変量の部分系では、日本的な構造物や晴れ着などに多い精悍な印象の低温系と深く濃い色合いの印象の高温系に分かれる。このようにTS不変量は、部分系の性質を見極める上でも、独立な部分系を扱っているかどうかを検証する上でも重要な役割を果たす。   Experiments with the entropy S to create a thermodynamic invariant of heat quantity Q = TS, for example, in a sub-system that deals only with the low-order invariant energy of color, the low temperature system is close to a monochrome image and cool The image of the impression is colorful in the high temperature system, and the image of the hot impression including the red system and the highland scenery in midsummer is divided. Also, in other subsystems, for example, in subsystems dealing with higher-order invariants of textures, images with tightly packed uniform texture are low-temperature systems, and summary images with proper composition and main subjects are displayed. It is characterized by gathering in high temperature systems. To outline other subsystems, the low-order invariant subsystems of the texture are divided into a low-temperature system with a quiet and quiet impression, and a high-temperature system that has a lot of objects and people gathered together and is full of emotion and emotion. . The high-order invariant subsystem of color is divided into a low-temperature system with a vivid impression often found in Japanese structures and sunny clothes, and a high-temperature system with a deep, dark hue. Thus, TS invariants play an important role in determining the properties of subsystems and verifying whether they are dealing with independent subsystems.

<自由エネルギー>
エネルギーEnの値をエネルギー準位nについてn次元のベクトル表記し、更にスカラー不変量TSを付け加えて自由エネルギーFを定義する。

Figure 0005041041
<Free energy>
The value of the energy E n is expressed as an n-dimensional vector for the energy level n, and a scalar invariant TS is further added to define the free energy F.
Figure 0005041041

これは画像系自身がもつ巨視的な性質を表す熱力学的物理量である。この画像の巨視的性質から、ある形容詞の性質をどれだけ発しているかを、形容詞のモデルとなる線形結合係数αベクトルとの内積をとることによって計測することができる。

Figure 0005041041
This is a thermodynamic physical quantity that represents the macroscopic properties of the image system itself. From the macroscopic properties of this image, how much the properties of a certain adjective are emitted can be measured by taking the inner product with the linear combination coefficient α vector that is a model of the adjective.
Figure 0005041041

したがって、エネルギーバンドの状態密度を説明したときの形容詞エネルギーQiの定義に対して、若干の変更を加えた定義を用いていることになる。
1/<S>は、部分系単位で定義されるボルツマン定数kを表している。なぜなら、部分系単位で状態の数を数えるためのプランク定数hの測り方が異なるから、部分系を統合するとき両者のスケールを合わせるための重要な役割を果たす。このように、部分系統合をするときは、その分母の規格化の仕方が非常に大切な役割を果たす。その基本的考え方として、可能な限りの統計平均をとったものを分母に持ってくるべきであるというのが、実験的に明らかになった事実である。内積を[-1,1]の区間に納めるだけの目的ならば、分母に分子の絶対値の最大値を持ってくるようなことも考えられるが、実際にそのようなことを行ってみると、全系としてのエネルギー計測には失敗することになる。
Therefore, the definition with a slight change is used for the definition of the adjective energy Qi when explaining the density of states of the energy band.
1 / <S> represents the Boltzmann constant k defined in the subsystem unit. This is because the Planck's constant h for measuring the number of states in each subsystem is different, so that it plays an important role in matching both scales when integrating subsystems. Thus, when subsystem integration is performed, the denominator standardization method plays a very important role. The basic idea is that it should be brought to the denominator with the statistical average as much as possible. If the purpose is to fit the inner product to the interval [-1,1], it may be possible to bring the absolute value of the numerator to the denominator. The energy measurement as the whole system will fail.

このように変更を加えた第1の理由は、形容詞エネルギーを求めるときの内積演算の形が、ギブス分布の引数の形に酷似しているからである。すなわち、ギブス分布のエネルギー状態Enに対する励起確率は

Figure 0005041041
と表され、自由エネルギーは確率分布の規格化因子の役割を果たす(文献E5参照)。そして、感性という画像系の巨視的な性質が、エネルギー関数の拘束条件E=E(p,q)のゆらぎ分布の中で、位相空間上の状態数がエントロピーS(p,q)=S(E)を通して、エネルギー状態密度分布ρ(En)によって記述される対応関係にあると考える。 The first reason for this change is that the shape of the inner product operation when obtaining the adjective energy is very similar to the shape of the argument of the Gibbs distribution. That is, the excitation probability for energy state E n of the Gibbs distribution
Figure 0005041041
The free energy plays the role of a normalization factor for the probability distribution (see reference E5). And the macroscopic property of the image system called Kansei is that the number of states in the phase space is entropy S (p, q) = S (in the fluctuation distribution of the energy function constraint E = E (p, q). Through E), it is considered that there is a correspondence relationship described by the energy state density distribution ρ (E n ).

第2の理由は、自由エネルギーF=E-TSは、それらを通してなす熱力学的な仕事量を意味する(文献E6参照)。これを次のように解釈する。画像系の微視的な状態(画素値の分布)は、巨視的な状態を表す物理量であるエネルギーE、熱量TSという形で、人の脳に対して、熱力学的な仕事Fをして、感性を誘起する。したがって、画像系の信号値分布のみから算出されたエネルギーバンド図は、画像自身の巨視的な性質を表すのに対し、それらに対して線形結合係数αベクトルを掛けた状態分布図は、人の脳内の感性の分布図を視覚的に定量化していると位置づけられる。   The second reason is that free energy F = E-TS means the thermodynamic work done through them (see reference E6). This is interpreted as follows. The microscopic state of the image system (pixel value distribution) is a physical quantity representing the macroscopic state, energy E and heat quantity TS, and a thermodynamic work F is performed on the human brain. Induces sensitivity. Therefore, the energy band diagram calculated from only the signal value distribution of the image system represents the macroscopic nature of the image itself, whereas the state distribution diagram obtained by multiplying them by the linear combination coefficient α vector It is considered that the distribution map of sensibility in the brain is visually quantified.

実際に、このような描像をとってみると、視覚心理量の面白い事実も説明できるようになる。すなわち、写真を真っ白な背景色の額縁をもつ絵と、真っ黒な背景色の額縁を持つ絵の印象の違いが生じることが、自由エネルギーの違いによって説明できる。真っ白な背景色と真っ黒な背景色がもつ自由エネルギーの値はそれぞれ計算でき、値は違っている。その背景色から額縁内に絵を示したときの自由エネルギーの変化量に相当する感性を誘起し、前者と後者ではその変化量が異なるため、誘起する感性も違ってくると考えられる。   In fact, taking such a picture can explain the interesting facts of visual psychology. That is, it can be explained by the difference in free energy that the difference in impression between a picture with a picture frame with a white background color and a picture with a picture frame with a black background color occurs. The free energy values of the white background color and the black background color can be calculated, but the values are different. The sensibility corresponding to the amount of change in free energy when a picture is displayed in the frame from the background color is induced. Since the amount of change differs between the former and the latter, the induced sensibility is considered to be different.

自由エネルギーで測る形容詞エネルギーが、視覚心理量と実際に実験を行ってみると、極めて線形な関係で画像の順番が並ぶ様子が確認される。このひとつの解釈として、人間の視覚心理量は、光量に対して対数的な応答特性を持っており、ギブス分布の励起確率の引数に対して、線形なスケールの印象を受けることになっていると考えられる。   When we actually experiment with the amount of adjectives measured with free energy, we can see that the images are arranged in an extremely linear relationship. One interpretation of this is that the human visual psychological quantity has a logarithmic response characteristic with respect to the amount of light, and is given an impression of a linear scale for the argument of the excitation probability of the Gibbs distribution. it is conceivable that.

[文献E5]ランダウ、リフシッツ理論物理学教程第5巻「統計物理学第1部」(第3版、1976年)、第3章「ギブス分布」、第28節「ギブス分布」、及び第31節「ギブス分布における自由エネルギー」
[文献E6]ランダウ、リフシッツ理論物理学教程第5巻「統計物理学第1部」(第3版、1976年)、第2章「熱力学的諸量」、第13節「仕事と熱量」、第15節「自由エネルギーと熱力学ポテンシャル」、及び第20節「外部の環境体の中におかれた物体によってなされる最大仕事」
[5]記述モデルの評価と性能
<形容詞の絶対印象の出力>
ある画像を表示して、ある人物の形容詞モデルでの絶対印象をエネルギーバンド図に基づいて数値評価した例を示す。値の大きい順に並び替えて、例えば、「爽やかな」=+0.47、「しっとりとした」=+0.02、「荒々しい」=-0.16、「賑やかな」=-0.75のように記述する。
[Literature E5] Landau, Lifschitz Theoretical Physics, Vol. 5, "Statistical Physics Part 1" (3rd edition, 1976), Chapter 3, "Gibbs distribution", Section 28, "Gibbs distribution", and 31 Section "Free energy in Gibbs distribution"
[Reference E6] Landau, Lifschitz Theoretical Physics, Vol. 5 "Statistical Physics Part 1" (3rd edition, 1976), Chapter 2 "Thermodynamic quantities", Section 13 "Work and heat" , Section 15 “Free energy and thermodynamic potential”, and Section 20 “Maximum work done by objects placed in external environmental bodies”
[5] Evaluation and performance of the description model <Output of absolute adjective impression>
An example is shown in which an image is displayed and an absolute impression of an adjective model of a person is numerically evaluated based on an energy band diagram. For example, “refreshing” = + 0.47, “moist” = + 0.02, “rough” = − 0.16, “lively” =-0.75.

<形容詞の相関行列>
第5の実施の形態で定義する、ある人物に基づいて形容詞と形容詞との間の相関関係を解明する形容詞の相関行列wijの例を示す。色とテキスチャまでの部分系を扱った範囲での値である。iとjは、「爽やかな」、「賑やかな」、「荒々しい」、「しっとりした」の順に形容詞番号を割り当てている。

Figure 0005041041
<Correlation matrix of adjectives>
An example of an adjective correlation matrix w ij that clarifies the correlation between adjectives based on a certain person defined in the fifth embodiment will be shown. It is a value in the range that handles the subsystems up to color and texture. i and j are assigned adjective numbers in the order of “fresh”, “lively”, “rough”, “moist”.
Figure 0005041041

<再現性>
一般画像のモデルとなる母集団画像と、その中から選んだ形容詞モデルの画像群について、心理的な印象度合いを例えば5段階評価したリストを用意しておけば、各々の不変量に対して形容詞モデルを構築するための線形結合係数を決めることにも使え、更にはその部分和である部分系の線形結合係数を決めることができる。この考え方を更に進めれば、全系の総和であるQiについても、一般画像のQiの値の分布に対して、モデル形容詞画像群のQiの分布の平均値が、偏差値としてどの位置にまで上位群に抽出することができたかを計測することができる。これは客観的な再現率を見るための指標となりうる。
<Reproducibility>
If you prepare a list that evaluates the degree of psychological impression, for example, for a population image that is a model of a general image and an image group of an adjective model selected from them, an adjective for each invariant It can also be used to determine the linear combination coefficient for constructing the model, and further, the linear combination coefficient of the subsystem that is the partial sum can be determined. If this concept is further advanced, for Qi, which is the total sum of the entire system, the average value of the distribution of Qi in the model adjective image group is up to which position as a deviation value relative to the distribution of the Qi value in the general image. It can be measured whether it was able to be extracted to the upper group. This can be an index for seeing objective recall.

モデル画像の選び方として、該当と非該当の0、1判断する手法と、心理的な印象度合いを段階分けして評価する方法がある。5段階評価の場合は、心理学でいうSD法(Semantic Differential法)という手法に従い、0を非該当、1−5までの整数を該当度合いの高さで表すことにする。   As a method of selecting a model image, there are a method of judging 0 or 1 as appropriate or not applicable, and a method of evaluating a psychological impression degree in stages. In the case of five-level evaluation, according to a method called SD method (Semantic Differential Method) in psychology, 0 is not applicable, and integers up to 1-5 are expressed with a corresponding degree of height.

平均値や偏差値などの統計データを計算する場合、0−1判断の場合は、モデル画像に関して均等な重みで平均を計算する。一方、5段階評価する場合は、モデル平均する場合に、心理度1のものには0.2枚分の重みだけ該当、心理度2のものには0.4枚分の重みだけ該当、…、のように、心理度5のものが1枚分の重み評価を受けるようにして、計算する。   When calculating statistical data such as an average value and a deviation value, in the case of 0-1 determination, the average is calculated with an equal weight for the model image. On the other hand, in the case of five-level evaluation, when the model is averaged, the weight of 0.2 sheets applies to the psychological degree 1, the weight of 0.4 sheets corresponds to the psychological degree 2, ... As described above, the calculation is performed so that the one with a psychological degree of 5 receives the weight evaluation for one sheet.

このように計算すると、モデル画像の平均値とその分布の広がり幅を標準偏差で評価すれば、平均値の誤差も評価できる。すなわち、これらの値と一般画像の平均値とその標準偏差と合わせて、モデル画像の平均値の一般画像の分布に対する位置を示す偏差値を計算する過程で、その定義に基づいて偏差値の誤差も評価すれば、偏差値の評価信頼度も合わせたデータを出すことができる。   By calculating in this way, the error of the average value can be evaluated by evaluating the average value of the model image and the spread width of the distribution with the standard deviation. That is, in the process of calculating the deviation value indicating the position of the average value of the model image with respect to the distribution of the general image, by combining these values, the average value of the general image, and the standard deviation thereof, an error of the deviation value based on the definition is calculated. If it is also evaluated, it is possible to obtain data that combines the evaluation reliability of the deviation value.

一般画像のモデル254枚の中から、被験者に対して「爽やかな」、「賑やかな」、「荒々しい」、「しっとりとした」の4つの形容詞モデルを選んだ結果における再現率を示す。第5の実施形態の方法の場合、複数人の統計平均結果は、順におよそ次のような偏差値となり、極めて高い再現率を実現することを意味している。それぞれ0-100%定義の偏差値で、85±12%、86±7%、98±2%、84±12%のようになる。線形性についても、心理評価値とQi値との間の関係を調べれば数値化できる。   The reproducibility is shown as a result of selecting four adjective models of “fresh”, “lively”, “rough”, and “moist” from 254 models of general images. In the case of the method of the fifth embodiment, the statistical average result of a plurality of persons becomes the following deviation value in order, which means that an extremely high recall is realized. Deviation values of 0-100% definition are 85 ± 12%, 86 ± 7%, 98 ± 2%, 84 ± 12% respectively. Linearity can also be quantified by examining the relationship between psychological evaluation values and Qi values.

まず、第5の実施形態では形容詞モデルの画像が多数存在する場合の安定的な感性検索システムを述べる。次に、第6の実施形態では形容詞モデル画像が少数の場合にも対応できる感性検索システムを述べる。次に、第7の実施形態では一枚画像の類似画像検索システムを述べる。   First, in the fifth embodiment, a stable sensibility retrieval system when there are a large number of adjective model images will be described. Next, in the sixth embodiment, a sensitivity search system capable of dealing with a small number of adjective model images will be described. In the seventh embodiment, a similar image search system for a single image will be described.

[第5の実施形態]
(感性検索:「エネルギー」のみの2段階統合)
1.マンセルHVC色空間への変換
第1〜第4の実施形態と同様で、色相面の作り方として、第4の実施形態に記述したようにニュートラルの分離を行った面と行わない面の両方を用意し、分離を行った面は色の側面を記述するために使い、分離を行わない面はテキスチャの側面を記述するために用いる。
[Fifth Embodiment]
(Kansei search: two-stage integration of “energy” only)
1. Conversion to Munsell HVC color space Similar to the first to fourth embodiments, both the surface with and without neutral separation are prepared as described in the fourth embodiment as the method of creating the hue surface. The separated surface is used to describe the color side, and the non-separated surface is used to describe the texture side.

色相環を一次元軸として見なす場合の扱い方として、本実施形態の前の冒頭説明でしたように、色の場合はヒストグラムの度数が最小となる点に切り込みを入れて一次元化する。テキスチャの場合は、マンセル値の原点に固定して切り込みを入れる。そのようにして次のHVC各色面のエッジ面を作成する。第1〜第4の実施形態についてもこれに準じるものとする。   As a handling method when the hue circle is regarded as a one-dimensional axis, as described at the beginning of this embodiment, in the case of color, a point at which the frequency of the histogram is minimized is cut into one dimension. In the case of a texture, a cut is made with the Munsell value fixed at the origin. In this way, an edge surface for each color surface of the next HVC is created. This also applies to the first to fourth embodiments.

2.HVC面のエッジ画像の作成
第2〜第3の実施形態の説明と同様である。
3.色の低次不変量の作成
この部分系を区別するための記号として不変量に対してFoという記号を用いる場合がある。
3−1.低次系の分布関数の作成
第1の実施形態と同様に、ヒストグラムのビン数は200とする。分布関数はビンの単位で量子化されていて、それ以上の精度で記述できない。分布関数を同じく以下のように表す。
f(H), f(V), f(C)
分布関数f(x)の変数x=H,V,Cの値は、ビン数に関係なく、マンセル値で定義した上で、HVC間で等歩度性を満たすようにマンセル値の基準最大値を用いて[0,1]に規格化しているものとする。ただし、Cの値には上限がないため、滅多にはないが1の値を超えることもある。すなわち、
H≡H/100,
V≡V/10,
C≡C/20。
2. Creation of edge image of HVC plane The description is the same as in the second to third embodiments.
3. Creation of low-order invariants of color The symbol Fo is sometimes used for invariants as a symbol to distinguish this subsystem.
3-1. Creation of Low-Order System Distribution Function As in the first embodiment, the number of bins in the histogram is 200. The distribution function is quantized in bin units and cannot be described with higher accuracy. The distribution function is also expressed as follows.
f (H), f (V), f (C)
The variable x = H, V, C values of the distribution function f (x) are defined as Munsell values regardless of the number of bins, and the reference Munsell value is set so that the equi-step rate is satisfied between HVCs. It is assumed that it is normalized to [0,1]. However, since there is no upper limit to the value of C, the value of 1 is rarely exceeded but may be exceeded. That is,
H≡H / 100,
V≡V / 10,
C≡C / 20.

また、分布関数は規格化の条件を満たす。よって、確率密度を記述する。

Figure 0005041041
In addition, the distribution function satisfies the standardization condition. Therefore, the probability density is described.
Figure 0005041041

f(H)に関して、ニュートラル色相の確率密度は、f(N)という1つのビンに記述されているものとする。   For f (H), the probability density of neutral hue is described in one bin called f (N).

3−2.エントロピーの計算
分布関数f(x)からエントロピーSを計算する。分布関数の値が0のところは、その状態をとらないという意味で、積分区間から排除するものとする。分布関数の色面を(α)で区別して表すと、H,V,C面の各々の分布関数からエントロピーが算出され、それらの和が色の低次系に射影された部分系のエントロピーを表す。

Figure 0005041041
この値をSFoとする。 3-2. Calculation of entropy The entropy S is calculated from the distribution function f (x). When the value of the distribution function is 0, it is excluded from the integration interval in the sense that the state is not taken. When the color surface of the distribution function is distinguished by (α), entropy is calculated from the distribution functions of the H, V, and C surfaces, and the sum of those is projected to the lower-order system of the color. Represent.
Figure 0005041041
This value is S Fo .

3−3.運動量の要素pnの計算
分布関数f(x)から平均値<x>と標準偏差値σxを計算する。

Figure 0005041041
3-3. Calculation of momentum element p n The average value <x> and the standard deviation value σ x are calculated from the distribution function f (x).
Figure 0005041041

色相面であってもニュートラル成分を除いた分布関数を用いて、色相環を一次元化した軸上で平均値と偏差値を計算するものとする。ただし、色相の平均値<H>は半径が1の色相環上で、大きさは常にl<H≠N>l=1を満たす複素数exp(2πi<H≠N>)で2成分表記されるものとする。そのとき、色相の大きさを表す半径にニュートラルを除外した影響を加味するものとする。そのために、ニュートラルの割合pop(N)を計算しておく。すなわち、

Figure 0005041041
x=H,V,Cであるので、それぞれを運動量の要素pnとして対応させる。
<H>, <V>, <C>, σH, σV, σC
色相に関連する部分は、下記のように定義する必要がある。2つに分離した成分には別の要素番号nを割り当てるものとする。
Figure 0005041041
なお、運動量の要素の値は全て[0,1]の範囲で記述される。 Even for the hue plane, the average value and the deviation value are calculated on an axis obtained by making the hue circle one-dimensional using a distribution function excluding the neutral component. However, the average hue value <H> is expressed in two components as a complex number exp (2πi <H ≠ N >) satisfying l <H ≠ N > l = 1 on the hue circle with a radius of 1. Shall. At that time, the effect of excluding neutral is added to the radius representing the hue size. Therefore, the neutral ratio pop (N) is calculated. That is,
Figure 0005041041
x = H, V, because in C, and to associate each as elements p n of momentum.
<H>, <V>, <C>, σ H , σ V , σ C
The part related to hue needs to be defined as follows. It is assumed that another element number n is assigned to the two separated components.
Figure 0005041041
The values of the momentum elements are all described in the range [0, 1].

3−4.エネルギーの要素Enの計算
エネルギー要素Enとしては以下のものが定義される。

Figure 0005041041
なお、エネルギーの要素の値は全て[-1,1]の範囲で記述される。 3-4. The calculated energy elements E n of the energy elements E n of is defined as follows.
Figure 0005041041
The values of energy elements are all described in the range [-1,1].

3−5.部分系の温度の計算
エネルギー要素の値をまとめてベクトル表記すると、部分系のエネルギーベクトルが定義できる。

Figure 0005041041
部分系のエネルギーベクトルのノルムを計算すると部分系に関する画像の温度Tを定義できる。
Figure 0005041041
3-5. Subsystem temperature calculation When the energy element values are collectively expressed as a vector, the energy vector of the subsystem can be defined.
Figure 0005041041
By calculating the norm of the energy vector of the subsystem, the image temperature T for the subsystem can be defined.
Figure 0005041041

3−6.部分系の自由エネルギーの計算
このように算出されてきたエネルギー要素Enのベクトル、画像の温度T、エントロピーSの巨視的物理量を用いて、熱力学的不変量である自由エネルギーを定義する。自由エネルギーは、エネルギーベクトルに対してスカラー量を1つ加えたベクトルである。

Figure 0005041041
3-6. Subsystem energy elements E n vector of which has been calculated as the calculation of the free energy of the temperature T of the image, using the macroscopic physical quantity of entropy S, defines the free energy is a thermodynamic invariant. Free energy is a vector obtained by adding one scalar quantity to an energy vector.
Figure 0005041041

ここに、<>は任意の一般画像に関する統計平均を表す。したがって、<S>は予め用意しておいた多量の任意の一般画像に関して、画像のエントロピーを計算し、それらの平均値を事前に算出しておく必要がある。物理的に1/<S>は、この部分系で規定されるプランク定数hに基づいて位相空間上の微視的状態数をエントロピーという巨視的物理量に結びつけるためのボルツマン定数kの役割を果たす。すなわち、位相空間上での状態数

Figure 0005041041
Here, <> represents a statistical average regarding an arbitrary general image. Therefore, for <S>, it is necessary to calculate the entropy of an image for a large number of arbitrary general images prepared in advance and to calculate the average value thereof in advance. Physically, 1 / <S> serves as a Boltzmann constant k for linking the number of microscopic states in the phase space to a macroscopic physical quantity called entropy based on the Planck constant h defined in this subsystem. That is, the number of states in the phase space
Figure 0005041041

(sは系の自由度の数)に対して、エントロピーはS=lnΔΓの関係で結ばれている(文献E3参照)。そして、温度をエネルギー量と結びつけるにはボルツマン定数kを介して、kTによって測られる。なお通常、ボルツマン定数はエントロピーの側に含めて定義し、温度はエネルギーと同じスケールの大きさで記述できるようにする定義が採用されることが多い(文献E7参照)。すなわち、S=klnΔΓ。画像系の量子状態は、部分系によってプランク定数の定義が変わるため、このような絶対的に不変な物理定数を定義できない。そこで、その部分系の中で一般画像がとりうる平均的な状態数を基準として、各々の画像がとっている状態数を絶対基準で計測するための規格化を行う操作をしている。これがボルツマン定数と同じ役割を果たす。この部分系のボルツマン定数は、下式で表すことができる。

Figure 0005041041
In contrast to (s is the number of degrees of freedom of the system), the entropy is tied in the relationship of S = lnΔΓ (see Document E3). And the temperature is measured by kT via the Boltzmann constant k to connect the temperature with the energy amount. Usually, the definition is such that the Boltzmann constant is defined by including it on the entropy side, and the temperature can be described in the same scale as the energy (see Document E7). That is, S = klnΔΓ. Since the definition of the Planck constant of the quantum state of the image system varies depending on the subsystem, such an absolutely invariant physical constant cannot be defined. In view of this, an operation for standardization is performed to measure the number of states taken by each image on the basis of the average number of states that a general image can take in the sub-system. This plays the same role as the Boltzmann constant. The Boltzmann constant of this subsystem can be expressed by the following equation.
Figure 0005041041

[文献E7]ランダウ、リフシッツ理論物理学教程第5巻「統計物理学第1部」(第3版、1976年)、第2章「熱力学的諸量」、第9節「温度」
4.色の高次不変量の作成
この部分系を区別するための記号として不変量に対してFという記号を用いる場合がある。
[Literature E7] Landau, Lifschitz Theoretical Physics, Vol. 5, "Statistical Physics Part 1" (3rd edition, 1976), Chapter 2, "Thermodynamic quantities", Section 9, "Temperature"
4). Creating higher-order invariants of color The symbol F is sometimes used for invariants as a symbol to distinguish this subsystem.

4−0.低次系の分布関数のヒルベルト空間表現
HVC面の色のヒストグラムを、色の低次系の分布関数と位置づける。低次系の分布関数は、元の座標系で測ることのできる座標空間qとも解釈することができる。これをチェビシェフ変換して周波数表現し、運動量空間pに投影する。これは元の分布関数を別の側面から見た等価表現である。ヒルベルト空間をなす基底関数として、低次系の分布関数の性質を加味して、できるだけコンパクトに表現する完全直交系の関数を選ぶ。しかし、座標空間と運動量空間の不確定性原理

Figure 0005041041
によって、一方でコンパクト表現されているときは他方はブロードな表現となる関係にもある。その両者の不確定性が最小となるような関数系を選ぶのが最適である。 4-0. Hilbert space representation of low-order system distribution functions
The color histogram of the HVC plane is positioned as a low-order color distribution function. The distribution function of the lower order system can be interpreted as a coordinate space q that can be measured in the original coordinate system. This is Chebyshev transformed to express the frequency and project it onto the momentum space p. This is an equivalent representation of the original distribution function from another perspective. As a basis function forming the Hilbert space, a function of a completely orthogonal system that is expressed as compactly as possible is selected in consideration of the properties of a low-order distribution function. However, the uncertainty principle of coordinate space and momentum space
Figure 0005041041
Therefore, when a compact expression is given on the one hand, the other is also in a broad expression. It is best to choose a functional system that minimizes the uncertainty between the two.

第1の実施形態と同様に、このとき展開係数の値が[-1,1]の範囲に収まるように定義されているものとする。

Figure 0005041041
(α)がHのときx=H、(α)がVのときx=V、(α)がCのときx=Cである。Nの値はN=100とする。 As in the first embodiment, it is assumed that the expansion coefficient value is defined to fall within the range [-1, 1].
Figure 0005041041
When (α) is H, x = H, when (α) is V, x = V, and when (α) is C, x = C. The value of N is N = 100.

4−1.高次系の分布関数の作成
チェビシェフ展開された係数のパワースペクトルを、色に関する高次系の分布関数と定義する。H,V,C3面について、高次系の分布関数が定義できる。確率密度を表すように規格化しておく。

Figure 0005041041
色の高次系の分布関数も2N=200のとき、kの値は200個のビンに量子化される。 4-1. Creation of higher-order distribution function The power spectrum of the Chebyshev-expanded coefficient is defined as a higher-order distribution function for color. Higher order distribution functions can be defined for the H, V, and C3 planes. Normalize to represent probability density.
Figure 0005041041
When the distribution function of the higher-order color system is 2N = 200, the value of k is quantized into 200 bins.

4−2.エントロピーの計算
分布関数f(k)からエントロピーSを計算する。分布関数の値が0のところは、その状態をとらないという意味で、積分区間から排除するものとする。分布関数の色面を(α)で区別して表すと、H,V,C面の各々の分布関数からエントロピーが算出され、それらの和が色の高次系に射影された部分系のエントロピーを表す。

Figure 0005041041
この値をSFとする。 4-2. Calculation of entropy The entropy S is calculated from the distribution function f (k). When the value of the distribution function is 0, it is excluded from the integration interval in the sense that the state is not taken. When the color surface of the distribution function is distinguished by (α), the entropy is calculated from the distribution functions of the H, V, and C surfaces, and the sum of those is projected onto the higher-order system of the color. Represent.
Figure 0005041041
This value to S F.

4−3.運動量の要素pnの計算
チェビシェフ展開係数はヒルベルト空間における運動量と捉えることができる。したがって、運動量の要素pnは展開係数そのものである。
pn (α)=cn (α) (α)=H,V,C。
異なる色面の運動量についても順にpnでまとめて表すことにする。これらがこの部分系の位相空間の運動量p=(p1,p2,…,pi,…)を構成する。
4-3. Calculation of momentum element p n Chebyshev expansion coefficient can be regarded as momentum in Hilbert space. Therefore, the momentum element pn is the expansion coefficient itself.
p n (α) = c n (α) (α) = H, V, C.
The momentum of the different color planes will also be represented by pn in order. These constitute the momentum p = (p 1 , p 2 ,..., P i ,...) Of the phase space of this subsystem.

4−4.エネルギーの要素Enの計算
運動量の積によって運動エネルギーを表すエネルギー行列を構築する際に、第5の実施形態では角運動量の単位で部分行列を作って、完全系をなすように拡張シュプールをとる。それによってエネルギーの固有値を求める。それらがエネルギーの要素となる。基本的に第1の実施形態と同じ要領でエネルギー不変量を構築する。
4-4. When building an energy matrix by a product of the calculated movement amount of elements E n of the energy represents the kinetic energy, in the fifth embodiment by making the partial matrix in units of angular momentum, take an extended trace so as to form a complete system . Thus, the eigenvalue of energy is obtained. They become energy elements. An energy invariant is constructed basically in the same manner as in the first embodiment.

エネルギーの要素を定義するとき、それらの各々が[-1,1]の範囲に収まるように、シュワルツの不等式で保証された関係を用いて、エネルギー行列の純粋なシュプール、すなわち対角要素の和で規格化しておく。したがって、純粋なシュプールのみで構築される定常状態のみが、規格化操作ができない。それ以外のエネルギー要素については全て規格化して拡張シュプールを定義する。純粋な対角和の値は、分布関数の展開係数の各々が[-1,1]の範囲で定義されることから、少々はみ出すことはあってもおよそ[0,1]の範囲の値が求まる。   When defining the elements of the energy, a pure spur of the energy matrix, i.e. the sum of the diagonal elements, using a relationship guaranteed by the Schwarz inequality so that each of them falls within the range [-1,1]. Standardize with. Therefore, the normalization operation cannot be performed only in the steady state constructed only by pure spurs. Standardize all other energy elements and define an extended spur. Since the value of the pure diagonal sum is defined in the range of [-1,1] for each expansion coefficient of the distribution function, the value in the range of [0,1] may be slightly extended. I want.

エネルギー固有値は、絶対的なエネルギー量を表すので、最終的にこれらの線形結合をとるにあたっても、エネルギー固有値が有限の値を持っていることと、線形結合係数が零でない値を持っていることでは異なる意味をなす。エネルギー固有値は、その画像自体が発しているエネルギー要素の存在の有無を表し、線形結合係数は、ある形容詞にとって重要な要素か否かを表すだけである。したがって、エネルギー固有値は、絶対基準で計測されなければならない。上述の対角和が[0,1]の範囲を超えて少々はみ出すことがある問題については、元から対角和のエネルギーについては零点エネルギーε0が加わっていたものとして、零点エネルギーに相当する分を引き算して定義するようにしてもよい。零点エネルギーを導入しても線形結合係数に対しては何の影響も与えない。ここで、色の高次系のチェビシェフ展開係数の場合は、零点エネルギーとして1/3=0.333程度の値を導入する。また、後述するテキスチャの高次系の球ベッセル展開係数の場合は、対角和が[0,1]の範囲を超えないので、零点エネルギーを導入する必要はない。 Since the energy eigenvalue represents the absolute amount of energy, the energy eigenvalue must have a finite value and the linear combination coefficient must have a non-zero value when finally taking these linear combinations. So it makes a different meaning. The energy eigenvalue represents the presence or absence of an energy element emitted from the image itself, and the linear combination coefficient merely represents whether or not it is an important element for a certain adjective. The energy eigenvalue must therefore be measured on an absolute basis. As for the above-mentioned problem that the diagonal sum may protrude slightly beyond the range of [0,1], the zero-point energy ε 0 is added to the diagonal sum energy from the source, and it corresponds to the zero-point energy. You may make it define by subtracting a minute. Introducing zero energy has no effect on the linear coupling coefficient. Here, in the case of a Chebyshev expansion coefficient of a higher-order color system, a value of about 1/3 = 0.333 is introduced as the zero point energy. In the case of a higher-order spherical Bessel expansion coefficient of a texture, which will be described later, it is not necessary to introduce zero energy because the diagonal sum does not exceed the range [0, 1].

以下では、cnを角運動量単位の部分群に分けて考える場合は、角運動量量子数l=0の展開係数をc0n、角運動量量子数l=1の展開係数をc1nと表すことにする。したがって、展開係数の要素数は半々のN個ずつに分かれる。部分群の要素番号はn=1,2,...,Nで数えるものとする。また、純粋な対角和を表す1つのエネルギー要素のみを別定義で与える。

Figure 0005041041
In the following, when c n is divided into subgroups of angular momentum units, the expansion coefficient of angular momentum quantum number l = 0 is expressed as c 0n , and the expansion coefficient of angular momentum quantum number l = 1 is expressed as c 1n. To do. Therefore, the number of elements of the expansion coefficient is divided into N half. The element numbers of the subgroups shall be counted by n = 1, 2, ..., N. Only one energy element representing a pure diagonal sum is given as another definition.
Figure 0005041041

ここに、c0k=c0,N+nのような値をとった時、c0,N+n=c0,nのように同一角運動量の部分群内でベクトル{c0k}を円環につないで、最初の地点に戻って定義し直すものとする。同様にc1,N+n=c1,nである。これらのエネルギー要素をまとめてEnで表すことにする。 Here, when a value such as c 0k = c 0, N + n is taken, the vector {c 0k } is circled within a subgroup of the same angular momentum as c 0, N + n = c 0, n Connect to the ring and go back to the first point and redefine it. Similarly, c 1, N + n = c 1, n . Collectively these energy elements will be denoted by E n.

4−5.部分系の温度の計算
前述と同様にして、部分系のエネルギーベクトルと部分系の温度Tが定義できる。

Figure 0005041041
4-5. Subsystem temperature calculation In the same way as described above, the energy vector of the subsystem and the temperature T of the subsystem can be defined.
Figure 0005041041

4−6.部分系の自由エネルギーの計算
前述と同様に、部分系の自由エネルギーが定義できる。

Figure 0005041041
この部分系のボルツマン定数は、この部分系のエントロピーの任意の画像の統計平均の逆数で測る。
Figure 0005041041
4-6. Calculation of free energy of subsystems As before, the free energy of subsystems can be defined.
Figure 0005041041
The Boltzmann constant of this subsystem is measured by the reciprocal of the statistical average of any image of the entropy of this subsystem.
Figure 0005041041

5.テキスチャの低次不変量の作成
この部分系を区別するための記号として不変量に対してGoという記号を用いる場合がある。
5−1.低次系の分布関数の作成
第3の実施形態と同様に、ヒストグラムのビン数は200とする。分布関数はビンの単位で量子化されていて、それ以上の精度で記述できない。分布関数を同じく以下のように表す。
f(△H), f(△V), f(△C)
分布関数f(x)の変数x=△H,△V,△Cの値は、ビン数に関係なく、マンセル値で定義した上で、HVC間で等歩度性を満たすように微分値として[-1,1]に規格化しているものとする。すなわち、
△H≡△H/100,
△V≡△V/10,
△C≡△C/20。
5. Creating low-order invariants of textures The symbol Go is sometimes used for invariants as a symbol to distinguish this subsystem.
5-1. Creation of Low-Order System Distribution Function As in the third embodiment, the number of bins in the histogram is 200. The distribution function is quantized in bin units and cannot be described with higher accuracy. The distribution function is also expressed as follows.
f (△ H), f (△ V), f (△ C)
The value of the variable x = △ H, △ V, △ C of the distribution function f (x) is defined as a Munsell value regardless of the number of bins. -1,1]. That is,
△ H≡ △ H / 100,
△ V≡ △ V / 10,
△ C≡ △ C / 20.

また、分布関数は規格化の条件を満たす。よって、確率密度を記述する。

Figure 0005041041
In addition, the distribution function satisfies the standardization condition. Therefore, the probability density is described.
Figure 0005041041

5−2.エントロピーの計算
分布関数f(x)からエントロピーSを計算する。分布関数の値が0のところは、その状態をとらないという意味で、積分区間から排除するものとする。分布関数の色面を(α)で区別して表すと、H,V,C面の各々のエッジ画像の分布関数からエントロピーが算出され、それらの和がテキスチャの低次系に射影された部分系のエントロピーを表す。

Figure 0005041041
この値をSGoとする。 5-2. Calculation of entropy The entropy S is calculated from the distribution function f (x). When the value of the distribution function is 0, it is excluded from the integration interval in the sense that the state is not taken. When the color plane of the distribution function is distinguished by (α), the entropy is calculated from the distribution functions of the edge images on the H, V, and C planes, and the sum of these is projected onto the lower-order system of the texture. Represents the entropy of.
Figure 0005041041
This value is S Go .

5−3.運動量の要素pnの計算
分布関数f(x)から平均値<x>と標準偏差値σxを計算する。

Figure 0005041041
x=△H,△V,△Cであるので、それぞれを運動量の要素pnとして対応させる。
<△H>, <△V>, <△C>, σ△H, σ△V, σ△C
なお、運動量の要素の値は全て[-1,1]の範囲で記述される。 5-3. Calculation of momentum element p n The average value <x> and the standard deviation value σ x are calculated from the distribution function f (x).
Figure 0005041041
x = △ H, △ V, because it is △ C, to correspond respectively as elements p n of momentum.
<△ H>, <△ V>, <△ C>, σ △ H , σ △ V , σ △ C
The values of the momentum elements are all described in the range [-1,1].

5−4.エネルギーの要素Enの計算
エネルギー要素Enとしては以下のものが定義される。これらの値は全て実数で定義される。
(α)(α)
amam:
<△H><△H>
<△V><△V>
<△C><△C>
amas:
<△H>σ△H
<△V>σ△V
<△C>σ△C
asas:
σ△Hσ△H
σ△Vσ△V
σ△Cσ△C
(β)(β):
ambm:
<△H><△V>
<△V><△C>
<△C><△H>
ambs:
<△H>σ△V
<△V>σ△C
<△C>σ△H
asbm:
σ△H<△V>
σ△V<△C>
σ△C<△H>
asbs:
σ△Hσ△V
σ△Vσ△C
σ△Cσ△H
なお、エネルギーの要素の値は全て[-1,1]の範囲で記述される。
5-4. The calculated energy elements E n of the energy elements E n of is defined as follows. These values are all defined by real numbers.
(α) (α)
amam:
<△ H><△H>
<△ V><△V>
<△ C><△C>
amas:
<△ H> σ △ H
<△ V> σ △ V
<△ C> σ △ C
asas:
σ △ H σ △ H
σ △ V σ △ V
σ △ C σ △ C
(β) (β):
ambm:
<△ H><△V>
<△ V><△C>
<△ C><△H>
ambs:
<△ H> σ △ V
<△ V> σ △ C
<△ C> σ △ H
asbm:
σ △ H <△ V>
σ △ V <△ C>
σ △ C <△ H>
asbs:
σ △ H σ △ V
σ △ V σ △ C
σ △ C σ △ H
The values of energy elements are all described in the range [-1,1].

5−5.部分系の温度の計算
前述と同様にして、部分系のエネルギーベクトルと部分系の画像の温度Tが定義できる。
5−6.部分系の自由エネルギーの計算
前述と同様に、部分系の自由エネルギーが定義できる。

Figure 0005041041
5-5. Subsystem temperature calculation In the same manner as described above, the energy vector of the subsystem and the temperature T of the image of the subsystem can be defined.
5-6. Calculation of free energy of subsystems As before, the free energy of subsystems can be defined.
Figure 0005041041

この部分系のボルツマン定数は、この部分系のエントロピーの任意の画像の統計平均の逆数で測る。

Figure 0005041041
The Boltzmann constant of this subsystem is measured by the reciprocal of the statistical average of any image of the entropy of this subsystem.
Figure 0005041041

6.テキスチャの高次不変量の作成
この部分系を区別するための記号として不変量に対してGという記号を用いる場合がある。
6−0.低次系の分布関数のヒルベルト空間表現
HVC面のエッジ画像のヒストグラムを、テキスチャの低次系の分布関数と位置づける。低次系の分布関数は、元の座標系で測ることのできる座標空間qとも解釈することができる。これを球ベッセル変換して周波数表現し、運動量空間pに投影する。これは元の分布関数を別の側面から見た等価表現である。ヒルベルト空間をなす基底関数として、低次系の分布関数の性質を加味して、できるだけコンパクトに表現する完全直交系の関数を選ぶ。しかし、座標空間と運動量空間の不確定性原理

Figure 0005041041
によって、一方でコンパクト表現されているときは他方はブロードな表現となる関係にもある。その両者の不確定性が最小となるような関数系を選ぶのが最適である。 6). Creation of texture higher-order invariants The symbol G may be used for invariants as a symbol to distinguish this subsystem.
6-0. Hilbert space representation of low-order system distribution functions
The histogram of the edge image of the HVC plane is positioned as the distribution function of the texture low-order system. The distribution function of the lower order system can be interpreted as a coordinate space q that can be measured in the original coordinate system. This is expressed as a frequency by spherical Bessel transformation and projected onto the momentum space p. This is an equivalent representation of the original distribution function from another perspective. As a basis function forming the Hilbert space, a function of a completely orthogonal system that is expressed as compactly as possible is selected in consideration of the properties of a low-order distribution function. However, the uncertainty principle of coordinate space and momentum space
Figure 0005041041
Therefore, when a compact expression is given on the one hand, the other is also in a broad expression. It is best to choose a functional system that minimizes the uncertainty between the two.

第3の実施形態と同様に、本実施形態では、s,p軌道による展開の場合の説明を行う。なお、s,p,d,f軌道による展開の場合も、冒頭説明したように同様に展開していくことができる。

Figure 0005041041
(α)がHのときx=△H、(α)がVのときx=△V、(α)がCのときx=△Cである。Nの値はN=100とする。 Similar to the third embodiment, in this embodiment, a description will be given of the case of expansion using s, p orbitals. In the case of expansion using s, p, d, and f orbits, the expansion can be performed in the same manner as described above.
Figure 0005041041
When (α) is H, x = ΔH, when (α) is V, x = ΔV, and when (α) is C, x = ΔC. The value of N is N = 100.

6−1.高次系の分布関数の作成
球ベッセル展開された係数のパワースペクトルを、テキスチャに関する高次系の分布関数と定義する。H,V,C3面について、高次系の分布関数が定義できる。確率密度を表すように規格化しておく。

Figure 0005041041
6-1. Creation of higher-order system distribution function The power spectrum of the coefficient expanded in spherical Bessel is defined as a higher-order system distribution function related to texture. Higher order distribution functions can be defined for the H, V, and C3 planes. Normalize to represent probability density.
Figure 0005041041

テキスチャの高次系の分布関数はN=100のとき、1つの角運動量につき、kの値は100個のビンに量子化される。lの値は0と1をとるから合計で2x100=200個のビンに量子化される。   When the distribution function of the texture higher-order system is N = 100, the value of k is quantized into 100 bins for each angular momentum. Since the value of l takes 0 and 1, it is quantized into a total of 2 × 100 = 200 bins.

6−2.エントロピーの計算
分布関数f(l,k)からエントロピーSを計算する。分布関数の値が0のところは、その状態をとらないという意味で、積分区間から排除するものとする。分布関数の色面を(α)で区別して表すと、H,V,C面の各々のエッジ画像の分布関数からエントロピーが算出され、それらの和がテキスチャの高次系に射影された部分系のエントロピーを表す。

Figure 0005041041
この値をSGとする。 6-2. Calculation of entropy The entropy S is calculated from the distribution function f (l, k). When the value of the distribution function is 0, it is excluded from the integration interval in the sense that the state is not taken. When the color plane of the distribution function is represented by (α), the entropy is calculated from the distribution functions of the edge images of the H, V, and C planes, and the sum of these is projected onto the higher order system of the texture. Represents the entropy of.
Figure 0005041041
This value is S G.

6−3.運動量の要素pnの計算
球ベッセル展開係数はヒルベルト空間における運動量と捉えることができる。したがって、運動量の要素pnは展開係数そのものである。
pn (α)=c0n (α)
pN+n (α)=c1n (α) (α)=H,V,C。
異なる色面の運動量についても順にpnでまとめて表すことにする。これらがこの部分系の位相空間の運動量p=(p1,p2,…,pi,…)を構成する。
6-3. Calculation of momentum element p n The spherical Bessel expansion coefficient can be regarded as momentum in Hilbert space. Therefore, the momentum element pn is the expansion coefficient itself.
p n (α) = c 0n (α)
p N + n (α) = c 1n (α) (α) = H, V, C.
The momentum of the different color planes will also be represented by pn in order. These constitute the momentum p = (p 1 , p 2 ,..., P i ,...) Of the phase space of this subsystem.

6−4.エネルギーの要素Enの計算
s,p軌道までの展開のときは、色の高次系であるチェビシェフ展開係数について定義した式と全く同様である。チェビシェフ展開係数を球ベッセル展開係数に置き換えるだけでよい。なお、テキスチャの高次系の場合は、零点エネルギーにつてはε0=0と置いてよい。
6-4. Calculation of energy element E n
The expansion up to the s, p orbit is exactly the same as the formula defined for the Chebyshev expansion coefficient, which is a higher-order color system. It is only necessary to replace the Chebyshev expansion coefficient with a spherical Bessel expansion coefficient. In the case of a higher-order texture system, ε 0 = 0 may be set for the zero point energy.

6−5.部分系の温度の計算
前述と同様にして、部分系のエネルギーベクトルと部分系の画像の温度Tが定義できる。
6−6.部分系の自由エネルギーの計算
前述と同様に、部分系の自由エネルギーが定義できる。

Figure 0005041041
6-5. Subsystem temperature calculation In the same manner as described above, the energy vector of the subsystem and the temperature T of the image of the subsystem can be defined.
6-6. Calculation of free energy of subsystems As before, the free energy of subsystems can be defined.
Figure 0005041041

この部分系のボルツマン定数は、この部分系のエントロピーの任意の画像の統計平均の逆数で測る。

Figure 0005041041
The Boltzmann constant of this subsystem is measured by the reciprocal of the statistical average of any image of the entropy of this subsystem.
Figure 0005041041

7.部分系の形容詞エネルギーへの統合
7−1.形容詞の設定
形容詞をキーワードとする感性検索システムで提示する形容詞を決め、それらを区別するための記号として、i番目の形容詞と割り当てる。形容詞として、例えば、「爽やかな」、「賑やかな」、「荒々しい」、「しっとりとした」などである。
7). Integration of subsystem into adjective energy 7-1. Setting Adjectives Determine the adjectives to be presented in the Kansei Retrieval System using adjectives as keywords, and assign them to the i-th adjective as a symbol to distinguish them. Examples of adjectives include “fresh”, “lively”, “rough”, “moist”, and the like.

7−2.一般画像モデルの構築
任意の一般画像を多数枚ランダムに集めて、それらを一般画像のモデルとする。通常、数百枚以上のオーダーの画像を用意する。更に正確を期するならば万のオーダーとなり、多ければ多いほど統計が安定する。これらを用いて以下に述べる一般モデル画像群の分布関数p(x)を構築する。分布関数p(x)は実数値Enのとる単位エネルギー区間内で一般画像がとりうる画像頻度を表し、エネルギー区間をビンとして区切れば、度数分布関数となる。
7-2. Construction of a general image model A large number of arbitrary general images are collected at random and used as a model of a general image. Usually, an image with an order of several hundreds or more is prepared. Furthermore, if it is accurate, it will be on the order of 10,000, and the more it is, the more stable the statistics will be. Using these, the distribution function p (x) of the general model image group described below is constructed. Distribution function p (x) represents the image frequency of the general image can take in unit energy interval taken by the real-valued E n, by delimiting energy interval as the bottle, the frequency distribution function.

7−3.形容詞モデル画像の構築
上記用意した一般画像モデルの各々に対し、i番目の形容詞に該当するか否かの心理的な印象評価を行い、形容詞モデル画像の分布データを作成する。この作成方法には2通りがあり、どちらを使ってもよい。すなわち、単なる該当、非該当の場合は1、0の整数を割り振り、1が割り当てられた画像を、同じ重みの画像として用いる。そして、該当画像群を用いて形容詞モデル画像群の分布関数q(x)を構築する。もう1つは、非該当の場合を0とし、該当の場合の心理的な絶対印象度合いを1−5の5段階評価をする方法である。この場合には、モデルの分布データを構築するに当たり、5評価の画像には1.0の重みを、4評価の画像には0.8の重みを、3評価の画像には0.6の重みを、2評価の画像には0.4の重みを、1評価の画像には0.2の重みをつけて以下に述べる度数分布q(x)を構築する。
7-3. Construction of Adjective Model Image For each of the prepared general image models, psychological impression evaluation is performed as to whether or not the i-th adjective is applicable, and distribution data of the adjective model image is created. There are two ways to create this, and either one can be used. That is, in the case of simply corresponding or not applicable, an integer of 1 or 0 is assigned, and an image assigned 1 is used as an image having the same weight. Then, the distribution function q (x) of the adjective model image group is constructed using the corresponding image group. The other is a method in which a non-applicable case is set to 0, and the psychological absolute impression degree in the applicable case is evaluated on a 5-level scale of 1-5. In this case, in constructing the distribution data of the model, a weight of 1.0 is assigned to the 5 evaluation image, a weight of 0.8 is applied to the 4 evaluation image, and a weight of 0.6 is applied to the 3 evaluation image. A frequency distribution q (x) described below is constructed by assigning a weight of 0.4 to an image of 2 evaluations and a weight of 0.2 to an image of 1 evaluation.

7−4.要素内の分布における偏差値の算出
上記定義してきた部分系の各々のエネルギー要素Enについて1つ1つ個別に、一般モデル画像がとるEnの値の分布と形容詞モデル画像がとるEnの値の分布とを調べ、形容詞モデル画像が一般モデル画像の平均とは異なる位置に分布しているとき、そのエネルギー要素はその形容詞にとって特異な働きをしているものとして、エネルギー和をとるときの線形結合係数の形で、その重みを与える。その特異な働きの具合は、一般モデル画像の分布に対して、形容詞モデル画像の分布が位置している偏差値で与えることができる。
7-4. One for energy elements E n of each of the subsystems that calculated been defined above deviation in the distribution of the elements one individually, general model images takes a value of E n distribution and E n the adjective model image taking When the adjective model image is distributed at a position different from the average of the general model image, the energy element is considered to be working peculiar to the adjective and The weight is given in the form of a linear combination coefficient. The unique working condition can be given by the deviation value where the distribution of the adjective model image is located with respect to the distribution of the general model image.

エネルギー要素Enを変数xで表し、一般モデル画像の分布関数がp(x)、形容詞モデル画像の分布関数がq(x)であるとする。一般モデル画像のエネルギー要素Enの平均値をmp、その標準偏差σp、形容詞モデル画像のエネルギー要素Enの平均値をmq、その標準偏差σqとする。そのとき、i番目の形容詞に対応するエネルギー要素Enに対する線形結合係数αi(En)は、誤差関数erf(x)を用いて以下のように表すことができる。線形結合係数は、一般モデル画像の平均値と同じところに位置するときは0、両端に位置するときは±1となるように定義する。また、形容詞モデル画像群の偏差値のゆらぎ、すなわち線形結合係数の誤差δαi(En)も評価できる。 It represents energy elements E n in the variable x, the distribution function of the general model image p (x), the distribution function of the adjective model image and a q (x). The average value of the energy elements E n of the general model image m p, its standard deviation sigma p, the average value of m q energy elements E n of the adjective model image, and its standard deviation sigma q. Then, the linear combination coefficients for the energy elements E n corresponding to the i-th adjective alpha i (E n) can be expressed as follows using the error function erf (x). The linear combination coefficient is defined to be 0 when positioned at the same position as the average value of the general model image, and ± 1 when positioned at both ends. Further, the fluctuation of the deviation value of the adjective model image group, that is, the error δα i (E n ) of the linear combination coefficient can be evaluated.

各エネルギー要素Enに対して

Figure 0005041041
For each energy elements E n
Figure 0005041041

偏差値およびその誤差

Figure 0005041041
Deviation value and its error
Figure 0005041041

ここに、

Figure 0005041041
であり、erf(±∞)=±1、erf(0)=0の値を返す。 here,
Figure 0005041041
And erf (± ∞) = ± 1 and erf (0) = 0 are returned.

7−5.部分系単位の部分エネルギーの算出
ある画像を入力し、それがi番目の形容詞の印象を備えているか否かを調べるために、その入力された画像に対して、各部分系のエネルギー要素を算出し、形容詞モデルによって確定された線形結合係数を用いて、その形容詞エネルギーの絶対量の総和を求める。その総和を求めるに当たって、まず部分系単位で部分和をとる。ここに部分系の自由エネルギーベクトルに対して、線形結合係数をベクトル表記したモデル形容詞ベクトルとの内積をとって部分和を定義する。そのとき、自由エネルギーとして熱量-TSというスカラー量を1つ付け加えた成分に対しても、対応する線形結合係数を定義する。すなわち、
自由エネルギーベクトル

Figure 0005041041
7-5. Calculation of partial energy of subsystem units To input an image and check whether it has the impression of the i-th adjective, calculate the energy element of each subsystem for the input image. Then, using the linear combination coefficient determined by the adjective model, the sum of absolute quantities of the adjective energy is obtained. In calculating the total sum, first, partial sums are taken in units of subsystems. Here, the partial sum is defined by taking the inner product of the free energy vector of the subsystem and the model adjective vector in which the linear coupling coefficient is expressed in vector. At that time, a corresponding linear combination coefficient is defined for a component obtained by adding one scalar quantity of heat quantity -TS as free energy. That is,
Free energy vector
Figure 0005041041

モデル形容詞ベクトル

Figure 0005041041
Model adjective vector
Figure 0005041041

部分系をa1,a2,...のように区別するインデックスを付けて部分系単位のエネルギー和Piを内積によって求める。a1は色の低次系、a2は色の高次系、a3はテキスチャの低次系、a4はテキスチャの高次系などと対応する。

Figure 0005041041
An index for distinguishing the subsystems such as a1, a2,. a1 corresponds to a low-order system of color, a2 corresponds to a high-order system of color, a3 corresponds to a low-order system of texture, a4 corresponds to a high-order system of texture, and the like.
Figure 0005041041

しかしながら、これらの線形結合をとって、全形容詞エネルギーQiを求めるにあたって、上述の単なる内積では、定義しうるエネルギー要素の数が多い系ほどPiの値は大きな値をとってしまう。部分系は独立な側面を記述しており、部分系の統合を行う時点では、均等な扱いをする必要がある。そのために部分和Piの値がおよそ[-1,1]の範囲に入るように規格化をしておく必要がある。すなわち、

Figure 0005041041
However, when these linear combinations are used to determine the total adjective energy Qi, the value of Pi increases as the number of energy elements that can be defined increases in the above simple inner product. Subsystems describe independent aspects, and at the time of integration of subsystems, it is necessary to treat them equally. Therefore, it is necessary to normalize so that the value of the partial sum Pi falls within the range of [-1,1]. That is,
Figure 0005041041

ここに<>aは全ての部分系の間に関する統計平均を表す。すなわち、考察した部分系の数をnaとすると、

Figure 0005041041
Where <> a represents the statistical average between all subsystems. That is, if the number of subsystems considered is n a
Figure 0005041041

ここでも分母の規格化においては可能な限り統計平均を行うべきであるという考え方に準じている。これによって、部分系によって違って定義される分布関数の量子化のビン数の違いによる状態数の違い、すなわちエントロピーの違いは吸収され、異なる部分系を共通土俵に乗せることができる。すなわち、部分系によって異なるプランク定数やボルツマン定数の定義がここで吸収され、同等の扱いをすることができるスケールのエネルギー物理量Piが算出される。物理的には分母の平方根の項は、部分系によって物理定数が異なるときに必要になる補正項と解することができる。一方の平均温度や形容詞ベクトルのノルム平均は、部分系によって定義しうるエネルギー要素の数の違いを吸収するための規格化である。このように部分系を共通土俵に乗せるためのノルムの統計平均量による規格化は、絶対物理量を規定する上で極めて重要な役割を果たす。
参考のために、任意の一般画像を多量に用意して、それらのエントロピーの値と温度の値をそれぞれの部分系について実験的に調べた結果を示す。これらの数値を見れば、規格化の手続きが部分系を統合する上で如何に重要であるかがわかる。
エントロピー
7.97≦〜SFo≦〜14.30 <SFo>=12.51
2.49≦ 〜SF≦〜6.05 <SF>=4.67
8.75≦ 〜SGo≦〜14.39 <SGo>=12.19
7.49≦ 〜SG≦〜13.82 <SG>=10.81
温度
0.18≦ 〜TFo≦〜1.37 <TFo>=0.73
2.68≦ 〜TF≦〜3.31 <TF>=2.91
0.003≦ 〜TGo≦〜0.10 <TGo>=0.03
5.75≦ 〜TG≦〜20.63 <TG>=12.31
したがって、1/<S>〜0.1のオーダーの数値であり、分母の平方根は1.1〜1.6程度の値である。
Again, the standardization of the denominator follows the idea that statistical averaging should be performed as much as possible. As a result, the difference in the number of states, that is, the difference in entropy due to the difference in the number of bins of the distribution function that is defined differently depending on the subsystem is absorbed, and different subsystems can be placed on the common earth. That is, the definition of the Planck constant and the Boltzmann constant that differ depending on the subsystem is absorbed here, and the energy physical quantity Pi of a scale that can be handled in the same way is calculated. Physically, the term of the square root of the denominator can be interpreted as a correction term that is required when the physical constant varies depending on the subsystem. On the other hand, the norm average of the average temperature and adjective vector is a standardization to absorb the difference in the number of energy elements that can be defined by the subsystem. In this way, normalization based on the statistical average of the norm for placing the subsystems on the common earth plays an extremely important role in defining the absolute physical quantity.
For reference, a large amount of arbitrary general images are prepared, and the entropy value and the temperature value are experimentally examined for each sub-system. These numbers show how important the standardization procedure is to integrate subsystems.
Entropy
7.97 ≤ ~ S Fo ≤ ~ 14.30 <S Fo > = 12.51
2.49 ≤ ~ S F ≤ ~ 6.05 <S F > = 4.67
8.75 ≤ ~ S Go ≤ ~ 14.39 <S Go > = 12.19
7.49 ≤ ~ S G ≤ ~ 13.82 <S G > = 10.81
temperature
0.18 ≦ 〜T Fo ≦ 〜1.37 <T Fo > = 0.73
2.68 ≤ ~ T F ≤ ~ 3.31 <T F > = 2.91
0.003 ≤ ~ T Go ≤ ~ 0.10 <T Go > = 0.03
5.75 ≦ 〜T G ≦ 〜20.63 <T G > = 12.31
Therefore, it is a numerical value on the order of 1 / <S> to 0.1, and the square root of the denominator is a value of about 1.1 to 1.6.

8.全系の形容詞エネルギーへの統合
次に部分系のエネルギーを統合する。全系の形容詞エネルギーQiを求めるために、部分和エネルギーPiを線形結合する。このときの線形結合係数は、ある形容詞iにとって色の低次系、色の高次系、テキスチャの低次系、テキスチャの高次系などの何れが重要な役割を占めているかを決めることになる。更に部分系として構図を加えたときは、構図の要素の重要度も加味されることになる。
8). Integration of the entire system into adjective energy Next, integrate the energy of the subsystem. In order to obtain the adjective energy Qi of the whole system, the partial sum energy Pi is linearly combined. The linear combination coefficient at this time determines whether a low-order color system, a higher-order color system, a lower-order texture system, a higher-order texture system, or the like plays an important role for an adjective i. Become. Furthermore, when composition is added as a subsystem, the importance of composition elements is taken into account.

線形結合係数を決定するためのステップは、前述の1つ1つのエネルギー要素Enに対してαiを決定するために行ったのと同様の手続きにより行われる。すなわち、部分和Pi,jを変数xとして、一般モデル画像の分布に対して平均値をmp、その標準偏差σp、形容詞モデル画像の分布に対して平均値をmq、その標準偏差σqを求め、同様に線形結合係数を決定する。

Figure 0005041041
Steps for determining the linear combination coefficient is performed by the same procedure as conducted in order to determine one single αi relative energy elements E n described above. That is, with the partial sum Pi, j as a variable x, the average value m p for the distribution of the general model image, its standard deviation σ p , the average value for the adjective model image distribution m q , its standard deviation σ q is determined and the linear combination coefficient is determined in the same manner.
Figure 0005041041

これらの線形結合係数を用いて、形容詞iに関する全系のエネルギー和Qiを求める。このときもおよそ[-1,1]の範囲に収まるように規格化を行っておく。

Figure 0005041041
Using these linear coupling coefficients, the energy sum Qi of the entire system related to the adjective i is obtained. At this time, normalization is performed so as to be within the range of [-1,1].
Figure 0005041041

ここに<>は一般モデル画像に関する平均、<>iは形容詞に関する平均を表す。なお、これまでに示したエネルギーバンド図はこの部分系の重み係数kについても内包する形のα(En)を用いて描いた図である。また、状態密度については一般モデル画像に用いたエネルギー要素の中でプラスマイナスに最大に振れるガマット領域ρmax(En)に対して、α(Enmax(En)として最大考慮される範囲をエネルギーバンドモデルとして塗りつぶしている。 Here, <> represents an average for a general model image, and <> i represents an average for an adjective. It should be noted that the energy band diagrams shown so far are drawn using α (E n ) in the form including the weighting coefficient k of this subsystem. In addition, the density of states is considered as α (E n ) ρ max (E n ) as the maximum for the gamut region ρ max (E n ) that swings to the maximum in the energy elements used in the general model image. The range is painted as an energy band model.

9.形容詞検索処理
このように学習用として一般モデルと形容詞モデルを組んで、エネルギーバンドモデルを構築すると、別のデータベースの画像に対して、i番目の形容詞をキーワードとして、それに近い印象の画像を形容詞エネルギーQiに基づいて検索をすることができる。Qiの順に画像を並べると、またそれは正規分布に近い形となり、上位群の偏差値の高い領域を目的の画像として提示することができる。また、更には下位群の偏差値が低い領域をこの形容詞とは反対構造をもった印象の画像であるとして提示することもできる。すなわち、ユーザーとしては反対の意味の感性画像の分類結果についても知ることができる。
9. Adjective search processing In this way, when an energy band model is constructed by combining a general model and an adjective model for learning, an image with an impression similar to that of the i-th adjective is used as an adjective energy for another database image. You can search based on Qi. When images are arranged in the order of Qi, it becomes a shape close to a normal distribution, and a region having a high deviation value of the upper group can be presented as a target image. Furthermore, it is also possible to present an area where the deviation value of the subgroup is low as an image of an impression having a structure opposite to this adjective. That is, the user can also know the classification result of the opposite sense image.

更には、ある一枚の画像を入力し、予め用意した形容詞モデルの形容詞全てについてQiを計算しておけば、そのモデルとなった人物にとって、その画像から受ける絶対印象の度合いを、全ての形容詞について数値化することができる。これを値の大きい順に並び替えて表示すれば、この画像は「爽やかさ」が0.8で「のどかさ」も0.7と高く、「賑やかさ」は−0.7と反対方向に低いためその印象は全く感じないといった結果を提示することができる。   Furthermore, if a single image is input and Qi is calculated for all adjectives of the adjective model prepared in advance, the degree of absolute impression received from the image for all the adjectives for that model Can be quantified. If this is rearranged and displayed in descending order, this image has a “freshness” of 0.8 and a “nodiness” as high as 0.7, and a “liveness” as low as −0.7 in the opposite direction. Therefore, a result that the impression is not felt at all can be presented.

形容詞のエネルギーバンドモデルとしては、万人に共通する平均モデルにとることもでき、国、文化、言語の違いに応じてそれらの文化圏に特有のモデルを構築することもできる。あるいは、個人レベルの嗜好の違いを反映した個性的なエネルギーバンドモデルも構築することができる。したがって、この画像検索システムが採用するエネルギーバンド構造のモデルは、人の感性の構造を定量的に解明するツールとしても使うことができる。   As an adjective energy band model, it can be an average model that is common to all people, and models specific to those cultural spheres can be constructed according to differences in countries, cultures, and languages. Alternatively, an individual energy band model that reflects differences in personal-level preferences can be constructed. Therefore, the energy band structure model adopted by this image retrieval system can be used as a tool for quantitatively elucidating the structure of human sensitivity.

実験的に、個性の違いが区別できるか試してみたところ、「荒々しい」という形容詞に対して、一人目は山肌の木々が鋭く林立した風景と川の流れが激しくしぶきを上げる様子と半々程度に選んだモデルに対して、感性検索結果はそれらの要素を複合的に捉えて上位群に集めてくる効果を示した。また、別の人は川の流れが激しくしぶきを上げる様子を主なモデル画像として選んだのに対しては、形容詞エネルギーQiはきっちりと川の流れの特徴をつかんで、モデルに近い画像を抽出する性能を示した。ゆえに、特徴量として用いたエネルギー要素Enは、画像全体に写り込んだ物体を識別する能力を備えているということができる。 Experimentally, when I tried to distinguish the difference in individuality, in contrast to the adjective “rough”, the first one is half-mountain trees and sharply forested landscape and the river flow violently splashing Kansei search results showed the effect of gathering these elements in a high rank group for the model selected to the extent. Also, while another person chose the main model image that the river flow was violently splashing, the adjective energy Qi exactly grasped the characteristics of the river flow and extracted an image close to the model Showed performance. Thus, the energy elements E n used as feature amounts, fancy-through the entire image can be said that the capability to identify the object.

なお、偏差値によって線形結合係数を求める考え方を延長して、最終的に求めたQiの値が、一般モデル画像に対して形容詞モデル画像は、上位群に集まってきているか否かは、もう一度モデル画像群のQiの一般モデルに対する偏差値を求めておけば確認することができる。これによって、理論モデルの正当性と扱う特徴量の十分性を検証することができる。

Figure 0005041041
Note that the idea of obtaining the linear combination coefficient by the deviation value is extended, and the final obtained Qi value is a model once more whether or not the adjective model image is gathered in the upper group compared to the general model image. This can be confirmed by obtaining the deviation value of the image group from the general model of Qi. As a result, the validity of the theoretical model and the sufficiency of the feature amount to be handled can be verified.
Figure 0005041041

この考え方を拡張して、最終的に求めた各々の形容詞に関するQiに対して、j番目の形容詞エネルギーQjの一般モデル画像分布に対して、i番目の形容詞エネルギーQiの形容詞モデル画像分布がどこに位置しているかを見ることによって、j番目の形容詞にとってi番目の形容詞の絶対印象がどれだけ含まれているかが分かり、i番目の形容詞はj番目の形容詞と近い印象を与える同類群に属するような形容詞なのか、あるいはi番目の形容詞はj番目の形容詞と正反対の印象を与える遠くはなれた形容詞群に属する形容詞なのかを表現する形容詞間の相関行列wijを求めることができる。これにより、万人に共通の形容詞構造のマップが明らかになるとともに、文化圏の違いや、個性の違いに関する形容詞のマップ構造も解明することができる。

Figure 0005041041
Extending this idea, for the Qi for each adjective finally obtained, where is the adjective model image distribution of the i-th adjective energy Qi relative to the general model image distribution of the j-th adjective energy Qj? The j-th adjective shows how much the absolute impression of the i-th adjective is included, and the i-th adjective belongs to a similar group that gives an impression similar to the j-th adjective It is possible to obtain a correlation matrix w ij between adjectives expressing whether they are adjectives or whether the i-th adjective belongs to a group of distant adjectives that gives the opposite impression of the j-th adjective. As a result, a map of adjective structures common to all people can be clarified, and the map structure of adjectives related to differences in cultural spheres and differences in individuality can be clarified.
Figure 0005041041

iとjの関係を入れ替えて、i番目の形容詞エネルギーQiの一般モデル分布画像に対して、j番目の形容詞エネルギーQjの形容詞モデル画像分布の偏差値も同様に別経路で計算することができる。定義からして形容詞の相関行列は対称行列である。すなわち、
wij = wji
しかしながら、別経路をたどって計算したものは、母集団画像の性質に偏りがある場合等には必ずしも一致しない。したがって、形容詞の相関行列が対称行列に近い値を示すか否かは、モデル構築過程に選んだ画像群が一般性の高いランダムな画像を選定しているか否かに関する妥当性を検証するためのよい指標を与える。また、対角成分は前述したように全てが1になるのが望ましく、そこに到達していない場合は、その形容詞を捉えるための特徴量が不足しているか、理論モデル仮説の成り立たない部分が存在することを意味するので、検索システムを構築する上でよい評価指標を与える。
By exchanging the relationship between i and j, the deviation value of the adjective model image distribution of the j-th adjective energy Qj can be similarly calculated by another path with respect to the general model distribution image of the i-th adjective energy Qi. By definition, the adjective correlation matrix is a symmetric matrix. That is,
w ij = w ji
However, what is calculated by following another path does not necessarily match when the characteristics of the population image are biased. Therefore, whether or not the correlation matrix of the adjective shows a value close to a symmetric matrix is to verify the validity of whether or not the image group selected in the model construction process selects a general random image. Give a good indicator. In addition, it is desirable that all diagonal components are 1 as described above. If the diagonal component has not been reached, the feature amount for capturing the adjective is insufficient, or the portion where the theoretical model hypothesis does not hold. Since it means that it exists, it gives a good evaluation index for building a search system.

[第6の実施形態]
(感性検索:「エネルギー+運動量+角運動量」の3段階統合)
第5の実施形態では、個性を反映した形容詞検索も可能であると述べた。しかし、個人の形容詞モデルを構築するに当たっては、ある程度多くの画像が用意されていることが望ましい。それに対して、もっと少数の3〜5枚程度の画像を提示して、それらの画像感性に近い画像をデータベースから選び出したいというような目的のときには、統計平均による情報の消失過程が不完全状態となるので、第5の実施形態で省略した力学的不変量も考察対象に加える必要が生じる。それに伴って新たに付け加える過程だけ以下に述べる。
[Sixth Embodiment]
(Sensitivity search: 3 steps integration of "energy + momentum + angular momentum")
In the fifth embodiment, it is described that an adjective search reflecting individuality is also possible. However, when constructing an individual adjective model, it is desirable that a certain number of images be prepared. On the other hand, when the purpose is to present a smaller number of 3 to 5 images and select from the database images that are close to their image sensitivity, the process of disappearance of information by statistical averaging is incomplete. Therefore, it is necessary to add the mechanical invariant omitted in the fifth embodiment to the object of consideration. Only the newly added process is described below.

1.マンセルHVC色空間への変換
2.HVC面のエッジ画像の作成
3.色の低次不変量の作成
3−1.低次系の分布関数の作成
3−2.エントロピーの計算
3−3.運動量の要素pnの計算
第5の実施形態で定義した運動量の内、平均値<H>、<V>、<C>のみを運動量の要素とする。
3−4.角運動量の要素Mnの計算
第5の実施形態で定義した運動量の内、標準偏差値σH、σV、σCを角運動量の要素とする。
3−5.エネルギーの要素Enの計算
3−6.部分系の温度の計算
色の高次系で後述する内容と同じ手続きを踏む。ここでは詳細を述べない。
3−7.部分系の自由エネルギーの計算
色の高次系で後述する内容と同じ手続きを踏む。ここでは詳細を述べない。
4.色の高次不変量の作成
4−0.低次系の分布関数のヒルベルト空間表現
4−1.高次系の分布関数の作成
4−2.エントロピーの計算
4−3.運動量の要素pnの計算
4−4.角運動量の要素Mnの計算
チェビシェフ展開係数は角運動量量子数l=0と1に分かれるから、角運動量量子数と運動量の積をとって角運動量を計算する。角運動量の要素Mnは次のようになる。
(c11 (α)+c12 (α)+...+c1N (α)) (α)=H,V,C。
4−5.エネルギーの要素Enの計算
4−6.部分系の温度の計算
エネルギー要素の値をエネルギーの単位でまとめてベクトル表記し、同様に運動量の要素の値も運動量の単位で、角運動量の要素の値も角運動量の単位でまとめてベクトル表記すると、部分系のエネルギーベクトルと運動量ベクトルと角運動量ベクトルが定義できる。

Figure 0005041041
1. 1. Conversion to Munsell HVC color space 2. Create edge image of HVC plane Creation of low-order invariants of color 3-1. Creation of low-order system distribution function 3-2. Calculation of entropy 3-3. Of defined in calculating the fifth embodiment of the elements p n of momentum momentum, the average value <H>, <V>, the elements of the momentum only <C>.
3-4. Calculation of Angular Momentum Element Mn Among the momentums defined in the fifth embodiment, standard deviation values σ H , σ V , and σ C are used as angular momentum elements.
3-5. Calculation of the energy elements E n of 3-6. Subsystem temperature calculation Follow the same procedure as described below for higher-order color systems. Details are not given here.
3-7. Calculation of free energy of subsystems Follow the same procedure as described later for higher-order colors. Details are not given here.
4). Creation of higher-order invariants of color 4-0. Hilbert space expression of low-order distribution function 4-1. Creation of high-order distribution function 4-2. Calculation of entropy 4-3. Calculation of momentum element p n 4-4. Calculation of angular momentum element M n Since the Chebyshev expansion coefficient is divided into angular momentum quantum numbers l = 0 and 1, angular momentum is calculated by taking the product of angular momentum quantum number and momentum. The angular momentum element M n is as follows.
(c 11 (α) + c 12 (α) + ... + c 1N (α) ) (α) = H, V, C.
4-5. Calculation of the energy elements E n of 4-6. Subsystem temperature calculation Energy element values are collectively expressed in units of energy, and momentum element values are also expressed in momentum units, and angular momentum element values are also expressed in vector units of angular momentum. Then, the energy vector, momentum vector, and angular momentum vector of the subsystem can be defined.
Figure 0005041041

部分系のエネルギーベクトル、運動量ベクトル、角運動量ベクトルのそれぞれのノルムを計算すると、部分系に関する画像の温度TE,Tp,TMが力学的不変量の単位で定義できる。

Figure 0005041041
When the norms of the energy vector, momentum vector, and angular momentum vector of the subsystem are calculated, the image temperatures T E , T p , T M related to the subsystem can be defined in units of mechanical invariants.
Figure 0005041041

4−7.部分系の自由エネルギーの計算
エネルギーの場合の類推から、部分系の自由エネルギー、自由運動量、自由角運動量を定義する。

Figure 0005041041
4-7. Calculation of free energy of subsystems From the analogy of energy, the free energy, free momentum, and free angular momentum of subsystems are defined.
Figure 0005041041

5.テキスチャの低次不変量の作成
「3.色の低次不変量の作成」で述べた要領と全く同様である。
6.テキスチャの高次不変量の作成
s,p軌道による球ベッセル展開を行うときは、「4.色の高次不変量の作成」で述べた要領と全く同様であるので記述は省略する。
7.部分系の力学的不変量単位の統合
7−1.形容詞の設定
7−2.一般画像モデルの構築
7−3.形容詞モデル画像の構築
7−4.要素内の分布における偏差値の算出
第6の実施形態では各エネルギー要素Enについて偏差値とその誤差の算出を行ったが、第7の実施形態では同様のことを運動量の要素pnと角運動量の要素Mnについても行う。記号を変えて、エネルギー要素に対する偏差値をβi、運動量の要素に対する偏差値をγi、角運動量の要素に対する偏差値をδiとする。

Figure 0005041041
5. Creation of texture low-order invariants This is exactly the same as described in “3. Creation of color low-order invariants”.
6). Create higher-order invariants for textures
When performing spherical Bessel expansion using s, p orbits, the description is omitted because it is exactly the same as the procedure described in “4.
7). Integration of mechanical invariant units of subsystems 7-1. Setting adjectives 7-2. Construction of general image model 7-3. Construction of adjective model image 7-4. Although the calculated sixth embodiment of the deviation in the distribution of the element was performed deviation values for each energy elements E n and the calculation of the error, the elements p n and the angular momentum that similar in the seventh embodiment This is also done for the momentum element M n . By changing the symbols, the deviation value for the energy element is β i , the deviation value for the momentum element is γ i , and the deviation value for the angular momentum element is δ i .
Figure 0005041041

7−5.部分系の力学的不変量単位の部分エネルギー、部分運動量、部分角運動量の算出
上述のようにして、自由エネルギーベクトル、自由運動量ベクトル、自由角運動量ベクトルの各々に対してモデル形容詞ベクトルが定まる。なお、TS不変量に対しても同様の過程を経て偏差値を定めているものとする。すなわち、

Figure 0005041041
7-5. Calculation of Partial Energy, Partial Momentum, and Partial Angular Momentum of Mechanical Invariant Units of Subsystem As described above, model adjective vectors are determined for each of the free energy vector, free momentum vector, and free angular momentum vector. It is assumed that the deviation value is determined through the same process for the TS invariant. That is,
Figure 0005041041

両者の内積をとって形容詞iの印象に関する部分系の力学的不変量単位の部分エネルギーEi、部分運動量pi、部分角運動量Miに統合する。規格化によって、全ての力学的不変量の次元が揃う。

Figure 0005041041
The inner product of both is taken and integrated into the partial energy E i , partial momentum p i , and partial angular momentum M i of the mechanical invariant unit of the subsystem related to the impression of the adjective i. Normalization brings all dimensions of mechanical invariants.
Figure 0005041041

8.部分系の形容詞エネルギーへの統合
部分系の中で求まった3つの力学的不変量は、部分系内における形容詞iに関する統計平均されたエネルギーの期待値、運動量の期待値、角運動量の期待値を表す。それらの巨視的な物理量のうち、少数画像モデルの場合、どれが重要な役割を果たすかを、3つの力学的不変量を線形結合するときの結合係数によって表す。それらの結合係数は同様に、一般モデル画像と形容詞モデル画像の分布関数の位置関係から偏差値によって記述することができる。各々の結合係数をαi(Ei),αi(pi),αi(Mi)によって表す。

Figure 0005041041
8). Integration of subsystems into adjective energy The three mechanical invariants found in the subsystem are the statistically averaged expected energy value, expected momentum value, and expected angular momentum value for the adjective i in the subsystem. Represent. Of these macroscopic physical quantities, which plays an important role in the case of a few image model is represented by a coupling coefficient when the three mechanical invariants are linearly combined. Similarly, these coupling coefficients can be described by deviation values from the positional relationship between the distribution functions of the general model image and the adjective model image. Each coupling coefficient is represented by α i (E i ), α i (p i ), α i (M i ).
Figure 0005041041

3つの線形結合係数をαiのベクトルとして、3つの力学的不変量をE'のベクトルとして表記する。

Figure 0005041041
Three linear combination coefficients are represented as α i vectors, and three mechanical invariants are represented as E ′ vectors.
Figure 0005041041

部分系の形容詞エネルギーPiはこれらの内積をとって表される。

Figure 0005041041


The adjective energy P i of the subsystem is expressed by taking these inner products.
Figure 0005041041


9.全系の形容詞エネルギーへの統合
後は第5の実施形態と全く同様である。
10.形容詞検索処理
[第7の実施形態]
(一枚画像の類似画像検索:「エネルギー+運動量+角運動量」の3段階統合)
第6の実施形態では、少数モデルによる形容詞モデルを構築する例を示した。これを極限にまで持って行けば、一枚の類似画像検索に使うことができる。すなわち、例示された一枚の画像の全体の印象が近い画像を、巨視的な物理量であるエネルギー、運動量、角運動量の記述を通して抽出することが可能になる。
9. After integration into the adjective energy of the whole system, it is exactly the same as in the fifth embodiment.
10. Adjective retrieval processing [seventh embodiment]
(Similar image search of single image: 3 steps integration of “energy + momentum + angular momentum”)
In the sixth embodiment, an example of constructing an adjective model using a minority model has been described. If you take this to the limit, you can use it to search for a single similar image. That is, it is possible to extract an image having a similar overall impression of one illustrated image through description of energy, momentum, and angular momentum, which are macroscopic physical quantities.

第6の実施形態の方法は、第5の実施形態の方法を包含している。なぜならば、モデル画像が多数になると、運動量と角運動量の役割が減って、自動的に統計平均によって、それらの線形結合係数は零に近い値に収束するからである。したがって、第6の実施形態の方法は、一枚画像検索から少数モデルの感性検索、更には多数モデルの感性検索までシームレスに実現することができる。   The method of the sixth embodiment includes the method of the fifth embodiment. This is because as the number of model images increases, the role of momentum and angular momentum decreases, and their linear combination coefficients converge to a value close to zero automatically by statistical averaging. Therefore, the method of the sixth embodiment can be seamlessly realized from single image search to small-model sensitivity search, and further to multiple-model sensitivity search.

Claims (17)

画像を入力する画像入力手段と、
前記画像の画素値の分布関数を作成する分布関数作成手段と、
前記分布関数を、完全系をなし分布域内で異なる重みによって互いに直交する基底関数を用いて級数展開し、展開係数によって前記分布関数を記述する記述手段と、
前記展開係数の2次形式の和を少なくとも含む指標を算出することによって、前記分布関数の形状の特徴を評価する評価手段と、
前記指標を値の大きさの順に並べ替えることによって、前記画像を該指標の性質を備えた画像とそれとは反対の性質を備えた画像の少なくとも2つの範疇の画像に分類する分類手段と
を備えたことを特徴とする画像分類装置。
An image input means for inputting an image;
A distribution function creating means for creating a distribution function of pixel values of the image;
A description means for describing the distribution function by expansion of the distribution function using a basis function orthogonal to each other by different weights in a complete distribution region, and describing the distribution function by an expansion coefficient;
Evaluation means for evaluating characteristics of the shape of the distribution function by calculating an index including at least a sum of quadratic forms of the expansion coefficients;
Classifying means for classifying the image into at least two categories of images having the property of the index and an image having the opposite property by rearranging the index in order of value size An image classification apparatus characterized by that.
請求項1に記載の画像分類装置において、
前記記述手段は、正の領域に広がる分布域の中央部と両端部で異なる重みによって互いに直交する基底関数を用いることを特徴とする画像分類装置。
The image classification device according to claim 1,
The image classification apparatus according to claim 1, wherein the description means uses basis functions orthogonal to each other with different weights at a central portion and both end portions of a distribution region extending in a positive region.
請求項1に記載の画像分類装置において、
前記記述手段は、分布関数の両端に位置する立ち上がり部と立ち下がり部の形状に対して、中央部の形状よりも重点を置いた密度で形状記述が可能な基底関数を用いることを特徴とする画像分類装置。
The image classification device according to claim 1,
The description means uses a basis function capable of describing the shape at a density with more emphasis than the shape of the central portion with respect to the shapes of the rising and falling portions located at both ends of the distribution function. Image classification device.
請求項1に記載の画像分類装置において、
前記記述手段は、前記基底関数としてチェビシェフ多項式を用いることを特徴とする画像分類装置。
The image classification device according to claim 1,
The image classification apparatus according to claim 1, wherein the description means uses a Chebyshev polynomial as the basis function.
画像を入力する画像入力手段と、
前記画像のエッジ成分に関するエッジ画像を作成するエッジ画像作成手段と、
前記エッジ画像の画素値の分布関数を作成する分布関数作成手段と、
前記分布関数を、完全系をなし分布域内で異なる重みによって互いに直交する基底関数を用いて級数展開し、展開係数によって前記分布関数を記述する記述手段と、
前記展開係数の2次形式の和を少なくとも含む指標を算出することによって、前記分布関数の形状の特徴を評価する評価手段と、
前記指標を値の大きさの順に並び替えることによって、前記画像を該指標の性質を備えた画像とそれとは反対の性質を備えた画像の少なくとも2つの範疇の画像に分類する分類手段と
を備えたことを特徴とする画像分類装置。
An image input means for inputting an image;
Edge image creation means for creating an edge image related to an edge component of the image;
A distribution function creating means for creating a distribution function of pixel values of the edge image;
A description means for describing the distribution function by expansion of the distribution function using a basis function orthogonal to each other by different weights in a complete distribution region, and describing the distribution function by an expansion coefficient;
Evaluation means for evaluating characteristics of the shape of the distribution function by calculating an index including at least a sum of quadratic forms of the expansion coefficients;
Classifying means for classifying the image into images having at least two categories of an image having the property of the index and an image having the opposite property by rearranging the index in order of value size. An image classification apparatus characterized by that.
請求項5に記載の画像分類装置において、
前記記述手段は、正と負の領域に広がる分布域の零付近と外側で異なる重みによって互いに直交する基底関数を用いることを特徴とする画像分類装置。
The image classification device according to claim 5, wherein
The image classification apparatus according to claim 1, wherein the description means uses basis functions that are orthogonal to each other with different weights near and outside the zero of the distribution range extending in the positive and negative regions.
請求項5に記載の画像分類装置において、
前記記述手段は、分布関数の外側に位置する裾野部分の形状に対して、原点付近の形状よりも重点を置いた密度で形状記述が可能な基底関数を用いることを特徴とする画像分類装置。
The image classification device according to claim 5, wherein
The image classification apparatus according to claim 1, wherein the description means uses a basis function capable of describing a shape at a density with more emphasis than the shape near the origin for the shape of the skirt portion located outside the distribution function.
請求項5に記載の画像分類装置において、
前記記述手段は、前記基底関数として球ベッセル関数を用いることを特徴とする画像分類装置。
The image classification device according to claim 5, wherein
The image classification apparatus, wherein the description means uses a spherical Bessel function as the basis function.
請求項5に記載の画像分類装置において、
前記エッジ画像作成手段は、前記画像をフィルタリングして逐次的に複数の解像度からなる高周波サブバンド画像を生成し、前記高周波サブバンド画像を低い解像度から逐次的に統合して、一つに統合された高周波帯域画像を生成し、前記一つに統合された高周波帯域画像をエッジ画像とすることを特徴とする画像分類装置。
The image classification device according to claim 5, wherein
The edge image creation means filters the image to sequentially generate a high-frequency subband image having a plurality of resolutions, and sequentially integrates the high-frequency subband images from a low resolution to be integrated into one. A high frequency band image is generated, and the integrated high frequency band image is used as an edge image.
請求項1または5に記載の画像分類装置において、
前記画像がカラー画像である場合、前記画像を色相面と輝度面と彩度面の3つの色面画像で表し、前記3つの色面画像の各々について前記処理を行うことによって、前記カラー画像を少なくとも2つの範疇の画像に分類することを特徴とする画像分類装置。
In the image classification device according to claim 1 or 5,
When the image is a color image, the image is represented by three color plane images of a hue plane, a luminance plane, and a saturation plane, and the color image is obtained by performing the processing on each of the three color plane images. An image classification apparatus for classifying images into at least two categories.
請求項1または5に記載の画像分類装置において、
前記分類手段は、前記画像を少なくとも正反対の性質を備えた2つの形容詞の範疇に分類することを特徴とする画像分類装置。
In the image classification device according to claim 1 or 5,
The classification means classifies the image into two adjective categories having at least opposite properties .
画像を入力する画像入力手段と、
前記画像の画素値の分布関数を作成する分布関数作成手段と、
前記分布関数を、完全系をなし互いに直交する、偶関数群と奇関数群とからなる基底関数を用いて級数展開し、展開係数によって前記分布関数を記述する記述手段と、
前記基底関数群の中で偶関数と奇関数に関する性質が同じ部分群に所属する関数群に対して、それぞれ偶数の量子数(0,2,...)と奇数の量子数(1,3,...)を付与し、前記展開係数と各々に付与された量子数との積を全ての展開係数について和をとった物理量を算出する物理量算出手段と、
前記物理量に基づき、前記分布関数の形状の特徴を評価する指標を算出する評価手段と、
前記指標を値の大きさの順に並び替えることによって、前記画像を該指標の性質を備えた画像とそれとは反対の性質を備えた画像の少なくとも2つの範疇の画像に分類する分類手段とを備えたことを特徴とする画像分類装置。
An image input means for inputting an image;
A distribution function creating means for creating a distribution function of pixel values of the image;
Description means for describing the distribution function by expansion of the distribution function using a basis function composed of an even function group and an odd function group forming a complete system and orthogonal to each other, and describing the distribution function by an expansion coefficient;
For the function groups belonging to the same subgroup in the basis function group, the properties related to the even function and the odd function are even quantum numbers (0,2, ...) and odd quantum numbers (1,3, respectively). , ...), and a physical quantity calculating means for calculating a physical quantity obtained by summing the product of the expansion coefficient and the quantum number assigned to each of the expansion coefficients,
Evaluation means for calculating an index for evaluating characteristics of the shape of the distribution function based on the physical quantity;
Classifying means for classifying the image into images having at least two categories of an image having the property of the index and an image having the opposite property by rearranging the index in order of value size. An image classification apparatus characterized by that.
請求項12に記載の画像分類装置において、
前記画像入力手段が、1つの色面の画像を入力するとき、
前記記述手段は、前記基底関数としてチェビシェフ多項式を用い、
前記物理量算出手段は、全ての偶関数群に対して量子数0を付与し、全ての奇関数群に対して量子数1を付与して、前記物理量を算出することを特徴とする画像分類装置。
The image classification device according to claim 12, wherein
When the image input means inputs an image of one color plane,
The description means uses a Chebyshev polynomial as the basis function,
The physical quantity calculating means assigns a quantum number of 0 to all even function groups and assigns a quantum number of 1 to all odd function groups to calculate the physical quantity, .
請求項12に記載の画像分類装置において、
前記画像入力手段が、1つの色面のエッジ成分に関するエッジ画像を入力するとき、
前記記述手段は、前記基底関数として、少なくとも次数0の偶関数群と次数1の奇関数群とからなる球ベッセル関数を用い、
前記物理量算出手段は、球ベッセル関数の次数に等しい量子数を各部分群に付与し、前記物理量を算出することを特徴とする画像分類装置。
The image classification device according to claim 12, wherein
When the image input means inputs an edge image related to an edge component of one color plane,
The description means uses, as the basis function, a spherical Bessel function composed of at least an even function group of degree 0 and an odd function group of degree 1;
The physical quantity calculating means assigns a quantum number equal to the order of a spherical Bessel function to each subgroup, and calculates the physical quantity.
請求項14に記載の画像分類装置において、
前記記述手段が、次数2以上の球ベッセル関数をも用いて、前記分布関数を記述するとき、
前記物理量算出手段は、前記物理量を算出するとともに、更に前記奇数次の展開係数を負の符号に反転した場合の積の和もとって前記物理量をもう1つ算出することを特徴とする画像分類装置。
The image classification device according to claim 14, wherein
When the description means describes the distribution function using a spherical Bessel function of degree 2 or higher,
The physical quantity calculating means calculates the physical quantity, and further calculates another physical quantity based on a sum of products when the odd-order expansion coefficient is inverted to a negative sign. apparatus.
請求項14に記載の画像分類装置において、
前記エッジ画像は、前記画像をフィルタリングして逐次的に複数の解像度からなる高周波サブバンド画像を生成し、前記高周波サブバンド画像を低い解像度から逐次的に統合して、一つに統合された高周波帯域画像であることを特徴とする画像分類装置。
The image classification device according to claim 14, wherein
The edge image is generated by filtering the image to sequentially generate a high-frequency subband image having a plurality of resolutions, sequentially integrating the high-frequency subband images from a low resolution, and combining the high-frequency subband images into one. An image classification device characterized by being a band image.
請求項14または16に記載の画像分類装置において、
前記画像入力手段は、色相と輝度と彩度の各々の面のエッジ画像を入力することを特徴とする画像分類装置。
The image classification device according to claim 14 or 16,
The image input device, wherein the image input means inputs an edge image of each surface of hue, luminance, and saturation.
JP2010147027A 2009-07-15 2010-06-29 Image classification device Active JP5041041B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2010147027A JP5041041B2 (en) 2009-07-15 2010-06-29 Image classification device
US12/834,457 US8478053B2 (en) 2009-07-15 2010-07-12 Image sorting apparatus

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2009166376 2009-07-15
JP2009166376 2009-07-15
JP2010147027A JP5041041B2 (en) 2009-07-15 2010-06-29 Image classification device

Publications (2)

Publication Number Publication Date
JP2011040050A JP2011040050A (en) 2011-02-24
JP5041041B2 true JP5041041B2 (en) 2012-10-03

Family

ID=43767696

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010147027A Active JP5041041B2 (en) 2009-07-15 2010-06-29 Image classification device

Country Status (1)

Country Link
JP (1) JP5041041B2 (en)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013020335A (en) * 2011-07-08 2013-01-31 Nikon Corp Image classification method
JP5902196B2 (en) * 2011-12-13 2016-04-13 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation Method, apparatus and computer program for retrieving medical images
GB2515398B (en) * 2011-12-13 2018-02-14 Ibm Method,apparatus, and computer program for generating representative image and radiographic interpretation information for each case
US9262442B2 (en) 2012-09-20 2016-02-16 International Business Machines Corporation Techniques for generating a representative image and radiographic interpretation information for a case
JP7322418B2 (en) * 2018-06-04 2023-08-08 株式会社デンソー Feature quantity extraction device, feature quantity extraction method, and object recognition device
CN108986180B (en) * 2018-06-07 2022-09-16 创新先进技术有限公司 Palette generation method and device and electronic equipment
CN115841624B (en) * 2023-02-23 2023-05-23 山东洲蓝环保科技有限公司 Blast furnace gas flow distribution identification method based on infrared image

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001195579A (en) * 2000-01-07 2001-07-19 Omron Corp Image evaluating device
JP4029316B2 (en) * 2001-10-18 2008-01-09 日本電気株式会社 Image type identification method and apparatus and image processing program
JP2004152087A (en) * 2002-10-31 2004-05-27 Fuji Photo Film Co Ltd Method and apparatus for extracting feature vector of image
JP2009031109A (en) * 2007-07-26 2009-02-12 Tokyo Institute Of Technology Method for analyzing image

Also Published As

Publication number Publication date
JP2011040050A (en) 2011-02-24

Similar Documents

Publication Publication Date Title
WO2013008573A1 (en) Image classification method
US8478053B2 (en) Image sorting apparatus
JP5041041B2 (en) Image classification device
Stoudenmire Learning relevant features of data with multi-scale tensor networks
Li et al. Learning disentangled feature representation for hybrid-distorted image restoration
CN107341505B (en) Scene classification method based on image significance and Object Bank
JP2010067221A (en) Image classification device
Khosla et al. Evaluation of Euclidean and Manhanttan metrics in content based image retrieval system
Rochac et al. A data augmentation-assisted deep learning model for high dimensional and highly imbalanced hyperspectral imaging data
He et al. Hyperspectral image spectral–spatial-range Gabor filtering
Mishra et al. Medical image retrieval using self-organising map on texture features
Jaffar Facial expression recognition using hybrid texture features based ensemble classifier
CN111680579A (en) Remote sensing image classification method for adaptive weight multi-view metric learning
Hossain et al. A new approach of content based image retrieval using color and texture features
CN110263808A (en) A kind of Image emotional semantic classification method based on LSTM network and attention mechanism
Kukharev et al. Face recognition using two-dimensional CCA and PLS
JP5007758B2 (en) Image classification device
JP5041040B2 (en) Image classification device
JP5007757B2 (en) Image classification device
Dixit et al. Utilization of edge operators for localization of copy-move image forgery using WLD-HOG features with connected component labeling
Arzuaga-Cruz et al. A MATLAB toolbox for hyperspectral image analysis
JP2013020337A (en) Image classification method
JP2013020336A (en) Image classification method
Liu et al. A novel image segmentation combined color recognition algorithm through boundary detection and deep neural network
Xue et al. Investigation of the role of aesthetics in differentiating between photographs taken by amateur and professional photographers

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110502

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110915

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111108

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111205

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120612

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120625

R150 Certificate of patent or registration of utility model

Ref document number: 5041041

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150720

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150720

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250