JP5548950B2 - 画像処理装置及び方法、並びにプログラム - Google Patents
画像処理装置及び方法、並びにプログラム Download PDFInfo
- Publication number
- JP5548950B2 JP5548950B2 JP2010140551A JP2010140551A JP5548950B2 JP 5548950 B2 JP5548950 B2 JP 5548950B2 JP 2010140551 A JP2010140551 A JP 2010140551A JP 2010140551 A JP2010140551 A JP 2010140551A JP 5548950 B2 JP5548950 B2 JP 5548950B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- viewpoint
- image
- series
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Image Processing (AREA)
Description
このため、画像処理分野では、人間の脳の視覚の順序に基づく画像処理を施す手法として、様々な手法の実現が求められている。
特に、研究開発が進んでいる音声処理分野の技術を画像処理分野に適用可能な手法の実現が強く求められている。例えば音声処理分野における特許文献1に記載の技術を画像処理分野に適用するためには、時系列の2次元データが必要になる。しかしながら、画像データを時系列の2次元データ化する適切な手法自体が見受けられず、特許文献1に記載の技術を画像処理分野に適用できる段階まで至っていない状況である。
所定の画像を原画像として、前記原画像のデータに対して画像処理を施す画像処理装置において、
前記原画像のデータを構成する各画素の画素値のそれぞれを構成要素として、人間が視覚により画像を認知していく時間的順序に基づいて決定された所定の順番で配列し直し、その結果得られるデータを、視点2次元時系列データとして出力する認知変換手段と、
前記認知変換手段から出力された前記視点2次元時系列データを変換処理する2次元時系列データ変換手段と、
前記2次元時系列データ変換手段で変換処理された前記再生成視点2次元時系列データを、前記認知変換手段で用いられた前記所定の順番と逆の順番で配列し直し、その結果得られるデータを、再生成画像のデータとして出力する逆認知変換手段と、
を備える画像処理装置を提供する。
図1は、本発明の第1実施形態に係る画像処理装置1の外観構成例を示す斜視図である。
図1に示すように、画像処理装置1は、デジタルフォトフレームとして構成されている。このため、画像処理装置1の正面(図1に図示されている面)には、例えば液晶ディスプレイ等で構成される表示部11が設けられている。
また、画像処理装置1には、マウス等で構成され、ユーザの指示操作を受け付ける操作部12が設けられている。
ここで、「画面」とは、表示装置又は装置が有する表示部(本実施形態では表示部11)の表示領域全体に表示される画像をいう。
図2の例の表示部11の画面には、同図中左方から順に、原画像表示領域21と、視点時系列表示領域22R,22G,22Bと、アトラクタ表示領域23R,23G,23Bと、再生成画像表示領域24と、が設けられている。
詳細については後述するが、認知変換処理とは、人間の脳が視覚により画像を認知していく時間的順序に基づいて、原画像のデータを、時系列の2次元データに変換する処理をいう。このような時系列の2次元のデータを、以下、「視点時系列2次元データ」と呼ぶ。また、視点時系列2次元データにより表現される画像、即ち、横軸が時間軸となり縦軸が画素値(本実施形態では輝度値)の軸となるグラフであって、視点時系列2次元データの各時刻に相当するデータがプロットされたグラフを含む画像を、「視点時系列2次元グラフ」と呼ぶ。
原画像のデータは、RGB毎の輝度データに分割され、各々の輝度データに対して認知変換処理が施される。
この場合、Rの輝度データに対して認知変換処理が施された結果として、Rについての視点時系列2次元データが得られ、当該視点時系列2次元データにより表現される視点時系列2次元グラフが、視点時系列表示領域22Rに表示される。
同様に、Gの輝度データに対して認知変換処理が施された結果として、Gについての視点時系列2次元データが得られ、当該視点時系列2次元データにより表現される視点時系列2次元グラフが、視点時系列表示領域22Gに表示される。
また、Bの輝度データに対して認知変換処理が施された結果として、Bについての視点時系列2次元データが得られ、当該視点時系列2次元データにより表現される視点時系列2次元グラフが、視点時系列表示領域22Bに表示される。
上述したように、視点時系列2次元データは、RGB毎に分割されている。従って、RGB毎の視点時系列2次元データの各々に対してターケンスプロット処理がそれぞれ施される。
この場合、Rの視点時系列2次元データに対してターケンスプロット処理が施された結果として、Rについてのアトラクタのデータが得られ、当該データにより表現されるアトラクタがN次元の空間に描画された画像(以下、「アトラクタ描画空間画像」と呼ぶ)が、アトラクタ表示領域23Rに表示される。
同様に、Gの視点時系列2次元データに対してターケンスプロット処理が施された結果として、Gについてのアトラクタのデータが得られ、当該データにより表現されるアトラクタ描画空間画像が、アトラクタ表示領域23Gに表示される。
また、Bの視点時系列2次元データに対してターケンスプロット処理が施された結果として、Bについてのアトラクタのデータが得られ、当該データにより表現されるアトラクタ描画空間画像が、アトラクタ表示領域23Bに表示される。
このように、ユーザにより形状が編集されたアトラクタを、以下、「編集後アトラクタ」と呼ぶ。
即ち、このようなユーザの編集の操作を受け付けて、編集後アトラクタのデータを生成する処理が、ターケンス可逆変換処理の第2の処理である。このようなターケンス可逆変換処理の第2の処理を、以下、「アトラクタ編集処理」と呼ぶ。
アトラクタ編集処理には、表示部11のアトラクタ表示領域23R,23G,23Bの各々に表示されるアトラクタ描画空間画像を、編集後アトラクタを含む画像に更新する処理も含まれる。
なお、このようにして逆変換された時系列の2次元データは、編集後アトラクタに基づいて視点時系列2次元データがいわば再生成されたものであるため、以下、「再生成視点時系列2次元データ」と呼ぶ。
即ち、編集後アトラクタを含むRGB毎のアトラクタのデータから、再生成視点時系列2次元データを生成する処理が、ターケンス可逆変換処理の第3の処理である。このようなターケンス可逆変換処理の第3の処理を、以下、「時系列2次元データ再生成処理」と呼ぶ。
再生成画像表示領域24には、編集後アトラクタを含むRGB毎のアトラクタのデータに対して、画像処理装置1により逆認知変換処理が施された結果が表示される。
詳細については後述するが、逆認知変換処理とは、RGB毎の再生成視点時系列2次元データを、RGB毎の輝度データに戻し、当該RGB毎の輝度データに基づいて画像のデータをいわば再生成する処理をいう。
このようにして再生成された画像のデータを、以下、「再生成画像のデータ」と呼び、当該再生画像のデータにより表現される画像を、以下、「再生成画像」と呼ぶ。
即ち、再生成画像表示領域24には、原画像に対する再生成画像が表示される。
ここで、視点時系列2次元データに対してターケンス可逆変換処理を施すことにより、人間の画像の認知に近い編集処理が実現可能になり、原画像と比較して、画像が持つ印象がより強まった再生成画像が得られることになる。
そこで、認知変換処理、ターケンス可逆変換処理、及び逆認知変換処理を含む一連の処理を、以下、「画像認知に基づく画像変換処理」と呼ぶ。
なお、認知変換処理の詳細については、図5乃至図9を用いて後述する。
即ち、ターケンス可逆変換部52は、視点時系列2次元データに対して、ターケンスプロット処理を施し、その結果得られるアトラクタのデータをアトラクタデータ記憶部63に記憶させる。
次に、ターケンス可逆変換部52は、ユーザによる操作部12の指示操作に従って、アトラクタのデータに対してアトラクタ編集処理を施し、その結果得られる編集後アトラクタのデータをアトラクタデータ記憶部63に記憶させる。
そして、ターケンス可逆変換部52は、編集後アトラクタを含むアトラクタのデータをアトラクタデータ記憶部63から読み出して、時系列2次元データ再生成処理を実行する。ターケンス可逆変換部52は、時系列2次元データ再生成処理の結果得られる再生成視点時系列2次元データを、再生成視点時系列2次元データ記憶部64に記憶させる。
なお、ターケンス可逆変換処理の詳細については、図10乃至図12を用いて後述する。
なお、逆認知変換処理の詳細については、図13及び図14を用いて後述する。
原画像記憶部61は、上述したように、原画像のデータを記憶する。
視点時系列2次元データ記憶部62は、上述したように、視点時系列2次元データをRGB毎に記憶する。
アトラクタデータ記憶部63は、上述したように、編集後アトラクタを含むアトラクタの各データをRGB毎に記憶する。
再生成視点時系列2次元データ記憶部64は、上述したように、再生成視点時系列2次元データをRGB毎に記憶する。
再生成画像記憶部65は、上述したように、再生成画像のデータを記憶する。
ただし、上述した図3の機能的構成は例示に過ぎず、画像認知に基づく画像変換処理を実行可能であれば、画像処理装置1は任意の機能的構成を取ることができる。
画像認知に基づく画像変換処理は、例えば、画像処理装置1の電源が投入されて、ユーザにより所定の操作がなされたことを契機として開始する。
スイッチ処理とは、モードや設定条件等の複数の選択肢が存在するものについて、初期設定を含め、所定の選択肢を選択して設定する処理をいう。
例えば本実施形態では、後述する図6のステップS31の処理でスタートポイントの設定に必要な選択として、原画像の中から所定の点を視点として選択して設定する処理が、スイッチ処理の一部として実行される。
また、表示部11の画面を構成する各領域の表示の有無や、表示位置を選択して設定する処理がスイッチ処理の一部として実行される。なお、当該処理が実行された直後の段階では、当該処理による設定結果に従って各領域が配置された画面であって、実画像が表示されていない画面が、表示部11に表示されるものとする。具体的には、説明の便宜上、図2に示す画面(ただし、この段階では実画像が表示されていない画面)が、表示部11に表示されるものとする。
ステップS13において、ターケンス可逆変換部52は、ターケンス可逆変換処理を実行する。
ステップS14において、逆認知変換部53は、逆認知変換処理を実行する。
これにより、画像認知に基づく画像変換処理は終了となる。
上述したように、図4のステップS11の処理でスイッチ処理が実行されて、処理がステップS12に進むと、認知変換処理として、次のような処理が実行される。
この段階で、表示部11の画面のうち、図2に示す原画像表示領域21には、原画像が表示されるものとする。
なお、RGBの輝度データの格納場所は、特に限定されず、例えば、データ記憶部54内に新たな記憶部(記憶領域)を設けてもよい。ただし、本実施形態では説明の便宜上、原画像記憶部61に、振り分けられた後のRGBの輝度データも格納されるものとする。
このようなステップS23の処理を、以下、「視点時系列化処理」と呼ぶ。
図6は、視点時系列化処理の詳細な流れの一例を説明するフローチャートである。
スタートポイントとは、後述するステップS33の処理で、輝度データのサンプリングを開始する原画像上の画素の位置をいう。スタートポイントのさらなる詳細については、図7乃至図9を参照して後述する。
即ち、図5のステップS22の処理で原画像のデータは、RGBの輝度データの各々に振り分けられている。このため、ステップS32の処理で、RGBの各々が所定の順番で1つずつ処理対象として順次設定され、処理対象の輝度データに対して次のステップS33の処理が施される。
なお、ステップS33の処理の内容の詳細については、図7乃至図9を参照して後述する。
RGBの全てが未だ処理対象になっていない場合、ステップS34においてNOであると判定され、処理はステップS32に戻され、それ以降の処理が繰り返される。
即ち、RGBの順に処理対象が設定されるとするならば、ステップS32乃至S34のループ処理が繰り返し実行されることで、原画像のRの輝度データからRの視点時系列2次元データが生成され、続いて、原画像のGの輝度データからGの視点時系列2次元データが生成され、最後に、原画像のBの輝度データからBの視点時系列2次元データが生成される。
これにより、ステップS34においてYESであると判定され、視点時系列化処理は終了する。即ち、図5のステップS23の処理が終了し、結果として、図4のステップS12の処理が終了し、処理はステップS13に進む。ただし、ステップS13以降の処理については後述する。
なお、この時点で、表示部11の画面のうち、視点時系列表示領域22R,22G,22Bの各々には、RGB毎の視点時系列2次元グラフがそれぞれ表示される。
人間の目71の網膜の多数の神経は、図7に示すように(ただし、多数の神経のうち神経81乃至84のみ図示)、当該目71の後方で束のようになって脳72まで繋がっている。
このような目71が実世界の木91rを注視すると、その像が視点91pとして目71の中心に写り込む。
この場合、図7に示すように、視点91p付近の神経81と、視点91pから外れた神経84とでは、目71から脳72までの距離が異なる。具体的には、神経81乃至84の各々の距離をL1乃至L4の各々と記述するものとするならば、L1<L2<L3<L4の関係が成立する。
ここで、神経の伝達速度は(1/10^4)[sec/m]で一定であるといわれている。従って、目71から脳72までの伝達時間は、(伝達速度)×(目71から脳72までの神経の距離)で決定されるので、目71から脳72までの距離が長くなるほど、伝達時間も長くなる。即ち、図7の例では、神経81乃至84は、その順で距離が長くなっていくので、その順で伝達時間も長くなっていく。
ここで、神経81乃至84の各々が脳72に伝達する情報を、I1乃至I4の各々と記述するものとする。この場合、情報I1乃至I4は、その順番で脳72に順次伝達される。従って、情報I1乃至I4をその順番で配置した情報群、即ち(I1、I2、I3、I4)という情報群は、時系列情報の一種である。
図8は、図7のAから矢印方向に視た場合の人間の目の網膜についての矢視図である。
図8に示すように、目71の網膜は、神経81乃至84等の各神経の先端が点として分布して構成されていると把握することができる。従って、情報I1乃至I4とは、神経81乃至84の先端(点)に入射される像に関する情報、具体的には、点に入射される光の情報である。
ここで、人間の目71の網膜がCCD(Charge Coupled Device Image Sensor)等の撮像素子の役割を果たし、人間の脳72がCPU(Central Processing Unit)等の制御部の役割を果たすものと仮定する。
このような仮定の下では、目71の網膜における神経81乃至84の各々の先端(点)とは、撮像素子を構成する1つの画素に相当する。撮像素子の画素は、所定時間内に蓄積された光量に応じて、輝度値等の画素値を電気信号として出力する。従って、情報I1乃至I4とは、神経81乃至84の各々に対応する画素についての「画素値」に相当する。
換言すると、撮像素子を構成する各画素の画素値を、左から右方向に、かつ、上から下方向の順番で配置させたデータが、時系列データとして制御部に伝達される。
制御部は、この時系列データを用いて、撮像素子により撮像された画像を認識する。
換言すると、上述したように、情報I1乃至I4をその順番で配置した情報群、即ち(I1、I2、I3、I4)という情報群が、時系列情報として脳72に伝達される。
脳72は、この時系列情報を用いて、目71の網膜に映った画像を認知する。
より一般的にいうと、図8において、視点91pから外側に位置する神経(視点91pからの距離が長くなる神経)ほど、脳72までの距離が長くなっていくので、当該神経から脳72までの伝達時間も長くなっていく。ただし、目71の網膜上での視点91pから同一距離に存在する神経、即ち、視点91pを中心とする同一円周上に分布する神経は、脳72までの距離が略同一となるため、脳72までの伝達時間は略同一となる。従って、視点91pを始点(中心)として同心円状に広がっていくように、各神経の情報(画素値に相当)が脳72に伝達していく。
ここで、脳72の画像を認知する認知部分においては、同一時刻には1つの神経の情報(1つの画素の画素値に相当)のみが認識可能であると仮定する。この仮定の下では、同一円周上に分布する各神経の情報は、所定の神経の情報を先頭にして左又は右周りの順番で、脳72の認知部分において順次認知されていく。即ち、視点91pを始点として、例えば右回りの渦巻状に、目71の網膜上に分布する各神経の情報を配置した情報群が、時系列情報として脳72に伝達される。そして、その認知部分において、当該時系列情報を用いて画像が認知される。要するに、当該認知部分は、目71の網膜上の視点91pを始点として、例えば右回りの渦巻状に広がっていくように、画像を認知していく。
そこで、本実施形態では、認知変換部51(図3)は、視点時系列化処理(図6)として、人間の脳72が目71を用いた視覚により画像を認知していく時間的順序に基づいて決定された所定の順番で、原画像のRGB毎の輝度データをサンプリングする。そして、認知変換部51は、当該輝度データをサンプリングの順番に配置し直すことで、人間の脳72に伝達される時系列情報と等価な時系列データを生成する。このようにして生成される時系列データが、上述した視点時系列2次元データである。
図9(A)は、原画像のRの輝度データを模式的に示した図である。
ここで、原画像のRの輝度データとは、原画像を構成する各画素のRについての輝度値(画素値の1つ)の集合体をいう。図9(A)においては、1つの小さな正方形が、1つの画素の輝度値を示しており、各正方形の配置位置は、原画像内の各画素の配置位置に対応している。
図9(B)は、図9(A)の原画像のRの輝度データから生成されたRの視点時系列2次元データを示すグラフ、即ち、Rの視点時系列2次元グラフを示している。
なお、視点となる画素の決定手法は、特に限定されない。例えば、原画像内で予め決定された配置位置(画像の中心等)の画素を、視点となる画素に決定する手法を採用してもよい。また例えば、任意のアルゴリズムに従って注目領域を原画像から検出し、注目領域内の所定の画素を、視点となる画素に決定する手法を採用してもよい。
即ち、認知変換部51は、サンプリングの順序を示す番号(以下、「セグメントNo」と呼ぶ)を、原画像を構成する各画素の各々に付していく。
具体的には、認知変換部51は、スタートポイントの画素のセグメントNoを「0」に設定する。次に、認知変換部51は、1つずつインクリメントした値、即ち、「2」、「3」、「4」・・・「n−1」、「n」の各値を、スタートポイントの画素を中心にして、右回りの渦巻状に広がっていくように、各画素の各々に付していく。なお、nは、原画像の総画素数以下の任意の整数値である。
例えば図9(A)の例では、各画素の輝度値を示す正方形の左隅に示される数値が、セグメントNoを示している。
ここで、原画像の端の画素が、視点となる画素、即ちスタートポイントの画素に設定された場合、右回りに渦巻状にセグメントNoを付していくと、原画像の範囲をはみ出すことがある。このような場合には、原画像の周囲に輝度値が「0」となる画素(以下、原画像内の画素と区別すべく、「仮想画素」と呼ぶ)が付加されているとみなし、認知変換部51は、仮想画素に対してセグメントNoを付すものとする。
この場合、横軸をセグメントNoとして、縦軸を輝度値として、Rの視点時系列2次元データを構成する各輝度値がそれぞれプロットされると、図9(B)に示す視点時系列2次元グラフが得られることになる。当該Rの視点時系列2次元グラフは、図2の視点時系列表示領域22Rに表示される。
この場合、B及びGの各視点時系列2次元グラフは、図2の視点時系列表示領域22B及び22Gの各々に表示される。
これにより、図6の視点時系列化処理、即ち、図5のステップS33の処理が終了し、図4のステップS12の認知変換処理が終了する。
次に、図10乃至図12を参照して、図4のステップS13のターケンス可逆変換処理の詳細な流れについて説明する。
上述したように、図4のステップS12の処理で認知変換処理が実行されて、RGB毎の視点時系列2次元データが生成されると、処理がステップS13に進み、ターケンス可逆変換処理として、次のような処理が実行される。
本実施形態のターケンスプロット処理では、RGB毎の視点時系列2次元データが、原波形データWとして用いられる。
この場合、原波形データWをリサンプリングするプロットスケールが用いられる。図11の例では、説明の便宜上N=3の場合、即ち、2次元の原波形データWから3次元のアトラクタを生成する場合のプロットスケールが示されている。プロットスケールは、プロットスケール幅tを隔てた3点(x成分、y成分及びz成分)における原波形データWの波形値T(x,y,z)を指定することによって設定される。
リサンプリング周期△tは、原波形データWのサンプリング周期以上の時間幅を有し、本実施形態では、セグメントNoが時間に見立てられているので(図9(B)の横軸参照)、隣接するセグメントNoの差分に相当する時間幅が採用されている。
リサンプリング周期△t毎に、時系列順に移動するプロットスケールによって、波形値T1(x,y,z)乃至波形値Tn(x,y,z)が得られる。波形値T1(x,y,z)乃至波形値Tn(x,y,z)の個数は、波形区間長Stimeで決定される。
即ち、表示部11の図2に示す画面のうち、Rのアトラクタ描画画像はアトラクタ表示領域23Rに表示され、Gのアトラクタ描画画像はアトラクタ表示領域23Gに表示され、Bのアトラクタ描画画像はアトラクタ表示領域23Bに表示される。
即ち、上述したように、ユーザは、表示部11のアトラクタ表示領域23R,23G,23Bの各々に表示されたアトラクタ描画空間画像を視認しながら、操作部12を操作することで、任意の数の任意のアトラクタの形状を任意に編集することができる。このようなユーザの操作が、編集操作である。
編集操作がされていない場合、ステップS44においてNOであると判定されて、処理はステップS47に進む。ただし、ステップS47以降の処理については後述する。
これに対して、編集操作がされた場合、ステップS44においてYESであると判定されて、処理はステップS45に進む。
即ち、本実施形態では、ユーザは、RGB毎のアトラクタを個別に編集する編集操作をすることができる。例えば、Gについてのアトラクタの形状を編集する編集操作がされた場合、表示部11の図2に示す画面内のアトラクタ表示領域23Gに表示されたアトラクタ描画画像が、編集前のアトラクタが描画された画像から、編集後アトラクタが描画された画像に更新される。
具体的には、図12(A)が、編集前のアトラクタが描画されたアトラクタ描画画像の一例を示し、図12(B)が、編集後アトラクタが描画されたアトラクタ描画画像の一例を示している。
なお、図12の例では、複数のアトラクタが描画されている。即ち、図12は、1つの原画像において複数の視点が設定され、複数の視点毎にアトラクタのデータが生成され場合のアトラクタ描画画像の例を示している。
このように複数のアトラクタを描画する場合には、点をプロットしただけでは、複数のアトラクタの軌跡の各々を区別して認識することが困難となる。そこで、このような場合には、図12に示すように、アトラクタの軌跡(を示す曲線)も表示すると好適である。アトラクタの軌跡の表示形態は、軌跡をはっきりと見せることが可能な形態であれば特に限定されず、例えば、プロットされた点と次の点とをスプライン処理等を行って薄い色の曲線としてわかりやすく表示するといった表示形態を採用することもできる。
ステップS47において、ターケンス可逆変換部52は、編集操作が終了したか否かを判定する。
編集操作が終了したという判定条件は、特に限定されず、ユーザが操作部12を用いて明示な操作をした場合に満たされるという条件を採用してもよいし、設定時間が経過した等ユーザの操作を介さずに自動的に満たされるという条件を採用してもよい。
編集操作がまだ終了していない場合、処理はステップS44に戻され、それ以降の処理が繰り返される。即ち、ユーザは、編集操作を終了するまでの間、RGB毎のアトラクタのうち、任意の数の任意のアトラクタを、任意の回数編集し直すことができる。
その後、編集操作が終了すると、ステップS47においてYESであると判定されて、処理はステップS48に進む。
即ち、ターケンス可逆変換部52は、編集後アトラクタを含むRGB毎のアトラクタのデータに対して、図11を用いて説明したターケンスプロット処理と逆方向の処理を施すことによって、逆変換された時系列の2次元データ、即ち、再生成視点時系列2次元データを生成する。
次に、図13を参照して、図4のステップS14の逆認知変換処理の詳細な流れについて説明する。
上述したように、図4のステップS13の処理でターケンス可逆変換処理が実行されて、RGB毎の再生成視点時系列2次元データが生成されると、処理がステップS14に進み、逆認知変換処理として、次のような処理が実行される。
このようなステップS52の処理を、以下、「2次元データ逆視点時系列化処理」と呼ぶ。
図14は、2次元データ逆視点時系列化処理の詳細な流れの一例を説明するフローチャートである。
即ち、図13のステップS51の処理でRGB毎の再生成視点時系列2次元データが読み込まれている。このため、ステップS62の処理で、RGBの各々が所定の順番で1つずつ処理対象として順次設定され、処理対象の再生成視点時系列2次元データに対して次のステップS63の処理が施される。
ただし、各構成要素(各画素の更新後の輝度値)が、原画像の各画素の配置順ではなく、人間の脳が視覚により画像を認知していく時間的順序で配置されたデータが、再生成視点時系列2次元データである。
具体的には本実施形態では、図9(A)に示すように、視点から外側に向かう方向に、右回りの渦巻状となる順番で、各構成要素(各画素の更新後の輝度値)が配置されることによって、再生成視点時系列2次元データが構成されている。
セグメントNoを用いるならば、各構成要素(各画素の更新後の輝度値)が「1」乃至「n」の順番で配置されたデータが、再生成視点時系列2次元データである。
このとき、最初に読み出される構成要素が、ステップS61の処理で決定されたENDアドレスに配置された構成要素、即ち、人間の脳であれば最後に認知される画素の更新後の輝度値である。セグメントNoを用いるならば「n」が付された画素の更新後の輝度値が最初に読み出される。
そして、逆認知変換部53は、図9(A)に示す逆の順番、即ち、外側から視点に向かう方向に、左回りの渦巻状となる順番で、読み出された各構成要素(各画素の更新後の輝度値)を順次配置していく。
これにより、処理対象の輝度データ(ただし、各画素の輝度値は更新されているデータ)が再生成される。
RGBの全てが未だ処理対象になっていない場合、ステップS64においてNOであると判定され、処理はステップS62に戻され、それ以降の処理が繰り返される。
即ち、RGBの順に処理対象が設定されるとするならば、ステップS62乃至S64のループ処理が繰り返し実行されることで、Rの再生成視点時系列2次元データからRの輝度データが再生成され、続いて、Gの再生成視点時系列2次元データからGの輝度データが再生成され、最後に、Bの再生成視点時系列2次元データからBの輝度データが再生成される。
これにより、ステップS64においてYESであると判定され、2次元データ逆視点時系列化処理は終了する。即ち、図13のステップS52の処理が終了し、処理はステップS53に進む。
RGB比率調整処理とは、再生成されたRGB毎の輝度データの各々について、同一画素のRGBの輝度値の比率が所定範囲内に収まるように、各輝度値を調整する処理をいう。
この時点で、表示部11の画面のうち、再生成画像表示領域24には、再生成画像が表示される。
なお、ユーザは、再生成画像表示領域24に表示された再生成画像が所望の画像でない場合、所望の画像が表示されるまで、アトラクタの編集操作を何度でも行うことができる。この場合、画像処理装置1は、ステップS11及びS12の処理をその都度実行してもよいが、適宜省略して、ステップS13の処理から開始するようにしてもよい。
認知変換部51は、原画像のデータを構成する各画素の輝度値のそれぞれを構成要素として、人間が視覚により画像を認知していく時間的順序に基づいて決定された所定の順番で配列し直し、その結果得られるデータを視点時系列2次元データとして出力する。
ターケンス可逆変換部52は、視点時系列2次元データを、ターケンスの埋め込み定理を用いてN次元(Nは2以上の整数値)の空間に描画するアトラクタのデータに変換する変換処理を実行する。次に、ターケンス可逆変換部52は、ユーザの指示操作に従って、アトラクタの形状が変化するように、当該アトラクタのデータを補正する補正処理を実行する。そして、ターケンス可逆変換部52は、補正処理後のアトラクタのデータ(即ち、編集後アトラクタのデータ)に対して、当該変換処理の逆変換処理を施し、その結果得られるデータを再生成視点時系列2次元データとして出力する。
逆認知変換部53は、再生成視点時系列2次元データの各構成要素を、認知変換部51で用いた所定の順番と逆の順番で配列し直し、その結果得られるデータを、再生成画像のデータとして出力する。
従って、アトラクタの形状を変化させるユーザ操作、即ち上述した編集操作は、人間の脳の視覚の順序(画像の認知順序)に近い編集操作であるといえる。
これにより、原画像と比較して、画像の持つ印象が強まった再生成画像が得られる。即ち、従来には存在しなかった、絵の印象が原画像よりも強烈に表現された画像や、従来には存在しなかった絵の変換が施された画像等が、再生成画像として得られる。
このような音声処理分野における特許文献1に記載の技術を適用したターケンス可逆変換処理を実現するために、認知変換部51と逆認知変換部53とが設けられているのである。
このようにして、音声処理分野の技術を適用して、人間の脳の視覚の順序に基づく画像処理が実現される。
次に、本発明に係る画像処理装置の第2実施形態について説明する。
図15は、第2実施形態に係る画像認知に基づく画像変換処理の流れの一例を示すフローチャートである。
これらの処理の詳細な説明は上述したのでここでは省略するが、第2実施形態に係る画像処理装置も、画像認知に基づく画像変換処理として、原画像のデータに対して、認知変換処理及び逆認知変換処理を施して、再生画像のデータを生成する点は第1実施形態と一致する。
一方、第2実施形態と第1実施形態との差異点は次のとおりである。即ち、第1実施形態では、図4のステップS12とステップS14との間のステップS13の処理として、上述したターケンス可逆変換処理が実行される(図10参照)。これに対して、第2実施形態では、図15のステップS72とステップS74との間のステップS73の処理として、「フーリエ可逆変換処理」と呼ばれる処理が実行される。
機能的構成の点から換言すると、図示はしないが、第2実施形態に係る画像処理装置は、図3の第1実施形態の機能的構成と比較して、次の点のみが異なり、それ以外の点は一致する。即ち、第2実施形態に係る画像処理装置においては、第1実施形態のターケンス可逆変換部52の代わりに、「フーリエ可逆変換処理」を実行する機能ブロックが設けられる点、及び、アトラクタデータ記憶部63の代わりに、「フーリエ可逆変換処理」で用いられるデータを記憶する機能ブロックが設けられる点のみが異なり、それ以外の点は一致する。
なお、第2実施形態に係る画像処理装置は、さらに、第1実施形態と同様に図1の外観的構成を有しており、第1実施形態と基本的に同様の図2の画面を表示するものとする。ここで、画面について「基本的に同様」と記載したのは、アトラクタ表示領域23R,23G,23Bに対応する領域には、アトラクタ描画画像では無く、「フーリエ可逆変換処理」の実行結果を示す画像が表示されるという微差があるからである。
図16は、図15のステップS73のフーリエ可逆変換処理の詳細な流れの一例を説明するフローチャートである。
図17は、図16のフーリエ可逆変換処理の具体的な結果の一例を示すグラフである。
なお、フーリエ可逆変換処理の動作主体は、より正確にいえば、第1実施形態のターケンス可逆変換部52の代わりに設けられる機能ブロック(図示せず)であるが、以下、説明の簡略上、単に画像処理装置であるものとする。
ここで、図示はしないが、第2実施形態の表示部11の画面においても、図2の画面と同様に視点時系列表示領域22R,22G,22Bが設けられているものとする。この場合、図17(A)に示すRについての視点時系列2次元グラフが、視点時系列表示領域22Rに表示されることになる。
図17(B)において、横軸は周波数であり、縦軸はゲインである。
ここで、図示はしないが、第2実施形態の表示部11の画面には、図2の画面のアトラクタ表示領域23R,23G,23Bの代わりに、RGB毎の視点周波数分布グラフの各々を表示する領域(以下、「周波数解析結果表示領域」と呼ぶ)が設けられている。この場合、図17(B)に示すRについての視点周波数グラフが、Rについての周波数解析結果表示領域に表示されることになる。
このように、ユーザにより形状が編集された波形を有する視点周波数グラフを、以下、「編集後視点周波数グラフ」と呼ぶ。
図17(C)は、編集後視点周波数グラフの一例を示している。
図17(C)内の両矢印で示すように、ユーザは、任意の数の任意の周波数のゲインを任意に調整することによって、所望の編集後視点周波数グラフを生成することができる。
このようなユーザの編集の操作を受け付けて、編集後視点周波数グラフに対応する周波数領域のデータ(以下、「編集後視点周波数データ」と呼ぶ)を生成する処理が、「周波数毎ゲイン調整処理」と呼ばれており、ステップS82の処理として実行される。
即ち、ステップS82において、画像処理装置は、RGB毎の視点周波数データに対して、周波数毎ゲイン調整処理を施すことによって、RGB毎の編集後視点周波数データを生成する。
なお、ユーザによる周波数毎のゲイン調整の編集操作が行われなかった視点周波数データは、そのまま編集後視点周波数データとして採用される。
ここで、ステップS83の逆フーリエ変換処理の結果得られる時間領域のデータは、編集後視点周波数データ(周波数毎にゲインが調整されたデータ)に基づいて視点時系列2次元データがいわば再生成されたものである。よって、ステップS83の逆フーリエ変換処理の結果得られる時間領域のデータは、第1実施形態と同様に、「再生成視点時系列2次元データ」として取り扱うことができる。
このため、図16のステップS83の処理が終了すると、即ち図15のステップS73の処理が終了し、処理はステップS74に進み、第1実施形態と同様の逆認知変換処理が実行され、再生成画像のデータが生成される。
第2実施形態にかかる画像処理装置は、視点時系列2次元データを、時間領域のデータから周波数領域のデータ(視点周波数データ)に変換するフーリエ変換処理を実行する。次に、第2実施形態にかかる画像処理装置は、前記周波数領域のデータのうち1以上の周波数のゲインを変化させることにより、前記周波数領域のデータを補正する補正処理を実行する。そして、第2実施形態にかかる画像処理装置は、補正処理後の周波数領域のデータ(即ち、編集後視点周波数データ)に対して、逆フーリエ変換処理を施し、その結果得られるデータを再生成視点時系列2次元データとして出力する。
第2実施形態に係る画像処理装置は、第1実施形態と同様に、上述の所定の順番と逆の順番で配列し直し、その結果得られるデータを、再生成画像のデータとして出力する。
ここで、逆フーリエ変換処理を施すデータは、ユーザ操作により波形の形状が変化した(周波数毎のゲイン調整が行われた)周波数領域のデータ、即ち編集後視点周波数データである。波形の形状が変化する前の周波数領域のデータ、即ち視点周波数データは、人間が視覚により画像を認知していく時間的順序に基づいて、原画像のデータから変換されたものである。
従って、周波数領域のデータの波形の形状を変化させるユーザ操作は、人間の脳の視覚の順序(画像の認知順序)に近い編集操作であるといえる。
これにより、原画像と比較して、画像の持つ印象が強まった再生成画像が得られる。即ち、従来には存在しなかった、絵の印象が原画像よりも強烈に表現された画像や、従来には存在しなかった絵の変換が施された画像等が、再生成画像として得られる。
このような音声処理分野における技術を適用したフーリエ可逆変換処理を実現するために、認知変換部51と逆認知変換部53とが設けられているのである。
このようにして、音声処理分野の技術を適用して、人間の脳の視覚の順序に基づく画像処理が実現される。
即ち、認知変換処理で得られる視点時系列2次元データを第1の形態から第2の形態に変換する変換処理を実行し、ユーザの指示操作に従って第2の形態のデータを補正する補正処理を実行し、補正処理後のデータを第2の形態から第1の形態に逆変換する逆変換処理を実行し、その結果得られるデータを再生成視点時系列2次元データとして出力する処理であれば、認知変換処理と逆認知変換処理との間の処理として採用することができる。
ここで、このような処理として、音声処理分野の技術で採用されていた処理を適用することは、本発明において特に必須なことではない。ただし、音声処理分野の技術で採用されていた処理を適用することで、本発明を容易に具現化できるので好適である。
しかしながら、サンプリング手法は、これに限定されず、人間が視覚により画像を認知していく時間的順序に基づいて決定された所定の順番でサンプリングする手法であれば足りる。
具体的には例えば、視点から同一距離に存在する網膜上の各神経、即ち図8の点線で示す同一円周上に分布する各神経から、脳までの伝達速度は同一であると仮定することもできる。このような仮定の下で、視点に対応するスタートポイントから、同心円状に広がるようにサンプリングをしていく、といったサンプリング手法を採用してもよい。この場合、同一円周状(より正確には正方形の辺状)に分布する各画素の輝度値は、時系列では同一時刻のデータとなるため、同一円周状の各画素の輝度値の平均値等をサンプリング値として採用すればよい。
また例えば、人間が視覚により画像を認知していく時間的順序として影響を及ぼす要素として、上述した実施形態で用いた目から脳までの神経の距離の他に、目の網膜に分布する神経の密度や、脳内での視覚の処理順序等が存在すると考えられる。よって、これらの要素に対応させた順番でサンプリングしていく、といったサンプリング手法を採用してもよい。
しかしながら、本発明は、特にこれに限定されず、画像処理機能を有する電子機器一般に適用することができ、例えば、本発明は、パーソナルコンピュータ、携帯型ナビゲーション装置、ポータブルゲーム機等に幅広く適用可能である。
RAM103にはまた、CPU101が各種の処理を実行する上において必要なデータ等も適宜記憶される。
出力部107は、例えば図1の表示部11や図示せぬ音声出力部等により構成される。
記憶部108は、ハードディスク等により構成され、各種データを記憶する。例えば図3のデータ記憶部54は、記憶部108内の一領域として構成され、上述した各種形態の画像のデータを記憶する。
通信部109は、インターネット等を介して他の装置との間で行う通信を制御する。
Claims (7)
- 所定の画像を原画像として、前記原画像のデータに対して画像処理を施す画像処理装置において、
前記原画像のデータを構成する各画素の画素値のそれぞれを構成要素として、人間が視覚により画像を認知していく時間的順序に基づいて決定された所定の順番で配列し直し、その結果得られるデータを、視点2次元時系列データとして出力する認知変換手段と、
前記認知変換手段から出力された前記視点2次元時系列データを変換処理する2次元時系列データ変換手段と、
前記2次元時系列データ変換手段で変換処理された前記再生成視点2次元時系列データを、前記認知変換手段で用いられた前記所定の順番と逆の順番で配列し直し、その結果得られるデータを、再生成画像のデータとして出力する逆認知変換手段と、
を備える画像処理装置。 - 前記2次元時系列データ変換手段は、
前記認知変換手段から出力された前記視点2次元時系列データを第1の形態から第2の形態に変換する変換処理を実行し、前記第2の形態のデータを補正する補正処理を実行し、補正後のデータを前記第2の形態から前記第1の形態に逆変換する逆変換処理を実行し、その結果得られるデータを、再生成視点2次元時系列データとして出力する形態可逆変換手段を備える、
請求項1に記載の画像処理装置。 - 前記認知変換手段は、
前記原画像を構成する前記各画素の中から視点となる画素をスタートポイントに設定し、
前記スタートポイントから、左又は右回りの渦巻状に、前記各画素の画素値のそれぞれを順次サンプリングしていき、
サンプリングの順番で、前記各画素の画素値を配列し直し、
その結果得られるデータを、前記視点2次元時系列として出力する、
請求項1又は2に記載の画像処理装置。 - 前記形態可逆変換手段は、
前記視点2次元時系列データを、ターケンスの埋め込み定理を用いてN次元(Nは2以上の整数値)の空間に描画するアトラクタのデータに変換する前記変換処理を実行し、
アトラクタの形状が変化するように、前記アトラクタのデータを補正する前記補正処理を実行し、
前記補正処理後の前記アトラクタのデータを用いて、前記変換処理の逆変換処理を実行し、
その結果得られるデータを、前記再生成視点時系列2次元データとして出力する、
請求項2に記載の画像処理装置。 - 前記形態可逆変換手段は、
前記視点2次元時系列データに対してフーリエ変換を施すことで、データの形態を時間領域から周波数領域に変換する前記変換処理を実行し、
前記周波数領域のデータのうち1以上の周波数のゲインを変化させることにより、前記周波数領域のデータを補正する前記補正処理を実行し、
補正処理後の前記周波数領域のデータ(編集後視点周波数データ)に対して、逆フーリエ変換を施すことで、データの形態を周波数領域から時間領域に逆変換する前記逆変換処理を実行し、
その結果得られるデータを、前記再生成視点時系列2次元データとして出力する、
請求項2に記載の画像処理装置。 - 所定の画像を原画像として、前記原画像のデータに対して画像処理を施す画像処理装置の画像処理方法において、
前記原画像のデータを構成する各画素の画素値のそれぞれを構成要素として、人間が視覚により画像を認知していく時間的順序に基づいて決定された所定の順番で配列し直し、その結果得られるデータを、視点2次元時系列データとして出力する認知変換ステップと、
前記認知変換ステップの処理によって出力された前記視点2次元時系列データ変換処理する2次元時系列データ変換ステップと、
前記2次元時系列データ変換ステップで変換処理された前記再生成視点2次元時系列データを、前記認知変換ステップで用いられた前記所定の順番と逆の順番で配列し直し、その結果得られるデータを、再生成画像のデータとして出力する逆認知変換ステップと、
を含む画像処理方法。 - 所定の画像を原画像として、前記原画像のデータに対して画像処理を施す画像処理装置を制御するコンピュータに、
前記原画像のデータを構成する各画素の画素値のそれぞれを構成要素として、人間が視覚により画像を認知していく時間的順序に基づいて決定された所定の順番で配列し直し、その結果得られるデータを、視点2次元時系列データとして出力する認知変換機能と、
前記認知変換機能の実現によって出力された前記視点2次元時系列データを変換処理する2次元時系列データ変換機能と、
前記2次元時系列データ変換機能の実現によって変換処理された前記再生成視点2次元時系列データを、前記認知変換機能で用いられた前記所定の順番と逆の順番で配列し直し、その結果得られるデータを、再生成画像のデータとして出力する逆認知変換機能と、
を実現させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010140551A JP5548950B2 (ja) | 2010-06-21 | 2010-06-21 | 画像処理装置及び方法、並びにプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010140551A JP5548950B2 (ja) | 2010-06-21 | 2010-06-21 | 画像処理装置及び方法、並びにプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2012003687A JP2012003687A (ja) | 2012-01-05 |
JP2012003687A5 JP2012003687A5 (ja) | 2013-07-18 |
JP5548950B2 true JP5548950B2 (ja) | 2014-07-16 |
Family
ID=45535550
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010140551A Expired - Fee Related JP5548950B2 (ja) | 2010-06-21 | 2010-06-21 | 画像処理装置及び方法、並びにプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5548950B2 (ja) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4346799B2 (ja) * | 2000-08-31 | 2009-10-21 | アロカ株式会社 | カオス解析装置 |
JP2002191046A (ja) * | 2000-12-22 | 2002-07-05 | Ffc:Kk | 画像監視装置 |
JP4580409B2 (ja) * | 2007-06-11 | 2010-11-10 | 富士通株式会社 | 音量制御装置および方法 |
JP5347405B2 (ja) * | 2008-09-25 | 2013-11-20 | カシオ計算機株式会社 | 波形発生装置および波形発生処理プログラム |
-
2010
- 2010-06-21 JP JP2010140551A patent/JP5548950B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2012003687A (ja) | 2012-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109191548A (zh) | 动画制作方法、装置、设备及存储介质 | |
JP2011170840A (ja) | 画像処理装置及び電子機器 | |
JP5949331B2 (ja) | 画像生成装置、画像生成方法及びプログラム | |
WO2009093398A1 (ja) | 画像処理装置、その処理方法およびプログラム | |
JP2010278725A (ja) | 画像音響処理装置及び撮像装置 | |
JP2013042301A (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP2016118991A (ja) | 画像生成装置、画像生成方法及びプログラム | |
JP2013200735A (ja) | 画像生成装置、画像生成方法及びプログラム | |
JP2000322588A (ja) | 画像処理装置及びその方法 | |
CN104394315A (zh) | 一种拍摄图像的方法 | |
JP7439131B2 (ja) | 空間オーディオをキャプチャする装置および関連する方法 | |
CN112863481A (zh) | 一种音频生成方法及设备 | |
JP2023098937A (ja) | 多次元反応型映像を再生する方法及び装置 | |
CN109064548A (zh) | 视频生成方法、装置、设备及存储介质 | |
CA2838878A1 (en) | Method and apparatus for controlling contents in electronic device | |
JP6171371B2 (ja) | 画像処理プログラム、画像処理装置および画像処理方法 | |
JP2013066058A (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP2013025697A (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP5548950B2 (ja) | 画像処理装置及び方法、並びにプログラム | |
JP5408037B2 (ja) | 画像処理装置及び方法、並びにプログラム | |
JP2007034724A (ja) | 画像処理装置、画像処理方法および画像処理プログラム | |
JP5966657B2 (ja) | 画像生成装置、画像生成方法及びプログラム | |
JP7152908B2 (ja) | 仕草制御装置及び仕草制御プログラム | |
WO2019229936A1 (ja) | 情報処理システム | |
WO2012146042A1 (zh) | 一种基于三维栅格平滑模型的图像细节增强方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130603 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130603 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140122 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140415 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140428 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5548950 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |