JP5548950B2 - 画像処理装置及び方法、並びにプログラム - Google Patents

画像処理装置及び方法、並びにプログラム Download PDF

Info

Publication number
JP5548950B2
JP5548950B2 JP2010140551A JP2010140551A JP5548950B2 JP 5548950 B2 JP5548950 B2 JP 5548950B2 JP 2010140551 A JP2010140551 A JP 2010140551A JP 2010140551 A JP2010140551 A JP 2010140551A JP 5548950 B2 JP5548950 B2 JP 5548950B2
Authority
JP
Japan
Prior art keywords
data
viewpoint
image
series
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010140551A
Other languages
English (en)
Other versions
JP2012003687A5 (ja
JP2012003687A (ja
Inventor
達也 出嶌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP2010140551A priority Critical patent/JP5548950B2/ja
Publication of JP2012003687A publication Critical patent/JP2012003687A/ja
Publication of JP2012003687A5 publication Critical patent/JP2012003687A5/ja
Application granted granted Critical
Publication of JP5548950B2 publication Critical patent/JP5548950B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Processing (AREA)

Description

本発明は、画像処理装置及び方法、並びにプログラムに関し、特に、人間の脳の視覚の順序に基づく画像処理を実現可能にする技術に関する。
人間の五感のうち、聴覚に訴える要素として音声が存在し、視覚に訴える要素として画像が存在し、それぞれの要素に関する技術分野が従来から存在する。即ち、従来、音声のデータに対して処理を施す技術分野(以下、「音声処理分野」と呼ぶ)、及び画像のデータに対して処理を施す技術分野(以下、「画像処理分野」と呼ぶ)が存在する。
ここで、人間の脳内での聴覚の順序とは、基本的に、人間の耳に入ってきた音声の順序であるため、音声処理分野では、人間の脳の聴覚の順序に基づく音声処理は、従来から研究開発が進み、技術として確立されつつある(例えば特許文献1参照)。
特開2008−275845号公報
一方、人間の脳内での視覚の順序自体が研究の段階であるため、画像処理分野では、人間の脳の視覚の順序に基づく画像処理は、充分に研究開発が進んでいるとはいえず、未だ技術として確立されているとはいい難い状況である。
このため、画像処理分野では、人間の脳の視覚の順序に基づく画像処理を施す手法として、様々な手法の実現が求められている。
特に、研究開発が進んでいる音声処理分野の技術を画像処理分野に適用可能な手法の実現が強く求められている。例えば音声処理分野における特許文献1に記載の技術を画像処理分野に適用するためには、時系列の2次元データが必要になる。しかしながら、画像データを時系列の2次元データ化する適切な手法自体が見受けられず、特許文献1に記載の技術を画像処理分野に適用できる段階まで至っていない状況である。
本発明は、このような状況に鑑みてなされたものであり、人間の脳の視覚の順序に基づく画像処理を実現可能にすることを目的とする。
本発明の一態様によると、
所定の画像を原画像として、前記原画像のデータに対して画像処理を施す画像処理装置において、
前記原画像のデータを構成する各画素の画素値のそれぞれを構成要素として、人間が視覚により画像を認知していく時間的順序に基づいて決定された所定の順番で配列し直し、その結果得られるデータを、視点2次元時系列データとして出力する認知変換手段と、
前記認知変換手段から出力された前記視点2次元時系列データを変換処理する2次元時系列データ変換手段と、
前記2次元時系列データ変換手段で変換処理された前記再生成視点2次元時系列データを、前記認知変換手段で用いられた前記所定の順番と逆の順番で配列し直し、その結果得られるデータを、再生成画像のデータとして出力する逆認知変換手段と、
を備える画像処理装置を提供する。
本発明の一態様によると、上述した本発明の一態様に係る画像処理装置に対応する情報処理方法及びプログラムを提供する。
本発明によれば、音声処理分野の技術を適用して、人間の脳の視覚の順序に基づく画像処理を実現可能にすることができる。
本発明の第1実施形態に係る画像処理装置の外観構成を示す正面図である。 第1実施形態に係る画像処理装置の表示部の画面の例を示す図である。 画像認知に基づく画像変換処理を実行するための、第1実施形態に係る画像処理装置の機能的構成を示す機能ブロック図である。 第1実施形態に係る画像認知に基づく画像変換処理の主となる流れの一例を示すフローチャートである。 図4の画像認知に基づく画像変換処理のうち、認知変換処理の詳細な流れの一例を説明するフローチャートである。 図5の認知変換処理のうち、視点時系列化処理の詳細な流れの一例を説明するフローチャートである。 図6の視点時系列化処理について具体的に説明する図であって、人間の目と脳との神経による繋がりを模式的に示した図である。 図6の視点時系列化処理について具体的に説明する図であって、図7のAから矢印方向に視た場合の人間の目の網膜の矢視図である。 図6の視点時系列化処理について具体的に説明する図であって、視点時系列2次元データの具体的な生成手法を説明する図である。 図4の画像認知に基づく画像変換処理のうち、ターケンス可逆変換処理の詳細な流れの一例を説明するフローチャートである。 図10のターケンス可逆変換処理のうち、ターケンスプロット処理の概要を説明するための図である。 図10のターケンス可逆変換処理における、編集前後のアトラクタ描画画像の一例を示す図である。 図4の画像認知に基づく画像変換処理のうち、逆認知変換処理の詳細な流れの一例を説明するフローチャートである。 図13の逆認知変換処理のうち、2次元データ逆視点時系列化処理の詳細な流れの一例を説明するフローチャートである。 第2実施形態に係る画像認知に基づく画像変換処理の主となる流れの一例を示すフローチャートである。 図15の画像認知に基づく画像変換処理のうち、フーリエ可逆変換処理の詳細な流れの一例を説明するフローチャートである。 図16のフーリエ可逆変換処理の具体的な結果の一例を示すグラフである。 図1の画像処理装置を実現するハードウェア構成を示すブロック図である。
以下、本発明の一実施形態を図面に基づいて説明する。
[第1実施形態]
図1は、本発明の第1実施形態に係る画像処理装置1の外観構成例を示す斜視図である。
図1に示すように、画像処理装置1は、デジタルフォトフレームとして構成されている。このため、画像処理装置1の正面(図1に図示されている面)には、例えば液晶ディスプレイ等で構成される表示部11が設けられている。
また、画像処理装置1には、マウス等で構成され、ユーザの指示操作を受け付ける操作部12が設けられている。
図2は、このような画像処理装置1の表示部11の画面の一例を示す図である。
ここで、「画面」とは、表示装置又は装置が有する表示部(本実施形態では表示部11)の表示領域全体に表示される画像をいう。
図2の例の表示部11の画面には、同図中左方から順に、原画像表示領域21と、視点時系列表示領域22R,22G,22Bと、アトラクタ表示領域23R,23G,23Bと、再生成画像表示領域24と、が設けられている。
原画像表示領域21には、画像処理装置1による画像処理の対象となる画像(以下、「原画像」と呼ぶ)が表示される。
視点時系列表示領域22R,22G,22Bには、原画像のデータに対して、画像処理装置1により認知変換処理が施された結果が表示される。
詳細については後述するが、認知変換処理とは、人間の脳が視覚により画像を認知していく時間的順序に基づいて、原画像のデータを、時系列の2次元データに変換する処理をいう。このような時系列の2次元のデータを、以下、「視点時系列2次元データ」と呼ぶ。また、視点時系列2次元データにより表現される画像、即ち、横軸が時間軸となり縦軸が画素値(本実施形態では輝度値)の軸となるグラフであって、視点時系列2次元データの各時刻に相当するデータがプロットされたグラフを含む画像を、「視点時系列2次元グラフ」と呼ぶ。
原画像のデータは、RGB毎の輝度データに分割され、各々の輝度データに対して認知変換処理が施される。
この場合、Rの輝度データに対して認知変換処理が施された結果として、Rについての視点時系列2次元データが得られ、当該視点時系列2次元データにより表現される視点時系列2次元グラフが、視点時系列表示領域22Rに表示される。
同様に、Gの輝度データに対して認知変換処理が施された結果として、Gについての視点時系列2次元データが得られ、当該視点時系列2次元データにより表現される視点時系列2次元グラフが、視点時系列表示領域22Gに表示される。
また、Bの輝度データに対して認知変換処理が施された結果として、Bについての視点時系列2次元データが得られ、当該視点時系列2次元データにより表現される視点時系列2次元グラフが、視点時系列表示領域22Bに表示される。
アトラクタ表示領域23R,23G,23Bには、RGB毎の視点時系列2次元データの各々に対して、画像処理装置1によりターケンス可逆変換処理が施された際に生成又は編集されるアトラクタがそれぞれ表示される。
詳細については特許文献1に開示されているため、本明細書では概略を述べるに留めるが、ターケンス可逆変換処理とは、次のような第1乃至第3の処理からなる一連の処理をいう。
即ち、ターケンス可逆変換処理の第1の処理とは、元の2次元波形のデータ(ここでは視点時系列2次元データ)から、ターケンスの埋め込み定理を用いて、N次元(Nは2以上の整数値)の空間に描画するアトラクタのデータを生成する処理をいう。このようなターケンス可逆変換処理の第1の処理を、以下、「ターケンスプロット処理」と呼ぶ。
上述したように、視点時系列2次元データは、RGB毎に分割されている。従って、RGB毎の視点時系列2次元データの各々に対してターケンスプロット処理がそれぞれ施される。
この場合、Rの視点時系列2次元データに対してターケンスプロット処理が施された結果として、Rについてのアトラクタのデータが得られ、当該データにより表現されるアトラクタがN次元の空間に描画された画像(以下、「アトラクタ描画空間画像」と呼ぶ)が、アトラクタ表示領域23Rに表示される。
同様に、Gの視点時系列2次元データに対してターケンスプロット処理が施された結果として、Gについてのアトラクタのデータが得られ、当該データにより表現されるアトラクタ描画空間画像が、アトラクタ表示領域23Gに表示される。
また、Bの視点時系列2次元データに対してターケンスプロット処理が施された結果として、Bについてのアトラクタのデータが得られ、当該データにより表現されるアトラクタ描画空間画像が、アトラクタ表示領域23Bに表示される。
ユーザは、表示部11のアトラクタ表示領域23R,23G,23Bの各々に表示されたアトラクタ描画空間画像を視認しながら、操作部12を操作することで、任意の数の任意のアトラクタの形状を任意に編集することができる。
このように、ユーザにより形状が編集されたアトラクタを、以下、「編集後アトラクタ」と呼ぶ。
即ち、このようなユーザの編集の操作を受け付けて、編集後アトラクタのデータを生成する処理が、ターケンス可逆変換処理の第2の処理である。このようなターケンス可逆変換処理の第2の処理を、以下、「アトラクタ編集処理」と呼ぶ。
アトラクタ編集処理には、表示部11のアトラクタ表示領域23R,23G,23Bの各々に表示されるアトラクタ描画空間画像を、編集後アトラクタを含む画像に更新する処理も含まれる。
ターケンス可逆変換処理の第3の処理とは、編集後アトラクタを含むRGB毎のアトラクタのデータを、時系列の2次元データに逆変換する処理をいう。
なお、このようにして逆変換された時系列の2次元データは、編集後アトラクタに基づいて視点時系列2次元データがいわば再生成されたものであるため、以下、「再生成視点時系列2次元データ」と呼ぶ。
即ち、編集後アトラクタを含むRGB毎のアトラクタのデータから、再生成視点時系列2次元データを生成する処理が、ターケンス可逆変換処理の第3の処理である。このようなターケンス可逆変換処理の第3の処理を、以下、「時系列2次元データ再生成処理」と呼ぶ。
このようなターケンス可逆変換処理の結果が表示されるアトラクタ表示領域23R,23G,23Bの右方には、再生成画像表示領域24が設けられている。
再生成画像表示領域24には、編集後アトラクタを含むRGB毎のアトラクタのデータに対して、画像処理装置1により逆認知変換処理が施された結果が表示される。
詳細については後述するが、逆認知変換処理とは、RGB毎の再生成視点時系列2次元データを、RGB毎の輝度データに戻し、当該RGB毎の輝度データに基づいて画像のデータをいわば再生成する処理をいう。
このようにして再生成された画像のデータを、以下、「再生成画像のデータ」と呼び、当該再生画像のデータにより表現される画像を、以下、「再生成画像」と呼ぶ。
即ち、再生成画像表示領域24には、原画像に対する再生成画像が表示される。
以上の内容を画像処理装置1による画像処理の観点で換言すると、画像処理装置1は、原画像のデータに対して、認知変換処理、ターケンス可逆変換処理、及び逆認知変換処理をその順番で施すことによって、再生画像のデータを生成することができる。
ここで、視点時系列2次元データに対してターケンス可逆変換処理を施すことにより、人間の画像の認知に近い編集処理が実現可能になり、原画像と比較して、画像が持つ印象がより強まった再生成画像が得られることになる。
そこで、認知変換処理、ターケンス可逆変換処理、及び逆認知変換処理を含む一連の処理を、以下、「画像認知に基づく画像変換処理」と呼ぶ。
図3は、画像認知に基づく画像変換処理を実行するための画像処理装置1の機能的構成を示す機能ブロック図である。
画像処理装置1は、上述した表示部11及び操作部12に加えてさらに、認知変換部51と、ターケンス可逆変換部52と、逆認知変換部53と、データ記憶部54と、表示制御部55と、を備えている。
認知変換部51は、原画像記憶部61から原画像のデータを読み出し、認知変換処理を実行する。認知変換部51は、認知変換処理の結果得られる視点時系列2次元データを、視点時系列2次元データ記憶部62に記憶させる。
なお、認知変換処理の詳細については、図5乃至図9を用いて後述する。
ターケンス可逆変換部52は、視点時系列2次元データ記憶部62から視点時系列2次元データを読み出し、ターケンス可逆変換処理を施す。
即ち、ターケンス可逆変換部52は、視点時系列2次元データに対して、ターケンスプロット処理を施し、その結果得られるアトラクタのデータをアトラクタデータ記憶部63に記憶させる。
次に、ターケンス可逆変換部52は、ユーザによる操作部12の指示操作に従って、アトラクタのデータに対してアトラクタ編集処理を施し、その結果得られる編集後アトラクタのデータをアトラクタデータ記憶部63に記憶させる。
そして、ターケンス可逆変換部52は、編集後アトラクタを含むアトラクタのデータをアトラクタデータ記憶部63から読み出して、時系列2次元データ再生成処理を実行する。ターケンス可逆変換部52は、時系列2次元データ再生成処理の結果得られる再生成視点時系列2次元データを、再生成視点時系列2次元データ記憶部64に記憶させる。
なお、ターケンス可逆変換処理の詳細については、図10乃至図12を用いて後述する。
逆認知変換部53は、再生成視点時系列2次元データ記憶部64から再生成視点時系列2次元データを読み出して、逆認知変換処理を実行する。逆認知変換部53は、逆認知変換処理の結果得られる再生成画像のデータを、再生成画像記憶部65に記憶させる。
なお、逆認知変換処理の詳細については、図13及び図14を用いて後述する。
データ記憶部54は、原画像記憶部61と、視点時系列2次元データ記憶部62と、アトラクタデータ記憶部63と、再生成視点時系列2次元データ記憶部64と、再生成画像記憶部65と、を備えている。
原画像記憶部61は、上述したように、原画像のデータを記憶する。
視点時系列2次元データ記憶部62は、上述したように、視点時系列2次元データをRGB毎に記憶する。
アトラクタデータ記憶部63は、上述したように、編集後アトラクタを含むアトラクタの各データをRGB毎に記憶する。
再生成視点時系列2次元データ記憶部64は、上述したように、再生成視点時系列2次元データをRGB毎に記憶する。
再生成画像記憶部65は、上述したように、再生成画像のデータを記憶する。
表示制御部55は、データ記憶部54に記憶された各種データに基づいて、上述した図2に示すような画面を表示部11に表示させる制御を実行する。
以上、画像処理装置1の機能的構成について説明した。
ただし、上述した図3の機能的構成は例示に過ぎず、画像認知に基づく画像変換処理を実行可能であれば、画像処理装置1は任意の機能的構成を取ることができる。
次に、図4乃至図14を参照して、図3の機能的構成を有する画像処理装置1が実行する画像認知に基づく画像変換処理の流れについて説明する。
図4は、画像認知に基づく画像変換処理の主となる流れの一例を示すフローチャートである。
画像認知に基づく画像変換処理は、例えば、画像処理装置1の電源が投入されて、ユーザにより所定の操作がなされたことを契機として開始する。
ステップS11において、画像処理装置1の各部は、スイッチ処理を実行する。
スイッチ処理とは、モードや設定条件等の複数の選択肢が存在するものについて、初期設定を含め、所定の選択肢を選択して設定する処理をいう。
例えば本実施形態では、後述する図6のステップS31の処理でスタートポイントの設定に必要な選択として、原画像の中から所定の点を視点として選択して設定する処理が、スイッチ処理の一部として実行される。
また、表示部11の画面を構成する各領域の表示の有無や、表示位置を選択して設定する処理がスイッチ処理の一部として実行される。なお、当該処理が実行された直後の段階では、当該処理による設定結果に従って各領域が配置された画面であって、実画像が表示されていない画面が、表示部11に表示されるものとする。具体的には、説明の便宜上、図2に示す画面(ただし、この段階では実画像が表示されていない画面)が、表示部11に表示されるものとする。
ステップS12において、認知変換部51は、認知変換処理を実行する。
ステップS13において、ターケンス可逆変換部52は、ターケンス可逆変換処理を実行する。
ステップS14において、逆認知変換部53は、逆認知変換処理を実行する。
これにより、画像認知に基づく画像変換処理は終了となる。
以下、ステップS12の認知変換処理、ステップS13の逆認知変換処理、及び、ステップS14のターケンス可逆変換処理の各々の詳細な流れについて、その順番で個別に説明していく。
初めに、図5乃至図9を参照して、ステップS12の認知変換処理の詳細な流れについて説明する。
図5は、認知変換処理の詳細な流れの一例を説明するフローチャートである。
上述したように、図4のステップS11の処理でスイッチ処理が実行されて、処理がステップS12に進むと、認知変換処理として、次のような処理が実行される。
ステップS21において、認知変換部51は、原画像のデータを原画像記憶部61から取り込む。
この段階で、表示部11の画面のうち、図2に示す原画像表示領域21には、原画像が表示されるものとする。
ステップS22において、認知変換部51は、原画像のデータを、RGBの輝度データ毎に振り分ける。
なお、RGBの輝度データの格納場所は、特に限定されず、例えば、データ記憶部54内に新たな記憶部(記憶領域)を設けてもよい。ただし、本実施形態では説明の便宜上、原画像記憶部61に、振り分けられた後のRGBの輝度データも格納されるものとする。
ステップS23において、認知変換部51は、原画像のデータをRGB毎に、振り分けた後のRGBの輝度データの各々を、視点時系列2次元データにそれぞれ変換する。
このようなステップS23の処理を、以下、「視点時系列化処理」と呼ぶ。
図6は、視点時系列化処理の詳細な流れの一例を説明するフローチャートである。
ステップS31において、認知変換部51は、原画像上の視点となるスタートポイントを設定する。
スタートポイントとは、後述するステップS33の処理で、輝度データのサンプリングを開始する原画像上の画素の位置をいう。スタートポイントのさらなる詳細については、図7乃至図9を参照して後述する。
ステップS32において、認知変換部51は、処理対象をRGBの中から設定する。
即ち、図5のステップS22の処理で原画像のデータは、RGBの輝度データの各々に振り分けられている。このため、ステップS32の処理で、RGBの各々が所定の順番で1つずつ処理対象として順次設定され、処理対象の輝度データに対して次のステップS33の処理が施される。
ステップS33において、認知変換部51は、処理対象の輝度データを時系列にサンプリングすることで、処理対象の視点時系列2次元データを生成する。
なお、ステップS33の処理の内容の詳細については、図7乃至図9を参照して後述する。
ステップS34において、認知変換部51は、RGBの全てを処理対象にしたか否かを判定する。
RGBの全てが未だ処理対象になっていない場合、ステップS34においてNOであると判定され、処理はステップS32に戻され、それ以降の処理が繰り返される。
即ち、RGBの順に処理対象が設定されるとするならば、ステップS32乃至S34のループ処理が繰り返し実行されることで、原画像のRの輝度データからRの視点時系列2次元データが生成され、続いて、原画像のGの輝度データからGの視点時系列2次元データが生成され、最後に、原画像のBの輝度データからBの視点時系列2次元データが生成される。
これにより、ステップS34においてYESであると判定され、視点時系列化処理は終了する。即ち、図5のステップS23の処理が終了し、結果として、図4のステップS12の処理が終了し、処理はステップS13に進む。ただし、ステップS13以降の処理については後述する。
なお、この時点で、表示部11の画面のうち、視点時系列表示領域22R,22G,22Bの各々には、RGB毎の視点時系列2次元グラフがそれぞれ表示される。
さらに以下、図7乃至図10を参照して、図6の視点時系列化処理について具体的に説明する。
図7は、人間の目と脳との神経による繋がりを模式的に示した図である。
人間の目71の網膜の多数の神経は、図7に示すように(ただし、多数の神経のうち神経81乃至84のみ図示)、当該目71の後方で束のようになって脳72まで繋がっている。
このような目71が実世界の木91rを注視すると、その像が視点91pとして目71の中心に写り込む。
この場合、図7に示すように、視点91p付近の神経81と、視点91pから外れた神経84とでは、目71から脳72までの距離が異なる。具体的には、神経81乃至84の各々の距離をL1乃至L4の各々と記述するものとするならば、L1<L2<L3<L4の関係が成立する。
ここで、神経の伝達速度は(1/10^4)[sec/m]で一定であるといわれている。従って、目71から脳72までの伝達時間は、(伝達速度)×(目71から脳72までの神経の距離)で決定されるので、目71から脳72までの距離が長くなるほど、伝達時間も長くなる。即ち、図7の例では、神経81乃至84は、その順で距離が長くなっていくので、その順で伝達時間も長くなっていく。
ここで、神経81乃至84の各々が脳72に伝達する情報を、I1乃至I4の各々と記述するものとする。この場合、情報I1乃至I4は、その順番で脳72に順次伝達される。従って、情報I1乃至I4をその順番で配置した情報群、即ち(I1、I2、I3、I4)という情報群は、時系列情報の一種である。
神経81乃至84の各々が脳72に伝達する情報I1乃至I4について、図8を参照して、さらに考えてみる。
図8は、図7のAから矢印方向に視た場合の人間の目の網膜についての矢視図である。
図8に示すように、目71の網膜は、神経81乃至84等の各神経の先端が点として分布して構成されていると把握することができる。従って、情報I1乃至I4とは、神経81乃至84の先端(点)に入射される像に関する情報、具体的には、点に入射される光の情報である。
ここで、人間の目71の網膜がCCD(Charge Coupled Device Image Sensor)等の撮像素子の役割を果たし、人間の脳72がCPU(Central Processing Unit)等の制御部の役割を果たすものと仮定する。
このような仮定の下では、目71の網膜における神経81乃至84の各々の先端(点)とは、撮像素子を構成する1つの画素に相当する。撮像素子の画素は、所定時間内に蓄積された光量に応じて、輝度値等の画素値を電気信号として出力する。従って、情報I1乃至I4とは、神経81乃至84の各々に対応する画素についての「画素値」に相当する。
ただし、制御部が撮像素子を用いて画像を認識する際の時間的順序と、人間の脳72が目71を用いた視覚により画像を認知する際の時間的順序との間には差異点がある。そこで、以下、この差異点について説明する。
撮像素子においては、一般的に、左から右方向に、かつ、上から下方向の順番で、各画素の画素値が出力される。即ち、撮像素子を構成する各画素の画素値は、時間的に、左から右方向に、かつ、上から下方向の順番で1つずつ、制御部に伝達される。
換言すると、撮像素子を構成する各画素の画素値を、左から右方向に、かつ、上から下方向の順番で配置させたデータが、時系列データとして制御部に伝達される。
制御部は、この時系列データを用いて、撮像素子により撮像された画像を認識する。
これに対して、人間の目71においては、情報I1乃至I4が脳72に到達する時間的順序は、目71から脳72までの距離が短い神経81乃至84の順、即ち、人間の目71の網膜上での視点91pから近い神経81乃至84の順である。従って、情報I1乃至I4が、その順番で時間的に脳72に伝達される。
換言すると、上述したように、情報I1乃至I4をその順番で配置した情報群、即ち(I1、I2、I3、I4)という情報群が、時系列情報として脳72に伝達される。
脳72は、この時系列情報を用いて、目71の網膜に映った画像を認知する。
より一般的にいうと、図8において、視点91pから外側に位置する神経(視点91pからの距離が長くなる神経)ほど、脳72までの距離が長くなっていくので、当該神経から脳72までの伝達時間も長くなっていく。ただし、目71の網膜上での視点91pから同一距離に存在する神経、即ち、視点91pを中心とする同一円周上に分布する神経は、脳72までの距離が略同一となるため、脳72までの伝達時間は略同一となる。従って、視点91pを始点(中心)として同心円状に広がっていくように、各神経の情報(画素値に相当)が脳72に伝達していく。
ここで、脳72の画像を認知する認知部分においては、同一時刻には1つの神経の情報(1つの画素の画素値に相当)のみが認識可能であると仮定する。この仮定の下では、同一円周上に分布する各神経の情報は、所定の神経の情報を先頭にして左又は右周りの順番で、脳72の認知部分において順次認知されていく。即ち、視点91pを始点として、例えば右回りの渦巻状に、目71の網膜上に分布する各神経の情報を配置した情報群が、時系列情報として脳72に伝達される。そして、その認知部分において、当該時系列情報を用いて画像が認知される。要するに、当該認知部分は、目71の網膜上の視点91pを始点として、例えば右回りの渦巻状に広がっていくように、画像を認知していく。
このように、同一の画像であっても、制御部が撮像素子を用いて画像を認識していく時間的順序と、人間の脳72が目71を用いた視覚により画像を認知していく時間的順序とは異なる。
そこで、本実施形態では、認知変換部51(図3)は、視点時系列化処理(図6)として、人間の脳72が目71を用いた視覚により画像を認知していく時間的順序に基づいて決定された所定の順番で、原画像のRGB毎の輝度データをサンプリングする。そして、認知変換部51は、当該輝度データをサンプリングの順番に配置し直すことで、人間の脳72に伝達される時系列情報と等価な時系列データを生成する。このようにして生成される時系列データが、上述した視点時系列2次元データである。
さらに、以下、具体例として図9を適宜参照しつつ、図6のステップS32の処理で処理対象がRに設定された場合の視点時系列変化処理、即ち、原画像のRの輝度データから、Rの視点時系列2次元データが生成されるまでの一連の処理の詳細について説明する。
図9は、視点時系列2次元データの具体的な生成手法を説明する図である。
図9(A)は、原画像のRの輝度データを模式的に示した図である。
ここで、原画像のRの輝度データとは、原画像を構成する各画素のRについての輝度値(画素値の1つ)の集合体をいう。図9(A)においては、1つの小さな正方形が、1つの画素の輝度値を示しており、各正方形の配置位置は、原画像内の各画素の配置位置に対応している。
図9(B)は、図9(A)の原画像のRの輝度データから生成されたRの視点時系列2次元データを示すグラフ、即ち、Rの視点時系列2次元グラフを示している。
この場合、認知変換部51は、原画像上の視点となる画素をスタートポイントに設定する(図6のステップS31参照)。
なお、視点となる画素の決定手法は、特に限定されない。例えば、原画像内で予め決定された配置位置(画像の中心等)の画素を、視点となる画素に決定する手法を採用してもよい。また例えば、任意のアルゴリズムに従って注目領域を原画像から検出し、注目領域内の所定の画素を、視点となる画素に決定する手法を採用してもよい。
次に、認知変換部51は、原画像のRの輝度データにおけるサンプリングの順番を決定する。
即ち、認知変換部51は、サンプリングの順序を示す番号(以下、「セグメントNo」と呼ぶ)を、原画像を構成する各画素の各々に付していく。
具体的には、認知変換部51は、スタートポイントの画素のセグメントNoを「0」に設定する。次に、認知変換部51は、1つずつインクリメントした値、即ち、「2」、「3」、「4」・・・「n−1」、「n」の各値を、スタートポイントの画素を中心にして、右回りの渦巻状に広がっていくように、各画素の各々に付していく。なお、nは、原画像の総画素数以下の任意の整数値である。
例えば図9(A)の例では、各画素の輝度値を示す正方形の左隅に示される数値が、セグメントNoを示している。
ここで、原画像の端の画素が、視点となる画素、即ちスタートポイントの画素に設定された場合、右回りに渦巻状にセグメントNoを付していくと、原画像の範囲をはみ出すことがある。このような場合には、原画像の周囲に輝度値が「0」となる画素(以下、原画像内の画素と区別すべく、「仮想画素」と呼ぶ)が付加されているとみなし、認知変換部51は、仮想画素に対してセグメントNoを付すものとする。
そして、認知変換部51は、セグメントNoの順番で、原画像のRの輝度データを構成する各輝度値(画素値の1つ)をサンプリングしていき、サンプリングの順番で配置し直したデータを、Rの視点時系列2次元データとして生成する(図6のステップS33参照)。なお、サンプリング対象が仮想画素の輝度値である場合、上述したように「0」がサンプリングされる。
この場合、横軸をセグメントNoとして、縦軸を輝度値として、Rの視点時系列2次元データを構成する各輝度値がそれぞれプロットされると、図9(B)に示す視点時系列2次元グラフが得られることになる。当該Rの視点時系列2次元グラフは、図2の視点時系列表示領域22Rに表示される。
図示はしないが、以上の一連の処理、即ち、図6のステップS31及びS32の処理が、原画像のG及びBの各輝度データに対しても同様に施されると、B及びGの各視点時系列2次元データが生成される。
この場合、B及びGの各視点時系列2次元グラフは、図2の視点時系列表示領域22B及び22Gの各々に表示される。
これにより、図6の視点時系列化処理、即ち、図5のステップS33の処理が終了し、図4のステップS12の認知変換処理が終了する。
以上、図5乃至図9を参照して、図4のステップS12の認知変換処理の詳細な流れについて説明した。
次に、図10乃至図12を参照して、図4のステップS13のターケンス可逆変換処理の詳細な流れについて説明する。
図10は、ターケンス可逆変換処理の詳細な流れの一例を説明するフローチャートである。
上述したように、図4のステップS12の処理で認知変換処理が実行されて、RGB毎の視点時系列2次元データが生成されると、処理がステップS13に進み、ターケンス可逆変換処理として、次のような処理が実行される。
ステップS41において、ターケンス可逆変換部52は、RGB毎に、ターケンスプロット処理を実行する。即ち、ターケンス可逆変換部52は、ターケンスの埋め込み定理を用いて、RGB毎の視点時系列2次元データから、N次元(Nは2以上の整数値)の空間に描画するアトラクタのデータを生成する。
図11は、ターケンスプロット処理の概要を説明するための図である。
本実施形態のターケンスプロット処理では、RGB毎の視点時系列2次元データが、原波形データWとして用いられる。
この場合、原波形データWをリサンプリングするプロットスケールが用いられる。図11の例では、説明の便宜上N=3の場合、即ち、2次元の原波形データWから3次元のアトラクタを生成する場合のプロットスケールが示されている。プロットスケールは、プロットスケール幅tを隔てた3点(x成分、y成分及びz成分)における原波形データWの波形値T(x,y,z)を指定することによって設定される。
原波形データWの波形値T(x,y,z)を指定するプロットスケールは、リサンプリング周期△t毎に時系列順に移動する。
リサンプリング周期△tは、原波形データWのサンプリング周期以上の時間幅を有し、本実施形態では、セグメントNoが時間に見立てられているので(図9(B)の横軸参照)、隣接するセグメントNoの差分に相当する時間幅が採用されている。
リサンプリング周期△t毎に、時系列順に移動するプロットスケールによって、波形値T1(x,y,z)乃至波形値Tn(x,y,z)が得られる。波形値T1(x,y,z)乃至波形値Tn(x,y,z)の個数は、波形区間長Stimeで決定される。
この波形値T1(x,y,z)乃至波形値Tn(x,y,z)の各々を示すデータがアトラクタのデータであり、図11に示すように、x軸、y軸、及びz軸の3軸で構築される空間に、波形値T1(x,y,z)乃至波形値Tn(x,y,z)の各々をプロットしたものがアトラクタである。
図10に戻り、ステップS42において、ターケンス可逆変換部52は、RGB毎に、アトラクタ描画画像を表示部11に表示する。
即ち、表示部11の図2に示す画面のうち、Rのアトラクタ描画画像はアトラクタ表示領域23Rに表示され、Gのアトラクタ描画画像はアトラクタ表示領域23Gに表示され、Bのアトラクタ描画画像はアトラクタ表示領域23Bに表示される。
ステップS43において、ターケンス可逆変換部52は、編集操作を受け付ける。
即ち、上述したように、ユーザは、表示部11のアトラクタ表示領域23R,23G,23Bの各々に表示されたアトラクタ描画空間画像を視認しながら、操作部12を操作することで、任意の数の任意のアトラクタの形状を任意に編集することができる。このようなユーザの操作が、編集操作である。
ステップS44において、ターケンス可逆変換部52は、編集操作がされたか否かを判定する。
編集操作がされていない場合、ステップS44においてNOであると判定されて、処理はステップS47に進む。ただし、ステップS47以降の処理については後述する。
これに対して、編集操作がされた場合、ステップS44においてYESであると判定されて、処理はステップS45に進む。
ステップS45において、ターケンス可逆変換部52は、アトラクタ編集処理を実行する。これにより、編集操作により形状が編集されたアトラクタ、即ち編集後アトラクタのデータが生成される。
ステップS46において、ターケンス可逆変換部52は、表示部11の画面表示を、編集後アトラクタが描画されるように更新する。
即ち、本実施形態では、ユーザは、RGB毎のアトラクタを個別に編集する編集操作をすることができる。例えば、Gについてのアトラクタの形状を編集する編集操作がされた場合、表示部11の図2に示す画面内のアトラクタ表示領域23Gに表示されたアトラクタ描画画像が、編集前のアトラクタが描画された画像から、編集後アトラクタが描画された画像に更新される。
図12は、編集前後のアトラクタ描画画像の一例を示している。
具体的には、図12(A)が、編集前のアトラクタが描画されたアトラクタ描画画像の一例を示し、図12(B)が、編集後アトラクタが描画されたアトラクタ描画画像の一例を示している。
なお、図12の例では、複数のアトラクタが描画されている。即ち、図12は、1つの原画像において複数の視点が設定され、複数の視点毎にアトラクタのデータが生成され場合のアトラクタ描画画像の例を示している。
このように複数のアトラクタを描画する場合には、点をプロットしただけでは、複数のアトラクタの軌跡の各々を区別して認識することが困難となる。そこで、このような場合には、図12に示すように、アトラクタの軌跡(を示す曲線)も表示すると好適である。アトラクタの軌跡の表示形態は、軌跡をはっきりと見せることが可能な形態であれば特に限定されず、例えば、プロットされた点と次の点とをスプライン処理等を行って薄い色の曲線としてわかりやすく表示するといった表示形態を採用することもできる。
図10に戻り、このようにして編集後アトラクタに表示が更新されてステップS46の処理が終了するか、又は、編集操作がされていないとしてステップS44の処理でNOであると判定された場合、処理はステップS47に進む。
ステップS47において、ターケンス可逆変換部52は、編集操作が終了したか否かを判定する。
編集操作が終了したという判定条件は、特に限定されず、ユーザが操作部12を用いて明示な操作をした場合に満たされるという条件を採用してもよいし、設定時間が経過した等ユーザの操作を介さずに自動的に満たされるという条件を採用してもよい。
編集操作がまだ終了していない場合、処理はステップS44に戻され、それ以降の処理が繰り返される。即ち、ユーザは、編集操作を終了するまでの間、RGB毎のアトラクタのうち、任意の数の任意のアトラクタを、任意の回数編集し直すことができる。
その後、編集操作が終了すると、ステップS47においてYESであると判定されて、処理はステップS48に進む。
ステップS48において、ターケンス可逆変換部52は、RGB毎に時系列2次元データ再生成処理を実行する。
即ち、ターケンス可逆変換部52は、編集後アトラクタを含むRGB毎のアトラクタのデータに対して、図11を用いて説明したターケンスプロット処理と逆方向の処理を施すことによって、逆変換された時系列の2次元データ、即ち、再生成視点時系列2次元データを生成する。
以上、図10乃至図12を参照して、図4のステップS13のターケンス可逆変換処理の詳細な流れについて説明する。
次に、図13を参照して、図4のステップS14の逆認知変換処理の詳細な流れについて説明する。
図13は、逆認知変換処理の詳細な流れの一例を説明するフローチャートである。
上述したように、図4のステップS13の処理でターケンス可逆変換処理が実行されて、RGB毎の再生成視点時系列2次元データが生成されると、処理がステップS14に進み、逆認知変換処理として、次のような処理が実行される。
ステップS51において、逆認知変換部53は、RGB毎に再生成視点時系列2次元データを読み込む。
ステップS52において、逆認知変換部53は、RGB毎の再生成視点時系列2次元データの各々に対して、図5のステップS23の視点時系列化処理の逆処理をそれぞれ施すことによって、RGB毎の輝度データを生成する。
このようなステップS52の処理を、以下、「2次元データ逆視点時系列化処理」と呼ぶ。
図14は、2次元データ逆視点時系列化処理の詳細な流れの一例を説明するフローチャートである。
ステップS61において、逆認知変換部53は、RGB毎の再生成視点時系列2次元データについて、ENDアドレスをそれぞれ決定する。なお、ENDアドレスについては、後述するステップS63の処理の説明の際に併せて説明する。
ステップS62において、逆認知変換部53は、処理対象をRGBの中から設定する。
即ち、図13のステップS51の処理でRGB毎の再生成視点時系列2次元データが読み込まれている。このため、ステップS62の処理で、RGBの各々が所定の順番で1つずつ処理対象として順次設定され、処理対象の再生成視点時系列2次元データに対して次のステップS63の処理が施される。
ステップS63において、逆認知変換部53は、処理対象の再生成視点時系列2次元データの各構成要素を逆方向から読み出して、逆回転まわりで視点方向に配置していくことで、処理対象の輝度データを再生成する。
即ち、再生成視点時系列2次元データの各構成要素は、図10のターケンス化逆変換処理によって更新された後の各画素の輝度値である。
ただし、各構成要素(各画素の更新後の輝度値)が、原画像の各画素の配置順ではなく、人間の脳が視覚により画像を認知していく時間的順序で配置されたデータが、再生成視点時系列2次元データである。
具体的には本実施形態では、図9(A)に示すように、視点から外側に向かう方向に、右回りの渦巻状となる順番で、各構成要素(各画素の更新後の輝度値)が配置されることによって、再生成視点時系列2次元データが構成されている。
セグメントNoを用いるならば、各構成要素(各画素の更新後の輝度値)が「1」乃至「n」の順番で配置されたデータが、再生成視点時系列2次元データである。
そこで、本実施形態ではステップS63の処理として、逆認知変換部53は、処理対象の再生成視点時系列2次元データの各構成要素(各画素の更新後の輝度値)を、逆の順番で、セグメントNoを用いるならば「n」乃至「1」の逆の順番で読み出す。
このとき、最初に読み出される構成要素が、ステップS61の処理で決定されたENDアドレスに配置された構成要素、即ち、人間の脳であれば最後に認知される画素の更新後の輝度値である。セグメントNoを用いるならば「n」が付された画素の更新後の輝度値が最初に読み出される。
そして、逆認知変換部53は、図9(A)に示す逆の順番、即ち、外側から視点に向かう方向に、左回りの渦巻状となる順番で、読み出された各構成要素(各画素の更新後の輝度値)を順次配置していく。
これにより、処理対象の輝度データ(ただし、各画素の輝度値は更新されているデータ)が再生成される。
ステップS64において、逆認知変換部53は、RGBの全てを処理対象にしたか否かを判定する。
RGBの全てが未だ処理対象になっていない場合、ステップS64においてNOであると判定され、処理はステップS62に戻され、それ以降の処理が繰り返される。
即ち、RGBの順に処理対象が設定されるとするならば、ステップS62乃至S64のループ処理が繰り返し実行されることで、Rの再生成視点時系列2次元データからRの輝度データが再生成され、続いて、Gの再生成視点時系列2次元データからGの輝度データが再生成され、最後に、Bの再生成視点時系列2次元データからBの輝度データが再生成される。
これにより、ステップS64においてYESであると判定され、2次元データ逆視点時系列化処理は終了する。即ち、図13のステップS52の処理が終了し、処理はステップS53に進む。
ステップS53において、逆認知変換部53は、RGB比率調整処理を実行する。
RGB比率調整処理とは、再生成されたRGB毎の輝度データの各々について、同一画素のRGBの輝度値の比率が所定範囲内に収まるように、各輝度値を調整する処理をいう。
ステップS54において、逆認知変換部53は、再生成されたRGB毎の輝度データを合成する処理(以下、「RGB合成処理」と呼ぶ)を実行して、再生成画像のデータを生成する。
これにより、逆認知変換処理は終了する。即ち、図4のステップS14の処理が終了し、画像認知に基づく画像変換処理が終了する。
この時点で、表示部11の画面のうち、再生成画像表示領域24には、再生成画像が表示される。
なお、ユーザは、再生成画像表示領域24に表示された再生成画像が所望の画像でない場合、所望の画像が表示されるまで、アトラクタの編集操作を何度でも行うことができる。この場合、画像処理装置1は、ステップS11及びS12の処理をその都度実行してもよいが、適宜省略して、ステップS13の処理から開始するようにしてもよい。
以上説明したように、第1実施形態に係る画像処理装置1は、認知変換部51と、ターケンス可逆変換部52と、逆認知変換部53と、を備えている。
認知変換部51は、原画像のデータを構成する各画素の輝度値のそれぞれを構成要素として、人間が視覚により画像を認知していく時間的順序に基づいて決定された所定の順番で配列し直し、その結果得られるデータを視点時系列2次元データとして出力する。
ターケンス可逆変換部52は、視点時系列2次元データを、ターケンスの埋め込み定理を用いてN次元(Nは2以上の整数値)の空間に描画するアトラクタのデータに変換する変換処理を実行する。次に、ターケンス可逆変換部52は、ユーザの指示操作に従って、アトラクタの形状が変化するように、当該アトラクタのデータを補正する補正処理を実行する。そして、ターケンス可逆変換部52は、補正処理後のアトラクタのデータ(即ち、編集後アトラクタのデータ)に対して、当該変換処理の逆変換処理を施し、その結果得られるデータを再生成視点時系列2次元データとして出力する。
逆認知変換部53は、再生成視点時系列2次元データの各構成要素を、認知変換部51で用いた所定の順番と逆の順番で配列し直し、その結果得られるデータを、再生成画像のデータとして出力する。
ここで、ターケンス可逆変換部52が逆変換を施すデータは、ユーザ操作により形状が変化したアトラクタのデータである。形状が変化する前のアトラクタのデータは、人間が視覚により画像を認知していく時間的順序に基づいて、原画像のデータから変換されたものである。
従って、アトラクタの形状を変化させるユーザ操作、即ち上述した編集操作は、人間の脳の視覚の順序(画像の認知順序)に近い編集操作であるといえる。
これにより、原画像と比較して、画像の持つ印象が強まった再生成画像が得られる。即ち、従来には存在しなかった、絵の印象が原画像よりも強烈に表現された画像や、従来には存在しなかった絵の変換が施された画像等が、再生成画像として得られる。
換言すると、ターケンス可逆変換部52の処理、即ちターケンス可逆変換処理(図10参照)とは、上述したように、音声処理分野における特許文献1に記載の技術を適用した処理である。
このような音声処理分野における特許文献1に記載の技術を適用したターケンス可逆変換処理を実現するために、認知変換部51と逆認知変換部53とが設けられているのである。
このようにして、音声処理分野の技術を適用して、人間の脳の視覚の順序に基づく画像処理が実現される。
以上、本発明に係る画像処理装置の第1実施形態について説明した。
次に、本発明に係る画像処理装置の第2実施形態について説明する。
[第2実施形態]
図15は、第2実施形態に係る画像認知に基づく画像変換処理の流れの一例を示すフローチャートである。
図4と図15とを比較するに、図15のステップS71は図4のステップS11と同様の処理であり、図15のステップS72は図4のステップS12と同様の処理であり、図15のステップS74は図4のステップS14と同様の処理である。
これらの処理の詳細な説明は上述したのでここでは省略するが、第2実施形態に係る画像処理装置も、画像認知に基づく画像変換処理として、原画像のデータに対して、認知変換処理及び逆認知変換処理を施して、再生画像のデータを生成する点は第1実施形態と一致する。
一方、第2実施形態と第1実施形態との差異点は次のとおりである。即ち、第1実施形態では、図4のステップS12とステップS14との間のステップS13の処理として、上述したターケンス可逆変換処理が実行される(図10参照)。これに対して、第2実施形態では、図15のステップS72とステップS74との間のステップS73の処理として、「フーリエ可逆変換処理」と呼ばれる処理が実行される。
機能的構成の点から換言すると、図示はしないが、第2実施形態に係る画像処理装置は、図3の第1実施形態の機能的構成と比較して、次の点のみが異なり、それ以外の点は一致する。即ち、第2実施形態に係る画像処理装置においては、第1実施形態のターケンス可逆変換部52の代わりに、「フーリエ可逆変換処理」を実行する機能ブロックが設けられる点、及び、アトラクタデータ記憶部63の代わりに、「フーリエ可逆変換処理」で用いられるデータを記憶する機能ブロックが設けられる点のみが異なり、それ以外の点は一致する。
なお、第2実施形態に係る画像処理装置は、さらに、第1実施形態と同様に図1の外観的構成を有しており、第1実施形態と基本的に同様の図2の画面を表示するものとする。ここで、画面について「基本的に同様」と記載したのは、アトラクタ表示領域23R,23G,23Bに対応する領域には、アトラクタ描画画像では無く、「フーリエ可逆変換処理」の実行結果を示す画像が表示されるという微差があるからである。
さらに、以下、図16及び図17を参照して、図15のステップS73のフーリエ可逆変換処理について詳細に説明する。
図16は、図15のステップS73のフーリエ可逆変換処理の詳細な流れの一例を説明するフローチャートである。
図17は、図16のフーリエ可逆変換処理の具体的な結果の一例を示すグラフである。
図16に示すフーリエ可逆変換処理は、図15のステップS72の処理で認知変換処理が実行されて、RGB毎の視点時系列2次元データが生成されると、ステップS73の処理として実行される。
なお、フーリエ可逆変換処理の動作主体は、より正確にいえば、第1実施形態のターケンス可逆変換部52の代わりに設けられる機能ブロック(図示せず)であるが、以下、説明の簡略上、単に画像処理装置であるものとする。
図16のステップS81において、画像処理装置は、RGB毎の視点時系列2次元データの各々に対して、FFT(Fast Fourier Transform)処理等のフーリエ変換処理を施すことによって、その形態を時間領域のデータから周波数領域のデータに変換する。
図17(A)は、ステップS81のフーリエ変換処理が実行される前の時間領域の視点時系列2次元データにより表現される画像、即ち、第1実施形態で説明した視点時系列2次元グラフの一例を示している。なお、図17(A)は、RGBのうち例えばRについての視点時系列2次元グラフであるものとする。
ここで、図示はしないが、第2実施形態の表示部11の画面においても、図2の画面と同様に視点時系列表示領域22R,22G,22Bが設けられているものとする。この場合、図17(A)に示すRについての視点時系列2次元グラフが、視点時系列表示領域22Rに表示されることになる。
図17(B)は、ステップS81のフーリエ変換処理が実行された後の周波数領域のデータ(以下、「視点周波数データ」と呼ぶ)により表現される画像(以下、「視点周波数分布グラフ」と呼ぶ)の一例を示している。なお、図17(B)は、RGBのうち例えばRについての視点周波数分布グラフであるものとする。
図17(B)において、横軸は周波数であり、縦軸はゲインである。
ここで、図示はしないが、第2実施形態の表示部11の画面には、図2の画面のアトラクタ表示領域23R,23G,23Bの代わりに、RGB毎の視点周波数分布グラフの各々を表示する領域(以下、「周波数解析結果表示領域」と呼ぶ)が設けられている。この場合、図17(B)に示すRについての視点周波数グラフが、Rについての周波数解析結果表示領域に表示されることになる。
ユーザは、表示部11のRGB毎の周波数解析結果表示領域の各々に表示された視点周波数グラフを視認しながら、操作部12を操作することで、任意の数の任意の視点周波数グラフの波形の形状を任意に編集することができる。
このように、ユーザにより形状が編集された波形を有する視点周波数グラフを、以下、「編集後視点周波数グラフ」と呼ぶ。
図17(C)は、編集後視点周波数グラフの一例を示している。
図17(C)内の両矢印で示すように、ユーザは、任意の数の任意の周波数のゲインを任意に調整することによって、所望の編集後視点周波数グラフを生成することができる。
このようなユーザの編集の操作を受け付けて、編集後視点周波数グラフに対応する周波数領域のデータ(以下、「編集後視点周波数データ」と呼ぶ)を生成する処理が、「周波数毎ゲイン調整処理」と呼ばれており、ステップS82の処理として実行される。
即ち、ステップS82において、画像処理装置は、RGB毎の視点周波数データに対して、周波数毎ゲイン調整処理を施すことによって、RGB毎の編集後視点周波数データを生成する。
なお、ユーザによる周波数毎のゲイン調整の編集操作が行われなかった視点周波数データは、そのまま編集後視点周波数データとして採用される。
ステップS83において、画像処理装置は、RGB毎の編集後視点周波数データの各々に対して、逆FFT(Fast Fourier Transform)処理等の逆フーリエ変換処理を施すことによって、その形態を周波数領域のデータから時間領域のデータに戻す。
ここで、ステップS83の逆フーリエ変換処理の結果得られる時間領域のデータは、編集後視点周波数データ(周波数毎にゲインが調整されたデータ)に基づいて視点時系列2次元データがいわば再生成されたものである。よって、ステップS83の逆フーリエ変換処理の結果得られる時間領域のデータは、第1実施形態と同様に、「再生成視点時系列2次元データ」として取り扱うことができる。
このため、図16のステップS83の処理が終了すると、即ち図15のステップS73の処理が終了し、処理はステップS74に進み、第1実施形態と同様の逆認知変換処理が実行され、再生成画像のデータが生成される。
以上説明したように、第2実施形態に係る画像処理装置は、第1実施形態と同様に、原画像のデータを構成する各画素の輝度値のそれぞれを構成要素として、人間が視覚により画像を認知していく時間的順序に基づいて決定された所定の順番で配列し直し、その結果得られるデータを視点時系列2次元データとして出力する。
第2実施形態にかかる画像処理装置は、視点時系列2次元データを、時間領域のデータから周波数領域のデータ(視点周波数データ)に変換するフーリエ変換処理を実行する。次に、第2実施形態にかかる画像処理装置は、前記周波数領域のデータのうち1以上の周波数のゲインを変化させることにより、前記周波数領域のデータを補正する補正処理を実行する。そして、第2実施形態にかかる画像処理装置は、補正処理後の周波数領域のデータ(即ち、編集後視点周波数データ)に対して、逆フーリエ変換処理を施し、その結果得られるデータを再生成視点時系列2次元データとして出力する。
第2実施形態に係る画像処理装置は、第1実施形態と同様に、上述の所定の順番と逆の順番で配列し直し、その結果得られるデータを、再生成画像のデータとして出力する。
ここで、逆フーリエ変換処理を施すデータは、ユーザ操作により波形の形状が変化した(周波数毎のゲイン調整が行われた)周波数領域のデータ、即ち編集後視点周波数データである。波形の形状が変化する前の周波数領域のデータ、即ち視点周波数データは、人間が視覚により画像を認知していく時間的順序に基づいて、原画像のデータから変換されたものである。
従って、周波数領域のデータの波形の形状を変化させるユーザ操作は、人間の脳の視覚の順序(画像の認知順序)に近い編集操作であるといえる。
これにより、原画像と比較して、画像の持つ印象が強まった再生成画像が得られる。即ち、従来には存在しなかった、絵の印象が原画像よりも強烈に表現された画像や、従来には存在しなかった絵の変換が施された画像等が、再生成画像として得られる。
換言すると、フーリエ可逆変換処理とは、音声処理分野において音声データに対して施されていた従来の技術を適用した処理である。
このような音声処理分野における技術を適用したフーリエ可逆変換処理を実現するために、認知変換部51と逆認知変換部53とが設けられているのである。
このようにして、音声処理分野の技術を適用して、人間の脳の視覚の順序に基づく画像処理が実現される。
なお、本発明は上述の実施形態に限定されるものではなく、本発明の目的を達成できる範囲での変形、改良等は本発明に含まれるものである。
例えば、認知変換処理と逆認知変換処理との間の処理として、上述の第1実施形態では図10のターケンス可逆変換処理が採用され、上述の第2実施形態では図16のフーリエ可逆変換処理が採用されたが、特にこれらに限定されない。
即ち、認知変換処理で得られる視点時系列2次元データを第1の形態から第2の形態に変換する変換処理を実行し、ユーザの指示操作に従って第2の形態のデータを補正する補正処理を実行し、補正処理後のデータを第2の形態から第1の形態に逆変換する逆変換処理を実行し、その結果得られるデータを再生成視点時系列2次元データとして出力する処理であれば、認知変換処理と逆認知変換処理との間の処理として採用することができる。
ここで、このような処理として、音声処理分野の技術で採用されていた処理を適用することは、本発明において特に必須なことではない。ただし、音声処理分野の技術で採用されていた処理を適用することで、本発明を容易に具現化できるので好適である。
また例えば、上述した実施形態では、画像処理が施される対象は、RGBの各輝度値とされたが、特にこれに限定されず、任意の色表現形態で分類された場合の各画素値、例えば色相や彩度等の値を採用することができる。
また例えば、上述した実施形態では、原画像のデータから視点2次元時系列データを生成する場合、視点に対応するスタートポイントから、左又は右回りの渦巻状に、各画素の輝度値のそれぞれを順次サンプリングする、といったサンプリング手法が採用された。
しかしながら、サンプリング手法は、これに限定されず、人間が視覚により画像を認知していく時間的順序に基づいて決定された所定の順番でサンプリングする手法であれば足りる。
具体的には例えば、視点から同一距離に存在する網膜上の各神経、即ち図8の点線で示す同一円周上に分布する各神経から、脳までの伝達速度は同一であると仮定することもできる。このような仮定の下で、視点に対応するスタートポイントから、同心円状に広がるようにサンプリングをしていく、といったサンプリング手法を採用してもよい。この場合、同一円周状(より正確には正方形の辺状)に分布する各画素の輝度値は、時系列では同一時刻のデータとなるため、同一円周状の各画素の輝度値の平均値等をサンプリング値として採用すればよい。
また例えば、人間が視覚により画像を認知していく時間的順序として影響を及ぼす要素として、上述した実施形態で用いた目から脳までの神経の距離の他に、目の網膜に分布する神経の密度や、脳内での視覚の処理順序等が存在すると考えられる。よって、これらの要素に対応させた順番でサンプリングしていく、といったサンプリング手法を採用してもよい。
また例えば、上述した実施形態では、本発明が適用される画像処理装置は、デジタルフォトフレームとして構成される例として説明した。
しかしながら、本発明は、特にこれに限定されず、画像処理機能を有する電子機器一般に適用することができ、例えば、本発明は、パーソナルコンピュータ、携帯型ナビゲーション装置、ポータブルゲーム機等に幅広く適用可能である。
上述した一連の処理は、ハードウェアにより実行させることもできるし、ソフトウェアにより実行させることもできる。
図18は、上述した一連の処理をソフトウェアにより実行させる場合の、本発明が適用される画像処理装置のハードウェア構成を示すブロック図である。
画像処理装置は、CPU(Central Processing Unit)101と、ROM(Read Only Memory)102と、RAM(Random Access Memory)103と、バス104と、入出力インターフェース105と、入力部106と、出力部107と、記憶部108と、通信部109と、ドライブ110と、上述した音源部56と、を備えている。
CPU101は、ROM102に記録されているプログラムに従って各種の処理を実行する。又は、CPU101は、記憶部108からRAM103にロードされたプログラムに従って各種の処理を実行する。
RAM103にはまた、CPU101が各種の処理を実行する上において必要なデータ等も適宜記憶される。
例えば、上述した図3の機能的構成のうち、認知変換部51、ターケンス可逆変換部52、逆認知変換部53、及び表示制御部55、並びに図16のフーリエ可逆変換処理を実行する機能ブロック(図示せず)は、CPU101というハードウェアと、ROM102等に記憶されたプログラム(ソフトウェア)との組み合わせとして構成することができる。
CPU101、ROM102、及びRAM103は、バス104を介して相互に接続されている。このバス104にはまた、入出力インターフェース105も接続されている。入出力インターフェース105には、入力部106、出力部107、記憶部108、通信部109、及びドライブ110が接続されている。
入力部106は、例えば図1の操作部12等により構成される。
出力部107は、例えば図1の表示部11や図示せぬ音声出力部等により構成される。
記憶部108は、ハードディスク等により構成され、各種データを記憶する。例えば図3のデータ記憶部54は、記憶部108内の一領域として構成され、上述した各種形態の画像のデータを記憶する。
通信部109は、インターネット等を介して他の装置との間で行う通信を制御する。
ドライブ110には、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリ等よりなるリムーバブルメディア121が適宜装着される。ドライブ110によって読み出されたコンピュータプログラムは、必要に応じて記憶部108等にインストールされる。
一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、コンピュータ等にネットワークや記録媒体からインストールされる。コンピュータは、専用のハードウェアに組み込まれているコンピュータであってもよい。また、コンピュータは、各種のプログラムをインストールすることで、各種の機能を実行することが可能なコンピュータ、例えば汎用のパーソナルコンピュータであってもよい。
このようなプログラムを含む記録媒体は、ユーザにプログラムを提供するために装置本体とは別に配布されるリムーバブルメディア121により構成されるだけでなく、装置本体に予め組み込まれた状態でユーザに提供される記録媒体等で構成される。リムーバブルメディアは、例えば、磁気ディスク(フロッピディスクを含む)、光ディスク、又は光磁気ディスク等により構成される。光ディスクは、例えば、CD−ROM(Compact Disk-Read Only Memory),DVD(Digital Versatile Disk)等により構成される。光磁気ディスクは、MD(Mini-Disk)等により構成される。また、装置本体に予め組み込まれた状態でユーザに提供される記録媒体は、例えば、プログラムが記録されているROM102や記憶部108に含まれるハードディスク等で構成される。
なお、本明細書において、記録媒体に記録されるプログラムを記述するステップは、その順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的或いは個別に実行される処理をも含むものである。
1・・・画像処理装置、11・・・表示部、12・・・操作部、51・・・認知変換部、52・・・ターケンス可逆変換部、53・・・逆認知変換部、54・・・データ記憶部、55・・・表示制御部、61・・・原画像記憶部、62・・・視点時系列2次元データ記憶部、63・・・アトラクタデータ記憶部、64・・・再生成視点時系列2次元データ記憶部、65・・・再生成画像記憶部、101・・・CPU、102・・・ROM、103・・・RAM、106・・・入力部、107・・・出力部、108・・・記憶部、109・・・通信部、110・・・ドライブ、121・・・リムーバブルメディア

Claims (7)

  1. 所定の画像を原画像として、前記原画像のデータに対して画像処理を施す画像処理装置において、
    前記原画像のデータを構成する各画素の画素値のそれぞれを構成要素として、人間が視覚により画像を認知していく時間的順序に基づいて決定された所定の順番で配列し直し、その結果得られるデータを、視点2次元時系列データとして出力する認知変換手段と、
    前記認知変換手段から出力された前記視点2次元時系列データを変換処理する2次元時系列データ変換手段と、
    前記2次元時系列データ変換手段で変換処理された前記再生成視点2次元時系列データを、前記認知変換手段で用いられた前記所定の順番と逆の順番で配列し直し、その結果得られるデータを、再生成画像のデータとして出力する逆認知変換手段と、
    を備える画像処理装置。
  2. 前記2次元時系列データ変換手段は、
    前記認知変換手段から出力された前記視点2次元時系列データを第1の形態から第2の形態に変換する変換処理を実行し、前記第2の形態のデータを補正する補正処理を実行し、補正後のデータを前記第2の形態から前記第1の形態に逆変換する逆変換処理を実行し、その結果得られるデータを、再生成視点2次元時系列データとして出力する形態可逆変換手段を備える、
    請求項1に記載の画像処理装置。
  3. 前記認知変換手段は、
    前記原画像を構成する前記各画素の中から視点となる画素をスタートポイントに設定し、
    前記スタートポイントから、左又は右回りの渦巻状に、前記各画素の画素値のそれぞれを順次サンプリングしていき、
    サンプリングの順番で、前記各画素の画素値を配列し直し、
    その結果得られるデータを、前記視点2次元時系列として出力する、
    請求項1又は2に記載の画像処理装置。
  4. 前記形態可逆変換手段は、
    前記視点2次元時系列データを、ターケンスの埋め込み定理を用いてN次元(Nは2以上の整数値)の空間に描画するアトラクタのデータに変換する前記変換処理を実行し、
    トラクタの形状が変化するように、前記アトラクタのデータを補正する前記補正処理を実行し、
    前記補正処理後の前記アトラクタのデータを用いて、前記変換処理の逆変換処理を実行し、
    その結果得られるデータを、前記再生成視点時系列2次元データとして出力する、
    請求項に記載の画像処理装置。
  5. 前記形態可逆変換手段は、
    前記視点2次元時系列データに対してフーリエ変換を施すことで、データの形態を時間領域から周波数領域に変換する前記変換処理を実行し、
    記周波数領域のデータのうち1以上の周波数のゲインを変化させることにより、前記周波数領域のデータを補正する前記補正処理を実行し、
    補正処理後の前記周波数領域のデータ(編集後視点周波数データ)に対して、逆フーリエ変換を施すことで、データの形態を周波数領域から時間領域に逆変換する前記逆変換処理を実行し、
    その結果得られるデータを、前記再生成視点時系列2次元データとして出力する、
    請求項に記載の画像処理装置。
  6. 所定の画像を原画像として、前記原画像のデータに対して画像処理を施す画像処理装置の画像処理方法において、
    前記原画像のデータを構成する各画素の画素値のそれぞれを構成要素として、人間が視覚により画像を認知していく時間的順序に基づいて決定された所定の順番で配列し直し、その結果得られるデータを、視点2次元時系列データとして出力する認知変換ステップと、
    前記認知変換ステップの処理によって出力された前記視点2次元時系列データ変換処理する2次元時系列データ変換ステップと、
    前記2次元時系列データ変換ステップで変換処理された前記再生成視点2次元時系列データを、前記認知変換ステップで用いられた前記所定の順番と逆の順番で配列し直し、その結果得られるデータを、再生成画像のデータとして出力する逆認知変換ステップと、
    を含む画像処理方法。
  7. 所定の画像を原画像として、前記原画像のデータに対して画像処理を施す画像処理装置を制御するコンピュータに、
    前記原画像のデータを構成する各画素の画素値のそれぞれを構成要素として、人間が視覚により画像を認知していく時間的順序に基づいて決定された所定の順番で配列し直し、その結果得られるデータを、視点2次元時系列データとして出力する認知変換機能と、
    前記認知変換機能の実現によって出力された前記視点2次元時系列データを変換処理する2次元時系列データ変換機能と、
    前記2次元時系列データ変換機能の実現によって変換処理された前記再生成視点2次元時系列データを、前記認知変換機能で用いられた前記所定の順番と逆の順番で配列し直し、その結果得られるデータを、再生成画像のデータとして出力する逆認知変換機能と、
    を実現させるプログラム。
JP2010140551A 2010-06-21 2010-06-21 画像処理装置及び方法、並びにプログラム Expired - Fee Related JP5548950B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010140551A JP5548950B2 (ja) 2010-06-21 2010-06-21 画像処理装置及び方法、並びにプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010140551A JP5548950B2 (ja) 2010-06-21 2010-06-21 画像処理装置及び方法、並びにプログラム

Publications (3)

Publication Number Publication Date
JP2012003687A JP2012003687A (ja) 2012-01-05
JP2012003687A5 JP2012003687A5 (ja) 2013-07-18
JP5548950B2 true JP5548950B2 (ja) 2014-07-16

Family

ID=45535550

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010140551A Expired - Fee Related JP5548950B2 (ja) 2010-06-21 2010-06-21 画像処理装置及び方法、並びにプログラム

Country Status (1)

Country Link
JP (1) JP5548950B2 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4346799B2 (ja) * 2000-08-31 2009-10-21 アロカ株式会社 カオス解析装置
JP2002191046A (ja) * 2000-12-22 2002-07-05 Ffc:Kk 画像監視装置
JP4580409B2 (ja) * 2007-06-11 2010-11-10 富士通株式会社 音量制御装置および方法
JP5347405B2 (ja) * 2008-09-25 2013-11-20 カシオ計算機株式会社 波形発生装置および波形発生処理プログラム

Also Published As

Publication number Publication date
JP2012003687A (ja) 2012-01-05

Similar Documents

Publication Publication Date Title
CN109191548A (zh) 动画制作方法、装置、设备及存储介质
JP2011170840A (ja) 画像処理装置及び電子機器
JP5949331B2 (ja) 画像生成装置、画像生成方法及びプログラム
WO2009093398A1 (ja) 画像処理装置、その処理方法およびプログラム
JP2010278725A (ja) 画像音響処理装置及び撮像装置
JP2013042301A (ja) 画像処理装置、画像処理方法及びプログラム
JP2016118991A (ja) 画像生成装置、画像生成方法及びプログラム
JP2013200735A (ja) 画像生成装置、画像生成方法及びプログラム
JP2000322588A (ja) 画像処理装置及びその方法
CN104394315A (zh) 一种拍摄图像的方法
JP7439131B2 (ja) 空間オーディオをキャプチャする装置および関連する方法
CN112863481A (zh) 一种音频生成方法及设备
JP2023098937A (ja) 多次元反応型映像を再生する方法及び装置
CN109064548A (zh) 视频生成方法、装置、设备及存储介质
CA2838878A1 (en) Method and apparatus for controlling contents in electronic device
JP6171371B2 (ja) 画像処理プログラム、画像処理装置および画像処理方法
JP2013066058A (ja) 画像処理装置、画像処理方法及びプログラム
JP2013025697A (ja) 画像処理装置、画像処理方法及びプログラム
JP5548950B2 (ja) 画像処理装置及び方法、並びにプログラム
JP5408037B2 (ja) 画像処理装置及び方法、並びにプログラム
JP2007034724A (ja) 画像処理装置、画像処理方法および画像処理プログラム
JP5966657B2 (ja) 画像生成装置、画像生成方法及びプログラム
JP7152908B2 (ja) 仕草制御装置及び仕草制御プログラム
WO2019229936A1 (ja) 情報処理システム
WO2012146042A1 (zh) 一种基于三维栅格平滑模型的图像细节增强方法

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130603

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130603

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140122

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140415

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140428

R150 Certificate of patent or registration of utility model

Ref document number: 5548950

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees