JP2022015209A - 画像処理方法、画像処理プログラム、及び表示装置 - Google Patents
画像処理方法、画像処理プログラム、及び表示装置 Download PDFInfo
- Publication number
- JP2022015209A JP2022015209A JP2020117905A JP2020117905A JP2022015209A JP 2022015209 A JP2022015209 A JP 2022015209A JP 2020117905 A JP2020117905 A JP 2020117905A JP 2020117905 A JP2020117905 A JP 2020117905A JP 2022015209 A JP2022015209 A JP 2022015209A
- Authority
- JP
- Japan
- Prior art keywords
- image
- image processing
- color
- pixel
- evaluation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 15
- 238000006243 chemical reaction Methods 0.000 claims abstract description 124
- 238000011156 evaluation Methods 0.000 claims abstract description 107
- 238000012545 processing Methods 0.000 claims abstract description 80
- 239000003086 colorant Substances 0.000 claims abstract description 30
- 238000005457 optimization Methods 0.000 claims description 22
- 230000009466 transformation Effects 0.000 claims description 21
- 238000000034 method Methods 0.000 abstract description 58
- 230000006870 function Effects 0.000 description 58
- 230000005540 biological transmission Effects 0.000 description 23
- 238000004364 calculation method Methods 0.000 description 22
- 238000004891 communication Methods 0.000 description 17
- 230000008569 process Effects 0.000 description 17
- 230000003287 optical effect Effects 0.000 description 14
- 238000004321 preservation Methods 0.000 description 14
- 208000006992 Color Vision Defects Diseases 0.000 description 9
- SOCTUWSJJQCPFX-UHFFFAOYSA-N dichromate(2-) Chemical compound [O-][Cr](=O)(=O)O[Cr]([O-])(=O)=O SOCTUWSJJQCPFX-UHFFFAOYSA-N 0.000 description 9
- 230000001953 sensory effect Effects 0.000 description 8
- 230000008859 change Effects 0.000 description 5
- 201000007254 color blindness Diseases 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000004088 simulation Methods 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- 208000036693 Color-vision disease Diseases 0.000 description 4
- 230000008094 contradictory effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000004438 eyesight Effects 0.000 description 4
- 230000033001 locomotion Effects 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 239000007787 solid Substances 0.000 description 4
- 230000004456 color vision Effects 0.000 description 3
- 230000007547 defect Effects 0.000 description 3
- 230000000717 retained effect Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 230000006735 deficit Effects 0.000 description 2
- 210000003128 head Anatomy 0.000 description 2
- 230000001771 impaired effect Effects 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 206010047571 Visual impairment Diseases 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000002763 pyramidal cell Anatomy 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 210000001525 retina Anatomy 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 208000029257 vision disease Diseases 0.000 description 1
- 230000004393 visual impairment Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Landscapes
- Image Processing (AREA)
Abstract
【課題】従来の色覚障がい者用支援画像生成技術は、複数の特徴色それぞれについて変換後の色を求め、それを画像の全ての色に伝搬することが必要なため、一枚の画像を処理するのに多大な時間がかかるという問題がある。【解決手段】入力画像の画素の色を変換する画像処理方法であって、評価関数に基いて統一線形変換式を決定する統一線形変換式決定ステップと、前記決定した統一線形変換式を用いて前記入力画像の全ての画素の色を変換する色変換ステップと、を備える画像処理方法が提供される。【選択図】図5
Description
本発明は、画像処理方法、画像処理プログラム、及び表示装置に関する。
世界中の色覚障がいを持つ人口は約二億人で、男性はその九割以上を占める。日本では男性の20人に1人、女性の500人に1人が色覚障がいを有するとされている。人間の目の網膜にあるL錐体、M錐体、S錐体と呼ばれる三種類の錐体細胞がそれぞれ長波長,中波長,短波長の光にもっとも反応し、色の知覚を可能にしている。三種類のうち一種類が正常に機能しない場合、異常三色覚あるいは二色覚という。また、異常が発生する錐体細胞の種類によって、色覚障がいはProtan(L錐体欠損)、Deutan(M錐体欠損)、Tritan(S錐体欠損)と分類される。色覚障がい者が知覚できる色の範囲は健常者より小さいため、色の違い(コントラスト)を判別する能力が低下する。そのため日常生活における不便も多い。
このような背景の下、画像処理分野において、色覚障がい者が視認し易い支援画像の生成が求められている。例えば、非特許文献1には、二色覚を持つ人が知覚できる色の範囲は三次元の色空間内にある二次元平面であると仮定し、三次元色空間内の色を二次元平面に投影することで障がいのシミュレーション画像を得る方法が開示されている。非特許文献2には、色覚障がい者にとって区別のつかない2色の色空間における距離が可能な限り離れるように変換することで色の違いを強調する方法が開示されている。しかし、障がい者が本来認識できる色を保存することが考慮されていないため、変換後の画像は障がい者に強い違和感を与える。非特許文献3には、赤緑色覚障がい者にとって青は認識できることを利用し、元画像の認識できない色に対して青成分を増やすことで周囲との差分を強調させる方法が開示されている。しかし、もともと青成分が高いところでは飽和となり,コントラストが失われる。特許文献1には、上述した問題を解決するために、本来見える色をできるだけ保ち、区別が困難な色の違いを強調する色変換技術が開示されている。
H. Brettel, F. Vienot, and J.D. Mollon, "Computerizedsimulation of color appearance for dichromats," JOSA A, vol. 14, no. 10,pp. 2647-2655, 1997.
G.M.Machado and M.M.Oliveira,"Real‐time temporal‐coherent color contrastenhancement for dichromats", Computer Graphics Forum,pp.933-942,2010.
M.F. Hassan, and R. Paramesran, "Naturalness preserving imagerecoloring method for people with red-green deficiency," SignalProcessing: Image Communication, vol. 57, pp. 126-133, 2017.
特許文献1に開示された色変換技術は、複数の特徴色それぞれについて変換後の色を求め、それを画像の全ての色に伝搬することが必要なため、一枚の画像を処理するのに多大な時間がかかるという問題がある。
本発明の一観点によれば、入力画像の画素の色を変換する画像処理方法であって、評価関数に基いて統一線形変換式を決定する統一線形変換式決定ステップと、前記決定した統一線形変換式を用いて前記入力画像の全ての画素の色を変換する色変換ステップと、を備える画像処理方法が提供される。
本発明に係る画像処理方法では、評価関数に基いた統一線形変換式により入力画像の全ての画素の色を変換するので、障がい者が本来見える色をできるだけ保ち、区別が困難な色の違いを強調する技術でありながら、高速処理を可能とするものである。
好ましくは、前記評価関数は、コントラスト強調の度合いを評価するコントラスト評価項と、 自然さを評価する自然さ評価項とを含むので、コントラスト強調と自然さという相反する指標のバランスをとった色変換が可能となる。
好ましくは、前記コントラスト評価項は、前記入力画像の任意の画素ペア間の距離と、当該任意の画素ペアを前記統一線形変換式により変換した変換後画素ペア間の距離との差が大きいほど評価が高くなり、前記自然さ評価項は、前記入力画像の任意の画素の色と当該画素を前記統一線形変換式により変換した変換後画素の色との差が少ないほど評価が高くなる。
好ましくは、前記統一線形変換式確定ステップは、前記評価関数に基いて前記統一線形変換式のパラメータを決定する最適化ステップを更に含む。
好ましくは、前記入力画像の表色系を、L*a*b*表色系に変換する表色系変換ステップを更に含む。
好ましくは、前記入力画像が動画の場合、前記評価関数は相関制約項を更に含み、前記相関制約項は、前記動画のフレーム内の画素と、その直前のフレーム内の関連画素との色の差に基いて計算される。
好ましくは、前記コントラスト評価項は、前記入力画像の任意の画素ペア間の距離と、当該任意の画素ペアを前記統一線形変換式により変換した変換後画素ペア間の距離との差が大きいほど評価が高くなり、前記自然さ評価項は、前記入力画像の任意の画素の色と当該画素を前記統一線形変換式により変換した変換後画素の色との差が少ないほど評価が高くなる。
好ましくは、前記統一線形変換式確定ステップは、前記評価関数に基いて前記統一線形変換式のパラメータを決定する最適化ステップを更に含む。
好ましくは、前記入力画像の表色系を、L*a*b*表色系に変換する表色系変換ステップを更に含む。
好ましくは、前記入力画像が動画の場合、前記評価関数は相関制約項を更に含み、前記相関制約項は、前記動画のフレーム内の画素と、その直前のフレーム内の関連画素との色の差に基いて計算される。
また、本発明の別の観点によれば、コンピューターに、評価関数に基いて統一線形変換式を決定する統一線形変換式決定ステップと、前記確定した統一線形変換式を用いて前記入力画像の全ての画素の色を変換する色変換ステップと、を実行させる画像処理プログラムが提供される。
本発明に係る画像処理プログラムでは、評価関数に基いた統一線形変換式により入力画像の全ての画素の色を変換するので、障がい者が本来見える色をできるだけ保ち、区別が困難な色の違いを強調する技術でありながら、高速処理を可能とするものである。
また、本発明の別の観点によれば、入力画像を出力する入力画像源と、評価関数に基いて統一線形変換式を決定する最適化処理部と、前記決定した統一線形変換式を用いて前記入力画像の全ての画素の色を変換した支援画像を生成する支援画像生成部と、前記支援画像を表示する表示部とを備える、画像処理装置が提供される。
本発明に係る画像処理装置では、評価関数に基いた統一線形変換式により入力画像の全ての画素の色を変換するので、障がい者が本来見える色をできるだけ保ち、区別が困難な色の違いを強調する技術でありながら、高速処理を可能とするものである。
以下、本発明の実施形態について図面を参照しながら詳細に説明する。以下に示す実施形態中で示した各種特徴事項は、互いに組み合わせ可能である。また、各特徴について独立して発明が成立する。また、本明細書において「部」とは、例えば、広義の回路によって実施されるハードウェア資源と、これらのハードウェア資源によって具体的に実現されうるソフトウェアの情報処理とを合わせたものを指しうる。
[1.原理]
[1.1 色覚障がいシミュレーション技術]
代表的な色覚障がいシミュレーション技術として、非特許文献1の方法が知られている。本来、健常者が知覚できる色の範囲は三次元の空間となるが、非特許文献1の方法は、二色覚を持つ人が知覚できる色の範囲は三次元の色空間内にある二次元平面(以下二色覚平面ともいう)であると仮定し、三次元色空間内の色を二色覚平面に投影し、障がいのシミュレーション画像を得る方法である。
[1.1 色覚障がいシミュレーション技術]
代表的な色覚障がいシミュレーション技術として、非特許文献1の方法が知られている。本来、健常者が知覚できる色の範囲は三次元の空間となるが、非特許文献1の方法は、二色覚を持つ人が知覚できる色の範囲は三次元の色空間内にある二次元平面(以下二色覚平面ともいう)であると仮定し、三次元色空間内の色を二色覚平面に投影し、障がいのシミュレーション画像を得る方法である。
一般的に、画像はRGB色空間で表されることが多い。RGB色空間とは、赤(Red)、緑(Green)、青(Blue)の3つの原色を混ぜて幅広い色を再現する加法混合の一種である。一方、明度を意味する次元L*と補色次元のa*及びb*を持ち、CIEXYZ色空間の座標を非線形に圧縮したL*a*b*色空間も多く用いられる。なお、a*は赤緑系の次元であり、b*は青黄色系の次元である。RGB色空間とL*a*b*色空間の相互変換は公知の手法により簡単に実現できる。なお、本明細書、図面においては、L*a*b*色空間をLab色空間、各軸をL軸、a軸、b軸のように*を省略して記載することがある。
本実施形態では、入力画像I内の全ての画素に対して統一線形変換式を用いて色変換を行うことにより、色覚障がい者が視認し易い支援画像Rの生成を行う。そのために、まずは、「コントラスト強調」と「自然さ保存」の二つの項をもつ評価関数を用いて最適化を行うことにより、統一線形変換式のパラメータを決定する。そして得られた統一線形変換式を用いて色変換を行い、支援画像Rを得る。以下、上述した処理について詳述する。
図1A及び図1BはL*a*b*色空間における二色覚平面πの例である(非特許文献[Kuhn, G. R., et al. (2008). "An efficient
naturalness-preserving image-recoloring method for dichromats." IEEE
transactions on visualization and computer graphics 14(6): 1747-1754.]参照)。図1AはDeutanの場合であり、図1BはProtanの場合である。二色覚平面πとL-b平面(L*軸とb*軸を含む平面)との角度θはそれぞれ、Deutan:θd=-8.11°、Protan:θp=-11.48°である。Tritanについては省略したが同様に表すことができる。
naturalness-preserving image-recoloring method for dichromats." IEEE
transactions on visualization and computer graphics 14(6): 1747-1754.]参照)。図1AはDeutanの場合であり、図1BはProtanの場合である。二色覚平面πとL-b平面(L*軸とb*軸を含む平面)との角度θはそれぞれ、Deutan:θd=-8.11°、Protan:θp=-11.48°である。Tritanについては省略したが同様に表すことができる。
[1.2 処理手順]
[1.2.a Lab色空間への変換]
まず最初に、入力画像I内の全ての画素をRGB色空間からLab色空間へ変換し画像ILabを得る。ILab内の任意の画素をpiとする。
[1.2.a Lab色空間への変換]
まず最初に、入力画像I内の全ての画素をRGB色空間からLab色空間へ変換し画像ILabを得る。ILab内の任意の画素をpiとする。
[1.2.b 回転]
次に、以後の計算を簡略化するため、画像ILab内の全ての画素をL軸を中心に角度θ回転させ、新な画像IrLabを得る。画像IrLab内の任意の画素をqiとする(図2(a)参照)。piからqiへ変換する式は以下である
前述した二色覚平面πの回転後の二色覚平面をπ’とすると、二色覚平面π’はL-b平面と重なる。従ってqiのa*成分を0にすることで、qiを二色覚平面π’へ投影した画素qi-が得られる(図2(b)参照)。
次に、以後の計算を簡略化するため、画像ILab内の全ての画素をL軸を中心に角度θ回転させ、新な画像IrLabを得る。画像IrLab内の任意の画素をqiとする(図2(a)参照)。piからqiへ変換する式は以下である
前述した二色覚平面πの回転後の二色覚平面をπ’とすると、二色覚平面π’はL-b平面と重なる。従ってqiのa*成分を0にすることで、qiを二色覚平面π’へ投影した画素qi-が得られる(図2(b)参照)。
[1.2.c 統一線形変換式による色変換及び二色覚平面π’への投影]
次に、画像IrLab内の任意の画素をqiに対し統一線形変換式を用いて色変換を行い、二色覚平面π’上の画素qi+を得る(図2(c)参照)。統一線形変換式を式(2)に示す。この統一線形変換式により、二色覚平面π’への投影も行っている。
二色覚平面π’はL-b平面と重なっているので、L*成分は保存され、a*成分は0である。b*成分のみ式(2)によって変換すればよい。従って、色変換の計算が高速に実行できる。なお、式(2)において、bi+は、角度θ回転した後の画素qiのa*成分とb*成分に対しパラメータw及び1-wをかけて足し合わせたものである。このパラメータwの値は、「コントラスト強調」と「自然さ保存」の二つの項をもつ評価関数を用いて最適化を行うことにより決定する。具体的な決定方法は後述する。上記評価関数により最適化されたパラメータwを用いて色変換を行うので、本来見える色をできるだけ保ち、また区別が困難な色の違いを強調する色変換を実現することができる。
次に、画像IrLab内の任意の画素をqiに対し統一線形変換式を用いて色変換を行い、二色覚平面π’上の画素qi+を得る(図2(c)参照)。統一線形変換式を式(2)に示す。この統一線形変換式により、二色覚平面π’への投影も行っている。
二色覚平面π’はL-b平面と重なっているので、L*成分は保存され、a*成分は0である。b*成分のみ式(2)によって変換すればよい。従って、色変換の計算が高速に実行できる。なお、式(2)において、bi+は、角度θ回転した後の画素qiのa*成分とb*成分に対しパラメータw及び1-wをかけて足し合わせたものである。このパラメータwの値は、「コントラスト強調」と「自然さ保存」の二つの項をもつ評価関数を用いて最適化を行うことにより決定する。具体的な決定方法は後述する。上記評価関数により最適化されたパラメータwを用いて色変換を行うので、本来見える色をできるだけ保ち、また区別が困難な色の違いを強調する色変換を実現することができる。
[1.2.d 逆回転及びRGB色空間への逆変換]
式(2)に示す統一線形変換式を用いて二色覚平面π’上に投影された全ての画素に対し色変換が終了した後、L*軸を中心に角度-θ回転する(図2(d)参照)ことにより、支援画像RLabを得る。その後、支援画像RLab内の全ての画素をLab色空間からRGB色空間へ変換し,支援画像Rを得る。上述したように、入力画像Iの全ての画素に対し統一線形変換式を用いて変換するので、支援画像Rを高速に得ることができる。また、「コントラスト強調」と「自然さ保存」の二つの項をもつ評価関数を用いて統一線形変換式の最適化を行うため、本来見える色をできるだけ保ち、また区別が困難な色の違いを強調する色変換を実現することができる。
式(2)に示す統一線形変換式を用いて二色覚平面π’上に投影された全ての画素に対し色変換が終了した後、L*軸を中心に角度-θ回転する(図2(d)参照)ことにより、支援画像RLabを得る。その後、支援画像RLab内の全ての画素をLab色空間からRGB色空間へ変換し,支援画像Rを得る。上述したように、入力画像Iの全ての画素に対し統一線形変換式を用いて変換するので、支援画像Rを高速に得ることができる。また、「コントラスト強調」と「自然さ保存」の二つの項をもつ評価関数を用いて統一線形変換式の最適化を行うため、本来見える色をできるだけ保ち、また区別が困難な色の違いを強調する色変換を実現することができる。
[1.3 評価関数]
上述したように、式(2)のパラメータwの値は「コントラスト強調」と「自然さ保存」の二つの項をもつ評価関数を用いて最適化を行うことにより決定する。以下に評価関数Estillを示す。
ここで、Econtが「コントラスト強調」の項(特許請求の範囲における「コントラスト評価項」の一例)であり、Enatが「自然さ保存」の項(特許請求の範囲における「自然さ評価項」の一例)である。βは両者のバランスをとるための係数である。評価関数を用いて最適化するとは、評価関数Estillが最大となるパラメータwと係数βを決定することである。後述するようにEcontとEnatは、パラメータwの関数となっている。また係数βは、障がいのタイプ及び入力画像Iに応じて「コントラスト強調」と「自然さ保存」という相反する指標のバランスをとるための係数である。パラメータwと係数βの決定方法の例は後述する。
上述したように、式(2)のパラメータwの値は「コントラスト強調」と「自然さ保存」の二つの項をもつ評価関数を用いて最適化を行うことにより決定する。以下に評価関数Estillを示す。
ここで、Econtが「コントラスト強調」の項(特許請求の範囲における「コントラスト評価項」の一例)であり、Enatが「自然さ保存」の項(特許請求の範囲における「自然さ評価項」の一例)である。βは両者のバランスをとるための係数である。評価関数を用いて最適化するとは、評価関数Estillが最大となるパラメータwと係数βを決定することである。後述するようにEcontとEnatは、パラメータwの関数となっている。また係数βは、障がいのタイプ及び入力画像Iに応じて「コントラスト強調」と「自然さ保存」という相反する指標のバランスをとるための係数である。パラメータwと係数βの決定方法の例は後述する。
[1.3.1 コントラスト強調の項]
コントラスト強調の項Econtは、画像IrLab内の任意の画素ペア(qi,qj)の変換後の画素ペア(qi+,qj+)(特許請求の範囲における「変換後画素ペア」の一例)を用いて以下の式(4)のように定義される。
ここでδi,jは、色変換前画像である画像ILabにおける画素piとpjの色の差(距離)である。画素ペア集合Pの決め方としては、任意の画素qiに対して、画像から二つの画素を選んで、qiとペアにする。うち一つは、qiと隣接している画素で、もう一つは画像からランダムに選んだ画素である。
コントラスト強調の項Econtは、画像IrLab内の任意の画素ペア(qi,qj)の変換後の画素ペア(qi+,qj+)(特許請求の範囲における「変換後画素ペア」の一例)を用いて以下の式(4)のように定義される。
ここでδi,jは、色変換前画像である画像ILabにおける画素piとpjの色の差(距離)である。画素ペア集合Pの決め方としては、任意の画素qiに対して、画像から二つの画素を選んで、qiとペアにする。うち一つは、qiと隣接している画素で、もう一つは画像からランダムに選んだ画素である。
コントラスト強調の項Econt(式(4))は、入力画像Iを構成する2つの画素の全ての組合わせに対し、色変換後と色変換前の色の差(距離)の比を足し合わせたものに相当する。すなわちEcontが大きいほど、画像全体として色変換後のコントラストが強くなっていることを示す。言い換えると、Econtが大きいほど区別が困難な色の違いを強調していることになる。本実施形態では色変換後と色変換前の色の差に対し、対数ユークリッド距離(Log-Euclidean Distance)を用いることで,画像内の細かい変化も強調できるようにしている。なお、回転後の画像である画像IrLabからをδi,jを算出することも可能である。その場合は、piとpjのa*、b*成分をそれぞれqiとqjのa*、b*成分で置き換えればよい。
[1.3.2 自然さ保存の項]
自然さ保存の項Enatは、任意の画素qiの色変換後の画素qi+(特許請求の範囲における「変換後画素」の一例)と、色変換前の投影画素qi-との差を全ての画素について評価したものであり、式(5)のように定義される。
qi+とqi-との差が少ないほどEnatが大きくなり、自然さが保存されていることを示している。
自然さ保存の項Enatは、任意の画素qiの色変換後の画素qi+(特許請求の範囲における「変換後画素」の一例)と、色変換前の投影画素qi-との差を全ての画素について評価したものであり、式(5)のように定義される。
qi+とqi-との差が少ないほどEnatが大きくなり、自然さが保存されていることを示している。
[1.3.2 評価関数を用いたパラメータwの最適化]
上述したように、評価関数を用いて最適化するとは、式(2)に示す評価関数Estillの値が最大となるパラメータwと係数βを決定することである。
係数βは自然さ保存とコントラスト強調のバランスを制御する係数である。自然さ保存とコントラスト強調は相反する項目であり係数βを調整することで障がい者ごとの障がい度及び好みに応じた支援画像Rを得ることができる。一般的に、障がいによるコントラスト損失が大きい程、コントラスト強調をより重視するのがよい。このβの候補値を自動的に提案する方法については後述する。
上述したように、評価関数を用いて最適化するとは、式(2)に示す評価関数Estillの値が最大となるパラメータwと係数βを決定することである。
係数βは自然さ保存とコントラスト強調のバランスを制御する係数である。自然さ保存とコントラスト強調は相反する項目であり係数βを調整することで障がい者ごとの障がい度及び好みに応じた支援画像Rを得ることができる。一般的に、障がいによるコントラスト損失が大きい程、コントラスト強調をより重視するのがよい。このβの候補値を自動的に提案する方法については後述する。
まず、ユーザーインターフェース等を活用して、または後述する自動提案の方法により、係数βを確定する。その後にパラメータwの値を決定する。式(4)及び式(5)の計算にはbi+(またはbj+)が必要になるが、これらは式(2)によって計算される。つまり、EcontとEnatはパラメータwの関数である。すなわち、評価関数Estillが最大となるパラメータwを決定するには評価関数Estillをwで微分した微分方程式を解けばよいことがわかる。ここでは微分法定式を解く代わりに、wの値の範囲[0,1]を0.1間隔で離散化した11個のパラメタw (w=0,0.1,0.2,…,1.0)をそれぞれ式(2)に代入し,評価関数Estillが最大となるパラメータwの値を最適解とする(以下、離散探索法という)。この方法で求めたパラメータwを用いて変換した支援画像Rと微分方程式を解いて求めた支援画像Rと比べたが、ほとんど差はなかった。離散探索法は微分方程式を解くのに比べて圧倒的に処理のスピードが速いという顕著な効果を有する。
[1.3.3 係数βについて]
上述したように係数βを調整することにより好みの支援画像Rを得ることができる。ここではこのβの候補値を自動的に提案する方法について述べる。一般的に、障がいによるコントラスト損失が大きい程コントラスト強調をより重視する必要があるため、本発明ではコントラスト損失をもとにβを自動決定する方法を提案する。そこで、画像の絶対的なコントラストを評価する尺度として、公知のAverage Gradient Norm(AGN)を採用する。入力画像IのAGNを式(6)のように定義する。
ここで、Gh(i)とGv(i)は、入力画像Iの画素iについて、公知のSobelフィルタをそれぞれ横方向と縦方向に適用した値である。すなわちAGN(I)は、入力画像Iの各画素の輝度値について隣の画素との輝度差を縦方向及び横方向について計算し、その絶対値和をとることに相当する。従ってAGNの値が大きいほど、入力画像Iの絶対的なコントラストが強いと言える。
上述したように係数βを調整することにより好みの支援画像Rを得ることができる。ここではこのβの候補値を自動的に提案する方法について述べる。一般的に、障がいによるコントラスト損失が大きい程コントラスト強調をより重視する必要があるため、本発明ではコントラスト損失をもとにβを自動決定する方法を提案する。そこで、画像の絶対的なコントラストを評価する尺度として、公知のAverage Gradient Norm(AGN)を採用する。入力画像IのAGNを式(6)のように定義する。
ここで、Gh(i)とGv(i)は、入力画像Iの画素iについて、公知のSobelフィルタをそれぞれ横方向と縦方向に適用した値である。すなわちAGN(I)は、入力画像Iの各画素の輝度値について隣の画素との輝度差を縦方向及び横方向について計算し、その絶対値和をとることに相当する。従ってAGNの値が大きいほど、入力画像Iの絶対的なコントラストが強いと言える。
式(6)により、入力画像Iのコントラスト評価値(AGN(I))が計算できたので、次に入力画像Iを障がいシミュレーション画像に変換した画像Icvdのコントラスト評価値(AGN(Icvd))を求め、両者のコントラスト評価値の差(コントラスト損失)を評価し、係数βを決定する。ここで、障がいシミュレーション画像Icvdについては、非特許文献1に記載の方法で変換した画像を採用する。両者のコントラスト差を係数βに対応させるために、式(7)を定義する。
ここで、kはコントラスト評価値にどれだけ敏感に反応するかを調整するための係数である。これは画像の性質に依存せず決定できるため,ユーザーにとって調整しやすい。ここでは一例としてk=10として計算を行ったがこの値に限定されるものではない。適切なβが求まる値にすればよい。式(7)によると、入力画像Iと障がいシミュレーション画像Icvdのコントラスト評価値の差が大きいほどβは小さくなり、自然さ保存よりもコントラスト強調が重視されることがわかる。
ここで、kはコントラスト評価値にどれだけ敏感に反応するかを調整するための係数である。これは画像の性質に依存せず決定できるため,ユーザーにとって調整しやすい。ここでは一例としてk=10として計算を行ったがこの値に限定されるものではない。適切なβが求まる値にすればよい。式(7)によると、入力画像Iと障がいシミュレーション画像Icvdのコントラスト評価値の差が大きいほどβは小さくなり、自然さ保存よりもコントラスト強調が重視されることがわかる。
上述した処理により、パラメータw及び係数βが確定する。すなわち統一線形変換式が確定するので、入力画像Iに対応する支援画像Rを得ることができる。入力画像Iの全ての画素に対し統一線形変換式を適用するので、計算を高速に実行することができる。更に、評価関数により最適な統一線形変換式を決定する際にも離散探索法により、計算を高速で実行することができる。また、統一線形変換式を決定する際は、「コントラスト強調」と「自然さ保存」の二つの項をもつ評価関数を用いるので、本来見える色をできるだけ保ち、また区別が困難な色の違いを強調する色変換を実現することができる。
[1.4 動画への適用について]
これまで静止画について、支援画像Rを求める方法を説明してきた。この方法は動画に対しても有効である。一般的な動画は1秒間に30フレーム(30fps)の静止画を連続的に表示している。すなわち各フレームを構成する静止画に対し、基本的には上述した方法を適用し、逐次各フレーム毎に色変換を行えばよい。ただし、各フレーム間の時間的連続性を保つ必要があるという動画特有の特徴を加味することにより、より自然な支援動画RVを作成することができる。以下支援動画RVの作成方法の原理について説明する。
これまで静止画について、支援画像Rを求める方法を説明してきた。この方法は動画に対しても有効である。一般的な動画は1秒間に30フレーム(30fps)の静止画を連続的に表示している。すなわち各フレームを構成する静止画に対し、基本的には上述した方法を適用し、逐次各フレーム毎に色変換を行えばよい。ただし、各フレーム間の時間的連続性を保つ必要があるという動画特有の特徴を加味することにより、より自然な支援動画RVを作成することができる。以下支援動画RVの作成方法の原理について説明する。
M個のフレームから構成されている入力動画IV{IVt|t=1,・・・,M}において、同一のオブジェクトが連続する複数のフレームに含まれる場合、前後のフレームにおいて、同一オブジェクトの色は時間の経過や位置の変化によっては変化しない方が自然である。すなわち、前後のフレームにおいて同一オブジェクトを表す画素の色を変化させない必要がある。そのために動画に対応した評価関数には、関連性を持つ画素間の相関制約Etempを加えることとした。なおここでは、連続したフレーム間においてオブジェクト(画素)の動きを特定するために、公知のオプティカルフロー技術を用いている。
図3にオプティカルフローの計算例を示す。(a)は時刻t-1のフレーム画像、(b)は時刻tのフレーム画像の例である。(c)に示す線が両図間のオプティカルフローのベクトルである。ベクトルの長さは前後フレームにおける画像の移動量を表している。オプティカルフローはすべての画素に対して動きベクトルを算出する。
[1.4.1 動画の評価関数について]
オプティカルフローにより時刻tの画素pt,iと関連付けされている時刻t-1の画素をp*t-1,iとする。オブジェクトの色は時間の経過や位置の変化によっては変化しないと仮定すると,二つの画素間に関連性があるかどうかは色の差で判断することが可能である。なお、直前のフレームと関連性が持たない画素も存在するが、それらの画素に対する相関制約は不要である。画素pt,iに対する相関制約の有無のマスクをzt,iとすると、zt,iは下記の式で計算される。
ここで、Tは関連性の有無を判断するための色の差の閾値であり、縦二重線で囲まれた部分はベクトルのL2ノルムである。すなわち、関連画素のフレーム間の色の差が少ない場合、zt,i=1となり相関制約のマスク有となる。そして相関制約Etemp(特許請求の範囲における「相関制約項」の一例)は以下の式で計算される。
上述したように、前後のフレームにおいて色を変化させたくない画素については,色変換を行った後もできるだけ変化させない。式(9)をみればわかるように、フレーム間で色の差が小さい関連画素の数が多いほどマスクzt,iが1となる画素が多くなるので、Etempは小さくなり0に近づく。
オプティカルフローにより時刻tの画素pt,iと関連付けされている時刻t-1の画素をp*t-1,iとする。オブジェクトの色は時間の経過や位置の変化によっては変化しないと仮定すると,二つの画素間に関連性があるかどうかは色の差で判断することが可能である。なお、直前のフレームと関連性が持たない画素も存在するが、それらの画素に対する相関制約は不要である。画素pt,iに対する相関制約の有無のマスクをzt,iとすると、zt,iは下記の式で計算される。
ここで、Tは関連性の有無を判断するための色の差の閾値であり、縦二重線で囲まれた部分はベクトルのL2ノルムである。すなわち、関連画素のフレーム間の色の差が少ない場合、zt,i=1となり相関制約のマスク有となる。そして相関制約Etemp(特許請求の範囲における「相関制約項」の一例)は以下の式で計算される。
上述したように、前後のフレームにおいて色を変化させたくない画素については,色変換を行った後もできるだけ変化させない。式(9)をみればわかるように、フレーム間で色の差が小さい関連画素の数が多いほどマスクzt,iが1となる画素が多くなるので、Etempは小さくなり0に近づく。
式(9)の相関制約Etempを考慮した動画用評価関数Evideoを以下に示す。
動画の色変換における最適化とは、式(10)に示す動画用評価関数Evideoを最大にするパラメータwを求めることである。Etempについては、式(8)及び式(9)から、zt,i=0となる画素は式(9)のexp項が固定値”1”となるのでパラメータwには無関係である。zt,i=1となる画素では、|q+t、i―q*t-1,i|の項、すなわち前フレームと後フレームとで関連画素の色の変化が少ないほど式(9)のexp項が1に近づくので相関制約Etempが大きな値をとることがわかる。つまり、相関制約Etempが大きな値をとるパラメータwを求めることで、前フレームと後フレームとで関連画素の色の変化が少なくなる。
ここで、係数βは、入力動画IVに応じて「コントラスト強調」と「自然さ保存」という相反する指標のバランスをとるための係数であり、係数γは相関制約とのバランスをとるための係数である。なお、動画の最初のフレーム画像の変換のみ、相関制約Etempを0とした、または、係数γを0とした評価関数Evideoを用いる。
動画の色変換における最適化とは、式(10)に示す動画用評価関数Evideoを最大にするパラメータwを求めることである。Etempについては、式(8)及び式(9)から、zt,i=0となる画素は式(9)のexp項が固定値”1”となるのでパラメータwには無関係である。zt,i=1となる画素では、|q+t、i―q*t-1,i|の項、すなわち前フレームと後フレームとで関連画素の色の変化が少ないほど式(9)のexp項が1に近づくので相関制約Etempが大きな値をとることがわかる。つまり、相関制約Etempが大きな値をとるパラメータwを求めることで、前フレームと後フレームとで関連画素の色の変化が少なくなる。
ここで、係数βは、入力動画IVに応じて「コントラスト強調」と「自然さ保存」という相反する指標のバランスをとるための係数であり、係数γは相関制約とのバランスをとるための係数である。なお、動画の最初のフレーム画像の変換のみ、相関制約Etempを0とした、または、係数γを0とした評価関数Evideoを用いる。
[2.第一実施形態]
図4は、本発明の一実施形態に係る表示装置1のブロック図である。表示装置1は、静止画である入力画像Iの支援画像Rを表示する装置であり、入力画像源2と、画像処理部3と、表示部4と、入力部5とを備える。
図4は、本発明の一実施形態に係る表示装置1のブロック図である。表示装置1は、静止画である入力画像Iの支援画像Rを表示する装置であり、入力画像源2と、画像処理部3と、表示部4と、入力部5とを備える。
入力画像源2は支援画像Rの元となる入力画像Iを出力し、表示装置1の画像処理部3における送受信部33(詳細は後述)に送信する。入力画像源2は、例えば、撮像装置(カメラ等)のように外界の状況を画像化するものでもよいし、メモリや光学ディスク等に記録された画像を再生する再生装置であってもよい。また、放送電波やインターネットなどから静止画や画像を取得する装置でもよい。この入力画像は、2次元の画素の集合体であり、様々な公知のフォーマットでコーディングされていてかまわない。また、図4では入力画像源2が表示装置1に含まれるように図示されているが、これに限らず入力画像源2が表示装置1とは別体の、一般的なコンピュータや携帯型端末、再生装置であってもよい。
画像処理部3は、入力画像源2により入力された入力画像Iに対して所定の画像処理を実行する。画像処理部3は、制御部31と、記憶部32と、送受信部33と、Lab変換部34と、最適化処理部37と、回転部38、支援画像生成部39とを備え、これらが通信バス300を介して接続されている。
制御部31は、表示装置1及び画像処理部3に関連する全体動作の処理・制御を行う。制御部31は、例えばCPU(Central Processing Unit)で構成されている。制御部31は、記憶部32に記憶された所定のプログラムを読み出すことによって、画像処理部3ないしは表示装置1に係る種々の機能を実現する。例えば、所定のプログラムを読み出して、出力画像を視覚障がい者のための支援画像に切り替えるか否かのグラフィカルユーザーインターフェース(Graphical User Interface:GUI)に係る画面を表示部4に表示させることが含まれる。なお、図4においては、単一の制御部31として表記されているが、実際はこれに限るものではなく、機能ごとに複数の制御部31を有するように実施してもよい。またそれらの組合せであってもよい。
記憶部32は、制御部31が実行する種々のプログラム等を記憶する。これは、例えばROM(Read Only Memory)、フラッシュメモリ、ハードディスクドライブ(Hard Disk Drive:HDD)またはソリッドステートドライブ(Solid State Drive:SSD)等である。また記憶部32は、プログラムの演算に係る一時的に必要な情報(引数、配列等)、及び、画像処理部3の各構成要素が実行する画像処理における一時的な保持データや各構成要素間の引き渡しデータ等を記憶するRAM(Random Access Memory)も含んでいる。
送受信部33は、画像処理部3と、画像処理部3以外の構成要素(表示装置1の外部の機器も含む)との通信のためのユニットである。送受信部33は、入力画像源2より入力画像Iの画像データを受信する。画像データがコーディングされている場合、デコードを行う。また、送受信部33は、画像処理した結果の出力画像を表示部4に送信する。また、送受信部33は、入力部5から入力された所定の指令信号を受信し、制御部31へ出力する。なお、送受信部33による画像処理部3の外部との通信は、図示しないバスを介して実行してもよいし、有線LANネットワーク通信、無線LANネットワーク通信、近距離無線通信等の適切な通信規格により実行してもよい。
Lab変換部34は、入力画像源2が出力する入力画像Iを送受信部33を経由して取得し、入力画像I内のすべての画素をRGB色空間からLab色空間へ変換し画像ILabを出力する。回転部38は、式(1)に基いて、画像ILab内のすべての画素をL軸を中心に角度θ回転させ、新たな画像IrLabを出力する(図2(a)参照)。最適化処理部37は、式(3)に示す評価関数Estillを用いて最適化を行うことにより、統一線形変換式(式(2))を決定する。支援画像生成部39は、統一線形変換式を用いて画像IrLab上の全ての画素に対し色変換を行い、二色覚平面π’に投影する。色変換を行った後、回転部38は二色覚平面π’上の画素を角度-θ回転を行う(図2(d)参照)。最後にLab変換部34により、Lab色空間からRGB色空間へ変換し、支援画像Rを出力する。送受信部33は、支援画像Rを表示部4へ出力する。
表示部4は、画像処理部3によって画像処理された画像データが入力されると、各ピクセルデータ(各ピクセルが有する輝度等の情報)に基づいてこれを映像として表示する媒体であり、例えばLCDモニタ、CRTモニタ、有機ELモニタ、プロジェクター、ヘッドマウントディスプレー等であってよい。具体的には、画像処理部3における支援画像生成部39から出力された支援画像Rが通信バス300及び送受信部33を介して表示部4に送信され、表示部4が当該支援画像Rを表示する。なお、図4に示されるように表示装置1として画像処理部3と表示部4とが一体的に実施されてもよいが別体であってもよい。
入力部5は、例えば、表示装置1自体に含まれるものであってもよいし、外付けされるものであってもよい。例えば、入力部5は、タッチパネルとして実装されうる。或いは、スイッチボタン、マウス、キーボード等のユーザーインターフェースを採用してもよい。表示装置1は入力部5を介して、操作者の指示(コマンド)を受け付ける。当該指示は、通信バス300を介して制御部31に転送され、制御部31が必要に応じて所定の制御や演算を実行しうる。当該指示の一例として、操作者は、入力部5を介して、表示部4に表示させる画像を支援画像とするか否かを選択することができる。また、支援画像を生成する際のパラメータを指定することもできる。
図5は、第一実施形態の画像処理部3の色変換処理を表すフローチャートである。
まず、Lab変換部34が入力画像源2から取得した入力画像Iの全ての画素をRGB色空間からLab色空間へ変換する(S100)。S100ステップが特許請求の範囲における「表色系変換ステップ」の一例である。次に、回転部38が全ての画素をL軸を中心に角度θ回転する(S105)。次に、最適化処理部37が、式(3)に示す評価関数Estillを用いて式(2)に示す統一線形変換式を決定する(S115)。S115ステップが特許請求の範囲における「統一線形変換式決定ステップ」の一例である。図6にこの統一線形変換式の決定処理のフローチャートを示す。その詳細は後述する。次に、支援画像生成部39がS115ステップにて決定した統一線形変換式を用いて全ての画素の色を変換し、二色覚平面π’へ投影する(S120)。S120ステップが特許請求の範囲における「色変換ステップ」の一例である。次に、回転部38が全ての画素をL軸を中心に角度θ逆回転する(S125)。最後に、Lab変換部34が全ての画素をLab色空間からRGB色空間へ変換して支援画像Rを得る(S130)。なお、「色変換ステップ」はS125ステップ、S130ステップを含んでも良い。
まず、Lab変換部34が入力画像源2から取得した入力画像Iの全ての画素をRGB色空間からLab色空間へ変換する(S100)。S100ステップが特許請求の範囲における「表色系変換ステップ」の一例である。次に、回転部38が全ての画素をL軸を中心に角度θ回転する(S105)。次に、最適化処理部37が、式(3)に示す評価関数Estillを用いて式(2)に示す統一線形変換式を決定する(S115)。S115ステップが特許請求の範囲における「統一線形変換式決定ステップ」の一例である。図6にこの統一線形変換式の決定処理のフローチャートを示す。その詳細は後述する。次に、支援画像生成部39がS115ステップにて決定した統一線形変換式を用いて全ての画素の色を変換し、二色覚平面π’へ投影する(S120)。S120ステップが特許請求の範囲における「色変換ステップ」の一例である。次に、回転部38が全ての画素をL軸を中心に角度θ逆回転する(S125)。最後に、Lab変換部34が全ての画素をLab色空間からRGB色空間へ変換して支援画像Rを得る(S130)。なお、「色変換ステップ」はS125ステップ、S130ステップを含んでも良い。
図6は最適化処理部37がS110にて実行する統一線形変換式の決定処理のフローチャートである。まず、係数βを決定する(S200)。係数βを決定するには式(6)及び式(7)により自動的に求めてもよいし、本実施形態の表示装置1のユーザーがあらかじめ入力しておいてもかまわない。ユーザーは支援画像Rを見てから係数βの値を再設定することにより支援画像Rの画質を再調整することもできる。S205、S210、S215、S220の一連の処理は、評価関数Estillを最大にするパラメータwを求めるための処理(離散探索法。特許請求の範囲における「最適化ステップ」の一例。)である。パラメータwの値を、0から1まで0.1刻みで式(2)に代入し色変換を行い評価関数Estillを計算する。次に、順次計算した評価関数Estillの値を比較し、評価関数Estillが最大となるパラメータwの値を決定する(S230)。最後に、S200で決定した係数βとS230で決定したパラメータwにより統一線形変換式を決定する(S235)。
本第一実施形態によれば、入力画像Iの全ての画素に対し、統一線形変換式を適用するので、計算を高速に実行することができる。更に、評価関数により最適な統一線形変換式を決定する際にも離散探索法を用いることにより、計算を高速で実行することができる。また、統一線形変換式を決定する際は、「コントラスト強調」と「自然さ保存」の二つの項をもつ評価関数を用いるので、本来見える色をできるだけ保ち、また区別が困難な色の違いを強調する色変換を実現することができる。
[3.第二実施形態]
図7は第二実施形態に係る表示装置10のブロック図である。第一実施形態が静止画の色変換により支援画像を得るのに対し、第二実施形態は動画の色変換により支援動画を得る。なお、以下では、第二実施形態に係る表示装置10における第一実施形態に係る表示装置1と同様の部分については同一の符号を付してある。また、その説明を省略することがある。
図7は第二実施形態に係る表示装置10のブロック図である。第一実施形態が静止画の色変換により支援画像を得るのに対し、第二実施形態は動画の色変換により支援動画を得る。なお、以下では、第二実施形態に係る表示装置10における第一実施形態に係る表示装置1と同様の部分については同一の符号を付してある。また、その説明を省略することがある。
表示装置10は、動画である入力動画IVの支援動画RVを表示する装置であり、入力画像源20と、画像処理部30と、表示部4と、入力部5とを備える。入力画像源20は支援動画RVの元となる入力動画IVを出力し、表示装置10の画像処理部30における送受信部330(詳細は後述)に送信する。入力画像源20は、例えば、撮像装置(カメラ等)のように外界の状況を動画化するものでもよいし、メモリや光学ディスク等に記録された動画を再生する再生装置であってもよい。また、放送電波やインターネットなどから動画を取得する装置でもよい。この入力動画IVは複数のフレーム画像(2次元の画素の集合体であり、例えばRGB色空間で表されている)で構成されている。入力動画IVは様々な公知のフォーマットでコーディングされていてかまわない。また、図7では入力画像源20が表示装置1に含まれるように図示されているが、これに限らず入力画像源20が表示装置10とは別体の、一般的なコンピュータや携帯型端末であってもよい。
画像処理部30は、入力画像源20により入力された入力動画IVに対して所定の画像処理を実行する。画像処理部30は、制御部310と、記憶部320と、送受信部330と、Lab変換部34と、最適化処理部37と、回転部38、支援画像生成部39と、オプティカルフロー計算部350とを備え、これらが通信バス300を介して接続されている。
制御部310は、表示装置10及び画像処理部30に関連する全体動作の処理・制御を行う。制御部310は、例えばCPU(Central Processing Unit)で構成されている。制御部310は、記憶部320に記憶された所定のプログラムを読み出すことによって、画像処理部30ないしは表示装置10に係る種々の機能を実現する。例えば、所定のプログラムを読み出して、出力動画を視覚障がい者のための支援動画に切り替えるか否かのグラフィカルユーザーインターフェース(Graphical User Interface:GUI)に係る画面を表示部4に表示させることが含まれる。なお、図7においては、単一の制御部310として表記されているが、実際はこれに限るものではなく、機能ごとに複数の制御部310を有するように実施してもよい。またそれらの組合せであってもよい。
記憶部320は、制御部310が実行する種々のプログラム等を記憶する。これは、例えばROM(Read Only Memory)、フラッシュメモリ、ハードディスクドライブ(Hard Disk Drive:HDD)またはソリッドステートドライブ(Solid State Drive:SSD)等である。また記憶部320は、プログラムの演算に係る一時的に必要な情報(引数、配列等)、及び、画像処理部30の各構成要素が実行する画像処理における一時的な保持データや各構成要素間の引き渡しデータ等を記憶するRAM(Random Access Memory)も含んでいる。このRAMには入力動画IVのフレーム画像が保存され、以下で詳述する各構成要素の画像処理に使用される。また、支援動画RVのフレーム画像も保存される。なお、入力動画IVまたは支援動画RVのフレーム画像は、HDDやSSDなどに保存されてもかまわない。
送受信部330は、画像処理部30と、画像処理部30以外の構成要素(表示装置10の外部の機器も含む)との通信のためのユニットである。送受信部330は、入力画像源20より入力動画IVを受信し、当該入力動画IVのフレーム画像を画像処理部30の各構成要素からの要求に応じて出力する。その際必要に応じて、フレーム画像の圧縮等を解除し、色空間をRGB色空間に変換して出力する。また、送受信部330は、画像処理した結果のフレーム画像を出力動画RMのフレーム画像として表示部4に送信する。また、送受信部330は、入力部5から入力された所定の指令信号を受信し、制御部310へ出力する。なお、送受信部330による画像処理部30の外部との通信は、図示しないバスを介して実行してもよいし、有線LANネットワーク通信、無線LANネットワーク通信、近距離無線通信等の適切な通信規格により実行してもよい。
Lab変換部34は、送受信部330が出力する入力動画IVのフレーム画像を取得し、当該フレーム画像内のすべての画素をRGB色空間からLab色空間へ変換しフレーム画像ILabを出力する。回転部38は、式(1)に基いて、フレーム画像ILab内のすべての画素をL軸を中心に角度θ回転させ、新たな画像IrLabを出力する(図2(a)参照)。オプティカルフロー計算部350は、時刻tのフレーム画像の画素pt,iと関連付けされている時刻t-1の画素p*t-1,iとの間の移動ベクトル(オプティカルフロー)を計算し、マスクzt,iを求める。最適化処理部37は、式(10)に示す評価関数Evideoを用いて最適化を行うことにより、式(2)に示す統一線形変換式を決定する。なお、動画の最初のフレーム画像の場合は、式(10)の係数γ、または、相関制約Etempを0とした評価関数Evideoを用いる。支援画像生成部39は、統一線形変換式を用いて全ての画素に対し色変換を行い、二色覚平面π’上に投影する。色変換を行った後、回転部38は二色覚平面π’上の画素を角度-θ回転を行う(図2(d)参照)。最後にLab変換部34により、Lab色空間からRGB色空間へ変換し、支援動画RVのフレーム画像を出力する。表示部4は、送受信部330を経由して取得した支援動画RVを表示する。なお、上述した一連のフレーム画像の処理は、一般的な動画のフレームレートである30fpsのタイミングに合わせて実行すれば、支援動画RVは自然な動画として表示装置4に表示される。または、上述した一連のフレーム画像の処理をフレームレートとは非同期で実行し、全てまたは一部のフレーム画像を記憶部320に保存した後、順次送受信部330を介して表示部4に表示してもよい。
表示部4は、画像処理部30によって画像処理された画像データが入力されると、各ピクセルデータ(各ピクセルが有する輝度等の情報)に基づいてこれを映像として表示する媒体であり、例えばLCDモニタ、CRTモニタ、有機ELモニタ、プロジェクター、ヘッドマウントディスプレー等であってよい。具体的には、画像処理部30における支援画像生成部39から出力された支援動画が通信バス300及び送受信部330を介して表示部4に送信され、表示部4が当該支援動画を表示する。なお、図7に示されるように表示装置10として画像処理部30と表示部4とが一体的に実装されてもよいが別体であってもよい。
入力部5は、例えば、表示装置10自体に含まれるものであってもよいし、外付けされるものであってもよい。例えば、入力部5は、タッチパネルとして実装されうる。或いは、スイッチボタン、マウス、キーボード等のユーザーインターフェースを採用してもよい。入力部5を介して、操作者の指示(コマンド)を受け付ける。当該指示は、通信バス300を介して制御部310に転送され、制御部310が必要に応じて所定の制御や演算を実行しうる。当該指示の一例として、操作者は、入力部5を介して、表示部4に表示させる動画を支援動画とするか否かを選択することができる。また、支援動画を生成する際のパラメータを指定することもできる。
図8は、第二実施形態の画像処理部30の動画処理を表すフローチャートである。まず、送受信部330から入力動画IVの最初のフレーム画像を取得する(S500)。次に画像処理部30が取得したフレーム画像に動画用色変換処理(詳細については後述する)を実行し、支援動画RVとしての色変換後のフレーム画像を得る(S505)。次に当該色変換後のフレーム画像を表示装置に出力する(S510)。次に当該フレームが最後のフレームかどうかを判断し(S515)、最後のフレームであれば処理を終了する。最後のフレームでなければ次のフレーム画像を取得し、S505の処理を実行する(S520)。なお、一連の処理は、一般的な動画のフレームレートである30fpsのタイミングに合わせて実行されてもよいし、フレームレートとは非同期に実行されてもよい。
図9は、第二実施形態の画像処理部30の動画用色変換処理を表すフローチャートである。 まず、Lab変換部34が、取得した入力動画IVのフレーム画像の全ての画素をRGB色空間からLab色空間へ変換する(S600)。次に、回転部38が全ての画素をL軸を中心に角度θ回転する(S605)。次に、オプティカルフロー計算部350が、現在のフレームと直前のフレーム間の関連画素に対するオプティカルフローを計算しマスクzt,iを求める(S615)。次に、最適化処理部37が、式(3)に示す評価関数Evideoを用いて式(2)に示す動画用統一線形変換式を決定する(S620)。S620ステップが特許請求の範囲における「統一線形変換式決定ステップ」の一例である。図10にこの動画用統一線形変換式の決定処理のフローチャートを示す。その詳細は後述する。次に、支援画像生成部39がS620ステップにて決定した動画用統一線形変換式を用いて全ての画素の色を変換し、二色覚平面π’へ投影する(S625)。S625ステップが特許請求の範囲における「色変換ステップ」の一例である。次に、回転部38が全ての画素をL軸を中心に角度θ逆回転する(S630)。最後に、Lab変換部34が全ての画素をLab色空間からRGB色空間へ変換して支援画像RVのフレーム画像を得る(S635)。なお、「色変換ステップ」はS630ステップ、S635ステップを含んでも良い。
図10は最適化処理部37がS620ステップにて実行する動画用統一線形変換式の決定処理のフローチャートである。まず、係数βとγを決定する(S700)。係数βを決定するには式(6)及び式(7)により自動的に求めてもよいし、本実施形態の表示装置10のユーザーがあらかじめ入力しておいてもかまわない。ユーザーは支援動画RVを見てから係数βとγの値を再設定することにより支援画像RVの画質を再調整することもできる。S705、S710、S715、S720の一連の各ステップの処理は、評価関数Evideoを最大にするパラメータwを求めるための処理である。パラメータwの値を、0から1まで0.1刻みで式(2)に代入し色変換を行い評価関数Evideoを計算する(離散探索法)。次に、順次計算した評価関数Evideoの値を比較し、評価関数Evideoが最大となるパラメータwの値を決定する(S730)。なお、動画の最初のフレーム画像の変換は、係数γ、または、相関制約Etempを0とした評価関数Evideoを用いる。最後に、S700で決定した係数β、γとS730で決定したパラメータwにより動画用統一線形変換式を決定する(S735)。
本第二実施形態によれば、入力動画IVのフレーム画像の全ての画素に対し、動画用統一線形変換式を適用するので、計算を高速に実行することができる。更に、動画用評価関数により最適な動画用統一線形変換式を決定する際にも離散探索法を用いることにより、計算を高速で実行することができる。また、動画用統一線形変換式を決定する際は、「コントラスト強調」と、「自然さ保存」と、「相関制約」の三つの項をもつ動画用評価関数を用いるので、本来見える色をできるだけ保ち、また区別が困難な色の違いを強調でき、かつフレーム間のつながりに違和感のない自然な支援動画を実現することができる。
[4.評価]
[4.1 官能評価]
本発明の色変換の官能評価を実施した。非特許文献2、非特許文献3及び特許文献1に記載の方法で色変換した支援画像と、本発明の方法で色変換した支援画像を、色覚障がいを持つ被験者7人(Protan:4名、Deutan:3名)に比較してもらい、区別が困難な色の違いを強調できているか(コントラスト強調官能評価)、自然な画像であるか(自然さ官能評価)について官能評価を実施した。具体的には、Protan用とDeutan用それぞれ10枚(うち数枚ProtanとDeutanの両方に使用)の画像に対し、上記4つの方法で色変換した支援画像を被験者に評価してもらった。コントラスト強調官能評価では、1枚の画像に対して元画像と比べ、次のような評価点数をつけてもらった。
「+1」:元画像よりコントラストが強調された。
「 0」:元画像と変わらない。
「-1」:元画像よりコントラストが弱まった。
その結果を表1に示す。表の数値は各被験者の評価点数の平均値である。表1の値が高いほど画像のコントラストがより強く、区別が困難な色の違いを強調できていることを示している。
本評価の結果より本発明の色変換方法は、Protanに対しては特許文献1の方法より劣るが他の方法に比べてよい結果となっていることがわかる。
[4.1 官能評価]
本発明の色変換の官能評価を実施した。非特許文献2、非特許文献3及び特許文献1に記載の方法で色変換した支援画像と、本発明の方法で色変換した支援画像を、色覚障がいを持つ被験者7人(Protan:4名、Deutan:3名)に比較してもらい、区別が困難な色の違いを強調できているか(コントラスト強調官能評価)、自然な画像であるか(自然さ官能評価)について官能評価を実施した。具体的には、Protan用とDeutan用それぞれ10枚(うち数枚ProtanとDeutanの両方に使用)の画像に対し、上記4つの方法で色変換した支援画像を被験者に評価してもらった。コントラスト強調官能評価では、1枚の画像に対して元画像と比べ、次のような評価点数をつけてもらった。
「+1」:元画像よりコントラストが強調された。
「 0」:元画像と変わらない。
「-1」:元画像よりコントラストが弱まった。
その結果を表1に示す。表の数値は各被験者の評価点数の平均値である。表1の値が高いほど画像のコントラストがより強く、区別が困難な色の違いを強調できていることを示している。
本評価の結果より本発明の色変換方法は、Protanに対しては特許文献1の方法より劣るが他の方法に比べてよい結果となっていることがわかる。
自然さ官能評価では、1枚の画像に対して、次のような評価点数をつけてもらった。
「1」:自然に見える
「0」:違和感を感じる(自然に見えない)
その結果を表2に示す。表の数値は各被験者の評価点数の平均値である。表2の値が高いほど画像がより自然に見えることを示している。
本評価の結果より本発明の色変換の方法は、他の方法に比べてより自然に見えることが分かる。
「1」:自然に見える
「0」:違和感を感じる(自然に見えない)
その結果を表2に示す。表の数値は各被験者の評価点数の平均値である。表2の値が高いほど画像がより自然に見えることを示している。
本評価の結果より本発明の色変換の方法は、他の方法に比べてより自然に見えることが分かる。
[4.1 自然さ客観評価]
図11a、図11b、図11c、図11dに示す入力画像に対し、公知のStructural Similarity(SSIM)評価尺度による自然さ客観評価を行った。前述の自然さ官能評価とは異なり、客観的な評価である。その結果を表3に示す。SSIM値が高いほど,画像がより自然であることを示している。
本評価の結果より本発明の色変換は従来技術に比べてより自然であることがわかる。
図11a、図11b、図11c、図11dに示す入力画像に対し、公知のStructural Similarity(SSIM)評価尺度による自然さ客観評価を行った。前述の自然さ官能評価とは異なり、客観的な評価である。その結果を表3に示す。SSIM値が高いほど,画像がより自然であることを示している。
本評価の結果より本発明の色変換は従来技術に比べてより自然であることがわかる。
以上の評価結果から、本来見える色をできるだけ保つことで自然でかつ区別が困難な色の違いを強調した支援画像を得ることができるという効果を有することがわかる。また、動画に対しても色変換が可能であり、しかもフレーム間の不自然さが少ない。また、本発明の色変換は、入力画像の全ての画素に対し、統一線形変換式を適用するので、計算を高速に実行することができる。更に本発明は、スマートフォンやテレビなどに実装可能な技術であるので、色覚障がい者のクオリティ・オブ・ライフを向上させることができる。
[5.変形例]
上述した実施形態は本発明を実施するための一例であり、他にも種々の実施形態を採用可能である。例えば、支援画像Rまたは支援動画RVは、表示部4に表示するだけでなく、外部の記憶媒体に保存したり、ネットワークを通じて外部に送信したりしてもよい。また、支援画像Rまたは支援動画RVは、記憶部32または記憶部320に保存しておき、入力部5を介した操作者の指示により、当該保存した支援画像Rまたは支援動画RVを表示部4に表示することもできる。
上述した実施形態は本発明を実施するための一例であり、他にも種々の実施形態を採用可能である。例えば、支援画像Rまたは支援動画RVは、表示部4に表示するだけでなく、外部の記憶媒体に保存したり、ネットワークを通じて外部に送信したりしてもよい。また、支援画像Rまたは支援動画RVは、記憶部32または記憶部320に保存しておき、入力部5を介した操作者の指示により、当該保存した支援画像Rまたは支援動画RVを表示部4に表示することもできる。
上述した評価関数や統一線形変換式、またはそれらのパラメータや係数の決め方は、一例であり目的を達成するものであれば他の式や決定方法を採用してもかまわない。例えば、評価関数は上述した評価項以外の評価項を備えていてもかまわない。
上述した実施形態において、入力画像I、入力動画IV、支援画像R及び支援動画RV(それぞれのフレーム画像も含む)はRGB色空間で表されるとしたが、他の色空間を採用してもかまわない。
1…表示装置、2…入力画像源、3…画像処理部、4…表示部、5…入力部、10…表示装置、31…制御部、32…記憶部、33…送受信部、34…Lab変換部、37…最適化処理部、38…回転部、39…支援画像生成部、300…バス、310…制御部、320…記憶部、330…送受信部、350・・・オプティカルフロー計算部
Claims (17)
- 入力画像の画素の色を変換する画像処理方法であって、
評価関数に基いて統一線形変換式を決定する統一線形変換式決定ステップと、
前記決定した統一線形変換式を用いて前記入力画像の全ての画素の色を変換する色変換ステップと、
を備える画像処理方法。 - 前記評価関数は、コントラスト強調の度合いを評価するコントラスト評価項と、
自然さを評価する自然さ評価項とを含む、請求項1に記載の画像処理方法。 - 前記コントラスト評価項は、前記入力画像の任意の画素ペア間の距離と、当該任意の画素ペアを前記統一線形変換式により変換した変換後画素ペア間の距離との差が大きいほど評価が高くなる、請求項2に記載の画像処理方法。
- 前記自然さ評価項は、前記入力画像の任意の画素の色と当該画素を前記統一線形変換式により変換した変換後画素の色との差が少ないほど評価が高くなる、請求項2または請求項3に記載の画像処理方法。
- 前記統一線形変換式確定ステップは、前記評価関数に基いて前記統一線形変換式のパラメータを決定する最適化ステップを更に含む、請求項1乃至請求項4のいずれか一項に記載の画像処理方法。
- 前記入力画像の表色系を、L*a*b*表色系に変換する表色系変換ステップを更に含む、請求項1乃至請求項5のいずれか一項に記載の画像処理方法。
- 前記入力画像が動画の場合、前記評価関数は相関制約項を更に含む、請求項2乃至請求項6のいずれか一項に記載の画像処理方法。
- 前記相関制約項は、前記動画のフレーム内の画素と、その直前のフレーム内の関連画素との色の差に基いて計算される、請求項7に記載の画像処理方法。
- コンピューターに、
評価関数に基いて統一線形変換式を決定する統一線形変換式決定ステップと、
前記決定した統一線形変換式を用いて前記入力画像の全ての画素の色を変換する色変換ステップと、
を実行させる画像処理プログラム。 - 入力画像を出力する入力画像源と、
評価関数に基いて統一線形変換式を決定する最適化処理部と、
前記決定した統一線形変換式を用いて前記入力画像の全ての画素の色を変換した支援画像を生成する支援画像生成部と、
前記支援画像を表示する表示部と、
を備える、画像処理装置。 - 前記評価関数は、コントラスト強調の度合いを評価するコントラスト評価項と、
自然さを評価する自然さ評価項とを含む、請求項10に記載の画像処理装置。 - 前記コントラスト評価項は、前記入力画像の任意の画素ペア間の距離と、当該任意の画素ペアを前記統一線形変換式により変換した変換後画素ペア間の距離との差が大きいほど評価が高くなる、請求項11に記載の画像処理装置。
- 前記自然さ評価項は、前記入力画像の任意の画素の色と当該画素を前記統一線形変換式により変換した変換後画素の色との差が少ないほど評価が高くなる、請求項10または請求項11に記載の画像処理装置。
- 前記最適化処理部は、前記評価関数に基いて前記統一線形変換式のパラメータを決定する、請求項10乃至請求項13のいずれか一項に記載の画像処理装置。
- 前記入力画像の表色系を、L*a*b*表色系に変換するLab変換部を更に含む、請求項10乃至請求項14のいずれか一項に記載の画像処理装置。
- 前記入力画像が動画の場合、前記評価関数は相関制約項を更に含む、請求項11乃至請求項15のいずれか一項に記載の画像処理装置。
- 前記相関制約項は、前記動画のフレーム内の画素と、その直前のフレーム内の関連画素との色の差に基いて計算される、請求項16に記載の画像処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020117905A JP2022015209A (ja) | 2020-07-08 | 2020-07-08 | 画像処理方法、画像処理プログラム、及び表示装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020117905A JP2022015209A (ja) | 2020-07-08 | 2020-07-08 | 画像処理方法、画像処理プログラム、及び表示装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022015209A true JP2022015209A (ja) | 2022-01-21 |
Family
ID=80120625
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020117905A Pending JP2022015209A (ja) | 2020-07-08 | 2020-07-08 | 画像処理方法、画像処理プログラム、及び表示装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2022015209A (ja) |
-
2020
- 2020-07-08 JP JP2020117905A patent/JP2022015209A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Duan et al. | Perceptual quality assessment of omnidirectional images | |
US9934575B2 (en) | Image processing apparatus, method and computer program to adjust 3D information based on human visual characteristics | |
RU2668408C2 (ru) | Устройства, системы и способы виртуализации зеркала | |
CN106682632B (zh) | 用于处理人脸图像的方法和装置 | |
Dong et al. | Human visual system-based saliency detection for high dynamic range content | |
CN110248242B (zh) | 一种图像处理和直播方法、装置、设备和存储介质 | |
JP5086711B2 (ja) | 映像表示装置 | |
CN114979689B (zh) | 多机位直播导播方法、设备以及介质 | |
CN112967193A (zh) | 图像校准方法及装置、计算机可读介质和电子设备 | |
Li | (Retracted) Infrared image filtering and enhancement processing method based upon image processing technology | |
Poreddy et al. | BVRIQE: A completely blind no reference virtual reality image quality evaluator | |
JP2022015209A (ja) | 画像処理方法、画像処理プログラム、及び表示装置 | |
Li et al. | State-of-the-art in 360 {\deg} Video/Image Processing: Perception, Assessment and Compression | |
CN104036459A (zh) | 一种具有图像真实感再现的局部色调映射方法 | |
CN110728630A (zh) | 基于增强现实的互联网图像处理方法及增强现实眼镜 | |
WO2022230253A1 (ja) | 情報処理装置及び情報処理方法 | |
JP5303399B2 (ja) | 動画像ビット深度削減装置及びプログラム | |
Tai et al. | Underwater image enhancement through depth estimation based on random forest | |
WO2020233536A1 (zh) | Vr视频质量评估方法及装置 | |
CN110060291B (zh) | 一种考虑人因的立体视在距离解算方法 | |
Chen et al. | Subjective and Objective Quality Assessment of Rendered Human Avatar Videos in Virtual Reality | |
Feng et al. | Visual Perception Based Blind Stereoscopic Omnidirectional Video Quality Assessment | |
Cyriac et al. | Perceptual dynamic range for in-camera image processing. | |
Hu et al. | Spatio-Temporal Feature Integration for Quality Assessment of Stitched Omnidirectional Images | |
Gu et al. | Quality Assessment of Virtual Reality Images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230609 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240202 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240305 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20240828 |