JP2020126563A

JP2020126563A - 視認性評価装置、視認性評価プログラムおよび視認性評価方法

Info

Publication number: JP2020126563A
Application number: JP2019020152A
Authority: JP
Inventors: 寛惠榎; Hiroe Enoki; 裕治太田; Yuji Ota
Original assignee: Enoki Hiroe
Current assignee: Enoki Hiroe
Priority date: 2019-02-06
Filing date: 2019-02-06
Publication date: 2020-08-20
Anticipated expiration: 2039-02-06
Also published as: JP6616536B1

Abstract

【課題】視認性を評価する技術を提供する。【解決手段】代表的な本発明の視認性評価装置の一つは、視認性の評価対象とする画像を被検画像として取得する取得部と、被検画像を異なるぼかし量で処理して複数のぼかし画像を生成する処理部と、ぼかし画像について画像認識の試験を行って試験結果を取得する試験部と、試験結果に基づいて画像認識が妥当となる限界のぼかし量を求め、限界のぼかし量に応じた値を視認性の評価値（以下「認識容易度」）とする判定部とを備える。【選択図】図１

Description

本発明は、視認性評価装置、視認性評価プログラムおよび視認性評価方法に関する。

神経膠腫（グリオーマ）などの脳腫瘍の摘出手術では、脳腫瘍を正確に摘出することによって、患者の５年生存率が高まることが知られている。そのため、脳腫瘍の摘出手術では、正常な脳部位と異常な腫瘍部位とを区別するために、脳機能マッピングという検査が行われる。

この脳機能マッピングでは、手術者が、患者の脳表面の局所部位に弱い電気刺激を与えながら、覚醒下の患者に対して局所部位の脳機能に係わるタスクを与える。

局所的な電気刺激にかかわらず患者がタスクを実行できた場合、その局所部位は、タスクと無関係な部位（腫瘍部位の可能性大）であると判断される。

一方、局所的な電気刺激によって患者がタスクを実行できない場合、その局所部位は、実行不能になったタスクに必要な脳部位（正常部位の可能性大）であると判断される。
このようなタスクの一つに、画像カードを提示して、絵柄の名称を回答してもらうネーミングタスクがある。

このネーミングタスクにおいては、画像によって患者が回答に迷うケースが散見される。その場合、正常部位か腫瘍部位かを即断することは難しい。そのため、手術者は、慎重を期して質問を繰り返すなど、脳機能マッピングに時間がかかっていた。
このような理由から、脳機能マッピングの確実性と効率性を高めるため、ネーミングタスクに使用する画像として、名称を即座に回答できる画像を術前に選択しておくことが重要になる。

なお、非特許文献１には「画像から想起される名称のバリエーションが多いほど、どの名称を回答すべきか迷い、回答時間が長くなる」旨の知見が開示される。

Nishimoto Takehiko「Japanese normative set of 359 pictures」 Behavior Research Methods 2005 37(3) 第398-416頁（https://link.springer.com/content/pdf/10.3758%2FBF03192709.pdf)

ネーミングタスクについて実験を行うと、非特許文献１が指摘する画像（複数の名称を想起させる画像）の他に、回答に時間がかかる画像が存在する。

例えば、次のような画像である。
（１）複雑
（２）形を捉えづらい
（３）コントラストや色が鮮明でない
（４）余分な要素による情報過多
（５）必要な特徴を欠く情報不足
（６）目を惹かない
（７）適切でない配色
（８）デフォルメ
（９）見慣れない視点や角度

これらの画像は、「見やすさ」や「分かりやすさ」や「目の惹きやすさ」などの視認のしやすさ（以下「視認性」という）を欠く画像である。視認性が低い画像の場合、被験者は画像の視認までに時間を要するため（または視認できないため）、回答に時間がかかってしまう。そこで、ネーミングタスク用の画像を準備する際には、視認性の高さを選択指標の一つとして評価することが好ましい。

また、視覚媒体としての画像として、広告や標識やピクトグラムや看板や動画や写真や書籍やフォントや絵文字や記号や紙面や図面や操作画面などがある。これら視覚媒体の画像などにおいても、「見やすさ」や「分かりやすさ」や「目の惹きやすさ」が要望される。その観点から、視覚媒体としての画像全般においても視認性を評価する技術が望まれる。

しかしながら、上述した非特許文献１には、この視認性を評価する技術について開示が見当たらない。

そこで、本発明は、視認性を評価する技術を提供することを目的とする。

上記課題を解決するために、代表的な本発明の視認性評価装置の一つは、視認性の評価対象とする画像を被検画像として取得する取得部と、被検画像を異なるぼかし量で処理して複数のぼかし画像を生成する処理部と、ぼかし画像について画像認識の試験を行って試験結果を取得する試験部と、試験結果に基づいて画像認識が妥当となる限界のぼかし量を求め、限界のぼかし量に応じた値を視認性の評価値（以下「認識容易度」）とする判定部とを備える。

本発明により、視認性を評価することが可能になる。
なお、上記した以外の課題、構成及び効果については、以下の実施形態の説明により明らかにされる。

実施例１の視認性評価装置１００の概略構成を示すブロック図である。実施例１における認識容易度の検出処理を示す流れ図である。複数のぼかし画像Ｇ（１）〜Ｇ（ｎ）を例示する図である。ぼかし画像Ｇ（ｉ）を提示する端末３３を例示する図である。設定部４５による境界値ＢＶの設定処理を示す流れ図である。空間分布Ｄの実験結果を示す図である。空間分布Ｄを範囲Ａ，Ｂに区分した様子を示す図である。視認性評価装置の全体動作を示す流れ図である。実施例２の視認性評価装置２００の概略構成を示すブロック図である。実施例２の機械学習器３００の基本構成を説明する図である。機械学習器３００の訓練データ４００の一部を示す図である。実施例２における認識容易度の検出処理を示す流れ図である。

以下、図面に基づいて、発明の実施形態を説明する。

実施例１は、ユーザ試験を利用して視認性を評価する実施形態である。

（実施例１の構成説明）
図１は、実施例１の視認性評価装置１００の概略構成を示すブロック図である。
同図において、視認性評価装置１００は、取得部１０、処理部２０、試験部３０、および判定部４０の機能を備えて構成される。

取得部１０は、視認性の評価対象とする画像を被検画像として取得し、処理部２０に伝達する。この取得部１０は、内蔵カメラや外部カメラから、ユーザが撮影した視覚媒体の電子データを被検画像として取得することができる。また、取得部１０は、被検画像を画像ファイルや動画ファイルやデータファイル（ｐｄｆファイル、ＳＶＧファイル、ＨＴＭＬファイルなど）その他の電子データとして取得することもできる。

処理部２０は、被検画像を異なる複数のぼかし量で処理することにより、僅かにぼかした画像から、視認が不可能なほどにぼかした画像まで、２つ以上のぼかし画像を生成する。複数のぼかし画像は、試験部３０に伝達される。

試験部３０は、ユーザ試験を行うために、提示部３１および入力部３２を備える。試験部３０は、視認性評価装置１００のユーザに対して、ぼかし量の大きい順に、複数のぼかし画像を提示部３１に提示する。ユーザは、提示されるぼかし画像について視認を試みる（画像認識の試験）。ユーザは、視認を試みた結果（試験結果）を、操作入力や音声入力やジェスチャ入力などにより試験部３０の入力部３２に入力する。

判定部４０は、試験結果に基づいて画像認識が妥当となる最大のぼかし量（以下「限界ぼかし量」という）を求め、その限界に対応する値を認識容易度とする。

また、判定部４０は、被検画像の認識容易度を境界値ＢＶと比較することにより、被検画像が『視認良好』か否かを評価する。判定部４０は、この境界値ＢＶを設定するための設定部４５を備える。境界値ＢＶについては後述する。

上述した視認性評価装置１００の構成は、専用の装置により実現される他に、例えば、パソコンやタブレットやスマートフォンや携帯端末やカメラなどのコンピュータにおいて視認性評価プログラム（アプリを含む）を実行することにより実現される。

また、視認性評価装置１００の一部または全部を、ネットワークやクラウドやデータセンタのサーバ上に設けてもよい。この場合、サーバは、通信接続されたクライアント端末（パソコンやタブレットやスマートフォンや携帯端末やカメラなど）を認証し、クライアント端末を仲介としてユーザに「被検画像の視認性を評価するサービス」を提供することが可能になる。

（実施例１における認識容易度の検出）
まず先に、視認性評価装置１００による認識容易度の検出処理について説明する。
図２は、実施例１における認識容易度の検出処理を示す流れ図である。
以下、同図に示すステップ番号に沿って説明する。

ステップＳ１０１：処理部２０は、取得部１０から伝達された被検画像に対して、最小ぼかし量ｂ（１）〜最大ぼかし量ｂ（ｎ）でぼかし処理を施し、ｎ個のぼかし画像Ｇ（１）〜Ｇ（ｎ）を生成する。なお、添え字ｎは２以上の自然数である。

図３は、複数のぼかし画像Ｇ（１）〜Ｇ（ｎ）を例示する図である。
同図において、ぼかし画像Ｇ（１）は、被検画像の輪郭やディテールを僅かにぼかした程度の画像であり、ぼかし画像Ｇ（ｎ）は、被検画像としての視認が不可能な程度にぼかした画像である。途中のぼかし画像は、与えるぼかし量を変化させてぼかし処理を実施した画像、または、ぼかし処理を重ねる回数によりぼかし量を変化させた画像である。ちなみに、主要なぼかし画像についてはぼかし処理により作成し、主要なぼかし画像の間に挿入されるぼかし画像については、主要なぼかし画像のオーバーラップ処理により補間的に生成してもよい。

ここでのぼかし処理は、人間の視認性を低下させるぼかし処理であればよい。例えば、ガウスぼかし処理のように、人間がぼんやり見る非合焦状態を再現するものでもよい。また、像流れ処理や像ゆらぎ処理のように、人間の視線が泳ぐ状態やカメラの手振れを再現するものでもよい。さらに、モザイク処理のように、空間解像度を低下させる処理でもよい。また、空間ローパスフィルタのように、画像の高域空間周波数成分を削減する処理でもよい。さらに、曇りガラスや、フォギー効果や、軟焦点効果や、レンズ収差や、色ずらし処理や、画像のずらし多重や、ノイズ重畳や、像歪みなどのぼかしを、模擬する画像処理でもよい。また、明度の低下処理や暗部の階調を潰す処理や黒潰れ処理のように暗所におけるぼかし（視認性の低下）を模擬する画像処理でもよい。さらに、コントラストの低下処理や階調の削減処理にように、明暗がぼんやりとする視認性の低下を模擬する画像処理でもよい。さらに、減色処理や白黒や特定色にモノクロ化する処理のように、色がぼやける視認性の低下を模擬する画像処理でもよい。また、高輝度側に飽和させる処理（白飛び処理など）のように、急に明るくなって視認性がぼやける状態を模擬する画像処理でもよい。

ステップＳ１０２：試験部３０は、ユーザ試験に先だって、限界ぼかし量Ｌに初期値０を代入し、ぼかし画像の順番ｉに初期値ｎを代入する。

ステップＳ１０３：試験部３０は、ぼかし画像Ｇ（ｉ）を提示部３１に所定時間ずつ提示する。
後述（ステップＳ１０８）するように、順番ｉはｎから１まで降順に切り替わる。その結果、提示部３１には、図３に示す矢印の方向順に、視認が不可能なほどのぼかし画像Ｇ（ｎ）から始まって、段階的に鮮明になるぼかし画像Ｇ（ｉ）が提示される。

図４は、このぼかし画像Ｇ（ｉ）を提示する端末３３を例示する図である。
同図に示す端末３３は、タッチパネルの画面を備え、提示部３１の表示エリアと共に、入力部３２の操作エリアも一緒に設けられる。また、端末３３には、入力部３２の音声入力用のマイク（不図示）や、ジェスチャ入力用の光受光部またはカメラ（不図示）も設けられる。

ステップＳ１０４：ユーザは、ヒントクイズの形式（映像がヒントとして順々に示され、答えが分かった時点でボタンを押す形式）で、提示部３１に提示されるぼかし画像Ｇ（ｉ）が視認可になった段階で、端末３３の入力部３２を操作（タップ操作や音声入力やジェスチャ入力など）する。入力部３２に入力された操作は「視認可」の意思を示す操作イベントとして、試験部３０に伝達される。

ステップＳ１０５：試験部３０は、ぼかし画像Ｇ（ｉ）の提示期間中に「視認可」の操作イベントが発生するか否かを判定する。「視認可」の操作イベントが発生すると、試験部３０はステップＳ１０６に動作を移行する。一方、ぼかし画像Ｇ（ｉ）の提示期間が終了した時点で「視認可」の操作イベントが発生していない場合、試験部３０はステップＳ１０７に動作を移行する。

ステップＳ１０６：試験部３０は、「視認可」の操作イベントが発生した時点で、提示中のぼかし画像Ｇ（ｉ）のぼかし量ｂ（ｉ）を、視認可の限界ぼかし量Ｌに代入する。
このユーザ試験では、「視認可」の操作イベントは初回のみ有効とし、限界ぼかし量Ｌへの代入処理も初回のみとする。その場合、操作イベント以降のぼかし画像の提示は、クイズの解答表示の意味合いとなるため、ぼかし画像の表示間隔を短縮することによりユーザ試験の所要時間を短縮する。

なお、ユーザが、後続の鮮明なぼかし画像Ｇ（ｉ）を観て、前回の「視認可」が勘違いであることに気付き、「視認可」の操作を繰り返す場合もある。このような操作が多いユーザについては、限界ぼかし量Ｌへの代入処理を上書き更新の処理とし、最終的な操作イベントを有効な「視認可」としてもよい。

ステップＳ１０７：試験部３０は、ｎ個のぼかし画像Ｇ（ｎ）〜Ｇ（１）の提示が完了したか否かを判定する。順番ｉが「１」であれば、試験部３０は提示完了と判定してステップＳ１０９に動作を移行する。一方、順番ｉが「１」より大きい場合、提示が完了していないと判定し、ステップＳ１０８に動作を移行する。

ステップＳ１０８：試験部３０は、段階的に鮮明になるぼかし画像を提示するため、順番ｉを１つ減らして、ステップＳ１０３に動作を移行する。

ステップＳ１０９：判定部４０は、視認可の限界ぼかし量Ｌに応じた値を、認識容易度とする。
例えば、判定部４０は、次式を用いて、認識容易度を求める。

認識容易度Ｒ［％］＝（限界ぼかし半径）／（絵柄半径） × 100
・・・［１］

式［１］に示す認識容易度Ｒは、限界ぼかし量Ｌに相当する限界ぼかし半径［pixel］を、絵柄がおよそ収まる円の半径［pixel］でサイズ調整（正規化）した百分率の値である。
上述した一連の処理により、被検画像の認識容易度が得られる。

（境界値ＢＶの設定処理）
続いて、視認性の臨界的な境界を示す境界値ＢＶを設定する処理について説明する。
図５は、設定部４５による境界値ＢＶの設定処理を示す流れ図である。
以下、同図に示すステップ番号に沿って説明する。

ステップＳ２０１：設定部４５は、境界値ＢＶの設定用に複数の訓練画像を収集する。複数の訓練画像には、視認性評価装置１００において視認性を過去に評価した被検画像を使用してもよい。また、視認性評価装置１００の開発チームが新たに収集した画像でもよいし、クラウド上からインターネットなどを介して（例えば自動的に）収集した画像でもよい。なお、訓練画像について、後述する回答時間および認識容易度のデータが収集可能であれば、訓練画像の画像データの収集は不要である。

ステップＳ２０２：設定部４５は、訓練画像ごとに、ネーミングタスクの実験結果である回答時間（視認にかかる時間）をデータ収集する。

ステップＳ２０３：設定部４５は、訓練画像ごとに、認識容易度をデータ収集する。

ステップＳ２０４：設定部４５は、訓練画像それぞれに（回答時間，認識容易度）の座標を与えて、訓練画像の群について空間分布Ｄを得る。

図６は、空間分布Ｄの実験結果を示す図である。
同図は、回答時間（中央値）を横軸とし、認識容易度（平均値）を縦軸として、訓練画像をそれぞれプロットした実験結果である。

図６に示す実験は、３２名の２０代女性を被験者とし、訓練画像ごとに回答時間と認識容易度を実験している。

なお、１人の被験者に対して、同じ訓練画像について認識容易度の実験と回答時間の実験とを行うと、先の認識容易度の実験により正解を知った状態で後の回答時間の実験を行うため、後知恵によって実験値が偏向する懸念がある。

そこで、実験に先立って、被験者をグループＰａ，Ｐｂにグループ分けする。また、訓練画像についても、訓練画像の群Ｇａと訓練画像の群Ｇｂとにグループ分けする。そして、グループＰａの被験者に対しては、訓練画像の群Ｇａについて回答時間の実験を行い、訓練画像の群Ｇｂについて認識容易度の実験を行った。グループＰｂの被験者に対しては、訓練画像の群Ｇｂについて回答時間の実験を行い、訓練画像の群Ｇａについて認識容易度の実験を行った。このような「たすき掛け方式」の実験とその順序により、上述した後知恵による実験値の偏向を回避した。

実験の結果、個々の訓練画像において、複数の回答時間と、複数の認識容易度が得られる。
この内、回答時間の実験値については、少数の被験者において回答時間が極端に遅れるなどの傾向が散見された。この状態で回答時間の平均を代表値とすると、少数の被験者の極端な遅れが平均に影響して代表値を偏らせてしまう。そこで、回答時間の実験結果としては、回答時間の上限側および下限側の影響を除くため、中央値（メディアン値）を代表値として採用した。

一方、認識容易度については、おおむね安定した結果が得られ、極端な個人差は生じなかった。そこで、認識容易度の実験結果としては、認識容易度の平均値を代表値として採用した。

ステップＳ２０５：設定部４５のデータ収集により作成される空間分布Ｄは、図６に示すようにＬ字状に分布する特性を示す。
設定部４５は、この空間分布ＤのＬ字状の特性に基づいてクラス分けの処理を行い、空間分布Ｄを次の範囲Ａ，Ｂに区分する。
●回答時間が短い側に集中する認識容易度の範囲Ａ
●回答時間が長い側まで分散する認識容易度の範囲Ｂ
図７は、空間分布Ｄを範囲Ａ，Ｂに区分した様子を示す図である。

ステップＳ２０６：認識容易度の範囲Ａ，Ｂは、回答時間の広がり方に有意な違いがあるため、範囲Ａ，Ｂの境界は、臨界的意義を有する境界となる。
そこで、設定部４５は、認識容易度の範囲Ａ，Ｂの境界を求め、臨界的意義を有する境界値ＢＶとする。
この境界値ＢＶよりも、被検画像の認識容易度が上であれば、被検画像は範囲Ａに属するため、回答時間は短い側に集中すると推定され、視認良好であると評価できる。
図７に示す範囲Ａ，Ｂから求めた、臨界的意義を有する境界値ＢＶは次の値となる。
臨界的意義を有する境界値ＢＶ＝６．７［％］
・・・［２］

ステップＳ２０７：設定部４５は、判定部４０に境界値ＢＶを設定（視認性評価装置１００の運用中であれば境界値ＢＶを随時更新）する。
以上の動作により、視認性評価装置１００では、視認良好か否かを評価するための境界値ＢＶが使用可能になる。

（実施例１の全体動作）
続いて、実施例１の全体動作について説明する。

図８は、視認性評価装置１００の全体動作を示す流れ図である。
以下、同図に示すステップ番号に沿って説明する。

ステップＳ３０１：ユーザは、視認性の評価対象とする画像を、被検画像として視認性評価装置１００に入力する。取得部１０は、入力された被検画像を処理部２０に伝達する。

ステップＳ３０２：視認性評価装置１００は、被検画像について認識容易度を求める。この動作の詳細については、図２の流れ図に基づいて既に説明したため、ここでの重複説明は省略する。

ステップＳ３０３：判定部４０は、視認性の評価値として、被検画像を入力したユーザに対して、認識容易度を返答する。

ステップＳ３０４：判定部４０は、被検画像の認識容易度が境界値ＢＶより上とみなせる場合、ステップＳ３０５に動作を移行する。それ以外の場合、判定部４０は、被検画像の視認性の評価を完了する。

ステップＳ３０５：ここでは、被検画像の認識容易度が境界値ＢＶより上とみなせるため、被検画像は「回答時間が短い側に集中する認識容易度の範囲Ａ（図７参照）」に属すると推定される。そこで、判定部４０は、被検画像を入力したユーザに対して、「被検画像の視認性は良好である」旨の評価情報を出力する。
以上の動作により、被検画像についての視認性の評価が完了する。

（実施例１の効果）
（１）脳機能マッピングにおいては、被験者は頭骨を固定され、手術台の上に横たわる。その状態では、眠くなったり、注視を維持できなかったり、被験者の視界はぼやけやすい。そこで、被検画像の認識がぎりぎり可能となる視界のぼやけを示す指標として、本願発明者は「認識容易度」を導入する。認識容易度の高い画像は、視界がぼやけても認識が容易な画像であるため、視認性が高い画像と評価できる。実施例１の視認性評価装置１００は、被検画像についてこの認識容易度を求める。したがって、被検画像の視認性を評価することが可能になる。

（２）実施例１では、視界のぼやけ具合を、被検画像に施すぼかし量を複数段階に異ならせることによって等価的に模擬している。通常、視界のぼやけ具合は視覚に関する定性的なパラメータであるため、そのままでは数値化は困難である。しかし、実施例１は、視界のぼやけ具合を画像のぼかし量によって模擬する。このぼかし量は画像処理上の数値である。したがって、認識容易度は、ぼかし量という数値に基づいて、視認性を数値によって評価することが可能になる。

（３）認識容易度の高い被検画像は、注視を維持できずに視界が定まらない状態であっても、目に入りやすく一目で把握しやすい画像である。その観点によれば、認識容易度は、視覚媒体としての画像全般において、「見やすさ」や「分かりやすさ」や「目の惹きやすさ」を評価する指標になる。したがって、視覚媒体の画像全般（広告や標識やピクトグラムや看板や動画や写真や書籍やフォントや絵文字や記号や紙面や図面や操作画面など）について認識容易度を求めることにより、「見やすさ」や「分かりやすさ」や「目の惹きやすさ」を評価することが可能になる。

（４）実施例１では、認識容易度の判定に境界値ＢＶを使用する。この境界値ＢＶは、図７に示すように「回答時間が短い側に集中する認識容易度の範囲Ａ」と「回答時間が長い側まで分散する認識容易度の範囲Ｂ」とに有意に分ける値（臨界的意義を有する値）である。したがって、被検画像の認識容易度が境界値ＢＶより上であれば、その被検画像の回答時間は短くなる可能性が大であり、視認性は良好であると判定することが可能になる。

（５）実施例１では、ユーザインターフェースとして端末３３を備える。この端末３３の提示部３１には、ぼかし量の大きい順に複数のぼかし画像Ｇ（ｎ）〜Ｇ（１）が順番に入れ替わって提示される。ユーザは、段階的に鮮明になるぼかし画像を観察することで、どの段階で視認可能になったかをはっきり知覚することが可能になる。そのため、認識容易度を明確に求めることが可能になる。

（６）実施例１では、さらに端末３３に入力部３２を備える。この入力部３２はユーザから視認試験の結果を取得する。そのため、ユーザから意思表示を聞き取るための実験立会人などは不要となり、ユーザ１人でも認識容易度を求めることが可能になる。

（７）視認性の評価には、回答時間の短さも判断材料になり得る。しかし、回答時間のユーザ試験は、被検画像を見てから名称を答えるまでの回答時間をコンマ１秒単位で測定するものであって、「早押しクイズ」の形式に相当する。そのため、被験者の中枢神経や運動神経や集中力、さらには試験環境の要因が大きく影響し、同じ被験者が同じ被検画像について試験を行っても、回答時間は毎回変動し再現性が低い。また、被験者が被検画像とその名称を一度記憶してしまえば、条件反射的に回答時間が短くなる。そのため、同じ被験者が同じ被検画像について回答時間の試験を行う際には、日を改めるなど時間を置く必要があった。
これらの理由から「回答時間」は視認性を評価する指標としては不都合な点が多かった。

それに対して、認識容易度のユーザ試験は、段階的に鮮明になるぼかし画像をヒントとして、ユーザが視認可になった段階で入力部３２を操作するものであって、「ヒントクイズ」の形式に相当する。そのため、１つのぼかし画像の提示期間内であればユーザは落ち着いて入力部３２を操作することが可能になる。そのため、被験者の中枢神経や運動神経や集中力、さらには試験環境などの要因はさほど影響せず、同じ被験者が同じ被検画像について試験を行っても、認識容易度は高い再現性が得られる。また、被験者が被検画像を一度記憶してしまっても認識容易度は条件反射的に答えるものではなく、ぼかし画像が何に見えるかを考えながら答えるものである。そのため、日を改めて時間を置かずにユーザ試験を繰り返しても、認識容易度は比較的変化せず再現性が高い。
これらの理由から「認識容易度」は視認性を客観的に評価する指標として優れている。

実施例２は、ユーザ（被験者）の代わりに機械学習器を利用して視認性を評価する実施形態である。

（実施例２の構成説明）
図９は、実施例２の視認性評価装置２００の概略構成を示すブロック図である。
同図において、視認性評価装置２００は、取得部１０、処理部２０、試験部５０、および判定部６０の機能を備えて構成される。試験部５０は、機械学習器３００を備える。

なお、試験部５０および判定部６０以外については、実施例１（図１参照）と同様のため、ここでの重複説明を省略する。

（機械学習器３００の基本構成）
図１０は、機械学習器３００の基本構成を説明する図である。
同図において、ぼかし画像などの映像情報は、画像解析の解析内容に適した前処理（クロップ、リサイズ、畳み込み前のパディングなど）が施された後、入力層３１０に入力される。

入力層３１０の映像情報は、畳み込み層・活性化関数３２１およびプーリング層３２２を介して処理され、画像空間の局所的な特徴に応じて活性化するニューロンからなる特徴マップに変換される。この畳み込み層・活性化関数３２１およびプーリング層３２２は、画像解析に適した層数だけ多層化される。

多層化された畳み込み層・活性化関数３２１およびプーリング層３２２を経由した特徴マップのニューロンの値はシリアル化された後、ニューラルネットワーク３３０に入力される。ニューラルネットワーク３３０は画像解析に適する層数でニューロンを結合（例えば全結合）して構成される。ニューラルネットワーク３３０の最終端の出力層３４０の複数のニューロンからは、画像解析の結果（尤度など）を示す活性化パターンが出力される。

ここでは、機械学習器３００の基本構成を１つの系統で説明したが、画像解析の内容によっては基本構成を並列ないし途中分岐にして複数系統により構成してもよい。また、途中に過去のニューロンの状態を保持する層を設けることにより、時間軸方向の画像（動画）の画像認識を可能にしてもよい。

（機械学習器３００の機械学習）
続いて、機械学習器３００の機械学習について説明する。
図１１は、機械学習器３００の訓練データ４００の一部を示す図である。

図１１に示す訓練画像４１０は、被検画像に含まれる可能性が高い円形、矩形、三角などの基本パーツの画像群である。
出力層３４０を構成する複数のニューロンには、これら基本パーツごとに独立した活性化パターンが教師値４２０として予め割り当てられる。

訓練データ４００は、これらの訓練画像４１０と教師値４２０とを含むデータセットを集めた群により構成される。

機械学習器３００の畳み込み層・活性化関数３２１やニューラルネットワーク３３０内のニューロンそれぞれは、重み配列Ｗやバイアスｂｉａｓを有する。これらの重み配列Ｗやバイアスｂｉａｓは、訓練データ４００を用いた機械学習（誤差逆伝搬法など）を繰り返すことにより逐次更新され、出力層３４０は学習した教師値に近い活性化パターンを出力するようになる。

（実施例２における認識容易度の検出）
続いて、ユーザ（被験者）の代わりに機械学習器３００を利用して認識容易度を自動的に検出する動作について説明する。

図１２は、実施例２における認識容易度の検出処理を示す流れ図である。
以下、同図に示すステップ番号に沿って説明する。なお、特に断らない動作については実施例１と同じ動作である。

ステップＳ５０１：処理部２０は、取得部１０から伝達された被検画像に対して、最小ぼかし量ｂ（１）〜最大ぼかし量ｂ（ｎ）でぼかし処理を施し、ｎ個のぼかし画像Ｇ（１）〜Ｇ（ｎ）を生成する。なお、添え字ｎは２以上の自然数である。

ステップＳ５０２：試験部５０は、機械学習器３００の入力層３１０に被検画像を入力する。機械学習器３００の出力層３４０には、被検画像に含まれる基本パーツ（機械学習済み）の組み合わせに応じた活性化パターンが画像認識の試験結果として現れる。試験部５０は、この活性化パターンを被検画像の画像認識の正解値として一時記憶する。

ステップＳ５０３：試験部５０は、ぼかし画像の順番ｉに初期値「１」を代入する。

ステップＳ５０４：試験部５０は、機械学習器３００の入力層３１０にぼかし画像Ｇ（ｉ）を入力する。機械学習器３００の出力層３４０には、ぼかし画像Ｇ（ｉ）に残存する基本パーツ（機械学習済み）の組み合わせに応じて活性化パターンが現れる。試験部５０は、ぼかし画像Ｇ（ｉ）の活性化パターンを画像認識の試験結果として取得する。

ステップＳ５０５：判定部６０は、試験結果と正解値との距離（活性化パターンのパターン列の差分二乗和、差分二乗平均、その平方根、差分絶対値和、差分絶対値平均など）を求める。なお、この距離を正解値の大きさなどを基準に正規化してもよい。

ステップＳ５０６：判定部６０は、試験結果と正解値との距離が妥当な範囲を超えるか否かを判定する。
ここでの妥当な範囲については、ユーザ試験においてぎりぎり視認可となったぼかし画像を収集し、収集したぼかし画像について求めた「距離」の値を基準に設定すればよい。
また、ぼかし量に対する距離の変化率を求め、その変化率の変曲点などの臨界点を基準に妥当な範囲を適応的に決定してもよい。
試験結果と正解値との距離が妥当な範囲を超える場合、判定部６０はぼかし画像Ｇ（ｉ）は視認不可になったと判断してステップＳ５０９に動作を移行する。
試験結果と正解値との距離が妥当な範囲に収まる場合、判定部６０はぼかし画像Ｇ（ｉ）は視認可であると判断してステップＳ５０７に動作を移行する。

ステップＳ５０７：試験部５０は、画像認識の対象を次のぼかし画像に進めるため、順番ｉを１つ増やす。

ステップＳ５０８：試験部５０は、ｎ個のぼかし画像Ｇ（１）〜Ｇ（ｎ）の画像認識が完了したか否かを判定する。順番ｉが「ｎ」以下の場合、画像認識が完了していないと判定し、ステップＳ５０４に動作を移行する。一方、順番ｉが「ｎ」を超えていれば、試験部５０は画像認識が完了したと判定してステップＳ５０９に動作を移行する。

ステップＳ５０９：判定部６０は、順番ｉの１つ前までが視認可の限界と判断し、視認可の限界ぼかし量Ｌに、ぼかし量ｂ（ｉ−１）を代入する。なお、ｉが「１」の場合、ぼかし量ｂ（１−１）＝ｂ（０）＝０とする。

ステップＳ５１０：判定部６０は、視認可の限界ぼかし量Ｌに応じた値を、認識容易度とする。
上述した処理により、被検画像の認識容易度が機械学習器３００を利用して自動的に得られる。

（実施例２のその他動作について）
実施例２のその他の動作については、機械学習器３００で求めた認識容易度を使用する点を除き、実施例１の動作（例えば図５〜図８参照）と同様であるため、ここでの重複説明は省略する。

（実施例２の効果）
実施例２は、ユーザの画像認識を機械学習器３００の画像認識で代替することにより、実施例１の効果と同様の効果が得られる。
さらに、実施例２は、次の効果も奏する。

（１）実施例２では、画像認識の機械学習を行った機械学習器３００を使用して、ぼかし画像について画像認識の試験を行う。その結果、実施例１のようなユーザ（人間の被験者）を必要とせずに、認識容易度を自動的に求めることが可能になる。

（２）実施例２では、訓練画像として、被検画像を構成する可能性がある基本パーツを機械学習器３００に学習させる。そのため、機械学習器３００にとって未学習（つまり初見）の画像であっても、機械学習器３００は基本パーツの活性化パターンという形で画像認識の試験結果を出力することが可能になる。

（３）実施例２では、被検画像の活性化パターン（画像認識の正解値）と、ぼかし画像の活性化パターン（視界がぼやけた状態での画像認識の試験結果）との距離という物理量を新たに導入する。この距離は、画像（視界）がぼやけたことによる画像認識の変容を示す。したがって、この距離が妥当な範囲内か否かを判定することにより、ぼかし画像が視認可か否かを人間の被験者に代わって評価することが可能になる。

（実施形態の補足事項）
なお、上述した実施形態では、機械学習器３００として、畳み込みニューラルネットワーク（図１０参照）を使用した。しかしながら、本発明はこれに限定されない。

例えば、機械学習器として、主として畳み込み層・活性化関数を多層化したＦＣＮ（Fully Convolutional Network）を採用してもよい。このＦＣＮは、基本パーツを機械学習することにより、入力される映像情報（被検画像やぼかし画像）に含まれる基本パーツを特徴抽出し、基本パーツの組み合わせに応じた特徴マップの活性化パターン（活性化パターンからなる一種の画像情報）を出力するようになる。したがって、被検画像の特徴マップとぼかし画像の特徴マップとの距離（特徴マップの画素差の差分二乗和、差分二乗平均、その平方根、差分絶対値和、差分絶対値平均など）に基づいても、ぼかし画像の画像認識が妥当か否かを判定することが可能になる。

また例えば、このような機械学習器としては、決定木学習、相関ルール学習、ニューラルネットワーク、遺伝的プログラミング、帰納論理プログラミング、サポートベクターマシン、クラスタリング、ベイジアンネットワーク、強化学習、表現学習、主成分分析、エクストリーム・ラーニング・マシン、およびその他の機械学習技法の少なくとも一つの技法に基づく学習モデルを採用してもよい。

なお、上述した実施形態では、画像認識が妥当となる最大のぼかし量を「画像認識が妥当となる限界のぼかし量」として採用した。しかしながら、本発明はこれに限定されない。例えば、画像認識が妥当となる一つ前のぼかし量を「画像認識が妥当となる限界のぼかし量」として採用することもできる。また例えば、画像認識が妥当から妥当でなくなった瞬間のぼかし量を「画像認識が妥当となる限界のぼかし量」として採用することもできる。

また、上述した実施形態では、実施例１，２を別々に説明したが、本発明はこれに限定されない。例えば、実施例１と実施例２とを一緒に実行し、機械学習器３００による認識容易度が人間の認識容易度に近づくように、機械学習器３００や判定部６０の動作パラメータを自動ないし手動で随時に調整してもよい。

さらに、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されない。

また、有る実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、有る実施例の構成に他の実施例の構成を加えることも可能である。

さらに、上述した構成の一部について、構成の追加・削除・置換をすることが可能である。

本発明は、視覚媒体の画像全般について視認性を評価する産業上の用途において利用可能である。

ＢＶ…境界値、１０…取得部、２０…処理部、３０…試験部、３１…提示部、３２…入力部、３３…端末、４０…判定部、４５…設定部、５０…試験部、６０…判定部、１００…視認性評価装置、３００…機械学習器、３１０…入力層、３２１…畳み込み層・活性化関数、３２２…プーリング層、３３０…ニューラルネットワーク、３４０…出力層、４００…訓練データ、４１０…訓練画像、４２０…教師値

Claims

視認性の評価対象とする画像を、被検画像として取得する取得部と、
前記被検画像からぼかし量の異なる複数のぼかし画像を生成する処理部と、
前記ぼかし画像について画像認識の試験を行い、試験結果を取得する試験部と、
前記試験結果に基づいて前記画像認識が妥当となる限界のぼかし量を求め、前記限界のぼかし量に応じた値を視認性の評価値（以下「認識容易度」）とする判定部と、
を備えたことを特徴とする視認性評価装置。
請求項１に記載の視認性評価装置において、
前記判定部は、
訓練画像の群について「視認にかかる回答時間」と「前記認識容易度」とを軸として分布を収集し、前記分布を「前記回答時間が短い側に集中する前記認識容易度の範囲Ａ」と「前記回答時間が長い側まで分散する前記認識容易度の範囲Ｂ」とにクラス分けして得られる前記範囲Ａ，Ｂの境界値を設定または更新する設定部を含み、
前記被検画像について求めた前記認識容易度が前記境界値より上の場合に、前記被検画像の視認性は良好であると判定する
ことを特徴とする視認性評価装置。
請求項１〜２のいずれか１項に記載の視認性評価装置において、
前記試験部は、
複数の前記ぼかし画像を前記ぼかし量の大きい順に提示する提示部と、
前記ぼかし画像を提示されたユーザから視認結果を取得するための入力部とを備える
ことを特徴とする視認性評価装置。
請求項１〜２のいずれか１項に記載の視認性評価装置において、
前記試験部は、
訓練画像と教師値とを含むデータセットの群を訓練データとして前記画像認識の機械学習を行った機械学習器を備え、前記機械学習器を用いて前記ぼかし画像について前記画像認識の試験を行う
ことを特徴とする視認性評価装置。
コンピュータを、請求項１〜４のいずれか１項に記載の前記取得部、前記処理部、前記試験部、および前記判定部として機能させる
ことを特徴とする視認性評価プログラム。
視認性の評価対象とする画像を、被検画像として取得する入力ステップと、
前記被検画像からぼかし量の異なる複数のぼかし画像を生成する処理ステップと、
前記ぼかし画像について画像認識の試験を行い、試験結果を取得する試験ステップと、
前記試験結果に基づいて前記画像認識が妥当となる限界のぼかし量を求め、前記限界のぼかし量に応じた値を視認性の評価値（以下「認識容易度」）とする判定ステップと、
を備えて、視認性評価サービスを提供することを特徴とする視認性評価方法。