JP2014142855A

JP2014142855A - 評価対象の評価項目の真値推定方法

Info

Publication number: JP2014142855A
Application number: JP2013011733A
Authority: JP
Inventors: Hitoshi Miura; 仁志三浦; Kyo Nakamura; 響中村
Original assignee: Tokai Optical Co Ltd
Current assignee: Tokai Optical Co Ltd
Priority date: 2013-01-25
Filing date: 2013-01-25
Publication date: 2014-08-07
Anticipated expiration: 2033-01-25
Also published as: JP6373556B2

Abstract

【課題】複数の評価主体それぞれが評価対象に関するある評価項目を数値化して評価した場合に、評価主体の数を増加させるに伴ってそれら評価結果の数値の平均値が収斂するであろう仮想的な真値を、多数の評価結果を得ることなく推定することができる評価対象の評価項目の真値推定方法を提供する。
【解決手段】複数の評価主体として例えばモニターそれぞれが評価対象として例えばレンズに関するある評価項目を数値化して評価した場合に、モニターの数を増加させるに伴ってそれら評価結果の数値の平均値が収斂するであろう仮想的な真値を、モニターの数を多数にすることなく推定するための真値推定方法であって、評価項目を評価したモニターの「評価を正確に行う能力」の大小を反映する数値を各モニター毎に算出し、それらの数値に基づいて算出した各モニター毎の重みを考慮して真値を推定するようにする。
【選択図】図４

Description

本発明は、複数の評価主体それぞれが評価対象に関するある評価項目を数値化して評価した場合に、評価主体の数を増加させるに伴ってそれら評価結果の数値の平均値が収斂するであろう仮想的な真値を、多数の評価結果を得ることなく推定することができる評価対象の評価項目の真値推定方法に関するものである。

例えば、メーカーが商品開発を行う場合などには、試作品を適当な手段によって優劣評価することがある。そのような場合に、評価項目の評価値がどのような傾向を示すかを正確に見積もることができればよいが、そのための適切な方法がないことも多い。例えばモニター評価する人間の主観によって優劣を判定するケースがある。あるいは機械的な測定手段があっても、その測定精度が悪いことや、複数の評価手段により別々の結果を得ることがある。
そのような場合の評価方法として、例えば比較的多数の人（例えば５０人以上の人々）にモニターとなってもらうことで、評価結果の数値の平均値をもって評価対象（試作品）の真値の推定値とすることが可能である。モニター能力のバラツキが正規分布的であると仮定すれば、平均値に基づいて得られた評価対象の真値の推定値は十分信用に足るものだからである。
しかしながら、実際は時間や費用の問題があって、数多くのモニター評価を行うことができない場合も多い。また、それぞれの評価を行う際の条件を一定にするなどの配慮が必要となる。例えば調節力が衰えた人が遠方と近方を一つの眼鏡で見るための累進屈折力レンズを評価対象として考えるものとする。累進屈折力レンズの性能（評価項目）をモニター装用によって評価する場合、数種類のレンズの遠用性能・中間性能・近用性能を一度に評価しようとすると、モニターする人間が疲れてしまったり集中力が持続しなかったりするという問題がある。だからといって、ある程度の時間を置いて別のレンズを評価すると、モニターする人間の体調や精神状態が変化するので、それぞれのレンズを一定の条件で評価することが難しい。

特開２００９−２５４３２号公報

こうしたことから、評価主体の数があまり多くなく、かつ各評価主体が評価対象を評価する能力にバラツキがある可能性があっても、評価対象の特性を表す真値を精度よく推定する方法が求められていた。各評価主体が評価対象を評価する能力にバラツキがある場合においてどのように評価可能かを想定すると、例えば評価対象の特性を単純平均により評価する方法や各評価主体の評価能力や特徴を相対的な比較により見積もる方法や主成分分析による方法が想定できる。
しかし、単純平均による場合では、評価主体の数が十分多ければ良いが、少ない場合は問題が生じる。評価能力が劣った評価主体、あるいは個別の特性が極端な評価主体による評価結果を同じ重みで平均したのでは、評価対象の真値を精度良く推定することが難しい。そのようにして得た平均値には不確定性があり、評価主体の数が少ないほどそのバラツキは大きくなってしまう。
また、各評価主体の評価能力や特徴を相対的な比較により見積もる方法とは、より具体的には各評価項目に関して、全評価主体による評価値の平均値を算出し、それと個々の評価主体による評価結果とを比較するという手法となるが、平均値は偏ったモニターの評価結果に影響されることとなるため信頼性が低いものとなる。
また、特許文献１に開示されるような主成分分析による方法では、各モニターの評価能力の優劣や個別の特性を無視した計算（均一であるか、偏りの無い分布であると仮定した計算）を行うこととなるので、好ましい結果を得ることができない。例え結果を得ても、固有値の小さい主成分ベクトルが多く得られて次元を効率良く縮小できず、それらの主成分が表す意味を把握することも難しいことが多い。
本発明は、このような従来の技術に存在する問題点に着目してなされたものである。その目的は、複数の評価主体それぞれが評価対象に関するある評価項目を数値化して評価した場合に、評価主体の数を増加させるに伴ってそれら評価結果の数値の平均値が収斂するであろう仮想的な真値を、多数の評価結果を得ることなく推定することができる評価対象の評価項目の真値推定方法を提供することである。

上記課題を解決するために請求項１の発明では、複数の評価主体それぞれが評価対象に関するある評価項目を数値化して評価した場合に、前記評価主体の数を増加させるに伴ってそれら評価結果の数値の平均値が収斂するであろう仮想的な真値を、評価主体の数を多数にすることなく推定するための真値推定方法であって、前記評価項目を評価した前記評価主体の評価能力の大小を反映する数値を各評価主体毎に算出し、それらの数値に基づいて算出した各評価主体毎の重みを考慮して真値を推定するようにしたことをその要旨とする。
また、請求項２の発明では請求項１に記載の発明の構成に加え、複数の前記評価主体のうちのすべての２つの組み合わせの前記評価主体のそれぞれの評価項目に対する評価結果に基づいて相関係数を求め、得られた前記相関係数に基づいて各評価主体に対する評価能力の大小を反映する数値を各評価主体毎に算出し、それらの数値に基づいて各評価主体毎の前記重みを算出するようにしたことをその要旨とする。
また、請求項３の発明では請求項１又は２に記載の発明の構成に加え、ｋを「１」から「評価項目の数」まで変わるインデックスとし、ｎを評価項目の数とし、評価項目の真値のデータ列Ｗ_ｋを平均０となるように規準化したものとして想定し、２つの前記評価主体のそれぞれの評価項目に対する評価結果のデータ列を平均０となるように規準化してｘ_ｋ、ｙ_ｋとおいた場合に、ｘ_ｋ、ｙ_ｋを下記数１の式によって近似的に示し、ｘ_ｋ、ｙ_ｋの前記相関係数ｒを下記数２の式によって近似的に示したことをその要旨とする。

また、請求項４の発明では請求項２又は３に記載の発明の構成に加え、ｉを「１」から「評価主体の数」まで変わるインデックスとし、ｒ_ｉを第ｉ番目のモニターによる評価項目に対する評価値と真値のデータ列Ｗ_ｋとの前記相関係数として、前記相関係数群ｒ_ｉに基づいてデータ列Ｗ_ｋの各値を推定するようにしたことをその要旨とする。
また、請求項５の発明では請求項２〜４のいずれかに記載の発明の構成に加え、ｉを「１」から「評価主体の数」まで変わるインデックスとし、ｒ_ｉを第ｉ番目のモニターによる評価値と真値のデータ列Ｗ_ｋとの前記相関係数とした場合に、前記重みをｒ_ｉ／（１−ｒ_ｉ）とすることをその要旨とする。

また、請求項６の発明では請求項１〜５のいずれかに記載の発明の構成に加え、前記評価主体の評価能力とは前記評価主体が評価を正確に行う能力であることをその要旨とする。
また、請求項７の発明では請求項１〜６のいずれかに記載の発明の構成に加え、前記評価主体の評価能力は複数の想定した評価因子の１つであることをその要旨とする。
また、請求項８の発明では請求項１〜７のいずれかに記載の発明の構成に加え評価値を複数の評価因子による寄与量と独自因子の和によって近似的に表すと想定し、前記評価主体の評価能力以外の評価因子の寄与量を評価値から減じた結果に基づいて真値を推定するようにしたことをその要旨とする。
また、請求項９の発明では請求項１〜８のいずれかに記載の発明の構成に加え、多変量解析によって前記評価因子の寄与量を算出するようにしたことをその要旨とする
また、請求項１０の発明では請求項１〜９のいずれかに記載の発明の構成に加え、評価主体は人間であることをその要旨とする。
また、請求項１１の発明では請求項１〜１０のいずれかに記載の発明の構成に加え、評価対象は眼鏡用レンズであることをその要旨とする。

上記のような構成では、真値を推定するために評価主体の評価能力の大小を反映する数値を各評価主体毎に算出し、それらの数値に基づいて算出した各評価主体毎の重みを考慮するようにしているため、数多くの評価主体がなくとも、また評価主体の評価能力にバラツキがあっても評価主体の数を増加させた場合に収斂するであろう仮想的な真値に近い値を推定することが可能となる。
ここにいう「真値」とは評価結果の数値の平均値が評価主体の数を増加させるに伴って収斂すると仮定した値である。実際は計算で求まるものではなく、評価主体の数が極めて多い場合の平均値である。本発明ではこのような仮想的な真値を評価主体の数が多くなくとも真値に近い推定が可能としたものである。
また、「評価主体」は３つ以上であることが必要であるが、必ずしも多数であることは必要ではない。ここで評価主体が２つしかないと、相関係数を１つ得られるだけなので、その値をもとに２つの値（各評価主体と真値データ列との相関係数）を求めることができないからである。評価主体が３つあれば、評価主体間の相関係数を３つ得られるので、３つの既知の値から３つの値（各評価主体と真値データ列との相関係数）を求めることができ、評価主体が４つ以上であれば、評価主体間の相関係数の数は評価主体の数を上回るので、最小二乗法により最適解を決定することができる。
もちろん、評価主体が多ければ計算の量は増えるがより真値に近い推定が可能となる。評価主体としては人と考えるのが一般的であるが、人以外に測定装置やコンピュータのような判断可能な機械や、判断のための手法なども評価主体となりうる。

また、「評価主体の評価能力の大小を反映する」とは評価能力が大きい場合に重みを多くし、逆に評価能力が小さい場合に重みを小さくするというものである。
また、それぞれの評価対象には１つ以上の個別評価項目があり、評価対象と個別評価項目の積が「評価項目」である。評価項目は２つ以上なければならない。つまり評価対象と個別評価項目のどちらかは２つ以上なければならない。また、相関係数を求めるためには評価項目は３つ以上でなければならない。評価項目が３つ以上でないといけない理由は評価項目が２つの場合は相関係数の値が常に−１か１になるので、相関係数を求める意味がなくなるからである。

ここで、ある評価項目についての真値を推定することを考える。
ある評価項目についての尤度関数を次の数３の式で示す。この式に基づいて真値θを推定するものとする。

尤度とは、第ｉ番目のモニターによる評価点がｘ_ｉとなる場合の確率密度関数の値をモニター全員について掛け合わせた値である。ここで第ｉ番目のモニターによるモニターによる評価点は、平均θ、標準偏差σ_ｉの正規分布に従うと仮定した。

真値θの最尤推定値は、尤度関数の値を（従って対数尤度関数の値を）最大にするθである。そこで、上式をθで微分して＝０とおくと下記数５となり、更に数６のように変形できる。結局、真値θの最尤推定値は下記の数７となる。この式から真値θはｘ_ｉの重みを１／σ_ｉ ^２とした加重平均となっていることがわかる。従って、各評価主体の固有の分散σ_ｉ ^２を推定し、それに基づいた加重平均を真値の推定値とすればよいことがわかる。

さて、重みを算出するためには、まず、評価能力の大小を反映する数値を算出する必要がある。しかし、評価能力の大小は通常数量データとは考えられていないため、なんらかの方法で数量データ化する必要がある。具体的には相関係数を求めることが考えられる。
すなわち、仮想的な真値のデータ列を想定し、各モニターによる評価値と真値のデータ列との相関係数を求め、それらの相関係数の値が各評価主体に対する評価能力の大小を反映すると考えるのである。そのために、複数の評価主体のうちのすべての２つの組み合わせの評価主体のそれぞれの評価項目に対する評価結果に基づいて、評価主体間の相関係数を求めることがよい。ここで評価主体相互間の相関係数は、評価主体のうちのすべての２つの組み合わせの数だけ求めることとなる。その数は（評価主体の数）・（評価主体の数−１）／２である。
相関係数の一般式は、数８で示される。
ここに、２つの前記評価主体のそれぞれの評価項目に対する評価結果のデータ列を平均０となるように規準化してｘ_ｋ、ｙ_ｋとおいた場合に、ｘ_ｋ、ｙ_ｋは上記数１の式によって近似的に示される。このｘ_ｋ、ｙ_ｋを数８に代入し数９とし、これを数１０のように展開する。ここでは評価主体はモニター、つまり「人」とするが、もちろん「人」以外でもよい。

ここで、α_ｋ、β_ｋ、Ｗ_ｋの分布はすべて独立であると仮定する。すると、これらのうち２つを乗じた和、すなわち、α_ｋβ_ｋ、Ｗ_ｋα_ｋ、Ｗ_ｋβ_ｋそれぞれについてｋ＝１からｎまで加え合わせた和の期待値は０である。
そこで、ｒをテイラー展開によって近似すると数１１の式となる。ここで簡略化のために、γ＝ｎ／（２ΣＷ_ｋ ^２）とおくと、ｘ_ｋ、ｙ_ｋの相関係数は数１２の式で示されることとなる。

ここでσ_ｘ＝０とすると、数列ｘ_ｋが真値の組Ｗ_ｋと等しくなる。すると数列ｙ_ｋと真値の組Ｗ_ｋとの相関係数は１／（１＋γσ_ｙ ^２）であることがわかる。
さて、ここでｒ_ｉを第ｉ番目のモニターの評価値と真値の組Ｗ_ｋとの相関係数とする。また、ｉ＝１〜ｎの各評価値の組の分散をσ_ｉ ^２とし、１／（１＋γσ_ｉ ^２）＝ｒ_ｉと表すことができる。これを変形すると１／σ_ｉ ^２＝γｒ_ｉ／（１−ｒ_ｉ）となる。
ここで、上記のように１／σ_ｉ ^２は真値θを加重平均として表す際の係数なのだから、それと比例関係にあるｒ_ｉ／（１−ｒ_ｉ）を重みとした加重平均を真値θの推定値とすればよいことがわかる。
また、２つのデータ列が上記数１２の式のように表されることから、第ｉ番目と第ｊ番目のモニターによる評価値の相関係数は、ｒ_ｉｊ≒ｒ_ｉ・ｒ_ｊと表されることがわかる。

上記のような計算によって重みをｒ_ｉ／（１−ｒ_ｉ）と設定したが、具体的にｉ番目のモニターと真値との相関係数を算出する必要がある。ここでは行列式を用いて変数を定義し、ｒ_ｉを最適化する計算で算出する手法を開示する。便宜的にこの手法を１因子法と呼ぶ。尚、この手法は一例であって、他の手法によってｒ_ｉを求めるようにしてもよい。
まず、変数を定義する。
ｍ：モニターの人数（実施例では１０人）
ｒ_ｉ：第ｉ番目のモニターによる評価結果と、真値との相関係数
これは仮想的な値であり、最適化計算によって推定する。
ｒ_ｉｊ：第ｉ番目のモニターによる評価結果と、第ｊ番目のモニターによる評価結果との相関係数、この値は、各モニターによる評価値より算出する。

数１３の行列と相関行列Ｒとの差の二乗和を最小にする条件に基づいて、ｒ_ｉを最適化することにより、各モニターの評価値と真値の組との相関係数を推定する。相関行列Ｒは数１３の行列式においてｒ_ｉｊをｒ_ｉ・ｒ_ｊに置き換えた行列で示される。
さて、ここで、ｒ_ｉの組を最適化計算によって求めるわけであるが、上記行列においては対角要素は同じ配列同士の相関係数なので１になる。また、ｒ_ｉ・ｒ_ｊ＝ｒ_ｊ・ｒ_ｉなので、実質的には以下の数１４で示すように要素として重要な部分のみで２つの行列の各要素の差の二乗和を表す関数Ｑ（ｒ_１、ｒ_２…ｒ_ｉ…ｒ_ｍ）を想定し、この関数Ｑの値を最小にするｒ_ｉの組を最適化計算によって求める。関数Ｑは数１５の通りである。つまり、既知のｒ_ｉｊの値の組をもとに、ｒ_１〜ｒ_ｍの数値を推定する計算を行うわけである。例えば以下の実施例１及び２ではｉは１０まで変化する。二重のΣによる項の数は、ｍ・（ｍ−１）／２であって、ｍ＝１０のときは４５となる。実施例ではｒ_ｉｊは４５個の数値であり、その値はモニターが評価した結果の数値より相関係数として算出できる。最適化計算の方法として、既知の例えばニュートン法や共役勾配法などを使用することができる。また、これらの計算は一般にはコンピュータによって計算することとなる。

上記評価主体の評価能力は１つの重要な因子と考えることができるが、評価因子は複数想定することが可能である。ここに「評価主体の評価能力」とはより具体的には例えば評価主体が評価を正確に行う能力である。更に、「評価を正確に行う能力」とはより真値に近い評価を行う性質の強弱と言い換えることができる。

因子分析を応用して「正確に行う能力以外の特性」を反映する因子負荷量（寄与量）を求め、その影響を排除することとする。ここでも評価主体はモニター、つまり「人」とするが、もちろん「人」以外でもよい。
（１）変数の設定
まず、評価項目をｎ個、モニター１とモニター２による評価点を、それぞれ数列ｘ_１＝｛ｘ_１１、ｘ_２１…ｘ_ｉ１…ｘ_ｎ１｝、ｘ_２＝｛ｘ_１２、ｘ_２２…ｘ_ｉ２…ｘ_ｎ２｝で表す。例えば以下の実施例１及び２ではｎ＝２０で、モニターは１０人であるが、ここでは簡単のためにモニターを２人として説明する。実施例１及び２における評価結果は１〜１０の数であるが、これを平均０、分散１に規準化し、その結果を数列Ｚ_１＝｛Ｚ_１１、Ｚ_２１…Ｚ_ｉ１…Ｚ_ｎ１｝、Ｚ_２＝｛Ｚ_１２、Ｚ_２２…Ｚ_ｉ２…Ｚ_ｎ２｝で表す。すなわち基準値Ｚ_ｉｊを以下表１の数値を式に適用して求める。

因子分析では各評価項目の基準値Ｚ_ｉ１、Ｚ_ｉ２（ｉ＝１〜ｎ）が、共通因子と因子負荷量と独自因子とによって表されると仮定する（数１６の式）。因子負荷量ａ_１１とａ_１２は、モニター１の２つの因子の強さを表す。因子のうち一つ（たとえば第１因子であるａ_１１）をモニター１の正確さを反映すると仮定する。すなわち、この値が大きければ、モニター１の評価結果にはバラツキが少ないと考える。もう一つの因子（ａ_１２）を正確さ以外の特性を反映すると仮定する。また、独自因子とは、個々の評価結果のうち共通因子で説明できない要素である。
ここで、ａ_２１はモニター２の正確さを反映しａ_２２は、モニター２の「正確さ以外の何らかの特性」を反映すると仮定する。下記実施例２では「遠用を高得点に評価する傾向」がこの「正確さ以外の特性」に相当する。「遠用を高得点に評価する傾向」は「正確さ以外の特性」を反映する因子の典型的な例である。

ここでｆ_ｉ１、ｆ_ｉ２のそれぞれは平均０、分散１とする。
すなわち、Σｆ_ｉ１／ｎ＝Σｆ_ｉ２／ｎ＝０、Σｆ_ｉ１ ^２／ｎ＝Σｆ_ｉ２ ^２／ｎ＝１が成り立つ。
また、ｆ_ｉ１とｆ_ｉ２を互いに無相関な直交因子として仮定するので、積和の期待値が０である。すなわち、Σｆ_ｉ１ｆ_ｉ２／ｎ＝０が成り立つ。更にｆ_ｉ１とｅ_ｉ１、ｆ_ｉ１とｅ_ｉ２、ｆ_ｉ２とｅ_ｉ１、ｆ_ｉ２とｅ_ｉ２、ｅ_ｉ１とｅ_ｉ２もすべて無相関と仮定するので、それぞれの積和の期待値は０である。

（２）因子分析
Ｚｉ１の分散が１であることから、以下の数１７の式の関係を導くことができる。

ｆ_ｉ１、ｆ_ｉ２の分散が１であること、Σｆ_ｉ１ｆ_ｉ２／ｎ＝０であること、ｆ_ｉ１、ｆ_ｉ２、ｅ_ｉ１が無相関であることから、ｄ_１ ^２＝Σｅ_ｉ１ ^２／ｎとおくと式（１）が成り立つ。

同様にＺｉ２の分散が１であることから、式（２）が成り立つ。

Ｚ_ｉ１とＺ_ｉ２の相関係数をｒ_１２（＝ｒ_２１）とすると、式（３）が成り立つ。

以上の（１）（２）（３）より、相関行列Ｒを次式で近似的に表わすことができる。

ここで、相関行列Ｒを表す２つの行列式の各要素の差の二乗和を表す関数Ｑ（ａ_１１、ａ_２１、ａ_１２、ａ_２２）を想定し、この関数の値を最小にする条件にもとづいて、因子付加量の値を最適化手法により求める。
因子分析では、ａ_１１ ^２＋ａ_１２ ^２など、共通因子で説明できる部分を共通性、ｄ_１２、ｄ_２２を独自性と呼ぶ。独自性は独自因子の分散である。共通性と独自性の和を全変動と呼ぶ。因子分析では観測変数を平均０、分散１に規準化しているため、観測変数の全変動は１である。各項は実数の二乗なので、共通性と独自性の値は０〜１の範囲に制限される。このことから、因子負荷量を最適化するにあたっては、独自因子の範囲を０〜１に制限する拘束条件を設ける。
こうして因子負荷量の値を求めるが、その値は一意に定まるものではない。ある因子負荷量の組ａ_１１、ａ_２１、ａ_１２、ａ_２２が関数Ｑを最小にする場合、次式（数２２）で表される角度θの回転変換によって得られるｂ_１１、ｂ_２１、ｂ_１２、ｂ_２２の値の組も関数Ｑを最小にするからである。

そのため因子分析では、最適化によって求めた因子負荷量を適当に回転させて解釈する。回転の方法として例えばバリマックス法をはじめいくつかの方法が提案されている。
回転した因子負荷量を再びａ_１１、ａ_２１、ａ_１２、ａ_２２で表す。次にｉ＝１〜ｎについて、Ｚ_ｉ１からａ_１２ｆ_ｉ２を減じ、Ｚ_ｉ２からａ_２２ｆ_ｉ２を減じて、その結果をそれぞれＺ_ｉ１、Ｚ_ｉ２に置き換える。
こうして第２因子の影響を取り除いた新しい数列Ｚ_１＝｛Ｚ_１１、Ｚ_２１…Ｚ_ｉ１…Ｚ_ｎ１｝、Ｚ_２＝｛Ｚ_１２、Ｚ_２２…Ｚ_ｉ２…Ｚ_ｎ１｝を作り、それに対して１因子法を適用して真値の推定値を得る。１因子法を用いることなく、ここでｆ_ｉ１の値を真値の目安とすることもできる。ただし、それでは推定の精度がやや劣ると考えられる。何故ならば、「正確さ以外の特性」の因子負荷量が大きいモニターにおいては、「正確さ」の因子負荷量が相対的に小さくなる。すると、本来はそのモニターの「正確さ」が強い場合であっても加重平均の重みが小さくなり、そのモニターの評価結果からもたらされる情報を有効に活用できないからである。
因子数を２のままとして、評価結果の数列（モニターの人数）を３とした場合の相関行列を数２３として示す。また、因子数を３個想定し、評価結果の数列を３とした場合の相関行列を数２４として示す。

因子数またはモニター人数が３より多い場合の計算方法も同様なので、一般的な式として示すことができる。分析にあたって想定する因子の数は３より多くてもよく、その数は分析を行なう者が判断することになっている。例えば、評価対象として実施例１や２のようにレンズを例に取ると「レンズＡＢＣＤＥを高得点に、レンズＦＧＨＩＪを低得点に評価する傾向」が、モニターによって大小の違いがあるかもしれない。実施例２の問題設定に、更にその要素を加えれば、その分析を３因子で行うほうが適当となることもある。
このような因子分析の考えを利用すれば、本来必要な評価主体の評価能力以外の因子の影響を除去して評価主体の評価能力という評価因子だけにすることでより真値に近い値を推定することが可能となる。この計算も一般にはコンピュータによって計算することとなる。

上記各請求項の発明では、複数の評価主体それぞれが評価対象に関するある評価項目を数値化して評価した場合に、前記評価主体の数を増加させるに伴ってそれら評価結果の数値の平均値が収斂するであろう仮想的な真値を、多数の評価結果を得ることなく推定することができる。

実施例１及び２において横軸を「遠用性能」、横軸を「近用性能」とした評価項目について設定した真値の散布図。実施例１においてモニターの重みを考慮した場合において横軸を「遠用性能」、縦軸を「近用性能」とした評価項目について真値を推定して得た値（推定値）の散布図。実施例１においてモニター結果を単純に平均化した場合において横軸を「遠用性能」、縦軸を「近用性能」とした評価項目について真値を推定して得た値（推定値）の散布図。実施例１において横軸を「１−正確さ設定値」、縦軸を「√（１／推測値との相関係数−１）」とした正確さの散布図。実施例１において横軸を「真値との相関係数」、縦軸を「推測値との相関係数」とした相関係数の散布図。実施例２において横軸を第１因子、縦軸を第２因子とした場合の回転前の因子付加量の散布図。実施例２において横軸を第１因子、縦軸を第２因子とした場合の回転後の因子付加量の散布図。実施例２において横軸を設定値、縦軸を回転後の第２因子とした場合の散布図。実施例２においてモニターの重みを考慮した場合において横軸を「遠用性能」、縦軸を「近用性能」とした評価項目について因子分析の前処理を行なって得た値（推定値）の散布図。実施例２において因子分析による前処理をせず横軸を「遠用性能」、縦軸を「近用性能」とした評価項目についてそのまま１因子法で推定して得た値（推定値）の散布図。実施例２において横軸を「１−正確さ設定値」、縦軸を「√（１／推測値との相関係数−１）」とした正確さの散布図。実施例１において横軸を「真値との相関係数」、縦軸を「推測値との相関係数」とした相関係数の散布図。実施例３において横軸を第１因子、縦軸を第２因子とした場合の回転後の因子付加量の散布図。実施例３において各モニターの総合的な評価能力を比較して示す折れ線グラフ。実施例３において各モニターの遠方、中間、近方の各領域における評価能力を比較して示す折れ線グラフ。実施例３において各モニターの正面と周辺の見え方とユレ歪みについての評価能力を比較して示す折れ線グラフ。実施例３において各モニターの正面と周辺とユレ歪みについての評価能力を比較して示す折れ線グラフ。

以下、本発明の評価対象の評価項目の真値推定方法を眼鏡レンズ（累進屈折力レンズ）に応用した実施例について説明する。
ところで、ある評価対象の評価項目について具体的なデータを取得して真値を推定しても、実際にその推定が正しいかどうかの検証は困難である。そのため、実施例１及び２では前もって真値と、評価主体（モニター）毎に評価因子について数値を設定し、その数値と真値に適合するように評価項目の数値（評価点）を設定するようにした。そして、上記のような計算で評価項目から評価主体の重みを算出し、設定した評価因子の数値と比較することとした。

（実施例１）
実施例１ではＡ〜Ｊの１０種類のレンズを評価対象とした。また評価項目はここでは遠用の見えやすさと近用の見えやすさといった漠然とした評価を判断するものと仮定して「遠用性能」と「近用性能」の２種類とした。つまり、１０種類のレンズについて２つずつの評価項目であるため、計２０の評価項目があることとなる。遠用性能と近用性能の真値は２．５〜７．５の乱数により設定した。また、１０人のモニターについて、評価因子として「正確に行う能力（正確さ）」を０．０〜１．０の乱数により設定した。
評価点は、真値に対して平均０、標準偏差３×（１−正確さ）の正規分布乱数を加えてランダマイズした結果を四捨五入して整数とし、更に１０を超えた値は１０に、１未満の値は１として下限１から上限１０の間の整数とした。
設定されたモニターの正確さを表す数値は、表２の通りである。設定されたレンズの評価の真値は表３の通りである。モニターの正確さを表す数値と真値に基づいて設定された各モニターが実行した（と仮定する）「遠用性能」と「近用性能」の評価結果は表４の通りである。

（１）レンズの評価結果
Ａ〜Ｊのレンズの「遠用性能」と「近用性能」の評価項目の真値（つまり、表３）を平均０、分散１に規準化して図１に示す。真値とモニターの正確さを表す数値に単位は無いため、絶対的な値に特別な意味は無く、相対的な違い（ポジショニング）が重要である。そこで遠用性能を横軸、近用性能を縦軸にして、規準化した数値をもとに２次元配置して表す。
図２は各モニターにより得られた「遠用性能」と「近用性能」の評価項目の評価結果に基づいて上記のように相関係数を求め、ついで１因子法によって重みを算出し、その重みを考慮してＡ〜Ｊの１０種類のレンズについて真値を推定したものである。図２は非常に図１の真値に近い散布状態を示している。つまり、各モニター毎の固有の重みを考慮して平均を求めることで真値に近い水準で推定が可能であることがわかる。
一方、図３は単純に１０人のモニターの平均を取って重みを考慮しないで得られた評価項目の評価結果である。図１の真値とは大きくずれてしまっていることがわかる。

（２）モニターの正確さの評価
各モニターについて正確さを評価した。まず表２の「正確さ」の数値をそのまま「正確さ設定値」とする。そして、「１−正確さ設定値」「真値との相関係数」「推測値との相関係数」「√（１／推測値との相関係数−１）」のモニター毎の数値を比較した（表５）。
ここで、真値からの変位量の標準偏差の目安となるのは「１−正確さ設定値」である。また、「√（１／推測値との相関係数−１）」は標準偏差に比例するはずである。そこで、まず「１−正確さ設定値」と「√（１／推測値との相関係数−１）」を比較した。比較した結果は図４の通りである。
また、「真値との相関係数」と「推測値との相関係数」を比較した。比較した結果は図５の通りである。
図４横軸：１から「あらかじめ設定した正確さを表す値」を減じた値。値が小さいモニターほど正確で、大きいほど不正確。この値は真値からの変位量の標準偏差に比例する。
図４縦軸：「推測した真値」と「各モニターによる評価点」の相関係数をＸとしたときの、√（１／Ｘ−１）の値。この値は真値からの変位量の標準偏差に近似される。
図５横軸：「あらかじめ設定した真値」と「操作前の評価点」との相関係数。「操作前の評価点」とは、ランダマイズ・整数化・１〜１０範囲制限をする前の値のこと。
図５縦軸：「推測した真値」と「各モニターによる評価点」の相関係数。
図４と図５において、横軸は問題設定をした人でないとわからない値で、縦軸は与えられた評価点データのみから得ることができる値である。図５の分布は傾きが４５度の直線上に並ぶことが理想的となる。図４は比例関係を表すので、直線上に並ぶことが理想的だが、傾きが４５度とは限らない。
図４及び図５の結果、各モニターの正確さの推定値は設定値と概ね直線に沿っており、真値との相関係数を精度良く再現できていると考えることができる。

（実施例２）
実施例２でもＡ〜Ｊの１０種類のレンズを評価対象とした。また評価項目も同様に「遠用性能」と「近用性能」の２種類とした。また、１０人のモニターについて評価因子として実施例１と同様に「正確に行う能力（正確さ）」を０．０〜１．０の乱数により設定した。また、実施例２では遠用を高得点に評価する傾向（以下、「遠用高評価」と略称する）を−０．５〜＋０．５の乱数により設定した。遠用高評価がマイナスの値であれば、近用を高評価する傾向を表す。つまり、実施例１よりも１つ評価因子が多い設定とした。
設定されたモニターの正確さを表す数値は実施例１と同様である（表２）。設定された遠用高評価を表す数値は、表６の通りである。また、真値は実施例１と同様である（表３）。モニターの正確さを表す数値と真値に基づいて設定された各モニターが実行した（と仮定する）「遠用性能」と「近用性能」の評価結果は表７の通りである。

実施例２は「正確に行う能力（正確さ）」以外の因子負荷量（寄与量）を求め、その影響を排除することを説明する実施例である。ここでは「遠用高評価」という評価因子がそれに相当するという設定である。
以下、上記因子分析を利用した実施例２の結果について説明する。
（１）因子負荷量の回転
モニター間の評価能力に優劣差があると考えられる状況において、ある因子の因子付加量が正の値ばかりであれば、それは評価能力の強さ（バラツキの小ささ）を反映していると解釈することができる。その因子をある軸方向に沿って分布するように因子付加量を回転すれば、その他の因子はプラスとマイナスの範囲に亘って分布する。ここで「その他の因子」の平均は０であると仮定することができる。仮に「その他の因子」に偏りがあって、たとえば遠用を高得点に評価するモニターがたまたま多く含まれていた場合であっても、偏りがあるかどうかはわからないので、その平均値をもって真値を推定するより他は無い。結局「その他の因子」の平均値は０になると仮定して因子付加量を回転させることになる。
表８は回転前の第１因子と第２因子の因子負荷量であり、表９は回転後の第１因子と第２因子の因子負荷量である。対応する散布図は図６と図７である。図８に示すように、表６の設定値と推定された第２因子は概ね比例関係であり、回転後の第２因子付加量の値は、遠用高評価特性の設定値と概ね対応するといえる。似た傾向のモニター同士は相関係数が大きくなり、反対傾向のモニター同士は相関係数が小さくなる。その関係を利用してデータを設定した次元（因子の数）の空間に最適配置する手法が因子分析であると考えれば、これらの結果を理解しやすい。

（２）レンズ性能の評価結果
図９は実施例１と同様に各モニターの実行した「遠用性能」と「近用性能」の評価項目の評価結果に基づいて上記のように相関係数を求め、ついで１因子法によって重みを算出し、その重みを考慮してＡ〜Ｊの１０種類のレンズについて真値を推定したものである。図９は非常に図１の真値に近い散布状態を示している。つまり、各モニター毎の固有の重みを考慮して平均を求めることで真値に近い水準で推定が可能であることがわかる。
一方、図１０は因子分析による前処理をせず単に１因子法で推定した値を使用した場合である。図９に比べて精度が若干悪い。

（３）モニターの正確さの評価
各モニターについて、実施例１と同様に比較を行った。モニター毎の数値は表１０に示す通りである。実施例１と同様に「１−正確さ設定値」と「√（１／推測値との相関係数−１）」を比較した。比較した結果は図１１の通りである。
また、実施例１と同様に「真値との相関係数」と「推測値との相関係数」を比較した。比較した結果は図１２の通りである。推定の精度は実施例１よりもやや悪かったものの、真値との相関係数を精度良く再現できていると考えることができる。

（実施例３）
実施例３は９名のモニターが５種類の累進屈折力レンズを評価した結果にもとづいて真値を推定する例である。これは上記実施例１及び２と異なり真値があらかじめ分かっているわけではない。また、あらかじめモニター毎に評価因子について数値を設定するものでもなく、実際にモニターが評価項目について評価をした結果に基づいて実際は不明な真値との相関係数を求め、更にモニター毎の加重平均の重みを求めるようにしている。
モニターをＭ、Ｓ１、Ｙ、Ｈ、Ｓ２、Ｎ、Ｉ、Ｓ３、Ｋのイニシャルで表した。各モニターのレンズ度数等のデータについては表１１に示す通りである。累進屈折力レンズはそれぞれレンズ特性の異なる出願人の会社製のＡ〜Ｅを使用した。累進屈折力レンズはすべて素材屈折率１．６とした。設計種別は「中近累進」や「近々累進」ではなく、すべて「遠近累進」に分類されるものである。ただし、商品によって遠用重視・中近重視といった特性の違いがある。モニターのうち３名（Ｉ、Ｓ３、Ｋ）は、４種類のレンズのみを評価した。
実施例３では実施例１及び２よりも評価項目はより詳細になっている。表１２及び表１３に示すように、各レンズの遠方、中間、近方の各領域について「正面の見え方」「周辺の見え方」「ユレ」「歪み」を評価した。つまり、評価項目は５つのレンズそれぞれに１２あり、かつモニターは９人なので評価点のデータ列は５・１２・９＝５４０となるが、実際にはモニターを実施していない評価項目があるので若干データは少ない。

（１）因子分析の結果
因子数を２に設定した因子分析を行った。因子の回転は、因子２の因子負荷量の重み付き平均を０にする条件で行った。重みは因子１の因子負荷量の値とし、因子１の因子負荷量がマイナスの場合は重みを０とした。重み付けをする理由は、因子１の因子負荷量が小さいモニター結果の信頼性が劣るためである。回転後の第１因子と第２因子の因子負荷量は表１４の通りである。また、分布図は図１３の通りである。
（２）モニターの正確さと重み付け
第２因子の影響を排除して、１因子法による分析を行ない、各モニターによる評価結果と真値の組との相関係数を推定した。その結果、すなわち第ｉ番目のモニターによる評価結果と真値の組との相関係数をｒ_ｉとし、ｒ_ｉ／（１−ｒ_ｉ）を重みとした加重平均により各評価項目の真値の組の推定値を算出した。また、加重平均により推定した真値の組と各モニターの評価結果の相関係数を求め、それを正確さの目安とした。それらの結果を表１５に示す。このようにして、再度相関係数を求める方法によれば「各モニターの正確さの目安となる値」として、相関係数の値を安定的に算出することができる。１因子法の計算では、ｒ_ｉ・ｒ_ｊとｒ_ｉｊの値を一致させることだけを目標とするので、各モニターは概ね同じ感覚をもってレンズの良し悪しを評価しているはずなのに相関係数がマイナスになったり、１を超えたりすることがある。それは相関係数の値としては不自然な値である。
（３）レンズ性能の評価
加重平均で推定した値と単純平均の結果をそれぞれ表１６と表１７において比較した。両方とも、平均０、分散１で規格化した数値である。両者の違いが大きい項目を太字で表した。

（４）モニターの正確さの評価
以上の説明で求めた正確さを「総合的な正確さ」とする。次に、各レンズに関して１２個ずつ設定した評価項目のうち、遠用に関する評価結果のみを利用して「遠用評価の正確さ」を求めた。すなわち、モニター評価の結果として得たデータの約１／３のみを利用して分析を行なったのである。その計算においては、９人のうち２人のモニターの相関係数を求める際の評価点データの数が少なくなり、２人が共通して評価したレンズの種類×４個となるが、それ以後の手順はすべて同じである。同様にして「中間評価の正確さ」「近用評価の正確さ」を求めた。
更に「正面の見え方」と「周辺の見え方」をひとまとめにした「見え方」と、「ユレ」と「歪み」をひとまとめにした「ユレ歪み」の２区分を想定し、それぞれの正確さを求めた。次いで、「正面の見え方」「周辺の見え方」「ユレ」「歪み」の４区分の正確さを求めた。
以上のすべてにおいて因子を２つ設定した因子分析を行い、第２因子の成分を除去してから１因子法で決定した重みによる加重平均から評価対象の評価項目の真値の推定値を得た。そのようにして得た真値の推定値をもとに、各モニターの正確さの目安（推定した真値との相関係数）を求めた。結果は図１４〜図１７に示す通りである。
１）総合的な正確さ、２）中間評価の正確さ、３）見え方評価の正確さ、４）ユレの正確さにおいて、モニター相互の関係が似ている。遠中近の正確さはそれぞれ異なり、特に遠用でモニター相互の差が大きいこれは中間→近用→遠用の順で見方（視線の使い方）に個人差が大きいためと考えられる。ユレ歪みではユレの正確さが、遠中近では中間の正確さがそれぞれ支配的になり、それらが総合的な正確さに影響したと考えられる。

尚、この発明は、次のように変更して具体化することも可能である。
・上記実施例では第ｉ番目のモニターによる評価結果と真値の組との相関係数をｒ_ｉとして、ｒ_ｉ／（１−ｒ_ｉ）を真値を推定する際の加重平均の重みとした。推定の精度は劣るが、手順を簡略化するためにｒ_ｉをそのまま重みとして計算してもよい。また、ｒ_ｉがマイナスになった場合は便宜的に重みを０にしてもよいし、ｒ_ｉを最適化する計算においてマイナスにならないようにする制限（非負拘束）をかけてもよい。また、ｒ_ｉが１に近いとｒ_ｉ／（１−ｒ_ｉ）の値が極めて大きくなり、特定の評価主体による評価結果がそのまま加重平均となる。それでは、複数の評価主体によって評価を行なった意味が薄れてしまうので、ｒ_ｉ／（１−ｒ_ｉ）の値に適当な上限を設けてもよい。その上限値はモニター人数の１〜２倍程度の値（１０人なら１０〜２０程度）が適当である。相関係数と加重平均の重みの関係は近似的なものなので、相関係数に基づいて重みを決定する方法にはこのような裁量が考えられる。
・１因子法においてｒ_ｉを最適化計算により算出したが、真値の組の推定値を直接最適化してもよい。具体的には、次のようにする。真値の組の推定値に適当な初期値を与えると各ｒ_ｉの値が定まる。そうして定まったｒ_ｉ・ｒ_ｊと、モニター評価結果から既知のｒ_ｉｊの差の二乗和を最小にするように、真値の組の推定値を最適化する。ただし、その方法では上記した重み決定の際の配慮ができないので、推定の精度はやや不利である。また、各モニターによる評価結果と推定した真値の組との相関係数を再度求めることにより「各モニターの正確さの目安」を安定した値として求めることもできない。
・上記実施例では一例としてレンズを評価対象としたが、評価対象を例えば薬に代えてモニターの臨床結果を評価項目として評価するような場合に適用してもよい。実施例では評価対象のレンズを複数としたが、仮に薬の種類が１種類であっても、臨床結果がたとえば多種類の臓器に関するもので評価項目が３つ以上あれば本発明を適用することができる。すなわち、モニターの数を多くすることなく、その薬の効果をより正確に把握することができる。
・１年の重大ニュース１０件を重要度の順位をつけて新聞の記事にするような場合に適用してもよい。少人数の記者が候補のニュース５０件について重要度を採点したとする。平均点の大きい順に１〜１０位を決定するのではなく本発明を適用すると、より大勢の人の平均的な感覚に近い順位づけができる。この場合は評価対象が５０個で、個別評価項目が１個の例である。それぞれの記者に対して「政治経済を重視し文化社会を軽視する傾向」のプラスとマイナスといった因子が見つかれば、その影響を排除する。そのようにして「各記者がニュースの重大さを評価する能力」の強さをより正確に重みとして反映できる。
その他本発明の趣旨を逸脱しない態様で実施することは自由である。

Claims

複数の評価主体それぞれが評価対象に関するある評価項目を数値化して評価した場合に、前記評価主体の数を増加させるに伴ってそれら評価結果の数値の平均値が収斂するであろう仮想的な真値を、評価主体の数を多数にすることなく推定するための真値推定方法であって、前記評価項目を評価した前記評価主体の評価能力の大小を反映する数値を各評価主体毎に算出し、それらの数値に基づいて算出した各評価主体毎の重みを考慮して真値を推定するようにしたことを特徴とする評価対象の評価項目の真値推定方法。
複数の前記評価主体のうちのすべての２つの組み合わせの前記評価主体のそれぞれの評価項目に対する評価結果に基づいて相関係数を求め、得られた前記相関係数に基づいて各評価主体に対する評価能力の大小を反映する数値を各評価主体毎に算出し、それらの数値に基づいて各評価主体毎の前記重みを算出するようにしたことを特徴とする請求項１に記載の評価対象の評価項目の真値推定方法。
ｋを「１」から「評価項目の数」まで変わるインデックスとし、ｎを評価項目の数とし、評価項目の真値のデータ列Ｗ_ｋを平均０となるように規準化したものとして想定し、２つの前記評価主体のそれぞれの評価項目に対する評価結果のデータ列を平均０となるように規準化してｘ_ｋ、ｙ_ｋとおいた場合に、ｘ_ｋ、ｙ_ｋを下記数１の式によって近似的に示し、ｘ_ｋ、ｙ_ｋの前記相関係数ｒを下記数２の式によって近似的に示したことを特徴とする請求項２に記載の評価対象の評価項目の真値推定方法。
ｉを「１」から「評価主体の数」まで変わるインデックスとし、ｒ_ｉを第ｉ番目のモニターによる評価項目に対する評価値と真値のデータ列Ｗ_ｋとの前記相関係数として、前記相関係数群ｒ_ｉに基づいてデータ列Ｗ_ｋの各値を推定するようにしたことを特徴とする請求項２又は３に記載の評価対象の評価項目の真値推定方法。
ｉを「１」から「評価主体の数」まで変わるインデックスとし、ｒ_ｉを第ｉ番目のモニターによる評価値と真値のデータ列Ｗ_ｋとの前記相関係数とした場合に、前記重みをｒ_ｉ／（１−ｒ_ｉ）とすることを特徴とする請求項２〜４のいずれかに記載の評価対象の評価項目の真値推定方法。
前記評価主体の評価能力とは前記評価主体が評価を正確に行う能力であることを特徴とする請求項１〜５のいずれかに記載の評価対象の評価項目の真値推定方法。
前記評価主体の評価能力は複数の想定した評価因子の１つであることを特徴とする請求項１〜６のいずれかに記載の評価対象の評価項目の真値推定方法。
評価値を複数の評価因子による寄与量と独自因子の和によって近似的に表すと想定し、前記評価主体の評価能力以外の評価因子の寄与量を評価値から減じた結果に基づいて真値を推定するようにしたことを特徴とする請求項１〜７のいずれかに記載の評価対象の評価項目の真値推定方法。
多変量解析によって前記評価因子の寄与量を算出するようにしたことを特徴とする請求項１〜８のいずれかに記載の評価対象の評価項目の真値推定方法。
評価主体は人間であることを特徴とする請求項１〜９のいずれかに記載の評価対象の評価項目の真値推定方法。
評価対象は眼鏡用レンズであることを特徴とする請求項１〜１０のいずれかに記載の評価対象の評価項目の真値推定方法。