JP2011257676A

JP2011257676A - 試験パラメータ推定方法、試験パラメータ推定プログラム、試験パラメータ推定装置

Info

Publication number: JP2011257676A
Application number: JP2010133762A
Authority: JP
Inventors: Yoshiki Samejima; 吉喜鮫島
Original assignee: Hitachi Solutions Ltd
Current assignee: Hitachi Solutions Ltd
Priority date: 2010-06-11
Filing date: 2010-06-11
Publication date: 2011-12-22

Abstract

【課題】項目反応理論における被験者の能力値パラメータの推定値誤差を小さくする。
【解決手段】本発明に係る試験パラメータ推定方法では、能力値パラメータθ_ｉを正規化することに加え、θ_ｉの分布が正規分布に近づくように、大小関係を維持しつつ、θ_ｉの値を分布関数の変数軸上で移動させる。
【選択図】図３

Description

本発明は、項目反応理論を用いた試験に係るパラメータを推定する手法に関するものである。

項目反応理論は、試験問題などの評価項目に対する被験者の応答（試験問題であれば回答結果）に基づき、被験者の特性（能力など）、評価項目が被験者の特性を識別する力、評価項目の難易度などを測定するための試験理論である。以下、項目反応理論の基本的な仕組みについて説明する。

試験項目ｊの識別力パラメータをａ_ｊ、試験項目ｊの困難度パラメータをｂ_ｊ、被験者ｉの能力値パラメータをθ_ｉとする。また、被験者ｉの試験項目ｊに対する正誤を、正答である場合は１、誤答である場合は０として表した正誤結果パターンをｕ_ｉｊとする。下記式１に示すＬを最大化するａ_ｊ、ｂ_ｊ、θ_ｉを求めることにより、ａ_ｊ、ｂ_ｊ、θ_ｉを推定する。

上記式１において、Ｄは尺度因子と呼ばれる定数であり、およそ１．７である。
上記式１のＬを最大化するａ_ｊ、ｂ_ｊ、θ_ｉを求めるに際し、同式のままでは扱いにくいので、Ｌの自然対数を最大化するａ_ｊ、ｂ_ｊ、θ_ｉを求めることにする。

上記式２のｌｎＬが最大になるとき、式２をａ_ｊ、ｂ_ｊ、θ_ｉでそれぞれ微分した値は０となるはずである。そこで、下記式３〜式５を満たすａ_ｊ、ｂ_ｊ、θ_ｉをそれぞれ求めることとする。式３〜式５を満たすａ_ｊ、ｂ_ｊ、θ_ｉを求める手法の例として、例えばニュートン法がある。

図１は、式３〜式５を満たすａ_ｊ、ｂ_ｊ、θ_ｉを、ニュートン法によって求める際の処理フローを示す図である。以下、図１の各ステップについて説明する。

（図１：ステップＳ１０１）
ａ_ｊ、ｂ_ｊ、θ_ｉそれぞれの初期値として、ａ_ｊ ^０、ｂ_ｊ ^０、θ_ｉ ^０を定める。例えば、ａ_ｊ ^０＝１、ｂ_ｊ ^０＝０、θ_ｉ ^０＝０とする。
（図１：ステップＳ１０２）
ｂ_ｊ＝ｂ_ｊ ^０、θ_ｉ＝θ_ｉ ^０と置いて、式３を満たすａ_ｊ＝ａ_ｊ ^１を、ニュートン法によって求める。

（図１：ステップＳ１０３）
ａ_ｊ＝ａ_ｊ ^０、θ_ｉ＝θ_ｉ ^０と置いて、式４を満たすｂ_ｊ＝ｂ_ｊ ^１を、ニュートン法によって求める。
（図１：ステップＳ１０４）
ａ_ｊ＝ａ_ｊ ^０、ｂ_ｉ＝ｂ_ｉ ^０と置いて、式５を満たすθ_ｉ＝θ_ｉ ^１を、ニュートン法によって求める。

（図１：ステップＳ１０５）
ステップＳ１０２で求めたａ_ｊ ^１とａ_ｊ ^０の差、ステップＳ１０３で求めたｂ_ｊ ^１とｂ_ｊ ^０の差、ステップＳ１０４で求めたθ_ｉ ^１とθ_ｉ ^０の差をそれぞれ求める。
（図１：ステップＳ１０６）
ステップＳ１０５で求めた３つの差分値が所定の閾値未満であればステップＳ１０７へ進み、少なくともいずれかの差分値が閾値以上であればステップＳ１０８へ進む。

（図１：ステップＳ１０７）
現在のａ_ｊ＝ａ_ｊ ^１、ｂ_ｊ＝ｂ_ｊ ^１、θ_ｉ＝θ_ｉ ^１の値を、各パラメータの推定結果とし、本処理フローを終了する。
（図１：ステップＳ１０８）
ａ_ｊ ^０、ｂ_ｊ ^０、θ_ｉ ^０を現在のａ_ｊ＝ａ_ｊ ^１、ｂ_ｊ＝ｂ_ｊ ^１、θ_ｉ＝θ_ｉ ^１で置き換え、ステップＳ１０２に戻って同様の処理を繰り返す。

以上、各試験パラメータを推定する従来の手法を説明した。
図１の処理フローを実行していく過程で、ステップＳ１０５における３つの差分値が次第に小さくなり、ａ_ｊ、ｂ_ｊ、θ_ｉそれぞれの値が収束していく。しかし、その結果得られる値は、各パラメータの真の値から離れていることが、実験的に分かっている。

これを回避する手法として、下記非特許文献１には、θ_ｉを正規化する手法が記載されている。同文献では、図１のステップＳ１０４で求まるθ_ｉ ^１の平均値をμ、標準偏差をσとして、θ_ｉ ^０＝（θ_ｉ ^１−μ）／σと置き換え、θ_ｉの平均が０、標準偏差が１となるようにしている。

豊田秀樹，項目反応理論［理論編］，１．２．３節，ｐ．１５，朝倉書店，２００５年

上記非特許文献１に記載の手法では、θ_ｉを正規化することにより、θ_ｉの誤差を小さくすることを図っているが、誤差を完全になくすことは難しい。

本発明は、上記のような課題を解決するためになされたものであり、項目反応理論における被験者の能力値パラメータの推定値誤差を、より小さくすることを目的とする。

本発明に係る試験パラメータ推定方法では、能力値パラメータθ_ｉを正規化することに加え、θ_ｉの分布が正規分布に近づくように、大小関係を維持しつつ、θ_ｉの値を分布関数の変数軸上で移動させる。

本発明に係る試験パラメータ推定方法によれば、θ_ｉの分布を正規分布に近づけるように各θ_ｉの値を移動させることにより、θ_ｉの推定誤差を小さくすることができる。特に被験者数が多くなると、θ_ｉの分布は正規分布に近づくと予想されるので、θ_ｉの分布を正規分布に近づけることの効果を有効に発揮することができる。

式３〜式５を満たすａ_ｊ、ｂ_ｊ、θ_ｉを、ニュートン法によって用いる際の処理フローを示す図である。能力値パラメータθ_ｉの分布を正規分布に近づける処理の考え方を説明する図である。図２で説明した、能力値θ_ｉの分布を補正する手順を実行する処理フローである。ｂ_ｊの推定結果に基づくｂ_ｊの分布と、ｂ_ｊの各値に対応するａ_ｊの分布を示す図である。ａ_ｊの２次分布の標準誤差を合算する過程を示す図である。図４〜図５で説明した、ａ_ｊの標準誤差を再算出する手順を実行する処理フローである。実施形態３に係る、能力値θ_ｉの分布を補正する手順を実行する処理フローである。実施形態６に係る試験パラメータ推定装置８００の機能ブロック図である。

＜実施の形態１＞
以下、本発明の実施形態１に係る試験パラメータ推定方法を説明する。本実施形態１では、能力値パラメータθ_ｉの分布を正規分布に近づけることにより、θ_ｉの推定結果の誤差を小さくすることを図る。

図２は、能力値パラメータθ_ｉの分布を正規分布に近づける処理の考え方を説明する図である。図２（ａ）はθ_ｉの分布が正規分布になっている場合の度数分布、図２（ｂ）は図１の処理フローで求められるθ_ｉの推定結果に基づく度数分布例を示す。ここでは、平均＝０、標準偏差＝１となる正規分布関数の例として、下記式６を用いた。

計算の便宜上、以下では図２の度数分布を、−３．０≦θ_ｉ≦３．０の範囲で０．５ずつ１２個の区間に区切り、さらにθ_ｉ＜−３．０の区間とθ_ｉ＞３．０の区間を加えた１４個の区間に区分けする。

図２（ａ）において、θ_ｉの総数が１００００個である場合、−３．０よりも小さいθ_ｉの個数は、下記式７で求められる。

したがって、θ_ｉが正規分布にしたがっている場合、−３．０よりも小さいθ_ｉの値は１３個存在するはずである。ところが、図１の処理フローを用いて推定したθ_ｉは推定誤差を含んでおり、必ずしも正規分布にしたがわない。そのため、−３．０よりも小さいθ_ｉの個数は、必ずしも１３個にならない。例えば、図２（ｂ）において、−３．０よりも小さいθ_ｉが１２個しか存在しない、などの推定結果が生じる可能性がある。

図１の処理フローを用いて推定したθ_ｉの分布を正規分布に近づけることにより、θ_ｉの推定誤差は小さくなると考えられる。本実施形態１では、θ_ｉの分布を正規分布に近づけるためには、各区間におけるθ_ｉの個数が、正規分布における各区間内のθ_ｉの個数と等しくなるように、図２（ｂ）の分布を補正すればよいと考える。

そこで本実施形態１では、図２（ｂ）の各区間におけるθ_ｉの個数が、正規分布における各区間内のθ_ｉの個数と等しくなるように、θ_ｉの値を図２の横軸（変数軸）上で移動させる。

上述の例の場合、−３．０よりも小さいθ_ｉが１２個しか存在しないので、−３．０≦θ_ｉ≦−２．５の区間からθ_ｉの値を１つ抜き出してマイナス方向に移動させ、−３．０よりも小さいθ_ｉが１３個となるように、θ_ｉの分布を補正すればよい。

ただし、各θ_ｉの値は、被験者ｉの能力値を示すので、試験の意義を没却しないためにも、各被験者ｉの能力値θ_ｉの大小関係が入れ替わらないようにする必要がある。

そこで具体的な処理としては、図１の処理フローによって得られたθ_ｉの系列のうち、値が小さいほうから順に１３個を抽出し、小さいほうから１３番目の値が−３．０（または−３．０より僅かに小さい値）となるように、１３個のθ_ｉを同じ量だけマイナス方向に移動させればよい。区間の境界上の値は、いずれかの区間に含めるなどして適宜取り扱えばよい。

同様に、図２（ａ）において、θ_ｉの総数が１００００個である場合、−３．０≦θ_ｉ≦−２．５の区間におけるθ_ｉの個数は、下記式８で求められる。

したがって、−３．０≦θ_ｉ≦−２．５の区間におけるθ_ｉの分布を正規分布に近づけるためには、図１の処理フローによって得られたθ_ｉの系列のうち、−３．０≦θ_ｉ≦−２．５の区間におけるθ_ｉの個数が４９個となるように、小さいほうから数えて１４番目〜６２番目の４９個のθ_ｉを、それぞれ同じ量だけ移動させればよい。

以下同様にして、各区間におけるθ_ｉの個数が、正規分布における同じ区間内のθ_ｉの個数と等しくなるように、θ_ｉの値を同じ量だけ移動させる。これにより、全ての区間において、θ_ｉの個数は正規分布と等価になり、最終的に得られるθ_ｉの分布は正規分布に近づくものと想定される。

なお、以上の手順において、各被験者ｉの能力値θ_ｉの大小関係が入れ替わらないように配慮しているので、θ_ｉの値を移動させて補正したとしても、補正前における能力値パラメータ系列θ_ｉが表す各被験者の能力は、略等価に保たれている。特に項目反応理論では、各被験者の絶対評価を算出するのではなく、当該試験項目における他の被験者との間の相対的な評価を算出するものであるため、上記補正によって試験パラメータの精度が損なわれるものではないと考えられる。

以上、本実施形態１に係る試験パラメータ推定方法の考え方を説明した。以下では具体的な処理フローについて説明する。

図３は、図２で説明した、能力値θ_ｉの分布を補正する手順を実行する処理フローである。以下、図３の各ステップについて説明する。

（図３：ステップＳ３００）
図１で説明した処理フローを実行した後、本処理フローを開始する。
（図３：ステップＳ３０１）
変数Ｍ０の値をＭ０＝１として初期化する。

（図３：ステップＳ３０２）
以下のステップＳ３０３〜Ｓ３０６を、図２で説明した１４個の区間、すなわち、−３．０＜θ_ｉの区間、−３．０≦θ_ｉ≦３．０の範囲で０．５ずつ区切った１２個の区間、およびθ_ｉ＞３．０の区間それぞれについて実行する。
（図３：ステップＳ３０３）
正規分布上における当該区間内のθ_ｉの個数Ｍ１を求める。算出方法は、θ_ｉの総数に応じて、上述の式７および式８と同様の手順を用いる。例えば−３．０＜θ_ｉの区間であれば、Ｍ１＝１３となる。

（図３：ステップＳ３０４）
図１で求めたθ_ｉのうち、小さい方から数えてＭ０番目〜Ｍ１番目を抽出する。例えば−３．０＜θ_ｉの区間であれば、Ｍ０＝１番目からＭ１＝１３番目までの１３個の値を抽出する。
（図３：ステップＳ３０５）
ステップＳ３０４で抽出したＭ１個のθ_ｉの値が当該区間内に収まるように、各θ_ｉを同じ量だけずらす。
（図３：ステップＳ３０６）
変数Ｍ０にＭ１の値を加算する。本ステップは、ステップＳ３０４を次回実行するときに抽出を開始するθ_ｉの初期値をセットする意義がある。

＜実施の形態１：まとめ＞
以上のように、本実施形態１によれば、θ_ｉが正規分布にしたがう場合における各区間内のθ_ｉの個数と、図１の処理フローによって推定した各区間におけるθ_ｉの個数とが同一になるように、同区間におけるθ_ｉの値を、それぞれ同じ量だけずらす。これにより、補正後のθ_ｉの分布は正規分布に近づくので、θ_ｉの推定精度を向上させることができる。特に被験者の数が多い場合には、θ_ｉの分布は正規分布に近いと想定されるので、本実施形態１の効果が有効に発揮される。

また、本実施形態１によれば、各区間におけるθ_ｉの値をずらす補正を実施する際に、各区間における補正前のθ_ｉの大小関係を補正後も維持する。これにより、補正後の能力値パラメータθ_ｉは、各被験者ｉの相対的な能力値を反映した状態が保たれるので、補正によって能力値の推定結果を破損することなく、推定精度を向上させることができる。

なお、本実施形態１において、θ_ｉの値を１４個に区分したが、これは計算の便宜上のものであり、区分の仕方はこれに限られるものではない。区分の上限値３．０と下限値−３．０についても同様である。また、正規分布関数は、式６以外の関数を用いてもよい。以下の実施形態でも同様である。

＜実施の形態２＞
本発明の実施形態２では、実施形態１で説明した手法に加え、または実施形態１で説明した手法とは独立に、各試験パラメータの標準誤差を小さく抑える手法を説明する。

図１を用いて説明した従来の推定手順において、各試験パラメータａ_ｊ、ｂ_ｊ、θ_ｉの推定結果と真の値との間には、誤差が生じている。この誤差の標準偏差を標準誤差と呼ぶ。すなわち、ａ_ｊ、ｂ_ｊ、θ_ｉが一定であっても、被験者が試験を受けるたびに正誤結果パターンｕ_ｉｊが変わり、ａ_ｊ、ｂ_ｊ、θ_ｉの推定結果も変わる。このときの標準偏差が標準誤差となる。なお、推定結果の平均は、真の値にほぼ等しいと想定される。

各試験パラメータの標準誤差は、フィッシャ情報量に基づき、下記式９〜式１１で求められる。

上記式９〜式１１で求められる標準誤差は、真の標準誤差からずれている。これは、各標準誤差を算出する際に用いる計算式内に他の試験パラメータが含まれており、他の試験パラメータにばらつきが内在しているからであると思われる。

そこで本実施形態２では、各標準誤差を算出する際に用いる他の試験パラメータのばらつきを加味して、改めて標準誤差を算出することを図る。以下、ａ_ｊの標準誤差を算出する手順を例にとり、本実施形態２における処理の考え方を説明する。

ａ_ｊの標準誤差を算出するための式９において、ｂ_ｊの推定値を用いる必要がある。しかしｂ_ｊの推定値は、ばらつきを内在している。そこで、ａ_ｊの標準誤差を算出するに際して、ｂ_ｊが取り得る値毎にａ_ｊの標準誤差を算出し、ｂ_ｊがその値を取り得る割合を乗算した上で合算する。

図４は、ｂ_ｊの推定結果に基づくｂ_ｊの分布と、ｂ_ｊの各値に対応するａ_ｊの分布を示す図である。以下、図４の各図について説明する。

図４（ａ）は、ｂ_ｊの推定結果に基づくｂ_ｊの分布を示す図である。ここでは、図１または実施形態１で説明した手法を用いて各試験パラメータａ_ｊ、ｂ_ｊ、θ_ｉを推定したものと仮定する。ａ_ｊの推定値は１．５、式９を用いて算出した標準誤差は０．２であるものとする。ｂ_ｊの推定値は１．０、式１０を用いて算出した標準誤差は０．１であるものとする。

ｂ_ｊの推定値は、上述の通り１．０であることが既に算出済みであるが、実際にはばらつきが内在しているので、ｂ_ｊがその他の値を取る可能性もある。そこで、推定値１．０を中心として、標準誤差０．１を用いて正規分布を作成し、他の取り得る値を把握する。この場合の正規分布関数は、実施形態１とは平均値（推定値）、標準偏差が異なるので、以下の式１２となる。

以後の計算の便宜上、図４（ａ）に示す正規分布を、１．０を中心として＋−０．３の範囲、すなわち０．７≦ｂ_ｊ≦１．３の６区間に区分けする。さらに、ｂ_ｊ＜０．７の区間とｂ_ｊ＞１．３の区間を加え、合計８つの区間に区分けする。

次に、各区間の代表値を定める。０．７≦ｂ_ｊ≦１．３の区間では、中心値を代表値とする。ｂ_ｊ＜０．７の区間における代表値はｂ_ｊ＝０．６５、ｂ_ｊ＞１．３の区間における代表値はｂ_ｊ＝１．３５とする。

図４（ｂ１）〜図４（ｂ８）は、図４（ａ）で定めたｂ_ｊの各代表値に対応するａ_ｊの２次的な推定値の分布を示す図である。ｂ_ｊ＝１．０のときにおけるａ_ｊの推定値は１．５であることが既に算出済みであるので、図４（ａ）で定めたｂ_ｊの各代表値に対応するａ_ｊの推定値を、２次推定値として改めて算出する。また、そのときのａ_ｊの標準誤差を、２次標準誤差として改めて算出する。

例えば、ｂ_ｊの代表値＝０．６５のときのａ_ｊの２次推定値は、ｂ_ｊ＝０．６５と置いたときの式３を満たすａ_ｊの値として求められる。同様に、ｂ_ｊの代表値＝０．６５のときのａ_ｊの２次標準誤差は、ｂ_ｊ＝０．６５と置いて式９により求められる。

図４（ｂ１）は、ｂ_ｊの代表値＝０．６５のときのａ_ｊの２次推定値が１．３であり、ａ_ｊの２次標準誤差が０．１であるときにおける、ａ_ｊの分布を示す。同様に、ｂ_ｊの代表値＝０．７５のときのａ_ｊの分布〜ｂ_ｊの代表値＝１．３５のときのａ_ｊの分布を求める。最終的には、図４（ａ）の８つの区分に対応する８つの分布が得られる。この８つの分布を便宜上、ａ_ｊの２次分布と呼ぶ。

ａ_ｊの８つの２次分布それぞれにおいて、ａ_ｊの本来の推定結果である１．５との間の誤差が生じている。したがって、この誤差の標準偏差、すなわちａ_ｊの２次分布の標準誤差を求めることができる。ａ_ｊの２次分布の標準誤差は、ｂ_ｊの推定結果に内在するばらつきを勘案した標準誤差であるといえる。

図５は、ａ_ｊの２次分布の標準誤差を合算する過程を示す図である。図５（ｂ１）は図４（ｂ１）に対応する。図５（ｂ１）に示す２次分布を図４（ａ）と同様に８つの区間に区分けし、各区間の代表値と、ａ_ｊの本来の推定値である１．５との差分を２乗し、当該区間が２次分布全体に占める割合を乗算して合算する。

例えば図５（ｂ１）のａ_ｊ＜１．０の区間における代表値は０．９５であるので、ａ_ｊの本来の推定値である１．５との差分は０．５５となる。また、ａ_ｊ＜１．０の区間がａ_ｊの２次分布全体に占める割合は、式７と同様に０．００１３となる。（１．５−０．９５）の２乗と０．００１３を乗算する。

同様に、１．０≦ａ_ｊ≦１．１の区間における代表値は１．０５であるので、ａ_ｊの本来の推定値である１．５との差分は０．４５となる。また、１．０≦ａ_ｊ≦１．１の区間がａ_ｊの２次分布全体に占める割合は、式７と同様の手法で算出すると、０．０２１５となる。（１．５−１．０５）の２乗と０．０２１５を乗算する。

以下同様にこれらの値を各区間について求めて合算し、変数Ｓ２に代入し、ｂ_ｊの代表値＝０．６５のときのＳ２を算出する。以下では、ｂ_ｊの代表値＝０．６５のときのＳ２を、Ｓ２｛ｂ_ｊ：０．６５｝と表記することにする。この算出過程を図５（ｂ１）の右端に示した。

以上の手順を、ｂ_ｊの各代表値について実施すると、ｂ_ｊの各代表値に対応するＳ２の値が求まる。すなわち、Ｓ２｛ｂ_ｊ：０．６５｝〜Ｓ２｛ｂ_ｊ：１．３５｝の８つのＳ２が求まる。各Ｓ２の値を、当該区間がｂ_ｊの全体分布に占める割合と乗算し、足し合わせたものを、変数Ｓ１に代入する。

この変数Ｓ１は、ｂ_ｊが取り得る値毎にａ_ｊの標準誤差を算出し、ｂ_ｊがその値を取り得る割合を乗じて合算したものであるといえる。したがって、変数Ｓ１の平方根を求めることにより、ｂ_ｊの推定結果に内在するばらつきを加味したａ_ｊの標準誤差を求めることができる。

図６は、図４〜図５で説明した、ａ_ｊの標準誤差を再算出する手順の処理フローである。以下、図６の各ステップについて説明する。ｂ_ｊ、θ_ｉの標準誤差についても同様の手順で再算出することができる。

（図６：ステップＳ６００）
図１および図３で説明した処理フローを実行した後、本処理フローを開始する。
（図６：ステップＳ６０１）
変数Ｓ１の値を０に初期化する。また、図１および図３の処理フローで求めたｂ_ｊの推定値と、式１０で求められる標準誤差とを用いて、ｂ_ｊの正規分布を求める。本ステップは、図４（ａ）で説明したｂ_ｊの正規分布を求める手順に相当する。

（図６：ステップＳ６０２）
ステップＳ６０１で作成したｂ_ｊの正規分布を、図４（ａ）で例示したような複数区間に区分けする。以下のステップＳ６０３〜Ｓ６１２を、ｂ_ｊの正規分布の各区間について実行する。
（図６：ステップＳ６０３）
ｂ_ｊの正規分布上の区間を、例えばｂ_ｊの値が小さい側から順に１つ選択する。ｂ_ｊの当該区間における代表値を定める。例えば、各区間の中間値を代表値とすればよい。両端部分の区間については、例えばｂ_ｊ＜０．７の区間については０．６５、ｂ_ｊ＞１．３の区間については１．３５、などとし、各代表値の値間隔が均等になるようにすればよい。

（図６：ステップＳ６０４）
ステップＳ６０３で選択したｂ_ｊの区間がｂ_ｊの全体分布に占める割合を求める。この割合は、式７や式８と同様の計算式によって求めることができる。
（図６：ステップＳ６０５）
ｂ_ｊの当該区間における代表値に対応する、ａ_ｊの推定値と標準誤差を求める。ａ_ｊの推定値は、式３を満たすａ_ｊの値として求められる。ａ_ｊの２次標準誤差は、式９を用いて求められる。本ステップは、図４（ｂ１）〜図４（ｂ８）に示す正規分布を作成する手順に相当する。

（図６：ステップＳ６０６）
変数Ｓ２の値を０に初期化する。
（図６：ステップＳ６０７）
ステップＳ６０５で作成したａ_ｊの正規分布（２次分布）を、図４（ｂ１）などで例示したような複数区間に区分けする。以下のステップＳ６０８〜Ｓ６１１を、ａ_ｊの正規分布の各区間について実行する。

（図６：ステップＳ６０８）
ａ_ｊの正規分布上の区間を、例えばａ_ｊの値が小さい側から順に１つ選択する。ａ_ｊの当該区間における代表値を定める。代表値の定め方は、ｂ_ｊの各区間の代表値を定める手法と同様でよい。
（図６：ステップＳ６０９）
ステップＳ６０８で選択したａ_ｊの区間がａ_ｊの２次分布全体に占める割合を求める。この割合は、式７や式８と同様の計算式によって求めることができる。

（図６：ステップＳ６１０）
ステップＳ６０８で定めたａ_ｊの代表値と、図１および図３の処理フローで求めたａ_ｊの推定値との差分を求め、２乗する。
（図６：ステップＳ６１１）
ステップＳ６０９で求めた、ａ_ｊの区間がａ_ｊの２次分布全体に占める割合と、ステップＳ６１０で求めた、ａ_ｊの代表値と本来のａ_ｊの推定値との差分の２乗を、乗算する。乗算して得た値を、変数Ｓ２に加算する。

（図６：ステップＳ６１２）
ステップＳ６０３で求めた、ｂ_ｊの区間がｂ_ｊの全体分布に占める割合と、ステップＳ６０７〜Ｓ６１１の結果求められたＳ２の値を、乗算する。乗算して得た値を、変数Ｓ１に加算する。
（図６：ステップＳ６１３）
Ｓ１の平方根を、再算出したａ_ｊとする。

以上、ａ_ｊの標準誤差を再算出する手順を説明した。ｂ_ｊ、θ_ｉの標準誤差についても図４〜図６で説明した手順と同様に再算出することができるので、必要に応じて再算出を実行してもよい。

＜実施の形態２：まとめ＞
以上のように、本実施形態２では、ａ_ｊ、ｂ_ｊ、またはθ_ｉのうち少なくともいずれかを、標準誤差を再算出する対象である第１パラメータ（図４〜図６ではａ_ｊ）として定めるとともに、標準誤差を再算出する際に用いる他の試験パラメータを第２パラメータ（図４〜図６ではｂ_ｊ）として定める。まず、第２パラメータ（ｂ_ｊ）の推定値と標準誤差を用いて第２パラメータ（ｂ_ｊ）の正規分布を推定する。次に、第２パラメータ（ｂ_ｊ）の正規分布上の各代表値に対応する第１パラメータ（ａ_ｊ）の標準誤差を、再算出する。これにより、第２パラメータ（ｂ_ｊ）の推定結果に内在しているばらつきを加味して、第１パラメータ（ａ_ｊ）の標準誤差を再算出することができる。

また、本実施形態２では、第２パラメータ（ｂ_ｊ）の正規分布上の各代表値に対応する第１パラメータ（ａ_ｊ）の正規分布（２次分布）を求め、第１パラメータ（ａ_ｊ）の２次分布上の各代表値と本来の推定値の差分を用いて、第１パラメータ（ａ_ｊ）の標準誤差を求める。さらに、第２パラメータ（ｂ_ｊ）の正規分布上の各代表値が全体に占める割合を乗じた上で、第１パラメータ（ａ_ｊ）の標準誤差を合算する。この手順によれば、第２パラメータ（ｂ_ｊ）にばらつきが内在している前提の下、第２パラメータ（ｂ_ｊ）の各代表値の寄与分を勘案して、第１パラメータ（ａ_ｊ）の標準誤差を合算することになる。したがって、第２パラメータ（ｂ_ｊ）のばらつきとその全体に対する割合を加味して、第１パラメータ（ａ_ｊ）の標準誤差を再算出することができる。

なお、本実施形態２において、ａ_ｊおよびｂ_ｊの値を８個に区分したが、これは計算の便宜上のものであり、区分の仕方はこれに限られるものではない。区分の上限値と下限値についても同様である。

＜実施の形態３＞
図７は、本発明の実施形態３に係る、能力値θ_ｉの分布を補正する手順を実行する処理フローである。図７に示す処理フローは、図１と概ね同様であるが、ステップＳ１０３とＳ１０４において、それぞれ１つ前のステップの結果を用いる点が異なる。

（図７：ステップＳ１０３）
ａ_ｊ＝ａ_ｊ ^１、θ_ｉ＝θ_ｉ ^０と置いて、式４を満たすｂ_ｊ＝ｂ_ｊ ^１を、ニュートン法によって求める。
（図７：ステップＳ１０４）
ａ_ｊ＝ａ_ｊ ^１、ｂ_ｉ＝ｂ_ｉ ^１と置いて、式５を満たすθ_ｉ＝θ_ｉ ^１を、ニュートン法によって求める。

本実施形態３によれば、ステップＳ１０３とＳ１０４において、それぞれ１つ前のステップの結果を用いるので、計算が早く収束することが期待できる。反面、局所最適解に陥り易くなる可能性があるので、必要に応じて適宜図１と使い分けるとよい。

＜実施の形態４＞
図７に示した処理フローにおいて、ステップＳ１０２〜Ｓ１０４の順番を入れ替えることもできる。例えば、以下のような変形例が考えられる。

（図１：ステップＳ１０２）
ａ_ｊ＝ａ_ｊ ^０、ｂ_ｉ＝ｂ_ｉ ^０と置いて、式５を満たすθ_ｉ＝θ_ｉ ^１を、ニュートン法によって求める。
（図１：ステップＳ１０３）
ｂ_ｊ＝ｂ_ｊ ^０、θ_ｉ＝θ_ｉ ^１と置いて、式３を満たすａ_ｊ＝ａ_ｊ ^１を、ニュートン法によって求める。
（図１：ステップＳ１０４）
ａ_ｊ＝ａ_ｊ ^１、θ_ｉ＝θ_ｉ ^１と置いて、式４を満たすｂ_ｊ＝ｂ_ｊ ^１を、ニュートン法によって求める。

＜実施の形態５＞
実施形態１で説明した手法を用いて各試験パラメータａ_ｊ、ｂ_ｊ、θ_ｉを推定する場合、θ_ｉの値は図１で推定したときの元来の値から移動されている。θ_ｉを移動させることが好ましくない場合、例えば元来の能力値パラメータθ_ｉを加工せずに用いたいような場合には、以下のような手順を用いることもできる。

まず始めに、実施形態１で説明した手法を用いて各試験パラメータａ_ｊ、ｂ_ｊ、θ_ｉを推定する。次に、推定した試験パラメータａ_ｊ、ｂ_ｊを用いて、式５を満たすθ_ｉを改めて求める。このとき、θ_ｉの値は移動させず、再算出したθ_ｉの値をそのまま最終結果とする。

本実施形態５によれば、推定したθ_ｉの値をそのまま最終推定結果とすることができるので、能力値パラメータθ_ｉを移動させるなどして加工する必要はなく、推定方法の効果をありのまま享受することができる。

＜実施の形態６＞
図８は、本発明の実施形態６に係る試験パラメータ推定装置８００の機能ブロック図である。試験パラメータ推定装置８００は、実施形態１〜６で説明した、項目反応理論を用いる試験に係るパラメータを推定する装置である。

試験パラメータ推定装置８００は、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）８１０、メモリ８２０、通信インターフェース８３０、および記憶装置８４０を備える。

ＣＰＵ８１０は、試験パラメータ推定プログラム８４２を実行することにより、実施形態１〜６で説明した、項目反応理論を用いる試験に係るパラメータを推定する方法を実行する。

メモリ８２０は、ＣＰＵ８１０が動作する際に用いる一時的なデータなどを記憶するメモリ装置である。通信インターフェース８３０は、試験パラメータ推定装置８００と外部装置が通信するためのインターフェースである。

記憶装置８４０は、正誤結果データ８４１、試験パラメータ推定プログラム８４２、推定結果データ８４３を格納する。

正誤結果データ８４１は、実施形態１で説明した正誤結果パラメータｕ_ｉｊを記録したデータである。試験パラメータ推定プログラム８４２は、正誤結果パラメータｕ_ｉｊを入力として受け取り、実施形態１〜６で説明した手順にしたがって各試験パラメータａ_ｊ、ｂ_ｊ、θ_ｉを推定するステップを記述したソフトウェアプログラムである。推定結果データ８４３は、試験パラメータ推定プログラム８４２の実行結果として、各試験パラメータａ_ｊ、ｂ_ｊ、θ_ｉの推定結果、標準誤差の再算出結果などを記録するデータである。

本実施形態６に係る試験パラメータ推定装置８００および試験パラメータ推定プログラム８４２によれば、実施形態１〜６で説明した手法を、ソフトウェアプログラムの形態で実現することができる。

なお、ＣＰＵ８１０が試験パラメータ推定プログラム８４２を実行することによって実現される機能を、同等の機能を実現する回路デバイスなどのハードウェアによって構成することもできる。この場合、各フローチャートのステップを実行する機能部をハードウェアによって構成することになる。ステップ毎に機能部を設けてもよいし、いずれか２以上のステップについて共通の機能部によって実現してもよい。

＜実施の形態７＞
以上の実施形態１〜６では、試験パラメータとしてａ_ｊ、ｂ_ｊ、θ_ｉを用いたが、さらに当て推量パラメータを加えることもできる。

８００：試験パラメータ推定装置、８１０：ＣＰＵ、８２０：メモリ、８３０：通信インターフェース、８４０：記憶装置、８４１：正誤結果データ、８４２：試験パラメータ推定プログラム、８４３：推定結果データ。

Claims

項目反応理論を用いた試験に係るパラメータをコンピュータで推定する方法であって、
試験問題毎の各被験者の正誤結果を記述した正誤結果データを記憶装置から読み取るステップと、
試験項目が被験者の能力を識別する力を示す識別力パラメータを前記正誤結果データに基づき推定する識別力推定ステップと、
試験項目の難しさを示す困難度パラメータを前記正誤結果データに基づき推定する困難度推定ステップと、
被験者の能力を示す能力値パラメータを前記正誤結果データに基づき推定する能力推定ステップと、
前記識別力推定ステップ、前記困難度推定ステップ、および前記能力推定ステップを繰り返して、前記識別力パラメータ、前記困難度パラメータ、および前記能力値パラメータそれぞれの最終的な推定結果を取得するステップと、
を有し、
前記能力推定ステップを繰り返して得られた前記能力値パラメータの系列を、正規分布関数の変数軸上に設けた複数区間に当てはめて複数に分割し、
各前記区間における前記能力値パラメータの個数と、前記能力値パラメータの系列が前記正規分布関数にしたがって分布していると仮定した場合における前記各区間内の前記能力値パラメータの個数とが、同一になるように、前記能力値パラメータの系列を前記変数軸上で移動させる
ことを特徴とする試験パラメータ推定方法。
前記識別力パラメータ、前記困難度パラメータ、および前記能力値パラメータを含む前記パラメータのうち少なくともいずれかを第１パラメータとして選択し、他の前記パラメータを第２パラメータとして用いて前記第１パラメータの標準誤差を再算出する標準誤差再算出ステップを有し、
前記標準誤差再算出ステップはさらに、
前記第１パラメータの標準誤差を再算出する際に用いる前記第２パラメータの推定値と標準誤差を取得するステップと、
前記第２パラメータの推定値と標準誤差を用いて前記第２パラメータの分布を推定するステップと、
前記第２パラメータの分布を複数区間に区分し、各区分の代表値毎に前記第１パラメータの分布を推定するステップと、
推定した前記第１パラメータの分布を用いて当該分布に対応する前記第１パラメータの標準誤差を再算出するステップと、
を有することを特徴とする請求項１記載の試験パラメータ推定方法。
前記第１パラメータの分布に対応する前記第１パラメータの標準誤差を再算出するステップでは、
前記第１パラメータの分布の変数軸上に設けた複数区間の代表値毎に、当該代表値と前記第１パラメータの推定値の間の差分の２乗を算出し、
前記差分の２乗と、当該代表値が属する前記区間が前記第１パラメータの分布に占める割合との積を、前記第１パラメータの分布上の全ての前記代表値について合算し、
その合算値を、前記第２パラメータの分布上の各区間について算出し、前記第２パラメータの分布上の当該区間が分布全体に占める割合を乗じた上で、その値を前記第２パラメータの分布上の全ての区間について算出して合算し、
その合算結果の平方根を、前記第１パラメータの最終的な標準誤差とする
ことを特徴とする請求項２記載の試験パラメータ推定方法。
請求項１から３のいずれか１項記載の試験パラメータ推定方法をコンピュータに実行させることを特徴とする試験パラメータ推定プログラム。
試験問題毎の各被験者の正誤結果を記述した正誤結果データを格納する記憶装置と、
請求項４記載の試験パラメータ推定プログラムと、
前記試験パラメータ推定プログラムを実行する演算装置と、
を備えることを特徴とする試験パラメータ推定装置。
項目反応理論を用いた試験に係るパラメータを推定する装置であって、
試験問題毎の各被験者の正誤結果を記述した正誤結果データを記憶装置から読み取る読取部と、
試験項目が被験者の能力を識別する力を示す識別力パラメータを前記正誤結果データに基づき推定する識別力推定部と、
試験項目の難しさを示す困難度パラメータを前記正誤結果データに基づき推定する困難度推定部と、
被験者の能力を示す能力値パラメータを前記正誤結果データに基づき推定する能力推定部と、
を備え、
前記識別力推定部、前記困難度推定部、および前記能力推定部の処理を繰り返して、前記識別力パラメータ、前記困難度パラメータ、および前記能力値パラメータそれぞれの最終的な推定結果を取得し、
前記能力推定部の処理を繰り返して得られた前記能力値パラメータの系列を、正規分布関数の変数軸上に設けた複数区間に当てはめて複数に分割し、
各前記区間における前記能力値パラメータの個数と、前記能力値パラメータの系列が前記正規分布関数にしたがって分布していると仮定した場合における前記各区間内の前記能力値パラメータの個数とが、同一になるように、前記能力値パラメータの系列を前記変数軸上で移動させる
ことを特徴とする試験パラメータ推定装置。