JP2011257676A - 試験パラメータ推定方法、試験パラメータ推定プログラム、試験パラメータ推定装置 - Google Patents
試験パラメータ推定方法、試験パラメータ推定プログラム、試験パラメータ推定装置 Download PDFInfo
- Publication number
- JP2011257676A JP2011257676A JP2010133762A JP2010133762A JP2011257676A JP 2011257676 A JP2011257676 A JP 2011257676A JP 2010133762 A JP2010133762 A JP 2010133762A JP 2010133762 A JP2010133762 A JP 2010133762A JP 2011257676 A JP2011257676 A JP 2011257676A
- Authority
- JP
- Japan
- Prior art keywords
- parameter
- value
- distribution
- test
- estimation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【課題】項目反応理論における被験者の能力値パラメータの推定値誤差を小さくする。
【解決手段】本発明に係る試験パラメータ推定方法では、能力値パラメータθiを正規化することに加え、θiの分布が正規分布に近づくように、大小関係を維持しつつ、θiの値を分布関数の変数軸上で移動させる。
【選択図】図3
【解決手段】本発明に係る試験パラメータ推定方法では、能力値パラメータθiを正規化することに加え、θiの分布が正規分布に近づくように、大小関係を維持しつつ、θiの値を分布関数の変数軸上で移動させる。
【選択図】図3
Description
本発明は、項目反応理論を用いた試験に係るパラメータを推定する手法に関するものである。
項目反応理論は、試験問題などの評価項目に対する被験者の応答(試験問題であれば回答結果)に基づき、被験者の特性(能力など)、評価項目が被験者の特性を識別する力、評価項目の難易度などを測定するための試験理論である。以下、項目反応理論の基本的な仕組みについて説明する。
試験項目jの識別力パラメータをaj、試験項目jの困難度パラメータをbj、被験者iの能力値パラメータをθiとする。また、被験者iの試験項目jに対する正誤を、正答である場合は1、誤答である場合は0として表した正誤結果パターンをuijとする。下記式1に示すLを最大化するaj、bj、θiを求めることにより、aj、bj、θiを推定する。
上記式1において、Dは尺度因子と呼ばれる定数であり、およそ1.7である。
上記式1のLを最大化するaj、bj、θiを求めるに際し、同式のままでは扱いにくいので、Lの自然対数を最大化するaj、bj、θiを求めることにする。
上記式1のLを最大化するaj、bj、θiを求めるに際し、同式のままでは扱いにくいので、Lの自然対数を最大化するaj、bj、θiを求めることにする。
上記式2のlnLが最大になるとき、式2をaj、bj、θiでそれぞれ微分した値は0となるはずである。そこで、下記式3〜式5を満たすaj、bj、θiをそれぞれ求めることとする。式3〜式5を満たすaj、bj、θiを求める手法の例として、例えばニュートン法がある。
図1は、式3〜式5を満たすaj、bj、θiを、ニュートン法によって求める際の処理フローを示す図である。以下、図1の各ステップについて説明する。
(図1:ステップS101)
aj、bj、θiそれぞれの初期値として、aj 0、bj 0、θi 0を定める。例えば、aj 0=1、bj 0=0、θi 0=0とする。
(図1:ステップS102)
bj=bj 0、θi=θi 0と置いて、式3を満たすaj=aj 1を、ニュートン法によって求める。
aj、bj、θiそれぞれの初期値として、aj 0、bj 0、θi 0を定める。例えば、aj 0=1、bj 0=0、θi 0=0とする。
(図1:ステップS102)
bj=bj 0、θi=θi 0と置いて、式3を満たすaj=aj 1を、ニュートン法によって求める。
(図1:ステップS103)
aj=aj 0、θi=θi 0と置いて、式4を満たすbj=bj 1を、ニュートン法によって求める。
(図1:ステップS104)
aj=aj 0、bi=bi 0と置いて、式5を満たすθi=θi 1を、ニュートン法によって求める。
aj=aj 0、θi=θi 0と置いて、式4を満たすbj=bj 1を、ニュートン法によって求める。
(図1:ステップS104)
aj=aj 0、bi=bi 0と置いて、式5を満たすθi=θi 1を、ニュートン法によって求める。
(図1:ステップS105)
ステップS102で求めたaj 1とaj 0の差、ステップS103で求めたbj 1とbj 0の差、ステップS104で求めたθi 1とθi 0の差をそれぞれ求める。
(図1:ステップS106)
ステップS105で求めた3つの差分値が所定の閾値未満であればステップS107へ進み、少なくともいずれかの差分値が閾値以上であればステップS108へ進む。
ステップS102で求めたaj 1とaj 0の差、ステップS103で求めたbj 1とbj 0の差、ステップS104で求めたθi 1とθi 0の差をそれぞれ求める。
(図1:ステップS106)
ステップS105で求めた3つの差分値が所定の閾値未満であればステップS107へ進み、少なくともいずれかの差分値が閾値以上であればステップS108へ進む。
(図1:ステップS107)
現在のaj=aj 1、bj=bj 1、θi=θi 1の値を、各パラメータの推定結果とし、本処理フローを終了する。
(図1:ステップS108)
aj 0、bj 0、θi 0を現在のaj=aj 1、bj=bj 1、θi=θi 1で置き換え、ステップS102に戻って同様の処理を繰り返す。
現在のaj=aj 1、bj=bj 1、θi=θi 1の値を、各パラメータの推定結果とし、本処理フローを終了する。
(図1:ステップS108)
aj 0、bj 0、θi 0を現在のaj=aj 1、bj=bj 1、θi=θi 1で置き換え、ステップS102に戻って同様の処理を繰り返す。
以上、各試験パラメータを推定する従来の手法を説明した。
図1の処理フローを実行していく過程で、ステップS105における3つの差分値が次第に小さくなり、aj、bj、θiそれぞれの値が収束していく。しかし、その結果得られる値は、各パラメータの真の値から離れていることが、実験的に分かっている。
図1の処理フローを実行していく過程で、ステップS105における3つの差分値が次第に小さくなり、aj、bj、θiそれぞれの値が収束していく。しかし、その結果得られる値は、各パラメータの真の値から離れていることが、実験的に分かっている。
これを回避する手法として、下記非特許文献1には、θiを正規化する手法が記載されている。同文献では、図1のステップS104で求まるθi 1の平均値をμ、標準偏差をσとして、θi 0=(θi 1−μ)/σと置き換え、θiの平均が0、標準偏差が1となるようにしている。
豊田秀樹,項目反応理論[理論編],1.2.3節,p.15,朝倉書店,2005年
上記非特許文献1に記載の手法では、θiを正規化することにより、θiの誤差を小さくすることを図っているが、誤差を完全になくすことは難しい。
本発明は、上記のような課題を解決するためになされたものであり、項目反応理論における被験者の能力値パラメータの推定値誤差を、より小さくすることを目的とする。
本発明に係る試験パラメータ推定方法では、能力値パラメータθiを正規化することに加え、θiの分布が正規分布に近づくように、大小関係を維持しつつ、θiの値を分布関数の変数軸上で移動させる。
本発明に係る試験パラメータ推定方法によれば、θiの分布を正規分布に近づけるように各θiの値を移動させることにより、θiの推定誤差を小さくすることができる。特に被験者数が多くなると、θiの分布は正規分布に近づくと予想されるので、θiの分布を正規分布に近づけることの効果を有効に発揮することができる。
<実施の形態1>
以下、本発明の実施形態1に係る試験パラメータ推定方法を説明する。本実施形態1では、能力値パラメータθiの分布を正規分布に近づけることにより、θiの推定結果の誤差を小さくすることを図る。
以下、本発明の実施形態1に係る試験パラメータ推定方法を説明する。本実施形態1では、能力値パラメータθiの分布を正規分布に近づけることにより、θiの推定結果の誤差を小さくすることを図る。
図2は、能力値パラメータθiの分布を正規分布に近づける処理の考え方を説明する図である。図2(a)はθiの分布が正規分布になっている場合の度数分布、図2(b)は図1の処理フローで求められるθiの推定結果に基づく度数分布例を示す。ここでは、平均=0、標準偏差=1となる正規分布関数の例として、下記式6を用いた。
計算の便宜上、以下では図2の度数分布を、−3.0≦θi≦3.0の範囲で0.5ずつ12個の区間に区切り、さらにθi<−3.0の区間とθi>3.0の区間を加えた14個の区間に区分けする。
図2(a)において、θiの総数が10000個である場合、−3.0よりも小さいθiの個数は、下記式7で求められる。
したがって、θiが正規分布にしたがっている場合、−3.0よりも小さいθiの値は13個存在するはずである。ところが、図1の処理フローを用いて推定したθiは推定誤差を含んでおり、必ずしも正規分布にしたがわない。そのため、−3.0よりも小さいθiの個数は、必ずしも13個にならない。例えば、図2(b)において、−3.0よりも小さいθiが12個しか存在しない、などの推定結果が生じる可能性がある。
図1の処理フローを用いて推定したθiの分布を正規分布に近づけることにより、θiの推定誤差は小さくなると考えられる。本実施形態1では、θiの分布を正規分布に近づけるためには、各区間におけるθiの個数が、正規分布における各区間内のθiの個数と等しくなるように、図2(b)の分布を補正すればよいと考える。
そこで本実施形態1では、図2(b)の各区間におけるθiの個数が、正規分布における各区間内のθiの個数と等しくなるように、θiの値を図2の横軸(変数軸)上で移動させる。
上述の例の場合、−3.0よりも小さいθiが12個しか存在しないので、−3.0≦θi≦−2.5の区間からθiの値を1つ抜き出してマイナス方向に移動させ、−3.0よりも小さいθiが13個となるように、θiの分布を補正すればよい。
ただし、各θiの値は、被験者iの能力値を示すので、試験の意義を没却しないためにも、各被験者iの能力値θiの大小関係が入れ替わらないようにする必要がある。
そこで具体的な処理としては、図1の処理フローによって得られたθiの系列のうち、値が小さいほうから順に13個を抽出し、小さいほうから13番目の値が−3.0(または−3.0より僅かに小さい値)となるように、13個のθiを同じ量だけマイナス方向に移動させればよい。区間の境界上の値は、いずれかの区間に含めるなどして適宜取り扱えばよい。
同様に、図2(a)において、θiの総数が10000個である場合、−3.0≦θi≦−2.5の区間におけるθiの個数は、下記式8で求められる。
したがって、−3.0≦θi≦−2.5の区間におけるθiの分布を正規分布に近づけるためには、図1の処理フローによって得られたθiの系列のうち、−3.0≦θi≦−2.5の区間におけるθiの個数が49個となるように、小さいほうから数えて14番目〜62番目の49個のθiを、それぞれ同じ量だけ移動させればよい。
以下同様にして、各区間におけるθiの個数が、正規分布における同じ区間内のθiの個数と等しくなるように、θiの値を同じ量だけ移動させる。これにより、全ての区間において、θiの個数は正規分布と等価になり、最終的に得られるθiの分布は正規分布に近づくものと想定される。
なお、以上の手順において、各被験者iの能力値θiの大小関係が入れ替わらないように配慮しているので、θiの値を移動させて補正したとしても、補正前における能力値パラメータ系列θiが表す各被験者の能力は、略等価に保たれている。特に項目反応理論では、各被験者の絶対評価を算出するのではなく、当該試験項目における他の被験者との間の相対的な評価を算出するものであるため、上記補正によって試験パラメータの精度が損なわれるものではないと考えられる。
以上、本実施形態1に係る試験パラメータ推定方法の考え方を説明した。以下では具体的な処理フローについて説明する。
図3は、図2で説明した、能力値θiの分布を補正する手順を実行する処理フローである。以下、図3の各ステップについて説明する。
(図3:ステップS300)
図1で説明した処理フローを実行した後、本処理フローを開始する。
(図3:ステップS301)
変数M0の値をM0=1として初期化する。
図1で説明した処理フローを実行した後、本処理フローを開始する。
(図3:ステップS301)
変数M0の値をM0=1として初期化する。
(図3:ステップS302)
以下のステップS303〜S306を、図2で説明した14個の区間、すなわち、−3.0<θiの区間、−3.0≦θi≦3.0の範囲で0.5ずつ区切った12個の区間、およびθi>3.0の区間それぞれについて実行する。
(図3:ステップS303)
正規分布上における当該区間内のθiの個数M1を求める。算出方法は、θiの総数に応じて、上述の式7および式8と同様の手順を用いる。例えば−3.0<θiの区間であれば、M1=13となる。
以下のステップS303〜S306を、図2で説明した14個の区間、すなわち、−3.0<θiの区間、−3.0≦θi≦3.0の範囲で0.5ずつ区切った12個の区間、およびθi>3.0の区間それぞれについて実行する。
(図3:ステップS303)
正規分布上における当該区間内のθiの個数M1を求める。算出方法は、θiの総数に応じて、上述の式7および式8と同様の手順を用いる。例えば−3.0<θiの区間であれば、M1=13となる。
(図3:ステップS304)
図1で求めたθiのうち、小さい方から数えてM0番目〜M1番目を抽出する。例えば−3.0<θiの区間であれば、M0=1番目からM1=13番目までの13個の値を抽出する。
(図3:ステップS305)
ステップS304で抽出したM1個のθiの値が当該区間内に収まるように、各θiを同じ量だけずらす。
(図3:ステップS306)
変数M0にM1の値を加算する。本ステップは、ステップS304を次回実行するときに抽出を開始するθiの初期値をセットする意義がある。
図1で求めたθiのうち、小さい方から数えてM0番目〜M1番目を抽出する。例えば−3.0<θiの区間であれば、M0=1番目からM1=13番目までの13個の値を抽出する。
(図3:ステップS305)
ステップS304で抽出したM1個のθiの値が当該区間内に収まるように、各θiを同じ量だけずらす。
(図3:ステップS306)
変数M0にM1の値を加算する。本ステップは、ステップS304を次回実行するときに抽出を開始するθiの初期値をセットする意義がある。
<実施の形態1:まとめ>
以上のように、本実施形態1によれば、θiが正規分布にしたがう場合における各区間内のθiの個数と、図1の処理フローによって推定した各区間におけるθiの個数とが同一になるように、同区間におけるθiの値を、それぞれ同じ量だけずらす。これにより、補正後のθiの分布は正規分布に近づくので、θiの推定精度を向上させることができる。特に被験者の数が多い場合には、θiの分布は正規分布に近いと想定されるので、本実施形態1の効果が有効に発揮される。
以上のように、本実施形態1によれば、θiが正規分布にしたがう場合における各区間内のθiの個数と、図1の処理フローによって推定した各区間におけるθiの個数とが同一になるように、同区間におけるθiの値を、それぞれ同じ量だけずらす。これにより、補正後のθiの分布は正規分布に近づくので、θiの推定精度を向上させることができる。特に被験者の数が多い場合には、θiの分布は正規分布に近いと想定されるので、本実施形態1の効果が有効に発揮される。
また、本実施形態1によれば、各区間におけるθiの値をずらす補正を実施する際に、各区間における補正前のθiの大小関係を補正後も維持する。これにより、補正後の能力値パラメータθiは、各被験者iの相対的な能力値を反映した状態が保たれるので、補正によって能力値の推定結果を破損することなく、推定精度を向上させることができる。
なお、本実施形態1において、θiの値を14個に区分したが、これは計算の便宜上のものであり、区分の仕方はこれに限られるものではない。区分の上限値3.0と下限値−3.0についても同様である。また、正規分布関数は、式6以外の関数を用いてもよい。以下の実施形態でも同様である。
<実施の形態2>
本発明の実施形態2では、実施形態1で説明した手法に加え、または実施形態1で説明した手法とは独立に、各試験パラメータの標準誤差を小さく抑える手法を説明する。
本発明の実施形態2では、実施形態1で説明した手法に加え、または実施形態1で説明した手法とは独立に、各試験パラメータの標準誤差を小さく抑える手法を説明する。
図1を用いて説明した従来の推定手順において、各試験パラメータaj、bj、θiの推定結果と真の値との間には、誤差が生じている。この誤差の標準偏差を標準誤差と呼ぶ。すなわち、aj、bj、θiが一定であっても、被験者が試験を受けるたびに正誤結果パターンuijが変わり、aj、bj、θiの推定結果も変わる。このときの標準偏差が標準誤差となる。なお、推定結果の平均は、真の値にほぼ等しいと想定される。
各試験パラメータの標準誤差は、フィッシャ情報量に基づき、下記式9〜式11で求められる。
上記式9〜式11で求められる標準誤差は、真の標準誤差からずれている。これは、各標準誤差を算出する際に用いる計算式内に他の試験パラメータが含まれており、他の試験パラメータにばらつきが内在しているからであると思われる。
そこで本実施形態2では、各標準誤差を算出する際に用いる他の試験パラメータのばらつきを加味して、改めて標準誤差を算出することを図る。以下、ajの標準誤差を算出する手順を例にとり、本実施形態2における処理の考え方を説明する。
ajの標準誤差を算出するための式9において、bjの推定値を用いる必要がある。しかしbjの推定値は、ばらつきを内在している。そこで、ajの標準誤差を算出するに際して、bjが取り得る値毎にajの標準誤差を算出し、bjがその値を取り得る割合を乗算した上で合算する。
図4は、bjの推定結果に基づくbjの分布と、bjの各値に対応するajの分布を示す図である。以下、図4の各図について説明する。
図4(a)は、bjの推定結果に基づくbjの分布を示す図である。ここでは、図1または実施形態1で説明した手法を用いて各試験パラメータaj、bj、θiを推定したものと仮定する。ajの推定値は1.5、式9を用いて算出した標準誤差は0.2であるものとする。bjの推定値は1.0、式10を用いて算出した標準誤差は0.1であるものとする。
bjの推定値は、上述の通り1.0であることが既に算出済みであるが、実際にはばらつきが内在しているので、bjがその他の値を取る可能性もある。そこで、推定値1.0を中心として、標準誤差0.1を用いて正規分布を作成し、他の取り得る値を把握する。この場合の正規分布関数は、実施形態1とは平均値(推定値)、標準偏差が異なるので、以下の式12となる。
以後の計算の便宜上、図4(a)に示す正規分布を、1.0を中心として+−0.3の範囲、すなわち0.7≦bj≦1.3の6区間に区分けする。さらに、bj<0.7の区間とbj>1.3の区間を加え、合計8つの区間に区分けする。
次に、各区間の代表値を定める。0.7≦bj≦1.3の区間では、中心値を代表値とする。bj<0.7の区間における代表値はbj=0.65、bj>1.3の区間における代表値はbj=1.35とする。
図4(b1)〜図4(b8)は、図4(a)で定めたbjの各代表値に対応するajの2次的な推定値の分布を示す図である。bj=1.0のときにおけるajの推定値は1.5であることが既に算出済みであるので、図4(a)で定めたbjの各代表値に対応するajの推定値を、2次推定値として改めて算出する。また、そのときのajの標準誤差を、2次標準誤差として改めて算出する。
例えば、bjの代表値=0.65のときのajの2次推定値は、bj=0.65と置いたときの式3を満たすajの値として求められる。同様に、bjの代表値=0.65のときのajの2次標準誤差は、bj=0.65と置いて式9により求められる。
図4(b1)は、bjの代表値=0.65のときのajの2次推定値が1.3であり、ajの2次標準誤差が0.1であるときにおける、ajの分布を示す。同様に、bjの代表値=0.75のときのajの分布〜bjの代表値=1.35のときのajの分布を求める。最終的には、図4(a)の8つの区分に対応する8つの分布が得られる。この8つの分布を便宜上、ajの2次分布と呼ぶ。
ajの8つの2次分布それぞれにおいて、ajの本来の推定結果である1.5との間の誤差が生じている。したがって、この誤差の標準偏差、すなわちajの2次分布の標準誤差を求めることができる。ajの2次分布の標準誤差は、bjの推定結果に内在するばらつきを勘案した標準誤差であるといえる。
図5は、ajの2次分布の標準誤差を合算する過程を示す図である。図5(b1)は図4(b1)に対応する。図5(b1)に示す2次分布を図4(a)と同様に8つの区間に区分けし、各区間の代表値と、ajの本来の推定値である1.5との差分を2乗し、当該区間が2次分布全体に占める割合を乗算して合算する。
例えば図5(b1)のaj<1.0の区間における代表値は0.95であるので、ajの本来の推定値である1.5との差分は0.55となる。また、aj<1.0の区間がajの2次分布全体に占める割合は、式7と同様に0.0013となる。(1.5−0.95)の2乗と0.0013を乗算する。
同様に、1.0≦aj≦1.1の区間における代表値は1.05であるので、ajの本来の推定値である1.5との差分は0.45となる。また、1.0≦aj≦1.1の区間がajの2次分布全体に占める割合は、式7と同様の手法で算出すると、0.0215となる。(1.5−1.05)の2乗と0.0215を乗算する。
以下同様にこれらの値を各区間について求めて合算し、変数S2に代入し、bjの代表値=0.65のときのS2を算出する。以下では、bjの代表値=0.65のときのS2を、S2{bj:0.65}と表記することにする。この算出過程を図5(b1)の右端に示した。
以上の手順を、bjの各代表値について実施すると、bjの各代表値に対応するS2の値が求まる。すなわち、S2{bj:0.65}〜S2{bj:1.35}の8つのS2が求まる。各S2の値を、当該区間がbjの全体分布に占める割合と乗算し、足し合わせたものを、変数S1に代入する。
この変数S1は、bjが取り得る値毎にajの標準誤差を算出し、bjがその値を取り得る割合を乗じて合算したものであるといえる。したがって、変数S1の平方根を求めることにより、bjの推定結果に内在するばらつきを加味したajの標準誤差を求めることができる。
図6は、図4〜図5で説明した、ajの標準誤差を再算出する手順の処理フローである。以下、図6の各ステップについて説明する。bj、θiの標準誤差についても同様の手順で再算出することができる。
(図6:ステップS600)
図1および図3で説明した処理フローを実行した後、本処理フローを開始する。
(図6:ステップS601)
変数S1の値を0に初期化する。また、図1および図3の処理フローで求めたbjの推定値と、式10で求められる標準誤差とを用いて、bjの正規分布を求める。本ステップは、図4(a)で説明したbjの正規分布を求める手順に相当する。
図1および図3で説明した処理フローを実行した後、本処理フローを開始する。
(図6:ステップS601)
変数S1の値を0に初期化する。また、図1および図3の処理フローで求めたbjの推定値と、式10で求められる標準誤差とを用いて、bjの正規分布を求める。本ステップは、図4(a)で説明したbjの正規分布を求める手順に相当する。
(図6:ステップS602)
ステップS601で作成したbjの正規分布を、図4(a)で例示したような複数区間に区分けする。以下のステップS603〜S612を、bjの正規分布の各区間について実行する。
(図6:ステップS603)
bjの正規分布上の区間を、例えばbjの値が小さい側から順に1つ選択する。bjの当該区間における代表値を定める。例えば、各区間の中間値を代表値とすればよい。両端部分の区間については、例えばbj<0.7の区間については0.65、bj>1.3の区間については1.35、などとし、各代表値の値間隔が均等になるようにすればよい。
ステップS601で作成したbjの正規分布を、図4(a)で例示したような複数区間に区分けする。以下のステップS603〜S612を、bjの正規分布の各区間について実行する。
(図6:ステップS603)
bjの正規分布上の区間を、例えばbjの値が小さい側から順に1つ選択する。bjの当該区間における代表値を定める。例えば、各区間の中間値を代表値とすればよい。両端部分の区間については、例えばbj<0.7の区間については0.65、bj>1.3の区間については1.35、などとし、各代表値の値間隔が均等になるようにすればよい。
(図6:ステップS604)
ステップS603で選択したbjの区間がbjの全体分布に占める割合を求める。この割合は、式7や式8と同様の計算式によって求めることができる。
(図6:ステップS605)
bjの当該区間における代表値に対応する、ajの推定値と標準誤差を求める。ajの推定値は、式3を満たすajの値として求められる。ajの2次標準誤差は、式9を用いて求められる。本ステップは、図4(b1)〜図4(b8)に示す正規分布を作成する手順に相当する。
ステップS603で選択したbjの区間がbjの全体分布に占める割合を求める。この割合は、式7や式8と同様の計算式によって求めることができる。
(図6:ステップS605)
bjの当該区間における代表値に対応する、ajの推定値と標準誤差を求める。ajの推定値は、式3を満たすajの値として求められる。ajの2次標準誤差は、式9を用いて求められる。本ステップは、図4(b1)〜図4(b8)に示す正規分布を作成する手順に相当する。
(図6:ステップS606)
変数S2の値を0に初期化する。
(図6:ステップS607)
ステップS605で作成したajの正規分布(2次分布)を、図4(b1)などで例示したような複数区間に区分けする。以下のステップS608〜S611を、ajの正規分布の各区間について実行する。
変数S2の値を0に初期化する。
(図6:ステップS607)
ステップS605で作成したajの正規分布(2次分布)を、図4(b1)などで例示したような複数区間に区分けする。以下のステップS608〜S611を、ajの正規分布の各区間について実行する。
(図6:ステップS608)
ajの正規分布上の区間を、例えばajの値が小さい側から順に1つ選択する。ajの当該区間における代表値を定める。代表値の定め方は、bjの各区間の代表値を定める手法と同様でよい。
(図6:ステップS609)
ステップS608で選択したajの区間がajの2次分布全体に占める割合を求める。この割合は、式7や式8と同様の計算式によって求めることができる。
ajの正規分布上の区間を、例えばajの値が小さい側から順に1つ選択する。ajの当該区間における代表値を定める。代表値の定め方は、bjの各区間の代表値を定める手法と同様でよい。
(図6:ステップS609)
ステップS608で選択したajの区間がajの2次分布全体に占める割合を求める。この割合は、式7や式8と同様の計算式によって求めることができる。
(図6:ステップS610)
ステップS608で定めたajの代表値と、図1および図3の処理フローで求めたajの推定値との差分を求め、2乗する。
(図6:ステップS611)
ステップS609で求めた、ajの区間がajの2次分布全体に占める割合と、ステップS610で求めた、ajの代表値と本来のajの推定値との差分の2乗を、乗算する。乗算して得た値を、変数S2に加算する。
ステップS608で定めたajの代表値と、図1および図3の処理フローで求めたajの推定値との差分を求め、2乗する。
(図6:ステップS611)
ステップS609で求めた、ajの区間がajの2次分布全体に占める割合と、ステップS610で求めた、ajの代表値と本来のajの推定値との差分の2乗を、乗算する。乗算して得た値を、変数S2に加算する。
(図6:ステップS612)
ステップS603で求めた、bjの区間がbjの全体分布に占める割合と、ステップS607〜S611の結果求められたS2の値を、乗算する。乗算して得た値を、変数S1に加算する。
(図6:ステップS613)
S1の平方根を、再算出したajとする。
ステップS603で求めた、bjの区間がbjの全体分布に占める割合と、ステップS607〜S611の結果求められたS2の値を、乗算する。乗算して得た値を、変数S1に加算する。
(図6:ステップS613)
S1の平方根を、再算出したajとする。
以上、ajの標準誤差を再算出する手順を説明した。bj、θiの標準誤差についても図4〜図6で説明した手順と同様に再算出することができるので、必要に応じて再算出を実行してもよい。
<実施の形態2:まとめ>
以上のように、本実施形態2では、aj、bj、またはθiのうち少なくともいずれかを、標準誤差を再算出する対象である第1パラメータ(図4〜図6ではaj)として定めるとともに、標準誤差を再算出する際に用いる他の試験パラメータを第2パラメータ(図4〜図6ではbj)として定める。まず、第2パラメータ(bj)の推定値と標準誤差を用いて第2パラメータ(bj)の正規分布を推定する。次に、第2パラメータ(bj)の正規分布上の各代表値に対応する第1パラメータ(aj)の標準誤差を、再算出する。これにより、第2パラメータ(bj)の推定結果に内在しているばらつきを加味して、第1パラメータ(aj)の標準誤差を再算出することができる。
以上のように、本実施形態2では、aj、bj、またはθiのうち少なくともいずれかを、標準誤差を再算出する対象である第1パラメータ(図4〜図6ではaj)として定めるとともに、標準誤差を再算出する際に用いる他の試験パラメータを第2パラメータ(図4〜図6ではbj)として定める。まず、第2パラメータ(bj)の推定値と標準誤差を用いて第2パラメータ(bj)の正規分布を推定する。次に、第2パラメータ(bj)の正規分布上の各代表値に対応する第1パラメータ(aj)の標準誤差を、再算出する。これにより、第2パラメータ(bj)の推定結果に内在しているばらつきを加味して、第1パラメータ(aj)の標準誤差を再算出することができる。
また、本実施形態2では、第2パラメータ(bj)の正規分布上の各代表値に対応する第1パラメータ(aj)の正規分布(2次分布)を求め、第1パラメータ(aj)の2次分布上の各代表値と本来の推定値の差分を用いて、第1パラメータ(aj)の標準誤差を求める。さらに、第2パラメータ(bj)の正規分布上の各代表値が全体に占める割合を乗じた上で、第1パラメータ(aj)の標準誤差を合算する。この手順によれば、第2パラメータ(bj)にばらつきが内在している前提の下、第2パラメータ(bj)の各代表値の寄与分を勘案して、第1パラメータ(aj)の標準誤差を合算することになる。したがって、第2パラメータ(bj)のばらつきとその全体に対する割合を加味して、第1パラメータ(aj)の標準誤差を再算出することができる。
なお、本実施形態2において、ajおよびbjの値を8個に区分したが、これは計算の便宜上のものであり、区分の仕方はこれに限られるものではない。区分の上限値と下限値についても同様である。
<実施の形態3>
図7は、本発明の実施形態3に係る、能力値θiの分布を補正する手順を実行する処理フローである。図7に示す処理フローは、図1と概ね同様であるが、ステップS103とS104において、それぞれ1つ前のステップの結果を用いる点が異なる。
図7は、本発明の実施形態3に係る、能力値θiの分布を補正する手順を実行する処理フローである。図7に示す処理フローは、図1と概ね同様であるが、ステップS103とS104において、それぞれ1つ前のステップの結果を用いる点が異なる。
(図7:ステップS103)
aj=aj 1、θi=θi 0と置いて、式4を満たすbj=bj 1を、ニュートン法によって求める。
(図7:ステップS104)
aj=aj 1、bi=bi 1と置いて、式5を満たすθi=θi 1を、ニュートン法によって求める。
aj=aj 1、θi=θi 0と置いて、式4を満たすbj=bj 1を、ニュートン法によって求める。
(図7:ステップS104)
aj=aj 1、bi=bi 1と置いて、式5を満たすθi=θi 1を、ニュートン法によって求める。
本実施形態3によれば、ステップS103とS104において、それぞれ1つ前のステップの結果を用いるので、計算が早く収束することが期待できる。反面、局所最適解に陥り易くなる可能性があるので、必要に応じて適宜図1と使い分けるとよい。
<実施の形態4>
図7に示した処理フローにおいて、ステップS102〜S104の順番を入れ替えることもできる。例えば、以下のような変形例が考えられる。
図7に示した処理フローにおいて、ステップS102〜S104の順番を入れ替えることもできる。例えば、以下のような変形例が考えられる。
(図1:ステップS102)
aj=aj 0、bi=bi 0と置いて、式5を満たすθi=θi 1を、ニュートン法によって求める。
(図1:ステップS103)
bj=bj 0、θi=θi 1と置いて、式3を満たすaj=aj 1を、ニュートン法によって求める。
(図1:ステップS104)
aj=aj 1、θi=θi 1と置いて、式4を満たすbj=bj 1を、ニュートン法によって求める。
aj=aj 0、bi=bi 0と置いて、式5を満たすθi=θi 1を、ニュートン法によって求める。
(図1:ステップS103)
bj=bj 0、θi=θi 1と置いて、式3を満たすaj=aj 1を、ニュートン法によって求める。
(図1:ステップS104)
aj=aj 1、θi=θi 1と置いて、式4を満たすbj=bj 1を、ニュートン法によって求める。
<実施の形態5>
実施形態1で説明した手法を用いて各試験パラメータaj、bj、θiを推定する場合、θiの値は図1で推定したときの元来の値から移動されている。θiを移動させることが好ましくない場合、例えば元来の能力値パラメータθiを加工せずに用いたいような場合には、以下のような手順を用いることもできる。
実施形態1で説明した手法を用いて各試験パラメータaj、bj、θiを推定する場合、θiの値は図1で推定したときの元来の値から移動されている。θiを移動させることが好ましくない場合、例えば元来の能力値パラメータθiを加工せずに用いたいような場合には、以下のような手順を用いることもできる。
まず始めに、実施形態1で説明した手法を用いて各試験パラメータaj、bj、θiを推定する。次に、推定した試験パラメータaj、bjを用いて、式5を満たすθiを改めて求める。このとき、θiの値は移動させず、再算出したθiの値をそのまま最終結果とする。
本実施形態5によれば、推定したθiの値をそのまま最終推定結果とすることができるので、能力値パラメータθiを移動させるなどして加工する必要はなく、推定方法の効果をありのまま享受することができる。
<実施の形態6>
図8は、本発明の実施形態6に係る試験パラメータ推定装置800の機能ブロック図である。試験パラメータ推定装置800は、実施形態1〜6で説明した、項目反応理論を用いる試験に係るパラメータを推定する装置である。
図8は、本発明の実施形態6に係る試験パラメータ推定装置800の機能ブロック図である。試験パラメータ推定装置800は、実施形態1〜6で説明した、項目反応理論を用いる試験に係るパラメータを推定する装置である。
試験パラメータ推定装置800は、CPU(Central Processing Unit)810、メモリ820、通信インターフェース830、および記憶装置840を備える。
CPU810は、試験パラメータ推定プログラム842を実行することにより、実施形態1〜6で説明した、項目反応理論を用いる試験に係るパラメータを推定する方法を実行する。
メモリ820は、CPU810が動作する際に用いる一時的なデータなどを記憶するメモリ装置である。通信インターフェース830は、試験パラメータ推定装置800と外部装置が通信するためのインターフェースである。
記憶装置840は、正誤結果データ841、試験パラメータ推定プログラム842、推定結果データ843を格納する。
正誤結果データ841は、実施形態1で説明した正誤結果パラメータuijを記録したデータである。試験パラメータ推定プログラム842は、正誤結果パラメータuijを入力として受け取り、実施形態1〜6で説明した手順にしたがって各試験パラメータaj、bj、θiを推定するステップを記述したソフトウェアプログラムである。推定結果データ843は、試験パラメータ推定プログラム842の実行結果として、各試験パラメータaj、bj、θiの推定結果、標準誤差の再算出結果などを記録するデータである。
本実施形態6に係る試験パラメータ推定装置800および試験パラメータ推定プログラム842によれば、実施形態1〜6で説明した手法を、ソフトウェアプログラムの形態で実現することができる。
なお、CPU810が試験パラメータ推定プログラム842を実行することによって実現される機能を、同等の機能を実現する回路デバイスなどのハードウェアによって構成することもできる。この場合、各フローチャートのステップを実行する機能部をハードウェアによって構成することになる。ステップ毎に機能部を設けてもよいし、いずれか2以上のステップについて共通の機能部によって実現してもよい。
<実施の形態7>
以上の実施形態1〜6では、試験パラメータとしてaj、bj、θiを用いたが、さらに当て推量パラメータを加えることもできる。
以上の実施形態1〜6では、試験パラメータとしてaj、bj、θiを用いたが、さらに当て推量パラメータを加えることもできる。
800:試験パラメータ推定装置、810:CPU、820:メモリ、830:通信インターフェース、840:記憶装置、841:正誤結果データ、842:試験パラメータ推定プログラム、843:推定結果データ。
Claims (6)
- 項目反応理論を用いた試験に係るパラメータをコンピュータで推定する方法であって、
試験問題毎の各被験者の正誤結果を記述した正誤結果データを記憶装置から読み取るステップと、
試験項目が被験者の能力を識別する力を示す識別力パラメータを前記正誤結果データに基づき推定する識別力推定ステップと、
試験項目の難しさを示す困難度パラメータを前記正誤結果データに基づき推定する困難度推定ステップと、
被験者の能力を示す能力値パラメータを前記正誤結果データに基づき推定する能力推定ステップと、
前記識別力推定ステップ、前記困難度推定ステップ、および前記能力推定ステップを繰り返して、前記識別力パラメータ、前記困難度パラメータ、および前記能力値パラメータそれぞれの最終的な推定結果を取得するステップと、
を有し、
前記能力推定ステップを繰り返して得られた前記能力値パラメータの系列を、正規分布関数の変数軸上に設けた複数区間に当てはめて複数に分割し、
各前記区間における前記能力値パラメータの個数と、前記能力値パラメータの系列が前記正規分布関数にしたがって分布していると仮定した場合における前記各区間内の前記能力値パラメータの個数とが、同一になるように、前記能力値パラメータの系列を前記変数軸上で移動させる
ことを特徴とする試験パラメータ推定方法。 - 前記識別力パラメータ、前記困難度パラメータ、および前記能力値パラメータを含む前記パラメータのうち少なくともいずれかを第1パラメータとして選択し、他の前記パラメータを第2パラメータとして用いて前記第1パラメータの標準誤差を再算出する標準誤差再算出ステップを有し、
前記標準誤差再算出ステップはさらに、
前記第1パラメータの標準誤差を再算出する際に用いる前記第2パラメータの推定値と標準誤差を取得するステップと、
前記第2パラメータの推定値と標準誤差を用いて前記第2パラメータの分布を推定するステップと、
前記第2パラメータの分布を複数区間に区分し、各区分の代表値毎に前記第1パラメータの分布を推定するステップと、
推定した前記第1パラメータの分布を用いて当該分布に対応する前記第1パラメータの標準誤差を再算出するステップと、
を有することを特徴とする請求項1記載の試験パラメータ推定方法。 - 前記第1パラメータの分布に対応する前記第1パラメータの標準誤差を再算出するステップでは、
前記第1パラメータの分布の変数軸上に設けた複数区間の代表値毎に、当該代表値と前記第1パラメータの推定値の間の差分の2乗を算出し、
前記差分の2乗と、当該代表値が属する前記区間が前記第1パラメータの分布に占める割合との積を、前記第1パラメータの分布上の全ての前記代表値について合算し、
その合算値を、前記第2パラメータの分布上の各区間について算出し、前記第2パラメータの分布上の当該区間が分布全体に占める割合を乗じた上で、その値を前記第2パラメータの分布上の全ての区間について算出して合算し、
その合算結果の平方根を、前記第1パラメータの最終的な標準誤差とする
ことを特徴とする請求項2記載の試験パラメータ推定方法。 - 請求項1から3のいずれか1項記載の試験パラメータ推定方法をコンピュータに実行させることを特徴とする試験パラメータ推定プログラム。
- 試験問題毎の各被験者の正誤結果を記述した正誤結果データを格納する記憶装置と、
請求項4記載の試験パラメータ推定プログラムと、
前記試験パラメータ推定プログラムを実行する演算装置と、
を備えることを特徴とする試験パラメータ推定装置。 - 項目反応理論を用いた試験に係るパラメータを推定する装置であって、
試験問題毎の各被験者の正誤結果を記述した正誤結果データを記憶装置から読み取る読取部と、
試験項目が被験者の能力を識別する力を示す識別力パラメータを前記正誤結果データに基づき推定する識別力推定部と、
試験項目の難しさを示す困難度パラメータを前記正誤結果データに基づき推定する困難度推定部と、
被験者の能力を示す能力値パラメータを前記正誤結果データに基づき推定する能力推定部と、
を備え、
前記識別力推定部、前記困難度推定部、および前記能力推定部の処理を繰り返して、前記識別力パラメータ、前記困難度パラメータ、および前記能力値パラメータそれぞれの最終的な推定結果を取得し、
前記能力推定部の処理を繰り返して得られた前記能力値パラメータの系列を、正規分布関数の変数軸上に設けた複数区間に当てはめて複数に分割し、
各前記区間における前記能力値パラメータの個数と、前記能力値パラメータの系列が前記正規分布関数にしたがって分布していると仮定した場合における前記各区間内の前記能力値パラメータの個数とが、同一になるように、前記能力値パラメータの系列を前記変数軸上で移動させる
ことを特徴とする試験パラメータ推定装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010133762A JP2011257676A (ja) | 2010-06-11 | 2010-06-11 | 試験パラメータ推定方法、試験パラメータ推定プログラム、試験パラメータ推定装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010133762A JP2011257676A (ja) | 2010-06-11 | 2010-06-11 | 試験パラメータ推定方法、試験パラメータ推定プログラム、試験パラメータ推定装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011257676A true JP2011257676A (ja) | 2011-12-22 |
Family
ID=45473890
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010133762A Pending JP2011257676A (ja) | 2010-06-11 | 2010-06-11 | 試験パラメータ推定方法、試験パラメータ推定プログラム、試験パラメータ推定装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2011257676A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015514268A (ja) * | 2012-03-26 | 2015-05-18 | サットマップ インターナショナル ホールディングス リミテッド | 差異アルゴリズム(va)および/または分布補償を用いた通話マッピングシステムおよび方法 |
-
2010
- 2010-06-11 JP JP2010133762A patent/JP2011257676A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015514268A (ja) * | 2012-03-26 | 2015-05-18 | サットマップ インターナショナル ホールディングス リミテッド | 差異アルゴリズム(va)および/または分布補償を用いた通話マッピングシステムおよび方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109815332B (zh) | 损失函数优化方法、装置、计算机设备及存储介质 | |
CN106096226B (zh) | 一种数据评估方法、装置及服务器 | |
US10586181B2 (en) | Generation of occupant activities based on recorded occupant behavior | |
JP6330605B2 (ja) | 推定プログラム、推定方法および推定装置 | |
JP2010122825A (ja) | データ予測装置、データ予測方法、データ予測プログラム | |
CN108122168A (zh) | 社交活动网络中种子节点筛选方法和装置 | |
JP2017015594A (ja) | バッテリー、電源管理装置、及び電源管理方法 | |
JP2011257676A (ja) | 試験パラメータ推定方法、試験パラメータ推定プログラム、試験パラメータ推定装置 | |
JP2017138885A (ja) | パラメータ選定方法、パラメータ選定プログラム及びパラメータ選定装置 | |
JP6381863B2 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
JP6493904B2 (ja) | パラメータ選定方法、パラメータ選定プログラム及びパラメータ選定装置 | |
CN109284320B (zh) | 大数据平台上的自动回归诊断方法 | |
US20130030863A1 (en) | Trend-based target setting for process control | |
US20120203520A1 (en) | Input parameter calculation method and apparatus | |
WO2005008580A1 (ja) | パラメータ調整装置 | |
CN117313409B (zh) | 一种电弧数学模型参数优化方法、系统、终端及介质 | |
JP7283645B1 (ja) | 予測値補正装置、予測値補正方法及びプログラム | |
JP2005149037A (ja) | 遺伝子発現作用推定方法、遺伝子発現作用推定装置及び遺伝子発現作用推定プログラム | |
US11749297B2 (en) | Audio quality estimation apparatus, audio quality estimation method and program | |
JP6267455B2 (ja) | 工数見積装置、工数見積方法及びプログラム | |
JP6668270B2 (ja) | 通信品質特徴量抽出装置及び方法 | |
JPH0981598A (ja) | パラメータ抽出方法 | |
JP2005242580A (ja) | パラメータ推定方法、データ予測方法、パラメータ推定装置、データ予測装置、及びコンピュータプログラム | |
JP6190335B2 (ja) | ソフトウェア品質基準計算装置及びソフトウェア品質基準計算方法 | |
CN117175546A (zh) | 基于图形化建模的分布式能源配电网拓扑识别方法和介质 |