以下、本発明の実施形態について図面を参照して説明する。
図1は、本実施形態による学習支援システムを示すブロック図である。学習支援システムT10は、出題傾向予測システムA10、影響度算出システムB10、タイムパフォーマンス算出システムC10、および学習指導システムD10を有している。
学習支援システムT10は、合否のある試験に対する時間効率のよい学習を支援するための学習支援システムである。
本実施形態の試験は定期的に実施される試験である。年1回等のように定期的に実施される試験の例として、国家試験等の資格試験、各種の学校の入学試験などがある。他にも年1回〜年数回といったように定期的に実施される試験は多い。試験には複数の問題が含まれている。受験者は問題に正解することにより得た得点の合計値がボーダーラインを越えたら合格でき、合計値がボーダーラインを下回ったら不合格となる。例えば、宅地建物取引士資格試験は、50問の問題を2時間で解答する形式である。1つの試験全体が複数の科目の試験からなるものもある。その場合、個々の科目をそれぞれ1つの試験として扱ってもよい。試験に含まれる問題には、試験に合格するためにその問題は正解する必要がある問題と、正解できなくても合否に影響は少ない問題があることが経験的に知られている。他の受験者が正解するレベルの問題を確実に正解することができれば試験に合格できると言われ、そのレベルの問題を確実に正解する力を身に着けるのが合格への近道と言われる。
試験全体あるいは科目にて問われる可能性のある知識は複数の分野に分類することができる。分野によって出題される問題数は様々である。毎回の試験で複数の問題が出題される分野があったり、過去数回の試験で出題されていない分野があったり、といったことがありうる。ほとんど出題されない分野と毎年出題される分野とでは合否への影響度が異なる。合格を目指す受験者は合否への影響度が高い分野を優先的に学習するのが通常である。したがって、ほとんど出題されない分野はほとんどの受験者が確実に問題に正解できるだけの知識を身に着けていないため、出題されたとしてもその問題が合否への影響度の高いものとはなり難い。また、分野毎にその問題を正解できるだけの知識を習得するのに要する学習の時間も異なる。知識を習得するに長時間の学習を要する分野もあれば、それほどの時間を要さずに知識を習得できる分野もある。また、各問題自体の着目すると、その問題の正解を導き出せるか否かを左右する要因として、正解を導き出すために必要な知識自体の習得の難易度、問題文の長さや複雑さ、正解の導きやすさ、など様々なものがある。各問題の正解率は、それらの要因が複雑に影響した結果であると想定される。学習者は、試験までの期間が限られているので、学習に当たられる時間も限られている。したがって、学習者は試験に合格するためには時間効率の良い学習を行うことが望まれる。
出題傾向予測システムA10は、次回の試験における分野毎の出題される問題の個数を示す出題傾向を予測するシステムである。出題傾向予測システムA10の本実施形態における具体的な構成および動作については後述する。
影響度算出システムB10は、出題傾向と過去の試験の問題とに基づいて、分野毎のその分野の問題を正解することが合格へ影響する度合いを示す分野別影響度を算出するシステムである。影響度算出システムB10の本実施形態における具体的な構成および動作については後述する。分野別影響度は、それぞれの分野の学習を行うことで合格の可能性が向上する度合いといってもよい。
タイムパフォーマンス算出システムC10は、分野毎の学習に要する時間である分野別学習所要時間と、分野別影響度とに基づいて、分野毎の学習の時間当たりの効果を示す分野別タイムパフォーマンスを算出するシステムである。タイムパフォーマンス算出システムC10はタイムパフォーマンス演算部C11および記憶部C12を有している。タイムパフォーマンス演算部C11は、例えば、影響度算出システムB10で算出された分野別影響度の情報と、記憶部C12に記録されている情報とを用いて、分野別タイムパフォーマンスを算出する。
学習指導システムD10は、タイムパフォーマンス算出システムC10で算出された分野別タイムパフォーマンスと、影響度算出システムB10で算出された分野別影響度と、出題傾向予測システムA10で算出された出題傾向との1つ以上に基づく、学習者の効率的な学習を支援するための学習指導情報を提供するシステムである。学習指導システムD10は、学習指導演算部D11および記憶部D12を有している。学習指導演算部D11は、例えば、分野別タイムパフォーマンス、分野別影響度、および出題傾向と、記憶部D12に記録されている情報とを用いて、学習指導情報を生成する。分野別タイムパフォーマンス、分野別影響度、および出題傾向は、それら自体が単独でも効率的な学習に役立つ情報である。学習指導情報は、分野別タイムパフォーマンス、分野別影響度、および出題傾向のうちの1つ以上を加工した情報を含んでいてよいし、それらの1つ以上の情報のそれ自体を含んでいてもよい。学習指導システムD10の本実施形態における具体的な構成および動作については後述する。
以上のように、本実施形態による学習支援システムT10によれば、分野毎の学習の時間当たりの効果を示す分野別タイムパフォーマンスを提供するので、合否のある試験の効率的な学習を支援することが可能となる。
図2は、本実施形態による計算機システムを示すブロック図である。計算機システムT20は、図1に示した学習支援システムT10を実現するコンピュータである。計算機システムT20は、ハードウェアとして、プロセッサT21、メインメモリT22、記憶装置T23、通信装置T24、入力装置T25、および表示装置T26を有し、それらがバスT27に接続されている。
記憶装置T23は、書込みおよび読み出しが可能にデータを記憶するものであって、この記憶装置T23によって、図1に示した記憶部C12および記憶部D12が実現される。更に、出題傾向予測システムA10および影響度算出システムB10もそれぞれ不図示の記憶部を有しており、それら記憶部も記憶装置T23による実現される。プロセッサT21は、記憶装置T23に記憶されたデータをメインメモリT22に読み出し、メインメモリT22を利用してソフトウェアプログラムの処理を実行するプロセッサである。プロセッサT21によって、図1に示したタイムパフォーマンス演算部C11および学習指導演算部D11が実現される。更に、出題傾向予測システムA10および影響度算出システムB10もそれぞれ不図示の処理部を有しており、それら処理部もプロセッサT21による実現される。通信装置T24は、通信ネットワーク等の不図示の通信回線を介して外部装置とデータを送受信する装置である。例えば、過去に実施された試験に関するデータは、通信装置T24が受信して記憶装置T23に格納してもよい。入力装置T25は、キーボードやマウスなど操作者の操作入力による情報を受け付ける装置であり、入力された情報はプロセッサT21にてソフトウェア処理に利用される。操作者が所望の処理を指示する操作を入力装置T25に対して行うと、プロセッサT21はその操作により指示された処理を実行する。表示装置T26は、プロセッサT21によるソフトウェア処理に伴って画像やテキストの情報をディスプレイ画面に表示する装置である。
なお、ここでは、図1に示した学習支援システムT10を構成する出題傾向予測システムA10、影響度算出システムB10、タイムパフォーマンス算出システムC10、および学習指導システムD10が、図2に示した1つの計算機システムT20により実現される例を示したが、本システム構成に限定されることはない。例えば、出題傾向予測システムA10、影響度算出システムB10、タイムパフォーマンス算出システムC10、および学習指導システムD10がそれぞれ別個の計算機システムにより実現されてもよい。
図3は、本実施形態による学習支援システムが実行する学習支援処理を示すフローチャートである。まず、出題傾向予測システムA10が出題傾向予測処理を実行する(ステップT101)。出題傾向予測処理は次回の試験の出題傾向を予測する処理である。出題傾向予測処理の詳細は後述する。次に、影響度算出システムB10が影響度算出処理を実行する(ステップT102)。影響度算出処理は分野別影響度を算出する処理である。影響度算出処理の詳細は後述する。
次に、タイムパフォーマンス算出システムC10がタイムパフォーマンス算出処理を実行する。タイムパフォーマンス算出処理は、分野別タイムパフォーマンスを算出する処理である。具体的には、タイムパフォーマンス算出システムC10は、影響度算出システムB10が算出した分野別影響度の数値を、記憶部C12に予め設定されている分野別学習所要時間で除算することにより、分野別タイムパフォーマンスを算出する。
次に、学習指導システムD10が学習指導処理を実行する(ステップT104)。学習指導処理は、学習者が効率よく学習を行うことを支援する学習指導情報を生成し、学習者に提供する処理である。具体的には、学習指導システムD10は、予め設定され記憶部D12に格納されている、学習者が学習に充てられる時間である学習持ち時間と、分野別影響度と、に基づいて、その学習者に推奨する学習に関する情報である学習指導情報を提供する。学習持ち時間は、例えば、学習者が自身で申告するものであってよいし、学習者の1週間の行動の情報と試験までの期間とに基づいて算出するものであってもよい。本構成によれば学習者に対して学習持ち時間に応じた学習を行うための学習指導を提供することができる。
具体的には、学習指導システムD10は、分野別学習所要時間の合計が学習持ち時間以下の範囲内で分野別影響度の合計が最大となる1つ以上の分野を抽出し、抽出した分野を学習指導情報として提示する。分野別学習所要時間は、各分野の知識を習得するのに要する時間として、分野毎に予め定められた時間である。本構成によれば、学習者は学習持ち時間を効果的に使うために学習すべき分野を知ることができる。更に、学習指導システムD10は、抽出した分野を分野別タイムパフォーマンスが高い順に提示する。本構成によれば、学習者は学習すべき分野をタイムパフォーマンスが高い順に優先的に学習することが可能となる。
<出題傾向分析システム>
図4は、本実施形態による出題傾向分析システムを示すブロック図である。
出題傾向予測システムA10は、問題分析部A11、予測手法選択部A12、本予測処理部A13、表示部A14、および記憶部A15を有している。記憶部A15には、問題データA16、出題データA18、候補予測モデル形式データA17、および予測結果A19のデータが格納される。
記憶部A15に格納されている出題データA18は、複数回の試験について各回の試験に出題された複数の問題に関するデータである。本実施形態では、出題データA18は、問題分析部A11が、過去に実施された各回の試験にて出題された問題のデータである問題データA16を分析して分野毎の出題数(以下「出題傾向」ともいう)にまとめたデータである。
また、候補予測モデル形式データA17は、将来の出題傾向の算出に用いる予測モデルの形式のデータである。例えば、所定の形式の予測モデルの構築および予測の処理を実行するためのソフトウェアである。形式の例として、ARMAモデル(自己回帰移動平均モデル)、ARIMAモデル(自己回帰和分移動平均モデル)、SARIMAモデル(季節自己回帰和分移動平均モデル)がある。
予測手法選択部A12は、複数回の試験のうち少なくとも1回の試験をモデル選択用予測対象とし、そのモデル選択用予測対象について、そのモデル選択用予測対象とした試験よりも前に実施された少なくとも1回の試験の出題データをモデル選択用予測対象に対応するモデル選択用予測入力とし、複数の候補予測モデル形式について、出題データを学習して構築した候補予測モデルを用いてモデル選択用予測入力からモデル選択用予測対象の出題傾向を予測し、予測された出題傾向とモデル選択用予測対象の実際の出題傾向との類似の度合いを示す指標を算出し、候補予測モデル毎の指標に基づき、未来の試験の出題傾向の予測に用いる適用予測モデル形式を選択する。類似の度合いを示す指標は、例えば、相関係数、決定係数、平均二乗誤差、またはそれらのうち複数の組合せ、または全ての組合せである。相関係数は1に近いほど類似の度合いが高いとすればよい。決定係数も1に近いほど類似の度合いが高いとすればよい。平均二乗誤差は0に近いほど類似の度合いが高いとすればよい。
本予測処理部A13は、選択された適用予測モデル形式により構築された適用予測モデルを用いて、過去の複数回の試験のうち少なくとも1回の試験の出題データを入力とし、次回の試験の出題傾向を予測する。出題傾向の予測結果は予測結果A19として記憶部A15に記録される。
表示部A14は、過去の複数回の試験の出題傾向を出題データA18から取得し、予測された次回の試験の出題傾向を予測結果A19から取得し、過去から次回までの試験の出題傾向を時系列に表示する。
資格試験などのように年1回あるいは年数回といったように定期的に実施される試験(以下「定期実施試験」という)では、様々な社会環境の変化による影響等により出題傾向も変化する。問題の分析を行ってきた受験機関などでは経験的に、次回試験の出題傾向を予測するのに最大でも過去10〜15年分程度の出題データを用いることが多い。そのため統計的な解析処理や機械学習を行うのに十分なデータ量の出題データが得られないことがある。また、定期実施試験の出題傾向やその変化は試験種別により異なる。そのため適切な予測モデルを選択し、その予測モデルを用いて過去の出題データから次回の試験の出題傾向を良好に予測するということが難しい。
本実施形態では、それぞれに特徴を有する複数の予測モデル形式を候補として予め用意しておき、その試験種別に応じて比較的高い予測精度が得られる予測モデル形式の適用予測モデルを用いて次回の試験の出題傾向を予測する。これにより、客観的でかつ良好な出題傾向の予測を可能としている。その際、過去の試験の出題データを学習して予測モデルを構築する処理を複数回実行する必要があるが、本実施形態では学習する出題データのデータ量が膨大とならないものであるため、複数回の学習を行っても学習に要する時間は問題となるほど長時間にはならない点も利点といえる。
図5は、出題傾向予測処理の一例を示すフローチャートである。出題傾向予測処理は出題傾向予測システムAが実行する一連の処理であ
る。
ステップAS101では、問題分析部A11が問題分析処理を実行する。問題分析処理は、過去の各試験の問題を示す問題データA16から、各試験における分野毎の出題数を示す出題データA18を生成する処理である。問題分析処理の詳細は後述する。
ステップAS102では、予測手法選択部A12が予測手法選択処理を実行する。予測手法選択処理は、次回の試験の出題傾向を予測するのに適用する候補として予め用意された予測モデル形式である候補予測モデル形式のいずれかの中から、次回の試験の出題傾向を予測するのに用いる予測モデル形式(適用予測モデル形式)を選択する処理である。予測手法選択処理の詳細は後述する。
ステップAS103では、本予測処理部A13が次回の試験の出題傾向を予測する予測処理(本予測処理)を実行する。本予測処理では、本予測処理部A13は、ステップAS102で選択された適用予測モデル形式を用いて、過去の試験の出題傾向に基づいて次回の試験の出題傾向を予測する。本予測処理の詳細は後述する。
ステップAS104では、表示部A14が表示処理を実行する。表示処理では、表示部A14は、過去の複数回の試験の出題傾向を出題データA18から取得し、予測された次回の試験の出題傾向を予測結果A19から取得し、過去から次回までの試験の出題傾向を時系列に表示する。過去から次回までの試験の出題傾向を時系列に表示する画面の一例について後述する。
以下、各処理の詳細について説明する。
図6は、問題分析処理の一例を示すフローチャートである。問題分析処理は試験の問題を分野毎に分類し、分野毎の出題数を算出する処理である。
図7は、問題データの一例を示す図である。図7の問題データA16は一例として宅地建物取引士資格試験の問題のデータである。本試験は、1年に1回実施される試験であり、4つの肢から正解の肢を選択する四肢択一式問題が50問出題される。問題データA16には、2001年〜2017年の各試験の問題のデータ(試験毎問題データA21)が含まれている。
図8は、試験毎問題データが示す試験毎の問題の一例を示す図である。図8には、2017年の試験毎問題データA21により示される試験A29が示されている。例示された問17を見ると、試験の問題A22は、複数の肢に共通の問題文A23と、複数の肢それぞれ毎の肢文A24とを含んでいる。
図6に戻り、ステップAS201では、問題分析部A11は、試験A29の各問題A22の問題文A23および肢文A24に対して形態素解析を行い、形態素を抽出する。形態素はそのまま単語であるものもあるが、連続する複数の形態素が複合されて単語となるものもある。
ステップAS202では、問題分析部A11は、必要に応じて連続する複数の形態素を複合し、形態素から単語を抽出する。形態素を複合するとき専門用語の辞書を用い、専門用語を生成するようにしてもよい。一般に試験の問題には専門用語が使われる場合があるので、専門分野の辞書を用いて当該専門分野の専門用語を正しく抽出することが有効である。
ステップAS203では、問題分析部A11は、問題文A23と肢文A24とから抽出された単語に基づいて問題A22を複数の出題分野に分類する。例えば、各分野に対して、その分野の問題に登場する専門用語などの単語を対応付けておき、問題文および肢文にどの分野に対応する単語が登場したかによって問題を分野毎に分類してもよい。問題分析部A11は、1つの肢について、その肢を含む問題の問題文とその肢の肢文とその肢の解説文とに含まれる語句からその肢の特徴量を算出し、1つの問題について、その問題に含まれる複数の肢の特徴量に基づいて、その問題を分類する出題分野を決定することにしてもよい。
なお、ここでは、4つの肢から正解の肢を選択する四肢択一式問題が出題される宅地建物取引士資格試験の例を示しているが、この試験種別に限定されることはない。試験種別によっては他の解答形式の問題も出題されうる。他の解答形式の問題についても同様に、その問題に含まれている単語を抽出し、抽出された単語に基づいて問題を複数の出題分野に分類することが可能である。
ステップAS204では、問題分析部A11は、各回の試験についての出題分野毎の問題の個数を示す出題傾向の情報を出題データA18として記憶部A15に記録する。
図9は、出題データの一例を示図である。出題データA18は、実施された過去の試験について、大分類および小分類で示される分野に対して各回の試験の出題数が表形式で示されている。図9の例では、試験種別が宅地建物取引士資格試験である。例えば、大分類が1であり、その中の小分類が(1)である分類についてみると、2001年の試験では4問出題され、2002年の試験では5問出題され、・・・、2015年の試験では4問出題され、2016年の試験では4問出題され、2017年の試験では5問出題されていることが分かる。2017年の試験までは過去の試験であり出題傾向は求まる。この2017年までの試験の出題傾向に基づいて次の試験である2018年の試験の出題傾向を予測することになる。
図10は、予測手法選択処理の一例を示すフローチャートである。予測手法選択処理は、予め用意した複数の候補予測モデル形式のうち予測精度が高いことが推定されるものにより次回の試験の出題傾向の予測に用いる適用予測モデルを生成する処理である。
図11は、候補予測モデル形式データの一例を示す図である。本実施形態では、候補予測モデル形式データA17には、ARMAモデルデータA41、ARIMAモデルデータA42、およびSARIMAモデルデータA43が含まれている。ARMAモデルは、自己回帰過程と移動平均過程を組み合わせモデルであり、時系列に適用されるモデルである。ARIMAモデルは、ARMAモデルに更に和分過程を組み合わせたモデルである。データ系列の前後のデータの差分系列を用いることに相当する。SARIMAモデルは、ARIMAモデルに更に周期性を取り入れたモデルであり、周期性を示す季節要素を用いるモデルである。
実際の出題傾向が既に分かっている試験の出題傾向を、それより前に実施された試験の出題傾向に基づいて、これら各候補予測モデルを用いて予測モデルを生成し、各予測モデルを用いて予測された出題傾向と実際に出題傾向とに基づき予測精度を推定し、予測精度の高い予測モデルを適用予測モデルとして選択する。
図10に戻り、ステップAS301では、予測手法選択部A12は、モデル選択用予測対象と、モデル選択用予測入力とを決定する。モデル選択用予測対象には、既に実施され実際の出題傾向が分かっている過去の試験を用いる。例えば、過去の最も新しい試験をモデル選択用予測対象とすればよく、図9の例では2017年の試験をモデル選択用予測対象とすればよい。モデル選択用予測入力は、モデル選択用予測対象を予測するための予測モデルに入力する出題データである。例えば、モデル選択用予測対象の試験よりも前に実施された試験の出題データをモデル選択用予測入力とすればよい。例えば、2007年の試験から2016年の試験までの10年分の出願データをモデル選択用予測入力とすることにしてもよい。
ステップAS302では、予測手法選択部A12は未処理の候補予測モデル形式を1つ選択する。
ステップAS303では、予測手法選択部A12は、候補予測モデル形式により出題データA18の少なくとも一部を学習して予測モデル(候補予測モデル)を構築する。候補予測モデルを構築するときに学習する出題データには例えばモデル選択用予測対象の試験よりも前に実施された出題データを用いるとよい。モデル選択用予測入力と同じ出題データを、候補予測モデルを構築するときに学習することにしてもよい。
ステップAS304では、予測手法選択部A12は、候補予測モデルを用いモデル選択用予測入力を入力として、モデル選択用予測対象の出題傾向を予測する。このとき、本実施形態では、予測手法選択部A12は、モデル選択用予測入力の全ての回の試験において出題された問題が同一の個数であった分野については、モデル選択用予測対象の出題される問題の予測値をその同一の個数とし、その出題分野を除いた残りの出題分野の出題される問題の個数を、候補予測モデルを用いた演算で予測した個数とする。
図12は、モデル選択用予測対象の予測された出題傾向の一例を示す図である。ここでは2017年の試験をモデル選択用予測対象としているので、モデル選択用予測対象の予測された出題傾向として2017年の予測出題傾向A51が示されている。大分類および小分類で示される分野に対して2017年の試験の出題数が示されている。
ステップAS305では、予測手法選択部A12は、候補予測モデルにより予測されたモデル選択用予測対象の出題傾向の予測精度を算出する。その際、予測手法選択部A12は、ステップAS304で予測したモデル選択用予測対象の出題傾向と、出題データA18に含まれているモデル選択用予測対象の試験の実際の出題傾向との類似の度合いを示す指標を算出し、その指標の値を予測精度とする。図9に示された2017年の試験の出題傾向と、図12に示された2017年の予測出題傾向A51との類似の度合いを示す指標を算出すればよい。
ステップAS306では、予測手法選択部A12は、全ての候補予測モデル形式を選択したか否か判定する。まだ全ての候補予測モデル形式を選択していなければ、予測手法選択部A12はステップAS302に戻り、次の候補予測モデル形式を選択する。既に全ての候補予測モデルを選択していれば、予測手法選択部A12はステップAS307に進む。
ステップAS307では、予測手法選択部A12は、次回の試験の出題傾向を予測するのに用いる適用予測モデル形式を決定する。例えば、予測精度が最も高かった候補予測モデルの形式を適用予測モデル形式として選択すればよい。
図13は、本予測処理の一例を示すフローチャートである。
ステップAS401では、本予測処理部A13は、予測手法選択部A12により選択された適用予測モデル形式により出題データA18の少なくとも一部を学習することにより、次回の試験の出題傾向を予測するのに用いる適用予測モデルを構築する。適用予測モデルを構築するときには、例えば、次回の試験よりも前に実施された試験の出題データを学習することにすればよい。ここでは2017年の試験までが既に実施されており次回の試験は2018年の試験であるので、2017年以前の出題データA18を学習すればよい。例えば、2008年の試験から2017年の試験までの10年分の出願データを学習することにしてもよい。
ステップAS402では、本予測処理部A13は、ステップAS401で構築した適用予測モデルを用いて次回の試験の出題傾向を予測する。過去の出題データを適用予測モデルに入力することにより次回の試験の出題傾向を予測することができる。例えば、次回の試験が2018年の試験であれば、2008年の試験から2017年までの試験の出題データを適用予測モデルに入力することにより2018年の試験の出題傾向を予測することにしてもよい。このとき本実施形態では、本予測処理部A13は、入力の全ての回の試験において出題された問題の個数が同一の個数であった分野については、次回の試験の出題される問題の予測値をその同一の個数とし、その出題分野を除いた残りの出題分野の出題される問題の個数を、適用予測モデルを用いた演算で予測した個数とする。
図14は、次回の試験の出題傾向予測した結果の一例を示す図である。図14を参照すると、大分類および小分類で示される分野に対して2018年の試験の出題数が示されている。
表示部A14は次回の試験の出題傾向の予測結果を表示する。
以上説明したように、出題傾向予測システムA10は、学習支援システムT10の一部であるとともに、単独でも試験の出題傾向を予測するという学習の支援に利用可能な情報を提供するものである。
本実施形態によれば、出題傾向予測システムA10は、所定の試験種別に関して過去の複数回の試験について各回の試験に出題された複数の問題に関するデータである出題データA18と、予め定められた複数の候補予測モデル形式データA17とを保持する記憶部A15と、試験種別について、複数回の試験のうち少なくとも1回の試験をモデル選択用予測対象とし、そのモデル選択用予測対象について、モデル選択用予測対象とした試験よりも前に実施された少なくとも1回の試験の出題データをモデル選択用予測対象に対応するモデル選択用予測入力とし、複数の候補予測モデル形式について、少なくとも一部の出題データを学習して構築された候補予測モデルを用いてモデル選択用予測入力からモデル選択用予測対象の出題傾向を予測し、予測された出題傾向とモデル選択用予測対象の実際の出題傾向との類似の度合いを示す指標を算出し、候補予測モデル形式毎の指標に基づき、未来の試験の出題傾向の予測に用いる適用予測モデル形式を選択する予測手法選択部A12と、適用予測モデル形式により構築された適用予測モデルを用いて、過去の複数回の試験のうち少なくとも1回の試験の出題データを入力とし、未来の試験の出題傾向を予測する本予測処理部A13と、予測された未来の試験の出題傾向を表示する表示部A14と、を有する。
本例によれば、各種性質を有する予め複数の予測モデル形式を候補として用意しておき、試験種別を限定し、その試験種別について予測精度が得られる予測モデルを適用予測モデルとし、その適用予測モデルを用いて次回の試験の出題傾向を予測するので、客観的でかつ良好な出題傾向の予測が可能となる。
また、本実施形態では、試験の問題には、複数の肢から適切な肢を選択させる多肢選択式問題があり、複数の肢に共通の問題文と、複数の肢それぞれ毎の肢文とを含む。問題分析部A11が、問題文と肢文とに基づいて問題を複数の出題分野に分類し、各回の試験についての出題分野毎の問題の個数を示す出題傾向の情報を出題データA18とし、予測手法選択部A12は、出題分野毎の問題の個数を示す出題傾向に基づいて適用予測モデル形式を選択し、本予測処理部A13は、未来の試験における出題分野毎の問題の個数を示す出題傾向を予測する。問題文および肢文に基づき問題を出題分野毎に分類し、その出題傾向を適用予測モデルの決定に用い、未来の試験の出題分野毎の問題数を予測するので、問題の分類を容易に行うことができる。また、分野ごとの出題数の傾向が予測できるので、予測結果をどの分野を重点的に学習すべきか判断するのに利用したり、模擬試験の作成において分野毎の問題数を判定するのに利用したりすることができる。
また、本実施形態では、問題分析部A11は、1つの肢について、その肢を含む問題の問題文とその肢の肢文とに含まれる語句からその肢の特徴量を算出し、1つの問題について、その問題に含まれる複数の肢の特徴量に基づいて、その問題を分類する出題分野を決定する。問題文と肢文とにより個々の肢の特徴量を算出し、問題に含まれる肢の個々の特徴量を総合してその問題を分類するので、含まれる肢の内容を考慮した問題文の分類が可能である。
また、本実施形態では、出題データA18は、試験における出題分野毎の出題された問題の個数で示される出題傾向の情報を含み、予測手法選択部A12は、自己回帰と移動平均が組み込まれた第1予測モデル形式と、自己回帰と移動平均とd1階差分(d1は変数)が組み込まれた第2予測モデル形式と、自己回帰と移動平均とd2階差分(d2は自然数)と季節階差が組み込まれた第3予測モデル形式とを含む複数の候補予測モデル形式を予め定め、その複数の候補予測モデル形式の中から適用予測モデル形式を選択し、表示部A14は、複数回の試験および未来の試験の出題分野毎の出題数を時系列に表示する。定期的に実施される試験種別の試験では、緩やかではあるが年数の経過に伴って出題傾向が変化しうることが経験的に知られている。しかし、利用する出題データの時間範囲が大きくないため、利用する出題データの時間範囲内で平均値が変動する場合と殆どしない場合が考えられる。また、出題者や試験委員により意識的にあるいは無意識的に出題傾向に周期性が形成される場合がある。ただし、利用する出題データの時間範囲が大きくないため、その時間範囲内で周期的な変動を想定するのがよい場合とよくない場合がある。以上のような定期的に実施される試験の性質を踏まえ、本実施形態では、上述したような候補予測モデル形式を予め用意しておき、その中から過去の出題傾向に合う予測モデル形式を選択するので、過去の試験が様々な傾向を示していても次回試験の出題傾向を良好に予測することが可能となる。
また、本実施形態では、表示部A14は、予測手法選択部A12により第3予測モデル形式(SARIMAモデル)が適用予測モデル形式として選択された場合、出題傾向に周期性がある可能性がある旨と周期性のあるデータに好適な予測モデルを適用した旨の情報とのいずれか一方または両方を表示する。受験機関のベテラン講師等は手作業による過去問の分析で次回の出題数を予測するだけでなく出題傾向の周期性も知得し、その周期性があるという情報を受験指導に役立てることがある。本実施形態によれば、出題傾向予測システムA10が出題分野毎の出題数だけでなく出題傾向に周期性がある可能性を示唆する情報を表示するので、経験豊富な講師が手作業で出題傾向を予測したときのように、出題傾向の周期性に関する情報を受験指導に役立てることができる。
また、本実施形態では、予測手法選択部A12は、モデル選択用予測入力の全ての回の試験において出題された問題が同一の個数であった出題分野については、モデル選択用予測対象の出題される問題の予測値を前記同一の個数とし、その出題分野を除いた残りの出題分野の出題される問題の個数を、候補予測モデルを用いた演算で予測した個数とし、本予測処理部A13は、入力の全ての回の試験において出題された問題の個数が同一の個数であった出題分野については、次回の試験の出題される問題の予測値を同一の個数とし、その出題分野を除いた残りの出題分野の出題される問題の個数を、適用予測モデルを用いた演算で予測した個数とする。定期的に実施する試験の問題では、ある分野で習得すべき知識の量やその知識を習得していることを確認する必要性あるいは更に他の分野とのバランスから、分野によっては出題数が概ね決まっている場合があることが経験的に知られている。本実施形態では、入力として用いる全ての回の試験において出題数が同一個数の出題分野は、出題数が概ね決まっている出題分野であると推定し、その分野については予測モデルを用いることなく予測値をその同一個数としている。これにより経験則に合致する予測結果を確実に得ることが可能となっている。
また、本実施形態では、表示部A14は、適用予測モデルの、予測された出題傾向と実際の出題傾向との類似の度合いを示す指標の値と、その指標に応じた予測精度に関する情報とのいずれか一方または両方を表示する。受験機関のベテラン講師等は手作業による過去問の分析で次回の出題数を予測するだけでなく、その予測精度がどの程度かを経験に基づいて推測し、その予測精度を受験指導に直接的にあるいは間接的に利用することがある。例えば、予測精度が低いと思える場合には予測が外れる場合も考慮してやや広い分野にわたり勉強するよう指導するかもしれない。本実施形態によれば、出題傾向予測システムA10が出題分野毎の出題数の予測値だけでなくその予測精度を示唆する情報を表示するので、出題傾向の予測精度がどの程度かを受験指導に役立てることができる。
上述した本実施形態の出題傾向予測システムは、説明のための例示であり、本発明の範囲をその実施形態のみに限定する趣旨ではない。当業者は、本発明の範囲を逸脱することなしに、他の様々な態様に変形して本発明を実施することができる。以下、いくつかの変形例について説明する。
変形例として、試験の問題に関連して複数の肢文のそれぞれについての解説文を用意し、問題分析部A11が試験の各問題を分野毎に分類する処理に利用することにしてもよい。具体的には、問題分析部A11は、問題文と肢文と解説文とに基づいて問題を出題分野に分類することにすればよい。問題分析部A11は、試験A29の各問題A22の問題文A23および肢文A24と各肢文A24の解説文とに対して形態素解析を行い形態素を抽出し、必要に応じて連続する複数の形態素を複合し、形態素から単語を抽出し、抽出された単語に基づいて問題A22を複数の出題分野に分類する。問題を作成した出題者自身や経験が豊富な講師が作成する解説文には、その問題や肢で問われる重要な知識に関連する単語が現れることがあるので、問題を出題分野に分類するのに問題文と肢文だけでなく解説文を利用することで、問題文や肢文が異なっても問われる知識が近いような類似問題の分野毎の分類を向上させることができる。また、問題分析部A11は、1つの肢について、その肢を含む問題の問題文とその肢の肢文とその肢の解説文とに含まれる語句からその肢の特徴量を算出し、1つの問題について、その問題に含まれる複数の肢の特徴量に基づいて、その問題を分類する出題分野を決定することにしてもよい。
また、変形例として、予測手法選択部A12は、複数回の試験をモデル選択用予測対象として複数の候補予測モデル形式による候補予測モデルのそれぞれについて前記指標を算出し、前記モデル選択用予測対象のそれぞれについて前記指標により上位から1つ以上の候補予測モデルを選択し、最も多くの前記モデル選択用予測対象にて選択された候補予測モデルの形式を前記適用予測モデル形式とすることにしてもよい。
また、予測手法選択部A12は、複数回の試験をモデル選択用予測対象として複数の候補予測モデル形式による候補予測モデルのそれぞれについて指標を算出し、その指標に基づきモデル選択用予測対象のそれぞれについて上位から1つ以上の候補予測モデルを選択し、複数のモデル選択用予測対象に対して実施時期が遅いほど大きい値となり、モデル選択用予測対象において上位であるほど大きい値となるように、複数の候補予測モデルを重み付けしたスコアを付与し、スコアの合計値が最も大きい候補予測モデルの形式を適用予測モデル形式とすることにしてもよい。
また、変形例として、予測手法選択部A12は、複数回の試験をモデル選択用予測対象として複数の候補予測モデルのそれぞれについて指標を算出し、モデル選択用予測対象のそれぞれについて指標により上位から1つ以上の候補予測モデルを選択し、モデル選択用予測対象にて選択された回数の多い上位n個(nは自然数)の候補予測モデルを適用予測モデルとし、本予測処理部A13は、そのn個の適用予測モデルによって算出した、未来の試験で出題される出題分野毎の問題の個数の平均値を出題傾向として算出することにしてもよい。
<影響度算出システム>
図15は、影響度算出システムの構成を示すブロック図である。影響度算出システムB10は、合否のある試験の各問題を対象として解析を行うことにより、試験に合格するために当該問題を正解することが求められる度合いである問題別影響度と、分野毎の当該分野の問題を正解することが合格へ影響する度合いを示す分野別影響度とを算出する。
図15を参照すると、影響度算出システムB10は、記憶部B11と影響度算出部B20を有している。影響度算出部B20は問題別影響度算出部B21と分野別影響度算出部B22を有している。
記憶部B11は、試験に含まれる複数の問題の問題文テキストを含む試験データを記憶している。複数の問題の全部または一部が解析の対象となりうる。以下、解析の対象の問題を対象問題と呼ぶ。
問題別影響度算出部B21は、各問題について、試験に合格するためにその問題を正解することが求められる度合いを示す指標である問題別影響度を算出する。
分野別影響度算出部B22は、分野毎の当該分野の問題を正解することが合格へ影響する度合いを示す指標である分野別影響度を算出する。
問題別影響度算出部B21は、前提知識判別部B12、問題文長算出部B13、解答形式特定部B14、問題別影響度評価部B15、および所要時間算出部B16を備えている。前提知識判別部B12は、対象問題を解くのに要する前提知識を判別する。問題文長算出部B13は、対象問題の文の長さである問題文長を算出する。解答形式特定部B14は、対象問題に対する解答形式を特定する。
問題別影響度評価部B15は、対象問題の前提知識と問題文長と解答形式とに基づいて、その対象問題の問題別影響度を評価する。例えば、問題別影響度が小さいということは、その問題を正解できないことが合否を分けることにはなり難いことを意味する。一般に問題の難易度が高い方が影響度は小さくなる傾向となる。例えば、非常に難しい問題は、合格者を含むほとんどの受験者が正解できないため、合否に影響が殆どないということが起こりうる。
以上のように、問題の前提知識と問題文長と解答形式とに基づいてその問題の合否への影響の度合いを評価するので、試験に含まれる個々の問題が試験の合否に対してどの程度影響するかという曖昧になりがちな事柄を客観的に評価可能にすることができ、合格に向けた問題の勉強への利用が可能なように解析する技術を提供する。
なお、問題別影響度を算出するのに対象問題を正解するのに要する所要時間を考慮してもよい。本実施形態の所要時間算出部B16はその場合のためにある。所要時間算出部B16は、対象問題を正解するのに要する所要時間を算出する。その場合、問題別影響度評価部B15は、前提知識と問題文長と解答形式と所要時間とに基づいて対象問題の問題別影響度を評価すればよい。前提知識、問題文長、および解答形式に加え、所要時間を考慮して問題別影響度を決定するので、制限時間内に問題を解く形式の試験において、対象問題の問題別影響度を所要時間の面の影響も考慮して客観的に評価することができる。
以下、影響度算出システムB10が実行する具体的な処理について説明する。
本実施形態にて対象とされる試験には様々な解答形式の問題が含まれている。代表的な解答形式として、正誤問題、択一式問題、組合せ問題、選択式問題、計算問題、個数問題、記述式問題がある。同じ分野の知識に関する問題であっても解答形式により正解の導きやすさが変わる可能性がある。解答形式により問題の正解の導き出しやすさが変わるので、解答形式は問題の問題別影響度を定める要因となりうる。
問題の解答形式により問題の問題文の形式もある程度定まっている。したがって、解答形式特定部B14は、対象問題の問題文テキストを解析し、解答形式毎の所定の条件に該当するか否か判定することにより、対象問題がどの解答形式のものであるかを判別することができる。
以下、各解答形式の問題の例を示す。
図16は、正誤問題の一例を示す図である。
正誤問題は、ある事項が正しいあるいはそれに準ずるものであるか、誤っているあるいはそれに準ずるものであるかを答えさせる二者択一の問題である。図16には、一例として、与えられた文章が正しいあるいは適切なものであるか、その文章が誤っているあるいは不適切なものであるかを答えさせる正誤問題が示されている。正誤問題は、解答が二者択一であり、問題文に、「正しい」という語句あるいはそれに準ずる所定の語句、および/または、「誤っている」あるいはそれに準ずる所定の語句が含まれているという特徴がある。図16に示した正誤問題における「適切な」は「正しい」に準ずる語句の例である。また、「不適切な」は「誤っている」の準ずる語句の例である。
図17は、択一式問題の一例を示す図である。
択一式問題は、所定個の文章(肢文)を選択肢として有し、その選択肢の中から1つの正解であるもの(正解肢)を選択させる問題である。選択肢の個数(肢数)としては、試験によって、例えば、四肢、五肢、六肢などがある。図17には、一例として、5個の選択肢の文章(肢文)のうちいずれが正しいかを答えさせる択一式問題が示されている。正しいものが正解肢となる。他の例としては、複数の肢文の中から誤っている1つの肢文を答えさせる択一式問題もある。その場合には、誤っているものが正解肢となる。択一式問題は、問題文に複数の肢文を含み、その肢文自体が解答の選択肢となっているという特徴がある。
また法律に関連する試験などの択一式問題の選択肢には、知識問題選択肢、事例問題選択肢、および判例問題選択肢がある。事例問題選択肢は、具体的な事例について問う選択肢である。事例問題選択肢は、事例問題に登場する所定の主体を示す単語(事例主体用語)が問題文に含まれているという特徴がある。法律に関する試験に登場する典型的な事例主体用語として、甲、乙、丙、丁、A社、B社、C社、D社などがある。判例問題選択肢は、特定の判例に関する理解について問う選択肢である。判例問題選択肢は、特定の判例に特有の語句あるいは語句の組合せが問題文に含まれているという特徴がある。知識問題選択肢は、特定の事項に関する知識を問う選択肢である。判例問題選択肢にも事例問題選択肢にも該当しない問題は知識問題選択肢と推定することができる。
図18は、組合せ問題の一例を示す図である。
組合せ問題は、複数個の肢文についての複数の組合せを選択肢として有し、その選択肢の中から、問題文で与えられた条件に該当する肢文の組合せを選択させる問題である。ここでいう組合せには、0個の場合および1個の場合も含まれる。図18には、一例として、ア、イ、ウという3つの事項について1、2、3、4という4つの組合せを選択肢とし、その選択肢の中から、誤っているものの組合せを選択させる組合せ問題が示されている。組合せ問題は、問題文に複数の肢文を有し選択肢の各々が0個以上の肢文の組合せとなっているという特徴がある。
図19は、選択式問題の一例を示す図である。
選択式問題は、問題文に複数の空欄があり問題文とは別にそれらの空欄に当てはまる語句を含む複数の語句が選択肢として与えられ、各空欄に当てはまる語句を選択肢の中から選択させる問題である。図19には、一例として、問題文にア、イ、ウ、エという4つの空欄があり、それら空欄に当てはまる語句を、1〜20という20個の選択肢から選択させる問題が示されている。選択式問題は、複数の空欄を含んだ問題文と空欄に当てはまる語句の候補を選択肢として羅列した部分とあるという特徴がある。
図20は、計算問題の一例を示す図である。
計算問題は、問題文の条件に従って数値計算を行い、正解を導く問題である。図20には、一例として、1〜4という4つの金額が選択肢として与えられており、問題文にて要求された金額を計算し、計算結果の金額と一致する選択肢を選択させる問題が示されている。計算問題は、解答の選択肢の各々に数値が含まれ、問題文にも計算に用いる数値が含まれているという特徴がある。
図21は、個数問題の一例を示す図である。
個数問題は、問題文に複数個の肢文を有し、複数個の肢文の個数を選択肢として有し、その選択肢の中から、問題文で与えられた条件に該当する肢文の個数を選択させる問題である。ここでいう個数には0個も含まれる。図21には、一例として、問題文にア、イ、ウという3つの肢文を有し、1(1つ)、2(2つ)、3(3つ)、4(なし)という4つの選択肢を有し、3つの肢文のうち誤っているものがいくつあるかを、選択肢の中から選択させる個数問題が示されている。個数問題は、複数の選択肢の各々が複数の肢文に対応する記号の組合せとなっているという特徴がある。ここでいう記号は各肢文を識別するものであればなんでも良く、例えば、数字、アルファベット、片仮名、平仮名、漢字、図形などでよい。
図22は、記述式問題の一例を示す図である。
記述式問題は、問題文に基づいて所定の事項について記述させる問題である。図22には、一例として、問題文にて要求される事項について、所定文字数程度の文章で記述させる記述式問題が示されている。記述式問題は、文章で記述することを要求する所定の語句が含まれているという特徴がある。図22に示した問題文における「記述しなさい」は、文章で記述することを要求する所定の語句の例である。他の例として、「記述せよ」「論述しなさい」「説明しなさい」などがある。
図23は、影響度算出システムが実行する全体処理の一例を示すフローチャートである。
まずステップB101にて前提知識判別部B12が前提知識判別処理を実行する。前提知識判別処理は、対象問題を解くのに要する前提知識の分野を判別する処理である。この処理により、対象問題がどの分野を前提とした問題か、すなわち、どの分野の知識の有無を問う問題かが特定される。前提知識判別処理の詳細は図25を参照して後述する。
次にステップB102にて問題文長算出部B13が問題文長算出処理を実行する。問題文長算出処理は、対象問題の問題文長を判別する処理である。問題文長は問題文の長さである。問題文長を表す単位は特に限定されないが、例えば、文字数、単語数、行数などで表現されうる。文字数で表現する場合、問題文長算出部B13は、問題文に含まれる文字の個数をカウントすればよい。
図24は、問題情報の一例を示す図である。問題情報B40には、問題の問題番号B41に対応付けて、該当分野B42、問題文長B43、解答形式B44、所要時間B45、および問題別影響度B46が登録される。本ステップB102では、問題情報B40に、対象問題の問題番号B41に対応付けて問題文長B43が登録される。
次にステップB103にて解答形式特定部B14が解答形式特定処理を実行する。解答形式特定処理は、対象問題の解答形式を特定する処理である。解答形式には、上述した、正誤問題、択一式問題、組合せ問題、選択式問題、計算問題、個数問題、記述式問題があり、択一式問題には更に判例問題、事例問題、知識問題がある。解答形式特定処理の詳細は図27を参照して後述する。この処理により対象問題の解答形式が特定される。
次にステップB104にて問題別影響度評価部B15が問題別影響度評価処理を実行する。問題別影響度評価処理は、対象問題の問題別影響度を評価する処理である。例えば問題別影響度を決定すればよい。問題別影響度の表現は特に限定されないが、例えば、数値によるスコア、ランク付けなどにより表現することができる。問題別影響度は、対象問題の前提知識の分野、問題文長、解答形式に基づいて、あるいは更に所要時間に基づいて決定することができる。問題別影響度評価処理の詳細は図28を参照して後述する。
次にステップB105にて、分野別影響度算出部B22は、分野別影響度算出処理を実行する。分野別影響度算出処理は、分野毎の当該分野の問題を正解することが合格へ影響する度合いを示す指標である分野別影響度を算出する処理である。分野別影響度の算出の詳細については後述する。
図25は、前提知識判別処理の一例を示すフローチャートである。
前提知識判別部B12は、記憶部B11から対象問題テキストを取得して解析することにより、対象問題に含まれている分野関連用語を抽出する。
分野関連用語とは、各分野の問題に登場する用語である。前提知識判別部B12は、各分野の分野関連用語を予め定めた分野情報を管理している。図26は、分野情報の一例を示す図である。分野情報B30は、分野B31に対応付けて、用語数B32と、分野関連用語B33と、知識難易度B34とが登録されたテーブルである。用語数B32は、対応する分野に関連する用語の個数を示す。分野関連用語B33は、対応する分野に関連する用語を示す。知識難易度B34は、対応する分野の知識を習得の難易度を示す。ここでは一例として知識難易度が10段階で示されているものとする。例えば、分野「1」には「abb」、「acc」、「add」、「aee」という4個の分野関連用語B33が設定されている。分野「1」の知識難易度は「4」である。同様に、分野「2」には「bcc」、「bdd」、「bee」、「bff」、「bgg」、「bhh」、「bii」という7個の分野関連用語B33が設定されている。分野「2」の知識難易度は「7」である。
具体的には、前提知識判別部B12は、対象問題に登場する単語と分野情報B30にて各分野に対応づけられた分野関連用語とを照合し、対象問題に登場する各分野の分や関連用語を抽出する。
次に、前提知識判別部B12は、ステップB201の照合結果に基づいて、当該問題が各分野の問題である可能性がどの程度であるかについての指標として分野スコアを算出する(ステップB202)。一例として、分野Xの分野スコアは式(1)により算出される。
分野Xの分野スコアSX=(ST/NX)×Nm ・・・(1)
ここでSTは一定値であり、全分野に共通する値が用いられる。Nxは分野Xに設定されている全体の分野関連用語の個数すなわち用語数B32である。Nmは、対象問題に含まれている分野Xの分野関連用語の個数である。
各分野間でトータルのスコアが一定となるように、一定値STを当該分野Xの用語数Nxで割った値を個々の分野関連用語B33のスコアとして各分野関連用語B33に均等に分配し、対象問題に含まれている分野関連用語B33のスコアを積算した値が当該対象問題の当該分野Xに対する分野スコアとなる。例えば、対象問題に分野Aに関連する「abb」および「acc」という2つの分野関連用語B33が含まれていた場合、当該対象問題の分野「1」に対する分野スコアS1は、S1=(ST/4)×2=ST/2となる。
次に、前提知識判別部B12は、ステップB202で算出した各分野の分野スコアを基に、当該対象問題が該当する分野(該当分野)を特定する(ステップB203)。例えば、分野スコアが所定の閾値を越えている分野を、当該対象問題の該当分野としてもよい。当該対象問題の該当分野は複数であってもよい。
次に、前提知識判別部B12は、ステップB203で特定した対象問題の該当分野を問題情報B40に登録する。本ステップB203では、図24に例示した問題情報B40に、対象問題の問題番号B41に対応付けて該当分野B42が登録される。
なお、ここに例示した前提知識判別処理とは異なる処理で対象問題の分野を特定してもよい。前提知識判別部B12は、例えば、出題傾向分析システムA10の問題分析部A11が決定した対象問題の出題分野の情報を取得し、その情報を用いてもよい。逆に、前提知識判別部B12が特定した対象問題の分野の情報を、出題傾向分析システムA10に通知し、出題傾向分析システムA10の問題分析部A11は、その情報に基づいて問題の出題分野を決定することにしてもよい。
図27は、解答形式特定処理の一例を示すフローチャートである。
まずステップB301にて、解答形式特定部B14は、対象問題が正誤問題であるか否か判定する。図16に例示した正誤問題には、解答が二者択一であり、問題文に、「正しい」という語句あるいはそれに準ずる所定の語句、および/または、「誤っている」あるいはそれに準ずる所定の語句が含まれているという特徴がある。解答形式特定部B14は対象問題の問題文テキストを解析し、対象問題の問題文テキストに正誤問題の特徴が含まれているか否か判定する。問題文テキストに正誤問題の特徴が含まれていれば、対象問題は正誤問題であると判断できる。対象問題が正誤問題であれば解答形式特定部B14はステップB309に進んで、問題情報B40に、対象問題の問題番号B41に対応する解答形式B44に「正誤問題」を登録する。
ステップB301にて対象問題が正誤問題でなければ、ステップB302にて、解答形式特定部B14は、対象問題が択一式問題であるか否か判定する。図17に示した択一式問題には、問題文に複数の肢文を含み、その肢文自体が解答の選択肢となっているという特徴がある。解答形式特定部B14は、対象問題の問題文テキストに択一式問題の特徴が含まれているか否か判定する。問題文テキストに択一式問題の特徴が含まれていれば、対象問題は択一式問題であると判断できる。対象問題が択一式問題であれば解答形式特定部B14はステップB303に進む。
ステップB303では、解答形式特定部B14は、択一式問題である対象問題の各選択肢が判例問題選択肢、事例問題選択肢、知識問題選択肢のいずれであるか判定する。判定問題選択肢には、特定の判例に特有の語句あるいは語句の組合せが問題文に含まれているという特徴がある。事例問題は、事例主体用語が問題文に含まれているという特徴がある。解答形式特定部B14は、問題文テキストに判例問題の特徴が含まれていれば対象問題は判例問題であると判断し、問題文テキストに事例問題の特徴が含まれていれば対象問題は事例問題であると判断し、問題文テキストに判例問題の特徴も事例問題の特徴も含まれていなければ対象問題は知識問題であると判断する。その後、解答形式特定部B14は、ステップB309に進んで、問題情報B40に、対象問題の問題番号B41に対応する解答形式B44に「択一式問題」を登録する。また、解答形式特定部B14は、択一式問題の各選択肢が、判例問題選択肢であるか、事例問題選択肢であるか、知識問題選択肢であるかを記録する。
ステップB302にて対象問題が択一式問題でなければ、ステップB304にて、解答形式特定部B14は、対象問題が組合せ問題であるか否か判定する。図18に例示した組合せ問題には、問題文に複数の肢文を有し選択肢の各々が0個以上の肢文の組合せとなっているという特徴がある。解答形式特定部B14は、対象問題の問題文テキストに組合せ問題の特徴が含まれているか否か判定する。問題文テキストに組合せ問題の特徴が含まれていれば、対象問題は組合せ問題であると判断できる。対象問題が組合せ問題であれば解答形式特定部B14はステップB309に進んで、問題情報B40に、対象問題の問題番号B41に対応する解答形式B44に「組合せ問題」を登録する。
ステップB304にて対象問題が組合せ問題でなければ、ステップB305にて、解答形式特定部B14は、対象問題が選択式問題であるか否か判定する。図19に例示した選択式問題には、複数の空欄を含んだ問題文と空欄に当てはまる語句の候補を選択肢として羅列した部分とあるという特徴がある。解答形式特定部B14は、対象問題の問題文テキストに選択式問題の特徴が含まれているか否か判定する。問題文テキストに選択式問題の特徴が含まれていれば、対象問題は選択式問題であると判断できる。対象問題が選択式問題であれば解答形式特定部B14はステップB309に進んで、問題情報B40に、対象問題の問題番号B41に対応する解答形式B44に「選択式問題」を登録する。
ステップB305にて対象問題が選択式問題でなければ、ステップB306にて、解答形式特定部B14は、対象問題が計算問題であるか否か判定する。図20に例示した計算問題には、解答の選択肢の各々に数値が含まれ、問題文にも計算に用いる数値が含まれているという特徴がある。解答形式特定部B14は、対象問題の問題文テキストに計算問題の特徴が含まれているか否か判定する。問題文テキストに計算問題の特徴が含まれていれば、対象問題は計算問題であると判断できる。対象問題が計算問題であれば解答形式特定部B14はステップB309に進んで、問題情報B40に、対象問題の問題番号B41に対応する解答形式B44に「計算問題」を登録する。
ステップB306にて対象問題が計算問題でなければ、ステップB307にて、解答形式特定部B14は、対象問題が個数問題であるか否か判定する。図21に例示した個数問題には、複数の選択肢の各々が複数の肢文に対応する記号の組合せとなっているという特徴がある。解答形式特定部B14は、対象問題の問題文テキストに個数問題の特徴が含まれているか否か判定する。問題文テキストに個数問題の特徴が含まれていれば、対象問題は個数問題であると判断できる。対象問題が個数問題であれば解答形式特定部B14はステップB309に進んで、問題情報B40に、対象問題の問題番号B41に対応する解答形式B44に「個数問題」を登録する。
ステップB307にて対象問題が個数問題でなければ、ステップB308にて、解答形式特定部B14は、対象問題が記述式問題であるか否か判定する。図22に例示した記述問題には、文章で記述することを要求する所定の語句が含まれているという特徴がある。解答形式特定部B14は、対象問題の問題文テキストに記述式問題の特徴が含まれているか否か判定する。問題文テキストに記述式問題の特徴が含まれていれば、対象問題は記述式問題であると判断できる。対象問題が記述式問題であれば解答形式特定部B14はステップB309に進んで、問題情報B40に、対象問題の問題番号B41に対応する解答形式B44に「記述式問題」を登録する。
ステップB308にて対象問題が記述式問題でなければ、解答形式特定部B14は、対象問題の解答形式がいずれにも該当しなかった旨のエラーを出力する。
図28は、問題別影響度評価処理の一例を示すフローチャートである。
本実施形態では、問題別影響度には、試験に合格するために対象問題を正解することが求められる度合いが高い方からレベルA、B、C、Dという4段階がある。レベルDは、正解しなくても合格が可能と想定される問題である。レベルCは、正解の確率が1/2近傍と想定される問題である。レベルBは、合格するには正解すべきと想定される難問である。レベルAは、合格するには正解すべきと想定される易問である。問題別影響度評価部B15は、対象試験がどのレベルに該当するか決定する。
このように、問題を、正解しなくても合格が可能と想定される問題、正解の確率が1/2近傍と想定される問題、合格するには正解すべきと想定される難問、合格するには正解すべきと想定される易問という4つのレベルに分類できるので、合格に向けた勉強への利用に有益な情報を提供することができる。
資格試験などの試験において、超難問や奇問などと言われる、合格者を含めてほとんど全ての受験者が解けないような問題が出題されることがある。そのような問題を他の問題と同様に扱って勉強するのは合格に向けた勉強としては効果的でない場合がある。レベルDは正解しなくても合格が可能な試験対策の勉強における優先度の低い問題である。それ以外のレベルA〜Cは合格するには正解すべき勉強の必要性の高い問題である。勉強の必要性の高い問題に関する勉強において、3段階に分けたレベルが受験者の学力に合わせた勉強や受験指導に有益な情報となる。
正解できなくても合格が可能で勉強の優先度の低いレベルDを除いた3段階のレベル分けというのは、勉強を段階的に進める上で有効な段階数の一例である。レベルA〜Cの3段階のレベルは段階的に勉強を進める上で有益な情報となる。
図28を参照すると、まずステップB401にて、問題別影響度評価部B15は、対象問題の出題頻度を評価する。対象問題の前提知識に対応する分野から問題が出題されていない期間が所定の期間閾値を越えていれば、対象問題をレベルDと決定する。一般に多くの受験者は長期にわたり出題されていない分野を勉強の対象から除いたり、優先度を下げることが多い。そのため長期にわたり出題されていない分野の問題については、多くの受験者は、その前提知識を知らないため正解できないことが想定される。そのような分野からの問題は合否への影響が小さいと推定できる。
次にステップB402にて、問題別影響度評価部B15は、対象問題の該当分野の知識難易度を評価する。対象問題の該当分野は、図24に例示した問題情報B40を参照することにより知得することができる。対象問題の該当分野は1つとは限らず複数である場合もある。該当分野の知識難易度は、図26に例示した分野情報B30を参照することにより、知得することができる。図26に示すように、分野B31のそれぞれについて、当該分野B31の知識の習得の難易度を示す知識難易度B34が予め設定されている。一例として、各分野の知識難易度は予め講師などが設定しておくことにしてもよい。あるいは、教材における当該分野の分量に基づいて知識難易度を自動設定してもよい。例えばテキストのページ数が多い分野は知識難易度が高いとしてもよい。あるいはeラーニングの時間が長い分野は知識難易度が高いとしてもよい。
問題別影響度評価部B15は、対象問題の該当分野から出題されていない期間が期間閾値以下であれば、該当分野の知識難易度に応じて対象問題の問題別影響度を設定する。このように対象問題の該当分野の知識の習得の難易度を問題別影響度に反映させるので、習得すべき分野の知識を習得するための勉強に有益な知識難易度を反映した情報を提供することができる。
具体的には、問題別影響度評価部B15は、対象問題の該当分野の最大値を所定の知識難易度閾値と比較することにより、対象問題の問題別影響度をレベルA、B、Cのいずれかに分類する。上述したように、レベルCは、正解の確率が1/2近傍と想定される問題であり、レベルBは、合格するには正解すべきと想定される難問であり、レベルAは、合格するには正解すべきと想定される易問である。知識難易度閾値は、対象問題がそれらレベルA、B、Cに適切に分類されるように予め設定しておく。具体的には、知識難易度が高ければ問題別影響度が低くなるようにするとよい。知識難易度が高いほど多くの受験者がその分野の知識を習得していない可能性が高まることが想定されるからである。
なお、ここで設定する問題別影響度は、最終決定されたものではない。後述するように、問題文長および解答形式に基づいて調整される。
続いてステップB403にて、問題別影響度評価部B15は、対象問題の問題文長を評価する。具体的には、問題別影響度評価部B15は、対象問題に設定されている問題別影響度がレベルAである場合、対象問題の問題文長が所定の問題文長閾値を越えていれば、対象問題の問題別影響度をレベルBに調整する。知識難易度の低い分野から出題された問題でも、問題文が長くなれば、問題文における前提知識を対応付ける箇所の個数が増え、出題者の意図を把握するのが難しくなる。一方、前提として知っておくべき知識の量が多く相互の関係が複雑であるなど、前提知識の知識難易度の高い分野の問題は性質が異なる。前提知識の知識難易度の高い分野の問題は、予め知識の難易度に合った影響度が設定されていれば、知識と問題の関係の複雑さは既に考慮済みとなるので、更に問題文が長かったとしても、必ずしも更に急激に難易度が上がり影響度が下がるというものではない。このような性質を踏まえ、本態様では、レベルAの対象問題に限り、問題文長が所定の問題文長閾値を越えていれば影響度をレベルBに変更するという処理を行って影響度の妥当性の向上を図っている。
続いてステップB404にて、問題別影響度評価部B15は、解答形式別評価処理を実行する。解答形式別評価処理は、対象問題の解答形式に応じて、対象問題の問題別影響度を評価する処理である。問題には様々な解答形式のものがある。解答形式により正解を導くことの難しさが異なる。解答形式によっては、関連する全ての知識を正確に理解し記憶していなければ正解を導くことが難しい問題がある。その一方で、関連する一部の知識を理解し記憶していれば、消去法等により正解を導ける問題もある。このような解答形式の違いを問題別影響度に反映させることができる。解答形式別評価処理の詳細は図29を参照して後述する。
続いてステップB405にて、問題別影響度評価部B15は、所要時間により対象問題の問題別影響度を評価する。ここでは、対象試験の問題別影響度にその対象試験の正解を導くのに要する所要時間を反映させる例を示す。
その場合、所要時間算出部B16は、対象試験の所要時間を算出する。所要時間の算出は予め行っておいてもよい。
所要時間算出部B16は、試験に取り組んだ受験者のうち対象問題を正解した受験者が対象問題に要した時間である正解時間を取得し、正解時間に基づいて所要時間を算出し、図24に例示した問題情報B40に所要時間B45として登録する。具体的には、例えば、所要時間算出部B16は、正解時間の平均値を所要時間としてもよい。正解時間は、例えば、当該試験の問題を提供するeラーニングシステムから取得可能である。通常、eラーニングシステムから取得できるのは、受験勉強の途中段階の受験者の試験結果であるため、正解率は本試験のものと乖離する可能性がある。しかし、正解した受験者の所要時間(正解時間)については本試験での時間に近い値が得られると想定される。なお、対象問題の所要時間は、問題別影響度の算出に利用可能であるだけでなく、単独でも受験勉強や受験指導に利用可能な有益な情報である。
問題別影響度評価部B15は、対象問題に設定されている問題別影響度を、その対象問題の所要時間に応じて調整する。所定時間内に所定数の問題を解くことが求められる試験において、他の問題に対して所要時間が長い問題は、受験者は試験時にその問題を後回しにする場合がある。そのため所要時間が長い問題は問題別影響度が低いと想定される。本例によれば、そのような所要時間を問題別影響度に反映させることができる。
図29は、解答形式別評価処理のフローチャートである。
ステップB501にて、問題別影響度評価部B15は、対象問題が択一式問題であるか否か判定する。対象問題が択一式問題であるか否かは、解答形式特定部B14による処理結果から判定することができる。
対象問題が択一式問題であれば、問題別影響度評価部B15は、ステップB502にて、択一式問題に含まれる各選択肢を評価する。その際、問題別影響度評価部B15は、各選択肢の選択肢種別に基づいて、当該選択肢の問題別影響度を判定する。各選択肢の選択肢種別は解答形式特定部B14の処理結果から知得することができる。問題別影響度評価部B15は、予め設定されている問題別影響度判定情報を参照して、各選択肢の選択肢種別に対応する問題別影響度を特定する。
図30は、問題別影響度判定情報の一例を示す図である。問題別影響度判定情報B50は、対象問題の解答形式あるいは選択肢の選択肢種別B51に対応付けて、問題別影響度B52が登録されたテーブルである。対象問題が択一式問題であれば選択肢種別毎に問題別影響度が設定され、択一式問題でなければ解答形式毎に問題別影響度が設定される。
図30の例では、択一式問題の知識問題選択肢の問題別影響度はA以上であると設定されている。択一式問題の低度事例問題選択肢の問題別影響度はB以上であると設定されている。択一式問題の判例問題選択肢の問題別影響度はB以上であると設定されている。択一式問題の高度事例問題選択肢の問題別影響度はC以上であると設定されている。
当該選択肢に設定されている問題別影響度が、問題別影響度判定情報B50に「〇以上」と設定されている問題別影響度「〇」より低い場合には、当該選択肢の問題別影響度は「〇」に変更される。例えば、当該選択肢が択一式問題の低度事例問題選択肢でありその問題別影響度がAに設定されている場合には、問題別影響度はBに変更される。
事例問題の選択肢は、前提知識を知っているかどうかが問われる知識問題選択肢と異なり、前提知識を問題に当て嵌める必要があるため、前提知識を知っているだけで解ける簡単な問題ではない。そのため、事例問題選択肢は、知識問題選択肢よりも問題別影響度を下げて妥当性を確保している。また、事例問題選択肢の中でも登場する主体が多い高度事例問題選択肢の方が、登場する主体の少ない低度事例問題選択肢よりも当て嵌めを行う箇所が多いので、より問題別影響度を下げて妥当性を確保している。このような性質を踏まえ、本態様では、低度事例問題選択肢をレベルBとし、高度事例問題選択肢をレベルCとし、問題別影響度の妥当性の確保を図っている。
続いて、問題別影響度評価部B15は、ステップB503にて、択一式問題総合評価処理を実行する。択一式問題総合評価処理は、択一式問題である対象問題の問題別影響度を、その対象問題に含まれてる各選択肢の問題別影響度に基づいて設定する処理である。択一式問題総合評価処理の詳細は図31および図32を参照して後述する。
ステップB501にて対象問題が択一式問題でなければ、問題別影響度評価部B15は、ステップB504にて対象問題の問題別影響度を評価する。その際、問題別影響度評価部B15は、予め設定されている問題別影響度判定情報B50を参照して、対象問題の解答形式に対応する問題別影響度を特定する。
図30の例では、正誤問題の問題別影響度はA以上であると設定されている。組合せ問題の問題別影響度はB以上であると設定されている。選択式問題の問題別影響度はB以上であると設定されている。計算問題の問題別影響度はC以上であると設定されている。個数算問題の問題別影響度はC以上であると設定されている。記述式問題の問題別影響度はC以上であると設定されている。
対象問題に設定されている問題別影響度が、問題別影響度判定情報B50に「〇以上」と設定されている問題別影響度「〇」より低い場合には、対象問題の問題別影響度は「〇」に変更される。例えば、対象問題が組合せ問題でありその問題別影響度がAに設定されている場合には、問題別影響度はBに変更される。
すなわち、問題別影響度評価部B15は、対象問題の前提知識および問題文長により設定された問題別影響度がレベルAであり、対象問題が組合せ問題または選択式問題であれば、対象問題をレベルBに変更する。対象問題の前提知識および問題文長により設定された問題別影響度がレベルAまたはレベルBであり、対象問題が計算問題、個数問題、または記述式問題のいずれかであれば、対象問題をレベルCに変更する。解答形式により調整した妥当な問題別影響度を提供することができる。
図31は、択一式問題総合評価処理の判定論理情報の一例を示す図である。図32は、択一式問題総合評価処理の一例を示すフローチャートである。
択一式問題総合評価は、択一式問題の問題別影響度を各選択肢の問題別影響度に基づく総合評価により設定する処理である。総合評価は図31に示した判定論理情報により行われる。
択一式問題は、全ての選択肢について確実に正しい判断ができない場合には、消去法で選択肢を絞り込んでいくことにより正解を導くこととなる。したがって、消去法による選択肢の絞り込みの容易さにより択一式問題の正解を導くことの容易さが変わる。本実施形態では、どの程度絞り込みができるかと総合評価とを対応づける。
図31に示すように、判定論理情報B60には、対象問題の選択肢が該当するか否か判定する条件(条件内容B62)と、当該条件に該当した対象問題の問題別影響度(総合評価B63)とを対応付けて、条件番号B61を付与して設定されている。本例では条件番号B61が小さい順に判断するものとなっている。
条件番号=1の条件では、条件内容「レベルAかつ正解肢である選択肢が含まれている」に該当する対象問題の総合評価としての問題別影響度がAである。条件番号=2の条件では、条件内容「レベルAかつ不正解肢である選択肢が選択肢の総個数より1個少ない個数だけ含まれている」に該当する対象問題の総合評価としての問題別影響度がAである。条件番号=3の条件では、条件内容「絞り込み条件2に該当せず、レベルBかつ正解肢である選択肢が含まれている」に該当する対象問題の総合評価としての問題別影響度がBである。条件番号=4の条件では、条件内容「絞り込み条件1、3に該当せず、レベルAまたはBかつ不正解肢である選択肢が選択肢の総個数より1個少ない個数だけ含まれている」に該当する対象問題の総合評価としての問題別影響度がBである。条件番号=5の条件では、条件内容「絞り込み条件2、4に該当せず、レベルCかつ正解肢である選択肢が含まれている」に該当する対象問題の総合評価としての問題別影響度がCである。条件番号=6の条件では、条件内容「絞り込み条件1〜5のいずれにも該当せず、レベルAまたはBかつ不正解肢である選択肢が選択肢の総個数よりも2個少ない個数だけ含まれている」に該当する対象問題の総合評価としての問題別影響度がCである。条件番号=7の条件では、条件内容「絞り込み条件1〜6のいずれにも該当しない」に該当する対象問題の総合評価としての問題別影響度がDである。
図32の択一式問題総合評価処理は一連のフローチャートにより実現している。
まずステップB601にて、問題別影響度評価部B15は、対象問題が絞り込み条件1に該当するか否か判定する。問題別影響度評価部B15は、対象問題が絞り込み条件1に該当したらステップB603にて対象問題の問題別影響度をAとする。
対象問題が絞り込み条件1に該当しなければ、問題別影響度評価部B15は、次にステップB602にて、対象問題が絞り込み条件2に該当するか否か判定する。問題別影響度評価部B15は、対象問題が絞り込み条件2に該当したらステップB603にて対象問題の問題別影響度をAとする。
対象問題が絞り込み条件2に該当しなければ、問題別影響度評価部B15は、次にステップB604にて、対象問題が絞り込み条件3に該当するか否か判定する。問題別影響度評価部B15は、対象問題が絞り込み条件3に該当したらステップB606にて対象問題の問題別影響度をBとする。
対象問題が絞り込み条件3に該当しなければ、問題別影響度評価部B15は、次にステップB605にて、対象問題が絞り込み条件4に該当するか否か判定する。問題別影響度評価部B15は、対象問題が絞り込み条件4に該当したらステップB606にて対象問題の問題別影響度をBとする。
対象問題が絞り込み条件4に該当しなければ、問題別影響度評価部B15は、次にステップB607にて、対象問題が絞り込み条件5に該当するか否か判定する。問題別影響度評価部B15は、対象問題が絞り込み条件5に該当したらステップB609にて対象問題の問題別影響度をCとする。
対象問題が絞り込み条件5に該当しなければ、問題別影響度評価部B15は、次にステップB608にて、対象問題が絞り込み条件6に該当するか否か判定する。問題別影響度評価部B15は、対象問題が絞り込み条件6に該当したらステップB609にて対象問題の問題別影響度をCとする。
対象問題が絞り込み条件6に該当しなければ、問題別影響度評価部B15は、ステップB610にて対象問題の問題別影響度をDとする。
図32の処理を以下のように整理することもできる。
問題別影響度評価部B15は、対象問題が、レベルAかつ正解肢である選択肢が択一式問題に含まれているという絞り込み条件1に該当すればその対象問題をレベルAに設定する。問題別影響度評価部B15は、対象問題が、レベルAかつ不正解肢である選択肢が択一式問題に選択肢の個数より1個少ない個数だけ含まれているという絞り込み条件2に該当すればその対象問題をレベルAに設定する。問題別影響度評価部B15は、対象問題が、絞り込み条件2に該当せず、レベルBかつ正解肢である選択肢が択一式問題に含まれているという絞り込み条件3に該当すればその対象問題をレベルBに設定する。問題別影響度評価部B15は、対象問題が、絞り込み条件1にも絞り込み条件3に該当せず、レベルAかつ不正解肢またはレベルBかつ不正解肢である選択肢が択一式問題に選択肢の総個数より1個少ない個数だけ含まれているという絞り込み条件4に該当すればその対象問題をレベルBに設定する。問題別影響度評価部B15は、対象問題が、絞り込み条件2にも絞り込み条件4にも該当せず、レベルCかつ正解肢である選択肢が択一式問題に含まれているという絞り込み条件5に該当すればその対象問題をレベルCに設定する。問題別影響度評価部B15は、対象問題が、絞り込み条件1〜5のいずれにも該当せず、レベルAかつ不正解肢またはレベルBかつ不正解肢である選択肢が択一式問題に選択肢の総個数より2個少ない個数だけ含まれているという絞り込み条件6に該当すればその対象問題をレベルCに設定する。問題別影響度評価部B15は、対象問題が、絞り込み条件1〜6のいずれにも該当しなければその対象問題をレベルDに設定する。択一式問題についてその択一式問題の全体と各選択肢とについて問題別影響度を、合格に向けた勉強への利用に有益な情報として提供することができる。
上記分野別影響度算出処理として、分野別影響度算出部B22は、問題別影響度算出部B21により算出された、試験に含まれる各問題の問題別影響度と、出題傾向予測システムA10により予測された次回の試験の出題傾向と、に基づいて、各分野の分野別影響度を算出する。
上述したように、本実施形態の問題別影響度は、A、B、C、Dという複数のレベルで示されるものとしている。これに対して、本実施形態の分野別影響度は、連続量の数値で示されるものとする。
分野別影響度算出部B22は、問題別影響度の各レベルに所定の数値を対応付けておき、分野に属する各問題の問題別影響度に対応する数値に基づいて、当該分野の分野別影響度の数値を算出する。正誤問題や択一問題など、なんらか限られた数の選択を行う解答形式の問題では、その合格への影響度は連続量よりも離散的な複数のレベルで示す方が明解に表現できる。一方、複数の問題が出題される可能性のある分野については、離散的なレベルよりも連続的あるいは高い解像度で示す方が、妥当性の高い表現が可能である。この点、本実施形態の構成によれば、問題別影響度は複数のレベルに分類し、レベル毎に設定された数値を用いて、連続量の数値として分野別影響度を算出するので、問題別影響度と分野別影響度の両方を好適に表現することが可能となっている。
具体的な例として、分野別影響度算出部B22は式(2)により算出する。
(分野Fの分野別影響度)=(分野Fに分類される問題の出題数)×(分野Fの問題の問題別影響度に対応する数値の平均値)・・・(2)
式(2)において、分野Fの問題の問題別影響度に対応する数値の例は以下のとおりである。レベルAには1を、レベルBには0.8を、レベルCには0.5、レベルDには0をそれぞれ対応づける。
以上説明した本実施形態による学習支援システムT10によれば、出題傾向予測システムA10が、次回の試験における分野毎の出題される問題の個数を示す出題傾向を予測し、影響度算出システムB10が、その出題傾向と過去の試験の問題とに基づいて、分野毎の当該分野の問題を正解することが合格へ影響する度合いを示す分野別影響度を算出し、タイムパフォーマンス算出システムC10が、分野毎の学習に要する時間である分野別学習所要時間と、分野別影響度とに基づいて、分野毎の学習の時間当たりの効果を示す分野別タイムパフォーマンスを算出する。したがって、分野毎の学習の時間当たりの効果を示す分野別タイムパフォーマンスを算出するので、合否のある試験の効率的な学習を支援することができる。
また、本実施形態では、影響度算出システムB10は、過去の試験の問題を個々に解析し、各問題の分野、問題文長、および解答形式を特定し、各問題の分野、問題文長、および解答形式と、出題傾向とに基づいて、分野別影響度を決定する。過去の試験の各問題の分野と問題文長と解答形式とを特定し、それらの情報と各分野の予測出題数とに基づいて各分野の合格への影響度を決定するので、分野、問題文長、および解答形式といった過去の試験の問題の個々の特徴を反映した分野毎の影響度に基づく試験の効率的な学習の支援が可能となる。
また、本実施形態では、過去の試験の各問題についての合格するために当該問題を正解することが求められる度合いを示す問題別影響度は複数のレベルで示され、前記複数のレベルのそれぞれに数値が予め対応付けられ、分野別影響度は、連続量の数値で示され、影響度算出システムB10は、過去の試験の各問題について問題別影響度を決定し、分野に属する問題の個々の問題別影響度に対応する数値に基づいて、当該分野の分野別影響度の数値を算出する。正誤問題や択一問題などの個々の問題は離散的なレベルに分類することで妥当な評価を行うことができる。本構成によれば、個々の問題は複数のレベルに分類し、レベル毎に設定された数値を用いて分野別影響度の数値を算出するので、個々の問題については複数のレベルによる評価を行いつつ分野については数値での評価を行うことができる。
また、本実施形態によれば、出題傾向予測システムA10は、過去の複数回の試験について各回の試験における出題分野毎の問題の個数を示すデータである出題データと、予め定められた複数の候補予測モデル形式のデータとを予め保持している。そして、出題傾向予測システムA10は、過去の複数回の試験のうち少なくとも1回の試験をモデル選択用予測対象とし、そのモデル選択用予測対象について、そのモデル選択用予測対象とした試験よりも前に実施された少なくとも1回の試験の出題データをモデル選択用予測対象に対応するモデル選択用予測入力とし、複数の候補予測モデル形式について、少なくとも一部の出題データを学習して構築された候補予測モデルを用いてモデル選択用予測入力からモデル選択用予測対象の出題分野毎の問題の個数を示す情報である出題傾向を予測する。更に、出題傾向予測システムA10は、予測された出題傾向とモデル選択用予測対象の実際の出題傾向との類似の度合いを示す指標を算出し、候補予測モデル形式毎の指標に基づき、未来の試験の出題傾向の予測に用いる適用予測モデル形式を選択する。そして、出題傾向予測システムA10は、適用予測モデル形式により構築された適用予測モデルを用いて、過去の複数回の試験のうち少なくとも1回の試験の出題データを入力とし、未来の試験の出題傾向を予測する。
資格試験などのように年1回あるいは年数回といったように定期的に実施される試験(以下「定期実施試験」という)では、様々な社会環境の変化による影響等により出題傾向も変化する。問題の分析を行ってきた受験機関などでは経験的に、次回試験の出題傾向を予測するのに最大でも過去10〜15年分程度の出題データを用いることが多い。そのため統計的な解析処理や機械学習を行うのに十分な量の出題データが得られないことがある。
また、定期実施試験の出題傾向やその変化は、例えば宅地建物取引士やマンション管理士などの試験種別により異なる。そのため適切な予測モデルを選択し、その予測モデルを用いて過去の出題データから次回の試験の出題傾向を良好に予測するということが難しい。
これに対して、本実施形態の構成によれば、各種性質を有する予め複数の予測モデル形式を候補として用意しておき、試験種別を限定し、その試験種別について予測精度が得られる予測モデルを適用予測モデルとし、その適用予測モデルを用いて次回の試験の出題傾向を予測する。これにより、客観的でかつ良好な出題傾向の予測を可能としている。
また、本実施形態によれば、出題傾向予測システムA10は、自己回帰と移動平均が組み込まれた第1予測モデル形式と、自己回帰と移動平均とd1階差分(d1は変数)が組み込まれた第2予測モデル形式と、自己回帰と移動平均とd2階差分(d2は自然数)と季節階差が組み込まれた第3予測モデル形式とを含む複数の候補予測モデル形式を予め定め、複数の候補予測モデル形式の中から前記適用予測モデル形式を選択する。定期実施試験では、緩やかではあるが年数の経過に伴って出題傾向が変化することが経験的に知られている。しかし、利用する出題データの時間範囲が大きくないため、利用する出題データの時間範囲内で平均値が変動する場合と殆どしない場合が考えられる。また、定期実施試験では、出題者や試験委員により意識的にあるいは無意識的に出題傾向に周期性が形成される場合がある。ただし、利用する出題データの時間範囲が大きくないため、その時間範囲内で周期的な変動を想定するのが良い場合とよくない場合がある。以上のような定期実施試験の性質を踏まえ、本例では、上述したような候補予測モデル形式を予め用意しておき、その中から過去の出題傾向に合う予測モデル形式を選択するので、過去の試験が様々な傾向を示していても次回試験の出題傾向を良好に予測することが可能となる。
また、本実施形態によれば、出題傾向予測システムA10は、モデル選択用予測入力の全ての回の試験において出題された問題が同一の個数であった出題分野については、モデル選択用予測対象の出題される問題の予測値を同一の個数とし、その出題分野を除いた残りの出題分野の出題される問題の個数を、候補予測モデルを用いた演算で予測した個数とし、入力の全ての回の試験において出題された問題の個数が同一の個数であった出題分野については、未来の試験の出題される問題の予測値を同一の個数とし、その出題分野を除いた残りの出題分野の出題される問題の個数を、適用予測モデルを用いた演算で予測した個数とする。定期実施問題では、ある分野で習得すべき知識の量やその知識を習得していることを確認する必要性あるいは更に他の分野とのバランスから、分野によっては出題数が概ね決まっている場合があることが経験的に知られている。本例では、入力として用いる全ての回の試験において出題数が同一個数の出題分野は、出題数が概ね決まっている出題分野であると推定し、その分野については予測モデルを用いることなく予測値を同一個数としている。これにより本例では経験則に合致する予測結果を得ることが可能となっている。
また、本実施形態によれば、学習指導システムD10が、学習者が学習に充てられる時間である学習持ち時間と、分野別影響度と、に基づいて、学習者に推奨する学習に関する情報である学習指導情報を提供する。したがって、学習者に対して学習持ち時間に応じて効果的に学習を進めるための学習指導を提供することができる。
また、本実施形態によれば、学習指導システムD10は、分野別学習所要時間の合計が学習持ち時間以下の範囲内で分野別影響度の合計が最大となる1つ以上の分野を抽出し、抽出した分野を学習指導情報として提供する。したがって、学習者は学習持ち時間を効果的に使うために学習すべき分野を知ることができる。
また、本実施形態によれば、学習指導システムD10は、抽出した分野を分野別タイムパフォーマンスが高い順に提示する。したがって、学習者は学習すべき分野をタイムパフォーマンスが高い順に優先的に学習することが可能となる。
上述した本発明の実施形態は、本発明の説明のための例示であり、本発明の範囲をそれらの実施形態にのみ限定する趣旨ではない。当業者は、本発明の範囲を逸脱することなしに、他の様々な態様で本発明を実施することができる。