JP2012088494A - Examination question evaluation system and method for controlling the same, program and recording medium - Google Patents
Examination question evaluation system and method for controlling the same, program and recording medium Download PDFInfo
- Publication number
- JP2012088494A JP2012088494A JP2010234597A JP2010234597A JP2012088494A JP 2012088494 A JP2012088494 A JP 2012088494A JP 2010234597 A JP2010234597 A JP 2010234597A JP 2010234597 A JP2010234597 A JP 2010234597A JP 2012088494 A JP2012088494 A JP 2012088494A
- Authority
- JP
- Japan
- Prior art keywords
- test
- question
- evaluation
- index
- ebel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Electrically Operated Instructional Devices (AREA)
Abstract
Description
本発明は、複数の受験者を対象に繰り返し実施される客観試験に用いられる試験問題を評価するための試験問題評価装置及びその制御方法並びにプログラム及び記録媒体に関する。 The present invention relates to a test question evaluation apparatus, a control method thereof, a program, and a recording medium for evaluating a test question used in an objective test repeatedly performed on a plurality of examinees.
医師国家試験、薬剤師国家試験、看護士国家試験、及び運転免許試験のように複数の受験者を対象に繰り返し実施される客観試験(出題時にすでに正解が決定しており、採点者が異なっても同一の採点結果が得られる試験)は、受験者の健全な自己学習を促進させ、問題解決能力を向上させるものが望ましい。また、難問及び奇問を排し、暗記のみでは正解に至らないような、解釈及び問題解決能力の測定に重点を置いた試験である必要がある。さらに、良く学習し理解している受験者とそれ以外の受験者を識別できる必要がある。従って、客観試験においては、各試験問題を評価し、適切にかつ効率的に見直して更新することが重要である(特許文献1及び2参照。)。非特許文献1には、修正イーベル法(非特許文献2参照。)により、又は、最低合格水準(Minimum Pass Level(MPL))に基づいて、客観試験の試験問題を評価することが記載されている。
Objective tests that are repeatedly performed on multiple candidates, such as the doctor's national exam, the pharmacist's national exam, the nurse's national exam, and the driver's license exam. It is desirable that exams that give the same scoring results) promote the sound self-learning of candidates and improve their problem-solving ability. In addition, it is necessary to focus on the measurement of interpretation and problem-solving ability so that difficult questions and odd questions are eliminated and correct answers cannot be obtained by memorization alone. In addition, it is necessary to be able to distinguish between those who have learned and understood well and those who have not. Therefore, in the objective test, it is important to evaluate each test problem and review and update it appropriately and efficiently (see
しかしながら、修正イーベル法又は最低合格水準のみによる試験問題の評価は、客観性及び汎用性に欠けるという面もあり、試験問題の評価方法としては不十分であるという課題があった。 However, the evaluation of the test problem using only the modified ebel method or the minimum acceptable level has a problem that it is insufficient as an evaluation method for the test problem because it lacks objectivity and versatility.
本発明の目的は以上の問題点を解決し、試験問題を従来技術に比較して効率的かつ客観的に評価できる試験問題評価装置及びその制御方法並びにプログラム及び記録媒体を提供することにある。 An object of the present invention is to solve the above-described problems and to provide a test problem evaluation apparatus, a control method thereof, a program, and a recording medium that can efficiently and objectively evaluate a test problem as compared with the prior art.
第1の発明に係る試験問題評価装置は、
試験問題の作問者により入力される所定のデータを入力するための入力手段と、
試験問題の作成をサポートする作問サポート処理及び上記試験問題を評価する試験問題評価処理を実行する制御手段と、
試験問題の難易度及び必要度と、上記試験問題の必要度及び難易度を表す修正イーベル指数との対応関係を示す修正イーベル指数算出テーブルを予め格納する記憶手段とを備えた試験問題評価装置であって、
上記制御手段は、
上記作問サポート処理において、上記入力手段から入力される上記試験問題の難易度及び必要度に基づいて、上記修正イーベル指数算出テーブルを参照して、上記試験問題の難易度及び必要度を表す修正イーベル指数を算出し、
上記試験問題評価処理において、複数の受験者の上記試験問題に対する解答内容を含むデータに基づいて、上記試験問題の正答率と、上記複数の受験者のうちの成績上位層の受験者と上記成績上位層の受験者よりも下位の成績の成績下位層の受験者とを区別する能力を表す識別指数とを算出し、上記算出された修正イーベル指数と、正答率と、識別指数とに基づいて、修正イーベル指数と、正答率と、識別指数とをパラメータとする所定の関数を用いて上記試験問題の品質を表す問題評価指数を算出して出力することを特徴とする。
The test problem evaluation apparatus according to the first invention is:
Input means for inputting predetermined data input by the examiner of the test question;
Control means for executing question support processing for supporting creation of test questions and test question evaluation processing for evaluating the test questions;
A test problem evaluation apparatus comprising a storage means for storing in advance a modified ebel index calculation table showing a correspondence relationship between the difficulty level and necessity level of the test problem and the corrected ebel index indicating the necessity level and difficulty level of the test problem. There,
The control means includes
In the question support process, based on the difficulty level and necessity level of the test question input from the input means, the correction indicating the difficulty level and the necessity level of the test question with reference to the corrected ebel index calculation table Calculate the ebel index,
In the examination question evaluation process, the correct answer rate of the examination question and the higher grade examinees and the grades of the plurality of examinees are based on data including the contents of answers to the examination questions of a plurality of examinees. Calculate an identification index that represents the ability to distinguish lower grades from lower grades than upper grades, and based on the calculated corrected ebel index, correct answer rate, and identification index A problem evaluation index representing the quality of the test question is calculated and output using a predetermined function having the corrected ebel index, the correct answer rate, and the identification index as parameters.
上記試験問題評価装置において、上記制御手段はさらに、上記試験問題評価処理において、上記算出された問題評価指数に基づいて、上記試験問題を複数の問題評価区分に分類し、上記分類された問題評価区分を出力することを特徴とする。 In the test question evaluation apparatus, the control means further classifies the test questions into a plurality of problem evaluation categories based on the calculated problem evaluation index in the test question evaluation process, and classifies the problem evaluations. The category is output.
また、上記試験問題評価装置において、上記制御手段はさらに、上記試験問題評価処理において、上記複数の問題評価区分のうち所定のしきい値区分より品質の良い問題評価指数を有する問題評価区分に分類された試験問題の内容を含む試験問題データを、上記記憶手段に格納することを特徴とする。 Further, in the test question evaluation apparatus, the control means is further classified into a problem evaluation category having a better problem evaluation index than a predetermined threshold value category among the plurality of question evaluation categories in the test question evaluation process. Test question data including the contents of the given test questions is stored in the storage means.
さらに、上記試験問題評価装置において、上記試験問題は多肢選択問題であって、
上記制御手段はさらに、上記試験問題評価処理において、上記解答内容を含むデータに基づいて、上記多肢選択問題の選択肢毎の選択率を算出し、上記試験問題を上記複数の問題評価区分に分類した後に、所定の選択率以下の選択肢があるときに上記分類された問題評価区分を1段階だけ下げるように変更することを特徴とする。
Furthermore, in the test problem evaluation apparatus, the test problem is a multiple-choice problem,
The control means further calculates a selection rate for each option of the multiple-choice question based on the data including the answer contents in the test question evaluation process, and classifies the test question into the plurality of question evaluation categories. After that, when there is an option with a predetermined selection rate or less, the classified problem evaluation category is changed so as to be lowered by one level.
またさらに、上記試験問題評価装置において、上記試験問題は多肢選択問題であって、
上記制御手段はさらに、
上記作問サポート処理において、上記入力手段から、上記多肢選択問題の各選択肢毎の難易度を表す難易度コードを入力し、
上記試験問題評価処理において、上記入力された難易度コードを、上記問題評価指数とともに出力することを特徴とする。
Still further, in the test problem evaluation apparatus, the test problem is a multiple choice problem,
The control means further includes
In the questioning support process, the difficulty code representing the difficulty for each option of the multiple-choice question is input from the input means.
In the test question evaluation process, the input difficulty code is output together with the question evaluation index.
また、上記試験問題評価装置において、上記修正イーベル指数は修正イーベル法において用いられる期待正答率であり、
上記修正イーベル指数算出テーブルは、修正イーベル法において用いられ、試験問題の難易度及び必要度と期待正答率との対応関係を示すテーブルであることを特徴とする。
In the test question evaluation apparatus, the corrected ebel index is an expected correct answer rate used in the corrected ebel method,
The modified ebel index calculation table is used in the modified ebel method, and is a table showing the correspondence between the difficulty level and necessity level of the test questions and the expected correct answer rate.
第2の発明に係る試験問題評価装置の制御方法は、
試験問題の作問者により入力される所定のデータを入力するための入力手段と、
試験問題の作成をサポートする作問サポート処理及び上記試験問題を評価する試験問題評価処理を実行する制御手段と、
試験問題の難易度及び必要度と、上記試験問題の必要度及び難易度を表す修正イーベル指数との対応関係を示す修正イーベル指数算出テーブルを予め格納する記憶手段とを備えた試験問題評価装置の制御方法であって、
上記制御手段が、上記作問サポート処理において、上記入力手段から入力される上記試験問題の難易度及び必要度に基づいて、上記修正イーベル指数算出テーブルを参照して、上記試験問題の難易度及び必要度を表す修正イーベル指数を算出するステップと、
上記制御手段が、上記試験問題評価処理において、複数の受験者の上記試験問題に対する解答内容を含むデータに基づいて、上記試験問題の正答率と、上記複数の受験者のうちの成績上位層の受験者と上記成績上位層の受験者よりも下位の成績の成績下位層の受験者とを区別する能力を表す識別指数とを算出し、上記算出された修正イーベル指数と、正答率と、識別指数とに基づいて、修正イーベル指数と、正答率と、識別指数とをパラメータとする所定の関数を用いて上記試験問題の品質を表す問題評価指数を算出して出力するステップとを含むことを特徴とする。
The control method of the test question evaluation apparatus according to the second invention is:
Input means for inputting predetermined data input by the examiner of the test question;
Control means for executing question support processing for supporting creation of test questions and test question evaluation processing for evaluating the test questions;
A test problem evaluation apparatus comprising storage means for storing in advance a corrected ebel index calculation table indicating a correspondence relationship between the difficulty level and necessity level of a test problem and the corrected ebel index indicating the necessity level and difficulty level of the test problem. A control method,
In the questioning support process, the control means refers to the modified ebel index calculation table based on the difficulty level and necessity level of the test problem input from the input means, and determines the difficulty level of the test problem and Calculating a modified ebel index representing the degree of necessity;
The control means, in the test question evaluation process, based on the data including the answer contents for the test questions of a plurality of examinees, the correct answer rate of the test questions and Calculates an identification index that represents the ability to distinguish test takers from lower grades of lower grades than those of the higher grades, and calculates the corrected ebel index, correct answer rate, and discrimination And calculating and outputting a problem evaluation index representing the quality of the test question using a predetermined function having the corrected ebel index, correct answer rate, and identification index as parameters based on the index. Features.
上記試験問題評価装置の制御方法において、上記制御手段が、上記試験問題評価処理において、上記算出された問題評価指数に基づいて、上記試験問題を複数の問題評価区分に分類し、上記分類された問題評価区分を出力するステップをさらに含むことを特徴とする。 In the control method of the test question evaluation apparatus, the control means classifies the test questions into a plurality of question evaluation categories based on the calculated problem evaluation index in the test question evaluation process, and the classified The method further includes the step of outputting a problem evaluation category.
また、上記試験問題評価装置の制御方法において、上記制御手段が、上記試験問題評価処理において、上記複数の問題評価区分のうち所定のしきい値区分より品質の良い問題評価指数を有する問題評価区分に分類された試験問題の内容を含む試験問題データを、上記記憶手段に格納するステップをさらに含むことを特徴とする。 Further, in the control method of the test problem evaluation apparatus, the control means has a problem evaluation category having a better problem evaluation index than a predetermined threshold value category among the plurality of problem evaluation categories in the test question evaluation process. The method further includes the step of storing the test question data including the contents of the test questions classified into the above-mentioned storage means.
さらに、上記試験問題評価装置の制御方法において、上記試験問題は多肢選択問題であって、
上記制御手段が、上記試験問題評価処理において、上記解答内容を含むデータに基づいて、上記多肢選択問題の選択肢毎の選択率を算出し、上記試験問題を上記複数の問題評価区分に分類した後に、所定の選択率以下の選択肢があるときに上記分類された問題評価区分を1段階だけ下げるように変更するステップをさらに含むことを特徴とする。
Further, in the control method of the test problem evaluation apparatus, the test problem is a multiple choice problem,
In the test question evaluation process, the control means calculates a selection rate for each option of the multiple-choice question based on data including the answer contents, and classifies the test questions into the plurality of question evaluation categories. The method further includes a step of changing the classified problem evaluation category so as to be lowered by one step when there is an option having a predetermined selection rate or less.
またさらに、上記試験問題評価装置の制御方法において、上記試験問題は多肢選択問題であって、
上記制御手段が、上記作問サポート処理において、上記入力手段から、上記多肢選択問題の各選択肢毎の難易度を表す難易度コードを入力するステップと、
上記制御手段が、上記試験問題評価処理において、上記入力された難易度コードを、上記問題評価指数とともに出力するステップとをさらに含むことを特徴とする。
Still further, in the control method of the test problem evaluation apparatus, the test problem is a multiple choice problem,
The control means, in the question support process, a step of inputting a difficulty level code representing a difficulty level for each option of the multiple-choice question from the input means;
The control means further includes a step of outputting the input difficulty code together with the problem evaluation index in the test question evaluation process.
また、上記試験問題評価装置の制御方法において、上記修正イーベル指数は修正イーベル法において用いられる期待正答率であり、
上記修正イーベル指数算出テーブルは、修正イーベル法において用いられ、試験問題の難易度及び必要度と期待正答率との対応関係を示すテーブルであることを特徴とする。
Further, in the control method of the test question evaluation apparatus, the corrected ebel index is an expected correct answer rate used in the corrected ebel method,
The modified ebel index calculation table is used in the modified ebel method, and is a table showing the correspondence between the difficulty level and necessity level of the test questions and the expected correct answer rate.
第3の発明に係るプログラムは、上記試験問題評価装置の制御方法における各ステップを含むことを特徴とする。 A program according to a third invention includes the steps of the control method for the test question evaluation apparatus.
第4の発明に係るコンピュータで読み取り可能な記録媒体は、上記プログラムを格納したことを特徴とする。 A computer-readable recording medium according to a fourth aspect of the present invention stores the above program.
本発明に係る試験問題評価装置及びその制御方法並びにプログラム及び記録媒体によれば、作問時に入力される試験問題の難易度及び必要度に基づいて算出される修正イーベル指数と、試験問題に対する解答内容を含むデータに基づいて算出される試験問題の正答率及び識別指数とに基づいて、修正イーベル指数と、正答率と、識別指数とをパラメータとする所定の関数を用いて上記試験問題の品質を表す問題評価指数を算出して出力するので、作問者による試験問題の評価内容と、試験実施後に得られる客観的な数値との両方を反映した問題評価指数を自動的に得ることができる。このため、試験問題の評価を自動的に行い、試験問題の良否を従来技術に比較して客観的に判定できる。 According to the test problem evaluation apparatus, the control method thereof, the program, and the recording medium according to the present invention, the corrected ebel index calculated based on the difficulty and necessity of the test problem input at the time of questioning, and the answer to the test problem Based on the correct answer rate and the identification index of the test questions calculated based on the data including the contents, the quality of the above test problem using a predetermined function with the corrected ebel index, the correct answer rate, and the identification index as parameters. A problem evaluation index that reflects both the evaluation contents of the test questions by the author and the objective numerical values obtained after the test can be automatically obtained. . For this reason, the test questions are automatically evaluated, and the quality of the test questions can be objectively determined as compared with the prior art.
以下、本発明に係る実施形態について図面を参照して説明する。なお、以下の実施形態において、同様の構成要素については同一の符号を付している。 Hereinafter, embodiments according to the present invention will be described with reference to the drawings. In the following embodiments, the same reference numerals are assigned to the same components.
図1は、本発明の実施形態に係る試験問題評価装置1の構成を示すブロック図であり、図2は、図1の試験問題分類テーブル12の一例を示すテーブルであり、図3は、図1のコメントテーブル13の一例を示すテーブルである。図1において、試験問題評価装置1は、例えばパーソナルコンピュータなどのディジタル計算機であって、作問者が、医師国家試験に準拠した模擬試験のための試験問題を作成し、評価するための端末装置として用いられる。本実施形態において、各試験問題は、5個の選択肢の中から1個の選択肢を選択する多肢選択問題(以下、MCQ(Multiple Choice Question)という。)である。試験問題評価装置1は、CPU(Central Processing Unit)2と、ROM(Read Only Memory)3と、RAM(Random Access Memory)4と、ハードディスクドライブ5と、ディスプレイ6と、操作入力部7と、LAN(Local Area Network)インターフェース8と、光ディスクドライブ20とを備えて構成される。CPU2は、バスを介してROM3、RAM4、ハードディスクドライブ5、ディスプレイ6、操作入力部7、LANインターフェース8、及び光ディスクドライブ20と接続されていてそれらの各動作及び試験問題評価装置1の全体の動作を制御するほか、後述する種々のソフトウェアプログラムの処理(図4及び図5)を実行する。
FIG. 1 is a block diagram showing a configuration of a test
また、図1において、ディスプレイ6は、液晶表示装置(LCD(Liquid Crystal Display))又はCRT(Cathode Ray Tube)ディスプレイなどの表示装置であり、試験問題評価装置1の動作状態の表示及び種々のGUI(Graphic User Interface)プログラムのための表示装置として機能する。さらに、操作入力部7は、例えば、マウスなどのポインティングデバイス及びキーボードなどの文字入力手段を含む。作問者及び受験者などの試験問題評価装置1のユーザは、データ及び指示コマンドなどを入力するために操作入力部7を用いる。さらに、LANインターフェース8は、LAN80に接続され、LAN80に接続された複数M台の受験者用端末装置30−1〜30−Mなどの機器からの信号及びデータを受信する一方、LAN80に接続された複数M台の受験者用端末装置30−1〜30−Mなどの機器に対してCPU2からの信号及びデータを送信して、信号変換及びプロトコル変換などのLAN通信に係る双方向のインターフェース処理を実行する。光ディスクドライブ20は、CD−ROM又はDVDなどの、コンピュータで読み取り可能な記録媒体21に記録されたデータ及びプログラムを読み出して出力する。
In FIG. 1, a
図1において、ROM3は、試験問題評価装置1の動作に必要であってCPU2によって実行される種々のソフトウェアのプログラムを予め格納する。また、ハードディスクドライブ5は、記録媒体を内蔵する記憶装置であり、CPU2が実行する試験問題評価プログラム10と、修正イーベル指数算出テーブル11と、試験問題分類テーブル12と、コメントテーブル13とを予め格納する。ここで、試験問題評価プログラム10は、図4を参照して詳細後述する作問サポート処理のプログラムと、図5を参照して詳細後述する試験問題評価処理のプログラムとを含む。また、ハードディスクドライブ5は、作問サポート処理によってそれぞれ生成されたN個(Nは正の整数である。)の試験問題データ14−1〜14−N(以下、試験問題データ14−1〜14−Nを区別しない場合には、試験問題データ14という。)を格納する。さらに、ハードディスクドライブ5は、プール(蓄積)対象の試験問題データ14を格納するためのプール対象試験問題データ格納領域15と、一部修正(ブラッシュアップ)してプール対象の問題となり得る試験問題データ14を格納するためのブラッシュアップ対象試験問題格納領域16と、重要な修正を含みかつブラッシュアップで十分に吟味の上、修正することにより再実施対象問題の候補になり得る試験問題データ14を格納するための、重要な修正を含むブラッシュアップ対象試験問題格納領域17とを有する。
In FIG. 1, the
ここで、修正イーベル指数算出テーブル11は、作問者によって試験問題データ14の生成時に設定される試験問題の難易度(平易、中等、又は困難)及び必要度(疑問、重要、又は必須)と、修正イーベル指数との対応関係を示す。ここで、修正イーベル指数は、試験問題の難易度及び必要度を表す指数であって、難易度の低下、及び必要度の上昇に伴って大きくなるように設定される。例えば、修正イーベル指数として、修正イーベル法(非特許文献2参照。)で用いられる期待正答率を用いてもよい。この場合は、修正イーベル指数算出テーブル11は、以下のように設定される。
Here, the modified ebel index calculation table 11 includes the difficulty (plain, medium, or difficult) and necessity (question, important, or essential) of the test questions set when the
また、図2に示すように、試験問題分類テーブル12は、詳細後述する試験問題評価処理によって算出される試験問題データ14の品質を表す問題評価指数と、試験問題の問題評価区分との対応関係を示す。さらに、図3に示すように、コメントテーブル13は、試験問題データ14の問題評価区分と、ディスプレイ6に表示されるコメントとの対応関係を示す。
As shown in FIG. 2, the test question classification table 12 includes a correspondence relationship between a problem evaluation index representing the quality of the
さらに、図1において、RAM4は、SRAM(Static RAM)、DRAM(Dynamic RAM)、SDRAM(Synchronous DRAM)などで構成され、CPU2のワーキングエリアとして使用されて、試験問題評価プログラム10などのプログラムを実行したときに、当該実行するプログラムに対応する機能を実行するために必要な実行プログラムとそれを実行するために必要なデータ及び実行時に発生する一時的なデータを格納する。
Further, in FIG. 1, a
次に、図4を参照して、図1のCPU2によって実行される作問サポート処理を説明する。図4は、図1のCPU2によって実行される、作問者の試験問題の作成をサポートするための作問サポート処理のフローチャートである。作問者が、試験問題評価装置1の操作入力部7を用いて、試験問題データ14−n(n=1,2,…,N)を生成するための所定の操作(例えば、ディスプレイ6に表示されている所定のアイコンをクリックする、又は、ディスプレイ6に表示されているコンソールウィンドウにおいて所定のコマンドを入力するなど。)を行うと、これに応答して、CPU2は、試験問題評価プログラム10に含まれる作問サポート処理のためのプログラムを実行する。
Next, the question support process executed by the
まず始めに、図4のステップS1において、ディスプレイ6に問題一覧ウィンドウ100が表示される。図6は、図4のステップS1においてディスプレイ6に表示される問題一覧ウィンドウ100の表示例である。図6に示すように、問題一覧ウィンドウ100は、試験問題データ14−nを新規に生成することを指示するための「新規作成」ボタン101と、既に生成されてハードディスクドライブ5に格納されている試験問題データ14−nを修正することを指示するための「問題の修正」ボタン102と、ハードディスクドライブ5に格納されている試験問題データ14−nの一覧表103とを含む。図4のステップS2において、作問者が、「新規作成」ボタン101をクリックしたか否かが判断され、YESのときはステップS5に進む一方、NOのときはステップS3に進む。そして、ステップS3において、作問者が、「問題の修正」ボタン102をクリックしたか否かが判断され、YESのときはステップS4に進む一方、NOのときはステップS2に戻る。ステップS4では、問題一覧ウィンドウ100の一覧表103において選択された問題データ14−nがハードディスクドライブ5から読み出される。そして、ステップS4又はステップS2に続いて、ステップS5において、ディスプレイ6に問題入力ウィンドウ200が表示される。
First, a
図7は、図4のステップS5においてディスプレイ6に表示される問題入力ウィンドウ200の表示例である。作問者は、ステップS5において、ディスプレイ6に表示された問題入力ウィンドウ200と操作入力部7とを用いて、対話形式で作問を行う。図7に示すように、問題入力ウィンドウ200は、問題文を入力するためのテキストボックス201と、選択肢毎に解答肢を入力するためのテキストボックス202−1〜202−5と、選択肢毎に難易度コードを選択して入力するためのドロップダウンリスト23−1〜23−5と、試験問題の必要度を選択して入力するためのドロップダウンリスト204と、試験問題の難易度を選択して入力するためのドロップダウンリスト205と、「保存」ボタン206とを含む。ここで、難易度コード(非特許文献1参照。)は、最低合格指数(非特許文献1参照。)に用いられるコードであって、選択肢が正解であるか否か及び難易度を表す。難易度コードは、正解を表す難易度コード(丸で囲まれた2(図7参照。))と、合格認定を許容できる最低能力の受験生が正解との区別できなくてもやむを得ない不正解の選択肢を表す難易度コード(2)と、合格認定を許容できる最低能力の受験生が正解とすることもあるであろうし、しないこともあるであろう不正解の選択肢を表す難易度コード(1)と、本試験問題に関係する領域の学習を行ったと思えない受験生が選択する選択肢を表す難易度コード(0)とから選択される。また、試験問題の必要度は、疑問、重要、及び必須の中から選択される。さらに、試験問題の難易度は、平易、中等、及び困難の中から選択される。図7の例では、テキストボックス201に、問題文「インフォームドコンセントとして適切でないのはどれか。」が入力されている。また、選択肢毎に、以下の解答肢と難易度コードが入力されている。
FIG. 7 is a display example of the
[表1]
____________________________________
選択肢 解答肢 難易度コード
____________________________________
a 治療処置の目的を説明する。 0
b 治療処置の選択肢を説明する。 0
c 治療処置のリスクを説明する。 0
d 病院の免責文書に署名をもらう。 正解を表す2(丸で囲まれた2)
e 納得の上同意文書に署名をもらう。 0
____________________________________
[Table 1]
______________________________________________
Options Answering limbs difficulty code __________________________
a Explain the purpose of the therapeutic procedure. 0
b Explain therapeutic treatment options. 0
c Explain the risk of therapeutic treatment. 0
d Get a hospital waiver document signed. 2 representing the correct answer (circled 2)
e Get the consent document signed with consent. 0
______________________________________________
さらに、図7において、ドロップダウンリスト204を用いて、必要度として「必須」が選択され、ドロップダウンリスト205を用いて、難易度として「平易」が選択されている。なお、図4のステップS3において作問者が「問題の修正」ボタンをクリックし、ステップS4において、選択された試験問題データ14−nがハードディスクドライブ5から読み出された場合には、読み出された試験問題データ14−nに含まれる問題文と、選択肢毎の解答肢及び難易度コードと、必要度及び難易度とを、ステップS5において問題入力ウィンドウ200に表示する。
Further, in FIG. 7, “required” is selected as the necessary degree using the drop-down
図4のステップS5に続いて、ステップS6において、作問者が、問題入力ウィンドウ200の「保存」ボタン206をクリックしたか否かが判断され、YESのときはステップS7に進む一方、NOのときはステップS6の処理を繰り返す。次に、ステップS7において、CPU2は、入力された必要度及び難易度に基づいて修正イーベル指数算出テーブル11を参照して、修正イーベル指数を算出する。そして、ステップS8において、CPU2は、入力された問題文と、入力された選択肢毎の解答肢及び難易度コードと、入力された必要度及び難易度と、算出された修正イーベル指数とを含む試験問題データ14−nを生成して、ハードディスクドライブ5に格納し、作問サポート処理を終了する。
Subsequent to step S5 of FIG. 4, in step S6, it is determined whether or not the questioner has clicked the “save”
以上説明したように、図4の作問サポート処理によって、問題文と、選択肢毎の解答肢及び難易度コードと、必要度及び難易度と、修正イーベル指数とを含む試験問題データ14−nを生成してハードディスクドライブ5に格納することができる。図1において、各受験者用端末装置30−1〜30−Mは、生成された試験問題データ14−nを、ハードディスクドライブ5からLANインターフェース8及びLAN80を介して他の受験者用端末装置30−1〜30−Mを用いて受信して受験者用端末装置30−1〜30−Mの各表示装置に表示する。各受験者は、受験者用端末装置30−1〜30−Mにおいて試験問題に解答し、受験者用端末装置30−1〜30−Mは、解答内容を含むデータを、LAN80を介して試験問題評価装置1に送信する。
As described above, the question support data 14-n including the question sentence, the answer limb and difficulty code for each option, the necessity and difficulty, and the modified ebel index is obtained by the question support process of FIG. It can be generated and stored in the
次に、図5を参照して、図1のCPU2によって実行される試験問題評価処理を説明する。図5は、図1のCPU2によって実行される試験問題評価処理のフローチャートである。作問者が、試験問題評価装置1の操作入力部7を用いて、試験問題データ14−nを評価するための所定の操作(例えば、ディスプレイ6に表示されている所定のアイコンをクリックする、又は、ディスプレイ6に表示されているコンソールウィンドウにおいて所定のコマンドを入力するなど。)を行うと、これに応答して、CPU2は、試験問題評価プログラム10に含まれる試験問題評価処理のためのプログラムを実行する。
Next, a test question evaluation process executed by the
まず始めに、ステップS10において、CPU2は、受験者用端末装置30−1〜30−Mから、試験問題データ14−nに対する解答内容を含むデータを受信し、当該受信されたデータに基づいて、各解答を採点し、正答率と、選択肢毎の選択者数と、選択肢毎の選択率と、識別指数とを算出する。
First, in step S10, the
ここで、試験問題データ14−nの正答率は、全ての受験者のうち試験問題データ14−nに正解した受験者の割合(0以上1以下の値)である。また、試験問題データ14−nの識別指数は、全ての受験者のうちの成績上位層の受験者と上記成績上位層の受験者よりも下位の成績の成績下位層の受験者とを区別する能力を表す。本実施形態において、試験問題データ14−nの識別指数は、全ての受験者のうちの成績最上位X%の受験者の試験問題データ14−nの正答率から、全ての受験者のうちの成績最下位Y%の受験者の試験問題データ14−nの正答率を減算した値であり、−1以上1以下の数値である。識別指数が負の値の試験問題は、適切な問題ではない可能性、あるいは、実施した試験で測定する能力と異なる能力を測定している可能性がある。一般に、識別指数は0.2を超えることが好ましい。また、成績最上位者の割合X%及び成績最下位者の割合Y%は、試験問題データ14−nを含む試験全体の得点順位に基づいて、例えば、それぞれ25%、15%、50%などの所定の値に設定される。ここで、例えばX=Y=50%であるとき、試験問題データ14−nの識別指数は、全ての受験者のうちの成績上位層の受験者と上記成績上位層の受験者よりも直下の下位の成績の成績下位層の受験者とを区別する能力を表す。また、例えばX<50%かつY<50%であるとき、試験問題データ14−nの識別指数は、全ての受験者のうちの成績上位層の受験者と上記成績上位層の受験者よりも、所定数の受験者を介して、下位の成績の成績下位層の受験者とを区別する能力を表し、当該成績上位層の受験者は第1のしきい値順位以上の受験者であり、当該下位の成績の成績下位層の受験者は、上記第1のしきい値順位よりも下位の第2のしきい値順位以下の受験者であり、それ故、試験問題データ14−nの識別指数は、全ての受験者のうちの、第1のしきい値順位以上の成績上位層の受験者と、第2のしきい値順位以下の下位の成績の成績下位層の受験者とを区別する能力を表す Here, the correct answer rate of the test question data 14-n is a ratio (value of 0 or more and 1 or less) of test takers who correctly answered the test question data 14-n among all test takers. In addition, the identification index of the exam question data 14-n distinguishes among the examinees of the higher grades among all the examinees and the examinees of the lower grades of the grades lower than the above graded candidates. Represents ability. In the present embodiment, the identification index of the test question data 14-n is determined based on the correct answer rate of the test question data 14-n of the examinee with the highest grade of X% among all the test candidates. This is a value obtained by subtracting the correct answer rate of the test question data 14-n of the examinee of the lowest grade Y%, and is a numerical value of −1 or more and 1 or less. A test problem with a negative identification index may not be an appropriate problem, or may be measuring an ability that is different from the ability to measure in the test performed. Generally, it is preferable that the identification index exceeds 0.2. Further, the ratio X% of the highest grader and the percentage Y% of the lowest grader are, for example, 25%, 15%, 50%, etc., respectively, based on the overall score ranking including the exam question data 14-n. Is set to a predetermined value. Here, for example, when X = Y = 50%, the identification index of the test question data 14-n is lower than those of the higher grades of all the examinees and those of the higher grades. Describes the ability to distinguish lower grades from lower grades. For example, when X <50% and Y <50%, the identification index of the test question data 14-n is higher than those of the higher grades of all the examinees and those of the above higher grades. , Representing the ability to distinguish lower grades of lower grades through a predetermined number of examinees, where the higher grades are those who are above the first threshold rank, The candidate of the lower grade of the lower grade is a candidate who is lower than the second threshold rank lower than the first threshold rank, and therefore, identification of the test question data 14-n The index distinguishes among candidates who are higher grades above the first threshold rank and those who are lower grades below the second threshold rank. Represents the ability to
次に、ステップS10に続いてステップS11において、CPU2は、試験問題データ14−nに含まれる修正イーベル指数と、算出した正答率及び識別指数とに基づいて、所定の関数を用いて問題評価指数を算出する。ここで、問題評価指数Eは、以下の式で表される。
Next, in step S11 following step S10, the
[数1]
E=f(x,y,z)
[Equation 1]
E = f (x, y, z)
ここで、xは修正イーベル指数であり、yは正答率であり、zは識別指数であり、fは例えば、それぞれ所定の係数を有してパラメータx、y、zを線形結合し、又は2次以上の高次方程式で結合する所定の関数である。このように算出された問題評価指数Eは試験問題の品質(良否)を表し、本実施形態では、関数fは、品質の上昇と共に試験問題の問題評価指数Eが高い値を有するように設定される。 Here, x is a modified ebel index, y is a correct answer rate, z is an identification index, and f is, for example, a linear combination of parameters x, y, and z each having a predetermined coefficient, or 2 It is a predetermined function that is combined by a higher-order equation of the order or higher. The problem evaluation index E calculated in this way represents the quality (good / bad) of the test problem. In this embodiment, the function f is set so that the problem evaluation index E of the test problem has a high value as the quality increases. The
図5において、ステップS11に続いてステップS12において、CPU2は、算出された問題評価指数に基づいて問題分類テーブル12を参照して、試験問題データ14−nを問題評価区分A,B又はCに分類する。ここで、問題評価区分A,B,Cは、試験問題の品質を表し、問題評価区分A,B,Cの順序で品質が悪くなる。具体的には、問題評価区分Aに分類された試験問題データ14−nはプール対象問題に適しており、問題評価区分Bに分類された試験問題データ14−nは一部修正(ブラッシュアップ)してプール対象問題となり得る。また、問題評価区分Cに分類された試験問題データ14−nは、問題評価区分Bに分類された試験問題データ14−nに比較して重要な修正を行う必要があるが、ブラッシュアップで十分に吟味の上、修正することにより再実施対象問題の候補になり得る。
In FIG. 5, in step S12 following step S11, the
次に、ステップS13において、試験問題データ14−nが問題評価区分Cに分類されたか否かが判断され、YESのときはステップS16に進む一方、NOのときはステップS14に進む。さらに、ステップS14において、選択者数がゼロの選択肢があるか、又は、選択率が2%未満の選択肢があるか否かが判断され、YESのときはステップS15に進む一方、NOのときはステップS16に進む。ステップS15では、問題評価区分は1段階だけ下げられ(問題評価区分Aから問題評価区分Bへ、又は、問題評価区分Bから問題評価区分Cへ下げられる。)、ステップS16に進む。ステップS16では、試験問題データ14−nが問題評価区分Aに分類された場合はプール対象試験問題データ格納領域15に格納し、問題評価区分Bに分類された場合はブラッシュアップ対象試験問題データ格納領域16に格納し、問題評価区分Cに分類された場合は重要な修正を含むブラッシュアップ対象試験問題データ格納領域17に格納する。ステップS16の処理により、問題評価区分Aに分類されたプール対象問題である試験問題データ14−nと、問題評価区分Bに分類された一部修正が必要な試験問題データ14−nと、問題評価区分Cに分類されたより重要な修正が必要な試験問題データ14−nとを、それぞれ異なる格納領域15,16及び17に格納できる。次に、ステップS17では、ディスプレイ6に、試験問題データ14−nの選択肢番号と、難易度コードと、修正イーベル指数と、正答率と、選択者数と、選択率と、識別指数と、問題評価指数と、問題評価区分とを表示するとともに、問題評価区分に基づいてコメントテーブル13を参照してコメントを表示し、試験問題評価処理を終了する。図8は、図5のステップS18におけるディスプレイ6への表示例である。なお、図8では、算出された正答率を100倍した値(単位は、%である。)を「正答率」として表示している。
Next, in step S13, it is determined whether or not the test question data 14-n is classified into the problem evaluation category C. If YES, the process proceeds to step S16, and if NO, the process proceeds to step S14. Further, in step S14, it is determined whether or not there is an option with the number of selections of zero or an option with a selection rate of less than 2%. If YES, the process proceeds to step S15, whereas if NO, Proceed to step S16. In step S15, the problem evaluation category is lowered by one level (from problem evaluation category A to problem evaluation category B, or from problem evaluation category B to problem evaluation category C), and the process proceeds to step S16. In step S16, when the test question data 14-n is classified into the problem evaluation category A, it is stored in the pool target test question
従来は、修正イーベル法による試験問題の主観的な評価と、試験実施後に得られる正答率などの客観的な数値に基づく試験問題の評価とは、独立に行われており、2つの評価結果に基づいて作問者自身が総合的に試験問題を評価する必要があった。しかしながら、本実施形態によれば、作問時に作問者によって設定される試験問題の難易度及び必要度を表す修正イーベル指数と、試験実施後に得られる試験問題の正答率及び識別指数とに基づいて問題評価指数を算出し、当該問題評価指数に基づいて試験問題を自動的に評価する。このため、作問者による試験問題の評価内容と、試験実施後に得られる客観的な数値との両方を反映した問題評価指数を自動的に得ることができる。このため、試験問題の評価を自動的に行い、試験問題の良否を従来技術に比較して客観的に判定できる。 Conventionally, the subjective evaluation of test questions using the modified ebel method and the evaluation of test questions based on objective values such as the correct answer rate obtained after the test are conducted independently. Based on this, the examiner himself had to evaluate the examination questions comprehensively. However, according to the present embodiment, based on the modified ebel index indicating the difficulty and necessity of the test questions set by the questioner at the time of writing, and the correct answer rate and identification index of the test questions obtained after the test is performed. The problem evaluation index is calculated, and the test questions are automatically evaluated based on the problem evaluation index. Therefore, it is possible to automatically obtain a problem evaluation index that reflects both the evaluation contents of the test questions by the questioner and the objective numerical values obtained after the test. For this reason, the test questions are automatically evaluated, and the quality of the test questions can be objectively determined as compared with the prior art.
さらに、図8に示すように、試験問題の問題評価区分を表示するので、作問者は、当該表示に基づいて、例えば、問題評価区分Bに分類されてブラッシュアップ対象試験問題格納領域16に格納された試験問題データ14と、問題評価区分Cに分類されて重要な修正を含むブラッシュアップ対象試験問題格納領域17に格納された試験問題データ14を吟味し推敲できる。また、問題評価区分Aに分類された(すなわち、しきい値区分Bより品質の良い問題評価指数を有し、良問と判定された)試験問題データ14−nを自動的にプール対象試験問題データ格納領域15に格納するので、従来技術に比較して、容易に客観試験を作成できる。従って、本実施形態によれば、試験作成を補助することができる。さらに、受験者用端末装置30−1〜30−Mから、問題評価区分Aに分類されてプール対象試験問題データ格納領域15に格納された試験問題データ14−nを読み出すことができるように設定すれば、受験者の自己学習を促進できる。
Further, as shown in FIG. 8, since the question evaluation classification of the test questions is displayed, the questioner is classified into the problem evaluation classification B based on the display, for example, in the examination
また、図5の試験問題評価処理において、選択者数がゼロの選択肢がある、又は、選択率が2%未満の選択肢があるときに、問題評価区分を1段階だけ下げる(ステップS14及びステップS15)ので、選択肢毎の選択率を考慮した試験問題評価を行うことができる。 Further, in the test question evaluation process of FIG. 5, when there is an option with the number of selections of zero or an option with a selection rate of less than 2%, the question evaluation category is lowered by one level (steps S14 and S15). Therefore, it is possible to perform a test question evaluation considering the selection rate for each option.
なお、上記実施形態では、試験問題データ14は5個の選択肢の中から1個の選択肢を選択する多肢選択問題を含んだ。しかしながら、本発明はこれに限らず、任意の数の選択肢から任意の数の選択肢を選択する多肢選択問題、又は論述問題であってもよい。ただし、論述問題の場合は、難易度コードの設定はできず、図5のステップS12の処理の次にステップS18の処理を実行することになる。
In the above embodiment, the
また、上記実施形態では、試験問題データ14を問題評価指数に基づいて問題評価区分A,B,Cに分類したが、本発明はこれに限らず、2つ又は4つ以上の問題評価区分に分類してもよい。例えば、測定する能力と異なる能力を測定しているために難しすぎる試験問題又は易しすぎる試験問題であって、ブラッシュアップの対象問題になり得ない試験問題を表す問題評価区分Dを追加して設けてもよい。
In the above embodiment, the
さらに、ステップS14における選択者数のしきい値及び選択率のしきい値と、試験問題分類テーブル12における試験問題データ14を分類するための問題評価指数のしきい値とは、本実施形態において示した値に限らない。試験問題評価処理を繰り返し実行し、より高精度に試験問題を評価できるように、これらの値を変更してもよい。
Furthermore, the threshold value of the number of selected persons and the threshold value of the selection rate in step S14 and the threshold value of the problem evaluation index for classifying the
またさらに、作問者によって図4の作問サポート処理のステップS5において設定された各選択肢の難易度コードに基づいて、最低合格指数(MPI(Minimum Pass Index)。非特許文献1参照。)を算出して、算出された最低合格指数をさらに含む試験問題データ14を生成してもよい。この場合、最低合格指数は、例えば、以下の式で算出される。
Furthermore, the minimum pass index (MPI (Minimum Pass Index), see Non-Patent Document 1) based on the difficulty code of each option set by the author in step S5 of the question support process of FIG. The
[数2]
最低合格指数=2/(各選択肢の難易度コードに対応する値の総和)
[Equation 2]
Minimum passing index = 2 / (sum of values corresponding to difficulty code of each option)
ただし、正解を表す難易度コード(丸で囲まれた2)に対応する値は2であり、難易度コード(2)に対応する値は2であり、難易度コード(1)に対応する値は1であり、難易度コード(0)に対応する値は0である。 However, the value corresponding to the difficulty level code (2 circled) representing the correct answer is 2, the value corresponding to the difficulty level code (2) is 2, and the value corresponding to the difficulty level code (1). Is 1, and the value corresponding to the difficulty level code (0) is 0.
また、上記実施形態において、決定された問題評価区分A、B又はCをディスプレイ6に表示したが、本発明はこれに限らず、プリンタなどの出力手段を用いて印字出力等してもよい。
In the above-described embodiment, the determined problem evaluation category A, B, or C is displayed on the
さらに、上記実施形態において、試験問題評価装置1は、作問者が、医師国家試験に準拠した模擬試験のための試験問題を作成して評価するために用いられた。しかしながら、本発明はこれに限らず、薬剤師国家試験又は看護士国家試験などの医学以外の領域の客観試験の試験問題を作成して評価するために用いられてもよい。
Furthermore, in the said embodiment, the test
またさらに、上記実施形態において、試験問題評価プログラム10と、その実行のための各テーブル11〜13及びデータとをそれぞれハードディスクドライブ5に予め格納した。しかしながら、本発明はこれに限らず、CD−ROM又はDVDなどの、コンピュータで読み取り可能な記録媒体21に記録された試験問題評価プログラム10と、その実行のための各テーブル11〜13及びデータをそれぞれ、コンピュータなどのコントローラを含む光ディスクドライブ20により読み出して、ハードディスクドライブ5に格納してもよい。また、試験問題評価プログラム10と、その実行のための各テーブル11〜13及びデータとを、試験問題評価装置1の外部装置から、インターネット及びLANインターフェース8を介してハードディスクドライブ5に格納してもよい。
Furthermore, in the above-described embodiment, the test
さらに、CPU2は、図4の作問サポート処理のステップS5において、ディスプレイ6に問題入力ウィンドウ200(図7参照。)を表示したが、本発明はこれに限られない。例えば、CPU2は、問題タイプ(図7の例では、上部に記載されているように、「タイプA」である。)に応じて類似の雛形問題を併せて表示するサポート機能を実行してもよい。さらに、CPU2は、問題作成時のガイダンス機能(例えば、コア・カリキュラムに準拠する場合は、「3歳」と入力すると、「女性」という単語が「女児」という単語に置き換わる機能。)を実行してもよい。
Further, the
またさらに、上記実施形態において、正答率及び期待正答率は0以上1以下の値であったが、本発明はこれに限らず、百分率であってもよい。 Furthermore, in the said embodiment, although the correct answer rate and the expected correct answer rate were values of 0 or more and 1 or less, this invention is not restricted to this, A percentage may be sufficient.
以上説明したように、本発明に係る試験問題評価装置及びその制御方法並びにプログラム及び記録媒体によれば、作問時に入力される試験問題の難易度及び必要度に基づいて算出される修正イーベル指数と、試験問題に対する解答内容を含むデータに基づいて算出される試験問題の正答率及び識別指数とに基づいて、修正イーベル指数と、正答率と、識別指数とをパラメータとする所定の関数を用いて上記試験問題の品質を表す問題評価指数を算出して出力するので、作問者による試験問題の評価内容と、試験実施後に得られる客観的な数値との両方を反映した問題評価指数を自動的に得ることができる。このため、試験問題の評価を自動的に行い、試験問題の良否を従来技術に比較して客観的に判定できる。 As described above, according to the test problem evaluation apparatus, the control method thereof, the program, and the recording medium according to the present invention, the modified ebel index calculated based on the difficulty level and the necessity level of the test problem input at the time of writing And a predetermined function using the corrected ebel index, the correct answer rate, and the identification index as parameters, based on the correct answer rate and the identification index of the test question calculated based on the data including the answer contents for the test question. The problem evaluation index that expresses the quality of the above test questions is calculated and output, so a problem evaluation index that reflects both the evaluation contents of the test questions by the author and objective values obtained after the test is automatically performed. Can be obtained. For this reason, the test questions are automatically evaluated, and the quality of the test questions can be objectively determined as compared with the prior art.
1…試験問題評価装置、
2…CPU、
3…ROM、
4…RAM、
5…ハードディスクドライブ、
6…ディスプレイ、
7…操作入力部、
8…LANインターフェース、
10…試験問題評価プログラム、
11…修正イーベル指数算出テーブル、
12…試験問題分類テーブル、
13…コメントテーブル、
14−1〜14−N…試験問題データ、
15…プール対象試験問題データ格納領域、
16…ブラッシュアップ対象試験問題データ格納領域、
17…重要な修正を含むブラッシュアップ対象試験問題データ格納領域、
20…光ディスクドライブ、
21…記録媒体、
31−1〜31−M…受験者用端末装置、
80…LAN。
1 ... Test question evaluation device,
2 ... CPU,
3 ... ROM,
4 ... RAM,
5. Hard disk drive,
6 ... Display,
7 ... operation input part,
8 ... LAN interface,
10 ... Exam question evaluation program,
11 ... Modified ebel index calculation table,
12 ... Exam question classification table,
13 ... Comment table,
14-1 to 14-N ... test question data,
15 ... Pool target test question data storage area,
16 ... Test question data storage area for brush-up,
17: Storage area for exam data subject to brush-up including important corrections,
20 ... Optical disc drive,
21. Recording medium,
31-1 to 31-M ... Terminal device for examinees,
80 ... LAN.
Claims (14)
試験問題の作成をサポートする作問サポート処理及び上記試験問題を評価する試験問題評価処理を実行する制御手段と、
試験問題の難易度及び必要度と、上記試験問題の必要度及び難易度を表す修正イーベル指数との対応関係を示す修正イーベル指数算出テーブルを予め格納する記憶手段とを備えた試験問題評価装置であって、
上記制御手段は、
上記作問サポート処理において、上記入力手段から入力される上記試験問題の難易度及び必要度に基づいて、上記修正イーベル指数算出テーブルを参照して、上記試験問題の難易度及び必要度を表す修正イーベル指数を算出し、
上記試験問題評価処理において、複数の受験者の上記試験問題に対する解答内容を含むデータに基づいて、上記試験問題の正答率と、上記複数の受験者のうちの成績上位層の受験者と上記成績上位層の受験者よりも下位の成績の成績下位層の受験者とを区別する能力を表す識別指数とを算出し、上記算出された修正イーベル指数と、正答率と、識別指数とに基づいて、修正イーベル指数と、正答率と、識別指数とをパラメータとする所定の関数を用いて上記試験問題の品質を表す問題評価指数を算出して出力することを特徴とする試験問題評価装置。 Input means for inputting predetermined data input by the examiner of the test question;
Control means for executing question support processing for supporting creation of test questions and test question evaluation processing for evaluating the test questions;
A test problem evaluation apparatus comprising a storage means for storing in advance a modified ebel index calculation table showing a correspondence relationship between the difficulty level and necessity level of the test problem and the corrected ebel index indicating the necessity level and difficulty level of the test problem. There,
The control means includes
In the question support process, based on the difficulty level and necessity level of the test question input from the input means, the correction indicating the difficulty level and the necessity level of the test question with reference to the corrected ebel index calculation table Calculate the ebel index,
In the examination question evaluation process, the correct answer rate of the examination question and the higher grade examinees and the grades of the plurality of examinees are based on data including the contents of answers to the examination questions of a plurality of examinees. Calculate an identification index that represents the ability to distinguish lower grades from lower grades than upper grades, and based on the calculated corrected ebel index, correct answer rate, and identification index A test question evaluation apparatus characterized in that a problem evaluation index representing the quality of the test question is calculated and output using a predetermined function having parameters of a modified Ebel index, a correct answer rate, and an identification index.
上記制御手段はさらに、上記試験問題評価処理において、上記解答内容を含むデータに基づいて、上記多肢選択問題の選択肢毎の選択率を算出し、上記試験問題を上記複数の問題評価区分に分類した後に、所定の選択率以下の選択肢があるときに上記分類された問題評価区分を1段階だけ下げるように変更することを特徴とする請求項2又は3記載の試験問題評価装置。 The exam question is a multiple choice question,
The control means further calculates a selection rate for each option of the multiple-choice question based on the data including the answer contents in the test question evaluation process, and classifies the test question into the plurality of question evaluation categories. 4. The test question evaluation apparatus according to claim 2 or 3, wherein when there is an option having a predetermined selection rate or less, the classified question evaluation category is changed to be lowered by one step.
上記制御手段はさらに、
上記作問サポート処理において、上記入力手段から、上記多肢選択問題の各選択肢毎の難易度を表す難易度コードを入力し、
上記試験問題評価処理において、上記入力された難易度コードを、上記問題評価指数とともに出力することを特徴とする請求項1乃至4のうちのいずれか1つに記載の試験問題評価装置。 The exam question is a multiple choice question,
The control means further includes
In the questioning support process, the difficulty code representing the difficulty for each option of the multiple-choice question is input from the input means.
5. The test question evaluation apparatus according to claim 1, wherein, in the test question evaluation process, the input difficulty code is output together with the question evaluation index. 6.
上記修正イーベル指数算出テーブルは、修正イーベル法において用いられ、試験問題の難易度及び必要度と期待正答率との対応関係を示すテーブルであることを特徴とする請求項1乃至5のうちのいずれか1つに記載の試験問題評価装置。 The above modified ebel index is the expected correct answer rate used in the modified ebel method.
6. The corrected ebel index calculation table is used in the modified ebel method, and is a table showing a correspondence relationship between a difficulty level and a necessity level of an examination question and an expected correct answer rate. The test problem evaluation apparatus as described in any one.
試験問題の作成をサポートする作問サポート処理及び上記試験問題を評価する試験問題評価処理を実行する制御手段と、
試験問題の難易度及び必要度と、上記試験問題の必要度及び難易度を表す修正イーベル指数との対応関係を示す修正イーベル指数算出テーブルを予め格納する記憶手段とを備えた試験問題評価装置の制御方法であって、
上記制御手段が、上記作問サポート処理において、上記入力手段から入力される上記試験問題の難易度及び必要度に基づいて、上記修正イーベル指数算出テーブルを参照して、上記試験問題の難易度及び必要度を表す修正イーベル指数を算出するステップと、
上記制御手段が、上記試験問題評価処理において、複数の受験者の上記試験問題に対する解答内容を含むデータに基づいて、上記試験問題の正答率と、上記複数の受験者のうちの成績上位層の受験者と上記成績上位層の受験者よりも下位の成績の成績下位層の受験者とを区別する能力を表す識別指数とを算出し、上記算出された修正イーベル指数と、正答率と、識別指数とに基づいて、修正イーベル指数と、正答率と、識別指数とをパラメータとする所定の関数を用いて上記試験問題の品質を表す問題評価指数を算出して出力するステップとを含むことを特徴とする試験問題評価装置の制御方法。 Input means for inputting predetermined data input by the examiner of the test question;
Control means for executing question support processing for supporting creation of test questions and test question evaluation processing for evaluating the test questions;
A test problem evaluation apparatus comprising storage means for storing in advance a corrected ebel index calculation table indicating a correspondence relationship between the difficulty level and necessity level of a test problem and the corrected ebel index indicating the necessity level and difficulty level of the test problem. A control method,
In the questioning support process, the control means refers to the modified ebel index calculation table based on the difficulty level and necessity level of the test problem input from the input means, and determines the difficulty level of the test problem and Calculating a modified ebel index representing the degree of necessity;
The control means, in the test question evaluation process, based on the data including the answer contents for the test questions of a plurality of examinees, the correct answer rate of the test questions and Calculates an identification index that represents the ability to distinguish test takers from lower grades of lower grades than those of the higher grades, and calculates the corrected ebel index, correct answer rate, and discrimination And calculating and outputting a problem evaluation index representing the quality of the test question using a predetermined function having the corrected ebel index, correct answer rate, and identification index as parameters based on the index. A control method for a test problem evaluation apparatus.
上記制御手段が、上記試験問題評価処理において、上記解答内容を含むデータに基づいて、上記多肢選択問題の選択肢毎の選択率を算出し、上記試験問題を上記複数の問題評価区分に分類した後に、所定の選択率以下の選択肢があるときに上記分類された問題評価区分を1段階だけ下げるように変更するステップをさらに含むことを特徴とする請求項8又は9記載の試験問題評価装置の制御方法。 The exam question is a multiple choice question,
In the test question evaluation process, the control means calculates a selection rate for each option of the multiple-choice question based on data including the answer contents, and classifies the test questions into the plurality of question evaluation categories. The test problem evaluation apparatus according to claim 8, further comprising a step of changing the classified problem evaluation category to be lowered by one step when there is an option having a predetermined selection rate or less. Control method.
上記制御手段が、上記作問サポート処理において、上記入力手段から、上記多肢選択問題の各選択肢毎の難易度を表す難易度コードを入力するステップと、
上記制御手段が、上記試験問題評価処理において、上記入力された難易度コードを、上記問題評価指数とともに出力するステップとをさらに含むことを特徴とする請求項7乃至10のうちのいずれか1つに記載の試験問題評価装置の制御方法。 The exam question is a multiple choice question,
The control means, in the question support process, a step of inputting a difficulty level code representing a difficulty level for each option of the multiple-choice question from the input means;
The control means further includes a step of outputting the input difficulty code together with the question evaluation index in the test question evaluation process. A control method for the test problem evaluation apparatus according to claim 1.
上記修正イーベル指数算出テーブルは、修正イーベル法において用いられ、試験問題の難易度及び必要度と期待正答率との対応関係を示すテーブルであることを特徴とする請求項7乃至11のうちのいずれか1つに記載の試験問題評価装置の制御方法。 The above modified ebel index is the expected correct answer rate used in the modified ebel method.
12. The corrected ebel index calculation table is used in the modified ebel method, and is a table showing a correspondence relationship between the difficulty level and necessity level of a test question and an expected correct answer rate. A method for controlling the test problem evaluation apparatus according to claim 1.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010234597A JP2012088494A (en) | 2010-10-19 | 2010-10-19 | Examination question evaluation system and method for controlling the same, program and recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010234597A JP2012088494A (en) | 2010-10-19 | 2010-10-19 | Examination question evaluation system and method for controlling the same, program and recording medium |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2012088494A true JP2012088494A (en) | 2012-05-10 |
Family
ID=46260182
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010234597A Pending JP2012088494A (en) | 2010-10-19 | 2010-10-19 | Examination question evaluation system and method for controlling the same, program and recording medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2012088494A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111597303A (en) * | 2020-05-12 | 2020-08-28 | 湖北美和易思教育科技有限公司 | Test paper question selection matching method and system |
CN112184006A (en) * | 2020-09-26 | 2021-01-05 | 深圳市快易典教育科技有限公司 | Multi-dimensional test question evaluation method and system and computer equipment |
WO2023273583A1 (en) * | 2021-06-29 | 2023-01-05 | 上海商汤智能科技有限公司 | Exam-marking method and apparatus, electronic device, and storage medium |
-
2010
- 2010-10-19 JP JP2010234597A patent/JP2012088494A/en active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111597303A (en) * | 2020-05-12 | 2020-08-28 | 湖北美和易思教育科技有限公司 | Test paper question selection matching method and system |
CN111597303B (en) * | 2020-05-12 | 2023-04-07 | 武汉美和易思数字科技有限公司 | Test paper question selection matching method and system |
CN112184006A (en) * | 2020-09-26 | 2021-01-05 | 深圳市快易典教育科技有限公司 | Multi-dimensional test question evaluation method and system and computer equipment |
CN112184006B (en) * | 2020-09-26 | 2024-04-16 | 深圳市快易典教育科技有限公司 | Multi-dimensional test question assessment method, system and computer equipment |
WO2023273583A1 (en) * | 2021-06-29 | 2023-01-05 | 上海商汤智能科技有限公司 | Exam-marking method and apparatus, electronic device, and storage medium |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kogan et al. | Guidelines: The do’s, don’ts and don’t knows of direct observation of clinical skills in medical education | |
US11996006B2 (en) | Virtual reality platform for training medical personnel to diagnose patients | |
Sears et al. | Measuring competence in healthcare learners and healthcare professionals by comparing self-assessment with objective structured clinical examinations: A systematic review | |
Wetzel | Factor analysis methods and validity evidence: a systematic review of instrument development across the continuum of medical education | |
Daniels et al. | Effect of clinically discriminating, evidence-based checklist items on the reliability of scores from an Internal Medicine residency OSCE | |
Pendergast et al. | The nomogram: A decision-making tool for practitioners using multitiered systems of support | |
Boerebach et al. | Embracing the complexity of valid assessments of clinicians’ performance: a call for in-depth examination of methodological and statistical contexts that affect the measurement of change | |
Veitch et al. | Evaluation of conventional training in Clinical Breast Examination (CBE) | |
Delclaux | No need for pulmonologists to interpret pulmonary function tests | |
Garcia-Retamero et al. | Scientific risk reporting in medical journals can bias expert judgment: Comparing surgeons’ risk comprehension across reporting formats. | |
Mannam et al. | Large language model-based neurosurgical evaluation matrix: a novel scoring criteria to assess the efficacy of ChatGPT as an educational tool for Neurosurgery Board preparation | |
JP2012088494A (en) | Examination question evaluation system and method for controlling the same, program and recording medium | |
Van Norman et al. | Posttest probabilities: An empirical demonstration of their use in evaluating the performance of universal screening measures across settings | |
Welsch et al. | The modified Readiness for Interprofessional Learning Scale in currently practicing athletic trainers | |
WO2015057842A1 (en) | Simulated clinical case-based systems and methods for assessment of health care professional's competence in evaluating and interpreting images and data | |
Aran et al. | Health literacy and health outcomes in stroke management: a systematic review and evaluation of available measures | |
JP6831551B2 (en) | Learning support device, program, learning support method, learning support system | |
Séguis et al. | Assessing clinical communication on the Occupational English Test® | |
Cambron-Goulet et al. | Guidelines for creating written clinical reasoning exams: insight from a Delphi study | |
Till et al. | Constructing and evaluating a validity argument for the final-year ward simulation exercise | |
Halamek | Educational perspectives: rigorous human performance assessment in neonatal-perinatal medicine | |
Balaha | Simplified Guidelines for Multiple-Choice Question Writing to Increase Faculty Compliance and Ensure Valid Student Results. | |
Wolden | Predicting success on the National Physical Therapy Examination: A systematic review of the literature and random effects meta-analysis | |
Clark et al. | Assessing evidence-based practice knowledge, self-efficacy, and use among respiratory therapists | |
Rothberg et al. | Validation of the Colorado psychiatry evidence-based medicine test |