JP2003085296A - Method and device for evaluating test question and its program and storage medium with its program stored thereon - Google Patents

Method and device for evaluating test question and its program and storage medium with its program stored thereon

Info

Publication number
JP2003085296A
JP2003085296A JP2001270987A JP2001270987A JP2003085296A JP 2003085296 A JP2003085296 A JP 2003085296A JP 2001270987 A JP2001270987 A JP 2001270987A JP 2001270987 A JP2001270987 A JP 2001270987A JP 2003085296 A JP2003085296 A JP 2003085296A
Authority
JP
Japan
Prior art keywords
test
test question
question
questions
hierarchical structure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001270987A
Other languages
Japanese (ja)
Inventor
Reo Kusaka
玲央 日下
Tomomi Ishiuchi
智美 石打
Akito Nagatsu
昭人 永津
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2001270987A priority Critical patent/JP2003085296A/en
Publication of JP2003085296A publication Critical patent/JP2003085296A/en
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

PROBLEM TO BE SOLVED: To judge whether or not test questions have the proper level of difficulty by evaluating those test questions according to contents. SOLUTION: Test questions are managed in a storage means in a hierarchical structure according to the contents of the test questions, and the level of difficulty of the test questions is calculated from the answer data of examinees in the test, and the test questions whose level of difficulty does not match the vertical relation of the hierarchical structure are detected.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、試験問題評価方法
及び装置及び試験問題評価プログラム及び試験問題評価
プログラムを格納した記憶媒体に係り、特に、試験にお
ける能力測定の精度の向上を図るために、試験問題を階
層構造で管理し、その階層構造を利用して上位・下位の
試験問題の難易度を比較することにより、不適切な試験
問題を発見し、修正したり削除したりすることにより、
試験の能力測定の精度を向上を図るための試験問題評価
方法及び装置及び試験問題評価プログラム及び試験問題
評価プログラムを格納した記憶媒体に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a test question evaluation method and apparatus, a test question evaluation program, and a storage medium storing the test question evaluation program, and more particularly, to improve accuracy of ability measurement in a test. By managing the exam questions in a hierarchical structure and comparing the difficulty levels of the upper and lower exam questions using the hierarchical structure, you can find inappropriate exam questions and correct or delete them.
The present invention relates to a test question evaluation method and apparatus for improving the accuracy of test ability measurement, a test question evaluation program, and a storage medium storing the test question evaluation program.

【0002】[0002]

【従来の技術】試験問題を評価する従来の方法として、
S−P表(S−P表の例としては、http://www.chuoh-k
youiku.co.jp/soft/sp,http://www.eyotsuva.com/eyo/
kyoukoku/image/sousasp.pdfや、佐藤隆博著『S−P表
の入門』明治図書、森敏明、秋田喜代美著『教育評価』
明治図書等がある)がある。S−P表とは、教師が主に
生徒の理解の程度を把握するために利用するテスト結果
表示法であるが、同時に生徒の回答データから試験問題
の不具合を発見することに利用される。
2. Description of the Related Art As a conventional method for evaluating test questions,
SP table (as an example of the SP table, http: //www.chuoh-k
youiku.co.jp/soft/sp, http://www.eyotsuva.com/eyo/
kyoukoku / image / sousasp.pdf and Takahiro Sato "Introduction to SP Table" Meiji Books, Toshiaki Mori, Kiyomi Akita "Educational Evaluation"
Meiji books etc.) The SP table is a test result display method mainly used by the teacher to grasp the degree of understanding of the student, but is also used to find a defect in the test question from the answer data of the student.

【0003】図11に示すように、S−P表の縦軸に
は、上から下へ正当数の高い順に生徒の名前が表示さ
れ、横軸には左から右へ正当数の高い順に試験問題が表
示される。各受験者が正答した試験問題の欄より、受験
者がどの試験問題に正答し、誤答したのか、逆に試験問
題は、どの受験者が正答し、誤答したのか、全体的に把
握することができる。
As shown in FIG. 11, on the vertical axis of the SP table, the names of students are displayed from the top to the bottom in the order of the highest legal numbers, and on the horizontal axis, the exams are tested from the left to the right in the highest legal number. The problem is displayed. From the column of the test question answered correctly by each examinee, it is possible to comprehensively understand which test question the examinee has answered correctly and made an incorrect answer, and vice versa, which examinee has answered the correct and incorrect questions. be able to.

【0004】S−P表を用いて、試験問題の評価を行う
具体的な方法は、能力の高い受験者が誤答しているの
に、能力の低い受験者が正答しているような試験問題な
ど、普通では考えにくい解答結果ある試験問題を発見
し、何らかの不具合があると推測することである。
A specific method for evaluating a test question using the SP table is a test in which a test taker with a high ability gives a wrong answer but a test taker with a poor ability gives a correct answer. The problem is to find a test question that has an answer result that is difficult to think, such as a question, and speculate that there is some kind of failure.

【0005】また、試験問題を評価するために、問題管
理データベースを図12に示すように問題ID毎に正答
率を管理する方法もある。
In order to evaluate the test questions, there is also a method of managing the correct answer rate for each question ID in the question management database as shown in FIG.

【0006】[0006]

【発明が解決しようとする課題】しかしながら、上記従
来のS−P表を用いて試験問題を評価する方法は、試験
問題の内容やカテゴリが考慮されないために、試験問題
間の比較評価が困難であるという問題がある。
However, the conventional method for evaluating test questions using the SP table is difficult to compare and evaluate the test questions because the content and category of the test questions are not taken into consideration. There is a problem.

【0007】本来、試験は、特定の能力分布をもった受
験者集団の能力を適切に評価できるように設計されてい
なければならない。能力の高い受験者は、高い得点を、
能力の低い受験者は低い得点を得るような試験問題の集
合によって成り立つべきである。そのためには、試験問
題が個々に適切な難しさを持っていなければならない。
試験の中には、基礎的な知識やスキルによって解答でき
る試験問題も、深い知識やスキルが要求される試験問題
も含まれるべきである。
Originally, the test should be designed so that the ability of a population of examinees with a particular ability distribution can be properly evaluated. Candidates with high abilities receive high scores,
Candidates with low abilities should consist of a set of exam questions that yield low scores. To do this, each test question must have an appropriate degree of difficulty.
Exams should include exam questions that can be answered by basic knowledge and skills, as well as exam questions that require deep knowledge and skills.

【0008】そのような試験の設計を実現するには、個
々の試験問題の難しさが適切であるかどうか評価する手
段が必要である。
In order to realize such a test design, a means is needed to assess the difficulty of the individual test questions.

【0009】個々の試験問題が適切な難易度であるかど
うかを評価するには、2つの方法がある。一つは、受験
者の解答データを参考に、能力が高い受験者が誤答して
いるのに能力が低い受験者が正答しているような試験問
題を発見する方法である。但し、能力の高い一人の受験
者が偶然誤答し、能力の低い一人の受験者があてずっぽ
うで正答したような場合にも、試験問題に不具合がある
ように見える。つまり、受験者の解答全体からの評価は
難しい。
There are two ways to assess whether an individual exam question is of adequate difficulty. One is a method of referring to the answer data of the examinee to find an exam question in which an examinee having a high ability gives a wrong answer but an examinee having a poor ability answers correctly. However, it seems that there is a defect in the examination problem even if one test taker with high ability accidentally makes a wrong answer and one test taker with low ability makes a correct answer. In other words, it is difficult to evaluate the examinee's entire answer.

【0010】もう一つは、前述の図12に示すように、
問題管理データベースに問題毎に正答率を管理すること
により、試験問題間の比較を行う方法である。試験問題
は、受験者の解答データから、例えば、正答数を難易度
とすることができる。10人中5人が正解している試験
問題ならば、0.5、10人中2人しか正解していない
試験問題ならば0.2と、数値が低いほど試験問題が難
しいことを表す難易度を考えることができる。この難易
度によって考えた場合、深い知識やスキルが求められる
試験問題は、基礎的な知識やスキルによって解答できる
試験問題よりもその数値が低いはずである。この方法で
は、受験者個人個人の解答を参考にするわけでないの
で、試験問題のより総合的な評価が可能である。
The other is, as shown in FIG.
This is a method of comparing exam questions by managing the correct answer rate for each question in a question management database. From the answer data of the examinee, the difficulty of the test question may be the number of correct answers, for example. If the test question is correct in 5 out of 10, 0.5 is 0.2 if only 2 in 10 are correct, and the lower the number, the more difficult the test problem is. You can think about the degree. Considering this difficulty level, exam questions that require deep knowledge and skills should have lower numbers than exam questions that can be answered by basic knowledge and skills. Since this method does not refer to the individual answers of individual examinees, it enables a more comprehensive evaluation of examination questions.

【0011】但し、そこでは、試験問題の比較対象が問
題になる。高度なネットワーク・セキュリティ技術に関
する試験問題と基礎的なデータベース言語の試験問題を
比較しても、それは意味ある比較とは言えないだろう。
なぜなら必要とされる知識やスキルの分野が異なってい
るからでる。高度なネットワーク・セキュリティ技術を
持つ受験者でも、データベースについての知識やスキル
は無いかもしれない。
However, there is a problem in the comparison of test questions. Comparing the exam questions of advanced network security technology with the exam questions of the underlying database language would not be a meaningful comparison.
This is because the areas of knowledge and skills required are different. Candidates with advanced network security technology may not have knowledge or skills about databases.

【0012】S−P表では、ネットワークに関する試験
問題もデータベースに関する試験問題も、単純に正答数
の順にS−P表の横軸に並べられる。全ての試験問題を
内容に関わらず同列に扱うので、どの試験問題がどの試
験問題よりも難しくあるべきか、あるいは、簡単である
べきかという、比較対象を選定するための情報が示され
ない。そのため、試験問題間の比較が困難だという問題
を抱えている。
In the SP table, both the test questions concerning the network and the test questions concerning the database are simply arranged on the horizontal axis of the SP table in the order of the number of correct answers. Since all test questions are treated in the same row regardless of the content, no information is provided for selecting comparison targets, which test questions should be more difficult or simpler than which ones. Therefore, there is a problem that it is difficult to compare test questions.

【0013】高度なネットワーク・セキュリティ技術に
関する試験問題は、その内容に直接的に属する基礎的知
識である試験問題、例えば、ネットワークに関する用語
の試験問題と比較されるべきである。
The test questions related to advanced network security technology should be compared with the test questions that are the basic knowledge directly related to the content thereof, for example, the test questions in the terminology related to networks.

【0014】つまり、試験問題が適切な難易度であるか
を評価するために、試験問題間の難易度の比較を行う時
には、試験問題の内容に応じた比較ができるような方法
が必要である。
That is, in order to evaluate whether the test questions have an appropriate difficulty level, when comparing the difficulty levels of the test questions, it is necessary to provide a method capable of making a comparison according to the contents of the test questions. .

【0015】本発明は、上記の点に鑑みなされたもの
で、内容に応じて試験問題間を比較することができ、適
切な難易度であるかを判定することが可能な試験問題評
価方法及び装置及び試験問題評価プログラム及び試験問
題評価プログラムを格納した記憶媒体を提供することを
目的とする。
The present invention has been made in view of the above points, and it is possible to compare test questions according to their contents, and a test question evaluation method capable of determining whether or not the difficulty level is appropriate. An object is to provide an apparatus, a test question evaluation program, and a storage medium storing the test question evaluation program.

【0016】[0016]

【課題を解決するための手段】図1は、本発明の原理を
説明するための図である。
FIG. 1 is a diagram for explaining the principle of the present invention.

【0017】本発明(請求項1)は、コンピュータを利
用した資格試験や認定試験を評価するための試験問題評
価方法において、試験問題を、該試験問題の内容に応じ
て階層構造で記憶手段内に管理し(ステップ1)、試験
問題を用いた試験における受験者の解答データから試験
問題の難易度を求め(ステップ2)、階層構造の上下関
係と難易度が矛盾する試験問題を検出する(ステップ
3)。本発明(請求項2)は、矛盾する試験問題を検出
する際に、階層構造の上位にある試験問題が下位にある
試験問題より難易度が低い場合には、矛盾があると判定
し、上位にある試験問題と下位にある試験問題に不適切
フラグを立てる。
According to the present invention (claim 1), in a test question evaluation method for evaluating a qualification test or a certification test using a computer, the test problems are stored in a storage means in a hierarchical structure according to the contents of the test problem. (Step 1), the difficulty of the test question is obtained from the answer data of the examinee in the test using the test question (step 2), and the test question in which the hierarchical relationship of the hierarchical structure and the difficulty are inconsistent is detected ( Step 3). The present invention (Claim 2) determines that there is a contradiction when an inconsistent test question is lower in difficulty than an inferior test question in a hierarchical structure when detecting an inconsistent test question. Flag exam questions in and exam questions below as inappropriate.

【0018】図2は、本発明の原理構成図である。FIG. 2 is a block diagram showing the principle of the present invention.

【0019】本発明(請求項3)は、コンピュータを利
用した資格試験や認定試験を評価するための試験問題評
価装置であって、試験問題の内容に応じて階層構造に管
理した試験問題データベース21と、試験問題を用いた
試験における受験者の解答データから試験問題の難易度
を求める解答分析手段22と、試験問題データベース2
1の階層構造の上下関係と解答分析手段22で求められ
た難易度が矛盾する試験問題を検出する矛盾検出手段2
3とを有する。
The present invention (Claim 3) is a test question evaluation apparatus for evaluating a qualification test or a certification test using a computer, and a test question database 21 managed in a hierarchical structure according to the contents of the test question. And the answer analysis means 22 for obtaining the difficulty level of the test question from the answer data of the examinee in the test using the test question, and the test question database 2
Contradiction detection means 2 for detecting a test question in which the hierarchical relationship of 1 and the difficulty level obtained by the answer analysis means 22 are inconsistent
3 and 3.

【0020】本発明(請求項4)は、矛盾検出手段23
において、階層構造の上位にある試験問題が下位にある
試験問題より難易度が低い場合には、矛盾があると判定
する手段と、上位にある試験問題と下位にある試験問題
に不適切フラグを立てる手段とを有する。
The present invention (Claim 4) provides a contradiction detecting means 23.
In the above, in the case where the test question at the higher level of the hierarchical structure has a lower difficulty level than the test question at the lower level, a means to determine that there is a contradiction and an inappropriate flag for the test question at the higher level and the test question at the lower level are set. And means for standing.

【0021】本発明(請求項5)は、コンピュータを利
用した資格試験や認定試験を評価するための試験問題評
価プログラムであって、試験問題の内容に応じて階層構
造に管理した試験問題データベースから出題された試験
問題に対する受験者の解答データから試験問題の難易度
を求める解答分析プロセスと、試験問題データベースの
階層構造の上下関係と解答分析プロセスで求められた難
易度が矛盾する試験問題を検出する矛盾検出プロセスと
を有する。
The present invention (Claim 5) is a test question evaluation program for evaluating a qualification test or qualification test using a computer, which uses a test question database managed in a hierarchical structure according to the contents of the test question. An answer analysis process that finds the difficulty level of the test question from the answer data of the examinee for the given test question, and a test question in which the hierarchical structure of the test question database and the difficulty level determined in the answer analysis process are inconsistent And a contradiction detection process.

【0022】本発明(請求項6)は、矛盾検出プロセス
において、階層構造の上位にある試験問題が下位にある
試験問題より難易度が低い場合には、矛盾があると判定
するプロセスと、上位にある試験問題と下位にある試験
問題に不適切フラグを立てるプロセスとを有する。
According to the present invention (Claim 6), in the contradiction detection process, if a test question at a higher level of the hierarchical structure has a lower difficulty level than a test question at a lower level, it is determined that there is a contradiction and a higher level. The exam questions in and the exam questions below are flagged as inappropriate.

【0023】本発明(請求項7)は、コンピュータを利
用した資格試験や認定試験を評価するための試験問題評
価プログラムを格納した記憶媒体であって、試験問題の
内容に応じて階層構造に管理した試験問題データベース
から出題された試験問題に対する受験者の解答データか
ら試験問題の難易度を求める解答分析プロセスと、試験
問題データベースの階層構造の上下関係と解答分析プロ
セスで求められた難易度が矛盾する試験問題を検出する
矛盾検出プロセスとを有する。
The present invention (claim 7) is a storage medium in which a test question evaluation program for evaluating a qualification test or a certification test using a computer is stored, and is managed in a hierarchical structure according to the contents of the test problem. The answer analysis process that finds the difficulty level of the test question from the answer data of the test question given from the exam question database, and the hierarchical relationship of the hierarchical structure of the test question database and the difficulty level determined by the answer analysis process are inconsistent. And a contradiction detection process for detecting test questions.

【0024】本発明(請求項8)は、矛盾検出プロセス
において、階層構造の上位にある試験問題が下位にある
試験問題より難易度が低い場合には、矛盾があると判定
するプロセスと、上位にある試験問題と下位にある試験
問題に不適切フラグを立てるプロセスとを有する。
According to the present invention (claim 8), in the contradiction detection process, when a test question at a higher level of the hierarchical structure is lower in difficulty than a test question at a lower level, it is determined that there is a contradiction and a higher level. The exam questions in and the exam questions below are flagged as inappropriate.

【0025】上記のように、本発明では、内容に応じた
階層構造上に試験問題を管理することで、関係ない内容
の問題同士ではなく、同じ内容の中で、高度な知識やス
キルを問う試験問題と基礎的な知識やスキルを問う試験
問題とを比較する。これにより、意味のある試験問題間
の難易度の比較を行うことが可能となる。
As described above, according to the present invention, by managing the examination questions in a hierarchical structure according to the contents, it is possible to ask for advanced knowledge and skills in the same contents, not in the questions of unrelated contents. Compare exam questions with exam questions that ask for basic knowledge or skills. This makes it possible to compare the difficulty levels of meaningful test questions.

【0026】難易度に矛盾があることが検出された試験
問題については、次回のテストに利用しないようにした
り、修正したり、削除したりすることで、結果的に試験
の能力測定の精度向上を達成することが可能となる。
As for the test question, which is detected to have inconsistency in difficulty, it is prevented from being used in the next test, is corrected, or is deleted, so that the accuracy of the ability measurement of the test is improved. Can be achieved.

【0027】[0027]

【発明の実施の形態】本発明では、試験問題間の比較評
価を実現するために、試験問題をその内容に応じて適切
に分類管理し、それを利用して比較する方法を提案す
る。具体的には、内容やカテゴリに応じて、高度な知識
やスキルを要求する問題ほど上位にあり、それに関する
基礎的な知識やスキルを要求する試験問題はその下位に
あるように階層的な構造をとる。
BEST MODE FOR CARRYING OUT THE INVENTION In order to realize comparative evaluation between test questions, the present invention proposes a method of appropriately classifying and managing test questions according to their contents and using them for comparison. Specifically, according to the content and category, the questions that require advanced knowledge and skills are ranked higher, and the exam questions that require basic knowledge and skills related to them are ranked lower. Take

【0028】図3は、本発明の一実施の形態における学
習目標の階層構造を示す図である。試験問題が問う知識
には、学習時の習得順序がある。「火」という漢字を書
けない受験者が「炭火」という漢字を書けることは通常
考えられない。同様に、試験問題が問うスキルにも高低
があり、漢字の読み書きができない受験者が、文章読解
をしたり、論述したりすることはできない。よって、試
験問題は、関連した知識やスキルの中で難易度の上下関
係があると考えることができる。
FIG. 3 is a diagram showing a hierarchical structure of learning targets in one embodiment of the present invention. The knowledge that the test questions ask has a learning sequence at the time of learning. Candidates who cannot write the kanji "fire" It is usually unthinkable that the examinee can write the kanji "charcoal". Similarly, examinees who are unable to read and write kanji cannot read or narrate sentences because they have high and low skills to ask for exam questions. Therefore, it can be considered that the test questions have a hierarchical relationship of difficulty among related knowledge and skills.

【0029】図4は、本発明の一実施の形態における試
験問題の階層構造の記述方法の例を示し、図5は、本発
明の一実施の形態における試験問題の階層構造モデルの
例(その1)である。図5は、図3と図4により表現さ
れる試験問題の階層構造をモデル化したものであり、試
験問題の難易度の上下関係を試験問題の番号を使って示
すと、 ・1>11>111 ・1>11>112 ・1>12>121 ・1>12>122 と考えることができる。
FIG. 4 shows an example of a method for describing the hierarchical structure of a test question in one embodiment of the present invention, and FIG. 5 shows an example of a hierarchical structure model of a test question in the one embodiment of the present invention (part thereof). 1). FIG. 5 is a model of the hierarchical structure of the test questions represented by FIG. 3 and FIG. 4, and the hierarchical relationship of the difficulty of the test questions is shown using the numbers of the test questions: 1>11> It can be considered as 111 .1>11> 112 .1>12> 121 .1>12> 122.

【0030】階層構造上に管理された試験問題におい
て、自分の知識やレベルより下位の試験問題は自分の知
識やレベルよりも難易度が低くなり、自分の知識やレベ
ルより上位の試験問題は、自分の知識やレベルよりも難
易度が高くなるように設計されている。
In the exam questions managed in a hierarchical structure, the exam questions lower than one's own knowledge and level have a lower degree of difficulty than one's own knowledge and level, and the exam questions above one's knowledge and level are: It is designed to be more difficult than your knowledge and level.

【0031】これらの階層構造の上下関係と難易度に矛
盾がある試験問題は、何等かの不具合があると考えられ
る。不具合とは、その試験が予め受験者に示していた出
題範囲を越えるような不適切な内容や用語が試験問題の
中で使われていたり、本来正解するはずの能力をもつ受
験者を間違えさせる引っ掛け問題のような内容が含まれ
ていたりすることである。
The test problem in which the hierarchical relationship of these hierarchical structures and the difficulty level are inconsistent is considered to have some trouble. A defect is a mistake in which an examinee who has the ability to correct the question is used with inappropriate content or terminology that is beyond the scope of the question that the examinee had shown to the examinee in advance, or who should have the correct answer. That is, the contents such as a hook problem may be included.

【0032】図6は、本発明の一実施の形態における試
験問題評価装置の構成を示す。
FIG. 6 shows the configuration of a test question evaluation device according to an embodiment of the present invention.

【0033】同図に示す装置は、試験問題データベース
21、解答分析部22、及び矛盾検出部23から構成さ
れる。
The apparatus shown in the figure comprises a test question database 21, an answer analysis section 22, and a contradiction detection section 23.

【0034】試験問題データベース21は、試験問題を
内容に応じて分類管理し、高度な知識やスキルを問う試
験問題が上位に位置し、それに関連する基礎的な知識や
スキルを問う試験問題が下位に位置するように、階層構
造上に管理する。
The exam question database 21 classifies and manages exam questions according to their contents, and the exam questions that ask for advanced knowledge and skills are located in the upper rank, and the exam questions that ask basic knowledge and skills related thereto are in the lower rank. It is managed in a hierarchical structure so that it is located at.

【0035】解答分析部22は、試験実施後に、受験者
の解答データから試験問題の難易度を求める。
The answer analysis unit 22 obtains the difficulty level of the test question from the answer data of the examinee after the test is performed.

【0036】矛盾検出部23は、階層構造の上下関係と
難易度の高低に矛盾がある試験問題を検出する。
The contradiction detection unit 23 detects a test question having a contradiction in the hierarchical relationship of the hierarchical structure and the difficulty level.

【0037】[0037]

【実施例】以下、本発明の実施例を図面と共に説明す
る。
Embodiments of the present invention will be described below with reference to the drawings.

【0038】まず、図6に示す試験問題評価装置の動作
について説明する。
First, the operation of the test question evaluation system shown in FIG. 6 will be described.

【0039】試験問題データベース21は、試験主催者
が作成した試験問題を記憶したデータベースである。試
験問題は、図4に示すように、内容に応じて分類され、
番号が振られる。図4では、最も高度な知識とスキルを
必要とする試験問題の番号を『1』とし、それに関連す
るLANに関する応用的な試験問題を『11』とし、セ
キュリティに関する応用的な試験問題を『12』と分け
ている。さらに、LANに関連する基礎的な知識やスキ
ルを問う試験問題をそれぞれ『111』、『112』と
し、セキュリティに関する基礎的な知識やスキルを問う
試験問題を『121』、『122』としている。このよ
うに記述された階層構造をモデル化した例が図5であ
る。 一つのテストの中で階層構造のツリーは一つとは
限らず、図5のような階層構造のツリーが複数存在する
ことになる。
The test question database 21 is a database that stores test questions created by the test organizer. The test questions are classified according to the content, as shown in FIG.
Numbered. In FIG. 4, the number of the test question that requires the most advanced knowledge and skill is "1", the related test question related to the LAN is "11", and the applied test question related to security is "12". ] Is divided. Further, test questions asking basic knowledge and skills related to LAN are designated as “111” and “112” respectively, and test questions asking basic knowledge and skills regarding security as “121” and “122” respectively. FIG. 5 shows an example of modeling the hierarchical structure described in this way. The number of trees having a hierarchical structure is not limited to one in one test, and a plurality of trees having a hierarchical structure as shown in FIG. 5 exist.

【0040】また、階層構造の中で、一つの試験問題の
すぐ上に位置する試験問題が一つであるとは限らない。
一つの試験問題が複数の試験問題に関連する下位の知識
やスキルを問う試験問題になっている場合には、試験問
題のすぐ上に複数の試験問題が存在する場合もある。こ
の時の試験問題管理方法の例を図7に示す。同図では、
試験問題に任意の番号を振り、各試験問題のすぐ上と下
にある試験問題を親と子として記述する。これにより、
各試験問題間の階層関係を記述する。このように記述さ
れた階層構造をモデル化した例を図8に示す。
Further, in the hierarchical structure, one test question is not always located immediately above one test question.
There may be multiple exam questions immediately above the exam question, where one exam question is an exam question that asks for subordinate knowledge or skills associated with multiple exam questions. An example of the test question management method at this time is shown in FIG. In the figure,
Assign any number to the test questions and describe the test questions immediately above and below each test question as parents and children. This allows
Describe the hierarchical relationship between each test question. FIG. 8 shows an example of modeling the hierarchical structure described in this way.

【0041】解答分析部22は、受験者の解答から試験
問題の難易度を求め、試験問題データベース21内の試
験問題に難易度のデータを追加する。試験問題の難易度
は、正答率を用いたり、項目応答理論(大友賢二著『項
目応答理論入門』大修館書店、池田央著『現代テスト理
論』朝倉書店)を用いたりして算出することができる。
The answer analysis unit 22 obtains the difficulty level of the test question from the answer of the examinee, and adds the difficulty level data to the test question in the test question database 21. The difficulty of the test question can be calculated by using the correct answer rate or using item response theory (Kenji Otomo "Introduction to Item Response Theory" Daishukan Shoten, Hiroshi Ikeda "Modern Test Theory" Asakura Shoten) it can.

【0042】正答率は、全体の受験者のうち何人が正解
したかを比率で表したものであり、最も難しい問題から
最も簡単な問題まで0〜+1.00の値をとる。
The correct answer rate represents the number of correct answers by all the examinees, and takes a value of 0 to +1.00 from the most difficult problem to the simplest problem.

【0043】項目応答理論とは、個々の試験問題に対す
る受験者の反応を数理モデルで表すものであり、一般的
に受験者の能力をθで示し、個々の項目への正答確率は
θの単調増加関数p(θ)で表され、試験問題の難易度
はbで表される。受験者の能力θと試験問題の難易度b
は同じ尺度上で表すことができる。つまり、難易度bに
解答できる能力がθであるという解釈ができる。bは最
も難しい問題から最も易しい問題まで+3.00〜−
3.00の値を取る。項目応答理論の下では、試験問題
の難易度は、受験者の能力に依存しないことが正答率を
用いた難易度と大きく異なる点である。
The item response theory is a mathematical model showing the test taker's reaction to each test question. Generally, the test taker's ability is represented by θ, and the probability of correct answer to each item is a monotone of θ. It is represented by an increasing function p (θ), and the difficulty of the test question is represented by b. Candidate's ability θ and difficulty of exam questions b
Can be expressed on the same scale. That is, it can be interpreted that the ability to answer the difficulty level b is θ. b is + 3.00-from the most difficult problem to the easiest problem
Takes a value of 3.00. Under the item response theory, the difficulty of the test question does not depend on the ability of the examinee, which is a great difference from the difficulty using the correct answer rate.

【0044】矛盾検出部23は、解答分析部22により
求められた試験問題の難易度を、試験問題の階層構造の
上下関係に従って比較する。図8は、本発明の一実施例
の矛盾検出方法を説明するための図である。ここでは、
項目応答理論によって求められた難易度が試験問題に付
加されているものとする。最も上位の試験問題からその
すぐ下位に位置する試験問題と難易度を比較する。
The contradiction detection section 23 compares the difficulty levels of the test questions obtained by the answer analysis section 22 according to the hierarchical relationship of the hierarchical structure of the test questions. FIG. 8 is a diagram for explaining the contradiction detection method according to the embodiment of the present invention. here,
It is assumed that the difficulty determined by the item response theory is added to the test question. The difficulty is compared with the exam question that is immediately below it from the highest exam question.

【0045】図8の例では、はじめに『問題1』と『問
題11』を比較する。次に、『問題1』と『問題12』
を比較する。次に、『問題11』と『問題111』、
『問題11』と『問題112』、『問題12』と『問題
121』、『問題12』と『問題122』の順に比較す
る。
In the example of FIG. 8, first, "problem 1" and "problem 11" are compared. Next, "Problem 1" and "Problem 12"
To compare. Next, "Problem 11" and "Problem 111",
"Problem 11" and "Problem 112", "Problem 12" and "Problem 121", "Problem 12" and "Problem 122" are compared in this order.

【0046】矛盾検出部23は、上位の試験問題よりも
下位の試験問題の難易度が高い時に、矛盾を検出する。
The contradiction detection section 23 detects a contradiction when the difficulty level of the lower-level test question is higher than that of the higher-level test question.

【0047】図8の例では、『問題12』は、『問題1
22』よりも上位にあるにも関わらず、難易度が低いの
で、矛盾があると検出する。複数の階層構造のツリーが
存在する場合には、それぞれのツリーにおいて同様の矛
盾検出を実施する。
In the example of FIG. 8, "Problem 12" is "Problem 1".
22 ”, but the difficulty level is low, so it is detected that there is a contradiction. When there are a plurality of hierarchically structured trees, similar inconsistency detection is performed in each tree.

【0048】検出結果は、試験問題データベース21上
に反映され、『問題12』及び『問題122』に図9に
示すような不適切フラグを立てる。
The detection result is reflected on the test question database 21, and the "problem 12" and "question 122" are flagged as inappropriate as shown in FIG.

【0049】図7及び図10に示すように、一つの試験
問題のすぐ上に複数の試験問題がある場合には、『問題
1』と『問題5』とが比較されるだけでなく、その後、
『問題2』も『問題5』と比較され、同様の矛盾検出が
行われる。
As shown in FIGS. 7 and 10, when there are a plurality of test questions immediately above one test question, not only are "problem 1" and "problem 5" compared, but ,
"Problem 2" is also compared with "Problem 5", and similar contradiction detection is performed.

【0050】難易度と不適切フラグは試験問題データベ
ース21上に図9に示すように記述する。不適切フラグ
は、試験主催者が試験問題データベース21上の試験問
題の修正や削除を行う際に取り消すことができる。
The degree of difficulty and the inappropriateness flag are described on the test question database 21 as shown in FIG. The inappropriate flag can be canceled when the test organizer corrects or deletes the test question on the test question database 21.

【0051】また、本発明は、上記の実施例における試
験問題評価装置の構成をプログラムとして構築し、試験
問題評価装置として利用されるコンピュータにインスト
ールする、または、ネットワークを介して流通させるこ
とも可能である。
Further, in the present invention, the configuration of the test question evaluation device in the above-mentioned embodiment can be constructed as a program and installed in a computer used as the test question evaluation device, or distributed through a network. Is.

【0052】また、構築されたプログラムを試験問題評
価装置として利用されるコンピュータに接続されるハー
ドディスクや、フロッピー(登録商標)ディスク、CD
−ROM等の可搬記憶媒体に格納しておき、本発明を実
施する際にインストールすることにより、容易に本発明
を実現できる。
A hard disk, a floppy (registered trademark) disk, or a CD connected to the computer used as the test question evaluation device for the constructed program.
-The present invention can be easily realized by storing it in a portable storage medium such as a ROM and installing it when carrying out the present invention.

【0053】なお、本発明は、上記の実施例に限定され
ることなく、特許請求の範囲内において、種々変更・応
用が可能である。
The present invention is not limited to the above embodiments, and various modifications and applications are possible within the scope of the claims.

【0054】[0054]

【発明の効果】上述のように、本発明によれば、内容に
応じて試験問題間を比較することができ、適切な難易度
であるかを判定することができる。これによって難易度
が適切でない試験問題を検出できる。検出された試験問
題を次回のテストに使わないようにしたり、修正した
り、削除したりすることにより、受験者の能力推定精度
の向上が実現できるという顕著な効果を奏するものであ
る。
As described above, according to the present invention, the test questions can be compared according to the contents, and it is possible to judge whether the difficulty level is appropriate. This makes it possible to detect a test question of which the difficulty level is not appropriate. By not using, correcting, or deleting the detected test questions for the next test, it is possible to improve the accuracy of the ability estimation of the examinees.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の原理を説明するための図である。FIG. 1 is a diagram for explaining the principle of the present invention.

【図2】本発明の原理構成図である。FIG. 2 is a principle configuration diagram of the present invention.

【図3】本発明の一実施の形態における学習目標の階層
構造を示す図である。
FIG. 3 is a diagram showing a hierarchical structure of learning targets according to an embodiment of the present invention.

【図4】本発明の一実施の形態における試験問題の階層
構造の記述方法の例である。
FIG. 4 is an example of a method of describing a hierarchical structure of a test question according to an embodiment of the present invention.

【図5】本発明の一実施の形態における試験問題の階層
構造モデルの例である。
FIG. 5 is an example of a hierarchical structure model of a test question in one embodiment of the present invention.

【図6】本発明の一実施の形態における試験問題評価装
置の構成図である。
FIG. 6 is a configuration diagram of a test question evaluation device according to an embodiment of the present invention.

【図7】本発明の一実施例の試験問題階層構造の記述方
法の例である。
FIG. 7 is an example of a method of describing a test question hierarchical structure according to an embodiment of the present invention.

【図8】本発明の一実施例の矛盾検出方法を説明するた
めの図である。
FIG. 8 is a diagram for explaining a contradiction detection method according to an embodiment of the present invention.

【図9】本発明の一実施例の難易度と不適切フラグの記
述方法を示す図である。
FIG. 9 is a diagram showing a method of describing a difficulty level and an inappropriate flag according to an embodiment of the present invention.

【図10】本発明の一実施例の試験問題の階層構造モデ
ルの例である。
FIG. 10 is an example of a hierarchical structure model of a test question according to an embodiment of the present invention.

【図11】従来の技術におけるS−P表を説明するため
の図である。
FIG. 11 is a diagram for explaining an SP table in the conventional technique.

【図12】従来の技術における問題管理データベースの
記述の例である。
FIG. 12 is an example of a description of a problem management database in the related art.

【符号の説明】[Explanation of symbols]

21 試験問題データベース 22 解答分析手段、解答分析部 23 矛盾検出手段、矛盾検出部 21 Exam question database 22 Answer analysis means, answer analysis section 23 Contradiction detection means, conflict detection unit

フロントページの続き (72)発明者 永津 昭人 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内Continued front page    (72) Inventor Akito Nagatsu             2-3-1, Otemachi, Chiyoda-ku, Tokyo             Inside Telegraph and Telephone Corporation

Claims (8)

【特許請求の範囲】[Claims] 【請求項1】 コンピュータを利用した資格試験や認定
試験を評価するための試験問題評価方法において、 試験問題を、該試験問題の内容に応じて階層構造で記憶
手段内に管理し、 前記試験問題を用いた試験における受験者の解答データ
から前記試験問題の難易度を求め、 前記階層構造の上下関係と前記難易度が矛盾する試験問
題を検出することを特徴とする試験問題評価方法。
1. A test question evaluation method for evaluating a qualification test or qualification test using a computer, wherein the test questions are managed in a storage means in a hierarchical structure according to the contents of the test questions, A test question evaluation method, wherein the difficulty level of the test question is obtained from the answer data of the examinee in the test using, and the test question in which the hierarchical relationship of the hierarchical structure and the difficulty level are contradictory is detected.
【請求項2】 前記矛盾する試験問題を検出する際に、 前記階層構造の上位にある試験問題が下位にある試験問
題より難易度が低い場合には、矛盾があると判定し、 前記上位にある試験問題と前記下位にある試験問題に不
適切フラグを立てる請求項1記載の試験問題評価方法。
2. When detecting the contradictory test questions, if the higher-ranked test questions in the hierarchical structure have a lower difficulty level than the lower-ranked test questions, it is determined that there is a contradiction, and The test question evaluation method according to claim 1, wherein an inappropriate flag is set for a test question and the subordinate test questions.
【請求項3】 コンピュータを利用した資格試験や認定
試験を評価するための試験問題評価装置であって、 試験問題の内容に応じて階層構造に管理した試験問題デ
ータベースと、 前記試験問題を用いた試験における受験者の解答データ
から前記試験問題の難易度を求める解答分析手段と、 前記試験問題データベースの階層構造の上下関係と前記
解答分析手段で求められた前記難易度が矛盾する試験問
題を検出する矛盾検出手段とを有することを特徴とする
試験問題評価装置。
3. A test question evaluation device for evaluating a qualification test or qualification test using a computer, which uses a test problem database managed in a hierarchical structure according to the contents of the test problem, and uses the test problem. An answer analysis unit that determines the difficulty level of the test question from the answer data of the examinee in the test, and a test question in which the hierarchical structure of the test question database and the difficulty level obtained by the answer analysis unit are inconsistent And a contradiction detecting means for performing the test question evaluation device.
【請求項4】 前記矛盾検出手段は、 前記階層構造の上位にある試験問題が下位にある試験問
題より難易度が低い場合には、矛盾があると判定する手
段と、 前記上位にある試験問題と前記下位にある試験問題に不
適切フラグを立てる手段とを有する請求項3記載の試験
問題評価装置。
4. The contradiction detection means determines that there is a contradiction when a test question at a higher level of the hierarchical structure has a lower difficulty level than a test question at a lower level, and the test question at a higher level. 4. The test question evaluation device according to claim 3, further comprising means for setting an inadequate flag for the test question at the lower level.
【請求項5】 コンピュータを利用した資格試験や認定
試験を評価するための試験問題評価プログラムであっ
て、 試験問題の内容に応じて階層構造に管理した試験問題デ
ータベースから出題された試験問題に対する受験者の解
答データから前記試験問題の難易度を求める解答分析プ
ロセスと、 前記試験問題データベースの階層構造の上下関係と前記
解答分析プロセスで求められた前記難易度が矛盾する試
験問題を検出する矛盾検出プロセスとを有することを特
徴とする試験問題評価プログラム。
5. An examination question evaluation program for evaluating a qualification examination or a certification examination using a computer, wherein an examination question is given from an examination question database managed in a hierarchical structure according to the contents of the examination question. Answer analysis process for determining the difficulty level of the test question from the answer data of the person, and contradiction detection for detecting a test question in which the hierarchical structure of the test question database and the difficulty level obtained in the answer analysis process are inconsistent A test question evaluation program characterized by having a process.
【請求項6】 前記矛盾検出プロセスは、 前記階層構造の上位にある試験問題が下位にある試験問
題より難易度が低い場合には、矛盾があると判定するプ
ロセスと、 前記上位にある試験問題と前記下位にある試験問題に不
適切フラグを立てるプロセスとを有する請求項5記載の
試験問題評価プログラム。
6. The process of detecting a contradiction includes a process of determining that there is a contradiction when a test question at a higher level of the hierarchical structure is lower in difficulty than a test question at a lower level, and the test question at a higher level. 6. The test question evaluation program according to claim 5, further comprising: and a process of setting an inappropriate flag to the test question at the lower level.
【請求項7】 コンピュータを利用した資格試験や認定
試験を評価するための試験問題評価プログラムを格納し
た記憶媒体であって、 試験問題の内容に応じて階層構造に管理した試験問題デ
ータベースから出題された試験問題に対する受験者の解
答データから前記試験問題の難易度を求める解答分析プ
ロセスと、 前記試験問題データベースの階層構造の上下関係と前記
解答分析プロセスで求められた前記難易度が矛盾する試
験問題を検出する矛盾検出プロセスとを有することを特
徴とする試験問題評価プログラムを格納した記憶媒体。
7. A storage medium for storing a test question evaluation program for evaluating a qualification test or a certification test using a computer, which is provided from a test question database managed in a hierarchical structure according to the contents of the test question. Answer analysis process for obtaining the difficulty level of the test question from the answer data of the examinee for the test question, and the test question in which the hierarchical relationship of the test question database and the difficulty level obtained in the answer analysis process are inconsistent A storage medium storing a test question evaluation program, characterized by having a contradiction detection process for detecting.
【請求項8】 前記矛盾検出プロセスは、 前記階層構造の上位にある試験問題が下位にある試験問
題より難易度が低い場合には、矛盾があると判定するプ
ロセスと、 前記上位にある試験問題と前記下位にある試験問題に不
適切フラグを立てるプロセスとを有する請求項7記載の
試験問題評価プログラムを格納した記憶媒体。
8. The contradiction detection process comprises a process of determining that there is a contradiction when a test question at a higher level of the hierarchical structure has a lower difficulty level than a test question at a lower level, and a test question at the higher level. 8. A storage medium storing a test question evaluation program according to claim 7, further comprising: and a process of setting an inappropriate flag to the test question at the lower level.
JP2001270987A 2001-09-06 2001-09-06 Method and device for evaluating test question and its program and storage medium with its program stored thereon Pending JP2003085296A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001270987A JP2003085296A (en) 2001-09-06 2001-09-06 Method and device for evaluating test question and its program and storage medium with its program stored thereon

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001270987A JP2003085296A (en) 2001-09-06 2001-09-06 Method and device for evaluating test question and its program and storage medium with its program stored thereon

Publications (1)

Publication Number Publication Date
JP2003085296A true JP2003085296A (en) 2003-03-20

Family

ID=19096557

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001270987A Pending JP2003085296A (en) 2001-09-06 2001-09-06 Method and device for evaluating test question and its program and storage medium with its program stored thereon

Country Status (1)

Country Link
JP (1) JP2003085296A (en)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007128162A (en) * 2005-11-01 2007-05-24 Advanced Telecommunication Research Institute International Information processing device and program
WO2008088004A1 (en) * 2007-01-19 2008-07-24 Konami Digital Entertainment Co., Ltd. Game system, server device, program, and computer-readable recording medium
JP2010134207A (en) * 2008-12-05 2010-06-17 Casio Computer Co Ltd Musical performance evaluation system and program
JP2016009335A (en) * 2014-06-24 2016-01-18 勝俣 和彦 Test preparation device and test preparation program
JP2016126029A (en) * 2014-12-26 2016-07-11 公益財団法人 日本英語検定協会 Computing for estimating capability value of multiple examinees on basis of item response theory
CN111597303A (en) * 2020-05-12 2020-08-28 湖北美和易思教育科技有限公司 Test paper question selection matching method and system
CN112598202A (en) * 2021-03-03 2021-04-02 北京世纪好未来教育科技有限公司 Test question difficulty evaluation method and device, storage medium and computing equipment

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007128162A (en) * 2005-11-01 2007-05-24 Advanced Telecommunication Research Institute International Information processing device and program
JP4701456B2 (en) * 2005-11-01 2011-06-15 株式会社国際電気通信基礎技術研究所 Information processing apparatus and program
WO2008088004A1 (en) * 2007-01-19 2008-07-24 Konami Digital Entertainment Co., Ltd. Game system, server device, program, and computer-readable recording medium
JP2010134207A (en) * 2008-12-05 2010-06-17 Casio Computer Co Ltd Musical performance evaluation system and program
JP2016009335A (en) * 2014-06-24 2016-01-18 勝俣 和彦 Test preparation device and test preparation program
JP2016126029A (en) * 2014-12-26 2016-07-11 公益財団法人 日本英語検定協会 Computing for estimating capability value of multiple examinees on basis of item response theory
CN111597303A (en) * 2020-05-12 2020-08-28 湖北美和易思教育科技有限公司 Test paper question selection matching method and system
CN111597303B (en) * 2020-05-12 2023-04-07 武汉美和易思数字科技有限公司 Test paper question selection matching method and system
CN112598202A (en) * 2021-03-03 2021-04-02 北京世纪好未来教育科技有限公司 Test question difficulty evaluation method and device, storage medium and computing equipment

Similar Documents

Publication Publication Date Title
Copur-Gencturk et al. Teachers’ bias against the mathematical ability of female, Black, and Hispanic students
Nygren et al. Swedish teenagers’ difficulties and abilities to determine digital news credibility
Schwieren et al. The testing effect in the psychology classroom: A meta-analytic perspective
Romig et al. Meta-analysis of criterion validity for curriculum-based measurement in written language
Bassok et al. Is kindergarten the new first grade?
Weidinger et al. Changes in the relation between competence beliefs and achievement in math across elementary school years
Templin et al. Obtaining diagnostic classification model estimates using Mplus
Hallam et al. Changes in motivation as expertise develops: Relationships with musical aspirations
Bastian et al. A framework for improvement: Analyzing performance-assessment scores for evidence-based teacher preparation program reforms
US6688888B1 (en) Computer-aided learning system and method
Allchin et al. Finding the place of argumentation in science education: Epistemics and Whole Science
KR100978091B1 (en) Management system for online test assessment and method thereof
Hershkovitz et al. Discovery with models: A case study on carelessness in computer-based science inquiry
NL1005053C2 (en) Self-study device.
Jeon et al. Modeling answer change behavior: An application of a generalized item response tree model
White Rater performance standards for classroom observation instruments
Shepherd The impact of teacher subject knowledge on learner performance in South Africa: A within-pupil across-subject approach
Ryser et al. Using growth models to measure school performance: Implications for gifted learners
Hosp et al. Using curriculum-based measures with postsecondary students with intellectual and developmental disabilities
TW201317954A (en) Method and system for learning diagnosis and dynamic recommendation of learning resource
Schmidt et al. Pretest‐posttest‐posttest multilevel IRT modeling of competence growth of students in higher education in Germany
Di Fabio Emotional intelligence: A new variable in career decision-making
Nierenberg et al. Is information literacy ability, and metacognition of that ability, related to interest, gender, or education level? A cross-sectional study of higher education students
Chen et al. Examining human and automated ratings of elementary students’ writing quality: A multivariate generalizability theory application
Piwowar et al. Evaluating response shift in training evaluation: comparing the retrospective pretest with an adapted measurement invariance approach in a classroom management training program

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060417

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060425

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060623

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20061219