JP5182954B2 - Cavity problem generator and program thereof - Google Patents

Cavity problem generator and program thereof Download PDF

Info

Publication number
JP5182954B2
JP5182954B2 JP2009163291A JP2009163291A JP5182954B2 JP 5182954 B2 JP5182954 B2 JP 5182954B2 JP 2009163291 A JP2009163291 A JP 2009163291A JP 2009163291 A JP2009163291 A JP 2009163291A JP 5182954 B2 JP5182954 B2 JP 5182954B2
Authority
JP
Japan
Prior art keywords
sentence
burial
option
candidate
blank
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009163291A
Other languages
Japanese (ja)
Other versions
JP2011017947A (en
Inventor
具治 岩田
武士 山田
智子 小尻
豊英 渡邉
拓也 後藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nagoya University NUC
Nippon Telegraph and Telephone Corp
Tokai National Higher Education and Research System NUC
Original Assignee
Nagoya University NUC
Nippon Telegraph and Telephone Corp
Tokai National Higher Education and Research System NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nagoya University NUC, Nippon Telegraph and Telephone Corp, Tokai National Higher Education and Research System NUC filed Critical Nagoya University NUC
Priority to JP2009163291A priority Critical patent/JP5182954B2/en
Publication of JP2011017947A publication Critical patent/JP2011017947A/en
Application granted granted Critical
Publication of JP5182954B2 publication Critical patent/JP5182954B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Electrically Operated Instructional Devices (AREA)

Description

本発明は、コンピュータを用いた個別学習に関し、特に、コンピュータを用いて穴埋問題を生成する問題生成(Question generation)技術に関する。   The present invention relates to individual learning using a computer, and more particularly to a question generation technique for generating a burial problem using a computer.

学習者が個々に学習を進める形態として、個別学習が知られている。これまで、個別学習で利用する問題は、教師等の専門家によって作成されることが一般的であった。近年、イーラーニング(e-learning)の普及に伴って、ネットワークを介して、コンピュータを用いての個別学習が拡大しつつある。このため、個別学習では、個々の学習者に合わせた大量の問題が必要とされている。   Individual learning is known as a form in which a learner advances learning individually. Until now, problems used in individual learning have generally been created by specialists such as teachers. In recent years, along with the spread of e-learning, individual learning using a computer is expanding through a network. For this reason, individual learning requires a large amount of problems tailored to individual learners.

このことから、現在、英文等の一部を空欄とした穴埋問題を生成する技術が提案されている(例えば、非特許文献1,2参照)。非特許文献1,2に記載の技術では、英文に出現する動詞や形容詞を空欄とする。これによって、非特許文献1,2に記載の技術では、特定の品詞を問う穴埋問題の生成を可能としている。   For this reason, a technique for generating a burial problem in which a part of English text or the like is blank has been proposed (see Non-Patent Documents 1 and 2, for example). In the techniques described in Non-Patent Documents 1 and 2, verbs and adjectives appearing in English are blank. As a result, the techniques described in Non-Patent Documents 1 and 2 enable generation of a burial problem asking for a specific part of speech.

また、個別学習では、空欄を決定するだけでなく、誤った選択肢となる誤選択肢を生成する必要もある。例えば、非特許文献1,2に記載の技術では、類語辞典などを用いて類義語や反義語を誤選択肢として生成する。これによって、非特許文献1,2に記載の技術では、学習者の語彙能力を測る穴埋問題の生成も可能としている。   In addition, in individual learning, it is necessary not only to determine a blank, but also to generate an erroneous option that becomes an incorrect option. For example, in the techniques described in Non-Patent Documents 1 and 2, synonyms and antonyms are generated as erroneous choices using a thesaurus. As a result, the techniques described in Non-Patent Documents 1 and 2 can also generate a burial problem that measures the vocabulary ability of the learner.

隅田英一郎,菅谷史昭,山本誠一,“英語能力測定のための空所補充問題の自動生成手法”,信学技報,Vol.104,No.503(2004),pp.17-22.Eiichiro Sumida, Fumiaki Shibuya, Seiichi Yamamoto, “Automatic generation method of empty space filling problem for measuring English proficiency”, IEICE Technical Report, Vol.104, No.503 (2004), pp.17-22. Yi-Chien Lin,Li-Chun Sung,and Meng Chang Chen,“An Automatic Multiple-Choice Question Generation Scheme for English Adjective Understanding”,ICCE 2007 Workshop Proc. of Modeling, Management and Generation of Problems / Questions in eLearning(2007),pp.137-142.Yi-Chien Lin, Li-Chun Sung, and Meng Chang Chen, “An Automatic Multiple-Choice Question Generation Scheme for English Adjective Understanding”, ICCE 2007 Workshop Proc. Of Modeling, Management and Generation of Problems / Questions in eLearning (2007) , pp.137-142.

非特許文献1,2をはじめとする従来技術では、以下のような問題がある。例えば、非特許文献1,2に記載の技術では、学習者自身が複数の英文から問題となる英文を1文選択する必要がある。しかし、学習者自身が、無数に存在する文章から穴埋問題に適した英文を選択することは困難である。   The conventional techniques including Non-Patent Documents 1 and 2 have the following problems. For example, in the techniques described in Non-Patent Documents 1 and 2, it is necessary for the learner himself to select one sentence in English from the plurality of sentences. However, it is difficult for the learner himself to select an English sentence suitable for the burial problem from an infinite number of sentences.

また、問題の難易度を左右することから、穴埋問題に適切な英文を選択することは重要である。例えば、文法的に正しく、一般によく使われる単語や品詞から構成されている文章は、問題文として適している。一方、固有名詞を多く含む文章、会話文、及び、文法的に正しくない文章は、問題文として不適切である。しかし、文章が穴埋問題に適しているかを判定可能な穴埋問題生成技術は、提案されていない。   In addition, it is important to select an appropriate English sentence for the burial problem because it affects the difficulty of the problem. For example, sentences that are grammatically correct and composed of commonly used words and parts of speech are suitable as question sentences. On the other hand, sentences containing many proper nouns, conversation sentences, and sentences that are not grammatically correct are inappropriate as question sentences. However, a burying problem generation technique that can determine whether a sentence is suitable for a burying problem has not been proposed.

また、穴埋問題における空欄は、学習者が学習する文法や語彙を示しており、空欄に置き換える単語や品詞も問題の難易度を大きく左右する要因である。ここで、従来技術のように、特定の品詞のみを空欄にする手法や、問題文中で学習者が指定した単語の頻出度に近い単語を空欄として決定する手法では、問題文中で空欄に置き換えられる単語が限定されることが多かった。しかし、空欄の決定には問題文の構造が影響するため、特定の品詞や単語の頻出度等の語彙レベルに限定されない、柔軟な穴埋問題生成技術が強く要望されている。   The blank in the burial problem indicates the grammar and vocabulary that the learner learns, and the word and the part of speech that are replaced by the blank are factors that greatly affect the difficulty of the problem. Here, as in the prior art, in a method of leaving only a specific part of speech blank or a method of determining a word close to the frequency of words specified by the learner in a question sentence as a blank, it is replaced with a blank in the question sentence. Words were often limited. However, since the structure of the question sentence influences the determination of the blank, there is a strong demand for a flexible burial problem generation technique that is not limited to a vocabulary level such as a specific part of speech or word frequency.

また、誤選択肢も問題の難易度に大きく影響を及ぼす。例えば、誤選択肢が正解選択肢の品詞や意味と全く異なるものである場合には、学習者が容易に正解することが可能である。一方、誤選択肢が正解選択肢と同じ品詞や似た意味を持つ単語である場合には、問題の難易度は高くなる。しかし、従来技術のように、正解選択肢の単語の類義語や反義語から誤選択肢群を生成する手法や、正解選択肢の単語とその頻出度に応じた語彙レベルが近い単語を誤選択肢群として用いる手法では、語彙を問う穴埋問題の生成に限定されている。このため、文法も学習可能な穴埋問題を生成する穴埋問題生成技術が強く要望されている。   In addition, wrong choices greatly affect the difficulty of the problem. For example, if the wrong choice is completely different from the part of speech or meaning of the correct choice, the learner can easily make the correct answer. On the other hand, when the wrong choice is a word having the same part of speech or similar meaning as the correct answer choice, the difficulty level of the problem becomes high. However, as in the prior art, a method for generating a wrong choice group from synonyms and antonyms of a correct choice word, or a method using a word with a close vocabulary level according to the correct choice word and its frequency as the wrong choice group Limited to the creation of burial questions that ask vocabulary. For this reason, there is a strong demand for a burial problem generation technique for generating a burial problem that can learn grammar.

そこで、本発明は、前記した課題を解決し、個別学習に適した穴埋問題を生成できる穴埋問題生成技術を提供することを目的とする。   Accordingly, an object of the present invention is to solve the above-described problems and provide a burial problem generation technique that can generate a burial problem suitable for individual learning.

専門家が穴埋問題を作成する際、経験に基づいて、学習目的に応じた問題文を選択し、空欄や誤選択肢を決定している。つまり、専門家の問題作成の知識は、既に作成された穴埋問題から取得できると考えられる。そこで、本願発明者らは、既存穴埋問題の単語や文法に関する統計情報を機械学習することで、専門家の経験的な知識を穴埋問題に反映できることを見出し、本発明を完成させた。   When an expert creates a burial problem, based on experience, he selects a problem sentence according to the learning purpose, and determines blanks and wrong choices. That is, it can be considered that the expert's knowledge of problem creation can be acquired from the already created burial problem. Therefore, the inventors of the present application have found that the empirical knowledge of experts can be reflected in the burial problem by machine learning statistical information on the words and grammar of the existing burial problem, and have completed the present invention.

具体的には、本願第1発明に係る穴埋問題生成装置は、外部から入力された穴埋問題文候補に含まれる1以上の単語を空欄に置き換えた穴埋問題文と、前記空欄に置き換えた前記1以上の単語である正解選択肢と、当該正解選択肢と異なる選択肢である誤選択肢とで構成される穴埋問題を生成する穴埋問題生成装置において、形態素が付加された前記穴埋問題文候補が複数入力され、優先度学習により予め学習した優先度情報に基づいて、前記穴埋問題文候補毎に優先度を算出すると共に、当該優先度が高い順に前記穴埋問題文候補を選択する問題文選択手段と、前記穴埋問題文候補に含まれる前記単語を系列として扱う系列ラベリングにより予め学習した空欄統計情報に基づいて、前記問題文選択手段が選択した前記穴埋問題文候補における前記空欄を決定する空欄決定手段と、前記誤選択肢の候補である誤選択肢候補を生成する生成規則が予め設定され、当該生成規則に基づいて、前記空欄決定手段が決定した前記空欄に対応する前記誤選択肢候補を生成する誤選択肢候補生成手段と、前記誤選択肢候補毎に、当該誤選択肢候補を前記穴埋問題文の前記空欄に挿入した検索文でインターネット検索を行い、前記インターネット検索に失敗した前記検索文における前記誤選択肢候補を前記誤選択肢として選択して、前記穴埋問題を出力する誤選択肢選択手段と、を備えることを特徴とする。   Specifically, the burial problem generator according to the first invention of the present application replaces one or more words included in candidate burial problem sentences input from the outside with blanks, and replaces the blanks with the blanks. In the burial problem generating apparatus for generating a burial problem composed of a correct answer option that is the one or more words and an incorrect option that is different from the correct answer option, the burial problem sentence to which a morpheme is added. A plurality of candidates are input, and the priority is calculated for each burial problem sentence candidate based on the priority information learned in advance by priority learning, and the burial problem sentence candidates are selected in descending order of the priority. In the burial problem sentence candidate selected by the problem sentence selection means, based on blank statistical information previously learned by a problem sentence selection means and sequence labeling that treats the words included in the burial problem sentence candidate as a sequence. A blank determining means for determining the blank and a generation rule for generating a wrong choice candidate that is a candidate for the wrong choice are preset, and the blank corresponding to the blank determined by the blank determination means based on the generation rule. An erroneous option candidate generating means for generating an incorrect option candidate, and for each of the erroneous option candidates, an Internet search was performed using a search sentence in which the incorrect option candidate was inserted into the blank of the burial problem sentence, and the Internet search failed. And selecting an erroneous option candidate in the search sentence as the erroneous option, and an erroneous option selecting means for outputting the burial problem.

まず、穴埋問題生成装置は、穴埋問題文候補として、学習者が個々に用意した文章(例えば、書籍、ニュース、コラム、論文、インターネット上のドキュメント等の英語文章)が複数入力される。つまり、学習者は、それぞれの好みや興味に応じた文章を、穴埋問題文候補として予め用意しておく。このとき、例えば、穴埋問題文候補には、それぞれに含まれる1個1個の単語に形態素(Part-of-speech tag)を付加しておく。   First, the burial problem generating apparatus receives a plurality of sentences (for example, English sentences such as books, news, columns, papers, documents on the Internet, etc.) prepared individually by the learner as burial problem sentence candidates. That is, the learner prepares sentences corresponding to each preference and interest in advance as burial problem sentence candidates. At this time, for example, a morpheme (Part-of-speech tag) is added to each word included in each burial problem sentence candidate.

次に、穴埋問題生成装置は、穴埋問題文候補から、穴埋問題に適した文章(穴埋問題文候補)を選択する。入力された穴埋問題文候補を用いて個別学習する場合、より適切な穴埋問題文候補から順に穴埋問題を生成することが好ましい。そこで、穴埋問題生成装置は、優先度学習により学習した優先度情報を用いて、優先度が高い順に穴埋問題文候補を選択する。これによって、穴埋問題生成装置は、穴埋問題文として不適切な文章(例えば、固有名詞が多い文章や会話文)を穴埋問題文として選択することを少なくできる。なお、優先度学習とは、各々のサンプル間の類似度から、入力されたサンプル内の優先度を算出することによって、サンプルを相対的に分類する手法である。この優先度学習としては、例えば、Ranking Voted Perceptron法(以下、「RVP法」と略記する)、及び、RocSVM(Rocchio Support Vector Machine)法があげられる。   Next, the burial problem generation device selects a sentence (clogging problem sentence candidate) suitable for the burial problem from the burial problem sentence candidates. When individual learning is performed using the input burial problem sentence candidates, it is preferable to generate burial problems in order from more appropriate burial problem sentence candidates. Therefore, the burial problem generating apparatus selects candidate burial problem sentences in descending order of priority using the priority information learned by the priority learning. Accordingly, the burial problem generating apparatus can reduce the selection of an inappropriate sentence (for example, a sentence or conversation sentence having many proper nouns) as the burial problem sentence as the burial problem sentence. Note that priority learning is a method of relatively classifying samples by calculating the priority in the input sample from the similarity between the samples. As this priority learning, for example, Ranking Voted Perceptron method (hereinafter abbreviated as “RVP method”) and RocSVM (Rocchio Support Vector Machine) method can be cited.

そして、穴埋問題生成装置は、穴埋問題文における空欄を決定する。ここで、文章は、単語や形態素の列から構成されている。つまり、空欄の決定は、単語や形態素の列に「空欄」というラベルを付ける問題と言い換えることができる。そこで、穴埋問題生成装置は、穴埋問題文における空欄の決定を系列ラベリング問題として扱い、穴埋問題文に含まれる単語に、空欄を意味するラベル付けを行う。これによって、穴埋問題生成装置は、穴埋問題文における空欄に置き換えられる単語の偏りを少なくできる。このとき、穴埋問題生成装置は、既存穴埋問題に含まれる単語と形態素との系列情報を学習データとして機械学習した空欄統計情報を予め記憶しておく。この機械学習としては、例えば、条件付き確率場(CRF:Conditional Random Fields)、隠れマルコフモデル(HMM:Hidden Markov Model)、及び、最大エントロピーマルコフモデル(MEMM:Maximum Entropy Markov Model)があげられる。   Then, the burial problem generating device determines a blank in the burial problem sentence. Here, the sentence is composed of a string of words and morphemes. That is, the determination of a blank can be paraphrased as a problem of labeling a column of words or morphemes as “blank”. Therefore, the burial problem generating apparatus treats the determination of blanks in the burial problem sentence as a series labeling problem, and labels words included in the burial problem sentence to mean blanks. As a result, the burial problem generator can reduce the bias of words that are replaced with blanks in the burial problem sentence. At this time, the burial problem generating device stores blank statistical information obtained by machine learning using, as learning data, sequence information of words and morphemes included in the existing burial problem. Examples of the machine learning include a conditional random field (CRF), a hidden Markov model (HMM), and a maximum entropy Markov model (MEMM).

さらに、穴埋問題生成装置は、誤選択肢を生成する。このとき、正解選択肢で空欄を埋めた穴埋問題文は、意味的・文法的に正しい文でなければならず、一方、誤選択肢で空欄を埋めた穴埋問題文は、意味的・文法的に正しい文であってはならない。つまり、穴埋問題生成装置は、正しい文となる誤選択肢候補を削除し、意味的・文法的に誤りとなる誤選択肢候補を誤選択肢として選択する必要がある。そこで、穴埋問題生成装置は、生成した誤選択肢候補で穴埋問題文の空欄を埋めた検索文を生成し、これを検索条件としてインターネット検索を行う。そして、穴埋問題生成装置は、インターネット検索に失敗した検索文における誤選択肢候補を誤選択肢として選択する。このようにして、穴埋問題生成装置は、個別学習に適した穴埋問題を生成する。   Further, the hole filling problem generating device generates an erroneous option. At this time, the burial problem sentence filled with blanks with correct choices must be semantically and grammatically correct sentences, while the burial problem sentence filled with blanks with wrong choices is semantic and grammatical. It must not be a correct sentence. In other words, it is necessary for the burial problem generating apparatus to delete erroneous option candidates that are correct sentences and to select erroneous option candidates that are semantically and grammatically incorrect as incorrect options. Therefore, the burial problem generation device generates a search sentence in which the blank of the burial problem sentence is filled with the generated erroneous option candidates, and performs an Internet search using this as a search condition. Then, the burial problem generating apparatus selects, as an incorrect option, an incorrect option candidate in a search sentence in which Internet search has failed. In this way, the burial problem generator generates a burial problem suitable for individual learning.

また、本願第2発明に係る穴埋問題生成装置は、既に作成された前記穴埋問題(既存穴埋問題)において前記空欄に置き換えられた前記1以上の単語の形態素と前記生成規則との対応関係を示す統計パターンを記憶する記憶手段をさらに備え、前記誤選択肢候補生成手段は、前記統計パターンを参照して、前記穴埋問題文において前記空欄に置き換えられた前記1以上の単語の形態素に対応した前記生成規則を用いて前記誤選択肢候補を生成することを特徴とする。   Further, the burial problem generating apparatus according to the second invention of the present application provides a correspondence between the generation rule and the morpheme of the one or more words that have been replaced with the blank in the already created burial problem (existing burial problem). Storage means for storing a statistical pattern indicating a relationship is further provided, wherein the erroneous option candidate generating means refers to the statistical pattern and uses the one or more word morphemes replaced with the blank in the burial problem sentence. The erroneous option candidate is generated using the corresponding generation rule.

ここで、既存穴埋問題における誤選択肢の生成規則を分析し、その統計パターンを記憶させておく。そして、穴埋問題生成装置は、この統計パターンに基づいて、誤選択肢候補を生成する。これによって、穴埋問題生成装置は、語彙だけでなく、文法も学習可能な穴埋問題を生成する   Here, the generation rule of the erroneous option in the existing hole filling problem is analyzed, and the statistical pattern is stored. Then, the burial problem generating device generates erroneous option candidates based on the statistical pattern. As a result, the burial problem generator generates burial problems that can learn not only vocabulary but also grammar.

また、本願第3発明に係る穴埋問題生成装置は、前記外部から前記穴埋問題文候補が複数入力され、入力された当該穴埋問題文候補を形態素解析すると共に、形態素を付加した前記穴埋問題文候補を前記問題文選択手段に出力する形態素付加手段をさらに備えることを特徴とする。これによって、穴埋問題生成装置は、学習者自身で穴埋問題文候補に形態素を付加する必要がなくなり、学習者にとって利便性が良い。   The burial problem generator according to the third invention of the present application is configured such that a plurality of the burial problem sentence candidates are input from the outside, the morphological analysis is performed on the input burial problem sentence candidates, and the morpheme is added to the hole. It further comprises morpheme adding means for outputting buried question sentence candidates to the question sentence selecting means. This eliminates the need for the learner himself to add a morpheme to the candidate burial problem sentence, which is convenient for the learner.

また、本願第4発明に係る穴埋問題生成プログラムは、コンピュータを、本願第1発明から本願第3発明までの何れかの穴埋問題生成装置の各手段として動作させることを特徴とする。このプログラムをインストールされたコンピュータは、このプログラムに基づいた各機能を実現することができる。   A burial problem generating program according to the fourth invention of the present application causes a computer to operate as each means of any of the burying problem generating apparatuses from the first invention of the present application to the third invention of the present application. A computer in which this program is installed can realize each function based on this program.

本発明によれば、専門家の経験的な知識を反映させて、個別学習に適した穴埋問題を生成できる穴埋問題生成技術を提供することができる。   ADVANTAGE OF THE INVENTION According to this invention, the burial problem generation technique which can reflect the empirical knowledge of an expert and can generate the burial problem suitable for individual learning can be provided.

本発明における、個別学習システムの概略を説明する図である。It is a figure explaining the outline of an individual learning system in the present invention. 本発明における、個別学習システムの構成を示すブロック図である。It is a block diagram which shows the structure of the individual learning system in this invention. 本発明における、問題入力画面の一例を示す図である。It is a figure which shows an example of the problem input screen in this invention. 本発明における、学習画面の一例を示す図である。It is a figure which shows an example of the learning screen in this invention. 本発明の第1実施形態に係る穴埋問題生成装置の機能を説明する図である。It is a figure explaining the function of the burial problem generating apparatus concerning a 1st embodiment of the present invention. 本発明の第1実施形態に係る穴埋問題生成装置の構成を示すブロック図である。It is a block diagram which shows the structure of the hole filling problem generation apparatus which concerns on 1st Embodiment of this invention. 図6の穴埋問題生成装置が用いるRVP法のアルゴリズムを説明する図である。It is a figure explaining the algorithm of the RVP method which the burial problem generating apparatus of FIG. 6 uses. 本発明に係る穴埋問題生成プログラムをインストールされたコンピュータのブロック図である。It is a block diagram of a computer in which a hole filling problem generating program according to the present invention is installed. 図6の穴埋問題生成装置の動作を示すフローチャートである。It is a flowchart which shows operation | movement of the hole filling problem production | generation apparatus of FIG.

以下、本発明の実施形態について、適宜図面を参照しながら詳細に説明する。なお、各実施形態において、同一の機能を有する手段には同一の符号を付し、説明を省略した。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings as appropriate. In each embodiment, means having the same function are denoted by the same reference numerals and description thereof is omitted.

[個別学習システムの概略]
以下、図1及び図2を参照し、本発明の第1実施形態に係る穴埋問題生成装置4を利用した、個別学習システム1の概略について、説明する。個別学習システム1は、例えば、英語の穴埋問題を生成して学習者の個別学習を支援するものである。なお、穴埋問題生成装置4が個別学習装置3に内蔵されていることから、図1には図示していない。
[Outline of individual learning system]
Hereinafter, an outline of the individual learning system 1 using the hole filling problem generating device 4 according to the first embodiment of the present invention will be described with reference to FIGS. 1 and 2. The individual learning system 1 generates, for example, an English burying problem and supports the learner's individual learning. Since the hole filling problem generating device 4 is built in the individual learning device 3, it is not shown in FIG.

前記したように、従来技術では、学習者自身が複数の英文から問題となる英文を1文選択する必要がある。しかし、学習者自身が、無数の文章から穴埋問題に適した英文を選択することは困難である。図1に示すように、学習者は、それぞれの好みや興味に応じた文章(図1では、英文)を複数用意し、これらを個別学習装置3に入力する。すると、個別学習装置3は、学習者が入力した文章から穴埋問題文として適切なものを選択し、さらに、誤選択肢を生成し、穴埋問題(図1では、問題と図示)として出力する。そして、学習者は、個別学習装置3が出力した穴埋問題を回答することによって、個別学習を行う。   As described above, in the prior art, the learner himself needs to select one sentence in question from a plurality of sentences. However, it is difficult for the learner himself to select an English sentence suitable for the burial problem from a myriad of sentences. As shown in FIG. 1, the learner prepares a plurality of sentences (English sentences in FIG. 1) according to each preference and interest, and inputs these to the individual learning device 3. Then, the individual learning device 3 selects an appropriate burial problem sentence from the sentences input by the learner, generates an incorrect option, and outputs it as a burial problem (shown as a problem in FIG. 1). . Then, the learner performs individual learning by answering the burial problem output by the individual learning device 3.

このため、図2に示すように、個別学習システム1は、学習者端末装置2と、個別学習装置3とを備える。ここで、学習者端末装置2は、個別学習装置3とインターネット等のネットワーク(不図示)介して接続している。なお、図2では、説明のため、1台の学習者端末装置2のみを図示したが、個別学習システム1は、学習者端末装置2を複数台備えても良い。   For this reason, as shown in FIG. 2, the individual learning system 1 includes a learner terminal device 2 and an individual learning device 3. Here, the learner terminal device 2 is connected to the individual learning device 3 via a network (not shown) such as the Internet. In FIG. 2, only one learner terminal device 2 is shown for explanation, but the individual learning system 1 may include a plurality of learner terminal devices 2.

学習者端末装置2は、学習者が個別学習に用いる端末装置である。例えば、学習者端末装置2は、マウス、キーボード等の入力手段(不図示)、ディスプレイ等の出力手段(不図示)を備え、インタネットーブラウザ(不図示)がインストールされた一般的なコンピュータである。   The learner terminal device 2 is a terminal device used by the learner for individual learning. For example, the learner terminal device 2 is a general computer that includes input means (not shown) such as a mouse and keyboard, output means (not shown) such as a display, and has an internet browser (not shown) installed. .

個別学習装置3は、学習者が個別学習に用いる穴埋問題を生成する装置であり、問題入力画面提示手段31と、穴埋問題文候補取得手段32と、穴埋問題生成装置4と、学習画面提示手段33とを備える。   The individual learning device 3 is a device that generates a burial problem used by the learner for individual learning, and includes a problem input screen presentation unit 31, a burial problem sentence candidate acquisition unit 32, a burial problem generation device 4, and learning. Screen display means 33.

問題入力画面提示手段31は、学習者が文章(穴埋問題文候補)を入力する問題入力画面Sc1(図3参照)を学習者端末装置2に提示する。例えば、問題入力画面提示手段31は、問題入力画面Sc1となるHTML(HyperText Markup Language)データを生成して学習者端末装置2に出力する。この問題入力画面Sc1は、図3に示すように、学習者が文章(穴埋問題文候補)を複数入力可能なテキストボックスTxと、テキストボックスTxに入力された文章(穴埋問題文候補)を個別学習装置3に送信する送信ボタンBt1とを含んでいる。なお、図3では、テキストボックスTx内の「This is the building where we had our first office.・・・」は、学習者が入力した文章(穴埋問題文候補)の一例である。   The question input screen presenting means 31 presents to the learner terminal device 2 a question input screen Sc1 (see FIG. 3) in which the learner inputs a sentence (filled question sentence candidate). For example, the question input screen presenting means 31 generates HTML (HyperText Markup Language) data to be the question input screen Sc1 and outputs it to the learner terminal device 2. As shown in FIG. 3, the question input screen Sc1 includes a text box Tx in which a learner can input a plurality of sentences (filled question sentence candidates) and a sentence (filled question sentence candidates) input in the text box Tx. Is transmitted to the individual learning device 3. In FIG. 3, “This is the building where we had our first office....” In the text box Tx is an example of a sentence (candidate question sentence candidate) input by the learner.

ここで、問題入力画面提示手段31からHTMLデータが出力されると、学習者端末装置2は、インタネットーブラウザに問題入力画面Sc1が表示される。そして、学習者は、例えば、書籍、ニュース、コラム、論文、インターネット上のドキュメント等の文章を、問題入力画面Sc1のテキストボックスTxにコピー&ペーストする。その後、学習者が問題入力画面Sc1の送信ボタンBt1をクリックすると、テキストボックスTxに入力された文章(穴埋問題文候補)が個別学習装置3に送信される。   Here, when the HTML data is output from the question input screen presenting means 31, the learner terminal device 2 displays the question input screen Sc1 on the Internet browser. Then, for example, the learner copies and pastes sentences such as books, news, columns, papers, and documents on the Internet to the text box Tx of the question input screen Sc1. Thereafter, when the learner clicks the send button Bt1 on the question input screen Sc1, the sentence (filled question sentence candidate) input in the text box Tx is transmitted to the individual learning device 3.

穴埋問題文候補取得手段32は、学習者端末装置2から送信された文章(穴埋問題文候補)を取得し、穴埋問題生成装置4に出力する。ここでは、例えば、穴埋問題文候補取得手段32は、図3の問題入力画面のテキストボックスTxに入力された「This is the building where we had our first office.」を含む複数の文章を、穴埋問題文候補として取得する。   The burial problem sentence candidate acquisition unit 32 acquires a sentence (a burial problem sentence candidate) transmitted from the learner terminal device 2 and outputs the sentence to the burial problem generation apparatus 4. Here, for example, the burial problem sentence candidate acquisition means 32 converts a plurality of sentences including “This is the building where we had our first office.” Input in the text box Tx of the problem input screen of FIG. Acquired as a buried question sentence candidate.

穴埋問題生成装置4は、穴埋問題文候補取得手段32からの穴埋問題文候補に含まれる1以上の単語を空欄に置き換えた穴埋問題文と、空欄に置き換えた1以上の単語である正解選択肢と、正解選択肢と異なる選択肢である誤選択肢とで構成される穴埋問題を生成する。なお、穴埋問題生成装置4の詳細は、後記する。   The burial problem generating apparatus 4 includes a burial problem sentence in which one or more words included in the burial problem sentence candidate from the burial problem sentence candidate obtaining unit 32 are replaced with blanks, and one or more words replaced with blanks. A burial problem composed of a certain correct answer option and an incorrect option that is different from the correct answer option is generated. Details of the hole filling problem generating device 4 will be described later.

学習画面提示手段33は、穴埋問題生成装置4が生成した穴埋問題に基づいて学習画面Sc2(図4参照)を生成し、この学習画面Sc2を学習者端末装置2に提示する。例えば、学習画面提示手段33は、学習画面Sc2となるHTMLデータを生成して学習者端末装置2に出力する。この学習画面Sc2は、図4に示すように、例えば、「This is the building ( ) we had our first office.」という穴埋問題文と、「where」という正解選択肢と、「what」、「which」及び「when」という誤選択肢とを含んでいる。また、この学習画面Sc2は、例えば、学習者が選択した選択肢を示すラジオボタンRbと、ラジオボタンRbで選択した選択肢が正解であるか否かを判定する回答ボタンBt2とを含んでいる。さらに、この学習画面Sc2には、回答ボタンBt2がクリックされると、学習者が選択した選択肢が正解であるか否かを判定し、選択肢に応じて正解ダイアログボックス又は誤答ダイアログボックスを出力するスクリプト(不図示)が含まれている。なお、この例では、穴埋問題文における空欄は、カッコ書きの部分である。   The learning screen presenting means 33 generates a learning screen Sc2 (see FIG. 4) based on the hole filling problem generated by the hole filling problem generating device 4, and presents the learning screen Sc2 to the learner terminal device 2. For example, the learning screen presentation unit 33 generates HTML data to be the learning screen Sc2 and outputs the HTML data to the learner terminal device 2. As shown in FIG. 4, the learning screen Sc2 includes, for example, a burial problem sentence “This is the building () we had our first office.”, A correct answer option “where”, “what”, “howch”. ”And“ when ”. The learning screen Sc2 includes, for example, a radio button Rb indicating an option selected by the learner and an answer button Bt2 for determining whether the option selected by the radio button Rb is correct. Furthermore, when the answer button Bt2 is clicked on the learning screen Sc2, it is determined whether or not the choice selected by the learner is the correct answer, and a correct answer dialog box or an incorrect answer dialog box is output according to the choice. A script (not shown) is included. In this example, the blank in the burial problem sentence is a part written in parentheses.

ここで、学習画面提示手段33からHTMLデータが出力されると、学習者端末装置2は、インタネットーブラウザに学習画面Sc2が表示される。すると、学習者は、「This is the building ( ) we had our first office.」という穴埋問題文において、穴埋にふさわしい選択肢「what」、「which」、「where」又は「when」に対応するラジオボタンRbを選択し、回答ボタンBt2をクリックする。ここで、学習者が「where」という正解選択肢を選択した場合、学習者端末装置2には、正解メッセージを含む正解ダイアログボックスが表示される。一方、学習者が「what」、「which」又は「when」という誤選択肢を選択した場合、学習者端末装置2には、誤答メッセージを含む誤答ダイアログボックスが表示される。以上のようにして、個別学習システム1では、学習者が個別学習を行うことができる。   Here, when the HTML data is output from the learning screen presenting means 33, the learner terminal device 2 displays the learning screen Sc2 on the Internet browser. Then, the learner corresponds to the choice “what”, “who”, “where” or “when” appropriate for filling in the burial problem sentence “This is the building () we had our first office.”. Select the radio button Rb and click the answer button Bt2. Here, when the learner selects the correct answer option “where”, the learner terminal device 2 displays a correct answer dialog box including a correct message. On the other hand, when the learner selects the wrong choice of “what”, “who”, or “when”, the learner terminal device 2 displays an error answer dialog box including an error message. As described above, in the individual learning system 1, a learner can perform individual learning.

[穴埋問題生成装置の構成]
以下、穴埋問題生成装置4の詳細について、説明する。図5に示すように、穴埋問題生成装置4は、大きく、1)学習者が入力した文章から適切な問題文を選択、2)選択した穴埋問題文候補における空欄を決定、及び、3)誤選択肢を生成という機能を備える。そして、これら機能を実現するために、図6に示すように、穴埋問題生成装置4は、記憶手段41と、優先度学習手段42と、空欄統計情報学習手段43と、統計パターン学習手段44と、形態素付加手段51と、問題文選択手段52と、空欄決定手段53と、誤選択肢生成手段54とを備える。
[Configuration of hole filling problem generator]
Hereinafter, the details of the hole filling problem generating apparatus 4 will be described. As shown in FIG. 5, the burial problem generating device 4 is largely divided into 1) selecting an appropriate problem sentence from sentences input by the learner, 2) determining a blank in the selected burial problem sentence candidate, and 3 ) Has the function of generating wrong choices. In order to realize these functions, as shown in FIG. 6, the burial problem generating apparatus 4 includes a storage unit 41, a priority learning unit 42, a blank statistical information learning unit 43, and a statistical pattern learning unit 44. A morpheme adding unit 51, a question sentence selecting unit 52, a blank determining unit 53, and an erroneous option generating unit 54.

なお、図6では、優先度学習手段42、空欄統計情報学習手段43、及び、統計パターン学習手段44が、穴埋問題を生成するために必要となる各種情報を生成して記憶手段41に記憶する。また、形態素付加手段51、問題文選択手段52、空欄決定手段53、及び、誤選択肢生成手段54が、記憶手段41に記憶した各種情報を用いて穴埋問題を生成する。   In FIG. 6, the priority learning means 42, the blank statistical information learning means 43, and the statistical pattern learning means 44 generate various information necessary for generating the burial problem and store them in the storage means 41. To do. In addition, the morpheme adding unit 51, the question sentence selecting unit 52, the blank space determining unit 53, and the erroneous option generating unit 54 generate a burial problem using various information stored in the storage unit 41.

記憶手段41は、既存穴埋問題文情報411と、ラベル付既存穴埋問題文情報412と、優先度情報413と、空欄統計情報414と、類語辞書415と、単語辞書416と、活用語リスト417と、統計パターン418とを記憶するメモリ又はハードディスクである。   The storage means 41 includes existing burial problem sentence information 411, labeled existing burial problem sentence information 412, priority information 413, blank space statistical information 414, a synonym dictionary 415, a word dictionary 416, and a use word list. A memory or a hard disk for storing 417 and a statistical pattern 418.

既存穴埋問題文情報411は、専門家が学習問題として作成した複数の既存穴埋問題の問題文と、その問題文に含まれる単語毎の形態素とを含む情報である。第1実施形態では、例えば、既存穴埋問題として、TOEIC(登録商標)の穴埋問題を用いている。なお、この既存穴埋問題文情報411は、例えば、オペレータによって予め記憶手段41に記憶される。   The existing burying problem sentence information 411 is information including a plurality of existing burying problem problems prepared by a specialist as a learning problem and morphemes for each word included in the problem sentence. In the first embodiment, for example, the TOEIC (registered trademark) filling problem is used as the existing filling problem. The existing burial problem sentence information 411 is stored in the storage unit 41 in advance by an operator, for example.

ラベル付既存穴埋問題文情報412は、既存穴埋問題文情報411に含まれる穴埋問題文の単語毎に固有表現のラベルが付加された情報である。このラベル付既存穴埋問題文情報412は、例えば、オペレータによって予め記憶手段41に記憶される。なお、ラベルの詳細については、後記する。   The existing burial problem sentence information 412 with label is information in which a unique expression label is added to each word of the burial problem sentence included in the existing burial problem sentence information 411. This existing hole-filled problem sentence information 412 with label is stored in the storage means 41 in advance by an operator, for example. Details of the label will be described later.

優先度情報413は、後記する優先度学習手段42が優先度学習によって生成した学習データである。なお、この優先度情報413は、後記する問題文選択手段52が参照する。   The priority information 413 is learning data generated by priority learning means 42 described later by priority learning. The priority information 413 is referred to by the question sentence selection unit 52 described later.

空欄統計情報414は、後記する空欄統計情報学習手段43が系列ラベリングによって生成した学習データである。なお、この空欄統計情報414は、後記する空欄決定手段53が参照する。   The blank statistic information 414 is learning data generated by the blank statistic information learning means 43 to be described later by series labeling. The blank statistic information 414 is referred to by the blank decision means 53 described later.

類語辞書415は、穴埋問題文に含まれる単語に類似する意味を有する類義語、及び、この単語と反対の意味を有する反義語が登録された辞書である。この類語辞書415は、後記する誤選択肢生成手段54が参照する。なお、この類語辞書415は、オペレータによって予め記憶手段41に記憶される。   The synonym dictionary 415 is a dictionary in which a synonym having a meaning similar to a word included in the burial problem sentence and an antonym having a meaning opposite to the word are registered. The synonym dictionary 415 is referred to by the erroneous option generation means 54 described later. The synonym dictionary 415 is stored in the storage unit 41 in advance by the operator.

単語辞書416は、穴埋問題文に含まれる単語が登録された辞書である。この単語辞書416は、後記する誤選択肢生成手段54が参照する。なお、この単語辞書416は、オペレータによって予め記憶手段41に記憶される。   The word dictionary 416 is a dictionary in which words included in the burial problem sentence are registered. This word dictionary 416 is referred to by the erroneous option generation means 54 described later. The word dictionary 416 is stored in the storage means 41 in advance by the operator.

活用語リスト417は、穴埋問題文に含まれる単語の活用語が登録されたリストである。この活用語リスト417は、後記する誤選択肢生成手段54が参照する。なお、この活用語リスト417は、オペレータによって予め記憶手段41に記憶される。   The utilization word list 417 is a list in which utilization words of words included in the burial problem sentence are registered. The use word list 417 is referred to by the erroneous option generation means 54 described later. The utilization word list 417 is stored in the storage unit 41 in advance by the operator.

統計パターン418は、既存穴埋問題において空欄に置き換えられた1以上の単語の形態素と生成規則との対応関係を示す情報である。ここで、生成規則は、誤選択肢を生成する様々な規則を示す。なお、この統計パターン418は、後記する誤選択肢生成手段54が参照する。   The statistical pattern 418 is information indicating a correspondence relationship between the generation rules and the morphemes of one or more words that have been replaced with blanks in the existing burying problem. Here, the generation rules indicate various rules for generating erroneous choices. The statistical pattern 418 is referred to by an erroneous option generation unit 54 described later.

優先度学習手段42は、記憶手段41のラベル付既存穴埋問題文情報412を参照し、優先度学習を行って優先度情報413を生成して、記憶手段41に記憶させる。以下、図7を参照し、RVP法による優先度学習の一例を説明する(適宜図6参照)。なお、このRVP法の詳細は、例えば、文献「Michael Collins, and Nigel Duffy,“New Ranking Algorithms for Parsing and Tagging:Kernels over Discrete Structures, and the Voted Perceptron”,Proc.of 40th Annual Meeting of the Association for Computational Linguistics (2007),pp.263-270.」に記載されている。   The priority learning unit 42 refers to the labeled existing burial problem sentence information 412 in the storage unit 41, performs priority learning, generates priority information 413, and stores it in the storage unit 41. Hereinafter, an example of priority learning by the RVP method will be described with reference to FIG. 7 (see FIG. 6 as appropriate). Details of the RVP method are described in, for example, the document “Michael Collins, and Nigel Duffy,“ New Ranking Algorithms for Parsing and Tagging: Kernels over Discrete Structures, and the Voted Perceptron ”, Proc. Of 40th Annual Meeting of the Association for Computational Linguistics (2007), pp.263-270.

図7では、xi0は、既存穴埋問題の問題文を正解選択肢で埋めた文章であり、これが正例である。また、図7では、xi1,・・・,xij及びyは、任意の文章であり、これが候補である。さらに、図7では、h(xi0)・h(y)は、文章xi0と文章yとの単語及び文法の類似度を示す。そして、図7では、h(xij)・h(y)は、文章xijと文章yとの単語及び文法の類似度を示す。そして、図7では、G(y)は文章xi0と文章yとの優先度を示し、αijは重みを示すパラメータであり、argmaxは、G(xij)を最大化する値を返す関数を示す。 In FIG. 7, x i0 is a sentence in which the question sentence of the existing burying problem is filled with the correct answer options, which is a positive example. In FIG. 7, x i1 ,..., X ij and y are arbitrary sentences, which are candidates. Further, in FIG. 7, h (x i0 ) · h (y) indicates the similarity of words and grammar between the sentence x i0 and the sentence y. In FIG. 7, h (x ij ) · h (y) indicates the similarity of words and grammar between the sentence x ij and the sentence y. In FIG. 7, G (y) indicates the priority between the sentence x i0 and the sentence y, α ij is a parameter indicating the weight, and argmax is a function that returns a value that maximizes G (x ij ). Indicates.

ここで、優先度学習手段42は、h(xij)・h(y)を下記の式(1)及び式(2)によって算出する。なお、式(2)に示すように、k(xij,y)は、文章xijと文章yとの単語の一致数を示すunigram(xij,y)と、文章xijと文章yとの形態素の一致数を示すposunigram(xij,y)との合計値である。つまり、文章xi0と文章yとの類似度が高い場合、優先度G(y)は、より高い値となる。このとき、優先度学習手段42は、候補の文章の類似度が正例の文章の類似度を超えた場合、その値を「1」とし、候補の文章の類似度が高い値とならないように学習する。なお、優先度学習手段42は、この式(1)及び式(2)の他、単語や品詞の系列の一致数や、構文木の一致数を用いても良い。 Here, the priority learning means 42 calculates h (x ij ) · h (y) by the following equations (1) and (2). Incidentally, as shown in equation (2), k (x ij , y) is the sentence x ij and unigram indicating the number of matched words and sentences y (x ij, y) and the sentence x ij and text y This is a total value with posunigram (x ij , y) indicating the number of coincidence of morphemes. That is, when the similarity between the sentence x i0 and the sentence y is high, the priority G (y) has a higher value. At this time, the priority learning means 42 sets the value to “1” when the similarity of the candidate sentence exceeds the similarity of the positive sentence so that the similarity of the candidate sentence does not become a high value. learn. Note that the priority learning means 42 may use the number of coincidence of word and part-of-speech sequences and the number of coincidence of syntax trees in addition to the equations (1) and (2).

Figure 0005182954
Figure 0005182954

Figure 0005182954
Figure 0005182954

なお、優先度学習手段42は、RVP法以外に、RocSVM法を用いて優先度学習を行うこともできる。このRocSVM法の詳細は、例えば、文献「Xaioli Li,Bing Liu ,“Learning to Classify Texts Using Positive and Unlabeled Data”」に記載されている。   Note that the priority learning means 42 can also perform priority learning using the RocSVM method in addition to the RVP method. Details of the RocSVM method are described in, for example, the document “Xaioli Li, Bing Liu,“ Learning to Classify Texts Using Positive and Unlabeled Data ””.

空欄統計情報学習手段43は、記憶手段41のラベル付既存穴埋問題文情報412を参照し、系列ラベリングを用いて空欄統計情報414を生成して、記憶手段41に記憶させる。例えば、空欄統計情報学習手段43は、穴埋問題文における空欄を固有表現として扱い、IOB2フォーマットを用いて表現する。このIOB2フォーマットは、「I」タグ、「O」タグ及び「B」タグという3種類のタグが定義される。具体的には、空欄統計情報学習手段43は、系列(穴埋問題文)に含まれる単語が、空欄の先頭に位置する場合、「B」タグを付加する。また、空欄統計情報学習手段43は、空欄が複数の単語にわたる場合、2語目以降に位置する単語には、「I」タグを付加する。そして、空欄統計情報学習手段43は、空欄以外の単語、つまり、固有表現ではない単語には「O」タグを付加する。   The blank statistic information learning means 43 refers to the labeled existing burying question sentence information 412 in the storage means 41, generates blank statistic information 414 using series labeling, and stores it in the storage means 41. For example, the blank statistic information learning means 43 treats blanks in the burial problem sentence as unique expressions and expresses them using the IOB2 format. In this IOB2 format, three types of tags are defined: an “I” tag, an “O” tag, and a “B” tag. Specifically, the blank statistic information learning unit 43 adds a “B” tag when the word included in the series (filled question sentence) is located at the head of the blank. The blank statistical information learning means 43 adds an “I” tag to the words positioned after the second word when the blank spans a plurality of words. The blank statistical information learning unit 43 adds an “O” tag to words other than blanks, that is, words that are not unique expressions.

以下、「His doctor urged him to ( ) doing hard exercise.」という穴埋問題文と、この空欄の正解選択肢「give up」とを例に、IOB2フォーマットについて説明する。この例では、表1に示すように、空欄の先頭となる単語「give」に「B」タグが付加され、これに続く単語「up」に「I」タグが付加され、空欄に位置していない単語には「O」タグが付加されている。   In the following, the IOB2 format will be described with an example of the burial problem sentence “His doctor urged him to () doing hard exercise.” And the correct answer option “give up” in this blank. In this example, as shown in Table 1, a “B” tag is added to the first word “give” in the blank, and an “I” tag is added to the next word “up”, and the word “give” is positioned in the blank. An “O” tag is added to the missing word.

Figure 0005182954
Figure 0005182954

ここで、空欄統計情報学習手段43は、例えば、系列ラベリングとして、条件付き確率場を用いる。この場合、空欄統計情報学習手段43は、ラベル付既存穴埋問題文情報412に含まれる空欄に対応する1以上の単語の形態素を条件付き確率場によって学習し、空欄統計情報414を生成する。なお、条件付き確率場の詳細は、例えば、文献「John Lafferty,Andrew McCallum, and Fernando Pereira,“Conditional Random Fields:Probabilistic Models for Segmenting and Labeling Sequence Data”,Proc. of ICML 2001,(2001),pp.282-289.」に記載されている。   Here, the blank statistic information learning means 43 uses a conditional random field, for example, as series labeling. In this case, the blank statistic information learning unit 43 learns one or more word morphemes corresponding to the blank included in the labeled existing burial problem sentence information 412 using a conditional random field, and generates blank statistic information 414. The details of the conditional random field are described in, for example, the literature “John Lafferty, Andrew McCallum, and Fernando Pereira,“ Conditional Random Fields: Probabilistic Models for Segmenting and Labeling Sequence Data ”, Proc. Of ICML 2001, (2001), pp. .282-289. ".

また、空欄統計情報学習手段43は、系列ラベリングとして、特開2008−225907号公報に記載の発明を用いても良い。この場合、空欄統計情報学習手段43は、ラベルなしデータ(つまり、既存穴埋問題文情報411)を利用し、学習済み識別モデル用パラメータベクトル集合とモデル統合用パラメータ集合とを学習し、生成モデル用パラメータベクトル集合を決定する。また、この場合、空欄統計情報学習手段43は、ラベルありデータ(つまり、ラベル付既存穴埋問題文情報412)を利用し、識別モデル用パラメータベクトル集合と生成モデル用パラメータベクトル集合とを学習し、モデル統合用パラメータ集合を決定する。これによって、穴埋問題生成装置4は、低コストで系列ラベリングの予測性能を向上させることができる。なお、空欄統計情報学習手段43は、系列ラベリングとして、隠れマルコフモデル、又は、最大エントロピーマルコフモデルを用いても良い。   The blank statistical information learning means 43 may use the invention described in Japanese Patent Application Laid-Open No. 2008-225907 as sequence labeling. In this case, the blank statistic information learning unit 43 uses unlabeled data (that is, the existing burial problem sentence information 411), learns the learned identification model parameter vector set and the model integration parameter set, and generates the generated model. A parameter vector set is determined. In this case, the blank statistic information learning unit 43 learns the identification model parameter vector set and the generation model parameter vector set using the labeled data (that is, the labeled existing burying problem sentence information 412). Then, a parameter set for model integration is determined. Thereby, the hole filling problem generating device 4 can improve the prediction performance of the sequence labeling at a low cost. The blank statistical information learning means 43 may use a hidden Markov model or a maximum entropy Markov model as the sequence labeling.

統計パターン学習手段44は、記憶手段41のラベル付既存穴埋問題文情報412を参照し、既存穴埋問題文において空欄に置き換えられた1以上の単語の形態素と生成規則との対応関係を求めて統計パターン418を生成して、記憶手段41に記憶させる。第1実施形態では、統計パターン学習手段44は、既存穴埋問題における空欄に置き換えられた単語の形態素を、I類、II−活用語類、II−派生語類、II−接頭語・接尾語類又はII−関連語類の何れかの生成規則に対応させて、統計パターンを生成している。なお、生成規則及び誤選択肢候補の詳細は、後記する。   The statistical pattern learning unit 44 refers to the labeled existing burial problem sentence information 412 in the storage unit 41 and obtains the correspondence between the morphemes of one or more words replaced with blanks in the existing burial problem sentence and the generation rules. The statistical pattern 418 is generated and stored in the storage unit 41. In the first embodiment, the statistical pattern learning unit 44 converts the morphemes of the words replaced with blanks in the existing burial problem into Class I, II-utilized words, II-derived words, II-prefix / suffixes. The statistical pattern is generated in correspondence with the generation rule of either the class or the II-related class. Details of the generation rule and the wrong choice candidate will be described later.

形態素付加手段51は、学習者端末装置2(図2参照)から穴埋問題文候補が複数入力され、隠れマルコフモデル、条件付き確率場等の形態素解析によって、入力された穴埋問題文候補に含まれる単語に形態素を付加して品詞付けする。そして、形態素付加手段51は、これら穴埋問題文候補を問題文選択手段52に出力する。   The morpheme adding means 51 receives a plurality of burial problem sentence candidates from the learner terminal device 2 (see FIG. 2), and converts the candidate burial problem sentence into the inputted burying problem sentence candidates by morphological analysis such as a hidden Markov model and a conditional random field. Add morphemes to the included words and add parts of speech. Then, the morpheme adding means 51 outputs these burying question sentence candidates to the question sentence selecting means 52.

問題文選択手段52は、記憶手段41の優先度情報413を参照し、形態素付加手段51から入力された穴埋問題文候補毎に優先度を算出すると共に、優先度が高い順に穴埋問題文候補を選択する。具体的には、問題文選択手段52は、入力された穴埋問題文候補z(k=0,・・・,M)のそれぞれについて、優先度情報413のパラメータαijを用いて、優先度G(z)を算出する。ここで、優先度G(z)が高いほど、穴埋問題として適切な問題文と言える。そして、問題文選択手段52は、穴埋問題文候補zのそれぞれを、算出した優先度G(z)が高い順にランク付けを行い、優先度G(z)が高い順に穴埋問題文候補zを選択する。ここで、穴埋問題を生成する数(問題数)が予め設定されている場合、問題文選択手段52は、この問題数だけ穴埋問題文候補zを選択しても良い。さらに、問題文選択手段52は、選択した穴埋問題文候補zを空欄決定手段53に出力する。なお、優先度G(z)の算出方法としては、図7の優先度G(y)の算出式aを用いることができる。 The question sentence selection means 52 refers to the priority information 413 of the storage means 41, calculates the priority for each burying question sentence candidate input from the morpheme addition means 51, and fills the burial problem sentences in descending order of priority. Select a candidate. Specifically, the question sentence selection unit 52 uses the parameter α ij of the priority information 413 for each of the input burial problem sentence candidates z k (k = 0,..., M) to give priority. The degree G (z k ) is calculated. Here, it can be said that the higher the priority G (z k ), the more appropriate the problem sentence as a burial problem. The sentence selection unit 52 issues, each Anauma clue candidate z k, calculated performs priority G (z k) ranked in descending order, Anauma problems priority G (z k) in descending order A sentence candidate z k is selected. Here, when the number (number of questions) for generating the burial problem is set in advance, the question sentence selection unit 52 may select the burial problem sentence candidate z k by this number of problems. Further, the question sentence selection unit 52 outputs the selected burial problem sentence candidate z k to the blank space determination unit 53. As a method for calculating the priority G (z k ), the calculation formula a for the priority G (y) in FIG. 7 can be used.

空欄決定手段53は、記憶手段41の空欄統計情報414を参照し、問題文選択手段52が選択した穴埋問題文候補における空欄を決定する。ここで、空欄統計情報414は、既存穴埋問題において、単語の形態素が、「I」タグ、「O」タグ及び「B」タグのそれぞれになる確率、つまり、空欄となる確率を示している。ここで、「This is the building ( ) we had our first office.」という穴埋問題文の例を下記の表2に示す。なお、表2では、タグ種別の項目は、空欄決定手段53が判定したタグの種別とその周辺確率とを示す。また、表2では、Bタグ、Iタグ及びOタグの項目は、それぞれ、「I」タグ、「O」タグ及び「B」タグとなる周辺確率を示し、空欄統計情報414から求めることができる。   The blank determining unit 53 refers to the blank statistical information 414 in the storage unit 41 and determines a blank in the burial problem sentence candidate selected by the question sentence selecting unit 52. Here, the blank statistic information 414 indicates the probability that the morpheme of the word will be each of the “I” tag, the “O” tag, and the “B” tag, that is, the probability that the word morpheme will be blank. . Here, an example of the burial problem sentence “This is the building () we had our first office.” Is shown in Table 2 below. In Table 2, the tag type item indicates the tag type determined by the blank space determination unit 53 and its peripheral probability. Also, in Table 2, the B tag, I tag, and O tag items indicate the peripheral probabilities of being the “I” tag, the “O” tag, and the “B” tag, respectively, and can be obtained from the blank statistical information 414. .

Figure 0005182954
Figure 0005182954

空欄決定手段53は、穴埋問題文候補に含まれる単語について、「I」タグ、「O」タグ及び「B」タグのうち最も周辺確率が高いものを、その形態素のタグと判定する。ここでは、表2に示すように、空欄決定手段53は、単語「This」や単語「is」を「O」タグと判定し、単語「where」を「B」タグ、つまり、空欄と判定する。ここで、空欄決定手段53は、穴埋問題文候補に含まれる全ての単語を「O」タグと判定した場合、それらの中で「B」タグとなる周辺確率が最も高い単語を空欄としても良い。その後、空欄決定手段53は、「B」タグと判定した単語を空欄に置き換えた穴埋問題文と、その単語を正解選択肢として、誤選択肢生成手段54に出力する。   The blank determination unit 53 determines the word having the highest peripheral probability among the “I” tag, the “O” tag, and the “B” tag among the words included in the burial problem sentence candidate as the tag of the morpheme. Here, as shown in Table 2, the blank determining means 53 determines the word “This” or the word “is” as an “O” tag, and determines the word “where” as a “B” tag, that is, a blank. . Here, when the blank determination unit 53 determines that all the words included in the burial problem sentence candidate are “O” tags, the word having the highest peripheral probability of being a “B” tag is set as a blank. good. Thereafter, the blank determination unit 53 outputs the burial problem sentence in which the word determined to be the “B” tag is replaced with a blank, and the word as the correct choice to the wrong choice generation unit 54.

誤選択肢生成手段54は、図6に示すように、誤選択肢候補生成手段54aと、誤選択肢選択手段54bとを備える。   As shown in FIG. 6, the erroneous option generation unit 54 includes an erroneous option candidate generation unit 54a and an erroneous option selection unit 54b.

誤選択肢候補生成手段54aは、記憶手段41の統計パターン418を参照して、空欄決定手段53から入力された穴埋問題文において空欄に置き換えられた単語(つまり、正解選択肢の単語)の形態素に対応した生成規則を判定する。そして、誤選択肢候補生成手段54aは、この生成規則を用いて、誤選択肢候補を生成する。ここでは、生成規則を、例えば、I類、II−活用語類、II−派生語類、II−接頭語・接尾語類、又は、II−関連語類に分類している。以下、生成規則及び誤選択肢候補の具体例を説明する。   The erroneous option candidate generation unit 54a refers to the statistical pattern 418 of the storage unit 41, and uses the morpheme of the word (that is, the correct option word) that is replaced with a blank in the burial problem sentence input from the blank determination unit 53. Determine the corresponding production rule. Then, the erroneous option candidate generation unit 54a generates erroneous option candidates using the generation rule. Here, the generation rules are classified into, for example, class I, class II-used words, class II-derived words, class II-prefix / suffix, or class II-related words. Hereinafter, specific examples of generation rules and erroneous option candidates will be described.

<生成規則及び誤選択肢候補の具体例>
まず、空欄に置き換えられた単語の形態素に基づいて、生成規則を、I類とII類とに大分類する。I類は、誤選択肢として出現する単語の種類が限られているものである。具体的には、I類は、空欄に置き換えられた単語の形態素が「前置詞」、「従位接続詞」、「疑問詞」、「等位接続詞」、又は、「助動詞」の何れかである。例えば、空欄に置き換えられた単語の形態素が「疑問詞」の場合、その誤選択肢は、「which」、「what」、「who」、「when」、「where」等の単語となる。
<Specific examples of generation rules and wrong choice candidates>
First, based on the morphemes of the words replaced with blanks, the generation rules are broadly classified into class I and class II. Class I is limited in the types of words that appear as erroneous choices. Specifically, in class I, the morpheme of the word replaced with a blank is either “preposition”, “subordinate conjunction”, “question”, “equal conjunction”, or “auxiliary verb”. For example, when the morpheme of the word replaced with a blank is “question word”, the wrong option is a word such as “which”, “what”, “who”, “when”, “where”.

例えば、既存穴埋問題において、「疑問詞」が空欄に置き換えられた穴埋問題での形態素の種類の割合を表3に示す。また、例えば、既存穴埋問題において、「疑問詞」が空欄となった問題での「疑問詞」の単語の頻出度を表4に示し、「疑問詞」以外の単語の頻出度を表5に示す。表3〜表5に示すように、I類では、誤選択肢候補生成手段54aは、誤選択肢として出現する形態素の種類の割合と、空欄に置き換えられた単語の頻出度とに基づいて、誤選択肢候補を生成できる。つまり、I類では、誤選択肢候補生成手段54aは、空欄に置き換えられた単語と同一の品詞で頻出度が高いものを誤選択肢候補とする。   For example, in the existing burying problem, Table 3 shows the ratio of morpheme types in the burying problem in which “question word” is replaced with a blank. Further, for example, in the existing burial problem, the frequency of the word “question” in the question where “question” is blank is shown in Table 4, and the frequency of words other than “question” is shown in Table 5. Shown in As shown in Tables 3 to 5, in Class I, the wrong choice candidate generation unit 54a determines the wrong choice based on the ratio of the types of morphemes that appear as wrong choices and the frequency of words replaced with blanks. Can generate candidates. That is, in class I, the wrong choice candidate generation unit 54a sets the same part of speech as the word replaced with a blank and a high frequency of occurrence as the wrong choice candidate.

Figure 0005182954
Figure 0005182954

Figure 0005182954
Figure 0005182954

Figure 0005182954
Figure 0005182954

II類は、選択肢間に特定のパターンが存在するものである。具体的には、II類は、空欄に置き換えられた単語の形態素が「動詞」、「名詞」、「形容詞」、又は、「副詞」の何れかである。ここでは、このII類を、さらに、II−活用語類、II−派生語類、II−接頭語・接尾語類及びII−関連語類に小分類した。   Class II has a specific pattern between options. Specifically, in class II, the morpheme of the word replaced with a blank is either “verb”, “noun”, “adjective”, or “adverb”. Here, this class II is further subdivided into class II-utilization, class II-derivative, class II-prefix / suffix and class II-related.

II−活用語類は、誤選択肢が、正解選択肢となる単語の活用語で構成されているものである。例えば、II−活用語類は、正解選択肢が「ask」であるとき、誤選択肢が「asked」、「asking」、「asks」等の活用語の場合である。この場合、誤選択肢候補生成手段54aは、記憶手段41の活用語リスト417を参照し、誤選択肢候補を生成する。   The II-used word class is composed of the used words of words whose erroneous choices become correct answer choices. For example, the II-used word class is a case where the correct answer option is “ask” and the wrong option is a used word such as “asked”, “asking”, “asks”, and the like. In this case, the wrong choice candidate generation unit 54a refers to the utilization word list 417 in the storage unit 41 and generates a wrong choice candidate.

II−派生語類は、誤選択肢が、正解選択肢となる単語の派生語で構成されているものである。例えば、II−派生語類は、正解選択肢が「work」であるとき、誤選択肢が「worker」、「works」、「working」等の派生語の場合である。この場合、誤選択肢候補生成手段54aは、記憶手段41の単語辞書416を参照し、正解選択肢となる単語の前方から75%の文字列を含む単語を取得する。そして、誤選択肢候補生成手段54aは、正解選択肢となる単語に対してレーベンシュタイン距離が小さい順に、単語辞書416から取得した単語を誤選択肢候補とする。なお、レーベンシュタイン距離とは、正解選択肢となる単語に対して誤選択肢となる単語がどの程度異なっているかを示す数値であり、例えば、動的計画法(DPマッチング法)によって求めることができる。   The II-derived word class is composed of a derivation word of a word in which an erroneous option is a correct answer option. For example, the II-derivative term is a case where the correct choice is “work” and the wrong choice is a derivative word such as “worker”, “works”, and “working”. In this case, the wrong choice candidate generation unit 54a refers to the word dictionary 416 of the storage unit 41, and acquires a word including a character string of 75% from the front of the word that is the correct answer option. Then, the wrong choice candidate generation unit 54a sets the words acquired from the word dictionary 416 in the order of the Levenshtein distance from the word that is the correct choice as the wrong choice candidate. Note that the Levenshtein distance is a numerical value indicating how much a word that is an incorrect option differs from a word that is a correct option, and can be obtained by, for example, dynamic programming (DP matching method).

II−接頭語・接尾語類は、誤選択肢となる単語の一部(接頭語や接尾語)が、正解選択肢となる単語と共通しているものである。具体的には、II−接頭語・接尾語類は、正解選択肢が「circulation」であるとき、誤選択肢が「circumcision」、「circus」、「circumstance」の場合である。この場合、誤選択肢候補生成手段54aは、記憶手段41の単語辞書416を参照し、接頭語の場合、正解選択肢となる単語と第1音節が一致する単語を取得し、接尾語の場合、正解選択肢となる単語と最終音節が一致する単語を取得する。そして、誤選択肢候補生成手段54aは、正解選択肢となる単語に対してレーベンシュタイン距離が小さい順に、単語辞書416から取得した単語を誤選択肢候補とする。   The II-prefix / suffix class is such that a part of a word (prefix or suffix) that becomes an incorrect option is common to a word that becomes a correct option. Specifically, the II-prefix / suffix class is when the correct answer option is “circulation” and the incorrect option is “circuitcumulation”, “circucus”, and “circucumstance”. In this case, the incorrect option candidate generation unit 54a refers to the word dictionary 416 of the storage unit 41, acquires a word that matches the first syllable with the word that is the correct option in the case of a prefix, and correct in the case of a suffix. Get a word whose final syllable matches the word to be selected. Then, the wrong choice candidate generation unit 54a sets the words acquired from the word dictionary 416 in the order of the Levenshtein distance from the word that is the correct choice as the wrong choice candidate.

なお、II−派生語類では、誤選択肢となる単語が、正解選択肢となる単語に対し、意味的な関連を持つことが多い。一方、II−接頭語・接尾語類では、誤選択肢となる単語が、正解選択肢となる単語に対し、意味的な関連が無いことが多い。   In II-derivatives, words that are erroneous choices often have a semantic relationship with words that are correct choices. On the other hand, in the II-prefix / suffix, a word that is an incorrect option often has no semantic relationship with a word that is a correct answer option.

II−関連語類は、誤選択肢となる単語が、正解選択肢となる単語の類義語又は反義語で構成されるものである。例えば、II−関連語類は、正解選択肢が「car」であるとき、誤選択肢が「automobile」、「vehicle」、「buggy」等の類義語の場合である。この場合、誤選択肢候補生成手段54aは、記憶手段41の類語辞書415を参照し、正解選択肢となる単語に対応する類義語及び/又は反義語を誤選択肢候補として取得する。   II-related words are those in which a word that is an incorrect option is a synonym or antonym of the word that is the correct option. For example, the II-related term is a case where when the correct answer option is “car”, the wrong option is a synonym such as “automobile”, “vehicle”, and “buggy”. In this case, the wrong option candidate generation unit 54a refers to the synonym dictionary 415 of the storage unit 41, and acquires the synonym and / or antonym corresponding to the word that is the correct answer option as the wrong option candidate.

既存穴埋問題として、TOEIC(登録商標)における、空欄に置き換えた単語の形態素が「動詞」である77問について、その生成規則の統計を下記の表6に示す。表6より、正解選択肢となる単語の形態素が「動詞」である場合、62%の確率でII−活用語類となっている。   As an existing burial problem, statistics of generation rules are shown in Table 6 below for 77 questions whose word morpheme is “verb” in TOEIC (registered trademark). From Table 6, when the morpheme of the word that is the correct answer option is “verb”, it is a II-utilized word class with a probability of 62%.

Figure 0005182954
Figure 0005182954

誤選択肢選択手段54bは、誤選択肢候補生成手段54aが生成した誤選択肢候補毎に、空欄決定手段53からの穴埋問題文の空欄にこの誤選択肢候補を挿入した検索文でインターネット検索を行う。インターネット上には、意味的・文法的に正しい文章も、正しくない文章も存在する。そこで、インターネット検索に失敗した文章(検索文)は、誰も書かない文章であり、意味的・文法的に正しい文章でないと考えられる。従って、誤選択肢選択手段54bは、インターネット検索に失敗した検索文における誤選択肢候補のみを誤選択肢とする。   The erroneous option selection unit 54b performs an Internet search for each erroneous option candidate generated by the erroneous option candidate generation unit 54a using a search sentence in which the erroneous option candidate is inserted in the blank of the burial problem sentence from the blank determination unit 53. There are both semantically and grammatically correct and incorrect sentences on the Internet. Therefore, it is considered that the sentence (search sentence) that failed in the Internet search is a sentence that no one writes and is not a semantically or grammatically correct sentence. Therefore, the wrong choice selection means 54b sets only the wrong choice candidates in the search sentence that failed in the Internet search as the wrong choice.

ここでは、I類、II−派生語類、II−接頭語・接尾語類又はII−関連語類の何れかの場合、誤選択肢選択手段54bは、前記したインターネット検索による誤選択肢の選択を行うこととした。また、II−活用語類の場合、正解選択肢と誤選択肢候補と文法的な関係を考慮し、その誤選択肢候補となる単語を穴埋問題文の空欄に挿入した文章が文法的に正しい可能性がある。従って、誤選択肢選択手段54bは、正解選択肢となる単語の形態素と、誤選択肢候補となる単語との形態素とが一致する場合、その誤選択肢候補を選択しない。その後、誤選択肢選択手段54bは、穴埋問題文と、正解選択肢と、選択した誤選択肢との組み合わせを、穴埋問題として出力する。   Here, in the case of any one of class I, II-derivatives, II-prefix / suffix, or II-related words, the erroneous option selection unit 54b selects the erroneous option by the above-described Internet search. It was decided. Also, in the case of II-used words, there is a possibility that a sentence in which a word that is a candidate for an incorrect option is inserted into a blank of a burial problem sentence is grammatically correct in consideration of a grammatical relationship between a correct answer option and an incorrect option candidate. There is. Therefore, if the morpheme of the word that becomes the correct option matches the morpheme of the word that becomes the error option candidate, the error option selection unit 54b does not select the error option candidate. Thereafter, the wrong option selection means 54b outputs a combination of the burial problem sentence, the correct answer option, and the selected wrong option as a burial problem.

以上、穴埋問題生成装置4を独立した装置として説明したが、本発明は、一般的なコンピュータを、穴埋問題生成装置4の各手段として動作させるための穴埋問題生成プログラムによっても実現できる。ここで、図8に示すように、コンピュータ9は、演算手段91と、ハードディスク等の記憶手段92と、マウス、キーボード等の入力手段93と、ディスプレイ等の出力手段94とを備える。そして、この穴埋問題生成プログラムをインストールされたコンピュータ9は、そのハードウェア資源を、優先度学習手段42、空欄統計情報学習手段43、統計パターン学習手段44、形態素付加手段51、問題文選択手段52、空欄決定手段53、誤選択肢候補生成手段54a、及び、誤選択肢選択手段54bとして協調動作させる。なお、この穴埋問題生成プログラムは、通信回線を介して配布しても良く、CD−ROMやフラッシュメモリ等の記録媒体に書き込んで配布しても良い。   As described above, the burying problem generation device 4 has been described as an independent device. However, the present invention can also be realized by a burying problem generation program for operating a general computer as each unit of the burying problem generation device 4. . Here, as shown in FIG. 8, the computer 9 includes calculation means 91, storage means 92 such as a hard disk, input means 93 such as a mouse and keyboard, and output means 94 such as a display. Then, the computer 9 in which the burial problem generating program is installed has its hardware resources as priority learning means 42, blank statistical information learning means 43, statistical pattern learning means 44, morpheme adding means 51, question sentence selecting means. 52, blank space determining means 53, erroneous option candidate generating means 54a, and erroneous option selecting means 54b are operated in cooperation. The burial problem generation program may be distributed via a communication line or may be distributed by writing in a recording medium such as a CD-ROM or a flash memory.

[穴埋問題生成装置の動作]
以下、図9を参照して、図6の穴埋問題生成装置4の動作を説明する(適宜図6参照)。なお、図9では、記憶手段41に、既存穴埋問題文情報411と、ラベル付既存穴埋問題文情報412と、優先度情報413と、空欄統計情報414と、類語辞書415と、単語辞書416と、活用語リスト417と、統計パターン418とが予め記憶されていることとして説明する。
[Operation of the hole filling problem generator]
Hereinafter, the operation of the burial problem generating apparatus 4 in FIG. 6 will be described with reference to FIG. 9 (see FIG. 6 as appropriate). In FIG. 9, the storage unit 41 stores the existing burial problem sentence information 411, the labeled existing burial problem sentence information 412, the priority information 413, the blank space statistical information 414, the synonym dictionary 415, and the word dictionary. A description will be given on the assumption that 416, a utilization word list 417, and a statistical pattern 418 are stored in advance.

まず、穴埋問題生成装置4は、形態素付加手段51によって、学習者端末装置2(図2参照)から穴埋問題文候補が複数入力され、隠れマルコフモデル、条件付き確率場等の形態素解析によって、入力された穴埋問題文候補に含まれる単語に形態素を付加して品詞付けする。そして、穴埋問題生成装置4は、形態素付加手段51によって、これら穴埋問題文候補を出力する(ステップS1)。   First, the burial problem generating device 4 receives a plurality of burial problem sentence candidates from the learner terminal device 2 (see FIG. 2) by the morpheme adding means 51, and performs morphological analysis such as a hidden Markov model and a conditional random field. Then, morphemes are added to the words included in the input burial problem sentence candidates to give part of speech. Then, the burial problem generating device 4 outputs these burial problem sentence candidates by the morpheme adding means 51 (step S1).

ステップS1の処理に続いて、穴埋問題生成装置4は、問題文選択手段52によって、記憶手段41の優先度情報413を参照し、ステップS1で出力した穴埋問題文候補毎に優先度を算出すると共に、優先度が高い順に穴埋問題文候補を選択する。そして、穴埋問題生成装置4は、問題文選択手段52によって、選択した穴埋問題文候補を出力する(ステップS2)。   Subsequent to the processing of step S1, the burial problem generating device 4 refers to the priority information 413 of the storage means 41 by the question sentence selection means 52, and sets the priority for each burying question sentence candidate output in step S1. While calculating, the burial problem candidate is selected in descending order of priority. Then, the burial problem generation device 4 outputs the selected burial problem sentence candidate by the question sentence selection means 52 (step S2).

ステップS2の処理に続いて、穴埋問題生成装置4は、空欄決定手段53によって、記憶手段41の空欄統計情報414を参照し、ステップS2で選択した穴埋問題文候補における空欄を決定する。そして、穴埋問題生成装置4は、空欄決定手段53によって、空欄を含む穴埋問題文と、空欄に置き換えた1以上の単語を正解選択肢として、出力する(ステップS3)。   Subsequent to the processing in step S2, the burial problem generating device 4 refers to the blank statistic information 414 in the storage means 41 by the blank determining means 53, and determines a blank in the burial problem sentence candidate selected in step S2. Then, the burial problem generating apparatus 4 outputs, as the correct choice, the burial problem sentence including the blank and one or more words replaced with the blank by the blank determination unit 53 (step S3).

ステップS3の処理に続いて、穴埋問題生成装置4は、誤選択肢候補生成手段54aによって、記憶手段41の統計パターン418を参照して、ステップS3で空欄に置き換えられた1以上の単語の形態素に対応した生成規則を判定する。そして、穴埋問題生成装置4は、誤選択肢候補生成手段54aによって、この生成規則を用いて誤選択肢候補を生成し、これを出力する(ステップS4)。   Subsequent to the processing in step S3, the burial problem generating device 4 refers to the statistical pattern 418 in the storage unit 41 by the erroneous option candidate generation unit 54a, and the morphemes of one or more words replaced in the blank in step S3. The generation rule corresponding to is determined. Then, the burial problem generating device 4 generates an erroneous option candidate using the generation rule by the erroneous option candidate generating unit 54a, and outputs it (step S4).

ステップS4の処理に続いて、穴埋問題生成装置4は、誤選択肢選択手段54bによって、ステップS4で生成した誤選択肢候補毎に、空欄決定手段53からの穴埋問題文の空欄にこの誤選択肢候補を挿入した検索文でインターネット検索を行う。そして、穴埋問題生成装置4は、誤選択肢選択手段54bによって、インターネット検索に失敗した検索文における誤選択肢候補のみを誤選択肢とする。このとき、穴埋問題生成装置4は、誤選択肢選択手段54bによって、正解選択肢となる単語の形態素と、誤選択肢候補となる単語との形態素とが一致する場合、その誤選択肢候補を選択しなくとも良い(ステップS5)。   Subsequent to the processing in step S4, the burial problem generating device 4 uses the erroneous option selection unit 54b to enter the erroneous option in the blank of the burial problem sentence from the blank determination unit 53 for each erroneous option candidate generated in step S4. Perform an Internet search using the search text with the candidate inserted. Then, the burial problem generating device 4 uses the erroneous option selection unit 54b as an erroneous option only for the erroneous option candidate in the search sentence that failed in the Internet search. At this time, if the morpheme of the word that is the correct answer matches the morpheme of the word that is the incorrect option candidate by the incorrect option selection unit 54b, the burial problem generating device 4 does not select the incorrect option candidate. It may be good (step S5).

ステップS5の処理に続いて、穴埋問題生成装置4は、誤選択肢選択手段54bによって、穴埋問題文と、正解選択肢と、ステップS5で選択した誤選択肢との組み合わせを、穴埋問題として出力する(ステップS6)。   Subsequent to the process of step S5, the burial problem generating device 4 outputs a combination of the burial problem sentence, the correct option, and the erroneous option selected in step S5 as a burial problem by the erroneous option selection unit 54b. (Step S6).

以上のように、本発明の第1実施形態に係る穴埋問題生成装置4によれば、穴埋問題として不適切な文章を穴埋問題文として選択することを少なくでき、穴埋問題文における空欄となる単語の偏りを少なくでき、さらに、意味的・文法的に誤りとなる誤選択肢候補のみを誤選択肢として選択できる。従って、本発明の第1実施形態に係る穴埋問題生成装置4によれば、専門家の経験的な知識を反映させて、個別学習に適した穴埋問題を生成できる。   As described above, according to the burial problem generation device 4 according to the first embodiment of the present invention, it is possible to reduce selection of an inappropriate sentence as a burial problem as a burial problem sentence. The bias of the blank word can be reduced, and only the wrong choice candidates that are semantically and grammatically incorrect can be selected as wrong choices. Therefore, according to the burial problem generating device 4 according to the first embodiment of the present invention, it is possible to generate a burial problem suitable for individual learning by reflecting empirical knowledge of experts.

また、本発明の第1実施形態に係る穴埋問題生成装置4によれば、形態素付加手段51を備えることで、学習者自身で穴埋問題文候補に形態素を付加する必要がなくなり、学習者にとって利便性が良い。なお、本発明では、形態素を付加した穴埋問題文候補が入力されるのであれば、形態素付加手段51を備えなくとも良い。   Moreover, according to the burial problem generating device 4 according to the first embodiment of the present invention, the morpheme adding means 51 is provided, so that it is not necessary for the learner to add morphemes to the burial problem sentence candidates. Convenience is good for. In the present invention, the morpheme adding means 51 may not be provided as long as candidate burial problem sentences to which morphemes are added are input.

また、本発明の第1実施形態では、英語の穴埋問題を生成する例で説明したが、本発明の対象は、英語に限定されない。例えば、本発明は、仏語、独語、日本語等の英語以外の言語の穴埋問題を生成できる。   Moreover, although 1st Embodiment of this invention demonstrated by the example which produces | generates an English hole filling problem, the object of this invention is not limited to English. For example, the present invention can generate a burial problem in languages other than English, such as French, German, and Japanese.

(実施例1)
図6の穴埋問題生成装置4による、RVP法での優先度学習を評価した。この実施例1では、TOEIC(登録商標)における穴埋問題1560文章を正例とし、新聞記事から抽出した同数の文章を1560文章を穴埋問題文候補とし、10重交差検定によって評価した。具体的には、穴埋問題生成装置4に、正例と穴埋問題文候補とを1404文章(9/10)ずつ訓練集合として優先度学習させた。そして、正例と穴埋問題文候補との残り156文章(1/10)をテスト集合として優先度学習させた。この作業を10通り実施した結果を下記の表7に示す。
Example 1
The priority learning by the RVP method by the burial problem generating device 4 in FIG. 6 was evaluated. In this Example 1, 1560 sentences of the burial problem in TOEIC (registered trademark) were taken as positive examples, and the same number of sentences extracted from newspaper articles were evaluated as 1060 burial problem sentence candidates by 10-fold cross validation. Specifically, the burial problem generating apparatus 4 was made to learn the priority and the burial problem sentence candidate as a training set by each of 1404 sentences (9/10). Then, the remaining 156 sentences (1/10) of the positive example and the burial problem sentence candidate were subjected to priority learning as a test set. Table 7 below shows the results of performing this operation in 10 ways.

Figure 0005182954
Figure 0005182954

この表7では、上位半分に含まれる正例、すなわち、156位以上に順位付けされた候補の割合の平均を表している。正例に頻繁に出現した単語や形態素から構成される英文が上位に順位付けされ、文法的な間違いを含む英文、会話文、口語的な表現を含む英文が下位に順位付けされた。以上のように、穴埋問題生成装置4は、適切な穴埋問題を選択できることがわかった。   In Table 7, the positive examples included in the upper half, that is, the average of the ratios of candidates ranked in the 156th or higher rank are shown. English sentences composed of words and morphemes that frequently appear in positive examples were ranked higher, and English sentences containing grammatical errors, conversational sentences, and English sentences containing colloquial expressions were ranked lower. As described above, it has been found that the burying problem generating apparatus 4 can select an appropriate burying problem.

(実施例2)
図6の穴埋問題生成装置4による、条件付き確率場による空欄の決定を評価した。この実施例2では、既存穴埋問題を用いて、条件付き確率場によって決定した空欄と、既存穴埋問題での元々の空欄とを比較した。具体的には、TOEIC(登録商標)における穴埋問題1560文章に対して、実施例1と同様に10重交差検定を実施した(つまり、1404文章(9/10)を訓練集合、156文章(1/10)をテスト集合)。そして、以下の2つの比較手法と、図6の穴埋問題生成装置4の手法(本発明の手法)とを比較した。
(Example 2)
Evaluation of blank determination by a conditional random field by the burial problem generator 4 of FIG. 6 was evaluated. In Example 2, using the existing filling problem, the blank determined by the conditional random field was compared with the original blank in the existing filling problem. Specifically, a 10-fold cross-validation was performed on the hole filling problem 1560 sentences in TOEIC (registered trademark) in the same manner as in Example 1 (that is, 1404 sentences (9/10) were trained as 156 sentences ( 1/10) test set). Then, the following two comparison methods were compared with the method (method of the present invention) of the burial problem generating device 4 in FIG.

<比較手法1:英文の一番左にある動詞を空欄にする手法>
この比較手法1は、英文の最初に出現する動詞を空欄として決定する手法である。ここで、TOEIC(登録商標)における穴埋問題1560文章に対して適用した。
<Comparison method 1: Method to leave the leftmost verb in English blank>
This comparison method 1 is a method for determining a verb appearing at the beginning of an English sentence as a blank. Here, it applied to the clogging problem 1560 sentences in TOEIC (registered trademark).

<比較手法2:空欄の頻出度が最も高い形態素を空欄にする手法>
この比較手法2は、訓練集合の形態素の数と出現順とを計測し、最も頻出度の高い形態素を空欄にする形態素とする手法である。ここで、空欄にする形態素とその出現順とに基づいて、テスト集合の英文で空欄を決定した。
<Comparison method 2: Method of making the morpheme with the highest frequency of blanks blank>
This comparison method 2 is a method of measuring the number of morphemes in the training set and the order of appearance, and setting the morpheme having the highest frequency as a blank morpheme. Here, blanks were determined in English from the test set based on the morphemes to be left blank and the order of their appearance.

下記の表8に、比較手法1と、比較手法2と、本発明の手法との結果を示した。表8では、一致率の項目は、既存穴埋問題での元々の空欄と、各手法で決定した空欄との一致率(つまり、精度)を示す。   Table 8 below shows the results of the comparison method 1, the comparison method 2, and the method of the present invention. In Table 8, the item of matching rate indicates the matching rate (that is, accuracy) between the original blank in the existing hole filling problem and the blank determined by each method.

Figure 0005182954
Figure 0005182954

表8に示すように、本発明の手法は、比較手法1や比較手法2に比べて一致率が高く、様々な形態素に対応する単語を空欄として決定でき、かつ、複数の単語を空欄として決定できる。従って、本発明の手法は、比較手法1,2と比べて、適切であると言える。   As shown in Table 8, the method of the present invention has a higher matching rate than the comparison method 1 and the comparison method 2, can determine words corresponding to various morphemes as blanks, and determines a plurality of words as blanks. it can. Therefore, it can be said that the method of the present invention is more appropriate than the comparative methods 1 and 2.

1 個別学習システム
2 学習者端末装置
3 個別学習装置
31 問題入力画面提示手段
32 穴埋問題文候補取得手段
33 学習画面提示手段
4 穴埋問題生成装置
41 記憶手段
42 優先度学習手段
43 空欄統計情報学習手段
44 統計パターン学習手段
51 形態素付加手段
52 問題文選択手段
53 空欄決定手段
54 誤選択肢生成手段
54a 誤選択肢候補生成手段
54b 誤選択肢選択手段
9 コンピュータ
91 演算手段
92 記憶手段
93 入力手段
94 出力手段
DESCRIPTION OF SYMBOLS 1 Individual learning system 2 Learner terminal device 3 Individual learning apparatus 31 Problem input screen presentation means 32 Cavity question sentence candidate acquisition means 33 Learning screen presentation means 4 Cavity problem generation apparatus 41 Storage means 42 Priority learning means 43 Blank statistical information Learning means 44 Statistical pattern learning means 51 Morphological addition means 52 Problem sentence selection means 53 Blank determination means 54 Error option generation means 54a Error option candidate generation means 54b Error option selection means 9 Computer 91 Calculation means 92 Storage means 93 Input means 94 Output means

Claims (4)

外部から入力された穴埋問題文候補に含まれる1以上の単語を空欄に置き換えた穴埋問題文と、前記空欄に置き換えた前記1以上の単語である正解選択肢と、当該正解選択肢と異なる選択肢である誤選択肢とで構成される穴埋問題を生成する穴埋問題生成装置において、
形態素が付加された前記穴埋問題文候補が複数入力され、優先度学習により予め学習した優先度情報に基づいて、前記穴埋問題文候補毎に優先度を算出すると共に、当該優先度が高い順に前記穴埋問題文候補を選択する問題文選択手段と、
前記穴埋問題文候補に含まれる前記単語を系列として扱う系列ラベリングにより予め学習した空欄統計情報に基づいて、前記問題文選択手段が選択した前記穴埋問題文候補における前記空欄を決定する空欄決定手段と、
前記誤選択肢の候補である誤選択肢候補を生成する生成規則が予め設定され、当該生成規則に基づいて、前記空欄決定手段が決定した前記空欄に対応する前記誤選択肢候補を生成する誤選択肢候補生成手段と、
前記誤選択肢候補毎に、当該誤選択肢候補を前記穴埋問題文の前記空欄に挿入した検索文でインターネット検索を行い、前記インターネット検索に失敗した前記検索文における前記誤選択肢候補を前記誤選択肢として選択して、前記穴埋問題を出力する誤選択肢選択手段と、
を備えることを特徴とする穴埋問題生成装置。
An underfill problem sentence in which one or more words included in a candidate for an underfill problem sentence input from the outside are replaced with blanks, a correct answer option that is the one or more words replaced with blanks, and an option different from the correct answer option In a burial problem generator for generating a burial problem composed of wrong choices,
A plurality of the burial problem sentence candidates to which morphemes are added are input, and a priority is calculated for each burial problem sentence candidate based on priority information learned in advance by priority learning, and the priority is high. A question sentence selecting means for selecting candidate burial problem sentences in order;
A blank determination for determining the blank in the burial problem sentence candidate selected by the question sentence selection means based on blank statistic information learned in advance by series labeling that treats the word included in the burial problem sentence candidate as a series. Means,
A generation rule for generating an incorrect option candidate that is a candidate for the incorrect option is preset, and an incorrect option candidate generation for generating the incorrect option candidate corresponding to the blank determined by the blank determination unit based on the generation rule Means,
For each of the erroneous option candidates, an Internet search is performed using a search sentence in which the incorrect option candidate is inserted into the blank of the burial problem sentence, and the erroneous option candidate in the search sentence that has failed in the Internet search is used as the erroneous option. And selecting an erroneous option selection means for outputting the hole filling problem,
A burial problem generating apparatus comprising:
既に作成された前記穴埋問題において前記空欄に置き換えられた前記1以上の単語の形態素と前記生成規則との対応関係を示す統計パターンを記憶する記憶手段をさらに備え、
前記誤選択肢候補生成手段は、前記統計パターンを参照して、前記穴埋問題文において前記空欄に置き換えられた前記1以上の単語の形態素に対応した前記生成規則を用いて前記誤選択肢候補を生成することを特徴とする請求項1に記載の穴埋問題生成装置。
A storage means for storing a statistical pattern indicating a correspondence relationship between the generation rule and the morpheme of the one or more words that have been replaced with the blank in the burial problem that has already been created;
The erroneous option candidate generation unit generates the erroneous option candidate using the generation rule corresponding to the morpheme of the one or more words replaced with the blank in the burial problem sentence with reference to the statistical pattern. The hole filling problem generating apparatus according to claim 1, wherein:
前記外部から前記穴埋問題文候補が複数入力され、入力された当該穴埋問題文候補を形態素解析すると共に、形態素を付加した前記穴埋問題文候補を前記問題文選択手段に出力する形態素付加手段をさらに備えることを特徴とする請求項1又は請求項2に記載の穴埋問題生成装置。   A plurality of the burial problem sentence candidates are inputted from the outside, and the inputted burial problem sentence candidates are subjected to morphological analysis, and the morpheme addition is performed to output the burial problem sentence candidates to which the morphemes are added to the question sentence selecting means The hole filling problem generating apparatus according to claim 1, further comprising means. コンピュータを、請求項1から請求項3の何れか一項に記載の穴埋問題生成装置の各手段として動作させるための穴埋問題生成プログラム。   A burial problem generation program for causing a computer to operate as each means of the burial problem generation apparatus according to any one of claims 1 to 3.
JP2009163291A 2009-07-10 2009-07-10 Cavity problem generator and program thereof Expired - Fee Related JP5182954B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009163291A JP5182954B2 (en) 2009-07-10 2009-07-10 Cavity problem generator and program thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009163291A JP5182954B2 (en) 2009-07-10 2009-07-10 Cavity problem generator and program thereof

Publications (2)

Publication Number Publication Date
JP2011017947A JP2011017947A (en) 2011-01-27
JP5182954B2 true JP5182954B2 (en) 2013-04-17

Family

ID=43595770

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009163291A Expired - Fee Related JP5182954B2 (en) 2009-07-10 2009-07-10 Cavity problem generator and program thereof

Country Status (1)

Country Link
JP (1) JP5182954B2 (en)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0830598A (en) * 1994-07-14 1996-02-02 Matsushita Electric Ind Co Ltd Support device for learning or document preparation
JP4018673B2 (en) * 2004-07-29 2007-12-05 株式会社国際電気通信基礎技術研究所 Multiple choice language test question automatic creation program
JP4827163B2 (en) * 2004-10-27 2011-11-30 Kddi株式会社 Test question distribution system
JP5230927B2 (en) * 2006-11-22 2013-07-10 ヤフー株式会社 Problem automatic creation apparatus, problem automatic creation method, and computer program
JP4904184B2 (en) * 2007-03-20 2012-03-28 富士通株式会社 Learning support device, learning support method and program thereof

Also Published As

Publication number Publication date
JP2011017947A (en) 2011-01-27

Similar Documents

Publication Publication Date Title
KR101678787B1 (en) Method for automatic question-answering and apparatus therefor
US9342499B2 (en) Round-trip translation for automated grammatical error correction
US10713571B2 (en) Displaying quality of question being asked a question answering system
US9959776B1 (en) System and method for automated scoring of texual responses to picture-based items
US9390087B1 (en) System and method for response generation using linguistic information
US20110184723A1 (en) Phonetic suggestion engine
KR101573854B1 (en) Method and system for statistical context-sensitive spelling correction using probability estimation based on relational words
WO2012039686A1 (en) Methods and systems for automated text correction
EP1644796A2 (en) Method and apparatus for language processing
CN104850543A (en) Voice conversation support apparatus and voice conversation support method
KR102552811B1 (en) System for providing cloud based grammar checker service
Riza et al. Question generator system of sentence completion in TOEFL using NLP and k-nearest neighbor
JP7279099B2 (en) Dialogue management
Lee Natural Language Processing: A Textbook with Python Implementation
KR102251554B1 (en) Method for generating educational foreign language text by adjusting text difficulty
KR101134455B1 (en) Speech recognition apparatus and its method
Rytting et al. Spelling correction for dialectal Arabic dictionary lookup
Beaufort et al. Automation of dictation exercises. A working combination of CALL and NLP.
JP5182954B2 (en) Cavity problem generator and program thereof
KR102182248B1 (en) System and method for checking grammar and computer program for the same
Cissé et al. Automatic Spell Checker and Correction for Under-represented Spoken Languages: Case Study on Wolof
Wolk et al. Unsupervised tool for quantification of progress in L2 English phraseological
CN114064861A (en) Query statement generation method and device
KR20040018008A (en) Apparatus for tagging part of speech and method therefor
L’haire FipsOrtho: A spell checker for learners of French

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20110902

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20120113

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20120113

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120508

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20120509

TRDD Decision of grant or rejection written
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121228

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130108

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130111

R150 Certificate of patent or registration of utility model

Ref document number: 5182954

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160125

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees