JP7082333B2 - Question automatic generation program and question automatic generation device - Google Patents
Question automatic generation program and question automatic generation device Download PDFInfo
- Publication number
- JP7082333B2 JP7082333B2 JP2017230233A JP2017230233A JP7082333B2 JP 7082333 B2 JP7082333 B2 JP 7082333B2 JP 2017230233 A JP2017230233 A JP 2017230233A JP 2017230233 A JP2017230233 A JP 2017230233A JP 7082333 B2 JP7082333 B2 JP 7082333B2
- Authority
- JP
- Japan
- Prior art keywords
- logical structure
- question
- text data
- function
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Electrically Operated Instructional Devices (AREA)
- Machine Translation (AREA)
Description
本発明は、読み込んだ文章の内容に関する設問を自動で生成する技術に関する。 The present invention relates to a technique for automatically generating a question regarding the content of a read sentence.
従来、教育現場において、教科書、参考書、専門書などに基づいてテストで出題する設問を作成する作業は、教職員一人ひとりに任されていることも多く、テストの設問作成作業が教職員の負担となっている場合があった。また、個人毎に設問作成を行っていると、教職員間の共有や年度を跨いでのデータの蓄積、引き継ぎ等が上手く行われないという問題があった。 Traditionally, in educational settings, the task of creating test questions based on textbooks, reference books, specialized books, etc. is often left to each faculty member, and the task of creating test questions is a burden on faculty members. There was a case. In addition, when questions are created for each individual, there is a problem that sharing between faculty and staff, accumulation of data across years, and handing over are not performed well.
以上の現状から、設問を自動で生成してくれるシステムが望まれていた。自動で問題を作成するものとしては、例えば、特許文献1が挙げられる。この特許文献1は、インターネット上に存在する所定の書式で記載されたコンテンツから自動で問題文を生成する問題自動生成装置が開示されている。
From the above situation, a system that automatically generates questions has been desired. For example,
前記特許文献1は、所定の書式で記載されたコンテンツから自動で問題文を生成する機能を有している。しかし、定まった書式から外れた文章からは問題文を生成できないため、問題文を生成可能な文書が制限されるという問題があった。
The
本発明は、上記問題点に鑑みなされたものであり、様々な文章から設問を自動で生成することができる設問自動生成プログラム及び設問自動生成装置を提供することを課題とする。 The present invention has been made in view of the above problems, and an object of the present invention is to provide an automatic question generation program and an automatic question generation device capable of automatically generating questions from various sentences.
本発明に係る設問自動生成プログラムは、読み込んだ文章の内容に関する設問を自動で生成する処理をコンピュータに実現させるための設問自動生成プログラムであって、前記コンピュータに、設問生成対象の文章のテキストデータを取得するテキストデータ取得機能と、取得したテキストデータに含まれる専門用語を抽出し、かつ複数の専門用語間の論理構造を抽出する論理構造抽出機能と、前記論理構造を用いて専門用語に関する設問を生成する設問生成機能とを実現させることを特徴とする。 The question automatic generation program according to the present invention is a question automatic generation program for realizing a process of automatically generating a question regarding the content of a read sentence on a computer, and the text data of the sentence to be question-generated on the computer. The text data acquisition function to acquire the text data, the logical structure extraction function to extract the technical terms contained in the acquired text data, and the logical structure between a plurality of technical terms, and the question about the technical terms using the logical structure. It is characterized by realizing a question generation function that generates.
また、前記論理構造抽出機能は、複数の専門用語間の論理構造の関係性について、定義、対置、包含、付随性質などを含む論理構造分類によって分類する機能を含み、前記設問生成機能は、前記論理構造分類に応じたアルゴリズムに基づいて設問を生成する機能を含むことを特徴とする。 Further, the logical structure extraction function includes a function of classifying the relationship of a logical structure between a plurality of technical terms by a logical structure classification including definition, confrontation, inclusion, ancillary properties, etc., and the question generation function is described above. It is characterized by including a function of generating a question based on an algorithm according to a logical structure classification.
また、前記論理構造抽出機能は、抽出した論理構造に基づいて当該論理構造の逆向きの論理構造を自動生成する機能を含むことを特徴とする。 Further, the logical structure extraction function is characterized by including a function of automatically generating a reverse logical structure of the logical structure based on the extracted logical structure.
また、前記テキストデータ取得機能は、設問生成対象の文章の画像データについて、目次、本文、図表、索引などの所定の分類に従って画像を領域毎に分類する画像領域分類機能と、分類後の領域毎に光学的文字認識によってテキストデータ化して所定の分類のタグ情報を付したテキストデータを取得する画像テキスト化機能とを含むことを特徴とする。 Further, the text data acquisition function has an image area classification function for classifying images for each area according to a predetermined classification such as a table of contents, a text, a chart, and an index for image data of a sentence to be question-generated, and a function for classifying each area after classification. It is characterized by including an image text conversion function for converting text data by optical character recognition and acquiring text data with tag information of a predetermined classification.
また、前記論理構造抽出機能における専門用語の抽出は、専門用語データベースを用いて行われることを特徴とする。 Further, the extraction of technical terms in the logical structure extraction function is performed using a technical term database.
また、前記専門用語データベースは、設問生成対象の文章のテキストデータを含む書籍の索引部分に関するテキストデータを少なくとも一部に利用したものであることを特徴とする。 Further, the technical term database is characterized in that at least a part of the text data related to the index portion of the book including the text data of the text to be asked is used.
また、前記論理構造抽出機能は、論理構造に対応した所定のキーワードに基づいて、テキストデータに含まれる専門用語間の論理構造を抽出するようにしたことを特徴とする。 Further, the logical structure extraction function is characterized in that the logical structure between technical terms included in the text data is extracted based on a predetermined keyword corresponding to the logical structure.
また、前記論理構造抽出機能は、取得したテキストデータを一文ごとに分解して、一文ごとに論理構造の抽出を行うようにしたことを特徴とする。 Further, the logical structure extraction function is characterized in that the acquired text data is decomposed for each sentence and the logical structure is extracted for each sentence.
また、前記論理構造抽出機能は、取得した図表に関するテキストデータ部分から論理構造の抽出を行う機能を含むことを特徴とする。 Further, the logical structure extraction function is characterized by including a function of extracting a logical structure from a text data portion related to an acquired chart.
また、前記コンピュータに、前記論理構造抽出機能で抽出した論理構造によって表現される専門用語間の論理構造の関係性を表形式にして出力する論理構造表出力機能を実現させることを特徴とする。 Further, the computer is characterized by realizing a logical structure table output function for outputting the relationship of the logical structure between technical terms expressed by the logical structure extracted by the logical structure extraction function in a tabular format.
本発明に係る設問自動生成装置は、読み込んだ文章の内容に関する設問を自動で生成する設問自動生成装置であって、設問生成対象の文章のテキストデータを取得するテキストデータ取得部と、取得したテキストデータに含まれる専門用語を抽出し、かつ複数の専門用語間の論理構造を抽出する論理構造抽出部と、前記論理構造を用いて専門用語に関する設問を生成する設問生成部とを備え、前記論理構造抽出部は、複数の専門用語間の論理構造の関係性について、定義、対置、包含、付随性質などを含む論理構造分類によって分類するように構成され、前記設問生成部は、前記論理構造分類に応じたアルゴリズムに基づいて設問を生成するように構成されたことを特徴とする。 The question automatic generation device according to the present invention is a question automatic generation device that automatically generates a question regarding the content of a read sentence, and has a text data acquisition unit for acquiring text data of the sentence to be asked and an acquired text. The logic is provided with a logical structure extraction unit that extracts technical terms contained in data and extracts a logical structure between a plurality of technical terms, and a question generation unit that generates questions related to technical terms using the logical structure. The structure extraction unit is configured to classify the relationship of the logical structure between a plurality of technical terms by the logical structure classification including definition, confrontation, inclusion, incidental property, etc., and the question generation unit is the logical structure classification. It is characterized in that it is configured to generate a question based on an algorithm corresponding to the above .
本発明に係る設問自動生成装置によれば、設問生成対象の文章のテキストデータを取得し、取得したテキストデータに含まれる専門用語を抽出し、かつ複数の専門用語間の論理構造を抽出し、論理構造を用いて専門用語に関する設問を生成するようにしたので、教科書、専門書、参考書などのテキストデータから自動で設問を生成することができるため、教職員の負担を軽減することが可能となり、また、生成した設問を記憶させてデータベース化すれば、教職員間の共有や年度を跨いでのデータの蓄積、引き継ぎ等に役立てることが可能となる。さらに、設問の生成に利用した論理構造の関係性を表した論理構造表を出力可能としたので、論理構造表を教科書等の理解の補助教材としたり、テスト後の再学習用の資料としたりすることが可能となる。 According to the question automatic generation device according to the present invention, text data of a sentence to be question-generated is acquired, technical terms included in the acquired text data are extracted, and a logical structure between a plurality of technical terms is extracted. Since questions related to technical terms are generated using a logical structure, questions can be automatically generated from text data such as textbooks, technical books, and reference books, which makes it possible to reduce the burden on faculty and staff. In addition, if the generated questions are stored and created in a database, it will be possible to use them for sharing among faculty and staff, accumulation of data across years, and handing over. Furthermore, since it is possible to output a logical structure table that shows the relationship of the logical structure used to generate the question, the logical structure table can be used as an auxiliary teaching material for understanding textbooks, etc., or as a material for re-learning after the test. It becomes possible to do.
以下、図面を参照しながら、実施の形態に係る設問自動生成装置の例について説明する。図1は、本発明に係る設問自動生成装置10の構成を表したブロック図である。なお、設問自動生成装置10は、専用マシンとして設計した装置であってもよいが、一般的なコンピュータによって実現可能なものであるものとする。この場合に、設問自動生成装置10は、一般的なコンピュータが通常備えているであろうCPU(Central Processing Unit:中央演算処理装置)、GPU(Graphics Processing Unit:画像処理装置)、メモリ、ハードディスクドライブ等のストレージを具備しているものとする(図示省略)。また、これらの一般的なコンピュータを本例の設問自動生成装置10として機能させるためにプログラムよって各種処理が実行されることは言うまでもない。また、以下に説明する設問自動生成装置10の構成要素を全て設問自動生成装置10自身が備えている必要はなく、一部構成を他の装置に備えさせる、例えば、通信ネットワークを介して接続可能なサーバ装置に一部の構成を備えさせるようにして、設問自動生成装置10が通信を行いながらサーバ装置に備えられた構成を利用するものであってもよい。
Hereinafter, an example of the question automatic generation device according to the embodiment will be described with reference to the drawings. FIG. 1 is a block diagram showing a configuration of a question
図1に示すように、設問自動生成装置10は、テキストデータ取得部11と、論理構造抽出部12と、設問生成部13と、論理構造表出力部14と、記憶部15とを少なくとも備えている。また、本例では、テキストデータ取得部11は、画像領域分類部111と、画像テキスト化部112とを備えている。
As shown in FIG. 1, the question
テキストデータ取得部11は、設問生成対象の文章のテキストデータを取得する機能を有する。教科書、参考書、専門書などの設問を生成したい内容を含む文章のテキストデータを取得するための構成であり、既にテキスト化されたものを設問自動生成装置10に取り込む機能の他、教科書、参考書、専門書などをイメージスキャナによって画像データ化して、その画像データに含まれる文章の内容を以下の画像領域分類部111及び画像テキスト化部112においてテキスト化する処理を実行する機能も備えている。取得したテキストデータは、複数の文が連続的に記載された状態のままであってもよいが、本例では、後述の論理構造抽出部12において一文ずつ処理を実行するようにするために、テキストデータ取得部11において、取得したテキストデータを一文ずつに分解して記憶させておくようにする。その際、表形式のデータにおいて一文ずつセルを分けて記憶させるようにしてもよい。
The text data acquisition unit 11 has a function of acquiring text data of a sentence for which a question is generated. It is a configuration for acquiring text data of sentences including the contents for which you want to generate questions such as textbooks, reference books, and specialized books. It also has a function to convert books, specialized books, etc. into image data by an image scanner, and to execute a process of converting the contents of sentences included in the image data into text in the following image
画像領域分類部111は、設問生成対象の文章の画像データについて、目次、本文、図表、索引などの所定の分類に従って画像を領域毎に分類する機能を有する。教科書などの書籍の中には目次、本文、図表、索引など内容が異なる記載部分が存在するため、これを分類するようにする。分類の方法は、記載内容から自動的に判別するアルゴリズム(機械学習による判別であってもよい)を採用してもよいし、ユーザが領域毎に分類を指定するようにしてもよい。
The image
画像テキスト化部112は、画像領域分類部111において領域毎に分類の指定が行われた画像データについて、分類後の領域毎に光学的文字認識(OCR)によってテキストデータ化して所定の分類のタグ情報を付したテキストデータを取得する機能を有する。本文に分類された領域については本文のテキストデータとして取得し、図表に分類された領域については図表のテキストデータとして取得するといったように、各分類のタグ情報を付したテキストデータとして取得する。また、索引に分類された領域についてのテキストデータは、後述する専門用語データベースとして利用するようにしてもよい。
The image
論理構造抽出部12は、取得したテキストデータに含まれる専門用語を抽出し、かつ複数の専門用語間の論理構造を抽出する機能を有する。専門用語の抽出を行う理由は、専門用語に関連した部分について論理構造を抽出するために、含まれる単語が専門用語であるか否かを判別する必要があるからである。専門用語の抽出のためには、例えば、専門用語データベースを利用してもよい。専門用語データベースは、予め作成して記憶させておいた文章に関する専門用語データベースであってもよい。また、索引に分類された領域について読み取ったテキストデータを、専門用語が含まれている可能性が高いテキストであるものとして、そのまま専門用語データベースとして利用するようにしてもよい。
The logical
論理構造の抽出処理は、専門用語を含む単語間の関係性を表す論理構造として抽出する処理であり、具体的には、論理構造に対応した所定のキーワードに基づいて、テキストデータに含まれる専門用語間の論理構造を抽出する。例えば、「Aは、BとCに分類される。」という一文については、A,B,Cが専門用語である場合、この一文からは、「A→(含む)→B,C」という論理構造と、「B→(対置)→C」という論理構造を抽出することができる。これは、「~は、~と~に分類される」というキーワードを含む場合、包含の論理構造と、対置の論理構造を抽出できる可能性が高いという規則性を予め記憶させておく。そして、「分類される」というキーワードを発見した場合には、包含の論理構造と対置の論理構造を抽出する処理を実行することになる。その他にも、「~には、~がある」、「~には、~が含まれる」といった包含の論理構造を抽出するためのキーワードや、「~が存在しない~」、「~が存在する~」といった存在、非存在の関係性を定める論理構造を抽出するためのキーワードなど、様々なキーワードに基づいて専門用語間の論理構造を抽出する。この論理構造の抽出は、論理関係を抽出する対象の単語が全て専門用語である場合に限らず、一方のみが専門用語である場合においても論理構造を抽出するようにしてもよい。また、言葉の定義などについては、単語間の論理構造抽出のみならず定義部分全体を論理構造として抽出してもよい。例えば、「~とは、~である。」というキーワードを定義の論理構造抽出の条件とする場合には、単語ではなく定義の説明箇所全体を抽出するようにしてもよい。なお、2以上の専門用語が登場する一文は、例外はあるものの大抵の場合には、何らかの論理構造を抽出することができる可能性が高い。よって、2以上の専門用語間の関係性を表現するキーワードとして可能性のある表現を可能な限り論理構造抽出用のキーワードとして設定しておくことが望ましい。 The logical structure extraction process is a process of extracting as a logical structure representing a relationship between words including technical terms, and specifically, a specialty included in text data based on a predetermined keyword corresponding to the logical structure. Extract the logical structure between terms. For example, for the sentence "A is classified into B and C", if A, B, and C are technical terms, the logic "A → (including) → B, C" is used from this sentence. The structure and the logical structure of "B-> (opposite)-> C" can be extracted. This memorizes in advance the logical structure of inclusion and the regularity that there is a high possibility that the logical structure of opposition can be extracted when the keyword "... is classified into ... and ..." is included. Then, when the keyword "classified" is found, the process of extracting the logical structure of inclusion and the logical structure of the opposite is executed. In addition, there are keywords for extracting the logical structure of inclusion such as "~ has ~" and "~ contains ~", and "~ does not exist ~" and "~ exists". The logical structure between technical terms is extracted based on various keywords such as the keyword for extracting the logical structure that defines the relationship between existence and non-existence such as "...". The extraction of the logical structure is not limited to the case where all the words for which the logical relationship is to be extracted are technical terms, and the logical structure may be extracted even when only one of them is a technical term. As for the definition of words, not only the logical structure between words but also the entire definition part may be extracted as a logical structure. For example, when the keyword "... is ..." is used as a condition for extracting the logical structure of the definition, the entire explanation part of the definition may be extracted instead of the word. In most cases, it is highly possible that some logical structure can be extracted from a sentence in which two or more technical terms appear, although there are exceptions. Therefore, it is desirable to set a possible expression as a keyword for expressing the relationship between two or more technical terms as a keyword for extracting a logical structure as much as possible.
また、論理構造抽出部12において抽出した論理構造のそれぞれについて、逆方向の論理構造を生成するようにする。逆方向の論理構造とは、論理構造を逆向きに表現可能な場合の関係性を表した論理構造のことをいう。具体的には、例えば、「A→(含む)→B,C」という論理構造から、「B→(含まれる)→A」と「C→(含まれる)→A」の逆方向の論理構造を抽出することをいう。逆方向の論理構造を抽出しておくことで、設問生成に用いる論理構造の選択肢が増すという効果がある。
Further, for each of the logical structures extracted by the logical
設問生成部13は、論理構造を用いて専門用語に関する設問を生成する機能を有する。より詳しくは、論理構造の種類に応じて生成する設問の内容が決定される。例えば、「B→(含む)→D,E」という論理構造からは、「BはDを含む概念である。〇か×か?」という設問を生成可能である。また、「B→(含む)→D,E」と、「C→(含む)→F,G」と、「B→(対置)→C」という3つの論理構造がある場合、これら3つの論理構造を全て用いると、「Bに含まれるものを選択せよ。正解選択肢:D,E、不正解選択肢:F,G」という設問を生成することができる。また、定義に関する論理構造を複数ピックアップして、設問として問いたい定義の内容の要素を正解選択肢とし、他の定義の内容を不正解選択肢とする設問の生成方法も考えられる。これらはあくまで一例であり、様々な論理構造の関係性を利用して自動で種々の設問を生成することが可能となる。なお、設問の生成数については、ユーザが希望する設問数を指定するものであってもよいし、論理構造から生成可能な設問を重複のない範囲で全て生成するものであってもよい。
The
論理構造表出力部14は、論理構造抽出部12において抽出した論理構造によって表現される専門用語間の論理構造の関係性を表形式にして出力する機能を有する。論理構造に基づいて、設問生成部13において設問を生成してテストで出題するのみならず、専門用語間の論理構造の関係性を表した表を出力することで、例えば、テスト後の再学習用の資料として論理構造表を利用することが可能となる。
The logical structure
記憶部15は、各部の処理に必要な各種データや、各部における処理の結果として得られたデータを記憶させる機能を有する。例えば、テキストデータ取得部11で取得したテキストデータ、論理構造抽出部12で抽出した論理構造、設問生成部13で生成した設問、論理構造表出力部14で生成した表、専門用語データベースなどは、この記憶部16に記憶させておくようにしてもよい。
The
次に、設問自動生成装置10における設問自動生成処理の流れについて説明を行う。図2は、設問自動生成装置10における設問自動生成処理の流れを示したフローチャート図である。この図2において、先ず、設問自動生成装置10は、テキストデータの取得を行う(S101)。テキストデータの取得は、どのような方法であってもよいが、例えば、画像データに含まれる文章を光学的文字認識処理(OCR処理)によってテキストデータ化するものであってもよい。そして、設問自動生成装置10は、テキストデータについて、見出し、本文、図表、索引等の所定の分類に従って取得したテキストデータを分類する(S102)。なお、OCR処理によってテキスト化する場合には、画像データの段階で分類を行って、分類後にテキスト化するようにしてもよい。そして、取得して分類されたテキストデータについて、複数の分が連結して文章を構成している箇所、特に本文について、一文ずつに分解する処理を行う(S103)。論理構造の抽出処理を一文単位で実行するためである。
Next, the flow of the question automatic generation process in the question
次に、設問自動生成装置10は、一文ずつ論理構造の抽出処理を実行する(S104)。論理構造の抽出は、本文のみならず可能であれば図表からも論理構造の抽出を試みる。また、設問自動生成装置10は、抽出した論理構造について逆方向の論理構造の生成を行う(S105)。設問自動生成装置10は、順方向と逆方向の両方の論理構造に基づいて、設問を所定数だけ自動生成する(S106)。そして、設問自動生成装置10は、生成した設問を出力する(S107)。出力は、表示画面に表示して確認させるものであってもよいし、紙などにプリントアウトするものであってもよい。また、当然ながら、記憶部16に記憶させる処理も実行する。また、必要があれば、論理構造の関係性を表した論理構造表を併せて出力して(S108)、処理を終了する。
Next, the question
次に、より具体的な例を用いて設問自動生成装置10の動作について説明を行う。図3は、設問生成を行いたい内容を含む教科書の一例を表した説明図である。図3に示すように、教科書には、見出し部分、本文部分、図表部分などが含まれている。また、この図3は、教科書をイメージスキャナで画像データ化したものであるとする。その場合、この図3の画像に含まれる内容を領域毎に分類する処理を実行する。分類処理は、記載内容から自動的に判別するアルゴリズムによって分類してもよいし、ユーザが領域毎に分類を指定する手法であってもよい。分類後、OCR処理によって、領域毎にテキストデータ化する。
Next, the operation of the automatic
図4は、図3に示す教科書のページをテキストデータ化した内容を表した説明図である。この図4に示すように、見出し部分と、本文として抽出した抽出文とが区別されてテキスト化されている。また、テキスト化した際に、複数の分が連結して文章となっていたものを一文ずつに分解して管理している。この際のデータは、図4に示すような表形式のデータの異なるセルに一文ずつ格納するものであってもよい。 FIG. 4 is an explanatory diagram showing the contents of the textbook pages shown in FIG. 3 converted into text data. As shown in FIG. 4, the heading portion and the extracted sentence extracted as the text are distinguished and converted into text. In addition, when it is converted into text, what was formed by concatenating multiple parts into sentences is decomposed into sentences and managed. The data at this time may be stored sentence by sentence in different cells of the tabular data as shown in FIG.
図5は、図4に示す抽出文のそれぞれについて論理構造の抽出を行った際の抽出結果を表した説明図である。この図5に示すように、一文目からは、「確率的影響→(対置)→確定的影響」という論理構造を含む4つの論理構造が抽出されている。二文目からは、「確率的影響→(含む)→発がん,遺伝的影響」という論理構造が抽出されている。三文目からは、「確定的影響→(含む)→白内障,皮膚の炎症」という論理構造が抽出されている。 FIG. 5 is an explanatory diagram showing the extraction results when the logical structure is extracted for each of the extracted sentences shown in FIG. As shown in FIG. 5, four logical structures including the logical structure of "stochastic influence-> (opposite)-> deterministic influence" are extracted from the first sentence. From the second sentence, the logical structure of "stochastic effect-> (including)-> carcinogenesis, genetic effect" is extracted. From the third sentence, the logical structure of "deterministic effect-> (including)-> cataract, skin inflammation" is extracted.
図6は、逆方向の論理構造の生成の一例を表した説明図である。順方向の論理構造として、「確率的影響→(含む)→(影響)→発がん,遺伝的影響」という論理構造が抽出された場合に、逆方向の論理構造として、「発がん→(含まれる)→(影響の分類)→確率的影響」と、「遺伝的影響→(含まれる)→(影響の分類)→確率的影響」という2つの逆方向の論理構造が生成される。このような逆方向の論理構造も設問生成に利用される。 FIG. 6 is an explanatory diagram showing an example of generation of a logical structure in the reverse direction. When the logical structure of "probabilistic effect-> (including)-> (effect)-> carcinogenesis, genetic effect" is extracted as the forward logical structure, the reverse logical structure is "carcinogenesis-> (included)". Two opposite logical structures are generated: → (classification of effects) → probabilistic effects” and “genetic effects → (included) → (classification of effects) → probabilistic effects”. Such a logical structure in the opposite direction is also used for question generation.
図7は、論理構造に基づいて自動で生成される設問の一例を表した説明図である。例えば、複数の選択肢の中から正解の選択肢を選択する設問を自動生成する際の処理ロジックは、(1)対置の論理構造を選択、(2)対置の論理構造のそれぞれが含む要素を自動収集する、(3)正解を答えさせたい対置に含まれる要素を正解選択肢、対置の残りに含まれる要素を不正解選択肢として設問を作成、という流れで設問を生成する。この処理ロジックに従って、図5で抽出した論理構造から設問を生成すると、例えば、例1又は例2の設問を生成することができる。なお、例1と例2は正解選択肢と不正解選択肢の関係性を逆にしただけの設問であり、この例1と例2の作成に利用した論理構造は全く同じものである。 FIG. 7 is an explanatory diagram showing an example of a question automatically generated based on a logical structure. For example, the processing logic for automatically generating a question that selects the correct answer from multiple choices is (1) selecting the logical structure of the confrontation, and (2) automatically collecting the elements included in each of the logical structures of the confrontation. The question is generated in the flow of (3) creating a question by using the elements included in the confrontation for which the correct answer is to be answered as the correct answer option and the elements contained in the rest of the confrontation as the incorrect answer option. By generating a question from the logical structure extracted in FIG. 5 according to this processing logic, for example, the question of Example 1 or Example 2 can be generated. It should be noted that Examples 1 and 2 are questions in which the relationship between the correct answer option and the incorrect answer option is reversed, and the logical structures used for creating the example 1 and the example 2 are exactly the same.
図8は、論理構造の関係性を表した論理構造表の一例を表した説明図である。図7の説明において前述した設問自動生成の処理ロジックを実行すると、その設問生成に利用する論考構造の関係性が抽出される。この抽出された論理構造の関係性を利用して設問を生成しているが、この論理構造の関係性を図8に示すようにそのまま論理構造表として出力すれば、学習者の理解を助けるための補助教材とすることが可能となる。この論理構造表は、設問生成時に合わせて作成することができるため、テスト後の復習用教材として配布して利用してもよい。 FIG. 8 is an explanatory diagram showing an example of a logical structure table showing the relationship of logical structures. When the above-mentioned processing logic for automatic question generation is executed in the explanation of FIG. 7, the relationship of the essay structure used for the question generation is extracted. Questions are generated using the relationships of the extracted logical structures, but if the relationships of these logical structures are output as they are as a logical structure table as shown in Fig. 8, it will help the learner's understanding. It will be possible to use it as a supplementary teaching material. Since this logical structure table can be created at the time of question generation, it may be distributed and used as a review material after the test.
図9は、教科書等に含まれる図表の一例を表した説明図である。図9は、放射線の影響の分類に確率的影響と確定的影響が含まれることと、確率的影響の具体例として発がん,遺伝的影響が含まれることと、確定的影響の具体例として白内障,皮膚の炎症が含まれることが読み取れる。この図9に示す図表が例えば、図3の図表領域に示されていて、本文にはこの内容が含まれていない場合には、この図9の図表から論理構造を抽出して、図8に示すような論理構造表を作成することができれば、図表のみに含まれる内容からも論理構造を抽出して設問生成が可能となる。この図9の例でいえば、図表の左のセルと右のセルの間には包含の論理構造が存在すると解釈することが最も自然であると判定して、包含の論理構造を抽出している。また、縦軸に並列に記載される項目が対置の関係であるという論理構造も抽出することができる。このように、文章の場合に比較して推定によって論理構造を抽出することになる可能性が増えるが、図表からも論理構造を抽出することができる。 FIG. 9 is an explanatory diagram showing an example of a chart included in a textbook or the like. FIG. 9 shows that the classification of radiation effects includes stochastic and deterministic effects, that carcinogenic and genetic effects are included as specific examples of stochastic effects, and that cataracts are specific examples of deterministic effects. It can be read that skin inflammation is included. When the chart shown in FIG. 9 is shown, for example, in the chart area of FIG. 3 and the text does not include this content, the logical structure is extracted from the chart of FIG. 9 and shown in FIG. If the logical structure table as shown can be created, it is possible to extract the logical structure from the contents contained only in the chart and generate a question. In the example of FIG. 9, it is determined that it is most natural to interpret that the logical structure of inclusion exists between the left cell and the right cell of the chart, and the logical structure of inclusion is extracted. There is. It is also possible to extract a logical structure in which the items described in parallel on the vertical axis are in a contradictory relationship. In this way, the possibility that the logical structure will be extracted by estimation increases as compared with the case of sentences, but the logical structure can also be extracted from figures and tables.
10 設問自動生成装置
11 テキストデータ取得部
111 画像領域分類部
112 画像テキスト化部
12 論理構造抽出部
13 設問生成部
14 論理構造表出力部
15 記憶部
10 Automatic question generation device 11 Text
Claims (10)
前記コンピュータに、
設問生成対象の文章のテキストデータを取得するテキストデータ取得機能と、
取得したテキストデータに含まれる専門用語を抽出し、かつ複数の専門用語間の論理構造を抽出するにあたり、複数の専門用語間の論理構造の関係性について、定義、対置、包含、付随性質などを含む論理構造分類によって分類する論理構造抽出機能と、
前記論理構造を用いて専門用語に関する設問を生成するにあたり、前記論理構造分類に応じたアルゴリズムに基づいて設問を生成する設問生成機能と
を実現させる設問自動生成プログラム。 It is a question automatic generation program to realize the process of automatically generating questions about the contents of the read sentences on the computer.
To the computer
A text data acquisition function that acquires the text data of the text for which the question is generated, and
In extracting the technical terms contained in the acquired text data and extracting the logical structure between multiple technical terms, the definition, confrontation, inclusion, incidental properties, etc. of the relationship of the logical structure between multiple technical terms are defined. The logical structure extraction function that classifies by the included logical structure classification ,
An automatic question generation program that realizes a question generation function that generates questions based on an algorithm corresponding to the logical structure classification when generating questions related to technical terms using the logical structure.
請求項1に記載の設問自動生成プログラム。 The question automatic generation program according to claim 1 , wherein the logical structure extraction function includes a function of automatically generating a reverse logical structure of the logical structure based on the extracted logical structure.
請求項1または請求項2の何れかに記載の設問自動生成プログラム。 The text data acquisition function is an image area classification function that classifies images for each area according to a predetermined classification such as a table of contents, a text, a chart, and an index for image data of a sentence to be question-generated, and an optical image for each area after classification. The question automatic generation program according to any one of claim 1 or 2 , which includes an image text conversion function for converting text data by target character recognition and acquiring text data with tag information of a predetermined classification.
請求項1から請求項3の何れかに記載の設問自動生成プログラム。 The automatic question generation program according to any one of claims 1 to 3 , wherein the technical term extraction in the logical structure extraction function is performed using the technical term database.
請求項4記載の設問自動生成プログラム。 The automatic question generation program according to claim 4 , wherein the technical term database uses at least a part of the text data related to the index portion of the book including the text data of the text to be asked.
請求項1から請求項5の何れかに記載の設問自動生成プログラム。 The question according to any one of claims 1 to 5 , wherein the logical structure extraction function extracts a logical structure between technical terms included in text data based on a predetermined keyword corresponding to the logical structure. Automatic generation program.
請求項1から請求項6の何れかに記載の設問自動生成プログラム。 The question automatic generation program according to any one of claims 1 to 6 , wherein the logical structure extraction function decomposes the acquired text data into sentences and extracts the logical structure for each sentence.
請求項1から請求項7の何れかに記載の設問自動生成プログラム。 The automatic question generation program according to any one of claims 1 to 7 , wherein the logical structure extraction function includes a function of extracting a logical structure from a text data portion related to an acquired chart.
前記論理構造抽出機能で抽出した論理構造によって表現される専門用語間の論理構造の関係性を表形式にして出力する論理構造表出力機能を実現させる
請求項1から請求項8の何れかに記載の設問自動生成プログラム。 To the computer
The method according to any one of claims 1 to 8 , which realizes a logical structure table output function that outputs the relationship of the logical structure between the technical terms expressed by the logical structure extracted by the logical structure extraction function in a tabular format. Question automatic generation program.
設問生成対象の文章のテキストデータを取得するテキストデータ取得部と、
取得したテキストデータに含まれる専門用語を抽出し、かつ複数の専門用語間の論理構造を抽出する論理構造抽出部と、
前記論理構造を用いて専門用語に関する設問を生成する設問生成部とを備え、
前記論理構造抽出部は、複数の専門用語間の論理構造の関係性について、定義、対置、包含、付随性質などを含む論理構造分類によって分類するように構成され、
前記設問生成部は、前記論理構造分類に応じたアルゴリズムに基づいて設問を生成するように構成された
ことを特徴とする設問自動生成装置。 It is a question automatic generation device that automatically generates questions about the contents of the read text.
The text data acquisition unit that acquires the text data of the text for which the question is generated, and
A logical structure extraction unit that extracts technical terms contained in the acquired text data and extracts the logical structure between multiple technical terms.
It is equipped with a question generation unit that generates questions related to technical terms using the above logical structure.
The logical structure extraction unit is configured to classify the relationship of logical structures between a plurality of technical terms by a logical structure classification including definitions, confrontations, inclusions, incidental properties, and the like.
The question generation unit is configured to generate questions based on an algorithm corresponding to the logical structure classification.
An automatic question generator that features this .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017230233A JP7082333B2 (en) | 2017-11-30 | 2017-11-30 | Question automatic generation program and question automatic generation device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017230233A JP7082333B2 (en) | 2017-11-30 | 2017-11-30 | Question automatic generation program and question automatic generation device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019101149A JP2019101149A (en) | 2019-06-24 |
JP7082333B2 true JP7082333B2 (en) | 2022-06-08 |
Family
ID=66973572
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017230233A Active JP7082333B2 (en) | 2017-11-30 | 2017-11-30 | Question automatic generation program and question automatic generation device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7082333B2 (en) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11030913B2 (en) * | 2018-06-07 | 2021-06-08 | Thinkster Learning, Inc. | Intelligent and contextual system for knowledge progression and quiz management |
US11928984B2 (en) | 2018-06-07 | 2024-03-12 | Thinkster Learning Inc. | Intelligent and contextual system for test management |
KR102129704B1 (en) * | 2019-11-01 | 2020-07-02 | 주식회사 보인정보기술 | Method And System for Generating Learning Item |
JP7440966B1 (en) | 2023-01-01 | 2024-02-29 | 優介 宮澤 | Theoretical structure modeling methods, programs, and systems |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009146311A (en) | 2007-12-17 | 2009-07-02 | Fuji Xerox Co Ltd | Document analyzer, document analyzing method, and computer program |
JP2012018300A (en) | 2010-07-08 | 2012-01-26 | Manabing Kk | Question automatic generation method and question automatic generation system |
JP2013206388A (en) | 2012-03-29 | 2013-10-07 | Dainippon Printing Co Ltd | Book information retrieval device, book information retrieval system, book information retrieval method and program |
JP2016218853A (en) | 2015-05-22 | 2016-12-22 | ソニー株式会社 | Information processor, information processing method, and program |
JP2017022471A (en) | 2015-07-07 | 2017-01-26 | 京セラドキュメントソリューションズ株式会社 | Image formation apparatus, image formation method, and control program |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2960936B2 (en) * | 1987-07-13 | 1999-10-12 | 日本電信電話株式会社 | Dependency analyzer |
JPH0743718B2 (en) * | 1989-10-13 | 1995-05-15 | 株式会社日立製作所 | Multimedia document structuring method |
-
2017
- 2017-11-30 JP JP2017230233A patent/JP7082333B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009146311A (en) | 2007-12-17 | 2009-07-02 | Fuji Xerox Co Ltd | Document analyzer, document analyzing method, and computer program |
JP2012018300A (en) | 2010-07-08 | 2012-01-26 | Manabing Kk | Question automatic generation method and question automatic generation system |
JP2013206388A (en) | 2012-03-29 | 2013-10-07 | Dainippon Printing Co Ltd | Book information retrieval device, book information retrieval system, book information retrieval method and program |
JP2016218853A (en) | 2015-05-22 | 2016-12-22 | ソニー株式会社 | Information processor, information processing method, and program |
JP2017022471A (en) | 2015-07-07 | 2017-01-26 | 京セラドキュメントソリューションズ株式会社 | Image formation apparatus, image formation method, and control program |
Also Published As
Publication number | Publication date |
---|---|
JP2019101149A (en) | 2019-06-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7082333B2 (en) | Question automatic generation program and question automatic generation device | |
Rai | Identifying key product attributes and their importance levels from online customer reviews | |
Tahsin Mayeesha et al. | Deep learning based question answering system in Bengali | |
Perkins et al. | Decoding academic integrity policies: A corpus linguistics investigation of AI and other technological threats | |
US11429786B2 (en) | Document analysis device, learning device, document analysis method, and learning method | |
US20170124039A1 (en) | Digital note creation | |
Strantz | Using web standards to design accessible data visualizations in professional communication | |
Alcaraz Martínez et al. | Accessible charts are part of the equation of accessible papers: a heuristic evaluation of the highest impact LIS journals | |
US20240211518A1 (en) | Automated document intake system | |
KR102140648B1 (en) | System for converting hangeul word file on the web | |
Oyama et al. | Visual clarity analysis and improvement support for presentation slides | |
US11232325B2 (en) | Data analysis system, method for controlling data analysis system, and recording medium | |
Browder | Scanning print to pdf: Opportunities and obstacles for screen reader accessibility | |
KR102569381B1 (en) | System and Method for Machine Reading Comprehension to Table-centered Web Documents | |
Splendiani et al. | Accessible images in computer science journals | |
CN116306506A (en) | Intelligent mail template method based on content identification | |
CN114331932A (en) | Target image generation method and device, computing equipment and computer storage medium | |
Skeppstedt et al. | From word clouds to Word Rain: Revisiting the classic word cloud to visualize climate change texts | |
US12106048B2 (en) | Structured text processing learning apparatus, structured text processing apparatus, structured text processing learning method, structured text processing method and program | |
JP2021117659A (en) | Identifying device, identifying method, program, and data structure | |
Kous et al. | Investigation of the accessibility of non-text content published on websites | |
Elahi et al. | Image Relevance on Websites and Readability | |
Splendiani et al. | Do physicians make their articles readable for their blind or low-vision patients? An analysis of current image processing practices in biomedical journals from the point of view of accessibility | |
JP2007334670A (en) | Device, method and program for image processing | |
Wilkening et al. | ACCSAMS: Automatic Conversion of Exam Documents to Accessible Learning Material for Blind and Visually Impaired |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201116 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210929 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211026 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211216 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220510 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220517 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7082333 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |