JP7025397B2

JP7025397B2 - 教育支援システム、教育支援方法および教育支援プログラム

Info

Publication number: JP7025397B2
Application number: JP2019206484A
Authority: JP
Inventors: 秀齊藤
Original assignee: Signate Inc
Current assignee: Signate Inc
Priority date: 2019-11-14
Filing date: 2019-11-14
Publication date: 2022-02-24
Anticipated expiration: 2039-11-14
Also published as: JP2021081805A

Description

本発明は、ネットワークを介した教育を支援する技術に関する。

上記技術分野において、特許文献１には、インターネットを介してオンラインで学生が受講できるコースを生成して、オンライン教育を実施する技術が開示されている。

特表２００３－５０３７８０号公報

しかしながら、ＡＩ(artificial intelligence)人材教育におけるプログラミング学習の問題で用いる入力データを生成するには多大な労力を必要とする。上記文献に記載の技術では、かかる課題に対処することができなかった。

本発明の目的は、上述の課題を解決する技術を提供することにある。

上記目的を達成するため、本発明に係る教育支援システムは、
ＡＩ(artificial intelligence)人材教育におけるプログラミング学習を支援する教育支援システムであって、
収集されたデータから表の形に整形された整形済データを取得する整形済データ取得部と、
前記整形済データに対して、プログラミング学習の成果を判定するための問題の難易度に影響を与える加工を加えることによって、前記問題に含まれる入力データを生成する入力データ生成部と、
を備える。

上記目的を達成するため、本発明に係る教育支援方法は、
ＡＩ(artificial intelligence)人材教育におけるプログラミング学習を支援する教育支援方法であって、
整形済データ取得部が、収集されたデータから表の形に整形された整形済データを取得する整形済データ取得ステップと、
入力データ生成部が、前記整形済データに対して、プログラミング学習の成果を判定するための問題の難易度に影響を与える加工を加えることによって、前記問題に含まれる入力データを生成する入力データ生成ステップと、
を含む。

上記目的を達成するため、本発明に係る教育支援プログラムは、
ＡＩ(artificial intelligence)人材教育におけるプログラミング学習を支援する教育支援プログラムであって、
収集されたデータから表の形に整形された整形済データを取得する整形済データ取得ステップと、
前記整形済データに対して、プログラミング学習の成果を判定するための問題の難易度に影響を与える加工を加えることによって、前記問題に含まれる入力データを生成する入力データ生成ステップと、
をコンピュータに実行させる。

本発明によれば、ＡＩ人材教育におけるプログラミング学習の問題で用いる入力データを効率的に生成することができる。

本発明の第１実施形態に係る教育支援システムの構成を示すブロック図である。本発明の第２実施形態に係る教育支援システムの概要を示す図である。本発明の第２実施形態に係る教育支援システムに参加したクライアントの通信端末の表画面を示す図である。本発明の第２実施形態に係る教育支援システムに参加したクライアントの通信端末の表画面を示す図である。本発明の第２実施形態に係る教育支援システムに参加したクライアントの通信端末の表画面を示す図である。本発明の第２実施形態に係る教育支援システムの構成を示すブロック図である。本発明の第２実施形態に係る教育支援システムの動作手順を示すシーケンス図である。本発明の第２実施形態に係る教育支援サーバの機能構成を示すブロック図である。本発明の第２実施形態に係る学習情報データベースの構成を示す図である。本発明の第２実施形態に係る受講者情報データベースの構成を示す図である。本発明の第２実施形態に係るコンペティション用データベースの構成を示す図である。本発明の第２実施形態に係るコンペティションの一例を示す図である。本発明の第２実施形態に係るコンペティションの他例を示す図である。本発明の第２実施形態に係る問題生成部および問題評価部の機能構成を示すブロック図である。本発明の第２実施形態に係る被操作データ生成部の機能構成を示すブロック図および処理手順を示すフローチャートである。本発明の第２実施形態に係る被操作データ生成部への入力データおよび出力データの構成を示す図である。本発明の第２実施形態に係る誤差算出部の機能構成を示すブロック図と、誤差算出、問題評価および成果評価の処理手順を示すフローチャートとである。本発明の第３実施形態に係る被操作データ生成部の機能構成を示すブロック図および処理手順を示すフローチャートである。本発明の第３実施形態に係る被操作データ生成部への入力データおよび出力データの構成を示す図である。本発明の第４実施形態に係る被操作データ生成部の機能構成を示すブロック図および処理手順を示すフローチャートである。本発明の第４実施形態に係る被操作データ生成部への入力データおよび出力データの構成を示す図である。本発明の第５実施形態に係る被操作データ生成部の機能構成を示すブロック図および処理手順を示すフローチャートである。本発明の第５実施形態に係る被操作データ生成部への入力データおよび出力データの構成を示す図である。本発明の第６実施形態に係る被操作データ生成部の機能構成を示すブロック図および処理手順を示すフローチャートである。本発明の第６実施形態に係る被操作データ生成部への入力データおよび出力データの構成を示す図である。本発明の第７実施形態に係る教育支援サーバの機能構成を示すブロック図である。本発明の第７実施形態に係る問題生成部の機能構成を示すブロック図である。本発明の第７実施形態に係る未整形データ生成部の機能構成を示すブロック図および処理手順を示すフローチャートである。本発明の第７実施形態に係る未整形データ生成部への入力データおよび出力データの構成を示す図である。本発明の第８実施形態に係る未整形データ生成部の機能構成を示すブロック図および処理手順を示すフローチャートである。本発明の第８実施形態に係る未整形データ生成部への入力データおよび出力データの構成を示す図である。本発明の第９実施形態に係る問題生成部の機能構成を示すブロック図である。本発明の第９実施形態に係る選択テーブルの構成を示す図である。本発明の第９実施形態に係る未整形データ生成部への入力データおよび出力データの構成を示す図である。

以下に、図面を参照して、本発明の実施の形態について例示的に詳しく説明する。ただし、以下の実施の形態に記載されている構成要素は単なる例示であり、本発明の技術範囲をそれらのみに限定する趣旨のものではない。

本実施形態において、「整形済データ」は、種々の予測または分類モデル生成のために収集された目的変数（ターゲット）と説明変数とを含む生データを、予測または分類アルゴリズムを適用可能に整形したデータを意味する。また、「被操作データ」は、「整形済データ」を所定の変換アルゴリズムに従って変換して性質を変化させたデータである。「被操作データ」は、その分析結果のユニーク性を担保するために生成され、その変換は予測または分類アルゴリズムを適用した場合に分析結果の精度に影響する。「被操作データ」を生成する変換アルゴリズムは、整形済データに対して、予測または分類アルゴリズムに不用なデータを追加する、または、予測または分類アルゴリズムに有用なデータを除去あるいは変化する。変換アルゴリズムとしては、次元数変換、欠損率制御、ノイズ付加、冗長化、あるいは、ターゲット分布の変換などが含まれるが、これらに限定されるものではない。また、「未整形データ」は、「整形済データ」に対してデータの内容や性質を変化させずに変形したものであり、その変形操作は予測または分類アルゴリズムを適用した場合に分析結果の精度に影響しない。「未整形データ」を生成する変形操作には、非ダミー化やテーブル分割などが含まれるが、これらに限定されるものではない。

［第１実施形態］
本発明の第１実施形態としての教育支援システム１００について、図１を用いて説明する。教育支援システム１００は、ＡＩ(artificial intelligence)人材教育におけるプログラミング学習を支援するシステムである。

図１に示すように、教育支援システム１００は、整形済データ取得部１０１と、入力データ生成部１０２と、を含む。整形済データ取得部１０１は、予測または分類アルゴリズム１１０を適用可能に整形された整形済データ１１１を取得する。入力データ生成部１０２は、整形済データ１１１に対して加工を加えることによって、プログラミング学習の成果を判定するための問題１２０に含まれる入力データ１１２を生成する。

本実施形態によれば、整形済データに加工を加えて問題に含まれる入力データを生成するので、人材教育におけるプログラミング学習の問題で用いる入力データを効率的に生成することができる。

［第２実施形態］
次に、本発明の第２実施形態に係る教育支援システムについて説明する。本実施形態に係る教育支援システムは、ＡＩ人材教育におけるプログラミング学習の講座の受講者に対して、プログラミング能力の習得度が可視化され、習得技術が種々の課題に応用できるよう受講者を支援する。例えば、様々な産業分野のクエスト(分析課題)を分析担当者の視点で経験できる。また、クエストで出題されるミッション(要素技術)をゲーム感覚でクリアしていくように設計されている。そして、各テーマの学習のラストミッションはコンペティション問題に解答する形式になっているため、本当の習得度が定量的にわかる。その上、他の参加者とのレベルを比較可能である。

このような教育支援システムにおいて、各テーマの学習のラストミッションにおけるコンペティション問題を生成する場合に、コンペティション問題の入力データを参加する受講者ごとに異ならせる必要がある。例えば、同時に受講する受講者が１００名であれば１００通り、１０００名であれば１０００通りの入力データを生成する必要がある。そして、その入力データが異なることによりコンペティション問題の難易度が相違することは、コンペティションの公平公正の観点から避けなければならない。そのため、異なる入力データを生成することに多くの労力が裂かれることになる。

本実施形態は、この問題を解決して簡単な処理でコンペティション問題の多くの異なる入力データを簡単に生成でき、かつ、コンペティション問題の難易度が相違しないように、あるいは、相違した場合に評価に反映できるようにした。

《教育支援システム》
以下、図２Ａ～図３Ｂを参照して、教育支援システムの構成および動作を説明する。

（概要）
図２Ａは、本実施形態に係る教育支援システムの概要を示す図である。

本実施形態に係る教育支援システムは、１つのテーマについての予測または分類モデルの学習をクエスト２１０として、各クエスト２１０を複数のミッション２１１～２１３から構成する。各ミッションとしては、予測または分類モデルを学習するための前処理のミッション２１１と、例えば回帰問題では回帰処理のミッション２１２と、クエスト２１０の最終段階のコンペティションを行うラストミッション２１３と、が含まれる。各ミッション２１１と２１２では、動画による作業の説明としてのタスクがあって、各ミッションの終わりは演習問題が提供される。また、エクストラエミッション２２０として、各ミッション２１１と２１２での習得を補助するミッション２２１や２２２が用意されている。

（通信端末の表示画面）
図２Ｂ～図２Ｄは、本実施形態に係る教育支援システムに参加したクライアントの通信端末の表示画面を示す図である。図２Ｂ～図２Ｄのような情報の提示によって、受講者への受講を促進している。

図２Ｂは、受講者が問題を解いている時の、通信端末の表示画面２３０である。表示画面２３０の領域２３１は、問題を解くに当たって受講者が必要とする基礎知識を表示する領域である。表示画面２３０の領域２３２は、受講者が予測または分類プログラムを作成しながら入力する領域である。表示画面２３０の領域２３３は、受講者が入力した予測または分類プログラムを実行した結果を表示する領域である。表示画面２３０の領域２３４は、受講者が入力した予測または分類プログラムを分析し、その分析結果を通知する領域である。

図２Ｃは、受講者が選択したテーマの学習をクリアした場合の、通信端末の表示画面２４０である。表示画面２４０の表示２４１は、クリアを受講者に伝えている。表示画面２４０の表示２４２は、かかるクリアにおいて１００スコア（ポイント）を獲得したことを伝えている。表示画面２４０の表示２４３は、学習結果の評価および課題を通知している。

図２Ｄは、受講者（本例では、山田太郎）の現在の受講状態を通知する、通信端末の表示画面２５０である。表示画面２５０の表示２５１は、受講者の獲得スコア、クリアしたクエスト数、ランキング、レベルを示す。表示画面２５０の表示２５２は、現在受講中のコースやテーマ、および、その進捗状況を示す。表示画面２５０の表示２５３は、最近クリアしたクエストの履歴や獲得スコアを示す。表示画面２５０の表示２５４は、最近の活動（受講状態）をカレンダーで示す。

（システム構成）
図３Ａは、本実施形態に係る教育支援システム３００の構成を示すブロック図である。

教育支援システム３００は、教育支援サーバ３１０と、クライアントの通信端末３２１～３２ｎと、ネットワーク３３０と、管理者の通信端末３４０と、を備える。教育支援サーバ３１０は、受講制御部３１１と、受講者管理部３１２と、課題設定部３１３と、成果判定部３１４と、受講管理用データベース３１５と、を有する。受講制御部３１１は、教育支援サーバ３１０が提供するＡＩ人材教育におけるプログラミング学習を支援するための講座のコースやテーマの実施を制御する。受講者管理部３１２は、教育支援サーバ３１０が提供する講座を受講する受講者の受講状態や進捗状況などを管理する。課題設定部３１３は、講座のコースやテーマに対応して受講の成果を自他共に評価するための課題を設定する。成果判定部３１４は、受講者の受講状態や進捗状況、あるいは、課題設定部３１３が設定した課題の解答レベルを参照して、受講者による受講の成果を判定して受講者に通知する。受講管理用データベース３１５は、上述の各部が参照するデータ、あるいは、各部が生成したデータを格納する。

クライアントの通信端末３２１～３２ｎは、ネットワーク３３０を介して教育支援サーバ３１０に接続され、教育支援サーバ３１０が提供する講座へ参加登録して、講座を受講する。管理者の通信端末３４０は、教育支援サーバ３１０の状態を監視すると共に、教育支援サーバ３１０を操作する。本実施携帯における入力データの生成は、教育支援サーバ３１０で自動的に行われても、管理者の通信端末３４０からの管理者とのインタラクションを通じて行われてもよい。なお、図３Ａについての説明では、教育支援サーバ３１０が提供する一般にオープンされた課題解決のコンペティションについての説明は省略されている。

（動作シーケンス）
図３Ｂは、本実施形態に係る教育支援システム３００の動作手順を示すシーケンス図である。なお、図３Ｂにおいても、教育支援サーバ３１０が提供する一般にオープンされた課題解決モデルのコンペティションについての説明は省略されている。また、図３Ｂにおいて、通信端末３２１～３２ｎはＷｅｂブラウザにより教育支援サーバ３１０とリンクするものとする。

通信端末３２１～３２ｎは、ステップＳ３０１において、受講者の属性および受講するコースなどの情報を入力して受講者の登録を行う。教育支援サーバ３１０は、ステップＳ３０３において、通信端末３２１～３２ｎからの情報を受信して受講管理用データベース３１５に登録する。まず、受講者がプログラミングトレーニングのコースを選択すると、教育支援サーバ３１０は、ステップＳ３０５において、プログラミングトレーニングの内容を提供し、通信端末３２１～３２ｎは、ステップＳ３０７において、プログラミングトレーニングを実行する。

受講者がプログラミング実践のコースを選択すると、教育支援サーバ３１０は、ステップＳ３１１において、実社会で解決すべき複数のテーマを通信端末３２１～３２ｎに送信する。通信端末３２１～３２ｎは、ステップＳ３１３において、複数のテーマから受講者が解答を目指すテーマを選択する。教育支援サーバ３１０は、ステップＳ３１５において、選択されたテーマについてその解答手順を複数の工程（受講者のミッション）に分けて、最初のミッションについての情報を通信端末３２１～３２ｎに提供する。通信端末３２１～３２ｎは、ステップＳ３１７において、最初のミッションについての作業を受講者に説明する。かかる説明は動画を含んだ理解容易なものが望ましい。作業の説明が終了すると、教育支援サーバ３１０は、ステップＳ３１９において、最初のミッションを完了するための演習問題を提供する。通信端末３２１～３２ｎは、ステップＳ３２１において、提供された演習問題を表示し、ステップＳ３２３において、受講者の入力に従って解答を教育支援サーバ３１０に送信する。教育支援サーバ３１０は、ステップＳ３２５において、演習問題に対する受講者の解答を評価する。そして、受講者の解答が所定レベルを超えている場合、教育支援サーバ３１０は、ステップＳ３２７において、受講者にスコア（あるいはポイント）を与えると共に、選択されたテーマについて解決するための次の工程の情報を通信端末３２１～３２ｎに提供する。通信端末３２１～３２ｎは、ステップＳ３２９において、次のミッションについての作業を受講者に説明する。このようにして、最後の工程までの演習が行われる。なお、演習問題への解答評価において問題点があれば、その部分についてのさらに詳細な説明や演習を行うことができる。

通信端末３２１～３２ｎは、ステップＳ３３１において、最後の工程での演習問題への受講者の解答を送信する。教育支援サーバ３１０は、ステップＳ３３３において、受講者の解答を評価する。最後の工程での演習問題の評価が所定レベルを超えている場合、教育支援サーバ３１０は、ステップＳ３３５において、受講者の受講成果を判定するための、予備知識や解答支援の無いコンペティション問題を生成する。なお、かかるコンペティション問題の生成は、テーマに対応した同じ問題であっても入力データが受講者によって異なる問題であるのが、平等なコンペティションを実現する上で必要である。本実施形態においては、かかる異なる入力データの生成を自動的に行い、かつ、異なる入力データ間の問題難度の差を少なく、あるいは、問題難度の差をコンペティションの結果に反映できるようにした。かかる問題生成は、管理者の通信端末３４０からの管理者とのインタラクションを通じて行われてもよい。教育支援サーバ３１０は、ステップＳ３３７において、受講者ごとに対応して生成したコンペティション問題を通信端末３２１～３２ｎに送信する。通信端末３２１～３２ｎは、ステップＳ３３９において、受講者ごとに異なるコンペティション問題を表示する。

通信端末３２１～３２ｎは、ステップＳ３４１において、受講者ごとの解答を教育支援サーバ３１０に送信し、教育支援サーバ３１０は、ステップＳ３４３において、上述した異なる入力データ間の問題難度の差を反映させながら、解答を評価してランキングを付す。その評価結果として、教育支援サーバ３１０は、ステップＳ３４５において、各受講者に進捗状況、ランキング、課題などを送信する。通信端末３２１～３２ｎは、ステップＳ３４７において、受信した各受講者に進捗状況、ランキング、課題などを表示する。

《教育支援サーバの機能構成》
図４は、本実施形態に係る教育支援サーバ３１０の機能構成を示すブロック図である。

教育支援サーバ３１０は、通信制御部４０１を備える。通信制御部４０１は、ネットワーク３３０を介した通信端末３２１～３２ｎとの通信を制御する。

教育支援サーバ３１０は、受講者管理部３１２として、受講者情報受信部４２７と受講者登録部４２２とを備える。なお、受講者管理部３１２には、受講管理用データベース３１５の受講者情報データベース４５２も含まれる。受講者情報受信部４２７は、ネットワーク３３０を介して接続された通信端末３２１～３２ｎからの受講者情報を受信する。受講者登録部４２２は、受講者情報を受講者情報データベース４５２に登録する。

教育支援サーバ３１０は、受講制御部３１１として、受講シーケンス制御部４１１と、作業説明部４１２と、演習送信部４１３と、演習解答受信部４１４と、解答評価部４１５と、を備える。なお、受講制御部３１１には、受講管理用データベース３１５の各データベースも含まれる。受講シーケンス制御部４１１は、受講者が受講するコースやテーマに対応して受講シーケンスを制御する。作業説明部４１２は、各テーマあるいは各テーマの各ミッションにおける作業について動画を含む説明を、通信端末３２１～３２ｎに送る。演習送信部４１３は、各テーマの各ミッションにおいて、そのミッションをクリアしたことを判定する演習問題を通信端末３２１～３２ｎに送信する。演習解答受信部４１４は、通信端末３２１～３２ｎからの受講者の演習問題への解答を受信する。解答評価部４１５は、受講者の演習問題への解答を評価する。各ミッションをクリアしたと評価すれば、次のミッションへの移行を受講シーケンス制御部４１１に通知する。

教育支援サーバ３１０は、課題設定部３１３として、問題生成部４３１と、問題送信部４３２と、を備える。なお、課題設定部３１３には、受講管理用データベース３１５の学習情報データベース４５１やコンペティション用データベース４５３も含まれる。問題生成部４３１は、受講シーケンス制御部４１１が各テーマの最終ミッションを完了したと判断した場合、受講したテーマについてのコンペティション問題を生成する。なお、かかるコンペティション問題はテーマに対応して同様であるが、その入力データは受講者によって異なるデータを自動的に生成する。問題送信部４３２は、受講者によって異なる入力データを含むコンペティション問題を通信端末３２１～３２ｎに送信する。

教育支援サーバ３１０は、成果判定部３１４として、問題評価部４４１と、問題解答受信部４４２と、解答判定部４４３と、解答判定送信部４４４と、を備える。なお、成果判定部３１４には、受講管理用データベース３１５の各データベースも含まれる。問題評価部４４１は、問題生成部４３１で生成したコンペティション問題の入力データに基づいて、コンペティション問題の難易度を評価し、問題解答に対する評価に反映させる。問題解答受信部４４２は、通信端末３２１～３２ｎからの受講者のコンペティション問題への解答を受信する。解答判定部４４３は、コンペティション問題への受講者の解答に問題評価部４４１が評価した問題の難易度を反映させて、受講テーマにおける受講者の受講成果として解答を判定する。なお、受講成果には、ランキング、レベル、提供するスコアなどが含まれる。解答判定送信部４４４は、受講者の受講成果を含む解答判定を通信端末３２１～３２ｎに送信する。

教育支援サーバ３１０の受講管理用データベース３１５には、学習情報データベース４５１と、受講者情報データベース４５２と、コンペティション用データベース４５３と、が含まれる。なお、受講管理用データベース３１５内の構成は図４に限定されず、複数のデータベースが合体されても、１つのデータベースが分割されても、一部同士が合体されてもよい。学習情報データベース４５１は、ＡＩ人材教育におけるプログラミング学習を支援する講座のコースやテーマ、その実施手順などを格納する。受講者情報データベース４５２は、講座を受講している受講者の登録、および、その受講者の受講内容や進捗情報、獲得スコア、ランキング、レベルなどを格納する。コンペティション用データベース４５３は、コンペティション問題に関する状況を格納する。なお、コンペティション問題には、各テーマの受講の最後に行われるコンペティション問題と、一般にオープンされて種々の課題についてのモデル提案を競うコンペティション問題とが含まれる。

（学習情報データベース）
図５Ａは、本実施形態に係る学習情報データベース４５１の構成を示す図である。学習情報データベース４５１は、講座のコースやテーマ、その実施手順などを格納する。

学習情報データベース４５１は、テーマ５１１に対応付けて複数のミッション５１２を記憶する。例えば、テーマ５１１が売上予測モデルであれば、複数のミッション５１２として、データ読み込みおよびデータ整形、検索・分析、モデリング、モデリング高度化、の４つのミッションが記憶される。そして、各ミッション５１２に対応して、作業動画解説を含むタスク５１３と、解決に必要な関数の演習問題５１４と、演習問題の解答５１５と、解答の評価方法５１６と、を記憶する。

なお、各テーマ５１１には、受講の成果を判定するためのテーマ別のコンペティション問題５２０を記憶する。なお、テーマ別のコンペティション問題５２０としては、コンペティション問題骨子５２１と、受講者により異なる入力データ５２２と、問題解答としての出力データ５２３と、を記憶する。受講者により異なる入力データ５２２としては、入力データ生成の元となる整形済データと、対象受講者ＩＤと、生成された入力データである被操作データまたは未整形データと、生成された擬似未整形データの二乗平均平方根誤差と、が記憶される。

（受講者情報データベース）
図５Ｂは、本実施形態に係る受講者情報データベース４５２の構成を示す図である。受講者情報データベース４５２は、受講中の受講者の受講内容や進捗情報、獲得スコア、ランキング、レベルなどを格納する。

受講者情報データベース４５２は、受講者ＩＤ５３１に対応付けて、登録された受講者情報５３２と、受講コース５３３と、選択テーマ５３４と、各テーマ別の進捗情報５３５と、受講者の進捗情報５３５と、を記憶する。なお、受講コース５３３としては、初級者向けのプログラミングトレーニングのコースと、中上級者向けの実践モデリングのコースとが含まれる。そして、受講者の進捗情報５３５には、例えば、獲得スコア、クリアしたテーマ数、現在のランキング、現在のレベルなどが含まれる。

（コンペティション用データベース）
図５Ｃは、本実施形態に係るコンペティション用データベース４５３の構成を示す図である。コンペティション用データベース４５３は、コンペティション問題に関する状況を格納する。

コンペティション用データベース４５３は、コンペティションＩＤ５４１に対応付けて、コンペティション種類５４２と、コンペティション内容５４３と、を記憶する。コンペティション種類５４２には、各テーマの受講の最後に成果を判定するためのテーマ別成果判定用のコンペティション問題と、オープンに一般からのモデル提案を競うオープンモデル提案用のコンペティション問題とがある。テーマ別成果判定用のコンペティション問題の場合は、各コンペティション問題に対して、解答情報５４４として、受講者ＩＤと解答内容とを記憶する。オープンモデル提案用のコンペティション問題の場合は、各コンペティション問題に対して、解答情報５４４として、提案者ＩＤと解答内容とを記憶する。さらに、コンペティション用データベース４５３は、各解答情報５４４に対応付けて、解答精度５４５と、解答順位５４６とを記憶する。

図５Ｃには、コンペティション内容として、テーマ別成果判定用のコンペティション問題である「売上予測モデル」５４７が図示されている。また、オープンモデル提案用のコンペティション問題である「豆腐の生産・売上予測モデル」５４８と、オープンモデル提案用のコンペティション問題である「新幹線走行場所の着雪量予測モデル」５４９と、が図示されている。

（コンペティション例）
図５Ｄは、本実施形態に係るコンペティションの一例５４８を示す図である。図５Ｄのコンペティションの一例５４８は、図５Ｃのオープンモデル提案用のコンペティション問題である「豆腐の生産・売上予測モデル」のコンペティション実行結果を示す。

図５Ｅは、本実施形態に係るコンペティションの他例５４９を示す図である。図５Ｅのコンペティションの他例５４９は、図５Ｃのオープンモデル提案用のコンペティション問題である「新幹線走行場所の着雪量予測モデル」のコンペティション実行結果を示す。

（問題生成部および問題評価部）
図６は、本実施形態に係る問題生成部４３１および問題評価部４４１の機能構成を示すブロック図である。図６において、図４と同様の構成要素は同じ参照番号を付している。

問題生成部４３１は、整形済データ取得部６１１と、被操作データ生成部６１２と、問題取得部６１３と、入力データ設定部６１４と、を有する。整形済データ取得部６１１は、例えば、学習情報データベース４５１から整形済データを取得する。なお、整形済データは、既存のデータ収集管理サイトなどからデータを取得して、予測または分類アルゴリズムを適用可能に整形したものであってもよい。

被操作データ生成部６１２は、入力データとして整形済データを入力し、出力データとして被操作データを出力する。受講者はかかる被操作データを入力データとして含むコンペティション問題の解答を予測または分類アルゴリズムを適用して得ようとする。例えば、被操作データ生成部６１２は、予測または分類アルゴリズムに不用なデータを追加する、または、予測または分類アルゴリズムに有用なデータを除去したり変更したりすることで、整形済データを被操作データに変換する。

問題取得部６１３は、各テーマについての最後のコンペティション問題骨子５２１を取得する。入力データ設定部６１４は、コンペティション問題骨子５２１の入力データを被操作データ生成部６１２で生成した被操作データに置き換えて、各受講者に特有の入力データを用いたコンペティション問題とする。なお、受講者ごとに異なる被操作データに置き換えることによっても、受講の成果評価が平等になるように調整する。

問題評価部４４１は、被操作データ取得部６２１と、誤差算出部６２２と、被操作データ評価部６２５と、を有する。被操作データ取得部６２１は、問題生成部４３１の被操作データ生成部６１２が生成した被操作データを取得する。誤差算出部６２２は、本実施形態においては、被操作データを重回帰分析した場合の評価である二乗平均平方根誤差（ＲＭＳＥ）の算出を行う。被操作データ評価部６２５は、誤差算出部６２２から出力された対象受講者への問題の入力データの二乗平均平方根誤差を評価する。そして、対象受講者の二乗平均平方根誤差がより大きい場合は、対象受講者に出題されたコンペティション問題の難易度が高くなっているとして、解答の評価時の基準をより低くする。一方、対象受講者の二乗平均平方根誤差がより小さい場合は、対象受講者に出題されたコンペティション問題の難易度が低くなっているとして、解答の評価時の基準をより高くする。なお、誤差算出は、二乗平均平方根誤差（ＲＭＳＥ）に限定されず、平均絶対誤差（ＭＡＥ）や決定係数Ｒ²などの他の評価関数であってもよい。

（被操作データ生成部の機能構成および処理手順）
本実施形態の被操作データ生成部６１２においては、入力データとしての整形済データに対して、行列で表された整形済データの行数および列数をそれぞれＮ、Ｍに拡張または縮小する。行数の縮小は、例えば、ランダムサンプリングした任意の行を削除することにより実現できる。また、行数の拡大は、例えば、ランダムサンプリングした任意の行にノイズを付加することにより実現できる。一方、列数の縮小は、例えば、ランダムサンプリングした任意の列を削除することにより実現できる。また、列数の拡大は例えば、ランダムサンプリングした任意の列と一定の相関を示す値を生成することにより実現できる。

図７は、本実施形態に係る被操作データ生成部６１２の機能構成を示すブロック図および処理手順を示すフローチャートである。このフローチャートは、教育支援サーバ３１０の不図示のＣＰＵがＲＡＭを用いて実行し、被操作データ生成部６１２の機能構成を実現する。

被操作データ生成部６１２は、次元数変換部７２１を有する。次元数変換部７２１は、整形済データ取得部６１１からの整形済データ７２２を入力し、入力データ設定部６１４および問題評価部４４１に被操作データ７２３を出力する。

被操作データ生成部６１２は、ステップＳ７０１において、入力データとして整形済データを取得する。被操作データ生成部６１２は、ステップＳ７０３において、整形済データの次元数を変換して、被操作データを生成する。そして、被操作データ生成部６１２は、ステップＳ７０５において、出力データとして、生成した被操作データを問題の入力データとして入力データ設定部６１４と問題評価部４４１に出力する。

（被操作データ生成部への入力データおよび出力データ）
図８は、本実施形態に係る被操作データ生成部６１２への入力データとしての整形済データ７２２および出力データとしての被操作データ７２３の構成を示す図である。なお、図８には、行や列の拡大の例を示すが、行や列の縮小も同様に可能である。

入力データとしての整形済データ７２２は、予測・分類モデルに入力可能なデータ形式に整形されている。整形済データ７２２は、小売業における売上予測モデルの生成に使用されるデータ例であり、“売上”を目的変数とし、それ以外の列を説明変数とすることで予測モデルを構築することができる。

出力データとしての被操作データ７２３は、列８３１や行８３２が拡大されたデータを示している。

（誤差算出部の機能構成）
誤差算出部６２２および被操作データ評価部６２５を含む問題評価部４４１においては、被操作データ生成部６１２によって生成された被操作データをコンペティション問題の入力データとして使用することを評価する。すなわち、被操作データ生成部６１２によって生成された被操作データを用いて予測アルゴリズムを適用した際のあらかじめ指定された評価関数による被操作データを用いた評価値を算出して、ベンチマーク精度値とする。本実施形態においては、予測アルゴリズムとして重回帰分析を適用し、評価関数として二乗平均平方根誤差（ＲＭＳＥ：Root Mean Squared Error）を使用する。図８の例では、売上をターゲット（目的変数）とし、それ以外を説明変数としたときの重回帰分析を適用した際の、ＲＭＳＥをベンチマークとする。なお、予測アルゴリズムと評価関数は上記例に限定されるものではない。

図９は、本実施形態に係る誤差算出部６２２の機能構成を示すブロック図と、誤差算出、問題評価および成果評価の処理手順を示すフローチャートとである。このフローチャートは、教育支援サーバ３１０の不図示のＣＰＵがＲＡＭを用いて実行し、問題評価部４４１および解答判定部４４３の機能構成を実現する。

誤差算出部６２２は、重回帰分析部９２１と二乗平均平方根誤差算出部９２２とを有する。重回帰分析部９２１は、被操作データ取得部６２１が被操作データ生成部６１２から取得した被操作データに基づいて、重回帰分析を行って回帰モデルを生成する。二乗平均平方根誤差算出部９２２は、重回帰分析部９２１が生成した回帰モデルによる予測値と被操作データとの誤差を算出して、誤差値を被操作データ評価部６２５に出力する。

問題評価部４４１の被操作データ取得部６２１は、ステップＳ９０１において、被操作データ生成部６１２が生成した被操作データを取得する。そして、誤差算出部６２２は、ステップＳ９０３において、被操作データに基づいた重回帰分析の誤差を算出する。ステップＳ９０３は、被操作データに基づいた重回帰分析によりモデルを生成するステップＳ９３１と、生成されたモデルに基づく予測値と被操作データとの二乗平均平方根誤差を算出するステップＳ９３３とを含む。

被操作データ評価部６２５は、ステップＳ９０５において、算出された二乗平均平方根誤差の大小に対応して、被操作データを入力データとして含む問題の評価基準を調整する。解答判定部４４３は、ステップＳ９０７において、コンペティション問題に対する受講者による解答を取得する。解答判定部４４３は、ステップＳ９０７において、ステップＳ９０５で調整された評価基準に基づいて、受講者による解答を評価判定する。

以上に説明したように、簡単に取得可能な生データを整形した整形済データさえあれば、この整形済データに種々の変換アルゴリズムによる操作を加えることにより、それぞれが固有（ユニーク）な被操作データを無数に生成することができる。この被操作データをコンペティション問題の入力データとして用いることで、受講者それぞれに特有のコンペティション問題を簡単に生成することができる。さらに、被操作データを評価することにより、コンペティション問題の難易度を判断することで、受講者の解答を公平公正に評価することも可能になる。

本実施形態によれば、整形済データに変換操作による加工を加えた被操作データとして問題に含まれる入力データを生成するので、人材教育におけるプログラミング学習の問題で用いる入力データを効率的に生成することができる。

本実施形態によれば、整形済データの列数や行数を拡張または縮小する簡単な処理により、コンペティション問題の異なる入力データとして大量の被操作データを生成できる。また、生成した被操作データのコンペティション問題の難易度への影響を評価できるので、公平公正なコンペティションが実現できる。

［第３実施形態］
次に、本発明の第３実施形態に係る教育支援システムについて説明する。本実施形態に係る教育支援システムは、上記第２実施形態と比べると、整形済データから被操作データを生成する処理を、整形済データの欠損率の制御で行う点で異なる。その他の構成および動作は、第２実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。

ここで、欠損率制御(m)は、入力データである整形済データの指定カラムの欠損率mを0.0～1.0で制御する。すなわち、人工的に欠損でないデータを欠損に置換、あるいは、欠損部分をデータで補完する処理を行う。例えば、ランダムに選んだセルを欠損値に置換する処理や、ランダムに選んだ欠損値に他のデータを用いて補間処理を実行することにより実現できる。

（被操作データ生成部の機能構成および処理手順）
図１０は、本実施形態に係る被操作データ生成部１０１２の機能構成を示すブロック図および処理手順を示すフローチャートである。このフローチャートは、教育支援サーバ３１０の不図示のＣＰＵがＲＡＭを用いて実行し、被操作データ生成部１０１２の機能構成を実現する。なお、図１０において、図７と同様の構成要素またはステップには同じ参照番号またはステップ番号を付して、重複する説明を省略する。

被操作データ生成部１０１２は、欠損率制御部１０２１を有する。欠損率制御部１０２１は、整形済データ取得部６１１からの整形済データ７２２を入力し、入力データ設定部６１４および問題評価部４４１に被操作データ１０２３を出力する。

被操作データ生成部１０１２は、ステップＳ７０１において、入力データとして整形済データを取得する。被操作データ生成部１０１２は、ステップＳ１００３において、整形済データに含まれる複数データのうち、ランダムに選んだデータを欠損とし、または、ランダムに選んだ欠損部分をデータで補完することにより欠損率を制御して、被操作データを生成する。すなわち、欠損でないデータを欠損に置換したり、欠損部分をデータで補完したりする。そして、被操作データ生成部１０１２は、ステップＳ７０５において、出力データとして、生成した被操作データを問題の入力データとして入力データ設定部６１４と問題評価部４４１に出力する。

（被操作データ生成部への入力データおよび出力データ）
図１１は、本実施形態に係る被操作データ生成部１０１２への入力データとしての整形済データ７２２および出力データとしての被操作データ１０２３の構成を示す図である。なお、図１１には、欠損でないデータを欠損に置換した例を示すが、欠損部分をデータで補完することも同様に可能である。

入力データとしての整形済データ７２２は、図８と同様である。出力データとしての被操作データ１０２３は、欠損でないデータが欠損値１１３１（ＮＡで示す）に置換されている。

本実施形態によれば、整形済データの欠損でないデータを欠損に置換、あるいは、欠損部分をデータで補完する簡単な処理により、コンペティション問題の異なる入力データとして大量の被操作データを生成できる。また、生成した被操作データのコンペティション問題の難易度への影響を評価できるので、公平公正なコンペティションが実現できる。

［第４実施形態］
次に、本発明の第４実施形態に係る教育支援システムについて説明する。本実施形態に係る教育支援システムは、上記第２実施形態および第３実施形態と比べると、整形済データから被操作データを生成する処理を、整形済データへのノイズの付加で行う点で異なる。その他の構成および動作は、第２実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。

ノイズ付加は、指定カラムへのランダムノイズを人工的に付加する。例えば、ランダムに選んだセルにランダムな値を付加する処理を実行することにより実現できる。なお、ノイズタイプおよびノイズパラメータとして、分布形およびパラメータの指定も可能である。入力データが文字列であれば、文字列に対する全角化や半角化、改行コードの変換等によりノイズを付加する。

（被操作生成部の機能構成および処理手順）
図１２は、本実施形態に係る被操作データ生成部１２１２の機能構成を示すブロック図および処理手順を示すフローチャートである。このフローチャートは、教育支援サーバ３１０の不図示のＣＰＵがＲＡＭを用いて実行し、被操作データ生成部１２１２の機能構成を実現する。なお、図１２において、図７と同様の構成要素またはステップには同じ参照番号またはステップ番号を付して、重複する説明を省略する。

被操作データ生成部１２１２は、ノイズ付加部１２２１を有する。ノイズ付加部１２２１は、整形済データ取得部６１１からの整形済データ７２２を入力し、入力データ設定部６１４および問題評価部４４１に被操作データ１２２３を出力する。

被操作データ生成部１２１２は、ステップＳ７０１において、入力データとして整形済データを取得する。被操作データ生成部１２１２は、ステップＳ１２０３において、整形済データにノイズを付加して、被操作データを生成する。そして、被操作データ生成部１２１２は、ステップＳ７０５において、出力データとして、生成した被操作データを入力データ設定部６１４と問題評価部４４１に出力する。

（被操作データ生成部への入力データおよび出力データ）
図１３は、本実施形態に係る被操作データ生成部１２１２への入力データとしての整形済データ７２２および出力データとしての被操作データ１２２３の構成を示す図である。

入力データとしての整形済データ７２２は、図８と同様である。出力データとしての被操作データ１２２３は、列１３３１のデータのノイズが付加されている。

本実施形態によれば、整形済データにノイズを付加する簡単な処理により、コンペティション問題の異なる入力データとして大量の被操作データを生成できる。また、生成した被操作データのコンペティション問題の難易度への影響を評価できるので、公平公正なコンペティションが実現できる。

［第５実施形態］
次に、本発明の第５実施形態に係る教育支援システムについて説明する。本実施形態に係る教育支援システムは、上記第２実施形態乃至第４実施形態と比べると、整形済データから被操作データを生成する処理を、整形済データの冗長化により行う点で異なる。その他の構成および動作は、第２実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。

冗長化（Nr, Cr）の処理では、整形済データのターゲット変数に不要なレコードNrを追加する。あるいは、無意味なカラムCrを追加する。例えば、列であればランダムに生成した値を付加する処理、行であれば各列中からランダムに選んだ値を各列の値として付加する処理を実行することにより実現できる。

（被操作データ生成部の機能構成および処理手順）
図１４は、本実施形態に係る被操作データ生成部１４１２の機能構成を示すブロック図および処理手順を示すフローチャートである。このフローチャートは、教育支援サーバ３１０の不図示のＣＰＵがＲＡＭを用いて実行し、被操作データ生成部１４１２の機能構成を実現する。なお、図１４において、図７と同様の構成要素またはステップには同じ参照番号またはステップ番号を付して、重複する説明を省略する。

被操作データ生成部１４１２は、冗長化部１４２１を有する。冗長化部１４２１は、整形済データ取得部６１１からの整形済データ７２２を入力し、入力データ設定部６１４および問題評価部４４１に被操作データ１４２３を出力する。

被操作データ生成部１４１２は、ステップＳ７０１において、入力データとして整形済データを取得する。被操作データ生成部１４１２は、ステップＳ１６０３において、整形済データを不要データで冗長化して、被操作データを生成する。そして、被操作データ生成部１４１２は、ステップＳ７０５において、出力データとして、生成した被操作データを入力データ設定部６１４と問題評価部４４１に出力する。

（被操作データ生成部への入力データおよび出力データ）
図１５は、本実施形態に係る被操作データ生成部１４１２への入力データとしての整形済データ７２２および出力データとしての被操作データ１４２３の構成を示す図である。

入力データとしての整形済データ７２２は、図８と同様である。出力データとしての被操作データ１４２３は、整形済データ７２２に対して、行１５３１や列１５３２を追加して冗長化した被操作データを生成している。

本実施形態によれば、整形済データに所定データ、例えば行や列を追加して冗長化する簡単な処理により、コンペティション問題の異なる入力データとして大量の被操作データを生成できる。また、生成した被操作データのコンペティション問題の難易度への影響を評価できるので、公平公正なコンペティションが実現できる。

［第６実施形態］
次に、本発明の第６実施形態に係る教育支援システムについて説明する。本実施形態に係る教育支援システムは、上記第２実施形態乃至第５実施形態と比べると、整形済データから被操作データを生成する処理を、整形済データ中のターゲット変数の分布を変換することにより行う点で異なる。その他の構成および動作は、第２実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。

ターゲット分布の変換において、分類問題の場合はクラスラベルの分布（正例率Pr）を変換する。一方、回帰問題の場合はターゲット変数の分布形およびパラメータを変換する。例えば、分類問題の場合、正例・負例を正例率に合うようにランダムサンプリング処理を実行することにより実現できる。また、回帰問題の場合、Box-cox変換処理（正規分布への変換処理の場合）を実行することにより実現できる。かかる変換処理は変換後の分布形に依存して選択される。

（被操作データ生成部の機能構成および処理手順）
図１６は、本実施形態に係る被操作データ生成部１６１２の機能構成を示すブロック図および処理手順を示すフローチャートである。このフローチャートは、教育支援サーバ３１０の不図示のＣＰＵがＲＡＭを用いて実行し、被操作データ生成部１６１２の機能構成を実現する。なお、図１６において、図７と同様の構成要素またはステップには同じ参照番号またはステップ番号を付して、重複する説明を省略する。

被操作データ生成部１６１２は、分布変換部１６２１を有する。分布変換部１６２１は、整形済データ取得部６１１からの整形済データ７２２を入力し、入力データ設定部６１４および問題評価部４４１に被操作データ１６２３を出力する。

被操作データ生成部１６１２は、ステップＳ７０１において、入力データとして整形済データを取得する。被操作データ生成部１６１２は、ステップＳ２００３において、整形済データ中のターゲット変数の分布を変換して、被操作データを生成する。そして、被操作データ生成部１６１２は、ステップＳ７０５において、出力データとして、生成した被操作データを入力データ設定部６１４と問題評価部４４１に出力する。

（被操作データ生成部への入力データおよび出力データ）
図１７は、本実施形態に係る被操作データ生成部１６１２への入力データとしての整形済データ７２２および出力データとしての被操作データ１６２３の構成を示す図である。

入力データとしての整形済データ７２２は、図８と同様である。出力データとしての被操作データ１６２３は、整形済データ７２２のターゲット変数である“売上”の分布を変換している（１７３１）。

本実施形態によれば、整形済データの正例率を維持しながらクラスまたはラベルの分布を変換したり、整形済データのターゲット変数の分布を変換したりする簡単な処理により、コンペティション問題の異なる入力データとして大量の被操作データを生成できる。また、生成した被操作データのコンペティション問題の難易度への影響を評価できるので、公平公正なコンペティションが実現できる。

［第７実施形態］
次に、本発明の第７実施形態に係る教育支援システムについて説明する。本実施形態に係る教育支援システムは、上記第２実施形態乃至第６実施形態と比べると、整形済データから変形操作により未整形データを生成する点で異なる。ここで変形操作とは、整形済データをデータの内容や性質を変化させずに変形した未整形データを生成する処理である。本実施形態においては、この処理を、整形済データのダミー変数をデータに変える非ダミー化により行う。その他の構成および動作は、第２実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。

《教育支援サーバの機能構成》
図１８は、本実施形態に係る教育支援サーバ１８１０の機能構成を示すブロック図である。なお、図１８において、図４と同じ機能構成には同じ参照番号を付して、重複する説明は省略する。

教育支援サーバ１８１０は、課題設定部１８１３と、成果判定部１８１４と、を備える。課題設定部１８１３は、問題生成部１８３１を有する。問題生成部１８３１は、図４の問題生成部４３１と異なり、整形済データをデータの内容や性質を変化させずに変形した未整形データをコンペティション問題の入力データとする。したがって、成果判定部１８１４には、図４の成果判定部３１４にあった問題評価部４４１を有しない。未整形データは、整形済データから内容や性質が変化してないので、元の入力データを含む問題作成時との問題の難易度に変化は見られない。

このように、本実施形態の教育支援サーバ１８１０においては、特に、未整形データを整形済データに整形する問題に対する、受講者の解答能力の成果が判定される。

（問題生成部）
図１９は、本実施形態に係る問題生成部１８３１の機能構成を示すブロック図である。なお、図１９において、図４および図６と同様の機能構成には同じ参照番号を付して、重複する説明を省略する。

問題生成部１８３１は、未整形データ生成部１９１２を有する。未整形データ生成部１９１２は、入力データとして整形済データを入力し、出力データとして未整形データを出力する。受講者はかかる未整形データを入力データとして含むコンペティション問題の解答を予測または分類アルゴリズムを適用して得ようとする。例えば、未整形データ生成部１９１２は、整形済データにデータの内容や性質を変化させない変形を加えて、コンペティション問題の入力データとしての未整形データを生成する。

（未整形データ生成部の機能構成および処理手順）
図２０は、本実施形態に係る未整形データ生成部１９１２の機能構成を示すブロック図および処理手順を示すフローチャートである。このフローチャートは、教育支援サーバ３１０の不図示のＣＰＵがＲＡＭを用いて実行し、未整形データ生成部１９１２の機能構成を実現する。なお、図２０において、図７と同様の構成要素またはステップには同じ参照番号またはステップ番号を付して、重複する説明を省略する。

未整形データ生成部１９１２は、非ダミー化部２０２１を有する。非ダミー化部２０２１は、整形済データ取得部６１１からの整形済データ７２２を入力し、入力データ設定部６１４および問題評価部４４１に未整形データ２０２３を出力する。

未整形データ生成部１９１２は、ステップＳ７０１において、入力データとして整形済データを取得する。未整形データ生成部１９１２は、ステップＳ２００３において、整形済データのダミー変数を非ダミー化して、未整形データを生成する。そして、未整形データ生成部１９１２は、ステップＳ７０５において、出力データとして、生成した未整形データを入力データ設定部６１４と問題評価部４４１に出力する。

（未整形データ生成部への入力データおよび出力データ）
図２１は、本実施形態に係る未整形データ生成部１９１２への入力データとしての整形済データ７２２および出力データとしての未整形データ２０２３の構成を示す図である。

入力データとしての整形済データ７２２は、図８と同様である。出力データとしての未整形データ２０２３は、整形済データ７２２の“晴れ”、“雨”、“曇り”の３つのダミー変数を、１変数の“天気”２１３１に非ダミー化している。

本実施形態によれば、整形済データのダミー変数をデータに変換して非ダミー化する簡単な処理により、コンペティション問題の異なる入力データとして大量の未整形データを生成できる。

［第８実施形態］
次に、本発明の第８実施形態に係る教育支援システムについて説明する。本実施形態に係る教育支援システムは、上記第７実施形態と比べると、整形済データから未整形データを生成する処理を、整形済データの分割化、特にテーブルの分割化により行う点で異なる。その他の構成および動作は、第２実施形態および第７実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。

テーブル分割化（Nd, Cd）では、入力データを複数(Nd, Cd)のテーブルに分割する。その際に、プライマリーキーを生成して結合性を担保する。例えば、ＳＱＬにおける、"inner join", "outer join"等の結合方法指定に対応した分割も可能である。

（未整形データ生成部の機能構成および処理手順）
図２２は、本実施形態に係る未整形データ生成部２２１２の機能構成を示すブロック図および処理手順を示すフローチャートである。このフローチャートは、教育支援サーバ３１０の不図示のＣＰＵがＲＡＭを用いて実行し、未整形データ生成部２２１２の機能構成を実現する。なお、図２２において、図７と同様の構成要素またはステップには同じ参照番号またはステップ番号を付して、重複する説明を省略する。

未整形データ生成部２２１２は、データ分割部２２２１を有する。データ分割部２２２１は、整形済データ取得部６１１からの整形済データ７２２を入力し、入力データ設定部６１４および問題評価部４４１に未整形データ２２２３を出力する。

未整形データ生成部２２１２は、ステップＳ７０１において、入力データとして整形済データを取得する。未整形データ生成部２２１２は、ステップＳ１８０３において、整形済データを複数ブロックに分割して、未整形データを生成する。整形済データがテーブルの場合は、プライマリーキーを生成してテーブルを分割する。そして、未整形データ生成部２２１２は、ステップＳ７０５において、出力データとして、生成した未整形データを入力データ設定部６１４と問題評価部４４１に出力する。

（未整形データ生成部への入力データおよび出力データ）
図２３は、本実施形態に係る未整形データ生成部２２１２への入力データとしての整形済データ７２２および出力データとしての未整形データ２２２３の構成を示す図である。

入力データとしての整形済データ７２２は、図８と同様である。出力データとしての未整形データ２２２３は、行ＩＤをプライマリーキーにし、整形済データ７２２を３つのテーブル２３２１～２３２３に分割して未整形データを生成している。なお、プライマリーキーはＩＤのような明示的なものでなく、文字列等の値でもよい。

本実施形態によれば、整形済データからプライマリーキーを生成して、整形済データを複数のブロックに分割する簡単な処理により、コンペティション問題の異なる入力データとして大量の未整形データを生成できる。

［第９実施形態］
次に、本発明の第９実施形態に係る教育支援システムについて説明する。本実施形態に係る教育支援システムは、上記第２実施形態乃至第８実施形態と比べると、第２実施形態から第８実施形態で示した、整形済データから被操作データや未整形データへの種々の生成方法を、選択可能にした点で異なる。その他の構成および動作は、第２実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。

（問題生成部の機能構成）
図２４は、本実施形態に係る問題生成部２４３１の機能構成を示すブロック図である。なお。図２４において、図６の問題生成部４３１と同様の構成要素には同じ参照番号を付して、重複する説明を省略する。

問題生成部２４３１は、アルゴリズム選択部２４１０と、入力データ生成部２４１２とを有する。アルゴリズム選択部２４１０は、選択テーブル２４１１を有し、第２実施形態から第８実施形態で示した整形済データから被操作データや未整形データへの種々の変換アルゴリズムや変形操作から少なくとも１つを選択して、入力データ生成部２４１２に提供する。入力データ生成部２４１２は、選択された変換アルゴリズムや変形操作を用いて、整形済データから被操作データや未整形データをコンペティション問題の入力データとして生成する。

（選択テーブル）
図２５は、本実施形態に係る選択テーブル２４１１の構成を示す図である。選択テーブル２４１１は、アルゴリズム選択部２４１０が整形済データから被操作データや未整形データへの変換アルゴリズムや変形操作の少なくとも１つを選択するために使用される。

選択テーブル２４１１は、変換アルゴリズムＩＤ２５１１に対応付けて、変換アルゴリズムの内容２５１２と、解答判定に用いられるデータ変換の評価の要否２５１３と、それぞれの変換アルゴリズムを使用するか否かの使用／不使用フラグ２５１４と、を記憶する。

（入力データ生成部への入力データおよび出力データ）
図２６は、本実施形態に係る入力データ生成部２４１２への入力データとしての整形済データ７２２および出力データとしての、コンペティション問題への入力データ２４２３の構成を示す図である。

入力データとしての整形済データ７２２は、図８と同様である。出力データとしてのコンペティション問題への入力データ２４２３は、欠損でないデータが欠損値１１３１（ＮＡで示す）に置換されている。さらに、行ＩＤをプライマリーキーにし、欠損でないデータが欠損値１１３１に置換されたデータを３つのテーブル２３２１、２６２２および２６２３に分割してコンペティション問題への入力データ２４２３を生成している。

なお、本実施形態においては、欠損率制御とデーブル分割との組み合わせを説明したが、図２５に示される変換アルゴリズムや変形操作の様々な組み合わせにより、簡単に多様なコンペティション問題への入力データを生成することができる。

本実施形態によれば、予測または分類アルゴリズム、あるいは、整形済データに適した変換アルゴリズムや変形操作を選択して、整形済データから被操作データや未整形データへの変換ができるので、より公平公正なコンペティションを実現することができる。

［他の実施形態］
以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明の技術的範囲で当業者が理解し得る様々な変更をすることができる。また、それぞれの実施形態に含まれる別々の特徴を如何様に組み合わせたシステムまたは装置も、本発明の技術的範囲に含まれる。

また、本発明は、複数の機器から構成されるシステムに適用されてもよいし、単体の装置に適用されてもよい。さらに、本発明は、実施形態の機能を実現する情報処理プログラムである教育支援プログラムが、システムあるいは装置に供給され、内蔵されたプロセッサによって実行される場合にも適用可能である。したがって、本発明の機能をコンピュータで実現するために、コンピュータにインストールされるプログラム、あるいはそのプログラムを格納した媒体、そのプログラムをダウンロードさせるＷＷＷ(World Wide Web)サーバも、プログラムを実行するプロセッサも本発明の技術的範囲に含まれる。特に、少なくとも、上述した実施形態に含まれる処理ステップをコンピュータに実行させるプログラムを格納した非一時的コンピュータ可読媒体（non-transitory computer readable medium）は本発明の技術的範囲に含まれる。

Claims

ＡＩ(artificial intelligence)人材教育におけるプログラミング学習を支援する教育支援システムであって、
収集されたデータから表の形に整形された整形済データを取得する整形済データ取得部と、
前記整形済データに対して、プログラミング学習の成果を判定するための問題の難易度に影響を与える加工を加えることによって、前記問題に含まれる入力データを生成する入力データ生成部と、
を備える教育支援システム。
前記入力データ生成部は、前記整形済データに変換操作を加えた被操作データを前記入力データとして生成する被操作データ生成部を含む請求項１に記載の教育支援システム。
前記被操作データの前記問題の難易度への影響を評価する被操作データ評価部と、
前記被操作データの評価結果を反映させて、前記プログラミング学習の成果を判定する成果判定部と、
をさらに備える請求項２に記載の教育支援システム。
前記被操作データ評価部は、前記被操作データに所定のアルゴリズムを適用した場合に、所定の評価関数を用いて前記被操作データを評価する請求項３に記載の教育支援システム。
前記所定のアルゴリズムは重回帰分析を含み、前記所定の評価関数は二乗平均平方根誤差を求める関数を含む請求項４に記載の教育支援システム。
前記被操作データ生成部は、前記整形済データに対して、予測または分類アルゴリズムに不用なデータを追加する、または、前記予測または分類アルゴリズムに有用なデータを除去したり変更したりする請求項２乃至５のいずれか１項に記載の教育支援システム。
前記被操作データ生成部は、前記整形済データが行列である場合、行数および列数の少なくともいずれかを拡張または縮小して前記被操作データを生成する請求項６に記載の教育支援システム。
前記被操作データ生成部は、前記整形済データに含まれる複数データのうち、ランダムに選んだデータを欠損とし、または、ランダムに選んだ欠損部分をデータで補完して、前記被操作データを生成する請求項６に記載の教育支援システム。
前記被操作データ生成部は、前記整形済データに含まれる複数データのうち、ランダムに選んだデータにノイズを付加して、前記被操作データを生成する請求項６に記載の教育支援システム。
前記被操作データ生成部は、前記整形済データが行列である場合、ランダムに選んだ行およびランダムに選んだ列の少なくともいずれかにノイズを付加する請求項９に記載の教育支援システム。
前記被操作データ生成部は、前記整形済データに所定データを追加して、前記被操作データを生成する請求項６に記載の教育支援システム。
前記被操作データ生成部は、前記整形済データが行列である場合、ランダムに生成したデータを含む列を追加、あるいは、列中からランダムに選んだデータを含む行を追加して、前記被操作データを生成する請求項１１に記載の教育支援システム。
前記被操作データ生成部は、前記整形済データの分布を変換して、前記被操作データを生成する請求項６に記載の教育支援システム。
前記被操作データ生成部は、前記問題が分類問題である場合、正例率を維持しながらクラスまたはラベルの分布を変換することで前記被操作データを生成する請求項１３に記載の教育支援システム。
前記被操作データ生成部は、前記問題が回帰問題である場合、ターゲット変数の分布形を変換することで前記被操作データを生成する請求項１３に記載の教育支援システム。
前記入力データ生成部は、前記整形済データに変形操作を加えた未整形データを前記入力データとして生成する未整形データ生成部を含む請求項１または２に記載の教育支援システム。
前記未整形データ生成部は、前記整形済データに含まれたダミー変数のいずれかを前記ダミー変数が表すデータに置換して、前記未整形データを生成する請求項１６に記載の教育支援システム。
前記未整形データ生成部は、前記整形済データが行列である場合、前記ダミー変数で表された複数の行または複数の列を１行または１列のデータに置換して、前記未整形データを生成する請求項１７に記載の教育支援システム。
前記未整形データ生成部は、前記整形済データを複数のブロックに分割して、前記未整形データを生成する請求項１６に記載の教育支援システム。
前記未整形データ生成部は、前記整形済データが行列である場合、列または行を複数の行または列からなるブロックに分割して、前記未整形データを生成する請求項１９に記載の教育支援システム。
ＡＩ(artificial intelligence)人材教育におけるプログラミング学習を支援する教育支援方法であって、
整形済データ取得部が、収集されたデータから表の形に整形された整形済データを取得する整形済データ取得ステップと、
入力データ生成部が、前記整形済データに対して、プログラミング学習の成果を判定するための問題の難易度に影響を与える加工を加えることによって、前記問題に含まれる入力データを生成する入力データ生成ステップと、
を含む教育支援方法。
ＡＩ(artificial intelligence)人材教育におけるプログラミング学習を支援する教育支援プログラムであって、
収集されたデータから表の形に整形された整形済データを取得する整形済データ取得ステップと、
前記整形済データに対して、プログラミング学習の成果を判定するための問題の難易度に影響を与える加工を加えることによって、前記問題に含まれる入力データを生成する入力データ生成ステップと、
をコンピュータに実行させる教育支援プログラム。