JP3733425B2 - Language acquisition support device, language acquisition support program, and language acquisition support method - Google Patents

Language acquisition support device, language acquisition support program, and language acquisition support method Download PDF

Info

Publication number
JP3733425B2
JP3733425B2 JP2002240749A JP2002240749A JP3733425B2 JP 3733425 B2 JP3733425 B2 JP 3733425B2 JP 2002240749 A JP2002240749 A JP 2002240749A JP 2002240749 A JP2002240749 A JP 2002240749A JP 3733425 B2 JP3733425 B2 JP 3733425B2
Authority
JP
Japan
Prior art keywords
word
preference
character
candidate
degree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2002240749A
Other languages
Japanese (ja)
Other versions
JP2004077995A (en
Inventor
真樹 村田
均 井佐原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute of Information and Communications Technology
Original Assignee
National Institute of Information and Communications Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Institute of Information and Communications Technology filed Critical National Institute of Information and Communications Technology
Priority to JP2002240749A priority Critical patent/JP3733425B2/en
Publication of JP2004077995A publication Critical patent/JP2004077995A/en
Application granted granted Critical
Publication of JP3733425B2 publication Critical patent/JP3733425B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Electrically Operated Instructional Devices (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、シリトリ遊びを応用して言語を習得するために役立つ言語獲得支援装置、及びそのためのプログラム並びに方法に関するものである。
【0002】
【従来の技術】
誰もが幼少期から慣れ親しんできたシリトリ遊びは多くの国に存在し、単にゲームとしての楽しみを味わうという側面を有するだけでなく、子供が母国語の単語を覚えたり、外国人が他国語を覚えるのに役立つという教育的側面や、人間と機械とのコミュニケーションをテーマとする研究対象となるという学究的側面をも有している。近年では、例えば教育的側面である言語習得の補助を目的としたシリトリゲームソフトの開発がなされている。また、人間がどのようなときに楽しみを感じるかという研究では、シリトリの相手がシリトリゲームソフトであってもそれが人間であると教示されているときに面白さを感じるという研究結果も得られている。
【0003】
【発明が解決しようとする課題】
ところで、シリトリには、例えば日本語でいえば「ん」という文字を語頭に有する単語が存在しないためにその文字「ん」を語尾に有する単語を出すと「負け」になる、というような各言語ごとの一定のルールが存在する。このようなルールの下では、ある文字を語頭とする単語は多いが他の文字を語頭とする単語は少ない、といった文字に依存する有利不利があり、人間同士の単なるシリトリ遊びでは各個人が経験的に自己に有利となるようにゲームを進めている。しかしながら、文字ごとの有利さや不利さを数量的な統計データとすることは容易ではないため、上述のシリトリゲームソフトの開発や研究においても、単に多くの語彙を集めて各単語の語頭文字や語尾文字を抽出した結果を利用するに留まっている。
【0004】
そこで本発明は、シリトリにおいてどのような戦略を採用すると有利になるか、あるいは不利になるかという数量的調査研究に基づいて、シリトリを利用して言語習得に有益な装置、プログラム及び方法を提供するものである。
【0005】
【課題を解決するための手段】
本発明は、入力された提示単語の語尾文字を語頭文字とする当該提示単語とは異なり且つ既に入力された又は出力した単語以外の回答単語を出力する所定のシリトリに係る規則に基づいた言語獲得支援装置Aであって、提示単語の入力を受け付ける入力受付部1と、この入力を受け付けた提示単語の語尾文字に基づいてその語尾文字を語頭文字とし既に入力を受け付けた又は既に出力した単語を除く候補単語を所定の単語辞書DB1から自動抽出する候補単語抽出部2と、前記単語辞書DB1に含まれる文字ごとに関してシリトリに勝つための複数の数量的統計データDB2に基づいて候補単語抽出部2で抽出した候補単語ごとに文字に依存するシリトリでの有利さの度合いを示す選好度を演算する選好度演算部3と、回答単語に決定する回答単語決定部4と、この決定された候補単語を回答単語として出力する回答単語出力部5とを具備する言語獲得支援装置A1(図1)の構成に加えて、自然言語文を格納した所定のコーパスDB3における提示単語が出現する文数等の頻度と、このコーパスDB2において提示単語と各候補単語が共に出現する頻度とを含む所定の演算式で得られる連想度を演算する連想度演算部6をさらに具備し、回答単語決定部4において、選好度演算部3の演算結果である選好度と連想度演算部6の演算結果である連想度をの値が大きいほど大きい値が得られる演算式により候補単語ごとの良好度を求め、当該良好度が最大の候補単語を回答単語に決定するように構成していることを基本的な特徴としている(図2)。このような言語獲得支援装置Aは、所定の方法に基づくプログラムに従い専用コンピュータ又は汎用コンピュータを動作させることによって所期の機能を実現する。
【0006】
すなわち、ユーザとコンピュータである言語獲得支援装置とが交互にシリトリを進める上で、ユーザが入力した提示単語に対してその語尾文字を語頭文字とするシリトリで勝つために演算された最高の選好度と、人間の「単語に関する連想のし易さ」という観点から演算された最高の連想度を有する、つまり最適な良好度の回答単語を当該言語獲得支援装置が出力することになる。したがって、ユーザが提示単語を入力し、それに対応して言語獲得支援装置が回答単語を出力するのを繰り返すことで一連のシリトリが成立し、それによってユーザは自己の有する語彙に加えて出力される単語を楽しみながら知ることができるようになる。なお、シリトリの規則は一連のシリトリを始める前に適宜決めておくことができ、また、単語辞書及びそれに対応する統計データはコンピュータに内蔵又は接続して利用することができるものであれば適したものを利用することができる。また、選好度の演算に際しては、既に入力を受け付けた単語や既に出力した単語を数量的統計データから除外して演算するようにしたり、それらの単語を除外せずに演算するようにするなどのバリエーションが考えられる。
【0007】
ところで、コンピュータである言語獲得支援装置は、単語辞書に回答単語として出力可能な単語が残っている限り、コンピュータ自身にとって有利となり且つ相手方であるユーザに取って不利となるような戦法を採用することによって、人間であるユーザに負けないようにシリトリを進めることができるようになる。そこで本発明は単語辞書に基づく数量的統計データを利用するものであるので、この数量的統計データを用いて語尾文字が同じである単語を連続的に回答単語として出力し、ユーザが使用できる単語を減らすことなどを基本的な戦法の考え方として、具体的には次のような方法を採用している。まず、数量的統計データDB2を、候補単語の語尾文字を語頭文字とする単語の数に対する候補単語の語尾文字を語頭文字として持ち且つシリトリの規則において負けを意味する文字を語尾文字に持つ単語の数の比率を選好度要素値として有するものとして、選好度演算部3において、選好度要素値の値が大きい候補単語ほど有利さの度合いが大きいことを示す演算式で得られる選好度を演算するようにすることが考えられる。すなわち、ある文字から始まる単語群の総数に対して、負けを意味する文字で終わる単語の数が大きい文字を語尾に有する単語で回答するほど、相手であるユーザは負けを意味する文字を語尾とする単語を入力しやすくなるので、コンピュータ側にとって有利である。なお、シリトリの規則において負けを意味する文字とは、例えば日本語であれば原則的に文字「ん」が該当するが、その他の文字を語尾とする場合に負けとなるような任意の規則を設定しておくことができる。
【0008】
さら本発明では、数量的統計データDB2を、候補単語の語尾文字を語頭文字とする二文字のみで構成される単語の集合においてそれら単語の語頭文字の種類の数を選好度要素値として有するものとして、選好度演算部3において、選好度要素値の値が大きい候補単語ほど有利さの度合いが大きいことを示す演算式で得られる選好度を演算するようにする方法を採用している。すなわち、二文字という比較的短い単語は人間にとって極めて想起し易いものであるので、多様な文字を語頭に有する二文字の単語で回答するほど有利となる。
【0009】
本発明では以上のような態様の他にも、数量的統計データDB2を、候補単語の語尾文字を語尾文字とする単語の集合においてそれら単語の語頭文字の種類の数を選好度要素値として有するものとしておき、選好度演算部3において、選好度要素値の値が大きい候補単語ほど有利さの度合いが大きいことを示す演算式で得られる選好度を演算するようにしてもよい。この方法であると、様々な文字で始まる単語で回答することができるので、ユーザに対する「攻め」が続き易くなる。
【0010】
さらに、数量的統計データDB2を、候補単語の語尾文字を語頭文字として持ち且つシリトリの規則において負けを意味する文字を語尾文字に持たない単語の数に対する候補単語の語尾文字を誤字文字とする単語の数の比率を選好度要素値として有するものとして、選好度演算部3で、選好度要素値の値が大きい候補単語ほど有利さの度合いが大きいことを示す演算式で得られる選好度を演算する方法を採用することができる。この場合は、語頭にくる文字の種類に比べて語尾にくる文字の種類が多くないと、ユーザに対する「攻め」が続かなくなるからである。
【0011】
さらにまた、数量的統計データDB2を、候補単語の語頭文字を語尾文字に持つ単語の数を選好度要素値として有するものとし、選好度演算部3において、選好度要素値の値が小さい候補単語ほど有利さの度合いが大きいことを示す演算式で得られる選好度を演算するような戦法を採ると、提示単語の語尾文字と同じ文字の回答単語で切り返して出力することになるため、ユーザは次の提示単語を想起するのに窮することになると考えられる。
【0012】
その他、数量的統計データDB2を、候補単語の語尾文字を語頭文字とする単語の数を選好度要素値として有するものとして、選好度演算部3において、選好度要素値の値が小さい候補単語ほど有利さの度合いが大きいことを示す演算式で得られる選好度を演算するようにしてもよい。すなわち、語尾文字の種類が少ない単語を回答単語として出力すると、ユーザは必然的に種類が少ない語頭文字を有する単語の中から次の単語を考える必要があることになり、ユーザにとって「攻め」が続きにくくなるからである。
【0013】
また、数量的統計データDB2を、候補単語の語尾文字を語頭文字として持つ単語の数を選好度要素値としてさらに有するものとしておき、選好度演算部3においてが、前記選好度要素値の値が大きい候補単語ほど有利さの度合いが大きいことを示す演算式で得られる選好度を演算するようにしてもよい。
【0014】
さらに、一連のシリトリにおいて使用可能な単語の分野を所定のものに制限する場合があるが、これを好適に実現するためには、例えば図3に示す言語獲得支援装置A3のように、上述した言語獲得支援装置A1における基本的構成態様構成に加えて、シリトリの規則として利用可能な単語群の複数の分野を設定しておき、いずれかの分野を指定する分野変更命令の入力を受け付けることにより一連のシリトリにおける単語群の分野を変更する単語分野変更部7をさらに設けるとよい。特に図2に示した言語獲得支援装置A2に単語分野変更部7の機能を加える場合には、図3に示すように、この単語分野変更部7の機能を、入力を受け付けた分野変更命令に基づいて、予め分野ごとに設定された複数の単語辞書、複数の統計データ又は自然言語文を格納した複数のコーパスの少なくとも何れか一つからそれに対応する参照すべき単語辞書、統計データ又はコーパスを選択するものとしてもよい。
【0015】
また、ユーザの言語修得度によっては、一連のシリトリにおける難易度を変更できるようにしておくとよい場合がある。この場合、図3に示す言語獲得支援装置A3のように、シリトリの規則として利用可能な複数の難易度を設定しておき、いずれかの難易度を指定する難易度変更命令の入力を受け付けることにより一連のシリトリにおける難易度を変更する難易度変更部8をさらに設けることが望ましい。
【0016】
この難易度変更部8の具体的に好ましい機能としては、予め設定された複数の難易度にそれぞれ対応した複数の単語辞書DB1及び統計データDB2から入力を受け付けた難易度変更命令に対応する単語辞書DB1及び統計データDB2を選択するものが挙げられる。また、難易度変更部8は、入力を受け付けた難易度変更命令に従って、選好度を演算する演算式に変更を加えるものとしてもよい。さらに、図2に示した言語獲得支援装置A2に単語分野変更部7の機能を加える場合には、難易度変更部8において、予め設定された複数の難易度にそれぞれ対応した複数の単語辞書DB1及び複数の統計データDB2、又は自然言語文を格納した複数のコーパスDB3から入力を受け付けた難易度変更命令に対応する単語辞書DB1及び統計データDB2、又はコーパスDB3を選択するものとしてもよい。なお、ここで用いる単語辞書DB1、統計データDB2、コーパスDB3は、分野変更部7で用いる単語辞書DB1、統計データDB2、コーパスDB3と同一でも異なっていてもよい。その他、難易度変更部8は、選好度及び連想度に基づいて回答単語を決定するための演算式に変更を加えるものとすることができる。
【0017】
以上に加えて、ユーザが回答単語に対応して次に入力すべき提示単語を思いつかない場合、コンピュータに提示単語のヒントとなる情報を出力させると、この言語獲得支援装置の使い勝手が向上すると考えられる。そのためには、図3又は図4に示す言語獲得支援装置A3、A4のように、上述した基本的構成態様又はそれを応用した構成態様に加えて、入力すべき提示単語に関するヒントを要請するヒント要請命令を受け付けるヒント要請受付部9aと、このヒント要請受付部9aで受け付けたヒント要請命令に基づいて直前に回答単語出力部で出力した回答単語の語尾文字を語頭文字とする単語からヒントを生成し出力するヒント生成・出力部9bとを設けるとよい。
【0018】
さらに、出力した回答単語をユーザが知りたい場合、その意味をも出力するようにするとユーザにとっての使い勝手が向上する。そのためには、図3又は図4に示す言語獲得支援装置A3、A4のように、上述した基本的構成態様又はそれを応用した構成態様に加えて、少なくとも回答単語出力部で出力した回答単語に関して入力された単語意味要請命令を受け付ける単語意味要請受付部10aと、この単語意味要請受付部10aで受け付けた単語意味要請命令に基づいて所定の単語意味辞書DB4から当該回答単語の意味を抽出し出力する単語意味抽出・出力部10bをさらに設けることが望ましい。なお、単語意味辞書DB4と、単語辞書DB1やコーパスDB3は、共通の単語を格納するように関連づけておくことが好ましい。
【0019】
【発明の実施の形態】
以下、本発明の一実施形態を、図面を参照して説明する。
【0020】
この実施形態は、シリトリを利用したユーザの言語の獲得を支援するためのものであって、ここでは上述した図3に示す言語獲得支援装置A3における例を示す。すなわち、図3の言語獲得支援装置A3は、本発明に係る言語獲得支援装置における基本的構成と複数の補助的構成とを併せ持つものである。なお、以下では、シリトリの規則として日本語の単語を使用する場合について説明する。
【0021】
まず、この言語獲得支援装置A3は、図5に示すように、CPU101、メモリ102、ハードディスク(HDD)等の記憶装置103、マウスやキーボード等の入力デバイス104、ディスプレイ等の出力デバイス105等を備えた汎用パーソナルコンピュータに後述するソフトウェアプログラムを記憶させたもので構成され、上記の他に、当該パーソナルコンピュータに内蔵した又は外部接続したデータベース装置106等を有している。なお、この言語獲得支援装置A3は、上記の構成の他にも、インターネットやLAN等に接続可能な通信インタフェースを設け、外部のユーザが使用するパーソナルコンピュータからのアクセスを受け付けて動作するようなものとすることもできるが、以下では単独のパーソナルコンピュータを言語獲得支援装置A3として使用する態様について説明する。
【0022】
次に、この言語獲得支援装置A3の機能構成について、図3を参照して説明する。上述したように、言語獲得支援装置A3は、記憶された言語獲得支援プログラムに従って動作することにより、入力受付部1、候補単語抽出部2、選好度演算部3、回答単語決定部4、回答単語出力部5、連想度演算部6、分野変更部7、難易度変更部8、ヒント要請受付部9a、ヒント生成・出力部9b、単語意味要請受付部10a、単語意味抽出・出力部10bとしての機能を発揮する。
【0023】
また、単語辞書DB1、統計データDB2、コーパスDB3、単語意味辞書DB4は、前記データベース装置106に格納されたものであるが、これらは、例えば「日本語の単語一般」「くだものの名前」、「国の名前」、「経済用語」…等の分野ごと、或いは難易度ごとに分類されたうえで、相互に関連づけて格納されている。具体的には、例えば図6に一例として「分類語彙表(国立国語研究所,秀英出版,1964)」をもとにした単語辞書DB1の一部のみを示すが、この単語辞書DB1は、「日本語の単語一般」の分野に属するものであって、「,」で区切られた7つの情報(読み,見出し語,分類番号,分類番号の第1下位番号,分類番号の第2下位番号,標本使用頻度が所定数(例えば7)以上の単語か否か)から構成されている。そして、この単語辞書DB1ごと、日本語の「ん」を除く44種類の文字(ひらがな)についての数量的統計データを統計データDB2として作成し格納している。図7は、ある単語辞書DB1に基づく統計データDB2の一例を示したものである。同図において、選好1〜6はそれぞれ選好度要素Px(x=1〜6)を示すものであり、各文字に係る選好度要素値が示されている。ここで、シリトリで有利となるための戦略を立てるうえで必要となる要素を、次のように定めるものとし、その要素を利用した演算式に従って、各選好度要素Pxに関する選好度要素値が求められるものとする。
【0024】
すなわち、前記要素として、まず、その文字を語尾文字とする単語辞書DB1内の単語の個数を「END」と表す。また、その文字を語頭文字とする単語の個数を「BEGIN」と表す。ただし、この「BEGIN」は、日本語のシリトリにおいて負けを意味する「ん」を語尾文字とする単語は除いたものである。次に、その文字を語頭文字とし、且つ「ん」を語尾文字とする単語の個数を「NN」と表す。また、その文字を語頭文字とし、且つその語頭文字を語尾文字とする単語の個数を「SAME」と表す。さらに、その文字を語尾文字とする単語の集合において語頭文字となり得る文字の種類の数を「BKIND」と表す。そして、その文字を語尾文字とする2文字の単語の集合において語頭文字となり得る文字の種類の数を「BKIND2」と表す。これらの要素に基づいて、次に説明するように、各選好度要素Pxに係る選好度要素値が求められる。なお、以下に説明する方法では、シリトリの相手であるユーザが使用できる単語を減らすなどの処理により言語獲得支援装置A3が有利となるように導くことを、シリトリの基本的戦法の考え方として採用したものである。
【0025】
具体的に、選好1に係る選好度要素P1は、候補単語の語尾文字を語頭文字として持ち且つシリトリの規則において負けを意味する文字を語尾文字に持たない単語の数に対する候補単語の語尾文字を語尾文字とする単語の数の比率を示すものであり、各文字についての選好度要素値は、そのような候補単語の総数を式{(END)/(BEGIN(END>>BEGIN))}に基づき演算することで求められる。選好2に係る選好度要素P2は、語尾文字を語頭文字とする単語の数を示すものであり、各文字についての選好度要素値は、候補単語についての{BEGIN}を演算することにより求められる。選好3に係る選好度要素P3は、候補単語の語尾文字を語頭文字とする単語の総数と比較した場合において、候補単語の語尾文字を語頭文字として持ち且つ文字「ん」を語尾文字とする単語の比率を示すものであり、各文字についての選好度要素値は、候補単語について式{(NN)/(BEGIN+NN)}に基づき演算することで求められる。選好4に係る選好度要素P4は、候補単語の語尾文字を語頭文字と語尾文字とに持つ単語の数を示すものであり、各文字についての選好度要素値は、候補単語についての{SAME}を演算することにより求められる。選好5に係る選好度要素P5は、候補単語の語尾文字を語尾文字とする単語の集合においてそれら単語の語尾文字の種類の数を示すものであり、各文字についての選好度要素値は、候補単語についての{BKIND}を演算することにより求められる。選好6に係る選好度要素P6は、候補単語の語尾文字を語尾文字とする二文字のみで構成される単語の集合においてそれら単語の語頭文字の種類の数を示すものであり、各文字についての選好度要素値は、候補単語についての{BKIND2}を演算することにより求められる。なお、図7は、選好1において選好度要素値の大きい文字から順に並べて示したものである。
【0026】
また、コーパスDB3は、対応する単語辞書DB1に含まれる単語を用いた日本語の用例をデータベース化したものであるが、必ずしも単語辞書DB1に含まれる単語の全てがこのコーパスDB3に含まれているとは限らない。そして、コーパスDB3に格納される用例は、自動的に形態素解析処理がなされ、各単語が当該コーパスDB3の全用例において出現する回数が算出されており、その回数が所定数(例えば7)以上か否かの情報が、対応する単語辞書DB1における「標本使用頻度」欄に記録される。なお、単語辞書DB1において、上記所定回数以上の単語のみをシリトリにおいて用いるように設定することもできる。また、コーパスDB3は、ユーザのレベルに応じて当該ユーザが比較的思いつき易い単語を含むものとした方が好ましいので、例えばユーザが小学生であれば、コーパスDB3として小学校の教科書や読本の用例を収録したものを用いるようにするとよい。
【0027】
さらに、単語意味辞書DB4は、単語辞書DB1に含まれる単語の意味を、当該単語と対応付けて格納している。この単語意味辞書DB4は、単語辞書DB1ごとにそれぞれ対応させて複数設けてもよいし、使用する可能性のある全ての単語辞書DB1に含まれる単語の全てを1つのデータベースに格納するものであってもよい。
【0028】
以下、各部の機能について順不同で簡単に説明する。
【0029】
分野変更部7は、ユーザが入力した一の分野を指定する分野変更命令に基づいて、使用すべき単語辞書DB1及び統計データDB2を決定し、場合によってはコーパスDB3や単語意味辞書DB4をも決定することによって、シリトリの規則として一連のシリトリにおいて用いることができる単語の分野を変更する。なお、ユーザが分野変更命令を容易に入力できるようにするためには、例えば出力デバイス105である予めディスプレイ等に複数の分野から一の分野を選択できるような画面を表示するようにしておくとよい。
【0030】
難易度変更部8は、ユーザが入力した一の難易度を指定する難易度変更命令に基づいて、使用すべき単語辞書DB1及び統計データDB2、或いはコーパスDB3等を決定し、若しくは後述する選好度演算部3、連想度演算部6、又は回答単語決定部4において回答単語を決定する過程で使用する演算式に変更を加える処理を行い、シリトリの規則として一連のシリトリにおいて用いる単語の難易度を変更する。なお、ユーザが難易度変更命令を容易に入力できるようにするためには、例えば予め出力デバイス105たるディスプレイ等に複数の難易度から一の難易度を選択できるように画面表示するようにしておくとよい。
【0031】
入力受付部1は、ユーザが入力した提示単語Wを受け付ける処理を行う。なお、ユーザが提示単語Wを容易に入力できるようにするためには、例えば予め出力デバイス105であるディスプレイ等に提示単語入力欄等を画面表示するようにしておくとよい。
【0032】
候補単語抽出部2は、入力受付部1で受け付けた提示単語Wに基づいて単語辞書DB1を検索し、当該提示単語Wの語尾文字を語頭文字とする回答単語の候補となり得る候補単語Wiを全て抽出する。その際、一連のシリトリにおいて先に入力を受け付けたことのある提示単語や、先に出力したことのある回答単語は抽出する候補単語Wiから除外する。また、提示単語の語尾文字が長音である場合には当該語尾文字を「う」であるとしたり、語尾文字が濁音や半濁音である場合には当該語尾文字をその濁点や半濁点を除いた文字であるとするなどの、シリトリの規則に基づく処理は、この候補単語抽出部2において実行するようにすることができる。
【0033】
選好度演算部3は、候補単語抽出部2において抽出した全ての候補単語Wi(i=1,2…n)それぞれに対して、統計データDB2を参照し、選好1〜6の各選好度要素P1〜P6に係る選好度要素値Px_i(x=1〜6)を、上述した規定に基づいて演算することによって、各候補単語に係る選好度Piを、演算式[Pi=Cp1xP1_i+Cp2xP2_i+Cp3xP3_i+Cp4xP4_i+Cp5xP5_i+Cp6xP6_i]により演算する。ここで、同式においてCpx(x=1〜6)は適宜定めることができる所定の定数である。なお、ここでは選好度Piを求める演算式を上記の演算式のように単純な線形和の関数としたが、より複雑に二次以上の項や、対数の項(log P1_i)や逆数の項(1/P1_i)又はこれらの組み合わせ等を追加した関数としてもよい。なお、上述した難易度変更部8において、所定の選好度要素Pxに重み付けをすることで難易度を変更する場合、前記演算式における定数Cpxを変更するようにしてもよい。
【0034】
連想度演算部6は、候補単語抽出部2において抽出した全ての候補単語Wi(i=1,2…n)それぞれに対して、コーパスDB3を参照し、各候補単語の連想のし易さを示す連想度Qiを、演算式[Qi = log {freq(Wi,W) / freq(W)}]により演算する。ここで、freq(W)は、当該コーパスDB3において提示単語Wが出現する文数を表し、freq(Wi,W)は当該コーパスDB3において提示単語Wと各候補単語Wiが共に出現する文数を表している。なお、この演算式も、上述した選好度Piを求める演算式と同様に、より複雑な関数或いはより単純な関数としてもよい。
【0035】
回答単語決定部4は、選好度演算部3及び連想度演算部6における演算結果である選好度Pi及び連想度Qiに基づく演算式[Ri=Cp x Pi + Cq x Qi]により、候補単語Wiごとの良好度Riを演算する。ただし、Cp及びCqは、適宜に定める所定の定数を意味している。そして、各候補単語Wiのうち最高の良好度Riを与えた候補単語を回答単語Wansと決定する。なお、ここでは選好度Piと連想度Qiとにそれぞれ定数を乗じた値を加えて得た値を良好度Riとしたが、選好度Piを求める演算式等と同様により複雑な演算式により良好度Riを演算するようにしてもよい。また、上述した難易度変更部8において、選好度Piと連想度Qiの何れかに重み付けをすることで難易度を変更する場合、前記の式おいて選好度Pi又は連想度Qiの何れか又は両方を累乗するように演算式を変更するようにしてもよい。
【0036】
回答単語出力部5は、回答単語決定部4で決定した回答単語Wansをディスプレイ等の表示デバイス105に表示することにより出力してユーザに提示する。したがって、ユーザは、この回答単語Wansに対してその語尾文字を語頭文字とする新たな単語を入力することになる。
【0037】
ヒント要請受付部9aは、ユーザが次に入力するのに適した提示単語を思いつかない場合、出力デバイス105であるディスプレイ等に表示させた所定のボタンをユーザにクリックなどさせることで入力されたヒント要請命令を受け付け、直前に回答単語出力部5で出力した回答単語Wansを回答単語決定部4から抽出するとともに当該回答単語Wansを提示単語の代わりに入力受付部1へ入力する。この場合、入力受付部1に入力された回答単語Wansに基づき、候補単語抽出部2、選好度演算部3、連想度演算部6、及び回答単語決定部4の一連の処理を経て、入力すべき提示単語に最適な単語を決定する。そして、ヒント生成・出力部9bは、この決定された単語に基づいて、当該単語を想到し得るような語句等からなるヒントを生成し、この生成したヒントを出力デバイス105に出力する。この処理は、例えば次のような処理で実行することができる。すなわち、ユーザが、出力された回答単語Wansが「る」を語尾文字とする単語である場合に、「る」で始まる単語を思いつかない場合、上記の処理に従って回答単語決定部4が「ルーレット」という単語を決定すると、ヒント生成・出力部9bは、「ルーレ??」というヒントを生成して出力する。
【0038】
単語意味要請受付部10aは、ユーザが回答単語Wansの意味を知りたい場合、出力デバイス105であるディスプレイ等に表示させた所定のボタンをユーザにクリックなどさせることで入力された単語意味要請命令を受け付けるものであり、単語意味抽出・出力部10bは、この入力された単語意味要請命令に基づいて単語意味辞書DB4を検索し、該当する単語の意味を抽出して出力デバイス105に出力する。
【0039】
次に、この言語獲得支援装置A3の使用時における動作の流れについて、図8〜図12に示すフローチャートを利用して説明する。
【0040】
なお、前提として、上述のようにユーザは直接、この言語獲得支援装置A3を操作するものとするが、ユーザが言語獲得支援装置A3に接続された他のコンピュータを使用する場合もほぼ同様の操作で言語獲得支援装置A3を利用することができる。また、言語獲得支援装置A3は既に起動して利用可能な状態にあり、所定の初期画面が出力デバイス105たるディスプレイに表示されているものとする。
【0041】
まず、図8に示すように、初期画面が表示された状態(START)で、ユーザにより分野変更命令を受け付ける(ステップS1)と、言語獲得支援装置A3は、この分野変更命令に従って、所定の単語辞書DB1、統計データDB2を少なくとも当該分野に対応するものに設定し(ステップS2)、或いはさらにコーパスDB3や単語意味辞書DB4も当該分野に対応するものに設定する(図示省略)。また、図9に示すように、初期画面が表示された状態(START)で、ユーザにより難易度変更命令を受け付ける(ステップS11)と、言語獲得支援装置A3は、この難易度変更命令に従って、所定の単語辞書DB1、統計データDB2を少なくとも当該難易度に対応するものに設定し(ステップS12)、或いはさらにコーパスDB3や単語意味辞書DB4を当該難易度に対応するものに設定したり(図示省略)、前記式1、式2又は式3を当該難易度に対応するように変更する(図示省略)。
【0042】
そして、図10に示すように、この状態(START)から言語獲得支援装置A3は、ユーザによる提示単語Wの入力を受け付ける(ステップS31)。ここで、ユーザが提示単語Wを思いつかず入力ができないか、提示単語Wを後入力したか、或いはユーザが適当に作った造語等のあり得ない単語を入力した、等の場合は(ステップS31;NO)、シリトリを続行することができないので、提示単語を受け付けずに終了し、ユーザの「負け」となる。一方、提示単語Wを受け付けた場合(ステップS31;YES)、まず、提示単語Wの語尾文字が「ん」であるか否かを判断し(ステップS32)、「ん」以外の場合は、設定された単語辞書DB1を検索して提示単語Wの語尾文字を語頭文字とする候補単語Wiを抽出する(ステップS33)。ここで、単語辞書DB1に抽出可能な候補単語Wiがない場合には(ステップS33;NO)、言語獲得支援装置A3がシリトリの続行をすることができないので終了し、言語獲得支援装置A3が「負け」になる。一方候補単語Wiの抽出ができた場合には(ステップS33;YES)、抽出した各候補単語Wiについて、統計データDB2を参照し前記式1に従ってそれぞれ選好度Piを演算する(ステップS34)。さらに、抽出した各候補単語Wiについて、コーパスDB3を参照し前記式2に従ってそれぞれ連想度Qiを演算する(ステップS35)。そして、これら演算した選好度Pi及び連想度Qiに基づき、前記式3に従って候補単語Wiごとの良好度Riを演算する(ステップS36)。次に、全ての候補単語Wiについての良好度Riを比較して(ステップS37)、最高の良好度Riを得た候補単語を回答単語Wansに決定し(ステップS38)、この回答単語Wansを出力する(ステップS39)。ここで、回答単語Wansの語尾文字が「ん」であるか否かを判断し(ステップS40)、「ん」でなければ以上の過程を繰り返すことで、ユーザと言語獲得支援装置A3との一連のシリトリが成立する。なお、入力された提示単語の語尾文字が「ん」である場合(ステップS32;YES)、又は、回答単語の語尾文字が「ん」である場合(ステップS40;YES)には、シリトリの規則において「負け」となるので、一連のシリトリは終了する(END)。ただし、シリトリの規則として、「ん」以外の文字を語尾文字とした場合にも「負け」となるようにしているときには、ステップS32及びステップS40においてその文字が提示単語又は回答単語の語尾文字であるか否かも判断するように設定することができる。
【0043】
また、ユーザがヒントを要求した場合、図11に示すように、言語獲得支援装置A3は、ユーザによるヒント要請命令を受け付けると(ステップS41)、直前に決定し出力した回答単語Wansを抽出し(ステップS42)、その回答単語Wansの語尾文字に基づいて前記ステップS31〜S37と同様の過程を経て(ステップS43)、前記ステップS38と同様に提示単語となり得る単語を決定し(ステップS44)、この単語に基づいてヒントを生成する(ステップS45)とともに、そのヒントを出力する(ステップS46)。
【0044】
一方、ユーザが回答単語Wansの意味を要求する場合は、図12に示すように、言語獲得支援装置A3は、ユーザによる単語意味要請命令を受け付けると(ステップS51)、決定し出力した回答単語Wansに基づいて単語意味辞書DB4を検索し、該当する単語の意味を抽出して(ステップS52)それを出力する(ステップS53)。
【0045】
以上のように、本実施形態の言語獲得支援装置A3を利用したシリトリに基づく言語獲得の方法によれば、シリトリという一種のゲームを通じて、ユーザが楽しみを感じながら日本語の単語を適切に習得できる。特に、言語獲得支援装置A3側では、ユーザが入力した提示単語に対して回答するのに最も適した単語、すなわちシリトリゲームで勝つことを目的とする場合の最良の単語を決定するに際して、シリトリで有利となる6種類の選好を利用し、最適な単語を回答単語として出力できるという特徴を持ちながら、且つ人間が連想しやすい単語をも優先的に選ぶようにしているため、機械的で冷徹な単語を選択するだけでなく、連想という人間が行う選択に近い出力をすることが可能な面白さを加味した構成となっている。また、シリトリの分野や難易度を変更したり、ヒントや単語の意味をユーザに提示するようにしているため、ユーザの使用感を好適に向上することも可能である。
【0046】
なお、本発明は上述した実施形態に限られるものではない。例えば、前記6つの選好は全て用いなくてもよく、例えばそのうちの何れかを選択的に利用することができるし、連想度を利用するか否かも任意である。また、回答単語を決定するまでに用いる演算式も適宜変更することもできる。さらに、分野変更、難易度変更、ヒント出力、単語意味出力は本発明の基本構成に付随するものであるので、これらを適用するか否かも任意である。その他の具体的構成についても上記実施形態に限られるものではなく、本発明の趣旨を逸脱しない範囲で種々変形が可能である。
【0047】
【発明の効果】
本発明は、以上に詳述したように、シリトリという遊びを通じて、ある言語の特に単語の習得をするのに大いに役立つものである。すなわち、ユーザがある単語を入力すると、その単語の語尾文字を語頭文字とする回答に最も適した単語を、シリトリで勝つための要素として演算された選好度と、人間の連想しやすさの要素として演算された連想度とから得られる最高の良好度を有する回答単語として出力することができ、これをユーザとコンピュータとの間で交互に繰り返すことで、シリトリの規則において反則となるまで、一連のシリトリを成立させることができるため、その間にユーザから提示された又はコンピュータから出力された多くの単語をユーザが知ることができ、その結果、当該シリトリで用いた言語の単語を数多く習得することが可能である。
【図面の簡単な説明】
【図1】本発明に係る言語獲得支援装置の基本的態様を示す機能構成図。
【図2】本発明に係る言語獲得支援装置の応用的態様を示す機能構成図。
【図3】本発明に係る言語獲得支援装置の他の応用的態様を示す機能構成図。
【図4】本発明に係る言語獲得支援装置の他の応用的態様を示す機能構成図。
【図5】本発明の一実施形態に係る言語獲得支援装置を構成するコンピュータの概略的な機器構成図。
【図6】同実施形態において利用される言語辞書の一例の一部を示す説明図。
【図7】同実施形態において利用される統計データの一例を示す説明図。
【図8】同実施形態における言語獲得支援装置の動作の一部を示すフローチャート。
【図9】同実施形態における言語獲得支援装置の動作の一部を示すフローチャート。
【図10】同実施形態における言語獲得支援装置の動作の一部を示すフローチャート。
【図11】同実施形態における言語獲得支援装置の動作の一部を示すフローチャート。
【図12】同実施形態における言語獲得支援装置の動作の一部を示すフローチャート。
【符号の説明】
A1、A2、A3、A4…言語獲得支援装置
DB1…単語辞書
DB2…統計データ
DB3…コーパス
DB4…単語意味辞書
1…入力受付部
2…候補単語抽出部
3…選好度演算部
4…回答単語決定部
5…回答単語出力部
6…連想度演算部
7…分野変更部
8…難易度変更部
9a…ヒント要請受付部
9b…ヒント生成・出力部
10a…単語意味要請受付部
10b…単語意味抽出・出力部
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a language acquisition support apparatus that is useful for learning a language by applying ciliary play, and a program and method therefor.
[0002]
[Prior art]
Ciritri play, which everyone has become accustomed to since childhood, exists in many countries and has the aspect of simply enjoying the fun of the game.Children can learn their native language words and foreigners can learn other languages. It has an educational aspect that is useful for learning, and an academic aspect that is a subject of research on the theme of communication between humans and machines. In recent years, for example, serial game software has been developed for the purpose of assisting language acquisition, which is an educational aspect. In addition, research on when humans feel fun can also be found that even if the opponent of the siritori is siritori game software, it feels interesting when it is taught that it is a human being. ing.
[0003]
[Problems to be solved by the invention]
By the way, there are no words that have the word “n” at the beginning of the word in Japanese. There are certain rules for each language. Under such rules, there are advantages and disadvantages that depend on characters, such that there are many words that start with one letter but few words that start with another letter. The game is advanced so that it is advantageous to the self. However, since it is not easy to make the advantages and disadvantages of each character into quantitative statistical data, even in the development and research of the above-mentioned siritri game software, simply collecting a large number of vocabulary, It just uses the result of extracting the ending character.
[0004]
Therefore, the present invention provides an apparatus, a program, and a method that are useful for language acquisition using a citrus based on a quantitative research study on which strategy will be advantageous or disadvantageous in the citrine. To do.
[0005]
[Means for Solving the Problems]
  The present invention is a language based on a rule based on a predetermined citrine that outputs an answer word other than an already input or output word, which is different from the presented word with the ending character of the input presented word as an initial character. Acquisition support device A2An input receiving unit 1 that receives an input of a presentation word, and a candidate that excludes a word that has already been input or has already been output based on the ending character of the presentation word that has received the input. Candidate word extraction unit 2 for automatically extracting words from a predetermined word dictionary DB1 and extraction by candidate word extraction unit 2 based on a plurality of quantitative statistical data DB2 for winning the ritual for each character included in the word dictionary DB1 A preference level calculation unit 3 that calculates a preference level indicating the degree of advantage in a character-dependent ritual for each candidate word, an answer word determination unit 4 that determines an answer word, and answers the determined candidate word An answer word output unit 5 for outputting as wordsIn addition to the configuration of the language acquisition support apparatus A1 (FIG. 1), the frequency such as the number of sentences in which the presented word appears in the predetermined corpus DB 3 storing the natural language sentence, and the presented word and each candidate word in the corpus DB 2 An association level calculation unit 6 that calculates an association level obtained by a predetermined calculation formula including the frequency of occurrence of both of them is further included. In the answer word determination unit 4, preference levels and associations that are calculation results of the preference level calculation unit 3 The degree of goodness for each candidate word by an arithmetic expression in which the larger the value of the association degree that is the calculation result of the degree calculation unit 6 is, the larger value is obtainedThe relevantGoodThe candidate word with the highest degree is determined as the answer wordConfigure toIs a basic feature(Figure 2). Such language acquisition support device A2Realizes the intended function by operating a dedicated computer or a general-purpose computer in accordance with a program based on a predetermined method.
[0006]
  In other words, when the user and the computer, which is a language acquisition support device, proceed alternately with the citation, the highest preference calculated to win the citation with the last letter as the initial letter for the presented word entered by the user Every timeAnd the highest degree of association calculated from the viewpoint of human ease of association with wordsHaving the bestGoodnessThe language acquisition support device outputs the answer word. Therefore, a series of citrines is established by repeating the input of the presented word by the user and the corresponding language acquisition support device outputting the answer word, and the user is output in addition to the vocabulary possessed by the user. You will be able to learn while enjoying the word. It should be noted that the rules of citrine can be determined as appropriate before starting a series of citrines, and the word dictionary and the corresponding statistical data are suitable as long as they can be built in or connected to a computer. Things can be used. In addition, when calculating the preference level, the words that have already been input and the words that have already been output are excluded from the quantitative statistical data, or the calculation is performed without excluding those words. Variations are possible.
[0007]
  By the way, as long as a word that can be output as a reply word remains in the word dictionary, the language acquisition support device that is a computer adopts a strategy that is advantageous for the computer itself and disadvantageous for the other user. This makes it possible to advance the clitoris so as not to lose to a human user. Therefore, since the present invention uses quantitative statistical data based on a word dictionary, a word that can be used by a user by continuously outputting words having the same ending character as answer words using the quantitative statistical data. Specifically, the following approach is adopted as a basic tactical approach to reducingis doing. First, the quantitative statistical data DB2 has a candidate word ending character as the initial character with respect to the number of words having the candidate word ending character as the initial character, and has a character that means losing in the siritri rule as an initial character. As the preference element value having the ratio of the number of words, the preference degree obtained by an arithmetic expression indicating that the preference word has a greater degree of advantage for a candidate word having a larger preference element value. It is conceivable to perform calculation. In other words, as the number of words that end with a character that means losing is larger than the total number of words that start with a certain character, the other user answers the character that means losing as the ending. This is advantageous for the computer because it is easy to input a word to be entered. In addition, the character that means losing in the rules of Ciritri is, for example, the character “n” in principle in Japanese, but any rule that loses when ending with other characters. Can be set.
[0008]
  MoreInIn the present inventionQuantitative statistical data DB2 as having as preference element value the number of initial letter types of words in a set of words consisting only of two letters with the initial letter of the candidate word as the initial letter, A method of calculating a preference level obtained by an arithmetic expression indicating that a preference word has a higher degree of advantage in a preference word in the preference level calculation unit 3Is adopted. That is, since a relatively short word of two letters is very easy to recall for human beings, it becomes more advantageous to reply with a two-letter word having various letters at the beginning.
[0009]
  In the present invention, in addition to the above embodiments,The quantitative statistical data DB2 is assumed to have, as a preference element value, the number of types of initial letters of the words in a set of words having the ending letter of the candidate word as a ending letter. You may make it calculate the preference degree obtained by the computing equation which shows that the degree of advantage is so large that the candidate word with a larger value of a preference element value. With this method, it is possible to answer with words starting with various characters, so that it is easy to continue “attack” against the user.
[0010]
Further, the quantitative statistical data DB2 uses the ending character of the candidate word for the number of words having the ending character of the candidate word as the initial character and having no ending character as the ending character in the siritri rules. As a preference element value having a ratio of the number of words, the preference degree obtained by an arithmetic expression indicating that a preference word has a greater degree of advantage in a candidate word having a larger preference element value. A calculation method can be adopted. In this case, if there are not many types of characters at the end of the characters compared to the types of characters at the beginning of the word, the “attack” against the user will not continue.
[0011]
Furthermore, the quantitative statistical data DB2 has the number of words having the initial character of the candidate word as the end character as a preference element value, and the preference value calculation unit 3 has a small preference element value. If a strategy is used to calculate the preference obtained with an arithmetic expression that indicates that the degree of advantage is greater for a word, the answer word with the same letter as the end word of the presented word will be cut back and output. Would be hesitant to recall the next word presented.
[0012]
In addition, it is assumed that the quantitative statistical data DB2 has, as the preference element value, the number of words whose initial word is the suffix of the candidate word. In the preference calculation unit 3, the candidate word having a small preference element value You may make it calculate the preference degree obtained with the calculating formula which shows that the degree of advantage is so large. That is, when a word with few types of ending characters is output as an answer word, the user inevitably needs to consider the next word from among words having a few initial characters, which is “attack” for the user. It is because it becomes difficult to continue.
[0013]
  Also,The quantitative statistical data DB2 is further assumed to have as a preference element value the number of words having the ending of the candidate word as a prefix, and the preference calculation unit 3 has a large value of the preference element value. You may make it calculate the preference degree obtained with the calculating formula which shows that the degree of advantage is so large that it is a candidate word.
[0014]
Furthermore, there are cases where the field of words that can be used in a series of citrines is limited to a predetermined one. In order to achieve this appropriately, for example, the language acquisition support device A3 shown in FIG. In addition to the basic configuration of the language acquisition support device A1, by setting a plurality of fields of a word group that can be used as a rule of the citrine, and accepting an input of a field change command for designating any field It is preferable to further provide a word field changing unit 7 that changes the field of the word group in a series of series. In particular, when the function of the word field changing unit 7 is added to the language acquisition support apparatus A2 shown in FIG. 2, as shown in FIG. 3, the function of the word field changing unit 7 is changed to a field changing command that accepts input. Based on at least one of a plurality of word dictionaries set in advance for each field, a plurality of statistical data, or a plurality of corpora storing natural language sentences, a word dictionary, statistical data, or corpus corresponding to the corresponding word dictionary It may be selected.
[0015]
Also, depending on the user's language acquisition level, it may be desirable to be able to change the difficulty level in a series of series. In this case, as in the language acquisition support device A3 shown in FIG. 3, a plurality of difficulty levels that can be used as the rules of the citrine are set, and an input of a difficulty level change command that specifies one of the difficulty levels is accepted. Therefore, it is desirable to further provide a difficulty level changing unit 8 for changing the difficulty level in a series of series.
[0016]
As a particularly preferable function of the difficulty level changing unit 8, a word dictionary corresponding to a difficulty level change command received from a plurality of word dictionaries DB 1 and statistical data DB 2 respectively corresponding to a plurality of preset difficulty levels Examples include selecting DB1 and statistical data DB2. The difficulty level changing unit 8 may change the arithmetic expression for calculating the preference level according to the difficulty level changing command that has received the input. Further, when the function of the word field changing unit 7 is added to the language acquisition support apparatus A2 shown in FIG. 2, the difficulty level changing unit 8 has a plurality of word dictionaries DB1 respectively corresponding to a plurality of preset difficulty levels. The word dictionary DB1 and the statistical data DB2 or the corpus DB3 corresponding to the difficulty level change command received from the plurality of statistical data DB2 or the plurality of corpus DB3 storing the natural language sentences may be selected. Note that the word dictionary DB1, the statistical data DB2, and the corpus DB3 used here may be the same as or different from the word dictionary DB1, the statistical data DB2, and the corpus DB3 used in the field changing unit 7. In addition, the difficulty level changing unit 8 can change the arithmetic expression for determining the answer word based on the preference level and the association level.
[0017]
In addition to the above, when the user does not come up with a presentation word to be input next corresponding to the answer word, it is thought that if the computer outputs information that is a hint of the presentation word, the usability of the language acquisition support device is improved. It is done. To that end, as in the language acquisition support devices A3 and A4 shown in FIG. 3 or FIG. 4, in addition to the basic configuration aspect described above or a configuration aspect applied thereto, a hint for requesting a hint related to a presentation word to be input Hint request receiving unit 9a that receives a request command, and a hint from a word that starts with the last letter of the answer word output by the answer word output unit immediately before based on the hint request command received by this hint request receiving unit 9a It is preferable to provide a hint generation / output unit 9b for generating and outputting.
[0018]
Further, when the user wants to know the output answer word, the user-friendliness is improved if the meaning is also output. For that purpose, in addition to the basic configuration mode described above or a configuration mode to which it is applied as in the language acquisition support devices A3 and A4 shown in FIG. 3 or FIG. 4, at least the response word output by the response word output unit A word meaning request receiving unit 10a that receives an input word meaning request command, and extracts and outputs the meaning of the answer word from a predetermined word meaning dictionary DB 4 based on the word meaning request command received by the word meaning request receiving unit 10a. It is desirable to further provide a word meaning extraction / output unit 10b. The word meaning dictionary DB4, the word dictionary DB1, and the corpus DB3 are preferably associated with each other so as to store a common word.
[0019]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, an embodiment of the present invention will be described with reference to the drawings.
[0020]
This embodiment is for supporting the acquisition of the language of the user using the citrine, and here, an example in the language acquisition support apparatus A3 shown in FIG. 3 described above is shown. That is, the language acquisition support device A3 of FIG. 3 has both a basic configuration and a plurality of auxiliary configurations in the language acquisition support device according to the present invention. In the following, a case where a Japanese word is used as the rule of the citrine will be described.
[0021]
First, as shown in FIG. 5, the language acquisition support apparatus A3 includes a CPU 101, a memory 102, a storage device 103 such as a hard disk (HDD), an input device 104 such as a mouse and a keyboard, an output device 105 such as a display, and the like. In addition to the above, the general-purpose personal computer stores a software program to be described later, and has a database device 106 built in the personal computer or externally connected. In addition to the above configuration, the language acquisition support device A3 is provided with a communication interface connectable to the Internet, a LAN, etc., and operates by accepting access from a personal computer used by an external user. In the following, a mode in which a single personal computer is used as the language acquisition support device A3 will be described.
[0022]
Next, the functional configuration of the language acquisition support apparatus A3 will be described with reference to FIG. As described above, the language acquisition support device A3 operates in accordance with the stored language acquisition support program, so that the input reception unit 1, the candidate word extraction unit 2, the preference calculation unit 3, the response word determination unit 4, the response word Output section 5, association degree calculation section 6, field change section 7, difficulty change section 8, hint request reception section 9a, hint generation / output section 9b, word meaning request reception section 10a, word meaning extraction / output section 10b Demonstrate the function.
[0023]
Further, the word dictionary DB1, the statistical data DB2, the corpus DB3, and the word meaning dictionary DB4 are stored in the database device 106. These are, for example, “Japanese word in general”, “fruit name”, “ They are stored in association with each other after being classified according to fields such as “name of country”, “economic term”, etc., or by difficulty level. Specifically, for example, FIG. 6 shows only a part of the word dictionary DB1 based on the “classified vocabulary table (National Institute for Japanese Language, Hidehide Publishing, 1964)” as an example. It belongs to the field of “Japanese words in general”, and is divided into seven pieces of information separated by “,” (reading, headword, classification number, first lower number of classification number, second lower number of classification number , Whether the sample usage frequency is a predetermined number (for example, 7) or more words). For each word dictionary DB1, quantitative statistical data for 44 types of characters (Hiragana) excluding Japanese “n” is created and stored as a statistical data DB2. FIG. 7 shows an example of statistical data DB2 based on a certain word dictionary DB1. In the figure, preferences 1 to 6 indicate preference elements Px (x = 1 to 6), respectively, and preference element values related to each character are shown. Here, it is assumed that the elements necessary for establishing a strategy to be advantageous in the citrine are determined as follows, and the preference element values for the respective preference elements Px are obtained according to arithmetic expressions using the elements. Shall be.
[0024]
That is, as the element, first, the number of words in the word dictionary DB1 having the character as the ending character is expressed as “END”. Further, the number of words having the character as the initial character is represented as “BEGIN”. However, this “BEGIN” is obtained by excluding a word whose final character is “n”, which means losing, in a Japanese series. Next, the number of words whose initial character is “n” and whose final character is “n” is expressed as “NN”. In addition, the number of words whose initial character is the initial character and whose initial character is the final character is represented as “SAME”. Further, the number of types of characters that can be the initial character in a set of words having the character as a ending character is represented as “BKIND”. The number of types of characters that can be the initial character in a set of two characters having the character as the ending character is represented as “BKIND2”. Based on these elements, a preference element value related to each preference element Px is obtained as described below. In the method described below, the basic idea of the basic strategy of Ciritori is adopted to guide the language acquisition support device A3 to be advantageous by processing such as reducing the number of words that can be used by the user who is the partner of the Ciritri. Is.
[0025]
Specifically, the preference element P1 related to the preference 1 includes the ending character of the candidate word with respect to the number of words having the ending character of the candidate word as the initial character and not having the character that means losing in the siritri rule as the initial character. , And the preference element value for each character is the total number of such candidate words in the formula {(END) / (BEGIN (END >> BEGIN))} It is calculated | required by calculating based on. The preference element P2 related to the preference 2 indicates the number of words having the initial character as the initial character, and the preference element value for each character is obtained by calculating {BEGIN} for the candidate word. It is done. The preference element P3 related to the preference 3 has the ending character of the candidate word as the initial character and the character “n” as the initial character when compared with the total number of words having the initial character of the candidate word as the initial character. The preference element value for each character is obtained by calculating the candidate word based on the formula {(NN) / (BEGIN + NN)}. The preference element P4 related to the preference 4 indicates the number of words having the ending character of the candidate word as the initial character and the ending character, and the preference element value for each character is the {SAME for the candidate word. } Is calculated. The preference element P5 related to the preference 5 indicates the number of types of ending characters of the words in the set of words having the ending characters of the candidate words as the ending characters, and the preference element value for each character is a candidate. It is obtained by computing {BKIND} for the word. The preference element P6 related to the preference 6 indicates the number of types of initial letters of the words in a set of words composed only of two letters having the ending letter of the candidate word as the ending letter. Is obtained by calculating {BKIND2} for the candidate word. FIG. 7 shows characters arranged in order from the character having the highest preference element value in preference 1.
[0026]
The corpus DB3 is a database of Japanese examples using words included in the corresponding word dictionary DB1, but all the words included in the word dictionary DB1 are not necessarily included in the corpus DB3. Not necessarily. The example stored in the corpus DB 3 is automatically subjected to morphological analysis processing, and the number of times each word appears in all the examples of the corpus DB 3 is calculated. Information on whether or not is recorded in the “sample use frequency” column in the corresponding word dictionary DB1. In the word dictionary DB1, it is possible to set so that only the above-mentioned predetermined number of words are used in the series. In addition, it is preferable that the corpus DB 3 includes words that are relatively easy for the user to think of depending on the level of the user. For example, if the user is an elementary school student, the corpus DB 3 includes examples of elementary school textbooks and readers. It is good to use what you did.
[0027]
Furthermore, the word meaning dictionary DB4 stores the meanings of the words included in the word dictionary DB1 in association with the words. The word semantic dictionary DB4 may be provided in a plurality corresponding to each word dictionary DB1, or all the words contained in all the word dictionaries DB1 that may be used are stored in one database. May be.
[0028]
Hereinafter, the functions of the respective units will be described in a random order.
[0029]
The field changing unit 7 determines a word dictionary DB1 and a statistical data DB2 to be used based on a field changing command that designates one field input by the user, and in some cases also determines a corpus DB3 and a word meaning dictionary DB4. By doing so, the field of words that can be used as a rule of a series is changed in a series of series. In order to allow the user to easily input a field change command, for example, a screen that allows one field to be selected from a plurality of fields is displayed on the display or the like that is the output device 105 in advance. Good.
[0030]
The difficulty level changing unit 8 determines a word dictionary DB1 and statistical data DB2 or a corpus DB3 to be used based on a difficulty level change command that designates one difficulty level input by the user, or a preference level described later. The arithmetic unit 3, the association degree arithmetic unit 6, or the answer word determination unit 4 performs a process of changing the arithmetic expression used in the process of determining the answer word, and determines the difficulty level of the word used in the series of citrines as a citrine rule. change. In order to allow the user to easily input the difficulty level change command, for example, a screen is displayed in advance on the display as the output device 105 so that one difficulty level can be selected from a plurality of difficulty levels. Good.
[0031]
The input receiving unit 1 performs a process of receiving the presentation word W input by the user. In order to allow the user to easily input the presented word W, for example, a presented word input field or the like may be displayed on the screen of the output device 105 or the like in advance.
[0032]
The candidate word extraction unit 2 searches the word dictionary DB1 based on the presentation word W received by the input reception unit 1, and selects a candidate word Wi that can be a candidate for a reply word with the ending character of the presentation word W as the initial character. Extract all. At that time, a presentation word that has been previously input in a series of citations and an answer word that has been output first are excluded from the candidate words Wi to be extracted. In addition, when the ending character of the presented word is a long sound, the ending character is assumed to be “U”, and when the ending character is a cloudy sound or a semi-voiced sound, the utterance is removed from the clouded sound or the semi-voiced sound. The candidate word extraction unit 2 can execute processing based on the rules of the citrine, such as being a character.
[0033]
The preference calculation unit 3 refers to the statistical data DB 2 for each of all candidate words Wi (i = 1, 2,... N) extracted by the candidate word extraction unit 2, and each preference element of preferences 1-6. By calculating the preference element values Px_i (x = 1 to 6) relating to P1 to P6 based on the above-described rules, the preference Pi relating to each candidate word is calculated using the equation [Pi = Cp1xP1_i + Cp2xP2_i + Cp3xP3_i + Cp4xP4_i + Cp5xP5_i + Cp6xP6_i]. Here, in the formula, Cpx (x = 1 to 6) is a predetermined constant that can be appropriately determined. Here, the arithmetic expression for obtaining the preference Pi is a simple linear sum function like the above arithmetic expression, but more complicated terms of quadratic terms, logarithmic terms (log P1_i) and reciprocal terms are used. A function to which (1 / P1_i) or a combination thereof is added may be used. When the difficulty level is changed by weighting the predetermined preference element Px in the difficulty level changing unit 8 described above, the constant Cpx in the arithmetic expression may be changed.
[0034]
The association degree calculation unit 6 refers to the corpus DB 3 for each of all candidate words Wi (i = 1, 2,... N) extracted by the candidate word extraction unit 2 and determines the ease of association of each candidate word. The association degree Qi shown is calculated by an arithmetic expression [Qi = log {freq (Wi, W) / freq (W)}]. Here, freq (W) represents the number of sentences in which the presented word W appears in the corpus DB3, and freq (Wi, W) represents the number of sentences in which both the presented word W and each candidate word Wi appear in the corpus DB3. Represents. This arithmetic expression may also be a more complex function or a simpler function, similar to the arithmetic expression for obtaining the preference Pi described above.
[0035]
The answer word determination unit 4 calculates the candidate word Wi by an arithmetic expression [Ri = Cp x Pi + Cq x Qi] based on the preference Pi and the association Qi, which are the calculation results in the preference calculation unit 3 and the association level calculation unit 6. The degree of goodness Ri for each is calculated. However, Cp and Cq mean predetermined constants determined as appropriate. And the candidate word which gave the highest favorableness degree Ri among each candidate word Wi is determined as the reply word Wans. Here, the value obtained by adding a value obtained by multiplying each of the preference level Pi and the association degree Qi by a constant is defined as the goodness level Ri, but it is better by a more complicated calculation formula like the calculation formula for obtaining the preference Pi. The degree Ri may be calculated. In the above-described difficulty level changing unit 8, when the difficulty level is changed by weighting either the preference level Pi or the association level Qi, either the preference level Pi or the association level Qi in the above formula or The arithmetic expression may be changed so that both are raised to the power.
[0036]
The answer word output unit 5 outputs the answer word Wans determined by the answer word determiner 4 by displaying it on the display device 105 such as a display and presents it to the user. Therefore, the user inputs a new word having the initial character as the initial character for the answer word Wans.
[0037]
The hint request receiving unit 9a, when the user does not come up with a presentation word suitable for the next input, the hint input by causing the user to click a predetermined button displayed on the display or the like as the output device 105. A request command is received, the answer word Wans output by the answer word output unit 5 immediately before is extracted from the answer word determination unit 4, and the answer word Wans is input to the input receiving unit 1 instead of the presented word. In this case, based on the answer word “Wans” input to the input receiving unit 1, the candidate word extraction unit 2, the preference calculation unit 3, the association degree calculation unit 6, and the answer word determination unit 4 are input through a series of processing. Determine the best word for the presentation word. Then, the hint generation / output unit 9 b generates a hint including a phrase that can be conceived of the word based on the determined word, and outputs the generated hint to the output device 105. This process can be executed by the following process, for example. That is, if the user does not come up with a word that begins with “ru” when the output answer word “Wans” is a word that ends with “ru”, the answer word determination unit 4 performs “roulette” according to the above processing. When the word “h” is determined, the hint generation / output unit 9b generates and outputs a hint “Lule ??”.
[0038]
When the user wants to know the meaning of the answer word “Wans”, the word meaning request receiving unit 10a receives the word meaning request command input by causing the user to click a predetermined button displayed on the display or the like as the output device 105. The word meaning extraction / output unit 10b searches the word meaning dictionary DB 4 based on the input word meaning request command, extracts the meaning of the corresponding word, and outputs it to the output device 105.
[0039]
Next, an operation flow when the language acquisition support apparatus A3 is used will be described with reference to flowcharts shown in FIGS.
[0040]
As a premise, the user directly operates the language acquisition support apparatus A3 as described above, but substantially the same operation is performed when the user uses another computer connected to the language acquisition support apparatus A3. Thus, the language acquisition support device A3 can be used. Further, it is assumed that the language acquisition support device A3 has already been activated and is available, and a predetermined initial screen is displayed on the display as the output device 105.
[0041]
First, as shown in FIG. 8, when the field change command is received by the user in a state where the initial screen is displayed (START) (step S1), the language acquisition support device A3 performs a predetermined word according to the field change command. The dictionary DB1 and the statistical data DB2 are set to at least those corresponding to the relevant field (step S2), or the corpus DB3 and the word meaning dictionary DB4 are further set to correspond to the relevant field (not shown). Also, as shown in FIG. 9, when the user receives a difficulty level change command in a state where the initial screen is displayed (START) (step S11), the language acquisition support device A3 performs predetermined processing according to the difficulty level change command. The word dictionary DB1 and the statistical data DB2 are set to correspond to at least the difficulty level (step S12), or the corpus DB3 and the word meaning dictionary DB4 are further set to correspond to the difficulty level (not shown). , Formula 1, Formula 2 or Formula 3 is changed to correspond to the difficulty level (not shown).
[0042]
And as shown in FIG. 10, language acquisition assistance apparatus A3 receives the input of the presentation word W by a user from this state (START) (step S31). Here, in the case where the user cannot think of the input word W and cannot input it, the input of the input word W is made later, or the user inputs an impossible word such as a coined word appropriately formed (step S31). NO), since the citrine cannot be continued, it ends without accepting the presented word, resulting in a “losing” of the user. On the other hand, when the presentation word W is received (step S31; YES), first, it is determined whether or not the ending character of the presentation word W is “n” (step S32). The candidate word Wi is extracted by searching the word dictionary DB1 and using the ending character of the presented word W as the initial character (step S33). Here, if there is no candidate word Wi that can be extracted in the word dictionary DB1 (step S33; NO), the language acquisition support apparatus A3 ends because the language acquisition support apparatus A3 cannot continue the citation. "Lose". On the other hand, if the candidate word Wi can be extracted (step S33; YES), the degree of preference Pi is calculated for each extracted candidate word Wi according to the equation 1 with reference to the statistical data DB2 (step S34). Further, with respect to each extracted candidate word Wi, the association degree Qi is calculated according to Equation 2 with reference to the corpus DB 3 (step S35). Then, based on the calculated preference level Pi and association level Qi, the goodness level Ri for each candidate word Wi is calculated according to the equation 3 (step S36). Next, the goodness level Ri for all candidate words Wi is compared (step S37), the candidate word that has obtained the highest goodness level Ri is determined as the answer word Wans (step S38), and this answer word Wans is output. (Step S39). Here, it is determined whether or not the ending character of the answer word “Wans” is “n” (step S40), and if it is not “n”, the above process is repeated, whereby a series of the user and the language acquisition support device A3. This is the case. When the ending character of the input presentation word is “n” (step S32; YES), or when the ending character of the answer word is “n” (step S40; YES), the rules of the ritual Since “losing”, the series of series ends (END). However, as a rule of the series, when a character other than “n” is used as the ending character, the character is the ending character of the presented word or the answer word in step S32 and step S40. It can be set to determine whether or not there is.
[0043]
When the user requests a hint, as shown in FIG. 11, when the language acquisition support apparatus A3 receives a hint request command from the user (step S41), the answer acquisition word Wans determined and output immediately before is extracted (step S41). Step S42), through a process similar to Steps S31 to S37 based on the ending character of the answer word Wans (Step S43), determine a word that can be a presentation word similarly to Step S38 (Step S44). A hint is generated based on the word (step S45) and the hint is output (step S46).
[0044]
On the other hand, when the user requests the meaning of the answer word “Wans”, as shown in FIG. 12, the language acquisition support apparatus A3 receives the word meaning request command from the user (step S51), and determines and outputs the answer word “Wans”. The word meaning dictionary DB 4 is searched based on the above, the meaning of the corresponding word is extracted (step S52), and it is output (step S53).
[0045]
As described above, according to the language acquisition method based on the citrus using the language acquisition support device A3 of the present embodiment, the user can appropriately learn Japanese words while feeling fun through a kind of game called iritri. . In particular, the language acquisition support apparatus A3 side determines the most suitable word for answering the presented word input by the user, that is, the best word for the purpose of winning in the ritual game. It is mechanical and cool because it uses six types of advantageous preferences and has the feature of being able to output the optimal word as an answer word, while also preferentially selecting words that are easily associated with humans. In addition to selecting a word, it has a configuration that takes into account the fun of being able to output an association that is close to the selection made by humans. Moreover, since the field of the citrine and the difficulty level are changed and the meanings of hints and words are presented to the user, the user's feeling of use can be preferably improved.
[0046]
The present invention is not limited to the embodiment described above. For example, it is not necessary to use all of the six preferences. For example, any one of them can be selectively used, and whether or not to use association is also arbitrary. Also, the arithmetic expression used until the answer word is determined can be changed as appropriate. Furthermore, field change, difficulty level change, hint output, and word meaning output are associated with the basic configuration of the present invention, so whether or not to apply these is also arbitrary. Other specific configurations are not limited to the above embodiment, and various modifications can be made without departing from the spirit of the present invention.
[0047]
【The invention's effect】
  As described in detail above, the present invention is very useful for learning a certain language, particularly words, through the play of citrine. That is, when a user enters a word, the most appropriate word for an answer with the word's suffixAs an answer word with the highest goodness obtained from the preference calculated as an element for winning in the citrine and the association calculated as an element of human associationSince it can be output, and by repeating this alternately between the user and the computer, a series of citrines can be established until it becomes a foul in the citrine rules. As a result, the user can learn many words output from the language, and as a result, can learn many words in the language used in the cerritory.
[Brief description of the drawings]
FIG. 1 is a functional configuration diagram showing a basic aspect of a language acquisition support apparatus according to the present invention.
FIG. 2 is a functional configuration diagram showing an applied aspect of the language acquisition support apparatus according to the present invention.
FIG. 3 is a functional configuration diagram showing another applied aspect of the language acquisition support apparatus according to the present invention.
FIG. 4 is a functional configuration diagram showing another applied aspect of the language acquisition support apparatus according to the present invention.
FIG. 5 is a schematic device configuration diagram of a computer constituting a language acquisition support apparatus according to an embodiment of the present invention.
FIG. 6 is an explanatory diagram showing a part of an example of a language dictionary used in the embodiment.
FIG. 7 is an explanatory diagram showing an example of statistical data used in the embodiment.
FIG. 8 is a flowchart showing a part of the operation of the language acquisition support apparatus according to the embodiment;
FIG. 9 is a flowchart showing a part of the operation of the language acquisition support apparatus according to the embodiment;
FIG. 10 is a flowchart showing a part of the operation of the language acquisition support apparatus according to the embodiment;
FIG. 11 is a flowchart showing a part of the operation of the language acquisition support apparatus according to the embodiment;
FIG. 12 is a flowchart showing a part of the operation of the language acquisition support apparatus according to the embodiment;
[Explanation of symbols]
A1, A2, A3, A4 ... Language acquisition support device
DB1 ... Word dictionary
DB2 ... statistical data
DB3 ... Corpus
DB4 ... Word meaning dictionary
1 ... Input reception part
2 ... Candidate word extraction unit
3 ... Preference calculation unit
4 ... Answer word decision section
5 ... Answer word output section
6 ... Association degree calculation unit
7. Field change department
8 ... Difficulty level change part
9a ... Hint request acceptance department
9b ... Hint generation / output unit
10a ... Word meaning request reception part
10b ... Word meaning extraction / output unit

Claims (13)

入力された提示単語の語尾文字を語頭文字とし且つ当該提示単語とは異なり既に入力を受け付けた又は既に出力した単語を除く回答単語を出力する所定のシリトリに係る規則に基づいた言語獲得支援装置であって、
提示単語の入力を受け付ける入力受付部と、
この入力受付部で受け付けた提示単語の語尾文字に基づいてその語尾文字を語頭文字とし既に入力を受け付けた又は既に出力した単語を除く候補単語を所定の単語辞書から自動抽出する候補単語抽出部と、
前記単語辞書に含まれる文字ごとに関してシリトリに勝つための複数の数量的統計データに基づいて、候補単語抽出部で抽出した候補単語ごとに文字に依存するシリトリでの有利さの度合いを示す選好度を演算する選好度演算部と、
自然言語文を格納した所定のコーパスにおいて提示単語と各候補単語が共に出現する頻度を、前記コーパスにおいて提示単語が出現する頻度で割った値に基づく連想度を演算する連想度演算部と、
選好度演算部で演算された選好度と連想度演算部で得られた連想度の両方を含み、且つそれら選好度と連想度の値が大きいほど大きい値が得られる演算式により候補単語ごとの良好度を求め、当該良好度が最大の候補単語を回答単語に決定する回答単語決定部と、
回答単語決定部で決定された回答単語を出力する回答単語出力部とを具備しており、
前記数量的統計データが、候補単語の語尾文字を語頭文字とする単語の数に対する候補単語の語尾文字を語頭文字として持ち且つシリトリの規則において負けを意味する文字を語尾文字に持つ単語の数の比率と、候補単語の語尾文字を語尾文字とする二文字のみで構成される候補単語の集合においてそれら単語の語頭文字の種類の数を選好度要素値として有し、選好度演算部が、前記選好度要素値の値が大きい候補単語ほど有利さの度合いが大きいことを示す演算式で得られる選好度を演算するものであることを特徴とする言語獲得支援装置。
Language acquisition support device based on a rule relating to a predetermined citrine that outputs an answer word excluding a word that has already been accepted or outputted, unlike the presentation word, with the ending character of the inputted presentation word as the initial character Because
An input receiving unit for receiving an input of the presented word;
Candidate word extraction unit for automatically extracting candidate words from a predetermined word dictionary based on the ending character of the presented word received by the input receiving unit, with the ending character as the initial character and excluding the word that has already been input or has already been output When,
Preference indicating the degree of advantage in the citation that depends on the character for each candidate word extracted by the candidate word extraction unit based on a plurality of quantitative statistical data for winning the citri for each character included in the word dictionary A preference calculation unit for calculating
An association degree calculation unit that calculates an association degree based on a value obtained by dividing a frequency at which a presentation word and each candidate word appear together in a predetermined corpus storing a natural language sentence by a frequency at which the presentation word appears in the corpus;
Each candidate word is calculated by an arithmetic expression that includes both the preference degree calculated by the preference degree calculation unit and the association degree obtained by the association degree calculation unit, and a larger value is obtained as the value of the preference degree and the association degree is larger. seek goodness, and answer word determiner that the goodness determines the maximum of the candidate words to answer word,
An answer word output unit that outputs the answer word determined by the answer word determination unit ,
The quantitative statistical data includes a word having a candidate word ending character as an initial character and a word having a character meaning losing in a siritri rule as the initial character with respect to the number of words having the candidate word ending character as an initial character. A preference ratio calculation unit having a ratio of numbers and the number of types of initial letters of those words in a set of candidate words composed of only two characters having the ending character of the candidate word as a ending character. However, the language acquisition support apparatus is characterized in that a preference level obtained by an arithmetic expression indicating that a candidate word having a higher preference element value has a higher degree of advantage is calculated .
前記数量的統計データが、候補単語の語尾文字を語尾文字とする単語の集合においてそれら単語の語頭文字の種類の数を選好度要素値としてさらに有し、選好度演算部が、前記選好度要素値の値が大きい候補単語ほど有利さの度合いが大きいことを示す演算式で得られる選好度を演算するものである請求項1記載の言語獲得支援装置。The quantitative statistical data further includes , as a preference element value, the number of types of initial letters of the words in a set of words having the suffix of the candidate word as a suffix , and a preference calculator calculates the preference 2. The language acquisition support apparatus according to claim 1, wherein a preference level obtained by an arithmetic expression indicating that a candidate word having a larger element value has a higher degree of advantage is calculated. 前記数量的統計データが、候補単語の語尾文字を語頭文字として持ち且つシリトリの規則において負けを意味する文字を語尾文字に持たない単語の数に対する候補単語の語尾文字を語尾文字とする単語の数の比率を選好度要素値としてさらに有し、選好度演算部が、前記選好度要素値の値が大きい候補単語ほど有利さの度合いが大きいことを示す演算式で得られる選好度を演算するものである請求項1又は2の何れかに記載の言語獲得支援装置。The quantitative statistical data includes a word having a candidate word ending character as a ending character with respect to the number of words having a candidate word ending character as an initial character and not having a character meaning losing in the siritri rule as a ending character. The preference element value is further included as a preference element value, and the preference calculation unit calculates a preference degree obtained by an arithmetic expression indicating that a candidate word having a larger value of the preference element value has a higher degree of advantage. The language acquisition support apparatus according to claim 1, wherein the language acquisition support apparatus is one. 前記数量的統計データが、候補単語の語尾文字を語頭文字及び語尾文字に持つ単語の数を選好度要素値としてさらに有し、選好度演算部が、前記選好度要素値の値が小さい候補単語ほど有利さの度合いが大きいことを示す演算式で得られる選好度を演算するものである請求項1、2又は3の何れかに記載の言語獲得支援装置。The quantitative statistical data further includes , as a preference element value, the number of words having a candidate word ending character as an initial character and a ending character, and a preference calculation unit is a candidate whose value of the preference element value is small 4. The language acquisition support apparatus according to claim 1, wherein a preference level obtained by an arithmetic expression indicating that a word has a higher degree of advantage is calculated. 前記数量的統計データが、候補単語の語尾文字を語頭文字として持つ単語の数を選好度要素値としてさらに有し、選好度演算部が、前記選好度要素値の値が大きい候補単語ほど有利さの度合いが大きいことを示す演算式で得られる選好度を演算するものである請求項1、2、3又は4の何れかに記載の言語獲得支援装置。The quantitative statistical data further includes , as a preference element value, the number of words having a candidate word ending as an initial character , and the preference calculation unit is more advantageous for a candidate word having a larger value of the preference element value. 5. The language acquisition support apparatus according to claim 1, wherein a preference degree obtained by an arithmetic expression indicating that the degree of the degree is large is calculated. シリトリの規則として利用可能な単語群の分野を設定しておき、いずれかの分野を指定 する分野変更命令の入力を受け付けることにより一連のシリトリにおける単語群の分野を変更する単語分野変更部をさらに具備し、この単語分野変更部が、入力を受け付けた分野変更命令に基づいて、予め分野ごとに設定された複数の単語辞書、複数の統計データ又は自然言語文を格納した複数のコーパスの少なくとも何れか一つから参照すべき単語辞書、統計データ又はコーパスを選択するものである請求項1、2、3、4又は5の何れかに記載の言語獲得支援装置。 A word field changing unit that sets the field of the word group that can be used as a rule of the ritual and changes the field of the word group in the series of rituals by receiving input of a field changing command that specifies any field The word field changing unit includes at least one of a plurality of word dictionaries, a plurality of statistical data, or a plurality of corpora that store natural language sentences set in advance for each field based on a field changing command that has received an input. 6. The language acquisition support apparatus according to claim 1 , wherein a word dictionary, statistical data, or corpus to be referred to is selected from any one of them . シリトリの規則として利用可能な複数の難易度を設定しておき、いずれかの難易度を指定する難易度変更命令の入力を受け付けることにより一連のシリトリにおける難易度変更部をさらに具備し、この難易度変更部が、予め設定された複数の難易度にそれぞれ対応した複数の単語辞書及び複数の統計データ、又は自然言語文を格納した複数のコーパスから入力を受け付けた難易度変更命令に対応する単語辞書及び統計データ、又はコーパスを選択するもの、又は選好度及び連想度に基づいて回答単語を決定するための演算式に変更を加えるものである請求項1、2、3、4、5又は6の何れかに記載の言語獲得支援装置。 A plurality of difficulty levels that can be used as siritri rules are set, and a difficulty level change section for a series of serie is further provided by accepting an input of a difficulty level change command that designates one of the difficulty levels. A word corresponding to a difficulty level change command received from a plurality of word dictionaries and a plurality of statistical data corresponding to a plurality of preset difficulty levels, or a plurality of corpora storing natural language sentences. 7. A dictionary, statistical data, or a corpus is selected, or an arithmetic expression for determining an answer word based on a preference and association is modified. The language acquisition support device according to any one of the above. 入力すべき提示単語に関するヒントを要請するヒント要請命令を受け付けるヒント要請受付部と、このヒント要請受付部で受け付けたヒント要請命令に基づいて直前に回答単語出力部で出力した回答単語の語尾文字を語頭文字とする単語からヒントを生成し出力するヒント生成・出力部とをさらに具備している請求項1、2、3、4、5、6又は7の何れかに記載の言語獲得支援装置。 A hint request accepting unit that accepts a hint request command for requesting a hint related to a presentation word to be input, and a suffix of the answer word output by the answer word output unit immediately before based on the hint request command accepted by the hint request accepting unit The language acquisition support apparatus according to claim 1 , further comprising a hint generation / output unit that generates and outputs a hint from a word used as an initial character. . 少なくとも回答単語出力部で出力した回答単語に関して入力された単語意味要請命令を受け付ける単語意味要請受付部と、この単語意味要請受付部で受け付けた単語意味要請命令に基づいて所定の単語意味辞書から当該回答単語の意味を抽出し出力する単語意味抽出・出力部をさらに具備している請求項1、2、3、4、5、6、7又は8の何れかに記載の言語獲得支援装置。 At least a word meaning request accepting unit that accepts an input word meaning request command regarding the answer word output by the answer word output unit, and a predetermined word meaning dictionary based on the word meaning request command accepted by the word meaning request accepting unit. The language acquisition support device according to claim 1 , further comprising a word meaning extraction / output unit that extracts and outputs the meaning of the answer word . コンピュータを動作させることにより、当該コンピュータに入力された提示単語の語尾文字を語頭文字とし且つ当該提示単語とは異なり既に入力を受け付けた又は既に出力した単語を除く回答単語を出力する所定のシリトリに係る規則に基づいた言語獲得支援装置として機能させるプログラムであって、当該コンピュータを、By operating a computer, a predetermined citrine that outputs an answer word excluding a word that has already been accepted or output, unlike the presented word, with the initial letter of the presented word input to the computer as an initial character. A program for causing a computer to function as a language acquisition support device based on the rules related to
提示単語の入力を受け付ける入力受付手段と、An input receiving means for receiving an input of the presented word;
この入力受付手段で受け付けた提示単語の語尾文字に基づいてその語尾文字を語頭文字とし既に入力を受け付けた又は既に出力した単語を除く候補単語を所定の単語辞書から自動抽出する候補単語抽出手段と、Candidate word extracting means for automatically extracting candidate words from a predetermined word dictionary excluding words that have already been input or have already been input based on the ending character of the presented word received by the input receiving means. When,
前記単語辞書に含まれる文字ごとに関してシリトリに勝つための複数の数量的統計データに基づいて、候補単語抽出手段で抽出した候補単語ごとに文字に依存するシリトリでの有利さの度合いを示す選好度を演算する選好度演算手段と、Preference indicating the degree of advantage in the citation that depends on the character for each candidate word extracted by the candidate word extraction means, based on a plurality of quantitative statistical data for winning the citation for each character included in the word dictionary A preference calculation means for calculating
自然言語文を格納した所定のコーパスにおいて提示単語と各候補単語が共に出現する頻度を、前記コーパスにおいて提示単語が出現する頻度で割った値に基づく連想度を演算する連想度演算手段と、An associative degree calculating means for calculating an association degree based on a value obtained by dividing a frequency at which a presentation word and each candidate word appear together in a predetermined corpus storing a natural language sentence by a frequency at which the presentation word appears in the corpus;
選好度演算手段で演算された選好度と連想度演算手段で得られた連想度の両方を含み、且つそれら選好度と連想度の値が大きいほど大きい値が得られる演算式により候補単語ごとの良好度を求め、当該良好度が最大の候補単語を回答単語に決定する回答単語決定手段と、Each candidate word is calculated by an arithmetic expression that includes both the preference level calculated by the preference level calculation unit and the association level obtained by the association level calculation unit, and a larger value is obtained as the value of the preference level and the association level is larger. An answer word determining means for obtaining a goodness degree and determining a candidate word having the maximum goodness degree as an answer word;
回答単語決定手段で決定された回答単語を出力する回答単語出力手段として機能させ、Function as an answer word output means for outputting the answer word determined by the answer word determination means,
前記数量的統計データが、候補単語の語尾文字を語頭文字とする単語の数に対する候補単語の語尾文字を語頭文字として持ち且つシリトリの規則において負けを意味する文字を語尾文字に持つ単語の数の比率と、候補単語の語尾文字を語尾文字とする二文字のみで構成される候補単語の集合においてそれら単語の語頭文字の種類の数を選好度要素値としてThe quantitative statistical data includes a word having a candidate word ending character as an initial character and a word having a character meaning losing in a siritri rule as the initial character with respect to the number of words having the candidate word ending character as an initial character. The preference element value is the ratio of the numbers and the number of types of initial letters of those words in a set of candidate words consisting only of two letters with the final letter of the candidate word as the final letter. 有し、選好度演算手段が、前記選好度要素値の値が大きい候補単語ほど有利さの度合いが大きいことを示す演算式で得られる選好度を演算するものであることを特徴とする言語獲得支援プログラム。A language acquisition unit, wherein the preference calculation means calculates a preference obtained by an arithmetic expression indicating that a candidate word having a larger value of the preference element value has a higher degree of advantage. Support program.
前記コンピュータをさらに、予め設定されたシリトリの規則として利用可能な単語群の複数の分野のうちいずれかの分野を指定する分野変更命令の入力を受け付けることにより一連のシリトリにおける単語群の分野を、予め分野ごとに設定された複数の単語辞書、複数の統計データ又は自然言語文を格納した複数のコーパスの少なくとも何れか一つから参照すべき単語辞書、統計データ又はコーパスを選択することによって変更する単語分野変更手段として機能させるものである請求項10記載の言語獲得支援プログラム。The computer further accepts an input of a field change command that designates any field among a plurality of fields of the word group that can be used as a preset rule of the citrine, thereby determining the field of the word group in the series of citrines, It is changed by selecting a word dictionary, statistical data, or corpus to be referred to from at least one of a plurality of word dictionaries set in advance for each field, a plurality of statistical data, or a plurality of corpora storing natural language sentences. The language acquisition support program according to claim 10, which functions as a word field changing means. コンピュータに入力された提示単語の語尾文字を語頭文字とし且つ当該提示単語とは異なり既に入力を受け付けた又は既に出力した単語を除く回答単語を当該コンピュータの処理に基づいて出力する所定のシリトリに係る規則に基づいた言語の獲得を支援する方法であって、To a predetermined citrine that outputs a reply word excluding a word that has already been accepted or output, unlike the presented word, with the ending character of the presented word input to the computer as an initial character. A method for supporting language acquisition based on such rules,
提示単語の入力を受け付ける入力受付ステップと、An input receiving step for receiving an input of the presented word;
この入力受付ステップで受け付けた提示単語の語尾文字に基づいてその語尾文字を語頭文字とし既に入力を受け付けた又は既に出力した単語を除く候補単語を所定の単語辞書から自動抽出する候補単語抽出ステップと、Candidate word extraction step for automatically extracting candidate words from a predetermined word dictionary excluding words that have already been input or have been output based on the ending character of the presented word received in this input reception step. When,
前記単語辞書に含まれる文字ごとに関してシリトリに勝つための複数の数量的統計データに基づいて、候補単語抽出ステップで抽出した候補単語ごとに文字に依存するシリトリでの有利さの度合いを示す選好度を演算する選好度演算ステップと、Preference indicating the degree of advantage in the citation that depends on the character for each candidate word extracted in the candidate word extraction step, based on a plurality of quantitative statistical data for winning the citation for each character included in the word dictionary A preference calculation step for calculating
自然言語文を格納した所定のコーパスにおいて提示単語と各候補単語が共に出現する頻度を、前記コーパスにおいて提示単語が出現する頻度で割った値に基づく連想度を演算する連想度演算ステップと、An association degree calculating step for calculating an association degree based on a value obtained by dividing the frequency of occurrence of both the suggested word and each candidate word in a predetermined corpus storing a natural language sentence by the frequency of occurrence of the presented word in the corpus;
選好度演算ステップで演算された選好度と連想度演算ステップで得られた連想度の両方を含み、且つそれら選好度と連想度の値が大きいほど大きい値が得られる演算式により候補単語ごとの良好度を求め、当該良好度が最大の候補単語を回答単語に決定する回答単語決定ステップと、Each candidate word is calculated by an arithmetic expression that includes both the preference degree calculated in the preference degree calculation step and the association degree obtained in the association degree calculation step, and the larger the preference value and the association degree value, the larger the value is obtained. An answer word determination step for obtaining a goodness degree and determining a candidate word having the maximum goodness degree as an answer word;
回答単語決定ステップで決定された回答単語を出力する回答単語出力ステップとからなり、An answer word output step for outputting the answer word determined in the answer word determination step,
前記数量的統計データが、候補単語の語尾文字を語頭文字とする単語の数に対する候補単語の語尾文字を語頭文字として持ち且つシリトリの規則において負けを意味する文字を語尾文字に持つ単語の数の比率と、候補単語の語尾文字を語尾文字とする二文字のみで構成される候補単語の集合においてそれら単語の語頭文字の種類の数を選好度要素値として有し、選好度演算手段が、前記選好度要素値の値が大きい候補単語ほど有利さの度合いが大きいことを示す演算式で得られる選好度を演算するものであることを特徴とする言語獲得支援方法。The quantitative statistical data includes a word having a candidate word ending character as an initial character and a word having a character meaning losing in a siritri rule as the initial character with respect to the number of words having the candidate word ending character as an initial character. A preference ratio calculation means having a ratio of numbers and a number of types of initial letters of the words in a set of candidate words composed only of two characters having the ending characters of the candidate words as ending characters; However, the language acquisition support method is characterized in that the preference degree obtained by an arithmetic expression indicating that the candidate word having a larger preference element value has a higher degree of advantage is calculated.
シリトリの規則として利用可能な単語群の複数の分野を予め設定しておき、いずれかの分野を指定する分野変更命令の入力を受け付けることにより一連のシリトリにおける単語群の分野を、予め分野ごとに設定された複数の単語辞書、複数の統計データ又は自然言語文を格納した複数のコーパスの少なくとも何れか一つから参照すべき単語辞書、統計データ又はコーパスを選択することによって変更する単語分野変更ステップをさらに有している請求項12記載の言語獲得支援方法。A plurality of fields of word groups that can be used as ritual rules are set in advance, and by receiving a field change command that designates one of the fields, a field of word groups in a series of citries is pre-defined for each field. A word field changing step that is changed by selecting a word dictionary, statistical data, or corpus to be referenced from at least one of a plurality of set word dictionaries, a plurality of statistical data, or a plurality of corpora storing natural language sentences. The language acquisition support method according to claim 12, further comprising:
JP2002240749A 2002-08-21 2002-08-21 Language acquisition support device, language acquisition support program, and language acquisition support method Expired - Lifetime JP3733425B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002240749A JP3733425B2 (en) 2002-08-21 2002-08-21 Language acquisition support device, language acquisition support program, and language acquisition support method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002240749A JP3733425B2 (en) 2002-08-21 2002-08-21 Language acquisition support device, language acquisition support program, and language acquisition support method

Publications (2)

Publication Number Publication Date
JP2004077995A JP2004077995A (en) 2004-03-11
JP3733425B2 true JP3733425B2 (en) 2006-01-11

Family

ID=32023456

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002240749A Expired - Lifetime JP3733425B2 (en) 2002-08-21 2002-08-21 Language acquisition support device, language acquisition support program, and language acquisition support method

Country Status (1)

Country Link
JP (1) JP3733425B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4550548B2 (en) * 2004-10-26 2010-09-22 株式会社国際電気通信基礎技術研究所 Teaching material presentation order control device and control program
JP2008032953A (en) * 2006-07-28 2008-02-14 National Institute Of Information & Communication Technology Language acquisition supporting device and program for the same
WO2020230353A1 (en) * 2019-05-13 2020-11-19 株式会社Nttドコモ Interaction device

Also Published As

Publication number Publication date
JP2004077995A (en) 2004-03-11

Similar Documents

Publication Publication Date Title
Aguado-Delgado et al. Accessibility in video games: a systematic review
JP4803709B2 (en) Word usage difference information acquisition program and apparatus
US20060089928A1 (en) Computer-implemented methods and systems for entering and searching for non-Roman-alphabet characters and related search systems
KR20050005523A (en) Word association method and apparatus
US20160035242A1 (en) Comprehension instruction system and method for vocabulary training
Kulahcioglu et al. Fontlex: A typographical lexicon based on affective associations
JP2012104041A (en) Text data summarization apparatus, text data summarization method and text data summarization program
JP3733425B2 (en) Language acquisition support device, language acquisition support program, and language acquisition support method
CN110941712B (en) User-level personalized text abstract generation method and system
Manin The right word in the left place: Measuring lexical foregrounding in poetry and prose
US9072966B2 (en) Computer implemented puzzle
Wloka et al. DARE–a comprehensive methodology for mastering kanji
JP7424104B2 (en) Learning equipment, learning methods and programs
JP2979475B2 (en) Electronic dictionary with word game
KR20070030734A (en) Composition evaluation device
JP2008032953A (en) Language acquisition supporting device and program for the same
Karpagam et al. An intelligent conversation agent for health care domain
KR101055619B1 (en) Intelligent end-to-end systems based on realistic language applications
WO2024004184A1 (en) Generation device, generation method, and program
Pollak et al. Scientific Question Generation: Pattern-Based and Graph-Based RoboCHAIR Methods.
Fehri¹ et al. Check for Construction of an Educational Game" CONJ_NOOJ" Héla Fehri¹ (~) and Nizar Jarray² MIRACL Laboratory, University of Sfax, Sfax, Tunisia
JP2007301272A (en) Game device and game control method
Weibel et al. Resources for Co-Designing Games with Children
Hjartarson et al. Malmon: A Crowd-Sourcing Platform for Simple Language
Erdur Language, Gender, and Videogames: Using Corpora to Analyse the Representation of Gender in Fantasy Videogames: Book Review

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20050121

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20050125

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050125

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050520

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050621

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050811

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050913

R150 Certificate of patent or registration of utility model

Ref document number: 3733425

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term