JP4908495B2 - 意味論的知識の評価と指導と習得とに関するシステムおよび方法 - Google Patents

意味論的知識の評価と指導と習得とに関するシステムおよび方法 Download PDF

Info

Publication number
JP4908495B2
JP4908495B2 JP2008504874A JP2008504874A JP4908495B2 JP 4908495 B2 JP4908495 B2 JP 4908495B2 JP 2008504874 A JP2008504874 A JP 2008504874A JP 2008504874 A JP2008504874 A JP 2008504874A JP 4908495 B2 JP4908495 B2 JP 4908495B2
Authority
JP
Japan
Prior art keywords
user
vocabulary
item
items
lexical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008504874A
Other languages
English (en)
Other versions
JP2008547038A5 (ja
JP2008547038A (ja
Inventor
シヒ ガイ
ブラウン チャールズ
カリガン ブレント
孝司 大野
潔 西島
シャウフェル デビッド
Original Assignee
エーアイ リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by エーアイ リミテッド filed Critical エーアイ リミテッド
Publication of JP2008547038A publication Critical patent/JP2008547038A/ja
Publication of JP2008547038A5 publication Critical patent/JP2008547038A5/ja
Application granted granted Critical
Publication of JP4908495B2 publication Critical patent/JP4908495B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B19/00Teaching not covered by other main groups of this subclass
    • G09B19/06Foreign languages
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B7/00Electrically-operated teaching apparatus or devices working with questions and answers

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Machine Translation (AREA)

Description

(関連出願の相互参照)
本出願は、2005年4月5日に出願された係属中の米国仮特許出願番号60/668764号に対する優先権を主張する。この米国仮特許出願番号60/668764号は、参照することにより本明細書に組み込まれる(代理人ドケット番号581458001US)。
以下の開示は、一般に、意味論的知識の評価と指導とに関するシステムおよび方法に関する。
言語学の分野には、数多くの教育理論と、言語習得に関する方法とが含まれる。従来の理論および方法の多くは、ルールに基づく文法概念または文法プロセスに関する。標準的な文法解釈法は、例えば、シンタックス(syntax)および文の構造の学習に焦点を当てている。この文法解釈法は、文を構築するための文法ルールを一度学生が十分に学習すれば、意味のある言語の生成に必要とされる適切な語彙をあてはめることができることを前提としている。例えば、(習慣形成に基づく)オーディオリンガル法は、主としてシンタックス構造に焦点を当て、語彙の単語は、それらの単語が様々な文の中で使用されるものとしてのみ教えられる。より最近の研究は、発達順序(developmental sequence)、インプットの役割(role of input)、および/または言語習得における指導の役割など、他の文法的特徴に焦点を当てている。
語彙概念および語彙学習ならびに指導法は、従来より、主流の言語習得理論に対して補助的なものと見なされてきた。しかしながら、主流の言語学者が依然として文法的な概念およびアプローチに主に焦点を当てる一方で、別の少数派の言語学研究者および専門家は、主に語彙の観点からの言語習得に焦点を当ててきた。
初期の語彙研究は、例えば人々が知っている単語の数を理解しようと試みた。これには、(a)単語を構成するもの、および(b)単語を知ることの意味の両方の定義が必要であった。何が単語を構成しているかについての有力な定義に基づくと、英語には約180000個の単語がある。例えば、以下の表は、ブラウンコーパス(Broun Corpus)の現行のテキスト(running text)における本文網羅率と英単語の使用頻度との関係の概要を示している。
Figure 0004908495
上の表に示すように、全英単語の約4分の1(24%)が、最頻出英単語の上位10個のうちの1つである傾向がある。上の表からさらに、単語の使用頻度が下がると、そのテキスト網羅率への寄与が下がることが分かる。実際、100個の最頻出英単語が、英語テキストに含まれる全単語のほぼ半数(49%)を占める。例えば、英語における最も一般的な単語「the」は、一般的なテキストの100語ごとに約6回出現する。
大部分の研究および成果が主に母国語の習得に焦点を当てる一方、第2言語の習得に対しても同様に暗示されることがある。例えば、初期の研究によると、ネイティブスピーカは150000をはるかに超える語彙を有し、従って、単語を直接的に研究しても言語習得の実践的な道筋を示すことができないと提案されている。しかしながら、以後の研究では、ネイティブの語彙は10000から20000語にしか及ばないようであると考えられている。その後、単語の直接的な研究が有益であるという考えが信頼されている。他の研究者は、英語を第2言語とする学生が学習すべき語彙の単語を調査し、重要度順にその語彙の単語をどのように並べるのが最適かを調査した。
一部の従来の語彙システムは、例えば、コーパス、またはコーパスのサブドメインに関する使用頻度により語彙の単語を構成することを含む。コーパスは、何百万ページもの所与の言語のテキストから構成される。サブドメインは、所与の言語に含まれる特殊目的の語彙項目のサブセットである(例えば、アメリカの道路標識、金融専門家が用いる語彙および用語、情報工学の技術者が用いる語彙および用語等)。従来の語彙システムは、所与の言語、またはその言語のサブドメインにとってどんな内容が相応レベルの学習教材を構成するかに関する意思決定において、主にコーパス内の単語使用頻度に依存する。例えば、出版社は、(a)一般的なコーパスから最頻出英単語のうち最初の1000個のみを含めたレベル調整したGraded Readers(GR)、および(b)典型的なTOEIC英語習熟度試験に出現し得る数千の英単語の全てを記載した単語帳を出版してきた。
しかしながら、従来の語彙システムは多数の欠点を含む。多くの従来システムの1つの欠点は、例えば、公開された単語リストは、特定の個人または個人のグループが既に知っている可能性のある単語を考慮しないということである。そのため、単語リストは学習者が既に熟知している何千ではなくとも何百もの単語を含んでいる可能性があり、従って、既知の単語を学習する利点は、ほとんどない、または全くないので、単語リストの言語習得に対する有益性はわずかしかない。むしろ、より高レベルなコミュニケーション能力および総合的な言語能力の取得に最も有益なことは、未知の語彙項目の学習および習得である。これと同じ現象は、他の種類の語彙項目、例えば、音声、発話、連語単位(multi-word-units)、慣用表現、イメージ、標識、記号、連記号単位(multi-symbol-units)、プログラムコードに対しても成り立つ。これらの各々は、言語またはその言語のサブドメインにおける意味を記号化あるいは伝達する役割を果たすものである。
従来の語彙システムの別の欠点は、個人が所与の言語または言語サブドメインにおける認識可能、かつ/または認識不能な特定の語彙項目を迅速かつ正確に識別する方法がないことである。例えば、個人、統計区分、および/または人口(population)ごとに、認識確率の低い高頻出英単語が何百もある。逆に、個人、統計区分、および/または人口ごとに、認識確率の高い低頻出英単語が何百もある。しかしながら、従来のシステムは、認識不能な項目から認識可能な項目を識別して分離することができない。
従来の語彙システムは他の欠点も複数含む。例えば、従来のシステムは一般に、(a)各個人が認識不能な語彙項目の相対的重要度と、(b)個人、統計区分、および/または人口の語彙知識の深さ(lexical depth of knowledge)とを測定したり評価したりしない。さらに、大部分の従来のシステムは、各個人学習者の語彙能力評価に基づいて能力相応なGraded Readers(GR)を構成することに適したプロセスを含まない。さらに、大部分の従来のアプローチは、新たに学習した語彙項目の保持能力を評価することに適したプロセスを含まない。従って、言語の習得および学習に関する語彙システムおよび方法を改善する必要性がある。
この背景技術のセクションは、言語習得、より詳細には、主に語彙の観点からの言語習得に関する様々な既存の理論、方法、およびシステムを要約したものである。このセクションは、以下で説明する本発明の理解に役立つ先行技術の語彙システムに関する発明者の洞察および所見の説明も含むが、その洞察および所見は、必ずしも当業者により理解される必要はなく、あるいは先行技術で開示される必要はない。従って、この背景技術セクションにこれらの洞察および所見を含めることは、従来の語彙システムに関連する様々な欠点の説明を含めて、上記の洞察および所見が先行技術の一部であったことを示すものとして解釈すべきではない。
(A.一般的概要)
以下の開示は一般に、能力相応な言語教材を試験、編集(compile)、評価、および配信するためのシステムおよび方法に関する。本明細書で説明する言語訓練システムは、任意の所与の言語または辞書(あるいは、言語または辞書の、任意の所与の特殊目的サブドメイン)における個人の語彙能力を評価することができ、かつその評価を用いて、効率的かつ迅速に個人の言語およびコミュニケーション能力を向上させるための、指導上最適な指導コースを確立することができる。より詳細には、開示するシステムおよび方法は、各個人の語彙能力を定量化し、個人、統計区分、および/または人口に対して、語彙認識能力の評価および知識の深さの評価を統計的に生成することができる。開示するシステムおよび方法は、個人の語彙能力評価およびニーズに基づいて各個人に対して特別にカスタマイズした、未知の語彙項目の個人別言語学習順序を生成することもできる。従って、語彙の重要度により構成され、かつ各個人学習者に対して様々な受動的かつ対話的な手法により配信される語彙項目を直接研究するためにも、開示するシステムおよび方法を提供することができる。
開示するシステムはさらに、様々な種類の個人別言語能力レポートをユーザに対して生成して配信すること、さらに上記レポートおよび関連データを他人に対して構成して伝達することを含む。本システムは、同一人口における様々な統計区分間、特に様々な年代間での特定の語彙項目の認識度における任意の重要な差異を識別して調整することができる。さらに、本システムは、複数の異なる国の人口間において存在する、任意の所与の言語またはその言語のサブドメインに対する語彙項目の認識度における任意の重要な差異を識別して調整することができる。
本システムはさらに、(任意の所与のトピックに関する)テキスト教材を再構成して提示することを含み、テキストが再構成された辞書は、学習者が認識できない予め定められた割合の語彙項目を含む。本文内に有限数の未知の語彙項目を含めることにより、読者は未知の語彙項目に対し、既知の項目を含む文脈中でそれらを使用することにより、未知の語彙項目に意味を割り当てることができる。
本発明の諸側面は、複数の様々な方法により特徴付けることができる。例えば、一側面は、所与の言語コーパスまたはそのサブドメイン内で、語彙項目の重要度を編集して保持する方法を含む。本明細書において、「重要度」という用語は、任意の1つまたは複数の項目出現頻度、項目の重要度の尺度、項目の引用数、項目の価値、および任意の他の項目に固有な定量化可能な変数を指すことができる。本発明の別の側面には、一般言語の辞書、または言語のサブドメインの辞書から抽出された一連の選択語彙項目の認識度に関して、個々のユーザを試験する方法を含めることができる。この選択語彙項目には、実在する語彙項目および擬似語彙項目の両方を含めることができる。擬似語彙項目は一般には妥当にみえるが、所与の言語または辞書において意味を持たないものである。本方法には、例えば、対話的な「Yes/No」語彙判定型の質問による試験プロセスを用いて、項目を表示することを含めることができる。
本発明のさらに別の側面には、ユーザが属する統計区分に対して予め定められた認識度を有する項目群から最初に提示される項目がランダムに選択されるように、対話的な順序で語彙項目を表示する方法を含めることができる。適切なアルゴリズムプロセスを使用して、ユーザが少なくとも1つの実在する語彙項目を知っているものとして識別し、かつユーザが少なくとも1つの実在する語彙項目を知らないものとして識別するまで、後続する各語彙項目を認識度スケールの上および下からランダムに選択することを誘導することができる。擬似語彙項目を実在する語彙項目の表現内にランダムに分散させ、ユーザ個々の当て推量行動(conjecturing behavior)を制御することができる。
本発明のさらに別の詳細な側面には、試験プロセス中に提示された語彙項目の質問に関する各回答者の回答と対話とに関わる各試験の回答およびデータの統計情報を、(例えばデータベースに)格納する方法を含めることができる。本発明の別の側面には、新たに学習した語彙項目知識の保持能力を、(特定の回答者、統計区分、および人口に対して)判定する方法を含めることができる。保持能力は、知識の深さ、保持期間、または他の適切な要因に基づくものとすることができる。
本発明のさらなる側面には、(a)全回答者からの回答データを集計し、各語彙項目に対する標準的な認識度測定を、統計区分ごとに判定する方法と、(b)1つまたは複数の特定の統計区分または人口に対して語彙認識の累積度数分布曲線を確立する方法と、(c)各個人回答者の統計データおよび語彙項目の認識回答データを、語彙認識の累積度数分布曲線に含める方法と、(d)語彙認識の累積度数分布曲線に沿って各回答者の語彙認識能力を判定し、このようにして対応する回答者の認識語彙項目および認識不能語彙項目を判定する方法とを含めることができる。
本発明の別の側面は、語彙項目の知識の深さに関する質問を対話的に表示すること(例えば、複数選択判定型の質問および/または「Yes/No」判定型の質問)を用いて、各回答者の語彙項目の知識の深さを試験する方法に関する。一実施形態において、例えば、最初に表示される知識項目の深さは、語彙項目の認識に対する回答者の能力評価に基づいて推定された能力レベルにある。アルゴリズムにより、後続する知識の深さに関する質問を選択して、能力推定値における最大量の情報を与える。各回答に対して、推定値の最大尤度(the maximum likelihood)、試験情報、および標準誤差を再計算し、それに従って、改訂された能力推定値における後続する知識の深さに関する質問を選択して、回答者に提示することができる。様々なレベルの語彙項目の知識の深さが所望のレベルの正確度で達成されるまで、このプロセスを繰り返すことができる。
本発明のさらに別の詳細な側面は、以下の各々を判定して、各個人が、知らない語彙項目、馴染みのない語彙項目、および忘れやすい語彙項目を学習するための指導上最適な個人別言語学習順序を生成する方法に関する:
(a)所与のコーパス、またはそのコーパスのサブドメイン内での語彙項目の重要度、
(b)統計区分または人口に対する語彙認識の累積度数分布曲線、
(c)統計区分または人口に対する複数の語彙知識の深さの累積度数分布曲線、
(d)統計区分または人口に対する語彙保持の累積度数分布曲線、
(e)個々の回答者の語彙認識能力、
(f)個々の回答者の語彙知識能力の深さ、および、
(g)個々の回答者の語彙保持能力。
本発明の別の側面には、適切なデータベースシステムと、任意の様々な学習プログラムまたはコンピュータシステムとの間で各学習者の個人別言語学習順序を対話的に交換する方法が含まれる。前述した学習プログラムまたはコンピュータシステムは、前述したデータベースシステムとインターフェースを介して接続されるように設けられる。学習プログラムとデータベースシステムとの間における対話的データ交換により、言語学習順序の改訂および保守を行うことができ、データベースシステムは、接続された言語プログラムまたはコンピュータシステムに対して、最新の言語学習順序および現在の言語学習順序を繰り返し配信することができる。
本発明のさらに別の側面は、個別電子メールサービスを介して、各個人学習者向けに、個人別言語学習順序内に1つまたは複数の語彙項目の変形を含める学習教材を生成する方法に関する。電子メールサービスは、様々な指導方針を利用して、購読者(subscriber)が語彙項目の知識を学習して保持することを支援することができる。例えば、個別電子メールサービスは、購読者による対話の様々な確認手段を要求および提供し、それにより、言語学習順序データベースシステムに対して、適切な更新を行うことが可能となる。
本発明のさらに別の側面は、様々な能力相応の段階的教材を生成して配信する方法に関する。そのような教材には、リーディング教材、リスニング教材、およびビデオ教材、ならびに他のレベル相応の文脈言語教材が含まれる。そのような能力相応の教材には、購読者による対話の様々な確認手段を要求および提供し、それにより、適切なデータ記憶デバイスに格納された言語学習順序に対して、適切な更新を行うことが可能となる。
本発明のさらに別の側面は、個人別の対話的な語彙言語学習ゲームを生成して配信する方法に関する。言語学習ゲームは、例えば、語彙項目群を配信して、必要に応じて語彙項目を個人別言語学習順序で提示することができる。言語学習ゲームは、他の形態のレベル相応の学習教材を配信して提示することもできる。言語学習ゲームは、移動通信デバイス、パーソナルコンピュータ、携帯電子デバイス、および/または他の適切な電子デバイスを用いて、語彙項目と他のレベル相応の学習教材とを配信して提示することができる。言語学習ゲームは、様々な指導方針およびグラフィカル形式を利用して、購読者が大部分の語彙項目および他のレベル相応の学習教材を迅速に学習して保持することを支援することができる。言語学習ゲームには、購読者の対話を承認して記録する自動的な手段を含めることもでき、それにより、データベースシステムに対して、適切な更新を行うことが可能となる。
本発明の別の側面は、個人用、累積的、および/または比較用といった様々な種類の語彙能力レポートを、個人、指導者、および/またはプログラム管理者に対して生成して配信する方法に関する。レポートされる結果には、例えば、(a)どれくらいの項目の総数が既知であるかを示すグラフィック表現およびテキスト表現、(b)所与のコーパスまたは所与のサブドメイン内での既知/未知の項目数、(c)コーパスまたは所与のサブドメインの様々な使用頻度帯における既知/未知の項目数、(d)知識の深さに関する様々な態様による語彙項目の認識の程度、(e)学習プログラムとの対話を介した新たな語彙項目の習得速度、(f)特定の能力目標達成前の残存項目数、(g)特定の能力目標の達成に必要な推定時間、および(h)個人の能力の任意の態様と、統計区分または人口の累積的な能力の均等な態様との比較を含めることができる。
本発明のさらに別の側面には、ユーザが知っている単語数、ユーザが知っている正確な単語、およびユーザの言語学習目標を達成するためにユーザが学習すべき単語を迅速かつ正確に識別する方法を含めることができる。例えば、本システムには、各個人が知っている単語を判定するように構成された語彙エンジンを含めることができる。一実施形態において、語彙エンジンは、ユーザに対して、コンピュータまたは携帯電子デバイス(例えば、携帯電話、PDA等)の画面上に一連の単語または他の語彙項目を表示させることができる。ユーザは、その単語または項目を知っていれば、「Yes」を選択またはクリックし、その単語または項目を知らなければ、「No」を選択またはクリックすることができる。語彙エンジンは、その回答に基づいて、所与の辞書を用いて、個人が知っている単語または項目を正確に判定することができる。次いで、語彙エンジンは、その個人に対する優先度で、残りの未知の単語をランク付けすることができ、これらの未知の単語は、ユーザの個別目標リストとなる。
本発明を様々な実施形態に関連させて説明する。以下の説明は、本発明のこれら実施形態を完全に理解させ、これら実施形態を説明できるようにさせるための具体的な詳細を提供する。しかしながら、当業者であれば、これらの詳細な説明がなくとも、本発明を実施できることが理解されよう。他の例では、本発明の実施形態の説明を不必要に不明瞭にすることを避けるため、公知の構造および機能を詳細に図示または記述していない。
以下の説明で用いる技術は、たとえその技術が本発明の特定の具体的な実施形態に関連させて使用されている場合でも、最も広範囲かつ合理的なように解釈されることを意図している。ある特定の用語については、以下でさらに重点的に説明するが、限定的に解釈されるよう意図した任意の技術は、この[発明を実施するための最良の形態]において、そのように明白かつ具体的に定義される。本特許出願における具体的説明は、一般に英語について言及するが、本明細書で説明するシステムおよび方法は、任意の言語または意味論的知識ドメインに対して、等しく適用することができる。
必須ではないが、本発明の諸側面および諸実施形態について、汎用コンピュータ(例えば、サーバまたはパーソナルコンピュータ)が実行するルーチンなどのコンピュータ実行可能命令の一般的コンテキストにおいて説明する。このようなシステムの例については、図12〜図13Bを参照して、以下でより詳細に説明する。
(B.言語知識評価と指導とに関するシステムおよび方法の実施形態)
図1は、本発明の一実施形態に従うように構成された言語評価および指導システム100を示すブロック図である。システム100には、試験コンポーネント124と、編集コンポーネント122、126、128、130、および132と、評価コンポーネント122、124、および132と、能力相応な言語教材をユーザに配信するように構成された配信コンポーネント116とを含めることができる。
システム100には、任意の所望の数のコーパスおよび対応するサブドメインを格納するように構成された1つまたは複数のコーパスおよびサブドメインデータベース110(1つのみ図示)を含めることができる。システム100にはまた、語彙項目データの重要度の編集に用いるコーパスプログラムまたはコーパスモジュール112も含まれる。より詳細には、各コーパスおよびサブドメイン内には、語彙項目のセットが存在する。各コーパスまたはサブドメイン内の語彙項目の全集合は、辞書と呼ばれる。本明細書では、用語「語彙項目」は、意味を記号化する任意の記号、連記号単位、音声、発話、単語、連語単位、または慣用表現を指す。用語「辞書」は、特定の言語における語彙項目全てを指す。所与の辞書内の語彙項目は、複数のコーパスまたはサブドメイン内の重要度に従ってランク付けすることができる。コーパスプログラム112は、例えば、コーパスおよびサブドメインを走査して、コーパスおよびサブドメインごとに、項目の重要度データを生成することができる。項目重要度データベース114は、コーパスまたはサブドメインごとに、語彙項目の重要度データを格納することができる。この特徴の1つの利点は、語彙項目が、各辞書に関して、相対的重要度に従って構成されるため、その相対的重要度が、各ユーザに対して未知の語彙項目および馴染みのない語彙項目を、個人別言語学習順序に最も論理的かつ効率的に並べることに寄与することである。
システム100には、キャリブレーションプログラムまたは方法130がさらに含まれる。このキャリブレーションプログラムまたは方法130は、大規模なサンプル128から語彙項目の認識度を推定し、その結果を適用して各個々の回答者に対して正確な能力推定値を生成し、そして、学習すべき対象項目から構成される個人別言語学習順序116の生成に寄与するものである。このプロセスには、例えば項目応答理論(「IRT(Item Response Theory)」)を使用して、各項目と各回答者、統計区分、および/または人口との間の確率関係を確立する統計モデルを構築することを含めることができる。この特徴の1つの利点は、システム100が、個々の回答者が知らない可能性があり、従って、学習すべきである特定の語彙項目を、正確に判定してレポートすることができることである。
所与のコーパスまたはそのサブドメインからの項目重要度データ、語彙項目認識度データ122、および1つまたは複数の語彙項目に関する知識の深さ122の態様からのデータ、ならびに語彙項目保持能力120からのデータを取得し、1つまたは複数のアルゴリズムプロセスによりそれらのデータを結合して、知らない可能性のある語彙項目から構成される一意な個人別言語学習順序を生成して保持するように、個人別言語学習順序編集部116が構成される。このプロセスは、各ユーザの語彙能力評価およびニーズにより通知される。従って、各ユーザの知らない可能性がある語彙項目であるが重要な語彙項目が優先されることになる。加えて、各ユーザの言語学習順序の構成は、ユーザの語彙知識の深さと、新たに学習した項目保持データとの現行の表現に基づいて、さらに更新することができる。
システム100はさらに、個々のユーザデータベース126と、様々な学習プログラム118および/または他の適切な環境との間で、個人別言語学習順序116を対話的に交換することができる。学習者が1つまたは複数の学習プログラム118と対話すると、対話および保持編集部120により、データを取得して編集することができる。対話および保持編集部120は、特定のユーザによる進歩がみられると学習順序編集部116に通知し、対話に基づいて各ユーザの言語学習順序が、ユーザの現在の語彙能力に関して常に通知または更新されることを確実にすることができる。より詳細には、対話および保持編集部120は、各ユーザの学習能力と、時間の経過とともに新たに習得した語彙項目を保持する能力とに関する情報を認識して編集することができる。このようにして、学習順序編集部116は、対話および保持編集部120から受信した情報に基づいて、各ユーザの言語学習順序を調整することができる。また、各ユーザの学習プログラムとの対話および/または新たに学習した項目の保持に関する情報を個々のユーザデータベース126に格納し、(必要に応じて)学習順序編集部116および/またはレポートモジュール134は、(後者は編集部116を介して)その情報を利用することが可能となる。個人別言語学習順序116に基づいて、文書による形式または聴覚による形式で、学習者が選択したトピックに関する教材を含む様々な能力相応の教材を作成して配信するようシステムを構成することもできる。このプロセスについては、図11A〜図11Cを参照して、以下でさらに詳細に説明する。
システム100には、ユーザとシステム100との間のインターフェースの一例として、コンピュータ適応型試験(「CAT(Computer Adaptive Test)」)コンポーネント124を含めることもできる。例えば、パーソナルコンピュータ、携帯電話、PDAを用いて、あるいは、他の適切なデバイスおよび/またはプロセスを用いてユーザに対する試験(例えば、対話的IRT試験)が管理されるように、CAT124を構成することができる。このように、CAT124を使用して、各ユーザの語彙項目認識能力および知識能力の深さを計算することができる。CAT124は、項目認識度およびDOKデータベース122から、1つまたは複数の統計区分と人口とに関する、適切な項目認識度データおよび知識の深さに関するデータを取得することもできる。
各ユーザの能力評価および統計的詳細を、個々のユーザデータベース126に格納し、各ユーザの生の項目回答データを、統計区分ごとの累積回答データベース128に格納することができる。累積回答データベース128は、キャリブレーションプログラム130の使用のために、個々の試験受験者全てからの回答データを定期的に収集して編集するように、構成することもできる。キャリブレーションプログラム130は、各語彙項目に対する認識度を確立し、人口および統計区分に対する関連する知識の深さを分析することができる。キャリブレーションプログラムの結果は、項目認識度およびDOKデータベース122に格納することができる。認識およびDOK度数分布曲線編集部132は、データベース122からのデータを、人口、統計区分、または別の所望の要素ごとにソートされた認識度数分布曲線を構築するように、構成することができる。度数分布曲線編集部132は、レポートモジュール134および学習順序編集部116の両方に、各ユーザの関連する度数分布曲線を提供することができる。
一実施形態において、個々のユーザデータベース126は、個人別言語学習順序編集部116に、個々のユーザの能力に関して通知することができる。認識およびDOK度数分布曲線編集部132は、各統計区分および人口に対して、認識度およびDOK能力測定値を構成することができる。従って、度数分布曲線編集部132により、既知の単語および未知の単語に関する各ユーザの評価を、認識度のランク順に行うことが可能となる(図3と関連させて以下で説明する)。学習順序編集部116は、一般言語およびその任意の所望のサブドメインの両方に対する項目重要度データベース114から、語彙項目データの重要度を取得する。学習順序編集部116は、ユーザの能力およびニーズに基づく優先度の観点から、各ユーザの知らない語彙項目、馴染みのない語彙項目、および忘れやすい語彙項目をランク付けすることができる。学習順序編集部116により、最重要(ではあるが未知の)語彙項目の学習が優先される。
一実施形態において、学習順序編集部116は、ユーザの個別項目順序を様々な学習プログラム118に提供するように、構成することもできる。学習プログラム118には、電子メールサービス、対話的言語学習ゲームまたはアクティビティ、および能力相応なテキスト教材が含まれるが、これらに限定されるものではない。ユーザは様々な学習ゲーム118と対話することができる。学習ゲーム118は、各ユーザが自身の個人別言語学習順序を学習することを支援するよう設計された適切な指導方針および指導形式を利用する。ユーザは、パーソナルコンピュータ、携帯電話、PDAを用いて、あるいは、他の適切なデバイスおよび/またはプロセスを用いて学習プログラムと対話することができる。
個々のグラフィックによるスコアおよび文字によるスコアが各ユーザに対して生成され、ユーザまたは他の個人(例えば、指導者等)が、パーソナルコンピュータ、携帯電話、PDAを用いて、あるいは、他の適切なデバイスおよび/またはプロセスを用いてそのスコアを利用することが可能となるように、レポートモジュール134を構成することができる。レポートモジュール134は、語彙能力および学習経過の多次元の分析および/または比較を有する統合型のレポートを指導者および/またはプログラム管理者に対して生成するように、構成することもできる。各レポートには一般に、ユーザが知っている単語の数、そのユーザにとって重要度が高いまたは頻度が高い位置およびその程度、単語知識のギャップ、およびユーザが自身の重要な次の語彙目標に到達するために習得が必要な単語の数が含まれる。重要な語彙の目標は、言語およびサブドメインに応じて変化する。一般的な英語では、例えば、使用頻度の最も高い単語の上位3000語を知ることで、辞書の支援なしに、典型的な英語の読本を読むことができる。従って、英語を学習するユーザにとって重要な目標は、使用頻度の最も高い単語の上位3000語を学習することであろう。他の実施形態では、レポートは様々なデータを含み、かつ/または様々な特徴を有することができる。
例示した実施形態では、言語訓練システム100の各コンポーネントには、独立したコンポーネント(例えば、単一のデータベースまたは単一の処理コンポーネント)が含まれる。しかしながら、他の実施形態では、複数の上述したコンポーネントを、同一のデバイス内に配置させることができる。さらに別の実施形態では、言語訓練システム100には、様々な数のコンポーネントを含めることができ、かつ/または、そのコンポーネントは、多様に配置させることができる。さらに、言語訓練システム100の1つまたは複数のコンポーネントは、単体で動作するか、またはシステム全体内のサブシステムとして動作する、別個のユーティリティを有することができることが理解されよう。例えば、システムの様々なコンポーネントを、単にユーザの語彙知識を評価するためだけに使用することができる。他の実施形態では、コンポーネントは、他のように配置させて、他の機能を実施させることができる。
図2は、本発明の一実施形態に従う、累積した個々の試験回答および回答者のデータを用いて、統計区分ごとの標準認識度数分布曲線を処理するように構成された、システム100の様々なコンポーネントを示すブロック図である。より詳細には、累積ユーザ回答データベース128は、(項目応答理論を利用する)語彙項目キャリブレーションプログラム130により、所望の間隔で分析することができる。キャリブレーションプログラム130は、例えば、項目応答ベクトルの最大尤度を結合的に推定する統計的手順である、結合最大尤度推定法(Joint Maximum Likelihood Estimation)を利用することができる。プログラムは、最初に回答者の能力の初期推定を行い、次いで、これらの推定値を固定されたものとして処理し、能力推定値を条件とした項目応答ベクトルの最大尤度を推定して、語彙項目の認識度の推定値を取得する。次いで、このステップの結果を固定されたものとして処理し、その後、語彙項目の認識度を条件とした最大尤度を用いて項目応答ベクトルを推定して、能力の新たな推定値を得る。このプロセスは、プロセスが設定基準に収束するまで継続する。
一実施形態において、例えば、各回答者は、対話的IRTオンライン試験において回答者の前に表示される一連の項目に対し、回答することができる。任意の1人の回答者に対して表示された適切な数の語彙項目は、他の回答者に対して表示されたものである可能性がある。キャリブレーションプログラム130は、全ての回答者の回答が、1つの集計された試験に対する1つの項目プール全体のサブセットであるかのように、全ての回答者の回答を管理、構成および定期的に編集することができる。一実施形態において、回答者の入力は、任意の特定の統計区分、および/あるいは、任意の言語またはその言語のサブドメインごとに構成することができる。キャリブレーションプログラム130により、各語彙項目の認識度測定値および各回答者の個々の能力測定値が同時に推定されるので、全ての推定値は、同一スケール上に存在することになる。各語彙項目に対する回答の累積数が、項目の認識度測定を安定させるのに十分であるとすると、システムは、任意の特定の言語サブドメインにおける個人の能力評価を正確に判定することができる。
一例として、本システムの特定の実施形態において(、および18歳の日本人男性から構成される統計区分に対して)、ヘヴィメタル音楽に関する日本語サブドメインにおける各語彙項目の具体的な認識度を判定することができる。ヘヴィメタル音楽(「HMM(Heavy Metal Music)」)に特に関連するコーパスサブドメインの分析を通じて、試験プロセス用の語彙項目を生成する。サブドメインは、コーパスプログラム112により走査されて構成され、この例では、コーパス内の出現頻度によりランク付けされた重要項目の辞書が編成される。第1ステップとして、対象統計区分のうち約1000人の回答者から構成されるベータ試験グループに対して、HMM語彙項目を試験する。ベータ試験により、18歳日本人男性のHMM語彙項目における認識度の初期キャリブレーションが可能となる。次いで、この試験により、後続する18歳男性の各回答者に対して、HMM語彙項目を暫定的に推定することができる。暫定スコアは、遡って最初の1000人のベータ試験回答者に送信することもできる。その後、回答者の累積数の増加に伴い、累積回答データ128のそれぞれの後続するキャリブレーション130により、個々の能力推定値の正確性が明確になる。語彙の統計的確率の性質は一種の収穫逓減(diminishing return)である。すなわち、特定のポイントを過ぎると、一般に各語彙項目に回答した人数に関係なく、項目の認識度測定は、一般に安定したままとなる。
所与の回答の確率は、変数と適用目的とに応じて、いくつかのIRT式により数学的に表現される。一実施形態において、能力θjを有するランダムな回答者jが、認識度riを有するランダムな項目iに正確に回答する確率は、回答者の能力と項目の認識度とによって条件付けられる。すなわち、回答者が特定のドメインにおいて高い能力を有する場合、その回答者は、回答者の統計区分および人口に対して高い認識度を有する項目を認識する可能性が高い。逆に、回答者が低い能力を有し、かつ項目が低い認識度を有する場合、回答者はその項目を認識しない可能性が高い。
一実施形態において、項目認識の確率は、以下の式を用いて計算することができる。
Figure 0004908495
ここで、Pi(θ)は、能力θを有するランダムな回答者が、項目iを認識する確率であり、eは自然対数の底(2.718)であり、θはロジット(logits)で測定された回答者の能力であり、biはロジットで測定された項目の認識不能度パラメータ(un-recognizability parameter)であり、riは認識度パラメータであって、(bi *−1.0)に等しい。
能力θの推定値が大きくなれば、回答者の能力も高くなる。能力θの推定値の範囲は、−∞<θ<∞とすることができる。同様に、認識度riの推定値が大きくなれば、その項目の認識度が高くなる。認識度の範囲は、−∞<b<∞とすることができる。
以下の式の1つまたは複数のバージョンに基づいて、適切なモデルを構築することができる。
Figure 0004908495
ここで、eは定数2.718であり、biは認識不能度パラメータであり、γjは回答者jの個々の当て推量行動であり、θは能力レベルであり、Dはスケーリング係数である。
一実施形態において、本発明の方法には、1つまたは複数のアルゴリズムプロセスを用い、コーパス内の重要度に基づいて、語彙項目の認識度の測定値と、項目のランクを数学的に具現化したものとを比較して、各学習者に対して確率的に認識不能な項目の相対的優先度を定量化することを含めることができる。
図3は、日本の人口における年齢別統計区分の中で、使用頻度の最も高いBNC英単語の上位6000語の各々の認識度に関する累積度数分布曲線グラフである。単語は、コーパス内の使用頻度ではなく、累積した回答者に対する認識により編成される。線Aは、試験回答者Aに対する−3.29という評価能力を示し、この統計区分が認識可能な6000語のうち1000個を回答者Aが認識する可能性が確率的に高いことを示している。線Bは、試験回答者Bに対する+2.63という評価能力を示し、この統計区分が認識可能な6000語のうち5000個を回答者Bが認識する可能性が確率的に高いことを示している。図3に示すデータについては、図8を参照して以下でさらに説明する。
図4は、本発明の一実施形態に従う、個人の語彙能力を評価するように構成された、図1のシステムの様々なコンポーネントを示すブロック図である。評価プロセスを使用して、例えば、個々の回答者がコーパスまたはそのコーパスのサブドメイン内で知っている可能性の高い語彙項目の総数と、特定の語彙項目との両方を正確に推定してレポートすることができる。
一実施形態において、ユーザインターフェース140を使用して、ユーザに「Yes/No」判定型試験を提示することにより、ユーザの能力を推定することができる。語彙判定タスクとしても知られる「Yes/No」試験は、一連の実在する語彙項目および擬似語彙項目から選択された語彙項目に関して課された質問に対して、「Yes」か「No」で回答するようユーザに要求する。このシステムは、様々な態様の信号検出理論を利用して、ユーザの、実在する項目に対する「Yes/No」の回答を擬似項目に対する「Yes/No」の回答と比較することができる。このシステムは、1つまたは複数のアルゴリズムプロセスを用いて、ユーザが正しい判定をする確率と、ユーザが行う各判定の正確度とを計算する。
一実施形態において、試験は、1つずつ項目を管理し、ユーザの回答パターンに基づいて、所望のレベルの回答の正確度が達成されるまで、表示された項目の認識度係数を変動させる。試験は、ユーザの正答または誤答に基づいてユーザのレベルに常に照準を合わせるので、能力の正確な推定に必要な質問数は、従来の試験方法より非常に少なくてすむ。
任意の測定の正確度は、推定値の標準誤差と関連付けられる。その標準誤差は、各特定の項目が、集計した試験結果に寄与する情報量によって与えられる数字である。以下に示す式(3)は、試験に基づいて推定値を求める情報関数であり、式(4)は、推定値の標準誤差との関係を示している。
Figure 0004908495
ここで、I(θ)は、項目1から項目nの試験によって与えられる情報であり、Pi’(θ)は、Pi(θ)の導関数である。
Figure 0004908495
ここで、SE(θ)は推定値の標準誤差である。
一実施形態において、このシステムには、コンピュータ適応型試験を含めることができ、このシステムは、語彙項目および擬似語彙項目のデータベースからランダムに抽出された語彙項目を試験受験者に提示することができる。最初の実在する語彙項目は、ユーザが属する統計区分の認識度の平均値を有する項目からランダムに選択される。ユーザの回答の仕方に応じて、次の実在する語彙項目は、平均からおおよそ標準偏差分だけプラスかマイナスされて、抽出することができる。続いて、1つまたは別の妥当なアルゴリズムプロセスを実施して、ユーザが少なくとも1つの実在する語彙項目を知っているものと識別され、かつユーザが少なくとも1つの実在する語彙項目を知らないものと識別されるまで、認識度スケール122(図1)を上下させて、語彙項目のランダムな選択を誘導する。擬似語彙項目は、実在する語彙項目の表現内にランダムに分散され、ユーザの個々の当て推量行動を制御する。
以下の式(5)で示すような尤度関数の導関数、ならびに上式(4)で示すような試験情報関数および標準誤差を用いて、試験受験者の最大尤推定値(the maximum likelihood estimate)を計算する。
Figure 0004908495
ここで、L(u1,u2,...,un|θ)は、回答ベクトルの尤度である。
各例において、次の語彙項目は、その能力の推定時に最大量の情報を与えるように選択される。次に、推定値の最大尤度、試験情報、および標準誤差が再計算される。このプロセスは、所望のレベルの正確度が達成されるまで反復することができ、従って、語彙項目数と試験を完了させるのに必要な時間量とが変動可能となる。
一実施形態において、各学習者の語彙知識の深さに関する様々な具体的態様を評価する高速かつ効率的な手段を提供するために、CAT124を用いて管理される語彙試験は、上式の様々な態様を利用することができる。例えば、偽りの友(false-friends)(すなわち、綴りが英単語に近いか、または英語に聞こえる母国語の単語であるが、その母国語でのその単語の使用法または意味が非常に異なるもの)と識別され得る所定の低重要度の単語について、学生を試験することもできる。語彙知識の深さ124の様々な態様に関する複数の測定を利用することにより、本明細書で説明する認識評価を、並列測定により妥当化できるだけでなく、新規かつ一意な知識の深さ評価の形式を可能とすることができる。
図5は、本発明の実施形態に従う、各語彙項目の認識確率を求めるための、語彙判定質問の詳細な例を示す表示図である。図示した例に示されるように、本明細書で開示するシステムおよび方法は、全ての種類の意味論的知識に関する評価および指導に有用であり得る。本実施形態において、このシステムは、オンラインの対話的な「Yes/No」語彙判定型の質問を用いて、個々の語彙認識試験を提供する。評価プロセスの重要な部分は、擬似語彙項目を含めることである。擬似語彙項目は妥当にみえるが、所与の言語では意味を有さない。例として、ブロック502は、日本人ユーザに対する日本語の単語を表示する語彙の「Yes/No」型の判定質問を示し、ブロック504は、日本人ユーザに対する擬似日本語の表示を示している。ブロック506は、英語内の金融サブドメインから抽出された実際の英語の連語単位、「compound interest」を示し、ブロック508は、擬似英単語「regget」を示している。ブロック510は、Java(登録商標)プログラミング言語のコード表現「return myDesk.size();」を示し、ブロック512は、Java(登録商標)プログラミング言語の擬似表現「avv;..;g3−d」を示している。ブロック514は、英語内のサブドメインからの実際の交通標識を示し、ブロック516は、同一ドメイン内の擬似交通標識を示している。
図6Aは、語彙知識の深さのスケール600を示す表示図である。語彙知識の深さのいくつかの態様が示されている。語彙知識の深さは、認識602から漸進的にスケールの右側に向かって増加するよう示されている。正確な定義604を選択できることは、単語の意味を正しく理解したことを示し、項目連語(collocation)606を正しく判断することは、深い理解を示す。さらに深いレベルの理解は、文中に単語を書くことといった生産的能力608を通じて証明される。
図6Bは、本発明の実施形態に従う、語彙知識の深さ判定型の質問の具体的な例を示す表示図である。このシステムは、複数選択判定型の質問、および「Yes/No」判定型の質問を含む手段を通じて、語彙知識の深さに関する個々の試験を提供する。このシステムは、受動的な知識から始まって、次第に、生産的な語彙項目知識にレベルが深くなるよう移動する連続体において、複数の態様の語彙知識の深さに基づいて、語彙知識の深さを定量化する。図示した知識の深さに関する質問の例は、様々な態様の知識の推定深さを評価する。このプロセスの重要な部分は、誤った選択肢の定義および擬似語彙連語を含めることである。誤った選択肢の定義は、妥当にみえるが、偽の語彙項目の定義である。擬似語彙連語は、妥当にみえるが、偽の連語である。
図6Bに示した例を用いて、3つの異なる態様の語彙知識の深さに関する知識の深さを確認することができる。例えば、ブロック610は、日本人ユーザに提示され得る英単語「wasted」に対する定義型の質問の認識を示している。ブロック612は、Java(登録商標)プログラミングのコード表現「<c:out value=“${user.firstName}”/>.」に対する定義型の質問の認識を示している。与えられた3つの定義のうち1つは正しい定義であり、他の2つの定義は、妥当にみえるが誤った選択肢である。
ブロック614およびブロック616は、連語認識型の質問を示している。より詳細には、ブロック614は、日本人ユーザに提示され得る擬似連語「fancy weather」を示し、ブロック616は、日本語での正しい連語を示している。
ブロック618およびブロック620は、2つの形式の文脈内項目生成タスク(item-production-in-context task)を示している。ブロック618は、日本人ユーザにJava(登録商標)プログラミングコードの表現における誤りを補正するよう要求する、文脈内項目生成型のタスクを示している。綴りおよび句読点の誤りを識別して補正することは、生産の形態である。ブロック620は、英単語「bargain」に対する文作成タスクを示している。ユーザには、単語「bargain」を用いて、与えられたスペースに文を書くタスクが与えられる。
図7は、約2500語を知っている個々の日本人ユーザに対する試験スコアシート700の実施形態を示している。スコアシート700の1つの特徴は、スコアシート700が絶対スコア(absolute score)を表示し、個々のユーザが知っている語彙項目数にそのスコアを関連付けることである。スコアシート700の別の特徴は、スコアリングシステムにより、他のグループおよび他の平均との直接的な比較が可能となることである。このケースでは、ユーザは、全部で2500語の英単語語彙を知っているが、そのうち1751個しか使用頻度の最も高い上位3000語に含まれない。従って、スコアシート700の1つの利点は、スコアシート700により、ユーザが自身の高頻出単語の知識ギャップに対する重要度を見ることができることである。このケースでは、例えば、1751個の単語のうち、ユーザは、コーパス内の使用頻度の最も高い上位1000語のうち801個(すなわち、80.1%)を知っていて、使用頻度の最も高い次の上位1000語のうち557個(すなわち、55.7%)を知っていて、使用頻度の最も高いさらに次の上位1000語のうち393個(すなわち、39.3%)を知っている。
開示するシステムおよび方法の1つの目的は、学習者が有意義な数の最重要語彙項目を習得することを支援することにある。前述したように、使用頻度の最も高い最初の上位3000語の英単語を知ることにより、人は一般に、辞書の支援なしに、典型的な教材を読むことができる。この具体的な例において、学習者の目標は、使用頻度の最も高い上位3000語の英単語のうち、1249個の未知の英単語を習得することであろう。最初の学習順序には、最頻出(ではあるが未知の)単語のうち199個を含めることができる。本明細書で説明するシステムおよび方法は、正確な語彙評価と、学習予測の正確なペースとを定量化可能とすることができる。さらに、システムの様々な実施形態には、様々な種類のグループ能力と、指導者およびプログラム管理者に対して編成可能な進捗レポートとが含まれる。従って、このシステムにより、個人およびグループの語彙能力を多次元的に比較して分析することができる。
正確なグラフ化により、学習者および指導者がある期間にわたって進捗を追跡するための明確なベンチマークが提供される。いくつかの実施形態では、例えば、設定期間後に、後続する試験が、進展がみられることを示すことができる。このシステムは、(学習者が新たな単語を習得しようと努力する場合、)進捗を正確に評価して表示することができる。さらに、このシステムの電子メールサービスおよび/または学習ゲームサービスを利用するユーザは、自身の進捗を3000語の目標に向けて進めることができる。
図8Aは、日本人口の年齢別統計区分におけるブリティッシュナショナルコーパス(「BNC(British National Corpus)」)英単語の使用頻度の最も高い上位6000語の各々に対する推定認識度を示す散布グラフである。グラフ内の各点は、6000個のBNC単語のうち特定の1つの単語を示している。表示した結果は、日本人口の1つの年齢別統計区分に属する549人の個人ユーザによる、「Yes/No」判定型の語彙項目質問に対する4217個の回答を統計的に分析して判定したものである。
図8Bは、6000個のBNC単語における特定の単語全てを示す散布グラフである。散布グラフ内の各点は、特定の1つの単語を示している。水平線Cは、個々のユーザCに対する認識能力評価値0.0を示している。垂直線Dは、線D上または線Dの左側に3000個の点が打たれるように引かれている。
領域1は多数の点を含み、それらの各点は、使用頻度の最も高い上位3000語のBNC単語のうち、ユーザCが認識する可能性が高い特定の単語を表している。任意の特定の点が、ユーザCの能力評価レベル値0.0の下方にいけばいくほど、ユーザCが、その点により表された単語を理解する可能性が高くなる。ユーザCの能力評価レベル値0.0に位置する点は、ユーザCが認識する確率が50%である特定の単語を表している。領域2は多数の点を含み、それらの各点は、使用頻度の最も高い上位3000語のBNC単語のうち、ユーザCが認識しない可能性が高い特定の単語を表している。任意の特定の点が、ユーザCの能力評価レベル値0.0の上方にいけばいくほど、ユーザCが、その点により表された単語を理解しない可能性が高くなる。
領域3および領域4を画定する楕円形は、コーパス内の特殊目的の言語サブドメインの例を示している。領域3は、ユーザCが確率的に認識可能である特殊目的のサブドメインの単語を表している。領域4は、ユーザCが確率的に認識不能である特殊目的のサブドメインの単語を表している。領域5に含まれる点はそれぞれ、ユーザCが認識する可能性が高い最頻出BNC単語の上位3001から6000語のうちの、特定の単語を表している。領域6に含まれる点はそれぞれ、ユーザCが認識しない可能性が高い最頻出BNC単語の上位3001から6000語のうちの、特定の単語を表している。
図8Cは、図8Bのデータを再編成して、BNCの1000語ごとの頻度帯に含まれる特定の単語に対するユーザCの認識を示している。このグラフは、例えば、ユーザCが、最頻出BNC単語の最初の上位1000個のうち、894個を認識できる可能性が高いことを示している。この結果は語彙能力評価の点で重要である。しかしながら、それよりもはるかに重要なことは、このプロセスにより、最頻出BNC単語の最初の上位1000個のうち、ユーザCがおそらく認識不能である可能性が高い106個の単語の各々が識別されることである。
図8Dは、図8Aおよび図8Bのデータを再編成して、BNC頻度データの対数正規変換と、実際に評価したBNC単語の認識度との比較を可能にするものである。散布グラフ内の線Pは、測定された項目認識度に対する単語使用頻度の回帰に基づく推定単語認識度を示している。この回帰直線は、使用頻度と項目認識度との絶対相関値(absolute correlation)0.60を示しているが、標準誤差が1.92であるので、単語使用頻度データからは、個々のユーザにとってどの語彙項目が既知である可能性があり、どの語彙項目が未知である可能性があるかを判定する統計的に妥当な方法が得られないことが分かる。図8Bおよび図8Dに示したことから、人口の統計区分の個々のメンバに対して判定された語彙項目認識度データは、各個々のユーザが各語彙項目を知っているか否かを推定することに対して統計的に妥当な基盤を与えることが確認される。
図9は、本発明の一実施形態に従う、個々の言語またはサブドメインの語彙能力評価に基づいて語彙項目を優先順位付けるように構成された、図1のシステムの様々なコンポーネントを示すブロック図である。例えば、様々なアルゴリズムプロセスは、(a)各個人の語彙認識能力124、(b)語彙知識の深さ124、および(c)保持率120を、(必要に応じて)コーパスまたはサブドメインの項目重要度データ114とともに計算して、学習者ごとの学習に関する理想的な個人別語彙学習順序116を作成することができる。
一実施形態において、各学習者の個人別言語学習順序116は、複数の、および様々な種類の学習プログラム118に配信することができる。前述したように、このシステムは、学習プログラム118から、学習者の学習プログラムとの対話に関するフィードバックを得ることができる。受信したフィードバックをシステムに通知することにより、このシステムは、各学習者の現在の能力とニーズの評価とに対して個人別言語学習順序を再編成することができる。学習プログラムからのフィードバックに基づいて、このシステムは、特定の語彙項目を学習者に提示するために、例えば、語彙項目の回収、以前に回収した語彙項目のリサイクル、新たな語彙項目の追加、または知識の深さの態様の変更を行うことができる。
このシステムには、電子メールを介して、個人別言語学習順序からの1つまたは複数の語彙項目を個々の学習者に配信する、個別電子メールサービスを含めることもできる。個別電子メールサービスは、様々な指導方針を利用して、購読者が重要かつ新たな語彙項目の知識を学習して保持することを支援することができる。個別電子メールサービスは、様々な手段を提供し、購読者との対話の確認を要求することにより、システムのデータベースに対する適切な更新を可能にする。
個別電子メールサービスの別の態様は、関心のあるトピックに関する能力相応なリーディング教材、リスニング教材、およびビデオ教材を含む様々な教材と、他の形態の能力相応な文脈言語教材とを購読者に対して作成して配信することにより、購読者が文脈において語彙項目を正確に使用する知識を学習して保持することを個別電子メールサービスが支援することである。上記の能力相応な教材は、様々な手段を提供し、購読者との対話の確認を要求することにより、システムのデータベースに対する適切な更新を可能にする。
このシステムは個人別の対話的言語学習ゲームも生成する。この個人別の対話的言語学習ゲームは、語彙項目群を配信し、購読者の個人別言語学習順序に従って語彙項目を提示する。個人別の対話的言語学習ゲームは、他の形態の能力相応な学習教材を配信して提示することもできる。個人別の対話的言語学習ゲームは、パーソナルコンピュータ、携帯電話、移動通信デバイス、および/または他の適切な電子デバイスを用いて、購読者に配信することができる。
個人別の対話的言語学習ゲームは、様々な指導方針およびグラフィカル形式を利用して、購読者が多数の語彙項目および他の能力相応な学習教材の知識をより迅速に学習して保持することを支援することができる。また、個人別の対話的言語学習ゲームは、購読者の対話を承認して記録する自動的な手段を提供し、それにより、このシステムのデータベースおよび学習者の個人別言語学習順序に対する適切な更新を可能にする。
図10は、本発明の一実施形態に従う、個人の語彙能力評価に基づいて能力相応なテキスト教材を準備して配信するように構成された、図1のシステムの様々なコンポーネントを示すブロック図である。文書、聴覚またはビデオを含む任意のテキスト教材を編集して再確認するプロセスは、各個人の語彙能力評価に基づくものとすることができる。学習者の関心およびニーズに基づいて、トピカルな(topical)テキスト教材データベース1010から適切なテキスト教材を抽出することができる。学習者が知らない可能性の高い語彙項目は、テキスト教材プログラムまたはモジュール1020により識別される。知らない可能性の高い項目については、除去するか、または認識された単語のデータベース122から取得された既知の単語に置き換えることにより、プログラム1020が生成した結果として生じる変更されたテキスト教材1030を、理解度の観点から調整して、既知の語彙項目を任意の所望の割合だけ含める。従って、本方法により、任意の所与の学習者に対して、指導上適切なリーディング教材、リスニング教材およびビデオ教材を、(例えば、ユーザインターフェース140を介して、)任意の所与の言語またはサブドメインにて作成し表示することができる。
図11Aは、本発明の一実施形態に従う、特定の個人の語彙能力評価に従ってフィルタリングされた英語テキストの例を示す表示図である。より詳細には、図11Aは、個人の語彙能力評価値1.32に基づいてフィルタリングされたリーディング教材の例を示している。本例では、95パーセントの認識理解度という目標が設定されている。この2つの設定に基づいて、ユーザが認識不能である可能性が高い単語の全てが識別される。このことを示すために、それらの単語を太字の斜字体で示している。
図11Bは、さらなる処理後の図11Aのテキスト1110を示す表示図である。より詳細には、テキスト内に残存する単語の少なくとも95パーセントを読者が認識できる可能性が高く、かつテキスト内に残存する単語の少なくとも5パーセント未満を読者が認識できない可能性が高いように、図11Bに示したリーディング教材のサンプル1110をさらに編集して再確認する。可能な限り、このプロセスは、ユーザの個人別言語学習順序に従って認識不能な単語を含めることを優先する。この説明を理解してもらうために、様々な編集マークを、図面内に表示したままにしておく。
図11Cは、能力相応なフィルタリングおよび編集が完了した後の図11Aおよび図11Bのテキスト1100を示す表示図である。結果として生じるテキストは、学習者の語彙能力評価に基づいて、学習者に対して95パーセント以上の理解度で編成されている、指導上能力相応かつトピカルなリーディング教材である。説明の目的上、学習者の認識不能な単語(5パーセント未満)を、太字の斜字体で表示している。
(C.適切なコンピューティングシステム)
図12〜図13Bおよび以下の記述は、本発明の諸側面を実施するのに適したコンピューティング環境の簡潔で一般的な説明を提供するが、本発明の諸側面は、コンピューティングシステムのみに実装される必要はない。従って、必須ではないが、本発明の諸側面および諸実施形態は、例えば、サーバまたはパーソナルコンピュータといった汎用コンピュータが実行するルーチンなどのコンピュータ実行可能命令の一般的コンテキストにおいて実装することができる。当業者であれば、本発明を、インターネット機器、ハンドヘルドデバイス、ウェアラブルコンピュータ、移動電話または携帯電話、マルチプロセッサシステム、マイクロプロセッサベースのまたはプログラム可能な家庭用電化製品、セットトップボックス、ネットワークPC、ミニコンピュータ、メインフレームコンピュータ等を含む他のコンピュータシステム構成を用いて実施できることが理解されよう。本発明は、以下で詳細に説明する1つまたは複数のコンピュータ実行可能命令を実施するよう特別にプログラム、構成または構築された特殊目的コンピュータまたはデータプロセッサにおいて具現化することができる。実際、本明細書で一般に使用する用語「コンピュータ」は、任意の上記デバイスおよび任意のデータプロセッサを指す。
本発明は、タスクまたはモジュールがリモート処理デバイスにより実行される分散コンピューティング環境において実施することもできる。リモート処理デバイスは、ローカルエリアネットワーク(「LAN」)、ワイドエリアネットワーク(「WAN」)、またはインターネットなどの通信ネットワークを介して分散コンピューティング環境に接続される。分散コンピューティング環境では、プログラムモジュールまたはサブルーチンは、ローカルメモリ記憶デバイスおよびリモートメモリ記憶デバイスの両方に配置することができる。以下で説明する本発明の諸側面は、磁気的または光学的に読み取り可能で、かつ取り外し可能なコンピュータディスクを含むコンピュータ読み取り可能な媒体に格納または分散させてもよいし、チップ(例えば、EEPROMチップ)内のファームウェアとして格納させてもよいし、またインターネットまたは(無線ネットワークを含む)他のネットワークを介して電子的に分散させてもよい。当業者であれば、本発明の一部をサーバコンピュータ上に配置させ、それ以外の部分をクライアントコンピュータ上に配置させてもよいことが理解されよう。本発明の諸側面に固有のデータのデータ構造および伝送も、本発明の範囲内に含まれる。
図12を参照すると、本発明の一実施形態では、パーソナルコンピュータまたはワークステーションなどのコンピュータ1200が利用される。コンピュータ1200は、1つまたは複数のユーザ入力デバイス1202およびデータ記憶デバイス1204に接続された1つまたは複数のプロセッサ1201を有する。コンピュータ1200は、表示デバイス1206および1つまたは複数の任意の追加的な出力デバイス1208(例えば、プリンタ、プロッタ、スピーカ、触覚出力デバイスまたは嗅覚出力デバイス等)のような少なくとも1つの出力デバイスにも接続される。例えば、光ネットワーク接続1210、無線トランシーバ1212、またはその両方を介して、コンピュータ1200を外部コンピュータに接続することができる。
入力デバイス1202には、キーボードおよび/またはマウスのようなポインティングデバイスを含めることができる。他の入力デバイスとして可能なものには、例えば、マイクロフォン、ジョイスティック、ペン、ゲームパッド、スキャナ、デジタルカメラ、ビデオカメラ等がある。データ記憶デバイス1204には、コンピュータ100がアクセス可能なデータを記憶できる任意の種類のコンピュータ読み取り可能な媒体を含めることができる。そのコンピュータ読み取り可能な媒体には、例えば、磁気ハードディスクドライブおよびフロッピー(登録商標)ディスクドライブ、光ディスクドライブ、磁気カセット、テープドライブ、フラッシュメモリカード、DVD、ベルヌーイカートリッジ、RAM、ROM、スマートカード等がある。実際、コンピュータ読み取り可能命令およびデータを格納または伝送するための任意の媒体を利用することができる。この媒体には、例えば、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、またはインターネット(図12には示さず)などのネットワークに対する接続ポートまたはそれらネットワーク上のノードが含まれる。
本発明の諸側面は、様々な他のコンピューティング環境において実施することもできる。例えば、図13Aを参照すると、ウェブインターフェースを有する分散コンピューティング環境では、システム1300内に1つまたは複数のユーザコンピュータ1302が含まれ、各ユーザコンピュータは、ブラウザプログラムモジュール1304を含む。ブラウザプログラムモジュール1304により、コンピュータは、インターネットのワールドワイドウェブ部分におけるウェブサイトを含むデータにアクセスし、インターネット1306とデータ交換することができる。ユーザコンピュータは、図12に関して、上述したコンピュータと実質的に同様のものとすることができる。ユーザコンピュータには、オペレーティングシステム、1つまたは複数のアプリケーションプログラム(例えば、ワープロアプリケーションまたはスプレッドシートアプリケーション)等の他のプログラムモジュールを含めることができる。このコンピュータは、様々な種類のアプリケーションを実行するようプログラム可能な汎用デバイスであってもよいし、1つの特定の機能または特定のクラスの機能群に最適化または限定された単一目的のデバイスであってもよい。ウェブブラウザを用いて例示したが、以下で詳述するように、ユーザにグラフィカルユーザインターフェースを提供する任意のアプリケーションプログラムを利用してもよく、ウェブブラウザおよびウェブインターフェースは、本明細書では、より知られている例として使用したに過ぎないことがより重要である。
インターネットまたはワールドワイドウェブ(「Web」)1306に接続された少なくとも1つのサーバコンピュータ1308は、ウェブページ、オーディオ信号、および電子イメージなどの電子メッセージの受信、ルーティング、および格納に関する機能の大部分または全てを実行する。インターネットを用いて例示したが、一部のアプリケーションでは、イントラネットのようなプライベートネットワークが実際には望ましい場合もある。ネットワークは、コンピュータが他のクライアントコンピュータに専らサービスを提供するクライアント−サーバアーキテクチャを有してもよいし、あるいは1つまたは複数のコンピュータがサーバおよびクライアントとして同時にサービスを提供するピアツーピアのような他のアーキテクチャを有してもよい。(1つまたは複数の)サーバコンピュータに接続された(1つまたは複数の)データベース1310は、ユーザコンピュータ間で交換されたウェブページおよびコンテンツの大部分を格納する。(1つまたは複数の)データベースを含む(1つまたは複数の)サーバコンピュータは、セキュリティ手段(例えば、ファイアウォールシステム、セキュアソケットレイヤ(SSL)、パスワード保護スキーム、暗号化等)を利用して、システムに対する悪意のある攻撃を防止し、内部に格納されたメッセージおよびデータの完全性を保持することができる。
サーバコンピュータ1308には、サーバエンジン1312、ウェブページ管理コンポーネント1314、コンテンツ管理コンポーネント1316、およびデータベース管理コンポーネント1318を含めることができる。サーバエンジンは、基本処理およびオペレーティングシステムレベルのタスクを実行する。ウェブページ管理コンポーネントは、ウェブページの作成および表示やルーティングを処理する。ユーザは、サーバコンピュータに関連付けられたURLにより、そのサーバコンピュータにアクセスすることができる。コンテンツ管理コンポーネントは、本明細書で説明した実施形態における機能の大部分を処理する。データベース管理コンポーネントは、データベースに関する格納および検索タスクと、データベースに対するクエリと、ビデオ、グラフィックおよびオーディオ信号などのデータの格納とを含む。
図13Bを参照すると、システム1300に対する代替実施形態が、システム1350として示されている。システム1350は、システム1300と実質的に同様であるが、(サーバコンピュータ1、2、...、Jとして示される)複数のサーバコンピュータを含む。負荷分散システム1352は、いくつかのサーバコンピュータに負荷を分散する。負荷分散は、当技術分野では周知の技術であり、複数のコンピュータ間で処理の負荷を分散し、それにより命令の処理およびデータのルーティングがより効率的に行われる。このような負荷分散は、特にトラフィックのピーク時にメッセージトラフィックを分散させることができる。
分散ファイルシステム1354は、ウェブサーバを、(データベース1、2、...、Kで示される)いくつかのデータベースに接続する。分散ファイルシステムとは、ある種のファイルシステムであり、そのシステムにおいては、ファイルシステム自身が、LANなどのネットワークにまたがるリモートファイルまたはデータベース、および分散ファイルからの情報(例えば、コンテンツページ)を管理して、透過的に配置する。分散ファイルシステムは、データベースに対する読み書き機能も管理する。
(結論)
文脈において明確に必要としない限り、本記載および特許請求の範囲全体にわたって、単語「〜を備える(comprise, comprising)」等は、排他的または網羅的な意味ではなく、包含的な意味、すなわち、「〜を含むが、〜に限定されるものではない」という意味として解釈されるべきである。本明細書では、用語「〜に接続された」、「〜に結合された」、またはそれらの任意の変形は、複数の要素間の直接的または間接的な任意の接続または結合を意味する。要素間の接続または結合は、物理的なもの、論理的なもの、またはそれらの組合せとすることができる。さらに、用語「本明細書で」、「上述の」、「以下で」、および同様な趣旨の単語は、本出願で用いられたとき、全体としての本明細書を指し、本明細書の特定の部分を指すものではない。また、文脈が許すところでは、上述の[発明を実施するための最良の形態]において、単数形または複数形を用いた単語には、それぞれ複数形または単数形を含めることもできる。複数項目のリストを示す単語「または」は、その単語を、次のように解釈したもの全てを含む。すなわち、リストにおける任意の項目、リストにおける全ての項目、およびリストにおける項目の任意の組合せを含むものである。
上述した本発明の実施形態の詳細な説明は、網羅的であることを意図しておらず、上記にて本発明を開示した形式そのものに限定するようにも意図していない。本発明の特定の実施形態および本発明の例を例示の目的で上述したが、本発明の範囲内において、様々な均等な変形が可能であり、当業者であれば、そのことが理解されるであろう。例えば、プロセスまたはブロックを所与の順序で提示したが、代替の実施形態では、異なる順序のステップを有するルーチンを実行してもよいし、異なる順序のブロックを有するシステムを利用してもよい。また、一部のプロセスまたはブロックを、削除、移動、追加、再分割、結合、および/または修正して、代替手段またはサブコンビネーションを提供することができる。これらプロセスまたはブロックの各々を様々な方法で実装することができる。また、プロセスまたはブロックは、時には順番に実行されるものとして示したが、これらプロセスまたはブロックを、並列に、または別の時点で実行してもよい。
本明細書で提供した本発明の教示は、他のシステムに適用することができ、必ずしも上述したシステムである必要はない。上述した様々な実施形態の要素および動作を組み合わせて、さらなる実施形態を提供することができる。
上述した任意の特許、出願、および他の参照は、添付の出願書類に列挙した任意のものを含めて、参照することにより本明細書に組み込まれるものである。本発明の実施形態を必要ならば修正して、上述した様々な参照におけるシステム、機能、および概念を利用し、本発明のさらに別の実施形態を提供することができる。
これらおよび他の変更を、上述した[発明を実施するための最良の形態]に照らして、本発明に加えることができる。上述した記載は、本発明の特定の実施形態を記述し、考えられる最良の形態を説明しているが、上述した記載がどんなに詳細に見えても、本発明を多数の方法で実施することができる。本明細書で開示した本発明に包含させつつ、データ収集および処理システムの詳細を、その実装の詳細において大幅に変化させることができる。上述したように、本発明の特定の特徴または態様を説明したときに用いた特別な用語は、関連する本発明の任意の詳細な特性、特徴、または態様に限定されるように、その用語の意味が本明細書において再定義されることを示唆するものとして理解すべきではない。一般に、上述した[発明を実施するための最良の形態]部分において、その用語が明確に定義されない限り、特許請求の範囲で用いる用語は、本明細書で開示した特定の実施形態に本発明を限定するものとして解釈するべきではない。従って、本発明の実際の範囲は、開示した実施形態だけでなく、請求項の下で本発明を実施または実装する全ての均等な方法も含む。
本発明の特定の側面を一定の請求項の形式で提示するが、発明者は、任意の数の請求項の形式で本発明の様々な側面を考慮に入れている。例えば、本発明のいくつかの側面は、コンピュータ読み取り可能な媒体を用いて具現化することができる。従って、発明者は、本出願をファイルした後に追加の請求項を加えて、本発明の他の側面に関する追加の請求項の形式を要求する権利を有する。
本発明の一実施形態に従う、能力相応な言語教材を試験、編集、評価、および配信するための言語評価および指導システムを示すブロック図である。 本発明の一実施形態に従う、累積した個々の試験解答および回答者のデータを用いて、統計区分ごとの標準認識度数分布曲線を処理するように構成された、図1のシステムの様々なコンポーネントを示すブロック図である。 ブリティッシュナショナルコーパス(「BNC」)英単語の使用頻度の最も高い上位6000語の認識度に関する累積度数分布曲線を示すグラフである。 本発明の一実施形態に従う、個人の語彙能力を評価するように構成された、図1のシステムの様々なコンポーネントを示すブロック図である。 本発明の一実施形態に従う、各語彙項目の認識確率を求めるための、「Yes/No」型の語彙判定質問の詳細な例を示す表示図である。 本発明の一実施形態に従う、語彙項目の知識の深さの具体的態様を有する知識スケールにおける語彙項目の深さを示す表示図である。 本発明の一実施形態に従う、語彙知識の深さ判定型の質問の具体的な例を示す表示図である。 本発明の一実施形態に従う、個々の回答者のスコアシートレポートのグラフおよび説明の例を示す表示図である。 BNC英単語の使用頻度の最も高い上位6000語の各々に対する推定認識度を示す散布グラフである。 使用頻度および単語認識度に関連付けられた、仮説的な学生の推定語彙量を示す散布グラフである。 図8Bに示した単語認識確率データを示すバーチャートである。 BNCの使用頻度データと、実際に評価したBNC単語認識との間の相関を示す散布グラフである。 本発明の一実施形態に従う、個人の語彙能力評価に基づいて語彙項目を優先順位付けるように構成された、図1のシステムの様々なコンポーネントを示すブロック図である。 本発明の一実施形態に従う、個人の語彙能力評価に基づいて能力相応なテキスト教材を準備して配信するように構成された、図1のシステムの様々なコンポーネントを示すブロック図である。 本発明の一実施形態に従う、特定の個人の語彙能力評価に従ってフィルタリングされた英語テキストの例を示す表示図である。 本発明の一実施形態に従う、さらなる処理後の図11Aのテキストを示す表示図である。 本発明の一実施形態に従う、能力相応なフィルタリングおよび編集が完了した後の図11Aおよび図11Bのテキストを示す表示図である 本発明の諸側面を利用することができる、基本的かつ適切なコンピュータおよびデータベースシステムを示すブロック図である。 ネットワークコンピュータ環境において本発明の諸側面を動作させることができる、単純ではあるが適切なシステムを示すブロック図である。 図13Aのシステムの代替システムを示すブロック図である。

Claims (16)

  1. 言語訓練システムであって、
    複数の語彙項目を格納する1つまたは複数のデータベースのセットおよびデータベースのサブセットと、
    前記1つまたは複数のデータベースのセットおよびデータベースのサブセットからの複数の語彙項目を格納する項目重要度データベースであって、項目重要度データベース内の前記複数の語彙項目は、選択されたセットと対応するサブセットとのうちの少なくとも一方において、出現頻度の順序でランク付けられる、項目重要度データベースと、
    (a)前記1つまたは複数のデータベースのセットおよびデータベースのサブセットから一連の語彙項目をユーザに回答させるために提示し、かつ(b)前記提示した語彙項目に関するユーザの回答を受信して処理する、ように構成されたユーザ試験コンポーネントと、
    前記ユーザ試験コンポーネントにおいてユーザに提示された各語彙項目に対して、語彙項目の認識度に関する測定、語彙項目の知識の深さに関する測定、および語彙項目の保持に関する測定を、1つまたは複数の統計区分または人口内のユーザと比較して判定するように構成されたキャリブレーションコンポーネントと、
    前記キャリブレーションコンポーネントの結果を格納する項目認識度データベースであって、前記項目認識度データベースからのデータにより、1つまたは複数の統計区分または人口に関して語彙項目の認識度によってソートされた度数分布曲線を構築可能な項目認識度データベースと、
    前記項目認識度データベースに基づいて未知である可能性の高い語彙項目に関する評価を行うとともに、前記項目重要度データベースから各語彙項目の重要度を取得することによって、各ユーザに対して、重要であるが未知である可能性の高い語彙項目から構成される目標リストを生成するように構成された学習順序編集部と
    を備えたことを特徴とする言語訓練システム。
  2. 前記学習順序編集部は、
    特定のセットまたは該セットのサブセット内の語彙項目重要度データと、
    前記ユーザの語彙認識能力レベルと、
    前記ユーザの語彙知識能力の深さと、
    前記ユーザの語彙保持能力と
    のうちの少なくとも一部に基づいて、特定のユーザに対する前記目標リストを生成することを特徴とする請求項1に記載の言語訓練システム。
  3. 前記ユーザ試験コンポーネントは、各語彙項目に関する「Yes/No」判定型の質問および複数選択判定型の質問を前記ユーザに提示するように構成されたコンピュータ適応型試験システムを含むことを特徴とする請求項1に記載の言語訓練システム。
  4. 前記項目重要度データベース内の前記複数の語彙項目は、1つまたは複数の統計区分または人口内の認識度の順序でさらにランク付けされることを特徴とする請求項1に記載の言語訓練システム。
  5. 1つまたは複数の語彙項目を各ユーザに回答させるために提示するように構成された1つまたは複数の学習プログラムまたはアクティビティをさらに備え、
    前記1つまたは複数の語彙項目は、少なくとも部分的に、前記ユーザの前記生成した目標リストに基づいて選択されることを特徴とする請求項1に記載の言語訓練システム。
  6. 前記ユーザと前記1つまたは複数の学習プログラムまたはアクティビティとの間の対話に基づいて入力を処理し、かつ前記入力を前記学習順序編集部に配信する
    ように構成されたフィードバックコンポーネントをさらに備え、
    前記学習順序編集部は、少なくとも部分的に、前記フィードバックコンポーネントからの前記入力に基づいて、前記ユーザに対して、最新の目標リストを生成するように構成されることを特徴とする請求項に記載の言語訓練システム。
  7. 前記1つまたは複数の学習プログラムは、パーソナルコンピュータ、移動通信デバイス、または他の電子デバイスを用いて利用可能な学習プログラムを含むことを特徴とする請求項に記載の言語訓練システム。
  8. 1つまたは複数の予め定められた間隔で電子的メッセージを用いて、前記目標リストまたは該目標リストの一部を、対応するユーザに配信するように構成された通信コンポーネント
    をさらに備えたことを特徴とする請求項1に記載の言語訓練システム。
  9. 1つまたは複数のプロセッサと前記1つまたは複数のプロセッサによって実行される1つまたは複数のプログラムを格納するメモリとを備えるシステムにおいて、前記1つまたは複数のプロセッサにより言語評価および指導に関してコンピュータで実装される方法であって、
    (a)複数の語彙項目を格納する1つまたは複数のデータベースのセットおよびデータベースのサブセットから一連の語彙項目をユーザに回答させるために提示し、かつ(b)前記提示した語彙項目に関するユーザの回答を受信して処理する、ように構成されたユーザを試験するステップと、
    前記ユーザ試験するステップにおいてユーザに提示された各語彙項目に対して、語彙項目の認識度に関する測定、語彙項目の知識の深さに関する測定、および語彙項目の保持に関する測定を、1つまたは複数の統計区分または人口内のユーザと比較して判定するように構成されたキャリブレーションステップと、
    前記キャリブレーションステップにおいて判定された結果を項目認識度データベースに格納するステップであって、前記項目認識度データベースからのデータにより、1つまたは複数の統計区分または人口に関して語彙項目の認識度によってソートされた度数分布曲線を構築可能な格納ステップと、
    前記項目認識度データベースに基づいて未知である可能性の高い語彙項目に関する評価を行うとともに、前記1つまたは複数のデータベースのセットおよびデータベースのサブセットからの複数の語彙項目を格納する項目重要度データベースであって、項目重要度データベース内の前記複数の語彙項目は選択されたセットと対応するサブセットとのうちの少なくとも一方において出現頻度の順序でランク付けられる項目重要度データベースから各語彙項目の重要度を取得することによって、各ユーザに対して、重要であるが未知である可能性の高い語彙項目から構成される目標リストを生成するステップと、
    少なくとも部分的に前記目標リストに基づいて、前記ユーザに対して、個人別言語学習順序を生成するステップと
    を備えることを特徴とするコンピュータで実装される方法。
  10. 前記ユーザを試験するステップは、
    一連の実在する語彙項目と擬似語彙項目とを前記ユーザに識別させるために提示するステップであって、前記擬似語彙項目は、当て推量による誤差を補正するのに用いられる偽の語彙項目を含む、提示するステップと、
    記ユーザが知っているものとして識別された語彙項目、および前記ユーザが知らないものとして識別された語彙項目を判定するために、前記ユーザからの回答を処理するステップと
    を含むことを特徴とする請求項9に記載の方法。
  11. 前記ユーザを試験するステップは、
    1の語彙項目を前記ユーザに識別させるために提示するステップであって、前記第1の語彙項目は、前記ユーザの統計区分に対する予め定められたレベルの認識度を有する語彙項目のグループから選択される、提示するステップと、
    記ユーザの回答に基づいて、第2の語彙項目を前記ユーザに識別させるために提示するステップであって、前記第2の語彙項目は、前記予め定められたレベルより設定レベル分だけ上方または下方にある認識度を有する、提示するステップと、
    続する語彙項目を前記ユーザに識別させるために提示するステップであって、前記後続する語彙項目は、前記ユーザの推定能力と比較して、高いまたは低い認識度を有する1つまたは複数の追加的な語彙項目の選択を統計的に決定することにより選択され、擬似語彙項目は、個々のユーザの当て推量行動を制御するために、実在する語彙項目の表現内にランダムに分散される、提示するステップと、
    前記識別において、前記ユーザが少なくとも1つの実在する語彙項目を知っているものとして識別し、かつ少なくとも1つの実在する語彙項目を知らないものとして識別するまで、前記後続する語彙項目を提示するステップを繰り返すステップと
    を含むことを特徴とする請求項9に記載の方法。
  12. 前記語彙項目は、記号、連記号単位、音声、発話、単語、連語単位、または言語もしくは言語のサブドメイン内で特定の意味を有する慣用表現を含むことを特徴とする請求項9に記載の方法。
  13. 少なくとも部分的に、前記目標リストを生成するステップにおいて評価された未知である可能性の高い語彙項目に基づいて、前記ユーザに対してテキスト教材を編集し生成するステップをさらに備え、
    前記テキスト教材には、リーディング教材、リスニング教材、およびビデオ教材を含めることができることを特徴とする請求項9に記載の方法。
  14. 記テキスト教材は、前記ユーザが既知である可能性の高い語彙項目を予め定めておいた所望の割合だけ含むことを特徴とする請求項13に記載の方法。
  15. 1つまたは複数の予め定められた間隔で送られた電子的メッセージを用いて、前記目標リストの少なくとも一部を前記ユーザに配信するステップ
    をさらに備えることを特徴とする請求項9に記載の方法。
  16. 前記生成するステップで特定された語彙項目の目標リストに基づいて、1つまたは複数のレポートを生成するステップをさらに備え、前記1つまたは複数のレポートは、
    前記ユーザが知っている語彙項目のグラフィカル表現およびテキスト表現と、
    コーパスの辞書または前記辞書のサブドメイン内で前記ユーザが知っている語彙項目および前記ユーザが知らない語彙項目の数と、
    各未知の語彙項目の識別と、
    コーパスまたは前記コーパスのサブドメインの様々な重要度帯または頻度帯における既知の語彙項目および未知の語彙項目の数と、
    ある辞書内の語彙項目に対する前記ユーザの知識能力の深さと、
    ある辞書内の新たに学習した語彙項目に対する前記ユーザの保持能力と、
    1つまたは複数の学習プログラムとの対話に基づく前記ユーザの学習速度と、
    特定のユーザ属性またはグループ属性と、1つまたは複数の所望のグループ、統計区分、または人口の均等な属性との間の比較と
    のうちの少なくとも1つを含むことを特徴とする請求項9に記載の方法。
JP2008504874A 2005-04-05 2006-04-05 意味論的知識の評価と指導と習得とに関するシステムおよび方法 Active JP4908495B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US66876405P 2005-04-05 2005-04-05
US60/668,764 2005-04-05
PCT/IB2006/002673 WO2007007201A2 (en) 2005-04-05 2006-04-05 Systems and methods for semantic knowledge assessment, instruction, and acquisition

Publications (3)

Publication Number Publication Date
JP2008547038A JP2008547038A (ja) 2008-12-25
JP2008547038A5 JP2008547038A5 (ja) 2011-12-22
JP4908495B2 true JP4908495B2 (ja) 2012-04-04

Family

ID=37254622

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008504874A Active JP4908495B2 (ja) 2005-04-05 2006-04-05 意味論的知識の評価と指導と習得とに関するシステムおよび方法

Country Status (7)

Country Link
US (1) US20110076653A1 (ja)
EP (1) EP1872353A2 (ja)
JP (1) JP4908495B2 (ja)
KR (1) KR100919912B1 (ja)
CN (1) CN101203895A (ja)
TW (1) TW200709120A (ja)
WO (2) WO2007007201A2 (ja)

Families Citing this family (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8439684B2 (en) * 2005-08-31 2013-05-14 School Specialty, Inc. Method of teaching reading
EP1802155A1 (en) 2005-12-21 2007-06-27 Cronto Limited System and method for dynamic multifactor authentication
US8396331B2 (en) * 2007-02-26 2013-03-12 Microsoft Corporation Generating a multi-use vocabulary based on image data
JP5029090B2 (ja) * 2007-03-26 2012-09-19 Kddi株式会社 能力推定システムおよび方法ならびにプログラムおよび記録媒体
US8725059B2 (en) 2007-05-16 2014-05-13 Xerox Corporation System and method for recommending educational resources
US8699939B2 (en) 2008-12-19 2014-04-15 Xerox Corporation System and method for recommending educational resources
US8457544B2 (en) 2008-12-19 2013-06-04 Xerox Corporation System and method for recommending educational resources
CA2640779A1 (en) * 2007-10-02 2009-04-02 Neurolanguage Corporation Computer-based language training work plan creation with specialized english materials
GB2465585A (en) * 2008-11-21 2010-05-26 Sharp Kk Method and system for vocabulary learning by study word selection
US20100143873A1 (en) * 2008-12-05 2010-06-10 Gregory Keim Apparatus and method for task based language instruction
WO2010065984A1 (en) * 2008-12-10 2010-06-17 Ahs Holdings Pty Ltd Development monitoring method and system
US8517739B2 (en) * 2009-11-10 2013-08-27 Johannes Alexander Dekkers Method to teach a dyslexic student how to read, using individual word exercises based on custom text
US8768241B2 (en) 2009-12-17 2014-07-01 Xerox Corporation System and method for representing digital assessments
KR101095069B1 (ko) * 2010-02-03 2011-12-20 고려대학교 산학협력단 사용자 관심 주제를 추출하는 휴대용 통신 단말기 및 그 방법
KR101148164B1 (ko) * 2010-05-18 2012-05-23 경희대학교 산학협력단 사용자 사용 단어에 기반한 사용자의 주관적 웰빙 상태 판단 방법
US8521077B2 (en) 2010-07-21 2013-08-27 Xerox Corporation System and method for detecting unauthorized collaboration on educational assessments
DE102010046439A1 (de) * 2010-09-24 2012-03-29 Belingoo Media Group S. A. System und Verfahren für relevanzbasiertes Kategorisieren und zeitnahes Lernen von Vokabeln
US20120208166A1 (en) * 2011-02-16 2012-08-16 Steve Ernst System and Method for Adaptive Knowledge Assessment And Learning
KR101178310B1 (ko) * 2011-02-24 2012-08-29 포항공과대학교 산학협력단 대화 관리 방법 및 이를 실행하는 시스템
US20130212095A1 (en) * 2012-01-16 2013-08-15 Haim BARAD System and method for mark-up language document rank analysis
US8768876B2 (en) 2012-02-24 2014-07-01 Placed, Inc. Inference pipeline system and method
US11734712B2 (en) 2012-02-24 2023-08-22 Foursquare Labs, Inc. Attributing in-store visits to media consumption based on data collected from user devices
US8972357B2 (en) 2012-02-24 2015-03-03 Placed, Inc. System and method for data collection to validate location data
CN103680261B (zh) * 2012-08-31 2017-03-08 英业达科技有限公司 词汇学习系统及其方法
KR101616909B1 (ko) * 2012-10-31 2016-04-29 에스케이텔레콤 주식회사 자동 채점 장치 및 방법
CN104282193B (zh) * 2013-07-11 2017-03-01 尤菊芳 客制化语言学习辅助卡的方法及选字方法
US9443326B2 (en) * 2013-12-10 2016-09-13 Microsoft Technology Licensing, Llc Semantic place labels
WO2015112250A1 (en) * 2014-01-22 2015-07-30 Speak Agent, Inc. Visual-kinesthetic language construction
US11222044B2 (en) 2014-05-16 2022-01-11 Microsoft Technology Licensing, Llc Natural language image search
KR101631374B1 (ko) * 2014-08-27 2016-06-16 김현옥 메타인지 능력 향상을 위한 수학학습 시스템 및 방법
US10423983B2 (en) 2014-09-16 2019-09-24 Snap Inc. Determining targeting information based on a predictive targeting model
US20160293045A1 (en) * 2015-03-31 2016-10-06 Fujitsu Limited Vocabulary learning support system
KR102487672B1 (ko) * 2015-06-05 2023-01-13 주식회사 한국리서치 분석 대상에 대한 고객의 니즈를 분석하는 방법 및 장치
US20170178530A1 (en) * 2015-07-27 2017-06-22 Boomwriter Media, Inc. Methods and systems for generating new vocabulary specific assignments using a continuously updated remote vocabulary database
US10817898B2 (en) 2015-08-13 2020-10-27 Placed, Llc Determining exposures to content presented by physical objects
US20170124892A1 (en) * 2015-11-01 2017-05-04 Yousef Daneshvar Dr. daneshvar's language learning program and methods
CN105354188A (zh) * 2015-11-18 2016-02-24 成都优译信息技术有限公司 用于翻译教学系统的批量评分方法
US9975241B2 (en) * 2015-12-03 2018-05-22 Intel Corporation Machine object determination based on human interaction
CN108780445B (zh) * 2016-03-16 2022-10-04 微软技术许可有限责任公司 用于对小数据的机器理解的并行分层模型
US10650621B1 (en) 2016-09-13 2020-05-12 Iocurrents, Inc. Interfacing with a vehicular controller area network
WO2018066083A1 (ja) 2016-10-04 2018-04-12 富士通株式会社 学習プログラム、情報処理装置および学習方法
CN106548787B (zh) * 2016-11-01 2019-07-09 云知声(上海)智能科技有限公司 优化生词的评测方法及评测系统
US10319255B2 (en) * 2016-11-08 2019-06-11 Pearson Education, Inc. Measuring language learning using standardized score scales and adaptive assessment engines
WO2019114427A1 (zh) * 2017-12-15 2019-06-20 蔚来汽车有限公司 车辆功能播报的方法、装置及车载智能控制器
KR101996249B1 (ko) * 2018-04-23 2019-07-04 (주)뤼이드 개인 맞춤형 교육 컨텐츠를 제공하기 위한 기계학습 프레임워크 운용 방법, 장치 및 컴퓨터 프로그램
KR102157937B1 (ko) * 2018-06-18 2020-09-18 최상덕 언어 학습을 지원하기 위한 방법, 시스템 및 비일시성의 컴퓨터 판독 가능한 기록 매체
CN108847076A (zh) * 2018-07-11 2018-11-20 北京美高森教育科技有限公司 语言学习机的测评方法
CN109033088B (zh) * 2018-09-04 2023-05-30 北京先声智能科技有限公司 一种基于神经网络的第二语言习得模型
US20210256861A1 (en) * 2020-02-14 2021-08-19 ARH Technologies, LLC Electronic infrastructure for digital content delivery and/or online assessment management
CN111680157A (zh) * 2020-06-05 2020-09-18 北京市商汤科技开发有限公司 数据处理方法、装置、设备及计算机存储介质
CN111700611B (zh) * 2020-06-16 2022-11-29 中国科学院深圳先进技术研究院 顿悟能力评估方法及相关设备
WO2021260762A1 (ja) * 2020-06-22 2021-12-30 日本電信電話株式会社 語彙数推定装置、語彙数推定方法、およびプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000284680A (ja) * 1999-03-31 2000-10-13 Seiko Instruments Inc 語彙学習機能付き電子辞書
JP2003186388A (ja) * 2001-11-14 2003-07-04 Fuji Xerox Co Ltd ダイナミック個別読解指導方法、ダイナミック個別読解指導システム、及び制御プログラム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3820421B2 (ja) * 1995-10-03 2006-09-13 圭介 高森 学習装置
US5954516A (en) * 1997-03-14 1999-09-21 Relational Technologies, Llc Method of using question writing to test mastery of a body of knowledge
US6482011B1 (en) * 1998-04-15 2002-11-19 Lg Electronics Inc. System and method for improved learning of foreign languages using indexed database
US20020119433A1 (en) * 2000-12-15 2002-08-29 Callender Thomas J. Process and system for creating and administering interview or test
KR20030039334A (ko) * 2003-02-10 2003-05-17 이태희 검색어의 의미론적 연관성 정보를 이용하는 정보검색장치 및 방법
US8798518B2 (en) * 2004-06-30 2014-08-05 Educational Testing Service Method and system for calibrating evidence models
EP1774512A2 (en) * 2004-07-22 2007-04-18 Leapfrog Enterprises, Inc. Interactive foreign language teaching device and method

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000284680A (ja) * 1999-03-31 2000-10-13 Seiko Instruments Inc 語彙学習機能付き電子辞書
JP2003186388A (ja) * 2001-11-14 2003-07-04 Fuji Xerox Co Ltd ダイナミック個別読解指導方法、ダイナミック個別読解指導システム、及び制御プログラム

Also Published As

Publication number Publication date
KR100919912B1 (ko) 2009-10-06
EP1872353A2 (en) 2008-01-02
CN101203895A (zh) 2008-06-18
WO2006121542A8 (en) 2008-05-22
WO2006121542A2 (en) 2006-11-16
US20110076653A1 (en) 2011-03-31
WO2007007201A2 (en) 2007-01-18
WO2007007201A8 (en) 2007-07-05
KR20080014762A (ko) 2008-02-14
TW200709120A (en) 2007-03-01
JP2008547038A (ja) 2008-12-25

Similar Documents

Publication Publication Date Title
JP4908495B2 (ja) 意味論的知識の評価と指導と習得とに関するシステムおよび方法
Towers et al. Leaving or staying in teaching: A ‘vignette’of an experienced urban teacher ‘leaver’of a London primary school
Haas The impact of study abroad on improved cultural awareness: A quantitative review
Misuraca et al. Using Opinion Mining as an educational analytic: An integrated strategy for the analysis of students’ feedback
CN107851398A (zh) 用于自适应评估和训练的系统及方法
Deane et al. Exploring the feasibility of using writing process features to assess text production skills
Nagle Developing and validating a methodology for crowdsourcing L2 speech ratings in Amazon Mechanical Turk
Bussaman et al. Prediction models of learning strategies and learning achievement for lifelong learning
Sieben et al. Can concept mapping support the quality of reflections made by undergraduate medical students? A mixed method study
Taylor A report on the review of test specifications for the reading and listening papers of the Test of English for Academic Purposes (TEAP) for Japanese university entrants
Kubsch et al. Distributing epistemic functions and tasks—A framework for augmenting human analytic power with machine learning in science education research
Roos et al. Sustainability governance toward an organizational sustainability culture at German higher education institutions
Atikuzzaman et al. Information Literacy Self-Efficacy Scale: validating the translated version of the scale for use among Bangla-speaking population
Erdem Aydin et al. Research Trends and Issues in Educational Technology: Content Analysis of TOJET (2012-2018).
Azevedo et al. Analysis of the relevance of posts in asynchronous discussions
González‐López et al. Lexical analysis of student research drafts in computing
Sundqvist et al. Mapping teacher beliefs and practices about multilingualism: The development of the MultiBAP questionnaire
Creek Occupational therapy defined as a complex intervention: a 5-year review
Arlitt et al. Feature engineering for design thinking assessment
Kučera Computational psycholinguistic analysis of Czech text and the CPACT research
Caprario et al. Corpus-informed instruction of the pragmatic marker I mean
KR20170063049A (ko) 복지서비스 발굴을 위한 빅데이터 사례 기반 감성 오피니언 추출 및 평가 시스템 및 그 방법
Chandrashekar Is hearing believing? Perception of online information credibility by screen reader users who are blind or visually impaired
Bardach et al. Teachers’ Psychological Characteristics, Teacher Effectiveness, and Within-Teacher Outcomes: An Integrative Review
Hartig Approaches to research in applied linguistics

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100618

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100917

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100928

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20101018

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20101025

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20101118

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20101126

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20101202

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20101202

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101220

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20110210

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110802

A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20111102

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111222

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120112

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150120

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4908495

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250