KR100919912B1 - 의미론적 지식의 평가, 교육, 및 습득을 위한 시스템 및방법 - Google Patents

의미론적 지식의 평가, 교육, 및 습득을 위한 시스템 및방법 Download PDF

Info

Publication number
KR100919912B1
KR100919912B1 KR1020077025691A KR20077025691A KR100919912B1 KR 100919912 B1 KR100919912 B1 KR 100919912B1 KR 1020077025691 A KR1020077025691 A KR 1020077025691A KR 20077025691 A KR20077025691 A KR 20077025691A KR 100919912 B1 KR100919912 B1 KR 100919912B1
Authority
KR
South Korea
Prior art keywords
user
lexical
items
item
vocabulary
Prior art date
Application number
KR1020077025691A
Other languages
English (en)
Other versions
KR20080014762A (ko
Inventor
가이 치히
찰스 브라운
브렌트 컬리건
다까시 오노
기요시 니시지마
데이비드 샤우펠레
Original Assignee
에이아이 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에이아이 리미티드 filed Critical 에이아이 리미티드
Publication of KR20080014762A publication Critical patent/KR20080014762A/ko
Application granted granted Critical
Publication of KR100919912B1 publication Critical patent/KR100919912B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B19/00Teaching not covered by other main groups of this subclass
    • G09B19/06Foreign languages
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B7/00Electrically-operated teaching apparatus or devices working with questions and answers

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Machine Translation (AREA)

Abstract

의미론적 지식 평가, 교육, 및 습득을 위한 시스템 및 방법이 개시된다. 일 실시예에 있어서, 언어 교육을 위한 컴퓨터 구현 방법은, 특정 언어의 어휘목록 내에서 사용자의 어휘 인식도 레벨을 판정하는 것을 포함한다. 본 방법은 항목 인식도에 기초하여, 모르는 어휘 항목들의 목표 리스트를 작성하는 것을 포함한다. 타겟 리스트는 특정 어휘목록 내의 모르는 어휘 항목들의 중요도에 순위를 매김으로써 소팅될 수 있다. 본 방법은 또한 적어도 부분적으로 목표 리스트에 기초하여 사용자에 대한 개인 언어 학습 시퀀스를 생성하는 것을 포함한다.
의미론적 지식, 평가, 교육, 습득, 어휘

Description

의미론적 지식의 평가, 교육, 및 습득을 위한 시스템 및 방법{SYSTEMS AND METHODS FOR SEMANTIC KNOWLEDGE ASSESSMENT, INSTRUCTION, AND ACQUISITION}
<관련 출원 상호 참조>
본원은 2005년 4월 5일자로 제출된 계류중인 미국 가출원 제60/668,764호(대리인 도켓 넘버: 581458001US)에 대한 우선권을 주장하며, 이를 원용한다.
본원은 일반적으로 의미론적 지식의 평가 및 교육을 위한 시스템 및 방법에 관한 것이다.
언어학의 분야는 수많은 교육학적 이론들과 언어 습득에 관련된 방법들을 포함한다. 종래의 이론과 방법들 중 다수는 규칙 기반의 문법적인 개념 또는 프로세스들에 관한 것이다. 예를 들어, 표준 문법-번역 방법은 문장의 구문 및 구조를 학습하는데 중점을 둔다. 이 방법은 일단 학습자가 문장을 구축하는 문법적 규칙들을 충분히 학습하였다면, 의미있는 언어를 생성하는데 필요한 만큼 적절한 어휘를 채워넣을 수 있을 것으로 가정한다. 예를 들어, (습관-형성에 기초한) 듣고 말하는 방법은 주로 구문론적인 구조들에 중점을 두며, 어휘 단어들은 다양한 구조들 내에서 나오는 경우에만 알게 된다. 좀더 최근의 연구에서는 언어 습득에 있어서의 발달 순서, 입력의 역할, 및/또는 교육의 역할과 같은 다른 문법적 특징들에 중 점을 둔다.
어휘의(lexical) 개념과 어휘 학습 및 교육 방법들은 역사적으로 주류의 언어 습득 이론들에 부수적인 것으로 여겨져 왔다. 그러나, 주류 언어학자들은 문법적인 개념과 접근법들에 주로 중점을 두고 있는 반면, 다른 언어 연구원 및 종사자들의 소수 집단은 유력한 어휘의 관점에서의 언어 습득에 중점을 두어 왔다.
예를 들어, 초기의 어휘 연구에서는 사람들이 알고 있는 단어의 수의 이해를 발전시키려 하였다. 이것은 단어를 알기 위해서는 (a) 단어를 구성하는 것이 무엇이며, (b) 그것이 의미하는 것이 무엇인지를 모두 정의할 필요가 있었다. 단어를 구성하는 것이 무엇인지에 대한 하나의 유력한 정의에 기초하면, 영어에는 약 180,000 개의 단어가 존재한다. 예를 들어, 이하의 도표는 브라운 코퍼스(Brown Corpus)에서 본문의 적용범위에 대한 영어 단어들의 빈도의 관계를 개략한다.
브라운 코퍼스에서 본문의 적용범위에 대한 영어 단어들의 빈도의 관계
상이한 단어 본문의 %
88,741 100
43,831 99
5,000 89
3,000 85
2,000 81
100 49
10 24
상기 도표에 나타낸 바와 같이, 영어 텍스트에서 모든 단어들의 약 1/4(24%)은 10개의 가장 빈번한 영어 단어들 중 하나일 가능성이 크다. 도표는 또한 단어가 빈도가 낮아질수록 본문 적용범위에 대한 그 기여가 감소한다는 것을 나타낸다. 사실, 100개의 가장 빈번한 영어 단어들은 문어적인 영어 텍스트의 모든 단어들의 거의 반(49%)을 차지한다. 예를 들어, 영어에서 가장 공통적인 단어 "the"는 일반 적인 텍스트의 100개의 단어마다 약 6번 나타난다.
대부분의 연구와 조사결과는 주로 제1 언어 습득에 중점을 두는 반면, 제2 언어 습득에 대한 밀접한 관계도 존재한다. 예를 들어, 초기의 연구에서는 원어민 화자들은 적어도 150,000 단어 이상의 어휘를 가지는 것으로 말하였으며, 따라서, 단어의 직접적인 학습은 언어 습득에 대한 실제적인 길을 제공하지 않았다. 그러나, 보다 후기의 연구에서는 원어민 어휘가 약 10,000 내지 20,000 단어에 이르는 것으로 판정하였다. 그 후에는, 단어의 직접적인 학습으로부터 유익함을 얻을 수 있다는 견해가 신뢰를 얻었다. 다른 연구자들은 영어와 같은 제2 언어 학습자들이 학습해야 하는 어휘 단어들이 무엇이며, 어떻게 이 어휘 단어들을 중요한 순서로 가장 잘 정렬할 수 있는지에 대하여 조사하였다.
예를 들어, 일부 종래의 어휘 체계들은 코퍼스(corpus) 또는 그 서브-도메인에 관하여 빈도별로 어휘 단어들을 체계화하는 것을 포함한다. 코퍼스는 수백만 페이지의 소정의 언어의 텍스트로 구성될 수 있다. 서브-도메인은 소정의 언어 내의 특수 목적의 어휘 항목 부분집합이다(예컨대, 미국 도로 기호, 파이낸스 전문직에 사용되는 어휘 및 용어들, 정보 기술 작업자가 사용하는 어휘 및 용어들). 종래의 어휘 체계들은, 소정의 언어 또는 그 서브-도메인에 대한 레벨에 맞는 학습 자료를 구성하는 것이 무엇인지를 판정함에 있어 주로 코퍼스의 단어 빈도에 의존한다. 예를 들어, 출판업자들은 (a) 범용 코퍼스로부터 첫번째 가장 빈도가 높은 영어 단어 1000개만을 포함하는, 레벨을 조정하여 등급을 매긴 독본들과, (b) 통상의 TOEIC 영어 능력 시험에서 나올 수 있는 영어 단어 수천개를 모두 제공하는 단 어 리스트 책자를 발행하였다.
그러나, 종래의 어휘 체계들은 여러 단점들을 포함한다. 많은 종래의 체계들의 하나의 단점은, 예를 들어, 출간된 단어 리스트들은 특정한 개인 또는 개인의 그룹이 이미 알고 있을 수도 있는 단어들을 고려하지 않는다는 점이다. 이와 같이, 단어 리스트들은 학습자가 이미 잘 알고 있는 수천은 아니더라도 수백의 단어들을 포함하고, 따라서, 알고 있는 단어들을 학습하는 것은 거의 아무런 이익이 없기 때문에 언어 학습에 있어서 단지 약간의 도움이 될 뿐이다. 오히려, 모르는 어휘 항목들을 학습하고 습득하는 것이 더 높은 레벨의 의사소통 능력과 전체적인 언어 능력을 획득하기에 가장 유용한 것이다. 이와 동일한 현상은 다른 종류의 어휘 항목들, 예를 들어, 소리(sound), 발성(utterance), 멀티 워드 유닛(multi-word-unit), 관용적 표현(idiomatic expression), 이미지(image), 사인(sign), 심볼(symbol), 멀티 심볼 유닛(multi-symbol unit), 프로그래밍 코드 등에도 마찬가지이며, 그 각각은 언어 또는 그 서브-도메인 내에서의 의미를 기호화하거나 전달하는 역할을 한다.
종래의 어휘 체계들의 다른 단점은, 개인이 인식 가능한 및/또는 인식 불가능한 소정의 언어 또는 언어 서브-도메인 내의 특정 어휘 항목들을 빠르고 정확하게 식별하는 방법이 없다는 점이다. 예를 들어, 개인, 인구통계학적 세부집단, 및/또는 모집단에 의해 인식될 확률이 낮은 높은 빈도의 영어 단어들이 수백개 존재한다. 역으로, 개인, 인구통계학적 세부집단, 및/또는 모집단에 의해 인식될 확률이 높은 낮은 빈도의 영어 단어들이 수백개 존재한다. 그러나, 종래의 체계들은 인식 불가능한 항목들로부터 인식 가능한 항목들을 식별하여 분리할 수 없다.
종래의 어휘 체계들은 다른 여러 단점들도 포함한다. 예를 들어, 종래의 체계들은 일반적으로 (a) 각 개인이 인식 불가능한 어휘 항목들의 상대적인 중요성과, (b) 개인, 인구통계학적 세부집단, 및/또는 모집단의 어휘 지식의 깊이를 측정 및 평가하지 않는다. 또한, 대부분의 종래의 체계들은 각각의 개인 학습자의 평가된 어휘 능력에 기초하여 능력에 적합한 독서 자료를 구성하는데 적절한 프로세스를 포함하지 않는다. 또한, 대부분의 종래의 접근법들은 새롭게 학습한 어휘 항목들의 기억 능력을 평가하기 위한 적합한 프로세스를 포함하지 않는다. 따라서, 언어 습득과 학습을 위한 시스템과 방법을 개선할 필요성이 있다.
본 배경기술 부분에서는 언어 습득, 더 구체적으로는, 유력한 어휘의 관점에서의 언어 습득에 관한 다양한 기존 이론들, 방법들, 및 시스템들을 요약한다. 또한, 이어서 설명하는 발명을 이해하는데 도움이 되는 종래 기술의 어휘 체계들에 관하여 발명자들에 의한 통찰 및 관찰에 대한 논의를 포함하지만, 그것은 반드시 당업자에 의해 이해되어야 하거나 종래 기술에 개시되어 있을 필요는 없다. 따라서, 종래의 어휘 체계들과 관련된 다양한 단점들에 대한 논의를 포함한 이러한 본 배경기술 부분에서의 통찰 및 관찰 내용의 포함은 그러한 통찰 및 관찰 내용이 종래 기술의 일부인 것으로 해석되어서는 아니 된다.
도 1은 본 발명의 일 실시예에 따라서 능력에 맞는 언어 교육 자료를 테스트하고, 컴파일하고, 평가하고, 전달하는 언어 평가 및 교육 시스템을 나타낸 블록도 이다.
도 2는 본 발명의 일 실시예에 따라서 누적적인 개인의 테스트 응답 및 응답자 데이터를 이용하여 인구통계학적 세부집단에 의한 정규 인식 누적도수분포곡선(ogive)을 처리하도록 구성되는 도 1의 시스템의 다양한 컴포넌트들을 나타낸 블록도이다.
도 3은 6000개의 가장 빈도가 높은 영국 국가 코퍼스(BNC) 영어 단어들의 인식도의 누적 도수분포를 나타낸 그래프이다.
도 4는 본 발명의 일 실시예에 따라서 개인의 어휘 능력을 평가하도록 구성되는 도 1의 시스템의 다양한 컴포넌트들을 나타낸 블록도이다.
도 5는 본 발명의 일 실시예에 따라서 각 어휘 항목의 인식도를 설정하기 위한 Yes/No 어휘 판정 질문의 특정 예를 나타낸 화면도이다.
도 6A는 본 발명의 일 실시예에 따라서 어휘 항목 지식의 깊이의 특정한 관점을 갖는 어휘 항목 지식의 깊이 스케일을 나타낸 표시도이다.
도 6B는 본 발명의 일 실시예에 따른 어휘 지식의 깊이 판정 유형 질문의 몇몇 예를 나타낸 표시도이다.
도 7은 본 발명의 일 실시예에 따른 개별 응답자 스코어 시트 보고서의 그래프 및 문어적 설명의 특정 예를 나타낸 표시도이다.
도 8A는 6000개의 가장 빈도가 높은 BNC 영어 단어들 각각의 예상 인식도를 나타낸 이산 분포도이다.
도 8B는 주파수와 단어 인식도의 관계에서 가설적인 학습자의 추정된 어휘집 사이즈를 나타낸 이산 분포도이다.
도 8C는 도 8B에 도시된 단어 인식도 데이터를 나타낸 막대 그래프이다.
도 8D는 BNC 빈도 데이터와 실제 평가된 BNC 단어 인식과의 상호상관을 나타낸 이산 분포도이다.
도 9는 본 발명의 일 실시예에 따라서 개인의 평가된 어휘 능력에 기초하여 어휘 항목들을 우선 순위화하도록 구성되는 도 1의 시스템의 각종 컴포넌트들을 나타낸 블록도이다.
도 10은 본 발명의 일 실시예에 따라서 개인의 평가된 어휘 능력에 기초하여 능력에 맞은 텍스트 자료를 작성 및 전달하도록 구성되는 도 1의 시스템의 각종 컴포넌트들을 나타낸 블록도이다.
도 11A는 본 발명의 일 실시예에 따라서 특정한 개인의 평가된 어휘 능력에 따라 필터링된 영어 텍스트의 일례를 나타낸 표시도이다.
도 11B는 본 발명의 일 실시예에 따른 또 다른 처리 후 도 11A의 텍스트를 나타낸 표시도이다.
도 11C는 본 발명의 일 실시예에 따른 능력에 맞는 필터링 및 편집의 완료후 도 11A 및 도 11B의 텍스트를 나타낸 표시도이다.
도 12는 본 발명의 양태들을 채용할 수 있는 기본적인 적합한 컴퓨터와 데이터베이스 시스템의 블록도이다.
도 13A는 본 발명의 양태들이 네트워크된 컴퓨터 환경에서 동작할 수 있는 간단하고 또한 적합한 시스템을 나타낸 블록도이다.
도 13B는 도 13A의 대체 시스템을 나타낸 블록도이다.
A. 개 요
이하의 개시물은 일반적으로 능력에 맞는 언어 교육 자료를 테스트하고, 컴파일하고, 평가하고, 전달하는 시스템 및 방법에 관한 것이다. 본 명세서에서 설명되는 언어 훈련 시스템은 소정의 언어 또는 어휘목록에서(또는 임의의 소정의 특수 목적의 언어 또는 어휘목록의 서브-도메인에서) 개인의 어휘 능력을 평가할 수 있으며, 이러한 평가를 이용하여, 개인의 언어 및 의사소통 능력을 효율적이고 빨리 향상시키기 위해 교육학적으로 최적의 교육 프로세스를 확립한다. 더 구체적으로, 개시된 시스템 및 방법은 각 개인의 어휘 능력의 수량화를 제공하며, 개인, 인구통계학적 세부집단, 및/또는 모집단의 통계적으로 유도된 어휘 인식도 평가 및 지식의 깊이 평가를 제공한다. 개시된 시스템 및 방법은 개인의 평가된 어휘 능력과 요구에 기초하여 각 개인에 대하여 특정적으로 맞추어진 비인식 어휘 항목들의 개인화된 언어 학습 시퀀스를 또한 생성할 수 있다. 그러므로, 개시된 시스템 및 방법은 각 개별 학습자에 대하여 어휘 중요도에 의해 구성되고 다양한 수동적 및 상호작용적 수단에 의해 전달되는 어휘 항목들의 직접적인 학습을 제공할 수 있다.
개시된 시스템은, 사용자들에 대하여는 다양한 유형의 개인화된 언어 능력 보고서의 생성 및 전달, 그 외에 대하여는 이러한 보고서와 관련 데이터의 구성 및 운반을 더 포함한다. 시스템은 동일한 모집단 내의 상이한 인구통계학적 세부집단 사이, 특히, 상이한 세대들 간의 특정 어휘 항목 인식도의 어떠한 중대한 차이를 식별하고 조정할 수 있다. 또한, 시스템은 2개 이상의 상이한 국가의 모집단 사이에 존재하는 임의의 주어신 언어 또는 그 서브-도메인에 대한 어휘 항목 인식도의 어떠한 큰 차이점을 식별하고 조정할 수 있다.
시스템은 인식된 텍스트의 어휘목록이 학습자에 대하여 인식 불가능한 소정의 퍼센트의 어휘 항목들을 포함하도록 텍스트 자료(또는 소정의 임의의 토픽)의 재구성 및 프리젠테이션을 더 포함한다. 제한된 수의 인식 불가능한 어휘 항목들을 본문에 포함시키는 것은, 독자들로 하여금 알려진 항목들 사이의 문맥에서 이들의 사용을 통해 인식되지 않은 어휘 항목들에 의미를 지정할 수 있도록 한다.
본 발명의 양태들은 수많은 다른 방법에서 특징이 있을 수 있다. 예를 들어, 하나의 양태는 소정의 언어 코퍼스 또는 그 서브-도메인 내의 어휘 항목들의 중요도를 컴파일하고 보존하는 방법을 포함할 수 있다. 본 명세서에서 사용되는 바와 같이, "중요도"라는 용어는, 항목의 발생 빈도, 항목 중대성의 스케일, 항목 인용의 수, 항목 값, 및 기타의 다른 항목에 특정된 수량화 가능한 변수 중 임의의 하나 이상을 일컬을 수 있다. 본 발명의 또 다른 양태는 일반적인 언어의 어휘목록, 또는 언어 서브-도메인의 어휘목록 중에서 취해진 일련의 선택 어휘 항목들의 인식을 위하여 개별 사용자들을 테스트하는 방법을 포함할 수 있다. 선택된 어휘 항목들은 실제 어휘 항목들 및 의사 어휘 항목들 모두를 포함할 수 있다. 의사 어휘 항목들은 일반적으로 그럴 듯하게 보이지만, 소정의 언어 또는 어휘목록에서 의미를 갖지는 않는다. 본 방법은 예를 들어 상호작용적인 "Yes/No" 어휘 판정형의 질문 테스트 프로세스를 이용하여 항목들을 표시하는 것을 포함할 수 있다.
본 발명의 또 다른 양태에서는, 제공되는 최초 항목이 사용자가 속하는 인구통계학적 세부집단에 있어서 소정의 인식도를 갖는 항목들 중에서 랜덤하게 선택되도록 상호작용적인 순서로 어휘 항목들을 표시하는 방법을 포함할 수 있다. 사용자가 적어도 하나의 실제 어휘 항목을 인식한 것으로 식별할 때까지, 또한 적어도 하나의 실제 어휘 항목을 인식하지 못한 것으로 식별할 때까지 인식도 스케일의 위로 아래로 각각의 후속하는 어휘 항목의 랜덤한 선택을 안내하기 위하여 적절한 알고리즘적인 프로세스가 사용될 수 있다. 의사 어휘 항목들은 사용자의 개별적인 추측 행동을 제어하기 위해 실제 어휘 항목들의 프리젠테이션 내에서 랜덤하게 분산될 수 있다.
본 발명의 또 다른 특정 양태에서는, 각각의 테스트 응답자에 대한 인구통계학적 정보 및 각 응답자의 응답과 테스트 프로세스 중에 제공되는 어휘 항목 질문들에 대한 상호작용에 관한 데이터를 저장하는(예컨대, 데이터베이스에) 방법을 포함할 수 있다. 본 발명의 또 다른 양태에서는 새롭게 학습한 어휘 항목 지식을 (특정 응답자, 인구통계학적 세부집단, 및 모집단에 대하여) 보유하는 능력을 판정하는 방법을 포함할 수 있다.
본 발명의 또 다른 양태에서는, (a) 모든 응답자들로부터의 응답 데이터를 취합하여 인구통계학적 세부집단에 대한 각 어휘 항목의 표준 인식도 지수를 판정하는 방법, (b) 하나 이상의 특정 인구통계학적 세부집단 또는 모집단에 대하여 어휘 인식 누적도수분포곡선(ogive)을 설정하는 방법, (c) 어휘 인식 누적도수분포곡선에 각 개별 응답자의 인구통계학적 데이터 및 어휘 항목 인식 응답 데이터를 포 함시키는 방법, (d) 어휘 인식 누적도수분포곡선을 따라서 각 응답자의 어휘 인식도를 판정하여, 해당 응답자가 인식한 어휘 항목 및 인식하지 못한 어휘 항목을 판정하는 방법을 포함할 수 있다.
본 발명의 또 다른 양태는, 어휘 항목 지식의 깊이 질문의 상호작용적 표시를 이용하여(예컨대, 다중 선택 및/또는 Yes/No 결정형 질문) 각 응답자의 어휘 항목 지식의 깊이를 테스트하는 방법에 관한 것이다. 일 실시예에 있어서, 예를 들어, 제일 먼저 표시되는 지식의 깊이 항목은 어휘 항목 인식에 대한 각 응답자의 평가된 능력에 기초하여 추정된 능력의 레벨이다. 후속하는 지식의 깊이 질문들은 능력의 추정치에서 최대의 정보량을 제공하도록 알고리즘적으로 선택된다. 각 응답에 있어서, 최대 우도, 테스트 정보, 추정치의 최대 오차가 재계산되며, 따라서 후속하는 지식의 깊이 질문들은 정정된 능력의 추정치에서 선택되어 응답자에게 제공될 수 있다. 본 프로세스는 소망하는 레벨의 정확도로 다양한 레벨의 어휘 항목 지식의 깊이 능력이 취득될 때까지 반복될 수 있다.
본 발명의 또 다른 특정 양태는, 각 개인의 학습을 위해 인식하지 못하고, 친하지 않으며, 망각한 것으로 예상되는 어휘 항목들의 교육학적으로 최적의 개인 언어 학습 시퀀스를 발생시키기 위해 이하의 각각을 판정하는 방법에 관한 것이다 -
(a) 소정의 코퍼스 또는 그 서브-도메인 내의 어휘 항목 중요도;
(b) 인구통계학적 세부집단 또는 모집합에 대한 어휘 인식 누적도수분포곡선(ogive);
(c) 인구통계학적 세부집단 또는 모집단에 대한 다수의 어휘 지식의 깊이 누적도수분포곡선
(d) 인구통계학적 세부집단 또는 모집단에 대한 어휘 인식 누적도수분포곡선;
(e) 개별 응답자의 어휘 인식도
(f) 개별 응답자의 어휘 지식의 깊이 능력; 및
(g) 개별 응답자의 어휘 보유 능력.
본 발명의 또 다른 양태에서는, 적합한 데이터베이스 시스템과 이러한 데이터베이스 시스템과 인터페이스하도록 구비되는 다양한 학습 프로그램들 또는 컴퓨터 시스템들과의 사이에 각 학습자의 개인 언어 학습 시퀀스를 상호 교환하는 방법을 포함한다. 학습 프로그램들과 데이터베이스 시스템들과의 사이의 데이터의 상호 교환은 언어 학습 시퀀스에 대한 정정과 정비를 발생시킬 수 있으며, 데이터베이스 시스템은 반복적으로 갱신된 현재의 언어 학습 시퀀스를 연결된 학습 프로그램들 또는 컴퓨터 시스템들에 반복적으로 전달할 수 있다.
본 발명의 또 다른 양태는, 맞춤식 전자 메일 서비스를 통해 각 개별 학습자에 대한 개인 언어 학습 시퀀스에서 하나 이상의 어휘 항목들의 변형예를 포함하는 학습 자료들을 생성하는 방법에 관한 것이다. 전자 메일 서비스는 가입자들이 어휘 항목들의 지식을 학습하고 보유하도록 지원하기 위하여 다양한 교육학적 전략들을 활용할 수 있다. 예를 들어, 맞춤식 전자 메일 서비스는 가입자 상호작용의 확인을 위한 다양한 수단을 요청하여 제공함으로써 언어 학습 시퀀스 데이터베이스 시스템에 대한 적절한 갱신이 이루어지도록 할 수 있다.
본 발명의 또 다른 양태는, 읽기 자료, 듣기 자료, 비디오 자료 및 기타의 레벨에 맞는 문맥적인 언어 자료들 포함하는 다양한 능력에 맞는 등급화된 자료들을 생성하여 전달하는 방법에 관한 것이다. 이러한 능력에 맞는 자료들은 가입자 상호작용의 확인을 위한 다양한 수단을 요청 및 제공하여, 적당한 데이터 저장 장치에 저장된 언어 학습 시퀀스에 대한 적절한 갱신이 이루어지도록 할 수 있다.
본 발명의 또 다른 양태는, 맞춤식의 상호작용적인 어휘 언어 학습 게임들을 생성하여 전달하는 방법에 관한 것이다. 예를 들어, 언어 학습 게임들은 어휘 항목들의 묶음을 전달하고, 개인 언어 학습 시퀀스에 대하여 적당한 만큼 어휘 항목들을 제공할 수 있다. 언어 학습 게임들은 또한 다른 형태의 레벨에 맞는 학습 자료들을 전달하고 제공할 수 있다. 언어 학습 게임들은 모바일 통신 장치, 퍼스널 컴퓨터, 포터블 전자 장치, 및/또는 기타의 적합한 전자 장치를 통해 어휘 항목들 및 다른 레벨에 맞는 학습 자료들을 전달하고 제공할 수 있다. 언어 학습 게임들은 가입자들이 매우 많은 수의 어휘 항목들과 기타의 레벨에 맞는 학습 자료들에 대한 지식을 재빨리 학습하여 보유하는데 도움이 되도록 다양한 교육학적 전략들과 그래픽 포맷들을 활용할 수 있다. 언어 학습 게임들은 또한 가입자 상호작용을 확인 및 기록하여 데이터베이스 시스템에 대하여 적절한 갱신이 이루어지도록 하는 자동 수단을 포함할 수 있다.
본 발명의 또 다른 양태는, 개인, 교사, 및/또는 프로그램 관리자들에 대하여 다양한 형태의 맞춤식의 누적적이거나 및/또는 비교적인 어휘 능력 보고서를 생 성하여 전달하는 방법에 관한 것이다. 보고된 결과물은 예를 들어 (a) 얼마나 많은 항목들을 아는지에 대한 그래픽 및 텍스트 표현, (b) 소정의 코퍼스 또는 소정의 서브-도메인 내의 얼마나 많은 항목들이 알려졌는지/알려지지 않았는지, (c) 코퍼스 또는 소정의 서브-도메인의 상이한 빈도 대역 내에서 얼마나 많은 항목들이 알려졌는지/알려지지 않았는지, (d) 다양한 지식의 깊이의 양상들에 의해 어휘 항목들이 얼마나 잘 알려졌는지, (e) 학습 프로그램들과의 상호작용을 통해 새로운 어휘 항목들이 얼마나 빨리 습득되고 있는지, (f) 특정한 능력 목표가 성취되기 전에 얼마나 많은 항목들이 남아 있는지, (g) 특정한 능력 목표를 성휘하기 위하여 요구되는 시간의 추정치, 및 (h) 인구통계학적 세부집단 또는 모집단의 누적 능력의 동등한 양상에 대한 개인의 능력의 임의의 양상의 비교.
본 발명의 또 다른 양태에서는, 얼마나 많은 단어들을 사용자가 아는지, 사용자가 아는 정확한 단어들, 및 사용자의 언어 학습 목표에 도달하기 위하여 어느 단어를 사용자가 학습할 필요가 있는지를 재빠르고 정확하게 식별하는 방법을 포함할 수 있다. 예를 들어, 시스템은 각 개인이 아는 단어들을 판정하도록 구성되는 어휘 엔진을 포함할 수 있다. 일 실시예에 있어서, 어휘 엔진은 컴퓨터 또는 포터블 전자 장치(예컨대, 셀룰러 전화, PDA, 등)의 화면에 사용자에 대하여 일련의 단어들 또는 다른 어휘 항목들을 표시할 수 있다. 사용자는 단어 또는 항목을 인식한다면 "Yes"를 인식하지 못한다면 "No"를 선택 또는 클릭할 수 있다. 응답들에 기초하여, 어휘 엔진은 소정의 어휘 목록 내에서 사람이 아는 정확한 단어 또는 항목들을 판정할 수 있다. 그 후, 어휘 엔진은 나머지 모르는 단어들에 그 개인에 대한 우선순위에 의하여 순위를 매길 수 있으며, 이 모르는 단어들은 사용자의 개인 목표 리스트가 될 것이다.
이하, 다양한 실시예들에 대하여 본 발명을 설명한다. 이하의 설명은 이러한 본 발명의 실시예들의 완전한 이해 및 설명을 가능하게 하기 위한 상세한 세부사항들을 제공한다. 그러나, 당업자라면 본 발명은 이들 세부사항 없이 실시될 수도 있음을 이해할 것이다. 기타의 경우, 공지된 구조들 및 기능들은 불필요하게 본 발명의 실시예들의 설명을 불분명하게 하는 것을 피하기 위해 상세하게 도시 또는 설명되지 않았다.
이하 제공되는 본 설명에서 사용되는 전문용어는, 본 발명의 특정 실시예의 상세한 설명과 연계하여 사용되고 있을지라도, 가장 넓은 타당한 방법으로 해석되고자 한 것이다. 일부 용어들은 이하에서 강조될 수도 있다; 그러나, 제한된 방법으로 해석되고자 한 어떠한 전문용어는 본 상세한 설명부에서와 같이 명백하게 또한 구체적으로 정의될 것이다. 본 특허 출원서의 예시적인 설명은 일반적으로 영어를 말하지만, 본 명세서의 시스템 및 방법은 임의의 언어 또는 의미론적 지식 영역에 동등하게 적용될 수 있다.
필요하지 않을지라도, 범용 컴퓨터(예컨대, 서버 또는 PC)에 의해 실행되는 루틴들과 같은 컴퓨터 실행가능한 명령어들의 일반적인 문맥에서 본 발명의 양태들 및 실시예들을 설명할 것이다. 이러한 시스템들의 예들을 도 12 내지 도 13B를 참조하여 보다 상세하게 설명할 것이다.
B. 언어 지식 평가 및 교육을 위한 시스템 및 방법의 실시예들
도 1은 본 발명의 일 실시예에 따라서 구성되는 언어 평가 및 교육 시스템(100)을 나타낸 블록도이다. 시스템(100)은 능력에 맞는 언어 교육 자료를 사용자들에 전달하도록 구성되는 테스팅 컴포넌트(124), 컴파일링 컴포넌트(122, 126, 128, 130, 및 132), 평가 컴포넌트(122, 124, 및 132), 및 전달 컴포넌트(116)를 포함할 수 있다.
시스템(100)은 임의의 소망하는 수의 코퍼스 및 해당 서브-도메인들을 저장하도록 구성되는 하나 이상의 코퍼스 및 서브-도메인 데이터베이스(110)(하나 만이 도시됨)를 포함할 수 있다. 시스템(100)은 또한 어휘 항목 데이터의 중요도를 컴파일하기 위한 코퍼스 프로그램 또는 모듈(112)을 포함할 수 있다. 더 구체적으로, 각각의 코퍼스 및 서브-도메인 내에는 설정된 수의 어휘 항목들이 존재한다. 각각의 코퍼스 또는 서브-도메인의 모든 어휘 항목들의 총체를 어휘목록(lexicon)이라 한다. 본 명세서에서 사용되는 바와 같이, "어휘 항목"이라는 용어는 의미를 상징화하는 임의의 심볼, 멀티 심볼 유닛, 소리, 발성, 단어, 멀티 워드 유닛, 또는 관용적 표현을 말한다. "어휘목록(lexicon)"이라는 용어는, 특정 언어 내의 어휘 항목 모두를 일컫는다. 소정의 어휘목록의 어휘 항목들은 코퍼스 또는 서브-도메인의 중요도를 기준으로 순위가 매겨질 수 있다. 예를 들어, 코퍼스 프로그램(112)은 예를 들어 코퍼스 및 서브-도메인들을 스캐닝하여 코퍼스 및 서브-도메인별로 항목 중요도 데이터를 생성할 수 있다. 항목 중요도 데이터베이스(114)는 코퍼스 또는 서브-도메인별로 어휘 항목 중요도 데이터를 저장할 수 있다. 이러한 특징의 하나의 장점은, 각 어휘목록에 대한 상대적 중요도에 의해 어휘 항목들을 구성하기 때문에, 모르는 친근하지 않은 어휘 항목들을 각각의 사용자에 대하여 개인적인 언어 학습 시퀀스들로 가장 논리적이고 효율적으로 시퀀싱하는데 기여한다.
시스템(100)은, 대규모 샘플(128) 가운데 어휘 항목 인식도를 추정하고 그 결과를 적용하여, 각 개별 응답자에 대한 양측의 사실 능력 추정치을 발생시키고 학습을 위하여 목표 항목의 개인 언어 학습 시퀀스(116)의 생성에 기여하는 교정 프로그램 또는 방법(130)을 더 포함한다. 이 프로세스는 예를 들어 각각의 항목과 각각의 응답자, 인구통계학적 세부집단, 및/또는 모집단과의 사이의 확률적 관계를 설정하는 통계적 모델을 구축하기 위하여 항목 응답 이론("IRT":Item Response Theory)을 이용하는 것을 포함할 수 있다. 본 특징의 하나의 장점은, 시스템(100)으로 하여금 개별 응답자가 모를 것으로 예상되는 따라서 학습해야 하는 특정 어휘 항목들을 정밀하게 판정하여 보고할 수 있도록 한다는 것이다.
개인 언어 학습 시퀀스 컴파일러(116)는, 소정의 코퍼스 또는 그 서브-도메인으로부터 항목 중요도 데이터를, 어휘 항목 인식도 데이터(122)를, 어휘 항목 지식의 깊이(122)의 하나 이상의 양상(aspect)으로부터의 데이터를, 어휘 항목 보유 능력(120)으로부터의 데이터를 취하여, 인식하지 못할 것으로 예상되는 어휘 항목들의 고유 개인 언어 학습 시퀀스를 생성하고 보존하기 위하여 하나 이상의 알고리즘적 프로세스에서 이들을 결합하도록 구성된다. 이 프로세스는 각각의 사용자의 평가된 어휘 능력 및 필요성을 통보받는다. 따라서, 각각의 사용자의 인식되지 않을 것으로 예상되지만 중요한 어휘 항목들이 우선순위화될 것이다. 또한, 각각의 사용자의 언어 학습 시퀀스의 구성은 어휘인 지식의 깊이의 자신만의 진행중인 표 현과 새롭게 학습된 항목 보유 데이터에 기초하여 더 갱신될 수 있다.
시스템(100)은 또한 개별 사용자 데이터베이스(126)와 다양한 학습 프로그램들(118) 및/또는 다른 적합한 환경과의 사이에 개인 언어 학습 시퀀스(116)의 상호 교환을 가능하게 한다. 학습자가 하나 이상의 학습 프로그램(118)과 상호작용함에 따라서, 상호작용 및 보유 컴파일러(120)에 의해 데이터가 취득되어 컴파일될 수 있다. 상호작용 및 보유 컴파일러(120)는, 특정 사용자에 의해 진행이 이루어짐에 따라 각각의 사용자의 언어 학습 시퀀스는 사용자의 현재 어휘 능력에 관하여 지속적으로 통보를 받고 있으며 갱신되고 있다는 것을 학습 시퀀스 컴파일러(116)에 통보할 수 있다. 더 구체적으로, 상호작용 및 보유 컴파일러(120)는 각각의 사용자의 학습 능력과 새롭게 습득한 어휘 항목의 지식을 지속적으로 보유하는 능력에 관한 정보를 인식하고 컴파일할 수 있다. 이와 같이, 학습 시퀀스 컴파일러(116)는 상호작용 및 보유 컴파일러(120)로부터 수신된 정보에 기초하여 각 사용자의 언어 학습 시퀀스를 조정할 수 있다. 각 사용자의 학습 프로그램 및/또는 새롭게 학습된 항목들의 보유에 관한 상호작용에 관한 정보는 또한 개별 사용자 데이터베이스(126)에 저장되어, (필요한 경우) 학습 시퀀스 컴파일러(116) 및/또는 (컴파일러(116)를 통해) 보고 모듈(134)에 대하여 활용 가능하게 될 수 있다. 시스템은 또한 개인 언어 학습 시퀀스(116)에 기초하여, 문어 또는 구어 포맷으로 학습자에 의해 선택된 토픽에 대한 자료를 포함하여, 다양한 능력에 맞는 자료를 작성하여 전달하도록 구성될 수 있다. 이 프로세스는 도 11A 내지 도 11C를 참조하여 이하에 더 상세하게 설명한다.
시스템(100)은 또한 사용자와 시스템(100)과의 사이의 하나의 인터페이스의 예로서 컴퓨터 적응 테스트("CAT": Computer Adaptive Test) 컴포넌트(124)를 포함할 수 있다. 예를 들어, CAT(125)는 퍼스널 컴퓨터, 모바일 전화, PDA를 통해 또는 기타의 적합한 장치 및/또는 프로세스를 이용하여 사용자에 대하여 테스트(예컨대, 상호작용적인 IRT 테스트)를 관리하도록 구성될 수 있다. 이와 같이, CAT(124)는 각 사용자의 어휘 항목 인식도와 지식의 깊이 능력을 계산하도록 사용될 수 있다. CAT(124)는 또한 항목 인식도 및 DOK 데이터베이스(122)로부터 하나 이상의 인구통계학적 세부집단 및 모집단에 대한 적절한 항목 인식도와 지식의 깊이 데이터를 취득할 수 있다.
각 사용자의 능력 평가 및 인구통계학적인 세부사항들은 개별 사용자 데이터베이스(126)에 저장될 수 있으며, 각 사용자의 미처리 항목 응답 데이터는 인구통계학적 세부집단 데이터베이스(128)에 의해 누적 응답에 저장될 수 있다. 누적 응답 데이터베이스(128)는 또한 모든 개별 테스트 경험자들로부터의 응답 데이터가 주기적으로 취합되어 교정 프로그램(130)에 의한 사용을 위해 컴파일되도록 구성될 수 있다. 교정 프로그램(130)은 각각의 어휘 항목에 대한 인식도를 설정하고, 모집단 및 인구통계학적 세부집단에 대한 관련된 지식의 깊이 분석을 처리할 수 있다. 교정 프로그램의 결과는 항목 인식도 및 DOK 데이터베이스(122)에 저장될 수 있다. 인식 및 DOK 누적도수분포곡선 컴파일러(132)는 데이터베이스(122)로부터의 데이터를 모집단, 인구통계학적 세부집단, 또는 다른 소망하는 구성요소에 의해 소팅되는 인식의 누적도수분포로 조합하도록 구성될 수 있다. 누적도수분포곡선 컴 파일러(132)는 보고 모듈(134) 및 학습 시퀀스 컴파일러(116) 양측에 대하여 각 사용자의 적합한 누적도수분포를 제공할 수 있다.
일 실시예에 있어서, 개별 사용자 데이터베이스(126)는 개별 사용자의 능력을 개인 언어 학습 시퀀스 컴파일러(116)에 통지할 수 있다. 인식 및 지식의 깊이 누적도수분포곡선 컴파일러(132)는 각 인구통계학적 세부집단과 모집단에 대한 인식도 및 DOK 능력 지수를 구성할 수 있다. 누적도수분포곡선 컴파일러(132)는 이에 따라서 각 사용자의 평가가 (이하에서, 도 3에 관하여 설명하는 바와 같이) 인식도의 순위에 의해 알려진 단어 및 미지의 단어들에 상대적으로 이루어지도록 할 수 있다. 학습 시퀀스 컴파일러(116)는 일반 언어 및 임의의 소망하는 그 서브-도메인 양측에 대하여 항목 중요도 데이터베이스(114)로부터 어휘 항목의 중요도 데이터를 취득한다. 학습 시퀀스 컴파일러(116)는 사용자의 능력 및 요구에 기초한 우선 순위을 기준으로 각 사용자의 미지의, 친근하지 않은, 잊어버렸을 수도 있는 어휘 항목들에 순위를 매길 수 있다. 가장 중요한(하지만 아직 인식되지 않은) 어휘 항목들은 학습 시퀀스 컴파일러(116)에 의한 학습을 위해 우선 순위화된다.
일 실시예에 있어서, 학습 시퀀스 컴파일러(116)는 또한, 이에 한하지 않지만, 전자 이메일 서비스, 상호 언어 학습 게임, 또는 조치들, 및 능력에 맞는 텍스트 자료를 포함하는, 각종 학습 프로그램들(18)에 대하여 사용자의 개인 항목 시퀀스를 제공하도록 구성될 수 있다. 사용자들은 적합한 교육학적 전략 및 각 사용자의 학습에 자신의 개인 언어 학습 시퀀스를 지원하도록 설계된 포맷을 채용하는 다양한 학습 게임들(118)과 상호작용할 수 있다. 사용자들은 퍼스널 컴퓨터, 모바일 전화, PDA를 통해, 또는 다른 적합한 장치 및/또는 프로세스를 이용하여 학습 프로그램과 상호작용할 수 있다.
보고 모듈(134)은 각 사용자에 대하여 개별 그래픽 및 문자화된 점수를 생성하고, 이들이 퍼스널 컴퓨터, 모바일 전화, PDA, 또는 기타의 적합한 장치 및/또는 프로세스를 통해 사용자 또는 다른 사람(예컨대, 교사, 등)에 대하여 활용가능하게 되도록 구성될 수 있다. 보고 모듈(134)은 교사 및/또는 프로그램 관리자에 대하여 다차원의 어휘 능력과 학습 진행의 분석 및/또는 비교를 갖는 집합형의 보고서를 생성하도록 구성될 수 있다. 각 보고서는 일반적으로 사용자에게 알려진 단어의 수, 사용자의 높은 중요도의 위치 및 사이즈, 또는 높은 빈도, 단어 지식 갭, 및 자신의 중요한 다음의 어휘 목표에 도달하기 위해 사용자가 취득해야할 단어의 수를 포함한다. 중요한 어휘 목표는 언어마다 서브-도메인마다 변한다. 일반적인 영어에 있어서, 예를 들어, 처음의 3000개의 가장 빈도가 높은 단어들의 지식이 일반적으로 사람이 일반적으로 사전의 도움없이 전형적인 영어 독서 자료를 판독할 수 있도록 하는지를 추정한다. 따라서, 영어를 학습하는 사용자들의 중요한 목표는 처음의 3000개의 가장 빈도가 높은 영어 단어들을 학습하는 것이 될 것이다. 다른 실시예에 있어서, 보고서는 상이한 데이터 및/또는 상이한 특징들을 포함할 수 있다.
예시된 실시예에 있어서, 언어 훈련 시스템(100)의 컴포넌트들 각각은 별도의 컴포넌트(예컨대, 단일 데이터베이스 또는 단일 처리 컴포넌트)를 포함한다. 그러나, 다른 실시예들에 있어서, 상기 컴포넌트들 중 2개 이상이 동일한 장치 내 에 있을 수 있다. 또 다른 실시예들에 있어서, 언어 훈련 시스템(100)은 상이한 수의 컴포넌트들을 포함할 수 있으며, 컴포넌트들은 상이한 배치를 가질 수 있다. 또한, 언어 훈련 시스템(100)의 하나 이상의 컴포넌트들이 홀로 동작하는 또는 전체 시스템 내의 서브시스템으로서의 별도의 유틸리티를 가질 수 있다는 것이 이해될 것이다. 예를 들어, 시스템의 각종 컴포넌트들은 사용자의 어휘 지식을 평가하기 위하여만 사용될 수 있다. 다른 실시예들에 있어서, 컴포넌트들은 다른 기능들을 수행하기 위하여 다른 배치들을 가질 수 있다.
도 2는 본 발명의 일 실시예에 따라서 누적적인 개별 테스트 응답과 응답자 데이터를 이용하여 인구통계학적 세부집단에 의한 정규 인식 누적도수분포를 처리하도록 구성되는 시스템(100)의 각종 컴포넌트들을 나타낸 블록도이다. 더 구체적으로, 누적 사용자 응답 데이터베이스(128)는 소망하는 간격에서 (항목 응답 이론을 활용하는) 어휘 항목 교정 프로그램(130)에 의해 분석될 수 있다. 교정 프로그램(130)은 예를 들어 항목 응답들의 벡터의 최대 우도를 통합적으로 추정하는 통계적 절차인, 통합 최대 우도 추정을 활용할 수 있다. 프로그램은 응답자의 능력을 초기 추정함으로써 시작한 후, 이 추정치들을 고정된 것으로 간주하고, 능력 추정을 조건으로 한 항목 응답들의 벡터의 최대 우도를 추정하여, 어휘 항목의 인식도의 추정치를 얻는다. 이 단계의 결과는 그 후 고정된 것으로 간주되며, 항목 응답들의 벡터는 그 후 어휘 항목 인식도를 조건으로 한 최대 우도를 이용하여 추정되어, 새로운 능력의 추정치를 얻는다. 이러한 프로세스는 설정된 기준에 수렴할 때까지 계속된다.
일 실시예에 있어서, 예를 들어, 각 응답자는 상호작용적인 IRT 온라인 테스트에서 그들 앞에 표시되는 일련의 항목들에 응답할 수 있다. 어느 한 응답자에 대하여 표시된 적당한 수의 어휘 항목들은 다른 응답자들에 대하여도 표시되었을 수 있다. 교정 프로그램(130)은 하나의 종합적인 테스트에 대하여 이들이 하나의 전체 항목 집합의 부분집합인 것처럼 하여, 모든 응답자의 대답들을 관리하고, 구성하고, 주기적으로 컴파일할 수 있다. 일 실시예에 있어서, 응답자의 입력은 임의의 특정한 인구통계학적 세부집단 및/또는 임의의 언어 또는 그 서브-도메인에 의해 구성될 수도 있다. 각 어휘 항목의 인식도 지수 및 각 응답자의 개별 능력 지수는 교정 프로그램(130)에 의해 동시에 추정되므로, 모든 추정치들은 동일한 스케일에 있을 것이다. 각 어휘 항목에 대한 응답의 누적수가 항목의 인식도 지수를 안정화할 수 있을 정도로 충분하다면, 시스템은 임의의 특정한 언어 서브-도메인에서 개인의 능력 평가를 정확하게 판정할 수 있다.
예를 들어, 하나의 특정한 시스템의 실시예에 있어서(18살의 일본 남자들로 구성된 인구통계학적 세부집단에 대하여), 헤비 메탈 음악에 대한 일본어 서브-도메인의 각 어휘 항목의 특정 인식도이 판정될 수 있다. 테스팅 프로세스를 위한 어휘 항목들은 헤비 메탈 음악("HMM")에 특히 관련되는 코퍼스 서브-도메인의 분석을 통해 생성될 수 있다. 서브-도메인은 코퍼스 프로그램(112)에 의해 스캐닝 및 구성될 것이며, 중요 항목들의 어휘목록으로 구성되어, 본 예에서는, 코퍼스 내의 발생 빈도에 의해 순위가 매겨지게 된다. 첫번째 단계로서, HMM 어휘 항목들은 목표 인구통계학적 세부집단 중에서 약 1000명의 응답자들의 베타테스트 그룹으로 테 스트 될 것이다. 베타 테스팅은 18살의 일본 남자들 중 HMM 어휘 항목들의 인식도의 초기 교정을 가능하게 할 것이다. 그 후, 테스트는 후속하는 18살 남자 응답자 각각에 대하여 HMM 어휘 지식의 잠정 추정치를 생성할 수 있을 것이다. 잠정적인 점수들은 또한 초기 1000명의 베타테스트 응답자들에 대하여 소급적으로 보내질 수 있다. 그 후, 응답자의 누적 수가 커짐에 따라서, 각각 후속하는 누적 응답 데이터(128)의 교정(130)으로, 개개인의 능력 추정치의 정확도가 예리하게 된다. 어휘통계학적 확률의 성질은 감소하는 순환 중 하나이다. 즉, 특정 지점 후, 얼마나 많은 사람이 각각의 어휘 항목에 응답하는지 여부는 문제가 되지 않으며, 항목의 인식도 지수는 일반적으로 안정적으로 유지된다.
소정의 응답의 확률은 변수와 적용의 목적에 따라서 다수의 상이한 IRT 공식을 통해 수학적으로 표현된다. 일 실시예에 있어서, 인식도 ri의 랜덤 항목(i)에 올바르게 응답하는 능력θj의 랜덤 응답자(j)의 확률은 응답자의 능력과 항목의 인식도를 조건으로 한다. 즉, 응답자가 특정한 도메인에서 높은 능력을 가지면, 그는 아마도 응답자의 인구통계학적 세부집단 및 모집단에 대하여 높은 인식도를 갖는 항목을 인식할 것이다. 역으로, 응답자가 낮은 능력을 가지며, 항목은 낮은 인식도를 갖는다면, 응답자는 아마도 항목을 인식하지 않을 것이다.
일 실시예에 있어서, 항목 인식의 확률은 이하의 수식을 이용하여 계산될 수 있다.
Figure 112007079461031-pct00001
(1)
여기서, P i (θ)는 항목(i)을 인식하는 능력(θ)을 갖는 랜덤 응답자의 확률이며, e 는 자연 로그의 밑수이며(2.718), θ는 로그(logits)로 측정된 응답자의 능력이며, b i 는 로그로 측정된 항목의 불인식도(un-recognizability) 파라미터이며, r j 는 인식도 파라미터 또는 (b i * -1.0)이다.
능력(θ)의 추정치가 높을수록, 응답자의 능력도 크다. 능력(θ)의 추정치는 -∞<θ<∞ 의 범위일 수 있다. 마찬가지로, 인식도(r j )의 추정치가 높을수록, 인식가능한 항목이 많다. 인식도는 -∞<b<∞의 범위일 수 있다.
이하의 수식의 하나 이상의 버전에 기초하여 적합한 모델이 구성될 수 있다.
Figure 112007079461031-pct00002
(2)
여기서, e 는 상수 2.1718이며, b i 는 불인식도 파라미터이며, r j 는 응답자(j)의 개별 추측 행동이며, θ는 능력 레벨이며, D는 크기조정 팩터이다.
일 실시예에 있어서, 본 방법은 하나 이상의 대수적 프로세스를 통해 코퍼스에서의 중요도에 기초하여 측정된 어휘 항목의 인식도를 항목의 순위의 수학적 표현과 비교하여, 각 학습자에게 확률적으로 인식 불가능한 항목들의 상대적인 우선순위를 수량화하는 것을 포함할 수 있다.
도 3은 일본어 모집단 내의 특정 나이의 인구통계학적 구회 중에서 600 개의 가장 빈도가 높은 BNC 영어 단어들 각각의 인식도의 누적도수분포의 그래프를 나타낸다. 코퍼스 내의 빈도가 아니라 누적 응답자에 대한 인식에 따라서 단어들이 구성된다. 라인 A는 테스트 응답자 A에 대한 -3.29의 평가된 능력을 나타내며, 이는 응답자 A는 확률적으로 본 인구통계학적 세부집단에 대하여 인식가능한 6000개의 단어 중 1000개를 인식할 가능성이 있음을 나타낸다. 라인 B는 테스트 응답자 B에 대하여 +2.63의 평가된 능력을 나타내며, 이는 응답자 B는 확률적으로 이 인구통계학적 세부집단에 대하여 인식가능한 6000개의 단어 중 5000개를 인식할 가능성이 있음을 나타낸다. 이하, 도 8을 참조하여 도 3에 예시된 데이터를 더 설명한다.
도 4는 본 발명의 일 실시예에 따라서 개인의 어휘 능력을 평가하도록 구성되는 도 1의 시스템의 각종 컴포넌트들을 나타낸 블록도이다. 이 평가 프로세스는 예를 들어 정확한 추정을 제공하고 개별 응답자가 코퍼스 또는 그 서브-도메인 내에서 알 것 같은 특정 어휘 항목들과 그 총수 모두를 보고하기 위해 사용될 수 있다.
일 실시예에 있어서, 사용자에게 Yes/No 판정형 테스트를 제공함으로써 사용자의 능력을 추정하기 위하여 사용자 인터페이스(140)가 사용될 수 있다. 또한, 어휘 판정 태스크로 알려진, Yes/No 테스트는 사용자들로 하여금 일련의 실제 어휘 항목 및 의사 어휘 항목 중에서 선택된 어휘 항목들에 부과된 질문에 대하여 Yes 또는 No로 대답할 것을 주문한다. 시스템은 실제 항목들에 대한 사용자의 Yes/No 응답을 의사 항목들에 대한 Yes/No 응답과 비교하기 위하여 신호 검출 이론의 다양 한 양태들을 활용할 수 있다. 하나 이상의 대수적 프로세스를 통해서, 시스템은 사용자가 각각의 판정을 행하는 정확도뿐만 아니라 올바른 판정을 하는 사용자의 확률을 계산한다.
일 실시예에 있어서, 테스트는 하나 하나씩 항목들을 관리하며, 사용자의 응답 패턴에 기초하여, 소망하는 응답 정확도의 레벨이 성취될 때까지 표시되는 항목들의 인식도 팩터를 변화시킨다. 테스트는 그들의 옳고 그름의 응답에 기초하여 지속적으로 사용자의 레벨에 중점을 두기 때문에, 정확하게 능력을 추정하기 위하여 종래의 테스트 방법들에 비하여 무척 적은 수의 질문들이 필요하다.
임의의 지수의 정확도는 각각의 특정 항목이 종합적인 테스트 결과에 기여하는 정보량에 의해 통지되는 수치인 추정치의 표준 오차와 관련된다. 이하 나타낸 수식 3은 테스트에 기초한 추정치에 대한 정보 함수이며, 수식 4는 추정치의 표준 오차와의 관계를 나타낸다.
Figure 112007079461031-pct00003
(3)
여기서, I(θ)는 항목 1 내지 n의 시험에 의해 제공되는 정보이며, P i '(θ)는 P i (θ)의 도함수이다.
Figure 112007079461031-pct00004
(4)
여기서, SE(θ)는 추정치의 표준 오차이다.
일 실시예에 있어서, 시스템은 컴퓨터 적응 테스트를 포함할 수 있으며, 테스트 시험자에게는 어휘 항목 및 의사 어휘 항목의 데이터베이스로부터 랜덤하게 취해지는 어휘 항목들이 제공될 수 있다. 첫번째 실제 어휘 항목은 사용자가 속하는 인구통계학적 세부집단에 대한 평균에서 인식도를 갖는 항목들 중 랜덤하게 선택된다. 사용자가 어떻게 응답하는지에 따라서, 다음의 실제 어휘 항목이 평균의 위 또는 아래의 대략 하나의 표준 편차로부터 취해질 수 있다. 이어서, 사용자가 적어도 하나의 실제 어휘 항목을 인식하는 것으로 식별하고, 또한 적어도 하나의 실제 어휘 항목을 인식되지 않는 것으로 식별할 까지, 인식도 스케일(122)(도 1)의 위 아래로 어휘 항목들의 랜덤한 선택을 안내하도록 하나 또는 또 다른 효과적인 알고리즘적 프로세스가 구현될 것이다. 의사 어휘 항목들은 사용자의 개별 추측 행동을 제어하도록 실제 어휘 항목들의 프리젠테이션 내에서 랜덤하게 분산된다.
테스트 시험자의 최대 우도 추정은, 수식 4에서 상기에 나타낸 표준 편차와 시험 정보 함수뿐만 아니라 이하 수식 (5)에 나타낸 바와 같이, 확률 함수의 도함수를 이용하여 계산된다.
Figure 112007079461031-pct00005
(5)
여기서,
Figure 112007079461031-pct00006
는 응답들의 벡터의 우도(likelihood)이다.
각각의 경우에, 그 능력의 추정치에서 정보의 최대량을 주도록 차기 어휘 항 목이 선택된다. 다음, 최대 우도, 테스트 정보, 및 추정치의 표준 오차가 다시 계산된다. 이러한 프로세스는 소망하는 레벨의 정확도가 성취될 때까자 반복되며, 따라서, 어휘 항목의 수와 테스트를 완료하기 위해 필요한 시간 량은 가변적이다.
일 실시예에 있어서, CAT(124)로 관리되는 어휘 테스트는 각 학습자의 어휘 지식의 깊이의 다양한 특정 양상들을 평가하는 고속의 효율적인 수단을 제공하기 위하여 상기 공식들의 다양한 양태들을 활용할 수 있다. 예를 들어, 학습자는 거짓-친구로 식별될 수 있었던 특정한 낮은 중요도의 단어들(즉, 영어로는 단어처럼 표기되고 들리지만, 모국어에서 그 사용 또는 의미는 매우 상이한 조어(mother tongue)로부터의 단어)에 대하여 테스트될 수 있다. 어휘 지식의 깊이의 다른 양상의 다수의 지수를 채용함으로써(124), 본 명세서에서 설명되는 인식 평가가 동시적인 측정을 통해 검증될 수 있을 뿐만 아니라, 새롭고 고유한 형태의 지식의 깊이 평가가 가능하게 될 수 있다.
도 5는 본 발명의 일 실시예에 따라서 각 어휘 항목의 인식의 확률을 설정하기 위한 어휘 판정 질문의 특정예들을 나타낸 표시도이다. 도시된 예들에서 나타낸 바와 같이, 본 명세서에서 개시된 시스템 및 방법은 모든 종류의 의미론적 지식의 평가와 교육에서 유용할 수 있다. 본 실시예에서, 시스템은 온라인의 상호작용적인 Yes/No 어휘 판정형 질문을 통해 어휘 인식의 개별적인 테스팅을 제공한다. 평가 프로세스의 중요 부분은 의사 어휘 항목의 포함이다. 의사 어휘 항목들은 그럴듯하게 보이지만, 소정의 언어에서 의미는 없다. 예를 들어, 블록 502는 일본어 사용자에 대하여 일본어의 단어들을 표시하는 Yes/No형의 어휘 판정 질문을 설명하 며, 블록 504는 일본어 사용자에 대한 의사 일본어 단어의 표시를 나타낸다. 블록 506은 영어 내의 파이낸셜 서브-도메인으로부터 추출된 실제적인 영어의 멀티 워드 유닛 "compound interest"를 나타내며, 블록 508은 의사 영어 단어 "regget"을 나타낸다. 블록 510은 자바 프로그래밍 언어 코드의 표현 "return myDisk.size();"을 나타내며, 블록 512는 자바 코드 "avv;..,;g3-d"의 의사 표현을 표시한다. 블록 514는 영어 내의 서브-도메인으로부터의 실제 교통 표지를 나타내며, 블록 516은 동일한 도메인 내의 의사 교통 표지를 나타낸다.
도 6A는 어휘 지식의 깊이 스케일(600)을 나타내는 표시도이다. 어휘 지식의 깊이의 몇몇 양상들이 도시되어 있다. 어휘 지식의 깊이는 인식(602)에서 시작하여 스케일의 오른쪽으로 갈수록 점차 더 큰 지식의 깊이로 증가되도록 도시되어 있다. 올바른 정의(604)를 선택할 수 있는 것은 단어의 의미의 올파른 파악을 나타내며, 항목 배열(606)을 올바르게 판정하는 것은 더 깊은 이해를 나타낸다. 문장으로 단어들을 쓰는 것 등의 신조력(608)을 통해서 더 깊은 이해의 레벨일지라도 증명된다.
도 6B는 본 발명의 일 실시예에 따라서 어휘 지식의 깊이 판정형 질문의 특정한 예들을 나타낸 표시도이다. 시스템은 다선택 판정형 질문 및 Yes/No 어휘 판정형 질문을 포함하는 수단을 통해서 어휘 지식의 깊이의 개별 테스팅을 제공한다. 시스템은 이해력이 풍부한 지식에서 시작하여 점차 더 깊은 레벨을 통해 신조력이 있는 어휘 항목 지식으로 이동하는 연속체 상에서 어휘 항목 지식의 깊이의 다수의 양상에 기초하여 어휘 지식의 깊이의 수량화를 제공한다. 도시된 지식의 깊이 질 문의 예들은 가능한 지식의 깊이의 상이한 양상들을 평가한다. 프로세스의 내부는 선택지 정의와 의사 어휘 배열(collocation)을 도입하는 것이다. 선택지 정의는 그럴듯하기는 하나, 어휘 항목의 거짓 정의이다. 의사 어휘 배열은 그럴듯 하나 거짓 배열이다.
도 6B에 도시된 예들은 어휘 지식의 깊이의 3개의 상이한 양상들에 대한 지식의 깊이를 확인하기 위하여 사용될 수 있다. 예를 들어, 블록 610은 일본어 사용자에게 제공될 수 있는 경우 영어 단어 "wasted"에 대한 정의의 인식형 질문을 나타낸다. 블록 612는 자바 프로그래밍 코드 표현 "<c:out value = "$(user.firstName}"/>에 대한 정의 인식형 질문을 나타낸다. 제공된 3개의 정의 중 하나는 참된 정의인 반면, 다른 2개의 정의는 그럴듯한 선택지들이다.
블록 614 및 616은 배열 인식형 질문을 나타낸다. 더 구체적으로, 블록 614는 영어 사용자에게 제공될 수 있는 경우 영어의 배열 "fancy weather"를 나타내며, 블록 616은 일본어의 참된 배열을 나타낸다.
블록 618 및 620은 2개의 형태의 문맥 상의 항목 생성 태스크를 나타낸다. 블록 618은 일본어 사용자에게 자바 프로그래밍 코드의 표현 내의 오류를 수정하도록 요청하는 문맥 상의 항목 생성형 태스크를 나타낸다. 철자 및 발음 오류를 식별하고 수정하는 것은 조어형성의 형태이다. 블록 620은 영어 단어 "bargain"에 대한 문장 작성 태스크를 나타낸다. "bargain"이라는 용어를 사용하여, 사용자는 제공된 빈 칸에 문장을 작성하도록 과제가 주어지게 된다.
도 7은 약 2500개의 단어를 알고 있는 개별 일본어 사용자에 대한 테스트 스 코어 시트(700)의 일 실시예를 나타낸다. 스코어 시트(700)의 하나의 특징은, 절대 스코어를 표시하며, 얼마나 많은 어휘 항목들을 개별 사용자가 알고 있는지에 대하여 스코어가 동점이 된다는 것이다. 스코어 시트(700)의 또 다른 특징은 스코어링 시스템이 다른 그룹 및 평균들과의 직접적인 비교를 가능하게 한다는 것이다. 이러한 경우, 사용자는 총 2500개의 영어 단어들을 알고 있지만, 1751개 만이 첫번째 3000개의 가장 빈도가 높은 단어 중에 속한다. 따라서, 스코어 시트(700)의 하나의 장점은, 사용자들로 하여금 그들의 높은 빈도의 단어 지식 갭의 중요성을 가시화할 수 있도록 한다는 것이다. 이러한 경우, 예를 들어, 1751개의 단어들 중, 사용자는 코퍼스의 1000개의 가장 빈도가 높은 단어들 중 801개(즉, 80.1%), 두번째 1000개의 가장 빈도가 높은 단어들 중 557개(즉, 55.7%), 세번째 1000개의 가장 빈도가 높은 영어 단어들 중 393개(즉, 39.3%)를 알고 있다.
개시된 시스템 및 방법의 하나의 목적은 의미있는 수의 가장 중요한 어휘 항목들을 습득하도록 학습자들을 지원하는 것이다. 앞에서 논의된 바와 같이, 첫번째 3000개의 가장 빈도가 높은 영어 단어를 안다는 것은 일반적으로 사람이 사전의 도움 없이 전형적인 자료를 판독할 수 있도록 한다. 이러한 특정 예에 있어서, 학습자의 목표는 3000개의 가장 빈도가 높은 영어 단어들 중에서 1249개의 미지의 영어 단어들을 습득하는 것이 될 것이다. 초기 학습 시퀀스는 가장 빈도가 높은(그러나 모르는) 단어들 중 199개를 포함할 수 있다. 본 명세서에서 설명되는 시스템 및 방법은 정확한 어휘 평가, 및 정확한 학습 속도 예측, 수량화를 행할 수 있다. 또한, 시스템의 다양한 실시예들은 상이한 유형의 그룹 능력과 교사 및 프로그램 관리자를 위해 구성될 수 있는 진행 보고서를 포함한다. 따라서, 시스템은 개인 및 그룹 어휘 능력의 다차원의 비교 및 분석을 가능하게 한다.
정확한 도해는 학습자 및 교사에 대하여 시간에 따른 진행을 트랙킹하기 위한 정확한 수준점을 제공한다. 일부 실시예들에 있어서, 예를 들어, 일련의 기간 경과후에, 후속하는 테스트는 진행이 이루어졌음을 실증할 수 있다. 시스템은 (학습자가 새로운 단어들을 습득하는 노력을 행하였다고 가정하여) 진행을 정확하게 평가하고 표시할 수 있다. 또한, 시스템의 이메일 서버 및/또는 학습 게임 서비스를 이용하는 사용자들은 3000개 단어 목표를 향해 더욱 진행할 수 있다.
도 8A는 일본어 모집단 내에서 세대를 지정한 인구통계학적 세부집단 중에서 6000개의 가장 빈도가 높은 영국 국가 코퍼스(BNC) 영어 단어들 각각의 가능한 인식도를 나타낸 이산분포도이다. 도면 내의 각각의 점은 6000개의 BNC 단어들 중 하나의 특정한 단어를 지시한다. 표시된 결과물은 일본어 모집단 내의 하나의 특정 세대의 인구통계학적 세부집단으로부터 549 명의 개별 사용자들에 의한 Yes/No 판정형 어휘 항목 질문에 대한 4217개의 응답의 통계적 분석을 통해 판정되었다.
도 8B는 6000개의 BNC 단어들 중 모든 지정 단어들을 나타내는 이산분포도이다. 이산 분포도의 각각의 점은 하나의 지정 단어를 나타낸다. 가로선 C는 개별 사용자 C에 대한 0.0의 평가된 인식도를 나타낸다. 수직선 D는 3000개의 점이 선 D의 좌측에 위치하도록 묘화된다.
1로 표기된 영역은 사용자 C에 의해 인식가능할 가능성이 있는 3000 개의 가장 빈도가 높은 BNC 단어들 중의 지정 단어를 각각 나타내는 많은 점들을 포함한 다. 임의의 특정 점들이 사용자 C의 0.0의 평가된 능력의 레벨 아래 멀리에 있을수록, 사용자 C가 그 점에 의해 나타낸 단어를 인식할 확률이 높아진다. 사용자 의 0.0의 평가된 능력 레벨 상에 놓여 있는 점들은 사용자 C가 인식할 확률이 50/50이 될 특정 단어들을 나타낸다. 2로 표시된 영역은 사용자 C가 인식가능할 가능성이 없는 3000 개의 가장 빈도가 높은 BNC 단어들 중의 지정 단어를 각각 나타내는 많은 점들을 포함한다. 임의의 특정 점들이 사용자 C의 0.0의 평가된 능력 레벨 위에서 멀리 놓여 있을수록, 사용자가 점으로 나타낸 단어를 인식하지 못할 확율이 더 높다.
영역 3 및 영역 4에 정의된 타원형은 코퍼스 내의 특수 목적의 언어 서브-도메인의 일례를 나타낸다. 영역 3은 확률적으로 사용자 C에 대하여 인식가능한 특수 목적의 서브-도메인의 단어들을 나타낸다. 영역 4는 확률적으로 사용자 C에 대하여 인식 불가능한 특수 목적의 서브-도메인의 단어들을 나타낸다. 영역 5는 각각 사용자 C에 대하여 인식될 가능성이 있는 3001 내지 6000개의 가장 빈도가 높은 BNC 단어들 중에서 지정 단어를 나타내는 점들을 포함한다. 영역 6는 각각 사용자 C가 인식하지 못할 가능성이 있는 3001 내지 6000개의 가장 빈도가 높은 BNC 단어들 중에서 지정 단어를 나타내는 점들을 포함한다.
도 8C는 BNC의 1천개의 단어 빈도 대역 내의 사용자 C의 지정 단어 인식을 나타내도록 도 8B의 데이터를 재구성한다. 본 도표는 예를 들어 사용자 C가 첫번째 1000개의 가장 빈도가 높은 BNC 단어들 중 894개를 인식할 가능성이 있다는 것을 나타낸다. 이 결과는 어휘 능력 평가의 측면에서 중요하다. 그러나, 프로세스 가 첫번째 1000개의 가장 빈도가 높은 BNC 단어들 내에서 사용자 C에 대하여 인식 불가능할 가능성이 있는 106개의 단어들 각각을 식별한다는 것이 더 중요하다.
도 8D는 BNC 빈도 데이터와 실제 평가된 BNC 단어 인식도의 대수정규적(lognormal) 변환의 비교를 허용하도록 도 8A와 도 8B의 데이터를 재구성한다. 이산분포도의 라인 P는 측정된 어휘 인식도에 대한 단어 빈도의 회귀에 기초한 예측된 단어 인식도를 나타낸다. 이 회귀선은 빈도와 항목 인식도 사이의 절대 상호상관으로 0.60을 나타내는 반면, 1.92의 표준 오차는 단어 빈도 데이터가 어느 어휘 항목들이 개별 사용자에게 알려질 확률이 있는지 및 어느 어휘 항목들이 알려지지 않을 확률이 있는지를 판정하기 위한 통계적으로 타당한 방법을 어휘 항목들이 제공하지 못한다는 것을 나타낸다. 도 8B 및 도 8D의 도시는, 모집단의 인구통계학적 세부집단의 개별 멤버들에 대하여 판정되는 경우, 어휘 항목 인식도 데이터가 각 개별 사용자에 의한 각각의 어휘 항목의 인식 가능성의 추정을 위해 통계적으로 타당한 기준을 제공한다는 것을 확인한다.
도 9는 본 발명의 일 실시예에 따라서 개인의 평가된 언어 또는 서브-도메인 어휘 능력에 기초하여 어휘 항목들을 우선순위화하도록 구성되는 도 1의 시스템의 다양한 컴포넌트들을 나타내는 블록도이다. 예를 들어, 다양한 알고리즘적 프로세스들은, 각 학습자의 학습을 위해 이상적인 개인 어휘 학습 시퀀스(116)를 생성하기 위해 코퍼스 또는 서브-도메인 항목 중요도 데이터(114)와 함께(적절하다면) (a) 각 개인의 어휘 인식도(124), (b) 어휘 지식의 깊이(124), 및 (c) 보유 비율(120)을 계산할 수 있다.
일 실시예에 있어서, 각 학습자의 개인 언어 학습 시퀀스(116)는 다수의 다양한 유형의 학습 프로그램들(118)에 전달될 수 있다. 앞서 논의된 바와 같이, 시스템은 학습자의 학습 프로그램들과의 상호작용에 관하여 학습 프로그램들(118)로부터 피드백을 취득할 수 있다. 수신되는 피드백은 시스템에 대하여 각 학습자의 현재 능력과 요구 평가에 맞추어 개인 언어 학습 시퀀스를 재구성하도록 할 수 있다는 것을 통지할 것이다. 학습 프로그램으로부터의 피드백에 기초하여, 시스템은, 예를 들어, 어휘 항목들을 폐기시키고, 앞서 폐기된 어휘 항목들을 재활용하며, 새로운 어휘 항목들을 추가하고, 특정 어휘 항목에 대한 지식의 깊이의 양상을 학습자에게 제공되도록 변경시킬 수 있다.
시스템은 또한 전자 메일을 통해 개별 학습자에게 개인 언어 학습 시퀀스로부터 하나 이상의 어휘 항목들을 전달하는 맞춤식 전자 메일 서비스를 포함할 수 있다. 맞춤식 전자 메일 서비스는 다양한 교육학적 전략들을 활용하여 가입자들이 중요한 새로운 어휘 항목들의 지식을 학습하고 유지하도록 지원할 수 있다. 맞춤식 전자 메일 서비스는 또한 가입자 상호작용의 확인을 요청하여 시스템 데이터베이스에 대하여 적절한 갱신이 이루어질 수 있도록 하는 다양한 수단을 제공할 수 있다.
맞춤식 전자 메일 서비스의 또 다른 양태는, 가입자에 대하여 관심의 토픽들에 대한 읽기, 듣기, 및 비디오물, 및 기타 형태의 능력에 맞는 문맥적인 언어 자료들을 포함하는 다양한 능력에 맞는 자료의 작성과 전달을 통해 문맥상에서 어휘 항목들의 적절한 사용의 지식을 학습하고 유지하도록 가입자들을 지원한다는 것이 다. 이러한 능력에 맞는 자료들은 가입자 상호작용의 확인을 요청하여, 시스템의 데이터베이스에 적절한 갱신이 이루어질 수 있도록 하는 다양한 수단을 제공할 수 있다.
시스템은 또한 가입자의 개인 언어 학습 시퀀스에 따라서 어휘 항목들의 묶음을 전달하여 어휘 항목들을 제공하는 맞춤식 상호작용 언어 학습 게임들의 발생을 제공한다. 맞춤식 상호작용 언어 학습 게임들은 또한 다른 형태의 능력에 맞는 학습 자료들을 전달하고 제공할 수 있다. 맞춤식 상호작용 언어 학습 게임들은 퍼스널 컴퓨터, 모바일 전화, 모바일 통신 장치, 및/또는 기타의 적합한 전자 장치들을 통해 가입자에게 전달될 수 있다.
맞춤식 상호작용 언어 학습 게임들은 다양한 교육학적 전략과 도해적 포맷들을 활용하여 큰 수의 어휘 항목들 및 다른 능력에 맞는 학습 자료들의 지식을 좀더 빠르게 학습하여 보유하도록 가입자들을 지원할 수 있다. 맞춤식 상호작용 언어 학습 게임들은 또한 가입자 상호작용을 확인하고 기록하여 시스템의 데이터베이스 및 가입자의 개인 언어 학습 시퀀스에 대하여 적절한 갱신이 이루어질 수 있도록 하는 자동적인 수단을 제공할 수 있다.
도 10은 본 발명의 일 실시예에 따라서 개인의 평가된 어휘 능력에 기초하여 능력에 맞는 텍스트 자료를 준비하여 전달하도록 구성되는 도 1의 시스템의 각종 컴포넌트들을 나타낸 블록도이다. 문어, 구어, 또는 비디오를 포함하는 임의의 텍스트 자료를 편집하고 재확인하는 프로세스는 각각의 개인의 평가된 어휘 능력에 기초할 수 있다. 학습자의 관심과 요구에 기초하여 적합한 텍스트 자료들이 화제 의 텍스트 자료(1010)의 데이터베이스로부터 추출될 수 있다. 학습자가 모를 것으로 예상되는 어휘 항목들은 텍스트 자료 프로그램 또는 모듈(1020)에 의해 식별된다. 모를 것으로 예상되는 항목들은, 프로그램(1020)에 의해 발생되는 그 결과의 변경된 텍스트 자료(1030)가 임의의 소망하는 백분율만큼 알려진 어휘 항목들을 포함하도록 이해력의 관점에서 조정되도록, 제거되거나 인식된 단어들의 데이터베이스(122)로부터 취득되는 알려진 단어들로 대체된다. 따라서, 본 방법은 임의의 소정의 언어 또는 서브-도메인에서 임의의 소정의 학습자에 대하여(예컨대, 사용자 인터페이스(140)를 통해) 교육학적으로 적절한 읽기, 듣기, 및 비디오 자료의 작성과 제공을 가능하게 한다.
도 11A는 본 발명의 일 실시예에 따라서 특정 개인의 평가된 어휘 능력에 따라서 필터링되는 영어 텍스트의 일례를 나타낸 표시도이다. 더 구체적으로, 도 11A는 1.32의 개인의 평가된 어휘 능력에 기초하여 필터링되는 읽기 자료의 샘플을 나타낸다. 본 예에서는, 95 퍼센트의 인식의 이해 목표가 설정되었다. 2개의 설정에 기초하여, 사용자에 대하여 인식 불가능할 것으로 예상되는 모든 단어들이 식별되었으며, 이 설명을 위해, 굵은 이탤릭체로 표시되어 있다.
도 11B는 더 처리후의 도 11A의 텍스트(1110)를 나타낸 표시도이다. 더 구체적으로, 도 11B에 도시된 샘플 읽기 자료(1110)는, 텍스트에 남아 있는 적어도 95 퍼센트의 단어들이 판독자에 의해 인식가능 하도록, 또한 텍스트에 남아있는 약 5 퍼센트 이하의 단어들이 판독자에 대하여 인식 불가능하게 되도록, 더 편집되고 재확인되었다. 프로세스는 가능하다면 많이 사용자의 개인 언어 학습 시퀀스에 다 라서 인식되지 않은 단어들의 포함을 우선순위화한다. 본 설명의 이해를 위해서, 다양한 편집 마크들이 도면에 남아 있다.
도 11C는 능력에 맞는 필터링 및 편집이 완료된 후의 도 11A 및 도 11B의 텍스트(1100)를 나타낸 표시도이다. 그 결과의 텍스트는, 학습자의 평가된 어휘 능력에 기초하여 학습자에 대하여 95 퍼센트 이상의 이해도로 구성되는 교육학적으로 능력에 맞는 화제의 읽기 자료이다. 이 설명을 위해서, 학습자의 인식 불가능한 단어들(5 퍼센트 이하)이 굵은 이탤릭체로 표시되어 있다.
C. 적절한 컴퓨팅 시스템
도 12 내지 도 13B 및 이하의 논의에서는, 컴퓨팅 환경에서 구현될 필요는 없지만, 본 발명의 양태들이 구현될 수 있는 적절한 컴퓨팅 환경의 간략하고 일반적인 설명을 제공한다. 따라서, 요구되지 않더라도, 본 발명의 양태 및 실시예들은, 범용 컴퓨터, 예컨대, 서버 또는 퍼스널 컴퓨터에 의해 실행되는 루틴과 같은, 컴퓨터 실행가능 명령어의 일반적인 문맥에서 구현될 수 있다. 당업자라면, 본 발명은 인터넷 기기, 핸드헬드 장치, 의류 컴퓨터, 셀룰러 또는 모바일 전화, 멀티-프로세서 시스템, 마이크로프로세서 기반의 또는 프로그래머블 소비자 전자장치, 셋톱 박스, 네크워크 PC, 미니-컴퓨터, 메인프레임 컴퓨터, 등을 포함하는, 다른 컴퓨터 시스템 구성으로 실시될 수 있음을 이해할 것이다. 본 발명은 이하 상세하게 설명되는 하나 이상의 컴퓨터 실행가능 명령어를 수행하도록 구성 또는 구축되는 특수 목적 컴퓨터 또는 데이터 프로세서에서 실시될 수 있다. 실제로, "컴퓨터"라는 용어는 본 명세서에서 일반적으로 사용되어, 임의의 데이터 프로세서뿐만 아니라 상기 장치들 중의 임의의 것을 일컫는다.
본 발명은 또한 로컬 영역 네트워크(LAN), 광대역 네트워크(WAN), 또는 인터넷 등의 통신 네트워크를 통해 링크되는 원격 처리 장치들에 의해 태스크 또는 모듈들이 수행되는 분산 컴퓨팅 환경에서 실시될 수 있다. 분산 컴퓨팅 환경에 있어서, 프로그램 모듈 또는 서브-루틴들은 로컬 메모리 저장장치 및 원격 메모리 저장장치 모두에 위치될 수도 있다. 이하에 설명하는 본 발명의 양태들은, 자기 및 광학적으로 판독가능하고 제거가능한 컴퓨터 디스크를 포함하는 컴퓨터 판독가능 매체에 저장 또는 분산될 수도 있으며, 칩에 펌웨어(예컨대, EEPROM 칩)로서 저장될 수도 있으며, 또한 인터넷 또는 (무선 네트워크를 포함하는) 기타의 네트워크를 통해 전자적으로 분산될 수도 있다. 당업자라면, 본 발명의 일부는 서버 컴퓨터에 상주하는 한편, 해당하는 일부는 클라이언트 컴퓨터에 상주할 수도 있음을 이해할 것이다. 본 발명의 앙태들에 특정적인 데이터 구조 및 데이터 송신 또한 본 발명의 범주 내에 포함된다.
도 12를 참조하면, 본 발명의 일 실시예에서는 하나 이상의 사용자 입력 장치(1202) 및 데이터 저장장치(1204)에 결합되는 하나 이상의 프로세서(1201)를 갖는, 퍼스널 컴퓨터 또는 워크스테이션 등의 컴퓨터(1200)를 채용한다. 컴퓨터는 또한 디스플레이 장치(1206)와 같은 적어도 하나의 출력 장치 및 하나 이상의 선택적인 추가 출력 장치(1208)(예컨대, 프린터, 플로터, 스피커, 촉각 또는 후각 출력 장치, 등)에 결합된다. 컴퓨터는 선택적인 네트워크 커넥션(1210), 무선 송수신기(1212), 또는 두 가지 모두를 통해 외부 컴퓨터들에 결합될 수도 있다.
입력 장치(1202)는 키보드 및/또는 마우스 등의 포인팅 장치를 포함할 수도 있다. 마이크로폰, 조이스틱, 펜, 게임 패드, 스캐너, 디지털 카메라, 비디오 카메라, 등의 다른 입력 장치들이 가능하다. 데이터 저장 장치(1204)는, 자기 하드 및 플로피 디스크 드라이브, 광학 디스크 드라이브, 자기 카셋트, 테이프 드라이브, 플래쉬 메모리 카드, DVD, 베르누이 카트리지, RAM, ROM, 스마트 카드 등의, 컴퓨터(100)에 의해 액세스 가능한 데이터를 저장할 수 있는 임의의 유형의 컴퓨터 판독가능 매체를 포함할 수도 있다. 실제로, LAN, WAN, 또는 인터넷(도 12에서 도시 생략) 등의 네트워크 상의 커넥션 포트 또는 노드를 포함하는, 컴퓨터 판독가능 명령어 및 데이터를 저장하거나 전송하기 위한 임의의 매체가 채용될 수도 있다.
본 발명의 양태들은 또한 다양한 다른 컴퓨팅 환경에서 실시될 수도 있다. 예를 들어, 도 13A를 참조하면, 웹 인터페이스를 갖는 분산 컴퓨팅 환경은, 시스템(1300)의 하나 이상의 사용자 컴퓨터(1302)를 포함하는 것이 도시되어 있으며, 그 각각은 인터넷의 월드 와이드 웹 부분 내의 웹 사이트를 포함하여, 컴퓨터가 인터넷(1306)과 데이터를 액세스하여 교환할 수 있도록 하는 브라우저 프로그램 모듈(1304)을 포함한다. 사용자 컴퓨터는 도 12에 관하여 상기 설명된 컴퓨터와 실질적으로 유사할 수도 있다. 사용자 컴퓨터는 운영체제, 하나 이상의 어플리케이션 프로그램(예컨대, 워드 프로세싱 또는 스프레드 시트 어플리케이션) 등의 다른 프로그램 모듈들을 포함할 수도 있다. 컴퓨터는 다양한 유형의 어플리케이션들에서 작동하도록 프로그램될 수 있는 범용 장치일 수도 있으며, 또는 특정 기능 또는 기능의 클래스에 취적화되거나 제한되는 단일 목적의 장치일 수도 있다. 더 중요 하게는, 이하 설명하는 바와 같이, 웹 브라우저로 나타내었지만, 사용자에 대하여 그래픽 사용자 인터페이스를 제공하기 위한 임의의 어플리케이션 프로그램이 채용될 수도 있다; 웹 브라우저 및 웹 인터페이스의 사용은 여기서는 단지 친근한 예로서 사용된다.
인터넷 또는 월드 와이드 웹(Web)(1306)에 결합되는 적어도 하나의 서버 컴퓨터(1308)는 웹 페이지, 오디오 신호, 및 전자 이미지 등의 전자적인 메시지들을 수신하고, 라우팅하고, 저장하는 기능들 중 많은 것 또는 모두를 수행한다. 인터넷을 나타내었지만, 인트라넷 등의 사설 네트워크가 실제로 일부 적용예에서는 바람직할 수도 있다. 네트워크는 컴퓨터가 다른 클라이언트 컴퓨터의 서버로 전용되는 클라이언트-서버 아키텍쳐를 가질 수도 있으며, 하나 이상의 컴퓨터가 동시에 서버와 클라이언트로서 기능하는 피어-투-피어 등의 다른 아키텍쳐를 가질 수도 있다. 서버 컴퓨터(들)에 결합되는 데이터베이스(1310) 또는 데이터베이스들은 사용자 컴퓨터들 사이에서 교환되는 웹 페이지들 및 콘텐츠 중 많은 부분을 저장한다. 데이터베이스(들)를 포함하는 서버 컴퓨터(들)는 시스템에 대한 악의의 공격을 방지하고, 이에 저장되는 메시지들 및 데이터의 무결성을 보존하도록 보안 대책(방화벽 시스템, 보안 소켓층(SSL), 패스워드 보호 체계, 암호화, 등)을 채용할 수 있다.
서버 컴퓨터(1308)는 서버 엔진(1312), 웹 페이지 관리 컴포넌트(1314), 콘텐츠 관리 컴포넌트(1316), 및 데이터베이스 관리 컴포넌트(1318)를 포함할 수 있다. 서버 엔진은 기본적인 처리와 운영 체제 수준의 태스크를 수행한다. 웹 페이 지 관리 컴포넌트는 웹 페이지의 생성과 표시 또는 라우팅을 처리한다. 사용자들은 이에 관련된 URL을 수단으로 서버 컴퓨터에 액세스할 수 있다. 콘텐츠 관리 컴포넌트는 본 명세서에서 설명한 실시예들의 대부분의 기능들을 처리한다. 데이터베이스 관리 컴포넌트는 데이터베이스에 대한 저장 및 검색 태스크, 데이터베이스에 대한 조회, 비디오, 그래픽, 오디오 신호등의 데이터의 저장을 포함한다.
도 13B를 참조하면, 시스템(1300)의 대체 실시예가 시스템(1350)으로 도시되어 있다. 시스템(1350)은 시스템(1300)과 실질적으로 유사하지만, 하나 이상의 서버 컴퓨터(서버 컴퓨터 1, 2, ..., J 로 표시됨)를 포함한다. 하중 밸런싱 시스템(1352)은 수개의 서버 컴퓨터들에 대한 하중을 밸런싱한다. 하중 밸런싱은 2개 이상의 컴퓨터들 간의 처리 하중을 분산하여, 명령어를 좀더 효율적으로 처리하고 데이터를 라우팅하는 당업계에 공지된 기법이다. 이러한 하중 밸런싱 장치는 메시지 트래픽을 특히 피크 트래픽 시간에 분산시킬 수 있다.
분산 파일 시스템(1354)은 웹 서버들을 수개의 데이터베이스들(데이터베이스 1, 2, ... K로 나타냄)에 결합시킨다. 분산 파일 시스템은 파일 시스템 자체가 LAN 등의 네트워크를 통해 원격 파일 또는 데이터베이스 및 분산된 파일들로부터의 정보들(예컨대, 콘텐츠 페이지)을 관리하고 투명하게 위치시키는 일종의 파일 시스템이다. 분산 파일 시스템은 또한 데이터베이스들에 대한 판독 및 기입 기능을 관리한다.
결 론
문맥에서 분명하게 다르게 요구하지 않는 한, 설명과 청구범위에 걸쳐서, " 구비한다(comprise, comprising, 등)"라는 용어는 배타적 또는 소모적 의미에 반대되는 포괄적 의미로서 이해되어야 한다; 즉, "포함하지만, 이에 한하지는 않는다"는 의미로. 본 명세서에서 사용되는 바와 같이, "연결(connected)", "결합(coupled)", 또는 임의의 그 변형은 2개 이상의 구성요서 사이의 직간접적인 임의의 연결 또는 결합을 의미하며; 구성요소들 간의 연결의 결합은 물리적, 논리적, 또는 그 조합일 수 있다. 또한, "본 명세서에서(herein)", "상기", "이하"라는 단어, 및 유사한 취지의 단어들은, 본 출원서에서 사용되는 경우, 본 출원서를 전체로서 지칭하며, 본 출원서의 임의의 특정 부분을 지칭하는 것이 아니다. 문맥에서 허용하는 경우, 상기 상세한 설명부의 단수 또는 복수형을 이용하는 단어들은 각각 복수 또는 단수를 포함할 수도 있다. 2개 이상의 항목들의 나열에서 참조하는 "또는(or)"이라는 단어는 이어지는 단어 해석들의 모두를 커버한다: 나열 중 임의의 항목들, 나열 중 항목들 모두, 및 나열 중 항목들의 임의의 조합.
상기 본 발명의 실시예들의 상세한 설명은 소모적이거나 본 발명을 상기 개시된 구체적인 형태로 제한하고자 한 것은 아니다. 상기에서 예시적인 목적으로 본 발명의 특정한 실시예들을 설명하지만, 당업자가 인식하듯이, 본 발명의 범주 내에서 각종 균등한 변경예들이 가능하다. 예를 들어, 프로세스들 또는 블록들이 소정의 순서로 제공되어 있지만, 대체 실시예들에서는 상이한 순서의 단계들을 갖는 루틴을 수행하거나 상이한 순서의 블록들을 갖는 시스템을 채용할 수 있으며, 일부 프로세스 또는 블록들은 대체예 또는 하부조합들을 제공하도록 삭제, 제거, 추가, 분할, 조합, 및/또는 변경될 수 있다. 이러한 프로세스 또는 블록들 각각은 다양한 상이한 방식으로 구현될 수 있다. 또한, 프로세스들 또는 블록들은 동시에 직렬적으로 수행되는 것으로 나타내어져 있지만, 이들 프로세스 또는 블록들은 병렬적으로 수행되거나, 상이한 때에 될 수도 있다.
본 명세서에 제공되는 본 발명의 교시는, 상기 설명된 시스템뿐만 아니라 다른 시스템들에 적용될 수 있다. 상기 설명한 다양한 실시예들의 구성요소들과 작용들은 조합되어 또 다른 실시예들을 제공할 수 있다.
첨부 파일에 열거될 수 있는 어떠한 것들도 포함하여, 상기 언급한 임의의 특허 및 출원서 및 기타의 참조들은 본 명세서에 참조로 포함된다. 본 발명의 양태들은 필요하다면 변경되어, 또 다른 본 발명의 실시예들을 제공하도록 상기 언급한 다양한 참조들의 시스템, 기능, 및 개념들을 채용할 수 있다.
이러한 다른 변경예들은 상기 상세한 설명부를 조명하여 본 발명에 대하여 이루어질 수 있다. 상기 설명은 본 발명의 특정 실시예들을 설명하고, 예기되는 최선의 모드를 설명하지만, 상기 텍스트에서 아무리 상세하게 표현되더라도, 본 발명은 많은 방법으로 실시될 수 있다. 데이터 집합과 처리 시스템의 세부사항들은 그 세부적인 구현에 있어서 크게 다를 수 있으나, 본 명세서에 개시된 본 발명에 여전히 포함되는 것이다. 상기 언급한 바와 같이, 본 발명의 특정한 특징 또는 양태들을 설명하면서 사용되는 특정한 전문용어는, 그 전문용어가 관련되는 본 발명의 임의의 특정한 특징, 특성, 또는 양태들에 제한되는 것으로 전문용어가 재정의되는 것을 의미하도록 취해져서는 아니 된다. 일반적으로, 이하의 청구범위에서 사용되는 용어들은 상기 상세한 설명부에서 명시적으로 정의하지 않는 한, 명세서 에 개시된 특정 실시예들에 본 발명을 제한하는 것으로 해석되어서는 아니 된다. 따라서, 본 발명의 실제 범주는 개시된 실시예들뿐만 아니라 청구범위 하에서 본 발명을 실시 또는 구현하는 모든 균등물도 포함한다.
본 발명의 특정한 양태들을 특정한 청구범위 형태로 이하에 제공하지만, 본 발명자들은 임의의 수의 청구항 형태로 본 발명의 다양한 양태들을 상정한다. 예를 들어, 다수의 본 발명의 양태들이 컴퓨터 판독가능 매체의 형태로 실시될 수 있다. 따라서, 본 발명자들은 본 발명의 다른 양태들에 대한 그러한 추가의 청구범위 형태들을 따르도록 본 출원서의 출원 후에 추가 청구항을 추가할 권리를 유보한다.

Claims (25)

  1. 언어 훈련 시스템으로서,
    다수의 어휘 항목들을 저장하는 하나 이상의 집합 및 부분집합 데이터베이스;
    하나 이상의 해당하는 집합 및 부분집합 데이터베이스로부터의 다수의 어휘 항목들을 저장하는 항목 빈도 데이터베이스 - 항목 중요도 데이터베이스의 다수의 어휘 항목들은 선택된 집합들 및/또는 해당하는 부분집합들 내에서의 발생 빈도의 순서로 순위가 매겨짐 -;
    (a) 응답용으로 하나 이상의 집합 및 부분집합으로부터의 일련의 어휘 항목들을 사용자에게 제시하고, (b) 제시된 어휘 항목들에 관련된 사용자 입력을 수신 및 처리하도록 구성되는 사용자 테스팅 컴포넌트;
    각 어휘 항목마다, 하나 이상의 인구통계학적 세부집단 또는 모집단 내의 사용자들과 비교하여, 어휘 항목 인식도 지수, 어휘 항목 지식의 깊이 지수, 및 어휘 항목 보유 지수를 판정하도록 구성되는 교정 컴포넌트; 및
    각 사용자마다 모르는 어휘 항목들의 목표 리스트를 생성하도록 구성되는 학습 시퀀스 컴파일러
    를 포함하는 언어 훈련 시스템.
  2. 제1항에 있어서,
    상기 학습 시퀀스 컴파일러는,
    특정 집합 또는 그 부분집합 내에서의 어휘 항목 중요도 데이터;
    사용자의 어휘 인식도 레벨;
    사용자의 어휘 지식의 깊이 능력; 및
    사용자의 어휘 보유 능력
    에 기초하여 특정 사용자에 대한 목표 리스트를 생성하는 언어 훈련 시스템.
  3. 제1항에 있어서,
    상기 목표 리스트는 특정 집합 또는 부분집합 내에서 모르는 어휘 항목들의 발생 빈도에 순위를 매겨 소팅되는 언어 훈련 시스템.
  4. 제1항에 있어서,
    상기 사용자 테스팅 컴포넌트는 각 어휘 항목마다 Yes/No 판정형 질문 및 다수 선택 판정형 질문을 사용자에게 제시하도록 구성되는 컴퓨터 적응 테스팅 시스템을 포함하는 언어 훈련 시스템.
  5. 제1항에 있어서,
    상기 항목 빈도 데이터베이스의 다수의 어휘 항목들은 또한 하나 이상의 인구통계학적 세부집단 또는 모집단 내의 인식도의 순서로 순위가 매겨지는 언어 훈 련 시스템.
  6. 제1항에 있어서,
    응답용으로 하나 이상의 어휘 항목들을 각 사용자에게 제시하도록 구성되는 하나 이상의 학습 프로그램을 더 포함하며,
    상기 하나 이상의 어휘 항목들은 생성된 사용자 목표 리스트에 기초하여 선택되는 언어 훈련 시스템.
  7. 제6항에 있어서,
    사용자와 상기 하나 이상의 학습 프로그램 간의 상호 작용에 기초하여 입력을 처리하고, 상기 입력을 상기 학습 시퀀스 컴파일러에 전달하도록 구성되는 피드백 컴포넌트를 더 포함하며,
    상기 학습 시퀀스 컴파일러는 상기 피드백 컴포넌트로부터의 입력에 기초하여 갱신된 사용자 목표 리스트를 생성하도록 구성되는 언어 훈련 시스템.
  8. 제6항에 있어서,
    상기 하나 이상의 학습 프로그램은, 퍼스널 컴퓨터, 모바일 통신 장치, 또는 그 외의 전자 장치를 통해 액세스 가능한 학습 프로그램들을 포함하는 언어 훈련 시스템.
  9. 제1항에 있어서,
    상기 교정 컴포넌트는 또한 항목 응답 이론을 이용하여 하나 이상의 인구통계학적 세분집단 또는 모집단에 대한 어휘 항목 인식 누적도수분포곡선(ogive)을 계산하도록 구성되는 언어 훈련 시스템.
  10. 제1항에 있어서,
    하나 이상의 소정의 간격으로 전자 메시징을 통해 해당 사용자들에게 목표 리스트들 또는 그 일부들을 전달하도록 구성되는 통신 컴포넌트를 더 포함하는 언어 훈련 시스템.
  11. 컴퓨터에 의해 구현되는 언어 평가 및 교육을 위한 방법으로서,
    특정 언어 또는 그 서브-도메인의 어휘목록(lexicon) 내에서 사용자의 어휘 인식도 레벨을 판정하는 단계;
    사용자의 인식도 레벨에 기초하여, 모르는 어휘 항목들의 목표 리스트를 작성하는 단계 - 상기 목표 리스트는 특정 어휘목록 내에서 모르는 어휘 항목들의 중요도에 순위를 매겨 소팅됨 -; 및
    상기 목표 리스트에 기초하여 사용자에 대한 개인 언어 학습 시퀀스를 생성하는 단계
    를 포함하는 방법.
  12. 제11항에 있어서,
    상기 사용자에 대한 개인 언어 학습 시퀀스를 생성하는 단계는,
    상기 어휘 목록의 코퍼스 또는 서브-도메인 내에서 각각의 특정 어휘 항목의 중요도를 판정하는 단계;
    사용자에 관련된 하나 이상의 인구통계학적 세부집단 또는 모집단에 대하여 누적 어휘 인식 누적도수분포곡선(ogive)을 판정하는 단계;
    사용자에 관련된 하나 이상의 인구통계학적 세부집단 또는 모집단에 대하여 하나 이상의 누적 어휘 지식의 깊이 누적도수분포곡선을 판정하는 단계;
    사용자에 관련된 하나 이상의 인구통계학적 세부집단 또는 모집단에 대하여 누적 어휘 보유 누적도수분포곡선을 판정하는 단계;
    언어 또는 그 서브-도메인에 대한 사용자의 어휘 인식도를 판정하는 단계;
    사용자의 어휘 지식의 깊이 능력을 판정하는 단계; 및
    사용자의 어휘 보유 능력을 판정하는 단계
    를 포함하는 방법.
  13. 제11항에 있어서,
    상기 사용자의 어휘 인식도 레벨을 판정하는 단계는,
    식별용으로 일련의 실제 어휘 항목들 및 의사 어휘 항목들을 사용자에게 제시하는 단계 - 상기 의사 어휘 항목들은 오차 수정의 추측에 사용되는 거짓 어휘 항목들을 포함함 -; 및
    사용자로부터의 응답들을 처리하여 (a) 사용자가 아는 것으로서 식별되는 어휘 항목들과, (b) 사용자가 모르는 것으로서 식별되는 어휘 항목들을 판정하는 단계
    를 포함하는 방법.
  14. 제13항에 있어서,
    사용자의 인구통계학적 정보, 식별용으로 제시되는 각각의 실제 어휘 항목 및 의사 어휘 항목, 및 제시된 어휘 항목들에 대한 각각의 사용자 응답 중 하나 이상을 데이터베이스에 저장하는 단계; 및
    저장된 사용자 데이터를 다른 사용자들로부터의 데이터와 취합하여 하나 이상의 특정 인구통계학적 세부집단 또는 모집단에 대하여 각 어휘 항목마다 표준 인식도 팩터를 판정하는 단계
    를 더 포함하는 방법.
  15. 제11항에 있어서,
    상기 사용자의 어휘 인식도 레벨을 판정하는 단계는,
    (a) 식별용으로 제1 어휘 항목을 사용자에게 제시하는 단계 - 상기 제1 어휘 항목은 사용자의 인구통계학적 세부집단에 대하여 소정의 레벨의 인식도를 갖는 일군의 어휘 항목들에서 선택됨 -;
    (b) 사용자의 응답에 기초하여, 식별용으로 제2 어휘 항목을 사용자에게 제시하는 단계 - 상기 제2 어휘 항목은 상기 소정의 레벨의 위 또는 아래에 설정된 레벨의 인식도를 가짐 -;
    (c) 식별용으로 후속하는 어휘 항목들을 사용자에게 제시하는 단계 - 상기 후속하는 어휘 항목들은 추정된 사용자의 능력에 비하여 더 높은 인식도 및/또는 더 낮은 인식도를 갖는 하나 이상의 추가 어휘 항목들의 선택을 통계적으로 판정함으로써 선택되며, 의사 어휘 항목들은 사용자의 개별 추측 행동을 제어하기 위해 실제 어휘 항목들의 제시 내에서 랜덤하게 분산됨 -; 및
    (d) 사용자가 적어도 하나의 실제 어휘 항목을 인식되는 것으로서 식별하고, 또한 적어도 하나의 실제 어휘 항목을 인식되지 않는 것으로 식별할 때까지 단계 (b) 및 단계 (c)를 반복하는 단계
    를 포함하는 방법.
  16. 제11항에 있어서,
    (a) 사용자의 추정된 지식의 깊이 능력 레벨로 일련의 지식의 깊이 질의에서 선택되는 제1 어휘 지식의 깊이 질의를 제시하는 단계 - 상기 추정된 지식의 깊이 능력은 사용자의 평가된 인식도 레벨에 기초함-;
    (b) 사용자로부터의 제1 질의에 대한 응답을 처리하여, 사용자의 개정된 추 정 지식의 깊이 능력을 통계적으로 판정하는 단계;
    (c) 하나 이상의 후속하는 지식의 깊이 질의를 사용자에게 제시하는 단계 - 상기 하나 이상의 후속하는 지식의 깊이 질의는 개정된 추정 지식의 깊이 능력에 기초하여 선택됨 -; 및
    (d) 사용자의 어휘 지식의 깊이 능력이 소망하는 정확도 내에서 판정될 때까지 단계 (b) 및 (c)를 반복하는 단계
    에 의해 사용자의 어휘 지식의 깊이 능력을 판정하는 단계를 더 포함하는 방법.
  17. 제11항에 있어서,
    상기 어휘 항목들은 심볼, 멀티 심볼 유닛, 소리, 발성, 단어, 멀티 워드 유닛, 또는 어휘목록 내에서 특정 의미를 갖는 관용적 표현을 포함하는 방법.
  18. 제11항에 있어서,
    상기 목표 리스트는 특정 어휘목록 내에서 학습되어야 하는 다음으로 가장 중요한 단어의 집합을 포함하는 방법.
  19. 제11항에 있어서,
    다수의 테스팅 주기로 사용자의 어휘 인식도 레벨을 판정하고 상기 어휘 인식도 레벨에 기초하여 모르는 어휘 항목들의 목표 리스트를 작성하는 것을 반복하는 단계;
    하나 이상의 테스팅 주기로부터의 결과에 기초하여 사용자의 언어 학습 시퀀스를 갱신하는 단계
    를 더 포함하는 방법.
  20. 제11항에 있어서,
    사용자의 어휘 능력에 기초하여 사용자의 텍스트 자료를 생성하는 단계를 더 포함하며,
    상기 텍스트 자료는 읽기 자료, 듣기 자료, 및 비디오 자료를 포함할 수 있는 방법.
  21. 제11항에 있어서,
    텍스트 자료를 사용자에게 제시하기 전에 텍스트 자료를 필터링하는 단계를 더 포함하며,
    필터링된 텍스트 자료의 어휘 항목들의 설정된 목표 백분율은 미리 설정될 수 있는 방법.
  22. 제11항에 있어서,
    하나 이상의 소정의 간격으로 전자 메시징을 통해 사용자에게 언어 학습 시퀀스 또는 그 일부를 전달하는 단계를 더 포함하는 방법.
  23. 제11항에 있어서,
    상기 언어 학습 시퀀스에 기초하여 하나 이상의 보고서를 생성하는 단계를 더 포함하며,
    상기 하나 이상의 보고서는,
    사용자가 아는 어휘 항목들의 그래픽 기재 및 텍스트 기재;
    어휘목록의 코퍼스 또는 서브-도메인 내에서 사용자가 아는 어휘 항목의 수 및 모르는 어휘 항목의 수;
    각각의 모르는 어휘 항목의 식별정보;
    어휘목록의 코퍼스 또는 서브-도메인의 상이한 중요도 대역 또는 빈도 대역 내에서 아는 어휘 항목의 수 및 모르는 어휘 항목의 수;
    어휘목록의 항목들에 대한 사용자의 지식의 깊이 능력;
    어휘목록의 항목들에 대한 사용자의 보유 능력;
    하나 이상의 학습 프로그램과의 상호작용에 기초한 사용자의 학습율; 및
    임의의 특정한 보고된 사용자 또는 그룹 속성과 하나 이상의 소망하는 그룹, 인구통계학적 세분집단 또는 모집단의 동등한 속성들과의 비교
    중 임의의 하나 이상을 포함하는 방법.
  24. 언어 교육 시스템으로서,
    코퍼스 또는 해당하는 서브-도메인 내의 다수의 어휘 항목들을 저장하는 수 단;
    상기 코퍼스 및/또는 해당하는 서브-도메인 내에서 중요도의 순서로 다수의 어휘 항목들에 순위를 매기는 수단;
    응답용으로 각 사용자마다 다수의 어휘 항목들 중 적어도 일부를 제시하는 것에 응답하여 사용자 입력을 수신 및 처리하는 수단;
    각 사용자마다, 소정의 인구통계학적 세부집단 또는 모집단 내의 다른 사용자들과 비교하여, 어휘 인식도 지수, 어휘 지식의 깊이 지수, 및 어휘 보유 지수를 계산하는 수단; 및
    각 사용자마다 모르는 어휘 항목들의 목표 리스트를 생성하는 수단
    을 포함하는 언어 교육 시스템.
  25. 의미론적 지식 평가 및 교육 시스템 - 상기 시스템은 다수의 어휘 항목들을 저장하기 위한 항목 중요도 데이터베이스를 포함하며, 저장된 다수의 어휘 항목들은 선택된 코퍼스 및/또는 해당하는 서브-도메인 내에서 중요도의 순서로 순위가 매겨짐 - 으로서,
    식별용으로 선택된 코퍼스 및/또는 서브-도메인으로부터 일련의 어휘 항목들을 사용자에게 제시하고, 제시된 각각의 어휘 항목에 대한 사용자 입력을 수신 및 처리하도록 구성되는 컴퓨터 적응 테스팅 컴포넌트;
    각 사용자마다, 하나 이상의 인구통계학적 세부집단 또는 모집단 내의 사용자들과 비교하여, 어휘 인식도 레벨, 다수의 어휘 항목 지식의 깊이 지수, 및 다수 의 어휘 항목 보유 지수를 판정하도록 구성되는 교정 컴포넌트; 및
    각 사용자마다 하나 이상의 모르는 어휘 항목들을 포함하는 개인 언어 학습 시퀀스를 생성하도록 구성되는 언어 시퀀스 컴파일러 - 선택된 어휘 항목들은 특정 코퍼스 및/또는 서브-도메인 내에서 차례로 학습되어야 하는 항목의 우선순위에 따라 편성됨 -
    를 포함하는 의미론적 지식 평가 및 교육 시스템.
KR1020077025691A 2005-04-05 2006-04-05 의미론적 지식의 평가, 교육, 및 습득을 위한 시스템 및방법 KR100919912B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US66876405P 2005-04-05 2005-04-05
US60/668,764 2005-04-05

Publications (2)

Publication Number Publication Date
KR20080014762A KR20080014762A (ko) 2008-02-14
KR100919912B1 true KR100919912B1 (ko) 2009-10-06

Family

ID=37254622

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020077025691A KR100919912B1 (ko) 2005-04-05 2006-04-05 의미론적 지식의 평가, 교육, 및 습득을 위한 시스템 및방법

Country Status (7)

Country Link
US (1) US20110076653A1 (ko)
EP (1) EP1872353A2 (ko)
JP (1) JP4908495B2 (ko)
KR (1) KR100919912B1 (ko)
CN (1) CN101203895A (ko)
TW (1) TW200709120A (ko)
WO (2) WO2006121542A2 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160143503A (ko) * 2015-06-05 2016-12-14 주식회사 한국리서치 분석 대상에 대한 고객의 니즈를 분석하는 방법 및 장치

Families Citing this family (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8439684B2 (en) * 2005-08-31 2013-05-14 School Specialty, Inc. Method of teaching reading
EP1802155A1 (en) 2005-12-21 2007-06-27 Cronto Limited System and method for dynamic multifactor authentication
US8396331B2 (en) * 2007-02-26 2013-03-12 Microsoft Corporation Generating a multi-use vocabulary based on image data
JP5029090B2 (ja) * 2007-03-26 2012-09-19 Kddi株式会社 能力推定システムおよび方法ならびにプログラムおよび記録媒体
US8457544B2 (en) 2008-12-19 2013-06-04 Xerox Corporation System and method for recommending educational resources
US8699939B2 (en) 2008-12-19 2014-04-15 Xerox Corporation System and method for recommending educational resources
US8725059B2 (en) 2007-05-16 2014-05-13 Xerox Corporation System and method for recommending educational resources
US20090087822A1 (en) * 2007-10-02 2009-04-02 Neurolanguage Corporation Computer-based language training work plan creation with specialized english materials
GB2465585A (en) * 2008-11-21 2010-05-26 Sharp Kk Method and system for vocabulary learning by study word selection
US20100143873A1 (en) * 2008-12-05 2010-06-10 Gregory Keim Apparatus and method for task based language instruction
WO2010065984A1 (en) * 2008-12-10 2010-06-17 Ahs Holdings Pty Ltd Development monitoring method and system
US8517739B2 (en) * 2009-11-10 2013-08-27 Johannes Alexander Dekkers Method to teach a dyslexic student how to read, using individual word exercises based on custom text
US8768241B2 (en) 2009-12-17 2014-07-01 Xerox Corporation System and method for representing digital assessments
KR101095069B1 (ko) * 2010-02-03 2011-12-20 고려대학교 산학협력단 사용자 관심 주제를 추출하는 휴대용 통신 단말기 및 그 방법
KR101148164B1 (ko) * 2010-05-18 2012-05-23 경희대학교 산학협력단 사용자 사용 단어에 기반한 사용자의 주관적 웰빙 상태 판단 방법
US8521077B2 (en) 2010-07-21 2013-08-27 Xerox Corporation System and method for detecting unauthorized collaboration on educational assessments
DE102010046439A1 (de) * 2010-09-24 2012-03-29 Belingoo Media Group S. A. System und Verfahren für relevanzbasiertes Kategorisieren und zeitnahes Lernen von Vokabeln
US20120208166A1 (en) * 2011-02-16 2012-08-16 Steve Ernst System and Method for Adaptive Knowledge Assessment And Learning
KR101178310B1 (ko) * 2011-02-24 2012-08-29 포항공과대학교 산학협력단 대화 관리 방법 및 이를 실행하는 시스템
US20130212095A1 (en) * 2012-01-16 2013-08-15 Haim BARAD System and method for mark-up language document rank analysis
US11734712B2 (en) 2012-02-24 2023-08-22 Foursquare Labs, Inc. Attributing in-store visits to media consumption based on data collected from user devices
US8972357B2 (en) 2012-02-24 2015-03-03 Placed, Inc. System and method for data collection to validate location data
US8768876B2 (en) 2012-02-24 2014-07-01 Placed, Inc. Inference pipeline system and method
CN103680261B (zh) * 2012-08-31 2017-03-08 英业达科技有限公司 词汇学习系统及其方法
KR101616909B1 (ko) * 2012-10-31 2016-04-29 에스케이텔레콤 주식회사 자동 채점 장치 및 방법
CN104282193B (zh) * 2013-07-11 2017-03-01 尤菊芳 客制化语言学习辅助卡的方法及选字方法
US9443326B2 (en) * 2013-12-10 2016-09-13 Microsoft Technology Licensing, Llc Semantic place labels
WO2015112250A1 (en) * 2014-01-22 2015-07-30 Speak Agent, Inc. Visual-kinesthetic language construction
US11222044B2 (en) 2014-05-16 2022-01-11 Microsoft Technology Licensing, Llc Natural language image search
KR101631374B1 (ko) * 2014-08-27 2016-06-16 김현옥 메타인지 능력 향상을 위한 수학학습 시스템 및 방법
US10423983B2 (en) 2014-09-16 2019-09-24 Snap Inc. Determining targeting information based on a predictive targeting model
US20160293045A1 (en) * 2015-03-31 2016-10-06 Fujitsu Limited Vocabulary learning support system
US20170178530A1 (en) * 2015-07-27 2017-06-22 Boomwriter Media, Inc. Methods and systems for generating new vocabulary specific assignments using a continuously updated remote vocabulary database
US10817898B2 (en) 2015-08-13 2020-10-27 Placed, Llc Determining exposures to content presented by physical objects
US20170124892A1 (en) * 2015-11-01 2017-05-04 Yousef Daneshvar Dr. daneshvar's language learning program and methods
CN105354188A (zh) * 2015-11-18 2016-02-24 成都优译信息技术有限公司 用于翻译教学系统的批量评分方法
US9975241B2 (en) * 2015-12-03 2018-05-22 Intel Corporation Machine object determination based on human interaction
US10691999B2 (en) 2016-03-16 2020-06-23 Maluuba Inc. Parallel-hierarchical model for machine comprehension on small data
US10650621B1 (en) 2016-09-13 2020-05-12 Iocurrents, Inc. Interfacing with a vehicular controller area network
JP6705506B2 (ja) 2016-10-04 2020-06-03 富士通株式会社 学習プログラム、情報処理装置および学習方法
CN106548787B (zh) * 2016-11-01 2019-07-09 云知声(上海)智能科技有限公司 优化生词的评测方法及评测系统
US10319255B2 (en) * 2016-11-08 2019-06-11 Pearson Education, Inc. Measuring language learning using standardized score scales and adaptive assessment engines
EP3725594B1 (en) * 2017-12-15 2024-03-06 NIO (Anhui) Holding Co., Ltd. Vehicle function broadcasting method and apparatus, and vehicle-mounted intelligent controller
KR101996249B1 (ko) * 2018-04-23 2019-07-04 (주)뤼이드 개인 맞춤형 교육 컨텐츠를 제공하기 위한 기계학습 프레임워크 운용 방법, 장치 및 컴퓨터 프로그램
KR102157937B1 (ko) * 2018-06-18 2020-09-18 최상덕 언어 학습을 지원하기 위한 방법, 시스템 및 비일시성의 컴퓨터 판독 가능한 기록 매체
CN108847076A (zh) * 2018-07-11 2018-11-20 北京美高森教育科技有限公司 语言学习机的测评方法
CN109033088B (zh) * 2018-09-04 2023-05-30 北京先声智能科技有限公司 一种基于神经网络的第二语言习得模型
US20210256861A1 (en) * 2020-02-14 2021-08-19 ARH Technologies, LLC Electronic infrastructure for digital content delivery and/or online assessment management
CN111680157A (zh) * 2020-06-05 2020-09-18 北京市商汤科技开发有限公司 数据处理方法、装置、设备及计算机存储介质
CN111700611B (zh) * 2020-06-16 2022-11-29 中国科学院深圳先进技术研究院 顿悟能力评估方法及相关设备
WO2021260762A1 (ja) * 2020-06-22 2021-12-30 日本電信電話株式会社 語彙数推定装置、語彙数推定方法、およびプログラム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030039334A (ko) * 2003-02-10 2003-05-17 이태희 검색어의 의미론적 연관성 정보를 이용하는 정보검색장치 및 방법

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3820421B2 (ja) * 1995-10-03 2006-09-13 圭介 高森 学習装置
US5954516A (en) * 1997-03-14 1999-09-21 Relational Technologies, Llc Method of using question writing to test mastery of a body of knowledge
US6482011B1 (en) * 1998-04-15 2002-11-19 Lg Electronics Inc. System and method for improved learning of foreign languages using indexed database
JP2000284680A (ja) * 1999-03-31 2000-10-13 Seiko Instruments Inc 語彙学習機能付き電子辞書
US20020119433A1 (en) * 2000-12-15 2002-08-29 Callender Thomas J. Process and system for creating and administering interview or test
US7386453B2 (en) * 2001-11-14 2008-06-10 Fuji Xerox, Co., Ltd Dynamically changing the levels of reading assistance and instruction to support the needs of different individuals
US8798518B2 (en) * 2004-06-30 2014-08-05 Educational Testing Service Method and system for calibrating evidence models
WO2006012565A2 (en) * 2004-07-22 2006-02-02 Leapfrog Enterprises, Inc. Interactive foreign language teaching device and method

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030039334A (ko) * 2003-02-10 2003-05-17 이태희 검색어의 의미론적 연관성 정보를 이용하는 정보검색장치 및 방법

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160143503A (ko) * 2015-06-05 2016-12-14 주식회사 한국리서치 분석 대상에 대한 고객의 니즈를 분석하는 방법 및 장치
KR102487672B1 (ko) * 2015-06-05 2023-01-13 주식회사 한국리서치 분석 대상에 대한 고객의 니즈를 분석하는 방법 및 장치

Also Published As

Publication number Publication date
EP1872353A2 (en) 2008-01-02
JP2008547038A (ja) 2008-12-25
CN101203895A (zh) 2008-06-18
JP4908495B2 (ja) 2012-04-04
WO2006121542A2 (en) 2006-11-16
WO2007007201A2 (en) 2007-01-18
WO2006121542A8 (en) 2008-05-22
US20110076653A1 (en) 2011-03-31
TW200709120A (en) 2007-03-01
KR20080014762A (ko) 2008-02-14
WO2007007201A8 (en) 2007-07-05

Similar Documents

Publication Publication Date Title
KR100919912B1 (ko) 의미론적 지식의 평가, 교육, 및 습득을 위한 시스템 및방법
Tipton et al. A review of statistical methods for generalizing from evaluations of educational interventions
CN107230174B (zh) 一种基于网络的在线互动学习系统和方法
Mayfield et al. LightSIDE: Open source machine learning for text
Hasibuan et al. Model Detecting Learning Styles with Artificial Neural Network.
Gluck Exploring the relationship between user satisfaction and relevance in information systems
US8166032B2 (en) System and method for sentiment-based text classification and relevancy ranking
US20110270883A1 (en) Automated Short Free-Text Scoring Method and System
US20090226872A1 (en) Electronic grading system
US20090198488A1 (en) System and method for analyzing communications using multi-placement hierarchical structures
Deane et al. Exploring the feasibility of using writing process features to assess text production skills
Wind et al. The influence of rater effects in training sets on the psychometric quality of automated scoring for writing assessments
CN114913729B (zh) 一种选题方法、装置、计算机设备和存储介质
Stamatatos et al. Plagiarism and authorship analysis: introduction to the special issue
CN113656687B (zh) 基于教研数据的教师画像构建方法
Jin et al. Detecting rater centrality effects in performance assessments: A model-based comparison of centrality indices
Clarke et al. Developing shared ways of seeing data: the perils and possibilities of achieving intercoder agreement
Jimenez et al. ProficiencyRank: Automatically ranking expertise in online collaborative social networks
Wichmann et al. Cross-linguistic conditions on word length
Hecht et al. Modeling booklet effects for nonequivalent group designs in large-scale assessment
Hasibuan et al. Detecting learning style based on level of knowledge
Çakar The use of qualitative content analysis in hospitality and tourism
Han et al. An item-based, Rasch-calibrated approach to assessing translation quality
Wu Using item response theory as a tool in educational measurement
Lim et al. So you want to publish in a premier journal? An illustrative guide on how to develop and write a quantitative research paper for premier journals

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120925

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20130429

Year of fee payment: 5

LAPS Lapse due to unpaid annual fee