KR102592553B1 - 수준별 언어 처리 모델을 이용한 맞춤형 영어 교육 방법 및 장치 - Google Patents

수준별 언어 처리 모델을 이용한 맞춤형 영어 교육 방법 및 장치 Download PDF

Info

Publication number
KR102592553B1
KR102592553B1 KR1020230004006A KR20230004006A KR102592553B1 KR 102592553 B1 KR102592553 B1 KR 102592553B1 KR 1020230004006 A KR1020230004006 A KR 1020230004006A KR 20230004006 A KR20230004006 A KR 20230004006A KR 102592553 B1 KR102592553 B1 KR 102592553B1
Authority
KR
South Korea
Prior art keywords
english
level
learner
language processing
model
Prior art date
Application number
KR1020230004006A
Other languages
English (en)
Inventor
이정훈
Original Assignee
이정훈
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 이정훈 filed Critical 이정훈
Priority to KR1020230004006A priority Critical patent/KR102592553B1/ko
Application granted granted Critical
Publication of KR102592553B1 publication Critical patent/KR102592553B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Primary Health Care (AREA)
  • Evolutionary Computation (AREA)
  • Strategic Management (AREA)
  • Mathematical Physics (AREA)
  • General Business, Economics & Management (AREA)
  • Medical Informatics (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Molecular Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)

Abstract

본 발명은 맞춤형 영어 교육 방법 및 장치에 관한 것이다. 본 발명은 방대한 데이터로 사전 학습된 자연어 처리 모델과 수준별로 학습되는 복수의 언어 모델을 이용하여 학습자가 인공지능과 자연스럽게 영어로 대화할 수 있도록 한다. 그리고 학습자의 학습 레벨에 따라 우선적으로 출력되는 수준별 영어 문자열이 달라지므로, 인공지능이 학습자의 영어 수준에 맞춰 수준별로 대화가 가능하고, 학습자가 수준별 영어 문자열을 확인하여 다양한 피드백을 받을 수 있다.

Description

수준별 언어 처리 모델을 이용한 맞춤형 영어 교육 방법 및 장치{METHOD FOR CUSTOMIZED ENGLISH EDUCATION USING LEVEL-SPECIFIC NATURAL LANGUAGE PROCESSING MODEL AND APPARATUS THEREFOR}
본 발명은 맞춤형 영어 교육 방법 및 장치에 관한 것이다.
영어는 큰 영향력을 가지는 언어 중 하나로서, 세계에서 통용 범위가 가장 넓은 언어에 해당한다. 더욱이, 정보화 및 세계화의 흐름으로 인해 영어의 중요성은 그 어느 때보다도 커지고 있다. 이에 여러 교육 기관에서는 효과적인 영어 교육을 위해 다양한 방식의 영어 학습 방법을 개발하고 있다.
그러나 방식의 차이가 있다고 하더라도, 영어 학습은 어디까지나 교육의 과정으로서 이루어지고 있는 상황이다. 언어는 상황 속에서 자연스럽게 타인과 의사를 소통하며 익혀야 하지만, 영어를 모국어로 사용하지 않는 나라에서 자연스럽게 영어를 사용하는 상황을 만들기가 무척이나 어렵기 때문이다.
영어를 사용하는 상황을 의도적으로 만들어, 영어 선생님과 대화하거나 채팅을 하는 영어 교육 방식도 제안되었다. 그러나 이러한 방식은 학습자가 영어 선생님의 답변에 의한 일방적인 피드백을 받는 방식이라는 한계가 있다. 따라서 학습자는 자신의 영어 수준에 맞춰 상황별로 다양한 피드백을 받기가 어려웠다.
대한민국 공개특허공보 제10-2022-0109800호 "대화형 교육 서비스를 제공하는 전자 장치 및 그 동작 방법"
본 발명은 학습자가 자신의 영어 수준에 맞춰 자연스럽게 상황별로 다양한 피드백을 제공받을 수 있는 영어 교육 서비스를 제공한다.
본 발명에 따른 수준별 언어 처리 모델을 이용한 맞춤형 영어 교육 방법은 (1) 학습자의 개인정보와 듣기, 쓰기, 및 말하기 분야를 포함하는 영어 테스트 결과를 수신하는 단계; (2) 영어 테스트 결과를 사용하여 학습 레벨을 설정하는 단계; 및 (3) 개인정보, 테스트 결과, 학습 레벨, 및 영어 문자열을 수준별 언어 처리 모델에 입력하고, 수준별 영어 문자열을 출력하는 단계를 포함한다.
본 발명은 방대한 데이터로 사전 학습된 자연어 처리 모델과 수준별로 학습되는 복수의 언어 모델을 이용하여 학습자가 인공지능과 자연스럽게 영어로 대화할 수 있도록 한다. 그리고 학습자의 학습 레벨에 따라 우선적으로 출력되는 수준별 영어 문자열이 달라지므로, 인공지능이 학습자의 영어 수준에 맞춰 수준별로 대화가 가능하고, 학습자가 수준별 영어 문자열을 확인하여 다양한 피드백을 받을 수 있다.
여기에 직접적으로 기재되지 않은 효과라도, 발명의 설명에 의해 예상되거나 기대되는 효과는 발명의 효과에 기재된 것으로 이해되어야 한다.
도 1은 본 발명의 실시예에 따른 맞춤형 영어 교육 방법의 아이디어를 나타내는 도면이다.
도 2는 본 발명의 실시예에 따른 맞춤형 영어 교육 방법의 구성을 나타내는 도면이다.
도 3은 본 발명의 실시예에 따른 맞춤형 영어 교육 방법에서 학습 레벨을 설정하는 구성을 나타내는 도면이다.
도 4는 본 발명의 실시예에 따른 맞춤형 영어 교육 방법에서 수준별 언어 처리 모델의 구성을 나타내는 도면이다.
도 5는 본 발명의 실시예에 따른 맞춤형 영어 교육 방법에서 복수의 인공 신경망 모델의 구성을 나타내는 도면이다.
도 6은 본 발명의 실시예에 따른 맞춤형 영어 교육 방법에서 학습 데이터의 구성을 나타내는 도면이다.
도 7은 본 발명의 실시예에 따른 맞춤형 영어 교육 방법에서 제1언어 모델이 학습하는 모습을 나타내는 도면이다.
도 8은 본 발명의 실시예에 따른 맞춤형 영어 교육 방법에서 제2언어 모델이 학습하는 모습을 나타내는 도면이다.
도 9 및 도 10은 본 발명의 실시예에 따른 맞춤형 영어 교육 방법에서 언어 모델별로 출력하는 수준별 영어 문자열을 나타내는 도면이다.
본 발명은 발명의 설명에서 기재하는 실시예로 한정되지 않고 다양하게 구현될 수 있다. 발명의 설명에서 사용하는 용어는 실시예를 설명하기 위한 것으로, 본 발명을 한정하려는 의도로 사용하는 것이 아니다. 발명의 설명에서 '포함하다'의 용어는 기재된 특징이 조합된 구성이 존재함을 지정하려는 것이다. 그러므로 하나 또는 그 이상의 다른 특징이나 이들을 조합한 구성의 존재 또는 부가 가능성을 배제하지 않는 것으로 이해되어야 한다. 이하에서는 본 발명이 속한 분야의 기술자에게 명백한 내용으로서 공개된 구성이나 기능에 대한 상세한 설명은 생략한다.
본 발명의 실시예에 따른 수준별 언어 처리 모델을 이용한 맞춤형 영어 교육 방법(이하에서는'맞춤형 영어 교육 방법'이라 함)은 사전 학습된 자연어 처리 모델과 복수의 언어 모델을 이용하여 학습자의 영어 수준에 맞춰 상황별로 자연스럽게 다양한 피드백을 제공할 수 있는 영어 교육 서비스에 관한 것이다.
도 1은 본 발명의 실시예에 따른 맞춤형 영어 교육 방법의 아이디어를 나타내는 도면이다. 도 1을 참조하면, 본 발명의 실시예에 따른 맞춤형 영어 교육 방법은 초급(Beginner), 중급(Intermediate), 및 고급(Advanced) 수준을 가지는 인공지능이 학습자의 영어 수준에 맞춰 학습자와 자연스럽게 영어로 대화할 수 있도록 한다. 따라서 학습자는 자신의 영어 수준에 맞는 인공지능과 상황 속에서 대화하며 자연스럽게 영어를 학습할 수 있다. 또한, 학습자는 자신의 영어 수준과 다른 수준을 가지는 인공지능의 답변을 확인할 수 있어, 상황별로 다양한 피드백을 받을 수 있다.
도 2는 본 발명의 실시예에 따른 맞춤형 영어 교육 방법의 구성을 나타내는 도면이다. 도 2를 참조하면, 본 발명의 실시예에 따른 맞춤형 영어 교육 방법은 (1) 학습자의 개인정보와 듣기, 쓰기, 및 말하기 분야를 포함하는 영어 테스트 결과를 수신하는 단계(S100), (2) 테스트 결과를 사용하여 학습 레벨을 설정하는 단계(S200), 및 (3) 개인정보, 테스트 결과, 학습 레벨, 및 영어 문자열을 수준별 언어 처리 모델에 입력하고, 수준별 영어 문자열을 출력하는 단계(S300)를 포함한다. 각각의 단계는 컴퓨팅 디바이스에 의해 수행될 수 있으며, 각각의 단계에 대한 설명에서 주어가 생략될 수 있다. 여기서, 컴퓨팅 디바이스는 데이터의 연산 및 저장을 수행하여 데이터 처리가 가능한 디바이스이다.
(1) 단계(S100)에서는 학습자의 개인정보와 듣기, 쓰기, 및 말하기 분야를 포함하는 영어 테스트 결과를 수신한다. 개인정보는 학습자의 성별, 나이, 주소, 영어 학습 기간, 및 영어권 국가 거주 기간을 포함한다. 본 발명에서는 학습자의 개인정보와 영어 테스트 결과를 학습자의 영어 수준을 판단하는데 사용한다. 이때, 학습자의 영어 수준을 종합적으로 판단하기 위해 듣기, 쓰기, 및 말하기 분야를 포함하는 영어 테스트 결과를 사용한다. 실시예에 따라서, 영어 테스트 결과는 외부 데이터를 참조할 수 있다. 따라서 토익(TOEIC), 토플(TOEFL), 텝스(TEPS), 및 아이엘츠(IELTS)와 같은 공인 영어 시험의 결과를 참조할 수 있다.
(2) 단계(S200)에서는 영어 테스트 결과를 사용하여 학습 레벨을 설정한다. 학습 레벨은 학습자의 영어 수준을 판단하기 위한 변수이다. 또한, 학습 레벨은 학습자의 수준에 맞는 수준별 영어 문자열을 우선적으로 출력하기 위해 사용되는 변수이다. 구체적으로, 학습 레벨은 후술하는 수준별 언어 처리 모델의 입력 변수로서, 학습자의 영어 수준을 판단하는 분류 모델의 분류 성능을 향상시키기 위해 영어 테스트 결과를 전처리(Preprocessing) 한 변수이다.
도 3은 본 발명의 실시예에 따른 맞춤형 영어 교육 방법에서 학습 레벨을 설정하는 구성을 나타내는 도면이다. 도 3을 참조하면, (2) 단계(S200)에서는 개인정보와 매칭되는 유사군을 특정하고, 유사군에 속하는 가상 학습자의 영어 테스트 결과와 비교하여 학습 레벨을 설정한다. 이때, (2) 단계(S200)에서는 유사군 군집 모델에 의해 미리 정해진 수로 군집화된 그룹 중에서 유사군을 특정한다. 개인정보는 다차원의 변수를 포함한다. 따라서 비지도 학습으로 학습되는 유사군 군집 모델을 사용하여 다차원 변수를 포함하는 개인정보를 미리 정해진 수의 그룹으로 분류한다. 이때, 미리 정해진 수는 다양하게 설정될 수 있으며, 실루엣 계수, Rule of Thumb, Elbow Method, 및 정보 기준 접근법(Information Criterion Approach)으로 설정될 수 있다. 개인정보와 매칭되는 유사군은 유사군 군집 모델의 군집화 결과에 따라 학습자의 개인정보가 분류되는 특정 그룹이다. 다시 말해, 유사군은 학습자와 유사한 개인정보를 가지는 여러 학습자가 포함되는 그룹이다.
각각의 유사군에는 개인정보가 유사한 여러 학습자가 포함된다. 이때, 본 발명에서는 유사군에 속하는 가상 학습자의 존재를 설정한다. 가상 학습자는 학습자가 속하는 유사군에서 학습의 목표가 되는 존재이다. 즉, 가상 학습자는 학습자와 선의의 라이벌이 되어, 학습자는 가상 학습자의 영어 수준을 넘는 것을 목표로 하게 된다. 중심극한정리(Central Limit Theory)에 따라, 유사군에 속하는 학습자가 30명 이상이면, 영어 테스트 결과는 확률 변수로서 정규분포로 근사하게 된다. 이때, 가상 학습자는 중심극한정리에 따라 정규분포로 근사하는 영어 테스트 결과의 95% 수준을 가진다. 즉, 가상 학습자는 각각의 유사군마다 평균적으로 95% 수준을 가지게 되므로, 각각의 유사군별로 가상 학습자에게 설정되는 영어 테스트 결과가 달라지게 된다.
학습 레벨은 가상 학습자의 영어 테스트 결과와 학습자의 영어 테스트 결과를 사용하여 결정된다. 구체적으로, 학습 레벨은 아래의 수학식 1에 의해 계산된다.
Figure 112023003927482-pat00001
여기서, L은 학습 레벨, v는 가상 학습자의 영어 테스트 결과값, x는 학습자의 영어 테스트 결과값, 그리고 w는 미리 정해진 가중치임.
영어 테스트 결과는 읽기, 쓰기, 및 말하기 분야를 포함하므로, 각각의 분야별로 가상 학습자와 학습자의 영어 테스트 결과값을 비교하고, 가중치를 곱한다. 이때, 본 발명에서는 ReLU(Rectified Linear Unit) 함수를 사용하여, 학습 레벨이 언제나 0 이상의 값을 가지도록 한다. 음수를 양수로 만들기 위해 제곱을 사용하는 경우, 값이 지나치게 커지는 문제가 발생한다. 또한, 절대값을 이용하는 경우, 학습자의 영어 테스트 결과값이 가상 학습자의 영어 테스트 결과값보다 높은 경우를 분류해낼 수 없게 된다. 따라서 본 발명에서는 수학식에서 ReLU 함수를 사용한다.
이때, (2) 단계(S200)에서는 학습 레벨이 0인 경우, 특정된 유사군보다 상위 수준의 유사군으로 특정한다. 학습 레벨이 0인 경우, 읽기, 쓰기, 및 말하기 분야 모두에서 학습자의 영어 테스트 결과값이 가상 학습자의 영어 테스트 결과값과 같거나 더 높다는 것을 의미한다. 이러한 경우, 그 학습자는 특정된 유사군에서 이상값(Outlier)에 해당하는 것으로 보아 유사군을 다시 특정한다. 즉, 학습자는 이미 특정된 유사군보다 더 높은 영어 수준을 가지므로, 그보다 높은 영어 테스트 결과를 가지는 유사군으로 특정된다. 이때, (2) 단계(S200)에서는 유사군 군집 모델의 군집화 결과에서 기존에 특정된 유사군과 가장 가까우면서, 동시에 가상 학습자의 영어 테스트 결과가 기존에 특정된 유사군의 가상 학습자보다 높은 유사군으로 특정한다.
도 4는 본 발명의 실시예에 따른 맞춤형 영어 교육 방법에서 수준별 언어 처리 모델의 구성을 나타내는 도면이다. 도 4를 참조하면, (3) 단계(S300)에서는 개인정보, 영어 테스트 결과, 학습 레벨, 및 영어 문자열을 수준별 언어 처리 모델에 입력하고, 수준별 영어 문자열을 출력한다. 여기서, 영어 문자열은 학습자가 입력하는 영어 텍스트 데이터이다. 수준별 언어 처리 모델은 여러 입력 변수를 입력 받고, 학습자의 수준에 맞는 수준별 영어 문자열을 출력한다. 따라서 학습자는 자신의 영어 수준에 맞는 인공지능과 자연스럽게 대화하면서 영어를 학습할 수 있게 된다.
수준별 언어 처리 모델은 사전 학습된 자연어 처리 모델 및 복수의 인공 신경망 모델을 포함한다. 본 발명에서는 영어 문자열을 임베딩하는 과정에서 사전 학습된 자연어 처리 모델을 이용한다. 여기서, 임베딩(Embedding)은 데이터를 벡터화하는 것으로서, 컴퓨팅 디바이스가 데이터를 효율적으로 처리할 수 있도록 하는 전처리 과정이다. 이러한 임베딩 과정을 통해 텍스트 데이터를 활용하는 인공지능 모델의 성능을 더욱 향상시킬 수 있다. 특히, 데이터가 충분히 많은 경우, 임베딩이 인공지능 모델의 성능에 큰 영향을 미치므로, 데이터의 특성을 고려한 임베딩 과정이 매우 중요하다.
이하에서는 자연어 처리 모델로서 BERT(Bidirectional Encoder Representations from Transformers) 계열 모델을 사용하는 실시예를 기준으로 설명한다. 그러나 본 발명에서 자연어 처리 모델이 BERT로 한정되는 것은 아니며, 다양한 자연어 처리 모델을 이용할 수 있다. BERT 계열 모델은 전체 문장의 문맥을 반영하여 단어를 임베딩할 수 있다. BERT 계열 모델의 입력 임베딩은 임베딩 레이어(Embedding Layer)를 지난 임베딩 벡터들이고, BERT의 연산을 거친 후의 출력 임베딩은 전체 문장의 문맥을 반영한 임베딩 벡터들이 된다. BERT 계열 모델은 사전 훈련을 위해서 인공 신경망의 입력으로 들어가는 입력 텍스트의 일부 단어를 랜덤으로 마스킹(Masking)한다. 그리고 인공 신경망에게 이 가려진 단어들(Masked words)을 예측하도록 한다. 자연어 처리 모델은 가려진 부분에 가장 확률이 높은 단어들을 출력한다. 이를 정확하게 복구할 때까지 자연어 처리 모델의 가중치를 변경하며 학습한다.
실시예에 따라서, (3) 단계(S300)에서는 영어 문자열을 토큰화(Tokenization)한다. 임베딩을 위해 먼저 텍스트 데이터를 전처리해야 하는데, 데이터를 토큰(Token) 단위로 나누는 작업을 토큰화라고 한다. 본 발명에서는 영어 문자열을 토큰화하므로, 단어 토큰화(Word Tokenization)를 수행한다. 이때, 토큰화를 수행하는 토크나이저는 하나의 단어를 더 작은 단위의 여러 서브 워드로 분리하는 서브 워드 토크나이저일 수 있다.
도 5는 본 발명의 실시예에 따른 맞춤형 영어 교육 방법에서 복수의 인공 신경망 모델의 구성을 나타내는 도면이다. 도 5를 참조하면, 복수의 인공 신경망 모델은 학습자의 영어 수준에 대한 확률 벡터를 출력하는 분류 모델, 초급 학습 데이터로 학습하는 제1언어 모델, 중급 학습 데이터로 학습하는 제2언어 모델, 및 고급 학습 데이터로 학습하는 제3언어 모델을 포함한다. 분류 모델은 입력 변수들을 사용하여 학습자의 영어 수준을 판단한다. 여기서, 영어 수준은 초급, 중급, 및 고급으로 분류된다. 구체적으로, 분류 모델은 개인정보, 테스트 결과, 및 학습 레벨을 입력 받고, 학습자의 영어 수준에 해당하는 각각의 확률값을 가지는 3차원의 확률 벡터를 출력한다. 예를 들어, 확률 벡터가 (0.1, 0.7, 0.2)라면, 중급에 해당할 확률값이 0.7로 가장 높으므로, 분류 모델은 학습자의 영어 수준을 중급으로 분류한다.
본 발명에서 복수의 언어 모델(Language Model; LM)은 인공 신경망 기반의 모델을 사용한다. 언어 모델은 RNN 계열 및 트랜스포머 계열 언어 모델에서 선택될 수 있으나, 자연어 처리(Natural Language Processing; NLP)가 가능한 모델이라면 다양한 언어 모델이 사용될 수 있다. 학습이 완료된 복수의 언어 모델은 자연어 처리를 통해 학습자가 입력한 영어 문자열에 가장 자연스러운 수준별 영어 문자열을 출력할 수 있다.
도 6은 본 발명의 실시예에 따른 맞춤형 영어 교육 방법에서 학습 데이터의 구성을 나타내는 도면이다. 도 7은 본 발명의 실시예에 따른 맞춤형 영어 교육 방법에서 제1언어 모델이 학습하는 모습을 나타내는 도면이고, 도 8은 본 발명의 실시예에 따른 맞춤형 영어 교육 방법에서 제2언어 모델이 학습하는 모습을 나타내는 도면이다. 도 6을 참조하면, 언어 모델을 학습시키는 학습 데이터는 초급 학습 데이터, 중급 학습 데이터, 및 고급 학습 데이터로 구성된다. 초급 학습 데이터는 어린이 영어책이나 전체관람가에 해당하는 등급을 가진 영상물을 포함한다. 영상물에서는 음성 데이터를 추출하여 영어 문자열을 추출한다. 중급 학습 데이터는 초급 학습 데이터에 더해, 청소년 영어책이나 15세 관람가까지 해당하는 등급을 가진 영상물을 포함한다. 고급 학습 데이터는 초급 및 중급 학습 데이터에 더해, 성인용 영어책이나 청소년 관람불가까지 해당하는 등급을 가진 영상물을 포함한다. 도 7을 참조하면, 제1언어 모델은 초급 학습 데이터로 학습이 이루어지므로, 영어를 모국어로 하는 어린이 정도의 영어 수준을 가지게 된다. 도 8을 참조하면, 제2언어 모델은 중급 학습 데이터로 학습이 이루어지므로, 영어를 모국어로 하는 청소년 정도의 영어 수준을 가지게 된다. 그리고 제3언어 모델은 고급 학습 데이터로 학습이 이루어지므로, 영어를 모국어로 하는 성인 정도의 영어 수준을 가지게 된다.
도 9 및 도 10은 본 발명의 실시예에 따른 맞춤형 영어 교육 방법에서 언어 모델별로 출력하는 수준별 영어 문자열을 나타내는 도면이다. 도 9의 예시를 참조하면, 제1언어 모델은 "It's done."을, 제2언어 모델은 "It's finished."를, 그리고 제3언어 모델은 "It's been accomplished."를 출력한다. 도 10의 예시를 참조하면, 제1언어 모델은 "I'm tired."를, 제2언어 모델은 "I'm stressed out."을, 그리고 제3언어 모델은 "I'm exasperated."를 출력한다. 각각의 예시에서 제1언어 모델 내지 제3언어 모델이 출력하는 영어 문자열의 의미는 모두 동일하나, 수준별 차이가 존재한다.
(3) 단계(S300)에서는 확률 벡터에서 가장 높은 확률값을 가지는 수준과 대응하는 언어 모델에서 출력하는 영어 문자열을 우선적으로 출력한다. 예를 들어, 분류 모델에서 학습자의 영어 수준을 중급으로 분류(판단)했다면, (3) 단계(S300)에서는 도 9 및 도 10의 예시에서 각각 "It's finished."와 "I'm stressed out."을 우선적으로 출력한다. 그리고 (3) 단계(S300)에서는 학습자의 요청 이벤트에 따라 나머지 영어 문자열을 출력한다. 요청 이벤트는 학습자가 다른 언어 모델에서 출력하는 영어 문자열을 확인하고자 할 때 생성되는 이벤트이다. 학습자는 우선적으로 확인한 자신의 영어 수준에 맞는 영어 문자열 외에도, 다른 수준의 영어 문자열을 확인하여 보다 복합적으로 영어를 학습할 수 있다. 따라서 학습자는 인공지능과 자연스럽게 대화를 하는 순간마다 서로 다른 수준의 영어 문자열을 확인하며 상황별로 다양한 피드백을 받을 수 있다.
실시예에 따라서, (3) 단계(S300)에서는 영어 음성을 영어 문자열로 변환하여 수준별 언어 처리 모델에 입력한다. 그리고 수준별 영어 문자열을 미리 정해진 성별 및 액센트의 영어 음성으로 출력한다. 학습자는 인공지능과 텍스트를 이용한 채팅 외에도, 음성을 통해 대화할 수 있다. 이 경우, 마이크 모듈로 수신하는 학습자의 음성 데이터를 영어 문자열로 변환하여 수준별 언어 처리 모델에 입력한다. 그리고 수준별 영어 문자열도 각각 음성 데이터로 변환하여 스피커 모듈을 통해 영어 음성으로 출력할 수 있다.
수준별 영어 문자열을 음성 데이터로 변환 시, 학습자가 선택하는 성별 및 액센트를 가지는 영어 음성으로 출력할 수 있다. 그리고 (3) 단계(S300)에서는 수준별 영어 문자열별로 성별 및 액센트를 서로 다르게 설정할 수 있다. 따라서 학습자는 다양한 영어 수준을 가지는 여러 사람과 대화하듯이 영어를 학습할 수 있다.
실시예에 따라서, 수준별 언어 처리 모델을 이용한 맞춤형 영어 교육 장치(이하에서는 '맞춤형 영어 교육 장치'라 함)는 명령어를 저장하는 메모리 및 명령어를 실행하는 프로세서를 포함한다. 여기서, 명령어는 본 발명의 실시예에 따른 맞춤형 영어 교육 방법의 각각의 단계를 포함한다. 또는, 실시예에 따라서, 본 발명의 실시예에 따른 맞춤형 영어 교육 방법의 각각의 단계에서 수행하는 기능은 각각의 구성으로 변환되고, 이러한 구성을 포함하는 장치로 구현될 수 있다. 각각의 구성은 전술한 방법의 각각의 단계에 대한 설명과 중복되므로, 그 자세한 설명은 생략한다.
발명의 설명에 기재된 내용은 예시에 불과하며, 본 발명은 이 분야의 기술자에 의하여 다양하게 변형되어 실시될 수 있다. 따라서 본 발명의 보호범위는 설명된 실시예의 기재와 표현으로 제한되지 않는다.

Claims (10)

  1. 컴퓨팅 디바이스에 의해 수행되는 방법으로서:
    (1) 학습자의 개인정보와 듣기, 쓰기, 및 말하기 분야를 포함하는 영어 테스트 결과를 수신하는 단계;
    (2) 상기 영어 테스트 결과를 사용하여 학습 레벨을 설정하는 단계; 및
    (3) 상기 개인정보, 상기 테스트 결과, 상기 학습 레벨, 및 영어 문자열을 수준별 언어 처리 모델에 입력하고, 수준별 영어 문자열을 출력하는 단계를 포함하고,
    상기 (2) 단계는,
    상기 개인정보와 매칭되는 유사군을 특정하고, 상기 유사군에 속하는 가상 학습자의 영어 테스트 결과와 비교하여 학습 레벨을 설정하며,
    상기 (2) 단계는,
    비지도 학습으로 학습되는 유사군 군집 모델에 의해 미리 정해진 수로 군집화된 그룹 중에서 유사군을 특정하고,
    상기 가상 학습자는,
    중심극한정리에 따라 각각의 유사군별로 정규분포로 근사하는 영어 테스트 결과의 95% 수준을 가지며,
    상기 학습 레벨은,
    아래의 수학식 1에 의해 계산되는 것을 특징으로 하는, 수준별 언어 처리 모델을 이용한 맞춤형 영어 교육 방법.
    [수학식 1]

    여기서, L은 학습 레벨, v는 가상 학습자의 영어 테스트 결과값, x는 학습자의 영어 테스트 결과값, 그리고 w는 미리 정해진 가중치임.
  2. 청구항 1에 있어서,
    상기 수준별 언어 처리 모델은,
    사전 학습된 자연어 처리 모델 및 복수의 인공 신경망 모델을 포함하는 것을 특징으로 하는, 수준별 언어 처리 모델을 이용한 맞춤형 영어 교육 방법.
  3. 청구항 2에 있어서,
    상기 복수의 인공 신경망 모델은,
    학습자의 영어 수준에 대한 확률 벡터를 출력하는 분류 모델, 초급 학습 데이터로 학습하는 제1언어 모델, 중급 학습 데이터로 학습하는 제2언어 모델, 및 고급 학습 데이터로 학습하는 제3언어 모델을 포함하는 것을 특징으로 하는, 수준별 언어 처리 모델을 이용한 맞춤형 영어 교육 방법.
  4. 청구항 3에 있어서,
    상기 (3) 단계는,
    상기 확률 벡터에서 가장 높은 확률값을 가지는 수준과 대응하는 언어 모델에서 출력하는 영어 문자열을 우선적으로 출력하고, 학습자의 요청 이벤트에 따라 나머지 영어 문자열을 출력하는 것을 특징으로 하는, 수준별 언어 처리 모델을 이용한 맞춤형 영어 교육 방법.
  5. 삭제
  6. 삭제
  7. 삭제
  8. 삭제
  9. 청구항 1에 있어서,
    상기 (2) 단계는,
    상기 학습 레벨이 0인 경우, 특정된 유사군보다 상위 수준의 유사군으로 특정하는 것을 특징으로 하는, 수준별 언어 처리 모델을 이용한 맞춤형 영어 교육 방법.
  10. 명령어를 로드하는 메모리; 및
    상기 명령어를 실행하는 프로세서를 포함하고,
    상기 명령어는,
    상기 프로세서가 청구항 1, 2, 3, 4, 및 9 중 어느 한 청구항의 단계를 수행하도록 하는 것을 특징으로 하는, 수준별 언어 처리 모델을 이용한 맞춤형 영어 교육 장치.
KR1020230004006A 2023-01-11 2023-01-11 수준별 언어 처리 모델을 이용한 맞춤형 영어 교육 방법 및 장치 KR102592553B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020230004006A KR102592553B1 (ko) 2023-01-11 2023-01-11 수준별 언어 처리 모델을 이용한 맞춤형 영어 교육 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020230004006A KR102592553B1 (ko) 2023-01-11 2023-01-11 수준별 언어 처리 모델을 이용한 맞춤형 영어 교육 방법 및 장치

Publications (1)

Publication Number Publication Date
KR102592553B1 true KR102592553B1 (ko) 2023-10-27

Family

ID=88514079

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020230004006A KR102592553B1 (ko) 2023-01-11 2023-01-11 수준별 언어 처리 모델을 이용한 맞춤형 영어 교육 방법 및 장치

Country Status (1)

Country Link
KR (1) KR102592553B1 (ko)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101184900B1 (ko) * 2010-06-03 2012-09-20 박향희 문장에 제시된 공란을 채우는 인터페이스를 이용한 언어 학습 시스템
KR20180102785A (ko) * 2017-03-08 2018-09-18 김동희 빅데이터 기반의 맞춤형 진학 정보 서비스 제공 방법
KR20190123105A (ko) * 2018-04-23 2019-10-31 주식회사 에스티유니타스 사용자 맞춤형 학습 컨텐츠 제공 시스템 및 방법
KR102358084B1 (ko) * 2021-05-31 2022-02-08 주식회사 애자일소다 학업 수준 결정 장치 및 그 방법
KR20220109800A (ko) 2021-01-29 2022-08-05 주식회사 엘지유플러스 대화형 교육 서비스를 제공하는 전자 장치 및 그 동작 방법
KR20220128260A (ko) * 2021-03-12 2022-09-20 주식회사 노스트라에이아이 학생과 인공지능 모델 간의 비교 평가를 바탕으로 학습 과정을 설계하는 전자 장치, 및 학습 관리 방법

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101184900B1 (ko) * 2010-06-03 2012-09-20 박향희 문장에 제시된 공란을 채우는 인터페이스를 이용한 언어 학습 시스템
KR20180102785A (ko) * 2017-03-08 2018-09-18 김동희 빅데이터 기반의 맞춤형 진학 정보 서비스 제공 방법
KR20190123105A (ko) * 2018-04-23 2019-10-31 주식회사 에스티유니타스 사용자 맞춤형 학습 컨텐츠 제공 시스템 및 방법
KR20220109800A (ko) 2021-01-29 2022-08-05 주식회사 엘지유플러스 대화형 교육 서비스를 제공하는 전자 장치 및 그 동작 방법
KR20220128260A (ko) * 2021-03-12 2022-09-20 주식회사 노스트라에이아이 학생과 인공지능 모델 간의 비교 평가를 바탕으로 학습 과정을 설계하는 전자 장치, 및 학습 관리 방법
KR102358084B1 (ko) * 2021-05-31 2022-02-08 주식회사 애자일소다 학업 수준 결정 장치 및 그 방법

Similar Documents

Publication Publication Date Title
US10621975B2 (en) Machine training for native language and fluency identification
CN105261246B (zh) 一种基于大数据挖掘技术的英语口语纠错系统
KR20210146089A (ko) 대화 스타일링 서비스를 위한 다중 페르소나 모델 생성 방법 및 이를 이용한 대화 스타일링 방법
CN112990353B (zh) 一种基于多模态模型的汉字易混淆集构建方法
US11823592B2 (en) Virtual agent conducting interactive testing
JP6810580B2 (ja) 言語モデル学習装置およびそのプログラム
Marrese-Taylor et al. Learning to automatically generate fill-in-the-blank quizzes
Ludusan et al. Does infant‐directed speech help phonetic learning? A machine learning investigation
Najafian et al. Improving speech recognition using limited accent diverse British English training data with deep neural networks
Wang [Retracted] Research on Open Oral English Scoring System Based on Neural Network
Abulimiti et al. How About Kind of Generating Hedges using End-to-End Neural Models?
KR102592553B1 (ko) 수준별 언어 처리 모델을 이용한 맞춤형 영어 교육 방법 및 장치
CN111368524A (zh) 一种基于自注意力双向gru和svm的微博观点句识别方法
Lee et al. Foreign language tutoring in oral conversations using spoken dialog systems
Bañeras-Roux et al. Hats: An open data set integrating human perception applied to the evaluation of automatic speech recognition metrics
Voskoboinik et al. Automated assessment of task completion in spontaneous speech for finnish and finland swedish language learners
AT&T
Loukina et al. Scoring and filtering models for automated speech scoring
Tascini Al-Chatbot: elderly aid
Johnson et al. An Analysis of Large Language Models for African American English Speaking Children’s Oral Language Assessment
Li An Artificial Intelligence Conversational Chatbot Developed for Non-Native English Speakers
CN117275319B (zh) 训练语言重点能力的装置
Kooragama et al. Speech Master: Natural Language Processing and Deep Learning Approach for Automated Speech Evaluation
Li Modular design of English pronunciation proficiency evaluation system based on Speech Recognition Technology
KR102706374B1 (ko) 말하기 채점 인공지능 모델을 이용하여 문법력 및 어휘력을 평가하는 장치

Legal Events

Date Code Title Description
GRNT Written decision to grant