KR102098283B1 - 언어 학습을 위한 자료 처리 시스템 및 방법 - Google Patents

언어 학습을 위한 자료 처리 시스템 및 방법 Download PDF

Info

Publication number
KR102098283B1
KR102098283B1 KR1020180086692A KR20180086692A KR102098283B1 KR 102098283 B1 KR102098283 B1 KR 102098283B1 KR 1020180086692 A KR1020180086692 A KR 1020180086692A KR 20180086692 A KR20180086692 A KR 20180086692A KR 102098283 B1 KR102098283 B1 KR 102098283B1
Authority
KR
South Korea
Prior art keywords
keyword
language learning
processing system
data processing
text
Prior art date
Application number
KR1020180086692A
Other languages
English (en)
Other versions
KR20200011794A (ko
Inventor
이경애
Original Assignee
주식회사 아이포트폴리오
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 아이포트폴리오 filed Critical 주식회사 아이포트폴리오
Priority to KR1020180086692A priority Critical patent/KR102098283B1/ko
Publication of KR20200011794A publication Critical patent/KR20200011794A/ko
Application granted granted Critical
Publication of KR102098283B1 publication Critical patent/KR102098283B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/258Heading extraction; Automatic titling; Numbering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/5866Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/632Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Abstract

본 발명은 언어 학습을 위한 자료 처리 시스템 및 방법을 개시하고 있으며, 본 발명의 일 실시예는, 언어 텍스트가 포함된 추출 대상 파일로부터 상기 파일에 포함된 텍스트를 추출하는 자료 수집부, 소정의 기준에 따라 상기 텍스트 중 키워드를 도출하는 자료 처리부, 그리고, 상기 키워드에 대한 이미지 및 음성 정보 중 적어도 어느 하나 이상의 정보를 생성하는 자료 생성부를 포함하는 언어 학습을 위한 자료 처리 시스템을 제공한다.

Description

언어 학습을 위한 자료 처리 시스템 및 방법{DATA PROCESSING SYSTEM AND METHOD FOR LANGUAGE LEARNING}
본 발명은 언어 학습을 위한 자료 처리 시스템 및 방법에 관한 것으로, 더욱 상세하게는, 언어 텍스트가 포함된 파일로부터 추출된 키워드에 대응되는 이미지를 검색하고 추출된 키워드와 검색된 이미지들을 조합하여 학습 문제를 출제하도록 하는 언어 학습 자료 처리 시스템 및 방법에 관한 것이다.
외국어를 학습하기 위한 일반적인 방법으로는, 외국어 학원을 이용하는 방법, 유선 전화나 화상 전화를 이용하는 방법, 온라인 강의를 이용하는 방법 등이 있다. 이 중에서도 최근 인터넷 관련 기술이 발달함에 따라 시간과 공간의 제약이 적다는 점에서, 온라인 강의를 이용하여 외국어를 학습하려는 사람들의 수가 급격히 증가하는 추세이다.
이와 관련하여, 인터넷 강의를 이용한 외국어 학습을 제공하는 회사들은 컴퓨터를 도구로 사용하여 다양한 외국어 학습 자료를 만들고 있으나, 현재 외국어 번역을 기계화한 기술에는 한계가 존재하므로 외국어 학습과 관련한 문제, 게임 등의 자료 생성은 많은 인력과 시간 및 비용을 필요로 한다.
예컨대, 이북(e-book)을 이용한 외국어 학습(e-book learning, e-learning)에 있어서, 이북에 있는 영어 텍스트 중 키워드를 선별하고 선별된 키워드에 해당하는 이미지를 검색한 후 키워드와 이에 해당하는 이미지를 연결하는 문제를 생성하는 경우를 예로 든다. 이와 같은 경우, 종래에는 이북에 있는 영어 텍스트 중 키워드를 선정하는 작업과, 선정된 키워드에 대응하는 이미지들을 검색하여 키워드와 매칭하는 작업 등을 외국어의 특성과 기계 번역의 한계로 인해 사람이 직접 해야 했었다.
따라서, 현재, 관련 업계에서는 인터넷을 활용한 외국어 학습 제공 시스템에 있어서 외국어 학습 관련 문제들을 효과적으로 출제하기 위한 방법과 기술들의 지속적인 개발이 요구되고 있다.
본 발명은 상기한 문제점을 해결하기 위해 안출된 것으로, 본 발명이 이루고자 하는 주된 기술적 과제는, 언어 텍스트가 포함된 파일로부터 텍스트를 추출하고, 추출된 텍스트 중 키워드를 선정하며, 선정된 키워드에 대응되는 이미지를 검색하여 키워드와 이미지들을 조합하여 학습 문제를 출제하도록 하는 언어 학습 자료 처리 시스템 및 방법을 제공하는 것이다.
본 발명이 이루고자 하는 기술적 과제는 이상에서 언급한 기술적 과제로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
상기 기술적 과제를 해결하기 위해 본 발명의 일 실시예는, 언어 텍스트가 포함된 추출 대상 파일로부터 상기 파일에 포함된 텍스트를 추출하는 자료 수집부, 소정의 기준에 따라 상기 텍스트 중 키워드를 도출하는 자료 처리부, 그리고, 상기 키워드에 대한 이미지 및 음성 정보 중 적어도 어느 하나 이상의 정보를 생성하는 자료 생성부를 포함하는 언어 학습을 위한 자료 처리 시스템을 제공한다.
본 실시예에 있어서, 상기 키워드와 이에 대응하고 상기 자료 생성부가 생성한 이미지 및 음성 정보 중 적어도 어느 하나 이상의 정보를 매칭시킨 문제를 생성하는 문제 출제부를 더 포함할 수 있다.
본 실시예에 있어서, 상기 자료 처리부는, 상기 텍스트의 품사, 원형 및 상기 파일 내에서 사용된 빈도 중 적어도 어느 하나 이상의 소정의 기준에 따라 상기 텍스트 중 키워드를 도출할 수 있다.
본 실시예에 있어서, 상기 자료 처리부는, 상기 텍스트를 상기 파일 내에서 사용된 빈도를 기초로 정렬한 후, 정렬된 텍스트 중 동사 또는 명사의 품사를 지닌 텍스트의 원형을 키워드로 도출할 수 있다.
본 실시예에 있어서, 상기 자료 생성부는, 상기 파일 내에서 상기 키워드가 포함된 문장을 번역한 후, 상기 키워드와 상기 문장의 번역문을 함께 이용하여, 상기 키워드에 대한 이미지를 검색함으로써 상기 키워드에 대응하는 이미지를 생성할 수 있다.
본 실시예에 있어서, 상기 자료 생성부는 상기 키워드에 대응하는 이미지 카드를 생성하고, 상기 문제 출제부는 사용자가 상기 키워드와 상기 키워드에 대응하는 이미지 카드를 연결하도록 하는 문제를 생성할 수 있다.
본 실시예에 있어서, 상기 자료 생성부는 상기 키워드에 대응하는 이미지 카드와 음성 파일을 생성하고, 상기 문제 출제부는 사용자가 상기 키워드와 상기 키워드에 대응하는 이미지 카드를 연결하도록 하는 문제를 생성하되 이와 함께 상기 키워드에 대응하는 음성 파일을 상기 사용자에게 제공할 수 있다.
또한, 상기 기술적 과제를 해결하기 위해 본 발명의 다른 실시예는, 상술한 본 발명의 일 실시예에 따른 언어 학습 자료 처리 시스템을 이용한 언어 학습 자료 처리 방법으로서, 상기 언어 학습 자료 처리 시스템이 언어 텍스트가 포함된 추출 대상 파일로부터 상기 파일에 포함된 텍스트를 추출하는 자료 수집 단계, 상기 언어 학습 자료 처리 시스템이 소정의 기준에 따라 상기 텍스트 중 키워드를 도출하는 자료 처리 단계, 그리고, 상기 언어 학습 자료 처리 시스템이 상기 키워드에 대한 이미지 및 음성 정보 중 적어도 어느 하나 이상의 정보를 생성하는 자료 생성 단계를 포함하는 언어 학습을 위한 자료 처리 방법을 제공한다.
본 실시예에 있어서, 상기 언어 학습 자료 처리 시스템이 상기 키워드와 이에 대응하고 상기 자료 생성 단계를 통해 생성한 이미지 및 음성 정보 중 적어도 어느 하나 이상의 정보를 매칭시킨 문제를 생성하는 문제 출제 단계를 더 포함할 수 있다.
본 실시예에 있어서, 상기 자료 처리 단계는, 상기 언어 학습 자료 처리 시스템이 상기 텍스트의 품사, 원형 및 상기 파일 내에서 사용된 빈도 중 적어도 어느 하나 이상의 소정의 기준에 따라 상기 텍스트 중 키워드를 도출하는 단계일 수 있다.
본 실시예에 있어서, 상기 자료 처리 단계는, 상기 언어 학습 자료 처리 시스템이 상기 텍스트를 상기 파일 내에서 사용된 빈도를 기초로 정렬하는 정렬 과정과, 상기 언어 학습 자료 처리 시스템이 상기 정렬 과정에 따라 정렬된 텍스트 중 동사 또는 명사의 품사를 지닌 텍스트의 원형을 키워드로 도출하는 도출 과정을 포함할 수 있다.
본 실시예에 있어서, 상기 자료 생성 단계는, 상기 언어 학습 자료 처리 시스템이 상기 파일 내에서 상기 키워드가 포함된 문장을 번역하는 번역 과정과, 상기 언어 학습 자료 처리 시스템이 상기 키워드와 상기 문장의 번역문을 함께 이용하여 상기 키워드에 대한 이미지를 검색하는 검색 과정 및 상기 언어 학습 자료 처리 시스템이 상기 검색 과정을 토대로 검색된 이미지들 중 상기 키워드에 대응하는 이미지를 선정하는 선정 과정을 포함할 수 있다.
본 실시예에 있어서, 상기 자료 생성 단계는 상기 언어 학습 자료 처리 시스템이 상기 키워드에 대응하는 이미지 카드를 생성하는 단계이고, 상기 문제 출제 단계는 상기 언어 학습 자료 처리 시스템이 사용자가 상기 키워드와 상기 키워드에 대응하는 이미지 카드를 연결하도록 하는 문제를 생성하는 단계일 수 있다.
본 실시예에 있어서, 상기 자료 생성 단계는 상기 언어 학습 자료 처리 시스템이 상기 키워드에 대응하는 이미지 카드와 음성 파일을 생성하는 단계이고, 상기 문제 출제 단계는 상기 언어 학습 자료 처리 시스템이 사용자가 상기 키워드와 상기 키워드에 대응하는 이미지 카드를 연결하도록 하는 문제를 생성하되 이와 함께 상기 키워드에 대응하는 음성 파일을 상기 사용자에게 제공하는 단계일 수 있다.
본 발명에 따르면, 언어 텍스트가 포함된 파일로부터 텍스트를 추출하고, 추출된 텍스트 중 키워드를 선정하며, 선정된 키워드에 대응되는 이미지를 검색하여 키워드와 이미지들을 조합하여 학습 문제를 출제하도록 하는 과정들을 모두 자동화할 수 있고, 이에 따라, 온라인을 통한 언어 학습 문제 출제에 소요되는 인력, 시간 및 비용을 절감할 수 있으며, 이와 관련한 업무 생산성을 증대시킬 수 있다.
또한, 본 발명에 따르면, 단어의 품사와 원형, 사용 빈도 등의 다양한 기준을 토대로 외국어 텍스트로부터 키워드를 선정하여 외국어 텍스트가 포함된 파일과 키워드 간의 관련도를 높일 수 있고 키워드에 대한 신뢰도를 높일 수 있다.
또한, 본 발명에 따르면, 선정된 키워드에 대응되는 이미지를 검색할 때에, 키워드가 포함된 문장 전체를 기계 번역한 번역문들을 함께 활용함으로써, 키워드에 대응되는 이미지와 키워드의 관련도를 높일 수 있고, 검색된 이미지들에 대한 신뢰도를 높일 수 있다.
또한, 본 발명에 따르면, 상기한 바와 같이 외국어 텍스트가 포함된 파일, 텍스트 중 선정된 키워드, 키워드에 대응되는 검색 이미지들의 관련도를 높임으로써, 파일에 포함된 내용에 대한 사용자의 이해도를 높일 수 있고, 이러한 자료들을 토대로 생성한 문제의 오류를 방지하여 문제의 정확성과 신뢰성을 높일 수 있다.
본 발명의 효과는 상기한 효과로 한정되는 것은 아니며, 본 발명의 상세한 설명 또는 특허청구범위에 기재된 발명의 구성으로부터 추론 가능한 모든 효과를 포함하는 것으로 이해되어야 한다.
도 1은 본 발명의 일 실시예에 따른 언어 학습을 위한 자료 처리 시스템의 구성을 도시한 블록도이다.
도 2는 본 발명의 일 실시예에 따른 언어 학습을 위한 자료 처리 시스템과 이와 연동 가능한 서버 및 단말기들을 설명하기 위해 도시한 도면이다.
도 3은 본 발명의 일 실시예에 따라 생성되는 문제들을 설명하기 위해 도시한 도면이다.
도 4는 본 발명의 다른 실시예에 따른 언어 학습을 위한 자료 처리 방법의 절차를 도시한 흐름도이다.
도 5는 도 4에 도시된 자료 처리 단계의 세부 과정들을 설명하기 위해 도시한 도면이다.
도 6은 도 4에 도시된 자료 생성 단계의 세부 과정들을 설명하기 위해 도시한 도면이다.
이하에서는 첨부한 도면을 참조하여 본 발명을 상세히 설명하기로 한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며, 따라서 여기에서 설명하는 실시예로 한정되는 것은 아니다. 또한, 첨부된 도면은 본 명세서에 개시된 실시 예를 쉽게 이해할 수 있도록 하기 위한 것일 뿐, 첨부된 도면에 의해 본 명세서에 개시된 기술적 사상이 제한되지 않으며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경물, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 도면에 나타난 각 구성요소의 크기, 형태, 형상은 다양하게 변형될 수 있고, 명세서 전체에 대하여 동일/유사한 부분에 대해서는 동일/유사한 도면 부호를 붙였다.
이하의 설명에서 사용되는 구성요소에 대한 접미사 "모듈" 및 "부"는 명세서 작성의 용이함만이 고려되어 부여되거나 혼용되는 것으로서, 그 자체로 서로 구별되는 의미 또는 역할을 갖는 것은 아니다. 또한, 본 명세서에 개시된 실시예를 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 명세서에 개시된 실시 예의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략하였다.
명세서 전체에서, 어떤 부분이 다른 부분과 "연결(접속, 접촉 또는 결합)"되어 있다고 할 때, 이는 "직접적으로 연결(접속, 접촉 또는 결합)"되어 있는 경우뿐만 아니라, 그 중간에 다른 부재를 사이에 두고 "간접적으로 연결(접속, 접촉 또는 결합)"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함(구비 또는 마련)"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 “포함(구비 또는 마련)”할 수 있다는 것을 의미한다.
본 명세서에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함하며, 분산되어 실시되는 구성요소들은 특별한 제한이 있지 않는 한 결합된 형태로 실시될 수도 있다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
도 1은 본 발명의 일 실시예에 따른 언어 학습을 위한 자료 처리 시스템의 구성을 도시한 블록도이고, 도 2는 본 발명의 일 실시예에 따른 언어 학습을 위한 자료 처리 시스템(이하, “언어 학습 자료 처리 시스템(100)”이라고 함)과 이와 연동 가능한 서버 및 단말기들을 설명하기 위해 도시한 도면이다.
도 1을 참조하면, 언어 학습 자료 처리 시스템(100)은 자료 수집부(110), 자료 처리부(120) 및 자료 생성부(130)를 포함한다.
구체적으로, 자료 수집부(110)는 언어 텍스트가 포함된 추출 대상 파일로부터 상기 파일에 포함된 텍스트를 추출하고, 자료 처리부(120)는 소정의 기준에 따라 상기 텍스트 중 키워드를 도출하며, 자료 생성부(130)는 상기 키워드에 대한 이미지 및 음성 정보 중 적어도 어느 하나 이상의 정보를 생성한다.
여기서, 언어 텍스트는 국어를 제외한 외국어로 작성된 텍스트일 수 있다.
또한, 자료 처리부(120)는, 상기 텍스트의 품사, 원형 및 상기 파일 내에서 사용된 빈도 중 적어도 어느 하나 이상의 소정의 기준에 따라 상기 텍스트 중 키워드를 도출할 수 있다.
또한, 자료 처리부(120)는, 상기 텍스트를 상기 파일 내에서 사용된 빈도를 기초로 정렬한 후, 정렬된 텍스트 중 동사 또는 명사의 품사를 지닌 텍스트의 원형을 키워드로 도출할 수도 있다.
이에 더하여, 자료 생성부(130)는 상기 파일 내에서 상기 키워드가 포함된 문장을 번역한 후, 상기 키워드와 상기 문장의 번역문을 함께 이용하여, 상기 키워드에 대한 이미지를 검색함으로써 상기 키워드에 대응하는 이미지를 생성할 수 있다. 여기서 번역이란, 국어를 제외한 외국어로 작성된 텍스트를 국어로 번역하는 것일 수 있으나, 반드시 이에 제한되는 것은 아니며, 수많은 언어 중 제1언어를 제2언어로 번역하는 넓은 의미로 해석되어야 한다.
이 때, 자료 수집부(110)는 기 설정된 언어 파일 데이터베이스(210)를 통해 외국어 텍스트가 담긴 파일을 획득할 수 있고, 자료 처리부(120)와 자료 생성부(130)가 이미지 검색이나 이미지 정보 또는 음성 정보를 획득하기 위해 기 설정된 이미지 및 음성 데이터베이스(220)와 번역 데이터베이스(230)를 활용할 수 있다.
한편, 다시 도 1을 참조하면, 언어 학습 자료 처리 시스템(100)은 문제 출제부(140)를 더 포함할 수 있다.
문제 출제부(140)는 상기 키워드와 이에 대응하고 자료 생성부(130)가 생성한 이미지 및 음성 정보 중 적어도 어느 하나 이상의 정보를 매칭시킨 문제를 생성한다. 이렇게 생성된 문제는 스마트폰, 데스크탑 등의 형태로 형성되는 사용자 단말기(300)에게 제공될 수 있다.
상술한 언어 학습 자료 처리 시스템(100)의 이해를 돕기 위해, 언어 학습 자료 처리 시스템(100)이 영어 텍스트가 담긴 파일에서 텍스트를 추출하여 키워드를 선정하고 키워드에 대응하는 이미지와 음성 정보를 생성하여 문제를 제공하도록 구현된 경우를 예로 든다.
먼저 자료 수집부(110)는 사계절 중 하나인 봄을 주제로 하는 내용이 담긴 동화의 영문 텍스트가 담긴 파일에서 영어 텍스트 전체를 추출하여 별도로 저장한다.
다음, 자료 처리부(120)는 텍스트 전체를 대상으로 가장 많이 사용된 단어들의 빈도 순서대로 정렬한다. 빈도순대로 정렬된 단어들이 spring, so, flower, good, read인 경우 자료 처리부(120)는 동사 또는 명사인 키워드 spring, flower, read 3개를 키워드로 설정한다. 이와 같이, 언어 학습 자료 처리 시스템(100)은 단어의 품사와 원형, 사용 빈도 등의 다양한 기준을 토대로 외국어 텍스트로부터 키워드를 선정하여 외국어 텍스트가 포함된 파일과 키워드 간의 관련도를 높일 수 있고 키워드에 대한 신뢰도를 높일 수 있다.
다음, 자료 생성부(130)는 spring, flower, read에 대응하는 이미지와 음성을 검색한다. 여기서, spring은 봄과 이와 전혀 관련 없는 용수철 등의 뜻도 가지므로, 이미지 검색시 계절과 관련된 봄이 아닌 탄성력을 갖는 용수철의 이미지가 검색될 수 있다.
따라서, 자료 생성부(130)는 파일 내에 spring이 담긴 문장 중 일부, 예컨대, “spring is warm weather” 전체를 번역하여 “봄은 따뜻한 계절이다”라는 번역문과 spring을 함께 이미지 검색에 활용할 수 있다.
이와 같이, 단어 한 개의 “spring”과 달리 문장 전체의 “spring is warm weather”에서의 srping은 용수철로 번역되지 않으므로, 언어 학습 자료 처리 시스템(100)은 선정된 키워드에 대응되는 이미지를 검색할 때에, 키워드가 포함된 문장 전체를 기계 번역한 번역문들을 함께 활용함으로써, 키워드에 대응되는 이미지와 키워드의 관련도를 높일 수 있고, 검색된 이미지들에 대한 신뢰도를 높일 수 있다.
마지막으로, 문제 출제부(140)는 사용자에게 이미지 매칭 문제 등을 생성하여 출제할 수 있다.
본 발명의 일 실시예에 따라 생성되는 문제들을 설명하기 위해 도시한 도 3을 참조하면, 도 3의 (b)와 같이 자료 생성부(130)는 상기 키워드에 대응하는 이미지 카드를 생성할 수 있고, 문제 출제부(140)는 사용자가 상기 키워드와 상기 키워드에 대응하는 이미지 카드를 연결하도록 하는 문제를 생성할 수 있다. 이 ?, 자료 생성부(130)는 상기 키워드에 대응하는 이미지 카드와 음성 파일을 생성하고, 문제 출제부(140)는 사용자가 상기 키워드와 상기 키워드에 대응하는 이미지 카드를 연결하도록 하는 문제를 생성하되 이와 함께 상기 키워드에 대응하는 음성 파일을 상기 사용자에게 제공할 수도 있다.
또한, 문제 출제부(140)는 도 3의 (a)와 같이 각 이미지들에 대응되는 키워드들을 사용자가 직접 입력하는 방식의 문제를 출제할 수도 있으며, 도 3의 (c)와 같이 한 이미지에 어울리는 키워드를 사용자들이 선택하도록 문제를 출제할 수도 있다. 마찬가지로 이 때에도 각 이미지 또는 키워드에 해당하는 음성이 함께 사용자에게 제공될 수 있다.
상술한 예를 통해 알 수 있듯이, 언어 학습 자료 처리 시스템(100)은 외국어 텍스트가 포함된 파일, 텍스트 중 선정된 키워드, 키워드에 대응되는 검색 이미지들의 관련도를 높임으로써, 파일에 포함된 내용에 대한 사용자의 이해도를 높일 수 있고, 이러한 자료들을 토대로 생성한 문제의 오류를 방지하여 문제의 정확성과 신뢰성을 높일 수 있다
이 뿐만 아니라, 언어 학습 자료 처리 시스템(100)은 외국어 텍스트가 포함된 파일로부터 텍스트를 추출하고, 추출된 텍스트 중 키워드를 선정하며, 선정된 키워드에 대응되는 이미지를 검색하여 키워드와 이미지들을 조합하여 학습 문제를 출제하도록 하는 과정들을 모두 자동화할 수 있고, 이에 따라, 온라인을 통한 외국어 학습 문제 출제에 소요되는 인력, 시간 및 비용을 절감할 수 있으며, 이와 관련한 업무 생산성을 증대시킬 수 있다.
상술한 본 발명의 일 실시예의 구현예를 설명하면 다음과 같다.
먼저, 언어 텍스트 및/또는 이에 대응되는 이미지들이 포함된 전자책 형태의 파일의 모든 텍스트는 별도의 데이터베이스에 저장된다. 해당 텍스트의 예는 다음과 같을 수 있다.
“This is Grandpa. This is Grandpa’s van. It’s fantastic! Hello! My name is Ben. Hello! My name is Rosie. Now let’s read this story, Stop the Machine! Ben’s sister Rosie, Rosie’s brother Ben, Grandpa, Ben’s friend Max “What are you doing with those plastic bottles, Clunk?’ Ben asks.
다음, 키워드를 선정하기 위해, 도서의 본문 범위 내에서, 모든 텍스트를 문장 단위로 분리하고 모든 문장을 순회하며, 문장에 포함된 단어 중 명사와 동사를 찾고, 해당 단어가 명사일 경우에는 단수(singular)로, 동사일 경우에는 현재형(present tense)로 변형한 뒤, 해당 단어가 I, me, my 등 영어의 stopword일 경우 키워드에서 제외시키도록 본 발명이 구현될 수 있다. 또한, 본 구현예에 따르면, 본 발명은 해당 단어가 특정 인물을 가리킬 경우 키워드에서 제외시킬 수 있다. 또한, 본 구현예에 따르면, 본 발명은 해당 단어가 중복해서 등장할 경우, 등장 횟수를 증가시켜 최종적으로 등장 횟수가 높은 순위대로 단어와 단어의 품사, 해당 단어가 포함된 문장 리스트를 제공할 수 있다. 예컨대 해당 리스트는 다음과 같을 수 있다.
“Example;
{
"keywords": [
{"robot": {
"pos": "noun",
"frequency": 20,
"sentences": [
"Clunk is Grandpa's robot.",
"Robots can do anything!",
...
]
}}
]
}”
다음, 외부 입력에 의해, 키워드 중 명사 fall이 본 구현예에 따른 시스템에 입력되면, 한영 사전 명사 검색 결과로서, 가을, 폭포가 검색되고, 키워드 포함 문장 을 기계 번역하여, 핵심 문장으로서 Fall season has begun, 이에 대한 번역 문장으로서 가을 시즌이 시작되었습니다가, 제공될 수 있다.
이에 따라, “가을”이라는 단어가 번역문에 포함되어 있음이 확인될 수 있다. 이후, 본 구현예에 따르면, fall과 가을을 검색 단어로 넣어 이미지 검색이 수행될 수 있다.
다음, 문제 출제 또는 게임 생성을 위해, 본 구현예에 따른 시스템은 주어진 키워드 목록에서 키워드를 외국어 사전(e.g., 한영사전)에 검색하여 복수개의 단어 뜻을 도출하고, 키워드가 포함된 문장을 2에 사용된 외국어 사전과 동일한 언어(e.g., 한국어)로 기계 번역한 후, 검색된 단어가 기계 번역된 문장에 포함되어 있는지 확인할 수 있다. 이후키워드(영문)와 번역 단어(e.g., 한국어)를 함께 이용하여 이미지 검색을 수행할 수 있고, 검색된 이미지와 서비스의 Theme 파일 등을 합성하거나, 주어진 키워드를 TTS(Text to Speech)를 이용하여 음성 파일로 합성할 수 있다. 최종적으로, 생성된 결과물들과 키워드 및 핵심 문장 리스트를 이용하여 다양한 문제 또는 게임 등을 생성하여 학습자에게 제공할 수 있다.
도 4는 본 발명의 다른 실시예에 따른 언어 학습을 위한 자료 처리 방법의 절차를 도시한 흐름도이고, 도 5는 도 4에 도시된 자료 처리 단계의 세부 과정들을 설명하기 위해 도시한 도면이며, 도 6은 도 4에 도시된 자료 생성 단계 의 세부 과정들을 설명하기 위해 도시한 도면이다.
아래에서 설명되는 언어 학습을 위한 자료 처리 방법(이하, “언어 학습 자료 처리 방법”이라고 함)은 앞서 도 1 내지 도 3을 참조하여 설명한 언어 학습 자료 처리 시스템(100)을 이용한 방법으로서, 언어 학습 자료 처리 시스템(100)이 수행하는 모든 기능들의 절차들을 포함할 수 있다. 따라서, 이하에서는 상술한 내용과 중복되는 내용은 생략하도록 한다.
도 4를 참조하면, 본 실시예에 따른 언어 학습 자료 처리 방법은 상기 언어 학습 자료 처리 시스템이 언어 텍스트가 포함된 추출 대상 파일로부터 상기 파일에 포함된 텍스트를 추출하는 자료 수집 단계(s410), 상기 언어 학습 자료 처리 시스템이 소정의 기준에 따라 상기 텍스트 중 키워드를 도출하는 자료 처리 단계(s420), 및 상기 언어 학습 자료 처리 시스템이 상기 키워드에 대한 이미지 및 음성 정보 중 적어도 어느 하나 이상의 정보를 생성하는 자료 생성 단계(s430)를 포함한다.
또한, 언어 학습 자료 처리 방법은 상기 언어 학습 자료 처리 시스템이 상기 키워드와 이에 대응하고 상기 자료 생성 단계를 통해 생성한 이미지 및 음성 정보 중 적어도 어느 하나 이상의 정보를 매칭시킨 문제를 생성하는 문제 출제 단계(s440)를 더 포함할 수 있다.
여기서, 자료 처리 단계(s420)는, 상기 언어 학습 자료 처리 시스템이 상기 텍스트의 품사, 원형 및 상기 파일 내에서 사용된 빈도 중 적어도 어느 하나 이상의 소정의 기준에 따라 상기 텍스트 중 키워드를 도출하는 단계일 수 있다.
이에 더하여, 자료 처리 단계(s420)는, 상기 언어 학습 자료 처리 시스템이 상기 텍스트를 상기 파일 내에서 사용된 빈도를 기초로 정렬하는 정렬 과정(s421)과, 상기 언어 학습 자료 처리 시스템이 정렬 과정(s421)에 따라 정렬된 텍스트 중 동사 또는 명사의 품사를 지닌 텍스트의 원형을 키워드로 도출하는 도출 과정(s422)을 포함할 수 있다.
또한, 자료 생성 단계(s430)는, 상기 언어 학습 자료 처리 시스템이 상기 파일 내에서 상기 키워드가 포함된 문장을 번역하는 번역 과정(s431)과, 상기 키워드와 상기 문장의 번역문을 함께 이용하여 상기 키워드에 대한 이미지를 검색하는 검색 과정(s432) 및 상기 검색 과정을 토대로 검색된 이미지들 중 상기 키워드에 대응하는 이미지를 선정하는 선정 과정(s433)을 포함할 수 있다.
본 실시예의 일 구현예로서, 자료 생성 단계(s430)는 상기 언어 학습 자료 처리 시스템이 상기 키워드에 대응하는 이미지 카드를 생성하는 단계이고, 문제 출제 단계(s440)는 상기 언어 학습 자료 처리 시스템이 사용자가 상기 키워드와 상기 키워드에 대응하는 이미지 카드를 연결하도록 하는 문제를 생성하는 단계일 수 있다.
위와 다른 구현예로서, 자료 생성 단계(s430)는 상기 언어 학습 자료 처리 시스템이 상기 키워드에 대응하는 이미지 카드와 음성 파일을 생성하는 단계이고, 문제 출제 단계(s440)는 상기 언어 학습 자료 처리 시스템이 사용자가 상기 키워드와 상기 키워드에 대응하는 이미지 카드를 연결하도록 하는 문제를 생성하되 이와 함께 상기 키워드에 대응하는 음성 파일을 상기 사용자에게 제공하는 단계일 수 있다.
이상 지금까지 설명된 언어 학습 자료 처리 시스템(100)과 이를 이용한 언어 학습 자료 처리 방법은 각각 모바일 PC와 모바일 어플리케이션을 통해서도 구현이 가능하다. 예컨대, 언어 학습 자료 처리 시스템(100)은 스마트폰과 같은 형태로 구현될 수 있고, 언어 학습 자료 처리 시스템(100)을 구성하는 구성요소들의 기능들은 스마트폰에 장착된 무선 통신 기술(이미지 검색), 중앙 처리 장치(명령), 데이터 저장 및 처리 장치(텍스트 추출 및 음성화), 디스플레이(출제된 문제 표시) 등을 통해 구현될 수 있으며, 각 절차들은 스마트폰에 내장되어 있거나 다운로드 받은 스마트폰용 어플리케이션을 통해 수행이 가능하다.
또한, 이상에서 설명된 실시예들은 하드웨어 구성요소, 소프트웨어 구성요소, 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치, 방법 및 구성요소는, 예를 들어, 프로세서(processor), 컨트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 또한 본 발명의 다양한 실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다.
상술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 본 발명의 범위는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.

Claims (15)

  1. 언어 텍스트가 포함된 파일로부터 학습 문제를 제공하기 위한 언어 학습 자료 처리 시스템에 있어서,
    언어 텍스트가 포함된 추출 대상 파일로부터 상기 파일에 포함된 텍스트를 추출하는 자료 수집부;
    소정의 기준에 따라 상기 텍스트 중 키워드를 도출하는 자료 처리부; 및
    상기 키워드에 대한 이미지를 검색하여 상기 키워드에 대응하는 이미지를 생성하는 자료 생성부; 및
    사용자에게 상기 키워드와 상기 키워드에 대응하는 이미지 카드를 연결하도록 하는 학습 문제를 제공하기 위하여, 상기 키워드와 대응하고 상기 자료 생성부가 생성한 이미지 정보를 매칭시킨 문제를 생성하는 문제 출제부를 포함하되,
    상기 자료생성부는,
    선정된 키워드에 대응되는 이미지를 검색할 때에, 키워드가 포함된 문장 전체를 기계 번역한 번역문들을 함께 활용하는 것을 특징으로 하는 특징으로 하는 언어 학습 자료 처리 시스템.
  2. 제1항 있어서,
    상기 문제 출제부는 상기 키워드와 대응하는 음성을 추가로 생성하는 것을 특징으로 하는 언어 학습 자료 처리 시스템.
  3. 제1항 있어서,
    상기 자료 처리부는,
    상기 텍스트의 품사, 원형 및 상기 파일 내에서 사용된 빈도 중 적어도 어느 하나 이상의 소정의 기준에 따라 상기 텍스트 중 키워드를 도출하는 것을 특징으로 하는 언어 학습 자료 처리 시스템.
  4. 제3항 있어서,
    상기 자료 처리부는,
    상기 텍스트를 상기 파일 내에서 사용된 빈도를 기초로 정렬한 후, 정렬된 텍스트 중 동사 또는 명사의 품사를 지닌 텍스트의 원형을 키워드로 도출하는 것을 특징으로 하는 언어 학습 자료 처리 시스템.
  5. 삭제
  6. 제2항 있어서,
    상기 자료 생성부는 상기 키워드에 대응하는 이미지 카드를 생성하고,
    상기 문제 출제부는 사용자가 상기 키워드와 상기 키워드에 대응하는 이미지 카드를 연결하도록 하는 문제를 생성하는 것을 특징으로 하는 언어 학습 자료 처리 시스템.
  7. 제2항에 있어서,
    상기 자료 생성부는 상기 키워드에 대응하는 이미지 카드와 음성 파일을 생성하고,
    상기 문제 출제부는 사용자가 상기 키워드와 상기 키워드에 대응하는 이미지 카드를 연결하도록 하는 문제를 생성하되 이와 함께 상기 키워드에 대응하는 음성 파일을 상기 사용자에게 제공하는 것을 특징으로 하는 언어 학습 자료 처리 시스템.
  8. 제1항에 따른 언어 학습 자료 처리 시스템을 이용한 자료 처리 방법으로서,
    상기 언어 학습 자료 처리 시스템이 언어 텍스트가 포함된 추출 대상 파일로부터 상기 파일에 포함된 텍스트를 추출하는 자료 수집 단계;
    상기 언어 학습 자료 처리 시스템이 소정의 기준에 따라 상기 텍스트 중 키워드를 도출하는 자료 처리 단계; 및
    상기 언어 학습 자료 처리 시스템이 상기 키워드에 대한 이미지 정보를 생성하는 자료 생성 단계를 포함하는 것을 특징으로 하는 언어 학습을 위한 자료 처리 방법.
  9. 제8항에 있어서,
    상기 언어 학습 자료 처리 시스템이 상기 키워드와 이에 대응하고 상기 자료 생성 단계를 통해 생성한 이미지 정보를 매칭시킨 문제를 생성하는 문제 출제 단계를 더 포함하는 것을 특징으로 하는 언어 학습을 위한 자료 처리 방법.
  10. 제8항 있어서,
    상기 자료 처리 단계는,
    상기 언어 학습 자료 처리 시스템이 상기 텍스트의 품사, 원형 및 상기 파일 내에서 사용된 빈도 중 적어도 어느 하나 이상의 소정의 기준에 따라 상기 텍스트 중 키워드를 도출하는 단계인 것을 특징으로 하는 언어 학습을 위한 자료 처리 방법.
  11. 제10항 있어서,
    상기 자료 처리 단계는,
    상기 언어 학습 자료 처리 시스템이 상기 텍스트를 상기 파일 내에서 사용된 빈도를 기초로 정렬하는 정렬 과정과, 상기 언어 학습 자료 처리 시스템이 상기 정렬 과정에 따라 정렬된 텍스트 중 동사 또는 명사의 품사를 지닌 텍스트의 원형을 키워드로 도출하는 도출 과정을 포함하는 것을 특징으로 하는 언어 학습을 위한 자료 처리 방법.
  12. 제8항 있어서,
    상기 자료 생성 단계는,
    상기 언어 학습 자료 처리 시스템이 상기 파일 내에서 상기 키워드가 포함된 문장을 번역하는 번역 과정과, 상기 언어 학습 자료 처리 시스템이 상기 키워드와 상기 문장의 번역문을 함께 이용하여 상기 키워드에 대한 이미지를 검색하는 검색 과정 및 상기 언어 학습 자료 처리 시스템이 상기 검색 과정을 토대로 검색된 이미지들 중 상기 키워드에 대응하는 이미지를 선정하는 선정 과정을 포함하는 것을 특징으로 하는 언어 학습을 위한 자료 처리 방법.
  13. 제9항 있어서,
    상기 자료 생성 단계는 상기 언어 학습 자료 처리 시스템이 상기 키워드에 대응하는 이미지 카드를 생성하는 단계이고,
    상기 문제 출제 단계는 상기 언어 학습 자료 처리 시스템이 사용자가 상기 키워드와 상기 키워드에 대응하는 이미지 카드를 연결하도록 하는 문제를 생성하는 단계인 것을 특징으로 하는 언어 학습을 위한 자료 처리 방법.
  14. 제9항 있어서,
    상기 자료 생성 단계는 상기 언어 학습 자료 처리 시스템이 상기 키워드에 대응하는 이미지 카드와 음성 파일을 생성하는 단계이고,
    상기 문제 출제 단계는 상기 언어 학습 자료 처리 시스템이 사용자가 상기 키워드와 상기 키워드에 대응하는 이미지 카드를 연결하도록 하는 문제를 생성하되 이와 함께 상기 키워드에 대응하는 음성 파일을 상기 사용자에게 제공하는 단계인 것을 특징으로 하는 언어 학습을 위한 자료 처리 방법.
  15. 삭제
KR1020180086692A 2018-07-25 2018-07-25 언어 학습을 위한 자료 처리 시스템 및 방법 KR102098283B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180086692A KR102098283B1 (ko) 2018-07-25 2018-07-25 언어 학습을 위한 자료 처리 시스템 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180086692A KR102098283B1 (ko) 2018-07-25 2018-07-25 언어 학습을 위한 자료 처리 시스템 및 방법

Publications (2)

Publication Number Publication Date
KR20200011794A KR20200011794A (ko) 2020-02-04
KR102098283B1 true KR102098283B1 (ko) 2020-05-15

Family

ID=69571158

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180086692A KR102098283B1 (ko) 2018-07-25 2018-07-25 언어 학습을 위한 자료 처리 시스템 및 방법

Country Status (1)

Country Link
KR (1) KR102098283B1 (ko)

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100978685B1 (ko) * 2008-02-19 2010-08-30 주식회사 포스코아이씨티 객체 지향형 컨텐츠를 이용한 다국어 학습 서비스 제공방법 및 시스템
KR101210871B1 (ko) * 2009-08-21 2012-12-11 주식회사 다크호스 사용자 제작 학습 컨텐츠의 제공 방법 및 시스템
KR20110124417A (ko) * 2010-05-11 2011-11-17 주식회사 코원시스템 외국어 단어 학습 콘텐츠 제공 시스템 및 그 방법
KR101303204B1 (ko) * 2010-12-08 2013-09-03 주식회사 펀진 언어 학습을 위한 단어장 생성 방법
KR101505673B1 (ko) * 2013-03-22 2015-03-24 (주)네오넷코리아 단어의 의미를 기반으로 하는 다국어 검색 시스템, 다국어 검색 방법 및 이를 이용한 이미지 검색 시스템
KR20150138742A (ko) * 2014-06-02 2015-12-10 삼성전자주식회사 컨텐츠 처리 방법 및 그 전자 장치
KR20180029563A (ko) * 2016-09-13 2018-03-21 주식회사 티슈 이북 및 워드 문서의 요약본 작성 시스템과 이를 이용한 학습 방법

Also Published As

Publication number Publication date
KR20200011794A (ko) 2020-02-04

Similar Documents

Publication Publication Date Title
TWI684881B (zh) 基於機器翻譯的自動生成重述以產生一對話式代理人的方法、系統及非暫態機器可讀取媒體
US10803850B2 (en) Voice generation with predetermined emotion type
TWI629601B (zh) 提供翻譯與分類翻譯結果的系統,電腦可讀存儲媒體,檔案分配系統及其方法
Ke From EFL to English as an international and scientific language: Analysing Taiwan's high-school English textbooks in the period 1952–2009
JP6087333B2 (ja) 情報提供システム、情報提供方法、及びプログラム
KR102090237B1 (ko) 시맨틱 트리플 기반의 지식 확장 시스템, 방법 및 컴퓨터 프로그램
KR20200087977A (ko) 멀티모달 문서 요약 시스템 및 방법
CN114401431A (zh) 一种虚拟人讲解视频生成方法及相关装置
KR102146433B1 (ko) 연상기억법을 이용한 문맥 기반 언어 학습 서비스 제공 방법
US9898935B2 (en) Language system
Hasnine et al. An algorithm to evaluate appropriateness of still images for learning concrete nouns of a new foreign language
KR20120032121A (ko) 언어 학습 프로그램을 저장하는 컴퓨터로 판독 가능한 기록매체
Lee et al. Conversational knowledge teaching agent that uses a knowledge base
KR102098283B1 (ko) 언어 학습을 위한 자료 처리 시스템 및 방법
Zeki et al. A mobile dictionary for pilgrims
KR101994856B1 (ko) 전환이미지를 이용한 장기기억 유도 학습장치
Qin et al. Technology in second language writing: advances in composing, translation, writing pedagogy and data-driven learning
US20160267811A1 (en) Systems and methods for teaching foreign languages
KR20160140527A (ko) 다국어 전자책 시스템 및 방법
Calzolari et al. The Italian Language in the Digital Age
Ritchie et al. Language Landscape: supporting community-led language documentation
Pedersen et al. The Danish language in the digital age
Kaur et al. ClickIndia: Indian Language Learning Mobile Application
Alweendo et al. The Development of a Bilingual English-Oshikwanyama Dictionary App
Lyu et al. Machine translation of english identifiers in python programs into traditional chinese

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right