KR20170009486A - 청크 기반 언어 학습용 데이터베이스 구축 방법 및 이를 수행하는 전자 기기 - Google Patents

청크 기반 언어 학습용 데이터베이스 구축 방법 및 이를 수행하는 전자 기기 Download PDF

Info

Publication number
KR20170009486A
KR20170009486A KR1020150101630A KR20150101630A KR20170009486A KR 20170009486 A KR20170009486 A KR 20170009486A KR 1020150101630 A KR1020150101630 A KR 1020150101630A KR 20150101630 A KR20150101630 A KR 20150101630A KR 20170009486 A KR20170009486 A KR 20170009486A
Authority
KR
South Korea
Prior art keywords
chunk
icon
chunks
words
sub
Prior art date
Application number
KR1020150101630A
Other languages
English (en)
Inventor
박상준
Original Assignee
박상준
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 박상준 filed Critical 박상준
Priority to KR1020150101630A priority Critical patent/KR20170009486A/ko
Publication of KR20170009486A publication Critical patent/KR20170009486A/ko

Links

Images

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B19/00Teaching not covered by other main groups of this subclass
    • G09B19/06Foreign languages
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • G09B5/06Electrically-operated educational appliances with both visual and audible presentation of the material to be studied

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

본 발명은 청크 기반 언어 학습용 데이터베이스 구축 방법 및 이를 수행하는 전자 기기에 관한 것으로, 본 발명의 일 양상에 따르면, 복수의 단어가 포함된 텍스트 데이터를 획득하는 단계; 상기 복수의 단어를 청크로 구분하는 단계; 상기 텍스트 데이터에 대응되는 오디오 데이터를 획득하는 단계; 상기 오디오 데이터를 음성 인식하는 단계; 및 상기 음성 인식 결과에 따라 상기 청크 별로 상기 오디오 데이터의 대응되는 음성 구간을 매칭시키는 단계;를 포함하는 청크 기반 언어 학습용 데이터베이스 구축 방법을 제공할 수 있다.

Description

청크 기반 언어 학습용 데이터베이스 구축 방법 및 이를 수행하는 전자 기기{DATABASE GENERATING METHOD FOR CHUNK-BASED LANGUAGE LEARNING AND ELECTRONIC DEVICE PERFORMING THE SAME}
본 발명은 청크 기반 언어 학습용 데이터베이스 구축 방법 및 이를 수행하는 전자 기기에 관한 것으로, 보다 상세하게는 청크 단위를 기반으로 언어를 학습할 수 있는 청크 기반 언어 학습용 데이터베이스 구축 방법 및 이를 수행하는 전자 기기에 관한 것이다.
언어 학습에 있어 가장 중요한 2가지를 고르라면, 단어와 어순을 들 수 있다. 의사 표현의 최소 단위라 볼 수 있는 문장은 각각의 고유한 의미를 담고 있는 개별 단어들의 배열로 구성되기 때문에 단어는 언어 학습의 핵심이며 기본이다. 어순은 각각의 의미를 담고 있는 단어들이 어떤 순서로 배치되는가에 대한 부분인데, 올바른 순서로 배치되어야 정확한 의사 전달이 가능하며, 단어의 배치 순서가 바뀌어 정반대의 의미가 되는 경우도 있다.
따라서 단어에 대한 지식이 아무리 뛰어나다 하더라도 말하기나 쓰기를 할 때에는 알고 있는 단어를 늘어놓아서는 말이 되지 않는다. 특히 우리나라 사람들이 풍부한 영어 단어 지식에도 불구하고 말하기나 쓰기에 어려움을 많이 느끼는 경우가 많은데 이는 우리나라 말의 어순이 영어와 상이함에 기인한 바가 크다.
이에 대한 해결책으로 문자의 형식을 다루는 문법을 가르치게 되는데, 많은 문법지식이 영어의 말하기나 쓰기에 실질적인 도움이 되지 않는 경우가 많다. 이는 교육현장에서 문법이 수험지식으로 다뤄질 뿐, 상이한 어순 문제를 해결하는데 실효성있게 관여하지 못하기 때문이다. 어순 학습에 있어서는 문법지식에 기반한 어순지식보다는 주요한 문장 형식에 기반한 체계적인 어순 훈련이 보다 중요하다.
올바른 단어 학습에서는 개별 단어의 단어의 의미뿐만 아니라, 해당 단어의 청크(chunk, 말뭉치)와 콜로케이션(collacation) 정보 등을 포함한 것이어야 효과적이라 할 수 있다. 여기서 청크는 하나 이상의 단어로 구성된 단어 덩어리이다. 하나의 문장을 말할 때 우리는 머릿속으로 한꺼번에 생각하고 한꺼번에 말하는 것이 아니라, 적절한 의미단위(구)로 끊어서 사고하고 끊어서 말하게 된다. 예를 들어 “오늘 학교에서 수업 중에 책을 읽다가 졸았어요” 라는 문장을 말하고자 하는 사람의 머리 속에는 “오늘/학교에서/수업 중에/책을 읽다가/졸았어요/”와 같이 문장이 분리되어 사고되고 분리하여 말하게 된다.
이런 의미에서 청크는 사고의 단위 또는 말할 때의 호흡 단위라고도 볼 수 있으며, 함께 쓰이는 단어들에 대한 콜로케이션 정보 등을 포함한 언어 학습에 있어 매우 중요한 단위라 볼 수 있다. 콜로케이션은 어떤 언어 내에서 특정한 뜻을 나타낼 때 흔히 함께 쓰이는 단어들의 결합을 의미하는데, 예를 들어 “자살(suicide)의 경우, “자살하다”의 올바른 영어 표현은 “commit suicide”이다. 즉, “자살하다”라는 표현을 위해서는 “하다(do)” 나 “take/get” 등이 아닌 “저지르다(commit)”라는 동사를 함께 쓰게 되는데, 이 경우 commit과 suicide는 콜로케이션 관계에 있다고 볼 수 있다.
그런데, 기존의 언어 학습법에서는 단어 학습의 중요성은 강요하면서도 단어간의 콜로케이션에 대한 고려를 하지 않아 학습자가 청크 단위로 사고하기 어렵고 이에 따라 올바른 문장을 배우기 어려운 문제점이 있었다.
본 발명의 일 과제는 청크 단위를 기반으로 언어 학습을 제공하기 위한 청크 기반 언어 학습용 데이터베이스 구축 방법 및 이를 수행하는 전자 기기를 제공하는 것이다.
본 발명이 해결하고자 하는 과제가 상술한 과제로 제한되는 것은 아니며, 언급되지 아니한 과제들은 본 명세서 및 첨부된 도면으로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
본 발명의 일 양상에 따르면, 복수의 단어가 포함된 텍스트 데이터를 획득하는 단계; 상기 복수의 단어를 청크로 구분하는 단계; 상기 텍스트 데이터에 대응되는 오디오 데이터를 획득하는 단계; 상기 오디오 데이터를 음성 인식하는 단계; 및 상기 음성 인식 결과에 따라 상기 청크 별로 상기 오디오 데이터의 대응되는 음성 구간을 매칭시키는 단계;를 포함하는 청크 기반 언어 학습용 데이터베이스 구축 방법을 제공할 수 있다.
본 발명의 다른 양상에 따르면, 청크 기반 언어 학습용 데이터베이스를 구축하는 전자 기기로서, 복수의 단어가 포함된 텍스트 데이터를 청크로 구분하는 청크 구분 모듈; 상기 텍스트 데이터에 대응되는 오디오 데이터를 음성 인식하는 음성 인식 모듈; 및 상기 음성 인식 결과에 따라 상기 청크 별로 상기 오디오 데이터의 대응되는 음성 구간을 매칭시키는 매칭 모듈;을 포함하는 전자 기기를 제공할 수 있다.
본 발명의 과제의 해결 수단이 상술한 해결 수단들로 제한되는 것은 아니며, 언급되지 아니한 해결 수단들은 본 명세서 및 첨부된 도면으로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
본 발명에 의하면, 청크 단위를 기반으로 언어 학습을 할 수 있다.
본 발명의 효과가 상술한 효과들로 제한되는 것은 아니며, 언급되지 아니한 효과들은 본 명세서 및 첨부된 도면으로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확히 이해될 수 있을 것이다.
도 1은 본 발명의 실시예에 따른 전자 기기의 블록도이다.
도 2는 본 발명의 실시예에 따른 청크 기반 언어 학습용 데이터베이스 구축 방법의 순서도이다.
도 3은 본 발명의 실시예에 따른 텍스트 데이터를 도시한 도면이다.
도 4는 본 발명의 실시예에 따른 청크 단위로 구분된 텍스트 데이터를 도시한 도면이다.
도 5는 본 발명의 실시예에 따른 청크 테이블을 도시한 도면이다.
도 6은 본 발명의 실시예에 따른 오디오 데이터를 도시한 도면이다.
도 7은 본 발명의 실시예에 따른 오디오 데이터로부터 추출된 텍스트를 도시한 도면이다.
도 8은 본 발명의 실시예에 따른 음성 테이블을 도시한 도면이다.
도 9는 본 발명의 실시예에 따른 도면이다.
도 10은 본 발명의 제1 실시예에 따른 청크 학습법의 화면을 도시한 도면이다.
도 11은 본 발명의 제2 실시예에 따른 청크 학습법의 화면을 도시한 도면이다.
도 12는 본 발명의 제3 실시예에 따른 청크 학습법의 화면을 도시한 도면이다.
본 명세서에 기재된 실시예는 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 본 발명의 사상을 명확히 설명하기 위한 것이므로, 본 발명이 본 명세서에 기재된 실시예에 의해 한정되는 것은 아니며, 본 발명의 범위는 본 발명의 사상을 벗어나지 아니하는 수정예 또는 변형예를 포함하는 것으로 해석되어야 한다.
본 명세서에서 사용되는 용어는 본 발명에서의 기능을 고려하여 가능한 현재 널리 사용되고 있는 일반적인 용어를 선택하였으나 이는 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자의 의도, 관례 또는 새로운 기술의 출현 등에 따라 달라질 수 있다. 다만, 이와 달리 특정한 용어를 임의의 의미로 정의하여 사용하는 경우에는 그 용어의 의미에 관하여 별도로 기재할 것이다. 따라서 본 명세서에서 사용되는 용어는 단순한 용어의 명칭이 아닌 그 용어가 가진 실질적인 의미와 본 명세서의 전반에 걸친 내용을 토대로 해석되어야 한다.
본 명세서에 첨부된 도면은 본 발명을 용이하게 설명하기 위한 것으로 도면에 도시된 형상은 본 발명의 이해를 돕기 위하여 필요에 따라 과장되어 표시된 것일 수 있으므로 본 발명이 도면에 의해 한정되는 것은 아니다.
본 명세서에서 본 발명에 관련된 공지의 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에 이에 관한 자세한 설명은 필요에 따라 생략하기로 한다.
본 발명의 일 양상에 따르면, 복수의 단어가 포함된 텍스트 데이터를 획득하는 단계; 상기 복수의 단어를 청크로 구분하는 단계; 상기 텍스트 데이터에 대응되는 오디오 데이터를 획득하는 단계; 상기 오디오 데이터를 음성 인식하는 단계; 및 상기 음성 인식 결과에 따라 상기 청크 별로 상기 오디오 데이터의 대응되는 음성 구간을 매칭시키는 단계;를 포함하는 청크 기반 언어 학습용 데이터베이스 구축 방법을 제공할 수 있다.
또 상기 매칭시키는 단계는, 상기 텍스트 데이터와 상기 음성 인식 결과에 따라 상기 오디오 데이터로부터 획득된 음성 인식 텍스트를 비교하는 단계 및 상기 비교 결과에 따라 상기 청크와 동일한 음성 인식 텍스트가 추출된 음성 구간을 상기 청크 별로 매칭시킬 수 있다.
또 상기 텍스트 데이터를 획득하는 단계는, 사용자로부터 상기 텍스트 데이터를 입력받는 단계, 외부 기기로부터 상기 텍스트 데이터를 수신하는 단계 및 저장부로부터 상기 텍스트 데이터를 로딩하는 단계 중 적어도 하나일 수 있다.
또 상기 오디오 데이터를 획득하는 단계는, 사용자로부터 음성 입력을 통해 상기 오디오 데이터를 입력받는 단계, 외부 기기로부터 상기 오디오 데이터를 수신하는 단계, 저장부로부터 상기 오디오 데이터를 로딩하는 단계 및 텍스트-투-스피치(TTS: Text-To-Speech) 방식으로 상기 텍스트 데이터로부터 상기 오디오 데이터를 생성하는 단계 중 적어도 하나일 수 있다.
또 상기 구분하는 단계는, 상기 복수의 단어에 대하여 품사를 판단하는 단계, 상기 품사에 기초하여 미리 정해진 규칙에 따라 상기 복수의 단어 중 일 단어 또는 일련의 단어군이 상기 청크를 구성하는지 여부를 판단하는 단계 및 상기 판단 결과에 기초하여 상기 복수의 단어를 상기 청크로 구분하는 단계를 포함할 수 있다.
또 상기 구분하는 단계는, 저장부에 저장되어 있는 청크 테이블에 기초하여 상기 복수의 단어 중 일 단어 또는 일련의 단어군이 상기 청크를 구성하는지 여부를 판단하는 단계 및 상기 판단 결과에 기초하여 상기 복수의 단어를 상기 청크로 구분하는 단계를 포함할 수 있다.
또 상기 구분하는 단계는, 상기 청크 사이에 청크 구분자를 삽입하는 단계를 더 포함할 수 있다.
또 사용자 입력에 따라 상기 청크의 구분을 편집하는 단계;를 더 포함할 수 있다.
또 상기 편집하는 단계는, 상기 청크 구분자의 추가, 삭제 및 위치 변경 중 어느 하나에 관한 사용자 입력을 수신하는 단계 및 상기 사용자 입력에 따라 상기 청크의 구분을 편집하는 단계를 포함할 수 있다.
또 상기 구분하는 단계는, 상기 청크 사이에 청크 구분자를 삽입하는 사용자 입력을 수신하는 단계 및 상기 사용자 입력에 따라 상기 복수의 단어를 상기 청크로 구분하는 단계를 포함할 수 있다.
또 상기 구분하는 단계는, 상기 청크 중 적어도 일부를 서브 청크로 구분하는 단계를 포함할 수 있다.
또 상기 구분하는 단계는, 상기 청크 사이에 청크 구분자를 삽입하는 단계 및 상기 서브 청크 사이에 서브 청크 구분자를 삽입하는 단계를 더 포함할 수 있다.
또 상기 매칭시키는 단계는, 상기 음성 인식 결과에 따라 상기 서브 청크 별로 상기 서브 청크가 속하는 청크에 매칭된 음성 구간 중 대응되는 음성 구간을 매칭시키는 단계를 포함할 수 있다.
또 상기 청크에 대응되는 청크 아이콘을 순차적으로 디스플레이하고, 상기 청크 중 상기 서브 청크를 가지는 청크에 대하여 상기 청크 아이콘에 서브 청크 아이콘을 추가하여 디스플레이하는 단계; 및 상기 청크 아이콘 및 상기 서브 청크 아이콘 중 적어도 하나를 선택하는 사용자 입력을 수신받은 경우, 상기 선택된 아이콘에 대응되는 청크 및 서브 청크 중 적어도 하나에 매칭된 음성 구간을 음성 출력하는 단계;를 더 포함할 수 있다.
또 상기 청크에 대응되는 청크 아이콘을 순차적으로 디스플레이하는 단계; 및 상기 청크 아이콘을 선택하는 사용자 입력을 수신받은 경우, 상기 선택된 청크 아이콘에 대응되는 청크에 매칭된 음성 구간을 음성 출력하는 단계;를 더 포함할 수 있다.
또 상기 청크 아이콘 사이에 연결 아이콘을 디스플레이하는 단계; 및 어느 하나의 상기 연결 아이콘을 선택하는 사용자 입력을 수신받은 경우, 최초의 청크 아이콘부터 상기 연결 아이콘의 바로 뒤에 위치하는 청크 아이콘까지에 대응되는 청크에 매칭된 음성 구간을 이어서 음성 출력하는 단계;를 더 포함할 수 있다.
본 발명의 다른 양상에 따르면, 청크 기반 언어 학습용 데이터베이스를 구축하는 전자 기기로서, 복수의 단어가 포함된 텍스트 데이터를 청크로 구분하는 청크 구분 모듈; 상기 텍스트 데이터에 대응되는 오디오 데이터를 음성 인식하는 음성 인식 모듈; 및 상기 음성 인식 결과에 따라 상기 청크 별로 상기 오디오 데이터의 대응되는 음성 구간을 매칭시키는 매칭 모듈;을 포함하는 전자 기기를 제공할 수 있다.
또 상기 매칭 모듈은, 상기 텍스트 데이터와 상기 음성 인식 결과에 따라 상기 오디오 데이터로부터 획득된 음성 인식 텍스트를 비교하고, 상기 비교 결과에 따라 상기 청크와 동일한 음성 인식 텍스트가 추출된 음성 구간을 상기 청크 별로 매칭시킬 수 있다.
또 상기 청크 구분 모듈은, 상기 복수의 단어에 대하여 품사를 판단하고, 상기 품사에 기초하여 미리 정해진 규칙에 따라 상기 복수의 단어 중 일 단어 또는 일련의 단어군이 상기 청크를 구성하는지 여부를 판단하고, 상기 판단 결과에 기초하여 상기 복수의 단어를 상기 청크로 구분할 수 있다.
또 상기 청크 구분 모듈은, 저장부에 저장되어 있는 청크 테이블에 기초하여 상기 복수의 단어 중 일 단어 또는 일련의 단어군이 상기 청크를 구성하는지 여부를 판단하고, 상기 판단 결과에 기초하여 상기 복수의 단어를 상기 청크로 구분할 수 있다.
또 상기 청크 구분 모듈은, 상기 청크 사이에 청크 구분자를 삽입할 수 있다.
또 상기 청크 사이에 청크 구분자를 삽입하는 사용자 입력을 수신하는 입력 모듈;을 더 포함하고, 상기 청크 구분 모듈은, 상기 사용자 입력에 따라 상기 복수의 단어를 상기 청크로 구분할 수 있다.
또 상기 청크 구분 모듈은, 상기 청크 중 적어도 일부를 서브 청크로 구분할 수 있다.
또 상기 청크 구분 모듈은, 상기 청크 사이에 청크 구분자를 삽입하고, 상기 서브 청크 사이에 서브 청크 구분자를 삽입할 수 있다.
또 상기 매칭 모듈은, 상기 음성 인식 결과에 따라 상기 서브 청크 별로 상기 서브 청크가 속하는 청크에 매칭된 음성 구간 중 대응되는 음성 구간을 매칭시킬 수 있다.
또 상기 청크에 대응되는 청크 아이콘을 순차적으로 디스플레이하고, 상기 청크 중 상기 서브 청크를 가지는 청크에 대하여 상기 청크 아이콘에 서브 청크 아이콘을 추가하여 디스플레이하는 디스플레이; 및 상기 청크 아이콘 및 상기 서브 청크 아이콘 중 적어도 하나를 선택하는 사용자 입력을 수신받은 경우, 상기 선택된 아이콘에 대응되는 청크 및 서브 청크 중 적어도 하나에 매칭된 음성 구간을 음성 출력하는 스피커;를 더 포함할 수 있다.
또 상기 청크에 대응되는 청크 아이콘을 순차적으로 디스플레이하는 디스플레이; 및 상기 청크 아이콘을 선택하는 사용자 입력을 수신받은 경우, 상기 선택된 청크 아이콘에 대응되는 청크에 매칭된 음성 구간을 음성 출력하는 스피커;를 더 포함할 수 있다.
또 상기 디스플레이는, 상기 청크 아이콘 사이에 연결 아이콘을 디스플레이하고, 상기 스피커는, 어느 하나의 상기 연결 아이콘을 선택하는 사용자 입력을 수신받은 경우, 최초의 청크 아이콘부터 상기 연결 아이콘의 바로 뒤에 위치하는 청크 아이콘까지에 대응되는 청크에 매칭된 음성 구간을 이어서 음성 출력할 수 있다.
청크 학습법은 영어 능력의 근간인 영어 문장 구조 능력이 빠른 시간 안에 효율적으로 완성되도록 단어가 아닌 의미있는 청크 단위로 학습시켜 영어 문장 응용 능력을 증가시키는 학습법이다. 예를 들어, 영어 문장을 시작부, 핵심부, 수식부의 세 부분으로 나누어 각 부분 중요 청크를 익혀 조합하는 훈련을 하면 약 500개의 청크로 약 300만개의 영어 문장을 자유자재로 만들어 낼 수 있는 문장 응용력이 생긴다.
이러한 청크 학습법은 영어에만 적용되는 것은 아니며, 일본어, 중국어 및 독일어 등 다양한 언어에 적용 가능하다. 다만, 본 발명의 실시예에서는 영어를 중심으로 설명하기로 한다.
본 발명의 실시예에서 청크는 주어와 동사, 전치사와 명사로 이루어진 전명구, 준동사구, 접속사절 중에 하나로 이루어진다. 준동사구는 예를 들어, to 부정사구, 현재 분사구(~ing), 과거 분사구(p.p)들 중에 하나일 수 있다. 따라서 영어 분장은 하나의 의미그룹을 형성하는 적어도 하나의 청크로 형성됨을 알 수 있다.
이하에서는 후술할 청크 기반 언어 학습용 데이터베이스 구축 방법을 수행하는 본 발명의 실시예에 따른 전자 기기에 관하여 설명한다.
본 발명에서 설명되는 전자 기기는 데스크 탑 컴퓨터를 비롯하여 노트북 컴퓨터(Laptor computer), 태블릿 PC 등의 형태로 제공될 수 있다. 물론 전자 기기(1000)가 상술한 예로 한정되는 것은 아니며 이외에도 입출력 인터페이스와 연산처리 기능을 가져 후술할 청크 기반 언어 학습용 데이터베이스 구축 방법을 수행할 수 있는 다양한 형태로 제공될 수 있다.
이하에서는 본 발명의 실시예에 따른 전자 기기에 관하여 도 1을 참조하여 설명한다.
도 1은 본 발명의 실시예에 따른 전자 기기의 블록도이다. 도 1을 참조하면, 본 발명의 일 실시예에 따른 전자 기기는 입력부(1200), 출력부(1500), 통신부(1100), 저장부(1300) 및 제어부(1400)를 포함할 수 있다. 이하에서는 전자 기기의 각 구성 요소에 관하여 설명한다.
입력부(1200)는 사용자로부터 사용자 입력을 수신할 수 있다. 사용자 입력은 키 입력, 터치 입력, 음성 음력을 비롯한 다양한 형태로 이루어질 수 있다. 이러한 사용자 입력을 받을 수 있는 입력부(1200)의 예로는 전통적인 형태의 키패드나 키보드, 마우스는 물론, 사용자의 터치를 감지하는 터치 센서, 음성 신호를 입력받는 마이크, 영상 인식을 통해 제스처 등을 인식하는 카메라, 사용자 접근을 감지하는 조도 센서나 적외선 센서 등으로 구성되는 근접 센서, 가속도 센서나 자이로 센서 등을 통해 사용자 동작을 인식하는 모션 센서 및 그 외의 다양한 형태의 사용자 입력을 감지하거나 입력받는 다양한 형태의 입력 수단을 모두 포함하는 포괄적인 개념이다. 여기서, 터치 센서는 디스플레이 패널에 부착되는 터치 패널이나 터치 필름을 통해 터치를 감지하는 압전식 또는 정전식 터치 센서, 광학적인 방식에 의해 터치를 감지하는 광학식 터치 센서 등으로 구현될 수 있다.
이외에도 입력부(1200)는 자체적으로 사용자 입력을 감지하는 장치 대신 전자 기기에 사용자 입력을 입력받는 외부의 입력 장치를 연결시키는 입력 인터페이스(USB 포트, PS/2 포트 등)의 형태로 구현될 수도 있다.
출력부(1500)는 각종 정보를 출력해 사용자에게 이를 제공할 수 있다. 이러한 출력부(1500)는 영상을 출력하는 디스플레이부(1520), 소리를 출력하는 스피커 형태의 음성 출력부(1510)를 포함할 수 있으며, 진동을 발생시키는 햅틱 장치 및 그 외의 다양한 형태의 출력 수단을 모두 포함할 수 있다. 출력부(1500)는 전자 기기에 상술한 개별 출력 수단을 연결시키는 포트 타입의 출력 인터페이스의 형태로 구현될 수도 있다.
여기서 일 예로, 디스플레이부(1520)는 텍스트, 정지 영상 및 동영상 등을 디스플레이 할 수 있다. 디스플레이는 액정 디스플레이(LCD: Liquid Crystal Display), 발광 다이오드(LED: light emitting diode) 디스플레이, 유기 발광 다이오드(OLED: Organic Light Emitting Diode) 디스플레이, 평판 디스플레이(FPD: Flat Panel Display), 투명 디스플레이(transparent display), 곡면 디스플레이(Curved Display), 플렉시블 디스플레이(flexible display), 3차원 디스플레이(3D display), 홀로그래픽 디스플레이(holographic display), 프로젝터 및 그 외의 영상 출력 기능을 수행할 수 있는 다양한 형태의 장치를 모두 포함하는 광의의 영상 표시 장치를 의미하는 개념이다. 이러한 디스플레이는 입력부(1200)의 터치 센서와 일체로 구성된 터치 디스플레이의 형태일 수도 있다.
통신부(1100)는 외부 기기와 통신을 수행할 수 있다. 이에 따라 전자 기기는 외부 기기와 각종 정보를 송수신할 수 있다. 여기서, 통신, 즉 데이터의 송수신은 유선 또는 무선으로 이루어질 수 있다. 이를 위해 통신부(1100)는 LAN(Local Area Network)를 통해 인터넷 등에 접속하는 유선 통신 모듈, 이동 통신 기지국을 거쳐 이동 통신 네트워크에 접속하여 데이터를 송수신하는 이동 통신 모듈, 와이파이(Wi-Fi) 같은 WLAN(Wireless Local Area Network) 계열의 통신 방식이나 블루투스(Bluetooth), 직비(Zigbee)와 같은 WPAN(Wireless Personal Area Network) 계열의 통신 방식을 이용하는 근거리 통신 모듈, GPS(Global Positioning System)과 같은 GNSS(Global Navigation Satellite System)을 이용하는 위성 통신 모듈 또는 이들의 조합으로 구성될 수 있다.
저장부(1300)는 각종 정보를 저장할 수 있다. 저장부(1300)는 데이터를 임시적으로 또는 반영구적으로 저장할 수 있다. 저장부(1300)의 예로는 하드 디스크(HDD: Hard Disk Drive), SSD(Solid State Drive), 플래쉬 저장부(flash memory), 롬(ROM: Read-Only Memory), 램(RAM: Random Access Memory) 등이 있을 수 있다. 이러한 저장부(1300)는 전자 기기에 내장되는 형태나 전자 기기에 탈부착 가능한 형태로 제공될 수 있다.
저장부(1300)에는 전자 기기를 구동하기 위한 운용 프로그램(OS: Operating System), 후술할 본 발명의 실시예에 따른 음성, 이미지 및 동영상 등과 같은 콘텐츠를 재생하거나 출력하기 위한 데이터 등과 같이 전자 기기를 구동하는데 필요하거나 이용되는 각종 데이터가 저장될 수 있다.
제어부(1400)는 전자 기기의 전반적인 동작을 제어한다. 이를 위해 제어부(1400)는 각종 정보의 연산 및 처리를 수행하고 전자 기기의 구성요소들의 동작을 제어할 수 있다. 제어부(1400)는 하드웨어 소프트웨어 또는 이들의 조합에 따라 컴퓨터나 이와 유사한 장치로 구현될 수 있다. 하드웨어적으로 제어부(1400)는 전기적인 신호를 처리하여 제어 기능을 수행하는 전자 회로 형태로 제공될 수 있으며, 소프트웨어적으로는 하드웨어적인 제어부(1400)를 구동시키는 프로그램 형태로 제공될 수 있다.
예를 들어, 제어부(1400)는 청크 구분 모듈, 인식 모듈 및 매칭 모듈 등과 같은 모듈을 포함할 수 있다.
청크 구분 모듈은 복수의 단어가 포함된 텍스트 데이터를 청크로 구분할 수 있으며, 좀 더 상세하게는 복수의 단어에 대하여 품사를 판단하고, 품사에 기초하여 미리 정해진 규칙에 따라 복수의 단어 중 일 단어 또는 일련의 단어군이 청크를 구성하는지 여부를 판단하고 판단 결과에 기초하여 복수의 단어를 청크로 구분할 수 있다. 그리고 저장부에 저장되어 있는 청크 테이블에 기초하여 복수의 단어 중 일 단어 또는 일련의 단어군이 청크를 구성하는지 여부를 판단하고 판단 결과에 기초하여 복수의 단어를 청크로 구분하는 것도 가능하다. 이러한 청크 구분 모듈은 청크 사이에 청크 구분자를 삽입하거나 서브 청크 구분자를 삽입함으로써, 청크 및 서브 청크를 구분할 수 있다.
인식 모듈은 텍스트 데이터에 대응되는 오디오 데이터를 음성 인식하며, 텍스트 투 스피치(TTS: Text-To-Speech)를 통해 음성 인식이 가능하다.
매칭 모듈은 음성 인식 결과에 따라 청크 별로 오디오 데이터의 대응되는 음성 구간을 매칭시킬 수 있다. 매칭 모듈은 텍스트 데이터와 음성 인식 결과에 따라 오디오 데이터로부터 획득된 음성 인식 텍스트를 비교하고 비교 결과에 따라 청크와 동일한 음성 인식 텍스트가 추출된 음성 구간을 청크별로 매칭할 수 있다.
한편, 이하의 설명에서 특별한 언급이 없는 경우에는 전자 기기의 동작은 제어부(1400)의 제어에 의해 수행되는 것으로 해석될 수 있다.
이하에서는 청크 기반 언어 학습용 데이터베이스 구축 방법에 관하여 설명한다.
도 2는 본 발명의 실시예에 따른 청크 기반 언어 학습용 데이터베이스 구축 방법의 순서도이다.
도 2를 참조하면, 청크 기반 언어 학습용 데이터베이스 구축 방법은 텍스트 데이터를 획득하는 단계(S110), 텍스트 데이터를 청크로 구분하는 단계(S120), 청크 테이블을 생성하는 단계(S130), 오디오 데이터를 획득하는 단계(S140), 오디오 데이터로부터 텍스트를 인식하는 단계(S140), 오디오 데이터로부터 텍스트를 인식하는 단계(S150), 오디오 테이블을 생성하는 단계(S160) 및 청크 테이블과 오디오 테이블을 매칭시켜 청크 기반 언어 학습용 데이터베이스를 생성하는 단계(S170)를 포함할 수 있다.
이하에서는 상술한 청크 기반 언어 학습용 데이터베이스 구축 방법의 각 단계에 관하여 도 3 내지 도 9를 참조하여 보다 구체적으로 설명하기로 한다.
도 3은 본 발명의 실시예에 따른 텍스트 데이터를 도시한 도면이다.
먼저, 도 3을 참조하면, 텍스트 데이터를 획득할 수 있다(S110). 텍스트 데이터는 문장, 문단 또는 글의 형태로 제공될 수 있다. 예를 들어, “Samson fell in love with a woman named Delilah who lived in a valley of Sorek.”으로 제공될 수 있다. 이러한 텍스트 데이터는 외부 기기 및 저장부(1300)에 미리 저장되어 있을 수 있으며, 통신부(1100)를 통해 수신할 수도 있다. 그리고 사용자로부터 텍스트 데이터를 입력 받는 것도 가능하다.
한편, 텍스트 데이터는 사용자에 의해 편집 가능하며, 이 경우 사용자 인증을 통해, 인증된 사용자만 편집 가능하게 제어될 수 있다.
도 4는 본 발명의 실시예에 따른 청크 단위로 구분된 텍스트 데이터를 도시한 도면이다.
도 4를 참조하면, 준비된 텍스트 데이터를 청크 단위로 구분할 수 있다(S120). 텍스트 데이터를 청크 단위로 나누기 위해 청크 구분자 및 서브 청크 구분자 중 적어도 하나가 제공될 수 있다.
청크를 구분하는 단계(S120)은 일 예에 의하면 텍스트 데이터에 청크 구분자나 서브 청크 구분자를 삽입하는 사용자 입력에 따라 이루어질 수 있다.
구체적으로 사용자에 의한 청크의 구분은 청크 구분자를 청크 사이에 삽입하여 이루어 질 수 있으며, 청크 구분자는 단어와 단어, 단어와 숙어 또는 숙어와 숙어 사이 등 청크와 청크 사이에 생성될 수 있다. 이때, 청크의 길이가 길거나 발음이 어려운 경우, 서브 청크 구분자를 단어와 단어 사이에 생성함으로써, 청크를 청크보다 작은 단위로 나눌 수 있다. 예를 들어, “Samson fell + in love / with a woman / named Delilah / who lived / in a valley of Sorek.”에서 “Samson fell in love”는 fell 과 in 사이에 서브 청크 구분자를 생성하여 “Samson fell + in love”으로 제공할 수 있다.
한편, 본 발명에서는 청크 구분자를 “/”로 표기하고 서브 청크 구분자를 “+”로 표기하였으나, 청크 구분자와 서브 청크 구분자를 구별할 수 있는 표기법을 사용한다면, “/”와 “+”이외의 다양한 표기로 생성하는 것도 가능하다. 다만, 텍스트 데이터에 포함될 수 있는 숫자, “.” 또는 “,” 등과 같은 부호는 피하는 것이 좋다.
이와 달리 청크 구분은 제어부(1400)가 텍스트 데이터에 포함된 단어의 품사를 판단하고, 그 품사로 된 단어 또는 일련의 단어군이 미리 정해진 규칙에 따라 청크를 구성하는 여부에 따라 청크인지 여부를 판단함으로써 이루어질 수 있다. 예를 들어, 미리 정해진 규칙은 “전치사+관사+명사”인 일련의 단어군을 청크로 결정하는 규칙으로서 제어부(1400)는 도 3의 문장에서 “with a woman”의 품사를 “전치사+관사+명사”로 판단하여 이를 청크로 인식할 수 있다.
또는 청크의 구분은 저장부(1300)에 청크 테이블이 미리 저장되어 있고 제어부(1400)가 이를 참조하면서 주어진 문장에서 청크를 추출할 수 있다. 예를 들어, “with a woman”이 하나의 청크로 청크 테이블에 저장되어 있고, 제어부(1400)는 이를 참조하여 도 3의 문장이 주어진 경우 해당 부분을 청크로 인식할 수 있는 것이다.
이처럼 제어부(1400)가 미리 정해진 규칙이나 청크 테이블을 참조하여 청크를 구분한 경우에 구분된 청크 사이와 서브 청크 사이에는 사용자 입력 시와 유사하게 청크 구분자나 서브 청크 구분자를 삽입할 수 있다. 이후 이와 같이 청크 구분자나 서브 청크 구분자가 삽입된 텍스트 데이터에 대하여 청크 구분자나 서브 청크 구분자를 삭제, 추가하거나 이들의 위치를 변경하는 사용자 입력에 의해 제어부(1400)에 의해 자동적으로 청크 구분된 텍스트 데이터를 사용자가 수동으로 편집하는 것이 가능하다.
또 한편, 텍스트 데이터를 획득할 때, 청크 단위로 구분된 상태의 텍스트 데이터를 획득할 경우, 텍스트 데이터를 청크 단위로 구분하는(S120) 단계는 생략 가능하다.
도 5는 본 발명의 실시예에 따른 청크 테이블을 도시한 도면이다.
도 5를 참조하면, 청크 구분자 및 서브 청크 구분자가 생성된 텍스트 데이터를 기준으로 청크 테이블을 생성할 수 있다(S130).
청크 테이블에는 청크 ID, sub 청크 ID, Chapter ID 및 텍스트 등이 제공될 수 있다.
청크 ID 및 sub 청크 ID는 청크 및 sub 청크를 각각의 식별자로 구분할 수 있다. Chapter ID는 텍스트 데이터의 대분류를 나타내는 식별자이며, 1번 책의 1번 챕터의 1단락 등의 정보를 Chapter ID를 통해 구분할 수 있다.
이러한 청크 테이블은 예를 들어, “Samson fell + in love / with a woman / named Delilah / who lived / in a valley of Sorek.”은 -1-번 Chapter에 총 5개의 청크와 2개의 서브 청크로 구분될 수 있다. 즉, #1 청크(Samson fell in love)는 ①서브 청크(Samson fell)와 ②서브 청크(in love)로 구분될 수 있다.
이러한 방법으로 텍스트 데이터를 토대로 청크 테이블을 구축할 수 있다.
도 6은 본 발명의 실시예에 따른 오디오 데이터를 도시한 도면이다.
도 6을 참조하면, 오디오 데이터를 획득할 수 있다(S140). 오디오 데이터는 저장부(1300)에 미리 저장되어 있거나, 통신부(1100)를 통해 수신 받을 수 있다. 그리고 텍스트 투 스피치(TTS: Text-To-Speech) 방식으로 텍스트 데이터로부터 오디오 데이터를 생성할 수 있다. 또 사용자로부터 입력 받는 것도 가능하다. 사용자로부터 직접 입력 받을 때에는, 마이크 등의 입력 부재를 통해 입력될 수 있다.
도 7은 본 발명의 실시예에 따른 오디오 데이터로부터 추출된 텍스트를 도시한 도면이다.
도 7을 참조하면, 오디오 데이터로부터 텍스트를 인식할 수 있다(S150).
오디오 데이터는 스피치 투 텍스트(SST: Speech-To-Text)를 통해 텍스트화 할 수 있다. 스피치 투 텍스트는 음성의 주파수 특징을 분석한 후 그 분석 결과에 대응하는 음성을 검색하여 음성을 인식하고, 음성 인식이 끝나면 인식된 음성을 텍스트로 변환할 수 있다. 이때, 음성의 특징을 분석하여, 음성의 크기 및 길이에 따라 텍스트를 서로 다르게 표현할 수 있다. 즉, 음성의 크기 및 길이를 소정 임계치와 비교 판단하여 음성 구간에 대응하는 텍스트의 속성을 변경할 수 있다.
도 8은 본 발명의 실시예에 따른 오디오 테이블을 도시한 도면이다.
도 8을 참조하면, 오디오 테이블을 생성할 수 있다(S160).
오디오 테이블은 오디오 ID와 오디오 파일로 제공될 수 있다. 각각의 오디오 파일에 따른 오디오 ID를 부여하여 각각의 오디오 파일을 구분할 수 있다.
도 9는 본 발명의 실시예에 청크 기반 언어 학습용 데이터베이스를 도시한 도면이다.
도 9를 참조하면, 청크 테이블과 오디오 테이블을 매칭시켜 청크 기반 언어 학습용 데이터베이스를 생성할 수 있다(S170). 오디오 테이블과 청크 테이블을 매칭하여, 각 청크별로 오디오 파일이 매칭될 수 있다. 예를 들어, #2 청크(with a woman)에 매칭되는 오디오 파일이 단일 파일로 제공될 수 있다.
이러한 방법으로 최종 청크 오디오 파일이 추출될 수 있다.
최종 청크 오디오 파일은 각 청크별 또는 서브 청크별로 청크 오디오 파일이 제공될 수 있으며, 이러한 청크 오디오 파일은 디스플레이부(1520)에 디스플레이되는 아이콘에 수신되는 사용자 신호 입력에 따라 스피커를 통해 출력될 수 있다.
이하에서는 청크 오디오 파일이 출력되는 아이콘에 관하여 설명한다.
도 10는 본 발명의 제1 실시예에 따른 청크 학습법의 화면을 도시한 도면이고, 도 11은 본 발명의 제2 실시예에 따른 청크 학습법의 화면을 도시한 도면이고, 도 12는 본 발명의 제3 실시예에 따른 청크 학습법의 화면을 도시한 도면이다.
도 10을 참조하면, 디스플레이부(1520)에는 청크 아이콘(CH) 및 연결 아이콘(C)이 디스플레이 될 수 있다.
청크 아이콘(CH)은 청크 오디오 파일이 저장되어 순차적으로 디스플레이 될 수 있으며, 각각의 청크 아이콘(CH)에는 청크 오디오 파일에 매칭되는 텍스트가 적혀있을 수 있다. 이러한 청크 아이콘(CH)을 사용자가 실행시켰을 때, 청크 오디오 파일이 재생될 수 있다. 예를 들어, “Samson fell in love”가 적혀있는 청크 아이콘(CH)을 사용자가 실행 시켰을 때, “Samson fell in love”에 매칭되는 청크 오디오 파일이 재생될 수 있다.
한편, 청크 아이콘(CH)에 텍스트가 적혀져 있지 않고 사용자가 청크 아이콘(CH)을 실행 시켰을 때, 실행되는 청크 오디오 파일에 매칭되는 텍스트가 청크 아이콘(CH)에 표현되는 것도 가능하다.
연결 아이콘(C)은 청크 아이콘(CH)과 청크 아이콘(CH) 사이에 제공될 수 있다. 이러한 연결 아이콘(C)은 어느 하나의 연결 아이콘(C)을 선택하는 사용자 입력을 수신 받은 경우, 최초의 청크 아이콘(CH)부터 연결 아이콘의 바로 뒤에 위치하는 청크 아이콘(CH)까지에 대응되는 청크에 매칭된 음성 구간을 이어서 스피커를 통해 음성 출력할 수 있다. 이때, 연결 아이콘(C)에는 “+”, ”*” 등과 같은 부호가 적혀져 있을 수 있다. 이러한 연결 아이콘(C)을 사용자가 실행 시켰을 때, 연결 아이콘(C)의 왼쪽에 디스플레이 되는 청크 아이콘(CH)들과 연결 아이콘(C)과 인접한 오른쪽에 디스플레이 되는 청크 아이콘(CH)에 매칭되는 청크 오디오 파일이 재생될 수 있다. 이때, 청크 오디오 파일들은 끊김 없이 연결되어 재생될 수 있다. 예를 들어, “named Delilah” 와 “who lived” 사이의 연결 아이콘(C)을 사용자가 실행 시켰을 때, “Samson fell in love with a woman named Delilah who lived”가 재생될 수 있다.
도 11을 참조하면, 디스플레이부(1520)에는 청크 아이콘(CH), 연결 아이콘(C) 및 그래픽 아이콘(G)이 디스플레이 될 수 있다. 다만, 제1 실시예에서는 청크 아이콘(CH) 및 연결 아이콘(C)만 디스플레이 되는데 반해, 제2 실시예에서는 그래픽 아이콘(G)이 추가로 디스플레이 될 수 있다.
제2 실시예에서의 청크 아이콘(CH) 및 연결 아이콘(C)은 제1 실시예에서의 청크 아이콘(CH) 및 연결 아이콘(C)과 동일하므로, 그에 대한 설명은 생략한다.
제2 실시예에서 그래픽 아이콘(G)에는 청크 아이콘(CH)과 관련된 동영상 또는 이미지가 내장될 수 있다. 그래픽 아이콘(G)은 청크 아이콘(CH)과 매칭되도록 디스플레이 될 수 있으며, 청크 아이콘(CH)의 상측, 하측 또는 좌측 등에 디스플레이 될 수 있다.
이러한 그래픽 아이콘(G)은 각각의 그래픽 아이콘(G)에 매칭되는 청크 아이콘(CH) 및 연결 아이콘(C)을 실행시켰을 때, 재생될 수 있다.
이때, 그래픽 아이콘(G)에 동영상이 내장될 경우, 사용자가 청크 아이콘(CH)을 실행 시켰을 때, 정지 상태에 있던 동영상이 재생될 수 있으며, 사용자가 연결 아이콘(C)을 실행 시켰을 때에는, 재생되는 청크 오디오 파일에 매칭되는 동영상이 차례로 재생될 수 있다.
그리고 그래픽 아이콘(G)이 이미지가 내장될 경우, 사용자가 청크 아이콘(CH)을 실행 시켰을 때, 흑백 상태의 이미지가 컬러로 변할 수 있으며, 사용자가 연결 아이콘(C)을 실행 시켰을 때에는, 재생되는 청크 오디오 파일에 매칭되는 이미지가 순서대로 컬러로 변할 수 있다.
한편, 사용자가 청크 아이콘(CH) 또는 연결 아이콘(C)을 실행 시켰을 때, 그래픽 아이콘(G)이 확대되면서 실행되는 것도 가능하다.
도 12를 참조하면, 디스플레이부(1520)에는 청크 아이콘(CH), 연결 아이콘(C), 그래픽 아이콘(G) 및 서브 청크 아이콘(SC)이 디스플레이 될 수 있다. 다만, 제3 실시예에서는 청크 아이콘(CH), 연결 아이콘(C) 및 그래픽 아이콘(G)만 디스플레이 되는데 반해, 제3 실시예에서는 서브 청크 아이콘(SC)이 추가로 디스플레이 될 수 있다.
제3 실시예에서의 청크 아이콘(CH), 연결 아이콘(C) 및 그래픽 아이콘(G)은 제2 실시예에서의 청크 아이콘(CH), 연결 아이콘(C) 및 그래픽 아이콘(G)과 동일하므로, 그에 대한 설명은 생략한다.
서브 청크 아이콘(SC)은 서브 청크로 나눈 청크가 있을 경우, 디스플레이 되며, 청크 아이콘(CH)에 인접한 곳에 디스플레이될 수 있다. 이때, 서브 청크 아이콘(SC)에는 숫자 또는 문자 등이 적혀있을 수 있다.
사용자가 서브 청크 아이콘(SC)을 실행시켰을 때, 서브 청크 단위로 제공되는 청크 오디오 파일이 재생될 수 있다. 예를 들어, “Samson fell in love”는 “Samson fell”과 “in love”의 2 개의 서브 청크로 나뉠 수 있으며, 도 11의 ①을 실행시켰을 때, “Samson fell”의 청크 오디오 파일이 재생되고 ②를 실행시켰을 때, “in love”의 청크 오디오 파일이 재생될 수 있다.
한편, 실질적으로 서브 청크 아이콘(SC)은 청크 아이콘(CH)과 동일하며, 청크 단위의 크기만 다를 뿐이다.
이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 이상에서 설명한 본 발명의 실시예들은 서로 별개로 또는 조합되어 구현되는 것도 가능하다.
따라서, 본 발명에 개시된 실시 예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시 예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.
1000: 전자기기 1100: 통신부
1200: 입력부 1300: 저장부
1400: 제어부 1500: 출력부
1510: 음성 출력부 1520: 디스플레이부

Claims (28)

  1. 복수의 단어가 포함된 텍스트 데이터를 획득하는 단계;
    상기 복수의 단어를 청크로 구분하는 단계;
    상기 텍스트 데이터에 대응되는 오디오 데이터를 획득하는 단계;
    상기 오디오 데이터를 음성 인식하는 단계; 및
    상기 음성 인식 결과에 따라 상기 청크 별로 상기 오디오 데이터의 대응되는 음성 구간을 매칭시키는 단계;를 포함하는
    청크 기반 언어 학습용 데이터베이스 구축 방법.
  2. 제1 항에 있어서,
    상기 매칭시키는 단계는, 상기 텍스트 데이터와 상기 음성 인식 결과에 따라 상기 오디오 데이터로부터 획득된 음성 인식 텍스트를 비교하는 단계 및 상기 비교 결과에 따라 상기 청크와 동일한 음성 인식 텍스트가 추출된 음성 구간을 상기 청크 별로 매칭시키는
    청크 기반 언어 학습용 데이터베이스 구축 방법.
  3. 제1 항에 있어서,
    상기 텍스트 데이터를 획득하는 단계는, 사용자로부터 상기 텍스트 데이터를 입력받는 단계, 외부 기기로부터 상기 텍스트 데이터를 수신하는 단계 및 저장부로부터 상기 텍스트 데이터를 로딩하는 단계 중 적어도 하나인
    청크 기반 언어 학습용 데이터베이스 구축 방법.
  4. 제1 항에 있어서,
    상기 오디오 데이터를 획득하는 단계는, 사용자로부터 음성 입력을 통해 상기 오디오 데이터를 입력받는 단계, 외부 기기로부터 상기 오디오 데이터를 수신하는 단계, 저장부로부터 상기 오디오 데이터를 로딩하는 단계 및 텍스트-투-스피치(TTS: Text-To-Speech) 방식으로 상기 텍스트 데이터로부터 상기 오디오 데이터를 생성하는 단계 중 적어도 하나인
    청크 기반 언어 학습용 데이터베이스 구축 방법.
  5. 제1 항에 있어서,
    상기 구분하는 단계는, 상기 복수의 단어에 대하여 품사를 판단하는 단계, 상기 품사에 기초하여 미리 정해진 규칙에 따라 상기 복수의 단어 중 일 단어 또는 일련의 단어군이 상기 청크를 구성하는지 여부를 판단하는 단계 및 상기 판단 결과에 기초하여 상기 복수의 단어를 상기 청크로 구분하는 단계를 포함하는
    청크 기반 언어 학습용 데이터베이스 구축 방법.
  6. 제1 항에 있어서,
    상기 구분하는 단계는, 저장부에 저장되어 있는 청크 테이블에 기초하여 상기 복수의 단어 중 일 단어 또는 일련의 단어군이 상기 청크를 구성하는지 여부를 판단하는 단계 및 상기 판단 결과에 기초하여 상기 복수의 단어를 상기 청크로 구분하는 단계를 포함하는
    청크 기반 언어 학습용 데이터베이스 구축 방법.
  7. 제5 항 또는 제6 항에 있어서,
    상기 구분하는 단계는, 상기 청크 사이에 청크 구분자를 삽입하는 단계를 더 포함하는
    청크 기반 언어 학습용 데이터베이스 구축 방법.
  8. 제7 항에 있어서,
    사용자 입력에 따라 상기 청크의 구분을 편집하는 단계;를 더 포함하는
    청크 기반 언어 학습용 데이터베이스 구축 방법.
  9. 제8 항에 있어서,
    상기 편집하는 단계는, 상기 청크 구분자의 추가, 삭제 및 위치 변경 중 어느 하나에 관한 사용자 입력을 수신하는 단계 및 상기 사용자 입력에 따라 상기 청크의 구분을 편집하는 단계를 포함하는
    청크 기반 언어 학습용 데이터베이스 구축 방법.
  10. 제1 항에 있어서,
    상기 구분하는 단계는, 상기 청크 사이에 청크 구분자를 삽입하는 사용자 입력을 수신하는 단계 및 상기 사용자 입력에 따라 상기 복수의 단어를 상기 청크로 구분하는 단계를 포함하는
    청크 기반 언어 학습용 데이터베이스 구축 방법.
  11. 제1 항에 있어서,
    상기 구분하는 단계는, 상기 청크 중 적어도 일부를 서브 청크로 구분하는 단계를 포함하는
    청크 기반 언어 학습용 데이터베이스 구축 방법.
  12. 제11 항에 있어서,
    상기 구분하는 단계는, 상기 청크 사이에 청크 구분자를 삽입하는 단계 및 상기 서브 청크 사이에 서브 청크 구분자를 삽입하는 단계를 더 포함하는
    청크 기반 언어 학습용 데이터베이스 구축 방법.
  13. 제11 항에 있어서,
    상기 매칭시키는 단계는, 상기 음성 인식 결과에 따라 상기 서브 청크 별로 상기 서브 청크가 속하는 청크에 매칭된 음성 구간 중 대응되는 음성 구간을 매칭시키는 단계를 포함하는
    청크 기반 언어 학습용 데이터베이스 구축 방법.
  14. 제13 항에 있어서,
    상기 청크에 대응되는 청크 아이콘을 순차적으로 디스플레이하고, 상기 청크 중 상기 서브 청크를 가지는 청크에 대하여 상기 청크 아이콘에 서브 청크 아이콘을 추가하여 디스플레이하는 단계; 및
    상기 청크 아이콘 및 상기 서브 청크 아이콘 중 적어도 하나를 선택하는 사용자 입력을 수신받은 경우, 상기 선택된 아이콘에 대응되는 청크 및 서브 청크 중 적어도 하나에 매칭된 음성 구간을 음성 출력하는 단계;를 더 포함하는
    청크 기반 언어 학습용 데이터베이스 구축 방법.
  15. 제1 항에 있어서,
    상기 청크에 대응되는 청크 아이콘을 순차적으로 디스플레이하는 단계; 및
    상기 청크 아이콘을 선택하는 사용자 입력을 수신받은 경우, 상기 선택된 청크 아이콘에 대응되는 청크에 매칭된 음성 구간을 음성 출력하는 단계;를 더 포함하는
    청크 기반 언어 학습용 데이터베이스 구축 방법.
  16. 제15 항에 있어서,
    상기 청크 아이콘 사이에 연결 아이콘을 디스플레이하는 단계; 및
    어느 하나의 상기 연결 아이콘을 선택하는 사용자 입력을 수신받은 경우, 최초의 청크 아이콘부터 상기 연결 아이콘의 바로 뒤에 위치하는 청크 아이콘까지에 대응되는 청크에 매칭된 음성 구간을 이어서 음성 출력하는 단계;를 더 포함하는
    청크 기반 언어 학습용 데이터베이스 구축 방법.
  17. 청크 기반 언어 학습용 데이터베이스를 구축하는 전자 기기로서,
    복수의 단어가 포함된 텍스트 데이터를 청크로 구분하는 청크 구분 모듈;
    상기 텍스트 데이터에 대응되는 오디오 데이터를 음성 인식하는 음성 인식 모듈; 및
    상기 음성 인식 결과에 따라 상기 청크 별로 상기 오디오 데이터의 대응되는 음성 구간을 매칭시키는 매칭 모듈;을 포함하는
    전자 기기.
  18. 제17 항에 있어서,
    상기 매칭 모듈은, 상기 텍스트 데이터와 상기 음성 인식 결과에 따라 상기 오디오 데이터로부터 획득된 음성 인식 텍스트를 비교하고, 상기 비교 결과에 따라 상기 청크와 동일한 음성 인식 텍스트가 추출된 음성 구간을 상기 청크 별로 매칭시키는
    전자 기기.
  19. 제17 항에 있어서,
    상기 청크 구분 모듈은, 상기 복수의 단어에 대하여 품사를 판단하고, 상기 품사에 기초하여 미리 정해진 규칙에 따라 상기 복수의 단어 중 일 단어 또는 일련의 단어군이 상기 청크를 구성하는지 여부를 판단하고, 상기 판단 결과에 기초하여 상기 복수의 단어를 상기 청크로 구분하는
    전자 기기.
  20. 제17 항에 있어서,
    상기 청크 구분 모듈은, 저장부에 저장되어 있는 청크 테이블에 기초하여 상기 복수의 단어 중 일 단어 또는 일련의 단어군이 상기 청크를 구성하는지 여부를 판단하고, 상기 판단 결과에 기초하여 상기 복수의 단어를 상기 청크로 구분하는
    전자 기기.
  21. 제19 항 또는 제 20 항에 있어서,
    상기 청크 구분 모듈은, 상기 청크 사이에 청크 구분자를 삽입하는
    전자 기기.
  22. 제17 항에 있어서,
    상기 청크 사이에 청크 구분자를 삽입하는 사용자 입력을 수신하는 입력 모듈;을 더 포함하고,
    상기 청크 구분 모듈은, 상기 사용자 입력에 따라 상기 복수의 단어를 상기 청크로 구분하는
    전자 기기.
  23. 제17 항에 있어서,
    상기 청크 구분 모듈은, 상기 청크 중 적어도 일부를 서브 청크로 구분하는
    전자 기기.
  24. 제23 항에 있어서,
    상기 청크 구분 모듈은, 상기 청크 사이에 청크 구분자를 삽입하고, 상기 서브 청크 사이에 서브 청크 구분자를 삽입하는
    전자 기기.
  25. 제23 항에 있어서,
    상기 매칭 모듈은, 상기 음성 인식 결과에 따라 상기 서브 청크 별로 상기 서브 청크가 속하는 청크에 매칭된 음성 구간 중 대응되는 음성 구간을 매칭시키는
    전자 기기.
  26. 제25 항에 있어서,
    상기 청크에 대응되는 청크 아이콘을 순차적으로 디스플레이하고, 상기 청크 중 상기 서브 청크를 가지는 청크에 대하여 상기 청크 아이콘에 서브 청크 아이콘을 추가하여 디스플레이하는 디스플레이; 및
    상기 청크 아이콘 및 상기 서브 청크 아이콘 중 적어도 하나를 선택하는 사용자 입력을 수신받은 경우, 상기 선택된 아이콘에 대응되는 청크 및 서브 청크 중 적어도 하나에 매칭된 음성 구간을 음성 출력하는 스피커;를 더 포함하는
    전자 기기.
  27. 제17 항에 있어서,
    상기 청크에 대응되는 청크 아이콘을 순차적으로 디스플레이하는 디스플레이; 및
    상기 청크 아이콘을 선택하는 사용자 입력을 수신받은 경우, 상기 선택된 청크 아이콘에 대응되는 청크에 매칭된 음성 구간을 음성 출력하는 스피커;를 더 포함하는
    전자 기기.
  28. 제27 항에 있어서,
    상기 디스플레이는, 상기 청크 아이콘 사이에 연결 아이콘을 디스플레이하고,
    상기 스피커는, 어느 하나의 상기 연결 아이콘을 선택하는 사용자 입력을 수신받은 경우, 최초의 청크 아이콘부터 상기 연결 아이콘의 바로 뒤에 위치하는 청크 아이콘까지에 대응되는 청크에 매칭된 음성 구간을 이어서 음성 출력하는
    전자 기기.
KR1020150101630A 2015-07-17 2015-07-17 청크 기반 언어 학습용 데이터베이스 구축 방법 및 이를 수행하는 전자 기기 KR20170009486A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020150101630A KR20170009486A (ko) 2015-07-17 2015-07-17 청크 기반 언어 학습용 데이터베이스 구축 방법 및 이를 수행하는 전자 기기

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020150101630A KR20170009486A (ko) 2015-07-17 2015-07-17 청크 기반 언어 학습용 데이터베이스 구축 방법 및 이를 수행하는 전자 기기

Publications (1)

Publication Number Publication Date
KR20170009486A true KR20170009486A (ko) 2017-01-25

Family

ID=57991724

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150101630A KR20170009486A (ko) 2015-07-17 2015-07-17 청크 기반 언어 학습용 데이터베이스 구축 방법 및 이를 수행하는 전자 기기

Country Status (1)

Country Link
KR (1) KR20170009486A (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180129486A (ko) * 2017-05-26 2018-12-05 주식회사 엠글리쉬 외국어학습을 위한 청크단위 분리 규칙과 핵심어 자동 강세 표시 구현 방법 및 시스템
KR20180130933A (ko) * 2017-05-30 2018-12-10 주식회사 엠글리쉬 영상데이터 음성신호 기반 청크 및 핵심어 분석 방법, 그리고 그 시스템
KR20190061191A (ko) * 2017-11-27 2019-06-05 송현종 아동언어학습을 위한 음성인식 기반 학습 시스템 및 학습방법
KR102654803B1 (ko) * 2023-11-20 2024-04-08 주식회사 액션파워 음성인식 학습 데이터에서 음성-텍스트 정렬 오류를 검출하는 방법

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180129486A (ko) * 2017-05-26 2018-12-05 주식회사 엠글리쉬 외국어학습을 위한 청크단위 분리 규칙과 핵심어 자동 강세 표시 구현 방법 및 시스템
KR20180130933A (ko) * 2017-05-30 2018-12-10 주식회사 엠글리쉬 영상데이터 음성신호 기반 청크 및 핵심어 분석 방법, 그리고 그 시스템
KR20190061191A (ko) * 2017-11-27 2019-06-05 송현종 아동언어학습을 위한 음성인식 기반 학습 시스템 및 학습방법
KR102654803B1 (ko) * 2023-11-20 2024-04-08 주식회사 액션파워 음성인식 학습 데이터에서 음성-텍스트 정렬 오류를 검출하는 방법

Similar Documents

Publication Publication Date Title
US20170220536A1 (en) Contextual menu with additional information to help user choice
US9548052B2 (en) Ebook interaction using speech recognition
US20150073801A1 (en) Apparatus and method for selecting a control object by voice recognition
TW200900967A (en) Multi-mode input method editor
US20140349259A1 (en) Device, method, and graphical user interface for a group reading environment
CN111462740A (zh) 非语音字母语言的话音辅助应用原型测试的话音命令匹配
US20160267902A1 (en) Speech recognition using a foreign word grammar
US10699072B2 (en) Immersive electronic reading
KR20140094919A (ko) 문장 형식별 구성요소 배열 및 확장에 따른 언어 교육 시스템 및 방법과 기록 매체: 팩토리얼 언어 교육법
Süzgün et al. Hospisign: an interactive sign language platform for hearing impaired
KR20170009486A (ko) 청크 기반 언어 학습용 데이터베이스 구축 방법 및 이를 수행하는 전자 기기
US10025772B2 (en) Information processing apparatus, information processing method, and program
KR102224977B1 (ko) 아동학습용 한글 교육 방법
EP3617907A1 (en) Translation device
KR101447879B1 (ko) 음성인식을 통해 컨트롤 객체를 선택하기 위한 장치 및 방법
CN112149403A (zh) 一种确定涉密文本的方法和装置
US20170069319A1 (en) Information processing device, information processing method, and program
KR102389153B1 (ko) 음성 반응형 전자책 제공 방법 및 디바이스
KR20170009487A (ko) 청크 기반 언어 학습 방법 및 이를 수행하는 전자 기기
KR101554619B1 (ko) 터치 스크린을 활용한 어학 학습 시스템 및 어학 학습 방법
CN113268981A (zh) 一种信息处理方法、装置及电子设备
JP6538399B2 (ja) 音声処理装置、音声処理方法およびプログラム
KR102667466B1 (ko) 이미지 연상 기법을 이용한 영어 독해 강의 콘텐츠 제공 방법 및 장치
KR102656262B1 (ko) 이미지를 이용한 중국어 연상학습 콘텐츠 제공 방법 및 장치
CN103678467A (zh) 信息显示控制装置、信息显示控制方法以及系统

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application