KR102403074B1 - 영어 문장 학습을 위한 이미지 구조화 시스템 - Google Patents

영어 문장 학습을 위한 이미지 구조화 시스템 Download PDF

Info

Publication number
KR102403074B1
KR102403074B1 KR1020190160763A KR20190160763A KR102403074B1 KR 102403074 B1 KR102403074 B1 KR 102403074B1 KR 1020190160763 A KR1020190160763 A KR 1020190160763A KR 20190160763 A KR20190160763 A KR 20190160763A KR 102403074 B1 KR102403074 B1 KR 102403074B1
Authority
KR
South Korea
Prior art keywords
box
word
value
image
index
Prior art date
Application number
KR1020190160763A
Other languages
English (en)
Other versions
KR20210060280A (ko
Inventor
황재윤
Original Assignee
주식회사 이볼케이노
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 이볼케이노 filed Critical 주식회사 이볼케이노
Publication of KR20210060280A publication Critical patent/KR20210060280A/ko
Application granted granted Critical
Publication of KR102403074B1 publication Critical patent/KR102403074B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • G09B5/02Electrically-operated educational appliances with visual presentation of the material to be studied, e.g. using film strip

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

본 발명은 문장의 POS(Part of speech)값, DEP(Dependency)값 및 각 단어의 헤드(head)에 해당하는 단어에 대한 데이터를 검출하도록 형성되는 문장분석 모듈과, 상기 POS값과 DEP값을 이용하여 영어문장에서 메인 단어들을 선택하고 메인 단어에 해당하지 않는 단어들이 속하는 메인 단어 그룹을 정의한 후 상기 그룹별 세트들을 설정하도록 형성되는 제어모듈과, 상기 세트들에 이미지 박스를 매칭시키고 상기 이미지 박스들에 색깔, 좌표, 순서를 정의하도록 형성되는 이미지 조합 모듈을 포함하는 것을 특징으로 하는 영어 문장 학습을 위한 이미지 구조화 시스템을 제공한다.

Description

영어 문장 학습을 위한 이미지 구조화 시스템 {IMAGE-STRUCTURING SYSTEM FOR LEARNING ENGLISH SENTENCES}
본 발명은 영어 문장 학습 시스템에 관한 것으로서, 보다 자세하게는 영어 문장의 구조를 이미지화하여 학습자에게 제공함으로써 직관적으로 영어 문장을 학습 할 수 있게 하는 영어 문장 학습을 위한 이미지 구조화 시스템에 관한 것이다.
영어 학습에는 다양한 방법이 있지만 이러한 학습 방법들의 궁극적인 목표는 학습자들이 영어권 국가의 원어민처럼 자연스럽게 영어를 이해할 수 있게 하는 것이다.
그러나, 국어와 영어의 문장 구조와 어순이 상이하기 때문에 학습자들이 영어 문장의 구조를 한눈에 파악하는 것이 어렵다는 문제가 있다.
종래에는 영어문장의 구조 분석 결과를 학습자에게 제공하여 학습자가 문장 구조 분석에 들이는 시간을 줄이는 식으로 학습 효율을 향상시키고자 하였다.
예를 들어, 대한민국 등록특허 제10-1302875호 '기호처리를 통해 문장구조 인식이 용이한 영어문장 직독직해 학습시스템'(이하 '특허문헌 1'이라 함)에서는 영어문장을 효과적으로 파악하고 이해하기 위한 영어문장 직독직해 학습시스템에 관한 것으로서 영어문장을 문장성분 또는 품사별로 분석하여 각각 문장성분 또는 품사별로 특정된 기호로 문장데이터를 표시함으로써 문장 구조를 쉽게 파악할 수 있게 한다.
또한, 대한민국 등록특허 제10-1906561호 '문장구조 이해가 용이한 영어문장 표시방법'(이하 '특허문헌 2'라 함)에서는 복수의 문장성분으로 구성된 영어문장을 일정한 의미단위 구문으로 분절하여 사용자 단말기로 표시 처리하여 영어문장을 구성하는 문장성분 및 품사 정보를 쉽게 파악할 수 있게 한다.
또한, 대한민국 등록특허 제10-1706980호 '캐릭터를 이용한 영어의 문장 구조 학습법'(이하 '특허문헌 3'이라 함)에서는 컴퓨터를 이용한 영어 학습 방법에 관한 것으로서 컴퓨터 화면에 디스플레이된 캐릭터의 완성을 통해서 이미지를 통해 영어의 문장 구조를 학습 할 수 있게 하는 영어 학습 방법을 개시한다.
하지만 이러한 종래기술들에서는 단순히 문법에 따른 영어문장의 구조 분석 데이터를 제공할 뿐 학습자가 영어를 모국어로 사용하는 사람들의 문장 이해 방식을 직관적으로 습득할 수 있게 하는 기술은 개시되어 있지 않다.
대한민국 등록특허 제10-1302875호 대한민국 등록특허 제10-1906561호 대한민국 등록특허 제10-1706980호
본 발명은 상기와 같은 문제점을 해결하기 위한 것으로서 영어문장의 텍스트 구조를 이미지화 하여 학습자가 영어 문장의 이해 방식을 직관적으로 습득할 수 있게 하는 영어 문장 학습을 위한 이미지 구조화 시스템을 제공하는 것을 목적으로 한다.
본 발명은 문장의 POS(Part of speech)값, DEP(Dependency)값 및 각 단어의 헤드(head)에 해당하는 단어에 대한 데이터를 검출하도록 형성되는 문장분석 모듈과, 상기 POS값과 DEP값을 이용하여 영어문장에서 메인 단어들을 선택하고 메인 단어에 해당하지 않는 단어들이 속하는 메인 단어 그룹을 정의한 후 상기 그룹별 세트들을 설정하도록 형성되는 제어모듈과, 상기 세트들에 이미지 박스를 매칭시키고 상기 이미지 박스들에 색깔, 좌표, 순서를 정의하도록 형성되는 이미지 조합 모듈을 포함하는 것을 특징으로 하는 영어 문장 학습을 위한 이미지 구조화 시스템을 제공한다.
본 발명의 일 실시예에 따르면, 상기 제어모듈은 문장의 패턴 분석 결과나 상기 문장분석 모듈의 분석 결과를 토대로 학습자에게 제공되는 이미지 박스들의 디스플레이 간격이나 디스플레이 시간을 조정한다.
본 발명의 일 실시예에 따르면, 상기 제어모듈은 DEP값이 conj인 경우 해당 단어의 헤드에 해당하는 단어의 POS가 verb이면 해당 단어를 메인 단어로 선택하고, DEP 값이 cc이면서 해당 단어의 헤드에 해당하는 단어의 POS값이 verb이면 해당 단어를 메인 단어로 선택하며, DEP 값이 prep 또는 agent인 단어의 경우 해당 단어의 차일드에 해당하는 단어의 DEP 값이 pcomp인 경우 상기 DEP 값이 prep 또는 agent인 단어를 메인 단어로 선택한다.
본 발명의 일 실시예에 따르면, 상기 제어 모듈은 단어가 메인 단어에 해당하는 경우 상기 단어의 인텍스를 세트값으로 선택하고, 단어의 DEP값이 agent 또는 prep인 경우 해당 단어의 차일드에 해당하는 단어가 메인 단어라면 차일드의 인덱스를 세트값으로 하며, 단어의 DEP값이 agent 또는 prep이 아닌 경우 파트 메인(part main)값을 세트값으로 설정한다.
본 발명의 일 실시예에 따르면, 상기 파트 메인값은 단어의 헤드에 해당하는 단어가 메인 단어인 경우 상기 헤드에 해당하는 단어의 인덱스 값이 파트 메인 값이 되며, 단어의 헤드에 해당하는 단어가 메인 단어가 아닌 경우 헤드의 헤드(엔세스터)에 해당하는 단어가 메인인 경우 엔세스터에 해당하는 단어의 인덱스 값을 파트 메인값으로 한다.
본 발명의 일 실시예에 따르면, 상기 이미지 박스는 주체, 행동, 결과물에 해당하는 단어들이 좌측 상단에서 우측 하단으로 연결되도록 연결 관계가 설정된다.
본 발명의 일 실시예에 따르면, 상기 이미지 박스는 동사에 해당하는 성분 박스가 중심에 배치되고, 주어 성분에 해당하는 박스가 상기 중심 박스의 좌측상단에 연결되고, 목적어 성분에 해당하는 박스가 우측하단에 연결되도록 형성된다.
본 발명의 일 실시예에 따르면, 상기 이미지 조합 모듈은 동일한 세트값을 갖는 단어들을 하나의 박스로 묶은 후 각 박스들의 인덱스값(inde_box), 헤드 인덱스값(head_index_box) 및 DEP값(DEP_box)을 추출한다.
본 발명의 일 실시예에 따르면, 상기 이미지 조합 모듈은 상대위치 값이 0인 박스들을 기준으로 하여 박스들의 그룹을 묶는 것을 특징으로 한다.
본 발명의 일 실시예에 따르면, 상기 박스들의 그룹은 상대위치 값이 0인 박스의 경우 박스의 인덱스(index_box) 값이 그룹 인덱스(index_group)가 되고, 상대위치 값이 0이 아닌 박스의 경우 헤드에 해당하는 박스의 상대위치가 0인 경우에는 상기 헤드에 해당하는 박스의 인덱스 값이 그룹 인덱스가 되고 헤드에 해당하는 박스의 상대위치가 0이 아닌 경우에는 상기 헤드에 해당하는 박스의 헤드에 해당하는 박스의 인덱스 값이 그룹 인덱스가 된다.
본 발명의 일 실시예에 따르면, 상기 이미지 조합 모듈은 그룹 간의 연결을 위한 커넥터를 선택하며, 상기 이미지 조합 모듈은 상대위치 값이 0인 박스를 커넥터로 선택하되 그룹 내의 첫번째 단어가 커넥터 단어인 경우에는 상기 첫번째 단어를 포함하는 박스를 상기 그룹의 커넥터로 선택하는 것을 특징으로 한다.
본 발명의 일 실시예에 따르면, 상기 커넥터 단어는 that, who, whoever, whom, whose, why, what, whatever, when, whenever, where, wherever, which 중 적어도 하나인 것을 특징으로 한다.
본 발명은 문장구조를 분석한 후 핵심단어를 기준으로 수식하는 단어, 세트, 그룹의 상대적 위치와 시간적 선후관계를 정의하여 문장 구조들 간의 공간적/시간적 연결관계를 이미지로 표현할 수 있다. 이를 통해 학습자가 영어의 문장 구성의 원리를 체득할 수 있게 한다.
또한, 본 발명은 문장의 구성요소들을 세트 및 그룹 별로 구분하여 영어문장 구성 방식을 쉽게 이해할 수 있게 한다.
또한, 본 발명은 문장 성분들에 일정 규칙에 따라 서로 다른 크기 또는 색깔의 박스를 할당하고 박스간의 연결관계를 정의하여 영어문장을 이해하는 방식과 중요도를 한눈에 파악할 수 있게 한다.
도 1은 본 발명의 일 실시예에 따른 영어 문장 학습을 위한 이미지 구조화 시스템의 개념도.
도 2는 영어문장 구조의 이미지 구조화 방법을 나타낸 순서도.
도 3은 문장분석 방법을 나타내는 개념도.
도 4는 문장분석 결과를 해석하는 방법을 설명하기 위한 개념도.
도 5는 Data 가공 방법의 세부 단계를 나타내는 순서도.
도 6은 영어문장에서 메인 단어들을 선택하는 방법을 설명하기 위한 개념도.
도 7은 단어 그룹별 세트를 설정하는 방법을 설명하기 위한 개념도.
도 8은 문장 구성 성분을 이미지화 하는 방법을 설명하는 순서도.
도 9는 본 발명의 일 실시예에 따라 정의된 이미지 박스를 설명하기 위한 개념도.
도 10은 그룹별 매칭되는 이미지 박스를 설명하기 위한 개념도.
도 11은 박스들의 위치 관계를 정의하는 방법을 설명하기 위한 개념도.
도 12 내지 도 16는 본 발명의 일 실시예에 따라 설정된 각 세트의 절대 좌표를 나타내는 개념도.
도 17은 세트 간 상대 좌표 값을 설정해 영어문장을 이미지 구조화한 결과를 보여주는 개념도.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다.
그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 기술적 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.
이하, 본 발명에 대하여 도면을 참조하여 보다 상세하게 설명한다. 본 명세서에서는 서로 다른 실시예라도 동일·유사한 구성에 대해서는 동일·유사한 참조번호를 부여하고, 그 설명은 처음 설명으로 갈음한다. 본 명세서에서 사용되는 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다.
또한, 이하의 설명에서 사용되는 구성요소에 대한 접미사 "모듈" 또는 "부"는 명세서 작성의 용이함만이 고려되어 부여되거나 혼용되는 것으로서, 그 자체로 서로 구별되는 의미 또는 역할을 갖는 것은 아니다.
도 1은 본 발명의 일 실시예에 따른 영어 문장 학습을 위한 이미지 구조화 시스템의 개념도이다.
도 1을 참조하면, 시스템(100)은 서버를 통해 다수의 사용자에게 언어 학습 컨텐츠를 제공할 수 있도록 형성된다.
학습자들은 사용자 단말기를 통해 언어 학습 컨텐츠를 제공받을 수 있다. 사용자 단말기에는 휴대폰, 스마트 폰(smart phone), 노트북 컴퓨터(laptop computer), 디지털방송용 단말기, PDA(personal digital assistants), PMP(portable multimedia player), 네비게이션, 슬레이트 PC(slate PC), 태블릿 PC(tablet PC), 울트라북(ultrabook), 웨어러블 디바이스(wearable device, 예를 들어, 워치형 단말기 (smartwatch), 글래스형 단말기 (smart glass), HMD(head mounted display)) 등의 이동 단말기나 디지털 TV, 데스크탑 컴퓨터, 디지털 사이니지 등과 같은 고정 단말기가 포함될 수 있다.
시스템(100)은 제어모듈(110)과, 데이터수집모듈(120)과, 데이터베이스(130)와, 이미지 조합 모듈(140), 문장분석모듈(150) 등을 포함할 수 있다. 이하에서는 설명의 편의를 위해 각 모듈을 구분하여 설명하고 있지만 실제 제어모듈(110)이 다른 모듈들을 기능을 포함하도록 형성되는 것이 가능하다.
제어모듈(110)은 문장에 대한 데이터를 수집하거나 데이터베이스에 저장된 데이터를 각 모듈에 제공하거나, 각 모듈들의 구동을 제어할 수 있다. 학습 효율 증대를 위해 제어모듈(110)에는 머신러닝 모듈이 포함될 수 있다. 예를 들어, 이미지 조합 모듈을 통해 문장 구성들을 이미지화 하는 과정에서 학습자들이 선호하는 박스 크기, 색상 등의 정보를 수집한 후 이를 이용해 최적의 이미지를 찾아내는 것이 가능하다.
제어모듈(110)은 문장 구성 이미지를 노출시킬 때 해당 이미지에 대응하는 음성을 함께 제공할 수 있다.
데이터수집모듈(120)은 문장을 구성하는 단어들에 대한 데이터들을 수집하여 제어모듈(110)에 제공할 수 있다. 예를 들어, 데이터수집모듈(120)은 단어들에 대응되는 음성데이터를 수집하여 데이터베이스에 저장할 수 있다.
데이터베이스(130)에는 시스템(100)을 구동시키기 위한 각종 데이터들이 저장된다. 예를 들어, 데이터베이스(130)에는 단어들에 대응되는 이미지 데이터들과 해당 단어에 대응되는 복수의 음성 데이터들이 저장될 수 있다.
또한, 데이터베이스(130)에는 이미지 박스의 색상, 크기, 위치에 대한 데이터들이 저장될 수 있다. 이러한 정보들은 사용자가 직접 설정할 수 있으며 경우에 따라서는 머신러닝을 통해 얻어진 정보일 수도 있다.
이미지 조합 모듈(140)은 각 단어에 해당하는 이미지 박스를 매칭하고 이미지 박스의 크기, 색상, 위치 등을 정의한다.
또한, 이미지 조합 모듈(140)은 각 세트 내 단어들의 이미지 박스의 위치를 정의한 후 세트 간 이미지 순서 및 위치를 정의할 수 있다.
문장분석모듈(150)은 머신 러닝 등의 인공지능(AI)을 활용하여 문장의 구조를 분석(sentence parsing)할 수 있다.
본 발명의 일 실시예에 따르면, 시스템은 강세 패턴 분석모듈(미도시)을 더 포함할 수 있다.
강세 패턴 분석모듈은 문장의 음성출력 데이터를 분석하여 화자가 문장을 끊어읽는 위치, 출력되는 dB 값, 성조나 억양 등을 분석하여 학습자가 청취하고자 하는 문장의 강세 패턴을 판단할 수 있다.
제어 모듈은 상기 강세 패턴 분석모듈이 분석한 패턴 또는 문장 분석 결과에 따라 학습자에게 제공되는 박스들의 디스플레이 간격이나 디스플레이 시간을 조정할 수 있다.
도 2는 영어문장 구조의 이미지 구조화 방법을 나타낸 순서도이다.
도 2를 참조하면, 영어문장 구조의 이미지 구조화 방법은 pre-data 처리 단계(S100)와, Data 가공 단계(S200)와, 문장 구성 이미지화 단계(S300)와, 학습 자료 제공 단계(S400) 등을 포함할 수 있다.
먼저 도 3 및 도 4를 참조하여 pre-data 처리 단계(S100)를 설명한다.
도 3은 문장분석 방법을 나타내는 개념도이고, 도 4는 문장분석 결과를 해석하는 방법을 설명하기 위한 개념도이다.
본 발명의 시스템은 영어 문장의 POS값과 DEP값을 활용하여 메인 단어들을 추출하고, 단어 그룹별 세트를 설정하고, 이렇게 정리된 데이터를 이용하여 영어문장을 이미지 구조화한다.
도 3을 참조하면 문장분석모듈은 문장의 POS (Part of speech) 값, DEP (Dependency) 값, 각 단어의 헤드(head)에 해당하는 단어 등에 대한 데이터를 검출한다.
POS 값은 각 단어들이 갖는 문장성분값을 나타낸다.
POS 값에는 ADJ(adjective), ADP(adposition), ADV(adverb), AUX(auxiliary), CONJ(conjunction), CCONJ(coordinating conjunction), DET(determiner), INTJ(interjection), NOUN(noun), NUM(numeral), PART(particle), PRON(pronoun), PROPN(proper noun), PUNCT(punctuation), SCONJ(subordinating conjuction), SYM(symbol), VERB(verb), X(other) SPACE(space) 등을 포함할 수 있다.
DEP 값은 단어들의 관계를 나타내는 값으로, 각 단어들은 도 4에 도시된 바와 같이 시작점(꼬리)과 도착점(머리)을 갖는 화살표로 연결될 수 있다.
본 실시예에서는 DEP 값 할당하기 위해 각 단어들을 연결하는 화살표를 이용하였으나 이는 단어들의 관계를 설명하기 위한 것일 뿐이다. 즉, 시스템에서 단어들의 관계를 화살표로 표시하지 않더라도 어느 한 단어에서 다음 단어로 의미가 연결되거나 문장 구조가 연결되는 경우에는 앞선 단어 쪽을 꼬리 지점으로 뒤따르는 단어 쪽을 머리 지점으로 설정하는 것이 가능하다.
DEP 값에는 acl(adjectival clause), acomp(adjectival complement), advcl(adverbial clause modifier), advmod(adverbial modifier), amod(adjectival modifier), appos(appositional modifier), ccomp(clausal complement), dobj(direct object), nsubj(nominal subject), det(determiner), relcl(relative clause modifier) 등을 포함할 수 있다.
도 4를 참조하면, 차일드(child)는 성분 2개를 연결한 화살표의 머리 지점에 위치한 성분을 말하고, 헤드(head)는 성분 2개를 연결한 화살표의 시작 지점의 성분을 말한다.
엔세스터(ancestor)는 헤드에서 헤드로 거슬러 올라간 위치의 성분을 말한다.
디센던트(descendant)는 차일드에서 차일드로 거슬러 내려간 위치의 성분을 말한다.
제어 모듈(110)은 상기에서 설명한 POS 값, DEP 값, 차일드, 디센던트, 엔세스터 등의 정보에 대응하여 data를 가공하고 이미지 박스의 배치, 모양, 색상, 크기 등을 설정할 수 있다.
도 5는 Data 가공 방법의 세부 단계를 나타내는 순서도이다.
도 5를 참조하면, data 가공 단계(S200)는 영어문장에서 메인 단어들을 선택하는 단계(S210)와, 남은 단어들이 속하는 그룹을 식별하는 단계(S220)와, 단어 그룹별 세트를 설정하는 단계(S230) 등을 포함할 수 있다.
메인 단어들을 선택하는 단계(S210)에서는 앞에서 설명한 단어들의 POS값, DEP값 및 성분간 연결구조 정보를 이용하여 문장에서 메인 단어를 선택한다.
도 6은 영어문장에서 메인 단어들을 선택하는 방법을 설명하기 위한 개념도이다.
본 발명의 일 실시예에 따른 메인 단어를 선택 과정은 다음과 같은 규칙을 따른다.
먼저, 제어 모듈은(110) 단어의 DEP 값이 acl, acomp, advcl, appos, attr, ccomp, cop, csubj, csubjpass, dative, dep, dobj, expl, intj, mark, meta, nounmod, npmod, nsubj, nsubjpass, oprd, obj, obl, parataxis, pcomp, pobj, preconj, punct, relcl, root, xcomp 등인 경우 해당 단어를 메인 단어로 선택한다.
다음으로, DEP값이 conj인 경우 해당 단어의 헤드에 해당하는 단어의 POS가 verb이면 해당 단어의 DEP값을 conj_t(메인 단어에 해당하는 conj)로 변경하고 이를 메인 단어로 선택한다. DEP값이 conj인 경우 해당 단어의 헤드에 해당하는 단어의 POS가 verb가 아니면 DEP값을 conj_f(메인 단어에 해당하지 않는 conj)로 변경하고 이를 메인 단어가 아닌 것으로 결정한다.
여기서 DEP값 conj_t 와 conj_f 는 설명의 편의를 위하여 표시한 것으로서 이러한 용어에 권리범위가 한정되는 것은 아니다.
또한, 제어 모듈(110)은 DEP 값이 cc이면서 해당 단어의 헤드에 해당하는 단어의 POS값이 verb이면 해당 단어의 DEP값을 cc_t(메인 단어에 해당하는 cc)로 변경하고 이를 메인 단어로 선택한다. DEP값이 cc이면서 해당 단어의 헤드에 해당하는 단어의 POS가 verb가 아니면 DEP값을 cc_f(메인 단어에 해당하지 않는 cc)로 변경하고 이를 메인 단어가 아닌 것으로 결정한다.
마찬가지로 DEP값 cc_t 와 cc_f 는 설명의 편의를 위하여 표시한 것으로서 이러한 용어에 권리범위가 한정되는 것은 아니다.
또한, 제어 모듈(110)은 DEP 값이 prep 또는 agent인 단어의 경우, 해당 단어의 차일드에 해당하는 단어의 DEP 값이 pcomp인 경우 상기 DEP 값이 prep 또는 agent인 단어를 메인 단어로 선택한다.
또한, 제어모듈(110)은 DEP 값이 pobj이면서 헤드에 해당하는 단어의 DEP 값이 prep 이거나 agent인 단어의 DEP 값을 pobj_t(메인 단어에 해당하는 pobj)로 변경하고 이를 메인 단어로 선택한다. DEP 값이 pobj 이면서 헤드에 해당하는 단어의 DEP 값이 prep나 agent가 아닌 단어의 DEP 값은 pobj_f(메인 단어에 해당하지 않는 pobj)로 변경하고 이를 메인 단어가 아닌 것으로 결정한다.
또한, 제어모듈(110)은 DEP 값이 mark이고 헤드에 해당하는 단어의 POS가 verb인 경우, 헤드의 인덱스가 자기의 인덱스 보다 큰 경우 해당 단어의 DEP를 cc_c로 변경하고 메인 단어로 선택한다. 상기 cc_c는 단어(또는 박스)위치를 결정하기 위한 성분으로 사용될 수 있다.
도 7은 단어 그룹별 세트를 설정하는 방법을 설명하기 위한 개념도이다.
도 7을 참조하면, 단어들의 세트를 설정하는 방법은 다음과 같다.
먼저, 단어가 메인 단어에 해당하는 경우 상기 단어의 인텍스를 세트값으로 선택한다.
단어가 메인 단어가 아닌 경우에는 단어의 DEP값이 agent 또는 prep인 경우와 아닌 경우로 나누어 세트를 설정한다.
단어의 DEP값이 agent 또는 prep인 경우, 해당 단어의 차일드(또는 디센던트)에 해당하는 단어를 확인하여 세트를 설정한다. 구체적으로, 해당 단어의 차일드가 메인 단어라면 차일드의 인덱스를 세트값으로 하며, 차일드가 메인 단어가 아니라면 차일드의 차일드(디센던트)가 메인 단어인지 여부를 다시 판단하여 세트를 설정한다. 이러한 과정을 메인 단어가 확인될 때까지 반복하게 된다.
예를 들어, 도 7에서 단어 "for"의 경우 DEP값이 prep이므로 해당 단어의 차일드에 해당하는 단어 "years"를 확인한다. years가 메인 단어에 해당하므로 단어 "for"는 years의 인덱스 9를 세트값으로 한다. 즉, "for" 단어는 세트 9로 설정된다.
단어의 DEP값이 agent 또는 prep이 아닌 경우 파트 메인(part main)값을 세트값으로 설정한다.
파트 메인 값은 다음과 같이 정해진다.
단어의 헤드에 해당하는 단어가 메인 단어인 경우 상기 헤드에 해당하는 단어의 인덱스 값이 파트 메인 값이 되며, 단어의 헤드에 해당하는 단어가 메인 단어가 아닌 경우 헤드의 헤드(엔세스터)에 해당하는 단어가 메인인 경우 엔세스터에 해당하는 단어의 인덱스 값이 파트 메인 값이 된다. 이러한 과정을 메인 단어가 확인될 때까지 반복하게 된다.
도 8은 문장 구성 성분을 이미지화 하는 방법을 설명하는 순서도이다.
도 8을 참조하면, 문장 구성 이미지화 단계(S300)는 이미지 박스를 정의하는 단계(S310)와, 단어 세트에 이미지 박스를 매칭시키는 단계(S320)와, 이미지 박스의 크기, 위치 등을 정의하는 단계(S330)를 포함할 수 있다.
이미지 박스를 정의하는 단계(S310)는 이미지 박스에 복수의 방향 성분을 설정하고 일정 방향으로 의식의 흐름이 진행되도록 상기 방향 성분에 단어들의 연결 관계를 설정한다.
예를 들어, 시스템은 이미지 박스에 대각선 4방향, 상하좌우 4방향으로 방향 성분을 설정할 수 있다.
본 발명의 일 실시예에 따르면 상기 대각선 방향 성분으로는 영어권 국가의 사람들의 사고 흐름 순서에 따라 단어들을 연결하고 상기 상하좌우 방향 성분으로는 문장의 연결 순서에 따라 단어들을 배치하는 것이 가능하다.
예를 들어, 영어의 의식 흐름은 '주체'가 -> '행동'을 통해 -> '결과물'을 얻는 방식으로 이루어진다. 본 발명의 시스템은 주체, 행동, 결과물에 해당하는 단어들을 좌측 상단에서 우측 하단으로 연결되도록 이미지 박스의 연결 관계를 설정할 수 있다.
도 9에서 중심이 되는 성분(0)은 동사에 해당하는 성분이 되고, 1 위치에는 주어 성분, 3 위치에는 목적어 성분이 배치된다. 2 위치에는 동사에 도움을 주는 도구들인 전치사(전치사구)와 같은 성분이 배치될 수 있다. 또한, c 위치에는 보어 성분, d 위치에는 부사 성분이 배치될 수 있다.
단어 세트에 이미지 박스를 매칭시키는 단계(S320)에서는 앞에서 설명한 세트들을 그룹으로 묶어 박스를 매칭시킨다.
도 10은 그룹별 매칭되는 이미지 박스를 설명하기 위한 개념도이다.
도 10을 참조하면, 시스템은 앞에서 설정한 세트값에 근거하여 박스들을 매칭한 후 박스들의 인덱스값과 DEP값 등을 정의한다.
또한, 도 9에서 정의한 이미지 박스 정보에 대응하여 박스들의 상대 위치 관계를 설정한다.
예를 들어, 도 9의 실시예에서 중심이 되는 성분은 동사에 해당하는 성분으로 정의하였으므로 동사 성분에 해당하는 박스들(served, died, was given, came, to pay)의 상대 위치는 0으로 설정한다. 그 후 시스템은 상대 위치가 0인 박스들과 다른 박스들의 위치 관계를 정의한다.
제어 모듈(110)은 동일한 그룹에 해당하는 박스들에 동일한 색을 부여할 수 있다.
상기 그룹은 상대위치(relative potision_box)가 0인 박수들을 기준으로 결정된다.
본 발명의 일 실시예에 따르면, 상대위치 값이 0인 박스의 경우 박스의 인덱스(index_box) 값이 그룹 인덱스(index_group)가 되고, 상대위치 값이 0이 아닌 박스의 경우 헤드에 해당하는 박스의 상대위치가 0인 경우에는 상기 헤드에 해당하는 박스의 인덱스 값이 그룹 인덱스가 되고 헤드에 해당하는 박스의 상대위치가 0이 아닌 경우에는 상기 헤드에 해당하는 박스의 헤드에 해당하는 박스의 인덱스 값이 그룹 인덱스가 된다.
또한, 이미지 박스의 크기, 위치 등을 정의하는 단계(S330)에서는 도 11에 도시된 것과 같이 기설정된 단어 종류에 따른 좌표 수정 수치값을 적용하여 각 단어(또는 박스)들의 위치 좌표를 설정할 수 있다.
본 발명의 일 실시예에 따르면 제어 모듈(110)은 문장 성분에 따라 박스의 크기를 다르게 할 수 있다.
예를 들어, 동사 성분에 해당하는 박스의 크기를 크게 하고 명사 및 전치사 성분에 해당하는 박스를 보통 크기로 하고, 관계사나 접속사에 해당하는 박스의 크기를 작게 할 수 있다.
예를 들어, 제어 모듈은 관계사 박스의 크기를 작게 할 수 있다. 특정 단어가 인덱스 그룹(동일한 헤드 인덱스를 가지는 박스들)의 첫번째 단어에 관계사 (that, who, whom, whose, why, what, when, where, which)가 나올 경우 해당 박스의 크기를 줄이는 방식이 적용될 수 있다.
도 10을 참조하면 인덱스 박스(index_box) 3과 32에 관계사가 첫번째 단어로 나오므로 제어부는 인덱스 박스 3과 32의 크기를 줄어들어 있다(도 13, 도 15 참조).
상기에서 설명한 data 가공 및 문장 구성 이미지화를 적용한 데이터가 도 12 내지 도 17에 도시되어 있다.
도 12 내지 도 16은 본 발명의 일 실시예에 따라 설정된 각 세트의 절대 좌표를 나타내는 개념도이고, 도 17은 세트 간 상대 좌표 값을 설정해 영어문장을 이미지 구조화한 결과를 보여주는 개념도이다.
시스템은 도 12 내지 도 16과 같이 그룹별 박스의 크기, 색깔, 위치를 설정한 후 이를 조합하여 도 17의 영어문장 이미지 구조화 결과물을 획득한다.
이미지 조합 모듈은 그룹 간의 연결을 위한 커넥터를 선택한다.
이미지 조합 모듈은 원칙적으로 상대위치 값이 0인 박스를 커넥터로 선택하며, 그룹 내의 첫번째 단어가 커넥터 단어인 경우에는 상기 첫번째 단어를 포함하는 박스를 상기 그룹의 커넥터로 선택한다.
커넥터 단어는 that, who, whoever, whom, whose, why, what, whatever, when, whenever, where, wherever, which 등이 있다.
그룹 간의 연결 또한 도 11에서 정의되는 상대적 위치 관계에 의하여 설정될 수 있다.
즉, 동사에 해당하는 커넥터가 중심이 되고, 좌측 상단에는 주어 성분에 해당하는 커넥터, 우측하단에는 목적어 성분에 해당하는 커넥터가 배치된다. 우측상단에는 전치사구와 같은 성분에 해당하는 커넥터가 배치될 수 있다. 또한, 우측에는 보어 성분에 해당하는 커넥터, 2 위치에는 전치사 성분, d 위치에는 부사 성분이 배치될 수 있다.
학습 자료 제공 단계(S400)에서는 위에서 설명한 단계들을 통해 준비된 학습 컨텐츠를 학습자에게 제공한다.
영어의 경우 스트레스 타임드 랭귀지(Stressed timed language)에 해당하기 때문에 문장을 끊어 읽는 패턴이 중요하다. 본 발명에서는 이러한 문장의 패턴을 반영하여 학습자에게 학습 자료를 제공할 수 있다.
예를 들어, 제어모듈은 화자가 문장을 끊어읽는 위치, 출력되는 dB 값, 성조나 억양 등을 분석하여 학습자가 청취하고자 하는 문장의 강세 패턴을 판단한 후 강세 패턴에 대응하여 이미지 박스(또는 이미지 박스 그룹)의 디스플레이 타임을 설정할 수 있다.
다른 실시예에 따르면, 제어모듈은 문장 분석 결과에 따라 학습자에게 제공되는 박스들의 디스플레이 간격이나 디스플레이 시간을 조정할 수 있다.
예를 들어, 제어모듈은 문장에 포함된 단어의 숫자를 파악한 후 단어 당 일정 시간을 배정할 수 있다. 일 예로, "The boy who has a ball lies on the chair." 라는 문장은 10개의 단어로 되어 있으며 각 단어에 0.5초를 배정할 경우 전체 문장의 길이는 5초(duration)가 된다.
그 후 제어모듈은 상기 5초를 단어수와 끊어 읽는 횟수를 합한 숫자로 나누어 묶음별 시간을 다시 분배할 수 있다. 예를 들어, 위의 문장을 "The boy / who has a ball / lies / on the chair." 로 끊어 읽을 경우 3곳에서 끊어 읽게 되므로 한 단어당 5/13초를 할당한 후 이미지 박스의 디스플레이 간격을 설정할 수 있다.
마찬가지로 제어모듈은 특정 규칙을 설정하여 박스들의 디스플레이 간격, 디스플레이 시간 등을 조정할 수 있으며 이를 통해 학습자가 일정한 패턴으로 문장을 끊어 읽는 방식을 익히게 할 수 있다.
상기에서 설명한 적어도 하나의 실시예에 따르면 문장구조를 분석한 후 핵심단어를 기준으로 수식하는 단어, 세트, 그룹의 상대적 위치와 시간적 선후관계를 정의하여 문장 구조들 간의 공간적/시간적 연결관계를 이미지로 표현할 수 있다. 이를 통해 학습자가 영어의 문장 구성의 원리를 체득할 수 있게 하고, 문장의 구성요소들을 세트 및 그룹 별로 구분하여 영어문장 구성 방식을 쉽게 이해할 수 있게 하며, 문장 성분들에 일정 규칙에 따라 서로 다른 크기 또는 색깔의 박스를 할당하고 박스간의 연결관계를 정의하여 영어문장을 이해하는 방식과 중요도를 한눈에 파악할 수 있게 하는 등 종래기술과는 차별되는 효과를 기대할 수 있다.
이상에서 설명한 발명은 위에서 설명된 실시예들의 구성과 방법에 한정되는 것이 아니라, 상기 실시예들은 다양한 변형이 이루어질 수 있도록 각 실시예들의 전부 또는 일부가 선택적으로 조합되어 구성될 수도 있다.

Claims (12)

  1. 문장의 POS(Part of speech)값, DEP(Dependency)값 및 각 단어의 헤드(head)에 해당하는 단어에 대한 데이터를 검출하도록 형성되는 문장분석 모듈;
    상기 POS값과 DEP값을 이용하여 영어문장에서 메인 단어들을 선택하고 메인 단어에 해당하지 않는 단어들이 속하는 메인 단어 그룹을 정의한 후 상기 그룹별 단어 세트들을 설정하도록 형성되는 제어모듈;
    상기 세트들에 이미지 박스를 매칭시키고 상기 이미지 박스들에 색깔, 좌표, 순서를 정의하도록 형성되는 이미지 조합 모듈을 포함하며,
    상기 제어모듈은,
    문장의 패턴 분석 결과나 상기 문장분석 모듈의 분석 결과를 토대로 학습자에게 제공되는 이미지 박스들의 디스플레이 간격이나 디스플레이 시간을 조정하는 것을 특징으로 하는 영어 문장 학습을 위한 이미지 구조화 시스템.
  2. 삭제
  3. 삭제
  4. 삭제
  5. 삭제
  6. 제1항에 있어서,
    상기 이미지 박스는,
    주체, 행동, 결과물에 해당하는 단어들을 좌측 상단에서 우측 하단으로 연결되도록 연결 관계가 설정되는 것을 특징으로 하는 영어 문장 학습을 위한 이미지 구조화 시스템.
  7. 제6항에 있어서,
    상기 이미지 박스는,
    동사에 해당하는 성분 박스가 중심에 배치되고, 주어 성분에 해당하는 박스가 상기 중심 박스의 좌측상단에 연결되고, 목적어 성분에 해당하는 박스가 우측하단에 연결되도록 형성되는 것을 특징으로 하는 영어 문장 학습을 위한 이미지 구조화 시스템.
  8. 제7항에 있어서,
    상기 이미지 조합 모듈은,
    동일한 세트값을 갖는 단어들을 하나의 박스로 묶은 후 각 박스들의 인덱스 값(index_box), 헤드 인덱스 값(head index_box), DEP 값(DEP_box) 및 상대위치 값(relative position_box)을 추출하는 것을 특징으로 하는 영어 문장 학습을 위한 이미지 구조화 시스템.
  9. 제8항에 있어서,
    상기 이미지 조합 모듈은,
    상대위치 값이 0인 박스들을 기준으로 하여 박스들의 그룹을 묶는 것을 특징으로 하는 영어 문장 학습을 위한 이미지 구조화 시스템.
  10. 제9항에 있어서,
    상기 박스들의 그룹은,
    상대위치 값이 0인 박스의 경우, 박스의 인덱스(index_box) 값이 그룹 인덱스(index_group)가 되고,
    상대위치 값이 0이 아닌 박스의 경우, 헤드에 해당하는 박스의 상대위치가 0인 경우에는 상기 헤드에 해당하는 박스의 인덱스 값이 그룹 인덱스가 되고 헤드에 해당하는 박스의 상대위치가 0이 아닌 경우에는 상기 헤드에 해당하는 박스의 헤드에 해당하는 박스의 인덱스 값이 그룹 인덱스가 되는 것을 특징으로 하는 영어 문장 학습을 위한 이미지 구조화 시스템.
  11. 제10항에 있어서,
    상기 이미지 조합 모듈은,
    그룹 간의 연결을 위한 커넥터를 선택하며,
    상기 이미지 조합 모듈은 상대위치 값이 0인 박스를 커넥터로 선택하되, 그룹 내의 첫번째 단어가 커넥터 단어인 경우에는 상기 첫번째 단어를 포함하는 박스를 상기 그룹의 커넥터로 선택하는 것을 특징으로 하는 영어 문장 학습을 위한 이미지 구조화 시스템.
  12. 제11항에 있어서,
    상기 커넥터 단어는,
    that, who, whoever, whom, whose, why, what, whatever, when, whenever, where, wherever, which 중 적어도 하나인 것을 특징으로 하는 영어 문장 학습을 위한 이미지 구조화 시스템.


KR1020190160763A 2019-11-17 2019-12-05 영어 문장 학습을 위한 이미지 구조화 시스템 KR102403074B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20190147247 2019-11-17
KR1020190147247 2019-11-17

Publications (2)

Publication Number Publication Date
KR20210060280A KR20210060280A (ko) 2021-05-26
KR102403074B1 true KR102403074B1 (ko) 2022-05-30

Family

ID=76137839

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190160763A KR102403074B1 (ko) 2019-11-17 2019-12-05 영어 문장 학습을 위한 이미지 구조화 시스템

Country Status (1)

Country Link
KR (1) KR102403074B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117453146B (zh) * 2023-12-22 2024-04-05 芯能量集成电路(上海)有限公司 数据读取方法、系统、eFlash控制器及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100921563B1 (ko) 2008-04-25 2009-10-12 한국과학기술원 의존 문법 구문 트리를 이용한 문장 요약 방법
KR101906561B1 (ko) 2017-12-15 2018-12-05 김홍빈 문장구조 이해가 용이한 영어문장 표시방법

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101302875B1 (ko) 2011-09-28 2013-09-05 손민석 기호처리를 통해 문장구조 인식이 용이한 영어문장 직독직해 학습시스템
KR101405893B1 (ko) * 2012-08-28 2014-06-17 공병섭 단말기를 이용한 영어문장의 분석시스템 및 그 방법
KR101706980B1 (ko) 2014-06-30 2017-02-16 주식회사 에듀잉 캐릭터를 이용한 영어의 문장 구조 학습법
KR101990023B1 (ko) * 2017-05-26 2019-06-18 주식회사 엠글리쉬 외국어학습을 위한 청크단위 분리 규칙과 핵심어 자동 강세 표시 구현 방법 및 시스템

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100921563B1 (ko) 2008-04-25 2009-10-12 한국과학기술원 의존 문법 구문 트리를 이용한 문장 요약 방법
KR101906561B1 (ko) 2017-12-15 2018-12-05 김홍빈 문장구조 이해가 용이한 영어문장 표시방법

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Stenetorp et al. "BRAT: a web-based tool for NLP-assisted text annotation." Proceedings of the Demonstrations at the 13th Conference of the European Chapter of the ACL 2012.*

Also Published As

Publication number Publication date
KR20210060280A (ko) 2021-05-26

Similar Documents

Publication Publication Date Title
US9899019B2 (en) Systems and methods for structured stem and suffix language models
JP6840132B2 (ja) デジタルノートテイキングのシステムおよび方法
US20110097693A1 (en) Aligning chunk translations for language learners
CA2833656C (en) System and method for enhancing comprehension and readability of text
US11126794B2 (en) Targeted rewrites
CN112689189A (zh) 一种视频展示、生成方法及装置
US10699072B2 (en) Immersive electronic reading
US20220188514A1 (en) System for analyzing and prescribing content changes to achieve target readability level
CN110232111A (zh) 一种文本显示方法、装置及终端设备
US9141867B1 (en) Determining word segment boundaries
KR20220084915A (ko) 클라우드 기반 문법 교정 서비스 제공 시스템
US11074939B1 (en) Disambiguation of audio content using visual context
KR102403074B1 (ko) 영어 문장 학습을 위한 이미지 구조화 시스템
KR102307779B1 (ko) 컨셉 이미지를 통한 언어 습득 효율 향상 시스템 및 방법
KR102377787B1 (ko) 영어 문장 학습을 위한 이미지 구조화 시스템
US11704090B2 (en) Audio interactive display system and method of interacting with audio interactive display system
JP6731011B2 (ja) 電子図書の表示用データの作成装置
KR102072708B1 (ko) 텍스트 콘텐츠의 장르를 추론하는 방법 및 컴퓨터 프로그램
KR20040090867A (ko) 그레비티 레이어 방식을 이용한 xsl 스타일 시트의자동 생성 방법
KR102444093B1 (ko) 이미지를 이용한 영어기출문제 학습 시스템
KR20210126240A (ko) 외국어 문장구조 학습 시스템
US20210294971A1 (en) Word verification editing for simple and detailed text editing
Hussain et al. Practical Functional Approach to Quality Assessment in Subtitling:" Pocahontas II--Case Study".
JPH10301929A (ja) 文書処理装置、文書処理方法及び記録媒体
CN114299525A (zh) 图片处理方法、装置及电子设备

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant