KR20210126240A - System for learning structures of foreign languages - Google Patents
System for learning structures of foreign languages Download PDFInfo
- Publication number
- KR20210126240A KR20210126240A KR1020200043779A KR20200043779A KR20210126240A KR 20210126240 A KR20210126240 A KR 20210126240A KR 1020200043779 A KR1020200043779 A KR 1020200043779A KR 20200043779 A KR20200043779 A KR 20200043779A KR 20210126240 A KR20210126240 A KR 20210126240A
- Authority
- KR
- South Korea
- Prior art keywords
- word
- value
- sentence
- head
- module
- Prior art date
Links
- 238000000034 method Methods 0.000 claims description 9
- 238000013480 data collection Methods 0.000 abstract description 5
- 238000010801 machine learning Methods 0.000 abstract description 4
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 239000003795 chemical substances by application Substances 0.000 description 5
- 239000003607 modifier Substances 0.000 description 5
- 230000014509 gene expression Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000010454 slate Substances 0.000 description 1
- 239000004984 smart glass Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G06Q50/30—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/50—Business processes related to the communications industry
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B19/00—Teaching not covered by other main groups of this subclass
- G09B19/06—Foreign languages
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/02—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail using automatic reactions or user delegation, e.g. automatic replies or chatbot-generated messages
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/04—Real-time or near real-time messaging, e.g. instant messaging [IM]
- H04L51/046—Interoperability with other network applications or services
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Educational Administration (AREA)
- Educational Technology (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Marketing (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Entrepreneurship & Innovation (AREA)
- Artificial Intelligence (AREA)
- Operations Research (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
Description
본 발명은 외국어 문장구조를 학습할 수 있는 시스템에 관한 것이다. 보다 자세하게는, 메신저를 이용한 채팅 방식으로 외국어 문장구조를 학습할 수 있는 외국어 문장구조 학습 시스템에 관한 것이다. The present invention relates to a system capable of learning foreign language sentence structures. More particularly, it relates to a foreign language sentence structure learning system capable of learning a foreign language sentence structure through a chatting method using a messenger.
언어마다 문장 성분의 배치되는 위치가 상이하다. 따라서 외국어를 공부하기 위해서는 단순히 문장을 암기하기 보다는 문장 성분이 어떻게 배치되는 것인지 습득하는 것이 필요하다. The arrangement positions of sentence components are different for each language. Therefore, in order to study a foreign language, it is necessary to learn how sentence components are arranged rather than simply memorizing sentences.
하지만, 종래의 외국어 학습시스템에서는 단순히 문장을 암기시키거나 단어를 나열하는 방식의 컨텐츠를 제공할 뿐이었다. However, in the conventional foreign language learning system, only memorizing sentences or providing contents in a manner of listing words.
따라서, 단순히 외국어 문장을 학습하는 것이 아닌 외국어의 문장 구조를 학습함으로써 학습 효율을 극대화 시킬 수 있는 시스템에 대한 연구가 진행되고 있다. Therefore, research on a system that can maximize learning efficiency by learning the sentence structure of a foreign language rather than simply learning foreign language sentences is being conducted.
본 발명은 외국어 문장구조를 학습할 수 있는 시스템을 제공하는 것을 목적으로 한다. An object of the present invention is to provide a system capable of learning foreign language sentence structures.
본 발명은 메신저를 이용한 채팅 방식으로 외국어 문장구조를 학습할 수 있는 외국어 문장구조 학습 시스템을 제공한다. The present invention provides a foreign language sentence structure learning system capable of learning a foreign language sentence structure through a chatting method using a messenger.
본 발명에 따르면 자신의 수준에 맞는 단어를 학습할 수 있으며, 모국어를 이용하여 영어식 말하기 구조화 방법을 학습하는 것이 가능하다. According to the present invention, it is possible to learn a word suitable for one's level, and it is possible to learn an English-style speech structuring method using the mother tongue.
도 1 내지 도 15는 본 발명의 일 실시예에 따른 시스템을 설명하기 위한 개념도. 1 to 15 are conceptual diagrams for explaining a system according to an embodiment of the present invention.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. Since the present invention can have various changes and can have various embodiments, specific embodiments are illustrated in the drawings and will be described in detail in the detailed description.
그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 기술적 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. However, this is not intended to limit the present invention to a specific embodiment, it should be understood to include all modifications, equivalents and substitutes included in the spirit and scope of the present invention.
이하, 본 발명에 대하여 도면을 참조하여 보다 상세하게 설명한다. 본 명세서에서는 서로 다른 실시예라도 동일·유사한 구성에 대해서는 동일·유사한 참조번호를 부여하고, 그 설명은 처음 설명으로 갈음한다. 본 명세서에서 사용되는 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다.Hereinafter, the present invention will be described in more detail with reference to the drawings. In the present specification, the same and similar reference numerals are assigned to the same and similar components in different embodiments, and the description is replaced with the first description. As used herein, the singular expression includes the plural expression unless the context clearly dictates otherwise.
또한, 이하의 설명에서 사용되는 구성요소에 대한 접미사 "모듈" 또는 "부"는 명세서 작성의 용이함만이 고려되어 부여되거나 혼용되는 것으로서, 그 자체로 서로 구별되는 의미 또는 역할을 갖는 것은 아니다.In addition, the suffix "module" or "part" for the components used in the following description is given or mixed in consideration of only the ease of writing the specification, and does not have a meaning or role distinct from each other by itself.
학습자들은 사용자 단말기를 통해 언어 학습 컨텐츠를 제공받을 수 있다. 사용자 단말기에는 휴대폰, 스마트 폰(smart phone), 노트북 컴퓨터(laptop computer), 디지털방송용 단말기, PDA(personal digital assistants), PMP(portable multimedia player), 네비게이션, 슬레이트 PC(slate PC), 태블릿 PC(tablet PC), 울트라북(ultrabook), 웨어러블 디바이스(wearable device, 예를 들어, 워치형 단말기 (smartwatch), 글래스형 단말기 (smart glass), HMD(head mounted display)) 등의 이동 단말기나 디지털 TV, 데스크탑 컴퓨터, 디지털 사이니지 등과 같은 고정 단말기가 포함될 수 있다. Learners may be provided with language learning content through the user terminal. User terminals include mobile phones, smart phones, laptop computers, digital broadcast terminals, personal digital assistants (PDA), portable multimedia players (PMPs), navigation systems, slate PCs, and tablet PCs. PC), ultrabooks, wearable devices, for example, watch-type terminals (smartwatch), glass-type terminals (smart glass), mobile terminals such as HMD (head mounted display), digital TV, desktop A fixed terminal such as a computer, digital signage, and the like may be included.
시스템(100)은 제어모듈(110)과, 데이터수집모듈(120)과, 데이터베이스(130)와, 이미지 조합 모듈(140), 문장분석모듈(150) 등을 포함할 수 있다. 이하에서는 설명의 편의를 위해 각 모듈을 구분하여 설명하고 있지만 실제 제어모듈(110)이 다른 모듈들을 기능을 포함하도록 형성되는 것이 가능하다. The system 100 may include a control module 110 , a data collection module 120 , a database 130 , an image combination module 140 , a sentence analysis module 150 , and the like. Hereinafter, each module is separately described for convenience of description, but it is possible that the actual control module 110 is formed to include functions of other modules.
제어모듈(110)은 문장에 대한 데이터를 수집하거나 데이터베이스에 저장된 데이터를 각 모듈에 제공하거나, 각 모듈들의 구동을 제어할 수 있다. 학습 효율 증대를 위해 제어모듈(110)에는 머신러닝 모듈이 포함될 수 있다. 예를 들어, 이미지 조합 모듈을 통해 문장 구성들을 이미지화 하는 과정에서 학습자들이 선호하는 박스 크기, 색상 등의 정보를 수집한 후 이를 이용해 최적의 이미지를 찾아내는 것이 가능하다. The control module 110 may collect data about a sentence, provide data stored in a database to each module, or control the operation of each module. To increase learning efficiency, the control module 110 may include a machine learning module. For example, it is possible to find the optimal image by collecting information such as the box size and color preferred by learners in the process of imaging sentence structures through the image combination module.
제어모듈(110)은 문장 구성 이미지를 노출시킬 때 해당 이미지에 대응하는 음성을 함께 제공할 수 있다. When exposing the sentence structure image, the control module 110 may provide a voice corresponding to the image together.
데이터수집모듈(120)은 문장을 구성하는 단어들에 대한 데이터들을 수집하여 제어모듈(110)에 제공할 수 있다. 예를 들어, 데이터수집모듈(120)은 단어들에 대응되는 음성데이터를 수집하여 데이터베이스에 저장할 수 있다. The data collection module 120 may collect data on words constituting a sentence and provide it to the control module 110 . For example, the data collection module 120 may collect voice data corresponding to words and store them in a database.
데이터베이스(130)에는 시스템(100)을 구동시키기 위한 각종 데이터들이 저장된다. 예를 들어, 데이터베이스(130)에는 단어들에 대응되는 이미지 데이터들과 해당 단어에 대응되는 복수의 음성 데이터들이 저장될 수 있다. The database 130 stores various data for driving the system 100 . For example, the database 130 may store image data corresponding to words and a plurality of voice data corresponding to the words.
또한, 데이터베이스(130)에는 이미지 박스의 색상, 크기, 위치에 대한 데이터들이 저장될 수 있다. 이러한 정보들은 사용자가 직접 설정할 수 있으며 경우에 따라서는 머신러닝을 통해 얻어진 정보일 수도 있다. In addition, data on the color, size, and position of the image box may be stored in the database 130 . Such information can be set by the user and, in some cases, may be information obtained through machine learning.
이미지 조합 모듈(140)은 각 단어(또는 그룹)에 해당하는 이미지 박스를 매칭하고 이미지 박스의 크기, 색상, 위치 등을 정의한다. The image combination module 140 matches an image box corresponding to each word (or group) and defines the size, color, position, and the like of the image box.
또한, 이미지 조합 모듈(140)은 각 세트 내 단어들의 이미지 박스(그룹)의 위치를 정의한 후 그룹 간 이미지 순서 및 위치를 정의할 수 있다. In addition, the image combination module 140 may define the position of the image box (group) of words in each set, and then define the image order and position between groups.
문장분석모듈(150)은 머신 러닝 등의 인공지능(AI)을 활용하여 문장의 구조를 분석(sentence parsing)할 수 있다. The sentence analysis module 150 may analyze the structure of a sentence by using artificial intelligence (AI) such as machine learning (sentence parsing).
본 발명의 일 실시예에 따르면, 시스템은 강세 패턴 분석모듈(미도시)을 더 포함할 수 있다. According to an embodiment of the present invention, the system may further include a bullish pattern analysis module (not shown).
강세 패턴 분석모듈은 문장의 음성출력 데이터를 분석하여 화자가 문장을 끊어읽는 위치, 출력되는 dB 값, 성조나 억양 등을 분석하여 학습자가 청취하고자 하는 문장의 강세 패턴을 판단할 수 있다. The stress pattern analysis module can determine the stress pattern of the sentence the learner wants to listen to by analyzing the voice output data of the sentence and analyzing the position where the speaker cuts the sentence, the output dB value, the tone or intonation, etc.
제어 모듈은 상기 강세 패턴 분석모듈이 분석한 패턴 또는 문장 분석 결과에 따라 학습자에게 제공되는 박스들의 디스플레이 간격이나 디스플레이 시간을 조정할 수 있다. The control module may adjust the display interval or display time of boxes provided to the learner according to the pattern or sentence analysis result analyzed by the stress pattern analysis module.
영어문장 구조의 이미지 구조화 방법은 pre-data 처리 단계(S100)와, Data 가공 단계(S200)와, 문장 구성 이미지화 단계(S300)와, 학습 자료 제공 단계(S400) 등을 포함할 수 있다. The image structuring method of the English sentence structure may include a pre-data processing step (S100), a data processing step (S200), a sentence structure imaging step (S300), and a learning data provision step (S400).
본 발명의 시스템은 영어 문장의 POS값과 DEP값을 활용하여 메인 단어들을 추출하고, 단어 그룹별 세트를 설정하고, 이렇게 정리된 데이터를 이용하여 영어문장을 이미지 구조화한다. The system of the present invention extracts main words by using the POS value and DEP value of the English sentence, sets a set for each word group, and uses the organized data to structure the English sentence image.
문장분석모듈은 문장의 POS (Part of speech) 값, DEP (Dependency) 값, 각 단어의 헤드(head)에 해당하는 단어 등에 대한 데이터를 검출한다. The sentence analysis module detects data on a POS (Part of speech) value of a sentence, a DEP (Dependency) value, and a word corresponding to the head of each word.
POS 값은 각 단어들이 갖는 문장성분값을 나타낸다. The POS value represents the sentence component value of each word.
POS 값에는 ADJ(adjective), ADP(adposition), ADV(adverb), AUX(auxiliary), CONJ(conjunction), CCONJ(coordinating conjunction), DET(determiner), INTJ(interjection), NOUN(noun), NUM(numeral), PART(particle), PRON(pronoun), PROPN(proper noun), PUNCT(punctuation), SCONJ(subordinating conjuction), SYM(symbol), VERB(verb), X(other) SPACE(space) 등을 포함할 수 있다. POS values include ADJ(adjective), ADP(adposition), ADV(adverb), AUX(auxiliary), CONJ(conjunction), CCONJ(coordinating conjunction), DET(determiner), INTJ(interjection), NOUN(noun), NUM (numeral), PART(particle), PRON(pronoun), PROPN(proper noun), PUNCT(punctuation), SCONJ(subordinating conjuction), SYM(symbol), VERB(verb), X(other) SPACE(space), etc. may include.
DEP 값은 단어들의 관계를 나타내는 값으로, 각 단어들은 도 4에 도시된 바와 같이 시작점(꼬리)과 도착점(머리)을 갖는 화살표로 연결될 수 있다. The DEP value is a value indicating a relationship between words, and each word may be connected with an arrow having a starting point (tail) and an ending point (head) as shown in FIG. 4 .
본 실시예에서는 DEP 값 할당하기 위해 각 단어들을 연결하는 화살표를 이용하였으나 이는 단어들의 관계를 설명하기 위한 것일 뿐이다. 즉, 시스템에서 단어들의 관계를 화살표로 표시하지 않더라도 어느 한 단어에서 다음 단어로 의미가 연결되거나 문장 구조가 연결되는 경우에는 앞선 단어 쪽을 꼬리 지점으로 뒤따르는 단어 쪽을 머리 지점으로 설정하는 것이 가능하다. In this embodiment, arrows connecting each word are used to allocate the DEP value, but this is only for explaining the relationship between the words. That is, even if the system does not indicate the relationship between words with arrows, if a meaning is connected from one word to the next or a sentence structure is connected, it is possible to set the side of the preceding word as the tail point and the side of the following word as the head point. do.
DEP 값에는 acl(adjectival clause), acomp(adjectival complement), advcl(adverbial clause modifier), advmod(adverbial modifier), amod(adjectival modifier), appos(appositional modifier), ccomp(clausal complement), dobj(direct object), nsubj(nominal subject), det(determiner), relcl(relative clause modifier) 등을 포함할 수 있다. DEP values include acl (adjectival clause), acomp (adjectival complement), advcl (adverbial clause modifier), advmod (adverbial modifier), amod (adjectival modifier), appos (appositional modifier), ccomp (clausal complement), dobj (direct object). ), nsubj (nominal subject), det (determiner), relcl (relative clause modifier), and the like.
차일드(child)는 성분 2개를 연결한 화살표의 머리 지점에 위치한 성분을 말하고, 헤드(head)는 성분 2개를 연결한 화살표의 시작 지점의 성분을 말한다. A child refers to a component located at the head point of an arrow connecting two components, and a head refers to a component at the starting point of an arrow connecting two components.
엔세스터(ancestor)는 헤드에서 헤드로 거슬러 올라간 위치의 성분을 말한다. An ancestor refers to a component of a position from the head back to the head.
디센던트(descendant)는 차일드에서 차일드로 거슬러 내려간 위치의 성분을 말한다. Descendant refers to a component of a position from child to child.
제어 모듈(110)은 상기에서 설명한 POS 값, DEP 값, 차일드, 디센던트, 엔세스터 등의 정보에 대응하여 data를 가공하고 이미지 박스의 배치, 모양, 색상, 크기 등을 설정할 수 있다. The control module 110 may process data in response to information such as the POS value, the DEP value, the child, descendant, and encestor described above, and set the arrangement, shape, color, size, etc. of the image box.
data 가공 단계(S200)는 영어문장에서 메인 단어들을 선택하는 단계(S210)와, 단어들의 세트를 지정하고 동일 세트의 단어들을 하나의 박스로 묶는 단계(S220), 박스 그룹 및 박스 포지션을 설정하는 단계(S230) 등을 포함할 수 있다. The data processing step (S200) includes a step (S210) of selecting main words from an English sentence, a step (S220) of specifying a set of words and tying the words of the same set into one box (S220), setting a box group and a box position It may include a step (S230) and the like.
메인 단어들을 선택하는 단계(S210)에서는 앞에서 설명한 단어들의 POS값, DEP값 및 성분간 연결구조 정보를 이용하여 문장에서 메인 단어를 선택한다. In the step of selecting the main words ( S210 ), the main word is selected from the sentence by using the POS value, the DEP value of the above-described words, and the connection structure information between the components.
< 메인 단어 식별(is main) >< Identification of the main word (is main) >
메인 단어에 해당하는 경우 메인단어 여부 데이터값(is main)을 트루(true)로 설정하고 메인 단어가 아닌 경우 폴스(false)로 설정한다. If it corresponds to the main word, the main word data value (is main) is set to true, and if it is not the main word, it is set to false.
제어 모듈은(110) 단어의 DEP 값이 acl, acomp, advcl, advmod_v, advmod_v_up, appos, attr, aux_t, auxpass, cc_t, cc_c, ccomp, conj_t, cop, csubj, csubjpass, dative, dep, dobj, expl, intj, meta, nsubj, nsubjpass, oprd, obj, obl, parataxis, pcomp, pobj, preconj, punct, relcl, root, xcomp 인 경우 해당 단어를 메인 단어로 선택한다. The control module 110 has a DEP value of the words acl, acomp, advcl, advmod_v, advmod_v_up, appos, attr, aux_t, auxpass, cc_t, cc_c, ccomp, conj_t, cop, csubj, csubjpass, dative, dep, dobj, expl , intj, meta, nsubj, nsubjpass, oprd, obj, obl, parataxis, pcomp, pobj, preconj, punct, relcl, root, xcomp, select the corresponding word as the main word.
DEP값이 conj인 경우 해당 단어의 헤드에 해당하는 단어의 POS가 verb이면 해당 단어의 DEP값을 conj_t(메인 단어에 해당하는 conj)로 변경하고 이를 메인 단어로 선택한다. DEP값이 conj인 경우 해당 단어의 헤드에 해당하는 단어의 POS가 verb가 아니면 DEP값을 conj_f(메인 단어에 해당하지 않는 conj)로 변경하고 이를 메인 단어가 아닌 것으로 결정한다. When the DEP value is conj, if the POS of the word corresponding to the head of the corresponding word is verb, the DEP value of the corresponding word is changed to conj_t (conj corresponding to the main word) and this is selected as the main word. When the DEP value is conj, if the POS of the word corresponding to the head of the corresponding word is not a verb, the DEP value is changed to conj_f (conj not corresponding to the main word) and it is determined as not the main word.
여기서 DEP값 conj_t 와 conj_f 는 설명의 편의를 위하여 표시한 것으로서 이러한 용어에 권리범위가 한정되는 것은 아니다. Here, the DEP values conj_t and conj_f are indicated for convenience of explanation, and the scope of rights is not limited to these terms.
또한, 제어 모듈(110)은 DEP 값이 cc이면서 해당 단어의 헤드에 해당하는 단어의 POS값이 verb인 경우 root가 head 이고 root index가 자기 index 보다 큰 경우 DEP 값을 cc_c 로 변경하고 root가 head 이고 root index가 자기 index 보다 작은 경우 DEP 값을 cc_t로 변경한다. 헤드에 해당하는 단어의 POS값이 verb가 아니면 DEP값을 cc_f(메인 단어에 해당하지 않는 cc)로 변경하고 이를 메인 단어가 아닌 것으로 결정한다. In addition, when the DEP value is cc and the POS value of the word corresponding to the head of the word is verb, the control module 110 changes the DEP value to cc_c when the root is head and the root index is greater than its own index, and the root is head and if the root index is smaller than its own index, the DEP value is changed to cc_t. If the POS value of the word corresponding to the head is not a verb, the DEP value is changed to cc_f (cc not corresponding to the main word) and it is determined as not the main word.
마찬가지로 DEP값 cc_t 와 cc_f 는 설명의 편의를 위하여 표시한 것으로서 이러한 용어에 권리범위가 한정되는 것은 아니다.Similarly, the DEP values cc_t and cc_f are indicated for convenience of explanation, and the scope of rights is not limited to these terms.
또한, 제어 모듈(110)은 DEP 값이 prep 또는 agent인 단어의 경우, 해당 단어의 차일드에 해당하는 단어의 DEP 값이 pcomp인 경우 상기 DEP 값이 prep 또는 agent인 단어는 메인 단어로 선택하지 않는다. In addition, in the case of a word having a DEP value of prep or agent, when the DEP value of a word corresponding to a child of the word is pcomp, the control module 110 does not select a word having a DEP value of prep or agent as the main word. .
제어 모듈(110)은 DEP 값이 npadvmod, advmod 이고 헤드의 POS가 verb인 경우, root가 head 이고 root index가 자기 index 보다 큰 경우 DEP 값을 cc_c로 변경하며 root가 head 가 아니고 root index가 자기 index 보다 작은 경우 DEP 값을 advmod_v로 변경한다. 이러한 변환을 통해 부사가 꾸며주는 말과 떨어져 있는 경우를 처리할 수 있게 된다. The control module 110 changes the DEP value to cc_c when the DEP value is npadvmod, advmod and the POS of the head is verb, when the root is the head and the root index is greater than the own index, and the root is not the head and the root index is the own index If it is less than, change the DEP value to advmod_v. Through this transformation, it is possible to handle the case where the adverb is separate from the adverb of the adverb.
DEP 값이 mark 이고 head의 POS가 verb 인 경우 head index가 자기 index 보다 큰 경우 DEP 값을 cc_c로 변경한다. 이를 통해 as와 같은 단어(mark)가 꾸며주는 말과 떨어져서 앞에 있을 경우를 처리할 수 있게 된다. If the DEP value is mark and the POS of the head is verb, if the head index is larger than the self index, the DEP value is changed to cc_c. Through this, it is possible to handle the case where a word (mark) such as as is in front of the adorning word.
또한, 제어모듈(110)은 DEP 값이 pobj이면서 헤드에 해당하는 단어의 DEP 값이 prep 이거나 agent인 단어의 DEP 값을 pobj_t(메인 단어에 해당하는 pobj)로 변경하고 이를 메인 단어로 선택한다. DEP 값이 pobj 이면서 헤드에 해당하는 단어의 DEP 값이 prep나 agent가 아닌 단어의 DEP 값은 pobj_f(메인 단어에 해당하지 않는 pobj)로 변경하고 이를 메인 단어가 아닌 것으로 결정한다. In addition, the control module 110 changes the DEP value of the word corresponding to the head to prep or the DEP value of the word corresponding to the head to pobj_t (pobj corresponding to the main word) while the DEP value is pobj, and selects it as the main word. If the DEP value is pobj and the DEP value of the word corresponding to the head is not prep or agent, the DEP value is changed to pobj_f (pobj not corresponding to the main word), and it is determined as not the main word.
또한, 제어모듈(110)은 DEP 값이 aux이면 lemma가 have 이거나 be 이면 DEP 값을 aux_t로 변경한다. Also, if the DEP value is aux, the control module 110 changes the DEP value to aux_t if the lemma is have or be.
또한, 제어모듈(110)은 'of' 단어의 head의 POS 값이 NOUN 이거나 PRON 인 경우, 해당 'of'를 head로 가지고 있는 단어는 메인 단어에서 제외한다. In addition, when the POS value of the head of the word 'of' is NOUN or PRON, the control module 110 excludes the word having the corresponding 'of' as the head from the main word.
<메인 단어의 depth를 확인><Check the depth of the main word>
'of'의 head를 A, 'of'를 head로 가지고 있는 단어를 B라고 하면, B를 head로 가지고 있는 단어의 head를 A로 변경한다. If the head of 'of' is A, and the word having 'of' as head is B, the head of the word having B as head is changed to A.
제어모듈은 DEP 값이 root인 단어의 depth를 0으로 지정하고, 각 단어들이 head 타고 root까지 거슬러 올라갈 때 만나는 메인 단어의 갯수가 n개인 경우 해당 단어의 depth를 n으로 지정한다. 이 때 단어 자신이 메인 단어인 것은 카운팅하지 않는다. The control module designates the depth of the word whose DEP value is the root as 0, and when the number of main words encountered when each word goes back to the root on the head is n, the depth of the corresponding word is designated as n. In this case, the word itself is not counted as the main word.
본 발명의 일 실시예에 따르면 제어 모듈(110)은 상기 depth 값 또는 아래에서 설명하는 레벨 값에 따라 글자의 크기와 폰트를 설정할 수 있다. According to an embodiment of the present invention, the control module 110 may set the size and font of characters according to the depth value or the level value described below.
<단어들의 파트값(part_main) 및 세트값 설정><Setting part value (part_main) and set value of words>
단어들이 어느 메인 단어의 파트에 해당하는지 결정한다. Determines which main word the words are part of.
제어모듈(110)은 먼저 메인 단어의 경우(true) index값을 파트값으로 정한다. The control module 110 first determines the index value as a part value in the case of the main word (true).
단어가 메인 단어에 해당하지 않는 경우(false) 아래의 방법으로 단어의 파트값(part_main)을 결정한다. If the word does not correspond to the main word (false), the part value (part_main) of the word is determined by the following method.
단어의 head에 해당하는 단어가 메인 단어인 경우(true) head의 index값을 파트값(part main)으로 결정한다. head에 해당하는 단어가 메인 단어가 아닌 경우(false) head의 head에 해당하는 단어가 메인 단어인지 확인하여 해당 메인 단어의 index 값을 파트값으로 결정한다. If the word corresponding to the head of the word is the main word (true), the index value of the head is determined as the part value (part main). If the word corresponding to the head is not the main word (false), it is checked whether the word corresponding to the head of the head is the main word, and the index value of the corresponding main word is determined as the part value.
메인 단어가 아니면서 DEP 값이 prep 이거나 agent 인 단어의 경우, 그 단어를 head로 갖고 있는 단어 중 메인 단어가 있다면 해당 메인 단어의 index 값을 파트값으로 결정한다. 예를 들어, index값 12의 'in'의 경우 메인 단어가 아니면서 DEP 값이 prep이다. 'in'을 head로 갖는 단어 중 index값 15인 'home' 단어가 메인 단어에 해당하므로 'home'의 index값(15)이 'in'의 파트값이 된다. In the case of a word that is not a main word and whose DEP value is prep or agent, if there is a main word among the words having the word as head, the index value of the corresponding main word is determined as the part value. For example, in the case of 'in' with an index value of 12, the DEP value is prep while not the main word. Since the word 'home' having an index value of 15 among words having 'in' as the head corresponds to the main word, the
메인 단어가 아니면서 DEP 값이 prep 이거나 agent 인 단어의 경우, 그 단어를 head로 갖고 있는 단어 중 메인 단어가 없다면 원래대로 head의 index값을 파트값으로 결정한다. 예를 들어, index값 30의 'of'의 경우 메인 단어가 아니면서 DEP 값이 prep이다. 하지만 'of'를 head로 갖는 단어(head index 값이 30인 단어들) 중에는 메인 단어가 존재하지 않기 때문에 'of'의 head index값인 29가 파트값이 된다. In the case of a word that is not a main word and whose DEP value is prep or agent, if there is no main word among the words that have the word as head, the index value of head is determined as the part value. For example, in the case of 'of' with an index value of 30, the DEP value is prep while not the main word. However, since the main word does not exist among the words having 'of' as the head (words with a head index value of 30), the head index value of 'of', 29, becomes the part value.
이해하기 쉽게 이에 해당하는 단어들을 도 6에서 붉은색 글자로 표시하고 있다. For easy understanding, corresponding words are indicated in red letters in FIG. 6 .
모든 단어들의 파트값이 결정될 때까지 계속 상기와 같이 방식으로 head를 거슬러 올라가며 파트값을 결정한다. Continue to determine the part value in the same manner as above until the part value of all words is determined.
단어들의 파트값을 결정한 후 메인 단어 여부와 상기 정해진 파트값을 이용해 단어들의 세트를 설정한다. After determining the part values of the words, a set of words is set by using the main word and the determined part values.
제어모듈(110)은 메인 단어에 해당하는 경우 상기 메인 단어의 index 값을 세트값으로 설정하며, 메인 단어가 아닌 경우 해당 단어의 파트값(part_main)을 세트값으로 설정한다. The control module 110 sets the index value of the main word as a set value when it corresponds to the main word, and sets the part value (part_main) of the corresponding word as a set value when it is not the main word.
<단어의 레벨 산정><Calculation of word level>
단어들의 레벨을 설정하여 박스 또는 그룹들의 크기, 색상 등을 결정한다. Set the level of words to determine the size, color, etc. of boxes or groups.
단어들의 레벨 산정은 단어가 배열된 순서대로 아래의 규칙에 따라 정하여진다. The level calculation of words is determined according to the following rules in the order in which the words are arranged.
DEP가 root인 단어의 레벨(level)을 1로 설정하고, 해당 단어의 DEP가 acl 또는 relcl에 해당하는 경우 head의 레벨에 1을 더한다. The level of the word whose DEP is the root is set to 1, and if the DEP of the corresponding word corresponds to acl or relcl, 1 is added to the level of the head.
단어의 DEP가 acl 또는 relcl이 아닌 경우 해당 단어의 레벨을 head의 레벨과 동일한 레벨로 설정한다. 만약 head의 레벨이 아직 정해지지 않았다면 해당 단어의 레벨을 설정하지 않고 패스하며 마지막 단어까지 도달한 경우 다시 첫 단어부터 다시 레벨을 산정한다. If the DEP of a word is not acl or relcl, the level of the word is set to the same level as that of the head. If the level of the head has not been determined yet, the level of the corresponding word is passed without setting, and if the last word is reached, the level is calculated again from the first word.
< 그룹 결정 >< Group decision >
제어모듈(110)은 도 6에서 같은 세트값을 갖는 단어들을 하나의 박스로 묶고 해당 세트값을 인덱스 박스(index_box)값으로 설정한다. The control module 110 groups words having the same set value into one box in FIG. 6 and sets the corresponding set value as an index box (index_box) value.
본 발명의 일 실시예에 따르면, 각 박스 내 단어들의 head index값을 추적하여 박스 내 단어가 아닌 단어를 head로 갖는 단어의 head index 값을 헤드 인덱스 박스(head_index_box)값으로 설정한다. 예를 들어, 도 6에서 세트값이 2인 단어들 중 'a'와 'retired'의 head index 값은 2이므로 동일 세트(박스) 내의 단어 'soldier'를 head로 갖지만 'soldier'의 head index는 11이므로 다른 세트(박스)의 단어 'died'를 head로 갖는다. 따라서, 인덱스 박스 2의 헤드 인덱스 박스는 11이 된다. According to an embodiment of the present invention, the head index value of the words in each box is tracked, and a head index value of a word having a word other than a word in the box as a head is set as a head index box (head_index_box) value. For example, in FIG. 6, the head index value of 'a' and 'retired' among the words having a set value of 2 is 2, so the word 'soldier' in the same set (box) is the head, but the head index of 'soldier' is 11, so we have as head the word 'died' from another set (box). Accordingly, the head index box of
제어모듈(110)은 단어의 DEP 값이 acl, relcl, 또는 root 인 경우 해당 단어를 그룹 팩터(group factor)로 설정하고 해당 단어를 포함하는 박스를 그룹 팩터 박스(group factor_box)로 설정한다. When the DEP value of a word is acl, relcl, or root, the control module 110 sets the corresponding word as a group factor and sets a box including the corresponding word as a group factor_box.
그룹 팩터 박스에 해당하는 박스의 경우 인덱스 박스 값을 인덱스 그룹 값으로 설정하고, 헤드 인덱스 박스가 그룹 팩터 박스에 해당하는 경우 헤드 인덱스 박스 값을 인덱스 그룹(index_group) 값으로 설정한다. 예를 들어, 인덱스 박스 값 2인 'a retired soldier'의 헤드 인덱스 박스 'died'가 그룹 팩터 박스에 해당(true)하므로 헤드 인덱스 박스 값 11을 인덱스 그룹 값으로 설정한다. In the case of the box corresponding to the group factor box, the index box value is set as the index group value, and when the head index box corresponds to the group factor box, the head index box value is set as the index group (index_group) value. For example, since the head index box 'died' of 'a retired soldier' with the index box value of 2 corresponds to the group factor box (true), the head
본 발명에서는 외국어 교과서와 참고서에 나오는 문장의 빈도수를 체크한다. In the present invention, the frequency of sentences in foreign language textbooks and reference books is checked.
예를 들어, 지리학 원서에 나오는 표현 중 빈도수가 가장 높은 단어들을 정렬하여 학습자에게 컨텐츠를 제공할 수 있다. For example, content can be provided to learners by arranging words with the highest frequency among expressions in a geography application.
또한, 본 발명의 시스템은 문장을 학습하였는지 여부를 체크하여 학습이 완료된 문장은 학습자에게 제시하지 않는다. In addition, the system of the present invention checks whether the sentence has been learned, and the learned sentence is not presented to the learner.
아직 배우지 않은 문장 중 빈도수가 가장 높은 문장을 추천하게 된다. Among the unlearned sentences, the sentence with the highest frequency is recommended.
언어는 크게 주체부, 관계부, 대상부(목적어), 배경 으로 구성된다. Language is largely composed of subject part, relation part, object part (object), and background.
주체부는 꾸며주는 부분 + 주체로 구성되고, 관계부는 꾸며주는 부분 + 대상으로 구성된다. The subject part consists of a decorating part + subject, and the relational part consists of a decorating part + object.
본 발명에서는 학습하고자 하는 언어에서 주체부, 관계부, 대상부(목적어), 배경의 순서를 파악하여 한글 문장의 단어들을 해당 외국어의 배치로 위치를 바꾼다. In the present invention, the order of the subject part, the relation part, the target part (object), and the background is identified in the language to be learned, and the words of the Korean sentence are changed to the arrangement of the foreign language.
본 발명은 랭귀지 메타 포멧을 제시한다. The present invention provides a language meta-format.
본 발명은 모든 문장을 clause와 relatives로 구분한 후 문장의 뼈대가 되는 성분들을 제시한다. The present invention presents components that become the skeleton of a sentence after dividing all sentences into clauses and relatives.
앞에서 설명한 DEP 값에 근거하여 핵심구와 relatives를 구분한다. Distinguish between key phrases and relatives based on the DEP values described above.
relative는 'acl', 'relcl', 'advcl', 'amod_t', 'appos', 'ccomp', 'csubj', 'csubjpass', 'xcomp' 성분들로 구성된다. relative consists of 'acl', 'relcl', 'advcl', 'amod_t', 'appos', 'ccomp', 'csubj', 'csubjpass', and 'xcomp' components.
또한, 단어 또는 세트의 레벨값에 따라 묶음을 형성한다. In addition, a bundle is formed according to the level value of a word or set.
레벨값이 1인 경우 핵심구로 취급하고, 레벨값이 2이상인 경우 relatives로 취급한다. 레벨값이 3이상인 경우 모두 레벨 2인 것으로 취급할 수 있다. When the level value is 1, it is treated as a key phrase, and when the level value is 2 or more, it is treated as relatives. If the level value is 3 or higher, all of them can be treated as
본 발명의 일 실시예에 따르면 시스템은 먼저 학습자가 문장을 선택할 수 있게 제시한다. 해당 문장은 TTS를 통해 발음을 제공할 수 있다. According to an embodiment of the present invention, the system first presents a sentence for the learner to select. The corresponding sentence may provide pronunciation through TTS.
이상에서 설명한 발명은 위에서 설명된 실시예들의 구성과 방법에 한정되는 것이 아니라, 상기 실시예들은 다양한 변형이 이루어질 수 있도록 각 실시예들의 전부 또는 일부가 선택적으로 조합되어 구성될 수도 있다.The invention described above is not limited to the configuration and method of the embodiments described above, but all or some of the embodiments may be selectively combined so that various modifications may be made.
Claims (1)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200043779A KR20210126240A (en) | 2020-04-10 | 2020-04-10 | System for learning structures of foreign languages |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200043779A KR20210126240A (en) | 2020-04-10 | 2020-04-10 | System for learning structures of foreign languages |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20210126240A true KR20210126240A (en) | 2021-10-20 |
Family
ID=78268075
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200043779A KR20210126240A (en) | 2020-04-10 | 2020-04-10 | System for learning structures of foreign languages |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20210126240A (en) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101853892B1 (en) | 2016-04-06 | 2018-05-02 | 조강수 | Apparatus, server, system and method for english study based on process of study, review and verification |
KR101906561B1 (en) | 2017-12-15 | 2018-12-05 | 김홍빈 | Display method of English sentence for easy recognition of sentence structure |
-
2020
- 2020-04-10 KR KR1020200043779A patent/KR20210126240A/en unknown
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101853892B1 (en) | 2016-04-06 | 2018-05-02 | 조강수 | Apparatus, server, system and method for english study based on process of study, review and verification |
KR101906561B1 (en) | 2017-12-15 | 2018-12-05 | 김홍빈 | Display method of English sentence for easy recognition of sentence structure |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101713487B1 (en) | Method for scoring supply type answer sheet by using ensemble machine learning method and computer program for the same | |
Zitouni | Natural language processing of semitic languages | |
US8744855B1 (en) | Determining reading levels of electronic books | |
CN111767709A (en) | Logic method for carrying out error correction and syntactic analysis on English text | |
CN110442839A (en) | English text combines mask method into syllables, combines method, storage medium and electronic equipment into syllables | |
Abdulrahman et al. | Developing a fine-grained corpus for a less-resourced language: the case of Kurdish | |
Sodhar et al. | Identification of issues and challenges in romanized Sindhi text | |
Alex | Automatic detection of English inclusions in mixed-lingual data with an application to parsing | |
Samudravijaya | Indian language speech label (ILSL): a de facto national standard | |
Yessenbayev et al. | KazNLP: A pipeline for automated processing of texts written in Kazakh language | |
Bhattacharyya et al. | Indic language computing | |
KR102307779B1 (en) | System for improving efficiency of language acquisition using the concept-image and method using the same | |
KR102403074B1 (en) | Image-structuring system for learning english sentences | |
US11704090B2 (en) | Audio interactive display system and method of interacting with audio interactive display system | |
KR20210126240A (en) | System for learning structures of foreign languages | |
Gondaliya et al. | A Rule-based Grammar and Spell Checking | |
BHATTACHARYYA et al. | Indic | |
Demilie et al. | Automated all in one misspelling detection and correction system for Ethiopian languages | |
de Mendonça Almeida et al. | Evaluating phonetic spellers for user-generated content in Brazilian Portuguese | |
US20200387806A1 (en) | Idea generation support device, idea generation support system, and recording medium | |
Zeisler | Why Ladakhi must not be written-Being part of the Great Tradition: another kind of global thinking | |
Choi et al. | Spoken‐to‐written text conversion for enhancement of Korean–English readability and machine translation | |
KR102377787B1 (en) | Image-structuring system for learning english sentences | |
Dashti et al. | PERCORE: A Deep Learning-Based Framework for Persian Spelling Correction with Phonetic Analysis | |
Krishnamurthy | The corpus revolution in EFL dictionaries |