KR102582013B1 - Word extraction device and Method for productive vocabulary knowledge expansion based on foreign language dialogue record of learners - Google Patents

Word extraction device and Method for productive vocabulary knowledge expansion based on foreign language dialogue record of learners Download PDF

Info

Publication number
KR102582013B1
KR102582013B1 KR1020210106226A KR20210106226A KR102582013B1 KR 102582013 B1 KR102582013 B1 KR 102582013B1 KR 1020210106226 A KR1020210106226 A KR 1020210106226A KR 20210106226 A KR20210106226 A KR 20210106226A KR 102582013 B1 KR102582013 B1 KR 102582013B1
Authority
KR
South Korea
Prior art keywords
words
word
recommended
extracted
extracting
Prior art date
Application number
KR1020210106226A
Other languages
Korean (ko)
Other versions
KR20230024103A (en
Inventor
김주호
김서영
이주훈
정석훈
최슬기
Original Assignee
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술원 filed Critical 한국과학기술원
Priority to KR1020210106226A priority Critical patent/KR102582013B1/en
Publication of KR20230024103A publication Critical patent/KR20230024103A/en
Application granted granted Critical
Publication of KR102582013B1 publication Critical patent/KR102582013B1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3347Query execution using vector based model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

외국어 학습 시 학습자의 외국어 대화 기록 기반 산출적 어휘 지식 확장을 위한 단어를 추출할 수 있는 방법 및 시스템이 제공된다. 본 발명의 실시예에 따른 단어 추출 방법은, 단어 추출 시스템이, 학습자의 과거 외국어 대화 기록에 대한 텍스트 데이터가 입력되도록 하는 단계; 및 단어 추출 시스템이, 입력된 텍스트 데이터를 기반으로 신규 추천 단어를 추출하는 단계;를 포함한다. 이에 의해, 학습자의 과거 외국어 대화 기록을 바탕으로 새로운 단어를 추천해 학습자의 문장에 자유롭게 활용할 수 있는 능력을 향상시킬 수 있다. A method and system for extracting words to expand productive vocabulary knowledge based on the learner's foreign language conversation records when learning a foreign language is provided. The word extraction method according to an embodiment of the present invention includes the steps of allowing the word extraction system to input text data about a learner's past foreign language conversation record; and a step of the word extraction system extracting new recommended words based on the input text data. By doing this, new words can be recommended based on the learner's past foreign language conversation records, improving the learner's ability to freely use them in sentences.

Description

학습자의 외국어 대화 기록 기반 산출적 어휘 지식 확장을 위한 단어 추출 장치 및 방법{Word extraction device and Method for productive vocabulary knowledge expansion based on foreign language dialogue record of learners}Word extraction device and Method for productive vocabulary knowledge expansion based on foreign language dialogue record of learners}

본 발명은 외국어 학습을 위한 단어 추출 방법 및 시스템에 관한 것으로, 더욱 상세하게는 외국어 학습 시 학습자의 외국어 대화 기록 기반 산출적 어휘 지식 확장을 위한 단어를 추출할 수 있는 방법 및 시스템에 관한 것이다.The present invention relates to a method and system for extracting words for learning a foreign language, and more specifically, to a method and system for extracting words for expanding the learner's productive vocabulary knowledge based on foreign language conversation records when learning a foreign language.

글로벌 시대에 맞추어 모국어 이외에 외국어를 학습하고자 하는 욕구가 계속 증가하고 있다. 이에 따라, 일반적인 어학원뿐만 아니라, 시간 및 장소적인 제약이 없는 전화를 통한 외국어 학습, 인터넷 강의, TV를 통한 강의 등 외국어 학습에 도움을 주기 위한 다양한 방안들이 성행하고 있다.In the global era, the desire to learn a foreign language other than one's native language continues to increase. Accordingly, in addition to general language schools, various methods to help learn foreign languages are becoming popular, such as learning foreign languages over the phone without time and location restrictions, online lectures, and lectures via TV.

한편, 외국어 학습의 경우, 학습자는 표현과 단어를 반복적으로 사용하는 습관을 보이기 때문에, 문장에 자유롭게 활용할 수 있는 수준으로 이해하고, 해당 의미를 다양하고 풍부하게 전달하기 위해서는 보다 효율적인 동의어 학습을 필요로 한다.Meanwhile, in the case of foreign language learning, learners have a habit of using expressions and words repeatedly, so more efficient synonym learning is needed to understand them to a level that can be freely used in sentences and to convey the corresponding meaning in a diverse and rich manner. do.

더불어, 외국어 학습의 경우, 학습자는, 산출적 어휘 지식이 제한적이기 때문에, 다양한 뜻을 표현하는 데 어려움을 겪을 수 있어, 다양한 의미를 표현할 수 있는 능력을 필요로 한다.In addition, in the case of foreign language learning, learners may have difficulty expressing various meanings because their productive vocabulary knowledge is limited, so they need the ability to express various meanings.

본 발명은 상기와 같은 문제점을 해결하기 위하여 안출된 것으로서, 본 발명의 목적은, 학습자의 과거 외국어 대화 기록을 바탕으로 새로운 단어를 추천해 학습자의 문장에 자유롭게 활용할 수 있는 능력을 향상시킬 수 있는 단어 추출 방법 및 시스템을 제공함에 있다.The present invention was created to solve the above problems, and the purpose of the present invention is to recommend new words based on the learner's past foreign language conversation records to improve the learner's ability to freely use them in sentences. To provide extraction methods and systems.

상기 목적을 달성하기 위한 본 발명의 일 실시예에 따른, 단어 추출 방법은, 단어 추출 시스템이, 학습자의 과거 외국어 대화 기록에 대한 텍스트 데이터가 입력되도록 하는 단계; 및 단어 추출 시스템이, 입력된 텍스트 데이터를 기반으로 신규 추천 단어를 추출하는 단계;를 포함한다. According to an embodiment of the present invention for achieving the above object, a word extraction method includes the steps of allowing a word extraction system to input text data about a learner's past foreign language conversation record; and a step of the word extraction system extracting new recommended words based on the input text data.

그리고 신규 추천 단어는, 추출되는 신규 추천 단어를 반복적 표현을 대체하는 제1 추천 단어 및 의미적 표현을 확장하는 제2 추천 단어 중 적어도 하나가 포함될 수 있다. Additionally, the new recommended word may include at least one of a first recommended word that replaces the repetitive expression of the extracted new recommended word and a second recommended word that expands the semantic expression.

또한, 추출하는 단계는, 제1 추천 단어 추출 시, 기설정된 횟수이상 반복 사용되는 단어를 추출하되, 추출되는 단어가 복수인 경우, 추출된 단어의 사용 빈도가 높은 순으로 추천순위를 결정할 수 있다. In addition, in the extraction step, when extracting the first recommended word, words that are used repeatedly more than a preset number of times are extracted, but if there are multiple words to be extracted, the recommendation ranking can be determined in order of frequency of use of the extracted words. .

그리고 추출하는 단계는, 제1 추천 단어 추출 시, 추출되는 단어의 품사가 동사, 형용사 및 명사로만 제한하여, 단어를 추출할 수 있다. And in the extraction step, when extracting the first recommended word, the words can be extracted by limiting the parts of speech of the extracted word to only verbs, adjectives, and nouns.

또한, 추출하는 단계는, 특정 세션(session)에서 기설정된 횟수이상 반복 사용되는 단어가 추출되면, 이전 세션에서 산출적 어휘 지식 범위에 따라 작성된 제1 추천 단어 목록을 불러와, 현재 세션에서 추출된 단어와 비교하여, 중복되는 단어를 제외한 이후, 중복되지 않는 신규 제1 추천 단어를 제1 추천 단어 목록에 추가하여 업데이트할 수 있다. In addition, in the extraction step, when words that are used repeatedly more than a preset number of times are extracted in a specific session, the first recommended word list created according to the range of calculated vocabulary knowledge in the previous session is retrieved, and the extracted words in the current session are retrieved. After comparing words and excluding overlapping words, new non-overlapping first recommended words can be added and updated to the first recommended word list.

그리고 추출하는 단계는, 신규 제1 추천 단어를 제1 추천 단어 목록에 추가하여 업데이트 하는 경우, 산출적 어휘 지식 범위 또는 제1 추천 단어 목록 내 추가되는 단어와 동의어 관계인 단어가 존재하면, 동의어 관계인 단어끼리 그룹을 구성하여 제1 추천 단어 목록에 기록하되, 동의어 관계인 단어들로 구성되는 그룹에는, 동의어 관계인 단어들 중 어느 하나가 사용된 문장 및 변용 가능한 예시 문장이 포함될 수 있다. In the extracting step, when updating a new first recommended word by adding it to the first recommended word list, if there is a word in a synonymous relationship with the word to be added in the calculated vocabulary knowledge range or the first recommended word list, the word in the synonymous relationship Groups are formed and recorded in the first recommended word list, but the group consisting of words in a synonymous relationship may include sentences in which one of the words in a synonymous relationship is used and example sentences that can be modified.

또한, 추출하는 단계는, 특정 세션(session)에서 기설정된 횟수이상 반복 사용되는 단어가 추출되면, 추출되는 단어와 동의어 관계인 다른 단어를 활용하면서 문장의 의미를 유지할 수 있는 복수의 예시 문장을 생성할 수 있다. In addition, the extraction step is to generate a plurality of example sentences that can maintain the meaning of the sentence while using other words that are synonymous with the extracted word when a word that is repeatedly used more than a preset number of times is extracted in a specific session. You can.

그리고 추출하는 단계는, 제2 추천 단어 추출 시, 입력된 텍스트 데이터를 기반으로 가장 최근 세션(session)에서 가장 높은 비중을 차지하는 대화 주제를 선정하고, 선정된 대화 주제를 대상으로 사용된 단어들을 사용 빈도순으로 정렬시킨 후, 정렬된 단어들을 이전 세션에서 선정된 대화 주제를 대상으로 사용된 단어들을 사용 빈도순으로 정렬시킨 단어들과 비교하여, 관련성 있는 단어들을 추출할 수 있다. And in the extraction step, when extracting the second recommended word, the conversation topic occupying the highest proportion in the most recent session is selected based on the input text data, and words used for the selected conversation topic are used. After sorting by frequency, related words can be extracted by comparing the sorted words with words sorted by frequency of use for the conversation topic selected in the previous session.

또한, 추출하는 단계는, 제2 추천 단어 추출 시, 각 단어를 벡터로 표현하는 대수적 모델인 백터 공간 모델을 이용하여, 현재 세션에서 사용된 단어와 이전 세션에서 사용된 단어 사이의 코사인 거리를 산출하고, 산출된 코사인 거리가 임계값 이하인 단어들을 관련성 있는 단어로 판별할 수 있다. In addition, in the extraction step, when extracting the second recommended word, the cosine distance between the word used in the current session and the word used in the previous session is calculated using a vector space model, which is an algebraic model that represents each word as a vector. And words whose calculated cosine distance is less than or equal to the threshold can be determined as relevant words.

그리고 추출하는 단계는, 제2 추천 단어 추출 시, 입력된 텍스트 데이터를 기반으로 학습자가 가장 최근 세션까지 사용한 단어들의 총 집합을 구성하고, 총 집합에 포함된 단어들을 대상으로 기저장된 단어별 난이도값을 고려하여, 난이도 평균값을 산출하고, 산출된 난이도 평균값에 따라 관련성 있는 단어들 중 제2 추천 단어를 추출하기 위한 의미적 표현 확장 범위를 결정할 수 있다. And in the extraction step, when extracting the second recommended word, a total set of words used by the learner up to the most recent session is formed based on the input text data, and the difficulty value for each word is pre-stored for the words included in the total set. Taking this into consideration, the average difficulty value can be calculated, and the semantic expression expansion range for extracting the second recommended word from among related words can be determined according to the calculated difficulty average value.

한편, 본 발명의 다른 실시예에 따른, 단어 추출 장치는, 학습자의 과거 외국어 대화 기록에 대한 텍스트 데이터가 입력되도록 하는 입력부; 및 입력된 텍스트 데이터를 기반으로 신규 추천 단어를 추출하는 프로세서;를 포함한다. Meanwhile, according to another embodiment of the present invention, a word extraction device includes: an input unit for inputting text data about a learner's past foreign language conversation record; and a processor that extracts new recommended words based on the input text data.

이상 설명한 바와 같이, 본 발명의 실시예들에 따르면, 학습자의 과거 외국어 대화 기록을 바탕으로 새로운 단어를 추천해 학습자의 문장에 자유롭게 활용할 수 있는 능력을 향상시킬 수 있다. As described above, according to embodiments of the present invention, new words can be recommended based on the learner's past foreign language conversation records, thereby improving the learner's ability to freely use them in sentences.

도 1은 본 발명의 일 실시예에 따른 학습자의 외국어 대화 기록 기반 산출적 어휘 지식 확장을 위한 단어 추출 장치의 설명에 제공된 도면,
도 2는, 본 발명의 일 실시예에 따른 학습자의 외국어 대화 기록 기반 산출적 어휘 지식 확장을 위한 단어 추출 방법의 설명에 제공된 도면,
도 3은, 상기 도 2에 도시된 학습자의 외국어 대화 기록 기반 산출적 어휘 지식 확장을 위한 단어 추출 방법 중 제1 추천 단어 추출 과정의 설명에 제공된 도면, 그리고
도 4는, 상기 도 2에 도시된 학습자의 외국어 대화 기록 기반 산출적 어휘 지식 확장을 위한 단어 추출 방법 중 제2 추천 단어 추출 과정의 설명에 제공된 도면이다.
1 is a diagram provided to explain a word extraction device for expanding productive vocabulary knowledge based on a learner's foreign language conversation record according to an embodiment of the present invention;
Figure 2 is a diagram provided to explain a word extraction method for expanding productive vocabulary knowledge based on a learner's foreign language conversation record according to an embodiment of the present invention;
Figure 3 is a diagram provided to explain the first recommended word extraction process among the word extraction methods for expanding productive vocabulary knowledge based on the learner's foreign language conversation record shown in Figure 2, and
FIG. 4 is a diagram provided to explain the second recommended word extraction process among the word extraction methods for expanding productive vocabulary knowledge based on the learner's foreign language conversation record shown in FIG. 2.

이하에서는 도면을 참조하여 본 발명을 보다 상세하게 설명한다.Hereinafter, the present invention will be described in more detail with reference to the drawings.

도 1은 본 발명의 일 실시예에 따른 학습자의 외국어 대화 기록 기반 산출적 어휘 지식 확장을 위한 단어 추출 장치(이하에서는 '단어 추출 장치'로 총칭하기로 함)의 설명에 제공된 도면이다. Figure 1 is a diagram provided to explain a word extraction device (hereinafter collectively referred to as 'word extraction device') for expanding the learner's productive vocabulary knowledge based on foreign language conversation records according to an embodiment of the present invention.

본 실시예에 따른 단어 추출 장치는, 학습자의 과거 외국어 대화 기록을 바탕으로 새로운 단어를 추천해 학습자의 문장에 자유롭게 활용할 수 있는 능력을 향상시키기 위해 마련된다. The word extraction device according to this embodiment is designed to recommend new words based on the learner's past foreign language conversation records and improve the learner's ability to freely use them in sentences.

이를 위해 본 단어 추출 장치는, 입력부(110), 프로세서(120), 출력부(130) 및 저장부(140)를 포함할 수 있다. To this end, the word extraction device may include an input unit 110, a processor 120, an output unit 130, and a storage unit 140.

입력부(110)는, 외부 장치와 통신 연결 가능한 통신 모듈이 구비될 수 있으며, 프로세서(120)가 동작함에 있어 필요한 데이터가 입력되도록 할 수 있다. The input unit 110 may be equipped with a communication module capable of communicating with an external device, and may allow data necessary for the processor 120 to operate.

예를 들면, 입력부(110)는, 학습자의 과거 외국어 대화 기록에 대한 텍스트 데이터가 입력되도록 할 수 있다. 여기서, 과거 외국어 대화 기록에 대한 텍스트 데이터는, 외국어 회화 수업 내용을 텍스트 데이터로 변환한 데이터를 의미한다. For example, the input unit 110 may allow text data about the learner's past foreign language conversation records to be input. Here, text data about past foreign language conversation records refers to data converted from foreign language conversation class content into text data.

그리고 출력부(130)는, 프로세서(120)가 처리한 데이터를 화면에 출력할 수 있는 디스플레이 장치이며, 저장부(140)는, 프로세서(120)가 동작함에 있어 필요한 프로그램 및 데이터를 저장하는 저장매체이다. The output unit 130 is a display device capable of outputting data processed by the processor 120 on the screen, and the storage unit 140 is a storage unit that stores programs and data necessary for the operation of the processor 120. It is a medium.

프로세서(120)는, 단어 추출 장치의 제반사항을 처리하기 위해 마련된다.The processor 120 is provided to process all matters of the word extraction device.

구체적으로, 프로세서(120)는, 입력된 텍스트 데이터에 자연어 처리 과정을 거쳐 신규 추천 단어를 추출할 수 있다. Specifically, the processor 120 may extract new recommended words from input text data through a natural language processing process.

이때, 신규 추천 단어는, 추출되는 신규 추천 단어를 반복적 표현을 대체하는 제1 추천 단어 및 의미적 표현을 확장하는 제2 추천 단어 중 적어도 하나가 포함될 수 있다. At this time, the new recommended word may include at least one of a first recommended word that replaces the repetitive expression of the extracted new recommended word and a second recommended word that expands the semantic expression.

여기서, 의미적 표현을 확장할 수 있는 단어란, 더 다양한 의미를 표현할 수 있도록 하는 단어를 의미한다. Here, words that can expand semantic expressions mean words that can express more diverse meanings.

예를 들면, 프로세서(120)는, 제1 추천 단어 추출 시, 기설정된 횟수이상 반복 사용되는 단어를 추출하되, 추출되는 단어가 복수인 경우, 추출된 단어의 사용 빈도가 높은 순으로 추천순위를 결정할 수 있다. For example, when extracting the first recommended word, the processor 120 extracts words that are used repeatedly more than a preset number of times. However, if there are multiple words to be extracted, the processor 120 ranks the recommendations in order of frequency of use of the extracted words. You can decide.

이때, 프로세서(120)는, 추출되는 단어의 품사가 동사, 형용사 및 명사로만 제한할 수 있다. At this time, the processor 120 may limit the parts of speech of the extracted word to only verbs, adjectives, and nouns.

그리고 프로세서(120)는 특정 세션(session)에서 기설정된 횟수이상 반복 사용되는 단어가 추출되면, 이전 세션에서 산출적 어휘 지식 범위에 따라 작성된 제1 추천 단어 목록을 불러와, 현재 세션에서 추출된 단어와 비교하여, 중복되는 단어를 제외한 이후, 중복되지 않는 신규 제1 추천 단어를 제1 추천 단어 목록에 추가하여 업데이트할 수 있다. And when a word that is repeatedly used more than a preset number of times is extracted in a specific session, the processor 120 retrieves the first recommended word list created according to the range of calculated vocabulary knowledge in the previous session, and retrieves the words extracted in the current session. Compared to , after excluding overlapping words, new non-overlapping first recommended words can be added and updated to the first recommended word list.

또한, 프로세서(120)는, 신규 제1 추천 단어를 제1 추천 단어 목록에 추가하여 업데이트 하는 경우, 산출적 어휘 지식 범위 또는 제1 추천 단어 목록 내 추가되는 단어와 동의어 관계인 단어가 존재하면, 동의어 관계인 단어끼리 그룹을 구성하여 제1 추천 단어 목록에 기록할 수 있다. In addition, when the processor 120 updates a new first recommended word by adding it to the first recommended word list, if there is a word that is synonymous with the added word in the calculated vocabulary knowledge range or the first recommended word list, the synonym Related words can be formed into groups and recorded in the first recommended word list.

이때, 동의어 관계인 단어들로 구성되는 그룹에는, 동의어 관계인 단어들 중 어느 하나가 사용된 문장 및 변용 가능한 예시 문장이 포함될 수 있다. At this time, the group consisting of words in a synonymous relationship may include sentences in which any one of the words in a synonymous relationship is used and example sentences that can be modified.

더불어, 프로세서(120)는, 특정 세션(session)에서 기설정된 횟수이상 반복 사용되는 단어가 추출되면, 자연어 처리 기계 학습 모델을 이용하여, 추출되는 단어와 동의어 관계인 다른 단어를 활용하면서 문장의 의미를 유지할 수 있는 복수의 예시 문장을 생성할 수 있다. In addition, when a word that is repeatedly used more than a preset number of times is extracted in a specific session, the processor 120 uses a natural language processing machine learning model to determine the meaning of the sentence by using other words that are synonymous with the extracted word. You can create multiple example sentences that you can maintain.

즉, 프로세서(120)는, 자주 반복되는 단어를 추출하고 그에 해당하는 동의어를 찾은 후, 학습자가 실제 교수자와의 대화에서 그 단어를 사용했던 문장을 생성하고, 동의어와 해당 문장을 입력값으로 하여 나온 자연어 처리 결과를 학습자에게 제시하여, 학습자의 문장에 자유롭게 활용할 수 있는 능력 향상에 기여할 수 있다. That is, the processor 120 extracts a frequently repeated word, finds a corresponding synonym, generates a sentence in which the learner actually used the word in a conversation with the instructor, and uses the synonym and the corresponding sentence as input values. By presenting the results of natural language processing to learners, it can contribute to improving the learner's ability to freely use them in their sentences.

한편, 프로세서(120)는, 학습자가 의미적 표현의 확장을 통한 다양한 의미를 표현할 수 있도록, 입력된 텍스트 데이터를 기반으로 가장 최근 세션(session)에서 가장 높은 비중을 차지하는 대화 주제를 선정하고, 선정된 대화 주제를 기반으로 제2 추천 단어를 추출할 수 있다. Meanwhile, the processor 120 selects and selects the conversation topic that accounts for the highest proportion in the most recent session based on the input text data so that the learner can express various meanings through expansion of semantic expressions. A second recommended word can be extracted based on the conversation topic.

예를 들면, 프로세서(120)는, 제2 추천 단어 추출 시, 입력된 텍스트 데이터를 기반으로 가장 최근 세션(session)에서 가장 높은 비중을 차지하는 대화 주제를 선정하고, 선정된 대화 주제를 대상으로 사용된 단어들을 사용 빈도순으로 정렬시킨 후, 정렬된 단어들을 이전 세션에서 선정된 대화 주제를 대상으로 사용된 단어들을 사용 빈도순으로 정렬시킨 단어들과 비교하여, 관련성 있는 단어들을 추출할 수 있다. For example, when extracting the second recommended word, the processor 120 selects the conversation topic occupying the highest proportion in the most recent session based on the input text data and uses the selected conversation topic as the target. After sorting the words in order of frequency of use, related words can be extracted by comparing the sorted words with words sorted by frequency of use for the conversation topic selected in the previous session.

구체적으로, 프로세서(120)는, 각 단어를 벡터로 표현하는 대수적 모델인 백터 공간 모델을 이용하여, 현재 세션에서 사용된 단어와 이전 세션에서 사용된 단어 사이의 코사인 거리를 산출하고, 산출된 코사인 거리가 임계값 이하인 단어들을 유사성 높은 단어 또는 관련성 있는 단어로 판별할 수 있다. Specifically, the processor 120 calculates the cosine distance between the word used in the current session and the word used in the previous session using a vector space model, which is an algebraic model that represents each word as a vector, and calculates the cosine of the calculated cosine. Words whose distance is less than the threshold can be determined as words with high similarity or as related words.

예를 들면, 프로세서(120)는, 각 단어들 중 학습자의 어휘 수준과 차이가 적은 것들을 걸러낸 후, 거리순으로 상위 n 개를 뽑으면 각 키워드별로 추천 단어를 n개씩 만들어 낼 수 있다. For example, the processor 120 can generate n recommended words for each keyword by filtering out words that have a small difference from the learner's vocabulary level and then selecting the top n words in order of distance.

여기서, 세션(session)에서 가장 높은 비중을 차지하는 대화 주제는, 식재료나 요리하는 방법과 관련 있는 단어들이 많이 사용되는 경우, 가장 높은 비중을 차지하는 대화 주제로 '음식' 또는 '요리'가 선정될 수 있으며, 이 과정은 자연어 처리 기계 학습 모델을 통해 수행될 수 있다. Here, the conversation topic that occupies the highest proportion in the session is 'food' or 'cooking'. If words related to ingredients or cooking methods are frequently used, 'food' or 'cooking' may be selected as the conversation topic that occupies the highest proportion. And this process can be performed through a natural language processing machine learning model.

또한, 단어별 난이도값은, 공인 영어시험 등에서 난이도별로 단어를 분류해놓은 목록과 단어의 일반적인 사용빈도를 이용해 사전에 설정될 수 있다. Additionally, the difficulty value for each word can be set in advance using a list of words classified by difficulty level in official English tests, etc. and the general frequency of use of the word.

그리고 프로세서(120)는, 제2 추천 단어 추출 시, 입력된 텍스트 데이터를 기반으로 학습자가 가장 최근 세션까지 사용한 단어들의 총 집합을 구성하고, 총 집합에 포함된 단어들을 대상으로 기저장된 단어별 난이도값을 고려하여, 난이도 평균값을 산출하고, 산출된 난이도 평균값에 따라 관련성 있는 단어들 중 제2 추천 단어를 추출하기 위한 의미적 표현 확장 범위를 결정할 수 있다. And when extracting the second recommended word, the processor 120 configures a total set of words used by the learner up to the most recent session based on the input text data, and pre-stores word-specific difficulty levels for the words included in the total set. Considering the value, the average difficulty value is calculated, and the semantic expression expansion range for extracting the second recommended word from among related words can be determined according to the calculated difficulty average value.

도 2는, 본 발명의 일 실시예에 따른 학습자의 외국어 대화 기록 기반 산출적 어휘 지식 확장을 위한 단어 추출 방법(이하에서는 '단어 추출 방법'으로 총칭하기로 함)의 설명에 제공된 도면이다. Figure 2 is a diagram provided to explain a word extraction method for expanding productive vocabulary knowledge based on a learner's foreign language conversation record (hereinafter collectively referred to as 'word extraction method') according to an embodiment of the present invention.

본 실시예에 따른 단어 추출 방법은, 도 1을 참조하여 전술한 단어 추출 장치를 통해 실행될 수 있다. The word extraction method according to this embodiment can be executed through the word extraction device described above with reference to FIG. 1.

본 단어 추출 방법은, 단어 추출 시스템을 통해, 학습자의 과거 외국어 대화 기록에 대한 텍스트 데이터가 입력되도록 하고(S210), 입력된 텍스트 데이터를 기반으로 신규 추천 단어를 추출함으로써(S220), 학습자의 과거 외국어 대화 기록을 바탕으로 새로운 단어를 추천해 학습자의 문장에 자유롭게 활용할 수 있는 능력을 향상시킬 수 있다. This word extraction method allows text data about the learner's past foreign language conversation records to be input through a word extraction system (S210), and extracts new recommended words based on the input text data (S220), thereby By recommending new words based on foreign language conversation records, you can improve the learner's ability to freely use them in sentences.

도 3은, 상기 도 2에 도시된 단어 추출 방법 중 제1 추천 단어 추출 과정의 설명에 제공된 도면이다. FIG. 3 is a diagram provided to explain the first recommended word extraction process among the word extraction methods shown in FIG. 2.

도 3을 참조하면, 단어 추출 방법은, 단어 추출 시스템을 통해, 입력된 텍스트 데이터를 분석하여, 기설정된 횟수이상 반복 사용되는 단어를 추출할 수 있다(S310). Referring to FIG. 3, the word extraction method can extract words that are used repeatedly a preset number of times or more by analyzing input text data through a word extraction system (S310).

그리고 단어 추출 방법은, 추출된 단어의 품사가 동사, 형용사 및 명사인 단어만 선별하고(S320), 선별된 단어가 복수인 경우(S330-Y), 단어의 사용 빈도가 높은 순으로 추천순위를 결정할 수 있다(S340). In addition, the word extraction method selects only words whose parts of speech are verb, adjective, and noun (S320), and when the selected words are plural (S330-Y), the recommendations are ranked in order of frequency of use. You can decide (S340).

또한, 단어 추출 방법은, 특정 세션(session)에서 기설정된 횟수이상 반복 사용되는 단어가 추출되면, 이전 세션에서 산출적 어휘 지식 범위에 따라 작성된 제1 추천 단어 목록을 불러와, 현재 세션에서 추출된 단어와 비교하여(S350), 중복되는 단어를 제외한 이후(S360), 중복되지 않는 신규 제1 추천 단어를 제1 추천 단어 목록에 추가하여 업데이트할 수 있다(S370). In addition, the word extraction method, when a word that is repeatedly used more than a preset number of times in a specific session is extracted, retrieves the first recommended word list created according to the range of calculated vocabulary knowledge in the previous session, and extracts the words extracted from the current session. After comparing the words (S350), overlapping words are excluded (S360), new non-overlapping first recommended words can be added and updated to the first recommended word list (S370).

도 4는, 상기 도 2에 도시된 단어 추출 방법 중 제2 추천 단어 추출 과정의 설명에 제공된 도면이다. FIG. 4 is a diagram provided to explain the second recommended word extraction process among the word extraction methods shown in FIG. 2.

도 4를 참조하면, 본 단어 추출 방법은, 단어 추출 장치를 통해, 입력된 텍스트 데이터를 기반으로 가장 최근 세션에서 가장 높은 비중을 차지하는 대화 주제를 선정하고(S410), 선정된 대화 주제를 대상으로 사용된 단어들을 사용 빈도순으로 정렬시킨 후(S420), 정렬된 단어들을 이전 세션에서 선정된 대화 주제를 대상으로 사용된 단어들을 사용 빈도순으로 정렬시킨 단어들과 비교할 수 있다(S430). Referring to FIG. 4, this word extraction method selects the conversation topic occupying the highest proportion in the most recent session based on the input text data through a word extraction device (S410), and targets the selected conversation topic. After sorting the words used in order of frequency of use (S420), the sorted words can be compared with words sorted by frequency of use for the conversation topic selected in the previous session (S430).

그리고 단어 추출 방법은, 각 단어를 벡터로 표현하는 대수적 모델인 백터 공간 모델을 이용하여, 현재 세션에서 사용된 단어와 이전 세션에서 사용된 단어 사이의 코사인 거리를 산출하고(S440), 산출된 코사인 거리가 임계값 이하인 단어들을 유사성 높은 단어 또는 관련성 있는 단어로 판별할 수 있다(S450). And the word extraction method uses a vector space model, an algebraic model that represents each word as a vector, to calculate the cosine distance between the word used in the current session and the word used in the previous session (S440), and the calculated cosine Words whose distance is less than the threshold can be determined as words with high similarity or as related words (S450).

이때, 단어 추출 방법은, 단어 추출 장치를 통해, 입력된 텍스트 데이터를 기반으로 학습자가 가장 최근 세션까지 사용한 단어들의 총 집합을 구성하고, 총 집합에 포함된 단어들을 대상으로 기저장된 단어별 난이도값을 고려하여, 난이도 평균값을 산출하고, 산출된 난이도 평균값에 따라 관련성 있는 단어들 중 제2 추천 단어를 추출하기 위한 의미적 표현 확장 범위를 결정함으로써, 의미적 표현 확장 범위를 기준으로 산출된 난이도 평균값에 따라 관련성 있는 단어들 중 일부 또는 전부를 제2 추천 단어로 결정할 수 있다(S460). At this time, the word extraction method is to construct a total set of words used by the learner up to the most recent session based on the input text data through a word extraction device, and pre-store difficulty values for each word for the words included in the total set. Taking this into consideration, the average difficulty value is calculated, and the semantic expression expansion range for extracting the second recommended word from the related words is determined according to the calculated difficulty average value, so that the difficulty average value is calculated based on the semantic expression expansion range. Accordingly, some or all of the related words may be determined as the second recommended word (S460).

한편, 본 실시예에 따른 장치와 방법의 기능을 수행하게 하는 컴퓨터 프로그램을 수록한 컴퓨터로 읽을 수 있는 기록매체에도 본 발명의 기술적 사상이 적용될 수 있음은 물론이다. 또한, 본 발명의 다양한 실시예에 따른 기술적 사상은 컴퓨터로 읽을 수 있는 기록매체에 기록된 컴퓨터로 읽을 수 있는 코드 형태로 구현될 수도 있다. 컴퓨터로 읽을 수 있는 기록매체는 컴퓨터에 의해 읽을 수 있고 데이터를 저장할 수 있는 어떤 데이터 저장 장치이더라도 가능하다. 예를 들어, 컴퓨터로 읽을 수 있는 기록매체는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광디스크, 하드 디스크 드라이브, 등이 될 수 있음은 물론이다. 또한, 컴퓨터로 읽을 수 있는 기록매체에 저장된 컴퓨터로 읽을 수 있는 코드 또는 프로그램은 컴퓨터간에 연결된 네트워크를 통해 전송될 수도 있다.Meanwhile, of course, the technical idea of the present invention can be applied to a computer-readable recording medium containing a computer program that performs the functions of the device and method according to this embodiment. Additionally, the technical ideas according to various embodiments of the present invention may be implemented in the form of computer-readable code recorded on a computer-readable recording medium. A computer-readable recording medium can be any data storage device that can be read by a computer and store data. For example, of course, computer-readable recording media can be ROM, RAM, CD-ROM, magnetic tape, floppy disk, optical disk, hard disk drive, etc. Additionally, computer-readable codes or programs stored on a computer-readable recording medium may be transmitted through a network connected between computers.

또한, 이상에서는 본 발명의 바람직한 실시예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어져서는 안될 것이다.In addition, although preferred embodiments of the present invention have been shown and described above, the present invention is not limited to the specific embodiments described above, and the technical field to which the invention pertains without departing from the gist of the present invention as claimed in the claims. Of course, various modifications can be made by those of ordinary skill in the art, and these modifications should not be understood individually from the technical idea or perspective of the present invention.

110 : 입력부
120 : 프로세서
130 : 출력부
140 : 저장부
110: input unit
120: processor
130: output unit
140: storage unit

Claims (11)

단어 추출 시스템이, 학습자의 과거 외국어 대화 기록에 대한 텍스트 데이터가 입력되도록 하는 단계; 및
단어 추출 시스템이, 입력된 텍스트 데이터를 기반으로 신규 추천 단어를 추출하는 단계;를 포함하고,
신규 추천 단어는,
추출되는 신규 추천 단어를 반복적 표현을 대체하는 제1 추천 단어 및 의미적 표현을 확장하는 제2 추천 단어 중 적어도 하나가 포함되며,
추출하는 단계는,
제1 추천 단어 추출 시, 기설정된 횟수이상 반복 사용되는 단어를 추출하되, 추출되는 단어가 복수인 경우, 추출된 단어의 사용 빈도가 높은 순으로 추천순위를 결정하고,
추출하는 단계는,
제1 추천 단어 추출 시, 추출되는 단어의 품사가 동사, 형용사 및 명사로만 제한하여, 단어를 추출하며,
추출하는 단계는,
특정 세션(session)에서 기설정된 횟수이상 반복 사용되는 단어가 추출되면, 이전 세션에서 산출적 어휘 지식 범위에 따라 작성된 제1 추천 단어 목록을 불러와, 현재 세션에서 추출된 단어와 비교하여, 중복되는 단어를 제외한 이후, 중복되지 않는 신규 제1 추천 단어를 제1 추천 단어 목록에 추가하여 업데이트하고,
추출하는 단계는,
신규 제1 추천 단어를 제1 추천 단어 목록에 추가하여 업데이트 하는 경우, 산출적 어휘 지식 범위 또는 제1 추천 단어 목록 내 추가되는 단어와 동의어 관계인 단어가 존재하면, 동의어 관계인 단어끼리 그룹을 구성하여 제1 추천 단어 목록에 기록하되,
동의어 관계인 단어들로 구성되는 그룹에는,
동의어 관계인 단어들 중 어느 하나가 사용된 문장 및 변용 가능한 예시 문장이 포함되며,
추출하는 단계는,
특정 세션(session)에서 기설정된 횟수이상 반복 사용되는 단어가 추출되면, 추출되는 단어와 동의어 관계인 다른 단어를 활용하면서 문장의 의미를 유지할 수 있는 복수의 예시 문장을 생성하고,
추출하는 단계는,
제2 추천 단어 추출 시, 입력된 텍스트 데이터를 기반으로 가장 최근 세션(session)에서 가장 높은 비중을 차지하는 대화 주제를 선정하고, 선정된 대화 주제를 대상으로 사용된 단어들을 사용 빈도순으로 정렬시킨 후, 정렬된 단어들을 이전 세션에서 선정된 대화 주제를 대상으로 사용된 단어들을 사용 빈도순으로 정렬시킨 단어들과 비교하여, 관련성 있는 단어들을 추출하며,
추출하는 단계는,
제2 추천 단어 추출 시, 각 단어를 벡터로 표현하는 대수적 모델인 백터 공간 모델을 이용하여, 현재 세션에서 사용된 단어와 이전 세션에서 사용된 단어 사이의 코사인 거리를 산출하고, 산출된 코사인 거리가 임계값 이하인 단어들을 관련성 있는 단어로 판별하고,
추출하는 단계는,
제2 추천 단어 추출 시, 입력된 텍스트 데이터를 기반으로 학습자가 가장 최근 세션까지 사용한 단어들의 총 집합을 구성하고, 총 집합에 포함된 단어들을 대상으로 기저장된 단어별 난이도값을 고려하여, 난이도 평균값을 산출하고,
산출된 난이도 평균값에 따라 관련성 있는 단어들 중 제2 추천 단어를 추출하기 위한 의미적 표현 확장 범위를 결정하는 것을 특징으로 하는 산출적 어휘 지식 확장을 위한 단어 추출 방법.
allowing the word extraction system to input text data about the learner's past foreign language conversation records; and
A word extraction system includes extracting new recommended words based on input text data,
New recommended words are:
The extracted new recommended word includes at least one of a first recommended word that replaces the repetitive expression and a second recommended word that expands the semantic expression,
The extraction step is,
When extracting the first recommended word, words that are used repeatedly more than a preset number of times are extracted, but if there are multiple words to be extracted, the recommendation ranking is determined in order of frequency of use of the extracted words,
The extraction step is,
When extracting the first recommended word, the parts of speech of the extracted word are limited to verbs, adjectives, and nouns, and words are extracted.
The extraction step is,
When words that are used repeatedly more than a preset number of times are extracted in a specific session, the first recommended word list created according to the range of calculated vocabulary knowledge in the previous session is retrieved, compared with the words extracted in the current session, and redundant words are retrieved. After excluding the words, add new non-redundant first recommended words to the first recommended word list and update it,
The extraction step is,
When updating a new first recommended word by adding it to the first recommended word list, if there is a word that is synonymous with the word to be added within the calculated vocabulary knowledge range or the first recommended word list, a group of words with a synonymous relationship is formed to form a group. 1 Record in the list of recommended words,
In a group consisting of words that are synonymous,
Includes sentences in which one of the synonymous words is used and example sentences that can be modified,
The extraction step is,
When a word that is used repeatedly more than a preset number of times is extracted in a specific session, a plurality of example sentences are generated that can maintain the meaning of the sentence while using other words that are synonymous with the extracted word,
The extraction step is,
When extracting the second recommended word, the conversation topic occupying the highest proportion in the most recent session is selected based on the input text data, and the words used for the selected conversation topic are sorted in order of frequency of use. , extracts related words by comparing the sorted words with words sorted by frequency of use for conversation topics selected in the previous session,
The extraction step is,
When extracting the second recommended word, the vector space model, which is an algebraic model that represents each word as a vector, is used to calculate the cosine distance between the word used in the current session and the word used in the previous session, and the calculated cosine distance is Determine words that are below the threshold as relevant words,
The extraction step is,
When extracting the second recommended word, a total set of words used by the learner up to the most recent session is formed based on the input text data, and the difficulty value for each word previously stored for the words included in the total set is taken into consideration to obtain an average difficulty value. Calculate
A word extraction method for expanding productive vocabulary knowledge, characterized by determining the semantic expression expansion range for extracting a second recommended word from among related words according to the calculated difficulty average value.
삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 학습자의 과거 외국어 대화 기록에 대한 텍스트 데이터가 입력되도록 하는 입력부; 및
입력된 텍스트 데이터를 기반으로 신규 추천 단어를 추출하는 프로세서;를 포함하고,
신규 추천 단어는,
추출되는 신규 추천 단어를 반복적 표현을 대체하는 제1 추천 단어 및 의미적 표현을 확장하는 제2 추천 단어 중 적어도 하나가 포함되며,
프로세서는,
제1 추천 단어 추출 시, 기설정된 횟수이상 반복 사용되는 단어를 추출하되, 추출되는 단어가 복수인 경우, 추출된 단어의 사용 빈도가 높은 순으로 추천순위를 결정하고,
프로세서는,
제1 추천 단어 추출 시, 추출되는 단어의 품사가 동사, 형용사 및 명사로만 제한하여, 단어를 추출하며,
프로세서는,
특정 세션(session)에서 기설정된 횟수이상 반복 사용되는 단어가 추출되면, 이전 세션에서 산출적 어휘 지식 범위에 따라 작성된 제1 추천 단어 목록을 불러와, 현재 세션에서 추출된 단어와 비교하여, 중복되는 단어를 제외한 이후, 중복되지 않는 신규 제1 추천 단어를 제1 추천 단어 목록에 추가하여 업데이트하고,
프로세서는,
신규 제1 추천 단어를 제1 추천 단어 목록에 추가하여 업데이트 하는 경우, 산출적 어휘 지식 범위 또는 제1 추천 단어 목록 내 추가되는 단어와 동의어 관계인 단어가 존재하면, 동의어 관계인 단어끼리 그룹을 구성하여 제1 추천 단어 목록에 기록하되,
동의어 관계인 단어들로 구성되는 그룹에는,
동의어 관계인 단어들 중 어느 하나가 사용된 문장 및 변용 가능한 예시 문장이 포함되며,
프로세서는,
특정 세션(session)에서 기설정된 횟수이상 반복 사용되는 단어가 추출되면, 추출되는 단어와 동의어 관계인 다른 단어를 활용하면서 문장의 의미를 유지할 수 있는 복수의 예시 문장을 생성하고,
프로세서는,
제2 추천 단어 추출 시, 입력된 텍스트 데이터를 기반으로 가장 최근 세션(session)에서 가장 높은 비중을 차지하는 대화 주제를 선정하고, 선정된 대화 주제를 대상으로 사용된 단어들을 사용 빈도순으로 정렬시킨 후, 정렬된 단어들을 이전 세션에서 선정된 대화 주제를 대상으로 사용된 단어들을 사용 빈도순으로 정렬시킨 단어들과 비교하여, 관련성 있는 단어들을 추출하며,
프로세서는,
제2 추천 단어 추출 시, 각 단어를 벡터로 표현하는 대수적 모델인 백터 공간 모델을 이용하여, 현재 세션에서 사용된 단어와 이전 세션에서 사용된 단어 사이의 코사인 거리를 산출하고, 산출된 코사인 거리가 임계값 이하인 단어들을 관련성 있는 단어로 판별하고,
프로세서는,
제2 추천 단어 추출 시, 입력된 텍스트 데이터를 기반으로 학습자가 가장 최근 세션까지 사용한 단어들의 총 집합을 구성하고, 총 집합에 포함된 단어들을 대상으로 기저장된 단어별 난이도값을 고려하여, 난이도 평균값을 산출하고,
산출된 난이도 평균값에 따라 관련성 있는 단어들 중 제2 추천 단어를 추출하기 위한 의미적 표현 확장 범위를 결정하는 것을 특징으로 하는 산출적 어휘 지식 확장을 위한 단어 추출 장치.
An input unit that allows text data about the learner's past foreign language conversation records to be input; and
A processor that extracts new recommended words based on input text data;
New recommended words are:
The extracted new recommended word includes at least one of a first recommended word that replaces the repetitive expression and a second recommended word that expands the semantic expression,
The processor is
When extracting the first recommended word, words that are used repeatedly more than a preset number of times are extracted, but if there are multiple words to be extracted, the recommendation ranking is determined in order of frequency of use of the extracted words,
The processor is
When extracting the first recommended word, the parts of speech of the extracted word are limited to verbs, adjectives, and nouns, and words are extracted.
The processor is
When words that are used repeatedly more than a preset number of times are extracted in a specific session, the first recommended word list created according to the range of calculated vocabulary knowledge in the previous session is retrieved, compared with the words extracted in the current session, and redundant words are retrieved. After excluding the words, add new non-redundant first recommended words to the first recommended word list and update it,
The processor is
When updating a new first recommended word by adding it to the first recommended word list, if there is a word that is synonymous with the word to be added within the calculated vocabulary knowledge range or the first recommended word list, a group of words with a synonymous relationship is formed to form a group. 1 Record in the list of recommended words,
In a group consisting of words that are synonymous,
Includes sentences in which one of the synonymous words is used and example sentences that can be modified,
The processor is
When a word that is used repeatedly more than a preset number of times is extracted in a specific session, a plurality of example sentences are generated that can maintain the meaning of the sentence while using other words that are synonymous with the extracted word,
The processor is
When extracting the second recommended word, the conversation topic occupying the highest proportion in the most recent session is selected based on the input text data, and the words used for the selected conversation topic are sorted in order of frequency of use. , extracts related words by comparing the sorted words with words sorted by frequency of use for conversation topics selected in the previous session,
The processor is
When extracting the second recommended word, the vector space model, which is an algebraic model that represents each word as a vector, is used to calculate the cosine distance between the word used in the current session and the word used in the previous session, and the calculated cosine distance is Determine words that are below the threshold as relevant words,
The processor is
When extracting the second recommended word, a total set of words used by the learner up to the most recent session is formed based on the input text data, and the difficulty value for each word previously stored for the words included in the total set is taken into consideration to obtain an average difficulty value. Calculate
A word extraction device for expanding productive vocabulary knowledge, characterized in that it determines the semantic expression expansion range for extracting a second recommended word from among related words according to the calculated difficulty average value.
KR1020210106226A 2021-08-11 2021-08-11 Word extraction device and Method for productive vocabulary knowledge expansion based on foreign language dialogue record of learners KR102582013B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210106226A KR102582013B1 (en) 2021-08-11 2021-08-11 Word extraction device and Method for productive vocabulary knowledge expansion based on foreign language dialogue record of learners

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210106226A KR102582013B1 (en) 2021-08-11 2021-08-11 Word extraction device and Method for productive vocabulary knowledge expansion based on foreign language dialogue record of learners

Publications (2)

Publication Number Publication Date
KR20230024103A KR20230024103A (en) 2023-02-20
KR102582013B1 true KR102582013B1 (en) 2023-09-22

Family

ID=85329034

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210106226A KR102582013B1 (en) 2021-08-11 2021-08-11 Word extraction device and Method for productive vocabulary knowledge expansion based on foreign language dialogue record of learners

Country Status (1)

Country Link
KR (1) KR102582013B1 (en)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140079551A (en) * 2012-12-14 2014-06-27 한국전자통신연구원 Apparatus of recommending word, phrase and sentence for learning foreign language
KR20170029248A (en) * 2015-09-07 2017-03-15 최상덕 Method, system and non-transitory computer-readable recording medium for assisting language study
JP2019049873A (en) * 2017-09-11 2019-03-28 株式会社Screenホールディングス Synonym dictionary creation apparatus, synonym dictionary creation program, and synonym dictionary creation method
KR102170206B1 (en) * 2018-12-27 2020-10-26 에스케이 주식회사 Information Search System and Method using keyword and relation information

Also Published As

Publication number Publication date
KR20230024103A (en) 2023-02-20

Similar Documents

Publication Publication Date Title
US10311146B2 (en) Machine translation method for performing translation between languages
US10325517B2 (en) Systems and methods for extracting keywords in language learning
CN106663125B (en) Question generation device and recording medium
JP2005157524A (en) Question response system, and method for processing question response
US11934781B2 (en) Systems and methods for controllable text summarization
CN115380260A (en) Language detection of user input text for network games
Shah et al. Simple App Review Classification with Only Lexical Features.
KR102146433B1 (en) Method for providing context based language learning service using associative memory
CN109063182B (en) Content recommendation method based on voice search questions and electronic equipment
US20230359816A1 (en) Related expression extraction device and related expression extraction method
KR102582013B1 (en) Word extraction device and Method for productive vocabulary knowledge expansion based on foreign language dialogue record of learners
Malhar et al. Deep learning based Answering Questions using T5 and Structured Question Generation System’
KR102345815B1 (en) Method and system for generating sentences containing target words
CN116685966A (en) Adjusting query generation patterns
Shi et al. Socio-situational setting classification based on language use
CN111401057B (en) Semantic analysis method, storage medium and terminal equipment
Hilding Making Chatbots More Conversational: Using Follow-Up Questions for Maximizing the Informational Value in Evaluation Responses
KR20230082528A (en) Method for pattern and video generation and training for language education using machine learning and system thereof
KR20230123116A (en) Big data-based writing level evaluation system
CN115587592A (en) Training method, device, equipment and storage medium of multi-language model
CN111125303A (en) Method and device for screening error correction of user input sentences
Golomb Dipping a Toe into the DH Waters

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant