KR102365341B1 - 인공지능 기반의 글쓰기 첨삭 시스템 및 그 방법 - Google Patents
인공지능 기반의 글쓰기 첨삭 시스템 및 그 방법 Download PDFInfo
- Publication number
- KR102365341B1 KR102365341B1 KR1020210028523A KR20210028523A KR102365341B1 KR 102365341 B1 KR102365341 B1 KR 102365341B1 KR 1020210028523 A KR1020210028523 A KR 1020210028523A KR 20210028523 A KR20210028523 A KR 20210028523A KR 102365341 B1 KR102365341 B1 KR 102365341B1
- Authority
- KR
- South Korea
- Prior art keywords
- correction
- user
- keyword
- writing
- unit
- Prior art date
Links
- 238000012937 correction Methods 0.000 title claims abstract description 193
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 42
- 238000000034 method Methods 0.000 title claims abstract description 29
- 238000013480 data collection Methods 0.000 claims abstract description 16
- 238000004364 calculation method Methods 0.000 claims abstract description 15
- 230000014509 gene expression Effects 0.000 claims description 18
- 238000012545 processing Methods 0.000 claims description 14
- 238000012360 testing method Methods 0.000 claims description 10
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 239000000284 extract Substances 0.000 claims description 7
- 238000011835 investigation Methods 0.000 claims description 6
- 238000009795 derivation Methods 0.000 claims description 5
- 239000000654 additive Substances 0.000 claims description 4
- 230000000996 additive effect Effects 0.000 claims description 4
- 238000003058 natural language processing Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 235000014443 Pyrus communis Nutrition 0.000 description 4
- 235000013399 edible fruits Nutrition 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000035807 sensation Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/232—Orthographic correction, e.g. spell checking or vowelisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Tourism & Hospitality (AREA)
- Educational Technology (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Probability & Statistics with Applications (AREA)
- Educational Administration (AREA)
- Data Mining & Analysis (AREA)
- Document Processing Apparatus (AREA)
Abstract
본 발명은 인공지능 기반의 글쓰기 첨삭 시스템 및 그 방법에 관한 것으로서, 사용자의 교육과정, 검색기록, SNS사용기록 중 적어도 한가지 이상의 사용자 정보를 포함하여 수집하는 사용자 정보 수집부, 기설정된 주기로 국립국어원에서 최신 어문 규정에 관한 데이터를 수집하고, 동일한 사항으로 반복 첨삭된 사용자의 첨삭 이력을 수집하는 첨삭 데이터 수집부, 상기 첨삭 데이터 수집부에서 수집된 첨삭 데이터를 기반으로 사용자 글쓰기를 첨삭하는 인공지능 첨삭부 및 상기 인공지능 첨삭부를 이용하여 첨삭 요소에 따른 가중치를 반영하여 사용자 글쓰기를 스코어링하는 첨삭 산출부를 포함하는 인공지능 기반의 글쓰기 첨삭 시스템 및 그 방법에 관한 것이다.
Description
본 발명은 인공지능 기반의 글쓰기 첨삭 시스템 및 그 방법에 관한 것으로, 보다 상세하게는, 수집된 사용자의 데이터를 기반으로 글감을 추천하고 인공지능 시스템을 통해 사용자의 글쓰기 첨삭 지원 및 스코어링을 통해 사용자의 글쓰기 능력을 향상시키는 인공지능 기반의 글쓰기 첨삭 시스템 및 그 방법에 관한 것이다.
종래의 글쓰기 첨삭은 대표적으로 학생들이 학교에서 일기, 독후감, 글짓기 등의 글쓰기 활동을 통해 교사들이 첨삭 대상이 되는 문장 혹은 단어를 색연필과 같은 필기도구로 교정부호나 기호를 덧씌워 다른 문장으로 대체하거나 의견기술을 하여 글쓴이가 다시 수정하는 방식으로 내용의 통일성과 문법, 문장부호, 오자 및 탈자와 같은 사항을 첨삭해줌으로써, 학생들의 글쓰기 능력을 보완 및 향상시켜왔다.
그러나, 기존의 글쓰기 첨삭 지도는 학교 교사나 전문 글쓰기 강사를 통해 이루어 졌기 때문에, 각 교사마다 공인된 기관인 국립국어원과 같은 곳에서의 최신 어법 정보, 표준어, 외래어 표기법 갱신에 대하여 동일하게 적용하지 못해 여전히 틀린 문법이나 표기를 통해 첨삭하는 등 최신 어문에 대한 정보갱신의 시점이 다르다는 문제점과 더불어 같은 글이라도 첨삭이 다른 경우가 많아 피교육자의 혼란을 야기시키는 상황이 발생하는 경우가 있었다.
또한, 동일한 교사라 하더라도 매번 첨삭의 내용이 달라지고, 교정부호에 대하여 또 다른 의미를 내포하거나 다른 의미로 사용하는 등 첨삭의 품질이 고르지 못하여 피교육자들의 불만이 높아지는 문제점이 있었다.
따라서, 인공지능을 활용한 어문 첨삭 데이터를 기반으로 사용자 글쓰기에 대한 최신어문 규정에 따른 정확하고 일관성 있는 첨삭을 제공할 수 있는 글쓰기 첨삭 시스템의 개발이 요구되고 있다.
삭제
본 발명은 인공지능을 통해 사용자의 정보를 수집함으로써, 수집된 사용자의 정보를 기반으로 단어 혹은 문장으로써 글감을 제공하는 인공지능 기반의 글쓰기 첨삭 시스템 및 그 방법을 제공하는 것에 그 목적이 있다.
또한, 본 발명은 인공지능을 기반으로 공인된 기관인 국립국어원에서 일정 주기마다 최신 어문 규정을 갱신함으로써, 최신 어문 규정을 기초로 사용자 글쓰기에 대한 단어, 맞춤법, 표준어, 띄어쓰기 및 외래어표기법에 대해 교정부호, 글자 색 변화, 밑줄 및 자동변환의 다양한 첨삭 방법을 통해 일정한 품질의 첨삭을 제공하는 인공지능 기반의 글 쓰기 첨삭 시스템 및 그 방법을 제공하는 것에 그 목적이 있다.
또한, 본 발명은 사용자가 첨삭한 글쓰기에 대하여 타 사용자와 그룹화, 스코어링 및 첨삭 테스트 기능을 제공함으로써, 사용자 글쓰기의 문장에 대한 정확도를 향상시키고 균일한 품질의 첨삭 시스템 및 그 방법을 제공하는 것에 그 목적이 있다.
본 발명의 일 실시례에 따른 인공지능 기반의 글쓰기 첨삭 시스템 및 그 방법은 사용자의 교육과정, 검색기록, SNS사용기록 중 적어도 한가지 이상의 사용자 정보를 포함하여 수집하는 사용자 정보 수집부, 기설정된 주기로 국립국어원에서 최신 어문 규정에 관한 데이터를 수집하고, 동일한 사항으로 반복 첨삭된 사용자의 첨삭 이력을 수집하는 첨삭 데이터 수집부, 상기 첨삭 데이터 수집부에서 수집된 첨삭 데이터를 기반으로 사용자 글쓰기를 첨삭하는 인공지능 첨삭부 및 상기 인공지능 첨삭부를 이용하여 첨삭 요소에 따른 가중치를 반영하여 사용자 글쓰기를 스코어링하는 첨삭 산출부를 포함할 수 있다.
또한, 상기 사용자 정보 수집부로부터 수집된 사용자 정보를 자연어 처리하되, 키워드로 구성된 상기 데이터를 어법에 맞는 문장구조로 변환하여 비교 분석하는 데이터 처리부 및 상기 데이터 처리부에서 비교 분석된 데이터에 기초하여 상기 사용자에게 글감주제어를 제공하는 글감제공부를 더 포함하고 상기 데이터 처리부는, 상기 사용자의 SNS 사용기록에 포함된 동사를 기초키워드로 추출하고, 상기 동사에 대응하는 연관조사를 추출하며, 상기 연관조사와 함께 사용된 단어를 핵심키워드로 추출하되, 상기 SNS 사용기록에 사진 또는 위치가 포함되는 경우, 상기 사진의 대상 또는 위치 정보를 우선으로 하는 핵심키워드를 추출하는 키워드 도출부, 상기 핵심키워드에 대응하는 연관키워드셋과 상기 사용자의 개인정보로부터 도출된 다수의 키워드에 대응하는 각각의 연관키워드셋을 비교하여 글감키워드를 추천하되, 상기 핵심키워드가 2개 이상 도출된 경우, 상기 사용자가 게시한 전체 콘텐츠로부터 상기 핵심키워드가 언급된 횟수, 상기 핵심키워드가 검색된 횟수 및 상기 핵심키워드가 포함된 게시글에 호감을 표시한 횟수에 따라 키워드별 관심도를 점수화하여 가장 높은 점수가 부여된 1순위 핵심키워드를 산출하는 핵심키워드 산출부 및 상기 핵심키워드 산출부의 연관키워드셋에 포함된 키워드들과 상기 사용자의 개인정보로부터 도출된 다수의 키워드에 대응하는 각각의 연관키워드셋에 포함된 키워드들 중 포함된 빈도수가 가장 높은 키워드를 추가키워드로 선정하여 상기 추가키워드를 글감 제공을 위한 글감키워드로 추천하는 글감 키워드 추천부를 포함할 수 있다.
또한, 상기 첨삭 데이터 수집부는, 단어, 맞춤법, 표준어, 문법, 띄어쓰기 및 외래어표기법 중 적어도 하나 이상의 항목을 포함하는 최신 어문 규정 데이터를 갱신하고, 상기 사용자가 작성한 글쓰기에 대하여 2회 이상 동일한 사항으로 반복 첨삭되었을 경우, 상기 첨삭 사항에 대한 이력을 사용자 맞춤형 표현부에 저장하며, 상기 사용자와 그룹화한 타 사용자의 첨삭 이력에 대하여 단어 혹은 문장별 첨삭한 부분 및 첨삭 횟수를 갱신하여 첨삭 데이터를 수집할 수 있다.
또한, 상기 사용자 맞춤형 표현부와 상기 첨삭 데이터 수집부에 저장된 표현들을 포함하는 첨삭 연습용 문장을 생성하여 사용자에게 제시하는 첨삭 테스트 생성부를 더 포함하고, 상기 첨삭 테스트 생성부는, 상기 첨삭 연습용 문장 생성시, 맞는 표현과 틀린 표현을 랜덤으로 생성하여 첨삭 연습용 문장을 생성할 수 있다.
또한, 상기 인공지능 첨삭부는, 교정부호, 글자 색 변화, 밑줄, 자동변환 중 적어도 하나의 방법을 사용자가 선택하도록 수정 방법 리스트를 제공하고, 상기 첨삭 산출부는, 사용자 글쓰기를 대상으로 기설정된 기준으로 수정된 첨삭된 횟수, 첨삭한 범위 및 중복된 첨삭에 대하여 산출된 범위에 따라 가중치를 달리하여 스코어링 할 수 있다.
본 발명에 의하면, 본 발명은 인공지능을 통해 사용자의 정보를 수집함으로써, 수집된 사용자의 정보를 기반으로 단어 혹은 문장으로써 글감을 제공하는 인공지능 기반의 글쓰기 첨삭 시스템 및 그 방법을 제공하는 효과가 있다.
또한, 본 발명은 인공지능을 기반으로 공인된 기관인 국립국어원에서 일정 주기마다 최신 어문 규정을 갱신함으로써, 최신 어문 규정을 기초로 사용자 글쓰기에 대한 단어, 맞춤법, 표준어, 띄어쓰기 및 외래어표기법에 대해 교정부호, 글자 색 변화, 밑줄 및 자동변환의 다양한 첨삭 방법을 통해 일정한 품질의 첨삭을 제공하는 인공지능 기반의 글 쓰기 첨삭 시스템 및 그 방법을 제공하는 효과가 있다.
또한, 본 발명은 사용자가 첨삭한 글쓰기에 대하여 타 사용자와 그룹화, 스코어링 및 첨삭 테스트 기능을 제공함으로써, 사용자 글쓰기의 문장에 대한 정확도를 향상시키고 균일한 품질의 첨삭 시스템 및 그 방법을 제공하는 효과가 있다.
도 1은 인공지능 기반의 글쓰기 첨삭 시스템의 블록도이다.
도 2는 인공지능 기반의 글쓰기 첨삭 시스템의 중간블록도이다.
도 3는 인공지능 기반의 글쓰기 첨삭 시스템이 사용자 정보 및 국립국어원으로부터 데이터 수집을 나타낸 그림이다.
도 4은 인공지능 기반의 글쓰기 첨삭 시스템에서의 첨삭 예시와 첨삭 방법 선택을 나타낸 그림이다.
도 2는 인공지능 기반의 글쓰기 첨삭 시스템의 중간블록도이다.
도 3는 인공지능 기반의 글쓰기 첨삭 시스템이 사용자 정보 및 국립국어원으로부터 데이터 수집을 나타낸 그림이다.
도 4은 인공지능 기반의 글쓰기 첨삭 시스템에서의 첨삭 예시와 첨삭 방법 선택을 나타낸 그림이다.
이하에서는 도면을 참조하여 본 발명의 구체적인 실시례를 상세하게 설명한다. 다만, 본 발명의 사상은 제시되는 실시례에 제한되지 아니하고, 본 발명의 사상을 이해하는 당업자는 동일한 사상의 범위 내에서 다른 구성요소를 추가, 변경, 삭제 등을 통하여, 퇴보적인 다른 발명이나 본 발명 사상의 범위 내에 포함되는 다른 실시례를 용이하게 제안할 수 있을 것이나, 이 또한 본원 발명 사상 범위 내에 포함된다고 할 것이다.
또한, 각 실시례의 도면에 나타나는 동일한 사상의 범위 내의 기능이 동일한 구성요소는 동일한 참조부호를 사용하여 설명한다.
이하, 첨부된 도면을 참조하여 본 발명을 보다 상세히 설명하기로 한다.
도 1은 본 발명의 일실시례에 따른 인공지능 기반의 글쓰기 첨삭 시스템 및 그 방법을 설명하기 위한 블록도이고, 도 2는 본 발명의 일실시례에 따른 인공지능 기반의 글쓰기 첨삭 시스템의 중간 블록도이며, 도 3은 본 발명의 일실시례에 따른 인공지능 기반의 글쓰기 첨삭 시스템이 사용자 정보 및 국립국어원으로부터 데이터를 수집하는 것을 나타낸 그림이고, 도 4는 본 발명의 일실시례에 따른 인공지능 기반의 글쓰기 첨삭 시스템에서의 첨삭 예시와 첨삭 방법 선택을 나타낸 그림이다.
도 1을 참고하면, 인공지능 기반의 글쓰기 첨삭 시스템(100)은 사용자 정보 수집부(110), 첨삭 데이터 수집부(120), 인공지능 첨삭부(130) 및 첨삭 산출부(140)를 포함할 수 있다.
상기 사용자 정보 수집부(110)는 상기 도 3의 그림과 같이 사용자의 교육과정, 검색기록, SNS사용기록 중 적어도 한가지 이상의 사용자 정보를 포함하여 수집할 수 있다.
상기 첨삭 데이터 수집부(120)는 기설정된 주기로 국립국어원에서 최신 어문 규정에 관한 데이터를 수집하고, 동일한 사항으로 반복 첨삭된 사용자의 첨삭 이력을 수집할 수 있다.
이때, 상기 첨삭 데이터 수집부(120)는 단어, 맞춤법, 표준어, 문법, 띄어쓰기 및 외래어표기법 중 적어도 하나 이상의 항목을 포함하는 최신 어문 규정 데이터를 갱신할 수 있다. 또한, 상기 사용자가 작성한 글쓰기에 대하여 2회 이상 동일한 사항으로 반복 첨삭되었을 경우, 상기 첨삭 사항에 대한 이력을 사용자 맞춤형 표현부에 저장할 수 있다. 이때, 상기 사용자와 그룹화한 타 사용자의 첨삭 이력에 대하여 단어 혹은 문장별 첨삭한 부분 및 첨삭 횟수를 갱신하여 첨삭 데이터를 수집할 수 있다.
여기서, 상기 최신 어문 규정 데이터는 기본 30일을 주기로 갱신할 수 있으나, 사용자 설정을 통해 갱신 주기를 가감할 수 있고, 사용자의 필요와 용도에 따라 데이터를 갱신하지 않도록 설정할 수도 있다.
상기 인공지능 첨삭부(130)는 상기 첨삭 데이터 수집부(120)에서 수집된 첨삭 데이터를 기반으로 사용자 글쓰기를 첨삭할 수 있다.
이때, 도 4를 참고하면, 상기 사용자가 상기 인공지능 첨삭부(130)를 이용하여 교정부호, 글자 색 변화, 밑줄, 자동변환 중 적어도 하나의 방법을 사용자가 선택하여 수정 방법을 정할 수 있다. 한편, 상기 첨삭 산출부(140)는 사용자 글쓰기의 첨삭에서 기설정된 기준으로 수정된 첨삭된 횟수, 첨삭한 범위 및 중복된 첨삭에 대하여 산출된 범위에 따라 가중치를 달리하여 스코어링할 수 있다.
또한, 상기 사용자는 상기 인공지능 첨삭부(130)의 자동변환 기능을 통해 자동으로 즉시 첨삭하는 기능과 동시에 작성한 원문의 단어 혹은 문장에 대해 첨삭 예정 표기만을 하도록 설정할 수 있다.
상기 첨삭 산출부(140)는 상기 인공지능 첨삭부(130)를 이용하여 첨삭 요소에 따른 가중치를 반영하여 사용자 글쓰기를 스코어링할 수 있다
이때, 상기 사용자 글쓰기 스코어링에서 첨삭한 범위는 상기 사용자가 쓴 글에 대한 첨삭 글자수를 기반으로 산출할 수 있다. 즉, 한 글자당 한글에 대한 첨삭은 2포인트로 계산하고 영문, 특수문자, 문장부호, 숫자에 대한 첨삭은 한 글자당 1포인트로 산정하여 연속되는 글자에 대한 범위를 포인트로 산출할 수 있다. 또한, 상기 사용자 글쓰기 스코어링은 수정이 아닌 단어 혹은 문장간 자리바꿈에 대하여 실시한 전체 범위를 포인트로 산출하도록 설정하거나, 산출이 되지 않도록 사용자가 설정할 수 있다.
일례로, '배는 선박을 의미하는 배(sip)와 과일을 의미하는 배(pear의 두가지 뜻을 포한한다'라고 작성된 문장을 '배는 선박을 의미하는 배(ship)와 과일을 의미하는 배(pear)의 두 가지 뜻을 포함한다.'로 첨삭했을 때, 'sip'에서 'ship'으로 1개의 알파벳 h를 추가하고, '(pear'에서 '(pear)'로 문장부호인 ')'를 추가할 수 있다. 또한, '다'에서 '다.'로 문장부호 '.'을 추가하고, '두가지'에서 '두 가지'로 띄어쓰기를 추가하여 첨삭된 기호, 문장부호, 띄어쓰기에 대해서 각 1포인트, '포한한다'에서 '포함한다'로 대체된 한글 문자에 1글자에 대해 2포인트로 산정하여 사용자 글쓰기에 대한 첨삭 포인트에 대하여 총합 6포인트로 사용자 글쓰기를 스코어링 할 수 있다.
한편, 첨삭 항목별 가중치는 상기 첨삭한 범위에 대한 첨삭 포인트를 산출하는 과정에서 사용자가 습관적으로 틀리거나, 특정 문법에 대하여 집중적인 학습이 요구될 때와 같이 사용자의 학습 목적에 따라 상기 첨삭 상기 포인트의 항목별 가중치를 가감할 수 있다.
여기서, 상기 사용자가 작성한 글쓰기 첨삭에 대하여 단어 혹은 문장의 삭제 또는 기존의 문장에서 단어나 문장이 추가되는 경우, 첨삭된 전체 글자수를 산정하고 포인트의 총합을 산출할 수 있다.
예를 들어, '곰곰히'라는 표현을 '곰곰이'로 첨삭했을 때, 상기 사용자 글쓰기에서 '곰곰히'라는 단어가 총 5회 사용되었다면, 상기 5회의 첨삭에 대한 10포인트의 감점이 아닌 1회의 감점인 2포인트의 감점을 할 수 있다. 이때, 동일한 내용으로 첨삭된 '곰곰히'라는 단어에 대하여 상기 사용자 맞춤형 표현부에 제공되어 추후 첨삭 연습용 문장에 무작위로 생성될 수 있다.
또한, 상기 사용자에게 부여되는 가산점은 사용자의 글쓰기 첨삭에 있어서 첨삭한 횟수, 범위 및 중복된 첨삭에 대하여 가중치를 달리하여 사용자의 글쓰기를 스코어링할 수 있다. 이때, 상기 사용자가 최초의 사용자 글쓰기 첨삭을 통한 스코어링 시, 상기 사용자와 유사한 스코어를 받은 복수의 타 사용자들로 구성된 그룹에 참여하여 그룹화된 사용자들간 피드백과 본인을 제외한 타 사용자의 글쓰기를 첨삭하여 스코어링할 수 있다. 여기서, 상기 인공지능 첨삭부(130)와 일치하는 첨삭 내용이 많을수록 상기 가산점을 부여 받을 수 있다.
한편, 첨삭 테스트 생성부는 상기 사용자 맞춤형 표현부와 상기 첨삭 데이터 수집부(120)에 저장된 표현들을 포함하는 첨삭 연습용 문장을 생성할 수 있다. 이때, 상기 첨삭 테스트 생성부가 상기 첨삭 연습용 문장 생성시, 맞는 표현과 틀린 표현을 무작위로 생성하여 첨삭 연습용 문장을 사용자에게 제공할 수 있다.
예를 들어, 사용자가 작성한 글쓰기에 대하여 '몇일'이라는 단어가 '며칠'로 2회 이상 동일한 첨삭이 이루어졌을때, 첨삭 전후 단어에 대해 상기 사용자 맞춤 표현부로 수집이 되고, 같은 그룹 내의 타 사용자가 '깨끗히'를 '깨끗이'로 상기 사용자와 같이 2회 이상 동일한 첨삭이 이루어졌을 때, '깨끗이'라는 단어도 상기 사용자 맞춤 표현부로 저장될 수 있다. 이때, 상기 첨삭 테스트 생성부는 추후 그룹 내 사용자들에게 첨삭 연습용 문제 생성 시 '나는 몇일에 걸쳐 방을 깨끗이 청소했다.' 혹은 '나는 며칠에 걸쳐 방을 깨끗히 청소했다.'로 생성하여 틀린 표현뿐만 아니라 맞는 표현도 동시에 첨삭 연습용 문제로 생성할 수 있다. 이를 통해, 사용자가 반복적으로 틀리는 부분을 상기시키고 상기 사용자를 포함한 그룹 내 사용자들의 문장 첨삭 능력을 향상시킬 수 있다.
또한, 인공지능 기반의 글쓰기 첨삭 시스템(100)은 데이터 처리부(150) 및 글감제공부(160)를 더 포함할 수 있다.
상기 데이터 처리부(150)는 상기 사용자 정보 수집부(110)로부터 수집된 사용자 정보를 자연어 처리하되, 키워드로 구성된 상기 데이터를 어법에 맞는 문장구조로 변환하여 비교 분석할 수 있다.
일례로, 상기 사용자 정보 수집부(110)에서 '#OOTD'라는 검색기록이 수집되었을 시, 상기 데이터 처리부(150)에서 '#OOTD'의 의미를 풀어 쓴 '오늘 입은 옷차림' 또는 'Outfit Of The Day'로 문장구조를 변환하여 상기 변환된 문장의 키워드인 '옷차림'과 'Outfit'을 핵심키워드 처리할 수 있다.
상기 글감제공부(160)는 상기 데이터 처리부(150)에서 비교 분석된 데이터에 기초하여 상기 사용자에게 글감주제어를 제공할 수 있다.
즉, 상기 글감제공부(160)는 상기 데이터 처리부(150)에서 제시한 예시와 같이 상기 사용자가 검색한 '#OOTD'라는 단어를 기반으로 글감 주제를 선정한다고 가정하면, '옷차림' 또는 '패션' 등의 직관적 글감주제어부터 '배색에 기반한 의상 색채 구성' 또는 '옷차림에 따른 사회적 위치와 시선'등과 같이 확장된 의미의 글감주제어도 제공할 수 있다.
또한, 도 2를 참고하면, 상기 데이터 처리부(150)는 키워드 도출부(151), 핵심키워드 산출부(152) 및 글감 키워드 추천부(153)를 더 포함할 수 있다.
상기 키워드 도출부(151)는 상기 데이터 처리부(150)에서 상기 사용자의 SNS 사용기록에 포함된 동사를 기초키워드로 추출하고, 상기 동사에 대응하는 연관조사를 추출하며, 상기 연관조사와 함께 사용된 단어를 핵심키워드로 추출하되, 상기 SNS 사용기록에 사진 또는 위치가 포함되는 경우, 상기 사진의 대상 또는 위치 정보를 우선으로 하는 핵심키워드를 추출할 수 있다.
상기 핵심키워드 산출부(152)는 핵심키워드에 대응하는 연관키워드셋과 상기 사용자의 개인정보로부터 도출된 다수의 키워드에 대응하는 각각의 연관키워드셋을 비교하여 글감키워드를 추천하되, 상기 핵심키워드가 2개 이상 도출된 경우, 상기 사용자가 게시한 전체 콘텐츠로부터 상기 핵심키워드가 언급된 횟수, 상기 핵심키워드가 검색된 횟수 및 상기 핵심키워드가 포함된 게시글에 호감을 표시한 횟수에 따라 키워드별 관심도를 점수화하여 가장 높은 점수가 부여된 1순위 핵심키워드를 산출할 수 있다.
상기 글감 키워드 추천부(153)는 상기 핵심키워드 산출부(152)의 연관키워드셋에 포함된 키워드들과 상기 사용자의 개인정보로부터 도출된 다수의 키워드에 대응하는 각각의 연관키워드셋에 포함된 키워드들 중 포함된 빈도수가 가장 높은 키워드를 추가키워드로 선정하여 상기 추가키워드를 글감 제공을 위한 글감키워드로 추천할 수 있다.
상기와 같이 본 발명의 일실시례에 따르면, 본 발명은 인공지능을 통해 사용자의 정보를 수집함으로써, 수집된 사용자의 정보를 기반으로 단어 혹은 문장으로써 글감을 제공하는 인공지능 기반의 글쓰기 첨삭 시스템 및 그 방법을 제공할 수 있다.
또한, 본 발명은 인공지능을 기반으로 공인된 기관인 국립국어원에서 일정 주기마다 최신 어문 규정을 갱신함으로써, 최신 어문 규정을 기초로 사용자 글쓰기에 대한 단어, 맞춤법, 표준어, 띄어쓰기 및 외래어표기법에 대해 교정부호, 글자 색 변화, 밑줄 및 자동변환의 다양한 첨삭 방법을 통해 일정한 품질의 첨삭을 제공하는 인공지능 기반의 글 쓰기 첨삭 시스템 및 그 방법을 제공할 수 있다.
또한, 본 발명은 사용자가 첨삭한 글쓰기에 대하여 타 사용자와 그룹화, 스코어링 및 첨삭 테스트 기능을 제공함으로써, 사용자 글쓰기의 문장에 대한 정확도를 향상시키고 균일한 품질의 첨삭 시스템 및 그 방법을 제공할 수 있다.
한편, 본 발명의 일실시례에 따른, 인공지능 기반의 글쓰기 첨삭 방법은 다양한 컴퓨터로 구현되는 동작을 수행하기 위한 프로그램 명령을 포함하는 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.
상기에서는 본 발명에 따른 실시례를 기준으로 본 발명의 구성과 특징을 설명하였으나 본 발명은 이에 한정되지 않으며, 본 발명의 사상과 범위 내에서 다양하게 변경 또는 변형할 수 있음은 본 발명이 속하는 기술분야의 당업자에게 명백한 것이며, 따라서 이와 같은 변경 또는 변형은 첨부된 특허청구범위에 속함을 밝혀둔다.
100: 인공지능 기반의 글쓰기 첨삭 시스템
110: 사용자 정보 수집부
120: 첨삭 데이터 수집부
130: 인공지능 첨삭부
140: 첨삭 산출부
150: 데이터 처리부
151: 키워드 도출부
152: 핵심키워드 산출부
153: 글감 키워드 추천부
160: 글감제공부
110: 사용자 정보 수집부
120: 첨삭 데이터 수집부
130: 인공지능 첨삭부
140: 첨삭 산출부
150: 데이터 처리부
151: 키워드 도출부
152: 핵심키워드 산출부
153: 글감 키워드 추천부
160: 글감제공부
Claims (5)
- 사용자의 교육과정, 검색기록, SNS사용기록 중 적어도 한가지 이상의 사용자 정보를 포함하여 수집하는 사용자 정보 수집부;
기설정된 주기로 상기 사용자가 작성한 글쓰기에 포함된 표현에 대하여 타 사용자의 첨삭 이력이 포함된 첨삭 데이터를 수집하는 첨삭 데이터 수집부;
상기 첨삭 데이터 수집부에서 수집된 첨삭 데이터를 기반으로 상기 타 사용자의 첨삭 이력의 내용과 동일한 오류가 존재하는지 판단하여 사용자 글쓰기의 첨삭이 필요한 부분을 추출하고, 상기 첨삭이 필요한 부분에 교정부호 사용, 글자 색 변화, 밑줄 표시 및 자동변환 표시하여 첨삭하는 인공지능 첨삭부; 및
상기 인공지능 첨삭부를 이용하여 첨삭 요소에 따른 가중치를 반영하여 사용자 글쓰기를 스코어링하는 첨삭 산출부;를 포함하고,
상기 사용자 정보 수집부로부터 수집된 사용자 정보를 자연어 처리하되, 키워드로 구성된 상기 데이터를 어법에 맞는 문장구조로 변환하여 비교 분석하는 데이터 처리부; 및
상기 데이터 처리부에서 비교 분석된 데이터에 기초하여 상기 사용자에게 글감주제어를 제공하는 글감제공부;를 더 포함하고
상기 데이터 처리부는,
상기 사용자의 SNS 사용기록에 포함된 동사를 기초키워드로 추출하고, 상기 동사에 대응하는 연관조사를 추출하며, 상기 연관조사와 함께 사용된 단어를 핵심키워드로 추출하되, 상기 SNS 사용기록에 사진 또는 위치가 포함되는 경우, 상기 사진의 대상 또는 위치 정보를 우선으로 하는 핵심키워드를 추출하는 키워드 도출부;
상기 핵심키워드에 대응하는 연관키워드셋과 상기 사용자의 개인정보로부터 도출된 다수의 키워드에 대응하는 각각의 연관키워드셋을 비교하여 글감키워드를 추천하되, 상기 핵심키워드가 2개 이상 도출된 경우, 상기 사용자가 게시한 전체 콘텐츠로부터 상기 핵심키워드가 언급된 횟수, 상기 핵심키워드가 검색된 횟수 및 상기 핵심키워드가 포함된 게시글에 호감을 표시한 횟수에 따라 키워드별 관심도를 점수화하여 가장 높은 점수가 부여된 1순위 핵심키워드를 산출하는 핵심키워드 산출부; 및
상기 핵심키워드 산출부의 연관키워드셋에 포함된 키워드들과 상기 사용자의 개인정보로부터 도출된 다수의 키워드에 대응하는 각각의 연관키워드셋에 포함된 키워드들 중 포함된 빈도수가 가장 높은 키워드를 추가키워드로 선정하여 상기 추가키워드를 글감 제공을 위한 글감키워드로 추천하는 글감 키워드 추천부;를 포함하며,
상기 첨삭 데이터 수집부는,
단어, 맞춤법, 표준어, 문법, 띄어쓰기 및 외래어표기법 중 적어도 하나 이상의 항목을 포함하는 최신 어문 규정 데이터를 갱신하고,
상기 사용자가 작성한 글쓰기에 대하여 2회 이상 동일한 사항으로 반복 첨삭되었을 경우, 상기 첨삭 사항에 대한 이력을 사용자 맞춤형 표현부;에 저장하며,
상기 사용자와 그룹화한 타 사용자의 첨삭 이력에 대하여 단어 혹은 문장별 첨삭한 부분 및 첨삭 횟수를 갱신하여 첨삭 데이터를 수집하고,
상기 사용자 맞춤형 표현부와 상기 첨삭 데이터 수집부에 저장된 표현들을 포함하는 첨삭 연습용 문장을 생성하여 사용자에게 제시하는 첨삭 테스트 생성부를 더 포함하고,
상기 첨삭 테스트 생성부는,
상기 첨삭 연습용 문장 생성시, 맞는 표현과 틀린 표현을 랜덤으로 생성하여 첨삭 연습용 문장을 생성하며,
상기 인공지능 첨삭부는,
교정부호, 글자 색 변화, 밑줄, 자동변환 중 적어도 하나의 방법을 사용자가 선택하도록 수정 방법 리스트를 제공하고,
상기 첨삭 산출부는,
사용자 글쓰기를 대상으로 기설정된 기준으로 수정된 첨삭된 횟수, 첨삭한 범위 및 중복된 첨삭에 대응하여 스코어링 하되, 상기 사용자가 작성한 글쓰기에서 첨삭한 한글 한 글자에 2포인트, 영문, 특수문자, 문장부호, 숫자 및 띄어쓰기에 대한 첨삭은 한 글자에 1포인트로 산출하여 스코어링 하는 것을 특징으로 하는 인공지능 기반의 글쓰기 첨삭 시스템.
- 삭제
- 삭제
- 삭제
- 삭제
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210028523A KR102365341B1 (ko) | 2021-03-04 | 2021-03-04 | 인공지능 기반의 글쓰기 첨삭 시스템 및 그 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210028523A KR102365341B1 (ko) | 2021-03-04 | 2021-03-04 | 인공지능 기반의 글쓰기 첨삭 시스템 및 그 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR102365341B1 true KR102365341B1 (ko) | 2022-02-23 |
Family
ID=80495417
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020210028523A KR102365341B1 (ko) | 2021-03-04 | 2021-03-04 | 인공지능 기반의 글쓰기 첨삭 시스템 및 그 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102365341B1 (ko) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102602813B1 (ko) * | 2023-02-08 | 2023-11-17 | 주식회사 보인정보기술 | 받아쓰기 문장 자동 생성 방법 및 장치 |
KR102658238B1 (ko) * | 2023-09-07 | 2024-04-18 | 아이보람 주식회사 | 모국어 습득 원리를 적용한 영어 교육을 수행함에 있어, 뉴럴 네트워크를 이용하여 사용자 단말에게 영어 글쓰기 서비스를 제공하는 방법 및 장치 |
KR102668347B1 (ko) | 2024-01-17 | 2024-05-24 | (주)진문콘텐츠스튜디오 | 웹 소설 작가를 양성하기 위한 인공지능 기반 따라쓰기 습작 지도 방법 및 시스템 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20110068491A (ko) * | 2009-12-16 | 2011-06-22 | 포항공과대학교 산학협력단 | 문법 오류 시뮬레이션 장치 및 방법 |
JP2013196374A (ja) * | 2012-03-19 | 2013-09-30 | Fujitsu Ltd | 文章校正装置、及び文章校正方法 |
KR101752679B1 (ko) | 2015-11-18 | 2017-09-26 | 라이팅박스(주) | 자연어 처리를 이용한 온라인 첨삭 방법 및 그 장치 |
KR102099364B1 (ko) * | 2020-02-11 | 2020-04-09 | 주식회사 팀플백 | 사용자 분석 기반의 책쓰기 가이딩 시스템 |
KR20200103338A (ko) * | 2019-02-25 | 2020-09-02 | 윤주웅 | 에세이 평가 서비스 제공 시스템 |
KR20200126103A (ko) * | 2019-04-29 | 2020-11-06 | 주식회사 카이엔터테인먼트 | 온라인 글쓰기 교육을 위한 빅데이터 구축 방법 |
-
2021
- 2021-03-04 KR KR1020210028523A patent/KR102365341B1/ko active IP Right Grant
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20110068491A (ko) * | 2009-12-16 | 2011-06-22 | 포항공과대학교 산학협력단 | 문법 오류 시뮬레이션 장치 및 방법 |
JP2013196374A (ja) * | 2012-03-19 | 2013-09-30 | Fujitsu Ltd | 文章校正装置、及び文章校正方法 |
KR101752679B1 (ko) | 2015-11-18 | 2017-09-26 | 라이팅박스(주) | 자연어 처리를 이용한 온라인 첨삭 방법 및 그 장치 |
KR20200103338A (ko) * | 2019-02-25 | 2020-09-02 | 윤주웅 | 에세이 평가 서비스 제공 시스템 |
KR20200126103A (ko) * | 2019-04-29 | 2020-11-06 | 주식회사 카이엔터테인먼트 | 온라인 글쓰기 교육을 위한 빅데이터 구축 방법 |
KR102099364B1 (ko) * | 2020-02-11 | 2020-04-09 | 주식회사 팀플백 | 사용자 분석 기반의 책쓰기 가이딩 시스템 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102602813B1 (ko) * | 2023-02-08 | 2023-11-17 | 주식회사 보인정보기술 | 받아쓰기 문장 자동 생성 방법 및 장치 |
KR102658238B1 (ko) * | 2023-09-07 | 2024-04-18 | 아이보람 주식회사 | 모국어 습득 원리를 적용한 영어 교육을 수행함에 있어, 뉴럴 네트워크를 이용하여 사용자 단말에게 영어 글쓰기 서비스를 제공하는 방법 및 장치 |
KR102668347B1 (ko) | 2024-01-17 | 2024-05-24 | (주)진문콘텐츠스튜디오 | 웹 소설 작가를 양성하기 위한 인공지능 기반 따라쓰기 습작 지도 방법 및 시스템 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102365341B1 (ko) | 인공지능 기반의 글쓰기 첨삭 시스템 및 그 방법 | |
Lee | The effectiveness of machine translation in foreign language education: a systematic review and meta-analysis | |
US11610507B2 (en) | Guided operation of a language-learning device based on learned user memory characteristics | |
US6729882B2 (en) | Phonetic instructional database computer device for teaching the sound patterns of English | |
Sinharay et al. | Prediction of essay scores from writing process and product features using data mining methods | |
JPWO2005057524A1 (ja) | 作文小論文の評価採点装置 | |
CN109155111B (zh) | 学习支持系统、方法及非易失性的机器可读介质 | |
WO2021260760A1 (ja) | 語彙数推定装置、語彙数推定方法、およびプログラム | |
Yunus et al. | ESL pre-service teachers' perceptions on the use of paragraph punch in teaching writing | |
WO2021089129A1 (en) | Analysis and comparison of character-coded digital data, in particular for job matching | |
KR102365345B1 (ko) | 인공지능과 빅데이터를 이용한 글쓰기 교정 시스템 및 그 방법 | |
KR102099364B1 (ko) | 사용자 분석 기반의 책쓰기 가이딩 시스템 | |
US10854106B2 (en) | Targeted repetition and targeted reinforcement in a language learning system | |
Coffin et al. | Supporting the writing skills of individuals with autism spectrum disorder through assistive technologies | |
US20230169268A1 (en) | Textual adjustment to a target reading level | |
Arshad et al. | Comprehensive readability assessment of scientific learning resources | |
Csernoch et al. | Human-centered digital sustainability: handling enumerated lists in digital texts | |
Beaufort et al. | Automation of dictation exercises. A working combination of CALL and NLP. | |
WO2021260763A1 (ja) | 語彙数推定装置、語彙数推定方法、およびプログラム | |
WO2021260761A1 (ja) | 語彙数推定装置、語彙数推定方法、およびプログラム | |
WO2021260762A1 (ja) | 語彙数推定装置、語彙数推定方法、およびプログラム | |
Hrkút et al. | Data Collection for Natural Language Processing Systems | |
Rynning-Tønnesen | A comparative case study of 8th graders’ spelling and grammar using handwritten versus computer-written texts with autocorrect/Grammar-checking-software | |
KR20230123116A (ko) | 빅데이터 기반의 글쓰기 수준 평가 시스템 | |
Kari | Lexware, Dene Band Labels, and Recent Alaska Dene Lexicography Work. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |