KR101882585B1 - 인간-로봇 상호작용을 위한 교육 환경에서의 자연어 문장/문단 가독성 분류 방법 및 시스템 - Google Patents

인간-로봇 상호작용을 위한 교육 환경에서의 자연어 문장/문단 가독성 분류 방법 및 시스템 Download PDF

Info

Publication number
KR101882585B1
KR101882585B1 KR1020160159834A KR20160159834A KR101882585B1 KR 101882585 B1 KR101882585 B1 KR 101882585B1 KR 1020160159834 A KR1020160159834 A KR 1020160159834A KR 20160159834 A KR20160159834 A KR 20160159834A KR 101882585 B1 KR101882585 B1 KR 101882585B1
Authority
KR
South Korea
Prior art keywords
sentence
paragraph
readability
classification
input
Prior art date
Application number
KR1020160159834A
Other languages
English (en)
Other versions
KR20180060393A (ko
Inventor
최용석
공성언
Original Assignee
한양대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한양대학교 산학협력단 filed Critical 한양대학교 산학협력단
Priority to KR1020160159834A priority Critical patent/KR101882585B1/ko
Publication of KR20180060393A publication Critical patent/KR20180060393A/ko
Application granted granted Critical
Publication of KR101882585B1 publication Critical patent/KR101882585B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B7/00Electrically-operated teaching apparatus or devices working with questions and answers
    • G09B7/02Electrically-operated teaching apparatus or devices working with questions and answers of the type wherein the student is expected to construct an answer to the question which is presented or wherein the machine gives an answer to the question presented by a student
    • G06F17/2705
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B7/00Electrically-operated teaching apparatus or devices working with questions and answers
    • G09B7/02Electrically-operated teaching apparatus or devices working with questions and answers of the type wherein the student is expected to construct an answer to the question which is presented or wherein the machine gives an answer to the question presented by a student
    • G09B7/04Electrically-operated teaching apparatus or devices working with questions and answers of the type wherein the student is expected to construct an answer to the question which is presented or wherein the machine gives an answer to the question presented by a student characterised by modifying the teaching programme in response to a wrong answer, e.g. repeating the question, supplying a further explanation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Machine Translation (AREA)

Abstract

일 실시예에 따른 트리 패턴 표현식 기반 매칭 기술 및 자연어 처리 기법을 통해 정의된 문장/문단의 특징을 추출하고, 추출된 문장/문단의 특징에 기초하여 기계 학습 기법 및 인공 신경망을 적용하여 문장/문단의 수준 및 가독성을 측정/분류하는 방법 및 시스템이 개시된다. 더욱 상세하게는, 본 발명은 문장 특징을 활용한 문장 가독성 분류 서비스에 있어서, 문장 분류 데이터베이스에 기반하여 정의된 문장의 특징을 추출하여 추출된 특징을 학습한 후, 새로운 문장의 입력시 입력된 문자의 수준 및 가독성을 분류하고, 문단 특징을 활용한 문단 가독성 분류 서비스에 있어서, 문단 분류 데이터 베이스에 기반하여 문단을 문장 단위로 파싱하여 정의된 문장들의 특징을 결합하여 문단의 특징을 추출한 후, 추출된 문단의 특징을 학습함으로써 새로운 문단의 입력시 입력된 문단의 수준 및 가독성을 분류할 수 있다.

Description

인간-로봇 상호작용을 위한 교육 환경에서의 자연어 문장/문단 가독성 분류 방법 및 시스템{METHOD AND SYSTEM FOR CLASSIFYING NATURAL LANGUAGE SENTENCE/PARAGRAPH READABILITY IN EDUCATIONAL ENVIRONMENT FOR HRI}
아래의 설명은 인간-로봇 상호작용을 위한 교육 환경에서의 자연어 문장/문단 가독성 분류 기술에 관한 것이다.
국외에서는 실제 수준별 문단을 학습하여 구축한 문단 분류기가 있으며, 뿐만 아니라 학생들이 구사한 문장/문단의 수준 및 가독성을 기반으로 한 자동 과제 평가 서비스(AES: Automated Essay Scoring)가 있다. 국내에서는 문장의 길이, 단어의 빈도, 품사의 빈도 등의 문장에서 사용된 기본적인 특징만을 이용하여 발음 난이도를 측정하거나 문장의 가독성을 분류하는 기술들이 존재한다.
또한, 온라인을 통한 학습이 증가함에 따라 학생들의 개인화된 맞춤형 학습 지원을 위한 수준별 학습 진단 및 처방 서비스가 제공되고 있다. 현재 서비스되고 있는 다수의 인터넷 학습시스템들은 사용자들의 학년, 과목, 또는 몇몇 정해진 유형에 따른 문제 은행식의 문제들만을 제공하고 있고, 그러한 문제풀이 역시 단순 통계식 채점 위주로 서비스되고 있으며, 오로지 선생님이나 교사 등 한정된 평가자에 의해서만 답변이나 평가가 제공되고 있다.
이와 같이 종래의 기술은, 문장의 길이, 단어 수 등의 문장에서 사용되는 기본적인 특징만을 이용하였기 때문에 문장 및/또는 문단의 수준과 가독성을 분류한 결과의 정확도가 낮았으며, 이러한 기능을 제공하는 서비스로 적용하기에는 한계가 존재한다.
일 실시예에 따르면, 트리 패턴 표현식 기반 매칭 기법 및 자연어 처리 기법을 활용하여 추출된 문장/문단의 특징에 기반하여 기계 학습 기법 및 인공 신경망을 적용하여 문장/문단의 수준 및 가독성을 분류하는 서비스 및 방법을 제공할 수 있다.
일 실시예에 따르면, 가독성 분류 시스템은, 문장이 입력됨을 수신함에 따라 상기 문장으로부터 문장 분류 결과 데이터베이스에 기반하여 문장의 특징을 추출하는 문장 특징 추출 모듈; 문단이 입력됨을 수신함에 따라 상기 문단으로부터 문단 분류 결과 데이터베이스에 기반하여 문단의 특징을 추출하는 문단 특징 추출 모듈-상기 문단은 문장 파서를 통하여 문장 단위로 분할함에 따라 생성된 문장들에 대하여 상기 문장 특징 추출 모듈을 통해 추출된 문장의 특징을 결합함으로써 상기 문단의 특징이 추출됨-; 상기 추출된 문장의 특징에 기초하여 상기 문장의 수준과 상기 문장의 가독성을 측정 및 분류하는 문장 가독성 분류 모듈; 및 상기 추출된 문단의 특징에 기초하여 상기 문단의 수준과 상기 문단의 가독성을 측정 및 분류하는 문단 가독성 분류 모듈을 포함할 수 있다.
상기 문장 특징 추출 모듈은, 상기 문장의 전체 길이, 상기 문장에서 사용된 단어의 개수, 문장의 문형 점수, 상기 문장에서 사용된 형용사구의 개수, 상기 문장에서 사용된 부사구의 개수, 상기 문장에서 사용된 수식어의 개수, 상기 문장에서 사용된 단어들의 평균 글자 수, 상기 문장에서 사용된 단어들의 평균 음절 수, 상기 문장의 구조 점수, 상기 문장에서 사용된 등위접속사의 개수, 상기 문장에서 사용된 종속절의 개수, 상기 문장에서 사용된 합성명사의 개수, 상기 문장에서 사용된 구성 성분간의 문법적 관계 개수 중 적어도 하나의 문장의 구조적 특징을 포함하는 문장의 구조적 특징 모듈; 및 Collins 단어 사전에 기록된 단어의 빈도 점수를 활용한 상기 문장에서의 어휘 점수 또는 아카데믹 워드 리스트(AWL: Academic Word List)에 저장된 단어의 점수 합 중 적어도 하나의 문장의 어휘적 특징을 포함하는 문장의 어휘적 특징 모듈을 포함할 수 있다.
상기 문장 특징 추출 모듈은, 상기 문장의 구조 점수를 산출하기 위하여 상기 문장에 대한 파스 트리와 트리 패턴 표현식 기반 매칭 기법을 수행하는 문장 구조 점수 평가 모듈을 더 포함하고, 상기 문장 구조 점수 평가 모듈은, 문장의 패턴화를 통해 생성된 패턴과 기 분류된 파스 트리 데이터베이스간의 트리 패턴 표현식 기반 매칭을 통하여 획득된 매칭 정보 결과를 이용하여 문장의 구조 점수를 평가할 수 있다.
상기 문장 가독성 분류 모듈은, 상기 추출된 문장의 특징을 인공 신경망, 서포트 벡터 머신(SVM), 나이브 베이지안에 기초하여 학습시킨 후 상기 문장의 특징에 따라 상기 문장의 수준 및 가독성을 평가 및 분류할 수 있다.
상기 문단 특징 추출 모듈은, 상기 문단의 전체 길이, 상기 문단에서 사용된 단어의 개수, 상기 문단에서 사용된 문장들의 문형 점수 평균, 상기 문단에서 사용된 형용사구의 개수, 상기 문단에서 사용된 부사구의 개수, 상기 문단에서 사용된 수식어의 개수, 상기 문단에서 사용된 단어들의 평균 글자수, 상기 문단에서 사용된 단어들의 평균 음절수, 상기 문단에서 사용된 트리 패턴 표현식 기반의 문장 구조 점수 평균, 상기 문단에서 사용된 등위접속사의 개수, 상기 문단에서 사용된 종속절의 개수, 상기 문단에서 사용된 합성명사의 개수, 상기 문단에서 사용된 구성 성분간의 문법적 관계 개수 중 적어도 하나의 문단 구조적 특징을 포함하고, Collins 단어 사전에 기록된 단어의 빈도 점수를 활용한 상기 문단에서의 어휘 점수 또는 상기 문단에서 사용된 AWL에 등록된 단어의 점수 합 중 적어도 하나의 문단 어휘적 특징을 포함할 수 있다.
상기 문단 가독성 분류 모듈은, 상기 추출된 문단의 특징을 인공신경망, 서포트 벡터 머신, 나이브 베이지안에 기초하여 학습시킨 후 상기 문단의 특징에 따라 상기 문단의 수준 및 가독성을 평가 및 분류할 수 있다.
일 실시예에 따르면, 가독성 분류 방법에 있어서, 문장 분류 결과 데이터베이스 및 문단 분류 결과 데이터베이스를 유지하는 단계; 문장 또는 문단이 입력됨을 수신하는 단계; 상기 문장이 입력됨을 수신함에 따른 입력 문장을 상기 문장 분류 결과 데이터베이스에 기반하여 상기 입력 문자의 구조적 및 어휘적 특징을 추출하는 단계; 상기 문단이 입력됨을 수신함에 따른 입력 문단을 상기 문단 분류 결과 데이터베이스에 기반하여 상기 입력 문단을 문장 단위로 파싱하여 정의된 문장들의 특징을 결합함으로써 상기 입력 문단의 특징을 추출하는 단계; 상기 추출된 문장 또는 문단의 특징에 기초하여 상기 문장 또는 문단의 수준과 상기 문장 또는 문단의 가독성을 측정 및 분류하는 단계; 및 상기 측정 및 분류된 문장 또는 문단의 수준과 가독성을 디스플레이하도록 제공하는 단계를 포함할 수 있다.
일 실시예에 따르면, 문장 구조 점수 평가 모듈은, 문장이 입력됨에 따른 입력 문장을 트리 패턴 표현식 매칭에 적용 가능한 파스 트리 구조의 패턴으로 패턴화시키는 입력 문장 패턴화 모듈; 상기 입력 문장의 패턴과 파스 트리 데이터베이스에 저장된 문장들의 파스 트리를 트리 패턴 표현식(TPE:Tree Pattern Expression) 매칭을 통해 매칭시키고, 상기 매칭된 매칭 결과에 기초하여 문장의 구조 점수를 획득하는 트리 패턴 표현식 기반 매칭 모듈; 및 상기 매칭 결과를 이용하여 매칭된 문장들에 대하여 상기 문장들의 수준간의 평균 및 분산을 활용하여 상기 문장의 구조 점수를 측정하는 매칭 결과 기반 문장구조 점수화 모듈을 포함할 수 있다.
일 실시예에 따른 가독성 분류 시스템은, 교육환경에서 기존 교육에 사용된 데이터를 학습하여 사용자로부터 입력된 문장/문단을 자연어 처리 기법을 통해 구조적 또는 어휘적 특징들을 추출하고, 추출된 특징에 기반하여 문장/문단의 수준 및 가독성을 분류 및 평가할 수 있다.
이에 따라 기존에 이미 가독성이 분류된 문장/문단들을 일 실시예에 따른 가독성 분류 시스템을 통해 재분류함으로써 분류 정확도를 높이고, 작성자의 언어 구사 수준을 정확하게 평가할 수 있을 뿐만 아니라 구조적 또는 어휘적인 특징들을 구체적으로 판단할 수 있다.
또한, 교육환경에서 교과서나 문제지 작성 시 수준별 분류하는 작업을 수동으로 작업했기 때문에 시간이 오래 소요되었던 기존 환경을 자동화함으로써 분류 시간의 소요를 획기적으로 감소시킬 수 있는 효과가 있다.
도 1은 일 실시예에 따른 가독성 분류 시스템의 구성을 설명하기 위한 블록도이다.
도 2는 일 실시예에 따른 문장 구조 점수 평가 모듈을 설명하기 위한 블록도이다.
도 3은 일 실시예에 따른 가독성 분류 시스템에서 문장의 특징을 활용한 문장 가독성을 측정 및 분류하는 방법을 설명하기 위한 도면이다.
도 4는 일 실시예에 따른 가독성 분류 시스템에서 문단의 특징을 활용한 문단 가독성을 측정 및 분류하는 방법을 설명하기 위한 도면이다.
도 5 및 도 6는 일 실시예에 따른 가독성 분류 시스템에서 문장 패턴화를 수행한 것을 나타낸 예이다.
도 7 내지 도 10은 일 실시예에 따른 가독성 분류 시스템에서 문장의 특징을 활용한 가독성 분류 결과를 나타낸 예이다.
도 11 내지 도 14는 일 실시예에 따른 가독성 분류 시스템에서 문단의 특징을 활용한 가독성 분류 결과를 나타낸 예이다.
도 15는 일 실시예에 따른 가독성 분류 시스템에서 문장의 특징을 활용한 문장 가독성을 측정 및 분류하는 방법을 설명하기 위한 흐름도이다.
도 16은 일 실시예에 따른 가독성 분류 시스템에서 문단의 특징을 활용한 문단 가독성을 측정 및 분류하는 방법을 설명하기 위한 흐름도이다.
이하, 실시예를 첨부한 도면을 참조하여 상세히 설명한다.
도 1은 일 실시예에 따른 가독성 분류 시스템의 구성을 설명하기 위한 블록도이다.
가독성 분류 시스템은 문장, 길이 단어 수 등과 같은 문장 구조 요소의 기본 개별 특징 값뿐만 아니라 문장 전체의 구조의 패턴을 활용하여 점수화한 값, 어휘 점수 등과 같은 문장의 구조적/어휘적 특성을 추출하기 위한 것이다. 이러한 문장의 구조적/어휘적 특성을 활용함으로써 비교적 높은 수준의 문장/문단 가독성 분류 서비스를 제공하고자 한다.
가독성 분류 시스템은 문장이 트리 패턴 표현식 기반 매칭 기법 및 자연어 처리 기법을 활용하여 추출된 문장/문단의 특징에 기반하여 기계 학습 기법 및 인공신경망을 적용하여 문장/문단의 수진 및 가독성을 분류하는 서비스를 제공할 수 있다.
문장 특징 추출 모듈(120)은 문장이 입력(110)됨에 따라 문장으로부터 문장 분류 결과 데이터베이스(111)에 기반하여 정의된 문장의 특징을 추출할 수 있다. 문장 특징 추출 모듈(120)은 문장의 구조적 특징을 추출하기 위한 문장의 구조적 특징 추출 모듈(122) 및 문장의 어휘적 특징을 추출하기 위한 문장의 어휘적 특징 추출 모듈(123)을 포함할 수 있다.
표 1은 문장의 구조적 및 어휘적 특징의 예를 나타낸 것이다.
Figure 112016116649266-pat00001
문장의 구조적 특징 추출 모듈(122)은 문장의 전체 길이, 문장에서 사용된 단어의 개수, 문장의 문형 점수, 문장에서 사용된 형용사구의 개수, 문장에서 사용된 부사구의 개수, 문장에서 사용된 수식어의 개수, 문장에서 사용된 단어들의 평균 글자 수, 문장에서 사용된 단어들의 평균 음절 수, 문장의 구조 점수, 문장에서 사용된 등위접속사의 개수, 문장에서 사용된 종속절의 개수, 문장에서 사용된 합성명사의 개수, 문장에서 사용된 구성 성분간의 문법적 관계 개수 중 적어도 하나의 문장의 구조적 특징을 포함하는 문장의 구조적 특징을 추출할 수 있다. 또한, 문장의 구조적 특징 추출 모듈(120)은 문장에서 사용된 수식어 개수/문장에서 사용된 총 단어의 개수를 계산한 형용사구의 다양성, 문장에서 사용된 부사구 개수/문장에서 사용된 총 단어의 개수를 계산한 부사구의 다양성, 문장에서 사용된 형용사구의 개수/문장에서 사용된 총 단어의 개수를 계산한 수식어의 다양성, 문장에서 사용된 구성 성분간의 문법적 관계의 평균 거리를 의미하는 GR의 평균 거리, 문장에서 사용된 구성 성분간의 문법적 관계의 최대 거리를 의미하는 GR 최대 거리를 더 포함할 수도 있다. 이외에서 문장 특징 추출 모듈(120)은 문장의 구조적 특징 및 문장의 어휘적 특징에 대한 요소를 추가 및 변경할 수도 있다.
문장의 어휘적 특징 추출 모듈(123)은 Collins 단어 사전에 기록된 단어의 빈도 점수를 활용한 상기 문장에서의 어휘 점수 또는 아카데믹 워드 리스트(AWL: Academic Word List)에 저장된 단어의 점수 합 중 적어도 하나의 문장의 어휘적 특징을 포함하는 문장의 어휘적 특징을 추출할 수 있다.
문장 특징 추출 모듈(120)은 문장의 특징 중 파스 트리와 트리 패턴 표현식 기반의 매칭 기법을 통하여 평가를 수행하는 문장 구조 점수 평가 모듈을 더 포함할 수 있다. 이때, 파스 트리는 입력된 올바른 문장에 대하여 상기 문장의 구조를 트리 구조로 표현한 것을 의미한다. 트리 패턴 표현식(TPE: Tree Pattern Expression)은 고유하게 정의한 TPE 규칙을 사용하여 트리 구조의 패턴을 효율적으로 매칭하기 위한 문장 구조의 표현식이다. 트리 표현식 기반 매칭 기법은 사전에 구축된 파스 트리 데이터베이스에서 패턴과 매칭되는 구조를 후위 순위를 사용한 동적 프로그래밍을 통해 탐색하는 매칭 기법이다.
문장 구조 점수 평가 모듈(121)은 문장의 패턴화를 통해 생성된 패턴과 기 분류된 파스 트리 데이터베이스간의 트리 패턴 표현식 기반 매칭을 통하여 획득된 매칭 정보 결과를 이용하여 문장의 구조 점수를 평가할 수 있다. 도 2를 참고하면, 문장 구조 점수 평가 모듈(121)을 설명하기 위한 것이다. 문장 구조 점수 평가 모듈(121)은 입력 문장 패턴화 모듈(210), 트리 패턴 표현식 기반 매칭 모듈(220) 및 매칭 결과 기반 문장구조 점수화 모듈(230)을 포함할 수 있다.
입력 문장 패턴화 모듈(210), 문장이 입력됨에 따른 입력 문장을 트리 패턴 표현식 매칭에 적용 가능한 파스 트리 구조의 패턴으로 패턴화시키는 모듈로서, 파스 트리 구축, 품사 태그 원형화, 단말 노드 가지치기(Pruning)하는 과정을 수행할 수 있다. 도 5 및 도 6을 참고하면, 예를 들면, 사용자가 "Kate is from London"을 입력했을 때 구조 점수를 평가하는 순서를 설명하기 위한 것으로, 문장 패턴화를 수행한 것을 나타낸 예이다. 도 5는 파스 트리를 구축하고, 품사 태그를 원형화한 후 푸르닝을 수행한 것을 나타낸 것이다.
트리 패턴 표현식 기반 매칭 모듈(220)은 입력 문장의 패턴과 파스 트리 데이터베이스에 저장된 문장들의 파스 트리를 트리 패턴 표현식(TPE:Tree Pattern Expression) 매칭을 통해 매칭시키고, 매칭된 매칭 결과에 기초하여 문장의 구조 점수를 획득할 수 있다. 도 6을 참고하면, 파스 트리 패턴 표현식 매칭을 수행한 예를 나타낸 것으로 노드의 동일한 번호끼리 매칭될 수 있다.
매칭 결과 기반 문장구조 점수화 모듈(230)은 매칭 결과를 이용하여 매칭된 문장들에 대하여 문장들의 수준간의 평균 및 분산을 활용하여 문장의 구조 점수를 측정하는 매칭 결과 기반 문장구조 점수화 모듈(230)을 포함할 수 있다. 문장 특징 추출 모듈은 문장의 구조 점수를 측정함으로써 문장의 구조 점수에 대한 결과를 획득하게 된다.
문장 가독성 분류 모듈(130)은 추출된 문장의 특징에 기초하여 문장의 수준과 문장의 가독성을 측정 및 분류할 수 있다. 문장 가독성 분류 모듈(130)은 추출된 문장의 특징을 인공 신경망, 서포트 벡터 머신(SVM), 나이브 베이지안 중 적어도 하나에 기초하여 학습시킨 후 문장의 특징에 따라 문장의 수준 및 가독성을 평가 및 분류할 수 있다.
문단 특징 추출 모듈(160)은 문단이 입력(150)됨을 수신함에 따라 문단으로부터 문단 부류 결과 데이터베이스(151)에 기반하여 문단을 문장 단위로 파싱하여 정의된 문장들의 특징을 결합함으로써 문단의 특징을 추출할 수 있다.
표 2는 문단의 특징을 나타낸 예이다.
Figure 112016116649266-pat00002
문단 특징 추출 모듈(160)은 문단의 구조적 특징 및 문단의 어휘적 특징을 추출할 수 있다. 문단 특징 추출 모듈(160)은 문단의 전체 길이, 문단에서 사용된 단어의 개수, 문단에서 사용된 문장들의 문형 점수 평균, 문단에서 사용된 형용사구의 개수, 문단에서 사용된 부사구의 개수, 문단에서 사용된 수식어의 개수, 문단에서 사용된 단어들의 평균 글자수, 문단에서 사용된 단어들의 평균 음절수, 문단에서 사용된 트리 패턴 표현식 기반의 문장 구조 점수 평균, 문단에서 사용된 등위접속사의 개수, 문단에서 사용된 종속절의 개수, 문단에서 사용된 합성명사의 개수, 문단에서 사용된 구성 성분간의 문법적 관계 개수 중 적어도 하나의 문단 구조적 특징을 포함할 수 있다. 문단 특징 추출 모듈(160)은 문단에서 사용된 수식어 개수/문단에서 사용된 총 단어의 개수를 계산한 문단 형용사구의 다양성, 문단에서 사용된 부사구 개수/문단에서 사용된 총 단어의 개수를 계산한 문단 부사구의 다양성, 문단에서 사용된 형용사구의 개수/문장에서 사용된 총 단어의 개수를 계산한 문단 수식어의 다양성, 문단에서 사용된 구성 성분간의 문법적 관계의 평균 거리를 의미하는 문단 GR의 평균 거리, 문단에서 사용된 구성 성분간의 문법적 관계의 최대 거리를 의미하는 문단 GR 최대 거리를 더 포함할 수도 있다.
문단 특징 추출 모듈(160)은 Collins 단어 사전에 기록된 단어의 빈도 점수를 활용한 상기 문단에서의 어휘 점수 또는 상기 문단에서 사용된 AWL에 등록된 단어의 점수 합 중 적어도 하나의 상기 문단 어휘적 특징을 포함할 수 있다.
문단 가독성 분류 모듈(170)은 추출된 문단의 특징에 기초하여 문단의 수준과 문단의 가독성을 측정 및 분류할 수 있다. 문단 가독성 분류 모듈(170)은 추출된 문단의 특징을 인공신경망, 서포트 벡터 머신, 나이브 베이지안 중 적어도 하나에 기초하여 학습시킨 후 문단의 특징에 따라 문단의 수준 및 가독성을 평가 및 분류할 수 있다.
일 실시예에 따르면, 초/중/고등학교와 같은 교육 환경에서 사용되는 문장/문단의 가독성을 자동으로 분류할 수 있고, 이에 기반한 전반적인 학업 수준을 평가하는 학업 수준 평가 시스템에 적용될 수 있다.
일 실시예에 따르면, 학습자가 구사하는 문장/문단의 능력 및 수준을 평가, 분류할 수 있고, 이에 기반하여 맞춤형 교과서, 학습지 등의 학습 자료 지원 및 제작이 요구되는 교수-학습 지원 시스템에 적용할 수 있다.
도 15는 일 실시예에 따른 가독성 분류 시스템에서 문장의 특징을 활용한 문장 가독성을 측정 및 분류하는 방법을 설명하기 위한 흐름도이다.
이때, 도 3의 도면을 참고하여, 문장의 특징을 활용한 문장 가독성을 측정 및 분류하는 방법을 설명하기로 한다.
단계(1510)에서 가독성 분류 시스템은 문장 분류 결과 데이터베이스(111)를 유지할 수 있다. 가독성 분류 시스템은 예를 들면, 국외에서 초/중/고등학교에 같은 교육 환경에서 문장 가독성 분류 서비스를 위하여 Weebit 데이터베이스를 구축할 수 있다.
예를 들면, 가독성 분류 시스템은 문장에 대하여 문장 특징 추출 모듈(120)을 통하여 문장에 대하여 문장의 구조적 특징 및 문장의 어휘적 특징을 추출한 후, 추출된 문장의 특징에 대하여 문장 가독성 분류기(130)를 통하여 학습(Training)시킬 수 있다. 가독성 분류 시스템은 학습된 데이터를 문장 분류 결과 데이터베이스(111)에 저장하고 있을 수 있다.
단계(1520)에서 가독성 분류 시스템은 문장이 입력(110)됨을 수신할 수 있다. 이때, 입력된 문장을 도 15에서 입력 문장이라고 부르기로 한다.
단계(1530)에서 가독성 분류 시스템은 문장이 입력됨을 수신함에 따른 입력 문장을 문장 분류 결과 데이터베이스에 기반하여 입력 문장의 구조적 및 어휘적 특징을 추출할 수 있다. 예를 들면, 가독성 분류 시스템은 문장 분류 결과 데이터베이스에 저장된 데이터와 입력 문장을 비교함으로써 입력 문장의 구조적 및 어휘적 특징을 추출할 수 있다.
단계(1540)에서 가독성 분류 시스템은 추출된 문장의 특징에 기초하여 문장의 수준과 문장의 가독성을 측정 및 분류할 수 있다. 예를 들면, 가독성 분류 시스템은 추출된 문장의 특징을 인공신경망 분류기(131), 서포트 벡터 머신 분류기(132) 및 나이브 베이지안 분류기(133) 등을 사용하여 학습시킴으로써 문장의 가독성을 측정 및 분류할 수 있다.
단계(1550)에서 가독성 분류 시스템은 측정 및 분류된 문장의 수준과 가독성을 디스플레이하도록 제공할 수 있다. 가독성 분류 시스템은 문장 가독성 분류 결과를 디스플레이에 출력할 수 있다.
도 7 내지 도 10를 참고하면, 일 실시예에 따른 가독성 분류 시스템에서 문장의 특징을 활용한 가독성 분류 결과를 나타낸 예이다. 가독성 분류 시스템은 문장을 입력하도록 사용자 인터페이스(User Interface)를 제공할 수 있다. 사용자는 사용자 인터페이스를 통하여 문장을 입력할 수 있다. 또한, 가독성 분류 시스템은 사용자로부터 입력된 것이 문장인지 문단인지 선택할 수 있도록 인터페이스를 제공할 수 있다. 사용자는 문장을 입력한 후, 'submit'이라는 인터페이스를 선택함으로써 입력된 문장을 가독성 분류 시스템으로 전송할 수 있다. 가독성 분류 시스템은 사용자로부터 입력된 문장을 수신하여 분석할 수 있다.
도 8을 참고하면, 가독성 분류 시스템은 사용자로부터 입력된 문장에 대한 특징을 추출한 후, 추출된 특징에 대한 문장의 가독성을 측정 및 분류할 수 있다. 가독성 분류 시스템은 사용자로부터 입력된 문장의 예상 등급을 통보할 수 있다. 예를 들면, 가독성 분류 시스템은 사용자로부터 입력된 문장의 예상 등급은 '3' 등급입니다. 와 같은 메시지를 출력할 수 있다.
도 9를 참고하면, 가독성 분류 시스템은 문장을 분석한 결과, 예를 들면, 패턴 점수, 단어 개수, 수식어 개수, 문장의 구조 점수, 단어 점수, 평균 단어의 음절수 및 단어당 평균 글자 개수 중 적어도 하나를 제공할 수 있으며, 분석된 결과를 그래프(예를 들면, 방출형 그래프)로 나타낼 수 있다.
도 10을 참고하면, 가독성 분류 시스템은 문장 가독성을 분류한 결과 화면을 나타낸 것이다. 가독성 분류 시스템은 인공신경망 분류기, 서포트 벡터 머신 분류기 및 나이브 베이지안 분류기 각각으로부터 분류된 결과를 제공할 수 있다.
도 16은 일 실시예에 따른 가독성 분류 시스템에서 문단의 특징을 활용한 문단 가독성을 측정 및 분류하는 방법을 설명하기 위한 흐름도이다.
이때, 도 4의 도면을 참고하여, 문단의 특징을 활용한 문단 가독성을 측정 및 분류하는 방법을 설명하기로 한다.
단계(1610)에서 가독성 분류 시스템은 문단 분류 결과 데이터베이스(151)를 유지할 수 있다. 가독성 분류 시스템은 예를 들면, 국외에서 초/중/고등학교에 같은 교육 환경에서 문장 가독성 분류 서비스를 위하여 Weebit 데이터베이스를 구축할 수 있다.
예를 들면, 가독성 분류 시스템은 문장에 대하여 문단 특징 추출 모듈(160)을 통하여 문단에 대하여 문장 파서를 통해 문장 단위로 분할한 후, 생성된 문장들에 대하여 문장의 구조적 및 어휘적 특징을 추출할 수 있다. 가독성 분류 시스템은 추출된 문단의 특징에 대하여 문단 가독성 분류 모듈(170)을 통하여 학습(Training)시킬 수 있다. 가독성 분류 시스템은 학습된 데이터를 문장 분류 결과 데이터베이스(111)에 저장하고 있을 수 있다.
단계(1620)에서 가독성 분류 시스템은 문단이 입력됨을 수신할 수 있다. 이때, 입력된 문단을 도 16에서 입력 문단이라고 부르기로 한다.
단계(1630)에서 가독성 분류 시스템은 문단이 입력됨을 수신함에 따른 입력 문단을 문단 분류 결과 데이터베이스에 기반하여 입력 문단을 문장 단위로 파싱하여 정의된 문장들의 특징을 결합함으로써 문단의 특징을 추출할 수 있다. 이때, 입력 문단은 문장 파서를 통하여 문장 단위로 분할함에 따라 생성된 문장들에 대하여 문장 특징 추출 모듈을 통해 추출된 문장의 특징을 결합함으로써 입력 문단의 특징이 추출될 수 있다.
단계(1640)에서 가독성 분류 시스템은 추출된 문단의 특징에 기초하여 문단의 수준과 문단의 가독성을 측정 및 분류할 수 있다. 예를 들면, 가독성 분류 시스템은 추출된 문단의 특징을 인공신경망 분류기(131), 서포트 벡터 머신 분류기(132) 및 나이브 베이지안 분류기(133) 등을 사용하여 학습시킴으로써 문단의 가독성을 측정 및 분류할 수 있다.
단계(1650)에서 가독성 분류 시스템은 측정 및 분류된 문단의 수준과 가독성을 디스플레이하도록 제공할 수 있다. 가독성 분류 시스템은 문단 가독성 분류 결과를 디스플레이에 출력할 수 있다.
도 11 내지 도 14를 참고하면, 일 실시예에 따른 가독성 분류 시스템에서 문단의 특징을 활용한 가독성 분류 결과를 나타낸 예이다. 도 11을 참고하면, 가독성 분류 시스템은 문단을 입력하도록 사용자 인터페이스(User Interface)를 제공할 수 있다. 사용자는 사용자 인터페이스를 통하여 문장을 입력할 수 있다. 또한, 가독성 분류 시스템은 사용자로부터 입력된 것이 문장인지 문단인지 선택할 수 있도록 인터페이스를 제공할 수 있다. 사용자는 문단을 입력한 후, 'submit'이라는 인터페이스를 선택함으로써 입력된 문단을 가독성 분류 시스템으로 전송할 수 있다. 가독성 분류 시스템은 사용자로부터 입력된 문단을 수신하여 분석할 수 있다.
도 12를 참고하면, 가독성 분류 시스템은 사용자로부터 입력된 문단에 대한 특징을 추출한 후, 추출된 특징에 대한 문단의 가독성을 측정 및 분류할 수 있다. 가독성 분류 시스템은 사용자로부터 입력된 문단의 예상 등급을 통보할 수 있다.
도 13을 참고하면, 가독성 분류 시스템은 문단을 분석한 결과, 예를 들면, 문장 개수, 전체 문장 길이, 전체 단어 개수, 수식어 전체 개수, 문장 구조 점수, 단어 점수, 문단 유사 단어 사용비율, 문단 가독성 점수 중 적어도 하나를 제공할 수 있으며, 분석된 결과를 그래프(예를 들면, 방출형 그래프)로 나타낼 수 있다.
도 14를 참고하면, 가독성 분류 시스템은 문단 가독성을 분류한 결과 화면을 나타낸 것이다. 가독성 분류 시스템은 인공신경망 분류기, 서포트 벡터 머신 분류기 및 나이브 베이지안 분류기 각각으로부터 분류된 결과를 제공할 수 있다.
일 실시예에 따르면, 국내 초/중/고등학교와 같은 교육 환경에서의 단순 학업 수준 평가 시스템, 교수-학습 지원 시스템뿐만 아리아 향후 과제물 자동 채점, 맞춤형 도서 추천 등의 학습 독려를 위한 능동적인 교육 환경을 위하여 활용될 수 있다.
또한, HRI(인간-로봇 상호작용)에서 로봇이 인간의 언어를 이해하기 위하여 문장/문단의 수준 및 가독성별로 분류하여 로봇 혹은 인간의 지식 수준에 적합한 학습을 통한 맞춤형 로봇 지식 서비스 수행 시 효과적으로 활용될 수 있다.
이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.
이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.

Claims (8)

  1. 가독성 분류 시스템에 있어서,
    문장이 입력됨을 수신함에 따라 상기 문장으로부터 문장 분류 결과 데이터베이스에 기반하여 문장의 특징을 추출하는 문장 특징 추출 모듈;
    문단이 입력됨을 수신함에 따라 상기 문단으로부터 문단 분류 결과 데이터베이스에 기반하여 문단의 특징을 추출하는 문단 특징 추출 모듈-상기 문단은 문장 파서를 통하여 문장 단위로 분할함에 따라 생성된 문장들에 대하여 상기 문장 특징 추출 모듈을 통해 추출된 문장의 특징을 결합함으로써 상기 문단의 특징이 추출됨-;
    상기 추출된 문장의 특징에 기초하여 상기 문장의 수준과 상기 문장의 가독성을 측정 및 분류하는 문장 가독성 분류 모듈; 및
    상기 추출된 문단의 특징에 기초하여 상기 문단의 수준과 상기 문단의 가독성을 측정 및 분류하는 문단 가독성 분류 모듈
    을 포함하고,
    상기 가독성 분류 시스템은, 상기 측정 및 분류된 문장 또는 문단의 수준과 가독성을 디스플레이하도록 제공하는 것을 포함하고,
    상기 문장 특징 추출 모듈은,
    상기 문장의 구조적 특징을 추출하는 문장의 구조적 특징 추출 모듈;
    상기 문장의 어휘적 특징을 추출하는 문장의 어휘적 특징 추출 모듈; 및
    상기 문장의 구조 점수를 산출하기 위하여 상기 문장에 대한 파스트리와 트리 패턴 표현식 기반 매칭 기법을 수행하는 문장 평가 모듈
    을 포함하고,
    상기 문장 평가 모듈은,
    문장이 입력됨에 따른 입력 문장을 트리 패턴 표현식 매칭에 적용 가능한 파스 트리 구조의 패턴으로 패턴화시키는 입력 문장 패턴화 모듈;
    상기 입력 문장의 패턴과 파스 트리 데이터베이스에 저장된 문장들의 파스 트리를 트리 패턴 표현식(TPE:Tree Pattern Expression) 매칭을 통해 매칭시키고, 상기 매칭된 매칭 결과에 기초하여 문장의 구조 점수를 획득하는 트리 패턴 표현식 기반 매칭 모듈; 및
    상기 매칭 결과를 이용하여 매칭된 문장들에 대하여 상기 문장들의 수준간의 평균 및 분산을 활용하여 상기 문장의 구조 점수를 측정하는 매칭 결과 기반 문장구조 점수화 모듈
    을 포함하고,
    상기 문장 가독성 분류 모듈은,
    상기 추출된 문장의 특징을 인공 신경망, 서포트 벡터 머신(SVM), 나이브 베이지안 중 적어도 하나에 기초하여 학습시킨 후 상기 문장의 특징에 따라 상기 문장의 수준 및 가독성을 평가 및 분류하고,
    상기 문단 가독성 분류 모듈은,
    상기 추출된 문단의 특징을 인공신경망, 서포트 벡터 머신, 나이브 베이지안 중 적어도 하나에 기초하여 학습시킨 후 상기 문단의 특징에 따라 상기 문단의 수준 및 가독성을 평가 및 분류하는
    가독성 분류 시스템.
  2. 제1항에 있어서,
    상기 문장 특징 추출 모듈은,
    상기 문장의 전체 길이, 상기 문장에서 사용된 단어의 개수, 문장의 문형 점수, 상기 문장에서 사용된 형용사구의 개수, 상기 문장에서 사용된 부사구의 개수, 상기 문장에서 사용된 수식어의 개수, 상기 문장에서 사용된 단어들의 평균 글자 수, 상기 문장에서 사용된 단어들의 평균 음절 수, 상기 문장의 구조 점수, 상기 문장에서 사용된 등위접속사의 개수, 상기 문장에서 사용된 종속절의 개수, 상기 문장에서 사용된 합성명사의 개수, 상기 문장에서 사용된 구성 성분간의 문법적 관계 개수 중 적어도 하나의 문장의 구조적 특징을 포함하는 문장의 구조적 특징 모듈; 및
    Collins 단어 사전에 기록된 단어의 빈도 점수를 활용한 상기 문장에서의 어휘 점수 또는 아카데믹 워드 리스트(AWL: Academic Word List)에 저장된 단어의 점수 합 중 적어도 하나의 문장의 어휘적 특징을 포함하는 문장의 어휘적 특징 모듈
    을 포함하는 가독성 분류 시스템.
  3. 삭제
  4. 삭제
  5. 제1항에 있어서,
    상기 문단 특징 추출 모듈은,
    상기 문단의 전체 길이, 상기 문단에서 사용된 단어의 개수, 상기 문단에서 사용된 문장들의 문형 점수 평균, 상기 문단에서 사용된 형용사구의 개수, 상기 문단에서 사용된 부사구의 개수, 상기 문단에서 사용된 수식어의 개수, 상기 문단에서 사용된 단어들의 평균 글자수, 상기 문단에서 사용된 단어들의 평균 음절수, 상기 문단에서 사용된 트리 패턴 표현식 기반의 문장 구조 점수 평균, 상기 문단에서 사용된 등위접속사의 개수, 상기 문단에서 사용된 종속절의 개수, 상기 문단에서 사용된 합성명사의 개수, 상기 문단에서 사용된 구성 성분간의 문법적 관계 개수 중 적어도 하나의 문단 구조적 특징을 포함하고,
    Collins 단어 사전에 기록된 단어의 빈도 점수를 활용한 상기 문단에서의 어휘 점수 또는 상기 문단에서 사용된 AWL에 등록된 단어의 점수 합 중 적어도 하나의 문단 어휘적 특징을 포함하는 가독성 분류 시스템.
  6. 삭제
  7. 가독성 분류 방법에 있어서,
    문장 분류 결과 데이터베이스 및 문단 분류 결과 데이터베이스를 유지하는 단계;
    문장 또는 문단이 입력됨을 수신하는 단계;
    상기 문장이 입력됨을 수신함에 따른 입력 문장을 상기 문장 분류 결과 데이터베이스에 기반하여 상기 입력 문장의 구조적 및 어휘적 특징을 추출하는 단계;
    상기 문단이 입력됨을 수신함에 따른 입력 문단을 상기 문단 분류 결과 데이터베이스에 기반하여 상기 입력 문단의 특징을 추출하는 단계-상기 입력 문단은 문장 파서를 통하여 문장 단위로 분할함에 따라 생성된 문장들에 대하여 기 추출된 문장의 특징을 결합함으로써 상기 입력 문단의 특징이 추출됨-;
    상기 추출된 문장 또는 문단의 특징에 기초하여 상기 문장 또는 문단의 수준과 상기 문장 또는 문단의 가독성을 측정 및 분류하는 단계; 및
    상기 측정 및 분류된 문장 또는 문단의 수준과 가독성을 디스플레이하도록 제공하는 단계
    를 포함하고,
    상기 입력 문장의 구조적 및 어휘적 특징을 추출하는 단계는,
    상기 문장의 구조 점수를 산출하기 위하여 상기 문장에 대한 파스트리와 트리 패턴 표현식 기반 매칭 기법을 수행하여 문장을 평가하는 단계
    를 포함하고,
    상기 문장을 평가하는 단계는,
    문장이 입력됨에 따른 입력 문장을 트리 패턴 표현식 매칭에 적용 가능한 파스 트리 구조의 패턴으로 패턴화시키고, 상기 입력 문장의 패턴과 파스 트리 데이터베이스에 저장된 문장들의 파스 트리를 트리 패턴 표현식(TPE:Tree Pattern Expression) 매칭을 통해 매칭시키고, 상기 매칭된 매칭 결과에 기초하여 문장의 구조 점수를 획득하고, 상기 매칭 결과를 이용하여 매칭된 문장들에 대하여 상기 문장들의 수준간의 평균 및 분산을 활용하여 상기 문장의 구조 점수를 측정하는 단계를 포함하고,
    상기 문장 또는 문단의 수준과 상기 문장 또는 문단의 가독성을 측정 및 분류하는 단계는,
    상기 추출된 문장의 특징을 인공 신경망, 서포트 벡터 머신(SVM), 나이브 베이지안 중 적어도 하나에 기초하여 학습시킨 후 상기 문장의 특징에 따라 상기 문장의 수준 및 가독성을 평가 및 분류하고, 상기 추출된 문단의 특징을 인공신경망, 서포트 벡터 머신, 나이브 베이지안 중 적어도 하나에 기초하여 학습시킨 후 상기 문단의 특징에 따라 상기 문단의 수준 및 가독성을 평가 및 분류하는 단계
    를 포함하는 가독성 분류 방법.
  8. 삭제
KR1020160159834A 2016-11-29 2016-11-29 인간-로봇 상호작용을 위한 교육 환경에서의 자연어 문장/문단 가독성 분류 방법 및 시스템 KR101882585B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020160159834A KR101882585B1 (ko) 2016-11-29 2016-11-29 인간-로봇 상호작용을 위한 교육 환경에서의 자연어 문장/문단 가독성 분류 방법 및 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160159834A KR101882585B1 (ko) 2016-11-29 2016-11-29 인간-로봇 상호작용을 위한 교육 환경에서의 자연어 문장/문단 가독성 분류 방법 및 시스템

Publications (2)

Publication Number Publication Date
KR20180060393A KR20180060393A (ko) 2018-06-07
KR101882585B1 true KR101882585B1 (ko) 2018-07-26

Family

ID=62621505

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160159834A KR101882585B1 (ko) 2016-11-29 2016-11-29 인간-로봇 상호작용을 위한 교육 환경에서의 자연어 문장/문단 가독성 분류 방법 및 시스템

Country Status (1)

Country Link
KR (1) KR101882585B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220073067A (ko) 2020-11-26 2022-06-03 주식회사 제페토로보틱스 교육용 로봇의 동작보정 시스템 및 동작보정 방법

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110008332B (zh) * 2019-02-13 2020-11-10 创新先进技术有限公司 通过强化学习提取主干词的方法及装置
KR102309633B1 (ko) * 2020-12-30 2021-10-07 한국교육방송공사 양적/질적 평가에 기반한 독서 교육을 위한 컴퓨터 프로그램, 그러한 방법 및 이를 위한 컴퓨터 시스템

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012230652A (ja) * 2011-04-27 2012-11-22 Isuzu Motors Ltd 可読性評価方法、可読性評価装置及び可読性評価プログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101241330B1 (ko) * 2010-11-17 2013-03-11 한국과학기술정보연구원 술어-논항구조 기반의 관계 식별 방법 및 장치

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012230652A (ja) * 2011-04-27 2012-11-22 Isuzu Motors Ltd 可読性評価方法、可読性評価装置及び可読性評価プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220073067A (ko) 2020-11-26 2022-06-03 주식회사 제페토로보틱스 교육용 로봇의 동작보정 시스템 및 동작보정 방법

Also Published As

Publication number Publication date
KR20180060393A (ko) 2018-06-07

Similar Documents

Publication Publication Date Title
Cer et al. Parsing to Stanford Dependencies: Trade-offs between Speed and Accuracy.
Ramalingam et al. Automated essay grading using machine learning algorithm
TWI608367B (zh) 中文文本可讀性計量系統及其方法
US9646512B2 (en) System and method for automated teaching of languages based on frequency of syntactic models
Chang et al. Research on detection methods based on Doc2vec abnormal comments
CN111666409B (zh) 一种基于综合深度胶囊网络的复杂评论文本的整体情感智能分类方法
US9443193B2 (en) Systems and methods for generating automated evaluation models
US20180102062A1 (en) Learning Map Methods and Systems
US9652991B2 (en) Systems and methods for content scoring of spoken responses
US11126783B2 (en) Output apparatus and non-transitory computer readable medium
CN108319734A (zh) 一种基于线性组合器的产品特征结构树自动构建方法
KR101882585B1 (ko) 인간-로봇 상호작용을 위한 교육 환경에서의 자연어 문장/문단 가독성 분류 방법 및 시스템
JP2018045062A (ja) 学習者の口述音声から自動的に採点するプログラム、装置及び方法
KR20180094664A (ko) 텍스트 데이터로부터 정보를 추출하기 위한 정보 추출 방법 및 장치
Nassiri et al. Arabic readability assessment for foreign language learners
Gomaa et al. Arabic short answer scoring with effective feedback for students
US10867525B1 (en) Systems and methods for generating recitation items
CN114037545A (zh) 客户推荐方法、装置、设备及存储介质
US12020593B2 (en) Automated evaluation of free-form answers and generation of actionable feedback to multidimensional reasoning questions
Taghipour Robust trait-specific essay scoring using neural networks and density estimators
Etxeberria et al. Learning to map variation-standard forms in Basque using a limited parallel corpus and the standard morphology
Jimenez et al. SOFTCARDINALITY: Learning to identify directional cross-lingual entailment from cardinalities and SMT
KR102188553B1 (ko) 애니메이션 기반의 스토리텔링을 통한 한글 교육 시스템
Pacol Sentiment Analysis of Students’ Feedback on Faculty Online Teaching Performance Using Machine Learning Techniques
Proença et al. Automatic Evaluation of Children Reading Aloud on Sentences and Pseudowords.

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right