KR102251693B1 - 학습 데이터 분석장치 및 이를 이용한 학습 지원방법 - Google Patents

학습 데이터 분석장치 및 이를 이용한 학습 지원방법 Download PDF

Info

Publication number
KR102251693B1
KR102251693B1 KR1020190094697A KR20190094697A KR102251693B1 KR 102251693 B1 KR102251693 B1 KR 102251693B1 KR 1020190094697 A KR1020190094697 A KR 1020190094697A KR 20190094697 A KR20190094697 A KR 20190094697A KR 102251693 B1 KR102251693 B1 KR 102251693B1
Authority
KR
South Korea
Prior art keywords
learning
data
user
unit
analysis
Prior art date
Application number
KR1020190094697A
Other languages
English (en)
Other versions
KR20210016667A (ko
Inventor
이권우
정경훈
Original Assignee
엔터씨스 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엔터씨스 주식회사 filed Critical 엔터씨스 주식회사
Priority to KR1020190094697A priority Critical patent/KR102251693B1/ko
Publication of KR20210016667A publication Critical patent/KR20210016667A/ko
Application granted granted Critical
Publication of KR102251693B1 publication Critical patent/KR102251693B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/042Knowledge-based neural networks; Logical representations of neural networks
    • G06N3/0427
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming

Abstract

학습 데이터 분석장치 및 이를 이용한 학습 지원방법이 개시된다. 보다 상세하게는 사용자의 학습 계획에 따른 과정 데이터와 학습 실천에 따른 결과 데이터를 포함한 학습 데이터를 획득하고 획득된 학습 데이터를 대상으로 유전자 염기서열 분석방법을 활용하여 사용자의 학습패턴 및 학습효율을 분석한 후 분석결과를 기초로 하여 효율적인 학습방법을 제공함에 따라 사용자의 학습을 지원한다.

Description

학습 데이터 분석장치 및 이를 이용한 학습 지원방법 {Study data analysis apparatus and method for supporting study using the apparatus }
본 발명은 데이터 분석 기술에 관한 것으로, 보다 상세하게는 사용자의 학습 데이터를 수집 및 분석하여 학습방법을 제시함에 따라 사용자의 학습을 지원하는 기술에 관한 것이다.
학습방법은 학교나 학원에서 학습하거나 학습자가 혼자 교재 등을 통해 학습하는 방법이 일반적이다. 학습자가 끊임없이 단순반복을 요구하는 학습방식은 학습자가 쉽게 싫증을 느끼므로 학습에 흥미를 잃고 학습을 자발적으로 수행하지 않게 된다. 자가학습을 하는 경우 학습내용이 어려우면 진도를 나갈 수 없게 되어 많은 심적 부담을 느끼게 되면서 몰입하지 못하여 학습을 중단하게 되는 사례가 많다. 또한 자가학습 시 학습관리 및 피드백이 제대로 이루어지지 않으며, 학습 효과에 대한 정확한 측정 및 학습향상 정도 등을 확인할 수 없다. 전술한 이유로 학습효과를 기대하기 어렵다.
대한민국 등록특허공보 10-1508117호(2015년 03월27일 등록)
일 실시 예에 따라, 사용자의 학습 데이터 분석을 기반으로 성적 향상을 위한 효율적인 학습방법을 제시함에 따라 사용자의 학습 동기와 의욕을 유발시키고 학습계획을 수립하며 학습목표까지 달성할 수 있도록 하는 학습 데이터 분석장치 및 이를 이용한 학습 지원방법을 제안한다.
일 실시 예에 따른 학습 데이터 분석장치는, 사용자의 학습 계획에 따른 과정 데이터와 학습 실천에 따른 결과 데이터를 포함한 학습 데이터를 획득하는 데이터 획득부와, 획득된 학습 데이터로부터 유전자 염기서열 분석 시 사용되는 시퀀스 데이터를 생성하여 가공하는 데이터 처리부와, 가공된 데이터 간 유사도에 기반하여 사용자 군집을 분류한 후 군집 분석을 수행하는 데이터 분석부와, 군집분석 결과를 기초로 하여 학습방법을 제공하는 서비스 제공부를 포함한다.
과정 데이터는 미리 설정된 기간 내에서 미리 설정된 시간 단위를 기준으로 학습과목 별로 절대 공부 시간을 포함하는 정량 데이터와 공부 시간대를 포함하는 정성 데이터를 포함하고, 과 데이터는 학습 전후의 점수 데이터를 포함할 수 있다.
데이터 처리부는, 과정 데이터로부터 시퀀스 데이터를 생성하는 시퀀스 생성부와, 시퀀스 데이터를 위치 빈도 행렬로 변환하는 제1 데이터 변환부와, 변환된 위치 빈도 행렬을 위치 가중치 행렬로 변환하는 제2 데이터 변환부를 포함할 수 있다.
시퀀스 생성부는 사용자를 전사인자(TF)로 설정하고 학습과목을 염기(A, T, G, C)로 설정한 후 시간에 따라 사용자가 학습한 과목들을 나열한 염기 서열 시퀀스를 생성하며, 생성된 염기 서열 시퀀스 하나를 공부 패턴으로 설정할 수 있다.
데이터 분석부는, 시퀀스 데이터를 가공한 데이터 간 유사도를 계산하는 유사도 계산부와, 계산된 유사도에 따라 데이터를 군집화하여 학습 패턴을 분류하는 군집화부와, 군집 간 및 군집 내 사용자들의 학습 패턴을 비교 분석하는 군집 분석부를 포함할 수 있다.
군집 분석부는 군집 간 및 군집 내 사용자들의 학습 데이터로부터 투자 시간 대비 점수 상승률을 포함한 학습 효율을 계산하여 계산된 학습 효율을 비교 분석할 수 있다.
서비스 제공부는, 군집 간 비교 분석 결과에 따라 군집들 중에 효율 향상을 위한 군집의 학습 패턴으로 교정하도록 유도하거나 군집 내 비교 분석 결과에 따라 효율 향상을 위한 사용자의 학습 패턴으로 교정하도록 유도하는 학습 교정부와, 사용자들로부터 축적된 데이터를 이용하여 소정 사용자를 대상으로 현재 점수에서 목표 점수로 상승하기 위한 과목 별 절대시간 및 학습 패턴을 포함한 학습계획을 제시하는 학습계획 수립부를 포함할 수 있다.
다른 실시 예에 따른 학습 지원방법은, 사용자의 학습 계획에 따른 과정 데이터와 학습 실천에 따른 결과 데이터를 포함한 학습 데이터를 획득하는 단계와, 획득된 학습 데이터로부터 유전자 염기서열 분석 시 사용되는 시퀀스 데이터를 생성하여 이를 행렬화하는 단계와, 행렬화된 데이터 간 유사도를 계산하는 단계와, 계산된 유사도에 따라 데이터를 군집화하여 학습 패턴을 분류하는 단계와, 군집 간 및 군집 내 사용자들의 학습 패턴을 비교 분석하는 단계와, 군집분석 결과를 기초로 하여 학습방법을 제공하는 단계를 포함한다.
시퀀스 데이터를 생성하여 이를 행렬화하는 단계는, 사용자를 전사인자(TF)로 설정하고 학습과목을 염기(A, T, G, C)로 설정한 후 시간에 따라 사용자가 학습한 과목들을 나열한 염기 서열 시퀀스를 생성하는 단계와, 생성된 시퀀스 데이터를 위치 빈도 행렬로 변환하는 단계와, 변환된 위치 빈도 행렬을 위치 가중치 행렬로 변환하는 단계를 포함할 수 있다.
분석 결과를 제공하는 단계에서, 군집 간 비교 분석 결과에 따라 군집들 중에 효율 향상을 위한 군집의 학습 패턴으로 교정하도록 유도하거나 군집 내 비교 분석 결과에 따라 효율 향상을 위한 사용자의 학습 패턴으로 교정하도록 유도할 수 있다.
분석 결과를 제공하는 단계에서, 사용자들로부터 축적된 데이터를 이용하여 소정 사용자를 대상으로 현재 점수에서 목표 점수로 상승하기 위한 과목 별 절대시간 및 학습 패턴을 포함한 학습계획을 제시할 수 있다.
이상에서 설명한 바와 같이, 본 발명은, 사용자의 학습 데이터 분석을 통해 학습 효율 및 학습 패턴을 알아내어 사용자에 가장 효율적인 학습방법을 제시함에 따라 사용자의 학습 동기와 의욕을 유발시키고 학습계획을 수립하며 학습목표까지 달성할 수 있다.
또한, 본 발명은, 고효율 학습패턴의 공통점을 파악함에 따라 가장 효율이 높은 군집 또는 사용자의 고효율 학습패턴으로 교정을 유도할 수 있다. 사용자를 대상으로 현재 점수에서 목표 점수로 상승하기 위한 과목 별 절대시간 및 학습 패턴을 포함한 학습계획을 제안함에 따라 계획을 수립하고 목표까지 달성할 수 있어 학습효과가 증대되는 효과가 있다.
도 1은 본 발명의 일 실시 예에 따른 학습 데이터 분석장치의 구성을 도시한 도면,
도 2는 본 발명의 일 실시 예에 따른 도 1의 데이터 처리부의 세부 구성을 도시한 도면,
도 3은 본 발명의 일 실시 예에 따른 도 1의 데이터 분석부의 세부 구성을 도시한 도면,
도 4는 본 발명의 일 실시 예에 따른 도 1의 서비스 제공부의 세부 구성을 도시한 도면,
도 5는 본 발명의 일 실시 예에 따른 유전자 염기서열 분석 시 사용되는 시퀀스 데이터를 도시한 도면,
도 6은 본 발명의 일 실시 예에 따라 수집되는 학습 데이터의 예를 도시한 도면,
도 7은 본 발명의 일 실시 예에 따른 토익의 학습 데이터를 도시한 도면,
도 8은 본 발명의 일 실시 예에 따른 과정 데이터를 가공하는 예를 도시한 도면,
도 9는 본 발명의 일 실시 예에 따른 학습 효율표를 도시한 도면,
도 10은 본 발명의 일 실시 예에 따른 유사도 기반 학습패턴을 군집화된 군집 그래프를 도시한 도면,
도 11은 본 발명의 일 실시 예에 따른 학습시간 당 기대점수를 나타내는 그래프를 도시한 도면,
도 12는 본 발명의 일 실시 예에 따른 학습 지원방법의 흐름을 도시한 도면이다.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시 예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시 예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시 예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 명세서 전체에 걸쳐 동일 참조 부호는 동일 구성 요소를 지칭한다.
본 발명의 실시 예들을 설명함에 있어서 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이며, 후술되는 용어들은 본 발명의 실시 예에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
첨부된 블록도의 각 블록과 흐름도의 각 단계의 조합들은 컴퓨터 프로그램인스트럭션들(실행 엔진)에 의해 수행될 수도 있으며, 이들 컴퓨터 프로그램 인스트럭션들은 범용 컴퓨터, 특수용 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비의 프로세서에 탑재될 수 있으므로, 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비의 프로세서를 통해 수행되는 그 인스트럭션들이 블록도의 각 블록 또는 흐름도의 각 단계에서 설명된 기능들을 수행하는 수단을 생성하게 된다.
이들 컴퓨터 프로그램 인스트럭션들은 특정 방식으로 기능을 구현하기 위해 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비를 지향할 수 있는 컴퓨터 이용가능 또는 컴퓨터 판독 가능 메모리에 저장되는 것도 가능하므로, 그 컴퓨터 이용가능 또는 컴퓨터 판독 가능 메모리에 저장된 인스트럭션들은 블록도의 각 블록 또는 흐름도의 각 단계에서 설명된 기능을 수행하는 인스트럭션 수단을 내포하는 제조 품목을 생산하는 것도 가능하다.
그리고 컴퓨터 프로그램 인스트럭션들은 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비 상에 탑재되는 것도 가능하므로, 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비 상에서 일련의 동작 단계들이 수행되어 컴퓨터로 실행되는 프로세스를 생성해서 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비를 수행하는 인스트럭션들은 블록도의 각 블록 및 흐름도의 각 단계에서 설명되는 기능들을 실행하기 위한 단계들을 제공하는 것도 가능하다.
또한, 각 블록 또는 각 단계는 특정된 논리적 기능들을 실행하기 위한 하나 이상의 실행 가능한 인스트럭션들을 포함하는 모듈, 세그먼트 또는 코드의 일부를 나타낼 수 있으며, 몇 가지 대체 실시 예들에서는 블록들 또는 단계들에서 언급된 기능들이 순서를 벗어나서 발생하는 것도 가능함을 주목해야 한다. 예컨대, 잇달아 도시되어 있는 두 개의 블록들 또는 단계들은 사실 실질적으로 동시에 수행되는 것도 가능하며, 또한 그 블록들 또는 단계들이 필요에 따라 해당하는 기능의 역순으로 수행되는 것도 가능하다.
이하, 첨부 도면을 참조하여 본 발명의 실시 예를 상세하게 설명한다. 그러나 다음에 예시하는 본 발명의 실시 예는 여러 가지 다른 형태로 변형될 수 있으며, 본 발명의 범위가 다음에 상술하는 실시 예에 한정되는 것은 아니다. 본 발명의 실시 예는 이 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 본 발명을 보다 완전하게 설명하기 위하여 제공된다.
도 1은 본 발명의 일 실시 예에 따른 학습 데이터 분석장치의 구성을 도시한 도면이다.
도 1을 참조하면, 학습 데이터 분석장치(1)는 사용자의 학습 데이터를 수집하고 수집된 데이터를 분석하여 효율적인 학습방법을 제시함에 따라 사용자의 학습을 지원하는 장치이다. 학습 지원은 학습 동기와 의욕을 유발시키고 학습계획을 수립하며 학습목표까지 달성할 수 있도록 한다.
학습 데이터 분석장치(1)는 통신망을 통해 사용자의 학습자 디바이스에 서비스를 제공하는 학습 지원서버 형태일 수 있다. 또는 학습자 디바이스에서 적어도 일부의 기능이 필요에 따라 구성될 수 있다. 학습자 디바이스에는 학습자에게 본 발명에 따른 학습 지원 기능을 제공할 수 있도록 이를 지원하는 애플리케이션이 포함되어 있을 수 있다. 이와 같은 애플리케이션은 학습 지원서버 또는 외부의 애플리케이션 배포 서버(미도시됨)로부터 다운로드된 것일 수 있다.
학습 데이터 분석장치(1)는 메모리 수단을 구비하고 프로세서를 탑재하여 연산 능력을 갖춘 디지털기기일 수 있다. 일 실시 예에 따른 프로세서는 데이터 획득부(10), 데이터 처리부(12), 데이터 분석부(14) 및 서비스 제공부(16)를 포함한다.
데이터 획득부(10)는 사용자의 학습 계획에 따른 과정 데이터와 학습 실천에 따른 결과 데이터를 포함하는 학습 데이터를 획득한다. 과정 데이터는 미리 설정된 기간 내에서 미리 설정된 시간 단위를 기준으로 학습과목 별로 절대 공부 시간을 포함하는 정량 데이터와 공부 시간대를 포함하는 정성 데이터를 포함한다. 결과 데이터는 학습 전후의 점수 데이터를 포함한다. 학습 전의 시작 점수와 학습 후의 달성 점수를 고려하기 때문에 사용자의 실제 목표가 되는 점수 상승 중심의 분석이 가능하다. 데이터 획득부(10)를 통해 획득하는 학습 데이터의 예는 도 6을 참조로 하여 후술한다.
데이터 처리부(12)는 데이터 획득부(10)를 통해 획득된 학습 데이터로부터 유전자 염기서열 분석 시 사용되는 시퀀스 데이터를 생성하여 가공한다. 유전자 시퀀스 데이터를 주로 분석하는 생명정보학(Bioinformatics)에서 질적 변수와 양적 변수가 혼합된 데이터 분석 방법론이 발달되어 있다. 생명정보학의 전사인자(Transcription Factor, TF)의 DNA 시퀀스 모티프(DNA sequence motif) 분석에 쓰이는 위치 가중치 행렬(Position Weight Matrix: PWM)은 PSWM (Position-Specific Weight Matrix) 또는 PSSM(Position-Specific Scoring Matrix)으로도 알려진다. 유전자 염기서열 분석 시 사용되는 시퀀스 데이터의 예는 도 5를 참조로 하여 후술한다. 데이터 처리부(12)의 세부 구성은 도 2를 참조로 하여 후술한다.
데이터 분석부(14)는 데이터 처리부(12)에서 가공된 데이터 간 유사도에 기반하여 사용자 군집을 분류한 후 군집 분석을 수행한다. 데이터 분석부(14)는 군집 분석 시에 딥 러닝(deep learning) 또는 기계학습(machine learning) 알고리즘을 통해 분석할 수 있다. 딥 러닝 또는 기계학습 알고리즘에는, K-최근접 이웃(K-Nearest Neighbors: K-NN) 알고리즘, 순환 신경망(Recurrent Neural Network: RNN) 알고리즘, 합성 곱 신경망(Convolutional Neural Network: CNN) 알고리즘 등이 포함될 수 있다. 데이터 분석부(14)의 세부 구성은 도 3을 참조로 하여 후술한다.
서비스 제공부(16)는 데이터 분석부(14)의 데이터 분석결과를 기초로 하여 사용자의 학습패턴을 평가하고 효율적인 학습방법을 제시한다. 서비스 제공부(16)의 세부 구성은 도 4를 참조로 하여 후술한다.
도 2는 본 발명의 일 실시 예에 따른 도 1의 데이터 처리부의 세부 구성을 도시한 도면이다.
도 1 및 도 2를 참조하면, 데이터 처리부(12)는 시퀀스 생성부(120), 제1 데이터 변환부(122) 및 제2 데이터 변환부(124)를 포함한다.
시퀀스 생성부(120)는 학습 데이터 중 과정 데이터로부터 시퀀스 데이터를 생성한다. 시퀀스 생성부(120) 사용자를 전사인자(TF)로 설정하고 학습과목을 염기(A, T, G, C)로 설정한 후 시간에 따라 사용자가 학습한 과목들을 나열한 염기 서열 시퀀스를 생성하며, 생성된 염기 서열 시퀀스 하나를 공부 패턴으로 설정한다.
제1 데이터 변환부(122)는 시퀀스 데이터를 위치 빈도 행렬로 변환한다. 위치 빈도 행렬의 예를 들면, 2주동안 매일 10:00-10:10분 사이에 학습한 과목의 수를 카운팅한 것이다.
제2 데이터 변환부(124)는 제1 데이터 변환부(122)에서 변환된 위치 빈도 행렬을 위치 가중치 행렬로 변환한다. 위치 가중치 행렬은 위치 빈도 행렬의 평균(average)과 임의의 가중치 의사 값(pseudo)과 학습 과목 별 비율(average_prop)를 이용하여 계산할 수 있다.
도 3은 본 발명의 일 실시 예에 따른 도 1의 데이터 분석부의 세부 구성을 도시한 도면이다.
도 1 및 도 3을 참조하면, 데이터 분석부(14)는 유사도 계산부(140), 군집화부(142) 및 군집 분석부(144)를 포함한다.
유사도 계산부(140)는 시퀀스 데이터를 가공한 데이터 간 유사도를 계산한다. 예를 들어, 시퀀스 데이터를 가공한 위치 빈도 행렬 또는 위치 가중치 행렬 간 유사도를 계산한다. 유사도는 데이터 간 거리를 의미하는 것으로, 그 값이 높을수록 사용자 간 학습패턴의 유사도가 높다고 할 수 있다. 유사도 계산을 위해 사용되는 통계적 방법으로 Pearson correlation, Average log-likelihood ratio, Pearson chi-square test, Sum of squared distance, Mutual information, Information correlation, Euclidean distance, Sandelin-wasserman similarity 등이 있다.
군집화부(142)는 유사도 계산부(140)를 통해 계산된 유사도에 따라 데이터를 군집화(Clustering) 하여 학습 패턴을 분류한다. 군집화 알고리즘은 예를 들어, Hierarchical clustering, k-means clustering, Partitioning around medoids 등이 있다.
군집 분석부(144)는 군집화부(142)를 통해 군집화된 군집 간 및 군집 내 사용자들의 학습 패턴을 비교 분석한다. 예를 들어, 군집 분석부(144)는 군집 간 및 군집 내 사용자들의 학습 데이터로부터 학습 효율을 계산하여 계산된 학습 효율을 비교 분석할 수 있다. 학습 효율은 투자 시간 대비 점수 상승률을 포함한다. 해당 값이 높을수록 학습 효율이 좋은 군집 또는 사용자라 할 수 있다.
도 4는 본 발명의 일 실시 예에 따른 도 1의 서비스 제공부의 세부 구성을 도시한 도면이다.
도 1 및 도 4를 참조하면, 서비스 제공부(16)는 학습 교정부(160) 및 학습계획 수립부(162)를 포함한다.
학습 교정부(160)는 데이터 분석부(14)의 군집 간 비교 분석 결과에 따라 군집들 중에 효율 향상을 위한 군집의 학습 패턴으로 교정하도록 유도하거나 군집 내 비교 분석 결과에 따라 효율 향상을 위한 사용자의 학습 패턴으로 교정하도록 유도한다.
학습계획 수립부(162)는 사용자들로부터 축적된 데이터를 이용하여 소정 사용자를 대상으로 현재 점수에서 목표 점수로 상승하기 위한 과목 별 절대시간 및 학습 패턴을 포함한 학습계획을 제시한다.
학습 교정부(160) 및 학습 교정부(160)의 시나리오에 따른 실시 예는 도 10 및 도 11을 참조로 하여 각각 후술한다.
도 5는 본 발명의 일 실시 예에 따른 유전자 염기서열 분석 시 사용되는 시퀀스 데이터를 도시한 도면이다.
도 5를 참조하면, 전사인자(TF)가 붙는 DNA 시퀀스는 다양성이 존재하면서도 일관적이다. 전사인자(TF)는 서로 다르면서도 유사한 시퀀스에 붙어 유전자 발현을 촉진한다. 예를 들어, 가상의 ‘TF-1’은 시퀀스A(AATTGGCC)와 시퀀스B(AAATGGCC)에 붙을 수 있지만, 시퀀스C(ATGCATGC)에는 붙지 않는다.
이러한 유전자 시퀀스 분석방법론을 본 발명에 적용하고자 한다. 예를 들어, 특정 사용자의 공부 패턴이 습관화 되어있어 특정한 시간대에 특정 과목을 공부 한다고 가정하면, 사용자를 TF에, 과목을 염기(A, T, G, C)에, 시퀀스 하나를 공부 패턴에 동치로 놓아 분석이 가능하다. 예를 들어, ‘TF-1’을 ‘철수’로 놓고, 각 시간대별 공부하는 과목을 염기(A=‘수학’, T=‘국어’, G=‘영어’, C=‘과학’)로 바꿔 패턴을 분석할 수 있는 것이다. 여기서 매일 수학, 국어, 영어, 과학 순으로 두 시간 혹은 세 시간씩 공부하는 철수의 패턴을 추출할 수 있다.
이하, 도 6 내지 도 11을 참조로 하여 학습 데이터 분석을 통한 효율적인 학습방법을 제시하는 실시 예들에 대해 후술한다. 설명의 용이를 위해 토익을 대상으로 독해(Reading: R) 및 청해(Listening: L)를 학습과목으로 가정하였다. 학습기간은 2주로 가정하여 10분 단위로 학습 데이터를 수집하였다.
도 6은 본 발명의 일 실시 예에 따라 수집되는 학습 데이터의 예를 도시한 도면이다.
도 6을 참조하면, 데이터 분석장치는 과정 데이터(x)와 결과 데이터(y)를 포함하는 학습 데이터를 수집한다. 과정 데이터(x)는 질적 변수인 정성 데이터와 양적 변수인 정량 데이터의 혼합 형태이다. 예를 들어, 정량 데이터는 절대 공부 시간(토익인 경우, 독해 공부 시간 및 청해 공부 시간), 계획 달성률을 포함한다. 정성 데이터는 주 공부 시간대(토익인 경우, 독해 공부 시간대, 청해 공부 시간대), 계획(이상)의 시간대, 계획 달성 시간대를 포함한다. 결과 데이터는 양적 변수인 학습 전후 점수 데이터(y1, y2)이다. 과정 데이터는 미리 설정된 기간 내에서 미리 설정된 시간 단위를 기준으로 학습과목 별로 얻을 수 있다. 예를 들어, 하루를 10분 단위로 쪼개어 2주간(14일) 수집한다.
도 7은 본 발명의 일 실시 예에 따른 토익의 학습 데이터를 도시한 도면이다.
도 7을 참조하면, 토익의 경우 사용자의 독해(R) 시작 점수는 300, 청해(L) 시작 점수는 300, 합 600인 경우, 달성한 결과 데이터는 독해(R) 점수 330, 청해(L) 점수는 320, 합 650점이다. 2주의 학습을 통해 독해(R) 점수는 30점, 청해(L) 점수는 20점 향상되었음을 확인할 수 있다. 사용자는 도 7에 도시된 바와 같이 하루를 10분 단위로 쪼개어 2주간(14일) 해당 시간대에 학습한 과목(R, L)을 과정 데이터로서 기록한다.
도 8은 본 발명의 일 실시 예에 따른 과정 데이터를 가공하는 예를 도시한 도면이다.
도 8을 참조하면, 데이터 분석장치는 과정 데이터인 시퀀스 데이터를 행렬화한다. 이를 위해, 사용자 당 수집된 과정 데이터(x)를 생명정보학에서 모티프 분석에 쓰이는 위치 빈도 행렬(Position frequency matrix: PFM)로 1차 가공한다. 나아가, 위치 빈도 행렬을 위치 가중치 행렬(Position Weight Matrix)(PWM)로 변환할 수 있다. . 위치 빈도 행렬은 소정 기간동안 매일 특정 시간대에 사이에 학습한 과목의 수를 카운팅한 것이다. 예를 들어, 도 8에 도시된 바와 같이, 2주 동안 10:00-10:10분에 독해(R)를 공부한 횟수는 9회이고, 청해(L)를 공부한 횟수는 4회이다.
위치 가중치 행렬은 학습과목 별(예를 들어, 독해, 청해 별) 가중치를 의미하는 것으로, 위치 빈도 행렬의 평균(average)과 임의의 가중치 의사 값(pseudo)과 학습 과목 별 비율(average_prop)을 이용하여 계산할 수 있다. 학습 과목 별 비율(average_prop)의 합은 1이다. 학습 모티프 벡터(Study Motif Vector)는 R/L, R, L, L/R로 분류될 수 있다.
도 9는 본 발명의 일 실시 예에 따른 학습 효율표를 도시한 도면이다.
도 9를 참조하면, 데이터 분석장치는 수집한 결과 데이터(y1, y2)를 통해 과목별 점수 상승량(Y=y2-y1)을 계산한다. 그리고 X(PWM) 또는 X(PSSM)에서 과목별 공부시간을 추출한다. 이어서, 과목별 학습 효율(시간당 점수 상승량)을 계산한다. 예를 들어, 2주간 600점의 철수는 독해 30시간, 청해 10시간 공부, 독해 100점/ 청해 30점 상승하였다. 철수의 시간당 점수 상승량은 독해 10점/1시간, 청해 3점/1시간이다.
도 10은 본 발명의 일 실시 예에 따른 유사도 기반 학습패턴을 군집화된 군집 그래프를 도시한 도면이다.
도 10을 참조하면, 데이터 분석장치는 학습패턴 간 유사도에 기반하여 학습패턴을 군집화한 후 분석을 시행한다. 도 10에서는 4개의 군집으로 분류되는 예를 도시하고 있다. 군집은 학습패턴의 유사도에 따라 나뉜 것으로, 예를 들어, 아침형 학습과 저녁형 학습으로 분류될 수 있고, 과목별로 몰아서 하는 학습패턴과 매일 나눠서 하는 학습패턴으로 분류될 수도 있다. 군집 분석은 군집 내 분석과 군집 간 분석을 포함한다. 군집 분석을 통해 고효율 학습패턴의 공통점을 파악하고 고효율 학습패턴으로 유도 및 교정할 수 있다.
군집 내 분석의 경우, 해당 사용자와 동일한 군집에 묶인 사용자들의 학습 효율을 비교하여, 가장 큰 점수 상승을 보이는 학습패턴을 추출한다. 군집 간 분석의 경우, 군집 별 사용자들의 평균 효율을 계산하여 가장 큰 점수 상승을 보이는 군집을 추출하고 해당 군집의 학습 패턴을 추출한다.
데이터 분석장치는 학습 효율 및 학습 패턴 분석결과를 이용하여 사용자에 학습방법을 제시한다. 학습방법은 고효율 학습패턴으로 교정을 유도하는 방법, 학습계획을 제안하는 방법 등이 있다.
이하, 고효율 학습 패턴 교정 서비스에 대해 후술한다. 이를 위해 시나리오를 다음과 같이 가정한다.
1) 군집 A (평균 효율 시간당 9점):
철수: 아침 9시부터 11시까지 청해, 15시부터 17시까지 독해 (시간당 11점)
철희: 아침 8시부터 9시까지 청해, 10시부터 12시까지 독해 (시간당 8점)
2) 군집 B (평균 효율 시간당 5점):
영희: 아침 9시부터 11시까지 독해, 15시부터 17시까지 청해
3) 군집 C (평균 효율 시간당 3점)
길동: 하루는 청해 4시간, 하루는 독해 4시간
4) 군집 D (평균 효율 시간당 2.5점)
영수: 평일 오전 청해 4시간, 주말 독해 10시간
1. 군집 간 분석: 군집 A, B, C, D 간 효율 차이. 
데이터 분석장치는 군집 A의 효율이 군집 D보다 월등한 경우, 군집 D의 사용자 군집에 군집A의 학습패턴을 추천한다.
2. 군집 내 분석
데이터 분석장치는 군집A 내에서 철수와 철희 간 학습 효율(시간당 점수 상승률)을 비교하여 고효율 패턴을 추출한다.  이때, 철수의 효율이 더 높은 경우, 철희에게 철수 학습 패턴으로 유도한다.
도 11은 본 발명의 일 실시 예에 따른 학습시간 당 기대점수를 예시적으로 나타내는 그래프를 도시한 도면이다.
도 11을 참조하면, 데이터 분석장치는 사용자에 학습 계획 제안 서비스를 제공할 수 있다. 해당 서비스는 점수 상승에 필요한 절대량/학습패턴을 제시하는 서비스이다.
예를 들어, 600점의 철수는 토익 100점 상승(청해 50점 상승, 독해 50점 상승 목표)이 목표이다.
1. 학습계획 제안
데이터 분석장치는 “600점의 사용자들이 청해: 2주간 평일 오전에 1시간 30분씩 / 독해: 2주간 40시간, 매일 4시간 이상” 공부한 경우 94.5%의 확률로 목표 달성하였음을 알아냈다.
2. 학습계획 교정
철수의 3일간 실제 학습한 과정 데이터가 청해: 평일 오전 30분씩 / 독해:  매일 3시간씩인 경우, 기대 점수는 "패턴 유지 시 예상 점수 640점"임을 제시한다. 나아가, 계획을 교정할 수 있다. 예를 들어, "남은 기간 동안, 하루에 청해 1시간 30분 더, 독해 1시간 30분씩 더 해야 목표 달성 가능"함을 제시한다.
도 12는 본 발명의 일 실시 예에 따른 학습 지원방법의 흐름을 도시한 도면이다.
도 1 및 도 12를 참조하면, 학습 데이터 분석장치(1)는 사용자의 학습 계획에 따른 과정 데이터와 학습 실천에 따른 결과 데이터를 포함한 학습 데이터를 획득한다(1210). 과정 데이터는 미리 설정된 기간 내에서 미리 설정된 시간 단위를 기준으로 학습과목 별로 절대 공부 시간을 포함하는 정량 데이터와 공부 시간대를 포함하는 정성 데이터를 포함한다. 결과 데이터는 학습 전후의 점수 데이터를 포함한다.
이어서, 획득된 학습 데이터로부터 유전자 염기서열 분석 시 사용되는 시퀀스 데이터를 생성하여 이를 행렬화한다(1220). 예를 들어, 사용자를 전사인자(TF)로 설정하고 학습과목을 염기(A, T, G, C)로 설정한 후 시간에 따라 사용자가 학습한 과목들을 나열한 염기 서열 시퀀스를 생성한다. 그리고 시퀀스 데이터를 위치 빈도 행렬로 변환하고, 변환된 위치 빈도 행렬을 위치 가중치 행렬로 변환한다. 이어서, 행렬화된 데이터 간 유사도를 계산(1230)하고, 계산된 유사도에 따라 데이터를 군집화하여 학습 패턴을 분류한다(1240).
이어서, 군집 간 및 군집 내 사용자들의 학습 패턴을 비교 분석(1250)한 후, 군집분석 결과를 기초로 하여 학습방법을 제공한다(1260). 예를 들어, 군집 간 비교 분석 결과에 따라 사용자가 군집들 중에 효율 향상을 위한 군집의 학습 패턴으로 교정하도록 유도한다. 또는 사용자가 군집 내 비교 분석 결과에 따라 효율 향상을 위한 사용자의 학습 패턴으로 교정하도록 유도한다. 다른 예로, 사용자들로부터 축적된 데이터를 이용하여 소정 사용자를 대상으로 현재 점수에서 목표 점수로 상승하기 위한 과목 별 절대시간 및 학습 패턴을 포함한 학습계획을 제시한다.
상기와 같이, 본 발명은, 사용자의 학습 데이터 분석을 통해 학습 효율 및 학습 패턴을 알아내어 사용자에 가장 효율적인 학습방법을 제시함에 따라 사용자의 학습 동기와 의욕을 유발시키고 학습계획을 수립하며 학습목표까지 달성할 수 있다.
또한, 본 발명은, 고효율 학습패턴의 공통점을 파악함에 따라 가장 효율이 높은 군집 또는 사용자의 고효율 학습패턴으로 교정을 유도할 수 있다. 사용자를 대상으로 현재 점수에서 목표 점수로 상승하기 위한 과목 별 절대시간 및 학습 패턴을 포함한 학습계획을 제안함에 따라 계획을 수립하고 목표까지 달성할 수 있어 학습효과가 증대되는 효과가 있다.
이제까지 본 발명에 대하여 그 실시 예들을 중심으로 살펴보았다. 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시 예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
1 : 학습 데이터 분석장치
10 : 데이터 획득부
12 : 데이터 처리부
14 : 데이터 분석부
16 : 서비스 제공부
120: 시퀀스 생성부
122: 제1 데이터 변환부
124: 제2 데이터 변환부
140: 유사도 계산부
142: 군집화부
144: 군집 분석부
160: 학습교정부
162: 학습계획 수립부

Claims (10)

  1. 사용자의 학습 계획에 따른 과정 데이터와 학습 실천에 따른 결과 데이터를 포함한 학습 데이터를 획득하는 데이터 획득부;
    획득된 학습 데이터로부터 유전자 염기서열 분석 시 사용되는 시퀀스 데이터를 생성하여 가공하는 데이터 처리부;
    가공된 데이터 간 유사도에 기반하여 사용자 군집을 분류한 후 군집 분석을 수행하는 데이터 분석부; 및
    군집분석 결과를 기초로 하여 학습방법을 제공하는 서비스 제공부;를 포함하고,
    데이터 처리부는,
    과정 데이터로부터 시퀀스 데이터를 생성하는 시퀀스 생성부;
    시퀀스 데이터를 위치 빈도 행렬로 변환하는 제1 데이터 변환부; 및
    변환된 위치 빈도 행렬을 위치 가중치 행렬로 변환하는 제2 데이터 변환부; 를 포함하며,
    시퀀스 생성부는,
    사용자를 전사인자(TF)로 설정하고 학습과목을 염기(A, T, G, C)로 설정한 후 사용자가 학습한 시간에 따라 사용자가 학습한 과목들을 나열한 염기 서열 시퀀스를 생성하며, 생성된 염기 서열 시퀀스 하나를 공부 패턴으로 설정하는 것을 특징으로 하는 학습 데이터 분석장치.
  2. 제 1 항에 있어서,
    과정 데이터는 미리 설정된 기간 내에서 미리 설정된 시간 단위를 기준으로 학습과목 별로 절대 공부 시간을 포함하는 정량 데이터와 공부 시간대를 포함하는 정성 데이터를 포함하고,
    결과 데이터는 학습 전후의 점수 데이터를 포함하는 것을 특징으로 하는 학습 데이터 분석장치.
  3. 삭제
  4. 삭제
  5. 제 1 항에 있어서, 데이터 분석부는
    시퀀스 데이터를 가공한 데이터 간 유사도를 계산하는 유사도 계산부;
    계산된 유사도에 따라 데이터를 군집화하여 학습 패턴을 분류하는 군집화부; 및
    군집 간 및 군집 내 사용자들의 학습 패턴을 비교 분석하는 군집 분석부;
    를 포함하는 것을 특징으로 하는 학습 데이터 분석장치.
  6. 제 5 항에 있어서, 군집 분석부는
    군집 간 및 군집 내 사용자들의 학습 데이터로부터 투자 시간 대비 점수 상승률을 포함한 학습 효율을 계산하여 계산된 학습 효율을 비교 분석하는 것을 특징으로 하는 학습 데이터 분석장치.
  7. 제 1 항에 있어서, 서비스 제공부는
    군집 간 비교 분석 결과에 따라 군집들 중에 효율 향상을 위한 군집의 학습 패턴으로 교정하도록 유도하거나 군집 내 비교 분석 결과에 따라 효율 향상을 위한 사용자의 학습 패턴으로 교정하도록 유도하는 학습 교정부; 및
    사용자들로부터 축적된 데이터를 이용하여 소정 사용자를 대상으로 현재 점수에서 목표 점수로 상승하기 위한 과목 별 절대시간 및 학습 패턴을 포함한 학습계획을 제시하는 학습계획 수립부;
    를 포함하는 것을 특징으로 하는 학습 데이터 분석장치.
  8. 사용자의 학습 계획에 따른 과정 데이터와 학습 실천에 따른 결과 데이터를 포함한 학습 데이터를 획득하는 단계;
    획득된 학습 데이터로부터 유전자 염기서열 분석 시 사용되는 시퀀스 데이터를 생성하여 이를 행렬화하는 단계;
    행렬화된 데이터 간 유사도를 계산하는 단계;
    계산된 유사도에 따라 데이터를 군집화하여 학습 패턴을 분류하는 단계;
    군집 간 및 군집 내 사용자들의 학습 패턴을 비교 분석하는 단계; 및
    군집분석 결과를 기초로 하여 학습방법을 제공하는 단계;를 포함하며,
    시퀀스 데이터를 생성하여 이를 행렬화하는 단계는
    사용자를 전사인자(TF)로 설정하고 학습과목을 염기(A, T, G, C)로 설정한 후 시간에 따라 사용자가 학습한 과목들을 나열한 염기 서열 시퀀스를 생성하는 단계;
    생성된 시퀀스 데이터를 위치 빈도 행렬로 변환하는 단계; 및
    변환된 위치 빈도 행렬을 위치 가중치 행렬로 변환하는 단계;
    를 포함하는 것을 특징으로 하는 학습 지원방법.
  9. 삭제
  10. 제 8 항에 있어서, 분석 결과를 제공하는 단계는
    군집 간 비교 분석 결과에 따라 군집들 중에 효율 향상을 위한 군집의 학습 패턴으로 교정하도록 유도하거나 군집 내 비교 분석 결과에 따라 효율 향상을 위한 사용자의 학습 패턴으로 교정하도록 유도하는 단계; 및
    사용자들로부터 축적된 데이터를 이용하여 소정 사용자를 대상으로 현재 점수에서 목표 점수로 상승하기 위한 과목 별 절대시간 및 학습 패턴을 포함한 학습계획을 제시하는 단계;를 구비하는 것을 특징으로 하는 학습 지원방법.
KR1020190094697A 2019-08-05 2019-08-05 학습 데이터 분석장치 및 이를 이용한 학습 지원방법 KR102251693B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190094697A KR102251693B1 (ko) 2019-08-05 2019-08-05 학습 데이터 분석장치 및 이를 이용한 학습 지원방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190094697A KR102251693B1 (ko) 2019-08-05 2019-08-05 학습 데이터 분석장치 및 이를 이용한 학습 지원방법

Publications (2)

Publication Number Publication Date
KR20210016667A KR20210016667A (ko) 2021-02-17
KR102251693B1 true KR102251693B1 (ko) 2021-05-13

Family

ID=74731737

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190094697A KR102251693B1 (ko) 2019-08-05 2019-08-05 학습 데이터 분석장치 및 이를 이용한 학습 지원방법

Country Status (1)

Country Link
KR (1) KR102251693B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102656358B1 (ko) * 2023-07-10 2024-04-11 주식회사 지원그룹 학습 정보 산출 장치 및 그에 관한 방법

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101508117B1 (ko) 2014-05-09 2015-04-08 고광철 영어 어순 지도를 이용한 영어 학습방법 및 그 시스템
KR101642577B1 (ko) * 2014-07-15 2016-07-27 한양대학교 산학협력단 효과적인 학습 독려와 가이드 및 학습 전략 수립 서비스 제공을 위한 스마트 개인화 학습 가이드 방법 및 시스템
KR101629084B1 (ko) * 2014-07-22 2016-06-09 이화여자대학교 산학협력단 사용자에 대한 학습 처방 결정 장치 및 방법
KR101869438B1 (ko) * 2016-11-22 2018-06-20 네이버 주식회사 딥 러닝을 이용하여 환자의 진단 이력으로부터 질병 예후를 예측하는 방법 및 시스템

Also Published As

Publication number Publication date
KR20210016667A (ko) 2021-02-17

Similar Documents

Publication Publication Date Title
CN111328407A (zh) 用于基于学习效率提供私人定制教育内容的机械学习方法、装置及计算机程序
US20200193317A1 (en) Method, device and computer program for estimating test score
Hlosta et al. Modelling student online behaviour in a virtual learning environment
KR102251693B1 (ko) 학습 데이터 분석장치 및 이를 이용한 학습 지원방법
CN109918514A (zh) 一种数学题目知识点和解题方法的自动提取方法、装置、平台
Xu et al. Application of random forest algorithm in physical education
CN111753846A (zh) 一种基于rpa和ai的网站验证方法、装置、设备及存储介质
Harb et al. SelectingOptimal Subset of Features for StudentPerformance Model
Fung et al. Enhancing learning paths with concept clustering and rule-based optimization
Ozbey et al. The determination and analysis of factors affecting to student learning by artificial intelligence in higher education
Basterrech et al. Nature-inspired algorithms for selecting EEG sources for motor imagery based BCI
JP6317000B1 (ja) ラベリング装置およびプログラム
Dervišević et al. Application of KNN and Decision Tree Classification Algorithms in the Prediction of Education Success from the Edu720 Platform
Espinosa A genetic algorithm for the calibration of a micro-simulation model
CN108520438A (zh) 行为类型确定方法及装置
Itoh et al. Towards generation of visual attention map for source code
Bao et al. A deep embedded clustering algorithm for the binning of metagenomic sequences
Li et al. A hybrid artificial bee colony algorithm to solve multi-objective hybrid flowshop in cloud computing systems
Rakus-Andersson Approximation and rough classification of letter-like polygon shapes
Xu et al. An adaptive strategy to adjust the components of memetic algorithms
Bartz-Beielstein et al. Sequential parameter optimization and optimal computational budget allocation for noisy optimization problems
Hashimoto et al. Extraction of editing processes for modifying a program to another purpose based on representation learning
CN115100007B (zh) 基于人工智能的在线教学管理方法及系统
Subirats et al. Intelligent Tutoring System in Archaeology
Zaw et al. A proposal of three extensions in blank element selection algorithm for Java programming learning assistant system

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right