WO2020235730A1

WO2020235730A1 - 동영상 학습 환경에서 학습자의 스캔 패턴에 기초한 학습 성과 예측 방법

Info

Publication number: WO2020235730A1
Application number: PCT/KR2019/006354
Authority: WO
Inventors: 조일현; 김지현
Original assignee: 이화여자대학교 산학협력단
Priority date: 2019-05-23
Filing date: 2019-05-28
Publication date: 2020-11-26
Also published as: KR102262662B1; KR20200134751A

Abstract

학습 환경에서 학습자의 스캔 패턴에 기초한 학습 성과 예측하기 위해, 시선 추적기를 통해 수집된 학습자의 시각 정보를 이용하여 동영상 학습 과정에서 학습자의 입체적 학습 과정을 추적하고, 시선 고정이 일어나는 시선 좌표를 활용하여 인지 부하와 주의 집중을 나타내는 부분을 탐색할 수 있다. 따라서, 학습자의 시각 정보를 이용한 학습 성과 예측을 통해 학습자의 학습을 최적화할 수 있다.

Description

동영상 학습 환경에서 학습자의 스캔 패턴에 기초한 학습 성과 예측 방법

아래 설명들은 동영상 학습 환경에서 학습자의 스캔 패턴에 기초한 학습 성과 예측 방법에 관한 것이다.

학습이란 학습 객체(object)와 학습 주체(subject) 간의 상호 작용으로서, 교수자 및 각종 학습 자료와 학습자 간의 메시지 교환 과정일 수 있다. 교수-학습 상황에서 학습자는 언제나 교수자의 설명에만 주의를 기울이지 않고, 자신의 학습전략/사전지식/학습태도등 다양한 요인에 따라 역동적인 학습을 할 수 있다. 이로 인해 교수자의 설명과 학습자의 정보 처리 사이에는 심리적 시차(time difference)가 발생될 수 있다. 따라서, 학습자-교수자 간의 심리적 시차를 규명하고, 학습자의 동영상이 재생되는 디스플레이의 응시하는 영역을 패턴화할 경우, 학습 성과는 예측될 수 있다.

본 발명은 시선 추적기를 통해 수집된 학습자의 시각 정보를 이용하여, 동영상 학습 과정에서 학습자의 입체적 학습 과정을 추적하는 동영상 학습 환경에서 학습자의 스캔 패턴에 기초한 학습 성과 예측 방법일 수 있다.

본 발명은 시선 고정이 일어나는 시선 좌표를 활용하여, 인지 부하와 주의 집중을 나타내는 부분을 탐색하는 동영상 학습 환경에서 학습자의 스캔 패턴에 기초한 학습 성과 예측 방법일 수 있다.

본 발명은 학습자의 시각 정보를 이용한 학습 성과 예측을 통해 학습자의 학습을 최적화하는 동영상 학습 환경에서 학습자의 스캔 패턴에 기초한 학습 성과 예측 방법일 수 있다.

일 실시예에 따르면, 학습과 관련된 동영상이 플레이될 때, 상기 동영상에 대한 관련 정보를 표시하는 관심 영역(Area of Interest, AOI)에 대응하는 픽셀을 식별하는 단계; 상기 동영상을 시청하는 학습자의 시선을 추적하여, 시각 정보를 획득하는 단계; 상기 학습자의 시선에 대응하는 상기 시각 정보와 상기 픽셀을 매칭하는 단계; 및 상기 매칭된 시각 정보와 픽셀을 이용하여, 상기 학습자의 시각 행동에 따른 학습 성과를 예측하는 스캔 패턴을 검출하는 단계를 포함하는, 동영상 학습 환경에서 학습자의 스캔 패턴에 기초한 학습 성과 예측 방법일 수 있다.

상기 시각 정보는, 상기 학습자의 시선 좌표와 지속 시간에 대한 정보를 포함하는, 동영상 학습 환경에서 학습자의 스캔 패턴에 기초한 학습 성과 예측 방법일 수 있다.

상기 시각 정보는, 시선 추적기와 상기 학습자의 눈 사이의 미리 설정된 거리 범위를 벗어나거나 또는, 시선 고정한 상기 학습자의 지속 시간의 미리 설정된 시간 범위를 벗어나는 경우에 대응하는 시각 정보를 제외하는, 동영상 학습 환경에서 학습자의 스캔 패턴에 기초한 학습 성과 예측 방법일 수 있다.

상기 관심 영역은, 상기 동영상의 과거 시점을 나타내는 과거 스크립트와 상기 동영상의 현재 시점을 나타내는 현재 스크립트와 상기 동영상의 미래 시점을 나타내는 미래 스크립트를 표시하는 영역을 나타내는, 동영상 학습 환경에서 학습자의 스캔 패턴에 기초한 학습 성과 예측 방법일 수 있다.

상기 과거 스크립트, 상기 현재 스크립트, 상기 미래 스크립트는, 상기 관심 영역의 사전에 설정된 영역에 표시되는, 동영상 학습 환경에서 학습자의 스캔 패턴에 기초한 학습 성과 예측 방법일 수 있다.

일 실시예에 따르면, 학습 성과 예측 장치는 프로세서 및 컴퓨터에서 읽을 수 있는 명령어를 포함하는 메모리를 포함하고, 상기 명령어가 상기 프로세서에서 실행되면, 상기 프로세서는, 학습과 관련된 동영상이 플레이될 때, 상기 동영상에 대한 관련 정보를 표시하는 관심 영역(Area of Interest, AOI)에 대응하는 픽셀을 식별하고, 상기 동영상을 시청하는 학습자의 시선을 추적하여 시각 정보를 획득하고, 상기 학습자의 시선에 대응하는 상기 시각 정보와 상기 픽셀을 매칭하고, 상기 매칭된 시각 정보와 픽셀을 이용하여, 상기 학습자의 시각 행동에 따른 학습 성과를 예측하는 패턴을 검출하는 동영상 학습 환경에서 학습자의 스캔 패턴에 기초한 학습 성과 예측 장치일 수 있다.

상기 시각 정보는, 상기 학습자의 시선 좌표와 지속 시간에 대한 정보를 포함하는, 동영상 학습 환경에서 학습자의 스캔 패턴에 기초한 학습 성과 예측 장치일 수 있다.

상기 시각 정보는, 시선 추적기와 상기 학습자의 눈 사이의 미리 설정된 거리 범위를 벗어나거나 또는, 시선 고정한 상기 학습자의 지속 시간의 미리 설정된 시간 범위를 벗어나는 경우에 대응하는 시각 정보를 제외하는, 동영상 학습 환경에서 학습자의 스캔 패턴에 기초한 학습 성과 예측 장치일 수 있다.

상기 관심 영역은, 상기 동영상의 과거 시점을 나타내는 과거 스크립트와 상기 동영상의 현재 시점을 나타내는 현재 스크립트와 상기 동영상의 미래 시점을 나타내는 미래 스크립트를 표시하는 영역을 나타내는, 동영상 학습 환경에서 학습자의 스캔 패턴에 기초한 학습 성과 예측 장치일 수 있다.

상기 과거 스크립트, 상기 현재 스크립트, 상기 미래 스크립트는, 상기 관심 영역의 사전에 설정된 영역에 표시되는, 동영상 학습 환경에서 학습자의 스캔 패턴에 기초한 학습 성과 예측 장치일 수 있다.

일 실시예에 따르면, 동영상 학습 환경에서 학습자의 스캔 패턴에 기초한 학습 성과 예측하는 본 발명은 시선 추적기를 통해 수집된 학습자의 시각 정보를 이용하여, 동영상 학습 과정에서 학습자의 입체적 학습 과정을 추적할 수 있다.

일 실시예에 따르면, 동영상 학습 환경에서 학습자의 스캔 패턴에 기초한 학습 성과 예측하는 본 발명은 시선 고정이 일어나는 시선 좌표를 활용하여, 인지 부하와 주의 집중을 나타내는 부분을 탐색할 수 있다.

일 실시예에 따르면, 동영상 학습 환경에서 학습자의 스캔 패턴에 기초한 학습 성과 예측하는 본 발명은 학습자의 시각 정보를 이용한 학습 성과 예측을 통해 학습자의 학습을 최적화할 수 있다.

도 1은 일 실시예에 따른, 동영상을 통해 학습하는 학습자를 나타낸 도면이다.

도 2는 일 실시예에 따른, 동영상 학습 환경에서 학습자의 시각에 기초한 학습 성과 예측 방법을 나타낸 도면이다.

도 3은 일 실시예에 따른, 부분 문자열 패턴의 빈도 테이블을 나타낸 도면이다.

도 4는 일 실시예에 따른, 빈도 테이블에 예측 결과를 시각화한 것을 나타낸 도면이다.

도 5은 일 실시예에 따른, 디스플레이에 표시되는 동영상 및 스크립트를 나타낸 도면이다.

도 6는 일 실시예에 따른, 개별 학습자의 시선 고정 시계열 그래프를 나타낸다.

도 7는 일 실시예에 따른, 전체 학습자의 시선 고정 시계열 그래프를 나타낸다.

도 8은 일 실시예에 따른, 개별 학습자의 시선 고정 시계열 그래프를 이용하여 학습 성과를 예측하는 패턴 탐지하는 것을 나타낸다.

도 9은 일 실시예에 따른, 전체 학습자의 시선 고정 시계열 그래프를 이용하여 학습 성과를 예측하는 패턴 탐지하는 것을 나타낸다.

도 10은 일 실시예에 따른, 학습자의 시선 위치를 추적하는 방법을 나타낸다.

도 11는 다른 일 실시예에 따른, 학습자의 시선 위치를 추적하는 방법을 나타낸다.

이하, 실시예들을 첨부된 도면을 참조하여 상세하게 설명한다. 그러나, 특허출원의 범위가 이러한 실시예들에 의해 제한되거나 한정되는 것은 아니다. 각 도면에 제시된 동일한 참조 부호는 동일한 부재를 나타낸다.

아래 설명하는 실시예들에는 다양한 변경이 가해질 수 있다. 아래 설명하는 실시예들은 실시 형태에 대해 한정하려는 것이 아니며, 이들에 대한 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.

제1 또는 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 이런 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 이해되어야 한다. 예를 들어, 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소는 제1 구성요소로도 명명될 수 있다.

실시예에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 실시예를 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수 개의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 명세서 상에 기재된 특징, 숫자, 단계, 동작, 구성 요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.

다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.

또한, 첨부 도면을 참조하여 설명함에 있어, 도면 부호에 관계없이 동일한 구성 요소는 동일한 참조 부호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다. 실시예를 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 실시예의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.

이하, 본 발명의 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.

디스플레이(110)은 재생하는 동영상을 표시할 수 있다. 동영상은 텍스트, 음성, 그림, 애니메이션을 통해 객체의 움직임을 표현하는 멀티미디어 학습 콘텐츠로서, 동영상을 이용하여 학습자(130)는 학습할 수 있다.

동영상을 이용하여 학습자(130)가 물리적으로 동일한 영상에 노출되더라도, 학습자(130)는 디스플레이(110)의 어디를, 어떻게 응시하는지에 따라 다른 학습 과정을 경험할 수 있다. 예를 들면, 동일한 동영상을 복수의 학습자가 시청하더라도, 학습자(130) 마다 서로 다른 학습 과정을 경험할 수 있다.

시선 추적기(120)는 학습자(130)의 시선을 추적할 수 있다. 여기서, 시선 추적기(120)는 디스플레이(110)에 장착되거나, 또는 학습자(130)에 부착되거나, 또는 이외의 별도의 장소에 위치할 수 있다.

시선 추적기(120)가 학습자(130)의 시선을 추적하는 방법의 일례로서,

눈 주변에 전극을 부착하여 망막과 각막 사이의 전위차를 측정하여 시선 위치를 계산하거나, 또는

각막에 미끄러지지 않는 렌즈를 부착하고 여기에 자기장 코일이나 거울을 부착하여 시선 위치를 계산하거나, 또는

헤드 밴드 또는 헬멧 밑에 작은 카메라를 장착하여 시선 위치를 계산하거나, 또는

외부에 회전이 가능한 카메라나 줌(zoom) 기능을 가지는 카메라와 조명을 이용하여 시선 위치를 계산하는 방법이 있다. 이외에도, 시선 추적기(120)가 학습자(130)의 시선을 추적하는 복수의 방법이 있으며, 그 중 일례에 대해 도 8과 도 9에서 자세히 설명한다.

따라서, 시선 추적기(120)가 학습자(130)의 시선을 추적하여 디스플레이(110)상의 어디를, 어떻게 응시하는지 판단한 경우, 동영상을 통해 학습하는 학습자(130)의 학습 성과를 예측할 수 있다.

도 2는 일 실시예에 따른, 동영상 학습 환경에서 학습자의 시각에 기초한 학습 성과 예측 방법을 나타낸 도면이다. 여기서, 학습 성과 예측 장치는 시선 추적기, 디스플레이에 내장될 수 있거나, 또는 별도의 외부의 기기에 내장될 수 있다. 학습 성과 예측 장치는 프로세서 및 컴퓨터에서 읽을 수 있는 명령어를 포함하는 메모리를 포함하고, 명령어가 프로세서에서 실행되면, 프로세서는 아래의 단계를 실행할 수 있다.

여기서, 주의 집중은 동영상 학습에 따른 자극에 의식을 집중하는 인지활동 능력으로서, 특정 시각 자극을 선택하여 의식을 집중하는 인지 활동에 해당한다. 또한, 인지 부하는 동영상 학습시 디스플레이에 표시되는 정보를 처리하며 경험하는 정신적 부하를 나타낼 수 있다.

단계(210)에서, 학습 성과 예측 장치는 학습과 관련된 동영상이 플레이될 때, 동영상에 대한 관련 정보를 표시하는 관심 영역(Area of Interest, AOI)에 대응하는 픽셀을 식별할 수 있다.

여기서, 관심 영역은 사전에 설정된 영역으로서, 동영상에 대한 과거 스크립트/현재 스크립트/미래 스크립트가 할당되는 영역일 수 있다. 이때, 관심 영역에 대응하는 픽셀은 식별될 수 있다. 즉, 과거 스크립트에 대응하는 픽셀, 현재 스크립트에 대응하는 픽셀, 미래 스크립트에 대응하는 픽셀은 식별될 수 있다. 예를 들면, 과거 스크립트에 대응하는 픽셀은 (0,0) ~ (1920, 360)일 수 있고, 현재 스크립트에 대응하는 픽셀은 (0, 360) ~ (1920, 720)일 수 있고, 미래 스크립트에 대응하는 픽셀은 (0, 720) ~ (1920, 1080)로서 사전에 설정될 수 있다.

단계(220)에서, 동영상을 시청하는 학습자의 시선을 추적하여, 시각 정보를 획득할 수 있다. 여기서, 시선 추적기가 학습자의 시선을 추적하는 일례는 이하에서 설명한다. 시각 정보는 학습자의 시선 좌표와 지속 시간에 대한 정보를 포함할 수 있다. 예를 들면, 시선 좌표는 학습자가 응시하는 디스플레이상의 좌표를 나타내고, 지속 시간은 학습자가 좌표 응시를 유지하는 시간을 나타낸다.

이때, 시선 추적기와 학습자의 눈 사이의 미리 설정된 거리 범위를 벗어난 경우에 대응하는 시각 정보가 제외될 수 있다. 구체적으로, 시선 추적기가 안정적인 시선 추적을 위한 미리 설정된 거리 범위(권장 거리 범위)가 존재하므로, 미리 설정된 거리 범위를 이탈한 경우 측정된 시각 정보의 정확도는 낮을 수 있다. 따라서, 미리 설정된 거리 범위를 이탈한 경우 측정된 시각 정보는 제외될 수 있다.

또한, 시선 고정의 지속 시간이 미리 설정된 시간 범위를 벗어난 경우에 대응하는 시각 정보가 제외될 수 있다. 구체적으로, 시선 고정 지속 시간의 정상 범위(미리 설정된 시간 범위)가 존재하므로, 미리 설정된 시간 범위를 이탈한 경우 측정된 시각 정보의 정확도는 낮을 수 있다. 따라서, 미리 설정된 시간 범위를 이탈한 경우 측정된 시각 정보는 제외될 수 있다.

단계(230)에서, 학습 성과 예측 장치는 학습자의 시선에 대응하는 시각 정보와 픽셀을 매칭할 수 있다.

시각 정보는 시선 좌표와 지속 시간을 포함하고 있으므로, 학습자가 응시하는 시선 좌표와 식별된 관심 영역의 픽셀을 매칭할 수 있다. 따라서, 학습자가 응시하는 영역이 과거 스크립트/현재 스크립트/미래 스크립트 인지 여부가 결정될 수 있다.

학습자가 응시하는 시선 좌표와 식별된 관심 영역의 픽셀을 매칭하였을 때 학습자가 과거 스크립트를 응시하는 경우, 현재 재생되는 동영상의 내용과 불일치한 부분을 학습자가 응시하는 것을 나타낸다. 또한, 학습자가 응시하는 시선 좌표와 식별된 관심 영역의 픽셀을 매칭하였을 때 학습자가 현재 스크립트를 응시하는 경우, 현재 재생되는 동영상의 내용과 일치한 부분을 학습자가 응시하는 것을 나타낸다. 또한, 학습자가 응시하는 시선 좌표와 식별된 관심 영역의 픽셀을 매칭하였을 때 학습자가 미래 스크립트를 응시하는 경우, 현재 재생되는 동영상의 내용과 불일치한 부분을 학습자가 응시하는 것을 나타낸다.

단계(240)에서, 학습 성과 예측 장치는 매칭된 시각 정보와 픽셀을 이용하여, 학습자의 시각 행동에 따른 학습 성과를 예측하는 스캔 패턴을 검출할 수 있다.

학습 성과 예측 장치는 시선 고정의 시간적 밀도(density)와 공간적 분산(dispersion)에 따른 동영상 구간을 분류할 수 있다. 여기서, 시간적 밀도(density)는 시선 고정(fixation) 이벤트가 얼마나 오래 지속되었는지를 나타내는 것으로서, 분석 구간 내 시선 고정 지속 시간의 총합(sum of fixation duration)으로 산출될 수 있다. 또한, 공간적 분산(dispersion)은 시선 고정 이벤트가 얼마나 다양한 관심 영역에서 발생했는지를 나타내는 것으로서, 분석 구간 내 시선고정의 AOI별 hit 빈도의 퍼짐 정도로 산출될 수 있다.

학습 성과 예측 장치는 일례로 60초 단위의 슬라이딩 윈도우(sliding window)를 적용하여 분석 단위가 되는 동영상 구간을 나눌 수 있다. 이때, 학습 성과 예측 장치는 분석 구간 별로 시간적 밀도와 공간적 분산을 산출할 수 있다. 여기서, 학습 성과 예측 장치는

높은 시간적 밀도, 큰 공간적 분산 구간

높은 시간적 밀도, 낮은 공간적 분산 구간

낮은 시간적 밀도, 큰 공간적 분산 구간

낮은 시간적 밀도, 낮은 공간적 분산 구간으로 분석 구간을 분류할 수 있다.

학습 성과 예측 장치는 분석 구간 별로 학습 성과를 예측하는 스캔 패턴(scan pattern)을 검출할 수 있다. 구체적으로, 1) 학습 성과 예측 장치는 AOI가 매칭된 시선 경로(scan path) 데이터를 학습자마다 하나의 문자열 객체(single subject)로 변환할 수 있고, 2) 하나의 문자열 객체를 N개의 부분 문자열 집합으로 나누는 토큰화(tokenization)를 수행할 수 있다.

여기서, N은 분석 구간 내 인접하는 문자열을 토큰화하는 문자열의 개수를 나타낸다. 예를 들면, 어떤 학습자의 특정한 분석 구간에서 시선 고정 전체 문자열 객체가 " abjiddhbba"인 경우, N=2라면 ab, bj, ji, id, dd, dh ~ 로 토큰화되고, N=3라면 abj, bji, jid, idd, ddh ~로 토큰화될 수 있다. 3) 학습 성과 예측 장치는 분석 구간 별로 학습자들의 스트림 패턴을 도출하여 부분 문자열 패턴의 빈도 테이블을 생성할 수 있다. 일례로서, N=2인 경우 문자열 패턴의 빈도 테이블은 도 3과 같다. 구체적으로, 도 3의 x축은 (n-1)번째 타임 인덱스에서의 AOI, y축은 n번째 타임 인덱스에서 발생한 시선 고정 이벤트의 AOI를 나타낼 수 있고, 각 셀에 적힌 숫자는 해당 시선 고정 패턴의 분석 구간 내 발생 빈도를 나타낼 수 있다. 예를 들면, 도 3에 표시된 두개의 화살표가 직교하는 '3321'은 'de' 패턴이 3321회 발생하였음을 나타내는 것으로서, A~C가 과거 스크립트 D가 현재 스크립트 E~J가 미래 스크립트인 경우 현재 스크립트 영역(D)에 대한 시선 고정(d) 이후 미래 스크립트 영역(E)에 대한 시선 고정(e)이 차례로 발생한 빈도가 3321회 발생하였음을 나타낸다.

4) 학습 성과 예측 장치는 분류회귀트리(Classification and Regression Tree, CART)를 이용하여 학습 성과(반응 변수)에 대한 스캔 패턴 별로 빈도(설명변수)의 영향을 나타내는 결정 트리(decision tree)를 시간적 밀도와 공간적 분산에 따라 4개 유형의 분석 구간 별로 생성할 수 있다. 여기서, 분류회귀트리는 설명변수의 비선형성(nonlinearity)과 상호작용(interactions)을 최대한 활용하여 반응 변수(종속변수)에 대한 영향을 판단할 때 이용될 수 있다. 설명변수를 중요도 기준에 따라 줄기(branch)를 만들어 나가며, 마지막 노드(node)에서 반응 변수에 대해 판단을 내리는 방식으로서, 반응 변수가 이항변수/다항변수 등인 경우에도 분류회귀트리는 사용될 수 있다. 학습 성과 예측 장치는 토큰화 기준 문자열 수(N)에 따라 예측 모형을 생성하여 가장 성과가 높은 모형을 결정할 수 있다. 이때, 생성된 빈도 테이블에 예측 결과를 시각화할 경우, 도 4와 같이 표시될 수 있다.

동영상(510)이 재생될 때, 동영상에 대한 관련 정보로서 스크립트(530)가 함께 디스플레이에 표시될 수 있다. 스크립트(530)는 현재 재생되는 동영상에 대한 현재 스크립트(533), 현재 보다 과거 시점에 대응하는 과거 스크립트(531), 현재 보다 미래 시점에 대응하는 미래 스크립트(535)를 포함할 수 있다. 이때, 스크립트(530)는 디스플레이의 일정한 영역에 할당될 수 있고, 과거 스크립트(531)/현재 스크립트(533)/미래 스크립트(535) 모두 사전에 할당된 영역에 표시될 수 있다.

디스플레이에 할당되는 과거 스크립트(531), 미래 스크립트(535)의 영역은 사전에 설정될 수 있다. 구체적으로, 재생되는 동영상(510)의 성격에 따라, 과거 스크립트(531)가 미래 스크립트(535) 보다 많은 영역을 할당받거나, 또는 과거 스크립트(531)과 미래 스크립트(535)가 동일한 영역을 할당받거나, 또는 과거 스크립트(531)가 미래 스크립트(535) 보다 적은 영역을 할당받을 수 있다. 예를 들면, 재생되는 동영상(510)을 통해 학습할 때 현재와 과거의 연계성이 중요한 경우 과거 스크립트(531)가 미래 스크립트(535) 보다 많은 영역을 할당받을 수 있다.

이때, 스크립트(530)가 할당되는 영역은 관심 영역(Area of Interest, AOI)으로서, 사전에 설정될 수 있다. 구체적으로, 사전에 영역이 설정된 관심 영역에 대응하는 픽셀은 식별될 수 있다. 과거 스크립트(531)에 대응하는 픽셀, 현재 스크립트(533)에 대응하는 픽셀, 미래 스크립트(535)에 대응하는 픽셀은 식별될 수 있다. 예를 들면, 과거 스크립트(531)에 대응하는 픽셀은 (0,0) ~ (1920, 360)일 수 있고, 현재 스크립트(533)에 대응하는 픽셀은 (0, 360) ~ (1920, 720)일 수 있고, 미래 스크립트(535)에 대응하는 픽셀은 (0, 720) ~ (1920, 1080)일 수 있다.

학습자의 시선을 추적한 결과 학습자가 과거 스크립트(531)를 응시하는 경우, 현재 재생되는 동영상의 내용과 불일치한 부분을 학습자가 응시하는 것을 나타낸다. 또한, 학습자의 시선을 추적한 결과 학습자가 현재 스크립트(533)을 응시하는 경우, 현재 재생되는 동영상의 내용과 일치한 부분을 학습자가 응시하는 것을 나타낸다. 또한, 학습자의 시선을 추적한 결과 학습자가 미래 스크립트(535)를 응시하는 경우, 현재 재생되는 동영상의 내용과 불일치한 부분을 학습자가 응시하는 것을 나타낸다.

학습자의 시선은 디스플레이의 특정한 영역에 일정한 시간 동안 고정되는 '시선 고정' 또는 디스플레이의 특정한 영역에 고정되지 않고 이동하는 '시선 도약'될 수 있다. 구체적으로, 학습자의 시선을 추적하여 시각 정보를 획득할 경우, 시각 정보는 시선 좌표와 지속 시간에 대한 정보를 포함할 수 있다. 학습자의 시선이 특정한 좌표에 일정한 지속 시간 이상 유지된 경우 '시선 고정'을 나타낼 수 있고, 학습자의 시선이 특정한 좌표에 일정한 지속 시간 이상 유지되지 않고 이동하는 경우 '시선 도약'을 나타낼 수 있다.

여기서, 시선 고정은 주의 집중의 지표로 활용되며, 시선 도약은 학습자의 인지 전략 또는 문제 해결 과정을 나타내는 지표로 활용될 수 있다. 시선이 특정 부분에 멈추어 있는 시선 고정은 해당 내용에 대한 인지적 처리가 발생하고 있음을 나타낼 수 있다. 따라서, 시선 고정이 일어나는 정보를 활용하여, 학습자의 인지 부하와 주의 집중을 나타내는 지표를 검출할 수 있다.

따라서, 학습자의 시선 추적에 따른 스크립트 내에서의 시선 고정/시선 도약을 추적하여, 학습자의 시각 행동에 따른 학습 성과를 예측하는 패턴을 검출할 수 있다.

도 6은 일 실시예에 따른, 개별 학습자의 시선 고정 시계열 그래프를 나타낸다. 도 6의 x축은 시간, y축은 시선 고정한 영역을 나타낸다. 여기서, 과거 스크립트에 대응하는 영역은 A, B, C로서, 현재 시간으로부터 이격된 정도에 따라 영역이 구별될 수 있다. 또한 미래 스크립트에 대응하는 영역은 E, F, G로서, 현재 시간으로부터 이격된 정도에 따라 영역이 구별될 수 있다.

구체적으로, 학습자는 시간 t1 ~ t2 동안 재생되는 동영상의 현재 스크립트에 대응하는 영역 D에 시선 고정하고 있다. 이후, 학습자는 시간 t2 ~ t3 동안 시선 고정하지 않고, 과거 스크립트에 대응하는 영역 C로 시선 도약하고 있다. 이후, 학습자는 시간 t3 ~ t4 동안 재생되는 동영상의 과거 스크립트에 대응하는 영역 C에 시선 고정하고 있다. 이후, 학습자는 t4 ~ t5 동안 시선 고정하지 않고, 현재 스크립트에 대응하는 영역 D로 시선 도약하고 있다. 이후, 학습자는 t5 ~ t6 동안 재생되는 동영상의 현재 스크립트에 대응하는 영역 D에 시선 고정하고 있다. 이후, 학습자는 t6 ~ t7 동안 시선 고정하지 않고, 미래 스크립트에 대응하는 영역 G로 시선 도약하고 있다. 이후, 학습자는 t7 ~ t8 동안 재생되는 동영상의 현재 스크립트가 아닌, 미래 스크립트에 대응하는 영역 G에 시선 고정하고 있다. 이후, 학습자가 시선 고정하는 영역은 도 6를 참조한다.

즉, 이와 같이 학습자는 동영상을 이용하여 학습할 때, 항상 현재 스크립트에 대응하는 영역에 시선 고정하지 않고 학습자의 판단에 따라 응시하는 영역을 변경할 수 있다.

도 7은 일 실시예에 따른, 전체 학습자의 시선 고정 시계열 그래프를 나타낸다.

학생 1은 현재 스크립트에 대응하는 영역 d, d에 시선 고정한 이후, 미래 스크립트에 대응하는 영역 g, f로 시선 도약하여 시선 고정한 이후, 현재 스크립트에 대응하는 영역 d로 시선 도약하여 시선 고정한 이후, 미래 스크립트에 대응하는 영역 f로 시선 도약하여 시선 고정한 이후, 현재 스크립트에 대응하는 영역 d, d로 시선 도약하여 시선 고정한 이후, 미래 스크립트에 대응하는 영역 g로 시선 도약하여 시선 고정한 이후, 현재 스크립트에 대응하는 영역 d로 시선 도약하여 시선 고정한 이후, 과거 스크립트에 대응하는 영역 c로 시선 도약하여 시선 고정한 이후, 미래 스크립트에 대응하는 영역 g로 시선 도약하여 시선 고정한 이후, 과거 스크립트에 대응하는 영역 a로 시선 도약하여 시선 고정하였다.

학생 2 ~ 학생 6의 시선 도약 및 시선 고정은 도 7을 참조한다.

도 8은 일 실시예에 따른, 개별 학습자의 시선 고정 시계열 그래프를 이용하여 학습 성과를 예측하는 패턴 탐지하는 것을 나타낸다. 구체적으로 N=2일 때 부분 문자열 패턴을 도출하고, 각 패턴의 빈도 수에 따라 분류회귀트리(CART)를 적용하여, 학습 성과를 정적(+)으로 예측하는 패턴과 부적(-)으로 예측하는 패턴을 검출한 시계열 그래프에 해당한다. 여기서, 'ga'는 (-)로 학습성과를 예측하고, 'bd' 및 'dc'는 (+)로 학습 성과를 예측하는 것을 나타낸다. 이는 시선 도약이 클수록 학습성과가 부적(-)으로 예측되고, 현재 영역을 과거 영역과 교차하며 시선 고정이 일어날 때 학습성과가 정적(+)으로 예측되는 것을 나타낼 수 있다.

도 9는 일 실시예에 따른, 전체 학습자의 시선 고정 시계열 그래프를 이용하여 학습 성과를 예측하는 패턴 탐지하는 것을 나타낸다. 여기서, 높은 주의 구간은 시선 고정 이벤트가 오래 지속된 것을 나타내며, 낮은 주의 구간은 시선 고정 이벤트가 상대적으로 짧게 지속된 것을 나타내고, 높은 분산 구간은 시선 고정 이벤트가 다양한 관심 영역에서 발생하였음을 나타내고, 낮은 분산 구간은 시선 고정 이벤트가 상대적으로 적은 관심 영역에서 발생하였음을 나타낸다.

시선 추적기(120)가 학습자(130)의 시선을 추적하는 복수의 방법이 있으며, 그 중 일례에 대해 이하, 도 10과 도 11에서 설명한다. 도 10과 도 11에 기재된 시선 추적 방법은 일례에 불과하며, 본 발명은 도 10과 도 11에 기재된 시선 추적 방법으로 권리범위가 한정되는 것은 아니다.

도 10은 일 실시예에 따른, 학습자의 시선 위치를 추적하는 방법을 나타낸다. 시선 추적기는 학습자의 얼굴 좌/우측에 배치되어, 학습자의 얼굴 영상을 인식하고, 얼굴 영상에서 좌/우측 눈을 탐지할 수 있다. 시선 추적기는 좌측 눈의 영상 및 우측 눈의 영상으로부터 동공(Pupil) 및 홍채(Iris)의 면적과 흰자위(Sclera)의 면적 및 눈꺼풀의 사이각을 도출하여 사용자의 시선을 추적할 수 있다.

시선 추적기는 좌측 눈의 영상 및 우측 눈의 영상으로부터 동공 및 홍채 영역을 검출할 수 있고, 각 영역의 면적을 추정할 수 있다. 또한, 시선 추적기는 좌측 눈의 영상 및 우측 눈의 영상으로부터 흰자위 영역을 검출할 수 있고, 흰자위 영역의 면적을 추정할 수 있다.

이후, 시선 추적기는 동공 및 홍채 영역의 면적과 흰자위 영역의 면적의 비율을 이용하여, 학습자의 좌우 시선을 추적할 수 있다. 구체적으로, 시선 추적기는 수평면과 평행하며 학습자의 좌/우측 눈의 동공의 중심을 지나는 기준선을 기준으로, 동공 및 홍채 영역의 면적과 흰자위 영역의 면적의 비율에 따라 기준선으로부터 시선이 이동하였는지 여부, 얼마나 이동하였는지 여부를 결정할 수 있다.

예를 들면, 학습자가 좌측을 보고 있는 그림 1010의 경우, 좌/우측 눈의 동공 및 홍채 영역의 면적과 흰자위 영역의 면적의 비율 이용하여, 학습자가 보고 있는 좌측의 정확한 위치를 결정할 수 있다. 다른 예를 들면, 학습자가 우측을 보고 있는 그림 1030의 경우, 좌/우측 눈의 동공 및 홍채 영역의 면적과 흰자위 영역의 면적의 비율 이용하여, 학습자가 보고 있는 우측의 정확한 위치를 결정할 수 있다. 다른 예를 들면, 학습자가 정면을 보고 있는 그림 1020의 경우, 좌/우측 눈의 동공 및 홍채 영역의 면적과 흰자위 영역의 면적의 비율 이용하여, 학습자가 보고 있는 정면의 정확한 위치를 결정할 수 있다.

도 11는 다른 일 실시예에 따른, 학습자의 시선 위치를 추적하는 방법을 나타낸다. 시선 추적기는 학습자의 얼굴 좌/우측에 배치되어, 학습자의 얼굴 영상을 인식하고, 얼굴 영상에서 좌/우측 눈을 탐지할 수 있다. 시선 추적기는 좌측 눈의 영상 및 우측 눈의 영상으로부터 동공(Pupil) 및 홍채(Iris)의 면적과 흰자위(Sclera)의 면적 및 눈꺼풀의 사이각을 도출하여 사용자의 시선을 추적할 수 있다.

구체적으로, 시선 추적기는 학습자의 윗 눈꺼풀과 기준선이 이루는 각

및 사용자의 아래 눈꺼풀과 기준선이 이루는 각

의 비율을 이용하여, 학습자의 상하 시선 위치를 결정할 수 있다. 예를 들면, 학습자가 위쪽을 보고 있는 그림 1110의 경우, 정면을 볼 때보다 윗 눈꺼풀과 기준선이 이루는 각

와 아래 눈꺼풀과 기준선이 이루는 각

의 비율이 상대적으로 크다. 만약, 사용자가 더 위쪽을 응시할수록 윗 눈꺼풀과 기준선이 이루는 각

와 아래 눈꺼풀과 기준선이 이루는 각

의 비율이 상대적으로 더 증가할 것이다. 다른 예를 들면, 학습자가 정면을 보고 있는 그림 1120의 경우, 윗 눈꺼풀과 기준선이 이루는 각

와 아래 눈꺼풀과 기준선이 이루는 각

은 비슷할 수 있다. 다른 예를 들면, 학습자가 아래쪽을 보고 있는 그림 1130의 경우, 정면을 볼 때보다 윗 눈꺼풀과 기준선이 이루는 각

와 아래 눈꺼풀과 기준선이 이루는 각

의 비율이 상대적으로 작다. 만약, 사용자가 더 아래쪽을 응시할수록 윗 눈꺼풀과 기준선이 이루는 각

와 아래 눈꺼풀과 기준선이 이루는 각

의 비율이 상대적으로 더 감소할 것이다. 즉, 시선 추적기는 학습자의 상하 시선을 추적할 수 있다.

일 실시예에 따르면, 시선 추적기는 학습자의 좌우 시선 추적 및 상하 시선 추적에 기초하여, 학습자가 실제로 보고 있는 위치를 정확하게 결정할 수 있다. 좌우 시선 추적 및 상하 시선 추적을 통한 학습자의 시선 추적 방법은 일례에 불과하며, 본 발명의 권리범위는 이에 한정되는 것은 아니다.

이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPA(field programmable array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.

소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.

실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.

이상과 같이 실시예들이 비록 한정된 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기를 기초로 다양한 기술적 수정 및 변형을 적용할 수 있다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.

Claims

학습과 관련된 동영상이 플레이될 때, 상기 동영상에 대한 관련 정보를 표시하는 관심 영역(Area of Interest, AOI)에 대응하는 픽셀을 식별하는 단계;

상기 동영상을 시청하는 학습자의 시선을 추적하여, 시각 정보를 획득하는 단계;

상기 학습자의 시선에 대응하는 상기 시각 정보와 상기 픽셀을 매칭하는 단계; 및

상기 매칭된 시각 정보와 픽셀을 이용하여, 상기 학습자의 시각 행동에 따른 학습 성과를 예측하는 스캔 패턴을 검출하는 단계

를 포함하는,

동영상 학습 환경에서 학습자의 스캔 패턴에 기초한 학습 성과 예측 방법.
제1항에 있어서,

상기 시각 정보는,

상기 학습자의 시선 좌표와 지속 시간에 대한 정보를 포함하는,

동영상 학습 환경에서 학습자의 스캔 패턴에 기초한 학습 성과 예측 방법.
제1항에 있어서,

상기 시각 정보는,

시선 추적기와 상기 학습자의 눈 사이의 미리 설정된 거리 범위를 벗어나거나 또는, 시선 고정한 상기 학습자의 지속 시간의 미리 설정된 시간 범위를 벗어나는 경우에 대응하는 시각 정보를 제외하는,

동영상 학습 환경에서 학습자의 스캔 패턴에 기초한 학습 성과 예측 방법.
제1항에 있어서,

상기 관심 영역은, 상기 동영상의 과거 시점을 나타내는 과거 스크립트와 상기 동영상의 현재 시점을 나타내는 현재 스크립트와 상기 동영상의 미래 시점을 나타내는 미래 스크립트를 표시하는 영역을 나타내는,

동영상 학습 환경에서 학습자의 스캔 패턴에 기초한 학습 성과 예측 방법.
제4항에 있어서,

상기 과거 스크립트, 상기 현재 스크립트, 상기 미래 스크립트는, 상기 관심 영역의 사전에 설정된 영역에 표시되는,

동영상 학습 환경에서 학습자의 스캔 패턴에 기초한 학습 성과 예측 방법.
하드웨어와 결합되어 제1항 내지 제5항 중 어느 하나의 항의 방법을 실행시키기 위하여 매체에 저장된 컴퓨터 프로그램.
학습 성과 예측 장치는 프로세서 및 컴퓨터에서 읽을 수 있는 명령어를 포함하는 메모리를 포함하고,

상기 명령어가 상기 프로세서에서 실행되면,

상기 프로세서는,

학습과 관련된 동영상이 플레이될 때, 상기 동영상에 대한 관련 정보를 표시하는 관심 영역(Area of Interest, AOI)에 대응하는 픽셀을 식별하고,

상기 동영상을 시청하는 학습자의 시선을 추적하여 시각 정보를 획득하고,

상기 학습자의 시선에 대응하는 상기 시각 정보와 상기 픽셀을 매칭하고,

상기 매칭된 시각 정보와 픽셀을 이용하여, 상기 학습자의 시각 행동에 따른 학습 성과를 예측하는 스캔 패턴을 검출하는

동영상 학습 환경에서 학습자의 스캔 패턴에 기초한 학습 성과 예측 장치.
제7항에 있어서,

상기 시각 정보는,

상기 학습자의 시선 좌표와 지속 시간에 대한 정보를 포함하는,

동영상 학습 환경에서 학습자의 스캔 패턴에 기초한 학습 성과 예측 장치.
제7항에 있어서,

상기 시각 정보는,

시선 추적기와 상기 학습자의 눈 사이의 미리 설정된 거리 범위를 벗어나거나 또는, 시선 고정한 상기 학습자의 지속 시간의 미리 설정된 시간 범위를 벗어나는 경우에 대응하는 시각 정보를 제외하는,

동영상 학습 환경에서 학습자의 스캔 패턴에 기초한 학습 성과 예측 장치.
제7항에 있어서,

상기 관심 영역은, 상기 동영상의 과거 시점을 나타내는 과거 스크립트와 상기 동영상의 현재 시점을 나타내는 현재 스크립트와 상기 동영상의 미래 시점을 나타내는 미래 스크립트를 표시하는 영역을 나타내는,

동영상 학습 환경에서 학습자의 스캔 패턴에 기초한 학습 성과 예측 장치.
제10항에 있어서,

상기 과거 스크립트, 상기 현재 스크립트, 상기 미래 스크립트는, 상기 관심 영역의 사전에 설정된 영역에 표시되는,

동영상 학습 환경에서 학습자의 스캔 패턴에 기초한 학습 성과 예측 장치.