KR102567043B1 - 인공지능 모델을 활용한 독서능력진단 기반 책 큐레이션 서비스 제공 방법, 장치 및 시스템 - Google Patents

인공지능 모델을 활용한 독서능력진단 기반 책 큐레이션 서비스 제공 방법, 장치 및 시스템 Download PDF

Info

Publication number
KR102567043B1
KR102567043B1 KR1020230037192A KR20230037192A KR102567043B1 KR 102567043 B1 KR102567043 B1 KR 102567043B1 KR 1020230037192 A KR1020230037192 A KR 1020230037192A KR 20230037192 A KR20230037192 A KR 20230037192A KR 102567043 B1 KR102567043 B1 KR 102567043B1
Authority
KR
South Korea
Prior art keywords
book
difficulty
calculating
books
index
Prior art date
Application number
KR1020230037192A
Other languages
English (en)
Inventor
최성규
Original Assignee
주식회사 레듀텍
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 레듀텍 filed Critical 주식회사 레듀텍
Priority to KR1020230037192A priority Critical patent/KR102567043B1/ko
Application granted granted Critical
Publication of KR102567043B1 publication Critical patent/KR102567043B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education

Abstract

본 발명의 일실시예는 사용자(학생, 책을 읽을/읽는 사람)가 어떤 수준의 책을 읽었을 때 가장 효과적일지 판단할 수 있도록 사용자의 독서 능력을 진단하고, 각 도서별로 어느 정도의 독서 능력이 있어야 지식을 효과적으로 학습할 수 있을지를 판단할 수 있도록 도서의 난이도를 평가함으로써, 사용자의 독서능력을 기반으로 책을 추천(큐레이션)할 수 있는, 인공지능 모델을 활용한 독서능력진단 기반 책 큐레이션 서비스 제공 방법, 장치 및 시스템에 관한 것이다.

Description

인공지능 모델을 활용한 독서능력진단 기반 책 큐레이션 서비스 제공 방법, 장치 및 시스템{METHOD, DEVICE AND SYSTEM FOR PROVIDING BOOK CURATION SERVICE BASED ON READING ABILITY DIAGNOSIS USING ARTIFICIAL INTELLIGENCE MODEL}
아래 실시예들은 사용자(학생, 책을 읽을/읽는 사람)가 어떤 수준의 책을 읽었을 때 가장 효과적일지 판단할 수 있도록 사용자의 독서 능력을 진단하고, 각 도서별로 어느 정도의 독서 능력이 있어야 지식을 효과적으로 학습할 수 있을지를 판단할 수 있도록 도서의 난이도를 평가함으로써, 사용자의 독서능력을 기반으로 책을 추천(큐레이션)할 수 있는, 인공지능 모델을 활용한 독서능력진단 기반 책 큐레이션 서비스 제공 방법, 장치 및 시스템에 관한 것이다.
스마트폰의 대중화로 인해 독서 인구가 급감하였으며, 이로 인해 난독증이나 학습에 장애가 있는 학생들의 수가 급증하고 있다.
이러한 사회 문제 발생에 따라 독서 교육에 관한 관심이 증가하고 있으며, 보다 효과적/효율적으로 독서 방법을 교육할 수 있는 커리큘럼들이 개발되고 있다.
이론적으로, 어떤 사람이 책을 읽었을 때, 그 책의 내용을 75% 정도 이해하면 가장 좋은 효율로 학습이 가능하다고 한다. 지식 공백이 발생한 25%가 책을 읽은 사람의 호기심을 자극하여, 보다 깊은 지식을 스스로 탐구하도록 유도할 수 있기 때문이다.
이와는 달리, 중학생이 초등학교 저학년용 책을 읽는 경우 내용을 100% 이해하지만, 너무 유치하게 느끼거나 흥미가 떨어지는 등의 이유로 학습 효율이 저하되며, 초등학교 저학년 학생들이 중학생용 책을 읽는 경우 책의 내용을 50%도 이해하지 못하게 되어 학습 효율이 저하된다.
한편, 각 사람들(학생들)은 각자 제반지식이나 독서능력, 어휘능력 등에 차이가 있어서, 종래와 같이 단순히 학년별로 지정된 추천도서 시스템이나 검색어, 기존 독서 이력 등을 기반으로 하는 추천도서 시스템으로는 독서 효율을 높이기 어려운 실정이다.
KR 10-2282337 B KR 10-1716050 B KR 10-1678521 B
본 발명의 일실시예가 해결하고자 하는 과제는, 전술한 바와 같은 종래 도서 추천 시스템의 한계점을 극복하기 위하여, 소정의 인공지능 알고리즘을 기반으로 사용자의 독서 능력을 정확하게 진단하고, 각 도서들의 난이도를 평가하여, 사용자의 현재 독서 능력에 가장 적합한 도서를 큐레이션하는, 인공지능 모델을 활용한 독서능력진단 기반 책 큐레이션 서비스 제공 방법, 장치 및 시스템을 제공하는 것이다.
일실시예에 따르면, 장치에 의해 수행되는, 인공지능 모델을 활용한 독서능력진단 기반 책 큐레이션 서비스 제공 방법에 있어서, 도서별 난이도 지수를 산출하는 단계; 상기 도서별 난이도 지수를 도서 데이터베이스에 반영하는 단계; 사용자별 독서능력을 평가하는 단계; 상기 사용자별 독서능력을 사용자 데이터베이스에 반영하는 단계; 상기 사용자별 독서능력, 사용자별 독서 기록 및 상기 도서별 난이도 지수를 기반으로, 상기 사용자에게 도서를 추천하는 단계; 사용자 단말로부터, 독서 기록을 수신하는 단계; 상기 독서 기록을 상기 사용자 데이터베이스에 반영하는 단계; 및 상기 독서 기록을 기반으로, 사용자별 독서능력을 평가하는 단계를 재수행하는 단계;를 포함하는, 인공지능 모델을 활용한 독서능력진단 기반 책 큐레이션 서비스 제공 방법을 제공한다.
또한, 상기 도서별 난이도 지수를 산출하는 단계는: 도서별로 카테고리를 지정하는 단계; 상기 카테고리마다 포함된 도서별로, 어휘 난이도를 기반으로 제1 난이도 지수를 산출하는 단계; 상기 카테고리마다 포함된 도서별로, 문장 길이를 기반으로 제2 난이도 지수를 산출하는 단계; 상기 카테고리마다 포함된 도서별로, 책 구조를 기반으로 제3 난이도 지수를 산출하는 단계; 및 상기 제1 난이도 지수 내지 제3 난이도 지수를 합산하여, 상기 도서별 난이도 지수로 지정하는 단계;를 포함하고, 상기 카테고리를 지정하는 단계는: 다수개의 서로 다른 제1 도서에 대한 카테고리를 입력받는 단계; 상기 제1 도서의 콘텐츠를 입력받는 단계; 상기 제1 도서가 아닌, 다수개의 서로 다른 제2 도서의 콘텐츠를 입력받는 단계; 상기 제1 도서 및 제2 도서의 콘텐츠로부터 불용어를 제거하여 제1 도서 및 제2 도서 전체에 대한 제1 단어 풀을 생성하는 단계; 상기 제1 단어 풀을 기반으로, 상기 제1 도서 및 제2 도서별로 단어별 출현 빈도를 산출하는 단계; 상기 제1 도서 및 제2 도서를, 상기 단어별 출현 빈도를 기반으로 벡터화하여, 제1 행렬을 생성하는 단계; 상기 제1 행렬을 기반으로, 상기 제1 도서 및 제2 도서에 대한 K-Means 클러스터링으로 상기 제1 도서 및 제2 도서를 군집화하는 단계; 및 상기 제1 도서에 대해 기 입력된 카테고리를 기반으로, 상기 제1 도서와 동일한 군집으로 지정된 제2 도서에 대한 카테고리를 지정하는 단계;를 포함할 수 있다.
그리고, 상기 어휘 난이도를 기반으로 제1 난이도 지수를 산출하는 단계는: 다수개의 서로 다른 제1 도서에 대한 제1 난이도 지수를 입력받는 단계; 상기 제1 도서가 아닌, 다수개의 서로 다른 제3 도서의 콘텐츠를 입력받는 단계; 제1 난이도 지수 산출에 사용될 제1 어휘들을 입력받는 단계; 상기 제1 어휘별로, 어휘 난이도를 입력받는 단계; 상기 제1 도서 및 제3 도서의 콘텐츠로부터 불용어를 제거하여, 도서별 제2 단어 풀을 생성하는 단계; 상기 제1 어휘별 어휘 난이도 및 제2 단어 풀을 기반으로, 도서별 어휘 난이도 출현 빈도를 산출하는 단계; 어휘 난이도를 '열'로, 도서 명을 '행'으로, 상기 도서별 어휘 난이도 출현 빈도를 '값'으로 하는 제2 행렬을 생성하는 단계; 상기 제2 행렬을 기반으로, 상기 도서에 대한 K-Means 클러스터링으로 상기 제1 도서 및 제3 도서들을 군집화하는 단계; 상기 제1 도서에 대해 기 입력된 제1 난이도 지수를 기반으로, 상기 제1 도서와 동일한 군집으로 지정된 제2 도서에 대한 제1 난이도 지수를 지정하는 단계;를 포함할 수 있다.
아울러, 상기 문장 길이를 기반으로 제2 난이도 지수를 산출하는 단계는: 다수개의 서로 다른 제1 도서에 대한 제2 난이도 지수를 입력받는 단계; 상기 제1 도서가 아닌, 다수개의 서로 다른 제4 도서의 콘텐츠를 입력받는 단계; 상기 제1 도서 및 제4 도서의 콘텐츠로부터 문장들을 분리하여, 제1 문장을 추출하는 단계; 상기 제1 문장마다 제1 글자수를 카운트하는 단계; 상기 제1 글자수로부터 중복된 값을 제거하여 제2 글자수를 산출하는 단계; 상기 제1 도서 및 제4 도서별로, 상기 제2 글자수에 대응하는 제1 문장의 개수를 카운트하여, 도서별 글자수 출현 빈도를 산출하는 단계; 상기 제2 글자수를 '열'로, 도서 명을 '행'으로, 상기 도서별 글자수출현 빈도를 '값'으로 하는 제3 행렬을 생성하는 단계; 상기 제3 행렬을 기반으로, 상기 도서에 대한 K-Means 클러스터링으로 상기 제1 도서 및 제4 도서들을 군집화하는 단계; 상기 제1 도서에 대해 기 입력된 제2 난이도 지수를 기반으로, 상기 제1 도서와 동일한 군집으로 지정된 제4 도서에 대한 제2 난이도 지수를 지정하는 단계;를 포함하고, 상기 책 구조를 기반으로 제3 난이도 지수를 산출하는 단계는: 다수개의 서로 다른 제1 도서에 대한 제3 난이도 지수를 입력받는 단계; 상기 제1 도서가 아닌, 다수개의 서로 다른 제5 도서의 콘텐츠를 입력받는 단계; 상기 제1 도서 및 제5 도서의 콘텐츠로부터 상기 제1 도서 및 제5 도서별로, 페이지별 그림 비율을 산출하는 단계; 상기 페이지별 그림 비율을 5개의 구간으로 구분하는 단계; 상기 제1 도서 및 제5 도서별로, 상기 페이지별 그림 비율 구간에 대응하는 페이지의 개수를 카운트하여, 도서별 구간별 그림 페이지 출현 빈도를 산출하는 단계; 상기 도서별 구간별 그림 페이지 출현 빈도를 상기 제1 도서 및 제5 도서별 전체 페이지 수로 나눈 값인 도서별 구간별 그림 빈도율을 산출하는 단계; 상기 제1 도서 및 제5 도서의 콘텐츠로부터 상기 제1 도서 및 제5 도서별로, 페이지별 글자 비율을 산출하는 단계; 상기 페이지별 글자 비율을 5개의 구간으로 구분하는 단계; 상기 제1 도서 및 제5 도서별로, 상기 페이지별 글자 비율 구간에 대응하는 페이지의 개수를 카운트하여, 도서별 구간별 글자 페이지 출현 빈도를 산출하는 단계; 상기 도서별 구간별 글자 페이지 출현 빈도를 상기 제1 도서 및 제5 도서별 전체 페이지 수로 나눈 값인 도서별 구간별 글자 빈도율을 산출하는 단계; 상기 페이지별 그림 비율 구간 및 페이지별 글자 비율 구간을 '열'로, 도서 명을 '행'으로, 도서별 구간별 그림 빈도율 및 도서별 구간별 글자 빈도율을 '값'으로 하는 제4 행렬을 생성하는 단계; 상기 제4 행렬을 기반으로, 상기 도서에 대한 K-Means 클러스터링으로 상기 제1 도서 및 제5 도서들을 군집화하는 단계; 및 상기 제1 도서에 대해 기 입력된 제3 난이도 지수를 기반으로, 상기 제1 도서와 동일한 군집으로 지정된 제5 도서에 대한 제3 난이도 지수를 지정하는 단계;를 포함할 수 있다.
또한, 상기 사용자별 독서능력을 평가하는 단계는: 2비트로 구성된 등급 산출 기준 변수를 생성하는 제1 평가 단계; 제1 난이도 등급으로 지정된 제1 문제를 출제하는 제2 평가 단계; 상기 제1 문제에 대한 답안을 입력받는 제3 평가 단계; 상기 등급 산출 기준 변수를 1 칸만큼 레프트 시프트(Left Shift) 연산(<<)하는 제4 평가 단계; 상기 등급 산출 기준 변수의 두 번째 자릿수에 제3 평가 단계 또는 제8 평가 단계의 정답 여부를 입력하는 제5 평가 단계; 상기 등급 산출 기준 변수를 기반으로, 난이도 하향, 난이도 유지 또는 난이도 상향을 판단하는 제6 평가 단계; 상기 제6 평가 단계를 기반으로, 제1 난이도 등급으로부터 하향, 유지 또는 상향된 제2 난이도 등급의 제2 문제를 출제하는 제7 평가 단계; 상기 제2 문제에 대한 답안을 입력받는 제8 평가 단계; 및 지정된 총 문항 개수에 기반하여, 상기 제4 평가 단계 내지 제8 평가 단계를 반복 수행하는 단계;를 포함할 수 있다.
일실시예에 따른 장치는 하드웨어와 결합되어 상술한 방법들 중 어느 하나의 항의 방법을 실행시키기 위하여 매체에 저장된 컴퓨터 프로그램에 의해 제어될 수 있다.
일실시예에 따르면, 사용자(책을 읽는/읽을 사람; 학생)의 현재 독서 능력을 보다 정확하게 진단/평가할 수 있다.
또한, 도서들의 난이도를 평가하여 이를 수치로 나타낼 수 있다.
그리고, 사용자의 독서 능력과 도서의 난이도를 매칭시켜, 사용자의 현재 독서 능력에서 가장 효율적/효과적인 도서를 추천/큐레이션할 수 있다.
아울러, 사람(관리자)이 직접 도서의 난이도를 평가하여 기준이 되는 난이도 지수를 입력하면, 이를 기반으로 다른 도서들의 난이도를 인공지능을 기반으로 자동으로 산출할 수 있다.
또한, 어휘 난이도, 문장의 길이, 책 구조를 종합적으로 평가하여 이를 기반으로 도서의 최종 난이도 지수를 산출함으로써, 책의 난이도를 보다 정확하게 평가할 수 있다.
그리고, 비지도학습(K-Means Clustering)을 기반으로 도서 난이도를 평가할 수 있다.
아울러, 사용자의 독서 능력을 평가하는 과정에서 사용자의 정답 여부에 따라 난이도를 동적으로 조절하여, 단순히 나이나 학년 등이 아니라 개인의 역량에 맞춘 정확한 독서 능력 평가를 수행할 수 있다.
도 1은 본 발명의 일실시예에 따른 인공지능 모델을 활용한 독서능력진단 기반 책 큐레이션 서비스 제공 방법, 장치 및 시스템을 나타낸 시스템도이다.
도 2는 본 발명의 일실시예에 따른 인공지능 모델을 활용한 독서능력진단 기반 책 큐레이션 서비스 제공 방법을 나타낸 순서도이다.
도 3은 본 발명의 일실시예에 따른 인공지능 모델을 활용한 독서능력진단 기반 책 큐레이션 서비스 제공 방법의 도서별 난이도 지수를 산출하는 단계를 나타낸 순서도이다.
도 4는 본 발명의 일실시예에 따른 인공지능 모델을 활용한 독서능력진단 기반 책 큐레이션 서비스 제공 방법의 도서별로 카테고리를 지정하는 단계를 나타낸 순서도이다.
도 5는 본 발명의 일실시예에 따른 인공지능 모델을 활용한 독서능력진단 기반 책 큐레이션 서비스 제공 방법의 제1 난이도 지수를 산출하는 단계를 나타낸 순서도이다.
도 6은 본 발명의 일실시예에 따른 인공지능 모델을 활용한 독서능력진단 기반 책 큐레이션 서비스 제공 방법에 따라 생성된 제1 행렬을 나타낸 도면이다.
이하에서, 첨부된 도면을 참조하여 실시예들을 상세하게 설명한다. 그러나, 실시예들에는 다양한 변경이 가해질 수 있어서 특허출원의 권리 범위가 이러한 실시예들에 의해 제한되거나 한정되는 것은 아니다. 실시예들에 대한 모든 변경, 균등물 내지 대체물이 권리 범위에 포함되는 것으로 이해되어야 한다.
실시예들에 대한 특정한 구조적 또는 기능적 설명들은 단지 예시를 위한 목적으로 개시된 것으로서, 다양한 형태로 변경되어 실시될 수 있다. 따라서, 실시예들은 특정한 개시형태로 한정되는 것이 아니며, 본 명세서의 범위는 기술적 사상에 포함되는 변경, 균등물, 또는 대체물을 포함한다.
제1 또는 제2 등의 용어를 다양한 구성요소들을 설명하는데 사용될 수 있지만, 이런 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 해석되어야 한다. 예를 들어, 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소는 제1 구성요소로도 명명될 수 있다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다.
실시예에서 사용한 용어는 단지 설명을 목적으로 사용된 것으로, 한정하려는 의도로 해석되어서는 안된다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 명세서 상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
또한, 첨부 도면을 참조하여 설명함에 있어, 도면 부호에 관계없이 동일한 구성 요소는 동일한 참조부호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다. 실시예를 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 실시예의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.
인공지능(Artificial Intelligence, AI) 시스템은 인간 수준의 지능을 구현하는 컴퓨터 시스템이며, 기존 규칙(Rule) 기반의 스마트 시스템과 달리 기계가 스스로 학습하고 판단하는 시스템이다. 인공지능 시스템은 사용할수록 인식률이 향상되고 사용자 취향을 보다 정확하게 이해할 수 있게 되어, 기존 규칙 기반의 스마트 시스템은 점차 심층 학습(Deep Learning) 기반 인공지능 시스템으로 대체되고 있다.
인공지능 기술은 기계 학습 및 기계 학습을 활용한 요소기술들로 구성된다. 기계 학습은 입력 데이터들의 특징을 스스로 분류/학습하는 알고리즘 기술이며, 요소기술은 심층 학습 등의 기계 학습 알고리즘을 활용하여 인간 두뇌의 인지, 판단 등의 기능을 모사하는 기술로서, 언어적 이해, 시각적 이해, 추론/예측, 지식 표현, 동작 제어 등의 기술 분야로 구성된다.
인공지능 기술이 응용되는 다양한 분야는 다음과 같다. 언어적 이해는 인간의 언어/문자를 인식하고 응용/처리하는 기술로서, 자연어 처리, 기계 번역, 대화시스템, 질의 응답, 음성 인식/합성 등을 포함한다. 시각적 이해는 사물을 인간의 시각처럼 인식하여 처리하는 기술로서, 객체 인식, 객체 추적, 영상 검색, 사람 인식, 장면 이해, 공간 이해, 영상 개선 등을 포함한다. 추론 예측은 정보를 판단하여 논리적으로 추론하고 예측하는 기술로서, 지식/확률 기반 추론, 최적화 예측, 선호 기반 계획, 추천 등을 포함한다. 지식 표현은 인간의 경험정보를 지식데이터로 자동화 처리하는 기술로서, 지식 구축(데이터 생성/분류), 지식 관리(데이터 활용) 등을 포함한다. 동작 제어는 차량의 자율 주행, 로봇의 움직임을 제어하는 기술로서, 움직임 제어(항법, 충돌, 주행), 조작 제어(행동 제어) 등을 포함한다.
일반적으로 기계 학습 알고리즘을 실생활에 적용하기 위해서는 기계 학습의 기본 방법론의 특성상 Trial and Error 방식으로 학습을 수행하게 된다. 특히, 심층 학습의 경우 수십만 번의 반복 실행을 필요로 한다. 이를 실제 물리적인 외부 환경에서 실행하기는 불가능하여 대신 실제 물리적인 외부 환경을 컴퓨터상에서 가상으로 구현하여 시뮬레이션을 통해 학습을 수행한다.
일실시예에 따르면, 장치에 의해 수행되는, 인공지능 모델을 활용한 독서능력진단 기반 책 큐레이션 서비스 제공 방법에 있어서, 도서별 난이도 지수를 산출하는 단계(S100); 상기 도서별 난이도 지수를 도서 데이터베이스에 반영하는 단계(S200); 사용자별 독서능력을 평가하는 단계(S300); 상기 사용자별 독서능력을 사용자 데이터베이스에 반영하는 단계(S400); 상기 사용자별 독서능력, 사용자별 독서 기록 및 상기 도서별 난이도 지수를 기반으로, 상기 사용자에게 도서를 추천하는 단계(S500); 사용자 단말로부터, 독서 기록을 수신하는 단계(S600); 상기 독서 기록을 상기 사용자 데이터베이스에 반영하는 단계(S700); 및 상기 독서 기록을 기반으로, 사용자별 독서능력을 평가하는 단계를 재수행하는 단계(S800);를 포함하는, 인공지능 모델을 활용한 독서능력진단 기반 책 큐레이션 서비스 제공 방법을 제공한다.
상기 장치는 소정의 서버 컴퓨터일 수 있다. 상기 장치는 다수개의 사용자 단말과 유무선 통신할 수 있다.
상기 도서별 난이도 지수를 산출하는 단계(S100);는, 후술하는 구체적인 단계들에 따라 도서 데이터베이스에 기록된 도서 각각에 대해 개별적으로 난이도 지수를 산출한다. 난이도 지수는 0 내지 1000의 자연수로 산출될 수 있다.
상기 도서별 난이도 지수를 도서 데이터베이스에 반영하는 단계(S200);에서는, 산출된 도서별 난이도 지수를 도서 데이터베이스에 업데이트한다. 이후, 새로운 도서가 도서 데이터베이스에 등재되면, 난이도 지수가 없는 도서들에 대해서만 도서별 난이도 지수를 산출하는 단계(S100)를 수행하여 데이터 처리량을 절감시킬 수 있다.
사용자별 독서능력을 평가하는 단계(S300);는 후술하는 구체적인 단계들에 따라 사용자 데이터베이스에 기록된 사용자 각각에 대해 개별적으로 독서능력을 산출한다. 독서능력은 0 내지 1000의 자연수로 산출될 수 있다.
상기 사용자별 독서능력을 사용자 데이터베이스에 반영하는 단계(S400);에서는, 산출된 사용자별 독서능력을 사용자 데이터베이스에 업데이트한다. 이후, 새로운 사용자가 사용자 데이터베이스에 등재되면, 독서능력 값이 없는 사용자들에 대해서만 사용자별 독서능력을 산출하는 단계를 수행하여 데이터 처리량을 절감시킬 수 있다. 한편, 사용자들은 일정한 주기(예를 들어 한 달) 또는 일정한 독서량(예를 들어 열 권)을 초과할 때마다, 새로이 독서능력을 평가하도록(사용자별 독서능력을 평가하는 단계(S300)를 수행하도록) 안내받을 수 있다.
상기 사용자별 독서능력, 사용자별 독서 기록 및 상기 도서별 난이도 지수를 기반으로, 상기 사용자에게 도서를 추천하는 단계(S500);는, 사용자별 독서능력과 도서별 난이도 지수를 매칭시켜, 적절한 범위의 난이도 지수를 가지는 도서를 사용자에게 추천한다.
이 때, 독서능력이 난이도 지수보다 소정의 수치 또는 비율만큼 낮도록 도서를 추천할 수 있다. 예를 들어, 사용자의 독서능력이 500일 때, 난이도 지수가 520 내지 550인 도서를 추천할 수 있다.
한편, 상기 사용자별 독서 기록은, 이미 읽은 적이 있는 도서가 무었인지, 어떤 도서를 몇 번 읽었는지 등을 기록한 데이터로써, 상기 사용자 데이터베이스에 기록될 수 있다.
사용자별 독서 기록을 기반으로, 이미 읽은 적이 있는 도서는 추천 도서에서 제외하고, 자주 읽는 카테고리의 도서를 추천함으로써 사용자가 관심있는 분야의 도서를 추천하여 독서에의 흥미를 유발시킬 수 있다.
사용자 단말로부터, 독서 기록을 수신하는 단계(S600);는, 사용자가 어떠한 도서를 읽었을 때, 전자책인 경우 자동으로 독서 기록을 수집하고, 종이책인 경우 독서 완료 여부를 사용자로부터 입력받을 수 있다. 여기서 사용자 단말이란, 상기 사용자가 구비한 스마트기기나 PC 등의 기기를 의미한다.
상기 독서 기록을 상기 사용자 데이터베이스에 반영하는 단계(S700);에서는, 장치로 수신된 사용자별 독서 기록을 사용자 데이터베이스에 업데이트한다.
상기 독서 기록을 기반으로, 사용자별 독서능력을 평가하는 단계를 재수행하는 단계(S800);는, 전술한 바와 같이, 가장 최근의 독서능력 평가일 이후로 사용자가 소정의 수 이상의 책을 읽었을 때 또는 가장 최근의 독서능력 평가일 이후로 소정의 기간이 경과했을 때, 사용자 단말에 소정의 푸시 알림을 송신하거나 메세지, 이메일 등을 송부하여, 사용자가 자신의 사용자 단말에서 독서능력 평가를 수행하도록 안내할 수 있다.
또한, 상기 도서별 난이도 지수를 산출하는 단계(S100)는: 도서별로 카테고리를 지정하는 단계(S110); 상기 카테고리마다 포함된 도서별로, 어휘 난이도를 기반으로 제1 난이도 지수를 산출하는 단계(S120); 상기 카테고리마다 포함된 도서별로, 문장 길이를 기반으로 제2 난이도 지수를 산출하는 단계(S130); 상기 카테고리마다 포함된 도서별로, 책 구조를 기반으로 제3 난이도 지수를 산출하는 단계(S140); 및 상기 제1 난이도 지수 내지 제3 난이도 지수를 합산하여, 상기 도서별 난이도 지수로 지정하는 단계(S150);를 포함할 수 있다.
도서별로 카테고리를 지정하는 단계(S110);에서는, 도서 데이터베이스에 등재된 도서들 각각에 대해 카테고리(소설, 시, 에세이, 인문, 가정, 육아, 요리, 건강, 취미, 스포츠, 경제, 경영, 자기계발, 정치, 사회, 역사, 문화, 종교, 예술, 문화, 기술, 공학, 외국어, 과학, 취업, 수험, 여행, 컴퓨터, IT, 청소년, 유아, 어린이, 만화 등)를 관리자 또는 인공지능 알고리즘에 의해 입력받는다.
상기 카테고리마다 포함된 도서별로, 어휘 난이도를 기반으로 제1 난이도 지수를 산출하는 단계(S120);에서는, 각 도서 카테고리마다 도서들을 구분하고, 각 카테고리마다 포함된 도서들에 대해 제1 난이도 지수를 산출한다.
예를 들어, A 카테고리에 소속된 1, 2, 3, 4, 5번 도서들 각각에 대해 제1 난이도 지수를 산출하고, B 카테고리에 소속된 6, 7, 8, 9, 10번 도서들 각각에 대해 제1 난이도 지수를 산출할 수 있다.
상기 카테고리마다 포함된 도서별로, 문장 길이를 기반으로 제2 난이도 지수를 산출하는 단계(S130); 및 상기 카테고리마다 포함된 도서별로, 책 구조를 기반으로 제3 난이도 지수를 산출하는 단계(S140);는, 전술한 제1 난이도 지수를 산출하는 단계(S120)와 동일한 방식으로, 카테고리별-도서별 제2 난이도 지수 및 제3 난이도 지수를 산출한다.
상기 제1 난이도 지수 내지 제3 난이도 지수를 합산하여, 상기 도서별 난이도 지수로 지정하는 단계(S150);에서는, 산출된 제1 난이도 지수 내지 제3 난이도 지수 값을 각 도서별로 합산하여, 도서별 최종 난이도 지수를 산출한다.
예를 들어, A 도서의 제1 난이도 지수가 100, 제2 난이도 지수가 150, 제3 난이도 지수가 150인 경우, A 도서의 난이도 지수는 100 + 150 + 150 = 400으로 산출될 수 있다.
상기 카테고리를 지정하는 단계는: 다수개의 서로 다른 제1 도서에 대한 카테고리를 입력받는 단계(S111); 상기 제1 도서의 콘텐츠를 입력받는 단계(S112); 상기 제1 도서가 아닌, 다수개의 서로 다른 제2 도서의 콘텐츠를 입력받는 단계(S113); 상기 제1 도서 및 제2 도서의 콘텐츠로부터 불용어를 제거하여 제1 도서 및 제2 도서 전체에 대한 제1 단어 풀을 생성하는 단계(S114); 상기 제1 단어 풀을 기반으로, 상기 제1 도서 및 제2 도서별로 단어별 출현 빈도를 산출하는 단계(S115); 상기 제1 도서 및 제2 도서를, 상기 단어별 출현 빈도를 기반으로 벡터화하여, 제1 행렬을 생성하는 단계(S116); 상기 제1 행렬을 기반으로, 상기 제1 도서 및 제2 도서에 대한 K-Means 클러스터링으로 상기 제1 도서 및 제2 도서를 군집화하는 단계(S117); 및 상기 제1 도서에 대해 기 입력된 카테고리를 기반으로, 상기 제1 도서와 동일한 군집으로 지정된 제2 도서에 대한 카테고리를 지정하는 단계(S118);를 포함할 수 있다.
다수개의 서로 다른 제1 도서에 대한 카테고리를 입력받는 단계(S111);에서는, 관리자(관리자 단말)에 의해 도서 데이터베이스에 등록된 다수개의 도서 각각에 대해 카테고리를 입력받을 수 있다.
여기서, 관리자는 모든 도서에 대해 카테고리를 일일이 지정하는 것이 아니라, 카테고리별로 대표 도서들을 선정하여 대표 도서들(일부 도서들)에 대해서만 카테고리를 입력한다.
상기 제1 도서의 콘텐츠를 입력받는 단계(S112);에서는, 상기 관리자가 카테고리를 직접 입력한 도서들의 콘텐츠(글, 그림 등)를 입력받아 도서 데이터베이스에 기록한다.
상기 제1 도서가 아닌, 다수개의 서로 다른 제2 도서의 콘텐츠를 입력받는 단계(S113);에서는, 상기 관리자가 카테고리를 직접 입력하지 않은 도서들의 콘텐츠(글, 그림 등)를 입력받아 도서 데이터베이스에 기록한다.
상기 제1 도서 및 제2 도서의 콘텐츠로부터 불용어(StopWords)를 제거하여 제1 도서 및 제2 도서 전체에 대한 제1 단어 풀을 생성하는 단계(S114);에서는, 제1 도서들 및 제2 도서들 전체에 기재된 모든 단어들을 취합하고, 조사 등을 제거하여 단어(어근)을 추출한 뒤, 그 중 불용어(또한, 그리고, 한편 등 일반적으로 사용되는 용어들로써, 문서를 군집화하는데 필요하지 않는 단어들)를 제거하고, 중복되는 단어를 제거한 제1 단어 풀을 생성한다.
상기 제1 단어 풀을 기반으로, 상기 제1 도서 및 제2 도서별로 단어별 출현 빈도를 산출하는 단계(S115);에서는, 상기 제1 단어 풀에 기재된 단어가, 각 제1 도서 및 제2 도서들 각각에서 몇 번이나 기재(출현)되어 있는지를 산출한다.
상기 제1 도서 및 제2 도서를, 상기 단어별 출현 빈도를 기반으로 벡터화하여, 제1 행렬을 생성하는 단계(S116);에서는, 제1 도서 및 제2 도서들 각각에서 상기 제1 단어 풀에 기재된 단어들이 얼마나 출현하는지를 나타내는 제1 행렬을 생성한다.
도 6에는 제1 행렬의 예시가 도시되어 있다.
도 6를 참조하면, 고유번호가 BOOK-103인 도서에서는 '학습'이라는 단어가 10번, '중학'이라는 단어가 10번, ..., '역사'라는 단어가 2번 출현한다.
상기 제1 행렬을 기반으로, 상기 제1 도서 및 제2 도서에 대한 K-Means 클러스터링으로 상기 제1 도서 및 제2 도서를 군집화하는 단계(S117);에서는, K-Means 클러스터링 알고리즘을 기반으로, 관리자에 의해 이미 카테고리가 입력된 제1 도서와, 아직 카테고리가 입력되지 않은 제2 도서를 함께 군집화한다.
상기 제1 도서에 대해 기 입력된 카테고리를 기반으로, 상기 제1 도서와 동일한 군집으로 지정된 제2 도서에 대한 카테고리를 지정하는 단계(S118);에서는, 군집화된 결과를 기반으로, 동일한 군집에 속한 다른 제1 도서들의 카테고리를 기반으로 제2 도서들의 카테고리를 자동으로 입력한다.
이 때, 어느 한 군집에서 다른 카테고리의 제1 도서들이 존재하는 경우에는, 그 군집에서의 카테고리 출현 빈도를 기반으로, 보다 더 많은 제1 도서 카테고리를 참조하여 제2 도서들의 카테고리를 입력할 수 있다.
예를 들어, 어느 군집에 A 카테고리의 제1 도서가 5개, B 카테고리의 제1 도서가 1개 포함되어 있다면, 그 군집에 포함된 제2 도서들은 A 카테고리로 지정될 수 있다.
그리고, 상기 어휘 난이도를 기반으로 제1 난이도 지수를 산출하는 단계(S120)는: 다수개의 서로 다른 제1 도서에 대한 제1 난이도 지수를 입력받는 단계(S121); 상기 제1 도서가 아닌, 다수개의 서로 다른 제3 도서의 콘텐츠를 입력받는 단계(S122); 제1 난이도 지수 산출에 사용될 제1 어휘들을 입력받는 단계(S123); 상기 제1 어휘별로, 어휘 난이도를 입력받는 단계(S124); 상기 제1 도서 및 제3 도서의 콘텐츠로부터 불용어를 제거하여, 도서별 제2 단어 풀을 생성하는 단계(S125); 상기 제1 어휘별 어휘 난이도 및 제2 단어 풀을 기반으로, 도서별 어휘 난이도 출현 빈도를 산출하는 단계(S126); 어휘 난이도를 '열'로, 도서 명을 '행'으로, 상기 도서별 어휘 난이도 출현 빈도를 '값'으로 하는 제2 행렬을 생성하는 단계(S127); 상기 제2 행렬을 기반으로, 상기 도서에 대한 K-Means 클러스터링으로 상기 제1 도서 및 제3 도서들을 군집화하는 단계(S128); 상기 제1 도서에 대해 기 입력된 제1 난이도 지수를 기반으로, 상기 제1 도서와 동일한 군집으로 지정된 제2 도서에 대한 제1 난이도 지수를 지정하는 단계(S129);를 포함할 수 있다.
다수개의 서로 다른 제1 도서에 대한 제1 난이도 지수를 입력받는 단계(S121);에서는 소정의 수식을 기반으로 다수개의 제1 도서들에 대해 제1 난이도 지수를 입력받거나, 관리자에 의해 제1 난이도 지수를 직접 입력받을 수 있다.
상기 제1 도서가 아닌, 다수개의 서로 다른 제3 도서의 콘텐츠를 입력받는 단계(S122);에서는, 상기 관리자가 제1 난이도 지수를 직접 입력하지 않은 도서들의 콘텐츠(글, 그림 등)를 입력받아 도서 데이터베이스에 기록한다. 여기서, 전술한 카테고리 지정 단계들에 따라, 제3 도서에 대해 이미 콘텐츠가 입력되어 있는 경우도 발생할 수 있다.
제1 난이도 지수 산출에 사용될 제1 어휘들을 입력받는 단계(S123);에서는, 해당 카테고리에서 어휘 난이도를 산정하는 데 중요한 제1 어휘들을 관리자로부터 입력받을 수 있다.
상기 제1 어휘별로, 어휘 난이도를 입력받는 단계(S124);에서는, 입력된 제1 어휘들 각각에 대해, 해당 어휘가 어느 정도의 어휘 난이도 값을 가지는지를 관리자로부터 자연수 값으로 입력받을 수 있다.
상기 제1 도서 및 제3 도서의 콘텐츠로부터 불용어를 제거하여, 도서별 제2 단어 풀을 생성하는 단계(S125);에서는, 제1 도서들 및 제3 도서들 각각에 기재된 단어들을 도서별로 구분한 상태로, 조사 등을 제거하여 단어(어근)을 추출한 뒤, 그 중 불용어(또한, 그리고, 한편 등 일반적으로 사용되는 용어들로써, 문서를 군집화하는데 필요하지 않는 단어들)를 제거하고, 중복되는 단어를 제거한, 도서별 제2 단어 풀을 생성한다.
상기 제1 어휘별 어휘 난이도 및 제2 단어 풀을 기반으로, 도서별 어휘 난이도 출현 빈도를 산출하는 단계(S126);에서는, 도서별로 어휘 난이도 값이 얼마나 출현하는지를 산출한다.
예를 들어, 제1 어휘별 어휘 난이도가 'A : 1, B : 2, C : 2, D : 3, E : 4'(A 내지 E는 어떤 단어를 의미함)일 때, '가' 도서에 'B' 단어가 3번, 'C' 단어가 5번, 'D' 단어가 2번 출현한다면, '가' 도서에서는 '2' 어휘 난이도의 단어가 3 + 5 = 8번, '3' 어휘 난이도의 단어가 3번 출현한 것으로 산출된다.
어휘 난이도를 '열'로, 도서 명을 '행'으로, 상기 도서별 어휘 난이도 출현 빈도를 '값'으로 하는 제2 행렬을 생성하는 단계(S127);에서는, 제1 도서 및 제3 도서들 각각에서 상기 제1 어휘별 어휘 난이도가 얼마나 출현하는지를 나타내는 제2 행렬을 생성한다.
상기 제2 행렬을 기반으로, 상기 도서에 대한 K-Means 클러스터링으로 상기 제1 도서 및 제3 도서들을 군집화하는 단계(S128);에서는, K-Means 클러스터링 알고리즘을 기반으로, 관리자에 의해 이미 제1 난이도 지수가 입력된 제1 도서와, 아직 제1 난이도 지수가 입력되지 않은 제3 도서를 함께 군집화한다.
상기 제1 도서에 대해 기 입력된 제1 난이도 지수를 기반으로, 상기 제1 도서와 동일한 군집으로 지정된 제2 도서에 대한 제1 난이도 지수를 지정하는 단계(S129);에서는, 군집화된 결과를 기반으로, 동일한 군집에 속한 다른 제1 도서들의 제1 난이도 지수를 기반으로 제3 도서들의 제1 난이도 지수를 자동으로 입력한다.
이 때, 어느 한 군집에서 다른 제1 난이도 지수의 제1 도서들이 존재하는 경우에는, 그 군집에서의 제1 난이도 지수의 평균값을 기반으로 제3 도서들의 제1 난이도 지수를 입력할 수 있다.
아울러, 상기 문장 길이를 기반으로 제2 난이도 지수를 산출하는 단계(S130)는: 다수개의 서로 다른 제1 도서에 대한 제2 난이도 지수를 입력받는 단계; 상기 제1 도서가 아닌, 다수개의 서로 다른 제4 도서의 콘텐츠를 입력받는 단계; 상기 제1 도서 및 제4 도서의 콘텐츠로부터 문장들을 분리하여, 제1 문장을 추출하는 단계; 상기 제1 문장마다 제1 글자수를 카운트하는 단계; 상기 제1 글자수로부터 중복된 값을 제거하여 제2 글자수를 산출하는 단계; 상기 제1 도서 및 제4 도서별로, 상기 제2 글자수에 대응하는 제1 문장의 개수를 카운트하여, 도서별 글자수 출현 빈도를 산출하는 단계; 상기 제2 글자수를 '열'로, 도서 명을 '행'으로, 상기 도서별 글자수출현 빈도를 '값'으로 하는 제3 행렬을 생성하는 단계; 상기 제3 행렬을 기반으로, 상기 도서에 대한 K-Means 클러스터링으로 상기 제1 도서 및 제4 도서들을 군집화하는 단계; 상기 제1 도서에 대해 기 입력된 제2 난이도 지수를 기반으로, 상기 제1 도서와 동일한 군집으로 지정된 제4 도서에 대한 제2 난이도 지수를 지정하는 단계;를 포함할 수 있다.
다수개의 서로 다른 제1 도서에 대한 제2 난이도 지수를 입력받는 단계;에서는 소정의 수식을 기반으로 다수개의 제1 도서들에 대해 제2 난이도 지수를 입력받거나, 관리자에 의해 제2 난이도 지수를 직접 입력받을 수 있다.
상기 제1 도서가 아닌, 다수개의 서로 다른 제4 도서의 콘텐츠를 입력받는 단계;에서는, 상기 관리자가 제2 난이도 지수를 직접 입력하지 않은 도서들의 콘텐츠(글, 그림 등)를 입력받아 도서 데이터베이스에 기록한다. 여기서, 전술한 카테고리 지정 단계들이나 제1 난이도 지수 산출 단계들에 따라, 제4 도서에 대해 이미 콘텐츠가 입력되어 있는 경우도 발생할 수 있다.
상기 제1 도서 및 제4 도서의 콘텐츠로부터 문장들을 분리하여, 제1 문장을 추출하는 단계;에서는, 제1 도서 및 제4 도서들로부터 각 문장들을 하나 씩 모두 분리하여 도서별 제1 문장들을 추출한다.
상기 제1 문장마다 제1 글자수를 카운트하는 단계; 상기 제1 글자수로부터 중복된 값을 제거하여 제2 글자수를 산출하는 단계;에서는, 도서별로 추출된 제1 문장들마다, 각 문장의 제1 글자수들을 카운트한다.
이후, 제1 글자수들로부터 중복되는 값들을 제거한 제2 글자수들을 산출한다.
예를 들어, 제1 글자수가 20, 25, 30, 31, 30, 26, 25, 20, 21로 산출된 경우, 중복되는 20, 25, 30 값은 한 번만 나타나도록 중복을 제거한 20, 25, 30, 31, 26, 21리 제2 글자수(배열, 컬렉션 또는 리스트)로써 산출될 수 있다.
상기 제1 도서 및 제4 도서별로, 상기 제2 글자수에 대응하는 제1 문장의 개수를 카운트하여, 도서별 글자수 출현 빈도를 산출하는 단계;에서는, 상기 제2 글자수에 해당하는 제1 문장의 개수를 각 도서별로 카운트하여, 도서별로 문장당 글자수가 얼마나 출현하는지를 산출할 수 있다.
예를 들어, 'A' 도서에서 30글자수의 문장이 10번 등장하고, 26글자수의 문장이 12번 등장하는 것을 산출할 수 있다.
상기 제2 글자수를 '열'로, 도서 명을 '행'으로, 상기 도서별 글자수출현 빈도를 '값'으로 하는 제3 행렬을 생성하는 단계;에서는, 제1 도서 및 제4 도서들 각각에서 상기 도서별 글자수 출현 빈도가 얼마인지를 나타내는 제3 행렬을 생성한다.
상기 제3 행렬을 기반으로, 상기 도서에 대한 K-Means 클러스터링으로 상기 제1 도서 및 제4 도서들을 군집화하는 단계;에서는, K-Means 클러스터링 알고리즘을 기반으로, 관리자에 의해 이미 제2 난이도 지수가 입력된 제1 도서와, 아직 제2 난이도 지수가 입력되지 않은 제4 도서를 함께 군집화한다.
상기 제1 도서에 대해 기 입력된 제2 난이도 지수를 기반으로, 상기 제1 도서와 동일한 군집으로 지정된 제4 도서에 대한 제2 난이도 지수를 지정하는 단계;에서는, 군집화된 결과를 기반으로, 동일한 군집에 속한 다른 제1 도서들의 제2 난이도 지수를 기반으로 제4 도서들의 제2 난이도 지수를 자동으로 입력한다.
이 때, 어느 한 군집에서 다른 제2 난이도 지수의 제1 도서들이 존재하는 경우에는, 그 군집에서의 제2 난이도 지수의 평균값을 기반으로 제4 도서들의 제2 난이도 지수를 입력할 수 있다.
상기 책 구조를 기반으로 제3 난이도 지수를 산출하는 단계(S140)는: 다수개의 서로 다른 제1 도서에 대한 제3 난이도 지수를 입력받는 단계; 상기 제1 도서가 아닌, 다수개의 서로 다른 제5 도서의 콘텐츠를 입력받는 단계; 상기 제1 도서 및 제5 도서의 콘텐츠로부터 상기 제1 도서 및 제5 도서별로, 페이지별 그림 비율을 산출하는 단계; 상기 페이지별 그림 비율을 5개의 구간으로 구분하는 단계; 상기 제1 도서 및 제5 도서별로, 상기 페이지별 그림 비율 구간에 대응하는 페이지의 개수를 카운트하여, 도서별 구간별 그림 페이지 출현 빈도를 산출하는 단계; 상기 도서별 구간별 그림 페이지 출현 빈도를 상기 제1 도서 및 제5 도서별 전체 페이지 수로 나눈 값인 도서별 구간별 그림 빈도율을 산출하는 단계; 상기 제1 도서 및 제5 도서의 콘텐츠로부터 상기 제1 도서 및 제5 도서별로, 페이지별 글자 비율을 산출하는 단계; 상기 페이지별 글자 비율을 5개의 구간으로 구분하는 단계; 상기 제1 도서 및 제5 도서별로, 상기 페이지별 글자 비율 구간에 대응하는 페이지의 개수를 카운트하여, 도서별 구간별 글자 페이지 출현 빈도를 산출하는 단계; 상기 도서별 구간별 글자 페이지 출현 빈도를 상기 제1 도서 및 제5 도서별 전체 페이지 수로 나눈 값인 도서별 구간별 글자 빈도율을 산출하는 단계; 상기 페이지별 그림 비율 구간 및 페이지별 글자 비율 구간을 '열'로, 도서 명을 '행'으로, 도서별 구간별 그림 빈도율 및 도서별 구간별 글자 빈도율을 '값'으로 하는 제4 행렬을 생성하는 단계; 상기 제4 행렬을 기반으로, 상기 도서에 대한 K-Means 클러스터링으로 상기 제1 도서 및 제5 도서들을 군집화하는 단계; 및 상기 제1 도서에 대해 기 입력된 제3 난이도 지수를 기반으로, 상기 제1 도서와 동일한 군집으로 지정된 제5 도서에 대한 제3 난이도 지수를 지정하는 단계;를 포함할 수 있다.
다수개의 서로 다른 제1 도서에 대한 제3 난이도 지수를 입력받는 단계;에서는 소정의 수식을 기반으로 다수개의 제1 도서들에 대해 제3 난이도 지수를 입력받거나, 관리자에 의해 제3 난이도 지수를 직접 입력받을 수 있다.
상기 제1 도서가 아닌, 다수개의 서로 다른 제5 도서의 콘텐츠를 입력받는 단계;에서는, 상기 관리자가 제3 난이도 지수를 직접 입력하지 않은 도서들의 콘텐츠(글, 그림 등)를 입력받아 도서 데이터베이스에 기록한다. 여기서, 전술한 카테고리 지정 단계들이나 제1 난이도 지수 산출 단계들에 따라, 제5 도서에 대해 이미 콘텐츠가 입력되어 있는 경우도 발생할 수 있다.
상기 제1 도서 및 제5 도서의 콘텐츠로부터 상기 제1 도서 및 제5 도서별로, 페이지별 그림 비율을 산출하는 단계;에서는, 각 도서별로 모든 페이지에서의 그림 비율을 산출한다.
예를 들어, 'A' 도서의 1페이지에는 그림이 50%의 비율을 차지하고, 2페이지에는 그림이 80%의 비율을 차지하고, 3페이지에는 그림이 20%의 비율을 차지하는 등 페이지별 그림 비율을, 콘텐츠(도서의 페이지별 스캔본/도서의 e북 페이지)로부터 산출/인식한다.
상기 페이지별 그림 비율을 5개의 구간으로 구분하는 단계;에서는, 그림 비율을 '20% 이하, 20% 초과 40% 이하, 40% 초과 60% 이하, 60% 초과 80% 이하, 80% 초과'의 5개 구간으로 구분할 수 있다.
상기 제1 도서 및 제5 도서별로, 상기 페이지별 그림 비율 구간에 대응하는 페이지의 개수를 카운트하여, 도서별 구간별 그림 페이지 출현 빈도를 산출하는 단계;에서는, 각 도서별로 및 각 그림 비율 구간별로 해당하는 페이지의 개수를 카운트한다.
예를 들어, 어떤 A 도서에서는 1 구간(20% 이하) 페이지가 20 페이지, 2 구간(20% 초과 40% 이하) 페이지가 40 페이지, 3 구간(40% 초과 60% 이하) 페이지가 30 페이지, 4 구간 페이지가 10 페이지(60% 초과 80% 이하), 5 구간(80% 초과) 페이지가 5 페이지로 산출될 수 있다.
상기 도서별 구간별 그림 페이지 출현 빈도를 상기 제1 도서 및 제5 도서별 전체 페이지 수로 나눈 값인 도서별 구간별 그림 빈도율을 산출하는 단계;에서는, 구간별 페이지 수를 그 도서의 전체 페이지 수로 나누어, 도서별 구간별 그림 빈도율을 산출할 수 있다.
예를 들어, 어떤 A 도서에서는 1 구간(20% 이하) 페이지가 20 페이지, 2 구간(20% 초과 40% 이하) 페이지가 40 페이지, 3 구간(40% 초과 60% 이하) 페이지가 30 페이지, 4 구간 페이지가 10 페이지(60% 초과 80% 이하), 5 구간(80% 초과) 페이지가 5 페이지로 산출되었을 때, 총 페이지 수인 105로 각 값들을 나누어 도서별 구간별 그림 빈도율을 산출한다. 1 구간의 그림 빈도율은 20 / 105 = 0.1905, 2 구간의 그림 빈도율은 40 / 105 = 0.3810, 3 구간의 그림 빈도율은 30 / 105 = 0.2857, 4 구간의 그림 빈도율은 10 / 105 = 0.0952, 5 구간의 그림 빈도율은 5 / 105 = 0.0476로 산출될 수 있다.
상기 제1 도서 및 제5 도서의 콘텐츠로부터 상기 제1 도서 및 제5 도서별로, 페이지별 글자 비율을 산출하는 단계;에서는, 각 도서별로 모든 페이지에서의 글자 비율을 산출한다.
예를 들어, 'A' 도서의 1페이지에는 글자가 50%의 비율을 차지하고, 2페이지에는 글자가 80%의 비율을 차지하고, 3페이지에는 글자가 20%의 비율을 차지하는 등 페이지별 글자 비율을, 콘텐츠(도서의 페이지별 스캔본/도서의 e북 페이지)로부터 산출/인식한다.
여기서, 전술한 페이지별 그림 비율과 페이지별 글자 비율은 서로 독립적인 것으로, 글자들은 소정의 OCR 기술 등을 기반으로 추출될 수 있다.
어떤 유형(예를 들어 그림이 있는 동화책 등)에서는 그림의 위에 글자가 중첩된 경우도 있으므로, 그림 비율이 80%임에도 글자 비율이 50%인 형태(그림 비율과 글자 비율의 합이 100%를 초과하는) 것도 가능하다.
상기 페이지별 글자 비율을 5개의 구간으로 구분하는 단계;에서는, 글자 비율을 '20% 이하, 20% 초과 40% 이하, 40% 초과 60% 이하, 60% 초과 80% 이하, 80% 초과'의 5개 구간으로 구분할 수 있다.
상기 제1 도서 및 제5 도서별로, 상기 페이지별 글자 비율 구간에 대응하는 페이지의 개수를 카운트하여, 도서별 구간별 글자 페이지 출현 빈도를 산출하는 단계;에서는, 각 도서별로 및 각 글자 비율 구간별로 해당하는 페이지의 개수를 카운트한다.
예를 들어, 어떤 A 도서에서는 1 구간(20% 이하) 페이지가 20 페이지, 2 구간(20% 초과 40% 이하) 페이지가 40 페이지, 3 구간(40% 초과 60% 이하) 페이지가 30 페이지, 4 구간 페이지가 10 페이지(60% 초과 80% 이하), 5 구간(80% 초과) 페이지가 5 페이지로 산출될 수 있다.
상기 도서별 구간별 글자 페이지 출현 빈도를 상기 제1 도서 및 제5 도서별 전체 페이지 수로 나눈 값인 도서별 구간별 글자 빈도율을 산출하는 단계;에서는, 구간별 페이지 수를 그 도서의 전체 페이지 수로 나누어, 도서별 구간별 글자 빈도율을 산출할 수 있다.
예를 들어, 어떤 A 도서에서는 1 구간(20% 이하) 페이지가 20 페이지, 2 구간(20% 초과 40% 이하) 페이지가 40 페이지, 3 구간(40% 초과 60% 이하) 페이지가 30 페이지, 4 구간 페이지가 10 페이지(60% 초과 80% 이하), 5 구간(80% 초과) 페이지가 5 페이지로 산출되었을 때, 총 페이지 수인 105로 각 값들을 나누어 도서별 구간별 글자 빈도율을 산출한다. 1 구간의 그림 빈도율은 20 / 105 = 0.1905, 2 구간의 그림 빈도율은 40 / 105 = 0.3810, 3 구간의 그림 빈도율은 30 / 105 = 0.2857, 4 구간의 그림 빈도율은 10 / 105 = 0.0952, 5 구간의 그림 빈도율은 5 / 105 = 0.0476로 산출될 수 있다.
상기 페이지별 그림 비율 구간 및 페이지별 글자 비율 구간을 '열'로, 도서 명을 '행'으로, 도서별 구간별 그림 빈도율 및 도서별 구간별 글자 빈도율을 '값'으로 하는 제4 행렬을 생성하는 단계;에서는, 제1 도서 및 제5 도서들 각각에서 상기 도서별 구간별 그림 빈도율이 얼마인지를 나타내는 제4 행렬을 생성한다.
상기 제4 행렬을 기반으로, 상기 도서에 대한 K-Means 클러스터링으로 상기 제1 도서 및 제5 도서들을 군집화하는 단계;에서는, K-Means 클러스터링 알고리즘을 기반으로, 관리자에 의해 이미 제3 난이도 지수가 입력된 제1 도서와, 아직 제3 난이도 지수가 입력되지 않은 제5 도서를 함께 군집화한다.
상기 제1 도서에 대해 기 입력된 제3 난이도 지수를 기반으로, 상기 제1 도서와 동일한 군집으로 지정된 제5 도서에 대한 제3 난이도 지수를 지정하는 단계;에서는, 군집화된 결과를 기반으로, 동일한 군집에 속한 다른 제1 도서들의 제3 난이도 지수를 기반으로 제5 도서들의 제3 난이도 지수를 자동으로 입력한다.
이 때, 어느 한 군집에서 다른 제3 난이도 지수의 제1 도서들이 존재하는 경우에는, 그 군집에서의 제3 난이도 지수의 평균값을 기반으로 제5 도서들의 제3 난이도 지수를 입력할 수 있다.
또한, 상기 사용자별 독서능력을 평가하는 단계(S300)는: 2비트로 구성된 등급 산출 기준 변수를 생성하는 제1 평가 단계; 제1 난이도 등급으로 지정된 제1 문제를 출제하는 제2 평가 단계; 상기 제1 문제에 대한 답안을 입력받는 제3 평가 단계; 상기 등급 산출 기준 변수를 1 칸만큼 레프트 시프트(Left Shift) 연산(<<)하는 제4 평가 단계; 상기 등급 산출 기준 변수의 두 번째 자릿수에 제3 평가 단계 또는 제8 평가 단계의 정답 여부를 입력하는 제5 평가 단계; 상기 등급 산출 기준 변수를 기반으로, 난이도 하향, 난이도 유지 또는 난이도 상향을 판단하는 제6 평가 단계; 상기 제6 평가 단계를 기반으로, 제1 난이도 등급으로부터 하향, 유지 또는 상향된 제2 난이도 등급의 제2 문제를 출제하는 제7 평가 단계; 상기 제2 문제에 대한 답안을 입력받는 제8 평가 단계; 및 지정된 총 문항 개수에 기반하여, 상기 제4 평가 단계 내지 제8 평가 단계를 반복 수행하는 단계;를 포함할 수 있다.
2비트로 구성된 등급 산출 기준 변수를 생성하는 제1 평가 단계;에서는, 2비트(2*2의 4가지 상태를 나타낼 수 있는 데이터)의 등급 산출 기준 변수를 생성한다.
제1 난이도 등급으로 지정된 제1 문제를 출제하는 제2 평가 단계;에서는, 사용자의 학년 등의 정보와는 무관하게 미리 지정된 제1 난이도 등급, 예를 들어 1단계에서 10단계까지의 등급 중 중간 등급인 5 등급의 제1 문제를 출제할 수 있다.
상기 제1 문제에 대한 답안을 입력받는 제3 평가 단계;에서는, 사용자 단말로부터 상기 제1 문제에 대한 답안을 입력받는다.
상기 등급 산출 기준 변수를 1 칸만큼 레프트 시프트(Left Shift) 연산(<<)하는 제4 평가 단계;에서는, 답안의 정답 여부를 갱신하기 전에, 최근 2회의 정답 여부만을 기록할 수 있도록 오래된 정답 여부 데이터(왼쪽 비트)를 제거하기 위하여 등급 산출 기준 변수를 왼 쪽으로 1칸만큼 시프트 연산한다.
예를 들어, '01'이었던 등급 산출 기준 변수는 '10'이 되고, '11'이었던 등급 산출 기준 변수는 '10'이 된다.
상기 등급 산출 기준 변수의 두 번째 자릿수(오른쪽 비트)에 제3 평가 단계 또는 제8 평가 단계의 정답 여부를 입력하는 제5 평가 단계;에서는, 직전에 수행된 제3 평가 단계 또는 제8 평가 단계의 정답 여부에 따라, 정답이었을 때 1을, 오답이었을 때 0을 상기 두 번째 자릿수에 입력한다.
상기 등급 산출 기준 변수를 기반으로, 난이도 하향, 난이도 유지 또는 난이도 상향을 판단하는 제6 평가 단계;에서는, 상기 등급 산출 기준 변수가 '11'인 경우에 난이도 상향으로, 상기 등급 산출 기준 변수가 '10' 또는 '01'인 경우에 난이도 유지로, 상기 등급 산출 기준 변수가 '00'인 경우에 난이도 하향으로 판단한다.
상기 제6 평가 단계를 기반으로, 제1 난이도 등급으로부터 하향, 유지 또는 상향된 제2 난이도 등급의 제2 문제를 출제하는 제7 평가 단계;에서는, 조정된 난이도에 맞는 제2 난이도 등급의 제2 문제를 출제한다.
상기 제2 문제에 대한 답안을 입력받는 제8 평가 단계;에서는, 조정된 난이도에 따라 출제된 제2 문제에 대한 응답을 상기 사용자 단말로부터 입력받는다.
지정된 총 문항 개수에 기반하여, 상기 제4 평가 단계 내지 제8 평가 단계를 반복 수행하는 단계;에서는, 지정된 총 문항 개수(예를 들어 10개)에 기반하여, 총 문항 개수를 충족할 때까지 각 단계들을 반복하여, 문제의 난이도를 동적으로 조절한다.
이상에서 설명된 실시예들은 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치, 방법 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
이상과 같이 실시예들이 비록 한정된 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기를 기초로 다양한 기술적 수정 및 변형을 적용할 수 있다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 청구범위의 범위에 속한다.
1 : 장치(서버)
2 : 사용자 단말
3 : 관리자 단말
4 : 데이터베이스 서버
S100 : 도서별 난이도 지수를 산출하는 단계
S110 : 도서별로 카테고리를 지정하는 단계
S111 : 다수개의 서로 다른 제1 도서에 대한 카테고리를 입력받는 단계
S112 : 제1 도서의 콘텐츠를 입력받는 단계
S113 : 제2 도서의 콘텐츠를 입력받는 단계
S114 : 제1 단어 풀을 생성하는 단계
S115 : 단어별 출현 빈도를 산출하는 단계
S116 : 제1 행렬을 생성하는 단계
S117 : 제1 도서 및 제2 도서를 군집화하는 단계
S118 : 제2 도서에 대한 카테고리를 지정하는 단계
S120 : 제1 난이도 지수를 산출하는 단계
S121 : 다수개의 서로 다른 제1 도서에 대한 제1 난이도 지수를 입력받는 단계
S122 : 제3 도서의 콘텐츠를 입력받는 단계
S123 : 제1 어휘들을 입력받는 단계
S124 : 어휘 난이도를 입력받는 단계
S125 : 제2 단어 풀을 생성하는 단계
S126 : 도서별 어휘 난이도 출현 빈도를 산출하는 단계
S127 : 제2 행렬을 생성하는 단계
S128 : 제1 도서 및 제3 도서들을 군집화하는 단계
S129 : 제2 도서에 대한 제1 난이도 지수를 지정하는 단계
S130 : 제2 난이도 지수를 산출하는 단계
S140 : 제3 난이도 지수를 산출하는 단계
S150 : 제1 난이도 지수 내지 제3 난이도 지수를 합산하여, 상기 도서별 난이도 지수로 지정하는 단계
S200 : 도서별 난이도 지수를 도서 데이터베이스에 반영하는 단계
S300 : 사용자별 독서능력을 평가하는 단계
S400 : 사용자별 독서능력을 사용자 데이터베이스에 반영하는 단계
S500 : 사용자에게 도서를 추천하는 단계
S600 : 독서 기록을 수신하는 단계
S700 : 독서 기록을 상기 사용자 데이터베이스에 반영하는 단계
S800 : 사용자별 독서능력을 평가하는 단계를 재수행하는 단계

Claims (3)

  1. 장치에 의해 수행되는, 인공지능 모델을 활용한 독서능력진단 기반 책 큐레이션 서비스 제공 방법에 있어서,
    도서별 난이도 지수를 산출하는 단계;
    상기 도서별 난이도 지수를 도서 데이터베이스에 반영하는 단계;
    사용자별 독서능력을 평가하는 단계;
    상기 사용자별 독서능력을 사용자 데이터베이스에 반영하는 단계;
    상기 사용자별 독서능력, 사용자별 독서 기록 및 상기 도서별 난이도 지수를 기반으로, 상기 사용자에게 도서를 추천하는 단계;
    사용자 단말로부터, 독서 기록을 수신하는 단계;
    상기 독서 기록을 상기 사용자 데이터베이스에 반영하는 단계; 및
    상기 독서 기록을 기반으로, 사용자별 독서능력을 평가하는 단계를 재수행하는 단계;를 포함하고,
    상기 도서별 난이도 지수를 산출하는 단계는:
    도서별로 카테고리를 지정하는 단계;
    상기 카테고리마다 포함된 도서별로, 어휘 난이도를 기반으로 제1 난이도 지수를 산출하는 단계;
    상기 카테고리마다 포함된 도서별로, 문장 길이를 기반으로 제2 난이도 지수를 산출하는 단계;
    상기 카테고리마다 포함된 도서별로, 책 구조를 기반으로 제3 난이도 지수를 산출하는 단계; 및
    상기 제1 난이도 지수 내지 제3 난이도 지수를 합산하여, 상기 도서별 난이도 지수로 지정하는 단계;를 포함하고,
    상기 카테고리를 지정하는 단계는:
    다수개의 서로 다른 제1 도서에 대한 카테고리를 입력받는 단계;
    상기 제1 도서의 콘텐츠를 입력받는 단계;
    상기 제1 도서가 아닌, 다수개의 서로 다른 제2 도서의 콘텐츠를 입력받는 단계;
    상기 제1 도서 및 제2 도서의 콘텐츠로부터 불용어를 제거하여 제1 도서 및 제2 도서 전체에 대한 제1 단어 풀을 생성하는 단계;
    상기 제1 단어 풀을 기반으로, 상기 제1 도서 및 제2 도서별로 단어별 출현 빈도를 산출하는 단계;
    상기 제1 도서 및 제2 도서를, 상기 단어별 출현 빈도를 기반으로 벡터화하여, 제1 행렬을 생성하는 단계;
    상기 제1 행렬을 기반으로, 상기 제1 도서 및 제2 도서에 대한 K-Means 클러스터링으로 상기 제1 도서 및 제2 도서를 군집화하는 단계; 및
    상기 제1 도서에 대해 기 입력된 카테고리를 기반으로, 상기 제1 도서와 동일한 군집으로 지정된 제2 도서에 대한 카테고리를 지정하는 단계;를 포함하고,
    상기 어휘 난이도를 기반으로 제1 난이도 지수를 산출하는 단계는:
    다수개의 서로 다른 제1 도서에 대한 제1 난이도 지수를 입력받는 단계;
    상기 제1 도서가 아닌, 다수개의 서로 다른 제3 도서의 콘텐츠를 입력받는 단계;
    제1 난이도 지수 산출에 사용될 제1 어휘들을 입력받는 단계;
    상기 제1 어휘별로, 어휘 난이도를 입력받는 단계;
    상기 제1 도서 및 제3 도서의 콘텐츠로부터 불용어를 제거하여, 도서별 제2 단어 풀을 생성하는 단계;
    상기 제1 어휘별 어휘 난이도 및 도서별 제2 단어 풀을 기반으로, 도서별 어휘 난이도 출현 빈도를 산출하는 단계;
    어휘 난이도를 '열'로, 도서 명을 '행'으로, 상기 도서별 어휘 난이도 출현 빈도를 '값'으로 하는 제2 행렬을 생성하는 단계;
    상기 제2 행렬을 기반으로, 상기 도서에 대한 K-Means 클러스터링으로 상기 제1 도서 및 제3 도서들을 군집화하는 단계;
    상기 제1 도서에 대해 기 입력된 제1 난이도 지수를 기반으로, 상기 제1 도서와 동일한 군집으로 지정된 제3 도서에 대한 제1 난이도 지수를 지정하는 단계;를 포함하고,
    상기 문장 길이를 기반으로 제2 난이도 지수를 산출하는 단계는:
    다수개의 서로 다른 제1 도서에 대한 제2 난이도 지수를 입력받는 단계;
    상기 제1 도서가 아닌, 다수개의 서로 다른 제4 도서의 콘텐츠를 입력받는 단계;
    상기 제1 도서 및 제4 도서의 콘텐츠로부터 문장들을 분리하여, 제1 문장을 추출하는 단계;
    상기 제1 문장마다 제1 글자수를 카운트하는 단계;
    상기 제1 글자수로부터 중복된 값을 제거하여 제2 글자수를 산출하는 단계;
    상기 제1 도서 및 제4 도서별로, 상기 제2 글자수에 대응하는 제1 문장의 개수를 카운트하여, 도서별 글자수 출현 빈도를 산출하는 단계;
    상기 제2 글자수를 '열'로, 도서 명을 '행'으로, 상기 도서별 글자수출현 빈도를 '값'으로 하는 제3 행렬을 생성하는 단계;
    상기 제3 행렬을 기반으로, 상기 도서에 대한 K-Means 클러스터링으로 상기 제1 도서 및 제4 도서들을 군집화하는 단계;
    상기 제1 도서에 대해 기 입력된 제2 난이도 지수를 기반으로, 상기 제1 도서와 동일한 군집으로 지정된 제4 도서에 대한 제2 난이도 지수를 지정하는 단계;를 포함하고,
    상기 책 구조를 기반으로 제3 난이도 지수를 산출하는 단계는:
    다수개의 서로 다른 제1 도서에 대한 제3 난이도 지수를 입력받는 단계;
    상기 제1 도서가 아닌, 다수개의 서로 다른 제5 도서의 콘텐츠를 입력받는 단계;
    상기 제1 도서 및 제5 도서의 콘텐츠로부터 상기 제1 도서 및 제5 도서별로, 페이지별 그림 비율을 산출하는 단계;
    상기 페이지별 그림 비율을 5개의 구간으로 구분하는 단계;
    상기 제1 도서 및 제5 도서별로, 상기 페이지별 그림 비율 구간에 대응하는 페이지의 개수를 카운트하여, 도서별 구간별 그림 페이지 출현 빈도를 산출하는 단계;
    상기 도서별 구간별 그림 페이지 출현 빈도를 상기 제1 도서 및 제5 도서별 전체 페이지 수로 나눈 값인 도서별 구간별 그림 빈도율을 산출하는 단계;
    상기 제1 도서 및 제5 도서의 콘텐츠로부터 상기 제1 도서 및 제5 도서별로, 페이지별 글자 비율을 산출하는 단계;
    상기 페이지별 글자 비율을 5개의 구간으로 구분하는 단계;
    상기 제1 도서 및 제5 도서별로, 상기 페이지별 글자 비율 구간에 대응하는 페이지의 개수를 카운트하여, 도서별 구간별 글자 페이지 출현 빈도를 산출하는 단계;
    상기 도서별 구간별 글자 페이지 출현 빈도를 상기 제1 도서 및 제5 도서별 전체 페이지 수로 나눈 값인 도서별 구간별 글자 빈도율을 산출하는 단계;
    상기 페이지별 그림 비율 구간 및 페이지별 글자 비율 구간을 '열'로, 도서 명을 '행'으로, 도서별 구간별 그림 빈도율 및 도서별 구간별 글자 빈도율을 '값'으로 하는 제4 행렬을 생성하는 단계;
    상기 제4 행렬을 기반으로, 상기 도서에 대한 K-Means 클러스터링으로 상기 제1 도서 및 제5 도서들을 군집화하는 단계; 및
    상기 제1 도서에 대해 기 입력된 제3 난이도 지수를 기반으로, 상기 제1 도서와 동일한 군집으로 지정된 제5 도서에 대한 제3 난이도 지수를 지정하는 단계;를 포함하고,
    상기 사용자별 독서능력을 평가하는 단계는:
    2비트로 구성된 등급 산출 기준 변수를 생성하는 제1 평가 단계;
    제1 난이도 등급으로 지정된 제1 문제를 출제하는 제2 평가 단계;
    상기 제1 문제에 대한 답안을 입력받는 제3 평가 단계;
    상기 등급 산출 기준 변수를 1 칸만큼 레프트 시프트(Left Shift) 연산(<<)하는 제4 평가 단계;
    상기 등급 산출 기준 변수의 두 번째 자릿수에 제3 평가 단계 또는 제8 평가 단계의 정답 여부를 입력하는 제5 평가 단계;
    상기 등급 산출 기준 변수를 기반으로, 난이도 하향, 난이도 유지 또는 난이도 상향을 판단하는 제6 평가 단계;
    상기 제6 평가 단계를 기반으로, 제1 난이도 등급으로부터 하향, 유지 또는 상향된 제2 난이도 등급의 제2 문제를 출제하는 제7 평가 단계;
    상기 제2 문제에 대한 답안을 입력받는 제8 평가 단계; 및
    지정된 총 문항 개수에 기반하여, 상기 제4 평가 단계 내지 제8 평가 단계를 반복 수행하는 단계;를 포함하여,
    상기 사용자 단말에 소정의 문제를 출제하고 상기 사용자 단말로부터 상기 문제에 대한 답안을 입력받아, 답안을 기반으로 소정의 독서능력 지수를 산출하도록 수행되는,
    인공지능 모델을 활용한 독서능력진단 기반 책 큐레이션 서비스 제공 방법
  2. 삭제
  3. 삭제
KR1020230037192A 2023-03-22 2023-03-22 인공지능 모델을 활용한 독서능력진단 기반 책 큐레이션 서비스 제공 방법, 장치 및 시스템 KR102567043B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020230037192A KR102567043B1 (ko) 2023-03-22 2023-03-22 인공지능 모델을 활용한 독서능력진단 기반 책 큐레이션 서비스 제공 방법, 장치 및 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020230037192A KR102567043B1 (ko) 2023-03-22 2023-03-22 인공지능 모델을 활용한 독서능력진단 기반 책 큐레이션 서비스 제공 방법, 장치 및 시스템

Publications (1)

Publication Number Publication Date
KR102567043B1 true KR102567043B1 (ko) 2023-08-14

Family

ID=87565745

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020230037192A KR102567043B1 (ko) 2023-03-22 2023-03-22 인공지능 모델을 활용한 독서능력진단 기반 책 큐레이션 서비스 제공 방법, 장치 및 시스템

Country Status (1)

Country Link
KR (1) KR102567043B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102615350B1 (ko) * 2023-09-26 2023-12-20 주식회사 뉴스쿨 뉴스독해지수를 기반으로 비문학 독해력 강화를 위한 사용자 맞춤형 학습 컨텐츠 제공 시스템

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020082161A (ko) * 2002-07-18 2002-10-30 (주)아틀란시스템 독서능력지수를 이용한 독서능력 관리방법 및 시스템
KR20050122571A (ko) * 2004-06-24 2005-12-29 김기형 어휘의 난이도 정보와 시소러스를 활용한 도서지수 부여시스템
KR101678521B1 (ko) 2016-06-07 2016-11-22 주식회사 미래엔 도서 추천 서비스 제공 장치 및 방법
KR101716050B1 (ko) 2015-04-30 2017-03-14 (주)웅진씽크빅 전자도서 추천 시스템 및 방법
KR102115486B1 (ko) * 2019-06-07 2020-05-26 (주)이루미에듀테크 독서 능력 진단 시스템, 방법, 및 장치
KR102282337B1 (ko) 2018-11-30 2021-07-26 조민선 도서 큐레이션 서비스 제공 방법, 장치 및 컴퓨터-판독가능 기록매체

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020082161A (ko) * 2002-07-18 2002-10-30 (주)아틀란시스템 독서능력지수를 이용한 독서능력 관리방법 및 시스템
KR20050122571A (ko) * 2004-06-24 2005-12-29 김기형 어휘의 난이도 정보와 시소러스를 활용한 도서지수 부여시스템
KR101716050B1 (ko) 2015-04-30 2017-03-14 (주)웅진씽크빅 전자도서 추천 시스템 및 방법
KR101678521B1 (ko) 2016-06-07 2016-11-22 주식회사 미래엔 도서 추천 서비스 제공 장치 및 방법
KR102282337B1 (ko) 2018-11-30 2021-07-26 조민선 도서 큐레이션 서비스 제공 방법, 장치 및 컴퓨터-판독가능 기록매체
KR102115486B1 (ko) * 2019-06-07 2020-05-26 (주)이루미에듀테크 독서 능력 진단 시스템, 방법, 및 장치

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102615350B1 (ko) * 2023-09-26 2023-12-20 주식회사 뉴스쿨 뉴스독해지수를 기반으로 비문학 독해력 강화를 위한 사용자 맞춤형 학습 컨텐츠 제공 시스템

Similar Documents

Publication Publication Date Title
Rasheed et al. Learning style detection in E-learning systems using machine learning techniques
Recker Scientific research in information systems: a beginner's guide
Guarín et al. A model to predict low academic performance at a specific enrollment using data mining
US11514809B2 (en) Educational and content recommendation management system
KR102096301B1 (ko) 액티브 러닝 기법을 적용한 머신 러닝 프레임워크 운용 방법, 장치 및 컴퓨터 프로그램
CN111460249A (zh) 一种基于学习者偏好建模的个性化学习资源推荐方法
CN111328407A (zh) 用于基于学习效率提供私人定制教育内容的机械学习方法、装置及计算机程序
Li et al. A competence-aware curriculum for visual concepts learning via question answering
Goggins et al. Learning Analytics at" Small" Scale: Exploring a Complexity-Grounded Model for Assessment Automation.
Nazaretsky et al. Empowering teachers with AI: Co-designing a learning analytics tool for personalized instruction in the science classroom
KR102567043B1 (ko) 인공지능 모델을 활용한 독서능력진단 기반 책 큐레이션 서비스 제공 방법, 장치 및 시스템
Giabbanelli et al. Overcoming the PBL assessment challenge: Design and development of the incremental thesaurus for assessing causal maps (ITACM)
CN114021722A (zh) 一种融合认知刻画的注意力知识追踪方法
PIAD DETERMINING THE DOMINANT ATTRIBUTES OF INFORMATION TECHNOLOGY GRADUATES EMPLOYABILITY PREDICTION USING DATA MINING CLASSIFICATION TECHNIQUES.
Geetha et al. Prediction of the academic performance of slow learners using efficient machine learning algorithm
Trandafili et al. Discovery and evaluation of student's profiles with machine learning
CN113283488B (zh) 一种基于学习行为的认知诊断方法及系统
Aydoğdu A new student modeling technique with convolutional neural networks: Learnerprints
Fagbola et al. Development of mobile-interfaced machine learning-based predictive models for improving students performance in programming courses
Ampadu Handling Big Data in Education: A Review of Educational Data Mining Techniques for Specific Educational Problems
CN114358988B (zh) 基于ai技术的教学方式推送方法及装置
Ninness et al. Identifying accurate and inaccurate stimulus relations: Human and computer learning
Salem Towards of intelligence education and learning
Gupta et al. Student Performance Evaluation Expert System Using Machine Learning to Make Cognitive Decisions
CN116502713B (zh) 一种基于加权元路径增强题目相似性嵌入的知识追踪方法

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant