KR20100028222A - 도서지수 부여 시스템의 도서지수 산출방법 - Google Patents

도서지수 부여 시스템의 도서지수 산출방법 Download PDF

Info

Publication number
KR20100028222A
KR20100028222A KR1020080087148A KR20080087148A KR20100028222A KR 20100028222 A KR20100028222 A KR 20100028222A KR 1020080087148 A KR1020080087148 A KR 1020080087148A KR 20080087148 A KR20080087148 A KR 20080087148A KR 20100028222 A KR20100028222 A KR 20100028222A
Authority
KR
South Korea
Prior art keywords
book
book index
index
difficulty
thesaurus
Prior art date
Application number
KR1020080087148A
Other languages
English (en)
Inventor
김기형
Original Assignee
김기형
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 김기형 filed Critical 김기형
Priority to KR1020080087148A priority Critical patent/KR20100028222A/ko
Publication of KR20100028222A publication Critical patent/KR20100028222A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education

Abstract

본 발명은 모든 종류의 출판물에 도서의 독해 난이도에 따른 지수를 객관적인 방법으로 부여하기 위한 도서지수 부여 시스템의 도서지수 산출방법에 관한 것으로,
효율적인 독서를 위해서 창안된 도서지수는 어휘 난이도, 빈도수, 그리고 문장의 길이를 기준으로 측정하여 기존의 주관적이고 비과학적인 도서 선택 방법에 체계적이고 과학적인 방법을 제시하지만 텍스트의 문장의 길이, 어휘의 난이도와 빈도수만으로 도서지수를 산출했을 때에 출판물의 성격과 특징을 간과할 수밖에 없었던 바,
이러한 오류를 개선하고 보다 정확한 도서지수를 산출하기 위하여 형태소 분석과 난이도 시소러스를 통해 산출된 1차 도서지수에 출판물 변인 즉, 글자의 크기(font), 삽화의 정도 그리고 도서의 분량(페이지 수)을 적용하여 최종 도서지수를 산출하는 것을 특징으로 하는 본 발명에 의하면 텍스트에 대한 분석과 독자의 권장 수준을 고려한 출판물에 대한 분석이 모두 적용되어 보다 더 객관적이고 과학적인 도서지수를 산출할 수 있게 될 뿐 아니라 출판사가 정한 도서의 권장 대상에 따른 출판물의 특성이 도서지수와 제대로 매칭됨으로써 출판사에게는 합리적인 기준을 제시할 수 있게 되고, 독자에게는 더욱 객관적이고 정확한 지수를 통해 손쉽게 개인별 맞춤 독서를 유도할 수 있게 되며, 교사나 부모들이 수준별 도서를 보다 쉽게 선택하고 교육할 수 있게 되어 자녀들에게 독서의 흥미 유발과 더불어 학습 및 집 중력을 향상시킬 수 있게 되는 등의 효과를 얻을 수 있게 된다.
도서지수, 난이도 시소러스, 출판물 변인

Description

도서지수 부여 시스템의 도서지수 산출방법 { The method of readability indexing system based on lexical difficulty and thesaurus utilizing the relation of publication }
본 발명은 모든 종류의 출판물에 도서의 독해 난이도에 따른 지수를 객관적인 방법으로 부여하기 위한 도서지수 부여 시스템에 관한 것으로, 더 자세하게는 형태소 분석과 난이도 시소러스를 통해 산출된 1차 도서지수에 출판물 변인을 적용하여 정교한 최종 도서지수를 산출할 수 있도록 하는 도서지수 부여 시스템의 도서지수 산출방법에 관한 것이다.
일반적으로 독서 능력을 향상시키기 위한 가장 효율적인 방법은 자신의 수준에 맞는 도서를 읽는 것이며, 그러기 위해서는 독자의 글에 대한 이해력과 도서의 난이도를 측정할 수 있는 객관적인 기준을 사용하여 독자와 도서의 수준을 측정할 수 있어야 한다.
글을 읽는 과정은 어휘를 인식하고, 그 어휘의 의미를 생각해 내고, 어휘가 포함된 문장의 구성 요소와 기능을 인식하며, 텍스트 내용을 통합하는 형태로 진행된다.
따라서 자신의 이해력 수준에 맞는 도서를 읽게 되면 책 속에서 이해되지 않는 어려운 어휘가 거의 없기 때문에 부담 없이 책을 읽을 수 있며, 대개 문장이 짧으면 이해의 속도가 빨라지고, 문장이 길면 그만큼 이해하기가 더 어려워진다.
본 발명이 관계하는 도서지수는 독자가 자신의 수준에 맞는 도서를 고를 수 있도록 어휘의 난이도와 문장의 길이(문장의 복잡성)에 따라 도서의 난이도를 과학적으로 측정하여 부여한 객관적인 지수이다.
도서지수는 책을 읽기 전에 출판물의 소비자인 독자나 독서 지도 교사 등에게 미리 그 책이 얼마나 어려운 책인지, 독자의 수준에 적절한 책인지 여부를 알려주는 지표가 될 수 있으며, 책의 선택을 앞 둔 사람들에게 선택에 필요한 객관적인 기준을 제공해 줄 수 있고, 개인의 독서력 향상을 위하여 수준에 적절한 도서를 선정하고자 할 때 개인들의 독서 능력을 평가해 줄 수도 있다.
그런데 기존의 도서지수는 어휘의 난이도와 문장의 길이만을 이용하여 도서의 난이도를 측정하였으며, 이와 같이 어휘의 난이도와 문장의 길이를 이용한 도서의 수준 측정은 도서의 읽기 난이도(Readability)를 객관적인 수치로 만들 수 있다는 장점 때문에 외국에서도 널리 이용되고 있다.
가독성 공식(Flesch Reading Ease Formula, 1948) 및 미국 메타메트릭스사(MetaMetrics)에서 개발한 렉사일 프레임워크(The LEXILE Framework) 등은 모두 어휘의 빈도, 문장의 길이와 같은 변인을 바탕으로 하여 도서의 수준을 측정한 것이다.
하지만 이러한 기준만으로는 정확한 도서지수를 산출하는데 한계가 있는데, 그 원인이 되는 것이 바로 출판물 변인이다.
즉, 어휘의 난이도와 빈도수, 문장 길이를 바탕으로 분석했을 때 대부분 도서의 경우 타당한 도서지수를 산출해 내지만 유아를 위한 그림책, 어린이를 위하여 전문적인 사항을 쉽게 풀어 쓴 책, 사춘기의 독자층을 겨냥한 책 등의 도서 자체의 특징이 매우 명확한 도서로부터는 상기 기준으로 정확한 도서지수를 산출할 수 없게 된다.
상기에서 말하는 도서 자체의 특징이 바로 출판물 변인을 의미하며, 이 출판물 변인을 활용하게 되면 더욱 정교하고 정확한 도서지수를 산출할 수 있게 된다.
참고적으로 출판물 변인이 뚜렷이 나타나는 도서의 특성은 다음과 같다.
1) 유아를 위한 그림 책 : 대부분 삽화가 각 페이지마다 삽입되어 있으며, 글자의 크기가 크고 분명하다.
2) 어린이를 위한 전문 분야 도서(어린이를 위한 과학, 미술, 음악 도서 등) : 어려운 전문 어휘가 많이 사용되었으나 그 설명에 해당하는 삽화가 삽입되어 이해를 돕고 있으며, 성인용 전문 서적에 비해 글자의 크기가 크고 도서의 분량(페이지 수)이 적다.
3) 사춘기의 독자층을 겨냥한 책 : 초등학교 고학년 이하에 해당하는 쉽고 일상적인 평이한 어휘로 쓰여져 있으나 구성이 복잡하고, 심오한 주제를 내포하고 있으며, 중학교 이상의 독자층을 대상으로 하기 때문에 글자의 크기가 작고, 삽화가 거의 사용되지 않으며, 도서의 분량(페이지 수)은 어휘의 수준이 초등학교 고학년 수준임을 감안한다면 많은 편에 속한다고 볼 수 있다.
한편 국내외로 중요성이 부각되고 있는 도서지수는 현재 영어 도서와 스페인어 도서에 대해서만 개발되어 적용되고 있는 실정이다.
영어의 경우 메타메트릭스사(MetaMetrics)가 운영하고 있는 렉사일 프레임워크(Lexile Framework)이라는 독서능력 평가 도구가 있지만 영어와 한국어는 언어체계 자체가 다르기 때문에 사용되는 어휘가 모두 다르며, 어휘의 빈도수 정보도 다르고, 문장의 복잡성을 계산하는 방법 등이 모두 다르기 때문에 상기 메타메트릭스사의 렉사일 프레임워크(Lexile Framework)를 통해 한국어 출판물의 도서지수를 산출할 수 없다.
이에 본 출원인은 한국어의 언어체계를 바탕으로 한 독서능력 평가도구를 개발하여 한국에서도 과학적이고 객관적인 도서능력 측정과 수준별 맞춤독서가 가능하도록 하였다.(특허 제10-2004-0047922호)
"어휘의 난이도 정보와 시소러스를 활용한 도서지수 부여 시스템"을 명칭으로 하는 본 출원인의 독서능력 평가 시스템은 개개의 어휘별 난이도 등급과 동음이의어 정보, 의미정보을 포함하는 난이도시소러스; 입력된 도서나 출판물을 분석하여 도서지수를 계산하여 보여 주며, 단순하게 도서지수 수치만 보여주는 것이 아니라 도서지수가 나오게 된 통계정보, 주변정보까지 보여줌은 물론 잘못된 결과에 대한 수정 기능까지 포함하고 있는 도서지수 개발 프로그램; 개별 사용자가 로그인을 통하여 자신의 도서지수를 확인하고, 관리할 수 있도록 해주는 도서지수평가 프로그램; 도서/출판물을 분석하여 해당 도서가 어느 분야에 속하는지를 결정하여 보여주는 분야 자동 설정 프로그램;을 구비하며, 어휘의 빈도수와 문장의 길이 외에 어 휘의 난이도까지 적용하여 정확한 도서지수를 산출한다.
그런데 어휘의 난이도와 빈도수, 문장의 길이를 토대로 1차적으로 도서지수를 계산한 후에 보다 정교하고 정확한 최종 도서지수를 산출하기 위해서는 도서의 특징을 고려하여 지수 조정을 해야 한다.
도서지수의 조정이 필요한 도서들의 특징을 살펴보면 글자의 크기와 삽화, 도서의 분량(페이지 수)이 도서의 난이도에 영향을 미치고 있음을 알 수 있다.
상기에서 글자의 크기와 삽화, 도서의 분량은 도서의 수준을 전적으로 결정할 수 있는 요인은 아니지만 권장 수준에 적합한 글자 크기, 도서의 분량, 삽화의 삽입은 읽기의 속도와 이해력을 향상시킨다는 것은 분명하다.
본 발명은 상기와 같은 종래의 실정을 감안하여 안출한 것이며, 그 목적이 난이도 시소러스와 도서지수 산출 프로그램을 구비하는 도서지수 부여 시스템에서 한국어로 된 독서의 대상이 되는 출판물에 대하여 도서지수를 산출함에 있어서 출판물 변인을 고려하여 보다 신뢰성이 뛰어난 도서지수를 산출할 수 있도록 하는 도서지수 부여 시스템의 도서지수 산출방법을 제공하는 데에 있는 것이다.
본 발명은 상기의 목적을 달성하기 위하여 형태소 분석과 난이도 시소러스를 통해 산출된 1차 도서지수에 출판물 변인을 적용하여 정교한 최종 도서지수를 산출하는 것을 특징으로 한다.
본 발명의 도서지수 부여 시스템의 도서지수 산출방법은 개개의 어휘별 난이도 등급과 동음이의어 정보, 의미정보를 포함하는 난이도시소러스와; 입력된 도서나 출판물을 분석하여 도서지수를 계산하여 보여 주며, 단순하게 도서지수 수치만 보여주는 것이 아니라 도서지수가 나오게 된 통계정보, 주변정보까지 보여줌은 물론 잘못된 결과에 대한 수정 기능까지 포함하고 있는 도서지수 산출 프로그램;을 구비하는 도서지수 부여 시스템에서 진행되며, 도서지수를 계산할 적어도 한 개 이상의 파일을 선택하여 선택된 파일 중 텍스트 파일 형식이 아닌 파일을 텍스트 파일로 변환하고, 제목 삭제, 정확한 구두점사용, 철자 오류 수정, 띄어쓰기 오류 수정의 전처리 과정을 수행하는 파일입력 및 전처리 단계; 전체 파일을 읽어서 파일크기를 알아내는 파일 전체 읽기 단계; 텍스트를 문장 단위로 나누는 문장나누기 단계; 입력된 문장을 형태소 별로 분석하는 형태소 해석 단계; 난이도 시소러스를 참조하여 잘못된 형태소 해석의 오류를 수정하는 오류 수정 단계; 형태소 중에서 체언과 용언, 부사 등을 추출하여 난이도 시소러스와 비교하여 각 단어에 대한 등급을 가져와서 1차 도서지수를 산출하는 1차 도서지수 산출 단계; 출판물 변인을 적용하여 최종 도서지수를 산출하는 최종 도서지수 산출 단계;로 이루어진다.
본 발명에 있어서 최종 도서지수 산출 단계는 해당 도서의 글자의 크기(Font)를 입력하는 글자크기 입력 단계; 도서에 삽화가 삽입된 수치를 입력하는 삽화정도 입력 단계; 도서의 순수한 텍스트 부분의 페이지 수를 입력하는 도서분량 입력 단계; 상기 글자크기 입력값, 삽화정도 입력값, 도서분량 입력값을 통해 지수 조정값을 산출하는 출판물 변인 계산 단계; 1차 도서지수에 상기 지수 조정값을 합 산하는 도서지수 조정 단계 산출된 최종 도서지수를 출력하는 최종 도서지수 출력 단계;로 이루어진다.
본 발명에 의하면 텍스트에 대한 분석과 독자의 권장 수준을 고려한 출판물에 대한 분석이 모두 적용되어 보다 더 객관적이고 과학적인 도서지수를 산출할 수 있게 된다.
아울러 본 발명에 의하면 출판물의 특성이 도서지수와 제대로 매칭됨으로써 출판사에게는 합리적인 기준을 제시할 수 있게 되고, 독자에게는 더욱 객관적이고 정확한 지수를 통해 손쉽게 개인별 맞춤 독서를 유도할 수 있게 되며, 교사나 부모들이 수준별 도서를 보다 쉽게 선택하고 교육할 수 있게 되어 자녀들에게 독서의 흥미 유발과 더불어 학습 및 집중력을 향상시킬 수 있게 되는 등의 효과를 얻을 수 있게 된다.
이하 본 발명의 구체적인 기술내용을 첨부도면에 의거하여 더욱 자세히 설명하면 다음과 같다.
도 1에는 본 발명이 관계하는 도서지수 부여 시스템의 구성도가 도시되어 있다.
본 발명이 관계하는 도서지수 부여 시스템은 개개의 어휘별 난이도 등급과 동음이의어 정보, 의미정보를 포함하는 난이도시소러스(Difficulty thesaurus; 101)와; 입력된 도서나 출판물을 분석하여 도서지수를 계산하여 보여 주며, 단순하 게 도서지수 수치만 보여주는 것이 아니라 도서지수가 나오게 된 통계정보, 주변정보까지 보여줌은 물론 잘못된 결과에 대한 수정 기능까지 포함하고 있는 도서지수 산출 프로그램(102);을 구비한다.
상기 도서지수 부여 시스템에서 난이도 시소러스(101)는 개개의 어휘별 난이도 등급과 동음이의어 정보, 의미정보 등을 포함한다.
난이도 시소러스(101)는 일정 단어 규모(예를 들면 50만 단어)로 각 어휘에 대한 품사 정보, 난이도 정보, 의미정보, 동음이의어 정보, 핵어휘 정보 등이 포함되어있는 것으로, 이런 정보들이 통합되어 데이터베이스로 구축된다.
도서지수 산출 프로그램(102)은 입력된 도서나 출판물을 분석하여 도서지수를 계산하여 보여주며, 단순하게 도서지수 수치만 보여 주는 것이 아니라 도서지수가 나오게 된 통계정보, 주변정보까지 보여 줌은 물론 잘못된 결과에 대한 수정 기능까지 포함한다.
도 2에는 본 발명의 최종 도서지수 산출 흐름도가 도시되어 있다.
상기 도서지수 부여 시스템에서 진행되는 본 발명의 도서지수 부여 시스템의 최종 도서지수 산출방법은 도서지수를 계산할 적어도 한 개 이상의 파일을 선택하여 선택된 파일 중 텍스트 파일 형식이 아닌 파일을 텍스트 파일로 변환하고, 제목 삭제, 정확한 구두점사용, 철자 오류 수정, 띄어쓰기 오류 수정의 전처리 과정을 수행하는 파일입력 및 전처리 단계(201); 전체 파일을 읽어서 파일 크기를 알아내는 파일 전체 읽기 단계(202); 텍스트를 문장 단위로 나누는 문장나누기 단계(203); 입력된 문장을 형태소 별로 분석하는 형태소 해석 단계(204); 난이도 시소 러스를 참조하여 잘못된 형태소 해석의 오류를 수정하는 오류 수정 단계(205); 형태소 중에서 체언과 용언, 부사 등을 추출하여 난이도 시소러스와 비교하여 각 단어에 대한 등급을 가져와서 1차 도서지수를 산출하는 1차 도서지수 산출 단계(206); 출판물 변인을 적용하여 최종 도서지수를 산출하는 최종 도서지수 산출 단계(207);로 이루어진다.
본 발명의 파일입력 및 전처리 단계(201)에서는 텍스트 파일로 변환 가능한 문서 파일이 모두 입력 가능하며, 도서지수 부여 시스템이 첫 번째로 하는 일은 도서지수를 계산할 적어도 한 개 이상의 파일을 선택하는 것이고, 선택된 파일 중 텍스트 파일 형식이 아닌 파일의 경우 텍스트 파일로 변환하게 된다.
파일 전체 읽기 단계(202)에서 도서지수 부여 시스템은 파일을 하나 하나씩 읽어서 처리하는데, 먼저 전체 파일을 읽어서 파일 크기를 알아내며, 이렇게 구해진 파일 크기는 도서지수 계산에 사용된 파일의 실제 크기를 파악하는 일과 전체 작업량 중 어느 정도 진행되었는지를 파악하는 기준이 된다.
문장나누기 단계(203)에서 하나의 문장은 한 줄로 적을 수도 있지만 한 줄에 1개 이상의 문장이 올 수도 있고, 한 문장이 여러 줄에 걸쳐 나올 수도 있기 때문에 먼저 문장 단위로 나누는 일은 중요하다.
형태소 해석 단계(204)에서는 어절 내에서만 형태소를 분석하는 것이 아니라 주변 어절까지 고려하여 형태소를 분석하고, 문장 단위로 처리하는 것이 정확한 형태소 분석에 유리하다.
또한 하나의 어절은 적어도 한 개 이상의 형태소로 구성되도록 하고, 기본적 으로 국어 형태소 규칙에 맞게 어절을 형태소 별로 분리해내는 것이 극히 바람직하다.
오류 수정 단계(205)는 형태소 분석 결과에서 나타나는 오류를 수정하는 단계이다.
예를 들면 특정의 뜻을 가진 명사이지만 사람 이름과 같은 고유명사로 쓰였을 경우에는 고유명사로 분류해야 하지만 형태소 분석 단계(204)에서는 일반명사로 분류하기 때문에 반드시 이러한 오류를 수정하는 작업을 해야 한다.
1차 도서지수 산출 단계(206)에서는 형태소 중에서 의미를 가진 체언과 용언, 부사 등을 추출하여 난이도 시소러스와 비교하여 각 단어에 대한 등급을 가져와서 도서지수를 산출하며, 이때 조사나 어미 등은 어휘적 의미를 가지지 않고 문법적 의미만 가지기 때문에 도서지수 계산에서 제외한다.
최종 도서지수 산출 단계(207)에서는 1차적으로 산출된 도서지수에 글자의 크기, 삽화의 정도, 도서의 분량을 계산한 출판물 변인 값을 가감하여 최종 도서지수를 산출한다.
도 3에는 본 발명의 출판물 변인 적용을 통한 최종 도서지수 산출 단계의 상세 흐름도가 도시되어 있다.
본 발명에 있어서 최종 도서지수 산출 단계(207)는 해당 도서의 글자의 크기(Font)를 입력하는 글자크기 입력 단계(301); 도서에 삽화가 삽입된 수치를 입력하는 삽화정도 입력 단계(302); 도서의 순수한 텍스트 부분의 페이지 수를 입력하는 도서분량 입력 단계(303); 상기 글자크기 입력값, 삽화정도 입력값, 도서분량 입력 값을 통해 지수 조정값을 산출하는 출판물 변인 계산 단계(304); 1차 도서지수에 상기 지수 조정값을 합산하는 도서지수 조정 단계(305); 산출된 최종 도서지수를 출력하는 최종 도서지수 출력 단계(306);로 이루어진다.
본 발명에 있어서 형태소 분석과 난이도 시소러스 등을 통해 산출된 1차 도서지수를 최종 도서지수 산출 단계(207)에서 조정할 때에는 글자의 크기와 삽화의 정도, 도서의 분량(페이지 수)까지 총 3가지의 출판물 변인을 적용한다.
이러한 변인들의 특징을 살펴보면 아래와 같다.
1) 글자의 크기 : 폰타스와 핀넬(Fountas & Pinnell, 1996)은 글씨 크기와 텍스트의 양은 책의 읽기 난이도에 영향을 미친다고 했다.
유아용 또는 초등학교 저학년 어린이를 위한 도서는 단어의 나열, 또는 단문으로 이루어져 있으며, 글자의 크기가 크고 분명하다.
또한 모든 페이지에서 글자가 일관성 있게 배치되어 있다.
반면 도서의 수준이 높아질수록 문장의 구조는 복잡해지고 글자의 크기는 작아진다.
2) 삽화의 정도 : 삽화란 문장을 보완하고 그 이해를 돕기 위해 문장 내용과 관계되는 전경, 인물 등을 묘사하여 글 속에 삽입하는 그림을 말한다.
삽화를 비롯하여 선명한 컬러 사진, 지도 등은 문자 언어가 가지고 있는 추상적인 내용을 보다 명료하게 전달해 줌으로써 본문의 내용을 구체적으로 이해하고 독자의 독서 의욕을 고취시키는 데 중요한 역할을 수행한다.
독서의 첫 걸음으로 읽는 도서들에서는 대부분 그림이 간단하고 명확하게, 직접적으로 도서의 내용을 지원한다.
홀맨(Hollman, 1995)은 좋은 그림책의 요건으로 ① 그림이 이야기를 잘 말해주어야 하고, ② 그림이 세부적인 내용과 정확하게 일치해야 하고, ③ 구성이 논리적이면서 성격이 잘 묘사되어야 하고, ④ 그림과 글이 효과적으로 의미를 전달해야 하고, ⑤ 그림의 색깔, 선, 형태, 질감, 모양, 매체 등이 전체적으로 조화를 이루어야 한다고 하였다.
대체로 유아용 그림책의 삽화가 어휘에 대하여 명확하고 구체적인 이미지를 제시하여 이해를 돕는다면 보다 높은 수준의 도서에서는 삽화가 더 복잡하며 이야기 구성을 강화시키고 확장시키는 데 이바지하기도 한다.
3) 도서의 분량 : 도서의 분량은 독자의 집중력과 이해력에 관련되어 있다.
도서의 분량이 많으면 시간과 장소의 제약이 가해질 수가 있기 때문에 그만큼 집중력의 저하를 가져올 수 있다.
또한 서로 연관된 사건들이 계속 이어지는 장편 소설의 경우 앞의 사건을 통해 뒤의 사건을 예측할 수 있어야 하기 때문에 독자의 작업 기억 용량에 따라 이해도의 차이를 보인다.
중학교 이상의 독자들에게는 크게 유효하지 않지만 유아 및 초등학교 독자들에게 있어 지나치게 많은 도서의 분량(페이지 수)은 독해력에 영향을 미치는 중요한 요인 중의 하나이다.
이처럼 보다 정교한 도서지수의 산출에 고려해야 하는 출판물 변인은 위에서 설명한 글자의 크기(font size), 삽화의 정도, 도서의 분량(페이지 수)으로 모두 세 가지이다.
본 발명은 상기 각 요인이 각 수준을 대표하는 기준에 맞지 않을 경우 맞지 않는 정도에 따라 차등하여 일정한 지수를 가감(加減)하는 방식을 사용한다.
예를 들어 도서지수 산출 프로그램에서 형태소 분석과 난이도 시소러스를 통해 산출된 1차 도서지수가 초등학교 4학년∼6학년 수준인 것으로 나타났는데, 해당 도서의 글자의 크기가 그 수준의 도서에 주로 사용되는 글자의 크기보다 작을 경우, 크기가 차이나는 정도에 따라 차등하여 일정 지수를 더해 주는 방식을 사용한다.(반대로 글자의 크기가 기준 크기보다 크면 일정 지수를 감해 준다.)
삽화의 경우도 각 등급에 맞는 기준을 세우고(가령 초등학교 1학년∼3학년의 경우 2,3 페이지당 한 개의 삽화) 각각에 세워진 기준보다 삽화가 적은 경우 그 정도에 따라 차등하여 일정 지수를 더해 주고, 더 많으면 일정 지수를 감해 준다.
도서의 분량도 마찬가지의 기준을 적용한다.
본 발명에 있어서 출판물 변인을 적용하여 가감(加減)하는 지수의 정도는 유아부터 성인에 이르기까지 다양한 수준과 분야로 구성된 책을 실제로 검토하고, 그 데이터를 기준으로 하여 선정하는 것이 바람직하다.
각 수준별로 기준이 되는 값의 예는 다음의 표와 같다.
Figure 112008504518870-PAT00001
한편 본 발명에 있어서 출판물 변인 계산 단계(304)에서는 글자크기, 삽화정도, 도서분량의 총 세 가지 출판물 변인 입력값을 통해 지수 조정값을 얻게 되고, 도서지수 조정 단계(305)에서는 상기 지수 조정값을 1차 산출 도서지수에 합산하여 신뢰성 높은 최종 도서지수를 산출하게 된다.
이상에서 설명한 본 발명은 전술한 설명 및 도면에 의해 한정되는 것은 아니고, 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능함은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어 명백할 것이다.
도 1은 본 발명이 관계하는 도서지수 부여 시스템의 구성도
도 2는 본 발명의 최종 도서지수 산출 흐름도
도 3은 본 발명의 출판물 변인 적용을 통한 최종 도서지수 산출 단계의 상세 흐름도
< 도면의 주요 부분에 대한 부호 설명 >
101 : 난이도 시소러스
102 : 도서지수 산출 프로그램

Claims (2)

  1. 개개의 어휘별 난이도 등급과 동음이의어 정보, 의미정보을 포함하는 난이도 시소러스와; 입력된 도서나 출판물을 분석하여 도서지수를 계산하여 보여 주며, 단순하게 도서지수 수치만 보여주는 것이 아니라 도서지수가 나오게 된 통계정보, 주변정보까지 보여줌은 물론 잘못된 결과에 대한 수정 기능까지 포함하고 있는 도서지수 산출 프로그램;을 구비하는 도서지수 부여 시스템의 도서지수 산출방법을 구성함에 있어서,
    도서지수를 계산할 적어도 한 개 이상의 파일을 선택하여 선택된 파일 중 텍스트 파일 형식이 아닌 파일을 텍스트 파일로 변환하고, 제목 삭제, 정확한 구두점 사용, 철자 오류 수정, 띄어쓰기 오류 수정의 전처리 과정을 수행하는 파일입력 및 전처리 단계; 전체 파일을 읽어서 파일 크기를 알아내는 파일 전체 읽기 단계; 텍스트를 문장 단위로 나누는 문장나누기 단계; 입력된 문장을 형태소 별로 분석하는 형태소 해석 단계; 난이도 시소러스를 참조하여 잘못된 형태소 해석의 오류를 수정하는 오류 수정 단계; 형태소 중에서 체언과 용언, 부사 등을 추출하여 난이도 시소러스와 비교하여 각 단어에 대한 등급을 가져와서 1차 도서지수를 산출하는 1차 도서지수 산출 단계; 출판물 변인을 적용하여 최종 도서지수를 산출하는 최종 도서지수 산출 단계;로 이루어지는 것을 특징으로 하는 도서지수 부여 시스템의 도서지수 산출방법.
  2. 제1항에 있어서, 최종 도서지수 산출 단계는 해당 도서의 글자의 크기(Font)를 입력하는 글자크기 입력 단계; 도서에 삽화가 삽입된 수치를 입력하는 삽화정도 입력 단계; 도서의 순수한 텍스트 부분의 페이지 수를 입력하는 도서분량 입력 단계; 상기 글자크기 입력값, 삽화정도 입력값, 도서분량 입력값을 통해 지수 조정값을 산출하는 출판물 변인 계산 단계; 1차 도서지수에 상기 지수 조정값을 합산하는 도서지수 조정 단계 산출된 최종 도서지수를 출력하는 최종 도서지수 출력 단계;로 이루어지는 것을 특징으로 하는 도서지수 부여 시스템의 도서지수 산출방법.
KR1020080087148A 2008-09-04 2008-09-04 도서지수 부여 시스템의 도서지수 산출방법 KR20100028222A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020080087148A KR20100028222A (ko) 2008-09-04 2008-09-04 도서지수 부여 시스템의 도서지수 산출방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020080087148A KR20100028222A (ko) 2008-09-04 2008-09-04 도서지수 부여 시스템의 도서지수 산출방법

Publications (1)

Publication Number Publication Date
KR20100028222A true KR20100028222A (ko) 2010-03-12

Family

ID=42178956

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080087148A KR20100028222A (ko) 2008-09-04 2008-09-04 도서지수 부여 시스템의 도서지수 산출방법

Country Status (1)

Country Link
KR (1) KR20100028222A (ko)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102190376B1 (ko) * 2020-04-07 2020-12-11 이동범 클라이언트 맞춤형 서적 제공 장치를 포함하는 서적 유통 시스템
KR102192171B1 (ko) * 2020-04-07 2020-12-16 이동범 클라이언트 맞춤형 서적 제공 장치 및 방법
KR102309633B1 (ko) 2020-12-30 2021-10-07 한국교육방송공사 양적/질적 평가에 기반한 독서 교육을 위한 컴퓨터 프로그램, 그러한 방법 및 이를 위한 컴퓨터 시스템
KR20220020184A (ko) * 2020-08-11 2022-02-18 주식회사 대교 국어 텍스트 자동 분석을 통한 독해지수 측정 방법 및 시스템
KR20230094304A (ko) 2021-12-21 2023-06-28 (주)웅진씽크빅 도서 지수를 이용한 도서 서비스 제공 시스템 및 방법

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102190376B1 (ko) * 2020-04-07 2020-12-11 이동범 클라이언트 맞춤형 서적 제공 장치를 포함하는 서적 유통 시스템
KR102192171B1 (ko) * 2020-04-07 2020-12-16 이동범 클라이언트 맞춤형 서적 제공 장치 및 방법
KR20220020184A (ko) * 2020-08-11 2022-02-18 주식회사 대교 국어 텍스트 자동 분석을 통한 독해지수 측정 방법 및 시스템
KR102309633B1 (ko) 2020-12-30 2021-10-07 한국교육방송공사 양적/질적 평가에 기반한 독서 교육을 위한 컴퓨터 프로그램, 그러한 방법 및 이를 위한 컴퓨터 시스템
KR20230094304A (ko) 2021-12-21 2023-06-28 (주)웅진씽크빅 도서 지수를 이용한 도서 서비스 제공 시스템 및 방법

Similar Documents

Publication Publication Date Title
Abu-Rabia et al. Advantages of bilinguals over monolinguals in learning a third language
Woods et al. Statistics in language studies
Sung et al. Leveling L2 texts through readability: Combining multilevel linguistic features with the CEFR
Crossley et al. Understanding expert ratings of essay quality: Coh-Metrix analyses of first and second language writing
Vermeer The relation between lexical richness and vocabulary size in Dutch L1 and L2 children
Masrai et al. How many words do you need to speak Arabic? An Arabic vocabulary size test
Anagnostou et al. From corpus-based collocation frequencies to readability measure
Reynolds et al. Modeling Taiwanese adolescent learners' English vocabulary acquisition and retention: The washback effect of the College entrance examination center's reference word list
Eika et al. Assessing the reading level of web texts for WCAG2. 0 compliance—can it be done automatically?
Kreyer et al. The development of phrasal complexity in German intermediate learners of English
KR20100028222A (ko) 도서지수 부여 시스템의 도서지수 산출방법
Sirico Jr Readability studies: how technocentrism can compromise research and legal determinations
Al Khalil et al. A large-scale leveled readability lexicon for Standard Arabic
Lee et al. Simple view of second language reading: A meta-analytic structural equation modeling approach
KR20220020184A (ko) 국어 텍스트 자동 분석을 통한 독해지수 측정 방법 및 시스템
Granados et al. Evidence for the interdependence hypothesis: a longitudinal study of biliteracy development in a CLIL/bilingual setting
KR100583174B1 (ko) 어휘의 난이도 정보와 시소러스를 활용한 도서지수 부여시스템
Li Research on Readability Grade Formula Based on HSK Compositions
Edtstadler et al. Improved German spelling acquisition through learning analytics
Francis Literacy and the language awareness hypothesis
Schmidt Grading tibetan children’s literature: A test case using the nlp readability tool “dakje”
Sun A contrastive analysis between English Vocabulary Profile and college English wordlist
Carstens et al. Designing a South African multilingual learner corpus of academic texts (SAMuLCAT)
Tellings et al. Clusters of word properties as predictors of elementary school children's performance on two word tasks
Madyakina et al. Professionally focused reading while studying English

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application