KR20050122571A - 어휘의 난이도 정보와 시소러스를 활용한 도서지수 부여시스템 - Google Patents
어휘의 난이도 정보와 시소러스를 활용한 도서지수 부여시스템 Download PDFInfo
- Publication number
- KR20050122571A KR20050122571A KR1020040047922A KR20040047922A KR20050122571A KR 20050122571 A KR20050122571 A KR 20050122571A KR 1020040047922 A KR1020040047922 A KR 1020040047922A KR 20040047922 A KR20040047922 A KR 20040047922A KR 20050122571 A KR20050122571 A KR 20050122571A
- Authority
- KR
- South Korea
- Prior art keywords
- difficulty
- book index
- book
- thesaurus
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000000877 morphologic effect Effects 0.000 claims abstract description 14
- 238000004364 calculation method Methods 0.000 claims description 20
- 238000011156 evaluation Methods 0.000 claims description 12
- 238000000034 method Methods 0.000 claims description 12
- 238000012217 deletion Methods 0.000 claims description 4
- 230000037430 deletion Effects 0.000 claims description 4
- 238000007781 pre-processing Methods 0.000 claims description 4
- 238000012937 correction Methods 0.000 claims description 2
- 230000010354 integration Effects 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 7
- 150000001875 compounds Chemical class 0.000 description 5
- 238000005259 measurement Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/232—Orthographic correction, e.g. spell checking or vowelisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/247—Thesauruses; Synonyms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Educational Technology (AREA)
- Educational Administration (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Machine Translation (AREA)
Abstract
Description
Claims (7)
- 개개의 어휘별 난이도 등급과 동음이의어 정보, 의미정보을 포함하는 난이도시소러스;입력된 도서나 출판물을 분석하여 도서지수를 계산하여 보여 주며, 단순하게 도서지수 수치만 보여주는 것이 아니라 도서지수가 나오게 된 통계정보, 주변정보까지 보여줌은 물론 잘못된 결과에 대한 수정 기능까지 포함하고 있는 도서지수개발 프로그램;개별 사용자가 로그인을 통하여 자신의 도서지수를 확인하고, 관리할 수 있도록 해주는 도서지수평가 프로그램;,도서/출판물을 분석하여 해당 도서가 어느 분야에 속하는지를 결정하여 보여주는 분야 자동 설정 프로그램;을 구비하는 것을 특징으로 하는 어휘의 난이도 정보와 시소러스를 활용한 도서지수 부여 시스템.
- 제1항에 있어서, 도서지수 개발 프로그램은도서지수를 계산할 적어도 한 개이상의 파일을 선택하여 선택된 파일 중 텍스트 파일 형식이 아닌 파일을 텍스트 파일로 변환하고, 제목 삭제, 정확한 구두점사용, 철자 오류 수정, 띄어쓰기 오류 수정 등의 전처리 과정을 수행하는 단계;전체 파일을 읽어서 파일 크기를 알아내는 단계;텍스트를 문장 단위로 나누는 단계;입력된 문장을 형태소 별로 분석하는 단계;난이도 시소러스를 참조하여 잘못된 형태소 해석의 오류를 수정하는 단계;형태소 중에서 체언과 용언, 부사 등을 추출하여 난이도 시소러스와 비교하여 각 단어에 대한 등급을 가져와서 도서지수를 계산하는 단계;입력 파일별로의 도서지수 계산 결과와 전체 입력 파일에 대한 통합 결과를 보여주는 단계;전체 문장수, 어절수, 형태소수, 문장당 어절수, 도서지수 계산에 사용된 형태소수, 동음이의어 수, 등급별 빈도수 등의 통계정보를 계산하는 단계;계산된 통계정보를 틀에 맞추어서 출력하는 단계;출현 단어들을 추출하여 등급별로 구분하고 빈도수를 계산하며, 아울러 품사별로 구분하고 그 빈도수도 계산하는 단계;입력 파일에 실제 등장한 단어들을 보여 줌으로써 사용된 단어들이 주로 어떤 단어들인지, 품사는 어떤 것이 많이 사용되었는지를 보여주는 단계;를 포함하는 것을 특징으로 하는 어휘의 난이도 정보와 시소러스를 활용한 도서지수 부여 시스템.
- 제1항 또는 제2항에 있어서,입력 파일에 나타나는 모든 형태소 중에서 도서지수 계산에 사용되는 형태소들만 고르고 난이도 시소러스와 비교하여 각 단어들의 난이도 등급을 알아낸 후 등급별로 비율을 계산하는 단계;난이도 등급별 비율을 계산한 후에는 난이도 등급에 가중치를 부여하는 단계;계산된 등급별 비율과 부여한 가중치를 이용하여 1차 도서지수를 계산하는 단계;계산된 1차 도서지수는 통계정보를 이용하여 조정하는 단계;출판물 자체의 형태에 따라 알파벳으로 출판물의 형태에 따른 도서등급을 부여하는 단계;출판물의 문학적 가치, 주제의 수준, 독자에 대한 적절성 등을 평가하여 도서등급을 부여하는 단계;를 거쳐 최종 도서지수를 산출하는 것을 특징으로 하는 어휘의 난이도 정보와 시소러스를 활용한 도서지수 부여 시스템.
- 제3항에 있어서,출현 단어들을 품사별로 보여주고 단어의 빈도수도 함께 보여주는 품사별보기와, 출현 단어들 중에서 난이도 시소러스에 등록된 단어들을 보여주는 등록어보기와, 형태소 해석 결과를 거쳐 도서지수 계산에 사용될 수 있는 품사이지만 난이도 시소러스에 등록되지 않은 단어들을 보여주는 미등록어보기를 포함하는 출현단어보기 단계;등급이 아주 높은 단어와 동일한 단어여서 도서지수가 예상외로 높게 나타나는 단어나 형태소 해석 오류로 인해 잘못 나뉘어진 단어를 삭제하는 지정단어 삭제단계;를 거쳐 1차 도서지수를 조정하는 것을 특징으로 하는 어휘의 난이도 정보와 시소러스를 활용한 도서지수 부여 시스템.
- 제1항에 있어서,대량의 코퍼스로부터 구해진 단어별 빈도수와 교과서, 동화 등에서 추출한 단어 빈도수, 전문가들이 정한 단어의 등급 등을 전체적으로 고려하여 각 단어마다 난이도 등급을 부여하는 단계;한 단어가 2가지 이상의 의미를 가지거나 한 단어가 다품사를 가지는 동음이 의어 정보를 추가하는 단계;단어 중에서 너무 흔하게 등장하여 난이도를 구분하는데 도움이 되지 않고, 정확한 도서지수 산출에 방해가 되는 단어인 핵어휘 정보를 추가하는 단계;빈도수는 낮지만 난이도 등급이 높은 단어와 같은 단어일 경우 도서지수 계산에 오류를 크게 발생시키는 고유명사 정보를 추가하는 단계;를 거쳐 1차 난이도 시소러스를 구축한 후 암호화과정을 거쳐 최종 난이도 시소러스로 변환하는 것을 특징으로 하는 어휘의 난이도 정보와 시소러스를 활용한 도서지수 부여 시스템.
- 제1항에 있어서, 분야 자동 설정 프로그램은도서지수를 계산할 적어도 한 개이상의 파일을 선택하여 선택된 파일 중 텍스트 파일 형식이 아닌 파일을 텍스트 파일로 변환하고, 제목 삭제, 정확한 구두점사용, 철자 오류 수정, 띄어쓰기 오류 수정 등의 전처리 과정을 수행하는 단계;전체 파일을 읽어서 파일 크기를 알아내는 단계;텍스트를 문장 단위로 나누는 단계;입력된 문장을 형태소 별로 분석하는 단계;난이도 시소러스를 참조하여 잘못된 형태소 해석의 오류를 수정하는 단계;난이도 시소러스를 참조하여 분야별 통계정보를 계산하는 단계;계산된 결과를 가장 유력한 분야와 함께 그래프로 출력하여 한 눈에 어느 분야에 속하는 도서인지 판별할 수 있도록 하는 단계;를 포함하는 것을 특징으로 하는 어휘의 난이도 정보와 시소러스를 활용한 도서지수 부여 시스템.
- 제1항에 있어서, 도서지수 평가 프로그램은사용자가 로그인을 하여 도서지수 평가에 응시하면 난이도 시소러스에서 수준별 어휘를 임의로 가져와서 만들어 둔 평가문제 데이터베이스에서 수준에 맞게 임의로 선택된 평가문제를 사용자에게 제시하는 단계;사용자의 문제풀이 후 도서지수를 계산하여 그 결과를 사용자 데이터베이스에 저장하고 사용자에게 제공하는 단계;도서지수 평가가 끝나면 시스템에서 추천도서 데이터베이스에 수록된 도서중에서 사용자 수준에 맞는 도서를 추천해주는 단계;를 포함하는 것을 특징으로 하는 어휘의 난이도 정보와 시소러스를 활용한 도서지수 부여 시스템.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020040047922A KR100583174B1 (ko) | 2004-06-24 | 2004-06-24 | 어휘의 난이도 정보와 시소러스를 활용한 도서지수 부여시스템 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020040047922A KR100583174B1 (ko) | 2004-06-24 | 2004-06-24 | 어휘의 난이도 정보와 시소러스를 활용한 도서지수 부여시스템 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20050122571A true KR20050122571A (ko) | 2005-12-29 |
KR100583174B1 KR100583174B1 (ko) | 2006-05-25 |
Family
ID=37294370
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020040047922A Expired - Fee Related KR100583174B1 (ko) | 2004-06-24 | 2004-06-24 | 어휘의 난이도 정보와 시소러스를 활용한 도서지수 부여시스템 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100583174B1 (ko) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100948827B1 (ko) * | 2009-10-19 | 2010-03-22 | 동국대학교 산학협력단 | 콘텐츠 제공 장치 및 콘텐츠 제공 방법 |
KR101114405B1 (ko) * | 2009-09-02 | 2012-02-22 | 박창섭 | 문서 분석 서비스 방법 |
KR101111715B1 (ko) * | 2008-11-20 | 2012-03-14 | 주식회사 매치앤픽스 | 행성계에 대비시켜 디스플레이되는 인터넷상에서의 3 차원 여론조사시스템 |
KR101148164B1 (ko) * | 2010-05-18 | 2012-05-23 | 경희대학교 산학협력단 | 사용자 사용 단어에 기반한 사용자의 주관적 웰빙 상태 판단 방법 |
KR20160066676A (ko) * | 2014-12-02 | 2016-06-13 | 한밭대학교 산학협력단 | 외국도서의 읽기 수준 판단 시스템 및 방법 |
KR102073262B1 (ko) * | 2019-06-07 | 2020-03-02 | (주)이루미에듀테크 | 전자책 제작 방법 및 장치 |
KR102201709B1 (ko) * | 2020-08-11 | 2021-01-12 | 주식회사 대교 | 국어 텍스트 자동 분석을 통한 독해지수 측정 방법 및 시스템 |
KR20220031958A (ko) * | 2020-09-06 | 2022-03-15 | 주식회사 참빛교육 | 도서 빅데이터 분석 시스템 |
KR102567043B1 (ko) * | 2023-03-22 | 2023-08-14 | 주식회사 레듀텍 | 인공지능 모델을 활용한 독서능력진단 기반 책 큐레이션 서비스 제공 방법, 장치 및 시스템 |
CN117668167A (zh) * | 2024-02-01 | 2024-03-08 | 《全国新书目》杂志有限责任公司 | 一种基于大数据分析的图书评级智能处理方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100206814B1 (ko) | 1996-10-25 | 1999-07-01 | 구자홍 | 어휘 자동 분류 장치 및 방법 |
KR20010008117A (ko) * | 2000-11-09 | 2001-02-05 | 조양래 | 사용자 어휘력 수준에 맞춘 문장 내 단어 자동 표시 방법,시스템 및 기록 매체 |
KR20020064821A (ko) * | 2001-02-03 | 2002-08-10 | (주)엔퀘스트테크놀러지 | 문서 장르 학습 시스템 및 그 방법과 그를 이용한 문서장르 분류시스템 및 그 방법 |
-
2004
- 2004-06-24 KR KR1020040047922A patent/KR100583174B1/ko not_active Expired - Fee Related
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101111715B1 (ko) * | 2008-11-20 | 2012-03-14 | 주식회사 매치앤픽스 | 행성계에 대비시켜 디스플레이되는 인터넷상에서의 3 차원 여론조사시스템 |
KR101114405B1 (ko) * | 2009-09-02 | 2012-02-22 | 박창섭 | 문서 분석 서비스 방법 |
KR100948827B1 (ko) * | 2009-10-19 | 2010-03-22 | 동국대학교 산학협력단 | 콘텐츠 제공 장치 및 콘텐츠 제공 방법 |
KR101148164B1 (ko) * | 2010-05-18 | 2012-05-23 | 경희대학교 산학협력단 | 사용자 사용 단어에 기반한 사용자의 주관적 웰빙 상태 판단 방법 |
KR20160066676A (ko) * | 2014-12-02 | 2016-06-13 | 한밭대학교 산학협력단 | 외국도서의 읽기 수준 판단 시스템 및 방법 |
KR102073262B1 (ko) * | 2019-06-07 | 2020-03-02 | (주)이루미에듀테크 | 전자책 제작 방법 및 장치 |
KR102201709B1 (ko) * | 2020-08-11 | 2021-01-12 | 주식회사 대교 | 국어 텍스트 자동 분석을 통한 독해지수 측정 방법 및 시스템 |
KR20220020184A (ko) * | 2020-08-11 | 2022-02-18 | 주식회사 대교 | 국어 텍스트 자동 분석을 통한 독해지수 측정 방법 및 시스템 |
KR20220031958A (ko) * | 2020-09-06 | 2022-03-15 | 주식회사 참빛교육 | 도서 빅데이터 분석 시스템 |
KR102567043B1 (ko) * | 2023-03-22 | 2023-08-14 | 주식회사 레듀텍 | 인공지능 모델을 활용한 독서능력진단 기반 책 큐레이션 서비스 제공 방법, 장치 및 시스템 |
CN117668167A (zh) * | 2024-02-01 | 2024-03-08 | 《全国新书目》杂志有限责任公司 | 一种基于大数据分析的图书评级智能处理方法 |
CN117668167B (zh) * | 2024-02-01 | 2024-04-05 | 《全国新书目》杂志有限责任公司 | 一种基于大数据分析的图书评级智能处理方法 |
Also Published As
Publication number | Publication date |
---|---|
KR100583174B1 (ko) | 2006-05-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Meara et al. | Tools for researching vocabulary | |
Sun et al. | Measuring translation difficulty: An empirical study | |
Sung et al. | CRIE: An automated analyzer for Chinese texts | |
Ishikawa | The ICNALE and sophisticated contrastive interlanguage analysis of Asian learners of English | |
US20110270603A1 (en) | Method and Apparatus for Language Processing | |
US20130149681A1 (en) | System and method for automatically generating document specific vocabulary questions | |
KR102201709B1 (ko) | 국어 텍스트 자동 분석을 통한 독해지수 측정 방법 및 시스템 | |
Sahu et al. | Evaluating performance of different grammar checking tools | |
Anagnostou et al. | From corpus-based collocation frequencies to readability measure | |
KR100583174B1 (ko) | 어휘의 난이도 정보와 시소러스를 활용한 도서지수 부여시스템 | |
Duan et al. | A longitudinal study of formulaic sequence use in second language writing: Complex dynamic systems perspective | |
KR20100028222A (ko) | 도서지수 부여 시스템의 도서지수 산출방법 | |
Armando et al. | Multi-LEX: A database of multi-word frequencies for French and English | |
Gruber-Miller et al. | Latin vocabulary knowledge and the readability of latin texts: A preliminary study | |
Acar et al. | A Turkish database for psycholinguistic studies based on frequency, age of acquisition, and imageability | |
Han et al. | Japanese sentence pattern learning with the use of illustrative examples extracted from the web | |
Lee et al. | Readability measurement of japanese texts based on levelled corpora | |
Sawaguchi et al. | Exploring the use of make+ noun collocations by Japanese EFL learners through a bilingual essay corpus | |
Teng Fatt | Text‐related variables in textbook readability | |
Kemp | An investigation of the vocabulary representative of postgraduate International Law texts | |
Mukherjee et al. | The role of surface, semantic and grammatical features on simplification of Spanish medical texts: A user study | |
Solovyev et al. | Computing syntactic parameters for automated text complexity assessment | |
Daelemans et al. | STYLENE: an environment for stylometry and readability research for Dutch | |
Jansen et al. | Evaluating four readability formulas for Afrikaans | |
Zhao | Sememe richness: a supplementary indicator of lexical richness in Chinese second-language writing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20040624 |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20060127 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20060515 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20060518 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20060518 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20090310 Start annual number: 4 End annual number: 4 |
|
FPAY | Annual fee payment |
Payment date: 20090514 Year of fee payment: 6 |
|
PR1001 | Payment of annual fee |
Payment date: 20090514 Start annual number: 5 End annual number: 6 |
|
LAPS | Lapse due to unpaid annual fee | ||
PC1903 | Unpaid annual fee |