KR20010008117A - 사용자 어휘력 수준에 맞춘 문장 내 단어 자동 표시 방법,시스템 및 기록 매체 - Google Patents

사용자 어휘력 수준에 맞춘 문장 내 단어 자동 표시 방법,시스템 및 기록 매체 Download PDF

Info

Publication number
KR20010008117A
KR20010008117A KR1020000066393A KR20000066393A KR20010008117A KR 20010008117 A KR20010008117 A KR 20010008117A KR 1020000066393 A KR1020000066393 A KR 1020000066393A KR 20000066393 A KR20000066393 A KR 20000066393A KR 20010008117 A KR20010008117 A KR 20010008117A
Authority
KR
South Korea
Prior art keywords
word
user
words
level
vocabulary
Prior art date
Application number
KR1020000066393A
Other languages
English (en)
Inventor
성열원
신원철
박준용
이호진
Original Assignee
조양래
주식회사 언어와 컴퓨터
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 조양래, 주식회사 언어와 컴퓨터 filed Critical 조양래
Priority to KR1020000066393A priority Critical patent/KR20010008117A/ko
Publication of KR20010008117A publication Critical patent/KR20010008117A/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • G06F16/337Profile generation, learning or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results

Abstract

본 발명은 외국어로 된 전자 문서 중 선택 영역 내의 단어에 대한 단어 정보를 사용자 어휘력 수준에 맞추어 자동으로 표시하는 방법, 시스템 및 기록 매체에 관한 것이다. 본 발명에 따른 사용자 어휘력 수준에 맞춘 문장 내 단어 자동 표시 방법은 먼저, 사용자로부터 블록 형태로 입력받은 선택 영역에서 단어들을 추출하여 원형을 복구한 후 품사를 추정하고, 단어의 어휘 수준을 산출한다. 사용자의 어휘력 수준은 사용자로부터 입력받거나 선택 영역 내 단어들의 어휘 수준을 참조하여 추정한다. 선택 영역에서 추출된 단어 중에서 사용자 어휘력 수준과 같거나 더 높은 어휘 수준을 가진 단어만을 추출하고, 단어 사전 데이터베이스를 검색하여 추출된 단어의 품사, 품사별 대역어, 빈도 수 정보를 추출하여 사용자에게 제공한다. 사용자 어휘력 수준에 맞는 단어에 대한 검색 결과만을 사용자에게 제공함으로써 불필요한 단어 검색 결과의 출력을 줄일 수 있다. 단어는 물론 숙어 및 관용어까지 검색해주므로 사용자는 단어 사전을 찾는 횟수를 줄일 수 있어 신속하고 효율적으로 사용자가 원하는 정보 취득이 가능하다. 사용자에 대한 어휘력 수준 정보가 없는 경우에도 사용자 어휘력 수준을 추정할 수도 있다.

Description

사용자 어휘력 수준에 맞춘 문장 내 단어 자동 표시 방법, 시스템 및 기록 매체{METHOD, SYSTEM AND COMPUTER-READABLE MEDIA FOR DISPLAYING AUTOMATICALLY WORDS IN THE SENTENCE ADAPTED TO USER'S WORD POWER}
본 발명은 사용자 어휘력 수준에 맞춘 문장 내 단어 자동 표시 방법, 시스템 및 기록 매체에 관한 것으로서, 보다 상세하게는 사용자의 어휘력 수준을 결정하여 사용자의 어휘력 수준에 맞는 단어를 추출하여 자동으로 표시하는 방법, 시스템 및 기록 매체에 관한 것이다.
최근 인터넷 사용자들이 급증하면서 필요한 정보를 얻기 위해 국내 뿐 아니라 외국의 뉴스, 정치, 경제, 인터넷 비즈니스 관련 웹사이트를 통해 다양한 정보를 얻고 있다.
외국어에 능숙치 못한 사람들에게는 국어가 아닌 외국어로 된 문서를 통해 필요한 정보를 얻는 데에는 시간이나 노력 면에서 많은 투자가 필요하다. 인터넷만이 아니더라도 외국어로 된 전자 메일이나 문서 파일을 읽고자할 경우에도 언어의 장벽으로 인한 불편함은 많다.
이러한 불편을 해소하기 위한 많은 영한 번역기와 같은 번역 소프트웨어가 있으나, 단어 단위가 아니고 문장 단위로 번역을 하며 번역 효율이 좋지 못하고 사용자가 만족할 만한 번역 결과를 내지 못하고 있다.
따라서, 문장 중에서 단어를 추출하고 단어의 뜻만을 사용자에게 제공하여 문장의 번역은 사용자에게 하도록 하여 기존의 영한 번역기가 가진 번역 효율 및 만족도가 떨어지는 문제를 해결할 수 있다.
즉, 문장 내 단어들에 대한 단어의 의미를 사용자에게 제공하고 사용자가 이를 토대로 문장을 해석하여 원하는 정보를 찾을 수 있도록 할 수 있다.
국내 특허 공개 제 1999-001315(발명의 명칭: "학습용 영한 단어 번역 소프트웨어")에서는 번역된 결과가 문장 단위가 아닌 단어 단위로 이루어지도록 하고 있다.
그러나, 이러한 문장 내 단어 추출에 의한 단어별 의미 출력 방법은 사용자의 어휘력 수준을 전혀 고려하지 않고 문장 내 단어들을 모두 검색하여 출력하고 있다.
사용자의 어휘력 수준보다 낮은 단어까지도 출력하게 되어 사용자로서는 이미 알고 있는 단어를 포함한 긴 출력 결과를 봐야하므로 외국어로 된 문서로부터 신속하게 원하는 정보를 취득하기에 불편한 점이 있었다.
따라서, 본 발명은 종래 기술의 제반 문제점을 해결하기 위하여 안출한 것으로서, 사용자로부터 전자 문서 중 일부를 블록 지정 방식에 의해 입력받아 해당 블록에서 단어를 추출 및 검색하고 사용자 어휘력 수준에 맞도록 단어 검색 결과를 사용자에게 제공하는 방법 및 시스템을 제공함에 그 목적이 있다.
또한, 본 발명의 목적은 사용자에 대한 어휘력 수준 정보가 없는 경우 사용자 어휘력 수준을 추정하여 추정된 어휘 수준에 맞는 단어에 대한 검색 결과를 사용자에게 제공하는 방법 및 시스템을 제공함에 그 목적이 있다.
도 1은 본 발명의 바람직한 일 실시예에 따른 사용자 어휘력 수준에 맞춘 문장 내 단어 자동 표시 방법을 구현하기 위한 시스템의 구성 블록도.
도 2a는 본 발명의 바람직한 일 실시예에 따른 사용자 어휘력 수준에 맞춘 문장 내 단어 자동 표시 방법을 구현하기 위한 시스템 중 품사 관련 데이터베이스의 내부 구조를 도시한 도면.
도 2b는 본 발명의 바람직한 일 실시예에 따른 사용자 어휘력 수준에 맞춘 문장 내 단어 자동 표시 방법을 구현하기 위한 시스템 중 단어 빈도 정보 데이터베이스의 내부 구조를 도시한 도면.
도 3은 본 발명의 바람직한 일 실시예에 따른 사용자 어휘력 수준에 맞춘 문장 내 단어 자동 표시 방법을 설명하는 순서도.
도 4는 본 발명의 바람직한 일 실시예에 따른 사용자 어휘력 수준에 맞는 단어 정보를 추출하기 위한 방법을 설명하는 순서도.
도 5는 본 발명의 바람직한 일 실시예에 따른 사용자의 어휘력 수준을 추정하기 위한 방법을 설명하는 순서도.
도 6a 내지 도 6c는 사용자의 어휘력 수준을 변화시키지 않은 상태에서 각각 정치, 경제, 기계 분야의 주제 글에 대해 본 발명인 사용자 어휘력 수준에 맞춘 문장 내 단어 자동 표시 방법을 적용한 결과 화면.
도 7은 본 발명의 바람직한 일 실시예에 따른 사용자로부터 사용자 어휘력 수준을 입력받기 위한 입력 화면.
도 8a 내지 도 8c는 본 발명의 바람직한 일 실시예에 따른 동일한 선택 영역에 대해 사용자의 어휘력 수준을 변화시키면서 본 발명인 사용자 어휘력 수준에 맞춘 문장 내 단어 자동 표시 방법을 적용한 결과 화면.
〈도면의 주요부분에 대한 부호의 설명〉
100-1,...,100-N : 클라이언트
110 : 단어 자동 표시 서버 120 : 단어 사전 데이터베이스
130 : 단어 빈도 정보 데이터베이스 140 : 품사 관련 데이터베이스
상술한 목적들을 달성하기 위하여 본 발명의 제1 측면에 따르면, 사용자의 입력에 기초하여 선택 영역을 설정하고, 상기 선택 영역 내 적어도 하나의 단어를 추출하고, 상기 추출된 단어의 어휘 수준을 산출하고, 미리 정해진 사용자의 어휘력 수준 및 상기 산출된 단어의 어휘 수준을 참조하여 상기 선택 영역에서 추출된 단어 중에서 표시될 어휘를 추출하고, 단어 사전 데이터베이스를 검색하여 상기 표시될 어휘의 단어 정보를 추출하여 사용자에게 제공하는 단계를 포함하는 사용자 어휘력 수준에 맞춘 문장 내 단어 자동 표시 방법 및 상기 방법에 상응하는 시스템이 제공된다.
상기 미리 정해진 사용자의 어휘력 수준은 상기 사용자로부터 어휘력 수준을 입력받아 정하여질 수 있다.
상기 선택 영역은 적어도 하나의 문장, 사용자가 블록으로 지정한 영역, 커서가 위치하는 라인, 커서가 위치하는 라인을 포함한 문장, 커서가 위치하는 라인을 포함하는 문단 및 커서가 위치하는 라인으로부터 위아래로 적어도 하나의 라인을 포함한 영역 중 적어도 하나로 선택될 수 있다.
상기 추출된 단어의 어휘 수준은 일반 단어 사전에서의 단어의 학습 수준 또는 단어의 사용 횟수를 반영한 별표 개수에 상응하는 빈도수 정보에 의해 결정될 수 있다.
상기 미리 정해진 사용자의 어휘력 수준은 상기 선택 영역에서의 단어들의 어휘 수준을 반영하여 상기 사용자의 어휘력 수준을 추정하여 정할 수 있다.
상기 사용자의 어휘력 수준 추정은 상기 선택 영역에서 추출된 복수의 단어들에 대해 평균 빈도 수 정보를 산출하고, 상기 평균 빈도 수 정보를 상기 사용자의 어휘력 수준으로 추정하여 정할 수 있다.
상기 미리 정해진 사용자의 어휘력 수준은 상기 사용자가 이전에 읽었던 선택 영역 내 단어들의 어휘 수준을 이용하여 정할 수 있다.
상기 사용자 어휘력 수준에 맞춘 문장 내 단어 자동 표시 방법은 상기 선택 영역에서 추출된 단어가 전문 분야 단어인지를 판단하는 단계 및 상기 판단 결과, 전문 분야 단어인 경우에는 해당 전문 용어 사전 데이터베이스를 검색하여 상기 선택 영역에서 추출된 단어의 정보를 추출하는 단계를 더 포함할 수 있다.
상기 사용자에게 제공되는 단어 정보는 상기 단어의 품사, 품사별 대역어, 빈도 수 중 적어도 하나를 포함할 수 있다.
본 발명의 다른 실시예에 따르면, 사용자의 입력에 기초하여 선택 영역을 설정하고, 상기 선택 영역 내 적어도 하나의 단어를 추출하고, 미리 정해진 사용자의 어휘력 수준 및 상기 추출 단어의 어휘 수준을 참조하여, 상기 추출된 단어 중에서 적어도 하나의 표시 단어를 선택하고-여기서, 상기 단어는 그에 상응하는 어휘 수준과 함께 저장되어 있음-, 복수의 단어와 각 단어에 상응하는 단어 정보가 저장되어 있는 단어 사전 데이터베이스를 검색하여 상기 표시 단어의 단어 정보를 사용자에게 제공하는 단계를 포함하는 사용자 어휘력 수준에 맞춘 문장 내 단어 자동 표시 방법 및 상기 방법에 상응하는 시스템이 제공된다.
본 발명의 제2 측면에 따르면, 사용자 어휘력 수준에 맞춘 문장 내 단어 자동 표시 방법을 수행하기 위하여 디지털 처리 장치에 의해 실행될 수 있는 명령어들의 프로그램이 유형적으로 구현되어 있으며 디지털 처리장치에 의해 판독될 수 있는 기록 매체에 있어서, 상기 사용자 어휘력 수준에 맞춘 문장 내 단어 자동 표시 방법이 사용자에 의해 지정된 선택 영역을 입력받고, 상기 선택 영역 내 적어도 하나의 단어를 추출하고, 상기 추출된 단어의 어휘 수준을 산출하고, 미리 정해진 사용자의 어휘력 수준 및 상기 산출된 단어의 어휘 수준을 참조하여 상기 선택 영역에서 추출된 단어 중에서 표시될 어휘를 추출하고, 단어 사전 데이터베이스를 검색하여 상기 표시될 어휘의 단어 정보를 추출하여 사용자에게 제공하는 단계를 포함하는 기록 매체가 제공된다.
이하, 본 발명에 따른 사용자 어휘력 수준에 맞춘 문장 내 단어 자동 표시 방법, 시스템 및 기록 매체의 바람직한 실시예를 첨부 도면을 참조하여 보다 상세히 설명한다.
도 1은 본 발명의 바람직한 일 실시예에 따른 사용자 어휘력 수준에 맞춘 문장 내 단어 자동 표시 방법을 구현하기 위한 시스템의 구성을 나타낸 블록도이다.
도 1에 도시된 바와 같이, 본 발명에 따른 사용자 어휘력 수준에 맞춘 문장 내 단어 자동 표시 시스템은 클라이언트(100-1, ..., 100-N, 이하 100 이라 한다), 단어 자동 표시 서버(110), 단어 사전 데이터베이스(120), 단어 정보 데이터베이스(130), 사용자 어휘력 수준 정보 데이터베이스(140)로 구성된다.
사용자는 클라이언트(100) 컴퓨터로 네트워크를 통해 단어 자동 표시 서버(110)에 접속하고, 사용자가 읽고자 하는 전자 문서 중에서 일부를 선택한다.
단어 자동 표시 서버(110)는 사용자의 선택 영역을 입력받고, 선택 영역 내에 있는 단어 중 사용자의 어휘력 수준에 맞는 단어를 추출하여 단어의 해석 결과를 클라이언트(100)에게 전송한다.
단어 자동 표시 시스템은 상기와 같은 웹 서버 기반으로 이루어 질 수 있다. 또한, 단어 자동 표시 시스템은 사용자의 클라이언트(100) 컴퓨터에 단어 자동 표시 방법을 실행하기 위한 프로그램을 설치하여 클라이언트(100) 컴퓨터 기반으로 이루어질 수도 있음은 물론이다.
단어 사전 데이터베이스(120)는 단어 사전을 데이터베이스화한 것으로, 단어별로 품사, 품사별 의미, 사용 빈도 수, 어휘 수준 등을 저장하고 있다. 자세한 설명은 후술한다.
상기 단어 사전 데이터베이스(120)는 단어 자동 표시 서버(110)를 운영하는 사업자 등이 직접 구축할 수도 있지만, 바람직하게는 이미 다른 웹사이트에서 구축된 단어 사전 데이터베이스를 이용할 수 도 있다.
즉, 서버 기반이든 클라이언트(100)기반이든 단어 사전 데이터베이스(120)를 참조할 때마다 해당 단어 사전을 구축한 웹사이트로 자동 링크 되도록 하여 기존에 구축된 데이터베이스를 사용할 수 있다.
단어 정보 데이터베이스(130)는 선택 영역에서 추출된 각각의 단어마다 단어의 원형, 추정된 품사, 품사별 의미 및 단어의 빈도 수 정보를 저장한다. 자세한 설명은 후술한다.
사용자 어휘력 수준 데이터베이스(140)에는 사용자의 어휘력 수준을 나타내는 정보가 저장된다. 예를 들어 중학생, 고등학생, 대학 교양 수준 등으로 구분할 수 있다. 사용자 어휘력 수준은 사용자가 직접 입력할 수도 있고 사용자가 읽는 전자 문서의 수준을 참작하여 추정할 수도 있다.
도 2a는 본 발명의 바람직한 일 실시예에 따른 사용자 어휘력 수준에 맞춘 문장 내 단어 자동 표시 방법을 구현하기 위한 시스템 중 단어 정보 데이터베이스(130)의 내부 구조를 도시한다.
도 2a를 참조하면, 단어 정보 데이터베이스(130)는 선택 영역에서 추출된 각각의 단어마다 단어의 원형 필드(132), 품사 필드(134), 품사별 대역어 필드(136), 단어의 빈도 수 정보 필드(138)를 포함한다.
상기 필드는 예를 들어 C언어의 구조체(structure)의 형태로 구성할 수 있으며, 후술할 선택 영역에서 추출된 단어의 원형 복구 후 품사 추정 과정에서 각각의 단어의 원형 필드에 상기 필드들이 덧붙여져 저장된다.
단어의 원형 필드(132)에는 선택 영역에서 추출된 각각의 단어의 품사가 추정된 후 품사별 원형이 저장된다.
각각의 단어마다 문장 내 사용될 때는 문법에 맞도록 변형된 형태로 사용될 수 있다. 예를 들어, 명사의 경우 원형 외에 3인칭 단수형, 복수형이 있고, 동사의 경우 동사 원형 외에 현재형, 현재 진행형, 과거형, 과거분사형 등이 있고, 형용사의 경우 원형 외에 비교급, 최상급 등이 있을 수 있다.
예를 들어, 'say'라는 동사의 경우 과거형인 'said', 과거분사형인 'said'에 대한 정보는 일반 단어 사전 데이터베이스에서 얻을 수 있다. 선택 영역 내에 'said'라는 단어가 있으면, 일반 단어 사전 데이터베이스에 저장된 'say-said-said
'의 'say' 동사의 과거형, 과거분사형을 참조하여 'said'를 원형인 'say'로 변환한다. 원형인 'say'가 단어의 원형 필드(132)에 저장된다.
품사 필드(132)에는 선택 영역에서 추출된 단어의 품사를 추정한 결과, 각각의 단어마다 문장 내 실제 품사로 가장 가능성 높은 순서로 제1 추정 품사, 제2추정 품사, 제3 추정 품사 등이 순서대로 저장되어 있다.
예를 들어 'drill'의 경우 문장 내 위치, 역할에 따라 명사(n), 자동사(vi), 타동사(vt)로 쓰일 수 있다. 이 경우, 명사(n), 자동사(vi), 타동사(vt) 순서대로 가능성이 높다고 하자. 품사 필드(132)에는 'drill' 단어에 대해 제1 추정 품사 필드에 명사(n), 제2 추정 품사 필드에 자동사(vi), 제3 추정 품사 필드에 타동사(vt)임을 식별케 하는 식별자가 저장된다. 이러한 품사 필드는 구조적으로 원형 필드인 'drill' 에 덧붙여져서 저장된다.
품사별 대역어 필드(134)에는 하나의 단어에 대해 각각의 추정되는 품사별로 단어 의미가 조금씩 다를 수 있으므로 이러한 각각의 품사별 단어 의미들이 저장된다.
예를 들어, 'drill'의 경우 명사(n)로 쓰일 때 사전을 찾아보면 교련, 드릴, 송곳 등의 의미가 있으므로 '교련', '드릴', '송곳'이 명사(n)라는 제1 추정 품사 필드에 덧붙여져서 품사별 대역어 필드(134)에 저장된다.
또한, 자동사(vi)로서의 의미인 '가르치다', '구멍을 내다'이 자동사(vi)라는 제2 추정 품사 필드에 덧붙여져서 품사별 대역어 필드(134)에 저장된다.
또한, 타동사(vt)로서의 의미인 '교련을 받다' '구멍을 내다'이 타동사(vi)라는 제3 추정 품사 필드에 덧붙여져서 품사별 대역어 필드(134)에 저장된다.
단어 빈도 수 정보 필드(138)에는 일반 단어 사전 데이터베이스를 참조하여 단어의 어휘 수준을 파악하기 위한 단어의 빈도 수가 각각의 단어의 원형 필드(132)에 구조적으로 덧붙여져서 저장된다.
도 2b는 본 발명의 바람직한 일 실시예에 따른 사용자 어휘력 수준에 맞춘 문장 내 단어 자동 표시 방법을 구현하기 위한 시스템 중 단어 사전 데이터베이스(120)의 내부 구조를 도시한다.
도 2b를 참조하면, 단어 사전 데이터베이스(140)는 일반 단어 사전 데이터베이스(122) 및 전문 단어 사전 데이터베이스(124)와 숙어 및 관용어 사전 데이터베이스(126)를 포함한다.
일반 단어 사전 데이터베이스(122)는 영어 단어를 예로 들면 일반 한영 사전을 데이터베이스화 한 것이다. 여기에는 각각의 단어별로 품사, 각 품사별 의미, 단어의 어휘 수준을 나타내는 사용 빈도 수 정보 등을 저장하고 있다.
전문 용어 사전 데이터베이스(124)는 선택 영역에서 추출된 단어가 일반 단어가 아닌 전문 용어인 경우에 참조하기 위한 것으로서 다양한 전공 분야별로 전공 용어를 데이터베이스화 한 것이다.
예를 들어, 의학 용어 사전, 법학 용어 사전, 경제 용어 사전, 물리학 용어 사전, 전자 용어 사전, 화학 용어 사전 등이 될 수 있다. 전문 분야 별로 세분화된 용어는 용량이 매우 방대하므로, 바람직하게는, 각 분야별로 이미 구축된 데이터베이스를 제공하는 웹사이트를 링크로 구성하여 해당 전공 용어 정보를 제공받을 수 있다.
숙어 및 관용어 사전 데이터베이스(126)는 선택 영역에서 추출된 단어들이 숙어 또는 관용어에 해당될 경우에 참조하기 위한 것이다.
상술한 설명에 의거하여 본 발명에 따른 방법에 대하여 좀더 상세히 설명하기로 한다.
도 3은 본 발명의 바람직한 일 실시예에 따른 사용자 어휘력 수준에 맞춘 문장 내 단어 자동 표시 방법을 설명하는 순서도이다.
도 3을 참조하면, 먼저 사용자 클라이언트(100)로부터 읽고자하는 전자 문서에서 해석하고자하는 영역(이하 '선택 영역'이라 한다)을 입력받는다(단계 301).
선택 영역은 사용자가 문장 단위로 지정할 수 있고, 선택 영역의 시작과 끝을 블록으로 지정할 수도 있다. 또한, 사용자의 선택 영역 지정이 없더라도 디폴트로 현재 커서가 위치하는 라인(line), 현재 커서가 위치하는 라인을 포함한 한 개의 문장, 현재 커서가 위치하는 라인을 포함하는 문단 및 현재 커서가 위치하는 라인으로부터 위아래 라인을 포함한 영역이 될 수도 있다.
선택 영역이 문장 단위가 아닌 블록으로 지정된 경우 등에는 문장 단위로 입력형을 만들기 위해 문장 종결 부호(., ?, !)를 참조하여 선택 영역을 문장 단위로 분리한다.
선택 영역 내에서 단어를 추출한다(단계 303). 즉, 위에서 분리된 각각의 문장에서 콤마(,), 세미 콜론(;), 콜론(:), 인용 부호(', ")와 같은 기호 등 불필요한 요소를 제거하고, 약어가 있는 경우에는 원형을 복구하여 단어를 추출한다.
선택 영역 내에서 추출된 단어의 품사를 추정한다(단계 305). 추출된 단어의 원형을 복구하고, 단어별 형태소 분석을 거쳐 단어의 품사를 예측한다.
단어의 원형 복구는 위에서 설명한 바와 같이 3인칭 단수형, 복수형, 현재 진행형, 과거형, 과거분사형, 비교급, 최상급 등으로 된 단어를 원형으로 복구하는 것을 의미한다. 즉, 단어를 원형으로 복구시켜 놓고 단어별 형태소 분석을 통하여 단어의 품사를 예측하는 것이다.
상기 추출된 단어의 빈도 수 정보를 단어 사전 데이터베이스(120)의 별표(★)개수를 참조하여 산출한다(단계 307). 일반 단어 사전 또는 숙어, 관용어 사전에는 별표(★)의 개수로 어휘의 난이도 수준을 표시하고 있다.
국내 영한 사전의 경우, 별표 세 개(★★★)는 중학교의 어휘 수준, 별표 2개(★★)는 고등학교 어휘 수준, 별표 하나(★)는 대학 교양 수준 등으로 구분하는 예가 있다. 국내 영한 사전의 경우 학습이 필요한 단계에 따라 별 표시를 하고, 별표가 적을 수록 어휘 수준이 높음을 나타낸다.
다른 예로, 콜린스 코빌드 영어 사전(COLLINS COBUILD ENGLISH DICTIONARY) 의 경우는 세계에서 발행되는 잡지, 신문, 출판물 등에서 약 2억 개의 말 뭉치(corpus)를 추출하여 사용 빈도 수에 따라 순위를 매기고, 순위 중 일정 범위(약 1/5 정도)를 기준으로 별표를 부여하고 있다.
별의 개수가 많을수록 단어가 잡지, 신문, 출판물 등에서 자주 사용되어 왔다는 것을 의미한다. 즉, 신문, 잡지, 기타 출판물에 실제로 사용되는 빈도 수를 세분화하여 빈도 수가 낮을수록 자주 사용되지 않는 것이며 별표의 개수가 적고 어휘 수준이 높은 것으로 볼 수 있다.
즉, 빈도 수 정보는 위와 같은 단어 사전의 별표의 개수를 나타낸다. 별표의 개수가 많을수록 어휘 수준이 낮은 것을 의미하고, 별표의 개수가 적을수록 어휘 수준이 높은 것을 의미한다.
따라서, 이와 같은 빈도 수 정보를 참조하여 단어의 어휘 수준을 파악할 수 있다.
선택 영역에서 사용자 어휘력 수준에 맞는 단어를 추출하고, 상기 단어를 해석해 놓은 해당 단어 사전 데이터베이스에서 단어의 품사, 품사별 의미, 빈도 수 등의 정보(이하 '단어 정보'라고 한다)를 추출한다(단계 309).
즉, 사용자의 어휘력 수준을 먼저 파악하여 어휘력 수준보다 높거나 같은 어휘 수준의 단어(이하 '표시될 어휘'라 한다)에 대해서만 해당 단어 사전 데이터베이스를 검색하여 단어 정보를 추출함으로써 단어 검색 효율을 높일 수 있다. 사용자 어휘력 수준을 파악하는 과정에 대해서는 도 4에서 상세히 설명한다.
상기 사용자 어휘 수준에 맞도록 추출된 단어들에 대한 단어 정보를 출력함으로써(단계 311), 선택 영역 내에 있는 단어들 중에서 사용자가 이미 알고 있는 쉬운 단어를 필터링하여 제거하고 사용자의 어휘 수준에 맞추어진 단어들만 출력할 수 있도록 한다.
도 4는 본 발명의 바람직한 일 실시예에 따른 사용자 어휘력 수준에 맞는 단어 정보를 추출하기 위한 방법을 설명하는 순서도이다.
도 4를 참조하면, 먼저, 선택 영역에서 추출된 단어 중에서 원형 복구되어 품사가 추정된 단어가 전문 분야 단어인지 여부를 판단한다(단계 401).
일반 단어 사전 데이터베이스(122) 또는 숙어 및 관용어 사전 데이터베이스(126)에 없는 경우에는 전문 분야 단어로 판단하고 해당 전문 용어 사전 데이터베이스(124)를 검색하여 단어 정보를 추출한다(단계 403).
또는, 사용자로부터 미리 검색할 전문 분야 사전을 입력받은 경우에는 사용자가 선택한 전문 분야 사전을 우선적으로 검색할 수도 있다(도 7참조).
상기 판단 결과, 전문 분야 단어가 아닌 경우에는 사용자의 어휘력 수준을 파악하기 위해 다음 단계를 수행한다.
먼저, 사용자가 자신의 어휘력 수준으로 미리 정해진 선택 항목들 중 하나를 선택하였는지를 판단하고(단계 405), 선택한 경우에는 선택된 어휘력 수준에 맞는 빈도 수의 단어를 선택 영역에서 추출한다(단계 407).
여기서 선택 항목들이란 바람직하게는 빈도 수 정보 즉, 일반 단어 사전의 별표 개수가 될 수 있다(도 7참조).
상기 판단 결과, 사용자가 선택 항목을 선택하지 않은 경우 또는 사용자의 어휘력 수준에 대해 사용자로부터 입력받은 정보가 전연 없는 경우에는 사용자 어휘력 수준을 추정한다(단계 409).
사용자 어휘력 수준을 추정하는 일례는 도 5에서 상세히 설명한다.
상기 사용자 어휘력 수준에 맞는 빈도 수의 단어를 선택 영역에서 추출하고(단계 411), 일반 단어 사전 데이터베이스(122)를 검색하여 상기 추출된 단어의 단어 정보를 추출한다(단계 413).
도 5는 본 발명의 바람직한 일 실시예에 따른 사용자의 어휘력 수준을 추정하기 위한 방법을 설명하는 순서도이다.
도 5를 참조하면, 먼저, 사용자가 읽고자하는 전자 문서, 즉 해석을 요구하는 전자 문서에서 샘플 단어들을 추출한다(단계 501). 즉, 선택 영역을 포함한 전자 문서 전체를 문장 단위로 분리하고, 위에서 설명한 방법으로 샘플 단어들을 추출하여 원형을 분리하고 품사를 추정한다.
일반 단어 사전 데이터베이스(122)를 참조하여 샘플 단어들의 빈도 수 정보를 추출하고(단계 503), 빈도 수 정보에 따라 사용자의 어휘력 수준을 추정한다(단계 505).
사용자의 어휘력 수준은 예를 들어 다음과 같이 판단할 수 있다.
만약, 추출된 샘플 단어들의 총 개수가 100개이고 100개 평균 별표 개수가 3개라고 하고, 사용자가 선택한 선택 영역의 단어 개수가 20개라고 하자. 전자 문서 전체가 해석이 쉽게 되는 경우는 사용자가 단어의 해석을 요구하는 일이 거의 없다고 가정하고 사용자의 어휘력 수준을 추정하는 알고리즘에서 제외시키기로 한다.
첫째, 일반적으로 선택 영역에는 사용자가 읽고자하는 전체 전자 문서에서 가장 해석하기 어려운 단어를 포함하는 경우가 있다. 예를 들어, 상기 예에서 선택 영역의 20개 단어들의 평균 별표 개수가 2인 경우가 있다고 하자.
전체 전자 문서의 별표 개수 평균이 선택 영역의 별표 개수 평균보다 큰 경우에는 사용자의 어휘력 수준을 전자 문서 전체의 평균 별표 개수(상기 예에서 별표 개수 3개)로 추정하여 별표 3개 이하의 단어들을 출력하도록 할 수 있다. 또는, 사용자의 어휘력 수준을 선택 영역의 별표 개수(상기 예에서 별표 개수 2개)로 추정하여 별표 2개 이하의 단어들을 출력하도록 할 수도 있다.
둘째, 선택 영역은 전자 문서 전체가 해석이 어려운 경우에도 그 중 꼭 해석이 필요한 부분만이 될 수도 있다. 여기에는 다시 2가지 경우 즉, 선택 영역에 있는 단어들 수준이 전자 문서 전체의 평균 어휘 수준보다 높거나 낮은 경우를 고려할 수 있다.
먼저, 선택 영역에 있는 단어들 수준이 전자 문서 전체의 평균 어휘 수준보다 높은 경우(예를 들어 상기 예에서 선택 영역의 별표 개수 평균이 2개인 경우)에는 첫째 경우와 같은 방법으로 사용자의 어휘력 수준을 추정할 수 있다.
다음, 선택 영역에 있는 단어들 수준이 전자 문서 전체의 평균 어휘 수준보다 낮은 경우(예를 들어 상기 예에서 선택 영역의 별표 개수가 평균 4개인 경우)는 사용자의 어휘력 수준을 선택 영역 내 단어들의 평균 별표 개수로 추정할 수 있다.
셋째, 선택 영역에 있는 단어들 수준이 전자 문서 전체의 평균 어휘 수준과 같은 경우(예를 들어 상기 예에서 선택 영역의 별표 개수가 평균 3개인 경우)는 사용자의 어휘력 수준을 선택 영역의 평균 별표 개수로 추정할 수 있다.
즉, 사용자의 어휘력 수준은 선택 영역에 있는 단어들의 평균 별표 개수를 반영하여 추정 가능하다.
또한, 사용자의 어휘력 수준은 다음과 같이 판단할 수도 있다.
사용자가 이전에 읽었던 선택 영역 내 단어들의 어휘 수준-예를 들어 별표 개수의 평균 등-를 사용자별로 사용자 어휘력 수준 정보 데이터베이스(140)에 저장해 두고, 나중에 사용자의 어휘력 수준을 추정하고자 할 때 이를 참조할 수 있다.
예를 들어, 특정 사용자가 그 동안 읽었던 전자 문서의 선택 영역 내 단어들의 평균 별표 개수를 산출하여 사용자 어휘력 수준 정보 데이터베이스(140)에 기록해 둔다. 다음 번에 동일한 사용자가 새로운 전자 문서를 읽고자 할 때는 사용자의 어휘력 수준을 별도로 입력받거나 추정하지 않는다. 사용자 어휘력 수준 정보 데이터베이스(140)에 미리 저장된 사용자의 어휘력 수준 정보를 읽어들여 사용자의 어휘력 수준으로 정할 수 있다.
다시 도 5로 돌아가서, 단계 507에서는 상기 추정된 사용자 어휘력 수준을 사용자 어휘력 수준 정보 데이터베이스(140)에 저장하여 사용자 개인마다의 어휘력 정보에 대한 데이터베이스를 구축하는데 활용할 수 있다.
도 6a 내지 도 6c는 사용자의 어휘력 수준을 변화시키지 않은 상태에서 각각 정치, 경제, 기계 분야의 주제 글에 대해 본 발명인 사용자 어휘력 수준에 맞춘 문장 내 단어 자동 표시 방법을 적용한 결과 화면이다.
도 6a 내지 도 6c에서는 사용자의 어휘력 수준을 별표 3개로 보고 빈도 수 정보가 별표 3개 이하(★★★, ★★, ★)인 단어 정보가 출력된 상태를 볼 수 있다. 사용자의 선택 영역이 블록(601, 605, 611)으로 지정되어 있다.
도 6a를 참조하면, 선택 영역에 대해 단어를 추출하여 원형을 복구하여 표시한다. 예를 들어, 선택 영역(601) 중 'said'를 'say'(603)로 표시한다. 선택 영역 중 'proposal'의 품사를 추정하여 가능한 품사는 명사 하나 뿐이므로 'proposal
'(607)을 명사(n)로 표시하고 있다.
또한, 품사별 대역어들을 표시하고 있다. 예를 들어, drill(609)의 경우에 위에서 상술한 바와 같이 명사(n)로 '교련', '드릴', '송곳'의 의미를 가짐을 표시하고, 자동사(vi)로 '가르치다', '구멍을 내다'의 의미를 가짐을 나타내며, 타동사(vt)로 '교련을 받다', '구멍을 내다'의 의미를 가짐을 나타낸다.
선택 영역(601) 내 단어 중 'dissented from'이라는 숙어의 경우 과거형을 원형인 dissent로 복구하고 품사를 추정한 후, 숙어 및 관용어 사전 데이터베이스(126)를 검색하여 'dissent from'(605)의 의미를 추출하여 표시한다.
도 6b를 참조하면, 블록으로 지정된 선택 영역(611) 내 단어 중에서 'info'의 경우 도면의 좌측 부분 출력 화면을 보면 단어의 원형이 'information'(613)임을 표시해준다. 또한, 'In addition to'(615)의 경우 숙어 및 관용어 사전 데이터베이스를 참조하여 그 의미를 표시해준다.
도 6c를 참조하면, 선택 영역(617) 중 'motor'에 대해 추정된 품사를 가장 확률이 높은 순서로 명사(n), 자동사(vi), 타동사(vt)로 구분하여 각각의 의미를 표시하고 있다(613 참조).
선택 영역(617) 중에서 'an advanced electric motor deliver the power' 부분을 보면 명사로 사용되고 있음을 알 수 있고, 품사 추정 결과와 일치함을 알 수 있다.
도 7은 본 발명의 바람직한 일 실시예에 따른 사용자로부터 사용자 어휘력 수준을 입력받기 위한 입력 화면이다.
도 7을 참조하면, 사용자가 자동 단어 찾기 빈도 수 설정(701) 항목에서 단어 빈도 수를 별표 1개에서 5개까지 중에서 선택할 수 있도록 하고 있다. 선택 항목은 중학교 수준, 고등학생 수준 또는 대학 교양 수준 등 사용자의 어휘력 수준을 구분하기 위한 항목이라면 도 7에 도시된 것 이외에도 어떠한 항목들로도 이루어질 수 있음은 물론이다.
사용자가 전문 용어 사전을 선택하면 선택 영역 내 단어를 검색함에 있어서, 선택된 전문 용어 사전 데이터베이스(124)를 우선적으로 검색하여 단어 정보를 추출한다(단계 401, 403 참조).
도 7에는 화학 용어(703-1), 컴퓨터/네트워크 용어(703-2), 통계 용어(703-3), 의학 용어(703-4)를 선택할 수 있도록 도시하고 있으나 이에 한정되는 것은 아니다. 기타 전공 분야의 용어 사전을 선택할 수 있는 항목을 얼마든지 추가할 수 있음은 물론이다.
도 8a 내지 도 8c는 본 발명의 바람직한 일 실시예에 따른 동일한 선택 영역에 대해 사용자의 어휘력 수준을 변화시키면서 본 발명인 사용자 어휘력 수준에 맞춘 문장 내 단어 자동 표시 방법을 적용한 결과 화면이다.
선택 영역(801)인 "Clinton told reporters at the White House on Monday that he hoped Yemen will give American investigators all the access they need to witnesses and suspects."은 블록(801)으로 지정되어 있다.
도 8a를 참조하면, 사용자 어휘력 수준이 별표 5개인 경우이다. 출력 결과(803)는 별표 5개 보다 어휘 수준이 높은 별표 5개 이하 단어들인 tell, reporter, at, White House, on, Monday 등이 출력된다.
도 8a에는 별표 5개 이하인 단어들 중에서 한 화면에 표시할 수 있는 단어들만을 보여주고 있으나, 나머지 단어들도 화면 스크롤을 통해 확인할 수 있다.
즉, 단어 사전 데이터베이스(120)를 검색하여 선택 영역(801) 내에 있는 단어들에 대한 별표 개수를 추출하고 별표 개수가 5개 이하인 단어들에 대해 품사, 품사별 대역어, 빈도 수를 출력한다.
도 8b를 참조하면, 사용자 어휘력 수준이 별표 3개인 경우이다. 출력 결과(805)는 별표 3개 보다 어휘 수준이 높은 별표 3개 이하 단어들인 White House, Yemen, investigator 만이 출력된다.
단어 사전 데이터베이스(120)를 검색하여 선택 영역(801) 내에 있는 단어들 중에서 별표 개수가 3개 이하(★★★, ★★, ★)인 단어들에 대해 품사, 품사별 대역어, 빈도 수를 출력한다. 도 8a에 비해 tell, reporter, at, on, Monday 등 별표 5개에서 4개까지의 어휘 수준이 낮은 단어들이 필터링되어 제거되었음을 알 수 있다.
도 8c를 참조하면, 사용자 어휘력 수준이 별표 1개인 경우로서, 출력 결과(807)는 별표 1개보다 어휘 수준이 높은 별표 1개 이하 단어들인 White House, Yemen 만이 출력된다.
단어 사전 데이터베이스(120)를 검색하여 선택 영역(801) 내에 있는 단어들 중에서 별표 개수가 1개 이하인 단어들에 대해 품사, 품사별 대역어, 빈도 수를 출력한다. 도 8b에 비해 investigator가 필터링되어 제거되었음을 알 수 있다.
즉, 별표 개수가 5개, 3개, 1개로 감소하여 사용자 어휘력 수준이 높아짐에 따라 출력되는 단어들의 어휘 수준이 점점 높아지고 출력 단어의 개수가 점점 줄어드는 것을 알 수 있다.
여기서, 단어는 영어 단어를 기준으로 설명하였지만, 영어 이외의 일본어, 독일어, 프랑스어, 스페인어 등의 외국어의 경우에도 해당 외국어 사전 데이터베이스를 이용하여 본 발명인 사용자 어휘력 수준에 맞추어 단어를 검색 출력해주는 방법이 적용될 수 있음은 자명하다.
상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야에서 통상의 지식을 가진 자라면 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.
본 발명에 따른 사용자 어휘력 수준에 맞춘 문장 내 단어 자동 표시 방법 및 시스템은 외국어로 된 전자 문서에 대해 사용자 어휘력 수준에 맞는 단어에 대한 검색 결과만을 사용자에게 제공함으로써 불필요한 단어 검색 결과의 출력을 줄이고 효율적인 단어 검색을 가능하게 하는 효과가 있다.
또한, 본 발명은 단어는 물론 숙어 및 관용어까지 검색해주므로 사용자는 출력 결과를 활용하면 단어 사전을 찾는 횟수를 줄일 수 있어 인터넷 웹사이트 등의 외국어 전자 문서로부터 신속하고 효율적으로 사용자가 원하는 정보 취득을 가능하도록 하는 효과도 있다.
또한, 본 발명은 사용자에 대한 어휘력 수준 정보가 없는 경우에도 사용자 어휘력 수준을 추정하여 추정된 어휘 수준에 맞는 단어에 대한 검색 결과를 사용자에게 제공하는 효과도 있다.

Claims (20)

  1. 사용자의 입력에 기초하여 선택 영역을 설정하는 단계;
    상기 선택 영역 내 적어도 하나의 단어를 추출하는 단계;
    상기 추출된 단어의 어휘 수준을 산출하는 단계;
    미리 정해진 사용자의 어휘력 수준 및 상기 산출된 단어의 어휘 수준을 참조하여 상기 선택 영역에서 추출된 단어 중에서 표시될 어휘를 추출하는 단계; 및
    단어 사전 데이터베이스를 검색하여 상기 표시될 어휘의 단어 정보를 추출하여 사용자에게 제공하는 단계
    를 포함하는 사용자 어휘력 수준에 맞춘 문장 내 단어 자동 표시 방법.
  2. 제1항에 있어서,
    상기 미리 정해진 사용자의 어휘력 수준은
    상기 사용자로부터 어휘력 수준을 입력받아 정하여지는 것
    을 특징으로 하는 사용자 어휘력 수준에 맞춘 문장 내 단어 자동 표시 방법.
  3. 제2항에 있어서,
    상기 선택 영역은
    적어도 하나의 문장, 사용자가 블록으로 지정한 영역, 커서가 위치하는 라인, 커서가 위치하는 라인을 포함한 문장, 커서가 위치하는 라인을 포함하는 문단 및 커서가 위치하는 라인으로부터 위아래로 적어도 하나의 라인을 포함한 영역 중 적어도 하나로 선택되는 것
    을 특징으로 하는 사용자 어휘력 수준에 맞춘 문장 내 단어 자동 표시 방법.
  4. 제3항에 있어서,
    상기 추출된 단어의 어휘 수준은
    일반 단어 사전에서의 단어의 학습 수준 또는 단어의 사용 횟수를 반영한 별표 개수에 상응하는 빈도수 정보에 의해 결정되는 것
    을 특징으로 하는 사용자 어휘력 수준에 맞춘 문장 내 단어 자동 표시 방법.
  5. 제1항에 있어서,
    상기 미리 정해진 사용자의 어휘력 수준은
    상기 선택 영역에서의 단어들의 어휘 수준을 반영하여 상기 사용자의 어휘력 수준을 추정하여 정하는 것
    을 특징으로 하는 사용자 어휘력 수준에 맞춘 문장 내 단어 자동 표시 방법.
  6. 제5항에 있어서,
    상기 사용자의 어휘력 수준 추정은
    상기 선택 영역에서 추출된 복수의 단어들에 대해 평균 빈도 수 정보를 산출하고, 상기 평균 빈도 수 정보를 상기 사용자의 어휘력 수준으로 추정하여 정하는 것
    을 특징으로 하는 사용자 어휘력 수준에 맞춘 문장 내 단어 자동 표시 방법.
  7. 제1항에 있어서,
    상기 미리 정해진 사용자의 어휘력 수준은
    상기 사용자가 이전에 읽었던 선택 영역 내 단어들의 어휘 수준을 이용하여 정하는 것
    을 특징으로 하는 사용자 어휘력 수준에 맞춘 문장 내 단어 자동 표시 방법.
  8. 제1항에 있어서,
    상기 선택 영역에서 추출된 단어가 전문 분야 단어인지를 판단하는 단계; 및
    상기 판단 결과, 전문 분야 단어인 경우에는 해당 전문 용어 사전 데이터베이스를 검색하여 상기 선택 영역에서 추출된 단어의 정보를 추출하는 단계
    를 더 포함하는 것을 특징으로 하는 사용자 어휘력 수준에 맞춘 문장 내 단어 자동 표시 방법.
  9. 제1항에 있어서,
    상기 사용자에게 제공되는 단어 정보는
    상기 단어의 품사, 품사별 대역어, 빈도 수 중 적어도 하나
    를 포함하는 사용자 어휘력 수준에 맞춘 문장 내 단어 자동 표시 방법.
  10. 사용자 어휘력 수준에 맞춘 문장 내 단어 자동 표시 방법을 수행하기 위하여 디지털 처리 장치에 의해 실행될 수 있는 명령어들의 프로그램이 유형적으로 구현되어 있으며 디지털 처리장치에 의해 판독될 수 있는 기록 매체에 있어서,
    상기 사용자 어휘력 수준에 맞춘 문장 내 단어 자동 표시 방법이
    사용자의 입력에 기초하여 선택 영역을 설정하는 단계;
    상기 선택 영역 내 적어도 하나의 단어를 추출하는 단계;
    상기 추출된 단어의 어휘 수준을 산출하는 단계;
    미리 정해진 사용자의 어휘력 수준 및 상기 산출된 단어의 어휘 수준을 참조하여 상기 선택 영역에서 추출된 단어 중에서 표시될 어휘를 추출하는 단계; 및
    단어 사전 데이터베이스를 검색하여 상기 표시될 어휘의 단어 정보를 추출하여 사용자에게 제공하는 단계
    를 포함하는 기록 매체.
  11. 제10항에 있어서,
    상기 미리 정해진 사용자의 어휘력 수준은
    상기 사용자로부터 어휘력 수준을 입력받아 정하여지는 것
    을 특징으로 하는 기록 매체.
  12. 제11항에 있어서,
    상기 선택 영역은
    적어도 하나의 문장, 사용자가 블록으로 지정한 영역, 커서가 위치하는 라인, 커서가 위치하는 라인을 포함한 문장, 커서가 위치하는 라인을 포함하는 문단 및 커서가 위치하는 라인으로부터 위아래로 적어도 하나의 라인을 포함한 영역 중 적어도 하나로 선택되는 것
    을 특징으로 하는 기록 매체.
  13. 제12항에 있어서,
    상기 추출된 단어의 어휘 수준은
    일반 단어 사전에서의 단어의 학습 수준 또는 단어의 사용 횟수를 반영한 별표 개수에 상응하는 빈도수 정보에 의해 결정되는 것
    을 특징으로 하는 기록 매체.
  14. 제10항에 있어서,
    상기 미리 정해진 사용자의 어휘력 수준은
    상기 선택 영역에서의 단어들의 어휘 수준을 반영하여 상기 사용자의 어휘력 수준을 추정하여 정하는 것
    을 특징으로 하는 기록 매체.
  15. 제14항에 있어서,
    상기 사용자의 어휘력 수준 추정은
    상기 선택 영역에서 추출된 복수의 단어들에 대해 평균 빈도 수 정보를 산출하고, 상기 평균 빈도 수 정보를 상기 사용자의 어휘력 수준으로 추정하여 정하는 것
    을 특징으로 하는 기록 매체.
  16. 제10항에 있어서,
    상기 미리 정해진 사용자의 어휘력 수준은
    상기 사용자가 이전에 읽었던 선택 영역 내 단어들의 어휘 수준을 이용하여 정하는 것
    을 특징으로 하는 기록 매체.
  17. 제10항에 있어서,
    상기 선택 영역에서 추출된 단어가 전문 분야 단어인지를 판단하는 단계; 및
    상기 판단 결과, 전문 분야 단어인 경우에는 해당 전문 용어 사전 데이터베이스를 검색하여 상기 선택 영역에서 추출된 단어의 정보를 추출하는 단계
    를 더 포함하는 것을 특징으로 하는 기록 매체.
  18. 제1항에 있어서,
    상기 사용자에게 제공되는 단어 정보는
    상기 단어의 품사, 품사별 대역어, 빈도 수 중 적어도 하나
    를 포함하는 사용자 어휘력 수준에 맞춘 문장 내 단어 자동 표시 방법.
  19. 프로그램이 저장되어있는 메모리; 및
    상기 메모리에 결합되어 상기 프로그램을 실행하는 프로세서
    를 포함하되,
    상기 프로세서는 상기 프로그램에 의해 ⅰ) 사용자의 입력에 기초하여 선택 영역을 설정하는 단계, ⅱ) 상기 선택 영역 내 적어도 하나의 단어를 추출하는 단계, ⅲ) 상기 추출된 단어의 어휘 수준을 산출하는 단계, ⅳ) 미리 정해진 사용자의 어휘력 수준 및 상기 산출된 단어의 어휘 수준을 참조하여 상기 선택 영역에서 추출된 단어 중에서 표시될 어휘를 추출하는 단계, ⅴ) 단어 사전 데이터베이스를 검색하여 상기 표시될 어휘의 단어 정보를 추출하여 사용자에게 제공하는 단계를 실행하는 사용자 어휘력 수준에 맞춘 문장 내 단어 자동 표시 시스템.
  20. 사용자의 입력에 기초하여 선택 영역을 설정하는 단계;
    상기 선택 영역 내 적어도 하나의 단어를 추출하는 단계;
    미리 정해진 사용자의 어휘력 수준 및 상기 추출 단어의 어휘 수준을 참조하여, 상기 추출된 단어 중에서 적어도 하나의 표시 단어를 선택하는 단계-여기서, 상기 단어는 그에 상응하는 어휘 수준과 함께 저장되어 있음-; 및
    복수의 단어와 각 단어에 상응하는 단어 정보가 저장되어 있는 단어 사전 데이터베이스를 검색하여 상기 표시 단어의 단어 정보를 사용자에게 제공하는 단계
    를 포함하는 사용자 어휘력 수준에 맞춘 문장 내 단어 자동 표시 방법.
KR1020000066393A 2000-11-09 2000-11-09 사용자 어휘력 수준에 맞춘 문장 내 단어 자동 표시 방법,시스템 및 기록 매체 KR20010008117A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020000066393A KR20010008117A (ko) 2000-11-09 2000-11-09 사용자 어휘력 수준에 맞춘 문장 내 단어 자동 표시 방법,시스템 및 기록 매체

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020000066393A KR20010008117A (ko) 2000-11-09 2000-11-09 사용자 어휘력 수준에 맞춘 문장 내 단어 자동 표시 방법,시스템 및 기록 매체

Publications (1)

Publication Number Publication Date
KR20010008117A true KR20010008117A (ko) 2001-02-05

Family

ID=19698055

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020000066393A KR20010008117A (ko) 2000-11-09 2000-11-09 사용자 어휘력 수준에 맞춘 문장 내 단어 자동 표시 방법,시스템 및 기록 매체

Country Status (1)

Country Link
KR (1) KR20010008117A (ko)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020042021A (ko) * 2000-11-29 2002-06-05 송제훈 워드 슬라이드를 이용한 학습 방법
KR100583174B1 (ko) * 2004-06-24 2006-05-25 김기형 어휘의 난이도 정보와 시소러스를 활용한 도서지수 부여시스템
KR101022793B1 (ko) * 2010-09-01 2011-03-17 김태성 표시와 비표시의 반복을 이용한 단어 학습 서비스 시스템 및 서비스 방법
KR101114405B1 (ko) * 2009-09-02 2012-02-22 박창섭 문서 분석 서비스 방법
KR20180111002A (ko) * 2017-03-30 2018-10-11 주식회사 마이소사이어티 다문화 구성원을 위한 대안 단어 추천 방법, 장치 및 컴퓨터 프로그램

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06318227A (ja) * 1992-03-03 1994-11-15 Nec Corp 機械翻訳用訳語選択支援装置
JPH113334A (ja) * 1997-06-12 1999-01-06 Canon Inc 翻訳装置及び翻訳方法
JP2000089882A (ja) * 1998-09-14 2000-03-31 Omron Corp 言語の翻訳・学習支援システム及びプログラム記憶媒体
KR20020034776A (ko) * 2000-11-03 2002-05-09 하오 밍 여 웹을 통하여 단어를 번역하는 방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06318227A (ja) * 1992-03-03 1994-11-15 Nec Corp 機械翻訳用訳語選択支援装置
JPH113334A (ja) * 1997-06-12 1999-01-06 Canon Inc 翻訳装置及び翻訳方法
JP2000089882A (ja) * 1998-09-14 2000-03-31 Omron Corp 言語の翻訳・学習支援システム及びプログラム記憶媒体
KR20020034776A (ko) * 2000-11-03 2002-05-09 하오 밍 여 웹을 통하여 단어를 번역하는 방법

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020042021A (ko) * 2000-11-29 2002-06-05 송제훈 워드 슬라이드를 이용한 학습 방법
KR100583174B1 (ko) * 2004-06-24 2006-05-25 김기형 어휘의 난이도 정보와 시소러스를 활용한 도서지수 부여시스템
KR101114405B1 (ko) * 2009-09-02 2012-02-22 박창섭 문서 분석 서비스 방법
KR101022793B1 (ko) * 2010-09-01 2011-03-17 김태성 표시와 비표시의 반복을 이용한 단어 학습 서비스 시스템 및 서비스 방법
WO2012030058A1 (ko) * 2010-09-01 2012-03-08 Kim Tae-Sung 표시와 비표시의 반복을 이용한 단어 학습 서비스 시스템 및 서비스 방법
KR20180111002A (ko) * 2017-03-30 2018-10-11 주식회사 마이소사이어티 다문화 구성원을 위한 대안 단어 추천 방법, 장치 및 컴퓨터 프로그램

Similar Documents

Publication Publication Date Title
Keller et al. Using the web to obtain frequencies for unseen bigrams
US7403889B2 (en) Electronic dictionary with example sentences
KR101004515B1 (ko) 문장 데이터베이스로부터 문장들을 사용자에게 제공하는 컴퓨터 구현 방법 및 이 방법을 수행하기 위한 컴퓨터 실행가능 명령어가 저장되어 있는 유형의 컴퓨터 판독가능 기록 매체, 문장 데이터베이스로부터 확인 문장들을 검색하는 시스템이 저장되어 있는 컴퓨터 판독가능 기록 매체
CN107818085B (zh) 阅读机器人进行阅读理解的答案选择方法及系统
Daelemans et al. Automatic Sentence Simplification for Subtitling in Dutch and English.
US20070203688A1 (en) Apparatus and method for word translation information output processing
JP2001195404A (ja) 句翻訳方法およびシステム
JP2008522332A (ja) 自動的に文書を拡充するシステムおよび方法
US20070061131A1 (en) Japanese virtual dictionary
Capstick et al. A system for supporting cross-lingual information retrieval
GB2401972A (en) Identifying special word usage in a document
Othman et al. English-asl gloss parallel corpus 2012: Aslg-pc12
KR101541170B1 (ko) 텍스트 요약 장치 및 방법
Park et al. Is the sky pure today? AwkChecker: an assistive tool for detecting and correcting collocation errors
KR20010008117A (ko) 사용자 어휘력 수준에 맞춘 문장 내 단어 자동 표시 방법,시스템 및 기록 매체
JP4499179B1 (ja) 端末装置
JP3937741B2 (ja) 文書の標準化
JP2008204133A (ja) 回答検索装置及びコンピュータプログラム
JP4054035B2 (ja) データベース構築装置、データベース構築方法、データベース構築プログラムおよび記録媒体
JP2004334699A (ja) テキスト評価装置、テキスト評価方法、プログラム及び記憶媒体
JPH07244665A (ja) 機械翻訳システム用辞書・ルール学習方法及び機械翻訳システム用辞書・ルール学習装置
Takeuchi et al. Flexible automatic look-up of English idiom entries in dictionaries
JP7167996B2 (ja) 事例検索方法
Wittmann et al. Some Language Resources and Tools for Computational Processing of Portuguese at INESC.
JPH07152778A (ja) 文書検索装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application