KR20070076126A - 전자 사전 - Google Patents

전자 사전 Download PDF

Info

Publication number
KR20070076126A
KR20070076126A KR1020060005154A KR20060005154A KR20070076126A KR 20070076126 A KR20070076126 A KR 20070076126A KR 1020060005154 A KR1020060005154 A KR 1020060005154A KR 20060005154 A KR20060005154 A KR 20060005154A KR 20070076126 A KR20070076126 A KR 20070076126A
Authority
KR
South Korea
Prior art keywords
word
query
dictionary
search
circular
Prior art date
Application number
KR1020060005154A
Other languages
English (en)
Inventor
김유남
이현배
곽민성
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to KR1020060005154A priority Critical patent/KR20070076126A/ko
Publication of KR20070076126A publication Critical patent/KR20070076126A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • G06F40/157Transformation using dictionaries or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 원형 단어 보정 엔진을 이용한 전자사전에 관한 것이다.
본 발명에 따른 전자사전은, 카메라로 촬영된 문서 영상 내에서 인식된 문자나, 사용자가 직접 입력한 단어, 문서 파일을 열어서 디스플레이 할 때 선택되는 단어를 초기 질의어로 하여 사전 데이터 베이스 내에서 해당 단어를 검색하고, 해당 단어의 검색에 실패하였을 경우 또는 단어 검색 이전에 초기 질의어를 원형 단어로 보정한 후 보정된 원형 단어를 최종 질의어로 하여 검색을 수행함으로써, 보다 정확한 검색 결과를 낼 수 있다.
전자사전, 검색, 질의어, 보정

Description

전자 사전{ELECTRONIC DICTIONARY}
도1은 본 발명의 제 1 실시예에 따른 전자사전 장치의 블럭도
도2는 본 발명의 제 1 실시예에 따른 전자사전 검색방법의 플로우차트
도3은 본 발명의 제 2 실시예에 따른 전자사전 장치의 블럭도
도4는 본 발명의 제 3 실시예에 따른 전자사전 장치의 블럭도
본 발명은 원형 단어 보정 엔진을 이용한 전자사전에 관한 것이다.
전자사전은 사용자가 검색을 원하는 단어를 문자 키의 조합으로 입력하여 질의어를 생성하고, 생성된 질의어로 사전 데이터 베이스 내에서 검색을 수행하여 그 뜻을 추출한다.
사용자가 문자 키를 입력하여 질의어를 생성하는 방법 이외에, 문자 인식을 이용한 질의어 생성방법이 있다. 이 방법은 카메라를 이용하여 단어 영상을 촬영하고, 촬영된 영상에서 단어 영역을 광학 문자 판독장치(OCR)를 이용하여 문자를 인식하고, 인식된 문자열을 전자사전의 질의어로 선택하여 사전 데이터 베이스 내에서 해당 단어를 검색하는 방법이다.
그렇지만 광학 문자 판독 기법을 이용하는 방식은 일반적인 문서에 적용하기에는 검색 오류가 높다. 왜냐하면 일반적인 문서에서는 명사의 복수형, 동사의 과거형, 과거 완료형, 수동태, 동명사 등의 형태로 다양하게 단어가 변형될 수 있기 때문이다. 즉, 사전 데이터 베이스에는 동사나 명사의 단어들은 보통 원형 단어만을 수록해 놓기 때문에 과거형이나 복수형의 단어는 사전 데이터 베이스 내에는 존재하지 않는 것이 대부분이기 때문이다.
일반 문서에서 카메라로 촬영된 영상들에는 사전 데이터 베이스에는 존재하기 어려운 과거형, 복수형 등의 문장에 적용되어 변형된 단어가 포함되어 있고, 이러한 단어가 문서 영상 내에서 인식된다고 하더라도 이 단어를 질의어로 하여 사전 데이터 베이스 검색을 한다고 해도 정확한 단어 검색은 어렵고, 검색 결과에 대한 신뢰도 또한 낮을 수 밖에 없다.
본 발명의 목적은 전자사전에서 질의어의 원형 단어를 토대로 검색을 수행함으로써, 보다 정확한 검색 결과를 낼 수 있도록 한 전자사전을 제공하는데 있다.
본 발명의 다른 목적은 전자사전에서 질의어를 카메라로 촬영한 문서 영상에서 문자 인식을 기반으로 입력하고, 인식된 문자열에 해당하는 단어의 원형 단어를 이용하여 검색을 수행함으로써, 보다 정확한 검색 결과를 낼 수 있도록 한 전자사전을 제공하는데 있다.
본 발명의 또 다른 목적은 전자사전에서 질의어를 사용자가 직접 입력하였을 때, 입력된 단어의 원형 단어를 이용하여 검색을 수행함으로써, 보다 정확한 검색 결과를 낼 수 있도록 한 전자사전을 제공하는데 있다.
본 발명의 또 다른 목적은 전자사전에서 질의어를 문서 파일을 열어서 디스플레이되는 문서 영상에서 단어를 선택하여 입력할 때, 그 질의어에 대한 원형 단어를 이용하여 검색을 수행함으로써, 보다 정확한 검색 결과를 낼 수 있도록 한 전자사전을 제공하는데 있다.
본 발명에 따른 전자사전 장치는, 표제어를 기반으로 구축된 전자사전 데이터 베이스; 질의어를 입력하는 질의어 입력부; 상기 입력된 질의어에 대응하는 원형 단어를 검색하는 원형 단어 검색부; 상기 질의어 또는 검색된 원형 단어를 기반으로 사전 데이터 베이스에서 해당 단어를 검색하는 사전 검색부; 및, 상기 검색 결과를 디스플레이 하는 출력부; 를 포함하는 것을 특징으로 한다.
또한 본 발명에 따른 전자사전 장치는, 표제어를 기반으로 구축된 전자사전 데이터 베이스; 문서 영상을 취득하는 카메라; 상기 카메라로 촬영된 문서 영상 내의 문자를 인식하는 문자 인식부; 상기 인식된 문자를 원형 단어로 보정하는 원형 단어 보정부; 상기 인식된 단어 또는 보정된 원형 단어를 기반으로 사전 데이터 베이스에서 해당 단어를 검색하는 사전 검색부; 및, 상기 검색 결과를 디스플레이 하는 출력부; 를 포함하는 것을 특징으로 한다.
또한 본 발명에 따른 전자사전 검색방법은, 질의어를 입력하는 단계; 상기 입력된 질의어를 이용하여 사전 데이터 베이스 내에서 해당 단어 검색을 수행하는 단계; 상기 사전 검색 결과를 출력하거나 원형 단어 보정을 수행한 후, 보정된 원 형 단어를 질의어로 재검색을 수행한 결과를 출력하는 단계; 를 포함하는 것을 특징으로 한다.
본 발명의 전자사전에 따르면 검색을 위하여 입력된 질의어를 대상으로 그 질의어에 해당하는 원형 단어를 검색하고, 검색된 원형 단어를 질의어로 사전 데이터 베이스에서 해당 단어를 검색한다. 여기서 질의어의 입력과 생성은 문자 키를 이용하여 사용자가 직접 입력하는 방법을 사용할 수도 있지만, 문서 영상에서 단어를 인식하는 방법을 사용할 수도 있다. 문서 영상에서 단어를 인식하는 방법으로는 카메라로 촬영한 문서 영상에서 문자열을 인식하고 인식된 문자열을 질의 단어로 선택하거나, 문서 파일(text file)을 열어서 디스플레이할 때 그 문서 파일 내에서 질의 단어를 선택하는 방법을 사용할 수도 있다.
본 발명의 전자사전에 따르면 질의어를 입력하고 생성하는 실시예로, 카메라를 이용하여 획득한 문서 영상에서 문자 인식기를 통해 단어를 인식하고, 인식된 단어를 원형 단어 보정 엔진을 이용해서 해당 원형 단어로 보정하며, 보정된 원형 단어를 전자사전의 질의어로 선택하여 사전 데이터 베이스 내 검색을 수행한다.
여기서 질의어와 사전 데이터 베이스 및 그 검색은 영한사전을 예로 들어 설명한다.
일반적인 영어 문서에 있는 각각의 단어들은 그 문장 구조, 시제 등에 맞게 변형되어 있다. 예를 들어 명사는 상황에 맞게 복수형이 될 수도 있으며, 동사는 과거형이거나 과거 완료형, 혹은 동명사 형태로 변형되어 있다. 일반적으로 영한사전에는 단어의 기본 원형 단어만을 표제어로 수록하며, 그 단어의 복수형태나 과거 형, 과거 완료형 등의 형태는 표제어로 수록하지 않고 그 단어의 원형 단어의 해설 내에 부가적으로 설명해 놓는다.
그러므로, 본 발명에서는 영한사전 검색을 할 때, 입력된 질의어의 원형 단어를 검색하고, 질의어를 원형 단어로 보정한 것을 사전 검색의 질의어로 삼아 사전 데이터 베이스에서 해당 원형 단어를 기준으로 검색을 수행한다. 이렇게 함으로써 검색 결과의 오류를 줄이고 검색 신뢰도를 높일 수 있게 된다.
질의어를 입력하는 방법으로는 카메라로 영어 문서를 촬영하고, 촬영된 문서 내에서 문자를 추출하며, 추출된 문자에 대한 단어를 원형 단어로 보정하고, 보정된 원형 단어를 이용해서 사전 검색을 수행한다. 문자를 인식하는 방법으로는 OCR 기법(OCR 엔진)을 사용한다. 즉, 본 발명에서는 단순히 OCR 엔진에만 의존하지 않고, OCR 엔진에 의해서 처리된 결과(인식된 단어)를 다시 원형 단어 보정 엔진을 이용해서 그 단어의 원형 단어로 복원시킨 후, 이 결과를 최종 질의어로 사용하여 사전 검색을 수행하는 것이다.
도1은 본 발명의 제 1 실시예에 따른 전자사전 장치의 구성을 보여준다. 도1에 나타낸 바와 같이 본 발명의 전자사전 장치는, 문서 촬영을 위한 카메라(110)와, 상기 카메라(110)로 촬영된 문서 영상의 신호처리를 수행하는 영상 처리부(120)와, 상기 처리된 문서 영상 내의 문자를 인식하는 문자 인식부(130)와, 상기 문서 영상의 촬영과 질의 단어를 선택하기 위한 기기 조작부(140)와, 원형 단어를 검색하여 질의어를 보정하는 원형 단어 보정부(150)와, 사전 데이터 베이스(160)와, 상기 문자 인식부(130)에서 인식된 단어에 대하여 원형 단어 보정부(150)로부 터 보정된 원형 단어를 질의어로 사전 데이터 베이스(160)에서 해당 단어를 검색하는 사전 검색부(170)와, 상기 검색 결과를 디스플레이 하기 위한 출력부(180)를 포함한다.
도2는 본 발명 제 1 실시예에 따른 전자사전 검색방법을 보여준다. 본 발명 제 1 실시예에 따른 사전 검색방법이, 카메라를 구동시키는 단계(S10), 문서 영상을 촬영하여 처리하는 단계(S20), 문서 영상으로부터 문자를 인식하는 단계(S30), 인식된 문자를 질의어로 하여 사전 검색 엔진을 구동시키는 단계(S40), 인식된 단어가 사전(데이터 베이스) 내에 존재하는지를 판별하는 단계(S50), 인식된 단어가 사전 내에 존재하지 않는 경우 원형 단어 보정을 수행하고 보정된 원형 단어를 질의어로 하여 사전내 재검색을 수행하는 단계(S60), 검색 결과를 출력하는 단계(S70)로 이루어진 것을 보여준다.
도1 및 도2를 참조하여 본 발명 제 1 실시예에 따른 사전 검색방법을 살펴본다. 먼저, 기기 조작부(140)를 이용하여 카메라(110)를 구동시킨다(S10). 카메라(110)가 구동되면 피사체인 문서 영상(10)이 영상 처리부(120)에서 디지털 신호처리되고 프리뷰(pre-view) 화면으로 출력부(180)에 디스플레이된다. 프리뷰 화면을 보면서 적절한 초점과 해상도가 이루어졌을 때 사용자가 기기 조작부(140)를 이용하여 해당 문서를 촬영한다(S20). 촬영된 문서 영상(10)에서 검색에 사용할 질의어 즉, 단어(11)를 기기 조작부(140)를 이용해서 선택한다. 단어(11)의 선택은 문서 영상에서 단어(11)로 선택할 부분 영상 영역을 키를 이용해서 선택하는 방법을 사용할 수 있다. 선택된 단어(11)는 문자 인식부(130)에서 인식된다(S30). 영상 내의 문자(단어)를 인식하는 방법은 기존의 OCR 기법을 응용하여 쉽게 구현된다.
인식된 단어(11)는 사전 검색부(170)로 전달된다. 이에 따라 사전 검색 엔진이 구동된다(S40). 사전 검색 엔진의 구동에 따라 사전 검색부(170)는 사전 데이터 베이스(160) 내에서 상기 인식된 단어(11)를 검색하게 된다. 사전 검색은 앞서 설명한 바와 같이 표제어 중심으로 이루어지게 되므로, 인식된 단어(11)가 사전 데이터 베이스(160) 내의 표제어로 등록된 단어라면 단어 검색은 성공적으로 이루어지게 될 것이다. 이 경우는 해당 검색 결과를 출력부(180)를 통해서 디스플레이하여 줌으로써 검색은 완료된다(S70).
그렇지만, 단어(11)가 사전 데이터 베이스(160) 내에 존재하지 않으면 사용자가 촬영한 단어는 원형 단어가 아닌 것으로 간주할 수 있다. 예를 들면, 동사의 과거형, 명사의 복수형 등과 같이 변형된 단어라고 할 수 있다. 그러므로 이러한 경우에는 해당 단어를 원형 단어 보정부(150)로 전달하고, 원형 단어 보정부(150)에서 그 단어에 대한 원형 단어를 검색하여, 상기 인식된 단어를 원형 단어로 보정한다(S60). 그리고 보정된 원형 단어를 사전 검색부(170)에 전달한다. 사전 검색부(170)는 보정된 원형 단어를 질의어로 하여 사전 데이터 베이스(160) 검색을 실행하고, 검색 결과를 출력부(180)에 디스플레이 한다(S70).
도1에서, 문서에서 촬영 및 인식된 단어(11)로 'dishes'를 초기의 질의어로 사용하였다. 이에 대한 검색 결과의 예제 화면(80)을 함께 표현하였다. 검색 결과 화면(80)에는 인식된 단어 창(81), 보정된 원형 단어 창(82), 그리고 검색 결과(83)를 함께 표현해 주고 있다. 'dishes'라는 초기 질의어를 사용하여 검색을 하였 을 때, 이 단어는 사전에 표제어로 수록된 단어가 아니기 때문에 기존에는 유사한 단어로써 'dishevel'이라는 단어가 검색 결과로 나올 수 있겠지만, 본 발명에서는 이 것을 원형 단어인 'dish'로 보정하고, 보정된 'dish'를 최종 질의어로 삼아서 사전 검색을 수행함으로써, 'dish'에 대한 정확한 검색 결과를 나타낼 수 있다.
도3은 본 발명의 제 2 실시예에 따른 전자사전 장치의 구성을 보여준다. 도2에 나타낸 바와 같이 본 발명의 전자사전 장치는, 질의 단어를 입력하기 위한 기기 조작부(210)와, 원형 단어를 검색하여 질의어를 보정하는 원형 단어 보정부(220)와, 사전 데이터 베이스(230)와, 상기 기기 조작부(210)로 입력된 단어에 대하여 원형 단어 보정부(220)로부터 보정된 원형 단어를 질의어로 사전 데이터 베이스(230)에서 해당 단어를 검색하는 사전 검색부(240)와, 상기 검색 결과를 디스플레이 하기 위한 출력부(250)를 포함한다.
도3에 나타낸 전자사전 장치에서는 질의어를 사용자가 직접 입력하는 경우이며, 이는 앞서 설명한 도1의 실시예에서 카메라로 촬영된 문서 영상 내에서 문자를 인식하고, 그 인식된 문자열을 검색을 위한 질의 단어로 선택하는 것과 구별된다.
질의 단어를 사용자가 직접 입력하는 방법은 기기 조작부(210)의 문자 입력 키를 이용할 수 있다. 사용자가 검색하고자 하는 단어의 원형을 알 수 없을 경우, 변형된 형태의 단어 입력에 대해서도 효율적이며 정확한 검색 결과를 낼 수 있는 전자사전이다.
도3을 참조하여 본 발명 제 2 실시예에 따른 사전 검색방법을 살펴본다. 먼 저, 기기 조작부(210)를 이용하여 질의할 단어를 입력한다. 여기서는 'dishes'를 질의 단어로 입력하는 경우에 대해서 보여준다.
입력된 단어는 사전 검색부(240)로 전달된다. 이에 따라 사전 검색 엔진이 구동된다. 사전 검색 엔진의 구동에 따라 사전 검색부(240)는 사전 데이터 베이스(230) 내에서 상기 입력된 단어를 검색하게 된다. 사전 검색은 앞서 설명한 바와 같이 표제어 중심으로 이루어지게 되므로, 입력된 단어가 사전 데이터 베이스(230) 내의 표제어로 등록된 단어라면 단어 검색은 성공적으로 이루어지게 될 것이다. 이 경우는 해당 검색 결과를 출력부(250)를 통해서 디스플레이하여 줌으로써 검색은 완료된다.
그렇지만, 입력된 단어가 사전 데이터 베이스(230) 내에 존재하지 않으면 사용자가 입력한 단어는 원형 단어가 아닌 것으로 간주할 수 있다. 예를 들면, 동사의 과거형, 명사의 복수형 등과 같이 변형된 단어라고 할 수 있다. 그러므로 이러한 경우에는 해당 단어를 원형 단어 보정부(220)로 전달하고, 원형 단어 보정부(220)에서 그 단어에 대한 원형 단어를 검색하여, 상기 입력된 단어를 원형 단어로 보정한다. 그리고 보정된 원형 단어를 사전 검색부(240)에 전달한다. 사전 검색부(240)는 보정된 원형 단어를 질의어로 하여 사전 데이터 베이스(230) 검색을 실행하고, 검색 결과를 출력부(250)에 디스플레이 한다.
도3에서, 입력 단어로 'dishes'를 초기의 질의어로 사용하였다. 이에 대한 검색 결과의 예제 화면(50)을 함께 표현하였다. 검색 결과 화면(50)에는 입력된 단어 창(51), 보정된 원형 단어 창(52), 그리고 검색 결과(53)를 함께 표현해 주고 있다. 'dishes'라는 초기 질의어를 사용하여 검색을 하였을 때, 이 단어는 사전에 표제어로 수록된 단어가 아니기 때문에 기존에는 유사한 단어로써 'dishevel'이라는 단어가 검색 결과로 나올 수 있겠지만, 본 발명에서는 이 것을 원형 단어인 'dish'로 보정하고, 보정된 'dish'를 최종 질의어로 삼아서 사전 검색을 수행함으로써, 'dish'에 대한 정확한 검색 결과를 나타낼 수 있다.
도4는 본 발명의 제 3 실시예에 따른 전자사전 장치의 구성을 보여준다. 도4에 나타낸 전자사전 장치는 텍스트 뷰어(Text Viewer)를 탑재함으로써, 전자 북(e-book)을 비롯하여 다양한 텍스트 문서를 열어 볼 수 있는 단말기에서 문서를 보다가 필요한 단어를 손쉽게 검색해 볼 수 있는 전자사전을 제공한다.
본 발명 제 3 실시예에 따른 전자사전 장치는, 질의 단어를 선택하기 위한 기기 조작부(310)와, 문서 파일이 저장된 문서 파일 저장부(320)와, 원형 단어를 검색하여 질의어를 보정하는 원형 단어 보정부(330)와, 사전 데이터 베이스(340)와, 문서 파일에서 상기 기기 조작부(310)로 선택된 단어에 대하여 원형 단어 보정부(330)로부터 보정된 원형 단어를 질의어로 사전 데이터 베이스(340)에서 해당 단어를 검색하는 사전 검색부(350)와, 상기 검색 결과를 디스플레이 하기 위한 출력부(360)를 포함한다.
도4에 나타낸 전자사전 장치에서는 질의어를 사용자가 디스플레이하여 보는 문서 내에서 선택하여 입력하는 경우이며, 이는 앞서 설명한 도1의 실시예에서 카메라로 촬영된 문서 영상 내에서 문자를 인식하고, 그 인식된 문자열을 검색을 위 한 질의 단어로 선택하는 실시예나, 사용자가 키 입력을 사용하여 질의 단어를 직접 입력하는 실시예와 구별된다. 즉, 문서 파일을 열어 볼 수 있는, 적어도 텍스트 뷰어를 탑재한 단말기에서 유용한 단어 검색 시스템을 제공하는 것이다.
질의 단어를 사용자가 선택하는 방법은 기기 조작부(310)의 키를 이용할 수 있다. 사용자가 문서 파일 저장부(320)에 저장된 문서 파일 중에서 희망하는 파일을 열어서 이 파일을 출력부(360)를 통해서 디스플레이 한다. 도4에서는 문서 영상(20)이 여기에 해당한다. 문서 영상(20) 내에서 사용자가 검색을 원하는 단어(21)를 선택한다. 단어(21)의 선택은 기기 조작부(310)의 키를 이용해서 선택할 수 있다. 여기서는 'dishes'를 질의 단어로 입력하는 경우에 대해서 보여준다.
선택된 단어는 사전 검색부(350)로 전달된다. 이에 따라 사전 검색 엔진이 구동된다. 사전 검색 엔진의 구동에 따라 사전 검색부(350)는 사전 데이터 베이스(340) 내에서 상기 입력된 단어를 검색하게 된다. 사전 검색은 앞서 설명한 바와 같이 표제어 중심으로 이루어지게 되므로, 입력된 단어가 사전 데이터 베이스(340) 내의 표제어로 등록된 단어라면 단어 검색은 성공적으로 이루어지게 될 것이다. 이 경우는 해당 검색 결과를 출력부(360)를 통해서 디스플레이하여 줌으로써 검색은 완료된다.
그렇지만, 입력된 단어가 사전 데이터 베이스(340) 내에 존재하지 않으면 사용자가 선택한 단어는 원형 단어가 아닌 것으로 간주할 수 있다. 예를 들면, 동사의 과거형, 명사의 복수형 등과 같이 변형된 단어라고 할 수 있다. 그러므로 이러한 경우에는 해당 단어를 원형 단어 보정부(330)로 전달하고, 원형 단어 보정부 (330)에서 그 단어에 대한 원형 단어를 검색하여, 상기 선택된 단어를 원형 단어로 보정한다. 그리고 보정된 원형 단어를 사전 검색부(350)에 전달한다. 사전 검색부(350)는 보정된 원형 단어를 질의어로 하여 사전 데이터 베이스(340) 검색을 실행하고, 검색 결과를 출력부(360)에 디스플레이 한다.
도4에서, 선택 단어로 'dishes'를 초기의 질의어로 사용하였다. 이에 대한 검색 결과의 예제 화면(60)을 함께 표현하였다. 검색 결과 화면(60)에는 선택된 단어 창(61), 보정된 원형 단어 창(62), 그리고 검색 결과(63)를 함께 표현해 주고 있다. 'dishes'라는 초기 질의어를 사용하여 검색을 하였을 때, 이 단어는 사전에 표제어로 수록된 단어가 아니기 때문에 기존에는 유사한 단어로써 'dishevel'이라는 단어가 검색 결과로 나올 수 있겠지만, 본 발명에서는 이 것을 원형 단어인 'dish'로 보정하고, 보정된 'dish'를 최종 질의어로 삼아서 사전 검색을 수행함으로써, 'dish'에 대한 정확한 검색 결과를 나타낼 수 있다.
본 발명의 전자사전에 따르면 질의 단어를 원형 단어로 보정하고, 보정된 원형 단어를 질의어로 하여 사전 검색을 수행함으로써, 검색 오류를 줄이고, 정확한 단어 검색이 가능하며, 검색 신뢰도를 높일 수 있다.

Claims (11)

  1. 표제어를 기반으로 구축된 전자사전 데이터 베이스;
    질의어를 입력하는 질의어 입력부;
    상기 입력된 질의어에 대응하는 원형 단어를 검색하는 원형 단어 검색부;
    상기 질의어 또는 검색된 원형 단어를 기반으로 사전 데이터 베이스에서 해당 단어를 검색하는 사전 검색부; 및,
    상기 검색 결과를 디스플레이 하는 출력부;
    를 포함하는 것을 특징으로 하는 전자사전.
  2. 제 1 항에 있어서, 상기 질의어 입력은 사용자가 직접 입력하는 것을 특징으로 하는 전자사전.
  3. 제 1 항에 있어서, 상기 질의어 입력은 문서 파일을 디스플레이하여 선택되는 것을 특징으로 하는 전자사전.
  4. 제 1 항에 있어서, 상기 검색 결과는 질의어, 원형 단어 보정된 질의어, 검색 결과를 함께 디스플레이하는 것을 특징으로 하는 전자사전.
  5. 표제어를 기반으로 구축된 전자사전 데이터 베이스;
    문서 영상을 취득하는 카메라;
    상기 카메라로 촬영된 문서 영상 내의 문자를 인식하는 문자 인식부;
    상기 인식된 문자를 원형 단어로 보정하는 원형 단어 보정부;
    상기 인식된 단어 또는 보정된 원형 단어를 기반으로 사전 데이터 베이스에서 해당 단어를 검색하는 사전 검색부; 및,
    상기 검색 결과를 디스플레이 하는 출력부;
    를 포함하는 것을 특징으로 하는 전자사전.
  6. 제 5 항에 있어서, 상기 검색 결과는 인식된 단어, 원형 단어 보정된 질의어, 검색 결과를 함께 디스플레이하는 것을 특징으로 하는 전자사전.
  7. 질의어를 입력하는 단계;
    상기 입력된 질의어를 이용하여 사전 데이터 베이스 내에서 해당 단어 검색을 수행하는 단계;
    상기 사전 검색 결과를 출력하거나 원형 단어 보정을 수행한 후, 보정된 원형 단어를 질의어로 재검색을 수행한 결과를 출력하는 단계;
    를 포함하는 것을 특징으로 하는 전자사전 검색방법.
  8. 제 7 항에 있어서, 상기 질의어 입력은 카메라로 촬영된 문서 영상에서 문자 인식을 기반으로 인식된 문자열에 대한 단어 선택으로 이루어지는 것을 특징으로 하는 전자사전 검색방법.
  9. 제 7 항에 있어서, 상기 질의어 입력은 사용자가 직접 입력하는 것을 특징으로 하는 전자사전 검색방법.
  10. 제 7 항에 있어서, 상기 질의어 입력은 문서 파일을 디스플레이하여 선택되는 것을 특징으로 하는 전자사전 검색방법.
  11. 제 7 항에 있어서, 상기 질의어에 대한 사전 검색에 성공한 경우에는 원형 단어 보정을 수행하지 않고 검색 결과를 출력하며, 실패한 경우에는 보정된 원형 단어를 새로운 질의어로 하여 재검색을 수행하는 것을 특징으로 하는 전자사전 검색방법.
KR1020060005154A 2006-01-18 2006-01-18 전자 사전 KR20070076126A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020060005154A KR20070076126A (ko) 2006-01-18 2006-01-18 전자 사전

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020060005154A KR20070076126A (ko) 2006-01-18 2006-01-18 전자 사전

Publications (1)

Publication Number Publication Date
KR20070076126A true KR20070076126A (ko) 2007-07-24

Family

ID=38501119

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060005154A KR20070076126A (ko) 2006-01-18 2006-01-18 전자 사전

Country Status (1)

Country Link
KR (1) KR20070076126A (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012036345A1 (ko) * 2010-09-17 2012-03-22 주식회사 엔웨이브 서버 연동 통페이지 광학문자 인식 및 사전 검색 시스템 및 방법
KR102212529B1 (ko) * 2019-10-16 2021-02-03 한남대학교 산학협력단 라즈베리파이 카메라를 이용한 점자 변환기

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012036345A1 (ko) * 2010-09-17 2012-03-22 주식회사 엔웨이브 서버 연동 통페이지 광학문자 인식 및 사전 검색 시스템 및 방법
KR102212529B1 (ko) * 2019-10-16 2021-02-03 한남대학교 산학협력단 라즈베리파이 카메라를 이용한 점자 변환기

Similar Documents

Publication Publication Date Title
US9411801B2 (en) General dictionary for all languages
US6687697B2 (en) System and method for improved string matching under noisy channel conditions
KR101220709B1 (ko) 한글 및 한자가 혼용된 문서에 대한 전자 사전 검색 장치 및 방법
JP2011070412A (ja) 画像検索装置および画像検索方法
EP2806336A1 (en) Text prediction in a text input associated with an image
US8023735B2 (en) Image processing apparatus for extracting representative characteristic from image data and storing image data to be associated with representative characteristic
JP2006072744A (ja) 文書処理装置、その制御方法、プログラム、及び記憶媒体
JP2005135113A (ja) 電子機器装置、関連語抽出方法及びプログラム
KR20070076126A (ko) 전자 사전
CN113495874A (zh) 信息处理装置和计算机可读取介质
CN114281979A (zh) 生成文本摘要的文本处理方法、装置、设备以及存储介质
JP5586772B1 (ja) 翻訳システム及び翻訳プログラム、並びに翻訳方法
US9607076B2 (en) Device and method for determining interest, and computer-readable storage medium for computer program
JP2007052581A (ja) メタデータ生成装置、メタデータ生成システム、これらにおける処理方法ならびに当該方法をコンピュータに実行させるプログラム
JP5646220B2 (ja) 出願文書情報処理装置、出願文書情報処理方法、及びプログラム
JP2008225676A (ja) 辞書検索装置及びその制御プログラム
JP2007011683A (ja) 文書管理支援装置
JP2008071311A (ja) 画像検索装置、画像検索方法、画像検索プログラム、及び、情報記憶媒体
US20200110476A1 (en) Digital Redacting Stylus and System
JP2007049245A (ja) 音声入力機能付撮影装置
JP2007142631A (ja) 画像形成装置
WO2014199681A1 (ja) 翻訳システム及び翻訳プログラム、並びに翻訳方法
KR200383899Y1 (ko) 광학식 문자판독(오씨알)이 가능한 디지탈 카메라
JPH08180064A (ja) 文書検索方法及び文書ファイリング装置
JP2010191907A (ja) 文字入力装置および文字入力方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application