KR20100125578A - 온라인 사전 서비스 제공 장치 및 방법 - Google Patents

온라인 사전 서비스 제공 장치 및 방법 Download PDF

Info

Publication number
KR20100125578A
KR20100125578A KR1020090044355A KR20090044355A KR20100125578A KR 20100125578 A KR20100125578 A KR 20100125578A KR 1020090044355 A KR1020090044355 A KR 1020090044355A KR 20090044355 A KR20090044355 A KR 20090044355A KR 20100125578 A KR20100125578 A KR 20100125578A
Authority
KR
South Korea
Prior art keywords
word
language
dictionary
interpretation
information
Prior art date
Application number
KR1020090044355A
Other languages
English (en)
Other versions
KR101042907B1 (ko
Inventor
안재홍
소순식
윤찬호
Original Assignee
엔에이치엔(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엔에이치엔(주) filed Critical 엔에이치엔(주)
Priority to KR1020090044355A priority Critical patent/KR101042907B1/ko
Priority to JP2010116852A priority patent/JP5693046B2/ja
Publication of KR20100125578A publication Critical patent/KR20100125578A/ko
Application granted granted Critical
Publication of KR101042907B1 publication Critical patent/KR101042907B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/49Data-driven translation using very large corpora, e.g. the web
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/04812Interaction techniques based on cursor appearance or behaviour, e.g. being affected by the presence of displayed objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

로딩된 웹 페이지에 포함된 단어에 대응하는 단어 인덱스 정보 및 미리 정해진 해석 언어 정보를 포함하는 쿼리를 사용자 단말로부터 수신하여 상기 해석 언어 정보 및 단어 인덱스 정보를 추출하는 쿼리 분석부, 원본 언어의 단어들에 대한 대상 언어에 의한 해석 데이터를 포함하는 적어도 하나의 사전 데이터를 포함하는 사전 데이터 저장부, 상기 해석 언어 정보 및 상기 단어 인덱스 정보에 기초하여 상기 사전 데이터를 선택하는 사전 선택부, 상기 선택된 사전 데이터로부터 상기 단어 인덱스 정보에 해당하는 상기 해석 데이터를 검색하는 검색부 및 상기 해석 데이터를 상기 클라이언트로 전송하는 검색 결과 전송부를 포함하고, 상기 인덱스 정보는 국가 언어를 식별하는 언어 식별자 및 상기 원본 언어의 단어에 대응하는 단어 식별자를 포함하는 온라인 사전 서비스 제공 장치를 제공한다.
Figure P1020090044355
온라인 사전, 툴팁

Description

온라인 사전 서비스 제공 장치 및 방법{METHOD AND APPARATUS FOR PROVIDING AN ONLINE DICTIONARY SERVICE}
본 발명은 온라인 사전 서비스의 제공 장치 및 방법에 관한 것이다.
최근 인터넷 사용 인구의 증가 및 인터넷을 통한 정보 검색의 활성화로 인하여 모국어로 작성된 웹 페이지뿐만 아니라, 다른 나라의 언어로 작성된 웹 페이지를 실행시키는 경우가 많아졌다. 다른 나라의 언어로 작성된 웹 페이지를 해독하기 위해서는 해당 언어에 능통해야 하지만, 이러한 언어 구사 능력을 가진 사용자는 소수에 그친다. 따라서, 인터넷 사용자의 편의를 증가시키기 위해서 이러한 언어의 장벽을 해소하기 위한 번역 서비스 또는 사전 서비스가 제공되고 있다.
통상의 번역 서비스의 경우 웹 페이지에 포함된 문장 또는 번역하고자 하는 웹 페이지의 URL을 복사하여 번역 서비스 제공 웹 페이지 등에 입력하면, 번역 서버에 상기 입력된 원문이 전달되고, 원문에 대한 번역 결과를 사용자 단말에 전송하는 방식을 사용된다. 그러나 이러한 번역 서비스의 번역 품질은 만족스러운 수 준이 아니며, 원문 또는 URL을 복사하여 입력하는 번거로운 절차를 거치게 된다.
또한, 통상의 사전 서비스의 경우, 검색하고자 하는 단어를 마우스와 같은 포인팅 장치로 지시하면, 해당 단어가 웹 서버로 전송되어, 그에 대한 해석 결과가 표시된다. 즉, 단어 단위로 해석이 제공되는 것이다.
도 1은 통상적으로 제공되는 온라인 사전 서비스를 설명하기 위한 도면이다.
네이버(www.naver.com) 또는 다음(www.daum.net)과 같은 포털 사이트 등에서는 사용자의 편의를 위하여 여러 가지 간단한 애플리케이션들이 포함된 툴바 서비스를 제공하고 있다. 상기 툴바 서비스에 포함된 하나의 서비스로서 온라인 사전 서비스가 제공되고 있다. 도시된 바와 같이, 영어 단어 위에 마우스와 같은 포인팅 장치의 지시자(10)가 웹 페이지에 포함된 단어(research)를 지시하면, 해당 단어(research)에 대한 해석(20)이 툴팁(tooltip) 형태로 제공된다. 이때, 지시자(10)가 단어의 주변에 위치하는 것으로 도시되어 있으나, 대체적인 실시예의 경우 단어의 바로 위에 위치한다.
한편, 종래 기술은 지정된 제 1 국가언어(예를 들어, 영어)에 대한 지정된 제 2 국가언어(예를 들어, 한국어)로의 해석만을 제공하고 있어, 그 밖의 국가 언어에 대한 해석을 동적으로 제공하지 못하고 있다. 이에 다양한 사용자들의 요구에 맞는 온라인 사전 서비스를 제공할 필요성이 있다.
본 발명의 일부 실시예는 여러 종류의 언어에 대하여 사용자가 선택한 언어를 기초로 한 해석 서비스를 제공할 수 있는 온라인 사전 서비스 제공 장치 및 방법을 제공한다.
상술한 기술적 과제를 달성하기 위한 기술적 수단으로서, 본 발명의 제 1 측면은 로딩된 웹 페이지에 포함된 단어에 대응하는 단어 인덱스 정보 및 미리 정해진 해석 언어 정보를 포함하는 쿼리를 사용자 단말로부터 수신하여 상기 해석 언어 정보 및 단어 인덱스 정보를 추출하는 쿼리 분석부, 원본 언어의 단어들에 대한 대상 언어에 의한 해석 데이터를 포함하는 적어도 하나의 사전 데이터를 포함하는 사전 데이터 저장부, 상기 해석 언어 정보 및 상기 단어 인덱스 정보에 기초하여 상기 사전 데이터를 선택하는 사전 선택부, 상기 선택된 사전 데이터로부터 상기 단어 인덱스 정보에 해당하는 상기 해석 데이터를 검색하는 검색부 및 상기 해석 데이터를 상기 클라이언트로 전송하는 검색 결과 전송부를 포함하고, 상기 인덱스 정보는 국가 언어를 식별하는 언어 식별자 및 상기 원본 언어의 단어에 대응하는 단어 식별자를 포함하는 온라인 사전 서비스 제공 장치를 제공한다.
또한, 본 발명의 제 2 측면은 로딩된 웹 페이지에 포함된 단어에 대응하는 단어 인덱스 정보 및 미리 정해진 해석 언어 정보를 포함하는 쿼리를 사용자 단말 로부터 수신하는 단계, 상기 쿼리로부터 상기 해석 언어 정보 및 단어 인덱스 정보를 추출하는 단계, 원본 언어의 단어들에 대한 대상 언어에 의한 해석 데이터들을 포함하는 적어도 하나의 사전 데이터로부터, 상기 해석 언어 정보 및 단어 인덱스 정보에 기초하여 사전 데이터를 선택하는 단계, 상기 선택된 사전 데이터로부터 상기 단어 인덱스 정보에 해당하는 상기 해석 데이터를 검색하는 단계 및 상기 해석 데이터를 상기 사용자 단말로 전송하는 단계를 포함하고, 상기 인덱스 정보는 국가 언어를 식별하는 언어 식별자 및 상기 원본 언어의 단어에 대응하는 단어 식별자를 포함하는 온라인 사전 서비스 제공 방법을 제공한다.
또한, 본 발명의 제 3 측면은 사용자 단말에 설치된 클라이언트를 통해 해석 언어를 설정하는 단계, 상기 사용자 단말에 로딩된 웹 페이지의 단어들 중 포인팅 장치에 의하여 지시된 단어를 추출하는 단계, 각 언어 별로 구분되는 체계를 갖는 단어 인덱스들을 포함하는 단어 인덱스 저장부로부터 상기 추출된 단어의 인덱스 정보를 검색하는 단계, 상기 해석 언어 정보 및 단어 인덱스 정보를 포함하는 쿼리를 생성하는 단계 및 상기 쿼리에 기초한 사전 서버의 검색 결과를 수신하여 상기 사용자 단말에 표시하는 단계를 포함하는 온라인 사전 서비스 제공 방법을 제공한다.
또한, 본 발명의 제 4 측면은 상기 온라인 사전 서비스 제공 방법에 기재된 단계를 수행하는 프로그램이 기록된 컴퓨터가 읽기 가능한 기록 매체를 제공한다.
전술한 본 발명의 과제 해결 수단에 의하면, 사용자가 클라이언트를 통해 선택하여 입력한 모국어에 따라 웹 페이지에 표시된 여러 나라의 언어에 대하여 자동으로 해석 서비스를 제공할 수 있다. 특히, 사용자의 모국어를 기초로 해석 서비스를 제공하므로, 사용자에 최적화된 서비스를 제공할 수 있다.
아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.
이하, 도면을 참조하여 본 발명의 내용을 살펴보기로 한다.
도 2는 본 발명의 일 실시예에 따른 온라인 사전 서비스 제공 장치를 도시한 도면이다.
온라인 사전 서비스 제공 장치(100)는 클라이언트(200)와 사전 서버(300)를 포함한다. 클라이언트(200)는 사용자 단말에 설치되어 각종 정보를 수집하여 네트워크를 통해 사전 서버(300)로 전달한다. 네트워크는 근거리 통신망(Local Area Network; LAN), 광역 통신망(Wide Area Network; WAN) 또는 부가가치 통신망(Value Added Network; VAN) 등과 같은 유선 네트워크나 이동 통신망(mobile radio communication network) 또는 위성 통신망 등과 같은 모든 종류의 무선 네트워크로 구현될 수 있다.
클라이언트(200)는 해석 언어 설정부(210), 검색어 추출부(220), 단어 인덱스 검색부(230), 단어 인덱스 저장부(240), 쿼리 생성부(250), 검색결과 표시부(260), 환경 설정부(270)를 포함한다.
클라이언트(200)는 네트워크를 통해 다운로드 되어 컴퓨터나 휴대용 단말기와 같은 사용자 단말에 설치된다. 여기서, 컴퓨터는 예를 들어, 웹 브라우저(WEB Browser)가 탑재된 노트북, 데스크톱(desktop), 랩톱(laptop) 등을 포함하고, 휴대용 단말기는 예를 들어, 휴대성과 이동성이 보장되는 무선 통신 장치로서, PCS(Personal Communication System), GSM(Global System for Mobile communications), PDC(Personal Digital Cellular), PHS(Personal Handyphone System), PDA(Personal Digital Assistant), IMT(International Mobile Telecommunication)-2000, CDMA(Code Division Multiple Access)-2000, W-CDMA(W-Code Division Multiple Access), Wibro(Wireless Broadband Internet) 단말 등과 같은 모든 종류의 핸드헬드(Handheld) 기반의 무선 통신 장치를 포함할 수 있다.
해석 언어 설정부(210)는 사용자가 선택한 언어를 해석 언어로 설정한다. 즉, 웹 페이지의 단어를 해석하는 기준 언어가 되는 해석 언어를 복수의 언어 중 선택하게 한다. 실시예에 따라, 클라이언트(200)가 사용자 단말에 설치되는 과정 중에 사용자가 해석 언어를 설정할 수 있도록 한다. 예를 들어, 영어, 한국어, 중국어 또는 일본어 등 각종 언어 중에서 사용자가 특정 언어를 선택하면, 선택된 언어가 해석 언어로 설정된다. 또한 이미 설정된 사용자의 해석 언어를 사용자의 선택에 따라 변경할 수 있도록 한다. 통상, 사용자의 모국어가 해석 언어로 선택될 것이다.
검색어 추출부(220)는 마우스와 같은 포인팅 장치에 의하여 지시되는 위치에 있는 단어를 인식하여 추출한다. 도면을 참조하여 상세 구성을 살펴보기로 한다.
도 3은 본 발명의 일 실시예에 따른 검색어 추출부의 상세 구성을 도시한 도면이다.
검색어 추출부(220)는 단어 인식부(222), 트리밍 처리부(224)를 포함한다.
단어 인식부(222)는 포인팅 장치의 지시자가 단어 위에 위치하는 이벤트를 감지하고, 이벤트가 발생한 지점의 단어를 인식하여 트리밍 처리부(224)로 전달한다. 이때, 포인팅 장치는 마우스, 태블릿(tablet), 터치 패드 또는 터치 스크린 등과 같은 다양한 형태의 입력 장치가 될 수 있다. 터치 스크린의 경우 별도의 장치 외에 손가락에 의하여 지시자의 이동이 제어될 수 있다.
단어 인식부(222)는 포인팅 장치의 이동 여부를 지속적으로 감지하며, 지시자가 단어 위에 위치하는 시간이 기준값 이상인 경우, 지시자가 위치하는 지점의 단어를 인식한다. 이때, 상기 기준값을 사용자의 설정에 따라 조절함으로써 단어 인식의 민감도를 조절할 수 있다. 즉, 지시자가 단어 위에 위치하는 시간의 기준 값을 증가시키면, 단어 인식의 민감도가 감소될 것이다. 역으로, 지시자가 단어 위에 위치하는 시간의 기준 값을 감소시키면, 단어 인식의 민감도가 증가할 것이다.
트리밍 처리부(224)는 단어 인식부(222)가 인식한 단어 중 노이즈(noise) 문자를 제거한다. 노이즈 문자는 단어의 해석과 무관한 여러 문자나 각종 특수 문자를 포함한다. 즉, 인식된 단어의 앞, 뒤, 중간 부분 등에 위치한 작은 따옴표(‘ ’), 큰 따옴표(“ ”), 느낌표(!), 물음표(?)등 각종 문장 부호 등이 노이즈 문자에 포함되며, 트리밍 처리부(234)는 이러한 노이즈 문자를 제거하는 트리밍 동작을 수행한다.
다시 도 2를 참조하면, 단어 인덱스 검색부(230)는 단어 인식부(222)에 의하여 인식된 단어, 또는 단어 인식부(222)에 의하여 인식되고 트리밍 처리부(224)에 의하여 트리밍 처리된 단어의 인덱스를 단어 인덱스 저장부(240)로부터 검색한다. 또한, 검색된 단어 인덱스를 쿼리 생성부(250)로 전송한다. 만약, 검색된 단어 인덱스가 없는 경우에는 해당 단어에 대한 해석이 사전 서버(300)에도 없는 것으로 판단하여, 해당 단어에 대한 쿼리가 생성되지 않도록 한다.
단어 인덱스 저장부(240)는 사전 서버(300)에 등록된 단어들에 대하여 고유의 인덱스를 지정하여 저장한다. 단어 인식부(222)에서 인식된 단어 중에는 사전 서버(300)에 등록되지 않은 단어들이 있을 수 있다. 이러한 단어들이 쿼리에 포함 되는 경우, 사전 서버(300)는 해당 단어에 대한 검색 값을 리턴할 수 없기 때문에 불필요한 연산을 수행하게 되는 문제점이 발생한다. 이에, 본 발명에서는 사전 서버(300)에 등록된 단어들의 인덱스 정보를 클라이언트(200)에 저장시키고, 사전 서버(300)에 등록된 단어들에 대해서만 쿼리가 생성되도록 한다.
한편, 단어 인덱스 저장부(240)는 언어 별로 구별되는 인덱스 체계를 갖도록 할 수 있다. 즉, 한국어, 영어, 일본어, 중국어 등 각종 언어별로 서로 다른 인덱스 체계를 갖도록 한다.
도 4는 본 발명의 일 실시예에 따른 단어 인덱스 저장부의 언어별 인덱스 체계를 도시한 도면이다.
도시된 바와 같이, 각 단어에 대하여 고유의 인덱스를 부여하고 있다. 또한, 언어 별로 서로 구분되는 인덱스 체계를 갖도록 한다. 예를 들면, 영어에 대해서는 EN, 한국어에 대해서는 KR, 일본어에 대해서는 JP, 중국어에 대해서는 CN과 같이 각 언어별로 상이한 언어 식별자를 갖도록 한다. 언어 식별자와 해당 언어의 단어 식별자(도면의 i, j, k, l)가 결합되어 하나의 단어 인덱스를 구성하고, 이를 통해 각 언어별 단어의 인덱스 체계가 형성될 수 있다. 이때, 예시한 인덱스 체계와 다른 인덱스 체계를 갖도록 실시예를 변경할 수 있다.
한편, 언어 식별자는 인식된 단어의 코드 패턴으로부터 결정될 수 있다. 즉, 각각의 단어 코드는 자신의 국적을 식별할 수 있는 특정 패턴을 갖고 있다. 예를 들어, 코드의 특정 부분을 이진 데이터로 구현함으로써, 상기 이진 데이터를 통해 해당 단어의 국적을 판단할 수 있다. 상기 단어의 코드 패턴은 인덱스 검색 부(230)에 테이블 형태로 저장되어 참조될 수 있다.
이에 따라, 단어 인덱스 만으로도 검색하고자 하는 단어 및 그 단어가 어떠한 언어에 해당하는지를 확인할 수 있도록 한다. 추후 설명할 사전 선택부(320)는 이러한 단어 인덱스 정보의 언어 식별자에 기초하여 복수의 사전 데이터 중 어느 하나를 선택한다. 따라서 단어 인덱스가 각 언어 별로 서로 구분되는 체계를 갖게 되면, 더욱 용이하게 사전 데이터를 선택할 수 있다.
실시예에 따라, 한국어, 영어, 중국어, 일본어 외에 독일어, 불어, 에스파냐어, 아랍어 등 여러 언어들에 대한 언어 식별자를 추가로 저장할 수 있다. 또한, 단어 인덱스 저장부(240)에 저장되는 데이터들은 실시자의 선택에 추가, 변경 또는 삭제될 수 있다.
다시 도 2를 참조하면, 쿼리 생성부(250)는 해석 언어 정보 및 단어 인덱스 정보를 포함하는 쿼리를 생성한다. 이때, 해석 언어 정보는 해석 언어 설정부(210)로부터 수신하고, 단어 인덱스 정보는 단어 인덱스 검색부(230)로부터 수신한다. 이는 사전 서버(300)에 전송되며, 사전 서버(300)는 쿼리에 포함된 해석 언어 정보 및 단어 인덱스 정보로부터 적절한 사전 데이터를 선택하고, 선택된 사전 데이터에서 단어 인덱스 정보에 해당하는 해석 데이터를 검색하게 된다. 이때, 쿼리 생성부(250)는 단어 인덱스 정보에 의하여 식별되는 단어가 사전 데이터에 등록된 경우에 한하여 상기 쿼리를 생성한다. 즉, 단어 인덱스 저장부(240)에 인덱스가 등록되지 않은 단어에 대해서는 쿼리를 생성하지 않는다.
검색 결과 표시부(260)는 사전 서버로부터 수신한 해석 데이터를 클라이언 트(200)에 표시한다. 바람직하게는, 포인팅 장치가 지시하는 검색 대상 단어와 인접한 위치에 툴팁(tooltip) 형태로 표시한다.
환경 설정부(270)는 사용자가 선택하는 설정 사항들을 입력 받고, 저장하여 그에 따라 온라인 사전 서비스가 제공되도록 한다. 예를 들어, 사용자가 설정한 해석 언어를 변경할 수 있도록 한다. 또한, 검색어 추출부(220)의 단어 인식부(222)에서 포인팅 장치의 지시자가 단어 위에 위치하는 시간의 기준 값을 사용자가 직접 설정할 수 있도록 한다.
이제, 사전 서버(300)의 구성을 살펴보기로 한다.
사전 서버(300)는 클라이언트(200)로부터 쿼리를 수신하여, 해석 언어 정보 및 단어 인덱스 정보에 기초하여 최적의 사전 데이터를 선택하고, 선택된 사전 데이터에서 검색 대상 단어에 대한 해석을 검색하여 클라이언트(200)로 전송한다. 사전 서버(300)는 쿼리 분석부(310), 사전 선택부(320), 검색부(330), 검색결과 전송부(340), 사전 데이터 저장부(350)를 포함한다.
사전 서버(300)의 쿼리 분석부(310)는 클라이언트(200)로부터 수신한 쿼리를 분석하여, 해석 언어 정보 및 단어 인덱스 정보를 추출한다. 또한, 해석 언어 정보를 사전 선택부(320)로 전달하고, 단어 인덱스 정보는 사전 선택부(320) 및 검색부(330)로 전달한다.
사전 선택부(320)는 해석 언어 정보 및 단어 인덱스의 언어 식별자에 기초하여 최적의 사전 데이터를 사전 데이터 저장부(350)에서 선택한다.
사전 데이터 저장부(350)에 대하여 먼저 설명하면, 사전 데이터 저장부(350) 는 복수의 사전 데이터(352, 354, 356)를 포함한다. 사전 데이터는 원본 언어의 각종 단어에 대한 대상 언어로의 해석을 포함한다. 즉, 원본 언어의 각종 단어를 대상 언어를 이용하여 번역하는 것이다. 이때, 원본 언어와 대상 언어는 동일한 언어일 수 있다. 예를 들어, 한국어, 일본어, 중국어, 영어 중 어느 하나의 언어를 원본 언어로 하고, 한국어, 일본어, 중국어, 영어 중 어느 하나의 언어를 대상 언어로 하는 총 16가지의 사전 데이터를 고려할 수 있다. 즉, 영어 단어를 영어로 해석하는 사전 데이터, 영어 단어를 중국어로 해석하는 사전 데이터, 영어 단어를 일본어로 해석하는 사전 데이터, 영어 단어를 한국어로 해석하는 사전 데이터, 중국어 단어를 영어로 해석하는 사전 데이터, 중국어 단어를 중국어로 해석하는 사전 데이터, 중국어 단어를 일어로 해석하는 사전 데이터 및 중국어 단어를 한국어로 해석하는 사전 데이터, 일본어 단어를 영어로 해석하는 사전 데이터, 일본어 단어를 중국어로 해석하는 사전 데이터, 일본어 단어를 일본어로 해석하는 사전 데이터, 일본어 단어를 한국어로 해석하는 사전 데이터, 한국어 단어를 영어로 해석하는 사전 데이터, 한국어 단어를 중국어로 해석하는 사전 데이터, 한국어 단어를 일어로 해석하는 사전 데이터 또는 한국어 단어를 한국어로 해석하는 사전 데이터를 고려할 수 있다.
즉, n 개의 언어 중 어느 하나의 언어를 원본 언어로 하고, m 개의 언어 중 어느 하나의 언어를 대상 언어로 하는 총 n*m 가지의 사전 데이터가 포함된다.
한편, 사전 데이터의 원본 언어의 각종 단어는 단어 인덱스 형태로 저장될 수 있다. 즉, 클라이언트(200)에서 전송되는 단어 인덱스를 기초로 검색이 수행되 므로, 사전 데이터는 단어 인덱스 정보를 포함하도록 구성된다. 한편, 사전 데이터의 각 단어에 대한 인덱스 정보에는 언어 식별자가 생략될 수 있다.
한편, 본 발명의 사전 데이터는 통상의 사전에 비하여 간략한 해석을 포함하도록 할 수 있다. 즉, 툴팁 형태의 해석을 제공하는 것이므로, 검색 대상이 되는 단어에 대한 대표 해석들만이 포함되도록 사전 데이터를 구성할 수 있다.
다시 사전 선택부(320)를 설명하면, 사전 선택부(320)는 원본 언어가 단어 인덱스 정보의 언어 식별자에 해당하며, 대상 언어가 해석 언어 정보에 해당하는 사전 데이터를 선택한다. 단어 인덱스 정보가 각 언어 별로 구분되는 인덱스 체계를 갖고 있으므로, 그로부터 원본 언어를 확인할 수 있다.
예를 들어, 해석 언어 정보가 영어이고, 단어 인덱스가 일본어를 나타내는 경우에는, 원본 언어가 일본어이고, 대상 언어가 영어인 사전 데이터를 선택한다. 즉, 웹 페이지에 포함된 각종 일본어 단어를 영어로 해석하는 사전 데이터가 선택된다. 또한, 해석 언어 정보가 한국어이고, 단어 인덱스가 중국어를 나타내는 경우에는, 원본 언어가 중국어이고, 대상 언어가 한국어인 사전 데이터를 선택한다. 즉, 웹 페이지에 포함된 각종 중국어 단어를 한국어로 해석하는 사전 데이터가 선택된다.
검색부(330)는 사전 선택부(320)에 의하여 선택된 사전 데이터로부터 단어 인덱스 정보에 해당하는 해석 데이터를 검색한다. 바람직하게는, 단어 인덱스 정보에 포함된 단어 식별자에 해당하는 해석 데이터를 검색하며, 검색된 해석 데이터는 검색 결과 전송부(340)로 전송된다.
검색 결과 전송부(340)는 검색된 해석 데이터를 네트워크를 통하여 클라이언트(200)로 전송한다.
참고로, 본 발명의 실시예에 따른 도 2와 도 3에 도시된 구성 요소들은 소프트웨어 또는 FPGA(Field Programmable Gate Array) 또는 ASIC(Application Specific Integrated Circuit)와 같은 하드웨어 구성 요소를 의미하며, 소정의 역할들을 수행한다.
그렇지만 '구성 요소들'은 소프트웨어 또는 하드웨어에 한정되는 의미는 아니며, 각 구성 요소는 어드레싱할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다.
따라서, 일 예로서 구성 요소는 소프트웨어 구성 요소들, 객체지향 소프트웨어 구성 요소들, 클래스 구성 요소들 및 태스크 구성 요소들과 같은 구성 요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로 코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들 및 변수들을 포함한다.
구성 요소들과 해당 구성 요소들 안에서 제공되는 기능은 더 작은 수의 구성 요소들로 결합되거나 추가적인 구성 요소들로 더 분리될 수 있다.
이제, 본 발명에 따른 온라인 사전 서비스 제공 방법에 대하여 살펴보기로 한다.
도 5는 본 발명의 일 실시예에 따른 온라인 사전 서비스 제공 방법을 도시한 순서도이다.
먼저, 사용자가 클라이언트(200)를 통해 선택한 언어를 해석 언어로 설정한다(S510). 통상의 경우 사용자의 모국어가 해석 언어로 선택되며, 이것이 해석 언어로 설정된다. 상기 해석 언어는 사용자가 직접 선택할 수도 있지만, 특정 언어 버전의 클라이언트를 선택함으로써 자동적으로 선택될 수 있다.
다음으로, 웹 페이지에서 포인팅 장치의 지시자를 통해 식별된 단어를 추출한다(S520). 먼저, 포인팅 장치의 지시자가 상기 웹 페이지의 단어 위에 기준값 이상의 시간 동안 위치하는 경우 해당 단어를 인식한다. 필요한 경우, 인식된 단어에 포함된 특수 문자를 트리밍하는 단계를 수행한다.
다음으로, 상기 추출된 단어에 대한 단어 인덱스를 검색한다(S530).
사전 서버(300)에 등록된 단어들에 대하여 부여된 고유의 인덱스들로부터 상기 인식된 단어 또는 상기 트리밍된 단어에 대한 인덱스를 검색하는 단계를 수행한다. 이때, 단어 인덱스는 언어 식별자와 해당 언어의 단어 식별자를 포함한다. 즉, 단어 인덱스는 각 언어별로 구분되는 인덱스 체계를 갖는다.
다음으로, 해석 언어 정보 및 단어 인덱스 정보를 포함하는 쿼리를 생성하고, 이를 사전 서버(300)로 전송한다(S540). 사용자 단말에 설치된 클라이언트(200)에서 쿼리를 생성하며, 사용자 단말과 사전 서버(300) 사이를 접속시키는 네트워크 수단을 통해 쿼리가 전송된다.
사전 서버(300)는 수신한 쿼리를 분석하여, 해석 언어 정보, 단어 인덱스 정보를 추출한다(S550). 추출된 해석 언어 정보는 사전 선택부(320)로, 단어 인덱스 정보는 사전 선택부(320) 및 검색부(330)로 전달된다.
다음으로, 해석 언어 정보, 단어 인덱스 정보를 기초로 하여 적절한 사전 데이터를 선택한다(S560). 이때, 단어 인덱스 정보에 포함되는 언어 식별자에 의하여 식별되는 언어는 사전 데이터의 원본 언어로 사용되고, 해석 언어 정보가 사전 데이터의 대상 언어로 사용된다.
다음으로, 선택된 사전 데이터로부터 단어 인덱스 정보에 해당하는 해석 데이터를 검색한다(S570). 선택된 사전 데이터로부터 단어 인덱스 정보의 단어 식별자에 해당하는 해석 데이터를 검색한다.
다음으로, 검색된 해석 데이터를 포함하는 검색 결과가 클라이언트(200)로 전송되며, 전송된 해석 데이터가 클라이언트(200)를 통해 사용자 단말에 표시된다(S580). 바람직하게는, 포인팅 장치가 지시하는 검색 대상 단어와 인접한 위치에 툴팁(tooltip) 형태로 표시한다.
본 발명의 일 실시예는 컴퓨터에 의해 실행되는 프로그램 모듈과 같은 컴퓨터에 의해 실행가능한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다. 컴퓨터 판독 가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독가능 매체는 컴퓨터 저장 매체 및 통신 매체를 모두 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다. 통신 매체는 전형적으로 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈, 또는 반송파와 같은 변조된 데이터 신호의 기타 데이터, 또는 기타 전송 메커니즘을 포함하며, 임의의 정보 전달 매체를 포함한다.
본 발명의 방법 및 시스템은 특정 실시예와 관련하여 설명되었지만, 그것들의 구성 요소 또는 동작의 일부 또는 전부는 범용 하드웨어 아키텍쳐를 갖는 컴퓨터 시스템을 사용하여 구현될 수 있다.
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.
본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
도 1은 통상적으로 제공되는 온라인 사전 서비스를 설명하기 위한 도면이다.
도 2는 본 발명의 일 실시예에 따른 온라인 사전 서비스 제공 장치를 도시한 도면이다.
도 3은 본 발명의 일 실시예에 따른 검색어 추출부의 상세 구성을 도시한 도면이다.
도 4는 본 발명의 일 실시예에 따른 단어 인덱스 저장부의 언어별 인덱스 체계를 도시한 도면이다.
도 5는 본 발명의 일 실시예에 따른 온라인 사전 서비스 제공 방법을 도시한 순서도이다.
<도면의 주요 부분에 대한 설명>
100: 온라인 사전 서비스 제공 장치
200: 클라이언트
210: 해석 언어 설정부 220: 검색어 추출부
230: 단어 인덱스 검색부 240: 단어 인덱스 저장부
250: 쿼리 생성부 260: 검색 결과 표시부
270: 환경 설정부 300: 사전 서버
310: 쿼리 분석부 320: 사전 선택부
330: 검색부 340: 검색 결과 전송부
350: 사전 데이터 저장부

Claims (16)

  1. 온라인 사전 서비스 제공 장치에 있어서,
    로딩된 웹 페이지에 포함된 단어에 대응하는 단어 인덱스 정보 및 미리 정해진 해석 언어 정보를 포함하는 쿼리를 사용자 단말로부터 수신하여 상기 해석 언어 정보 및 단어 인덱스 정보를 추출하는 쿼리 분석부,
    원본 언어의 단어들에 대한 대상 언어에 의한 해석 데이터를 포함하는 적어도 하나의 사전 데이터를 포함하는 사전 데이터 저장부,
    상기 해석 언어 정보 및 상기 단어 인덱스 정보에 기초하여 상기 사전 데이터를 선택하는 사전 선택부,
    상기 선택된 사전 데이터로부터 상기 단어 인덱스 정보에 해당하는 상기 해석 데이터를 검색하는 검색부 및
    상기 해석 데이터를 상기 클라이언트로 전송하는 검색 결과 전송부를 포함하고,
    상기 인덱스 정보는 국가 언어를 식별하는 언어 식별자 및 상기 원본 언어의 단어에 대응하는 단어 식별자를 포함하는 온라인 사전 서비스 제공 장치.
  2. 제 1 항에 있어서,
    상기 언어 식별자는 단어의 코드 패턴에 기초하여 결정되는 것인 온라인 사 전 서비스 제공 장치.
  3. 제 1 항에 있어서,
    상기 사전 데이터 저장부는 상기 원본 언어의 단어를 단어 인덱스 형태로 저장하는 사전 데이터를 포함하는 온라인 사전 서비스 제공 장치.
  4. 제 1 항에 있어서,
    상기 사전 선택부는 상기 원본 언어가 상기 단어 인덱스 정보의 언어 식별자에 해당하며, 상기 대상 언어가 상기 해석 언어 정보에 해당하는 사전 데이터를 선택하는 것인 온라인 사전 서비스 제공 장치.
  5. 제 1 항에 있어서,
    상기 검색부는 상기 선택된 사전 데이터로부터 상기 단어 인덱스 정보의 단어 식별자에 해당하는 해석 데이터를 검색하는 것인 온라인 사전 서비스 제공 장치.
  6. 제 1 항에 있어서,
    상기 쿼리는 상기 사용자 단말에 설치된 클라이언트가 생성하며,
    상기 클라이언트는
    특정 언어를 해석 언어로 설정하는 해석 언어 설정부,
    상기 사용자 단말에 로딩된 웹 페이지의 단어들 중 포인팅 장치에 의하여 지시된 단어를 추출하는 검색어 추출부,
    상기 단어 인덱스 정보를 저장하는 단어 인덱스 저장부,
    상기 단어 인덱스 저장부로부터 상기 추출된 단어의 인덱스를 검색하는 단어 인덱스 검색부,
    상기 해석 언어 정보 및 단어 인덱스 정보를 포함하는 쿼리를 생성하는 쿼리 생성부 및
    상기 해석 데이터를 수신하여 상기 사용자 단말에 표시하는 검색 결과 표시부를 포함하고,
    상기 단어 인덱스 검색부는 상기 추출된 단어의 코드 패턴에 기초하여 언어 식별자를 선택하는 것인 온라인 사전 서비스 제공 장치.
  7. 제 6 항에 있어서,
    상기 검색어 추출부는
    상기 포인팅 장치의 지시자가 상기 웹 페이지의 단어 위에 기준값 이상의 시 간 동안 위치하는 경우 해당 단어를 인식하는 단어 인식부 및
    상기 단어 인식부가 인식한 단어로부터 특수 문자를 포함하는 노이즈 문자를 제거하는 트리밍 처리부
    를 포함하는 온라인 사전 서비스 제공 장치.
  8. 온라인 사전 서비스 제공 방법에 있어서,
    로딩된 웹 페이지에 포함된 단어에 대응하는 단어 인덱스 정보 및 미리 정해진 해석 언어 정보를 포함하는 쿼리를 사용자 단말로부터 수신하는 단계,
    상기 쿼리로부터 상기 해석 언어 정보 및 단어 인덱스 정보를 추출하는 단계,
    원본 언어의 단어들에 대한 대상 언어에 의한 해석 데이터들을 포함하는 적어도 하나의 사전 데이터로부터, 상기 해석 언어 정보 및 단어 인덱스 정보에 기초하여 사전 데이터를 선택하는 단계,
    상기 선택된 사전 데이터로부터 상기 단어 인덱스 정보에 해당하는 상기 해석 데이터를 검색하는 단계 및
    상기 해석 데이터를 상기 사용자 단말로 전송하는 단계를 포함하고,
    상기 인덱스 정보는 국가 언어를 식별하는 언어 식별자 및 상기 원본 언어의 단어에 대응하는 단어 식별자를 포함하는 온라인 사전 서비스 제공 방법.
  9. 제 8 항에 있어서,
    상기 언어 식별자는 단어의 코드 패턴에 기초하여 결정되는 것인 온라인 사전 서비스 제공 방법.
  10. 제 8 항에 있어서,
    상기 사전 데이터를 선택하는 단계는
    상기 원본 언어가 상기 단어 인덱스 정보의 언어 식별자에 해당하며, 상기 대상 언어가 상기 해석 언어 정보에 해당하는 사전 데이터를 선택하는 것인 온라인 사전 서비스 제공 방법.
  11. 제 8 항에 있어서,
    상기 해석 데이터를 검색하는 단계
    상기 선택된 사전 데이터로부터 상기 단어 인덱스 정보의 단어 식별자에 해당하는 해석 데이터를 검색하는 것인 온라인 사전 서비스 제공 방법.
  12. 온라인 사전 서비스 제공 방법에 있어서,
    사용자 단말에 설치된 클라이언트를 통해 해석 언어를 설정하는 단계,
    상기 사용자 단말에 로딩된 웹 페이지의 단어들 중 포인팅 장치에 의하여 지시된 단어를 추출하는 단계,
    각 언어 별로 구분되는 체계를 갖는 단어 인덱스들을 포함하는 단어 인덱스 저장부로부터 상기 추출된 단어의 인덱스 정보를 검색하는 단계,
    상기 해석 언어 정보 및 단어 인덱스 정보를 포함하는 쿼리를 생성하는 단계 및
    상기 쿼리에 기초한 사전 서버의 검색 결과를 수신하여 상기 사용자 단말에 표시하는 단계
    를 포함하는 온라인 사전 서비스 제공 방법.
  13. 제 12 항에 있어서,
    상기 단어 인덱스 정보는 국가 언어를 식별하는 언어 식별자 및 상기 원본 언어의 단어에 대응하는 단어 식별자를 포함하는 것인 온라인 사전 서비스 제공 방법.
  14. 제 12 항에 있어서,
    상기 포인팅 장치에 의하여 지시된 단어를 추출하는 단계는
    상기 포인팅 장치의 지시자가 상기 웹 페이지의 단어 위에 기준값 이상의 시간 동안 위치하는 경우 해당 단어를 인식하는 단계 및
    상기 인식된 단어로부터 특수 문자를 포함하는 노이즈 문자를 트리밍하는 단계
    를 포함하는 온라인 사전 서비스 제공 방법.
  15. 제 12 항에 있어서,
    상기 추출된 단어의 인덱스를 검색하는 단계는
    상기 추출된 단어의 코드 패턴에 기초하여 단어 인덱스의 언어 식별자를 선택하는 것인 온라인 사전 서비스 제공 방법.
  16. 제8항 내지 제15항 중 어느 하나의 항에 기재된 단계를 수행하는 프로그램이 기록된 컴퓨터가 읽기 가능한 기록 매체.
KR1020090044355A 2009-05-21 2009-05-21 온라인 사전 서비스 제공 장치 및 방법 KR101042907B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020090044355A KR101042907B1 (ko) 2009-05-21 2009-05-21 온라인 사전 서비스 제공 장치 및 방법
JP2010116852A JP5693046B2 (ja) 2009-05-21 2010-05-21 オンライン辞書サービス提供システム、オンライン辞書サービス提供装置及びその方法並びにその方法を実行するプログラムが記録されたコンピュータ読取可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090044355A KR101042907B1 (ko) 2009-05-21 2009-05-21 온라인 사전 서비스 제공 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20100125578A true KR20100125578A (ko) 2010-12-01
KR101042907B1 KR101042907B1 (ko) 2011-06-21

Family

ID=43420042

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090044355A KR101042907B1 (ko) 2009-05-21 2009-05-21 온라인 사전 서비스 제공 장치 및 방법

Country Status (2)

Country Link
JP (1) JP5693046B2 (ko)
KR (1) KR101042907B1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5508596B1 (ja) * 2013-12-25 2014-06-04 利仁 曽根 入力支援方法
KR101932814B1 (ko) * 2016-10-21 2019-03-20 노홍석 단어 정보 제공 방법 및 시스템
CN115019572B (zh) * 2022-06-29 2024-04-05 张磊 一种提升电子词典笔学习和记忆效果的系统和方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0668140A (ja) * 1992-08-20 1994-03-11 Hitachi Ltd 電子翻訳方式
KR20010003037A (ko) * 1999-06-21 2001-01-15 장충엽 다국어 입력기
KR100480345B1 (ko) * 2002-03-27 2005-04-06 서호일 언어코드를 사용한 언어 학습/번역 서비스 시스템 및 그방법

Also Published As

Publication number Publication date
JP2010272116A (ja) 2010-12-02
JP5693046B2 (ja) 2015-04-01
KR101042907B1 (ko) 2011-06-21

Similar Documents

Publication Publication Date Title
US8745051B2 (en) Resource locator suggestions from input character sequence
CN101395608B (zh) 在搜索结果的站点内搜索
US9129009B2 (en) Related links
CN102609208A (zh) 在触屏设备上进行屏幕取词的方法、系统及触屏设备
US20110316796A1 (en) Information Search Apparatus and Information Search Method
CN105528338B (zh) 智能预测的输入方法和系统
JP2009289202A (ja) キーワード入力支援装置、キーワード入力支援方法及びプログラム
US20170161238A1 (en) Emojis for redirecting user to desired websites
US20090282037A1 (en) Method and system for providing convenient dictionary services
CN106708885A (zh) 一种实现搜索的方法和装置
US10303747B2 (en) Method, apparatus and system for controlling address input
US10430522B2 (en) Dynamic suggestions for content translation
KR101042907B1 (ko) 온라인 사전 서비스 제공 장치 및 방법
KR101072254B1 (ko) 온라인 사전 서비스 제공 장치 및 방법
KR100913389B1 (ko) 인터넷검색서비스방법 및 그 시스템
KR20140115849A (ko) 단어의 의미를 기반으로 하는 다국어 검색 시스템, 다국어 검색 방법 및 이를 이용한 이미지 검색 시스템
US20160224533A1 (en) Search engine buttons matrix interface
KR101099010B1 (ko) 온라인 사전 서비스 제공 방법 및 장치, 그 프로그램을 기록한 컴퓨터로 판독 가능한 기록매체
CN104778156B (zh) 文本输入方法、文本输入装置及电子设备
KR102186595B1 (ko) 검색 서비스 제공 시스템 및 방법
KR20120091598A (ko) 다국어 웹 페이지를 이용한 통합 검색 시스템 및 방법, 다국어 웹 페이지 검색이 가능한 단말기
KR101326427B1 (ko) 웹 네비게이션 서비스 시스템
KR101724680B1 (ko) 검색 서비스 제공 장치 및 검색 서비스 제공 방법
KR101727821B1 (ko) 컨텐츠 내 단어에 대한 정답성 검색 결과를 제공하는 방법 및 시스템
KR101182255B1 (ko) 정보 액세스 지원을 위한 방법 및 이를 위한 기록매체

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20160329

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20170328

Year of fee payment: 7