KR101072254B1 - Method and apparatus for providing an online dictionary service - Google Patents

Method and apparatus for providing an online dictionary service Download PDF

Info

Publication number
KR101072254B1
KR101072254B1 KR1020090044356A KR20090044356A KR101072254B1 KR 101072254 B1 KR101072254 B1 KR 101072254B1 KR 1020090044356 A KR1020090044356 A KR 1020090044356A KR 20090044356 A KR20090044356 A KR 20090044356A KR 101072254 B1 KR101072254 B1 KR 101072254B1
Authority
KR
South Korea
Prior art keywords
information
web page
language
user
word
Prior art date
Application number
KR1020090044356A
Other languages
Korean (ko)
Other versions
KR20100125579A (en
Inventor
안재홍
소순식
윤찬호
Original Assignee
엔에이치엔(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엔에이치엔(주) filed Critical 엔에이치엔(주)
Priority to KR1020090044356A priority Critical patent/KR101072254B1/en
Priority to JP2010116530A priority patent/JP5416033B2/en
Publication of KR20100125579A publication Critical patent/KR20100125579A/en
Application granted granted Critical
Publication of KR101072254B1 publication Critical patent/KR101072254B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3337Translation of the query language, e.g. Chinese to English
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

사용자 단말로부터 사용자 모국어 정보, 로딩된 웹 페이지의 인코딩 언어 정보 및 상기 웹 페이지에 포함된 검색어 정보를 포함하는 쿼리를 수신하여 상기 사용자 모국어 정보, 웹 페이지의 인코딩 언어 정보 및 검색어 정보를 추출하는 쿼리 분석부, 원본 언어의 단어들에 대한 대상 언어에 의한 해석 데이터들을 포함하는 적어도 하나의 사전 데이터를 포함하는 사전 데이터 저장부, 상기 사용자 모국어 정보 및 웹 페이지 인코딩 언어 정보에 기초하여 상기 사전 데이터를 선택하는 사전 선택부, 상기 선택된 사전 데이터로부터 상기 검색어 정보에 대응하는 상기 해석 데이터를 검색하는 검색부 및 상기 해석 데이터를 상기 사용자 단말로 전송하는 검색 결과 전송부를 포함하는 온라인 사전 서비스 제공 장치를 제공한다.

Figure R1020090044356

온라인 사전, 툴팁

A query analysis for extracting the user native language information, the encoding language information of the web page and the search term information by receiving a query including the user native language information, the encoding language information of the loaded web page and the search term information included in the web page from the user terminal A dictionary data storage unit including at least one dictionary data including interpretation data of a target language of words of a source language, and selecting the dictionary data based on the user native language information and web page encoding language information. It provides a pre-selection unit, a search unit for searching the analysis data corresponding to the search word information from the selected dictionary data and a search result transmission unit for transmitting the analysis data to the user terminal.

Figure R1020090044356

Online dictionaries, tooltips

Description

온라인 사전 서비스 제공 장치 및 방법{METHOD AND APPARATUS FOR PROVIDING AN ONLINE DICTIONARY SERVICE}METHOD AND APPARATUS FOR PROVIDING AN ONLINE DICTIONARY SERVICE}

본 발명은 온라인 사전 서비스의 제공 장치 및 방법에 관한 것이다.The present invention relates to an apparatus and method for providing an online dictionary service.

최근 인터넷 사용 인구의 증가 및 인터넷을 통한 정보 검색의 활성화로 인하여 모국어로 작성된 웹 페이지뿐만 아니라, 다른 나라의 언어로 작성된 웹 페이지를 실행시키는 경우가 많아졌다. 다른 나라의 언어로 작성된 웹 페이지를 해독하기 위해서는 해당 언어에 능통해야 하지만, 이러한 언어 구사 능력을 가진 사용자는 소수에 그친다. 따라서 인터넷 사용자의 편의를 증가시키기 위한 목적으로써, 언어의 장벽을 해소하기 위한 번역 서비스 또는 사전 서비스가 제공되고 있다.Recently, due to the increase in the number of Internet users and the activation of information retrieval through the Internet, not only web pages written in the native language but also web pages written in languages of other countries have been executed. To decipher a web page written in another language, you need to be proficient in that language, but only a few users are able to speak these languages. Therefore, for the purpose of increasing the convenience of the Internet user, a translation service or a dictionary service for solving the language barrier is provided.

통상의 번역 서비스의 경우 웹 페이지에 포함된 문장 또는 번역하고자 하는 웹 페이지의 URL을 복사하여 번역 서비스 제공 웹 페이지 등에 입력하면, 번역 서버에 상기 입력된 원문이 전달되고, 원문에 대한 번역 결과를 사용자 단말에 전송하는 방식을 사용된다. 그러나 이러한 번역 서비스의 번역 품질은 만족스러운 수 준이 아니며, 원문 또는 URL을 복사하여 입력하는 번거로운 절차를 거치게 된다.In the case of a normal translation service, if a text included in a web page or a URL of a web page to be translated is copied and input into a translation service providing web page, the input original text is delivered to a translation server, and the user translates the original text into a translation result. A method of transmitting to the terminal is used. However, the translation quality of these translation services is not satisfactory and goes through a cumbersome process of copying and entering the original text or URL.

또한, 통상의 사전 서비스의 경우, 검색하고자 하는 단어를 마우스와 같은 포인팅 장치로 지시하면, 해당 단어가 웹 서버로 전송되어, 그에 대한 해석 결과가 표시된다. 즉, 단어 단위로 해석이 제공되는 것이다. In addition, in a conventional dictionary service, when a word to be searched is instructed by a pointing device such as a mouse, the word is transmitted to a web server, and an analysis result thereof is displayed. That is, interpretation is provided on a word-by-word basis.

도 1은 통상적으로 제공되는 온라인 사전 서비스를 설명하기 위한 도면이다.1 is a diagram for explaining an online dictionary service that is typically provided.

네이버(www.naver.com) 또는 다음(www.daum.net)과 같은 포털 사이트 등에서는 사용자의 편의를 위하여 여러 가지 간단한 애플리케이션들이 포함된 툴바 서비스를 제공하고 있다. 상기 툴바 서비스에 포함된 하나의 서비스로서 온라인 사전 서비스가 제공되고 있다. 도시된 바와 같이, 영어 단어 위에 마우스와 같은 포인팅 장치의 지시자(10)가 웹 페이지에 포함된 단어(research)를 지시하면, 해당 단어(research)에 대한 해석(20)이 툴팁(tooltip) 형태로 제공된다. 이때, 지시자(10)가 단어의 주변에 위치하는 것으로 도시되어 있으나, 대체적인 실시예의 경우 단어의 바로 위에 위치한다. For example, portal sites such as Naver (www.naver.com) or Daum (www.daum.net) provide a toolbar service that includes several simple applications. An online dictionary service is provided as one service included in the toolbar service. As shown, when the indicator 10 of a pointing device such as a mouse over an English word indicates a word included in a web page, the interpretation 20 of the word is in the form of a tooltip. Is provided. In this case, although the indicator 10 is shown as being positioned around the word, in an alternative embodiment, it is located directly above the word.

한편, 종래 기술은 지정된 제 1 국가언어(예를 들어, 영어)에 대한 지정된 제 2 국가언어(예를 들어, 한국어)로의 해석만을 제공하고 있어, 그 밖의 국가 언어에 대한 해석을 동적으로 제공하지 못하고 있다. 이에 다양한 사용자들의 요구에 맞는 온라인 사전 서비스를 제공할 필요성이 있다. On the other hand, the prior art only provides the interpretation of the designated first national language (eg, English) to the designated second national language (eg, Korean), and does not dynamically provide interpretation of other national languages. I can't. Therefore, there is a need to provide an online dictionary service that meets the needs of various users.

본 발명의 일부 실시예는 여러 종류의 언어에 대하여 모국어 해석을 동적으로 제공할 수 있는 온라인 사전 서비스 제공 장치 및 방법을 제공한다.Some embodiments of the present invention provide an online dictionary service providing apparatus and method capable of dynamically providing a native language interpretation for various kinds of languages.

상술한 기술적 과제를 달성하기 위한 기술적 수단으로서, 본 발명의 제 1 측면은 사용자 단말로부터 사용자 모국어 정보, 로딩된 웹 페이지의 인코딩 언어 정보 및 상기 웹 페이지에 포함된 검색어 정보를 포함하는 쿼리를 수신하여 상기 사용자 모국어 정보, 웹 페이지의 인코딩 언어 정보 및 검색어 정보를 추출하는 쿼리 분석부, 원본 언어의 단어들에 대한 대상 언어에 의한 해석 데이터들을 포함하는 적어도 하나의 사전 데이터를 포함하는 사전 데이터 저장부, 상기 사용자 모국어 정보 및 웹 페이지 인코딩 언어 정보에 기초하여 상기 사전 데이터를 선택하는 사전 선택부, 상기 선택된 사전 데이터로부터 상기 검색어 정보에 대응하는 상기 해석 데이터를 검색하는 검색부 및 상기 해석 데이터를 상기 사용자 단말로 전송하는 검색 결과 전송부를 포함하는 온라인 사전 서비스 제공 장치를 제공한다.As a technical means for achieving the above-described technical problem, a first aspect of the present invention is to receive a query including the user native language information, the encoding language information of the loaded web page and the search term information included in the web page from the user terminal A query analyzer extracting the user native language information, encoding language information of the web page, and search term information; a dictionary data storage unit including at least one dictionary data including interpretation data of target words for words of a source language; A pre-selection unit for selecting the dictionary data based on the user native language information and web page encoding language information, a search unit for searching the analysis data corresponding to the search word information from the selected dictionary data, and the analysis data at the user terminal; Search result transmission to send to It provides an online dictionary service device.

또한, 본 발명의 제 2 측면은 사용자 단말로부터 사용자 모국어 정보, 로딩된 웹 페이지의 인코딩 언어 정보 및 상기 웹 페이지에 포함된 검색어 정보를 포함하는 쿼리를 수신하는 단계, 상기 쿼리로부터 상기 사용자 모국어 정보, 웹 페이지의 인코딩 언어 정보 및 검색어 정보를 추출하는 단계, 원본 언어의 단어들에 대한 대상 언어에 의한 해석 데이터들을 포함하는 적어도 하나의 사전 데이터로부터, 상기 사용자 모국어 정보 및 웹 페이지 인코딩 언어 정보에 기초하여 사전 데이터를 선택하는 단계, 상기 선택된 사전 데이터로부터 상기 검색어 정보에 대응하는 상기 해석 데이터를 검색하는 단계 및 상기 해석 데이터를 상기 사용자 단말로 전송하는 단계를 포함하는 온라인 사전 서비스 제공 방법을 제공한다.In addition, a second aspect of the present invention is to receive a query including a user native language information, encoding language information of the loaded web page and the search term information included in the web page from the user terminal, the user native language information from the query, Extracting encoding language information and search term information of a web page, from at least one dictionary data including interpretation data by target language for words of a source language, based on the user native language information and web page encoding language information Selecting dictionary data, searching for the analysis data corresponding to the search word information from the selected dictionary data and transmitting the analysis data to the user terminal provides an online dictionary service providing method.

또한, 본 발명의 제 3 측면은 사용자 단말로부터 사용자의 모국어 정보를 확인하는 단계, 상기 사용자 단말에 로딩된 웹 페이지의 인코딩 언어 정보를 확인하는 단계, 상기 웹 페이지 상에서 포인팅 장치를 통해 포인팅된 단어를 추출하여 검색어 정보를 생성하는 단계, 상기 사용자 모국어 정보, 상기 웹 페이지의 인코딩 언어 정보 및 상기 검색어 정보를 포함하는 쿼리를 생성하는 단계 및 상기 쿼리에 기초한 사전 서버의 검색 결과를 수신하여 상기 사용자 단말에 표시하는 단계를 포함하는 온라인 사전 서비스 제공 방법을 제공한다. In addition, the third aspect of the present invention is to identify the user's native language information from the user terminal, the step of confirming the encoding language information of the web page loaded on the user terminal, words pointing through the pointing device on the web page Extracting and generating search term information, generating a query including the user native language information, encoding language information of the web page, and the search term information, and receiving a search result of a dictionary server based on the query to the user terminal. It provides an online dictionary service providing method comprising the step of displaying.

또한, 본 발명의 제 4 측면은 상기 온라인 사전 서비스 제공 방법에 기재된 단계를 수행하는 프로그램이 기록된 컴퓨터가 읽기 가능한 기록 매체를 제공한다.A fourth aspect of the present invention also provides a computer-readable recording medium having recorded thereon a program for performing the steps described in the online dictionary service providing method.

전술한 본 발명의 과제 해결 수단에 의하면, 사용자의 모국어에 따라 웹 페이지에 표시된 여러 나라의 언어에 대하여 자동으로 해석 서비스를 제공할 수 있다. 특히, 사용자의 모국어를 기초로 해석 서비스를 제공하므로, 사용자에 최적화된 서비스를 제공할 수 있다. 또한, 사용자의 모국어를 사용자 단말의 설정에 기 초하여 자동으로 확인하므로, 편리성이 더욱 증가한다.According to the problem solving means of the present invention described above, it is possible to automatically provide an analysis service for the languages of various countries displayed on the web page according to the user's native language. In particular, since the analysis service is provided based on the user's native language, the service optimized for the user can be provided. In addition, since the user's native language is automatically checked based on the setting of the user terminal, convenience is further increased.

아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.DETAILED DESCRIPTION Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings so that those skilled in the art may easily implement the present invention. The present invention may, however, be embodied in many different forms and should not be construed as limited to the embodiments set forth herein. In the drawings, parts irrelevant to the description are omitted in order to clearly describe the present invention, and like reference numerals designate like parts throughout the specification.

명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.Throughout the specification, when a part is "connected" to another part, this includes not only "directly connected" but also "electrically connected" with another element in between. . In addition, when a part is said to "include" a certain component, which means that it may further include other components, except to exclude other components unless otherwise stated.

이하, 도면을 참조하여 본 발명의 내용을 살펴보기로 한다.Hereinafter, the contents of the present invention will be described with reference to the accompanying drawings.

도 2는 본 발명의 일 실시예에 따른 온라인 사전 서비스 제공 장치를 도시한 도면이다.2 is a diagram illustrating an online dictionary service providing apparatus according to an embodiment of the present invention.

온라인 사전 서비스 제공 장치(100)는 클라이언트(200)와 사전 서버(300)를 포함한다. 클라이언트(200)는 사용자 단말에 설치되어 각종 정보를 수집하여 네트워크를 통해 사전 서버(300)로 전달한다. 네트워크는 근거리 통신망(Local Area Network; LAN), 광역 통신망(Wide Area Network; WAN) 또는 부가가치 통신망(Value Added Network; VAN) 등과 같은 유선 네트워크나 이동 통신망(mobile radio communication network) 또는 위성 통신망 등과 같은 모든 종류의 무선 네트워크로 구현될 수 있다.The online dictionary service providing apparatus 100 includes a client 200 and a dictionary server 300. The client 200 is installed in the user terminal and collects various types of information and transmits it to the dictionary server 300 through the network. The network may be any wired network, such as a local area network (LAN), wide area network (WAN), or value added network (VAN), or a mobile radio communication network, or a satellite communication network. It can be implemented as a kind of wireless network.

클라이언트(200)는 사용자의 모국어 정보, 웹 페이지의 인코딩 언어 정보 및 검색어 정보를 포함하는 쿼리를 생성하여 사전 서버(300)에 전송한다. 클라이언트(200)는 사용자 모국어 확인부(210), 웹 페이지 언어 확인부(220), 검색어 생성부(230), 쿼리 생성부(240), 검색결과 표시부(250), 환경 설정부(260)를 포함한다. The client 200 generates a query including the user's native language information, the encoding language information of the web page, and the search word information and transmits the query to the dictionary server 300. The client 200 may include a user native language confirmation unit 210, a web page language confirmation unit 220, a search term generator 230, a query generator 240, a search result display unit 250, and an environment setting unit 260. Include.

클라이언트(200)는 네트워크를 통해 다운로드 되어 컴퓨터나 휴대용 단말기와 같은 사용자 단말에 설치된다. 여기서, 컴퓨터는 예를 들어, 웹 브라우저(WEB Browser)가 탑재된 노트북, 데스크톱(desktop), 랩톱(laptop) 등을 포함하고, 휴대용 단말기는 예를 들어, 휴대성과 이동성이 보장되는 무선 통신 장치로서, PCS(Personal Communication System), GSM(Global System for Mobile communications), PDC(Personal Digital Cellular), PHS(Personal Handyphone System), PDA(Personal Digital Assistant), IMT(International Mobile Telecommunication)-2000, CDMA(Code Division Multiple Access)-2000, W-CDMA(W-Code Division Multiple Access), Wibro(Wireless Broadband Internet) 단말 등과 같은 모든 종류의 핸드헬드(Handheld) 기반의 무선 통신 장치를 포함할 수 있다.The client 200 is downloaded through a network and installed in a user terminal such as a computer or a portable terminal. Here, the computer includes, for example, a laptop, desktop, laptop, etc., which is equipped with a web browser, and the portable terminal is, for example, a wireless communication device that ensures portability and mobility. , Personal Communication System (PCS), Global System for Mobile communications (GSM), Personal Digital Cellular (PDC), Personal Handyphone System (PHS), Personal Digital Assistant (PDA), International Mobile Telecommunication (IMT) -2000, Code CDMA Division type multiple access (WDM) -2000, W-Code Division Multiple Access (W-CDMA), Wireless Broadband Internet (WBRO) terminal, and the like can include all types of handheld based wireless communication devices.

사용자 모국어 확인부(210)는 사용자 단말의 설정 상태로부터 사용자의 모국어를 확인한다. 예를 들어, 컴퓨터나 휴대용 단말기에 설치된 운영체제(OS) 또는 응용 프로그램의 정보로부터 사용자의 모국어를 확인한다. 통상적으로 사용되는 운영체제(OS)로는 마이크로소프트(Microsoft)사의 윈도우(Windows) 시리즈 제품을 예로들 수 있다. 상기 윈도우 OS의 경우 영어 외에 각 나라의 국어를 메인 언어로 표시하는 제품들로 분류될 수 있다. 예를 들어, 한국어, 중국어, 일본어 등을 메인 언어로 사용하는 윈도우 OS가 사용자 단말에 설치된다. 따라서 사용자 단말에 설치된 OS를 기초로 하여 사용자의 모국어를 판단할 수 있다. 즉, 사용자 단말에 설치된 운영 체제의 메인 언어가 영어인 경우에는 사용자의 모국어는 영어인 것으로 판단한다. The user native language confirmation unit 210 confirms the user's native language from the setting state of the user terminal. For example, the user's native language is identified from information of an operating system (OS) or an application program installed in a computer or a portable terminal. A commonly used operating system (OS) is Microsoft's Windows series products. In the case of the Windows OS, products other than English may be classified into products that display the national language of each country as the main language. For example, a Windows OS using Korean, Chinese, Japanese, etc. as a main language is installed in a user terminal. Therefore, the user's native language can be determined based on the OS installed in the user terminal. That is, when the main language of the operating system installed in the user terminal is English, it is determined that the native language of the user is English.

또한, 사용자 단말의 운영체제(OS)외에 각종 응용 프로그램의 정보로부터 사용자의 모국어를 확인할 수 있다. 응용 프로그램에는 오피스 프로그램 또는 웹 브라우저 등 여러 가지 소프트웨어가 포함될 수 있다. 이러한 응용 프로그램 역시 운영체제와 마찬가지로 각 나라의 국어를 메인 언어로 표시하는 제품들로 분류될 수 있다. 따라서 사용자 단말에 설치된 응용 프로그램의 메인 언어에 기초하여 사용자의 모국어를 확인할 수 있다. In addition, the mother tongue of the user may be confirmed from information of various application programs in addition to the operating system (OS) of the user terminal. The application may include various software such as an office program or a web browser. Like the operating system, such application programs may be classified into products that display the national language of each country as the main language. Therefore, the user's native language can be checked based on the main language of the application program installed in the user terminal.

한편, 상당수의 사용자 단말의 경우 운영체제의 메인 언어와 응용 프로그램의 메인 언어가 일치하므로, 두 기준 중 어느 하나만을 사용하여 사용자의 모국어를 확인할 수 있다. 만약, 운영체제의 메인 언어와 응용 프로그램의 메인 언어가 다른 경우에는 운영체제의 메인 언어를 기초로 하여 사용자의 모국어를 결정하거나, 응용 프로그램의 메인 언어를 기초로 하여 사용자의 모국어를 결정한다. On the other hand, in the case of a large number of user terminals, since the main language of the operating system and the main language of the application program match, it is possible to check the user's native language using only one of the two criteria. If the main language of the operating system and the main language of the application program are different, the mother tongue of the user is determined based on the main language of the operating system, or the mother tongue of the user is determined based on the main language of the application program.

웹 페이지 언어 확인부(220)는 사용자 단말의 웹 브라우저에 로딩된 웹 페이 지의 인코딩 언어를 확인한다. 통상의 웹 페이지는 HTML 언어로서 작성되며, 웹 페이지의 프로그래밍 문서의 헤더(heater) 영역에는 해당 웹 페이지가 어떤 언어를 기준으로 하여 인코딩 되었는지 여부에 대한 정보가 저장된다.The web page language confirmation unit 220 checks the encoding language of the web page loaded in the web browser of the user terminal. A typical web page is written as an HTML language, and the header area of the programming document of the web page stores information about which language the web page is encoded based on.

도 3은 웹 페이지의 인코딩 정보를 포함하는 헤더의 일 예를 나타내는 도면이다. 3 is a diagram illustrating an example of a header including encoding information of a web page.

웹 페이지의 인코딩 정보는 ‘charset’의 설정값에 따라 결정된다. 도시된 바와 같이 ‘charset’이 ‘euc-kr’로 설정된 경우, 해당 웹 페이지는 ‘euc-kr’ 코드에 따라 인코딩된 것으로 판단한다. ‘euc-kr’ 코드는 한국어를 기반으로 하는 인코딩 방법이므로, 해당 웹 페이지는 한국어를 기초로 하여 작성된 것으로 판단한다. The encoding information of the web page is determined by the setting of 'charset'. As shown in the figure, when 'charset' is set to 'euc-kr', the web page is determined to be encoded according to the 'euc-kr' code. The 'euc-kr' code is based on Korean, so the web page is determined to be based on Korean.

이와 같은 인코딩 방법은 포함하는 언어의 종류, 개발 주체 등에 따라 다양한 종류로 구분된다. 일본어를 기반으로 하는 인코딩 방법으로는 Shift_JIS, EUC-JP, ISO-2022-JP 등이 있고, 중국어를 기반으로 하는 인코딩 방법으로는 GB 2312, GBK, GB 18030, Big5 등이 있으며, 한국어를 기반으로 하는 인코딩 방법으로는 EUC-KR, ISO-2022-KR 등이 있다. 그 밖에, 아랍어, 발트어, 중앙 유럽어, 그리스어, 히브리어, 태국어, 터키어, 베트남어, 서유럽어 등 각 언어를 기반으로 하는 여러 인코딩 방법이 알려져 있다. Such encoding methods are classified into various types according to the type of language included, the subject of development, and the like. Japanese-based encoding methods include Shift_JIS, EUC-JP, ISO-2022-JP, and Chinese-based encoding methods include GB 2312, GBK, GB 18030, and Big5. Encoding methods are EUC-KR and ISO-2022-KR. In addition, several encoding methods are known based on each language such as Arabic, Baltic, Central European, Greek, Hebrew, Thai, Turkish, Vietnamese, and Western European.

따라서 각 웹 페이지의 인코딩 정보를 확인하면, 해당 웹 페이지에 기술된 언어가 어떠한 언어로 작성되어 있는지를 확인할 수 있다.Therefore, by checking the encoding information of each web page, it is possible to confirm in which language the language described in the web page is written.

웹 페이지 언어 확인부(220)는 각 웹 페이지의 프로그래밍 문서의 헤더 부분 의 ‘charset’에 설정된 값을 추출하여 인코딩 정보를 확인할 수 있다. 또는, BHO (Browser Helper Objects) 모듈을 이용하여 웹 페이지의 인코딩 정보를 확인할 수 있다.The web page language checking unit 220 may check encoding information by extracting a value set in 'charset' of a header portion of a programming document of each web page. Alternatively, you can check the encoding information of the web page using the Browser Helper Objects (BHO) module.

검색어 생성부(230)는 마우스와 같은 포인팅 장치를 통해 지시되는 위치에 있는 단어를 추출하여 검색어 정보를 생성한다. 도면을 참조하여 상세 구성을 살펴보기로 한다.The search term generator 230 extracts a word at a position indicated by a pointing device such as a mouse to generate search term information. A detailed configuration will be described with reference to the drawings.

도 4는 본 발명의 일 실시예에 따른 검색어 생성부의 상세 구성을 도시한 도면이다.4 is a diagram illustrating a detailed configuration of a search word generator according to an exemplary embodiment of the present invention.

검색어 생성부(230)는 단어 인식부(232), 트리밍 처리부(234), 단어 인덱스 검색부(236), 단어 인덱스 저장부(238)를 포함한다.The search word generator 230 includes a word recognizer 232, a trimming processor 234, a word index searcher 236, and a word index storage 238.

단어 인식부(232)는 포인팅 장치의 지시자가 단어 위에 위치하는 이벤트를 감지하고, 이벤트가 발생한 지점의 단어를 인식하여 트리밍 처리부(234)로 전달한다. 이때, 포인팅 장치는 마우스, 태블릿(tablet), 터치 패드 또는 터치 스크린 등과 같은 다양한 형태의 입력 장치가 될 수 있다. 터치 스크린의 경우 별도의 장치 외에 손가락에 의하여 지시자의 이동이 제어될 수 있다. The word recognizer 232 detects an event in which the indicator of the pointing device is positioned on the word, recognizes a word at a point where the event occurs, and transmits the word to the trimming processor 234. In this case, the pointing device may be various types of input devices such as a mouse, a tablet, a touch pad, or a touch screen. In the case of a touch screen, the movement of the indicator may be controlled by a finger in addition to a separate device.

단어 인식부(232)는 포인팅 장치의 이동 여부를 지속적으로 감지하며, 지시자가 단어 위에 위치하는 시간이 기준값 이상인 경우, 지시자가 위치하는 지점의 단어를 인식한다. 이때, 상기 기준값을 사용자의 설정에 따라 조절함으로써 단어 인식의 민감도를 조절할 수 있다. 즉, 지시자가 단어 위에 위치하는 시간의 기준 값을 증가시키면, 단어 인식의 민감도가 감소될 것이다. 역으로, 지시자가 단어 위에 위치하는 시간의 기준 값을 감소시키면, 단어 인식의 민감도가 증가할 것이다.The word recognition unit 232 continuously detects whether the pointing device is moved, and recognizes a word at a point where the indicator is located when the indicator is longer than a reference value. In this case, the sensitivity of word recognition may be adjusted by adjusting the reference value according to a user's setting. That is, if the indicator increases the reference value of time over the word, the sensitivity of word recognition will be reduced. Conversely, decreasing the reference value of the time the indicator is positioned over a word will increase the sensitivity of word recognition.

트리밍 처리부(234)는 단어 인식부(232)가 인식한 단어 중 노이즈(noise) 문자를 제거한다. 노이즈 문자는 단어의 해석과 무관한 여러 문자나 각종 특수 문자를 포함한다. 즉, 인식된 단어의 앞, 뒤, 중간 부분 등에 위치한 작은 따옴표(‘ ’), 큰 따옴표(“ ”), 느낌표(!), 물음표(?)등 각종 문장 부호 등이 노이즈 문자에 포함되며, 트리밍 처리부(234)는 이러한 노이즈 문자를 제거하는 트리밍 동작을 수행한다.The trimming processor 234 removes noise characters from the words recognized by the word recognizer 232. Noise characters include various characters or various special characters that are unrelated to word interpretation. In other words, various punctuation marks such as single quotation marks (''), double quotation marks (“”), exclamation marks (!), And question marks (?) Located in front of, behind, and the middle of the recognized word are included in the noise character. The processor 234 performs a trimming operation to remove such noise characters.

단어 인덱스 검색부(236)는 단어 인식부(232)에 의하여 인식된 단어, 또는 단어 인식부(232)에 의하여 인식되고 트리밍 처리부(234)에 의하여 트리밍 처리된 단어의 인덱스를 단어 인덱스 저장부(238)로부터 검색한다. 또한, 검색된 단어 인덱스를 검색어 정보로 설정하여 쿼리 생성부(240)로 전송한다. 만약, 검색된 단어 인덱스가 없는 경우에는 해당 단어에 대한 해석이 사전 서버(300)에도 없는 것으로 판단하여, 해당 단어에 대한 쿼리가 생성되지 않도록 한다.The word index search unit 236 may convert the index of the word recognized by the word recognizer 232 or the word recognized by the word recognizer 232 and trimmed by the trimming processor 234 into a word index storage unit ( 238). In addition, the searched word index is set as search word information and transmitted to the query generator 240. If there is no search word index, it is determined that there is no interpretation for the word in the dictionary server 300, so that a query for the word is not generated.

단어 인덱스 저장부(238)는 사전 서버(300)에 등록된 단어들에 대하여 고유의 인덱스를 지정하여 저장한다. 단어 인식부(232)에서 인식된 단어 중에는 사전 서버(300)에 등록되지 않은 단어들이 있을 수 있다. 이러한 단어들이 쿼리에 포함되는 경우, 사전 서버(300)는 해당 단어에 대한 검색 값을 리턴할 수 없기 때문에 불필요한 연산을 수행하게 되는 문제점이 발생한다. 이에, 본 발명에서는 사전 서버(300)에 등록된 단어들의 인덱스 정보를 클라이언트(200)에 저장시키고, 사전 서 버(300)에 등록된 단어들에 대해서만 쿼리가 생성되도록 한다. The word index storage unit 238 designates and stores a unique index of words registered in the dictionary server 300. Among words recognized by the word recognizer 232 may be words not registered in the dictionary server 300. If such words are included in the query, the dictionary server 300 may not return a search value for the word, thereby causing an unnecessary operation. Thus, in the present invention, the index information of the words registered in the dictionary server 300 is stored in the client 200, and the query is generated only for the words registered in the dictionary server 300.

한편, 단어 인덱스 저장부(238)는 언어 별로 구별되는 인덱스 테이블을 갖도록 할 수 있다. 즉, 한국어, 영어, 일본어, 중국어 등 각종 언어별로 서로 다른 인덱스 테이블을 포함하도록 한다.Meanwhile, the word index storage 238 may have an index table distinguished for each language. That is, different index tables may be included for various languages such as Korean, English, Japanese, and Chinese.

다시 도 2를 참조하면, 쿼리 생성부(240)는 사용자 모국어 정보, 웹 페이지 인코딩 언어 정보 및 검색어 정보를 포함하는 쿼리를 생성한다. 사용자 모국어 정보는 사용자 모국어 확인부(210)로부터 수신하고, 웹 페이지 인코딩 언어 정보는 웹 페이지 언어 확인부(220)로부터 수신하며, 검색어 정보는 검색어 생성부(230)로 수신한다. 이때, 검색어 정보는 검색어 생성부(230)에서 출력되는 단어 인덱스 형태가 될 수 있다. 이는 사전 서버(300)에 전송되며, 사전 서버(300)는 쿼리에 포함된 사용자 모국어 정보 및 웹 페이지 인코딩 언어 정보로부터 적절한 사전 데이터를 선택하고, 선택된 사전 데이터에서 검색어 정보에 해당하는 해석 데이터를 검색하게 된다. 이때, 쿼리 생성부(240)는 검색어 정보에 의하여 식별되는 단어가 사전 데이터에 등록된 경우에 한하여 상기 쿼리를 생성한다. 즉, 단어 인덱스 저장부(238)에 인덱스가 등록되지 않은 단어에 대해서는 쿼리를 생성하지 않는다.Referring back to FIG. 2, the query generator 240 generates a query including user native language information, web page encoding language information, and search term information. The user native language information is received from the user native language confirmation unit 210, the web page encoding language information is received from the web page language confirmation unit 220, and the search term information is received by the search word generator 230. In this case, the search word information may be in the form of a word index output from the search word generator 230. This is sent to the dictionary server 300, the dictionary server 300 selects the appropriate dictionary data from the user native language information and the web page encoding language information included in the query, and retrieves the interpretation data corresponding to the search term information from the selected dictionary data Done. In this case, the query generator 240 generates the query only when the word identified by the search word information is registered in the dictionary data. That is, a query is not generated for words for which an index is not registered in the word index storage unit 238.

검색 결과 표시부(250)는 사전 서버로부터 수신되는 해석 데이터를 사용자 단말의 각종 표시 수단에 표시한다. 바람직하게는, 포인팅 장치가 지시하는 검색 대상 단어와 인접한 위치에 툴팁(tooltip) 형태로 표시한다. The search result display unit 250 displays the analysis data received from the dictionary server on various display means of the user terminal. Preferably, the tool is displayed in the form of a tooltip at a position adjacent to the search target word indicated by the pointing device.

환경 설정부(260)는 사용자가 선택하는 설정 사항들을 입력받고, 저장하여 그에 따라 온라인 사전 서비스가 제공되도록 한다. 앞서 설명한, 사용자 모국어를 확인하는 기준을 사용자 단말의 운영체제 또는 응용 프로그램 중 어느 하나로 고정시키거나, 사용자 모국어 자체를 사용자가 직접 설정하도록 한다. 또한, 검색어 생성부(230)의 단어 인식부(232)에서 포인팅 장치의 지시자가 단어 위에 위치하는 시간의 기준 값을 사용자가 직접 설정할 수 있도록 한다.The environment setting unit 260 receives and stores setting items selected by the user so that the online dictionary service is provided accordingly. As described above, the criterion for identifying the user native language may be fixed to one of an operating system or an application program of the user terminal, or the user may directly set the user native language. In addition, the word recognition unit 232 of the search word generator 230 allows the user to directly set the reference value of the time that the indicator of the pointing device is located on the word.

이제, 사전 서버(300)의 구성을 살펴보기로 한다.Now, the configuration of the dictionary server 300 will be described.

사전 서버(300)는 클라이언트(200)로부터 쿼리를 수신하여 사용자의 모국어 정보 및 웹 페이지의 인코딩 언어에 기초하여 최적의 사전 데이터를 선택하고, 선택된 사전 데이터에서 검색 대상 단어에 대한 해석을 검색하여 클라이언트(200)로 전송한다. 사전 서버(300)는 쿼리 분석부(310), 사전 선택부(320), 검색부(330), 검색결과 전송부(340), 사전 데이터 저장부(350)를 포함한다. The dictionary server 300 receives a query from the client 200 to select the optimal dictionary data based on the user's native language information and the encoding language of the web page, and retrieves the interpretation of the search target word from the selected dictionary data. Send to 200. The dictionary server 300 includes a query analyzer 310, a dictionary selector 320, a searcher 330, a search result transmitter 340, and a dictionary data storage 350.

사전 서버(300)의 쿼리 분석부(310)는 클라이언트(200)로부터 수신한 쿼리를 분석하여, 사용자 모국어 정보, 웹 페이지 인코딩 언어 정보 및 검색어 정보를 추출한다. 또한, 사용자 모국어 정보 및 웹 페이지 인코딩 언어 정보를 사전 선택부(320)로 전달하고, 검색어 정보는 검색부(330)로 전달한다.The query analyzing unit 310 of the dictionary server 300 analyzes the query received from the client 200 and extracts user native language information, web page encoding language information, and search term information. In addition, the user mother language information and the web page encoding language information are transmitted to the pre-selection unit 320, and the search word information is transmitted to the search unit 330.

사전 선택부(320)는 사용자 모국어 정보 및 웹 페이지 인코딩 언어 정보에 기초하여 최적의 사전 데이터를 사전 데이터 저장부(350)에서 선택한다. The dictionary selector 320 selects the optimal dictionary data from the dictionary data storage 350 based on the user mother tongue information and the web page encoding language information.

사전 데이터 저장부(350)에 대하여 먼저 설명하면, 사전 데이터 저장부(350)는 복수의 사전 데이터(352, 354, 356)를 포함한다. 사전 데이터는 원본 언어의 단어들에 대한 대상 언어로의 해석을 포함한다. 이때, 원본 언어는 해석을 필요로 하는 단어의 언어 종류를 의미한다. 또한, 대상 언어는 해석을 수행하는 언어를 의미한다. 즉, 원본 언어의 단어들을 대상 언어를 이용하여 번역하는 것이다. 이때, 원본 언어와 대상 언어는 동일한 언어일 수 있다. 예를 들어, 한국어, 일본어, 중국어, 영어 중 어느 하나의 언어를 원본 언어로 하고, 한국어, 일본어, 중국어, 영어 중 어느 하나의 언어를 대상 언어로 하는 총 16가지의 사전 데이터를 고려할 수 있다. 즉, 영어 단어를 영어로 해석하는 사전 데이터, 영어 단어를 중국어로 해석하는 사전 데이터, 영어 단어를 일본어로 해석하는 사전 데이터, 영어 단어를 한국어로 해석하는 사전 데이터, 중국어 단어를 영어로 해석하는 사전 데이터, 중국어 단어를 중국어로 해석하는 사전 데이터, 중국어 단어를 일어로 해석하는 사전 데이터 및 중국어 단어를 한국어로 해석하는 사전 데이터, 일본어 단어를 영어로 해석하는 사전 데이터, 일본어 단어를 중국어로 해석하는 사전 데이터, 일본어 단어를 일본어로 해석하는 사전 데이터, 일본어 단어를 한국어로 해석하는 사전 데이터, 한국어 단어를 영어로 해석하는 사전 데이터, 한국어 단어를 중국어로 해석하는 사전 데이터, 한국어 단어를 일어로 해석하는 사전 데이터 또는 한국어 단어를 한국어로 해석하는 사전 데이터를 고려할 수 있다.First, the dictionary data storage 350 will be described. The dictionary data storage 350 includes a plurality of dictionary data 352, 354, and 356. Dictionary data includes interpretation of words in the source language into the target language. In this case, the original language means a language type of a word requiring interpretation. In addition, the target language means a language for performing the interpretation. That is, words of the source language are translated using the target language. In this case, the source language and the target language may be the same language. For example, a total of 16 dictionary data may be considered in which the language of any one of Korean, Japanese, Chinese, and English is the source language, and the language of any one of Korean, Japanese, Chinese, and English is the target language. That is, dictionary data for interpreting English words in English, dictionary data for interpreting English words in Chinese, dictionary data for interpreting English words in Japanese, dictionary data for interpreting English words in Korean, and dictionary for interpreting Chinese words in English. Data, dictionary data for interpreting Chinese words in Chinese, dictionary data for interpreting Chinese words in Japanese, dictionary data for interpreting Chinese words in Korean, dictionary data for interpreting Japanese words in English, dictionary to interpret Japanese words in Chinese Data, dictionary data for interpreting Japanese words in Japanese, dictionary data for interpreting Japanese words in Korean, dictionary data for interpreting Korean words in English, dictionary data for interpreting Korean words in Chinese, dictionary to interpret Korean words in Japanese Having a dictionary to translate data or Korean words into Korean Data may be considered.

즉, n 개의 언어 중 어느 하나의 언어를 원본 언어로 하고, m 개의 언어 중 어느 하나의 언어를 대상 언어로 하는 총 n*m 가지의 사전 데이터가 포함된다.That is, a total of n * m dictionary data including one language among n languages as a source language and one language among m languages as a target language is included.

한편, 사전 데이터의 원본 언어의 단어들은 단어 인덱스와 매칭시켜 저장될 수 있다. 즉, 클라이언트(200)로부터 수신한 검색어 정보가 단어 인덱스를 포함하는 실시예의 경우, 단어 인덱스를 기초로 검색이 수행되므로, 사전 데이터는 단어 인덱스 정보를 포함하도록 구성된다.Meanwhile, words of the original language of the dictionary data may be stored by matching with a word index. That is, in the case where the search word information received from the client 200 includes the word index, the search is performed based on the word index, and thus the dictionary data is configured to include the word index information.

한편, 본 발명의 사전 데이터는 통상의 사전에 비하여 간략한 해석을 포함하도록 할 수 있다. 즉, 툴팁 형태의 해석을 제공하는 것이므로, 검색 대상이 되는 단어에 대한 대표 해석들만이 포함되도록 사전 데이터를 구성할 수 있다.  On the other hand, the dictionary data of the present invention can include a simple interpretation as compared to the conventional dictionary. In other words, since it provides a tooltip-type interpretation, the dictionary data may be configured to include only representative interpretations of the word to be searched.

다시 사전 선택부(320)를 설명하면, 사전 선택부(320)는 원본 언어가 웹 페이지의 인코딩 언어 정보에 해당하고, 대상 언어가 사용자 모국어 정보에 해당하는 사전 데이터를 선택한다. 예를 들어, 사용자 모국어 정보가 영어이고, 웹 페이지 인코딩 언어 정보가 일본어인 경우에는, 원본 언어가 일본어이고, 대상 언어가 영어인 사전 데이터를 선택한다. 즉, 웹 페이지에 포함된 각종 일본어 단어를 영어로 해석하는 사전 데이터가 선택된다. 또한, 사용자 모국어 정보가 한국어이고, 웹 페이지 인코딩 언어 정보가 중국어인 경우에는, 원본 언어가 한국어이고, 대상 언어가 중국어인 사전 데이터를 선택한다. 즉, 웹 페이지에 포함된 각종 중국어 단어를 한국어로 해석하는 사전 데이터가 선택된다.Referring back to the dictionary selector 320, the dictionary selector 320 selects dictionary data in which the original language corresponds to encoding language information of a web page and the target language corresponds to user native language information. For example, when the user native language information is English and the web page encoding language information is Japanese, dictionary data in which the source language is Japanese and the target language is English is selected. That is, dictionary data for selecting various Japanese words included in the web page into English is selected. In addition, when the user native language information is Korean and the web page encoding language information is Chinese, dictionary data in which the original language is Korean and the target language is Chinese is selected. That is, dictionary data for selecting various Chinese words included in the web page into Korean is selected.

검색부(330)는 사전 선택부(320)에 의하여 선택된 사전 데이터로부터 검색어 정보에 해당하는 해석 데이터를 검색한다. 이때, 검색어 정보가 단어 인덱스 형태인 경우에는 단어 인덱스를 기초로 하여 해석 데이터를 검색한다. 검색된 해석 데이터는 검색 결과 전송부(340)로 전송된다.The search unit 330 searches for analysis data corresponding to search word information from the dictionary data selected by the pre-selection unit 320. At this time, when the search word information is in the form of a word index, the analysis data is searched based on the word index. The searched analysis data is transmitted to the search result transmitter 340.

검색 결과 전송부(340)는 검색된 해석 데이터를 네트워크를 통하여 클라이언트(200)로 전송한다. The search result transmitter 340 transmits the searched analysis data to the client 200 through the network.

참고로, 본 발명의 실시예에 따른 도 2와 도 4에 도시된 구성 요소들은 소프트웨어 또는 FPGA(Field Programmable Gate Array) 또는 ASIC(Application Specific Integrated Circuit)와 같은 하드웨어 구성 요소를 의미하며, 소정의 역할들을 수행한다.For reference, components shown in FIGS. 2 and 4 according to an embodiment of the present invention mean software components or hardware components such as a field programmable gate array (FPGA) or an application specific integrated circuit (ASIC), and have a predetermined role. Perform them.

그렇지만 '구성 요소들'은 소프트웨어 또는 하드웨어에 한정되는 의미는 아니며, 각 구성 요소는 어드레싱할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다.However, 'components' are not meant to be limited to software or hardware, and each component may be configured to be in an addressable storage medium or may be configured to reproduce one or more processors.

따라서 일 예로서 구성 요소는 소프트웨어 구성 요소들, 객체지향 소프트웨어 구성 요소들, 클래스 구성 요소들 및 태스크 구성 요소들과 같은 구성 요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로 코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들 및 변수들을 포함한다.Thus, as an example, a component may include components such as software components, object-oriented software components, class components, and task components, and processes, functions, properties, procedures, subroutines. Examples, segments of program code, drivers, firmware, microcode, circuitry, data, databases, data structures, tables, arrays, and variables.

구성 요소들과 해당 구성 요소들 안에서 제공되는 기능은 더 작은 수의 구성 요소들로 결합되거나 추가적인 구성 요소들로 더 분리될 수 있다.Components and the functionality provided within those components may be combined into a smaller number of components or further separated into additional components.

이제, 본 발명에 따른 온라인 사전 서비스 제공 방법에 대하여 살펴보기로 한다.Now, the online dictionary service providing method according to the present invention will be described.

도 5는 본 발명의 일 실시예에 따른 온라인 사전 서비스 제공 방법을 도시한 순서도이다.5 is a flowchart illustrating a method for providing an online dictionary service according to an embodiment of the present invention.

먼저, 사용자 단말의 설정 상태로부터 사용자의 모국어 정보를 확인한다(S510). 사용자 단말의 운영체제의 설정 언어 또는 응용 프로그램의 설정 언어로부터 사용자의 모국어를 확인할 수 있다.First, the mother tongue information of the user is checked from the setting state of the user terminal (S510). The native language of the user may be checked from the setting language of the operating system of the user terminal or the setting language of the application program.

다음으로, 사용자 단말에 로딩된 웹 페이지의 인코딩 언어 정보를 확인한 다(S520). 웹 페이지의 인코딩 언어는 웹 페이지 헤더 부분의 ‘charset’의 설정값으로부터 확인할 수 있다.Next, the encoding language information of the web page loaded in the user terminal is checked (S520). The encoding language of the web page can be checked from the 'charset' setting in the header of the web page.

다음으로, 웹 페이지에서 포인팅 장치의 지시자를 통해 식별된 단어를 추출하여 검색어 정보를 생성한다(S530). Next, the word identified through the indicator of the pointing device is extracted from the web page to generate search word information (S530).

이때, 검색어 정보를 생성하는 상세 방법을 살펴보면 다음과 같다.In this case, a detailed method of generating search word information is as follows.

먼저, 포인팅 장치의 지시자가 상기 웹 페이지의 단어 위에 기준값 이상의 시간 동안 위치하는 경우 해당 단어를 인식한다. 다음으로, 인식된 단어에 포함된 특수 문자를 트리밍하는 단계를 수행한다. 다음으로, 사전 서버에 등록된 단어들에 대하여 부여된 고유의 인덱스들로부터 상기 인식된 단어 또는 상기 트리밍된 단어에 대한 인덱스를 검색하는 단계를 수행한다.First, when an indicator of a pointing device is positioned over a word of the web page for more than a reference value, the word is recognized. Next, the process of trimming the special characters included in the recognized word is performed. Next, searching for the recognized word or the index for the trimmed word from the unique indexes assigned to the words registered in the dictionary server.

다음으로, 사용자 모국어 정보, 웹 페이지의 인코딩 언어 정보, 검색어 정보를 포함하는 쿼리를 생성하고(S540), 이를 사전 서버(300)로 전송한다. 사용자 단말에 설치된 클라이언트(200)에서 쿼리를 생성하며, 사용자 단말과 사전 서버(300) 사이를 접속시키는 네트워크 수단을 통해 쿼리가 전송된다. Next, a query including the user native language information, the encoding language information of the web page, the search term information is generated (S540), and transmitted to the dictionary server 300. The client 200 installed in the user terminal generates a query, and the query is transmitted through a network means for connecting the user terminal and the dictionary server 300.

사전 서버(300)는 수신한 쿼리를 분석하여, 사용자 모국어 정보, 웹 페이지의 인코딩 언어 정보, 검색어 정보를 추출한다(S550). 추출된 사용자 모국어 정보 및 웹 페이지의 인코딩 언어 정보는 사전 선택부(320)로, 검색어 정보는 검색부(330)로 전달된다.The dictionary server 300 analyzes the received query and extracts user native language information, encoding language information of a web page, and search term information (S550). The extracted user native language information and encoding language information of the web page are transmitted to the preselection unit 320, and the search word information is transmitted to the search unit 330.

다음으로, 사용자 모국어 정보, 웹 페이지의 인코딩 언어 정보를 기초로 하여 적절한 사전 데이터를 선택한다(S560). 이때, 웹 페이지의 인코딩 언어 정보가 사전 데이터의 원본 언어로 사용되고, 사용자 모국어 정보가 사전 데이터의 대상 언어로 사용된다. 즉, 웹 페이지의 인코딩 언어를 사용자 모국어로 해석하는 사전 데이터가 선택된다.Next, appropriate dictionary data is selected based on the user native language information and the encoding language information of the web page (S560). At this time, the encoding language information of the web page is used as the source language of the dictionary data, and the user native language information is used as the target language of the dictionary data. That is, dictionary data for selecting the encoding language of the web page as the user native language is selected.

다음으로, 선택된 사전 데이터로부터 검색어 정보에 해당하는 해석 데이터를 검색한다(S570). 실시예에 따라, 검색어 정보에 포함된 단어 인덱스 정보를 이용하여 그에 해당하는 해석 데이터를 검색한다. Next, the analysis data corresponding to the search word information is retrieved from the selected dictionary data (S570). According to an embodiment, the corresponding interpretation data is searched by using the word index information included in the search word information.

다음으로, 검색된 해석 데이터를 포함하는 검색 결과가 클라이언트(200)로 전송되며, 전송된 해석 데이터가 클라이언트(200)를 통해 사용자 단말에 표시된다(S580). 바람직하게는, 포인팅 장치가 지시하는 검색 대상 단어와 인접한 위치에 툴팁(tooltip) 형태로 표시한다. Next, a search result including the found analysis data is transmitted to the client 200, and the transmitted analysis data is displayed on the user terminal through the client 200 (S580). Preferably, the tool is displayed in the form of a tooltip at a position adjacent to the search target word indicated by the pointing device.

본 발명의 일 실시예는 컴퓨터에 의해 실행되는 프로그램 모듈과 같은 컴퓨터에 의해 실행가능한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다. 컴퓨터 판독 가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독가능 매체는 컴퓨터 저장 매체를 모두 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다.One embodiment of the present invention can also be implemented in the form of a recording medium containing instructions executable by a computer, such as a program module executed by the computer. Computer readable media can be any available media that can be accessed by a computer and includes both volatile and nonvolatile media, removable and non-removable media. In addition, computer readable media may include all computer storage media. Computer storage media includes both volatile and nonvolatile, removable and non-removable media implemented in any method or technology for storage of information such as computer readable instructions, data structures, program modules or other data.

본 발명의 방법 및 시스템은 특정 실시예와 관련하여 설명되었지만, 그것들의 구성 요소 또는 동작의 일부 또는 전부는 범용 하드웨어 아키텍쳐를 갖는 컴퓨터 시스템을 사용하여 구현될 수 있다. While the methods and systems of the present invention have been described in connection with specific embodiments, some or all of those elements or operations may be implemented using a computer system having a general purpose hardware architecture.

전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.The foregoing description of the present invention is intended for illustration, and it will be understood by those skilled in the art that the present invention may be easily modified in other specific forms without changing the technical spirit or essential features of the present invention. will be. It is therefore to be understood that the above-described embodiments are illustrative in all aspects and not restrictive. For example, each component described as a single type may be implemented in a distributed manner, and similarly, components described as distributed may be implemented in a combined form.

본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.The scope of the present invention is shown by the following claims rather than the above description, and all changes or modifications derived from the meaning and scope of the claims and their equivalents should be construed as being included in the scope of the present invention. do.

도 1은 통상적으로 제공되는 온라인 사전 서비스를 설명하기 위한 도면이다.1 is a diagram for explaining an online dictionary service that is typically provided.

도 2는 본 발명의 일 실시예에 따른 온라인 사전 서비스 제공 장치를 도시한 도면이다.2 is a diagram illustrating an online dictionary service providing apparatus according to an embodiment of the present invention.

도 3은 웹 페이지의 인코딩 정보를 포함하는 헤더부분의 일 예를 나타내는 도면이다. 3 is a diagram illustrating an example of a header part including encoding information of a web page.

도 4는 본 발명의 일 실시예에 따른 검색어 생성부의 상세 구성을 도시한 도면이다.4 is a diagram illustrating a detailed configuration of a search word generator according to an exemplary embodiment of the present invention.

도 5는 본 발명의 일 실시예에 따른 온라인 사전 서비스 제공 방법을 도시한 순서도이다.5 is a flowchart illustrating a method for providing an online dictionary service according to an embodiment of the present invention.

<도면의 주요 부분에 대한 설명>Description of the main parts of the drawing

100: 온라인 사전 서비스 제공 장치 100: online dictionary service providing device

200: 클라이언트200: client

210: 사용자 모국어 확인부 220: 웹 페이지 언어 확인부210: user native language confirmation unit 220: web page language confirmation unit

230: 검색어 생성부 240: 쿼리 생성부230: search term generator 240: query generator

250: 검색 결과 표시부 260: 환경 설정부250: search result display unit 260: environment setting unit

300: 사전 서버300: dictionary server

310: 쿼리 분석부 320: 사전 선택부310: query analysis unit 320: preselection unit

330: 검색부 340: 검색 결과 전송부330: search unit 340: search result transmission unit

350: 사전 데이터 저장부350: dictionary data storage

Claims (17)

온라인 사전 서비스 제공 장치에 있어서,An online dictionary service providing apparatus, 사용자 단말로부터 사용자 모국어 정보, 로딩된 웹 페이지의 인코딩 언어 정보 및 상기 웹 페이지에 포함된 검색어 정보를 포함하는 쿼리를 수신하여 상기 사용자 모국어 정보, 웹 페이지의 인코딩 언어 정보 및 검색어 정보를 추출하는 쿼리 분석부,A query analysis for extracting the user native language information, the encoding language information of the web page and the search term information by receiving a query including the user native language information, the encoding language information of the loaded web page and the search term information included in the web page from the user terminal part, 원본 언어의 단어들에 대한 대상 언어에 의한 해석 데이터들을 포함하는 적어도 하나의 사전 데이터를 포함하는 사전 데이터 저장부,A dictionary data storage unit including at least one dictionary data including interpretation data by a target language for words of a source language, 상기 사용자 모국어 정보 및 웹 페이지 인코딩 언어 정보에 기초하여 상기 사전 데이터를 선택하는 사전 선택부,A pre-selection unit which selects the dictionary data based on the user native language information and web page encoding language information; 상기 선택된 사전 데이터로부터 상기 검색어 정보에 대응하는 상기 해석 데이터를 검색하는 검색부 및A search unit for searching the analysis data corresponding to the search word information from the selected dictionary data; 상기 해석 데이터를 상기 사용자 단말로 전송하는 검색 결과 전송부Search result transmission unit for transmitting the analysis data to the user terminal 를 포함하되,Including, 상기 사용자 모국어 정보는 상기 사용자 단말에 설치된 운영 체제 또는 응용 프로그램에 기초하여 확인되는 것인 온라인 사전 서비스 제공 장치.And the user native language information is checked based on an operating system or an application program installed in the user terminal. 삭제delete 제 1 항에 있어서,The method of claim 1, 상기 웹 페이지의 인코딩 언어 정보는 상기 웹 페이지의 프로그래밍 문서의 헤더(header)에 포함된 캐릭터 셋(charset)에 기초하여 확인되는 것인 온라인 사전 서비스 제공 장치.And encoding language information of the web page is confirmed based on a charset included in a header of a programming document of the web page. 제 1 항에 있어서,The method of claim 1, 상기 검색어 정보는 상기 사전 데이터에 등록된 단어들에 대하여 부여된 고유의 단어 인덱스 정보를 포함하는 것인 온라인 사전 서비스 제공 장치.And the search word information includes unique word index information given to words registered in the dictionary data. 제 1 항에 있어서,The method of claim 1, 상기 사전 데이터 저장부는 n 개의 언어 중 어느 하나의 언어를 상기 원본 언어로 하고, m 개의 언어 중 어느 하나의 언어를 상기 대상 언어로 하는 총 n*m 개의 사전 데이터를 포함하는 것인 온라인 사전 서비스 제공 장치.The dictionary data storage unit includes a total of n * m dictionary data including any one of n languages as the source language and one of m languages as the target language. Device. 제 1 항에 있어서,The method of claim 1, 상기 사전 데이터 저장부는 상기 원본 언어의 단어를 단어 인덱스와 매칭시켜 저장하는 사전 데이터를 포함하는 것인 온라인 사전 서비스 제공 장치.And the dictionary data storage unit includes dictionary data for matching and storing words of the original language with word indices. 제 1 항에 있어서,The method of claim 1, 상기 사전 선택부는 상기 원본 언어가 상기 웹 페이지의 인코딩 언어 정보에 해당하며, 상기 대상 언어가 상기 사용자 모국어 정보에 해당하는 사전 데이터를 선택하는 것인 온라인 사전 서비스 제공 장치.And the dictionary selection unit selects dictionary data corresponding to the source language corresponding to encoding language information of the web page, and the target language corresponding to the user native language information. 제 1 항에 있어서,The method of claim 1, 상기 쿼리는 상기 사용자 단말에 설치된 클라이언트가 생성하며,The query is generated by a client installed in the user terminal, 상기 클라이언트는The client is 상기 사용자 단말에 설치된 운영체체 또는 응용 프로그램에 기초하여 상기 사용자 모국어 정보를 확인하는 사용자 모국어 확인부,A user native language confirmation unit for confirming the user native language information based on an operating system or an application program installed in the user terminal; 상기 사용자 단말에 로딩된 웹 페이지의 인코딩 언어 정보를 확인하는 웹 페이지 언어 확인부,A web page language confirmation unit for checking encoding language information of a web page loaded in the user terminal; 상기 웹 페이지 상에서 포인팅 장치를 통해 포인팅된 단어를 추출하여 검색어 정보를 생성하는 검색어 생성부,A search word generator which extracts a word pointed by a pointing device on the web page to generate search word information; 상기 쿼리를 생성하는 쿼리 생성부 및A query generator for generating the query; 상기 해석 데이터를 수신하여 상기 사용자 단말에 표시하는 검색 결과 표시부Search result display unit for receiving the analysis data to display on the user terminal 를 포함하는 온라인 사전 서비스 제공 장치.Online dictionary service providing device comprising a. 온라인 사전 서비스 제공 방법에 있어서,In the online dictionary service providing method, 사용자 단말로부터 사용자 모국어 정보, 로딩된 웹 페이지의 인코딩 언어 정보 및 상기 웹 페이지에 포함된 검색어 정보를 포함하는 쿼리를 수신하는 단계,Receiving a query including user native language information, encoding language information of a loaded web page, and search term information included in the web page from a user terminal; 상기 쿼리로부터 상기 사용자 모국어 정보, 웹 페이지의 인코딩 언어 정보 및 검색어 정보를 추출하는 단계,Extracting the user native language information, encoding language information of the web page, and search term information from the query; 원본 언어의 단어들에 대한 대상 언어에 의한 해석 데이터들을 포함하는 적어도 하나의 사전 데이터로부터, 상기 사용자 모국어 정보 및 웹 페이지 인코딩 언어 정보에 기초하여 사전 데이터를 선택하는 단계,Selecting dictionary data based on the user native language information and web page encoding language information from at least one dictionary data including interpretation data by a target language for words of a source language, 상기 선택된 사전 데이터로부터 상기 검색어 정보에 대응하는 상기 해석 데이터를 검색하는 단계 및Retrieving the analysis data corresponding to the search term information from the selected dictionary data; and 상기 해석 데이터를 상기 사용자 단말로 전송하는 단계Transmitting the analysis data to the user terminal 를 포함하되,Including, 상기 사용자 모국어 정보는 상기 사용자 단말에 설치된 운영체체 또는 응용 프로그램에 기초하여 확인되는 것인 온라인 사전 서비스 제공 방법.And the user native language information is checked based on an operating system or an application program installed in the user terminal. 삭제delete 제 9 항에 있어서,The method of claim 9, 상기 웹 페이지의 인코딩 언어 정보는 상기 웹 페이지의 프로그래밍 문서의 헤더(header)에 포함된 캐릭터 셋(charset)에 기초하여 확인되는 것인 온라인 사전 서비스 제공 방법.Encoding language information of the web page is checked based on a charset included in a header of a programming document of the web page. 제 9 항에 있어서,The method of claim 9, 상기 검색어 정보는 상기 사전 데이터에 등록된 단어들에 대하여 부여된 고유의 단어 인덱스 정보를 포함하는 것인 온라인 사전 서비스 제공 방법.And the search word information includes unique word index information assigned to words registered in the dictionary data. 온라인 사전 서비스 제공 방법에 있어서,In the online dictionary service providing method, 사용자 단말로부터 사용자의 모국어 정보를 확인하는 단계,Checking the mother tongue information of the user from the user terminal; 상기 사용자 단말에 로딩된 웹 페이지의 인코딩 언어 정보를 확인하는 단계,Checking encoding language information of a web page loaded on the user terminal; 상기 웹 페이지 상에서 포인팅 장치를 통해 포인팅된 단어를 추출하여 검색어 정보를 생성하는 단계,Generating search term information by extracting a word pointed by a pointing device on the web page; 상기 사용자 모국어 정보, 상기 웹 페이지의 인코딩 언어 정보 및 상기 검색어 정보를 포함하는 쿼리를 생성하는 단계 및Generating a query including the user native language information, encoding language information of the web page, and the search term information; and 상기 쿼리에 기초한 사전 서버의 검색 결과를 수신하여 상기 사용자 단말에 표시하는 단계Receiving a search result of a dictionary server based on the query and displaying the search result on the user terminal; 를 포함하되,Including, 상기 사용자의 모국어 정보를 확인하는 단계는Checking the native language information of the user 상기 사용자 단말에 설치된 운영 체제 또는 응용 프로그램에 기초하여 상기 사용자 모국어 정보를 확인하는 것인 온라인 사전 서비스 제공 방법.And checking the user native language information based on an operating system or an application program installed in the user terminal. 삭제delete 제 13 항에 있어서,The method of claim 13, 상기 웹 페이지의 인코딩 언어 정보를 확인하는 단계는Checking the encoding language information of the web page 상기 웹 페이지의 프로그래밍 문서의 헤더(header)에 포함된 캐릭터 셋(charset)에 기초하여 상기 웹 페이지의 인코딩 언어 정보를 확인하는 것인 온라인 사전 서비스 제공 방법.And checking encoding language information of the web page based on a charset included in a header of a programming document of the web page. 제 13 항에 있어서,The method of claim 13, 상기 검색어 정보를 생성하는 단계는Generating the search term information 상기 포인팅 장치의 지시자가 상기 웹 페이지의 단어 위에 기준값 이상의 시간 동안 위치하는 경우 해당 단어를 인식하는 단계,Recognizing the word when the indicator of the pointing device is positioned over the word of the web page for a time longer than a reference value; 상기 인식된 단어로부터 특수 문자를 포함하는 노이즈 문자를 트리밍하는 단계,Trimming noise characters including special characters from the recognized words; 상기 사전 서버에 등록된 단어들에 대하여 부여된 고유의 인덱스들로부터 상기 인식된 단어 또는 상기 트리밍된 단어에 대한 인덱스를 검색하는 단계 및Retrieving the index of the recognized word or the trimmed word from the unique indices assigned to the words registered in the dictionary server; and 상기 검색된 단어 인덱스를 상기 검색어 정보로 설정하는 단계Setting the searched word index as the search term information 를 포함하는 온라인 사전 서비스 제공 방법.Online dictionary service providing method comprising a. 제9항, 제11항 내지 제13항, 제15항, 및 제16항 중 어느 하나의 항에 기재된 단계를 수행하는 프로그램이 기록된 컴퓨터가 읽기 가능한 기록 매체.A non-transitory computer-readable recording medium having recorded thereon a program for performing the steps of any one of claims 9, 11, 13, 15, and 16.
KR1020090044356A 2009-05-21 2009-05-21 Method and apparatus for providing an online dictionary service KR101072254B1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020090044356A KR101072254B1 (en) 2009-05-21 2009-05-21 Method and apparatus for providing an online dictionary service
JP2010116530A JP5416033B2 (en) 2009-05-21 2010-05-20 Online dictionary service providing apparatus and online dictionary service providing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090044356A KR101072254B1 (en) 2009-05-21 2009-05-21 Method and apparatus for providing an online dictionary service

Publications (2)

Publication Number Publication Date
KR20100125579A KR20100125579A (en) 2010-12-01
KR101072254B1 true KR101072254B1 (en) 2011-10-12

Family

ID=43420041

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090044356A KR101072254B1 (en) 2009-05-21 2009-05-21 Method and apparatus for providing an online dictionary service

Country Status (2)

Country Link
JP (1) JP5416033B2 (en)
KR (1) KR101072254B1 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101328092B1 (en) * 2011-11-17 2013-11-13 서울신용평가정보 주식회사 Method for processing auto complete of domain address
KR101647098B1 (en) * 2014-12-12 2016-08-10 네이버 주식회사 Method, system and recording medium for registering word card

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03110673A (en) * 1989-09-25 1991-05-10 Canon Inc Electronic dictionary
JPH05324709A (en) * 1992-05-19 1993-12-07 Ricoh Co Ltd Bilingual image forming device
JP3281639B2 (en) * 1992-05-26 2002-05-13 三洋電機株式会社 Document search system
JPH1056491A (en) * 1996-08-09 1998-02-24 Toshiba Corp Machine translation system and machine translation method
JP4547474B2 (en) * 1998-12-31 2010-09-22 俊彦 岡部 WWW search device
AUPR360701A0 (en) * 2001-03-06 2001-04-05 Worldlingo, Inc Seamless translation system

Also Published As

Publication number Publication date
KR20100125579A (en) 2010-12-01
JP5416033B2 (en) 2014-02-12
JP2010272114A (en) 2010-12-02

Similar Documents

Publication Publication Date Title
US8745051B2 (en) Resource locator suggestions from input character sequence
US6381593B1 (en) Document information management system
KR101533570B1 (en) Autocompletion and automatic input method correction for partially entered search query
CN101395608B (en) Searching within a site of a search result
US8886642B2 (en) Method and system for unified searching and incremental searching across and within multiple documents
CN1894685A (en) Translation tool
KR100956087B1 (en) Computer readable recoding medium, character inputting and editing method, server apparatus, and server
US20090282037A1 (en) Method and system for providing convenient dictionary services
JP2007072596A (en) Information sharing system and information sharing method
KR101042907B1 (en) Method and apparatus for providing an online dictionary service
KR101072254B1 (en) Method and apparatus for providing an online dictionary service
JP2005346666A (en) System and method for web page translation
US20050102280A1 (en) Search system, search program, and personal computer
KR100913389B1 (en) Internet search service method and system thereof
JP4505389B2 (en) Advertisement content transmission system and advertisement content transmission method
WO2001095151A1 (en) Data transfer device
CN104778156B (en) Text input method, text input device and electronic equipment
KR101099010B1 (en) Method and apparatus for providing on online dictionary service, and computer-readable recorded medium
JP2007034463A (en) Information retrieval system and information retrieval program
KR101995741B1 (en) A gesture based system for translation and transliteration of input text and a method thereof
KR101326427B1 (en) Web Navigation Service System
JP2010211530A (en) Information retrieval terminal equipment, system, method, and program
Rojbi et al. KeybNav: a new system for web navigation through a keyboard
KR100916816B1 (en) Method and system for reducing error in chouon and sokuon and providing function of finding a japanese alphabet in japanese input unit by using japanese alias database
Althaus et al. Smart linkification of content within applications

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20140925

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20151002

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20181002

Year of fee payment: 8