KR20090108485A - Method, apparatus and computer-readable recording medium for reading text on image contained in web page and providing translation service on same text - Google Patents

Method, apparatus and computer-readable recording medium for reading text on image contained in web page and providing translation service on same text Download PDF

Info

Publication number
KR20090108485A
KR20090108485A KR1020080033923A KR20080033923A KR20090108485A KR 20090108485 A KR20090108485 A KR 20090108485A KR 1020080033923 A KR1020080033923 A KR 1020080033923A KR 20080033923 A KR20080033923 A KR 20080033923A KR 20090108485 A KR20090108485 A KR 20090108485A
Authority
KR
South Korea
Prior art keywords
web page
text
identifier
translation
image
Prior art date
Application number
KR1020080033923A
Other languages
Korean (ko)
Other versions
KR100953627B1 (en
Inventor
양병석
최원효
Original Assignee
엔에이치엔(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엔에이치엔(주) filed Critical 엔에이치엔(주)
Priority to KR1020080033923A priority Critical patent/KR100953627B1/en
Publication of KR20090108485A publication Critical patent/KR20090108485A/en
Application granted granted Critical
Publication of KR100953627B1 publication Critical patent/KR100953627B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/63Scene text, e.g. street names
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Abstract

PURPOSE: A method, an apparatus and a computer-readable recording medium for reading a text on an image contained in a webpage and providing a translation service on the same text are provided to increase the usability of a user webpage and to minimize the burden caused by a system establishment and maintenance. CONSTITUTION: An application server(100) communicates with a user terminal device(900), and performs data communication with an open type API service gateway(200) through an open type API. A web server(300) searches a webpage corresponding to an identifier inputted by the user terminal device. A text reading server(500) processes the text reading process for an image included in the webpage searched by the web server based on the inputted identifier.

Description

웹 페이지에 포함되는 이미지 상의 텍스트를 판독하고 이에 대한 번역 서비스를 제공하기 위한 방법, 장치 및 컴퓨터 판독 가능한 기록 매체{METHOD, APPARATUS AND COMPUTER-READABLE RECORDING MEDIUM FOR READING TEXT ON IMAGE CONTAINED IN WEB PAGE AND PROVIDING TRANSLATION SERVICE ON SAME TEXT}METHOD, APPARATUS AND COMPUTER-READABLE RECORDING MEDIUM FOR READING TEXT ON IMAGE CONTAINED IN WEB PAGE AND PROVIDING TRANSLATION SERVICE ON SAME TEXT}

본 발명은 웹 페이지에 포함되는 이미지 상의 텍스트를 판독하고 이에 대한 번역 서비스를 제공하기 위한 방법, 장치 및 컴퓨터 판독 가능한 기록 매체에 관한 것으로서, 보다 상세하게는, 사용자가 URL(Uniform Resource Locator) 등과 같은 웹 페이지 식별자를 입력하는 경우, 해당 식별자에 대응하는 웹 페이지를 검색하고, 해당 웹 페이지에 포함되어 있는 이미지 상의 텍스트를 판독하며, 판독된 텍스트에 대한 번역 서비스를 제공함으로써, 사용자의 편의를 증대시키는 방법, 장치 및 컴퓨터 판독 가능한 기록 매체에 관한 것이다.The present invention relates to a method, an apparatus and a computer readable recording medium for reading a text on an image included in a web page and providing a translation service thereto. When the web page identifier is input, the web page corresponding to the identifier is searched, the text on the image included in the web page is read, and the translation service for the read text is provided, thereby increasing the user's convenience. A method, apparatus and computer readable recording medium.

근래에 들어, 인터넷 사용이 보편화되면서 사용자들은 인터넷 검색을 통하여 다양한 정보를 획득할 수 있게 되었다. 즉, 사용자들은 인터넷에의 접속이 가능한 개인용 컴퓨터 등의 단말 장치를 통해 인터넷 검색 사이트에 접속한 후, 뉴스, 지식, 게임, 커뮤니티 등과 관련된 각종 컨텐츠를 검색할 수 있게 되었다.In recent years, as the use of the Internet has become more common, users can obtain various information through Internet searches. That is, after accessing an Internet search site through a terminal device such as a personal computer that can access the Internet, users can search for various contents related to news, knowledge, games, communities, and the like.

사용자들은 인터넷 검색을 수행하거나, 원하는 웹 페이지나 파일 등에 대한 정보를 획득하기 위해 Internet ExplorerTM, NetscapeTM, LynxTM 등과 같은 웹 브라우저를 기동시키고, 웹 브라우저의 주소창에 URL 등과 같은 식별자를 입력함으로써, 해당 식별자에 대응하는 웹 페이지 또는 파일을 제공 받게 된다.By users enter an identifier, such as performing, or any web page or in order to obtain information about the file, Internet Explorer TM, Netscape TM, activates a Web browser such as Lynx TM, URL into the address bar of your Web browser to search the Internet, A web page or file corresponding to the identifier is provided.

그런데, 이렇게 제공되는 웹 페이지에는 이미지가 포함되어 있을 수 있고, 그 이미지에는 하나 이상의 문자 또는 기호가 포함되어 있을 수 있다. 그러나, 사용자가 해당 이미지에 포함된 문자 또는 기호를 바로 편집 가능한 형태로 판독하여 이를 이용할 수 없다는 문제점이 있었다.However, the provided web page may include an image, and the image may include one or more characters or symbols. However, there has been a problem that a user cannot read and use a character or a symbol included in the image in an editable form immediately.

한편, 본 출원인의 저명 포털 사이트인 네이버TM(www.naver.com)에서 제공하는 '일본어 번역기'와 같은 번역 서비스 제공 수단에서는, 사용자가 번역을 원하는 웹 페이지의 URL을 입력하면, 해당 URL에 대응하는 웹 페이지에 포함되는 텍스트를 번역하여, 번역한 결과가 반영된 웹 페이지를 제공하는 방식을 채택하고 있다. 그러나, 여기에서는 해당 웹 페이지의 텍스트만을 번역해 줄 뿐이기 때문에, 웹 페이지에 포함되어 있는 이미지에 문자 또는 기호로 이루어진 텍스트가 포함되어 있을지라도 사용자가 이에 대해서는 번역 서비스를 제공 받지 못하는 문제가 있었다.On the other hand, in a translation service providing means such as 'Japanese translator' provided by Naver TM (www.naver.com), which is the prominent portal site of the applicant, when a user inputs a URL of a web page to be translated, the corresponding URL is A method of translating text included in a web page to provide a web page reflecting the translated result is adopted. However, since only the text of the web page is translated here, the user may not be provided with a translation service even if the image included in the web page includes text composed of letters or symbols.

따라서, 웹 페이지에 포함되어 있는 이미지 상의 문자 또는 기호를 편집 가능한 형태로 이용할 수 있도록 하는 한편, 이미지 상의 텍스트도 번역하여 제공하는 기술이 필요한 실정이다.Therefore, there is a need for a technology for providing a text or a symbol on an image included in a web page in an editable form, and also translating and providing text on the image.

이상의 문제점을 해결하기 위하여, 근래에 널리 이용되고 있는 OCR(Optical Character Recognition) 등과 같은 문자 판독 기술이 고려될 수 있다. 문자 판독 기술은 이미지에 포함된 문자 또는 기호를 기계로 판독 가능한 형태로 (예를 들면, 편집 가능한 형태로) 변환하는 기술이다. 그러나, 현재 존재하는 문자 판독 기술을 이용하는 경우에도, 앞서 설명한 바와 같은 이미지로부터의 문자·기호의 판독이나 이미지 상의 텍스트의 번역 등과 같은 서비스를 위해서는, 문자 판독 장치나 번역 장치 등과 같은 고가의 장치가 각각 구비되어 있어야 하며, 이에 따른 시스템의 구축 및 유지/보수와 같은 관리 부담 역시 적지 않다.In order to solve the above problems, a character reading technique such as OCR (Optical Character Recognition), which is widely used in recent years, may be considered. Character reading technology is a technique for converting characters or symbols included in an image into a machine-readable form (eg, in an editable form). However, even in the case of using the existing character reading technology, expensive devices such as a character reading device or a translation device may be used for services such as the reading of characters and symbols from an image as described above and the translation of text on the image. It should be equipped, and the management burden such as the construction and maintenance of the system accordingly is not small.

따라서, 웹 페이지에 포함되어 있는 이미지에 대한 문자 또는 기호를 판독하여 이를 기계 판독 가능한 형태로 제공하고, 판독된 문자 또는 기호로 이루어진 텍스트에 대하여 번역 서비스를 제공하되, 적은 비용만을 사용하여도 시스템의 구축 및 유지/보수가 가능하도록 하는 기술을 개발하는 것이 급선무이다.Therefore, by reading the characters or symbols for the image included in the web page and providing them in a machine-readable form, and providing a translation service for the text consisting of the read characters or symbols, even if using a small cost of the system It is imperative to develop a technology that enables deployment and maintenance.

본 발명은 상술한 문제점을 모두 해결하는 것을 그 목적으로 한다.The object of the present invention is to solve all the above-mentioned problems.

또한, 본 발명은 사용자가 URL 등의 식별자를 입력하는 경우, 해당 URL에 대응하는 웹 페이지에 포함되어 있는 이미지 상의 문자 또는 기호를 판독하여 이러한 문자 또는 기호를 기계 판독 가능한 형태로 제공함으로써, 사용자의 웹 페이지의 활용도를 높이는 것에 그 목적이 있다.In addition, when the user inputs an identifier such as a URL, the present invention reads a character or symbol on an image included in a web page corresponding to the URL and provides the character or symbol in a machine-readable form, thereby providing The purpose is to increase the utilization of web pages.

그리고, 본 발명은 판독된 문자 및/또는 기호로 이루어진 텍스트에 대한 번역 서비스를 제공함으로써, 이미지로 표현된 텍스트에 대하여도 번역 서비스를 제공하는 것에 그 목적이 있다.Another object of the present invention is to provide a translation service for text represented by an image by providing a translation service for text composed of read characters and / or symbols.

또한, 본 발명은 개방형 API(Application Program Interface)를 이용하여 웹 페이지에 포함되어 있는 이미지 상의 텍스트를 판독하고 이에 대한 번역 서비스를 제공함으로써, 서비스 제공을 위한 시스템 구축 및 유지/보수에 따른 부담을 최소화시키는 데에 그 목적이 있다.In addition, the present invention by using an open API (Application Program Interface) to read the text on the image included in the web page and provides a translation service for this, thereby minimizing the burden of building and maintaining the system for service provision The purpose is to make it.

상기 목적을 달성하기 위한 본 발명의 대표적인 구성은 다음과 같다.Representative configuration of the present invention for achieving the above object is as follows.

본 발명의 일 태양에 따르면, 웹 페이지에 포함되어 있는 이미지로부터 문자 및/또는 기호를 판독하기 위한 방법으로서, 사용자 단말 장치로부터 웹 페이지의 식별자를 수신하는 단계, 상기 식별자에 대응하는 웹 페이지에 포함되어 있는 적어도 하나의 이미지를 획득하는 단계, 및 상기 적어도 하나의 이미지 상의 문자 및/ 또는 기호에 대한 판독 결과를 획득하는 단계를 포함하는 방법이 제공된다.According to an aspect of the present invention, a method for reading text and / or symbols from an image included in a web page, the method comprising: receiving an identifier of a web page from a user terminal device, the web page corresponding to the identifier included in the web page; Obtaining at least one image, and obtaining a reading result for the character and / or symbol on the at least one image.

본 발명의 다른 태양에 따르면, 웹 페이지에 포함되어 있는 이미지 상의 텍스트에 대한 번역 결과를 제공하기 위한 방법으로서, 사용자 단말 장치로부터 웹 페이지의 식별자를 수신하는 단계, 상기 식별자에 대응하는 웹 페이지에 포함되어 있는 적어도 하나의 이미지를 획득하는 단계, 상기 적어도 하나의 이미지 상의 텍스트에 대한 판독 결과를 획득하는 단계, 및 상기 판독된 텍스트에 대한 번역 결과를 획득하는 단계를 포함하는 방법이 제공된다.According to another aspect of the present invention, a method for providing a translation result for text on an image included in a web page, the method comprising: receiving an identifier of a web page from a user terminal device, the web page corresponding to the identifier included in the web page; Obtaining at least one image that is intended, obtaining a read result for the text on the at least one image, and obtaining a translation result for the read text.

본 발명의 또 다른 태양에 따르면, 웹 페이지에 포함되어 있는 이미지로부터 문자 및/또는 기호를 판독하기 위한 시스템으로서, 사용자 단말 장치로부터 수신된 식별자에 대응하는 웹 페이지에 포함되어 있는 적어도 하나의 이미지 상의 문자 및/또는 기호에 대한 판독 결과를 획득하는 개방형 API 서비스 게이트웨이, 상기 개방형 API 서비스 게이트웨이의 요청에 따라 상기 식별자에 대응하는 웹 페이지를 검색하여 제공하는 웹 서버, 및 상기 개방형 API 서비스 게이트웨이의 요청에 따라 상기 웹 페이지에 포함되어 있는 적어도 하나의 이미지 상의 문자 및/또는 기호에 대한 판독 결과를 제공하는 판독 서버를 포함하는 시스템이 제공된다.According to another aspect of the invention, a system for reading text and / or symbols from an image included in a web page, the system comprising: at least one image on a web page corresponding to an identifier received from a user terminal device; An open API service gateway for obtaining a read result of a character and / or symbol, a web server for searching and providing a web page corresponding to the identifier according to a request of the open API service gateway, and a request of the open API service gateway Accordingly, a system is provided that includes a reading server that provides reading results for characters and / or symbols on at least one image included in the web page.

이 외에도, 본 발명에 따르면 웹 페이지에 포함되어 있는 이미지 상의 텍스트를 판독하고 이에 대한 번역 서비스를 제공하기 위한 다른 방법, 시스템, 및 상기 방법들을 실행하기 위한 컴퓨터 프로그램을 기록하는 컴퓨터 판독 가능한 기록 매체가 더 제공된다.In addition, according to the present invention there is provided a computer readable recording medium for recording another method, system for reading text on an image included in a web page and providing a translation service therefor, and a computer program for executing the methods. More is provided.

본 발명에 의하면, 사용자가 URL과 같은 식별자를 입력하는 등의 간단한 조작만으로도 해당 웹 페이지에 포함되어 있는 이미지 상의 문자 또는 기호에 대한 판독 결과를 제공 받을 수 있게 되므로, 사용자 편의가 증대되는 효과가 있다.According to the present invention, the user can be provided with a read result of a character or a symbol on an image included in the web page by a simple operation such as inputting an identifier such as a URL, thereby increasing user convenience. .

또한, 본 발명에 의하면, 웹 페이지에 포함되어 있는 이미지 상의 텍스트에 대하여도 번역 서비스를 제공할 수 있게 되는 효과가 있다.In addition, according to the present invention, there is an effect that it is possible to provide a translation service for the text on the image included in the web page.

한편, 본 발명에 의하면, 개방형 API를 이용한 문자·기호의 판독 및 그 텍스트에 대한 번역이 가능해지기 때문에, 서비스 제공을 위한 시스템의 구축 및 유지/보수에 따른 부담이 최소화될 수 있게 되는 효과가 있다.On the other hand, according to the present invention, since it is possible to read the characters and symbols and the translation of the text using the open API, there is an effect that the burden due to the construction and maintenance of the system for providing the service can be minimized. .

후술하는 본 발명에 대한 상세한 설명은, 본 발명이 실시될 수 있는 특정 실시예를 예시로서 도시하는 첨부 도면을 참조한다. 이들 실시예는 당업자가 본 발명을 실시할 수 있기에 충분하도록 상세히 설명된다. 본 발명의 다양한 실시예는 서로 다르지만 상호 배타적일 필요는 없음이 이해되어야 한다. 예를 들어, 여기에 기재되어 있는 특정 형상, 구조 및 특성은 일 실시예에 관련하여 본 발명의 정신 및 범위를 벗어나지 않으면서 다른 실시예로 구현될 수 있다. 또한, 각각의 개시된 실시예 내의 개별 구성요소의 위치 또는 배치는 본 발명의 정신 및 범위를 벗어나지 않으면서 변경될 수 있음이 이해되어야 한다. 따라서, 후술하는 상세한 설명은 한정적인 의미로서 취하려는 것이 아니며, 본 발명의 범위는, 적절하게 설명된다면, 그 청구항들이 주장하는 것과 균등한 모든 범위와 더불어 첨부된 청구항에 의해서만 한정된다. 도면에서 유사한 참조부호는 여러 측면에 걸쳐서 동일하거나 유사한 기능을 지칭한다.DETAILED DESCRIPTION The following detailed description of the invention refers to the accompanying drawings that show, by way of illustration, specific embodiments in which the invention may be practiced. These embodiments are described in sufficient detail to enable those skilled in the art to practice the invention. It should be understood that the various embodiments of the present invention are different but need not be mutually exclusive. For example, certain shapes, structures, and characteristics described herein may be embodied in other embodiments without departing from the spirit and scope of the invention with respect to one embodiment. In addition, it is to be understood that the location or arrangement of individual components within each disclosed embodiment may be changed without departing from the spirit and scope of the invention. The following detailed description, therefore, is not to be taken in a limiting sense, and the scope of the present invention, if properly described, is defined only by the appended claims, along with the full range of equivalents to which such claims are entitled. Like reference numerals in the drawings refer to the same or similar functions throughout the several aspects.

이하, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명을 용이하게 실시할 수 있도록 하기 위하여, 본 발명의 바람직한 실시예들에 관하여 첨부된 도면을 참조하여 상세히 설명하기로 한다.Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings so that those skilled in the art can easily implement the present invention.

본 명세서에서 말하는 웹 페이지의 식별자는, 인터넷 또는 월드 와이드 웹(WWW; World Wide Web) 상에서 웹 페이지의 파일이 존재하는 위치를 지시하기 위한 지시자로서, 그 대표적인 예로 URL을 들 수 있다.The identifier of a web page as used herein is an indicator for indicating a location of a file of a web page on the Internet or the World Wide Web (WWW), and a representative example thereof may be a URL.

전체 시스템의 구성Configuration of the entire system

도 1은 본 발명의 일 실시예에 따라 특정 식별자를 갖는 웹 페이지에 포함되어 있는 이미지로부터 OCR 기술을 이용해 문자 또는 기호를 추출한 후, 이를 XML(eXtensible Markup Language) 또는 HTML(HyperText Markup Language) 등의 마크업 언어로 표현하여 제공하고 이에 대한 번역 서비스를 제공하기 위한 전체 시스템의 개략적인 구성도이다.FIG. 1 illustrates extracting a character or a symbol from an image included in a web page having a specific identifier using OCR technology, and then extracting the character or symbol from the image, such as XML (eXtensible Markup Language) or HTML (HyperText Markup Language). It is a schematic configuration diagram of the entire system for providing a markup language and providing a translation service.

도 1에 도시되어 있는 바와 같이 본 발명의 일 실시예에 따른 전체 시스템은, 인터넷, 응용 서버(100), 개방형 API(Open API; Open Application Program Interface) 서비스 게이트웨이(200), 웹 서버(300), 문자 판독 서버(또는, 문자/기호 판독 서버)(500), 번역 서비스 제공 서버(700), 및 사용자 단말 장치(900)로 구성될 수 있다.As shown in Figure 1, the entire system according to an embodiment of the present invention, the Internet, application server 100, Open API (Open Application Program Interface) service gateway 200, Web server 300 , A character reading server (or a character / symbol reading server) 500, a translation service providing server 700, and a user terminal device 900.

먼저, 인터넷은 유선 및 무선 등과 같은 그 통신 양태를 가리지 않고 구성될 수 있으며, 근거리 통신망(LAN; Local Area Network), 도시권 통신망(MAN; Metropolitan Area Network), 광역 통신망(WAN; Wide Area Network) 등 다양한 통신망으로 구성될 수 있다. 바람직하게는, 본 발명에서 말하는 인터넷은 공지의 월드와이드웹(WWW; World Wide Web)일 수 있다.First, the Internet may be configured without regard to communication modes such as wired and wireless, and may include a local area network (LAN), a metropolitan area network (MAN), a wide area network (WAN), and the like. It can be configured with various communication networks. Preferably, the Internet referred to in the present invention may be a known World Wide Web (WWW).

응용 서버(100)는 인터넷을 통하여 사용자 단말 장치(900)와 통신을 수행하며, 개방형 API를 통해 개방형 API 서비스 게이트웨이(200)와 데이터 통신을 수행한다. 응용 서버(100)는, 사용자 단말 장치(900)로부터 웹 검색 서비스 요청, 문자 판독 서비스 요청 또는 번역 서비스 요청이 수신되면, 상기 요청을 개방형 API 서비스 게이트웨이(200)에 전송한다. 개방형 API 서비스 게이트웨이(200)는 상기 서비스 요청들을 웹 서버(300), 문자 판독 서버(500), 또는 번역 서비스 제공 서버(700)에 전송한다.The application server 100 communicates with the user terminal device 900 through the Internet, and performs data communication with the open API service gateway 200 through the open API. When the application server 100 receives a web search service request, a text read service request, or a translation service request from the user terminal device 900, the application server 100 transmits the request to the open API service gateway 200. The open API service gateway 200 transmits the service requests to the web server 300, the text reading server 500, or the translation service providing server 700.

개방형 API 서비스 게이트웨이(200)는 표준화된 개방형 API를 통해 응용 서버(100)와 데이터 통신을 수행한다. 한편, 전술한 바와 같이, 사용자 단말 장치(900)로부터의 서비스 요청을 수신하여, 이를 각 서버로 전송하는 기능 또한 수행한다. 구체적으로 설명하면, 개방형 API 서비스 게이트웨이(200)는 사용자 단말 장치(900)로부터 특정 식별자를 갖는 웹 페이지에 포함되어 있는 이미지에 대한 문자 판독 요청이 수신되면, 이러한 요청을 웹 서버(300) 및 문자 판독 서버(500)에 전송하여, 해당 식별자를 갖는 웹 페이지를 검색한 후에 그 웹 페이지에 포함되어 있는 이미지에 대한 문자 판독 처리를 할 수 있도록 한다. 또한, 개방형 API 서비스 게이트웨이(200)는 문자 판독 결과에 대하여 번역 서비스를 요청할 수도 있다.The open API service gateway 200 performs data communication with the application server 100 through a standardized open API. Meanwhile, as described above, a function of receiving a service request from the user terminal device 900 and transmitting the service request to each server is also performed. Specifically, when the open API service gateway 200 receives a text read request for an image included in a web page having a specific identifier from the user terminal device 900, the open API service gateway 200 sends the request to the web server 300 and the text. The data is transmitted to the reading server 500 so as to search for a web page having the corresponding identifier and to perform a character reading process on an image included in the web page. In addition, the open API service gateway 200 may request a translation service for the character read result.

웹 서버(300)는 통상의 웹 검색 서버와 동일한 구성요소로서, 사용자 단말 장치(900)에 의해 입력되는 식별자에 해당하는 웹 페이지를 검색하는 기능을 수행한다. 이러한 웹 서버(300)는 도 1에 도시되는 바와 같이 별도의 구성요소로 구비될 수도 있지만 생략될 수도 있는 구성요소인데, 이 경우 응용 서버(100)가 웹 서버 기능도 함께 수행할 수 있다.The web server 300 is the same component as a conventional web search server and performs a function of searching a web page corresponding to an identifier input by the user terminal device 900. The web server 300 may be provided as a separate component as shown in FIG. 1, but may be omitted. In this case, the application server 100 may also perform a web server function.

문자 판독 서버(500)는 사용자 단말 장치(900)에 의해 입력되는 식별자를 기초로 하여 웹 서버(300)에 의해 검색되는 웹 페이지에 포함되어 있는 이미지에 대한 문자 판독 처리를 수행한다. 웹 서버(300)에 의해 검색된 웹 페이지에 관한 정보가 개방형 API 서비스 게이트웨이(200)를 통해 문자 판독 서버(500)로 전송되면, 문자 판독 서버(500)는 해당 웹 페이지에 포함되어 있는 이미지를 인식한 후, 그 이미지에 대한 문자 판독을 수행한다. 한편, 문자 판독 서버(500)는 문자 판독 후에는 인식된 텍스트를 XML 또는 HTML 등의 마크업 언어 형태로 변환한 후 출력한다. 문자 판독 서버(500)는 웹 페이지에 포함되어 있는 이미지에 대해 문자 판독을 수행한 후, 그 처리 결과가 반영된 웹 페이지 자체를 제공할 수도 있고, 문자 판독이 수행된 이미지 파일에 대한 판독 결과만을 제공할 수도 있다. 한편, 문자 판독 서버(500)에 의한 문자 판독은 사람이 쓰거나 기계에 의해 인쇄된 문자의 이미지를 기계가 읽을 수 있는 문자로 변환하는 OCR 기술에 의해 수행될 수 있다. 이러한 문자 판독 서버(500)의 내부 구성과 그 동작에 대해서는 후에 상세히 설명하기로 한다.The character reading server 500 performs character reading processing on an image included in a web page searched by the web server 300 based on the identifier input by the user terminal device 900. When information about the web page retrieved by the web server 300 is transmitted to the character reading server 500 through the open API service gateway 200, the character reading server 500 recognizes an image included in the web page. After that, a character read on that image is performed. On the other hand, after reading the character, the character reading server 500 converts the recognized text into a markup language such as XML or HTML and outputs the converted text. The character reading server 500 may perform character reading on the image included in the web page, and then provide the web page itself reflecting the processing result, or provide only the reading result on the image file on which the character reading is performed. You may. Meanwhile, the character reading by the character reading server 500 may be performed by an OCR technique that converts an image of a character written by a person or printed by a machine into a machine readable character. The internal structure of the character reading server 500 and its operation will be described later in detail.

한편, 이러한 문자 판독에 있어서는 문자 판독 데이터베이스(600)가 참조될 수 있다. 구체적으로 설명하면, 문자 판독 데이터베이스(600)에는 각종 이미지에 포함되거나 포함되어 있을 가능성이 있는 것으로 판단되는 다양한 문자, 기호 등이 저장되어 있을 수 있다. 또한, 문자 판독 데이터베이스(600)에는 해당 이미지에 포함되어 있는 문자에 대한 언어, 폰트(font) 등에 관한 정보가 저장되어 있을 수 있다. 문자 판독 서버(500)는 이러한 정보를 참조하여, 웹 페이지에 포함되어 있는 이미지에 대한 문자 판독을 수행하게 된다. 비록 도 1에서는 문자 판독 데이터베이스(600)가 문자 판독 서버(500)와 별개로 구성되는 것으로 도시되지만, 본 발명을 구현하는 당업자의 필요에 따라, 문자 판독 데이터베이스(600)는 문자 판독 서버(500)에 포함되어 구성될 수도 있다.On the other hand, in the character reading, the character reading database 600 can be referred to. Specifically, the character reading database 600 may store various characters, symbols, and the like, which may be included or included in various images. In addition, the character reading database 600 may store information about a language, a font, and the like for the characters included in the image. The character reading server 500 refers to this information and performs character reading on an image included in a web page. Although the character reading database 600 is shown in FIG. 1 as being configured separately from the character reading server 500, according to the needs of those skilled in the art of implementing the present invention, the character reading database 600 is a character reading server 500. It may be included in the configuration.

번역 서비스 제공 서버(700)는 문자 판독 서버(500)에 의해 문자 판독이 수행되어 마크업 언어로 변환된 텍스트에 대한 번역 서비스를 제공할 수 있다. 문자 판독 서버(500)에 의해 출력되는 마크업 언어 형태의 텍스트를 포함하는 웹 페이지에 관한 정보는 개방형 API 서비스 게이트웨이(200)를 통해 번역 서비스 제공 서버(700)로 전송된다. 번역 서비스 제공 서버(700)는 해당 웹 페이지에 포함되는 텍스트에 대해 번역을 수행한다. 예를 들어, 해당 웹 페이지에 포함되는 텍스트가 외국어(예를 들면, 영어 또는 일어)인 경우에는, 이러한 외국어 텍스트를 한국어로 번역하여 출력할 수도 있고, 반대로 한국어 텍스트를 외국어로 번역하여 출력할 수도 있다. 이러한 번역 서비스 제공 서버(700)의 내부 구성과 그 동작에 대해서는 후에 상세히 설명하기로 한다.The translation service providing server 700 may provide a translation service for text that is read by the character reading server 500 and converted into a markup language. Information about a web page including text in markup language form output by the character reading server 500 is transmitted to the translation service providing server 700 through the open API service gateway 200. The translation service providing server 700 performs translation on text included in the web page. For example, if the text included in the web page is a foreign language (for example, English or Japanese), the foreign language text may be translated into Korean and vice versa. have. An internal configuration of the translation service providing server 700 and its operation will be described later in detail.

한편, 이러한 번역 서비스 제공 서버(700)에 의한 번역에 있어서는 번역 데이터베이스(800)가 참조될 수 있다. 구체적으로 설명하면, 번역 데이터베이 스(800)에는 해당 텍스트에 대응하거나 대응하고 있을 가능성이 있는 것으로 판단되는 한국어 또는 외국어 텍스트가 저장되어 있을 수 있고, 번역 서비스 제공 서버(700)는 이러한 정보를 참조하여, 웹 페이지에 포함되는 텍스트에 대한 번역을 수행하게 된다. 비록 도 1에서는 번역 데이터베이스(800)가 번역 서비스 제공 서버(700)와 별개로 구성되는 것으로 도시되지만, 본 발명을 구현하는 당업자의 필요에 따라, 번역 데이터베이스(800)는 번역 서비스 제공 서버(700)에 포함되어 구성될 수도 있다.Meanwhile, the translation database 800 may be referred to in translation by the translation service providing server 700. Specifically, the translation database 800 may store Korean or foreign language text that is determined to correspond to or possibly correspond to the corresponding text, and the translation service providing server 700 may refer to such information. Thus, the translation of the text included in the web page is performed. Although the translation database 800 is shown as being configured separately from the translation service providing server 700 in FIG. 1, the translation database 800 may be translated service providing server 700 according to the needs of those skilled in the art of implementing the present invention. It may be included in the configuration.

그리고, 사용자 단말 장치(900)는 사용자가 인터넷을 통하여 응용 서버(100)에 접속한 후 통신할 수 있도록 하는 기능을 포함하는 디지털 기기로서, 개인용 컴퓨터(예를 들어, 데스크탑 컴퓨터, 노트북 컴퓨터 등), 워크스테이션, PDA, 웹 패드, 이동 전화기 등과 같이 메모리 수단을 구비하고 마이크로 프로세서를 탑재하여 연산 능력을 갖춘 디지털 기기라면 얼마든지 본 발명에 따른 사용자 단말 장치(900)로서 채택될 수 있다.In addition, the user terminal device 900 is a digital device including a function for allowing a user to communicate after connecting to the application server 100 through the Internet, and includes a personal computer (for example, a desktop computer, a notebook computer, etc.). A digital device having a memory device such as a workstation, a PDA, a web pad, a mobile phone, and the like with a microprocessor can be adopted as the user terminal device 900 according to the present invention.

사용자는 사용자 단말 장치(900)를 통해 웹 검색이 가능한 웹 브라우저를 실행시켜 검색하고자 하는 웹 페이지의 식별자를 입력할 수 있다. 이렇게 입력되는 식별자는 응용 서버(100)를 통해 개방형 API 서비스 게이트웨이(200)로 전해지고, 웹 서버(300)에 의해 해당 식별자를 갖는 웹 페이지가 검색되며, 문자 판독 서버(500) 및 번역 서비스 제공 서버(700)에 의해 해당 웹 페이지에 포함되는 이미지에 대한 문자 판독 및 이에 따른 번역이 행해진다. 검색되는 웹 페이지에 대한 정보, 문자 판독 결과, 및 번역 결과는 다시 개방형 API 서비스 게이트웨이(200) 및 응용 서버(100)를 통해 사용자 단말 장치(900)로 전송되고, 사용자는 이를 통해 특정 식별자를 갖는 웹 페이지에 포함되어 있는 이미지에 대한 문자 판독 및 번역 서비스를 제공 받을 수 있게 된다. 한편, 사용자는 웹 페이지의 식별자를 입력할 때에 번역 서비스를 제공 받을지 여부를 선택할 수 있다. 사용자가 번역 서비스를 제공 받기를 원하지 않는 경우에는 문자 판독 서버(500)에 의해 문자 판독된 결과만이 개방형 API 서비스 게이트웨이(200) 및 응용 서버(100)를 통해 사용자에게 제공되고, 사용자가 번역 서비스를 제공 받기를 원하는 경우에는 번역 서비스 제공 서버(700)에 의해 번역된 결과가 제공될 수 있다.The user may input a identifier of a web page to be searched by executing a web browser capable of web search through the user terminal device 900. The input identifier is transmitted to the open API service gateway 200 through the application server 100, the web page having the identifier is retrieved by the web server 300, the character reading server 500 and the translation service providing server. By 700, the character reading and the corresponding translation for the image included in the web page is performed. The information about the retrieved web page, the text reading result, and the translation result are transmitted back to the user terminal device 900 through the open API service gateway 200 and the application server 100, and the user has a specific identifier therethrough. Text reading and translation services for images included in web pages will be provided. Meanwhile, the user may select whether to provide a translation service when inputting an identifier of a web page. If the user does not want to be provided with a translation service, only the results read by the character reading server 500 are provided to the user through the open API service gateway 200 and the application server 100, and the user is provided with the translation service. If you want to be provided with the translation service provided by the translation service server 700 may be provided.

개방형 Open APIAPI 서비스 게이트웨이의 구성 Configuration of the Services Gateway

이하에서는, 본 발명의 일 실시예에 따른 개방형 API 서비스 게이트웨이(200)의 내부 구성 및 각 구성요소의 기능에 대하여 살펴보기로 한다.Hereinafter, the internal configuration of the open API service gateway 200 and the function of each component will be described.

도 2는 본 발명의 일 실시예에 따른 개방형 API 서비스 게이트웨이(200)의 내부 구성을 상세하게 도시한 도면이다. 도 2를 참조하면, 본 발명의 일 실시예에 따른 개방형 API 서비스 게이트웨이(200)는 제어부(210), 통신부(220), 웹 페이지 정보 획득부(230), 문자 판독 결과 획득부(240), 번역 결과 획득부(250), 및 메모리부(270)로 구성될 수 있다.2 is a diagram illustrating in detail the internal configuration of the open API service gateway 200 according to an embodiment of the present invention. Referring to FIG. 2, the open API service gateway 200 according to an embodiment of the present invention includes a control unit 210, a communication unit 220, a web page information obtaining unit 230, a text reading result obtaining unit 240, The translation result obtaining unit 250 and the memory unit 270 may be configured.

본 발명의 일 실시예에 따르면, 상기 각 구성요소들은 데이터 통신이 가능한 소정의 프로그램 모듈들일 수 있다. 이러한 프로그램 모듈들은 운영 시스템, 응용 프로그램 모듈 및 기타 프로그램 모듈의 형태로 개방형 API 서비스 게이트웨이(200)에 포함될 수 있으며, 물리적으로는 여러 가지 공지의 기억 장치 상에 저장 될 수 있다. 또한, 이러한 프로그램 모듈들은 개방형 API 서비스 게이트웨이(200)와 통신 가능한 원격 기억 장치에 저장될 수도 있다. 한편, 이러한 프로그램 모듈들은 본 발명에 따라 후술할 특정 업무를 수행하거나 특정 추상 데이터 유형을 실행하는 루틴, 서브루틴, 프로그램, 오브젝트, 컴포넌트, 데이터 구조 등을 포괄하지만, 이에 제한되지는 않는다.According to an embodiment of the present invention, each of the components may be predetermined program modules capable of data communication. Such program modules may be included in the open API service gateway 200 in the form of an operating system, an application module, and other program modules, and may be physically stored on various known storage devices. Such program modules may also be stored in a remote storage device that can communicate with the open API service gateway 200. On the other hand, such program modules include, but are not limited to, routines, subroutines, programs, objects, components, data structures, etc. that perform particular tasks or execute particular abstract data types, described below, in accordance with the present invention.

먼저, 제어부(210)는 개방형 API 서비스 게이트웨이(200)의 전반적인 동작을 제어하며, 본 발명의 일 실시예에 따라, 응용 서버(100)의 요청에 응하여 특정 식별자를 갖는 웹 페이지에 대한 검색 요청, 해당 웹 페이지에 포함되어 있는 이미지에 대한 문자 판독 요청 또는 이에 대한 번역 요청에 따른 정보의 획득, 문자 판독 결과의 획득, 번역 결과의 획득을 제어한다.First, the controller 210 controls the overall operation of the open API service gateway 200, and according to an embodiment of the present invention, in response to a request of the application server 100, a search request for a web page having a specific identifier, Controls the acquisition of information according to the text read request or translation request for the image included in the web page, the text read result, and the translation result.

통신부(220)는 제어부(210)의 제어에 따라 개방형 API를 이용한 응용 서버(100)와의 데이터 통신과, 웹 서버(300), 문자 판독 서버(500) 및 번역 서비스 제공 서버(700)와의 데이터 통신을 수행한다.The communication unit 220 communicates data with the application server 100 using the open API under the control of the control unit 210, and data communication with the web server 300, the text reading server 500, and the translation service providing server 700. Do this.

웹 페이지 정보 획득부(230)는 사용자 단말 장치(900)를 사용하는 사용자에 의해 입력되어 응용 서버(100)를 통해 수신된 웹 페이지 식별자에 관한 정보를 검출한 후, 제어부(210)의 제어에 따라 해당 식별자에 관한 정보를 웹 서버(300)에 전송한다. 웹 서버(300)가 상기 식별자에 관한 정보를 수신한 후, 해당 식별자에 대응하는 웹 페이지를 검색하고, 검색된 웹 페이지에 관한 정보를 개방형 API 서비스 게이트웨이(200)로 제공하면, 웹 페이지 정보 획득부(230)는 검색된 웹 페이지에 관한 정보를 수신하게 된다. 한편, 본 발명의 다른 실시예에 따라, 웹 서 버(300)의 기능을 응용 서버(100)가 대신하는 경우에는, 개방형 API 서비스 게이트웨이(200)는 사용자가 입력한 식별자에 대응하는 웹 페이지에 관한 정보를 응용 서버(100)로부터 개방형 API를 통해 바로 수신할 수도 있다.The web page information acquisition unit 230 detects information about the web page identifier received by the user using the user terminal device 900 and received through the application server 100 and then controls the control unit 210. Accordingly, the information about the identifier is transmitted to the web server 300. After the web server 300 receives the information about the identifier, searches for a web page corresponding to the identifier, and provides information about the searched web page to the open API service gateway 200. 230 receives information about the retrieved web page. On the other hand, according to another embodiment of the present invention, when the application server 100 replaces the function of the web server 300, the open API service gateway 200 to the web page corresponding to the identifier entered by the user Information may be directly received from the application server 100 through an open API.

문자 판독 결과 획득부(240)는 제어부(210)의 제어에 따라 웹 페이지 정보 획득부(230)가 획득한 웹 페이지에 관한 정보를 문자 판독 서버(500)로 전송한다. 그 후, 문자 판독 서버(500)가 상기 웹 페이지에 포함되어 있는 이미지에 대한 문자 판독 결과를 제공하면, 문자 판독 결과 획득부(240)는 해당 웹 페이지에 대한 문자 판독 결과를 수신한다. 전술한 바와 같이, 문자 판독 결과 획득부(240)가 수신하는 문자 판독 결과는 XML 또는 HTML 등의 마크업 언어로 변환된 웹 페이지의 형태일 수도 있고, 해당 웹 페이지에 포함되어 있는 이미지 파일만에 대한 문자 판독 결과일 수도 있다. 획득된 문자 판독 결과를 포함하는 웹 페이지에 대한 정보, 또는 이미지 파일만에 대한 문자 판독 결과는 제어부(210)의 제어에 따라 통신부(220)를 통해 응용 서버(100)로 전송될 수 있고, 사용자 단말 장치(900)는 응용 서버(100)로부터 상기 문자 판독 결과를 수신할 수 있다.The character reading result obtaining unit 240 transmits the information about the web page acquired by the web page information obtaining unit 230 to the character reading server 500 under the control of the control unit 210. Thereafter, when the text reading server 500 provides the text reading result for the image included in the web page, the text reading result obtaining unit 240 receives the text reading result for the web page. As described above, the text reading result received by the text reading result obtaining unit 240 may be in the form of a web page converted into a markup language such as XML or HTML, or only in an image file included in the web page. It may also be a character read result. The information on the web page including the obtained text reading result, or the text reading result for the image file only may be transmitted to the application server 100 through the communication unit 220 under the control of the controller 210, and the user The terminal device 900 may receive the character read result from the application server 100.

한편, 문자 판독 결과 획득부(240)에 의해 획득된 문자 판독 결과는 번역 서비스 제공을 위해 번역 서비스 제공 서버(700)로 전송될 수도 있다. 문자 판독 결과 획득부(240)에 의해 획득된 문자 판독 결과를 응용 서버(100)로 전송할지, 번역 서비스 제공 서버(700)로도 전송할지 여부는 사용자에 의해 선택적으로 결정될 수 있다. 구체적으로 설명하면, 사용자가 사용자 단말 장치(900)를 통해 식별자를 입력할 때, 번역 서비스를 제공 받을지 여부를 결정하여 그 요청을 전송할 수 있는 데, 사용자가 번역 서비스 제공을 원하지 않을 시에는 제어부(210)의 제어에 의해 문자 판독 결과 획득부(240)에 의해 획득된 문자 판독 결과가 응용 서버(100)에만 전송되며, 반대의 경우에는 문자 판독 결과가 번역 서비스 제공 서버(700)로도 전송될 수 있다.Meanwhile, the text reading result obtained by the text reading result obtaining unit 240 may be transmitted to the translation service providing server 700 to provide a translation service. Whether to transmit the character reading result obtained by the character reading result obtaining unit 240 to the application server 100 or the translation service providing server 700 may be selectively determined by the user. In detail, when a user inputs an identifier through the user terminal device 900, the user may determine whether to receive a translation service and transmit the request. When the user does not want to provide the translation service, the controller ( The character reading result obtained by the character reading result obtaining unit 240 under the control of 210 is transmitted only to the application server 100, and in the opposite case, the character reading result may also be transmitted to the translation service providing server 700. have.

번역 결과 획득부(250)는 제어부(210)의 제어에 따라 문자 판독 결과 획득부(230)가 획득한 문자 판독 결과를 번역 서비스 제공 서버(700)로 전송한다. 번역 서비스 제공 서버(700)에 의해 판독된 텍스트에 대한 번역이 이루어지고, 번역 결과 획득부(250)는 번역 결과를 획득한다. 수신된 번역 결과 또는 번역 결과가 반영된 웹 페이지에 대한 정보는 제어부(210)의 제어에 따라 통신부(220)를 통해 응용 서버(100)로 전송되고, 사용자 단말 장치(900)는 응용 서버(100)를 통해 번역 결과 또는 번역 결과가 반영된 웹 페이지를 수신할 수 있다.The translation result obtaining unit 250 transmits the text reading result obtained by the text reading result obtaining unit 230 to the translation service providing server 700 under the control of the control unit 210. The translation of the text read by the translation service providing server 700 is performed, and the translation result obtaining unit 250 obtains the translation result. The received translation result or information on the web page reflecting the translation result is transmitted to the application server 100 through the communication unit 220 under the control of the control unit 210, the user terminal device 900 is the application server 100 Through the translation result or the web page reflecting the translation result can be received.

메모리부(270)는 개방형 API 서비스 게이트웨이(200)의 동작에 필요한 프로그램들을 저장한다. 또한, 메모리부(270)는 웹 페이지 정보 획득부(230), 문자 판독 결과 획득부(240), 및 번역 결과 획득부(250)에 의해 획득된 정보들을 임시 저장한다.The memory unit 270 stores programs necessary for the operation of the open API service gateway 200. In addition, the memory unit 270 temporarily stores the information obtained by the web page information obtaining unit 230, the character reading result obtaining unit 240, and the translation result obtaining unit 250.

문자 판독 서버의 구성Configure the Character Read Server

이하에서는, 본 발명의 일 실시예에 따른 문자 판독 서버(500)의 내부 구성 및 각 구성요소의 기능에 대하여 살펴보기로 한다.Hereinafter, the internal structure of the character reading server 500 and the function of each component will be described.

도 3은 본 발명의 일 실시예에 따른 문자 판독 서버(500)의 내부 구성을 상세하게 도시한 도면이다. 도 3을 참조하면, 본 발명의 일 실시예에 따른 문자 판 독 서버(500)는, 제어부(510), 통신부(520), 이미지 인식 및 분석부(530), 문자/기호 변환부(540), 마크업 언어 변환부(550)로 구성될 수 있다.3 is a diagram illustrating in detail the internal configuration of the character reading server 500 according to an embodiment of the present invention. Referring to FIG. 3, the character reading server 500 according to an exemplary embodiment of the present invention may include a controller 510, a communication unit 520, an image recognition and analysis unit 530, and a character / symbol converter 540. The markup language converter 550 may be configured.

본 발명의 일 실시예에 따르면, 상기 구성요소들은 데이터 통신이 가능한 소정의 프로그램 모듈들일 수 있다. 이러한 프로그램 모듈들은 운영 시스템, 응용 프로그램 모듈 및 기타 프로그램 모듈의 형태로 문자 판독 서버(500)에 포함될 수 있으며, 물리적으로는 여러 가지 공지의 기억 장치 상에 저장될 수 있다. 또한, 이러한 프로그램 모듈들은 문자 판독 서버(500)와 통신 가능한 원격 기억 장치에 저장될 수도 있다. 한편, 이러한 프로그램 모듈들은 본 발명에 따라 후술할 특정 업무를 수행하거나 특정 추상 데이터 유형을 실행하는 루틴, 서브루틴, 프로그램, 오브젝트, 컴포넌트, 데이터 구조 등을 포괄하지만, 이에 제한되지는 않는다.According to an embodiment of the present invention, the components may be predetermined program modules capable of data communication. Such program modules may be included in the character reading server 500 in the form of operating systems, application modules, and other program modules, and may be physically stored on a variety of known storage devices. In addition, these program modules may be stored in a remote storage device that can communicate with the character read server 500. On the other hand, such program modules include, but are not limited to, routines, subroutines, programs, objects, components, data structures, etc. that perform particular tasks or execute particular abstract data types, described below, in accordance with the present invention.

제어부(510)는 문자 판독 서버(500)의 전반적인 동작을 제어하며, 특히, 개방형 API 서비스 게이트웨이(200)의 요청에 대해 소정 웹 페이지에 포함되어 있는 이미지에 대한 문자 판독을 수행한 후, 그 결과를 제공하는 동작을 제어한다.The control unit 510 controls the overall operation of the character reading server 500, and in particular, after performing the character reading on the image included in the predetermined web page for the request of the open API service gateway 200, the result Control the operation to provide.

통신부(520)는 문자 판독 서버(500)와 개방형 API 서비스 게이트웨이(200) 간의 통신을 수행한다. 통신부(520)는 개방형 API 서비스 게이트웨이(200)로부터 소정 웹 페이지에 대한 정보를 수신하고, 해당 웹 페이지에 포함되어 있는 이미지에 대해 문자 판독된 결과를 XML 또는 HTML 등의 마크업 언어의 형태로 전송한다.The communication unit 520 performs communication between the text reading server 500 and the open API service gateway 200. The communication unit 520 receives information on a predetermined web page from the open API service gateway 200, and transmits a character read result of an image included in the web page in a markup language such as XML or HTML. do.

이미지 인식 및 분석부(530)는 통신부(520)에 의해 수신된, 웹 페이지에 포함되어 있는 이미지를 인식하여 이를 공지의 이미지 분석 알고리즘에 의하여 분석한다. 이와 관련하여, 본 발명이 속하는 기술분야의 당업자는 공지된 기술 문헌인 한국정보과학회의 "2007 한국컴퓨터종합학술대회 논문집 Vol. 34, No. 1(C)"에 개시된 문자 인식 기술 등을 참고할 수 있다.The image recognition and analysis unit 530 recognizes an image included in the web page received by the communication unit 520 and analyzes the image by using a known image analysis algorithm. In this regard, those skilled in the art to which the present invention belongs may refer to the character recognition technology disclosed in the Korean Information Science Society, Vol. 34, No. 1 (C), which is a well-known technical document. have.

문자/기호 변환부(540)는 이미지 인식 및 분석부(530)에 의하여 분석된 이미지에 포함되는 것으로 판단되는 문자 또는 기호를 추출하여 기계로 판독 가능한 문자 또는 기호로 변환한다. 본 발명의 바람직한 실시예에 따르면, 문자/기호 변환부(540)는 분석된 특정 이미지와 문자 또는 기호 간의 유사도를 산출하여 최대치의 유사도를 보이는 문자 또는 기호로 해당 이미지를 변환할 수 있다.The character / symbol converter 540 extracts a character or symbol determined to be included in the image analyzed by the image recognition and analysis unit 530 and converts the character or symbol into a machine-readable character or symbol. According to a preferred embodiment of the present invention, the character / symbol converter 540 may convert the image into a character or symbol showing a maximum degree of similarity by calculating the similarity between the analyzed specific image and the character or symbol.

한편, 전술한 바와 같이, 문자/기호 변환 시에는 문자 판독 데이터베이스(600)가 참조될 수 있다. 문자 판독 데이터베이스(600)에는 이미지에 대응하는 문자, 기호 또는 텍스트에 대한 정보가 저장되어 있을 수 있다. 또한, 이와 함께, 해당 이미지로 표현되는 문자에 대응하는 언어, 폰트 정보가 더 저장되어 있을 수도 있다. 문자/기호 변환부(540)는 이러한 문자 판독 데이터베이스(600)를 참조하여, 이미지로 표현되어 있는 문자 등을 각종 폰트로 표현되는 각 언어(예를 들면, 한국어, 영어 또는 일어)로 변환할 수 있다.Meanwhile, as described above, the character reading database 600 may be referred to at the time of character / symbol conversion. The character reading database 600 may store information on a character, a symbol, or text corresponding to the image. In addition, language and font information corresponding to a character represented by the image may be further stored. The character / symbol conversion unit 540 may convert the characters represented by the image into respective languages (eg, Korean, English, or Japanese) represented by various fonts with reference to the character read database 600. have.

그리고, 마크업 언어 변환부(550)는 문자/기호 변환부(540)에 의해 변환된 결과를 XML 또는 HTML 등의 마크업 언어로 변환한다.The markup language converter 550 converts the result converted by the character / symbol converter 540 into a markup language such as XML or HTML.

이렇게 마크업 언어로 변환된 문자 판독 결과는 제어부(510)의 제어에 따라 통신부(520)를 통해 개방형 API 서비스 게이트웨이(200)로 전송된다.The character read result converted into the markup language is transmitted to the open API service gateway 200 through the communication unit 520 under the control of the control unit 510.

번역 서비스 제공 서버의 구성Configuration of Translation Service Provision Server

이하에서는, 본 발명의 일 실시예에 따른 번역 서비스 제공 서버(700)의 내 부 구성 및 각 구성요소의 기능에 대하여 살펴보기로 한다.Hereinafter, the internal structure of the translation service providing server 700 and the functions of each component will be described.

도 4는 본 발명의 일 실시예에 따른 번역 서비스 제공 서버(700)의 내부 구성을 상세하게 도시한 도면이다. 도 4를 참조하면, 본 발명의 일 실시예에 따른 번역 서비스 제공 서버(700)는, 제어부(710), 통신부(720), 번역 모드 선택부(730), 번역 수행부(750)로 구성될 수 있다.4 is a diagram illustrating an internal configuration of a translation service providing server 700 according to an embodiment of the present invention in detail. Referring to FIG. 4, the translation service providing server 700 according to an embodiment of the present invention may include a control unit 710, a communication unit 720, a translation mode selection unit 730, and a translation execution unit 750. Can be.

본 발명의 일 실시예에 따르면, 상기 구성요소들은 데이터 통신이 가능한 소정의 프로그램 모듈들일 수 있다. 이러한 프로그램 모듈들은 운영 시스템, 응용 프로그램 모듈 및 기타 프로그램 모듈의 형태로 번역 서비스 제공 서버(700)에 포함될 수 있으며, 물리적으로는 여러 가지 공지의 기억 장치 상에 저장될 수 있다. 또한, 이러한 프로그램 모듈들은 번역 서비스 제공 서버(700)와 통신 가능한 원격 기억 장치에 저장될 수도 있다. 한편, 이러한 프로그램 모듈들은 본 발명에 따라 후술할 특정 업무를 수행하거나 특정 추상 데이터 유형을 실행하는 루틴, 서브루틴, 프로그램, 오브젝트, 컴포넌트, 데이터 구조 등을 포괄하지만, 이에 제한되지는 않는다.According to an embodiment of the present invention, the components may be predetermined program modules capable of data communication. Such program modules may be included in the translation service providing server 700 in the form of an operating system, an application module, and other program modules, and may be physically stored on various known storage devices. In addition, these program modules may be stored in a remote storage device that can communicate with the translation service providing server 700. On the other hand, such program modules include, but are not limited to, routines, subroutines, programs, objects, components, data structures, etc. that perform particular tasks or execute particular abstract data types, described below, in accordance with the present invention.

제어부(710)는 번역 서비스 제공 서버(700)의 전반적인 동작을 제어하며, 특히, 개방형 API 서비스 게이트웨이(200)의 요청에 따라, 문자 판독 결과에 대한 번역이 수행된 후, 그 결과를 제공하는 동작을 제어한다.The control unit 710 controls the overall operation of the translation service providing server 700, and in particular, in response to a request of the open API service gateway 200, after the translation of the character read result is performed, providing the result To control.

통신부(720)는 번역 서비스 제공 서버(700)와 개방형 API 서비스 게이트웨이(200) 간의 통신을 수행한다. 통신부(720)는 개방형 API 서비스 게이트웨이(200)로부터 문자 판독된 결과 또는 그 결과가 반영된 소정 웹 페이지에 대한 정 보를 수신하고, 해당 텍스트에 대한 번역이 수행된 후에는, 그 결과를 전송한다.The communicator 720 performs communication between the translation service providing server 700 and the open API service gateway 200. The communicator 720 receives the information about the result of reading the text or the predetermined web page reflecting the result from the open API service gateway 200, and after the translation of the text is performed, transmits the result.

번역 모드 선택부(730)는 먼저 개방형 API 서비스 게이트웨이(200)로부터 수신된 문자 판독 결과에 포함되는 텍스트를 인식한다. 이러한 인식을 통해 해당 텍스트의 언어를 판별한다. 한편, 이러한 인식에는 텍스트에 포함되는 기호들을 제외한 채 문자만을 인식하는 과정이 포함될 수도 있다. 번역 모드 선택부(730)는 텍스트를 인식하고 그 언어를 인식한 후에, 번역 모드를 선택한다. 예를 들어, 인식된 텍스트가 영어이면 '영-한 번역' 모드 또는 '영-일 번역' 모드를 선택하고, 인식된 텍스트가 일어이면 '일-한 번역' 모드 또는 '일-영 번역' 모드를 선택할 수 있다. 한편, 모드 선택은 반드시 하나의 모드의 선택으로 한정되지 않아도 되며, 예를 들면, '영-한 번역' 모드 또는 '영-일 번역' 모드가 동시에 선택될 수도 있다.The translation mode selector 730 first recognizes text included in a character read result received from the open API service gateway 200. This recognition determines the language of the text. On the other hand, the recognition may include a process of recognizing only letters without excluding symbols included in the text. After recognizing the text and the language, the translation mode selector 730 selects the translation mode. For example, if the recognized text is English, select 'English-English translation' mode or 'English-Japanese translation' mode. If the recognized text is Japanese, 'Japanese-English translation' mode or 'Japanese-English translation' mode Can be selected. On the other hand, the mode selection is not necessarily limited to the selection of one mode, for example, the 'English-English translation' mode or the 'English-Japanese translation' mode may be selected at the same time.

번역 수행부(750)는 번역 모드 선택부(730)에 의해 선택된 번역 모드에 따라 인식된 텍스트에 대한 번역을 수행한다.The translation performer 750 translates the recognized text according to the translation mode selected by the translation mode selector 730.

이러한 번역 시에는 번역 데이터베이스(800)가 참조될 수 있다. 번역 데이터베이스(800)에는 해당 언어에 대응하는 다른 언어에 대한 정보가 저장되어 있을 수 있고, 번역 수행부(750)는 이러한 데이터베이스(800)를 참조하여 해당 텍스트에 대한 번역을 수행하게 된다.In this translation, the translation database 800 may be referred to. The translation database 800 may store information about other languages corresponding to the corresponding language, and the translation performing unit 750 may perform translation on the corresponding text with reference to the database 800.

번역 결과는 제어부(710)의 제어에 따라 통신부(720)를 통해 개방형 API 서비스 게이트웨이(200)로 전송된다. 번역 결과를 수신한 개방형 API 서비스 게이트웨이(200)는 번역 결과 또는 번역 결과가 반영된 웹 페이지에 대한 정보를 응용 서 버(100)로 전송할 수 있다. 또한, 번역 결과와 함께 번역 전 원문에 관한 정보도 함께 전송될 수 있다.The translation result is transmitted to the open API service gateway 200 through the communication unit 720 under the control of the control unit 710. The open API service gateway 200 receiving the translation result may transmit information on the web page in which the translation result or the translation result is reflected to the application server 100. In addition, information about the original text before translation may be transmitted together with the translation result.

개방형 API 서비스 게이트웨이(200)는 번역 결과, 번역 결과가 반영된 웹 페이지, 및/또는 번역 전 원문에 대한 정보를 응용 서버(100)로 전송하고, 응용 서버(100)는 상기 정보를 사용자 단말 장치(900)로 전송한다.The open API service gateway 200 transmits the translation result, the web page reflecting the translation result, and / or information about the original text to the application server 100, and the application server 100 transmits the information to the user terminal device ( 900).

서비스 제공 과정Service delivery process

이하에서는, 도 5를 참조하여, 본 발명의 일 실시예에 따라 특정 식별자에 해당하는 웹 페이지에 포함되어 있는 이미지에 대한 문자 판독 서비스 및 문자 판독 결과에 대한 번역 서비스를 제공하는 과정에 대해 살펴보기로 한다.Hereinafter, referring to FIG. 5, a process of providing a text reading service for an image included in a web page corresponding to a specific identifier and a translation service for the text reading result according to an embodiment of the present invention will be described. Shall be.

먼저, 사용자가 사용자 단말 장치(900)를 통해 웹 브라우저를 실행시키고 특정 URL을 입력함과 동시에 서비스 요청을 하면(S110), 웹 브라우저에 의해 서비스 요청이 응용 서버(100)로 전송된다(S115). 이 때, 전술한 바와 같이, 사용자는 식별자 입력과 동시에 웹 페이지에 포함되어 있는 이미지에 대한 문자 판독 서비스만을 제공 받을 것인지, 판독된 텍스트에 대한 번역 서비스도 함께 받을 것인지 여부를 결정할 수 있다.First, when a user executes a web browser through the user terminal device 900 and inputs a specific URL and requests a service at the same time (S110), the service request is transmitted to the application server 100 by the web browser (S115). . At this time, as described above, the user may determine whether to receive only the text reading service for the image included in the web page or the translation service for the read text simultaneously with the input of the identifier.

서비스 요청을 전송 받은 응용 서버(100)는 개방형 API를 이용하여 이를 개방형 API 서비스 게이트웨이(200)에 전송한다(S120). 개방형 API 서비스 게이트웨이(200)는 해당 서비스 요청에 따라, 사용자 단말 장치(900)로부터 전송된 URL을 웹 서버(300)로 전송한다(S130).The application server 100 receiving the service request transmits the open request to the open API service gateway 200 using the open API (S120). The open API service gateway 200 transmits the URL transmitted from the user terminal device 900 to the web server 300 according to the corresponding service request (S130).

URL을 전송 받은 웹 서버(300)는 해당 URL에 대응하는 웹 페이지를 검색한 후(S140), 검색된 웹 페이지에 대한 정보를 다시 개방형 API 서비스 게이트웨이(200)로 전송한다(S145). 이를 전송 받은 개방형 API 서비스 게이트웨이(200)는 웹 페이지에 대한 정보를 문자 판독 서버(500)로 전송한다(S150).After receiving the URL, the web server 300 searches for a web page corresponding to the corresponding URL (S140), and then transmits information about the found webpage to the open API service gateway 200 (S145). The open API service gateway 200 which has received this transmits the information about the web page to the character reading server 500 (S150).

문자 판독 서버(500)는 전송 받은 웹 페이지에 포함되어 있는 이미지를 인식, 분석한 후, 해당 이미지로 표현되는 문자 또는 기호를 기계 판독 가능한 문자 또는 기호로 변환한 후, 다시 마크업 언어의 형태로 변환한다(S160). 이렇게 얻어진 문자 판독 결과는 다시 개방형 API 서비스 게이트웨이(200)로 전송된다(S165).The character reading server 500 recognizes and analyzes an image included in the received web page, converts a character or symbol represented by the image into a machine-readable character or symbol, and then again forms a markup language. Convert (S160). The character reading result thus obtained is transmitted to the open API service gateway 200 again (S165).

단계 S110에서 사용자가 문자 판독 서비스만을 요청하였다면, 상기 문자 판독 결과를 수신한 개방형 API 서비스 게이트웨이(200)는 그 문자 판독 결과를 응용 서버(100)로 전송하고(S171), 응용 서버(100)는 이를 사용자 단말 장치(900)로 전송한다(S173).If the user requests only the text reading service in step S110, the open API service gateway 200 receiving the text reading result transmits the text reading result to the application server 100 (S171), and the application server 100 This is transmitted to the user terminal device 900 (S173).

한편, 단계 S110에서 사용자가 문자 판독 서비스와 함께 번역 서비스도 요청하였다면, 상기 문자 판독 결과를 수신한 개방형 API 서비스 게이트웨이(200)는 그 문자 판독 결과를 번역 서비스 제공 서버(700)로 전송한다(S175).On the other hand, if the user also requested a translation service together with the text reading service in step S110, the open API service gateway 200 receiving the text reading result transmits the text reading result to the translation service providing server 700 (S175). ).

그 후, 번역 서비스 제공 서버(700)는 수신한 문자 판독 결과를 기초로 하여 번역을 수행한 후(S180), 번역 결과 및/또는 번역 전의 문자 판독 결과를 개방형 API 서비스 게이트웨이(200)로 전송한다(S185).Thereafter, the translation service providing server 700 performs a translation based on the received character reading result (S180), and then transmits the translation result and / or the character reading result before the translation to the open API service gateway 200. (S185).

번역 결과 및/또는 번역 전의 문자 판독 결과를 수신한 개방형 API 서비스 게이트웨이(200)는 이를 응용 서버(100)로 전송하고(S190), 응용 서버(100)는 이를 사용자 단말 장치(900)로 전송한다(S195).The open API service gateway 200 having received the translation result and / or the character read result before translation transmits it to the application server 100 (S190), and the application server 100 transmits it to the user terminal device 900. (S195).

이렇게 함으로써, 사용자는 사용자 단말 장치(900)를 통해 URL을 입력하는 것만으로도, 해당 웹 페이지에 포함되어 있는 이미지에 대한 문자 판독 서비스 또는 번역 서비스를 제공 받을 수 있게 된다.In this way, the user can be provided with a text reading service or a translation service for an image included in the web page only by inputting a URL through the user terminal device 900.

이상 설명된 본 발명에 따른 실시예들은 다양한 컴퓨터 구성요소를 통하여 수행될 수 있는 프로그램 명령어의 형태로 구현되어 컴퓨터 판독 가능한 기록 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능한 기록 매체는 프로그램 명령어, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 컴퓨터 판독 가능한 기록 매체에 기록되는 프로그램 명령어는 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 분야의 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능한 기록 매체의 예에는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM, DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 ROM, RAM, 플래시 메모리 등과 같은 프로그램 명령어를 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령어의 예에는, 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함된다. 상기 하드웨어 장치는 본 발명에 따른 처리를 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.Embodiments according to the present invention described above may be implemented in the form of program instructions that may be executed by various computer components, and may be recorded in a computer-readable recording medium. The computer-readable recording medium may include program instructions, data files, data structures, etc. alone or in combination. Program instructions recorded on the computer-readable recording medium may be those specially designed and configured for the present invention, or may be known and available to those skilled in the computer software arts. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks and magnetic tape, optical recording media such as CD-ROMs, DVDs, and magneto-optical media such as floptical disks. media), and hardware devices specifically configured to store and execute program instructions, such as ROM, RAM, flash memory, and the like. Examples of program instructions include not only machine code generated by a compiler, but also high-level language code that can be executed by a computer using an interpreter or the like. The hardware device may be configured to operate as one or more software modules to perform the process according to the invention, and vice versa.

이상에서 본 발명이 구체적인 구성요소 등과 같은 특정 사항들과 한정된 실시예 및 도면에 의해 설명되었으나, 이는 본 발명의 보다 전반적인 이해를 돕기 위 해서 제공된 것일 뿐, 본 발명이 상기 실시예들에 한정되는 것은 아니며, 본 발명이 속하는 기술분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형을 꾀할 수 있다.Although the present invention has been described by specific embodiments such as specific components and the like, but the embodiments and the drawings are provided only to help a more general understanding of the present invention, the present invention is limited to the above embodiments. However, one of ordinary skill in the art can make various modifications and variations from this description.

따라서, 본 발명의 사상은 상기 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐만 아니라 이 특허청구범위와 균등하게 또는 등가적으로 변형된 모든 것들은 본 발명의 사상의 범주에 속한다고 할 것이다.Therefore, the spirit of the present invention should not be limited to the embodiments described above, and all of the equivalents or equivalents of the claims, as well as the claims below, are included in the scope of the spirit of the present invention. I will say.

도 1은 본 발명의 일 실시예에 따라 특정 식별자를 갖는 웹 페이지에 포함되어 있는 이미지로부터 OCR 기술을 이용해 문자 또는 기호를 추출한 후, 이를 XML 또는 HTML 등의 마크업 언어로 표현하여 제공하고 이에 대한 번역 서비스를 제공하기 위한 전체 시스템의 개략적인 구성도이다.FIG. 1 extracts a character or symbol from an image included in a web page having a specific identifier using OCR technology, and expresses it in a markup language such as XML or HTML according to an embodiment of the present invention. It is a schematic block diagram of the whole system for providing a translation service.

도 2는 본 발명의 일 실시예에 따른 개방형 API 서비스 게이트웨이(200)의 내부 구성을 상세하게 도시한 도면이다.2 is a diagram illustrating in detail the internal configuration of the open API service gateway 200 according to an embodiment of the present invention.

도 3은 본 발명의 일 실시예에 따른 문자 판독 서버(500)의 내부 구성을 상세하게 도시한 도면이다.3 is a diagram illustrating in detail the internal configuration of the character reading server 500 according to an embodiment of the present invention.

도 4는 본 발명의 일 실시예에 따른 번역 서비스 제공 서버(700)의 내부 구성을 상세하게 도시한 도면이다.4 is a diagram illustrating an internal configuration of a translation service providing server 700 according to an embodiment of the present invention in detail.

도 5는 본 발명의 일 실시예에 따라 특정 식별자에 해당하는 웹 페이지에 포함되어 있는 이미지에 대한 문자 판독 서비스 및 문자 판독 결과에 대한 번역 서비스를 제공하는 과정을 설명하는 흐름도이다.5 is a flowchart illustrating a process of providing a text reading service for a image included in a web page corresponding to a specific identifier and a translation service for the text reading result according to an embodiment of the present invention.

<주요 도면 부호에 관한 간단한 설명><Brief description of the major reference numerals>

100: 응용 서버 200: 개방형 API 서비스 게이트웨이100: application server 200: open API service gateway

300: 웹 서버 500: 문자 판독 서버300: Web server 500: character read server

700: 번역 서비스 제공 서버 900: 사용자 단말 장치700: translation service providing server 900: user terminal device

Claims (21)

웹 페이지에 포함되어 있는 이미지로부터 문자 및/또는 기호를 판독하기 위한 방법으로서,A method for reading characters and / or symbols from an image included in a web page, 사용자 단말 장치로부터 웹 페이지의 식별자를 수신하는 단계,Receiving an identifier of a web page from a user terminal device, 상기 식별자에 대응하는 웹 페이지에 포함되어 있는 적어도 하나의 이미지를 획득하는 단계, 및Obtaining at least one image included in a web page corresponding to the identifier, and 상기 적어도 하나의 이미지 상의 문자 및/또는 기호에 대한 판독 결과를 획득하는 단계Obtaining a read result for a character and / or symbol on the at least one image 를 포함하는 방법.How to include. 제1항에 있어서,The method of claim 1, 상기 식별자는 URL(Uniform Resource Locator)인 방법.Wherein the identifier is a Uniform Resource Locator (URL). 제1항에 있어서,The method of claim 1, 상기 웹 페이지 식별자 수신 단계는, 개방형 API(Application Program Interface)를 통해 수행되는 방법.The web page identifier receiving step is performed through an open application program interface (API). 제1항에 있어서,The method of claim 1, 상기 판독 결과 획득 단계는, 상기 적어도 하나의 이미지 상의 문자 및/또는 기호를 기계로 판독 가능한 형태로 변환하는 단계를 포함하는 방법.Wherein acquiring the read result comprises converting characters and / or symbols on the at least one image into a machine-readable form. 제4항에 있어서,The method of claim 4, wherein 상기 기계로 판독 가능한 형태로 변환된 문자 및/또는 기호는 XML(eXtensible Markup Language) 또는 HTML(HyperText Markup Language)로 표현되는 방법.And converting the characters and / or symbols into the machine-readable form in eXtensible Markup Language (XML) or HyperText Markup Language (HTML). 제1항에 있어서,The method of claim 1, 상기 획득된 판독 결과를 상기 사용자 단말 장치로 전송하는 단계를 더 포함하는 방법.Transmitting the obtained read result to the user terminal device. 웹 페이지에 포함되어 있는 이미지 상의 텍스트에 대한 번역 결과를 제공하기 위한 방법으로서,A method for providing translation results for text on an image included in a web page, 사용자 단말 장치로부터 웹 페이지의 식별자를 수신하는 단계,Receiving an identifier of a web page from a user terminal device, 상기 식별자에 대응하는 웹 페이지에 포함되어 있는 적어도 하나의 이미지를 획득하는 단계,Obtaining at least one image included in a web page corresponding to the identifier, 상기 적어도 하나의 이미지 상의 텍스트에 대한 판독 결과를 획득하는 단계, 및Obtaining a reading result on text on the at least one image, and 상기 판독된 텍스트에 대한 번역 결과를 획득하는 단계Obtaining a translation result for the read text 를 포함하는 방법.How to include. 제7항에 있어서,The method of claim 7, wherein 상기 식별자는 URL인 방법.The identifier is a URL. 제7항에 있어서,The method of claim 7, wherein 상기 웹 페이지 식별자 수신 단계는, 개방형 API를 통해 수행되는 방법.Receiving the web page identifier is performed through an open API. 제7항에 있어서,The method of claim 7, wherein 상기 판독 결과 획득 단계는, 상기 적어도 하나의 이미지 상의 텍스트를 기계로 판독 가능한 형태로 변환하는 단계를 포함하는 방법.And obtaining the read result comprises converting text on the at least one image into a machine readable form. 제10항에 있어서,The method of claim 10, 상기 기계로 판독 가능한 형태로 변환된 텍스트는 XML 또는 HTML로 표현되는 방법.Text converted into the machine-readable form is represented in XML or HTML. 제7항에 있어서,The method of claim 7, wherein 상기 획득된 번역 결과를 전송하는 단계를 더 포함하는 방법.Transmitting the obtained translation result. 웹 페이지에 포함되어 있는 이미지로부터 문자 및/또는 기호를 판독하기 위한 시스템으로서,A system for reading characters and / or symbols from an image contained in a web page, 사용자 단말 장치로부터 수신된 식별자에 대응하는 웹 페이지에 포함되어 있는 적어도 하나의 이미지 상의 문자 및/또는 기호에 대한 판독 결과를 획득하는 개방형 API 서비스 게이트웨이,An open API service gateway that obtains a reading result of characters and / or symbols on at least one image included in a web page corresponding to an identifier received from a user terminal device, 상기 개방형 API 서비스 게이트웨이의 요청에 따라 상기 식별자에 대응하는 웹 페이지를 검색하여 제공하는 웹 서버, 및A web server for searching and providing a web page corresponding to the identifier according to a request of the open API service gateway; 상기 개방형 API 서비스 게이트웨이의 요청에 따라 상기 웹 페이지에 포함되어 있는 적어도 하나의 이미지 상의 문자 및/또는 기호에 대한 판독 결과를 제공하는 판독 서버A read server that provides read results for characters and / or symbols on at least one image included in the web page at the request of the open API service gateway 를 포함하는 시스템.System comprising a. 제13항에 있어서,The method of claim 13, 상기 식별자는 URL인 시스템.The identifier is a URL. 제13항에 있어서,The method of claim 13, 상기 사용자 단말 장치로부터의 식별자를 상기 개방형 API 서비스 게이트웨이에 전송하는 응용 서버를 더 포함하는 시스템.And an application server for transmitting the identifier from the user terminal device to the open API service gateway. 제15항에 있어서,The method of claim 15, 상기 응용 서버와 상기 개방형 API 서비스 게이트웨이 간의 통신은 개방형 API를 통해 이루어지는 시스템.The communication between the application server and the open API service gateway is via an open API. 제13항에 있어서,The method of claim 13, 상기 개방형 API 서비스 게이트웨이는,The open API service gateway, 상기 식별자에 대응하는 웹 페이지에 대한 정보를 요청하여 획득하는 웹 페이지 정보 획득부, 및A web page information acquisition unit for requesting and obtaining information on a web page corresponding to the identifier, and 상기 웹 페이지에 포함되어 있는 적어도 하나의 이미지에 대한 문자 및/또는 기호의 판독을 요청하여 판독된 결과를 획득하는 판독 결과 획득부A reading result obtaining unit which requests reading of characters and / or symbols of at least one image included in the web page to obtain a read result 를 포함하는 시스템.System comprising a. 제13항에 있어서,The method of claim 13, 상기 판독 서버는,The read server, 상기 웹 페이지에 포함되어 있는 적어도 하나의 이미지를 인식하고, 상기 적어도 하나의 인식된 이미지를 분석하는 이미지 인식 및 분석부,An image recognition and analysis unit which recognizes at least one image included in the web page and analyzes the at least one recognized image; 상기 적어도 하나의 분석된 이미지에 포함되어 있는 문자 및/또는 기호를 추출하여 이를 기계로 판독 가능한 문자 및/또는 기호로 변환하는 문자/기호 변환부, 및A character / symbol converter for extracting characters and / or symbols included in the at least one analyzed image and converting the characters and / or symbols into machine-readable characters and / or symbols; 상기 변환된 문자 및/또는 기호를 마크업 언어의 형태로 변환하는 마크업 언어 변환부Markup language conversion unit for converting the converted characters and / or symbols into the form of a markup language 를 포함하는 시스템.System comprising a. 제18항에 있어서,The method of claim 18, 상기 마크업 언어는 XML 또는 HTML인 시스템.The markup language is XML or HTML. 제13항에 있어서,The method of claim 13, 상기 판독 결과에 기초한 번역 결과를 제공하는 번역 서비스 제공 서버를 더 포함하는 시스템. And a translation service providing server for providing a translation result based on the reading result. 제1항 내지 제12항 중 어느 한 항에 따른 방법을 실행하기 위한 컴퓨터 프로그램을 기록하는 컴퓨터 판독 가능한 기록 매체.A computer-readable recording medium for recording a computer program for executing the method according to any one of claims 1 to 12.
KR1020080033923A 2008-04-11 2008-04-11 Method, apparatus and computer-readable recording medium for reading text on image contained in web page and providing translation service on same text KR100953627B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020080033923A KR100953627B1 (en) 2008-04-11 2008-04-11 Method, apparatus and computer-readable recording medium for reading text on image contained in web page and providing translation service on same text

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020080033923A KR100953627B1 (en) 2008-04-11 2008-04-11 Method, apparatus and computer-readable recording medium for reading text on image contained in web page and providing translation service on same text

Publications (2)

Publication Number Publication Date
KR20090108485A true KR20090108485A (en) 2009-10-15
KR100953627B1 KR100953627B1 (en) 2010-04-20

Family

ID=41551866

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080033923A KR100953627B1 (en) 2008-04-11 2008-04-11 Method, apparatus and computer-readable recording medium for reading text on image contained in web page and providing translation service on same text

Country Status (1)

Country Link
KR (1) KR100953627B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200009205A (en) * 2018-07-18 2020-01-30 네이버 주식회사 Method for proving translation service and terminal device using the same

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002108855A (en) * 2000-09-29 2002-04-12 Brother Ind Ltd Document processor
KR100811407B1 (en) * 2001-12-31 2008-03-10 주식회사 케이티 Apparatus and method for UMS hosting service with open API technologies
JP4048188B2 (en) 2004-06-07 2008-02-13 株式会社インパルスジャパン WEB page translation apparatus and WEB page translation method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200009205A (en) * 2018-07-18 2020-01-30 네이버 주식회사 Method for proving translation service and terminal device using the same

Also Published As

Publication number Publication date
KR100953627B1 (en) 2010-04-20

Similar Documents

Publication Publication Date Title
US6988100B2 (en) Method and system for extending the performance of a web crawler
CN1114168C (en) Www addressing
KR100936204B1 (en) Copy and paste processing method, apparatus, and storage medium
US7496497B2 (en) Method and system for selecting web site home page by extracting site language cookie stored in an access device to identify directional information item
US6564254B1 (en) System and a process for specifying a location on a network
CN100367299C (en) Image processing device, image processing method, and storage medium storing program therefor
KR100907671B1 (en) How to Edit Recording Media and Character Input
US20080281577A1 (en) Language Identification Equipment, Translation Equipment, Translation Server, Language Identification Method, and Translation Processing Method
US20060230100A1 (en) Web content transcoding system and method for small display device
KR101015234B1 (en) Method, system and computer-readable recording medium for providing web contents by translating one language included therein into the other language
KR100956087B1 (en) Computer readable recoding medium, character inputting and editing method, server apparatus, and server
JP2004530959A (en) System and method for delivering content to mobile device
CN101388011A (en) Method and apparatus for recording information into user thesaurus
MXPA04001729A (en) Methods and systems for language translation.
US20090313536A1 (en) Dynamically Providing Relevant Browser Content
JP2007528520A (en) Method and system for managing websites registered with search engines
KR20120025066A (en) Web browsing system and method for rendering dynamic resource uri of script
KR20100045337A (en) Method, system and computer-readable recording medium for providing the translated comics contents, and exposing the translated comics contents for retrieval
KR20090130364A (en) Method, apparatus and computer-readable recording medium for tagging image contained in web page and providing web search service using tagged result
KR100940365B1 (en) Method, apparatus and computer-readable recording medium for tagging image contained in web page and providing web search service using tagged result
KR100953627B1 (en) Method, apparatus and computer-readable recording medium for reading text on image contained in web page and providing translation service on same text
KR102244668B1 (en) System and method for automatically inputting personal information using codes
US20020007382A1 (en) Computer having character input function,method of carrying out process depending on input characters, and storage medium
JP5565197B2 (en) Web application linkage method, linkage apparatus, and linkage program
KR100516302B1 (en) Method And System For Handling Wrongly Inputted Internet Address

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130329

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20160329

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20170328

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20190401

Year of fee payment: 10