KR20090108485A - Method, apparatus and computer-readable recording medium for reading text on image contained in web page and providing translation service on same text - Google Patents
Method, apparatus and computer-readable recording medium for reading text on image contained in web page and providing translation service on same text Download PDFInfo
- Publication number
- KR20090108485A KR20090108485A KR1020080033923A KR20080033923A KR20090108485A KR 20090108485 A KR20090108485 A KR 20090108485A KR 1020080033923 A KR1020080033923 A KR 1020080033923A KR 20080033923 A KR20080033923 A KR 20080033923A KR 20090108485 A KR20090108485 A KR 20090108485A
- Authority
- KR
- South Korea
- Prior art keywords
- web page
- text
- identifier
- translation
- image
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
- G06V20/63—Scene text, e.g. street names
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
Abstract
Description
본 발명은 웹 페이지에 포함되는 이미지 상의 텍스트를 판독하고 이에 대한 번역 서비스를 제공하기 위한 방법, 장치 및 컴퓨터 판독 가능한 기록 매체에 관한 것으로서, 보다 상세하게는, 사용자가 URL(Uniform Resource Locator) 등과 같은 웹 페이지 식별자를 입력하는 경우, 해당 식별자에 대응하는 웹 페이지를 검색하고, 해당 웹 페이지에 포함되어 있는 이미지 상의 텍스트를 판독하며, 판독된 텍스트에 대한 번역 서비스를 제공함으로써, 사용자의 편의를 증대시키는 방법, 장치 및 컴퓨터 판독 가능한 기록 매체에 관한 것이다.The present invention relates to a method, an apparatus and a computer readable recording medium for reading a text on an image included in a web page and providing a translation service thereto. When the web page identifier is input, the web page corresponding to the identifier is searched, the text on the image included in the web page is read, and the translation service for the read text is provided, thereby increasing the user's convenience. A method, apparatus and computer readable recording medium.
근래에 들어, 인터넷 사용이 보편화되면서 사용자들은 인터넷 검색을 통하여 다양한 정보를 획득할 수 있게 되었다. 즉, 사용자들은 인터넷에의 접속이 가능한 개인용 컴퓨터 등의 단말 장치를 통해 인터넷 검색 사이트에 접속한 후, 뉴스, 지식, 게임, 커뮤니티 등과 관련된 각종 컨텐츠를 검색할 수 있게 되었다.In recent years, as the use of the Internet has become more common, users can obtain various information through Internet searches. That is, after accessing an Internet search site through a terminal device such as a personal computer that can access the Internet, users can search for various contents related to news, knowledge, games, communities, and the like.
사용자들은 인터넷 검색을 수행하거나, 원하는 웹 페이지나 파일 등에 대한 정보를 획득하기 위해 Internet ExplorerTM, NetscapeTM, LynxTM 등과 같은 웹 브라우저를 기동시키고, 웹 브라우저의 주소창에 URL 등과 같은 식별자를 입력함으로써, 해당 식별자에 대응하는 웹 페이지 또는 파일을 제공 받게 된다.By users enter an identifier, such as performing, or any web page or in order to obtain information about the file, Internet Explorer TM, Netscape TM, activates a Web browser such as Lynx TM, URL into the address bar of your Web browser to search the Internet, A web page or file corresponding to the identifier is provided.
그런데, 이렇게 제공되는 웹 페이지에는 이미지가 포함되어 있을 수 있고, 그 이미지에는 하나 이상의 문자 또는 기호가 포함되어 있을 수 있다. 그러나, 사용자가 해당 이미지에 포함된 문자 또는 기호를 바로 편집 가능한 형태로 판독하여 이를 이용할 수 없다는 문제점이 있었다.However, the provided web page may include an image, and the image may include one or more characters or symbols. However, there has been a problem that a user cannot read and use a character or a symbol included in the image in an editable form immediately.
한편, 본 출원인의 저명 포털 사이트인 네이버TM(www.naver.com)에서 제공하는 '일본어 번역기'와 같은 번역 서비스 제공 수단에서는, 사용자가 번역을 원하는 웹 페이지의 URL을 입력하면, 해당 URL에 대응하는 웹 페이지에 포함되는 텍스트를 번역하여, 번역한 결과가 반영된 웹 페이지를 제공하는 방식을 채택하고 있다. 그러나, 여기에서는 해당 웹 페이지의 텍스트만을 번역해 줄 뿐이기 때문에, 웹 페이지에 포함되어 있는 이미지에 문자 또는 기호로 이루어진 텍스트가 포함되어 있을지라도 사용자가 이에 대해서는 번역 서비스를 제공 받지 못하는 문제가 있었다.On the other hand, in a translation service providing means such as 'Japanese translator' provided by Naver TM (www.naver.com), which is the prominent portal site of the applicant, when a user inputs a URL of a web page to be translated, the corresponding URL is A method of translating text included in a web page to provide a web page reflecting the translated result is adopted. However, since only the text of the web page is translated here, the user may not be provided with a translation service even if the image included in the web page includes text composed of letters or symbols.
따라서, 웹 페이지에 포함되어 있는 이미지 상의 문자 또는 기호를 편집 가능한 형태로 이용할 수 있도록 하는 한편, 이미지 상의 텍스트도 번역하여 제공하는 기술이 필요한 실정이다.Therefore, there is a need for a technology for providing a text or a symbol on an image included in a web page in an editable form, and also translating and providing text on the image.
이상의 문제점을 해결하기 위하여, 근래에 널리 이용되고 있는 OCR(Optical Character Recognition) 등과 같은 문자 판독 기술이 고려될 수 있다. 문자 판독 기술은 이미지에 포함된 문자 또는 기호를 기계로 판독 가능한 형태로 (예를 들면, 편집 가능한 형태로) 변환하는 기술이다. 그러나, 현재 존재하는 문자 판독 기술을 이용하는 경우에도, 앞서 설명한 바와 같은 이미지로부터의 문자·기호의 판독이나 이미지 상의 텍스트의 번역 등과 같은 서비스를 위해서는, 문자 판독 장치나 번역 장치 등과 같은 고가의 장치가 각각 구비되어 있어야 하며, 이에 따른 시스템의 구축 및 유지/보수와 같은 관리 부담 역시 적지 않다.In order to solve the above problems, a character reading technique such as OCR (Optical Character Recognition), which is widely used in recent years, may be considered. Character reading technology is a technique for converting characters or symbols included in an image into a machine-readable form (eg, in an editable form). However, even in the case of using the existing character reading technology, expensive devices such as a character reading device or a translation device may be used for services such as the reading of characters and symbols from an image as described above and the translation of text on the image. It should be equipped, and the management burden such as the construction and maintenance of the system accordingly is not small.
따라서, 웹 페이지에 포함되어 있는 이미지에 대한 문자 또는 기호를 판독하여 이를 기계 판독 가능한 형태로 제공하고, 판독된 문자 또는 기호로 이루어진 텍스트에 대하여 번역 서비스를 제공하되, 적은 비용만을 사용하여도 시스템의 구축 및 유지/보수가 가능하도록 하는 기술을 개발하는 것이 급선무이다.Therefore, by reading the characters or symbols for the image included in the web page and providing them in a machine-readable form, and providing a translation service for the text consisting of the read characters or symbols, even if using a small cost of the system It is imperative to develop a technology that enables deployment and maintenance.
본 발명은 상술한 문제점을 모두 해결하는 것을 그 목적으로 한다.The object of the present invention is to solve all the above-mentioned problems.
또한, 본 발명은 사용자가 URL 등의 식별자를 입력하는 경우, 해당 URL에 대응하는 웹 페이지에 포함되어 있는 이미지 상의 문자 또는 기호를 판독하여 이러한 문자 또는 기호를 기계 판독 가능한 형태로 제공함으로써, 사용자의 웹 페이지의 활용도를 높이는 것에 그 목적이 있다.In addition, when the user inputs an identifier such as a URL, the present invention reads a character or symbol on an image included in a web page corresponding to the URL and provides the character or symbol in a machine-readable form, thereby providing The purpose is to increase the utilization of web pages.
그리고, 본 발명은 판독된 문자 및/또는 기호로 이루어진 텍스트에 대한 번역 서비스를 제공함으로써, 이미지로 표현된 텍스트에 대하여도 번역 서비스를 제공하는 것에 그 목적이 있다.Another object of the present invention is to provide a translation service for text represented by an image by providing a translation service for text composed of read characters and / or symbols.
또한, 본 발명은 개방형 API(Application Program Interface)를 이용하여 웹 페이지에 포함되어 있는 이미지 상의 텍스트를 판독하고 이에 대한 번역 서비스를 제공함으로써, 서비스 제공을 위한 시스템 구축 및 유지/보수에 따른 부담을 최소화시키는 데에 그 목적이 있다.In addition, the present invention by using an open API (Application Program Interface) to read the text on the image included in the web page and provides a translation service for this, thereby minimizing the burden of building and maintaining the system for service provision The purpose is to make it.
상기 목적을 달성하기 위한 본 발명의 대표적인 구성은 다음과 같다.Representative configuration of the present invention for achieving the above object is as follows.
본 발명의 일 태양에 따르면, 웹 페이지에 포함되어 있는 이미지로부터 문자 및/또는 기호를 판독하기 위한 방법으로서, 사용자 단말 장치로부터 웹 페이지의 식별자를 수신하는 단계, 상기 식별자에 대응하는 웹 페이지에 포함되어 있는 적어도 하나의 이미지를 획득하는 단계, 및 상기 적어도 하나의 이미지 상의 문자 및/ 또는 기호에 대한 판독 결과를 획득하는 단계를 포함하는 방법이 제공된다.According to an aspect of the present invention, a method for reading text and / or symbols from an image included in a web page, the method comprising: receiving an identifier of a web page from a user terminal device, the web page corresponding to the identifier included in the web page; Obtaining at least one image, and obtaining a reading result for the character and / or symbol on the at least one image.
본 발명의 다른 태양에 따르면, 웹 페이지에 포함되어 있는 이미지 상의 텍스트에 대한 번역 결과를 제공하기 위한 방법으로서, 사용자 단말 장치로부터 웹 페이지의 식별자를 수신하는 단계, 상기 식별자에 대응하는 웹 페이지에 포함되어 있는 적어도 하나의 이미지를 획득하는 단계, 상기 적어도 하나의 이미지 상의 텍스트에 대한 판독 결과를 획득하는 단계, 및 상기 판독된 텍스트에 대한 번역 결과를 획득하는 단계를 포함하는 방법이 제공된다.According to another aspect of the present invention, a method for providing a translation result for text on an image included in a web page, the method comprising: receiving an identifier of a web page from a user terminal device, the web page corresponding to the identifier included in the web page; Obtaining at least one image that is intended, obtaining a read result for the text on the at least one image, and obtaining a translation result for the read text.
본 발명의 또 다른 태양에 따르면, 웹 페이지에 포함되어 있는 이미지로부터 문자 및/또는 기호를 판독하기 위한 시스템으로서, 사용자 단말 장치로부터 수신된 식별자에 대응하는 웹 페이지에 포함되어 있는 적어도 하나의 이미지 상의 문자 및/또는 기호에 대한 판독 결과를 획득하는 개방형 API 서비스 게이트웨이, 상기 개방형 API 서비스 게이트웨이의 요청에 따라 상기 식별자에 대응하는 웹 페이지를 검색하여 제공하는 웹 서버, 및 상기 개방형 API 서비스 게이트웨이의 요청에 따라 상기 웹 페이지에 포함되어 있는 적어도 하나의 이미지 상의 문자 및/또는 기호에 대한 판독 결과를 제공하는 판독 서버를 포함하는 시스템이 제공된다.According to another aspect of the invention, a system for reading text and / or symbols from an image included in a web page, the system comprising: at least one image on a web page corresponding to an identifier received from a user terminal device; An open API service gateway for obtaining a read result of a character and / or symbol, a web server for searching and providing a web page corresponding to the identifier according to a request of the open API service gateway, and a request of the open API service gateway Accordingly, a system is provided that includes a reading server that provides reading results for characters and / or symbols on at least one image included in the web page.
이 외에도, 본 발명에 따르면 웹 페이지에 포함되어 있는 이미지 상의 텍스트를 판독하고 이에 대한 번역 서비스를 제공하기 위한 다른 방법, 시스템, 및 상기 방법들을 실행하기 위한 컴퓨터 프로그램을 기록하는 컴퓨터 판독 가능한 기록 매체가 더 제공된다.In addition, according to the present invention there is provided a computer readable recording medium for recording another method, system for reading text on an image included in a web page and providing a translation service therefor, and a computer program for executing the methods. More is provided.
본 발명에 의하면, 사용자가 URL과 같은 식별자를 입력하는 등의 간단한 조작만으로도 해당 웹 페이지에 포함되어 있는 이미지 상의 문자 또는 기호에 대한 판독 결과를 제공 받을 수 있게 되므로, 사용자 편의가 증대되는 효과가 있다.According to the present invention, the user can be provided with a read result of a character or a symbol on an image included in the web page by a simple operation such as inputting an identifier such as a URL, thereby increasing user convenience. .
또한, 본 발명에 의하면, 웹 페이지에 포함되어 있는 이미지 상의 텍스트에 대하여도 번역 서비스를 제공할 수 있게 되는 효과가 있다.In addition, according to the present invention, there is an effect that it is possible to provide a translation service for the text on the image included in the web page.
한편, 본 발명에 의하면, 개방형 API를 이용한 문자·기호의 판독 및 그 텍스트에 대한 번역이 가능해지기 때문에, 서비스 제공을 위한 시스템의 구축 및 유지/보수에 따른 부담이 최소화될 수 있게 되는 효과가 있다.On the other hand, according to the present invention, since it is possible to read the characters and symbols and the translation of the text using the open API, there is an effect that the burden due to the construction and maintenance of the system for providing the service can be minimized. .
후술하는 본 발명에 대한 상세한 설명은, 본 발명이 실시될 수 있는 특정 실시예를 예시로서 도시하는 첨부 도면을 참조한다. 이들 실시예는 당업자가 본 발명을 실시할 수 있기에 충분하도록 상세히 설명된다. 본 발명의 다양한 실시예는 서로 다르지만 상호 배타적일 필요는 없음이 이해되어야 한다. 예를 들어, 여기에 기재되어 있는 특정 형상, 구조 및 특성은 일 실시예에 관련하여 본 발명의 정신 및 범위를 벗어나지 않으면서 다른 실시예로 구현될 수 있다. 또한, 각각의 개시된 실시예 내의 개별 구성요소의 위치 또는 배치는 본 발명의 정신 및 범위를 벗어나지 않으면서 변경될 수 있음이 이해되어야 한다. 따라서, 후술하는 상세한 설명은 한정적인 의미로서 취하려는 것이 아니며, 본 발명의 범위는, 적절하게 설명된다면, 그 청구항들이 주장하는 것과 균등한 모든 범위와 더불어 첨부된 청구항에 의해서만 한정된다. 도면에서 유사한 참조부호는 여러 측면에 걸쳐서 동일하거나 유사한 기능을 지칭한다.DETAILED DESCRIPTION The following detailed description of the invention refers to the accompanying drawings that show, by way of illustration, specific embodiments in which the invention may be practiced. These embodiments are described in sufficient detail to enable those skilled in the art to practice the invention. It should be understood that the various embodiments of the present invention are different but need not be mutually exclusive. For example, certain shapes, structures, and characteristics described herein may be embodied in other embodiments without departing from the spirit and scope of the invention with respect to one embodiment. In addition, it is to be understood that the location or arrangement of individual components within each disclosed embodiment may be changed without departing from the spirit and scope of the invention. The following detailed description, therefore, is not to be taken in a limiting sense, and the scope of the present invention, if properly described, is defined only by the appended claims, along with the full range of equivalents to which such claims are entitled. Like reference numerals in the drawings refer to the same or similar functions throughout the several aspects.
이하, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명을 용이하게 실시할 수 있도록 하기 위하여, 본 발명의 바람직한 실시예들에 관하여 첨부된 도면을 참조하여 상세히 설명하기로 한다.Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings so that those skilled in the art can easily implement the present invention.
본 명세서에서 말하는 웹 페이지의 식별자는, 인터넷 또는 월드 와이드 웹(WWW; World Wide Web) 상에서 웹 페이지의 파일이 존재하는 위치를 지시하기 위한 지시자로서, 그 대표적인 예로 URL을 들 수 있다.The identifier of a web page as used herein is an indicator for indicating a location of a file of a web page on the Internet or the World Wide Web (WWW), and a representative example thereof may be a URL.
전체 시스템의 구성Configuration of the entire system
도 1은 본 발명의 일 실시예에 따라 특정 식별자를 갖는 웹 페이지에 포함되어 있는 이미지로부터 OCR 기술을 이용해 문자 또는 기호를 추출한 후, 이를 XML(eXtensible Markup Language) 또는 HTML(HyperText Markup Language) 등의 마크업 언어로 표현하여 제공하고 이에 대한 번역 서비스를 제공하기 위한 전체 시스템의 개략적인 구성도이다.FIG. 1 illustrates extracting a character or a symbol from an image included in a web page having a specific identifier using OCR technology, and then extracting the character or symbol from the image, such as XML (eXtensible Markup Language) or HTML (HyperText Markup Language). It is a schematic configuration diagram of the entire system for providing a markup language and providing a translation service.
도 1에 도시되어 있는 바와 같이 본 발명의 일 실시예에 따른 전체 시스템은, 인터넷, 응용 서버(100), 개방형 API(Open API; Open Application Program Interface) 서비스 게이트웨이(200), 웹 서버(300), 문자 판독 서버(또는, 문자/기호 판독 서버)(500), 번역 서비스 제공 서버(700), 및 사용자 단말 장치(900)로 구성될 수 있다.As shown in Figure 1, the entire system according to an embodiment of the present invention, the Internet,
먼저, 인터넷은 유선 및 무선 등과 같은 그 통신 양태를 가리지 않고 구성될 수 있으며, 근거리 통신망(LAN; Local Area Network), 도시권 통신망(MAN; Metropolitan Area Network), 광역 통신망(WAN; Wide Area Network) 등 다양한 통신망으로 구성될 수 있다. 바람직하게는, 본 발명에서 말하는 인터넷은 공지의 월드와이드웹(WWW; World Wide Web)일 수 있다.First, the Internet may be configured without regard to communication modes such as wired and wireless, and may include a local area network (LAN), a metropolitan area network (MAN), a wide area network (WAN), and the like. It can be configured with various communication networks. Preferably, the Internet referred to in the present invention may be a known World Wide Web (WWW).
응용 서버(100)는 인터넷을 통하여 사용자 단말 장치(900)와 통신을 수행하며, 개방형 API를 통해 개방형 API 서비스 게이트웨이(200)와 데이터 통신을 수행한다. 응용 서버(100)는, 사용자 단말 장치(900)로부터 웹 검색 서비스 요청, 문자 판독 서비스 요청 또는 번역 서비스 요청이 수신되면, 상기 요청을 개방형 API 서비스 게이트웨이(200)에 전송한다. 개방형 API 서비스 게이트웨이(200)는 상기 서비스 요청들을 웹 서버(300), 문자 판독 서버(500), 또는 번역 서비스 제공 서버(700)에 전송한다.The
개방형 API 서비스 게이트웨이(200)는 표준화된 개방형 API를 통해 응용 서버(100)와 데이터 통신을 수행한다. 한편, 전술한 바와 같이, 사용자 단말 장치(900)로부터의 서비스 요청을 수신하여, 이를 각 서버로 전송하는 기능 또한 수행한다. 구체적으로 설명하면, 개방형 API 서비스 게이트웨이(200)는 사용자 단말 장치(900)로부터 특정 식별자를 갖는 웹 페이지에 포함되어 있는 이미지에 대한 문자 판독 요청이 수신되면, 이러한 요청을 웹 서버(300) 및 문자 판독 서버(500)에 전송하여, 해당 식별자를 갖는 웹 페이지를 검색한 후에 그 웹 페이지에 포함되어 있는 이미지에 대한 문자 판독 처리를 할 수 있도록 한다. 또한, 개방형 API 서비스 게이트웨이(200)는 문자 판독 결과에 대하여 번역 서비스를 요청할 수도 있다.The open
웹 서버(300)는 통상의 웹 검색 서버와 동일한 구성요소로서, 사용자 단말 장치(900)에 의해 입력되는 식별자에 해당하는 웹 페이지를 검색하는 기능을 수행한다. 이러한 웹 서버(300)는 도 1에 도시되는 바와 같이 별도의 구성요소로 구비될 수도 있지만 생략될 수도 있는 구성요소인데, 이 경우 응용 서버(100)가 웹 서버 기능도 함께 수행할 수 있다.The
문자 판독 서버(500)는 사용자 단말 장치(900)에 의해 입력되는 식별자를 기초로 하여 웹 서버(300)에 의해 검색되는 웹 페이지에 포함되어 있는 이미지에 대한 문자 판독 처리를 수행한다. 웹 서버(300)에 의해 검색된 웹 페이지에 관한 정보가 개방형 API 서비스 게이트웨이(200)를 통해 문자 판독 서버(500)로 전송되면, 문자 판독 서버(500)는 해당 웹 페이지에 포함되어 있는 이미지를 인식한 후, 그 이미지에 대한 문자 판독을 수행한다. 한편, 문자 판독 서버(500)는 문자 판독 후에는 인식된 텍스트를 XML 또는 HTML 등의 마크업 언어 형태로 변환한 후 출력한다. 문자 판독 서버(500)는 웹 페이지에 포함되어 있는 이미지에 대해 문자 판독을 수행한 후, 그 처리 결과가 반영된 웹 페이지 자체를 제공할 수도 있고, 문자 판독이 수행된 이미지 파일에 대한 판독 결과만을 제공할 수도 있다. 한편, 문자 판독 서버(500)에 의한 문자 판독은 사람이 쓰거나 기계에 의해 인쇄된 문자의 이미지를 기계가 읽을 수 있는 문자로 변환하는 OCR 기술에 의해 수행될 수 있다. 이러한 문자 판독 서버(500)의 내부 구성과 그 동작에 대해서는 후에 상세히 설명하기로 한다.The
한편, 이러한 문자 판독에 있어서는 문자 판독 데이터베이스(600)가 참조될 수 있다. 구체적으로 설명하면, 문자 판독 데이터베이스(600)에는 각종 이미지에 포함되거나 포함되어 있을 가능성이 있는 것으로 판단되는 다양한 문자, 기호 등이 저장되어 있을 수 있다. 또한, 문자 판독 데이터베이스(600)에는 해당 이미지에 포함되어 있는 문자에 대한 언어, 폰트(font) 등에 관한 정보가 저장되어 있을 수 있다. 문자 판독 서버(500)는 이러한 정보를 참조하여, 웹 페이지에 포함되어 있는 이미지에 대한 문자 판독을 수행하게 된다. 비록 도 1에서는 문자 판독 데이터베이스(600)가 문자 판독 서버(500)와 별개로 구성되는 것으로 도시되지만, 본 발명을 구현하는 당업자의 필요에 따라, 문자 판독 데이터베이스(600)는 문자 판독 서버(500)에 포함되어 구성될 수도 있다.On the other hand, in the character reading, the
번역 서비스 제공 서버(700)는 문자 판독 서버(500)에 의해 문자 판독이 수행되어 마크업 언어로 변환된 텍스트에 대한 번역 서비스를 제공할 수 있다. 문자 판독 서버(500)에 의해 출력되는 마크업 언어 형태의 텍스트를 포함하는 웹 페이지에 관한 정보는 개방형 API 서비스 게이트웨이(200)를 통해 번역 서비스 제공 서버(700)로 전송된다. 번역 서비스 제공 서버(700)는 해당 웹 페이지에 포함되는 텍스트에 대해 번역을 수행한다. 예를 들어, 해당 웹 페이지에 포함되는 텍스트가 외국어(예를 들면, 영어 또는 일어)인 경우에는, 이러한 외국어 텍스트를 한국어로 번역하여 출력할 수도 있고, 반대로 한국어 텍스트를 외국어로 번역하여 출력할 수도 있다. 이러한 번역 서비스 제공 서버(700)의 내부 구성과 그 동작에 대해서는 후에 상세히 설명하기로 한다.The translation
한편, 이러한 번역 서비스 제공 서버(700)에 의한 번역에 있어서는 번역 데이터베이스(800)가 참조될 수 있다. 구체적으로 설명하면, 번역 데이터베이 스(800)에는 해당 텍스트에 대응하거나 대응하고 있을 가능성이 있는 것으로 판단되는 한국어 또는 외국어 텍스트가 저장되어 있을 수 있고, 번역 서비스 제공 서버(700)는 이러한 정보를 참조하여, 웹 페이지에 포함되는 텍스트에 대한 번역을 수행하게 된다. 비록 도 1에서는 번역 데이터베이스(800)가 번역 서비스 제공 서버(700)와 별개로 구성되는 것으로 도시되지만, 본 발명을 구현하는 당업자의 필요에 따라, 번역 데이터베이스(800)는 번역 서비스 제공 서버(700)에 포함되어 구성될 수도 있다.Meanwhile, the
그리고, 사용자 단말 장치(900)는 사용자가 인터넷을 통하여 응용 서버(100)에 접속한 후 통신할 수 있도록 하는 기능을 포함하는 디지털 기기로서, 개인용 컴퓨터(예를 들어, 데스크탑 컴퓨터, 노트북 컴퓨터 등), 워크스테이션, PDA, 웹 패드, 이동 전화기 등과 같이 메모리 수단을 구비하고 마이크로 프로세서를 탑재하여 연산 능력을 갖춘 디지털 기기라면 얼마든지 본 발명에 따른 사용자 단말 장치(900)로서 채택될 수 있다.In addition, the
사용자는 사용자 단말 장치(900)를 통해 웹 검색이 가능한 웹 브라우저를 실행시켜 검색하고자 하는 웹 페이지의 식별자를 입력할 수 있다. 이렇게 입력되는 식별자는 응용 서버(100)를 통해 개방형 API 서비스 게이트웨이(200)로 전해지고, 웹 서버(300)에 의해 해당 식별자를 갖는 웹 페이지가 검색되며, 문자 판독 서버(500) 및 번역 서비스 제공 서버(700)에 의해 해당 웹 페이지에 포함되는 이미지에 대한 문자 판독 및 이에 따른 번역이 행해진다. 검색되는 웹 페이지에 대한 정보, 문자 판독 결과, 및 번역 결과는 다시 개방형 API 서비스 게이트웨이(200) 및 응용 서버(100)를 통해 사용자 단말 장치(900)로 전송되고, 사용자는 이를 통해 특정 식별자를 갖는 웹 페이지에 포함되어 있는 이미지에 대한 문자 판독 및 번역 서비스를 제공 받을 수 있게 된다. 한편, 사용자는 웹 페이지의 식별자를 입력할 때에 번역 서비스를 제공 받을지 여부를 선택할 수 있다. 사용자가 번역 서비스를 제공 받기를 원하지 않는 경우에는 문자 판독 서버(500)에 의해 문자 판독된 결과만이 개방형 API 서비스 게이트웨이(200) 및 응용 서버(100)를 통해 사용자에게 제공되고, 사용자가 번역 서비스를 제공 받기를 원하는 경우에는 번역 서비스 제공 서버(700)에 의해 번역된 결과가 제공될 수 있다.The user may input a identifier of a web page to be searched by executing a web browser capable of web search through the
개방형 Open APIAPI 서비스 게이트웨이의 구성 Configuration of the Services Gateway
이하에서는, 본 발명의 일 실시예에 따른 개방형 API 서비스 게이트웨이(200)의 내부 구성 및 각 구성요소의 기능에 대하여 살펴보기로 한다.Hereinafter, the internal configuration of the open
도 2는 본 발명의 일 실시예에 따른 개방형 API 서비스 게이트웨이(200)의 내부 구성을 상세하게 도시한 도면이다. 도 2를 참조하면, 본 발명의 일 실시예에 따른 개방형 API 서비스 게이트웨이(200)는 제어부(210), 통신부(220), 웹 페이지 정보 획득부(230), 문자 판독 결과 획득부(240), 번역 결과 획득부(250), 및 메모리부(270)로 구성될 수 있다.2 is a diagram illustrating in detail the internal configuration of the open
본 발명의 일 실시예에 따르면, 상기 각 구성요소들은 데이터 통신이 가능한 소정의 프로그램 모듈들일 수 있다. 이러한 프로그램 모듈들은 운영 시스템, 응용 프로그램 모듈 및 기타 프로그램 모듈의 형태로 개방형 API 서비스 게이트웨이(200)에 포함될 수 있으며, 물리적으로는 여러 가지 공지의 기억 장치 상에 저장 될 수 있다. 또한, 이러한 프로그램 모듈들은 개방형 API 서비스 게이트웨이(200)와 통신 가능한 원격 기억 장치에 저장될 수도 있다. 한편, 이러한 프로그램 모듈들은 본 발명에 따라 후술할 특정 업무를 수행하거나 특정 추상 데이터 유형을 실행하는 루틴, 서브루틴, 프로그램, 오브젝트, 컴포넌트, 데이터 구조 등을 포괄하지만, 이에 제한되지는 않는다.According to an embodiment of the present invention, each of the components may be predetermined program modules capable of data communication. Such program modules may be included in the open
먼저, 제어부(210)는 개방형 API 서비스 게이트웨이(200)의 전반적인 동작을 제어하며, 본 발명의 일 실시예에 따라, 응용 서버(100)의 요청에 응하여 특정 식별자를 갖는 웹 페이지에 대한 검색 요청, 해당 웹 페이지에 포함되어 있는 이미지에 대한 문자 판독 요청 또는 이에 대한 번역 요청에 따른 정보의 획득, 문자 판독 결과의 획득, 번역 결과의 획득을 제어한다.First, the
통신부(220)는 제어부(210)의 제어에 따라 개방형 API를 이용한 응용 서버(100)와의 데이터 통신과, 웹 서버(300), 문자 판독 서버(500) 및 번역 서비스 제공 서버(700)와의 데이터 통신을 수행한다.The
웹 페이지 정보 획득부(230)는 사용자 단말 장치(900)를 사용하는 사용자에 의해 입력되어 응용 서버(100)를 통해 수신된 웹 페이지 식별자에 관한 정보를 검출한 후, 제어부(210)의 제어에 따라 해당 식별자에 관한 정보를 웹 서버(300)에 전송한다. 웹 서버(300)가 상기 식별자에 관한 정보를 수신한 후, 해당 식별자에 대응하는 웹 페이지를 검색하고, 검색된 웹 페이지에 관한 정보를 개방형 API 서비스 게이트웨이(200)로 제공하면, 웹 페이지 정보 획득부(230)는 검색된 웹 페이지에 관한 정보를 수신하게 된다. 한편, 본 발명의 다른 실시예에 따라, 웹 서 버(300)의 기능을 응용 서버(100)가 대신하는 경우에는, 개방형 API 서비스 게이트웨이(200)는 사용자가 입력한 식별자에 대응하는 웹 페이지에 관한 정보를 응용 서버(100)로부터 개방형 API를 통해 바로 수신할 수도 있다.The web page
문자 판독 결과 획득부(240)는 제어부(210)의 제어에 따라 웹 페이지 정보 획득부(230)가 획득한 웹 페이지에 관한 정보를 문자 판독 서버(500)로 전송한다. 그 후, 문자 판독 서버(500)가 상기 웹 페이지에 포함되어 있는 이미지에 대한 문자 판독 결과를 제공하면, 문자 판독 결과 획득부(240)는 해당 웹 페이지에 대한 문자 판독 결과를 수신한다. 전술한 바와 같이, 문자 판독 결과 획득부(240)가 수신하는 문자 판독 결과는 XML 또는 HTML 등의 마크업 언어로 변환된 웹 페이지의 형태일 수도 있고, 해당 웹 페이지에 포함되어 있는 이미지 파일만에 대한 문자 판독 결과일 수도 있다. 획득된 문자 판독 결과를 포함하는 웹 페이지에 대한 정보, 또는 이미지 파일만에 대한 문자 판독 결과는 제어부(210)의 제어에 따라 통신부(220)를 통해 응용 서버(100)로 전송될 수 있고, 사용자 단말 장치(900)는 응용 서버(100)로부터 상기 문자 판독 결과를 수신할 수 있다.The character reading
한편, 문자 판독 결과 획득부(240)에 의해 획득된 문자 판독 결과는 번역 서비스 제공을 위해 번역 서비스 제공 서버(700)로 전송될 수도 있다. 문자 판독 결과 획득부(240)에 의해 획득된 문자 판독 결과를 응용 서버(100)로 전송할지, 번역 서비스 제공 서버(700)로도 전송할지 여부는 사용자에 의해 선택적으로 결정될 수 있다. 구체적으로 설명하면, 사용자가 사용자 단말 장치(900)를 통해 식별자를 입력할 때, 번역 서비스를 제공 받을지 여부를 결정하여 그 요청을 전송할 수 있는 데, 사용자가 번역 서비스 제공을 원하지 않을 시에는 제어부(210)의 제어에 의해 문자 판독 결과 획득부(240)에 의해 획득된 문자 판독 결과가 응용 서버(100)에만 전송되며, 반대의 경우에는 문자 판독 결과가 번역 서비스 제공 서버(700)로도 전송될 수 있다.Meanwhile, the text reading result obtained by the text reading
번역 결과 획득부(250)는 제어부(210)의 제어에 따라 문자 판독 결과 획득부(230)가 획득한 문자 판독 결과를 번역 서비스 제공 서버(700)로 전송한다. 번역 서비스 제공 서버(700)에 의해 판독된 텍스트에 대한 번역이 이루어지고, 번역 결과 획득부(250)는 번역 결과를 획득한다. 수신된 번역 결과 또는 번역 결과가 반영된 웹 페이지에 대한 정보는 제어부(210)의 제어에 따라 통신부(220)를 통해 응용 서버(100)로 전송되고, 사용자 단말 장치(900)는 응용 서버(100)를 통해 번역 결과 또는 번역 결과가 반영된 웹 페이지를 수신할 수 있다.The translation
메모리부(270)는 개방형 API 서비스 게이트웨이(200)의 동작에 필요한 프로그램들을 저장한다. 또한, 메모리부(270)는 웹 페이지 정보 획득부(230), 문자 판독 결과 획득부(240), 및 번역 결과 획득부(250)에 의해 획득된 정보들을 임시 저장한다.The
문자 판독 서버의 구성Configure the Character Read Server
이하에서는, 본 발명의 일 실시예에 따른 문자 판독 서버(500)의 내부 구성 및 각 구성요소의 기능에 대하여 살펴보기로 한다.Hereinafter, the internal structure of the
도 3은 본 발명의 일 실시예에 따른 문자 판독 서버(500)의 내부 구성을 상세하게 도시한 도면이다. 도 3을 참조하면, 본 발명의 일 실시예에 따른 문자 판 독 서버(500)는, 제어부(510), 통신부(520), 이미지 인식 및 분석부(530), 문자/기호 변환부(540), 마크업 언어 변환부(550)로 구성될 수 있다.3 is a diagram illustrating in detail the internal configuration of the
본 발명의 일 실시예에 따르면, 상기 구성요소들은 데이터 통신이 가능한 소정의 프로그램 모듈들일 수 있다. 이러한 프로그램 모듈들은 운영 시스템, 응용 프로그램 모듈 및 기타 프로그램 모듈의 형태로 문자 판독 서버(500)에 포함될 수 있으며, 물리적으로는 여러 가지 공지의 기억 장치 상에 저장될 수 있다. 또한, 이러한 프로그램 모듈들은 문자 판독 서버(500)와 통신 가능한 원격 기억 장치에 저장될 수도 있다. 한편, 이러한 프로그램 모듈들은 본 발명에 따라 후술할 특정 업무를 수행하거나 특정 추상 데이터 유형을 실행하는 루틴, 서브루틴, 프로그램, 오브젝트, 컴포넌트, 데이터 구조 등을 포괄하지만, 이에 제한되지는 않는다.According to an embodiment of the present invention, the components may be predetermined program modules capable of data communication. Such program modules may be included in the
제어부(510)는 문자 판독 서버(500)의 전반적인 동작을 제어하며, 특히, 개방형 API 서비스 게이트웨이(200)의 요청에 대해 소정 웹 페이지에 포함되어 있는 이미지에 대한 문자 판독을 수행한 후, 그 결과를 제공하는 동작을 제어한다.The
통신부(520)는 문자 판독 서버(500)와 개방형 API 서비스 게이트웨이(200) 간의 통신을 수행한다. 통신부(520)는 개방형 API 서비스 게이트웨이(200)로부터 소정 웹 페이지에 대한 정보를 수신하고, 해당 웹 페이지에 포함되어 있는 이미지에 대해 문자 판독된 결과를 XML 또는 HTML 등의 마크업 언어의 형태로 전송한다.The
이미지 인식 및 분석부(530)는 통신부(520)에 의해 수신된, 웹 페이지에 포함되어 있는 이미지를 인식하여 이를 공지의 이미지 분석 알고리즘에 의하여 분석한다. 이와 관련하여, 본 발명이 속하는 기술분야의 당업자는 공지된 기술 문헌인 한국정보과학회의 "2007 한국컴퓨터종합학술대회 논문집 Vol. 34, No. 1(C)"에 개시된 문자 인식 기술 등을 참고할 수 있다.The image recognition and analysis unit 530 recognizes an image included in the web page received by the
문자/기호 변환부(540)는 이미지 인식 및 분석부(530)에 의하여 분석된 이미지에 포함되는 것으로 판단되는 문자 또는 기호를 추출하여 기계로 판독 가능한 문자 또는 기호로 변환한다. 본 발명의 바람직한 실시예에 따르면, 문자/기호 변환부(540)는 분석된 특정 이미지와 문자 또는 기호 간의 유사도를 산출하여 최대치의 유사도를 보이는 문자 또는 기호로 해당 이미지를 변환할 수 있다.The character /
한편, 전술한 바와 같이, 문자/기호 변환 시에는 문자 판독 데이터베이스(600)가 참조될 수 있다. 문자 판독 데이터베이스(600)에는 이미지에 대응하는 문자, 기호 또는 텍스트에 대한 정보가 저장되어 있을 수 있다. 또한, 이와 함께, 해당 이미지로 표현되는 문자에 대응하는 언어, 폰트 정보가 더 저장되어 있을 수도 있다. 문자/기호 변환부(540)는 이러한 문자 판독 데이터베이스(600)를 참조하여, 이미지로 표현되어 있는 문자 등을 각종 폰트로 표현되는 각 언어(예를 들면, 한국어, 영어 또는 일어)로 변환할 수 있다.Meanwhile, as described above, the
그리고, 마크업 언어 변환부(550)는 문자/기호 변환부(540)에 의해 변환된 결과를 XML 또는 HTML 등의 마크업 언어로 변환한다.The
이렇게 마크업 언어로 변환된 문자 판독 결과는 제어부(510)의 제어에 따라 통신부(520)를 통해 개방형 API 서비스 게이트웨이(200)로 전송된다.The character read result converted into the markup language is transmitted to the open
번역 서비스 제공 서버의 구성Configuration of Translation Service Provision Server
이하에서는, 본 발명의 일 실시예에 따른 번역 서비스 제공 서버(700)의 내 부 구성 및 각 구성요소의 기능에 대하여 살펴보기로 한다.Hereinafter, the internal structure of the translation
도 4는 본 발명의 일 실시예에 따른 번역 서비스 제공 서버(700)의 내부 구성을 상세하게 도시한 도면이다. 도 4를 참조하면, 본 발명의 일 실시예에 따른 번역 서비스 제공 서버(700)는, 제어부(710), 통신부(720), 번역 모드 선택부(730), 번역 수행부(750)로 구성될 수 있다.4 is a diagram illustrating an internal configuration of a translation
본 발명의 일 실시예에 따르면, 상기 구성요소들은 데이터 통신이 가능한 소정의 프로그램 모듈들일 수 있다. 이러한 프로그램 모듈들은 운영 시스템, 응용 프로그램 모듈 및 기타 프로그램 모듈의 형태로 번역 서비스 제공 서버(700)에 포함될 수 있으며, 물리적으로는 여러 가지 공지의 기억 장치 상에 저장될 수 있다. 또한, 이러한 프로그램 모듈들은 번역 서비스 제공 서버(700)와 통신 가능한 원격 기억 장치에 저장될 수도 있다. 한편, 이러한 프로그램 모듈들은 본 발명에 따라 후술할 특정 업무를 수행하거나 특정 추상 데이터 유형을 실행하는 루틴, 서브루틴, 프로그램, 오브젝트, 컴포넌트, 데이터 구조 등을 포괄하지만, 이에 제한되지는 않는다.According to an embodiment of the present invention, the components may be predetermined program modules capable of data communication. Such program modules may be included in the translation
제어부(710)는 번역 서비스 제공 서버(700)의 전반적인 동작을 제어하며, 특히, 개방형 API 서비스 게이트웨이(200)의 요청에 따라, 문자 판독 결과에 대한 번역이 수행된 후, 그 결과를 제공하는 동작을 제어한다.The
통신부(720)는 번역 서비스 제공 서버(700)와 개방형 API 서비스 게이트웨이(200) 간의 통신을 수행한다. 통신부(720)는 개방형 API 서비스 게이트웨이(200)로부터 문자 판독된 결과 또는 그 결과가 반영된 소정 웹 페이지에 대한 정 보를 수신하고, 해당 텍스트에 대한 번역이 수행된 후에는, 그 결과를 전송한다.The
번역 모드 선택부(730)는 먼저 개방형 API 서비스 게이트웨이(200)로부터 수신된 문자 판독 결과에 포함되는 텍스트를 인식한다. 이러한 인식을 통해 해당 텍스트의 언어를 판별한다. 한편, 이러한 인식에는 텍스트에 포함되는 기호들을 제외한 채 문자만을 인식하는 과정이 포함될 수도 있다. 번역 모드 선택부(730)는 텍스트를 인식하고 그 언어를 인식한 후에, 번역 모드를 선택한다. 예를 들어, 인식된 텍스트가 영어이면 '영-한 번역' 모드 또는 '영-일 번역' 모드를 선택하고, 인식된 텍스트가 일어이면 '일-한 번역' 모드 또는 '일-영 번역' 모드를 선택할 수 있다. 한편, 모드 선택은 반드시 하나의 모드의 선택으로 한정되지 않아도 되며, 예를 들면, '영-한 번역' 모드 또는 '영-일 번역' 모드가 동시에 선택될 수도 있다.The translation mode selector 730 first recognizes text included in a character read result received from the open
번역 수행부(750)는 번역 모드 선택부(730)에 의해 선택된 번역 모드에 따라 인식된 텍스트에 대한 번역을 수행한다.The
이러한 번역 시에는 번역 데이터베이스(800)가 참조될 수 있다. 번역 데이터베이스(800)에는 해당 언어에 대응하는 다른 언어에 대한 정보가 저장되어 있을 수 있고, 번역 수행부(750)는 이러한 데이터베이스(800)를 참조하여 해당 텍스트에 대한 번역을 수행하게 된다.In this translation, the
번역 결과는 제어부(710)의 제어에 따라 통신부(720)를 통해 개방형 API 서비스 게이트웨이(200)로 전송된다. 번역 결과를 수신한 개방형 API 서비스 게이트웨이(200)는 번역 결과 또는 번역 결과가 반영된 웹 페이지에 대한 정보를 응용 서 버(100)로 전송할 수 있다. 또한, 번역 결과와 함께 번역 전 원문에 관한 정보도 함께 전송될 수 있다.The translation result is transmitted to the open
개방형 API 서비스 게이트웨이(200)는 번역 결과, 번역 결과가 반영된 웹 페이지, 및/또는 번역 전 원문에 대한 정보를 응용 서버(100)로 전송하고, 응용 서버(100)는 상기 정보를 사용자 단말 장치(900)로 전송한다.The open
서비스 제공 과정Service delivery process
이하에서는, 도 5를 참조하여, 본 발명의 일 실시예에 따라 특정 식별자에 해당하는 웹 페이지에 포함되어 있는 이미지에 대한 문자 판독 서비스 및 문자 판독 결과에 대한 번역 서비스를 제공하는 과정에 대해 살펴보기로 한다.Hereinafter, referring to FIG. 5, a process of providing a text reading service for an image included in a web page corresponding to a specific identifier and a translation service for the text reading result according to an embodiment of the present invention will be described. Shall be.
먼저, 사용자가 사용자 단말 장치(900)를 통해 웹 브라우저를 실행시키고 특정 URL을 입력함과 동시에 서비스 요청을 하면(S110), 웹 브라우저에 의해 서비스 요청이 응용 서버(100)로 전송된다(S115). 이 때, 전술한 바와 같이, 사용자는 식별자 입력과 동시에 웹 페이지에 포함되어 있는 이미지에 대한 문자 판독 서비스만을 제공 받을 것인지, 판독된 텍스트에 대한 번역 서비스도 함께 받을 것인지 여부를 결정할 수 있다.First, when a user executes a web browser through the
서비스 요청을 전송 받은 응용 서버(100)는 개방형 API를 이용하여 이를 개방형 API 서비스 게이트웨이(200)에 전송한다(S120). 개방형 API 서비스 게이트웨이(200)는 해당 서비스 요청에 따라, 사용자 단말 장치(900)로부터 전송된 URL을 웹 서버(300)로 전송한다(S130).The
URL을 전송 받은 웹 서버(300)는 해당 URL에 대응하는 웹 페이지를 검색한 후(S140), 검색된 웹 페이지에 대한 정보를 다시 개방형 API 서비스 게이트웨이(200)로 전송한다(S145). 이를 전송 받은 개방형 API 서비스 게이트웨이(200)는 웹 페이지에 대한 정보를 문자 판독 서버(500)로 전송한다(S150).After receiving the URL, the
문자 판독 서버(500)는 전송 받은 웹 페이지에 포함되어 있는 이미지를 인식, 분석한 후, 해당 이미지로 표현되는 문자 또는 기호를 기계 판독 가능한 문자 또는 기호로 변환한 후, 다시 마크업 언어의 형태로 변환한다(S160). 이렇게 얻어진 문자 판독 결과는 다시 개방형 API 서비스 게이트웨이(200)로 전송된다(S165).The
단계 S110에서 사용자가 문자 판독 서비스만을 요청하였다면, 상기 문자 판독 결과를 수신한 개방형 API 서비스 게이트웨이(200)는 그 문자 판독 결과를 응용 서버(100)로 전송하고(S171), 응용 서버(100)는 이를 사용자 단말 장치(900)로 전송한다(S173).If the user requests only the text reading service in step S110, the open
한편, 단계 S110에서 사용자가 문자 판독 서비스와 함께 번역 서비스도 요청하였다면, 상기 문자 판독 결과를 수신한 개방형 API 서비스 게이트웨이(200)는 그 문자 판독 결과를 번역 서비스 제공 서버(700)로 전송한다(S175).On the other hand, if the user also requested a translation service together with the text reading service in step S110, the open
그 후, 번역 서비스 제공 서버(700)는 수신한 문자 판독 결과를 기초로 하여 번역을 수행한 후(S180), 번역 결과 및/또는 번역 전의 문자 판독 결과를 개방형 API 서비스 게이트웨이(200)로 전송한다(S185).Thereafter, the translation
번역 결과 및/또는 번역 전의 문자 판독 결과를 수신한 개방형 API 서비스 게이트웨이(200)는 이를 응용 서버(100)로 전송하고(S190), 응용 서버(100)는 이를 사용자 단말 장치(900)로 전송한다(S195).The open
이렇게 함으로써, 사용자는 사용자 단말 장치(900)를 통해 URL을 입력하는 것만으로도, 해당 웹 페이지에 포함되어 있는 이미지에 대한 문자 판독 서비스 또는 번역 서비스를 제공 받을 수 있게 된다.In this way, the user can be provided with a text reading service or a translation service for an image included in the web page only by inputting a URL through the
이상 설명된 본 발명에 따른 실시예들은 다양한 컴퓨터 구성요소를 통하여 수행될 수 있는 프로그램 명령어의 형태로 구현되어 컴퓨터 판독 가능한 기록 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능한 기록 매체는 프로그램 명령어, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 컴퓨터 판독 가능한 기록 매체에 기록되는 프로그램 명령어는 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 분야의 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능한 기록 매체의 예에는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM, DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 ROM, RAM, 플래시 메모리 등과 같은 프로그램 명령어를 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령어의 예에는, 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함된다. 상기 하드웨어 장치는 본 발명에 따른 처리를 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.Embodiments according to the present invention described above may be implemented in the form of program instructions that may be executed by various computer components, and may be recorded in a computer-readable recording medium. The computer-readable recording medium may include program instructions, data files, data structures, etc. alone or in combination. Program instructions recorded on the computer-readable recording medium may be those specially designed and configured for the present invention, or may be known and available to those skilled in the computer software arts. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks and magnetic tape, optical recording media such as CD-ROMs, DVDs, and magneto-optical media such as floptical disks. media), and hardware devices specifically configured to store and execute program instructions, such as ROM, RAM, flash memory, and the like. Examples of program instructions include not only machine code generated by a compiler, but also high-level language code that can be executed by a computer using an interpreter or the like. The hardware device may be configured to operate as one or more software modules to perform the process according to the invention, and vice versa.
이상에서 본 발명이 구체적인 구성요소 등과 같은 특정 사항들과 한정된 실시예 및 도면에 의해 설명되었으나, 이는 본 발명의 보다 전반적인 이해를 돕기 위 해서 제공된 것일 뿐, 본 발명이 상기 실시예들에 한정되는 것은 아니며, 본 발명이 속하는 기술분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형을 꾀할 수 있다.Although the present invention has been described by specific embodiments such as specific components and the like, but the embodiments and the drawings are provided only to help a more general understanding of the present invention, the present invention is limited to the above embodiments. However, one of ordinary skill in the art can make various modifications and variations from this description.
따라서, 본 발명의 사상은 상기 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐만 아니라 이 특허청구범위와 균등하게 또는 등가적으로 변형된 모든 것들은 본 발명의 사상의 범주에 속한다고 할 것이다.Therefore, the spirit of the present invention should not be limited to the embodiments described above, and all of the equivalents or equivalents of the claims, as well as the claims below, are included in the scope of the spirit of the present invention. I will say.
도 1은 본 발명의 일 실시예에 따라 특정 식별자를 갖는 웹 페이지에 포함되어 있는 이미지로부터 OCR 기술을 이용해 문자 또는 기호를 추출한 후, 이를 XML 또는 HTML 등의 마크업 언어로 표현하여 제공하고 이에 대한 번역 서비스를 제공하기 위한 전체 시스템의 개략적인 구성도이다.FIG. 1 extracts a character or symbol from an image included in a web page having a specific identifier using OCR technology, and expresses it in a markup language such as XML or HTML according to an embodiment of the present invention. It is a schematic block diagram of the whole system for providing a translation service.
도 2는 본 발명의 일 실시예에 따른 개방형 API 서비스 게이트웨이(200)의 내부 구성을 상세하게 도시한 도면이다.2 is a diagram illustrating in detail the internal configuration of the open
도 3은 본 발명의 일 실시예에 따른 문자 판독 서버(500)의 내부 구성을 상세하게 도시한 도면이다.3 is a diagram illustrating in detail the internal configuration of the
도 4는 본 발명의 일 실시예에 따른 번역 서비스 제공 서버(700)의 내부 구성을 상세하게 도시한 도면이다.4 is a diagram illustrating an internal configuration of a translation
도 5는 본 발명의 일 실시예에 따라 특정 식별자에 해당하는 웹 페이지에 포함되어 있는 이미지에 대한 문자 판독 서비스 및 문자 판독 결과에 대한 번역 서비스를 제공하는 과정을 설명하는 흐름도이다.5 is a flowchart illustrating a process of providing a text reading service for a image included in a web page corresponding to a specific identifier and a translation service for the text reading result according to an embodiment of the present invention.
<주요 도면 부호에 관한 간단한 설명><Brief description of the major reference numerals>
100: 응용 서버 200: 개방형 API 서비스 게이트웨이100: application server 200: open API service gateway
300: 웹 서버 500: 문자 판독 서버300: Web server 500: character read server
700: 번역 서비스 제공 서버 900: 사용자 단말 장치700: translation service providing server 900: user terminal device
Claims (21)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020080033923A KR100953627B1 (en) | 2008-04-11 | 2008-04-11 | Method, apparatus and computer-readable recording medium for reading text on image contained in web page and providing translation service on same text |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020080033923A KR100953627B1 (en) | 2008-04-11 | 2008-04-11 | Method, apparatus and computer-readable recording medium for reading text on image contained in web page and providing translation service on same text |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20090108485A true KR20090108485A (en) | 2009-10-15 |
KR100953627B1 KR100953627B1 (en) | 2010-04-20 |
Family
ID=41551866
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020080033923A KR100953627B1 (en) | 2008-04-11 | 2008-04-11 | Method, apparatus and computer-readable recording medium for reading text on image contained in web page and providing translation service on same text |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100953627B1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200009205A (en) * | 2018-07-18 | 2020-01-30 | 네이버 주식회사 | Method for proving translation service and terminal device using the same |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002108855A (en) * | 2000-09-29 | 2002-04-12 | Brother Ind Ltd | Document processor |
KR100811407B1 (en) * | 2001-12-31 | 2008-03-10 | 주식회사 케이티 | Apparatus and method for UMS hosting service with open API technologies |
JP4048188B2 (en) | 2004-06-07 | 2008-02-13 | 株式会社インパルスジャパン | WEB page translation apparatus and WEB page translation method |
-
2008
- 2008-04-11 KR KR1020080033923A patent/KR100953627B1/en active IP Right Grant
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200009205A (en) * | 2018-07-18 | 2020-01-30 | 네이버 주식회사 | Method for proving translation service and terminal device using the same |
Also Published As
Publication number | Publication date |
---|---|
KR100953627B1 (en) | 2010-04-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6988100B2 (en) | Method and system for extending the performance of a web crawler | |
CN1114168C (en) | Www addressing | |
KR100936204B1 (en) | Copy and paste processing method, apparatus, and storage medium | |
US7496497B2 (en) | Method and system for selecting web site home page by extracting site language cookie stored in an access device to identify directional information item | |
US6564254B1 (en) | System and a process for specifying a location on a network | |
CN100367299C (en) | Image processing device, image processing method, and storage medium storing program therefor | |
KR100907671B1 (en) | How to Edit Recording Media and Character Input | |
US20080281577A1 (en) | Language Identification Equipment, Translation Equipment, Translation Server, Language Identification Method, and Translation Processing Method | |
US20060230100A1 (en) | Web content transcoding system and method for small display device | |
KR101015234B1 (en) | Method, system and computer-readable recording medium for providing web contents by translating one language included therein into the other language | |
KR100956087B1 (en) | Computer readable recoding medium, character inputting and editing method, server apparatus, and server | |
JP2004530959A (en) | System and method for delivering content to mobile device | |
CN101388011A (en) | Method and apparatus for recording information into user thesaurus | |
MXPA04001729A (en) | Methods and systems for language translation. | |
US20090313536A1 (en) | Dynamically Providing Relevant Browser Content | |
JP2007528520A (en) | Method and system for managing websites registered with search engines | |
KR20120025066A (en) | Web browsing system and method for rendering dynamic resource uri of script | |
KR20100045337A (en) | Method, system and computer-readable recording medium for providing the translated comics contents, and exposing the translated comics contents for retrieval | |
KR20090130364A (en) | Method, apparatus and computer-readable recording medium for tagging image contained in web page and providing web search service using tagged result | |
KR100940365B1 (en) | Method, apparatus and computer-readable recording medium for tagging image contained in web page and providing web search service using tagged result | |
KR100953627B1 (en) | Method, apparatus and computer-readable recording medium for reading text on image contained in web page and providing translation service on same text | |
KR102244668B1 (en) | System and method for automatically inputting personal information using codes | |
US20020007382A1 (en) | Computer having character input function,method of carrying out process depending on input characters, and storage medium | |
JP5565197B2 (en) | Web application linkage method, linkage apparatus, and linkage program | |
KR100516302B1 (en) | Method And System For Handling Wrongly Inputted Internet Address |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130329 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20160329 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20170328 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20190401 Year of fee payment: 10 |