KR20110011840A - Method and apparatus for automatically recognizing keywords and providing related additional information - Google Patents
Method and apparatus for automatically recognizing keywords and providing related additional information Download PDFInfo
- Publication number
- KR20110011840A KR20110011840A KR1020090069267A KR20090069267A KR20110011840A KR 20110011840 A KR20110011840 A KR 20110011840A KR 1020090069267 A KR1020090069267 A KR 1020090069267A KR 20090069267 A KR20090069267 A KR 20090069267A KR 20110011840 A KR20110011840 A KR 20110011840A
- Authority
- KR
- South Korea
- Prior art keywords
- keyword
- additional information
- text
- unit
- matching determination
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/134—Hyperlinking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
본 발명은 키워드 자동 인식기, 키워드 자동 인식방법, 키워드 부가정보 제공기 및 키워드 부가정보 제공방법에 관한 것으로서, 보다 상세하게는 웹페이지 내에 포함된 특정 키워드를 자동 인식하고, 자동 인식된 키워드에 대하여 부가 정보를 추가하여 이용자에게 제공하는 키워드 자동 인식기, 키워드 자동 인식방법, 키워드 부가정보 제공기 및 키워드 부가정보 제공방법에 관한 것이다.The present invention relates to a keyword automatic recognizer, a keyword automatic recognition method, a keyword additional information provider and a keyword additional information providing method, and more specifically, automatically recognizes a specific keyword included in a web page, and adds to the automatically recognized keyword. The present invention relates to a keyword automatic recognizer, an automatic keyword recognition method, a keyword additional information provider, and a keyword additional information providing method for adding information to a user.
인터넷 웹 페이지 내의 특정 문자열을 대상으로 하는 부가 정보의 제공 기법과 관련하여 몇 가지 방식이 알려져 있다. Several methods are known in connection with a method of providing additional information for a specific character string in an Internet web page.
도 1은 웹페이지 내의 특정 문자열을 검색어로 하는 검색 결과를 제공하는 기법의 일례를 나타낸 도면이다. 1 is a diagram illustrating an example of a technique of providing a search result using a specific string in a web page as a search word.
도 1에서 나타낸 종래 기술에서는, 특정 웹페이지에 대해서 해당 웹페이지의 작성자가 직접 선정한 특정 문자열(도 1에서는 "하나로마트")에 대하여 해당 문자열을 검색어로 하는 검색결과를 새로운 웹브라우저 화면에 출력되도록 하고 있다. In the prior art illustrated in FIG. 1, a search result using the string as a search word is output on a new web browser screen for a specific string selected by the creator of the web page (“Hanaro Mart” in FIG. 1). Doing.
이를 위하여, 해당 웹페이지의 특정 문자열에는 해당 문자열을 검색어로 하는 검색결과에 대응되는 하이퍼링크가 HTML 정보에 포함된다.To this end, a specific string of the web page includes a hyperlink corresponding to a search result using the string as a keyword in the HTML information.
이러한 기법을 활용하면, 해당 웹페이지를 이용하는 인터넷 사용자로 하여금 검색결과와 하이퍼링크된 특정 문자열을 클릭하는 것만으로도 해당 문자열에 관한 인터넷 검색 결과를 간편하게 얻을 수 있게 된다. Using this technique, an internet user using the web page can easily obtain an Internet search result about the string by simply clicking on the search result and a hyperlinked string.
한편, 만약 해당 특정 문자열이 그에 관한 쇼핑몰 사이트(또는 쇼핑몰 사이트 내의 특정 상품 관련 페이지)으로 연결되도록 하이퍼링크를 설정함으로써, 인터넷 사용자를 그 쇼핑몰 사이트(또는 쇼핑몰 사이트 내의 특정 상품 관련 페이지)로 유입시킬 수 있는 효과도 기대할 수 있다. On the other hand, if a specific string is set to a hyperlink to link to a shopping mall site (or a specific product related page in the shopping mall site), the Internet user can be introduced to the shopping mall site (or a specific product related page in the shopping mall site). It can be expected to be effective.
도 2는 웹페이지 내의 특정 문자열을 검색어로 하는 검색 결과를 제공하는 기법의 다른 예를 나타낸 도면이다. 2 is a diagram illustrating another example of a technique of providing a search result using a specific string in a web page as a search word.
도 2에서 나타낸 종래 기술에서는, 웹페이지 내의 특정 문자열에 하이퍼링크가 미리 설정되어 있는 도 1의 경우와 달리, 사용자가 임의의 문자열(도 2에서는 "대형할인점")에 직접 블록을 설정하는 경우, 블록 설정된 해당 문자열을 검색어로 하는 검색 결과 페이지와 연결되는 아이콘이 생성되도록 하고 있다.In the prior art shown in FIG. 2, unlike the case of FIG. 1 in which a hyperlink is set in advance in a specific character string in a web page, when a user directly sets a block in an arbitrary character string ("large discount point" in FIG. 2), The icon that is connected to the search result page that uses the corresponding string set as a keyword is created.
이 때, 해당 문자열을 검색어로 하는 검색 결과 페이지는, 해당 웹페이지의 작성자가 지정하는 검색 사이트의 검색 결과 페이지가 되는 점은 도 1의 경우와 마찬가지이다.At this time, the search result page using the character string as a search word is the same as that of the case of FIG.
한편, 도 1의 종래 기술은 해당 웹페이지의 내용을 직접 수정하여야만 웹페이지 내의 특정 문자열에 하이퍼링크 등의 부가정보를 더할 수 있으며, 부가정보가 제공되는 대상이 되는 문자열이 이미 정해져 있다는 한계가 있다. On the other hand, the prior art of Figure 1 can be added to the additional information, such as hyperlinks to a specific string in the web page only by modifying the content of the web page directly, there is a limitation that the string to which the additional information is provided is already determined .
또한, 도 2의 종래 기술에서도, 사용자가 직접 드래그(drag) 등의 행위에 의하여 지정한 문자열에 대하여 부가정보를 제공할 뿐, 원하는 문자열을 자동으로 검색을 할 수 없다는 한계가 있을 뿐만 아니라, 해당 문자열에 대하여 제공되는 부가정보 또한 웹페이지의 작성자에 의하여 지정된 형태의 부가정보(예컨대 해당 문자열에 관한 검색결과로 연결되는 하이퍼링크 등)만이 제공되는 한계 또한 존재한다. In addition, even in the related art of FIG. 2, the user may not only automatically search for a desired character string by providing additional information on a character string designated by a user, such as a drag, but also have a limitation. There is also a limitation that only additional information provided for the webpage is provided with additional information (eg, a hyperlink to a search result of the corresponding character string) in the form designated by the author of the webpage.
즉, 위와 같은 종래 기술 중 어느 것에 의하더라도, 웹페이지의 내용을 수정할 권한이 없는 자가 해당 웹페이지 내에서 원하는 문자열을 자동으로 검색한 후, 해당 문자열에 대하여 부가정보를 제공할 수 있는 수단이 없었다. That is, according to any of the prior arts described above, there is no means for providing an additional information on the string after a person who does not have the authority to modify the contents of the web page automatically searches for the desired string in the web page. .
본 발명은 상기와 같은 문제점을 해결하기 위하여 착안된 것으로서, 임의의 웹페이지 내에서 소정의 키워드와 일치하는 문자열을 자동 검색한 후 해당 문자열에 대한 부가 정보를 인터넷 사용자에게 제공할 수 있도록 하는 키워드 자동 인식기, 키워드 자동 인식방법, 키워드 부가정보 제공기 및 키워드 부가정보 제공방법을 제공하는 것을 목적으로 한다. The present invention was conceived to solve the above problems, and automatically searches for a character string matching a predetermined keyword within an arbitrary web page, and then automatically provides a keyword for providing the Internet user with additional information about the character string. An object of the present invention is to provide a recognizer, an automatic keyword recognition method, a keyword additional information provider, and a keyword additional information provision method.
상기와 같은 목적을 달성하기 위하여, 본 발명에 의한 키워드 자동 인식기는, 텍스트 판독부, 대응 키워드 저장부 및 키워드 정합 판단부를 포함하며, 상기 텍스트 판독부는 사용자 컴퓨터의 웹브라우저에 로딩된 웹페이지를 읽어들여, 상기 웹페이지 내에 존재하는 문자열을 판독하여 상기 상기 키워드 정합 판단부에 전달하고, 상기 키워드 정합 판단부는 상기 문자열에 구문분석을 행하여 대상 키워드를 추출하고, 상기 대상 키워드에 관한 대응 키워드가 존재하는지 여부를 판단하며, 상기 대응 키워드 저장부는 적어도 하나의 상기 대응 키워드를 저장하고, 상기 키워드 정합 판단부의 요청에 응답하여 상기 대상 키워드에 상기 대응 키워드가 대응되는지 여부를 알려준다. In order to achieve the above object, the keyword automatic recognizer according to the present invention includes a text reader, a corresponding keyword storage unit, and a keyword matching determination unit, wherein the text reader reads a web page loaded in a web browser of a user computer. Read and transmit the character string existing in the web page to the keyword matching determination unit, and the keyword matching determination unit parses the character string to extract a target keyword and whether there is a corresponding keyword related to the target keyword. The corresponding keyword storage unit stores at least one corresponding keyword and informs whether the corresponding keyword corresponds to the target keyword in response to a request of the keyword matching determination unit.
또한, 본 발명의 다른 측면에 의한 키워드 자동 인식방법은, 텍스트 판독부, 대응 키워드 저장부 및 키워드 정합 판단부를 포함하는 키워드 자동 인식기에서 수행되며, 상기 텍스트 판독부가 사용자 컴퓨터의 웹브라우저에 로딩된 웹페이지를 읽어들여, 상기 웹페이지 내에 존재하는 문서 객체 모델로부터 문자열을 판독하여 상기 상기 키워드 정합 판단부에 전달하는 텍스트 판독단계와, 상기 키워드 정합 판단부가 상기 문자열에 구문분석을 행하여 대상 키워드를 추출하고, 추출된 대상 키워드가 있는 경우 상기 대상 키워드에 관한 대응 키워드가 존재하는지 여부를 판단하는 키워드 정합 판단단계를 포함한다. Also, the automatic keyword recognition method according to another aspect of the present invention is performed in a keyword automatic recognizer including a text reader, a corresponding keyword storage unit, and a keyword matching determination unit, wherein the text reader is a web loaded on a web browser of a user computer. A text reading step of reading a page, reading a character string from a document object model existing in the web page, and delivering the character string to the keyword matching determination unit, and extracting a target keyword by parsing the character string by the keyword matching determination unit; And a keyword matching determination step of determining whether a corresponding keyword for the target keyword exists when the extracted target keyword exists.
또한, 본 발명의 또 다른 측면에 의한 키워드 부가정보 제공기는, 텍스트 판독부, 대응 키워드 저장부, 키워드 정합 판단부 및 부가정보 생성부를 포함하며, 상기 텍스트 판독부는 사용자 컴퓨터의 웹브라우저에 로딩된 웹페이지를 읽어들여, 상기 웹페이지 내에 존재하는 문자열을 판독하여 상기 상기 키워드 정합 판단부에 전달하고, 상기 키워드 정합 판단부는 상기 문자열에 구문분석을 행하여 대상 키워드를 추출하고, 상기 대상 키워드에 관한 대응 키워드가 존재하는지 여부를 판단하고, 상기 대응 키워드 저장부는 적어도 하나의 상기 대응 키워드를 저장하고, 상기 키워드 정합 판단부로 상기 대상 키워드에 상기 대응 키워드가 대응되는지 여부를 알려주며, 상기 부가정보 생성부는 상기 대응 키워드 중 하나와 일치하는 상기 대상 키워드가 있는 경우, 상기 대응 키워드에 대응되는 부가정보를 생성하여 상기 대상 키워드에 부가한 후 상기 키워드 정합 판단부로 리턴하는 텍스트 판독부, 대응 키워드 저장부, 키워드 정합 판단부 및 부가정보 생성부를 포함한다. In addition, the keyword additional information providing apparatus according to another aspect of the present invention includes a text reader, a corresponding keyword storage unit, a keyword matching determination unit, and an additional information generating unit, wherein the text reader is a web loaded in a web browser of a user computer. Reads a page, reads a character string existing in the web page, and transmits the character string to the keyword matching determination unit. The keyword matching determination unit parses the character string to extract a target keyword, and generates a corresponding keyword related to the target keyword. Is determined, and the corresponding keyword storage unit stores at least one corresponding keyword, and informs the keyword matching determination unit whether the corresponding keyword corresponds to the target keyword, and the additional information generator is configured to correspond to the corresponding keyword. Has the target keyword that matches one of the In this case, the mobile terminal may include a text reader, a corresponding keyword storage unit, a keyword matching determination unit, and an additional information generation unit that generates additional information corresponding to the corresponding keyword, adds the target keyword to the target keyword, and returns to the keyword matching determination unit.
또한, 본 발명의 또 다른 측면에 의한 키워드 부가정보 제공방법은, 키워드 부가정보 제공기에 의하여 수행되며, 상기 텍스트 판독부가 사용자 컴퓨터의 웹브라우저에 로딩된 웹페이지를 읽어들여, 상기 웹페이지 내에 존재하는 문자열을 판 독하여 상기 상기 키워드 정합 판단부에 전달하는 텍스트 판독단계와, 상기 키워드 정합 판단부가 상기 문자열에 구문분석을 행하여 대상 키워드를 추출하고, 상기 대응 키워드 저장부를 참조하여 상기 대상 키워드에 관한 대응 키워드가 존재하는지 여부를 판단하는 키워드 정합 판단단계 및 상기 대응 키워드 중 하나와 일치하는 상기 대상 키워드가 있는 경우, 상기 부가정보 생성부가 상기 대응 키워드에 대응되는 부가정보를 생성하여 상기 대상 키워드에 부가한 후 상기 키워드 정합 판단부로 리턴하는 부가정보 생성단계를 포함한다. In addition, the method for providing keyword additional information according to another aspect of the present invention is performed by a keyword additional information provider, wherein the text reader reads a web page loaded in a web browser of a user computer, and is present in the web page. A text reading step of reading a character string and transferring the same to the keyword matching determination unit; and extracting a target keyword by parsing the character string by the keyword matching determination unit, and referring to the corresponding keyword storage unit to correspond to the target keyword. When there is a keyword matching determination step of determining whether a keyword exists and the target keyword that matches one of the corresponding keywords, the additional information generation unit generates additional information corresponding to the corresponding keyword and adds it to the target keyword. After the return to the keyword matching determination unit And a beam generating step.
또한, 본 발명의 또 다른 측면에 의한 키워드 부가정보 제공프로그램이 저장된 컴퓨터로 읽을 수 있는 기록매체는, 텍스트 판독부가 사용자 컴퓨터의 웹브라우저에 로딩된 웹페이지를 읽어들여, 상기 웹페이지 내에 존재하는 문자열을 판독하여 상기 상기 키워드 정합 판단부에 전달하는 텍스트 판독기능과, 상기 키워드 정합 판단부가 상기 문자열에 구문분석을 행하여 대상 키워드를 추출하고, 상기 대응 키워드 저장부를 참조하여 상기 대상 키워드에 관한 대응 키워드가 존재하는지 여부를 판단하는 키워드 정합 판단기능 및 상기 대응 키워드 중 하나와 일치하는 상기 대상 키워드가 있는 경우, 상기 부가정보 생성부가 상기 대응 키워드에 대응되는 부가정보를 생성하여 상기 대상 키워드에 부가한 후 상기 키워드 정합 판단부로 리턴하는 부가정보 생성기능을 포함한다. In addition, the computer-readable recording medium storing the keyword additional information providing program according to another aspect of the present invention, the text reading unit reads the web page loaded in the web browser of the user computer, the character string present in the web page A text reading function for reading and transferring the same to the keyword matching determination unit, and extracting a target keyword by parsing the character string by the keyword matching determination unit, and referring to the corresponding keyword storage unit to obtain a corresponding keyword for the target keyword. If there is a keyword matching determination function for determining whether there exists a target keyword that matches one of the corresponding keywords, the additional information generator generates additional information corresponding to the corresponding keyword, and adds the additional information to the target keyword. Additional information returned to the keyword matching determination unit Includes generation function.
특정 웹페이지의 작성자가 아닌 자로 하여금 해당 웹페이지 내의 임의의 문자열을 키워드로 하는 부가 정보를 인터넷 사용자에게 제공할 수 있도록 하는 키워 드 자동 인식 및 부가정보 제공 기능을 가진 수단, 예컨대 인터넷 툴바 등을 제공할 수 있는 효과가 있다. Provides means for automatic keyword recognition and additional information providing, such as the Internet toolbar, that enables non-authors of a particular web page to provide additional information to the Internet user as a keyword in any string within the web page. It can work.
또한, 특정 웹페이지 내에서 임의의 키워드를 검색함에 있어서, 텍스트가 아닌 문서요소에 관한 검색을 생략함으로써 검색속도를 향상시킬 수 있는 효과가 있다.In addition, when searching for any keyword in a specific web page, it is possible to improve the search speed by omitting the search for document elements other than text.
나아가, 본 제안발명에 의하면 사용자가 일반적인 웹페이지에 접속하는 경우라도, 툴바 등 프로그램을 설치하는 것만으로 해당 툴바의 제공자가 원하는 키워드를 자동 검색한 후 원하는 웹페이지로 연결하는 하이퍼링크를 제공할 수 있게 됨으로써, 어떠한 웹페이지에 대해서도 툴바의 제공자가 원하는 사이트(예컨대 쇼핑, 검색 등)로 사용자의 트래픽을 유도하는 부가정보를 웹페이지 내의 키워드에 대하여 제공할 수 있는 효과가 있다.Furthermore, according to the present invention, even when a user accesses a general web page, the user can provide a hyperlink to the desired web page after automatically searching for a keyword desired by the provider of the toolbar by simply installing a program such as a toolbar. As a result, any web page can provide additional information for a keyword in the web page to direct traffic of the user to a desired site (eg, shopping, search, etc.) of the toolbar.
아래에서는 첨부한 도면을 참고로 하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.DETAILED DESCRIPTION Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings so that those skilled in the art may easily implement the present invention. The present invention may, however, be embodied in many different forms and should not be construed as limited to the embodiments set forth herein. In the drawings, parts irrelevant to the description are omitted in order to clearly describe the present invention, and like reference numerals designate like parts throughout the specification.
명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다.Throughout the specification, when a part is "connected" to another part, this includes not only "directly connected" but also "electrically connected" with another element in between. .
명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다. 또한, 명세서에 기재된 "…부", "…기", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다.Throughout the specification, when a part is said to "include" a certain component, it means that it can further include other components, without excluding other components unless specifically stated otherwise. In addition, the terms “… unit”, “… unit”, “module”, etc. described in the specification mean a unit that processes at least one function or operation, which may be implemented by hardware or software or a combination of hardware and software. have.
도 3은 키워드 자동 인식기의 일례를 나타낸 도면이다. 3 is a diagram illustrating an example of a keyword automatic recognizer.
웹페이지의 판독에 있어서 문제가 되는 것은, 웹페이지 내에서 판독 대상 문자열과 판독 제외 문자열을 구분하는 것이다. A problem in reading a web page is to distinguish between the character string to be read and the character string to exclude reading in the web page.
HTML 문서는 태그들의 계층적인 집합으로 이루어져 있다. HTML documents consist of a hierarchical set of tags.
예를 들어, 아래 표 1과 같은 형식을 따른다. For example, follow the format shown in Table 1 below.
<head>
<title> 고양이 그림 </title>
</head>
<body>
<IMG id="cat_pic" src="http://imagepath" border=0>
<p> 예쁜 고양이입니다. </p>
</body>
</html><html>
<head>
<title> Cat Picture </ title>
</ head>
<body>
<IMG id = "cat_pic" src = "http: // imagepath" border = 0>
<p> This is a pretty cat. </ p>
</ body>
</ html>
예컨대, HTML언어로 이루어진 특정 웹페이지 내에서 "image"라는 문자열을 찾고자 하는 경우에, 웹페이지의 "본문 내용"만이 아니라 "태그(tag)"까지도 포함하여 검색을 하게 된다면, 해당 웹페이지의 "본문"에는 검색하고자 하는 문자열이 없음에도 불구하고 <IMG id="cat_pic" src="http://imagepath" border=0>라는 태그에 포함된 "image"를 검색하는 결과를 낳게 되므로, 원치 않는 검색 결과를 얻게 되는 문제점과, 불필요한 대상까지 검색함에 따른 시간 및 연산량 증가의 문제점이 발생한다. For example, if you want to find the string "image" within a particular web page in HTML language, and you search for "tag" as well as the "body content" of the web page, Body "results in the search for" image "contained in the tag <IMG id =" cat_pic "src =" http: // imagepath "border = 0>, even though there are no strings to search for. The problem of obtaining a search result and the increase of time and amount of computation by searching for an unnecessary object occur.
나아가, 만약 "image"라는 문자열에 특정의 하이퍼링크를 부가하고자 한다면, 본문이 아닌 태그에 하이퍼링크가 걸림으로써 해당 웹페이지의 레이아웃 자체가 망가지는 더 큰 문제가 발생하게 된다. Furthermore, if you want to add a specific hyperlink to the string "image", a bigger problem arises because the hyperlink is attached to the tag rather than the body, thereby destroying the layout of the web page itself.
도 3의 실시예에서는 키워드 자동 인식의 대상이 되는 웹페이지가 문서 객체 모델(Document Object Model)을 따른다는 특징을 활용하고 있다. In the embodiment of FIG. 3, a web page that is a target of keyword automatic recognition utilizes a feature that follows a document object model.
문서 객체 모델이란, 구조화된 문서를 표현하기 위한 객체 지향 모델 중 하나의 형식이다. The document object model is one form of object-oriented model for representing structured documents.
이러한 HTML 문서를 문서 객체 모델로 변환한다면, 표 2과 같은 DOM 객체가 만들어진다. If you convert these HTML documents to the document object model, the DOM objects shown in Table 2 are created.
(Node Type)Node type
(Node Type)
HTML
BODY
IMG
IMAGE_NODE
표 1과 표 2를 비교하면, HTML 문서의 태그들은 표 2의 각 노드에 대응되며, 표 1의 각각의 태그 안에 쓰인 속성은 표 2의 "속성" 필드에서 표현될 수 있다. Comparing Table 1 and Table 2, the tags of the HTML document correspond to each node of Table 2, and the attributes written in each tag of Table 1 may be expressed in the "Attribute" field of Table 2.
이처럼, DOM의 기본적인 문서요소를 노드(node)라고 하며, 각 노드는 다른 노드의 상/하위에 위치할 수 있고, 각 속성(Attribute)은 노드의 하위에 위치한다. As such, the basic document element of the DOM is called a node, and each node can be located above and below another node, and each attribute is located below the node.
도 3의 실시예는 이러한 문서 객체 모델의 트리 구조에 착안하여, 웹페이지 문서에 포함된 노드의 속성을 파악한 후, 노드의 유형(node type)이 텍스트 노드인 경우에만 해당 노드의 속성을 판독함으로써, 웹페이지의 내용 중에서 문자열만을 추출할 수 있도록 하는 것을 기본적인 개념으로 삼고 있다. The embodiment of FIG. 3 focuses on the tree structure of the document object model to identify the attributes of the nodes included in the webpage document, and then reads the attributes of the nodes only when the node type is a text node. The basic concept is that only strings can be extracted from the contents of web pages.
다시 도 3으로 돌아가면, 도 3의 실시예에 따른 키워드 자동 인식기(100)는 텍스트 판독부(110), 대응 키워드 저장부(120) 및 키워드 정합 판단부(130)를 포함하여 이루어진다. 3, the keyword
또한, 도 3의 키워드 자동 인식기(100)는 인터넷 가능한 사용자 PC의 웹브라우저에 플러그인 형태로 설치되는 툴바(toolbar) 프로그램에 포함되도록 할 수 있다. 따라서, 키워드 자동 인식기(100)의 제공자는 툴바 프로그램과 함께 키워드 자동 인식기(100)를 배포함으로써, 인터넷 사용자로 하여금 사용자의 PC에 이를 설치할 수 있도록 함으로써 키워드 자동 인식기(100)가 웹브라우저와 함께 구동되도록 한다.In addition, the keyword
텍스트 판독부(110)는, 사용자 컴퓨터의 웹브라우저에 로딩된 웹페이지의 문서 객체 모델을 읽어 들여, 상기 웹페이지 내에 존재하는 텍스트 노드로부터 문자열을 판독하여 키워드 정합 판단부(130)로 전달한다.The
예컨대, 웹브라우저에서 특정 웹페이지 문서가 다 로딩(loading)되었다는 이벤트가 발생하면, 텍스트 판독부(110)는 해당 이벤트에 반응하여 해당 웹페이지의 문서 객체 모델을 읽어들인다.For example, when an event indicating that a particular webpage document is loaded in a web browser occurs, the
이 때, 앞서 표 1 및 표 2와 관련하여 설명한 바와 같이, 텍스트 판독부(110)는 해당 문서 객체 모델의 각각의 노드(이하에서 노드를 "문서요소"와 같은 의미로 보기로 한다)의 노드 유형에 의거하여, 노드 유형이 텍스트(text)로 지정된 노드만을 찾아 그 속성(Attribute)을 추출한다. 이 때의 해당 노드의 속성이 바로 웹페이지에서 텍스트로 표현되는 부분으로서, 문자열 인식의 대상이 된다. 예컨대, 표 2에서는 텍스트 노드의 노드 유형(node type)을 "TEXT_NODE"로 표시하도록 하고 있다.At this time, as described above with respect to Tables 1 and 2, the
키워드 정합 판단부(130)에서는 텍스트 판독부(110)로부터 전달된 문자열에 대하여 구문분석(파싱:parsing)을 수행하여 대상 키워드를 추출하고, 추출된 대상 키워드가 찾고자 하는 키워드인지 여부를 판단한다. The keyword
구문분석(파싱:parsing)이라 함은, 일련의 문자열을 의미있는 토큰(token)으로 분해하고, 이들로 이루어진 파스 트리(parse tree)를 만드는 과정을 말한다. Parsing is the process of breaking a string of strings into meaningful tokens and creating a parse tree of them.
텍스트 판독부(110)에서 추출된 문자열은 문자열을 이루고 있는 각종 문장성분, 예컨대 명사와 조사 등이 서로 혼합되어 있는 상태이기 때문에, 이로부터 유의미한 대상 키워드를 효율적으로 추출하기 위해서는 파싱 작업의 수행이 필요하다. Since the text string extracted by the
예를 들어, 텍스트 판독부(110)에서 전달받은 문자열이 "사과를", "사과가", "사과들도" 또는 "사과의" 등을 포함하는 문자열인 경우에, 파싱을 수행함으로써 이들 문자열로부터 공통적으로 "사과"라는 대상 키워드를 추출할 수 있게 된다.For example, when the strings received from the
현재까지 알려진 파싱 기법은 매우 다양한데, 본 실시예에는 공지의 다양한 파싱 기법이 제한 없이 널리 적용될 수 있다. There are a wide variety of parsing techniques known to date, and various known parsing techniques may be widely applied to the present embodiment without limitation.
키워드 정합 판단부(130)가 대상 키워드를 추출한 다음에는 대응 키워드 저장부(120)에서 저장되고 관리되는 대응 키워드와의 비교를 통하여 대상 키워드가 찾고자 하는 키워드인지 여부를 판단한다.After the keyword
대응 키워드 저장부(120)는 키워드 자동 인식기(100)가 특정 웹페이지 내에서 찾고자 하는 모든 키워드를 저장한다. The corresponding
대응 키워드 저장부(120)는 대응 키워드에 관한 해시 테이블(hash table)이나 데이터베이스를 구성함으로써 구현될 수 있다.The corresponding
대응 키워드 저장부(120)가 해시 테이블로 구현되고, 텍스트 판독부(110)에서 추출된 문자열로부터 파싱 작업을 거쳐 얻어진 대상 키워드가 "사과"와 "딸기"였고, 그 중에서 키워드 자동 인식기(100)가 찾고자 하는 키워드가 "사과"인 경우를 예로 들어 계속 설명하기로 한다.The corresponding
키워드 정합 판단부(130)는 먼저 "사과"에 대하여 해시 함수를 적용함으로써, 대응 키워드 저장부(120) 내에 "사과"에 관한 대응 키워드(즉, "사과"라는 키워드)가 있는지 여부를 판단한다. The keyword
"사과"는 키워드 자동 인식기(100)가 찾고자 하는 키워드이므로, 대응 키워드 저장부(120) 내에 존재하게 되므로, 해시 함수의 결과값은 "사과라는 대상 키워드가 키워드 자동 인식기(100)가 찾고자 하는 키워드임"을 의미하는 값이 되고, 키워드 정합 판단부(130)는 "사과"가 찾고자 하는 키워드인 것으로 판단한다. Since the "apple" is a keyword to be searched by the keyword
이 결과값에 따라, 웹페이지 내의 "사과"라는 키워드에 대해서는 이후에서 설명하는 부가정보 생성 작업을 통하여 사과라는 대상 키워드에 대하여 특수한 부가정보(예컨대, 하이퍼링크 주소정보 또는 관련 이미지나 텍스트를 포함하는 팝업정보 등)를 더 생성한 후 웹브라우저에 리턴할 수도 있다. According to the result value, the keyword "apple" in the web page is generated through the additional information generation operation described later, and includes additional additional information (e.g., hyperlink address information or related image or text) for the target keyword apple. Pop-up information, etc.) can be generated and returned to the web browser.
다음으로, 키워드 정합 판단부(130)는 "딸기"에 대하여 해시 함수를 적용함으로써, 대응 키워드 저장부(120) 내에 "딸기"에 관한 대응 키워드가 있는지 여부를 판단한다. Next, the keyword
"사과"와 달리, "딸기"는 키워드 자동 인식기(100)가 찾고자 하는 키워드가 아니므로, 대응 키워드 저장부(120) 내에 존재하지 않아, 해시 함수의 결과값은 "딸기라는 대상 키워드는 찾고자 하는 키워드가 아님"을 의미하는 값이 되고, 키워드 정합 판단부(130)는 "딸기"가 찾고자 하는 키워드가 아닌 것으로 판단한다. Unlike "apple", "strawberry" is not a keyword that the keyword
이에 따라, "딸기"는 아무런 변경이 없이 키워드 자동 인식기(100)로부터 그대로 웹브라우저에 리턴된다. Accordingly, the "strawberry" is returned to the web browser as it is from the keyword
한편, 키워드는 2 단어 이상의 복합어 키워드일 수도 있다. 현재 복합어 키워드의 추출을 위하여 다양한 파싱 기법이 개발되어 있는데, 도 3의 실시예에서는 복합어 키워드의 추출에 관한 공지의 다양한 파싱 기법이 제한 없이 적용될 수 있다. The keyword may be a compound word keyword of two words or more. Currently, various parsing techniques have been developed for extracting compound word keywords. In the embodiment of FIG. 3, various known parsing techniques for extracting compound word keywords may be applied without limitation.
또한, 키워드 정합 판단부(130)에서 "현재 대상 키워드 및 직전 대상 키워드"(2 단어 키워드) 또는 "현재 대상 키워드 및 직전 2개 대상 키워드"(3 단어 키워드)에 대하여 키워드 정합 여부를 판단함으로써, 복합어 키워드 또한 자동 인식을 수행할 수 있게 된다. In addition, the keyword
예컨대, "사과" 및 "딸기"에 관한 키워드 정합 여부를 판단한 후, "사과 딸기"에 관한 키워드 정합 여부를 더 판단하는 것이다. For example, after determining whether to match keywords related to "apple" and "strawberry", it is further determined whether to match keywords related to "apple strawberry".
이와 같은 키워드 자동 인식기의 동작은 대응 키워드 저장부(120)가 데이터베이스로 구현되는 경우에도 마찬가지로 이루어진다.The operation of the keyword automatic recognizer is similarly performed even when the corresponding
도 4는 도 3의 실시예에에 따른 키워드 자동 인식기에 의한 키워드 자동 인식 방법을 나타낸 흐름도이다. 4 is a flowchart illustrating a keyword automatic recognition method by a keyword automatic recognizer according to the embodiment of FIG. 3.
도 4에서 나타낸 바와 같이, 키워드 자동 인식 방법은 텍스트 판독단계(S110)와 키워드 정합 판단단계(S120)를 포함하여 이루어진다. As shown in FIG. 4, the automatic keyword recognition method includes a text reading step S110 and a keyword matching determining step S120.
텍스트 판독단계(S100)에서는 키워드 자동 인식기(100)의 텍스트 판독부(110)가 해당 문서 객체 모델의 문서요소를 판독하여, 속성이 텍스트(text)인 문서요소의 태그 밸류(tag value)를 문자열로 인식하고, 인식된 문자열을 키워드 정합 판단부((130)로 전달한다.In the text reading step (S100), the
텍스트 판독단계(S110)는 웹브라우저에서 발생되는 "웹페이지 로딩 완료 이벤트" 등의 이벤트에 의하여 기동될 수 있다. The text reading step S110 may be triggered by an event such as a "web page loading completion event" generated in a web browser.
다음으로, 키워드 정합 판단단계(S120)에서는, 텍스트 판독부(110)로부터 전달된 문자열에 대하여 키워드 정합 판단부(130)가 파싱을 수행하여 대상 키워드를 추출하고, 추출된 대상 키워드가 찾고자 하는 키워드인지 여부를 판단한다. Next, in the keyword matching determination step (S120), the keyword
이 때, 키워드 정합 여부의 판단은 대응 키워드 저장부(120)에서 저장되고 관리되는 대응 키워드와의 비교를 통하여 이루어진다. At this time, the determination of keyword matching is made through comparison with the corresponding keyword stored and managed in the corresponding
예컨대, 대응 키워드 저장부(120)가 해시 테이블로 이루어진 경우에는, 대상 키워드에 대한 해시 함수의 결과값에 따라 해당 대상 키워드가 찾고자 하는 키워드인지 여부를 판단하게 된다. For example, when the corresponding
만약 대상 키워드가 찾고자 하는 키워드가 아닌 경우에는, 해당 대상 키워드는 그대로 웹브라우저로 반환(리턴)되며, 대상 키워드가 찾고자 하는 키워드인 경우에는, 별도의 단계를 통하여 대상 키워드에 관한 부가정보를 더 생성할 수도 있는데, 이에 대해서는 후술하기로 한다.If the target keyword is not the keyword to be searched, the target keyword is returned (returned) to the web browser as it is. If the target keyword is the keyword to be searched, additional information about the target keyword is generated through a separate step. This may be described later.
도 5는 도 4의 키워드 자동 인식 방법을 더욱 자세히 나타낸 실시예에 관한 흐름도이다. FIG. 5 is a flowchart illustrating an embodiment of the method of automatically detecting a keyword of FIG. 4. FIG.
도 5의 실시예는, 텍스트 판독단계(S110)에 대한 하위 단계(S112,S114,S115,S116,S118) 및 키워드 정합 판단단계(S120)에 대한 하위 단계(S122,S124,S125,S126,S128)를 더 포함하여 이루어진다.5, the substeps S112, S114, S115, S116, and S118 for the text reading step S110 and the substeps S122, S124, S125, S126, and S128 for the keyword matching determination step S120. ) Is further included.
도 5에서 나타낸 바와 같이, 텍스트 판독 단계(S110)에서는 먼저 문서 객체 모델의 각 문서요소의 속성이 판독된다(S112).As shown in Fig. 5, in the text reading step S110, the attributes of each document element of the document object model are first read out (S112).
이에 따라, 만약 문서요소의 속성이 텍스트(text)인 경우에는 해당 문서요소의 내용을 문자열로 간주하여 이를 키워드 정합 판단부로 전달한다(S114,S115).Accordingly, if the attribute of the document element is text, the content of the document element is regarded as a string and transmitted to the keyword matching determination unit (S114, S115).
만약 문서요소의 속성이 텍스트가 아닌 경우에는, 이를 스킵한다(S114,S116).If the attribute of the document element is not text, it is skipped (S114, S116).
이러한 방식으로 문서 객체 모델 내의 모든 문서요소에 대하여 순차적으로 문서요소 속성을 판독함으로써 추출된 문자열을 키워드 정합 판단부로 전달함으로써 텍스트 판독단계의 수행이 완료된다(S118). In this manner, the text reading step is completed by transferring the extracted character string to the keyword matching determination unit by sequentially reading the document element attributes for all the document elements in the document object model (S118).
다음으로, 키워드 정합 판단단계(S120)에서는 텍스트 판독부로부터 전달된 문자열에 대하여 파싱이 수행됨으로써, 문자열로부터 대상 키워드(들)를 추출하게 된다(S122).Next, in the keyword matching determination step S120, parsing is performed on the string transmitted from the text reading unit, thereby extracting the target keyword (s) from the string (S122).
키워드 정합 판단부는 추출된 대상 키워드(들)에 대해서 대응 키워드 저장부를 참조하여 대응 키워드 존재 여부를 판단한다(S124).The keyword matching determination unit determines whether there is a corresponding keyword with reference to the corresponding keyword storage unit with respect to the extracted target keyword (s) (S124).
만약 대응 키워드가 존재하는 경우에는 해당 대상 키워드를 일치 키워드로 분류하며(S125), 대응 키워드가 존재하지 않는 경우에는 불일치 키워드로 분류한다(S126). 분류 단계(S125,S126) 이후에는 해당 대상 키워드를 웹브라우저로 리턴하는 단계가 더 포함될 수 있다. If there is a corresponding keyword, the target keyword is classified as a match keyword (S125), and if there is no corresponding keyword, it is classified as a mismatch keyword (S126). After the classification step (S125, S126) may further include the step of returning the target keyword to the web browser.
이러한 키워드 정합 판단단계는 앞서 서술한 바와 같이, 2 단어 키워드, 3 단어 키워드 등 복합어 키워드에 대해서도 수행될 수 있으며, 모든 키워드에 대해서 대응 키워드 존재여부에 관한 판단이 수행되면 키워드 정합 판단단계가 종료된다(S128). As described above, the keyword matching determination step may be performed on a compound word keyword, such as a two word keyword or a three word keyword, and the keyword matching determination step is terminated when the determination regarding the existence of the corresponding keyword is performed for all keywords. (S128).
도 6은 도 4의 키워드 자동 인식 방법을 더욱 자세히 나타낸 다른 실시예에 관한 흐름도이다. 6 is a flowchart illustrating another embodiment of the method for automatically recognizing a keyword of FIG. 4.
도 5의 실시예와 도 6의 실시예의 가장 큰 차이점은, 도 5의 실시예에서는 텍스트 판독과 키워드 정합판단이 특정 웹페이지를 기준으로 수행되는 반면, 도 6의 실시예는 웹페이지 내의 특정 대상 키워드를 기준으로 수행된다는 점이다.The main difference between the embodiment of FIG. 5 and the embodiment of FIG. 6 is that in the embodiment of FIG. 5, text reading and keyword matching are performed based on a specific web page, whereas the embodiment of FIG. Is performed based on keywords.
즉, 도 6의 실시예에서는 문자열의 판독 및 파싱을 통하여 추출된 하나의 대상 키워드에 대하여 키워드 정합 여부에 관한 판단이 수행되기까지의 일련의 절차를 기본 단위로 하여 각 대상 키워드마다 순차적으로 키워드 자동 인식 절차가 수행된다. That is, in the exemplary embodiment of FIG. 6, the keyword is sequentially automatically generated for each target keyword based on a series of procedures until a determination as to whether keyword matching is performed on one target keyword extracted through reading and parsing a character string. Recognition procedure is performed.
도 6의 텍스트 판독단계(S110a)에서, 텍스트 판독부가 웹페이지의 문서 객체 모델 내의 문서요소의 속성을 판독하여(S112a), 해당 문서요소의 속성이 텍스트가 아닌 경우 다음 문서요소의 속성을 판독하고(S114a,S116a), 해당 문서요소의 속성이 텍스트인 경우 문자열을 추출하여 키워드 정합 판단부로 전달하는(S114a,S15a) 과정은 도 5의 실시예와 유사하다. In the text reading step S110a of FIG. 6, the text reading unit reads an attribute of the document element in the document object model of the web page (S112a), and if the attribute of the document element is not text, reads the attribute of the next document element. In operation S114a and S116a, when the attribute of the corresponding document element is text, the process of extracting a character string and transferring it to the keyword matching determination unit is similar to the embodiment of FIG. 5.
다만, 도 6의 실시예에서는 웹페이지의 문서 객체 모델 내의 하나의 텍스트 문서요소 내의 문자열만이 키워드 정합 판단부로 전달되는 반면(S115a), 도 5의 실시예에서는 웹페이지의 문서 객체 모델 내의 모든 텍스트 문서요소 내의 문자열이 전달된다는 차이점이 있다. However, in the embodiment of FIG. 6, only a string in one text document element in the document object model of the web page is transmitted to the keyword matching determining unit (S115a). In the embodiment of FIG. 5, all the text in the document object model of the web page is transmitted. The difference is that the string within the document element is passed.
이러한 차이점이 존재함에 따라, 키워드 정합 판단단계(S120a)에서도, 하나의 문자열에 대해서만 파싱 및 대상 키워드(들)가 추출되고(S122a), 대응 키워드 존재여부 판단단계(S124a) 및 그에 따른 키워드 분류 단계(S125a,S126a)가 수행된다. As such a difference exists, even in the keyword matching determination step (S120a), parsing and target keyword (s) are extracted only for one character string (S122a), and the corresponding keyword existence determination step (S124a) and the keyword classification step accordingly. (S125a, S126a) are performed.
하나의 텍스트 문서요소로부터 추출한 문자열에 대하여 키워드 정합여부 판단이 완료되면, 키워드 정합 판단부가 모든 문서요소에 대하여 처리가 완료되었는지 여부를 판단한 후(S128a), 처리되지 않은 문서요소가 남은 경우에는 다음 문서요소를 처리 대상으로 지정한 후(S116a), 다시 문서요소의 속성 판독 절차부터 순차적으로 재개한다. When the keyword matching determination is completed with respect to the character string extracted from one text document element, after the keyword matching determination unit judges whether or not the processing is completed for all the document elements (S128a), and if the unprocessed document element remains, the next document After the element is designated as the processing target (S116a), the process is resumed sequentially from the attribute reading procedure of the document element.
이를 통하여 웹페이지의 문서 객체 구조 전체에 대한 키워드 자동 인식이 수행될 수 있게 된다. Through this, keyword automatic recognition of the entire document object structure of the web page can be performed.
도 7은 키워드 부가정보 제공기의 일례를 나타낸 도면이다. 7 is a diagram illustrating an example of a keyword additional information provider.
도 7의 실시예에 의한 키워드 부가정보 제공기는, 웹페이지 내에서 키워드를 자동 인식한 경우, 해당 키워드에 대하여 부가정보(예컨대 하이퍼텍스트 링크정보 또는 관련 이미지 및/또는 텍스트를 포함하는 팝업정보 등)를 제공하는 장치이다.When the keyword additional information provider according to the embodiment of FIG. 7 automatically recognizes a keyword in a web page, the keyword additional information provider provides additional information (for example, hypertext link information or pop-up information including related images and / or text) about the keyword. It is a device that provides.
도 7에서 나타낸 바와 같이, 키워드 부가정보 제공기(200)의 일례는, 텍스트 판독부(210), 대응 키워드 저장부(230), 키워드 정합 판단부(240) 및 부가정보 생성부(250)를 포함하여 이루어진다. As illustrated in FIG. 7, an example of the keyword
한편, 도 7의 키워드 부가정보 제공기(200)의 문서요소 중에서, 텍스트 판독부(210), 대응 키워드 저장부(230) 및 키워드 정합 판단부(240)는 각각 도 3의 키워드 자동 인식기(100)의 문서요소 중 텍스트 판독부(110), 대응 키워드 저장부(120) 및 키워드 정합 판단부(130)에 대응되므로, 각각의 문서요소(210,230,240)의 기능 중 공통되는 부분에 관한 상세한 설명은 이를 생략하기로 한다.Meanwhile, among the document elements of the keyword
또한, 앞서 도 3의 키워드 자동 인식기(100)를 설명하면서 언급한 바와 같이, 키워드 정합 판단부(240)는 특정 대상 키워드에 대하여 대응 키워드 저장부(230)에 대응 키워드가 존재한다고 판단된 경우, 해당 키워드에 대하여 부가정보를 더 생성한 후 웹브라우저에 리턴하도록 할 수 있다. In addition, as described above with reference to the keyword
이를 위하여, 도 7의 키워드 부가정보 제공기(200)는 각각의 대응 키워드에 관하여 부가정보를 생성하는 부가정보 생성부(250)를 더 구비한다. To this end, the keyword
부가정보 생성부는 각각의 대응 키워드에 관하여 생성할 부가정보의 내용 및 규칙을 관리하고 있으므로, 키워드 정합 판단부(240)로부터 특정 대응 키워드에 관한 부가정보의 생성을 요청받는 경우, 그에 따른 부가정보를 생성하여 키워드 정합 판단부(240)로 반환한다. Since the additional information generation unit manages the content and rules of additional information to be generated for each corresponding keyword, when the keyword
예를 들어, 만약 대응 키워드가 특정 지역의 주소를 나타내는 키워드이고, 제공하여야 할 부가정보의 내용이 "특정 인터넷 지도 서비스에서의 해당 주소의 지도상의 좌표에 대응되는 하이퍼링크"인 경우에는, 부가정보 생성부(250)는 키워드 정합 판단부(240)로부터 전달받은 "주소"에 대하여 하이퍼링크 정보를 더 부가한 후 키워드 정합 판단부(240)로 반환하게 된다. For example, if the corresponding keyword is a keyword indicating an address of a specific area, and the content of the additional information to be provided is "a hyperlink corresponding to the coordinate on the map of the address in a specific Internet map service", the additional information The
부가정보 생성부(250)로부터 "하이퍼링크가 부가된 대상 키워드"를 전달받은 키워드 정합 판단부(240)는 이를 다시 웹브라우저에 반환함으로써, 최종적으로 웹브라우저의 윈도우 화면 상에는 "특정 인터넷 지도 서비스에서의 해당 주소의 지도상의 좌표에 대응되는 하이퍼링크가 부가된 형태"로 대상 키워드가 보여지게 된다. The keyword
PC의 사용자는 이를 통하여, 그 웹페이지의 제공자(작성자)가 직접 해당 대상 키워드에 관하여 부가정보를 제공하지 않았음에도 불구하고, 대상 키워드를 클릭함으로써 (키워드 부가정보 제공기를 배포한 자가 지정한) 특정 인터넷 지도 서비스에서 대상 키워드(주소)의 지도상 위치를 확인할 수 있게 된다. This allows a user of a PC to access a particular Internet (designated by the person who distributes the keyword supplementary information provider) by clicking on the target keyword, even though the provider of the web page has not provided additional information about the target keyword. The map service can check the location of the target keyword (address) on the map.
도 8은 도 7의 키워드 부가정보 제공기에 의한 키워드 부가정보 제공방법의 일례를 나타낸 흐름도이다. 8 is a flowchart illustrating an example of a method for providing keyword additional information by the keyword additional information provider of FIG. 7.
도 8에서 나타낸 바와 같이, 키워드 부가정보 제공방법(S200)은, 텍스트 판독단계(S210), 키워드 정합 판단단계(S220) 및 부가정보 생성단계(S230)를 포함하여 이루어진다. As shown in FIG. 8, the method of providing additional keyword information S200 includes a text reading step S210, a keyword matching determination step S220, and an additional information generating step S230.
도 7에서 언급한 바와 마찬가지로, 키워드 부가정보 제공기에 의한 키워드 부가정보 제공방법(S200)의 각 구성단계 중에서, 텍스트 판독단계(S210) 및 키워드 정합 판단단계(S220)는 각각 키워드 자동 인식 방법에 관한 첫번째 실시예에서의 텍스트 판독단계(S110)와 키워드 정합 판단단계(S120) 또는 두번째 실시예에서의 텍스트 판독단계(S110a)와 키워드 정합 판단단계(S120a)에 대응되므로, 구성단계(S210,S220,S230) 중 공통되는 부분에 관한 상세한 설명은 이를 생략하기로 한다.As mentioned in FIG. 7, among the respective configuration steps of the method of providing keyword additional information by the keyword additional information provider S200, the text reading step S210 and the keyword matching determination step S220 are each related to a keyword automatic recognition method. Since it corresponds to the text reading step S110 and the keyword matching determining step S120 in the first embodiment or the text reading step S110a and the keyword matching determining step S120a in the second embodiment, the configuration steps S210, S220, Detailed description of the common parts in S230 will be omitted.
한편, 부가정보 생성단계(S230)에서는 부가정보 생성부(250)에서 대응키워드에 관한 부가정보를 생성하여, 해당 대응키워드에 관한 대상키워드에 생성된 부가정보를 부가하여 키워드 정합 판단부(240)로 반환하게 된다. Meanwhile, in the additional information generating step (S230), the additional
"부가정보가 부가된 대상키워드"는 키워드 정합 판단부(240)에 의하여 다시 웹브라우저로 반환되므로, 최종적으로 사용자 PC의 웹브라우저 상에서 "부가정보가 부가된 대상키워드"가 출력될 수 있게 된다. Since the "target keyword with additional information" is returned to the web browser by the keyword
한편, 부가정보는 단지 하이퍼링크만으로 한정되는 것이 아니다. On the other hand, the additional information is not limited to only hyperlinks.
도 9는 키워드 부가정보 제공기에 의하여 제공되는 부가정보의 다른 예에 관한 도면이다. 9 is a diagram illustrating another example of additional information provided by a keyword additional information provider.
도 9에서 나타낸 바와 같이, 부가정보는 대상 키워드와 관련된 이미지 및/또는 텍스트를 더 부연설명해주는 팝업정보의 형태로 표현될 수도 있다. As illustrated in FIG. 9, the additional information may be expressed in the form of pop-up information that further describes an image and / or text related to the target keyword.
예컨대, 도 9에서 음영으로 표시된 "대형할인점"이 대응키워드 저장부(220)에 저장된 대응키워드이고, 해당 대응키워드에 관하여 제공되는 부가정보의 내용이 해당 대형할인점에 관한 이미지 정보(412)와 텍스트 정보(414)를 포함하는 팝업정보(410)가 되도록 할 수도 있다. For example, the "large discount point" shaded in FIG. 9 is the corresponding keyword stored in the corresponding keyword storage unit 220, and the content of the additional information provided with respect to the corresponding keyword is the
일례로서, 팝업정보(410)는 동일한 웹페이지의 해당 대상키워드 근처에서 표시되는 팝업윈도우(popup window) 레이어(layer)로 구현될 수 있다. As an example, the pop-up
도 9의 예에서, 키워드 정합 판단부(240)가 부가정보 생성부(250)에 부가정보 생성을 요청하게 되면, 부가정보 생성부(250)가 대응키워드에 관한 이미지 정보(412)와 텍스트 정보(414)를 포함하도록 팝업정보(410)를 생성한 후, 팝업정보를 출력할 수 있는 부가정보가 부가된 대상키워드를 키워드 정합 판단부(240)에 리턴하게 된다. 이어서 키워드 정합 판단부(240)가 이를 웹브라우저로 다시 반환하게 되면, 최종적으로 사용자는 해당 키워드("대형할인점")에 대하여 팝업으로 출력되는 부가정보(410)를 확인할 수 있게 되는 것이다. In the example of FIG. 9, when the keyword
부가정보(410)는 예컨대 웹브라우저 상에서 하나의 레이어에 표시되도록 할 수도 있으며, 부가정보(410)가 표현되는 조건을 해당 키워드 상에 마우스포인터(400)가 배치되는 이벤트가 검출되는 것으로 하는 등의 예가 가능하다. For example, the
물론, 팝업정보(410)가 레이어 이외의 방법으로 표시되도록 하는 것도 가능하며, 부가정보의 표현 조건도 위의 이벤트 검출 이외의 다양한 조건을 모두 적용할 수 있다. Of course, the pop-up
나아가, 팝업정보(410) 영역이나 팝업정보(410) 영역 내의 관련 이미지(412), 텍스트(414) 등에 앞서 설명한 바와 같은 하이퍼링크 정보를 더 부가할 수 있음도 자명하다. Furthermore, it is apparent that the hyperlink information as described above may be further added to the
도 10은 키워드 부가정보 제공기의 또다른 실시예를 나타낸 도면이다. 10 is a view showing another embodiment of a keyword additional information provider.
도 10의 실시예에 따른 키워드 부가정보 제공기는, 텍스트 판독부(210), 대응 키워드 저장부(230), 키워드 정합 판단부(240), 부가정보 생성부(250a) 및 부가정보 저장부(260)를 포함하여 이루어진다. The keyword additional information provider according to the exemplary embodiment of FIG. 10 may include a
도 7과 도 10의 차이점은, 도 10의 실시예에 따른 키워드 부가정보 제공기는 부가정보 저장부를 더 포함한다는 점이다. The difference between FIG. 7 and FIG. 10 is that the keyword additional information provider according to the embodiment of FIG. 10 further includes an additional information storage.
부가정보 생성부(250,250a)는 대응키워드에 관하여 생성되는 부가정보의 생성 규칙뿐만 아니라, 부가되는 정보 자체를 더 필요로 할 수 있다. The additional
예컨대, 도 9의 팝업정보(410)와 같은 부가정보를 생성하는 과정에서, 이미지 정보(412)나 텍스트 정보(414)를 인터넷으로 연결된 외부의 PC나 서버 등으로부터 전송받아 팝업정보(410)를 생성할 수도 있다. For example, in the process of generating additional information such as the pop-up
그러나, 상황에 따라서는 이미지 정보(412)나 텍스트 정보(414)를 해당 사용자 PC 내에 저장하여야 할 수 있다. 여기에는 부가정보 생성의 처리속도나 인터넷 연결상태 등 여러 요인이 작용할 수 있다. However, depending on the situation,
키워드 부가정보 제공기는 사용자 PC에 설치된 툴바 프로그램의 일부로 제공될 수 있으므로, 이러한 경우에 부가정보 저장부(260)는 툴바 프로그램의 설치 시에 함께 설치된 후, 외부의 PC나 서버 등으로부터 부가정보 저장부(260)에 저당되어야 하는 부가정보를 내려받아 저장하도록 할 수 있다. Since the keyword additional information provider may be provided as a part of a toolbar program installed in the user PC, in this case, the additional
한편, 대응키워드 저장부(230), 부가정보 생성부(250,250a) 및 부가정보 저장부(260) 내의 일체의 대응키워드, 대응키워드에 관한 부가정보의 조건 및 내용 등은 지속적으로 갱신되어야 할 필요가 있다. Meanwhile, all the corresponding keywords in the corresponding
이를 위하여, 도면에서 표현되지는 않았지만 키워드 부가정보 제공기는 업데이트부를 더 포함하도록 할 수 있다. To this end, although not represented in the drawing, the keyword additional information provider may further include an update unit.
업데이트부가 키워드 부가정보 제공기와의 상호작용을 행하는 외부의 서버로부터의 요청에 따라, 대응키워드 저장부(230), 부가정보 생성부(250),250a) 및 부가정보 저장부(260)의 내용을 외부의 서버로부터 내려받거나 변경함으로써, 키워드 부가정보 제공기가 항상 최신의 상태로 갱신되도록 할 수 있다. In response to a request from an external server that the updater interacts with the keyword additional information provider, the contents of the corresponding
이상에서 설명한 본 발명의 실시예는 장치 및 방법을 통해서만 구현이 되는 것은 아니며, 본 발명의 실시예의 구성에 대응하는 기능을 실현하는 프로그램 또는 그 프로그램이 기록된 기록 매체를 통해 구현될 수도 있으며, 이러한 구현은 앞서 설명한 실시예의 기재로부터 본 발명이 속하는 기술분야의 전문가라면 쉽게 구현할 수 있는 것이다. The embodiments of the present invention described above are not only implemented by the apparatus and method but may be implemented through a program for realizing the function corresponding to the configuration of the embodiment of the present invention or a recording medium on which the program is recorded, The embodiments can be easily implemented by those skilled in the art from the description of the embodiments described above.
이상에서 본 발명의 실시예에 대하여 상세하게 설명하였지만 본 발명의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 발명의 권리범위에 속하는 것이다.Although the embodiments of the present invention have been described in detail above, the scope of the present invention is not limited thereto, and various modifications and improvements of those skilled in the art using the basic concepts of the present invention defined in the following claims are also provided. It belongs to the scope of rights.
도 1은 웹페이지 내의 특정 문자열을 검색어로 하는 검색 결과를 제공하는 기법의 일례를 나타낸 도면,1 is a diagram illustrating an example of a technique of providing a search result using a specific string in a web page as a search word.
도 2는 웹페이지 내의 특정 문자열을 검색어로 하는 검색 결과를 제공하는 기법의 다른 예를 나타낸 도면,2 is a diagram illustrating another example of a technique of providing a search result using a specific string in a web page as a search word;
도 3은 키워드 자동 인식기의 일례를 나타낸 도면,3 is a view showing an example of a keyword automatic recognizer;
도 4는 도 3의 실시예에에 따른 키워드 자동 인식기에 의한 키워드 자동 인식 방법을 나타낸 흐름도,4 is a flowchart illustrating a keyword automatic recognition method by a keyword automatic recognizer according to the embodiment of FIG. 3;
도 5는 도 4의 키워드 자동 인식 방법을 더욱 자세히 나타낸 실시예에 관한 흐름도,FIG. 5 is a flowchart illustrating an embodiment of the method for automatically recognizing a keyword of FIG. 4; FIG.
도 6은 도 4의 키워드 자동 인식 방법을 더욱 자세히 나타낸 다른 실시예에 관한 흐름도,6 is a flowchart illustrating another embodiment of the method for automatically recognizing a keyword of FIG. 4 in more detail.
도 7은 키워드 부가정보 제공기의 일례를 나타낸 도면,7 is a diagram illustrating an example of a keyword additional information provider;
도 8은 도 7의 키워드 부가정보 제공기에 의한 키워드 부가정보 제공방법의 일례를 나타낸 흐름도,8 is a flowchart illustrating an example of a method for providing keyword additional information by the keyword additional information provider of FIG. 7;
도 9는 키워드 부가정보 제공기에 의하여 제공되는 부가정보의 다른 예에 관한 도면,9 is a diagram of another example of additional information provided by a keyword additional information provider;
도 10은 키워드 부가정보 제공기의 또다른 실시예를 나타낸 도면이다. 10 is a view showing another embodiment of a keyword additional information provider.
Claims (18)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020090069267A KR101079288B1 (en) | 2009-07-29 | 2009-07-29 | Method and apparatus for automatically recognizing keywords and providing related additional information |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020090069267A KR101079288B1 (en) | 2009-07-29 | 2009-07-29 | Method and apparatus for automatically recognizing keywords and providing related additional information |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20110011840A true KR20110011840A (en) | 2011-02-09 |
KR101079288B1 KR101079288B1 (en) | 2011-11-04 |
Family
ID=43771841
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020090069267A KR101079288B1 (en) | 2009-07-29 | 2009-07-29 | Method and apparatus for automatically recognizing keywords and providing related additional information |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101079288B1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111931952A (en) * | 2020-07-04 | 2020-11-13 | 华电联合(北京)电力工程有限公司 | Power equipment abnormity analysis reporting method and device, electronic equipment and storage medium |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100824434B1 (en) | 2006-06-19 | 2008-04-22 | (주)첫눈 | Additional information providing method and apparatus by dynamically combining it with core keywords of contents |
KR100901134B1 (en) | 2008-09-09 | 2009-06-04 | 김수현 | Tag display system for analysing morpheme and source code |
-
2009
- 2009-07-29 KR KR1020090069267A patent/KR101079288B1/en active IP Right Grant
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111931952A (en) * | 2020-07-04 | 2020-11-13 | 华电联合(北京)电力工程有限公司 | Power equipment abnormity analysis reporting method and device, electronic equipment and storage medium |
Also Published As
Publication number | Publication date |
---|---|
KR101079288B1 (en) | 2011-11-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8615508B2 (en) | Artificial anchor for a document | |
US7299407B2 (en) | Marking and annotating electronic documents | |
CN109033358B (en) | Method for associating news aggregation with intelligent entity | |
JP3703080B2 (en) | Method, system and medium for simplifying web content | |
US8392449B2 (en) | Resource search operations | |
US7809710B2 (en) | System and method for extracting content for submission to a search engine | |
CN101918945B (en) | Automatic expanded language search | |
US9858314B2 (en) | System and method for refining search results | |
US20090199083A1 (en) | Method of enabling the modification and annotation of a webpage from a web browser | |
US20210019470A1 (en) | Identifying Information Using Referenced Text | |
US7698329B2 (en) | Method for improving quality of search results by avoiding indexing sections of pages | |
US7421416B2 (en) | Method of managing web sites registered in search engine and a system thereof | |
CN107870915B (en) | Indication of search results | |
US8108410B2 (en) | Determining veracity of data in a repository using a semantic network | |
CN114021042A (en) | Webpage content extraction method and device, computer equipment and storage medium | |
CN114443928B (en) | Web text data crawler method and system | |
KR102023147B1 (en) | Application partial deep link to the corresponding resource | |
JP2007193697A (en) | Information collection apparatus, information collection method and program | |
US11768804B2 (en) | Deep search embedding of inferred document characteristics | |
KR101079288B1 (en) | Method and apparatus for automatically recognizing keywords and providing related additional information | |
KR102280028B1 (en) | Method for managing contents based on chatbot using big-data and artificial intelligence and apparatus for the same | |
US20230081042A1 (en) | Apparatus and method for processing natural language | |
KR20040086732A (en) | A method of managing web sites registered in search engine and a system thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20140926 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20150811 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20160908 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20190329 Year of fee payment: 9 |