KR20010064265A - Web filtering system and method using thereof in internet - Google Patents

Web filtering system and method using thereof in internet Download PDF

Info

Publication number
KR20010064265A
KR20010064265A KR1019990062415A KR19990062415A KR20010064265A KR 20010064265 A KR20010064265 A KR 20010064265A KR 1019990062415 A KR1019990062415 A KR 1019990062415A KR 19990062415 A KR19990062415 A KR 19990062415A KR 20010064265 A KR20010064265 A KR 20010064265A
Authority
KR
South Korea
Prior art keywords
search
document
user
documents
analyzer
Prior art date
Application number
KR1019990062415A
Other languages
Korean (ko)
Other versions
KR100362381B1 (en
Inventor
이상무
구경철
이준섭
박종봉
박기식
Original Assignee
오길록
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 오길록, 한국전자통신연구원 filed Critical 오길록
Priority to KR1019990062415A priority Critical patent/KR100362381B1/en
Publication of KR20010064265A publication Critical patent/KR20010064265A/en
Application granted granted Critical
Publication of KR100362381B1 publication Critical patent/KR100362381B1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24575Query processing with adaptation to user needs using context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)

Abstract

PURPOSE: A method and system for filtering the web are provided to offer a priority order deciding method considering interest of a user with respect to an information search and to reduce a searching space by using an estimation mechanism. CONSTITUTION: A search demanding analyzer(200) performs a function for analyzing search demanding contents for accessing contents as a searching keyword inputted from a user to a demand of the user at supplying a search result. A search document analyzer(210) performs a function for analyzing the searched document for an adjustment adapted to the demand of the user. A search document converter(220) performs a function for processing actual application contents in a document selected adapted to the demand of the user from the selected document. A filter(230) performs a function selecting documents adjacent to the demand of the user from the searched document based on analyzed search demanding information. That is, the filter(230) receives and stores search demanding information analyzed from the search demanding analyzer(200) and extracts necessary document by applying and preparing the analyzed demanding information to initial search documents transmitted from the search document analyzer(210), and transmits the documents to the search document converter(220).

Description

웹 여과 시스템 및 그 운용 방법 {Web filtering system and method using thereof in internet}Web filtering system and method using method in internet}

본 발명은 인터넷에서의 웹 여과 시스템 및 그 운용 방법에 관한 것이며, 특히, 검색 정보에 대한 사용자의 관심도를 고려한 우선 순위 결정 방법 및 검색 공간의 규모를 줄이기 위한 추정 메커니즘을 사용한 웹 여과 시스템 및 그 운용 방법에 관한 것이다.BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a web filtration system and an operation method thereof on the Internet. In particular, a web filtration system using a prioritization method considering a user's interest in search information and an estimation mechanism for reducing the size of a search space and its operation It is about a method.

종래의 검색 도구에 의하면 검색 키워드를 통하여 그것을 포함하고 있는 모든 웹 페이지를 탐색하고, 해당 문서들의 인터넷 주소를 링크시킨 결과 목록을 띄우게 되는데, 이들 링크를 따라 원하는 내용이 포함된 사이트를 찾는다는 것은 출력된 결과 목록의 건수 자체가 보통 수백 건에 달하는 량이고, 또한, 관심있는 타이틀이 먼저 나온다면 모르지만, 그러한 것은 일정한 규칙이 있는 것이 아니며, 사용자가 원하는 타이틀이 어디에 있는지 알 수 없는 상태에서 그것이 거의 검색된 목록의 뒷 부분에 있다면, 거기에 다다르기까지 매 건을 일일이 눈으로 확인하여야 하는 단순하고 피로한 작업을 반복하여야 한다.According to a conventional search tool, a search keyword searches all web pages including the web page and links the document's Internet address to a list of results. The search results show that the site contains the desired content. The number of results in the list is usually hundreds, and if the title of interest comes first, it doesn't have any rules, and it's almost never found without knowing where the title you want is located. If you're at the end of the list, you'll have to repeat a simple and tiring task that requires you to visually check each case until you get there.

더욱이 관심있는 타이틀을 발견하였다고 하더라도, 실제 그 내용을 디스플레이하였을 때, 다시 그것이 원하는 내용일 것이라는 보장 역시 없다는 문제점이 있다. 또한, 때로는 단순히 검색 용어만 일치했을 뿐, 전혀 무관한 결과를 출력하는 비중도 적지 않다.Moreover, even if a title of interest has been found, there is no guarantee that when the content is actually displayed, it will again be the desired content. Also, sometimes only the search terms are matched, and the weight of outputting irrelevant results is not small.

본 발명은 상기와 같은 종래 기술의 문제점을 해결하기 위하여 안출된 것으로서, 검색 정보에 대한 사용자의 관심도를 고려한 우선 순위 결정 방법 및 검색 공간의 규모를 줄이기 위한 추정 메커니즘을 사용한 웹 여과 시스템 및 그 운용 방법을 제공하는데 그 목적이 있다.The present invention has been made to solve the above problems of the prior art, a web filtering system using a prioritization method in consideration of the user's interest in search information and an estimation mechanism for reducing the size of the search space and its operation method The purpose is to provide.

도 1은 본 발명의 일 실시예에 따른 웹 여과 시스템이 포함된 인터넷 검색 시스템의 구성도이고,1 is a block diagram of an Internet search system including a web filtration system according to an embodiment of the present invention,

도 2는 본 발명의 일 실시예에 따른 웹 여과 시스템의 구성도로서, 상기 웹 여과 시스템이고,2 is a block diagram of a web filtration system according to an embodiment of the present invention, wherein the web filtration system,

도 3은 본 발명의 일 실시예에 따른 웹 여과 시스템의 작동 절차를 나타낸 흐름도이다.3 is a flowchart illustrating an operating procedure of the web filtration system according to an embodiment of the present invention.

앞서 설명한 바와 같은 목적을 달성하기 위한 본 발명에 따르면, 검색 키워드가 입력되면, 검색 요구 내용이 무엇인지를 분석하는 검색 요구 분석기; 상기 검색 키워드에 따라 검색된 문서들을 웹 서버로부터 입력받아 상기 검색된 문서들을 분석하는 검색 문서 분석기; 상기 검색 문서 분석기에서 분석된 정보를 참조하여 상기 웹 서버로부터 입력된 검색된 문서를 재차 여과시키는 여과기; 및 상기 여과기에서 여과된 문서를 사용자의 요구에 따른 형태로 변환하는 검색 문서 변환기를 포함하여 이루어진 것을 특징으로 하는 웹 여과 시스템이 제공된다.According to the present invention for achieving the above object, a search request analyzer for analyzing what the search request is, if a search keyword is input; A search document analyzer configured to receive documents searched according to the search keyword from a web server and analyze the searched documents; A filter for re-filtering the searched document input from the web server with reference to the information analyzed by the search document analyzer; And a search document converter for converting the document filtered by the filter into a form according to a user's request.

또한, 사용자에 의한 검색 요구 메시지가 수신되면, 검색 주소 및 검색 키워드를 추출한 후, 필요한 검색 제약 조건을 생성하는 제 1 단계; 상기 제 1 단계에서 추출한 검색 주소에 따른 문서를 추출하고, 검색 공간을 최적화한 후, 검색 시간 및 검색 공간을 계산하여, 기설정한 값 이하인지 여부를 판단하는 제 2 단계; 상기 제 2 단계에서의 판단 결과, 기설정한 값 이하이면, 상기 제 1 단계에서 추출 및 생성한 검색 키워드 및 제약 조건을 사용하여 필요한 문서를 선별하고, 상기 선별된 결과 문서들에 연결 표시를 삽입한 후, 우선 순위를 결정하는 제 3 단계; 및 상기 제 2 단계에서의 판단 결과, 기설정한 값을 초과하면, 상기 검색 제약 조건을 변경한 후, 상기 제 2 단계로 복귀하는 제 4 단계를 포함하여 이루어진 것을 특징으로 하는 웹 여과 시스템의 운영 방법이 제공된다.In addition, when the search request message by the user is received, the first step of extracting the search address and the search keyword, and generates the necessary search constraints; A second step of extracting a document according to the search address extracted in the first step, optimizing a search space, calculating a search time and a search space, and determining whether the document is equal to or less than a preset value; If the determination result in the second step is less than or equal to a predetermined value, the necessary documents are selected using the search keywords and constraints extracted and generated in the first step, and a connection mark is inserted into the selected result documents. A third step of determining priorities; And a fourth step of returning to the second step after changing the search constraint if the predetermined value is exceeded as a result of the determination in the second step. A method is provided.

또한, 컴퓨터에, 사용자에 의한 검색 요구 메시지가 수신되면, 검색 주소 및 검색 키워드를 추출한 후, 필요한 검색 제약 조건을 생성하는 제 1 단계; 상기 제 1 단계에서 추출한 검색 주소에 따른 문서를 추출하고, 검색 공간을 최적화한 후,검색 시간 및 검색 공간을 계산하여, 기설정한 값 이하인지 여부를 판단하는 제 2 단계; 상기 제 2 단계에서의 판단 결과, 기설정한 값 이하이면, 상기 제 1 단계에서 추출 및 생성한 검색 키워드 및 제약 조건을 사용하여 필요한 문서를 선별하고, 상기 선별된 결과 문서들에 연결 표시를 삽입한 후, 우선 순위를 결정하는 제 3 단계; 및 상기 제 2 단계에서의 판단 결과, 기설정한 값을 초과하면, 상기 검색 제약 조건을 변경한 후, 상기 제 2 단계로 복귀하는 제 4 단계를 포함하여 이루어진 것을 실행시킬 수 있는 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체가 제공된다.In addition, when the computer receives a search request message by the user, the first step of extracting the search address and the search keyword, and generates the necessary search constraints; A second step of extracting a document according to the search address extracted in the first step, optimizing a search space, calculating a search time and a search space, and determining whether the document is equal to or less than a preset value; If the determination result in the second step is less than or equal to a predetermined value, the necessary documents are selected using the search keywords and constraints extracted and generated in the first step, and a connection mark is inserted into the selected result documents. A third step of determining priorities; And a fourth step of returning to the second step after changing the search constraint if the predetermined value is exceeded as a result of the determination in the second step. A recording medium that can be read by is provided.

아래에서, 본 발명에 따른 양호한 일 실시예를 첨부한 도면을 참조로 하여 상세히 설명하겠다.In the following, with reference to the accompanying drawings, a preferred embodiment according to the present invention will be described in detail.

본 발명은 최대한 사용자의 요구에 맞는 정보만을 추출하여 제공할 수 있도록 하는 동작 메카니즘을 구현한 것이다. 즉, 내부적으로 추출한 문서들에 대하여 사용자 요구에 대한 만족도를 예측할 수 있는 평가 요소를 적용하고, 아울러 검색에 있어서 중요한 성능 요소인 검색 시간 및 검색량의 적절한 조절을 통하여 효율적인 검색을 수행할 수 있도록 방대한 인터넷 공간 상에서의 항해를 최적으로 수행하는 방법을 적용한다.The present invention implements an operation mechanism capable of extracting and providing only information that meets a user's needs as much as possible. In other words, it is possible to apply an evaluation factor that can predict the satisfaction of user's demand on internally extracted documents and to perform an efficient search by appropriately adjusting search time and search volume, which are important performance factors in search. Applies the optimal way of navigating the Internet space.

도 1은 본 발명의 일 실시예에 따른 웹 여과 시스템이 포함된 인터넷 검색 시스템의 구성도로서, 이를 상세히 설명하면 다음과 같다.1 is a block diagram of an Internet search system including a web filtration system according to an embodiment of the present invention.

사용자 시스템(110) 영역에 있는 웹 브라우저(120)를 통하여 사용자는 인터넷 통신 시스템에 연결되게 된다. 웹 서버(130)에 의하여 추출된 초기의 검색 정보(링킹 주소 및 해당 사이트의 문서, 120)는 웹 여과 시스템(112)에 의하여 사용자의 만족도에 부합하는 정보로 가공(여기서 가공이란 정보 자체의 변화가 아니라 초기의 검색 정보인 정보 집합의 사용자의 요구에 근접하기 위한 평가를 통한 변환)되어 출력된다.The user is connected to the internet communication system through the web browser 120 in the user system 110 area. The initial search information (linking address and document of the site, 120) extracted by the web server 130 is processed into information corresponding to the user's satisfaction by the web filtration system 112 (where processing is a change in the information itself). Instead of the initial search information, the information set is converted through evaluation to approach the user's request.

도 2는 본 발명의 일 실시예에 따른 웹 여과 시스템의 구성도로서, 상기 웹 여과 시스템은 검색 요구 분석기(200), 여과기(230), 검색 문서 분석기(210) 및 검색 문서 변환기(220)를 포함하여 이루어진다.2 is a block diagram of a web filtration system according to an embodiment of the present invention, wherein the web filtration system includes a search request analyzer 200, a filter 230, a search document analyzer 210, and a search document converter 220. It is made to include.

상기 검색 요구 분석기(200)는 사용자로부터 입력된 검색 키워드 등의 내용을 차후 검색 결과 제공시 사용자의 수요에 근접시킬 수 있도록, 그 검색 요구 내용이 무엇인지를 분석하는 기능을 수행한다.The search request analyzer 200 performs a function of analyzing what the search request contents are so that the contents of the search keyword inputted by the user can be approached to the demand of the user when providing the search results later.

또한, 상기 검색 문서 분석기(210)는 사용자의 수요에 맞는 조정을 위하여 검색된 문서를 분석하는 기능을 수행한다.In addition, the search document analyzer 210 performs a function of analyzing the searched document for adjustment according to the user's demand.

또한, 상기 검색 문서 변환기(220)는 검색된 문서로부터 다시 사용자의 요구에 맞도록 선별된 문서에서 실제 적용 내용을 가공하는 기능을 수행한다.In addition, the search document converter 220 performs a function of processing the actual application content in the document selected to meet the needs of the user again from the searched document.

또한, 상기 여과기(230)는 분석된 검색 요구 정보를 바탕으로 검색된 문서로부터 사용자의 요구에 근접된 문서들을 선별하는 기능을 수행한다.In addition, the filter 230 performs a function of selecting documents close to the user's request from the searched documents based on the analyzed search request information.

그리고, 통신 서비스 시스템은 인터넷 통신 기반으로서 일반적으로 사용되는 여러가지 검색 툴들을 포함하고 있으며, 상기 웹 여과 시스템 내부 또는 외부에 장착될 수 있다.In addition, the communication service system includes various search tools which are generally used as an internet communication base, and may be mounted inside or outside the web filtration system.

즉, 상기 여과기(230)는 상기 검색 요구 분석기(200)로부터 분석된 검색 요구 정보를 전달받아 저장하고 있다가 상기 검색 문서 분석기(210)로부터 전달받은 초기 검색된 문서들에 그 분석된 요구 정보를 적용, 대비하여 필요한 문서들을 추출하고 이를 상기 검색 문서 변환기(220)로 전송한다.That is, the filter 230 receives and stores the search request information analyzed by the search request analyzer 200 and then applies the analyzed request information to initial searched documents received from the search document analyzer 210. In order to prepare a document, the necessary documents are extracted and transmitted to the search document converter 220.

도 3은 본 발명의 일 실시예에 따른 웹 여과 시스템의 작동 절차를 나타낸 흐름도로서, 이를 상세히 설명하면 다음과 같다.3 is a flowchart illustrating an operation procedure of the web filtration system according to an embodiment of the present invention.

먼저, 스텝 S301에서, 사용자에 의한 검색 요구 메시지가 수신되면, 스텝 S302에서, 웹 여과 시스템을 작동시킬 지 여부를 판단한다. 한편, 상기 검색 요구 메시지는 주로 키워드로 구성되어 있으며, 필요한 검색 제약 조건과 요구되는 주소들로 이루어질 수 있다.First, in step S301, when a search request message by the user is received, it is determined in step S302 whether to operate the web filtration system. On the other hand, the search request message is mainly composed of keywords, it may consist of the necessary search constraints and the required addresses.

상기 스텝 S302에서의 판단 결과, 웹 여과 시스템을 작동시킬 필요가 없으면, 즉, 검색 루트로는 꼭 여과기를 사용하지 않고 보통의 검색 방법을 사용할 것이면, 스텝 S303에서, 바로 검색 문서를 추출하도록 하며, 스텝 S304에서, 추출된 문서들에 연결 표시를 삽입한 후, 스텝 S305에서, 웹 브라우저에 전송한다.As a result of the determination in step S302, if it is not necessary to operate the web filtration system, that is, if a regular search method is to be used without using a filter as a search route, in step S303, a search document is immediately extracted, In step S304, after inserting the connection mark into the extracted documents, in step S305, it transmits to a web browser.

상기 스텝 S302에서의 판단 결과, 웹 여과 시스템을 작동할 필요가 있으면, 스텝 S306에서, 검색 주소를 추출하고, 스텝 S307에서, 검색 키워드를 추출한 후, 스텝 S308에서, 필요한 검색 제약 조건을 추출한다.As a result of the determination in step S302, if it is necessary to operate the web filtration system, the search address is extracted in step S306, the search keyword is extracted in step S307, and then the required search constraints are extracted in step S308.

이어서, 스텝 S309에서, 검색 주소에 따른 문서를 추출하고, 스텝 S310에서,검색 공간을 최적화한 후, 스텝 S311에서, 시간과 검색 공간을 계산한다. 이때, 검색 공간의 최적화는 검색 시간과 인터넷 상에서의 항해 범위 및 검색 문서의 량이 인자가 되어 검색을 평가한 후, 스텝 S312에서, 적정 수준인지 여부를 판단한다.Next, in step S309, the document according to the search address is extracted, and in step S310, the search space is optimized, and in step S311, time and search space are calculated. At this time, the optimization of the search space is based on the search time, the navigation range on the Internet, and the amount of search documents, and the search is evaluated.

상기 스텝 S312에서의 판단 결과, 적정 수준이 되지 못하면, 해당 세션을 종료하고, 검색 제약 조건의 변경을 시도한다.As a result of the determination in step S312, if the proper level is not reached, the session is terminated and the search constraint is changed.

상기 스텝 S312에서의 판단 결과, 적정 수준이면, 스텝 S313에서, 검색 키워드 및 제약 조건을 사용하여 필요한 문서를 선별하고, 스텝 S314에서, 선별된 결과 문서들에 연결 표시를 삽입한 후, 스텝 S315 내지 스텝 S317에서, 연결 우선 순위 결정을 위하여 검색된 주소에 키워드가 매치되는 경우를 최우선 순위로 결정하며, 그 다음은 패러그래프(Paragraph) 단위로 키워드 매치의 여부를 확인하여 검색된 문서마다 우선 순위를 배치시킨다. 이어서, 우선 순위가 결정되면, 스텝 S318에서, 그 정리 결과를 브라우저로 전송한다.As a result of the determination in step S312, if it is an appropriate level, in step S313, necessary documents are selected using a search keyword and constraint conditions, and in step S314, after inserting a linkage indication into the selected result documents, step S315 to step S315; In step S317, the case where a keyword matches the address searched for connection priority determination is determined as the highest priority, and then, whether or not keyword matching is performed in a paragraph unit, priority is placed for each retrieved document. . Then, if the priority is determined, in step S318, the arrangement result is sent to the browser.

여기에서 상기 연결 표시의 처리 과정은 다음과 같다.Herein, the processing of the connection indication is as follows.

검색 스트림이 계속되는 동안 해당 스트림으로부터 하나의 스트링을 판독한다. 만일, 판독한 스트링이 연결 표시에 해당하는 것이면, 그 유형에 따라 검색 주소를 추출하고, 절대 주소로 변환한 다음, 연결 리스트에 삽입한다. 그리고, 그것이 매치되는 지의 여부를 검검하고 링크에 점수를 매긴다.Read a string from the stream while the search stream continues. If the read string corresponds to a concatenated indication, the search address is extracted according to the type, converted to an absolute address, and inserted into the concatenated list. It checks whether it matches and scores the link.

연결 표시의 유형이 또 다른 것이면, 원천이 되는 주소를 추출한 후, 그것을 절대 주소로 변환하고, 해당 스트링을 임시 버퍼에 삽입한다. 또한, 연결 표시가문구 검색을 위한 꼬리표이면, 임시 버퍼가 매치되는 지를 확인하여, 매치되면, 그것을 브라우저로 전송하고, 그러하지 아니하면, 버퍼를 해제한다. 그리고, 연결 표시가 텍스트이면 그것을 임시 버퍼에 삽입한다.If the type of link indication is another, extract the source address, convert it to an absolute address, and insert the string into a temporary buffer. Also, if the connection indicator is a tag for phrase search, it checks if the temporary buffer matches, and if it matches, sends it to the browser, otherwise releases the buffer. If the connection mark is text, it inserts it into a temporary buffer.

다음으로 각 연결 노드의 연결 방법에 있어서는 일단 모든 방문이 완료되지 않는 동안 노드들을 방문하되, 이 때, 노드가 링크를 가지고 있으면, 방문된 사이트로부터 추출된 새로운 링크를 링크 리스트에 삽입하고, 소팅한다. 이렇게 소팅된 링크 리스트로부터 제일 첫 번째 링크를 선택함으로써, 검색 결과의 우선 순위가 결정된다.Next, in the connection method of each connection node, nodes are visited while all the visits are not completed. If the node has a link, a new link extracted from the visited site is inserted into the link list and sorted. . By selecting the first link from this sorted list of links, the search results are prioritized.

또한, 본 발명의 일 실시예에 따른 웹 여과 시스템은 프락시 서버(Proxy Server)로서 일반적으로 인터넷 상에서 이용되고 있는 각종 검색 툴 간의 전환, 즉 검색의 계속적인 진행을 위하여 하나의 검색 툴에서 또 다른 검색 툴로의 전환이 필요없는 사용자 인터페이스를 갖고 있으며, 브라우저에 검색된 문서로부터 가치있는 정보만을 추출하고, 거기에 더욱 필요한 정보로서의 형태로 가공하는 여과 서비스를 제공한다.In addition, the web filtration system according to an embodiment of the present invention is a proxy server (Proxy Server) to switch between various search tools that are generally used on the Internet, that is, another search in one search tool for the continuous progress of the search It has a user interface that does not require a conversion to a tool, and provides a filtering service that extracts only valuable information from documents retrieved in a browser, and processes it into more necessary information.

상기와 같은 본 발명은 컴퓨터로 읽을 수 있는 기록 매체로 기록되고, 컴퓨터에 의해 처리될 수 있다.The present invention as described above is recorded on a computer-readable recording medium, and can be processed by a computer.

앞서 상세히 설명한 바와 같이 본 발명은 검색 정보에 대한 사용자의 관심도를 고려한 우선 순위 결정 방법 및 검색 공간의 규모를 줄이기 위한 추정 메커니즘을 사용한 웹 여과 시스템 및 그 운용 방법을 제공함으로써, 인터넷 상에서 이용되고 있는 각종 검색 툴 간의 전환, 즉 검색의 계속적인 진행을 위하여 하나의 검색 툴에서 또 다른 검색 툴로의 전환이 필요없는 사용자 인터페이스를 가지고, 브라우저에 검색된 문서로부터 가치있는 정보만을 추출하는 효과가 있다.As described in detail above, the present invention provides a web filtering system using a prioritization method considering a user's interest in search information and an estimation mechanism for reducing the size of a search space, and a method of operating the same. It has the effect of extracting only valuable information from documents retrieved in a browser with a user interface that does not require a switch between search tools, that is, to continue the search, from one search tool to another.

이상에서 본 발명에 대한 기술 사상을 첨부 도면과 함께 서술하였지만 이는 본 발명의 가장 양호한 일 실시예를 예시적으로 설명한 것이지 본 발명을 한정하는 것은 아니다. 또한, 이 기술 분야의 통상의 지식을 가진 자이면 누구나 본 발명의 기술 사상의 범주를 이탈하지 않는 범위 내에서 다양한 변형 및 모방이 가능함은 명백한 사실이다.The technical spirit of the present invention has been described above with reference to the accompanying drawings, but this is by way of example only and not by way of limitation to the present invention. In addition, it is obvious that any person skilled in the art may make various modifications and imitations without departing from the scope of the technical idea of the present invention.

Claims (8)

검색 키워드가 입력되면, 검색 요구 내용이 무엇인지를 분석하는 검색 요구 분석기;A search request analyzer for analyzing what the search request contents are if a search keyword is input; 상기 검색 키워드에 따라 검색된 문서들을 웹 서버로부터 입력받아 상기 검색된 문서들을 분석하는 검색 문서 분석기;A search document analyzer configured to receive documents searched according to the search keyword from a web server and analyze the searched documents; 상기 검색 문서 분석기에서 분석된 정보를 참조하여 상기 웹 서버로부터 입력된 검색된 문서를 재차 여과시키는 여과기; 및A filter for re-filtering the searched document input from the web server with reference to the information analyzed by the search document analyzer; And 상기 여과기에서 여과된 문서를 사용자의 요구에 따른 형태로 변환하는 검색 문서 변환기를 포함하여 이루어진 것을 특징으로 하는 웹 여과 시스템.And a search document converter for converting the document filtered by the filter into a form according to a user's request. 제 1 항에 있어서,The method of claim 1, 인터넷 통신 기반으로서 사용되는 검색 툴들을 포함하고, 상기 사용자 시스템 및 상기 웹 서버와 통신 기능을 수행하는 통신 서비스 시스템을 더 포함하여 이루어진 것을 특징으로 하는 웹 여과 시스템.And a communication service system including search tools used as an internet communication base, and performing a communication function with the user system and the web server. 제 1 항에 있어서,The method of claim 1, 상기 여과기는,The filter, 상기 검색 요구 분석기로부터 분석된 검색 요구 정보를 입력받아 저장한 후, 상기 검색 문서 분석기로부터 입력받은 초기 검색된 문서들에 상기 검색 요구 정보를 적용, 대비하여 필요한 문서를 추출하는 것을 특징으로 하는 웹 여과 시스템.After receiving and storing the search request information analyzed from the search request analyzer, the web filtering system characterized in that the required document is extracted by applying and preparing the search request information to the initial searched documents received from the search document analyzer . 사용자에 의한 검색 요구 메시지가 수신되면, 검색 주소 및 검색 키워드를 추출한 후, 필요한 검색 제약 조건을 생성하는 제 1 단계;A first step of extracting a search address and a search keyword and generating a necessary search constraint when a search request message by the user is received; 상기 제 1 단계에서 추출한 검색 주소에 따른 문서를 추출하고, 검색 공간을 최적화한 후, 검색 시간 및 검색 공간을 계산하여, 기설정한 값 이하인지 여부를 판단하는 제 2 단계;A second step of extracting a document according to the search address extracted in the first step, optimizing a search space, calculating a search time and a search space, and determining whether the document is equal to or less than a preset value; 상기 제 2 단계에서의 판단 결과, 기설정한 값 이하이면, 상기 제 1 단계에서 추출 및 생성한 검색 키워드 및 제약 조건을 사용하여 필요한 문서를 선별하고, 상기 선별된 결과 문서들에 연결 표시를 삽입한 후, 우선 순위를 결정하는 제 3 단계; 및If the determination result in the second step is less than or equal to a predetermined value, the necessary documents are selected using the search keywords and constraints extracted and generated in the first step, and a connection mark is inserted into the selected result documents. A third step of determining priorities; And 상기 제 2 단계에서의 판단 결과, 기설정한 값을 초과하면, 상기 검색 제약 조건을 변경한 후, 상기 제 2 단계로 복귀하는 제 4 단계를 포함하여 이루어진 것을 특징으로 하는 웹 여과 시스템의 운영 방법.And a fourth step of returning to the second step after changing the search constraint if the predetermined value is exceeded as a result of the determination in the second step. . 제 4 항에 있어서,The method of claim 4, wherein 상기 제 1 단계는,The first step is, 사용자에 의한 검색 요구 메시지가 수신되고, 웹 여과 시스템을 작동시킬 필요가 없으면, 검색 문서를 추출하여 연결 표시를 삽입한 후, 사용자 시스템으로 전송하는 것을 특징으로 하는 웹 여과 시스템의 운영 방법.If a search request message by the user is received and the web filtration system does not need to be operated, the search document is extracted, the connection indication is inserted, and then transmitted to the user system. 제 4 항에 있어서,The method of claim 4, wherein 상기 제 2 단계는,The second step, 검색 공간 최적화시 검색 시간, 인터넷 상에서의 항해 범위 및 검색 문서량을 인자로 하여 최적화를 수행하는 것을 특징으로 하는 웹 여과 시스템의 운영 방법.A method of operating a web filtration system, characterized in that the optimization is performed based on a search time, a navigation range on the Internet, and a search document amount when optimizing a search space. 제 4 항에 있어서,The method of claim 4, wherein 상기 제 3 단계는,The third step, 상기 검색 주소에 상기 키워드가 매치되는 경우를 최우선 순위로 결정하고, 패러그래프(Paragraph) 단위로 상기 키워드 매치 여부를 확인하여 우선 순위를 결정하는 것을 특징으로 하는 웹 여과 시스템의 운영 방법.And determining the priority of the case where the keyword is matched to the search address, and determining the priority by checking whether the keyword is matched in a paragraph unit. 컴퓨터에,On your computer, 사용자에 의한 검색 요구 메시지가 수신되면, 검색 주소 및 검색 키워드를 추출한 후, 필요한 검색 제약 조건을 생성하는 제 1 단계;A first step of extracting a search address and a search keyword and generating a necessary search constraint when a search request message by the user is received; 상기 제 1 단계에서 추출한 검색 주소에 따른 문서를 추출하고, 검색 공간을 최적화한 후, 검색 시간 및 검색 공간을 계산하여, 기설정한 값 이하인지 여부를 판단하는 제 2 단계;A second step of extracting a document according to the search address extracted in the first step, optimizing a search space, calculating a search time and a search space, and determining whether the document is equal to or less than a preset value; 상기 제 2 단계에서의 판단 결과, 기설정한 값 이하이면, 상기 제 1 단계에서 추출 및 생성한 검색 키워드 및 제약 조건을 사용하여 필요한 문서를 선별하고, 상기 선별된 결과 문서들에 연결 표시를 삽입한 후, 우선 순위를 결정하는 제 3 단계; 및If the determination result in the second step is less than or equal to a predetermined value, the necessary documents are selected using the search keywords and constraints extracted and generated in the first step, and a connection mark is inserted into the selected result documents. A third step of determining priorities; And 상기 제 2 단계에서의 판단 결과, 기설정한 값을 초과하면, 상기 검색 제약 조건을 변경한 후, 상기 제 2 단계로 복귀하는 제 4 단계를 포함하여 이루어진 것을 실행시킬 수 있는 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체.As a result of the determination in the second step, if the predetermined value is exceeded, the computer may record a program capable of executing the step including the fourth step of changing the search constraint and then returning to the second step. Readable Recording Media.
KR1019990062415A 1999-12-27 1999-12-27 Web filtering system and method using thereof in internet KR100362381B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019990062415A KR100362381B1 (en) 1999-12-27 1999-12-27 Web filtering system and method using thereof in internet

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019990062415A KR100362381B1 (en) 1999-12-27 1999-12-27 Web filtering system and method using thereof in internet

Publications (2)

Publication Number Publication Date
KR20010064265A true KR20010064265A (en) 2001-07-09
KR100362381B1 KR100362381B1 (en) 2002-11-23

Family

ID=19629961

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019990062415A KR100362381B1 (en) 1999-12-27 1999-12-27 Web filtering system and method using thereof in internet

Country Status (1)

Country Link
KR (1) KR100362381B1 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009125890A1 (en) * 2008-04-08 2009-10-15 Korea Institute Of Science And Technology Information System and method for multiple entity-centric integrated search
WO2009136990A2 (en) * 2008-05-06 2009-11-12 Yahoo!, Inc. Algorithmically generated topic pages
US8126930B2 (en) 2008-05-06 2012-02-28 Yahoo! Inc. Micro-bucket testing for page optimization

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08305729A (en) * 1995-05-10 1996-11-22 Oki Electric Ind Co Ltd Network information filtering system
JPH1139329A (en) * 1997-07-22 1999-02-12 Nec Software Ltd Dynamic generation system for html file
US5926808A (en) * 1997-07-25 1999-07-20 Claritech Corporation Displaying portions of text from multiple documents over multiple databases related to a search query in a computer network
JPH11167580A (en) * 1997-12-04 1999-06-22 Nec Corp Automatic sorting device and method for url of web client

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009125890A1 (en) * 2008-04-08 2009-10-15 Korea Institute Of Science And Technology Information System and method for multiple entity-centric integrated search
KR100930617B1 (en) * 2008-04-08 2009-12-09 한국과학기술정보연구원 Multiple object-oriented integrated search system and method
WO2009136990A2 (en) * 2008-05-06 2009-11-12 Yahoo!, Inc. Algorithmically generated topic pages
WO2009136990A3 (en) * 2008-05-06 2010-01-28 Yahoo!, Inc. Algorithmically generated topic pages
US8126930B2 (en) 2008-05-06 2012-02-28 Yahoo! Inc. Micro-bucket testing for page optimization
US9798807B2 (en) 2008-05-06 2017-10-24 Excalibur Ip, Llc Algorithmically generated topic pages

Also Published As

Publication number Publication date
KR100362381B1 (en) 2002-11-23

Similar Documents

Publication Publication Date Title
US6119078A (en) Systems, methods and computer program products for automatically translating web pages
CN100535898C (en) System and method for question-reply type document search
JP5011751B2 (en) Translation information output processing program, processing method, and processing apparatus
CA2458138C (en) Methods and systems for language translation
JP4007596B2 (en) Server and program
JP4909334B2 (en) Service proposal apparatus and method, service proposal system, service proposal apparatus and method based on user's favorite base
US20020122053A1 (en) Method and apparatus for presenting non-displayed text in Web pages
KR100509276B1 (en) Method for searching web page on popularity of visiting web pages and apparatus thereof
JP4699148B2 (en) Keyword extraction device, keyword extraction program
JP2007164790A (en) Method and system for supporting information access and recording medium therefor
US20020059348A1 (en) Automatic documentation generation tool and associated method
JP4430598B2 (en) Information sharing system and information sharing method
US7155664B1 (en) Extracting comment keywords from distinct design files to produce documentation
WO2005121982A1 (en) Information providing system, method, program, information communication terminal, and information display switching program
JP2010067005A (en) Retrieval device, and method of controlling the same
KR100917458B1 (en) Method and system of providing recommended words
KR100362381B1 (en) Web filtering system and method using thereof in internet
KR20020084302A (en) Apparatus of extract and transmission of image using the character message, its method
JP2007011973A (en) Information retrieval device and information retrieval program
KR100368300B1 (en) Internet-based searching method
KR20030051577A (en) Display method for research result in internet site
JP2010108268A (en) Document processing apparatus
JP4148247B2 (en) Vocabulary acquisition method and apparatus, program, and computer-readable recording medium
KR20000049891A (en) System and method for electronic publishing with structured data
KR100382600B1 (en) Method for providing integrated web search service through network system and computer-readable medium recording the method

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20091228

Year of fee payment: 10

LAPS Lapse due to unpaid annual fee