KR20060038486A - 검색 엔진에서 등록된 웹사이트를 관리하기 위한 방법 및그 시스템 - Google Patents
검색 엔진에서 등록된 웹사이트를 관리하기 위한 방법 및그 시스템 Download PDFInfo
- Publication number
- KR20060038486A KR20060038486A KR1020030021483A KR20030021483A KR20060038486A KR 20060038486 A KR20060038486 A KR 20060038486A KR 1020030021483 A KR1020030021483 A KR 1020030021483A KR 20030021483 A KR20030021483 A KR 20030021483A KR 20060038486 A KR20060038486 A KR 20060038486A
- Authority
- KR
- South Korea
- Prior art keywords
- website
- predetermined
- adult
- keyword
- site
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
Claims (22)
- 검색 엔진에서 등록된 웹사이트를 관리하기 위한 방법에 있어서,상기 웹사이트에 대한 정보를 데이터베이스 수단에 소정의 필드 별로 분류하여 기록하는 단계;소정의 성인 키워드를 성인 키워드 데이터베이스에 유지하는 단계;상기 웹사이트의 웹페이지를 구성하는 소스 파일을 독출하는 단계;상기 독출된 소스 파일을 분석하는 단계; 및소정의 기준에 따라 상기 웹사이트가 성인 사이트인지 여부를 판단하는 단계를 포함하는 것을 특징으로 하는 웹사이트 관리 방법.
- 제1항에 있어서,상기 소정의 기준은 상기 소스 파일에 포함된 문자열 중 상기 성인 키워드와 매칭되는 문자열의 길이의 합이 소정의 바이트 이상인지 여부인 것을 특징으로 하는 웹사이트 관리 방법.
- 제1항에 있어서,상기 소정의 기준은 상기 소스 파일에 포함된 문자열 중 상기 성인 키워드와 매칭되는 문자열의 개수가 소정 개수 이상인지 여부인 것을 특징으로 하는 웹사이트 관리 방법.
- 제1항에 있어서,상기 소정의 기준은 상기 소스 파일에 포함된 전체 문자열의 길이와 상기 문자열 중 상기 성인 키워드와 매칭되는 문자열의 길이의 합의 비율이 소정의 값 이상인지 여부인 것을 특징으로 하는 웹사이트 관리 방법.
- 제1항에 있어서,상기 소정의 기준은 상기 소스 파일에 포함된 범용 리소스 로케이터(URL)의 개수가 소정의 제1 개수 이상이고, 상기 소스 파일에 포함된 문자열 중 상기 성인 키워드와 매칭되는 문자열의 개수가 소정의 제2 개수 이상인지 여부인 것을 특징으로 하는 웹사이트 관리 방법.
- 제1항에 있어서,상기 소정의 기준은 상기 소스 파일에 포함된 문자열 중 공백(space)이 없는 문자열의 길이가 소정의 바이트 이상이고, 상기 소스 파일에 포함된 문자열 중 상기 성인 키워드와 매칭되는 문자열의 개수가 소정의 개수 이상인지 여부인 것을 특징으로 하는 웹사이트 관리 방법.
- 제1항에 있어서,소정의 인기 키워드를 인기 키워드 데이터베이스 수단에 유지하는 단계를 더 포함하고,상기 소정의 기준은 상기 소스 파일에 포함된 문자열 중 상기 인기 키워드와 매칭되는 문자열의 개수가 소정 개수 이상인지 여부인 것을 특징으로 하는 웹사이트 관리 방법.
- 제1항에 있어서,상기 독출된 소스 파일을 분석하는 단계는 상기 소스 파일에서 ANCHOR 텍스트를 추출하는 단계를 포함하고,상기 소정의 기준은 상기 ANCHOR 텍스트에 포함된 문자열 중 상기 성인 키워드와 매칭되는 문자열의 개수가 소정 개수 이상인지 여부인 것을 특징으로 하는 웹사이트 관리 방법.
- 제1항에 있어서,소정의 인기 키워드를 인기 키워드 데이터베이스 수단에 유지하는 단계를 더 포함하고,상기 소정의 기준은 상기 소스 파일에 포함된 문자열 중 상기 인기 키워드와 매칭되는 문자열이 소정의 회수 이상 반복되어 나타나는지 여부인 것을 특징으로 하는 웹사이트 관리 방법.
- 제1항에 있어서,상기 독출된 소스 파일을 분석하는 단계는 상기 소스 파일에서 타이틀 태그를 추출하는 단계를 포함하고,상기 소정의 기준은 상기 소스 파일의 타이틀 태그에 포함된 문자열 중 상기 성인 키워드와 매칭되는 문자열의 길이의 합이 소정 바이트 이상인지 여부인 것을 특징으로 하는 웹사이트 관리 방법.
- 검색 엔진에서 등록된 웹사이트를 관리하기 위한 방법에 있어서,상기 웹사이트에 대한 정보를 데이터베이스 수단에 소정의 필드 별로 분류하여 기록하는 단계;소정의 성인 키워드를 성인 키워드 데이터베이스에 유지하는 단계;소정의 인기 키워드를 인기 키워드 데이터베이스에 유지하는 단계;상기 웹사이트의 웹페이지를 구성하는 소스 파일을 독출하는 단계;상기 독출된 소스 파일을 분석하는 단계;소정의 제1 기준에 따라 상기 웹사이트가 성인 사이트인지 여부를 판단하는 단계;상기 웹 사이트가 성인 사이트인 것으로 판단된 경우, 소정의 제2 기준에 따라 상기 웹사이트가 기만 사이트인지 여부를 판단하는 단계; 및상기 웹사이트가 기만 사이트인 것으로 판단되는 경우, 상기 웹사이트에 대하여 소정의 처리를 수행하도록 제어하는 단계를 포함하는 것을 특징으로 하는 웹사이트 관리 방법.
- 제11항에 있어서,상기 소정의 제2 기준은 상기 소스 파일에 포함된 문자열 중 상기 인기 키워드와 매칭되는 문자열의 개수가 소정 개수 이상인지 여부인 것을 특징으로 하는 웹사이트 관리 방법.
- 제11항에 있어서,상기 소정의 제2 기준은 상기 소스 파일에 포함된 문자열 중 상기 인기 키워드와 매칭되는 문자열이 소정의 회수 이상 반복되어 나타나는지 여부인 것을 특징으로 하는 웹사이트 관리 방법.
- 검색 엔진에서 등록된 웹사이트를 관리하기 위한 방법에 있어서,상기 웹사이트에 대한 정보 데이터베이스 수단에 소정의 필드 별로 분류하여 기록하는 단계;소정의 성인 키워드를 성인 키워드 데이터베이스에 유지하는 단계;상기 웹사이트의 웹페이지를 구성하는 소스 파일을 독출하는 단계;상기 독출된 소스 파일을 분석하는 단계;소정의 제1 기준에 따라 상기 웹사이트가 성인 사이트인지 여부를 판단하는 단계;성인 사이트인 것으로 판단된 경우, 소정의 제2 기준에 따라 상기 웹사이트 가 변질 사이트인지 여부를 판단하는 단계; 및상기 웹사이트가 변질 사이트인 것으로 판단되는 경우, 상기 웹사이트에 대하여 소정의 처리를 수행하도록 제어하는 단계를 포함하는 것을 특징으로 하는 웹사이트 관리 방법.
- 제14항에 있어서,상기 데이터베이스 수단은 웹사이트 카테고리 정보 필드를 포함하고,상기 변질 사이트인지 여부를 판단하는 단계는,상기 데이터베이스 수단의 상기 웹사이트 카테고리 정보 필드를 검색하여 상기 웹사이트의 카테고리 정보를 획득하는 단계;획득한 상기 웹사이트의 카테고리 정보를 분석하여 상기 웹사이트가 일반 웹사이트로 등록되어 있는지 여부를 판단하는 단계; 및일반 웹사이트로 등록되어 있는 것으로 판단되는 경우, 상기 웹사이트를 변질 사이트로 판단하는 단계를 포함하는 것을 특징으로 하는 웹사이트 관리 방법.
- 제1항, 제11항 및 제14항 중 어느 하나의 항에 있어서,상기 소정의 성인 키워드를 성인 키워드 데이터베이스에 유지하는 단계는,상기 데이터베이스 수단으로부터 소정의 관리자에 의해 성인 사이트로 판단된 하나 이상의 웹사이트의 정보를 수신하는 단계;상기 하나 이상의 웹 사이트의 웹페이지에 포함된 문자열을 추출하는 단계;상기 추출된 문자열의 문자열 별 빈도 수를 기록하는 단계;상기 추출된 문자열을 상기 빈도 수에 따라 소팅(sorting)하는 단계;상기 소팅된 문자열에서 소정의 개수의 문자열을 성인 키워드로 추출하는 단계; 및상기 추출된 성인 키워드를 상기 성인 키워드 데이터베이스에 저장하는 단계를 포함하는 것을 특징으로 하는 웹사이트 관리 방법.
- 제7항, 제9항 및 제11항 중 어느 하나의 항에 있어서,상기 소정의 인기 키워드를 상기 인기 키워드 데이터베이스에 유지하는 단계는,다수의 사용자로부터 검색어를 입력 받는 단계;상기 입력된 검색어의 검색어 별 빈도 수를 기록하는 단계;상기 입력된 검색어를 상기 빈도 수에 따라 소팅(sorting)하는 단계;상기 소팅된 검색어에서 소정의 개수의 검색어를 인기 키워드로 추출하는 단계; 및상기 추출된 인기 키워드를 상기 인기 키워드 데이터베이스에 저장하는 단계를 포함하는 것을 특징으로 하는 웹사이트 관리 방법.
- 제11항 또는 제14항에 있어서,상기 데이터베이스 수단은 웹사이트 등록자 필드를 포함하고,상기 소정의 처리를 수행하도록 제어하는 단계는,상기 데이터베이스 수단의 웹사이트 등록자 필드를 검색하여 상기 웹사이트의 등록자 정보를 획득하는 단계;상기 웹사이트의 등록자 정보에서 상기 등록자의 연락 정보를 추출하는 단계; 및추출된 상기 연락 정보로 메시지를 전송하는 단계를 포함하는 것을 특징으로 하는 웹사이트 관리 방법.
- 제18항에 있어서,상기 연락 정보는 상기 웹사이트의 등록자의 이메일 주소 또는 이동통신단말기 번호인 것을 특징으로 하고, 상기 메시지를 전송하는 단계는이메일 서버를 제어하여 상기 이메일 주소로 이메일을 발송하도록 하는 단계 또는 단문자 메시지 서비스 서버를 제어하여 상기 이동통신단말기 번호로 단문자 메시지를 발송하도록 하는 단계를 포함하는 것을 특징으로 하는 웹사이트 관리 방법.
- 제11항 또는 제14항에 있어서,상기 데이터베이스 수단은 웹사이트 등록자 필드를 포함하고,상기 소정의 처리를 수행하도록 제어하는 단계는,상기 데이터베이스 수단의 웹사이트 등록자 필드를 검색하여 상기 웹사이트의 등록자 정보를 획득하는 단계;상기 웹사이트의 등록자 정보에서 상기 등록자가 등록한 다른 웹사이트의 범용 리소스 로케이터(URL) 정보를 추출하는 단계; 및상기 웹사이트의 웹페이지를 구성하는 소스 파일을 독출하는 단계;상기 독출된 소스 파일을 분석하는 단계;소정의 제1 기준에 따라 상기 웹사이트가 성인 사이트인지 여부를 판단하는 단계; 및상기 웹사이트가 성인 사이트인 것으로 판단되는 경우, 소정의 제2 기준에 따라 상기 웹사이트가 변질 사이트 또는 기만 사이트인지 여부를 판단하는 단계를 포함하는 것을 특징으로 하는 등록된 웹사이트의 관리 방법.
- 제1항 내지 제20항 중 어느 한 항의 방법을 실행시키기 위한 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체.
- 검색 엔진에서 등록된 웹사이트를 관리하기 위한 시스템에 있어서,하나 이상의 단말기와 데이터 통신을 수행하기 위한 인터페이스 모듈;상기 하나 이상의 단말기로부터 소정의 웹사이트의 정보를 포함하는 웹사이트 등록 신청을 수신하고, 상기 웹사이트 정보를 소정의 필드 별로 분류하기 위한 웹사이트 등록 모듈;상기 웹사이트 정보 및 소정의 키워드를 분류하여 저장하기 위한 데이터베이스 수단;상기 웹사이트의 웹페이지를 구성하는 소스 파일을 추출하고, 추출된 소스 파일을 분석하기 위한 웹사이트 분석 모듈; 및소정의 기준에 따라 상기 웹사이트가 기만 사이트 또는 변질 사이트인지 여부를 판단하기 위한 웹사이트 관리 모듈을 포함하는 것을 특징으로 하는 웹사이트 등록 관리 시스템.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020030021483A KR100610775B1 (ko) | 2003-04-04 | 2003-04-04 | 검색 엔진에서 등록된 웹사이트를 관리하기 위한 방법 및그 시스템 |
PCT/KR2004/000665 WO2004088542A1 (en) | 2003-04-04 | 2004-03-25 | A method of managing registered web sites in search engine and a system thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020030021483A KR100610775B1 (ko) | 2003-04-04 | 2003-04-04 | 검색 엔진에서 등록된 웹사이트를 관리하기 위한 방법 및그 시스템 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020040003114A Division KR20040086733A (ko) | 2004-01-15 | 2004-01-15 | 검색 엔진에서 등록된 웹사이트를 관리하기 위한 방법 및그 시스템 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20060038486A true KR20060038486A (ko) | 2006-05-04 |
KR100610775B1 KR100610775B1 (ko) | 2006-08-09 |
Family
ID=33128960
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020030021483A KR100610775B1 (ko) | 2003-04-04 | 2003-04-04 | 검색 엔진에서 등록된 웹사이트를 관리하기 위한 방법 및그 시스템 |
Country Status (2)
Country | Link |
---|---|
KR (1) | KR100610775B1 (ko) |
WO (1) | WO2004088542A1 (ko) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100670789B1 (ko) * | 2004-12-03 | 2007-01-17 | 한국전자통신연구원 | 유해 사이트 차단을 위한 다단계 텍스트 필터링 방법 |
KR100823388B1 (ko) * | 2006-08-11 | 2008-04-17 | 주식회사 케익소프트 | 웹 접근성 서비스 제공방법 및 그 시스템 |
KR101140263B1 (ko) * | 2010-07-07 | 2012-06-13 | 엔에이치엔(주) | 텍스트 패턴 추출을 이용하여 웹문서를 정제하기 위한 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체 |
KR20200105179A (ko) * | 2019-02-28 | 2020-09-07 | 안상필 | 유해 사이트 현황 자동 수집 시스템 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100240829B1 (ko) * | 1997-09-13 | 2000-01-15 | 전주범 | 인터넷 기능을 갖는 텔레비전에서의 성인 사이트 오픈 방지 장치 |
KR20010105960A (ko) * | 2000-05-19 | 2001-11-29 | 이동진 | 인터넷 유해정보 차단시스템 |
KR20010025209A (ko) * | 2000-10-20 | 2001-04-06 | 고진선 | 통신 네트워크를 이용한 유해 정보 차단 서비스 사업 방법및 이를 구현할 수 있는 프로그램이 수록된 컴퓨터로 읽을수 있는 기록매체 |
KR20020081774A (ko) * | 2001-04-19 | 2002-10-30 | 주식회사 플랜티넷 | 유해사이트 데이터베이스 현행화 방법 및 장치 |
-
2003
- 2003-04-04 KR KR1020030021483A patent/KR100610775B1/ko active IP Right Grant
-
2004
- 2004-03-25 WO PCT/KR2004/000665 patent/WO2004088542A1/en active Application Filing
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100670789B1 (ko) * | 2004-12-03 | 2007-01-17 | 한국전자통신연구원 | 유해 사이트 차단을 위한 다단계 텍스트 필터링 방법 |
KR100823388B1 (ko) * | 2006-08-11 | 2008-04-17 | 주식회사 케익소프트 | 웹 접근성 서비스 제공방법 및 그 시스템 |
KR101140263B1 (ko) * | 2010-07-07 | 2012-06-13 | 엔에이치엔(주) | 텍스트 패턴 추출을 이용하여 웹문서를 정제하기 위한 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체 |
KR20200105179A (ko) * | 2019-02-28 | 2020-09-07 | 안상필 | 유해 사이트 현황 자동 수집 시스템 |
Also Published As
Publication number | Publication date |
---|---|
KR100610775B1 (ko) | 2006-08-09 |
WO2004088542A1 (en) | 2004-10-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6029192A (en) | System and method for locating resources on a network using resource evaluations derived from electronic messages | |
US8117208B2 (en) | System for entity search and a method for entity scoring in a linked document database | |
KR100485321B1 (ko) | 검색 엔진에서 등록된 웹사이트를 관리하기 위한 방법 및그 시스템 | |
US8326818B2 (en) | Method of managing websites registered in search engine and a system thereof | |
US7346604B1 (en) | Method for ranking hypertext search results by analysis of hyperlinks from expert documents and keyword scope | |
US8478737B2 (en) | Segmentation of search topics in query logs | |
US7823065B2 (en) | Lexicon-based new idea detector | |
US20050171932A1 (en) | Method and system for extracting, analyzing, storing, comparing and reporting on data stored in web and/or other network repositories and apparatus to detect, prevent and obfuscate information removal from information servers | |
US20080201297A1 (en) | Method and System for Determining Relation Between Search Terms in the Internet Search System | |
EP1450268A1 (en) | Information analysis method and apparatus | |
US20130144834A1 (en) | Uniform resource locator canonicalization | |
KR100509276B1 (ko) | 웹페이지별 방문인기도에 기반한 웹페이지 검색방법 및 그장치 | |
JP2011154467A (ja) | 検索結果順位付け方法および検索結果順位付けシステム | |
Jepsen et al. | Characteristics of scientific Web publications: Preliminary data gathering and analysis | |
JP2003173352A (ja) | 検索ログ解析方法および装置、文書情報検索方法および装置、検索ログ解析プログラム、文書情報検索プログラム、および記録媒体 | |
KR100610775B1 (ko) | 검색 엔진에서 등록된 웹사이트를 관리하기 위한 방법 및그 시스템 | |
US20020062341A1 (en) | Interested article serving system and interested article serving method | |
KR20040086733A (ko) | 검색 엔진에서 등록된 웹사이트를 관리하기 위한 방법 및그 시스템 | |
KR20040098889A (ko) | 웹사이트 검색 서비스 제공 방법 및 그 시스템 | |
JP2001282837A (ja) | 情報収集装置 | |
KR100458458B1 (ko) | 검색 엔진에서 등록된 웹사이트를 관리하기 위한 방법 및그 시스템 | |
JP2003173351A (ja) | 情報解析、収集、検索方法、装置、プログラム、および記録媒体 | |
KR101048590B1 (ko) | 검색 엔진에서 등록된 웹사이트를 관리하기 위한 방법 및그 시스템 | |
de Alencar et al. | Geotagging aided by topic detection with Wikipedia | |
KR100467011B1 (ko) | 인터넷을 통한 백과사전 정보 제공 방법 및 그 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
A107 | Divisional application of patent | ||
A302 | Request for accelerated examination | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
J201 | Request for trial against refusal decision | ||
AMND | Amendment | ||
B601 | Maintenance of original decision after re-examination before a trial | ||
E801 | Decision on dismissal of amendment | ||
J301 | Trial decision |
Free format text: TRIAL DECISION FOR APPEAL AGAINST DECISION TO DECLINE REFUSAL REQUESTED 20040915 Effective date: 20050329 |
|
J2X1 | Appeal (before the patent court) |
Free format text: APPEAL AGAINST DECISION TO DECLINE REFUSAL |
|
J302 | Written judgement (patent court) |
Free format text: JUDGMENT (PATENT COURT) FOR APPEAL AGAINST DECISION TO DECLINE REFUSAL REQUESTED 20050502 Effective date: 20060228 |
|
S901 | Examination by remand of revocation | ||
E902 | Notification of reason for refusal | ||
GRNO | Decision to grant (after opposition) | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20110707 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20130626 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20150722 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20160725 Year of fee payment: 11 |
|
FPAY | Annual fee payment |
Payment date: 20170704 Year of fee payment: 12 |
|
FPAY | Annual fee payment |
Payment date: 20190701 Year of fee payment: 14 |