KR101837836B1 - 웹페이지 분석을 통한 상품 정보 관리 시스템 및 이를 이용한 상품 정보 관리 방법 - Google Patents
웹페이지 분석을 통한 상품 정보 관리 시스템 및 이를 이용한 상품 정보 관리 방법 Download PDFInfo
- Publication number
- KR101837836B1 KR101837836B1 KR1020160068913A KR20160068913A KR101837836B1 KR 101837836 B1 KR101837836 B1 KR 101837836B1 KR 1020160068913 A KR1020160068913 A KR 1020160068913A KR 20160068913 A KR20160068913 A KR 20160068913A KR 101837836 B1 KR101837836 B1 KR 101837836B1
- Authority
- KR
- South Korea
- Prior art keywords
- information
- web page
- product
- server
- product information
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
-
- G06F17/30705—
-
- G06F17/30861—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0281—Customer communication at a business location, e.g. providing product or service information, consulting
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L69/00—Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
- H04L69/16—Implementation or adaptation of Internet protocol [IP], of transmission control protocol [TCP] or of user datagram protocol [UDP]
- H04L69/169—Special adaptations of TCP, UDP or IP for interworking of IP based networks with other networks
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- General Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Information Transfer Between Computers (AREA)
Abstract
웹페이지 분석을 통한 상품 정보 관리 시스템 및 이를 이용한 상품 정보 관리 방법이 개시된다. 본 웹페이지 분석을 통한 상품 정보 관리 시스템은, 적어도 하나의 웹사이트에 대한 주소 정보를 저장하는 제1 저장 서버; 상기 주소 정보를 기반으로 기설정된 시간마다 상기 웹사이트에 접속하여 웹페이지에 대한 정보를 분석하는 웹페이지 분석 서버; 상기 분석된 웹페이지 정보를 기반으로, 상기 웹페이지에 등재된 상품들에 대한 정보를 분석하는 상품 분석 서버; 상기 분석된 상품 정보를 저장하는 제2 저장 서버; 및 상기 기설정된 시간 이전에 상기 제2 저장 서버에 기저장된 제1 상품 정보와 상기 기설정된 시간 이후에 상기 상품 분석 서버에 의해 추가로 분석된 제2 상품 정보를 비교하여 리포팅하는 리포팅 서버;를 포함한다. 이에 의해, 오픈마켓에 게재되는 상품들에 대한 정보를 수작업으로 일일이 취득하지 않게 되어 보다 쉽고 빠르게 많은 양의 상품 정보를 취득할 수 있으며, 원하는 정보를 원하는 형식으로 리포팅받을 수 있게 된다.
Description
본 발명은 웹페이지 분석을 통한 상품 정보 관리 시스템 및 이를 이용한 상품 정보 관리 방법에 관한 것으로, 보다 상세하게는, 오픈마켓의 웹페이지를 자동으로 분석하여 오픈마켓의 웹페이지에 게재된 상품들에 대한 정보를 자동으로 관리하기 위한 시스템 및 방법에 관한 것이다.
온라인을 통한 상품 구매가 활성화되고 있고, 이러한 온라인 상의 상품 구매는, 판매자 입장에서, 오프라인 마켓을 보유함으로 인해 발생되는 비용들에 대한 절감과 구매가 요청된 이력을 기반으로 판매 준비를 할 수 있다는 장점을 가지며, 구매자 입장에서, 자신이 필요한 상품에 대한 정보를 시간적 여유를 가지고 관찰하거나 더 많은 할인 혜택을 받으며 상품을 구매할 기회를 부여받는다는 점에서 장점을 가진다.
이로 인해 해외 사이트를 통한 온라인 구매도 활성화되고 있고, G마켓, 11번가 등 대형 오픈마켓에서는 다품종의 상품들이 상호 가격 경쟁을 하며 구매자에게 제공되고 있다.
이러한 오픈마켓에서는 전술한 바와 같이 다수의 판매자들이 개입하여 판매 조건을 제시하고 구매자들이 판매 조건을 기반으로 구매하고 있으므로, 일단위 또는 주단위 등으로 게재되는 상품들의 종류나 가격이 변동하게 되는데, 이러한 오픈마켓에서 변동되는 상품에 대한 각종 정보들은 수작업으로 데이터화되어 사용되고 있다.
일 예로, 특정 상품을 판매하는 판매자 입장에서는, 경쟁사에서 어떠한 가격으로 어떠한 오픈마켓에 상품을 게재하는지 수시로 모니터링할 필요가 있고, 구매자 입장에서도 자신이 원하는 상품이 어떠한 시점에 어떠한 구매조건으로 게재되는지 모니터링할 필요가 있으며, 오픈마켓 관리자 입장에서도 타 오픈마켓에 게재되는 상품들에 대한 정보나 오픈마켓의 웹페이지에 대한 정보들을 수집해야 할 필요가 있는데, 종래에는 이러한 정보들이 수작업으로 수집되어 기존 정보와 현재 정보가 수작업으로 비교되어 사용되고 있다.
또한, 다양한 물품에 대한 다양한 정보를 수집하기 위해서는 오픈마켓에 수시로 접속하거나 많은 양의 정보를 취득해야 하기 때문에, 해당 사이트로 접속하는 IP가 차단되는 경우가 빈번하고 시간적 제약으로 인해 정보 취득량이 제한된다는 문제가 있다.
본 발명은 상기와 같은 문제를 해결하기 위해 안출된 것으로, 본 발명의 목적은, 오픈마켓에 자동으로 접속하여 필요한 정보들을 자동으로 수집하며, 수집된 정보들을 기반으로 변동상황이나 변동이력에 대해 자동으로 리포팅하여 사용자에게 제공할 수 있도록 하기 위한 웹페이지 분석을 통한 상품 정보 관리 시스템 및 이를 이용한 상품 정보 관리 방법을 제공함에 있다.
상기 목적을 달성하기 위한 본 발명의 일 실시예에 따른 웹페이지 분석을 통한 상품 정보 관리 시스템은, 적어도 하나의 웹사이트에 대한 주소 정보를 저장하는 제1 저장 서버; 상기 주소 정보를 기반으로 기설정된 시간마다 상기 웹사이트에 접속하여 웹페이지에 대한 정보를 분석하는 웹페이지 분석 서버; 상기 분석된 웹페이지 정보를 기반으로, 상기 웹페이지에 등재된 상품들에 대한 정보를 분석하는 상품 분석 서버; 상기 분석된 상품 정보를 저장하는 제2 저장 서버; 및 상기 기설정된 시간 이전에 상기 제2 저장 서버에 기저장된 제1 상품 정보와 상기 기설정된 시간 이후에 상기 상품 분석 서버에 의해 추가로 분석된 제2 상품 정보를 비교하여 리포팅하는 리포팅 서버;를 포함한다.
여기서, 상기 리포팅 서버는, 상기 상품 분석 서버로부터 분석된 상품이 동일 웹사이트 내의 동종 상품 또는 동일 상품인 경우에, 상기 동종 상품 또는 상기 동일 상품으로부터 분석된 상기 제1 상품 정보와 상기 제2 상품 정보를 비교하며, 비교 현황을 리포팅할 수 있다.
또한, 상기 리포팅 서버는, 상기 상품 분석 서버로부터 분석된 상품이 서로 다른 웹사이트 내의 동종 상품 또는 동일 상품인 경우에, 상기 동종 상품 또는 상기 동일 상품으로부터 분석된 제1 웹사이트 내의 상기 제1 상품 정보와 제2 웹사이트 내의 상기 제2 상품 정보를 비교하며, 비교 현황을 리포팅할 수 있다.
그리고, 상기 리포팅 서버는, 상기 비교 현황을 전자문서 형태로 리포팅하도록 하기 위한 전자문서 생성부; 및 상기 비교 현황이 하이라이트 되어 상기 전자문서 상에서 디스플레이되도록 하기 위한 GUI 생성부;를 포함할 수 있다.
또한, 상기 비교 현황은, 상기 동종 상품 또는 상기 동일 상품에 대한, 가격 정보, 명칭 정보, 이벤트 정보, 코드 정보, 재고 정보(사이즈,색상), 할인 정보(쿠폰), 카테고리 정보, 판매량 정보, 판매순위 정보, 판매자 정보, 구매자 정보, 재질 정보, 속성 정보 중 적어도 하나의 정보에 대한 비교 현황이고, 상기 리포팅 서버는, 상기 적어도 하나의 정보 중 비교가 필요한 정보만을 선별적으로 리포팅되도록 하기 위한 선별정보 설정부;를 더 포함할 수 있다.
그리고, 상기 웹페이지 분석 서버는, 트래픽 상태로 인해 상기 제1 저장 서버에 저장된 주소 정보를 통한 접속이 지연되는 경우, 상기 접속이 차단되도록 하거나 재접속이 시도되도록 하기 위한 재접속 관리부; 및 접속 IP 차단에 의해, 상기 제1 저장 서버에 저장된 주소 정보를 통한 접속이 불가능한 경우, 별도의 IP를 통한 접속이 시도되도록 하는 IP관리부;를 포함할 수 있다.
또한, 상기 웹페이지 분석 서버는, 상기 웹페이지의 소스 코드를 추출하는 소스 코드 추출부; 및 상기 추출된 소스 코드를 통해 유효 데이터를 선별하는 유효 데이터 선별부;를 포함할 수 있다.
그리고, 상기 상품 분석 서버는, 상품 정보에 매칭되는 키워드을 저장하는 키워드 저장부; 및 상기 키워드를 기반으로, 상기 선별된 유효 데이터에서 상품 정보를 분석하는 상품정보 분석부;를 포함할 수 있다.
또한, 상기 웹사이트는 오픈마켓 웹사이트일 수 있다.
한편, 상기 목적을 달성하기 위한 본 발명의 일 실시예에 따른 웹페이지 분석을 통한 상품 정보 관리 방법은, 적어도 하나의 웹사이트에 대한 주소 정보를 저장하는 단계; 상기 주소 정보를 기반으로 기설정된 시간마다 상기 웹사이트에 접속하는 단계; 상기 접속된 웹페이지에 대한 정보를 분석하는 단계; 상기 분석된 웹페이지 정보를 기반으로, 상기 웹페이지에 등재된 상품들에 대한 정보를 분석하는 단계; 상기 분석된 상품 정보를 저장하는 단계; 및 상기 기설정된 시간 이전에 상기 제2 저장 서버에 기저장된 제1 상품 정보와 상기 기설정된 시간 이후에 상기 상품 분석 서버에 의해 추가로 분석된 제2 상품 정보를 비교하여 디스플레이하는 단계;를 포함한다.
이에 의해, 오픈마켓에 게재되는 상품들에 대한 정보를 수작업으로 일일이 취득하지 않게 되어 보다 쉽고 빠르게 많은 양의 상품 정보를 취득할 수 있으며, 원하는 정보를 원하는 형식으로 리포팅받을 수 있게 된다.
도 1은 본 발명의 일 실시예에 따른 상품 정보 관리 시스템과 웹사이트 및 리포트와의 연동 관계를 개략적으로 도시한 도면,
도 2는 본 발명의 일 실시예에 따른 상품 정보 관리 시스템의 내부 구성을 도시한 블록도,
도 3은 본 발명의 일 실시예에 따른 웹페이지 분석 서버의 구성을 도시한 블록도,
도 4는 본 발명의 일 실시예에 따른 상품 분석 서버의 구성을 도시한 블록도,
도 5는 본 발명의 일 실시예에 따른 리포팅 서버의 구성을 도시한 블록도,
도 6은 본 발명의 일 실시예에 따른 상품 정보 관리 방법을 도시한 흐름도,
도 7은 본 발명의 일 실시예에 따른 상품 정보를 추출하는 과정을 도시한 도면,
도 8은 본 발명의 일 실시예에 따른 리포트의 예시를 도시한 도면,
도 9는 본 발명의 다른 실시예에 따른 리포트의 예시를 도시한 도면,
도 10은 본 발명의 또 다른 실시예에 따른 리포트의 예시를 도시한 도면, 그리고,
도 11은 본 발명의 또 다른 실시예에 따른 리포트의 예시를 도시한 도면이다.
도 2는 본 발명의 일 실시예에 따른 상품 정보 관리 시스템의 내부 구성을 도시한 블록도,
도 3은 본 발명의 일 실시예에 따른 웹페이지 분석 서버의 구성을 도시한 블록도,
도 4는 본 발명의 일 실시예에 따른 상품 분석 서버의 구성을 도시한 블록도,
도 5는 본 발명의 일 실시예에 따른 리포팅 서버의 구성을 도시한 블록도,
도 6은 본 발명의 일 실시예에 따른 상품 정보 관리 방법을 도시한 흐름도,
도 7은 본 발명의 일 실시예에 따른 상품 정보를 추출하는 과정을 도시한 도면,
도 8은 본 발명의 일 실시예에 따른 리포트의 예시를 도시한 도면,
도 9는 본 발명의 다른 실시예에 따른 리포트의 예시를 도시한 도면,
도 10은 본 발명의 또 다른 실시예에 따른 리포트의 예시를 도시한 도면, 그리고,
도 11은 본 발명의 또 다른 실시예에 따른 리포트의 예시를 도시한 도면이다.
이하에서는 도면을 참조하여 본 발명에 대해 보다 상세히 설명하기로 한다.
도 1은 본 발명의 일 실시예에 따른 상품 정보 관리 시스템(10)과 웹사이트 (W)및 리포트(R)와의 연동 관계를 개략적으로 도시한 도면이다.
본 실시예에 따른 상품 정보 관리 시스템(10)은 웹사이트에 자동으로 접속하여 웹사이트(W)로부터 상품 정보를 취득하고, 취득된 상품 정보를 기반으로 자동으로 리포트(R)를 생성한다.
이러한 상품 정보 관리 시스템(10)은 그 역할에 따라 다수의 장치들 또는 다수의 서버들로 구성될 수 있으며, 세부적인 구성은 도 2에서 후술한다.
웹사이트(W)는 구체적으로, 오픈마켓에서 운영하는 상품의 판매를 목적으로 하는 웹 상의 사이트를 의미하며, 상품 정보 관리 시스템(10)에서는 단일 웹사이트 또는 복수의 웹사이트에 자동 접속함으로서, 해당 웹사이트에서 필요한 상품에 대한 정보를 취득하게 되는데, 이러한 상품에 대한 정보 역시 단일 상품에 대한 정보일 수도 있고 복수의 상품에 대한 정보일 수 있으며, 복수의 상품들을 상호 비교한 정보일 수 있다.
리포트(R)는 상품 정보 관리 시스템(10)에서 추출한 상품에 대한 정보를 기반으로 작성되는 전자문서 형식의 보고서로서, 사용자의 편의에 따라 다양한 양태로 생성될 수 있다. 예를 들어, 사용자가 단일 상품에 대한 어제 날짜의 판매량과 오늘 날짜의 판매량을 비교하고자 한다면, 리포트(R)는 이러한 비교 추이를 보여줄 수 있는 형식으로 사용자에게 제공될 수 있고, 사용자가 웹사이트(W) 상에서의 상품들의 전반적인 배치 현황이나 가격 변동 현황을 파악하고자 한다면, 리포트(R)는 이러한 현황을 보여줄 수 있는 형식으로 사용자에게 제공될 수 있을 것이다.
도 2는 본 발명의 일 실시예에 따른 상품 정보 관리 시스템(10)의 내부 구성을 도시한 블록도이다.
도시된 바와 같이, 본 실시예에 따른 상품 정보 관리 시스템(10)은 제1 저장 서버(100), 제2 저장 서버(200), 웹페이지 분석 서버(300), 상품 분석 서버(400) 및 리포팅 서버(500)로 구성된다.
우선, 제1 저장 서버(100)는 웹사이트에 대한 정보를 저장하는 역할을 한다. 이러한 웹사이트에 대한 정보는, 사용자에 의해 미리 획득되어 저장될 수 있다.
예를 들어, 사용자는 'A 오픈마켓'에서의 상품들에 대한 정보가 필요한 경우, 제1 저장 서버(100)는 이러한 'A 오픈마켓'에 대한 인터넷 주소 정보인 'WWW.A-MARKET.COM'이라는 주소 정보를 내부에 저장할 수 있고, 상품 정보 관리 시스템(10)이 이러한 저장된 주소 정보를 기반으로 인터넷을 통해 자동으로 접속하도록 할 수 있다.
뿐만 아니라, 제1 저장 서버(100)는 오픈마켓에 대한 정보를 인터넷 상에서 검색하여 검색된 결과를 기반으로 오픈마켓에 대한 주소 정보를 자동으로 취득할 수 있다.
예를 들어, 제1 저장 서버(100)는 미리 저장된 오픈마켓에 대한 명칭 정보나 주소 정보가 인터넷 상의 포털 사이트에 입력되었을 때의 연관검색어 등을 수집하여 해당 연관검색어에 해당하는 오픈마켓의 주소 정보를 자동으로 취득할 수도 있을 것이다.
이와 같이 제1 저장 서버(100)에 저장된 웹사이트에 대한 정보는 상품 정보 관리 시스템(10)이 상품 정보를 취득하기 위한 웹사이트 접속의 목적으로 사용되게 된다.
제2 저장 서버(200)는 상품 정보 관리 시스템(10)에 의해 분석된 상품 정보를 저장하는 역할을 하게 된다.
이러한 제2 저장 서버(200)는 취득된 상품 정보를 다양한 방식으로 테이블화하여 저장할 수 있으며, 저장되는 기준이 되는 항목과 변수가 되는 항목은 다양하게 구현될 수 있을 것이다.
예를 들어, 'a'라는 상품에 대한 정보가 기준이 되는 항목이 되어 저장된다면, 이러한 'a'라는 상품에 대한 정보는 'A'라는 웹사이트에서의 가격에 대한 정보, 'B'라는 웹사이트에서의 가격에 대한 정보 등으로 웹사이트가 변수가 되어 웹사이트 별로 다르게 저장될 수 있고, 어제 날짜의 가격에 대한 정보, 오늘 날짜의 가격에 대한 정보 등으로 날짜가 변수가 되어 날짜 별로 다르게 저장될 수 있을 것이다.
뿐만 아니라, 기준이 되는 항목은 반드시 상품이 기준으로 되지 않고, 판매자가 기준이 되거나 상품의 카테고리가 기준이 되는 등 다양하게 구현될 수 있다.
즉, 제2 저장 서버(200)는 사람이 수작업을 통해 물리적으로 취득할 수 있는 제한적인 정보들의 한계를 충분히 초월할 만큼 다양한 정보들을 수집하여 저장하게 된다.
이러한 제2 저장 서버(200)는 단순히 오픈마켓에 대한 웹사이트 정보를 저장하는 제1 저장 서버(100)와 달리 다양하고 폭넓은 자료들을 저장해야 하는 관계로 보다 대용량으로 구축되도록 구현될 수 있다.
그리고, 이상에서는 제1 저장 서버(100)와 제2 저장 서버(200)를 구분하여 설명하였으나, 이는 역할 면에서의 구분을 의미하는 것이며 제1 저장 서버(100)와 제2 저장 서버(200)가 물리적으로나 논리적으로 반드시 구분되지 않는 경우에도 본 발명의 기술적 범주 내에 속함은 물론일 것이다.
한편, 제1 저장 서버(100)에 저장된 웹사이트 정보를 기반으로 특정 웹페이지에 접속하게 되면, 접속된 웹페이지에 게재되는 상품 정보를 취득하기 위해 웹페이지 분석 서버(300)가 동작하게 된다.
웹페이지 분석 서버(300)는 제1 저장 서버(100)에 저장된 주소를 기반으로 웹사이트에 접속되도록 하거나 접속된 웹사이트에서 웹페이지의 구조를 분석하거나 상품 정보의 취득을 위해 필요한 데이터들을 선별하는 역할을 하게 된다.
이에 대한 설명을 위해 도 3을 참조하기로 한다.
도 3은 본 발명의 일 실시예에 따른 웹페이지 분석 서버(300)의 구성을 도시한 블록도이다.
도시된 바와 같이 본 실시예에 따른 웹페이지 분석 서버(300)는 접속 관리부(310), 재접속 관리부(330), IP 관리부(350)), 소스 코드 추출부(370) 및 유효 데이터 선별부(390)로 구축된다.
접속 관리부(310)는 제1 저장 서버(100)에 저장된 웹사이트 정보에 따라 상품 정보 관리 시스템(10)이 특정 웹사이트에 접속할 수 있도록 하는 역할을 한다. 이를 위해 접속 관리부(310)는 인터넷 연결 상태, 웹사이트 트래픽 상태, 웹사이트 주소 정보 유효성 판단 등의 역할을 하게 된다.
또한, 웹사이트의 접속은 사용자에 의해 설정된 시간 간격마다 수행될 수 있고, 접속된 웹사이트에서의 웹페이지 분석 또한 사용자에 의해 설정된 시간 간격마다 수행될 수 있다. 이를 위해 접속 관리부(310)는 내부의 타이머 또는 인터넷 상에서 획득된 시간 정보를 통해 기설정된 시간에 대한 체킹을 하여 웹사이트의 접속 여부 및 웹페이지 분석 여부를 판단하게 된다.
한편, 재접속 관리부(330)는 웹사이트의 트래픽 상태가 양호하지 않아 제1 저장 서버(100)에 저장된 주소 정보를 통한 접속이 지연되는 경우, 기존의 접속을 차단하고 재접속이 시도되도록 하기 위한 목적으로 마련된다.
예를 들어, 특정 오픈마켓의 웹사이트에서는 특정한 시간마다 특별 할인 이벤트가 발생될 수 있고, 이러한 시간에는 웹사이트의 트래픽 상태가 양호하지 않을 수 있다. 재접속 관리부(330)는 접속 관리부(310)와의 통신을 통해 트래픽 상태가 양호하지 않을 것을 예측하여 접속 관리부(310)에 기존의 접속을 차단할 것을 요청하는 메시지를 전송할 수 있고, 접속 관리부(310)와의 통신을 통해 트래픽 상태가 양호하지 않음을 알리는 메시지를 수신하면 일정 시간 이후 접속 관리부(310)가 재접속을 시도하도록 하기 위한 메시지를 접속 관리부(310)로 전송할 수 있을 것이다.
이러한 접속 관리부(310)와 재접속 관리부(330) 역시 역할이나 기능 면에서 별도의 구성으로 분리되어 설명되고 있는 것에 불과하며, 물리적으로나 논리적으로 반드시 구분되지 않는 경우에도 본 발명의 기술적 사상이 그대로 적용될 수 있음은 물론이다.
한편, 국내도 마찬가지이며 특히 해외 오픈마켓 웹사이트에서는 특정 IP 주소를 통한 접속이 다수 발생되는 경우 이러한 접속 IP를 사전에 차단하거나 접속 허가 횟수를 제한하는 경우도 발생된다.
이에 따라 IP 관리부는, 기존의 접속 IP가 차단되거나 기존의 접속 IP를 통한 접속이 원활하지 않게 되는 경우, 접속 관리부(310)를 통해 별도의 IP를 통한 접속이 시도되도록 하는 역할을 하게 된다.
이와 같이 재접속 관리부(330)와 IP 관리부(350)는 접속 관리부(310)가 정상적이고 원활하게 오픈마켓의 웹사이트에 접속할 수 있도록 하는 역할을 하게 되며, 이로 인해 접속 관리부(310)는 오픈마켓의 웹사이트에 정상적인 접속 상태를 확보 및 유지할 수 있게 된다.
접속 관리부(310)에 의해 상품 정보 관리 시스템(10)이 단일 오픈마켓 또는 복수의 오픈마켓들에 대한 웹사이트에 접속하게 되면, 접속된 웹사이트에서의 웹페이지 분석이 수행되고, 이러한 웹페이지 분석은 소스 코드 추출부(370) 및 유효 데이터 선별부(390)에 의해 수행되게 된다.
소스 코드 추출부(370)는 접속된 웹페이지에서의 소스 코드를 추출하는 역할을 하게 되고, 유효 데이터 선별부(390)는 추출된 소스 코드 상에서 상품 정보의 취득에 필요한 유효 데이터를, 소스 코드 상에서 상품 정보와 무관한 비유효 데이터와 구분하여 선별하는 역할을 하게 된다. 이에 대해서는, 도 7을 참조하여 보다 상세히 설명하기로 한다.
도 3을 참조하여 이상에서 설명한 바와 같이 웹페이지 분석 서버(300)는 제1 저장 서버(100)에 저장된 주소를 기반으로 오픈마켓의 웹사이트에 정상적으로 접속되도록 하거나 접속된 웹사이트에서 웹페이지의 구조를 분석하거나 상품 정보의 취득을 위해 필요한 유효 데이터들을 선별하는 역할을 하게 된다.
다시 도 2에 대해 설명하자면, 웹페이지 분석 서버(300)에서 최종적으로 선별된 유효 데이터들은 상품 분석 서버(400)로 전달되게 된다.
상품 분석 서버(400)는 웹페이지 분석 서버(300)로부터 수신된 유효 데이터에 대한 정보를 기반으로 키워드를 통해 웹페이지에 등재된 상품들에 대한 정보를 분석하고, 분석된 상품들에 대한 정보가 제2 저장 서버(200)에 저장되도록 하며, 리포팅 서버(500)에 의해 리포트가 전자문서 형태로 생성될 수 있게, 분석된 상품에 대한 정보들과 저장된 정보들이 리포팅 서버(500)로 전달되도록 하는 역할을 하게 된다.
이에 대한 설명을 위해 도 4를 참조하기로 한다.
도 4는 본 발명의 일 실시예에 따른 상품 분석 서버(400)의 구성을 도시한 블록도이다.
도시된 바와 같이 본 실시예에 따른 상품 분석 서버(400)는 키워드 저장부(410) 및 상품정보 분석부(450)로 구축된다.
키워드 저장부(410)는 상품정보의 분석을 위해 소스 코드 상에서 확인해야 할 키워드들에 대해 저장하는 역할을 하게 된다.
예를 들어, 키워드 저장부(410)에 저장된 키워드들은 '가격', 'price', '명칭', 'title' 등의 상품 정보를 위해 필요한 키워드들이거나 'script', 'array', 'html', 'head', 'function', 'return' 등의 소스 코드 상에서 코드화를 위해 필요한 언어들로 구성된 키워드들일 수 있다.
이러한 키워드들 중 전자의 키워드들은 상품정보 분석부(450)에서 유효 데이터를 추출하기 위한 목적으로 사용되고 후자의 키워드들은 상품정보 분석부(450)에서 비유효 데이터를 제거하기 위한 목적으로 사용될 수 있을 것이다.
상품정보 분석부(450)는 키워드 저장부(410)에 저장된 이러한 키워드들을 통해 상품에 대한 정보를 추출하게 된다.
예를 들어, 상품정보 분석부(450)는, 키워드 저장부(410)에 저장된 'price'라는 키워드를 기반으로는, 소스 코드 상에서 'price'라는 단어의 주변에 위치한 숫자 정보를 상품의 금액 정보로 취득하여 추출할 수 있을 것이고, 키워드 저장부(410)에 저장된 'title'이라는 키워드를 기반으로는, 소스 코드 상에서 'title'라는 단어의 주변에 위치한 문자 정보를 상품의 제품명 정보로 취득하여 추출할 수 있을 것이다.
상품정보 분석부(450)는 이와 같이 추출된 상품 정보를 제2 저장부(200)에 저장되도록 하게 되며, 제2 저장부(200)에 저장된 상품 정보들을 기반으로 전자문서 형식의 리포트가 생성되도록 하기 위한 로-데이터가 구축되도록 하는 역할을 하게 된다.
도 4를 참조하여 이상에서 설명한 바와 같이 상품 분석 서버(400)는 웹페이지 분석 서버(300)로부터 수신된 유효 데이터에 대한 정보를 기반으로 키워드를 통해 웹페이지에 등재된 상품들에 대한 정보를 분석하고, 분석된 상품들에 대한 정보가 제2 저장 서버(200)에 저장되도록 하며, 리포팅 서버(500)에 의해 리포트가 전자문서 형태로 생성될 수 있게, 분석된 상품에 대한 정보들과 저장된 정보들이 리포팅 서버(500)로 전달되도록 하는 역할을 하게 된다.
다시 도 2에 대해 설명하자면, 상품 분석 서버(400)에서 추출된 상품 정보에 대한 로-데이터들은 리포팅 서버(500)로 전달되게 된다.
리포팅 서버(500)는 사용자의 설정에 따라 기준이 되는 항목과 변수가 되는 항목을 입력받고, 이러한 항목들을 기반으로 전자문서 형식의 리포트가 생성되도록 하며, 생성된 리포트에서는 비교된 내역들이 하이라이트 처리되어 사용자에게 제공되도록 하는 역할을 하게 된다.
이에 대한 설명을 위해 도 5를 참조하기로 한다.
도 5는 본 발명의 일 실시예에 따른 리포팅 서버(500)의 구성을 도시한 블록도이다.
도시된 바와 같이 본 실시예에 따른 리포팅 서버(500)는 전자문서 생성부(510), GUI 생성부(530) 및 선별정보 설정부(550)로 구축된다.
전자문서 생성부(510)는 상품 분석 서버(400)에서 새롭게 취득된 상품 정보(이하, 제1 상품 정보)와 상품 분석 서버(400)에서 취득되어 미리 저장된 예전 상품 정보(이하, 제2 상품 정보)를 비교하여 제공하기 위한 리포트를 전자문서 형태로 생성하는 역할을 하게 된다.
예를 들어, 이러한 리포트는, 상품 분석 서버(400)로부터 분석된 상품이 동일 웹사이트 내의 동종 상품 또는 동일 상품인 경우에, 동종 상품 또는 동일 상품으로부터 분석된 제1 상품 정보와 상기 제2 상품 정보를 비교하며, 비교 현황을 리포팅하기 위한 리포트일 수 있다.
또한, 이러한 리포트는, 상품 분석 서버(400)로부터 분석된 상품이 서로 다른 웹사이트 내의 동종 상품 또는 동일 상품인 경우에, 동종 상품 또는 동일 상품으로부터 분석된 제1 웹사이트 내의 제1 상품 정보와 제2 웹사이트 내의 제2 상품 정보를 비교하며, 비교 현황을 리포팅하기 위한 리포트일 수 있다.
뿐만 아니라, 이러한 리포트는, 상품이 기준이 되는 항목이 되지 않은 상태로 리포팅되도록 할 수 있으며, 일 예로 특정 웹사이트의 웹페이지 현황 자체를 기준이 되는 항목으로 하여 과거의 웹페이지 배열 정보와 현재의 웹페이지 배열 정보가 비교되는 비교 현황을 리포팅하기 위한 리포트일 수 있다.
전자문서 생성부(510)에 의해 1차적으로 리포트가 생성되면, GUI 생성부(530)는 생성된 리포트에 비교 결과에 따른 차이점이 명확하게 부각되도록 하기 위한 그래픽들이 리포트에 첨가되도록 할 수 있다.
이러한 그래픽들은 제1 상품정보와 제2 상품정보 간의 차이가 발생된 부분들, 예를 들어, 제1 상품정보에서는 가격이 1,000원이었으나 제2 상품정보에서는 가격이 1,100원인 경우, 이러한 부분들에 하이라이트 처리를 위해 사용될 수 있을 것이다.
뿐만 아니라, 어제 날짜의 웹페이지의 구조나 웹페이지 상에서 등재된 상품들과 오늘 날짜의 웹페이지의 구조나 웹페이지 상에서 등재된 상품들 간에 차이가 있는 부분들, 예를 들어, 어제 날짜의 웹페이지 상에서는 세 번째 구역에 'a'라는 상품이 등재되고 오늘 날짜의 웹페이지 상에서는 세 번째 구역에 'b'라는 상품이 등재되는 경우, 이러한 부분들에 하이라이트 처리를 위해 사용될 수 있을 것이다.
한편, 선별정보 설정부(550)는, 상품 정보들 중 기준이 되는 항목들과 변수가 되는 항목들을 사용자의 요구에 따라 자유자재로 설정할 수 있도록 하기 위한 목적으로 마련된다.
예를 들어, 사용자가 지난 1년간 'a'라는 상품의 가격 변동 추이를 오픈마켓 별로 리포팅받아보기를 원한다면, 기준이 되는 항목은 상품의 명칭인 'a'이거나 'a'상품의 가격으로 설정될 것이고, 변수가 되는 항목은 날짜 또는 오픈마켓의 종류가 될 것이다.
다시 도 2에 대해 설명하자면, 이와 같이 리포팅 서버(500)는 생성된 리포트를 통해, 오픈마켓에 게재되는 상품들에 대한 정보를 수작업으로 일일이 취득하지 않아도 보다 쉽고 빠르게 많은 양의 상품 정보를 사용자에게 원하는 형식으로 제공할 수 있게 된다.
경우에 따라 리포팅 서버(500)는 프린터, 외부 단말 등과 유/무선으로 연결되어 생성된 리포트가 자동으로 출력되거나 인쇄되도록 구현될 수 있을 것이다.
도 6은 본 발명의 일 실시예에 따른 상품 정보 관리 방법을 도시한 흐름도이다.
우선, 웹페이지 분석 서버(300)는, 웹사이트에 접속하여 웹페이지를 분석하기로 사용자에 의해 설정된 시간이 도래하였는지 여부를 판단한다(S605). 예를 들어, 사용자에 의해 매일 12시에 오픈마켓의 웹페이지를 분석하는 것으로 설정이 된 상태라면, 웹페이지 분석 서버(300)는 이러한 사용자에 의해 설정된 시간이 도래하였는지 여부를 판단하게 되는 것이다.
물론, 분석이 필요한 웹사이트가 복수 개로 존재한다면, 웹페이지 분석 서버(300)는 웹사이트마다 서로 다른 시간 간격마다 분석하도록 설정될 수 있을 것이다.
만약, 사용자에 의해 설정된 시간이 도래하였다면(S605-Y), 웹페이지 분석 서버(300)는 제1 저장서버(100)로부터 분석 대상 웹사이트의 주소 정보를 획득하고(S610), 획득된 주소 정보를 기반으로 웹사이트에 접속을 시도하게 된다(S615).
이후, 웹페이지 분석 서버(300)는 접속된 웹사이트 상에서 소스 코드를 추출하고(S620), 추출된 소스 코드 상에서 유효데이터를 선별하여(S625), 선별된 유효데이터를 상품 분석 서버(400)로 전달하게 된다(S630).
한편, 상품 분석 서버(400)는 웹페이지 분석 서버(300)로부터 유효데이터를 전달받기 이전부터 유효데이터 상에서 상품 정보를 추출하기 위한 키워드들을 저장하고 있게 된다(S635).
이러한 키워드들은 웹사이트마다 다르게 설정되거나 소스 코드의 유형에 따라 다르게 설정될 수 있고, 사용자에 의해 또는 자동으로 갱신되거나 변경되도록 구현될 수 있을 것이다.
상품 분석 서버(400)는 저장된 키워드를 이용하여 수신된 유효데이터 상에서 상품 정보를 분석하게 되고(S640), 분석된 상품 정보는 리포팅 서버(500)로 전달되게 된다(S645).
한편, 리포팅 서버(500)는 상품 분석 서버(400)로부터 상품 정보를 전달받기 이전 또는 전달받은 직후 제2 저장 서버(200)로부터 기존의 상품 정보들을 획득하게 되고(S650), 이후, 기존의 상품 정보와 상품 분석 서버(400)로부터 전달받은 현재의 상품 정보를 비교하여 리포트를 생성하게 된다.
구체적으로, 리포팅 서버(500)는 사용자로부터 항목들을 선별하기 위한 선별정보를 수신하였는지 여부를 판단하고(S655), 선별 정보를 수신하였으면(S655-Y), 수신된 선별 정보를 기반으로 상품 정보를 비교하게 된다(S660).
이후, 리포팅 서버(500)는 비교 결과를 전자문서로 생성하고(S665), 양자에서 차이가 있는 부분에 대해 GUI가 부가되도록 한 후(S670), 사용자에게 리포트 형식으로 리포팅하게 된다(S675).
도 7은 본 발명의 일 실시예에 따른 상품 정보를 추출하는 과정을 도시한 도면이다. 도 7에서는 소스 코드를 기반으로 상품 정보를 추출하는 과정에 대해 도시하였다.
도시된 바와 같이 소스 코드 상에서는 상품 정보의 취득에 필요한 유효 데이터와 상품 정보와 무관한 비유효 데이터로 구분될 수 있다. 전술한 바와 같이 이러한 유효 데이터의 구분은 키워드를 기반으로 수행되게 된다.
예를 들어 'title'이나 'price'라는 단어가 포함되어 있는 단락은 유효 데이터로 구분되고, 'script'나 'html'이라는 단어가 포함되어 있는 단락은 비유효 데이터로 구분될 수 있다.
이러한 키워드들을 통해 유효 데이터와 비유효 데이터가 구분되고 확정되게 되면, 유효 데이터 상에서 상품 정보가 추출되게 된다.
상품 정보는, 다양한 방식으로 추출될 수 있는데, 일 예로, 'price'라는 단어의 좌우 20단어 내외에 위치한 숫자 정보를 상품의 금액 정보로 취득하여 추출할 수 있을 것이고, 'title'이라는 단어의 좌우 50단어 내외에 위치한 문자 정보를 상품의 제품명 정보로 취득하여 추출할 수 있을 것이다.
물론, 이와 같이 상품의 정보가 다양하게 추출되도록 구현하는 과정에서, 추출된 상품의 정보가 정확한지 여부에 대해서는 관리자의 컨펌이 수행되는 단계가 수반될 수 있고, 관리자의 컨펌이 수행된 키워드들에 대해서는 학습을 통해 추후 중요 키워드로 관리되어 사용되도록 구현될 수 있을 것이다.
한편, 이상에서는 소스 코드를 기반으로 상품 정보를 추출하는 과정에 대해 설명하였지만, 본 발명의 기술적 사상은 반드시 소스 코드를 기반으로 상품 정보를 추출하는 것에 국한되지는 않으며 웹사이트 상의 웹페이지에서 웹페이지 간의 비교 또는 상품 정보 간의 비교가 가능하다면, 어떠한 방식으로 정보를 추출하는 경우에도 본 발명의 기술적 사상의 범주 내에 있다고 볼 것이다.
예를 들어, 상품 정보를 추출하는 과정은, 웹페이지 간의 이미지 비교 엔진을 통해 이미지 비교를 통해 수행되거나, OCR인식 등의 문자 인식 엔진을 통해 문자 비교를 통해 수행될 수도 있으며, 구매자 입장에서 확인 가능한 웹페이지 구조 상에서가 아닌 관리자 모드 하에서의 웹페이지 또는 기계언어 구조 상에서의 비교를 통해 수행될 수도 있을 것이다.
도 8 내지 도 11은 본 발명의 실시예들에 따른 리포트의 예시들을 도시한 도면이다.
리포트는, 도 8에 도시된 바와 같이 기존의 상품 정보(상단부)와 현재의 상품 정보(하단부)가 모두 디스플레이되도록 제공된 채, 이들 중 달라진 부분만 하이라이트(H) 처리되도록 사용자에게 제공될 수 있고, 도 9에 도시된 바와 같이 현재의 상품 정보 중 달라진 부분만 하이라이트(H) 처리되도록 사용자에게 제공될 수 있으며, 도 10 및 도 11에 도시된 바와 같이 웹페이지 자체가 아니라 상품 정보의 추이들을 다양한 양태로 보여질 수 있도록 사용자에게 제공될 수 있다.
이에 의해, 특정 상품을 판매하는 판매자 입장에서는, 경쟁사에서 어떠한 가격으로 어떠한 오픈마켓에 상품을 게재하는지 다양한 정보들을 기반으로 폭넓은 관점에서 수시로 모니터링할 수 있게 되고, 구매자 입장에서도 자신이 원하는 상품이 어떠한 시점에 어떠한 구매조건으로 게재되는지 모니터링할 수 있게 되며, 오픈마켓 관리자 입장에서도 타 오픈마켓에 게재되는 상품들에 대한 정보나 오픈마켓의 웹페이지에 대한 정보들을 자동으로 손쉽게 수집할 수 있게 된다.
이상 첨부된 도면을 참조하여 본 발명의 실시예를 설명하였지만, 본 발명의 기술적 사상을 효과적으로 설명하기 위한 특정의 실시예를 위주로 도시하고 설명한 것에 불과하다. 따라서, 본 발명은 상기한 실시예에만 한정되지는 않으며 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자라면 이하의 청구범위에 기재된 발명의 기술적 사상의 요지를 벗어남이 없이 얼마든지 다양하게 변경 실시할 수 있을 것이다. 아울러, 본 발명의 범위는 상기의 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어진다. 또한, 특허청구범위의 의미 및 범위 그리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
W : 웹사이트 R : 리포트
10 : 상품 정보 관리 시스템 100 : 제1 저장 서버
200 : 제2 저장 서버 300 : 웹페이지 분석 서버
310 : 접속 관리부 330 : 재접속 관리부
350 : IP 관리부 370 : 소스 코드 추출부
390 : 유효 데이터 선별부 400 : 상품 분석 서버
410 : 키워드 저장부 450 : 상품 정보 분석부
500 : 리포팅 서버 510 : 전자문서 생성부
530 : GUI 생성부 550 : 선별정보 설정부
H : 하이라이트
10 : 상품 정보 관리 시스템 100 : 제1 저장 서버
200 : 제2 저장 서버 300 : 웹페이지 분석 서버
310 : 접속 관리부 330 : 재접속 관리부
350 : IP 관리부 370 : 소스 코드 추출부
390 : 유효 데이터 선별부 400 : 상품 분석 서버
410 : 키워드 저장부 450 : 상품 정보 분석부
500 : 리포팅 서버 510 : 전자문서 생성부
530 : GUI 생성부 550 : 선별정보 설정부
H : 하이라이트
Claims (10)
- 적어도 하나의 웹사이트에 대한 주소 정보를 저장하는 제1 저장 서버;
상기 주소 정보를 기반으로 기설정된 시간마다 상기 웹사이트에 접속하여 웹페이지에 대한 정보를 분석하는 웹페이지 분석 서버;
상기 분석된 웹페이지 정보를 기반으로, 상기 웹페이지에 등재된 상품들에 대한 정보를 분석하는 상품 분석 서버;
상기 분석된 상품 정보를 저장하는 제2 저장 서버; 및
상기 기설정된 시간 이전에 상기 제2 저장 서버에 기저장된 제1 상품 정보와 상기 기설정된 시간 이후에 상기 상품 분석 서버에 의해 추가로 분석된 제2 상품 정보를 비교하여 리포팅하는 리포팅 서버;를 포함하고,
상기 웹페이지 분석 서버는,
상기 웹페이지의 소스 코드를 추출하는 소스 코드 추출부;
상기 추출된 소스 코드를 통해 유효 데이터를 선별하는 유효 데이터 선별부;
상기 제1 저장서버에 저장된 웹사이트 정보에 따라 특정 웹사이트에 접속하도록 하는 웹사이트 접속 관리부:
트래픽 상태로 인해 상기 제1 저장 서버에 저장된 주소 정보를 통한 접속이 지연되는 경우, 상기 접속이 차단되도록 하거나 재접속이 시도되도록 하기 위한 재접속 관리부; 및
접속 IP 차단에 의해, 상기 제1 저장 서버에 저장된 주소 정보를 통한 접속이 불가능한 경우, 별도의 IP를 통한 접속이 시도되도록 하는 IP관리부;를 포함하며,
상기 웹사이트 접속 관리부는,
사용자에 의해 설정된 시간 간격마다 상기 접속을 수행하도록 하는 것을 특징으로 하는 웹페이지 분석을 통한 상품 정보 관리 시스템. - 제 1항에 있어서,
상기 리포팅 서버는,
상기 상품 분석 서버로부터 분석된 상품이 동일 웹사이트 내의 동종 상품 또는 동일 상품인 경우에, 상기 동종 상품 또는 상기 동일 상품으로부터 분석된 상기 제1 상품 정보와 상기 제2 상품 정보를 비교하며, 비교 현황을 리포팅하는 것을 특징으로 하는 웹페이지 분석을 통한 상품 정보 관리 시스템. - 제 1항에 있어서,
상기 리포팅 서버는,
상기 상품 분석 서버로부터 분석된 상품이 서로 다른 웹사이트 내의 동종 상품 또는 동일 상품인 경우에, 상기 동종 상품 또는 상기 동일 상품으로부터 분석된 제1 웹사이트 내의 상기 제1 상품 정보와 제2 웹사이트 내의 상기 제2 상품 정보를 비교하며, 비교 현황을 리포팅하는 것을 특징으로 하는 웹페이지 분석을 통한 상품 정보 관리 시스템. - 제 2항 또는 제3항에 있어서,
상기 리포팅 서버는,
상기 비교 현황을 전자문서 형태로 리포팅하도록 하기 위한 전자문서 생성부; 및
상기 비교 현황이 하이라이트 되어 상기 전자문서 상에서 디스플레이되도록 하기 위한 GUI 생성부;를 포함하는 것을 특징으로 하는 웹페이지 분석을 통한 상품 정보 관리 시스템. - 제 4항에 있어서,
상기 비교 현황은,
상기 동종 상품 또는 상기 동일 상품에 대한, 가격 정보, 명칭 정보, 이벤트 정보, 코드 정보, 재고 정보, 할인 정보, 카테고리 정보, 판매량 정보, 판매순위 정보, 판매자 정보, 구매자 정보, 재질 정보, 속성 정보 중 적어도 하나의 정보에 대한 비교 현황이고,
상기 리포팅 서버는,
상기 적어도 하나의 정보 중 비교가 필요한 정보만을 선별적으로 리포팅되도록 하기 위한 선별정보 설정부;를 더 포함하는 것을 특징으로 하는 웹페이지 분석을 통한 상품 정보 관리 시스템. - 삭제
- 삭제
- 제 1항에 있어서,
상기 상품 분석 서버는,
상품 정보에 매칭되는 키워드를 저장하는 키워드 저장부; 및
상기 키워드를 기반으로, 상기 선별된 유효 데이터에서 상품 정보를 분석하는 상품정보 분석부;를 포함하는 것을 특징으로 하는 웹페이지 분석을 통한 상품 정보 관리 시스템. - 제 1항에 있어서,
상기 웹사이트는 오픈마켓 웹사이트인 것을 특징으로 하는 웹페이지 분석을 통한 상품 정보 관리 시스템. - 제1 저장 서버에 의해, 적어도 하나의 웹사이트에 대한 주소 정보가 저장되는 단계;
웹페이지 분석 서버에 의해, 상기 주소 정보를 기반으로 기설정된 시간마다 상기 웹사이트에 접속되는 단계;
상기 웹페이지 분석 서버에 의해, 상기 접속된 웹사이트의 웹페이지에 대한 웹페이지 정보가 분석되는 단계;
상품 분석 서버에 의해, 상기 분석된 웹페이지 정보를 기반으로, 상기 웹페이지에 등재된 상품들에 대한 상품 정보가 분석되는 단계;
제2 저장 서버에 의해, 상기 분석된 상품 정보가 저장되는 단계; 및
리포팅 서버에 의해, 상기 기설정된 시간 이전에 상기 제2 저장 서버에 기저장된 제1 상품 정보와 상기 기설정된 시간 이후에 상기 상품 분석 서버에 의해 추가로 분석된 제2 상품 정보가 비교되어 디스플레이되는 단계;를 포함하고,
상기 웹사이트에 접속되는 단계는,
상기 웹페이지 분석 서버에 마련되는 웹사이트 접속 관리부에 의해, 상기 제1 저장 서버에 저장된 웹사이트 정보에 따라 특정 웹사이트에, 사용자에 의해 설정된 시간 간격마다 접속이 수행되며,
상기 웹페이지 정보가 분석되는 단계는,
트래픽 상태로 인해 상기 제1 저장서버에 저장된 주소 정보를 통한 접속이 불가능한 경우, 상기 웹페이지 분석 서버에 마련되는 재접속 관리부에 의해, 상기 접속이 차단되거나 재접속이 시도되며, 접속 IP가 차단되어 상기 제1 저장 서버에 저장된 주소 정보를 통한 접속이 불가능한 경우, 상기 웹페이지 분석 서버에 마련되는 IP관리부에 의해, 별도의 IP를 통한 접속이 시도되고,
상기 웹페이지 정보가 분석되는 단계는,
상기 제1 저장 서버에 저장된 주소 정보를 통한 접속이 이뤄진 경우, 상기 웹페이지 분석 서버에 마련되는 소스 코드 추출부에 의해, 상기 접속된 웹페이지의 소스 코드가 추출되고, 상기 웹페이지 분석 서버에 마련되는 유효 데이터 선별부에 의해, 상기 추출된 소스 코드를 통해 유효 데이터가 선별되는 것을 특징으로 하는 웹페이지 분석을 통한 상품 정보 관리 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020160068913A KR101837836B1 (ko) | 2016-06-02 | 2016-06-02 | 웹페이지 분석을 통한 상품 정보 관리 시스템 및 이를 이용한 상품 정보 관리 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020160068913A KR101837836B1 (ko) | 2016-06-02 | 2016-06-02 | 웹페이지 분석을 통한 상품 정보 관리 시스템 및 이를 이용한 상품 정보 관리 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20170136846A KR20170136846A (ko) | 2017-12-12 |
KR101837836B1 true KR101837836B1 (ko) | 2018-03-13 |
Family
ID=60944015
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020160068913A KR101837836B1 (ko) | 2016-06-02 | 2016-06-02 | 웹페이지 분석을 통한 상품 정보 관리 시스템 및 이를 이용한 상품 정보 관리 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101837836B1 (ko) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101958577B1 (ko) * | 2017-12-29 | 2019-03-14 | 김기수 | 웹페이지 캡처 이미지 기반의 웹페이지 분석 방법 및 이를 이용한 웹페이지 분석 시스템 |
US11775565B2 (en) | 2020-10-14 | 2023-10-03 | Coupang Corp. | Systems and methods for database reconciliation |
KR102369961B1 (ko) * | 2020-10-14 | 2022-03-04 | 쿠팡 주식회사 | 데이터베이스 조정을 위한 시스템 및 방법 |
KR102600682B1 (ko) * | 2022-03-07 | 2023-11-09 | 주식회사 누리온텍 | 오픈마켓 판매 관리자를 위한 지능형 가격 정보 비교 서버 및 그 프로그램 |
-
2016
- 2016-06-02 KR KR1020160068913A patent/KR101837836B1/ko active IP Right Grant
Also Published As
Publication number | Publication date |
---|---|
KR20170136846A (ko) | 2017-12-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5396533B2 (ja) | 情報処理装置、情報処理方法、および、情報処理装置用のプログラム | |
JP5493267B2 (ja) | 商品検索装置および商品検索方法 | |
KR101837836B1 (ko) | 웹페이지 분석을 통한 상품 정보 관리 시스템 및 이를 이용한 상품 정보 관리 방법 | |
US20040103037A1 (en) | Methods and apparatus for organizing retail product information | |
JP2009223456A (ja) | 価格調査システムおよび価格調査方法 | |
KR20130004937A (ko) | 정보 처리 장치, 정보 처리 방법, 및 기록 매체 | |
KR20110043215A (ko) | 상품 가격 비교 추천 시스템 및 그 운용방법 | |
KR101509393B1 (ko) | 상품 정보 제공 장치 및 그 방법 | |
JP6567688B2 (ja) | 管理装置、管理方法、非一時的な記録媒体、およびプログラム | |
JP2008009931A (ja) | 商品情報提供システム、商品情報提供サーバ、及び商品情報提供方法 | |
US20180336618A1 (en) | Merchandise purchase assist system | |
JP4850028B2 (ja) | 履歴情報提供システム | |
JP4986539B2 (ja) | 履歴情報提供システム | |
US9978092B2 (en) | Information processing device, information processing method, program for information processing device, and recording medium | |
JP5996154B1 (ja) | 管理装置、管理方法、非一時的な記録媒体、およびプログラム | |
JP4937642B2 (ja) | 商品情報提供システム、商品情報提供サーバ、及び商品情報提供方法 | |
WO2021181900A1 (ja) | ターゲットユーザ特徴抽出方法、ターゲットユーザ特徴抽出システム及びターゲットユーザ特徴抽出サーバ | |
KR102429104B1 (ko) | 인공지능에 기반한 상품 카탈로그 자동 분류 시스템 | |
KR100312430B1 (ko) | 인터넷 쇼핑몰 상품정보 학습 시스템 및 그 방법 | |
KR100357890B1 (ko) | 비교 광고 및 판매 방법 및 그 시스템 | |
TW201407515A (zh) | 網路購物資訊處理方法、系統與電腦可讀取儲存媒體 | |
JP4850022B2 (ja) | 履歴情報提供システム | |
JP5228683B2 (ja) | 商品検索装置および商品検索方法 | |
JP2011232873A (ja) | 購買データ収集システム、購買データ収集装置、購買データ収集方法および購買データ収集プログラム | |
KR100763484B1 (ko) | 여러 사이트들의 포인트를 하나로 적립하는 방법 및 그장치와 기록매체 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |