KR20010055126A - 인터넷 쇼핑몰 상품정보 학습 시스템 및 그 방법 - Google Patents

인터넷 쇼핑몰 상품정보 학습 시스템 및 그 방법 Download PDF

Info

Publication number
KR20010055126A
KR20010055126A KR1019990056208A KR19990056208A KR20010055126A KR 20010055126 A KR20010055126 A KR 20010055126A KR 1019990056208 A KR1019990056208 A KR 1019990056208A KR 19990056208 A KR19990056208 A KR 19990056208A KR 20010055126 A KR20010055126 A KR 20010055126A
Authority
KR
South Korea
Prior art keywords
shopping mall
search result
query template
product information
tag
Prior art date
Application number
KR1019990056208A
Other languages
English (en)
Other versions
KR100312430B1 (ko
Inventor
김중배
이경호
김성훈
장철수
함호상
박상봉
최중민
Original Assignee
오길록
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 오길록, 한국전자통신연구원 filed Critical 오길록
Priority to KR1019990056208A priority Critical patent/KR100312430B1/ko
Publication of KR20010055126A publication Critical patent/KR20010055126A/ko
Application granted granted Critical
Publication of KR100312430B1 publication Critical patent/KR100312430B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation
    • G06Q30/0625Directed, with specific intent or strategy
    • G06Q30/0629Directed, with specific intent or strategy for generating comparisons

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명은 인터넷 쇼핑몰 상품정보 학습 시스템 및 그 방법과, 이를 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것으로, 질의어 템플릿 생성수단이 외부로부터 새로운 쇼핑몰의 URL을 수신하여, 질의어 템플릿을 생성하는 제 1단계; 상기 질의어 템플릿 생성수단으로부터 질의어 템플릿을 수신한 검색결과 분류수단이 테스트 질의어를 사용하여 새로운 쇼핑몰의 검색 결과 형태를 분류하는 제 2단계; 상기 검색결과 분류수단의 검색결과 분류에 따라 학습수단이 상품정보의 위치 및 패턴을 추출하는 제 3단계; 및 상기 질의 템플릿 자동 생성수단에서 생성된 질의어 템플릿, 상기 학습수단에서 추출된 상품정보의 위치 및 상품정보의 패턴을 지식베이스수단에 저장하는 제 4단계를 포함한다.

Description

인터넷 쇼핑몰 상품정보 학습 시스템 및 그 방법{SYSTEM FOR LEARNING INFORMATION OF GOODS IN INTERNET SHOPPING MALLS AND METHOD USING THE SAME}
본 발명은 인터넷 쇼핑몰 상품정보 학습방법과, 이를 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것이다.
최근에는 인터넷이 보편화되고, 인터넷 쇼핑몰을 이용한 쇼핑을 하는 사용자가 급증하였다. 그러나, 각각의 쇼핑몰은 독특한 검색 처리와 검색 결과의 출력 방식을 가지고 있기 때문에, 사용자에게 비교 쇼핑의 정보를 전달하기 위한 인터넷 쇼핑몰에서 해당 상품에 대한 비교 검색 방법의 필요성이 대두되었다.
이에 따라, 종래에는 쇼핑몰을 관리하는 관리자가 각각의 쇼핑몰에서 통합에 필요한 요소(제품명, 제조회사, 제품가격 등)를 추출하는 규칙을 직접 구성하여 이를 저장하는 방식을 취하였다. 수동으로 작성된 규칙을 토대로 각 쇼핑몰에서 상품정보를 수집하고 가공하여 사용자에게 결과를 제공하는 방법이 사용되었다.
그러나, 종래의 인터넷 쇼핑몰에서 상품정보 학습방법은, 사용자에게 필요한 상품정보를 수집하고 가공하는데 많은 시간과 인력이 소요되며, 새로운 쇼핑몰이 생길 때 마다 해당 쇼핑몰에 대한 정보 추출 규칙을 새로 작성하여야 하는 문제가 있다.
또한, 종래에는 샵봇(Shopbot)이라는 쇼핑몰 통합 소프트웨어가 사용되었으나, 샵봇은 시스템 사용 환경의 제한(상품 정보를 구분하기 위해 상품의 정보 단위별로 구분자가 반드시 있어야 한다)을 두는 바이어스(Bias)를 설정하므로, 정보 단위별로 구분자가 없는 쇼핑몰의 상품 정보에 대한 학습을 수행할 수 없다는 문제가있다.
따라서, 상기와 같은 문제점을 해결하기 위해 안출된 본 발명은, 인터넷 쇼핑몰에서 판매상품들에 대해 비교 쇼핑을 하기 위한 필요한 상품정보 추출 규칙을 자동으로 생성함으로써, 관리자의 개입없이 각 쇼핑몰에서 필요한 정보를 추출할 수 있는 인터넷 쇼핑몰 상품정보 학습방법과, 이를 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는데 그 목적이 있다.
도1은 본 발명이 적용되는 인터넷 쇼핑몰 상품정보 학습 시스템의 개략적인 구성을 나타낸 일실시예 블록다이어그램.
도2는 본 발명에 따른 인터넷 쇼핑몰 상품정보 학습방법에 대한 일실시예 처리흐름도.
도3은 상기 도2의 질의어 템플릿 생성 서브루틴의 일실시예 상세흐름도.
도4는 상기 도2의 검색결과 분류 서브루틴의 일실시예 상세흐름도.
도5는 상기 도2의 상품정보의 위치 추출 서브루틴의 일실시예 상세흐름도.
도6은 상기 도2에서 상품정보의 패턴 추출 서브루틴의 일실시예 상세흐름도.
* 도면의 주요 부분에 대한 부호의 설명
10 : 질의어 템플릿 생성기 12 : 검색결과 분류기
14 : 테이블형 학습기 16 : 지식베이스
18 : 리스트형 학습기
상기 목적을 달성하기 위한 본 발명이 적용되는 인터넷 쇼핑몰 상품정보 학습 시스템은, 새로 생성된 쇼핑몰의 URL(Uniform Resource Locator)을 수신하여 질의어 템플릿을 생성하는 질의어 템플릿 생성수단; 상기 질의어 템플릿 생성수단으로부터 질의어 템플릿의 수신하고, 테스트 질의어를 입력받아 새로운 쇼핑몰의 검색결과 형태를 분류하는 검색결과 분류수단; 상기 검색결과 분류수단에서 분류한 해당 쇼핑몰의 검색결과 페이지에서 상품의 위치 및 패턴정보를 추출하는 학습수단; 및 상기 질의어 템플릿 생성수단에서 생성된 질의어 템플릿과 상기 학습수단에서 추출된 상품의 위치정보 및 패턴정보를 저장하는 지식베이스수단을 구비한다.
본 발명에 따른 인터넷 쇼핑몰 상품정보 학습방법은, 질의어 템플릿 생성수단이 외부로부터 새로운 쇼핑몰의 URL을 수신하여, 질의어 템플릿을 생성하는 제1단계; 상기 질의어 템플릿 생성수단으로부터 질의어 템플릿을 수신한 검색결과 분류수단이 테스트 질의어를 사용하여 새로운 쇼핑몰의 검색 결과 형태를 분류하는 제 2단계; 상기 검색결과 분류수단의 검색결과 분류에 따라 학습수단이 상품정보의 위치 및 패턴을 추출하는 제 3단계; 및 상기 질의 템플릿 자동 생성수단에서 생성된 질의어 템플릿, 상기 학습수단에서 추출된 상품정보의 위치 및 상품정보의 패턴을 지식베이스수단에 저장하는 제 4단계를 포함한다.
또한, 본 발명은, 마이크로 프로세서를 구비한, 인터넷 쇼핑몰 상품정보 학습 시스템에, 질의어 템플릿 생성수단이 외부로부터 새로운 쇼핑몰의 URL을 수신하여, 질의어 템플릿을 생성하는 제 1기능; 상기 질의어 템플릿 생성수단으로부터 질의어 템플릿을 수신한 검색결과 분류수단이 테스트 질의어를 사용하여 새로운 쇼핑몰의 검색 결과 형태를 분류하는 제 2기능; 상기 검색결과 분류수단의 검색결과 분류에 따라 학습수단이 상품정보의 위치 및 패턴을 추출하는 제 3기능; 및 상기 질의 템플릿 자동 생성수단에서 생성된 질의어 템플릿, 상기 학습수단에서 추출된 상품정보의 위치 및 상품정보의 패턴을 지식베이스수단에 저장하는 제 4기능 을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.
상술한 목적, 특징들 및 장점은 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해 질 것이다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 일실시예를 상세히 설명한다.
인터넷 쇼핑몰은 저마다의 독특한 검색 처리와 검색 결과의 출력 방식을 가지고 있기 때문에 완전 구조화된 검색 결과 형태와 준 구조화된 검색 결과 형태를가질 수 있다. 여기서, 완전 구조화된 검색결과는 데이터베이스의 테이블 형태와 같이 각 열에 포함된 정보가 무엇인지를 알 수 있는 레이블이 있는 경우를 말하며, 준 구조화 된 검색 결과는 규칙적으로 어떤 패턴이 반복되는 형태를 말한다.
본 발명에서는 완전 구조화된 검색 결과에서 뿐만 아니라 준 구조화된 검색 결과에서도 자동으로 정보를 추출할 수 있는 인터넷 쇼핑몰 상품정보 학습방법을 제시한다.
도1은 본 발명이 적용되는 인터넷 쇼핑몰 상품정보 학습시스템의 개략적인 구성을 나타낸 일실시예 블록다이어그램이다.
도1에 도시된 바와 같이, 새로 생성된 쇼핑몰의 URL(Uniform Resource Locator)을 수신하여 질의어 템플릿을 생성하기 위한 질의어 템플릿 생성기(10)와, 상기 질의어 템플릿 생성기(10)로부터 질의어 템플릿의 수신하고 테스트 질의어를 입력받아 새로운 쇼핑몰의 검색결과 형태를 분류하는 검색결과 분류기(12)와, 상기 검색결과 분류기(12)에서 분류한 검색결과 형태가 테이블형일 경우 해당 쇼핑몰의 검색결과 페이지에서 상품의 위치정보를 추출하는 테이블형 학습기(14)와, 상기 검색결과 분류기(12)에서 분류한 검색결과 형태가 리스트형일 경우 해당 쇼핑몰의 검색결과 페이지에서 상품의 패턴정보를 추출하는 리스트형 학습기(16)와, 상기 질의어 템플릿 생성기(10)에서 생성된 질의어 템플릿과 상품의 위치정보 및 패턴정보를 저장하는 지식베이스(Knowledge-base)(18)를 구비한다. 여기서, 테이블형은 HTML(HyperText Markup Language)의 <TABLE> 태그를 이용해 데이터베이스와 같은 형태로 상품 정보를 출력하는 형태를 말하며, 리스트형은 테이블형이 아닌 모든 검색 결과의 형태를 말한다.
그러면, 첨부된 도2 내지 도6을 참조하여 본 발명이 적용되는 인터넷 쇼핑몰 상품정보 학습방법을 설명한다.
첨부된 도2는 본 발명이 적용되는 인터넷 쇼핑몰 학습방법에 대한 일실시예 처리흐름도로서, 새로운 쇼핑몰이 생성되면 그 쇼핑몰의 URL(Uniform Resource Locator)을 수신하고(100), 수신된 쇼핑몰의 URL을 상기 질의어 템플릿 생성기(10)에 입력하면, 상기 질의어 템플릿 생성기(10)는 질의어 템플릿을 생성하여(102), 상기 검색결과 분류기(12)로 전송한다.
상기 질의어 템플릿 생성기(10)로부터 질의어 템플릿을 수신한 상기 검색결과 분류기(12)는 테스트 질의어를 사용하여 새로운 쇼핑몰의 검색 결과 형태를 분류한다(104).
상기 검색결과 분류기(12)에서 분류한 검색결과가 테이블형일 경우, 상기 테이블형 학습기(14)는 해당 쇼핑몰 페이지에서 상품정보의 위치를 추출하고(106), 상기 검색결과 분류기(12)에서 분류한 검색결과가 리스트형일 경우, 상기 리스트형 학습기(16)는 상품정보의 패턴을 추출한다(108).
상기 질의 템플릿 자동 생성기(10)에서 생성된 질의어 템플릿, 상기 테이블형 학습기(14)에처 추출된 상품정보의 위치 및 상기 리스트형 학습기(16)에서 추출된 상품정보의 패턴은 상기 지식베이스(18)에 저장된다(110).
첨부된 도3은 상기 도2에서 질의어 템플릿 생성기(10)가 질의어 템플릿을 생성하는 과정(102)의 상세흐름도로서, 오프라인으로 행해지는 작업으로 사용자가원하는 상품의 검색을 위해 검색어를 입력했을 때, 각각의 쇼핑몰들에게 질의를 하기위해 미리 각 쇼핑몰들의 질의 형태를 판별해 놓기 위하여 이용한다.
먼저, 웹 로봇(webrobot)을 통해 학습하고자 하는 쇼핑몰의 HTML(HyperText Markup Language)파일을 수집하고, 검색을 위해 사용되는 <FORM> 태그의 개수 i를 HTML 파싱(parsing)을 통해서 구하고(200), <FORM>태그의 개수 i가 1인지를 판단한다(202).
상기 판단결과(202), <FORM>태그의 개수 i가 1이 아닐경우, 상기 질의어 템플릿 생성기(10)는 검색 키워드를 입력하기 위해 태그의 타입이 텍스트(TEXT)인 <INPUT>태그의 개수 j를 구하고(204), <INPUT>태그의 개수 j가 1인지를 판단한다(206). 여기서, 상기 검색 키워드를 CGI(Common Gateway Interface) 프로그램에 파라미터로 전달하기 위한 일반적인 방법이 태그의 타입이 텍스트(TEXT)인 <INPUT>태그를 이용하는 것이며, 또한, 하나의 <FORM>태그내부에 다수의 텍스트(TEXT) 타입의 <INPUT> 태그가 존재할 수 있기 때문에 이 태그들의 개수를 구하는 것이다.
상기 판단결과(202), <FORM>태그의 개수 i가 1일 경우, 상기 질의어 템플릿 생성기(10)는 다수의 <FORM>태그중 검색 수행에 적합한 <FORM>태그를 선택한다. 일반적으로, HTML문서 한 페이지에는 다수의 <FORM>태그가 존재할 수 있으며, 이것은 한 페이지에서 여러 경로를 통해 쇼핑몰 서버의 CGI 프로그램을 구동시킬 수 있음을 의미한다. 따라서 실제 검색을 행하는 <FORM>을 선택하는 것이다.
상기 판단결과(206), <INPUT>태그의 개수 j가 1일 경우, 상기 질의어 템플릿생성기(10)는 <FORM>태그 내부의 질의를 쇼핑몰 서버에 전달하는 방법을 조합해서 질의어 템플릿을 생성한다(208).
상기 판단결과(206), <INPUT>태그의 개수 j가 1이 아닐경우, 상기 질의어 템플릿 생성기(10)는 다수의 <INPUT>태그 중 어느 <INPUT> 태그에 질의어를 삽입할 <INPUT> 태그를 선택하고(210), 상기 208단계를 수행한다.
첨부된 도4는 상기 도2에서 질의어 템플릿 생성기(10)로부터 질의어 템플릿을 수신한 검색결과 분류기(12)가 테스트 질의어를 사용하여 새로운 쇼핑몰의 검색 결과 형태를 분류하는 과정(104)의 상세흐름도로서, 상기 검색결과 분류기(12)는 질의어 템플릿 생성기(10)로부터 질의어 템블릿을 수신하고, 새로운 쇼핑몰 검색 결과를 저장한 HTML파일에 <TABLE>태그가 존재하는지를 판단한다(300).
상기 판단결과(300), <TABLE>태그가 존재할 경우, 상기 검색결과 분류기(12)는 새로운 쇼핑몰 검색 결과를 저장한 HTML파일에서 <TABLE>로 시작해서 </TABLE>로 끝나는 부분을 별도의 파일로 생성하고(302), 상기 판단결과(300), <TABLE>태그가 존재하지 않을 경우, 상기 검색결과 분류기(12)는 현재 쇼핑몰의 검색 결과의 형태를 리스트 형으로 설정하고, 새로운 쇼핑몰 검색결과를 저장한 HTML파일을 리스트형 학습기(16)로 전송한다.
상기 302단계 수행후, 상기 검색결과 분류기(12)는 새로운 쇼핑몰 검색 결과를 저장한 HTML파일에서 <TABLE>태그의 레이블과 온토로지(ontology)가 같고, 상품정보가 반복적으로 같은 열에 나타나는지를 판단한다(304). 여기서, 새로운 쇼핑몰의 검색결과를 저장한 HTML파일에 <TABLE>태그가 있다고 그 부분이 상품 정보라고확신할 수 없기 때문에 현 테이블의 첫번째 행의 키워드들과 테이블이 포함하고 있는 내용을 바탕으로 판별하게 된다. 일반적으로, 쇼핑몰의 검색결과를 저장한 HTML파일의 <TABLE>태그의 첫번째 행에는 그 열이 어떤 정보를 담고 있는지를 나타내는 레이블이 존재한다. 온토로지는 전자상거래에서 사용되는 일종의 사전으로 볼 수 있다. 즉, 상품의 가격을 나타낼 때 "상품 가격", "Price", "판매가" 등의 단어들이 온토로지에 해당된다.
상기 판단결과(304), <TABLE>태그의 레이블과 온토로지(ontology)가 같고, 상품정보가 반복적으로 같은 열에 나타날 경우, 상기 검색결과 분류기(12)는 현재 쇼핑몰의 검색 결과의 형태를 테이블 형으로 설정하고, 새로운 쇼핑몰 검색결과를 저장한 HTML파일을 테이블형 학습기(14)로 전송하고(306), 상기 판단결과(304), <TABLE>태그의 레이블과 온토로지(ontology)가 같고, 상품정보가 반복적으로 같은 열에 나타나지 않을 경우, 상기 검색결과 분류기(12)는 현재 쇼핑몰의 검색 결과의 형태를 리스트 형으로 설정하고, 새로운 쇼핑몰 검색결과를 저장한 HTML파일을 리스트형 학습기(16)로 전송한다.
첨부된 도5는 상기 도2에서 테이블형 학습기(14)가 해당 쇼핑몰 페이지에서 상품정보의 위치를 추출하는 과정(106)의 상세흐름도로서, 상기 검색결과 분류기(12)로부터 새로운 쇼핑몰의 검색결과를 저장한 HTML파일을 수신한 상기 테이블형 학습기(14)는 현재 페이지의 <TABLE>태그와 </TABLE>태그 사이의 정보를 별도의 파일로 생성하고(400), 상품의 위치 정보를 찾아내기 위해 테이블의 첫번째 행을 검색한다(402).
상기 테이블형 학습기(14)는 HTML파일의 테이블에서 추출해야 할 정보의 위치를 파악하기 위해 상기 HTML파일의 모든 <TD>태그에 대하여, 태그 <TD>안에 나타나는 키워드와 온토로지가 일치하는지를 판단한다(404).
상기 판단결과(404), 태그 <TD>안에 나타나는 키워드와 온토로지가 일치할 경우, 상기 테이블형 학습기(14)는 통합에 필요한 열들의 위치를 인식하고 그 위치를 규칙의 형태로 만들어 상품정보의 위치에 관한 정보를 등록한다(406).
여기서, 상품 검색 결과가 테이블형인 경우 같은 행의 다른 열들은 하나의 상품에 대한 정보를 나타낸다. 또한 각 열은 다른 상품에 대한 같은 의미 정보를 나타내게 된다. 예를 들면 한 열이 가격 정보를 나타낸다면 그 열이 포함하는 각 셀(Cell)들은 다른 상품에 대한 가격 정보를 나타내게 된다.
테이블의 첫번째 행은 각각의 열들이 나타내는 정보의 의미를 키워드 형태로 나타낸다. 만약 어떤 열이 가격에 대한 정보를 담고 있다면 '가격, 소비자가, 판매가, price'등과 같은 키워드가 나타나게 된다.
첨부된 도6은 상기 도2에서 리스트형 학습기(16)가 상품정보의 패턴을 추출하는 과정(108)의 상세흐름도로서, 상기 리스트형 학습기(16)는 검색결과 분류기(12)로부터 수신한 새로운 쇼핑몰 검색결과 HTML파일을 상품정보 단위로 검색결과를 나누기 위해 HTML의 <BR> 태그 및 줄 나눔 태그를 이용하여 한 줄씩 나누고, 상기 HTML파일의 모든 줄에 대해서 분석할 쇼핑몰 페이지를 저장한 파일로부터 한 줄을 판독하며(500), 현재의 줄이 담고있는 정보의 의미를 파악하여(502), 그 의미를 기록한 후(504), 페이지에 나타난 상품정보 위치패턴을 추출한다(508).
예를들어, 도서의 경우 추출해야 하는 정보가 '도서명, 가격'이라고 하면, 도서명의 경우 쇼핑몰 서버에 검색을 요청할 때 사용한 질의어를 포함하고 있는지를 매칭을 통해 확인하면 된다. 또한 현재의 줄이 가격을 나타내고 있는지를 알아보기 위해서는 가격을 나타내는 키워드 즉, '가격, 판매가, price'등의 키워드 뒤에 숫자 정보가 나타나는지를 알아보면 된다.
즉, 하나의 상품에 대한 상품 정보 단위를 정확하게 추출하기 위해 패턴을 추출하게 된다. 이렇게 반복적으로 나타나는 일정한 패턴이 바로 하나의 상품을 나타내는 상품 정보이며, 상품 정보의 단위를 추출하면 그 상품 정보에서 필요한 상품 속성만을 추출해 내어 정보를 통합한다.
이상에서 설명한 본 발명은, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 있어 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하므로 전술한 실시예 및 첨부된 도면에 한정되는 것이 아니다.
상기와 같은 본 발명은, 새로운 쇼핑몰의 정보 추출 규칙을 자동으로 생성해내므로 관리자의 수작업을 줄일 수 있으며, 비교 쇼핑 시스템을 보다 쉽게 유지할 수 있는 효과가 있다,
또한, 기존에 이미 생성한 규칙을 통해 정보 추출을 할 수 없는 경우 즉, 기존의 쇼핑몰의 검색 방법과 검색 결과 출력 방법이 달라진 경우 자동으로 이를 발견하여 관리자의 부가작업 없이 이를 새롭게 갱신하므로서, 비교 쇼핑 시스템을 유지하기 위해 필요한 비용을 현저하게 절감할 수 있는 효과가 있다.

Claims (11)

  1. 새로 생성된 쇼핑몰의 URL(Uniform Resource Locator)을 수신하여 질의어 템플릿을 생성하는 질의어 템플릿 생성수단;
    상기 질의어 템플릿 생성수단으로부터 질의어 템플릿의 수신하고, 테스트 질의어를 입력받아 새로운 쇼핑몰의 검색결과 형태를 분류하는 검색결과 분류수단;
    상기 검색결과 분류수단에서 분류한 해당 쇼핑몰의 검색결과 페이지에서 상품의 위치 및 패턴정보를 추출하는 학습수단; 및
    상기 질의어 템플릿 생성수단에서 생성된 질의어 템플릿과 상기 학습수단에서 추출된 상품의 위치정보 및 패턴정보를 저장하는 지식베이스수단
    을 포함하는 인터넷 쇼핑몰 상품정보 학습 시스템.
  2. 제 1항에 있어서,
    상기 검색결과 분류수단은, 새로운 쇼핑몰의 검색결과 형태를 테이블형 또는 리스트형으로 자동 분류할 수 있는 것을 특징으로하는 인터넷 쇼핑몰 상품정보 학습 시스템.
  3. 제 1항에 있어서,
    상기 학습수단은,
    상기 검색결과 분류수단에서 분류한 테이블형 검색결과 페이지에서 상품의 위치정보를 추출하는 테이블형 학습수단; 및
    상기 검색결과 분류수단에서 분류한 리스트형 검색결과 페이지에서 상품의 패턴정보를 추출하는 리스트형 학습수단을 포함하는 인터넷 쇼핑몰 상품정보 학습 시스템.
  4. 제 3항에 있어서,
    상기 리스트형 학습수단은, 상기 검색결과 분류수단으로부터 수신한 새로운 쇼핑몰 검색결과 HTML파일을 HTML의 <BR> 태그 및 줄 나눔 태그를 이용하여 한 줄씩 나누는 것을 특징으로하는 인터넷 쇼핑몰 상품정보 학습 시스템.
  5. 질의어 템플릿 생성수단이 외부로부터 새로운 쇼핑몰의 URL을 수신하여, 질의어 템플릿을 생성하는 제 1단계;
    상기 질의어 템플릿 생성수단으로부터 질의어 템플릿을 수신한 검색결과 분류수단이 테스트 질의어를 사용하여 새로운 쇼핑몰의 검색 결과 형태를 분류하는 제 2단계;
    상기 검색결과 분류수단의 검색결과 분류에 따라 학습수단이 상품정보의 위치 및 패턴을 추출하는 제 3단계; 및
    상기 질의 템플릿 자동 생성수단에서 생성된 질의어 템플릿, 상기 학습수단에서 추출된 상품정보의 위치 및 상품정보의 패턴을 지식베이스수단에 저장하는 제 4단계
    를 포함하는 인터넷 쇼핑몰 상품정보 학습방법.
  6. 제 5항에 있어서,
    상기 제 1단계는,
    상기 질의어 템플릿 생성수단이 학습하고자 하는 쇼핑몰의 HTML파일을 수집하여, 검색을 위해 사용되는 <FORM> 태그의 개수를 구하고, <FORM>태그의 개수가 1인지를 판단하는 제 5단계;
    상기 제 5단계의 판단결과, <FORM>태그의 개수가 1일 경우, 상기 질의어 템플릿 생성수단이 <INPUT>태그의 개수를 구하고, <INPUT>태그의 개수가 1인지를 판단하는 제 6단계;
    상기 제 5단계의 판단결과, <FORM>태그의 개수가 1일 경우, 상기 질의어 템플릿 생성수단이 다수의 <FORM>태그 중 검색 수행에 적합한 <FORM>태그를 선택하는 제 7단계;
    상기 제 6단계의 판단결과, <INPUT>태그의 개수가 1일 경우, 상기 질의어 템플릿 생성수단이 질의어 템플릿을 생성하는 제 8단계; 및
    상기 제 6단계의 판단결과, <INPUT>태그의 개수가 1이 아닐경우, 상기 질의어 템플릿 생성수단이 질의어를 삽입할 <INPUT> 태그를 선택하고, 상기 제 8단계를 수행하는 제 9단계를 포함하는 인터넷 쇼핑몰 상품정보 학습방법.
  7. 제 5항 또는 제 6항에 있어서,
    상기 제 2단계는,
    상기 질의어 템플릿 생성수단으로부터 질의어 템블릿을 수신한 상기 검색결과 분류수단이 새로운 쇼핑몰 검색 결과를 저장한 HTML파일에 <TABLE>태그가 존재하는지를 판단하는 제 10단계;
    상기 제 10단계의 판단결과, <TABLE>태그가 존재할 경우, 상기 검색결과 분류수단이 새로운 쇼핑몰 검색 결과를 저장한 HTML파일에서 <TABLE>로 시작해서 </TABLE>로 끝나는 부분을 별도의 파일로 생성하는 제 11단계;
    상기 제 10단계의 판단결과, <TABLE>태그가 존재하지 않을 경우, 상기 검색결과 분류수단이 현재 쇼핑몰의 검색 결과의 형태를 리스트 형으로 설정하고, 새로운 쇼핑몰 검색결과를 저장한 HTML파일을 리스트형 학습수단으로 전송하는 제 12단계;
    상기 제 11단계 수행후, 상기 검색결과 분류수단이 새로운 쇼핑몰 검색 결과를 저장한 HTML파일에서 <TABLE>태그의 레이블과 온토로지(ontology)가 같고, 상품정보가 반복적으로 같은 열에 나타나는지를 판단하는 제 13단계;
    상기 제 13단계의 판단결과, <TABLE>태그의 레이블과 온토로지가 같고, 상품정보가 반복적으로 같은 열에 나타날 경우, 상기 검색결과 분류수단이 현재 쇼핑몰의 검색 결과의 형태를 테이블 형으로 설정하고, 새로운 쇼핑몰 검색결과를 저장한 HTML파일을 테이블형 학습수단으로 전송하는 제 14단계;
    상기 제 13단계의 판단결과, <TABLE>태그의 레이블과 온토로지가 같고, 상품정보가 반복적으로 같은 열에 나타나지 않을 경우, 상기 제 12단계를 수행하는 제 15단계를 포함하는 인터넷 쇼핑몰 상품정보 학습방법.
  8. 제 7항에 있어서,
    상기 제 3단계는,
    상기 검색결과 분류수단에서 분류한 검색결과 형태가 테이블형일 경우, 상기 테이블형 학습수단이 해당 쇼핑몰의 검색결과 페이지에서 상품의 위치정보를 추출하는 제 16단계; 및
    상기 검색결과 분류수단에서 분류한 검색결과 형태가 리스트형일 경우, 상기 리스트형 학습수단이 해당 쇼핑몰의 검색결과 페이지에서 상품의 패턴정보를 추출하는 제 17단계를 포함하는 인터넷 쇼핑몰 상품정보 학습방법.
  9. 제 8항에 있어서,
    상기 제 16단계는,
    상기 검색결과 분류수단으로부터 새로운 쇼핑몰의 검색결과를 저장한 HTML파일을 수신한 상기 테이블형 학습수단이 현재 페이지의 <TABLE>태그와 </TABLE>태그 사이의 정보를 별도의 파일로 생성하는 제 18단계;
    상기 테이블형 학습수단이 상품의 위치 정보를 찾아내기 위해 테이블의 첫번째 행을 검색하는 제 19단계;
    상기 테이블형 학습수단이 상기 HTML파일의 모든 <TD>태그에 대하여, 태그 <TD>안에 나타나는 키워드와 온토로지가 일치하는지를 판단하는 제 20단계; 및
    상기 제 20단계의 판단결과, 태그 <TD>안에 나타나는 키워드와 온토로지가 일치할 경우, 상기 테이블형 학습수단이 통합에 필요한 열들의 위치를 인식하고 그 위치를 규칙의 형태로 만들어 상품정보의 위치에 관한 정보를 등록하는 제 21단계를 포함하는 인터넷 쇼핑몰 상품정보 학습방법.
  10. 제 8항 또는 제 9항에 있어서,
    상기 제 17단계는,
    상기 검색결과 분류수단으로부터 새로운 쇼핑몰 검색결과 HTML파일을 수신한 상기 리스트형 학습수단이 상기 HTML파일을 <BR> 태그 및 줄 나눔 태그를 이용하여 한 줄씩 나누는 제 22단계;
    상기 리스트형 학습수단이 상기 HTML파일의 모든 줄에 대해서 분석할 쇼핑몰페이지를 저장한 파일로부터 한 줄을 판독하여, 현재의 줄이 담고있는 정보의 의미를 파악하는 제 23단계; 및
    상기 리스트형 학습수단이 상기 HTML 파일에 나타난 상품정보 위치패턴을 추출하는 제 24단계를 포함하는 인터넷 쇼핑몰 상품정보 학습방법.
  11. 마이크로 프로세서를 구비한, 인터넷 쇼핑몰 상품정보 학습 시스템에,
    질의어 템플릿 생성수단이 외부로부터 새로운 쇼핑몰의 URL을 수신하여, 질의어 템플릿을 생성하는 제 1기능;
    상기 질의어 템플릿 생성수단으로부터 질의어 템플릿을 수신한 검색결과 분류수단이 테스트 질의어를 사용하여 새로운 쇼핑몰의 검색 결과 형태를 분류하는 제 2기능;
    상기 검색결과 분류수단의 검색결과 분류에 따라 학습수단이 상품정보의 위치 및 패턴을 추출하는 제 3기능; 및
    상기 질의 템플릿 자동 생성수단에서 생성된 질의어 템플릿, 상기 학습수단에서 추출된 상품정보의 위치 및 상품정보의 패턴을 지식베이스수단에 저장하는 제 4기능
    을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
KR1019990056208A 1999-12-09 1999-12-09 인터넷 쇼핑몰 상품정보 학습 시스템 및 그 방법 KR100312430B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019990056208A KR100312430B1 (ko) 1999-12-09 1999-12-09 인터넷 쇼핑몰 상품정보 학습 시스템 및 그 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019990056208A KR100312430B1 (ko) 1999-12-09 1999-12-09 인터넷 쇼핑몰 상품정보 학습 시스템 및 그 방법

Publications (2)

Publication Number Publication Date
KR20010055126A true KR20010055126A (ko) 2001-07-04
KR100312430B1 KR100312430B1 (ko) 2001-11-05

Family

ID=19624588

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019990056208A KR100312430B1 (ko) 1999-12-09 1999-12-09 인터넷 쇼핑몰 상품정보 학습 시스템 및 그 방법

Country Status (1)

Country Link
KR (1) KR100312430B1 (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020064249A (ko) * 2002-07-04 2002-08-07 이은석 컨텐츠 자동확장기능을 이용한 전자상거래시스템 및 이의운용방법
KR101640799B1 (ko) 2016-03-11 2016-07-19 아무르콜라겐(주) 불가사리 추출물의 제조 방법 및 불가사리 추출물을 함유하는 화장료 조성물
KR20210045284A (ko) * 2019-10-16 2021-04-26 카페24 주식회사 이종 쇼핑몰 간의 연동 방법
CN117611272A (zh) * 2023-10-25 2024-02-27 深圳市灵智数字科技有限公司 商品推荐方法、装置及电子设备

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030085719A (ko) * 2002-05-01 2003-11-07 삼성에스디에스 주식회사 쇼핑몰 웹페이지를 항해하는 방법 및 그 장치

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020064249A (ko) * 2002-07-04 2002-08-07 이은석 컨텐츠 자동확장기능을 이용한 전자상거래시스템 및 이의운용방법
KR101640799B1 (ko) 2016-03-11 2016-07-19 아무르콜라겐(주) 불가사리 추출물의 제조 방법 및 불가사리 추출물을 함유하는 화장료 조성물
KR20210045284A (ko) * 2019-10-16 2021-04-26 카페24 주식회사 이종 쇼핑몰 간의 연동 방법
CN117611272A (zh) * 2023-10-25 2024-02-27 深圳市灵智数字科技有限公司 商品推荐方法、装置及电子设备

Also Published As

Publication number Publication date
KR100312430B1 (ko) 2001-11-05

Similar Documents

Publication Publication Date Title
US6523025B1 (en) Document processing system and recording medium
US8190556B2 (en) Intellegent data search engine
CN101490677B (zh) 呈现搜索结果信息
JP4637969B1 (ja) ウェブページの主意,およびユーザの嗜好を適切に把握して,最善の情報をリアルタイムに推奨する方法
JP5396533B2 (ja) 情報処理装置、情報処理方法、および、情報処理装置用のプログラム
US20050027704A1 (en) Method and system for assessing relevant properties of work contexts for use by information services
KR102466489B1 (ko) 관심 지점에 관련된 정보를 사용자에게 제공하기 위한 방법 및 시스템
JP2000348041A (ja) 文書検索方法及びその装置並びにプログラムを記録した機械読み取り可能な記録媒体
CN107016020A (zh) 利用垂直建议辅助搜索请求的系统和方法
US8359307B2 (en) Method and apparatus for building sales tools by mining data from websites
JP5442401B2 (ja) 行動情報抽出システム及び抽出方法
KR101523450B1 (ko) 관련어 등록 장치, 관련어 등록 방법, 기록 매체 및, 관련어 등록 시스템
KR20160103470A (ko) 네트워크를 통해 상품에 대한 기존 사용자들의 반응정보를 제공하기 위한 시스템 및 방법
JP2023015766A (ja) 検索装置、検索方法及び検索プログラム
JP5138621B2 (ja) 情報処理装置及び不満解決商品発見方法及びプログラム
KR100312430B1 (ko) 인터넷 쇼핑몰 상품정보 학습 시스템 및 그 방법
WO2001027712A2 (en) A method and system for automatically structuring content from universal marked-up documents
JP6533876B2 (ja) 商品情報表示システム、商品情報表示方法、及びプログラム
JP2013101416A (ja) 検索装置、検索方法、および、検索装置用のプログラム
CN111723296B (zh) 搜索处理方法、装置及计算机设备
JP4417497B2 (ja) 情報検索装置及びプログラムを記憶した記憶媒体
KR101440385B1 (ko) 인디케이터를 이용한 정보 관리 장치
JP2002278983A (ja) 要約抽出プログラム、文書分析支援プログラム、要約抽出方法、文書分析支援方法、文書分析支援システム
CN111914154A (zh) 一种智能搜索导向系统及方法
JP5187187B2 (ja) 体験情報検索システム

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120928

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20130923

Year of fee payment: 13

LAPS Lapse due to unpaid annual fee