KR20180110498A - 범용화된 정보 추출 방법 및 이를 적용한 디바이스 - Google Patents

범용화된 정보 추출 방법 및 이를 적용한 디바이스 Download PDF

Info

Publication number
KR20180110498A
KR20180110498A KR1020170040136A KR20170040136A KR20180110498A KR 20180110498 A KR20180110498 A KR 20180110498A KR 1020170040136 A KR1020170040136 A KR 1020170040136A KR 20170040136 A KR20170040136 A KR 20170040136A KR 20180110498 A KR20180110498 A KR 20180110498A
Authority
KR
South Korea
Prior art keywords
information
web document
extracting
extraction
node
Prior art date
Application number
KR1020170040136A
Other languages
English (en)
Other versions
KR101990502B1 (ko
Inventor
이단비
강지형
Original Assignee
주식회사 위시어폰
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 위시어폰 filed Critical 주식회사 위시어폰
Priority to KR1020170040136A priority Critical patent/KR101990502B1/ko
Publication of KR20180110498A publication Critical patent/KR20180110498A/ko
Application granted granted Critical
Publication of KR101990502B1 publication Critical patent/KR101990502B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/02Comparing digital values
    • G06F7/023Comparing digital values adaptive, e.g. self learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • G06F16/337Profile generation, learning or modification
    • G06F17/30702
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0633Lists, e.g. purchase orders, compilation or processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • General Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

범용화된 정보 추출 방법이 개시된다. 본 방법은 적어도 하나의 학습용 웹문서 각각에 포함된 구성 정보를 노드를 이용하여 구조화하는 단계, 적어도 하나의 학습용 웹문서에 대해, 추출용 정보가 위치한 제1 타겟 노드 및 상기 제1 타겟 노드의 적어도 하나의 상위 노드에 포함된 정보를 정규화하여 저장하는 단계, 추출용 웹문서에 포함된 구성 정보를 노드를 이용하여 구조화하는 단계, 추출용 웹문서 상에서 상기 추출용 정보를 추출하는 경우, 상기 추출용 웹문서 상의 노드들을 순회하면서 정규화된 상기 학습용 웹문서의 노드 정보와 계층 비교하여 상기 추출용 웹문서 상의 노드들에 가중치 점수를 부여하는 단계 및 가중치 점수가 소정의 조건을 만족하는 제2 타겟 노드에 연관된 정보를 추출하는 단계를 포함할 수 있다. 이에 따라 정보 검색 및 정보 추출의 효율이 향상될 수 있다.

Description

범용화된 정보 추출 방법 및 이를 적용한 디바이스{a device and a method for extracting generalized information}
본 개시는 범용화된 정보 추출 방법 및 이를 적용한 디바이스에 관한 것이다.
종래의 온라인 쇼핑몰들은 해당 쇼핑몰에 로그인한 사용자에 한하여 해당 쇼핑몰의 웹문서 내의 상품에 대해서만 위시리스트 생성 또는 장바구니 담기 서비스를 제공했다. 여기서, 위시리스트란 소비자의 선호되는 상품 리스트를 의미한다.
이에 따라, 소비자는 여러 쇼핑몰을 방문하여 언젠가 구매하길 원하는 물건 또는 서비스를 발견하지만, 각 쇼핑몰에 담아둘 경우, 어느 쇼핑몰이었는지 기억하기 어렵고, 확인을 위해서는 각 쇼핑몰에 로그인을 통해야 한다. 한편, 메모장 애플리케이션 등을 통해 쇼핑 리스트를 관리하기도 하지만, 이 경우, 현재 상품의 가격 및 또는 구매조건의 변동 등에 대한 정보를 제공받지 못한다. 따라서, 이를 제공하는 서비스의 대두가 필요하다.
아울러, 상기의 서비스는 위시리스트에 포함된 쇼핑몰의 특정 정보(가령, 상품의 가격 또는 구매조건 정보 등)를 쉽게 추출할 수 있어야 한다. 따라서, 특정 정보의 추출을 손쉽게 수행하는 방법의 대두가 필요하다.
한편, 상기와 같은 정보는 본 발명의 이해를 돕기 위한 백그라운드(background) 정보로서만 제시될 뿐이다. 상기 내용 중 어느 것이라도 본 발명에 관한 종래 기술로서 적용 가능할지 여부에 관해, 어떤 결정도 이루어지지 않았고, 또한 어떤 주장도 이루어지지 않는다.
공개특허공보 2001-0047428호(공개일자: 2001.6.15)
상술된 문제점들을 해결하기 위해 본 발명의 일 실시 예는 학습용 웹문서의 구성 정보를 구조화하는 방법 및 디바이스를 제안한다.
또한, 본 발명의 일 실시 예는 기계적으로 학습된 정보에 기초하여 추출용 웹문서의 추출용 정보를 추출하는 방법 및 디바이스를 제안한다.
또한, 본 발명의 일 실시 예는 웹문서에 포함된 상품 정보를 절차적으로 추출하는 방법 및 디바이스를 제안한다.
본 발명에서 이루고자 하는 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급하지 않은 또 다른 기술적 과제들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
본 발명의 일 실시 예에 따른 학습을 통한 범용화된 정보 추출 방법은 적어도 하나의 학습용 웹문서 각각에 포함된 구성 정보를 노드를 이용하여 구조화하는 단계; 상기 적어도 하나의 학습용 웹문서에 대해, 추출용 정보가 위치한 제1 타겟 노드 및 상기 제1 타겟 노드의 적어도 하나의 상위 노드에 포함된 정보를 정규화하여 저장하는 단계; 추출용 웹문서에 포함된 구성 정보를 노드를 이용하여 구조화하는 단계; 상기 추출용 웹문서 상에서 상기 추출용 정보를 추출하는 경우, 상기 추출용 웹문서 상의 노드들을 순회하면서 정규화된 상기 학습용 웹문서의 노드 정보와 계층 비교하여 상기 추출용 웹문서 상의 노드들에 가중치 점수를 부여하는 단계; 및 상기 가중치 점수가 소정의 조건을 만족하는 제2 타겟 노드에 연관된 정보를 추출하는 단계를 포함할 수 있다.
본 발명의 다양한 실시 예에 따르면 아래와 같은 효과가 발생된다.
첫째, 학습용 웹문서의 구성 정보를 구조화하는 방법이 제공됨으로써, 정보 검색 및 정보 추출 효율성이 향상되고, 사용자 편의성이 향상될 수 있다.
둘째, 기계적으로 학습된 정보에 기초하여 가중치를 부여하여 노드를 검색하는 방법이 제공됨으로써, 정보 검색 및 정보 추출 효율성이 향상되고, 사용자 편의성이 향상될 수 있다.
셋째, 웹문서에 포함된 상품 정보를 절차적으로 추출하는 방법이 제공됨으로써, 정보 검색 및 정보 추출 효율성이 향상되고, 사용자 편의성이 향상될 수 있다.
본 발명에서 얻은 수 있는 효과는 이상에서 언급한 효과들로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
도 1은 실시 예에 따른 위시리스트를 관리하는 개략적인 시스템을 나타낸다.
도 2를 실시 예에 따른 위시리스트를 수집하는 방법을 나타내는 시퀀스도이다.
도 3은 실시 예에 따른 디바이스에서 구동되는 위시리스트 애플리케이션의 동작을 나타내는 시퀀스도이다.
도 4는 실시 예에 따른 구조화된 웹문서를 나타낸다.
도 5는 실시 예에 따른 범용화된 정보를 추출하는 디바이스의 블록도를 나타낸다.
도 6은 학습용 웹문서에 포함된 구성 정보로부터 필요 정보를 생성하여 저장하는 기준을 설명하기 위한 도면이다.
도 7 및 도 8은 실시 예에 따른 추출용 정보를 입력받는 방법을 나타낸다.
도 9 내지 도 13은 실시 예에 따른 추출용 정보를 추출하는 방법을 나타낸다.
도 14 및 도 15는 실시 예에 따른 웹문서를 위시리스트에 추가하는 방법을 나타낸다.
이하, 첨부된 도면을 참조하여 본 명세서에 개시된 실시 예를 상세히 설명하되, 도면 부호에 관계없이 동일하거나 유사한 구성요소는 동일한 참조 번호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다. 이하의 설명에서 사용되는 구성요소에 대한 접미사 "모듈" 및 "부"는 명세서 작성의 용이함만이 고려되어 부여되거나 혼용되는 것으로서, 그 자체로 서로 구별되는 의미 또는 역할을 갖는 것은 아니다. 또한, 본 명세서에 개시된 실시 예를 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 명세서에 개시된 실시 예의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 첨부된 도면은 본 명세서에 개시된 실시 예를 쉽게 이해할 수 있도록 하기 위한 것일 뿐, 첨부된 도면에 의해 본 명세서에 개시된 기술적 사상이 제한되지 않으며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.
제1, 제2 등과 같이 서수를 포함하는 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되지는 않는다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.
단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다.
본 출원에서, "포함한다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
본 명세서에서 설명되는 이동 단말기에는 휴대폰, 스마트 폰(smart phone), 노트북 컴퓨터(laptop computer), 디지털방송용 단말기, PDA(personal digital assistants), PMP(portable multimedia player), 네비게이션, 슬레이트 PC(slate PC), 태블릿 PC(tablet PC), 울트라북(ultrabook), 웨어러블 디바이스(wearable device, 예를 들어, 워치형 단말기 (smartwatch), 글래스형 단말기 (smart glass), HMD(head mounted display)) 등이 포함될 수 있다.
그러나, 본 명세서에 기재된 실시 예에 따른 구성은 이동 단말기에만 적용 가능한 경우를 제외하면, 디지털 TV, 데스크탑 컴퓨터, 디지털 사이니지 등과 같은 고정 단말기에도 적용될 수도 있음을 본 기술분야의 당업자라면 쉽게 알 수 있을 것이다.
도 1은 실시 예에 따른 위시리스트를 관리하는 개략적인 시스템(1000)을 나타낸다.
도 1에 도시된 바와 같이, 시스템(1000)은 이동 단말기(100), 상기 이동 단말기(100)와 네트워크를 통해 연결되는 복수의 쇼핑몰(20a, 20b), 위시 리스트 서버(200, wish list server)를 포함할 수 있다.
이동 단말기(100)는 사용자에 의해 조작될 수 있다. 여기서, 쇼핑몰 A(20a) 및 쇼핑몰 B(20b)는 온라인 쇼핑몰이거나 진열된 상품에 대한 정보 또는 프로모션 정보를 전송하기 위한 비콘 등의 데이터 전송장치가 설치된 오프라인 쇼핑몰을 포함할 수 있다.
이동 단말기(100)는 사용자 조작에 의해 온라인 쇼핑몰에 접속하여 상품을 검색하고 선택하거나, 오프라인 쇼핑장소에서 사용자에 의해 이동될 수 있다.
이동 단말기(100)는 위시리스트 서버(200) 또는 애플리케이션 스토어에서 위시리스트를 관리할 수 있도록 해주는 위시리스트 애플리케이션을 다운받을 수 있으나, 실시 예는 이에 국한되지 않는다.
여기서, 위시리스트는 wish list로 다양한 웹문서에서 사용자의 선호에 의해 선택된 상품, 서비스 등의 정보를 일괄적으로 저장할 수 있다. 위시리스트는 복수의 쇼핑몰(20a, 20b)에서 선택된 상품, 서비스 등을 저장할 수 있다. 시스템(1000)은 위시리스트에 저장된 상품의 가격 변동 정보를 포함한 이벤트 정보를 이동 단말기(100)로 제공할 수 있다.
위시리스트 애플리케이션이 이동 단말기(100)에 설치되는 경우, 이동 단말기(100)는 위시리스트 애플리케이션이 이동 단말기(100)에 설치된 브라우져 또는 외부 데이터 수신 애플리케이션과 연계되게 할 수 있다.
이동 단말기(100)는 설치된 위시리스트 애플리케이션이 활성화되면, 상품을 검색하면서 해당 상품을 위시리스트에 추가할 수 있다.
이동 단말기(100)는 사용자에 의해 선호되는 상품을 선택하는 기능이 1) 기기의 OS에 탑재된 기본 브라우져, 2) 위시리스트 애플리케이션에 내재된 브라우져, 및 3) 모든 쇼핑몰의 자체 애플리케이션 등 온라인 쇼핑 경험에서의 모든 채널을 통해 호출 및 작동 가능하게 할 수 있다.
예를 들어, iOS를 사용하는 이동 단말기(100)는 Share Extension 기능에 의해 다른 애플리케이션들 간의 데이터 공유 기능을 제공하는데, 기본 브라우져에서 Share Extension 기능을 이용하여, 현재 열람 중인 웹문서에 포함되어 있는 콘텐츠(예를 들어, URL, 이미지, 텍스트)를 위시리스트 애플리케이션과 공유하도록 할 수 있다. 위시리스트 애플리케이션은 이러한 Share Extension 또는 각각의 이동 단말기(100)에서 제공되는 공유기능을 통하여 브라우져에서 표시하고 있는 웹문서의 현재 URL을 확인하고, 현재 페이지에서 추출한 상품명, 상품 가격 및 상품 이미지 등을 추출할 수 있다. 추출된 정보는 위시리스트 애플리케이션의 자체 UI를 통해 사용자가 확인할 수 있도록 통일된 형식으로 사용자 단말의 화면에 제시될 수 있다.
보다 구체적으로, 사용자가 쇼핑몰 웹문서에서 위시리스트에 추가하기를 원하는 상품을 발견한 경우, 이동 단말기(100)는 Share Extension 또는 Direct Share 등과 같은 공유기능을 통해 현재 URL을 확인하고, 현재 URL 정보를 위시리스트 수집 장치에 전송할 수 있다. 위시리스트 수집 장치는 사용자 단말 내에 있거나 위시리스트 서버와 같은 외부 장치일 수 있다. 전송받은 URL 정보를 통해 상품명, 상품 가격 등과 같은 상품 정보를 추출하기 위한 연산은 사용자 단말에서 로컬로 작동하거나 위시리스트 서버(200)와 같은 원격의 서버에서 수행될 수 있다. 이러한 연산의 수행 결과 추출된 상품 상세 정보는 사용자 단말에서 별도의 UI를 생성하여 사용자에게 노출될 수 있다. 사용자가 상품 상세 정보가 자신이 수집하기 원하는 정보와 일치함을 확인하는 신호가 사용자 단말에서 수신되면, 수집된 상품 정보는 원격 서버의 데이터베이스에 저장될 수 있다.
상술된 바와 같은 상품 정보 수집은 위시리스트 애플리케이션에 내장된 브라우져를 통해서도 이루어질 수 있다. 위시리스트 애플리케이션은 온라인 쇼핑몰을 탐색할 수 있는 브라우져를 제공하며, 이러한 브라우져를 통해 상품을 검색한 후 위시리스트 애플리케이션 내의 수집 버튼을 통해 상품 수집 함수를 호출할 수 있다. 호출 이후의 과정은 사용자 단말의 브라우져를 이용하는 것과 동일하나, URL 정보 전달 및 UI 생성을 위한 객체가 애플리케이션 내의 웹브라우져 컨트롤러 객체라는 점에서 차이가 있을 수 있다.
위시리스트 서버(200)는 각각의 쇼핑몰의 상품 게시 형식에 대한 정보를 저장하는 쇼핑몰 데이터베이스 및 사용자들이 위시리스트로 선택한 상품에 대한 정보를 저장하는 상품 데이테베이스를 포함하거나 이런 데이터베이스들과 연결되어 동작할 수 있다. 상품 데이터베이스는 상품의 URL, 상품명, 상품 정보 추출시의 가격, 상품 이미지(또는 이미지의 URL), 상품에 대한 선호도, 상품 정보의 추출 시간, 브랜드, 제조사, 상품 카테고리(생활용품인지, 의류인지, 전자기기인지, 여행상품인지 등) 등에 대한 데이터를 포함할 수 있다. 또한, 상품 데이터베이스에는 사용자 단말의 각종 센서 및 정보를 통해서 수집되는, 상품 선택시 사용자의 행동 컨텍스트와 관련 있는 데이터(예를 들어, 위치 정보, 선택시 시간, 쇼핑몰로의 진입 경로, 사용자 단말의 제조사, 사용자 단말의 모델명, 사용자 단말의 OS 등)를 포함할 수 있다.
한편, 본 명세서서는 위시 리스트 서버(200)가 이동 단말기(100)와 분리된 경우와 위시 리스트 서버(200)의 기능을 이동 단말기(100)가 포함하는 경우를 함께 혼용하여 설명할 수 있다.
이하에서는 도 2를 참고하여 실시 예에 따른 위시리스트를 수집하는 방법을 설명하기로 한다.
이동 단말기(100)에는 위시리스트 애플리케이션이 설치되고, 사용자 계정이 생성되어 사용자 계정으로 로그인이 이루어진 상태이다. 이동 단말기(100)는 사용자 조작에 의해 쇼핑몰의 상품을 선택하고(S210), 쇼핑몰 서버로부터 상품에 대한 정보를 수신하여 디스플레이할 수 있다(S220).
그 다음으로, 이동 단말기(100)는 사용자 조작에 의해 선호하는 상품을 선택하여 위시리스트 서버(200)에 위시 수집 요청한다(S230). 이 경우, 위시 수집 요청은 사용자가 선택한 상품의 웹문서의 URL 전송 또는 선택된 상품을 제공하는 웹문서의 URL(uniform resource locator) 전송을 포함할 수 있으나, 실시 예는 이에 국한되지 않는다.
여기서, 만약 이동 단말기(100)가 위시리스트 서버(200)의 기능을 포함하는 다른 실시예에서는, 위시 수집 요청이 반드시 원격의 위시리스트 서버(200)로 전송되지 않고, 이동 단말기(100)의 위시리스트 애플리케이션에 연계된 위시 수집 모듈에 전달될 수도 있다.
이 경우, 위시 수집 요청은 이동 단말기(100)에 의해 자체적으로 처리되고, 이후의 상품 정보 추출도 이동 단말기(100)에서 로컬로 수행될 수 있다.
위시리스트 서버는 쇼핑몰 서버(20)에 접속하여 사용자에 의해 선택된 상품의 웹문서로부터 선택된 상품의 상품명, 상품 가격 또는 이미지 등과 같은 상품 정보를 추출하여 수집할 수 있다(S240, S250).
추가적으로, 이동 단말기(100)는 위시리스트 서버(200)와 쇼핑몰 서버(20) 간의 통신이 문제없는지 확인한다(S260, S270). 위시리스트 서버(200)는 최종적으로 위시 DB에 상기 상품 정보를 저장한다(S280).
한편, 상품 정보의 추출을 위해서는 다양한 방법이 적용될 수 있다. 이하에서는 위시리스트 서버(200)의 기능을 포함하는 이동 단말기(100)가 임의의 웹문서에 포함된 상품 정보를 아는 경우와 모르는 경우의 동작을 자세히 살펴본다
(1) 먼저, 이동 단말기(100)가 임의의 웹문서에 포함된 상품 정보의 위치를 아는 경우를 살펴보기로 한다.
이동 단말기(100)는 xPath 매칭을 통해 상품 정보를 수집할 수 있고, CSS(cascading style sheets) selector 이용하여 상품 정보를 수집할 수 있다. 다만, 이하에서는 xPath 매칭을 통해 상품 정보를 수집하는 것으로 설명하기로 한다.
어떠한 웹문서의 HTML 문서는 DOM(Document Object Model)을 통해 구조화될 수 있다. 즉, 웹문서의 특정 부분이 DOM Tree를 통해 구조화되어 특정 정보의 위치 경로를 반환할 수 있으며, 이동 단말기(200)는 쇼핑몰마다 고유한 상품 정보의 xPath를 별도의 쇼핑몰 데이터베이스에 저장하여, 각각의 쇼핑몰의 상품 웹문서에서 상품명, 가격, 브랜드, 상품 이미지 등과 같은 정보가 웹문서의 어느 경로에 위치하는지를 알 수 있다.
xPath는 이동 단말기(200)의 관리자가 사전에 분석하여 쇼핑몰 데이터베이스에 미리 저장되어 있을 수 있다. 이러한 경우, 상품 정보의 수집은 쇼핑몰 데이터베이스에 저장된 특정 쇼핑몰의 게시 형식을 불러오고, 그 게시 형식에 기초하여 특정 쇼핑몰의 상품 웹문서를 분석하고 상품 정보를 추출하는 동작으로 수행될 수 있다. xPath는 위시리스트 애플리케이션의 기능을 통해 상품 수집 요청이 있을때마다 해당 쇼핑몰의 상품 웹문서에 대해 분석이 이루어질 수 있고, 이러한 경우, 일반화된 매칭 방식을 통해 상품 웹문서로부터 상품 정보가 추출될 수 있다. 따라서, 위시리스트 애플리케이션에 연계된 모듈이 상품 정보가 담겨 있는 페이지의 URL 및/또는 쿼리 요청을 수신하였을 때, 해당하는 페이지의 정보에서 xPath를 기반으로 파싱(parsing)을 통해 상품명, 상품 가격, 이미지 주소의 정보 등을 추출할 수 있다. 도 3에 따르면, 이동 단말기(100)의 위시리스트 애플리케이션에서 수행되는 방법의 흐름도이다. 사용자가 상품의 웹문서를 선택하여 위시리스트에 추가하기 원하는 경우, 위시리스트 애플리케이션은 현재 웹문서의 URL을 수신한다(S310). 수신된 URL의 도메인 주소를 통해 쇼핑몰의 종류가 판단될 수 있다(S320).
예를 들어, URL이 http://www.AAABBB.com/product/ MallDisplay.do?_method=Detail&sc.prdNo=3795801222&ns1=list&ns2=oldList&ns3=prd&sc.shopNo=0000100000&sc.dispNo=008001 인 경우, 이동 단말기(200) 또는 위시리스트 애플리케이션은 AAABBB.com을 통해 상기 상품이 상기 사이트의 상품임을 판단할 수 있다. 이러한 판단을 통해 “AAABBB”가 상품을 게시하는 형식을 알기 위해 쇼핑몰 데이터베이스로에 저장된 “AAABBB”의 상품 게시 형식에 대한 데이터를 로딩하여, 상품명, 가격, 이미지 URL에 해당하는 xPath를 확인할 수 있다(S330). xPath 파싱을 통해 필요로 하는 정보에 대한 결과값이 반환되고(S340), 이러한 정보를 기초로 사용자가 자신이 선택한 상품의 정보를 확인할 수 있도록 UI를 생성하여 상품 정보를 출력할 수 있다(S350).
(2) 다음으로 이동 단말기(100)가 임의의 웹문서에 포함된 상품 정보의 위치를 모르는 경우를 살펴보기로 한다. 역시 이동 단말기(100)가 위시리스트 서버(200)의 기능을 포함하는 것으로 설명한다.
일단, 구조화된 웹문서를 도 4를 참고하여 설명하기로 한다.
웹문서는 노드를 이용하여 구성 정보의 계층화가 표현될 수 있다. 가령, 웹문서는 최하단의 텍스트 정보를 포함하는 노드(411a) 및 상위 태그 정보(411b, 411c, 411d, 411e, 411f, 411g, 411h)를 포함하는 노드로 계층화되어 표현될 수 있다. 또한, 데이터가 위치한 노드와 그 상위 최소 4단계의 노드에 관한 정보가 정규화되어 데이터베이스에 저장될 수 있다.
도 5는 본 발명의 일 실시 예에 따른 범용화된 정보를 추출하는 이동 단말기(100)의 구성을 나타내는 블록도이다. 상기 이동 단말기(100)는 상술한 위시리스트 서버(200)를 포함하는 디바이스이나, 실시 예는 이에 국한되지 않는다.
도 5에 따르면, 이동 단말기(100)는 상품 정보 입력부(110), 학습부(120), 추출부(130), 디스플레이(140), 저장부(150) 및 제어부(160)를 포함한다. 상술한 구성 요소는 본 이동 단말기(100)를 구현하는데 필수적인 구성은 아니여서 다른 구성 요소가 추가될 수 있고, 상술한 구성 요소 중 일부가 생략될 수도 있다.
상품 정보 입력부(110)는 웹문서의 주소 정보, 상기 웹문서에 포함된 상품 정보(가령, 상품명 정보, 가격 정보, 이미지 정보 등)를 입력받을 수 있다. 상기 상품 정보는 도 7에 도시된 것과 같은 특정 입력 필드로 입력하는 방식 및 도 8에 도시된 것과 같은 마우스로 드래그하는 방식에 의해 입력될 수 있으나, 실시 예는 이에 국한되지 않는다.
학습부(120)는 복수의 학습용 웹문서에서 필요정보를 추출하여 저장하기 위한 모듈이다. 학습부(120)는 웹문서 구조화부(121), 키-밸류 생성부(125)를 포함한다.
웹문서 구조화부(121)는 적어도 하나의 학습용 웹문서에 포함된 구성 정보를 상기 학습용 웹문서 각각에 대해 노드를 이용하여 구조화하는 모듈이다. 즉, 각각의 웹문서에 대해 도 4와 같이 구조화하는 모듈이다. 구성 정보는 웹문서가 표시될 때의 정보 및 웹문서가 특정 형태, 모양 등으로 표시되게 제어하는 정보 등을 모두 포함하는 정보이다.
키-밸류 생성부(125)는 적어도 하나의 학습용 웹문서에 포함된 구성 정보로부터 필요 정보를 생성하여 저장하는 모듈이다. 도 6을 참고하여 설명하기로 한다. 여기서, 키(key, 510)는 구성 정보를 검색 및 구조화를 편리하게 하기 위한 항목으로 타입(type) 정보(511a), 태그(tag) 정보(511b), 스텝(step) 정보(511c) 및 태그 발생(tag occurrences) 정보(511d)를 포함할 수 있다.
타입 정보(511a)는 아이템의 타입을 나타내는 정보로, 상품명 정보, 가격 정보, 이미지 주소 정보 등을 포함할 수 있으나 실시 예는 이에 국한되지 않는다. 타입 정보는 검수자에 의해 찾고자 하는 정보일 수 있으나, 실시 예는 이에 국한되지 않는다. 검수자는 실제 사람일 수 있고, 검수 프로그램으로 구현될 수 있다.
태그 정보(511b)는 웹문서의 구조를 표현하기 위한 정보로, html 문서의 경우 div, h1, h2, table 등이 포함될 수 있으나, 실시 예는 이에 국한되지 않는다.
스텝 정보(511c)는 태그들의 순서를 나타낸다. 트리의 마지막 노드(leaf 노드)를 0으로 설정될 수 있고, 1단계 상위 노드 별로 +1씩 더해질 수 있으나, 실시 예는 이에 국한되지 않는다.
태그 발생 정보(511d)는 해당 타입 정보 또는 스텝 정보에서 태그가 나타난 횟수를 나타낼 수 있으나, 실시 예는 이에 국한되지 않는다.
키 검색 방법은 DB의 쿼리문과 유사하게 사용될 수 있다. 가령, “title:*:0:*” 이면 타이틀 타입의 제일 마지막 모든 태그 반환하는 검색식이 될 수 있다.
그 다음, 밸류(520)는 “next” 필드(530) 및 “attrs” 필드(530)를 포함할 수 있다.
“next” 필드(530)는 현재 노드의 상위 노드에 대한 정보를 포함하고, 문자열로 구성될 수 있으나, 실시 예는 이에 국한되지 않는다.
“next” 필드(530)는 “step” 필드(531)와 “tags” 필드(533)를 포함할 수 있는데, “step” 필드(531)는 다음 단계 검색을 위한 필드이다. 만약, 키의 스텝 정보가 0이라면 밸류의 “step” 필드는 1로 설정될 수 있다. “tags” 필드는 다음 단계 검색을 위한 필드로 상위 노드의 태그명 리스트를 포함할 수 있다.
“attrs” 필드는 현재 노드의 속성을 검사하기 위한 필드이다. “키” 및 “밸류”로 구성되고 “키”는 속성명, “밸류”는 속성값을 나타낸다. 여기서 “키”는 “id”, “class” 등을 포함할 수 있으나, 실시 예는 이에 국한되지 않는다.
밸류의 구체적인 예를 설명하면 아래와 같다.
get: title:div:0:1 1은 title 타입의 div 노드의 attribute를 가져오는 식이고, "{"attrs": {"data-reactid": "33", "class": ["prod_tit", "P1rMZ", "touch-header-title", "dtl_tit", "thw-detail-title", "product-name", "name"], "itemprop": "name"}, "next": {"step": 1, "tags": ["div", "nav"]}}"는 다음 노드가 div 혹은 nav 의 tag name을 가져야 하고, 현재 노드가 attrs 안의 키, 밸류 값을 가지면 추출을 원하는 데이터일 가능성이 있음을 나타낸다.
상술한 구성에 의해 특정 구조가 반복적으로 나타나는 웹문서의 정보를 정규화하여 추출됨으로써, 추출을 원하는 문서구조마다 데이터를 추출하는 모듈을 별도로 두어야하는 번거로움이 해소될 수 있다. 또한, 기계적 학습을 통해 학습용 웹문서를 간단한 절차에 따라 대량으로 학습시키고 임의의 웹문서에서 유사 데이터가 자동으로 추출될 수 있다.
디스플레이(140)는 웹문서를 표시하고, 웹문서의 구조화된 구성 정보를 표시할 수 있다.
저장부(150)는 복수의 학습용 웹문서로부터 추출하고자 하는 데이터가 위치한 노드와 그 상위 최소 4단계 이상의 노드에 관한 정보를 정규화하여 저장할 수 있다. 가령, 검수자는 추출하고자 하는 데이터 및 그 상위 4단계의 정보를 저장할 수 있고, 자동으로 추출하고자 하는 데이터 및 그 상위 4단계의 정보가 저장될 수 있다. 다만, 상위 4단계 이상의 정보가 저장될 수 있으나 실시 예는 이에 국한되지 않는다.
추출부(130)는 학습용 웹문서로부터 추출된 노드 정보에 기초하여 추출대상 웹문서에서 특정 정보를 추출하는 모듈로, 웹문서 구조화부(131), 노드 탐색부(133) 및 노드별 가중치 산출부(137)를 포함할 수 있다.
웹문서 구조화부(131)는 학습부(120)의 웹문서 구조화부(121)와 기능이 유사한 바, 여기서는 생략한다.
노드 탐색부(133)는 구조화된 웹문서를 구성하는 노드를 탐색하는 모듈로 다양한 탐색방법이 적용될 수 있다.
노드별 가중치 산출부(137)는 수많은 학습용 웹문서로부터 추출된 정보로부터 임의의 웹문서에 대해 노드별로 가중치를 게산하는 모듈이다.
노드별 가중치 산출부(137)는 기존에 학습된 패턴에 기초하여 학습된 타입의 구조(쇼핑몰, 뉴스 등)로부터 추출을 원하는 데이터가 포함된 임의의 웹문서에서 모든 노드를 순회하며 아래의 수식에 따라 가중치를 계산할 수 있다.
Figure pat00001
W는 기준노드의 가중치에 해당되고, 추출용 웹문서 내의 모든 노드가 기준노드의 가중치가 산출되어 비교될 수 있다. Wi 는 두 가지 값을 가질 수 있다. 두 가지 값은 a) 현재 스텝의 태그 정보가 데이터베이스에 저장된 정보와 일치하는 경우 A 값을 갖고, b) 현재 스텝의 속성 정보가 데이터베이스에 저장된 정보와 일치하는 경우 B의 값을 포함한다. 이때,
a) 및 b)를 모두 만족하는 경우 A+B값을 Wi값이 될 수 있다.
즉, 임의의 웹문서에서의 특정 노드 및 그 상위 노드들을 학습된 웹문서의 특정 노드 및 그 상위 노드를 비교하면서, 태그만 일치하는 경우 A 값을 할당하고, 속성 값이 일치하는 경우 B값을 할당할 수 있다. 태그 및 속성 값이 일치하는 경우 A+B의 값을 가질 수 있다. B값이 A값보다 크게 설정될 수 있으나, 실시 예는 이에 국한되지 않는다.
그리고, 추출부(130)는 모든 노드 중에서 가중치의 값이 가장 큰 노드의 텍스트를 추출할 수 있다.
또한, 노드별 가중치 산출부(137)는 상술한 가중치 산출 방법을 더 확장하여 아래와 같이 가중치를 각각의 노드 별로 부여할 수 있다.
Figure pat00002
여기서, n-th ancestor는 특정 기준 노드(스텝이 0)의 상위 n번째 상위노드의 인덱스이며, K(i)는 상기 기준 노드에 대한 커널 함수에 해당된다. 상술한 가중치 산출 방법에서는 K(i)가 i로 선택된 것이나, 가중치 부여에 가장 적합한 함수라면 실시 예는 이에 한정되지 않는다. 또한, K(i)는 학습용 웹문서에서 추출된 정보가 방대할 경우, 추출용 웹문서에서 추출 정보를 정확하고 신속하게 추출하도록 구현될 수 있다.
도 7 및 도 8은 본 발명의 실시 예에 따른 추출용 정보를 입력하는 방법을 나타낸다. 이동 단말기(100)는 추출을 원하는 노드 정보를 저장할 때, 마지막 노드의 태그, 속성, 밸류 등의 정보를 정규화하여 기입할 수 있다.
도 7에 따르면, 웹문서 주소 정보(URL, 610), 상품 타이틀 정보(620), 가격 정보(630) 및 이미지 주소 정보(640) 등이 입력될 수 있다. 상기의 입력된 정보에 기초하여 추출용 정보가 입력될 수 있다. 가령, 입력정보가 상품명(620)이라면 상품명에 해당되는 학습용 웹문서의 추출 정보가 상품명이 되고, 임의의 추출용 웹문서의 상품명을 검색하여 추출될 수 있다.
도 8에 따르면, 추출용 정보가 사용자의 드래그 동작에 의해서 선택되면(810), 추출용 정보로 상품명 정보가 입력되어 추출용 웹문서에서 해당 상품명 정보가 추출될 수 있다.
도 9 및 도 10은 추출용 웹문서에서 특정 추출용 정보를 추출하는 방법을 나타낸다.
도 9에 따르면, 이동 단말기(100)는 추출용 웹문서를 노드들로 구조화한 후, 학습용 웹문서를 통해 저장된 특정 추출용 정보에 기초하여 추출용 웹문서에서 추출용 정보를 검색 및 추출할 수 있다.
가령, 이동 단말기(100)는 입력된 추출용 정보가 상품의 가격 정보인 경우, 추출용 웹문서의 노드들을 순회하며 학습용 웹문서에서 분석된 상품의 가격 정보의 노드 계층도와 비교할 수 있다.
이동 단말기(100)는 div class=”price2_2”(div class = “price_2_1”은 2줄 할인전 가격)를 기준으로 계층적으로 학습용 웹문서에서 분석된 가격 정보의 노드 게층도와 비교할 수 있다. 이동 단말기(100)는 학습용 웹문서에서 분석된 상품의 가격 정보의 노드 계층도가 다수개인 경우 각각의 노드 계층도 별로 추출용 웹문서의 추출된 가격 정보와 순차적으로 비교하여 노드에 가중치 점수를 부여할 수 있다.
도 10도 마찬가지로 “미녀와 야수 스페셜 에디션 티세트”가 추출용 정보이고, 이를 학습용 웹문서에서 분석된 상품명 정보와 계층적으로 분석하여 노드에 가중치를 부여할 수 있다. 이때, 상품 정보는 이미지의 “이미지 alt”에 포함될 수도 있다. 만약, 학습용 웹문서를 통해 분석된 상품명 정보가 “이미지 alt”에 포함된 경우, 해당 노드의 가중치가 크게 부여될 수 있다.
도 11 내지 도 13은 추출부(130)의 다른 실시 동작을 나타낸다. 추출부(130)는 가중치에 기초하지 않고 직관적으로 추출용 정보를 추출할 수 있다. 추출부(130)는 직관적인 정보 선택 기준을 알고리즘화하여 임의 의 웹문서로부터 추출용 정보를 추출할 수 있다.
먼저, 도 11에 따르면 상품명 정보에 기초하여 추출용 정보를 추출할 수 있다. Javascript를 모두 렌더링하고 <script>, <br> 등의 노이즈를 제거한다(1110). 이에 따라, 화면에 표시될 구성들이 모두 표현된 상태에서 불필요한 정보가 제거될 수 있다.
추출부(130)는 웹문서 트리 안의 모든 노드를 순회하여 속성의 값에 상품명이 존재하는지 확인하고, 텍스트 데이터, 폰트 사이즈, 볼드 스타일 여부 등에 기초하여 상품명 후보군을 생성한다(1120). 후보 배열이 존재하지 않는 경우 이미지의 “alt”를 추출할 수도 있으나(1130), 실시 예는 이에 국한되지 않는다.
추출부(130)는 후보 배열을 순회하여 폰트 사이즈에 따라 내림차순 정렬을 진행하고(1140) 정렬된 배열에서 같은 사이즈인 경우 볼드 여부에 따라 다시 내림차순 정렬을 수행한다(1150). 이는 특정 웹문서에서 ?트의 크기가 클수록 볼드로 표시될수록 상품명이 가능성이 높은 것을 이용한 것이다. 결국, 타이틀이 선정될 수 있다(1160).
도 12에 따르면, 추출부(130)는 가격 정보를 추출할 수 있다. 추출부(130)는 노드의 숫자 및 통화의 조합한 정규표현식을 통과한 데이터 후보 배열을 생성한다. 이때, 스트라이크 스타일이 포함되면 노드의 데이터는 할인 전 가격일 가능성이 높으므로 원가 정보로 데이터에 추가한 후 후보 배열에서 제외할 수 있고, 이탤릭 문자, 그림자 등과 같은 데코레이션 정보도 고려될 수 있다(1210). 그 다음 텍스트 폰트의 크기가 클수록, 볼드가 포함되어 있을수록 최종 가격일 수 있다(1220, 1230). 결국 최종 가격이 선택될 수 있다(1240).도 13에 따르면, 추출부(130)는 이미지 태그에 속한 모든 이미지를 대상으로 상단에 배치된 이미지(1310), 크기가 큰 이미지(1320)를 대표 이미지로 추출할 수 있다(1330).
또한, 추출부(130)는 특정 추출용 정보(가령, 상품명, 가격 정보, 이미지 정보, 신문 기사 바디, 타이틀, 게시 날짜 등)가 상기 추출용 웹문서 상에서 소정 조건에 부합하게 수집된 경우, 추출용 웹문서 상에서 수집된 정보에 기초하여 추출용 웹문서와 연관된 서비스 정보를 제공할 수 있다.
추출부(130)는 상품명, 가격, 이미지 정보가 모두 추출된 경우 상품 페이지로 간주하여 추출용 웹문서는 상품에 관련된 문서임을 알릴 수 있다(예를 들면, 현재 웹문서는 위시하기가 가능해요)
또한, 추출부(130)는 신문 기사 바디, 타이틀, 게시 날짜가 모두 추출된 경우 뉴스 페이지로 간주하고 추출용 웹문서는 뉴스 정보가 포함된 웹문서임을 알릴 수 있다.
또한, 도 11 내지 도 13에서 설명한 방법은 학습용 웹문서가 없이 추출용 웹문서에서 필요 정보를 추출하는 것을 상정하였으나, 이는 실시 예에 불과하고 상기 방법은 학습용 웹문서에 의해 학습 데이터를 수집한 후, 수행될 수 있다.
한편, 상술된 추출 방식은 모든 쇼핑몰에서 사용자의 열람을 위해 이미 공개된, HTML, JAVASCRIPT, JSON, XML 등의 데이터에서 필요한 정보를 추출하는 방식으므로 각각의 쇼핑몰의 사업 주체와 별도 사전 기술 협약 없이도 필요한 정보를 추출할 수 있도록 한다.
상기 방식들은 각각 수행될 수도 있고, 상품 정보의 추출의 정확성을 높이기 위해 조합하여 사용될 수도 있음은 물론이다. 본 개시에서는 상기 방식들을 통해 공개적으로 제공되는 쇼핑몰의 웹문서 자체에서 필요한 상품 정보를 추출하므로, 온라인 쇼핑몰 주체들과의 별도의 기술적 협약 없이도 사용자에게 공개되는 기본적인 데이터만으로 상품의 위시리스트를 수집할 수 있다. 또한, 본 개시의 위시리스트 애플리케이션은 기본 브라우져의 플러그인 형태로 제공되어 모든 사용자 단말에서 유사한 사용자 경험을 통해 접근용이성 및 범용성을 제공할 수 있다. 모바일 디바이스 이외의 PC에서도 별도의 툴바 등을 설치하지 않고, Share extension, Chrome extension 등과 같이 브라우져의 확장 플러그인 형태로 작동할 수 있음은 물론이다.
상술된 방식으로 추출된 상품 정보에 기초하여 위시리스트 서버(200) 또는 위시리스트 애플리케이션은 사용자가 선택한 상품의 상품명, 가격, 상품의 이미지, 구매조건, 배송조건 등의 상세정보를 자체 UI를 통해 사용자 단말에 표시하며, 정보의 정확성에 대한 사용자의 확인을 구할 수 있다. 사용자가 정보의 정확성을 확인하면, 해당 정보의 상품을 위시리스트에 수집하기 원한다는 것으로 인식하여 해당 정보는 사용자 계정에 연계하여 위시리스트 데이터베이스 또는 상품 데이터베이스에 저장될 수 있다. 상품 정보 확인을 위한 UI는 일정한 형식으로 정해져 있어, 사용자는 다양한 쇼핑몰의 상품에 대해서도 일관된 UI에 따라 상품 정보를 확인하고 저장할 수 있다. 시장(온라인 및 오프라인을 모두 포함하는 시장)에서의 상품들의 정보는 지속적으로 변화하며, 특히 온라인 쇼핑몰의 상품의 가격, 할인 조건, 판매 조건 또는 배송 조건은 상대적으로 빈번하게 변동할 수 있다. 이러한 변동되는 정보들에 대한 실시간 확인을 위해 사용자 단말에서 정보확인 동작이 수행되도록 할 수 있으나, 이는 사용자 단말에 추가적인 부하를 발생시키므로, 원격에서 서버가 구성되어 상기 확인을 수행하는 것이 바람직할 것이다.
위시리스트 서버(200)는 상품 데이터베이스를 순환하며, 각각의 상품의 웹문서에 대한 URL을 이용하여 해당 상품에 대한 현재 가격, 구매조건 등의 상품 정보를 질의하고 수집하여 데이터베이스를 업데이트할 수 있다. 이러한 업데이트는 하루, 일주일, 한달 간격 등 다양한 주기에 따라 자동으로 주기적으로 이루어질 수 있다. 이 경우, 기존 데이터를 별도로 저장하여 상품 정보의 변동 이력을 보여주는 정보로 활용할 수 있다.
다른 실시예에서, 위시리스트 서버(200)는 상품 데이터베이스에 저장된 상품의 URL을 이용할 뿐만 아니라, 인터넷에서 접속가능한 복수의 다른 쇼핑몰 또는 검색엔진을 이용하여 해당 상품에 대한 가격을 질의하여 가장 낮은 가격을 조회할 수 있다. 예를 들어, 상품 질의 방식은 상품명, 또는 상품의 해시태그를 통한 텍스트 검색 방식, 상품의 이미지를 통한 이미지 검색 방식을 포함할 수 있다. 상품의 해시태그는 기존에 사용자가 부여한 값, 컨텐츠 생산자가 최초로 부여한 값, 해당 쇼핑몰의 다른 사용자들이 부여한 값, 또는 본 시스템에서 자동으로 추출한 값 등일 수 있다.
상술된 질의 내용 및 수집 내용을 기초로, 상품 정보에 변동 사항이 발생한 경우, 해당 정보에 따라 컨텐츠를 자동으로 생성하여 사용자 단말로 전송한다. 예를 들어, 상품의 가격이 떨어진 경우, 서비스 운영자가 미리 작성한 컨텐츠 데이터베이스와 변화한 가격의 수치를 조합하여, "xxx 의 가격이 xxx 원 내려갔어요. 위시리스트를 통해 확인해보세요!" 등의 문구가 자동으로 구성되어 사용자 단말로 전송될 수 있다.
상술된 동작들을 통해 누적된 상품 정보의 변동 데이터를 기초로, 현재 시점에서의 구매 타당성이 판단될 수 있다. 예를 들어, 최근 일정 기간 내의 평균 가격과 현재 가격과의 차이 또는 최저/최고 가격과의 차이를 비교하거나, 특정 브랜드, 쇼핑몰의 프로모션/가격할인 패턴, 유사 카테고리의 다른 상품들의 가격변동폭을 파악하는 머싱 러닝 분석을 통해 구매 시점의 타당성이 평가될 수 있다. 이러한 평가를 통해 사용자에게 적합한 구매시점이 안내될 수 있다.
한편, 장기간동안 위시리스트 애플리케이션을 통해 축적되는 상품 데이테베이스에서의 정보의 빅데이터 분석 등을 통하여 다양한 취향 분석 및 상품 추천이 가능하게 될 수 있다.
먼저, 상품 데이터베이스에는 각각의 상품에 대한 선호도 또는 인기도 정보를 위한 칼럼이 존재할 수 있다. 선호도는 최초 선택시에 사용자에 의해 정해질 수 있고, 선호도 또는 인기도는 사용자 계정에 연계되어 상품 데이터베이스에 저장된 상품들 중 하나의 상품을 선택하는 신호가 위시리스트 서버에 수신되는 경우, 위시리스트 서버에 연결된 상품 데이터베이스의 선호도 또는 인기도 정보에서 상기 하나의 상품의 선호도 또는 인기도 수치가 증가될 수 있다. 여기서 상품을 선택하는 것은 상품의 미리보기, 상세보기 또는 구매하기 등을 포함하는 동작일 수 있다.
상품의 인기도는 상품 데이터베이스에 저장된 특정 상품과 상품과 연계된 사용자 계정들이 1:n의 관계를 갖는 경우 n 값이 클수록 인기도 수치가 높아지도록 설정될 수 있다. 예를 들어, 제 1 상품이 사용자 계정1, 사용자 계정2, 사용자 계정3에 연계되어 있는 경우와 제 2 상품이 사용자 계정1과만 연계되어 있는 경우, 제 1 상품의 인기도가 제 2 상품의 인기도보다 높은 수치를 가진다. 여기서, 상품의 동일성은 URL을 기초로 판단되거나, URL이 다르더라도, 상품명, 브랜드, 모델명 등을 기초로 하여 결정될 수 있다.
상품의 인기도는 구매 전환율에 따라 결정될 수 있다. 예를 들어, 위시리스트 서버는 구매 결정 여부를 취합하여 구매 결정 수준이 더 높은 상품의 인기도에 가산점을 부여할 수 있다. 즉, 다수의 사용자가 위시리스트에 수집하고, 구매 전환율이 높은 상품일수록 높은 인기도를 갖는 상품으로 분류될 수 있다.
상술된 바와 같은 인기도를 기초로 "오늘의 인기 상품 Top10"등이 컨텐츠화 되어 사용자 단말들에 전송될 수 있다.
한편, 상품 추천은 유사한 취향을 가진 사용자들 사이의 상품 추천을 통해 이루어질 수 있다. 취향 분석은 텍스트 또는 이미지 마이닝을 이용한 상품 특징 추출 방법에 의해서도 이루어질 수 잇다. 텍스트 또는 이미지 마이닝 기법을 통해 주어진 상품 정보에서 핵심 키워드를 추출하고, 키워드로부터 시맨틱 검색을 통해 특징이 추론될 수 있다. 텍스트 마이닝 기법은 상품명에서 상품과 연관되어 있는 단어들을 자동으로 추출하고, 이미지 마이닝 기법은 상품의 이미지에서 상품 또는 소비자의 취향과 연관되어 있는 단어들을 자동으로 추론하는 방법일 수 있다. 또한, 상품에 대한 핵심 키워드는 상술된 자동화된 방식 이외에도 컨텐츠 최초 생산자(판매자), 임의의 집단 사용자, 위시리스트 서비스의 사용자가 부여하는 해시태그를 통해서도 수집될 수 있다. 이렇게 구성된 추론함수와 그 결과값은, 취향 분석 및 추천을 위한 상품 클러스터링 과정에서 유사도 추출을 위한 요소로 활용될 수 있다.
사용자들간의 유사성 분석은 위시리스트에 담긴 공통되는 상품들의 수를 통해 이루어질 수도 있다. 위시리스트 서버는 상품 데이터베이스의 사용자 계정 A의 상품과 사용자 계정 B의 상품을 비교하여, 공통되는 상품의 수를 계산하고, 공통되는 상품의 수가 서비스 운영자 또는 사용자에 의해 미리결정된 수치 이상인 경우에 사용자 계정 A와 사용자 계정 B가 유사 취향을 가진 그룹으로 판단하여, 사용자 계정 A의 위시리스트 상품 중에서 사용자 계정 B의 위시리스트 상품에는 없는 상품들을 사용자 계정 B로 추천하는 신호를 생성할 수 있다. 이 경우, 상술된 상품 특징 추출을 통해 사용자 계정 B가 이미 포함한 상품과 유사한 특징을 가진 상품들만을 추천하도록 구현될 수도 있다.
취향 분석은 상품 데이테베이스의 상품 선호도 정보에 의해 이루어질 수 있다. 예를 들어, 상품 데이터베이스에는 상품의 정보를 포함하여 애플리케이션 UI를 통해 입력받은 상품에 대한 선호도가 0점에서 5점 사이의 값으로 저장되어 있을 수 있다. 선호도 수치와 상술된 상품 특징의 추출시 키워드를 연계하여 사용자가 높은 선호도를 표시한 상품의 특징이 정의될 수 있다. 이러한 방식으로 정의된 사용자의 취향 데이터를 근거로 사용자의 취향에 적합한 신규/유사 상품 추천이나 타게팅 광고 등의 컨텐츠가 구성될 수 있다.취향 분석 및 구매 의향 분석은 사용자의 상품 열람 히스토리를 기반으로 이루어질 수도 있다. 사용자의 위시리스트의 상품의 확인 횟수, 위시리스트에 상품을 담아둔 기간, 선호도 정보, 공유 정도 등 사용자가 위시리스트 애플리케이션 또는 브라우져를 통해 상품을 열람하는 행동에 대한 컨텍스트를 데이터베이스화하여 원격의 서버에 저장하고, 이를 통해 사용자의 취향 및 구매 의향이 분석될 수 있다. 예를 들어, 어떤 상품에 대한 열람 빈도가 다른 상품에 비해 현저하게 높은 경우, 해당 상품에 대한 구매 의사가 비교적 높은 것으로 판단되어, 유사한 대안 상품이 추천되거나 사용자가 위시리스트 공유를 허용한 다른 사용자 또는 소셜 계정에 연계된 다른 사용자에게 선물을 추천할 수 있다.
상품 추천은 협업필터링을 이용해서 이루어질 수도 있다. 어떠한 사용자에게 연결되어 있는 위시리스트 상품들의 특징을 통해 사용자의 특징을 추론하고, 다수의 사용자들을 이러한 특징에 근거하여 클러스터링하게 되면, 각각의 사용자 계정에 연결되어 있는 위시리스트의 데이터를 기반으로 상호 추천이 가능하게 된다. 예를 들어, 사용자 A에게 연계된 위시리스트의 제 1 상품이 사용자 A와 같은 특징 클러스터에 소속된 사용자 B에게 연계되어 있지 않은 경우, 제 1 상품을 사용자 B에게 추천할 수 있다. 이러한 방식은 유사한 특징을 공유하는 사용자들간의 상호 추천을 통해 타겟팅의 정확도를 높일 수 있다.
한편, 소셜 그래프 또는 사용자 설정에 따라 사용자의 위시리스트의 공개 범위가 설정되고 기념을 데이터를 호환하여 선물 추천을 위한 소셜 컨텐츠를 구성할 수 있다. 즉, 사용자 A가 자신의 위시리스트를 사용자 B에게 공개하는 것을 허용한 경우, 사용자의 선호도 수치가 높은 순서대로 사용자 B의 사용자 계정으로 사용자 A가 선호하는 상품이 추천될 수 있다. 사용자는 자신의 위시리스트를 특정 사용자에게 공개하여 선물을 요청하도록 할 수도 있고, 다른 사용자에게 선물을 하기 위해, 다른 사용자의 위시리스트의 공유를 요청할 수도 있다.
상기 소셜 그래프는 기기에 저장된 전화번호, 연락처, 애플리케이션내 친구맺기를 통한 관계 분석뿐만 아니라, Facebook/twitter/WeChat/Kakao 등 외부 SNS 서비스 API와 연동을 통해 생성될 수 있고, 상기 선물 추천 기능을 위해 사용자 단말 또는 애플리케이션에 저장된 사용자의 기념일 등이 이용될 수 있다. 또한, 단순한 위시리스트 공개뿐만이 아니라 사용자 간에 선물하기에 적합한 상품을 적합한 타이밍에 타게팅 방식으로 추천될 수 있다.
한편, 오프라인의 공간주가 게재한 온라인 데이터 또는 비콘 등과 같이 오프라인 공간에서 실시간으로 데이터를 전송하는 장치를 통해 오프라인에 존재하는 상품의 명세 정보를 사용자 단말에서 획득할 수 있는 경우, 위시리스트 애플리케이션이 설치된 디바이스를 통해서 오프라인 공간에서의 상품을 온라인 위시리스트에 추가할 수 있다. 또는, 해당 공간에 비콘과 같은 데이터 전송장치가 부재하는 경우에도, 위시리스트 애플리케이션을 통해 상품의 사진을 촬영하고 이미지를 분석하거나, QR 코드 또는 바코드를 분석하여 상품의 정보를 사용자 단말에서 획득할 수 있다.
임의의 오프라인 상품 명세는 위시리스트 애플리케이션의 시스템에서 정의된 데이터베이스 형식으로 표준화되어 저장되며, 사용자는 위시리스트 UI를 통해 온라인 쇼핑몰에서 상품을 수집하는 경우와 동일하게 오프라인에서 수집한 상품의 정보를 확인할 수 있다. 위시리스트를 수집하는 디바이스는 스마트폰 뿐만 아니라, 스마트 워치, 스마트 밴드, 구글 글라스 등 웨어러블 디바이스를 포함하여 연산 및 데이터 입/출력이 가능한 모든 장치가 될 수 있다.
위시리스트 애플리케이션이 설치된 디바이스를 소지한 사용자가 특정 오프라인 공간에 입장한 경우, 해당 공간에서는 사용자의 위시리스트 상품에 관련된 프로모션 정보가 제공될 수 있다. 사용자 단말은 해당 공간에서의 프로모션 정보를 실시간으로 감지하고, 사용자의 위시리스트의 상품들과의 상관 관계를 판단할 수 있다. 프로모션 정보는 오프라인 공간주가 게재한 온라인 데이터를 통해 수집되거나, 비콘 등과 같이 오프라인 공간에서 실시간으로 데이터를 전송하는 장치를 통해서 즉시 수집할 수 있다. 프로모션 정보와 사용자의 위시리스트의 상품 중 적어도 하나에 관계가 있는 경우, 예를 들어, 기존에 위시리스트의 상품보다 오프라인 상점에서의 상품이 더 낮은 가격을 제공하는 경우, 또는 쿠폰이 존재하는 경우 사용자 단말로 알람이 전송된다. 오프라인 공간의 입장 감지 모듈은 디바이스에서 로컬로 작동되며, 상관관계 판단 함수와 알림 전송 모듈은 로컬 디바이스 혹은 원격의 서버에서 작동할 수 있다.
도 14 및 도 15는 실시 예에 따른 웹문서를 위시리스트에 추가하는 방법을 나타낸다.
도 14는 본 개시의 실시예에 따른 상품 웹문서에서의 공유하기 화면의 예시이다. 공유하기 및 Wishupon을 선택하면 해당 상품의 수집이 시작된다.
하단의 “위시하기”탭이 선택되면 상기 사이트의 상품명, 가격 정보, 대표 이미지 등이 위시리스트에 저장될 수 있다.
도 15에 따르면, 상품 정보의 수집 후 사용자의 확인을 구하는 화면의 예시이다. 수집된 상품 정보를 사용자에게 제시하는 화면에서 사용자가 선호도 평가하기의 별점 등을 선택하도록 하여 사용자의 상품에 대한 선호도를 표시하도록 할 수 있다. 사용자에 의해 선택된 선호도는 상품 데이터베이스에서 사용자의 선호도 칼럼에 별도로 저장될 수 있다.
또한, 범용화된 정보를 추출하는 디바이스(100)는 추출용 웹문서에서 추출용 정보가 소정만큼 수집된 경우, 웹문서와 관련된 정보를 제공할 수 있다. 가령, 디바이스(100)는 특정 웹문서가 어떤 문서이고(상품관련 문서, 뉴스, 광고, 동영상 포함 문서 등), 무슨 특징이 있는지 알려줄 수 있다.
또한, 최종적으로 위시하기(1310)가 선택되야만 위시리스트에 상기 웹문서가 저장될 수 있으나, 실시 예가 이에 국한되는 것은 아니다.
본 발명의 기술 분야에서 통상의 지식을 가진 자는 여기에 개시된 실시예들과 관련하여 설명된 다양한 예시적인 논리 블록들, 모듈들, 프로세서들, 수단들, 회로들 및 알고리즘 단계들이 전자 하드웨어, (편의를 위해, 여기에서 "소프트웨어"로 지칭되는) 다양한 형태들의 프로그램 또는 설계 코드 또는 이들 모두의 결합에 의해 구현될 수 있다는 것을 이해할 것이다. 하드웨어 및 소프트웨어의 이러한 상호 호환성을 명확하게 설명하기 위해, 다양한 예시적인 컴포넌트들, 블록들, 모듈들, 회로들 및 단계들이 이들의 기능과 관련하여 위에서 일반적으로 설명되었다. 이러한 기능이 하드웨어 또는 소프트웨어로서 구현되는지 여부는 특정한 애플리케이션 및 전체 시스템에 대하여 부과되는 설계 제약들에 따라 좌우된다. 본 발명의 기술 분야에서 통상의 지식을 가진 자는 각각의 특정한 애플리케이션에 대하여 다양한 방식들로 설명된 기능을 구현할 수 있으나, 이러한 구현 결정들은 본 발명의 범위를 벗어나는 것으로 해석되어서는 안 될 것이다.
또한, 제시된 실시예들에 대한 설명은 본 발명의 기술 분야에서 통상의 지식을 가진 자가 본 발명을 이용하거나 또는 실시할 수 있도록 제공된다. 이러한 실시예들에 대한 다양한 변형들은 본 발명의 기술 분야에서 통상의 지식을 가진 자에게 명백할 것이며, 여기에 정의된 일반적인 원리들은 본 발명의 범위를 벗어남이 없이 다른 실시예들에 적용될 수 있다. 그리하여, 본 발명은 여기에 제시된 실시예들로 한정되는 것이 아니라, 여기에 제시된 원리들 및 신규한 특징들과 일관되는 최광의의 범위에서 해석되어야 할 것이다.

Claims (10)

  1. 적어도 하나의 학습용 웹문서 각각에 포함된 구성 정보를 노드를 이용하여 구조화하는 단계;
    상기 적어도 하나의 학습용 웹문서에 대해, 추출용 정보가 위치한 제1 타겟 노드 및 상기 제1 타겟 노드의 적어도 하나의 상위 노드에 포함된 정보를 정규화하여 저장하는 단계;
    추출용 웹문서에 포함된 구성 정보를 노드를 이용하여 구조화하는 단계;
    상기 추출용 웹문서 상에서 상기 추출용 정보를 추출하는 경우, 상기 추출용 웹문서 상의 노드들을 순회하면서 정규화된 상기 학습용 웹문서의 노드 정보와 계층 비교하여 상기 추출용 웹문서 상의 노드들에 가중치 점수를 부여하는 단계; 및
    상기 가중치 점수가 소정의 조건을 만족하는 제2 타겟 노드에 연관된 정보를 추출하는 단계를 포함하는, 학습을 통한 범용화된 정보 추출 방법.
  2. 제1항에 있어서,
    상기 가중치 점수를 부여하는 단계는,
    상기 추출용 웹문상 상의 모든 노드를 순회하며, 아래 수학식 1에 기초하여 기준 노드별로 가중치를 산출하는 단계를 포함하는, 학습을 통한 범용화된 정보 추출 방법
    [수학식 1]
    Figure pat00003

    (W는 기준 노드의 가중치, Wi 값은 a) 현재 스텝의 태그 정보가 저장된 정보와 일치하는 경우 제1 값, b) 현재 스탭의 속성 정보가 저장된 정보와 일치하는 경우 제2 값, c) 현재 스텝의 태그 정보 및 속성 정보가 저장된 정보와 일치하는 경우 제3 값, 여기서, i는 스텝이고 i가 1 증가할 때 상위 노드로 순회함, n-th ancestor는 상기 기준 노드의 n번째 상위 노드의 인덱스이고, K(i)는 i와 관련된 커널 함수).
  3. 제1항에 있어서,
    상기 정규화하여 저장하는 단계는,
    상기 학습용 웹문서에 포함된 구성 정보를 키(key) 정보 및 밸류(value) 정보에 기초하여, 노드 정보를 정규화하여 저장하는 단계를 포함하는, 학습을 통한 범용화된 정보 추출 방법.
  4. 제3항에 있어서,
    상기 키 정보는,
    특정 아이템의 타입 정보, 태그명 정보 및 태그의 순서 정보 중 적어도 하나를 포함하고,
    상기 밸류 정보는,
    특정 노드의 다음 단계로 검색될 상위 노드 정보 또는 상기 특정 노드의 속성 정보를 검사하기 위한 필드 정보를 포함하는, 학습을 통한 범용화된 정보 추출 방법.
  5. 제1항에 있어서,
    상기 추출용 웹문서의 주소 정보 및 상기 추출용 웹문서의 상기 추출용 정보를 입력받는 단계를 더 포함하는, 학습을 통한 범용화된 정보 추출 방법.
  6. 제5항에 있어서,
    상기 추출용 정보는,
    상품명 정보, 상품의 가격 정보 및 이미지 정보 중 적어도 하나의 정보를 포함하는, 학습을 통한 범용화된 정보 추출 방법.
  7. 적어도 하나의 학습용 웹문서 각각에 포함된 구성 정보를 노드를 이용하여 구조화하는 웹문서 구조화부;
    상기 적어도 하나의 학습용 웹문서에 대해, 추출용 정보가 위치한 제1 타겟 노드 및 상기 제1 타겟 노드의 적어도 하나의 상위 노드에 포함된 정보를 정규화하여 저장하는 키-밸류(key-value) 생성부; 및
    상기 웹문서 구조화부를 제어하여 추출용 웹문서에 포함된 구성 정보를 노드를 이용하여 구조화하고, 상기 추출용 웹문서 상에서 상기 추출용 정보를 추출하는 경우, 상기 추출용 웹문서 상의 노드들을 순회하면서 정규화된 상기 학습용 웹문서의 노드 정보와 계층 비교하여 상기 추출용 웹문서 상의 노드들에 가중치 점수를 부여하도록 제어하는 제어부를 포함하며,
    상기 제어부는,
    상기 가중치 점수가 소정의 조건을 만족하는 제2 타겟 노드에 연관된 정보를 추출하는, 학습을 통한 범용화된 정보를 추출하는 디바이스.
  8. 범용화된 정보 추출 방법에 있어서,
    추출용 웹문서에 포함된 구성 정보를 노드들을 이용하여 구조화하는 단계;
    상기 추출용 웹문서의 렌더링되지 않은 엔티티들을 렌더링하고, 노이즈 데이터를 필터링하는 단계; 및
    상기 추출용 웹문서 상에서 특정 추출용 정보를 추출하는 단계를 포함하는, 범용화된 정보 추출 방법.
  9. 제8항에 있어서,
    상기 추출하는 단계는,
    상기 특정 추출용 정보가 상품명 정보인 경우, 상기 노드들을 순회하며 태그명 및 속성값에 기초하여 상품명 정보를 검색하되, 텍스트 정보, 폰트 정보 및 데코레이션 정보, 볼드 스타일 정보 중 적어도 하나에 기초하여 상기 상품명 정보를 추출하는 단계;
    상기 특정 추출용 정보가 상품 가격 정보인 경우, 할인전 금액 정보, 폰트/ 데코레이션 정보, 및 볼드 스타일 정보 중 적어도 하나에 기초하여 상기 상품 가격 정보를 추출하는 단계; 및
    상기 특정 추출용 정보가 이미지 정보인 경우, 렌더링되는 위치 정보 및 이미지 크기에 기초하여 상기 이미지 정보를 추출하는 단계를 포함하는, 범용화된 정보 추출 방법.
  10. 제8항에 있어서,
    상기 특정 추출용 정보가 상기 추출용 웹문서 상에서 소정 조건에 부합하게 수집된 경우, 상기 추출용 웹문서 상에서 수집된 정보에 기초하여 상기 추출용 웹문서와 연관된 서비스 정보를 제공하는 단계를 더 포함하는, 범용화된 정보 추출 방법.
KR1020170040136A 2017-03-29 2017-03-29 범용화된 정보 추출 방법 및 이를 적용한 디바이스 KR101990502B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170040136A KR101990502B1 (ko) 2017-03-29 2017-03-29 범용화된 정보 추출 방법 및 이를 적용한 디바이스

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170040136A KR101990502B1 (ko) 2017-03-29 2017-03-29 범용화된 정보 추출 방법 및 이를 적용한 디바이스

Publications (2)

Publication Number Publication Date
KR20180110498A true KR20180110498A (ko) 2018-10-10
KR101990502B1 KR101990502B1 (ko) 2019-06-18

Family

ID=63876273

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170040136A KR101990502B1 (ko) 2017-03-29 2017-03-29 범용화된 정보 추출 방법 및 이를 적용한 디바이스

Country Status (1)

Country Link
KR (1) KR101990502B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180137256A (ko) * 2017-06-16 2018-12-27 국방과학연구소 Html 태그정보의 추론 및 학습을 통한 웹페이지 정보 추출 장치 및 그 방법
KR20190087949A (ko) 2018-01-17 2019-07-25 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. 정보를 생성하기 위한 방법 및 장치

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010047428A (ko) 1999-11-19 2001-06-15 박소영 인터넷 상점의 장바구니 기능 제공 시스템 및 기능 제공방법
KR20090008777A (ko) * 2007-07-19 2009-01-22 최진혁 온라인 쇼핑몰들의 위시리스트 모음 웹 서비스 시스템 및방법
KR20100041584A (ko) * 2008-10-14 2010-04-22 에스케이 텔레콤주식회사 웹 페이지 내의 컨텐츠를 추출하기 위한 방법, 장치 및 컴퓨터로 읽을 수 있는 기록매체

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010047428A (ko) 1999-11-19 2001-06-15 박소영 인터넷 상점의 장바구니 기능 제공 시스템 및 기능 제공방법
KR20090008777A (ko) * 2007-07-19 2009-01-22 최진혁 온라인 쇼핑몰들의 위시리스트 모음 웹 서비스 시스템 및방법
KR20100041584A (ko) * 2008-10-14 2010-04-22 에스케이 텔레콤주식회사 웹 페이지 내의 컨텐츠를 추출하기 위한 방법, 장치 및 컴퓨터로 읽을 수 있는 기록매체

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180137256A (ko) * 2017-06-16 2018-12-27 국방과학연구소 Html 태그정보의 추론 및 학습을 통한 웹페이지 정보 추출 장치 및 그 방법
KR20190087949A (ko) 2018-01-17 2019-07-25 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. 정보를 생성하기 위한 방법 및 장치

Also Published As

Publication number Publication date
KR101990502B1 (ko) 2019-06-18

Similar Documents

Publication Publication Date Title
US11977598B2 (en) Systems and methods for obtaining search results
US9646096B2 (en) System and methods for analyzing and improving online engagement
US9552433B2 (en) Generic content collection systems
US9659103B2 (en) Auto-aligning website elements by grouping elements based on a plurality of contextual indicators
US11172040B2 (en) Method and apparatus for pushing information
US9183515B2 (en) Share box for endorsements
US20150347578A1 (en) System and methods for auto-generating video from website elements
WO2013180121A1 (ja) 情報処理装置、情報処理方法、情報処理プログラム及び記録媒体
JP2009193465A (ja) 情報処理装置、情報提供システム、情報処理方法、およびプログラム
US20120066233A1 (en) System and methods for mapping user reviewed and rated websites to specific user activities
US20160299951A1 (en) Processing a search query and retrieving targeted records from a networked database system
JP6976207B2 (ja) 情報処理装置、情報処理方法、およびプログラム
US10146559B2 (en) In-application recommendation of deep states of native applications
TWI503768B (zh) Information processing devices, information processing methods and information processing products
JP2017054176A (ja) 決定装置、決定方法および決定プログラム
JP6698730B2 (ja) 抽出装置、抽出方法及び抽出プログラム
JP2018120337A (ja) 検索装置、検索方法及び検索プログラム
EP3111344A1 (en) Information interface generation and/or population
KR101990502B1 (ko) 범용화된 정보 추출 방법 및 이를 적용한 디바이스
KR20170060885A (ko) 사용자 단말에서 위시리스트를 관리할 수 있도록 하기 위한 장치 및 방법
US20140372220A1 (en) Social Media Integration for Offer Searching
KR20160130369A (ko) 온라인 상에 게재된 웹 문서 기반 상권 분석 서비스 시스템 및 방법
KR102238438B1 (ko) 규격화된 광고상품을 이용한 광고상품거래 서비스 제공 시스템
JP6311052B1 (ja) 抽出装置、抽出方法及び抽出プログラム
US20180165741A1 (en) Information providing device, information providing method, information providing program, and computer-readable storage medium storing the program

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant