KR20180100974A - 온라인 콘텐츠 검색 및 관리 시스템 - Google Patents

온라인 콘텐츠 검색 및 관리 시스템 Download PDF

Info

Publication number
KR20180100974A
KR20180100974A KR1020170027580A KR20170027580A KR20180100974A KR 20180100974 A KR20180100974 A KR 20180100974A KR 1020170027580 A KR1020170027580 A KR 1020170027580A KR 20170027580 A KR20170027580 A KR 20170027580A KR 20180100974 A KR20180100974 A KR 20180100974A
Authority
KR
South Korea
Prior art keywords
content
information
contents
search
content management
Prior art date
Application number
KR1020170027580A
Other languages
English (en)
Inventor
엄대용
황동준
Original Assignee
엄대용
황동준
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엄대용, 황동준 filed Critical 엄대용
Priority to KR1020170027580A priority Critical patent/KR20180100974A/ko
Publication of KR20180100974A publication Critical patent/KR20180100974A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • G06F17/30864
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • G06F17/3053
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Primary Health Care (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 사용자(User)로부터 키워드, 사이트, 시간대, 설정값 등과 같이 기 설정된 카테고리 별로 입력정보를 입력받으며, 입력된 입력정보에 따라 콘텐츠 제공서버들을 탐색하여 입력정보에 대응되는 콘텐츠들을 추출한 후 추출된 콘텐츠들에 대한 정보인 스크래핑 정보를 클라이언트 단말기에 디스플레이 하도록 구성됨으로써 단순히 키워드 기반으로만 검색서비스를 제공하는 것이 아니라 다양한 조건을 기반으로 검색서비스를 제공하여 검색의 정확성 및 정밀도를 획기적으로 높일 수 있고, 스크래핑 정보가 클라이언트 단말기에 전시될 뿐만 아니라 이미지파일로 변환되어 클라이언트 단말기에 저장됨으로써 별도의 어플리케이션이나 특정 프로그램을 설치하지 않아도 검색결과를 파일 형태로 자유롭게 활용할 수 있으며, 검색된 콘텐츠들에 대한 연관도를 산출하여 연관도가 기 설정된 제1 설정값(TH1) 이상일 때 해당 콘텐츠들의 대표콘텐츠를 결정하여 대표콘텐츠에 한해서만 스크래핑 정보를 생성하도록 구성됨으로써 유사한 내용의 콘텐츠들의 검색으로 인한 사용자의 불필요한 시간소모를 방지함과 동시에 검색의 효율성을 높일 수 있는 온라인 콘텐츠 검색 및 관리 시스템에 관한 것이다.

Description

온라인 콘텐츠 검색 및 관리 시스템{On-line contents researching and managing system}
본 발명은 온라인 콘텐츠 검색 및 관리 시스템에 관한 것으로서, 상세하게로는 사용자(User)로부터 입력된 정보에 대응되는 콘텐츠들을 검색하여 검색결과를 기 설정된 그래픽 사용자 인터페이스(GUI, Graphic Use Interface)로 생성하여 사용자 단말기에 디스플레이 및 저장되도록 하는 온라인 콘텐츠 검색 및 관리 시스템에 관한 것이다.
인터넷 인프라가 확장되고, 정보통신 산업이 기하급수적으로 발달함에 따라 온라인상에는 하루에도 수많은 각종 기사, SNS, 홍보자료, 정보제공자료 등의 다양한 콘텐츠들이 생성 및 공급되고 있으며, 이러한 콘텐츠를 제공하기 위한 콘텐츠 제공서버들의 수량 및 종류도 다양해지고 있다.
이에 따라 다양한 콘텐츠들로부터 자신이 원하는 콘텐츠를 검색하기 위한 검색서비스가 널리 사용되고 있다.
종래에는 유저가 특정 키워드에 대한 기사 콘텐츠를 검색하거나 또는 특정 사이트의 신규 등록(업데이트)된 콘텐츠를 검색하고자 하는 경우, 검색사이트 또는 콘텐츠 제공서버들 각각에 접속하여 신규 콘텐츠가 생성되었는지를 일일이 열람 및 확인하여야하기 때문에 검색이 번거롭고 복잡하며, 불필요한 시간이 과도하게 소모되는 단점을 갖는다.
예를 들어 유저가 전자상거래 사이트인 ‘A’ 사이트에 2만원 미만의 ‘B’ 제품의 매물이 등록되는지를 검색하고자할 경우, 유저는 주기적으로 ‘A’사이트에 접속하여 콘텐츠목록들을 일일이 확인하여야하기 때문에 검색작업이 번거로우며, 불필요한 시간을 소모하게 된다.
이러한 문제점을 해결하기 위하여, 유저로부터 입력된 키워드에 따라 자동으로 자료들을 검색 및 스크랩 하기 위한 데이터 검색시스템에 대한 다양한 연구가 진행되고 있다.
도 1은 국내공개특허 제10-2004-0064686호(발명의 명칭 : 데이터 검색 방법 및 인터넷을 이용한 정보 자료 스크랩 방법)에 개시된 시스템의 구성도이다.
도 1의 데이터 검색 방법 및 인터넷을 이용한 정보 자료 스크랩을 위한 시스템(이하 종래기술이라고 함)(100)은 사용자단말기(110)와, 데이터베이스 서버(160)들, 전기통신망(150)으로 이루어진다.
사용자단말기(110)는 인터넷을 통해 검색을 하고 검색된 자료를 저장매체에 저장시키는 기능을 포함한 엔진인 데이터 프로세싱 엔진 소프트웨어(112)와, 검색에 필요한 키워드를 입력받는 입력장치(130)와, 검색된 결과를 표시하는 출력장치(130)와, 검색된 데이터가 저장되는 저장장치(140)로 이루어진다.
데이터베이스 서버(160)들은 인터넷(150)을 통하여 연결된 신문사, 잡지사, 기타 각종의 정보를 제공하는 사이트 등의 서버이다.
이와 같이 구성되는 종래기술(100)은 사용자단말기(110)의 데이터 프로세싱 엔진 소프트웨어(112)가 데이터베이스 서버(160)들을 탐색하여 입력장치(130)를 통해 입력된 데이터에 대응되는 데이터들을 검색하고, 검색된 결과를 출력장치(120)를 통해 출력하도록 구성됨으로써 사용자는 자신이 원하는 정보를 일일이 검색하지 않아도 적합한 검색결과를 제공받을 수 있는 장점을 갖는다.
그러나 종래기술(100)은 만약 데이터베이스 서버(160)들에서 특정 키워드에 대한 유사한 내용의 데이터들을 제공한다고 가정할 때, 데이터 프로세싱 엔진 소프트웨어(112)에 의해 검색된 데이터들에는 중복되는 데이터들이 다수 존재하게 되고, 이에 따라 사용자는 중복되는 유사한 내용의 데이터들을 제공받기 때문에 데이터 열람 시 불필요한 시간소모가 증가함과 동시에 정보제공의 효율성이 떨어지는 단점을 갖는다. 특히 현재 이슈 되고 있는 사건일 경우, 유사한 내용의 기사들이 중복되게 다양한 매체에서 생성되기 때문에 이러한 시간소모는 더욱 커지게 되고, 정보전달 효율성은 더욱 저하되게 된다.
또한 종래기술(100)은 검색이 단순히 키워드 기반으로 이루어지기 때문에 사용자가 원하는 다양한 조건들에 대한 데이터를 검색하지 못하여 검색의 정확성 및 정밀도가 떨어지는 단점을 갖는다.
본 발명은 이러한 문제를 해결하기 위한 것으로, 본 발명의 해결과제는 사용자(User)로부터 키워드, 사이트주소, 패턴설정(HTML 소스 내 특정위치에 대한 패턴 정의), 시간대, 설정값 등과 같이 기 설정된 카테고리 별로 입력정보를 입력받으며, 입력된 입력정보에 따라 콘텐츠 제공서버들을 탐색하여 입력정보에 대응되는 콘텐츠들을 추출한 후 추출된 콘텐츠들에 대한 정보인 스크래핑 정보를 클라이언트 단말기에 디스플레이 하도록 구성됨으로써 단순히 키워드 기반으로만 검색서비스를 제공하는 것이 아니라 다양한 조건을 기반으로 검색서비스를 제공하여 검색의 정확성 및 정밀도를 획기적으로 높일 수 있는 온라인 콘텐츠 검색 및 관리 시스템을 제공하기 위한 것이다.
또한 본 발명의 다른 해결과제는 검색결과인 스크래핑 정보가 클라이언트 단말기에 전시될 뿐만 아니라 이미지파일로 변환되어 클라이언트 단말기에 저장됨으로써 별도의 어플리케이션이나 특정 프로그램을 설치하지 않아도 검색결과를 파일 형태로 자유롭게 활용할 수 있는 온라인 콘텐츠 검색 및 관리 시스템을 제공하기 위한 것이다.
또한 본 발명의 또 다른 해결과제는 검색된 콘텐츠들에 대한 연관도를 산출하여 연관도가 기 설정된 제1 설정값(TH1) 이상일 때 해당 콘텐츠들의 대표콘텐츠를 결정하여 대표콘텐츠에 한해서만 스크래핑 정보를 생성하도록 구성됨으로써 유사한 내용의 콘텐츠들의 검색으로 인한 사용자의 불필요한 시간소모를 방지함과 동시에 검색의 효율성을 높일 수 있는 온라인 콘텐츠 검색 및 관리 시스템을 제공하기 위한 것이다.
또한 본 발명의 또 다른 해결과제는 사용자로부터 입력정보를 입력받을 때, 콘텐츠 제공서버들 각각의 우선순위 정보를 함께 입력받아 대표콘텐츠 결정 시 입력정보의 우선순위에 따라 가장 높은 우선순위를 갖는 사이트의 콘텐츠를 대표콘텐츠로 결정함으로써 유사한 내용의 콘텐츠들이 검색될 때 사용자가 중요시하는 사이트의 콘텐츠를 대표콘텐츠로 제공할 수 있는 온라인 콘텐츠 검색 및 관리 시스템을 제공하기 위한 것이다.
상기 과제를 해결하기 위한 본 발명의 해결수단은 사용자(User)의 요청에 대응되는 콘텐츠들을 검색하여 검색결과를 사용자게에게 제공하기 위한 온라인 콘텐츠 검색 및 관리시스템에 있어서: 사용자로부터 키워드를 포함하는 검색 입력정보를 입력받으면 외부로 검색 입력정보를 포함하는 검색 요청데이터를 전송하는 응용 프로그램인 콘텐츠관리 어플리케이션이 설치되는 클라이언트 단말기; 콘텐츠를 생성하여 접속된 유저에게 제공하는 콘텐츠 제공서버들; 상기 콘텐츠관리 어플리케이션으로부터 검색 요청데이터를 전송받으면, 상기 콘텐츠 제공서버들에 접속하여 검색 입력정보의 키워드에 대응되는 콘텐츠를 추출하는 크롤링부와, 상기 크롤링부에 의해 추출된 콘텐츠들에 대한 정보인 스크래핑 정보를 생성하는 스크래핑 정보 생성부와, 상기 스크래핑 정보 생성부에 의해 생성된 스크래핑 정보를 해당 콘텐츠관리 어플리케이션으로 전송하는 제어부로 구성되는 콘텐츠 관리서버를 포함하고, 상기 콘텐츠관리 어플리케이션은 상기 콘텐츠 관리서버로부터 전송받은 스크래핑 정보를 상기 클라이언트 단말기에 전시하는 것이다.
또한 본 발명에서 상기 콘텐츠 관리서버는 동일콘텐츠 검출부과, 대표콘텐츠 검출부를 더 포함하고, 상기 동일콘텐츠 검출부는 상기 크롤링부에 의해 추출된 콘텐츠들의 텍스트를 검출한 후 기 설정된 연관도검출 알고리즘을 이용하여 검출된 콘텐츠들의 텍스트들 각각의 연관도를 산출하는 연관도 산출모듈; 상기 연관도 산출모듈에 의해 산출된 연관도들 각각을 기 설정된 제1 설정값(TH1, Threshold1)에 비교하며, 만약 연관도가 제1 설정값(TH1) 미만이면 해당 콘텐츠들을 개별콘텐츠로 판별하며, 만약 연관도가 제1 설정값(TH1) 이상이면 해당 콘텐츠들을 동일콘텐츠로 판별하는 제1 비교 및 판별모듈을 포함하고, 상기 대표콘텐츠 검출부는 상기 제1 비교 및 판별모듈에 의해 동일콘텐츠로 결정된 콘텐츠들 중 어느 하나를 대표콘텐츠로 결정하고, 상기 스크래핑 정보 생성부는 상기 동일콘텐츠 검출부에 의해 개별콘텐츠로 판별된 콘텐츠들과, 상기 대표콘텐츠 검출부에 의해 결정된 대표콘텐츠를 스크래핑 정보로 생성하는 것이 바람직하다.
또한 본 발명에서 상기 콘텐츠관리 어플리케이션은 사용자로부터 상기 검색 입력정보를 입력받을 때, 상기 콘텐츠 제공서버들 각각의 우선순위 정보를 입력받아 검색 입력정보에 우선순위 정보가 포함되도록 하고, 상기 대표콘텐츠 검출부는 검색 입력정보의 우선순위 정보를 활용하여, 상기 제1 비교 및 판별모듈에 의해 동일콘텐츠로 결정된 콘텐츠들을 제공한 콘텐츠 제공서버들을 우선순위에 따라 정렬한 후 우선순위가 가장 높은 콘텐츠 제공서버에서 제공된 콘텐츠를 동일콘텐츠로 판별된 콘텐츠들의 대표콘텐츠로 결정하는 것이 바람직하다.
또한 본 발명에서 상기 검색 입력정보는 상기 키워드, 시간대, 특정사이트 주소, 상기 우선순위 정보를 더 포함하는 것이 바람직하다.
또한 본 발명에서 상기 콘텐츠관리 어플리케이션은 사용자로부터 키워드, 특정사이트 주소, HTML 소스 내 특정위치에 대한 패턴 정의인 패턴설정, 특정 카테고리의 데이터범위인 설정값을 포함하는 알림 입력정보를 입력받으며, 상기 콘텐츠 관리서버로 알림 입력정보를 포함하는 알림 요청데이터를 전송하고, 상기 콘텐츠 관리서버는 알림정보 생성부를 더 포함하고, 상기 콘텐츠 관리서버는 상기 콘텐츠관리 어플리케이션으로부터 알림 요청데이터를 전송받으면, 상기 크롤링부가 알림 입력정보의 특정사이트에 접속하여 키워드, 시간대, 패턴설정 및 설정값에 대응되는 콘텐츠가 검색되는 경우 해당 콘텐츠를 추출하여 상기 알림정보 생성부로 입력하고, 상기 알림정보 생성부는 상기 크롤링부로부터 입력된 콘텐츠에 대한 정보인 알림정보를 생성하고, 상기 제어부는 상기 알림정보 생성부에 의해 생성된 알림정보를 해당 콘텐츠관리 어플리케이션으로 전송하고, 상기 콘텐츠관리 어플리케이션은 상기 콘텐츠 관리서버로부터 전송받은 알림정보를 상기 클라이언트 단말기에 전시하는 것이 바람직하다.
또한 본 발명에서 상기 콘텐츠관리 어플리케이션은 상기 콘텐츠 관리서버로부터 스크래핑 정보 또는 알림정보를 전송받으면, 전송받은 스크래핑 정보 또는 알림정보를 기 제작된 그래픽 사용자 인터페이스(GUI)로 제작하여 상기 클라이언트 단말기에 전시하는 것이 바람직하다.
또한 본 발명에서 상기 콘텐츠관리 어플리케이션은 제작된 그래픽 사용자 인터페이스(GUI)를 이미지파일로 변환하여 상기 클라이언트 단말기에 저장시키는 것이 바람직하다.
또한 본 발명에서 상기 콘텐츠관리 어플리케이션은 상기 콘텐츠 관리서버로부터 알림정보를 전송받으면 알림정보를 푸시(Push) 알림 방식으로 상기 클라이언트 단말기에 전시하는 것이 바람직하다.
상기 과제와 해결수단을 갖는 본 발명에 따르면 사용자(User)로부터 키워드, 사이트 주소, 시간대, 패턴설정(HTML 소스 내 특정위치에 대한 패턴 정의), 설정값 등과 같이 기 설정된 카테고리 별로 입력정보를 입력받으며, 입력된 입력정보에 따라 콘텐츠 제공서버들을 탐색하여 입력정보에 대응되는 콘텐츠들을 추출한 후 추출된 콘텐츠들에 대한 정보인 스크래핑 정보를 클라이언트 단말기에 디스플레이 하도록 구성됨으로써 단순히 키워드 기반으로만 검색서비스를 제공하는 것이 아니라 다양한 조건을 기반으로 검색서비스를 제공하여 검색의 정확성 및 정밀도를 획기적으로 높일 수 있게 된다.
또한 본 발명에 의하면 검색결과인 스크래핑 정보가 클라이언트 단말기에 전시될 뿐만 아니라 이미지파일로 변환되어 클라이언트 단말기에 저장됨으로써 별도의 어플리케이션이나 특정 프로그램을 설치하지 않아도 검색결과를 파일 형태로 자유롭게 활용할 수 있다.
또한 본 발명에 의하면 검색된 콘텐츠들에 대한 연관도를 산출하여 연관도가 기 설정된 제1 설정값(TH1) 이상일 때 해당 콘텐츠들의 대표콘텐츠를 결정하여 대표콘텐츠에 한해서만 스크래핑 정보를 생성하도록 구성됨으로써 유사한 내용의 콘텐츠들의 검색으로 인한 사용자의 불필요한 시간소모를 방지함과 동시에 검색의 효율성을 높일 수 있다.
또한 본 발명에 의하면 사용자로부터 입력정보를 입력받을 때, 콘텐츠 제공서버들 각각의 우선순위 정보를 함께 입력받아 대표콘텐츠 결정 시 입력정보의 우선순위에 따라 가장 높은 우선순위를 갖는 사이트의 콘텐츠를 대표콘텐츠로 결정함으로써 유사한 내용의 콘텐츠들이 검색될 때 사용자가 중요시하는 사이트의 콘텐츠를 대표콘텐츠로 제공할 수 있게 된다.
도 1은 국내공개특허 제10-2004-0064686호(발명의 명칭 : 데이터 검색 방법 및 인터넷을 이용한 정보 자료 스크랩 방법)에 개시된 시스템의 구성도이다.
도 2는 본 발명의 일실시예인 온라인 콘텐츠 검색 및 관리 시스템을 나타내는 구성도이다.
도 3은 도 2의 클라이언트 단말기를 나타내는 블록도이다.
도 4는 도 2의 콘텐츠 관리서버를 나타내는 블록도이다.
도 5는 도 4의 동일콘텐츠 검출부를 나타내는 블록도이다.
도 6은 도 2의 콘텐츠관리 어플리케이션을 나타내는 블록도이다.
도 7은 도 6의 인터페이스 처리모듈에 의해 제공되는 인터페이스를 나타내는 블록도이다.
도 8은 도 7의 검색정보 인터페이스를 나타내는 예시도이다.
도 9는 도 7의 알림정보 인터페이스를 나타내는 예시도이다.
이하, 첨부된 도면을 참조하여 본 발명의 일실시예를 설명한다.
도 2는 본 발명의 일실시예인 온라인 콘텐츠 검색 및 관리 시스템을 나타내는 구성도이다.
본 발명의 일실시예인 온라인 콘텐츠 검색 및 관리 시스템(1)은 콘텐츠 제공서버(9-1), ..., (9-N)들 또는 이들 중 사용자(User)에 의해 선택된 특정사이트들에 접속하여 이들로부터 제공되는 콘텐츠들 중 사용자(User)로부터 입력된 정보(이하 입력정보라고 함)에 대응되는 콘텐츠들을 검색 및 스크래핑(Scrapping) 하여 사용자에게 제공하기 위한 시스템이다.
또한 온라인 콘텐츠 검색 및 관리 시스템(1)은 클라이언트 단말기(4)와, 콘텐츠들을 생성 및 제공하는 콘텐츠 제공서버(9-1), ..., (9-N)들과, 클라이언트 단말기(4)에 설치되어 콘텐츠 제공서버(9-1), ..., (9-N)들에 접속하여 유저로부터 입력된 입력정보에 따라 후술되는 콘텐츠 관리서버(3)로 검색을 요청하며 콘텐츠 관리서버(3)로부터 전송받은 검색결과는 클라이언트 단말기(4)에 전시하는 콘텐츠관리 어플리케이션(5)과, 콘텐츠관리 어플리케이션(5)을 관리 및 제어하며 콘텐츠관리 어플리케이션(5)의 요청에 따라 동작을 수행하여 검색결과를 콘텐츠관리 어플리케이션(5)으로 제공하는 콘텐츠 관리서버(3)와, 콘텐츠 관리서버(3), 클라이언트 단말기(4) 및 콘텐츠 제공서버(9-1), ..., (9-N)들 사이의 데이터 이동경로를 제공하는 통신망(10)으로 이루어진다.
이때 본 발명에서는 설명의 편의를 위해 클라이언트 단말기(4)가 한 개인 것으로 예를 들어 설명하였으나, 클라이언트 단말기는 복수개로 구성될 수 있음은 당연하다.
또한 본 발명에서는 설명의 편의를 위해 콘텐츠 관리서버(3)가 클라이언트 단말기(4)의 요청에 따라 콘텐츠 제공서버(9-1), ..., (9-N)들에 접속하여 콘텐츠를 검색하는 것으로 예를 들어 설명하였으나, 온라인 콘텐츠 검색 및 관리 시스템(1)은 별도의 콘텐츠 관리서버(3)를 구비하지 않고, 콘텐츠관리 어플리케이션(5)이 자체적으로 콘텐츠 검색 서비스를 수행 및 제공하는 것으로 구성될 수 있음은 당연하다.
또한 도면에서는 특정 유저가 한 개의 클라이언트 단말기(4)를 사용하는 것으로 예를 들어 설명하였으나, 특정 유저는 복수개의 단말기들을 구비할 수 있으며, 콘텐츠 관리서버(3)는 유저를 식별할 수 있는 아이디(ID)를 기준으로 동일 아이디로 등록된 단말기들로 검색결과 및 알림정보를 전송할 수 있고, 이러한 시스템은 온라인 어플리케이션에 있어서 통상적으로 사용되는 기술이기 때문에 상세한 설명은 생략하기로 한다.
통신망(10)은 콘텐츠 관리서버(3), 클라이언트 단말기(4) 및 콘텐츠 제공서버(9-1), ..., (9-N)들 사이의 데이터 이동경로를 제공하기 위한 망이며, 상세하게로는 광역통신망(WAN), 이동통신망, 유선통신망, 와이파이(Wi-fi), LTE 등으로 구성될 수 있다.
도 3은 도 2의 클라이언트 단말기를 나타내는 블록도이다.
클라이언트 단말기(4)는 통신망(10)과의 접속을 지원하는 사용자(User)가 소지한 디지털 단말기이며, 상세하게로는 데스크탑 PC, 스마트폰(Smart-phone), 태블릿 PC, 노트북 등으로 구성될 수 있으며, 본 발명에서는 설명의 편의를 위해 스마트폰으로 구성되는 것으로 예를 들어 설명하기로 한다.
또한 클라이언트 단말기(4)는 도 3에 도시된 바와 같이, 통상의 스마트폰에 구비되어 콘텐츠가 전시되는 모니터(41)와, 통신망(10)에 접속하여 콘텐츠 관리서버(3) 또는 콘텐츠 제공서버(9-1), ..., (9-N)들과의 데이터통신을 지원하는 통신 인터페이스부(43)와, 사용자로부터 문자 및 기호를 입력받는 입력부(45)와, 클라이언트 단말기의 O.S를 담당하며 제어대상을 제어하는 제어부(47)와, 본 발명의 목적을 달성하기 위한 후술되는 도 6의 콘텐츠관리 어플리케이션(5)을 관리 및 제어하는 어플리케이션 관리부(49)로 이루어진다.
도 2의 콘텐츠 제공서버(9-1), ..., (9-N)들은 신문사, 언론사, 각종 관공서, 전자상거래 사이트, 포털사이트 등과 같이 다양한 콘텐츠를 웹페이지(Web-page), 그래픽 사용자 인터페이스(GUI) 등으로 제작하여 접속된 유저에게 제공하는 콘텐츠 제공사의 데이터베이스 서버이다.
콘텐츠관리 어플리케이션(5)은 클라이언트 단말기(4)에 설치되어 콘텐츠 검색 및 알림 서비스를 제공하는 응용 프로그램이다.
또한 콘텐츠관리 어플리케이션(5)은 사용자의 선택에 따라 검색모드 또는 알림모드로 운용된다.
또한 콘텐츠관리 어플리케이션(5)은 검색모드 시, 사용자로부터 카테고리 별로 사용자로부터 정보(이하 검색 입력정보라고 함)를 입력받으며, 입력된 입력정보를 포함하는 검색 요청데이터를 콘텐츠 관리서버(3)로 전송한다.
이때 카테고리는 키워드, 시간대, 특정사이트 주소, 사이트별 우선순위를 포함하고, ‘키워드’는 검색하고자 하는 콘텐츠에 대한 핵심적인 단어나 문구이고, ‘시간대’는 검색하고자 하는 콘텐츠가 제공된 시간범위이고, ‘특정사이트 주소’는 검색하고자 하는 콘텐츠를 제공한 사이트들의 주소이고, ‘사이트별 우선순위’는 동일한 내용의 콘텐츠가 다수의 사이트들에서 검색될 때 사용자에게 제공될 사이트의 순서를 나타낸다.
또한 콘텐츠 관리서버(3)는 콘텐츠 관리 어플리케이션(5)으로부터 검색 입력정보를 포함하는 검색 요청데이터를 전송받으면, 기 설정된 주기에 따라 콘텐츠 제공서버(9-1), ..., (9-N)들 또는 입력된 특정사이트들에 접속하며, 입력된 키워드 및 시간대에 맞는 콘텐츠들을 검색한 후 추출한다.
또한 콘텐츠 관리서버(3)는 기 설정된 연관도 검출 알고리즘을 이용하여 추출된 각 콘텐츠 사이의 연관도를 검출하며, 만약 연관도가 기 설정된 제1 설정값(TH1:Threshold1) 이상일 때 해당 콘텐츠들을 동일한 내용의 콘텐츠(이하 동일콘텐츠라고 함)라고 판단한다.
또한 콘텐츠 관리서버(3)는 동일콘텐츠들이 검색되면, 사용자로부터 입력된 입력정보의 사이트별 우선순위에 따라 검색된 동일콘텐츠들 중 우선순위가 가장 높은 사이트에서 제공되는 콘텐츠 하나만을 사용자에게 제공할 것으로 결정함으로써 동일콘텐츠들에 대한 반복적인 스크래핑 및 제공으로 인한 동일콘텐츠에 대한 열람자의 반복적인 열람을 효율적으로 방지할 수 있게 된다.
또한 콘텐츠 관리서버(3)는 추출된 콘텐츠들에 대한 정보인 스크래핑 정보를 해당 콘텐츠 관리 어플리케이션(5)으로 전송하고, 콘텐츠 관리 어플리케이션(5)은 콘텐츠 관리서버(3)로부터 스크래핑 정보를 전송받으면, 전송받은 스크래핑 정보를 기 설정된 그래픽 사용자 인터페이스(GUI)로 변환하여 클라이언트 단말기(4)에 전시함과 동시에 변환된 그래픽 사용자 인터페이스를 이미지 파일로 변환하여 클라이언트 단말기(4)에 저장한다.
예를 들어 콘텐츠 제공서버(9)가 ‘A 사이트’, ‘B 사이트’, ‘C 사이트’, ‘D 사이트’이고, ‘A 사이트’, ‘B 사이트’, ‘C 사이트’, ‘D 사이트’에서 모두 유사한 내용의 콘텐츠가 제공되었다고 가정할 때, 콘텐츠관리 어플리케이션(5)은 사용자로부터 ‘A 사이트’, ‘B 사이트’, ‘C 사이트’, ‘D 사이트’에 대한 우선순위를 입력받게 되고, 이에 따라 콘텐츠관리 어플리케이션(5)은 사용자로부터 검색모드를 선택받으면 콘텐츠 관리서버(3)로 검색 입력정보를 포함하는 검색 요청데이터를 전송하고, 콘텐츠 관리서버(3)는 ‘A 사이트’, ‘B 사이트’, ‘C 사이트’, ‘D 사이트’에 접속하여 검색 입력정보에 대응되는 콘텐츠들을 검색 및 추출하되, 추출된 콘텐츠들의 연관도가 제1 설정값(TH1) 이상인 콘텐츠들을 동일콘텐츠라고 판단한 후 이들 중 우선순위가 가장 높은 사이트의 콘텐츠와, 연관도가 제1 설정값(TH1) 미만인 콘텐츠들을 스크래핑 한 스크래핑 정보를 생성하여 콘텐츠관리 어플리케이션(5)으로 전송하고, 콘텐츠관리 어플리케이션(5)을 콘텐츠 관리서버(3)로부터 전송받은 스크래핑 정보들을 그래픽 사용자 인터페이스로 생성하여 이를 클라이언트 단말기(4)에 저장함과 동시에 그래픽 사용자 인터페이스를 이미지 파일로 변환하여 클라이언트 단말기(4)에 저장한다.
이때 콘텐츠 관리서버(3)는 콘텐츠관리 어플리케이션(5)으로부터 전송받은 검색 입력정보와, 검색 입력정보에 따른 검색을 통해 생성된 스크래핑 정보들을 저장하며, 기 설정된 주기 동안 저장된 검색 입력정보 및 스크래핑 정보들을 활용하여 통계분석 및 빅데이터 분석 등과 같은 2차 서비스를 수행할 수 있게 된다.
또한 콘텐츠 관리 어플리케이션(5)은 사용자(User)의 선택에 따라 알림모드로 운영되고, 알림모드 운영 시 사용자로부터 카테고리별로 정보를 입력받는다.
이때 입력된 정보를 알림 입력정보라고 하고, 카테고리는 키워드, 특정사이트 주소, 설정값, 패턴설정(HTML 소스 내 특정위치에 대한 패턴 정의) 등을 포함한다.
이때 ‘설정값’은 사용자에게 알림 서비스를 제공하기 위한 특정카테고리의 데이터 범위를 나타내며, 상세하게로는 ‘가격범위’, ‘날짜범위’, ‘시간대 범위’ 등으로 이루어질 수 있다.
또한 콘텐츠관리 어플리케이션(5)은 알림모드 구동 시 알림 입력정보를 포함하는 알림 요청데이터를 콘텐츠 관리서버(3)로 전송하고, 콘텐츠 관리서버(3)는 전송받은 알림 입력정보의 특정사이트로 주기적으로 접속하여 신규 등록된 콘텐츠들 중 입력정보의 키워드, 패턴설정 및 설정값에 대응되는 콘텐츠를 검색하며, 만약 콘텐츠가 검색되는 경우, 해당 사이트주소, 게시판종류, 게시판식별번호 등을 포함하는 알림정보를 생성한 후 이를 콘텐츠관리 어플리케이션(5)으로 전송한다.
또한 콘텐츠관리 어플리케이션(5)은 콘텐츠 관리서버(3)로부터 알림정보를 전송받으면, 전송받은 알림정보를 푸시(Push) 등의 방식으로 클라이언트 단말기(4)의 모니터에 노출시킨다.
예를 들어 콘텐츠 관리 어플리케이션(5)은 사용자로부터 전자상거래 서비스를 제공하는 ‘E 사이트’의 주소와, ‘노트북’의 키워드와, ‘10~ 80만원’의 설정값을 입력받는다고 가정할 때, 알림모드 구동 시 콘텐츠 관리서버(3)로 알림정보를 포함하는 알림 요청데이터를 전송하고, 콘텐츠 관리서버(3)는 알림 요청데이터를 전송받으면, 전송받은 입력정보에 따라 주기적으로 ‘E 사이트’에 접속하여 신규 등록된 콘텐츠들 중 10 ~ 80만원 사이의 ‘노트북’에 관련된 콘텐츠가 있는지를 검색하며, 만약 10 ~ 80만원 사이의 ‘노트북’의 신규 등록된 콘텐츠가 검색되는 경우, 해당 사이트주소, 게시판종류, 게시판식별번호 등을 포함하는 알림정보를 생성한 후 이를 콘텐츠관리 어플리케이션(5)으로 전송하고, 콘텐츠관리 어플리케이션(5)은 콘텐츠 관리서버(3)로 전송받은 알림정보를 클라이언트 단말기(4)에 전시한다.
콘텐츠 관리서버(3)는 콘텐츠관리 어플리케이션(5)의 백업, 업데이트 등과 같이 콘텐츠관리 어플리케이션(5)을 관리 및 제어한다.
또한 콘텐츠 관리서버(3)는 전술하였던 바와 같이, 콘텐츠관리 어플리케이션(5)으로부터 입력정보를 포함하는 검색 요청데이터 또는 알림 요청데이터를 전송받으며, 전송받은 입력정보에 따라 검색 및 알림서비스를 제공한다.
도 4는 도 2의 콘텐츠 관리서버를 나타내는 블록도이다.
콘텐츠 관리서버(3)는 도 4에 도시된 바와 같이, 제어부(31)와, 데이터베이스부(32), 통신 인터페이스부(33), 크롤링부(34), 어플리케이션 관리부(35), 동일콘텐츠 검출부(36), 대표콘텐츠 검출부(37), 스크래핑 정보 생성부(38), 알림정보 생성부(39), 기타서비스 관리부(40)로 이루어진다.
제어부(31)는 콘텐츠 관리서버(3)의 O.S(Operating System)이며, 제어대상(32), (33), (34), (35), (36), (37), (38), (39), (40)들을 관리 및 제어한다.
또한 제어부(31)는 통신 인터페이스부(33)를 통해 콘텐츠관리 어플리케이션(5)으로부터 검색 입력정보를 포함하는 검색 요청데이터 또는 알림 입력정보를 포함하는 알림 요청데이터를 전송받으면, 크롤링부(34)로 검색 입력정보 또는 알림 입력정보를 입력하여 크롤링부(34)를 구동시킨다.
또한 제어부(31)는 검색 요청데이터에 따라 크롤링부(34)에 의해 콘텐츠가 검색되면, 동일콘텐츠 검출부(36)를 구동시키고, 알림 요청데이터에 따라 크롤링부(34)에 의해 콘텐츠가 검색되면, 알림정보 생성부(39)를 구동시킨다.
데이터베이스부(32)에는 회원정보, 인적정보 등이 저장된다.
또한 데이터베이스부(32)에는 기 설정된 콘텐츠 제공서버(9-1), ..., (9-N)들 각각의 통신식별정보들이 저장된다.
또한 데이터베이스부(32)에는 콘텐츠관리 어플리케이션(5)의 백업정보, 펌웨어 등이 저장된다.
또한 데이터베이스부(32)에는 콘텐츠관리 어플리케이션(5)으로부터 전송받은 검색 입력정보들 또는 알림 입력정보들과, 스크래핑 정보 생성부(38)에 의해 생성된 스크래핑 정보들과, 알림정보 생성부(39)에 의해 생성된 알림정보들이 저장된다.
통신 인터페이스부(33)는 클라이언트 단말기(4) 및 콘텐츠 제공서버(9-1), ..., (9-N)들과 데이터를 송수신한다.
어플리케이션 관리부(35)는 콘텐츠관리 어플리케이션(5)을 관리한다.
크롤링부(34)는 통신 인터페이스부(33)를 통해 클라이언트 단말기(4)로부터 검색 입력정보를 포함하는 검색 요청데이터를 전송받으면, 콘텐츠 제공서버(9-1), ..., (9-N)들 또는 검색 입력정보에 포함된 특정사이트에 등록된 콘텐츠들을 탐색하여 입력정보의 키워드 및 시간대에 맞는 콘텐츠들을 추출한다.
이때 크롤링부(34)는 공지된 다양한 기술 및 방식을 통해 콘텐츠 제공서버(9-1), ..., (9-N)들의 사이트들로부터 콘텐츠를 검색 및 추출할 수 있고, 상세하게로는 크롤링부(34)는 콘텐츠 제공서버(9-1), ..., (9-N)들의 사이트들로부터 인덱스 하이퍼텍스트 마크-업 언어(HTML, Hypertext Mark up Language) 파일을 읽어들여 능동적으로 목적파일을 검색하고 분석하도록 구성될 수 있다.
또한 크롤링부(34)는 추출된 콘텐츠들을 동일콘텐츠 검출부(36)로 입력한다.
또한 크롤링부(34)는 통신 인터페이스부(33)를 통해 클라이언트 단말기(4)로부터 알림 입력정보를 포함하는 알림 요청데이터를 전송받으면, 알림 입력정보의 특정사이트에 접속하여 신규 등록된 콘텐츠들 중 알림 입력정보의 키워드 및 설정값에 대응되는 콘텐츠를 추출한다.
또한 크롤링부(34)는 만약 입력정보의 키워드, 시간대 및 설정값에 대응되는 특정사이트의 신규 등록 콘텐츠가 추출되는 경우, 추출된 신규 등록 콘텐츠를 알림정보 생성부(39)로 입력한다.
도 5는 도 4의 동일콘텐츠 검출부를 나타내는 블록도이다.
동일콘텐츠 검출부(36)는 도 5에 도시된 바와 같이, 연관도 산출모듈(361)과, 제1 비교 및 판단모듈(363), 동일콘텐츠 수량 산출모듈(365), 제2 비교 및 판단모듈(367)로 이루어진다.
이때 동일콘텐츠 검출부(36)는 콘텐츠 관리서버(3)가 콘텐츠관리 어플리케이션(5)으로부터 검색 요청데이터를 전송받아 크롤링부(34)가 구동되는 경우 진행되며, 크롤링부(34)에 의해 추출된 콘텐츠들을 입력받는다.
연관도 산출모듈(361)은 크롤링부(34)로부터 입력된 콘텐츠들 각각의 텍스트를 검출하며, 기 설정된 연관도 검출 알고리즘을 이용하여 검출된 텍스트들 각각의 연관도 값들을 산출한다.
예를 들어 콘텐츠‘A’, ‘B’, ‘C’가 입력될 때 연관도 산출모듈(361)은 콘텐츠 ‘A’, ‘B’, ‘C’의 텍스트’a’, ‘b’, ‘c’들을 검출한 후 기 설정된 연관도 검출 알고리즘을 이용하여 ‘a’, ‘b’의 연관도와, ‘a’, ‘c;의 연관도, ’b’, ‘c’의 연관도를 산출한다.
또한 연관도 산출모듈(361)에 의해 산출된 연관도 값들은 제1 비교 및 판단모듈(363)로 입력된다.
제1 비교 및 판단모듈(363)은 연관도 산출모듈(361)에 의해 산출된 연관도 값들 각각을 기 설정된 제1 설정값(TH1:Threshold1)에 비교한다. 이때 제1 설정값(TH1)은 두 개의 콘텐츠들의 내용들이 동일한 내용이라고 판단할 수 있는 연관도의 최소값으로 정의된다.
또한 제1 비교 및 판단모듈(363)은 만약 연관도가 제1 설정값(TH1) 미만인 경우, 해당 2개의 콘텐츠들이 서로 다른 내용의 콘텐츠인 ‘개별콘텐츠’라고 판단하며, 만약 연관도가 제1 설정값(TH1) 이상인 경우, 해당 2개의 콘텐츠들이 동일한 내용의 콘텐츠인 ‘동일콘텐츠’라고 판단한다.
이때 본 발명에서는 설명의 편의를 위해 제1 비교 및 판단모듈(363)이 콘텐츠들의 텍스트들 각각의 연관도 비교를 통해 동일콘텐츠를 결정하는 것으로 예를 들어 설명하였으나, 동일콘텐츠를 결정하는 방법 및 기술은 공지된 다양한 알고리즘이 적용될 수 있다.
또한 제1 비교 및 판단모듈(363)은 동일콘텐츠로 결정된 콘텐츠들 중 어느 하나와 연관도가 제1 설정값(TH1) 이상인 콘텐츠가 검출되나, 해당 콘텐츠가 동일콘텐츠들 중 다른 하나와 연관도가 제1 설정값(TH1) 미만이더라도 해당 콘텐츠를 동일콘텐츠로 결정한다.
예를 들어 콘텐츠 ‘A‘, ‘B‘, ‘C‘, ‘D‘, ‘E‘, ‘F‘ 중에서 ‘A‘, ‘B‘, ‘C‘가 동일콘텐츠로 검출되었고, ‘E‘, ‘F‘는 동일콘텐츠가 아니라고 검출되었을 때, 만약 ‘D‘가 ‘B‘, ‘C‘와는 연관도가 제1 설정값(TH1) 미만이나, ‘A‘와 연관도가 제1 설정값(TH1) 이상인 경우, 제1 비교 및 판단모듈(363)은 ‘A‘, ‘B‘, ‘C‘, ‘D‘를 동일콘텐츠로 결정한다.
이때 제어부(31)는 제1 비교 및 판단모듈(363)에 의해 동일콘텐츠가 검출되는 경우, 검출된 동일콘텐츠 정보를 동일콘텐츠 수량 검출모듈(365)로 입력시키고, 제1 비교 및 판단모듈(363)에 의해 검출된 개별콘텐츠들은 스크래핑 정보 생성부(38)로 입력시킨다.
동일콘텐츠 수량 검출모듈(365)은 제1 비교 및 판단모듈(363)에 의해 동일콘텐츠로 결정된 콘텐츠들의 수량(N)을 검출한다.
제2 비교 및 판단모듈(367)은 동일콘텐츠 수량 검출모듈(365)에 의해 검출된 동일콘텐츠 수량(N)을 기 설정된 제2 설정값(TH2)에 비교한다. 이때 제2 설정값(TH2)은 대표콘텐츠를 결정하기 위한 동일콘텐츠 수량(N)의 최소값으로 정의된다.
또한 제2 비교 및 판단모듈(367)은 만약 동일콘텐츠 수량(N)이 제2 설정값(TH2) 미만이면, 동일콘텐츠들을 개별콘텐츠들이라고 판단하며, 개벌콘텐츠로 판단된 동일콘텐츠들을 스크래핑 정보 생성부(38)로 입력한다.
또한 제2 비교 및 판단모듈(367)은 만약 동일콘텐츠 수량(N)이 제2 설정값(TH2) 이상이면, 대표콘텐츠 검출부(37)로 동일콘텐츠들을 입력한다.
도 4의 대표콘텐츠 검출부(37)는 동일콘텐츠 검출부(36)의 제2 비교 및 판단모듈(367)에 의해 동일콘텐츠 수량(N)이 제2 설정값(TH2) 이상일 때 구동되며, 입력된 동일콘텐츠들 중 대표콘텐츠를 결정하여 결정된 대표콘텐츠에 한해서만 스크래핑 정보가 생성되도록 한다.
또한 대표콘텐츠 검출부(37)는 제2 설정값(TH2) 이상의 수량을 갖는 동일콘텐츠들이 입력되면, 사용자(User)로부터 입력된 입력정보의 사이트별 우선순위를 활용하여 입력된 동일콘텐츠들 각각의 우선순위를 부여한다.
또한 대표콘텐츠 검출부(37)는 우선순위가 부여된 동일콘텐츠들 중 우선순위가 가장 높은 콘텐츠를 대표콘텐츠로 결정한다.
또한 대표콘텐츠 검출부(37)에 의해 결정된 대표콘텐츠는 스크래핑 정보 생성부(38)로 입력된다.
스크래핑 정보 생성부(38)는 1)동일콘텐츠 검출부(36)의 제1 비교 및 판단모듈(363)에 의해 결정된 개별콘텐츠들과, 2)동일콘텐츠 검출부(36)의 제2 비교 및 판단모듈(367)에 의해 검출된 개별콘텐츠들과, 3)대표콘텐츠 검출부(37)에 의해 결정된 대표콘텐츠를 활용하여 스크래핑 정보를 생성한다. 이때 스크래핑 정보는 사이트주소, 게시판종류 및 번호, 콘텐츠내용, 등록시간 등을 포함한다.
또한 제어부(31)는 스크래핑 정보 생성부(38)에 의해 스크래핑 정보가 생성되면, 생성된 스크래핑 정보를 데이터베이스부(32)에 저장함과 동시에 통신 인터페이스부(33)를 제어하여 생성된 스크래핑 정보가 클라이언트 단말기(4)로 전송되도록 한다.
알림정보 생성부(39)는 크롤링부(34)로부터 신규 등록 콘텐츠를 입력받는다. 다시 말하면, 콘텐츠 관리서버(3)는 클라이언트 단말기(4)로부터 입력정보를 포함하는 알림 요청데이터를 전송받으면, 크롤링부(34)가 입력정보의 특정사이트에 접속하여 신규 등록된 콘텐츠들 중 입력정보의 키워드, 시간대 및 설정값에 대응되는 콘텐츠가 존재하는지를 검출하며, 신규 등록 콘텐츠가 검출되는 경우 이를 알림정보 생성부(39)로 입력한다.
또한 알림정보 생성부(39)는 크롤링부(34)로부터 신규 등록 콘텐츠를 입력받으면, 입력된 콘텐츠의 사이트주소, 게시판 종류 및 번호, 등록시간, 설정데이터를 포함하는 알림정보를 생성한다.
이때 제어부(31)는 알림정보 생성부(39)에 의해 알림정보가 생성되면, 생성된 알림정보를 데이터베이스부(32)에 저장함과 동시에 알림정보가 클라이언트 단말기(4)로 전송되도록 통신 인터페이스부(33)를 제어한다.
기타서비스 관리부(40)는 데이터베이스부(32)에 저장된 입력정보들과, 스크래핑 정보들, 알림정보들을 활용하여 통계데이터를 생성하거나 또는 빅데이터 분석 등과 같은 2차서비스를 수행하기 위한 동작을 수행한다.
이때 통계데이터 생성 및 빅데이터 분석은 데이터분석 시스템에 있어서 통상적으로 사용되는 기술이기 때문에 상세한 설명은 생략하기로 한다.
도 6은 도 2의 콘텐츠관리 어플리케이션을 나타내는 블록도이다.
도 6의 콘텐츠관리 어플리케이션(5)은 클라이언트 단말기(4)에 설치되어 콘텐츠 관리서버(3)와 연계하여 콘텐츠관리 서비스를 제공하는 응용 프로그램이다.
또한 콘텐츠관리 어플리케이션(5)은 도 6에 도시된 바와 같이, 제어모듈(50)과, 저장모듈(51), 데이터 입출력모듈(52), 인터페이스 처리모듈(53), 검색 요청모듈(54), 알림 요청모듈(55), 알림모듈(56)로 이루어진다.
제어모듈(50)은 제어대상(51), (52), (53), (54), (55), (56)들을 관리 및 제어한다.
저장모듈(51)은 콘텐츠 관리서버(3)로부터 검색 결과인 스크래핑 정보가 전시되는 후술되는 도 8의 검색정보 인터페이스(534)를 JPG, TIFF 등의 이미지파일로 변환한 후 변환된 이미지파일을 클라이언트 단말기(4)의 메모리에 저장시킴으로써 사용자는 별도의 어플리케이션이나 특정 프로그램을 설치하지 않아도 검색결과를 파일 형태로 자유롭게 활용 및 열람할 수 있게 된다.
데이터 입출력모듈(52)은 클라이언트 단말기와 데이터를 입출력한다.
도 7은 도 6의 인터페이스 처리모듈에 의해 제공되는 인터페이스를 나타내는 블록도이고, 예시도이고, 도 8은 도 7의 검색정보 인터페이스를 나타내는 예시도이고, 도 9는 도 7의 알림정보 인터페이스를 나타내는 예시도이다.
인터페이스 처리모듈(53)은 기 제작된 그래픽 사용자 인터페이스(GUI)들을 관리 및 제어하며, 사용자의 요청 및 연산처리에 따른 결과데이터를 적합한 그래픽 사용자 인터페이스(GUI)를 통해 클라이언트 단말기(4)에 디스플레이 한다.
또한 인터페이스 처리모듈(53)은 도 7에 도시된 바와 같이, 최초 접속 시 제공되되, 사용자로부터 검색모드 및 알림모드 중 어느 하나를 선택받기 위한 아이콘(버튼)들이 노출되는 선택 인터페이스(531)와, 선택 인터페이스(531)를 통해 사용자로부터 검색모드가 선택될 때 제공되며 사용자로부터 검색 입력정보를 입력받기 위한 제1 입력 인터페이스(532)와, 선택 인터페이스(531)를 통해 사용자로부터 알림모드가 선택될 때 제공되며 사용자로부터 알림 입력정보를 입력받기 위한 제2 입력 인터페이스(533)와, 제1 입력 인터페이스(532)에 의해 입력된 입력정보에 대응되는 스크래핑 정보를 콘텐츠 관리서버(3)로부터 전송받으면 이를 전시하는 검색정보 인터페이스(534)와, 제2 입력 인터페이스(533)에 의해 입력된 입력정보에 대응되는 알림정보를 콘텐츠 관리서버(3)로부터 전송받으면 이를 전시하는 알림정보 인터페이스(535)를 사용자에게 제공한다.
선택 인터페이스(531)는 사용자가 최초 접속할 때 제공되는 그래픽 사용자 인터페이스이다.
또한 선택 인터페이스(531)에는 도면에는 도시되지 않았지만, 사용자로부터 검색모드를 요청받기 위한 제1 버튼(아이콘)과, 사용자로부터 알림모드를 요청받기 위한 제2 버튼(아이콘)이 노출된다.
이때 인터페이스 처리모듈(53)은 선택 인터페이스(531)를 통해 사용자로부터 만약 제1 버튼(또는 아이콘)이 클릭되면 제1 입력 인터페이스(532)를 사용자에게 제공하며, 만약 제2 버튼(또는 아이콘)이 클릭되면 제2 입력 인터페이스(533)를 사용자에게 제공한다.
제1 입력 인터페이스(532)는 선택 인터페이스(531)를 통해 사용자가 검색모드를 선택할 때 제공되는 그래픽 사용자 인터페이스이다.
또한 제1 입력 인터페이스(532)에는 사용자로부터 검색 입력정보를 입력받기 위한 입력란들이 노출된다. 이때 검색 입력정보는 적어도 하나 이상의 키워드, 시간대, 특정사이트 주소, 사이트별 우선순위 정보를 포함한다.
또한 제1 입력 인터페이스(532)를 통해 검색 입력정보가 입력되면, 제어모듈(50)의 제어에 따라 검색 요청모듈(54)이 구동되어 검색 요청모듈(54)에 의해 검색 입력정보를 포함하는 검색 요청데이터가 콘텐츠 관리서버(3)로 전송되게 된다.
제2 입력 인터페이스(533)는 선택 인터페이스(531)를 통해 사용자가 알림모드를 선택할 때 제공되는 그래픽 사용자 인터페이스이다.
또한 제2 입력 인터페이스(533)에는 사용자로부터 알림 입력정보를 입력받기 위한 입력란들이 노출된다. 이때 알림 입력정보는 적어도 하나 이상의 키워드, 적어도 하나 이상의 특정사이트 주소, 패턴설정, 설정값 등을 포함하는 입력정보를 포함하고, 설정값은 ‘가격범위’, ‘날짜범위’, ‘시간대 범위’ 등과 같은 특정 카테고리에 대한 범위를 나타낸다.
또한 제2 입력 인터페이스(533)를 통해 알림 입력정보가 입력되면, 제어모듈(50)의 제어에 따라 알림 요청모듈(55)이 구동되어 알림 요청모듈(55)에 의해 알림 입력정보를 포함하는 알림 요청데이터가 콘텐츠 관리서버(3)로 전송되게 된다.
도 8의 검색정보 인터페이스(534)는 콘텐츠 관리서버(3)로부터 검색 요청데이터에 대응되는 스크래핑 정보를 전송받으면, 전송받은 스크래핑 정보를 전시하는 그래픽 사용자 인터페이스이다.
또한 검색정보 인터페이스(534)는 도 8에 도시된 바와 같이, 전송받은 스크래핑 정보들을 활용하여 스크래핑된 콘텐츠들을 목록별로 정렬하여 전시한다.
또한 검색정보 인터페이스(534)는 스크래핑된 콘텐츠들을 목록별로 전시할 때 각 목록의 콘텐츠의 사이트주소, 제목, 게시판종류 및 번호, 등록시간을 노출한다.
도 9의 알림정보 인터페이스(535)는 콘텐츠 관리서버(3)로부터 알림 요청데이터에 대응되는 알림정보를 전송받으면, 전송받은 알림정보를 전시하는 그래픽 사용자 인터페이스이다.
또한 알림정보 인터페이스(535)는 알림 요청데이터에 대응되는 신규 등록 콘텐츠의 사이트주소, 제목, 게시판종류 및 번호, 등록시간, 설정값을 노출한다.
도 6의 검색 요청모듈(54)은 전술하였던 도 7의 제1 입력 인터페이스(532)를 통해 사용자로부터 입력된 검색 입력정보를 포함하는 검색 요청데이터를 생성하여 이를 콘텐츠 관리서버(3)로 전송한다.
알림 요청모듈(55)은 전술하였던 도 7의 제2 입력 인터페이스(533)를 통해 사용자로부터 입력된 알림 입력정보를 포함하는 알림 요청데이터를 생성하여 이를 콘텐츠 관리서버(3)로 전송한다.
알림모듈(56)은 콘텐츠 관리서버(3)로부터 알림정보를 전송받으면, 전송받은 알림정보를 푸시(Push) 등의 방식으로 클라이언트 단말기(4)의 모니터에 노출시킴으로서 사용자가 즉각적으로 이를 인지할 수 있도록 한다.
이와 같이 본 발명의 일실시예인 온라인 콘텐츠 검색 및 관리 시스템(1)은 사용자(User)로부터 키워드, 사이트, 시간대, 설정값 등과 같이 기 설정된 카테고리 별로 입력정보를 입력받으며, 입력된 입력정보에 따라 콘텐츠 제공서버들을 탐색하여 입력정보에 대응되는 콘텐츠들을 추출한 후 추출된 콘텐츠들에 대한 정보인 스크래핑 정보를 클라이언트 단말기에 디스플레이 하도록 구성됨으로써 단순히 키워드 기반으로만 검색서비스를 제공하는 것이 아니라 다양한 조건을 기반으로 검색서비스를 제공하여 검색의 정확성 및 정밀도를 획기적으로 높일 수 있게 된다.
또한 본 발명의 온라인 콘텐츠 검색 및 관리 시스템(1)은 검색결과인 스크래핑 정보가 클라이언트 단말기에 전시될 뿐만 아니라 이미지파일로 변환되어 클라이언트 단말기에 저장됨으로써 별도의 어플리케이션이나 특정 프로그램을 설치하지 않아도 검색결과를 파일 형태로 자유롭게 활용할 수 있게 된다.
또한 본 발명의 온라인 콘텐츠 검색 및 관리 시스템(1)은 검색된 콘텐츠들에 대한 연관도를 산출하여 연관도가 기 설정된 제1 설정값(TH1) 이상일 때 해당 콘텐츠들의 대표콘텐츠를 결정하여 대표콘텐츠에 한해서만 스크래핑 정보를 생성하도록 구성됨으로써 유사한 내용의 콘텐츠들의 검색으로 인한 사용자의 불필요한 시간소모를 방지함과 동시에 검색의 효율성을 높일 수 있다.
또한 본 발명의 온라인 콘텐츠 검색 및 관리 시스템(1)은 사용자로부터 입력정보를 입력받을 때, 콘텐츠 제공서버들 각각의 우선순위 정보를 함께 입력받아 대표콘텐츠 결정 시 입력정보의 우선순위에 따라 가장 높은 우선순위를 갖는 사이트의 콘텐츠를 대표콘텐츠로 결정함으로써 유사한 내용의 콘텐츠들이 검색될 때 사용자가 중요시하는 사이트의 콘텐츠를 대표콘텐츠로 제공할 수 있게 된다.
1:온라인 콘텐츠 검색 및 관리 시스템 3:콘텐츠 관리서버
4:클라이언트 단말기 5:콘텐츠관리 어플리케이션
9-1, ..., 9-N:콘텐츠 제공서버들 10:통신망
31:제어부 32:데이터베이스부 33:통신 인터페이스부
34:크롤링부 35:어플리케이션 관리부
36:동일콘텐츠 검출부 37:대표콘텐츠 검출부
38:스크래핑 정보 생성부 39:알림정보 생성부
40:기타서비스 관리부 51:제어모듈 52:저장모듈
53:인터페이스 처리모듈 54:검색요청모듈 55:알림요청모듈
56:알림모듈 361:연관도 산출모듈
363:제1 비교 및 판단모듈 365:동일콘텐츠 수량 검출모듈
367:제2 비교 및 판단모듈

Claims (8)

  1. 사용자(User)의 요청에 대응되는 콘텐츠들을 검색하여 검색결과를 사용자게에게 제공하기 위한 온라인 콘텐츠 검색 및 관리시스템에 있어서:
    사용자로부터 키워드를 포함하는 검색 입력정보를 입력받으면 외부로 검색 입력정보를 포함하는 검색 요청데이터를 전송하는 응용 프로그램인 콘텐츠관리 어플리케이션이 설치되는 클라이언트 단말기;
    콘텐츠를 생성하여 접속된 유저에게 제공하는 콘텐츠 제공서버들;
    상기 콘텐츠관리 어플리케이션으로부터 검색 요청데이터를 전송받으면, 상기 콘텐츠 제공서버들에 접속하여 검색 입력정보의 키워드에 대응되는 콘텐츠를 추출하는 크롤링부와, 상기 크롤링부에 의해 추출된 콘텐츠들에 대한 정보인 스크래핑 정보를 생성하는 스크래핑 정보 생성부와, 상기 스크래핑 정보 생성부에 의해 생성된 스크래핑 정보를 해당 콘텐츠관리 어플리케이션으로 전송하는 제어부로 구성되는 콘텐츠 관리서버를 포함하고,
    상기 콘텐츠관리 어플리케이션은 상기 콘텐츠 관리서버로부터 전송받은 스크래핑 정보를 상기 클라이언트 단말기에 전시하는 것을 특징으로 하는 온라인 콘텐츠 검색 및 관리시스템.
  2. 청구항 제1항에 있어서, 상기 콘텐츠 관리서버는 동일콘텐츠 검출부과, 대표콘텐츠 검출부를 더 포함하고,
    상기 동일콘텐츠 검출부는
    상기 크롤링부에 의해 추출된 콘텐츠들의 텍스트를 검출한 후 기 설정된 연관도검출 알고리즘을 이용하여 검출된 콘텐츠들의 텍스트들 각각의 연관도를 산출하는 연관도 산출모듈;
    상기 연관도 산출모듈에 의해 산출된 연관도들 각각을 기 설정된 제1 설정값(TH1, Threshold1)에 비교하며, 만약 연관도가 제1 설정값(TH1) 미만이면 해당 콘텐츠들을 개별콘텐츠로 판별하며, 만약 연관도가 제1 설정값(TH1) 이상이면 해당 콘텐츠들을 동일콘텐츠로 판별하는 제1 비교 및 판별모듈을 포함하고,
    상기 대표콘텐츠 검출부는 상기 제1 비교 및 판별모듈에 의해 동일콘텐츠로 결정된 콘텐츠들 중 어느 하나를 대표콘텐츠로 결정하고,
    상기 스크래핑 정보 생성부는 상기 동일콘텐츠 검출부에 의해 개별콘텐츠로 판별된 콘텐츠들과, 상기 대표콘텐츠 검출부에 의해 결정된 대표콘텐츠를 스크래핑 정보로 생성하는 것을 특징으로 하는 온라인 콘텐츠 검색 및 관리 시스템.
  3. 청구항 제2항에 있어서, 상기 콘텐츠관리 어플리케이션은 사용자로부터 상기 검색 입력정보를 입력받을 때, 상기 콘텐츠 제공서버들 각각의 우선순위 정보를 입력받아 검색 입력정보에 우선순위 정보가 포함되도록 하고,
    상기 대표콘텐츠 검출부는
    검색 입력정보의 우선순위 정보를 활용하여, 상기 제1 비교 및 판별모듈에 의해 동일콘텐츠로 결정된 콘텐츠들을 제공한 콘텐츠 제공서버들을 우선순위에 따라 정렬한 후 우선순위가 가장 높은 콘텐츠 제공서버에서 제공된 콘텐츠를 동일콘텐츠로 판별된 콘텐츠들의 대표콘텐츠로 결정하는 것을 특징으로 하는 온라인 콘텐츠 검색 및 관리 시스템.
  4. 청구항 제3항에 있어서, 상기 검색 입력정보는 상기 키워드, 시간대, 특정사이트 주소, 상기 우선순위 정보를 더 포함하는 것을 특징으로 하는 온라인 콘텐츠 검색 및 관리 시스템.
  5. 청구항 제3항에 있어서, 상기 콘텐츠관리 어플리케이션은
    사용자로부터 키워드, 특정사이트 주소, HTML 소스 내 특정위치에 대한 패턴 정의인 패턴설정, 특정 카테고리의 데이터범위인 설정값을 포함하는 알림 입력정보를 입력받으며, 상기 콘텐츠 관리서버로 알림 입력정보를 포함하는 알림 요청데이터를 전송하고,
    상기 콘텐츠 관리서버는 알림정보 생성부를 더 포함하고,
    상기 콘텐츠 관리서버는
    상기 콘텐츠관리 어플리케이션으로부터 알림 요청데이터를 전송받으면, 상기 크롤링부가 알림 입력정보의 특정사이트에 접속하여 키워드, 시간대, 패턴설정 및 설정값에 대응되는 콘텐츠가 검색되는 경우 해당 콘텐츠를 추출하여 상기 알림정보 생성부로 입력하고,
    상기 알림정보 생성부는 상기 크롤링부로부터 입력된 콘텐츠에 대한 정보인 알림정보를 생성하고,
    상기 제어부는 상기 알림정보 생성부에 의해 생성된 알림정보를 해당 콘텐츠관리 어플리케이션으로 전송하고,
    상기 콘텐츠관리 어플리케이션은 상기 콘텐츠 관리서버로부터 전송받은 알림정보를 상기 클라이언트 단말기에 전시하는 것을 특징으로 하는 온라인 콘텐츠 검색 및 관리 시스템.
  6. 청구항 제5항에 있어서, 상기 콘텐츠관리 어플리케이션은 상기 콘텐츠 관리서버로부터 스크래핑 정보 또는 알림정보를 전송받으면, 전송받은 스크래핑 정보 또는 알림정보를 기 제작된 그래픽 사용자 인터페이스(GUI)로 제작하여 상기 클라이언트 단말기에 전시하는 것을 특징으로 하는 온라인 콘텐츠 검색 및 관리 시스템.
  7. 청구항 제6항에 있어서, 상기 콘텐츠관리 어플리케이션은 제작된 그래픽 사용자 인터페이스(GUI)를 이미지파일로 변환하여 상기 클라이언트 단말기에 저장시키는 것을 특징으로 하는 온라인 콘텐츠 검색 및 관리 시스템.
  8. 청구항 제7항에 있어서, 상기 콘텐츠관리 어플리케이션은 상기 콘텐츠 관리서버로부터 알림정보를 전송받으면 알림정보를 푸시(Push) 알림 방식으로 상기 클라이언트 단말기에 전시하는 것을 특징으로 하는 온라인 콘텐츠 검색 및 관리 시스템.
KR1020170027580A 2017-03-03 2017-03-03 온라인 콘텐츠 검색 및 관리 시스템 KR20180100974A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170027580A KR20180100974A (ko) 2017-03-03 2017-03-03 온라인 콘텐츠 검색 및 관리 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170027580A KR20180100974A (ko) 2017-03-03 2017-03-03 온라인 콘텐츠 검색 및 관리 시스템

Publications (1)

Publication Number Publication Date
KR20180100974A true KR20180100974A (ko) 2018-09-12

Family

ID=63593026

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170027580A KR20180100974A (ko) 2017-03-03 2017-03-03 온라인 콘텐츠 검색 및 관리 시스템

Country Status (1)

Country Link
KR (1) KR20180100974A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024025027A1 (ko) * 2022-07-25 2024-02-01 쿠팡 주식회사 전자 장치 및 그의 패키지 관리 방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024025027A1 (ko) * 2022-07-25 2024-02-01 쿠팡 주식회사 전자 장치 및 그의 패키지 관리 방법

Similar Documents

Publication Publication Date Title
CN109145280B (zh) 信息推送的方法和装置
US9990422B2 (en) Contextual analysis engine
CN1648902B (zh) 统一和混合搜索的系统和方法
US7421441B1 (en) Systems and methods for presenting information based on publisher-selected labels
US10114534B2 (en) System and method for dynamically displaying personalized home screens respective of user queries
US7769771B2 (en) Searching a document using relevance feedback
JP4591217B2 (ja) 推薦情報提供システム
EP3529714B1 (en) Animated snippets for search results
US20090248678A1 (en) Information recommendation device and information recommendation method
WO2011080899A1 (ja) 情報推薦方法
US10134070B2 (en) Contextualized user recapture system
US8572118B2 (en) Computer method and apparatus of information management and navigation
US20080294618A1 (en) System and method for advanced handling of multiple form fields based on recent operator behavior
US11461801B2 (en) Detecting and resolving semantic misalignments between digital messages and external digital content
CN112818111A (zh) 文档推荐方法、装置、电子设备和介质
CN110737824A (zh) 内容查询方法和装置
JP2006113984A (ja) 情報提供システム,メタデータ収集解析サーバ,およびコンピュータプログラム
US20080177704A1 (en) Utilizing Tags to Organize Queries
US20160171567A1 (en) Universal feedback system with site-local data acquisition and presentation
US20160241671A1 (en) Profile update evaluator
US20230259569A1 (en) Systems and methods for automatic and adaptive browser bookmarks
CN110827101B (zh) 一种店铺推荐的方法和装置
KR20180100974A (ko) 온라인 콘텐츠 검색 및 관리 시스템
CN113722593B (zh) 事件数据处理方法、装置、电子设备和介质
CN112100522B (zh) 用于检索兴趣点的方法、装置、设备及介质

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right