KR20130033520A - 온라인 상에 게재된 웹 문서 기반 행사 이력 분석 시스템 및 방법 - Google Patents

온라인 상에 게재된 웹 문서 기반 행사 이력 분석 시스템 및 방법 Download PDF

Info

Publication number
KR20130033520A
KR20130033520A KR1020110093882A KR20110093882A KR20130033520A KR 20130033520 A KR20130033520 A KR 20130033520A KR 1020110093882 A KR1020110093882 A KR 1020110093882A KR 20110093882 A KR20110093882 A KR 20110093882A KR 20130033520 A KR20130033520 A KR 20130033520A
Authority
KR
South Korea
Prior art keywords
analysis
web document
event
web
event history
Prior art date
Application number
KR1020110093882A
Other languages
English (en)
Inventor
문승훈
Original Assignee
에스케이플래닛 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에스케이플래닛 주식회사 filed Critical 에스케이플래닛 주식회사
Priority to KR1020110093882A priority Critical patent/KR20130033520A/ko
Publication of KR20130033520A publication Critical patent/KR20130033520A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Abstract

본 발명은 웹 사이트의 뉴스 기사, 카페 또는 블로그 등에 게재된 웹 문서들을 수집하여 수집한 웹 문서로부터 행사와 관련된 정보를 추출하고 추출한 정보를 토대로 특정 인물 또는 특정 모임에 대한 과거 행사 일정 및 장소, 행사의 성공 여부, 일반인들의 주관적 평가 등 행사 관련 다양한 정보를 분석하여 관련 사용자에게 제공하는 온라인 상에서의 웹 문서 기반 행사 이력 분석 시스템 및 방법을 제공한다.

Description

온라인 상에 게재된 웹 문서 기반 행사 이력 분석 시스템 및 방법{IN ONLINE WEB TEXT BASED EVENT HISTORY ANALYSIS SERVICE SYSTEM AND METHOD THEREOF}
본 발명은 행사 이력 분석 시스템 및 방법에 관한 것으로서, 상세하게는 웹 사이트의 뉴스 기사, 카페 또는 블로그 등에 게재된 웹 문서들을 수집하여 수집한 웹 문서로부터 행사와 관련된 내용을 추출하고 추출한 정보를 토대로 특정 인물 또는 모임에 대한 과거 행사 일정 및 장소, 행사의 성공 여부, 일반인들의 주관적 평가 등 행사 관련 다양한 정보를 분석하여 제공하는 행사 이력 분석 시스템 및 방법에 관한 것이다.
최근 인터넷 사용이 점차 활발해짐에 따라, 많은 사람들이 특정 웹 사이트의 게시판, 블로그(blog), 커뮤니티(community)인 카페, 페이스북이나 미니홈피와 같은 쇼셜 네트워크서비스(Social Network Service) 등의 온라인 매체를 통해서 자신의 의견을 표현하고 있다. 따라서 사용자들은 종종 특정한 정보의 가치를 평가할 때 다른 사용자들이 인터넷 상에 올려놓은 의견 정보를 참조하여 결정한다.
예를 들어, 인터넷 상의 웹 포털, 업종별 전문 사이트, 개인 블로그 등에는 상품 품평에서 영화 품평까지 다양한 사용자들의 의견이 존재한다. 이러한 사용자들의 의견들은 일반 사용자들이 제품을 구매하거나 영화를 보기 전에 참조하기 위한 자료로 이용할 수 있으며, 마케팅 담당자나 주식 매매자 등이 각 제품 또는 기업에 대한 사용자들의 의견을 알고자 하는 경우에도 사용할 수 있다.
이를 위해 종래에는 뉴스 기사, 카페 및 블로그에 올린 사용자들의 게시물 내용에서 의미있는 정보를 추출하고 이를 가공하여 사용자들에게 가치있는 서비스를 제공하는 웹 분석 기술을 적용하고 있으며, 이 때의 기술 개념은 텍스트 마이닝(text mining), 오피니언 마이닝(opinion mining), 감성 분석 등의 용어로 사용되고 있다.
텍스트 마이닝 또는 오피니언 마이닝 기법은 최근 유명인들의 인물 호감도, 상품의 호감도 등을 분석하는 서비스 분야에 주로 사용되고 있으며 관련 특허들도 출원되고 있다.
본 발명은 상기의 웹 분석 기술을 기반으로 창안된 것으로서, 웹 사이트의 뉴스 기사, 카페 또는 블로그 등에 게재된 웹 문서들을 수집하여 수집한 웹 문서로부터 행사와 관련된 정보를 추출하고 추출한 정보를 토대로 특정 인물 또는 특정 모임에 대한 과거 행사 일정 및 장소, 행사의 성공 여부, 일반인들의 주관적 평가 등 행사 관련 다양한 정보를 분석하여 관련 사용자에게 제공하는 온라인 상에서의 웹 문서 기반 행사 이력 분석 시스템 및 방법을 제공하는 데 그 목적이 있다.
이를 위하여 본 발명의 제1 측면에 따르면, 본 발명의 복수의 웹 사이트에 게재된 웹 문서 기반 행사 이력 분석 시스템은, 복수의 웹 사이트를 통해 게재되는 웹 문서를 관리하는 웹 문서 DB; 상기 복수의 웹 사이트를 게재된 웹 문서에 대하여 행사 이력에 관한 분석을 요청하고 그 분석 결과를 제공받는 사용자 단말; 및 상기 웹 문서 DB로부터 행사에 관한 웹 문서를 수집하여 상기 사용자 단말이 요청한 특정 인물 또는 특정 모임과 대응하는 웹 문서를 추출하고, 추출한 웹 문서를 문법적 구조 또는 감성적 사전을 기반으로 분석하여 분석할 인물 또는 모임과 연관 있는 행사 이력, 일반인들의 반응을 산출하고 그 산출한 결과를 상기 사용자 단말로 제공하는 분석 서비스 장치를 포함하는 것을 특징으로 한다.
본 발명의 제2 측면에 따르면, 본 발명의 행사 이력 분석 서비스 장치는, 텍스트에서 의미있는 데이터를 추출하기 위한 주요 키워드, 행사의 반응을 평가하기 위한 감성 키워드를 저장한 사전부; 복수의 웹 사이트로부터 행사 이력에 관한 웹 문서를 주기적으로 수집하는 웹 문서 수집부; 및 상기 웹 문서 수집부에서 수집한 웹 문서에 대하여 사용자가 요청한 특정 인물 또는 특정 모임과 연관 있는 웹 문서를 추출하고 추출한 웹 문서를 문법적 구조 또는 상기 사전부에 저장된 주요 키워드 및 감성 키워드를 기반으로 분석하여 해당 행사와 관련된 정보를 산출하는 웹 문서 분석부를 포함하는 것을 특징으로 한다.
본 발명의 제3 측면에 따르면, 본 발명의 사용자 단말은, 데이터를 송수신하는 송수신부; 사용자의 조작을 입력 받는 입력부; 및 상기 입력부로부터 특정 인물 또는 특정 행사명을 포함한 키워드를 입력받고 입력받은 키워드에 대하여 행사 이력을 분석하기 위한 요청이 입력되면 상기 송수신부를 통해 분석 요청 메시지와 함께 상기 키워드를 전달하고, 상기 분석 요청 메시지에 대응하여 상기 송수신부로부터 행사 이력을 분석한 결과를 수신하면 그 분석 결과를 표시하도록 제어하는 처리부를 포함하는 것을 특징으로 한다.
본 발명의 제4 측면에 따르면, 본 발명의 복수의 웹 사이트에 게재된 웹 문서 기반 행사 이력 분석 방법은, 행사 이력을 분석할 특정 인물 또는 목적, 행사명을 포함하는 키워드를 등록하는 단계; 복수의 웹 사이트에 게재된 웹 문서로부터 상기 키워드와 연관 있는 웹 문서를 수집하는 단계; 수집한 웹 문서를 문법적 구조 또는 감성적 키워드를 기반으로 분석하여 해당 행사와 관련된 정보를 산출하는 단계; 및 분석한 결과들을 제공하는 단계를 포함하는 것을 특징으로 한다.
본 발명의 제5 측면에 따르면, 본 발명의 컴퓨터 판독 가능한 기록 매체는, 단말에 의해 실행될 때, 행사 이력을 분석하기 원하는 특정 인물명 또는 특정 행사명에 대한 키워드를 입력받고, 입력 받은 키워드에 기반하여 행사 이력 분석을 요청하며, 상기 요청에 따라 특정 인물 또는 특정 모임과 연관 있는 행사의 분석 결과를 획득하고 획득한 분석 결과를 표시하기 위한 명령어를 포함하는 것을 특징으로 한다.
본 발명에 따르면, 온라인 상에 게시된 수많은 웹 문서로부터 원하는 특정 인물에 대한 행사 이력, 또는 특정 모임에 관한 행사 이력을 파악할 수 있으므로 특정 행사 또는 행사에 참여한 특정 인물에 관심있는 사용자들에게 차별화된 재미를 제공할 수 있는 효과가 있다.
또한, 본 발명은 유명인들의 팬 카페, 포털 사이트의 연예 섹션 등과 연동하여 해당 사이트 방문들에게 다양한 볼거리 정보를 제공하는 효과를 제공한다.
도 1은 본 발명에 따른 행사 이력 분석 시스템의 망 구성을 나타낸 도면이다.
도 2는 본 발명에 따른 분석 서비스 장치의 구성을 나타낸 도면이다.
도 3은 본 발명에 따른 분석 서비스 장치의 웹 문서 수집부를 나타낸 도면이다.
도 4는 본 발명에 따른 분석 서비스 장치의 웹 문서 분석부를 나타낸 도면이다.
도 4는 본 발명에 따른 사용자 단말의 구성을 나타낸 도면이다.
도 6는 본 발명에 따른 온라인 상에 게재된 웹 문서를 이용하여 행사 이력을 분석하는 방법을 설명하는 흐름도이다.
도 7은 도 6의 상세 흐름도이다.
이하, 첨부된 도면을 참조하여 본 발명에 따른 실시 예를 상세하게 설명한다. 본 발명의 구성 및 그에 따른 작용 효과는 이하의 상세한 설명을 통해 명확하게 이해될 것이다. 본 발명의 상세한 설명에 앞서, 동일한 구성요소에 대해서는 다른 도면 상에 표시되더라도 가능한 동일한 부호로 표시하며, 공지된 구성에 대해서는 본 발명의 요지를 흐릴 수 있다고 판단되는 경우 구체적인 설명은 생략하기로 함에 유의한다.
설명에 앞서, 본 발명에서 언급하는 웹 문서는 온라인 매체 상에 네티즌들에 의해 게재된 본문, 본문에 부가된 댓글, 첨부파일 또는 이미지로서, 특정 인물이 참여한 행사나 특정 목적을 갖는 모임의 행사에 대하여 네티즌들의 주관적인 의견을 포함한다.
온라인 매체는 네티즌들에 의해 웹 문서가 발생될 수 있는 웹 사이트(신문 사이트, 방송 사이트, 전문 매장 사이트), 게시판, 블로그, 카페, 쇼셜 네트워크 서비스를 지원하는 사이트 등 다른 사용자간 커뮤니티(community)가 가능한 채널을 의미한다.
도 1은 본 발명에 따른 행사 이력 분석 시스템의 망 구성을 나타낸 도면이다.
본 발명에 따른 행사 이력 분석 시스템은 복수의 웹 사이트(100)에 게시된 웹 문서를 저장하는 웹 문서 DB(200)와, 통신망(300)을 통해 복수의 웹 문서 DB(200)와 연결되어 원하는 정보를 추출하고 분석하는 분석 서비스 장치(400), 사용자 단말(500)을 포함한다.
복수의 웹 사이트(100)는 앞서 설명한 바와 같이 네티즌들에 의해 웹 문서가 발생될 수 있는 웹 사이트(신문 사이트, 방송 사이트, 전문 매장 사이트), 게시판, 블로그, 카페, 쇼셜 네트워크 서비스를 지원하는 사이트 등 다른 사용자간 커뮤니티(community)가 가능한 온라인 채널을 말한다.
웹 문서 DB(200)는 각 웹 사이트(100)에 게재되는 웹 문서를 저장하여 관리한다. 웹 문서는 뉴스 사이트에 게재된 유명인들의 행사 기사이거나, 카페 및 블로그 등에 개인들이 유명인들의 행사 관련 내용을 올린 문서일 수 있다. 이러한 웹 문서들에는 유명인 이름, 행사명, 행사 날짜, 행사 지역, 행사 참여 인원, 행사에 대한 의견들이 포함된다. 또한, 소정 행사에 관한 뉴스 기사 또는 게시물의 경우 참가자들 또는 일반인들의 유명인 행사에 관한 사실 내용 및 그에 대한 개인적인 평가 내용들이 댓글로 부가되기도 한다.
통신망(300)은 복수의 웹 문서 DB(200)와 분석 서비스 장치(400)간, 사용자 단말(500)과 분석 서비스 장치(400)간 상호 유무선으로 통신할 수 있도록 통신 서비스를 제공하는 네트워크를 말한다. 즉, 통신망(300)은 웹 문서 DB(200)에 저장된 다양한 웹 문서를 분석 서비스 장치(400)로 제공하고, 사용자 단말(500)로부터 행사 이력을 분석할 키워드와 함께 분석 요청 메시지가 수신되면 분석 서비스 장치(400)로 전달한다. 이와 반대로 분석 서비스 장치(400)로부터 행사 이력 분석 결과를 수신하면 해당 사용자 단말(500)로 전달함으로써 사용자 단말(500)과 분석 서비스 장치(400)간을 인터페이스한다.
이러한 통신망(300)은 유선 인터넷망일 수 있으며, 이동 통신망(CDMA, W-CDMA 등)을 통해 연결되는 무선 데이터망(인터넷망, IMS 등), 위성통신망, 또는 Wi-Fi를 통해 연결되는 인터넷망 등을 포함할 수 있다. 구체적으로, CDMA 망의 경우 PDSN(Packet Data Serving Node)을 통해 데이터망에 접속될 수 있고, W-CDMA 망의 경우 GGSN(Gateway GPRS Support Node)을 통해 데이터망에 접속될 수 있다. 또한 핫 스팟(Hot-Spot) 등의 지역에서는 Wi-Fi 등의 근거리 통신을 통해 인터넷망에 접속될 수 있다.
예를 들어, 웹 문서 DB(200)와 연결되는 통신망(300)은 인터넷망을 이용하고, 사용자 단말(500)과 연결되는 통신망(300)은 이동통신망 또는 WiFi를 통해 연결되는 인터넷망, 또는 유선 인터넷망일 수 있다. 또는 분석 서비스 장치(400)와 연결되는 통신망(300)은 인터넷망일 수 있다.
사용자 단말(500)은 분석 서비스 장치(400)에 행사 이력 분석 서비스를 이용하기 위해 사용자 정보를 등록하고, 등록 후 분석 서비스 장치(400)에 원하는 인물 또는 행사에 대하여 행사 이력 분석을 요청한다. 그리고, 분석한 결과를 분석 서비스 장치(400)로부터 제공받는다. 이러한 서비스를 제공받기 위해 사용자 단말(500)에는 행사 이력에 관한 분석 프로그램을 탑재한다.
또한, 사용자 단말(500)은 상기와 같이 분석 서비스 장치(400)와 데이터를 제공받기 위해 통신망(300)을 통해 통신이 가능한 단말을 이용한다. 예를 들어, PC, 노트북, 태블릿 PC, PDA(Personal Digital Assistants), MP3 플레이어, 스마트 폰 등과 같이, 이동 통신망(CDMA, W-CDMA 등)을 통해 통신이 가능한 단말, 무선 인터넷망(WiBro 등) 또는 Wi-Fi 등의 근거리 통신을 통해 데이터 송수신이 가능한 단말 등을 이용할 수 있다.
분석 서비스 장치(400)는 복수의 웹 문서 DB(200)에 게재된 웹 문서로부터 행사와 연관 있는 웹 문서를 수집하고 수집한 웹 문서를 문법적 구조 또는 감성적 사전에 기반하여 분석하여 특정 인물이 참가하거나 또는 특정 목적을 갖는 행사에 대하여 행사 이력, 일반인들의 반응 등을 산출한다.
이러한 분석 서비스 장치(400)는 도 2 내지 도 4와 같이 구성된다.
도 2를 참조하면, 분석 서비스 장치(400)는 웹 문서 수집부(410), 웹 문서 분석부(420), 부가 서비스 연계부(430), 웹 문서 저장부(440), 사전부(450)를 포함한다.
구체적으로, 웹 문서 수집부(410)는 도 3에 도시한 바와 같이 웹 문서 모니터링부(412), 행사 관련 웹 문서 추출부(414), 의미 단어 추출부(416) 등을 포함한다.
웹 문서 모니터링부(412)는 복수의 웹 사이트에 게재된 웹 문서를 일정 주기마다 모니터링하면서 수집한다. 예를 들면, 2010년도 한 해에 대해서만 웹 문서를 분석할 경우 2010년 1월 1일부터 2010년 12월 31일까지 게재된 웹 문서를 수집하고, 한달 전부터 최근까지 게재된 웹 문서를 분석할 경우에는 정보를 갱신할 일정 주기를 정해 두고 모니터링할 수 있다.
행사 관련 웹 문서 추출부(414)는 웹 문서 모니터링부(412)를 통해 수집한 웹 문서에서 행사와 관련된 웹 문서를 추출한다. 추출 방법으로는 행사와 관련된 임의의 키워드(축제, 페스티발, 콘서트, 콘퍼런스, 대회 등)를 설정하고 검색을 통해 해당 키워드를 포함하고 있는 웹 문서를 추출하는 방식을 활용할 수 있다.
의미 단어 추출부(416)는 행사 관련 웹 문서 추출부(414)를 통해 추출한 웹 문서에서 의미있는 단어(이하, 의미 단어)를 추출하여 추출한 의미 단어를 웹 문서 저장부(440)에 저장한다. 예를 들어, 웹 문서에서 콘서트 장소명-올림픽 체조 경기장, 콘서트 일자-2010년 12월 23일, 관객수-5000명 등의 의미 단어를 추출하여 웹 문서 저장부(440)에 저장할 수 있다.
이때, 웹 문서 수집부(410)는 복수의 웹 사이트로부터 주기적으로 수집한 웹 문서를 그대로 웹 문서 저장부(440)에 저장할 수 있고, 또는 행사 관련 웹 문서 추출부(414)에서 사용자 단말(500)이 요청한 특정 분석 대상과 연관 있는 웹 문서만 추출하여 웹 문서 저장부(440)에 저장할 수 있다. 예를 들어, 그룹가수인 소녀시대가 참가한 행사에 대해서만 분석할 경우 복수의 웹 사이트로부터 수집한 웹 문서에서 인물명 소녀시대를 인덱싱하여 추출한 웹 문서만을 저장할 수 있다.
다시 도 2를 참조하면, 웹 문서 저장부(440)는 행사에 관한 자료 즉, 웹 문서로부터 추출한 의미 단어를 구분하여 저장할 수 있다. 예를 들어, 웹 문서에 행사명, 행사에 참가한 인물에 대한 정보가 포함된 경우 의미 단어로 행사명뿐만 아니라 행사에 참가한 인물에 관한 정보가 각각 추출되기 때문에 특정 인물에 대하여 분석시 용이하게 관련 행사 이력 정보를 분류하여 제공할 수 있다.
사전부(450)는 수집한 문서의 텍스트에서 의미있는 데이터를 추출하기 위한 주요 키워드, 행사의 반응을 평가하기 위한 감성 키워드, 일반적인 텍스트 마이닝(text-mining)으로 분석하기 위한 품사 정보 등을 저장한다. 예를 들어, 주요 키워드로서 행사에 참가한 인물명, 장소 명칭, 행사명 등을 포함하고, 감성 키워드로서 긍정적인 표현인 '멋지다', '훌륭하다', '캡이다', '최고다' 등을 포함하며, 부정적인 표현으로는 '형편없다', '꽝이다' 등을 포함한다.
웹 문서 분석부(420)는 사전부(440)에 저장된 키워드들을 활용하여 웹 문서 수집부(410)에서 수집한 웹 문서를 분석함으로써 분석할 인물 또는 모임에 관한 행사의 이력 정보를 산출한다. 그리고, 웹 문서 분석부(420)는 산출한 정보를 저장에 적합한 형태로 가공하고 웹 문서 저장부(440)에 저장한다.
이때, 웹 문서 분석부(420)에서의 구체적인 분석 방법으로는 언어 분석과 감성 분석 등이 있다. 언어 분석은 문법 또는 구문 구조에 기반하여 분석하는 것이고, 감성 분석은 감성 사전을 기반으로 표현 정도에 따라 주관적인 의견을 분석하는 것이다.
도 4를 참조하면, 상기의 언어 분석 기능과 감성 분석 기능을 갖는 웹 문서 분석부(420)의 구성을 도시하고 있다.
언어 분석기(422)는 웹 문서에 포함된 문장들을 분리하여 문단 번호, 문단에서의 위치 등 전체 문장의 형태를 파악하는 문장 분리기, 문장 단위로 형태소 분석하는 형태소 분리기 등을 포함할 수 있다. 따라서, 언어 분석기(422)는 웹 문서에 포함된 문장들을 객관적인 사실에 근거하여 분석(text mining)함으로써 특정 인물 또는 목적을 갖는 행사에 대하여 객관적인 정보를 획득한다. 여기서, 객관적인 정보라 함은 특정 인물의 행사 여부, 행사 장소, 행사 일정 등을 포함한다.
감성 분석기(424)는 사전부(도 2의 450)에 기 저장된 키워드를 기반으로 언어 분석기(422)를 통해 분리된 형태소가 긍정적 또는 부정적 표현을 사용하고 있는지, 어떤 감탄사 표현을 사용하고 있는지를 필터링한다. 이를 통해 감성 분석기(424)는 웹 문서의 내용이 행사에 대하여 긍정적 평가를 하고 있는지, 부정적 평가를 하고 있는지 또는 행사에 참가한 인물에 대하여 긍정적, 부정적 평가를 하고 있는지 등에 대한 주관적인 반응을 분석(opinion mining)한다. 즉 보통 사용자들은 웹 사이트 상에 게재하는 웹 문서에 사용자 개인의 감정을 표현한다. 행사 또는 행사에 참가한 인물에 대한 긍정 또는 부정은 웹 문서에 표현된 단어의 양으로 판단할 수 있다. 예를 들어, 웹 문서에 긍정적 텍스트(표현어)가 많은 경우 사용자의 감정이 긍정적이라 할 수 있으며 이때 긍정 비율은 높다. 반대로, 웹 문서에 부정적 텍스트가 많은 경우 사용자의 감정이 부정적이라 할 수 있으며 이때 긍정 비율은 상대적으로 낮다.
따라서, 본 발명에 따른 웹 문서 분석부(420)는 언어 분석기(422)를 통해 사전부(460)에 기 저장된 키워드와 매핑시켜 행사명, 행사 장소, 행사 일정 등과 같은 텍스트 정보로부터 행사와 관련한 객관적인 정보를 분석한다. 또한, 본 발명에 따른 웹 문서 분석부(420)는 감성 분석기(424)를 통해 사전부(460)에 기 저장된 감성 키워드와 매핑시켜 감성적인 표현으로부터 행사에 관하여 일반인들이 느낀 반응에 대한 주관적인 감성 정보를 분석한다.
또한 도 2에 도시한 바와 같이 본 발명의 부가 서비스 연계부(430)는 웹 문서 분석부(420)를 통해 분석한 결과를 부가 서비스와 연계하여 제공하기 위한 모듈로, 전자 지도 서비스, 주변 위치 정보(POI: Point Of Interest) 서비스, 지난 행사 다시보기 서비스 등을 포함할 수 있다.
예를 들어, 분석이 완료된 지난 행사 정보를 전자 지도 상에 지역별로 또는 기간별로 출력해 주는 서비스를 부가 서비스로 제공할 수 있다. 이 경우 부가 서비스 연계부(430)는 각 행사장의 위치명, 위치 위경도 정보, 행사의 일정(또는 행사 내용) 등을 포함하여 저장된 POI(Point Of Interest) 데이터베이스와, 전자 지도 정보를 저장한 전자 지도 데이터베이스를 포함하고, 상기의 POI 데이터베이스 및 전자지도 데이터베이스와 연계되어 전자 지도 이미지를 생성하는 기능, 분석 결과와 전자 지도를 매칭하여 행사 정보를 제공하는 기능 등을 제공한다.
도 5는 본 발명에 따른 사용자 단말의 구성을 나타낸 도면이다.
본 발명에 따른 사용자 단말(500)은 송수신부(510), 처리부(520), 저장부(530), 표시부(540), 입력부(550) 등을 포함하여 구성될 수 있다.
송수신부(510)는 통신망을 통해 네트워크 기반의 분석 서비스 장치(도 1의 400)와 데이터를 송수신한다.
저장부(530)는 단말기의 동작 제어 시 필요한 프로그램과, 행사 이력 분석 서비스를 제공받기 위한 분석 프로그램을 저장한다.
입력부(550)는 사용자와의 인터페이스를 위한 장치로 각종 기능 키 및 문자 입력 등을 위한 키를 구비하고 있으며, 사용자가 조작하는 키에 대응하는 키 입력 데이터를 처리부(520)로 출력한다.
표시부(550)는 처리부(520)로부터 제공되는 표시 데이터를 표시하고, 특히 본 발명에서는 원하는 행사 이력 분석을 위한 키워드를 입력하고 그 분석 결과를 제공하는 화면을 표시한다.
처리부(520)는 입력부(550)를 통해 사용자로부터 행사 이력 분석을 위한 키워드로서 특정 인물 또는 특정 행사명이 입력되면 이에 대응하는 입력 데이터를 송수신부(510)로 전달하여 외부의 분석 서비스 장치(도 1의 400)에 키워드에 따른 행사 이력 분석을 요청한다. 그리고, 처리부(520)는 송수신부(510)를 통해 외부의 분석 서비스 장치(도 1의 400)로부터 행사 이력 분석 결과를 획득하고 이를 표시부(540)로 전달한다.
또한, 처리부(520)는 분석 서비스 장치(도 1의 400)로부터 획득한 행사 이력 분석 결과를 표시부(540)에 전달할 때 전자 지도와 주변 위치 정보 서비스와 연동하여 제공할 수 있다. 예를 들어, 해당 행사가 진행한 장소(위치)를 전자 지도와 매핑하여 전자 지도 상에 특정 기간별 또는 지역별로 행사 이력 정보를 제공하도록 한다.
이렇게 구성되는 사용자 단말은 내부의 저장부(530)에 저장된 분석 프로그램을 통해 사용자가 원하는 특정 인물이나 또는 특정 모임에서의 행사에 대한 키워드를 입력하여 관련 행사 이력 분석 서비스를 요청하고, 상기 요청에 따라 분석 결과를 수신하여 특정 인물에 관심 있는 사용자나 연예인 팬 카페, 특정 포털 사이트에 차별화된 정보를 제공하는 것에 특징이 있다.
한편, 상기와 같이 구성되는 사용자 단말(500)은 컴퓨터에 의해 실행되는 프로그램 모듈과 같은 컴퓨터에 의해 실행 가능한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다. 일 예로, 기록 매체는 각 장치의 내장형으로 하드 디스크, 플래시 메모리, RAM, ROM 등이거나, 외장형으로 CD-R, CD-RW와 같은 광디스크, 콤팩트 플래시 카드, 스마트 미디어, 메모리 스틱, 멀티미디어 카드 등일 수 있다.
이때, 기록 매체는 행사 이력을 분석하기 원하는 특정 인물명 또는 특정 행사명에 대한 키워드를 입력 받고, 입력 받은 키워드에 기반하여 행사 이력 분석을 요청하며, 상기 요청에 따라 특정 인물 또는 특정 모임과 연관 있는 행사의 분석 결과를 획득하고 획득한 분석 결과를 표시하기 위한 명령어를 포함한다.
또, 획득한 분석 결과를 표시할 때 전자 지도 이미지를 생성하고, 생성한 전자 지도 상에 획득한 분석 결과의 위치 정보를 매핑하여 함께 표시하기 위한 명령어를 더 포함할 수 있다.
그럼 이상의 시스템 구성을 이용하여 행사 이력을 분석하는 방법에 대하여 구체적으로 설명하기로 한다.
도 6은 본 발명에 따른 온라인 상에 게재된 웹 문서를 이용하여 행사 이력을 분석하는 방법을 설명하는 흐름도이고, 도 7은 도 6의 상세 흐름도이다.
먼저 도 6을 참조하면, 분석 서비스 장치는 분석하고자 하는 키워드를 등록해 두고(S100), 복수의 웹 사이트에 게재된 웹 문서로부터 키워드와 관련한 웹 문서를 수집한다(S110).
상기의 과정은 사용자 단말이 분석 서비스를 요청하는 단계에서 수행될 수 있지만, 행사 이력 분석에 관한 웹 문서를 구축하는 단계에서 수행될 수도 있다.
전자의 경우 분석하고자 하는 키워드 등록은 서비스를 등록한 사용자 단말별 요청에 따라 분석하고자 원하는 특정 대상(예컨대, 가수 소녀시대가 참가한 행사, 불우이웃돕기를 위한 행사 등)을 포함하지만, 후자의 경우 분석하고자 하는 키워드 등록은 행사에 관한 일반적인 키워드 즉, 행사명, 행사 장소, 일정 등을 포함한다.
후자의 경우 분석 서비스 장치는 추가적으로 도 7에 나타난 과정을 거친다. 즉, 복수의 웹 사이트에 게재된 웹 문서에 사전에 등록해 둔 키워드가 포함되어 있는지 모니터링을 하고 키워드와 관련된 웹 문서가 존재하면 이를 추출하여 수집한다(S111, S112).
이후, 수집한 웹 문서로부터 사전부에 기 저장된 주요 키워드와 매칭시켜 의미있는 단어(이하, 의미 단어)를 추출한다(S113). 의미 단어는 행사 이력을 분석하는데 필요한 주요 키워드로, 예를 들어 행사명, 행사 장소, 일정, 특정 인물의 행사 여부 등을 포함할 수 있다.
이후, 분석 서비스 장치는 추출한 의미 단어를 데이터베이스에 저장함으로써 추후에 사용자의 분석 대상에 따른 관련 정보를 용이하게 추출할 수 있다(S114).
이후, 분석 서비스 장치는 전자 지도와 같이 부가 서비스와 연동할 경우 추출한 의미 단어를 전자 지도와 함께 제공할 수 있도록 장소와 연관되는 단어를 지역 정보와 매칭하여 POI 데이터베이스에 저장한다(S115).
이후, 분석 서비스 장치는 도 6에 도시한 바와 같이 상기의 과정을 통해 수집한 웹 문서를 언어분석 방법 또는 감성 분석 방법을 통해 분석한다(S120).
언어 분석은 웹 문서에 포함된 문장들을 문법 또는 구문 구조에 근거하여 분석함으로써 특정 인물 또는 특정 모임과 연관 있는 행사의 객관적인 정보를 분석한다.
감성 분석은 사전에 미리 구축된 감성 키워드와 매칭하여 감성적인 표현에 따라 특정 인물 또는 특정 모임과 연관 있는 행사의 주관적인 반응을 분석한다.
이후, 분석 서비스 장치는 상기의 분석을 통해 행사와 관련된 객관적인 정보와 주관적인 정보를 분석 결과로 해당 사용자 단말에게 제공한다(S130). 제공시 상기에서 구축한 POI 데이터베이스를 기반으로 하여 전자 지도 상에 주변 위치 정보를 제공하는 전자 지도 서비스, 주변 위치정보 서비스(POI 서비스), 지난 행사 다시보기 서비스 등의 부가 서비스와 연계하여 분석 결과를 제공할 수 있다. 이를 테면, 서울 지역에서 가수 소녀시대가 참관한 행사에 대하여 분석한 결과를 세부 지역별로 표시하거나, 또는 사용자가 위치한 곳으로부터 일정 반경 내에 포함되는 행사 정보를 표시하거나, 또는 2~3개월 단위로 기간을 구분하여 전자 지도 상에 표시할 수 있다. 전자 지도 상의 표시는 해당 지역 및 위치에 행사명을 표기하여 나타내고 해당 행사명을 선택 또는 포커싱하는 경우 행사명에 대한 세부 분석 결과 또는 행사 내용을 전자 지도 상에 오버랩되게 나타낼 수 있고 또는 세부 화면으로 전환하여 나타낼 수도 있을 것이다.
이상의 설명은 본 발명을 예시적으로 설명한 것에 불과하며, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 본 발명의 기술적 사상에서 벗어나지 않는 범위에서 다양한 변형이 가능할 것이다. 따라서 본 발명의 명세서에 개시된 실시 예들은 본 발명을 한정하는 것이 아니다. 본 발명의 범위는 아래의 특허청구범위에 의해 해석되어야 하며, 그와 균등한 범위 내에 있는 모든 기술도 본 발명의 범위에 포함되는 것으로 해석해야 할 것이다.
종래에는 사용자가 필요에 의해 직접 온라인 상의 특정 웹 문서를 검색하여 원하는 정보를 획득함으로써 다양한 온라인 매체에 대하여 통합적으로 정보 획득이 어려웠으나, 본 발명은 웹 분석 기술을 기반으로 웹 사이트의 뉴스 기사, 카페 또는 블로그 등에 게재된 웹 문서들을 수집하고 수집한 웹 문서로부터 원하는 상업 업종과 관련된 내용을 추출하여 특정 지역 및 특정 업종에 대한 만족도 평가, 향후 마케팅 방향, 상업 유망성 여부 등의 상권을 분석함으로써 향후 상권 경향, 상업성 등을 파악할 수 있다. 이러한 점에서 기존 문서 분석의 한계를 뛰어 넘음에 따라 관련 기술에 대한 이용만이 아닌 적용되는 분석 알고리즘의 시판 또는 영업의 가능성이 충분할 뿐만 아니라 현실적으로 명백하게 실시할 수 있는 정도이므로 산업상 이용 가능성이 있는 유용한 발명이다.
100: 웹 사이트 200: 웹 문서 DB
300: 통신망 400: 분석 서비스 장치
500: 사용자 단말 410: 웹 문서 수집부
420: 웹 문서 분석부 430: 마케팅 정보 분석부
440: 부가 서비스 연계부 450: 웹 문서 저장부
460: 사전부 422: 언어 분석기
424: 감성 분석기 510: 송수신부
520: 처리부 530: 저장부
540: 표시부 550; 입력부

Claims (14)

  1. 복수의 웹 사이트를 통해 게재되는 웹 문서를 관리하는 웹 문서 DB;
    상기 복수의 웹 사이트를 통해 게재된 웹 문서에 대하여 행사 이력에 관한 분석을 요청하고 그 분석 결과를 제공받는 사용자 단말; 및
    상기 웹 문서 DB로부터 행사 이력에 관한 웹 문서를 수집하여 상기 사용자 단말이 요청한 특정 인물 또는 특정 모임과 대응하는 웹 문서를 추출하고, 추출한 웹 문서를 문법적 구조 또는 감성적 사전을 기반으로 분석하여 분석할 인물 또는 모임과 연관 있는 행사 이력, 일반인들의 반응을 산출하고 그 산출한 결과를 상기 사용자 단말로 제공하는 분석 서비스 장치
    를 포함하는 것을 특징으로 하는 복수의 웹 사이트에 게재된 웹 문서 기반 행사 이력 분석 서비스 시스템.
  2. 텍스트에서 의미있는 데이터를 추출하기 위한 주요 키워드, 행사의 반응을 평가하기 위한 감성 키워드를 저장한 사전부;
    복수의 웹 사이트로부터 행사 이력에 관한 웹 문서를 주기적으로 수집하는 웹 문서 수집부; 및
    상기 웹 문서 수집부에서 수집한 웹 문서에 대하여 사용자가 요청한 특정 인물 또는 특정 모임과 연관 있는 웹 문서를 추출하고 추출한 웹 문서를 문법적 구조 또는 상기 사전부에 저장된 주요 키워드 및 감성 키워드를 기반으로 분석하여 해당 행사와 관련된 정보를 산출하는 웹 문서 분석부
    를 포함하는 것을 특징으로 하는 행사 이력 분석 서비스 장치.
  3. 제 2 항에 있어서,
    상기 웹 문서 분석부를 통해 분석한 결과를 부가 서비스와 연계하여 제공하는 부가 서비스 연계부
    를 더 포함하는 것을 특징으로 하는 행사 이력 분석 서비스 장치.
  4. 제 3 항에 있어서,
    상기 부가 서비스는 전자 지도 서비스, 주변 위치 정보 서비스(POI 서비스), 지난 행사 다시보기 서비스를 포함하는 것을 특징으로 하는 행사 이력 분석 서비스 장치.
  5. 제 2 항에 있어서,
    상기 웹 문서 수집부는,
    상기 복수의 웹 사이트로부터 행사 이력에 관한 웹 문서를 추출하고, 추출한 웹 문서에서 의미있는 단어를 추출하여 추출한 의미 단어를 기준으로 데이터베이스에 저장해 두는 것을 특징으로 하는 행사 이력 분석 서비스 장치.
  6. 제 2 항에 있어서,
    상기 웹 문서 분석부는,
    상기 추출한 웹 문서를 문법적 구조를 근거로 분석하여 상기 특정 인물 또는 특정 모임과 연관 있는 행사의 객관적인 정보를 산출하는 언어 분석기와,
    상기 추출한 웹 문서를 상기 사전부에 저장된 감성 키워드와 매칭하여 감성적 표현에 따라 상기 특정 인물 또는 특정 모임과 연관 있는 행사에 대한 주관적인 반응을 분석하는 감성 분석기
    를 포함하는 특징으로 하는 행사 이력 분석 서비스 장치.
  7. 데이터를 송수신하는 송수신부;
    사용자의 조작을 입력 받는 입력부; 및
    상기 입력부로부터 특정 인물 또는 특정 행사명을 포함한 키워드를 입력받고 입력받은 키워드에 대하여 행사 이력을 분석하기 위한 요청이 입력되면 상기 송수신부를 통해 분석 요청 메시지와 함께 상기 키워드를 전달하고, 상기 분석 요청 메시지에 대응하여 상기 송수신부로부터 행사 이력을 분석한 결과를 수신하면 그 분석 결과를 표시하도록 제어하는 처리부
    를 포함하는 것을 특징으로 하는 사용자 단말.
  8. 제 7 항에 있어서,
    상기 처리부는,
    상기 분석 결과를 표시할 때 전자 지도 이미지를 생성하고 생성한 전자 지도 상에 기간별 또는 지역별로 상기 분석 결과를 매핑하여 제공하는 것을 특징으로 하는 사용자 단말.
  9. 행사 이력을 분석할 특정 인물 또는 목적, 행사명을 포함하는 키워드를 등록하는 단계;
    복수의 웹 사이트에 게재된 웹 문서로부터 상기 키워드와 연관 있는 웹 문서를 수집하는 단계;
    수집한 웹 문서를 문법적 구조 또는 감성적 키워드를 기반으로 분석하여 해당 행사와 관련된 정보를 산출하는 단계; 및
    분석한 결과들을 제공하는 단계
    를 포함하는 것을 특징으로 하는 복수의 웹 사이트에 게재된 웹 문서 기반 행사 이력 분석 방법.
  10. 제 9 항에 있어서,
    상기 분석 결과들을 제공하는 단계는,
    전자 지도를 포함한 부가 서비스와 연동하여 상기 분석 결과와 함께 제공하는 것을 특징으로 하는 복수의 웹 사이트에 게재된 웹 문서 기반 행사 이력 분석 방법.
  11. 제 9 항에 있어서,
    상기 웹 문서를 수집하는 단계는,
    상기 복수의 웹 사이트로부터 상기 키워드와 연관 있는 웹 문서를 추출하고 추출한 웹 문서에서 의미있는 단어를 추출한 후 추출한 의미 단어를 데이터베이스에 저장해 두는 것을 특징으로 하는 복수의 웹 사이트에 게재된 웹 문서 기반 행사 이력 분석 방법.
  12. 제 9 항에 있어서,
    상기 수집한 웹 문서를 분석하는 단계는,
    상기 수집한 웹 문서를 문법적 구조에 기반한 언어 분석을 통해 특정 인물 또는 특정 모임과 연관 있는 행사의 객관적인 정보를 산출하는 단계와,
    상기 언어 분석을 통해 형태소 단위로 분리된 웹 문서를 기 저장된 감성적 키워드와 매칭하여 감성적 표현에 따라 상기 특정 인물 또는 특정 모임과 연관 있는 행사의 주관적인 반응을 분석하는 단계
    를 포함하는 것을 특징으로 하는 복수의 웹 사이트에 게재된 웹 문서 기반 행사 이력 분석 방법.
  13. 단말에 의해 실행될 때,
    행사 이력을 분석하기 원하는 특정 인물명 또는 특정 행사명에 대한 키워드를 입력받고,
    입력 받은 키워드에 기반하여 행사 이력 분석을 요청하며,
    상기 요청에 따라 특정 인물 또는 특정 모임과 연관 있는 행사의 분석 결과를 획득하고 획득한 분석 결과를 표시하기 위한 명령어를 포함하는 컴퓨터 판독 가능한 기록 매체.
  14. 제 13 항에 있어서,
    상기 분석 결과를 표시할 때 전자 지도 이미지를 생성하고,
    생성한 전자 지도 상에 상기 분석 결과를 매핑하여 함께 표시하기 위한 명령어를 더 포함하는 것을 특징으로 하는 컴퓨터 판독 가능한 기록 매체.
KR1020110093882A 2011-09-19 2011-09-19 온라인 상에 게재된 웹 문서 기반 행사 이력 분석 시스템 및 방법 KR20130033520A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020110093882A KR20130033520A (ko) 2011-09-19 2011-09-19 온라인 상에 게재된 웹 문서 기반 행사 이력 분석 시스템 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020110093882A KR20130033520A (ko) 2011-09-19 2011-09-19 온라인 상에 게재된 웹 문서 기반 행사 이력 분석 시스템 및 방법

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020160145404A Division KR20160131981A (ko) 2016-11-02 2016-11-02 온라인 상에 게재된 웹 문서 기반 행사 이력 분석 시스템 및 방법

Publications (1)

Publication Number Publication Date
KR20130033520A true KR20130033520A (ko) 2013-04-04

Family

ID=48435870

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020110093882A KR20130033520A (ko) 2011-09-19 2011-09-19 온라인 상에 게재된 웹 문서 기반 행사 이력 분석 시스템 및 방법

Country Status (1)

Country Link
KR (1) KR20130033520A (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150100065A (ko) * 2014-02-24 2015-09-02 정소연 행사 서비스 순위 선정 시스템 및 그의 제어 방법
KR101614736B1 (ko) * 2015-05-29 2016-04-29 (주)타파크로스 텍스트 데이터 마이닝을 통한 확산 예측 기반 크롤링 방법 및 시스템
JP2019121302A (ja) * 2018-01-11 2019-07-22 ヤフー株式会社 情報処理装置、情報処理方法、およびプログラム
KR102514091B1 (ko) * 2022-10-31 2023-03-24 전시컨벤션경영연구소 주식회사 전시마케팅 성과관리 방법 및, 이를 위한 컴퓨터 프로그램

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150100065A (ko) * 2014-02-24 2015-09-02 정소연 행사 서비스 순위 선정 시스템 및 그의 제어 방법
KR101614736B1 (ko) * 2015-05-29 2016-04-29 (주)타파크로스 텍스트 데이터 마이닝을 통한 확산 예측 기반 크롤링 방법 및 시스템
JP2019121302A (ja) * 2018-01-11 2019-07-22 ヤフー株式会社 情報処理装置、情報処理方法、およびプログラム
KR102514091B1 (ko) * 2022-10-31 2023-03-24 전시컨벤션경영연구소 주식회사 전시마케팅 성과관리 방법 및, 이를 위한 컴퓨터 프로그램

Similar Documents

Publication Publication Date Title
Wilson et al. Using blogs as a qualitative health research tool: a scoping review
TWI443532B (zh) 上下文式查詢增廣系統與方法
JP2019028647A (ja) 研修情報提供装置、方法およびプログラム
US20130297581A1 (en) Systems and methods for customized filtering and analysis of social media content collected over social networks
US20120179972A1 (en) Advisor-assistant using semantic analysis of community exchanges
Nikolaidou et al. Utilizing social media in transport planning and public transit quality: Survey of literature
KR20160055930A (ko) 연속적인 소셜 커뮤니케이션에 사용되는 콘텐츠를 능동적으로 구성하기 위한 시스템 및 방법
WO2012080790A1 (en) System and method to provide messages adaptive to a crowd profile
KR20130083012A (ko) 음악컨텐츠 추천장치, 그 추천방법 및 기록매체
KR20120013044A (ko) 모바일 검색을 위한 모바일 시스템, 검색 시스템 및 검색 결과 제공 방법
KR101462348B1 (ko) 모바일 메신저에 적용 가능한 태그를 이용한 재능 교환 및 공통 관심 사용자 매칭 시스템 및 그 방법
KR20130030434A (ko) 온라인 상에 게재된 웹 문서 기반 상권 분석 서비스 시스템 및 방법
US20140136517A1 (en) Apparatus And Methods for Providing Search Results
US20150348097A1 (en) Autocreated campaigns for hashtag keywords
Savino et al. MapRecorder: analysing real-world usage of mobile map applications
KR101816205B1 (ko) 인터넷 콘텐츠 제공 서버 및 그 방법이 구현된 컴퓨터로 판독 가능한 기록매체
van Driel et al. Promises and pitfalls of social media data donations
US11651039B1 (en) System, method, and user interface for a search engine based on multi-document summarization
KR20190058086A (ko) 행복큐레이션 서비스 기반 문화 생활 추천 방법 및 시스템
KR20130033520A (ko) 온라인 상에 게재된 웹 문서 기반 행사 이력 분석 시스템 및 방법
KR101486924B1 (ko) 소셜 네트워크 서비스를 이용한 미디어 콘텐츠 추천 방법
Kim et al. Recent research trends for geospatial information explored by Twitter data
KR20120064296A (ko) 감상평 검색을 통한 정보 제공 시스템 및 방법
Fensel et al. Bringing online visibility to hotels with Schema. org and multi-channel communication
KR20160131981A (ko) 온라인 상에 게재된 웹 문서 기반 행사 이력 분석 시스템 및 방법

Legal Events

Date Code Title Description
N231 Notification of change of applicant
A201 Request for examination
A107 Divisional application of patent
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment