KR101094511B1 - 웹 문서를 이용하여 설문조사용 질의문의 결과를 획득하는 시스템 - Google Patents

웹 문서를 이용하여 설문조사용 질의문의 결과를 획득하는 시스템 Download PDF

Info

Publication number
KR101094511B1
KR101094511B1 KR1020090112265A KR20090112265A KR101094511B1 KR 101094511 B1 KR101094511 B1 KR 101094511B1 KR 1020090112265 A KR1020090112265 A KR 1020090112265A KR 20090112265 A KR20090112265 A KR 20090112265A KR 101094511 B1 KR101094511 B1 KR 101094511B1
Authority
KR
South Korea
Prior art keywords
survey
query
word
questionnaire
evaluation element
Prior art date
Application number
KR1020090112265A
Other languages
English (en)
Other versions
KR20110055308A (ko
Inventor
박정호
Original Assignee
주식회사 알에스엔
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 알에스엔 filed Critical 주식회사 알에스엔
Priority to KR1020090112265A priority Critical patent/KR101094511B1/ko
Publication of KR20110055308A publication Critical patent/KR20110055308A/ko
Application granted granted Critical
Publication of KR101094511B1 publication Critical patent/KR101094511B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 웹 문서를 이용하여 설문조사용 질의문의 결과를 획득하는 시스템에 관한 것으로서, 더욱 자세하게는 오프라인으로 진행되는 설문조사의 대상선정 및 설문조사에 소요되는 시간을 대폭 단축시킬 수 있으며, 이를 통해 설문조사 결과를 얻기 위해서 상당한 시간이 걸리는 종래의 설문조사 방식을 사용할 수 없는 긴급 이슈에 대한 실시간 설문조사가 가능한 웹 문서를 이용하여 설문조사용 질의문의 결과를 획득하는 시스템에 관한 것이다.
본 발명인 웹 문서를 이용하여 설문조사용 질의문의 결과를 획득하는 시스템은,
인터넷에서 작성된 글을 실시간으로 수집하는 웹로봇과;
상기 수집된 텍스트 기반의 데이터를 분석이 용이하도록 인덱싱하는 검색엔진과;
설문조사에 포함되는 질의문을 수신받아 등록하는 질의문등록부와;
상기 설문조사에 포함되는 질의문을 분석하여 범위를 한정할 수 있는 주제어와 내용을 분류할 평가요소를 추출하는 질의어분석부와;
상기 질의어 분석시 사용되는 평가요소를 저장하고 있는 분석사전디비;를 포함하여 구성되는 것을 특징으로 한다.
본 발명을 통해 온라인을 통하여 설문조사의 질의문에 관한 설문조사 결과를 획득할 수 있도록 함으로써, 오프라인으로 진행되는 설문조사의 대상선정 및 설문 조사에 소요되는 시간을 대폭 단축시켜 설문조사 결과를 얻기 위해서 상당한 시간이 걸리는 종래의 설문조사 방식을 사용할 수 없는 긴급 이슈에 대한 실시간 설문조사가 가능한 효과를 제공하게 된다.
설문 조사, 웹 로봇, 정보수집, 질의문.

Description

웹 문서를 이용하여 설문조사용 질의문의 결과를 획득하는 시스템{acquirement system of result for questionnaires using web document.}
본 발명은 웹 문서를 이용하여 설문조사용 질의문의 결과를 획득하는 시스템에 관한 것으로서, 더욱 자세하게는 오프라인으로 진행되는 설문조사의 대상선정 및 설문조사에 소요되는 시간을 대폭 단축시킬 수 있으며, 이를 통해 설문조사 결과를 얻기 위해서 상당한 시간이 걸리는 종래의 설문조사 방식을 사용할 수 없는 긴급 이슈에 대한 실시간 설문조사가 가능한 웹 문서를 이용하여 설문조사용 질의문의 결과를 획득하는 시스템에 관한 것이다.
사회 이슈나 제품 또는 정당의 지지도에 대한 여론의 동향을 파악하기 위한 방법 중에 하나로 주로 이용되는 방법으로는 표본추출을 통한 설문조사가 있다.
상기한 설문조사를 위해 미리 질문을 선별하고, 통상적으로 5개의 보기를 마련한다.
질문을 객관식으로 선정하는 이유는 조사결과에 대한 통계를 작성하여 설문 응답자의 여론을 수치화하기 위해서이다.
또한, 사회 이슈 또는 제품에 대한 추가적인 의견을 조사할 필요가 있을 경우에는 몇 개의 주관식 답안을 마련하는 경우도 있다.
한편, 설문조사의 대상을 선정하는 과정도 매우 중요한 부분이다.
조사대상이 되는 이슈 및 제품과 관련된 인원을 선정해야 하며, 편파적인 결과가 나오지 않도록 지역/연령/성별의 분포를 고르게 하여야 한다.
또한, 특수 목적을 위해 제한된 지역/성별/연령에 대해서 설문조사를 시행하는 경우도 있었다.(예를 들어, 화장품에 대한 설문조사는 도시/20~30대/여성에 대해서만 조사할 수 있다.)
일반적으로 설문조사는 대면, 유선, 우편 등을 통해서 이루어지며, 이렇게 조사된 결과는 취합하여 통계를 작성하게 된다.
따라서, 종래 오프라인 설문조사의 경우, 오프라인으로 설문조사를 시행함으로 인해 다소의 기간이 소요되기 때문에 시급성을 요하는 이슈에 대한 여론파악 및 대응에 활용하기에 부적합 면이 있었다.
왜냐하면, 설문조사를 위해 설문지를 작성하고, 표본 대상을 추출하고, 조사를 시행하고 조사 결과를 분석하는데 최소 4~5일 가량이 소요되기 때문에 일 단위로 이슈 발생하고, 이슈의 주제가 변화하는 현실과 비추어 보면 다소 늦는 단점이 있기 때문이며, 설문조사의 결과가 나올 시점에는 이미 다른 이슈가 확산되고 있는 경우가 대다수이기 때문이다.
또한, 설문조사 대상의 선정 방법이 지역/성별/연령을 감안하여 무작위 대상 에게 설문조사를 시행하는 경우가 대부분인데, 이는 개인의 관심도와 관계없이 설문 대상을 선별하게 되므로 설문조사 결과의 신뢰도에 보이지 않는 영향을 미치게 된다.
즉,설문조사 내용에 대하여 전혀 관심이 없는 사람을 대상으로 실시한 설문의 결과에 어느 정도의 신뢰도를 주어야 할지, 이를 전체적인 여론의 동향으로 인정해야 할지 판단하기 힘들기 때문이다.
결론적으로 여론파악의 도구로서 거의 유일하게 사용되고 있는 대면, 유선, 우편등의 오프라인 설문조사 방식의 문제점을 해결할 수 있는 기술을 요구하게 되었다.
본 발명은 상기와 같은 문제점들을 해결하기 위하여 창안된 것으로, 본 발명의 목적은 온라인을 통하여 설문조사의 질의문에 관한 설문조사 결과를 획득할 수 있도록 하여 오프라인으로 진행되는 설문조사의 대상선정 및 설문조사에 소요되는 시간을 대폭 단축시켜 설문조사 결과를 얻기 위해서 상당한 시간이 걸리는 종래의 설문조사 방식을 사용할 수 없는 긴급 이슈에 대한 실시간 설문조사가 가능하도록 하는데 있다.
본 발명의 다른 목적은 종래의 설문조사시 건별로 비용이 발생되는 문제점을 개선하여 본 시스템 구축에 따른 다양한 주제/제품에 대하여 반복적인 여론조사를 실시 할 수 있도록 하는데 있다.
본 발명의 또 다른 목적은 설문조사의 결과 도출 시간을 대폭 단축시킴으로 인하여 보다 빠르고 적절한 여론 대응을 가능하게 함으로써, 여론 대응에 대한 결과로 여론이 변화하는 추이까지 분석할 수 있도록 하는데 있다.
상기와 같은 목적을 달성하기 위하여 본 발명인 웹 문서를 이용하여 설문조사용 질의문의 결과를 획득하는 시스템은,
인터넷에서 작성된 글을 실시간으로 수집하는 웹로봇과;
상기 수집된 텍스트 기반의 데이터를 분석이 용이하도록 인덱싱하는 검색엔 진과;
설문조사에 포함되는 질의문을 수신받아 등록하는 질의문등록부와;
상기 설문조사에 포함되는 질의문을 분석하여 범위를 한정할 수 있는 주제어와 내용을 분류할 평가요소를 추출하는 질의어분석부와;
상기 질의어 분석시 사용되는 평가요소를 저장하고 있는 분석사전디비;를 포함하여 구성되어 본 발명의 과제를 해결하게 된다.
본 발명인 웹 문서를 이용하여 설문조사용 질의문의 결과를 획득하는 시스템은 온라인을 통하여 설문조사의 질의문에 관한 설문조사 결과를 획득할 수 있도록 함으로써, 오프라인으로 진행되는 설문조사의 대상선정 및 설문조사에 소요되는 시간을 대폭 단축시켜 설문조사 결과를 얻기 위해서 상당한 시간이 걸리는 종래의 설문조사 방식을 사용할 수 없는 긴급 이슈에 대한 실시간 설문조사가 가능한 효과를 제공하게 된다.
또한, 종래의 설문조사시 건별로 비용이 발생되는 문제점을 개선하여 본 시스템 구축에 따른 다양한 주제/제품에 대하여 반복적인 여론조사를 실시할 수 있게 되어 설문조사 비용을 대폭 감소시킬 수 있게 된다.
또한, 종래의 설문조사에 소요되는 시간이 대폭 줄어들게 되고, 이로 인해 보다 빠르고 적절한 여론 대응을 가능하게 하며, 여론 대응에 대한 결과로 여론이 변화하는 추이까지 분석할 수 있는 확장성을 제공하게 된다.
이하 첨부된 도면을 참조하여 본 발명의 웹 문서를 이용하여 설문조사용 질의문의 결과를 획득하는 시스템의 구성을 실시 예에 따라 자세히 설명하면 다음과 같다.
본 발명의 일실시예에 따른 웹 문서를 이용하여 설문조사용 질의문의 결과를 획득하는 시스템은,
인터넷에서 작성된 글을 실시간으로 수집하는 웹로봇과;
상기 수집된 텍스트 기반의 데이터를 분석이 용이하도록 인덱싱하는 검색엔진과;
설문조사에 포함되는 질의문을 수신받아 등록하는 질의문등록부와;
상기 설문조사에 포함되는 질의문을 분석하여 범위를 한정할 수 있는 주제어와 내용을 분류할 평가요소를 추출하는 질의어분석부와;
상기 질의어 분석시 사용되는 평가요소를 저장하고 있는 분석사전디비;를 포함하여 구성되는 것을 특징으로 한다.
이때, 상기 질의어분석부는,
질의문을 구성하고 있는 모든 단어 중에서 모집단의 범주를 결정하기 위한 주제어를 추출하는 주제어추출모듈과,
질의문을 구성하고 있는 모든 단어 중에서 수집된 문서들을 평가하기 위한 평가요소를 추출하는 평가요소추출모듈과,
상기 평가요소추출모듈에 의해 평가요소가 추출되면 주제어추출모듈에 의해 추출된 주제어로 모집단을 검색하여 분석대상 문서를 추출하는 분석대상문서추출모듈과,
상기 추출된 분석대상 문서 중 평가요소의 하위분류 단어 혹은 보기의 단어별로 검색된 문서의 갯수를 카운트하는 문서갯수카운트모듈과,
하위분류 단어 혹은 보기의 단어에 대한 카운트 정보를 획득하는 카운트정보획득모듈을 포함하여 구성되는 것을 특징으로 한다.
이때, 상기 주제어추출모듈 및 평가요소추출모듈은,
각 단어를 형태소별로 분해하는 것을 특징으로 한다.
이때, 상기 평가요소추출모듈은,
질의문의 술부의 주체가 되는 단어를 평가요소로 선정하되, 질의문이 의문사를 포함하고 있다면 의문사의 주체가 되는 단어를 평가요소로 선정하는 것을 특징으로 한다.
이때, 상기 평가요소추출모듈은,
질의문에 보기가 있다면 이 보기들의 상위 단어를 분석사전디비를 참조하여 추출한 후 해당 질의문에서 검색하여 평가요소로 선정하는 것을 특징으로 한다.
이때, 상기 평가요소추출모듈은,
질의문에 보기가 없다면 분석사전디비를 참조하여 평가요소의 하위 단어 집합을 추출한 후 평가요소로 선정하는 것을 특징으로 한다.
이때, 상기 분석사전디비는,
평가요소의 상위 단어부터 하위 단어 집합을 저장하고 있는 것을 특징으로 한다.
이때, 상기 웹로봇의,
정보 수집 대상은 카페, 블로그 방식의 사이트 혹은 웹페이지인 것을 특징으로 한다.
도 1은 본 발명의 일 실시예에 따른 웹 문서를 이용하여 설문조사용 질의문의 결과를 획득하는 시스템의 전체 구성도이다.
도 1에 도시한 바와 같이, 본 발명인 웹 문서를 이용하여 설문조사용 질의문의 결과를 획득하는 시스템(100)은,
인터넷에서 작성된 글을 실시간으로 수집하는 웹로봇(110)과;
상기 수집된 텍스트 기반의 데이터를 분석이 용이하도록 인덱싱하는 검색엔진(120)과;
설문조사에 포함되는 질의문을 수신받아 등록하는 질의문등록부(130)와;
상기 설문조사에 포함되는 질의문을 분석하여 범위를 한정할 수 있는 주제어와 내용을 분류할 평가요소를 추출하는 질의어분석부(140)와;
상기 질의어 분석시 사용되는 평가요소를 저장하고 있는 분석사전디비(150);를 포함하여 구성되는 것을 특징으로 한다.
상기 웹로봇의 정보 수집 대상은 카페, 블로그 방식의 사이트 혹은 웹페이지인 것을 특징으로 하는데, 상기한 바와 같이 정보의 수집 대상은 카페, 블로그 등과 같은 네티즌이 직접 글을 작성할 수 있는 사이트 혹은 웹페이지로 제한할 수 있다.
또한, 상기 분석사전디비는 평가요소의 상위 단어와 하위 단어 집합을 저장하게 되며, 예를 들어, "정당"이라는 상위 단어는 "한나라당, 민주당, 민주 노동당, 진보신당, 자유 선진당 등의 하위단어의 집합과 연결된다.
상기 웹로봇을 통해 인터넷에서 작성된 글들을 실시간으로 수집하게 되며, 상기 수집된 텍스트 기반의 데이터를 빠른 분석이 용이하도록 검색엔진에 의해 인덱싱하게 된다.
상기 검색엔진을 통한 인덱싱 방법은 당업자들에게 널리 알려진 기술이므로 이에 대한 구체적인 설명은 생략하도록 한다.
상기 검색엔진을 통해 인덱싱된 데이터들은 별도의 데이터베이스(미도시)에 저장하고 관리하게 된다.
결론적으로 상기와 같은 구성은 웹로봇을 통해 수집된 웹문서(10)들은 데이터베이스에 저장되며, 사용자의 질의어 입력시 질의문으로부터 주제어와 평가요소를 추출하고, 이를 통해 역설문 조사를 수행하여 그 결과를 사용자에게 보여줄 수 있도록 결과프로그램을 본 발명의 시스템에 탑재하여 사용자의 단말기 화면에 출력하게 되는 것이다.
도 2는 본 발명의 일 실시예에 따른 웹 문서를 이용하여 설문조사용 질의문의 결과를 획득하는 시스템의 질의어분석부 블록도이다.
도 2에 도시한 바와 같이, 상기 질의어분석부(140)는,
질의문을 구성하고 있는 모든 단어 중에서 모집단의 범주를 결정하기 위한 주제어를 추출하는 주제어추출모듈(141)과,
질의문을 구성하고 있는 모든 단어 중에서 수집된 문서들을 평가하기 위한 평가요소를 추출하는 평가요소추출모듈(142)과,
상기 평가요소추출모듈에 의해 평가요소가 추출되면 주제어추출모듈에 의해 추출된 주제어로 모집단을 검색하여 분석대상 문서를 추출하는 분석대상문서추출모듈(143)과,
상기 추출된 분석대상 문서 중 평가요소의 하위분류 단어 혹은 보기의 단어별로 검색된 문서의 갯수를 카운트하는 문서갯수카운트모듈(144)과,
하위분류 단어 혹은 보기의 단어에 대한 카운트 정보를 획득하는 카운트정보획득모듈(145)을 포함하여 구성된다.
상기 주제어추출모듈 및 평가요소추출모듈은 각 단어를 형태소별로 분해하고 분해된 형태소 중에서 주제어추출모듈에 의해 주제어를 선별하고, 평가요소추출모듈에 의해 평가요소를 선별하게 된다.
본 발명에서 가장 특징적인 상기 평가요소추출모듈은 질의문의 술부의 주체가 되는 단어를 평가요소로 선정하되, 질의문이 의문사를 포함하고 있다면 의문사의 주체가 되는 단어를 우선적으로 평가요소로 선정하게 된다.
또한, 상기 평가요소추출모듈은 질의문에 보기가 있다면 이 보기들의 상위 단어를 분석사전디비를 참조하여 추출한 후 해당 질의문에서 검색하여 평가요소로 선정하는 것을 특징으로 하고 있다.
보기 1의 예를 들어 설명하도록 하겠다.
< 보기 1 >

질의문 : 현 국회의 파행사태는 어느 정당의 책임이 크다고 생각하십니까?(택1)

① 한나라당 ② 민주당 ③ 민주 노동당 ④ 자유 선진당 ⑤ 기타
상기와 같이 질의문의 보기를 통해 평가요소를 선정할 수 있다. 즉, "한나라당, 민주당, 민주 노동당, 자유 선진당"의 상위 단어인 "정당"을 평가요소로 선정하게 된다.
또한, 상기 평가요소추출모듈은 질의문에 보기가 없다면 분석사전디비를 참조하여 평가요소의 하위 단어 집합을 추출한 후 평가요소로 선정하게 된다.
보기 2의 예를 들어 설명하도록 하겠다.
< 보기 2 >

질의문 : 현 국회의 파행사태는 어느 정당의 책임이 크다고 생각하십니까?(단답형)
상기와 같이, 질의문의 보기 항목이 없을 경우에는 의문사의 주체를 평가요소로 설정할 수 있게 되는데, 의문사 "어느"의 주체가 되는 "정당"을 평가요소로 선정할 수 있으며, "정당"의 하위 단어 집합을 분석사전디비를 참조하여 추출하게 되면 "한나라당, 민주당, 민주 노동당, 자유 선진당"의 하위단어 집합이 조회되어 이를 평가요소로 선정할 수 있다.
상기와 같이 평가요소추출모듈에 의해 추출된 평가요소 이외의 질의문에 포함된 단어는 모집단을 범주화하는 키워드로 사용하게 된다.
본 발명에서 설명하고 있는 주제어는 질의문의 분석 결과로 도출되는 단어(또는 단어의 집합)로 질의문을 구성하고 있는 모든 단어 중에서 모집단의 범주를 결정하기 위해 사용되는 단어를 지칭하며, 주로 평가요소를 제외한 모든 단어가 주 제어로 선정된다.
예를 들어, "국회운영에 차질이 생기는 원인을 제공하는 정당은 어디라고 생각하십니까?"라는 질의문에서의 주제어는 "국회, 운영, 차질, 생기다, 원인, 제공"으로 주제어추출모듈을 통해 추출되게 된다.
또한, 평가요소는 질의문의 분석 결과로 도출되는 단어(또는 단어의 집합)로 질의문을 구성하고 있는 모든 단어 중에서 분석대상이 된 문서들을 평가하기 위해 사용되어 지는 단어로서 주로 마지막 술부의 주체가 되는 명사 내지는 의문사의 주체를 선정하게 된다.
예를 들어, "국회운영에 차질이 생기는 원인을 제공하는 정당은 어디라고 생각하십니까?"라는 질의문에서의 평가요소는 "정당"으로 평가요소추출모듈을 통해 추출되게 된다.
또한, 모집단은 웹사이트로부터 실시간 수집된 모든 웹문서들을 지칭한다.
도 3은 본 발명의 일 실시예에 따른 웹 문서를 이용하여 설문조사용 질의문의 결과를 획득하는 시스템의 평가요소추출모듈의 평가요소 선정 방법을 나타낸 흐름도이다.
도 3에 도시한 바와 같이, 평가요소추출모듈의 평가요소 선정은 보기가 있는 질의문일 경우에는 보기의 상위 단어를 선정하게 된다.
한편, 평가요소추출모듈의 평가요소 선정시 보기가 없고, 의문사가 있는 질의문일 경우에는 의문사의 주체를 선정하게 된다.
한편, 평가요소추출모듈의 평가요소 선정시 보기 및 의문사가 없는 질의문일 경우에는 최종 술어의 주체를 선정하게 된다.
보기 3의 예를 들어 설명하도록 하겠다.
< 보기 3 >

질의문 : 현 국회의 파행사태의 원인을 제공한 정당을 적으세요.(단답형)
상기와 같이, 보기 항목 및 의문사가 없을 경우에 최종 술어(적으세요)의 목적격의 위치인 "정당"을 평가요소로 선정할 수 있다.
도 4는 본 발명의 일 실시예에 따른 웹 문서를 이용하여 설문조사용 질의문의 결과를 획득하는 시스템의 동작 관계를 나타낸 흐름도이다.
도 4에 도시한 바와 같이, 본 발명인 웹 문서를 이용하여 설문조사용 질의문의 결과를 획득하는 시스템의 동작은,
본 발명의 시스템을 운영하는 웹사이트에 사용자가 로그인하여 질의문을 입력하게 되면 질의문등록부에 의해 설문조사에 포함되는 질의문을 수신받아 등록(S110)하게 된다.
상기 질의문등록부에 의해 등록된 질의문 정보는 별도의 질의문정보저장부(미도시)에 저장하게 되며, 웹로봇을 통해 인터넷에서 작성된 글을 실시간으로 수집(S120)하게 되며, 상기 수집된 텍스트 기반의 데이터를 분석이 용이하도록 검색엔진을 통해 인덱싱(S130)하게 된다.
이때, 질의어분석부의 주제어추출모듈(141)를 통해 질의문을 구성하고 있는 모든 단어 중에서 모집단의 범주를 결정하기 위한 주제어를 추출(S140)하게 되며, 평가요소추출모듈(142)에 의해 질의문을 구성하고 있는 모든 단어 중에서 수집된 문서들을 평가하기 위한 평가요소를 추출(S150)하게 된다.
상기 추출단계를 거친 후 분석대상문서추출모듈(143)에 의해 상기 평가요소추출모듈에 의해 평가요소가 추출되면, 주제어추출모듈에 의해 추출된 주제어로 모집단을 검색하여 분석대상 문서를 추출(S160)하게 되는 것이다.
상기 추출된 분석대상 문서 중 평가요소의 하위분류 단어 혹은 보기의 단어별로 검색된 문서의 갯수를 문서갯수카운트모듈(144)를 통해 카운트(S170)하게 된다.
보기 4의 예를 들어 설명하도록 하겠다.
< 보기 4 >

질의문 : 현 국회의 파행사태의 원인을 제공한 정당을 적으세요(단답형)

① 한나라당 ② 민주당 ③ 민주 노동당 ④ 자유 선진당 ⑤ 기타
도 5에 도시한 바와 같이, 선정된 주제어를 참조하여 모집단을 선정하게 되고 질의와 관련된 문서를 추출하게 되며, 평가요소인 " 한나라당, 민주당, 민주 노동당, 자유 선진당, 기타 정당별로 검색된 문서의 갯수를 카운트하게 된다.
예를 들어, 한나라당 관련 정보, 민주당 관련 정보, 민주 노동당 관련 정보, 자유 선진당 관련 정보등을 카운트하여 각각의 카운트 집계 결과를 제공하게 되는 것이다.
즉, 상기 하위분류 단어 혹은 보기의 단어에 대한 카운트 정보를 카운트정보획득모듈(145)을 통해 획득(S180)하여 사용자에게 보여줄 수 있는 결과프로그램에 카운트 정보를 제공하여 본 발명의 시스템에 접속된 사용자의 단말기 화면에 출력(S190)하게 되는 것이다.
결론적으로 상기와 같은 구성 및 동작을 통해 온라인을 통하여 설문조사의 질의문에 관한 설문조사 결과를 획득할 수 있도록 함으로써, 오프라인으로 진행되는 설문조사의 대상선정 및 설문조사에 소요되는 시간을 대폭 단축시켜 설문조사 결과를 얻기 위해서 상당한 시간이 걸리는 종래의 설문조사 방식을 사용할 수 없는 긴급 이슈에 대한 실시간 설문조사가 가능한 효과를 제공하게 된다.
이상에서와 같은 내용의 본 발명이 속하는 기술분야의 당업자는 본 발명의 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시 예들은 모든 면에서 예시된 것이며 한정적인 것이 아닌 것으로서 이해해야만 한다.
본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구 범위의 의미 및 범위 그리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
본 발명의 웹 문서를 이용하여 설문조사용 질의문의 결과를 획득하는 시스템은 온라인을 통하여 설문조사의 질의문에 관한 설문조사 결과를 획득할 수 있도록 함으로써, 오프라인으로 진행되는 설문조사의 대상선정 및 설문조사에 소요되는 시 간을 대폭 단축시켜 설문조사 결과를 얻기 위해서 상당한 시간이 걸리는 종래의 설문조사 방식을 사용할 수 없는 긴급 이슈에 대한 실시간 설문조사가 가능한 효과를 제공하게 되어 각종 오프라인 설문조사 방식을 대체할 것으로 예상된다.
도 1은 본 발명의 일 실시예에 따른 웹 문서를 이용하여 설문조사용 질의문의 결과를 획득하는 시스템의 전체 구성도이다.
도 2는 본 발명의 일 실시예에 따른 웹 문서를 이용하여 설문조사용 질의문의 결과를 획득하는 시스템의 질의어분석부 블록도이다.
도 3은 본 발명의 일 실시예에 따른 웹 문서를 이용하여 설문조사용 질의문의 결과를 획득하는 시스템의 평가요소추출모듈의 평가요소 선정 방법을 나타낸 흐름도이다.
도 4는 본 발명의 일 실시예에 따른 웹 문서를 이용하여 설문조사용 질의문의 결과를 획득하는 시스템의 동작 관계를 나타낸 흐름도이다.
도 5는 본 발명의 일 실시예에 따른 웹 문서를 이용하여 설문조사용 질의문의 결과를 획득하는 시스템의 카운트 집계의 예를 나타낸 예시도이다.
< 도면의 주요 부분에 대한 부호의 설명 >
100 : 본 발명의 시스템
110 : 웹로봇
120 : 검색엔진
130 : 질의문등록부
140 : 질의어분석부
150 : 분석사전디비

Claims (8)

  1. 인터넷에서 작성된 글을 실시간으로 수집하는 웹로봇과;
    상기 수집된 텍스트 기반의 데이터를 분석이 용이하도록 인덱싱하는 검색엔진과;
    설문조사에 포함되는 질의문을 수신받아 등록하는 질의문등록부와;
    질의문을 구성하고 있는 모든 단어 중에서 모집단의 범주를 결정하기 위한 주제어를 추출하되, 각 단어를 형태소별로 분해하는 주제어추출모듈과,
    질의문을 구성하고 있는 모든 단어 중에서 수집된 문서들을 평가하기 위한 평가요소를 추출하되, 각 단어를 형태소별로 분해하는 평가요소추출모듈과,
    상기 평가요소추출모듈에 의해 평가요소가 추출되면 주제어추출모듈에 의해 추출된 주제어로 모집단을 검색하여 분석대상 문서를 추출하는 분석대상문서추출모듈과,
    상기 추출된 분석대상 문서 중 평가요소의 하위분류 단어 혹은 보기의 단어별로 검색된 문서의 갯수를 카운트하는 문서갯수카운트모듈과,
    하위분류 단어 혹은 보기의 단어에 대한 카운트 정보를 획득하는 카운트정보획득모듈을 포함하여 구성되는 질의어분석부와;
    상기 질의어 분석시 사용되는 평가요소를 저장하고 있는 분석사전디비;를 포함하여 구성되되,
    상기 평가요소추출모듈은,
    질의문의 술부의 주체가 되는 단어를 평가요소로 선정하되, 질의문이 의문사를 포함하고 있다면 의문사의 주체가 되는 단어를 평가요소로 선정하며, 질의문에 보기가 있다면 이 보기들의 상위 단어를 분석사전디비를 참조하여 추출한 후 해당 질의문에서 검색하여 평가요소로 선정하며, 질의문에 보기가 없다면 분석사전디비를 참조하여 평가요소의 하위 단어 집합을 추출한 후 평가요소로 선정하는 것을 특징으로 하며,
    상기 분석사전디비는,
    평가요소의 상위 단어부터 하위 단어 집합을 저장하고 있는 것을 특징으로 하는 웹 문서를 이용하여 설문조사용 질의문의 결과를 획득하는 시스템.
  2. 삭제
  3. 삭제
  4. 삭제
  5. 삭제
  6. 삭제
  7. 삭제
  8. 삭제
KR1020090112265A 2009-11-19 2009-11-19 웹 문서를 이용하여 설문조사용 질의문의 결과를 획득하는 시스템 KR101094511B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020090112265A KR101094511B1 (ko) 2009-11-19 2009-11-19 웹 문서를 이용하여 설문조사용 질의문의 결과를 획득하는 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090112265A KR101094511B1 (ko) 2009-11-19 2009-11-19 웹 문서를 이용하여 설문조사용 질의문의 결과를 획득하는 시스템

Publications (2)

Publication Number Publication Date
KR20110055308A KR20110055308A (ko) 2011-05-25
KR101094511B1 true KR101094511B1 (ko) 2011-12-19

Family

ID=44364329

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090112265A KR101094511B1 (ko) 2009-11-19 2009-11-19 웹 문서를 이용하여 설문조사용 질의문의 결과를 획득하는 시스템

Country Status (1)

Country Link
KR (1) KR101094511B1 (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102093316B1 (ko) 2019-12-13 2020-03-25 한국건설기술연구원 제3자의 벤치마킹이 가능한 건축물 지도 플랫폼 시스템 및 이의 운용방법
KR102093315B1 (ko) 2019-12-13 2020-03-25 한국건설기술연구원 조사사항을 시각화하는 건축물 지도 플랫폼 시스템 및 이의 운용방법
KR20200067666A (ko) 2018-12-04 2020-06-12 주식회사 인스유틸 온라인 설문조사 및 보상 시스템 및 그 방법
KR20240037584A (ko) 2022-09-15 2024-03-22 한국건설기술연구원 거주 후 평가를 위한 공간정보 기반 온라인 설문조사 시스템 및 방법

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101583188B1 (ko) * 2014-10-13 2016-01-11 부산대학교 산학협력단 문제 사이트 발굴 방법 및 문제 사이트 발굴 시스템
KR102216581B1 (ko) 2019-07-26 2021-02-17 주식회사 인포플러스 인공지능을 이용한 설문 평가자 선정 방법 및 설문 시스템
KR102614812B1 (ko) 2021-09-15 2023-12-20 주식회사 마크로밀엠브레인 설문조사 지원시스템

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200067666A (ko) 2018-12-04 2020-06-12 주식회사 인스유틸 온라인 설문조사 및 보상 시스템 및 그 방법
KR102093316B1 (ko) 2019-12-13 2020-03-25 한국건설기술연구원 제3자의 벤치마킹이 가능한 건축물 지도 플랫폼 시스템 및 이의 운용방법
KR102093315B1 (ko) 2019-12-13 2020-03-25 한국건설기술연구원 조사사항을 시각화하는 건축물 지도 플랫폼 시스템 및 이의 운용방법
KR20240037584A (ko) 2022-09-15 2024-03-22 한국건설기술연구원 거주 후 평가를 위한 공간정보 기반 온라인 설문조사 시스템 및 방법

Also Published As

Publication number Publication date
KR20110055308A (ko) 2011-05-25

Similar Documents

Publication Publication Date Title
Batool et al. Precise tweet classification and sentiment analysis
KR101094511B1 (ko) 웹 문서를 이용하여 설문조사용 질의문의 결과를 획득하는 시스템
Bansal et al. On predicting elections with hybrid topic based sentiment analysis of tweets
Weller et al. Citation Analysis in Twitter: Approaches for Defining and Measuring Information Flows within Tweets during Scientific Conferences.
Jans et al. Skip n-grams and ranking functions for predicting script events
KR102075788B1 (ko) 빅 데이터를 활용한 건강정보 콘텐츠 추천 서비스 시스템
Ridout et al. Exploring the validity of electronic newspaper databases
Elsweiler et al. Understanding re-finding behavior in naturalistic email interaction logs
Liu et al. A text cube approach to human, social and cultural behavior in the twitter stream
Stede et al. The climate change debate and natural language processing
Rubbo et al. Citation of retracted articles in engineering: A study of the Web of Science database
Highfield Talking of many things: using topical networks to study discussions in social media
Heredia et al. Exploring the effectiveness of twitter at polling the united states 2016 presidential election
Demus et al. Detox: A comprehensive dataset for German offensive language and conversation analysis
Haustein et al. Using social bookmarks and tags as alternative indicators of journal content description
Chao Disciplinary reach: Investigating the impact of dataset reuse in the earth sciences
Zhao et al. Research on the impact evaluation of academic journals based on altmetrics and citation indicators
Altenburger et al. Is Yelp actually cleaning up the restaurant industry? A re-analysis on the relative usefulness of consumer reviews
Polcsik et al. Residents’ perceptions of sporting events: a review of the literature
Ding et al. It's time to confront fake news and rumors on social media: a bibliometric study based on VOSviewer
TW201640383A (zh) 網路事件自動蒐集分析方法及系統
Thapen et al. Towards Passive Political Opinion Polling using Twitter.
Soto et al. Data quality challenges in twitter content analysis for informing policy making in health care
Cherichi et al. Big data analysis for event detection in microblogs
Wang et al. Tracing digital footprints to academic articles: An investigation of PeerJ publication referral data

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20140926

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20150930

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20180920

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20190930

Year of fee payment: 9