KR20120070256A - 맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법 - Google Patents

맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법 Download PDF

Info

Publication number
KR20120070256A
KR20120070256A KR1020100131738A KR20100131738A KR20120070256A KR 20120070256 A KR20120070256 A KR 20120070256A KR 1020100131738 A KR1020100131738 A KR 1020100131738A KR 20100131738 A KR20100131738 A KR 20100131738A KR 20120070256 A KR20120070256 A KR 20120070256A
Authority
KR
South Korea
Prior art keywords
information
map
keywords
local
keyword
Prior art date
Application number
KR1020100131738A
Other languages
English (en)
Other versions
KR101221959B1 (ko
Inventor
권용진
Original Assignee
한국항공대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국항공대학교산학협력단 filed Critical 한국항공대학교산학협력단
Priority to KR1020100131738A priority Critical patent/KR101221959B1/ko
Publication of KR20120070256A publication Critical patent/KR20120070256A/ko
Application granted granted Critical
Publication of KR101221959B1 publication Critical patent/KR101221959B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

웹 문서에 포함된 다양한 지역정보들을 연결하여 지도에 표시함으로써 사용자의 정보획득에 대한 편의성을 도모하고 문화관광 정보를 효율적으로 제공할 수 있도록 한 맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법이 개시된다.
개시된 맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법은, 지역을 대표하는 대표 키워드를 추출하고, 상기 추출한 대표 키워드를 기반으로 웹으로부터 지역에 대한 다양한 문서들을 수집하여 그룹화하는 제1단계와; 상기 지역을 대표하는 고유지역 키워드를 추출하여 키워드들 간의 연관지식을 생성하는 제2단계와; 지리정보를 기반으로 상기 추출한 고유지역 키워드의 관련정보를 직관적으로 파악할 수 있도록 지도 기반의 인터페이스를 통해 통합적으로 지역정보를 제공해 주는 제3단계를 포함한다.

Description

맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법{An Integrated Region-Related Information Searching System applying of Map Interface and Knowledge Processing}
본 발명은 지역관련정보 통합검색에 관한 것으로서, 더욱 상세하게는 웹 문서에 포함된 다양한 지역정보들을 연결하여 지도에 표시함으로써 사용자의 정보획득에 대한 편의성을 도모하고 문화관광 정보를 효율적으로 제공할 수 있도록 한 맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법에 관한 것이다.
인터넷 기술의 발달과 사용자 중심의 웹 환경이 형성되면서, 웹을 통해 다양한 정보와 서비스를 쉽고 편리하게 제공받을 수 있게 되었다. 기존의 웹과는 달리 현재의 웹(web 2.0)은 사용자들의 협업, 공유, 참여를 중심으로 형성되어, 정보생산자가 일방적으로 정보를 생성하고 제공하던 이전의 웹보다 훨씬 더 많은 양의 정보가 존재하게 되었다.
이런 인터넷 환경의 변화와 함께 구글(Google), 네이버(NAVER)와 같은 대형포털에서 지도 기반의 다양한 서비스를 제공함에 따라, 현실 공간에 대한 사용자의 관심이 웹에서의 지역정보 획득으로 이어지고 있다. 실제로 맛집, 부동산, 구인구직, 교통, 축제/행사 등에 관한 지역정보는 서비스 제공자 및 사용자들을 통해 블로그, 백과사전, 뉴스, 이미지 등 다양한 형태로 생성되고 그 수가 폭발적으로 증가하고 있다. 이와 더불어 이런 지역정보들은 현재 대형포털을 중심으로 지도와 결합하여 제공되고 있다.
사용자가 현재의 웹을 통해 지역정보를 획득하고자 할 때에는 도 1과 같은 과정을 거치게 된다. 사용자는 일반적으로 검색 키워드를 생성하여 NAVER나 Google 등의 포털 사이트에 입력한다. 이때, 포털 사이트는 검색 결과 페이지에 검색어와 관련된 수많은 웹 문서들의 목록을 사용자에게 제공한다. 사용자는 제공된 목록에 표시된 링크를 통해 웹 문서들을 일일이 읽어보며 관련 지역정보를 직접 파악하고 종합해야 한다. 예를 들어, 지역에 대한 역사, 연혁, 문화재 정보 등은 웹페이지나 백과사전 등의 웹 문서를, 다른 사용자가 경험한 내용과 의견을 알고자 할 때는 블로그와 같은 문서를 따로 찾아서 읽어볼 것이다. 또한, 만약 문서 내에 지명이나 행사 개최지 등의 내용이 포함되어 있다면, 이에 대한 위치 정보는 추가로 지도 서비스를 통해 확인해야 한다.
기존의 지도 서비스를 이용한 지역정보제공 서비스에는, Google의 Google Maps가 있다. Google은 전 세계 지도 데이터를 기반으로 각국의 업체나 주소, 장소에 대한 검색을 지원한다. 사용자가 입력한 키워드를 중심으로 위치에 근거한 주변의 지역정보와 함께 사진, 동영상, 위키 백과 등이 지도에 표시되지만, 이때 지도에 표시되는 정보는 매우 단순하고 일차원적인 정보이다. 다시 말해, 하나의 콘텐츠와 하나의 위치(좌표) 정보가 일 대 일로 연결되어 있을 뿐, 해당 지역에 관련된 컨텐츠간 관련성을 판단하기는 어렵다. 또한, Google이라는 기업은 매우 광범위한 지역 즉, 세계 각국을 대상으로 수많은 정보를 취급하기 때문에, 어떤 특정한 지역에 대한 상세한 정보는 얻기가 힘들다.
국내 포털 업체의 지도 서비스는 Google의 지도 서비스보다는 상대적으로 상세한 국내 지역정보를 제공한다. NAVER나 다음(Daum)의 경우에 지도 서비스를 통해 지역의 명소나 주요 상점들의 주소, 전화번호, 대중교통 등을 알 수 있고, 도로교통상황도 실시간으로 확인할 수 있다. NAVER는 최근 부동산지도, 자전거 지도, 등산지도 등 주제별 지도를 제공하고 있으며, 지명 키워드가 포함된 관련 블로그와 카페 등의 웹콘텐츠를 상세 정보 페이지에서 함께 제공해준다.
또한, 지역정보제공 서비스로서, 인터넷 1인 미디어인 블로그가 있으며, 현재 NAVER, Daum, 야후(YAHOO) 등에서 서비스되고 있다. 블로그에는 개인의 소소한 일상이나 관심사에 대한 내용을 작성하는데, 특히 행사나 여행, 맛집 등에 관한 정보가 많이 포함된다. 이런 블로그에는 사용자 개개인의 경험과 생각, 느낌 등 다양한 주관적 내용이 기록되어 있고, 지명이나 상호 명 등과 같은 지리적인 데이터가 포함되어 있다. 하지만, 블로그 작성자는 자신이 방문한 곳의 위치나 주소를 이미 알고 있으므로 대부분이 그 해당 장소를 한눈에 파악할 수 있는 지도를 함께 제공하고 있지는 않다. 따라서, 해당 블로그를 공유하는 다른 사용자는 블로그에 기록된 지명이나 상호 명에 대해 지도를 통해 추가로 지리적인 정보를 확인해야 하는 불편함이 따르게 된다. 예를 들어, 도 2와 같이 "하나 투어 여행박람회"에 관한 블로그가 있다고 하자. 블로거는 자신의 경험을 기록하면서 해당 박람회가 개최된 장소가 '킨텍스'라는 것 또한 함께 기록하였다. 이때, 이 블로그를 공유한 다른 사용자는 포스트를 읽던 중 '킨텍스'에 대한 위치 정보를 파악하기 위해 추가로 지도 검색을 통해 킨텍스의 위치나 주소를 알 수 있게 된다.
한편, 지도 서비스를 이용한 지역정보제공 서비스로서, 한국항공대학교에서 개발한 경기21서치 시스템은, 사용자가 지역관련 웹 문서를 검색하고 해당 웹 문서를 지도와 비교하여 공간정보를 취득하며, 이를 반복적으로 수행해야 하는 기존의 지역정보 검색 서비스들의 한계를 해결하고자 개발된 시스템이다. 이 시스템은 지역관련 정보검색 과정을 단순화하기 위해, 웹 지리지역정보에 포함된 지리공간단어를 활용하고, 현재의 웹 공간으로부터 "현실?지식?응용"이라는 3-계층 공간 모델을 기반으로 하여 구현되었다. 사용자는 이 시스템을 사용하여 계층 간 정보가 관련성으로 연결된 연결 구조를 탐험하는 것만으로 웹 지리지역정보 및 지리적인 특성에 대한 다양한 관계 정보, 그리고 공간정보를 효율적으로 얻을 수 있다.
경기21서치 시스템은 연관 키워드를 제공하고 이를 지도기반으로 표현한다. 이때 이 시스템은 다양한 종류의 지역관련 정보를 일목요연하게 정리하여 제공하는 것에 대해서는 고려하고 있지 않다. 즉, 이 시스템에서는 정보를 키워드 형태로 요약하여 제공하고 이와 관련된 웹 문서들의 링크를 제공하는데, 통합된 지역정보를 제공하기 위해서는 더욱 다양한 종류의 정보들을 체계적으로 자동 정리하여 제공하는 것이 필요하다.
이상 살펴본 기존의 지도 서비스와 블로그 서비스는 아래와 같은 몇 가지 문제점을 도출하였다. 첫째는, 검색 결과의 웹 문서들을 하나씩 읽어보아야 하고, 웹에 각각 개별적으로 존재하는 다양한 정보들을 사용자가 스스로 분석하고 종합하는 번거로움이 수반된다는 것이다. 둘째, 지리정보는 지도를 통해 추가로 확인해야 하는 불편함이 존재하며, 셋째, 관련정보들을 얻기 위해 키워드를 입력하고 결과를 확인하는 검색 과정이 반복된다는 것이다.
따라서 사용자가 특정 지역의 관련 정보를 자세하고 종합적이며 손쉽게 획득할 수 있도록 지원하는 시스템이 필요하다.
이에 본 발명은 상기와 같은 기존 지역정보 제공시스템에서 발생하는 제반 문제점을 해소하고, 지역관련 정보에 대한 사용자들의 다양한 요구를 만족시킬 수 있는 지역포털 구축에 대한 필요성의 제기에 따라 제안된 것으로서,
본 발명이 해결하려는 과제는, 웹 문서에 포함된 다양한 지역정보들을 연결하여 지도에 표시함으로써 사용자의 정보획득에 대한 편의성을 도모하고 문화관광 정보를 효율적으로 제공할 수 있도록 한 맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법을 제공하는 데 있다.
본 발명이 해결하려는 다른 과제는, 다양한 형태(블로그. 사진 등)의 정보들을 통합하여 특정 장소에 대한 관련 정보 파악이 쉽고, 지리정보 획득을 위한 추가적인 검색 과정이 생략된 맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법을 제공하는 데 있다.
상기와 같은 과제들을 해결하기 위한 본 발명의 바람직한 실시 예에 따른 "맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법"은,
지역을 대표하는 대표 키워드를 추출하고, 추출한 대표 키워드를 기반으로 웹으로부터 지역에 대한 다양한 문서들을 수집하여 그룹화하는 제1단계와;
상기 지역을 대표하는 고유지역 키워드를 추출하여 키워드들 간의 연관지식을 생성하는 제2단계와;
지리정보를 기반으로 상기 추출한 고유지역 키워드의 관련정보를 직관적으로 파악할 수 있도록 지도 기반의 인터페이스를 통해 통합적으로 지역정보를 제공해주는 제3단계를 포함하는 것을 특징으로 한다.
상기 제1단계의 다양한 문서들은,
해당 지역에 대한 블로그, 뉴스, 사전, 웹 문서, 지역민의 참여 정보, 항공 사진, 수치지도, GIS데이터를 포함하는 것을 특징으로 한다.
상기 제2단계의 지역을 대표하는 고유지역 키워드 추출은,
문화유적 및 문화시설을 지역을 대표하는 고유지역 키워드로 추출하는 것을 특징으로 한다.
상기 제2단계의 연관지식 생성은,
수집한 웹 문서의 태그를 제거하고, 태그가 제거된 웹 문서를 분석(parsing)하여 텍스트를 추출하는 단계와;
상기 추출한 텍스트에 대한 형태소를 분석하는 단계와;
연관 키워드를 추출하는 단계와;
추출한 연관 키워드의 연관도를 계산하는 단계를 포함한다.
상기 연관도 계산은 유사도 행렬을 이용하여 계산하는 것을 특징으로 한다.
상기 제3단계의 추출한 고유지역 키워드의 관련정보는,
추출한 고유지역 키워드를 중심으로 연관 키워드를 재구성하여 관련정보로 제공해주는 것을 특징으로 한다.
상기 제3단계의 지도 기반의 인터페이스는,
문화적, 역사적 사실을 기반으로 한 객관적 지역정보와 사용자의 경험이나 의견에 기반한 주관적 지역정보를 함께 제공해주는 것을 특징으로 한다.
여기서 주관적 지역정보는, 블로그 정보를 포함하는 것을 특징으로 한다.
상기 객관적 지역정보는,
백과사전, 뉴스, 이미지, 군지 정보를 포함하는 것을 특징으로 한다.
상기 제3단계는,
고유지역 키워드 간의 관련성은 지도에 표시해주고, 상기 고유지역 키워드를 제외한 키워드 간의 관련성은 지도 표시 영역을 제외한 영역에 표시해주는 것을 특징으로 한다.
또한, 상기 제3단계의 지도 기반의 인터페이스는,
위치나 거리에 근거한 관련성과 의미론적 관련성을 함께 제공해주는 것을 특징으로 한다.
본 발명에 따르면, 지자체가 제공하는 생활지역정보 서비스 및 지역포털 등과 같이 특정 지역에 특화된 지역정보서비스 내에서 사용자 및 정보 제공자가 생성한 정보를 통합하여 제공하므로, 웹 공간상의 여러 곳에 분리되어 있는 정보들로는 얻을 수 없는 부가가치가 발생하여, 지자체 경쟁력의 향상이 가능하고, 지역민의 정보활동을 통한 삶의 질을 향상시킬 수 있는 장점이 있다.
또한, 본 발명에 따르면, 지리정보 획득을 위한 추가적인 검색 과정이 불필요하므로, 사용자에게 검색의 편의성을 제공해주는 장점이 있다.
또한, 본 발명에 따르면, 웹 문서에 포함된 다양한 지역정보들을 연결하여 지도에 표시함으로써, 사용자의 정보획득에 대한 편의성을 도모할 수 있는 장점이 있다.
도 1은 일반적인 웹 환경에서의 지역정보 획득과정을 보인 개념도.
도 2는 기존 블로그 서비스의 예시도.
도 3은 본 발명에 따른 맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법이 적용되는 시스템의 개념도.
도 4는 본 발명에 따른 맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법에 대한 흐름도.
도 5는 본 발명을 적용한 예시도.
도 6은 고양시 수치지도 예시도.
도 7은 본 발명에서 주관적 지역정보 처리과정을 보인 설명도.
도 8은 본 발명에서 맵 인터페이스의 예시도.
도 9-(1)은 사용자 인터페이스 첫 화면 예시도이고, 도 9-(2)는 '행주산성선택시 화면 예시도이다.
도 10은 맵 인터페이스에 표시되는 데이터들의 변화도.
이하 본 발명의 바람직한 실시 예를 첨부한 도면에 의거 상세히 설명하면 다음과 같다. 본 발명을 설명하기에 앞서 관련된 공지 기능 혹은 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그에 대한 상세한 설명은 생략한다.
도 3은 본 발명에 따른 맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법이 적용되는 시스템의 개념도로서, 웹에 존재하는 다양한 형태의 수많은 지역 정보를 지식 처리를 통해 종합하고 선별하여, 사용자가 특정 지역의 관련 정보를 획득하고자 할 때, 맵 인터페이스를 기반으로 효율적인 서비스 제공을 돕기 위한 모델이다. 개별적으로 존재하는 지역정보들을 그룹화한 '지역정보 웹 문서 Layer', 키워드 간의 의미론적 연관지식이 생성되는 '고유지역키워드 Layer', 의미론적 관련성으로 연결된 키워드들을 맵(map)에 표시해주는 '맵 인터페이스 Layer'의 3-Layer로 구성된다.
이러한 개념의 본 발명에 따른 맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법이 적용되는 시스템은, 수치지도와 지자체 홈페이지를 이용하여 지역을 대표하는 고유지역정보를 생성하고, 이를 이용하여 관련 웹 문서, 블로그, 이미지, 백과사전 등의 다양한 형태의 웹 페이지들을 수집한 후, 각 웹 페이지들에 대해 형태소 분석, 연관 키워드 추출 및 연관도 계산 등을 통해 연관키워드를 생성하고 이를 고유지역 키워드와 연결하여 연관지식을 생성하게 된다. 이후 관련정보를 사용자가 직관적으로 파악할 수 있도록 지도 기반의 사용자 인터페이스를 제공해주게 된다. 여기서 사용자 인터페이스는 객관적 지역정보와 주관적 지역정보를 통합하여 지역정보를 제공해줌으로써, 사용자가 자세한 정보를 획득할 수 있도록 하며, 한번에 관련정보를 제공해줌으로써 사용자에게 정보 검색의 편리함을 제공해준다.
이러한 본 발명의 개념을 달성하기 위한 시스템은, 인터넷 등이 가능한 통신모듈과 정보처리기능이 가능한 제어장치를 구비한 퍼스널컴퓨터를 이용하며, 제어장치는 항공사진, 수치지도, 지리정보(GIS데이터)를 이용하게 된다.
도 4는 본 발명의 바람직한 실시 예에 따른 "맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법"을 보인 흐름도로서, 지역을 대표하는 대표 키워드를 추출하고, 추출한 대표 키워드를 기반으로 웹으로부터 지역에 대한 다양한 문서들을 수집하여 그룹화하는 제1단계(S100)와; 상기 지역을 대표하는 고유지역 키워드를 추출하여 키워드들 간의 연관지식을 생성하는 제2단계(S200)와; 지리정보를 기반으로 상기 추출한 고유지역 키워드의 관련정보를 직관적으로 파악할 수 있도록 지도 기반의 인터페이스를 통해 통합적으로 지역정보를 제공해주는 제3단계(S300)로 이루어진다.
이와 같이 이루어진 본 발명에 따른 "맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법"은, 먼저 제1단계(S100)로서 지역을 대표하는 대표 키워드를 추출하고(S101), 추출한 대표 키워드를 기반으로 웹으로부터 지역에 대한 다양한 문서들을 수집하여 그룹화하게 된다(S103).
본 발명에서는 지역정보를 '고유지역정보'와 '일반지역정보'로 구분한다. 지역정보를 지도에 매핑하기 위해서는 지역정보가 '위치'정보를 포함하고 있어야 한다. 문화시설(도서관, 공공체육시설 등), 문화유적(문화재, 사찰, 산성 등)은 위치(소재지)가 반드시 있고, 지역축제나 행사에도 개최되는 장소 정보가 존재한다. 이와 동시에 특정 지역을 특징짓는 정보를 포함한다면 그 지역정보는 지도의 해당 위치에 매핑될 수 있는데, 본 발명에서는 이를 '고유지역정보'라 한다. 예를 들면, 지역축제/행사, 문화재, 문화시설 정보 등과 같이 특정 지역에 특화된 정보가 고유지역정보이다. '일반지역정보'는 고유지역정보가 아닌 지역정보로서, 어느 지역에 대해서도 존재하는 일반적인 지역정보이다. 예를 들어, 고양시에는 고양시청, 고양경찰서가 있고, 김포시에는 김포시청, 김포경찰서가 있는데, 이런 시설에 대한 정보들은 특정 지역을 특징짓는다고 할 수 없다. 이런 의미에서 일반지역정보는 주로 관공서나 학교, 학원 등의 교육기관, 그리고 병원, 은행과 같은 업체 정보들을 포함한다.
도 3의 지역정보 웹 문서 Layer는 위와 같은 정의를 바탕으로, 지역정보를 포함하는 웹 문서들을 문서 형태별(백과사전, 블로그, 이미지, 동영상 등)로 관련 있는 지역정보끼리 그룹화하는 Layer이다. 예를 들어, '행주산성'이라는 백과사전 항목과 '행주산성 해맞이 2만명 운집'이라는 뉴스 기사, 그리고 '행주산성 맛집'이라는 제목의 블로그는 동일한 지역정보로 그룹화될 수 있다. 이렇게 관련된 웹 문서끼리 그룹화하고 문서 형태별로 구분함으로써, 백과사전, 뉴스 기사, 블로그 등 다양한 형태의 지역정보들을 효율적으로 처리하여 사용자에게 제공할 수 있다.
다음으로, 제2단계(S200)에서는 상기 지역을 대표하는 고유지역 키워드를 추출하여(S201), 키워드 간의 연관지식을 생성하게 된다(S203).
관련 있는 지역정보들을 같은 형태의 웹 문서별로 그룹화한 지역정보 웹 문서 Layer의 각 그룹들은 각각 특정 지역 관련 키워드로 대표될 수 있다. 예를 들어, 행주산성과 관련된 웹 문서들은 '행주산성'이라는 키워드로 대표될 수 있다. 이와 같이 '북한산', '일산호수공원' 등도 고양시를 대표하며 특징짓는 키워드가 될 수 있다. 이때, 이런 키워드는 실생활 공간의 특정 위치(좌표)에 매핑될 수 있는 것을 고려한다. 이는 제안하는 모델에서 지역관련 정보를 효율적으로 표시하기 위하여 맵 인터페이스를 이용하기 때문이다. 즉, 본 발명에서는 이처럼 관련 고유지역정보들의 그룹을 대표할 수 있으면서 실생활 공간의 특정 위치(좌표)에 매핑될 수 있는 키워드를 '고유지역키워드'라고 정의한다.
고유지역키워드 Layer에서는 고유지역정보를 대표하는 고유지역 키워드 간의 의미론적 연관지식이 생성된다. 먼저, 고유지역 키워드의 추출을 위해 웹 문서, 지도 플랫폼 등을 분석하여 고유지역 키워드 후보 집합을 추출한다. 그리고 고유지역 키워드 집합을 생성한 후, 키워드 간의 연관성을 계산하고 이로부터 새로운 지식을 만들어낸다. 예를 들어, '행주산성'과 '북한산성'은 산성이라는 관련성이 있다는 것을 쉽게 알 수 있지만, 시스템적으로 이를 유추해내기는 어렵다. 이는 기존의 지도 서비스들이 지도상에 표시하는 정보가 대부분 단순히 위치나 거리에 근거한 정보에 불과하기 때문이다. 고유지역 키워드 생성 및 의미 있는 관련지식을 생성하는 방법에 대해서는 후술하기로 한다.
다음으로, 제3단계(S300)에서는 지리정보를 기반으로 상기 추출한 고유지역 키워드의 관련정보를 직관적으로 파악할 수 있도록 지도 기반의 인터페이스를 통해 통합적으로 지역정보를 제공해주게 된다.
'맵 인터페이스 Layer'는 고유지역 키워드 간의 관련성을 지도를 기반으로 표현하는 Layer로, 사용자가 선택한 고유지역 키워드를 중심 키워드로 하여 그와 연관성이 높은 키워드들을 지도의 실제 위치(좌표)에 매핑한다. 사용자가 맵 인터페이스에 매핑되어 표시되는 키워드 중 '행주산성'이라는 고유지역 키워드를 선택했다고 하자. 이때, 지역정보 웹 문서 Layer에 존재하는 문서 중에서 행주산성으로 그룹화되어 있는 문서들이 선택되고, 고유지역 키워드 Layer에서는 행주산성과 연관있는 고유지역 키워드 중 상위에 랭크되어있는 키워드들이 선택된다. 선택된 문서들과 연관 키워드들은 최종적으로 지도상에 표현된다. 그리고 이 Layer에서 중심 키워드와 함께 지도에 매핑되는 키워드들은 어떤 흥미로운 연관관계를 갖는 키워드들이다.
맵 인터페이스 Layer에서 지도를 기반으로 정보를 표현한 것은 정보 획득의 직관성을 보장한다. 지도에 표현되는 정보들은 시각적인 측면에서 한눈에 파악될 수 있어서, 사용자의 종합적인 판단에 도움을 준다. 또한, 문서 내에 지명이나 행사 개최지 등의 내용이 포함되어 있는 경우, 위치 정보에 대한 추가적인 검색이 필요하지 않다.
이상과 같은 본 발명의 특징을 실시 예를 들어 구체적으로 설명하면 다음과 같다.
예를 들어, 경기도 고양시 지역관련 정보를 제공하는 통합검색 서비스를 본 발명에서 제안한 모델을 적용하면, 도 5와 같은 4단계의 과정으로 구현할 수 있다.
즉, (1) 특정 지역을 대표할 수 있는 키워드들을 추출하고, (2) 관련 웹 페이지들을 수집한 후 연관 키워드 집합을 추출한다. 다음, (3) 연관지식생성 알고리즘을 적용하여 키워드 간의 연관도를 계산한다. 마지막으로, (4) 사용자가 직관적으로 파악할 수 있도록 지도를 활용한 사용자 인터페이스를 구축한다. 제안한 시스템 모델과 관련하여, (1), (3) 과정은 고유지역 키워드 Layer, (2) 과정은 지역정보 웹 문서 Layer, (4) 과정은 맵 인터페이스 Layer에 해당한다.
먼저, 첫 단계는 고유지역 정보로부터 고유지역 키워드들을 획득하기 위해, 고양시의 문화재, 문화시설, 행정기관, 산 등의 명칭을 고양시 수치지도에서 추출하는 과정이다. 그리고 추출된 단어들을 고양시청 홈페이지에서 추출된 단어들과 비교하여 최종 고유지역 키워드 집합을 획득한다.
구체적인 방법은 다음과 같다. 먼저, 수치지도로부터 좌표로 매핑될 수 있는 키워드들을 추출한다. 수치지도는 지리 공간정보를 항목(layer)별로 구분하여 데이터베이스화하고 이용 목적에 따라서 지도를 자유로이 작성할 수 있도록 전산화한 지도이다. 수치지도의 각 객체는 일괄적으로 정해진 표준코드로 분류되기 때문에 그 코드를 기준으로 고양시 관련 단어를 추출할 수 있다. 도 6은 고양시 수치지도 1099개 중 일산구 장항동 일산호수공원 주변이 포함된 수치지도 파일이다. 일부분을 확대해보면 '일산구', '장항동', '장항2동' 등의 텍스트가 해당 위치에 매핑되어 있음을 볼 수 있다. 이처럼 수치지도를 분석하고 코드별로 분류된 시설물 등의 텍스트 정보를 통해 고양시에 관련된 4614개의 단어를 추출하였다.
이렇게 추출된 단어들은 본 발명에서 정의한 고유지역 키워드를 포함하고 있지만, 고유지역 키워드가 아닌 키워드도 포함하고 있다. 이는 고양시 수치지도가 고양시 전체에 대해 좌표로 매핑될 수 있는 모든 시설물 정보를 담고 있어서, 고양시를 특징짓는 단어들 외의 단어들도 다수 포함하고 있기 때문이다. 그래서 본 발명에서는 고유지역 키워드만을 선별하기 위해 고양시청 홈페이지의 '문화관광' 안내페이지를 이용하였다. 이 페이지를 이용한 이유는, 일반적으로 어떤 특정 지역을 대표하는 사이트 중 가장 대표적인 것은 지자체 홈페이지이고, 이런 홈페이지는 대부분 해당 지역을 대표하는 정보를 다수 포함하고 있기 때문이다. 또한, 이런 시, 군 등의 관공서 홈페이지는 공공성이 강해서 보다 명확하고 객관적인 내용의 정보 전달이 이루어지기 때문에 신뢰도가 높다고 볼 수 있다. 고양시청 홈페이지의 '문화관광' 안내페이지에서는 '문화행사/축제', '문화유적/볼거리', '문화시설' 등의 카테고리로 구분된 각각의 페이지로부터 관련 단어를 추출할 수 있다. 이렇게 추출된 단어들과 수치지도로부터 추출한 단어들의 교집합을 취해 최종적으로 고양시 지역의 고유지역 키워드 133개를 획득하였다.
본 발명에서는 고유지역 키워드 추출을 위해 고양시청 홈페이지 내의 '문화관광' 안내페이지만을 이용하였기 때문에, 비교적 정확하게 고유지역 키워드를 추출할 수 있다.
본 발명에서는 지역 정보를 주관적인 관점과 객관적인 관점의 정보로 구분하고 있다. 블로그는 주관적 지역정보로 분류하고, 그 외 지역관련 정보들을 포함하는 백과사전, 뉴스, 이미지 등의 웹 문서를 객관적 지역정보로 분류한다. 여기서 블로그를 주관적 지역정보로 분류한 이유는, 시스템 구현 과정에서 블로그에 기록된 사용자 개개인의 경험과 주관적인 생각, 느낌 등 다양한 내용 중 자주 기록되는 키워드로 표현하여 이를 다른 사용자들과 공유할 수 있도록 하기 위함이다. 관련 웹 문서는 네이버 open API를 사용하여 수집하였다. 네이버 open API는 네이버가 가진 각종 데이터, 콘텐츠, 서비스 등을 이용할 수 있도록 공개한 인터페이스이며, 이를 통해 다양한 Mash-up 서비스가 개발될 수 있다.
객관적인 지역정보를 수집하기 위해 백과사전, 뉴스, 이미지, 기타 웹 문서 등에 대해 각 고유지역 키워드를 쿼리(query)로 한 검색결과의 링크들을 수집한다. 그리고 수집된 링크를 통해 웹 문서를 저장하고 텍스트만을 다시 추출해낸다. 이로부터 문서에 포함된 고유지역키워드의 출현 빈도 등을 알 수 있게 되는데 이후 연관도 계산 과정에서 지도에 표시되는 10개의 연관 키워드를 선정하는데 이용된다. 또한, 백과사전이나 뉴스 등으로부터 얻을 수 없는 고양시의 상세 정보는 고양군지 데이터를 활용하여 객관적 지역정보를 보충한다.
주관적 지역정보에 속하는 블로그에 대해서도 마찬가지로 네이버 open API를 이용해 링크를 수집하고, 각 링크로부터 문서의 텍스트만을 추출한다. 추출된 텍스트는 도 7과 같이, 태그제거, 형태소분석(명사 추출), 일반명사 제거 등의 과정을 거쳐 명사형태의 연관 키워드 집합을 생성한다. 다음으로, 생성된 명사 집합에서 고양시 관련 키워드만을 추출하는 작업이 필요하다. 기존의 검색엔진 검색 결과의 신뢰도를 바탕으로, 생성된 명사 집합 내의 모든 단어들을 검색 엔진에 쿼리로 전송하여 검색 결과 페이지에 그 쿼리와 '고양시'나 '고양'이란 단어가 일정횟수 이상 함께 발견되면 고양시 지역 관련 키워드로 판단하였다. 이 키워드들은 맵 인터페이스에서 중심에 있는 키워드와의 연관도 계산에 이용된다.
본 발명은 사용자가 선택한 키워드와 가장 관련도가 높은 고유지역 키워드 10개를 지도에 표시하여 그 관련성을 나타낸다. 또한, 관련도가 높은 연관 키워드 10개를 블로그 문서로부터 추출하여 함께 제공한다. 이때 어떤 두 개의 키워드가 관련이 있다고 판단하는 기준은 '같은 문서에 출현한다'라는 공기성이다. 키워드 간의 관련성 판단에는 데이터마이닝 기법들을 이용하는데, 여기서는 연관규칙과 유사도 행렬 두 가지 방법을 적용한 데이터의 결과를 살펴본다.
연관 규칙은 데이터마이닝의 대표적인 기술로 백화점이나 슈퍼마켓에서 함께 구매한 물건들에 관한 연관성을 찾아내는 기술이다. 여기서 '함께 구매했다'라는 것을 트랜잭션(transaction)이라고 부르는데, 우리가 다루는 데이터의 각각의 원소는 장바구니에 들어있는 항목(상품)들이라 할 수 있다. 이때 하나의 장바구니에 포함된 데이터 집합을 트랜잭션이라 한다. 연관 규칙은 일정 지지도 이상의 규칙들을 대상으로, 한 페이지에 여러 번 출현하더라도 모두 1회로 간주하는 데이터마이닝 기법이다. 이것은 상품 구매자의 장바구니에 담겨있는 상품 각각의 개수보다는 어떤 상품들을 같이 구매하는가에 초점을 맞추기 때문에, 하나의 웹 페이지에 여러 번 출현하는 키워드의 출현횟수는 무시된다. 또한, 일반적으로 연관 규칙은 보편타당한 경우에 적용될 수 있지만, 본 발명에서 구현하고자 하는 시스템은 '지역성'을 다루는 특수한 경우이므로 적절한 방법이 아니다.
유사도 행렬은 '두 단어가 공기하는 문서의 수'와 같은 단어 간 관련도를 나타낼 수 있다. 우선 문서 dj에 색인어 wi가 몇 번 출현하는지 빈도를 측정하여 행렬 mij를 만들고, mij의 전치 행렬 mij t를 만들어 두 행렬의 곱 s=mij×mij t를 만든다. 행렬 s의 각 요소는 두 단어가 같은 문서에 얼마나 많이 출현했는가를 나타내는 척도이다. 웹 문서와 키워드를 이용하여 만든 행렬 mij은 대부분의 요소가 0인 희소행렬이다. 따라서, 행렬의 요소가 0이 아닌 것끼리만 계산하여 메모리의 사용과 계산량을 큰 폭으로 줄일 수 있다. k개의 문서와 l개의 색인어를 이용해 행렬을 만들고 연관도를 계산하는 방법은 다음과 같다.
① 문서 dj에 색인어 wi가 몇 번 출현하는지 빈도를 측정하여 행렬 mij를 만든다.
② 행렬 mt=mji를 만든다.
③ 연관도 계산 s=mij×mji
유사도 행렬은 한 페이지에 출현하는 키워드 횟수 정보를 이용하고 키워드-키워드 행렬을 생성하여 모든 키워드 간의 연관도를 계산한다. 같은 문서에 두 개의 키워드가 어느 정도의 빈도로 동시에 출현했는가 하는 것이 그 척도이며, 두 키워드가 많은 문서에 동시에 나타날수록 그 연관도가 높아지게 된다. 연관규칙과는 달리 각 문서에 나타나는 횟수도 관련성에 기여하므로, 여러 문서에 동시에 나타나는 횟수가 적더라도 한 문서에 많이 나타나면 높은 관련성을 갖게 되는 것이다.
본 발명에서 사용한 고유지역 키워드 간의 연관도 계산은 다음과 같다. 우선, 키워드-문서의 A행렬을 생성한다. A행렬의 행은 133개의 고유지역 키워드이고, 열은 관련 웹 문서 수집과정으로 수집된 각 문서들을 의미하며, 각 문서에 출현한 키워드의 빈도가 희소행렬로 생성된다. 다음으로, A행렬의 전치 행렬인 문서-키워드의 B행렬을 생성한다. B행렬의 행은 각각의 웹 문서이고 열은 고유지역 키워드이다. 키워드-키워드 행렬, 즉, A×B 행렬을 구하는 계산 방법은 다음과 같다. A행렬을 기록한 파일에는 하기의 [표 1]에 예를 든 것처럼 문서 번호 112, 1009, 2080 등과 같이 '행주산성'이 출현하는 문서에 대한 정보가 기록되어 있고, B행렬을 기록한 파일에는 문서에 출현하는 연관 키워드들의 출현 빈도가 기록되어 있다. 이때, A×B 행렬은 문서 번호 112, 1009, 2080 등과 같이 '행주산성'이 출현하는 문서만 읽어들이고, 그 문서에 출현하는 다른 키워드의 출현 빈도 수와 곱을 하여 연관도를 계산한다.
'행주산성'이 출현하는 문서 정보
문서번호 출현 빈도 문서번호 출현 빈도
112 2 4568 5
1009 3 5871 12
2080 1 10551 3
'행주산성', '북한산', '일산호수공원'과 같은 고양시의 고유지역 키워드는 문화, 역사, 또는 지리적 의미를 갖는다. 또한, 웹 페이지에서 이런 고유지역 키워드들과 함께 출현하는 키워드 역시 유사한 의미가 있을 확률이 높다. 예를 들어 '북한산'의 경우, 웹 페이지에서 동시에 출현하는 고유지역 키워드들의 목록은 아래와 같다.
북한산성, 국녕사, 노적사, 태고사, 무량사, 상운사, 흥국사, 행주산성, 서삼릉, 호수공원
위와 같은 관련 키워드들은 '북한산'이 해당 문서에서 상대적으로 높은 빈도로 출현할 때, 더 많은 횟수로 출현하게 된다. 이는 그 문서 자체가 문화?역사?지리적 특수성을 반영하고 있기 때문이다. 이때 국녕사, 노적사, 북한산성 등은 기존의 지도서비스를 통해서도 북한산과 지리적으로 가까운 곳에 위치하여 있으므로, 지리적으로 관련성이 있음을 직관적으로 추측할 수가 있다. 주목할 만한 것은 북한산과 거리상으로 약 20km 떨어져 있는 호수공원과의 관련성이 드러난다는 점이다. 이처럼 유사도 행렬을 이용하면, 거리에 근거한 관련성뿐만 아니라 직관적으로 쉽게 유추하기 어려운 이런 흥미로운 연관관계를 생성해낼 수 있다. 다른 예로서, 홍릉-중남미문화원, 행주산성-호수공원, 고양아람누리-목암미술관 등의 의미 있는 연관 지식 들이 창출된다.
주관적 지역정보인 블로그의 텍스트 처리과정을 통해 추출된 연관 키워드 집합에 대해서도, 마찬가지로 A×B 행렬을 구하는 계산 방법을 이용한다. 이때 A행렬의 행은 연관 키워드들이고, 열은 그 키워드들이 포함된 문서이며, B행렬은 A행렬의 전치 행렬이 된다. 유사도 행렬을 이용한 연관도 계산 과정을 거쳐 고유지역 키워드 각각에 대해 관련도가 높은 연관 키워드부터 순위를 매긴 후, 상위 10개 키워드를 맵 인터페이스의 좌측에 표시하여 사용자들의 지역정보 종합 및 획득을 용이하게 한다.
한편, 현재 구현된 시스템상에서 일괄적으로 한 번에 진행되지는 않지만, 각 장에 해당하는 프로세스는 각각 자동으로 진행된다. 즉, 웹 문서 수집 및 연관 키워드 추출과정은 한 번에 자동 실행되며, 연관도 계산 과정도 마찬가지로 자동 실행된다. 그러므로 자동화의 측면에서는 현재의 시스템으로도 최신의 검색결과를 보장할 수 있다.
사용자 인터페이스는 이렇게 처리된 관련 지역 정보를 직관적으로 파악할 수 있도록 하기 위해 지도를 활용한다. JavaScript, JSP, XML, MySQL(DB) 등으로 구현하고 AJAX 기술을 활용하여 작성한다. AJAX 기술을 활용하면 페이지의 이동 없이도 원하는 데이터를 가져올 수 있고, 별도의 프로그램 설치도 필요하지 않다.
사용자가 지도에서 어떤 키워드를 선택하면 해당 키워드를 중심으로 그와 관련된 상위 10개의 고유지역 키워드를 지도상에 다시 마커로 표시한다. 이때 마커를 클릭하는 것만으로도 연결된 모든 관련 정보의 획득이 가능한데, 이는 사용자의 정보 검색 편리성을 높인다. 지도 좌우측의 지역정보들은 해당 정보를 클릭하면 관련 웹 페이지의 링크를 DB로부터 획득하여 화면에 나타낸다. 도 8은 사용자가 처음 서비스를 사용할 때 보이는 첫 화면이다. 본 발명이 로딩 되었을 때의 맨 처음 중심키워드는 고양시청이고, 고양시를 대표하는 고유지역 키워드들이 실제 위치와 매핑되어 지도상에 나타난다. 그 중에서도 고양시와 관련도가 높은 10개의 키워드는 중심 키워드와 선으로 연결되고 red 마커로 표시된다. 그리고 지도의 중심에 있는 고유지역 키워드에 대하여, 지도의 좌측에는 주관적 지역정보인 블로그로부터 추출된 연관 키워드가, 우측에는 백과사전, 뉴스, 이미지, 군지 등의 객관적 지역정보가 배치된다.
사용자가 지도를 이용하여 특정 지역을 살펴볼 때, 공간 관련성과 공간 근접성이 높은 지명들은 대부분 근처에 밀집하여 보여진다. 이런 관련성은 단순히 지도를 보는 것만으로도 파악할 수 있다. 하지만, 본 발명에서 제시한 바와 같이 의미적으로 관련성이 높은 지명을 공간 근접성에 구애받지 않고 제공한다면, 지도상에서 '근처에 있기 때문에 단순히 보여지는 것' 이외에 비록 멀리 떨어져 있다 하더라도 그 관련성을 쉽게 파악할 수 없는 지명에 관한 관련성을 알아낼 수 있다. 또한, 지도상에 키워드가 마커와 함께 매핑되는데, 이 마커를 클릭하는 것만으로도 해당 지명 키워드와 연관도가 높은 다른 지명들의 위치를 쉽게 파악할 수 있으므로 검색 인터페이스 측면에서도 높은 유용성을 갖는다.
본 발명에서 구현한 실시 예 시스템을 Intel Xeon 2.66Hz(8 CPUs), 3.25GB RAM의 스펙을 갖는 Windows Server에서 운용하였다.
본 시스템의 동작과정을 상세히 살펴보면 다음과 같다. 도 9-(1)을 보면 중심 키워드인 '고양시청'과 선으로 연결되어 있는 행주산성, 북한산, 서오릉 등이 고양시를 가장 대표하는 키워드들임을 알 수 있다(①). 다음, 고양시청을 중심으로 한 첫 화면에서 오른쪽의 '백과사전'을 클릭(②)하고, '고양시'에 관련된 백과사전 항목들 중 '충장사(고양시)'를 선택하면 해당 페이지(③)를 확인할 수 있다. '행주산성'을 클릭(④)하면 도 9-(2)에 보이는 것처럼 고양시의 대표 키워드 중 하나인 행주산성을 중심으로 지도 영역 내의 키워드들이 재배치되고, 상위 10개의 연관 키워드들이 '행주산성'과 선으로 연결되어 표시된다(⑤). 이 상태에서 지도 우측의 '이미지'를 클릭(⑥)하면, '행주산성'의 이미지는 화면 우측에 10개씩 썸네일(thumbnail)로 표시되고, 각 이미지의 썸네일 클릭시 원본 크기의 이미지가 제공된다. 만약 지도의 좌측에 위치한 블로그 연관 키워드 중 행주산성과 '잔치국수'가 어떤 관련성이 있는지 궁금하여 '잔치국수' 키워드를 클릭(⑦)했을 때, 관련 블로그 하나를 선택(⑧)하고 해당 블로그 내용을 읽고나면, 행주산성에 유명한 원조국수집이 있음을 알 수 있다. 이것은 블로그들의 목록 중 '행주산성 원조국수집' 또는 '행주산성맛집/국수'라는 제목을 통해서도 짐작할 수 있게 된다. 도 10은 도 9에서 중심키워드가 '고양시'에서 '행주산성'으로 바뀌었을 때 맵 인터페이스에 표시되는 데이터들의 변화를 보여준다.
제안한 시스템은 기존의 서비스들이 갖는 한계를 다음과 같이 해결한다. 첫째, 본 발명에서 제안하는 시스템은, 웹상에 존재하는 다양한 종류의 정보들을 대상으로 사용자가 원하는 정보를 자동으로 종합하고 정리하여 제공하는 서비스를 제공한다. 예를 들어 사용자가 알고자 하는 특정 지명에 관한 블로그 정보를 지도 좌측에 연관 키워드로 선택하기만 하면 관련 블로그에 손쉽게 접근할 수 있다. 또한, 오른쪽에 백과사전, 뉴스, 이미지, 고양 군지 정보를 정리하여 보여준다. 이처럼 웹상의 다양한 형태의 정보들을 자동으로 통합/정리하고 관련성이 높은 정보를 사용자에게 제공함으로써, 웹에 개별적으로 존재하는 다양한 정보들을 사용자가 스스로 정리하고 종합하는 것을 줄일 수 있다. 둘째, 지도를 기반으로 지역정보를 제공함으로써 사용자가 검색하려는 대상을 지도상의 실제 위치에 표시함으로써, 추가적인 지리정보 검색을 줄일 수 있다. 셋째, 제안한 시스템은 사용자가 선택한 키워드와 의미적으로 관련성이 높은 지명/비지명 키워드를 연관도 계산 알고리즘을 통해 처리하고, 관련성이 높은 정보만을 선별하여 자동으로 제공한다. 또한, 지도상 관련성이 있는 고유지역 키워드 또는 지도 좌측 블로그 연관 키워드의 클릭만으로도 해당 지역정보를 쉽게 획득할 수 있으므로, 관련 정보들을 얻기 위해 일어나는 불필요한 키워드 입력을 줄일 수 있다.
추가로 본 발명에서 요구되는 사항은 다음과 같다. 첫째, 객관적 지역정보 중 '뉴스'나 '블로그'에 대한 정보가 현재는 정적인 정보라는 점이다. 예를 들어, 어떤 장소에서 개최되는 행사에 관한 최신 정보를 쉽게 파악할 수 없다는 것이다. 이것은 지역신문의 행사/축제 관련 기사들을 주기적으로 스크랩하고 분석하여 사용자들이 파악하기 쉬운 형태로 제공함으로써, 향후 실시간성이 반영된 정보 제공을 위한 연구의 수행을 통해 해결할 것이다. 둘째는 사용자들의 기호에 따라 메뉴 구성을 바꿀 수 있는 맞춤형 인터페이스에 대한 요구사항으로, 이는 사용자의 블로그, 백과사전, 뉴스 등의 정보 중 사용자가 원하는 정보만을 제공해주기 위한 방법론 연구를 통해 시스템을 추가 구현하여 해결할 수 있다.
이상 상술한 본 발명에 따르면, 사용자가 특정 지역의 관련 정보를 자세하고 종합적이며 손쉽게 획득할 수 있도록 지원하는 시스템의 제공을 위해 맵 인터페이스와 지식 처리를 활용하여 지역 관련정보를 통합 검색하는 3 계층의 시스템 모델을 제안한다. 그리고 제안한 모델을 기반으로, 고유지역 키워드들의 추출, 관련 웹 페이지 수집 및 연관 키워드 집합생성, 연관지식생성 알고리즘을 적용한 키워드 간의 연관도 계산, 지도를 활용한 사용자 인터페이스 제작의 4단계 구축방안을 제시하였다. 또한, 실제로 경기도 고양시 지역을 대상으로 하여 시스템을 구축하고 운용해봄으로써, 관련 지역정보 검색의 편의성, 직관적인 정보의 인식, 정보 형태별로의 검색용이, 종합적인 정보 판단 등의 측면에서 장점이 있음을 확인하였다. 이를 통해 제안한 모델과 유사도 행렬을 이용한 지역정보의 지식처리 알고리즘, 사용자의 검색 편의를 돕는 UI 등의 타당성을 검증하였다.
본 발명은 단순히 개별 '정보'로 존재하는 지역정보들을 융합하고, 새로운 '지식'을 생산 및 체계화하여 사용자들에게 제공해준다. 이를 통해 사용자는 다양하고 상세한 지역정보들을 제공받을 수 있고, 관련 정보도 쉽게 얻을 수 있게 된다.
본 발명은 상술한 특정의 바람직한 실시 예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변형실시가 가능한 것은 물론이고, 그와 같은 변경은 청구범위 기재의 범위 내에 있게 된다.

Claims (10)

  1. 지역을 대표하는 대표 키워드를 추출하고, 상기 추출한 대표 키워드를 기반으로 웹으로부터 지역에 대한 다양한 문서들을 수집하여 그룹화하는 제1단계와;
    상기 지역을 대표하는 고유지역 키워드를 추출하여 키워드들 간의 연관지식을 생성하는 제2단계와;
    지리정보를 기반으로 상기 추출한 고유지역 키워드의 관련정보를 직관적으로 파악할 수 있도록 지도 기반의 인터페이스를 통해 통합적으로 지역정보를 제공해 주는 제3단계를 포함하는 것을 특징으로 하는 맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법.
  2. 청구항 1에 있어서, 상기 제1단계의 다양한 문서들은,
    해당 지역에 대한 블로그, 뉴스, 사전, 웹 문서, 지역민의 참여 정보, 항공 사진, 수치지도, GIS데이터를 포함하는 것을 특징으로 하는 맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법.
  3. 청구항 1에 있어서, 상기 제2단계의 지역을 대표하는 고유지역 키워드 추출은,
    문화유적 및 문화시설을 지역을 대표하는 고유지역 키워드로 추출하는 것을 특징으로 하는 맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법.
  4. 청구항 1에 있어서, 상기 제2단계의 연관지식 생성은,
    수집한 웹 문서의 태그를 제거하고, 태그가 제거된 웹 문서를 분석(parsing)하여 텍스트를 추출하는 단계와;
    상기 추출한 텍스트에 대한 형태소를 분석하는 단계와;
    연관 키워드를 추출하는 단계와;
    추출한 연관 키워드의 연관 도를 계산하는 단계를 포함하는 것을 특징으로 하는 맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법.
  5. 청구항 4에 있어서, 상기 연관도 계산은 유사도 행렬을 이용하여 계산하는 것을 특징으로 하는 맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법.
  6. 청구항 1에 있어서, 상기 제3단계의 추출한 고유지역 키워드의 관련정보는,
    추출한 고유지역 키워드를 중심으로 연관 키워드를 재구성하여 관련정보로 제공해주는 것을 특징으로 하는 맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법.
  7. 청구항 6에 있어서, 상기 제3단계의 지도 기반의 인터페이스는,
    문화적, 역사적 사실을 기반으로 한 객관적 지역정보와 사용자의 경험이나 의견에 기반한 주관적 지역정보를 함께 제공해주는 것을 특징으로 하는 맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법.
  8. 청구항 7에 있어서, 상기 객관적 지역정보는,
    백과사전, 뉴스, 이미지, 군지 정보를 포함하는 것을 특징으로 하는 맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법.
  9. 청구항 7에 있어서, 상기 제3단계는,
    고유지역 키워드들 간의 관련성은 지도에 표시해주고, 상기 고유지역 키워드를 제외한 키워드들 간의 관련성은 지도 표시 영역을 제외한 영역에 표시해주는 것을 특징으로 하는 맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법.
  10. 청구항 9에 있어서, 상기 제3단계의 지도 기반의 인터페이스는,
    위치나 거리에 근거한 관련성과 의미론적 관련성을 함께 제공해주는 것을 특징으로 하는 맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법.
KR1020100131738A 2010-12-21 2010-12-21 맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법 KR101221959B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020100131738A KR101221959B1 (ko) 2010-12-21 2010-12-21 맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020100131738A KR101221959B1 (ko) 2010-12-21 2010-12-21 맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법

Publications (2)

Publication Number Publication Date
KR20120070256A true KR20120070256A (ko) 2012-06-29
KR101221959B1 KR101221959B1 (ko) 2013-01-15

Family

ID=46688159

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100131738A KR101221959B1 (ko) 2010-12-21 2010-12-21 맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법

Country Status (1)

Country Link
KR (1) KR101221959B1 (ko)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103149548A (zh) * 2013-01-31 2013-06-12 重庆市电力公司电力科学研究院 一种基于电能计量装置的信息显示方法和装置
KR20150110322A (ko) * 2015-02-17 2015-10-02 주식회사 비아이스트라 생태 관광 정보 제공 방법
KR20180079919A (ko) * 2017-01-03 2018-07-11 고려대학교 산학협력단 사물인터넷에 기반한 경험 공유 방법 및 장치
CN110472066A (zh) * 2019-08-07 2019-11-19 北京大学 一种城市地理语义知识图谱的构建方法
KR102129877B1 (ko) * 2019-12-06 2020-07-03 강상현 데이터분석기술기반 온라인 관광기념품지원시스템
KR20200117691A (ko) * 2019-04-05 2020-10-14 연세대학교 산학협력단 공간 지식 베이스 기반의 집단 키워드 질의 처리 방법 및 장치
KR102178621B1 (ko) * 2020-03-13 2020-11-13 조민수 다종 장비의 통합 관제 시스템
KR20200139995A (ko) * 2019-06-05 2020-12-15 연세대학교 산학협력단 공간 지식 그래프를 이용하여 공간 엔티티의 지역 유사성을 측정하는 장치 및 방법
WO2022177268A1 (ko) * 2021-02-18 2022-08-25 한국전자기술연구원 파편적 데이터 통합 장치 및 방법

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101527646B1 (ko) * 2013-08-14 2015-06-09 한영수 공공 지리정보시스템의 데이터를 이용하여 공간정보 획득방법 및 이를 위한 장치

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080026948A (ko) * 2006-09-22 2008-03-26 숭실대학교산학협력단 연관 키워드 그룹 추출 방법

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103149548A (zh) * 2013-01-31 2013-06-12 重庆市电力公司电力科学研究院 一种基于电能计量装置的信息显示方法和装置
KR20150110322A (ko) * 2015-02-17 2015-10-02 주식회사 비아이스트라 생태 관광 정보 제공 방법
KR20180079919A (ko) * 2017-01-03 2018-07-11 고려대학교 산학협력단 사물인터넷에 기반한 경험 공유 방법 및 장치
KR20200117691A (ko) * 2019-04-05 2020-10-14 연세대학교 산학협력단 공간 지식 베이스 기반의 집단 키워드 질의 처리 방법 및 장치
KR20200139995A (ko) * 2019-06-05 2020-12-15 연세대학교 산학협력단 공간 지식 그래프를 이용하여 공간 엔티티의 지역 유사성을 측정하는 장치 및 방법
CN110472066A (zh) * 2019-08-07 2019-11-19 北京大学 一种城市地理语义知识图谱的构建方法
CN110472066B (zh) * 2019-08-07 2022-03-25 北京大学 一种城市地理语义知识图谱的构建方法
KR102129877B1 (ko) * 2019-12-06 2020-07-03 강상현 데이터분석기술기반 온라인 관광기념품지원시스템
KR102178621B1 (ko) * 2020-03-13 2020-11-13 조민수 다종 장비의 통합 관제 시스템
WO2022177268A1 (ko) * 2021-02-18 2022-08-25 한국전자기술연구원 파편적 데이터 통합 장치 및 방법

Also Published As

Publication number Publication date
KR101221959B1 (ko) 2013-01-15

Similar Documents

Publication Publication Date Title
KR101221959B1 (ko) 맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법
Marine-Roig et al. Tourism analytics with massive user-generated content: A case study of Barcelona
JP4637969B1 (ja) ウェブページの主意,およびユーザの嗜好を適切に把握して,最善の情報をリアルタイムに推奨する方法
Chuang et al. Enabling maps/location searches on mobile devices: Constructing a POI database via focused crawling and information extraction
US8670617B2 (en) Systems and methods for linking content to individual image features
Zhang et al. How are tourists different?-Reading geo-tagged photos through a deep learning model
US20100198627A1 (en) System and method for implementing bible based travel
WO2015018247A1 (zh) 事件多维度信息显示装置和方法
Cai et al. Mining mobility patterns from geotagged photos through semantic trajectory clustering
WO2016162843A1 (en) Processing a search query and retrieving targeted records from a networked database system
Tulić Ceballos The impact of Web 3.0 technologies on tourism information systems
Ning et al. Seeing is visiting: discerning tourists’ behavior from landmarks in ordinary photos
KR20200014589A (ko) 지역 기반 아이템 추천 장치 및 방법
KR100572751B1 (ko) 웹 기반의 지리정보 검색 시스템
Lin et al. Displaying spatial epistemologies on web GIS: using visual materials from the Chinese local gazetteers as an example
TW201730832A (zh) 行程規劃之操作方法
JP7090779B2 (ja) 情報処理装置、情報処理方法及び情報処理システム
Schindling et al. Deepening historical GIS: an integrated database solution for linking people, place and events through unstructured text
Almendros Jiménez et al. The retrieval of social network data for points-of-interest in OpenStreetMap
US11568004B2 (en) Comparative search within user-generated content
Viana et al. Mobile photo recommendation and logbook generation using context-tagged images
Oliveira et al. Gazetteer enrichment for addressing urban areas: A case study
Liu et al. Review of the development of digital earth research during 1998–2015 based on a bibliometric analysis
Bui Automatic construction of POI address lists at city streets from geo-tagged photos and web data: a case study of San Jose City
Perera et al. Smart Maps through Semantic Web, Social Media, and Sentiment Analysis

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20170103

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20171206

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20190708

Year of fee payment: 7