KR101221959B1 - An Integrated Region-Related Information Searching System applying of Map Interface and Knowledge Processing - Google Patents

An Integrated Region-Related Information Searching System applying of Map Interface and Knowledge Processing Download PDF

Info

Publication number
KR101221959B1
KR101221959B1 KR1020100131738A KR20100131738A KR101221959B1 KR 101221959 B1 KR101221959 B1 KR 101221959B1 KR 1020100131738 A KR1020100131738 A KR 1020100131738A KR 20100131738 A KR20100131738 A KR 20100131738A KR 101221959 B1 KR101221959 B1 KR 101221959B1
Authority
KR
South Korea
Prior art keywords
information
map
keywords
local
keyword
Prior art date
Application number
KR1020100131738A
Other languages
Korean (ko)
Other versions
KR20120070256A (en
Inventor
권용진
Original Assignee
한국항공대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국항공대학교산학협력단 filed Critical 한국항공대학교산학협력단
Priority to KR1020100131738A priority Critical patent/KR101221959B1/en
Publication of KR20120070256A publication Critical patent/KR20120070256A/en
Application granted granted Critical
Publication of KR101221959B1 publication Critical patent/KR101221959B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Abstract

웹 문서에 포함된 다양한 지역정보들을 연결하여 지도에 표시함으로써 사용자의 정보획득에 대한 편의성을 도모하고 문화관광 정보를 효율적으로 제공할 수 있도록 한 맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법이 개시된다.
개시된 맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법은, 지역을 대표하는 대표 키워드를 추출하고, 상기 추출한 대표 키워드를 기반으로 웹으로부터 지역에 대한 다양한 문서들을 수집하여 그룹화하는 제1단계와; 상기 지역을 대표하는 고유지역 키워드를 추출하여 키워드들 간의 연관지식을 생성하는 제2단계와; 지리정보를 기반으로 상기 추출한 고유지역 키워드의 관련정보를 직관적으로 파악할 수 있도록 지도 기반의 인터페이스를 통해 통합적으로 지역정보를 제공해 주는 제3단계를 포함한다.
Integrated search method of local information using map interface and knowledge processing to improve user convenience and provide cultural tourism information by connecting various local information included in web documents and displaying them on a map This is disclosed.
The integrated search method for local information using the disclosed map interface and knowledge processing includes a first step of extracting a representative keyword representing a region and collecting and grouping various documents about the region from the web based on the extracted representative keyword; ; Extracting a unique region keyword representing the region to generate related knowledge between the keywords; And a third step of comprehensively providing local information through a map-based interface so as to intuitively grasp relevant information of the extracted unique region keyword based on geographic information.

Description

맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법{An Integrated Region-Related Information Searching System applying of Map Interface and Knowledge Processing}An integrated region-related information searching system applying of map interface and knowledge processing

본 발명은 지역관련정보 통합검색에 관한 것으로서, 더욱 상세하게는 웹 문서에 포함된 다양한 지역정보들을 연결하여 지도에 표시함으로써 사용자의 정보획득에 대한 편의성을 도모하고 문화관광 정보를 효율적으로 제공할 수 있도록 한 맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법에 관한 것이다.The present invention relates to integrated search of local information, and more particularly, by connecting various local information included in a web document and displaying it on a map, it is possible to facilitate user's information acquisition and efficiently provide cultural tourism information. The present invention relates to a method of integrated retrieval of local information using a map interface and knowledge processing.

인터넷 기술의 발달과 사용자 중심의 웹 환경이 형성되면서, 웹을 통해 다양한 정보와 서비스를 쉽고 편리하게 제공받을 수 있게 되었다. 기존의 웹과는 달리 현재의 웹(web 2.0)은 사용자들의 협업, 공유, 참여를 중심으로 형성되어, 정보생산자가 일방적으로 정보를 생성하고 제공하던 이전의 웹보다 훨씬 더 많은 양의 정보가 존재하게 되었다.With the development of internet technology and the formation of a user-oriented web environment, various information and services can be easily and conveniently provided through the web. Unlike the existing web, the current web (web 2.0) is formed around the collaboration, sharing, and participation of users, and there is a much larger amount of information than the previous web, where information producers unilaterally created and provided information. Was done.

이런 인터넷 환경의 변화와 함께 구글(Google), 네이버(NAVER)와 같은 대형포털에서 지도 기반의 다양한 서비스를 제공함에 따라, 현실 공간에 대한 사용자의 관심이 웹에서의 지역정보 획득으로 이어지고 있다. 실제로 맛집, 부동산, 구인구직, 교통, 축제/행사 등에 관한 지역정보는 서비스 제공자 및 사용자들을 통해 블로그, 백과사전, 뉴스, 이미지 등 다양한 형태로 생성되고 그 수가 폭발적으로 증가하고 있다. 이와 더불어 이런 지역정보들은 현재 대형포털을 중심으로 지도와 결합하여 제공되고 있다.With the change of the internet environment, the large portals such as Google and NAVER provide various map-based services, and the user's interest in the real space is leading to the acquisition of local information on the web. Indeed, local information on restaurants, real estate, jobs, traffic, festivals and events are generated in various forms such as blogs, encyclopedias, news, and images through service providers and users, and the number is exploding. In addition, such local information is currently provided in conjunction with maps around large portals.

사용자가 현재의 웹을 통해 지역정보를 획득하고자 할 때에는 도 1과 같은 과정을 거치게 된다. 사용자는 일반적으로 검색 키워드를 생성하여 NAVER나 Google 등의 포털 사이트에 입력한다. 이때, 포털 사이트는 검색 결과 페이지에 검색어와 관련된 수많은 웹 문서들의 목록을 사용자에게 제공한다. 사용자는 제공된 목록에 표시된 링크를 통해 웹 문서들을 일일이 읽어보며 관련 지역정보를 직접 파악하고 종합해야 한다. 예를 들어, 지역에 대한 역사, 연혁, 문화재 정보 등은 웹페이지나 백과사전 등의 웹 문서를, 다른 사용자가 경험한 내용과 의견을 알고자 할 때는 블로그와 같은 문서를 따로 찾아서 읽어볼 것이다. 또한, 만약 문서 내에 지명이나 행사 개최지 등의 내용이 포함되어 있다면, 이에 대한 위치 정보는 추가로 지도 서비스를 통해 확인해야 한다.When the user wants to acquire local information through the current web, the process goes to the process shown in FIG. Users typically generate search keywords and enter them into portal sites such as NAVER or Google. At this time, the portal site provides the user with a list of numerous web documents related to the search word on the search result page. The user should read through the web documents through the links provided in the list provided and identify and synthesize relevant local information. For example, the history, history, and cultural properties of the region will be read through web pages, such as web pages and encyclopedias, and blogs if you want to know what other users have experienced. In addition, if the document contains a place name or event venue, the location information should be further confirmed through the map service.

기존의 지도 서비스를 이용한 지역정보제공 서비스에는, Google의 Google Maps가 있다. Google은 전 세계 지도 데이터를 기반으로 각국의 업체나 주소, 장소에 대한 검색을 지원한다. 사용자가 입력한 키워드를 중심으로 위치에 근거한 주변의 지역정보와 함께 사진, 동영상, 위키 백과 등이 지도에 표시되지만, 이때 지도에 표시되는 정보는 매우 단순하고 일차원적인 정보이다. 다시 말해, 하나의 콘텐츠와 하나의 위치(좌표) 정보가 일 대 일로 연결되어 있을 뿐, 해당 지역에 관련된 컨텐츠간 관련성을 판단하기는 어렵다. 또한, Google이라는 기업은 매우 광범위한 지역 즉, 세계 각국을 대상으로 수많은 정보를 취급하기 때문에, 어떤 특정한 지역에 대한 상세한 정보는 얻기가 힘들다.The local information service using the existing map service is Google Maps of Google. Google supports searches for businesses, addresses, and places around the world based on global map data. Photographs, videos, Wikipedia, etc. are displayed on the map with local information based on the location based on the keyword entered by the user, but the information displayed on the map is very simple and one-dimensional information. In other words, only one content and one location (coordinate) information is connected one-to-one, and it is difficult to determine the relevance between the contents related to the region. In addition, the company Google handles a lot of information in a very wide area, that is, around the world, so it's hard to get detailed information about any particular area.

국내 포털 업체의 지도 서비스는 Google의 지도 서비스보다는 상대적으로 상세한 국내 지역정보를 제공한다. NAVER나 다음(Daum)의 경우에 지도 서비스를 통해 지역의 명소나 주요 상점들의 주소, 전화번호, 대중교통 등을 알 수 있고, 도로교통상황도 실시간으로 확인할 수 있다. NAVER는 최근 부동산지도, 자전거 지도, 등산지도 등 주제별 지도를 제공하고 있으며, 지명 키워드가 포함된 관련 블로그와 카페 등의 웹콘텐츠를 상세 정보 페이지에서 함께 제공해준다.Domestic portal companies' map service provides relatively detailed domestic local information rather than Google's map service. In the case of NAVER or Daum, the map service can show the address, phone number, public transportation, etc. of local attractions, major stores, and road traffic conditions in real time. NAVER recently provides thematic maps such as real estate maps, bicycle maps, mountain climbing maps, and web contents such as related blogs and cafes including place names keywords, and detailed information pages.

또한, 지역정보제공 서비스로서, 인터넷 1인 미디어인 블로그가 있으며, 현재 NAVER, Daum, 야후(YAHOO) 등에서 서비스되고 있다. 블로그에는 개인의 소소한 일상이나 관심사에 대한 내용을 작성하는데, 특히 행사나 여행, 맛집 등에 관한 정보가 많이 포함된다. 이런 블로그에는 사용자 개개인의 경험과 생각, 느낌 등 다양한 주관적 내용이 기록되어 있고, 지명이나 상호 명 등과 같은 지리적인 데이터가 포함되어 있다. 하지만, 블로그 작성자는 자신이 방문한 곳의 위치나 주소를 이미 알고 있으므로 대부분이 그 해당 장소를 한눈에 파악할 수 있는 지도를 함께 제공하고 있지는 않다. 따라서, 해당 블로그를 공유하는 다른 사용자는 블로그에 기록된 지명이나 상호 명에 대해 지도를 통해 추가로 지리적인 정보를 확인해야 하는 불편함이 따르게 된다. 예를 들어, 도 2와 같이 "하나 투어 여행박람회"에 관한 블로그가 있다고 하자. 블로거는 자신의 경험을 기록하면서 해당 박람회가 개최된 장소가 '킨텍스'라는 것 또한 함께 기록하였다. 이때, 이 블로그를 공유한 다른 사용자는 포스트를 읽던 중 '킨텍스'에 대한 위치 정보를 파악하기 위해 추가로 지도 검색을 통해 킨텍스의 위치나 주소를 알 수 있게 된다.In addition, as a local information providing service, there is a blog, which is an Internet media media, and is currently being serviced by NAVER, Daum, Yahoo. A blog writes about a person's small daily life or interests, and includes a lot of information about events, travel, and restaurants. These blogs contain a variety of subjective content, including personal experiences, thoughts, and feelings, and include geographic data such as place names and business names. However, blog writers already know the location or address of the site they visited, and most don't provide a map that gives them an overview. Therefore, the other users sharing the blog is inconvenient to additionally confirm the geographical information through a map for the name or business name recorded in the blog. For example, suppose that there is a blog about "Hana Tour Expo" as shown in FIG. The blogger also recorded his experiences and also noted that the venue where the fair was held was 'KINTEX'. At this time, other users who have shared this blog will be able to know the location or address of the KINTEX through a map search to find the location information of the KINTEX while reading the post.

한편, 지도 서비스를 이용한 지역정보제공 서비스로서, 한국항공대학교에서 개발한 경기21서치 시스템은, 사용자가 지역관련 웹 문서를 검색하고 해당 웹 문서를 지도와 비교하여 공간정보를 취득하며, 이를 반복적으로 수행해야 하는 기존의 지역정보 검색 서비스들의 한계를 해결하고자 개발된 시스템이다. 이 시스템은 지역관련 정보검색 과정을 단순화하기 위해, 웹 지리지역정보에 포함된 지리공간단어를 활용하고, 현재의 웹 공간으로부터 "현실·지식·응용"이라는 3-계층 공간 모델을 기반으로 하여 구현되었다. 사용자는 이 시스템을 사용하여 계층 간 정보가 관련성으로 연결된 연결 구조를 탐험하는 것만으로 웹 지리지역정보 및 지리적인 특성에 대한 다양한 관계 정보, 그리고 공간정보를 효율적으로 얻을 수 있다.On the other hand, as a local information providing service using a map service, Gyeonggi 21 search system developed by Korea Aerospace University, the user searches for local web documents and compares the web documents with a map to obtain spatial information, and repeatedly This system was developed to solve the limitations of existing local information retrieval services that should be performed. The system utilizes geospatial words included in web geospatial information to simplify the process of searching for local information and is based on a three-tier spatial model called "reality, knowledge, and application" from the current web space. It became. By using this system, users can efficiently obtain web georegional information, various relational information about geographic characteristics, and spatial information simply by exploring the connection structure in which information between layers is related.

경기21서치 시스템은 연관 키워드를 제공하고 이를 지도기반으로 표현한다. 이때 이 시스템은 다양한 종류의 지역관련 정보를 일목요연하게 정리하여 제공하는 것에 대해서는 고려하고 있지 않다. 즉, 이 시스템에서는 정보를 키워드 형태로 요약하여 제공하고 이와 관련된 웹 문서들의 링크를 제공하는데, 통합된 지역정보를 제공하기 위해서는 더욱 다양한 종류의 정보들을 체계적으로 자동 정리하여 제공하는 것이 필요하다. The Competition 21 Search System provides related keywords and expresses them on a map basis. The system does not consider providing various kinds of regional information at a glance. In other words, the system summarizes the information in the form of keywords and provides links to related web documents. In order to provide integrated local information, it is necessary to systematically and automatically organize various types of information.

이상 살펴본 기존의 지도 서비스와 블로그 서비스는 아래와 같은 몇 가지 문제점을 도출하였다. 첫째는, 검색 결과의 웹 문서들을 하나씩 읽어보아야 하고, 웹에 각각 개별적으로 존재하는 다양한 정보들을 사용자가 스스로 분석하고 종합하는 번거로움이 수반된다는 것이다. 둘째, 지리정보는 지도를 통해 추가로 확인해야 하는 불편함이 존재하며, 셋째, 관련정보들을 얻기 위해 키워드를 입력하고 결과를 확인하는 검색 과정이 반복된다는 것이다.The existing map service and blog service discussed above have drawn several problems as follows. First, it is necessary to read the web documents of the search results one by one, and the user is troublesome to analyze and synthesize various pieces of information that exist individually on the web. Second, there are inconveniences that the geographic information needs to be additionally checked through the map. Third, the search process is repeated to enter keywords and check results in order to obtain related information.

따라서 사용자가 특정 지역의 관련 정보를 자세하고 종합적이며 손쉽게 획득할 수 있도록 지원하는 시스템이 필요하다.
Therefore, there is a need for a system that enables a user to acquire detailed, comprehensive and easy information related to a specific region.

이에 본 발명은 상기와 같은 기존 지역정보 제공시스템에서 발생하는 제반 문제점을 해소하고, 지역관련 정보에 대한 사용자들의 다양한 요구를 만족시킬 수 있는 지역포털 구축에 대한 필요성의 제기에 따라 제안된 것으로서,Accordingly, the present invention has been proposed in accordance with the need for building a local portal that can solve various problems occurring in the existing local information providing system as described above and satisfy various demands of users for local related information.

본 발명이 해결하려는 과제는, 웹 문서에 포함된 다양한 지역정보들을 연결하여 지도에 표시함으로써 사용자의 정보획득에 대한 편의성을 도모하고 문화관광 정보를 효율적으로 제공할 수 있도록 한 맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법을 제공하는 데 있다.The problem to be solved by the present invention is the map interface and knowledge processing to connect the various local information included in the web document to display on a map to facilitate the user's information acquisition and to efficiently provide cultural tourism information It is to provide an integrated search method for local information.

본 발명이 해결하려는 다른 과제는, 다양한 형태(블로그. 사진 등)의 정보들을 통합하여 특정 장소에 대한 관련 정보 파악이 쉽고, 지리정보 획득을 위한 추가적인 검색 과정이 생략된 맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법을 제공하는 데 있다.
Another problem to be solved by the present invention is to integrate information of various forms (blogs, photos, etc.) to easily grasp relevant information about a specific place, and utilize a map interface and knowledge processing, which eliminates an additional search process for obtaining geographic information. It is to provide an integrated search method for local information.

상기와 같은 과제들을 해결하기 위한 본 발명의 바람직한 실시 예에 따른 "맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법"은,According to a preferred embodiment of the present invention for solving the above problems, "local area information integrated search method using a map interface and knowledge processing",

지역을 대표하는 대표 키워드를 추출하고, 추출한 대표 키워드를 기반으로 웹으로부터 지역에 대한 다양한 문서들을 수집하여 그룹화하는 제1단계와;A first step of extracting a representative keyword representing a region and collecting and grouping various documents about the region from the web based on the extracted representative keyword;

상기 지역을 대표하는 고유지역 키워드를 추출하여 키워드들 간의 연관지식을 생성하는 제2단계와;Extracting a unique region keyword representing the region to generate related knowledge between the keywords;

지리정보를 기반으로 상기 추출한 고유지역 키워드의 관련정보를 직관적으로 파악할 수 있도록 지도 기반의 인터페이스를 통해 통합적으로 지역정보를 제공해주는 제3단계를 포함하는 것을 특징으로 한다.
And a third step of providing integrated regional information through a map-based interface so as to intuitively grasp relevant information of the extracted unique region keyword based on geographical information.

상기 제1단계의 다양한 문서들은,The various documents of the first step,

해당 지역에 대한 블로그, 뉴스, 사전, 웹 문서, 지역민의 참여 정보, 항공 사진, 수치지도, GIS데이터를 포함하는 것을 특징으로 한다.
It includes blogs, news, dictionaries, web documents, local participation information, aerial photos, digital maps, and GIS data for the region.

상기 제2단계의 지역을 대표하는 고유지역 키워드 추출은,Unique region keyword extraction representing the region of the second step,

문화유적 및 문화시설을 지역을 대표하는 고유지역 키워드로 추출하는 것을 특징으로 한다.
It is characterized by extracting cultural relics and cultural facilities with unique local keywords representing the region.

상기 제2단계의 연관지식 생성은,Generating the associated knowledge of the second step,

수집한 웹 문서의 태그를 제거하고, 태그가 제거된 웹 문서를 분석(parsing)하여 텍스트를 추출하는 단계와;Removing the tags of the collected web document, parsing the removed web document, and extracting text;

상기 추출한 텍스트에 대한 형태소를 분석하는 단계와;Analyzing the morpheme for the extracted text;

연관 키워드를 추출하는 단계와;Extracting an associated keyword;

추출한 연관 키워드의 연관도를 계산하는 단계를 포함한다.
Calculating an association degree of the extracted association keyword.

상기 연관도 계산은 유사도 행렬을 이용하여 계산하는 것을 특징으로 한다.
The correlation calculation may be performed using a similarity matrix.

상기 제3단계의 추출한 고유지역 키워드의 관련정보는,The related information of the extracted unique region keyword of the third step is

추출한 고유지역 키워드를 중심으로 연관 키워드를 재구성하여 관련정보로 제공해주는 것을 특징으로 한다.
It is characterized by reconstructing related keywords centering on extracted unique region keywords and providing them as related information.

상기 제3단계의 지도 기반의 인터페이스는,The map-based interface of the third stage,

문화적, 역사적 사실을 기반으로 한 객관적 지역정보와 사용자의 경험이나 의견에 기반한 주관적 지역정보를 함께 제공해주는 것을 특징으로 한다.It provides objective local information based on cultural and historical facts and subjective local information based on user's experience or opinion.

여기서 주관적 지역정보는, 블로그 정보를 포함하는 것을 특징으로 한다.
The subjective local information is characterized by including blog information.

상기 객관적 지역정보는,The objective area information,

백과사전, 뉴스, 이미지, 군지 정보를 포함하는 것을 특징으로 한다.
Encyclopedia, news, images, group information, including information.

상기 제3단계는,The third step,

고유지역 키워드 간의 관련성은 지도에 표시해주고, 상기 고유지역 키워드를 제외한 키워드 간의 관련성은 지도 표시 영역을 제외한 영역에 표시해주는 것을 특징으로 한다.
The relevance between the unique area keywords is displayed on a map, and the relevance between the keywords excluding the unique area keyword is displayed on an area except the map display area.

또한, 상기 제3단계의 지도 기반의 인터페이스는,In addition, the map-based interface of the third step,

위치나 거리에 근거한 관련성과 의미론적 관련성을 함께 제공해주는 것을 특징으로 한다.
It is characterized by providing both semantic and semantic relations based on location or distance.

본 발명에 따르면, 지자체가 제공하는 생활지역정보 서비스 및 지역포털 등과 같이 특정 지역에 특화된 지역정보서비스 내에서 사용자 및 정보 제공자가 생성한 정보를 통합하여 제공하므로, 웹 공간상의 여러 곳에 분리되어 있는 정보들로는 얻을 수 없는 부가가치가 발생하여, 지자체 경쟁력의 향상이 가능하고, 지역민의 정보활동을 통한 삶의 질을 향상시킬 수 있는 장점이 있다.According to the present invention, since information generated by users and information providers is integrated and provided in a local information service specialized for a specific region, such as a living area information service and a regional portal provided by a local government, information separated in various places on a web space is provided. There is an advantage that can generate added value that cannot be obtained by the local people, improve the competitiveness of local governments, and improve the quality of life through the information activities of local people.

또한, 본 발명에 따르면, 지리정보 획득을 위한 추가적인 검색 과정이 불필요하므로, 사용자에게 검색의 편의성을 제공해주는 장점이 있다.In addition, according to the present invention, since an additional search process for obtaining geographic information is unnecessary, there is an advantage of providing a user with convenience of searching.

또한, 본 발명에 따르면, 웹 문서에 포함된 다양한 지역정보들을 연결하여 지도에 표시함으로써, 사용자의 정보획득에 대한 편의성을 도모할 수 있는 장점이 있다.
In addition, according to the present invention, by connecting a variety of local information included in the web document to display on the map, there is an advantage that can be facilitated for the user information acquisition.

도 1은 일반적인 웹 환경에서의 지역정보 획득과정을 보인 개념도.
도 2는 기존 블로그 서비스의 예시도.
도 3은 본 발명에 따른 맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법이 적용되는 시스템의 개념도.
도 4는 본 발명에 따른 맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법에 대한 흐름도.
도 5는 본 발명을 적용한 예시도.
도 6은 고양시 수치지도 예시도.
도 7은 본 발명에서 주관적 지역정보 처리과정을 보인 설명도.
도 8은 본 발명에서 맵 인터페이스의 예시도.
도 9-(1)은 사용자 인터페이스 첫 화면 예시도이고, 도 9-(2)는 '행주산성선택시 화면 예시도이다.
도 10은 맵 인터페이스에 표시되는 데이터들의 변화도.
1 is a conceptual diagram showing a process of obtaining local information in a general web environment.
2 is an exemplary diagram of an existing blog service.
3 is a conceptual diagram of a system to which a method for integrated local retrieval information using a map interface and knowledge processing according to the present invention is applied;
4 is a flowchart illustrating a method for integrated regional retrieval information using a map interface and knowledge processing according to the present invention.
5 is an exemplary view to which the present invention is applied.
6 is an exemplary diagram of Goyang-shi numerical map.
7 is an explanatory diagram showing a subjective regional information processing process in the present invention.
8 is an exemplary view of a map interface in the present invention.
9- (1) is an exemplary view of the first screen of the user interface, and FIG. 9- (2) is an exemplary view of the screen when selecting the row destination acidity.
10 is a change diagram of data displayed on a map interface.

이하 본 발명의 바람직한 실시 예를 첨부한 도면에 의거 상세히 설명하면 다음과 같다. 본 발명을 설명하기에 앞서 관련된 공지 기능 혹은 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그에 대한 상세한 설명은 생략한다.Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings. In the following description, well-known functions or constructions are not described in detail since they would obscure the invention in unnecessary detail.

도 3은 본 발명에 따른 맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법이 적용되는 시스템의 개념도로서, 웹에 존재하는 다양한 형태의 수많은 지역 정보를 지식 처리를 통해 종합하고 선별하여, 사용자가 특정 지역의 관련 정보를 획득하고자 할 때, 맵 인터페이스를 기반으로 효율적인 서비스 제공을 돕기 위한 모델이다. 개별적으로 존재하는 지역정보들을 그룹화한 '지역정보 웹 문서 Layer', 키워드 간의 의미론적 연관지식이 생성되는 '고유지역키워드 Layer', 의미론적 관련성으로 연결된 키워드들을 맵(map)에 표시해주는 '맵 인터페이스 Layer'의 3-Layer로 구성된다.FIG. 3 is a conceptual diagram of a system to which an integrated search method for local related information using a map interface and knowledge processing according to the present invention is applied. Is a model for helping to provide efficient service based on map interface when it wants to acquire relevant information of a specific area. 'Local information web document layer' grouping individual existing local information, 'unique regional keyword layer' where semantic correlation knowledge is generated between keywords, and 'map interface' that displays keywords connected by semantic relevance on map Layer '3-Layer.

이러한 개념의 본 발명에 따른 맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법이 적용되는 시스템은, 수치지도와 지자체 홈페이지를 이용하여 지역을 대표하는 고유지역정보를 생성하고, 이를 이용하여 관련 웹 문서, 블로그, 이미지, 백과사전 등의 다양한 형태의 웹 페이지들을 수집한 후, 각 웹 페이지들에 대해 형태소 분석, 연관 키워드 추출 및 연관도 계산 등을 통해 연관키워드를 생성하고 이를 고유지역 키워드와 연결하여 연관지식을 생성하게 된다. 이후 관련정보를 사용자가 직관적으로 파악할 수 있도록 지도 기반의 사용자 인터페이스를 제공해주게 된다. 여기서 사용자 인터페이스는 객관적 지역정보와 주관적 지역정보를 통합하여 지역정보를 제공해줌으로써, 사용자가 자세한 정보를 획득할 수 있도록 하며, 한번에 관련정보를 제공해줌으로써 사용자에게 정보 검색의 편리함을 제공해준다.The system to which the integrated search method for local information using the map interface and knowledge processing according to the present invention of this concept is applied generates a unique area information representing a region by using a digital map and a local government homepage, After collecting various types of web pages such as web documents, blogs, images, encyclopedias, and generating related keywords through stemming, extracting related keywords, and calculating relevance for each web page, it generates unique keywords and unique local keywords. Connect and generate association knowledge. After that, it provides a map-based user interface so that users can intuitively grasp the relevant information. Here, the user interface provides the local information by integrating the objective local information and the subjective local information so that the user can obtain detailed information, and provides the user with the convenience of information retrieval by providing related information at once.

이러한 본 발명의 개념을 달성하기 위한 시스템은, 인터넷 등이 가능한 통신모듈과 정보처리기능이 가능한 제어장치를 구비한 퍼스널컴퓨터를 이용하며, 제어장치는 항공사진, 수치지도, 지리정보(GIS데이터)를 이용하게 된다.A system for achieving the concept of the present invention uses a personal computer having a communication module capable of Internet and a control device capable of an information processing function. The control device includes an aerial photograph, a digital map, and geographic information (GIS data). Will be used.

도 4는 본 발명의 바람직한 실시 예에 따른 "맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법"을 보인 흐름도로서, 지역을 대표하는 대표 키워드를 추출하고, 추출한 대표 키워드를 기반으로 웹으로부터 지역에 대한 다양한 문서들을 수집하여 그룹화하는 제1단계(S100)와; 상기 지역을 대표하는 고유지역 키워드를 추출하여 키워드들 간의 연관지식을 생성하는 제2단계(S200)와; 지리정보를 기반으로 상기 추출한 고유지역 키워드의 관련정보를 직관적으로 파악할 수 있도록 지도 기반의 인터페이스를 통해 통합적으로 지역정보를 제공해주는 제3단계(S300)로 이루어진다.FIG. 4 is a flowchart illustrating a method for integrated search of local information using a map interface and knowledge processing according to a preferred embodiment of the present invention. The representative keyword is extracted from the web based on the extracted representative keyword. A first step (S100) of collecting and grouping various documents about a region; A second step (S200) of generating a related knowledge between the keywords by extracting a unique region keyword representing the region; Based on the geographic information, the third step (S300) provides integrated area information through a map-based interface so as to intuitively grasp the related information of the extracted unique area keyword.

이와 같이 이루어진 본 발명에 따른 "맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법"은, 먼저 제1단계(S100)로서 지역을 대표하는 대표 키워드를 추출하고(S101), 추출한 대표 키워드를 기반으로 웹으로부터 지역에 대한 다양한 문서들을 수집하여 그룹화하게 된다(S103).As described above, the "local related information integrated search method using a map interface and knowledge processing" according to the present invention comprises first extracting a representative keyword representing a region as a first step (S100) (S101) and extracting the extracted representative keyword. Various documents about the region are collected and grouped based on the web (S103).

본 발명에서는 지역정보를 '고유지역정보'와 '일반지역정보'로 구분한다. 지역정보를 지도에 매핑하기 위해서는 지역정보가 '위치'정보를 포함하고 있어야 한다. 문화시설(도서관, 공공체육시설 등), 문화유적(문화재, 사찰, 산성 등)은 위치(소재지)가 반드시 있고, 지역축제나 행사에도 개최되는 장소 정보가 존재한다. 이와 동시에 특정 지역을 특징짓는 정보를 포함한다면 그 지역정보는 지도의 해당 위치에 매핑될 수 있는데, 본 발명에서는 이를 '고유지역정보'라 한다. 예를 들면, 지역축제/행사, 문화재, 문화시설 정보 등과 같이 특정 지역에 특화된 정보가 고유지역정보이다. '일반지역정보'는 고유지역정보가 아닌 지역정보로서, 어느 지역에 대해서도 존재하는 일반적인 지역정보이다. 예를 들어, 고양시에는 고양시청, 고양경찰서가 있고, 김포시에는 김포시청, 김포경찰서가 있는데, 이런 시설에 대한 정보들은 특정 지역을 특징짓는다고 할 수 없다. 이런 의미에서 일반지역정보는 주로 관공서나 학교, 학원 등의 교육기관, 그리고 병원, 은행과 같은 업체 정보들을 포함한다.In the present invention, the local information is divided into 'own area information' and 'general area information'. In order to map local information to a map, local information must include 'location' information. Cultural facilities (libraries, public sports facilities, etc.) and cultural relics (cultural assets, temples, acids, etc.) must have a location (location), and there is information on places held at local festivals and events. At the same time, if it includes information that characterizes a particular area, the area information can be mapped to a corresponding location on a map, which is referred to as 'unique area information' in the present invention. For example, information specific to a specific area, such as local festivals / events, cultural assets, and cultural facility information, is unique area information. 'General area information' is local information, not unique local information, and is general local information existing in any area. For example, there are Goyang City Hall and Goyang Police Station in Goyang City, and Gimpo City Hall and Gimpo Police Station in Gimpo City. The information on these facilities is not characteristic of a particular area. In this sense, general area information mainly includes educational institutions such as government offices, schools and academies, and company information such as hospitals and banks.

도 3의 지역정보 웹 문서 Layer는 위와 같은 정의를 바탕으로, 지역정보를 포함하는 웹 문서들을 문서 형태별(백과사전, 블로그, 이미지, 동영상 등)로 관련 있는 지역정보끼리 그룹화하는 Layer이다. 예를 들어, '행주산성'이라는 백과사전 항목과 '행주산성 해맞이 2만명 운집'이라는 뉴스 기사, 그리고 '행주산성 맛집'이라는 제목의 블로그는 동일한 지역정보로 그룹화될 수 있다. 이렇게 관련된 웹 문서끼리 그룹화하고 문서 형태별로 구분함으로써, 백과사전, 뉴스 기사, 블로그 등 다양한 형태의 지역정보들을 효율적으로 처리하여 사용자에게 제공할 수 있다.The local information web document layer of FIG. 3 is a layer for grouping local information related to web documents including local information by document type (encyclopedia, blog, image, video, etc.) based on the above definition. For example, an encyclopedia entry of 'Haengjusanseong', a news article called 'Hangjusanseong's 20,000 haunted house', and a blog titled 'Hangjusanseong Fortress' can be grouped with the same local information. By grouping related web documents and classifying them into document types, various types of local information such as encyclopedias, news articles, and blogs can be efficiently processed and provided to users.

다음으로, 제2단계(S200)에서는 상기 지역을 대표하는 고유지역 키워드를 추출하여(S201), 키워드 간의 연관지식을 생성하게 된다(S203).Next, in the second step (S200) to extract the unique region keywords representing the region (S201), to generate the associated knowledge between the keywords (S203).

관련 있는 지역정보들을 같은 형태의 웹 문서별로 그룹화한 지역정보 웹 문서 Layer의 각 그룹들은 각각 특정 지역 관련 키워드로 대표될 수 있다. 예를 들어, 행주산성과 관련된 웹 문서들은 '행주산성'이라는 키워드로 대표될 수 있다. 이와 같이 '북한산', '일산호수공원' 등도 고양시를 대표하며 특징짓는 키워드가 될 수 있다. 이때, 이런 키워드는 실생활 공간의 특정 위치(좌표)에 매핑될 수 있는 것을 고려한다. 이는 제안하는 모델에서 지역관련 정보를 효율적으로 표시하기 위하여 맵 인터페이스를 이용하기 때문이다. 즉, 본 발명에서는 이처럼 관련 고유지역정보들의 그룹을 대표할 수 있으면서 실생활 공간의 특정 위치(좌표)에 매핑될 수 있는 키워드를 '고유지역키워드'라고 정의한다.Each group of the local information web document layer grouping related local information by the same type of web document may be represented by a specific local related keyword. For example, web documents related to hangsan acidity may be represented by the keyword 'hangsan acidity'. As such, 'North Korea' and 'Ilsan Lake Park' may be keywords that represent and characterize Goyang. In this case, it is considered that such a keyword may be mapped to a specific position (coordinate) of the real life space. This is because the proposed model uses the map interface to efficiently display area-related information. That is, in the present invention, a keyword that can represent a group of related unique area information and can be mapped to a specific location (coordinate) of a real life space is defined as 'own area keyword'.

고유지역키워드 Layer에서는 고유지역정보를 대표하는 고유지역 키워드 간의 의미론적 연관지식이 생성된다. 먼저, 고유지역 키워드의 추출을 위해 웹 문서, 지도 플랫폼 등을 분석하여 고유지역 키워드 후보 집합을 추출한다. 그리고 고유지역 키워드 집합을 생성한 후, 키워드 간의 연관성을 계산하고 이로부터 새로운 지식을 만들어낸다. 예를 들어, '행주산성'과 '북한산성'은 산성이라는 관련성이 있다는 것을 쉽게 알 수 있지만, 시스템적으로 이를 유추해내기는 어렵다. 이는 기존의 지도 서비스들이 지도상에 표시하는 정보가 대부분 단순히 위치나 거리에 근거한 정보에 불과하기 때문이다. 고유지역 키워드 생성 및 의미 있는 관련지식을 생성하는 방법에 대해서는 후술하기로 한다.In the unique region keyword layer, semantic association knowledge between unique region keywords representing unique region information is generated. First, for the extraction of unique local keywords, web site, map platform, etc. are analyzed to extract the unique local keyword candidate set. After generating a set of unique local keywords, the association between the keywords is calculated and new knowledge is generated from them. For example, it is easy to see that 'Haengju Fortress' and 'North North Fortress' are related to acidity, but it is difficult to infer this systematically. This is because most of the information displayed on the map of existing map services is merely information based on location or distance. A method of generating a unique region keyword and generating relevant knowledge will be described later.

다음으로, 제3단계(S300)에서는 지리정보를 기반으로 상기 추출한 고유지역 키워드의 관련정보를 직관적으로 파악할 수 있도록 지도 기반의 인터페이스를 통해 통합적으로 지역정보를 제공해주게 된다.Next, in the third step (S300) to provide an integrated information through the map-based interface to intuitively grasp the relevant information of the extracted unique region keywords based on the geographic information.

'맵 인터페이스 Layer'는 고유지역 키워드 간의 관련성을 지도를 기반으로 표현하는 Layer로, 사용자가 선택한 고유지역 키워드를 중심 키워드로 하여 그와 연관성이 높은 키워드들을 지도의 실제 위치(좌표)에 매핑한다. 사용자가 맵 인터페이스에 매핑되어 표시되는 키워드 중 '행주산성'이라는 고유지역 키워드를 선택했다고 하자. 이때, 지역정보 웹 문서 Layer에 존재하는 문서 중에서 행주산성으로 그룹화되어 있는 문서들이 선택되고, 고유지역 키워드 Layer에서는 행주산성과 연관있는 고유지역 키워드 중 상위에 랭크되어있는 키워드들이 선택된다. 선택된 문서들과 연관 키워드들은 최종적으로 지도상에 표현된다. 그리고 이 Layer에서 중심 키워드와 함께 지도에 매핑되는 키워드들은 어떤 흥미로운 연관관계를 갖는 키워드들이다.'Map Interface Layer' is a layer that expresses the relevance between the keywords of the unique region based on the map. The keywords of the unique region selected by the user are mapped to the actual position (coordinates) of the map. Assume that the user selects a unique region keyword called 'hangsansanseong' among the keywords displayed and mapped on the map interface. At this time, the documents grouped by the hangju acidity are selected among the documents existing in the local information web document layer, and the keywords ranked at the top among the unique area keywords related to the hangju acidity are selected in the unique region keyword layer. The selected documents and associated keywords are finally represented on the map. And the keywords mapped to the map with the central keyword in this layer are keywords with some interesting associations.

맵 인터페이스 Layer에서 지도를 기반으로 정보를 표현한 것은 정보 획득의 직관성을 보장한다. 지도에 표현되는 정보들은 시각적인 측면에서 한눈에 파악될 수 있어서, 사용자의 종합적인 판단에 도움을 준다. 또한, 문서 내에 지명이나 행사 개최지 등의 내용이 포함되어 있는 경우, 위치 정보에 대한 추가적인 검색이 필요하지 않다.Representation of the information based on the map in the map interface layer guarantees the intuitiveness of information acquisition. Information presented on the map can be grasped at a glance in the visual aspect, which helps the user's comprehensive judgment. In addition, if a document includes contents such as a place name or an event venue, an additional search for location information is not necessary.

이상과 같은 본 발명의 특징을 실시 예를 들어 구체적으로 설명하면 다음과 같다.Referring to the features of the present invention as described above in detail as follows.

예를 들어, 경기도 고양시 지역관련 정보를 제공하는 통합검색 서비스를 본 발명에서 제안한 모델을 적용하면, 도 5와 같은 4단계의 과정으로 구현할 수 있다.For example, by applying the model proposed in the present invention, the integrated search service that provides information related to Goyang-si, Gyeonggi-do, can be implemented in a four-step process as shown in FIG.

즉, (1) 특정 지역을 대표할 수 있는 키워드들을 추출하고, (2) 관련 웹 페이지들을 수집한 후 연관 키워드 집합을 추출한다. 다음, (3) 연관지식생성 알고리즘을 적용하여 키워드 간의 연관도를 계산한다. 마지막으로, (4) 사용자가 직관적으로 파악할 수 있도록 지도를 활용한 사용자 인터페이스를 구축한다. 제안한 시스템 모델과 관련하여, (1), (3) 과정은 고유지역 키워드 Layer, (2) 과정은 지역정보 웹 문서 Layer, (4) 과정은 맵 인터페이스 Layer에 해당한다.That is, (1) extract keywords that can represent a particular region, and (2) extract related web pages after collecting relevant web pages. Next, (3) the correlation between keywords is calculated by applying the association knowledge generation algorithm. Finally, (4) construct a user interface using maps so that users can intuitively grasp. In relation to the proposed system model, steps (1) and (3) correspond to the unique region keyword layer, (2) the local information web document layer, and (4) the map interface layer.

먼저, 첫 단계는 고유지역 정보로부터 고유지역 키워드들을 획득하기 위해, 고양시의 문화재, 문화시설, 행정기관, 산 등의 명칭을 고양시 수치지도에서 추출하는 과정이다. 그리고 추출된 단어들을 고양시청 홈페이지에서 추출된 단어들과 비교하여 최종 고유지역 키워드 집합을 획득한다.First, the first step is to extract the names of cultural assets, cultural facilities, administrative institutions, mountains, etc. of Goyang-shi from the numerical map of Goyang-city in order to obtain unique-region keywords from the information on the unique region. The extracted words are compared with the words extracted from the Goyang City Hall homepage to obtain a final set of unique local keywords.

구체적인 방법은 다음과 같다. 먼저, 수치지도로부터 좌표로 매핑될 수 있는 키워드들을 추출한다. 수치지도는 지리 공간정보를 항목(layer)별로 구분하여 데이터베이스화하고 이용 목적에 따라서 지도를 자유로이 작성할 수 있도록 전산화한 지도이다. 수치지도의 각 객체는 일괄적으로 정해진 표준코드로 분류되기 때문에 그 코드를 기준으로 고양시 관련 단어를 추출할 수 있다. 도 6은 고양시 수치지도 1099개 중 일산구 장항동 일산호수공원 주변이 포함된 수치지도 파일이다. 일부분을 확대해보면 '일산구', '장항동', '장항2동' 등의 텍스트가 해당 위치에 매핑되어 있음을 볼 수 있다. 이처럼 수치지도를 분석하고 코드별로 분류된 시설물 등의 텍스트 정보를 통해 고양시에 관련된 4614개의 단어를 추출하였다.The concrete method is as follows. First, keywords that can be mapped to coordinates are extracted from the numerical map. A digital map is a computerized map that allows geospatial information to be classified by layer into a database and maps can be freely created according to the purpose of use. Since each object of the digital map is classified as a standard code determined collectively, related words can be extracted based on the code. FIG. 6 is a numerical map file including surroundings of Ilsan Lake Park, Janghang-dong, Ilsan-gu, of 1099 numerical maps in Goyang-si. If you zoom in on the part, you can see that the texts such as 'Ilsan-gu', 'Janghang-dong' and 'Janghang 2-dong' are mapped to the location. In this way, the numerical map was analyzed and 4614 words related to Goyang-si were extracted through text information such as facilities classified by codes.

이렇게 추출된 단어들은 본 발명에서 정의한 고유지역 키워드를 포함하고 있지만, 고유지역 키워드가 아닌 키워드도 포함하고 있다. 이는 고양시 수치지도가 고양시 전체에 대해 좌표로 매핑될 수 있는 모든 시설물 정보를 담고 있어서, 고양시를 특징짓는 단어들 외의 단어들도 다수 포함하고 있기 때문이다. 그래서 본 발명에서는 고유지역 키워드만을 선별하기 위해 고양시청 홈페이지의 '문화관광' 안내페이지를 이용하였다. 이 페이지를 이용한 이유는, 일반적으로 어떤 특정 지역을 대표하는 사이트 중 가장 대표적인 것은 지자체 홈페이지이고, 이런 홈페이지는 대부분 해당 지역을 대표하는 정보를 다수 포함하고 있기 때문이다. 또한, 이런 시, 군 등의 관공서 홈페이지는 공공성이 강해서 보다 명확하고 객관적인 내용의 정보 전달이 이루어지기 때문에 신뢰도가 높다고 볼 수 있다. 고양시청 홈페이지의 '문화관광' 안내페이지에서는 '문화행사/축제', '문화유적/볼거리', '문화시설' 등의 카테고리로 구분된 각각의 페이지로부터 관련 단어를 추출할 수 있다. 이렇게 추출된 단어들과 수치지도로부터 추출한 단어들의 교집합을 취해 최종적으로 고양시 지역의 고유지역 키워드 133개를 획득하였다.The extracted words include the unique region keywords defined in the present invention, but also include keywords that are not unique region keywords. This is because the Goyang digital map contains all the facility information that can be mapped to the coordinates of the whole Goyang city, and contains many words other than the words that characterize Goyang. Therefore, in the present invention, the 'cultural tourism' guide page of the Goyang City Hall homepage was used to select only unique keyword. The reason for using this page is that the most representative of the sites that represent a particular area is the local government homepage, and most of these homepages contain a lot of information that represents the area. In addition, the homepages of public offices such as cities and counties have a strong publicity, and thus can be regarded as having high reliability because information of clearer and more objective information is delivered. In the 'Cultural Tourism' guide page of Goyang City Hall website, related words can be extracted from each page divided into categories such as 'Cultural Events / Festivals', 'Cultural Relics / Things', and 'Cultural Facilities'. By taking the intersection of the extracted words and the words extracted from the digital map, we finally obtained 133 keywords of unique regions in Goyang.

본 발명에서는 고유지역 키워드 추출을 위해 고양시청 홈페이지 내의 '문화관광' 안내페이지만을 이용하였기 때문에, 비교적 정확하게 고유지역 키워드를 추출할 수 있다.In the present invention, since only the 'cultural tourism' guide page in the Goyang City Hall homepage is used for extracting the unique region keyword, the unique region keyword can be extracted relatively accurately.

본 발명에서는 지역 정보를 주관적인 관점과 객관적인 관점의 정보로 구분하고 있다. 블로그는 주관적 지역정보로 분류하고, 그 외 지역관련 정보들을 포함하는 백과사전, 뉴스, 이미지 등의 웹 문서를 객관적 지역정보로 분류한다. 여기서 블로그를 주관적 지역정보로 분류한 이유는, 시스템 구현 과정에서 블로그에 기록된 사용자 개개인의 경험과 주관적인 생각, 느낌 등 다양한 내용 중 자주 기록되는 키워드로 표현하여 이를 다른 사용자들과 공유할 수 있도록 하기 위함이다. 관련 웹 문서는 네이버 open API를 사용하여 수집하였다. 네이버 open API는 네이버가 가진 각종 데이터, 콘텐츠, 서비스 등을 이용할 수 있도록 공개한 인터페이스이며, 이를 통해 다양한 Mash-up 서비스가 개발될 수 있다.In the present invention, local information is divided into subjective and objective viewpoints. Blogs are categorized as subjective local information, and web documents such as encyclopedias, news, and images that contain other regional information are classified as objective local information. The reason why the blog is classified as subjective local information is to express it as a keyword frequently recorded among various contents such as the experiences, subjective thoughts, and feelings of the users recorded in the blog during the system implementation process so that it can be shared with other users. For sake. Relevant web documents were collected using NAVER open API. NAVER open API is an open interface to use various data, contents, and services of NAVER, and various Mash-up services can be developed through this.

객관적인 지역정보를 수집하기 위해 백과사전, 뉴스, 이미지, 기타 웹 문서 등에 대해 각 고유지역 키워드를 쿼리(query)로 한 검색결과의 링크들을 수집한다. 그리고 수집된 링크를 통해 웹 문서를 저장하고 텍스트만을 다시 추출해낸다. 이로부터 문서에 포함된 고유지역키워드의 출현 빈도 등을 알 수 있게 되는데 이후 연관도 계산 과정에서 지도에 표시되는 10개의 연관 키워드를 선정하는데 이용된다. 또한, 백과사전이나 뉴스 등으로부터 얻을 수 없는 고양시의 상세 정보는 고양군지 데이터를 활용하여 객관적 지역정보를 보충한다.To collect objective local information, we collect links in search results by querying each unique local keyword for encyclopedias, news, images, and other web documents. The collected links save the web document and extract only the text. From this, it is possible to know the frequency of occurrence of the unique area keywords included in the document, which is then used to select 10 related keywords displayed on the map in the process of calculating the degree of association. In addition, detailed information of Goyang-shi, which cannot be obtained from encyclopedias or news, supplements the objective area information using Goyang-gun data.

주관적 지역정보에 속하는 블로그에 대해서도 마찬가지로 네이버 open API를 이용해 링크를 수집하고, 각 링크로부터 문서의 텍스트만을 추출한다. 추출된 텍스트는 도 7과 같이, 태그제거, 형태소분석(명사 추출), 일반명사 제거 등의 과정을 거쳐 명사형태의 연관 키워드 집합을 생성한다. 다음으로, 생성된 명사 집합에서 고양시 관련 키워드만을 추출하는 작업이 필요하다. 기존의 검색엔진 검색 결과의 신뢰도를 바탕으로, 생성된 명사 집합 내의 모든 단어들을 검색 엔진에 쿼리로 전송하여 검색 결과 페이지에 그 쿼리와 '고양시'나 '고양'이란 단어가 일정횟수 이상 함께 발견되면 고양시 지역 관련 키워드로 판단하였다. 이 키워드들은 맵 인터페이스에서 중심에 있는 키워드와의 연관도 계산에 이용된다.Similarly, blogs belonging to subjective local information are collected using the NAVER open API, and only the text of the document is extracted from each link. As shown in FIG. 7, the extracted text generates a related keyword set of a noun type through a process of tag removal, morphological analysis (noun extraction), and general noun removal. Next, it is necessary to extract only Goyang-related keywords from the generated noun set. Based on the reliability of existing search engine search results, if all the words in the generated noun set are sent to the search engine as a query, the query and the word 'Goyang' or 'Cat' are found on the search results page a certain number of times. It was determined as a keyword related to the Goyang region. These keywords are used to calculate the degree of association with the keyword centered in the map interface.

본 발명은 사용자가 선택한 키워드와 가장 관련도가 높은 고유지역 키워드 10개를 지도에 표시하여 그 관련성을 나타낸다. 또한, 관련도가 높은 연관 키워드 10개를 블로그 문서로부터 추출하여 함께 제공한다. 이때 어떤 두 개의 키워드가 관련이 있다고 판단하는 기준은 '같은 문서에 출현한다'라는 공기성이다. 키워드 간의 관련성 판단에는 데이터마이닝 기법들을 이용하는데, 여기서는 연관규칙과 유사도 행렬 두 가지 방법을 적용한 데이터의 결과를 살펴본다.According to the present invention, ten unique local keywords most relevant to a keyword selected by a user are displayed on a map to indicate their relevance. In addition, 10 relevant keywords are extracted from the blog document and provided together. The criterion that any two keywords are related to is the aerodynamic of 'appearing in the same document'. Data mining techniques are used to determine the relevance between keywords. Here, we examine the results of data applying two methods of association rule and similarity matrix.

연관 규칙은 데이터마이닝의 대표적인 기술로 백화점이나 슈퍼마켓에서 함께 구매한 물건들에 관한 연관성을 찾아내는 기술이다. 여기서 '함께 구매했다'라는 것을 트랜잭션(transaction)이라고 부르는데, 우리가 다루는 데이터의 각각의 원소는 장바구니에 들어있는 항목(상품)들이라 할 수 있다. 이때 하나의 장바구니에 포함된 데이터 집합을 트랜잭션이라 한다. 연관 규칙은 일정 지지도 이상의 규칙들을 대상으로, 한 페이지에 여러 번 출현하더라도 모두 1회로 간주하는 데이터마이닝 기법이다. 이것은 상품 구매자의 장바구니에 담겨있는 상품 각각의 개수보다는 어떤 상품들을 같이 구매하는가에 초점을 맞추기 때문에, 하나의 웹 페이지에 여러 번 출현하는 키워드의 출현횟수는 무시된다. 또한, 일반적으로 연관 규칙은 보편타당한 경우에 적용될 수 있지만, 본 발명에서 구현하고자 하는 시스템은 '지역성'을 다루는 특수한 경우이므로 적절한 방법이 아니다.Association rules are a typical technique of data mining, which is a technique for finding associations between items purchased at department stores or supermarkets. Here, 'buy together' is called a transaction, and each element of the data we deal with is an item in a shopping cart. At this time, the data set included in one shopping cart is called a transaction. Association rule is a data mining technique that targets rules with a certain degree of support and counts them as one even if they appear several times on a page. Since it focuses on which products are purchased together rather than the number of products in the shopping cart of the product buyer, the occurrence number of keywords appearing on a web page several times is ignored. In addition, in general, the association rule may be applied in a case where it is universally valid, but the system to be implemented in the present invention is not a proper method because it is a special case of dealing with 'locality'.

유사도 행렬은 '두 단어가 공기하는 문서의 수'와 같은 단어 간 관련도를 나타낼 수 있다. 우선 문서 dj에 색인어 wi가 몇 번 출현하는지 빈도를 측정하여 행렬 mij를 만들고, mij의 전치 행렬 mij t를 만들어 두 행렬의 곱 s=mij×mij t를 만든다. 행렬 s의 각 요소는 두 단어가 같은 문서에 얼마나 많이 출현했는가를 나타내는 척도이다. 웹 문서와 키워드를 이용하여 만든 행렬 mij은 대부분의 요소가 0인 희소행렬이다. 따라서, 행렬의 요소가 0이 아닌 것끼리만 계산하여 메모리의 사용과 계산량을 큰 폭으로 줄일 수 있다. k개의 문서와 l개의 색인어를 이용해 행렬을 만들고 연관도를 계산하는 방법은 다음과 같다.The similarity matrix may indicate the degree of relevance between words such as 'the number of documents in which two words are held'. Creating a first document index term w i m ij is the matrix by measuring the frequency of occurrence in a few times that d j, creating a transposed matrix m ij ij m t of the product of two matrices s = m ij × m makes ij t. Each element of the matrix s is a measure of how many words appear in the same document. The matrix m ij created using web documents and keywords is a sparse matrix with most elements zero. Therefore, by using only nonzero elements of a matrix, memory usage and computation can be greatly reduced. Using k documents and l index words to build a matrix and calculate the degree of association:

① 문서 dj에 색인어 wi가 몇 번 출현하는지 빈도를 측정하여 행렬 mij를 만든다.① Create a matrix m ij by measuring the frequency of how many times the index word w i appears in document d j .

② 행렬 mt=mji를 만든다.② Create the matrix m t = m ji .

③ 연관도 계산 s=mij×mji ③ Calculation of Association s = m ij × m ji

유사도 행렬은 한 페이지에 출현하는 키워드 횟수 정보를 이용하고 키워드-키워드 행렬을 생성하여 모든 키워드 간의 연관도를 계산한다. 같은 문서에 두 개의 키워드가 어느 정도의 빈도로 동시에 출현했는가 하는 것이 그 척도이며, 두 키워드가 많은 문서에 동시에 나타날수록 그 연관도가 높아지게 된다. 연관규칙과는 달리 각 문서에 나타나는 횟수도 관련성에 기여하므로, 여러 문서에 동시에 나타나는 횟수가 적더라도 한 문서에 많이 나타나면 높은 관련성을 갖게 되는 것이다.The similarity matrix calculates the degree of association between all keywords by using keyword count information appearing on one page and generating a keyword-keyword matrix. The measure of how often two keywords appear in the same document at the same time is the measure. The more the two keywords appear in many documents at the same time, the higher the relevance is. Unlike the association rules, the number of times that appears in each document also contributes to the relevance, so that even if the number of times that appears in several documents is high, the number of times that appears in one document is high.

본 발명에서 사용한 고유지역 키워드 간의 연관도 계산은 다음과 같다. 우선, 키워드-문서의 A행렬을 생성한다. A행렬의 행은 133개의 고유지역 키워드이고, 열은 관련 웹 문서 수집과정으로 수집된 각 문서들을 의미하며, 각 문서에 출현한 키워드의 빈도가 희소행렬로 생성된다. 다음으로, A행렬의 전치 행렬인 문서-키워드의 B행렬을 생성한다. B행렬의 행은 각각의 웹 문서이고 열은 고유지역 키워드이다. 키워드-키워드 행렬, 즉, A×B 행렬을 구하는 계산 방법은 다음과 같다. A행렬을 기록한 파일에는 하기의 [표 1]에 예를 든 것처럼 문서 번호 112, 1009, 2080 등과 같이 '행주산성'이 출현하는 문서에 대한 정보가 기록되어 있고, B행렬을 기록한 파일에는 문서에 출현하는 연관 키워드들의 출현 빈도가 기록되어 있다. 이때, A×B 행렬은 문서 번호 112, 1009, 2080 등과 같이 '행주산성'이 출현하는 문서만 읽어들이고, 그 문서에 출현하는 다른 키워드의 출현 빈도 수와 곱을 하여 연관도를 계산한다.Calculation of the degree of association between the unique region keywords used in the present invention is as follows. First, create an A matrix of keyword-documents. The row of matrix A is 133 unique region keywords, and the columns represent each document collected by the relevant web document collection process, and the frequency of keywords appearing in each document is generated as a sparse matrix. Next, a matrix B of document-keywords, which is a transpose matrix of matrix A, is generated. Row B is each web document and column is a unique local keyword. The calculation method for obtaining the keyword-keyword matrix, that is, the A × B matrix is as follows. In the file recording the matrix A, information about the document in which the 'hangjusanseongseong' appears, such as document number 112, 1009, and 2080, is recorded as shown in Table 1 below. The frequency of appearance of the associated keywords appearing is recorded. In this case, the A × B matrix reads only the document in which 'rowability' appears, such as document numbers 112, 1009, and 2080, and calculates the degree of association by multiplying the frequency of appearance of other keywords appearing in the document.

'행주산성'이 출현하는 문서 정보Document information about the appearance of Haengsan Fortress 문서번호Document number 출현 빈도Appearance frequency 문서번호Document number 출현 빈도Appearance frequency 112112 22 45684568 55 10091009 33 58715871 1212 20802080 1One 1055110551 33

'행주산성', '북한산', '일산호수공원'과 같은 고양시의 고유지역 키워드는 문화, 역사, 또는 지리적 의미를 갖는다. 또한, 웹 페이지에서 이런 고유지역 키워드들과 함께 출현하는 키워드 역시 유사한 의미가 있을 확률이 높다. 예를 들어 '북한산'의 경우, 웹 페이지에서 동시에 출현하는 고유지역 키워드들의 목록은 아래와 같다.Keywords in the region of Goyang, such as 'Haengju Fortress', 'Bukhansan' and 'Ilsan Lake Park', have a cultural, historical or geographical meaning. Also, keywords appearing with these unique local keywords on web pages are likely to have similar meanings. For example, in the case of Mt. North Korea, a list of unique local keywords appearing simultaneously on a web page is shown below.

북한산성, 국녕사, 노적사, 태고사, 무량사, 상운사, 흥국사, 행주산성, 서삼릉, 호수공원Bukhansan Fortress, Kuknyeongsa Temple, Nojeoksa Temple, Taegosa Temple, Muryangsa Temple, Sangunsa Temple, Heungguksa Temple, Haengjusanseong Fortress, Seosamneung, Lake Park

위와 같은 관련 키워드들은 '북한산'이 해당 문서에서 상대적으로 높은 빈도로 출현할 때, 더 많은 횟수로 출현하게 된다. 이는 그 문서 자체가 문화·역사·지리적 특수성을 반영하고 있기 때문이다. 이때 국녕사, 노적사, 북한산성 등은 기존의 지도서비스를 통해서도 북한산과 지리적으로 가까운 곳에 위치하여 있으므로, 지리적으로 관련성이 있음을 직관적으로 추측할 수가 있다. 주목할 만한 것은 북한산과 거리상으로 약 20km 떨어져 있는 호수공원과의 관련성이 드러난다는 점이다. 이처럼 유사도 행렬을 이용하면, 거리에 근거한 관련성뿐만 아니라 직관적으로 쉽게 유추하기 어려운 이런 흥미로운 연관관계를 생성해낼 수 있다. 다른 예로서, 홍릉-중남미문화원, 행주산성-호수공원, 고양아람누리-목암미술관 등의 의미 있는 연관 지식 들이 창출된다.These related keywords will appear more frequently when 'North Korea' appears relatively frequently in the document. This is because the document itself reflects cultural, historical and geographical specificities. At this time, Kuknyeongsa Temple, Nojaksa Temple, and Bukhansan Fortress are located close to Mt. Bukhansan through existing map services, so it can be intuitively assumed that they are geographically related. Notable is the relevance of Lake Park, which is about 20 km away from Bukhansan Mountain. Similarity matrices can be used to create not only distance-based associations, but also interesting relationships that are difficult to infer intuitively. As another example, meaningful related knowledge is created, such as Hongneung-Latin American Culture Center, Haengju Sanseong-lake Park, Goyang Aram Nuri-Mokam Art Museum.

주관적 지역정보인 블로그의 텍스트 처리과정을 통해 추출된 연관 키워드 집합에 대해서도, 마찬가지로 A×B 행렬을 구하는 계산 방법을 이용한다. 이때 A행렬의 행은 연관 키워드들이고, 열은 그 키워드들이 포함된 문서이며, B행렬은 A행렬의 전치 행렬이 된다. 유사도 행렬을 이용한 연관도 계산 과정을 거쳐 고유지역 키워드 각각에 대해 관련도가 높은 연관 키워드부터 순위를 매긴 후, 상위 10개 키워드를 맵 인터페이스의 좌측에 표시하여 사용자들의 지역정보 종합 및 획득을 용이하게 한다.Similarly, for the set of related keywords extracted through the text processing of the blog, which is subjective local information, the calculation method of obtaining the A × B matrix is used. In this case, the row of matrix A is related keywords, the column is a document including the keywords, and the matrix B is a transpose matrix of matrix A. After relevance calculation process using similarity matrix, each relevant local keyword is ranked in order of high relevance related keywords, and then the top 10 keywords are displayed on the left side of the map interface to facilitate user synthesis and acquisition of local information. do.

한편, 현재 구현된 시스템상에서 일괄적으로 한 번에 진행되지는 않지만, 각 장에 해당하는 프로세스는 각각 자동으로 진행된다. 즉, 웹 문서 수집 및 연관 키워드 추출과정은 한 번에 자동 실행되며, 연관도 계산 과정도 마찬가지로 자동 실행된다. 그러므로 자동화의 측면에서는 현재의 시스템으로도 최신의 검색결과를 보장할 수 있다.On the other hand, in the currently implemented system, although it does not go all at once, the process corresponding to each chapter proceeds automatically. That is, the web document collection and association keyword extraction process is automatically executed at once, and the association calculation process is also automatically performed. Therefore, in terms of automation, the current system can guarantee the latest search results.

사용자 인터페이스는 이렇게 처리된 관련 지역 정보를 직관적으로 파악할 수 있도록 하기 위해 지도를 활용한다. JavaScript, JSP, XML, MySQL(DB) 등으로 구현하고 AJAX 기술을 활용하여 작성한다. AJAX 기술을 활용하면 페이지의 이동 없이도 원하는 데이터를 가져올 수 있고, 별도의 프로그램 설치도 필요하지 않다.The user interface utilizes maps to provide an intuitive view of the relevant local information processed in this way. Implement in JavaScript, JSP, XML, MySQL (DB), etc. and write using AJAX technology. With AJAX technology, you can get the data you want without having to move pages, and you don't need to install any programs.

사용자가 지도에서 어떤 키워드를 선택하면 해당 키워드를 중심으로 그와 관련된 상위 10개의 고유지역 키워드를 지도상에 다시 마커로 표시한다. 이때 마커를 클릭하는 것만으로도 연결된 모든 관련 정보의 획득이 가능한데, 이는 사용자의 정보 검색 편리성을 높인다. 지도 좌우측의 지역정보들은 해당 정보를 클릭하면 관련 웹 페이지의 링크를 DB로부터 획득하여 화면에 나타낸다. 도 8은 사용자가 처음 서비스를 사용할 때 보이는 첫 화면이다. 본 발명이 로딩 되었을 때의 맨 처음 중심키워드는 고양시청이고, 고양시를 대표하는 고유지역 키워드들이 실제 위치와 매핑되어 지도상에 나타난다. 그 중에서도 고양시와 관련도가 높은 10개의 키워드는 중심 키워드와 선으로 연결되고 red 마커로 표시된다. 그리고 지도의 중심에 있는 고유지역 키워드에 대하여, 지도의 좌측에는 주관적 지역정보인 블로그로부터 추출된 연관 키워드가, 우측에는 백과사전, 뉴스, 이미지, 군지 등의 객관적 지역정보가 배치된다.When a user selects a keyword on the map, the top 10 unique area keywords related to the keyword are displayed as markers on the map again. At this time, it is possible to obtain all related information by simply clicking on the marker, which increases the user's convenience of information search. Local information on the left and right side of the map is obtained by clicking the relevant information and obtaining the link of the relevant web page from the DB. 8 is the first screen shown when the user uses the service for the first time. When the present invention is loaded, the first central keyword is Goyang City Hall, and unique local keywords representing Goyang City are mapped to actual locations and displayed on a map. Among them, 10 keywords that are highly related to Goyang are connected with the central keyword by a line and marked with a red marker. In relation to the unique region keyword at the center of the map, the related keyword extracted from the blog as subjective regional information is arranged on the left side of the map, and the objective region information such as encyclopedia, news, image, and county is arranged on the right side.

사용자가 지도를 이용하여 특정 지역을 살펴볼 때, 공간 관련성과 공간 근접성이 높은 지명들은 대부분 근처에 밀집하여 보여진다. 이런 관련성은 단순히 지도를 보는 것만으로도 파악할 수 있다. 하지만, 본 발명에서 제시한 바와 같이 의미적으로 관련성이 높은 지명을 공간 근접성에 구애받지 않고 제공한다면, 지도상에서 '근처에 있기 때문에 단순히 보여지는 것' 이외에 비록 멀리 떨어져 있다 하더라도 그 관련성을 쉽게 파악할 수 없는 지명에 관한 관련성을 알아낼 수 있다. 또한, 지도상에 키워드가 마커와 함께 매핑되는데, 이 마커를 클릭하는 것만으로도 해당 지명 키워드와 연관도가 높은 다른 지명들의 위치를 쉽게 파악할 수 있으므로 검색 인터페이스 측면에서도 높은 유용성을 갖는다.When a user looks at a specific area using a map, most place names that have high spatial relevance and spatial proximity are displayed nearby. This relationship can be understood simply by looking at the map. However, if a semanticly relevant place name is provided regardless of spatial proximity, as shown in the present invention, it is easy to grasp the relevance even if it is far away from the map. Can find relevance for missing names. In addition, keywords are mapped with markers on the map. By simply clicking on the markers, the location of other names that are highly related to the name keywords can be easily identified.

본 발명에서 구현한 실시 예 시스템을 Intel Xeon 2.66Hz(8 CPUs), 3.25GB RAM의 스펙을 갖는 Windows Server에서 운용하였다. The embodiment system implemented in the present invention was operated in a Windows Server having a specification of Intel Xeon 2.66Hz (8 CPUs), 3.25GB RAM.

본 시스템의 동작과정을 상세히 살펴보면 다음과 같다. 도 9-(1)을 보면 중심 키워드인 '고양시청'과 선으로 연결되어 있는 행주산성, 북한산, 서오릉 등이 고양시를 가장 대표하는 키워드들임을 알 수 있다(①). 다음, 고양시청을 중심으로 한 첫 화면에서 오른쪽의 '백과사전'을 클릭(②)하고, '고양시'에 관련된 백과사전 항목들 중 '충장사(고양시)'를 선택하면 해당 페이지(③)를 확인할 수 있다. '행주산성'을 클릭(④)하면 도 9-(2)에 보이는 것처럼 고양시의 대표 키워드 중 하나인 행주산성을 중심으로 지도 영역 내의 키워드들이 재배치되고, 상위 10개의 연관 키워드들이 '행주산성'과 선으로 연결되어 표시된다(⑤). 이 상태에서 지도 우측의 '이미지'를 클릭(⑥)하면, '행주산성'의 이미지는 화면 우측에 10개씩 썸네일(thumbnail)로 표시되고, 각 이미지의 썸네일 클릭시 원본 크기의 이미지가 제공된다. 만약 지도의 좌측에 위치한 블로그 연관 키워드 중 행주산성과 '잔치국수'가 어떤 관련성이 있는지 궁금하여 '잔치국수' 키워드를 클릭(⑦)했을 때, 관련 블로그 하나를 선택(⑧)하고 해당 블로그 내용을 읽고나면, 행주산성에 유명한 원조국수집이 있음을 알 수 있다. 이것은 블로그들의 목록 중 '행주산성 원조국수집' 또는 '행주산성맛집/국수'라는 제목을 통해서도 짐작할 수 있게 된다. 도 10은 도 9에서 중심키워드가 '고양시'에서 '행주산성'으로 바뀌었을 때 맵 인터페이스에 표시되는 데이터들의 변화를 보여준다.Looking at the operation of the system in detail as follows. Referring to FIG. 9- (1), it can be seen that Haengju Fortress, Bukhansan, and Seoo-reung, which are connected to the central keyword 'Goyang City Hall', are the most representative keywords of Goyang City (①). Next, click on 'Encyclopedia' on the right side of the first screen centering on Goyang City Hall (②) and select 'Chungjangsa (Goyang City)' among the encyclopedia items related to 'Goyang City'. Can be. If you click (④) on 'Hangju Acidity', the keywords in the map area will be rearranged based on Haengju Acidity, one of the representative keywords of Goyang, as shown in Fig. 9- (2). It is connected by a line (⑤). If you click (⑥) on the right side of the map in this state, 10 images of 'Hangju Sansung' are displayed as thumbnails on the right side of the screen, and the image of the original size is provided when the thumbnail of each image is clicked. If you click (⑦) the keyword 'Feast Noodles' because you are curious about the relationship between Haengju Sanseong and 'Feast Noodles' among the blog related keywords located on the left side of the map, select one related blog (⑧) After reading it, we can see that there is a famous collection of aid soup in Haengju Fortress. This can be guessed through the title of 'Haengju Sansung Assisted Noodle House Collection' or 'Hangju Sanseong Delicious Restaurant / Noodles' in the list of blogs. FIG. 10 illustrates a change of data displayed on the map interface when the central keyword is changed from 'Goyang-si' to 'Hangju Sanseong' in FIG. 9.

제안한 시스템은 기존의 서비스들이 갖는 한계를 다음과 같이 해결한다. 첫째, 본 발명에서 제안하는 시스템은, 웹상에 존재하는 다양한 종류의 정보들을 대상으로 사용자가 원하는 정보를 자동으로 종합하고 정리하여 제공하는 서비스를 제공한다. 예를 들어 사용자가 알고자 하는 특정 지명에 관한 블로그 정보를 지도 좌측에 연관 키워드로 선택하기만 하면 관련 블로그에 손쉽게 접근할 수 있다. 또한, 오른쪽에 백과사전, 뉴스, 이미지, 고양 군지 정보를 정리하여 보여준다. 이처럼 웹상의 다양한 형태의 정보들을 자동으로 통합/정리하고 관련성이 높은 정보를 사용자에게 제공함으로써, 웹에 개별적으로 존재하는 다양한 정보들을 사용자가 스스로 정리하고 종합하는 것을 줄일 수 있다. 둘째, 지도를 기반으로 지역정보를 제공함으로써 사용자가 검색하려는 대상을 지도상의 실제 위치에 표시함으로써, 추가적인 지리정보 검색을 줄일 수 있다. 셋째, 제안한 시스템은 사용자가 선택한 키워드와 의미적으로 관련성이 높은 지명/비지명 키워드를 연관도 계산 알고리즘을 통해 처리하고, 관련성이 높은 정보만을 선별하여 자동으로 제공한다. 또한, 지도상 관련성이 있는 고유지역 키워드 또는 지도 좌측 블로그 연관 키워드의 클릭만으로도 해당 지역정보를 쉽게 획득할 수 있으므로, 관련 정보들을 얻기 위해 일어나는 불필요한 키워드 입력을 줄일 수 있다.The proposed system solves the limitations of existing services as follows. First, the system proposed by the present invention provides a service that automatically aggregates and organizes information desired by a user for various types of information existing on the web. For example, you can easily access related blogs by simply selecting the blog information about the specific place name you want to know as a related keyword on the left side of the map. In addition, the encyclopedia, news, images, Goyang group information is shown on the right side. As such, by automatically integrating and arranging various types of information on the web and providing relevant information to the user, it is possible to reduce the user's self-organization and synthesis of various pieces of information existing on the web. Second, by providing local information based on a map, an object to be searched by a user is displayed on a real location on a map, thereby reducing additional geographic information search. Third, the proposed system processes names / non-name keywords that are semantically related to the keywords selected by the user through an association calculation algorithm, and automatically selects and provides only relevant information. In addition, since the relevant local information can be easily obtained by simply clicking on a relevant local keyword or a blog related keyword on the left side of the map, unnecessary keyword input occurring to obtain related information can be reduced.

추가로 본 발명에서 요구되는 사항은 다음과 같다. 첫째, 객관적 지역정보 중 '뉴스'나 '블로그'에 대한 정보가 현재는 정적인 정보라는 점이다. 예를 들어, 어떤 장소에서 개최되는 행사에 관한 최신 정보를 쉽게 파악할 수 없다는 것이다. 이것은 지역신문의 행사/축제 관련 기사들을 주기적으로 스크랩하고 분석하여 사용자들이 파악하기 쉬운 형태로 제공함으로써, 향후 실시간성이 반영된 정보 제공을 위한 연구의 수행을 통해 해결할 것이다. 둘째는 사용자들의 기호에 따라 메뉴 구성을 바꿀 수 있는 맞춤형 인터페이스에 대한 요구사항으로, 이는 사용자의 블로그, 백과사전, 뉴스 등의 정보 중 사용자가 원하는 정보만을 제공해주기 위한 방법론 연구를 통해 시스템을 추가 구현하여 해결할 수 있다.Further matters required by the present invention are as follows. First, information about 'news' or 'blog' among objective local information is static information at present. For example, you can't easily keep up-to-date on what's going on in a place. This will be solved by conducting research for providing information reflecting real-time information by scrapping and analyzing articles related to local newspaper events / festival periodically and providing them in a form that users can easily grasp. The second is a requirement for a customized interface that can change the menu configuration according to the user's preference. This is further implemented through a methodology study to provide only the information desired by the user such as blog, encyclopedia, and news. This can be solved.

이상 상술한 본 발명에 따르면, 사용자가 특정 지역의 관련 정보를 자세하고 종합적이며 손쉽게 획득할 수 있도록 지원하는 시스템의 제공을 위해 맵 인터페이스와 지식 처리를 활용하여 지역 관련정보를 통합 검색하는 3 계층의 시스템 모델을 제안한다. 그리고 제안한 모델을 기반으로, 고유지역 키워드들의 추출, 관련 웹 페이지 수집 및 연관 키워드 집합생성, 연관지식생성 알고리즘을 적용한 키워드 간의 연관도 계산, 지도를 활용한 사용자 인터페이스 제작의 4단계 구축방안을 제시하였다. 또한, 실제로 경기도 고양시 지역을 대상으로 하여 시스템을 구축하고 운용해봄으로써, 관련 지역정보 검색의 편의성, 직관적인 정보의 인식, 정보 형태별로의 검색용이, 종합적인 정보 판단 등의 측면에서 장점이 있음을 확인하였다. 이를 통해 제안한 모델과 유사도 행렬을 이용한 지역정보의 지식처리 알고리즘, 사용자의 검색 편의를 돕는 UI 등의 타당성을 검증하였다.According to the present invention as described above, in order to provide a system that enables the user to obtain detailed, comprehensive and easy to obtain the relevant information of a specific region, a three-layer of integrated search for the region-related information using a map interface and knowledge processing We propose a system model. Based on the proposed model, we proposed the four-step construction method of extracting unique keywords, collecting related web pages and generating related keyword sets, calculating the degree of association between keywords using the associated knowledge generation algorithm, and creating a user interface using maps. . In addition, by establishing and operating the system in Goyang-si, Gyeonggi-do, it has advantages in terms of convenience of searching relevant local information, intuitive information recognition, search by information type, and comprehensive information judgment. Confirmed. Through this, we verified the validity of the proposed model and the knowledge processing algorithm of local information using the similarity matrix and the UI for the user's convenience.

본 발명은 단순히 개별 '정보'로 존재하는 지역정보들을 융합하고, 새로운 '지식'을 생산 및 체계화하여 사용자들에게 제공해준다. 이를 통해 사용자는 다양하고 상세한 지역정보들을 제공받을 수 있고, 관련 정보도 쉽게 얻을 수 있게 된다.The present invention simply fuses local information existing as individual 'information', produces and organizes new 'knowledge' and provides it to users. Through this, the user can be provided with various detailed local information, and the related information can be easily obtained.

본 발명은 상술한 특정의 바람직한 실시 예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변형실시가 가능한 것은 물론이고, 그와 같은 변경은 청구범위 기재의 범위 내에 있게 된다.It will be understood by those skilled in the art that various changes in form and details may be made therein without departing from the spirit and scope of the invention as defined in the appended claims and their equivalents. Of course, such modifications are within the scope of the claims.

Claims (10)

지역을 대표하는 대표 키워드를 추출하고, 상기 추출한 대표 키워드를 기반으로 웹으로부터 지역에 대한 다양한 문서들을 수집하여 그룹화하는 제1단계와;
상기 지역을 대표하는 고유지역 키워드를 추출하여 키워드들 간의 연관지식을 생성하는 제2단계와;
지리정보를 기반으로 상기 추출한 고유지역 키워드의 관련정보를 직관적으로 파악할 수 있도록 지도 기반의 인터페이스를 통해 통합적으로 지역정보를 제공해 주는 제3단계를 포함하고,
상기 지도 기반의 인터페이스는,
문화적, 역사적 사실을 기반으로 한 객관적 지역정보와 사용자의 경험이나 의견에 기반한 주관적 지역정보를 함께 제공해주는 것을 특징으로 하는 맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법.
Extracting a representative keyword representing a region, and collecting and grouping various documents about the region from the web based on the extracted representative keyword;
Extracting a unique region keyword representing the region to generate related knowledge between the keywords;
And a third step of providing the integrated local information through a map-based interface so as to intuitively grasp the related information of the extracted unique local keyword based on the geographical information,
The map-based interface,
An integrated retrieval method for local information using a map interface and knowledge processing, which provides objective local information based on cultural and historical facts and subjective local information based on user's experience or opinion.
청구항 1에 있어서, 상기 제1단계의 다양한 문서들은,
해당 지역에 대한 블로그, 뉴스, 사전, 웹 문서, 지역민의 참여 정보, 항공 사진, 수치지도, GIS데이터를 포함하는 것을 특징으로 하는 맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법.
The method of claim 1, wherein the various documents of the first step,
Integrated search method for local information using a map interface and knowledge processing, including blogs, news, dictionaries, web documents, participation information of local people, aerial photographs, digital maps, and GIS data.
청구항 1에 있어서, 상기 제2단계의 지역을 대표하는 고유지역 키워드 추출은,
문화유적 및 문화시설을 지역을 대표하는 고유지역 키워드로 추출하는 것을 특징으로 하는 맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법.
The method according to claim 1, wherein the unique region keyword extraction representing the region of the second step,
Integrated retrieval method for local information using a map interface and knowledge processing, characterized in that the extraction of cultural relics and cultural facilities as unique local keywords representing regions.
청구항 1에 있어서, 상기 제2단계의 연관지식 생성은,
수집한 웹 문서의 태그를 제거하고, 태그가 제거된 웹 문서를 분석(parsing)하여 텍스트를 추출하는 단계와;
상기 추출한 텍스트에 대한 형태소를 분석하는 단계와;
연관 키워드를 추출하는 단계와;
추출한 연관 키워드의 연관 도를 계산하는 단계를 포함하는 것을 특징으로 하는 맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법.
The method according to claim 1, wherein the association knowledge generation of the second step,
Removing the tags of the collected web document, parsing the removed web document, and extracting text;
Analyzing the morpheme for the extracted text;
Extracting an associated keyword;
Comprising a step of calculating the degree of association of the extracted relevant keywords, the integrated search method for local information using the map interface and knowledge processing.
청구항 4에 있어서, 상기 연관도 계산은 유사도 행렬을 이용하여 계산하는 것을 특징으로 하는 맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법.
The method according to claim 4, wherein the correlation calculation is performed using a similarity matrix.
청구항 1에 있어서, 상기 제3단계의 추출한 고유지역 키워드의 관련정보는,
추출한 고유지역 키워드를 중심으로 연관 키워드를 재구성하여 관련정보로 제공해주는 것을 특징으로 하는 맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법.
The method according to claim 1, wherein the relevant information of the extracted unique region keyword of the third step,
Integrated retrieval method for local information using a map interface and knowledge processing, characterized in that the relevant keywords are reconstructed based on the extracted unique area keywords and provided as related information.
삭제delete 청구항 1에 있어서, 상기 객관적 지역정보는,
백과사전, 뉴스, 이미지, 군지 정보를 포함하는 것을 특징으로 하는 맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법.
The method according to claim 1, wherein the objective area information,
Integrated search method for local information using a map interface and knowledge processing, including encyclopedia, news, images, and county information.
청구항 1에 있어서, 상기 제3단계는,
고유지역 키워드들 간의 관련성은 지도에 표시해주고, 상기 고유지역 키워드를 제외한 키워드들 간의 관련성은 지도 표시 영역을 제외한 영역에 표시해주는 것을 특징으로 하는 맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법.
The method of claim 1, wherein the third step,
Integrated search method using local map interface and knowledge processing, characterized in that the relation between the keywords of the unique region is displayed on the map, and that the relations between the keywords except the unique region keyword are displayed in the region except the map display area. .
청구항 9에 있어서, 상기 제3단계는,
위치나 거리에 근거한 관련성과 의미론적 관련성을 함께 제공해주는 것을 특징으로 하는 맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법.
The method of claim 9, wherein the third step,
An integrated retrieval method for local information using a map interface and knowledge processing that provides location and distance-based and semantic relevance together.
KR1020100131738A 2010-12-21 2010-12-21 An Integrated Region-Related Information Searching System applying of Map Interface and Knowledge Processing KR101221959B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020100131738A KR101221959B1 (en) 2010-12-21 2010-12-21 An Integrated Region-Related Information Searching System applying of Map Interface and Knowledge Processing

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020100131738A KR101221959B1 (en) 2010-12-21 2010-12-21 An Integrated Region-Related Information Searching System applying of Map Interface and Knowledge Processing

Publications (2)

Publication Number Publication Date
KR20120070256A KR20120070256A (en) 2012-06-29
KR101221959B1 true KR101221959B1 (en) 2013-01-15

Family

ID=46688159

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100131738A KR101221959B1 (en) 2010-12-21 2010-12-21 An Integrated Region-Related Information Searching System applying of Map Interface and Knowledge Processing

Country Status (1)

Country Link
KR (1) KR101221959B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101527646B1 (en) * 2013-08-14 2015-06-09 한영수 Method and apparatus for acquiring spatial information using data of pubric geographic information system

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103149548B (en) * 2013-01-31 2015-11-18 重庆市电力公司电力科学研究院 A kind of method for information display based on electric power meter and device
KR101677556B1 (en) * 2015-02-17 2016-11-18 주식회사 비아이스트라 Methods of providing ecotourism information
KR101909646B1 (en) * 2017-01-03 2018-12-19 고려대학교 산학협력단 Method and apparatus for sharing experience based on internet of things
KR102185703B1 (en) * 2019-04-05 2020-12-02 연세대학교 산학협력단 Method and Apparatus for Processing Group Keyword Query Based on Spatial Knowledge Base
KR102215100B1 (en) * 2019-06-05 2021-02-09 연세대학교 산학협력단 Apparatus and method for measuring region similarity of spatial entity using spatial knowledge graphs
CN110472066B (en) * 2019-08-07 2022-03-25 北京大学 Construction method of urban geographic semantic knowledge map
KR102129877B1 (en) * 2019-12-06 2020-07-03 강상현 Online tourism souvenir support system based on data analysis technology
KR102178621B1 (en) * 2020-03-13 2020-11-13 조민수 Integrated control system of multiple equipment
KR102457965B1 (en) * 2021-02-18 2022-10-24 한국전자기술연구원 Apparatus and method for integrating fragmented data

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080026948A (en) * 2006-09-22 2008-03-26 숭실대학교산학협력단 Method for related keyword group extraction

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080026948A (en) * 2006-09-22 2008-03-26 숭실대학교산학협력단 Method for related keyword group extraction

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
윤성관 외 4명, ‘연관 키워드 기반의 지리 및 지역정보 검색시스템: 경기21서치 2.0’, 한국GIS학회지, 제17권, 제1호, pp.1-14, 2009년 4월.*
윤성관 외 4명, '연관 키워드 기반의 지리 및 지역정보 검색시스템: 경기21서치 2.0', 한국GIS학회지, 제17권, 제1호, pp.1-14, 2009년 4월. *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101527646B1 (en) * 2013-08-14 2015-06-09 한영수 Method and apparatus for acquiring spatial information using data of pubric geographic information system

Also Published As

Publication number Publication date
KR20120070256A (en) 2012-06-29

Similar Documents

Publication Publication Date Title
KR101221959B1 (en) An Integrated Region-Related Information Searching System applying of Map Interface and Knowledge Processing
Marine-Roig et al. Tourism analytics with massive user-generated content: A case study of Barcelona
JP2011154668A (en) Method for recommending the most appropriate information in real time by properly recognizing main idea of web page and preference of user
Chuang et al. Enabling maps/location searches on mobile devices: Constructing a POI database via focused crawling and information extraction
US8670617B2 (en) Systems and methods for linking content to individual image features
CN102841920A (en) Method and device for extracting webpage frame information
US20100198627A1 (en) System and method for implementing bible based travel
WO2015018247A1 (en) Event multi-dimensional information display device and method
Cai et al. Mining mobility patterns from geotagged photos through semantic trajectory clustering
Tulić Ceballos The impact of Web 3.0 technologies on tourism information systems
Ballatore et al. Special issue introduction: Spatial approaches to information search
Tahmasebzadeh et al. Geowine: Geolocation based wiki, image, news and event retrieval
Abascal-Mena et al. Geo information extraction and processing from travel narratives.
JP5639549B2 (en) Information retrieval apparatus, method, and program
Guo et al. Understanding travel destinations from structured tourism blogs
KR100572751B1 (en) Geographic information system based on web
Lin et al. Displaying spatial epistemologies on web GIS: using visual materials from the Chinese local gazetteers as an example
TW201730832A (en) Operation method for itinerary planning preferably using the application program to click and confirm itinerary and travel route on the map by means of electronic devices
Fränti et al. Location-based search engine for multimedia phones
JP7090779B2 (en) Information processing equipment, information processing methods and information processing systems
Schindling et al. Deepening historical GIS: an integrated database solution for linking people, place and events through unstructured text
Tabarcea et al. Framework for location-aware search engine
US11568004B2 (en) Comparative search within user-generated content
Oliveira et al. Gazetteer enrichment for addressing urban areas: A case study
Bui Automatic construction of POI address lists at city streets from geo-tagged photos and web data: a case study of San Jose City

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20170103

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20171206

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20190708

Year of fee payment: 7