KR20190040700A - Device and method for expressing urban identity using hashtag - Google Patents

Device and method for expressing urban identity using hashtag Download PDF

Info

Publication number
KR20190040700A
KR20190040700A KR1020170130173A KR20170130173A KR20190040700A KR 20190040700 A KR20190040700 A KR 20190040700A KR 1020170130173 A KR1020170130173 A KR 1020170130173A KR 20170130173 A KR20170130173 A KR 20170130173A KR 20190040700 A KR20190040700 A KR 20190040700A
Authority
KR
South Korea
Prior art keywords
location
frequency
city
category
hash tag
Prior art date
Application number
KR1020170130173A
Other languages
Korean (ko)
Inventor
김영철
장기문
Original Assignee
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술원 filed Critical 한국과학기술원
Priority to KR1020170130173A priority Critical patent/KR20190040700A/en
Publication of KR20190040700A publication Critical patent/KR20190040700A/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Remote Sensing (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

The present invention relates to an apparatus for expressing a city identity using a hashtag, and to a method thereof. The apparatus for expressing a city identity using a hashtag collects hashtag keywords related to a city or a specific location of the city on a social network service to classify the hashtag keywords per category; and calculates and adds frequency numbers for each category to express a graphic corresponding to the frequency numbers on a map, thereby allowing people without prior information to easily figure out the city.

Description

해시태그를 이용한 도시 정체성 표현 장치 및 방법{Device and method for expressing urban identity using hashtag}Technical Field [0001] The present invention relates to a device and method for expressing urban identity using a hash tag,

본 발명은 해시태그를 이용한 도시 정체성 표현 장치 및 방법에 관한 것으로서, 구체적으로는 소셜 네트워크 서비스상의 도시 또는 도시의 특정 위치와 관련된 해시태그 키워드를 수집하여 해시태그 키워드를 카테고리 별로 분류하고, 각 카테고리 별로 빈도수를 계산 및 합산 하여 그 빈도수에 대응하는 그래픽을 지도상에 표현함으로서, 사전정보가 없는 사람들도 도시를 쉽게 파악할 수 있도록 하는 해시태그를 이용한 도시 정체성 표현 장치 및 방법에 관한 것이다.The present invention relates to an apparatus and method for expressing urban identity using a hash tag, and more particularly, to a method and apparatus for collecting hash tag keywords related to specific locations of a city or a city on a social network service and classifying the hash tag keywords into categories, And more particularly, to an apparatus and method for expressing urban identity using a hash tag that allows a person who does not have prior information to easily grasp a city by calculating and adding a frequency and displaying a graphic corresponding to the frequency on a map.

도시의 지속 가능한 개발을 위해 도시 정체성을 파악하기 위한 시도들이 있어 왔다. 여기에서, 도시 정체성은 물리적 특수성, 사회적 이미지화 가능성, 정서적 애착 및 만족감 등으로 구성되는 게슈탈트(Gestalt)형의 개념으로 정의 되어진다. 이 개념은 렐프(Relph)가 제안한 도시 정체성을 나타내는 물리적 위치, 활동 및 의미에서 수정되어진 것이다. 따라서, 도시 정체성은 물리적 특수성과 도시의 주관적인 의미로서 나타날 수 있다.Attempts have been made to identify urban identity for sustainable development of the city. Here, urban identity is defined as a Gestalt type concept consisting of physical specificity, social image possibility, emotional attachment and satisfaction. This concept has been modified in the physical location, activity, and meaning of the urban identity proposed by Relph. Thus, urban identity can manifest itself as a physical peculiarity and a subjective meaning of the city.

한국공개특허 제10-2015-0126289호Korean Patent Publication No. 10-2015-0126289 한국등록특허 제10-1713558호Korean Patent No. 10-1713558

본 발명은 소셜 네트워크 서비스상의 도시 또는 도시의 특정 위치와 관련된 해시태그 키워드를 수집하여 해시태그 키워드를 카테고리 별로 분류하고, 각 카테고리 별로 빈도수를 계산 및 합산 하여 그 빈도수에 대응하는 그래픽을 지도상에 표현함으로써, 사전정보가 없는 사람들도 도시를 쉽게 파악할 수 있도록 하는 해시태그를 이용한 도시 정체성 표현 장치 및 방법의 제공을 목적으로 한다.The present invention collects hash tag keywords related to specific locations of a city or a city on a social network service, classifies the hash tag keywords according to categories, calculates and adds frequency numbers for each category, and displays a graphic corresponding to the frequency on a map The present invention also provides an apparatus and method for expressing urban identity using a hash tag that allows people without prior information to easily grasp the city.

본 발명의 목적을 실현하기 위한 해시태그를 이용한 도시 정체성 표현 장치는, 소셜 네트워크 서비스(Social Network Service, SNS)의 검색 엔진을 이용하여 위치를 검색하고, 위치를 포함하는 해시태그(Hashtag)의 데이터를 수집하는 수집부; 상기 데이터를 CSV(Comma Separated Value) 파일의 메타데이터(Metadata)로 추출하는 제1 추출부; 상기 메타데이터의 캡션텍스트(Caption Text)열에서, 해시태그 키워드(Hashtag Keyword)를 추출하는 제2 추출부; 상기 해시태그 키워드에서 상기 소셜 네트워크 서비스와 관련된 불용어(Stopwords)의 제거를 수행하는 제거부; 상기 불용어가 제거된 상기 해시태그 키워드를 카테고리 별로 분류하는 분류부; 상기 불용어가 제거된 상기 해시태그 키워드를 카운팅 하여 빈도수를 계산하고, 상기 카테고리 별로 상기 해시태그 키워드의 빈도수를 합산하는 연산부; 상기 카테고리 별로 각 빈도수에 대응하여 반지름을 갖는 동심원을 형성하며, 상기 동심원을 카테고리에 따라 지정된 색상으로 표현하는 그래픽부; 및 상기 동심원을 상기 위치가 나타나는 지도에 오버랩 하는 오버랩 표현부를 포함한다.An urban identity expression apparatus using a hash tag for realizing the object of the present invention searches for a location by using a search engine of a social network service (SNS), and stores the data of a hash tag (Hashtag) A collecting unit for collecting the collected objects; A first extracting unit for extracting the data as a metadata of a CSV (Comma Separated Value) file; A second extracting unit for extracting a hash tag keyword in a caption text column of the metadata; A removal unit configured to remove the stopwords related to the social network service from the hashtag keyword; A classification unit for classifying the hash tag keywords in which the stopwords have been removed, by category; A calculation unit for counting the hashtag keywords from which the stopwords have been removed to calculate a frequency, and adding the frequencies of the hashtag keywords according to the categories; A graphical unit for forming a concentric circle having a radius corresponding to each frequency in each of the categories and representing the concentric circle in a color designated according to the category; And an overlap expression unit for overlapping the concentric circle with the map on which the position appears.

이때, 상기 수집부는, 소셜 네트워크 서비스의 검색 엔진을 이용하여 도시를 검색하고, 상기 위치를 포함하는 해시태그의 데이터를 수집하여 상기 위치 텍스트의 빈도수를 계산하는 제1 계산부; 및 소셜 네트워크 서비스상에서 도시내 상기 위치의 체크인(Check-in) 포인트 밀도를 계산하는 제2 계산부를 더 포함할 수 있다.The collecting unit may include a first calculating unit for searching a city using a search engine of a social network service, collecting data of a hash tag including the location, and calculating a frequency of the location text; And a second calculation unit for calculating a check-in point density of the location in the city on the social network service.

또한, 상기 수집부는, 상기 위치 텍스트의 빈도수 또는 상기 위치의 체크인 포인트 밀도가 소정의 임계 빈도수 또는 소정의 임계 밀도 이상일때, 상기 도시의 상기 위치를 검색 대상으로 설정하는 설정부를 더 포함할 수 있다.The collecting unit may further include a setting unit that sets the location of the city as a search target when the frequency of the location text or the check-in point density of the location is a predetermined threshold frequency or a predetermined threshold density or more.

한편, 상기 제2 추출부는, 언태그(Un-tag)된 텍스트는 제외시킬 수 있다.On the other hand, the second extracting unit may exclude un-tagged text.

또한, 상기 분류부는, 상기 카테고리의 빈도수가 소정의 임계 빈도수 미만일때, 상기 카테고리를 삭제시킬 수 있다.The classifying unit may delete the category when the frequency of the category is less than a predetermined threshold frequency.

본 발명의 목적을 실현하기 위한 해시태그를 이용한 도시 정체성 표현 방법은, (a) 소셜 네트워크 서비스의 검색 엔진을 이용하여 위치를 검색하고, 위치를 포함하는 해시태그의 데이터를 수집하는 단계; (b) 상기 데이터를 CSV 파일의 메타데이터로 추출하는 단계; (c) 상기 메타데이터의 캡션텍스트 열에서, 해시태그 키워드를 추출하는 단계; (d) 상기 해시태그 키워드에서 상기 소셜 네트워크 서비스와 관련된 불용어의 제거를 수행하는 단계; (e) 상기 불용어가 제거된 상기 해시태그 키워드를 카테고리 별로 분류하는 단계; (f) 상기 불용어가 제거된 상기 해시태그 키워드를 카운팅 하여 빈도수를 계산하고, 상기 카테고리 별로 상기 해시태그 키워드의 빈도수를 합산하는 단계; (g) 상기 카테고리 별로 각 빈도수에 대응하여 반지름을 갖는 동심원을 형성하며, 상기 동심원을 카테고리에 따라 지정된 색상으로 표현하는 단계; 및 (h) 상기 동심원을 상기 위치가 나타나는 지도에 오버랩 하는 단계를 포함한다. A method of representing a city identity using a hash tag for realizing the object of the present invention includes the steps of: (a) searching for a location using a search engine of a social network service and collecting data of a hash tag including a location; (b) extracting the data as metadata of a CSV file; (c) extracting a hash tag keyword in a caption text string of the metadata; (d) performing removal of an abbreviation relating to the social network service from the hashtag keyword; (e) classifying the hash tag keywords from which the stopwords have been removed, by category; (f) counting the hash tag keywords from which the stopwords are removed, calculating a frequency, and summing the frequencies of the hash tag keywords for each category; (g) forming a concentric circle having a radius corresponding to each frequency of each of the categories, and expressing the concentric circle in a color designated according to the category; And (h) overlapping the concentric circle with the map on which the location appears.

이때, 상기 (a) 단계는, 소셜 네트워크 서비스의 검색 엔진을 이용하여 도시를 검색하고, 상기 위치를 포함하는 해시태그의 데이터를 수집하여 상기 위치 텍스트의 빈도수를 계산하는 단계; 및 소셜 네트워크 서비스상에서 도시내 상기 위치의 체크인 포인트 밀도를 계산하는 단계로 수행될 수 있다.The step (a) may include searching a city using a search engine of a social network service, collecting data of a hash tag including the location, and calculating a frequency of the location text; And computing the check-in point density of the location in the city on the social network service.

또한, 상기 (a) 단계는, 상기 위치 텍스트의 빈도수 또는 상기 위치의 체크인 포인트 밀도가 소정의 임계 빈도수 또는 소정의 임계 밀도 이상일 때, 상기 도시의 상기 위치를 검색 대상으로 설정할 수 있다. The step (a) may set the location of the city as a search target when the frequency of the location text or the check-in point density of the location is a predetermined threshold frequency or a predetermined threshold density or more.

한편, 상기 (c) 단계는, 언태그된 텍스트는 제외시킬 수 있다.Meanwhile, in the step (c), untagged text may be excluded.

또한, 상기 (e) 단계는, 상기 카테고리의 빈도수가 소정의 임계 빈도수 미만일때, 상기 카테고리를 삭제시킬 수 있다.The step (e) may delete the category when the frequency of the category is less than a predetermined threshold frequency.

본 발명에 따른 해시태그를 이용한 도시 정체성 표현 장치 및 방법에 의하면,According to the apparatus and method for representing city identity using a hash tag according to the present invention,

첫째, 체크인 포인트 밀도 또는 위치 텍스트의 빈도수를 활용하여 도시에서 중요한 의미를 갖는 특정 위치를 설정할 수 있다.First, it is possible to set a specific position having important meaning in the city by utilizing the density of the check-in point or the frequency of the location text.

둘째, 소셜 네트워크 서비스 상의 해시태그 키워드를 카운팅 하여 빈도수를 계산하고, 카테고리 별로 분류하여 합산할 수 있다.Second, the hash tag keywords on the social network service can be counted to calculate the frequency, and classified by category and summed up.

셋째, 소정 임계 미만의 빈도수를 갖는 카테고리를 삭제하여, 상대적으로 더욱 중요한 카테고리를 부각시킴으로서 도시를 효과적으로 표현할 수 있다.Third, a category having a frequency lower than a predetermined threshold can be deleted, and a city can be effectively expressed by highlighting a relatively more important category.

넷째, 카테고리 별로 지정된 색상의 동심원을 표현하여, 도시를 이미지화함으로써, 사전 정보가 없는 사람들로 하여금 한눈에 쉽게 도시를 알아볼 수 있도록 표현할 수 있다.Fourth, by concentrating the concentric circles of the colors designated for each category, the city can be imaged so that people without prior information can easily recognize the city at a glance.

다섯째, 각 동심원 반지름의 크기가 각 카테고리의 빈도수에 대응하여 표현되므로, 사전 정보가 없는 사람들도 도시의 정체성을 쉽게 파악할 수 있다.Fifth, since the size of each concentric circle radius is expressed in correspondence with the frequency of each category, people without prior information can easily grasp the identity of the city.

도 1은 본 발명에 따른 해시태그를 이용한 도시 정체성 표현 장치의 블록도이다.
도 2는 도 1에 도시된 수집부의 세부 블록도이다.
도 3은 본 발명에 따른 해시태그를 이용한 도시 정체성 표현 방법의 알고리즘 흐름도이다.
도 4는 도 3에 도시된 해시태그의 데이터 수집 단계의 세부 알고리즘 흐름도이다.
도 5는 해시태그 키워드를 카테고리 별로 분류하고, 서로 다른 색상을 지정한 표이다.
도 6은 해시태그 키워드를 카테고리 별로 분류하고 빈도수를 계산 하고 합산한 표이다.
도 7은 위치가 나타나는 지도에 동심원을 오버랩 한 모식도이다.
1 is a block diagram of an apparatus for representing an urban identity using a hash tag according to the present invention.
2 is a detailed block diagram of the collector shown in Fig.
3 is a flowchart illustrating an algorithm for representing a city identity using a hash tag according to the present invention.
4 is a detailed algorithm flow chart of the data collection step of the hash tag shown in FIG.
5 is a table in which hash tag keywords are classified according to categories and different colors are designated.
FIG. 6 is a table in which the hash tag keywords are classified according to categories, and the frequency numbers are calculated and added.
7 is a schematic diagram in which a concentric circle overlaps a map in which a position appears.

이하 첨부한 도면들을 참조하여 본 발명의 바람직한 실시예를 보다 상세하게 설명한다. 이때, 첨부된 도면에서 동일한 구성 요소는 가능한 동일한 부호로 나타내고 있음에 유의한다. 또한, 본 발명의 요지를 흐리게 할 수 있는 공지 기능 및 구성에 대한 상세한 설명은 생략할 것이다. 마찬가지 이유로 첨부 도면에 있어서 일부 구성 요소는 과장되거나 생략되거나 개략적으로 도시되었다.DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Reference will now be made in detail to the preferred embodiments of the present invention, examples of which are illustrated in the accompanying drawings. Note that, in the drawings, the same components are denoted by the same reference symbols as possible. Further, the detailed description of known functions and configurations that may obscure the gist of the present invention will be omitted. For the same reason, some of the components in the drawings are exaggerated, omitted, or schematically illustrated.

본 발명에서 언급하는 '이용자'는 소셜 네트워크 서비스를 이용하는 이용자를 의미한다.The 'user' referred to in the present invention means a user who uses a social network service.

도시 정체성을 파악하기 위한 가장 일반적인 방법으로는 SNS상의 체크인(Check-in) 포인트를 활용한 기법으로서, 체크인 포인트의 분포도를 파악하여 도시에서의 공간적으로 중요한 위치를 확인하기 위한 기법 등이 있다.One of the most common methods for identifying urban identity is to use check-in points on the SNS, and to identify spatially significant locations in the city by identifying the distribution of check-in points.

하지만, SNS상의 체크인 포인트 분포를 활용한 도시의 중요 위치 확인 기법은 Wi-Fi 연결이 불안정하거나, SNS 이용자가 야외 공간에서 분위기를 즐기려는 심리적인 욕구로 인해 소극적으로 무선 장치를 사용하여 실시간 사진 공유를 비활성화 하며, 대신 일상 공간으로 돌아가 해시태그를 사용하여 사진을 업로드 하는 행동 패턴 등에 의해 정확하지 않을 수 있다.However, due to the unstable Wi-Fi connection and the psychological desire for SNS users to enjoy the atmosphere in the outdoor space, the city's important location identification technique utilizing the distribution of check-in points in the SNS can be used for real- And may instead be inaccurate due to behavioral patterns such as returning to the daily space and uploading photos using a hashtag.

또한, 도시에서 특정 위치의 체크인 포인트 분포 조사 뿐만 아니라, 설문조사, 인터뷰 등이 도시의 정체성을 파악하는데 이용 됐던 조사 기법이다. 하지만, 주관적인 기법으로서 신뢰성에 문제점이 있다.In addition, surveying methods such as questionnaires, interviews, etc. were used to identify urban identities, as well as the distribution of check-in points at specific locations in the city. However, there is a problem in reliability as a subjective technique.

소셜 네트워크 서비스는 기존에 형성된 오프라인 인맥을 중심으로 온라인에서 소통하는 방식인 싸이월드(Cyworld)의 미니홈피나 블로그, 스마트폰의 등장과 함께 타임라인 형식으로 단문형태의 메시지를 실시간으로 주고받는 트위터(Twitter)나 페이스북(Facebook), 관심사나 취미 등 특정한 주제를 중심으로 공유하는 사용자 맞춤형 서비스인 텀블러(Tumblr), 핀터레스트(Pinterest), 인스타그램(Instagram)과 같은 것일 수 있다.The social network service is Cyworld 's mini - homepage, blog, and smartphone, which is a way to communicate online with existing offline network connections, and Twitter Such as Tumblr, Pinterest, and Instagram, which are customized services that are shared around specific topics such as Twitter, Facebook, and interests and hobbies.

도 1은 본 발명에 따른 해시태그를 이용한 도시 정체성 표현 장치(1000)의 블록도이다. 도 2는 도 1에 도시된 수집부(100)의 세부 블록도이다.1 is a block diagram of an apparatus 1000 for representing an urban identity using a hash tag according to the present invention. 2 is a detailed block diagram of the collecting unit 100 shown in FIG.

도 1 및 도 2를 참조하면, 본 발명에 따른 해시태그를 이용한 도시 정체성 표현 장치(1000)는 수집부(100), 제1 추출부(200), 제2 추출부(300), 제거부(400), 분류부(500), 연산부(600), 그래픽부(700), 오버랩 표현부(800)를 포함한다.1 and 2, an apparatus 1000 for representing an urban identity using a hash tag according to the present invention includes a collecting unit 100, a first extracting unit 200, a second extracting unit 300, 400, a classifier 500, an operation unit 600, a graphic unit 700, and an overlap expression unit 800.

수집부(100)는 소설네트워크 서비스의 검색 엔진을 이용하여 위치를 검색하고, 위치를 포함하는 해시태그의 데이터를 수집한다. The collection unit 100 searches for a location using a search engine of a novel network service, and collects data of a hash tag including a location.

여기에서, 위치는 소셜 네트워크 서비스 상에서 이용자들에 의해 많이 체크인 되거나 소셜 네트워크 상에 해시태그와 함께 업로드되는 장소로서, 도시에서 소셜 네트워크 서비스의 이용자들이 특정 도시에서 자주 이용하거나 언급하여 중요하다고 인식되는 위치일 수 있다. 위치는 특정 도시에서 지명, 기차역, 공원, 백화점, 길거리 등과 같은 특정 장소를 의미할 수 있다. 또한, 도시에서 특정 위치는 아래에 기술하는 방법과 같이 정량적으로 설정될 수 있다. Here, the location is a place that is often checked in by users on the social network service or uploaded with the hashtag on the social network, where the users of the social network service in the city are identified as important Lt; / RTI > A location may refer to a specific place in a particular city, such as a place name, a train station, a park, a department store, a street, and the like. In addition, a specific position in the city can be quantitatively set as described below.

예를 들어, 분당시와 같은 특정 도시를 소셜 네트워크 서비스의 검색 엔진에 검색 하면, 제1 계산부(110)는 위치를 포함하는 해시태그의 데이터를 수집하여 위치 텍스트의 빈도수를 계산할 수 있다. 이때, 위치를 포함하는 해시태그의 데이터는 소셜 네트워크 서비스의 이용자가 해시태그를 사용하여 분당시와 같은 특정 도시와 함께 해시태그를 이용하여 특정 위치를 소설 네트워크 서비스 상에 함께 업로드 한 것일 수 있고, 해시태그를 이용하지 않은 텍스트는 수집되지 않을 수 있다.For example, when a specific city such as a minute-by-minute is searched by a search engine of a social network service, the first calculation unit 110 may collect data of a hash tag including a location and calculate a frequency of the location text. At this time, the data of the hashtag including the location may be the user of the social network service uploading the specific location together with the specific city such as the minutes of the minute, using the hashtag, together with the hashtag on the novel network service, Text without hashtags may not be collected.

또한, 분당시와 같은 특정 도시를 소셜 네트워크 서비스의 검색 엔진을 통해 검색 하면, 제2 계산부(120)는 소셜 네트워크 서비스상에서 지명, 기차역, 공원, 백화점, 길거리 등과 같은 특정 위치의 체크인 포인트 밀도를 계산할 수 있다. 여기에서, 체크인은 소셜 네트워크 서비스의 이용자가 분당시와 같은 특정 도시내 특정 위치에서 자신의 친구들에게 자신의 위치를 알리기 위한 것으로서, 소셜 네트워크 서비스 상의 기능일 수 있다.In addition, if a specific city such as the city of minutes is searched through a search engine of a social network service, the second calculation unit 120 calculates a check-in point density of a specific location such as a place name, a train station, a park, a department store, Can be calculated. Here, check-in is for a user of a social network service to inform his / her friends of his / her location at a specific location in a specific city such as Bundang City, and may be a function on a social network service.

설정부(130)는 제1 계산부(110)에서 계산한 위치 텍스트의 빈도수 또는 제2 계산부(120)에서 계산한 위치의 체크인 포인트 밀도를 이용하여 위치 텍스트의 빈도수 또는 위치의 체크인 포인트 밀도가 소정의 임계 빈도수 또는 소정의 임계 밀도 이상일때, 특정 도시의 위치를 검색 대상으로 설정할 수 있다.The setting unit 130 sets the checkpoint density of the location text or the location of the location text using the frequency of the location text calculated by the first calculator 110 or the checkpoint density of the location calculated by the second calculator 120 When a predetermined threshold frequency or a predetermined threshold density or more, the location of a specific city can be set as a search target.

수집부(100)는 이와 같은 방법으로 소셜 네트워크 상에서 해시태그와 함께 많이 업로드 되는 특정 도시의 특정 위치를 설정하고, 소셜 네트워크 서비스의 검색 엔진에 위치를 검색하면, 위치를 포함하는 해시태그의 데이터를 수집한다. The collecting unit 100 sets a specific location of a particular city to be uploaded together with a hash tag on the social network in this way, and searches for a location in a search engine of a social network service, Collect.

제1 추출부(200)는 위치를 포함하는 해시태그의 데이터를 CSV 파일 형식의 메타데이터로 추출한다. CSV 파일 형식의 메타데이터는 생성 날짜, 캡션텍스트, 위도, 경도 등을 포함할 수 있다.The first extracting unit 200 extracts the data of the hash tag including the position into the metadata of the CSV file format. The metadata of the CSV file format may include creation date, caption text, latitude, longitude, and the like.

제2 추출부(300)는 메타데이터의 캡션텍스트 열에서 해시태그 키워드를 추출한다. 또한, 제2 추출부(300)는 메타데이터의 캡션텍스트 열에서 언태그된 텍스트는 제외시킬 수 있다.The second extracting unit 300 extracts a hash tag keyword from the caption text string of the metadata. Also, the second extracting unit 300 may exclude the untagged text from the caption text string of the metadata.

제거부(400)는 해시태그 키워드에서 인스타, 타그램, 팔로우, 좋아요, OOTD(Outfit Of The Day) 등과 같은 소셜 네트워크 서비스와 관련된 불용어를 제거한다. The removal unit 400 removes an abbreviation related to a social network service such as an instance, a tag, a follow, a good, and an outfit of the day (OOTD) from a hash tag keyword.

분류부(500)는 불용어가 제거된 하위 개념의 해시태그 키워드를 관광, 데이트, 스포츠, 문화 예술, 식사, 직장 등과 같은 상위 개념의 카테고리 별로 분류한다. 예를 들어, 드링크, 맥주, 브런치, 카페, 치킨, 소주, 스시, 스타벅스 등과 같은 하위 개념의 해시태그 키워드는 식사와 같은 상위 개념의 카테고리로 분류될 수 있고, 발레, 사이클, 골프, 헬스, 필라테스, 스트레칭, 웨이트 트레이닝 등과 같은 하위 개념의 해시태그 키워드는 스포츠와 같은 상위 개념의 해시태그로 분류될 수 있다. 또한, 버스킹, 콘서트, 백화점 문화 센터, 힙합, 영화, 박물관 등과 같은 하위 개념의 해시태그 키워드는 문화 예술과 같은 상위 개념의 카테고리로 분류될 수 있다.The classification unit 500 classifies the hash tag keywords of the lower concept from which the stopwords have been removed into categories of upper concept such as sightseeing, date, sports, culture art, meal, work, and the like. For example, sub-concept hashtag keywords such as drinks, beer, brunch, cafe, chicken, shochu, sushi, and Starbucks can be classified into categories of superior concepts such as meals, ballet, cycle, golf, Sub-concept hashtag keywords such as pilates, stretching, weight training, etc. can be classified into hashtags of the upper concept such as sports. In addition, sub-concept hash tag keywords such as bus kings, concerts, department store culture centers, hip-hop, movies, museums, etc. can be classified into categories of upper concept such as culture and art.

연산부(600)는 불용어가 제거된 해시태그 키워드를 카운팅 하여 빈도수를 계산하고, 카테고리 별로 해시태그 키워드의 빈도수를 합산한다. 여기에서, 분류부(500)는 카테고리의 빈도수가 소정의 임계 빈도수 미만일 때, 카테고리를 삭제시킬 수 있다. 예를 들어, 관광 카테고리의 빈도수가 5000건이고, 데이트 카테고리의 빈도수가 6000건이며, 스포츠의 카테고리가 120건이면, 임계 빈도수를 3000건으로 지정하여 임계 빈도수 미만의 스포츠의 카테고리를 삭제함으로서, 특정 위치에서 관광과 데이트 카테고리를 상대적으로 부각시켜 특정 위치의 특징을 효과적으로 나타낼 수 있다.The operation unit 600 counts the hash tag keywords from which the stopwords are removed, calculates the frequency, and sums the frequencies of the hash tag keywords for each category. Here, the classifying section 500 can delete the category when the frequency of the category is less than the predetermined threshold frequency. For example, if the frequency of the tourism category is 5000, the frequency of the date category is 6000, and the category of the sports is 120, by designating the threshold frequency to 3000 and deleting the category of sports below the critical frequency, It is possible to effectively express the characteristic of the specific location by relatively highlighting the tourist and date category.

그래픽부(700)는 카테고리 별로 각 빈도수에 대응하여 반지름을 갖는 동심원을 형성하며, 동심원은 카테고리에 따라 지정된 색상으로 표현된다. 동심원의 색상은 R 소프트웨어의 색상 목록에서 지정될 수 있다.The graphic unit 700 forms a concentric circle having a radius corresponding to each frequency by category, and the concentric circle is expressed by a color designated according to the category. The color of concentric circles can be specified in the color list of the R software.

오버랩 표현부(800)는 위치를 포함하는 도시가 나타나는 지도에 동심원을 오버랩한다. 오버랩 표현부(800)는 수집부(100)의 설정부(130)에서 설정된 위치를 포함하는 기존 지도를 불러올 수 있다.The overlap expression unit 800 overlaps the concentric circle on the map where the city including the position appears. The overlapped expression unit 800 may retrieve an existing map including a location set in the setting unit 130 of the collection unit 100. [

도 3은 본 발명에 따른 해시태그를 이용한 도시 정체성 표현 방법의 알고리즘 흐름도이고, 도 1의 해시태그를 이용한 도시 정체성 표현 장치(1000)를 시계열적으로 구현한 경우에도 본 실시예에 해당하므로 수집부(100), 제1 추출부(200), 제2 추출부(300), 제거부(400), 분류부(500), 연산부(600), 그래픽부(700), 오버랩 표현부(800)에 대하여 설명된 부분은 본 실시예에서도 그대로 적용되며, 도 4는 도 3에 도시된 해시태그의 데이터 수집 단계의 세부 알고리즘 흐름도이고, 도 2의 도 1에 도시된 수집부의 세부 블록도를 시계열적으로 구현한 경우에도 본 실시예에 해당하므로 제1 계산부(110), 제2 계산부(120), 설정부(130)에 대하여 설명된 부분은 본 실시예에서도 그대로 적용된다.FIG. 3 is a flowchart of an algorithm for representing a city identity using a hash tag according to the present invention. Even when the city identity representation apparatus 1000 using the hashtag of FIG. 1 is implemented in a time-series manner, The first extracting unit 200, the second extracting unit 300, the removing unit 400, the classifying unit 500, the calculating unit 600, the graphic unit 700, and the overlap display unit 800 Fig. 4 is a detailed algorithm flowchart of the data collection step of the hash tag shown in Fig. 3, and a detailed block diagram of the collection unit shown in Fig. 1 of Fig. 2 is shown in a time-series manner The present invention is applied to the first calculation unit 110, the second calculation unit 120 and the setting unit 130 as they are in the present embodiment.

도 3 및 도 4를 참조하면, 본 발명에 따른 해시태그를 이용한 도시 정체성 표현 방법은 해시태그의 데이터 수집단계(S100), 메타데이터 추출단계(S200), 해시태그 키워드 추출단계(S300), 불용어 제거단계(S400), 카테고리 분류단계(S500), 빈도수 계산 및 합산단계(S600), 동심원 형성 및 색상지정 단계(S700) 및 지도에 동심원을 오버랩하는 단계(S800) 순으로 수행된다.3 and 4, a method for representing a city identity using a hash tag according to the present invention includes a hash tag data collection step S100, a metadata extraction step S200, a hash tag keyword extraction step S300, (Step S400), a category classification step S500, a frequency calculation and summation step S600, a concentric circle formation and color designation step S700, and a step of overlapping concentric circles on the map S800.

S100 단계에서, 수집부(100)는 소셜 네트워크 서비스의 검색 엔진을 이용하여 위치를 검색하고, 위치를 포함하는 해시태그의 데이터를 수집한다.In step S100, the collecting unit 100 searches for a location using a search engine of a social network service, and collects data of a hash tag including a location.

여기에서, 위치는 소셜 네트워크 서비스 상에서 이용자들에 의해 많이 체크인 되거나 소셜 네트워크 상에 해시태그와 함께 업로드되는 장소로서, 도시에서 소셜 네트워크 서비스의 이용자들이 특정 도시에서 자주 이용하거나 언급하여 중요하다고 인식되는 위치일 수 있다. 위치는 특정 도시에서 지명, 기차역, 공원, 백화점, 길거리 등과 같은 특정 장소를 의미할 수 있다. 또한, 도시에서 특정 위치는 아래에 기술하는 방법과 같이 정량적으로 설정될 수 있다. Here, the location is a place that is often checked in by users on the social network service or uploaded with the hashtag on the social network, where the users of the social network service in the city are identified as important Lt; / RTI > A location may refer to a specific place in a particular city, such as a place name, a train station, a park, a department store, a street, and the like. In addition, a specific position in the city can be quantitatively set as described below.

예를 들어, S110 단계에서, 분당시와 같은 특정 도시를 소셜 네트워크 서비스의 검색 엔진에 검색 하면, 제1 계산부(110)는 위치를 포함하는 해시태그의 데이터를 수집하여 위치 텍스트의 빈도수를 계산할 수 있다. 이때, 위치를 포함하는 해시태그의 데이터는 소셜 네트워크 서비스의 이용자가 해시태그를 사용하여 분당시와 같은 특정 도시와 함께 해시태그를 이용하여 특정 위치를 소설 네트워크 서비스 상에 함께 업로드 한 것일 수 있고, 해시태그를 이용하지 않은 텍스트는 수집되지 않을 수 있다.For example, if it is determined in step S110 that a specific city such as the city of minutes is searched by the search engine of the social network service, the first calculation unit 110 collects the data of the hash tag including the location to calculate the frequency of the location text . At this time, the data of the hashtag including the location may be the user of the social network service uploading the specific location together with the specific city such as the minutes of the minute, using the hashtag, together with the hashtag on the novel network service, Text without hashtags may not be collected.

또한, S120 단계에서, 분당시와 같은 특정 도시를 소셜 네트워크 서비스의 검색 엔진을 통해 검색 하면, 제2 계산부(120)는 소셜 네트워크 서비스상에서 지명, 기차역, 공원, 백화점, 길거리 등과 같은 특정 위치의 체크인 포인트 밀도를 계산할 수 있다. 여기에서, 체크인은 소셜 네트워크 서비스의 이용자가 분당시와 같은 특정 도시내 특정 위치에서 자신의 친구들에게 자신의 위치를 알리기 위한 것으로서, 소셜 네트워크 서비스 상의 기능일 수 있다.In step S120, when a specific city such as a minute of the minute is searched through a search engine of the social network service, the second calculation unit 120 calculates a specific location such as a place name, a train station, a park, a department store, Check-in point density can be calculated. Here, check-in is for a user of a social network service to inform his / her friends of his / her location at a specific location in a specific city such as Bundang City, and may be a function on a social network service.

S130 단계에서, 설정부(130)는 제1 계산부(110)에서 계산한 위치 텍스트의 빈도수 또는 제2 계산부(120)에서 계산한 위치의 체크인 포인트 밀도를 이용하여 위치 텍스트의 빈도수 또는 위치의 체크인 포인트 밀도가 소정의 임계 빈도수 또는 소정의 임계 밀도 이상일때, 특정 도시의 위치를 검색 대상으로 설정할 수 있다. 따라서, S100 단계의 수집부(100)는 이와 같은 방법으로 소셜 네트워크 상에서 해시태그와 함께 많이 업로드 되는 특정 도시의 특정 위치를 설정하고, 소셜 네트워크 서비스의 검색 엔진에 위치를 검색하면, 위치를 포함하는 해시태그의 데이터를 수집한다. In step S130, the setting unit 130 sets the frequency or position of the position text using the frequency of the position text calculated by the first calculation unit 110 or the check-in point density of the position calculated by the second calculation unit 120 When the check-in point density is equal to or greater than a predetermined threshold frequency or a predetermined threshold density, the location of a specific city can be set as a search target. Accordingly, the collecting unit 100 in step S100 sets a specific location of a particular city to be uploaded with the hash tag on the social network in this manner, and when searching the location in the search engine of the social network service, Collect the data of the hashtag.

S200 단계에서, 제1 추출부(200)는 위치를 포함하는 해시태그의 데이터를 CSV 파일 형식의 메타데이터로 추출한다. CSV 파일 형식의 메타데이터는 생성 날짜, 캡션텍스트, 위도, 경도 등을 포함할 수 있다.In step S200, the first extracting unit 200 extracts the data of the hash tag including the position into the metadata of the CSV file format. The metadata of the CSV file format may include creation date, caption text, latitude, longitude, and the like.

S300 단계에서, 제2 추출부(300)는 메타데이터의 캡션텍스트 열에서 해시태그 키워드를 추출한다. 또한, 제2 추출부(300)는 메타데이터의 캡션텍스트 열에서 언태그된 텍스트는 제외시킬 수 있다.In step S300, the second extraction unit 300 extracts a hash tag keyword from the caption text string of the metadata. Also, the second extracting unit 300 may exclude the untagged text from the caption text string of the metadata.

S400 단계에서, 제거부(400)는 해시태그 키워드에서 인스타, 타그램, 팔로우, 좋아요, OOTD(Outfit Of The Day) 등과 같은 소셜 네트워크 서비스와 관련된 불용어를 제거한다.In step S400, the removal unit 400 removes an idiom associated with a social network service such as an instance, a tag, a follow, a favorite, and Out of the Day (OOTD) from a hash tag keyword.

S500 단계에서, 분류부(500)는 불용어가 제거된 하위 개념의 해시태그 키워드를 관광, 데이트, 스포츠, 문화 예술, 식사, 직장 등과 같은 상위 개념의 카테고리 별로 분류한다. 예를 들어, 드링크, 맥주, 브런치, 카페, 치킨, 소주, 스시, 스타벅스 등과 같은 하위 개념의 해시태그 키워드는 식사와 같은 상위 개념의 카테고리로 분류될 수 있고, 발레, 사이클, 골프, 헬스, 필라테스, 스트레칭, 웨이트 트레이닝 등과 같은 하위 개념의 해시태그 키워드는 스포츠와 같은 상위 개념의 해시태그로 분류될 수 있다. 또한, 버스킹, 콘서트, 백화점 문화 센터, 힙합, 영화, 박물관 등과 같은 하위 개념의 해시태그 키워드는 문화 예술과 같은 상위 개념의 카테고리로 분류될 수 있다.In step S500, the classifying unit 500 classifies the hash tag keywords of the lower concept from which the stopwords have been removed into categories of superior concept such as sightseeing, date, sports, culture art, meal, work, For example, sub-concept hashtag keywords such as drinks, beer, brunch, cafe, chicken, shochu, sushi, and Starbucks can be classified into categories of superior concepts such as meals, ballet, cycle, golf, Sub-concept hashtag keywords such as pilates, stretching, weight training, etc. can be classified into hashtags of the upper concept such as sports. In addition, sub-concept hash tag keywords such as bus kings, concerts, department store culture centers, hip-hop, movies, museums, etc. can be classified into categories of upper concept such as culture and art.

S600 단계에서, 연산부(600)는 불용어가 제거된 해시태그 키워드를 카운팅 하여 빈도수를 계산하고, 카테고리 별로 해시태그 키워드의 빈도수를 합산한다. 여기에서, 분류부(500)는 카테고리의 빈도수가 소정의 임계 빈도수 미만일때, 카테고리를 삭제시킬 수 있다. 예를 들어, 관광 카테고리의 빈도수가 5000건이고, 데이트 카테고리의 빈도수가 6000건이며, 스포츠의 카테고리가 120건이면, 임계 빈도수를 3000건으로 지정하여 임계 빈도수 미만의 스포츠의 카테고리를 삭제함으로서, 특정 위치에서 관광과 데이트 카테고리를 상대적으로 부각시켜 특정 위치의 특징을 효과적으로 나타낼 수 있다.In operation S600, the operation unit 600 counts the hash tag keywords from which the stopwords are removed, calculates the frequency, and sums the frequencies of the hash tag keywords for each category. Here, the classifying section 500 can delete the category when the frequency of the category is less than the predetermined threshold frequency. For example, if the frequency of the tourism category is 5000, the frequency of the date category is 6000, and the category of the sports is 120, by designating the threshold frequency to 3000 and deleting the category of sports below the critical frequency, It is possible to effectively express the characteristic of the specific location by relatively highlighting the tourist and date category.

S700 단계에서, 그래픽부(700)는 카테고리 별로 각 빈도수에 대응하여 반지름을 갖는 동심원을 형성하며, 동심원은 카테고리에 따라 지정된 색상으로 표현된다. 동심원의 색상은 R 소프트웨어의 색상 목록에서 지정될 수 있다.In step S700, the graphic unit 700 forms a concentric circle having a radius corresponding to each frequency in each category, and the concentric circle is expressed in a color designated according to the category. The color of concentric circles can be specified in the color list of the R software.

S800 단계에서, 오버램 표현부(800)는 위치를 포함하는 도시가 나타나는 지도에 동심원을 오버랩한다. 오버랩 표현부(800)는 수집부(100)의 설정부(130)에서 설정된 위치를 포함하는 기존 지도를 불러올 수 있다.In step S800, the overram representation unit 800 overlaps the concentric circles on the map where the city including the location appears. The overlapped expression unit 800 may retrieve an existing map including a location set in the setting unit 130 of the collection unit 100. [

도 5는 해시태그 키워드를 카테고리 별로 분류하고, 서로 다른 색상을 지정한 표이고, 도 6은 해시태그 키워드를 카테고리 별로 분류하고 빈도수를 계산 하고 합산한 표이며, 도 7은 위치가 나타나는 지도에 동심원을 오버랩 한 모식도이다.FIG. 5 is a table in which hashtag keywords are classified according to categories and different colors are designated. FIG. 6 is a table in which hashtag keywords are classified according to categories and frequency numbers are calculated and added. FIG. Fig.

도 5 내지 도 7을 참조하면, 발레, 사이클, 골프, 헬스, 필라테스, 웨이트 트레이닝 등의 하위 개념의 해시태그 키워드가 스포츠/운동과 같은 상위 개념의 카테고리로 분류되고 빨간색의 색상이 지정될 수 있다. 또한, 상위 개념의 식사 카테고리로 분류되는 하위 개념의 해시태그 키워드인 카페(Cafe)의 빈도수는 1215건, 맥주의 빈도수는 808건, 드링크(Drinks)는 535건, 쉑쉑(Shake Shake)은 304건으로서, 이러한 해시태그 키워드의 빈도수는 식사(Eating) 카테고리의 빈도수로 합산될 수 있다. 5 to 7, subordinate hashtag keywords such as ballet, cycle, golf, fitness, pilates, and weight training can be classified into categories of superior concept such as sports / exercise and colors of red can be designated . In addition, the frequency of the hashtag keyword, Cafe, which is a sub-concept keyword classified into the upper concept meal category, is 1215, the frequency of beer is 808, the number of Drinks is 535, the number of Shake Shake is 304 , And the frequency of these hash tag keywords may be added to the frequency of the eating category.

이렇게 카테고리의 빈도수에 대응하는 반지름을 갖고, 색상이 지정된 동심원이 특정 위치를 포함하는 지도에 오버랩되고, 특정 도시에서 중요한 의미를 갖는 위치의 특정 동심원의 색상과 크기를 파악함으로서 도시 및 위치의 정체성을 사전 정보가 없는 사람들도 쉽게 파악할 수 있다.By identifying the color and size of a particular concentric circle with a radius corresponding to the frequency of the category, a colored concentric circle overlapping a map containing a specific location, and a location having a significant meaning in a specific city, People without prior information can easily grasp it.

이상 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙력된 기술자는 아래의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.It will be understood by those skilled in the art that various changes in form and details may be made therein without departing from the spirit and scope of the invention as defined in the appended claims. It will be possible.

1000 : 해시태그를 이용한 도시 정체성 표현 장치
100 : 수집부
200 : 제1 추출부
300 : 제2 추출부
400 : 제거부
500 : 분류부
600 : 연산부
700 : 그래픽부
800 : 오버랩 표현부
1000: City identity expression device using hashtag
100: Collecting section
200: first extracting unit
300: second extracting unit
400: Remove
500:
600:
700: Graphic section
800: Overlap expression unit

Claims (10)

소셜 네트워크 서비스(Social Network Service, SNS)의 검색 엔진을 이용하여 위치를 검색하고, 위치를 포함하는 해시태그(Hashtag)의 데이터를 수집하는 수집부;
상기 데이터를 CSV(Comma Separated Value) 파일의 메타데이터(Metadata)로 추출하는 제1 추출부;
상기 메타데이터의 캡션텍스트(Caption Text) 열에서, 해시태그 키워드(Hashtag Keyword)를 추출하는 제2 추출부;
상기 해시태그 키워드에서 상기 소셜 네트워크 서비스와 관련된 불용어(Stopwords)의 제거를 수행하는 제거부;
상기 불용어가 제거된 상기 해시태그 키워드를 카테고리 별로 분류하는 분류부;
상기 불용어가 제거된 상기 해시태그 키워드를 카운팅 하여 빈도수를 계산하고, 상기 카테고리 별로 상기 해시태그 키워드의 빈도수를 합산하는 연산부;
상기 카테고리 별로 각 빈도수에 대응하여 반지름을 갖는 동심원을 형성하며, 상기 동심원은 카테고리에 따라 지정된 색상으로 표현하는 그래픽부; 및
상기 동심원을 상기 위치가 나타나는 지도에 오버랩 하는 오버랩 표현부를 포함하는 것을 특징으로 하는 해시태그를 이용한 도시 정체성 표현 장치.
A collection unit for searching a location using a search engine of a social network service (SNS) and collecting data of a hash tag (Hashtag) including a location;
A first extracting unit for extracting the data as a metadata of a CSV (Comma Separated Value) file;
A second extracting unit for extracting a hash tag keyword in a caption text column of the metadata;
A removal unit configured to remove the stopwords related to the social network service from the hashtag keyword;
A classification unit for classifying the hash tag keywords in which the stopwords have been removed, by category;
A calculation unit for counting the hashtag keywords from which the stopwords have been removed to calculate a frequency, and adding the frequencies of the hashtag keywords according to the categories;
A graphical unit for forming a concentric circle having a radius corresponding to each frequency of the categories, the concentric circle having a color designated by a category; And
And an overlap representation unit for overlapping the concentric circle with a map on which the position is displayed.
청구항 1에 있어서,
상기 수집부는,
소셜 네트워크 서비스의 검색 엔진을 이용하여 도시를 검색하고, 상기 위치를 포함하는 해시태그의 데이터를 수집하여 상기 위치 텍스트의 빈도수를 계산하는 제1 계산부; 및
소셜 네트워크 서비스상에서 도시내 상기 위치의 체크인(Check-in) 포인트 밀도를 계산하는 제2 계산부를 더 포함하는 것을 특징으로 하는 해시태그를 이용한 도시 정체성 표현 장치.
The method according to claim 1,
Wherein,
A first calculation unit for searching a city using a search engine of a social network service, collecting data of a hash tag including the location, and calculating a frequency of the location text; And
Further comprising a second calculation unit for calculating a check-in point density of the location in the city on the social network service.
청구항 2에 있어서,
상기 수집부는,
상기 위치 텍스트의 빈도수 또는 상기 위치의 체크인 포인트 밀도가 소정의 임계 빈도수 또는 소정의 임계 밀도 이상일때, 상기 도시의 상기 위치를 검색 대상으로 설정하는 설정부를 더 포함하는 것을 특징으로 하는 해시태그를 이용한 도시 정체성 표현 장치.
The method of claim 2,
Wherein,
Further comprising a setting unit configured to set the location of the city as a search target when the frequency of the location text or the check-in point density of the location is a predetermined threshold frequency or a predetermined threshold density or more Identity representation device.
청구항 1에 있어서,
상기 제2 추출부는,
언태그(Un-tag)된 텍스트는 제외시키는 것을 특징으로 하는 해시태그를 이용한 도시 정체성 표현 장치.
The method according to claim 1,
Wherein the second extracting unit comprises:
Wherein the un-tagged text is excluded from the un-tagged text.
청구항 1에 있어서,
상기 분류부는,
상기 카테고리의 빈도수가 소정의 임계 빈도수 미만일때, 상기 카테고리를 삭제시키는 것을 특징으로 하는 해시태그를 이용한 도시 정체성 표현 장치.
The method according to claim 1,
Wherein,
And when the frequency of the category is less than a predetermined threshold frequency, the category is deleted.
(a) 소셜 네트워크 서비스의 검색 엔진을 이용하여 위치를 검색하고, 위치를 포함하는 해시태그의 데이터를 수집하는 단계;
(b) 상기 데이터를 CSV 파일의 메타데이터로 추출하는 단계;
(c) 상기 메타데이터의 캡션텍스트 열에서, 해시태그 키워드를 추출하는 단계;
(d) 상기 해시태그 키워드에서 상기 소셜 네트워크 서비스와 관련된 불용어의 제거를 수행하는 단계;
(e) 상기 불용어가 제거된 상기 해시태그 키워드를 카테고리 별로 분류하는 단계;
(f) 상기 불용어가 제거된 상기 해시태그 키워드를 카운팅 하여 빈도수를 계산하고, 상기 카테고리 별로 상기 해시태그 키워드의 빈도수를 합산하는 단계;
(g) 상기 카테고리 별로 각 빈도수에 대응하여 반지름을 갖는 동심원을 형성하며, 상기 동심원을 카테고리에 따라 지정된 색상으로 표현하는 단계; 및
(h) 상기 동심원을 상기 위치가 나타나는 지도에 오버랩 하는 단계를 포함하는 것을 특징으로 하는 해시태그를 이용한 도시 정체성 표현 방법.
(a) retrieving a location using a search engine of a social network service, and collecting data of a hash tag including a location;
(b) extracting the data as metadata of a CSV file;
(c) extracting a hash tag keyword in a caption text string of the metadata;
(d) performing removal of an abbreviation relating to the social network service from the hashtag keyword;
(e) classifying the hash tag keywords from which the stopwords have been removed, by category;
(f) counting the hash tag keywords from which the stopwords are removed, calculating a frequency, and summing the frequencies of the hash tag keywords for each category;
(g) forming a concentric circle having a radius corresponding to each frequency of each of the categories, and expressing the concentric circle in a color designated according to the category; And
(h) overlapping the concentric circle with a map on which the location is indicated.
청구항 6에 있어서,
상기 (a) 단계는,
소셜 네트워크 서비스의 검색 엔진을 이용하여 도시를 검색하고, 상기 위치를 포함하는 해시태그의 데이터를 수집하여 상기 위치 텍스트의 빈도수를 계산하는 단계; 및
소셜 네트워크 서비스상에서 도시내 상기 위치의 체크인 포인트 밀도를 계산하는 단계로 수행되는 것을 특징으로 하는 해시태그를 이용한 도시 정체성 표현 방법.
The method of claim 6,
The step (a)
Retrieving a city using a search engine of a social network service, collecting data of a hash tag including the location, and calculating a frequency of the location text; And
And calculating the density of the check-in point of the location in the city on the social network service.
청구항 7에 있어서,
상기 (a) 단계는,
상기 위치 텍스트의 빈도수 또는 상기 위치의 체크인 포인트 밀도가 소정의 임계 빈도수 또는 소정의 임계 밀도 이상일때, 상기 도시의 상기 위치를 검색 대상으로 설정하는 것을 특징으로 하는 해시태그를 이용한 도시 정체성 표현 방법.
The method of claim 7,
The step (a)
Wherein the location of the city is set as a search target when the frequency of the location text or the check-in point density of the location is a predetermined threshold frequency or a predetermined threshold density or more.
청구항 6에 있어서,
상기 (c) 단계는,
언태그된 텍스트는 제외시키는 것을 특징으로 하는 해시태그를 이용한 도시 정체성 표현 방법.
The method of claim 6,
The step (c)
And the untagged text is excluded.
청구항 6에 있어서,
상기 (e) 단계는,
상기 카테고리의 빈도수가 소정의 임계 빈도수 미만일때, 상기 카테고리를 삭제시키는 것을 특징으로 하는 해시태그를 이용한 도시 정체성 표현 방법.
The method of claim 6,
The step (e)
And deleting the category when the frequency of the category is less than a predetermined threshold frequency.
KR1020170130173A 2017-10-11 2017-10-11 Device and method for expressing urban identity using hashtag KR20190040700A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170130173A KR20190040700A (en) 2017-10-11 2017-10-11 Device and method for expressing urban identity using hashtag

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170130173A KR20190040700A (en) 2017-10-11 2017-10-11 Device and method for expressing urban identity using hashtag

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020190158090A Division KR102227033B1 (en) 2019-12-02 2019-12-02 Device and method for expressing urban identity using hashtag

Publications (1)

Publication Number Publication Date
KR20190040700A true KR20190040700A (en) 2019-04-19

Family

ID=66283292

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170130173A KR20190040700A (en) 2017-10-11 2017-10-11 Device and method for expressing urban identity using hashtag

Country Status (1)

Country Link
KR (1) KR20190040700A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022208481A1 (en) * 2021-04-02 2022-10-06 Pikurate, Ltd. Personalized content curation system and content proposal method based on bookmark history

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150126289A (en) 2014-05-02 2015-11-11 한국전자통신연구원 Navigation apparatus for providing social network service based on augmented reality, metadata processor and metadata processing method in the augmented reality navigation system
KR101713558B1 (en) 2015-10-30 2017-03-08 조선대학교산학협력단 Method of classification and analysis of sentiment in social network service

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150126289A (en) 2014-05-02 2015-11-11 한국전자통신연구원 Navigation apparatus for providing social network service based on augmented reality, metadata processor and metadata processing method in the augmented reality navigation system
KR101713558B1 (en) 2015-10-30 2017-03-08 조선대학교산학협력단 Method of classification and analysis of sentiment in social network service

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022208481A1 (en) * 2021-04-02 2022-10-06 Pikurate, Ltd. Personalized content curation system and content proposal method based on bookmark history

Similar Documents

Publication Publication Date Title
Hasnat et al. Identifying tourists and analyzing spatial patterns of their destinations from location-based social media data
EP3779841B1 (en) Method, apparatus and system for sending information, and computer-readable storage medium
CN109074358B (en) Providing geographic locations related to user interests
US20150112963A1 (en) Time and location based information search and discovery
US20170303081A1 (en) Computerized system and method for generating and updating a map user interface
CN107291888B (en) Machine learning statistical model-based living recommendation system method near living hotel
CN104115180B (en) Message processing device, information processing method and program
US20160180402A1 (en) Method for recommending products based on a user profile derived from metadata of multimedia content
WO2019056661A1 (en) Search term pushing method and device, and terminal
TW201727558A (en) System, method, and device for generating a geographic area heat map
US10228258B2 (en) Determining top venues from aggregated user activity location data
US11216499B2 (en) Information retrieval apparatus, information retrieval system, and information retrieval method
CN105874452B (en) Marking points of interest from social feeds
JP7197930B2 (en) Methods and systems for providing location-based personalized content
US11573988B2 (en) Storage of point of interest data on a user device for offline use
KR20130090612A (en) Method and system for providing location based contents by analyzing keywords on social network service
Figueredo et al. Using social media photos to identify tourism preferences in smart tourism destination
Chen et al. Social media-based profiling of business locations
KR102227033B1 (en) Device and method for expressing urban identity using hashtag
KR20190040700A (en) Device and method for expressing urban identity using hashtag
US11409788B2 (en) Method for clustering at least two timestamped photographs
Yoon et al. Finding tourism niche on image-based social media: Integrating computational methods
Kitayama Extraction method for Anaba spots based on name recognition and user's evaluation
US20210072869A1 (en) Method for retrieving at least two captured photographs
Alves et al. Tagging space from information extraction and popularity of points of interest

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
A107 Divisional application of patent