KR102227033B1 - 해시태그를 이용한 도시 정체성 표현 장치 및 방법 - Google Patents

해시태그를 이용한 도시 정체성 표현 장치 및 방법 Download PDF

Info

Publication number
KR102227033B1
KR102227033B1 KR1020190158090A KR20190158090A KR102227033B1 KR 102227033 B1 KR102227033 B1 KR 102227033B1 KR 1020190158090 A KR1020190158090 A KR 1020190158090A KR 20190158090 A KR20190158090 A KR 20190158090A KR 102227033 B1 KR102227033 B1 KR 102227033B1
Authority
KR
South Korea
Prior art keywords
hashtag
location
frequency
unit
city
Prior art date
Application number
KR1020190158090A
Other languages
English (en)
Other versions
KR20190137046A (ko
Inventor
김영철
장기문
Original Assignee
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술원 filed Critical 한국과학기술원
Priority to KR1020190158090A priority Critical patent/KR102227033B1/ko
Publication of KR20190137046A publication Critical patent/KR20190137046A/ko
Application granted granted Critical
Publication of KR102227033B1 publication Critical patent/KR102227033B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Primary Health Care (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Remote Sensing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 해시태그를 이용한 도시 정체성 표현 장치 및 방법에 관한 것으로서, 소셜 네트워크 서비스상의 도시 또는 도시의 특정 위치와 관련된 해시태그 키워드를 수집하여 해시태그 키워드를 카테고리 별로 분류하고, 각 카테고리 별로 빈도수를 계산 및 합산 하여 그 빈도수에 대응하는 그래픽을 지도상에 표현함으로써, 사전정보가 없는 사람들도 도시를 쉽게 파악할 수 있도록 하는 해시태그를 이용한 도시 정체성 표현 장치 및 방법의 제공한다.

Description

해시태그를 이용한 도시 정체성 표현 장치 및 방법{Device and method for expressing urban identity using hashtag}
본 발명은 해시태그를 이용한 도시 정체성 표현 장치 및 방법에 관한 것으로서, 구체적으로는 소셜 네트워크 서비스상의 도시 또는 도시의 특정 위치와 관련된 해시태그 키워드를 수집하여 해시태그 키워드를 카테고리 별로 분류하고, 각 카테고리 별로 빈도수를 계산 및 합산 하여 그 빈도수에 대응하는 그래픽을 지도상에 표현함으로서, 사전정보가 없는 사람들도 도시를 쉽게 파악할 수 있도록 하는 해시태그를 이용한 도시 정체성 표현 장치 및 방법에 관한 것이다.
도시의 지속 가능한 개발을 위해 도시 정체성을 파악하기 위한 시도들이 있어 왔다. 여기에서, 도시 정체성은 물리적 특수성, 사회적 이미지화 가능성, 정서적 애착 및 만족감 등으로 구성되는 게슈탈트(Gestalt)형의 개념으로 정의 되어진다. 이 개념은 렐프(Relph)가 제안한 도시 정체성을 나타내는 물리적 위치, 활동 및 의미에서 수정되어진 것이다. 따라서, 도시 정체성은 물리적 특수성과 도시의 주관적인 의미로서 나타날 수 있다.
한국공개특허 제10-2015-0126289호 한국등록특허 제10-1713558호
본 발명은 소셜 네트워크 서비스상의 도시 또는 도시의 특정 위치와 관련된 해시태그 키워드를 수집하여 해시태그 키워드를 카테고리 별로 분류하고, 각 카테고리 별로 빈도수를 계산 및 합산 하여 그 빈도수에 대응하는 그래픽을 지도상에 표현함으로써, 사전정보가 없는 사람들도 도시를 쉽게 파악할 수 있도록 하는 해시태그를 이용한 도시 정체성 표현 장치 및 방법의 제공을 목적으로 한다.
본 발명의 목적을 실현하기 위한 해시태그를 이용한 도시 정체성 표현 장치는, 소셜 네트워크 서비스(Social Network Service, SNS)의 검색 엔진을 이용하여 위치를 검색하고, 위치를 포함하는 해시태그(Hashtag)의 데이터를 수집하는 수집부; 상기 데이터를 CSV(Comma Separated Value) 파일의 메타데이터(Metadata)로 추출하는 제1 추출부; 상기 메타데이터의 캡션텍스트(Caption Text)열에서, 해시태그 키워드(Hashtag Keyword)를 추출하는 제2 추출부; 상기 해시태그 키워드에서 상기 소셜 네트워크 서비스와 관련된 불용어(Stopwords)의 제거를 수행하는 제거부; 상기 불용어가 제거된 상기 해시태그 키워드를 카테고리 별로 분류하는 분류부; 상기 불용어가 제거된 상기 해시태그 키워드를 카운팅 하여 빈도수를 계산하고, 상기 카테고리 별로 상기 해시태그 키워드의 빈도수를 합산하는 연산부; 상기 카테고리 별로 각 빈도수에 대응하여 반지름을 갖는 동심원을 형성하며, 상기 동심원을 카테고리에 따라 지정된 색상으로 표현하는 그래픽부; 및 상기 동심원을 상기 위치가 나타나는 지도에 오버랩 하는 오버랩 표현부를 포함한다.
이때, 상기 수집부는, 소셜 네트워크 서비스의 검색 엔진을 이용하여 도시를 검색하고, 상기 위치를 포함하는 해시태그의 데이터를 수집하여 상기 위치 텍스트의 빈도수를 계산하는 제1 계산부; 및 소셜 네트워크 서비스상에서 도시내 상기 위치의 체크인(Check-in) 포인트 밀도를 계산하는 제2 계산부를 더 포함할 수 있다.
또한, 상기 수집부는, 상기 위치 텍스트의 빈도수 또는 상기 위치의 체크인 포인트 밀도가 소정의 임계 빈도수 또는 소정의 임계 밀도 이상일때, 상기 도시의 상기 위치를 검색 대상으로 설정하는 설정부를 더 포함할 수 있다.
한편, 상기 제2 추출부는, 언태그(Un-tag)된 텍스트는 제외시킬 수 있다.
또한, 상기 분류부는, 상기 카테고리의 빈도수가 소정의 임계 빈도수 미만일때, 상기 카테고리를 삭제시킬 수 있다.
본 발명의 목적을 실현하기 위한 해시태그를 이용한 도시 정체성 표현 방법은, (a) 소셜 네트워크 서비스의 검색 엔진을 이용하여 위치를 검색하고, 위치를 포함하는 해시태그의 데이터를 수집하는 단계; (b) 상기 데이터를 CSV 파일의 메타데이터로 추출하는 단계; (c) 상기 메타데이터의 캡션텍스트 열에서, 해시태그 키워드를 추출하는 단계; (d) 상기 해시태그 키워드에서 상기 소셜 네트워크 서비스와 관련된 불용어의 제거를 수행하는 단계; (e) 상기 불용어가 제거된 상기 해시태그 키워드를 카테고리 별로 분류하는 단계; (f) 상기 불용어가 제거된 상기 해시태그 키워드를 카운팅 하여 빈도수를 계산하고, 상기 카테고리 별로 상기 해시태그 키워드의 빈도수를 합산하는 단계; (g) 상기 카테고리 별로 각 빈도수에 대응하여 반지름을 갖는 동심원을 형성하며, 상기 동심원을 카테고리에 따라 지정된 색상으로 표현하는 단계; 및 (h) 상기 동심원을 상기 위치가 나타나는 지도에 오버랩 하는 단계를 포함한다.
이때, 상기 (a) 단계는, 소셜 네트워크 서비스의 검색 엔진을 이용하여 도시를 검색하고, 상기 위치를 포함하는 해시태그의 데이터를 수집하여 상기 위치 텍스트의 빈도수를 계산하는 단계; 및 소셜 네트워크 서비스상에서 도시내 상기 위치의 체크인 포인트 밀도를 계산하는 단계로 수행될 수 있다.
또한, 상기 (a) 단계는, 상기 위치 텍스트의 빈도수 또는 상기 위치의 체크인 포인트 밀도가 소정의 임계 빈도수 또는 소정의 임계 밀도 이상일 때, 상기 도시의 상기 위치를 검색 대상으로 설정할 수 있다.
한편, 상기 (c) 단계는, 언태그된 텍스트는 제외시킬 수 있다.
또한, 상기 (e) 단계는, 상기 카테고리의 빈도수가 소정의 임계 빈도수 미만일때, 상기 카테고리를 삭제시킬 수 있다.
본 발명에 따른 해시태그를 이용한 도시 정체성 표현 장치 및 방법에 의하면,
첫째, 체크인 포인트 밀도 또는 위치 텍스트의 빈도수를 활용하여 도시에서 중요한 의미를 갖는 특정 위치를 설정할 수 있다.
둘째, 소셜 네트워크 서비스 상의 해시태그 키워드를 카운팅 하여 빈도수를 계산하고, 카테고리 별로 분류하여 합산할 수 있다.
셋째, 소정 임계 미만의 빈도수를 갖는 카테고리를 삭제하여, 상대적으로 더욱 중요한 카테고리를 부각시킴으로서 도시를 효과적으로 표현할 수 있다.
넷째, 카테고리 별로 지정된 색상의 동심원을 표현하여, 도시를 이미지화함으로써, 사전 정보가 없는 사람들로 하여금 한눈에 쉽게 도시를 알아볼 수 있도록 표현할 수 있다.
다섯째, 각 동심원 반지름의 크기가 각 카테고리의 빈도수에 대응하여 표현되므로, 사전 정보가 없는 사람들도 도시의 정체성을 쉽게 파악할 수 있다.
도 1은 본 발명에 따른 해시태그를 이용한 도시 정체성 표현 장치의 블록도이다.
도 2는 도 1에 도시된 수집부의 세부 블록도이다.
도 3은 본 발명에 따른 해시태그를 이용한 도시 정체성 표현 방법의 알고리즘 흐름도이다.
도 4는 도 3에 도시된 해시태그의 데이터 수집 단계의 세부 알고리즘 흐름도이다.
도 5는 해시태그 키워드를 카테고리 별로 분류하고, 서로 다른 색상을 지정한 표이다.
도 6은 해시태그 키워드를 카테고리 별로 분류하고 빈도수를 계산 하고 합산한 표이다.
도 7은 위치가 나타나는 지도에 동심원을 오버랩 한 모식도이다.
이하 첨부한 도면들을 참조하여 본 발명의 바람직한 실시예를 보다 상세하게 설명한다. 이때, 첨부된 도면에서 동일한 구성 요소는 가능한 동일한 부호로 나타내고 있음에 유의한다. 또한, 본 발명의 요지를 흐리게 할 수 있는 공지 기능 및 구성에 대한 상세한 설명은 생략할 것이다. 마찬가지 이유로 첨부 도면에 있어서 일부 구성 요소는 과장되거나 생략되거나 개략적으로 도시되었다.
본 발명에서 언급하는 '이용자'는 소셜 네트워크 서비스를 이용하는 이용자를 의미한다.
도시 정체성을 파악하기 위한 가장 일반적인 방법으로는 SNS상의 체크인(Check-in) 포인트를 활용한 기법으로서, 체크인 포인트의 분포도를 파악하여 도시에서의 공간적으로 중요한 위치를 확인하기 위한 기법 등이 있다.
하지만, SNS상의 체크인 포인트 분포를 활용한 도시의 중요 위치 확인 기법은 Wi-Fi 연결이 불안정하거나, SNS 이용자가 야외 공간에서 분위기를 즐기려는 심리적인 욕구로 인해 소극적으로 무선 장치를 사용하여 실시간 사진 공유를 비활성화 하며, 대신 일상 공간으로 돌아가 해시태그를 사용하여 사진을 업로드 하는 행동 패턴 등에 의해 정확하지 않을 수 있다.
또한, 도시에서 특정 위치의 체크인 포인트 분포 조사 뿐만 아니라, 설문조사, 인터뷰 등이 도시의 정체성을 파악하는데 이용 됐던 조사 기법이다. 하지만, 주관적인 기법으로서 신뢰성에 문제점이 있다.
소셜 네트워크 서비스는 기존에 형성된 오프라인 인맥을 중심으로 온라인에서 소통하는 방식인 싸이월드(Cyworld)의 미니홈피나 블로그, 스마트폰의 등장과 함께 타임라인 형식으로 단문형태의 메시지를 실시간으로 주고받는 트위터(Twitter)나 페이스북(Facebook), 관심사나 취미 등 특정한 주제를 중심으로 공유하는 사용자 맞춤형 서비스인 텀블러(Tumblr), 핀터레스트(Pinterest), 인스타그램(Instagram)과 같은 것일 수 있다.
도 1은 본 발명에 따른 해시태그를 이용한 도시 정체성 표현 장치(1000)의 블록도이다. 도 2는 도 1에 도시된 수집부(100)의 세부 블록도이다.
도 1 및 도 2를 참조하면, 본 발명에 따른 해시태그를 이용한 도시 정체성 표현 장치(1000)는 수집부(100), 제1 추출부(200), 제2 추출부(300), 제거부(400), 분류부(500), 연산부(600), 그래픽부(700), 오버랩 표현부(800)를 포함한다.
수집부(100)는 소설네트워크 서비스의 검색 엔진을 이용하여 위치를 검색하고, 위치를 포함하는 해시태그의 데이터를 수집한다.
여기에서, 위치는 소셜 네트워크 서비스 상에서 이용자들에 의해 많이 체크인 되거나 소셜 네트워크 상에 해시태그와 함께 업로드되는 장소로서, 도시에서 소셜 네트워크 서비스의 이용자들이 특정 도시에서 자주 이용하거나 언급하여 중요하다고 인식되는 위치일 수 있다. 위치는 특정 도시에서 지명, 기차역, 공원, 백화점, 길거리 등과 같은 특정 장소를 의미할 수 있다. 또한, 도시에서 특정 위치는 아래에 기술하는 방법과 같이 정량적으로 설정될 수 있다.
예를 들어, 분당시와 같은 특정 도시를 소셜 네트워크 서비스의 검색 엔진에 검색 하면, 제1 계산부(110)는 위치를 포함하는 해시태그의 데이터를 수집하여 위치 텍스트의 빈도수를 계산할 수 있다. 이때, 위치를 포함하는 해시태그의 데이터는 소셜 네트워크 서비스의 이용자가 해시태그를 사용하여 분당시와 같은 특정 도시와 함께 해시태그를 이용하여 특정 위치를 소설 네트워크 서비스 상에 함께 업로드 한 것일 수 있고, 해시태그를 이용하지 않은 텍스트는 수집되지 않을 수 있다.
또한, 분당시와 같은 특정 도시를 소셜 네트워크 서비스의 검색 엔진을 통해 검색 하면, 제2 계산부(120)는 소셜 네트워크 서비스상에서 지명, 기차역, 공원, 백화점, 길거리 등과 같은 특정 위치의 체크인 포인트 밀도를 계산할 수 있다. 여기에서, 체크인은 소셜 네트워크 서비스의 이용자가 분당시와 같은 특정 도시내 특정 위치에서 자신의 친구들에게 자신의 위치를 알리기 위한 것으로서, 소셜 네트워크 서비스 상의 기능일 수 있다.
설정부(130)는 제1 계산부(110)에서 계산한 위치 텍스트의 빈도수 또는 제2 계산부(120)에서 계산한 위치의 체크인 포인트 밀도를 이용하여 위치 텍스트의 빈도수 또는 위치의 체크인 포인트 밀도가 소정의 임계 빈도수 또는 소정의 임계 밀도 이상일때, 특정 도시의 위치를 검색 대상으로 설정할 수 있다.
수집부(100)는 이와 같은 방법으로 소셜 네트워크 상에서 해시태그와 함께 많이 업로드 되는 특정 도시의 특정 위치를 설정하고, 소셜 네트워크 서비스의 검색 엔진에 위치를 검색하면, 위치를 포함하는 해시태그의 데이터를 수집한다.
제1 추출부(200)는 위치를 포함하는 해시태그의 데이터를 CSV 파일 형식의 메타데이터로 추출한다. CSV 파일 형식의 메타데이터는 생성 날짜, 캡션텍스트, 위도, 경도 등을 포함할 수 있다.
제2 추출부(300)는 메타데이터의 캡션텍스트 열에서 해시태그 키워드를 추출한다. 또한, 제2 추출부(300)는 메타데이터의 캡션텍스트 열에서 언태그된 텍스트는 제외시킬 수 있다.
제거부(400)는 해시태그 키워드에서 인스타, 타그램, 팔로우, 좋아요, OOTD(Outfit Of The Day) 등과 같은 소셜 네트워크 서비스와 관련된 불용어를 제거한다.
분류부(500)는 불용어가 제거된 하위 개념의 해시태그 키워드를 관광, 데이트, 스포츠, 문화 예술, 식사, 직장 등과 같은 상위 개념의 카테고리 별로 분류한다. 예를 들어, 드링크, 맥주, 브런치, 카페, 치킨, 소주, 스시, 스타벅스 등과 같은 하위 개념의 해시태그 키워드는 식사와 같은 상위 개념의 카테고리로 분류될 수 있고, 발레, 사이클, 골프, 헬스, 필라테스, 스트레칭, 웨이트 트레이닝 등과 같은 하위 개념의 해시태그 키워드는 스포츠와 같은 상위 개념의 해시태그로 분류될 수 있다. 또한, 버스킹, 콘서트, 백화점 문화 센터, 힙합, 영화, 박물관 등과 같은 하위 개념의 해시태그 키워드는 문화 예술과 같은 상위 개념의 카테고리로 분류될 수 있다.
연산부(600)는 불용어가 제거된 해시태그 키워드를 카운팅 하여 빈도수를 계산하고, 카테고리 별로 해시태그 키워드의 빈도수를 합산한다. 여기에서, 분류부(500)는 카테고리의 빈도수가 소정의 임계 빈도수 미만일 때, 카테고리를 삭제시킬 수 있다. 예를 들어, 관광 카테고리의 빈도수가 5000건이고, 데이트 카테고리의 빈도수가 6000건이며, 스포츠의 카테고리가 120건이면, 임계 빈도수를 3000건으로 지정하여 임계 빈도수 미만의 스포츠의 카테고리를 삭제함으로서, 특정 위치에서 관광과 데이트 카테고리를 상대적으로 부각시켜 특정 위치의 특징을 효과적으로 나타낼 수 있다.
그래픽부(700)는 카테고리 별로 각 빈도수에 대응하여 반지름을 갖는 동심원을 형성하며, 동심원은 카테고리에 따라 지정된 색상으로 표현된다. 동심원의 색상은 R 소프트웨어의 색상 목록에서 지정될 수 있다.
오버랩 표현부(800)는 위치를 포함하는 도시가 나타나는 지도에 동심원을 오버랩한다. 오버랩 표현부(800)는 수집부(100)의 설정부(130)에서 설정된 위치를 포함하는 기존 지도를 불러올 수 있다.
도 3은 본 발명에 따른 해시태그를 이용한 도시 정체성 표현 방법의 알고리즘 흐름도이고, 도 1의 해시태그를 이용한 도시 정체성 표현 장치(1000)를 시계열적으로 구현한 경우에도 본 실시예에 해당하므로 수집부(100), 제1 추출부(200), 제2 추출부(300), 제거부(400), 분류부(500), 연산부(600), 그래픽부(700), 오버랩 표현부(800)에 대하여 설명된 부분은 본 실시예에서도 그대로 적용되며, 도 4는 도 3에 도시된 해시태그의 데이터 수집 단계의 세부 알고리즘 흐름도이고, 도 2의 도 1에 도시된 수집부의 세부 블록도를 시계열적으로 구현한 경우에도 본 실시예에 해당하므로 제1 계산부(110), 제2 계산부(120), 설정부(130)에 대하여 설명된 부분은 본 실시예에서도 그대로 적용된다.
도 3 및 도 4를 참조하면, 본 발명에 따른 해시태그를 이용한 도시 정체성 표현 방법은 해시태그의 데이터 수집단계(S100), 메타데이터 추출단계(S200), 해시태그 키워드 추출단계(S300), 불용어 제거단계(S400), 카테고리 분류단계(S500), 빈도수 계산 및 합산단계(S600), 동심원 형성 및 색상지정 단계(S700) 및 지도에 동심원을 오버랩하는 단계(S800) 순으로 수행된다.
S100 단계에서, 수집부(100)는 소셜 네트워크 서비스의 검색 엔진을 이용하여 위치를 검색하고, 위치를 포함하는 해시태그의 데이터를 수집한다.
여기에서, 위치는 소셜 네트워크 서비스 상에서 이용자들에 의해 많이 체크인 되거나 소셜 네트워크 상에 해시태그와 함께 업로드되는 장소로서, 도시에서 소셜 네트워크 서비스의 이용자들이 특정 도시에서 자주 이용하거나 언급하여 중요하다고 인식되는 위치일 수 있다. 위치는 특정 도시에서 지명, 기차역, 공원, 백화점, 길거리 등과 같은 특정 장소를 의미할 수 있다. 또한, 도시에서 특정 위치는 아래에 기술하는 방법과 같이 정량적으로 설정될 수 있다.
예를 들어, S110 단계에서, 분당시와 같은 특정 도시를 소셜 네트워크 서비스의 검색 엔진에 검색 하면, 제1 계산부(110)는 위치를 포함하는 해시태그의 데이터를 수집하여 위치 텍스트의 빈도수를 계산할 수 있다. 이때, 위치를 포함하는 해시태그의 데이터는 소셜 네트워크 서비스의 이용자가 해시태그를 사용하여 분당시와 같은 특정 도시와 함께 해시태그를 이용하여 특정 위치를 소설 네트워크 서비스 상에 함께 업로드 한 것일 수 있고, 해시태그를 이용하지 않은 텍스트는 수집되지 않을 수 있다.
또한, S120 단계에서, 분당시와 같은 특정 도시를 소셜 네트워크 서비스의 검색 엔진을 통해 검색 하면, 제2 계산부(120)는 소셜 네트워크 서비스상에서 지명, 기차역, 공원, 백화점, 길거리 등과 같은 특정 위치의 체크인 포인트 밀도를 계산할 수 있다. 여기에서, 체크인은 소셜 네트워크 서비스의 이용자가 분당시와 같은 특정 도시내 특정 위치에서 자신의 친구들에게 자신의 위치를 알리기 위한 것으로서, 소셜 네트워크 서비스 상의 기능일 수 있다.
S130 단계에서, 설정부(130)는 제1 계산부(110)에서 계산한 위치 텍스트의 빈도수 또는 제2 계산부(120)에서 계산한 위치의 체크인 포인트 밀도를 이용하여 위치 텍스트의 빈도수 또는 위치의 체크인 포인트 밀도가 소정의 임계 빈도수 또는 소정의 임계 밀도 이상일때, 특정 도시의 위치를 검색 대상으로 설정할 수 있다. 따라서, S100 단계의 수집부(100)는 이와 같은 방법으로 소셜 네트워크 상에서 해시태그와 함께 많이 업로드 되는 특정 도시의 특정 위치를 설정하고, 소셜 네트워크 서비스의 검색 엔진에 위치를 검색하면, 위치를 포함하는 해시태그의 데이터를 수집한다.
S200 단계에서, 제1 추출부(200)는 위치를 포함하는 해시태그의 데이터를 CSV 파일 형식의 메타데이터로 추출한다. CSV 파일 형식의 메타데이터는 생성 날짜, 캡션텍스트, 위도, 경도 등을 포함할 수 있다.
S300 단계에서, 제2 추출부(300)는 메타데이터의 캡션텍스트 열에서 해시태그 키워드를 추출한다. 또한, 제2 추출부(300)는 메타데이터의 캡션텍스트 열에서 언태그된 텍스트는 제외시킬 수 있다.
S400 단계에서, 제거부(400)는 해시태그 키워드에서 인스타, 타그램, 팔로우, 좋아요, OOTD(Outfit Of The Day) 등과 같은 소셜 네트워크 서비스와 관련된 불용어를 제거한다.
S500 단계에서, 분류부(500)는 불용어가 제거된 하위 개념의 해시태그 키워드를 관광, 데이트, 스포츠, 문화 예술, 식사, 직장 등과 같은 상위 개념의 카테고리 별로 분류한다. 예를 들어, 드링크, 맥주, 브런치, 카페, 치킨, 소주, 스시, 스타벅스 등과 같은 하위 개념의 해시태그 키워드는 식사와 같은 상위 개념의 카테고리로 분류될 수 있고, 발레, 사이클, 골프, 헬스, 필라테스, 스트레칭, 웨이트 트레이닝 등과 같은 하위 개념의 해시태그 키워드는 스포츠와 같은 상위 개념의 해시태그로 분류될 수 있다. 또한, 버스킹, 콘서트, 백화점 문화 센터, 힙합, 영화, 박물관 등과 같은 하위 개념의 해시태그 키워드는 문화 예술과 같은 상위 개념의 카테고리로 분류될 수 있다.
S600 단계에서, 연산부(600)는 불용어가 제거된 해시태그 키워드를 카운팅 하여 빈도수를 계산하고, 카테고리 별로 해시태그 키워드의 빈도수를 합산한다. 여기에서, 분류부(500)는 카테고리의 빈도수가 소정의 임계 빈도수 미만일때, 카테고리를 삭제시킬 수 있다. 예를 들어, 관광 카테고리의 빈도수가 5000건이고, 데이트 카테고리의 빈도수가 6000건이며, 스포츠의 카테고리가 120건이면, 임계 빈도수를 3000건으로 지정하여 임계 빈도수 미만의 스포츠의 카테고리를 삭제함으로서, 특정 위치에서 관광과 데이트 카테고리를 상대적으로 부각시켜 특정 위치의 특징을 효과적으로 나타낼 수 있다.
S700 단계에서, 그래픽부(700)는 카테고리 별로 각 빈도수에 대응하여 반지름을 갖는 동심원을 형성하며, 동심원은 카테고리에 따라 지정된 색상으로 표현된다. 동심원의 색상은 R 소프트웨어의 색상 목록에서 지정될 수 있다.
S800 단계에서, 오버램 표현부(800)는 위치를 포함하는 도시가 나타나는 지도에 동심원을 오버랩한다. 오버랩 표현부(800)는 수집부(100)의 설정부(130)에서 설정된 위치를 포함하는 기존 지도를 불러올 수 있다.
도 5는 해시태그 키워드를 카테고리 별로 분류하고, 서로 다른 색상을 지정한 표이고, 도 6은 해시태그 키워드를 카테고리 별로 분류하고 빈도수를 계산 하고 합산한 표이며, 도 7은 위치가 나타나는 지도에 동심원을 오버랩 한 모식도이다.
도 5 내지 도 7을 참조하면, 발레, 사이클, 골프, 헬스, 필라테스, 웨이트 트레이닝 등의 하위 개념의 해시태그 키워드가 스포츠/운동과 같은 상위 개념의 카테고리로 분류되고 빨간색의 색상이 지정될 수 있다. 또한, 상위 개념의 식사 카테고리로 분류되는 하위 개념의 해시태그 키워드인 카페(Cafe)의 빈도수는 1215건, 맥주의 빈도수는 808건, 드링크(Drinks)는 535건, 쉑쉑(Shake Shake)은 304건으로서, 이러한 해시태그 키워드의 빈도수는 식사(Eating) 카테고리의 빈도수로 합산될 수 있다.
이렇게 카테고리의 빈도수에 대응하는 반지름을 갖고, 색상이 지정된 동심원이 특정 위치를 포함하는 지도에 오버랩되고, 특정 도시에서 중요한 의미를 갖는 위치의 특정 동심원의 색상과 크기를 파악함으로서 도시 및 위치의 정체성을 사전 정보가 없는 사람들도 쉽게 파악할 수 있다.
이상 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙력된 기술자는 아래의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.
1000 : 해시태그를 이용한 도시 정체성 표현 장치
100 : 수집부
200 : 제1 추출부
300 : 제2 추출부
400 : 제거부
500 : 분류부
600 : 연산부
700 : 그래픽부
800 : 오버랩 표현부

Claims (3)

  1. 소셜 네트워크 서비스(Social Network Service, SNS)의 검색 엔진을 이용하여 위치를 검색하고, 위치를 포함하는 해시태그(Hashtag)의 데이터를 수집하는 수집부;
    상기 데이터를 CSV(Comma Separated Value) 파일의 메타데이터(Metadata)로 추출하는 제1 추출부;
    상기 메타데이터의 캡션텍스트(Caption Text) 열에서, 해시태그 키워드(Hashtag Keyword)를 추출하는 제2 추출부;
    상기 해시태그 키워드에서 상기 소셜 네트워크 서비스와 관련된 불용어(Stopwords)의 제거를 수행하는 제거부;
    상기 불용어가 제거된 상기 해시태그 키워드를 카테고리 별로 분류하는 분류부;
    상기 불용어가 제거된 상기 해시태그 키워드를 카운팅 하여 빈도수를 계산하고, 상기 카테고리 별로 상기 해시태그 키워드의 빈도수를 합산하는 연산부;
    상기 카테고리 별로 각 빈도수에 대응하여 반지름을 갖는 동심원을 형성하며, 상기 동심원은 카테고리에 따라 지정된 색상으로 표현하는 그래픽부; 및
    상기 동심원을 상기 위치가 나타나는 지도에 오버랩 하는 오버랩 표현부를 포함하되,
    상기 수집부는,
    소셜 네트워크 서비스의 검색 엔진을 이용하여 도시를 검색하고, 상기 위치를 포함하는 해시태그의 데이터를 수집하여 상기 위치를 포함하는 해시태그의 데이터의 빈도수를 계산하는 제1 계산부;
    소셜 네트워크 서비스상에서 도시내 상기 위치의 체크인(Check-in) 포인트 밀도를 계산하는 제2 계산부; 및
    상기 위치를 포함하는 해시태그의 데이터의 빈도수 또는 상기 위치의 체크인 포인트 밀도가 소정의 임계 빈도수 또는 소정의 임계 밀도 이상일때, 상기 도시의 상기 위치를 검색 대상으로 설정하는 설정부를 포함하고,
    상기 제2 추출부는,
    언태그(Un-tag)된 텍스트는 제외시키는 것을 특징으로 하는 해시태그를 이용한 도시 정체성 표현 장치.
  2. 삭제
  3. 청구항 1에 있어서,
    상기 분류부는,
    상기 카테고리의 빈도수가 소정의 임계 빈도수 미만일때, 상기 카테고리를 삭제시키는 것을 특징으로 하는 해시태그를 이용한 도시 정체성 표현 장치.
KR1020190158090A 2019-12-02 2019-12-02 해시태그를 이용한 도시 정체성 표현 장치 및 방법 KR102227033B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190158090A KR102227033B1 (ko) 2019-12-02 2019-12-02 해시태그를 이용한 도시 정체성 표현 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190158090A KR102227033B1 (ko) 2019-12-02 2019-12-02 해시태그를 이용한 도시 정체성 표현 장치 및 방법

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020170130173A Division KR20190040700A (ko) 2017-10-11 2017-10-11 해시태그를 이용한 도시 정체성 표현 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20190137046A KR20190137046A (ko) 2019-12-10
KR102227033B1 true KR102227033B1 (ko) 2021-03-12

Family

ID=69003144

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190158090A KR102227033B1 (ko) 2019-12-02 2019-12-02 해시태그를 이용한 도시 정체성 표현 장치 및 방법

Country Status (1)

Country Link
KR (1) KR102227033B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102552856B1 (ko) * 2023-03-31 2023-07-06 이나나 커머스 연계 콘텐츠 제공 플랫폼 서비스를 위한 키워드 추출 및 콘텐츠 템플릿 생성 자동화 방법, 장치 및 시스템

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101224312B1 (ko) * 2010-11-23 2013-01-21 한국과학기술원 소셜 네트워킹 서비스 사용자를 위한 친구 추천 방법, 이를 위한 기록 매체 및 이를 이용하는 소셜 네트워킹 서비스 및 서버
KR20150126289A (ko) 2014-05-02 2015-11-11 한국전자통신연구원 증강현실 기반 소셜 네트워크 서비스 정보를 제공하는 내비게이션 장치와 메타데이터 처리장치 및 그 방법
KR101713558B1 (ko) 2015-10-30 2017-03-08 조선대학교산학협력단 소셜 네트워크 서비스 상의 사용자 게시글 감정 분류 방법

Also Published As

Publication number Publication date
KR20190137046A (ko) 2019-12-10

Similar Documents

Publication Publication Date Title
JP6784308B2 (ja) 施設特性を更新するプログラム、施設をプロファイリングするプログラム、コンピュータ・システム、及び施設特性を更新する方法
US20150112963A1 (en) Time and location based information search and discovery
US20170032384A1 (en) System and Method for Analyzing Social Media Users Based on User Content Posted from Monitored Locations
US9485318B1 (en) System and method for identifying influential social media and providing location-based alerts
CN102047249B (zh) 用于聚合和呈现与地理位置相关联的数据的方法和设备
US10762538B2 (en) Knowledge model for personalization and location services
JP6229655B2 (ja) 情報処理装置、情報処理方法およびプログラム
Cheng et al. Who is the barbecue king of texas? A geo-spatial approach to finding local experts on twitter
US20130097246A1 (en) Multilocal implicit social networking
KR20140071417A (ko) 그래프 모델을 이용하여 유도된 인터넷 연결 가능한 장치와 관련된 정보 데이터에 기초하여 데이터 네트워크를 이용하는 모바일 광고
US9195735B2 (en) Information extracting server, information extracting client, information extracting method, and information extracting program
CN105865478A (zh) 一种导航信息推送方法和装置、设备
JP7197930B2 (ja) ロケーションベースの個人用コンテンツを提供する方法及びシステム
KR20100022871A (ko) 커뮤니케이션 제공 시스템 및 커뮤니케이션 서비스 제공 방법
JP2006024060A (ja) 情報取得利用管理装置および情報取得利用管理方法
Ayala-Gómez et al. Where could we go? Recommendations for groups in location-based social networks
CN110781256B (zh) 基于发送位置数据确定与Wi-Fi相匹配的POI的方法及装置
KR102227033B1 (ko) 해시태그를 이용한 도시 정체성 표현 장치 및 방법
KR101693429B1 (ko) 대인 관계 유형 파악을 통한 코칭 정보 제공 시스템
Kojima et al. Crowd and event detection by fusion of camera images and micro blogs
KR20190040700A (ko) 해시태그를 이용한 도시 정체성 표현 장치 및 방법
US11847180B2 (en) Method and system for recommending location-based digital content
US9386108B1 (en) Automated rare species and new species discovery alerts via crowdsourcing
Bernabeu-Bautista et al. Social media data collection and quality for urban studies
Huang et al. The demodulating and encoding heritage (DEH) platform for mobile digital culture heritage (M-DCH)

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant