KR20230055081A - 소셜 미디어를 이용한 도시 소리 환경 측정 시스템 및 방법 - Google Patents

소셜 미디어를 이용한 도시 소리 환경 측정 시스템 및 방법 Download PDF

Info

Publication number
KR20230055081A
KR20230055081A KR1020210138340A KR20210138340A KR20230055081A KR 20230055081 A KR20230055081 A KR 20230055081A KR 1020210138340 A KR1020210138340 A KR 1020210138340A KR 20210138340 A KR20210138340 A KR 20210138340A KR 20230055081 A KR20230055081 A KR 20230055081A
Authority
KR
South Korea
Prior art keywords
category
social media
text data
sound environment
analysis target
Prior art date
Application number
KR1020210138340A
Other languages
English (en)
Inventor
김영철
이하늘
Original Assignee
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술원 filed Critical 한국과학기술원
Priority to KR1020210138340A priority Critical patent/KR20230055081A/ko
Publication of KR20230055081A publication Critical patent/KR20230055081A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/909Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Library & Information Science (AREA)
  • Remote Sensing (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 텍스트 기반 소셜 미디어로부터 분석 대상지의 텍스트 데이터를 수집하는 데이터 수집부; 수집된 텍스트 데이터를 미리 설정된 분류 체계에 따라 소리 유형별로 분류하는 유형 분류부; 및 분류된 유형에 따라 상기 분석 대상지의 소리 환경을 지도상에 시각적으로 표시하는 시각화부를 포함하는 소셜 미디어를 이용한 도시 소리 환경 측정 시스템을 제공한다. 또한, (a) 텍스트 기반 소셜 미디어로부터 분석 대상지의 텍스트 데이터를 수집하는 데이터 수집 단계; (b) 수집된 텍스트 데이터를 미리 설정된 분류 체계에 따라 소리 유형별로 분류하는 유형 분류 단계; 및 (c) 분류된 유형에 따라 상기 분석 대상지의 소리 환경을 지도상에 시각적으로 표시하는 시각화 단계를 포함하는 소셜 미디어를 이용한 도시 소리 환경 측정 방법을 제공한다.

Description

소셜 미디어를 이용한 도시 소리 환경 측정 시스템 및 방법{Urban Soundscape Detecting System using Social Media and Method thereof}
본 발명은 도시의 소리 환경을 측정하는 시스템 및 그 방법에 관한 것으로서, 구체적으로는 소셜 미디어의 텍스트 데이터를 분석하여 각 지역별 소리 환경을 추정하는 시스템 및 방법에 관한 것이다.
도시의 소음원이 증가함에 따라, 쾌적한 음환경은 삶의 질을 결정하는 중요한 요소로 인식되고 있다. 기존의 소음 관리는 도시 공간의 질적 측면을 고려하기 보다 물리적 음압 레벨(dB)의 저감에 중점을 두며, 이러한 방식은 음환경 만족도를 충족시키는 데에 한계가 있다. 최근 유럽의 음환경 계획은 소음 저감에서 ‘사운드스케이프’ 디자인으로 패러다임이 변화하고 있다. 사운드스케이프는 인간의 인식과 반응을 기반으로, 소리의 물리적 요인, 비물리적 요인, 그리고 도시의 사회문화적 맥락을 파악할 수 있는 지표가 될 수 있다.
사운드스케이프의 측정은 주로 사운드 워크(Soundwalk) 방법으로 진행되는데, 현장에서 직접 소리를 수집하고 평가하는 방식이 주류를 이루고 있다.
그러나 이러한 방법은 도시의 넓은 범위를 다루기에 시공간적 제약이 따르며, 설문조사를 하지 않는 이상 사운드스케이프에 대한 직접적인 인식을 평가하기 어려운 문제가 있다. 특히 날씨나 시간대 등 기준을 면밀하게 고려해야 하는 단점이 있다.
특허문헌 1 : 대한민국 공개특허 제10-2019-0030275호 특허문헌 2 : 대한민국 공개특허 제10-2012-0014508호
본 발명은 소셜 미디어의 텍스트 데이터를 분석하여 각 지역별 소리 환경을 추정하는 도시 소리 환경 측정 시스템의 제공 및 그 방법을 목적으로 한다.
위와 같은 목적을 달성하기 위하여 본 발명의 일 실시예에 의한 소셜 미디어를 이용한 도시 소리 환경 측정 시스템은, 텍스트 기반 소셜 미디어로부터 분석 대상지의 텍스트 데이터를 수집하는 데이터 수집부; 수집된 텍스트 데이터를 미리 설정된 분류 체계에 따라 소리 유형별로 분류하는 유형 분류부; 및 분류된 유형에 따라 상기 분석 대상지의 소리 환경을 지도상에 시각적으로 표시하는 시각화부를 포함한다.
이때, 상기 데이터 수집부는, 각 지역을 호칭하는 단어 또는 문장(즉, 지역의 명소 또는 관심 지점(Point of Interest, POI))을 저장하는 지역 명칭 DB; 및 소셜 미디어로부터 수집된 텍스트 데이터에서 태그, 메타 또는 본문에 포함된 위치 관련 단어를 확인하고, 상기 지역 명칭 DB에 대조하여 수집된 텍스트 데이터가 상기 분석 대상지에 해당하는지 확인하는 지역 확인 모듈을 포함할 수 있다.
이때, 상기 유형 분류부는, 상기 텍스트 데이터의 단어를 분류 기준에 따라 제1 카테고리, 제2 카테고리 및 제3 카테고리로 분류하고, 상기 분석 대상지별 각 카테고리의 발생 수를 확인하는 것이 바람직하다.
또한, 상기 유형 분류부는, 각각의 상기 카테고리에 해당하는 단어 또는 문장을 저장하는 카테고리 DB; 상기 텍스트 데이터의 단어를 형태소 단위로 분리하고 상기 카테고리 DB에 조회하는 자연어 처리 모듈; 및 상기 분석 대상지별 각 카테고리의 발생 수를 확인하는 빈도 확인 모듈을 포함할 수 있다.
한편, 상기 제1 카테고리, 상기 제2 카테고리 및 상기 제3 카테고리는, 각각 물리적 환경(physical setting), 활동(activity) 및 의미(meaning, image)와 관련한 소리 환경을 분류하는 카테고리일 수 있다.
아울러, 상기 시각화부는, 상기 제1 카테고리, 상기 제2 카테고리 및 상기 제3 카테고리의 빈도수를 이미지로 표시하고 지도상의 상기 분석 대상지의 위치에 중첩하여 표시할 수 있다.
위와 같은 목적을 달성하기 위하여 본 발명의 일 실시예에 의한 소셜 미디어를 이용한 도시 소리 환경 측정 방법은, (a) 텍스트 기반 소셜 미디어로부터 분석 대상지의 텍스트 데이터를 수집하는 데이터 수집 단계; (b) 수집된 텍스트 데이터를 미리 설정된 분류 체계에 따라 소리 유형별로 분류하는 유형 분류 단계; 및 (c) 분류된 유형에 따라 상기 분석 대상지의 소리 환경을 지도상에 시각적으로 표시하는 시각화 단계를 포함한다.
이때, 상기 (a) 단계는, 각 지역을 호칭하는 단어 또는 문장을 저장하는 지역 명칭 DB; 및 소셜 미디어로부터 수집된 텍스트 데이터에서 태그, 메타 또는 본문에 포함된 위치 관련 단어를 확인하고, 상기 지역 명칭 DB에 대조하여 수집된 텍스트 데이터가 상기 분석 대상지에 해당하는지 확인하는 지역 확인 모듈을 포함하는 데이터 수집부에 의해 수행되는 것이 바람직하다.
이때, 상기 (b) 단계는, (b-1) 상기 텍스트 데이터의 단어를 분류 기준에 따라 제1 카테고리, 제2 카테고리 및 제3 카테고리로 분류하는 단계; 및 (b-2) 상기 분석 대상지별 각 카테고리의 발생 수를 확인하는 단계를 포함할 수 있다.
또한, 상기 (b) 단계는, 각각의 상기 카테고리에 해당하는 단어 또는 문장을 저장하는 카테고리 DB; 상기 텍스트 데이터의 단어를 형태소 단위로 분리하고 상기 카테고리 DB에 조회하는 자연어 처리 모듈; 및 상기 분석 대상지별 각 카테고리의 발생 수를 확인하는 빈도 확인 모듈을 포함하는 유형 분류부에 의해 수행될 수 있다.
한편, 상기 제1 카테고리, 상기 제2 카테고리 및 상기 제3 카테고리는, 각각 물리적 환경(physical setting), 활동(activity) 및 의미(meaning, image)와 관련한 소리 환경을 분류하는 카테고리일 수 있다.
아울러, 상기 (c) 단계는, 상기 제1 카테고리, 상기 제2 카테고리 및 상기 제3 카테고리의 빈도수를 이미지로 표시하고 지도상의 상기 분석 대상지의 위치에 중첩하여 표시하는 단계를 포함할 수 있다.
본 발명에 의한 소셜 미디어를 이용한 도시 소리 환경 측정 시스템 및 방법에 의하면,
첫째, 소셜 미디어를 활용하여 사운드스케이프에 대한 사람들의 전반적인 인식과 패턴을 파악하고, 사운드스케이프가 도시 공간의 특성이 될 수 있음을 확인할 수 있다.
둘째, 소셜 미디어를 사용한 분석 방법은 사운드스케이프를 측정하고 평가하는 데긍정적으로 기여할 수 있다.
셋째, 또한 공간적 특성이 반영된 사운드스케이프는 음환경과 경관 계획을 수립하는데 기초 정보를 효과적으로 제공할 수 있다.
넷째, 사운드스케이프는 도시 공간에 대한 개인의 인식을 나타낼 수 있으므로, 공간의 이용자(User), 사회문화적 맥락, 물리적 특성 등을 종합적으로 고려할 수 있다.
도 1은 일 실시예에 따른 소셜 미디어를 이용한 도시 소리 환경 측정 시스템의 블록도이다.
도 2는 데이터 수집부의 세부 블록도이다.
도 3은 유형 분류부의 세부 블록도이다.
도 4는 일 실시 형태에 따른 지역 명칭 DB를 설명한다.
도 5는 일 실시 형태에 따른 카테고리 DB를 설명한다.
도 6은 유형 분류부에서 수행되는 실제 동작 가운데 하나를 설명한다.
도 7은 일 실시 형태에 따른 시각화된 소리 환경 지도이다.
도 8은 일 실시예에 따른 소셜 미디어를 이용한 도시 소리 환경 측정 방법을 설명하는 순서도이다.
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예들을 상세히 설명한다. 이때, 첨부된 도면에서 동일한 구성 요소는 가능한 동일한 부호로 나타내고 있음에 유의한다. 또한, 본 발명의 요지를 흐리게 할 수 있는 공지 기능 및 구성에 대한 상세한 설명은 생략할 것이다. 마찬가지 이유로 첨부 도면에 있어서 일부 구성요소는 과장되거나 생략되거나 개략적으로 도시되었다.
도 1은 일 실시예에 따른 소셜 미디어를 이용한 도시 소리 환경 측정 시스템의 블록도이고, 도 2는 데이터 수집부의 세부 블록도이고, 도 3은 유형 분류부의 세부 블록도이다.
도 1 내지 도 3을 참조하면, 본 발명에 따른 소셜 미디어를 이용한 도시 소리 환경 측정 시스템(1000)은 데이터 수집부(100), 유형 분류부(200) 및 시각화부(300)를 포함한다. 소셜 미디어를 이용한 도시 소리 환경 측정 시스템(1000)은 전산 처리 장치에서 구현 되는 것으로서, 데이터 수집부(100), 유형 분류부(200) 및 시각화부(300)는 소프트웨어로 구현할 수 있다.
실시자에 따라 데이터 수집부(100), 유형 분류부(200) 및 시각화부(300)는 하나의 컴퓨팅 장치에서 구현될 수도 있으며, 필요에 따라 네트워크로 연결된 별도의 분리된 장치에서 구현될 수도 있다.
데이터 수집부(100)는 텍스트 기반 소셜 미디어로부터 분석 대상지의 텍스트 데이터(TEXT DATA)를 수집한다.
여기서, 소셜 미디어는 소셜 네트워크 서비스(Social Networking Service, SNS)를 의미하는 것으로서, 페이스북(Facebook), 인스타그램(Instagram), 트위터(Twitter) 등과 같은 인터넷 등의 전자 네트워크로 서로의 소식을 주고받는 등 사교활동을 하는 전반적인 서비스이다. 텍스트 데이터(TEXT DATA)는 각 서비스의 사용자들이 작성하여 공개하는 포스팅 데이터 중에서 문자로 이루어지는 데이터이다. 즉, 포스팅 본문의 내용이다.
데이터 수집부(100)는 인터넷 상에서 공개된 다수의 포스팅(P1, P2, .. Pn)에서 텍스트 데이터(TEXT DATA)를 수집한다. 이때, 실시 형태에 따라 텍스트 데이터(TEXT DATA)를 수집할 때 포스팅을 무작위로 수집한 후 지역을 분류할 수도 있고, 관심 지역과 관련된 포스팅 만을 수집할 수도 있다.
본 발명의 목적은 관심 지역(POI, Point of Interst, 분석 대상지)의 사운스스케이프(Soundscape)를 지도 형태로 작성하는 것이므로, 분석 대상지(POI)와 관련있는 텍스트 데이터만을 수집하는 것이 바람직하다. 본 발명에서 사용하는 용어 '분석 대상지'와 '관심 지역'은 텍스트 데이터(TEXT DATA)가 포스팅된 지역, 또는 텍스트 데이터(TEXT DATA)에서 설명되는 지역을 의미하는 것으로서 동일한 개념을 뜻하는 용어이다.
도 2를 참조하면, 데이터 수집부(100)는 지역 명칭 DB(110) 및 지역 확인 모듈(120)을 포함한다. 지역 명칭 DB(110)는 각 지역을 호칭하는 단어 또는 문장을 저장한다.
지역 확인 모듈(120)은 텍스트 데이터에서 태그, 메타 또는 본문에 포함된 위치 관련 단어를 확인하고, 지역 명칭 DB(110)에 대조하여 수집된 텍스트 데이터가 분석 대상지(POI)에 해당하는지 확인한다. 다른 실시 형태로서는, 지역 확인 모듈(120)은 분석 대상지(POI)에 해당하는지 확인 하지 않고, 해당 지역의 POI를 기반으로 텍스트 데이터를 수집하는 방식으로 진행할 수 있다. 즉, 특정 POI가 포함된 텍스를 검색하고 수집하는 방식으로 지역 확인 모듈(120)을 구현하는 것도 무방하다.
도 4는 일 실시 형태에 따른 지역 명칭 DB를 설명한다. 지역 명칭 DB(110)는 주소, 도로명 주소,명소 및 랜드마크 등 텍스트 데이터에서 관심 지역(POI, 분석 대상지)을 확인할 수 있는 단어 또는 문장을 포함한다.
지역 확인 모듈(120)은 수집된 텍스트 데이터에서 지역 명칭 DB(110)에 수록된 지역 호칭 단어 또는 문장이 포함되어 있는지 여부를 판단하고, 포함된 경우 해당 텍스트 데이터를 유형 분류부(200)로 전달한다.
유형 분류부(200)는 수집된 텍스트 데이터를 미리 설정된 분류 체계에 따라 소리 유형별로 분류한다. 여기서 수집된 텍스트 데이터는 분석 대상지(POI)에 해당하는 텍스트를 의미한다.
유형 분류부(200)는 텍스트 데이터의 단어를 분류 기준에 따라 제1 카테고리(C1), 제2 카테고리(C2) 및 제3 카테고리(C3)로 분류하고, 분석 대상지별 각 카테고리의 발생 수를 확인한다.
도 3을 참조하면, 일 실시형태에 따른 유형 분류부(200)는 카테고리 DB(210), 자연어 처리 모듈(220) 및 빈도 확인 모듈(230)을 포함한다.
카테고리 DB(210)는 각각의 카테고리에 해당하는 단어 또는 문장을 저장한다. 자연어 처리 모듈(220)은 텍스트 데이터의 단어를 형태소 단위로 분리하고 카테고리 DB(210)에 조회한다. 빈도 확인 모듈(230)은 분석 대상지(POI)별 각 카테고리의 발생 수를 확인하여 제1 카테고리(C1), 제2 카테고리(C2) 및 제3 카테고리(C3)의 발생 빈도를 시각화(300)에 전달한다. 본 발명에서는 K-평균 군집화 알고리즘을 사용하여 분석 대상지(POI)의 소리 환경의 전반적인 경향을 분석하였다. K-평균 군집화 알고리즘은 K개의 중심을 임의로 지정하고, 그에 따라 특정 데이터들을 K개의 군집으로 분류하였고, 속성이 비슷한 데이터들끼리 하나의 군집에 할당되며, 최적의 군집 수 K를 결정하기 위해 Elbow Method를 사용하여 Inertia 값을 비교하였다. 여기서 Inertia는 데이터가 밀집된 정도이며, 그 감소 정도가 낮아지는 지점이 최적 군집 수라 할 수 있다. 본 발명에서 분석 대상지의 K-평균 군집 분석을 수행한 결과 3개의 군집, 즉 3개의 사운드스케이프 패턴이 도출되어서, 이를 유형 분류를 위한 3개의 카테고리로 지정 하였다.
도 5는 일 실시 형태에 따른 카테고리 DB를 설명하고, 도 6은 유형 분류부에서 수행되는 실제 동작 가운데 하나를 설명한다. 도 5 및 도 6을 참조하면 제1 카테고리(C1), 제2 카테고리(C2) 및 제3 카테고리(C3)는 각각 물리적 환경(physical setting), 활동(activity) 및 의미(meaning, image)와 관련한 소리 환경을 분류하는 카테고리이다. 도 5에 도시된 바와 같이 각 카테고리는 소리 환경을 세부적으로 분류한 서브 카테고리를 포함한다.
도 5 및 도 6은 카테고리 분류를 설명하기 위한 예시에 불과한 것으로서, 도시된 바에 따라 본 발명이 한정되는 것은 아니다. 실시자에 따라 각 카테고리에 포함되는 소리 환경은 적절하게 변형될 수 있다. 자연어 처리 모듈(220)은 텍스트 데이터의 문장들을 형태소 단위로 분리하고, 빈도 확인 모듈(230)은 각 단어가 카테고리 DB(210)의 어떤 카테코리 및 서브 카테고리에 속하는지 확인한다.
도 7은 일 실시 형태에 따른 시각화된 소리 환경 지도이다. 시각화부(300)는 분류된 카테고리 유형에 따라 분석 대상지의 소리 환경을 지도상에 시각적으로 표시한다. 구체적으로, 시각화부(300)는 제1 카테고리(C1), 제2 카테고리(C2) 및 제3 카테고리(C3)의 빈도수를 이미지로 표시하고 지도상의 상기 분석 대상지의 위치에 중첩하여 표시한다.
도 7의 실시형태에서는 시인성을 좋게 하기 위해 GIS 소프트웨어인 QGIS를 활용하였으며, 실제 공간의 물리적 크기와 상관 없이 1.5ㅧ1.5 ㎢ 그리드로 구성되며 지역별로 우세한 사운드스케이프를 나타냈으나, 이는 실시 가능한 형태 가운데 하나일 뿐으로서, 실시자에 따라 사운드스케이프의 표시형태는 다양한 형태로 도시 가능하다.
도 8은 일 실시예에 따른 소셜 미디어를 이용한 도시 소리 환경 측정 방법을 설명하는 순서도이다. 소셜 미디어를 이용한 도시 소리 환경 측정 방법을 설명하면 다음과 같다. 도 1 내지 도 7에서 설명된 소셜 미디어를 이용한 도시 소리 환경 측정 시스템(1000)을 시계열적으로 구현한 경우에도 본 실시예에 해당하므로 데이터 수집부(100), 유형 분류부(200) 및 시각화부(300)에 대하여 설명된 부분은 본 실시예에서도 그대로 적용된다.
일 실시예에 따른 소셜 미디어를 이용한 도시 소리 환경 측정 방법은, 데이터 수집 단계(S100), 유형 분류 단계(S200) 및 시각화 단계(S300)를 포함한다.
본 발명에 따른 소셜 미디어를 이용한 도시 소리 환경 측정 방법은 전산 처리 장치에서 구현 되는 것으로서, 데이터 수집 단계(S100), 유형 분류 단계(S200) 및 시각화 단계(S300)는 전산 처리 장치에서 소프트웨어로 구현된다.
S100 단계에서, 데이터 수집부(100)는 텍스트 기반 소셜 미디어로부터 분석 대상지의 텍스트 데이터(TEXT DATA)를 수집한다.
여기서, 소셜 미디어는 소셜 네트워크 서비스(Social Networking Service, SNS)를 의미하는 것으로서, 페이스북(Facebook), 인스타그램(Instagram), 트위터(Twitter) 등과 같은 인터넷 등의 전자 네트워크로 서로의 소식을 주고받는 등 사교활동을 하는 전반적인 서비스이다. 텍스트 데이터(TEXT DATA)는 각 서비스의 사용자들이 작성하여 공개하는 포스팅 데이터 중에서 문자로 이루어지는 데이터이다. 즉, 포스팅 본문의 내용이다.
데이터 수집부(100)는 인터넷 상에서 공개된 다수의 포스팅(P1, P2, .. Pn)에서 텍스트 데이터(TEXT DATA)를 수집한다. 이때, 실시 형태에 따라 텍스트 데이터(TEXT DATA)를 수집할 때 포스팅을 무작위로 수집한 후 지역을 분류할 수도 있고, 관심 지역과 관련된 포스팅 만을 수집할 수도 있다.
본 발명의 목적은 관심 지역(POI, Point of Interst, 분석 대상지)의 사운스스케이프(Soundscape)를 지도 형태로 작성하는 것이므로, 분석 대상지(POI)와 관련있는 텍스트 데이터만을 수집하는 것이 바람직하다. 본 발명에서 사용하는 용어 '분석 대상지'와 '관심 지역'은 텍스트 데이터(TEXT DATA)가 포스팅된 지역, 또는 텍스트 데이터(TEXT DATA)에서 설명되는 지역을 의미하는 것으로서 동일한 개념을 뜻하는 용어이다.
도 2를 참조하면, 데이터 수집부(100)는 지역 명칭 DB(110) 및 지역 확인 모듈(120)을 포함한다. 지역 명칭 DB(110)는 각 지역을 호칭하는 단어 또는 문장을 저장한다.
지역 확인 모듈(120)은 텍스트 데이터에서 태그, 메타 또는 본문에 포함된 위치 관련 단어를 확인하고, 지역 명칭 DB(110)에 대조하여 수집된 텍스트 데이터가 분석 대상지(POI)에 해당하는지 확인한다. 다른 실시 형태로서는, 지역 확인 모듈(120)은 분석 대상지(POI)에 해당하는지 확인 하지 않고, 해당 지역의 POI를 기반으로 텍스트 데이터를 수집하는 방식으로 진행할 수 있다. 즉, 특정 POI가 포함된 텍스를 검색하고 수집하는 방식으로 지역 확인 모듈(120)을 구현하는 것도 무방하다.
도 4는 일 실시 형태에 따른 지역 명칭 DB를 설명한다. 지역 명칭 DB(110)는 주소, 도로명 주소,명소 및 랜드마크 등 텍스트 데이터에서 관심 지역(POI, 분석 대상지)을 확인할 수 있는 단어 또는 문장을 포함한다.
지역 확인 모듈(120)은 수집된 텍스트 데이터에서 지역 명칭 DB(110)에 수록된 지역 호칭 단어 또는 문장이 포함되어 있는지 여부를 판단하고, 포함된 경우 해당 텍스트 데이터를 유형 분류부(200)로 전달한다.
S200 단계에서, 유형 분류부(200)는 수집된 텍스트 데이터를 미리 설정된 분류 체계에 따라 소리 유형별로 분류한다. 여기서 수집된 텍스트 데이터는 분석 대상지(POI)에 해당하는 텍스트를 의미한다.
유형 분류부(200)는 텍스트 데이터의 단어를 분류 기준에 따라 제1 카테고리(C1), 제2 카테고리(C2) 및 제3 카테고리(C3)로 분류하고, 분석 대상지별 각 카테고리의 발생 수를 확인한다.
도 3을 참조하면, 일 실시형태에 따른 유형 분류부(200)는 카테고리 DB(210), 자연어 처리 모듈(220) 및 빈도 확인 모듈(230)을 포함한다.
카테고리 DB(210)는 각각의 카테고리에 해당하는 단어 또는 문장을 저장한다. 자연어 처리 모듈(220)은 텍스트 데이터의 단어를 형태소 단위로 분리하고 카테고리 DB(210)에 조회한다. 빈도 확인 모듈(230)은 분석 대상지(POI)별 각 카테고리의 발생 수를 확인하여 제1 카테고리(C1), 제2 카테고리(C2) 및 제3 카테고리(C3)의 발생 빈도를 시각화(300)에 전달한다. 본 발명에서는 K-평균 군집화 알고리즘을 사용하여 분석 대상지(POI)의 소리 환경의 전반적인 경향을 분석하였다. K-평균 군집화 알고리즘은 K개의 중심을 임의로 지정하고, 그에 따라 특정 데이터들을 K개의 군집으로 분류하였고, 속성이 비슷한 데이터들끼리 하나의 군집에 할당되며, 최적의 군집 수 K를 결정하기 위해 Elbow Method를 사용하여 Inertia 값을 비교하였다. 여기서 Inertia는 데이터가 밀집된 정도이며, 그 감소 정도가 낮아지는 지점이 최적 군집 수라 할 수 있다. 본 발명에서 분석 대상지의 K-평균 군집 분석을 수행한 결과 3개의 군집, 즉 3개의 사운드스케이프 패턴이 도출되어서, 이를 유형 분류를 위한 3개의 카테고리로 지정 하였다.
도 5는 일 실시 형태에 따른 카테고리 DB를 설명하고, 도 6은 유형 분류부에서 수행되는 실제 동작 가운데 하나를 설명한다. 도 5 및 도 6을 참조하면 제1 카테고리(C1), 제2 카테고리(C2) 및 제3 카테고리(C3)는 각각 물리적 환경(physical setting), 활동(activity) 및 의미(meaning, image)와 관련한 소리 환경을 분류하는 카테고리이다. 도 5에 도시된 바와 같이 각 카테고리는 소리 환경을 세부적으로 분류한 서브 카테고리를 포함한다.
도 5 및 도 6은 카테고리 분류를 설명하기 위한 예시에 불과한 것으로서, 도시된 바에 따라 본 발명이 한정되는 것은 아니다. 실시자에 따라 각 카테고리에 포함되는 소리 환경은 적절하게 변형될 수 있다. 자연어 처리 모듈(220)은 텍스트 데이터의 문장들을 형태소 단위로 분리하고, 빈도 확인 모듈(230)은 각 단어가 카테고리 DB(210)의 어떤 카테코리 및 서브 카테고리에 속하는지 확인한다.
도 7은 일 실시 형태에 따른 시각화된 소리 환경 지도이다.
S300 단계에서, 시각화부(300)는 분류된 카테고리 유형에 따라 분석 대상지의 소리 환경을 지도상에 시각적으로 표시한다. 구체적으로, 시각화부(300)는 제1 카테고리(C1), 제2 카테고리(C2) 및 제3 카테고리(C3)의 빈도수를 이미지로 표시하고 지도상의 상기 분석 대상지의 위치에 중첩하여 표시한다.
도 7의 실시형태에서는 시인성을 좋게 하기 위해 GIS 소프트웨어인 QGIS를 활용하였으며, 실제 공간의 물리적 크기와 상관 없이 1.5ㅧ1.5 ㎢ 그리드로 구성되며 지역별로 우세한 사운드스케이프를 나타냈으나, 이는 실시 가능한 형태 가운데 하나일 뿐으로서, 실시자에 따라 사운드스케이프의 표시형태는 다양한 형태로 도시 가능하다.
본 명세서와 도면에 개시된 본 발명의 실시예들은 본 발명의 기술 내용을 쉽게 설명하고 본 발명의 이해를 돕기 위해 특정 예를 제시한 것일 뿐이며, 본 발명의 범위를 한정하고자 하는 것은 아니다. 여기에 개시된 실시예들 이외에도 본 발명의 기술적 사상에 바탕을 둔 다른 변형 예들이 실시 가능하다는 것은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 자명한 것이다.
1000 : 소셜 미디어를 이용한 도시 소리 환경 측정 시스템
100 : 데이터 수집부
200 : 유형 분류부
300 : 시각화부

Claims (12)

  1. 텍스트 기반 소셜 미디어로부터 분석 대상지의 텍스트 데이터를 수집하는 데이터 수집부;
    수집된 텍스트 데이터를 미리 설정된 분류 체계에 따라 소리 유형별로 분류하는 유형 분류부; 및
    분류된 유형에 따라 상기 분석 대상지의 소리 환경을 지도상에 시각적으로 표시하는 시각화부를 포함하는 소셜 미디어를 이용한 도시 소리 환경 측정 시스템.
  2. 청구항 1에 있어서,
    상기 데이터 수집부는,
    각 지역을 호칭하는 단어 또는 문장을 저장하는 지역 명칭 DB; 및
    소셜 미디어로부터 수집된 텍스트 데이터에서 태그, 메타 또는 본문에 포함된 위치 관련 단어를 확인하고, 상기 지역 명칭 DB에 대조하여 수집된 텍스트 데이터가 상기 분석 대상지에 해당하는지 확인하는 지역 확인 모듈을 포함하는 것을 특징으로 하는 소셜 미디어를 이용한 도시 소리 환경 측정 시스템.
  3. 청구항 2에 있어서,
    상기 유형 분류부는,
    상기 텍스트 데이터의 단어를 분류 기준에 따라 제1 카테고리, 제2 카테고리 및 제3 카테고리로 분류하고,
    상기 분석 대상지별 각 카테고리의 발생 수를 확인하는 것을 특징으로 하는 소셜 미디어를 이용한 도시 소리 환경 측정 시스템.
  4. 청구항 3에 있어서,
    상기 유형 분류부는,
    각각의 상기 카테고리에 해당하는 단어 또는 문장을 저장하는 카테고리 DB;
    상기 텍스트 데이터의 단어를 형태소 단위로 분리하고 상기 카테고리 DB에 조회하는 자연어 처리 모듈; 및
    상기 분석 대상지별 각 카테고리의 발생 수를 확인하는 빈도 확인 모듈을 포함하는 것을 특징으로 하는 소셜 미디어를 이용한 도시 소리 환경 측정 시스템.
  5. 청구항 4에 있어서,
    상기 제1 카테고리, 상기 제2 카테고리 및 상기 제3 카테고리는,
    각각 물리적 환경(physical setting), 활동(activity) 및 의미(meaning, image)와 관련한 소리 환경을 분류하는 카테고리인 것을 특징으로 하는 소셜 미디어를 이용한 도시 소리 환경 측정 시스템.
  6. 청구항 5에 있어서,
    상기 시각화부는,
    상기 제1 카테고리, 상기 제2 카테고리 및 상기 제3 카테고리의 빈도수를 이미지로 표시하고 지도상의 상기 분석 대상지의 위치에 중첩하여 표시하는 것을 특징으로 하는 소셜 미디어를 이용한 도시 소리 환경 측정 시스템.
  7. (a) 텍스트 기반 소셜 미디어로부터 분석 대상지의 텍스트 데이터를 수집하는 데이터 수집 단계;
    (b) 수집된 텍스트 데이터를 미리 설정된 분류 체계에 따라 소리 유형별로 분류하는 유형 분류 단계; 및
    (c) 분류된 유형에 따라 상기 분석 대상지의 소리 환경을 지도상에 시각적으로 표시하는 시각화 단계를 포함하는 소셜 미디어를 이용한 도시 소리 환경 측정 방법.
  8. 청구항 7에 있어서,
    상기 (a) 단계는,
    각 지역을 호칭하는 단어 또는 문장을 저장하는 지역 명칭 DB; 및
    소셜 미디어로부터 수집된 텍스트 데이터에서 태그, 메타 또는 본문에 포함된 위치 관련 단어를 확인하고, 상기 지역 명칭 DB에 대조하여 수집된 텍스트 데이터가 상기 분석 대상지에 해당하는지 확인하는 지역 확인 모듈을 포함하는 데이터 수집부에 의해 수행되는 것을 특징으로 하는 소셜 미디어를 이용한 도시 소리 환경 측정 방법.
  9. 청구항 8에 있어서,
    상기 (b) 단계는,
    (b-1) 상기 텍스트 데이터의 단어를 분류 기준에 따라 제1 카테고리, 제2 카테고리 및 제3 카테고리로 분류하는 단계; 및
    (b-2) 상기 분석 대상지별 각 카테고리의 발생 수를 확인하는 단계를 포함하는 것을 특징으로 하는 소셜 미디어를 이용한 도시 소리 환경 측정 방법.
  10. 청구항 9에 있어서,
    상기 (b) 단계는,
    각각의 상기 카테고리에 해당하는 단어 또는 문장을 저장하는 카테고리 DB;
    상기 텍스트 데이터의 단어를 형태소 단위로 분리하고 상기 카테고리 DB에 조회하는 자연어 처리 모듈; 및
    상기 분석 대상지별 각 카테고리의 발생 수를 확인하는 빈도 확인 모듈을 포함하는 유형 분류부에 의해 수행되는 것을 특징으로 하는 소셜 미디어를 이용한 도시 소리 환경 측정 방법.
  11. 청구항 10에 있어서,
    상기 제1 카테고리, 상기 제2 카테고리 및 상기 제3 카테고리는,
    각각 물리적 환경(physical setting), 활동(activity) 및 의미(meaning, image)와 관련한 소리 환경을 분류하는 카테고리인 것을 특징으로 하는 소셜 미디어를 이용한 도시 소리 환경 측정 방법.
  12. 청구항 11에 있어서
    상기 (c) 단계는,
    상기 제1 카테고리, 상기 제2 카테고리 및 상기 제3 카테고리의 빈도수를 이미지로 표시하고 지도상의 상기 분석 대상지의 위치에 중첩하여 표시하는 단계를 포함하는 것을 특징으로 하는 소셜 미디어를 이용한 도시 소리 환경 측정 방법.
KR1020210138340A 2021-10-18 2021-10-18 소셜 미디어를 이용한 도시 소리 환경 측정 시스템 및 방법 KR20230055081A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210138340A KR20230055081A (ko) 2021-10-18 2021-10-18 소셜 미디어를 이용한 도시 소리 환경 측정 시스템 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210138340A KR20230055081A (ko) 2021-10-18 2021-10-18 소셜 미디어를 이용한 도시 소리 환경 측정 시스템 및 방법

Publications (1)

Publication Number Publication Date
KR20230055081A true KR20230055081A (ko) 2023-04-25

Family

ID=86101454

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210138340A KR20230055081A (ko) 2021-10-18 2021-10-18 소셜 미디어를 이용한 도시 소리 환경 측정 시스템 및 방법

Country Status (1)

Country Link
KR (1) KR20230055081A (ko)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120014508A (ko) 2010-08-09 2012-02-17 서울시립대학교 산학협력단 유비쿼터스-시티 미들웨어를 사용하여 소음을 온라인 가시화하는 장치 및 방법
KR20190030275A (ko) 2017-09-14 2019-03-22 동아대학교 산학협력단 이어폰 형태의 소리 수집 장치를 이용한 빅 데이터 기반 실시간 소음지도 제공 시스템

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120014508A (ko) 2010-08-09 2012-02-17 서울시립대학교 산학협력단 유비쿼터스-시티 미들웨어를 사용하여 소음을 온라인 가시화하는 장치 및 방법
KR20190030275A (ko) 2017-09-14 2019-03-22 동아대학교 산학협력단 이어폰 형태의 소리 수집 장치를 이용한 빅 데이터 기반 실시간 소음지도 제공 시스템

Similar Documents

Publication Publication Date Title
Mourad et al. Critical impact of social networks infodemic on defeating coronavirus COVID-19 pandemic: Twitter-based study and research directions
Hou et al. Survey on data analysis in social media: A practical application aspect
CN104809108B (zh) 信息监测分析系统
KR101695011B1 (ko) 토픽별 오피니언과 소셜 영향력자를 기반으로 토픽을 탐지하고 추적하는 시스템 및 방법
KR101890497B1 (ko) 교통 위험도 분석방법 및 이를 포함하는 저장매체
CN111291071B (zh) 数据处理方法、装置及电子设备
CN101772766A (zh) 以用户为中心的信息搜索的方法和系统
US20120117034A1 (en) Context-aware apparatus and method
KR20160133304A (ko) 사용자 리뷰 제공 방법, 장치 및 컴퓨터 프로그램
US20200265054A1 (en) Ranking collections of document passages associated with an entity name by relevance to a query
CN113139025B (zh) 一种威胁情报的评价方法、装置、设备及存储介质
Tang et al. Visual analysis of traffic data based on topic modeling (ChinaVis 2017)
US8655883B1 (en) Automatic detection of similar business updates by using similarity to past rejected updates
Zhang et al. Analysis of street crime predictors in web open data
KR102124935B1 (ko) 크라우드 소싱을 활용한 재난 모니터링 시스템, 재난 모니터링 방법 및 이를 수행하기 위한 컴퓨터 프로그램
CN113590940B (zh) 基于知识图谱的文章生成方法和装置
Zhang et al. Automatic latent street type discovery from web open data
CN110895543B (zh) 人口迁徙跟踪展示方法、装置及存储介质
CN107330076A (zh) 一种网络舆情信息展示系统及方法
Yang et al. Diversity in urban social media analytics
KR20230055081A (ko) 소셜 미디어를 이용한 도시 소리 환경 측정 시스템 및 방법
CN110674208A (zh) 用于确定用户的职住地信息的方法和装置
KR20170000287A (ko) 지오 태깅 방법, 지오 태깅 장치 및 이를 수행하는 프로그램을 기록하는 기록매체
CN104809253B (zh) 互联网数据分析系统
Power et al. A Case Study for Monitoring Fires with Twitter.