KR102083017B1 - Method and system for analyzing social review of place - Google Patents

Method and system for analyzing social review of place Download PDF

Info

Publication number
KR102083017B1
KR102083017B1 KR1020180073133A KR20180073133A KR102083017B1 KR 102083017 B1 KR102083017 B1 KR 102083017B1 KR 1020180073133 A KR1020180073133 A KR 1020180073133A KR 20180073133 A KR20180073133 A KR 20180073133A KR 102083017 B1 KR102083017 B1 KR 102083017B1
Authority
KR
South Korea
Prior art keywords
social
analysis
information
dictionary
category
Prior art date
Application number
KR1020180073133A
Other languages
Korean (ko)
Other versions
KR20200000897A (en
Inventor
김현규
Original Assignee
삼육대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼육대학교산학협력단 filed Critical 삼육대학교산학협력단
Priority to KR1020180073133A priority Critical patent/KR102083017B1/en
Publication of KR20200000897A publication Critical patent/KR20200000897A/en
Application granted granted Critical
Publication of KR102083017B1 publication Critical patent/KR102083017B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/14Travel agencies

Abstract

본 발명은 플레이스의 소셜 리뷰 분석 방법 및 시스템에 관한 것이다. 본 발명의 일 실시예에 따른 플레이스의 소셜 리뷰 분석 방법은 사용자로부터 플레이스에 관한 검색 키워드 및 카테고리 정보를 입력 받는 단계와; 상기 검색 키워드에 대한 소셜 리뷰를 수집하는 단계와; 상기 카테고리 별로 서로 상이한 단어가 포함되도록 상기 카테고리 별로 각각 마련된 응용영역별 단어사전 중 사용자로부터 입력받은 카테고리 정보에 대응되는 응용영역별 단어사전을 이용하여 상기 소셜 리뷰에 대한 형태소 분석을 수행하는 단계; 및 상기 형태소 분석에 의해 도출된 정보를 이용하여 상기 소셜 리뷰에 대한 분석 정보를 추출 및 출력하는 단계를 포함한다.The present invention relates to a method and system for analyzing social reviews of a place. A method for analyzing a social review of a place according to an embodiment of the present invention includes receiving search keywords and category information related to the place from a user; Collecting a social review of the search keyword; Performing a morpheme analysis of the social review by using a word dictionary for each application area corresponding to category information input from a user among word dictionary for each application area provided for each category so that different words are included for each category; And extracting and outputting analysis information for the social review using the information derived by the morpheme analysis.

Description

플레이스의 소셜 리뷰 분석 방법 및 시스템 {Method and system for analyzing social review of place}Method and system for analyzing social review of place}

본 발명은 소셜 빅 데이터를 활용하여 음식점, 숙박업소, 여행명소 등의 플레이스에 대한 분석 정보를 제공하기 위한 플레이스의 소셜 리뷰 분석 방법 및 시스템에 관한 것이다.The present invention relates to a method and system for analyzing social reviews of a place for providing analysis information about a place such as a restaurant, a lodging facility, and a travel spot using social big data.

근래에 다양한 소셜 네트워크 서비스가 등장함에 따라 이용자들은 자신의 경험이나 의견을 다른 사람들과 쉽게 공유할 수 있는 기회가 증가하고 있으며, 이에 따라 소셜 네트워크 서비스를 마케팅 수단으로서 활용하는 시도가 이루어지고 있다.With the emergence of various social network services in recent years, users have an increased opportunity to easily share their experiences or opinions with others, and accordingly, attempts have been made to utilize social network services as a marketing means.

특히 최근 포털 사이트나 SNS 사이트를 통해 음식점, 숙박업소, 여행명소 등에 대한 리뷰, 평가가 공유되고 있는데, 이러한 플레이스에 대한 온라인 리뷰, 평가 등은 수요자들이 해당 플레이스에 대한 선택 여부를 결정하는 중요한 기준이 되고 있다.In particular, recently, reviews and evaluations of restaurants, lodging establishments, and tourist attractions are shared through portal sites or SNS sites. Online reviews, evaluations, etc. of these places are important criteria for consumers to decide whether to select the place. Is becoming.

나아가 해당 플레이스의 마케팅 전략을 수립하거나 상권을 분석할 때, 소셜 리뷰에 대한 분석 정보의 활용 필요성이 점차 대두되고 있으며, 이와 관련된 기술들이 개발 및 제안되고 있다. (특허문헌 1 참조)Furthermore, when establishing the marketing strategy of the relevant place or analyzing commercial areas, the necessity of using analysis information for social reviews is gradually emerging, and related technologies have been developed and proposed. (See Patent Document 1)

온라인에서 수집된 소셜 리뷰의 분석을 위해서는 리뷰 데이터에 대한 형태소 분석이 선행되어야 하는데, 이러한 형태소 분석은 단어의 유형(명사, 조사, 동사 등)을 인식하여, 키워드로서 가치가 있는 명사의 추출하고 각 단어를 기본형(표준형)으로 변환시킨다. To analyze social reviews collected online, morphological analysis of review data must be preceded. Such morphological analysis recognizes the type of words (nouns, surveys, verbs, etc.), extracts valuable nouns as keywords Convert a word to a basic form (standard form).

이러한 형태소 분석은 기본적으로 분석에 필요한 단어가 포함된 단어 사전을 검색하여 수행된다. 이 과정은 리뷰의 단어별로 전체 한글 사전을 검색하는 방식으로 수행되며, 검색된 단어가 형용사 또는 동사일 경우 가능한 모든 활용 형태를 검사/처리해야 하므로, 많은 시간과 컴퓨팅 자원이 소모되는 문제가 있다. 예를 들어, 월 단위로 전국 상권 분석 정보를 업데이트하는 방식의 상권 분석 서비스를 상정하면, 500개의 리뷰를 처리하는데 약 1분 정도가 소요되며, 플레이스별로 평균 500개의 리뷰를 가정할 경우, 전국 35000개의 플레이스에 대한 리뷰를 처리하는데 15일 정도가 소요되게 된다. 이에 따르면, 리뷰 수집에 소요되는 시간까지 포함하면, 월 단위 업데이트가 사실상 불가능하게 되는 것이다. The morpheme analysis is basically performed by searching a word dictionary containing words necessary for analysis. This process is performed by searching the entire Hangul dictionary for each word of the review, and if the searched word is an adjective or a verb, all possible forms of utilization must be checked / processed, which consumes a lot of time and computing resources. For example, assuming a commercial analysis service that updates national commercial analysis information on a monthly basis, it takes about 1 minute to process 500 reviews, and assuming an average of 500 reviews per place, 35000 nationwide It takes about 15 days to process a review of a dog's place. According to this, if the time required for collecting reviews is included, monthly updates are virtually impossible.

한편, 형태소 분석을 거친 리뷰로부터 유효한 데이터를 추출하는 단계가 수행되는데, 기존의 유효 데이터 추출 방법은 수집된 소셜 리뷰가 주어진 검색 키워드와 연관이 적은 것으로 간주한 후 미리 정의된 긍정 표현(예를 들어, '맛있다', '맛집' 등)이 포함된 리뷰만을 추출하는 방식을 사용하며, 이러한 방식은 유효 데이터로 채택되는 비율이 현저히 낮은 문제가 있다. 이와 같이, 통계의 모집단이 되는 리뷰 개수가 적을 경우, 산정 결과에 대한 정확성 및 신뢰도가 저하될 뿐만 아니라, 바이럴 마케팅에 취약해지는 문제점이 발생한다.Meanwhile, a step of extracting valid data from a review that has undergone morphological analysis is performed. In the existing method of extracting valid data, a predetermined positive expression (for example, after the collected social review is regarded as having little relation with a given search keyword) , 'Delicious', 'Delicious', etc.) is used to extract only the reviews that contain it, and this method has a problem in that the rate of adoption as effective data is remarkably low. As described above, when the number of reviews serving as a population of statistics is small, accuracy and reliability of the calculation result are deteriorated, and a problem is vulnerable to viral marketing.

등록특허공보 제10-1715737호 (2017,03.07)Registered Patent Publication No. 10-1715737 (2017,03.07)

본 발명은 상기와 같은 문제점을 해결하기 위한 것으로서, 종래 기술보다 향상된 속도를 제공할 뿐 아니라 분석 정확도의 향상이 가능한 플레이스의 소셜 리뷰 분석 방법 및 시스템을 제공하기 위한 것이다.The present invention is to solve the above problems, as well as to provide an improved speed than the prior art, and to provide a method and system for analyzing social reviews of a place capable of improving analysis accuracy.

본 발명이 이루고자 하는 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.The technical problems to be achieved by the present invention are not limited to the technical problems mentioned above, and other technical problems that are not mentioned will be clearly understood by those skilled in the art from the following description. Will be able to.

본 발명의 일 실시예에 따르면, 사용자로부터 플레이스에 관한 검색 키워드 및 카테고리 정보를 입력 받는 단계와; 상기 검색 키워드에 대한 소셜 리뷰를 수집하는 단계와; 상기 카테고리 별로 서로 상이한 단어가 포함되도록 상기 카테고리 별로 각각 마련된 응용영역별 단어사전 중 사용자로부터 입력받은 카테고리 정보에 대응되는 응용영역별 단어사전을 이용하여 상기 소셜 리뷰에 대한 형태소 분석을 수행하는 단계; 및 상기 형태소 분석에 의해 도출된 정보를 이용하여 상기 소셜 리뷰에 대한 분석 정보를 추출 및 출력하는 단계를 포함하는 플레이스의 소셜 리뷰 분석 방법이 제공될 수 있다.According to an embodiment of the present invention, receiving search keyword and category information about a place from a user; Collecting a social review of the search keyword; Performing a morpheme analysis of the social review by using a word dictionary for each application area corresponding to category information input from a user among word dictionary for each application area provided for each category so that different words are included for each category; And extracting and outputting analysis information for the social review using the information derived by the morpheme analysis.

또한, 상기 카테고리 정보는 음식점, 카페, 숙박업소, 관광 명소 중 하나 이상을 포함할 수 있다. In addition, the category information may include one or more of restaurants, cafes, lodging establishments, and tourist attractions.

또한, 상기 소셜 리뷰에 대한 분석 정보는 연관 키워드, 연관 이미지, 인기 지수, 및 인지도 정보 중 하나 이상을 포함할 수 있다.Further, the analysis information for the social review may include one or more of a related keyword, a related image, a popularity index, and recognition information.

또한, 상기 소셜 리뷰 분석 방법은 수집된 모든 소셜 리뷰를 연관성이 있는 것으로 간주한 후, 연관성이 낮은 노이즈 패턴이 포함된 리뷰를 제외시켜 분석 정보 출력을 위한 유효 데이터를 추출하는 단계를 더 포함할 수 있다.In addition, the method for analyzing the social review may further include extracting valid data for outputting analysis information by excluding all reviews having a low noise pattern after considering all collected social reviews as relevant. have.

또한, 상기 유효 데이터를 추출하는 단계는, 상기 카테고리별로 상이한 노이즈 패턴이 포함된 응용영역별 패턴사전을 검색하여 이루어질 수 있다.In addition, the step of extracting the effective data may be performed by searching for a pattern dictionary for each application area including different noise patterns for each category.

또한, 상기 소셜 리뷰 분석 방법은 상기 소셜 리뷰에 대한 분석 정보를 다른 언어로 번역하는 단계를 더 포함하고, 상기 번역 단계는, 고유명사에 대한 번역 정보가 포함되도록 별도로 마련된 고유명사 사전을 검색하여 고유명사에 대한 번역을 수행하는 단계와; 온라인 번역기를 통해 고유명사를 제외한 잔여 부분에 대한 번역을 수행하는 단계를 포함할 수 있다.In addition, the social review analysis method further includes the step of translating the analysis information on the social review into another language, and the translation step is performed by searching for a dictionary of proper nouns separately provided to include translation information about the proper noun. Performing a translation for the noun; It may include the step of performing the translation for the remaining part except the proper noun through the online translator.

한편, 본 발명의 다른 실시예에 따르면, 사용자로부터 플레이스에 관한 검색 키워드 및 카테고리 정보를 입력 받고, 상기 검색 키워드에 대한 소셜 리뷰를 수집하는 소셜 리뷰 수집 유닛과; 상기 소셜 리뷰에 대한 형태소 분석을 수행하는 형태소 분석 유닛; 및 상기 형태소 분석에 의해 도출된 정보를 이용하여 상기 소셜 리뷰에 대한 분석 정보를 추출 및 출력하는 분석 유닛을 포함하고, 상기 형태소 분석 유닛은, 상기 카테고리 별로 각각 마련되며, 상기 카테고리 별로 서로 상이한 단어가 포함되는 복수의 응용영역별 단어사전; 및 상기 복수의 응용영역별 단어사전 중 사용자로부터 입력받은 카테고리 정보에 대응되는 응용영역별 단어사전을 이용하여 상기 소셜 리뷰에 대한 형태소 분석을 수행하는 형태소 분석기를 포함하는 것을 특징으로 하는 플레이스의 소셜 리뷰 분석 시스템이 제공될 수 있다.Meanwhile, according to another embodiment of the present invention, a social review collection unit that receives search keywords and category information regarding a place from a user and collects social reviews of the search keywords; A morpheme analysis unit that performs a morpheme analysis for the social review; And an analysis unit for extracting and outputting analysis information for the social review using the information derived from the morpheme analysis, wherein the morpheme analysis unit is provided for each category, and different words for each category are provided. A word dictionary for a plurality of application areas included; And a morpheme analyzer that performs a morpheme analysis on the social review by using a word dictionary for each application region corresponding to category information input from a user among the word dictionary for each of the plurality of application regions. An analysis system can be provided.

또한, 상기 형태소 분석 유닛은, 시험 데이터에 대한 기계 학습을 통해 상기 응용영역별 단어사전에 포함되는 단어는 도출하는 단어사전 학습기를 더 포함할 수 있다.In addition, the morpheme analysis unit may further include a word dictionary learner that derives words included in the word dictionary for each application area through machine learning of test data.

또한, 상기 소셜 리뷰 분석 시스템은, 수집된 모든 소셜 리뷰를 연관성이 있는 것으로 간주한 후, 연관성이 낮은 노이즈 패턴이 포함된 리뷰를 제외시켜 분석 정보의 출력을 위한 유효 데이터를 추출하는 노이즈 필터 유닛을 더 포함할 수 있다.In addition, the social review analysis system, after considering all the collected social reviews as relevant, excludes the reviews that include the low noise pattern and extracts effective data for output of analysis information. It may further include.

또한, 상기 노이즈 필터 유닛은 상기 카테고리별로 상이한 노이즈 패턴이 포함된 응용영역별 패턴 사전을 검색하여 필터링을 수행할 수 있다.Further, the noise filter unit may perform filtering by searching a pattern dictionary for each application area including different noise patterns for each category.

또한, 상기 응용영역별 단어사전 및 패턴사전은 상기 카테고리별로 모듈화되게 구성될 수 있다.Further, the word dictionary and the pattern dictionary for each application area may be configured to be modularized for each category.

또한, 상기 소셜 리뷰 분석 시스템은 상기 소셜 리뷰에 대한 분석 정보를 다른 언어로 번역하는 번역 유닛을 더 포함하고, 상기 번역 유닛은, 고유명사에 대한 번역 정보가 포함되는 고유명사 사전; 및 상기 분석 정보 중 고유명사 부분은 상기 고유명사 사전을 이용하여 번역을 수행하고, 고유명사를 제외한 잔여 부분에 대해서는 온라인 번역기를 통해 번역이 수행되도록 하는 번역기를 포함할 수 있다. 여기서, 상기 고유명사 사전은 복수의 언어 별로 각각 구비될 수 있다.In addition, the social review analysis system further includes a translation unit that translates the analysis information on the social review into another language, and the translation unit includes: a proper noun dictionary including translation information about a proper noun; And the proper noun part of the analysis information may include a translator that performs translation using the proper noun dictionary, and performs translation through an online translator for the remaining parts except the proper noun. Here, the proper noun dictionary may be provided for each of a plurality of languages.

본 발명의 일 실시예에 따르면, 카테고리 별로 응용영역별 단어사전을 마련하고, 사용자로부터 입력받은 카테고리 정보에 대응되는 응용영역별 단어사전을 이용하여 소셜 리뷰에 대한 형태소 분석을 수행함으로써, 소셜 리뷰에 대한 처리 속도를 월등히 향상시킬 수 있으며, 컴퓨팅 자원 소모를 줄일 수 있는 효과가 있다.According to an embodiment of the present invention, by preparing a word dictionary for each application area for each category, and performing a morpheme analysis for a social review using the word dictionary for each application area corresponding to the category information received from the user, It can greatly improve the processing speed of the system, and has the effect of reducing the consumption of computing resources.

또한, 수집된 소셜 리뷰 중 유효한 데이터를 추출하는 방식으로써, 수집된 모든 소셜 리뷰를 연관성이 있는 것으로 간주한 후, 연관성이 낮은 노이즈 패턴이 포함된 리뷰를 제외시키는 긍정적 노이즈 필터링 방식을 사용함으로써, 분석 결과의 정확도 및 신뢰성을 향상시킬 수 있다.In addition, as a method of extracting valid data among the collected social reviews, by analyzing all collected social reviews as relevant, by using a positive noise filtering method that excludes reviews that include a noise pattern with a low correlation. The accuracy and reliability of the results can be improved.

또한, 상권 분석 정보에 대한 번역 정보를 제공하여 분석 정보의 사용층을 외국인까지 확대할 수 있으며, 번역시 별도로 마련된 고유명사 사전을 통한 고유 명사 번역을 1차적으로 수행한 후 나머지 번역을 온라인 번역기로 수행함으로써, 온라인 번역기에 통한 번역시 발생 가능한 오번역을 최소화할 수 있는 이점이 있다.In addition, it is possible to expand the use layer of the analysis information to foreigners by providing translation information for commercial analysis information, and perform the translation of the original noun through a separate noun dictionary prepared first when translating, and then use the remaining translations as an online translator. By performing, there is an advantage that can minimize the mistranslation that may occur during translation through an online translator.

나아가, 응용영역별 단어사전 및 패턴 사전을 카테고리별로 모듈화되게 구성함으로써, 카테고리의 추가 및 응용 분야의 확장이 용이한 이점이 있다.Further, by configuring the word dictionary and pattern dictionary for each application area to be modularized by category, there is an advantage of easy addition of categories and expansion of application fields.

도 1은 본 발명의 일 실시예에 따른 플레이스의 소셜 리뷰 분석 시스템의 블록 다이어그램.
도 2는 본 발명의 일 실시예에 따른 플레이스의 소셜 리뷰 분석 방법을 나타낸 순서도.
도 3은 본 발명과 관련된 검색 키워드 및 카테고리 정보를 입력받기 위한 입력 페이지의 일 예를 예시한 도면.
도 4는 본 발명과 관련된 소셜 리뷰에 대한 노이즈 필터링 후 유효 데이터를 출력한 일 예를 예시한 도면.
도 5는 본 발명과 관련된 소셜 리뷰에 대한 분석 정보를 출력한 출력 페이지의 일 예를 예시한 도면.
1 is a block diagram of a social review analysis system of a place according to an embodiment of the present invention.
2 is a flow chart illustrating a method for analyzing social reviews of a place according to an embodiment of the present invention.
3 is a diagram illustrating an example of an input page for receiving search keyword and category information related to the present invention.
4 is a diagram illustrating an example of outputting valid data after noise filtering for a social review related to the present invention.
5 is a diagram illustrating an example of an output page that outputs analysis information for a social review related to the present invention.

본 발명은 다양한 변환을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변환, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 본 발명을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.The present invention can be applied to a variety of transformations and may have various embodiments, and specific embodiments will be illustrated in the drawings and described in detail. However, this is not intended to limit the present invention to specific embodiments, and should be understood to include all conversions, equivalents, and substitutes included in the spirit and scope of the present invention. In the description of the present invention, when it is determined that a detailed description of known technologies related to the present invention may obscure the subject matter of the present invention, the detailed description will be omitted.

제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다.Terms such as first and second may be used to describe various components, but the components should not be limited by the terms. The terms are used only for the purpose of distinguishing one component from other components.

본 출원에서 사용한 용어는 단지 특정한 실시 예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함한다" 또는 "가지다" 등의 용어는 명세서 상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.Terms used in the present application are only used to describe specific embodiments, and are not intended to limit the present invention. Singular expressions include plural expressions unless the context clearly indicates otherwise. In this application, the terms "comprises" or "have" are intended to indicate the presence of features, numbers, steps, actions, components, parts or combinations thereof described in the specification, one or more other features. It should be understood that the existence or addition possibilities of fields or numbers, steps, operations, components, parts or combinations thereof are not excluded in advance.

이하, 본 발명에 의한 플레이스의 소셜 리뷰 분석 방법 및 시스템의 일 실시예를 첨부도면을 참조하여 상세히 설명하기로 하며, 첨부 도면을 참조하여 설명함에 있어, 동일하거나 대응하는 구성 요소는 동일한 도면번호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다.Hereinafter, an embodiment of a method and system for analyzing social reviews of a place according to the present invention will be described in detail with reference to the accompanying drawings. In describing with reference to the accompanying drawings, identical or corresponding components have the same reference numbers. It will be given and redundant description will be omitted.

도 1은 본 발명의 일 실시예에 따른 플레이스의 소셜 리뷰 분석 시스템의 블록 다이어그램이다.1 is a block diagram of a place's social review analysis system according to an embodiment of the present invention.

도 1을 참조하면, 본 실시예에 따른 소셜 리뷰 분석 시스템은 소셜 리뷰 수집 유닛(10), 형태소 분석 유닛(20), 분석 유닛(30)을 포함한다.Referring to FIG. 1, the social review analysis system according to the present embodiment includes a social review collection unit 10, a morpheme analysis unit 20, and an analysis unit 30.

소셜 리뷰 수집 유닛(10)은 사용자로부터 플레이스(음식점, 카페, 숙박업소, 관광 명소 등)에 관한 검색 키워드 및 카테고리 정보를 입력 받는다. 여기서, 검색 키워드는 플레이스의 상호명, 주소명 등이 될 수 있고, 카테고리 정보는 '음식점', '카페', '숙박업소', '관광 명소' 등이 될 수 있다. 사용자는 소셜 리뷰 수집 유닛(10)과 온라인으로 연결된 사용자 클라이언트(스마트폰, 컴퓨터 등)을 통해 해당 정보를 입력할 수 있다. The social review collection unit 10 receives search keywords and category information regarding a place (restaurant, cafe, accommodation, tourist attraction, etc.) from a user. Here, the search keyword may be a place name or an address name of the place, and the category information may be a 'restaurant', a 'cafe', a 'hotel,' or a tourist attraction. The user may input the corresponding information through a user client (smartphone, computer, etc.) connected online with the social review collection unit 10.

소셜 리뷰 수집 유닛(10)은 사용자로부터 입력받는 검색 키워드에 대한 소셜 리뷰를 수집한다. 소셜 리뷰 수집 유닛(10)은 기설정된 소셜 사이트(100)로부터 소셜 리뷰를 수집하며, 이러한 소셜 사이트(100)는 네이버, 다음 등의 포털 사이트와, 페이스북, 트위터, 인스타그램 등의 SNS 사이트 등을 포함할 수 있다. 소셜 리뷰는 블로그, 카페, SNS 피드 등의 게시물을 포함하며, 텍스트 이외에 이미지도 포함할 수 있다. 이러한 소셜 리뷰 데이터는 포털 및 SNS 사이트들이 제공하는 오픈 검색 API를 통해 수집 가능하며, 수집된 소셜 리뷰는 별도로 바련된 소셜 리뷰 데이터베이스(15)에 저장될 수 있다.The social review collection unit 10 collects social reviews of search keywords received from a user. The social review collection unit 10 collects social reviews from a predetermined social site 100, and the social site 100 includes portal sites such as Naver, Daum, and SNS sites such as Facebook, Twitter, and Instagram. And the like. Social reviews include posts such as blogs, cafes, and social media feeds, and can include images in addition to text. Such social review data can be collected through an open search API provided by portals and SNS sites, and the collected social reviews can be stored in a separately prepared social review database 15.

형태소 분석 유닛(20)은 소셜 리뷰에 대한 형태소 분석을 수행한다. 형태소 분석 유닛(20)은 소셜 리뷰를 구성하는 단어의 유형(명사, 조사, 동사 등)을 인식하고, 키워드로서 가치가 있는 명사의 추출하고 각 단어를 기본형(표준형)으로 변환시킨다.The morpheme analysis unit 20 performs morpheme analysis for social reviews. The morpheme analysis unit 20 recognizes types of words (nouns, surveys, verbs, etc.) constituting social reviews, extracts valuable nouns as keywords, and converts each word into a basic form (standard form).

형태소 분석 유닛(20)은 응용영역별 단어사전(21) 및 형태소 분석기(22)를 포함한다. The morpheme analysis unit 20 includes a word dictionary 21 for each application area and a morpheme analyzer 22.

응용영역별 단어사전(21)은 복수개로서 카테고리 별로 각각 마련되며, 카테고리 별로 서로 상이한 단어가 포함된다. 예를 들어, 음식점, 카페, 숙박업소, 관광 명소 별로 소셜 리뷰에서 자주 언급되는 단어들이 모두 다르며, 이러한 사항을 이용하여 카테고리별로 응용용역별 단어사전(21)을 별도로 제작하여 사전의 사이즈를 줄였다. 각 응용영역별 단어사전(21)은 각 응용영역별로 주요 의미를 가지는 단어 위주로 구성될 수 있다. A plurality of word dictionaries 21 for each application area are provided for each category, and different words are included for each category. For example, the words frequently mentioned in social reviews are different for restaurants, cafes, lodging establishments, and tourist attractions, and by using these matters, the dictionary of words for each application service is separately produced to reduce the size of the dictionary. The word dictionary 21 for each application area may be composed mainly of words having a main meaning for each application area.

형태소 분석기(22)는 복수의 응용영역별 단어사전(21) 중 사용자로부터 입력받은 카테고리 정보에 대응되는 응용영역별 단어사전(21)을 이용하여 소셜 리뷰에 대한 형태소 분석을 수행한다. 이에 따르면 기존의 공용 라이브러리(단일 라이브러리)를 사용하는 경우와 대비해서 사전 검색 시간을 대폭 단축시킬 수 있다. 또한, 형용사, 동사의 활용 형태의 처리 또한 사전 별로 제한된 단어에 한하여 처리되므로 효율성 향상이 가능하다. The morpheme analyzer 22 performs morpheme analysis for a social review by using the word dictionary 21 for each application area corresponding to category information input from the user among the word dictionary 21 for each application area. According to this, it is possible to significantly shorten the dictionary search time compared to the case of using the existing common library (single library). In addition, the processing of adjectives and verbs is also limited to words limited by dictionaries, so efficiency can be improved.

형태소 분석 유닛(20)에는, 시험 데이터(Training data set)에 대한 기계 학습(machine learning)을 통해 응용영역별 단어사전(21)에 포함되는 단어를 도출하는 단어사전 학습기(23)가 추가로 구비될 수 있다.The morpheme analysis unit 20 is further equipped with a word dictionary learner 23 for deriving words included in the word dictionary 21 for each application area through machine learning for the training data set. Can be.

분석 유닛(30)은 이상과 같은 형태소 분석에 의해 도출된 정보를 이용하여 소셜 리뷰에 대한 분석 정보를 추출 및 출력한다. 이러한 소셜 리뷰에 대한 분석 정보로서, 연관 키워드, 연관 이미지, 인기 지수, 및 인지도 정보 등을 들 수 있다. The analysis unit 30 extracts and outputs analysis information for a social review using the information derived by the above morphological analysis. As the analysis information for the social review, related keywords, related images, popularity indexes, and recognition information may be mentioned.

이상과 같은 형태소 분석 방법에 따르면, 500개의 리뷰를 처리하는데 시간을 기존의 1분에서 5초 이내로 단축할 수 있으며, 이를 통해 플레이스별 실시간 분석이 가능해진다.According to the above morphological analysis method, it is possible to shorten the time to process 500 reviews within 1 minute to 5 seconds, thereby enabling real-time analysis for each place.

한편, 본 실시예에 의한 소셜 분석 시스템은 수집된 소셜 리뷰 중 유효한 데이터를 추출하기 위한 노이즈 필터 유닛(40)이 추가로 구비할 수 있다. Meanwhile, the social analysis system according to the present embodiment may further include a noise filter unit 40 for extracting valid data among collected social reviews.

예를 들어, 검색 키워드가“동경미식”으로 주어질 경우, 검색 결과에 “동경미식 오른쪽분식집”, “동경미식 건물 2층 소아과” 등의 노이즈가 함께 포함되어 전달되므로, 이를 걸러내기 위한 필터링 과정이 필요하며, 노이즈 필터 유닛(40)은 이러한 노이즈 필터링을 수행한다.For example, if the search keyword is given as “Tokyo Beauty”, the search results include noises such as “Tokyo Fine Food Right Side Dining House” and “Tokyo Beauty Building 2nd Floor Pediatrics”, so the filtering process to filter them out This is necessary, and the noise filter unit 40 performs such noise filtering.

노이즈 필터 유닛(40)은 형태소 분석 유닛(20)과 분석 유닛(30)의 사이에 연결되며, 형태소 분석 유닛(20)으로부터 받는 데이터에 대한 필터링 처리 후, 이를 분석 유닛(30)으로 전달한다. 노이즈 필터 유닛(40)의 필터링에 의해 추출된 유효 데이터는 별도로 마련된 유효 데이터 데이터베이스(45)에 저장될 수 있다.The noise filter unit 40 is connected between the morpheme analysis unit 20 and the analysis unit 30, and after filtering the data received from the morpheme analysis unit 20, it is transferred to the analysis unit 30. The valid data extracted by the filtering of the noise filter unit 40 may be stored in a valid data database 45 provided separately.

기존의 유효 데이터 추출 방법은 수집된 소셜 리뷰가 주어진 검색 키워드와 연관이 적은 것으로 간주한 후 미리 정의된 긍정 표현(예를 들어, '맛있다', '맛집' 등)이 포함된 리뷰만을 추출하는 방식으로서, 소위 부정적(Pessimistic) 노이즈 필터링으로 지칭될 수 있다. 이러한 부정적(Pessimistic) 노이즈 필터링의 경우, 리뷰 타이틀에 “동경미식”이 있거나, "인생맛집", "강추" 등의 미리 정의된 긍정 표현이 있을 경우에 한해 유효 데이터(연관 리뷰)로 체택하게 되며, 유효 데이터로 채택되는 비율이 전체의 5 내지 10% 정도로 매우 낮다. The existing method of extracting valid data considers that the collected social reviews are less related to a given search keyword, and then extracts only reviews that include predefined positive expressions (eg, 'delicious', 'delicious', etc.) As, it can be referred to as so-called negative (Pessimistic) noise filtering. In the case of such negative noise filtering, it is selected as valid data (associated review) only when the review title has “Tokyo Beauty” or a predefined positive expression such as “Life Taste” or “Gangchu”. However, the ratio adopted as valid data is very low, about 5 to 10% of the total.

예를 들어, 플레이스의 추천에 있어 리뷰수가 50개인 "플레이스 A"가 1위, 리뷰수가 41개인 "플레이스 B"가 2위로 추천될 경우, "플레이스 B"에서 바이럴 마케터를 고용하여 10개의 리뷰만 올리게 되면 순위가 변동될 있게 된다. 이와 같이, 통계의 모집단이 되는 리뷰 수가 적을 경우, 산정 결과에 대한 신뢰도가 저하될 뿐만 아니라, 바이럴 마케팅에 취약해지는 문제점이 발생한다.For example, in place recommendation, if "Place A" with 50 reviews is ranked 1st and "Place B" with 41 reviews is ranked 2nd, "Place B" hires a viral marketer and only reviews 10 If you increase it, the ranking will change. As described above, when the number of reviews serving as a population of statistics is small, not only the reliability of the calculation result is lowered, but also a problem that is vulnerable to viral marketing occurs.

본 실시예에 따르면, 이와 같은 문제점을 해결하기 위하여, 노이즈 필터 유닛(40)은 수집된 모든 소셜 리뷰를 연관성이 있는 것으로 간주한 후, 연관성이 낮은 노이즈 패턴이 포함된 리뷰를 제외시켜 유효 데이터를 추출하는, 소위 긍정적(Optimistic) 노이즈 필터링 방식을 사용한다. According to the present embodiment, in order to solve such a problem, the noise filter unit 40 considers all collected social reviews as relevant, and then excludes the reviews including the low-related noise patterns to extract valid data. To extract, we use a so-called positive noise filtering method.

이러한 노이즈 패턴으로서, "오른쪽", "건물 2층"과 같은 플레이스의 인접 위치를 나타내는 부사, 버스 노선이나 지하철 노선과 같은 단어의 단순한 나열, "종로점", "강남역점"과 같은 지역별 프랜차이즈를 지칭하는 단어 등을 들 수 있다.These noise patterns include adverbs indicating adjacent locations of places such as "right" and "second floor of the building", simple listing of words such as bus lines and subway lines, and regional franchises such as "Jongno point" and "Gangnam station point". And words to say.

이러한 노이즈 패턴 또한 카테고리별로 다르게 구성될 수 있으며, 이러한 경우 노이즈 필터 유닛(40)은 카테고리별로 상이한 노이즈 패턴이 포함된 응용영역별 패턴사전(41)을 검색하여 필터링을 수행할 수 있다. 예를 들어, “분양”, “프리미엄” 등의 단어는 부동산 응용영역에서는 주요 키워드로 처리되나, 맛집, 관광명소 등의 응용영역에 대한 분석에서는 노이즈 패턴으로 인식될 수 있다. 이러한 응용영역별 노이즈 패턴의 도출 또한 기계 학습을 통해 수행 가능하다.The noise pattern may also be configured differently for each category, and in this case, the noise filter unit 40 may perform filtering by searching the pattern dictionary 41 for each application area including different noise patterns for each category. For example, words such as “sale” and “premium” are treated as key keywords in the real estate application area, but may be recognized as noise patterns in analysis of application areas such as restaurants and tourist attractions. Derivation of noise patterns for each application area can also be performed through machine learning.

본 발명에 따르면, 카테고리별로 별도로 마련된 응용영역별 단어사전(21) 및 패턴사전(41)은 카테고리별로 모듈화되게 구성될 수 있다. 예를 들어, 음식점에 해당하는 단어사전(21) 및 패턴사전(41)이 모듈화된 제1 모듈과, 관광명소에 해당하는 응용을 모듈화시키고, 관광명소에 해당하는 단어사전(21) 및 패턴사전(41)이 모듈화된 제2 모듈이 별도로 구비될 수 있다. 여기서 부동산 응용영역을 추가하고 할 경우, 부동산에 해당하는 단어사전(21) 및 패턴사전(41)이 모듈화된 제3 모듈을 추가하기만 하며 되므로, 응용 영역 및 적용 분야를 용이하게 확장할 수 있다.According to the present invention, the word dictionary 21 and the pattern dictionary 41 provided separately for each category may be configured to be modularized for each category. For example, the first module in which the word dictionary 21 and the pattern dictionary 41 corresponding to a restaurant are modularized, and the application corresponding to the tourist attraction is modularized, and the word dictionary 21 and the pattern dictionary corresponding to the tourist attraction A second module in which (41) is modularized may be separately provided. Here, when adding and applying the real estate application area, the word dictionary 21 and the pattern dictionary 41 corresponding to the real estate only need to add a modularized third module, so that the application area and application field can be easily expanded. .

한편, 본 실시예에 따른 소셜 리뷰 분석 시스템에는 소셜 리뷰에 대한 분석 정보를 다른 언어로 번역하여 번역 정보를 출력하는 번역 유닛(50)이 추가로 구비될 수 있다. 이와 같이, 연관 키워드, 인지도 정보 등 관련 정보에 대한 다국어 지원을 통해 분석 정보에 대한 사용층을 외국인들까지 확대할 수 있다. Meanwhile, the social review analysis system according to the present embodiment may further include a translation unit 50 that translates analysis information about social reviews into other languages and outputs translation information. In this way, the multi-language support for related information such as related keywords and recognition information can be used to expand the level of analysis information to foreigners.

본 실시예의 번역 유닛(50)은 다국어 지원을 위해 기본적으로 온라인 번역기(예를 들어, 구글 번역)를 활용하며, 이러한 온라인 번역기의 번역 오류 문제(예를 들어, “오삼불고기”를 “5-3 bulgogi”로, “성지원식당”을 “sex support restaurant”으로 번역)를 해결하기 위해 별도의 고유명사 사전(51)을 구비한다.The translation unit 50 of the present embodiment basically uses an online translator (eg, Google Translate) for multilingual support, and the translation error problem (eg, “Osam Bulgogi”) of the online translator is “5-3. bulgogi ”, translated“ sex support restaurant ”into“ sex support restaurant ”), a separate proper noun dictionary 51 is provided.

번역 유닛(50)은 고유명사에 대한 번역 정보가 포함되는 고유명사 사전(51)와, 고유명사 사전(51)을 검색하여 고유명사에 대한 번역을 수행하는 번역기(52)를 포함한다. 고유명사 사전(51)은 복수의 언어 별로 각각 구비될 수 있으며, 번역기(52)는 분석 정보 중 고유명사 부분(예를 들어, "오삼불고기", "성지원" 등)은 고유명사 사전을 이용하여 번역을 수행하고, 고유명사를 제외한 잔여 부분에 대해서는 번역기 API(53)를 통해 온라인 번역기(200)를 활용하여 번역이 수행되도록 한다.The translation unit 50 includes a proper noun dictionary 51 including translation information about a proper noun, and a translator 52 that searches for the proper noun dictionary 51 and performs translation on the proper noun. The proper noun dictionary 51 may be provided for each of a plurality of languages, and the translator 52 uses a proper noun dictionary for the proper noun part (eg, “Osam Bulgogi”, “Sung Ji-won”, etc.) of the analysis information. Translation is performed by using the online translator 200 through the translator API 53 for the remaining part except the proper noun.

도 2는 본 발명의 일 실시예에 따른 플레이스의 소셜 리뷰 분석 방법을 나타낸 순서도이다.2 is a flowchart illustrating a method for analyzing social reviews of a place according to an embodiment of the present invention.

도 2를 참조하여 본 실시예에 따른 소셜 리뷰 분석 방법을 상세히 설명하면, 먼저, 소셜 리뷰 수집 유닛(10)은 사용자로부터 플레이스에 대한 검색 키워드를 입력 받는다(S10). 도 3은 검색 키워드 및 카테고리 정보를 입력받기 위한 입력 페이지의 일 예를 예시하고 있다. 이에 따르면, 검색 키워드(상호명, 주소 등)는 타이핑을 통해 입력받고, 카테고리 정보(음식점, 카페, 숙박업소, 관광 명소 등)는 기설정된 메뉴 중 하나를 선택하는 방식을 통해 해당 정보를 입력 받는 것이 예시되어 있다.Referring to FIG. 2, the social review analysis method according to this embodiment will be described in detail. First, the social review collection unit 10 receives a search keyword for a place from a user (S10). 3 illustrates an example of an input page for receiving search keywords and category information. According to this, the search keyword (mutual name, address, etc.) is input through typing, and the category information (restaurant, cafe, lodging facility, tourist attraction, etc.) is inputted by selecting one of the preset menus. Is illustrated.

다음으로, 소셜 리뷰 수집 유닛(10)은 사용자로부터 입력받는 검색 키워드에 대한 소셜 리뷰를 소셜 사이트(100)로부터 수집한다(S20).Next, the social review collection unit 10 collects social reviews of the search keywords received from the user from the social site 100 (S20).

다음으로, 형태소 분석기(22)는 카테고리 별로 서로 상이한 단어가 포함되도록 카테고리 별로 각각 마련된 응용영역별 단어사전(21) 중 사용자로부터 입력받은 카테고리 정보에 대응되는 응용영역별 단어사전(21)을 이용하여 소셜 리뷰에 대한 형태소 분석을 수행한다(S30).Next, the morpheme analyzer 22 uses the word dictionary 21 for each application area corresponding to the category information input from the user among the word dictionary 21 for each application area provided for each category so that different words are included for each category. Morphological analysis for the social review is performed (S30).

다음으로, 노이즈 필터 유닛(40)은 수집된 모든 소셜 리뷰를 연관성이 있는 것으로 간주한 후, 연관성이 낮은 노이즈 패턴이 포함된 리뷰를 제외시켜 분석 정보 출력을 위한 유효 데이터를 추출한다(S40, 긍정적 노이즈 필터링). 노이즈 필터 유닛(40)은, 앞에서 설명한 바와 같이, 카테고리별로 상이한 노이즈 패턴이 포함된 응용영역별 패턴사전(41)을 검색하여 노이즈를 필터링한다.Next, the noise filter unit 40 considers all the collected social reviews as relevant, and then extracts valid data for outputting analysis information by excluding reviews that include noise patterns with low association (S40, positive) Noise filtering). As described above, the noise filter unit 40 filters noise by searching the pattern dictionary 41 for each application area including different noise patterns for each category.

도 4는 본 발명과 관련된 소셜 리뷰에 대한 노이즈 필터링 후 유효 데이터(연관 리뷰)를 출력한 일 예를 예시하여 보이고 있으며, 이에 따르면 연관 리뷰에 대한 요약 정보 및 원문보기 링크가 출력된 것이 예시되어 있다. 본 발명에 따르면, 노이즈 필터링 단계에서 연관 리뷰로 채택되는 비율을 기존 5 내지 10%에서 30% 이상으로 증가시킬 수 있다.4 illustrates an example of outputting valid data (associated review) after noise filtering for a social review related to the present invention, according to which the summary information and the original text link for the related review are output. . According to the present invention, it is possible to increase the ratio adopted as a related review in the noise filtering step from 5 to 10% to 30% or more.

다음으로, 분석 유닛(30)은 이상에서 도출된 정보를 이용하여 소셜 리뷰에 대한 분석 정보를 추출 및 출력한다(S50). 소셜 리뷰에 대한 분석 정보는 연관 키워드, 연관 이미지, 인기 지수, 및 인지도 정보 등을 포함할 수 있다.Next, the analysis unit 30 extracts and outputs analysis information for the social review using the information derived from the above (S50). The analysis information for the social review may include related keywords, related images, popularity index, and recognition information.

도 5는 본 발명과 관련된 소셜 리뷰에 대한 분석 정보를 출력한 출력 페이지의 일 예를 예시하고 있으며, 이에 따르면 분석 정보로서 검색 플레이스에 대한 연관 키워드, 인기 지수의 증감/추이 그래프가 출력된 것이 예시되어 있다.FIG. 5 illustrates an example of an output page outputting analysis information for a social review related to the present invention, and accordingly, as an analysis information, an example of outputting an increase / decrease / trend graph of a related keyword or a popularity index for a search place is output. It is done.

다음으로, 필요에 따라, 소셜 리뷰에 대한 분석 정보를 다른 언어로 번역하는 단계를 추가로 수행할 수 있다(S51). 분석 정보에 대한 번역은, 앞선 설명과 같이, 별도로 마련된 고유명사 사전(51)을 검색하여 고유명사에 대한 번역을 수행한 후, 온라인 번역기(200)를 이용하여 고유명사를 제외한 잔여 부분에 대한 번역을 수행하는 방식을 통해 수행 가능하다.Next, if necessary, the step of translating the analysis information for the social review in another language may be additionally performed (S51). As for the translation of the analysis information, as described above, a separate proper noun dictionary 51 is searched for and the translation of the proper noun is performed, and then the online translator 200 is used to translate the remaining parts except the proper noun. It can be done through the method of performing.

한편, 이상에서 설명한 플레이스의 소셜 리뷰 분석 방법에서, 유효 데이터 추출 단계(S40) 및 분석 정보 번역 단계(S60) 중 적어도 하나는 필요에 따라 생략될 수 있다 할 것이다.On the other hand, in the social review analysis method of the place described above, at least one of the valid data extraction step (S40) and the analysis information translation step (S60) may be omitted if necessary.

이상에서 설명한 플레이스의 소셜 리뷰 분석 방법 및 시스템은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수도 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magneticmedia), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.The method and system for analyzing social reviews of the place described above may be implemented in the form of program instructions that can be executed through various computer means and may be recorded in a computer-readable medium. The computer-readable medium may include program instructions, data files, data structures, or the like alone or in combination. The program instructions recorded on the medium may be specially designed and configured for the embodiments or may be known and usable by those skilled in computer software. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks, and magnetic tapes, optical media such as CD-ROMs, DVDs, and magnetic media such as floptical disks. Hardware devices specially configured to store and execute program instructions, such as magneto-optical media, and ROM, RAM, flash memory, and the like, are included. Examples of program instructions include high-level language code that can be executed by a computer using an interpreter, etc., as well as machine language codes produced by a compiler. The hardware device described above may be configured to operate as one or more software modules to perform the operations of the embodiments, and vice versa.

상기에서는 본 발명의 특정의 실시예를 참조하여 설명하였지만, 해당 기술 분야에서 통상의 지식을 가진 자라면 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.Although described above with reference to specific embodiments of the present invention, those skilled in the art may vary the present invention without departing from the spirit and scope of the present invention as set forth in the claims below. You can understand that it can be modified and changed.

10: 소셜 리뷰 수집 유닛 20: 형태소 분석 유닛
21: 응용영역별 단어사전 22: 형태소 분석기
23: 단어사전 학습기 30: 분석 유닛
40: 노이즈 필터 유닛 41: 응용영역별 패턴사전
50: 번역 유닛 51: 고유명사 사전
52: 번역기
10: social review collection unit 20: morpheme analysis unit
21: Word dictionary by application area 22: Morphological analyzer
23: word dictionary learning unit 30: analysis unit
40: noise filter unit 41: pattern dictionary for each application area
50: translation unit 51: proper noun dictionary
52: translator

Claims (13)

소셜 리뷰 수집 유닛을 통해, 사용자로부터 플레이스에 관한 검색 키워드 및 카테고리 정보를 입력 받는 단계;
상기 소셜 리뷰 수집 유닛을 통해, 상기 검색 키워드에 대한 소셜 리뷰를 수집하는 단계;
형태소 분석 유닛을 통해, 상기 소셜 리뷰에 대한 형태소 분석을 수행하는 단계;
노이즈 필터 유닛을 통해, 수집된 모든 소셜 리뷰를 연관성이 있는 것으로 간주한 후, 연관성이 낮은 노이즈 패턴이 포함된 리뷰를 제외시켜 분석 정보 출력을 위한 유효 데이터를 추출하는 단계; 및
분석 유닛을 통해, 상기 형태소 분석에 의해 도출된 정보와, 추출된 상기 유효 데이터를 이용하여 상기 소셜 리뷰에 대한 분석 정보를 추출 및 출력하는 단계를 포함하고,
상기 카테고리 별로 서로 상이한 단어가 포함되는 응용영역별 단어사전과, 상기 카테고리별로 상이한 노이즈 패턴이 포함된 응용영역별 패턴사전이 상기 카테고리 별로 각각 마련되고,
상기 형태소 분석 유닛은 상기 응용영역별 단어사전 중 사용자로부터 입력받은 카테고리 정보에 대응되는 응용영역별 단어사전을 이용하여 형태소 분석을 수행하며,
상기 노이즈 필터 유닛은 상기 응용영역별 패턴사전 중 사용자로부터 입력받은 카테고리 정보에 대응되는 응용영역별 패턴사전을 검색하여 유효 데이터를 추출하는 것을 특징으로 하는 플레이스의 소셜 리뷰 분석 방법.
Receiving a search keyword and category information regarding a place from a user through a social review collection unit;
Collecting a social review of the search keyword through the social review collection unit;
Performing a morpheme analysis on the social review through a morpheme analysis unit;
Through the noise filter unit, after all collected social reviews are regarded as relevant, extracting valid data for outputting analysis information by excluding reviews that include a low noise pattern; And
And extracting and outputting analysis information for the social review using the information derived by the morpheme analysis and the extracted valid data through an analysis unit,
A word dictionary for each application area containing different words for each category and a pattern dictionary for each application area containing different noise patterns for each category are provided for each category,
The morpheme analysis unit performs morpheme analysis using a word dictionary for each application area corresponding to category information input from a user among the word dictionary for each application area,
The noise filter unit searches for a pattern dictionary for each application area corresponding to category information received from a user among the pattern dictionary for each application area, and extracts valid data.
제1항에 있어서,
상기 카테고리 정보는 음식점, 카페, 숙박업소, 관광 명소 중 하나 이상을 포함하는 것을 특징으로 하는 플레이스의 소셜 리뷰 분석 방법.
According to claim 1,
The category information includes one or more of a restaurant, a cafe, a lodging facility, and a tourist attraction.
제1항에 있어서,
상기 소셜 리뷰에 대한 분석 정보는 연관 키워드, 연관 이미지, 인기 지수, 및 인지도 정보 중 하나 이상을 포함하는 것을 특징으로 하는 플레이스의 소셜 리뷰 분석 방법.
According to claim 1,
The analysis information for the social review includes one or more of related keywords, associated images, popularity index, and recognition information.
삭제delete 삭제delete 제1항에 있어서,
번역 유닛을 통해, 상기 소셜 리뷰에 대한 분석 정보를 다른 언어로 번역하는 단계를 더 포함하고,
상기 번역 단계는,
번역기를 통해 고유명사에 대한 번역 정보가 포함되도록 별도로 마련된 고유명사 사전을 검색하여 고유명사에 대한 번역을 수행하는 단계;
온라인 번역기를 통해 고유명사를 제외한 잔여 부분에 대한 번역을 수행하는 단계를 포함하는 것을 특징으로 하는 플레이스의 소셜 리뷰 분석 방법.
According to claim 1,
Through the translation unit, further comprising the step of translating the analysis information for the social review in another language,
The translation step,
Performing a translation for the proper noun by searching for a dictionary of proper nouns provided to include translation information about the proper noun through a translator;
And translating the remaining portion of the place except the proper noun through an online translator.
사용자로부터 플레이스에 관한 검색 키워드 및 카테고리 정보를 입력 받고, 상기 검색 키워드에 대한 소셜 리뷰를 수집하는 소셜 리뷰 수집 유닛;
상기 소셜 리뷰에 대한 형태소 분석을 수행하는 형태소 분석 유닛;
수집된 모든 소셜 리뷰를 연관성이 있는 것으로 간주한 후, 연관성이 낮은 노이즈 패턴이 포함된 리뷰를 제외시켜 분석 정보의 출력을 위한 유효 데이터를 추출하는 노이즈 필터 유닛; 및
상기 형태소 분석에 의해 도출된 정보와, 추출된 상기 유효 데이터를 이용하여 상기 소셜 리뷰에 대한 분석 정보를 추출 및 출력하는 분석 유닛을 포함하고,
상기 형태소 분석 유닛은,
상기 카테고리 별로 각각 마련되며, 상기 카테고리 별로 서로 상이한 단어가 포함되는 복수의 응용영역별 단어사전; 및
상기 복수의 응용영역별 단어사전 중 사용자로부터 입력받은 카테고리 정보에 대응되는 응용영역별 단어사전을 이용하여 상기 소셜 리뷰에 대한 형태소 분석을 수행하는 형태소 분석기를 포함하며,
상기 노이즈 필터 유닛은 상기 카테고리별로 상이한 노이즈 패턴이 포함된 응용영역별 패턴사전 중 사용자로부터 입력받은 카테고리 정보에 대응되는 응용영역별 패턴사전을 검색하여 필터링을 수행하는 것을 특징으로 하는 플레이스의 소셜 리뷰 분석 시스템.
A social review collection unit that receives search keyword and category information regarding a place from a user and collects social reviews for the search keyword;
A morpheme analysis unit that performs a morpheme analysis for the social review;
A noise filter unit that extracts valid data for outputting analysis information by excluding reviews that include a noise pattern having a low association after considering all collected social reviews as relevant; And
And an analysis unit for extracting and outputting analysis information for the social review using the information derived by the morpheme analysis and the extracted valid data,
The morpheme analysis unit,
A dictionary of words for each application area provided for each category and including different words for each category; And
And a morpheme analyzer for performing a morpheme analysis on the social review by using a word dictionary for each application region corresponding to category information input from a user among the word dictionary for each of the plurality of application regions,
The noise filter unit searches for a pattern dictionary for each application area corresponding to category information input from a user among pattern dictionary for each application area including different noise patterns for each category, and performs filtering on the place's social review. system.
제7항에 있어서, 상기 형태소 분석 유닛은,
시험 데이터에 대한 기계 학습을 통해 상기 응용영역별 단어사전에 포함되는 단어는 도출하는 단어사전 학습기를 더 포함하는 것을 특징으로 하는 플레이스의 소셜 리뷰 분석 시스템.
The method of claim 7, wherein the morpheme analysis unit,
The social review analysis system of the place further comprising a word dictionary learner to derive words included in the word dictionary for each application area through machine learning on test data.
삭제delete 삭제delete 제7항에 있어서,
상기 응용영역별 단어사전 및 패턴사전은 상기 카테고리별로 모듈화되게 구성되는 것을 특징으로 하는 플레이스의 소셜 리뷰 분석 시스템.
The method of claim 7,
The word dictionary and pattern dictionary for each application area are configured to be modularized for each category.
제7항에 있어서,
상기 소셜 리뷰에 대한 분석 정보를 다른 언어로 번역하는 번역 유닛을 더 포함하고,
상기 번역 유닛은,
고유명사에 대한 번역 정보가 포함되는 고유명사 사전; 및
상기 분석 정보 중 고유명사 부분은 상기 고유명사 사전을 이용하여 번역을 수행하고, 고유명사를 제외한 잔여 부분에 대해서는 온라인 번역기를 통해 번역이 수행되도록 하는 번역기를 포함하는 것을 특징으로 하는 플레이스의 소셜 리뷰 분석 시스템.
The method of claim 7,
Further comprising a translation unit for translating the analysis information for the social review in another language,
The translation unit,
A proper noun dictionary containing translation information about the proper noun; And
The social noun analysis of the place, wherein the proper noun part of the analysis information includes a translator that performs translation by using the proper noun dictionary, and the translation is performed through an online translator for the remaining parts except the proper noun. system.
제12항에 있어서,
상기 고유명사 사전은 복수의 언어 별로 각각 구비되는 것을 특징으로 하는 플레이스의 소셜 리뷰 분석 시스템.
The method of claim 12,
The proper noun dictionary is a social review analysis system of a place, characterized in that provided for each of a plurality of languages.
KR1020180073133A 2018-06-26 2018-06-26 Method and system for analyzing social review of place KR102083017B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180073133A KR102083017B1 (en) 2018-06-26 2018-06-26 Method and system for analyzing social review of place

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180073133A KR102083017B1 (en) 2018-06-26 2018-06-26 Method and system for analyzing social review of place

Publications (2)

Publication Number Publication Date
KR20200000897A KR20200000897A (en) 2020-01-06
KR102083017B1 true KR102083017B1 (en) 2020-04-23

Family

ID=69158793

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180073133A KR102083017B1 (en) 2018-06-26 2018-06-26 Method and system for analyzing social review of place

Country Status (1)

Country Link
KR (1) KR102083017B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220056552A (en) 2020-10-28 2022-05-06 (주)아모레퍼시픽 Sentence analysis method and system

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102472868B1 (en) * 2022-08-10 2022-12-01 주식회사 플리더스 Game information management server that can determine the genre and subject matter of a game based on review data collected from game testers and the operating method thereof
KR102614638B1 (en) * 2022-09-07 2023-12-15 (주)휴먼아이티솔루션 Method, apparatus and computer-readable medium of providing nearby tourist attraction information using gps data in photo review post

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090079575A (en) * 2008-01-18 2009-07-22 (주)시터스 System and device of navigation service and method of servicing the same
KR101005337B1 (en) * 2008-09-29 2011-01-04 주식회사 버즈니 System for extraction and analysis of opinion in web documents and method thereof
KR101134701B1 (en) * 2010-08-09 2012-04-13 숭실대학교산학협력단 The Method and System for Automatically Constructing Positive/Negative Feature-Predicate Dictionary for Polarity Classification of Product Reviews
KR101715737B1 (en) 2014-10-02 2017-03-14 키위플 주식회사 Method of analyzing a stream of a business area and system for performing the same
KR20170021454A (en) * 2015-08-18 2017-02-28 주식회사 엠젠플러스 Individual products through big data analysis using information collected on the basis of the user's media recommended methods and product recommendation system
KR20160130369A (en) * 2016-11-02 2016-11-11 에스케이플래닛 주식회사 In online web text based commercial analysis service system and method thereof

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220056552A (en) 2020-10-28 2022-05-06 (주)아모레퍼시픽 Sentence analysis method and system

Also Published As

Publication number Publication date
KR20200000897A (en) 2020-01-06

Similar Documents

Publication Publication Date Title
Malmasi et al. MultiCoNER: A large-scale multilingual dataset for complex named entity recognition
Gupta et al. A survey of text question answering techniques
KR101864361B1 (en) Method and system for providing translated result
Hogenboom et al. Multi-lingual support for lexicon-based sentiment analysis guided by semantics
US7949514B2 (en) Method for building parallel corpora
US20130060769A1 (en) System and method for identifying social media interactions
Maier et al. Machine translation vs. multilingual dictionaries assessing two strategies for the topic modeling of multilingual text collections
US20110040769A1 (en) Query-URL N-Gram Features in Web Ranking
WO2005059771A1 (en) Translation judgment device, method, and program
KR102083017B1 (en) Method and system for analyzing social review of place
JP2009157791A (en) Question answering method, device, program, and recording medium which records the program
KR101638535B1 (en) Method of detecting issue patten associated with user search word, server performing the same and storage medium storing the same
Vanetik et al. An unsupervised constrained optimization approach to compressive summarization
Onal et al. Named entity recognition from scratch on social media
Zeng et al. Text mining of tourism preference in a multilingual site
CN101520778A (en) Apparatus and method for determing parts-of-speech in chinese
KR101478016B1 (en) Apparatus and method for information retrieval based on sentence cluster using term co-occurrence
KR101916781B1 (en) Method and system for providing translated result
Dias Cardoso et al. Language identification for social media: short messages and transliteration
Paramita et al. Methods for collection and evaluation of comparable documents
Mara English-Wolaytta Machine Translation using Statistical Approach
JP4401269B2 (en) Parallel translation judgment device and program
Hajbi et al. Natural Language Processing Based Approach to Overcome Arabizi and Code Switching in Social Media Moroccan Dialect
CN114970543A (en) Semantic analysis method for crowdsourced design resources
Rofiq Indonesian news extractive text summarization using latent semantic analysis

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant