KR20230148995A - Methods and System for Providing Personalized Reviews - Google Patents

Methods and System for Providing Personalized Reviews Download PDF

Info

Publication number
KR20230148995A
KR20230148995A KR1020220048092A KR20220048092A KR20230148995A KR 20230148995 A KR20230148995 A KR 20230148995A KR 1020220048092 A KR1020220048092 A KR 1020220048092A KR 20220048092 A KR20220048092 A KR 20220048092A KR 20230148995 A KR20230148995 A KR 20230148995A
Authority
KR
South Korea
Prior art keywords
user
review
reviews
personalized
data distribution
Prior art date
Application number
KR1020220048092A
Other languages
Korean (ko)
Inventor
이보원
윤수연
Original Assignee
인하대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 인하대학교 산학협력단 filed Critical 인하대학교 산학협력단
Priority to KR1020220048092A priority Critical patent/KR20230148995A/en
Publication of KR20230148995A publication Critical patent/KR20230148995A/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0282Rating or review of business operators or products
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Abstract

개인화된 리뷰를 제공하는 방법 및 시스템이 제시된다. 본 발명에서 제안하는 개인화된 리뷰를 제공하는 방법은 정보 추출부를 통해 사용자가 평가하는 하나 이상의 평가 대상에 대해 복수의 평가 정보를 반영한 리뷰를 수집하고, 사용자별 개인화된 리뷰로 재가공하기 위해 수집된 리뷰의 에 대해 웹크롤링(Web Crawling) 또는 웹스크래핑(Web Scraping)을 이용하여 리뷰 관련 정보를 추출하는 단계, 학습부를 통해 기계학습(Machine Learning; ML) 또는 자연어 처리(Natural Language Processing; NLP)를 이용하여 추출된 리뷰 관련 정보를 수치화하는 단계 및 사용자별 개인화된 리뷰 제공부를 통해 상기 수치화된 리뷰 관련 정보를 사용자별 가중치 파라미터와 데이터 분포로서 나타내고, 사용자별 가중치 파라미터 및 데이터 분포를 이용하여 사용자별 개인화된 리뷰를 제공하는 단계를 포함한다.A method and system for providing personalized reviews are presented. The method of providing personalized reviews proposed in the present invention collects reviews reflecting a plurality of evaluation information for one or more evaluation objects evaluated by users through an information extraction unit, and reprocesses the collected reviews into personalized reviews for each user. The step of extracting review-related information using web crawling or web scraping, and using machine learning (ML) or natural language processing (NLP) through the learning department. Through the step of quantifying the extracted review-related information and the personalized review provision unit for each user, the quantified review-related information is expressed as weight parameters and data distribution for each user, and personalized information for each user is provided using the weight parameters and data distribution for each user. Includes providing a review.

Description

개인화된 리뷰를 제공하는 방법 및 시스템{Methods and System for Providing Personalized Reviews}Methods and System for Providing Personalized Reviews}

본 발명은 개인화된 리뷰를 제공하는 방법 및 시스템에 관한 것이다.The present invention relates to a method and system for providing personalized reviews.

인터넷 및 스마트폰 앱 등 다수의 사람이 대상을 평가할 수 있는 플랫폼에서 제공되는 리뷰에 있어서, 동일한 대상이라고 하더라도 개인에 따라서 평가가 달라질 수 있다. 하지만 개인이 경험해보지 못한 영역에 대해 직접 시도하기 전까지는 타인의 리뷰에 의존할 수밖에 없는데, 이는 개인에 따라서 정확한 정보가 될 수도 있고 부정확한 정보가 될 수도 있다. In reviews provided on platforms where multiple people can evaluate an object, such as the Internet and smartphone apps, evaluations of the same object may vary depending on the individual. However, until an individual tries an area they have no experience in, they have no choice but to rely on other people's reviews, which may be accurate or inaccurate information depending on the individual.

예를 들어, 음식을 선택할 때는 이미 그 음식을 시도해 본 사람들의 평가에 의존할 수밖에 없다. 따라서 다수 평가자의 평가들을 종합적으로 열람이 가능한 리뷰 앱들이 다양하게 시장에 등장했다. 하지만 그 평가는 사용자마다 척도가 달라 상대적이다. 즉, 리뷰가 주관적인 평가이기 때문에 경우에 따라서 특정 사용자에게는 적용되지 않을 수 있다는 치명적인 단점이 존재한다. 개별 사용자가 부여하는 평점은 사용자에 따라 편향성이나 패턴이 있을 수 밖에 없고, 따라서 보다 정확한 정보를 제공하기 위해서는 이를 고려하는 것이 바람직하다. For example, when choosing a food, you have no choice but to rely on the reviews of people who have already tried the food. Accordingly, a variety of review apps that allow users to comprehensively view reviews from multiple evaluators have appeared on the market. However, the evaluation is relative as the scale varies from user to user. In other words, because reviews are subjective evaluations, there is a fatal drawback in that they may not apply to specific users in some cases. Ratings given by individual users inevitably have biases or patterns depending on the user, so it is desirable to take this into consideration in order to provide more accurate information.

이와 관련하여, 종래기술 한국등록특허 제10-2227552호는 상황인지 알고리즘 기반 리뷰 카테고리를 이용한 음식점 노출 개인화 서비스 제공 시스템에 대해 개시하고 있다. 이를 위하여 해당 아이디어는 웹트래픽 및 키스트로크 로깅(Keystroke logging)을 포함하는 개인화 데이터를 실시간으로 업로드하고 개인화 데이터에 의해 정렬순서가 변경된 메인 페이지를 노출하며 개인화 서비스 제공 서버를 포함한다. In this regard, prior art Korean Patent No. 10-2227552 discloses a system for providing a restaurant exposure personalization service using a review category based on a context-aware algorithm. To this end, the idea uploads personalization data including web traffic and keystroke logging in real time, exposes the main page with the sort order changed by the personalization data, and includes a server that provides personalization services.

또 다른 종래기술 한국등록특허 제10-2017-0016913호는 콘텐츠의 우선순위를 개인화하는 시스템, 방법 및 프로그램에 대해 개시하고 있다. 이를 위하여 대표액션이 전체 사용자의 액션 대비 어느 정도 수준인지를 평가하여 속성별로 대표액션 스코어를 계산하는 가중치인 속성 가중치를 생성하는 속성 가중치 모듈이나 속성 가중치와 온라인 콘텐츠의 속성정보를 이용하여 온라인 콘텐츠의 우선순위를 계산하는 우선순위 모듈 등 여러가지 모듈을 제시한다. Another prior art Korean Patent No. 10-2017-0016913 discloses a system, method, and program for personalizing the priority of content. For this purpose, the attribute weight module generates an attribute weight, which is a weight that calculates the representative action score for each attribute by evaluating the level of representative action compared to the actions of all users, or uses the attribute weight and attribute information of online content to determine the level of online content. It presents several modules, including a priority module that calculates priorities.

또 다른 종래기술 한국등록특허 제10-1532715호는 문서와 서치 질의에 대해 관련성 점수를 계산하고, 그 서치 질의에 응답하여 결과 리스트에 반환된 문서를 등급화하여 변수와 파라미터를 갖는 공식으로 공식화하며, 최종적으로 서치 엔진에 의해 반환되는 결과를 등급화하기 위한 방법과 시스템에 대해 개시하고 있다. 그 과정에서 통계 분류의 형태를 포함하는 기술과 같은 머신 학습 기술을 사용해서 상기 파라미터를 결정한다. Another prior art, Korean Patent No. 10-1532715, calculates relevance scores for documents and search queries, ranks the documents returned in the result list in response to the search queries, and formulates them into a formula with variables and parameters. , discloses a method and system for grading the results ultimately returned by the search engine. In the process, machine learning techniques, such as techniques involving forms of statistical classification, are used to determine said parameters.

다만, 상술된 종래기술의 구성을 이용한다고 할지라도 그 목적이 다르고, 문서를 등급화할 뿐 개인에 적합하도록 재구성의 단계를 포함하지 않기 때문에 리뷰 개인화라고 할 수 없다. 따라서, 개인별 취향 및 상황을 고려하여 리뷰를 개인화하는 방법의 연구 및 개발이 요구된다. However, even if the configuration of the prior art described above is used, the purpose is different and it cannot be said to be personalization of reviews because it only grades documents and does not include a stage of reconstruction to suit the individual. Therefore, research and development of methods to personalize reviews by considering individual tastes and situations are required.

한국등록특허 제10-2227552호(2021.03.08)Korean Patent No. 10-2227552 (2021.03.08) 한국등록특허 제10-1871827호(2018.06.21)Korean Patent No. 10-1871827 (2018.06.21) 한국등록특허 제10-1532715호(2015.06.24)Korean Patent No. 10-1532715 (2015.06.24)

본 발명이 이루고자 하는 기술적 과제는 리뷰를 제공받는 개개인에게 최적화된 리뷰 정보를 제공하는 서비스인 리뷰 개인화를 통하여 인터넷 및 스마트폰 앱 등의 플랫폼에서 보다 정확한 정보를 제공하기 위한 방법 및 시스템을 제공하는데 있다. 본 발명에 따른 개인화된 리뷰로 재가공하기 위해 주어진 리뷰 정보를 웹크롤링(Web Crawling)이나 웹스크래핑(Web Scraping) 및 구조화 단계를 통해 정보를 추출한 다음, 기계학습(Machine Learning; ML) 혹은 자연어 처리(Natural Language Processing; NLP)를 사용해서 수치화하고자 한다. 이후 수치화된 리뷰를 분포로 나타내고 최종적으로 개인에게 맞춤화된 결과를 반환하며, 개인화된 리뷰에 사용자의 만족도를 증가시키기 위해 사용자의 리뷰로부터 파라미터를 지속적으로 갱신한다. The technical task to be achieved by the present invention is to provide a method and system for providing more accurate information on platforms such as the Internet and smartphone apps through review personalization, a service that provides optimized review information to individuals who receive reviews. . In order to reprocess the given review information into a personalized review according to the present invention, information is extracted from the given review information through web crawling, web scraping, and structuring steps, and then machine learning (ML) or natural language processing ( We want to quantify it using Natural Language Processing (NLP). Afterwards, the quantified reviews are expressed as a distribution, and finally, a result customized to the individual is returned. Parameters are continuously updated from the user's review to increase the user's satisfaction with the personalized review.

일 측면에 있어서, 본 발명에서 제안하는 개인화된 리뷰를 제공하는 방법은 정보 추출부를 통해 사용자가 평가하는 하나 이상의 평가 대상에 대해 복수의 평가 정보를 반영한 리뷰를 수집하고, 사용자별 개인화된 리뷰로 재가공하기 위해 수집된 리뷰의 에 대해 웹크롤링(Web Crawling) 또는 웹스크래핑(Web Scraping)을 이용하여 리뷰 관련 정보를 추출하는 단계, 학습부를 통해 기계학습(Machine Learning; ML) 또는 자연어 처리(Natural Language Processing; NLP)를 이용하여 추출된 리뷰 관련 정보를 수치화하는 단계 및 사용자별 개인화된 리뷰 제공부를 통해 상기 수치화된 리뷰 관련 정보를 사용자별 가중치 파라미터와 데이터 분포로서 나타내고, 사용자별 가중치 파라미터 및 데이터 분포를 이용하여 사용자별 개인화된 리뷰를 제공하는 단계를 포함한다. In one aspect, the method of providing personalized reviews proposed in the present invention collects reviews reflecting a plurality of evaluation information for one or more evaluation objects evaluated by a user through an information extraction unit, and reprocesses them into personalized reviews for each user. A step of extracting review-related information using web crawling or web scraping for the collected reviews, and machine learning (ML) or natural language processing through the learning department. ; NLP) is used to quantify the extracted review-related information, and through a personalized review provision unit for each user, the quantified review-related information is expressed as weight parameters and data distribution for each user, and the weight parameters and data distribution for each user are used. This includes providing personalized reviews for each user.

본 발명의 실시예에 따른 사용자별 개인화된 리뷰 제공부를 통해 사용자별 개인화된 리뷰에 대한 사용자의 만족도를 증가시키기 위해 사용자별 가중치 파라미터 및 데이터 분포를 반복적으로 갱신한다. In order to increase the user's satisfaction with the personalized review for each user, the weight parameters and data distribution for each user are repeatedly updated through the personalized review providing unit for each user according to an embodiment of the present invention.

상기 학습부를 통해 기계학습 또는 자연어 처리를 이용하여 추출된 리뷰 관련 정보를 수치화하는 단계는 사용자별 개인화된 리뷰로 재가공하기 위해 수집된 리뷰의 개인 사용자 평가 외에 또 다른 복수의 사용자들의 평가를 포함하는 리뷰들에 대하여 수치화된 리뷰 관련 정보를 다차원 특징공간 내 점들로 나타내고, 상기 다차원 특징공간 내 점들에 대하여 클러스터링(Clustering) 또는 기계학습을 수행한다. In the step of quantifying the review-related information extracted using machine learning or natural language processing through the learning unit, the review includes the evaluation of a plurality of users in addition to the individual user evaluation of the collected review to reprocess it into a personalized review for each user. Numerical review-related information is expressed as points in a multidimensional feature space, and clustering or machine learning is performed on the points in the multidimensional feature space.

상기 사용자별 개인화된 리뷰 제공부를 통해 상기 수치화된 리뷰 관련 정보를 사용자별 가중치 파라미터와 데이터 분포로서 나타내고, 사용자별 가중치 파라미터 및 데이터 분포를 이용하여 사용자별 개인화된 리뷰를 제공하는 단계는 상기 데이터 분포를 파악하기 위해 다차원 가우시안 분포로 나타내고, 상기 사용자별 가중치 파라미터는 평가 대상에 대한 개인 사용자 외에 또 다른 복수의 사용자들의 수치에 따른 개인 사용자만의 경향성을 반영하고, 모든 리뷰를 반영한 데이터 분포와 비교하여 개인 사용자의 리뷰의 상대적인 위치를 나타내는 수치이고, 상기 개인 사용자 및 상기 복수의 사용자들을 미리 정해진 특정 부류로 군집화하여 군집별 경향성을 나타낸다. The step of displaying the quantified review-related information as a weight parameter and a data distribution for each user through the personalized review providing unit for each user, and providing a personalized review for each user using the weight parameter and data distribution for each user, determines the data distribution. In order to understand this, it is expressed as a multidimensional Gaussian distribution, and the weight parameter for each user reflects the individual user's tendency according to the values of a plurality of users other than the individual user for the evaluation target, and compares the individual user's tendency with the data distribution reflecting all reviews. It is a numerical value representing the relative position of a user's review, and clusters the individual user and the plurality of users into a predetermined specific category to indicate the tendency for each cluster.

또 다른 일 측면에 있어서, 본 발명에서 제안하는 개인화된 리뷰를 제공하는 시스템은 사용자가 평가하는 하나 이상의 평가 대상에 대해 복수의 평가 정보를 반영한 리뷰를 수집하고, 사용자별 개인화된 리뷰로 재가공하기 위해 수집된 리뷰의 에 대해 웹크롤링(Web Crawling) 또는 웹스크래핑(Web Scraping)을 이용하여 리뷰 관련 정보를 추출하는 정보 추출부, 기계학습(Machine Learning; ML) 또는 자연어 처리(Natural Language Processing; NLP)를 이용하여 추출된 리뷰 관련 정보를 수치화하는 학습부 및 수치화된 리뷰 관련 정보를 사용자별 가중치 파라미터와 데이터 분포로서 나타내고, 사용자별 가중치 파라미터 및 데이터 분포를 이용하여 사용자별 개인화된 리뷰를 제공하는 사용자별 개인화된 리뷰 제공부를 포함한다.In another aspect, the system for providing personalized reviews proposed in the present invention collects reviews reflecting a plurality of evaluation information for one or more evaluation objects evaluated by users, and reprocesses them into personalized reviews for each user. Information extraction unit that extracts review-related information from collected reviews using web crawling or web scraping, machine learning (ML), or natural language processing (NLP) A learning unit that quantifies the extracted review-related information using and represents the quantified review-related information as weight parameters and data distribution for each user, and provides personalized reviews for each user using the weight parameters and data distribution for each user. Includes a personalized review section.

본 발명의 실시예들에 따르면 리뷰를 제공받는 개개인에게 최적화된 리뷰 정보를 제공하는 서비스인 리뷰 개인화를 통하여 인터넷 및 스마트폰 앱 등의 플랫폼에서 보다 정확한 정보를 제공할 수 있다. 사용자에게 적절한 리뷰 정보를 이용하여 보다 신뢰도가 높은 개인화된 리뷰를 제공할 수 있고, 나아가 수집된 다양한 리뷰의 수치화된 변인들을 사용하여 다른 사용자와 함께 최적화된 추천 서비스를 제공할 수 있다. According to embodiments of the present invention, more accurate information can be provided on platforms such as the Internet and smartphone apps through review personalization, which is a service that provides optimized review information to individuals who receive reviews. It is possible to provide users with personalized reviews with higher reliability by using appropriate review information, and furthermore, by using the quantified variables of various collected reviews, an optimized recommendation service can be provided together with other users.

도 1은 본 발명의 일 실시예에 따른 사용자별 개인화된 리뷰를 제공하는 방법을 설명하기 위한 흐름도이다.
도 2는 본 발명의 일 실시예에 따른 사용자별 개인화된 리뷰를 제공하는 시스템의 구성을 나타내는 도면이다.
도 3은 본 발명의 일 실시예에 따른 사용자별 가중치 파라미터의 예시를 나타내는 도면이다.
도 4는 본 발명의 일 실시예에 따른 사용자별 개인화된 리뷰를 제공하는 다양한 예시를 설명하기 위한 도면이다.
1 is a flowchart illustrating a method of providing personalized reviews for each user according to an embodiment of the present invention.
Figure 2 is a diagram showing the configuration of a system that provides personalized reviews for each user according to an embodiment of the present invention.
Figure 3 is a diagram showing an example of weight parameters for each user according to an embodiment of the present invention.
Figure 4 is a diagram for explaining various examples of providing personalized reviews for each user according to an embodiment of the present invention.

본 발명은 인터넷 및 스마트폰 앱 등에서 제공되는 리뷰를 개인화하기 위한 방법 및 시스템에 대한 것이다. 본 발명에 따른 방법은 개인별 특성을 고려하여 사용자 전체에 공통으로 제공되는 리뷰를 개인화된 리뷰로 표시하는 것을 목적으로, 주어진 텍스트 정보를 이용하여 웹크롤링(Web Crawling)이나 웹스크래핑(Web Scraping) 및 구조화 단계를 거쳐 정보를 추출하는 단계, 그리고 추출된 정보를 기반으로 개인화된 리뷰를 생성하는 단계를 포함한다. 예를 들어, 상기 정보는 통계 분류의 형태를 포함하는 기술과 같은, 기계학습(Machine Learning; ML) 또는 자연어 처리(Natural Language Processing; NLP)를 사용하여 결정할 수 있다. 보다 유의미한 정보를 전달하는 것을 목표로 사용자에게 보다 최적화된 정보를 제공하고, 특히 재가공된 리뷰에 대한 만족도를 향상시키기 위해 관련 파라미터를 지속적으로 갱신한다. 이하, 본 발명의 실시 예를 첨부된 도면을 참조하여 상세하게 설명한다. The present invention relates to a method and system for personalizing reviews provided on the Internet and smartphone apps. The method according to the present invention has the purpose of displaying reviews commonly provided to all users as personalized reviews, taking individual characteristics into account, using given text information to perform web crawling, web scraping, and It includes a step of extracting information through a structuring step, and a step of creating a personalized review based on the extracted information. For example, the information may be determined using Machine Learning (ML) or Natural Language Processing (NLP), techniques including forms of statistical classification. With the goal of delivering more meaningful information, we provide users with more optimized information and, in particular, continuously update related parameters to improve satisfaction with reprocessed reviews. Hereinafter, embodiments of the present invention will be described in detail with reference to the attached drawings.

도 1은 본 발명의 일 실시예에 따른 사용자별 개인화된 리뷰를 제공하는 방법을 설명하기 위한 흐름도이다. 1 is a flowchart illustrating a method of providing personalized reviews for each user according to an embodiment of the present invention.

제안하는 사용자별 개인화된 리뷰를 제공하는 방법은 정보 추출부를 통해 사용자가 평가하는 하나 이상의 평가 대상에 대해 복수의 평가 정보를 반영한 리뷰를 수집하고, 사용자별 개인화된 리뷰로 재가공하기 위해 수집된 리뷰의 에 대해 웹크롤링(Web Crawling) 또는 웹스크래핑(Web Scraping)을 이용하여 리뷰 관련 정보를 추출하는 단계(110), 학습부를 통해 기계학습(Machine Learning; ML) 또는 자연어 처리(Natural Language Processing; NLP)를 이용하여 추출된 리뷰 관련 정보를 수치화하는 단계(120), 사용자별 개인화된 리뷰 제공부를 통해 상기 수치화된 리뷰 관련 정보를 사용자별 가중치 파라미터와 데이터 분포로서 나타내고, 사용자별 가중치 파라미터 및 데이터 분포를 이용하여 사용자별 개인화된 리뷰를 제공하는 단계(130) 및 상기 사용자별 개인화된 리뷰 제공부를 통해 사용자별 개인화된 리뷰에 대한 사용자의 만족도를 증가시키기 위해 사용자별 가중치 파라미터 및 데이터 분포를 반복적으로 갱신하는 단계(140)를 포함한다. The proposed method of providing personalized reviews for each user is to collect reviews reflecting multiple evaluation information for one or more evaluation targets evaluated by the user through an information extraction unit, and to reprocess the collected reviews into personalized reviews for each user. Step 110 of extracting review-related information using web crawling or web scraping, machine learning (ML) or natural language processing (NLP) through the learning unit. Step 120 of quantifying the extracted review-related information using A step of providing a personalized review for each user (130) and a step of repeatedly updating the weight parameters and data distribution for each user to increase the user's satisfaction with the personalized review for each user through the personalized review providing unit for each user. Includes (140).

단계(110)에서, 정보 추출부를 통해 사용자가 평가하는 하나 이상의 평가 대상에 대해 복수의 평가 정보를 반영한 리뷰를 수집하고, 사용자별 개인화된 리뷰로 재가공하기 위해 수집된 리뷰의 에 대해 웹크롤링(Web Crawling) 또는 웹스크래핑(Web Scraping)을 이용하여 리뷰 관련 정보를 추출한다. In step 110, reviews reflecting a plurality of evaluation information for one or more evaluation objects evaluated by the user are collected through the information extraction unit, and web crawling (Web crawling) of the collected reviews to be reprocessed into personalized reviews for each user. Extract review-related information using crawling or web scraping.

본 발명의 실시예에 따른 웹크롤링이란 조직적이고 자동화된 방법으로 전 세계적인 정보공간인 월드 와이드 웹(World Wide Web; WWW)을 탐색하여 유용한 데이터를 추출해내는 작업이다. 구글과 같은 검색엔진 등에서 주로 사용하며 특정 형태의 정보를 수집하는 데도 사용한다.Web crawling according to an embodiment of the present invention is a task of extracting useful data by exploring the World Wide Web (WWW), a global information space, in an organized and automated manner. It is mainly used by search engines such as Google, and is also used to collect specific types of information.

본 발명의 실시예에 따른 웹스크래핑은 웹페이지(Webpage)로부터 유용한 데이터를 추출해오는 작업이다. 웹크롤링과 달리 여러 페이지가 아니라 하나의 웹페이지가 대상이라는 점에서 차이가 있다.Web scraping according to an embodiment of the present invention is a task of extracting useful data from a webpage. Unlike web crawling, the difference is that the target is a single web page rather than multiple pages.

단계(120)에서, 학습부를 통해 기계학습(Machine Learning; ML) 또는 자연어 처리(Natural Language Processing; NLP)를 이용하여 추출된 리뷰 관련 정보를 수치화한다. In step 120, the review-related information extracted using machine learning (ML) or natural language processing (NLP) is quantified through the learning unit.

이때, 사용자별 개인화된 리뷰로 재가공하기 위해 수집된 리뷰의 개인 사용자 평가 외에 또 다른 복수의 사용자들의 평가를 포함하는 리뷰들에 대하여 수치화된 리뷰 관련 정보를 다차원 특징공간 내 점들로 이해할 수 있다. 상기 다차원 특징공간 내 점들에 대하여 클러스터링(Clustering) 또는 기계학습을 통한 회귀분석(regression analysis)등 여러 연산을 적용할 수 있다. At this time, for reviews that include evaluations of multiple users in addition to individual user evaluations of reviews collected to be reprocessed into personalized reviews for each user, quantified review-related information can be understood as points in a multidimensional feature space. Various operations, such as clustering or regression analysis through machine learning, can be applied to the points in the multidimensional feature space.

본 발명의 실시예에 따른 기계학습이란 인공지능의 한 분야로, 명시적인 프로그래밍 없이 학습하여 성능을 개선하는 컴퓨터 알고리즘과 기술을 개발하는 연구분야다. 크게 분류(Classification)와 회귀(Regression)로 그 목적을 나눌 수 있는데, 결국 주목적은 예측(Prediction)이다. 본 발명의 실시예에 따른 기계학습을 통하여 리뷰에 대한 올바른 가중치를 예측할 수 있다.Machine learning according to an embodiment of the present invention is a field of artificial intelligence and is a research field that develops computer algorithms and technologies that improve performance by learning without explicit programming. The purpose can be broadly divided into classification and regression, but ultimately the main purpose is prediction. The correct weight for reviews can be predicted through machine learning according to an embodiment of the present invention.

본 발명의 실시예에 따른 자연어 처리는 컴퓨터와 인간이 의사소통을 위해 사용하는 자연어 사이의 상호작용을 연구하는 인공지능의 한 분야다. 음성인식, 번역 등을 포함하여 매우 넓은 범위를 포괄한다. 본 발명의 실시예에 따른 자연어 처리는 텍스트 데이터를 수치화하는 단계에 적용할 수 있다.Natural language processing according to an embodiment of the present invention is a field of artificial intelligence that studies the interaction between computers and natural language used by humans for communication. It covers a very wide range, including voice recognition and translation. Natural language processing according to an embodiment of the present invention can be applied to the step of digitizing text data.

단계(130)에서, 사용자별 개인화된 리뷰 제공부를 통해 상기 수치화된 리뷰 관련 정보를 사용자별 가중치 파라미터와 데이터 분포로서 나타내고, 사용자별 가중치 파라미터 및 데이터 분포를 이용하여 사용자별 개인화된 리뷰를 제공한다. In step 130, the quantified review-related information is expressed as a weight parameter and data distribution for each user through a personalized review provision unit for each user, and a personalized review for each user is provided using the weight parameter and data distribution for each user.

먼저, 수치화된 리뷰 관련 정보가 개인 사용자 본인의 것인지 여부를 판단한다(131). 개인 사용자 본인의 것이 아닌 경우, 데이터 분포를 파악하기 위해 대표 값과 분포를 파악하기 쉬운 다차원 가우시안 분포로 나타낸다(132). First, it is determined whether the quantified review-related information belongs to the individual user (131). If it is not the individual user's own, the representative value and distribution are expressed as a multidimensional Gaussian distribution that is easy to understand in order to understand the data distribution (132).

반면에, 개인 사용자 본인의 것인 경우, 사용자별 가중치 파라미터로 나타낸다(133). 이후, 사용자별 가중치 파라미터 및 데이터 분포를 이용하여 사용자별 개인화된 리뷰를 제공한다(134). On the other hand, if it belongs to an individual user, it is expressed as a weight parameter for each user (133). Afterwards, personalized reviews are provided for each user using weight parameters and data distribution for each user (134).

본 발명의 실시예에 따른 사용자별 가중치 파라미터는 평가 대상에 대한 개인 사용자 외에 또 다른 복수의 사용자들의 수치에 따른 개인 사용자만의 경향성을 반영한다. 이러한 사용자별 가중치 파라미터는 모든 리뷰를 반영한 글로벌 데이터 분포와 비교하여 개인 사용자의 리뷰의 상대적인 위치를 나타내는 수치이다. The weight parameter for each user according to an embodiment of the present invention reflects the individual user's tendency according to the values of a plurality of users other than the individual user for the evaluation target. These user-specific weight parameters are numbers that represent the relative position of an individual user's review compared to the global data distribution reflecting all reviews.

이러한 사용자별 가중치 파라미터에 대해 기계학습(Machine Learning; ML)으로 학습의 과정을 거치고 자연어 처리(Natural Language Processing; NLP)를 통해 텍스트로 구성된 리뷰를 수치화한다. These user-specific weight parameters go through a learning process using machine learning (ML), and the text reviews are quantified through natural language processing (NLP).

본 발명의 실시예에 따르면, 개인 사용자 및 상기 복수의 사용자들을 미리 정해진 특정 부류로 군집화하여 군집별 경향성을 나타낼 수 있다. 또한, 평가 대상들을 미리 정해진 특정 부류로 군집화하여 군집별 경향성을 나타낼 수도 있다. According to an embodiment of the present invention, individual users and the plurality of users can be clustered into specific predetermined categories to show trends for each cluster. Additionally, evaluation targets can be clustered into specific, predetermined categories to show trends for each cluster.

단계(140)에서, 사용자별 개인화된 리뷰 제공부를 통해 사용자별 개인화된 리뷰에 대한 사용자의 만족도를 증가시키기 위해 사용자별 가중치 파라미터 및 데이터 분포를 반복적으로 갱신한다. In step 140, the weight parameters and data distribution for each user are repeatedly updated to increase the user's satisfaction with the personalized review for each user through the personalized review provision unit for each user.

기계학습(Machine Learning; ML) 또는 자연어 처리(Natural Language Processing; NLP)를 이용하여 추출된 리뷰 관련 정보를 수치화하는 학습의 과정은 본 발명의 실시예에 따른 특정 평가대상에 대하여 예측한 사용자의 만족도와 실제 사용자가 남긴 리뷰로 계산한 만족도를 비교하여, 사용자의 만족도를 정확하게 예측하는 것을 목표로 반복하여 학습할 수 있다. The learning process of quantifying the review-related information extracted using machine learning (ML) or natural language processing (NLP) is the user's satisfaction predicted for a specific evaluation target according to an embodiment of the present invention. By comparing the satisfaction calculated with reviews left by actual users, learning can be repeated with the goal of accurately predicting user satisfaction.

다양한 내부 및 외부 변인들에 의해 결정되는 파라미터에 대해 외부 변인에 따라 추천하는 기능을 수행할 수도 있다. It is also possible to perform a recommendation function based on external variables for parameters determined by various internal and external variables.

리뷰를 제공받는 사용자에게 보다 신뢰성 있는 리뷰를 제공하기 위해 본 발명에서는 텍스트로 이루어진 리뷰를 기계학습 또는 자연어 처리를 이용해서 수치화 하고 수치화된 데이터의 분포를 통해 타인과 사용자의 리뷰와 비교하여 최종적으로 사용자에게 최적화된 리뷰 정보를 제공하는 방식을 제안한다. 바람직하게, 기계학습을 사용할 경우 개인화된 리뷰에 대하여 사용자의 만족도를 증가시키기 위해 사용자의 새로운 리뷰를 반영하여 파라미터를 갱신하는 과정을 반복한다. 본 아이디어는 또한 기존의 리뷰 데이터를 웹크롤링(Web crawling)이나 웹스크래핑(Web scraping)하는 방법을 포함하기 때문에 추가적인 데이터를 필요로 하지 않고도 최적화된 리뷰를 제공할 수 있다. In order to provide more reliable reviews to users who receive reviews, the present invention quantifies text reviews using machine learning or natural language processing, compares them with reviews of others and users through the distribution of quantified data, and ultimately provides user reviews. We propose a method of providing optimized review information to users. Preferably, when using machine learning, the process of updating parameters by reflecting the user's new review is repeated to increase the user's satisfaction with the personalized review. This idea also includes a method of web crawling or web scraping existing review data, so it can provide optimized reviews without requiring additional data.

도 2는 본 발명의 일 실시예에 따른 사용자별 개인화된 리뷰를 제공하는 시스템의 구성을 나타내는 도면이다. Figure 2 is a diagram showing the configuration of a system that provides personalized reviews for each user according to an embodiment of the present invention.

제안하는 사용자별 개인화된 리뷰를 제공하는 시스템은 정보 추출부(210), 학습부(220) 및 사용자별 개인화된 리뷰 제공부(230)를 포함한다. The proposed system for providing personalized reviews for each user includes an information extraction unit 210, a learning unit 220, and a personalized review provision unit 230 for each user.

본 발명의 실시예에 따른 정보 추출부(210)는 사용자가 평가하는 하나 이상의 평가 대상에 대해 복수의 평가 정보를 반영한 리뷰를 수집하고, 사용자별 개인화된 리뷰로 재가공하기 위해 수집된 리뷰의 에 대해 웹크롤링(Web Crawling) 또는 웹스크래핑(Web Scraping)을 이용하여 리뷰 관련 정보를 추출한다. The information extraction unit 210 according to an embodiment of the present invention collects reviews reflecting a plurality of evaluation information for one or more evaluation objects evaluated by a user, and provides information about the collected reviews in order to reprocess them into personalized reviews for each user. Review-related information is extracted using web crawling or web scraping.

본 발명의 실시예에 따른 학습부(220)는 기계학습(Machine Learning; ML) 또는 자연어 처리(Natural Language Processing; NLP)를 이용하여 추출된 리뷰 관련 정보를 수치화한다. The learning unit 220 according to an embodiment of the present invention quantifies the extracted review-related information using machine learning (ML) or natural language processing (NLP).

본 발명의 실시예에 따른 학습부(220)는 사용자별 개인화된 리뷰로 재가공하기 위해 수집된 리뷰의 개인 사용자 평가 외에 또 다른 복수의 사용자들의 평가를 포함하는 리뷰들에 대하여 수치화된 리뷰 관련 정보를 다차원 특징공간 내 점들로 이해할 수 있다. 상기 다차원 특징공간 내 점들에 대하여 클러스터링(Clustering) 또는 기계학습을 통한 회귀분석(regression analysis)등 여러 연산을 적용할 수 있다. The learning unit 220 according to an embodiment of the present invention provides quantified review-related information for reviews that include evaluations of a plurality of users in addition to individual user evaluations of the collected reviews in order to reprocess them into personalized reviews for each user. It can be understood as points in a multidimensional feature space. Various operations, such as clustering or regression analysis through machine learning, can be applied to the points in the multidimensional feature space.

본 발명의 실시예에 따른 제공부(230)는 사용자별 개인화된 리뷰 제공부를 통해 상기 수치화된 리뷰 관련 정보를 사용자별 가중치 파라미터와 데이터 분포로서 나타내고, 사용자별 가중치 파라미터 및 데이터 분포를 이용하여 사용자별 개인화된 리뷰를 제공한다. The provision unit 230 according to an embodiment of the present invention displays the quantified review-related information as a weight parameter and data distribution for each user through a personalized review provision unit for each user, and uses the weight parameter and data distribution for each user to Provides personalized reviews.

본 발명의 실시예에 따른 제공부(230)는 데이터 분포를 파악하기 위해 대표 값과 분포를 파악하기 쉬운 다차원 가우시안 분포로 나타낸다. In order to understand the data distribution, the providing unit 230 according to an embodiment of the present invention displays representative values and distributions as multidimensional Gaussian distributions that are easy to understand.

본 발명의 실시예에 따른 사용자별 가중치 파라미터는 평가 대상에 대한 개인 사용자 외에 또 다른 복수의 사용자들의 수치에 따른 개인 사용자만의 경향성을 반영한다. 이러한 사용자별 가중치 파라미터는 모든 리뷰를 반영한 글로벌 데이터 분포와 비교하여 개인 사용자의 리뷰의 상대적인 위치를 나타내는 수치이다. The weight parameter for each user according to an embodiment of the present invention reflects the individual user's tendency according to the values of a plurality of users other than the individual user for the evaluation target. These user-specific weight parameters are numbers that represent the relative position of an individual user's review compared to the global data distribution reflecting all reviews.

이러한 사용자별 가중치 파라미터에 대해 기계학습(Machine Learning; ML)으로 학습의 과정을 거치고 자연어 처리(Natural Language Processing; NLP)를 통해 텍스트로 구성된 리뷰를 수치화한다. These user-specific weight parameters go through a learning process using machine learning (ML), and the text reviews are quantified through natural language processing (NLP).

본 발명의 실시예에 따르면, 개인 사용자 및 상기 복수의 사용자들을 미리 정해진 특정 부류로 군집화하여 군집별 경향성을 나타낼 수 있다. 또한, 평가 대상들을 미리 정해진 특정 부류로 군집화하여 군집별 경향성을 나타낼 수도 있다. According to an embodiment of the present invention, individual users and the plurality of users can be clustered into specific predetermined categories to show trends for each cluster. Additionally, evaluation targets can be clustered into specific, predetermined categories to show trends for each cluster.

본 발명의 실시예에 따른 제공부(230)는 사용자별 개인화된 리뷰에 대한 사용자의 만족도를 증가시키기 위해 사용자별 가중치 파라미터 및 데이터 분포를 반복적으로 갱신한다. The provision unit 230 according to an embodiment of the present invention repeatedly updates the weight parameters and data distribution for each user in order to increase the user's satisfaction with the personalized review for each user.

기계학습(Machine Learning; ML) 또는 자연어 처리(Natural Language Processing; NLP)를 이용하여 추출된 리뷰 관련 정보를 수치화하는 학습의 과정은 본 발명의 실시예에 따른 특정 평가대상에 대하여 예측한 사용자의 만족도와 실제 사용자가 남긴 리뷰로 계산한 만족도를 비교하여, 사용자의 만족도를 정확하게 예측하는 것을 목표로 반복하여 학습할 수 있다. The learning process of quantifying the review-related information extracted using machine learning (ML) or natural language processing (NLP) is the user's satisfaction predicted for a specific evaluation target according to an embodiment of the present invention. By comparing the satisfaction calculated with reviews left by actual users, learning can be repeated with the goal of accurately predicting user satisfaction.

다양한 내부 및 외부 변인들에 의해 결정되는 파라미터에 대해 외부 변인에 따라 추천하는 기능을 수행할 수도 있다. It is also possible to perform a recommendation function based on external variables for parameters determined by various internal and external variables.

도 3은 본 발명의 일 실시예에 따른 사용자별 가중치 파라미터의 예시를 나타내는 도면이다. Figure 3 is a diagram showing an example of weight parameters for each user according to an embodiment of the present invention.

리뷰는 평가자의 주관적인 생각이기에 평가자들의 리뷰는 모두에게 정확한 정보라고 할 수 없다. 하지만 아직까지 인터넷 및 스마트폰 앱 등에서 제공되는 리뷰는 그러한 고려가 반영되지 않으며, 그에 따라 여러 리뷰가 존재함에도 사용자는 적합한 정보를 얻지 못하는 경우도 존재한다. Because reviews are the subjective thoughts of evaluators, their reviews cannot be said to be accurate information for everyone. However, reviews provided on the Internet and smartphone apps do not yet reflect such considerations, and as a result, there are cases where users do not receive appropriate information even though there are multiple reviews.

따라서, 본 발명에서는 리뷰를 제공받는 개개인에게 최적화된 리뷰 정보를 제공하는 서비스인 리뷰 개인화를 통하여 인터넷 및 스마트폰 앱 등의 플랫폼에서 보다 정확한 정보를 제공하고자 한다. Therefore, the present invention seeks to provide more accurate information on platforms such as the Internet and smartphone apps through review personalization, which is a service that provides optimized review information to individuals who receive reviews.

본 발명의 실시예에 따른 개인화된 리뷰로 재가공하기 위해 주어진 리뷰 정보를 웹크롤링(Web Crawling)이나 웹스크래핑(Web Scraping)및 구조화 단계를 통해 정보를 추출한 다음, 기계학습 또는 자연어 처리를 이용해서 수치화할 수 있다. 이후, 수치화된 리뷰를 분포로 나타내고, 최종적으로 개인에게 맞춤화된 결과를 반환한다. In order to reprocess the given review information into a personalized review according to an embodiment of the present invention, information is extracted from the given review information through web crawling, web scraping, and structuring steps, and then quantified using machine learning or natural language processing. can do. Afterwards, the quantified reviews are expressed as a distribution, and finally, customized results are returned to the individual.

도 3은 하나의 평가 대상에 대한 그래프를 나타낸다. 리뷰의 수치화는 다차원 공간에서의 분포로 표시 가능하며 해당 그래프는 그 중 한 축에 대한 사용자별 가중치를 나타낸 것이다. 축이 N개라면 수치화된 리뷰는 N차원 공간의 분포로 표현할 수 있으며 이러한 경우 N개의 가중치 집합을 사용할 수 있다. Figure 3 shows a graph for one evaluation target. Reviews can be quantified as a distribution in a multidimensional space, and the graph shows the weight of each user on one of the axes. If there are N axes, the numerical review can be expressed as a distribution in an N-dimensional space, and in this case, a set of N weights can be used.

도 4는 본 발명의 일 실시예에 따른 사용자별 개인화된 리뷰를 제공하는 다양한 예시를 설명하기 위한 도면이다.Figure 4 is a diagram for explaining various examples of providing personalized reviews for each user according to an embodiment of the present invention.

본 발명의 실시예에 따르면, 사용자에게 적절한 리뷰 정보를 이용하여 보다 신뢰도가 높은 개인화된 리뷰를 제공할 수 있다. 나아가 수집된 다양한 리뷰의 수치화된 변인들을 사용하여 다른 사용자와 함께 최적화된 추천 서비스를 제공받을 수 있다. According to an embodiment of the present invention, a personalized review with higher reliability can be provided to the user using appropriate review information. Furthermore, by using the quantified variables of the various collected reviews, you can receive an optimized recommendation service together with other users.

도 4에 도시된 실시예는 특히 음식 리뷰의 개인화에 대한 것이며 본 발명은 이 외 다양한 경우에 적용 가능하고, 여러 가지 상이한 형태로 구현될 수 있으며 여기서 설명하는 실시예에 한정되지 않는다. The embodiment shown in FIG. 4 is specifically about personalization of food reviews, and the present invention is applicable to various other cases, can be implemented in many different forms, and is not limited to the embodiment described herein.

도 4(a)를 참조하면, 개인 사용자에 대한 미식 프로필을 표시한다. 사용자에 대하여 미식 정보를 분석한 결과를 맛의 종류에 따라 표시한다. 이때, 정보는 함축적으로 표현할 수 있다. Referring to Figure 4(a), a gourmet profile for an individual user is displayed. The results of analyzing gourmet information about the user are displayed according to the type of taste. At this time, information can be expressed implicitly.

도 4(b)는 특정 매장의 특정 음식에 대해 분석된 리뷰 프로필을 표시한다.Figure 4(b) displays the analyzed review profile for a specific food in a specific store.

특정 매장의 특정 음식에 대한 맛의 종류에 따라 개인 사용자에게 최적화된 맛을 추천할 수 있다. Depending on the type of taste for a specific food at a specific store, an optimized flavor can be recommended to an individual user.

도 4(c)는 음식 리뷰의 개인화에 있어서 환경정보(예를 들어, 날씨)를 반영한 추천 메뉴를 표시한다. Figure 4(c) displays a recommended menu that reflects environmental information (e.g., weather) in personalizing food reviews.

이와 같이 리뷰를 제공받는 개개인에게 최적화된 리뷰 정보를 제공하는 서비스인 리뷰 개인화를 통하여 인터넷 및 스마트폰 앱 등의 플랫폼에서 보다 정확한 정보를 제공할 수 있다. 사용자에게 적절한 리뷰 정보를 이용하여 보다 신뢰도가 높은 개인화된 리뷰를 제공할 수 있고, 나아가 수집된 다양한 리뷰의 수치화된 변인들을 사용하여 다른 사용자와 함께 최적화된 추천 서비스를 제공할 수 있다. In this way, more accurate information can be provided on platforms such as the Internet and smartphone apps through review personalization, a service that provides optimized review information to each individual who receives the review. It is possible to provide users with personalized reviews with higher reliability by using appropriate review information, and furthermore, by using the quantified variables of various collected reviews, an optimized recommendation service can be provided together with other users.

이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다.  또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다.  이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다.  예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다.  또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.The device described above may be implemented with hardware components, software components, and/or a combination of hardware components and software components. For example, devices and components described in embodiments may include, for example, a processor, a controller, an arithmetic logic unit (ALU), a digital signal processor, a microcomputer, a field programmable gate array (FPGA), etc. , may be implemented using one or more general-purpose or special-purpose computers, such as a programmable logic unit (PLU), a microprocessor, or any other device capable of executing and responding to instructions. A processing device may execute an operating system (OS) and one or more software applications that run on the operating system. Additionally, a processing device may access, store, manipulate, process, and generate data in response to the execution of software. For ease of understanding, a single processing device may be described as being used; however, those skilled in the art will understand that a processing device includes multiple processing elements and/or multiple types of processing elements. It can be seen that it may include. For example, a processing device may include a plurality of processors or one processor and one controller. Additionally, other processing configurations, such as parallel processors, are possible.

소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다.  소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치에 구체화(embody)될 수 있다.  소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.Software may include a computer program, code, instructions, or a combination of one or more of these, which may configure a processing unit to operate as desired, or may be processed independently or collectively. You can command the device. Software and/or data may be used on any type of machine, component, physical device, virtual equipment, computer storage medium or device to be interpreted by or to provide instructions or data to a processing device. It can be embodied in . Software may be distributed over networked computer systems and stored or executed in a distributed manner. Software and data may be stored on one or more computer-readable recording media.

실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다.  상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다.  상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다.  컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다.  프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.  The method according to the embodiment may be implemented in the form of program instructions that can be executed through various computer means and recorded on a computer-readable medium. The computer-readable medium may include program instructions, data files, data structures, etc., singly or in combination. Program instructions recorded on the medium may be specially designed and configured for the embodiment or may be known and available to those skilled in the art of computer software. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks, and magnetic tapes, optical media such as CD-ROMs and DVDs, and magnetic media such as floptical disks. -Includes optical media (magneto-optical media) and hardware devices specifically configured to store and execute program instructions, such as ROM, RAM, flash memory, etc. Examples of program instructions include machine language code, such as that produced by a compiler, as well as high-level language code that can be executed by a computer using an interpreter, etc.

이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다.  예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.As described above, although the embodiments have been described with limited examples and drawings, various modifications and variations can be made by those skilled in the art from the above description. For example, the described techniques are performed in a different order than the described method, and/or components of the described system, structure, device, circuit, etc. are combined or combined in a different form than the described method, or other components are used. Alternatively, appropriate results may be achieved even if substituted or substituted by an equivalent.

그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.Therefore, other implementations, other embodiments, and equivalents of the claims also fall within the scope of the claims described below.

Claims (8)

정보 추출부를 통해 사용자가 평가하는 하나 이상의 평가 대상에 대해 복수의 평가 정보를 반영한 리뷰를 수집하고, 사용자별 개인화된 리뷰로 재가공하기 위해 수집된 리뷰의 에 대해 웹크롤링(Web Crawling) 또는 웹스크래핑(Web Scraping)을 이용하여 리뷰 관련 정보를 추출하는 단계;
학습부를 통해 기계학습(Machine Learning; ML) 또는 자연어 처리(Natural Language Processing; NLP)를 이용하여 추출된 리뷰 관련 정보를 수치화하는 단계; 및
사용자별 개인화된 리뷰 제공부를 통해 상기 수치화된 리뷰 관련 정보를 사용자별 가중치 파라미터와 데이터 분포로서 나타내고, 사용자별 가중치 파라미터 및 데이터 분포를 이용하여 사용자별 개인화된 리뷰를 제공하는 단계
를 포함하는 리뷰 제공 방법.
Through the information extraction unit, reviews reflecting multiple evaluation information for one or more evaluation targets evaluated by users are collected, and web crawling or web scraping (web crawling) is performed on the collected reviews in order to reprocess them into personalized reviews for each user. Extracting review-related information using Web Scraping;
Quantifying the extracted review-related information using machine learning (ML) or natural language processing (NLP) through the learning unit; and
Displaying the quantified review-related information as weight parameters and data distribution for each user through a personalized review provision unit for each user, and providing a personalized review for each user using the weight parameters and data distribution for each user.
How to provide a review, including .
제1항에 있어서,
상기 사용자별 개인화된 리뷰 제공부를 통해 사용자별 개인화된 리뷰에 대한 사용자의 만족도를 증가시키기 위해 사용자별 가중치 파라미터 및 데이터 분포를 반복적으로 갱신하는 단계
를 더 포함하는 리뷰 제공 방법.
According to paragraph 1,
Iteratively updating weight parameters and data distribution for each user to increase user satisfaction with the personalized review for each user through the personalized review provision unit for each user.
How to provide a review, including further.
제1항에 있어서,
상기 학습부를 통해 기계학습 또는 자연어 처리를 이용하여 추출된 리뷰 관련 정보를 수치화하는 단계는,
사용자별 개인화된 리뷰로 재가공하기 위해 수집된 리뷰의 개인 사용자 평가 외에 또 다른 복수의 사용자들의 평가를 포함하는 리뷰들에 대하여 수치화된 리뷰 관련 정보를 다차원 특징공간 내 점들로 나타내고, 상기 다차원 특징공간 내 점들에 대하여 클러스터링(Clustering) 또는 기계학습을 수행하는
리뷰 제공 방법.
According to paragraph 1,
The step of quantifying the review-related information extracted using machine learning or natural language processing through the learning unit is,
In order to reprocess the collected reviews into personalized reviews for each user, quantified review-related information for reviews that include evaluations from multiple users in addition to individual user evaluations of the collected reviews is expressed as points in a multidimensional feature space, and within the multidimensional feature space Performing clustering or machine learning on points
How to provide a review.
제1항에 있어서,
상기 사용자별 개인화된 리뷰 제공부를 통해 상기 수치화된 리뷰 관련 정보를 사용자별 가중치 파라미터와 데이터 분포로서 나타내고, 사용자별 가중치 파라미터 및 데이터 분포를 이용하여 사용자별 개인화된 리뷰를 제공하는 단계는,
상기 데이터 분포를 파악하기 위해 다차원 가우시안 분포로 나타내고,
상기 사용자별 가중치 파라미터는 평가 대상에 대한 개인 사용자 외에 또 다른 복수의 사용자들의 수치에 따른 개인 사용자만의 경향성을 반영하고, 모든 리뷰를 반영한 데이터 분포와 비교하여 개인 사용자의 리뷰의 상대적인 위치를 나타내는 수치이고,
상기 개인 사용자 및 상기 복수의 사용자들을 미리 정해진 특정 부류로 군집화하여 군집별 경향성을 나타내는
리뷰 제공 방법.
According to paragraph 1,
The step of representing the quantified review-related information as a weight parameter and data distribution for each user through the personalized review provision unit for each user, and providing a personalized review for each user using the weight parameter and data distribution for each user, including:
In order to understand the data distribution, it is expressed as a multidimensional Gaussian distribution,
The weight parameter for each user reflects the individual user's tendency according to the values of a plurality of users other than the individual user for the evaluation target, and is a value representing the relative position of the individual user's review compared to the data distribution reflecting all reviews. ego,
Clustering the individual user and the plurality of users into specific predetermined categories to indicate trends for each group
How to provide a review.
사용자가 평가하는 하나 이상의 평가 대상에 대해 복수의 평가 정보를 반영한 리뷰를 수집하고, 사용자별 개인화된 리뷰로 재가공하기 위해 수집된 리뷰의 에 대해 웹크롤링(Web Crawling) 또는 웹스크래핑(Web Scraping)을 이용하여 리뷰 관련 정보를 추출하는 정보 추출부;
기계학습(Machine Learning; ML) 또는 자연어 처리(Natural Language Processing; NLP)를 이용하여 추출된 리뷰 관련 정보를 수치화하는 학습부; 및
수치화된 리뷰 관련 정보를 사용자별 가중치 파라미터와 데이터 분포로서 나타내고, 사용자별 가중치 파라미터 및 데이터 분포를 이용하여 사용자별 개인화된 리뷰를 제공하는 사용자별 개인화된 리뷰 제공부
를 포함하는 리뷰 제공 시스템.
We collect reviews reflecting multiple evaluation information for one or more evaluation targets evaluated by users, and perform web crawling or web scraping on the collected reviews to reprocess them into personalized reviews for each user. an information extraction unit that extracts review-related information;
A learning unit that quantifies review-related information extracted using machine learning (ML) or natural language processing (NLP); and
A personalized review provision unit for each user that displays quantified review-related information as weight parameters and data distribution for each user and provides personalized reviews for each user using the weight parameters and data distribution for each user.
A review provision system that includes.
제5항에 있어서,
상기 사용자별 개인화된 리뷰 제공부는
사용자별 개인화된 리뷰에 대한 사용자의 만족도를 증가시키기 위해 사용자별 가중치 파라미터 및 데이터 분포를 반복적으로 갱신하는
리뷰 제공 시스템.
According to clause 5,
The section that provides personalized reviews for each user
Iteratively updates weight parameters and data distribution for each user to increase user satisfaction with personalized reviews.
Review provision system.
제5항에 있어서,
상기 학습부는,
사용자별 개인화된 리뷰로 재가공하기 위해 수집된 리뷰의 개인 사용자 평가 외에 또 다른 복수의 사용자들의 평가를 포함하는 리뷰들에 대하여 수치화된 리뷰 관련 정보를 다차원 특징공간 내 점들로 나타내고, 상기 다차원 특징공간 내 점들에 대하여 클러스터링(Clustering) 또는 기계학습을 수행하는
리뷰 제공 시스템.
According to clause 5,
The learning department,
In order to reprocess the collected reviews into personalized reviews for each user, quantified review-related information for reviews that include evaluations from multiple users in addition to individual user evaluations of the collected reviews is expressed as points in a multidimensional feature space, and within the multidimensional feature space Performing clustering or machine learning on points
Review provision system.
제5항에 있어서,
상기 사용자별 개인화된 리뷰 제공부는,
상기 데이터 분포를 파악하기 위해 다차원 가우시안 분포로 나타내고,
상기 사용자별 가중치 파라미터는 평가 대상에 대한 개인 사용자 외에 또 다른 복수의 사용자들의 수치에 따른 개인 사용자만의 경향성을 반영하고, 모든 리뷰를 반영한 데이터 분포와 비교하여 개인 사용자의 리뷰의 상대적인 위치를 나타내는 수치이고,
상기 개인 사용자 및 상기 복수의 사용자들을 미리 정해진 특정 부류로 군집화하여 군집별 경향성을 나타내는
리뷰 제공 시스템.
According to clause 5,
The personalized review provision section for each user,
In order to understand the data distribution, it is expressed as a multidimensional Gaussian distribution,
The weight parameter for each user reflects the individual user's tendency according to the values of a plurality of users other than the individual user for the evaluation target, and is a value representing the relative position of the individual user's review compared to the data distribution reflecting all reviews. ego,
Clustering the individual user and the plurality of users into specific predetermined categories to indicate trends for each group
Review provision system.
KR1020220048092A 2022-04-19 2022-04-19 Methods and System for Providing Personalized Reviews KR20230148995A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220048092A KR20230148995A (en) 2022-04-19 2022-04-19 Methods and System for Providing Personalized Reviews

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220048092A KR20230148995A (en) 2022-04-19 2022-04-19 Methods and System for Providing Personalized Reviews

Publications (1)

Publication Number Publication Date
KR20230148995A true KR20230148995A (en) 2023-10-26

Family

ID=88509125

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220048092A KR20230148995A (en) 2022-04-19 2022-04-19 Methods and System for Providing Personalized Reviews

Country Status (1)

Country Link
KR (1) KR20230148995A (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101532715B1 (en) 2005-03-18 2015-07-02 써치 엔진 테크놀로지스, 엘엘씨 Search engine that applies feedback from users to improve search results
KR101871827B1 (en) 2017-02-07 2018-06-28 (주)망고플레이트 Content priority personalization apparatus, method and program
KR102227552B1 (en) 2020-06-08 2021-03-15 주식회사 그로우키친 System for providing context awareness algorithm based restaurant sorting personalized service using review category

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101532715B1 (en) 2005-03-18 2015-07-02 써치 엔진 테크놀로지스, 엘엘씨 Search engine that applies feedback from users to improve search results
KR101871827B1 (en) 2017-02-07 2018-06-28 (주)망고플레이트 Content priority personalization apparatus, method and program
KR102227552B1 (en) 2020-06-08 2021-03-15 주식회사 그로우키친 System for providing context awareness algorithm based restaurant sorting personalized service using review category

Similar Documents

Publication Publication Date Title
KR101778679B1 (en) Method and system for classifying data consisting of multiple attribues represented by sequences of text words or symbols using deep learning
CN108874992B (en) Public opinion analysis method, system, computer equipment and storage medium
US11042594B2 (en) Artificial intelligence for product data extraction
CN110659742B (en) Method and device for acquiring sequence representation vector of user behavior sequence
US20020049685A1 (en) Prediction analysis apparatus and program storage medium therefor
CN110110233B (en) Information processing method, device, medium and computing equipment
CN111737586B (en) Information recommendation method, device, equipment and computer readable storage medium
CN112580346B (en) Event extraction method and device, computer equipment and storage medium
Peker et al. Application of Chi-square discretization algorithms to ensemble classification methods
CN114077661A (en) Information processing apparatus, information processing method, and computer readable medium
AL-Bakri et al. Multi label restaurant classification using support vector machine
KR20230117716A (en) User equipment, method, and recording medium for creating recommendation keyword
KR20230148995A (en) Methods and System for Providing Personalized Reviews
CN115660695A (en) Customer service personnel label portrait construction method and device, electronic equipment and storage medium
WO2022271528A1 (en) Explainable artificial intelligence in computing environment
CN113961811A (en) Conversational recommendation method, device, equipment and medium based on event map
CN115129863A (en) Intention recognition method, device, equipment, storage medium and computer program product
CN114065763A (en) Event extraction-based public opinion analysis method and device and related components
KR20210142443A (en) Method and system for providing continuous adaptive learning over time for real time attack detection in cyberspace
JP2020061147A (en) Method and device for searching for cnn-based image
KR20210023453A (en) Apparatus and method for matching review advertisement
CN116453702B (en) Data processing method, device, system and medium for autism behavior feature set
KR102399833B1 (en) synopsis production service providing apparatus using log line based on artificial neural network and method therefor
CN117422063B (en) Big data processing method applying intelligent auxiliary decision and intelligent auxiliary decision system
CN113792163B (en) Multimedia recommendation method and device, electronic equipment and storage medium