KR102080344B1 - An apparatus and method for detecting fraud evaluation of online contents that distinguish heavy user from fraud user - Google Patents

An apparatus and method for detecting fraud evaluation of online contents that distinguish heavy user from fraud user Download PDF

Info

Publication number
KR102080344B1
KR102080344B1 KR1020180167363A KR20180167363A KR102080344B1 KR 102080344 B1 KR102080344 B1 KR 102080344B1 KR 1020180167363 A KR1020180167363 A KR 1020180167363A KR 20180167363 A KR20180167363 A KR 20180167363A KR 102080344 B1 KR102080344 B1 KR 102080344B1
Authority
KR
South Korea
Prior art keywords
information
evaluation information
false
online content
user
Prior art date
Application number
KR1020180167363A
Other languages
Korean (ko)
Other versions
KR20190000350A (en
Inventor
노마이클명헌
Original Assignee
(주)망고플레이트
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)망고플레이트 filed Critical (주)망고플레이트
Priority to KR1020180167363A priority Critical patent/KR102080344B1/en
Publication of KR20190000350A publication Critical patent/KR20190000350A/en
Application granted granted Critical
Publication of KR102080344B1 publication Critical patent/KR102080344B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0278Product appraisal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Abstract

본 발명은 특정 서비스 제공자, 특정 서비스, 글, 사진, 책, 음식점이나 카페와 같은 맛집을 포함한 상점, 영화 등과 관련된 온라인 콘텐츠의 허위 평가 정보 적발 시스템, 장치, 방법 및 프로그램에 관한 것이다. 이를 위하여, 온라인 콘텐츠가 업로드 되고 사용자가 접근하여 온라인 콘텐츠에 대한 평가 정보를 입력할 수 있도록 사용자의 클라이언트와 연결되는 플랫폼 서비스에 구성되고, 온라인 콘텐츠의 허위 평가 정보의 적발을 위하여, 특정 온라인 콘텐츠 또는 특정 사용자에 대응되는 판정 보조 정보를 생성하는 판정 보조 정보 생성 모듈; 및 플랫폼 서비스에 구성되고, 판정 보조 정보 생성 모듈과 연결되어 판정 보조 정보를 수신받고, 판정 보조 정보를 토대로 온라인 콘텐츠에 허위 평가 정보가 입력되었는지 여부 또는 사용자가 허위 평가 정보를 입력하였는지 여부를 판정하는 허위 평가 정보 판정 모듈;을 포함하는, 허위 평가 정보 적발 장치가 제공될 수 있다. 이에 따르면, 플랫폼 서비스에서 온라인 콘텐츠에 대한 허위 평가 정보가 자동으로 적발될 수 있게 되는 효과가 발생된다.The present invention relates to a system, apparatus, method and program for detecting false evaluation information of online content related to a specific service provider, a specific service, a text, a photo, a book, a store including a restaurant such as a restaurant or a cafe, a movie, and the like. To this end, the online content is uploaded and configured in a platform service connected to the user's client so that the user can access and enter evaluation information on the online content, and for the detection of false evaluation information of the online content, A determination assistance information generation module for generating determination assistance information corresponding to a specific user; And a platform service configured to be connected with the determination assistance information generation module to receive the determination assistance information, and determine whether false evaluation information is input to the online content or whether the user inputs the false evaluation information based on the determination assistance information. False evaluation information determination module; false evaluation information detection apparatus can be provided, including. According to this, there is an effect that the false evaluation information for the online content can be automatically detected in the platform service.

Description

헤비 사용자와 허위 평가 사용자를 구분하는 온라인 콘텐츠의 허위 평가 정보 적발 장치 및 방법{An apparatus and method for detecting fraud evaluation of online contents that distinguish heavy user from fraud user}An apparatus and method for detecting fraud evaluation of online contents that distinguish heavy user from fraud user}

본 발명은 가입일로부터 평가 정보의 입력일까지의 기간 정보를 이용하여 헤비 사용자와 허위 평가 사용자를 구분하는 온라인 콘텐츠의 허위 평가 정보 적발 시스템, 장치, 방법 및 프로그램에 관한 것으로, 보다 구체적으로는 특정 서비스 제공자, 특정 서비스, 글, 사진, 책, 음식점이나 카페와 같은 맛집을 포함한 상점, 영화 등과 관련된 온라인 콘텐츠의 허위 평가 정보 적발 시스템, 장치, 방법 및 프로그램에 관한 것이다.The present invention relates to a system, apparatus, method and program for detecting false evaluation information of online content that distinguishes a heavy user from a false evaluation user by using period information from a subscription date to an input date of evaluation information, and more specifically, a specific service provider. , A system, an apparatus, a method, and a program for detecting false evaluation information of online content related to a specific service, an article, a photo, a book, a restaurant including a restaurant or a cafe, a movie, and the like.

최근, 인터넷에는 온라인 콘텐츠를 업로드하여 사용자(user)를 획득하려는 서비스 제공자들과 이러한 온라인 콘텐츠를 이용하려고 하는 사용자들이 모이는 양면 네트워크의 플랫폼 서비스들이 많이 발달되고 있다. 이러한 플랫폼 서비스에는 예를 들어 이베이(ebay)나 아마존닷컴(Amazon.com)과 같은 오픈 마켓(open market), 우버(Uber)나 에어비앤비(Airbnb)와 같은 공유 서비스, 옐프(Yelp)나 망고플레이트(Mangoplate)와 같은 맛집 정보제공 서비스 등을 의미할 수 있다. 특히 스마트폰 덕분에 기존의 web 시대보다 서비스 제공자가 되는 것이 간편해졌고, 사용자의 스마트폰의 플랫폼 서비스를 통한 온라인 콘텐츠에의 접근성이 상당히 향상되었다. 이는 인터넷상에서의 온라인 콘텐츠 및 플랫폼 서비스의 폭발적인 증가를 야기하였다. 사용자들은 이런 온라인 콘텐츠가 집적되어 있는 장과 같은 플랫폼 서비스를 모바일 애플리케이션, 모바일 웹 등을 통해 이용하여 자신이 원하는 정보를 충분히 얻을 수 있으며, 이를 통해 선택, 결정 또는 판단을 하는데 도움을 받고 있다. Recently, a lot of platform services of a double-sided network have been developed on the Internet where service providers who upload online content to acquire users and users who want to use such online content gather. These platform services include, for example, open markets such as ebay and Amazon.com, shared services such as Uber and Airbnb, and Yelp and Mango Plates. It may mean a restaurant information service such as (Mangoplate). In particular, smartphones have made it easier to become a service provider than the traditional web era, and users' access to online content through platform services on their smartphones has been significantly improved. This has led to an explosion of online content and platform services on the Internet. Users can use platform services such as the field where online contents are accumulated through mobile applications, mobile web, etc. to obtain enough information as they want, thereby helping them to select, make decisions or make judgments.

특히 사용자의 결정에 도움을 주는 것은 특정 온라인 콘텐츠에 대한 평점 또는 댓글을 이용한 다른 사용자들의 평가에 대한 정보인 평가 정보의 제공이다. 이러한 평가 정보의 제공은 이베이에서 크게 효과를 본 뒤, 아마존닷컴, 우버, 에어비앤비, 옐프 등의 플랫폼 서비스에서 사용자의 경험을 향상시키기 위해 대부분 이용하고 있는 서비스이다.In particular, the user's decision is to provide rating information, which is information about ratings of other users using ratings or comments on specific online content. Providing such evaluation information has been greatly effected on eBay, and is mostly used to improve the user's experience in platform services such as Amazon.com, Uber, Airbnb, and Yelp.

이러한 평가 정보는 특정 온라인 콘텐츠에 대한 평점 정보, 코멘트 정보(사용자 리뷰 정보, 사용자 댓글 정보를 포함), '좋아요'나 '나빠요'와 같은 호감 정보, 공유 여부 정보, 추천 정보, 조회 정보를 포함할 수 있다. 사용자는 플랫폼 서비스에 업로드 된 적어도 하나 이상의 온라인 콘텐츠를 제공받게 되는데, 온라인 콘텐츠에 대한 평가 정보가 사용자의 결정에 매우 큰 도움을 주게 되고, 이는 사용자 경험(User experience)의 향상으로 이어지게 된다. This rating information may include rating information, comment information (including user review information and user comment information) about certain online content, crush information such as 'like' or 'bad', shareability information, recommendation information, and inquiry information. Can be. The user is provided with at least one online content uploaded to the platform service, and the evaluation information on the online content is very helpful for the user's decision, which leads to an improvement of the user experience.

하지만, 이러한 온라인 콘텐츠가 모여져 있는 장인 플랫폼 서비스에 평가 정보를 제공하게 되면, 경쟁자의 악의적 평가 또는 관련자의 호의적 평가 등과 같은 특정 사용자의 허위 평가에 의해 플랫폼 서비스 자체가 레몬 마켓이 될 위험에 노출되게 된다. 특정 사용자의 허위 평가 정보는, 온라인 콘텐츠를 제공받는 사용자의 온라인 콘텐츠의 평가 정보에 대한 신뢰를 상실하게 함으로써, 온라인 콘텐츠의 생태계 자체를 위협하게 되는 것이다.However, if the evaluation information is provided to the artisan platform service where the online contents are gathered, the platform service itself is exposed to the risk of becoming a lemon market by the false evaluation of a specific user such as a malicious evaluation of a competitor or a favorable evaluation of a related person. . False evaluation information of a specific user threatens the ecosystem of the online content by losing trust in the evaluation information of the online content of the user who receives the online content.

한국 공개특허 10-2012-0101188Korea Patent Publication 10-2012-0101188 한국 공개특허 10-2013-0113038Korea Patent Publication 10-2013-0113038

하지만, 기존의 온라인 콘텐츠에 대한 평점 정보 제공은 단순히 하나의 온라인 콘텐츠에 기록된 모든 평점의 산술평균으로 수행되고 있어서 특정 사용자의 허위 평가 정보를 적발하기 어려웠다. 또한, 기존의 온라인 콘텐츠에 대한 코멘트 정보 제공이나 호감 정보 제공은 허위 평가 정보의 적발이 실질적으로 수행되고 있지 않았고, 사용자들이 자체적으로 신고하는 '신고' 기능이 이용되는 정도에 불과하였다.However, since the rating information for the existing online content is simply performed as an arithmetic mean of all ratings recorded in one online content, it is difficult to detect false rating information of a specific user. In addition, the provision of comment information and crush information on the existing online contents has not been actually carried out the detection of false evaluation information, only the extent to which the 'report' function that users report themselves is used.

따라서, 기존에는 특정 사용자의 허위 평가 정보를 적발하기 위해 각각의 온라인 콘텐츠에 대해 사람이 수동으로 해당 온라인 콘텐츠의 평점 정보, 코멘트 정보 및 호감 정보의 허위 평가 정보 여부를 판단하여 평점 산출 시 포함 여부, 사용자에게 출력 여부 등을 결정하였다.Therefore, in the past, in order to detect false rating information of a specific user, for each online content, a person manually determines whether the rating information, comment information, and affinity information of the online content is included in the calculation of the rating, The user decides whether to print or not.

위와 같이 사람이 수동으로 수행하는 허위 평가 정보의 적발 방법은 엄청난 비용(특히, 인력 비용)을 야기하고, 신속하지 못하며, 지속 가능하지 못하여 온라인 콘텐츠와 트래픽이 폭발적으로 증가하는 플랫폼 서비스의 레몬 마켓화를 막기에는 역부족이었다.As described above, the method of capturing false evaluation information manually performed by humans is a lemon marketization of platform service that causes huge costs (especially manpower costs), is not fast and sustainable, and the online content and traffic is exploding. It was not enough to prevent.

게다가, 특정 상점의 홀릭(holic)과 같은 헤비 사용자(heavy user)가 급증함에 따라, 특정 평가 정보를 입력한 사용자가 헤비 사용자인지 아니면 허위 평가 정보를 입력하는 허위 평가 사용자인지를 구분하고 분류하는 것은 기존의 방법으로는 여전히 역부족이었다. 왜냐하면, 헤비 사용자와 허위 평가 사용자의 평가 정보 입력 빈도 등의 서비스 내 사용 행태가 매우 유사하기 때문이다.In addition, as the number of heavy users such as holics in a particular store surges, it is difficult to distinguish and classify whether the user who inputs specific evaluation information is a heavy user or a false evaluation user who inputs false evaluation information. Traditional methods were still inadequate. This is because usage behaviors in the service, such as the frequency of input of evaluation information of the heavy user and the false evaluation user, are very similar.

따라서 본 발명의 목적은, 특정 서비스 제공자, 특정 서비스, 글, 사진, 책, 음식점이나 카페와 같은 맛집을 포함한 상점, 영화 등과 관련된 온라인 콘텐츠의 허위 평가 정보를 신속하게 자동으로 적발하기 위해 가입일로부터 평가 정보의 입력일까지의 기간 정보를 이용하여 헤비 사용자와 허위 평가 사용자를 구분하는 온라인 콘텐츠의 허위 평가 정보 적발 시스템, 장치, 방법 및 프로그램을 제공하는 데에 있다.Accordingly, an object of the present invention is to evaluate from a subscription to quickly and automatically detect false evaluation information of online content related to a specific service provider, a specific service, a text, a photo, a book, a store including a restaurant or a restaurant such as a cafe, a movie, and the like. The present invention provides a system, apparatus, method, and program for detecting false evaluation information of online content that distinguishes a heavy user from a false evaluation user by using the period information up to the date of inputting the information.

이하 본 발명의 목적을 달성하기 위한 구체적 수단에 대하여 설명한다.Hereinafter, specific means for achieving the object of the present invention will be described.

본 발명의 목적은, 온라인 콘텐츠가 업로드 되고 사용자가 접근하여 상기 온라인 콘텐츠에 대한 평가 정보를 입력할 수 있도록 상기 사용자의 클라이언트와 연결되는 플랫폼 서비스에 구성되고, 상기 온라인 콘텐츠의 허위 평가 정보의 적발을 위하여, 특정 온라인 콘텐츠 또는 특정 사용자에 대응되는 판정 보조 정보를 생성하는 판정 보조 정보 생성 모듈; 및 상기 플랫폼 서비스에 구성되고, 상기 판정 보조 정보 생성 모듈과 연결되어 상기 판정 보조 정보를 수신받고, 상기 판정 보조 정보를 토대로 상기 온라인 콘텐츠에 허위 평가 정보가 입력되었는지 여부 또는 상기 사용자가 허위 평가 정보를 입력하였는지 여부를 판정하는 허위 평가 정보 판정 모듈;을 포함하고, 상기 판정 보조 정보는, 각각의 온라인 콘텐츠에 입력되는 적어도 하나의 사용자의 평가 정보의 빈도 또는 각각의 사용자가 적어도 하나의 온라인 콘텐츠에 입력하는 평가 정보의 빈도에 관한 정보인 빈도 정보와, 상기 사용자가 가입 후 문제되는 평가 정보의 입력까지 얼마나 기간이 지났는지에 대한 정보 또는 가입일부터 현재까지의 평가 정보 입력 개수에 대한 정보인 사용 기간 정보를 포함하는 것을 특징으로 하는, 허위 평가 정보 적발 장치를 제공하여 달성될 수 있다.An object of the present invention is configured in a platform service connected to the client of the user so that the online content is uploaded and the user can access and input the evaluation information for the online content, the detection of false evaluation information of the online content A decision assistance information generation module for generating decision assistance information corresponding to a specific online content or a specific user; And configured to be connected to the determination assistance information generation module to receive the determination assistance information, and to determine whether false evaluation information is input to the online content based on the determination assistance information, or that the user makes false evaluation information. False evaluation information determining module for determining whether or not input, wherein the determination assistance information, the frequency of at least one user's evaluation information input to each online content or each user input to at least one online content; Frequency information, which is information on the frequency of the evaluation information, and information on how long the user has passed until the user inputs the problem information after joining, or usage period information which is information on the number of evaluation information inputs from the membership to the present. False evaluation information, characterized in that it comprises a It can be achieved by providing to the device.

본 발명의 다른 목적은, 온라인 콘텐츠가 업로드 되고 사용자가 접근하여 상기 온라인 콘텐츠에 대한 평가 정보를 입력할 수 있도록 상기 사용자의 클라이언트와 연결되는 플랫폼 서비스에 구성되고, 상기 온라인 콘텐츠의 허위 평가 정보의 적발을 위하여, 특정 온라인 콘텐츠에 대응되는 판정 보조 정보를 생성하는 판정 보조 정보 생성 모듈; 및 상기 플랫폼 서비스에 구성되고, 상기 판정 보조 정보 생성 모듈과 연결되어 상기 판정 보조 정보를 수신받고, 상기 판정 보조 정보를 토대로 상기 온라인 콘텐츠에 허위 평가 정보가 입력되었는지 여부를 판정하는 허위 평가 정보 판정 모듈;을 포함하고, 상기 판정 보조 정보는, 각각의 온라인 콘텐츠에 입력되는 적어도 하나의 사용자의 평가 정보의 빈도 또는 각각의 사용자가 적어도 하나의 온라인 콘텐츠에 입력하는 평가 정보의 빈도에 관한 정보인 빈도 정보와, 상기 사용자가 가입 후 문제되는 평가 정보의 입력까지 얼마나 기간이 지났는지에 대한 정보 또는 가입일부터 현재까지의 평가 정보 입력 개수에 대한 정보인 사용 기간 정보를 포함하며, 상기 허위 평가 정보 판정 모듈은, 상기 사용 기간 정보를 상기 빈도 정보의 가중치로 이용하는 것을 특징으로 하는, 허위 평가 정보 적발 장치를 제공하여 달성될 수 있다.Another object of the present invention is a platform service that is connected to the client of the user so that the online content is uploaded and the user can access and input the evaluation information for the online content, the detection of false evaluation information of the online content A decision aid information generation module for generating decision aid information corresponding to the specific online content; And a false evaluation information determining module, configured in the platform service, connected to the determining assistance information generating module to receive the determining assistance information, and determining whether false evaluation information is input to the online content based on the determining assistance information. Wherein the determination assistance information is frequency information that is information about a frequency of at least one user's evaluation information input to each online content or a frequency of each user's evaluation information input to at least one online content. And usage period information which is information on how long the user has passed until the user inputs the evaluation information after signing up or information about the number of evaluation information inputs from the date of joining to the present, wherein the false evaluation information determination module includes: Using the period information as a weight of the frequency information It can be achieved by providing a false evaluation information detection device, characterized in that.

본 발명의 다른 목적은, 온라인 콘텐츠가 업로드 되고 사용자가 접근하여 상기 온라인 콘텐츠에 대한 평가 정보를 입력할 수 있도록 상기 사용자의 클라이언트와 연결되는 플랫폼 서비스에 구성되고 상기 온라인 콘텐츠의 허위 평가 정보의 적발을 수행하는 허위 평가 정보 적발 장치가, 상기 클라이언트에서 특정 온라인 콘텐츠에 관한 특정 사용자의 평가 정보를 수신하는 평가 정보 수신 단계; 상기 허위 평가 정보 적발 장치의 일구성인 판정 보조 정보 생성 모듈이, 상기 온라인 콘텐츠 또는 상기 사용자에 대한 판정 보조 정보를 생성하는 판정 보조 정보 생성 단계; 및 상기 허위 평가 정보 적발 장치의 일구성인 허위 평가 정보 판정 모듈이, 상기 판정 보조 정보를 토대로 상기 온라인 콘텐츠에 허위 평가 정보가 입력되었는지 여부 또는 상기 사용자가 허위 평가 정보를 입력하였는지 여부를 판정하는 허위 평가 정보 판정 단계;를 포함하고, 상기 판정 보조 정보는, 각각의 온라인 콘텐츠에 입력되는 적어도 하나의 사용자의 평가 정보의 빈도 또는 각각의 사용자가 적어도 하나의 온라인 콘텐츠에 입력하는 평가 정보의 빈도에 관한 정보인 빈도 정보와, 상기 사용자가 가입 후 문제되는 평가 정보의 입력까지 얼마나 기간이 지났는지에 대한 정보 또는 가입일부터 현재까지의 평가 정보 입력 개수에 대한 정보인 사용 기간 정보를 포함하는 것을 특징으로 하는, 허위 평가 정보 적발 방법을 제공하여 달성될 수 있다.Another object of the present invention is to provide a platform service connected to the client of the user so that the online content is uploaded and the user can access and input the evaluation information for the online content, and to detect the false evaluation information of the online content. An evaluation information receiving step of performing, by the false evaluation information detection device, evaluation information of a specific user regarding a specific online content at the client; A determination assistance information generating step of generating, by the determination assistance information generating module which is one component of the false evaluation information detection device, the determination assistance information for the online content or the user; And a false evaluation information determining module, which is one component of the false evaluation information detecting device, determines whether false evaluation information is input to the online content or whether the user inputs false evaluation information based on the determination assistance information. An evaluation information determination step, wherein the determination assistance information is related to a frequency of at least one user's evaluation information input to each online content or a frequency of evaluation information each user inputs to at least one online content. Frequency information, which is information, and usage period information which is information on how long a period has passed until the user inputs problem information after joining, or information on the number of evaluation information inputs from the membership to the present. This can be achieved by providing a method for capturing false assessment information.

본 발명의 달느 목적은, 온라인 콘텐츠가 업로드 되고 사용자가 접근하여 상기 온라인 콘텐츠에 대한 평가 정보를 입력할 수 있도록 상기 사용자의 클라이언트와 연결되는 플랫폼 서비스에 구성되고 상기 온라인 콘텐츠의 허위 평가 정보의 적발을 수행하는 허위 평가 정보 적발 장치가, 상기 클라이언트에서 특정 온라인 콘텐츠에 관한 특정 사용자의 평가 정보를 수신하는 평가 정보 수신 단계; 상기 허위 평가 정보 적발 장치의 일구성인 판정 보조 정보 생성 모듈이, 상기 온라인 콘텐츠에 대한 판정 보조 정보를 생성하는 판정 보조 정보 생성 단계; 및 상기 허위 평가 정보 적발 장치의 일구성인 허위 평가 정보 판정 모듈이, 상기 판정 보조 정보를 토대로 상기 온라인 콘텐츠에 허위 평가 정보가 입력되었는지 여부를 판정하는 허위 평가 정보 판정 단계;를 포함하고, 상기 판정 보조 정보는, 각각의 온라인 콘텐츠에 입력되는 적어도 하나의 사용자의 평가 정보의 빈도 또는 각각의 사용자가 적어도 하나의 온라인 콘텐츠에 입력하는 평가 정보의 빈도에 관한 정보인 빈도 정보와, 상기 사용자가 가입 후 문제되는 평가 정보의 입력까지 얼마나 기간이 지났는지에 대한 정보 또는 가입일부터 현재까지의 평가 정보 입력 개수에 대한 정보인 사용 기간 정보를 포함하며, 상기 허위 평가 정보 판정 모듈은, 상기 사용 기간 정보를 상기 빈도 정보의 가중치로 이용하는 것을 특징으로 하는, 허위 평가 정보 적발 방법을 제공하여 달성될 수 있다.Another object of the present invention is to provide a platform service connected to the client of the user so that the online content is uploaded and the user can access and input the evaluation information for the online content, and to detect the false evaluation information of the online content. An evaluation information receiving step of performing, by the false evaluation information detection device, evaluation information of a specific user regarding a specific online content at the client; A determination assistance information generating step of generating, by the determination assistance information generating module, which is one component of the false evaluation information detection device, determination assistance information for the online content; And a false evaluation information determination step of determining, by the false evaluation information determination module, which is one component of the false evaluation information detection device, whether false evaluation information is input to the online content based on the determination assistance information. The supplementary information includes frequency information that is information about a frequency of at least one user's evaluation information input to each online content or a frequency of evaluation information each user inputs to at least one online content, and after the user subscribes. It includes information on how long the period has passed until the input of the evaluation information in question, or information on usage period, which is information on the number of evaluation information inputs from the membership to the present, wherein the false evaluation information determination module is configured to read the usage period information. False evaluation information, characterized in that used as a weight of the frequency information It can be achieved by providing a method to.

본 발명의 다른 목적은, 온라인 콘텐츠가 업로드 되고 사용자가 접근하여 상기 온라인 콘텐츠에 대한 평가 정보를 입력할 수 있도록 상기 사용자의 클라이언트와 연결되는 플랫폼 서비스에 구성되고 상기 온라인 콘텐츠의 허위 평가 정보의 적발을 수행하는 허위 평가 정보 적발 장치가, 상기 클라이언트에서 특정 온라인 콘텐츠에 관한 특정 사용자의 평가 정보를 수신하는 평가 정보 수신 단계; 상기 허위 평가 정보 적발 장치의 일구성인 판정 보조 정보 생성 모듈이, 상기 온라인 콘텐츠 또는 상기 사용자에 대한 판정 보조 정보를 생성하는 판정 보조 정보 생성 단계; 및 상기 허위 평가 정보 적발 장치의 일구성인 허위 평가 정보 판정 모듈이, 상기 판정 보조 정보를 토대로 상기 온라인 콘텐츠에 허위 평가 정보가 입력되었는지 여부 또는 상기 사용자가 허위 평가 정보를 입력하였는지 여부를 판정하는 허위 평가 정보 판정 단계;를 포함하고, 상기 판정 보조 정보는, 각각의 온라인 콘텐츠에 입력되는 적어도 하나의 사용자의 평가 정보의 빈도 또는 각각의 사용자가 적어도 하나의 온라인 콘텐츠에 입력하는 평가 정보의 빈도에 관한 정보인 빈도 정보와, 상기 사용자가 가입 후 문제되는 평가 정보의 입력까지 얼마나 기간이 지났는지에 대한 정보 또는 가입일부터 현재까지의 평가 정보 입력 개수에 대한 정보인 사용 기간 정보를 포함하는 것을 특징으로 하는, 허위 평가 정보 적발 방법을 컴퓨터상에서 수행하는 기록매체에 저장된 프로그램을 제공하여 달성될 수 있다.Another object of the present invention is to provide a platform service connected to the client of the user so that the online content is uploaded and the user can access and input the evaluation information for the online content, and to detect the false evaluation information of the online content. An evaluation information receiving step of performing, by the false evaluation information detection device, evaluation information of a specific user regarding a specific online content at the client; A determination assistance information generating step of generating, by the determination assistance information generating module which is one component of the false evaluation information detection device, the determination assistance information for the online content or the user; And a false evaluation information determining module, which is one component of the false evaluation information detecting device, determines whether false evaluation information is input to the online content or whether the user inputs false evaluation information based on the determination assistance information. An evaluation information determination step, wherein the determination assistance information is related to a frequency of at least one user's evaluation information input to each online content or a frequency of evaluation information each user inputs to at least one online content. Frequency information, which is information, and usage period information which is information on how long a period has passed until the user inputs problem information after joining, or information on the number of evaluation information inputs from the membership to the present. To perform computer-based methods for capturing false assessment information. This can be accomplished by providing a program stored on the lock medium.

상기한 바와 같이, 본 발명에 의하면 이하와 같은 효과가 있다.As described above, the present invention has the following effects.

첫째, 본 발명의 일실시예에 따르면, 평가 정보 입력 빈도 등의 측면에서 사용 행태가 유사한 헤비 사용자와 허위 평가 사용자가 동시에 존재하는 상황에서, 플랫폼 서비스의 온라인 콘텐츠에 대한 허위 평가 정보가 자동으로 적발될 수 있게 되는 효과가 발생된다.First, according to an embodiment of the present invention, in the situation where a heavy user and a false evaluation user having similar usage behaviors in terms of frequency of input of evaluation information exist simultaneously, false evaluation information of online contents of the platform service is automatically detected. The effect is that it becomes possible.

둘째, 본 발명의 일실시예에 따르면, 플랫폼 서비스에서 온라인 콘텐츠에 대한 허위 평가 정보의 적발이 자동으로 이루어지게 됨으로써 인력 비용을 절감할 수 있게 되는 효과가 발생된다. Secondly, according to one embodiment of the present invention, since false detection information on the online content is automatically detected in the platform service, it is possible to reduce manpower costs.

셋째, 본 발명의 일실시예에 따라 HHI(Herfindahl-Hirschman Index) 지수를 이용하는 경우, 적은 정보로 신속하게 허위 평가 정보를 자동으로 적발할 수 있게 되는 효과가 발생된다. 허위 평가 정보의 적발에서 적은 정보를 이용하여 높은 확률로 허위 평가 정보를 적발하게 되는 것은 데이터 분석의 활용성 측면에서 매우 중요한 것이다.Third, when using the Herfindahl-Hirschman Index (HHI) index in accordance with an embodiment of the present invention, there is an effect that can automatically detect the false evaluation information quickly with little information. It is very important in terms of usability of data analysis to detect false evaluation information with high probability by using less information in the detection of false evaluation information.

본 명세서에 첨부되는 다음의 도면들은 본 발명의 바람직한 실시예를 예시하는 것이며, 발명의 상세한 설명과 함께 본 발명의 기술사상을 더욱 이해시키는 역할을 하는 것이므로, 본 발명은 그러한 도면에 기재된 사항에만 한정되어 해석되어서는 아니 된다.
도 1은 본 발명의 일실시예에 따른 온라인 콘텐츠의 허위 평가 정보 적발 시스템을 도시한 블럭도,
도 2는 본 발명의 일실시예에 따른 플랫폼 서비스를 도시한 블럭도,
도 3은 본 발명의 일실시예에 따른 허위 평가 정보 적발 장치(107)를 도시한 블럭도,
도 4는 본 발명의 일실시예에 따른 온라인 콘텐츠의 허위 평가 정보 적발 방법을 도시한 것,
도 5는 식당 902의 온라인 콘텐츠에 입력된 표 1의 실제 리뷰내용을 도시한 것,
도 6은 식당 137445의 온라인 콘텐츠에 입력된 표 2의 실제 리뷰내용 일부를 도시한 것,
도 7은 실제 사용자 데이터 중 316개의 랜덤 샘플에 대한 코멘트를 입력한 식당 개수/총 코멘트 입력 개수의 비율의 분포를 나타낸 것이다.
The following drawings, which are attached to this specification, illustrate exemplary embodiments of the present invention, and together with the detailed description thereof, serve to further understand the technical spirit of the present invention. It should not be interpreted.
1 is a block diagram showing a system for detecting false evaluation information of online content according to an embodiment of the present invention;
2 is a block diagram illustrating a platform service according to an embodiment of the present invention;
3 is a block diagram showing a false evaluation information detection device 107 according to an embodiment of the present invention,
4 illustrates a method for capturing false evaluation information of online content according to an embodiment of the present invention.
5 shows the actual reviews of Table 1 entered into the online content of the restaurant 902,
FIG. 6 shows some of the actual reviews of Table 2 entered into the online content of restaurant 137445,
FIG. 7 illustrates a distribution of a ratio of the number of restaurants / total comment inputs for inputting comments on 316 random samples of actual user data.

이하 첨부된 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 본 발명을 쉽게 실시할 수 있는 실시예를 상세히 설명한다. 다만, 본 발명의 바람직한 실시예에 대한 동작원리를 상세하게 설명함에 있어서 관련된 공지기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략한다.DETAILED DESCRIPTION Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings. However, in describing in detail the operating principle of the preferred embodiment of the present invention, if it is determined that the detailed description of the related known function or configuration may unnecessarily obscure the subject matter of the present invention, the detailed description thereof will be omitted.

또한, 도면 전체에 걸쳐 유사한 기능 및 작용을 하는 부분에 대해서는 동일한 도면 부호를 사용한다. 명세서 전체에서, 특정 부분이 다른 부분과 연결되어 있다고 할 때, 이는 직접적으로 연결되어 있는 경우뿐만 아니라, 그 중간에 다른 소자를 사이에 두고, 간접적으로 연결되어 있는 경우도 포함한다. 또한, 특정 구성요소를 포함한다는 것은 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라, 다른 구성요소를 더 포함할 수 있는 것을 의미한다.In addition, the same reference numerals are used for parts having similar functions and functions throughout the drawings. Throughout the specification, when a particular part is connected to another part, this includes not only the case where it is directly connected, but also the case where it is indirectly connected with another element in between. In addition, the inclusion of a specific component does not exclude other components unless specifically stated otherwise, it means that may further include other components.

본 발명에서 '온라인 콘텐츠'는 특정 서비스 제공자의 프로필, 특정 서비스의 프로필, 글, 사진, 책, 음식점이나 카페와 같은 맛집을 포함한 상점, 영화 등과 관련된 정보를 의미할 수 있다. 사용자들은 PC 또는 스마트폰의 애플리케이션이나 웹을 통해서 이러한 온라인 콘텐츠들을 브라우징 및 탐색할 수 있다. 사용자들은 이러한 온라인 콘텐츠들에 대해 평가 정보를 제공할 수 있다.In the present invention, the 'online content' may refer to information related to a profile of a specific service provider, a profile of a specific service, a text, a photo, a book, a shop including a restaurant such as a restaurant or a cafe, a movie, and the like. Users can browse and browse these online content through applications on the PC or smartphone or the web. Users can provide rating information for these online content.

본 발명에서 '평가 정보'는 특정 온라인 콘텐츠에 대한 평점 정보, 코멘트 정보(사용자 리뷰 정보, 사용자 댓글 정보를 포함), '좋아요'나 '나빠요'와 같은 호감 정보, 공유 여부 정보, 추천 정보, 조회 정보를 포함한 사용자가 특정 온라인 콘텐츠에 대해 제공하는 정보를 의미할 수 있다. 이러한 평가 정보는 특정 온라인 콘텐츠에 대해 등급을 매기거나, 평가하거나, 제안하거나, 호감을 표시하거나, 비호감을 표시하거나, 추천하거나 비추천하는 모든 정보를 의미할 수 있다.In the present invention, 'rating information' is a rating information, comment information (including user review information, user comment information) for a particular online content, crush information such as 'like' or 'bad', sharing information, recommendation information, inquiry It may mean information provided by the user about the specific online content including the information. Such rating information may refer to any information that is rated, rated, suggested, liked, disliked, recommended, or disliked for specific online content.

본 발명에서 '플랫폼 서비스'는 온라인 콘텐츠를 업로드하여 사용자를 획득하려는 서비스 제공자들과 이러한 온라인 콘텐츠를 이용하려고 하는 사용자들이 모이는 온라인 상의 양면 네트워크를 의미할 수 있다. In the present invention, the 'platform service' may mean an online double-sided network of service providers trying to acquire users by uploading online contents and users who want to use such online contents.

온라인 콘텐츠의 허위 평가 정보 적발 시스템False information dissemination system of online content

온라인 콘텐츠의 허위 평가 정보 적발 시스템에 관하여, 도 1은 본 발명의 일실시예에 따른 온라인 콘텐츠의 허위 평가 정보 적발 시스템을 도시한 블럭도이다. 도 1에 도시된 바와 같이, 본 발명의 일실시예에 따른 온라인 콘텐츠의 허위 평가 정보 적발 시스템(100)은 클라이언트(101), 네트워크(102), 플랫폼 서비스(103)를 포함할 수 있다.Regarding a False Evaluation Information Detection System of Online Content, FIG. 1 is a block diagram illustrating a false evaluation information detection system of online content according to an embodiment of the present invention. As shown in FIG. 1, the system for detecting false information of online content according to an embodiment of the present invention 100 may include a client 101, a network 102, and a platform service 103.

클라이언트(101)는 적어도 하나 이상의 클라이언트 장치들, 예를 들어, 하나 이상의 스마트폰, 태블릿과 같은 모바일 장치, 랩탑(laptop)이나 데스크탑 PC를 포함할 수 있다. 사용자는 클라이언트(101)를 통해 온라인 콘텐츠를 브라우징/탐색하거나 특정 온라인 콘텐츠의 평가 정보를 입력하게 된다.The client 101 may include at least one or more client devices, for example, one or more smartphones, mobile devices such as tablets, laptops or desktop PCs. The user browses / searches online content or inputs evaluation information of specific online content through the client 101.

네트워크(102)는 데이터 프로세싱 시스템들, 컴퓨터들, 서버들, 모바일 장치들간의 무선 혹은 유선 통신 연결을 제공하는 커넥션들을 포함할 수 있다. 본 발명의 일실시예에 따른 네트워크(102)는 클라이언트(101)와 플랫폼 서비스(103)의 유무선 통신 연결을 제공하는 커넥션으로 구성될 수 있다. 본 발명의 일실시예에 따른 네트워크(102)는 서로 통신하기 위해 TCP/IP를 사용하는 네트워크들 및 게이트웨이들의 World Wide Collection, 인트라넷, LAN, WAN을 포함할 수 있고, 인터넷을 의미할 수 있다.Network 102 may include connections that provide a wireless or wired communication connection between data processing systems, computers, servers, mobile devices. The network 102 according to an embodiment of the present invention may be configured as a connection for providing a wired or wireless communication connection between the client 101 and the platform service 103. The network 102 according to an embodiment of the present invention may include a World Wide Collection of networks and gateways using TCP / IP to communicate with each other, an intranet, a LAN, and a WAN, and may mean the Internet.

플랫폼 서비스(103)는 클라이언트(101)와 네트워크(102)를 통해 연결되어 클라이언트(101)에 온라인 콘텐츠를 송신하고, 클라이언트(101)에 의해 평가 정보를 수신받는 구성을 의미하고, 플랫폼 서비스(103)의 인터페이스는 스마트폰/Mac OS의 애플리케이션 또는 스마트폰/PC의 웹 브라우저를 통해 사용자가 이용할 수 있는 웹 페이지일 수 있다. 본 발명의 일실시예에 따른 플랫폼 서비스(103)는 각종 컴퓨터들, 서버들, 데이터베이스들, 라우터들, 스위치들, 커넥션 들 및 다른 장치를 포함할 수 있다. The platform service 103 is connected to the client 101 through the network 102 to transmit online content to the client 101, and receives the evaluation information by the client 101. ) May be a web page that is available to a user through an application of a smartphone / Mac OS or a web browser of the smartphone / PC. Platform service 103 according to an embodiment of the present invention may include various computers, servers, databases, routers, switches, connections and other devices.

도 2는 본 발명의 일실시예에 따른 플랫폼 서비스를 도시한 블럭도이다. 도 2에 도시된 바와 같이 본 발명의 일실시예에 따른 플랫폼 서비스(103)는 온라인 콘텐츠 제공 모듈(104), 온라인 콘텐츠 데이터베이스(105), 평가 정보 수신 모듈(106), 허위 평가 정보 적발 장치(107)를 포함할 수 있다.2 is a block diagram illustrating a platform service according to an embodiment of the present invention. As shown in FIG. 2, the platform service 103 according to an embodiment of the present invention includes an online content providing module 104, an online content database 105, an evaluation information receiving module 106, and a false evaluation information detecting device ( 107).

온라인 콘텐츠 제공 모듈(104)은 온라인 콘텐츠 데이터베이스(105)에서 온라인 콘텐츠를 수신하여 클라이언트(101)에 제공하는 구성이다. 온라인 콘텐츠 제공 모듈(104)에 의해 클라이언트(101)는 플랫폼 서비스(103)에서 온라인 콘텐츠를 브라우징/탐색할 수 있게 된다.The online content providing module 104 is configured to receive online content from the online content database 105 and provide it to the client 101. The online content providing module 104 allows the client 101 to browse / browse online content in the platform service 103.

온라인 콘텐츠 데이터베이스(105)는 클라이언트(101)를 통해 사용자가 제공하거나 플랫폼 서비스 제공자가 입력한 온라인 콘텐츠를 저장하는 구성을 의미할 수 있다.The online content database 105 may refer to a configuration for storing online content provided by a user through the client 101 or input by a platform service provider.

평가 정보 수신 모듈(106)은 클라이언트(101)에서 평가 정보를 수신하여 허위 평가 정보 적발 장치(107)로 평가 정보를 전달하는 모듈이다. The evaluation information receiving module 106 is a module that receives the evaluation information from the client 101 and delivers the evaluation information to the false evaluation information detection device 107.

허위 평가 정보 적발 장치(107)는 평가 정보 수신 모듈(106)에서 특정 사용자의 평가 정보를 수신하여 허위 평가 정보의 적발을 수행하는 구성이다. 도 3은 본 발명의 일실시예에 따른 허위 평가 정보 적발 장치(107)를 도시한 블럭도이다. 도 3에 도시된 바와 같이, 본 발명의 일실시예에 따른 허위 평가 정보 적발 장치(107)는 판정 보조 정보 생성 모듈(108), 평가 정보 데이터베이스(109), 허위 평가 정보 판정 모듈(110), 페널티 처리 모듈(111)을 포함할 수 있다.The false evaluation information detection device 107 is configured to receive evaluation information of a specific user in the evaluation information receiving module 106 and detect false evaluation information. 3 is a block diagram showing a false evaluation information detection device 107 according to an embodiment of the present invention. As shown in FIG. 3, the apparatus for detecting false evaluation information 107 according to an embodiment of the present invention includes a determination assistance information generating module 108, an evaluation information database 109, a false evaluation information determining module 110, It may include a penalty processing module 111.

판정 보조 정보 생성 모듈(108)은 허위 평가 정보 판정 모듈(110)에서 평가 정보를 허위 평가 정보로 분류하거나 예측하기 위해 수신된 평가 정보를 가공하여 평가를 용이하게 하는 판정 보조 정보를 생성하는 모듈이다. 판정 보조 정보 생성 모듈(108)는 평가 정보 수신 모듈(106)에서 평가 정보 및 평가 정보에 대응되는 사용자의 정보를 수신하고, 평가 정보 데이터베이스(109) 또는 허위 평가 정보 판정 모듈(110)로 용이한 평가를 위해 평가 정보를 가공한 판정 보조 정보를 송신하게 된다. The determination assistance information generation module 108 is a module that generates the determination assistance information that facilitates the evaluation by processing the evaluation information received in order to classify or predict the evaluation information as the false evaluation information in the false evaluation information determination module 110. . The determination assistance information generating module 108 receives the evaluation information and the user's information corresponding to the evaluation information in the evaluation information receiving module 106 and facilitates the evaluation information database 109 or the false evaluation information determination module 110. The determination assistance information obtained by processing the evaluation information is transmitted for evaluation.

평가 정보 데이터베이스(109)는 판정 보조 정보 생성 모듈(108), 평가 정보 수신 모듈(106), 페널티 처리 모듈(111)과 연결되어 판정 보조 정보, 평가 정보, 페널티 처리 정보를 저장하게 된다. 특히 페널티 처리 정보는 온라인 콘텐츠 제공 모듈(104), 온라인 콘텐츠 데이터베이스(105)에 전달될 수 있다.The evaluation information database 109 is connected to the determination assistance information generating module 108, the evaluation information receiving module 106, and the penalty processing module 111 to store the determination assistance information, the evaluation information, and the penalty processing information. In particular, the penalty processing information may be delivered to the online content providing module 104 and the online content database 105.

허위 평가 정보 판정 모듈(110)은 판정 보조 정보 생성 모듈(108) 및 평가 정보 수신 모듈(106)과 연결되어 판정 보조 정보 및 평가 정보를 수신하고, 이를 분석하여 허위 평가 정보 여부를 판정하는 모듈이다. 허위 평가 정보 여부는, 해당 평가 정보가 허위 평가 정보라는 것을 적발하거나, 해당 온라인 콘텐츠에 허위 평가 정보가 입력되었음을 적발하는 것을 의미할 수 있다. 특정 사용자의 평가 정보가 허위 평가 정보로 판정되는 경우, 페널티 처리 모듈(111)로 해당 평가 정보 및 대응되는 사용자 정보를 전송할 수 있다.The false evaluation information determination module 110 is connected to the determination assistance information generating module 108 and the evaluation information receiving module 106 to receive determination assistance information and evaluation information, and analyzes it to determine whether false evaluation information is present. . The false evaluation information may mean that the corresponding evaluation information is false evaluation information, or may indicate that false evaluation information is input to the online content. When the evaluation information of a specific user is determined to be false evaluation information, the corresponding evaluation information and corresponding user information may be transmitted to the penalty processing module 111.

페널티 처리 모듈(111)은 허위 평가 정보 판정 모듈(110)에서 허위 평가 정보로 판정된 평가 정보 및 대응되는 사용자 정보를 수신하여 이에 페널티 처리를 한 페널티 처리 정보를 생성하는 모듈이다.The penalty processing module 111 is a module that receives the evaluation information determined as the false evaluation information and the corresponding user information in the false evaluation information determination module 110 and generates penalty processing information that has been penalized thereto.

온라인 콘텐츠의 허위 평가 정보 적발 방법How to Catch False Assessment Information of Online Content

온라인 콘텐츠의 허위 평가 정보 적발 방법에 관하여, 도 4는 본 발명의 일실시예에 따른 온라인 콘텐츠의 허위 평가 정보 적발 방법을 도시한 것이다. 도 4에 도시된 바와 같이, 본 발명의 일실시예에 따른 온라인 콘텐츠의 허위 평가 정보 적발 방법은, 평가 정보 수신 단계(S10), 판정 보조 정보 생성 단계(S20), 허위 평가 정보 판정 단계(S30), 페널티 처리 단계(S40)를 포함할 수 있다.Regarding a method for detecting false evaluation information of online content, FIG. 4 illustrates a method for detecting false evaluation information of online content according to an embodiment of the present invention. As shown in FIG. 4, in the method for detecting false evaluation information of online content according to an embodiment of the present invention, the evaluation information receiving step S10, the determination assistance information generating step S20, and the false evaluation information determining step S30. ), It may include a penalty processing step (S40).

평가 정보 수신 단계(S10)는 클라이언트(101)에서 송신한 평가 정보를 평가 정보 수신 모듈(106)이 수신하는 단계이다.The evaluation information receiving step S10 is a step in which the evaluation information receiving module 106 receives the evaluation information transmitted from the client 101.

판정 보조 정보 생성 단계(S20)는 평가 정보 수신 모듈(106)이 수신한 평가 정보를 허위 평가 정보 적발 장치(107)에 송신하고, 허위 평가 정보 적발 장치(107)의 일구성인 판정 보조 정보 생성 모듈(108)에서 수신된 평가 정보 및 사용자 정보 등을 토대로 판정 보조 정보를 생성하는 단계이다. The determination assistance information generation step S20 transmits the evaluation information received by the evaluation information receiving module 106 to the false evaluation information detection device 107, and generates determination assistance information that is one component of the false evaluation information detection device 107. The determination assistance information is generated based on the evaluation information, the user information, and the like received by the module 108.

허위 평가 정보 판정 단계(S30)는 판정 보조 정보 생성 모듈(108)에서 생성된 판정 보조 정보를 토대로 허위 평가 정보 판정 모듈(110)이 해당 평가 정보가 허위 평가 정보라는 것을 판정하거나, 특정 온라인 콘텐츠에 대한 평가 정보가 허위 평가 정보일 확률이 높다는 것을 판정하는 단계이다. 허위 평가 정보는 온라인 콘텐츠의 평가를 상향시키려는 포지티브(positive) 허위 평가 정보, 온라인 콘텐츠의 평가를 하향시키려는 네거티브(negative) 허위 평가 정보로 구분될 수 있다.False evaluation information determination step (S30) is based on the determination assistance information generated in the determination assistance information generation module 108, the false evaluation information determination module 110 determines that the evaluation information is false evaluation information, or to the specific online content It is a step of determining that the evaluation information about the likelihood is false evaluation information. The false evaluation information may be classified into positive false evaluation information to increase the evaluation of the online content, and negative false evaluation information to lower the evaluation of the online content.

페널티 처리 단계(S40)는 허위 평가 정보 판정 모듈(110)이 해당 평가 정보 또는 해당 온라인 콘텐츠의 평가 정보 중 적어도 일부가 허위 평가 정보라는 것을 판정하는 경우, 해당 사용자, 해당 평가 정보 또는 해당 온라인 콘텐츠의 평가 정보 중 적어도 일부에 대해 페널티 처리를 하는 단계이다. 포지티브 허위 평가 정보의 경우 페널티 처리는 해당 평가 정보를 전송한 사용자의 계정을 중단 또는 취소하는 것, 해당 평가 정보에 대한 weight를 0(평가 정보 합산의 배제) 또는 음수로 주는 것을 포함할 수 있다. 네거티브 허위 평가 정보의 경우 페널티 처리는 해당 평가 정보를 전송한 사용자의 계정을 중단 또는 취소하는 것, 해당 평가 정보에 대한 weight를 0(평가 정보 합산의 배제) 또는 양수로 주는 것을 포함할 수 있다.Penalty processing step (S40), if the false evaluation information determination module 110 determines that at least some of the evaluation information or the evaluation information of the online content is false evaluation information, the user, the evaluation information or of the online content A penalty process is performed on at least some of the evaluation information. In the case of positive false evaluation information, the penalty processing may include suspending or canceling the account of the user who transmitted the evaluation information, and giving a weight for the evaluation information to 0 (excluding the sum of evaluation information) or negative. In the case of negative false evaluation information, the penalty processing may include suspending or canceling the account of the user who sent the evaluation information, and giving the weight of the evaluation information as 0 (excluding the sum of evaluation information) or a positive number.

본 발명의 일실시예에 따른 온라인 콘텐츠의 허위 평가 정보 적발 방법이 컴퓨터 상에서 수행되는 HDD, SSD, CD-ROM, USB 등의 기록매체에 저장된 프로그램으로 구성될 수 있다.According to an embodiment of the present invention, a method for capturing false evaluation information of online content may include a program stored in a recording medium such as an HDD, an SSD, a CD-ROM, a USB, and the like, which is executed on a computer.

실시예Example

이하에서는 본 발명의 일실시예에 따른 온라인 콘텐츠의 허위 평가 정보 적발 시스템, 장치, 방법 및 프로그램의 구체적인 실시예를 기재한다. Hereinafter, a specific embodiment of a system, apparatus, method, and program for detecting false evaluation information of online content according to an embodiment of the present invention will be described.

판정 보조 정보와 관련하여, 본 발명의 일실시예에 따른 온라인 콘텐츠의 허위 평가 정보 적발 시스템의 일구성인 판정 보조 정보 생성 모듈(108)에서 생성될 수 있는 판정 보조 정보는, 코멘트 정보(댓글 정보, 리뷰 정보 등)의 텍스트 마이닝 정보, 평가 정보의 빈도 정보, 사용자 간 네트워크 정보, 사용자의 사용행태 정보를 포함할 수 있다.Regarding the determination assistance information, the determination assistance information that may be generated by the determination assistance information generating module 108 which is one component of the false evaluation information detection system of the online content according to one embodiment of the present invention is comment information (comment information). , Textual mining information of the review information, etc.), frequency information of the evaluation information, network information between users, and usage behavior information of the user.

(1) 코멘트/리뷰 정보(1) Comment / Review Information

텍스트 마이닝 정보를 판정 보조 정보로 제공하는 것과 관련하여, 평가 정보 중 코멘트/리뷰 정보의 텍스트 마이닝을 통해 코멘트/리뷰 정보의 포지티브 및 네거티브 정도에 대해 감성 분석(Sentimental analysis)할 수 있고, 이러한 코멘트/리뷰 정보의 감성 분석 결과를 통해 특정 감성의 코멘트/리뷰의 빈도 정보가 판정 보조 정보로 허위 평가 정보 판정 모듈(110)에 제공될 수 있다.Regarding providing the text mining information as the judgment aid information, the textual mining of the comment / review information among the evaluation information enables the emotional analysis of the positive and negative degree of the comment / review information, and the comment / Through the emotion analysis result of the review information, the frequency information of the comment / review of a specific emotion may be provided to the false evaluation information determination module 110 as decision assistance information.

또는 기존에 허위 평가 정보로 판정되었던 코멘트/리뷰 정보에 여러 속성(attribute)을 부여하여 유사한 패턴을 보이는 코멘트/리뷰 정보를 허위 평가 정보로 판정할 수 있고, 이를 위해 여러 분류 모델에서 Supervised Machine Learning 중 하나가 이용될 수 있다. 이러한 경우, 기존의 허위 평가 정보와 입력된 평가 정보가 동일한 그룹으로 분류되면 이러한 분류 정보가 판정 보조 정보로 허위 평가 정보 판정 모듈(110)에 제공될 수 있다. 코멘트/리뷰 정보에 포함될 수 있는 속성으로는, 코멘트/리뷰의 길이, 코멘트/리뷰의 감성 분석 정보, 코멘트/리뷰의 입력에 걸린 시간, 코멘트/리뷰에의 이모티콘 사용 여부 등이 있을 수 있다.Alternatively, the comment / review information showing a similar pattern may be determined as the false evaluation information by assigning a plurality of attributes to the comment / review information previously determined as false evaluation information. One can be used. In this case, when the existing false evaluation information and the input evaluation information are classified into the same group, the classification information may be provided to the false evaluation information determination module 110 as decision assistance information. Attributes that may be included in the comment / review information may include a length of the comment / review, emotion analysis information of the comment / review, a time taken for input of the comment / review, and whether to use an emoticon in the comment / review.

또는, 기존의 평가 정보와 새롭게 수신된 평가 정보에 여러 속성을 부여한 뒤 클러스터링하고, 해당 평가 정보가 포함된 클러스터의 허위 평가 정보의 확률을 이용할 수 있다. 이를 위해 Unsupervised Machine Learning의 여러 모델 중 하나가 활용될 수 있다. 이에 따르면 특정 평가 정보가 수신되는 경우, 해당 평가 정보가 속하는 클러스터의 허위 평가 정보의 확률값이 판정 보조 정보로서 허위 평가 정보 판정 모듈(110)에 제공될 수 있다. 이러한 경우, 허위 평가 정보 판정 모듈(110)에서는 해당 평가 정보가 속하는 클러스터의 허위 평가 정보의 확률값의 컷오프 값(cut-off value)을 설정하여 허위 평가 정보를 판정할 수 있다.Alternatively, various attributes may be assigned to existing evaluation information and newly received evaluation information and clustered, and the probability of false evaluation information of the cluster including the corresponding evaluation information may be used. To this end, one of several models of Unsupervised Machine Learning can be utilized. According to this, when specific evaluation information is received, the probability value of the false evaluation information of the cluster to which the corresponding evaluation information belongs may be provided to the false evaluation information determination module 110 as decision assistance information. In this case, the false evaluation information determination module 110 may determine the false evaluation information by setting a cut-off value of a probability value of the false evaluation information of the cluster to which the corresponding evaluation information belongs.

또는, 평가 정보 중 코멘트/리뷰 정보의 텍스트 마이닝을 통해 특정 단어의 빈도/유무를 파악하여 판정 보조 정보로 허위 평가 정보 판정 모듈(110)에 제공할 수 있다. 예를 들어, 식당 주인이, 자신이 운영하는 식당과 관련된 온라인 콘텐츠에 대해 작성한 코멘트 정보에는 "보증합니다", "보장합니다" 등의 일반 사용자들이 쓰지 않는 단어들이 나오는 경우가 많고, "정성을 다하겠습니다"와 같이 자신도 모르는 사이에 존댓말을 사용하는 경우가 많다. 이러한 코멘트/리뷰의 구체적인 표현 방식에 대한 정보가 허위 평가 정보 판정 모듈(11)에 판정 보조 정보로 제공될 수 있다.Alternatively, the frequency / presence of a specific word may be grasped through text mining of the comment / review information of the evaluation information, and provided to the false evaluation information determination module 110 as decision assistance information. For example, a restaurant owner's comment information about online content related to his or her own restaurant often contains words that are not used by ordinary users, such as "guarantee" and "guarantee," "I often use reverence without knowing it." Information about a specific expression method of such a comment / review may be provided to the false evaluation information determination module 11 as decision assistance information.

(2) 평가 정보의 빈도 정보(2) Frequency information of evaluation information

평가 정보의 빈도 정보를 판정 보조 정보로 제공하는 것과 관련하여, 허위 평가 정보 판정 모둘(110)에 평가 정보의 빈도 정보가 판정 보조 정보로 제공되면 급격하게 평가 정보의 빈도가 상승되는 경우, 해당 온라인 콘텐츠에 대한 적어도 일부의 평가 정보를 허위 평가 정보로 판정할 수 있다. 이는 예를 들어, 평가 정보의 빈도에 대응되는 정규분포를 구하고, 각 온라인 콘텐츠에 대해 평균적으로 평가 정보가 얼마나 나오는지에 대해 정규분포의 어느 위치인지를 분석할 수 있다. 평가 정보의 빈도가 급격하게 변화하면 해당 정규분포에서의 위치가 달라지게 된다. 본 발명의 일실시예에 따르면 이러한 빈도 정보는 날짜별 평가 정보의 개수를 예로 들 수 있다. 본 발명의 다른 실시예에 따르면, 정규분포가 아닌 확률분포, t분포, 카이분포 등의 통계 분포를 이용할 수 있다.In connection with providing the frequency information of the evaluation information as the determination assistance information, when the frequency information of the evaluation information is provided as the determination assistance information in the false evaluation information determination module 110, if the frequency of the evaluation information is rapidly increased, the corresponding online At least some evaluation information about the content may be determined as false evaluation information. For example, the normal distribution corresponding to the frequency of the evaluation information may be obtained, and the position of the normal distribution may be analyzed with respect to how much evaluation information is output for each online content. If the frequency of evaluation information changes drastically, the position in the normal distribution is changed. According to an embodiment of the present invention, such frequency information may be an example of the number of evaluation information for each date. According to another embodiment of the present invention, statistical distributions such as probability distribution, t distribution, and chi distribution may be used instead of the normal distribution.

(3) 사용자 간 네트워크 정보(3) network information between users

사용자 간 네트워크 정보를 판정 보조 정보로 제공하는 것과 관련하여, 네트워크 정보는 사용자 간의 소셜 네트워크 정보를 의미할 수 있다. 예를 들어, 특정 온라인 콘텐츠에 평가 정보를 입력한 사용자 간에 위치정보가 매우 유사하다면 해당 정보가 판정 보조 정보로서 허위 평가 정보 판정 모듈(110)에 제공될 수 있다. 또는, 특정 온라인 콘텐츠에 평가 정보를 입력한 사용자들끼리 모두 소셜 네트워크의 친구 관계인 경우나 입력한 사용자들끼리의 소셜 네트워크의 상호 친구(mutual friend)가 많은 경우에는 해당 정보가 판정 보조 정보로서 허위 평가 정보 판정 모듈(110)에 제공될 수 있다.With regard to providing network information between users as decision assistance information, network information may refer to social network information between users. For example, if location information is very similar among users who input evaluation information into specific online content, the information may be provided to the false evaluation information determination module 110 as decision assistance information. Alternatively, when all users who enter rating information in a particular online content are friends of a social network or when there are many mutual friends of social networks between users who input the information, the information is false as evaluation aid information. The information determination module 110 may be provided.

헌데, 허위 평가 정보를 입력하는 허위 평가 사용자들의 수법은 날로 진화하고 있다. 허위 평가 정보에 관한 적발 및 페널티가 이어지게 되자, 허위 평가 사용자들은 단기간에 모든 허위 평가 정보의 입력하지 않고, 장기간에 걸쳐서 식당과 같은 특정 온라인 콘텐츠에 허위 평가 정보를 입력하고 있는 실정이다. 이러한 상황에서 가장 적합한 문제해결 방식 중 하나로 위의 소셜 네트워크 친구 정보(연결 정보)가 이용될 수 있다. 본 발명의 일실시예에 따르면 특정 온라인 콘텐츠에 평가 정보를 입력한 사용자끼리의 연결 개수 정보가, 허위 평가 사용자의 적발에 이용될 수 있다. 이에 따르면, 허위 평가 사용자의 적발에 현저한 정확도가 발생되게 된다.By the way, the technique of the false evaluation users inputting false evaluation information is evolving day by day. As detection and penalty regarding false evaluation information continue, false evaluation users do not input all false evaluation information in a short period of time, but enter false evaluation information into specific online content such as a restaurant over a long period of time. In such a situation, the above social network friend information (connection information) may be used as one of the most suitable problem solving methods. According to an embodiment of the present invention, the number of connection information between users who input evaluation information into specific online content may be used to detect false evaluation users. According to this, remarkable accuracy is generated in the detection of the false evaluation user.

식당에 대한 온라인 콘텐츠의 예를 들면, 특정 식당 정보에 실제 평가 정보를 입력한 A, B, C, D, E가 있고, 허위 평가 정보를 입력한 ㄱ, ㄴ, ㄷ, ㄹ, ㅁ이 있다고 가정한다. 이때, 정당 평가 사용자인 A, B, C, D, E 중 친구 관계로 연결되는 커넥션 수는 2개가 있고, 가능한 최대 커넥션 수는 10개, 전체 네트워크의 친구 수는 150명, 전체 네트워크의 distinct한 친구 수는 140명(겹치지 않는 친구의 수)이라고 가정한다. 또한, 허위 평가 사용자인 ㄱ, ㄴ, ㄷ, ㄹ, ㅁ 중 친구 관계로 연결되는 커넥션 수는 8개가 있고, 가능한 최대 커넥션 수는 10개, 전체 네트워크의 친구 수는 30명, 전체 네트워크의 distinct한 친구 수는 29명이라고 가정한다. 평가 정보를 입력한 사용자끼리의 관계가 가까울수록 허위 평가 정보를 입력한 하나의 그룹이 있다고 가정할 수 있게 된다.As an example of online content for a restaurant, assume that there are A, B, C, D, and E with actual rating information for specific restaurant information, and a, b, c, d, and ㅁ with false rating information. do. At this time, there are two connections among the party evaluation users A, B, C, D, and E that are connected in a friend relationship, the maximum number of possible connections is 10, the number of friends of the whole network is 150, and the distinction of the whole network is distinct. Assume that the number of friends is 140 (the number of nonoverlapping friends). In addition, there are 8 connections with friends among the false rating users a, b, c, d, and ㅁ, the maximum number of possible connections is 10, the number of friends in the entire network is 30, the distinction in the whole network Assume that you have 29 friends. As the relationship between users who input the evaluation information becomes closer, it can be assumed that there is one group that inputs the false evaluation information.

위의 경우에서, ㄱ, ㄴ, ㄷ, ㄹ, ㅁ을 허위 평가 사용자로 적발하기 위해서, 평가 정보를 입력한 사용자끼리의 친구 관계 커넥션 수와 가능한 최대 커넥션의 수의 비(ratio)가 판정 보조 정보로 이용될 수 있다. 또는, 평가 정보를 입력한 사용자끼리의 친구 관계 커넥션 수와 전체 네트워크의 distinct한 친구 수의 비(ratio)가 판정 보조 정보로 이용될 수 있다. 또는, 평가 정보를 입력한 사용자끼리의 친구 관계 커넥션 수와 전체 네트워크의 총 친구 수의 비(ratio)가 판정 보조 정보로 이용될 수 있다. 또는, 평가 정보를 입력한 사용자끼리의 전체 네트워크의 총 친구 수와 전체 네트워크의 distinct한 친구 수의 비(ratio)가 판정 보조 정보로 이용될 수 있다.In the above case, in order to detect a, b, c, d, and k as a false evaluation user, the ratio of the number of friendship relations between the users who input the evaluation information and the maximum possible number of connections is determined by the assistant assistance information. It can be used as. Alternatively, the ratio of the number of friend relation connections between users who input the evaluation information and the number of distinct friends of the entire network may be used as the determination assistance information. Alternatively, the ratio of the number of friend relation connections between users who input the evaluation information and the total number of friends of the entire network may be used as the determination assistance information. Alternatively, a ratio of the total number of friends of the entire network and the distinct number of friends of the entire network among users who input the evaluation information may be used as the determination assistance information.

이를 위해서 본 발명의 일실시예에 따르면, 판정 보조 정보 생성 모듈(108)에서 특정 온라인 콘텐츠에 평가 정보를 업로드 한 사용자 집단에 대해 평가 정보를 입력한 사용자끼리의 친구 관계 커넥션 수와 가능한 최대 커넥션의 수의 비(ratio), 평가 정보를 입력한 사용자끼리의 친구 관계 커넥션 수와 전체 네트워크의 distinct한 친구 수의 비(ratio), 평가 정보를 입력한 사용자끼리의 친구 관계 커넥션 수와 전체 네트워크의 총 친구 수의 비(ratio) 또는 평가 정보를 입력한 사용자끼리의 전체 네트워크의 총 친구 수와 전체 네트워크의 distinct한 친구 수의 비(ratio) 중 적어도 하나를 판정 보조 정보로 생성할 수 있다. 이러한 판정 보조 정보를 토대로 허위 평가 정보 여부를 판단하는 방법으로는, ratio의 분포 또는 HHI의 분포를 이용하는 방법이 이용될 수 있다. To this end, according to an embodiment of the present invention, the decision assistance information generation module 108 has a maximum number of connection relations and the maximum number of possible connections between users who have input the evaluation information for the user group uploading the evaluation information to the specific online content. The ratio of the number of friends, the number of friendship connections between users who entered evaluation information, and the ratio of the number of distinct friends of the whole network, the total number of friendship connections between users who entered evaluation information, and the total number of networks At least one of the ratio of the number of friends or the ratio of the total number of friends of the entire network and the distinct number of friends of the entire network among users who input the evaluation information may be generated as the determination assistance information. As a method of determining whether or not the false evaluation information is based on the determination assistance information, a method using a distribution of ratio or a distribution of HHI may be used.

본 발명의 일실시예에 따라, 특정 온라인 콘텐츠에 평가 정보를 업로드 한 사용자 집단에 대해 평가 정보를 입력한 사용자끼리의 친구 관계 커넥션 수와 가능한 최대 커넥션의 수의 비(ratio)를 판정 보조 정보로 이용하게 되는 경우, 허위 평가 정보를 입력하려는 여러 명의 사용자로 구성된 허위 평가 정보 입력 단체가 하루가 아닌 특정 기간에 걸쳐서 특정 온라인 콘텐츠에 허위 평가 정보를 입력하는 경우도 적발할 수 있게 되는 효과가 발생된다.According to an embodiment of the present invention, the ratio of the number of friend-connection connections and the maximum possible number of connections between users who have input the evaluation information with respect to a group of users who have uploaded the evaluation information to specific online content is determined as the assistance information. In this case, the false evaluation information input group composed of several users who want to enter the false evaluation information can be detected even when the false evaluation information is input to specific online content over a certain period of time, rather than one day. .

(4) 사용자의 행태 정보(4) user behavior information

사용자의 행태 정보를 판정 보조 정보로 제공하는 것과 관련하여, 사용자가 플랫폼 서비스에 유입된지 몇 초내에 평가 정보를 입력하는지, 다른 온라인 콘텐츠를 브라우징하다가 평가 정보를 입력하는지, 당일 몇 번째 세션에서 평가 정보를 입력하는지, 어떤 페이지에서 평가 정보 입력으로 유입되는지 등을 분석하여 판정 보조 정보로 이용할 수 있다. 이에 따르면 특정 평가 정보가 수신되는 경우, 해당 평가 정보를 입력한 사용자의 행태 정보가 판정 보조 정보로서 허위 평가 정보 판정 모듈(110)에 제공될 수 있다. 또는, 예를 들어, 사용자가 해당 식당의 리뷰를 모두 like하면서 평가 정보를 입력하는 경우, 사용자가 특정 식당은 포지티브 평가 정보를 입력하면서 동시에 근처의 같은 종류의 식당에 대해서는 네거티브 평가 정보를 입력한 경우, 사용자가 평가 정보를 활발히 입력하는 다른 사용자들의 댓글에 전화번호/이메일 등의 연락처를 남기며 보상을 약속하는 경우 등의 사용자 행태 정보가 판정 보조 정보로서 허위 평가 정보 판정 모듈(110)에 제공될 수 있다.Regarding providing the user's behavior information as decision aid information, within a few seconds of entering the platform service, whether the user enters the evaluation information, browses other online content, enters the evaluation information, and the evaluation information in the session of the day Input information, which page is inputted into the evaluation information input, and the like can be analyzed and used as the determination assistance information. According to this, when specific evaluation information is received, behavior information of the user who inputs the evaluation information may be provided to the false evaluation information determination module 110 as decision assistance information. Or, for example, if a user enters rating information while like all of the reviews of the restaurant, the user enters positive rating information for a particular restaurant while entering negative rating information for restaurants of the same type nearby. The user behavior information, such as a case where a user promises compensation by leaving a contact number such as a phone number / email in a comment of other users who actively input evaluation information, may be provided to the false evaluation information determination module 110 as decision assistance information. have.

(5) 가입일부터 특정 평가 정보를 업로드할 때까지의 기간(5) time period from signup to upload specific rating information

특히, 특정 상점의 홀릭(holic)과 같은 헤비 사용자(heavy user)가 급증함에 따라, 특정 평가 정보를 입력한 사용자가 헤비 사용자인지 아니면 허위 평가 정보를 입력하는 허위 평가 사용자인지를 구분하고 분류하는 것은 기존의 방법으로는 여전히 역부족이었다. 왜냐하면, 헤비 사용자와 허위 평가 사용자의 평가 정보 입력 빈도 등의 서비스 내 사용 행태가 매우 유사하기 때문이다. 하지만, 본 발명의 일실시예에 따라 특정 사용자가 해당 플랫폼 서비스에 가입한 뒤 특정 평가 정보를 업로드 할 때까지의 기간에 대한 정보를 판정 보조 정보로 이용하는 경우, 헤비 사용자와 허위 평가 사용자의 구분이 용이하게 가능해지는 효과가 발생된다. 본 발명의 일실시예에 따르면, 특정 온라인 콘텐츠에 대한 평가 정보의 빈도 정보를 판정 보조 정보로 이용하는 경우 가입일과 해당 평가 정보의 입력일까지의 기간에 대한 정보도 함께 판정 보조 정보로 이용할 수 있는 것이다. 또는, 가입입부터의 리뷰 개수 정보도 가입일과 해당 평가 정보의 입력일까지의 기간에 대한 정보와 동일한 효과를 가져올 수 있다.In particular, as the number of heavy users such as holics in a specific store increases rapidly, it is difficult to distinguish and classify whether a user who inputs specific evaluation information is a heavy user or a false evaluation user who inputs false evaluation information. Traditional methods were still inadequate. This is because usage behaviors in the service, such as the frequency of input of evaluation information of the heavy user and the false evaluation user, are very similar. However, according to an embodiment of the present invention, when a specific user joins the platform service and uses information on a period until uploading specific evaluation information as the determination assistance information, the distinction between the heavy user and the false evaluation user is determined. The effect which becomes easily possible is produced. According to an embodiment of the present invention, when the frequency information of the evaluation information on the specific online content is used as the determination assistant information, the information on the joining and the period until the input date of the evaluation information may also be used as the determination assistant information. Alternatively, the information on the number of reviews from the subscription can also have the same effect as the information on the period from the date of entry of the subscription and the corresponding evaluation information.

예를 들어, 가입 후 특정 평가 정보의 업로드까지의 기간이 짧을수록 허위 평가 사용자일 확률이 높다는 통계적 결과가 도출된다는 것을 가정하는 경우, 아래와 같이 본 발명의 일실시예에 따른 기술적 특징이 수행될 수 있다. 특정 온라인 콘텐츠에 관한 평가 정보의 빈도 정보에 의해 구성되는 분포에서 특정 기간에 유독 평가 정보의 빈도가 높았다면, 단순히 빈도 정보만을 이용하는 경우에는 해당 기간이 무조건 허위 평가 정보가 입력된 기간으로 판단되게 된다. 이러한 경우, 헤비 사용자들에 의한 평가 정보를 허위 평가 정보로 오인할 수 있는 문제가 발생된다. 또한 허위 평가 정보 적발 장치에 의해 적발된 평가 정보가 허위 평가 정보가 아님을 관리자가 직접 확인해야 하므로, 인적 자원의 소모가 발생되는 문제가 발생된다. For example, if it is assumed that a statistical result is obtained that the shorter the period from the subscription to the upload of specific evaluation information, the higher the probability of being a false evaluation user, the technical feature according to an embodiment of the present invention may be performed as follows. have. If the frequency of the toxic evaluation information is high in a specific period in the distribution composed of the frequency information of the evaluation information on the specific online content, if only the frequency information is used, the period is unconditionally determined as the period in which the false evaluation information is inputted. . In this case, a problem arises in that evaluation information by the heavy users may be mistaken for false evaluation information. In addition, since the administrator must directly confirm that the evaluation information caught by the false evaluation information detection device is not false evaluation information, a problem occurs in that human resources are consumed.

하지만, 본 발명의 일실시예에 따라 특정 온라인 콘텐츠에 관한 평가 정보의 빈도 정보와 함께 가입 후 해당 평가 정보의 업로드까지의 기간에 대한 정보가 함께 판정 보조 정보로 이용되는 경우, 헤비 사용자들에 의한 평가 정보를 허위 평가 정보로 오인하는 비율이 낮아질 수 있다. 즉, 이러한 판정 보조 정보에 따르면, 본 발명의 일실시예에 따른 허위 평가 정보 적발 장치에 의해 적발된 허위 평가 정보 중 헤비 사용자들에 의한 평가 정보의 비율이 저감될 수 있다.However, according to an embodiment of the present invention, when the information on the period from the subscription to the upload of the evaluation information together with the frequency information of the evaluation information on the specific online content is used as the decision assistance information, The rate of mistaken evaluation information for false evaluation information may be lowered. That is, according to the determination assistance information, the ratio of the evaluation information by the heavy users among the false evaluation information caught by the false evaluation information detection apparatus according to an embodiment of the present invention can be reduced.

이를 위해서 본 발명의 일실시예에 따르면, 판정 보조 정보 생성 모듈(108)에서 각각의 평가 정보에 대해 해당 사용자가 가입 후 해당 평가 정보의 업로드까지 얼마나 기간이 지났는지에 대한 정보를 판정 보조 정보로 생성할 수 있다. To this end, according to an embodiment of the present invention, in the determination assistance information generation module 108, as the determination assistance information, information about how long has passed until the user uploads the evaluation information after joining the evaluation information for each evaluation information; Can be generated.

본 발명의 다른 실시예에 따르면, 가입일부터 현재까지의 리뷰/코멘트 개수가 판정 보조 정보로서 이용될 수 있고, 위와 동일한 효과를 나타낼 수 있다.According to another embodiment of the present invention, the number of reviews / comments from the date of joining to the present may be used as the determination assistance information, and the same effect as described above may be obtained.

[실시예]EXAMPLE

이하 표 1, 2는 가입일부터 특정 평가 정보를 업로드할 때까지의 기간을 판정 보조 정보로 이용하는 경우, 발생되는 효과를 입증하기 위한 실시예이다. 출원인의 실제 데이터를 근거로 하였으며, 출원인의 실제 애플리케이션 서비스인 망고플레이트에서 바로 확인할 수 있다. 개인정보 보호를 위해 닉네임은 일부 삭제하였다.Tables 1 and 2 below are examples for demonstrating the effect generated when the period from joining to uploading specific evaluation information is used as the determination assistant information. Based on the Applicant's actual data, it is immediately available on the Mango Plate, Applicant's actual application service. Some nicknames have been deleted for privacy reasons.

식당 IDRestaurant ID 식당명Name of Restaurant 사용자 IDUser ID 닉네임nickname 가입일Joined 리뷰 작성일Reviewed by 총 리뷰수Total review 902902 란***Column *** 556755556755 n*****n ***** 2016-05-16 4:38:43 AM2016-05-16 4:38:43 AM 2016-05-16 4:58:01 AM2016-05-16 4:58:01 AM 1One 902902 란***Column *** 556763556763 김*****Kim***** 2016-05-16 4:54:29 AM2016-05-16 4:54:29 AM 2016-05-16 5:03:00 AM2016-05-16 5:03:00 AM 1One 902902 란***Column *** 556786556786 박*****foil***** 2016-05-16 4:41:07 AM2016-05-16 4:41:07 AM 2016-05-16 5:11:59 AM2016-05-16 5:11:59 AM 1One 902902 란***Column *** 556785556785 정*****tablet***** 2016-05-16 6:17:23 AM2016-05-16 6:17:23 AM 2016-05-16 7:09:40 AM2016-05-16 7:09:40 AM 1One 902902 란***Column *** 556802556802 오*****Five***** 2016-05-16 7:03:27 AM2016-05-16 7:03:27 AM 2016-05-16 7:25:09 AM2016-05-16 7:25:09 AM 1One 902902 란***Column *** 557005557005 J*****J ***** 2016-05-16 2:17:43 PM2016-05-16 2:17:43 PM 2016-05-18 2:50:43 PM2016-05-18 2:50:43 PM 1One

위 표 1은 식당 ID 902인 특정 식당에 7일 이내에 6개의 리뷰가 작성된 경우를 나타낸 것이다. 리뷰 작성일을 토대로 리뷰의 빈도를 검토하면 2016.05.16에 5개의 리뷰, 2016.05.18에 1개의 리뷰가 작성된 것을 확인할 수 있다. 식당 ID 902의 리뷰 빈도를 이하에서 서술할 HHI로 나타내면 다음과 같다. HHI902 = (1/6)^2 + (5/6)^2 = 26/36Table 1 above shows a case in which six reviews are written within 7 days for a specific restaurant with restaurant ID 902. If you review the frequency of reviews based on the date of the review, you'll see 5 reviews written on May 16, 2016 and 1 review written on May 18, 2016. The frequency of reviews of restaurant ID 902 is expressed as HHI described below. HHI 902 = (1/6) ^ 2 + (5/6) ^ 2 = 26/36

식당 IDRestaurant ID 식당명Name of Restaurant 아이디ID 닉네임nickname 가입일Joined 리뷰 작성일Reviewed by 총 리뷰수Total review 137445137445 경********circa******** 2790727907 L*****L ***** 2014-08-01 4:18:26 AM2014-08-01 4:18:26 AM 2016-01-25 4:31:46 AM2016-01-25 4:31:46 AM 279279 137445137445 경********circa******** 5254452544 A*****A ***** 2015-01-05 9:50:19 AM2015-01-05 9:50:19 AM 2016-01-26 7:50:14 AM2016-01-26 7:50:14 AM 245245 137445137445 경********circa******** 435605435605 한*****One***** 2015-11-14 11:16:59 AM2015-11-14 11:16:59 AM 2016-01-26 2:36:45 PM2016-01-26 2:36:45 PM 107107 137445137445 경********circa******** 114662114662 모*****mother***** 2015-04-27 2:37:10 AM2015-04-27 2:37:10 AM 2016-01-26 2:44:13 PM2016-01-26 2:44:13 PM 498498 137445137445 경********circa******** 6546065460 K*****K ***** 2015-03-02 10:04:04 AM2015-03-02 10:04:04 AM 2016-01-26 3:48:08 PM2016-01-26 3:48:08 PM 222222 137445137445 경********circa******** 6868 Z*****Z ***** 2012-11-21 9:25:29 PM2012-11-21 9:25:29 PM 2016-01-29 1:03:08 PM2016-01-29 1:03:08 PM 571571

위 표 2는 식당 ID 137445인 특정 식당에 7일 이내에 6개의 리뷰가 작성된 경우를 나타낸 것이다. 리뷰 작성일을 토대로 리뷰의 빈도를 검토하면 2016.01.25에 1개의 리뷰, 2016.01.26에 4개의 리뷰, 2016.01.29에 1개의 리뷰가 작성된 것을 확인할 수 있다. 식당 ID 137445의 리뷰 빈도를 이하에서 서술할 HHI로 나타내면 다음과 같다. HHI137445 = (1/6)^2 + (4/6)^2 + (1/6)^2 = 18/36Table 2 above shows a case where six reviews are written within 7 days for a specific restaurant with restaurant ID 137445. If you review the frequency of reviews based on the date of the review, you'll see 1 review written on January 25, 2016, 4 reviews written on January 26, 2016, and 1 review written on January 29, 2016. The frequency of reviews of restaurant ID 137445 is expressed as HHI described below. HHI 137445 = (1/6) ^ 2 + (4/6) ^ 2 + (1/6) ^ 2 = 18/36

위에서 HHI902와 HHI137445의 값이 상당히 높고, 상호 유사한 것을 확인할 수 있다. 따라서, 본 발명의 일실시예에 따라 리뷰의 빈도 정보를 판정 보조 정보로 생성하여 허위 평가 정보를 판정하게 되면 식당 902와 식당 137445는 모두 허위 평가 정보가 입력된 온라인 콘텐츠로 판정될 수 있고, 두 식당 모두 육안 분석의 대상으로 분류될 수 있다. 빈도 정보만 가지고도 관리자가 모든 식당의 정보를 보지 않아도 되므로, 인적 자원 절감이라는 상당한 효과를 발생시키게 된다.In the above, the values of HHI 902 and HHI 137445 are quite high, and they are similar to each other. Accordingly, when the false information is determined by generating the frequency information of the review as the determination assistant information according to an embodiment of the present invention, both the restaurant 902 and the restaurant 137445 may be determined as online content in which the false evaluation information is input. All restaurants can be classified for visual analysis. The frequency information alone does not require the manager to see all the restaurants' information, resulting in significant human resource savings.

허나, 실제 리뷰 내용을 검토해보면, 식당 902가 식당 137445 보다 더 허위 평가 정보가 입력된 온라인 콘텐츠에 가깝다는 것을 확인할 수 있다. However, when reviewing the actual reviews, it can be seen that restaurant 902 is closer to online content with false rating information than restaurant 137445.

도 5는 식당 902의 온라인 콘텐츠에 입력된 표 1의 실제 리뷰내용을 도시한 것이다. 도 5에 도시된 바와 같이, 표 1의 실제 리뷰 내용은 "한번 먹으면 잊을수 없는 그맛", "^^"과 같은 인위적이고 작위적인 문구를 포함하고, "란나타이"라는 식당의 이름을 작위적으로 노출하며, "꿍팟퐁커리"와 같이 메뉴의 이름을 정확하게 인위적으로 노출하고, "맛집 찾으시는 분들 적극 추천해드립니다!"와 같이 다른 사람에게 적극적으로 추천하는 행태를 보이고 있다. 또한, 촬영된 사진의 수준이 전문가 수준인 것을 확인할 수 있다. 이러한 리뷰나 코멘트는 허위 평가 정보로 육안 판정될 수 있다.5 shows the actual review of Table 1 entered into the online content of the restaurant 902. As shown in FIG. 5, the actual review of Table 1 includes artificial and artificial phrases such as "it is unforgettable once you eat it," "^^", and exposes the name of the restaurant "Lanna Thai". He also shows the name of the menu precisely and artificially, such as "Champapon Curry" and actively recommends it to other people, such as "We recommend highly recommended restaurants." In addition, it can be confirmed that the level of the picture taken is professional. Such reviews or comments can be visually determined with false evaluation information.

도 6은 식당 137445의 온라인 콘텐츠에 입력된 표 2의 실제 리뷰내용 일부를 도시한 것이다. 도 6에 도시된 바와 같이, 표 2의 실제 리뷰 내용은 문장을 끝까지 완결하지 않는 특징이 있고, 해당 식당의 장단점이 모두 기재되어 있으며, 일반적으로 시니컬한 문제를 갖고 있고, 촬영된 사진의 수준이 일반인 수준인 것을 확인할 수 있다. 이러한 리뷰나 코멘트는 허위 평가 정보가 아닌 것으로 육안 판정될 수 있다.6 shows some of the actual reviews of Table 2 entered into the online content of restaurant 137445. As shown in Figure 6, the actual review of Table 2 is characterized by not completing the sentence to the end, all of the pros and cons of the restaurant is described, generally have a sinemic problem, the level of the picture taken You can see that the public level. Such reviews or comments can be visually determined to be not false evaluation information.

결국, 본 발명의 일실시예에 따라 리뷰 빈도 정보를 판정 보조 정보로 이용하는 경우, 수많은 식당 온라인 콘텐츠 중에서 허위 평가 정보가 입력되어 있을 확률이 높은 온라인 콘텐츠 그룹(식당 902, 식당 137445 등을 포함하는 그룹)을 판정 할수 있게 된다. 하지만, 이처럼 허위 평가 정보가 입력되어 있을 확률이 높은 온라인 콘텐츠 그룹에는 실제로 허위 평가 정보가 입력된 경우(올바른 판정, 예를 들어 식당 902)가 있고, 그렇지 않은 경우(에러 판정, 예를 들어 식당 137445)가 있다. After all, in the case of using the review frequency information as the determination assistance information according to an embodiment of the present invention, a group including an online content group (restaurant 902, restaurant 137445, etc.) having a high probability that false evaluation information is input among numerous restaurant online contents. ) Can be determined. However, online content groups that are more likely to have false ratings entered may actually have false ratings entered (correct decision, e.g. restaurant 902), and otherwise (error verdict, e.g. restaurant 137445). There is).

본 발명의 일실시예에 따라 특정 온라인 콘텐츠에 관한 평가 정보의 빈도 정보와 함께 가입 후 해당 평가 정보의 업로드까지의 기간에 대한 정보가 함께 판정 보조 정보로 이용되는 경우, 헤비 사용자들에 의한 평가 정보를 허위 평가 정보로 오인하는 비율이 낮아질 수 있다.According to an embodiment of the present invention, when the information on the period from the subscription to the upload of the evaluation information together with the frequency information of the evaluation information on the specific online content is used as the determination assistance information, the evaluation information by the heavy users The rate of mistaken for false evaluation information can be lowered.

식당 902의 경우, 리뷰 작성일을 토대로 리뷰의 빈도를 검토하면 2016.05.16에 5개의 리뷰가 모두 가입일로부터 24시간 이내에 작성되었고, 2016.05.18에 1개의 리뷰가 24시간 이후에 작성된 것을 위에서 확인할 수 있다. 식당 ID 902의 리뷰 빈도의 HHI 값은 위에서 26/36이었으나, 가입일로부터 24시간 이내에 작성된 리뷰를 허위 평가 정보로 간주하여 허위 평가 정보가 아닌 평가 정보를 무효화(nulling)하면 아래와 같은 HHI 값이 나온다. 이하에서는 허위 평가 정보가 아닌 평가 정보의 무효화가 이루어진 HHI 값을 HHI'로 명명한다.For restaurant 902, if you review the frequency of reviews based on the date of review, you can see above that all 5 reviews were written within 24 hours of joining on May 16, 2016, and 1 review was written after 24 hours on May 18, 2016. . The HHI value of the review frequency of the restaurant ID 902 was 26/36 above, but if the review written within 24 hours from the membership is regarded as false evaluation information and the evaluation information is nulled rather than the false evaluation information, the following HHI value is obtained. Hereinafter, the HHI value in which the evaluation information is invalidated rather than the false evaluation information is referred to as HHI '.

HHI'902 = 0*(1/6)^2 + 1*(5/6)^2 = 25/36HHI ' 902 = 0 * (1/6) ^ 2 + 1 * (5/6) ^ 2 = 25/36

식당 902의 경우 평가 정보의 빈도 정보 및 가입일로부터 평가일까지의 기간 정보를 이용하는 경우(HHI'), 여전히 높은 HHI 값이 나오게 되어 허위 평가 정보가 입력된 온라인 콘텐츠로 판정될 수 있다.In the case of the restaurant 902, when the frequency information of the evaluation information and the period information from the joining date to the evaluation date (HHI ') are still used, a high HHI value may still be output, and thus the false evaluation information may be determined as online content.

식당 137445의 경우, 리뷰 작성일을 토대로 리뷰의 빈도를 검토하면 2016.01.25에 1개의 리뷰, 2016.01.26에 4개의 리뷰, 2016.01.29에 1개의 리뷰 모두가 24시간 이후(특히 10일 이상)가 작성된 것을 확인할 수 있다. 식당 ID 137445의 리뷰 빈도의 HHI 값은 위에서 18/36이었으나, 가입일로부터 24시간 이내에 작성된 리뷰를 허위 평가 정보로 간주하여 허위 평가 정보가 아닌 평가 정보를 무효화(nulling)하면 아래와 같은 HHI' 값이 나온다.For restaurant 137445, if you review the frequency of reviews based on the date of review, one review on January 25, 2016, four reviews on January 26, 2016, and one review on January 29, 2016, will be available after 24 hours (especially more than 10 days). You can confirm that it was created. The HHI value of the review frequency of the restaurant ID 137445 was 18/36 above, but if the review written within 24 hours from the membership is regarded as false evaluation information and the null information is invalid, the following HHI 'value is obtained. .

HHI'137445 = 0*(1/6)^2 + 0*(4/6)^2 + 0*(1/6)^2 = 0/36HHI ' 137445 = 0 * (1/6) ^ 2 + 0 * (4/6) ^ 2 + 0 * (1/6) ^ 2 = 0/36

식당 137445의 경우, 평가 정보의 빈도 정보만을 이용한 HHI 값이 18/36으로 높았던 것에 비하여, 평가 정보의 빈도 정보 및 가입일로부터 평가일까지의 기간 정보를 이용하는 경우(HHI') 상당히 낮은 HHI 값이 나오게 되어 허위 평가 정보가 입력된 온라인 콘텐츠로 판정되지 않을 수 있다.In the case of the restaurant 137445, the HHI value using only the frequency information of the evaluation information was 18/36, which was higher than that when using the frequency information of the evaluation information and the period information from the join date to the evaluation date (HHI '). The false evaluation information may not be determined as input online content.

결국, 평가 정보의 빈도 정보만을 이용한 HHI 값보다, 평가 정보의 빈도 정보 및 가입일로부터 평가일까지의 기간 정보를 함께 이용한 HHI 값이 특정 온라인 콘텐츠에 대한 허위 평가 정보의 판정 효과가 훨씬 정확해지는 효과가 발생된다. 본 실시예에서는 본 발명의 개념에 대한 설명의 편의를 위해 HHI를 적용한 것이고, 본 발명의 내용을 한정하지 않는다.As a result, the HHI value using the frequency information of the evaluation information and the period information from the subscription date to the evaluation date is much more accurate than the HHI value using only the frequency information of the evaluation information. Is generated. In this embodiment, HHI is applied for the convenience of explanation of the concept of the present invention, and the content of the present invention is not limited.

(5) 평가 개수와 평가한 식당 개수의 비율 또는 차이(5) The ratio or difference between the number of evaluations and the number of restaurants

본 발명의 일실시예에 따르면, 판정 보조 정보는 특정 사용자가 남긴 평가 정보의 각각의 온라인 콘텐츠에 대한 빈도 분포 정보일 수 있다. 온라인 콘텐츠가 식당 정보인 경우를 예로 설명하면, 헤비 사용자는 다양한 식당에 많은 평가 정보를 입력하는 패턴을 보이는 반면, 허위 평가 사용자는 특정 식장에만 많은 평가 정보를 입력하는 패턴을 보인다. 따라서, 각각의 사용자별로 적어도 하나 이상의 온라인 콘텐츠에 대한 평가 정보의 입력 빈도의 분포 또는 비율을 확인하면, 해당 사용자가 헤비 사용자인지 아니면 허위 평가 사용자인지를 명백하게 분석할 수 있게 되는 효과가 발생된다. 따라서 본 발명의 다른 실시예에 따르면 판정 보조 정보는 특정 사용자에 대해 적어도 하나 이상의 온라인 콘텐츠에 대한 평가 정보의 입력 빈도의 분포 또는 비율일 수 있다.According to one embodiment of the present invention, the determination assistance information may be frequency distribution information for each online content of evaluation information left by a specific user. For example, when the online content is restaurant information, the heavy user shows a pattern of inputting a lot of evaluation information in various restaurants, while the false user shows a pattern of inputting a lot of evaluation information only at a specific restaurant. Therefore, if the distribution or the ratio of the input frequency of the evaluation information for the at least one or more online content for each user is confirmed, it is possible to clearly analyze whether the user is a heavy user or a false evaluation user. Therefore, according to another embodiment of the present invention, the determination assistance information may be a distribution or ratio of input frequencies of evaluation information for at least one or more online contents for a specific user.

[실시예]EXAMPLE

이하 표 3은 총 코멘트(특정 리뷰에 입력되는 댓글을 코멘트라 정의한다.)의 입력 개수와 코멘트를 입력한 식당 개수(코멘트를 입력한 온라인 콘텐츠 개수)의 비율을 판정 보조 정보로 이용하는 경우, 발생되는 효과를 입증하기 위한 실제 실시예이다. 출원인의 실제 데이터를 근거로 하였으며, 출원인의 실제 애플리케이션 서비스인 망고플레이트에서 바로 확인할 수 있다. 개인정보 보호를 위해 닉네임은 일부 삭제하였다. 본 발명의 일실시예에 따른 총 코멘트 입력 개수와 코멘트를 입력한 식당 개수의 비율은 0에서 1 사이에 정의될 수 있다.Table 3 below shows a case where the ratio of the number of inputs of the total comments (comments inputted to a specific review is defined as comments) and the number of restaurants (inputs of online content in which comments) are inputted as a comment assistance information is generated. It is a practical example to demonstrate the effect. Based on the Applicant's actual data, it is immediately available on the Mango Plate, Applicant's actual application service. Some nicknames have been deleted for privacy reasons. According to an embodiment of the present invention, the ratio of the total number of comment inputs and the number of restaurants in which a comment is input may be defined between 0 and 1.

사용자 IDUser ID 닉네임nickname 총 코멘트
입력 개수
Total comments
Input count
식당 개수Number of restaurants 비율
(식당 개수/총 코멘트 입력 개수)
ratio
(Number of restaurants / total comment input)
449089449089 오******Five****** 1515 1One 0.0670.067 520630520630 신******God****** 1414 1One 0.0710.071 523323523323 이******this****** 77 1One 0.1430.143 199760199760 J******J ****** 66 1One 0.1670.167 261309261309 Y******Y ****** 66 1One 0.1670.167 494654494654 길******way****** 66 1One 0.1670.167 541606541606 김******Kim****** 1212 55 0.4170.417

표 3에 도시된 바와 같이, 사용자 449089는 본 발명의 일실시예에 따른 플랫폼 서비스에 총 15개의 코멘트를 입력하였는데, 모두 1개의 식당에 입력한 것이었다. 그에 따라 비율(식당 개수/총 코멘트 입력 개수)는 0.067이 도출되었다. 그에 반해 사용자 541606는 본 발명의 일실시예에 따른 플랫폼 서비스에 총 12개의 코멘트를 6개의 식당에 입력하였다. 이 경우 비율은 0.417이 도출되었다.본 발명의 일실시예에 따르면, 각각의 특정 사용자별로 코멘트를 입력한 식당 개수/총 코멘트의 입력 개수의 비율이 낮으면 낮을수록 허위 평가 정보를 입력한 사용자 그룹에 가까운 것을 확인할 수 있었다. 이하의 표 4는 허위 평가 정보를 입력한 것으로 판정되는 사용자 449089의 리뷰 예를 기재한 것이다. 사용자 ID는 사용자의 식별 코드, review ID는 해당 코멘트가 달린 리뷰의 식별 코드를 의미한다.As shown in Table 3, the user 449089 inputs a total of 15 comments to the platform service according to an embodiment of the present invention, all of which were entered into one restaurant. As a result, the ratio (number of restaurants / total comment input) was 0.067. In contrast, the user 541606 inputs a total of 12 comments to six restaurants in the platform service according to an embodiment of the present invention. In this case, a ratio of 0.417 was derived. According to one embodiment of the present invention, the lower the ratio of the number of restaurants inputted to each specific user / the number of inputs of the total comments, the lower the user group who inputs false evaluation information. It was confirmed that close to. Table 4 below describes a review example of the user 449089 that is determined to have entered the false evaluation information. The user ID is the identification code of the user, and the review ID is the identification code of the review with the corresponding comment.

사용자 IDUser ID review IDreview ID 식당명Name of Restaurant 코멘트를 입력한 식당 개수/총 코멘트의 입력 개수의 비율The ratio of the number of restaurants which inputted comment / the number of input of total comment 코멘트 내용Comment content 449089449089 16452321645232 오******Five****** 0.0670.067 안녕하세요. 오******입니다^^ 저희 매장을 찾아주시고 좋은 의견 남겨주셔서 감사드립니다. 더 맛있고 건강하게 준비하도록 항상 노력하겠습니다. 앞으로도 많은 애용과 관심 부탁드립니다^^ Hello. Oh ****** ^^ Thank you for visiting our store and leaving good feedback. We will always try to prepare more delicious and healthy. Thank you for your patronage and interest in the future ^^ 449089449089 16044971604497 오******Five****** 0.0670.067 안녕하세요. 오******입니다^^ 매장 방문해 주시고 감사 리뷰까지 남겨주셔서 감사드립니다. 고객님의 의견에 힘입어 더나은 서비스 제공해 힘쓰겠습니다. 앞으로도 많은 애용 부탁드립니다. 감사합니다^^Hello. Oh ****** ^^ Thank you for visiting the store and leaving a review. We will do our best to provide better service based on your feedback. Thank you for your patronage in the future. Thank you ^^ 449089449089 15927231592723 오******Five****** 0.0670.067 안녕하세요. 오******입니다. 먼저, 고객님의 소중한 의견 감사드립니다. 의견 하나하나 놓치지 않고 귀담아 듣는 오키포키가 되도록 노력하겠습니다. 앞으로도 많은 애용 부탁드립니다. 감사합니다^^Hello. Oh ******. First of all, thank you for your valuable feedback. We will do our best to be an okipoki listening to every opinion. Thank you for your patronage in the future. Thank you ^^ 199760199760 957686957686 그******That****** 0.150.15 더욱더 노력해서 개선하겠습니다^^ 조언 감사합니다! We will try harder and better ^^ Thank you for your advice! 253973253973 11432881143288 동******copper****** 0.250.25 한번 드시러 오세요 :)Come try it out :) 375720375720 21587482158748 겁******cowardice****** 0.250.25 서비스교육을 어서 준비하도록 하겠습니다 죄송합니다..I'll prepare for service training. Sorry. 494654494654 16224871622487 코******nose****** 0.150.15 많이들 오세요 맛있고 이모님들 서비스 최?ㅋA lot of people come here and delicious aunts service Choi? 520630520630 18854881885488 신******God****** 0.050.05 선물 드릴께요 제게 문자한통 주세요^^ 010********I'll give you a present. Please give me a text. ^^ 010 ********

표 4에는 사용자 449089의 전체 코멘트 중 3개만 기재하였고, 나머지 코멘트 모두 같은 형식을 나타내고 있다. 표 4에 기재된 바와 같이, 사용자 449089는 해당 식당 관계자(대표적인 허위 평가 정보 입력 사용자)인 것이 명백하다. 결국, 사용자 449089가 해당 식당(온라인 콘텐츠)에 대해 평가한 평가 정보(예를 들어 평점, 별점)는 허위 평가 정보로 판정하고, 평점이나 별점의 합산에 패널티를 적용하는 것이 합리적이다. 본 발명의 일실시예에 따라, 코멘트를 입력한 식당 개수/총 코멘트의 입력 개수의 비율을 이용하는 경우, 위와 같이 허위 평가 정보를 입력하는 사용자를 쉽게 분류해낼 수 있다. 사용자 449089뿐만 아니라, 표 4의 다른 예시인 사용자 199760, 사용자 253973, 사용자 376720, 사용자 494654, 사용자 520630도 코멘트의 내용을 읽어보면 해당 식당 관계자인 것을 명백하게 육안 판정할 수 있다.도 7은 실제 사용자 데이터 중 316개의 랜덤 샘플에 대한 코멘트를 입력한 식당 개수/총 코멘트 입력 개수의 비율의 분포를 나타낸 것이다. 도 7에 도시된 바와 같이, 허위 평가 정보를 입력한 그룹과 허위 평가 정보가 아닌 일반 평가 정보를 입력한 그룹이 분포상에서 명확하게 구분되는 것을 확인할 수 있다. 따라서, 본 발명의 일실시예에 따르면, 각각의 특정 사용자별로 코멘트를 입력한 식당 개수/총 코멘트 입력 개수의 비율을 계산하고, 이를 분포도 상에 plot 한 뒤, 특정 cutoff value를 정의하거나, 클러스터링을 이용하여 허위 평가 정보를 입력한 사용자 그룹을 분류할 수 있다.In Table 4, only three of the user 449089's total comments are listed, and all the other comments have the same format. As shown in Table 4, it is apparent that the user 449089 is the restaurant official (representative false evaluation information input user). As a result, it is reasonable for the user 449089 to evaluate the evaluation information (eg, rating or star rating) that the user has rated for the restaurant (online content) as false evaluation information, and apply a penalty to the sum of the rating or the star rating. According to one embodiment of the present invention, when using the ratio of the number of restaurants inputted to the input number of the total comments inputted, it is possible to easily classify the user inputting the false evaluation information as described above. In addition to the user 449089, other examples in Table 4, user 199760, user 253973, user 376720, user 494654, and user 520630, can also be visually determined to be clear that the restaurant is related to the user by reading the comments. The distribution of the ratio of the number of the restaurant which inputs the comment about 316 random samples / the total number of comment input is shown. As shown in FIG. 7, it can be seen that a group in which false evaluation information is input and a group in which general evaluation information other than false evaluation information are input are clearly distinguished in a distribution. Therefore, according to an embodiment of the present invention, the ratio of the number of restaurants inputted to the total number of comments inputted for each specific user / total comment inputted number is calculated, plotted on the distribution map, and then a specific cutoff value is defined or clustering is performed. The user group may be classified by inputting false evaluation information.

(6) HHI를 이용한 허위 평가 정보의 판정(6) Determination of false evaluation information using HHI

허위 평가 정보의 판정과 관련하여, 본 발명의 일실시예에 따른 허위 정보 평가 정보 판정 모듈(110)에서의 허위 평가 정보의 판정은 HHI (HerfindahlHirschman Index)를 이용할 수 있다. 온라인 콘텐츠의 허위 평가 정보의 판정을 이용하는데, HHI 값을 사용하면 단순히 정규분포에 도시하는 것보다도 눈에 띄는 차이가 발생하게 된다. 따라서 이에 따르면 사람이 모든 온라인 콘텐츠의 평가 정보를 검토할 필요도 없이, 급격하게 평가 정도 빈도가 변화하는 온라인 콘텐츠를 찾을 수 있게 된다.Regarding the determination of the false evaluation information, the determination of the false evaluation information in the false information evaluation information determination module 110 according to an embodiment of the present invention may use the HerfindahlHirschman Index (HHI). Determination of false evaluation information of online content is used, and using the HHI value causes a noticeable difference than simply shown in the normal distribution. Therefore, according to this, without having to review the evaluation information of all the online contents, it is possible to find the online contents which change the frequency of the rating rapidly.

HHI는 특정 산업에서의 시장 집중 정도를 측정하는 방법의 하나로서, 전체 시장을 100으로 할 때 각 기업(조직)이 차지하는 시장 점유율에 제곱을 한 후 모두 더한 값이다. 이는 각 기업의 시장 점유율 자체를 가중치로 하는 시장 점유율의 가중 합이라고 할 수 있으며, 상위 기업의 시장 점유가 독점에 가까우면 가까울수록 HHI 값도 높아지고, 자유경쟁에 가까우면 가까울수록 HHI 값이 낮아진다. 일반적으로 1,800 이상을 고집중, 1,000 이하를 저집중, 그 중간을 중집중 산업이라고 한다.HHI is a measure of market concentration in a particular industry. The total market is 100, which is the square of the market share of each company (organization), plus the sum. This is a weighted sum of market share, weighted by the market share of each company itself. The closer the market share of the parent company is to monopoly, the higher the HHI, and the closer to free competition, the lower the HHI value. Generally, 1,800 or more are concentrated, 1,000 or less are concentrated, and the middle is called a centralized industry.

HHI를 평가 정보의 빈도 정보를 이용한 허위 평가 정보의 판정에 이용하는 경우, 다음 수학식 1과 같이 표현될 수 있다.When the HHI is used to determine the false evaluation information using the frequency information of the evaluation information, it can be expressed as Equation 1 below.

Figure 112019096605369-pat00001
Figure 112019096605369-pat00001

위 수학식 1에서, HHI는 HHI 값, N은 해당 온라인 콘텐츠에 평가 정보가 입력된 날(Day)의 수, Si는 날짜 i의 평가 정보 개수 점유율을 의미할 수 있다. 이러한 HHI 값으로 정규분포를 그리고, 각각의 온라인 콘텐츠를 그 정규분포에서 플로팅한 뒤, 정규분포에서의 HHI 변화를 살피면 급격하게 평가 정보 빈도가 변동하는 온라인 콘텐츠를 알아낼 수 있다. 예를 들어, 평균 하루에 1번 평가 정보가 입력되던 온라인 콘텐츠의 평가 정보 빈도가 갑자기 늘어날 때, 기존의 어떠한 방식보다도 HHI 값을 이용하는 방식에서 눈에 띄는 차이가 발생하게 된다. 수학식 1에서는 설명의 편의을 위해 Si에 대해 제곱을 취하나, n 제곱이 가능하다.In Equation 1 above, HHI may represent an HHI value, N may represent the number of days in which evaluation information is input into the online content, and S i may represent a share of the evaluation information number of the date i. By drawing a normal distribution with these HHI values, plotting each online content from the normal distribution, and looking at the HHI change in the normal distribution, it is possible to find out the online content whose rating information fluctuates rapidly. For example, when the frequency of evaluation information of online content in which the evaluation information is input once a day increases suddenly, a noticeable difference occurs in the method of using the HHI value than any conventional method. In Equation 1, the square of S i is taken for convenience of explanation, but n square is possible.

예를 들어, 총 10회의 평가 정보가 특정 온라인 콘텐츠에 입력되는 경우를 가정할 때, 만일 하루에 1회씩 평가 정보가 입력되어 총 10회가 입력되는 경우, HHI는 0.1이 된다. 하지만, 6일 동안 하루에 1회씩 평가 정보가 6회 입력되고, 2일 동안 하루에 2회씩 평가 정보가 4회 입력되면 HHI는 0.14가 된다. 1일 동안 1회의 평가 정보가 입력, 1일 동안 6회의 평가 정보가 입력, 1일 동안 3회의 평가 정보가 입력되게 되면 HHI는 0.46으로 급격하게 상승하게 된다. 이렇게 되면, 사람이 모든 식당의 평가 정보를 검토할 필요 없이, 급격하게 평가 정보 빈도가 변동하는 식당을 찾아낼 수 있게 되는 효과가 발생된다.For example, assuming that a total of 10 evaluation information is input to a specific online content, if the evaluation information is input once a day and a total of 10 times are input, the HHI is 0.1. However, if the evaluation information is input six times once a day for six days, and the evaluation information is input four times twice a day for two days, the HHI becomes 0.14. When one evaluation information is input in one day, six evaluation information is input in one day, and three evaluation information is input in one day, the HHI increases rapidly to 0.46. This has the effect of allowing a person to find a restaurant whose frequency of evaluation information fluctuates rapidly without having to review the evaluation information of all restaurants.

다른 판정 보조 정보에 대해서도 HHI가 이용될 수 있다. 예를 들어, 사용자 A는 30개의 식당에 30개의 리뷰를 남겼고, 사용자 B는 15개의 식당에 30개의 리뷰를 남긴 상황을 가정할 때, 특정 사용자에 대해 적어도 하나 이상의 온라인 콘텐츠에 대한 평가 정보의 입력 빈도의 분포 또는 점유율이 HHI로 표현되는 경우 그 차이가 극명해지는 것을 확인할 수 있다.HHI may also be used for other decision assistance information. For example, assuming that User A left 30 reviews in 30 restaurants and User B left 30 reviews in 15 restaurants, input of rating information for at least one online content for a particular user When the distribution or occupancy of the frequency is expressed by HHI, it can be seen that the difference becomes clear.

(7) 평가된 온라인 콘텐츠 중 겹치는 콘텐츠의 비율(7) The percentage of overlapping content among the rated online content

또한, 본 발명의 다른 실시예에 따르면, 문제되는 온라인 콘텐츠에 평가 정보를 업로드 한 사용자 집단에 대해, 평가 정보를 입력한 온라인 콘텐츠의 겹치는 수가 판정 보조 정보로 이용될 수 있다. 보다 구체적으로 온라인 콘텐츠가 식당 정보인 경우에, 특정 식당 정보에 평가 정보를 업로드한 특정 사용자 집단이 평가한 복수개의 식당 중에서 겹치는 식당의 비율(ratio)이 판정 보조 정보가 될 수 있다. 이러한 판정 보조 정보를 토대로 허위 평가 정보 여부를 판단하는 방법으로는, 이러한 판정 보조 정보를 토대로 군집 분석이 이루어지거나 ratio의 분포 또는 HHI의 분포를 이용하는 방법이 이용될 수 있다.In addition, according to another embodiment of the present invention, the overlapping number of online contents in which evaluation information is input may be used as determination assistance information for a user group in which evaluation information is uploaded to the online content in question. More specifically, when the online content is restaurant information, the ratio of restaurants overlapping among a plurality of restaurants evaluated by a specific user group uploading evaluation information to specific restaurant information may be determination assistance information. As a method of determining whether the false evaluation information is based on the determination assistance information, a cluster analysis may be performed based on the determination assistance information, or a method using a distribution of ratio or distribution of HHI may be used.

본 발명의 다른 실시예에 따라, 특정 식당 정보에 평가 정보를 업로드한 특정 사용자 집단이 평가한 복수개의 식당 중에서 겹치는 식당의 비율(ratio)이 판정 보조 정보로 이용되는 경우, 복수의 사용자가 상호 협력하여 허위 평가 정보를 입력하는 허위 평가 집단을 적발할 수 있는 효과가 발생된다. 이러한 허위 평가 집단은 상호 네트워크가 존재하지 않아 본 발명의 일실시예에 따른 네트워크 정보를 이용해서는 적발하기가 어렵다. 또한, 이러한 허위 평가 집단은 장기적으로 허위 평가 정보를 입력하기 때문에, 본 발명의 일실시예에 따른 빈도 정보를 이용해서는 적발하기가 어렵다. 따라서, 이러한 허위 평가 집단에 대해서는 본 발명의 다른 실시예에 따라 특정 식당 정보에 평가 정보를 업로드한 특정 사용자 집단이 평가한 복수개의 식당 중에서 겹치는 식당의 비율(ratio)을 이용하여 허위 평가 집단이라 적발하는 것이 가장 높은 정확도를 나타낼 수 있다.According to another embodiment of the present invention, when a ratio of overlapping restaurants among the plurality of restaurants evaluated by a specific user group uploading evaluation information to specific restaurant information is used as the determination assistance information, the plurality of users cooperate with each other. Thus, an effect of detecting a false evaluation group for inputting false evaluation information is generated. Such a false evaluation group is difficult to detect using the network information according to an embodiment of the present invention because there is no mutual network. In addition, since the false evaluation group inputs false evaluation information in the long term, it is difficult to detect using frequency information according to an embodiment of the present invention. Accordingly, the false evaluation group is detected as a false evaluation group by using a ratio of overlapping restaurants among a plurality of restaurants evaluated by a specific user group uploading evaluation information to specific restaurant information according to another embodiment of the present invention. To achieve the highest accuracy.

본 발명의 다른 실시예에 따라, 특정 식당 정보에 평가 정보를 업로드한 특정 사용자 집단이 평가한 복수개의 식당 중에서 겹치는 식당의 비율(ratio)이 판정 보조 정보로 이용되는 경우, 다음과 같은 단계로, 허위 평가 정보를 입력하는 사용자 집단의 적발 방법이 수행될 수 있다. 모든 사용자 중에서 평가 정보를 입력한 3개 이상의 온라인 콘텐츠가 겹치는 사용자 집단을 찾는 것은 서버나 DB에 굉장한 부하가 될 수 있다. 하지만, 이하의 방법에 따르면 서버나 DB에 발생하는 부하를 상당히 줄일 수 있는 효과가 발생된다.According to another embodiment of the present invention, when a ratio of restaurants overlapping among a plurality of restaurants evaluated by a specific user group uploading evaluation information to specific restaurant information is used as the determination assistant information, the following steps are provided. A detection method of a user group for inputting false evaluation information may be performed. Finding a group of users who overlap three or more pieces of online content with rating information among all users can be a huge load on the server or database. However, the following method can significantly reduce the load on the server or DB.

첫째, 사용자별로 평가 정보를 입력한 온라인 콘텐츠가 다른 사용자와 몇 개가 겹치는지 계산 (2인으로 그룹화)Firstly, calculate how many online contents overlapped with other users by inputting rating information for each user (grouped by 2 people)

둘째, 겹치는 온라인 콘텐츠가 특정 개수 이상인 사용자 그룹을 선별하거나 겹치는 온라인 콘텐츠의 개수/총 평가 정보 입력 개수가 사용자 2인 모두 특정 비율 이상을 만족하는 사용자 그룹을 선별 (샘플 크기 축소)Second, screening user groups that have a certain number of overlapping online contents or a number of overlapping online contents / number of total evaluation information inputs.

셋째, 2인으로 구성된 사용자 그룹의 평가 정보의 입력이 겹치는 온라인 콘텐츠의 적어도 일부와 평가한 온라인 콘텐츠가 겹치는 제3의 사용자를 n회 반복 탐색 (3인 이상의 그룹화)Third, n iterative search for at least a portion of online content where input of evaluation information of a user group consisting of two people overlaps and a third user whose evaluation online content overlaps (grouping of three or more)

본 발명의 다른 실시예에 따라 2인으로 허위 평가 정보를 입력하는 사용자 집단을 2인으로 그룹화 하고, 샘플 크기를 축소한 뒤, 2인 그룹과 평가 정보가 입력된 온라인 콘텐츠가 일부 겹치는 제3의 사용자를 탐색하여 3인 이상으로 그룹화 하는 순서로 사용자 집단을 탐색하는 경우, 서버나 DB에 발생하는 부하가 상당히 저감되어 허위 평가 정보 입력 사용자 집단의 적발이 용이해지는 효과가 발생된다.According to another embodiment of the present invention, a group of users who input false evaluation information by two persons is grouped into two persons, a sample size is reduced, and a third group in which the two groups and the online content in which the evaluation information is input partially overlaps. When searching for a user group in order of searching for users and grouping them into three or more users, the load generated on the server or DB is considerably reduced, thereby facilitating the detection of false evaluation information input user groups.

[실시예]EXAMPLE

이하, 표 5는 서로 리뷰를 업로드 한 식당이 겹치는 특정 사용자 집단의 상세 정보를 기재한 것이다. 표 5는 특정 사용자 집단에서 리뷰를 기재한 식당 정보의 겹치는 수를 판정 보조 정보로 이용하는 경우, 발생되는 효과를 입증하기 위한 실제 실시예이다. 출원인의 실제 데이터를 근거로 하였으며, 출원인의 실제 애플리케이션 서비스인 망고플레이트에서 바로 확인할 수 있다. 개인정보 보호를 위해 닉네임은 일부 삭제하였다.Hereinafter, Table 5 lists detailed information of specific user groups that overlap with restaurants uploading reviews. Table 5 is a practical example for demonstrating the effect that occurs when using the overlapping number of restaurant information for review in a specific user group as the decision assistance information. Based on the Applicant's actual data, it is immediately available on the Mango Plate, Applicant's actual application service. Some nicknames have been deleted for privacy reasons.

사용자 IDUser ID 닉네임nickname 리뷰 날짜Review date 사용자 총 리뷰수User total reviews 대표 리뷰 내용Representative review contents 557404557404 박******foil****** 2016-05-17 12:28:02 PM 등 3회3 times including 2016-05-17 12:28:02 PM 33 보쌈이 기가막힌집푸짐한 쌈채소와 막삶은 수육에 동동주한잔그리고 마무리로 막국수 한그릇난 여기면 행복해Bossa's splendid savory vegetables, freshly boiled fish, a cup of Dong Dongju 557432557432 승******W ****** 2016-05-17 1:25:12 PM 등 3회2016-05-17 1:25:12 PM 3 times 33 더운날엔 여기보쌈에다가 얼음동동주와 오무술막국수면 끝.On a hot day, it's packed with ice dongdongju and Omusul Makguksu. 557735557735 박******foil****** 2016-05-18 9:00:50 AM 등 3회2016-05-18 9:00:50 AM 3 times 33 진짜 먹어본 보쌈중에 역대급으로 맛있어요! 막국수도 짱짱짱It's delicious all the time I've eaten it! Makguksu-chan 65577356557735 이******this****** 2016-05-18 9:05:29 AM 등 3회2016-05-18 9:05:29 AM 3 times 33 살아있는 홍게 25000원 무한리필! 25000원으러 배터지게먹고 왔어요. 부담스러울땐 점심특선으로 홍게라면도 짱! 화장실도 너무 깨끗해서 좋아요♡Live red crab 25,000 won unlimited refills! I ate it for 25,000 won. When you're in a hurry, you can also enjoy crab ramen for lunch! The bathroom is so clean 558123558123 *찬******cold***** 2016-05-19 7:04:46 AM 등 3회2016-05-19 7:04:46 AM 3 times 33 시골풍경이참좋은맛집Delicious Rural Scenery 588272588272 *채******pick***** 2016-05-19 12:13:43 PM 등 3회3 times including 2016-05-19 12:13:43 PM 33 우리식구 단골집 오수물막국수 다이어트의 최대강적 하지만 난 보쌈과 막국수면 돼지가되어도행복해 ㅋㅋMy family's regular house sesame water Makguksu diet is the strongest but I am happy even if you become a bossam and Makguksu noodles ㅋㅋ 588899588899 *혜****** Benefit ***** 2016-05-21 1:56:34 AM 등 3회2016-05-21 1:56:34 AM 3 times 33 춘천여행의 단골 막국수집 보쌈이 맛있는집막국수는 당연 짱이요Of course, the traditional Makguksu noodle restaurant in Chuncheon is delicious. 588912588912 사******four****** 2016-05-21 2:02:18 AM
등 3회
2016-05-21 2:02:18 AM
3 times
33 풍성한 쌈채소에 따끈한 수육 아삭한 무채의환상콜라보 보쌈의 진리The truth of Bosamu's fantastic collaboration of boiled meat and vegetables

표 5에 도시된 바와 같이, 8명의 사용자로 이루어진 사용자 집단이 3개의 식당에 대해서 돌아가면서 서로 다른 날짜에 각각의 식당에 대한 좋은 평가를 남겨주고 있는 것을 확인할 수 있다. 3개의 식당은 각각 식당 ID 141464의 오수물 막국수, 식당 ID 141642의 샘밭촌놈, 식당 ID 258706의 오수물막국수이다. 표 5에 기재된 사용자 집단은, 각각의 사용자가 모두 사용자 총 리뷰수와 겹치는 식당의 수가 같을 정도로 목적이 분명한 것을 확인할 수 있다. 그 목적은 바로 해당 식당 그룹에 좋은 평가를 입력하기 위해서이다.As shown in Table 5, it can be seen that a user group consisting of eight users rotates about three restaurants, leaving a good rating for each restaurant on different dates. The three restaurants are sewage Makguksu with Restaurant ID 141464, Sambat Village with Restaurant ID 141642, and Sewage Makguksu with Restaurant ID 258706. The user group shown in Table 5 can confirm that the purpose is so clear that each user has the same number of restaurants that all overlap with the total user reviews. The purpose is to enter a good rating for that restaurant group.

위에서 검토한 평가 정보의 빈도 정보를 이용하게 되면, 해당 리뷰들이 하루에 모두 작성된 것이 아니라 다른 날짜에 분산되어 작성된 것이므로, 허위 평가 정보를 잡아내기 어려운 집단행동이다. 하지만, 본 발명의 다른 실시예에 따라 서로 리뷰를 업로드 한 식당이 겹치는 특정 사용자 집단의 정보를 분석하게 되면, 허위 평가 정보가 다양한 날짜에 입력된다고 하더라도 허위 평가 정보로 판정할 수 있게 되는 효과가 발생된다.When the frequency information of the evaluation information reviewed above is used, it is difficult to catch false evaluation information because the reviews are not written in one day but distributed in different dates. However, when analyzing the information of a specific user group overlapping restaurants uploaded reviews, according to another embodiment of the present invention, even if the false rating information is input on various dates, it is possible to determine the false rating information. do.

표 5에 기재된 리뷰 각각을 읽어보면 허위 평가 정보인지 여부를 판단하기 매우 어렵게 기재되어 있다. 본 발명의 다른 실시예에 따라 서로 리뷰를 업로드 한 식당이 겹치는 특정 사용자 집단의 상세 정보를 검토하게 되면, 실제 리뷰를 보고도 허위 평가 정보인지 판정하기 어려운 경우에도 허위 평가 정보를 잡아낼 수 있는 효과가 발생된다.When reading each of the reviews described in Table 5, it is very difficult to determine whether or not it is false evaluation information. According to another embodiment of the present invention, when reviewing detailed information of a specific user group that overlaps restaurants uploaded with each other, even if the actual review is difficult to determine whether the false rating information is effective, the false rating information can be caught. Is generated.

이상에서 설명한 바와 같이, 본 발명이 속하는 기술 분야의 통상의 기술자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 상술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로서 이해해야만 한다. 본 발명의 범위는 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함하는 것으로 해석되어야 한다.As described above, those skilled in the art will appreciate that the present invention can be implemented in other specific forms without changing the technical spirit or essential features. Therefore, the above-described embodiments are to be understood in all respects as illustrative and not restrictive. The scope of the present invention is shown by the following claims rather than the detailed description, and it should be construed that all changes or modifications derived from the meaning and scope of the claims and equivalent concepts are included in the scope of the present invention.

100: 온라인 콘텐츠의 허위 평가 정보 적발 시스템
101: 클라이언트
102: 네트워크
103: 플랫폼 서비스
104: 온라인 콘텐츠 제공 모듈
105: 온라인 콘텐츠 데이터베이스
106: 평가 정보 수신 모듈
107: 허위 평가 정보 적발 장치
108: 판정 보조 정보 생성 모듈
109: 평가 정보 데이터베이스
110: 허위 평가 정보 판정 모듈
111: 페널티 처리 모듈
100: system for capturing false evaluation information of online content
101: client
102: network
103: platform services
104: online content delivery module
105: Online content database
106: evaluation information receiving module
107: false evaluation information detection device
108: judgment assistance information generation module
109: Evaluation Information Database
110: false evaluation information determination module
111: penalty processing module

Claims (2)

온라인 콘텐츠가 업로드 되고 사용자가 접근하여 상기 온라인 콘텐츠에 대한 평가 정보를 입력할 수 있도록 상기 사용자의 클라이언트와 연결되는 플랫폼 서비스에 구성되고, 상기 온라인 콘텐츠의 허위 평가 정보의 적발을 위하여 상기 온라인 콘텐츠에 대응되는 판정 보조 정보를 생성하는 판정 보조 정보 생성 모듈; 및
상기 플랫폼 서비스에 구성되고, 상기 판정 보조 정보 생성 모듈과 연결되어 상기 판정 보조 정보를 수신받고, 상기 판정 보조 정보를 토대로 상기 온라인 콘텐츠에 허위 평가 정보가 입력되었는지 여부를 판정하는 허위 평가 정보 판정 모듈;
을 포함하고,
상기 판정 보조 정보는,
특정 온라인 콘텐츠가 특정 기간 간격으로 구분된 기간 단위 중에서 특정 기간 단위가 상기 평가 정보의 개수를 얼마나 독점하는지에 관한 정보인 제1평가 정보 독점률; 및
특정 사용자의 특정 평가 정보의 입력일이 상기 특정 사용자의 가입일로부터 기설정된 기간 이후인 상기 평가 정보의 가중치를 무효화하여 상기 특정 온라인 콘텐츠가 상기 특정 기간 간격으로 구분된 상기 기간 단위 중에서 특정 기간 단위가 상기 평가 정보의 개수를 얼마나 독점하는지에 관한 정보인 제2평가 정보 독점률;
을 포함하며,
상기 특정 온라인 콘텐츠에 대한 상기 제1평가 정보 독점률 및 상기 제2평가 정보 독점률은 아래의 수학식에 따라 계산되고,
상기 허위 평가 정보 판정 모듈은, 상기 제1평가 정보 독점률과 상기 제2평가 정보 독점률의 차이를 기초로 상기 특정 온라인 콘텐츠의 상기 평가 정보가 헤비 사용자에 의한 것인지 아니면 허위 평가 사용자에 의한 것인지를 구분하여 상기 특정 온라인 콘텐츠에 관한 허위 평가 정보 판정을 수행하며,
상기 허위 평가 정보 판정 모듈은, 상기 제1평가 정보 독점률과 상기 제2평가 정보 독점률의 차이가 특정 값 이하인 경우에 상기 특정 온라인 콘텐츠의 상기 평가 정보가 상기 허위 평가 사용자에 의한 것으로 판정하는 것을 특징으로 하는,
헤비 사용자와 허위 평가 사용자를 구분하는 온라인 콘텐츠의 허위 평가 정보 적발 장치.
[수학식]
Figure 112019096605369-pat00009

여기서, HHI는 상기 제1평가 정보 독점률 및 상기 제2평가 정보 독점률, N은 상기 특정 온라인 콘텐츠에 상기 평가 정보가 입력된 날(Day)의 수, Si는 상기 특정 기간 단위 i의 평가 정보 개수 점유율을 의미함.
And a platform service connected to the client of the user so that the online content can be uploaded and the user can access and input evaluation information about the online content, and correspond to the online content for the detection of false evaluation information of the online content. A determination assistance information generation module for generating determination assistance information to be generated; And
A false evaluation information determination module, configured to be connected to the determination assistance information generating module, to receive the determination assistance information, and to determine whether false evaluation information is input to the online content based on the determination assistance information;
Including,
The determination assistance information,
A first evaluation information monopoly rate, which is information on how much a specific period unit monopolizes the number of evaluation information among period units divided by a specific period of time; And
The specific period unit is evaluated among the period units in which the specific online content is divided into the specific period intervals by invalidating a weight of the evaluation information whose input date of specific evaluation information of a specific user is after a predetermined period from the subscription of the specific user. A second evaluation information monopoly rate, which is information on how monopolistic the number of information is;
Including;
The first evaluation information monopoly rate and the second evaluation information monopoly rate for the specific online content are calculated according to the following equation,
The false rating information determining module determines whether the rating information of the specific online content is by a heavy user or a false rating user based on a difference between the first rating information monopoly rate and the second rating information monopoly rate. Classify and perform false evaluation information determination on the specific online content,
The false evaluation information determining module determines that the evaluation information of the specific online content is caused by the false evaluation user when the difference between the first evaluation information monopoly rate and the second evaluation information monopoly rate is equal to or less than a specific value. Characterized by
Device for detecting false rating information of online content that distinguishes heavy users from false rating users.
[Equation]
Figure 112019096605369-pat00009

Here, HHI is the first evaluation information monopoly rate and the second evaluation information monopoly rate, N is the number of days that the evaluation information is input to the specific online content, S i is the evaluation of the specific period unit i Information share share.
온라인 콘텐츠가 업로드 되고 사용자가 접근하여 상기 온라인 콘텐츠에 대한 평가 정보를 입력할 수 있도록 상기 사용자의 클라이언트와 연결되는 플랫폼 서비스에 구성되고 상기 온라인 콘텐츠의 허위 평가 정보의 적발을 수행하는 허위 평가 정보 적발 장치가, 상기 클라이언트에서 온라인 콘텐츠의 평가 정보를 수신하는 평가 정보 수신 단계;
상기 허위 평가 정보 적발 장치의 일구성인 판정 보조 정보 생성 모듈이, 상기 온라인 콘텐츠에 대한 판정 보조 정보를 생성하는 판정 보조 정보 생성 단계; 및
상기 허위 평가 정보 적발 장치의 일구성인 허위 평가 정보 판정 모듈이, 상기 판정 보조 정보를 토대로 상기 온라인 콘텐츠에 허위 평가 정보가 입력되었는지 여부를 판정하는 허위 평가 정보 판정 단계;
를 포함하고,
상기 판정 보조 정보는,
특정 온라인 콘텐츠가 특정 기간 간격으로 구분된 기간 단위 중에서 특정 기간 단위가 상기 평가 정보의 개수를 얼마나 독점하는지에 관한 정보인 제1평가 정보 독점률; 및
특정 사용자의 특정 평가 정보의 입력일이 상기 특정 사용자의 가입일로부터 기설정된 기간 이후인 상기 평가 정보의 가중치를 무효화하여 상기 특정 온라인 콘텐츠가 상기 특정 기간 간격으로 구분된 상기 기간 단위 중에서 특정 기간 단위가 상기 평가 정보의 개수를 얼마나 독점하는지에 관한 정보인 제2평가 정보 독점률;
을 포함하며,
상기 특정 온라인 콘텐츠에 대한 상기 제1평가 정보 독점률 및 상기 제2평가 정보 독점률은 아래의 수학식에 따라 계산되고,
상기 허위 평가 정보 판정 단계에서 상기 허위 평가 정보 판정 모듈은, 상기 제1평가 정보 독점률과 상기 제2평가 정보 독점률의 차이를 기초로 상기 특정 온라인 콘텐츠의 상기 평가 정보가 헤비 사용자에 의한 것인지 아니면 허위 평가 사용자에 의한 것인지를 구분하여 상기 특정 온라인 콘텐츠에 관한 허위 평가 정보 판정을 수행하며,
상기 허위 평가 정보 판정 모듈은, 상기 제1평가 정보 독점률과 상기 제2평가 정보 독점률의 차이가 특정 값 이하인 경우에 상기 특정 온라인 콘텐츠의 상기 평가 정보가 상기 허위 평가 사용자에 의한 것으로 판정하는 것을 특징으로 하는,
헤비 사용자와 허위 평가 사용자를 구분하는 온라인 콘텐츠의 허위 평가 정보 적발 방법.
[수학식]
Figure 112019096605369-pat00010

여기서, HHI는 상기 제1평가 정보 독점률 및 상기 제2평가 정보 독점률, N은 상기 특정 온라인 콘텐츠에 상기 평가 정보가 입력된 날(Day)의 수, Si는 상기 특정 기간 단위 i의 평가 정보 개수 점유율을 의미함.
False evaluation information detection device configured on a platform service connected to the client of the user so that the online content is uploaded and the user can access and input the evaluation information on the online content, and perform false detection of the online content. A rating information receiving step of receiving evaluation information of online content at the client;
A determination assistance information generation step of generating, by the determination assistance information generation module, one component of the false evaluation information detection device, determination assistance information for the online content; And
A false evaluation information determining step of determining, by the false evaluation information determining module, which is one component of the false evaluation information detecting device, whether false evaluation information is input to the online content on the basis of the determination assistance information;
Including,
The determination assistance information,
A first evaluation information monopoly rate, which is information on how much a specific period unit monopolizes the number of evaluation information among period units divided by a specific period of time; And
The specific period unit is evaluated among the period units in which the specific online content is divided into the specific period intervals by invalidating a weight of the evaluation information whose input date of specific evaluation information of a specific user is after a predetermined period from the subscription of the specific user. A second evaluation information monopoly rate, which is information on how monopolistic the number of information is;
Including;
The first evaluation information monopoly rate and the second evaluation information monopoly rate for the specific online content are calculated according to the following equation,
In the false evaluation information determining step, the false evaluation information determining module determines whether the evaluation information of the specific online content is caused by a heavy user based on a difference between the first evaluation information monopoly rate and the second evaluation information monopoly rate. Determining whether or not by a false rating user to perform false judgment information determination on the specific online content,
The false evaluation information determining module determines that the evaluation information of the specific online content is caused by the false evaluation user when the difference between the first evaluation information monopoly rate and the second evaluation information monopoly rate is equal to or less than a specific value. Characterized by
A method of capturing false rating information of online content that distinguishes heavy users from false rating users.
[Equation]
Figure 112019096605369-pat00010

Here, HHI is the first evaluation information monopoly rate and the second evaluation information monopoly rate, N is the number of days that the evaluation information is input to the specific online content, S i is the evaluation of the specific period unit i Information share share.
KR1020180167363A 2018-12-21 2018-12-21 An apparatus and method for detecting fraud evaluation of online contents that distinguish heavy user from fraud user KR102080344B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180167363A KR102080344B1 (en) 2018-12-21 2018-12-21 An apparatus and method for detecting fraud evaluation of online contents that distinguish heavy user from fraud user

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180167363A KR102080344B1 (en) 2018-12-21 2018-12-21 An apparatus and method for detecting fraud evaluation of online contents that distinguish heavy user from fraud user

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020160079961A Division KR20180001163A (en) 2016-06-27 2016-06-27 Apparatus, Method, and Program for Fraud Detecting Related to an Online Content

Publications (2)

Publication Number Publication Date
KR20190000350A KR20190000350A (en) 2019-01-02
KR102080344B1 true KR102080344B1 (en) 2020-02-21

Family

ID=65021506

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180167363A KR102080344B1 (en) 2018-12-21 2018-12-21 An apparatus and method for detecting fraud evaluation of online contents that distinguish heavy user from fraud user

Country Status (1)

Country Link
KR (1) KR102080344B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220097630A (en) 2020-12-30 2022-07-08 주식회사 프리딕션 Machine learning-based fake review detection system and method, computer program and computer readable recording medium

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
USD1015637S1 (en) * 2022-07-20 2024-02-20 Jiangxi Yihuale Pen industry Co., LTD Nail brush

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120101188A (en) 2011-02-01 2012-09-13 케이비에스인터넷 주식회사 System and method for providing information of good food restaurant using smart phone
KR20130113038A (en) 2012-04-05 2013-10-15 신광윤 System and method for searching favorite restaurant using map api in a location-based way
KR101460654B1 (en) * 2012-07-19 2014-11-12 고려대학교 산학협력단 System and method for managing contents
KR102005971B1 (en) * 2012-12-13 2019-07-31 에스케이플래닛 주식회사 Influence determination system and method thereof for social network user
US9479516B2 (en) * 2013-02-11 2016-10-25 Google Inc. Automatic detection of fraudulent ratings/comments related to an application store

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220097630A (en) 2020-12-30 2022-07-08 주식회사 프리딕션 Machine learning-based fake review detection system and method, computer program and computer readable recording medium

Also Published As

Publication number Publication date
KR20190000350A (en) 2019-01-02

Similar Documents

Publication Publication Date Title
JP6480993B2 (en) Assessing claims in social networking systems
US10771575B2 (en) Method and apparatus for identifying common interest between social network users
US20230394068A1 (en) Temporal clustering of social networking content
CN105612514B (en) System and method for image classification by associating contextual cues with images
KR101009830B1 (en) Compatibility scoring of users in a social network
Quercia et al. Friendsensing: recommending friends using mobile phones
Chaniotakis et al. Mapping social media for transportation studies
US20220101203A1 (en) Training data quality for spam classification
Lorek et al. Automated credibility assessment on Twitter
KR101686830B1 (en) Tag suggestions for images on online social networks
JP2016177764A (en) Facility estimation method, device and program
US20130282811A1 (en) Providing a claims-based profile in a social networking system
US10949434B1 (en) User identification system
Chu et al. Using visualizations to explore network dynamics
Ma et al. Understanding news sharing in social media from the diffusion of innovations perspective
KR102080344B1 (en) An apparatus and method for detecting fraud evaluation of online contents that distinguish heavy user from fraud user
KR102080345B1 (en) Apparatus and method for detecting fraud evaluation information of online contents judging a fraud evaluation user group using the number of overlapping evaluation online contents
Li et al. Fake reviews tell no tales? dissecting click farming in content-generated social networks
Alsudais et al. We know where you are tweeting from: Assigning a type of place to tweets using natural language processing and random forests
CN105426392B (en) Collaborative filtering recommendation method and system
JP7092194B2 (en) Information processing equipment, judgment method, and program
Szomszor et al. Semantics, sensors, and the social web: The live social semantics experiments
US20160225103A1 (en) Methods, systems, and computer readable media for determining social compatibility using a selected group
KR20180001168A (en) Apparatus, Method, and Program for Fraud Detecting Related to an Online Content
KR101659611B1 (en) Device and method for providing data, and computer program for executing the method

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant