KR20090103171A - Automatic ripple filtering method - Google Patents

Automatic ripple filtering method

Info

Publication number
KR20090103171A
KR20090103171A KR1020080028591A KR20080028591A KR20090103171A KR 20090103171 A KR20090103171 A KR 20090103171A KR 1020080028591 A KR1020080028591 A KR 1020080028591A KR 20080028591 A KR20080028591 A KR 20080028591A KR 20090103171 A KR20090103171 A KR 20090103171A
Authority
KR
South Korea
Prior art keywords
comments
index
word
comment
words
Prior art date
Application number
KR1020080028591A
Other languages
Korean (ko)
Inventor
하성욱
남예슬
Original Assignee
하성욱
남예슬
장무경
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 하성욱, 남예슬, 장무경 filed Critical 하성욱
Priority to KR1020080028591A priority Critical patent/KR20090103171A/en
Publication of KR20090103171A publication Critical patent/KR20090103171A/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • G06F16/148File search processing

Abstract

PURPOSE: A method for automatically filtering replies is provided to filter malignant replies which are inserted in a bulletin board so that they cannot be displayed according to dangerous degrees of each person. CONSTITUTION: Persons who participate in an experiment subjectively evaluate replies(S11). A word database of the replies is generated based on average evaluation indexes of each word which are obtained by an average evaluation index of a common word between a subject and the replies(S12). A user inclination index is measured through a depression test(S13). Evaluation indexes for a newly inputted subject and replies are automatically calculated based on the average evaluation indexes of each word(S14).

Description

댓글 자동 필터링 방법{Automatic ripple filtering method}Automatic ripple filtering method

본 발명은 댓글 필터링 방법에 관한 것으로서, 보다 상세하게는 자살의 여러 원인 중 개인적인 모멸감과 수치심을 일으키는 인터넷 댓글에 대한 자동 필터링 방법에 관한 것이다.The present invention relates to a method for filtering comments, and more particularly, to an automatic filtering method for Internet comments causing personal feelings of shame and shame among various causes of suicide.

가수 유니와 탤런트 정다빈의 자살은 유명인이기 때문에 주위에 알려진 자살 사건으로서 자살로 사망하는 전체 인구 중 빙산의 일각에 불과한 아주 미세한 수준이다. 1987년부터 1996년 사이 10년간에 걸쳐 자살과 에이즈로 인해 사망한 35 세 이하의 젊은이들의 사망자 비교 결과, 에이즈로 죽은 젊은이보다 자살로 죽은 젊은이가 거의 15,000명이나 더 많았다. 1998년에는 전세계 사망자 5,400 만 명 가운데 1.8% 가 자살 사망이었다고 한다. 이러한 자살은 15 ~ 44세 남녀의 10대 사망 원인 중 여자들은 두 번째 큰 사망 원인이고, 남자들은 네 번째 사망 원인이었다. 이러한 자살에는 심각한 정신병, 유전적 형질, 충동적이거나 폭력적인 기질, 정신 질환이 있는 경우, 조울병이 있는 경우, 감정의 기복이 있는 경우, 인생의 사건들이나 상황, 경제 생활과 직업에서 맞부딪히는 어려움, 법정 대결, 불치의 병이나 장애를 불러오는 질병, 수치심을 불러 일으키고 치욕감을 주는 상황 등 수많은 원인이 존재한다. 이들 중에서 외부 원인으로 인한 자살은 학교 폭력, 내신 성적 하락, 인터넷 댓글에 상시 노출로 인한 수치심과 모멸감 등이 있다. The suicides of singers Euni and talent Jung Da-bin are celebrities, so they are known to be a very suicidal event, and they are just the tip of the iceberg of the total population who die from suicide. A comparison of the deaths of young people under the age of 35 who died of suicide and AIDS over the decade between 1987 and 1996 found that nearly 15,000 young people died of suicide than young people who died of AIDS. In 1998, 1.8 percent of the world's 55 million fatalities were suicidal. This suicide was the second leading cause of death among women in their 15-44 year olds, with the second leading cause of death for men. These suicides include serious psychosis, genetic traits, impulsive or violent temperaments, mental illness, manic-depressive illness, emotional ups and downs, difficulties in life events and situations, economic life and occupation, There are a number of causes, including court confrontations, incurable illnesses and disabilities, conditions of shame and disgrace. Among these, suicides caused by external causes include school violence, poor grades, and shame and scorn of constant exposure to Internet comments.

의학 및 생물학과 관련된 여러 연구에서 자살을 유발하는 원인으로 인해 변화되는 생체적 요소로 세로토닌 수치, 뇌척수액의 5-HIAA 수치, 노드아드레날린계 수치, 오메가-3 필수 지방산의 수치가 존재한다는 것을 밝혀내었다. 여러 실험 대상자들에 대해 오랜 기간 조사하여 세로토닌과 5-HIAA 는 수치가 낮아질 때, 노드아드레날린계 뉴런은 개수가 현저히 줄어들 때, 오메가-3 필수 지방산의 섭취가 줄어들었을 경우에 폭력적이고 충동적인 행동을 하게 되며, 자살 위험이 현격하게 증가함을 데이터로 보여주었다. Several studies related to medicine and biology have revealed that the biologics that change due to suicide-causing factors include serotonin levels, 5-HIAA levels in cerebrospinal fluid, noradrenaline levels, and omega-3 essential fatty acids. Long-term investigations have been conducted in a number of subjects to show violent and impulsive behavior when serotonin and 5-HIAA levels are low, node adrenergic neurons are significantly reduced in number, and omega-3 essential fatty acid intake is reduced. The data showed that the risk of suicide increased significantly.

본 발명은 이와 같이 종래의 제품의 문제점을 해결하기 위한 것으로, 그 목적은 다른 여러 요소 중에서도 댓글로 인해 증가하는 자살 위험을 방지하는 댓글 자동 필터링 방법을 제공함에 있다.The present invention is to solve the problems of the conventional product as described above, the object is to provide a method for automatically filtering comments to prevent the risk of suicide due to comments among other factors.

상기한 목적을 달성하기 위하여, 본 발명에 따른 댓글 자동 필터링 방법은 (i) 실험에 참여한 사람들이 댓글들에 주관적으로 평가하고 상기 주제글과 댓글들 간의 공통 단어에 대한 평가 지수 평균으로 얻은 단어별 평균 평가 지수로 상기 댓글의 단어 데이터베이스를 생성하는 단계; (ii) 우울증 테스트를 통한 사용자 성향 지수를 측정하는 단계; (iii) 상기 단어별 평균 평가 지수를 기반으로 새로 입력된 주제글과 댓글들에 대하여 평가 지수를 자동 평가하는 단계; 및 (iv) 상기 사용자 성향 지수에 따라 상기 댓글들을 자동 필터링하는 단계를 포함하는 것을 특징으로 한다.In order to achieve the above object, the automatic comment filtering method according to the present invention includes (i) subjects who participated in the experiment subjectively to the comments and the words obtained by the average of the evaluation index for the common words between the topic and comments Creating a word database of said comment with an average rating index; (ii) measuring a user disposition index through the depression test; (iii) automatically evaluating an evaluation index on newly inputted topics and comments based on the word-based average rating index; And (iv) automatically filtering the comments according to the user propensity index.

바람직하게는, 단계 (i)에서 상기 댓글의 단어들은 상기 단어별 평균 평가 지수는 상기 평가 지수가 양수인 값들을 집합으로 구성된 양성 단어 집합, 상기 평가 지수가 음수인 값들의 집합으로 구성된 악성 단어 집합, 및 카테고리에 따라서 양성 또는 악성 단어들이 분류되며, 주제에 상관없는 악성 단어들로 구성된 별도의 집합으로 구분하여 상기 단어 데이터베이스에 저장된다. 더욱 바람직하게는, 단계 (iii)는 (iii-1) 상기 댓글들에 포함된 각 단어를 분리하는 단계; (iii-2) 상기 분리된 단어들 중 단계 (i)의 상기 단어 데이터베이스에서 존재하는 단어들 중에 포함된 단어들의 평가 점수를 모두 합산하는 단계; (iii-3) 상기 합산한 평가 지수를 상기 단어 데이터베이스에 속하는 단어 개수로 나누어 얻은 결과값을 상기 댓글들의 평가 지수로 결정하는 단계를 포함한다. Preferably, in the step (i), the words of the comment is the mean rating index for each word is a positive word set consisting of a set of values that the evaluation index is positive, a malicious word set consisting of a set of values that the negative evaluation index, And positive or malicious words are classified according to categories, and are divided into a separate set of malicious words irrespective of a subject and stored in the word database. More preferably, step (iii) comprises: (iii-1) separating each word included in the comments; (iii-2) summing all the evaluation scores of the words included among the words existing in the word database of step (i) among the separated words; (iii-3) determining a result value obtained by dividing the sum of the evaluation indexes by the number of words belonging to the word database as the evaluation index of the comments.

본 발명의 다른 실시예에 따른 댓글 자동 필터링 방법은 (a) 실험에 참여한 사람들이 댓글들에 주관적으로 평가하고 상기 주제글과 댓글들 간의 공통 단어에 대한 평가 지수 평균으로 얻은 단어별 평균 평가 지수로 상기 댓글의 단어 데이터베이스를 생성하는 단계; (b) 자살 수치 측정을 통한 사용자 성향 지수를 측정하는 단계; (c) 상기 단어별 평균 평가 지수를 기반으로 새로 입력된 주제글과 댓글들에 대하여 평가 지수를 자동 평가하는 단계; 및 (d) 상기 사용자 성향 지수에 따라 상기 댓글들을 자동 필터링하는 단계를 포함하는 것을 특징으로 한다. According to another embodiment of the present invention, the method for automatically filtering comments includes (a) an average evaluation index for each word obtained by subjects who participate in the experiment subjectively to the comments and the evaluation index average for the common words between the topic and the comments. Creating a word database of the comment; (b) measuring a user disposition index through measuring suicide values; (c) automatically evaluating an evaluation index on newly inputted topics and comments based on the word-based average rating index; And (d) automatically filtering the comments according to the user propensity index.

바람직하게는, 단계 (b)의 자살 수치 측정을 통한 사용자 성향 지수는 다음 수학식 에 의해 얻어지며, 여기서, α 값은 정상적인 사람의 4 가지 생리적 자살 수치의 평균값을 나타내고,w 값은 댓글의 악성이나 양성 강도에 따라 적절한 비율이 나오도록 신경망을 통하여 적응적으로 적절히 조절되는 상수이다.Preferably, the user tendency index by measuring suicide value of step (b) is Where α represents the mean of the four physiological suicides of a normal person, and w is a constant that is appropriately adaptively adjusted through the neural network to yield an appropriate rate based on the malignant or benign intensity of the comment. .

본 발명은 게시판에 게재되는 악성 댓글이 개인 위험도에 따라 표시되지 않도록 필터링함으로써, 자살로 인한 사망을 미연에 방지할 수 있다.The present invention can prevent the death caused by suicide by filtering so that malicious comments posted on the bulletin board is not displayed according to the individual risk.

도 1은 본 발명의 제1 실시예에 따른 댓글 자동 평가 방법의 구성을 나타낸 구조도이다.1 is a structural diagram showing the configuration of an automatic comment evaluation method according to a first embodiment of the present invention.

도 2는 본 발명의 제2 실시예에 따른 댓글 자동 평가 방법의 구성을 나타낸 구조도이다.2 is a structural diagram showing the configuration of an automatic comment evaluation method according to a second embodiment of the present invention.

도 3은 본 발명에 적용될 수 있는 명사 추출 폼의 일예를 나타낸 도면이다.3 is a view showing an example of a noun extraction form that can be applied to the present invention.

도 4는 본 발명의 실시예에 따른 자동 평가 지수의 오차를 나타낸 그래프이다.4 is a graph showing the error of the automatic evaluation index in accordance with an embodiment of the present invention.

도 5는 본 발명의 실시예에 따른 전체 데이터로 훈련 DB를 구성한 결과를 나타낸 그래프이다.Figure 5 is a graph showing the result of configuring the training DB with the total data according to an embodiment of the present invention.

도 6은 본 발명의 실시예에 따른 평균 평가 지수의 독자가 보낸 게시물의 일예를 나타낸 도면이다.6 is a view showing an example of a post sent by the reader of the average rating index according to an embodiment of the present invention.

도 7은 본 발명의 실시예에 따른 성향 지수가 낮은 독자가 보낸 게시물의 일예를 나타낸 도면이다.7 is a diagram illustrating an example of a post sent by a reader having a low propensity index according to an embodiment of the present invention.

이하, 첨부된 도면에 의하여 본 발명의 바람직한 실시 예를 상세하게 설명한다.Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings.

도 1은 본 발명의 제1 실시예에 따른 댓글 자동 평가 방법의 구성을 나타낸 구조도이다.1 is a structural diagram showing the configuration of an automatic comment evaluation method according to a first embodiment of the present invention.

신체에 관계된 수치를 측정하는 기구는 체중계나 혈압 측정기처럼 비 체혈식 기구와 손을 찔러서 체혈한 뒤에 혈당을 측정하는 혈당 측정기와 같은 체혈식 기구로 나눌 수 있다. 자살에 관계된 세로토닌, 5-HIAA, 노드아드레날린계, 오메가-3 필수 지방산의 4 가지 주요 수치는 체혈식 기구에 속하며, 뇌척수액, 혈액 내 성분 분석을 통하여 이들 수치가 측정되어야 한다. 물론, 이들 수치와 관련된 파동을 초음파 측정기로 측정 가능하다면 비 체혈식 기구로도 활용할 수 있다.Devices that measure body-related levels can be divided into non-blood-mechanical devices, such as weight scales and blood pressure gauges, and body-blooded devices such as blood glucose meters that measure blood sugar after the body pierces blood. The four major levels of suicide related serotonin, 5-HIAA, noradrenaline, and omega-3 essential fatty acids belong to the hematopoietic apparatus and should be measured by analysis of cerebrospinal fluid and blood components. Of course, if the wave associated with these values can be measured with an ultrasonic meter, it can also be used as a non-bodied device.

자살에 영향을 미치는 인생의 사건들이나 상황, 경제 생활, 법정 대결, 불치의 병, 수치심, 치욕감에 해당하는 외적 원인에 대한 4가지 주요 수치 변화를 측정할 수 있다면, 수치 변화에 따른 자살 방지에 활용할 수 있게 된다. 이러한 자살 수치 측정 기구는 아직까지 개발된 것이 없는 기구로서, 본 발명에서는 가상 측정 기구가 있다는 가정 하에 이론을 전개하고자 한다. If you can measure four major numerical changes for external events such as life events or circumstances affecting suicide, economic life, court confrontation, incurable illness, shame, and shame, You can use it. Such a suicide numerical measuring instrument has not been developed yet, and the present invention intends to develop a theory under the assumption that there is a virtual measuring instrument.

측정 기구에 의해 4 가지 주요 수치의 변화를 수치심과 모멸감 판별 기준으로 활용하고자 한다. 즉, 세로토닌 수치, 5-HIAA 수치, 노드아드레날린계의 개수, 오메가-3 필수 지방산이 미세히 감소하는 정도를 측정할 수 있다고 가정해보자. 자신에 관련된 내용이 실린 신문 기사나 자신의 주제글에 대한 댓글 각각에 대해 이들의 수치가 변화한다면 이들 수치의 증가 또는 감소에 따라 댓글의 악성과 양성 정도를 수치화할 수 있다. 개인의 성격과 그날의 스트레스 정도와 기분에 따라 다르겠지만, 각 개인의 현재 상태에서 A 라는 댓글을 읽고 이들 수치가 변하지 않거나 증가한다면 양성 댓글인 경우이고, 이들 수치가 감소한다면 악성 댓글일 가능성이 높아진다. 그러나 현실적으로 이러한 측정 기구를 이용하여 댓글의 성향을 판단하는 것은 불가능하다. 따라서, 본 발명에서는 현실적으로 가능한 방식으로 댓글의 성향을 분류하는 방식을 제안하고자 한다. We will use the four major numerical changes as a measure of shame and scorn. In other words, suppose that you can measure the level of serotonin, 5-HIAA, the number of noradrenaline, and the decrease of omega-3 essential fatty acids. If their figures change for each newspaper article or comment on their topic, then the increase or decrease of these figures can quantify the degree of malignancy and positivity. Depending on the individual's personality and the degree of stress and mood of the day, if the individual's current state reads the comments A and these numbers remain unchanged or increase, then they are positive. If these numbers decrease, they are more likely to be malicious. . In reality, however, it is impossible to judge the propensity of comments using such a measuring apparatus. Accordingly, the present invention proposes a method of classifying the propensity of comments in a realistically possible manner.

가상 기계와 주관적 분류에 대한 관계Relationship to virtual machines and subjective classification

본 발명에서는 자신과 관계된 기사 글이나 자신이 게시하거나 자신과 관련된 게시물을 통틀어 주제글이라 칭한다. 또한, 설명을 전개해나가기 위해 두 가지 지수를 도입한다. 첫 번째 평가 지수는 댓글을 대상으로 사람이 평가하거나 자동으로 평가되는 값을 말하며, 두 번째 성향 지수는 사람을 대상으로 가상 측정기를 통하거나 설문지 형식으로 측정된 값을 말한다. In the present invention, articles related to themselves or posts related to themselves or posts related to themselves are referred to as topics. In addition, two indexes are introduced to develop the explanation. The first score is the value that a person evaluates or automatically evaluates in the comments. The second score is the value measured by a virtual meter or in the form of a questionnaire.

하나의 주제글에 대하여 달리게 되는 수많은 댓글에 대해 평가 지수를 부여할 수 있다. 이 평가 지수는 주제글에 칭찬 또는 격려되는 내용 등으로 주제글에 긍정적인 성향을 갖는 양성 댓글인 경우 양수 값을 가지며, 인신 공격이나 부정적 견해 등의 내용으로 부정적인 성향을 갖는 악성 댓글의 경우는 음수 값을 갖도록 정의한다. 도 1 및 도 2를 참조하면, 주제글에 관계없이 실험에 참여한 사람들이 댓글들에 주관적으로 평가한다. 이때 긍정적인 성향을 갖는 양성 댓글인 경우 양수 값을 가지며, 인신 공격이나 부정적 견해 등의 내용으로 부정적인 성향을 갖는 악성 댓글의 경우는 음수 값을 갖는다(단계 S11, S21).You can assign a rating index to a large number of comments running on a topic. This evaluation index has a positive value for positive comments that have a positive tendency to the topic, such as praise or encouragement in the topic, and negative for malicious comments that have a negative tendency for content such as human attacks or negative opinions. Define to have a value. 1 and 2, subjects who participated in the experiment subjectively evaluate the comments regardless of the topic. At this time, a positive comment having a positive tendency has a positive value, and a malicious comment having a negative tendency due to content of a human attack or a negative opinion has a negative value (steps S11 and S21).

이 평가 지수는 자살 수치 가상 측정기에 의해서 측정되는 성향 지수에 일정 상수를 곱하여 정할 수 있다. 가상 측정기에서 계산되는 성향 지수를 다음 수학식 1을 통하여 평가 지수 y로 변환할 수 있다. This evaluation index can be determined by multiplying the propensity index measured by the suicide virtual measurer by a constant constant. The propensity index calculated by the virtual meter may be converted into an evaluation index y through Equation 1 below.

여기서, α 값은 정상적인 사람의 4 가지 생리적 자살 수치의 평균값을 나타낸다. w(weight)값은 댓글의 악성이나 양성 강도에 따라 적절한 비율이 나오도록 SOM, BP 와 같은 신경망을 통하여 적응적으로 적절히 조절되는 상수이다. 위 수학식 1에서 성향 지수 x 및 평균 성향 지수 α 간의 차이가 미세하다면, 평가 지수가 0으로 중앙값이 되도록 하였다. 여기서, 성향 지수 x가 감소하면 평가 지수도 작은 값이 나오게 된다. 따라서, 댓글을 읽고 성향 지수가 음수 값이 나타나게 되면 심적인 요소나, 다른 외부적 요인들에 의해 더 빨리 자살에 이르게 될 가능성이 높아진다. Here, α value represents the average value of four physiological suicide values of a normal person. The w (weight) value is a constant that is adaptively appropriately adjusted through neural networks such as SOM and BP so that an appropriate ratio is obtained according to the malignant or positive strength of the comment. If the difference between the propensity index x and the average propensity index α is small in Equation 1, the evaluation index is set to 0 as the median. Here, when the propensity index x decreases, the evaluation index also has a small value. Therefore, reading comments and having a negative value for the propensity index increases the likelihood of suicide due to mental or other external factors.

그러나, 자살 수치 가상 측정기를 현재는 사용할 수 없기 때문에 위 수학식 1은 추상적인 식이 된다. 가상 측정 수치와 비슷한 효과를 갖는 것으로는 실험자가 주제글에 대한 댓글을 읽어서 악성 인지 혹은 양성 인지를 주관적인 점수로 평가한 수치를 사용할 수 있다. 가장 악성인 댓글을 -5, 가장 양성인 댓글을 +5 로 평가하도록 한다. 실험자들의 대상 그룹에 따라 여러 수치가 나오겠지만, 체조와 같은 경기에서 가장 높은 점수와 가장 낮은 점수를 제외하고 평균을 취하는 방식을 적용할 수 있다. 따라서, 대상 실험자 수에서 낮은 점수 군의 10% 와 높은 점수 군의 10%를 제외한 점수의 평균값으로 성향 지수를 정할 수 있다. 리서치 조사와 같이 실험자의 대상 수가 많다면 댓글에 대한 주관적 판단 오차를 줄일 수 있을 것이다. However, Equation 1 above is an abstract equation since the suicide virtual counter is currently unavailable. As similar to the virtual measurement value, the experimenter can read the comments on the topic and use the value that evaluates the malignant or positive recognition as a subjective score. Rate the most malicious comments as -5 and the most positive comments as +5. Depending on the subject group of experimenters, the figures will be different, but in games such as gymnastics, the average score can be applied except for the highest and lowest scores. Therefore, the propensity index can be determined by the average value of scores excluding 10% of the low score group and 10% of the high score group. If the number of subjects is large, such as research research, subjective judgment errors on comments may be reduced.

자동 단어 분류 시스템Automatic word classification system

일반적으로 검색 엔진은 텍스트 기반 검색과 콘텐츠 기반 검색으로 나눌 수 있다. 엠파스나 네이버와 같은 포털 검색 사이트에서는 입력한 단어들을 기준으로 검색하는 텍스트 기반 검색 엔진이다. 이들은 검색된 그림이나 동영상도 미디어 파일의 소유자가 부여한 제목 또는 간단한 설명을 기준으로 검색한다. 동영상 검색에 대한 기능이 기본인 MPEG-7 은 텍스트 기반 검색과 콘텐츠 기반 검색 두 가지 모두를 적용하고 있다. 그림이나 영상을 텍스트로 검색하는 MPEG-7 텍스트 기반 검색 엔진은 사람이 주관적으로 분류한 영상의 설명을 기준으로 검색하는 엔진이다. 이에 반해, 원하는 영상에서 영상 자체의 고유한 특징을 기반으로 분류 및 검색하는 것은 MPEG-7 콘텐츠 기반 검색 엔진으로 구분하여 말할 수 있다. 예를 들어, 콘텐츠 기반 검색은 급격한 장면 변화에서 각 프레임이 특징들이 전 프레임과 차이가 문턱치 보다 큰 경우 주요 프레임으로 검출하고 이 프레임에서 RGB 색상 정보, 객체 정보 등과 같은 특징적인 정보를 절대적인 값에 의해서 얻어낼 수 있다. 즉, 특징 정보에서 얻어진 값을 각 특징을 추출하는 함수로부터 언제나 규칙적인 값을 얻게 된다. 따라서, 동일한 장면은 언제나 동일한 값을 얻게 된다. In general, search engines can be divided into text-based and content-based searches. Portal search sites like Empas and Naver are text-based search engines that search based on the words you enter. They also search for pictures or videos based on the title or short description given by the owner of the media file. MPEG-7, which is the basis for video retrieval, applies both text-based and content-based retrieval. The MPEG-7 text-based search engine that searches pictures and videos by text is based on the description of subjects classified by human subjectively. In contrast, classification and retrieval based on unique characteristics of the image itself in a desired image may be classified into an MPEG-7 content-based search engine. For example, content-based retrieval detects each frame as a main frame when the features differ from the previous frame in a sudden scene change, and the characteristic information such as RGB color information and object information in this frame is determined by an absolute value. You can get it. That is, the value obtained from the feature information is always obtained regularly from the function of extracting each feature. Thus, the same scene always gets the same value.

주제글이나 댓글을 주관적 분류를 이용하는 경우는 MPEG-7 의 텍스트 기반 검색에 비유할 수 있다. 즉, 사람이 평가하는 지수를 기준으로 분류하는 주관적 분류 엔진이라고 할 수 있다. 이러한 분류 방법은 모든 주제글과 댓글에 대하여 판단 인력이 대규모로 요구되며, 수많은 시간이 요구된다. 또한, 댓글에 대한 성향 판단은 인터넷에서 실시간으로 업데이트되는 댓글의 특성상 새로운 단어에 대한 평가가 상시 이루어져야 한다. Subjective classification of a topic or comment can be likened to the text-based retrieval of MPEG-7. In other words, it can be said to be a subjective classification engine that classifies people based on the index. This classification method requires a large number of judgment personnel for all topics and comments, and requires a lot of time. In addition, the judgment on the propensity for comments should always be evaluated for new words due to the characteristics of comments updated in real time on the Internet.

주제글이나 댓글에 대한 자동 분류는 단어나 문장에 대한 자체 기준에 따라 악성인지 또는 양성인지 성향을 판단할 기본 근거가 요구된다. 그러나 판별 시스템을 통하여 아무런 의미도 알 수 없는 문장을 악성인지 양성인지 판단하는 것은 판단 기준을 설정하기 힘들어 구현이 불가능하다. 따라서, 본 발명에서는 양성과 악성을 분류하기 위한 판단 기준 선정 방식에 대해서 다음과 같은 방식을 제안하고자 한다. Automatic classification of topic or comment requires a basic basis for judging whether it is malignant or benign based on its own criteria for words or sentences. However, judging whether a sentence whose meaning is unknown through a discrimination system is malicious or benign is difficult to set the criterion, and thus cannot be implemented. Therefore, the present invention intends to propose the following method for selecting a criterion selection method for classifying benign and malignant.

댓글에 포함된 각 단어를 분류한 상태에서 각 단어가 기존 주제글에 대해서 악성인지 양성인 지를 판단하는 함수 f(x)로부터 규칙적인 값을 얻어내어 언제나 동일한 값을 얻어내기는 힘들다. 우선 평가를 하기 위한 판단 기준으로 활용할 단어 DB(데이터베이스)를 구축해야 한다. 상기 단어 DB를 구축할 때 각 단어의 평가 지수는 실험자들이 평가한 주관적인 평가 수치에 의존하게 된다. 실험 대상자의 수가 많아지고, 각 단어에 대한 평가 회수가 많을수록 신뢰도가 높아질 것이다. 따라서, 평가 회수가 낮은 단어는 평가 지수에 대한 신뢰도가 낮으므로 댓글 판단에서 더 세밀한 판단 기준을 적용해야 한다. 해당 댓글이 악성 또는 양성인 지를 판별하는 것은 기계가 아닌 사람의 기준으로 조사된 통계를 통한 판단이 필요하므로, 기계를 통해 일반 단어에 대한 규칙적인 평가 지수를 얻는 것이 애초에 불가능하다. 따라서, 단어 평가 지수에 대한 신뢰도는 방대한 자료 수집과 시간으로 높일 수밖에 없다.In the state of classifying each word included in a comment, it is difficult to always obtain the same value from a function f (x) that determines whether each word is malicious or positive for an existing topic. First, we need to build a word DB (database) to be used as a criterion for evaluation. When constructing the word DB, the evaluation index of each word depends on subjective evaluation values evaluated by the experimenters. The larger the number of test subjects and the higher the number of evaluations for each word, the higher the reliability. Therefore, a word with a low number of evaluations has low reliability in the evaluation index, and thus, a more detailed criterion should be applied in the comment judgment. Determining whether the comment is malignant or benign requires judgment based on the statistics surveyed on the basis of the person, not on the machine, so it is impossible to obtain a regular evaluation index for common words through the machine. Therefore, the reliability of the word evaluation index is bound to be increased by huge data collection and time.

기본 단어 구성 방법How basic words are organized

기본 단어는 주제글과 댓글에 사용되는 명사를 사용한다. 주제글에 관계없이 실험에 참여한 사람들이 주관적으로 평가한 지수가 부여된 단어들을 전부 통합하여 단어 DB를 생성한다(단계 S12, S22). 각 댓글의 평가 지수는 그 댓글에 사용된 모든 명사에 동일한 점수를 부여한다. 댓글과 주제어들 간의 공통 단어들에 대한 평가 지수 평균으로 단어별 평균 평가 지수를 구한다. 평가 지수가 양수인 값들을 집합으로 구성하면 양성 단어 집합이 구성되며, 음수인 값들의 집합은 악성 단어 집합으로 구성할 수 있다. 카테고리에 따라서 양성 또는 악성 단어들이 분류될 수 있지만, 주제에 상관없는 악성 단어들은 별도의 집합에 저장하도록 한다. 예를 들어, 소풍간 사진에 대한 주제글인데 성형 의혹, 루머, 인신 공격성 글과 같이 주제에 상관없는 악성 단어들을 저장하는 것이다. Basic words use nouns used in topics and comments. Irrespective of the topic text, the words DB are generated by integrating all the words to which the indexes subjectively evaluated by the people who participated in the experiment (steps S12 and S22). The rating index of each comment gives the same score to all nouns used in that comment. The average score is calculated for each word by the average score of the common words between the comments and the main words. If the evaluation index is composed of positive values, a positive word set is formed, and a negative value set can be composed of a malicious word set. Positive or malicious words can be classified according to categories, but malicious words irrelevant to the subject are stored in a separate set. For example, this topic is about a pictorial pictorial, storing malicious words that are irrelevant to the subject, such as plastic suspicion, rumors, and aggression.

다음으로는 단어 평가 지수를 한 댓글에 대한 전체 평가 지수로 자동으로 부여하는 방법에 대해서 이하에 설명한다. 댓글에 사용되는 모든 단어에 대한 평가 지수를 구하려면 광범위한 실험 집단을 구성하여 장기간의 주관적 점수를 얻어야 한다. 시간적으로나 기술적으로 불가능한 방법이다. 따라서, 본 발명에서는 주관적 평가 지수로 인해 계산된 각 단어의 평가 지수를 기준으로 새로 입력되는 댓글에 대해 단어 자동 평가를 사용하고자 한다. Next, a method of automatically assigning a word evaluation index to the overall evaluation index for one comment will be described below. To get a score for every word used in a comment, you need to construct a broad experimental group to get a long-term subjective score. This is not possible in time or technically. Therefore, the present invention intends to use the word automatic evaluation for the newly input comments based on the evaluation index of each word calculated due to the subjective evaluation index.

단어 평가 지수 자동 부여 방법How to automatically give word evaluation index

악성 및 양성 단어 집합의 각 단어는 평가 지수가 있다. 평가되지 않은 일반 댓글에 대한 지수 평가는 글에 포함된 악성과 양성 단어들의 평가 지수 총합을 단어 개수로 나눈 평균 평가 지수로 쉽게 구할 수 있다. 그러나 주관적 평가 지수로 얻어진 단어 집합은 한정되어 있다. 이들 단어들을 기준으로 댓글의 평가 지수를 자동으로 부여하는 것은 현재 단어들과 관련이 없는 댓글인 경우, 평가 지수를 판별할 수 있는 단어의 개수가 적어서 지수 자체가 의미 없어진다. 새롭게 추가되는 단어는 자신이 속하는 댓글의 평가 지수 합계를 이들 댓글의 개수로 나눈 평균값으로 부여하도록 한다. Each word in the malignant and benign word set has a rating index. Index evaluation for unrated general comments can be easily obtained as the average rating index divided by the total number of rating indexes of malignant and benign words included in the article. However, the set of words obtained from the subjective evaluation index is limited. Automatically assigning the evaluation index of the comment based on these words is that if the comment is not related to the current words, the number of words that can determine the evaluation index is small, the index itself becomes meaningless. The newly added word is to give the sum of the evaluation indexes of the comments to which it belongs as an average value divided by the number of these comments.

이 방법도 현재 존재하는 단어 집합의 평가 지수의 신뢰도가 새로운 단어의 평가 지수 결정에 영향을 끼치게 된다. 어떤 댓글에 처음 나타난 단어에 자동으로 부여하는 평가지수는 신뢰도가 아주 낮다. 그러나, 다수의 댓글에서 비슷한 성향의 댓글에 지속적으로 노출되는 단어의 경우에는 평가 지수에 대한 신뢰도가 자율적으로 조정되어 적합한 값으로 정해질 수 있다. In this method, the reliability of the evaluation index of the existing word set influences the determination of the evaluation index of the new word. The evaluation index that is automatically assigned to the first word that appears in a comment has very low reliability. However, in the case of words continuously exposed to comments of similar tendency in a plurality of comments, the reliability of the evaluation index may be adjusted autonomously and set to a suitable value.

자동 평가 지수의 신뢰성 검사 방법Reliability test method of automatic evaluation index

기존의 존재하는 주제글과 댓글에서 주관적으로 측정된 평가 지수와 새로운 주제글과 댓글에 대해 상기한 방법대로 자동으로 얻어진 평가 지수의 정확성을 검증할 수 있는 절차가 있어야 한다. 자동 분류 방식으로 얻은 평가 지수의 검사는 컴퓨터에 의해 얻어진 자동 평가 지수와 사람을 통해 평가된 주관적 평가 지수 평균 간의 오차를 이용할 수 있다. There should be a procedure for verifying the accuracy of the evaluation scores that are subjectively measured in existing topics and comments, and the scores that are automatically obtained as described above for new topics and comments. Examination of the evaluation index obtained by the automatic classification method may use the error between the computer-generated automatic evaluation index and the subjective evaluation index average evaluated by humans.

검사를 위해서는 주제글과 댓글의 개수가 총 T 개 일 때, 주제글과 댓글을 N 개 선정한다. 여기서, N의 범위는 1 ≤ N ≤ T/2이다. 각 댓글에 대해 여러 번의 테스트로 총 M 번의 주관적 평가 지수를 조사하도록 한다. 각 댓글에 대해 최상위와 최하위 5% 점수를 제외한 평가 점수들의 총합을 0.9 ㅧ M으로 나눈 평균값을 최종 평가 지수로 부여한다. 이때 동일한 주제글에 대한 댓글 중 50%를 A 집단으로 나머지는 B 집단으로 분리한다. A 집단은 단어 분류 및 컴퓨터 자동 판단의 기본 근거가 되는 단어 DB를 구성하는 평가 지수로 활용한다. B 집단은 저장된 단어 DB의 평가 지수로부터 컴퓨터를 통해 자동으로 평가 지수를 얻는데 활용된다. 이때, B 집단에 속하는 댓글에서 측정된 자동 평가 지수와 실험자에 의해 부여된 주관적 평가 지수 간의 오차를 통해 자동으로 평가된 지수의 신뢰성을 검사할 수 있다. For inspection, when the total number of topics and comments is T, select N topics and comments. Here, the range of N is 1 ≦ N ≦ T / 2. For each comment, several tests are conducted to examine a total of M subjective scores. For each comment, the final evaluation index is given as the average value obtained by dividing the sum of the evaluation scores except 0.9 and M by the highest and lowest 5% points. At this time, 50% of comments on the same topic are divided into Group A and the rest into Group B. Group A is used as an evaluation index that constitutes a word DB that is the basis for word classification and automatic computer judgment. Group B is used to automatically obtain an evaluation index through a computer from the evaluation index of the stored word DB. At this time, the reliability of the automatically evaluated index can be checked through the error between the automatic evaluation index measured in the comments belonging to group B and the subjective evaluation index given by the experimenter.

설문 테스트를 통한 위험 수치(사용자 성향 지수) 측정(S23)Measure risk level (user propensity index) through a survey test (S23)

자살 위험도에 대한 가상 측정 시스템은 현재로서는 개념적인 추상적인 시스템이다. 따라서, 본 발명의 시뮬레이션을 위해서 측정 가능한 모델로서 우울증 테스트를 통해 위험 수치를 적용하여 사용자 성형 지수를 측정한(단계 S23). 보건복지부 정신 보건과에서 후원하는 전문적인 심리 검사 사이트에 있는 고등부 우울증 테스트를 기본으로 수치를 측정한다. 검사 대상과 검사 항목 수에 따라 더 섬세한 수치를 측정할 수 있을 것이다. 성실하지 못한 답변으로 인한 잘못된 측정 수치, 연령별 테스트 문항 내용 등에 따라 수치는 변수가 많겠지만, 올바른 답변으로 평균적인 수치에 근접한 성향 분석이 가능하다고 가정하도록 한다. 30가지 문항 중 최초 다섯 가지 설문 문항들은 다음과 같다.The virtual measurement system for suicide risk is a conceptual abstract system at present. Therefore, the user shaping index was measured by applying a risk value through a depression test as a measurable model for the simulation of the present invention (step S23). The figures are based on the Higher Depression Test, a professional psychological test site sponsored by the Department of Mental Health, Department of Health and Human Services. Depending on the object to be inspected and the number of test items, more precise values can be measured. Although there are many variables depending on the incorrect measurement result due to unsatisfactory answers and the contents of test questions by age, the assumption is that the analysis of propensity close to the average value is possible with the correct answer. The first five of the 30 questions are:

1. 식욕이 좋다. 1. I have an appetite.

2. 난처할 때는 입을 다무는 것이 상책이라고 믿는다. 2. I believe it is best to shut your mouth when you are in trouble.

3. 한 주일에도 몇 번씩 신물이 올라와서 고생한다. 3. He suffers from the sickness coming up several times a week.

4. 한가지 일에 정신을 집중하기가 어렵다. 4. It's hard to concentrate on one thing.

5. 목덜미가 아픈 때는 거의 없다.5. The neck is rarely painful.

댓글은 위험 수치에 관계없이 악성 수치가 최대인 글들이 존재한다. 누구나 읽어도 상처를 받거나 위험 수치를 높이는 평가 지수가 -4 이상의 값인 글들일 것이다. 본 발명에서는 수치에 관계없이 악성 댓글은 원래의 게시판에 존재하는 필터 기능과 같이 사용될 것이고, 다른 성향 지수의 글들은 측정된 위험 수치에 따라 필터링될 것이다. Comments have a high number of malicious posts regardless of risk. Anyone who reads will have a score of -4 or higher that will hurt or raise the risk. In the present invention, regardless of the number of malicious comments will be used together with the filter function existing in the original bulletin board, the posts of the other propensity index will be filtered according to the measured risk value.

단어 DB(데이터베이스) 생성(S12, S22)과 댓글 자동 평가 방법(S14, S24)Word DB (database) creation (S12, S22) and comment automatic evaluation method (S14, S24)

본 발명의 댓글 자동 평가 방법(S14, S24)은 주관적 검색 엔진과 같은 각 단어 평가 지수를 기반으로 새로 입력된 주제글과 댓글에 대해서는 평가지수를 자동 부여하는 방식이다. 댓글에 대한 실험자들의 주관적인 평가 지수를 기준으로 댓글에 속하는 각 단어에 대한 평가 점수를 DB에 저장하는 과정이 필요하다(S12, S22). 이 DB는 각 댓글의 평가 지수를 자동으로 측정하기 위한 기초 자료에 해당한다. 각 댓글의 평균 평가 지수를 기준으로 댓글에 속하는 단어를 데이터 베이스에 평가 점수는 평가 지수에 더해주고, 댓글 포함 개수는 1씩 증가시킨다. 예를 들어, 성형이라는 단어가 이전까지 총 평가 점수가 11 점이고 포함되었던 개수가 3개이었다고 하자. 새로 입력된 댓글의 평가 지수가 2 점이고 '성형'이라는 단어가 포함되어 있다면, 이 단어의 총 평가 점수는 13 점이 되고, 개수는 4 개가 된다. 추후, 이 단어의 최종 평가 점수는 평균 값인 3.25(= 13/4)이 된다. The automatic comment evaluation method (S14, S24) of the present invention is a method of automatically assigning an evaluation index to a newly input topic and comment based on each word evaluation index such as a subjective search engine. It is necessary to store the evaluation score for each word in the DB in the DB based on the subjective evaluation index of the experimenter for the comment (S12, S22). This DB is the basic data for automatically measuring the evaluation index of each comment. Based on the average rating index of each comment, the words included in the comments are added to the evaluation score in the database, and the number of comments included is increased by one. For example, suppose the word plastic had a total score of 11 and included 3 before. If the newly entered comment has an evaluation score of 2 points and the word 'molding' is included, the total evaluation score of this word is 13 points and the number is 4. Later, the final evaluation score of this word is 3.25 (= 13/4), which is an average value.

새로운 댓글을 평가하는 방법(S14, S24)은 댓글에 포함된 각 단어를 분리하여, 단어 DB에서 존재하는 단어들의 평가 점수를 모두 합산하도록 한다. 새로운 댓글에 포함된 단어가 A, B, C, D, E 이고, 단어 DB에 속하는 단어가 A, B, D 라면 단어 DB에 A, B, D의 평가 점수를 합산하고 DB 에 속하는 단어 개수로 나누어 이 댓글의 평가 지수를 계산하도록 한다. The method of evaluating the new comment (S14, S24) is to separate each word included in the comment, so as to sum all the evaluation scores of the words existing in the word DB. If the words included in the new comment are A, B, C, D, E, and the words belonging to the word DB are A, B, D, the evaluation scores of A, B, D are added to the word DB and the number of words in the DB is added. Calculate the rating index for this comment.

게시판 보기 기능과 가상 측정 시스템의 연계Linkage of Bulletin Board View Function and Virtual Measurement System

악성 댓글인 악플에 대한 심각한 폐해에 대한 사회적인 인식으로 공익적 차원의 자발적 캠페인인 양성 댓글로서 선플을 달자는 운동이 생기고 있다. 그러나, 개별 유전자 DNA의 다양한 조합만큼이나 다양한 인간성으로 인하여 이러한 운동에 상관없이 인터넷상에서의 영웅주의나 고립된 인간들의 사회적 불만 표출의 하나인 악성 댓글은 없어지지 않을 것이다.Social awareness of the serious harm of bad comments, malignant comments, is creating a campaign to vote as a positive comment for the public interest. However, due to the diversity of humanity as well as the various combinations of individual genetic DNAs, malicious comments, either heroic or isolated social dissatisfaction on the Internet, will not disappear regardless of this movement.

악플에 대해서도 받아들이는 개인 성격에 따라 반응이 달라진다. 겉으로 드러나는 활발한 외향적인 성격으로 보이더라도 조울증에 속하는 조증으로 인해 나타나는 외향성을 가진 사람들은 일반 내성적인 성격의 사람들보다 자살 위험도가 훨씬 더 높은 집단에 속한다. 또한, 항상 우등생이고 최고를 지향하는 엘리트들도 알려지지 않은 내적인 정신적 스트레스로 인해 자살 위험도가 높을 수 있다. 자살 위험도가 높은 집단에 속하는 사람들은 악성 댓글에 노출되는 기간이 짧더라도 정신적으로 더 우울해지거나 자살을 생각할 수 있게 된다. 이러한 위험성은 겉으로 잘 드러나지 않는 경우 주위에서 조처를 취할 겨를도 없게 된다. Reactions also depend on the personality of the person who accepts the bad. Even though the outwardly active outgoing personality appears, those who are extroverted due to manic depression are more likely to be suicidal than those of general introverted personality. Also, elites who are always honored and oriented to the highest may be at higher risk of suicide due to unknown internal mental stress. People who belong to a high risk group may be mentally depressed or even thought to commit suicide even if they are exposed to malicious comments for a short time. These risks can be difficult to take action around if they are not obvious.

따라서, 자동으로 이러한 위험성이 있는 집단을 위해 게시판에 악성 댓글이 개인 위험도에 따라 표시되지 않도록 할 수 있다면, 자살로 인한 사망을 미연에 방지할 수 있을 것이다. 그러나, 개인별 위험성 측정은 짜여진 우울증 테스트와 같은 항목별 답안에 의지하는 경우 잘 드러나지 않는다. 수학식 1로 표현된 자살 수치 가상 측정기를 활용하여, 당뇨병을 가진 사람들이 활용하는 혈당 측정기처럼 주기적으로 해당 수치를 측정할 수 있다. 이렇게 얻어진 수치를 통신을 통해 전송된 컴퓨터에서는 악성 댓글의 평가 지수에 따라 보여지는 댓글이 조정될 수 있다. 예를 들어, A 라는 사람의 현재 자살 성향 지수가 -3.5 라면, a 라는 댓글의 성형 지수가 -3.6인 경우는 보여 지지 않을 것이며, -3.5 이상은 보일 수 있을 것이다. 또한, 평가지수가 음수로서 심한 악성 댓글을 읽게 되면 저장된 성향 지수에 다시 평가 지수 점수를 합산하여 자살 위험 수치가 더 높아지도록 조정해야 한다. 따라서, 다음 댓글을 읽을 때는 조정된 위험 수치에 따라 댓글을 볼 수 있는 기능으로 변경된다. Thus, if you can automatically prevent malicious comments from appearing on bulletin boards for such risky groups, death by suicide could be prevented. However, individual risk measures are less visible when relying on itemized answers, such as a structured depression test. By using the virtual suicide value meter expressed in Equation 1, it can be periodically measured as a blood glucose meter used by people with diabetes. In the computer transmitted through the numerical value obtained through the communication, the comment displayed according to the evaluation index of the malicious comment may be adjusted. For example, if a person's current suicide tendency index is -3.5, then a comment of a's cosmetic index is -3.6 would not be shown, and a -3.5 or higher would be seen. In addition, if the rating score is negative and the malicious comments are read, the score should be added to the stored propensity index and adjusted to increase the suicide risk. Therefore, when you read the next comment, it changes to the ability to view the comment according to the adjusted risk value.

위험 수치와 게시판 연동Risk figures and bulletin board

기본적인 위험 수치와 각 댓글의 평가 지수에 따라 필터링되는 것을 기본으로 한다. 그러나, 악성 댓글에 여러 번 노출될 때 자살 위험군에 속하는 사람들은 더 쉽고 강력하게 자살 동기가 유발된다. 악성 댓글과 양성 댓글에 대해 보이는 반응에 따라 자살 수치를 판단할 수 있는 시스템이 현재로서는 불가능하기 때문에, 설문 테스트를 통해 얻어진 위험 수치에 가상으로 증감되는 수치를 적용하기로 한다. 사람에 따라서는 악성 댓글을 계속 보게 되면, 글에 의해 충격받는 정도가 무뎌질 수 있지만, 실제 실험에서는 위험적인 요소가 많으므로 동적으로 증가 감소 수치가 조절되기보다는 악성 댓글에 대해서는 평가 지수의 값이 -1 정도로 성향 지수에 더해지도록 하고, 양성 댓글을 보는 경우는 평가 지수의 값에 +0.5 정도 더하여 성향 지수를 조정하도록 적용한다. 예를 들어, 좋은 글을 두 번 읽으면 엔도르핀이 증가하고 나쁜 글 한번 읽었을 때는 스트레스 인자가 쌓인다고 볼 때, 처음 측정된 수치가 좋은 글과 나쁜 글의 성향 수치를 지속적으로 증가 또는 감소해주어야 한다. 즉, 무조건 좋은 글은 1 증가시키고, 나쁜 글은 1 감소시키는 것보다, 좋은 글은 읽으면 0.5 증가되고 나쁜 글 읽으면 1 감소시키는 것으로 비율로 차이를 둔다는 것이다. 비율 결정은 실제 가상 측정 시스템을 활용하거나 임상 실험을 통하여 비율을 정확히 조정할 필요가 있다. 본 발명에서는 비율을 1:0.5로 고정하여 실제 알고리즘을 구현하도록 한다. 1:1의 비율로 적용할 수도 있겠지만, 여러 번의 칭찬보다 한 번의 충격이 오래갈 수 있기 때문에 1:0.5의 비율도 적절한 값이 아닐 것이다.It is based on filtering by the default risk level and the rating score of each comment. However, when exposed to malicious comments several times, those who are at risk of suicide are more easily and strongly motivated to commit suicide. Since there is currently no system that can determine suicides based on responses to malicious and positive comments, we will apply a hypothetical increase or decrease to the risk value obtained from the survey test. In some people, if you keep seeing malicious comments, the impact of the posts can be dull, but in practice, there are many risk factors, so the value of the score for malicious comments is higher than the dynamic increase and decrease. It should be added to the propensity index of about -1, and to adjust the propensity index by adding +0.5 to the value of the evaluation index when viewing positive comments. For example, if you read good articles twice, endorphins increase, and if you read bad articles once, the stress factor builds up, the first measured value should continuously increase or decrease the tendency of good and bad articles. In other words, rather than increasing the number of good articles by 1 and reducing the number of bad articles by 1, the ratio is set by increasing 0.5 when reading good articles and 1 by reading bad articles. Percentage determination needs to be precisely scaled using real virtual measurement systems or through clinical trials. In the present invention, the ratio is fixed at 1: 0.5 to implement the actual algorithm. A ratio of 1: 1 may be applied, but a ratio of 1: 0.5 may not be appropriate because a single shock may last longer than several compliments.

관련성에 따른 게시판 구현 방법(S15, S25)Bulletin board implementation method according to relevance (S15, S25)

도 1 및 도 2를 참조하면, 단계 S13 또는 S23에서 측정된 사용자 성향 지수에 따라 단어 DB를 통해 평가된 댓글을 자동 필터링한다(S15, S25). 도 1을 참조하면, 성향 지수는 악성과 양성 댓글을 읽으면서 조정되어 댓글을 다시 보여줄 때 조정된 지수에 따라 다시 댓글이 표시된다. 도 2를 참조하면, 우울증 테스트와 같은 인위적인 검사가 아닌 정확한 수치를 통해 측정된 값을 이용하므로 현재 상태가 가장 잘 반영된 결과로 보이게 된다. 일반적인 신문 기사에 대한 댓글은 독자가 게시된 기사에 관련이 있는지 유무를 판별하는 것이 어렵다. 따라서, 자신이 글쓴이가 아닌 글에 대해서는 대중적으로 악성이 댓글 즉, 성향지수가 -3 이하인 댓글에 대해서만 필터링을 일률적으로 적용하도록 한다. 물론, 읽기 버튼을 2개로 나누어 일반 독자와 관련된 독자로 구분하여 읽도록 유도할 수 있으나 이러한 기능의 사용성은 높지 못할 것이다. 따라서, 신문 기사와 같이 자신이 글쓴이 주체가 아닌 타인의 글에 보게 될 때는 댓글에 대해서 성향 지수가 -3 이하의 댓글만 필터링하도록 한다. 자신이 글쓴이 주체가 되는 주제글의 댓글들은 글쓴이의 성향지수에 따라 평가지수가 (-성향지수+1)/2 이하의 글은 게시되지 않도록 보여준다. 즉, 성형지수가 -3으로 자살 위험성이 높은 사람의 경우는 평가 지수의 기준이 (+3+1)/2 = 2가 되어 평가 지수가 2 이상인 양성 댓글만 볼 수 있게 된다. 자살 위험성이 낮은 사람의 경우는 조금 심한 악성 댓글을 인내해낼 수 있지만, 위험성이 높은 사람은 약간의 악성 댓글도 심각한 영향을 끼칠 수 있게 된다. 1 and 2, the comments evaluated through the word DB are automatically filtered according to the user propensity index measured in step S13 or S23 (S15 and S25). Referring to FIG. 1, the propensity index is adjusted while reading malignant and positive comments, and the comment is displayed again according to the adjusted index when the comment is shown again. Referring to FIG. 2, since the measured value is measured using an accurate value rather than an artificial test such as a depression test, the current state is best reflected. Comments on general newspaper articles are difficult to determine if the reader is relevant to the published article. Therefore, for the posts which are not the authors, filtering is uniformly applied only to the malicious comments in general, that is, the comments having the propensity index of -3 or less. Of course, the read button can be divided into two readers related to the general readers to be read, but the usability of these functions will not be high. Therefore, when the article is seen in the writings of other people, such as newspaper articles, only the comments with a propensity index of -3 or less for the comments should be filtered. Comments on subjects that are the subject of the author show that the evaluation index is less than (-inclination index + 1) / 2 according to the inclination index of the author. In other words, in the case of a high suicide risk score of -3, the criterion of the evaluation index is (+ 3 + 1) / 2 = 2 so that only positive comments with an evaluation index of 2 or more can be viewed. People who are at low risk of suicide can endure a little bit of bad comments, but people who are at high risk can have some bad comments.

실시예Example

본 발명에서는 실험 대상을 일반 고교로 한정하여 포털 사이트에 게재된 주제글과 댓글에 대해 주관적인 판단 데이터를 수집하였다. 데이터는 요즘 이슈가 되고 있는 텔미 댄싱, 대선, 아파트 미분양 등 다양한 주제를 대상으로 하였다. 일반 신문 기사보다는 포털 사이트의 토론 게시판에서 각 주제글마다 20 개씩의 댓글을 선정하여 실험 데이터로 사용하였다. 하나의 주제글과 댓글 20 개 하나의 묶음으로 실험자들이 가장 악성인 -5 점에서 가장 양성인 +5 점 사이에 자신의 주관에 따라 평가하도록 하였다. 각 묶음 별로 10 명씩 평가에 참여하였다. 각 댓글에 포함된 명사를 추출하기 위해 기본적인 추출은 프로그래밍으로 해결하였지만, 네티즌들의 언어 파괴에 의해 놈현과 같은 축약된 명사나 디빠(디워 팬)와 같이 변형된 언어에 대해서는 수동으로 단어를 추가할 수 있도록 구성하였다. 시뮬레이션 프로그램에서 단어를 추출하는 일부 폼은 도 3과 같다.In the present invention, subjects were limited to general high schools, and subjective judgment data on subjects and comments posted on portal sites were collected. The data covered a variety of topics such as telme dancing, presidential elections, and unsold apartments. Twenty comments were selected for each topic in the discussion board of the portal site, rather than general newspaper articles, and used as experimental data. A group of 20 topics and comments allowed the experimenters to evaluate their subjects between the most malicious -5 points and the most positive +5 points. Ten people in each group participated in the evaluation. The basic extraction was solved programmatically to extract the nouns contained in each comment, but words could be added manually for the abbreviated nouns such as Nomhyun or the deformed languages such as Dipa (Die Fan) by the language destruction of netizens. It was configured to be. Some forms of extracting words from the simulation program are shown in FIG. 3.

도 3에는 본 발명의 실시예에 따른 명사 추출 폼의 일예가 도시되어 있다.Figure 3 shows an example of a noun extraction form according to an embodiment of the present invention.

도 3에서 상단은 읽어 들인 주제글과 댓글 데이터 파일이며, 두 번째 줄은 현재 댓글에 대한 실험 대상자들의 주관적인 점수와 평균 평가 지수를 나타낸다. 다음 칸에는 현재 댓글에서 공백으로 구분된 문자열을 나타낸다. 오른쪽 폼은 자동으로 추출하고, 수동을 수정하고 추가한 명사목록이 된다. 시뮬레이션에서 프로그래밍으로 인한 자동 명사 분류는 은, 는, 이, 가, 라면 등의 기본적인 조사로 한정하였다. 실제로 정확한 명사 분리는 형태소를 기반으로 하는 알고리즘이 따로 요구되지만, 본 실험에서는 간단한 형태소 분리만 프로그래밍으로 해결하였다. In the upper part of FIG. 3, the read topic and comment data files are shown, and the second line shows subjective scores and average scores of subjects for the current comment. The next column shows a space separated string of current comments. The form on the right is a list of nouns that are automatically extracted, manually modified, and added. The classification of automatic nouns due to programming in simulations was limited to basic investigations such as silver, ,,,, and ramen. In fact, the exact noun separation requires a morpheme based algorithm, but in this experiment, only simple morpheme separation was solved by programming.

이렇게 명사와 주관적인 점수로 다시 저장된 데이터를 대상으로 입력된 댓글에 대한 자동 평가 지수의 신뢰성을 실험하였다. 자동 단어 평가 지수를 측정하기 위해서 하나의 주제글에 대한 댓글을 무작위로 10 개를 추려서 단어 DB를 생성하는데 사용하고, 선택되지 못한 10 개의 댓글은 자동 단어 평가 지수를 구한 값과 실제 주관적인 평가 데이터와의 오차를 계산하여 신뢰성을 구하였다. 여기서, 무작위로 선택된 10 개의 댓글을 훈련 데이터, 나머지 댓글을 실험 데이터로 구분하도록 하였다. 본 실시예에 사용된 각 주제글에 따라 오차의 범위가 크기도 하고 작기도 하였다. 도 4는 하나의 묶음에서 평가된 댓글 10 개에 대한 오차의 전체 평균을 하나의 값으로 표현한 그래프이다. 하나의 값은 각 묶음당 20 번의 평가를 수행하여 얻어진 총합에 대한 평균 오차이다. In this way, we tested the reliability of the automatic evaluation index for comments entered on the data stored as nouns and subjective scores. In order to measure the automatic word evaluation index, randomly select 10 comments on a topic to generate a word DB, and the 10 unselected comments are obtained from the automatic word evaluation index and the actual subjective evaluation data. The error was calculated to determine the reliability. Here, 10 randomly selected comments were divided into training data and the remaining comments into experimental data. Depending on the topic used in this example, the error range was large and small. Figure 4 is a graph representing the total average of the errors for the 10 comments evaluated in one bundle as a value. One value is the mean error for the sum obtained by performing 20 evaluations for each batch.

도 4는 본 발명의 실시예에 따른 자동 평가 지수의 오차를 나타낸 그래프이다.4 is a graph showing the error of the automatic evaluation index in accordance with an embodiment of the present invention.

도 4에 도시된 바와 같이, -5 ~ 5로 11 값에서 오차의 범위는 0 ~ 2로 평가 지수의 범위에 비해 작다고 할 수 있다. 그러나 수집된 실험데이터는 단어의 개수가 적어서 10 개의 명사를 포함하고 있는 댓글에서 훈련데이터에서 수집된 단어 DB에서 일치하는 명사가 한 개만 존재하는 경우도 있었다. 따라서, 오차에 대한 신뢰성은 시간과 인력을 통해서 충분히 훈련된 단어 DB 에 의해서 해결될 수 있다. As shown in FIG. 4, the range of the error at the value of 11 to −5 to 5 may be 0 to 2, which may be smaller than the range of the evaluation index. However, the collected experimental data had a small number of words, and in a comment containing 10 nouns, there was a case where only one noun matched in the word DB collected from the training data. Thus, the reliability of the error can be solved by a word DB that is sufficiently trained through time and manpower.

또 다른 실험으로 이번에는 모든 실험 데이터를 훈련 데이터로 사용하여 단어 DB를 생성하였다. 같은 명사라도 여러 댓글에 포함되기 때문에 전체 평균으로 명사의 평가지수가 저장되면 원래 평가된 값과는 다르게 달라진다. 이 실험은 훈련 데이터가 무작위로 매번 선택되었던 이전 실험과는 달리 전체 댓글을 입력 데이터로 사용하여 훈련 데이터가 고정된다. 이전과 같이 각 묶음에 대해서 20 번 실험할 때 매번 다른 훈련데이터를 생성하지 않으므로 한 번의 반복으로 단어 DB 를 구성하였다. 그러나 실험하는 데이터는 무작위로 10 개를 추출하여 자동 평가지수와 주관적 평가 지수 간의 오차를 계산하였다. 이 실험 역시 총 20 번을 반복하여 얻어진 총 오차의 평균을 그래프로 도 5에 표현하였다. In another experiment, we generated a word DB using all the experimental data as training data. The same nouns are included in multiple comments, so when the noun's evaluation index is stored as an overall average, it differs from the original value. Unlike the previous experiment where the training data was randomly selected every time, this experiment uses the entire comment as input data and the training data is fixed. As before, when we experimented 20 times for each bundle, we did not generate different training data each time, so we constructed a word DB with one iteration. However, the experimental data were randomly extracted from 10 and calculated the error between the automatic evaluation index and the subjective evaluation index. In this experiment, the average of the total errors obtained by repeating a total of 20 times is represented in a graph in FIG. 5.

도 5에는 전체 데이터로 훈련 DB 를 구성한 결과가 도시되어 있다. 이전 실험에 비해서 댓글마다 발생하는 명사가 단어 DB에서 존재하지 않는 경우가 없으므로 오차가 현저히 적어졌으나, 여러 댓글에 포함되는 명사들로 인해서 만족할 만할 수준의 신뢰성은 갖지 못하고 있다. 실험 데이터가 더 많아져서 중복되는 명사의 개수가 많아질수록 오차의 범위가 줄어들 것이다. 물론, 일반 리서치와 같이 대상자가 많은 경우에 비추어 볼 때, 실험 대상자들의 주관적인 판단기준에 따라 95% 이상의 신뢰 수준을 갖기는 어려울 것이다. 실험 데이터 전체로 단어 DB를 구성하여, 주제글에 대한 댓글을 독자의 개인적 성향 지수에 따라 댓글을 보여주는 필터링 알고리즘의 정확도를 측정해보았다. 이 실험에 참여자는 일반적인 우울증 검사 테스트 항목에 따라 예로 답한 항목을 1 점으로 하여 총 문항수로 나눈 값에 10 배를 취한후 -5를 빼서 기존 댓글의 평가 지수인 -5 ~ +5 의 범위로 평준화하였다. 프로그램으로 측정한 값을 기준으로 측정에 참여한 실험자가 현재 게시물을 읽는다는 가정하에 댓글 필터링을 시뮬레이션하였다. 5 shows the results of configuring the training DB with all the data. Compared to the previous experiment, the nouns that occur in each comment do not exist in the word DB, so the error is significantly reduced, but due to the nouns included in the various comments, there is no satisfactory level of reliability. The more experimental data you have, the greater the number of duplicate nouns will reduce the margin of error. Of course, in the case of a large number of subjects, such as general research, it will be difficult to have a confidence level of more than 95%, depending on subjects' subjective criteria. By constructing a word DB with the experimental data as a whole, we measured the accuracy of the filtering algorithm that shows the comments on the topic according to the reader's personal inclination index. Participants in this experiment were 10 times the total number of questions divided by total number of questions according to the general depression test test item, and then subtracted -5 to equalize the range of -5 to +5, which is the evaluation index of existing comments. It was. Based on the program-measured value, we simulated comment filtering on the assumption that the experimenter who reads the current post is reading.

도 1을 참조하면, 단계 S15를 수행한 후, 상기 댓글 점에 따라 상기 사용자 성향 지수를 수정한다(단계 S16). 도 6은 본 발명의 실시예에 따른 평균 평가 지수의 독자가 보낸 게시물의 일예를 나타낸 도면으로서, 주제글과 댓글에 대해 단어 DB 를 통해 평가된 각 댓글의 평가 지수에 대해 평균 성향 지수가 1.28인 독자를 대상으로 평가 지수가 1.28 2 = - 0.72 이상의 값을 갖는 댓글만 표시된 게시물이다. 이때, 각 댓글의 평가 지수가 현재 독자의 성향 지수 값인 1.28 보다 큰 값들은 (평가 지수 - 성향 지수)/10를 성향 지수에 합해서 성향 지수를 수정하였다. 반대로, 평가지수가 성향 지수보다 작은 경우는 (평가 지수 성향 지수)/2를 합산시켰다. 즉, 성향 지수보다 더 큰 값을 갖는 현재 독자에 대해 양성인 댓글은 성향 지수를 조금씩 높여가지만, 성향 지수 보다 작은 값을 갖는 음성 댓글은 빠르게 성향 지수를 낮추도록 실험하였다. 즉, 독자가 악성으로 인해 정신적 스트레스를 급격히 받는 정도를 지수에 적용하였다. Referring to FIG. 1, after performing step S15, the user tendency index is corrected according to the comment point (step S16). 6 is a view showing an example of a post sent by the reader of the average rating index according to an embodiment of the present invention, the average index is 1.28 for the rating index of each comment evaluated through the word DB for the topic and comments This post only shows comments with a rating of 1.28 2 =-0.72. At this time, the evaluation index of each comment is larger than 1.28, which is the current reader's propensity index value, to modify the propensity index by adding (rating index-propensity index) / 10 to the propensity index. Conversely, if the valuation index is smaller than the propensity index, the (valuation index propensity index) / 2 is added. In other words, the comments positive for the current reader having a value larger than the propensity index increase the propensity index little by little, whereas the negative comments having a value smaller than the propensity index are rapidly lowered. In other words, the index was applied to the extent to which the reader suddenly receives mental stress due to malignancy.

도 2를 참조하면, 단계 S25를 수행한 후, 상기 자살 수치 측정을 통한 성향 지수를 재 계산한다(단계 S26). 도 7은 우울증 증세가 심각한 실험자로서 성향 지수가 지극히 낮은 경우에 보게 되는 게시물이다. 이 실험에서는 생성된 단어 DB 에 영향을 많이 받게 됨을 알 수 있었다. 단어 DB 를 생성한 댓글 평가 점수 역시 주관적인 평가로 이루어지고, 게시물을 보기 위한 초기 우울증 테스트 측정에서도 실험자들의 주관적인 평가로 구성되므로 실험 결과 역시 이들 실험자들의 성향에 높은 의존도를 보였다. 명세서의 전반부에 언급했듯이 주위에 기대를 받고 있는 유망주 스트레스가 있는 사람, 내적인 스트레스를 우울증 테스트를 통해서 방출되지 못하는 사람은 이러한 주관적인 테스트 자체가 소용없는 경우이다. 이들은 아무 이유없이 어느 날 갑자기 자살에 이를 수 있는 타입들이다. 따라서, 더욱 정확한 필터링이 이루어지려면 제안한 자살 수치 가상 측정기를 이용하여 각 댓글을 읽으면서 시시각각 변하는 세밀한 자살 수치 측정에 의한 수치들이 성향 지수에 반영되어서 댓글 필터링이 되어야 한다. Referring to FIG. 2, after performing step S25, the propensity index through the suicide value measurement is recalculated (step S26). FIG. 7 is a post seen when the propensity index is extremely low as a serious experimenter with depression. In this experiment, we can see that the generated word DB is affected a lot. The comment scores that generated the word DB were also subjective, and the initial depression test for the posts consisted of subjective evaluations of the experimenters. As mentioned in the first half of the specification, those with prospective stress who are expected to be around, and those who do not release internal stress through the depression test, are cases where this subjective test itself is useless. These are the types that can suddenly kill themselves one day for no reason. Therefore, in order to achieve more accurate filtering, it is necessary to filter comments by reading each comment by using the proposed suicide virtual meter, which is reflected in the tendency index.

본 발명에 따른 방법은 현재 일어나고 있는 자살을 IT와 연관지어서 해결해보고자 하는 기초 이론적인 발명이다. 현재 의학 분야에서는 전기 전자 컴퓨터 공학, 물리학 등의 첨단 기술이 도입된 의용 공학이 실제 업무에 적용되고 있다. 본 발명에서 제안하는 것처럼 의용 공학과 IT를 접목하면 인터넷이나 UCC에 의학적 이론이 접목되어 인간의 생활을 더욱 윤택하게 만들 수 있을 것이다. 본 발명은 단순한 IT 기능만을 의학적인 이론에 적용한 발명이지만, 여기서 제안한 대로 의용공학에서 실제 자살 수치 측정기가 도입된다면 현실에서 의용 공학과 IT가 접목이 가능할 것이다. 아동 폭력은 대상자가 자라나서 또 다른 폭력이나 자살을 부르는 심각한 사회적 불안 요소를 갖는다. 제안하는 방식을 아동 학대를 받는 아동의 보청기에 적용한다면 부모나 친지 등 아동 폭력을 행사할 수 있는 소리가 현재 아이의 스트레스에 따라 소리를 필터링하는데도 사용할 수 있을 것이다. 앞으로 뇌과학 분야를 포함하여 의용 공학과 IT 분야를 더욱더 전문적으로 연구하여, 실생활에 적용될 수 있을 것이다. The method according to the present invention is a basic theoretical invention which attempts to solve the current suicide in association with IT. In the medical field, medical engineering with advanced technologies such as electro-electronic computer engineering and physics is applied to practical work. As suggested by the present invention, if medical science and IT are combined, medical theory may be combined with the Internet or UCC to make human life more profitable. The present invention is an invention in which only a simple IT function is applied to medical theory, but if the actual suicide measurer is introduced in medical engineering, medical engineering and IT may be combined in reality. Child violence has a serious social anxiety factor that causes the subject to grow and cause another violence or suicide. If the proposed method is applied to hearing aids of children who are being abused, the sounds that can be used for child violence such as parents or relatives can be used to filter the sounds according to the stress of the current child. In the future, the medical engineering and IT fields, including the brain science field, will be studied more professionally and applied to real life.

Claims (9)

(i) 실험에 참여한 사람들이 댓글들에 주관적으로 평가하고 상기 주제글과 댓글들 간의 공통 단어에 대한 평가 지수 평균으로 얻은 단어별 평균 평가 지수로 상기 댓글의 단어 데이터베이스를 생성하는 단계;(i) generating a word database of the comments by means of word-by-word average ratings obtained by subjects evaluating the comments subjectively and evaluating average scores for common words between the topic and the comments; (ii) 우울증 테스트를 통한 사용자 성향 지수를 측정하는 단계;(ii) measuring a user disposition index through the depression test; (iii) 상기 단어별 평균 평가 지수를 기반으로 새로 입력된 주제글과 댓글들에 대하여 평가 지수를 자동 평가하는 단계; 및(iii) automatically evaluating an evaluation index on newly inputted topics and comments based on the word-based average rating index; And (iv) 상기 사용자 성향 지수에 따라 상기 댓글들을 자동 필터링하는 단계를포함하는 댓글 자동 필터링 방법. (iv) filtering the comments automatically according to the user propensity index. 제1 항에 있어서, 자신의 주제글에 대한 댓글 각각에 대하여 세로토닌 수치, 뇌척수액의 5-HIAA 수치, 노드아드레날린계의 개수, 오메가-3 필수 지방산의 감소 정도에 따라 상기 댓글이 악성 댓글 또는 양성 댓글인 지를 판단하는 댓글 자동 필터링 방법.  The method of claim 1, wherein the comment is a malicious comment or a positive comment according to the serotonin level, the 5-HIAA level of the cerebrospinal fluid, the number of node adrenergic systems, and the degree of reduction of omega-3 essential fatty acids for each comment on the topic. How to filter comments automatically. 제1 항에 있어서, 단계 (i)에서 상기 댓글의 단어들은 상기 단어별 평균 평가 지수는 상기 평가 지수가 양수인 값들을 집합으로 구성된 양성 단어 집합, 상기 평가 지수가 음수인 값들의 집합으로 구성된 악성 단어 집합, 및 카테고리에 따라서 양성 또는 악성 단어들이 분류되며, 주제에 상관없는 악성 단어들로 구성된 별도의 집합으로 구분하여 상기 단어 데이터베이스에 저장되는 댓글 자동 필터링 방법. According to claim 1, wherein the words of the comment in the step (i) is the average word-by-word average rating index is a positive word set consisting of a set of values that the evaluation index is positive, a malicious word consisting of a set of values that the negative evaluation index Positive or malicious words are classified according to a set and a category, and are automatically stored in the word database by dividing them into a separate set of malicious words irrelevant to a subject. 제1 항에 있어서, 단계 (iii)는The method of claim 1, wherein step (iii) (iii-1) 상기 댓글들에 포함된 각 단어를 분리하는 단계;(iii-1) separating each word included in the comments; (iii-2) 상기 분리된 단어들 중 단계 (i)의 상기 단어 데이터베이스에서 존재하는 단어들 중에 포함된 단어들의 평가 점수를 모두 합산하는 단계;(iii-2) summing all the evaluation scores of the words included among the words existing in the word database of step (i) among the separated words; (iii-3) 상기 합산한 평가 지수를 상기 단어 데이터베이스에 속하는 단어 개수로 나누어 얻은 결과값을 상기 댓글들의 평가 지수로 결정하는 단계를 포함하는 댓글 자동 필터링 방법. and (iii-3) determining a result value obtained by dividing the sum of the evaluation indexes by the number of words belonging to the word database as the evaluation index of the comments. 제1 항에 있어서, 단계 (iv)에서, 자신이 글쓴이 주체가 아닌 타인의 글에 보게 될 때는 댓글에 대해서 성향 지수가 -3 이하의 댓글만 필터링하도록 하고, 자신이 글쓴이 주체가 되는 주제글의 댓글들은 글쓴이의 성향지수에 따라 평가지수가 (-성향지수+1)/2 이하의 글은 게시되지 않도록 하고 (-성향지수+1)/2 이상인 양성 댓글만 볼 수 있게 필터링하는 댓글 자동 필터링 방법.The method of claim 1, wherein in step (iv), when the post is viewed by a person other than the writer's subject, the inclination index of the comment is filtered to be a comment of -3 or less, and the subject of which the subject is the writer is Comments are automatically filtered to prevent only posts with an evaluation index of (-Disposition Index + 1) / 2 from being posted and only view positive comments with (-Disposition Index + 1) / 2 or higher, depending on the author's disposition index. . 제1 항에 있어서, (v) 댓글 점에 따라 상기 사용자 성향 지수를 수정하는 단계를 더 포함하는 댓글 자동 필터링 방법. The method of claim 1, further comprising: (v) modifying the user propensity index according to a comment point. (a) 실험에 참여한 사람들이 댓글들에 주관적으로 평가하고 상기 주제글과 댓글들 간의 공통 단어에 대한 평가 지수 평균으로 얻은 단어별 평균 평가 지수로 상기 댓글의 단어 데이터베이스를 생성하는 단계;(a) subjecting the experiment subjectively to the comments, and generating a word database of the comments with an average rating index for each word obtained as an average of the evaluation indexes for the common words between the topic and the comments; (b) 자살 수치 측정을 통한 사용자 성향 지수를 측정하는 단계;(b) measuring a user disposition index through measuring suicide values; (c) 상기 단어별 평균 평가 지수를 기반으로 새로 입력된 주제글과 댓글들에 대하여 평가 지수를 자동 평가하는 단계; 및(c) automatically evaluating an evaluation index on newly inputted topics and comments based on the word-based average rating index; And (d) 상기 사용자 성향 지수에 따라 상기 댓글들을 자동 필터링하는 단계를 포함하는 자동 댓글 필터링 방법.and (d) automatically filtering the comments according to the user propensity index. 제7 항에 있어서, 단계 (b)의 자살 수치 측정을 통한 사용자 성향 지수는 다음 수학식 에 의해 얻어지며, 여기서, α 값은 정상적인 사람의 4 가지 생리적 자살 수치의 평균값을 나타내고, w 값은 댓글의 악성이나 양성 강도에 따라 적절한 비율이 나오도록 신경망을 통하여 적응적으로 적절히 조절되는 상수인 댓글 자동 필터링 방법.According to claim 7, wherein the user tendency index through the suicide value measurement of step (b) is Where α represents the mean of four physiological suicides in a normal person, and w is a constant that is appropriately adaptively adjusted through the neural network to yield an appropriate rate based on the malignant or benign intensity of the comment. How to auto filter comments. 제7 항에 있어서, (e) 상기 자살 수치 측정을 통한 성향 지수를 재 계산하는 단계를 더 포함하는 댓글 자동 필터링 방법.The method of claim 7, further comprising: (e) recalculating a propensity index through the suicide measure.
KR1020080028591A 2008-03-27 2008-03-27 Automatic ripple filtering method KR20090103171A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020080028591A KR20090103171A (en) 2008-03-27 2008-03-27 Automatic ripple filtering method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020080028591A KR20090103171A (en) 2008-03-27 2008-03-27 Automatic ripple filtering method

Publications (1)

Publication Number Publication Date
KR20090103171A true KR20090103171A (en) 2009-10-01

Family

ID=41532734

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080028591A KR20090103171A (en) 2008-03-27 2008-03-27 Automatic ripple filtering method

Country Status (1)

Country Link
KR (1) KR20090103171A (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101136725B1 (en) * 2009-10-23 2012-04-17 박정원 Contents service system and method
KR20220067621A (en) 2020-11-17 2022-05-25 문종민 Method for determining bad comments and evaluating malicious comments
WO2022119203A1 (en) * 2020-12-03 2022-06-09 주식회사 큐티티 System for suppressing comment-based distorted behaviors
KR20230049354A (en) * 2021-10-06 2023-04-13 건국대학교 산학협력단 Malicious comment filter device and method
KR20230051354A (en) 2021-10-08 2023-04-18 문종민 Method for evaluating malicious comments
KR20230101235A (en) 2021-12-29 2023-07-06 주식회사 큐티티 Comment evaluation system using loyalty factor evaluation

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101136725B1 (en) * 2009-10-23 2012-04-17 박정원 Contents service system and method
KR20220067621A (en) 2020-11-17 2022-05-25 문종민 Method for determining bad comments and evaluating malicious comments
WO2022119203A1 (en) * 2020-12-03 2022-06-09 주식회사 큐티티 System for suppressing comment-based distorted behaviors
KR20220078351A (en) 2020-12-03 2022-06-10 주식회사 큐티티 Comment-based distortion behavior suppression system
KR20230049354A (en) * 2021-10-06 2023-04-13 건국대학교 산학협력단 Malicious comment filter device and method
KR20230051354A (en) 2021-10-08 2023-04-18 문종민 Method for evaluating malicious comments
KR20230101235A (en) 2021-12-29 2023-07-06 주식회사 큐티티 Comment evaluation system using loyalty factor evaluation

Similar Documents

Publication Publication Date Title
Thorstad et al. Predicting future mental illness from social media: A big-data approach
Cooke et al. Measuring well-being: A review of instruments
Ogihara et al. Are common names becoming less common? The rise in uniqueness and individualism in Japan
Barcaccia et al. Defining quality of life: a wild-goose chase?
Orford et al. PGSI and DSM-IV in the 2007 British Gambling Prevalence Survey: Reliability, item response, factor structure and inter-scale agreement
Gomm Social research methodology: A critical introduction
Wellington et al. Research methods for the social sciences
Taylor Searching for similarity using corpus-assisted discourse studies
Tang et al. Associations between Chinese EFL graduate students' beliefs and language learning strategies
Yoon et al. Category norms as a function of culture and age: comparisons of item responses to 105 categories by american and chinese adults.
Carpenter Meta-analyses of sex differences in responses to sexual versus emotional infidelity: Men and women are more similar than different
Grinnell Jr et al. Social work research and evaluation: Foundations of evidence-based practice
KR20090103171A (en) Automatic ripple filtering method
CN112927782B (en) Heart health state early warning system based on text emotion analysis
Caprara et al. A personological approach to the study of aggression
Lambert et al. The social context of school bullying: Evidence from a survey of children in South Wales
He Text mining and IRT for psychiatric and psychological assessment
Karademir Coskun et al. Students' Profiles of Information Seeking Behaviors on Facebook: Relations to Personality, Time Management, Gender, and Facebook Use.
Rubin The classification and statistical manual of mental health concerns: A proposed practical scientific alternative to the DSM and ICD
WO2020155118A1 (en) Teaching test item matching method, apparatus and device
Vadevelu et al. Emotion and problem focused coping by transgender adolescents and young adults with family social support and exclusion: A case study in Southern Thailand
Tadisetty et al. Anonymous prediction of mental illness in social media
Schield Teaching the social construction of statistics
Sarić et al. Identification of alcohol addicts among high school students using decision tree based algorithm
Van Praag et al. Beyond disciplinary blind spots: a systematic review of research on ethnicity and race in secondary education using automated text analysis

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application