KR100926448B1 - System and Method for Determining Adult Contents - Google Patents

System and Method for Determining Adult Contents Download PDF

Info

Publication number
KR100926448B1
KR100926448B1 KR1020080033575A KR20080033575A KR100926448B1 KR 100926448 B1 KR100926448 B1 KR 100926448B1 KR 1020080033575 A KR1020080033575 A KR 1020080033575A KR 20080033575 A KR20080033575 A KR 20080033575A KR 100926448 B1 KR100926448 B1 KR 100926448B1
Authority
KR
South Korea
Prior art keywords
adult
index
skin
determining
image
Prior art date
Application number
KR1020080033575A
Other languages
Korean (ko)
Other versions
KR20090108248A (en
Inventor
박근한
정성원
이현수
김지승
이상호
Original Assignee
엔에이치엔(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엔에이치엔(주) filed Critical 엔에이치엔(주)
Priority to KR1020080033575A priority Critical patent/KR100926448B1/en
Publication of KR20090108248A publication Critical patent/KR20090108248A/en
Application granted granted Critical
Publication of KR100926448B1 publication Critical patent/KR100926448B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

대상물로부터 수집한 이미지 및 텍스트를 사용하여 성인 지수를 결정하고, 그 성인 지수를 사용하여 대상물의 성인물 여부를 판단할 수 있는 본 발명의 일 실시예에 따른 성인물 판단 방법은 대상물로부터 수집된 입력 이미지의 성인 이미지 관련도를 나타내는 스킨 지수(skin index)를 결정하는 단계; 상기 대상물로부터 수집된 입력 텍스트의 성인 용어 관련도를 나타내는 텍스트 성인 지수를 결정하는 단계; 상기 스킨 지수 및 텍스트 성인 지수를 사용하여 성인 지수를 결정하는 단계; 및 상기 성인 지수에 따라 상기 대상물의 성인물 여부를 판단하는 단계를 포함하는 것을 특징으로 한다.Adult content determination method according to an embodiment of the present invention that can determine the adult index by using the image and text collected from the object, the adult index using the adult index of the input image collected from the object Determining a skin index indicative of adult image relevance; Determining a textual adult index indicating an adult term relevance of the input text collected from the object; Determining an adult index using the skin index and the text adult index; And determining whether the object is an adult according to the adult index.

성인 지수, 스킨 지수, 텍스트 성인 지수 Adult index, skin index, text adult index

Description

성인물 판단 방법 및 시스템{System and Method for Determining Adult Contents}System and Method for Determining Adult Contents}

본 발명은 성인물 판단 방법 및 시스템에 관한 것으로서 보다 상세하게는 대상물로부터 수집한 웹페이지 문서, 이미지, 동영상 등으로부터 스킨 지수(skin index) 및 텍스트 성인 지수(text adult index)를 결정하고, 스킨 지수 및 텍스트 성인 지수를 사용하여 결정한 성인 지수로써 대상물의 성인물 여부를 판단하는 방법 및 시스템에 관한 것이다.The present invention relates to a method and system for determining adult material, and more specifically, a skin index and a text adult index are determined from a webpage document, an image, a video, etc. collected from an object. The present invention relates to a method and system for determining whether an object is adult or not as an adult index determined using a text adult index.

대중매체의 발달로 인하여 성인물이 가정에 본격적으로 침투하고 있는 상태이며, 대표적인 대중 매체로서 인터넷 상의 웹페이지 또는 웹사이트를 통해, 청소년들이 유해한 성인물을 접하고 있다. 또한, 대부분의 가정에서는 청소년들이 컴퓨터를 사용하여 용이하게 각종 웹사이트에 접속하고 있으며 쉽게 성인물에 접할 수 있는 실정이다.Due to the development of mass media, adult content is infiltrating into the home in earnest, and teenagers are exposed to harmful adult content through web pages or websites on the Internet. In addition, in most families, teenagers are easily accessing various websites using computers, and are easily accessible to adult content.

따라서, 인터넷 사이트 제공자는 자신이 운영하는 웹사이트에서 소정의 인증 과정 없이 성인물이 제공되지 않도록 각종 멀티미디어 콘텐츠에 대해 검수 과정을 거치고 있다.Therefore, the Internet site provider is undergoing a screening process for various multimedia content so that adult content is not provided without a predetermined authentication process on the website operated by the Internet site provider.

특히, 검색 사이트 제공자 또는 포탈 사이트 제공자의 경우, 자신이 운영하는 웹사이트를 통해 소정의 성인 사이트에 접속하거나 성인물을 다운로드 받지 못하도록 성인 사이트의 유알엘(URL) 또는 이미지, 동영상 등의 콘텐츠가 성인물과 관련되어 있음을 경고하거나, 성인 사이트에 관련된 호스트로의 접속 또는 성인물로의 접근을 차단하고 있다.In particular, in the case of a search site provider or a portal site provider, content such as URLs or images or videos of an adult site is associated with adult content so that a user cannot access or download a certain adult site through a website operated by the user. It warns you that you have a problem, or blocks access to or related to adult sites.

그리고, 검색 사이트 제공자 또는 포탈 사이트 제공자는 검사 대상인 호스트, 웹페이지, 웹사이트 등으로부터 이미지, 동영상 등을 획득하여 이들이 성인물 제공자인지 또는 이들로부터 획득한 이미지, 동영상 등이 성인물인지를 검수하고 있다.In addition, the search site provider or the portal site provider acquires an image, a video, and the like from a host, a web page, a website, or the like, which is an inspection object, and checks whether they are an adult provider or an image, a video, etc. obtained from the adult.

나아가, 웹페이지, 이미지 게시물, 동영상 게시물 등은 검색 사이트 또는 포탈 사이트를 경유하여 여러 사용자에게 제공되기 때문에, 검색 사이트 제공자 또는 포탈 사이트 제공자는 상술한 콘텐츠가 성인물인지 미리 검수함으로써 사용자에게 성인물을 노출시키는 확률을 최소화하려 하고 있다.Furthermore, since web pages, image posts, video posts, etc. are provided to multiple users via a search site or portal site, the search site provider or portal site provider exposes the adult content to the user by checking in advance whether the aforementioned content is adult content. We are trying to minimize the probability.

그런데, 성인물 판단을 위한 검수 대상이 급속도로 증가하여 검수자가 일일이 목적한 시간 내에 검수를 마칠 수 없게 됨에 따라, 빠르고 자동적으로 검수를 수행하여 검사자의 실수를 방지하고 재검수까지도 가능하게 하는 방법이 필요하게 되었으나, 아직 효과적인 성인물 판단 방법이 제시되지 않고 있다.However, as the number of inspection objects for judging adult content increases rapidly and the inspectors cannot finish the inspection within the intended time, there is a need for a method to prevent the mistakes of the inspectors and even to reinspect the inspection by performing the inspection quickly and automatically. However, there is no effective method of judging adult content yet.

특히, 이미지, 동영상 등의 콘텐츠의 경우, 성인물 판단을 위해 이미지 프로세싱을 사용할 필요가 있으나, 그 이미지 프로세싱에 대한 방법 및 절차가 불명확하다는 문제가 있었다.In particular, in the case of content such as an image or a video, it is necessary to use image processing to determine adult content, but there is a problem in that the method and procedure for the image processing are unclear.

또한, 검수 대상에 대해 우선 순위를 정하여 시간 대비 성인물 검출 비율을 획기적으로 높일 수 있는 방법이 필요하게 되었으나, 그 우선 순위를 정하고 성인물 관련 정도를 나타내는 지수(index)의 결정 방법이 불명확하다는 문제가 있었다.In addition, there is a need for a method to significantly increase the detection rate of adult objects over time by setting priorities for inspection targets, but there is a problem that the method of determining an index indicating the priority and the degree of related adult content is unclear. .

본 발명은 상술한 문제점을 해결하기 위한 것으로서, 자동화된 방법으로 빠르게 성인물 여부를 검수하여 성인물 여부를 판단할 수 있는 성인물 판단 방법 및 시스템을 제공하는 것을 그 기술적 과제로 한다.The present invention is to solve the above problems, to provide a method and system for determining adult material that can determine whether adult content by quickly inspecting the adult content in an automated method as its technical problem.

또한, 본 발명은 검수 대상물로부터 수집한 이미지, 동영상 등의 콘텐츠 등에 대해, 검수를 위한 명확한 이미지 프로세싱 방법 및 절차를 제공하는 것을 그 기술적 과제로 한다.In addition, the present invention is to provide a clear image processing method and procedure for the inspection of the content, such as image, video, and the like collected from the inspection object as its technical problem.

또한, 본 발명은 성인물 판단을 위해 검수의 우선 순위를 정하고 성인물 관련 정도를 나타낼 수 있는 지수를 결정하는 방법 및 절차를 제공하는 것을 그 기술적 과제로 한다.In addition, the present invention is to provide a method and procedure for determining the priority of the inspection for determining the adult content and determine the index that can indicate the degree of adult content.

상술한 목적을 달성하기 위한 본 발명의 일 측면에 따른 성인물 판단 방법은 대상물로부터 수집된 입력 이미지의 성인 이미지 관련도를 나타내는 스킨 지수(skin index)를 결정하는 단계; 상기 대상물로부터 수집된 입력 텍스트의 성인 용어 관련도를 나타내는 텍스트 성인 지수를 결정하는 단계; 상기 스킨 지수 및 텍스트 성인 지수를 사용하여 성인 지수를 결정하는 단계 및 상기 성인 지수에 따라 상기 대상물의 성인물 여부를 판단하는 단계를 포함하는 것을 특징으로 한다.Adult object determination method according to an aspect of the present invention for achieving the above object comprises the steps of determining a skin index (skin index) indicating the adult image relatedness of the input image collected from the object; Determining a textual adult index indicating an adult term relevance of the input text collected from the object; Determining the adult index using the skin index and the text adult index, and determining whether the object is an adult according to the adult index.

상술한 목적을 달성하기 위한 본 발명의 일 측면에 따른 성인물 판단 시스템은 대상물로부터 수집된 입력 이미지의 성인 이미지 관련도를 나타내는 스킨 지수(skin index)를 결정하는 스킨 지수 결정부; 상기 대상물로부터 수집된 입력 텍스트의 성인 용어 관련도를 나타내는 텍스트 성인 지수를 결정하는 텍스트 성인 지수 결정부; 상기 스킨 지수 및 텍스트 성인 지수를 사용하여 성인 지수를 결정하는 성인 지수 결정부; 및 상기 성인 지수에 따라 상기 대상물의 성인물 여부를 판단하는 성인물 판단부를 포함하는 것을 특징으로 한다.In accordance with an aspect of the present invention, there is provided a system for determining adult material, comprising: a skin index determiner configured to determine a skin index representing an adult image related degree of an input image collected from an object; A text adult index determination unit for determining a text adult index indicating an adult term relevance of the input text collected from the object; An adult index determiner that determines an adult index using the skin index and the text adult index; And an adult material determining unit determining whether an adult object of the object is based on the adult index.

상술한 바와 같이 본 발명에 따르면, 성인물 검수를 위한 검수 대상의 양이 많음에도 불구하고, 빠르고 자동적으로 검수를 수행할 수 있게 하는 성인물 판단 방법 및 시스템을 제공하는 효과가 있다.As described above, according to the present invention, there is an effect of providing a method and system for determining adult material, which enables to perform the inspection quickly and automatically despite the large amount of inspection targets for adult content inspection.

또한, 본 발명에 따르면, 검수 대상으로부터 획득한 이미지를 분석하여 성인물 여부를 판단할 수 있도록, 명확한 이미지 프로세싱 방법 및 절차를 제공하는 효과가 있다.In addition, according to the present invention, there is an effect of providing a clear image processing method and procedure to determine whether or not adult content by analyzing the image obtained from the inspection target.

또한, 본 발명에 따르면, 검수 대상으로부터 수집한 콘텐츠의 성인물 관련 정도를 나타내는 성인 지수에 의해 검수 대상의 우선 순위를 정할 수 있고, 성인 지수를 참고하여 성인물 여부를 판단할 수 있는 효과가 있다. 따라서, 성인 지수를 통해 사용자로의 접근이 차단될 성인물 여부 또는 재검수가 필요한 성인물 여부를 판단할 수 있다.In addition, according to the present invention, the priority of the inspection target can be determined by the adult index indicating the degree of adult-related content of the content collected from the inspection target, and the adult index can be determined by referring to the adult index. Therefore, the adult index may determine whether adult content to be blocked from access to the user or adult content requiring re-examination.

본 발명의 실시예에 대한 상세한 설명을 하기 이전에 본 발명에서 사용된 성인 지수(adult index)란 용어에 대해 간략히 설명한다.Before the detailed description of the embodiments of the present invention, the term adult index used in the present invention will be briefly described.

성인 지수는 검수 대상물인 이미지 콘텐츠, 동영상 콘텐츠, 호스트, 블로그, 웹페이지, 웹사이트, 게시판, BBS, 미니 홈피, 카페 등으로부터 수집한 이미지의 성인물 관련도를 나타낸다. 즉, 성인 지수는 검수 대상물이 성인물일 가능성을 의미한다.The adult index indicates the adult content relatedness of images collected from image contents, video contents, hosts, blogs, web pages, websites, bulletin boards, BBS, mini homepages, cafes, etc. In other words, the adult index means that the inspected object is an adult object.

따라서, 검색 사이트 제공자 또는 포탈 사이트 제공자는 성인 지수를 알면, 성인 지수를 사용하여 검수 대상물이 사용자로의 접근이 차단되어야 하는 성인물인지 여부 또는 재검수가 필요한 성인물인지 여부 등을 판단할 수 있다.Therefore, when the search site provider or the portal site provider knows the adult index, the adult index may be used to determine whether the subject to be inspected is an adult to be blocked from access to the user or an adult to be re-examined.

상술한 검수 대상물은 이미지 콘텐츠, 동영상 콘텐츠, 호스트, 블로그, 웹페이지, 웹사이트, 카페, 미니 홈피 및 BBS(Bulletin Board System) 중 적어도 하나를 포함할 수 있다. The inspection object may include at least one of an image content, a video content, a host, a blog, a web page, a website, a cafe, a mini homepage, and a bulletin board system (BBS).

이하에서는 설명의 편의를 위해 검수 대상물이 호스트인 것으로 설명한다. 즉, 본 발명의 일 실시예에 따른 성인물이 성인 호스트인 것을 일 예로 하여, 성인 호스트 판단 방법 및 시스템을 설명한다.Hereinafter, for convenience of explanation, the inspection object is described as a host. That is, an adult host determination method and system will be described using an example that an adult is an adult host according to an embodiment of the present invention.

이하 첨부된 도면을 참조하여 본 발명의 실시예에 대해 상세히 설명한다.Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings.

도 1은 본 발명의 일 실시예에 따른 성인 호스트 판단 시스템의 개략적인 블록도이다.1 is a schematic block diagram of an adult host determination system according to an embodiment of the present invention.

본 발명의 일 실시예에 따른 성인 호스트 판단 시스템(102)은 스킨 지수 결 정부(104), 텍스트 성인 지수 결정부(106), 성인 지수 결정부(108) 및 성인 호스트 판단부(110)를 포함한다.The adult host determination system 102 according to an embodiment of the present invention includes a skin index determination 104, a text adult index determination unit 106, an adult index determination unit 108, and an adult host determination unit 110. do.

성인 호스트 판단 시스템(102)은 검수 대상인 호스트로부터 웹페이지 문서, 이미지 게시물, 동영상 게시물 등의 콘텐츠를 수집한다. 또한, 성인 호스트 판단 시스템(102)은 호스트로부터 수집된 후 소정의 데이터베이스에 저장된 웹페이지 문서, 이미지 게시물, 동영상 게시물 등의 콘텐츠를 수신할 수도 있다.The adult host determination system 102 collects content such as web page documents, image posts, video posts, etc. from the host to be inspected. In addition, the adult host determination system 102 may receive content such as web page documents, image posts, video posts, and the like, collected from a host and stored in a predetermined database.

그리고, 성인 호스트 판단 시스템(102)은 이미지 프로세싱에 의해 검수 대상 호스트로부터 추출한 이미지에 대한 스킨 지수(skin index)를 결정하고, 호스트가 제공하는 웹페이지 문서, BBS, 이미지, 동영상 또는 유알엘(URL) 등에서 추출한 텍스트(text)를 분석하여 텍스트 성인 지수를 결정한다. 그리고, 그 지수들에 따라 성인 지수를 결정한 후, 성인 지수에 따라 상기 호스트가 성인 호스트 인지 여부를 판단한다. The adult host determination system 102 determines a skin index for an image extracted from the inspected target host by image processing, and provides a web page document, a BBS, an image, a video, or a URL provided by the host. The text adult index is analyzed by analyzing the text extracted from the back. After determining the adult index according to the indexes, it is determined whether the host is an adult host according to the adult index.

그리고, 그 판단 결과를 검색 사이트, 포탈 사이트 등의 운영자에게 전송한다. 이후 검색 사이트, 포탈 사이트 등의 운영자는 수신한 성인 호스트 판단 결과에 따라 해당 호스트 및 호스트로부터 획득한 콘텐츠를 사용자에게 제공할지 또는 재검수할지 여부를 결정하게 된다.The determination result is then transmitted to the operator of the search site, portal site, and the like. Thereafter, the operator of the search site, the portal site, or the like determines whether to provide or re-examine the host and the content obtained from the host according to the received adult host determination result.

스킨 지수 및 텍스트 성인 지수를 개념적으로 간략히 설명하면, 스킨 지수는 호스트로부터 획득한 이미지가 갖는 살색 계통의 컬러(color) 영역의 비율, 즉 신체의 노출 정도를 의미한다. 그리고, 텍스트 성인 지수는 호스트로부터 획득한 텍스트가 성인 용어(adult term)와 얼마나 관련도가 높은지를 의미한다.Conceptually briefly describing the skin index and the text adult index, the skin index refers to the ratio of the color region of the skin color line of the image acquired from the host, that is, the degree of exposure of the body. In addition, the text adult index means how relevant the text obtained from the host is to an adult term.

이하, 스킨 지수 결정을 위해 성인 호스트 판단 시스템(102)이 호스트로부터 획득한 이미지를 입력 이미지라 하고, 텍스트 성인 지수 결정을 위해 호스트로부터 획득한 텍스트를 입력 텍스트라 하겠다.Hereinafter, an image acquired by the adult host determination system 102 from the host for determining the skin index is referred to as an input image, and text obtained from the host for determining the text adult index is referred to as input text.

성인 호스트 판단 시스템(102)은 성인 지수를 호스트 검수의 우선 순위를 정하는 척도로 사용할 수 있다. 예컨데, 성인 지수가 낮은 검수 대상 호스트에 대해서 우선 순위가 높은 성인 호스트가 아니라고 판단하고, 그 검수 대상 호스트가 사용자에게 제공되도록 성인 호스트 판단 결과를 출력할 수 있다. 따라서, 검색 사이트, 포탈 사이트 등의 운영자는 성인 지수가 낮은 검수 대상 호스트에 대해서는 추후 재검수를 하지 않게 된다.The adult host determination system 102 may use the adult index as a measure of prioritizing host inspection. For example, it may be determined that the inspection target host having a low adult index is not a high priority adult host, and the adult host determination result may be output so that the inspection target host is provided to the user. Therefore, the operator of the search site, portal site, etc. do not re-examine the host to be inspected with a low adult index later.

이하, 도 2 내지 도 4을 통해 스킨 지수 결정부(104)의 구성 및 동작에 대해 설명한다.Hereinafter, the configuration and operation of the skin index determiner 104 will be described with reference to FIGS. 2 to 4.

도 2는 본 발명의 일 실시예에 따른 스킨 지수 결정부(104)를 나타낸 개략적인 블록도로서, 스킨 지수 결정부(104)는 트레이닝부(202), 컬러 분석부(204), 살색 영역 결정부(206), 스킨 영역 결정부(208) 및 스킨 지수 산출부(210)를 포함한다.2 is a schematic block diagram illustrating a skin index determiner 104 according to an embodiment of the present invention, wherein the skin index determiner 104 includes a training unit 202, a color analyzer 204, and a skin color area determination unit. The unit 206 includes a skin region determiner 208 and a skin index calculator 210.

스킨 지수 결정부(104)는 호스트부터 수집된 입력 이미지의 성인 이미지 관련도를 나타내는 스킨 지수(skin index)를 결정한다. 여기서, 호스트로부터 수집된 입력 이미지는 호스트가 운영하는 웹사이트, 웹페이지, 게시판 등으로부터 획득하거나, 호스트가 제공하는 이미지 게시물 또는 동영상 게시물로부터 추출한 이미지이며, 스킨 지수 결정부(104)가 직접 입력 이미지를 수집하거나, 이미 수집된 입력 이미지를 수신할 수 있다.The skin index determiner 104 determines a skin index indicating an adult image relevance of the input image collected from the host. Here, the input image collected from the host is an image obtained from a website, a web page, a bulletin board, or the like operated by the host, or an image extracted from an image post or a video post provided by the host, and the skin index determiner 104 directly inputs the image. May be collected or an input image already collected may be received.

트레이닝부(202)는 제1 트레이닝 셋(training set)을 사용하여 살색 범위를 결정하는 트레이닝을 수행하고, 살색 범위에 따라 살색 계통을 정의한다. 트레이닝부(202)에서 정의된 살색 계통에 의해 살색 영역 결정부(206)는 호스트로부터의 입력 이미지가 상기 살색 계통의 컬러 영역을 포함하는지 여부를 판단하게 된다.The training unit 202 performs a training for determining a flesh color range using a first training set, and defines a flesh color line according to the flesh color range. Based on the color scheme defined in the training unit 202, the color region determination unit 206 determines whether the input image from the host includes the color region of the color scheme.

트레이닝부(202)는 제1 트레이닝 셋에 포함된 이미지들을 사용하여 지식 데이터베이스를 훈련(train)시킴으로써 살색 계통의 컬러를 정의하는 살색 범위를 결정한다. 여기서, 트레이닝부(202)는 상기 살색 범위를 훈련된 이미지들의 상대적 RGB들을 사용하여 결정한다.The training unit 202 determines a skin color range that defines the color of the skin color system by training the knowledge database using the images included in the first training set. Here, the training unit 202 determines the flesh color range using the relative RGB of the trained images.

여기서, 상대적 RGB(relative RGB)는 그 정의에 의해 이미지에 대한 휘도(luminance)의 영향을 대체적으로 무시하기 위해 사용된다. 따라서, 밝은 영상이나 어두운 영상을 가진 이미지들이 모두 비슷한 상대적 RGB값을 가지면 같은 컬러 영역에 속하는 것으로 판별한다. 즉 살색을 띈 색상의 경우, 어두운 살색과 밝은 살색 모두 같은 컬러 영역에 속하는 것으로 판단한다.Here, relative RGB is used by its definition to largely ignore the effect of luminance on the image. Therefore, if all images having a bright image or a dark image have similar relative RGB values, it is determined that they belong to the same color region. That is, in the case of a flesh-colored color, it is determined that both the dark skin color and the light skin color belong to the same color region.

이는 이미지의 살색 계통의 컬러 영역 판단 시, 빛의 영향과 인종의 영향을 모두 최소화하기 위함이다. 그리고, 이미지의 상대적 RGB값은 상기 이미지의 RGB를 이용하여 하기 수학식 1로써 나타낼 수 있다.This is to minimize the influence of both light and race when judging the color gamut of the skin color system of the image. The relative RGB value of the image may be represented by Equation 1 using RGB of the image.

상대적 R = R/(R+G+B);Relative R = R / (R + G + B);

상대적 G = G/(R+G+B);Relative G = G / (R + G + B);

상대적 B = B/(R+G+B);Relative B = B / (R + G + B);

상기 수학식 1은 R,G 또는 B값을 R+G+B값으로 나눔으로써 명암에 의한 차이점을 노말라이징(normalizing)하는 방법이다. R+G+B값은 대체적으로 픽셀의 밝고 어두움을 나타내는 특성이므로 상대적 RGB에서는 이에 대한 영향을 최소화할 수 있다. 상대적 RGB값은 그 정의에 의해 2개의 값만으로도 표현 가능하다. 즉, 상대적 R 및 G값만 알면 B값은 소정의 계산에 의해 알 수 있다.Equation 1 is a method of normalizing a difference by contrast by dividing an R, G or B value by an R + G + B value. The R + G + B values generally represent the light and darkness of the pixel, so the effect on relative RGB can be minimized. Relative RGB values can be represented by only two values by definition. In other words, if only the relative R and G values are known, the B value can be known by a predetermined calculation.

본 발명의 일 실시예에서는 제1 트레이닝 셋으로부터 스킨 색상의 범위로서 평균과 분산을 구하고, 살색 영역 결정부(206)에서 이 평균과 분산 내에 들어오는 입력 이미지의 픽셀 값들을 스킨 픽셀이라고 판별하게 된다.In an embodiment of the present invention, the average and the variance are obtained as the range of the skin color from the first training set, and the skin color area determiner 206 determines that the pixel values of the input image within the average and the variance are the skin pixels.

트레이닝부(202)는 제1 트레이닝 셋에서 훈련된 이미지들의 상대적 RGB값들로부터 살색 계통의 상대적 RGB 범위를 정의한다. 일 실시예에 있어서, 상기 살색 계통의 상대적 RGB 범위는 훈련된 이미지들의 상대적 RGB값들의 평균과 분산에 의해 정의될 수 있다.The training unit 202 defines a relative RGB range of the flesh color line from the relative RGB values of the images trained in the first training set. In one embodiment, the relative RGB range of the flesh line can be defined by the mean and variance of the relative RGB values of the trained images.

컬러 분석부(204)는 호스트로부터 획득한 이미지, 동영상 등으로부터 입력 이미지를 추출하고, 입력 이미지의 컬러를 분석한다. 변형된 실시예에 있어서, 컬러 분석부(204)는 입력 이미지를 직접 추출하지 않고, 단지 입력 이미지를 수신하여 컬러를 분석할 수 있다.The color analyzer 204 extracts an input image from an image, a video, and the like obtained from the host, and analyzes the color of the input image. In the modified embodiment, the color analyzer 204 may receive the input image and analyze the color without directly extracting the input image.

본 발명의 일 실시예에 있어서, 호스트로부터 획득한 콘텐츠가 이미지인 경우, 입력 이미지는 상기 이미지 콘텐츠일 수 있고, 상기 콘텐츠가 동영상인 경우, 입력 이미지는 동영상으로부터 캡춰(capture) 등의 방법으로 추출한 정지 영상일 수 있다.In an embodiment of the present invention, when the content obtained from the host is an image, the input image may be the image content, and when the content is a video, the input image is extracted from the video by a capture method or the like. It may be a still image.

컬러 분석부(204)는 상기 분석을 통해 입력 이미지를 구성하는 각 영역이 가지는 컬러를 획득하고, 그에 대한 컬러 정보를 생성한다. 여기서, 컬러 분석부(204)는 입력 이미지 픽셀의 상대적 RGB를 상기 컬러 정보로서 생성한다.The color analyzer 204 acquires the color of each region constituting the input image through the analysis and generates color information therefor. Here, the color analyzer 204 generates relative RGB of the input image pixel as the color information.

또한, 컬러 분석부(204)는 분석 결과인 컬러 정보에 의해 입력 이미지가 회색 계통의 컬러 영역으로 이루어졌는지 판단하고, 그 결과를 스킨 지수 산출부(210)에 통지한다. 이후, 스킨 지수 산출부(210)는 컬러 분석부(204)로부터 입력 이미지가 회색 계통의 컬러 영역으로 이루어졌다는 통지를 수신하면, 스킨 지수를 기준치로서 결정하게 된다. 이에 관하여는 상세히 후술한다.In addition, the color analyzer 204 determines whether the input image is composed of a color region of a gray system based on the color information that is an analysis result, and notifies the skin index calculator 210 of the result. Subsequently, when the skin index calculator 210 receives a notification from the color analyzer 204 that the input image is in the gray region, the skin index is determined as the reference value. This will be described later in detail.

살색 영역 결정부(206)는 컬러 분석부(204)의 분석 결과인 컬러 정보에 의해 입력 이미지가 살색 계통의 컬러 영역을 포함하는지 판단한다. 그리고, 입력 이미지가 살색 계통의 컬러 영역을 포함하는 경우, 입력 이미지로부터 상기 살색 계통의 컬러 영역 이미지를 획득한다. 여기서, 살색 영역 결정부(206)는 트레이닝부(202)에서 정의된 살색 계통을 사용하여 상기 입력 이미지가 살색 계통의 컬러 영역을 포함하는지 판단한다.The skin color area determiner 206 determines whether the input image includes the color region of the skin color line based on the color information that is the analysis result of the color analyzer 204. When the input image includes the color gamut of the flesh color line, a color gamut image of the skin color line is obtained from the input image. Here, the skin color area determiner 206 determines whether the input image includes the color area of the skin color line using the skin color line defined in the training unit 202.

일 실시예에 있어서, 컬러 분석부(204)의 분석 결과에 따른 입력 이미지의 상대적 RGB가 트레이닝부(202)에서 정의된 살색 계통의 상대적 RGB의 범위에 포함되는지 여부를 판단함으로써 상기 살색 계통의 컬러 영역의 포함 여부를 판단할 수 있다.In one embodiment, the color of the color scheme by determining whether the relative RGB of the input image according to the analysis result of the color analyzer 204 falls within the range of the relative RGB of the color scheme defined in the training unit 202. It may be determined whether the region is included.

본 발명의 일 실시예에서는 빛의 영향을 상대적으로 덜 받는 상대적 RGB 색 상 공간을 사용함으로써 트레이닝부(202)에서 결정된 살색 계통의 컬러 범위를 규정하기 위해 필요한 데이터량이 줄어들고, 컬러 분석부(204) 및 살색 영역 결정부(206)에서 입력 이미지가 살색 계통의 컬러 영역을 포함하는지 판단하는데 필요한 데이터량과 연산 시간이 줄어들게 된다.In an embodiment of the present invention, by using a relative RGB color space that is relatively less affected by light, the amount of data required to define the color range of the flesh color system determined by the training unit 202 is reduced, and the color analyzer 204 And a data amount and a calculation time required for determining whether the input image includes the color gamut of the skin color line in the skin area determining unit 206.

구체적으로, 살색 영역 결정부(206)는 컬러 분석부(202)로부터 입력 이미지의 픽셀의 상대적 RGB값을 수신하고 트레이닝부(202)로부터 살색 계통의 상대적 RGB의 평균과 분산을 수신한다. 그리고, 입력 이미지의 픽셀의 상대적 RGB값이 상기 평균과 분산에 의한 컬러 범위에 포함되는 경우, 해당 픽셀을 살색 계통의 컬러 영역이라고 판별한다.In detail, the flesh color area determiner 206 receives the relative RGB values of the pixels of the input image from the color analyzer 202 and receives the average and the variance of the relative RGB values of the flesh color lines from the training unit 202. When the relative RGB value of the pixel of the input image is included in the color range by the mean and the variance, the pixel is determined to be a color region of the flesh color line.

한편, 살색 영역 결정부(206)에 의해 결정된 살색 계통의 컬러 영역 이미지는 입력 이미지에서 살색 계통의 컬러 영역이 아닌 부분이 제거된 이미지일 수 있다.On the other hand, the color gamut image of the color gamut determined by the color gamut determination unit 206 may be an image in which a portion other than the color gamut of the color gamut is removed from the input image.

일 실시예에 있어서, 살색 영역 결정부(206)는 입력 이미지가 살색 계통 또는 회색 계통의 컬러 영역을 포함하지 않는 경우, 스킨 지수 산출부(210)로 그 결과를 통지하고, 스킨 지수 산출부(210)는 그에 따라 스킨 지수를 기본값으로 결정할 수 있다. 여기서, 상기 기본값은 호스트가 성인 호스트가 아니라고 판단될 정도로 작은 값일 수 있다.In one embodiment, when the input image does not include the color region of the skin color system or the gray system, the skin color calculator 206 notifies the skin index calculator 210 of the result, and the skin index calculator ( 210 may accordingly determine the skin index as a default. Here, the default value may be a value small enough to determine that the host is not an adult host.

스킨 영역 결정부(208)는 상기 살색 계통의 컬러 영역 이미지를 사용하여 스킨 영역을 결정한다. 이하, 도 3을 통해 스킨 영역 결정부(208)의 구체적인 구성 및 동작에 대해 설명한다.The skin region determiner 208 determines the skin region using the color region image of the skin color line. Hereinafter, a detailed configuration and operation of the skin region determiner 208 will be described with reference to FIG. 3.

도 3은 본 발명의 일 실시예에 따른 스킨 영역 결정부(208)를 개략적으로 나타낸 블록도로서, 스킨 영역 결정부(208)는 필터부(302) 및 연결 영역 제거부(304)를 포함한다.3 is a block diagram schematically illustrating a skin region determiner 208 according to an exemplary embodiment of the present invention. The skin region determiner 208 includes a filter 302 and a connection region remover 304. .

필터부(302)는 살색 영역 결정부(206)에서 결정된 살색 계통의 컬러 영역 이미지를 필터링하여 노이즈를 제거한다. 일 실시예에 있어서, 상기 필터링은 중간값(median) 필터링 또는 평균값(average) 필터링을 포함할 수 있다. . 한편, 노이즈란, 살색 영역 결정부에 의해 결정된 살색 영역 중에서 임계치 이하의 살색 부분을 의미할 수 있다.The filter unit 302 filters the color gamut image of the color scheme determined by the color gamut determination unit 206 to remove noise. In one embodiment, the filtering may include median filtering or average filtering. . On the other hand, the noise may mean a skin portion below the threshold value in the skin region determined by the skin region determiner.

연결 영역 제거부(304)는 필터부(302)의 출력인 노이즈가 제거된 이미지에서 설정값 이하의 면적을 가지는 연결 영역을 제거하여 스킨 영역을 결정한다.The connection area removal unit 304 determines a skin area by removing a connection area having an area smaller than or equal to a set value from the noise-removed image output from the filter unit 302.

따라서, 본 발명의 일 실시예에 따른 스킨 영역은 살색 계통의 컬러 영역 이미지에서 노이즈가 제거되고, 커넥티드 컴포넌트(connected component) 방식에 따라 설정값 이하의 면적을 갖는 연결 영역이 제거된 이미지에 해당한다. 커넥티드 컴포넌트 방식은 본 발명이 속하는 기술분야에서 널리 알려진 기술이므로 구체적인 설명은 생략하기로 한다.Therefore, the skin region according to an embodiment of the present invention corresponds to an image from which noise is removed from the color region image of the skin color system, and in which the connection region having an area smaller than or equal to a set value is removed according to the connected component method. do. Since the connected component method is well known in the art, a detailed description thereof will be omitted.

연결 영역 제거부(304)는 커넥티드 컴포넌트에 따라 성인물 관련 정도 측정에 큰 영향을 미치지 않는 작은 이미지 영역들을 제거함으로써, 이후 스킨 지수 산출부(210)가 성인 이미지 관련 정도를 의미하는 스킨 지수를 산출할 때, 그 산출 시간 및 복잡도를 줄어들게 한다.The connection area removal unit 304 removes small image areas that do not have a significant influence on the measurement of the adult-related degree according to the connected component, and then the skin index calculation unit 210 calculates a skin index indicating the degree of the adult image-related degree. This reduces the computation time and complexity.

상술한 실시예에 있어서는 살색 계통의 컬러 영역 이미지로부터 노이즈를 제거한 후 연결 영역을 제거하는 것으로 기재하였으나, 변형된 실시예에 있어서는 연결 영역 제거부(304)에서 연결 영역을 제거한 후 필터부(302)에서 노이즈를 제거할 수도 있을 것이다. 또한, 필터부(302)를 생략함으로써, 노이즈 제거 과정을 거치지 않고 연결 영역 제거부(304)에서 살색 계통의 컬러 영역 이미지로부터 연결 영역만 을 제거할 수 있다. 또한, 연결 영역 제거부(304)를 생략함으로써, 연결 영역 제거 과정을 거치지 않고 해당 이미지로부터 필터부(302)에서 노이즈만을 제거하여 스킨 영역을 결정할 수도 있을 것이다.In the above-described embodiment, the connection area is removed after removing the noise from the color gamut image of the skin color system. In the modified embodiment, the connection area removal unit 304 removes the connection area and then the filter unit 302. You might be able to remove the noise from the. In addition, by omitting the filter unit 302, the connection area removal unit 304 may remove only the connection area from the color gamut image of the flesh color system without undergoing a noise removing process. In addition, by omitting the connection area removal unit 304, the skin area may be determined by removing only the noise from the filter unit 302 from the image without undergoing the connection area removal process.

다시, 도 2를 참조하면, 스킨 지수 산출부(210)는 스킨 영역의 면적을 사용하여 스킨 지수를 결정한다.Referring again to FIG. 2, the skin index calculator 210 determines the skin index using the area of the skin region.

구체적으로, 스킨 지수 산출부(210)는 입력 이미지의 면적에 대한 스킨 영역의 면적의 비율에 따라 스킨 지수를 결정한다. 여기서, 스킨 지수는 하기 수학식 2로써 나타낼 수 있다.In detail, the skin index calculator 210 determines the skin index according to the ratio of the area of the skin region to the area of the input image. Here, the skin index can be represented by the following equation (2).

Figure 112008025896877-pat00001
Figure 112008025896877-pat00001

또한, 스킨 지수 산출부(210)는 컬러 분석부(204)로부터 입력 이미지가 회색 계통의 컬러 영역으로 이루어졌다는 통지를 수신하면, 스킨 지수를 기준치로서 결정한다. 이는, 입력 이미지가 살색 계통의 컬러 영역을 포함하지 않는 경우, 사람의 스킨 노출 정도와 관련된 스킨 지수가 결정되지 못하므로 스킨 지수를 기 규정된 기준치로서 결정하는 것이다. 이에 대해서는 상세히 후술한다.In addition, the skin index calculator 210 determines the skin index as a reference value when receiving a notification from the color analyzer 204 that the input image is composed of a gray area of a color region. This means that when the input image does not include the color region of the skin color line, a skin index related to the degree of skin exposure of a person is not determined, and thus the skin index is determined as a predetermined reference value. This will be described later in detail.

또한, 스킨 지수 산출부(210)는 스킨 지수가 제1 임계치 이하 또는 제2 임계치 이상인 경우, 상기 스킨 지수를 기본값으로서 다시 결정한다. 이는 스킨 영역이 너무 적거나 너무 많은 경우, 입력 이미지가 사람의 형상이 없는 이미지 또는 살색 계통의 컬러로 채워진 단순한 박스(box) 이미지일 확률이 높으므로, 성인 이미지와 관련 정도가 낮은 것으로서 판단하기 위함이다. 예컨데, 0.5 초과의 스킨 지수를 가진 이미지를 성인물로 판단하는 것이 성인물 판단 기준일 경우, 0.01 이하 또는 0.99 이상의 스킨 지수를 갖는 이미지에게 다시 0.005의 아주 작은 스킨 지수를 부여함으로써, 추후 성인 지수가 낮게 결정되게 한다.In addition, when the skin index is less than the first threshold value or more than the second threshold value, the skin index calculator 210 determines the skin index again as a default value. This is to determine that if the skin area is too small or too large, the input image is likely to be a non-human image or a simple box image filled with flesh-colored colors, which is low relative to the adult image. to be. For example, if judging an image with a skin index greater than 0.5 as adult content is the adult content criterion, an image with a skin index of 0.01 or less or 0.99 or more is again given a very small skin index of 0.005 so that the adult index is determined to be lower later. do.

한편, 스킨 지수 산출부(210)는 입력 이미지가 회색 계통의 컬러 영역으로 이루어진 경우 0.5의 스킨 지수(기준치)를 부여한다. 이 경우, 호스트의 성인 호스트 여부는 스킨 지수보다는 텍스트 성인 지수의 영향을 더 받게 된다.On the other hand, the skin index calculator 210 gives a skin index (reference value) of 0.5 when the input image consists of a gray area color area. In this case, whether the host is an adult host is more affected by the text adult index than the skin index.

예컨데, 입력 이미지가 회색 계통의 누드(nude)의 여성 이미지인 경우, 스킨 지수 산출부(210)는 스킨 지수를 0.5로 결정한다. 그리고, 입력 이미지가 누드의 여성 이미지이기 때문에 성인물로서 판단해야 할 필요가 있다. 따라서, 이 경우, 텍스트 성인 지수 결정부(106)는 호스트로부터 획득한 입력 텍스트가 "섹스(sex)", "포르노(porno)" 등과 같은 성인 텍스트를 포함하는 경우, 해당 텍스트 성인 지수를 높게 결정함으로써 추후 검수 대상 호스트가 성인 호스트로 판단되게 한다. For example, when the input image is a nude female image of gray color, the skin index calculator 210 determines the skin index to be 0.5. And since the input image is a nude female image, it is necessary to judge it as adult. Therefore, in this case, the text adult index determining unit 106 determines that the text adult index is high when the input text obtained from the host includes adult text such as "sex", "porno", or the like. As a result, the host to be inspected later is determined to be an adult host.

도 4는 본 발명의 일 실시예에 따른 스킨 지수 결정부(104)에 의해 처리되는 이미지들을 나타낸 도면이다.4 is a diagram illustrating images processed by the skin index determiner 104 according to an embodiment of the present invention.

도 4를 참조하면, 도 4(a)는 호스트가 제공하는 이미지 또는 동영상으로부터 추출한 입력 이미지로서 일정 부분의 스킨이 노출된 여성 이미지이다.Referring to FIG. 4, FIG. 4A is an input image extracted from an image or a video provided by a host and is a female image in which a portion of a skin is exposed.

도 4(a)의 이미지는 컬러 분석부(204)에서 분석되고, 컬러 분석부(204)는 분석 결과인 해당 이미지의 컬러 정보를 출력한다.The image of FIG. 4A is analyzed by the color analyzer 204, and the color analyzer 204 outputs color information of the corresponding image that is a result of the analysis.

도 4(b)는 살색 영역 결정부(206)가 상기 컬러 정보에 의해 생성한 살색 계통의 컬러 영역 이미지를 나타낸다.FIG. 4B illustrates a color gamut image of the color gamut generated by the color gamut determination unit 206 based on the color information.

도 4(c)는 스킨 영역 결정부(208)의 필터부(302)에 의해 살색의 컬러 영역 이미지에 나타난 노이즈(402)가 제거된 후의 이미지를 나타낸다.FIG. 4C shows the image after the noise 402 shown in the flesh color region image is removed by the filter unit 302 of the skin region determination unit 208.

도 4(d)는 스킨 영역 결정부(208)의 연결 영역 제거부(304)에 의해 면적이 설정값 이하인 연결 영역(404)이 제거된 후의 이미지를 나타낸다.FIG. 4D illustrates an image after the connection area 404 having an area less than or equal to a set value is removed by the connection area removal unit 304 of the skin area determination unit 208.

도 4(e)는 스킨 영역 결정부(208)의 연결 영역 제거부(304)에 의해 최종적으로 스킨 영역(406)으로 결정된 영역을 나타낸다. 그리고, 스킨 지수 산출부(210)는 도 4(e)에 나타난 이미지에 의해 스킨 지수를 결정한다.FIG. 4E illustrates a region finally determined as the skin region 406 by the connection region removing unit 304 of the skin region determination unit 208. The skin index calculator 210 determines the skin index based on the image shown in FIG. 4E.

다시, 도 1을 참조하면, 텍스트 성인 지수 결정부(106)는 호스트로부터 수집된 입력 텍스트의 성인 용어 관련도를 나타내는 텍스트 성인 지수를 결정한다.Referring back to FIG. 1, the text adult index determiner 106 determines a text adult index indicating the degree of adult term relevance of the input text collected from the host.

이하, 도 5 내지 도 8을 통해 텍스트 성인 지수 결정부(106)의 구성 및 동작에 대해 설명한다.Hereinafter, the configuration and operation of the text adult index determiner 106 will be described with reference to FIGS. 5 through 8.

도 5는 본 발명의 일 실시예에 따른 텍스트 성인 지수 결정부(106)를 나타낸 개략적인 블록도로서, 텍스트 성인 지수 결정부(106)는 웹페이지 성인 지수 결정부(502), 유알엘 성인 지수 결정부(504) 및 텍스트 성인 지수 산출부(506)를 포함한다.5 is a schematic block diagram illustrating a text adult index determiner 106 according to an embodiment of the present invention. The text adult index determiner 106 determines a webpage adult index determiner 502 and a UEL adult index determiner. A unit 504 and a text adult index calculator 506 are included.

웹페이지 성인 지수 결정부(502)는 호스트가 제공하는 웹페이지 문서, BBS, 이미지 게시물 또는 동영상 게시물 등에서 추출한 입력 텍스트를 분석하여 웹페이지 성인 지수를 결정한다. 여기서, 웹페이지 성인 지수 결정부(502)는 상기 입력 텍스트를 호스트로부터 직접 추출하거나 이미 추출된 입력 텍스트를 수신할 수 있다.The webpage adult index determination unit 502 determines the webpage adult index by analyzing input text extracted from a webpage document, a BBS, an image post or a video post provided by a host. Here, the webpage adult index determination unit 502 may directly extract the input text from the host or receive the extracted input text.

도 6은 본 발명의 일 실시예에 따른 웹페이지 성인 지수 결정부(502)를 나타낸 개략적인 블록도로서, 웹페이지 성인 지수 결정부(502)는 제2 트레이닝 셋(602), 제1 후보 용어 선정부(604), 제1 사전 생성부(606) 및 웹페이지 성인 지수 산출부(608)를 포함한다. 이하, 상기 입력 텍스트는 호스트가 운영하는 웹페이지 문서에 포함된 텍스트인 것으로 설명한다.FIG. 6 is a schematic block diagram illustrating a webpage adult index determiner 502 according to an embodiment of the present invention. The webpage adult index determiner 502 may include a second training set 602 and a first candidate term. The selection unit 604, the first dictionary generation unit 606, and the webpage adult index calculation unit 608 are included. Hereinafter, the input text will be described as text included in a web page document operated by the host.

제2 트레이닝 셋(602)은 다수의 성인 웹페이지 문서 및 비성인 웹페이지 문서로 구성된다. 여기서, 성인 웹페이지 문서 및 비성인 웹페이지 문서는 소정의 용어(term)가 성인 웹페이지 문서 또는 비성인 웹페이지 문서에 출현하는 빈도를 산출하는데 필요한 모집단(population) 역할을 한다. 또한, 성인 웹페이지 문서 및 비성인 웹페이지 문서는 인터넷 상에서 다수의 호스트로부터 랜덤하게 수집한 것일 수 있다.The second training set 602 consists of a plurality of adult webpage documents and non-adult webpage documents. Here, the adult webpage document and the non-adult webpage document serve as a population necessary to calculate the frequency with which a certain term appears in the adult webpage document or the non-adult webpage document. In addition, adult webpage documents and adult webpage documents may be randomly collected from a plurality of hosts on the Internet.

제1 후보 용어 선정부(604)는 제2 트레이닝 셋(602)으로부터 제1 후보 용어를 선정한다. 여기서, 제1 후보 용어는 상기 성인 웹페이지 문서 및 비성인 웹페이지 문서에 포함된 용어 중에서 선정한다.The first candidate term selector 604 selects the first candidate term from the second training set 602. Here, the first candidate term is selected from terms included in the adult webpage document and the non-adult webpage document.

일 실시예에 있어서, 상기 제1 후보 용어는 상기 성인 웹페이지 문서 또는 비성인 웹페이지 문서에 포함된 단어 중에서 주어, 관사 등의 일반적인 단어를 뺀 단어일 수 있다.In an embodiment, the first candidate term may be a word subtracted from a word included in the adult webpage document or a non-adult webpage document and given a general word such as an article.

제1 사전 생성부(606)는 제1 후보 용어와 제1 후보 용어가 성인 웹페이지 문 서에 출현한 빈도 및 비성인 웹페이지에 출현한 빈도에 따라 결정되는 빈도 점수의 맵핑 정보를 생성한다. 이하, 상기 맵핑 정보를 제1 사전이라 하겠다.The first dictionary generation unit 606 generates mapping information of frequency scores determined according to the frequency of appearance of the first candidate term and the first candidate term in an adult webpage document and the frequency of appearance in an adult webpage. Hereinafter, the mapping information will be referred to as a first dictionary.

일 예로, 제1 사전 생성부(606)는 "비키니"란 제1 후보 용어가 존재하는 경우, "비키니"가 제2 트레이닝 셋(602)의 성인 웹페이지 문서에 출현한 빈도를 산출하고, 비성인 웹페이지 문서에 출현한 빈도를 산출하여, 그 2개의 빈도를 사용하여 빈도 점수를 산출한다. 그리고, 제1 사전 생성부(606)는 "비키니"와 해당 빈도 점수를 제1 사전의 엔트리로서 추가한다. 따라서, "비키니"와 해당 빈도 점수의 매핑 정보가 생성되게 된다. 제1 사전의 일 예는 도 7에 나타나 있다.For example, when the first candidate term "bikini" exists, the first dictionary generation unit 606 calculates a frequency in which "bikini" appears in the adult webpage document of the second training set 602. The frequency appearing in the adult webpage document is calculated, and the frequency score is calculated using the two frequencies. Then, the first dictionary generation unit 606 adds "bikini" and the corresponding frequency score as entries of the first dictionary. Therefore, mapping information of "bikini" and the corresponding frequency score is generated. An example of the first dictionary is shown in FIG. 7.

구체적으로 제1 사전 생성부(606)가 상기 빈도 점수를 산출하는 방법은 먼저, 성인 웹페이지 문서가 포함하는 용어의 총 개수 및 비성인 웹페이지 문서가 포함하는 용어의 총 개수를 구한다. 그리고, i번째 제1 후보 용어를 나타내는

Figure 112008025896877-pat00002
가 성인 웹페이지 문서에 출현한 횟수를 구한다. 마찬가지로,
Figure 112008025896877-pat00003
가 비성인 웹페이지 문서에 출현한 횟수를 산출한다.In detail, the method of calculating the frequency score by the first dictionary generation unit 606 first obtains the total number of terms included in the adult webpage document and the total number of terms included in the non-adult webpage document. And the i-th first candidate term
Figure 112008025896877-pat00002
Find the number of times a has appeared in an adult web page document. Likewise,
Figure 112008025896877-pat00003
The number of occurrences of a non-adult web page document is calculated.

따라서, 전술한 과정을 통해 산출한 횟수 및 개수 정보를 통해 성인 웹페이지 문서에 출현한 빈도를 산출하고, 비성인 웹페이지 문서에 출현한 빈도를 산출할 수 있다. 그리고, 그 빈도들의 비율을 사용하여 빈도 점수를 구한다.Accordingly, the frequency of appearance in the adult webpage document may be calculated through the count and the number information calculated through the above-described process, and the frequency of appearance in the non-adult webpage document may be calculated. Then, the frequency score is obtained using the ratio of the frequencies.

다시 도 6을 참조하면, 웹페이지 성인 지수 산출부(608)는 제1 사전의 매핑 정보를 참조하여, 호스트가 운영하는 웹페이지에 포함된 용어에 매핑되는 빈도 점수를 사용하여 웹페이지 성인 지수를 결정한다. 일 실시예에 있어서, 호스트가 운 영하는 웹페이지에 포함된 용어는 호스트가 제공하는 웹페이지의 웹페이지 문서, 이미지 게시물, 동영상 게시물 등에서 추출한 입력 텍스트일 수 있다.Referring back to FIG. 6, the webpage adult index calculator 608 refers to the mapping information of the first dictionary and uses the frequency score mapped to the term included in the webpage operated by the host to calculate the webpage adult index. Decide In an embodiment, the term included in the webpage operated by the host may be input text extracted from a webpage document, an image post, a video post, or the like of the webpage provided by the host.

구체적으로 웹페이지 성인 지수 산출부(608)가 상기 웹페이지 성인 지수를 결정하는 과정은 하기의 수학식 3으로써 나타낼 수 있다.In detail, the process of the webpage adult index calculator 608 determining the webpage adult index may be represented by Equation 3 below.

Figure 112008025896877-pat00004
Figure 112008025896877-pat00004

상기 수학식 3에서 Adult(D)는 웹페이지 성인 지수를 나타내며, P(Adult|Doc)는 검수 대상인 호스트가 제공하는 웹페이지 문서(Doc)가 입력되었을 때 그 웹페이지 문서가 성인 웹페이지(Adult)일 조건부 확률을 나타낸다. 그리고, P(Normal|Doc)은 그 웹페이지 문서가 비성인 웹페이지일 조건부 확률을 나타낸다.In Equation 3, Adult (D) represents a webpage adult index, and P (Adult | Doc) represents an adult webpage (Adult) when a webpage document (Doc) provided by a host to be inspected is input. Conditional probability. And P (Normal | Doc) represents a conditional probability that the webpage document is an non-web page.

또한, 상기 수학식 3은 P(Doc|Adult)P(Adult)/[P(Doc|Normal)P(Normal)]를 유도하기 때문에 사전 확률 정보로부터 현재 사건의 조건부 확률을 추정하는 베이지안 정리(Bayes' theorem)를 사용하는 것이다. 그리고, 수학식 3에서, 계산의 편의를 위해 P(Normal)은 P(Adult)와 동일하다고 보았다.In addition, since Equation 3 derives P (Doc | Adult) P (Adult) / [P (Doc | Normal) P (Normal)], Bayesian theorem (Bayes) for estimating the conditional probability of the current event from prior probability information. 'theorem). In Equation 3, for convenience of calculation, P (Normal) was considered to be the same as P (Adult).

결국, Adult(D)는 호스트로부터 수집한 웹페이지 문서(Doc)가 포함하는 용어들(

Figure 112008025896877-pat00005
, i는 1에서 n사이의 정수)을 획득하고, 그 용어들이 가지는 빈도 점수들의 합에 의해 결정된다. In the end, Adult (D) refers to terms that the webpage document (Doc) contains from the host (
Figure 112008025896877-pat00005
, i is an integer between 1 and n), and is determined by the sum of the frequency scores of the terms.

구체적으로 설명하면, 제1 사전을 참조하여

Figure 112008025896877-pat00006
에 매핑되는 빈도 점수를 찾는다. 그리고, 매핑 과정을 n번 반복하여 빈도 점수들을 모두 더함으로써 웹페이지 성인 지수를 결정한다. 일 실시예에 있어서, 상기 웹페이지 성인 지수는 0에서 1사이의 값으로 표준화(normalize)된 값일 수 있다.Specifically, with reference to the first dictionary
Figure 112008025896877-pat00006
Find the frequency score that maps to. Then, the mapping process is repeated n times to add all the frequency scores to determine the webpage adult index. In one embodiment, the webpage adult index may be a value normalized to a value between 0 and 1.

결국, 상술한 제1 사전을 사용하여 웹페이지 성인 지수를 결정하는 과정은 하기의 수학식 4로써 간략히 표현될 수 있다.As a result, the process of determining the webpage adult index using the above-described first dictionary may be briefly expressed by Equation 4 below.

Figure 112008025896877-pat00007
Figure 112008025896877-pat00007

상기 수학식 4에서,

Figure 112008025896877-pat00008
(i는 1에서 n까지의 정수)는 검수를 위해 호스트가 운영하는 웹페이지로부터 특정 용어(입력 텍스트)를 획득한 경우, 그 특정 용어와 동일한 제1 후보 용어에 매핑되는 빈도 점수이다.In Equation 4,
Figure 112008025896877-pat00008
(i is an integer from 1 to n) is a frequency score mapped to the same first candidate term when the specific term (input text) is obtained from the web page operated by the host for inspection.

다시 도 5를 참조하면, 유알엘 성인 지수 결정부(504)는 호스트에서 획득한 입력 텍스트 중 호스트의 유알엘의 성인 용어 관련도를 나타내는 유알엘 성인 지수를 결정한다. 여기서, 유알엘 성인 지수 결정부(504)는 호스트의 유알엘을 직접 추출하거나 이미 추출된 유알엘을 수신할 수 있다.Referring back to FIG. 5, the UEL adult index determination unit 504 determines a UEL adult index indicating the relevance of the adult term of the UAL of the host among the input texts acquired by the host. Here, the UEL adult index determination unit 504 may directly extract the UEL of the host or receive the UEL already extracted.

도 8은 본 발명의 일 실시예에 따른 유알엘 성인 지수 결정부(504)를 나타낸 개략적인 블록도로서, 유알엘 성인 지수 결정부(504)는 제3 트레이닝 셋(802), 제2 후보 용어 선정부(804), 제2 사전 생성부(806) 및 유알엘 성인 지수 산출부(808)를 포함한다.FIG. 8 is a schematic block diagram illustrating a UEL adult index determiner 504 according to an embodiment of the present invention. The UEL adult index determiner 504 includes a third training set 802 and a second candidate term selector. 804, a second dictionary generator 806, and a UEL adult index calculator 808.

제3 트레이닝 셋(802)은 다수의 성인 유알엘 및 비성인 유알엘로 구성된다. 여기서, 성인 유알엘 및 비성인 유알엘은 소정의 유알엘이 성인 유알엘 또는 비성인 유알엘에 출현하는 빈도를 산출하는데 필요한 모집단 역할을 한다. 또한, 성인 유알엘 및 비성인 유알엘은 인터넷 상에서 다수의 호스트로부터 랜덤하게 수집한 것일 수 있다. 여기서 성인 유알엘은 성인 호스트의 유알엘을 의미하지만, 변형된 실시예에 있어서, 성인물이 성인 이미지 콘텐츠인 경우 성인 이미지 콘텐츠를 제공하는 호스트 또는 웹페이지 등의 유알엘을 의미한다.The third training set 802 consists of a number of adult UELs and non-UALs. Here, the adult Ualel and the adult Ualel serve as a population necessary to calculate the frequency at which a given Ual appears in the adult Ual or the adult Ualel. In addition, adult Ualel and adult Ualel may be randomly collected from a number of hosts on the Internet. Here, the adult UEL refers to the UAL of the adult host. However, in the modified embodiment, when the adult content is the adult image content, the adult UEL refers to a UAL such as a host or a web page that provides the adult image content.

제2 후보 용어 선정부(804)는 제3 트레이닝 셋(802)으로부터 제2 후보 용어를 선정한다. 여기서, 제2 후보 용어는 상기 성인 호스트의 유알엘 및 비성인 호스트의 유알엘에 포함된 용어 중에서 선정한다.The second candidate term selector 804 selects a second candidate term from the third training set 802. Here, the second candidate term is selected from the terms included in the UEL of the adult host and the UEL of the adult host.

일 실시예에 있어서, 상기 제2 후보 용어는 상기 성인 호스트의 유알엘 또는 비성인 호스트의 유알엘에 포함된 단어 중에서 "WWW" 등과 같은 일반적인 단어(stop word)를 뺀 단어일 수 있다.In one embodiment, the second candidate term may be a word subtracted from a general word such as “WWW” among words included in the UAL of the adult host or the UAL of the adult host.

제2 사전 생성부(806)는 제2 후보 용어와 제2 후보 용어가 성인 호스트의 유알엘에 출현한 빈도 및 비성인 호스트의 유알엘에 출현한 빈도에 따라 결정되는 빈도 점수의 맵핑 정보를 생성한다. 이하, 상기 맵핑 정보를 제2 사전이라 하겠다. 상기 제2 사전의 구체적인 구성은 웹페이지 성인 지수에 대해 전술한 바 및 도 7에 의해 이해될 수 있으므로 설명을 생략한다. The second dictionary generation unit 806 generates mapping information of frequency scores determined according to the frequency in which the second candidate term and the second candidate term appear in the UAL of the adult host and the frequency in the UAL of the adult host. Hereinafter, the mapping information will be referred to as a second dictionary. The detailed configuration of the second dictionary can be understood as described above with reference to the webpage adult index and FIG. 7, and a description thereof will be omitted.

또한, 제2 사전 생성부(806)가 상기 빈도 점수를 산출하는 과정은 제1 사전 생성부(606)에 대해 전술한 바에 의해 이해될 수 있으므로 자세한 설명을 생략한다.In addition, since the process of calculating the frequency score by the second dictionary generator 806 may be understood as described above with respect to the first dictionary generator 606, a detailed description thereof will be omitted.

유알엘 성인 지수 산출부(808)는 제2 사전의 매핑 정보를 참조하여, 호스트의 유알엘에 포함된 용어에 매핑되는 빈도 점수를 사용하여 유알엘 성인 지수를 결정한다. 여기서, 유알엘 성인 지수 산출부(808)가 유알엘 성인 지수를 결정하는 과정은 상기의 수학식 3 내지 수학식 4에 의해 이해될 수 있으므로 자세한 설명을 생략한다. 일 실시예에 있어서, 유알엘 성인 지수는 0에서 1사이의 값으로 표준화(normalize)된 값일 수 있다.The UEL adult index calculator 808 determines the UEL adult index by using a frequency score mapped to a term included in the UEL of the host by referring to the mapping information of the second dictionary. Here, the process of determining the UEL adult index by the UEL adult index calculation unit 808 may be understood by the above Equation 3 to Equation 4, a detailed description thereof will be omitted. In one embodiment, the UEL adult index may be a value normalized to a value between 0 and 1.

다시 도 5를 참조하면, 텍스트 성인 지수 산출부(506)는 웹페이지 성인 지수 및 유알엘 성인 지수를 사용하여 텍스트 성인 지수를 결정한다. 일 실시예에 있어서, 텍스트 성인 지수 산출부(506)는 텍스트 성인 지수를 웹페이지 성인 지수 및 상기 유알엘 성인 지수 중 최대값에 따라 결정할 수 있다. 이를 수학식 5에 나타내었다.Referring back to FIG. 5, the text adult index calculator 506 determines the text adult index using the webpage adult index and the UEL adult index. In one embodiment, the text adult index calculator 506 may determine the text adult index according to the maximum value of the webpage adult index and the UEL adult index. This is shown in Equation 5.

텍스트 성인 지수 = Max{웹페이지 성인 지수, 유알엘 성인 지수}Text Adult Index = Max {Webpage Adult Index, EU Adult Index}

다시 도 1을 참조하면, 성인 지수 결정부(108)는 스킨 지수 결정부(104)로부터 획득한 스킨 지수 및 성인 지수 결정부(106)로부터 획득한 텍스트 성인 지수를 사용하여 성인 지수를 결정한다.Referring back to FIG. 1, the adult index determiner 108 determines the adult index by using the skin index obtained from the skin index determiner 104 and the text adult index obtained from the adult index determiner 106.

일 실시예에 있어서, 성인 지수 결정부(108)는 성인 지수를 스킨 지수 및 텍스트 성인 지수의 곱에 따라 결정할 수 있다.In one embodiment, the adult index determiner 108 may determine the adult index according to the product of the skin index and the text adult index.

일 실시예에 있어서, 성인 지수는 상기 수학식 5를 고려했을 때, 하기 수학식 6으로써 나타낼 수 있다.In one embodiment, the adult index can be represented by the following equation 6, considering the equation (5).

성인 지수 = 스킨 지수× Max{웹페이지 성인 지수, 유알엘 성인 지수}Adult Index = Skin Index × Max {Webpage Adult Index, EU Adult Index}

일 실시예에 있어서, 성인 호스트 판단 시스템(102)은 호스트로부터 획득한 입력 이미지가 복수인 경우, 복수의 입력 이미지에 대한 복수의 스킨 지수 및 텍스트 성인 지수를 결정한다. 그리고, 성인 지수 결정부(108)는 해당하는 복수의 1차적인 성인 지수를 결정하고, 복수의 1차적인 성인 지수의 평균을 최종적인 호스트의 성인 지수로 결정할 수 있다.In one embodiment, the adult host determination system 102 determines a plurality of skin indices and text adult indices for the plurality of input images when there are a plurality of input images obtained from the host. In addition, the adult index determiner 108 may determine a plurality of primary adult indices, and determine an average of the plurality of primary adult indices as the adult index of the final host.

성인 호스트 판단부(110)는 성인 지수를 특정 기준치와 비교함으로써 검수 대상 호스트가 성인 호스트인지 여부를 판단한다. 즉, 성인 호스트 판단부(110)는 성인 지수의 크고 적음에 따라 검수 대상 호스트의 성인 호스트 여부를 판단한다.The adult host determiner 110 determines whether the inspected host is an adult host by comparing the adult index with a specific reference value. That is, the adult host determination unit 110 determines whether the host to be inspected is an adult host according to the large and small adult index.

예컨데, 성인 호스트 판단부(110)는 성인 지수가 0.5 초과인 경우 검수 대상 호스트를 성인 호스트로서 판단한다. 그리고, 그 결과를 검색 사이트, 포탈 사이트 등의 운영자에게 제공한다.For example, the adult host determination unit 110 determines the inspection target host as an adult host when the adult index is greater than 0.5. The result is then provided to the operator of the search site, portal site, and the like.

도 9는 본 발명의 일 실시예에 따른 성인 지수 결정부(108)가 검수 대상 호스트의 성인 지수를 결정한 결과를 나타내는 도면이다.9 is a diagram illustrating a result of determining the adult index of the host to be inspected by the adult index determiner 108 according to an embodiment of the present invention.

도 9를 참조하면, 성인 호스트 판단부(110)는 상기 결과를 참조하여, 성인 지수가 0.5보다 큰 호스트인 "www.hitmodel.biz", "gxyz.com", 및 " www.redma.info"를 사용자의 접근을 차단할 성인 호스트 또는 재검수를 수행할 성 인 호스트로 판단할 수 있다.Referring to FIG. 9, the adult host determining unit 110 may refer to the above results, and refer to the above results, "www.hitmodel.biz", "gxyz.com", and "www.redma.info", which hosts have an adult index greater than 0.5. Can be determined to be an adult host that will block the user's access or an adult host that will perform re-examination.

도 10은 본 발명의 일 실시예에 따른 성인물 판단 방법을 나타내는 순서도로서, 이하에서는 성인물이 성인 호스트인 것을 일 예로 하여 성인 호스트 판단 방법을 설명한다.FIG. 10 is a flowchart illustrating a method for determining adult material according to an embodiment of the present invention. Hereinafter, an adult host determination method will be described with an example that an adult material is an adult host.

먼저, 호스트로부터 수집된 입력 이미지의 성인 이미지 관련도를 나타내는 스킨 지수를 결정한다(S1002). 일 실시예에 있어서, 상기 입력 이미지는 호스트가 제공하는 웹페이지, 이미지 게시물, 및 동영상 게시물 중 적어도 하나로부터 수집한 것일 수 있다.First, a skin index indicating an adult image relevance of an input image collected from a host is determined (S1002). In one embodiment, the input image may be collected from at least one of a web page, an image post, and a video post provided by the host.

다음으로, 호스트로부터 수집된 입력 텍스트의 성인 용어 관련도를 나타내는 텍스트 성인 지수를 결정한다(S1004).Next, the text adult index indicating the adult term relatedness of the input text collected from the host is determined (S1004).

상술한 실시예에서는 스킨 지수에 대한 결정 단계(S1002) 후에 텍스트 성인 지수에 대한 결정 단계(S1004)를 수행하지만, 변형된 실시예에서는 스킨 지수에 대한 결정 단계(S1002)가 텍스트 성인 지수에 대한 결정 단계(S1004) 후에 수행될 수 있으며, 두 단계(S1002,S1004)가 동시에 수행될 수도 있다.In the above-described embodiment, the determining step S1004 for the text adult index is performed after the determining step S1002 for the skin index. In the modified embodiment, the determining step S1002 for the skin index is determined for the text adult index. This may be performed after step S1004, and two steps S1002 and S1004 may be simultaneously performed.

다음으로 스킨 지수 및 텍스트 성인 지수를 사용하여 성인 지수를 결정한다(S1006). 일 실시예에 있어서, 성인 지수는 스킨 지수 및 텍스트 성인 지수의 곱에 따라 결정될 수 있다.Next, the adult index is determined using the skin index and the text adult index (S1006). In one embodiment, the adult index may be determined according to the product of the skin index and the text adult index.

다음으로, 성인 지수에 따라 호스트의 성인 호스트 여부를 판단한다(S1008). 일 실시예에 있어서, 성인 지수가 특정 기준치(=0.5)보다 큰지 판단하고, 만약, 스킨 지수가 특정 기준치(=0.5)보다 큰 경우, 검수 대상 호스트를 성인 호스트라고 판단할 수 있다.Next, it is determined whether the host is an adult host according to the adult index (S1008). In one embodiment, it is determined whether the adult index is greater than the specific reference value (= 0.5), and if the skin index is greater than the specific reference value (= 0.5), the inspected host may be determined to be an adult host.

도 11은 본 발명의 일 실시예에 따른 성인 호스트 판단 방법에서 스킨 지수에 대한 결정 과정(S1002)을 구체적으로 나타내는 순서도이다.11 is a flowchart specifically showing a determination process (S1002) for the skin index in the adult host determination method according to an embodiment of the present invention.

먼저, 검수 대상 호스트로부터 획득한 입력 이미지의 컬러를 분석한다(S1102). 일 실시예에 있어서, 상기 입력 이미지는 상기 호스트가 제공하는 웹페이지, 이미지 게시물, 동영상 게시물 중 적어도 하나로부터 추출한 것일 수 있다.First, the color of the input image acquired from the inspection target host is analyzed (S1102). In one embodiment, the input image may be extracted from at least one of a web page, an image post, a video post provided by the host.

다음으로, 상기 분석 결과에 따라 입력 이미지가 회색 계통의 컬러 영역으로 이루어졌는지 판단한다(S1104). 만약, 입력 이미지가 회색 계통의 컬러 영역으로 이루어진 경우, 기준치를 스킨 지수로서 결정한다(S1106). Next, according to the analysis result, it is determined whether the input image is composed of a color region of a gray system (S1104). If the input image is composed of a gray area color area, the reference value is determined as the skin index (S1106).

한편, 상기 분석 결과, 입력 이미지가 회색 계통의 컬러 영역으로 이루어지지 않은 경우(S1104), 입력 이미지가 살색 계통의 컬러 영역을 포함하는 지 판단한다(S1108). 만약, 입력 이미지가 살색 계통의 컬러 영역을 포함하지 않은 경우, 스킨 지수를 기본값으로서 결정한다(S1110). 상기 기본값은 검수 대상 호스트가 성인 호스트로 판단되지 않을 만큼 매우 작은 값이다. 그러나, 만약, 입력 이미지가 살색 계통의 컬러 영역을 포함한 경우, 입력 이미지로부터 살색 계통의 컬러 영역 이미지를 획득한다(S1112).Meanwhile, as a result of the analysis, when the input image is not composed of the color gamut of the gray system (S1104), it is determined whether the input image includes the color gamut of the flesh color system (S1108). If the input image does not include the color gamut of the skin color system, the skin index is determined as a default value (S1110). The default value is so small that the host to be inspected is not considered an adult host. However, if the input image includes the color gamut of the skin color system, a color gamut image of the skin color system is obtained from the input image (S1112).

일 실시예에 있어서, 상기 살색 계통은 제1 트레이닝 셋을 사용하여 결정된 살색 범위에 의해 정의될 수 있다.In one embodiment, the flesh line may be defined by a flesh range determined using the first training set.

일 실시예에 있어서, 살색 계통의 컬러 영역의 포함 여부에 대한 판단은 상기 분석 결과에 따른 입력 이미지의 상대적 RGB가 상기 살색 계통에 해당하는 상대 적 RGB의 범위에 포함되는지 여부를 판단하는 것일 수 있다.In one embodiment, the determination of whether the color gamut is included in the flesh color line may include determining whether the relative RGB of the input image according to the analysis result is included in the range of the relative RGB corresponding to the flesh color line. .

여기서, 입력 이미지의 상대적 RGB는 입력 이미지의 RGB 각각을 더한 값에 대한 입력 이미지의 RGB 각각의 비율일 수 있으며, 살색 계통에 해당하는 상대적 RGB의 경우도 마찬가지로 연산될 수 있다. 그리고, 상대적 RGB는 수학식 1을 통해 상술한 바로 이해될 수 있으므로 구체적인 설명은 생략한다. Here, the relative RGB of the input image may be a ratio of each RGB of the input image to a value obtained by adding each RGB of the input image, and the relative RGB corresponding to the flesh color system may be calculated in the same manner. In addition, since the relative RGB can be immediately understood through Equation 1, a detailed description thereof will be omitted.

다음으로, 상기 살색 계통의 컬러 영역 이미지를 필터링하여 노이즈를 제거한다(S1114). 일 실시예에 있어서, 상기 필터링은 중간값 필터링 또는 평균값 필터링을 포함할 수 있다.Next, the color gamut image of the skin color system is filtered to remove noise (S1114). In one embodiment, the filtering may include median filtering or average filtering.

다음으로, 노이즈가 제거된 이미지 중 면적이 설정값 이하인 연결 영역을 제거한 이미지를 획득하고(S1116), 상기 연결 영역이 제거된 이미지의 살색 계통의 컬러 영역을 스킨 영역으로서 결정한다(S1118).Next, an image from which the connection area whose area is less than or equal to the set value is removed from the image from which the noise is removed is obtained (S1116), and the color area of the flesh color line of the image from which the connection area is removed is determined as the skin area (S1118).

상술한 실시예에 있어서는 살색 계통의 컬러 영역 이미지로부터 노이즈를 제거한 후 연결 영역을 제거하는 것으로 기재하였으나, 변형된 실시예에 있어서는 연결 영역을 제거한 후 노이즈를 제거할 수도 있을 것이다. 또한, 노이즈 제거 과정(S1114)을 거치지 않고 살색 계통의 컬러 영역 이미지로부터 연결 영역만을 제거할 수 있으며, 연결 영역 제거 과정(S1116)을 거치지 않고 해당 이미지로부터 노이즈만을 제거할 수도 있을 것이다.In the above-described embodiment, the connection area is removed after removing the noise from the color gamut image of the flesh color system, but in the modified embodiment, the noise may be removed after removing the connection area. In addition, only the connection area may be removed from the color gamut image of the flesh color system without going through the noise removing process (S1114), and only the noise may be removed from the corresponding image without going through the connection area removing process (S1116).

다음으로, 입력 이미지의 면적에 대한 스킨 영역의 면적의 비율에 따라 스킨 지수를 결정한다(S1120). 일 실시예에 있어서, 스킨 지수는 스킨 영역의 면적을 사용하여 결정된 스킨 지수가 제1 임계치 이하 또는 제2 임계치 이상인 경우, 기본값 으로서 다시 결정될 수 있다.Next, the skin index is determined according to the ratio of the area of the skin area to the area of the input image (S1120). In one embodiment, the skin index may be determined again as a default value when the skin index determined using the area of the skin area is less than or equal to the first threshold or greater than or equal to the second threshold.

도 12는 본 발명의 일 실시예에 따른 성인 호스트 판단 방법에서 텍스트 성인 지수에 대한 결정 과정(S1004)을 구체적으로 나타내는 순서도이다.12 is a flowchart specifically showing a determination process (S1004) for a text adult index in the method of determining an adult host according to an embodiment of the present invention.

먼저, 호스트로부터 획득한 입력 텍스트 중 상기 호스트가 운영하는 웹페이지로부터 추출한 텍스트의 성인 용어 관련도를 나타내는 웹페이지 성인 지수를 결정한다(S1202).First, a webpage adult index indicating an adult term relation degree of text extracted from a webpage operated by the host among input texts acquired from the host is determined (S1202).

다음으로, 입력 텍스트 중 호스트의 유알엘(URL)의 성인 용어 관련도를 나타내는 유알엘 성인 지수를 결정한다(S1204).Next, in the input text, the UEL adult index indicating the adult term relevance of the URL of the host is determined (S1204).

상술한 실시예에서는 웹페이지 성인 지수에 대한 결정 단계(S1202) 후에 유알엘 성인 지수에 대한 결정 단계(S1204)를 수행하지만, 변형된 실시예에서는 웹페이지 성인 지수에 대한 결정 단계(S1202)가 유알엘 성인 지수에 대한 결정 단계(S1204) 후에 수행될 수 있으며, 두 단계(S1202,S1204)가 동시에 수행될 수도 있다.In the above-described embodiment, the determining step S1204 for the UEL adult index is performed after the determining step S1202 for the webpage adult index, but in the modified embodiment, the determining step S1202 for the webpage adult index is UAL adult. It may be performed after the step S1204 of determining the index, and the two steps S1202 and S1204 may be simultaneously performed.

다음으로, 웹페이지 성인 지수 및 유알엘 성인 지수를 사용하여 텍스트 성인 지수를 결정한다(S1206). 일 실시예에 있어서, 상기 웹페이지로부터 추출한 텍스트는, 상기 호스트가 운영하는 웹페이지의 웹페이지 문서, BBS, 이미지 게시물, 및 동영상 게시물 중 적어도 하나로부터 추출된 것일 수 있다.Next, the text adult index is determined using the webpage adult index and the UEL adult index (S1206). The text extracted from the web page may be extracted from at least one of a web page document, a BBS, an image post, and a video post of a web page operated by the host.

일 실시예에 있어서, 텍스트 성인 지수는 웹페이지 성인 지수 및 유알엘 성인 지수 중 최대값에 의해 결정될 수 있다.In one embodiment, the text adult index may be determined by a maximum value of the webpage adult index and the UEL adult index.

도 13은 본 발명의 일 실시예에 따른 성인 호스트 판단 방법에서 웹페이지 성인 지수에 대한 결정 과정(S1202)을 구체적으로 나타내는 순서도이다.FIG. 13 is a flowchart specifically illustrating a determination process (S1202) of a webpage adult index in a method of determining an adult host according to an embodiment of the present invention.

먼저, 성인 웹페이지 및 비성인 웹페이지로 구성된 제2 트레이닝 셋으로부터 제1 후보 용어를 선정한다(S1302).First, a first candidate term is selected from a second training set consisting of an adult web page and an adult web page (S1302).

다음으로, 제1 후보 용어와 제1 후보 용어가 성인 웹페이지에 출현한 빈도 및 비성인 웹페이지에 출현한 빈도에 따라 결정되는 빈도 점수의 매핑 정보를 생성한다(S1304).Next, mapping information of frequency scores determined according to a frequency in which the first candidate term and the first candidate term appear in the adult webpage and the frequency in the non-adult webpage is generated (S1304).

다음으로, 상기 매핑 정보를 참조하여, 호스트가 운영하는 웹페이지에 포함된 용어에 매핑되는 빈도 점수를 사용하여 웹페이지 성인 지수를 결정한다(S1306). Next, referring to the mapping information, a webpage adult index is determined using a frequency score mapped to a term included in a webpage operated by the host (S1306).

일 실시예에 있어서, 호스트가 운영하는 웹페이지에 포함된 용어와 동일한 제1 후보 용어를 찾고, 그 제1 후보 용어에 매핑되는 빈도 점수를 찾는다. 그리고, 그 빈도 점수를 사용하여 웹페이지 성인 지수를 결정하게 된다. 여기서, 빈도 점수의 산출 및 빈도 점수를 사용하여 웹페이지 성인 지수를 결정하는데 필요한 과정은 수학식 3 및 수학식 4로써 상술하였으므로 설명을 생략한다. In one embodiment, a first candidate term is found that is identical to a term included in a webpage operated by the host, and a frequency score mapped to the first candidate term is found. The frequency score is then used to determine the webpage adult index. Here, since the process required for calculating the webpage adult index using the frequency score and the frequency score is described above as Equation 3 and Equation 4, description thereof is omitted.

도 14는 본 발명의 일 실시예에 따른 성인 호스트 판단 방법에서 유알엘 성인 지수에 대한 결정 과정(S1204)을 구체적으로 나타내는 순서도이다.14 is a flowchart specifically illustrating a determination process (S1204) of a UEL adult index in the method of determining an adult host according to an embodiment of the present invention.

먼저, 성인 호스트 및 비성인 호스트의 유알엘로 구성된 제3 트레이닝 셋으로부터 제2 후보 용어를 선정한다(S1402).First, a second candidate term is selected from a third training set consisting of UALs of an adult host and an adult host (S1402).

다음으로, 제2 후보 용어와 제2 후보 용어가 성인 호스트의 유알엘에 출현한 빈도 및 비성인 호스트의 유알엘에 출현한 빈도에 따라 결정되는 빈도 점수의 매핑 정보를 생성한다(S1404).Next, mapping information of frequency scores determined according to the frequency of appearance of the second candidate term and the second candidate term in the UAL of the adult host and the appearance of the UAL of the adult host is generated (S1404).

다음으로, 상기 매핑 정보를 참조하여, 호스트의 유알엘에 포함된 용어에 매핑되는 빈도 점수를 사용하여 유알엘 성인 지수를 결정한다(S1406). 여기서, 유알엘 성인 지수를 위한 빈도 점수의 산출 및 빈도 점수를 사용하여 유알엘 성인 지수를 결정하는데 필요한 과정은 수학식 3 및 수학식 4로써 이해될 수 있으므로 자세한 설명을 생략한다. Next, the UEL adult index is determined using the frequency score mapped to the term included in the UEL of the host by referring to the mapping information (S1406). Here, the process required to determine the UEL adult index using the calculation of the frequency score for the UEL adult index and the frequency score can be understood as Equation 3 and Equation 4 will not be described in detail.

본 발명의 일 실시예에 따른 성인물 판단 방법은 다양한 컴퓨터 수단을 이용하여 수행될 수 있는 프로그램 형태로도 구현될 수 있는데, 이때 성인물 판단 방법을 수행하기 위한 프로그램은 하드 디스크, CD-ROM, DVD, 롬(ROM), 램, 또는 플래시 메모리와 같은 컴퓨터로 판독할 수 있는 기록 매체에 저장된다.Adult content determination method according to an embodiment of the present invention can be implemented in the form of a program that can be performed using a variety of computer means, the program for performing the adult content determination method is a hard disk, CD-ROM, DVD, It is stored in a computer-readable recording medium such as a ROM, a RAM, or a flash memory.

본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다.Those skilled in the art to which the present invention pertains will understand that the present invention can be implemented in other specific forms without changing the technical spirit or essential features.

그러므로, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.Therefore, it is to be understood that the embodiments described above are exemplary in all respects and not restrictive. The scope of the present invention is shown by the following claims rather than the detailed description, and all changes or modifications derived from the meaning and scope of the claims and their equivalent concepts should be construed as being included in the scope of the present invention. do.

도 1은 본 발명의 일 실시예에 따른 성인 호스트 판단 시스템의 개략적인 블록도.1 is a schematic block diagram of an adult host determination system in accordance with an embodiment of the present invention.

도 2는 본 발명의 일 실시예에 따른 스킨 지수 결정부를 나타낸 개략적인 블록도.Figure 2 is a schematic block diagram showing a skin index determination unit according to an embodiment of the present invention.

도 3은 본 발명의 일 실시예에 따른 스킨 영역 결정부를 개략적으로 나타낸 블록도.3 is a block diagram schematically illustrating a skin region determiner according to an embodiment of the present invention.

도 4는 본 발명의 일 실시예에 따른 스킨 지수 결정부에 의해 처리되는 이미지들을 나타낸 도면.4 is a view showing images processed by the skin index determiner according to an embodiment of the present invention.

도 5는 본 발명의 일 실시예에 따른 텍스트 성인 지수 결정부를 나타낸 개략적인 블록도.5 is a schematic block diagram illustrating a text adult index determiner according to an embodiment of the present invention.

도 6은 본 발명의 일 실시예에 따른 웹페이지 성인 지수 결정부를 나타낸 개략적인 블록도.6 is a schematic block diagram showing a webpage adult index determination unit according to an embodiment of the present invention.

도 7은 본 발명의 일 실시예에 따른 제1 사전의 일 예를 나타낸 도면.7 illustrates an example of a first dictionary according to an embodiment of the present invention.

도 8은 본 발명의 일 실시예에 따른 유알엘 성인 지수 결정부를 나타낸 개략적인 블록도.8 is a schematic block diagram showing a UEL adult index determination unit according to an embodiment of the present invention.

도 9는 본 발명의 일 실시예에 따른 성인 지수 결정부가 검수 대상 호스트의 성인 지수를 결정한 결과를 나타내는 도면.FIG. 9 is a diagram illustrating a result of determining an adult index of a host to be inspected by an adult index determination unit according to an embodiment of the present invention; FIG.

도 10은 본 발명의 일 실시예에 따른 성인 호스트 판단 방법을 나타내는 순서도.10 is a flowchart illustrating a method of determining an adult host according to an embodiment of the present invention.

도 11은 본 발명의 일 실시예에 따른 성인 호스트 판단 방법에서 스킨 지수에 대한 결정 과정을 구체적으로 나타내는 순서도.11 is a flowchart specifically showing a determination process for a skin index in the method of determining an adult host according to an embodiment of the present invention.

도 12는 본 발명의 일 실시예에 따른 성인 호스트 판단 방법에서 텍스트 성인 지수에 대한 결정 과정을 구체적으로 나타내는 순서도.12 is a flow chart showing in detail the determination process for the text adult index in the adult host determination method according to an embodiment of the present invention.

도 13은 본 발명의 일 실시예에 따른 성인 호스트 판단 방법에서 웹페이지 성인 지수에 대한 결정 과정을 구체적으로 나타내는 순서도.FIG. 13 is a flowchart specifically illustrating a determination process of a webpage adult index in a method of determining an adult host according to an embodiment of the present invention. FIG.

도 14는 본 발명의 일 실시예에 따른 성인 호스트 판단 방법에서 유알엘 성인 지수에 대한 결정 과정을 구체적으로 나타내는 순서도.14 is a flow chart showing in detail the determination process for the UEL adult index in the adult host determination method according to an embodiment of the present invention.

<도면의 주요부분에 대한 부호의 설명><Description of the symbols for the main parts of the drawings>

102: 성인 호스트 판단 시스템 104: 스킨 지수 결정부102: adult host judgment system 104: skin index determination unit

106: 텍스트 성인 지수 결정부 108: 성인 지수 결정부106: text adult index determination section 108: adult index determination section

110: 성인 호스트 판단부 110: adult host judgment

Claims (26)

대상물로부터 수집된 입력 이미지의 성인 이미지 관련도를 나타내는 스킨 지수(skin index)를 결정하는 단계;Determining a skin index indicating an adult image relevance of the input image collected from the object; 상기 대상물로부터 수집된 입력 텍스트의 성인 용어 관련도를 나타내는 텍스트 성인 지수를 결정하는 단계;Determining a textual adult index indicating an adult term relevance of the input text collected from the object; 상기 스킨 지수 및 텍스트 성인 지수를 사용하여 성인 지수를 결정하는 단계; 및Determining an adult index using the skin index and the text adult index; And 상기 성인 지수에 따라 상기 대상물의 성인물 여부를 판단하는 단계를 포함하고,Determining whether the object is an adult object according to the adult index; 상기 텍스트 성인 지수를 결정하는 단계는,Determining the text adult index, 상기 입력 텍스트 중 상기 대상물에 관련된 웹페이지로부터 추출한 텍스트의 성인 용어 관련도를 나타내는 웹페이지 성인 지수를 결정하는 단계;Determining a webpage adult index indicating an adult term relevance of text extracted from a webpage related to the object among the input texts; 상기 입력 텍스트 중 상기 대상물에 관련된 유알엘(URL)의 성인 용어 관련도를 나타내는 유알엘 성인 지수를 결정하는 단계; 및Determining a UELEL adult index indicating an adult term relevance of a URL related to the object in the input text; And 상기 웹페이지 성인 지수 및 유알엘 성인 지수를 사용하여 상기 텍스트 성인 지수를 결정하는 단계;Determining the text adult index using the webpage adult index and the UEL adult index; 를 포함하는 것을 특징으로 하는 성인물 판단 방법.Adult content determination method comprising a. 제1항에 있어서, 상기 스킨 지수를 결정하는 단계는,The method of claim 1, wherein determining the skin index, 상기 입력 이미지가 살색 계통의 컬러(color) 영역을 포함하는 경우, 상기 입력 이미지로부터 상기 살색 계통의 컬러 영역 이미지를 획득하는 단계;Acquiring a color gamut image of the skin color line from the input image when the input image includes a color area of the skin color line; 상기 컬러 영역 이미지를 사용하여 스킨 영역을 결정하는 단계; 및Determining a skin region using the color region image; And 상기 스킨 영역의 면적을 사용하여 스킨 지수를 결정하는 단계;Determining a skin index using the area of the skin region; 를 포함하는 것을 특징으로 하는 성인물 판단 방법.Adult content determination method comprising a. 제2항에 있어서, 상기 스킨 지수는,The method of claim 2, wherein the skin index is, 상기 입력 이미지의 면적에 대한 상기 스킨 영역의 면적의 비율에 따라 결정 되는 것을 특징으로 하는 성인물 판단 방법.Adult content determining method according to the ratio of the area of the skin area to the area of the input image. 제2항에 있어서, 상기 스킨 지수를 결정하는 단계는,The method of claim 2, wherein determining the skin index, 상기 입력 이미지가 회색 계통의 컬러 영역으로 이루어졌는지 판단하는 단계를 더 포함하되,The method may further include determining whether the input image is comprised of a gray area of a color area. 상기 입력 이미지가 회색 계통의 컬러 영역으로 이루어진 것으로 판단된 경우, 상기 스킨 지수는 기준치로서 결정되는 것을 특징으로 하는 성인물 판단 방법.And determining the skin index as a reference value when the input image is determined to be a gray region of a color region. 제2항에 있어서, 상기 스킨 영역을 결정하는 단계는,The method of claim 2, wherein the determining of the skin region comprises: 상기 컬러 영역 이미지를 필터링하여 노이즈를 제거하는 단계; 및Filtering the color gamut image to remove noise; And 상기 노이즈가 제거된 이미지를 사용하여 상기 스킨 영역을 결정하는 단계;Determining the skin region using the noise removed image; 를 포함하는 것을 특징으로 하는 성인물 판단 방법.Adult content determination method comprising a. 제2항에 있어서, 상기 스킨 영역을 결정하는 단계는,The method of claim 2, wherein the determining of the skin region comprises: 상기 컬러 영역 이미지 중 면적이 설정값 이하인 연결 영역(connected component)이 제거된 이미지를 획득하는 단계; 및Obtaining an image from which a connected component having an area less than or equal to a predetermined value of the color area image is removed; And 상기 연결 영역이 제거된 이미지를 사용하여 상기 스킨 영역을 결정하는 단계;Determining the skin region using the image from which the connection region has been removed; 를 포함하는 것을 특징으로 하는 성인물 판단 방법.Adult content determination method comprising a. 제2항에 있어서, 상기 컬러 영역의 포함 여부에 대한 판단은,The method of claim 2, wherein the determination on whether the color region is included, 상기 입력 이미지의 상대적 RGB가 상기 살색 계통에 해당하는 상대적 RGB의 범위에 포함되는지 여부로써 수행되는 것을 특징으로 하는 성인물 판단 방법.And determining whether the relative RGB of the input image falls within a range of the relative RGB corresponding to the flesh color line. 제1항에 있어서, 상기 대상물은,The method of claim 1, wherein the object, 이미지 콘텐츠, 동영상 콘텐츠, 호스트, 블로그, 웹페이지, 웹사이트, 카페, 미니 홈피 및 BBS(Bulletin Board System) 중 적어도 하나를 포함하는 것을 특징으로 하는 성인물 판단 방법.Adult content determination method comprising at least one of the image content, video content, host, blog, web page, website, cafe, mini homepage and BBS (Bulletin Board System). 삭제delete 제1항에 있어서, 상기 웹페이지로부터 추출한 텍스트는,The method of claim 1, wherein the text extracted from the web page, 상기 웹페이지의 웹페이지 문서, BBS, 이미지 게시물, 및 동영상 게시물 중 적어도 하나로부터 추출된 것을 특징으로 하는 성인물 판단 방법.Adult content determination method, characterized in that extracted from at least one of the web page document, BBS, image posts, and video posts of the web page. 제1항에 있어서, 상기 웹페이지 성인 지수를 결정하는 단계는,The method of claim 1, wherein the determining of the webpage adult index comprises: 성인 웹페이지 및 비성인 웹페이지로 구성된 제2 트레이닝 셋으로부터 제1 후보 용어를 선정하는 단계;Selecting a first candidate term from a second training set consisting of an adult webpage and an adult webpage; 상기 제1 후보 용어와 상기 제1 후보 용어가 상기 성인 웹페이지에 출현한 빈도 및 상기 비성인 웹페이지에 출현한 빈도에 따라 결정되는 제1 빈도 점수의 매핑 정보를 생성하는 단계; 및Generating mapping information of a first frequency score determined according to a frequency of the first candidate term and the first candidate term appearing on the adult webpage and a frequency of appearance on the non-adult webpage; And 상기 매핑 정보를 참조하여, 상기 웹페이지로부터 추출된 텍스트에 상응하는 제1 후보 용어에 매핑되는 제1 빈도 점수를 사용하여 상기 웹페이지 성인 지수를 결정하는 단계;Determining the webpage adult index by using a first frequency score mapped to a first candidate term corresponding to text extracted from the webpage with reference to the mapping information; 를 포함하는 것을 특징으로 하는 성인물 판단 방법.Adult content determination method comprising a. 제1항에 있어서, 상기 유알엘 성인 지수를 결정하는 단계는,The method of claim 1, wherein the determining of the UEL Adult Index, 성인물의 유알엘과 비성인물의 유알엘로 구성된 제3 트레이닝 셋으로부터 제2 후보 용어를 선정하는 단계;Selecting a second candidate term from a third training set consisting of the adult UEL and the adult adult UEL; 상기 제2 후보 용어와 상기 제2 후보 용어가 상기 성인물의 유알엘에 출현한 빈도 및 상기 비성인물의 유알엘에 출현한 빈도에 따라 결정되는 제2 빈도 점수의 매핑 정보를 생성하는 단계; 및Generating mapping information of a second frequency score determined according to a frequency of the second candidate term and the second candidate term appearing in the UEL of the adult and a frequency of appearing in the UEL of the non-adult; And 상기 매핑 정보를 참조하여, 상기 대상물에 관련된 유알엘에 상응하는 제2 후보 용어에 매핑되는 제2 빈도 점수를 사용하여 상기 유알엘 성인 지수를 결정하는 단계;Determining the UEL adult index by using a second frequency score mapped to a second candidate term corresponding to the UEL related to the object by referring to the mapping information; 를 포함하는 것을 특징으로 하는 성인물 판단 방법.Adult content determination method comprising a. 제1항에 있어서, 상기 텍스트 성인 지수는,The method of claim 1, wherein the text adult index is 상기 웹페이지 성인 지수 및 상기 유알엘 성인 지수 중 최대값에 의해 결정되는 것을 특징으로 하는 성인물 판단 방법.Adult content determination method, characterized in that determined by the maximum value of the web page adult index and the UEL adult index. 제1항 내지 제8항, 제10항 내지 제13항 중 어느 하나의 항에 기재된 방법을 수행하기 위한 프로그램이 기록된 컴퓨터로 판독 가능한 기록매체.A computer-readable recording medium having recorded thereon a program for performing the method according to any one of claims 1 to 8 and 10 to 13. 대상물로부터 수집된 입력 이미지의 성인 이미지 관련도를 나타내는 스킨 지수(skin index)를 결정하는 스킨 지수 결정부;A skin index determiner for determining a skin index indicating an adult image relevance of an input image collected from an object; 상기 대상물로부터 수집된 입력 텍스트의 성인 용어 관련도를 나타내는 텍스트 성인 지수를 결정하는 텍스트 성인 지수 결정부;A text adult index determination unit for determining a text adult index indicating an adult term relevance of the input text collected from the object; 상기 스킨 지수 및 텍스트 성인 지수를 사용하여 성인 지수를 결정하는 성인 지수 결정부; 및An adult index determiner that determines an adult index using the skin index and the text adult index; And 상기 성인 지수에 따라 상기 대상물의 성인물 여부를 판단하는 성인물 판단부를 포함하고,And an adult material determining unit determining whether the object is adult according to the adult index. 상기 텍스트 성인 지수 결정부는,The text adult index determination unit, 상기 입력 텍스트 중 상기 대상물에 관련된 웹페이지로부터 추출한 텍스트의 성인 용어 관련도를 나타내는 웹페이지 성인 지수를 결정하는 웹페이지 성인 지수 결정부;A web page adult index determination unit for determining a web page adult index indicating an adult term relevance of text extracted from a web page related to the object among the input texts; 상기 입력 텍스트 중 상기 대상물에 관련된 유알엘의 성인 용어 관련도를 나타내는 유알엘 성인 지수를 결정하는 유알엘 성인 지수 결정부; 및A UEL adult index determination unit which determines a UEL adult index indicating an adult term relation of UAl related to the object in the input text; And 상기 웹페이지 성인 지수 및 유알엘 성인 지수를 사용하여 상기 텍스트 성인 지수를 결정하는 텍스트 성인 지수 산출부;A text adult index calculator configured to determine the text adult index using the webpage adult index and the UEL adult index; 를 포함하는 것을 특징으로 하는 성인물 판단 시스템.Adult content determination system comprising a. 제15항에 있어서, 상기 스킨 지수 결정부는,The method of claim 15, wherein the skin index determiner, 상기 입력 이미지가 살색 계통의 컬러 영역을 포함하는 경우, 상기 입력 이미지로부터 상기 살색 계통의 컬러 영역 이미지를 획득하는 살색 영역 결정부;A skin color region determiner which obtains a color region image of the skin color system from the input image when the input image includes a color region of a skin color system; 상기 컬러 영역 이미지를 사용하여 스킨 영역을 결정하는 스킨 영역 결정부; 및A skin region determiner configured to determine a skin region using the color region image; And 상기 스킨 영역의 면적을 사용하여 스킨 지수를 결정하는 스킨 지수 산출부;A skin index calculator configured to determine a skin index using an area of the skin region; 를 포함하는 것을 특징으로 하는 성인물 판단 시스템.Adult content determination system comprising a. 제16항에 있어서, 상기 스킨 지수 산출부는,The method of claim 16, wherein the skin index calculator, 상기 입력 이미지의 면적에 대한 상기 스킨 영역의 면적의 비율에 따라 상기 스킨 지수를 결정하는 것을 특징으로 하는 성인물 판단 시스템.And determine the skin index according to a ratio of the area of the skin region to the area of the input image. 제16항에 있어서, 상기 스킨 지수 산출부는,The method of claim 16, wherein the skin index calculator, 상기 입력 이미지가 회색 계통의 컬러 영역으로 이루어진 것으로 판단된 경우, 상기 스킨 지수를 기준치로서 결정하는 것을 특징으로 하는 성인물 판단 시스템.And determining the skin index as a reference value when it is determined that the input image is formed of a gray region of a color region. 제16항에 있어서, 상기 스킨 영역 결정부는,The method of claim 16, wherein the skin region determiner, 상기 컬러 영역 이미지를 필터링하여 노이즈를 제거하는 필터부; 및A filter unit filtering the color gamut image to remove noise; And 상기 노이즈가 제거된 이미지를 사용하여 상기 스킨 영역을 결정하는 스킨 영역 판단부;A skin region determiner configured to determine the skin region using the image from which the noise is removed; 를 포함하는 것을 특징으로 하는 성인물 판단 시스템.Adult content determination system comprising a. 제16항에 있어서, 상기 스킨 영역 결정부는,The method of claim 16, wherein the skin region determiner, 상기 컬러 영역 이미지 중 면적이 설정값 이하인 연결 영역을 제거하는 연결 영역 제거부; 및A connection area removal unit for removing a connection area having an area less than or equal to a set value of the color area image; And 상기 연결 영역이 제거된 이미지를 사용하여 상기 스킨 영역을 결정하는 스킨 영역 판단부;A skin region determiner configured to determine the skin region using the image from which the connection region is removed; 를 포함하는 것을 특징으로 하는 성인물 판단 시스템.Adult content determination system comprising a. 제16항에 있어서, 상기 살색 영역 결정부는,The method of claim 16, wherein the skin region determiner, 상기 입력 이미지의 상대적 RGB가 상기 살색 계통에 해당하는 상대적 RGB의 범위에 포함되는지 여부로써 상기 컬러 영역의 포함 여부를 판단하는 것을 특징으로 하는 성인물 판단 시스템.And determining whether the color gamut is included or not based on whether the relative RGB of the input image is included in a range of relative RGB corresponding to the flesh color line. 제16항에 있어서, 상기 스킨 지수 결정부는,The method of claim 16, wherein the skin index determiner, 제1 트레이닝 셋을 사용하여 살색 범위를 결정하는 트레이닝을 수행하고, 상기 살색 범위에 따라 상기 살색 계통을 정의하는 트레이닝부를 더 포함하되,Further comprising a training unit configured to determine a skin color range using a first training set, and to define the skin color line according to the skin color range, 상기 살색 영역 결정부는 상기 트레이닝부에 의해 정의된 살색 계통에 의해 상기 컬러 영역의 포함 여부를 판단하는 것을 특징으로 하는 성인물 판단 시스템.The flesh area determining unit determines the inclusion of the color area by the flesh color system defined by the training unit. 삭제delete 제15항에 있어서, 상기 웹페이지 성인 지수 결정부는,The method of claim 15, wherein the web page adult index determination unit, 성인 웹페이지 및 비성인 웹페이지로 구성된 제2 트레이닝 셋으로부터 제1 후보 용어를 선정하는 제1 후보 용어 선정부;A first candidate term selecting unit selecting a first candidate term from a second training set consisting of an adult web page and an adult web page; 상기 제1 후보 용어와 상기 제1 후보 용어가 상기 성인 웹페이지에 출현한 빈도 및 상기 비성인 웹페이지에 출현한 빈도에 따라 결정되는 제1 빈도 점수의 매핑 정보를 생성하는 제1 사전 생성부; 및A first dictionary generator configured to generate mapping information of a first frequency score determined according to a frequency of the first candidate term and the first candidate term appearing on the adult webpage and a frequency of appearing on the non-adult webpage; And 상기 매핑 정보를 참조하여, 상기 웹페이지로부터 추출한 텍스트에 상응하는 제1 후보 용어에 매핑되는 제1 빈도 점수를 사용하여 상기 웹페이지 성인 지수를 결정하는 웹페이지 성인 지수 산출부;A webpage adult index calculator for determining the webpage adult index by using a first frequency score mapped to a first candidate term corresponding to text extracted from the webpage, with reference to the mapping information; 를 포함하는 것을 특징으로 하는 성인물 판단 시스템.Adult content determination system comprising a. 제15항에 있어서, 상기 유알엘 성인 지수 결정부는,The method of claim 15, wherein the UEL adult index determination unit, 성인물의 유알엘 및 비성인물의 유알엘로 구성된 제3 트레이닝 셋으로부터 제2 후보 용어를 선정하는 제2 후보 용어 선정부;A second candidate term selecting unit for selecting a second candidate term from a third training set consisting of a UEL of adult and a UEL of non-adult; 상기 제2 후보 용어와 상기 제2 후보 용어가 상기 성인물의 유알엘에 출현한 빈도 및 상기 비성인물의 유알엘에 출현한 빈도에 따라 결정되는 제2 빈도 점수의 매핑 정보를 생성하는 제2 사전 생성부; 및A second dictionary generator for generating mapping information of a second frequency score determined according to a frequency of the second candidate term and the second candidate term appearing in the UEL of the adult and a frequency of appearing in the UEL of the non-adult; And 상기 매핑 정보를 참조하여, 상기 대상물에 관련된 유알엘에 상응하는 제2 후보 용어에 매핑되는 제2 빈도 점수를 사용하여 상기 유알엘 성인 지수를 결정하는 유알엘 성인 지수 산출부;A UEL adult index calculator configured to determine the UEL adult index by using a second frequency score mapped to a second candidate term corresponding to the UAL related to the object by referring to the mapping information; 를 포함하는 것을 특징으로 하는 성인물 판단 시스템.Adult content determination system comprising a. 제15항에 있어서, 상기 텍스트 성인 지수 산출부는,The method of claim 15, wherein the text adult index calculator, 상기 텍스트 성인 지수를 상기 웹페이지 성인 지수 및 상기 유알엘 성인 지수 중 최대값에 따라 결정하는 것을 특징으로 하는 성인물 판단 시스템.And the text adult index is determined according to a maximum value of the webpage adult index and the UEL adult index.
KR1020080033575A 2008-04-11 2008-04-11 System and Method for Determining Adult Contents KR100926448B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020080033575A KR100926448B1 (en) 2008-04-11 2008-04-11 System and Method for Determining Adult Contents

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020080033575A KR100926448B1 (en) 2008-04-11 2008-04-11 System and Method for Determining Adult Contents

Publications (2)

Publication Number Publication Date
KR20090108248A KR20090108248A (en) 2009-10-15
KR100926448B1 true KR100926448B1 (en) 2009-11-13

Family

ID=41551668

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080033575A KR100926448B1 (en) 2008-04-11 2008-04-11 System and Method for Determining Adult Contents

Country Status (1)

Country Link
KR (1) KR100926448B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102315243B1 (en) 2021-02-23 2021-10-20 주식회사 컴위드 Apparatus for Adult Content Service and Driving Method Thereof

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102666481B1 (en) * 2022-02-11 2024-05-14 네이버 주식회사 Method and system for generating safe internet resource access information

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19990025595A (en) * 1997-09-13 1999-04-06 전주범 Preventing adult site open on televisions with Internet capabilities
JP2002117401A (en) 2000-10-04 2002-04-19 Shin Ryu Adult and sex image detection system
KR20060001830A (en) * 2005-08-17 2006-01-06 (주)엠아이티소프트 System and method for blocking pornography
KR20080110064A (en) * 2007-06-14 2008-12-18 유성준 Method for distinguishing obscene image and apparatus therefor

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19990025595A (en) * 1997-09-13 1999-04-06 전주범 Preventing adult site open on televisions with Internet capabilities
JP2002117401A (en) 2000-10-04 2002-04-19 Shin Ryu Adult and sex image detection system
KR20060001830A (en) * 2005-08-17 2006-01-06 (주)엠아이티소프트 System and method for blocking pornography
KR20080110064A (en) * 2007-06-14 2008-12-18 유성준 Method for distinguishing obscene image and apparatus therefor

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102315243B1 (en) 2021-02-23 2021-10-20 주식회사 컴위드 Apparatus for Adult Content Service and Driving Method Thereof

Also Published As

Publication number Publication date
KR20090108248A (en) 2009-10-15

Similar Documents

Publication Publication Date Title
Luiten et al. Premvos: Proposal-generation, refinement and merging for video object segmentation
CN107122806B (en) Sensitive image identification method and device
Dong et al. Casia image tampering detection evaluation database
Liu et al. Image retargeting quality assessment
US8352405B2 (en) Incorporating lexicon knowledge into SVM learning to improve sentiment classification
CN109614604B (en) Subtitle processing method, device and storage medium
CN112541476B (en) Malicious webpage identification method based on semantic feature extraction
CN111212303B (en) Video recommendation method, server and computer-readable storage medium
CN106844685B (en) Method, device and server for identifying website
CN111291572B (en) Text typesetting method and device and computer readable storage medium
CN109508406B (en) Information processing method and device and computer readable storage medium
CN111985419B (en) Video processing method and related equipment
Chan et al. Building systems to block pornography
CN114650447A (en) Method and device for determining video content abnormal degree and computing equipment
Jayanthiladevi et al. Text, images, and video analytics for fog computing
CN113076961B (en) Image feature library updating method, image detection method and device
CN114565927A (en) Table identification method and device, electronic equipment and storage medium
KR100926448B1 (en) System and Method for Determining Adult Contents
KR100970328B1 (en) System and Method for Determining Adult Contents
CN111950591B (en) Model training method, interaction relation recognition device and electronic equipment
CN114220057A (en) Video trailer identification method and device, electronic equipment and readable storage medium
CN114417860A (en) Information detection method, device and equipment
CN103778210A (en) Method and device for judging specific file type of file to be analyzed
Gundelach et al. Cookiescanner: An Automated Tool for Detecting and Evaluating GDPR Consent Notices on Websites
CN111753836A (en) Character recognition method and device, computer readable medium and electronic equipment

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121011

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20130926

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20140925

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20151102

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20161024

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20181105

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20191001

Year of fee payment: 11