KR20150030445A - System for detecting child pornography - Google Patents

System for detecting child pornography Download PDF

Info

Publication number
KR20150030445A
KR20150030445A KR20130109691A KR20130109691A KR20150030445A KR 20150030445 A KR20150030445 A KR 20150030445A KR 20130109691 A KR20130109691 A KR 20130109691A KR 20130109691 A KR20130109691 A KR 20130109691A KR 20150030445 A KR20150030445 A KR 20150030445A
Authority
KR
South Korea
Prior art keywords
image
child
feature
module
pornography
Prior art date
Application number
KR20130109691A
Other languages
Korean (ko)
Inventor
정치윤
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR20130109691A priority Critical patent/KR20150030445A/en
Publication of KR20150030445A publication Critical patent/KR20150030445A/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7837Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using objects detected or recognised in the video content
    • G06F16/784Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using objects detected or recognised in the video content the detected or recognised objects being people
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/103Static body considered as a whole, e.g. static pedestrian or occupant recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Human Computer Interaction (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

Provided is a system for detecting child pornography, which is capable of dividing and detecting effectively general pornography and child pornography using a soft biometric recognition technology. The system includes a video providing device configured to store at least one video content and provide the same to the outside; and a child pornography determination device configured to extract the video content stored in the video providing device, to analyze the incontinence of the extracted video content to determine incontinence, and to analyze soft biometric identification information on each of people from objects included in the video content by using a soft biometric identification method to determine whether the video content corresponds to child pornography content.

Description

아동 음란물 탐지 시스템{System for detecting child pornography}System for detecting child pornography [

본 발명은 음란물 탐지 시스템에 관한 것으로, 특히 멀티미디어데이터에서 소프트 생체인식 기술을 이용하여 아동 음란물을 분류할 수 있는 아동 음란물 탐지 시스템에 관한 것이다.The present invention relates to a pornographic object detection system, and more particularly, to a child pornographic object detection system capable of classifying child pornographic objects by using a soft biometric technique in multimedia data.

아동 음란물은 성폭력 범죄에 많은 영향을 미치고 있으며, 사회적 약자로서 보호되어야 할 아동을 대상으로 하는 음란물이라는 점에서 최근에 심각한 사회 문제로 대두되고 있다. 따라서 아동 음란물의 배포, 소지, 상영 등에 대한 처벌이 강화되고 있지만, 실질적으로 PC, USB 메모리, CD/DVD, 스트리밍 서비스 등에서 성인 음란물과 아동 음란물을 분류하거나 검색 할 수 있는 기술은 개발되고 있지 않다.Child pornography has a great impact on sexual violence crimes and has recently become a serious social problem in that it is a pornographic object intended for children who should be protected as a socially weak person. Therefore, although punishment for distributing, possessing, and showing child pornography has been strengthened, there is no technology developed to classify and search adult pornography and child pornography in PC, USB memory, CD / DVD, streaming service and the like.

일반적인 음란물을 검색하고 탐지하는 기술은 멀티미디어 데이터의 해쉬 값을 생성하여 비교하는 방법, 멀티미디어 데이터의 내용을 분석하는 방법 등이 개발되어 오고 있다. 멀티미디어 데이터의 해쉬 값을 사용하는 방법은 해쉬 목록에 포함된 음란물이라고 하더라도 코덱 및 해상도의 변경, 영상 편집 등이 발생하면 탐지 할 수 없는 단점이 있다. 따라서 저장장치에서 아동 음란물이 존재하는지 여부를 검색하는 목적으로 사용하기에는 어려움이 있다.Techniques for detecting and detecting common pornography have been developed, for example, by generating and comparing hash values of multimedia data, and analyzing the contents of multimedia data. The method of using the hash value of the multimedia data has a disadvantage in that it can not be detected even if the obscene content included in the hash list includes codec, resolution change, image editing, and the like. Therefore, it is difficult to use it for the purpose of retrieving whether or not child pornography exists in the storage device.

멀티미디어 데이터의 내용을 분석하여 음란물을 탐지하는 방법의 경우 동영상의 색상, 형태, 질감, 소리 등의 정보를 분석하여 음란물 여부를 분류하지만, 아동 음란물은 음란물과 특성이 유사하여 구분하기 어렵다. 따라서 일반적인 음란물을 분류하는 기법을 아동 음란물 탐지라는 제한된 용도로 사용하기에는 어려움이 있다. In the method of detecting pornographic material by analyzing the contents of multimedia data, it is difficult to distinguish the pornographic material because the pornographic material is similar in characteristics to the pornographic material. Therefore, it is difficult to use the technique of classifying general pornography as limited use of child pornography detection.

한국 등록 특허 제1013484호에는 영상 분할알고리즘을 이용하여 추출한 객체를 통해 이미지의 음란물 여부를 검출하기 위한 음란물 검출 시스템을 개시하고 있으나, 이 또한 단순히 음란물을 검출할 뿐, 아동 음란물을 별도로 구분하지 못하는 한계가 있다.Korean Patent No. 1013484 discloses a pornographic material detection system for detecting whether or not a pornographic object is an image through an object extracted using an image segmentation algorithm. However, this pornographic object detection system only detects pornographic material, .

본 발명의 목적은 소프트 생체인식 기술을 이용하여 효과적으로 일반 음란물과 아동 음란물을 구분하여 검출할 수 있는 아동 음란물 탐지 시스템을 제공하는데 있다.SUMMARY OF THE INVENTION It is an object of the present invention to provide a child pornography detection system that can effectively detect general pornography and child pornography effectively using soft biometric technology.

상기 목적을 달성하기 위한 본 발명의 일 예에 따른 아동 음란물 탐지 시스템은 적어도 하나의 영상 콘텐츠를 저장하고 외부로 제공할 수 있는 영상 제공 장치; 및 상기 영상 제공 장치에 저장된 적어도 하나의 영상 콘텐츠를 추출하여 추출된 상기 영상 콘텐츠의 선정성을 분석하여 선정도를 판별하고, 소프트 생체인식 기법을 이용하여 상기 영상 콘텐츠에 포함된 객체 중 사람 각각에 대한 소프트 생체인식 정보를 분석하여, 상기 영상 콘텐츠가 아동 음란물 콘텐츠인지 판별하는 아동 음란물 판단 장치; 를 포함한다.According to an aspect of the present invention, there is provided a child pornography detection system comprising: an image providing device capable of storing at least one image content and providing the image content to the outside; And extracting at least one image content stored in the image providing device and analyzing the selectivity of the extracted image content to determine a degree of selectivity, and determining a degree of selectivity for each of the objects included in the image content using a soft biometrics technique A child pornography determining device for analyzing soft biometric information to determine whether the image content is child pornographic content; .

따라서, 본 발명의 아동 음란물 탐지 시스템은 영상의 선정도와 소프트 생체인식을 통하여 생성된 등장 인물에 대한 성별, 나이 등의 정보를 사용함으로써 아동 음란물 탐지의 정확도를 높일 수 있으며, 유해 콘텐츠에 등장하는 인물의 성별, 나이를 분석함에 있어서 신장 정보, 음성 정보등을 결합하여 사용함으로써 성별, 나이 추정의 정확도를 높여서 아동 음란물 분류 성능을 향상 시킬 수 있다.Therefore, the child pornography detection system of the present invention can improve the accuracy of child pornography detection by using information such as sex, age, and the like of characters created through image selection and soft biometry, The sex and age of the child can be used in combination with the kidney information and the voice information to enhance the accuracy of the sex and age estimation, thereby improving the child pornography classification performance.

또한, 순차적인 방법으로 아동 음란물을 탐지하는 방법을 제공함으로써 스트리밍 데이터에서 아동 음란물탐지를 가능하게 하고, 대용량 스토리지에서 다수의 파일을 조사할 때 검색 속도를 향상 시킬 수 있다.In addition, it is possible to detect child pornography in streaming data by providing a method of detecting child pornography in a sequential manner, and to improve the retrieval speed when scanning a large number of files in a mass storage.

도1 은 본 발명의 일 실시예에 따른 아동음란물 탐지 시스템을 나타낸다.
도2 는 본 발명에 따른 선정성 분석부의 일 구현예를 나타낸다.
도3 은 본 발명에 따른 선정성 분석부의 다른 구현예를 나타낸다.
도4 는 본 발명에 따른 소프트 생체인식 분석부의 일 구현예를 나타낸다.
도5 는 도4의 소프트 생체인식 분석부에 의해 분석된 소프트 생체인식 정보의 적용예를 나탄낸다.
도6 은 본 발명에 따른 아동 음란물 분류부의 일 구현예를 나타낸다.
도7 은 특징 결합 모듈이 특징 벡터를 생성하는 일 예를 나타낸다.
도8 은 특징 결합 모듈이 특징 벡터를 생성하는 다른 예를 나타낸다.
도9 는 본 발명에 따른 아동 음란물 분류 모듈의 구현예를 나타낸다.
도10 은 본 발명의 일 실시예에 따른 아동 음란물 탐지 방법을 나타낸다.
도11 은 본 발명의 다른 실시예에 따른 아동 음란물 탐지 방법을 나타낸다.
1 shows a child pornography detection system according to an embodiment of the present invention.
2 shows an embodiment of the selectivity analyzing unit according to the present invention.
3 shows another embodiment of the selectivity analyzing unit according to the present invention.
4 shows an embodiment of a soft biometric analysis unit according to the present invention.
FIG. 5 illustrates an example of application of soft biometric information analyzed by the soft biometric analysis unit of FIG.
Fig. 6 shows an embodiment of a child pornography classification unit according to the present invention.
7 shows an example in which a feature combining module generates a feature vector.
Fig. 8 shows another example in which the feature combination module generates the feature vector.
Fig. 9 shows an embodiment of a child pornography classification module according to the present invention.
FIG. 10 shows a method for detecting pornography of a child according to an embodiment of the present invention.
11 shows a method for detecting child sexual pornography according to another embodiment of the present invention.

본 발명과 본 발명의 동작상의 이점 및 본 발명의 실시에 의하여 달성되는 목적을 충분히 이해하기 위해서는 본 발명의 바람직한 실시예를 예시하는 첨부 도면 및 첨부 도면에 기재된 내용을 참조하여야만 한다. In order to fully understand the present invention, operational advantages of the present invention, and objects achieved by the practice of the present invention, reference should be made to the accompanying drawings and the accompanying drawings which illustrate preferred embodiments of the present invention.

이하, 첨부한 도면을 참조하여 본 발명의 바람직한 실시예를 설명함으로서, 본 발명을 상세히 설명한다. 그러나, 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며, 설명하는 실시예에 한정되는 것이 아니다. 그리고, 본 발명을 명확하게 설명하기 위하여 설명과 관계없는 부분은 생략되며, 도면의 동일한 참조부호는 동일한 부재임을 나타낸다. Hereinafter, the present invention will be described in detail with reference to the preferred embodiments of the present invention with reference to the accompanying drawings. However, the present invention can be implemented in various different forms, and is not limited to the embodiments described. In order to clearly describe the present invention, parts that are not related to the description are omitted, and the same reference numerals in the drawings denote the same members.

명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라, 다른 구성요소를 더 포함할 수 있는 것을 의미한다. 또한, 명세서에 기재된 "...부", "...기", "모듈", "블록" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다.Throughout the specification, when an element is referred to as "including" an element, it does not exclude other elements unless specifically stated to the contrary. The terms "part", "unit", "module", "block", and the like described in the specification mean units for processing at least one function or operation, And a combination of software.

도1 은 본 발명의 일 실시예에 따른 아동 음란물 탐지 시스템 나타낸다.1 shows a child pornography detection system according to an embodiment of the present invention.

도1 을 참조하면 본 발명의 아동 음란물 탐지 시스템은 영상 제공 장치(100)와 아동 음란물 판단 장치(200)를 포함한다.Referring to FIG. 1, the child pornography detection system of the present invention includes an image providing apparatus 100 and a child pornography determining apparatus 200.

영상 제공 장치(100)는 적어도 하나의 영상 콘텐츠를 저장하고 외부로 제공할 수 있도록 구현된다. 영상 제공 장치(100)는 스마트 폰, 스마트 패드, PC 등에 포함되어 영상 콘텐츠를 저장할 수 있는 로컬 데이터 스토리지(110), 원격지에서 네트워크를 통해 영상 콘텐츠를 제공할 수 있는 네트워크 스토리지 (120) 및 원격지에서 스트리밍 기법으로 실시간 영상 콘텐츠를 제공할 수 있는 스트리밍 서비스 장치(130) 등의 각종 영상 저장 매체를 포함할 수 있다.The image providing apparatus 100 is configured to store at least one image content and provide the image content to the outside. The image providing apparatus 100 includes a local data storage 110 that can store image contents included in a smart phone, a smart pad, and a PC, a network storage 120 that can provide image contents through a network at a remote site, And a streaming service device 130 capable of providing real-time image contents using a streaming technique.

아동 음란물 판단 장치(200)는 영상 추출부(210), 선정성 분석부(220), 소프트 생체인식 분석부(230) 및 아동 음란물 분류부(240)를 포함한다.The child pornography determining apparatus 200 includes an image extracting unit 210, a sensibility analyzing unit 220, a soft biometric analyzing unit 230 and a child pornography sorting unit 240.

영상 추출부(210)는 상기 영상 제공 장치(100)에 저장된 적어도 하나의 영상 콘텐츠를 추출하여 입력 영상 콘텐츠를 획득한다. 영상 추출부(210)는 영상 제공 장치(100)의 로컬 데이터 스토리지(110), 네트워크 스토리지(120) 및 스트리밍 서비스 장치(30) 등의 영상 저장 매체에 저장된 적어도 하나의 영상 콘텐츠를 감지하고, 감지된 적어도 하나의 영상 콘텐츠를 수신한다. 영상 추출부(210)는 영상 제공 장치(100)에 포함된 적어도 하나의 영상 콘텐츠를 저장된 파일의 확장자 등을 이용하여 감지하거나, 영상 제공 장치(100)에서 외부로 출력되는 데이터를 수집 및 분석하여 영상 콘텐츠를 감지할 수 있다. 그리고 영상 추출부(210)는 수신된 영상 콘텐츠를 선정성 분석부(220) 및 소프트 생체인식 분석부(230)로 전송하여 영상을 분석하도록 한다.The image extracting unit 210 extracts at least one image content stored in the image providing apparatus 100 to acquire the input image content. The image extracting unit 210 detects at least one image content stored in an image storage medium such as the local data storage 110, the network storage 120 and the streaming service apparatus 30 of the image providing apparatus 100, At least one video content. The image extracting unit 210 senses at least one image content included in the image providing apparatus 100 using an extension of a stored file or collects and analyzes data output from the image providing apparatus 100 to the outside The image content can be detected. Then, the image extracting unit 210 transmits the received image content to the sensibility analyzing unit 220 and the soft biometric analyzing unit 230 to analyze the image.

이때, 영상 추출부(210)는 영상 콘텐츠에 포함된 음성 및 이미지의 모든 정보를 선정성 분석부(220)와 소프트 생체인식 분석부(230)로 전송할 수도 있으나, 경우에 따라서는 영상 콘텐츠의 일부분 만을 샘플링하여 선택적으로 전송할 수도 있다. 일반적인 HD급 동영상의 경우 초당 24~30프레임 정도로 구성되며, 1시간 정도의 동영상인 경우에는 8만 프레임 정도로 구성되어 선정성 분석부(220) 및 소프트 생체인식 분석부(230)가 분석할 데이터의 양이 많아진다. 또한 움직임이 없는 영상 또는 움직임이 적은 영상과 같이 연속되는 이미지에서 중복되는 정보들도 많이 존재하므로, 영상을 효율적으로 분석하기 위해서는 샘플링이 필요하다. 따라서 영상 추출부(210)는 기설정된 시간마다 분석 구간을 추출하는 시간 단위 샘플링, 기설정된 프레임 수 마다 분석 구간을 추출하는 프레임 단위 샘플링 등의 임계값에 기반한 샘플링 방법과 영상 분석을 통하여 씬(scene) 또는 샷(shot)의 변화를 탐지하여 분석 구간을 추출하는 방법 등의 다양한 방법을 사용하여 분석할 데이터를 샘플링하여 선정성 분석부(220) 및 소프트 생체인식 분석부(230)로 전송할 수 있다. 예를 들면, 영상 추출부(210)는 영상 콘텐츠를 분석하여 영상 콘텐츠에 표시되는 객체 중 사람이 포함되는 구간을 분석 구간으로 추출하여 선정성 분석부(220) 및 소프트 생체인식 분석부(230)로 전송할 수 있다. 즉 본 발명은 아동 음란물을 탐지하기 위한 방법이므로 사람이 포함되지 않은 영상 콘텐츠에 대해서는 분석할 필요가 없다. 이에 선정성 분석부(220) 및 소프트 생체인식 분석부(230)가 불필요하게 영상 콘텐츠를 분석하지 않도록 영상 추출부(210)가 사전에 필터링 작업을 수행할 수 있다.At this time, the image extracting unit 210 may transmit all information of the voice and image included in the image content to the sensibility analyzing unit 220 and the soft biometrics analyzing unit 230, but in some cases, only a part of the image content And may be selectively transmitted by sampling. In the case of a general HD-class moving image, it is composed of about 24 to 30 frames per second. When the moving image is about one hour, it is about 80,000 frames. The sensibility analysis unit 220 and the soft biometrics analysis unit 230 . In addition, since there are many information overlapping in a continuous image such as a motionless image or a motionless image, sampling is required to efficiently analyze the image. Accordingly, the image extracting unit 210 may extract a scene by a sampling method based on a threshold value such as time unit sampling for extracting an analysis interval at predetermined time intervals, frame-by-sample sampling for extracting an analysis interval for each predetermined number of frames, Or a method of extracting an analysis section by detecting a change of a shot or the like and may transmit the sampled data to the sensibility analysis unit 220 and the soft biometrics analysis unit 230. For example, the image extracting unit 210 analyzes the image content, extracts a section including a person among the objects displayed in the image content as an analysis section, and transmits the extracted section to the sensibility analysis unit 220 and the soft biometrics analysis unit 230 Lt; / RTI > That is, since the present invention is a method for detecting child pornography, there is no need to analyze image content that does not include a person. Therefore, the image extracting unit 210 may perform the filtering operation in advance so that the selectivity analyzing unit 220 and the soft biometric analyzing unit 230 do not unnecessarily analyze the image contents.

선정성 분석부(220)는 영상 추출부(210)로부터 영상 콘텐츠를 수신하고, 수신된 영상 콘텐츠의 특성(색상, 형태, 질감), 움직임, 소리 등의 정보를 프레임 단위 또는 기설정된 분석 구간 단위로 분석하여 선정성을 판단한다. 즉 음란물 여부를 판정한다. 선정성 분석부(220)는 기존의 음란물 탐지에 사용되는 해쉬 기반 음란물 탐지 방법, 내용 분석 기반 음란물 탐지 방법 등을 모두 적용 될 수 있다. 결과적으로 선정선 분석부(220)는 기존의 음란물 탐지 방법을 이용하여 아동 음란물과 일반 음란물을 구분하지 않고, 영상 콘텐츠가 음란물 콘텐츠인지를 판별한다.The selectivity analyzing unit 220 receives the image content from the image extracting unit 210 and transmits information such as the characteristics (color, shape, texture), motion, and sound of the received image content to a frame unit or a predetermined analysis unit Analysis is made to determine the selectivity. That is, it is judged whether or not obscene material is present. The susceptibility analyzing unit 220 can be applied to both hash-based pornography detection method and content analysis-based pornography detection method used for existing pornographic material detection. As a result, the selection line analyzer 220 determines whether the image content is pornographic content, without distinguishing the pornography object from the general pornography object using the existing pornographic material detection method.

소프트 생체인식 분석부(230)는 영상 추출부(210)로부터 영상 콘텐츠를 수신하고, 수신된 영상 콘텐츠에 포함된 객체 중 사람이 등장하는지 판별하고, 등장하는 사람의 특성을 소프트 생체인식 기법을 이용하여 분석한다.The soft biometrics analysis unit 230 receives the image content from the image extraction unit 210, determines whether a person is included in the object included in the received image content, and uses the soft biometrics technique Respectively.

소프트 생체인식 기술은 개인의 신원을 정확히 구분하기 위한 목적으로 사용되는 전통적인 생체인식 기술과 달리, 사람들이 자연스럽게 인지하는 특성(성별, 나이, 신장, 피부색, 걸음걸이 등)을 분석하여 개인의 개략정인 정보를 획득하기 위해 사용되는 기술이다. 전통적인 생체인식 기술은 개개인의 신원을 정확하게 확인하기 위해서 제약적 환경에서 사용자의 협력이 필요했다. 예를 들면, 각종 보안 장치에서 개인의 지문 정보나 홍체, 지정맥 정보 등을 이용하여 기 등록된 사람들 중 특정 사람을 판별하는 기술이 전통적인 생체인식 기술에 해당한다. 그리고 특정 사람을 판별하기 위해서는 기존에 판별대상이 되는 각 개인에 대한 정보가 미리 수집되어 있어야 하므로, 제약적인 환경에서만 사용가능하고, 지문 및 홍체 정보 등을 사용자가 제공해야만 하므로 사용자의 협력이 필수적이었다. 그에 비해 소프트 생체인식 기술은 성별, 나이, 신장 등과 같은 개인의 개략적인 특성만을 획득하기 위한 기술로, 사용자의 협력을 필요로 하지 않는다. 그러므로 영상 감시, 저장 영상의 분석 등에 용이하게 활용할 수 있다. Unlike traditional biometric technology, which is used to accurately identify an individual's identity, soft biometric technology analyzes characteristics naturally recognized by people (sex, age, height, skin color, gait, etc.) It is a technique used to acquire information. Traditional biometric technologies required user cooperation in a constrained environment to accurately identify an individual. For example, the conventional biometric technology corresponds to a technique of identifying a specific person among registered people by using fingerprint information, iris information, finger vein information, and the like in various security devices. In order to discriminate a specific person, information about each individual to be discriminated should be collected in advance. Therefore, it is necessary to provide users with fingerprint and iris information in a restrictive environment. . On the other hand, soft biometric technology is a technology for acquiring only the approximate characteristics of individual such as sex, age, height, etc., and does not require user cooperation. Therefore, it can be easily used for video surveillance and analysis of stored images.

이에 소프트 생체인식 분석부(230)는 소프트 생체인식 기술을 이용하여 영상에 포함된 사람이 성인인지 아동인지 판별할 수 있다.Accordingly, the soft biometric analysis unit 230 can determine whether the person included in the image is an adult or a child using soft biometric technology.

아동 음란물 분류부(240)는 선정성 분석부(220)에서 분석한 정보와 소프트 생체인식 분석부(230)에서 분석한 정보를 결합하여 아동 음란물 여부를 판단하는 기능을 수행한다. 즉 아동 음란물 분류부(240)는 선정성 분석부(220)에서 영상 콘텐츠가 음란물인지 판별하고, 소프트 생체인식 분석부(230)에서 영상 콘텐츠에 아동이 포함된 것으로 판별하면, 해당 영상 콘텐츠가 아동 음란물인 것으로 판별할 수 있다.The child pornography classifying unit 240 performs a function of judging whether a child is a pornographic child by combining information analyzed by the perceived property analyzing unit 220 and information analyzed by the soft biometric analyzing unit 230. That is, if the child pornography classification unit 240 determines that the image content is a pornographic material in the sensibility analysis unit 220 and the soft biometric analysis unit 230 determines that the image content includes a child, . ≪ / RTI >

아동 음란물 분류부(240)는 선정성 분석부(220)와 소프트 생체인식 분석부(230)에서 생성된 정보를 아동 음란물의 기준이 되는 데이터베이스에 저장된 유사한 영상을 검색하여 비교하는 검색 기반의 방법, 기계 학습 알고리즘과 선정성 분석부(220), 소프트 생체인식 분석부(240)에서 생성된 특징 정보를 사용하여 사전에 분류 모델을 생성한 후 입력되는 영상에 대해여 아동 음란물 여부를 분류하는 방법 등을 사용하여 적어도 하나의 영상 콘텐츠에서 아동 음란물을 분류할 수 있다.The child pornography classifying unit 240 may include a search-based method for searching for similar images stored in a database serving as a reference of the child pornography, and comparing the information generated by the sensibility analyzing unit 220 and the soft biometric analysis unit 230 A method of classifying a sexually explicit sex image of a child into an input image after generating a classification model in advance using the feature information generated by the learning algorithm and the sensibility analysis unit 220 and the soft biometric analysis unit 240 So that child pornography can be classified in at least one image content.

도2 는 본 발명에 따른 선정성 분석부의 일 구현예를 나타낸다.2 shows an embodiment of the selectivity analyzing unit according to the present invention.

상기한 바와 같이 영상 콘텐츠의 선정성을 분석하기 위해서는 유해 동영상의 해쉬값을 생성하여 비교하는 방법, 이미지의 전체의 색상, 질감, 형태 등의 특징 및 음성, 모션 정보를 사용하여 선정성을 분석하는 전역 특징 기반의 선정성 분석 방법, 이미지에서 특징점을 검출하고 특징점 주변의 지역적인 영역 정보를 사용하여 선정성을 분석하는 지역 특징 기반 선정성 분석 방법이 사용 될 수 있다.In order to analyze the sensibility of the image contents as described above, there is a method of generating and comparing hash values of the harmful video, a global characteristic of analyzing the sensibility by using characteristics such as the color, texture, Based sensory analysis method, a feature-based sensibility analysis method that detects feature points in an image and analyzes the sensibility using local area information around the feature points can be used.

도2 의 선정성 분석부(220)는 상기한 선정성 분석 방법 중 전역 특징에 기반한 영상 콘첸츠의 선정성 분석 방법을 사용하는 경우에 대한 구성을 나타낸다. 도2 의 선정성 분석부(220)는 영상 분할 모듈(221), 이미지 특징 추출 모듈(222), 음성 특징 추출 모듈(223) 및 선정도 분류 모듈(234)를 포함한다.The selectivity analyzing unit 220 of FIG. 2 shows a configuration for using the selectivity analysis method of the video content based on the global feature among the above selectivity analysis methods. 2 includes an image segmentation module 221, an image feature extraction module 222, a voice feature extraction module 223, and a selection degree classification module 234.

영상 분할 모듈(221)은 영상 추출부(210)로부터 영상 콘텐츠가 수신되면, 영상 콘텐츠에서 이미지와 음성을 구분하여, 이미지는 이미지 특징 추출 모듈(222)로 전송하고 음성은 음성 특징 분석 모듈(223)으로 전송한다. 이때 영상 분할 모듈(221)은 이미지 특징 추출 모듈(222)로 전송하는 이미지를 전체 또는 균일한 크기의 격자로 분할하여 전송할 수 있다.The image segmentation module 221 separates the image and audio from the image content, and transmits the image to the image feature extraction module 222. The voice is transmitted to the voice feature analysis module 223 ). At this time, the image segmentation module 221 may divide the image to be transmitted to the image feature extraction module 222 into a whole or a grid of a uniform size and transmit the segmented image.

이미지 특징 추출 모듈(222)은 색상 특징 추출부, 질감 특징 추출부, 형태 특징 추출부, 모션 특징 추출부 등의 서로 다른 복수개의 특징 추출부를 구비하여, 영상 분할 모듈(221)에서 분할되어 전송되는 이미지의 각 영역에서의 색상, 질감, 형태, 모션 등의 서로 다른 특징 정보를 추출한다.The image feature extraction module 222 includes a plurality of different feature extraction units, such as a color feature extraction unit, a texture feature extraction unit, a morphological feature extraction unit, and a motion feature extraction unit, And extracts different feature information such as color, texture, shape, and motion in each area of the image.

음성 특징 분석 모듈(223) 영상 분할 모듈(221)에서 분할되어 전송되는 음성에서 소리 패턴의 반복성 등의 특징을 추출한다.The voice feature analysis module 223 extracts characteristics such as the repeatability of the voice pattern from the voice divided and transmitted by the video segmentation module 221.

선정도 분류 모듈(224)은 선정도 분류 모델 및 선정도 분류부를 구비한다. 선정도 분류 모델은 이전 수집된 이미지 및 음성의 특징 정보들에 대해 기계학습을 통하여 사전에 생성된다. 선정도 분류부(224)는 이미지 특징 추출 모듈(222) 및 음성 특징 추출 모듈(223)에서 획득한 이미지 특징 정보 및 음성 특징 정보를 선정도 분류 모델과 비교하여 입력된 영상 콘텐츠의 선정도를 분류한다. 이 때 선정도는 프레임 단위 또는 분석 구간별로 생성될 수 있으며, 선정도는 0 ~ 1 사이의 값을 가지도록 설정될 수 있다. 여기서 0은 일반적인 영상을 의미하며, 1은 선정성이 높음을 의미한다. 그러나 선정도의 값은 다양하게 설정될 수 있다.The selection degree classification module 224 includes a selection degree classification model and a selection degree classification section. The selectivity classification model is created in advance through machine learning on feature information of previously collected images and voices. The selection degree classifying unit 224 compares the image feature information and the voice feature information acquired by the image feature extracting module 222 and the voice feature extracting module 223 with the selectivity classification model to classify the selected degree of the image content do. At this time, the degree of selectivity may be generated for each frame or analysis interval, and the degree of selectivity may be set to a value between 0 and 1. Here, 0 means general image and 1 means high selectivity. However, the value of the selectivity can be set to various values.

도3 은 본 발명에 따른 선정성 분석부의 다른 구현예를 나타낸다.3 shows another embodiment of the selectivity analyzing unit according to the present invention.

도3 의 전역 특징에 기반한 영상 콘텐츠의 선정성 분석 방법을 사용하는 도2 의 선정성 분석부와 달리 지역 특징에 기반한 방법을 사용할 수 있도록 구성된다. 도3 의 선정성 분석부(220)는 특징점 추출 모듈(225), 특징점 표현 모듈(226), 음성 특징 분석 모듈(227) 및 선정도 분류 모듈(228)을 포함한다.Unlike the lexicality analysis unit of FIG. 2, which uses the method of analyzing the sensibility of the image contents based on the global characteristics of FIG. 3, the method is configured to use the method based on the local features. 3 includes a feature extraction module 225, a feature extraction module 226, a voice feature analysis module 227, and a selection degree classification module 228.

특징점 추출 모듈(225)은 영상 추출부(210)로부터 영상 콘텐츠가 수신되면, 이미지와 음성을 구분하여, 이미지는 이미지 특징 추출 모듈(222)로 전송하고 음성은 음성 특징 분석 모듈(223)으로 전송한다. 이때 특징점 추출 모듈(225)는 도2 의 영상 분할 모듈(221)과 달리 특징점 표현 모듈(226)로 전송하는 이미지의 특징점을 추출하여 전송한다. 영상에서 특징점을 추출하는 기술은 기존에 다양한 영상 처리 기법으로 제시되어 있으므로 여기서는 상세한 설명을 생략한다.When the image content is received from the image extracting unit 210, the feature point extracting module 225 separates the image and voice, transmits the image to the image feature extracting module 222, and transmits the voice to the voice feature analyzing module 223 do. At this time, the feature point extraction module 225 extracts feature points of the image to be transmitted to the feature point presentation module 226 and transmits the extracted feature points, unlike the image segmentation module 221 of FIG. The technique of extracting feature points from an image has been proposed in various image processing techniques, so a detailed description thereof will be omitted here.

특징점 표현 모듈(225)은 명도 특징 추출부, 색상 특징 추출부 및 모션 특징 추출부 등의 서로 다른 복수개의 특징 추출부를 구비하여, 특징점 추출 모듈(225)에서 분할되어 전송되는 이미지의 각 특징점에 대해, 명도 특징값, 색상 특징값, 모션 특징값 등을 추출한다.The feature point expression module 225 includes a plurality of different feature extraction units such as a brightness feature extraction unit, a color feature extraction unit, and a motion feature extraction unit. The feature point expression module 225 performs a feature extraction process on each feature point of an image , Brightness feature value, color feature value, and motion feature value.

음성 특징 분석 모듈(227)은 도2 의 음성 특징 모듈(223)과 마찬가지로 특징점 추출 모듈(225)에서 분할되어 전송되는 음성에서 소리 패턴의 반복성 등의 특징을 추출한다.Like the voice feature module 223 of FIG. 2, the voice feature analysis module 227 extracts characteristics such as the repeatability of the voice pattern from the voice that is divided and transmitted by the feature point extraction module 225.

선정도 분류 모듈(228)은 도2 의 선정도 분류 모듈(224)와 동일하게 선정도 분류 모델 및 선정도 분류부를 구비한다. 선정도 분류 모델은 이전 수집된 이미지 및 음성의 특징 정보들에 대해 기계학습을 통하여 사전에 생성된다. 선정도 분류부(228)는 특징점 표현 모듈(226) 및 음성 특징 추출 모듈(228)에서 획득한 특징점 정보 및 음성 특징 정보를 기생성된 선정도 분류 모델과 비교하여 입력된 영상 콘텐츠의 선정도를 분류한다.The selection degree classification module 228 includes a selection degree classification model and a selection degree classification section in the same manner as the selection degree classification module 224 of FIG. The selectivity classification model is created in advance through machine learning on feature information of previously collected images and voices. The selection degree classifying unit 228 compares the feature point information and the voice feature information acquired by the feature point expression module 226 and the voice feature extraction module 228 with the generated selection degree classification model, Classify.

도4 는 본 발명에 따른 소프트 생체인식 분석부의 일 구현예를 나타낸다.4 shows an embodiment of a soft biometric analysis unit according to the present invention.

도4 의 소프트 생체인식 분석부(230)는 성별 추정 모듈(231), 음성 정보 분석 모듈(232), 나이 추정 모듈(233), 신장 추정 모듈(234) 및 소프트 생체정보 결합 모듈(235)을 포함한다.4 includes a gender estimation module 231, a voice information analysis module 232, an age estimation module 233, an elongation estimation module 234, and a soft biometric information association module 235 .

성별 추정 모듈(231), 음성 정보 분석 모듈(232), 나이 추정 모듈(233), 신장 추정 모듈(234) 및 소프트 생체정보 결합 모듈(235) 각각은 영상 추출부(210)에서 전송된 영상 콘텐츠를 분석하여 영상에 포함된 사람의 성별, 나이, 신장 등의 정보를 획득한다. 특히 신장 추정 모듈(234)은 얼굴 등과 같이 크기가 제한적인 객체가 검출 된 후, 정확한 사람의 신장을 측정할 수 없으므로, 기설정된 객체의 영역별 평균 크기와 검출된 객체의 크기 및 이미지 내에서의 위치 정보를 사용하여 신장을 추정할 수 있다. 성별 추정 모듈(231)과 나이 추정 모듈(233)은 영상에서 얼굴 검출을 수행 한 후, 얼굴의 특징점(눈, 코, 입 등) 정보를 사용하여 정규화 시킨 다음 정규화된 얼굴 영역에서 특징 정보를 추출하고, 사전에 학습된 성별 분류 모델 및 나이 분류 모델을 통하여 영상에 포함된 사람의 성별 및 나이를 판단한다. 특히 나이 추정 모듈(233)은 나이를 추정함에 있어서 이미지에서 직접 획득하는 정보 이외에도, 음성 정보 분석 모듈(232) 및 신장 추정 모듈(234)에서 획득되는 음성 정보, 신장 추정 정보등을 결합하여 이미지에 포함된 사람의 나이를 추정할 수 있다. 성별 추정 모듈(231) 또한 성별을 추정할 때 이미지에서 직접 획득하는 정보 외에 음성 정보 분석 모듈(232)에서 획득하는 음성 정보를 부가 정보로 사용할 수 있다. 음성 정보 분석 모듈(232)은 영상 콘텐츠에 포함된 사람의 소프트 생체 정보를 직접 획득하기 보다는 성별 추정 모듈(231), 나이 추정 모듈(233), 신장 추정 모듈(234)에서 소프트 생체 정보 추정 시에 정확도를 높이기 위한 보조 수단으로서 제공될 수 있다.The gender estimation module 231, the audio information analysis module 232, the age estimation module 233, the elongation estimation module 234 and the soft biometric information combination module 235 respectively extract the image contents And acquires information such as the sex, age, and height of the person included in the image. In particular, since the elongation estimation module 234 can not accurately measure the elongation of a person after the object having a limited size such as a face is detected, the elongation estimation module 234 estimates the average size of the predetermined object, the size of the detected object, The height information can be used to estimate the height. The gender estimation module 231 and the age estimation module 233 perform face detection on the image and then normalize the face using the feature points (eye, nose, mouth, etc.) of the face and then extract the feature information from the normalized face region And the gender and age of the person included in the image are determined through the previously learned gender classification model and the age classification model. In particular, the age estimation module 233 combines voice information, extension estimation information, and the like obtained from the voice information analysis module 232 and the extension estimation module 234 in addition to the information obtained directly from the image in estimating the age, You can estimate the age of the people involved. The gender estimation module 231 can also use the voice information acquired by the voice information analysis module 232 as additional information in addition to the information directly acquired from the image when estimating gender. The voice information analysis module 232 may be used to estimate the soft biometric information in the gender estimation module 231, the age estimation module 233, and the elongation estimation module 234, rather than directly acquiring the soft biometric information of a person included in the image content It can be provided as an auxiliary means for increasing the accuracy.

소프트 생체정보 결합 모듈(235)은 이미지에 존재하는 각 사람에 대한 식별자를 부여하고, 성별 추정 모듈(231), 나이 추정 모듈(233), 신장 추정 모듈(234)에서 생성된 소프트 생체정보가 각 식별자에 대응하도록 매칭하는 동작을 수행한다.  The soft biometric information combination module 235 assigns an identifier for each person present in the image and the soft biometric information generated by the gender estimation module 231, the age estimation module 233, and the elongation estimation module 234, And performs matching to correspond to the identifier.

상기에서는 소프트 생체인식 분석부(230)가 소프트 생체인식 정보를 획득하기 위해 성별 추정 모듈(231), 음성 정보 분석 모듈(232), 나이 추정 모듈(233), 신장 추정 모듈(234)을 구비하는 것으로 도시하였으나, 소프트 생체인식 분석부(230)는 더 정확한 소프트 생체인식 정보를 획득하기 위해 추가적인 모듈을 구비할 수 있음은 자명하다. 그리고 성별 추정 모듈(231), 음성 정보 분석 모듈(232), 나이 추정 모듈(233), 신장 추정 모듈(234)은 모두 소프트 생체인식 정보를 추정하는 소프트 생체인식 정보 추정 모듈이므로 , 소프트 생체인식 정보 추정 모듈부로 통합될 수 있다.In the above description, the soft biometric analysis unit 230 includes a gender estimation module 231, a voice information analysis module 232, an age estimation module 233, and an extension estimation module 234 in order to acquire soft biometric information It is apparent that the soft biometric analysis unit 230 may include additional modules for obtaining more accurate soft biometric information. Since the gender estimation module 231, the voice information analysis module 232, the age estimation module 233 and the extension estimation module 234 are all soft biometric information estimation modules for estimating soft biometric information, Estimation module section.

도5 는 도4의 소프트 생체인식 분석부에 의해 분석된 소프트 생체인식 정보의 적용예를 나탄낸다.FIG. 5 illustrates an example of application of soft biometric information analyzed by the soft biometric analysis unit of FIG.

도5 에 도시된 바와 같이, 소프트 생체인식 분석부는 영상 콘텐츠에 포함된 객체 중 적어도 하나의 사람에 대한 식별자를 ID로 부여하고, 성별 추정 모듈(231), 나이 추정 모듈(233), 신장 추정 모듈(234)에서 추정된 적어도 하나의 사람 각각의 나이, 성별 및 신장 등을 식별자에 매칭한다.5, the soft biometric analysis unit assigns IDs to at least one of the objects included in the image content as IDs, and outputs the IDs to the gender estimation module 231, the age estimation module 233, Sex, height, etc. of each of at least one person estimated in step 234 with an identifier.

소프트 생체인식 분석부(230)에 의해서 생성된 소프트 생체인식 정보는 프레임 단위 또는 분석 구간별로 생성될 수 있으며, 영상 콘텐츠 내 존재하는 사람에 대한 성별, 나이, 신장 등의 정보를 포함할 수 있다.The soft biometric information generated by the soft biometric analysis unit 230 may be generated for each frame or for each analysis interval and may include information such as sex, age, and height for a person present in the image content.

도6 은 본 발명에 따른 아동 음란물 분류부의 일 구현예를 나타낸다.Fig. 6 shows an embodiment of a child pornography classification unit according to the present invention.

아동 음란물 분류부(240)는 프레임 단위 또는 분석 구간별로 생성된 선정도 및 소프트 생체인식 정보를 사용하여 아동 음란물을 분류하기 위한 특징 벡터를 생성하는 특징 결합 모듈(241)과 생성된 특징을 사용하여 아동 음란물 여부를 판단하는 아동 음란물 분류 모듈(242)로 구성된다.The child pornographic classification unit 240 includes a feature combination module 241 for generating a feature vector for classifying child pornography using the degree of selection and soft biometric information generated for each frame or analysis section, And a child pornography classification module 242 for judging whether or not the child is a pornographic child.

도7 은 특징 결합 모듈이 특징 벡터를 생성하는 일 예를 나타낸다.7 shows an example in which a feature combining module generates a feature vector.

도7 은 특징 결합 모듈(241)이 선정도와 소프트 생체인식 정보를 통합하여 단일 특징 벡터로 생성하는 경우를 나타낸다. 아동 음란물을 분류하기 위한 특징은 각각의 선정도 및 소프트 생체인식 정보를 연결하여 수학식 1과 같이 생성될 수 있다.FIG. 7 shows a case where the feature combining module 241 combines the selection and soft biometric information to generate a single feature vector. The feature for classifying child pornography can be generated as shown in Equation 1 by connecting each degree of selection and soft biometric information.

Figure pat00001
Figure pat00001

(여기서 F는 단일 특징 벡터를 나타내고, Ni(여기서 i는 k이하의 자연수 )는 선정도를 나타내며, Bi는 소프트 생체인식 정보를 나타낸다. 그리고 k(여기서 k는 자연수)는 분석 구간 개수 또는 프레임 개수를 나타낸다.)(Where F denotes a single feature vector, N i (where i is a natural number less than or equal to k) denotes the selectivity, B i denotes soft biometric information, and k (where k is a natural number) Indicates the number of frames.)

수학식 1에 기술된 바와 같이 특징 결합 모듈(241)은 영상 추출부(210)에서 분할한 분석 구간 또는 프레임 각각에 대해 선정도 분석부(220)에서 획득한 선정도와 소프트 생체인식 분석부(230)에서 획득한 소프트 생체인식 정보를 수신하여, 아동 음란물을 분류하기 위한 단일 특징 벡터(F)를 생성한다.As described in Equation 1, the feature combining module 241 performs a feature extraction process in which the feature extraction unit 210 extracts the feature extraction result obtained from the feature extraction unit 220 for each analysis region or frame divided by the image extraction unit 210, ), And generates a single feature vector F for classifying child pornography.

선정도(Ni)는 상기한 바와 같이 0 ~ 1 사이의 값을 갖는 실수로 표현될 수 있으며, 소프트 생체인식 정보(Bi)는 분석된 영상 콘텐츠에 존재하는 사람에 대한 성별, 나이, 신장 등의 정보를 기초로 하여, 전체 사람 수[남, 여], 어른의 수[남, 여], 아동의 수[남, 여] 및 최소 연령[남, 여]등으로 가공된 정보를 포함할 수 있다.The selection degree N i may be represented by a real number having a value between 0 and 1 as described above and the soft biometric information Bi may be expressed by the sex, May include information processed by the total number of persons [male and female], the number of adults [male and female], the number of children [male and female] and the minimum age [male and female] have.

도8 은 특징 결합 모듈이 특징 벡터를 생성하는 다른 예를 나타낸다.Fig. 8 shows another example in which the feature combination module generates the feature vector.

도8 은 특징 결합 모듈(241)이 선정도와 소프트 생체인식 정보 각각에 대해 개별적으로 특징 벡터로 생성하는 경우를 나타낸다. 도8 에서 특징 결합 모듈(241)은 분석구간 또는 프레임에서 추출된 선정도만을 이용하여 음란물 여부를 판단하기 위한 하나의 특징 벡터(선정도 특징 벡터)로 생성하고, 선정도가 기설정된 임계값(예를 들면, 0.7) 이상인, 즉 선정도 특징 벡터가 임계값 이상인 이미지에 대한 소프트 생체인식 정보에 대해서만 아동 음란물을 분류하기 위한 특징 벡터를 생성한다. 선정도만을 연결하여 음란물 여부를 판단하기 위한 특징 벡터는 수학식 2와 같이 표현될 수 있다.8 shows a case where the feature combining module 241 generates feature vectors separately for each of the selection and soft biometric information. In FIG. 8, the feature combining module 241 generates one feature vector (selectivity feature vector) for determining whether the obscenity is determined using only the degree of line extracted from the analysis section or the frame, For example, 0.7), i.e., a feature vector for classifying child pornography only for soft biometric information on an image whose feature vector is greater than or equal to a threshold value. A feature vector for determining whether a pornographic object is connected by connecting only the degree of line can be expressed by Equation (2).

Figure pat00002
Figure pat00002

(여기서 Fn은 선정도 특징 벡터를 나타내고, Ni(여기서 i는 k이하의 자연수)는 선정도를 나타내며, k(여기서 k는 자연수)는 분석 구간 개수 또는 프레임 개수를 나타낸다.)(Where F n denotes the feature vector and N i (where i is a natural number less than or equal to k) denotes the selectivity, and k (where k is a natural number) denotes the number of analysis intervals or frames.

그리고 선정도 특징 벡터(Fn)가 임계값 이상인 이미지에 대한 소프트 생체인식정보 특징 벡터는 수학식 3과 같이 표현될 수 있다.Then, the soft biometric information feature vector for the image whose feature vector F n is equal to or greater than the threshold value can be expressed as Equation (3).

Figure pat00003
Figure pat00003

(여기서 Fb는 소프트 생체인식정보 특징 벡터를 나타내고, Aj(여기서 j는 m 이하의 자연수)는 선정도 특징 벡터(Fn)가 임계값 이상을 갖는 영상에서 소프트 생체인식 정보를 바탕으로 생성한 통계적인 값을 의미하며, m(여기서 m은 k 이하의 자연수)은 통계적인 값의 개수를 의미한다. 통계적인 값은 평균 등장 인물의 수[남, 여], 평균 최소 연령[남, 여], 아동의 등장 비율[남,여], 성인의 등장 비율[남,여], 아동과 성인이 동시에 등장하는 비율[남,여] 등이 될 수 있다. (Where F b is a soft biometric information feature vector, and A j (where j is a natural number less than or equal to m) is generated based on soft biometric information in an image having a feature vector F n greater than or equal to a threshold value (M is a natural number less than or equal to k) means the number of statistical values. The statistical value is the average number of characters [male, female], average minimum age [male, female ], The rate of appearance of children [male and female], the rate of appearance of adults [male and female], and the rate at which both children and adults appear at the same time [male and female].

또한 특징 결합 모듈(241)은 선정도 특징 벡터(Fn)와 무관하게 소프트 생체인식정보 특징 벡터(Fb)를 생성할 수도 있다. 특징 결합 모듈(241)이 선정도 특징 벡터(Fn)와 무관하게 분석구간 또는 프레임에서 추출된 소프트 생체인식 정보를 사용하여 생성하는 소프트 생체인식정보 특징 벡터는 수학식 4와 같이 표현될 수 있다.The feature combining module 241 may also generate the soft biometric information feature vector F b regardless of the selectivity feature vector F n . The soft biometric information feature vector generated by the feature combining module 241 using the soft biometric information extracted from the analysis period or frame irrespective of the selectivity feature vector F n may be expressed by Equation 4 .

Figure pat00004
Figure pat00004

(여기서 Fb는 소프트 생체인식정보 특징 벡터를 나타내고, Bi(여기서 i는 k이하의 자연수) 는 소프트 생체인식 정보를 의미하며, k(여기서 k는 자연수)는 분석 구간 개수 또는 프레임 개수를 나타낸다.)(Where F b represents a soft biometric information feature vector, B i (where i is a natural number less than or equal to k) denotes soft biometric information, and k (where k is a natural number) represents the number of analysis intervals or the number of frames .)

소프트 생체인식 정보(Bi)는 분석 영상 내 존재하는 객체에 대한 성별, 나이, 신장 등의 정보를 바탕으로 등장하는 사람의 수[남, 여], 어른의 수[남, 여], 아동의 수[남, 여], 최소 연령[남, 여] 등으로 가공된 정보를 사용한다. The soft biometric information (B i ) is the number of persons [male and female], the number of adults [male and female], and the number of children based on information such as sex, age, Use information processed by [male, female], minimum age [male, female], and so on.

도9 는 본 발명에 따른 아동 음란물 분류 모듈의 구현예를 나타낸다.Fig. 9 shows an embodiment of a child pornography classification module according to the present invention.

도9 에서는 3가지 아동 음란물 분류 모듈(242)의 예를 나타내었으며, (a)는 단일 특징벡터에 대해서 기계학습 방법을 통하여 생성된 아동 음란물 분류 모델을 사용하여 아동 음란물 여부를 판단하는 아동 음란물 분류 모듈(242)을 나타내고, (b)는 아동 음란물 기준 DB에서 특징 벡터와 유사한 영상을 검색한 후, 검색된 영상 중 아동 음란물을 포함하는 영상의 비율을 통하여 아동 음란물 여부를 판단하는 아동 음란물 분류 모듈(242)을 나타내며, (c)는 N개의 특징 분류부 및 N개의 특징 분류부에 각각 대응하는 N개의 특징 분류 모델을 구비한다. 그리고 N개의 특징 분류부가 각 특징 벡터에 대한 특징 분류 모델을 이용하여 N개의 판단 결과를 생성한 후, 각 결과를 통합하여 아동 음란물 여부를 판단하는 아동 음란물 분류 모듈(242)을 나타낸다.9 shows an example of three child pornography classification modules 242. (a) shows a child pornography classification model 242 that uses a child pornography classification model generated through a machine learning method for a single feature vector to determine whether a child is a pornographic child Module 242, (b) a child pornography classification module for searching the child pornography reference DB for an image similar to the feature vector, and then determining whether the user is a pornographic child through a ratio of images including child pornography 242, and (c) includes N feature classification models corresponding to N feature classification sections and N feature classification sections, respectively. And N feature classification units generate N judgment results using the feature classification model for each feature vector, and then integrate the results to determine whether the child is a pornographic child.

도10 은 본 발명의 일 실시예에 따른 아동 음란물 탐지 방법을 나타낸다.FIG. 10 shows a method for detecting pornography of a child according to an embodiment of the present invention.

도1 내지 도9 를 참조하여 도10 의 아동 음란물 탐지 방법을 설명하면, 먼저 영상 추출부(210)가 영상 제공 장치(100)에 저장된 적어도 하나의 영상 콘텐츠를 추출하여 획득한다(S110). 그리고 추출된 영상 콘텐츠를 분석하여 영상 콘텐츠를 샘플링한다(S120). 선정성 분석부(220)는 샘플링 된 영상에 대해 선정도를 분석한다(S130). 한편 소프트 생체인식 정보 분석부(230)가 소프트 생체인식정보를 분석한다(S140). 그리고 샘플링되어 분석된 영상이 영상 콘텐츠 영상 추출부(210)는 샘플링된 영상 콘텐츠가 영상 콘텐츠의 끝인지 판별한다(S150). 샘플링된 영상이 해당 영상 콘텐츠의 끝이면, 아동 음란물 분류부(240)의 특징 결합 모듈(241)이 분석된 선정성 정보와 소프트 생체인식 정보를 이용하여 영상 콘텐츠에 대한 특징 벡터를 생성한다(S160). 여기서 특징 벡터는 상기한 바와 같이 선정도와 소프트 생체인식 정보가 하나의 특징 벡터로 통합된 단일 특징 벡터로 생성될 수도 있으며, 선정도와 소프트 생체인식 정보가 별도로 구분되는 개별 특징 벡터로 생성될 수도 있다. 그리고 아동 음란물 분류부(240)의 아동 음란물 분류 모듈(242)이 생성된 특징 벡터를 이용하여 영상 콘텐츠가 아동 음란물인지 여부를 판별하여 분류한다(S170). 여기서 아동 음란물 분류는 단순히 아동 음란물인지 아닌지로 판별하여 분류할 수도 있으나, 경우에 따라서는 복수개의 등급을 미리 설정하여 등급별로 분류할 수도 있다.Referring to FIGS. 1 to 9, the child pornography detecting method of FIG. 10 will be described. First, the image extracting unit 210 extracts and acquires at least one image content stored in the image providing apparatus 100 (S110). Then, the extracted image content is analyzed and the image content is sampled (S120). The selectivity analyzing unit 220 analyzes the degree of selectivity of the sampled image (S130). Meanwhile, the soft biometrics information analysis unit 230 analyzes the soft biometrics information (S140). Then, the image content image extraction unit 210 determines whether the sampled image content is the end of the image content (S150). If the sampled image is the end of the corresponding image content, the feature combination module 241 of the child pornography classifier 240 generates the feature vector for the image content using the analyzed sensibility information and the soft biometric information (S160) . Here, the feature vector may be generated as a single feature vector in which the selection and soft biometrics information are integrated into one feature vector as described above, and the feature vector may be generated separately from the selection and soft biometrics information. Then, the child pornography class module 242 of the child pornography classifier 240 determines whether the image content is a child pornography item using the generated feature vector (S170). Here, the child pornography classification may be classified by discriminating whether or not the child is a pornographic child, but in some cases, a plurality of classes may be set in advance and classified into classes.

또한 상기에서는 샘플링 된 영상의 선정도를 분석한 이후에 소프트 생체인식 정보를 분석하는 것으로 설명하였으나, 선정성 분석부(220)와 소프트 생체인식 정보 분석부(230)가 각각 선정도 분석과 소프트 생체인식 정보를 동시에 병렬로 분석하도록 구성될 수도 있다. 이렇게 선정도 분석과 소프트 생체인식 정보를 병렬로 동시에 분석하게 되면, 영상 콘텐츠에 대한 분석 시간을 절감할 수 있다.In the above description, the soft biometrics information is analyzed after analyzing the selected degree of the sampled image. However, the sensibility analyzing unit 220 and the soft biometrics information analyzing unit 230 may be configured to analyze the degree of selectivity analysis, May be configured to analyze information simultaneously in parallel. By analyzing the selection analysis and the soft biometric information simultaneously in parallel, the analysis time for the image contents can be reduced.

또한, 상기한 바와 같이, 선정성 분석부(220)가 영상 콘텐츠의 선정도를 분석하여 선정도에 대한 선정도 특징 벡터를 생성하고, 생성된 선정도 특징 벡터로부터 대응하는 영상 콘텐츠가 선정성 영상으로 판별되는 경우에만 소프트 생체인식 정보 분석부(230)가 소프트 생체인식 정보를 분석하여 소프트 생체인식 정보 특징 벡터를 생성하도록 구성할 수도 있다. 이 경우, 선정성이 낮은 영상 콘텐츠에 대해 불필요하게 소프트 생체인식 정보를 분석할 필요가 없으므로, 시스템의 부하와 분석 시간을 줄일 수 있다.In addition, as described above, the selectivity analyzing unit 220 analyzes the degree of selectivity of the image content, generates a feature vector for the selectivity, and discriminates the corresponding image content from the generated selectivity feature vector as a selectivity image The soft biometric information analysis unit 230 may analyze the soft biometric information to generate the soft biometric information feature vector. In this case, since there is no need to analyze the soft biometric information unnecessarily for the image contents with low selectivity, the load on the system and the analysis time can be reduced.

도11 은 본 발명의 다른 실시예에 따른 아동 음란물 탐지 방법을 나타낸다.11 shows a method for detecting child sexual pornography according to another embodiment of the present invention.

도11 의 아동 음란물 탐지 방법 또한 도10 의 아동 음란물 탐지 방법과 마찬가지로 먼저 영상 추출부(210)가 영상 제공 장치(100)에 저장된 적어도 하나의 영상 콘텐츠를 추출하여 획득하고(S210), 추출된 영상 콘텐츠를 분석하여 영상 콘텐츠를 샘플링한다(S220). 그리고 선정성 분석부(220)가 샘플링 된 영상에 대해 선정도를 분석하고(S230), 소프트 생체인식 정보 분석부(230)가 소프트 생체인식정보를 분석한다(S240). 이후 도11 의 아동 음란물 탐지 방법은 도10 과 달리 선정도와 소프트 생체인식 정보가 분석된 영상에 대해 선정도와 소프트 생체인식 정보를 이용하여 아동 음란물인지를 판단한다(S250). 그리고 아동 음란물 판단 정보를 누적하여 저장한다(S260).11, the image extracting unit 210 first extracts and acquires at least one image content stored in the image providing apparatus 100 (S210), and extracts the extracted image content The content is analyzed and the video content is sampled (S220). Then, the sensibility analyzing unit 220 analyzes the sampled image (S230), and the soft biometric information analyzing unit 230 analyzes the soft biometric information (S240). The child pornography detection method of FIG. 11 is different from that of FIG. 10, and it is determined whether the child pornographic material is the child pornographic material by using the selection and soft biometric information for the image in which the selection and soft biometric information are analyzed (S250). The child pornography determination information is accumulated and stored (S260).

누적하여 저장된 아동 음란물 판단 정보를 기초로 해당 영상 콘텐츠의 아동 음란물 여부를 판별한다(S270). 만일 누적된 아동 음란물 판단 정보에 의해 해당 영상 콘텐츠의 아동 음란물인 것으로 판단되면, 아동 음란물로 분류하고 종료한다(S280). 그러나 아동 음란물이 아닌 것으로 판단되면, 샘플링되어 분석된 영상이 영상 콘텐츠의 끝인지 판별한다(S290). 판별 결과 샘플링되어 분석된 영상이 영상 콘텐츠의 끝이면, 아동 음란물로 분류하지 않고 그대로 종료한다. 반면, 샘플링되어 분석된 영상이 영상 콘텐츠의 끝이 아니면, 영상 콘텐츠의 나머지 영상을 샘플링하여 분석을 반복한다(S120).(S270) whether or not the pornographic material of the corresponding image content is a child based on the cumulative stored child pornographic substance judgment information. If it is determined by the accumulated child pornography determination information that the video content is a child pornographic material, the child pornography is classified and terminated (S280). However, if it is determined that the child pornography is not the child pornographic material, it is determined whether the sampled and analyzed image is the end of the image content (S290). As a result of the discrimination, if the sampled and analyzed image is at the end of the image content, it is terminated without classifying it as a child pornography. On the other hand, if the sampled and analyzed image is not the end of the image content, the remaining image of the image content is sampled and the analysis is repeated (S120).

결과적으로 도11 은 영상 콘텐츠의 마지막까지 분석을 수행하지 않고, 샘플링된 영상 각각에 대해 미리 아동 음란물 여부를 판별하여 아동 음란물 판단 정보를 누적하고, 누적된 아동 음란물 판단 정보가 아동 음란물인 것으로 판별되면, 영상 콘텐츠의 나머지 영역에 대해서는 추가로 영상을 분석하지 않고, 아동 음란물로 분류하기 때문에 불필요한 분석을 줄여 시스템의 자원 낭비를 줄일 수 있을 뿐만 아니라, 시간을 절감할 수 있다.As a result, FIG. 11 does not perform the analysis until the end of the image content, and judges whether or not the child sexually explicit object is in advance for each of the sampled images, accumulates the child pornographic substance judgment information, and if the accumulated child sexually- , The remaining regions of the image contents are not analyzed further, but are classified as child pornography. Therefore, unnecessary analysis can be reduced to reduce waste of system resources and save time.

본 발명에 따른 방법은 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다. The method according to the present invention can be implemented as a computer-readable code on a computer-readable recording medium. A computer-readable recording medium includes all kinds of recording apparatuses in which data that can be read by a computer system is stored. Examples of the recording medium include a ROM, a RAM, a CD-ROM, a magnetic tape, a floppy disk, an optical data storage device, and the like, and a carrier wave (for example, transmission via the Internet). The computer-readable recording medium may also be distributed over a networked computer system so that computer readable code can be stored and executed in a distributed manner.

본 발명은 도면에 도시된 실시예를 참고로 설명되었으나 이는 예시적인 것에 불과하며, 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. While the present invention has been particularly shown and described with reference to exemplary embodiments thereof, it is evident that many alternatives, modifications and variations will be apparent to those skilled in the art.

따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 등록청구범위의 기술적 사상에 의해 정해져야 할 것이다.Accordingly, the true scope of the present invention should be determined by the technical idea of the appended claims.

Claims (1)

적어도 하나의 영상 콘텐츠를 저장하고 외부로 제공할 수 있는 영상 제공 장치; 및
상기 영상 제공 장치에 저장된 적어도 하나의 영상 콘텐츠를 추출하여 추출된 상기 영상 콘텐츠의 선정성을 분석하여 선정도를 판별하고, 소프트 생체인식 기법을 이용하여 상기 영상 콘텐츠에 포함된 객체 중 사람 각각에 대한 소프트 생체인식 정보를 분석하여, 상기 영상 콘텐츠가 아동 음란물 콘텐츠인지 판별하는 아동 음란물 판단 장치; 를 포함하는 아동 음란물 탐지 시스템.
An image providing device capable of storing at least one image content and providing the image content to the outside; And
The method comprising: extracting at least one image content stored in the image providing device, analyzing the selectivity of the extracted image content to determine a degree of selectivity, determining softness of each of the objects included in the image content using a soft biometric technique, A child pornography determining device for analyzing the biometric information to determine whether the image content is child pornographic content; A child pornography detection system.
KR20130109691A 2013-09-12 2013-09-12 System for detecting child pornography KR20150030445A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR20130109691A KR20150030445A (en) 2013-09-12 2013-09-12 System for detecting child pornography

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR20130109691A KR20150030445A (en) 2013-09-12 2013-09-12 System for detecting child pornography

Publications (1)

Publication Number Publication Date
KR20150030445A true KR20150030445A (en) 2015-03-20

Family

ID=53024489

Family Applications (1)

Application Number Title Priority Date Filing Date
KR20130109691A KR20150030445A (en) 2013-09-12 2013-09-12 System for detecting child pornography

Country Status (1)

Country Link
KR (1) KR20150030445A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190105181A (en) * 2018-02-23 2019-09-16 주식회사 넥스트키 Video provision system using contents for children, and method for providing contents of children based on the same
KR20210023916A (en) * 2019-08-23 2021-03-04 박현준 Apparatus for measuring a contribution of content and method thereof
WO2021064337A1 (en) * 2019-10-02 2021-04-08 Censorpic Ltd Improvements in and relating to content identification

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190105181A (en) * 2018-02-23 2019-09-16 주식회사 넥스트키 Video provision system using contents for children, and method for providing contents of children based on the same
KR20210023916A (en) * 2019-08-23 2021-03-04 박현준 Apparatus for measuring a contribution of content and method thereof
WO2021064337A1 (en) * 2019-10-02 2021-04-08 Censorpic Ltd Improvements in and relating to content identification

Similar Documents

Publication Publication Date Title
CA3077830C (en) System and method for appearance search
JP7132387B2 (en) Image processing device, image processing method and program
US10755080B2 (en) Information processing apparatus, information processing method, and storage medium
CN109558810B (en) Target person identification method based on part segmentation and fusion
US6661907B2 (en) Face detection in digital images
CN104794464B (en) A kind of biopsy method based on relative priority
JP4866754B2 (en) Action history search device and action history search method
US9996554B2 (en) Search apparatus, search method, and storage medium
Reney et al. An efficient method to face and emotion detection
JP2005149506A (en) Method and apparatus for automatic object recognition/collation
CN103049459A (en) Feature recognition based quick video retrieval method
KR100695136B1 (en) Face detection method and apparatus in image
US8509539B2 (en) Image processing apparatus and image processing method
CN113779308A (en) Short video detection and multi-classification method, device and storage medium
Martinho-Corbishley et al. Soft biometric retrieval to describe and identify surveillance images
KR101455666B1 (en) Authentication apparatus and authentication method thereof
KR100602576B1 (en) Face recognition method, and method for searching and displaying character appearance using the same
KR20150030445A (en) System for detecting child pornography
WO2015102711A2 (en) A method and system of enforcing privacy policies for mobile sensory devices
KR102475752B1 (en) Method and apparatus for prodicting moving path
CN108024148A (en) The multimedia file recognition methods of Behavior-based control feature, processing method and processing device
CN106599765B (en) Method and system for judging living body based on video-audio frequency of object continuous pronunciation
JP4838272B2 (en) VIDEO INDEXING DEVICE, VIDEO INDEXING METHOD, VIDEO INDEXING PROGRAM, AND ITS RECORDING MEDIUM
KR101551190B1 (en) A Detection Method for Human Body Part Representing Harmfulness of Images
Manlises et al. Performance Differences Between Keras Model and Deep Learning CNN in Implementing an Age Classification System

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid