KR102395846B1

KR102395846B1 - 디지털 콘텐츠의 필터링 시스템 및 필터링 제어방법

Info

Publication number: KR102395846B1
Application number: KR1020210160177A
Authority: KR
Inventors: 노정인; 김승완; 김성준
Original assignee: ㈜노웨어소프트
Priority date: 2021-11-19
Filing date: 2021-11-19
Publication date: 2022-05-10

Abstract

본 발명의 일실시예에 따른 디지털 콘텐츠의 필터링 시스템은 다수의 인공지능 신경망을 구비하여 디지털 콘텐츠를 학습하고 필터링을 수행하는 중앙서버; 상기 중앙서버에 연결되고, 상기 디지털 콘텐츠를 저장한 콘텐츠 저장서버; 상기 중앙서버에 연결되고, 상기 디지털 콘텐츠를 필터링하는데 이용되는 다수의 데이터를 저장한 콘텐츠 관리데이터 저장서버; 상기 중앙서버에 연결되어 상기 디지털 콘텐츠의 필터링을 위한 사용자 명령을 입력받는 인터페이스; 및 상기 중앙서버에 연결되고, 상기 중앙서버의 제어에 따라 상기 디지털 콘텐츠를 송수신하는 송수신부;를 포함하고, 상기 중앙서버는 상기 디지털 콘텐츠를 영상 정보와 문자 정보로 분리하되, 상기 디지털 콘텐츠의 소비자에 따라 서로 다른 적합 허용치를 적용하여 상기 문자 정보를 필터링하는 것을 특징으로 한다.

Description

디지털 콘텐츠의 필터링 시스템 및 필터링 제어방법{Filtering system of digital contents and control method therof}

본 발명은 디지털 콘텐츠의 필터링 시스템 및 필터링 제어방법에 관한 것으로, 특히 학습용 디지털 콘텐츠에 대해 언어폭력과 유해한 콘텐츠 내용을 필터링하기 위한 디지털 콘텐츠의 필터링 시스템 및 필터링 제어방법에 관한 것이다.

종래에 통신 환경과 디지털 기기의 발달은 디지털 콘텐츠의 폭발적 수요를 창출하고 있다.

하지만, 영화, 음악 등의 콘텐츠 대다수는 OSP(online service provider)를 통해 불법적으로 공유되고 있으며, 이로 인해 저작권 침해 사례가 크게 증가하고 있다. 특히 유튜브의 도래와 함께 디지털 콘텐츠를 단순히 소비만 했던 사용자는 UCC(user created content)를 통해 능동적인 생산자로 거듭나고 있고, 이 과정에서 종래의 저작물인 영화, 드라마, 음악 등을 편집하여 UCC로 제작하는 등 저작권 침해가 가속되고 있다.

이에 따라, 디지털 콘텐츠의 저작권 보호를 위해 기술적인 보호 조치로서 콘텐츠 필터링 등을 통해 불법 다운로드를 차단하고 있는데, 이러한 콘텐츠 필터링은 콘텐츠의 각종 정보(예를 들면, 파일명, 해쉬값, 특징값 등)를 추출하고, 이를 기반으로 구축된 검색용 데이터베이스를 구축하여 특정 콘텐츠에 대한 저작권 유무를 판별한 후 그 판별 결과에 따라 선택 필터링하는 방식으로 수행된다.

그러나, 이러한 필터링 방법은 디지털 콘텐츠에 포함된 언어 폭력, 유해한 영상 등에 대한 필터링을 수행하지는 못하고 있다.

특히, 코로나 19가 유행하면서 청소년들과 대학생들에게 비대면으로 학습이 이루어지면서 관련 콘텐츠들이 많이 생성되어 공급되지만, 이러한 학습 콘텐츠들에 대해 필터링이 엄격하게 이루어지지 않고 있는 실정이다.

이에 따라 청소년들이 디지털 콘텐츠를 통해 유해 웹사이트, 유해영상, 광고 또는 각종 불건전한 정보를 수신할 수 있고, 이러한 불건전한 정보들에 의해 무분별한 언어와 영상에 그대로 노출되는 문제점이 있다.

특허문헌 : 공개특허공보 제10-2010-0116056호

본 발명은 상기 문제점을 해소하기 위하여 안출된 것으로, 본 발명의 목적은 학습용과 일반 디지털 콘텐츠의 언어폭력과 유해한 콘텐츠 내용을 필터링하기 위한 디지털 콘텐츠의 필터링 시스템을 제공하는 데 있다.

본 발명의 다른 목적은 학습용과 일반 디지털 콘텐츠의 언어폭력과 유해한 콘텐츠 내용을 필터링하기 위한 디지털 콘텐츠의 필터링 제어방법을 제공하는 데 있다.

본 발명의 일실시예에 따른 디지털 콘텐츠의 필터링 시스템에서 상기 인공지능 신경망은 상기 디지털 콘텐츠의 문자정보를 필터링하기 위한 LSTM(Long Short-Term Memory models) 및 상기 디지털 콘텐츠의 영상정보를 필터링하기 위한 CNN 신경망을 포함하는 것을 특징으로 한다.

또는, 본 발명의 다른 실시예에 따른 디지털 콘텐츠의 필터링 제어방법은 (A) 중앙서버가 입력받은 사용자 명령에 따라 디지털 콘텐츠의 필터링을 시동하는 단계; (B) 상기 중앙서버가 상기 디지털 콘텐츠를 영상정보와 문자정보로 분리하는 단계; (C) 상기 중앙서버가 상기 문자정보에 대한 필터링을 수행하는 단계; (D) 상기 중앙서버가 상기 영상정보에 대한 필터링을 수행하는 단계; 및 (E) 상기 중앙서버가 상기 문자정보에 대한 필터링 수행결과 또는 상기 영상정보에 대한 필터링 수행결과에 따라 상기 디지털 콘텐츠의 적합여부를 알리는 단계;를 포함한다.

본 발명의 다른 실시예에 따른 디지털 콘텐츠의 필터링 제어방법에서 상기 문자정보는 상기 디지털 콘텐츠에 첨부된 문서파일, 음성인식기술을 이용하여 상기 영상정보에 대응하는 음성을 문자로 인식한 대화문장 또는 강의 문장, 상기 영상정보에 대해 OCR(optical character recognition) 기법으로 검출된 문자를 포함하는 것을 특징으로 한다.

본 발명의 다른 실시예에 따른 디지털 콘텐츠의 필터링 제어방법에서 상기 (C) 단계는 상기 중앙서버에 구비된 LSTM(Long Short-Term Memory models)을 이용하여 수행되는 것을 특징으로 한다.

본 발명의 다른 실시예에 따른 디지털 콘텐츠의 필터링 제어방법에서 상기 (C) 단계는 (C-1) 상기 문자정보에 대해 문장별로 분리하고, 상기 문장에 대해 각각의 단어로 분리하는 인코딩(encoding)을 수행하는 단계; (C-2) 상기 인코딩으로 분리된 각각의 단어를 벡터형으로 변환하는 임베딩(embedding) 처리를 수행하는 단계; (C-3) 상기 각각의 단어에 대한 벡터를 상기 LSTM에 입력 벡터(x^(t))로 입력하여, 상기 각각의 단어에 대한 가중치로 식별하는 단계; (C-4) 상기 LSTM을 이용하여 상기 각각의 단어가 상기 문장을 구성하는 다른 단어와의 관계가중치를 도출하여 식별하는 단계; 및 (C-5) 상기 관계가중치 각각을 합한 합산치가 설정된 임계치보다 많은지를 판단하는 단계;를 더 포함하는 것을 특징으로 한다.

본 발명의 다른 실시예에 따른 디지털 콘텐츠의 필터링 제어방법에서 상기 (D) 단계는 상기 중앙서버에 구비된 CNN 신경망을 이용하여 수행되는 것을 특징으로 한다.

본 발명의 다른 실시예에 따른 디지털 콘텐츠의 필터링 제어방법에서 상기 (D) 단계는 (D-1) 상기 영상정보에서 특징맵(feature map)을 추출하는 단계; (D-2) 추출한 다수의 상기 특징맵을 합산하고, 컨벌루션 연산을 수행해 상기 특징맵을 재생성하는 단계; (D-3) 상기 재생성된 특징맵을 활성화 함수(Activation function)에 대입하여 연산하는 단계; (D-4) 상기 활성화 함수를 이용하여 출력된 출력값을 이용하여 풀링(pooling) 연산을 실행하는 단계; (D-5) 상기 풀링 연산의 풀링 연산값과 미리 설정한 목표 출력값을 이용하여 손실값을 연산하는 단계; (D-6) 연산된 상기 손실값을 이용해 매개변수에 대한 수정값을 획득하고, 상기 수정값을 이용하여 상기 매개 변수를 업데이트하는 단계; (D-7) 업데이트된 상기 매개 변수를 이용하여, 상기 (D-2) 단계부터 상기 (D-6) 단계까지를 설정된 횟수로 재수행하는 단계; (D-8) 획득한 이진 영상에 대해 침식연산과 팽창연산을 수행하는 단계; 및 (D-9) 상기 이진 영상에서 검출된 객체의 윤곽선 패턴을 콘텐츠 관리 데이터 저장서버에 저장된 윤곽선 비교패턴과 매칭하여 적합패턴인지를 판단하는 단계;를 더 포함하는 것을 특징으로 한다.

본 발명의 특징 및 이점들은 첨부도면에 의거한 다음의 상세한 설명으로 더욱 명백해질 것이다.

이에 앞서, 본 명세서 및 청구범위에 사용된 용어나 단어는 통상적이고, 사전적인 의미로 해석되어서는 아니 되며, 발명자가 그 자신의 발명을 가장 최선의 방법으로 설명하기 위해 용어의 개념을 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합되는 의미와 개념으로 해석되어야만 한다.

본 발명의 일실시예에 따른 디지털 콘텐츠를 필터링하는 시스템은 중앙서버의 내부에 구비된 인공지능 신경망을 이용하여 디지털 콘텐츠를 학습하고 필터링하여, 필터링한 결과에 따라 해당 디지털 콘텐츠에 대한 적합 여부를 판단하여 사용자에게 디스플레이할 수 있는 효과가 있다.

본 발명의 다른 실시예에 따른 디지털 콘텐츠를 필터링하는 제어방법은 디지털 콘텐츠를 구성하는 문자정보와 영상정보를 각각 필터링하여 적합 여부를 판단하여 사용자에게 알림으로써, 미성년자들에게 무분별한 언어와 영상과 같은 불건전한 정보들에 그대로 노출되는 것을 미연에 방지할 수 있는 효과가 있다.

도 1은 본 발명의 일실시예에 따른 디지털 콘텐츠를 필터링하는 시스템의 구성도.
도 2는 본 발명의 다른 실시예에 따른 디지털 콘텐츠를 필터링하는 제어방법을 설명하기 위한 순서도.
도 3은 본 발명의 다른 실시예에 따른 디지털 콘텐츠를 필터링하는 제어방법에 적용되는 LSTM 아키텍처.
도 4는 본 발명의 다른 실시예에 따른 디지털 콘텐츠를 필터링하는 제어방법에서 문장 필터링을 설명하기 위한 예시도.
도 5a와 도 5b는 본 발명의 다른 실시예에 따른 디지털 콘텐츠를 필터링하는 제어방법에서 영상 필터링을 설명하기 위한 예시도들.
도 6은 본 발명의 다른 실시예에 따른 디지털 콘텐츠를 필터링하는 제어방법에 적용되는 CNN 신경망의 구조도.
도 7은 본 발명의 다른 실시예에 따른 디지털 콘텐츠를 필터링하는 제어방법에서 영상 필터링의 컨벌루션 처리 과정을 설명하기 위한 예시도.
도 8은 본 발명의 다른 실시예에 따른 디지털 콘텐츠를 필터링하는 제어방법에서 영상 필터링의 풀링 과정을 설명하기 위한 예시도.

본 발명의 목적, 특정한 장점들 및 신규한 특징들은 첨부된 도면들과 연관되는 이하의 상세한 설명과 바람직한 실시예로부터 더욱 명백해질 것이다. 본 명세서에서 각 도면의 구성요소들에 참조번호를 부가함에 있어서, 동일한 구성 요소들에 한해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 번호를 가지도록 하고 있음에 유의하여야 한다. 또한, 제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 또한, 본 발명을 설명함에 있어서, 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명은 생략한다.

이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예를 상세히 설명하기로 한다. 도 1은 본 발명의 일실시예에 따른 디지털 콘텐츠를 필터링하는 시스템의 구성도이다.

본 발명의 일실시예에 따른 디지털 콘텐츠를 필터링하는 시스템(100)은 도 1에 도시된 바와 같이 중앙서버(110), 콘텐츠 저장서버(120), 콘텐츠 관리데이터 저장서버(130), 인터페이스(140) 및 송수신부(150)를 포함할 수 있다.

중앙서버(110)는 시스템(100)을 구성하는 다른 구성들(120, 130, 140, 150)의 동작을 전반적으로 제어 및 관리하는 구성으로서, 내부에 다수의 인공지능 신경망을 구비하여 콘텐츠 저장서버(120)에 저장된 디지털 콘텐츠 또는 인터페이스(140)를 통해 입력되는 디지털 콘텐츠를 학습하고 필터링을 수행할 수 있다. 이러한 중앙서버(110)는 디지털 콘텐츠를 필터링한 결과를 사용자에게 디스플레이할 수 있다.

여기서, 다수의 인공지능 신경망은 예컨대 디지털 콘텐츠의 문자정보를 필터링하기 위한 LSTM(Long Short-Term Memory models) 및 디지털 콘텐츠의 영상정보를 필터링하기 위한 CNN 신경망을 포함할 수 있다. 물론, LSTM 및 CNN 신경망 이외의 다른 신경망을 포함할 수도 있다.

콘텐츠 저장서버(120)는 중앙서버(110)에 의해 학습 처리된 디지털 콘텐츠, 중앙서버(110)에서 학습 처리될 예정의 디지털 콘텐츠 등을 저장할 수 있고, 특히 중앙서버(110)에 의해 학습 처리된 디지털 콘텐츠는 언어폭력과 유해한 콘텐츠 내용을 필터링하는 과정을 거쳐 적합으로 판명된 디지털 콘텐츠 및 부적합으로 판명된 디지털 콘텐츠를 포함할 수 있다. 이러한 적합 디지털 콘텐츠와 부적합 디지털 콘텐츠는 콘텐츠 관리데이터 저장서버(130)에 설정된 그룹 설정데이터에 따라 그룹화되어 저장될 수 있다.

여기서, 콘텐츠 관리 데이터의 보안 정책에 따른 그룹 설정데이터는 해당 콘텐츠의 보안 중요도 및 적합판정 정도에 따라 제 1 콘텐츠 그룹부터 제 5 콘텐츠 그룹으로 설정될 수 있다. 제 1 콘텐츠 그룹에 포함된 콘텐츠들은 보안 중요도와 적합판정 정도가 가장 높고, 제 5 콘텐츠 그룹에 포함된 콘텐츠들은 보안 중요도와 적합판정 정도가 가장 낮다.

또한, 비교판단 데이터는 디지털 콘텐츠의 부적합 여부를 비교판단하기 위한 데이터, 예컨대 문장 내의 단어별 관계가중치, 문장의 관계가중치의 임계치, 영상의 윤관선에 대한 적합 패턴 등을 포함할 수 있다.

인터페이스(140)는 디지털 콘텐츠를 필터링하는 시스템(100)의 사용자 명령을 입력받는 구성으로, 예를 들어 키보드, 키패드, 터치 스크린일 수 있다. 여기서, 사용자 명령은 사용자에 의해 설정되는 콘텐츠 관리 데이터를 생성하기 위한 명령어, 콘텐츠를 콘텐츠 저장서버(120)에 저장 또는 삭제하기 위한 명령어, 송수신부(150)의 통신 동작을 제어하기 위한 명령어 등을 포함할 수 있다.

송수신부(150)는 중앙서버(110)의 제어에 따라 외부 장치와의 통신을 수행하여 디지털 콘텐츠를 이용자에게 전송하는 구성으로, 인트라넷 및 인터넷에 유,무선 송신 및 수신을 지원하기 위해서 예컨대 모뎀, 증폭기, 필터 및 주파수 변환 장치들을 포함할 수 있다.

이와 같이 구성된 디지털 콘텐츠를 필터링하는 시스템(100)은 중앙서버(110)의 내부에 구비된 인공지능 신경망을 이용하여 디지털 콘텐츠를 학습하고 필터링하여, 필터링한 결과에 따라 해당 디지털 콘텐츠에 대한 적합 여부를 판단하여 사용자에게 디스플레이할 수 있다.

이하, 본 발명의 다른 실시예에 따른 디지털 콘텐츠를 필터링하는 제어방법에 대해 도 2 내지 도 8을 참조하여 설명한다. 도 2는 본 발명의 다른 실시예에 따른 디지털 콘텐츠를 필터링하는 제어방법을 설명하기 위한 순서도이고, 도 3은 본 발명의 다른 실시예에 따른 디지털 콘텐츠를 필터링하는 제어방법에 적용되는 LSTM 아키텍처이며, 도 4는 본 발명의 다른 실시예에 따른 디지털 콘텐츠를 필터링하는 제어방법에서 문장 필터링을 설명하기 위한 예시도이며, 도 5a와 도 5b는 본 발명의 다른 실시예에 따른 디지털 콘텐츠를 필터링하는 제어방법에서 영상 필터링을 설명하기 위한 예시도들이며, 도 6은 본 발명의 다른 실시예에 따른 디지털 콘텐츠를 필터링하는 제어방법에 적용되는 CNN 신경망의 구조도이며, 도 7은 본 발명의 다른 실시예에 따른 디지털 콘텐츠를 필터링하는 제어방법에서 영상 필터링의 컨벌루션 처리 과정을 설명하기 위한 예시도이며, 도 8은 본 발명의 다른 실시예에 따른 디지털 콘텐츠를 필터링하는 제어방법에서 영상 필터링의 풀링 과정을 설명하기 위한 예시도이다.

본 발명의 다른 실시예에 따른 디지털 콘텐츠를 필터링하는 제어방법은 중앙서버(110)가 인터페이스(140)를 통해 입력받은 사용자 명령에 따라 콘텐츠 저장서버(120)에 저장된 디지털 콘텐츠 또는 인터페이스(140)를 통해 입력되는 디지털 콘텐츠를 학습하고 필터링을 시동한다(S210).

필터링을 시동함에 따라, 먼저 중앙서버(110)는 디지털 콘텐츠를 영상정보와 문자정보로 분리한다(S220).

이때, 문자정보는 해당 디지털 콘텐츠에 첨부된 문서파일, 음성인식기술을 이용하여 해당 영상정보에 대응하는 음성을 문자로 인식한 대화 또는 강의 문장, 해당 영상정보에서 OCR(optical character recognition) 기법으로 검출된 문자 등을 포함할 수 있다. 즉, 도 4에 도시된 바와 같이 문자정보는 대화 문장(201)으로 인식되어 분리될 수 있다.

분리된 영상정보와 문자정보에 대해, 중앙서버(110)는 영상정보와 문자정보 각각에 대해 인공지능 신경망을 이용한 필터링을 수행한다.

먼저, 중앙서버(110)는 문자정보에 대한 필터링을 위한 인공지능 신경망으로 LSTM(Long Short-Term Memory models)을 이용할 수 있다. LSTM은 RNN(Recurrent Neural Network) 신경망의 한 종류로서, 유전자, 손글씨, 음성 신호, 문장 등과 같이 배열(sequence) 또는 시계열의 형태를 갖는 데이터에서 패턴을 인식하는 인공 신경망이다. 특히, LSTM은 긴 의존 기간(long-term dependency)을 필요로 하는 데이터를 학습하는데 효과적이다.

이러한 문자정보의 필터링을 위해, 중앙서버(110)는 도 4에 도시된 대화 문장(201)에 대한 전처리(Preprocessing) 과정을 수행한다.

구체적으로, 전처리 과정은 대화 문장(201)을 각 문장별로 분리하고, 이어서 각각의 단어(202,203)로 분리하는 인코딩(encoding)을 수행한다.

중앙서버(110)는 이렇게 인코딩으로 분리된 각각의 단어(202,203)를 아래의 [수학식 1]의 임베딩(Embedding) 함수를 이용하여 벡터형으로 변환하는 임베딩 처리를 수행한다.

여기서, a는 입력 단어의 총개수이고, b는 벡터의 크기이며, c는 입력 단어 각각의 적합 허용치이다.

이때, 입력 단어의 적합 허용치(c)는 콘텐츠 관리데이터 저장서버(130)에 등급별로 저장된 빅데이터를 참조하여 부여되고, 특히 아래의 [표 1]과 같이 계층별, 성별, 지역별로 분류된 혐오단어를 5등급으로 분류하여 적합 허용치(c)가 "마이너스 값"으로 부여될 수 있다.

5등급 분류	예시
청소년 혐오단어	고삐리, 급식충, 애새끼, 잼민이
남성 혐오단어	한남충, 개새끼
여성 혐오단어	된장녀, 창녀, 김치녀
노인 혐오단어	틀딱, 꼰대, 노망
지역 혐오단어	전라디언, 홍어, 대구통구이
장애인 혐오단어	병신, 머저리, 애자, 등신

물론, 5등급 분류 단어는 [표 1]의 단어 이외에 외국인 혐오단어, 직업 혐오단어, 차별단어, 각종 비속어 등의 부적합 단어들을 포함하며, 이러한 5등급 분류 단어는 적합 허용치(c)가 "마이너스 값"으로 부여될 수 있다. 이러한 5등급으로 분류되는 단어들은 콘텐츠 관리데이터 저장서버(130)에 실시간 또는 일정 시간에 빅데이터로 업데이트되어 추가될 수 있다.

이렇게 변환된 각 단어(202,203)의 벡터는 LSTM에 입력 벡터(x^(t))로서 입력되어 학습되어, 각 단어별 가중치로 식별된다(S230).

이러한 LSTM은 도 3에 도시된 구성을 가져, 입력 게이트(Input gate), 망각 게이트(Forget gate), 출력 게이트(Output gate)의 세 개의 게이트로 이루어진다.

입력 게이트는 새로운 입력을 추가하기 위해 필요한 게이트이고, 망각 게이트는 불필요한 정보를 지우기 위해 필요한 게이트이며, 출력 게이트는 현재 시간 단계에서 출력에 영향을 주는지를 결정하기 위해 필요한 게이트이다.

이러한 게이트들은 아래의 [수학식 2]로 표현된다.

여기서, f^(t)는 망각 게이트이고, i^(t)는 입력 게이트이며, o^(t)는 출력 게이트이며, c^(t)와 c^(t-1)은 셀 상태 벡터이며, w_f, w_i, w_o, w_c 는 히든 레이어(hidden laer)와 출력 레이어의 가중치를 각각 나타내며, b_f, b_i, b_o, b_c 는 바이어스(bias) 벡터이며, x^(t)는 각 단어(202,203)의 입력 벡터이며, f_g(), f_c(), f_h()는 활성화 함수를 각각 나타내며, h^(t)와 h^(t-1)은 시간 t와 t-1에서 히든 레이어(hidden layer) 뉴런(neuron)의 출력을 각각 나타내며, u_f, u_i, u_o, u_c 는 히든 레이어 뉴런을 반복(recurrent) 레이어에 연결하고 출력되는 가중치를 각각 나타낸다.

각 단어별 가중치를 도출하여 식별하는 과정에서 중앙서버(110)는 각 단어(202,203)가 문장 내에서 주어 또는 목적어에 해당하는지를 판단하여 각 단어별 가중치를 추가 부여할 수도 있다. 특히, 단어별 가중치는 입력되는 각 단어(202,203)가 상술한 [표 1]과 같은 5등급 분류 단어에 해당하는 경우에 마이너스 값으로 도출될 수도 있다.

이러한 LSTM을 이용한 반복 학습으로 각 단어별 가중치를 식별한 후, 중앙서버(110)는 LSTM을 이용하여 각 단어(202,203)가 문장을 구성하는 다른 단어와의 관계가중치(u10,u16,u20,u26)를 도출하여 식별한다(S232).

이러한 관계가중치(u10,u16,u20,u26)는 문장을 구성하는 다른 단어와 연관관계가 예를 들어 긍정 또는 부정인지에 따라, 문장부호에 따라 또는 문장 접속사에 따라 도출될 수 있고, 콘텐츠 관리 데이터 저장서버(130)에 빅데이터로 저장된 관계가중치 설정기준데이터를 참조하여 도출될 수도 있다.

이렇게 각 문장별로 관계가중치(u10,u16,u20,u26)를 도출한 후, 중앙서버(110)는 각 문장별로 도출된 관계가중치(u10,u16,u20,u26)를 각 문장별로 합산한 합산치가 설정된 임계치 이상인지를 판단한다(S234).

여기서, 임계치는 콘텐츠 관리 데이터 저장서버(130)에 저장된 데이터로서, 문장을 구성하는 단어의 개수에 따라 콘텐츠 이용자의 연령 등을 감안하여 설정된 수치일 수 있다. 즉, 콘텐츠 이용자의 연령이 청소년에 해당한다면 임계치는 0으로 설정될 수 있고, 콘텐츠 이용자의 연령이 성인 장년층에 해당한다면 임계치는 임의의 값으로 설정될 수 있다.

각 문장별로 합산한 합산치가 설정된 임계치 이상이 아니면, 중앙서버(110)는 해당 문장이 부적합한 문장으로 판단하고, 부적합 콘텐츠의 판단결과로 사용자에게 음성 또는 문자로 출력하여 알린다(S250).

예를 들어 청소년의 학습을 위한 콘텐츠인 경우, 합산치가 0 으로 설정된 임계치보다 작은 마이너스의 값으로 도출된다면, 중앙서버(110)는 해당 문장의 진의가 의심스런 부적합한 문장으로 판단하고, 부적합 콘텐츠의 판단결과로 사용자에게 음성 또는 문자로 출력할 수 있다.

반면에, 각 문장별로 합산한 합산치가 설정된 임계치 이상이면, 중앙서버(110)는 해당 문장이 적합한 문장으로 판단하고, 적합 콘텐츠의 판단결과로 사용자에게 음성 또는 문자로 출력하여 알린다(S260).

이와 같이 문자정보의 필터링을 수행함과 별개로, 중앙서버(110)는 디지털 콘텐츠의 영상정보에 대한 필터링을 수행한다.

영상정보에 대한 필터링을 위해, 먼저 중앙서버(110)는 영상정보에서 특징맵(feature map)을 추출한다(S240).

구체적으로, 특징맵의 추출과정은 도 6에 도시된 CNN 신경망과 같은 심층 신경망을 이용할 수 있고, 심층 신경망의 입력 레이어(input layer)에 도 5a의 영상 이미지의 픽셀정보가 입력되고, 제 1 히든 레이어(hidden layer 1)를 거치면서 도 7에 도시된 바와 같이 필터를 이용해 컨벌루션(convolution) 연산을 실행하는 과정을 포함할 수 있다.

이때, 필터를 이용해 컨벌루션 연산은 아래의 [수학식 3]을 이용하여 실행할 수 있다.

여기에서, l은 레이어(layer)를 의미하고, size^l은 레이어의 사이즈를 의미하며, In은 입력 레이어에 입력되는 데이터(data)의 수를 의미하고, Ia는 라벨(label)의 수를 의미하며, O는 출력 컨볼루션층(Output Convolution Layer)을 의미하고, w는 가중치를 의미하며, b는 특징맵의 편향 바이어스(bias)를 의미한다.

이러한 컨벌루션 연산을 통해 처리된 특징맵은 도 5b에 도시된 바와 같이 이진수 값을 갖는 흑백 이미지 형태를 갖는다.

특징맵을 추출한 후, 중앙서버(110)는 추출한 다수의 특징맵을 합산하고, 합산한 특징맵에 대하여 컨벌루션 연산을 수행해 특징맵을 재생성한다(S241).

이때, 특징맵을 재생성하는 과정은 아래의 [수학식 4]를 이용하여 합산한 특징맵을 컨캐터네이팅(Concatenating)하고, [수학식 5]를 이용한 컨벌루션 연산을 수행하여 실행될 수 있다.

여기서, In은 입력되는 데이터(data)의 수를 의미하고, Ia는 라벨(label)의 수를 의미하며, O는 출력 컨볼루션층(Output Convolution Layer)을 의미하며, w는 가중치를 의미한다.

이때, f_c는 컨캐터네이팅한 특징맵을 이용하여 컨벌루션 연산을 수행한 결과값을 나타낸 것으로, 재생성된 특징맵을 의미할 수 있다.

특징맵을 재생성한 후, 중앙서버(110)는 재생성된 특징맵을 활성화 함수(Activation function)에 대입하여 연산할 수 있다(S242).

여기서, 활성화 함수는 Sigmoid 함수 또는 ReLu 함수를 이용할 수 있다.

활성화 함수를 이용하여 출력된 출력값에 대해, 중앙서버(110)는 획득한 출력값을 이용하여 풀링(pooling) 연산을 실행한다(S243).

구체적으로, 풀링 연산은 데이터의 차원의 크기를 축소하기 위한 것으로, 데이터에서 세로 및 가로 방향 공간의 크기를 줄이는 연산이다. 이러한 풀링 연산은 다양한 파라미터, 예를 들어 평균, 중간값, 최댓값, 최소값 등을 이용할 수 있고, 여기서는 도 8에 도시된 바와 같이 최댓값을 이용한 최댓값 풀링 연산을 적용한다. 최댓값 풀링 연산(max polling)을 이용하여 이미지의 제한 영역에서 최댓값을 추출하고, 데이터의 노이즈를 제거할 수 있으며, 데이터가 줄어드는 과정에서 오버 피팅(over fitting)을 방지할 수 있다.

이러한 최댓값 풀링 연산은 아래의 [수학식 6]을 이용하여 실행될 수 있다.

여기서, x는 풀링 연산을 위해 입력되는 행렬을 의미하고, l은 풀링 연산의 해당층을 의미하며, i는 입력되는 행렬의 행을 의미하며, j는 입력되는 행렬의 열을 의미하며, size^l은 풀링 연산의 해당층 사이즈를 의미하며, Im은 풀링 연산의 해당층에 입력되는 데이터(data)의 수를 의미하고, Ia는 라벨(label)의 수를 의미한다.

풀링 연산을 실행한 후, 중앙서버(110)는 풀링 연산값과 미리 설정한 목표 출력값을 이용하여 손실값을 연산한다(S244).

구체적으로, 손실값 연산은 아래의 [수학식 7]의 MSLE, [수학식 8]의 RMSLE 또는 [수학식 9]의 sMAPE를 이용하여 연산할 수 있고, 미리 설정한 목표 출력값은 GT(Ground Truth)일 수 있다.

이때, GT는 예컨대 도 5a의 원본 이미지 데이터를 제 1 히든 레이어에서 컨벌루션 연산을 수행한 컨벌루션 연산값을 기초로 최댓값 풀링 연산(Max Pooling)을 수행한 값일 수도 있다.

여기서,

는 풀링 연산 단계(S243)의 풀링 연산값을 의미하고,

는 미리 설정한 목표 출력값을 의미한다.

손실값을 연산한 후, 중앙서버(110)는 연산된 손실값을 이용해 매개변수에 대한 수정값을 획득한다(S245).

이때, 매개변수는 w인 가중치를 의미할 수 있고, 중앙서버(110)는 획득한 매개 변수에 대한 수정값을 이용하여 매개 변수를 업데이트할 수 있다.

이렇게 업데이트된 매개 변수를 이용하여, 중앙서버(110)는 상술한 특징맵을 재생성하는 단계(S241)부터 매개변수의 수정값을 획득하는 단계(S245)까지를 설정된 횟수로 재수행할 수 있다(S246).

이러한 재수행 과정이 1번 완료되면 epoch 1번 학습 완료한 것이고, 재수행 과정이 50번 반복적으로 수행되면 epoch 50으로 학습 완료한 것이다.

이러한 설정 횟수의 재수행 과정에 따라, 중앙서버(110)는 보다 명확한 흑백의 이진 영상을 획득하고, 이러한 이진 영상에서 노이즈를 제거하고 복원하기 위한 침식연산과 팽창연산을 수행한다(S247).

구체적으로, 침식연산은 노이즈를 제거하기 위해 형태학적 기반의 연산으로 아래의 [수학식 10]에 따라 수행한다. 여기서, A와 B는

내의 집합이고, B에 의한 A의 침식은

로 표기한다. 즉, B에 의한 A의 침식은 Z에 의해 천이된 B가 A 내에 포함되는 모든 점 Z의 집합이다.

이러한 침식연산이 수행되면, 배경이 넓어지고 객체는 작아지면서 이진 영상의 노이즈가 제거될 수 있다.

이어서, 침식연산 수행에 의해 작아진 이진 영상의 객체을 원래의 크기로 되돌리기 위하여, 형태학적 기반의 팽창연산을 아래의 [수학식 11]에 따라 수행한다. 여기서, A와 B는 Z² 내의 집합이고, B에 의한 A의 팽창은

로 표기한다. 즉, B에 의한 A의 팽창은 B와 A가 적어도 한 개 요소에 의해 겹쳐지도록 모두 Z만큼 전치된 집합이다.

이때, 침식연산에 의해 객체부분의 침식이 많이 발생하였기 때문에, 팽창연산은 예컨대 2번 수행할 수 있다. 이러한 팽창연산의 수행 결과, 객체 부분이 커지고 배경부분이 작아진 영상을 획득할 수 있다.

이러한 팽창연산이 수행된 후, 중앙서버(110)는 팽창연산이 수행된 이진영상에 대해 영상 내에 포함된 객체의 윤곽선을 검출한다.

이렇게 객체의 윤곽선을 검출한 후, 중앙서버(110)는 검출된 객체의 윤곽선 패턴이 콘텐츠 관리 데이터 저장서버(130)에 저장된 윤곽선 비교패턴과 매칭하여 적합패턴인지를 판단한다(S248).

여기서, 윤곽선 비교패턴은 예컨대 남,녀의 성기 윤곽선 패턴, 남,녀의 신체부위의 윤곽선 패턴, 무기들의 윤곽선 패턴, 담배 윤곽선 패턴 등을 포함할 수 있다.

이러한 윤곽선 비교패턴과 검출된 객체의 윤곽선 패턴을 서로 매칭하여 매칭률이 예컨대 50% 이상으로 도출되면, 중앙서버(110)는 해당 영상을 부적합한 영상으로 판단하고, 부적합 콘텐츠의 판단결과로 사용자에게 음성 또는 문자로 출력하여 알린다(S250).

반면에, 윤곽선 비교패턴과 검출된 객체의 윤곽선 패턴을 서로 매칭하여 매칭률이 예컨대 50% 미만으로 도출되면, 중앙서버(110)는 해당 영상을 적합한 영상으로 판단하고, 적합 콘텐츠의 판단결과로 사용자에게 음성 또는 문자로 출력하여 알린다(S260).

이와 같은 과정의 디지털 콘텐츠를 필터링하는 제어방법은 디지털 콘텐츠를 구성하는 문자정보와 영상정보를 각각 필터링하여 적합 여부를 판단하여 사용자에게 알림으로써, 미성년자들에게 무분별한 언어와 영상과 같은 불건전한 정보들에 그대로 노출되는 것을 미연에 방지할 수 있다.

본 발명의 기술사상은 상기 바람직한 실시예에 따라 구체적으로 기술되었으나, 전술한 실시예들은 그 설명을 위한 것이며, 그 제한을 위한 것이 아님을 주의하여야 한다.

또한, 본 발명의 기술분야의 통상의 전문가라면 본 발명의 기술사상의 범위 내에서 다양한 실시가 가능함을 이해할 수 있을 것이다.

100: 필터링 시스템 110: 중앙서버
120: 콘텐츠 저장서버
130: 콘텐츠 관리 데이터 저장서버 140: 인터페이스
150: 송수신부

Claims

다수의 인공지능 신경망을 구비하여 디지털 콘텐츠를 학습하고 필터링을 수행하는 중앙서버;
상기 중앙서버에 연결되고, 상기 디지털 콘텐츠를 저장한 콘텐츠 저장서버;
상기 중앙서버에 연결되고, 상기 디지털 콘텐츠를 필터링하는데 이용되는 다수의 데이터를 저장한 콘텐츠 관리데이터 저장서버;
상기 중앙서버에 연결되어 상기 디지털 콘텐츠의 필터링을 위한 사용자 명령을 입력받는 인터페이스; 및
상기 중앙서버에 연결되고, 상기 중앙서버의 제어에 따라 상기 디지털 콘텐츠를 송수신하는 송수신부;
를 포함하고,
상기 중앙서버는 상기 디지털 콘텐츠를 영상 정보와 문자정보로 분리하되, 상기 디지털 콘텐츠의 소비자에 따라 서로 다른 적합 허용치를 적용하여 상기 문자정보를 필터링하며,
상기 콘텐츠 관리데이터 저장서버는,
보안 정책에 따른 그룹 설정데이터 및 상기 디지털 콘텐츠의 부적합 여부를 비교판단하는데 이용되는 비교판단 데이터를 저장하며,
상기 보안 정책에 따른 그룹 설정데이터는 해당 콘텐츠의 보안 중요도 및 적합판정 정도에 따라 복수의 콘텐츠 그룹으로 설정되며,
복수의 콘텐츠 그룹은 보안중요도가 높으면서 적합판정 정도가 높은 그룹부터 보안중요도가 낮으면서 적합판정 정도가 낮은 그룹으로 구분되며,
상기 문자정보의 적합 허용치는 상기 콘텐츠 관리데이터 저장서버에 등급별로 저장된 빅데이터를 참조하여 부여되고,
계층별, 성별 및 지역별로 분류된 혐오단어를 포함하면 가장 높은 등급으로 분류하여 적합 허용치가 마이너스 값으로 부여될 수 있는 것을 특징으로 하는 디지털 콘텐츠의 필터링 시스템.
제 1 항에 있어서,
상기 인공지능 신경망은 상기 디지털 콘텐츠의 문자정보를 필터링하기 위한 LSTM(Long Short-Term Memory models) 및 상기 디지털 콘텐츠의 영상정보를 필터링하기 위한 CNN 신경망을 포함하는 것을 특징으로 하는 디지털 콘텐츠의 필터링 시스템.
삭제
디지털 콘텐츠의 필터링 시스템을 이용한 디지털 콘텐츠의 필터링 제어방법에 있어서,
(A) 중앙서버가 입력받은 사용자 명령에 따라 디지털 콘텐츠의 필터링을 시동하는 단계;
(B) 상기 중앙서버가 상기 디지털 콘텐츠를 영상정보와 문자정보로 분리하는 단계;
(C) 상기 중앙서버가 상기 문자정보에 대한 필터링을 수행하는 단계;
(D) 상기 중앙서버가 상기 영상정보에 대한 필터링을 수행하는 단계; 및
(E) 상기 중앙서버가 상기 문자정보에 대한 필터링 수행결과 또는 상기 영상정보에 대한 필터링 수행결과에 따라 상기 디지털 콘텐츠의 적합여부를 알리는 단계;
를 포함하고,
상기 디지털 콘텐츠의 필터링 시스템은,
상기 디지털 콘텐츠의 저작권자 데이터, 상기 디지털 콘텐츠의 사용자 데이터, 보안 정책에 따른 그룹 설정데이터 및 상기 디지털 콘텐츠의 부적합 여부를 비교하여 판단하는 비교판단 데이터가 저장되는 콘텐츠 관리데이터 저장서버를 포함하고,
상기 보안 정책에 따른 그룹 설정데이터는 해당 콘텐츠의 보안 중요도 및 적합판정 정도에 따라 복수의 콘텐츠 그룹으로 설정되며,
복수의 콘텐츠 그룹은 보안중요도가 높으면서 적합판정 정도가 높은 그룹부터 보안중요도가 낮으면서 적합판정 정도가 낮은 그룹으로 구분되며,
상기 문자정보의 적합 허용치는 상기 콘텐츠 관리데이터 저장서버에 등급별로 저장된 빅데이터를 참조하여 부여되고,
계층별, 성별 및 지역별로 분류된 혐오단어를 포함하면 가장 높은 등급으로 분류하여 적합 허용치가 마이너스 값으로 부여될 수 있는 것을 특징으로 하는 디지털 콘텐츠의 필터링 제어방법.
제 4 항에 있어서,
상기 문자정보는 상기 디지털 콘텐츠에 첨부된 문서파일, 음성인식기술을 이용하여 상기 영상정보에 대응하는 음성을 문자로 인식한 대화문장 또는 강의 문장, 상기 영상정보에 대해 OCR(optical character recognition) 기법으로 검출된 문자를 포함하는 것을 특징으로 하는 디지털 콘텐츠의 필터링 제어방법.
제 4 항에 있어서,
상기 (C) 단계는 상기 중앙서버에 구비된 LSTM(Long Short-Term Memory models)을 이용하여 수행되는 것을 특징으로 하는 디지털 콘텐츠의 필터링 제어방법.
제 6 항에 있어서,
상기 (C) 단계는
(C-1) 상기 문자정보에 대해 문장별로 분리하고, 상기 문장에 대해 각각의 단어로 분리하는 인코딩(encoding)을 수행하는 단계;
(C-2) 상기 인코딩으로 분리된 각각의 단어를 벡터형으로 변환하는 임베딩(embedding) 처리를 수행하는 단계;
(C-3) 상기 각각의 단어에 대한 벡터를 상기 LSTM에 입력 벡터(x^(t))로 입력하여, 상기 각각의 단어에 대한 가중치로 식별하는 단계;
(C-4) 상기 LSTM을 이용하여 상기 각각의 단어가 상기 문장을 구성하는 다른 단어와의 관계가중치를 도출하여 식별하는 단계; 및
(C-5) 상기 관계가중치 각각을 합한 합산치가 설정된 임계치보다 많은지를 판단하는 단계;
를 더 포함하는 것을 특징으로 하는 디지털 콘텐츠의 필터링 제어방법.
제 4 항에 있어서,
상기 (D) 단계는 상기 중앙서버에 구비된 CNN 신경망을 이용하여 수행되는 것을 특징으로 하는 디지털 콘텐츠의 필터링 제어방법.
제 4 항에 있어서,
상기 (D) 단계는
(D-1) 상기 영상정보에서 특징맵(feature map)을 추출하는 단계;
(D-2) 추출한 다수의 상기 특징맵을 합산하고, 컨벌루션 연산을 수행해 상기 특징맵을 재생성하는 단계;
(D-3) 상기 재생성된 특징맵을 활성화 함수(Activation function)에 대입하여 연산하는 단계;
(D-4) 상기 활성화 함수를 이용하여 출력된 출력값을 이용하여 풀링(pooling) 연산을 실행하는 단계;
(D-5) 상기 풀링 연산의 풀링 연산값과 미리 설정한 목표 출력값을 이용하여 손실값을 연산하는 단계;
(D-6) 연산된 상기 손실값을 이용해 매개변수에 대한 수정값을 획득하고, 상기 수정값을 이용하여 상기 매개 변수를 업데이트하는 단계;
(D-7) 업데이트된 상기 매개 변수를 이용하여, 상기 (D-2) 단계부터 상기 (D-6) 단계까지를 설정된 횟수로 재수행하는 단계;
(D-8) 획득한 이진 영상에 대해 침식연산과 팽창연산을 수행하는 단계; 및
(D-9) 상기 이진 영상에서 검출된 객체의 윤곽선 패턴을 콘텐츠 관리 데이터 저장서버에 저장된 윤곽선 비교패턴과 매칭하여 적합패턴인지를 판단하는 단계;
를 더 포함하는 것을 특징으로 하는 디지털 콘텐츠의 필터링 제어방법.
삭제