KR102395846B1 - 디지털 콘텐츠의 필터링 시스템 및 필터링 제어방법 - Google Patents

디지털 콘텐츠의 필터링 시스템 및 필터링 제어방법 Download PDF

Info

Publication number
KR102395846B1
KR102395846B1 KR1020210160177A KR20210160177A KR102395846B1 KR 102395846 B1 KR102395846 B1 KR 102395846B1 KR 1020210160177 A KR1020210160177 A KR 1020210160177A KR 20210160177 A KR20210160177 A KR 20210160177A KR 102395846 B1 KR102395846 B1 KR 102395846B1
Authority
KR
South Korea
Prior art keywords
digital content
filtering
central server
content
value
Prior art date
Application number
KR1020210160177A
Other languages
English (en)
Inventor
노정인
김승완
김성준
Original Assignee
㈜노웨어소프트
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ㈜노웨어소프트 filed Critical ㈜노웨어소프트
Priority to KR1020210160177A priority Critical patent/KR102395846B1/ko
Application granted granted Critical
Publication of KR102395846B1 publication Critical patent/KR102395846B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/454Content or additional data filtering, e.g. blocking advertisements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/904Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/20Image enhancement or restoration by the use of local operators
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/431Generation of visual interfaces for content selection or interaction; Content or additional data rendering
    • H04N21/4318Generation of visual interfaces for content selection or interaction; Content or additional data rendering by altering the content in the rendering process, e.g. blanking, blurring or masking an image region
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • H04N21/4348Demultiplexing of additional data and video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4662Learning process for intelligent management, e.g. learning user preferences for recommending movies characterized by learning algorithms
    • H04N21/4666Learning process for intelligent management, e.g. learning user preferences for recommending movies characterized by learning algorithms using neural networks, e.g. processing the feedback provided by the user

Abstract

본 발명의 일실시예에 따른 디지털 콘텐츠의 필터링 시스템은 다수의 인공지능 신경망을 구비하여 디지털 콘텐츠를 학습하고 필터링을 수행하는 중앙서버; 상기 중앙서버에 연결되고, 상기 디지털 콘텐츠를 저장한 콘텐츠 저장서버; 상기 중앙서버에 연결되고, 상기 디지털 콘텐츠를 필터링하는데 이용되는 다수의 데이터를 저장한 콘텐츠 관리데이터 저장서버; 상기 중앙서버에 연결되어 상기 디지털 콘텐츠의 필터링을 위한 사용자 명령을 입력받는 인터페이스; 및 상기 중앙서버에 연결되고, 상기 중앙서버의 제어에 따라 상기 디지털 콘텐츠를 송수신하는 송수신부;를 포함하고, 상기 중앙서버는 상기 디지털 콘텐츠를 영상 정보와 문자 정보로 분리하되, 상기 디지털 콘텐츠의 소비자에 따라 서로 다른 적합 허용치를 적용하여 상기 문자 정보를 필터링하는 것을 특징으로 한다.

Description

디지털 콘텐츠의 필터링 시스템 및 필터링 제어방법{Filtering system of digital contents and control method therof}
본 발명은 디지털 콘텐츠의 필터링 시스템 및 필터링 제어방법에 관한 것으로, 특히 학습용 디지털 콘텐츠에 대해 언어폭력과 유해한 콘텐츠 내용을 필터링하기 위한 디지털 콘텐츠의 필터링 시스템 및 필터링 제어방법에 관한 것이다.
종래에 통신 환경과 디지털 기기의 발달은 디지털 콘텐츠의 폭발적 수요를 창출하고 있다.
하지만, 영화, 음악 등의 콘텐츠 대다수는 OSP(online service provider)를 통해 불법적으로 공유되고 있으며, 이로 인해 저작권 침해 사례가 크게 증가하고 있다. 특히 유튜브의 도래와 함께 디지털 콘텐츠를 단순히 소비만 했던 사용자는 UCC(user created content)를 통해 능동적인 생산자로 거듭나고 있고, 이 과정에서 종래의 저작물인 영화, 드라마, 음악 등을 편집하여 UCC로 제작하는 등 저작권 침해가 가속되고 있다.
이에 따라, 디지털 콘텐츠의 저작권 보호를 위해 기술적인 보호 조치로서 콘텐츠 필터링 등을 통해 불법 다운로드를 차단하고 있는데, 이러한 콘텐츠 필터링은 콘텐츠의 각종 정보(예를 들면, 파일명, 해쉬값, 특징값 등)를 추출하고, 이를 기반으로 구축된 검색용 데이터베이스를 구축하여 특정 콘텐츠에 대한 저작권 유무를 판별한 후 그 판별 결과에 따라 선택 필터링하는 방식으로 수행된다.
그러나, 이러한 필터링 방법은 디지털 콘텐츠에 포함된 언어 폭력, 유해한 영상 등에 대한 필터링을 수행하지는 못하고 있다.
특히, 코로나 19가 유행하면서 청소년들과 대학생들에게 비대면으로 학습이 이루어지면서 관련 콘텐츠들이 많이 생성되어 공급되지만, 이러한 학습 콘텐츠들에 대해 필터링이 엄격하게 이루어지지 않고 있는 실정이다.
이에 따라 청소년들이 디지털 콘텐츠를 통해 유해 웹사이트, 유해영상, 광고 또는 각종 불건전한 정보를 수신할 수 있고, 이러한 불건전한 정보들에 의해 무분별한 언어와 영상에 그대로 노출되는 문제점이 있다.
특허문헌 : 공개특허공보 제10-2010-0116056호
본 발명은 상기 문제점을 해소하기 위하여 안출된 것으로, 본 발명의 목적은 학습용과 일반 디지털 콘텐츠의 언어폭력과 유해한 콘텐츠 내용을 필터링하기 위한 디지털 콘텐츠의 필터링 시스템을 제공하는 데 있다.
본 발명의 다른 목적은 학습용과 일반 디지털 콘텐츠의 언어폭력과 유해한 콘텐츠 내용을 필터링하기 위한 디지털 콘텐츠의 필터링 제어방법을 제공하는 데 있다.
본 발명의 일실시예에 따른 디지털 콘텐츠의 필터링 시스템은 다수의 인공지능 신경망을 구비하여 디지털 콘텐츠를 학습하고 필터링을 수행하는 중앙서버; 상기 중앙서버에 연결되고, 상기 디지털 콘텐츠를 저장한 콘텐츠 저장서버; 상기 중앙서버에 연결되고, 상기 디지털 콘텐츠를 필터링하는데 이용되는 다수의 데이터를 저장한 콘텐츠 관리데이터 저장서버; 상기 중앙서버에 연결되어 상기 디지털 콘텐츠의 필터링을 위한 사용자 명령을 입력받는 인터페이스; 및 상기 중앙서버에 연결되고, 상기 중앙서버의 제어에 따라 상기 디지털 콘텐츠를 송수신하는 송수신부;를 포함하고, 상기 중앙서버는 상기 디지털 콘텐츠를 영상 정보와 문자 정보로 분리하되, 상기 디지털 콘텐츠의 소비자에 따라 서로 다른 적합 허용치를 적용하여 상기 문자 정보를 필터링하는 것을 특징으로 한다.
본 발명의 일실시예에 따른 디지털 콘텐츠의 필터링 시스템에서 상기 인공지능 신경망은 상기 디지털 콘텐츠의 문자정보를 필터링하기 위한 LSTM(Long Short-Term Memory models) 및 상기 디지털 콘텐츠의 영상정보를 필터링하기 위한 CNN 신경망을 포함하는 것을 특징으로 한다.
본 발명의 일실시예에 따른 디지털 콘텐츠의 필터링 시스템에서 상기 콘텐츠 관리데이터 저장서버는 상기 디지털 콘텐츠의 저작권자 데이터, 상기 디지털 콘텐츠의 사용자 데이터, 보안 정책에 따른 그룹 설정데이터 및 상기 디지털 콘텐츠의 부적합 여부를 비교판단하는데 이용되는 비교판단 데이터를 저장하는 것을 특징으로 한다.
또는, 본 발명의 다른 실시예에 따른 디지털 콘텐츠의 필터링 제어방법은 (A) 중앙서버가 입력받은 사용자 명령에 따라 디지털 콘텐츠의 필터링을 시동하는 단계; (B) 상기 중앙서버가 상기 디지털 콘텐츠를 영상정보와 문자정보로 분리하는 단계; (C) 상기 중앙서버가 상기 문자정보에 대한 필터링을 수행하는 단계; (D) 상기 중앙서버가 상기 영상정보에 대한 필터링을 수행하는 단계; 및 (E) 상기 중앙서버가 상기 문자정보에 대한 필터링 수행결과 또는 상기 영상정보에 대한 필터링 수행결과에 따라 상기 디지털 콘텐츠의 적합여부를 알리는 단계;를 포함한다.
본 발명의 다른 실시예에 따른 디지털 콘텐츠의 필터링 제어방법에서 상기 문자정보는 상기 디지털 콘텐츠에 첨부된 문서파일, 음성인식기술을 이용하여 상기 영상정보에 대응하는 음성을 문자로 인식한 대화문장 또는 강의 문장, 상기 영상정보에 대해 OCR(optical character recognition) 기법으로 검출된 문자를 포함하는 것을 특징으로 한다.
본 발명의 다른 실시예에 따른 디지털 콘텐츠의 필터링 제어방법에서 상기 (C) 단계는 상기 중앙서버에 구비된 LSTM(Long Short-Term Memory models)을 이용하여 수행되는 것을 특징으로 한다.
본 발명의 다른 실시예에 따른 디지털 콘텐츠의 필터링 제어방법에서 상기 (C) 단계는 (C-1) 상기 문자정보에 대해 문장별로 분리하고, 상기 문장에 대해 각각의 단어로 분리하는 인코딩(encoding)을 수행하는 단계; (C-2) 상기 인코딩으로 분리된 각각의 단어를 벡터형으로 변환하는 임베딩(embedding) 처리를 수행하는 단계; (C-3) 상기 각각의 단어에 대한 벡터를 상기 LSTM에 입력 벡터(x(t))로 입력하여, 상기 각각의 단어에 대한 가중치로 식별하는 단계; (C-4) 상기 LSTM을 이용하여 상기 각각의 단어가 상기 문장을 구성하는 다른 단어와의 관계가중치를 도출하여 식별하는 단계; 및 (C-5) 상기 관계가중치 각각을 합한 합산치가 설정된 임계치보다 많은지를 판단하는 단계;를 더 포함하는 것을 특징으로 한다.
본 발명의 다른 실시예에 따른 디지털 콘텐츠의 필터링 제어방법에서 상기 (D) 단계는 상기 중앙서버에 구비된 CNN 신경망을 이용하여 수행되는 것을 특징으로 한다.
본 발명의 다른 실시예에 따른 디지털 콘텐츠의 필터링 제어방법에서 상기 (D) 단계는 (D-1) 상기 영상정보에서 특징맵(feature map)을 추출하는 단계; (D-2) 추출한 다수의 상기 특징맵을 합산하고, 컨벌루션 연산을 수행해 상기 특징맵을 재생성하는 단계; (D-3) 상기 재생성된 특징맵을 활성화 함수(Activation function)에 대입하여 연산하는 단계; (D-4) 상기 활성화 함수를 이용하여 출력된 출력값을 이용하여 풀링(pooling) 연산을 실행하는 단계; (D-5) 상기 풀링 연산의 풀링 연산값과 미리 설정한 목표 출력값을 이용하여 손실값을 연산하는 단계; (D-6) 연산된 상기 손실값을 이용해 매개변수에 대한 수정값을 획득하고, 상기 수정값을 이용하여 상기 매개 변수를 업데이트하는 단계; (D-7) 업데이트된 상기 매개 변수를 이용하여, 상기 (D-2) 단계부터 상기 (D-6) 단계까지를 설정된 횟수로 재수행하는 단계; (D-8) 획득한 이진 영상에 대해 침식연산과 팽창연산을 수행하는 단계; 및 (D-9) 상기 이진 영상에서 검출된 객체의 윤곽선 패턴을 콘텐츠 관리 데이터 저장서버에 저장된 윤곽선 비교패턴과 매칭하여 적합패턴인지를 판단하는 단계;를 더 포함하는 것을 특징으로 한다.
본 발명의 다른 실시예에 따른 디지털 콘텐츠의 필터링 제어방법에서 상기 콘텐츠 관리데이터 저장서버는 상기 디지털 콘텐츠의 저작권자 데이터, 상기 디지털 콘텐츠의 사용자 데이터, 보안 정책에 따른 그룹 설정데이터 및 상기 디지털 콘텐츠의 부적합 여부를 비교판단하는데 이용되는 비교판단 데이터를 저장하는 것을 특징으로 한다.
본 발명의 특징 및 이점들은 첨부도면에 의거한 다음의 상세한 설명으로 더욱 명백해질 것이다.
이에 앞서, 본 명세서 및 청구범위에 사용된 용어나 단어는 통상적이고, 사전적인 의미로 해석되어서는 아니 되며, 발명자가 그 자신의 발명을 가장 최선의 방법으로 설명하기 위해 용어의 개념을 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합되는 의미와 개념으로 해석되어야만 한다.
본 발명의 일실시예에 따른 디지털 콘텐츠를 필터링하는 시스템은 중앙서버의 내부에 구비된 인공지능 신경망을 이용하여 디지털 콘텐츠를 학습하고 필터링하여, 필터링한 결과에 따라 해당 디지털 콘텐츠에 대한 적합 여부를 판단하여 사용자에게 디스플레이할 수 있는 효과가 있다.
본 발명의 다른 실시예에 따른 디지털 콘텐츠를 필터링하는 제어방법은 디지털 콘텐츠를 구성하는 문자정보와 영상정보를 각각 필터링하여 적합 여부를 판단하여 사용자에게 알림으로써, 미성년자들에게 무분별한 언어와 영상과 같은 불건전한 정보들에 그대로 노출되는 것을 미연에 방지할 수 있는 효과가 있다.
도 1은 본 발명의 일실시예에 따른 디지털 콘텐츠를 필터링하는 시스템의 구성도.
도 2는 본 발명의 다른 실시예에 따른 디지털 콘텐츠를 필터링하는 제어방법을 설명하기 위한 순서도.
도 3은 본 발명의 다른 실시예에 따른 디지털 콘텐츠를 필터링하는 제어방법에 적용되는 LSTM 아키텍처.
도 4는 본 발명의 다른 실시예에 따른 디지털 콘텐츠를 필터링하는 제어방법에서 문장 필터링을 설명하기 위한 예시도.
도 5a와 도 5b는 본 발명의 다른 실시예에 따른 디지털 콘텐츠를 필터링하는 제어방법에서 영상 필터링을 설명하기 위한 예시도들.
도 6은 본 발명의 다른 실시예에 따른 디지털 콘텐츠를 필터링하는 제어방법에 적용되는 CNN 신경망의 구조도.
도 7은 본 발명의 다른 실시예에 따른 디지털 콘텐츠를 필터링하는 제어방법에서 영상 필터링의 컨벌루션 처리 과정을 설명하기 위한 예시도.
도 8은 본 발명의 다른 실시예에 따른 디지털 콘텐츠를 필터링하는 제어방법에서 영상 필터링의 풀링 과정을 설명하기 위한 예시도.
본 발명의 목적, 특정한 장점들 및 신규한 특징들은 첨부된 도면들과 연관되는 이하의 상세한 설명과 바람직한 실시예로부터 더욱 명백해질 것이다. 본 명세서에서 각 도면의 구성요소들에 참조번호를 부가함에 있어서, 동일한 구성 요소들에 한해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 번호를 가지도록 하고 있음에 유의하여야 한다. 또한, 제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 또한, 본 발명을 설명함에 있어서, 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명은 생략한다.
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예를 상세히 설명하기로 한다. 도 1은 본 발명의 일실시예에 따른 디지털 콘텐츠를 필터링하는 시스템의 구성도이다.
본 발명의 일실시예에 따른 디지털 콘텐츠를 필터링하는 시스템(100)은 도 1에 도시된 바와 같이 중앙서버(110), 콘텐츠 저장서버(120), 콘텐츠 관리데이터 저장서버(130), 인터페이스(140) 및 송수신부(150)를 포함할 수 있다.
중앙서버(110)는 시스템(100)을 구성하는 다른 구성들(120, 130, 140, 150)의 동작을 전반적으로 제어 및 관리하는 구성으로서, 내부에 다수의 인공지능 신경망을 구비하여 콘텐츠 저장서버(120)에 저장된 디지털 콘텐츠 또는 인터페이스(140)를 통해 입력되는 디지털 콘텐츠를 학습하고 필터링을 수행할 수 있다. 이러한 중앙서버(110)는 디지털 콘텐츠를 필터링한 결과를 사용자에게 디스플레이할 수 있다.
여기서, 다수의 인공지능 신경망은 예컨대 디지털 콘텐츠의 문자정보를 필터링하기 위한 LSTM(Long Short-Term Memory models) 및 디지털 콘텐츠의 영상정보를 필터링하기 위한 CNN 신경망을 포함할 수 있다. 물론, LSTM 및 CNN 신경망 이외의 다른 신경망을 포함할 수도 있다.
콘텐츠 저장서버(120)는 중앙서버(110)에 의해 학습 처리된 디지털 콘텐츠, 중앙서버(110)에서 학습 처리될 예정의 디지털 콘텐츠 등을 저장할 수 있고, 특히 중앙서버(110)에 의해 학습 처리된 디지털 콘텐츠는 언어폭력과 유해한 콘텐츠 내용을 필터링하는 과정을 거쳐 적합으로 판명된 디지털 콘텐츠 및 부적합으로 판명된 디지털 콘텐츠를 포함할 수 있다. 이러한 적합 디지털 콘텐츠와 부적합 디지털 콘텐츠는 콘텐츠 관리데이터 저장서버(130)에 설정된 그룹 설정데이터에 따라 그룹화되어 저장될 수 있다.
콘텐츠 관리데이터 저장서버(130)는 콘텐츠 저장서버(120)에 저장된 각 콘텐츠의 저작권자 데이터, 각 콘텐츠의 사용자 데이터, 콘텐츠 관리 데이터의 보안 정책에 따른 그룹 설정데이터, 중앙서버(110)에서 디지털 콘텐츠의 부적합 여부를 비교판단하는데 이용되는 비교판단 데이터 등을 저장할 수 있다.
여기서, 콘텐츠 관리 데이터의 보안 정책에 따른 그룹 설정데이터는 해당 콘텐츠의 보안 중요도 및 적합판정 정도에 따라 제 1 콘텐츠 그룹부터 제 5 콘텐츠 그룹으로 설정될 수 있다. 제 1 콘텐츠 그룹에 포함된 콘텐츠들은 보안 중요도와 적합판정 정도가 가장 높고, 제 5 콘텐츠 그룹에 포함된 콘텐츠들은 보안 중요도와 적합판정 정도가 가장 낮다.
또한, 비교판단 데이터는 디지털 콘텐츠의 부적합 여부를 비교판단하기 위한 데이터, 예컨대 문장 내의 단어별 관계가중치, 문장의 관계가중치의 임계치, 영상의 윤관선에 대한 적합 패턴 등을 포함할 수 있다.
인터페이스(140)는 디지털 콘텐츠를 필터링하는 시스템(100)의 사용자 명령을 입력받는 구성으로, 예를 들어 키보드, 키패드, 터치 스크린일 수 있다. 여기서, 사용자 명령은 사용자에 의해 설정되는 콘텐츠 관리 데이터를 생성하기 위한 명령어, 콘텐츠를 콘텐츠 저장서버(120)에 저장 또는 삭제하기 위한 명령어, 송수신부(150)의 통신 동작을 제어하기 위한 명령어 등을 포함할 수 있다.
송수신부(150)는 중앙서버(110)의 제어에 따라 외부 장치와의 통신을 수행하여 디지털 콘텐츠를 이용자에게 전송하는 구성으로, 인트라넷 및 인터넷에 유,무선 송신 및 수신을 지원하기 위해서 예컨대 모뎀, 증폭기, 필터 및 주파수 변환 장치들을 포함할 수 있다.
이와 같이 구성된 디지털 콘텐츠를 필터링하는 시스템(100)은 중앙서버(110)의 내부에 구비된 인공지능 신경망을 이용하여 디지털 콘텐츠를 학습하고 필터링하여, 필터링한 결과에 따라 해당 디지털 콘텐츠에 대한 적합 여부를 판단하여 사용자에게 디스플레이할 수 있다.
이하, 본 발명의 다른 실시예에 따른 디지털 콘텐츠를 필터링하는 제어방법에 대해 도 2 내지 도 8을 참조하여 설명한다. 도 2는 본 발명의 다른 실시예에 따른 디지털 콘텐츠를 필터링하는 제어방법을 설명하기 위한 순서도이고, 도 3은 본 발명의 다른 실시예에 따른 디지털 콘텐츠를 필터링하는 제어방법에 적용되는 LSTM 아키텍처이며, 도 4는 본 발명의 다른 실시예에 따른 디지털 콘텐츠를 필터링하는 제어방법에서 문장 필터링을 설명하기 위한 예시도이며, 도 5a와 도 5b는 본 발명의 다른 실시예에 따른 디지털 콘텐츠를 필터링하는 제어방법에서 영상 필터링을 설명하기 위한 예시도들이며, 도 6은 본 발명의 다른 실시예에 따른 디지털 콘텐츠를 필터링하는 제어방법에 적용되는 CNN 신경망의 구조도이며, 도 7은 본 발명의 다른 실시예에 따른 디지털 콘텐츠를 필터링하는 제어방법에서 영상 필터링의 컨벌루션 처리 과정을 설명하기 위한 예시도이며, 도 8은 본 발명의 다른 실시예에 따른 디지털 콘텐츠를 필터링하는 제어방법에서 영상 필터링의 풀링 과정을 설명하기 위한 예시도이다.
본 발명의 다른 실시예에 따른 디지털 콘텐츠를 필터링하는 제어방법은 중앙서버(110)가 인터페이스(140)를 통해 입력받은 사용자 명령에 따라 콘텐츠 저장서버(120)에 저장된 디지털 콘텐츠 또는 인터페이스(140)를 통해 입력되는 디지털 콘텐츠를 학습하고 필터링을 시동한다(S210).
필터링을 시동함에 따라, 먼저 중앙서버(110)는 디지털 콘텐츠를 영상정보와 문자정보로 분리한다(S220).
이때, 문자정보는 해당 디지털 콘텐츠에 첨부된 문서파일, 음성인식기술을 이용하여 해당 영상정보에 대응하는 음성을 문자로 인식한 대화 또는 강의 문장, 해당 영상정보에서 OCR(optical character recognition) 기법으로 검출된 문자 등을 포함할 수 있다. 즉, 도 4에 도시된 바와 같이 문자정보는 대화 문장(201)으로 인식되어 분리될 수 있다.
분리된 영상정보와 문자정보에 대해, 중앙서버(110)는 영상정보와 문자정보 각각에 대해 인공지능 신경망을 이용한 필터링을 수행한다.
먼저, 중앙서버(110)는 문자정보에 대한 필터링을 위한 인공지능 신경망으로 LSTM(Long Short-Term Memory models)을 이용할 수 있다. LSTM은 RNN(Recurrent Neural Network) 신경망의 한 종류로서, 유전자, 손글씨, 음성 신호, 문장 등과 같이 배열(sequence) 또는 시계열의 형태를 갖는 데이터에서 패턴을 인식하는 인공 신경망이다. 특히, LSTM은 긴 의존 기간(long-term dependency)을 필요로 하는 데이터를 학습하는데 효과적이다.
이러한 문자정보의 필터링을 위해, 중앙서버(110)는 도 4에 도시된 대화 문장(201)에 대한 전처리(Preprocessing) 과정을 수행한다.
구체적으로, 전처리 과정은 대화 문장(201)을 각 문장별로 분리하고, 이어서 각각의 단어(202,203)로 분리하는 인코딩(encoding)을 수행한다.
중앙서버(110)는 이렇게 인코딩으로 분리된 각각의 단어(202,203)를 아래의 [수학식 1]의 임베딩(Embedding) 함수를 이용하여 벡터형으로 변환하는 임베딩 처리를 수행한다.
Figure 112021133694980-pat00001
여기서, a는 입력 단어의 총개수이고, b는 벡터의 크기이며, c는 입력 단어 각각의 적합 허용치이다.
이때, 입력 단어의 적합 허용치(c)는 콘텐츠 관리데이터 저장서버(130)에 등급별로 저장된 빅데이터를 참조하여 부여되고, 특히 아래의 [표 1]과 같이 계층별, 성별, 지역별로 분류된 혐오단어를 5등급으로 분류하여 적합 허용치(c)가 "마이너스 값"으로 부여될 수 있다.
5등급 분류 예시
청소년 혐오단어 고삐리, 급식충, 애새끼, 잼민이
남성 혐오단어 한남충, 개새끼
여성 혐오단어 된장녀, 창녀, 김치녀
노인 혐오단어 틀딱, 꼰대, 노망
지역 혐오단어 전라디언, 홍어, 대구통구이
장애인 혐오단어 병신, 머저리, 애자, 등신
물론, 5등급 분류 단어는 [표 1]의 단어 이외에 외국인 혐오단어, 직업 혐오단어, 차별단어, 각종 비속어 등의 부적합 단어들을 포함하며, 이러한 5등급 분류 단어는 적합 허용치(c)가 "마이너스 값"으로 부여될 수 있다. 이러한 5등급으로 분류되는 단어들은 콘텐츠 관리데이터 저장서버(130)에 실시간 또는 일정 시간에 빅데이터로 업데이트되어 추가될 수 있다.
이렇게 변환된 각 단어(202,203)의 벡터는 LSTM에 입력 벡터(x(t))로서 입력되어 학습되어, 각 단어별 가중치로 식별된다(S230).
이러한 LSTM은 도 3에 도시된 구성을 가져, 입력 게이트(Input gate), 망각 게이트(Forget gate), 출력 게이트(Output gate)의 세 개의 게이트로 이루어진다.
입력 게이트는 새로운 입력을 추가하기 위해 필요한 게이트이고, 망각 게이트는 불필요한 정보를 지우기 위해 필요한 게이트이며, 출력 게이트는 현재 시간 단계에서 출력에 영향을 주는지를 결정하기 위해 필요한 게이트이다.
이러한 게이트들은 아래의 [수학식 2]로 표현된다.
Figure 112021133694980-pat00002
여기서, f(t)는 망각 게이트이고, i(t)는 입력 게이트이며, o(t)는 출력 게이트이며, c(t)와 c(t-1)은 셀 상태 벡터이며, wf, wi, wo, wc 는 히든 레이어(hidden laer)와 출력 레이어의 가중치를 각각 나타내며, bf, bi, bo, bc 는 바이어스(bias) 벡터이며, x(t)는 각 단어(202,203)의 입력 벡터이며, fg(), fc(), fh()는 활성화 함수를 각각 나타내며, h(t)와 h(t-1)은 시간 t와 t-1에서 히든 레이어(hidden layer) 뉴런(neuron)의 출력을 각각 나타내며, uf, ui, uo, uc 는 히든 레이어 뉴런을 반복(recurrent) 레이어에 연결하고 출력되는 가중치를 각각 나타낸다.
각 단어별 가중치를 도출하여 식별하는 과정에서 중앙서버(110)는 각 단어(202,203)가 문장 내에서 주어 또는 목적어에 해당하는지를 판단하여 각 단어별 가중치를 추가 부여할 수도 있다. 특히, 단어별 가중치는 입력되는 각 단어(202,203)가 상술한 [표 1]과 같은 5등급 분류 단어에 해당하는 경우에 마이너스 값으로 도출될 수도 있다.
이러한 LSTM을 이용한 반복 학습으로 각 단어별 가중치를 식별한 후, 중앙서버(110)는 LSTM을 이용하여 각 단어(202,203)가 문장을 구성하는 다른 단어와의 관계가중치(u10,u16,u20,u26)를 도출하여 식별한다(S232).
이러한 관계가중치(u10,u16,u20,u26)는 문장을 구성하는 다른 단어와 연관관계가 예를 들어 긍정 또는 부정인지에 따라, 문장부호에 따라 또는 문장 접속사에 따라 도출될 수 있고, 콘텐츠 관리 데이터 저장서버(130)에 빅데이터로 저장된 관계가중치 설정기준데이터를 참조하여 도출될 수도 있다.
이렇게 각 문장별로 관계가중치(u10,u16,u20,u26)를 도출한 후, 중앙서버(110)는 각 문장별로 도출된 관계가중치(u10,u16,u20,u26)를 각 문장별로 합산한 합산치가 설정된 임계치 이상인지를 판단한다(S234).
여기서, 임계치는 콘텐츠 관리 데이터 저장서버(130)에 저장된 데이터로서, 문장을 구성하는 단어의 개수에 따라 콘텐츠 이용자의 연령 등을 감안하여 설정된 수치일 수 있다. 즉, 콘텐츠 이용자의 연령이 청소년에 해당한다면 임계치는 0으로 설정될 수 있고, 콘텐츠 이용자의 연령이 성인 장년층에 해당한다면 임계치는 임의의 값으로 설정될 수 있다.
각 문장별로 합산한 합산치가 설정된 임계치 이상이 아니면, 중앙서버(110)는 해당 문장이 부적합한 문장으로 판단하고, 부적합 콘텐츠의 판단결과로 사용자에게 음성 또는 문자로 출력하여 알린다(S250).
예를 들어 청소년의 학습을 위한 콘텐츠인 경우, 합산치가 0 으로 설정된 임계치보다 작은 마이너스의 값으로 도출된다면, 중앙서버(110)는 해당 문장의 진의가 의심스런 부적합한 문장으로 판단하고, 부적합 콘텐츠의 판단결과로 사용자에게 음성 또는 문자로 출력할 수 있다.
반면에, 각 문장별로 합산한 합산치가 설정된 임계치 이상이면, 중앙서버(110)는 해당 문장이 적합한 문장으로 판단하고, 적합 콘텐츠의 판단결과로 사용자에게 음성 또는 문자로 출력하여 알린다(S260).
이와 같이 문자정보의 필터링을 수행함과 별개로, 중앙서버(110)는 디지털 콘텐츠의 영상정보에 대한 필터링을 수행한다.
영상정보에 대한 필터링을 위해, 먼저 중앙서버(110)는 영상정보에서 특징맵(feature map)을 추출한다(S240).
구체적으로, 특징맵의 추출과정은 도 6에 도시된 CNN 신경망과 같은 심층 신경망을 이용할 수 있고, 심층 신경망의 입력 레이어(input layer)에 도 5a의 영상 이미지의 픽셀정보가 입력되고, 제 1 히든 레이어(hidden layer 1)를 거치면서 도 7에 도시된 바와 같이 필터를 이용해 컨벌루션(convolution) 연산을 실행하는 과정을 포함할 수 있다.
이때, 필터를 이용해 컨벌루션 연산은 아래의 [수학식 3]을 이용하여 실행할 수 있다.
Figure 112021133694980-pat00003
Figure 112021133694980-pat00004
여기에서, l은 레이어(layer)를 의미하고, sizel은 레이어의 사이즈를 의미하며, In은 입력 레이어에 입력되는 데이터(data)의 수를 의미하고, Ia는 라벨(label)의 수를 의미하며, O는 출력 컨볼루션층(Output Convolution Layer)을 의미하고, w는 가중치를 의미하며, b는 특징맵의 편향 바이어스(bias)를 의미한다.
이러한 컨벌루션 연산을 통해 처리된 특징맵은 도 5b에 도시된 바와 같이 이진수 값을 갖는 흑백 이미지 형태를 갖는다.
특징맵을 추출한 후, 중앙서버(110)는 추출한 다수의 특징맵을 합산하고, 합산한 특징맵에 대하여 컨벌루션 연산을 수행해 특징맵을 재생성한다(S241).
이때, 특징맵을 재생성하는 과정은 아래의 [수학식 4]를 이용하여 합산한 특징맵을 컨캐터네이팅(Concatenating)하고, [수학식 5]를 이용한 컨벌루션 연산을 수행하여 실행될 수 있다.
Figure 112021133694980-pat00005
Figure 112021133694980-pat00006
Figure 112021133694980-pat00007
여기서, In은 입력되는 데이터(data)의 수를 의미하고, Ia는 라벨(label)의 수를 의미하며, O는 출력 컨볼루션층(Output Convolution Layer)을 의미하며, w는 가중치를 의미한다.
이때, fc는 컨캐터네이팅한 특징맵을 이용하여 컨벌루션 연산을 수행한 결과값을 나타낸 것으로, 재생성된 특징맵을 의미할 수 있다.
특징맵을 재생성한 후, 중앙서버(110)는 재생성된 특징맵을 활성화 함수(Activation function)에 대입하여 연산할 수 있다(S242).
여기서, 활성화 함수는 Sigmoid 함수 또는 ReLu 함수를 이용할 수 있다.
활성화 함수를 이용하여 출력된 출력값에 대해, 중앙서버(110)는 획득한 출력값을 이용하여 풀링(pooling) 연산을 실행한다(S243).
구체적으로, 풀링 연산은 데이터의 차원의 크기를 축소하기 위한 것으로, 데이터에서 세로 및 가로 방향 공간의 크기를 줄이는 연산이다. 이러한 풀링 연산은 다양한 파라미터, 예를 들어 평균, 중간값, 최댓값, 최소값 등을 이용할 수 있고, 여기서는 도 8에 도시된 바와 같이 최댓값을 이용한 최댓값 풀링 연산을 적용한다. 최댓값 풀링 연산(max polling)을 이용하여 이미지의 제한 영역에서 최댓값을 추출하고, 데이터의 노이즈를 제거할 수 있으며, 데이터가 줄어드는 과정에서 오버 피팅(over fitting)을 방지할 수 있다.
이러한 최댓값 풀링 연산은 아래의 [수학식 6]을 이용하여 실행될 수 있다.
Figure 112021133694980-pat00008
Figure 112021133694980-pat00009
여기서, x는 풀링 연산을 위해 입력되는 행렬을 의미하고, l은 풀링 연산의 해당층을 의미하며, i는 입력되는 행렬의 행을 의미하며, j는 입력되는 행렬의 열을 의미하며, sizel은 풀링 연산의 해당층 사이즈를 의미하며, Im은 풀링 연산의 해당층에 입력되는 데이터(data)의 수를 의미하고, Ia는 라벨(label)의 수를 의미한다.
풀링 연산을 실행한 후, 중앙서버(110)는 풀링 연산값과 미리 설정한 목표 출력값을 이용하여 손실값을 연산한다(S244).
구체적으로, 손실값 연산은 아래의 [수학식 7]의 MSLE, [수학식 8]의 RMSLE 또는 [수학식 9]의 sMAPE를 이용하여 연산할 수 있고, 미리 설정한 목표 출력값은 GT(Ground Truth)일 수 있다.
이때, GT는 예컨대 도 5a의 원본 이미지 데이터를 제 1 히든 레이어에서 컨벌루션 연산을 수행한 컨벌루션 연산값을 기초로 최댓값 풀링 연산(Max Pooling)을 수행한 값일 수도 있다.
Figure 112021133694980-pat00010
Figure 112021133694980-pat00011
Figure 112021133694980-pat00012
여기서,
Figure 112021133694980-pat00013
는 풀링 연산 단계(S243)의 풀링 연산값을 의미하고,
Figure 112021133694980-pat00014
는 미리 설정한 목표 출력값을 의미한다.
손실값을 연산한 후, 중앙서버(110)는 연산된 손실값을 이용해 매개변수에 대한 수정값을 획득한다(S245).
이때, 매개변수는 w인 가중치를 의미할 수 있고, 중앙서버(110)는 획득한 매개 변수에 대한 수정값을 이용하여 매개 변수를 업데이트할 수 있다.
이렇게 업데이트된 매개 변수를 이용하여, 중앙서버(110)는 상술한 특징맵을 재생성하는 단계(S241)부터 매개변수의 수정값을 획득하는 단계(S245)까지를 설정된 횟수로 재수행할 수 있다(S246).
이러한 재수행 과정이 1번 완료되면 epoch 1번 학습 완료한 것이고, 재수행 과정이 50번 반복적으로 수행되면 epoch 50으로 학습 완료한 것이다.
이러한 설정 횟수의 재수행 과정에 따라, 중앙서버(110)는 보다 명확한 흑백의 이진 영상을 획득하고, 이러한 이진 영상에서 노이즈를 제거하고 복원하기 위한 침식연산과 팽창연산을 수행한다(S247).
구체적으로, 침식연산은 노이즈를 제거하기 위해 형태학적 기반의 연산으로 아래의 [수학식 10]에 따라 수행한다. 여기서, A와 B는
Figure 112021133694980-pat00015
내의 집합이고, B에 의한 A의 침식은
Figure 112021133694980-pat00016
로 표기한다. 즉, B에 의한 A의 침식은 Z에 의해 천이된 B가 A 내에 포함되는 모든 점 Z의 집합이다.
Figure 112021133694980-pat00017
이러한 침식연산이 수행되면, 배경이 넓어지고 객체는 작아지면서 이진 영상의 노이즈가 제거될 수 있다.
이어서, 침식연산 수행에 의해 작아진 이진 영상의 객체을 원래의 크기로 되돌리기 위하여, 형태학적 기반의 팽창연산을 아래의 [수학식 11]에 따라 수행한다. 여기서, A와 B는 Z2 내의 집합이고, B에 의한 A의 팽창은
Figure 112021133694980-pat00018
로 표기한다. 즉, B에 의한 A의 팽창은 B와 A가 적어도 한 개 요소에 의해 겹쳐지도록 모두 Z만큼 전치된 집합이다.
Figure 112021133694980-pat00019
이때, 침식연산에 의해 객체부분의 침식이 많이 발생하였기 때문에, 팽창연산은 예컨대 2번 수행할 수 있다. 이러한 팽창연산의 수행 결과, 객체 부분이 커지고 배경부분이 작아진 영상을 획득할 수 있다.
이러한 팽창연산이 수행된 후, 중앙서버(110)는 팽창연산이 수행된 이진영상에 대해 영상 내에 포함된 객체의 윤곽선을 검출한다.
이렇게 객체의 윤곽선을 검출한 후, 중앙서버(110)는 검출된 객체의 윤곽선 패턴이 콘텐츠 관리 데이터 저장서버(130)에 저장된 윤곽선 비교패턴과 매칭하여 적합패턴인지를 판단한다(S248).
여기서, 윤곽선 비교패턴은 예컨대 남,녀의 성기 윤곽선 패턴, 남,녀의 신체부위의 윤곽선 패턴, 무기들의 윤곽선 패턴, 담배 윤곽선 패턴 등을 포함할 수 있다.
이러한 윤곽선 비교패턴과 검출된 객체의 윤곽선 패턴을 서로 매칭하여 매칭률이 예컨대 50% 이상으로 도출되면, 중앙서버(110)는 해당 영상을 부적합한 영상으로 판단하고, 부적합 콘텐츠의 판단결과로 사용자에게 음성 또는 문자로 출력하여 알린다(S250).
반면에, 윤곽선 비교패턴과 검출된 객체의 윤곽선 패턴을 서로 매칭하여 매칭률이 예컨대 50% 미만으로 도출되면, 중앙서버(110)는 해당 영상을 적합한 영상으로 판단하고, 적합 콘텐츠의 판단결과로 사용자에게 음성 또는 문자로 출력하여 알린다(S260).
이와 같은 과정의 디지털 콘텐츠를 필터링하는 제어방법은 디지털 콘텐츠를 구성하는 문자정보와 영상정보를 각각 필터링하여 적합 여부를 판단하여 사용자에게 알림으로써, 미성년자들에게 무분별한 언어와 영상과 같은 불건전한 정보들에 그대로 노출되는 것을 미연에 방지할 수 있다.
본 발명의 기술사상은 상기 바람직한 실시예에 따라 구체적으로 기술되었으나, 전술한 실시예들은 그 설명을 위한 것이며, 그 제한을 위한 것이 아님을 주의하여야 한다.
또한, 본 발명의 기술분야의 통상의 전문가라면 본 발명의 기술사상의 범위 내에서 다양한 실시가 가능함을 이해할 수 있을 것이다.
100: 필터링 시스템 110: 중앙서버
120: 콘텐츠 저장서버
130: 콘텐츠 관리 데이터 저장서버 140: 인터페이스
150: 송수신부

Claims (10)

  1. 다수의 인공지능 신경망을 구비하여 디지털 콘텐츠를 학습하고 필터링을 수행하는 중앙서버;
    상기 중앙서버에 연결되고, 상기 디지털 콘텐츠를 저장한 콘텐츠 저장서버;
    상기 중앙서버에 연결되고, 상기 디지털 콘텐츠를 필터링하는데 이용되는 다수의 데이터를 저장한 콘텐츠 관리데이터 저장서버;
    상기 중앙서버에 연결되어 상기 디지털 콘텐츠의 필터링을 위한 사용자 명령을 입력받는 인터페이스; 및
    상기 중앙서버에 연결되고, 상기 중앙서버의 제어에 따라 상기 디지털 콘텐츠를 송수신하는 송수신부;
    를 포함하고,
    상기 중앙서버는 상기 디지털 콘텐츠를 영상 정보와 문자정보로 분리하되, 상기 디지털 콘텐츠의 소비자에 따라 서로 다른 적합 허용치를 적용하여 상기 문자정보를 필터링하며,
    상기 콘텐츠 관리데이터 저장서버는,
    보안 정책에 따른 그룹 설정데이터 및 상기 디지털 콘텐츠의 부적합 여부를 비교판단하는데 이용되는 비교판단 데이터를 저장하며,
    상기 보안 정책에 따른 그룹 설정데이터는 해당 콘텐츠의 보안 중요도 및 적합판정 정도에 따라 복수의 콘텐츠 그룹으로 설정되며,
    복수의 콘텐츠 그룹은 보안중요도가 높으면서 적합판정 정도가 높은 그룹부터 보안중요도가 낮으면서 적합판정 정도가 낮은 그룹으로 구분되며,
    상기 문자정보의 적합 허용치는 상기 콘텐츠 관리데이터 저장서버에 등급별로 저장된 빅데이터를 참조하여 부여되고,
    계층별, 성별 및 지역별로 분류된 혐오단어를 포함하면 가장 높은 등급으로 분류하여 적합 허용치가 마이너스 값으로 부여될 수 있는 것을 특징으로 하는 디지털 콘텐츠의 필터링 시스템.
  2. 제 1 항에 있어서,
    상기 인공지능 신경망은 상기 디지털 콘텐츠의 문자정보를 필터링하기 위한 LSTM(Long Short-Term Memory models) 및 상기 디지털 콘텐츠의 영상정보를 필터링하기 위한 CNN 신경망을 포함하는 것을 특징으로 하는 디지털 콘텐츠의 필터링 시스템.
  3. 삭제
  4. 디지털 콘텐츠의 필터링 시스템을 이용한 디지털 콘텐츠의 필터링 제어방법에 있어서,
    (A) 중앙서버가 입력받은 사용자 명령에 따라 디지털 콘텐츠의 필터링을 시동하는 단계;
    (B) 상기 중앙서버가 상기 디지털 콘텐츠를 영상정보와 문자정보로 분리하는 단계;
    (C) 상기 중앙서버가 상기 문자정보에 대한 필터링을 수행하는 단계;
    (D) 상기 중앙서버가 상기 영상정보에 대한 필터링을 수행하는 단계; 및
    (E) 상기 중앙서버가 상기 문자정보에 대한 필터링 수행결과 또는 상기 영상정보에 대한 필터링 수행결과에 따라 상기 디지털 콘텐츠의 적합여부를 알리는 단계;
    를 포함하고,
    상기 디지털 콘텐츠의 필터링 시스템은,
    상기 디지털 콘텐츠의 저작권자 데이터, 상기 디지털 콘텐츠의 사용자 데이터, 보안 정책에 따른 그룹 설정데이터 및 상기 디지털 콘텐츠의 부적합 여부를 비교하여 판단하는 비교판단 데이터가 저장되는 콘텐츠 관리데이터 저장서버를 포함하고,
    상기 보안 정책에 따른 그룹 설정데이터는 해당 콘텐츠의 보안 중요도 및 적합판정 정도에 따라 복수의 콘텐츠 그룹으로 설정되며,
    복수의 콘텐츠 그룹은 보안중요도가 높으면서 적합판정 정도가 높은 그룹부터 보안중요도가 낮으면서 적합판정 정도가 낮은 그룹으로 구분되며,
    상기 문자정보의 적합 허용치는 상기 콘텐츠 관리데이터 저장서버에 등급별로 저장된 빅데이터를 참조하여 부여되고,
    계층별, 성별 및 지역별로 분류된 혐오단어를 포함하면 가장 높은 등급으로 분류하여 적합 허용치가 마이너스 값으로 부여될 수 있는 것을 특징으로 하는 디지털 콘텐츠의 필터링 제어방법.
  5. 제 4 항에 있어서,
    상기 문자정보는 상기 디지털 콘텐츠에 첨부된 문서파일, 음성인식기술을 이용하여 상기 영상정보에 대응하는 음성을 문자로 인식한 대화문장 또는 강의 문장, 상기 영상정보에 대해 OCR(optical character recognition) 기법으로 검출된 문자를 포함하는 것을 특징으로 하는 디지털 콘텐츠의 필터링 제어방법.
  6. 제 4 항에 있어서,
    상기 (C) 단계는 상기 중앙서버에 구비된 LSTM(Long Short-Term Memory models)을 이용하여 수행되는 것을 특징으로 하는 디지털 콘텐츠의 필터링 제어방법.
  7. 제 6 항에 있어서,
    상기 (C) 단계는
    (C-1) 상기 문자정보에 대해 문장별로 분리하고, 상기 문장에 대해 각각의 단어로 분리하는 인코딩(encoding)을 수행하는 단계;
    (C-2) 상기 인코딩으로 분리된 각각의 단어를 벡터형으로 변환하는 임베딩(embedding) 처리를 수행하는 단계;
    (C-3) 상기 각각의 단어에 대한 벡터를 상기 LSTM에 입력 벡터(x(t))로 입력하여, 상기 각각의 단어에 대한 가중치로 식별하는 단계;
    (C-4) 상기 LSTM을 이용하여 상기 각각의 단어가 상기 문장을 구성하는 다른 단어와의 관계가중치를 도출하여 식별하는 단계; 및
    (C-5) 상기 관계가중치 각각을 합한 합산치가 설정된 임계치보다 많은지를 판단하는 단계;
    를 더 포함하는 것을 특징으로 하는 디지털 콘텐츠의 필터링 제어방법.
  8. 제 4 항에 있어서,
    상기 (D) 단계는 상기 중앙서버에 구비된 CNN 신경망을 이용하여 수행되는 것을 특징으로 하는 디지털 콘텐츠의 필터링 제어방법.
  9. 제 4 항에 있어서,
    상기 (D) 단계는
    (D-1) 상기 영상정보에서 특징맵(feature map)을 추출하는 단계;
    (D-2) 추출한 다수의 상기 특징맵을 합산하고, 컨벌루션 연산을 수행해 상기 특징맵을 재생성하는 단계;
    (D-3) 상기 재생성된 특징맵을 활성화 함수(Activation function)에 대입하여 연산하는 단계;
    (D-4) 상기 활성화 함수를 이용하여 출력된 출력값을 이용하여 풀링(pooling) 연산을 실행하는 단계;
    (D-5) 상기 풀링 연산의 풀링 연산값과 미리 설정한 목표 출력값을 이용하여 손실값을 연산하는 단계;
    (D-6) 연산된 상기 손실값을 이용해 매개변수에 대한 수정값을 획득하고, 상기 수정값을 이용하여 상기 매개 변수를 업데이트하는 단계;
    (D-7) 업데이트된 상기 매개 변수를 이용하여, 상기 (D-2) 단계부터 상기 (D-6) 단계까지를 설정된 횟수로 재수행하는 단계;
    (D-8) 획득한 이진 영상에 대해 침식연산과 팽창연산을 수행하는 단계; 및
    (D-9) 상기 이진 영상에서 검출된 객체의 윤곽선 패턴을 콘텐츠 관리 데이터 저장서버에 저장된 윤곽선 비교패턴과 매칭하여 적합패턴인지를 판단하는 단계;
    를 더 포함하는 것을 특징으로 하는 디지털 콘텐츠의 필터링 제어방법.
  10. 삭제
KR1020210160177A 2021-11-19 2021-11-19 디지털 콘텐츠의 필터링 시스템 및 필터링 제어방법 KR102395846B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210160177A KR102395846B1 (ko) 2021-11-19 2021-11-19 디지털 콘텐츠의 필터링 시스템 및 필터링 제어방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210160177A KR102395846B1 (ko) 2021-11-19 2021-11-19 디지털 콘텐츠의 필터링 시스템 및 필터링 제어방법

Publications (1)

Publication Number Publication Date
KR102395846B1 true KR102395846B1 (ko) 2022-05-10

Family

ID=81591460

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210160177A KR102395846B1 (ko) 2021-11-19 2021-11-19 디지털 콘텐츠의 필터링 시스템 및 필터링 제어방법

Country Status (1)

Country Link
KR (1) KR102395846B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102472447B1 (ko) * 2022-06-13 2022-11-30 (주)유알피시스템 머신러닝을 이용한 복합 문서내 특정 콘텐츠 자동 차단 시스템 및 방법
KR102618061B1 (ko) * 2023-03-21 2023-12-27 (주)노웨어소프트 인공지능 기반 감정 분석을 활용하여 유해 컨텐츠를 필터링하는 방법 및 장치

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100735885B1 (ko) * 2006-02-10 2007-07-06 삼성전자주식회사 통화 내용의 필터링이 가능한 휴대용 단말기 및 그 방법
KR20090019329A (ko) * 2007-08-20 2009-02-25 (주)케이티에프테크놀로지스 유해 콘텐츠 차단을 위한 방법 및 유해 콘텐츠 차단을 위한이동 통신 단말기
KR20100034782A (ko) * 2008-09-25 2010-04-02 고려대학교 산학협력단 음란물 검출 시스템 및 방법
KR20100116056A (ko) 2009-04-21 2010-10-29 한국전자통신연구원 디지털 콘텐츠 저작권 보호를 위한 분산 필터링 장치 및 그 방법
KR20180071156A (ko) * 2016-12-19 2018-06-27 삼성전자주식회사 동영상을 필터링하는 방법 및 장치
KR102048638B1 (ko) * 2018-08-31 2019-11-25 망고슬래브 주식회사 콘텐츠 인식 방법 및 시스템
KR102102676B1 (ko) * 2017-01-26 2020-04-22 실터 테크놀로지스 리미티드 데이터 콘텐츠 필터
KR102169073B1 (ko) * 2019-09-30 2020-10-22 광운대학교 산학협력단 동영상 유해성 분석 결과 기반 실시간 스트리밍 차단 시스템 및 방법
KR20210129583A (ko) * 2020-04-20 2021-10-28 사운드하운드, 인코포레이티드 미디어 재생 디바이스에서의 콘텐츠 필터링
KR20210133411A (ko) * 2020-04-29 2021-11-08 한국전자통신연구원 스마트 기기에서의 유해 스트리밍 영상 검출 방법, 스마트 기기 및 기계 학습 단말

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100735885B1 (ko) * 2006-02-10 2007-07-06 삼성전자주식회사 통화 내용의 필터링이 가능한 휴대용 단말기 및 그 방법
KR20090019329A (ko) * 2007-08-20 2009-02-25 (주)케이티에프테크놀로지스 유해 콘텐츠 차단을 위한 방법 및 유해 콘텐츠 차단을 위한이동 통신 단말기
KR20100034782A (ko) * 2008-09-25 2010-04-02 고려대학교 산학협력단 음란물 검출 시스템 및 방법
KR20100116056A (ko) 2009-04-21 2010-10-29 한국전자통신연구원 디지털 콘텐츠 저작권 보호를 위한 분산 필터링 장치 및 그 방법
KR20180071156A (ko) * 2016-12-19 2018-06-27 삼성전자주식회사 동영상을 필터링하는 방법 및 장치
KR102102676B1 (ko) * 2017-01-26 2020-04-22 실터 테크놀로지스 리미티드 데이터 콘텐츠 필터
KR102048638B1 (ko) * 2018-08-31 2019-11-25 망고슬래브 주식회사 콘텐츠 인식 방법 및 시스템
KR102169073B1 (ko) * 2019-09-30 2020-10-22 광운대학교 산학협력단 동영상 유해성 분석 결과 기반 실시간 스트리밍 차단 시스템 및 방법
KR20210129583A (ko) * 2020-04-20 2021-10-28 사운드하운드, 인코포레이티드 미디어 재생 디바이스에서의 콘텐츠 필터링
KR20210133411A (ko) * 2020-04-29 2021-11-08 한국전자통신연구원 스마트 기기에서의 유해 스트리밍 영상 검출 방법, 스마트 기기 및 기계 학습 단말

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102472447B1 (ko) * 2022-06-13 2022-11-30 (주)유알피시스템 머신러닝을 이용한 복합 문서내 특정 콘텐츠 자동 차단 시스템 및 방법
KR102618061B1 (ko) * 2023-03-21 2023-12-27 (주)노웨어소프트 인공지능 기반 감정 분석을 활용하여 유해 컨텐츠를 필터링하는 방법 및 장치

Similar Documents

Publication Publication Date Title
KR102395846B1 (ko) 디지털 콘텐츠의 필터링 시스템 및 필터링 제어방법
CN110147806B (zh) 图像描述模型的训练方法、装置及存储介质
CN112861945B (zh) 一种多模态融合谎言检测方法
CN111160452A (zh) 一种基于预训练语言模型的多模态网络谣言检测方法
CN112052331A (zh) 一种处理文本信息的方法及终端
KR20230048992A (ko) 부적절 스코어를 이용한 인공지능 기반의 버츄어 휴먼 인터렉션 생성 장치 및 방법
US20230252786A1 (en) Video processing
CN111046178A (zh) 一种文本序列生成方法及其系统
CN116756577B (zh) 模型训练方法、装置、设备及存储介质
CN113946698A (zh) 一种融合多粒度数据和近邻数据的跨媒体检索方法及系统
CN111241850B (zh) 提供业务模型的方法及装置
CN114580428A (zh) 融合多任务和多标签学习的司法领域深度事件抽取方法
CN112149410A (zh) 语义识别方法、装置、计算机设备和存储介质
CN117251551B (zh) 一种基于大语言模型的自然语言处理系统及方法
CN113792659A (zh) 文档识别方法、装置及电子设备
Salman et al. Privacy preserving personalization for video facial expression recognition using federated learning
KR20200011251A (ko) 대화 인지를 위한 규칙 생성 방법, 규칙 기반의 추론 방법 및 그 방법이 적용된 장치
CN115495579A (zh) 5g通信助理文本分类的方法、装置、电子设备及存储介质
KR102443629B1 (ko) 딥러닝 nlp 모델을 활용한 뉴스 긍정도 분석 솔루션 및 시스템
CN113656451A (zh) 数据挖掘方法、电子设备和计算机可读存储介质
CN113609292A (zh) 基于图结构的已知虚假新闻智能检测方法
CN113704544A (zh) 一种视频分类方法、装置、电子设备和存储介质
KR20200023620A (ko) 대화 인지를 위한 규칙기반의 사용자 의도 추론 장치
Hallyal et al. Optimized recognition of CAPTCHA through attention models
CN112528048B (zh) 一种跨模态检索方法、装置、设备及介质

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant