KR20090001760A - System and method for inspection of adult moving video by audio identification - Google Patents
System and method for inspection of adult moving video by audio identification Download PDFInfo
- Publication number
- KR20090001760A KR20090001760A KR1020070048252A KR20070048252A KR20090001760A KR 20090001760 A KR20090001760 A KR 20090001760A KR 1020070048252 A KR1020070048252 A KR 1020070048252A KR 20070048252 A KR20070048252 A KR 20070048252A KR 20090001760 A KR20090001760 A KR 20090001760A
- Authority
- KR
- South Korea
- Prior art keywords
- video
- adult
- video file
- audio fingerprint
- file
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/231—Content storage operation, e.g. caching movies for short term storage, replicating data over plural servers, prioritizing data for deletion
Abstract
Description
본 명세서에 첨부되는 다음의 도면들은 본 발명의 바람직한 실시 예를 예시하는 것이며, 후술하는 발명의 상세한 설명과 함께 본 발명의 기술사상을 더욱 이해시키는 역할을 하는 것이므로, 본 발명은 그러한 도면에 기재된 사항에만 한정되어 해석되어서는 아니 된다.The following drawings attached to this specification are illustrative of the preferred embodiments of the present invention, and together with the detailed description of the invention to serve to further understand the technical spirit of the present invention, the present invention is a matter described in such drawings It should not be construed as limited to.
도 1은 본 발명의 제1실시예에 따른 오디오 식별을 통한 성인물 동영상 검열시스템의 개략적인 구성을 도시한 블록도이다.1 is a block diagram showing a schematic configuration of a system for censoring adult video by audio identification according to a first embodiment of the present invention.
도 2는 본 발명의 제2실시예에 따른 오디오 식별을 통한 성인물 동영상 검열시스템의 개략적인 구성을 도시한 블록도이다.2 is a block diagram illustrating a schematic configuration of a system for censoring adult video by audio identification according to a second embodiment of the present invention.
도 3 및 도 4는 본 발명의 제1실시예에 따른 오디오 식별을 통한 성인물 동영상 검열 시스템의 동작 방법을 도시한 절차 흐름도이다. 3 and 4 are flowcharts illustrating a method of operating an adult video censoring system through audio identification according to a first embodiment of the present invention.
도 5 및 도 6은 본 발명의 제2실시예에 따른 오디오 식별을 통한 성인물 동영상 검열 시스템의 동작 방법을 도시한 절차 흐름도이다.5 and 6 are flowcharts illustrating a method of operating an adult video censoring system through audio identification according to a second embodiment of the present invention.
도 7은 본 발명에 따른 성인물 동영상 검열 시스템의 동작 방법을 수행하는데 채용될 수 있는 범용 컴퓨터 시스템의 내부 블록도이다. 7 is an internal block diagram of a general-purpose computer system that may be employed to perform the method of operation of the adult movie inspection system according to the present invention.
<도면의 주요 참조 번호><Main reference number in drawing>
100: 파일입력부 110: 오디오 특징 추출부100: file input unit 110: audio feature extraction unit
120: 성인물 동영상 검사부 130: 관리자 검열부120: adult video inspection unit 130: manager censor
140: 동영상 색인부 150: 일반 동영상 검사부140: video index unit 150: general video inspection unit
160: 성인물 동영상 색인 DB 170: 성인물 동영상 스토리지160: adult video index DB 170: adult video storage
180: 일반 동영상 색인 DB 190: 일반 동영상 스토리지180: normal video index DB 190: normal video storage
본 발명은 성인물 동영상 검열 시스템에 대한 것으로서, 보다 상세하게는 동영상 내에 포함된 오디오를 식별하여 성인물 동영상 여부를 검열할 수 있는 시스템 및 그 방법에 대한 것이다.The present invention relates to an adult video censoring system, and more particularly, to a system and a method for identifying an adult video by identifying audio included in a video.
정보 통신 기술의 급속한 발달로 인터넷을 통한 데이터 전송 속도가 하루가 다르게 빨라지고 있다. 이에 따라, 실시간 교육, 방송, 영화, 쇼핑 등을 위한 동영상 스트리밍 서비스와 함께 대용량 동영상 파일의 다운로드 서비스도 가능해졌다. With the rapid development of information and communication technology, the speed of data transmission over the Internet is getting faster every day. Accordingly, a video streaming service for real-time education, broadcasting, movies, shopping, etc., as well as a download service of a large video file, has become possible.
각종 동영상 서비스의 등장으로 양적 질적으로 인터넷 서비스가 향상되었다는 긍정적 측면도 있지만, 다른 한편으로는 웹하드 서비스와 연계한 파일공유서비스나 메신저 프로그램 등을 이용한 성인물 동영상의 불법 배포가 또 다른 사회적 이슈로 부각되고 있다.The emergence of various video services has positively indicated that the internet service has been improved quantitatively, but on the other hand, illegal distribution of adult videos using file sharing services or messenger programs linked with web hard services is emerging as another social issue. .
성인물 동영상은 합법적으로 제작된 것도 있지만, 대개는 외국에서 불법으로 제작되거나 화상 채팅 사이트나 사생활 공간 등에서 상대방의 동의 없이 불법으로 촬영된 것들이 대부분이다. 특히, 후자의 경우는 동영상 촬영 행위 자체가 불법일 뿐만 아니라, 동영상 파일이 인터넷을 통해 배포되었을 경우 피 촬영자에게 심대한 정신적 충격을 줄 수 있고 피 촬영자가 유명인인 경우는 사회적 파장까지 불러일으키는 문제가 있다. Adult videos are legally produced, but most of them are illegally made in foreign countries or illegally shot on a video chat site or private space without the consent of the other party. In particular, in the latter case, the act of shooting a movie itself is illegal, and when a video file is distributed through the Internet, it can cause a serious mental shock to the subject, and when the subject is a celebrity, it causes a social wave. .
또한, 최근에는 동영상 촬영이 가능한 디지털 카메라, 디지털 캠코더. 카메라 휴대폰 등이 보급됨에 따라, UCC(User Created Contents) 형태의성인물 동영상까지 가세하고 있어 성인물 동영상 문제가 더욱 심각해지고 있는 실정이다.In recent years, digital cameras and digital camcorders that can shoot video. As camera phones are spreading, adult video in the form of User Created Contents (UCC) is being added, and the problem of adult video is becoming more serious.
성인물 동영상은 미성년자인 청소년들의 정신건강에 악영향을 미친다는 점은 아무리 강조해도 지나치지 않다. 또한, 인터넷 포탈과 같이 공공성을 갖는 웹사이트를 통해 성인물 동영상이 배포될 경우, 웹사이트 운영자의 신뢰성과 도덕성에 심대한 타격을 준다. 따라서, 인터넷을 통해 배포되는 동영상이 성인물 동영상에 해당하는지 여부를 효과적으로 검열할 수 있는 기술이 절실히 요구되고 있다.It can not be overemphasized that adult video has an adverse effect on the mental health of minors. In addition, if adult video is distributed through a public website, such as an Internet portal, it severely impacts the reliability and morality of the website operator. Therefore, there is an urgent need for a technology that can effectively detect whether a video distributed through the Internet corresponds to an adult video.
종래의 성인물 동영상 검열 기술로는, 동영상 검열자가 동영상의 내용을 일일이 검사하여 성인물 동영상 여부를 판별하는 수동 검열 방식, 동영상의 색상(황색, 검은색, 백색 등)을 분석하여 특정 색상의 비중이 임계치를 넘어서면 성인물 동영상으로 판정하는 색상 검열 방식(한국공개특허 제2004-46537호), 각종 성인물 동영상의 해쉬값에 대한 DB를 구축한 후 검열 대상 동영상의 해쉬값과 DB에 기록된 해쉬값를 서로 비교하여 유사도가 임계치를 넘으면 성인물 동영상으로 판정하는 해쉬값 검열 방식(한국등록특허 제10-517645호) 등이 있다. In the conventional adult video censorship technology, the video censor inspects the contents of the video manually to determine whether the adult video or not, and by analyzing the color (yellow, black, white, etc.) of the video, the specific gravity of the specific color is thresholded. The color screening method (Korean Patent Laid-Open Patent No. 2004-46537) that judges the adult video when exceeding, builds a DB of hash values of various adult video and compares the hash value of the video to be inspected with the hash value recorded in the DB. Thus, if the similarity exceeds a threshold, a hash value screening method (Korean Patent No. 10-517645), etc., which is determined as an adult video.
그런데, 수동 검열 방식은 동영상 검열을 수행하는데 많은 시간이 소요되므 로 다량의 동영상 파일을 검열하는데 효과적이지 않다. 그리고, 색상 검열 방식은 동영상 촬영장소의 조명이나 연기자의 복장 등에 따라 검열 오차가 발생되어 신뢰성이 떨어지는 문제가 있다. 또한, 해쉬값 검열 방식은 성인물 동영상의 일부 클립을 따로 추출하여 2차적으로 편집하거나, 동영상 파일의 인코딩 환경, 예컨대 인코딩 알고리즘의 종류, 파일에 삽입되는 태그, 샘플링 비율, 비트율 등이 달라지면 검열이 제대로 이루어지지 않는 문제가 있다.However, the manual censoring method takes a lot of time to perform video censorship, so it is not effective for censoring a large number of video files. In addition, the color censoring method has a problem in that a censoring error occurs due to lighting of a moving picture photographing place or clothing of an actor, resulting in inferior reliability. In addition, the hash value detection method extracts a part of clips of an adult video separately and edits them secondly, or censors properly when the encoding environment of the video file, such as the type of encoding algorithm, the tag inserted in the file, the sampling rate, and the bit rate, is changed. There is a problem that is not made.
따라서, 본 발명은 상술한 종래 기술의 문제점을 해결하기 위하여 창안된 것으로서, 동영상 파일의 인코딩 환경에 의존하지 않으면서 동영상의 실질적 내용을 기반으로 한 신뢰성 높은 성인물 동영상 검열 시스템 및 방법을 제공하는데 그 목적이 있다.Accordingly, the present invention has been made to solve the above-mentioned problems of the prior art, and provides a reliable adult video screening system and method based on the actual content of a video without relying on the encoding environment of the video file. There is this.
본 발명의 다른 목적은, 복사된 성인물 동영상뿐만 아니라 동일한 오디오 스트림으로 제작된 다양한 포맷의 성인물 동영상에 대해서도 검열이 가능한 성인물 동영상 검열 시스템 및 방법을 제공하는데 있다. Another object of the present invention is to provide an adult video screening system and method capable of censoring not only copied adult video but also adult video of various formats produced by the same audio stream.
본 발명의 또 다른 목적은 2차적으로 편집된 성인물 동영상에 대해서도 검열이 가능한 시스템 및 방법을 제공하는데 있다.It is still another object of the present invention to provide a system and method capable of censoring secondary adult videos.
본 발명의 또 다른 목적은 다양한 동영상 서비스의 제공을 위한 동영상 데이터베이스의 구축시 동영상 검열자의 부담을 저감시킬 수 있는 성인물 동영상 검열 시스템 및 방법을 제공하는데 있다.Still another object of the present invention is to provide an adult video censoring system and method that can reduce the burden of video censorship when constructing a video database for providing various video services.
상기 기술적 과제를 달성하기 위한 본 발명에 따른 오디오 식별을 통한 성인물 동영상 검열 시스템은, 성인물 동영상 파일의 오디오 핑거프린트가 색인화되어 있는 성인물 동영상 색인 DB; 검열 대상 동영상 파일을 입력받는 파일 입력부 상기 입력된 동영상 파일에 포함된 오디오 데이터를 분석하여 오디오 핑거프린트를 추출하는 오디오 특징 추출부 및 상기 추출된 오디오 핑거프린트와 대응되는 오디오 핑거프린트가 상기 성인물 동영상 색인 DB에색인화되어 있는지 여부를 조회하여 상기 동영상 파일이 색인화된 성인물에 해당하는지 여부를 검열하는 성인물 동영상 검사부를 포함한다.In accordance with an aspect of the present invention, there is provided a system for censoring adult video through audio identification, comprising: an adult video index DB in which an audio fingerprint of an adult video file is indexed; A file input unit for receiving a censored video file, an audio feature extractor for analyzing an audio data included in the input video file, and extracting an audio fingerprint; and an audio fingerprint corresponding to the extracted audio fingerprint. And an adult video inspection unit for searching whether the video file corresponds to an indexed adult material by inquiring whether the DB is indexed or not.
바람직하게, 상기 성인물 동영상 검사부는, 추출된 오디오 핑거프린트와 임계치 이상의 유사도를 갖는 오디오 핑거프린트가 상기 성인물 동영상 색인 DB에 색인화되어 있는지 여부를 조회하여 상기 동영상 파일을 검열한다.Preferably, the adult video inspection unit inspects the video file by inquiring whether the extracted audio fingerprint and the audio fingerprint having a similarity or higher than a threshold are indexed in the adult video index DB.
본 발명에 따른 시스템은, 상기 검열 결과 동영상 파일이 색인화된 성인물이 아닌 것으로 판단되면, 동영상 파일내에 포함된 영상을 검열 관리자에게 표시하고, 검열 관리자로부터 동영상의 종류를 지정받는 관리자 검열부 및 상기 관리자 검열부를 통해 동영상 파일이 성인물인 것으로 지정되면 추출된 오디오 핑거프린트를 성인물 색인 DB에 신규로 색인화하는 동영상 색인부를 더 포함할 수 있다.The system according to the present invention, if it is determined that the video file is not an indexed adult material as a result of the censorship, and displays the image contained in the video file to the censorship manager, the manager censor and the manager to receive the type of the video from the censorship manager If the moving image file is designated as an adult through the censor, the extracted audio fingerprint may further include a moving image indexing unit for newly indexing the adult index DB.
본 발명의 일 측면에 따르면, 일반 동영상 파일의 오디오 핑거프린트가 색인화되어 있는 일반 동영상 색인DB; 및 상기 관리자 검열부를 통해 동영상 파일이 비 성인물인 것으로 지정되면, 추출된 오디오 핑거프린트와 대응되는 오디오 핑거프린트가 상기 일반 동영상 색인 DB에 색인화되어 있는지 여부를 조회하여 상기 동영상 파일이 색인화된 다른 일반 동영상과 중복되는지 여부를 검열하는 일반 동영상 검사부를 더 포함할 수 있다. 상기 검열 결과 동영상 파일이 색인화된 일반 동영상이 아닌 것으로 판단되면, 상기 동영상 색인부는 추출된 오디오 핑거프린트를 일반 동영상 색인 DB에신규로 색인화한다.According to an aspect of the present invention, there is provided a general video index DB in which an audio fingerprint of a general video file is indexed; And if the video file is designated as a non-adult through the manager censor, check whether the audio fingerprint corresponding to the extracted audio fingerprint is indexed in the general video index DB, and the other general video indexed with the video file. It may further include a general video inspection unit for inspecting whether or not overlap. If it is determined that the video file is not an indexed general video, the video indexing unit indexes the extracted audio fingerprint into a general video index DB.
본 발명의 다른 측면에 따르면, 일반 동영상 파일의 오디오 핑거프린트가 색인화되어 있는 일반 동영상 색인 DB; 및 추출된 오디오 핑거프린트와 대응되는 오디오 핑거프린트가 상기 일반 동영상 색인 DB에 색인화되어 있는지 여부를 검열하는 일반 동영상 검사부를 더 포함하고, 상기 성인물 동영상 검사부는 동영상 파일이 비 성인물로 판별되면 일반 동영상 검열 요청을 상기 일반 동영상 검사부로 출력하고, 상기 일반 동영상 검사부는 상기 검열 요청에 따라 일반 동영상 검열을 수행할 수 있다. According to another aspect of the invention, the general video index DB, the audio fingerprint of the general video file is indexed; And a general video inspecting unit for inspecting whether an audio fingerprint corresponding to the extracted audio fingerprint is indexed in the general video index DB. The adult video inspecting unit inspects the general video when the video file is determined to be non-adult. The request may be output to the general video inspecting unit, and the general video inspecting unit may perform general video inspecting according to the censoring request.
이런 경우, 상기 일반 동영상 검열 결과 동영상 파일이 색인화된 일반 동영상이 아닌 것으로 판단되면, 동영상 파일내에 포함된 영상을 검열 관리자에게 표시하고, 검열 관리자로부터 동영상의 종류를 지정받는 관리자 검열부 및 상기 관리자 검열부를 통해, 동영상 파일이 성인물인 것으로 지정되면 성인물 동영상 색인 DB에, 비 성인물인 것으로 지정되면 일반 동영상 색인 DB에 추출된 오디오 핑거프린트를 신규로 색인화하는 동영상 색인부를 더 포함할 수 있다. In this case, if it is determined that the video file is not an indexed general video as a result of the normal video censoring, the inspector inspecting unit and the inspector inspecting the video included in the video file to the censoring manager and receiving the type of video from the censoring manager The video file may further include a video index unit for newly indexing an audio fingerprint extracted from the adult video index DB if the video file is designated as an adult content and a general video index DB if the video file is designated as an adult content.
본 발명에 있어서, 상기 동영상 색인부는 추출된 오디오 핑거프린트의 신규 색인화시 동영상 파일의 헤더 및 메타 정보도 함께 색인화할 수 있다.In the present invention, the video index unit may also index the header and meta information of the video file when new indexing of the extracted audio fingerprint.
본 발명의 다른 기술적 과제는 상술한 오디오 식별을 통한 성인물 동영상 검 열 시스템의 동작 방법과 이 방법을 프로그램화하여 수록한 컴퓨터로 읽을 수 있는 기록매체에 의해서도 달성될 수 있다.Another technical problem of the present invention can be achieved by the above-described method of operating an adult video screening system through audio identification and a computer-readable recording medium that records the program.
이하 첨부된 도면을 참조로 본 발명의 바람직한 실시예를 상세히 설명하기로 한다. 이에 앞서, 본 명세서 및 청구범위에 사용된 용어나 단어는 통상적이거나 사전적인 의미로 한정해서 해석되어서는 아니되며, 발명자는 그 자신의 발명을 가장 최선의 방법으로 설명하기 위해 용어의 개념을 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야만 한다. 따라서, 본 명세서에 기재된 실시예와 도면에 도시된 구성은 본 발명의 가장 바람직한 일 실시예에 불과할 뿐이고 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형예들이 있을 수 있음을 이해하여야 한다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings. Prior to this, terms or words used in the specification and claims should not be construed as having a conventional or dictionary meaning, and the inventors should properly explain the concept of terms in order to best explain their own invention. Based on the principle that can be defined, it should be interpreted as meaning and concept corresponding to the technical idea of the present invention. Therefore, the embodiments described in the specification and the drawings shown in the drawings are only the most preferred embodiment of the present invention and do not represent all of the technical idea of the present invention, various modifications that can be replaced at the time of the present application It should be understood that there may be equivalents and variations.
도 1은 본 발명의 제1실시예에 따른 오디오 식별을 통한 성인물 동영상 검열시스템의 개략적인 구성을 도시한 블록도이다.1 is a block diagram showing a schematic configuration of a system for censoring adult video by audio identification according to a first embodiment of the present invention.
제1실시예에 따른 성인물 동영상 검열 시스템은, 파일 입력부(100), 오디오특징 추출부(110), 성인물 동영상 검사부(120), 관리자 검열부(130), 동영상 색인부(140), 일반 동영상 검사부(150), 성인물 동영상 색인 DB(160), 성인물 동영상 스토리지(170), 일반 동영상 색인 DB(180) 및 일반 동영상 스토리지(190)를 포함한다.Adult video screening system according to the first embodiment, the
상기 파일 입력부(100)는 검열 대상이 되는 동영상 파일을 입력받아 오디오 특징 추출부(110)로 전달한다. 여기서, 검열은 동영상 파일이 성인물에 해당하는지 여부를 판단하는 것을 말한다. 성인물은 청소년에게 유해한 영향을 미치는 음란물, 폭력물, 잔혹물 등 각종 유해 동영상을 의미한다. 동영상 파일은 mpeg, avi, mov 등의 동영상 전용 포맷을 가진다. 동영상 파일은 네트워크를 통해 전송된 파일이다. 일 예로, 동영상 파일은 유무선 인터넷을 통해 전송된 파일, 메일 수신을 통해 전송된 파일 또는 P2P 통신을 통해 전송된 파일이다. 대안적으로, 동영상 파일은 컴퓨터 스토리지 내에 저장된 파일이다. 후자의 경우, 상기 파일 입력부(100)는 검열 관리자가 적어도 하나 이상의 동영상 파일을 선택할 수 있는 사용자 인터페이스를 제공하는 것이 바람직하다. 사용자 인터페이스를 통해 선택된 동영상 파일은 검열 대상 파일로 선정된다. 본 발명에 따른 시스템이 설치될 수 있는 컴퓨터는 퍼스널 컴퓨터 또는 서버 컴퓨터이다. 서버 컴퓨터는 유무선 인터넷서비스가 가능한 콘텐츠 서버, 검색 포탈 서버, 메일 서버 등이다.The
상기 오디오 특징 추출부(110)는 동영상 파일에 포함된 오디오 데이터를 분석하여 오디오 핑거프린트를 추출한다. 여기서, 오디오 핑거프린트는 오디오 데이터를 배타적이고도 고유하게 식별할 수 있는 일종의 오디오 지문을 지칭한다. 바람직하게, 상기 오디오 특징 추출부(110)는 오디오 핑거프린트를 추출하기에 앞서 동영상 파일로부터 오디오 데이터만을 선택적으로 분리하는 과정을 선행한다.The
상기 오디오 특징 추출부(110)는 동영상 파일 내의 오디오 스트림을 분석하여 오디오 핑거프린트를 추출한다. 즉, 오디오 특징 추출부(110)는 동영상 파일 안에 포함된 오디오 데이터를 획득한 후 윈도우 분석을 통해 오디오 데이터를 프레임 단위로 분할한다. 그런 다음, 프레임별로 주파수 특성을 추출하기 위해 퓨리에 변 환을 수행한다. 상기 윈도우 분석시에는 Hamming/Hanning 윈도우 등을 사용할 수 있다. 이어서, 상기 오디오 특징 추출부(110)는 퓨리에 변환을 적용한 프레임 마다 파워 스펙트럼의 필터뱅크 출력의 에너지 시퀀스를 기반으로 주파수 및 시간축 필터링을 수행한 후 각 주파수 밴드 에너지에 대해 특정 임계값을 기준으로 비트를 할당하여 소정 비트수(예컨대, 32비트)의 오디오 핑거프린트를 생성한다. The
바람직하게, 상기 필터뱅크로는 인간의 청각 특성을 고려하기 위해 Mel/bark 스케일 필터뱅크를 사용한다. 하지만, 본 발명이 이에 한하는 것은 아니다. 한편, 주파수 및 시간축 필터링은 주파수 인접 밴드와 인접 프레임의 상관 관계를 최소화하기 위해 수행하는 것이다. 즉, 주파수 및 시간축 필터링은 인접 밴드 에너지의 차, 그리고 인접 프레임 사이의 차를 확대하여 상기 상관 관계를 최소화하기 위해 수행된다. 바람직하게, 상기 주파수 필터링은 에너지들의 상관도를 최소화할 수 있는 BPF(Band Pass Filter) 형태의 2차 FIR 필터 타입을 사용하여 수행하고, 상기 시간축 필터링은 채널 왜곡을 줄이기 위해 잘 알려진 RASTA 필터 타입을 사용하여 수행함으로써, 외부 잡음 및 채널 잡음에 강인한 오디오 핑거프린트를 추출할 수 있다. 하지만, 본 발명은 주파수 및 시간축 필터링의 방식에 의해 한정되는 것은 아니다.Preferably, the filter bank uses a Mel / bark scale filter bank in order to consider human hearing characteristics. However, the present invention is not limited thereto. On the other hand, frequency and time-base filtering are performed to minimize the correlation between the frequency adjacent band and the adjacent frame. That is, frequency and time base filtering is performed to minimize the correlation by enlarging the difference between adjacent band energies and the difference between adjacent frames. Preferably, the frequency filtering is performed using a second pass FIR filter type in the form of a band pass filter (BPF) that minimizes the correlation of energies, and the time-base filtering uses a well-known RASTA filter type to reduce channel distortion. By using it, an audio fingerprint robust to external noise and channel noise can be extracted. However, the present invention is not limited by the scheme of frequency and time base filtering.
상술한 오디오 핑거프린트 기법은 박만수씨의 논문 "Frequency-Temporal Filtering for a Robust Audio Fingerprinting Scheme in Real-Noise Environments "(ETRI Journal, vol.28, no.4, Aug.2006, pp509-512)에 개시되어 있다. 따라서, 상기 논문의 모든 내용은 본 발명의 구성의 일부로 통합될 수 있다. 한편, 본 발명 은 오디오 핑거프린트를 추출하는 구체적인 방식에 의해 한정되지 않으므로, 오디오 핑거프린트를 추출할 수 있는 알고리즘이라면 어떠한 것이라도 채용 가능하다. 일 예로, 상기 오디오 특징 추출부(110)는 일반적인 오디오 특징들을 적용하여 확률적 패턴 모델을 이용해 오디오 핑거프린트를 추출할 수도 있다. The above-described audio fingerprinting technique is disclosed in Park Man-soo's article "Frequency-Temporal Filtering for a Robust Audio Fingerprinting Scheme in Real-Noise Environments" (ETRI Journal, vol. 28, no.4, Aug. 2006, pp509-512). It is. Accordingly, all content of the article can be incorporated as part of the construction of the present invention. On the other hand, the present invention is not limited by the specific manner of extracting the audio fingerprint, any algorithm that can extract the audio fingerprint can be employed. For example, the
상기 성인물 동영상 검사부(120)는 오디오 특징 추출부(110)로부터 추출된 오디오 핑거프린트를 입력받는다. 그런 다음, 추출된 오디오 핑거프린트와 대응되는 오디오 핑거프린트가 성인물 동영상 색인 DB(160)에 색인화되어 있는지 조회함으로써 동영상 파일이 성인물에 해당하는지 여부를 검열한다. The adult
만약, 추출된 오디오 핑거프린트와 대응되는 오디오 핑거프린트가 존재하면 동영상 파일은 성인물에 해당하고, 반대로 추출된 오디오 핑거프린트와 대응되는 오디오 핑거프린트가 존재하지 않으면 동영상 파일은 적어도 색인화된 성인물에 해당하지 않는다. If there is an audio fingerprint corresponding to the extracted audio fingerprint, the video file corresponds to adult content. On the contrary, if there is no audio fingerprint corresponding to the extracted audio fingerprint, the video file corresponds to at least indexed adult content. Do not.
오디오 핑거프린트가 상호 대응되는 경우란 오디오 핑거프린트 사이의 유사도가 임계치를 초과하는 경우를 말한다. 따라서, 동영상 파일이 성인물로 판별된 경우는 추출된 오디오 핑거프린트와의 유사도가 임계치를 초과하는 오디오 핑거프리트가 상기 성인물 동영상 색인 DB(160)에 이미 색인화되어 있음을 의미한다. The case where the audio fingerprints correspond to each other means that the similarity between the audio fingerprints exceeds a threshold. Therefore, when the video file is determined to be adult, it means that an audio fingerprint of which similarity with the extracted audio fingerprint exceeds a threshold is already indexed in the adult video index DB 160.
여기서, 오디오 핑거프린트 간의 유사도 판단은 오디오 핑거프린트의 HD(Hamming Distance) 값을 기반으로 할 수 있다. 일 예로, 두 개의 파일 전구간에서 추출된 오디오 핑거프린트 시퀀스 사이에 HD 값이 '0'이 되는 핑거프린트의 비율을 기반으로 파일 간의 동일 여부를 판단할 수 있다. 대안적으로, 두 개의 파일 전구간에서 추출된 오디오 핑거프린트 시퀀스 사이의 전체 매칭을 통해 HD 값을 기준으로 전체 평균 BER(Bit Error Rate)를 계산하여 그 값을 기반으로 오디오 핑거프린트 간의 유사도를 판별할 수도 있다. 물론, 프레임마다 추출된 핑거프린트를 비교하기 때문에 2개의 파일의 시간적 순서는 고려되어야 한다. 반면에, 확률적 패턴 모델링 기법에서의 오디오 핑거프린트 간의 유사도 판단은 ED(Euclidean Distance), CAD(Cosine Angle Distance), SRE(Symmetric Relative Entropy) 등의 거리 척도 함수를 기반으로 할 수 있다.Here, the similarity determination between the audio fingerprints may be based on a Hamming Distance (HD) value of the audio fingerprint. As an example, it may be determined whether the files are identical based on the ratio of the fingerprints in which the HD value is '0' between the audio fingerprint sequences extracted between the two file sections. Alternatively, a full match between audio fingerprint sequences extracted between two file regions can be used to calculate the overall average bit error rate (BER) based on the HD value to determine similarity between audio fingerprints based on that value. It may be. Of course, the temporal order of the two files must be taken into account because the fingerprints extracted for each frame are compared. On the other hand, the similarity determination between audio fingerprints in the stochastic pattern modeling technique may be based on distance scale functions such as ED (Euclidean Distance), CAD (Cosine Angle Distance), and SRE (Symmetric Relative Entropy).
상기와 같이 오디오 핑거프린트를 이용하여 동영상 파일의 성인물 여부를 판별하면 효과적인 성인물 검열이 가능해진다. 동영상 파일로부터 추출된 오디오 핑거프린트가 이미 색인화되어 있는 오디오 핑거프린트와 동일하면 동영상 파일의 내용이 이미 성인물로 판별된 동영상과 오디오 스트림의 내용이 서로 동일하다는 것이고, 오디오 스트림이 서로 동일하면 검열 대상 동영상 파일을 성인물이라고 간주할 수 있기 때문이다.As described above, if an adult fingerprint of a video file is discriminated using an audio fingerprint, an effective adult substance censor is possible. If the audio fingerprint extracted from the video file is the same as the already-indexed audio fingerprint, then the video file has already been identified as adult and the content of the audio stream is the same. This is because files can be considered adult.
상기 성인물 동영상 검사부(120)는 파일입력부(100)를 통해 입력된 동영상 파일이 기 색인화된 성인물로 판별되면 동영상 파일의 색인화 작업을 생략한다. 대신, 성인물 동영상 색인 DB(160) 및 성인물 동영상 스토리지(170)의 별도 저장 공간에 추출된 오디오 핑거프린트와 동영상 파일을 각각 저장할 수 있다. 상기 별도 저장 공간은 성인물 동영상 색인 DB(160) 및 성인물 동영상 스토리지(170)와는 별도의 DB 및 스토리지에 설정될 수도 있음은 자명하다.The adult
상기 성인물 동영상 검사부(120)는 오디오 핑거프린트를 기반으로 한 동영상 파일의 검열 결과, 동영상 파일이 기 색인화된 성인물이 아닌 것으로 판단되면, 관리자 검열부(130)와 연동하여 검열 관리자에 의한 수동 검열 과정을 선택적으로 진행할 수 있다.When the adult
즉, 관리자 검열부(130)는 성인물 동영상 검사부(120)로부터 동영상 파일에 대한 수동 검열을 요청받는다. 그러면, 관리자 검열부(130)는 색인화된 성인물이 아닌 것으로 판단된 동영상 파일을 검열 관리자에게 시각적으로 표시한 후 검열 관리자로부터 동영상의 종류를 지정받는다. That is, the
동영상 파일의 시각적 표시는 동영상 파일을 재생하거나 동영상 파일로부터 일정한 프레임 간격으로 동영상의 정지 영상을 캡쳐하여 연속적으로 나열하는 방식에 의해 이루어질 수 있다. 후자의 표시 방식은 동영상의 전체 내용을 한눈에 확인할 수 있으므로 소요되는 동영상 검열 시간이 작다는 이점이 있다. 하지만, 본 발명은 동영상 파일의 시각적 표시 방식에 의해 한정되는 것은 아니다.The visual display of the moving image file may be performed by playing the moving image file or capturing and continuously arranging still images of the moving image at regular frame intervals from the moving image file. The latter display method has the advantage that the video censoring time required is small because the entire contents of the video can be checked at a glance. However, the present invention is not limited to the visual display method of the video file.
상기 관리자 검열부(130)는 검열 관리자가 동영상 파일의 종류를 어떻게 지정하느냐에 따라 다음과 같은 프로세스를 진행할 수 있다. 즉, 검열 관리자가 동영상 파일을 성인물로 지정하면, 관리자 검열부(130)는 동영상 색인부(140)로 동영상 파일의 신규 색인화를 요청한다. 그러면, 동영상 색인부(140)는 동영상 파일로부터 추출된 오디오 핑거프린트를 성인물 동영상 색인 DB(160)에 신규로 색인화한다. 나아가, 성인물 동영상 스토리지(170)에 색인화된 동영상 파일을 저장한다. 한편, 필수적인 것은 아니지만, 동영상 색인부(140)는 오디오 핑거프린트의 색인화시 동영상 파일로부터 추출된 헤더 및 메타 정보도 함께 색인화할 수 있다.The
반대로, 검열 관리자가 동영상 파일을 일반 동영상으로 지정하면, 관리자 검열부(130)는 동영상 색인부(140)로 일반 동영상으로서의 신규 색인화를 요청한다. 그러면, 동영상 색인부(140)는 동영상 파일로부터 추출된 오디오 핑거프린트를 일반 동영상 색인 DB(180)에 신규로 색인화한다. 나아가, 일반 동영상 스토리지(190)에 색인화된 동영상 파일을 저장한다. 한편, 필수적인 것은 아니지만, 동영상 색인부(140)는 오디오 핑거프린트의 색인화시 동영상 파일로부터 추출된 헤더 및 메타 정보도 함께 색인화할 수 있다.On the contrary, if the censorship manager designates a video file as a normal video, the
상기한 바와 달리, 상기 관리자 검열부(130)는 동영상 파일이 일반 동영상으로 지정된 경우, 동영상 파일의 DB 색인화 및 스토리지 저장에 앞서 파일 중복 검열 절차를 진행할 수 있다. 즉, 관리자 검열부(130)는 검열 관리자가 동영상 파일을 일반 동영상으로 지정하면, 일반 동영상 검사부(150)로 파일 중복 검열을 요청한다. 그러면, 일반 동영상 검사부(150)는 동영상 파일로부터 추출된 오디오 핑거프린트와 대응되는 오디오 핑거프린트가 일반 동영상 색인 DB(180)에 색인화되어 있는지 여부를 조회하여 파일 중복 검열을 수행한다. 여기서, 오디오 핑거프린트 간의 대응 개념은 이미 상술하였다.Unlike the above description, when the video file is designated as a normal video, the
파일 중복 검열 결과, 추출된 오디오 핑거프린트가 일반 동영상 색인 DB(180)에 색인화되어 있지 않은 것으로 판단되면, 상기 일반 동영상 검사부(150)는 동영상 색인부(140)로 동영상 파일의 신규 색인화를 요청한다. 이에 따라, 동영상 색인부(140)는 추출된 오디오 핑거프린트를 일반 동영상 색인 DB(180)에 신규로 색인화하고 동영상 파일을 일반 동영상 스토리지(190)에 저장한다. As a result of file duplication inspection, if it is determined that the extracted audio fingerprint is not indexed in the general
반대로, 추출된 오디오 핑거프린트가 일반 동영상 색인 DB(180)에 이미 색인화되어 있는 것으로 판단되면, 상기 일반 동영상 검사부(150)는 동영상 파일과 내용이 실질적으로 중복되는 동영상 파일이 일반 동영상 스토리지(190)에 저장되어 있는 것으로 간주한다. 이런 경우, 오디오 핑거프린트의 DB 색인화 및 일반 동영상 스토리지 저장을 생략한다. 대신, 일반 동영상 색인 DB(180) 및 일반 동영상 스토리지(190)의 별도 저장 공간에 추출된 오디오 핑거프린트와 동영상 파일을 각각 저장할 수 있다. 상기 별도 저장 공간은 일반 동영상 색인DB(180) 및 성인물 동영상 스토리지(190)와는 별도의 DB 및 스토리지에 설정될 수도 있음은 자명하다.On the contrary, if it is determined that the extracted audio fingerprint is already indexed in the general
도 2는 본 발명의 제2실시예에 따른 오디오 식별을 통한 성인물 동영상 검열시스템의 개략적인 구성을 도시한 블록도이다.2 is a block diagram illustrating a schematic configuration of a system for censoring adult video by audio identification according to a second embodiment of the present invention.
제2실시예예 따른 성인물 동영상 검열 시스템은 상술한 제1실시예에 따른 시스템과 동일한 구성을 포함하되, 성인물 동영상 검사부(120), 관리자 검열부(130) 및 일반 동영상 검사부(150)의 배치 순서가 서로 다르다. The adult video screening system according to the second embodiment includes the same configuration as the system according to the first embodiment described above, the arrangement order of the adult
즉, 제1실시예에서는 성인물 동영상 검사부(120), 관리자 검열부(130) 및 일반 동영상 검사부(150)의 순으로 구성요소가 배치되었지만, 제2실시예에서는 성인물 동영상 검사부(120), 일반 동영상 검사부(150) 및 관리자 검열부(130)의 순으로 구성요소가 배치된다. 따라서, 제2실시예에 따른 성인물 동영상 검열 시스템은 성인물 동영상 검열과 파일 중복 검열을 연속적으로 실시하고 검열 관리자에 의한 수동 검열을 마지막으로 수행한다. That is, in the first embodiment, the components are arranged in order of the adult
구체적으로, 상기 성인물 동영상 검사부(120)는 성인물 동영상 색인DB(160) 를 조회한 결과 동영상 파일로부터 추출된 오디오 핑거프린트가 기 색인화된 오디오 핑거프린트가 아닌 것으로 판단되면, 일반 동영상 검사부(150) 측에 일반 동영상을 기준으로 한 파일 중복 검열을 요청한다. Specifically, when the adult
그러면, 일반 동영상 검사부(150)는 동영상 파일로부터 추출된 오디오 핑거프린트와 대응되는 오디오 핑거프린트가 일반 동영상 색인 DB(180)에 색인화되어 있는지 여부를 조회하여 파일 중복 검열을 수행한다. Then, the general
파일 중복 검열 결과, 추출된 오디오 핑거프린트가 일반 동영상 색인 DB(180)에 이미 색인화되어 있는 것으로 판단되면, 상기 일반 동영상 검사부(150)는 동영상 파일과 내용이 실질적으로 중복되는 동영상 파일이 일반 동영상 스토리지(190)에 저장되어 있는 것으로 간주한다. 이런 경우, 오디오 핑거프린트의 DB 색인화 및 동영상 파일의 스토리지 저장을 생략한다. 대신, 일반 동영상 색인 DB(180) 및 일반 동영상 스토리지(190)의 별도 저장 공간에 추출된 오디오 핑거프린트와 동영상 파일을 각각 저장할 수 있다. 상기 별도 저장 공간은 일반 동영상 색인 DB(180) 및 일반 동영상 스토리지(190)와는 별도의 DB 및 스토리지에 설정될 수도 있음은 자명하다.As a result of file duplication inspection, if it is determined that the extracted audio fingerprint is already indexed in the general
반면, 추출된 오디오 핑거프린트가 일반 동영상 색인 DB(180)에 색인화되어 있지 않은 것으로 판단되면, 상기 일반 동영상 검사부(150)는 관리자 검열부(130) 측에 검열 관리자에 의한 수동 검열을 요청한다. 그러면, 관리자 검열부(130)는 동영상 파일을 검열 관리자에게 시각적으로 표시한 후 검열 관리자로부터 동영상 종류를 지정받는다. 여기서, 동영상 파일의 시각적 표시 방식은 이미 상술한 바 있 다.On the other hand, if it is determined that the extracted audio fingerprint is not indexed in the general
검열 관리자가 동영상 파일을 성인물로 지정하면, 관리자 검열부(130)는 동영상 색인부(140)로 동영상 파일의 신규 색인화를 요청한다. 그러면, 동영상 색인부(140)는 동영상 파일로부터 추출된 오디오 핑거프린트를 성인물 동영상 색인 DB(160)에 신규로 색인화한다. 나아가, 성인물 동영상 스토리지(170)에 색인화된 동영상 파일을 저장한다. 한편, 필수적인 것은 아니지만, 동영상 색인부(140)는 오디오 핑거프린트의 색인화시 동영상 파일로부터 추출된 헤더 및 메타 정보도 함께 색인화할 수 있다.If the censorship manager designates the video file as adult content, the
반대로, 검열 관리자가 동영상 파일을 일반 동영상으로 지정하면, 관리자 검열부(130)는 동영상 색인부(140)측에 일반 동영상으로서의 신규 색인화를 요청한다. 그러면, 동영상 색인부(140)는 동영상 파일로부터 추출된 오디오 핑거프린트를 일반 동영상 색인 DB(180)에 신규로 색인화한다. 나아가, 일반 동영상 스토리지(190)에 색인화된 동영상 파일을 저장한다. 한편, 필수적인 것은 아니지만, 동영상 색인부(140)는 오디오 핑거프린트의 색인화시 동영상 파일로부터 추출된 헤더 및 메타 정보도 함께 색인화할 수 있다.On the contrary, if the censorship manager designates a video file as a normal video, the
상술한 제2실시예에 따른 성인물 동영상 검열 시스템은 성인물 동영상 검열과 파일 중복 검열을 연속적으로 실시한 후 검열 관리자에 의한 수동 검열을 수행하므로, 제1실시예에 비해 검열 관리자의 부담을 줄일 수있는 장점이 있다.The adult video censoring system according to the second embodiment described above performs the manual censoring by the censorship manager after continuously performing adult video censorship and file duplication censoring, and thus reduces the burden on the censorship manager compared to the first embodiment. There is this.
도 3 및 도 4는 본 발명의 제1실시예에 따른 오디오 식별을 통한 성인물 동영상 검열 시스템의 동작 방법을 도시한 절차 흐름도이다. 각 단계의 실행 주체는 도 1에 도시된 성인물 동영상 검열 시스템이다.3 and 4 are flowcharts illustrating a method of operating an adult video censoring system through audio identification according to a first embodiment of the present invention. The execution subject of each step is the adult video screening system shown in FIG.
먼저, 다량의 성인물 동영상 파일의 오디오 핑거프린트가 색인화되어 있는 성인물 동영상 색인 DB와 다량의 일반 동영상 파일의 오디오 핑거프린트가 색인화되어 있는 일반 동영상 색인 DB를 제공한다(S101 단계). First, an adult video index DB in which audio fingerprints of a large amount of adult video files are indexed and a general video index DB in which audio fingerprints of a plurality of general video files are indexed are provided (step S101).
이어서, 성인물 동영상 색인 DB가 제공된 상태에서 검열 대상이 되는 동영상 파일을 입력받는다(S102 단계). 동영상 파일은 네트워크를 통하여 입력받거나 컴퓨터 내부의 스토리지로부터 입력받는다.Subsequently, in response to the adult video index DB being provided, the video file to be inspected is input (step S102). Video files can be input via the network or from storage inside the computer.
그런 다음, 입력된 동영상 파일에서 오디오 스트림을 분리한다(S103 단계). 그러고 나서, 분리된 오디오 스트림을 분석하여 오디오 핑거프린트를 추출한다(S104 단계). 오디오 핑거프린트의 추출 방법은 이미 상술하였다.Then, the audio stream is separated from the input video file (step S103). Then, the separated audio stream is analyzed to extract an audio fingerprint (step S104). The extraction method of the audio fingerprint has already been described above.
그 다음, 성인물 동영상 색인 DB를 조회하여 추출된 오디오 핑거프린트와 대응되는 오디오 핑거프린트가 상기 성인물 동영상 색인 DB에 색인화되어 있는지 판단한다(S105 단계).Next, the adult video index DB is queried to determine whether an audio fingerprint corresponding to the extracted audio fingerprint is indexed in the adult video index DB (S105).
S105 단계에서의 판단 결과, 대응하는 오디오 핑거프린트가 색인화되어 있으면 동영상 파일을 성인물로 판별하여 추출된 오디오 핑거프린트의 신규 색인화와 동영상 파일의 스토리지 저장을 생략한다(S106 단계). 그런 다음, 동영상 파일에 대한 성인물 동영상 검열 절차를 종료한다. 대안적으로, 추출된 오디오 핑거프린트와 동영상 파일을 성인물 동영상 색인 DB 및 성인물 동영상 스토리지에 할당된 별도의 저장공간으로 이동시킨 후 동영상 파일에 대한 성인물 동영상 검열 절차를 종료한다.As a result of the determination in step S105, if the corresponding audio fingerprint is indexed, the moving image file is identified as adult material, and new indexing of the extracted audio fingerprint and storage storage of the moving image file are omitted (step S106). Then, the adult video censoring procedure for the video file ends. Alternatively, the extracted audio fingerprint and the video file are moved to separate storage spaces allocated to the adult video index DB and the adult video storage, and the adult video censoring procedure for the video file is terminated.
반대로, 대응되는 오디오 핑거프린트가 색인화되어 있지 않으면, 동영상 파일에 포함된 영상을 검열 관리자에게 표시한다(S107 단계). 영상의 표시는 동영상 파일을 재생하는 방식 또는 일정한 프레임 간격으로 동영상의 정지 영상을 캡쳐하여 연속적으로 나열하는 방식에 의한다. In contrast, if the corresponding audio fingerprint is not indexed, an image included in the moving image file is displayed to the censoring manager (step S107). The display of an image may be based on a method of playing a moving image file or a method of capturing and continuously arranging still images of a moving image at regular frame intervals.
이어서, 검열 관리자로부터 표시된 동영상의 종류를 지정받아 동영상의 종류를 판단한다(S108 단계). 판단 결과, 동영상의 종류가 성인물이면 추출된 오디오 핑거프린트를 성인물 동영상 색인 DB에 신규로 색인화하고 동영상 파일을 스토리지에 신규로 저장한다(S109 단계). 오디오 핑거프린트의 신규 색인화시 동영상 파일의 헤더와 메타 정보도 함께 색인화할 수 있다. 반대로, 동영상의 종류가 성인물이 아니면, 일반 동영상 색인 DB를 조회하여 추출된 오디오 핑거프린트와 대응되는 오디오 핑거프린트가 상기 일반 동영상 색인 DB에 색인화되어 있는지 판단하여 중복 파일 검열을 수행한다(S110 단계).Subsequently, the type of the moving image is determined by the type of the moving image displayed by the censorship manager (step S108). As a result of the determination, if the type of the video is adult, the extracted audio fingerprint is newly indexed in the adult video index DB, and the video file is newly stored in the storage (step S109). When indexing an audio fingerprint, the header and meta information of the video file can be indexed together. On the contrary, if the type of the video is not adult content, the normal video index DB is searched to determine whether the audio fingerprint corresponding to the extracted audio fingerprint is indexed in the general video index DB and then duplicate file inspection is performed (step S110). .
S110 단계에서의 중복 파일 검열 결과, 대응하는 오디오 핑거프린트가 색인화되어 있으면 동영상 파일을 중복된 일반 동영상으로 판별하여 추출된 오디오 핑거프린트의 신규 색인화와 동영상 파일의 스토리지 저장을 생략한다(S111 단계). 그런 다음, 중복 파일 검열 절차를 종료한다. 대안적으로, 추출된 오디오 핑거프린트와 동영상 파일을 일반 동영상 색인 DB 및 일반 동영상 스토리지에 할당된 별도의 저장공간으로 이동시킨 후 중복 파일 검열 절차를 종료할 수 있다.As a result of the duplicate file inspection in step S110, if the corresponding audio fingerprint is indexed, the moving image file is identified as a duplicate general moving image, and new indexing of the extracted audio fingerprint and storage storage of the moving image file are omitted (step S111). Then, the duplicate file inspection process is terminated. Alternatively, the extracted audio fingerprint and the video file may be moved to separate storage spaces allocated to the general video index DB and the general video storage, and then the duplicate file screening process may be terminated.
반대로, 대응하는 오디오 핑거프린트가 색인화되어 있지 않으면 동영상 파일을 새로운 일반 동영상으로 판별하여 추출된 오디오 핑거프린트를 일반 동영상 색 인 DB에 신규로 색인화하고 동영상 파일을 일반 동영상 스토리지에 신규 저장한다(S112). 오디오 핑거프린트의 신규 색인화시 동영상 파일의 헤더와 메타 정보도 함께 색인화할 수 있다.On the contrary, if the corresponding audio fingerprint is not indexed, the video file is identified as a new general video, the extracted audio fingerprint is newly indexed in the general video index DB, and the video file is newly stored in the general video storage (S112). . When indexing an audio fingerprint, the header and meta information of the video file can be indexed together.
위와 같이, 성인물 동영상 검열, 검열 관리자에 의한 수동 검열 및 일반 동영상을 기준으로 한 파일 중복 검열 과정이 종료되면, 본 발명의 제1실시예에 따른 성인물 동영상 검열 방법의 전 과정이 완료된다.As described above, when the adult video censorship, manual censoring by the censorship manager and the file duplication screening process based on the general video are finished, the entire process of the adult video censoring method according to the first embodiment of the present invention is completed.
도 5 및 도 6은 본 발명의 제2실시예에 따른 오디오 식별을 통한 성인물 동영상 검열 시스템의 동작 방법을 도시한 절차 흐름도이다. 각 단계의 실행 주체는 도 2에 도시된 성인물 동영상 검열 시스템이다.5 and 6 are flowcharts illustrating a method of operating an adult video censoring system through audio identification according to a second embodiment of the present invention. The execution subject of each step is the adult video screening system shown in FIG.
도면에 도시된 바와 같이, 성인물 동영상 색인 DB와 일반 동영상 색인 DB를 제공하는 단계(S101 단계), 검열 대상 동영상 파일을 입력받는 단계(S102 단계), 동영상 파일로부터 오디오 스트림을 분리하는 단계(S103 단계), 분리된 오디오 스트림으로부터 오디오 핑거프린트를 추출하는 단계(S104 단계), 성인물 동영상 색인 DB를 이용하여 동영상을 검열하는 단계(S105 단계), 및 동영상 파일이 성인물로 판별되었을 때 추출된 오디오 핑거프린트의 신규 색인화와 동영상 파일의 스토리지 저장을 생략하는 단계(S106 단계)는 상술한 제1실시예에 따른 성인물 동영상 검열 방법과 실질적으로 동일하다. 하지만, 동영상 파일이 성인물로 판별되지 않은 경우 진행되는 후속 프로세스는 제1실시예와 상이하다.As shown in the figure, providing an adult video index DB and a general video index DB (step S101), receiving a censored video file (step S102), and separating an audio stream from the video file (step S103). ), Extracting the audio fingerprint from the separated audio stream (step S104), censoring the video using the adult video index DB (step S105), and extracting the audio fingerprint when the video file is determined to be adult Omitting the new indexing and storage storage of the video file (step S106) is substantially the same as the adult video clip detection method according to the first embodiment described above. However, if the video file is not determined to be adult, the subsequent process is different from that of the first embodiment.
즉, S105 단계에서 동영상 파일이 성인물로 판별되지 않으면, 일반 동영상 색인 DB를 조회하여 추출된 오디오 핑거프린트와 대응되는 오디오 핑거프린트가 상 기 일반 동영상 색인 DB에 색인화되어 있는지 판단하여 중복 파일 검열을 수행한다(S113 단계).That is, if the video file is not determined as adult in step S105, the general video index DB is searched to determine whether the audio fingerprint corresponding to the extracted audio fingerprint is indexed in the general video index DB, and then duplicate file inspection is performed. (Step S113).
S113 단계에서의 중복 파일 검열 결과, 대응하는 오디오 핑거프린트가 색인화되어 있으면 동영상 파일을 중복된 일반 동영상으로 판별하여 추출된 오디오 핑거프린트의 신규 색인화와 동영상 파일의 스토리지 저장을 생략한다(S114 단계). 대안적으로, 추출된 오디오 핑거프린트와 동영상 파일을 일반 동영상 색인 DB 및 일반 동영상 스토리지에 할당된 별도의 저장공간으로 이동시킬 수 있다. As a result of the duplicate file inspection in step S113, if the corresponding audio fingerprint is indexed, the moving image file is identified as a duplicate general moving image, and new indexing of the extracted audio fingerprint and storage storage of the moving image file are omitted (step S114). Alternatively, the extracted audio fingerprint and the video file may be moved to separate storage spaces allocated to the general video index DB and the general video storage.
반대로, 대응되는 오디오 핑거프린트가 색인화되어 있지 않으면 동영상 파일에 포함된 영상을 검열 관리자에게 표시한다(S115 단계). 영상의 표시는 동영상 파일을 재생하는 방식 또는 일정한 프레임 간격으로 동영상의 정지 영상을 캡쳐하여 연속적으로 나열하는 방식에 의한다. On the contrary, if the corresponding audio fingerprint is not indexed, an image included in the video file is displayed to the censoring manager (step S115). The display of an image may be based on a method of playing a moving image file or a method of capturing and continuously arranging still images of a moving image at regular frame intervals.
이어서, 검열 관리자로부터 표시된 동영상의 종류를 지정받아 동영상의 종류를 판단한다(S116 단계). 판단 결과, 동영상의 종류가 성인물이면 추출된 오디오 핑거프린트를 성인물 동영상 색인 DB에 신규로 색인화하고 동영상 파일을 성인물 동영상 스토리지에 신규로 저장한다(S117 단계). 반대로, 동영상의 종류가 일반 동영상이면 추출된 오디오 핑거프린트를 일반 동영상 색인 DB에 신규로 색인화하고 동영상 파일을 일반 동영상 스토리지에 신규 저장한다(S118). 오디오 핑거프린트의 신규 색인화시 동영상 파일의 헤더와 메타 정보도 함께 색인화할 수 있다. Subsequently, the type of the moving image is determined by the type of the moving image displayed by the censorship manager (step S116). As a result, if the type of the video is adult, the extracted audio fingerprint is newly indexed in the adult video index DB, and the video file is newly stored in the adult video storage (step S117). On the contrary, if the type of video is a normal video, the extracted audio fingerprint is newly indexed in the general video index DB and the video file is newly stored in the general video storage (S118). When indexing an audio fingerprint, the header and meta information of the video file can be indexed together.
위와 같이, 성인물 동영상 검열, 일반 동영상을 기준으로 한 파일 중복 검열 및 검열 관리자에 의한 수동 검열 과정이 종료되면, 본 발명의 제2실시예예 따른 성인물 동영상 검열 방법의 전 과정이 완료된다.As described above, when censoring adult video, duplicate file censoring based on a general video, and manual censoring by the censorship manager are completed, the entire process of censoring adult video according to the second embodiment of the present invention is completed.
본 발명에 따른 성인물 동영상 검열 시스템의 동작 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터에 의해 판독 가능한 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합으로 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 프로그램 분야의 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예로는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media) 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 상기 매체는 프로그램 명령, 데이터 구조 등을 지정하는 신호를 전송하는 반송파를 포함하는 광 또는 금속선, 도파관 등의 전송 매체일 수도 있다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급언어 코드를 포함한다. 상기한 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 동작하도록 구성될 수 있으며, 그 역도 마찬가지이다. The operation method of the adult movie screening system according to the present invention is implemented in the form of program instructions that can be executed by various computer means can be recorded in a computer-readable medium. The computer readable medium may include program instructions, data files, data structures, etc. alone or in combination. Program instructions recorded on the media may be those specially designed and constructed for the purposes of the present invention, or they may be of the kind well-known and available to those skilled in the computer program arts. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks, and magnetic tape, optical media such as CD-ROMs, DVDs, and magnetic disks, such as floppy disks. Hardware devices specially configured to store and execute program instructions such as magneto-optical media and ROM, RAM, flash memory and the like. The medium may be a transmission medium such as an optical or metal wire, a waveguide, or the like including a carrier wave for transmitting a signal specifying a program command, a data structure, or the like. Examples of program instructions include machine code, such as produced by a compiler, as well as high-level language code that can be executed by a computer using an interpreter. Such hardware devices may be configured to operate as one or more software modules to perform the operations of the present invention, and vice versa.
도 7은 본 발명에 따른 성인물 동영상 검열 시스템의 동작 방법을 수행하는데 채용될 수 있는 범용 컴퓨터 시스템의 내부 블록도이다.7 is an internal block diagram of a general-purpose computer system that may be employed to perform the method of operation of the adult movie inspection system according to the present invention.
상기 범용 컴퓨터 시스템(400)은 램(RAM: 420)과 롬(ROM: 430)을 포함하는 주기억장치와 연결되는 하나 이상의 프로세서(410)를 포함한다. 프로세서(410)는 중앙처리장치(CPU)로 불리기도 한다. 본 기술분야에서 널리 알려진 바와 같이, 롬(430)은 데이터와 명령을 단방향성으로 프로세서(410)에 전송하는 역할을 하며, 램(420)은 통상적으로 데이터와 명령을 양방향성으로 프로세서(410)로 전송하는데 사용된다. 램(420) 및롬(430)은 컴퓨터 판독 가능 매체의 어떠한 적절한 형태를 포함할 수 있다. 대용량 기억장치(440)는 양방향성으로 프로세서(410)와 연결되어 추가적인 데이터 저장 능력을 제공하며, 상기된 컴퓨터 판독 가능 기록 매체 중 어떠한 것일 수 있다. 대용량 기억장치(440)는 프로그램, 데이터 등을 저장하는데 사용되며, 통상적으로 주기억장치보다 속도가 느린 하드 디스크와 같은 보조기억장치이다. CD롬(460)과 같은 특정 대용량 기억장치가 사용될 수도 있다. 프로세서(410)는 비디오 모니터, 트랙볼 마우스, 키보드, 마이크로폰, 터치스크린 형 디스플레이, 카드 판독기, 자기 또는 종이 테이프 판독기, 음성 또는 필기 인식기, 조이스틱 또는 기타 공지된 컴퓨터 입출력 장치와 같은 하나 이상의 입출력 인터페이스(450)와 연결된다. 마지막으로, 프로세서(410)는 네트워크 인터페이스(470)를 통하여 유선 또는 무선 통신 네트워크에 연결될 수 있다. 이러한 네트워크 연결을 통하여 상기된 방법의 절차를 수행할 수 있다. 상기된 장치 및 도구는 컴퓨터 하드웨어 및 소프트웨어 기술 분야의 당업자에게 잘 알려져 있다. 한편, 상기된 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 동작하도록 구성될 수 있다.The general
이상과 같이, 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 이것에 의해 한정되지 않으며 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 본 발명의 기술사상과 아래에 기재될 특허청구범위의 균등범위 내에서 다양한 수정 및 변형이 가능함은 물론이다.As described above, although the present invention has been described by way of limited embodiments and drawings, the present invention is not limited thereto and is intended by those skilled in the art to which the present invention pertains. Of course, various modifications and variations are possible within the scope of equivalents of the claims to be described.
본 발명에 따르면, 오디오의 내용을 기반으로 성인물 동영상을 검열하므로 성인물을 효과적으로 차단할 수 있다. 특히, 영상의 색상 등을 분석하여 성인물을 검열하던 종래기술에 비해 시스템의 로드가 작고 검열 오차를 더욱 줄일 수 있다. 또한, 오디오 스트림의 내용만 동일하면 동영상 파일의 인코딩 환경이 달라지거나 동영상 파일이 2차적으로 편집되더라도 성인물 동영상의 검열이 가능하다. 나아가, 성인물 동영상의 색인화가 지속적으로 이루어지므로, 동영상 서비스 제공을 위한 동영상 데이터베이스의 구축시 색인화된 성인물 동영상의 수에 비례하여 검열 관리자의 부담을 지속적으로 줄여나갈 수 있다. 또한, 성인물 동영상 검열과 파일 중복 검열을 통합시킴으로써 스토리지 공간의 효율적 사용이 가능해진다. According to the present invention, since adult content videos are censored based on the content of audio, adult content can be effectively blocked. In particular, the load of the system is smaller and the detection error can be further reduced compared to the conventional technology of analyzing the color of the image and the like to censor adult material. In addition, if the contents of the audio stream are the same, the adult video can be inspected even if the encoding environment of the video file is changed or the video file is secondarily edited. Furthermore, since the indexing of the adult video is continuously performed, the burden of the censorship manager can be continuously reduced in proportion to the number of the adult video indexed in the construction of the video database for providing the video service. In addition, the use of storage space can be achieved by integrating adult video screening and file duplication screening.
Claims (28)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020070048252A KR100930869B1 (en) | 2007-05-17 | 2007-05-17 | System and method for screening adult video through audio identification |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020070048252A KR100930869B1 (en) | 2007-05-17 | 2007-05-17 | System and method for screening adult video through audio identification |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20090001760A true KR20090001760A (en) | 2009-01-09 |
KR100930869B1 KR100930869B1 (en) | 2009-12-10 |
Family
ID=40484809
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020070048252A KR100930869B1 (en) | 2007-05-17 | 2007-05-17 | System and method for screening adult video through audio identification |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100930869B1 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101315970B1 (en) | 2012-05-23 | 2013-10-08 | (주)엔써즈 | Apparatus and method for recognizing content using audio signal |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100595032B1 (en) * | 2004-05-27 | 2006-06-30 | 대덕대학산학협력단 | Selective Analysis Method of Image |
KR100628313B1 (en) * | 2004-11-25 | 2006-09-27 | 한국전자통신연구원 | Method for selective detecting of harmful information in internet-specific application programs and apparatus thereof |
KR20060061682A (en) * | 2004-12-02 | 2006-06-08 | 주식회사 대우일렉트로닉스 | Method for restricting output of image |
KR100733145B1 (en) * | 2005-09-15 | 2007-06-27 | 한국과학기술원 | Fingerprint Producing Method and Audio Fingerprinting System Based on Normalized Spectral Subband Centroids |
-
2007
- 2007-05-17 KR KR1020070048252A patent/KR100930869B1/en active IP Right Grant
Also Published As
Publication number | Publication date |
---|---|
KR100930869B1 (en) | 2009-12-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2301246B1 (en) | Video fingerprint systems and methods | |
US8347408B2 (en) | Matching of unknown video content to protected video content | |
CN110324729B (en) | Method, device, electronic equipment and medium for identifying infringement video link | |
Zhang et al. | Efficient video frame insertion and deletion detection based on inconsistency of correlations between local binary pattern coded frames | |
Poisel et al. | Forensics investigations of multimedia data: A review of the state-of-the-art | |
EP2608107A2 (en) | System and method for fingerprinting video | |
US20090327334A1 (en) | Generating Measures of Video Sequences to Detect Unauthorized Use | |
Teyssou et al. | The InVID plug-in: web video verification on the browser | |
Fadl et al. | Authentication of surveillance videos: detecting frame duplication based on residual frame | |
RU2677368C1 (en) | Method and system for automatic determination of fuzzy duplicates of video content | |
US20170185675A1 (en) | Fingerprinting and matching of content of a multi-media file | |
TWI793657B (en) | Apparatus and method for filtering harmful video file | |
Fadl et al. | Surveillance video authentication using universal image quality index of temporal average | |
CN111914649A (en) | Face recognition method and device, electronic equipment and storage medium | |
KR100930529B1 (en) | Harmful video screening system and method through video identification | |
AlZahrani et al. | Forensic analysis of Twitch video streaming activities on Android | |
Jin et al. | Video logo removal detection based on sparse representation | |
KR100930869B1 (en) | System and method for screening adult video through audio identification | |
KR100916310B1 (en) | System and Method for recommendation of music and moving video based on audio signal processing | |
CN113569719B (en) | Video infringement judging method and device, storage medium and electronic equipment | |
US20100189368A1 (en) | Determining video ownership without the use of fingerprinting or watermarks | |
KR102308303B1 (en) | Apparatus and method for filtering harmful video file | |
KR100896335B1 (en) | System and Method for managing and detecting duplicate movie files based on audio contents | |
US20140245018A1 (en) | Systems and Methods for Media Recognition | |
Cattaneo et al. | Using PNU-based techniques to detect alien frames in videos |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20121204 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20131202 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20141201 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20151201 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20161201 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20171201 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20191022 Year of fee payment: 11 |