KR101976802B1 - A Contents Monitering System For Protection Of Copyright - Google Patents

A Contents Monitering System For Protection Of Copyright Download PDF

Info

Publication number
KR101976802B1
KR101976802B1 KR1020190028051A KR20190028051A KR101976802B1 KR 101976802 B1 KR101976802 B1 KR 101976802B1 KR 1020190028051 A KR1020190028051 A KR 1020190028051A KR 20190028051 A KR20190028051 A KR 20190028051A KR 101976802 B1 KR101976802 B1 KR 101976802B1
Authority
KR
South Korea
Prior art keywords
content
information
illegal
contents
protected
Prior art date
Application number
KR1020190028051A
Other languages
Korean (ko)
Inventor
서민승
Original Assignee
주식회사 유니온콘텐츠
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 유니온콘텐츠 filed Critical 주식회사 유니온콘텐츠
Priority to KR1020190028051A priority Critical patent/KR101976802B1/en
Application granted granted Critical
Publication of KR101976802B1 publication Critical patent/KR101976802B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/10Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services
    • G06Q50/184Intellectual property management

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Technology Law (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • Economics (AREA)
  • Computer Hardware Design (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

The present invention relates to a real-time content monitoring system for copyright protection, capable of blocking distribution of illegal content. According to the present invention, the real-time content monitoring system for copyright protection comprises: a provider subscription module receiving provide information including a service site address from a plurality of service providers; a content storing module including a protection target database receiving protected content information of protection target content from a content provider, a provided content database storing provided content information of providing target content which is content uploaded on a service site, and an identifier database storing an identifier, which identifies cooperation target content among the contents uploaded in the service site, received from the service provider; a cooperated content extraction module including a cooperated content extraction unit extracting cooperated content from the provided target content through comparison between the providing content information and the identifier, and a non-cooperation determination unit determining the providing target content not extracted as the cooperated content as non-cooperated content; and an illegal content extraction module extracting illegal content from the non-cooperated content through comparison between the providing content information of the non-cooperated content and the protected content information.

Description

저작권 보호를 위한 실시간 콘텐츠 모니터링 시스템{A Contents Monitering System For Protection Of Copyright} [0001] The present invention relates to a content monitoring system,

본 발명은 저작권 보호를 위한 실시간 콘텐츠 모니터링 시스템에 관한 것으로서, 보다 상세하게 설명하면 콘텐츠를 공유하는 웹페이지 등에서 불법 저작물의 유통 및 제휴 저작물의 정상판매를 실시간으로 필터링하여 불법 콘텐츠에 대한 차단 및 정상 콘텐츠에 대한 유통 기록에 대한 통계수치를 디지털화하여 제공할 수 있도록 하는, 저작권 보호를 위한 실시간 콘텐츠 모니터링 시스템에 관한 것이다.The present invention relates to a real-time content monitoring system for copyright protection. More specifically, the present invention relates to a real-time content monitoring system for copyright protection, in which real-time filtering of distribution of illegal works and normal sales of affiliate works, And to provide a digitalized statistical value of the distribution record to the real-time content monitoring system for copyright protection.

현재 무선통신 기술 및 무선통신이 적용된 모바일 단말기 기술의 발전에 따라 언제 어디서나 인터넷망에 접속할 수 있는 유비쿼터스 컴퓨팅 환경이 구축되었다.Nowadays, due to the development of mobile communication technology and wireless terminal technology, a ubiquitous computing environment capable of accessing the Internet anytime and anywhere has been established.

유비쿼터스 컴퓨팅 환경이 구축됨에 따라 사람들은 언제 어디서나 도서 등의 텍스트 기반 문서, 정지영상, 동영상 등의 멀티미디어 콘텐츠들을 자유롭게 다운로드 받아 이용할 수 있게 되었다.As the ubiquitous computing environment is established, people can freely download and use multimedia contents such as text-based documents, still images, and videos, such as books, anytime and anywhere.

이럴 때 이용되는 것이 웹하드(Web hard) 등의 콘텐츠 공유 웹페이지인데, 웹하드는 컴퓨터의 하드 디스크처럼 데이터나 파일 등의 콘텐츠를 저장해 놓을 수 있는 인터넷 상의 저장공간을 의미한다. 웹하드를 통한 콘텐츠 공유 방식에 대해 좀 더 자세히 살펴보면, 저작물 콘텐츠에 대한 권리 및 유통 허가를 보유한 콘텐츠 사업자가 웹하드에 콘텐츠를 업로드한다. 업로드된 콘텐츠는 웹하드 사업자에 의해 유료로 일반 사용자에게 제공되며, 일반 사용자는 웹하드 사용자에게 콘텐츠 비용을 결제하고 콘텐츠를 다운로드 받는 것이다. 그 후 웹하드 사용자는 해당 콘텐츠에 대한 비용을 콘텐츠 사업자에게 제공한다.In this case, the content sharing web page such as Web hard is used. The web hard means storage space on the Internet which can store contents such as data or files like a hard disk of a computer. If we look more closely at how content is shared via WebHard, content providers who have rights and distribution permissions to the content of the work will upload the content to the WebHard. The uploaded content is provided to the general user for a fee by the webhard operator, and the general user receives the content fee and downloads the content to the webhard user. The web hard user then provides the content provider with the cost for the content.

그러나 일반 사용자들의 콘텐츠 수요가 최근 폭증함에 따라, 온라인으로 유통되는 콘텐츠 시장, 즉 웹하드에서 불법적인 콘텐츠의 유통 또한 기하급수적으로 늘어나고 있다.However, as the content demand of general users has recently increased, the distribution of illegal contents on the online content market, that is, web hard, is also increasing exponentially.

멀티미디어 콘텐츠와 같은 디지털 콘텐츠는 기존 오프라인 콘텐츠와 달리 클라이언트 또는 인터넷 사용자에 의해 원본의 손상 없이 쉽게 대량 복제가 가능하다는 특징을 가지고 있어, 불법 콘텐츠의 유통은 해당 저작권자, 즉 콘텐츠 사업자에게 심대한 피해를 끼치고 있다.Unlike conventional offline content, digital contents such as multimedia contents are easily duplicated by a client or an Internet user without damaging the original, and the distribution of illegal contents has a serious harm to the copyright owner, that is, content provider .

따라서 불법 복제 콘텐츠에 대한 무단 배포를 방지하기 위한 다양한 방법들이 연구되어 적용되고 있다.Therefore, various methods to prevent unauthorized distribution of pirated contents have been studied and applied.

이에 대한 선행기술로서, 한국 등록특허 제 10-1800641호에 '콘텐츠 저작권 보호 시스템 및 방법'이 개시되어 있다. 상기 발명은 콘텐츠 저작권 보호 시스템 및 방법에 관한 것으로, 더욱 상세하게는 단속 요청된 콘텐츠가 게시된 온라인 콘텐츠 서비스 사이트를 제공하는 온라인 서비스 제공부(Online Service Provider: OSP)의 콘텐츠 보호 서비스의 등록 여부, 게시된 콘텐츠의 제휴여부 및 게시된 콘텐츠 게시 정보에 포함된 콘텐츠의 이미지 및 내용 둘 모두를 고려한 불법 콘텐츠 정확도에 의해 게시된 콘텐츠의 불법 여부를 판단하고, 불법으로 판단된 콘텐츠에 대해서 제휴를 유도하는 콘텐츠 저작권 보호 시스템 및 방법에 관한 것이다.As a prior art to this problem, Korean Patent Registration No. 10-1800641 discloses a system and method for content copyright protection. The present invention relates to a content copyright protection system and method, and more particularly, to a content copyright protection system and method, and more particularly, to a content copyright protection system and method for an online service provider site (OSP) It is determined whether or not the posted content is illegal based on the accuracy of the illegal content considering both the image content and the content of the content included in the published content publishing information and whether the content is allied with the posted content, And a content copyright protection system and method.

따라서 이를 통해 회원으로 등록한 OSP가 제공하는 온라인 콘텐츠 서비스 사이트에 대해서는 콘텐츠별로 제휴 여부에 대한 정보인 제휴 여부 정보를 제공함으로써 제휴정보를 포함하는 콘텐츠를 정상적인 콘텐츠로 분류할 수 있으므로, 보다 쉽고 간단하게 장상 콘텐츠를 추출해 낼 수 있고, 이로 인해 불법 여부를 검사해야 할 콘텐츠의 수를 줄여 불법 콘텐츠 검출 속도를 향상시킬 수 있는 효과를 갖는다.Accordingly, the online content service site provided by the OSP registered as a member can classify the content including the affiliation information into normal content by providing the affiliation information, which is the information about the affiliation by each content, It is possible to extract the content, thereby reducing the number of contents to be checked for illegalness, thereby improving the detection speed of the illegal content.

그러나 본 발명은 여기에서 더 나아가 콘텐츠를 공유하는 웹페이지 등에서 불법 저작물의 유통 및 제휴 저작물의 정상판매를 실시간으로 필터링하여 불법 콘텐츠에 대한 차단 및 정상 콘텐츠에 대한 유통 기록에 대한 통계수치를 디지털화하여 제공할 수 있도록 하는 저작권 보호를 위한 실시간 콘텐츠 모니터링 시스템을 제공하고자 한다.However, according to the present invention, the distribution of illegal works and the normal sales of the cooperative works are filtered in real time on a web page or the like sharing contents to block illegal contents and digitize statistical values for distribution records of normal contents And to provide a real-time content monitoring system for copyright protection.

본 발명은 상기 기술의 문제점을 극복하기 위해 안출된 것으로, 콘텐츠를 공유하는 웹페이지 등에서 불법 저작물의 유통 및 제휴 저작물의 정상판매를 실시간으로 필터링하여 불법 콘텐츠에 대한 차단 및 정상 콘텐츠에 대한 유통 기록에 대한 통계수치를 디지털화하여 제공할 수 있도록 하는 저작권 보호를 위한 실시간 콘텐츠 모니터링 시스템을 제공하는 것을 주요 목적으로 한다. Disclosure of the Invention The present invention has been conceived to overcome the problems of the above-described technology, and it is an object of the present invention to provide a method and apparatus for filtering illegal content and distribution of illegal content, And to provide a real-time content monitoring system for copyright protection, which enables digital statistics values to be provided.

본 발명의 다른 목적은, 분석기간 동안 모니터링 대상인 서비스 사이트에 업로드된 콘텐츠 수, 그 중에서 제휴 콘텐츠로 판정된 수, 비제휴 콘텐츠로 판정된 수, 비제휴 콘텐츠 중에서도 불법 콘텐츠로 판정된 수를 포함하는 통계치에 대한 자료를 생성하여 서비스 제공자에게 제공할 수 있도록 하는 것이다.It is another object of the present invention to provide a content management method and a content management method, which are capable of controlling the number of content uploaded to a service site to be monitored during an analysis period, the number determined as an affiliate content, To generate data on statistics and to provide them to service providers.

본 발명의 또 다른 목적은, 해시값을 이용한 불법 콘텐츠 추출을 가능케 하는 것이다.It is still another object of the present invention to enable illegal content extraction using a hash value.

본 발명의 추가 목적은, 보호 대상 콘텐츠와 제공 대상 콘텐츠 사이의 키워드 비교를 통해 불법 콘텐츠 추출을 가능케 하는 것이다. It is a further object of the present invention to enable illegal content extraction through keyword comparison between the content to be protected and the content to be provided.

본 발명의 추가 목적은, 키워드를 이용한 불법 콘텐츠 추출 시 제공 대상 콘텐츠에 포함된 키워드 뿐 아니라 제공 대상 콘텐츠와 관련된 텍스트에서 관련어를 추출하여 유사도 분석에 이용할 수 있도록 하는 것이다.It is a further object of the present invention to extract related words from not only keywords included in a content to be provided but also text related to a content to be provided at the time of illegal content extraction using a keyword so as to be used for similarity analysis.

상기 목적을 달성하기 위하여, 본 발명에 따른 저작권 보호를 위한 실시간 콘텐츠 모니터링 시스템은, 복수의 서비스 제공자로부터 서비스 사이트 주소를 포함하는 제공자정보를 입력받는 제공자가입모듈; 콘텐츠 제공자로부터 보호 대상 콘텐츠의 보호콘텐츠정보를 입력받아 저장하는 보호대상DB와, 상기 서비스 사이트에 업로드된 콘텐츠인 제공 대상 콘텐츠의 제공컨텐츠정보를 저장하는 제공콘텐츠DB 및, 상기 서비스 제공자로부터 상기 서비스 사이트에 업로드된 콘텐츠 중 제휴 대상 콘텐츠를 식별하기 위한 식별자를 입력받아 저장하는 식별DB를 포함하는 콘텐츠저장모듈; 상기 제공컨텐츠정보와 상기 식별자 사이의 비교 처리를 통해 상기 제공 대상 콘텐츠로부터 제휴 콘텐츠를 추출하는 제휴콘텐츠추출부 및, 상기 제휴 콘텐츠로 추출되지 않은 상기 제공 대상 콘텐츠를 비제휴 콘텐츠로 판정하는 비제휴판정부를 포함하는 제휴콘텐츠추출모듈; 상기 비제휴 콘텐츠의 상기 제공컨텐츠정보와 상기 보호콘텐츠정보 사이의 비교 처리를 통해 상기 비제휴 콘텐츠로부터 불법 콘텐츠를 추출하는 불법 콘텐츠추출모듈;을 포함하는 것을 특징으로 한다.In order to achieve the above object, a real-time content monitoring system for copyright protection according to the present invention comprises: a provider subscription module for receiving provider information including a service site address from a plurality of service providers; A protection target DB for receiving and storing protection content information of a protection target content from a content provider; a provision target content DB for storing provision target content information of a target content that is a content uploaded to the service site; And an identification DB for receiving and storing an identifier for identifying a content to be affiliated among the contents uploaded to the content storage module. An affiliate content extracting unit that extracts an affiliate content from the content to be provided through comparison processing between the provided content information and the identifier, and a non-affiliated determination unit that determines the content to be provided that has not been extracted as the non- An affiliate content extraction module including a content part; And an illegal content extraction module for extracting illegal content from the non-affiliated content through a comparison process between the provided content information of the non-affiliated content and the protected content information.

또한, 상기 시스템은, 기 설정된 분석기간 동안 상기 서비스 사이트에서 추출된 상기 제휴 콘텐츠의 수인 제휴빈도수를 파악하는 제휴빈도산출부 및, 상기 분석기간 동안 상기 서비스 사이트에서 추출된 상기 비제휴 콘텐츠의 수인 비제휴빈도수를 파악하는 비제휴추출부 및, 상기 분석기간 동안 상기 서비스 사이트에서 추출된 상기 불법 콘텐츠의 수인 불법빈도수를 파악하는 불법빈도산출부와, 상기 분석기간 동안 상기 서비스 사이트에 업로드된 상기 제공 대상 콘텐츠의 개수와 상기 제휴빈도수 및 상기 추출빈도수를 기반으로 콘텐츠통계를 생성하여 상기 서비스 제공자에게 제공하는 자료제공부를 포함하는 통계분석모듈;을 더 포함하는 것을 특징으로 한다.Also, the system may further include: an association frequency calculation unit for determining a frequency of association, which is the number of the affiliate contents extracted from the service site for a predetermined analysis period; An illegal frequency calculation unit for determining an illegal frequency that is the number of the illegal contents extracted from the service site during the analysis period; And a data providing unit for generating content statistics based on the number of contents, the association frequency and the extraction frequency, and providing the generated content statistics to the service provider.

덧붙여, 상기 제휴콘텐츠추출부는, 상기 제공컨텐츠정보와 상기 식별자를 비교 처리하여 상기 제공 대상 콘텐츠의 상기 식별자 포함 유무를 판단하는 식별자비교파트 및, 상기 식별자를 포함하는 상기 제공 대상 콘텐츠를 제휴 콘텐츠로 추출하는 식별자기반추출파트를 더 포함하고, 상기 불법콘텐츠추출모듈은, 상기 비제휴 콘텐츠의 상기 제공컨텐츠정보와 상기 보호콘텐츠정보를 비교 처리하여 상기 제공 대상 콘텐츠와 상기 보호 대상 콘텐츠 사이의 유사도를 판단하는 유사도판단부와, 상기 유사도가 기 설정된 기준값을 초과한 상기 제공 대상 콘텐츠를 불법 콘텐츠로 추출하는 유사도추출부를 더 포함하는 것을 특징으로 한다.In addition, the affiliate content extracting unit may include: an identifier comparison part for comparing the provided content information with the identifier to determine whether or not the content to be provided includes the identifier; and an extraction part for extracting the content to be provided including the identifier as an affiliate content Wherein the illegal content extraction module compares the provided content information of the non-affiliated content with the protected content information to determine a degree of similarity between the content to be provided and the protected content And a similarity extracting unit for extracting the contents to be provided which exceed the preset reference value as illegal contents.

더불어, 상기 시스템은, 상기 보호 대상 콘텐츠의 해시값 특징정보를 추출하는 정보추출부 및, 해시값 특징정보를 저장하는 특징DB를 포함하는 특징정보저장모듈;을 더 포함하고. 상기 유사도판단부는, 상기 제공콘텐츠정보의 해시값을 파악하는 해시분석파트 및, 상기 제공콘텐츠정보의 해시값을 상기 해시값 특징정보와 비교 처리하여 상기 제공 대상 콘텐츠와 상기 보호 대상 콘텐츠 사이의 유사도를 판단하는 해시비교파트를 더 포함하는 것을 특징으로 한다.In addition, the system may further include a feature information storage module including an information extraction unit for extracting the hash value feature information of the protected content, and a feature DB for storing the hash value feature information. The similarity degree determination unit may include a hash analysis part for grasping a hash value of the provided content information and a hash value analysis part for comparing the hash value of the provided content information with the hash value feature information to determine a degree of similarity And a hash comparison part for determining the hash comparison part.

본 발명에 따른 저작권 보호를 위한 실시간 콘텐츠 모니터링 시스템은,A real-time content monitoring system for copyright protection according to the present invention comprises:

1) 콘텐츠를 공유하는 웹페이지 등에서 불법 저작물의 유통 및 제휴 저작물의 정상판매를 실시간으로 필터링하여 불법 콘텐츠에 대한 차단 및 정상 콘텐츠에 대한 유통 기록에 대한 통계수치를 디지털화하여 제공할 수 있도록 하였으며,1) In order to block the illegal contents and to digitize the statistics of the circulation records for the normal contents, it is possible to filter the illegal works'

2) 분석기간 동안 모니터링 대상인 서비스 사이트에 업로드된 콘텐츠 수, 그 중에서 제휴 콘텐츠로 판정된 수, 비제휴 콘텐츠로 판정된 수, 비제휴 콘텐츠 중에서도 불법 콘텐츠로 판정된 수를 포함하는 통계치에 대한 자료를 생성하여 서비스 제공자에게 제공할 수 있도록 하고,2) Data on statistics including the number of contents uploaded to the service site monitored during the analysis period, the number determined as affiliated contents, the number determined as non-affiliated contents, and the number determined as illegal contents among non-affiliated contents And provide it to the service provider,

3) 해시값을 이용한 불법 콘텐츠 추출을 가능케 하였을 뿐 아니라,3) Not only has it enabled illegal content extraction using hash value,

4) 보호 대상 콘텐츠와 제공 대상 콘텐츠 사이의 키워드 비교를 통해 불법 콘텐츠 추출을 가능케 하였으며,4) Keyword comparison between the protected contents and the contents to be provided enabled illegal contents extraction,

5) 키워드를 이용한 불법 콘텐츠 추출 시 제공 대상 콘텐츠에 포함된 키워드 뿐 아니라 제공 대상 콘텐츠와 관련된 텍스트에서 관련어를 추출하여 유사도 분석에 이용할 수 있도록 하였다.5) When extracting illegal contents using keywords, related words are extracted from the texts related to the contents to be provided as well as the keywords included in the contents to be provided, so that they can be used for the similarity analysis.

도 1은 본 발명의 시스템에 대한 개략적인 구성을 나타낸 개념도.
도 2는 본 발명의 시스템에 대한 세부 구성을 도시한 블록도.
도 3은 본 발명의 실시간 콘텐츠 모니터링 순서를 도시한 프로세스도.
도 4는 본 발명의 우도함수의 예시를 나타낸 그래프.
1 is a conceptual diagram showing a schematic configuration of a system of the present invention;
2 is a block diagram illustrating a detailed configuration of a system of the present invention;
3 is a process diagram showing a real-time content monitoring sequence of the present invention.
4 is a graph showing an example of the likelihood function of the present invention.

이하 첨부된 도면을 참조하여 본 발명의 바람직한 실시예를 상세하게 설명하도록 한다. 첨부된 도면은 축척에 의하여 도시되지 않았으며, 각 도면의 동일한 참조 번호는 동일한 구성 요소를 지칭한다.Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings. The accompanying drawings are not drawn to scale and wherein like reference numerals in the various drawings refer to like elements.

도 1은 본 발명의 시스템(10)에 대한 개략적인 구성을 나타낸 개념도이다.1 is a conceptual diagram showing a schematic configuration of a system 10 of the present invention.

도 1을 참조하여 본 발명의 저작권 보호를 위한 실시간 콘텐츠 모니터링 시스템(10)을 구성하는 각 구성요소에 대해 설명하고자 한다.Referring to FIG. 1, components of the real-time content monitoring system 10 for copyright protection of the present invention will be described.

본 발명의 저작권 보호를 위한 실시간 콘텐츠 모니터링 시스템(10)은, 기본적으로 서비스 제공자(20), 콘텐츠 제공자(30), 업로더(40), 그리고 메인서버(50)로 이루어진다.The real-time content monitoring system 10 for copyright protection of the present invention basically comprises a service provider 20, a content provider 30, an uploader 40, and a main server 50.

먼저 콘텐츠 제공자(30)는 데이터나 파일에 대한 권리를 소유한 자를 의미하며, 해당 콘텐츠에 대한 권리를 보유한 자라고 할 수 있다. 이는 상술한 설명에서의 콘텐츠 사업자라고도 할 수 있으며, 데이터나 파일 등의 저작물, 즉 콘텐츠에 대한 권리 및 유통 허가를 보유한 일반 개인 또는 회사라 할 수 있다. 따라서 콘텐츠 제공자(30)는 본 발명의 콘텐츠 모니터링 시스템(10)을 통해 본인이 권리 및 유통 허가를 보유한 콘텐츠에 대한 보호 및 모니터링을 요청할 수 있다.First, the content provider 30 refers to a person who owns rights to data or files, and may be a person who holds rights to the content. This may be referred to as a content provider in the above description, and may be a general person or a company having rights to a content such as data and files, that is, rights to distribute contents and distribution permission. Thus, the content provider 30 can request protection and monitoring of content having rights and distribution permits through the content monitoring system 10 of the present invention.

서비스 제공자(20)라 함은 상술한 설명에서의 웹하드 서비스 제공자(20), 즉 웹하드 사업자라고 할 수 있다. 이는 일반 개인 또는 회사일 수 있다. 웹하드는 컴퓨터의 하드 디스크처럼 데이터나 파일 등의 콘텐츠를 저장해 놓을 수 있는 인터넷 상의 저장공간을 의미하며, 서비스 제공자(20)는 해당 웹하드 서비스에 대한 사업자로서 서비스 사이트를 오픈하여 데이터나 파일 등의 콘텐츠를 저장하는 웹 상의 저장공간을 생성한 자라고 할 수 있다.The service provider 20 may be referred to as a web hard service provider 20, i.e., a web hard service provider in the above description. It may be a private individual or a company. Web hard means a storage space on the Internet that can store contents such as data or files like a hard disk of a computer. The service provider 20 opens a service site as a provider for the web hard service, Quot; is a person who has created a storage space on the web for storing contents of "

서비스 제공자(20)를 통해 개설된 서비스 사이트, 즉 웹하드에는 데이터나 파일 등의 콘텐츠가 업로드 되어 대중에게 공유될 수 있다. 이 때 업로드를 수행하는 자를 일반적으로 업로더(40)라고 통칭할 수 있는데, 이러한 업로더(40)는 특정 콘텐츠를 보유한 일반 개인일 수도 있으며, 혹은 상술한 콘텐츠 제공자(30)일 수도 있다. 따라서 콘텐츠 제공자(30) 또는 일반 개인인 업로더(40)가 서비스 사이트에 콘텐츠를 업로드하면, 서비스 제공자(20)는 업로드된 콘텐츠를 일반 사용자, 즉 대중에게 유료로 판매할 수 있게 된다.Contents such as data and files can be uploaded to the service site established through the service provider 20, that is, the web hard, and can be shared with the public. At this time, the uploader is generally referred to as an uploader 40. The uploader 40 may be a general person having a specific content, or may be the content provider 30 described above. Therefore, when the content provider 30 or the general uploader 40 uploads the content to the service site, the service provider 20 can sell the uploaded content to the general user, that is, to the public for a fee.

메인서버(50)는 본 발명의 시스템(10)의 구현을 위한 서버PC의 모임이라고도 할 수 있으며, 후술하겠지만 본 시스템(10)에는 다양한 데이터베이스 들이 포함되므로 해당 DB들의 집단 뿐 아니라 본 발명의 시스템(10) 구현을 위한 시스템(10)서버 등이 본 발명의 메인서버(50)라 할 수 있다. 이러한 메인서버(50)는 콘텐츠 모니터링 시스템(10)을 구현하여 서비스 사이트에 업로드된 콘텐츠 중에서 제휴 콘텐츠, 비제휴 콘텐츠를 식별해낼 뿐 아니라, 나아가 불법 콘텐츠, 즉 콘텐츠 제공자(30)의 허가 없이 불법으로 판매되고 있는 콘텐츠에 대한 모니터링을 수행한다.The main server 50 may be referred to as a group of server PCs for the implementation of the system 10 of the present invention. As described later, various databases are included in the system 10, A system 10 server for implementing the present invention may be referred to as a main server 50 of the present invention. The main server 50 implements the content monitoring system 10 to not only identify the affiliated content and the non-affiliated content among the contents uploaded to the service site, but also illegally transmit the illegal content, that is, illegally Perform monitoring on the content being sold.

여기서 제휴 콘텐츠라 함은 콘텐츠에 대한 저작물 또는 유통 권리를 가지고 있는 자, 즉 콘텐츠 제공자(30)와의 계약을 통해 정상적으로 판매되고 있는 콘텐츠로서, 다시 말해 정식 허가를 통해 공유되는 콘텐츠라고 할 수 있다.Here, the affiliated content is a content that is normally sold through a contract with the content provider 30, that is, a content that is shared through formal authorizations.

비제휴 콘텐츠는 넓은 범위의 불법 콘텐츠라고 할 수 있는데, 콘텐츠 제공자(30)와의 계약 없이 판매되고 있는 콘텐츠라고 할 수 있다. 즉 판매 및 공유에 대한 정식 허가가 없이 공유 및 판매되고 있는 콘텐츠라고 할 수 있다.Non-affiliated content can be said to be a wide range of illegal content, but content that is sold without contracting with the content provider 30. That is, content that is being shared and sold without formal permission to sell and share.

따라서 본 발명의 메인서버(50)는 시스템(10)의 구현을 통해 서비스 사이트에 업로드된 콘텐츠 중 제휴 콘텐츠와 비제휴 콘텐츠를 판별하여 비제휴 콘텐츠를 추출해내는 역할을 수행한다. 나아가 비제휴 콘텐츠 중에서도 2차 추출을 더하여 보다 세밀한 의미의 불법 콘텐츠 추출을 수행하도록 하는 것이다. 이 때 2차 추출 대상은 콘텐츠 제공자(30)로부터 보호 요청이 들어온 콘텐츠, 즉 보호 대상 콘텐츠를 의미하는데, 이는 제휴 없이는 합법적인 공유를 금지한 콘텐츠로서, 비제휴 콘텐츠 중에서 해당 보호 대상 콘텐츠가 추출된다면 이는 엄연한 불법에 해당함으로 좁은 의미의 불법 콘텐츠는 비제휴 콘텐츠 중에서도 보호 대상 콘텐츠와 유사도가 높은 콘텐츠를 의미하는 것이다.Therefore, the main server 50 of the present invention plays a role of extracting non-affiliated contents by discriminating the affiliated contents and non-affiliated contents among the contents uploaded to the service site through the implementation of the system 10. [ Further, the second extraction is added to the non-affiliated contents to extract illegal contents in a finer sense. In this case, the secondary extraction target means a content in which a protection request is received from the content provider 30, that is, a content to be protected, which is a content prohibited from legitimate sharing without cooperation, This is an illegal law, so illegal content in a narrow sense means content that is highly similar to the protected content among non-affiliated contents.

이를 통해 서비스 사이트, 즉 웹하드 상에서 불법 콘텐츠의 유통 및 제휴 콘텐츠의 정상판매를 실시간으로 모니터링하여 불법 콘텐츠에 대한 차단요청 및 제휴 콘텐츠 및 불법 콘텐츠 등에 대한 유통 통계 등을 디지털화하여 제공할 수 있게 된다.Through this, it is possible to monitor the distribution of illegal contents on the service site, that is, the web hard, and the normal sales of the affiliate contents in real time, and to provide blocking requests for illegal contents and distribution statistics about affiliate contents and illegal contents.

이와 같은 본 발명의 저작권 보호를 위한 실시간 콘텐츠 모니터링 시스템(10)에 대해 보다 상세히 설명하면 다음과 같다.The real-time content monitoring system 10 for copyright protection according to the present invention will now be described in more detail.

도 2는 본 발명의 시스템(10)에 대한 세부 구성을 도시한 블록도이고, 도 3은 본 발명의 실시간 콘텐츠 모니터링 순서를 도시한 프로세스도이다.FIG. 2 is a block diagram showing a detailed configuration of the system 10 of the present invention, and FIG. 3 is a process diagram showing a real-time content monitoring sequence of the present invention.

도 2 및 도 3을 참조하여 설명하면, 본 발명의 저작권 보호를 위한 실시간 콘텐츠 모니터링 시스템(10)은 기본적으로 제공자가입모듈(100), 콘텐츠저장모듈(200), 제휴콘텐츠추출모듈(300) 및 불법콘텐츠추출모듈(400)을 기본적으로 포함한다.2 and 3, the real-time content monitoring system 10 for copyright protection of the present invention basically includes a provider subscription module 100, a content storage module 200, an affiliate content extraction module 300, An illegal content extraction module 400 is basically included.

제공자가입모듈(100)은 상술한 복수의 서비스 제공자(20)로부터 서비스 사이트 주소, 즉 운영 중인 웹하드 사이트의 주소를 포함하는 제공자정보를 입력받는 기능을 수행한다.The provider subscription module 100 functions to receive provider information including a service site address, that is, an address of an operating web hard site, from the plurality of service providers 20 described above.

콘텐츠저장모듈(200)은 보호대상DB(210), 제공콘텐츠DB(220), 식별DB(230)를 포함하여 복수의 정보를 입력 및 저장하는 데이터베이스의 기능을 수행하는 모듈인데, 이에 대해 보다 상세히 설명하면 다음과 같다.The content storage module 200 is a module for performing a function of a database for inputting and storing a plurality of information including the protection object DB 210, the provision contents DB 220 and the identification DB 230, The following is an explanation.

보호대상DB(210)는 상술한 콘텐츠 제공자(30)로부터 유통 및 판매에 대한 권리를 보호하고자 하는 콘텐츠인 보호 대상 콘텐츠에 대한 보호콘텐츠정보를 입력받아 저장하는 기능을 수행한다. 이 때 보호콘텐츠정보는 보호할 콘텐츠 그 자체, 보호할 콘텐츠의 일부 영상(정지 영상 또는 동영상), 제목, 설명 및 관련 키워드(영화 관련 콘텐츠인 경우 감독, 출연진, 줄거리, 시놉시스) 등을 포함할 수 있다.The protected object DB 210 receives and stores protected content information for the protected content, which is a content for protecting the rights to circulation and sale, from the content provider 30 described above. The protected content information may include the content itself to be protected, some images (still images or video) of the content to be protected, titles, descriptions, and related keywords (such as supervisors, casts, synopsis, synopsis for movie content) have.

제공콘텐츠DB(220)는 상술한 서비스 사이트에 업로드된 콘텐츠, 즉 업로더(40)에 의해 업로드된 제공 대상 콘텐츠의 정보인 제공콘텐츠정보를 입력받아 저장하는 기능을 수행한다. 이 때 제공콘텐츠정보는 제공 대상 콘텐츠 그 자체, 콘텐츠의 제목, 설명 및 관련 키워드 등을 포함할 수 있다. 더불어 후술할 식별자 역시 제공콘텐츠정보에 포함되어 저장된다.The providing content DB 220 receives and stores the content uploaded to the service site, that is, the providing content information, which is the information of the content to be provided, uploaded by the uploader 40. At this time, the provided content information may include the content to be provided itself, the title of the content, a description, a related keyword, and the like. In addition, an identifier to be described later is also stored in the provided content information.

식별DB(230)는 서비스 제공자(20)로부터 식별자를 입력받아 저장하는 기능을 수행한다. 이 때 식별자라 함은 제공 대상 콘텐츠, 즉 서비스 사이트에 업로드된 전체 콘텐츠 중에서 제휴 콘텐츠를 식별하기 위해 제휴 콘텐츠에 부가되는 식별용 키워드 또는 코드라고도 할 수 있는데, 이는 '제휴'와 같은 키워드 단어일 수도 있으며, 혹은 특정 코드나 특정 이미지일 수도 있다. 따라서 서비스 제공자(20)마다 제휴 콘텐츠에 부가되는 식별자가 다를 수 있으므로, 서비스 제공자(20)로부터 식별자를 입력받아 저장하도록 한다.The identification DB 230 receives the identifier from the service provider 20 and stores the received identifier. In this case, the identifier may be referred to as an identification keyword or code added to the affiliated content in order to identify the affiliated content among the contents to be provided, that is, all the contents uploaded to the service site. This may be a keyword word such as 'affiliate' , Or it may be a specific code or a specific image. Therefore, since the identifiers added to the affiliated contents may be different for each service provider 20, the identifier is received from the service provider 20 and stored.

제휴콘텐츠추출모듈(300)은 각각의 서비스 사이트에 업로드된 제공 대상 콘텐츠로부터 제휴 콘텐츠 및 비제휴 콘텐츠를 추출하는 기능을 수행하는 것으로서, 제휴콘텐츠추출부(310) 및 비제휴콘텐츠추출부(320)를 포함한다.The affiliate content extracting module 300 extracts the affiliate content and the non-affiliated content from the content to be provided, which is uploaded to each service site. The affiliate content extracting module 310 and the non- .

제휴콘텐츠추출부(310)는 각각의 서비스 사이트에 업로드된 제공콘텐츠정보와 식별자 사이의 비교 처리를 통해 제공 대상 콘텐츠 중 제휴 콘텐츠를 추출하는 기능을 수행한다. 따라서 제휴콘텐츠추출부(310)는 각각의 제공 대상 콘텐츠의 제공콘텐츠정보에 식별자(키워드, 코드, 이미지 중 어느 하나일 수 있다)가 포함되어 있는지를 파악하여 해당 식별자를 포함하는 제공 대상 콘텐츠를 제휴 콘텐츠로서 추출하여 제휴 콘텐츠의 유통을 모니터링 하는 것이다. 보다 상세하게는, 제휴콘텐츠추출부(310)에 포함될 수 있는 식별자비교파트(311)가 상기 제공콘텐츠정보와 상기 식별자를 비교 처리하여 상기 제공 대상 콘텐츠의 상기 식별자 포함 유무를 판단하고, 제휴콘텐츠추출부(310)에 포함될 수 있는 식별자기반추출파트(312)가 상기 식별자를 포함하는 상기 제공 대상 콘텐츠를 제휴 콘텐츠로 추출하게 된다.The affiliate content extracting unit 310 performs a function of extracting an affiliate content among the content to be provided through comparison processing between the provided content information uploaded to each service site and the identifier. Accordingly, the affiliate content extracting unit 310 determines whether the provided content information of each content to be provided includes an identifier (which may be any one of a keyword, a code, and an image) and stores the content to be provided, And the distribution of affiliate contents is monitored. More specifically, the identifier comparison part 311, which can be included in the affiliate content extraction unit 310, compares the provided content information with the identifier to determine whether or not the content to be provided includes the identifier, The identifier-based extraction part 312 that can be included in the part 310 extracts the content to be provided including the identifier as an affiliate content.

비제휴콘텐츠추출부(320)는 제공 대상 콘텐츠 중 제휴 콘텐츠로 추출되지 않는 콘텐츠, 즉 제공콘텐츠정보에서 식별자를 포함하지 않은 제공 대상 콘텐츠를 비제휴 콘텐츠로 판정 및 추출하는 기능을 수행한다. 비제휴 콘텐츠는 넓은 의미의 불법 콘텐츠라고 할 수 있으므로, 이를 통해 불법 콘텐츠에 대한 모니터링을 수행하게 된다.The non-affiliated content extracting unit 320 performs a function of determining and extracting a content that is not extracted as an affiliated content, that is, a content to be provided that does not include an identifier in the provided content information, as a non-affiliated content. Non-affiliate content can be considered as illegal content in a broad sense, so that it will monitor illegal content.

나아가 본 발명의 실시간 콘텐츠 모니터링 시스템(10)은 불법콘텐츠추출모듈(400)을 더 포함한다. 이는 비제휴 콘텐츠 중에서도 불법 콘텐츠를 판정해내는 것인데, 콘텐츠 제공자(30)로부터 직접적으로 권리에 대한 보호를 요청받은 보호 대상 콘텐츠, 즉 제휴 없이 업로드 되는 것을 금지하고자 하는 콘텐츠인 불법 콘텐츠를 판단하여 2차적인 모니터링을 수행하기 위함이다.Furthermore, the real-time content monitoring system 10 of the present invention further includes an illegal content extraction module 400. This is to judge illegal content even among non-affiliated contents. It is judged illegal content which is the content to be protected, which is requested to be protected directly from the contents provider 30, that is, the content which is prohibited to be uploaded without affiliation, In order to perform monitoring.

이러한 불법콘텐츠추출모듈(400)은 2차적으로 상기 비제휴 콘텐츠의 상기 제공콘텐츠정보와 상기 보호콘텐츠정보 사이의 비교 처리를 수행하여, 보호콘텐츠정보와 유사도가 기준 유사도 이상인 제공콘텐츠정보를 포함한 비제휴 콘텐츠, 즉 비제휴 콘텐츠 중 보호 대상 콘텐츠와의 유사도가 기준 이상인 비제휴 콘텐츠를 불법 콘텐츠로 추출하는 기능을 수행한다. 이 때 유사도 판정의 기준을 본 발명의 시스템(10) 관리자, 또는 콘텐츠 제공자(30)에 의해 설정될 수 있다.The illegal content extraction module 400 performs a comparison process between the provided content information and the protected content information of the non-affiliated content in a second order, and stores the protected content information in the non-affiliated content including the provided content information, Unfriendly contents, that is, non-affiliated contents whose similarity with the protected content is equal to or higher than the reference, into illegal contents. At this time, the criterion of the degree of similarity determination may be set by the system 10 manager of the present invention, or the content provider 30.

이 때 보다 상세하게는 불법콘텐츠추출모듈(400)에 포함될 수 있는 유사도판단부(410)에 의해 상기 비제휴 콘텐츠의 상기 제공콘텐츠정보와 상기 보호콘텐츠정보를 비교 처리하여 상기 제공 대상 콘텐츠와 상기 보호 대상 콘텐츠 사이의 유사도를 판단한다. 이 때 유사도 판단 방식에는 제한을 두지 않으며, 유사도 판단의 실시예에 대해서는 후술하기로 한다.In detail, the similarity determination unit 410, which may be included in the illegal content extraction module 400, compares the provided content information of the non-affiliated content with the protected content information, And judges the similarity between the target contents. At this time, there is no limitation on the similarity determination method, and an embodiment of the similarity determination will be described later.

또한 불법콘텐츠추출모듈(400)에 포함될 수 있는 유사도추출부(420)는 상기 유사도가 시스템(10) 관리자, 또는 콘텐츠 제공자(30)에 의해 기 설정된 기준값을 초과하는 상기 제공 대상 콘텐츠를 불법 콘텐츠로 추출할 수 있다.In addition, the similarity extraction unit 420, which may be included in the illegal content extraction module 400, may determine that the similarity is an illegal content that exceeds the reference value preset by the administrator of the system 10 or the content provider 30 Can be extracted.

따라서 이와 같은 본 발명의 저작권 보호를 위한 실시간 콘텐츠 모니터링 시스템(10)은 제휴 콘텐츠 및 비제휴 콘텐츠, 나아가 불법 콘텐츠에 대한 모니터링을 수행할 수 있으며, 비제휴 콘텐츠의 경우 제휴 콘텐츠로의 전환을 요청할 수도 있고, 불법 콘텐츠의 경우 차단 또는 서비스 제공자(20)를 통한 삭제를 요청할 수도 있게 된다.Accordingly, the real-time content monitoring system 10 for copyright protection according to the present invention can perform monitoring of affiliate content, non-affiliated content, and illegal content. In the case of non-affiliated content, And may ask for blocking or illegal deletion through the service provider 20 in case of illegal contents.

나아가 본 발명의 시스템(10)은 제휴 콘텐츠 및 비제휴 콘텐츠, 그리고 불법 콘텐츠에 대한 통계자료를 수치화하여 제공할 수 있는데, 이를 위해 통계분석모듈(500)을 더 포함할 수 있다. 통계분석모듈(500)은 구체적으로 제휴빈도산출부(510), 비제휴추출부(520), 불법빈도산출부(530), 자료제공부(540)를 포함한다.Furthermore, the system 10 of the present invention can provide statistical data on affiliated contents, non-affiliated contents, and illegal contents, and may further include a statistical analysis module 500 for this purpose. The statistical analysis module 500 specifically includes an association frequency calculation unit 510, a non-association extraction unit 520, an illegal frequency calculation unit 530, and a data providing unit 540.

제휴빈도산출부(510)는 시스템(10) 관리자, 콘텐츠 제공자(30), 서비스 제공자(20) 중 어느 하나를 통해 기 설정된 분석기간 동안 모니터링이 수행된 상기 서비스 사이트에서 추출 처리된 상기 제휴 콘텐츠의 개수인 제휴빈도수를 파악하는 기능을 수행할 수 있다.The affiliate frequency calculating unit 510 calculates the affiliate frequency of the affiliate content extracted and processed in the service site monitored during the predetermined analysis period through the administrator of the system 10, the content provider 30, and the service provider 20 It is possible to perform the function of grasping the number of cooperating frequencies.

비제휴추출부(520)는 상술한 분석기간 동안 모니터링이 수행된 상기 서비스 사이트에서 추출 처리된 상기 비제휴 콘텐츠의 개수인 비제휴빈도수를 파악하는 기능을 수행할 수 있다.The non-association extracting unit 520 can perform a function of grasping the number of non-association frequencies that is the number of the non-affiliated contents extracted and processed in the service site that has been monitored during the analysis period described above.

불법빈도산출부(530)는 상술한 분석기간 동안 모니터링이 수행된 상기 서비스 사이트에서 추출 처리된 상기 불법 콘텐츠의 수인 불법빈도수를 파악하는 기능을 수행할 수 있다.The illegal frequency calculation unit 530 may perform a function of grasping the illegal frequency, which is the number of the illegal contents extracted and processed in the service site that has been monitored during the analysis period described above.

자료제공부(540)는 상기 분석기간 동안의 제휴빈도수, 비제휴빈도수, 추출빈도수 뿐 아니라 분석기간 동안 모니터링 대상인 상기 서비스 사이트에 업로드된 상기 제공 대상 콘텐츠의 전체 개수를 기반으로 콘텐츠통계를 생성하여 해당 서비스 사이트를 운영하는 서비스 제공자(20)에게 콘텐츠통계를 제공하는 역할을 수행한다. 이 때 콘텐츠통계는 업로드된 콘텐츠 수, 그 중에서 제휴 콘텐츠로 판정된 수, 비제휴 콘텐츠로 판정된 수, 비제휴 콘텐츠 중에서도 불법 콘텐츠로 판정된 수를 포함하는 통계치에 대한 자료라고 할 수 있다. 이를 서비스 제공자(20)에게 제공함에 따라 서비스 제공자(20)가 운영하고 있는 서비스 사이트, 즉 웹하드에 얼마나 많은 콘텐츠가 공유되고 있으며, 그 중 제휴/비제휴 콘텐츠의 비중은 어떠한지, 더불어 불법 콘텐츠의 비중이 어떠한지에 대한 실시간 모니터링 결과를 제공할 수 있게 된다.The data providing unit 540 generates content statistics based on the number of affiliation frequencies, non-affiliation frequencies, and extraction frequencies during the analysis period, based on the total number of contents to be provided, which are uploaded to the service sites being monitored during the analysis period, And provides content statistics to the service provider 20 operating the service site. At this time, the content statistics are data on the number of uploaded contents, the number determined as affiliated contents, the number determined as non-affiliated contents, and the statistics including the number determined as illegal contents among non-affiliated contents. The service provider 20 provides the service provider 20 with information about how much content is shared in the service site operated by the service provider 20, that is, web hard, how much of the affiliated / non-affiliated content is, It is possible to provide a real-time monitoring result on the specific gravity.

더불어 상술한 설명에서 불법 콘텐츠 추출을 위한 유사도 판단에는 제한이 없다 하였는데, 이 때 유사도 판단을 위해 해시값 비교, 또는 키워드 비교 등이 이루어질 수 있다.In addition, in the above description, there is no limitation on the determination of the degree of similarity for illegal content extraction. In this case, a hash value comparison or a keyword comparison can be performed to determine the degree of similarity.

먼저 해시값 비교를 위한 실시예에 대해 설명하면, 본 발명의 시스템(10)은 기본적으로 해시값 특징정보 저장을 위한 특징정보저장모듈(600)을 더 포함할 수 있다. 특징정보저장모듈(600)은 정보추출부(610) 및 특징DB(620)를 기본적으로 포함한다.First, an embodiment for comparing hash values will be described. The system 10 of the present invention may further include a feature information storage module 600 basically for storing hash value feature information. The feature information storage module 600 basically includes an information extraction unit 610 and a feature DB 620.

정보추출부(610)는 상기 보호 대상 콘텐츠의 해시값 특징정보를 추출하는 기능을 수행한다. 이 때 해시값 특징정보라 함은 해당 콘텐츠의 해시값을 의미하며, 해시값은 복사된 디지털 증거의 동일성을 입증하기 위해 파일 특성을 축약한 암호같은 수치로 일반적으로 수사과정에서 '디지털 증거의 지문'으로 통하므로, 해당 콘텐츠의 특성이라고도 할 수 있다.The information extracting unit 610 extracts the hash value feature information of the protected content. In this case, the hash value characteristic information means the hash value of the content, and the hash value is a numerical value such as a cipher that shortens the file characteristic in order to verify the identity of the copied digital evidence. Generally, Quot ;, so it can be said to be a characteristic of the content.

특징DB(620)는 해당 보호 대상 콘텐츠로부터 추출된 해시값 특징정보를 저장하여 데이터베이스화하는 기능을 수행한다. 각각이 보호 대상 콘텐츠의 해시값 특징정보가 특징DB(620)에 저장되므로, 후술할 유사도 판단이 가능해지게 된다.The feature DB 620 stores the hash value feature information extracted from the content to be protected and stores it in a database. Since the hash value feature information of the content to be protected is stored in the feature DB 620, it is possible to determine the degree of similarity to be described later.

이와 같이 특징정보저장모듈(600)에서 해당 보호 대상 콘텐츠의 해시값 특징정보를 추출 및 저장하는 경우, 유사도판단부(410)는 상기 제공 대상 콘텐츠의 해시값과 상기 해시값 특징정보 사이의 비교 처리를 통해 유사도를 판단하게 된다. 이를 위해 유사도판단부(410)는 해시값분석파트(411) 및 해시값비교파트(412)를 더 포함할 수 있다.In the case where the feature information storage module 600 extracts and stores the hash value feature information of the corresponding protection target content, the similarity determination unit 410 compares the hash value of the target content with the hash value feature information The degree of similarity is determined. For this, the similarity determination unit 410 may further include a hash value analysis part 411 and a hash value comparison part 412.

해시값분석파트(411)는 상기 제공 대상 콘텐츠의 해시값을 파악하는 기능을 수행하는 것으로서, 이는 상술한 특징정보저장모듈(600)의 정보추출부(610)와 그 기능이 같으나 해시값 추출 대상이 제공 대상 콘텐츠라는 차이가 있다. 상세한 설명은 상술한 정보추출부(610)를 참조하면 되므로 설명을 생략하기로 한다.The hash value analysis part 411 performs a function of grasping the hash value of the content to be provided and has the same function as the information extraction part 610 of the feature information storage module 600, There is a difference in the content to be provided. The detailed description will be made with reference to the above-described information extracting unit 610, and a description thereof will be omitted.

해시값비교파트(412)는 상기 제공 대상 콘텐츠의 해시값을 상기 해시값 특징정보와 비교 처리하여 상기 제공 대상 콘텐츠와 상기 보호 대상 콘텐츠 사이의 유사도를 판단하는 기능을 수행하는 것으로서, 해시값의 경우 '디지털 증거의 지문'으로 불리는 만큼 상기 제공 대상 콘텐츠의 해시값과 상술한 해시값 특징정보 사이의 유사도가 높은 경우 해당 제공 대상 콘텐츠가 상기 보호 대상 콘텐츠와 일치할 가능성이 높다고 판별할 수 있는 것이다.The hash value comparison part 412 performs a function of comparing the hash value of the content to be provided with the hash value feature information to determine the degree of similarity between the content to be provided and the content to be protected. If the degree of similarity between the hash value of the content to be provided and the hash value feature information is high as it is called 'fingerprint of digital evidence', it can be determined that the content to be provided corresponds to the content to be protected.

또 다른 유사도 판단 실시예로서는 키워드 비교 방식이 있을 수 있는데, 해당 보호 대상 콘텐츠에 포함된 키워드 특징정보와, 제공 대상 콘텐츠에 포함된 키워드 사이의 유사도를 비교하는 것이다. 이 때 제공 대상 콘텐츠의 경우 업로더(40)들이 모니터링을 피하기 위해 키워드를 교묘히 조작하는 경우가 존재한다. 즉 제목이 사랑인 경우 '사/랑'이나 '사,랑'과 같이 검색을 피할 수 있도록 하는 것이다. 따라서 해당 제공 대상 콘텐츠에 포함된 키워드 뿐 아니라 해당 키워드와 관련된 관련어를 추출하고, 이를 보호 대상 콘텐츠에 포함된 키워드 특징정보와 비교 처리할 수 있도록 하는 것이다.Another embodiment of judging the similarity degree may be a keyword comparison method, which compares the keyword feature information included in the protection target content with the similarity between the keywords included in the target content. At this time, in the case of the contents to be provided, there are cases where the uploaders 40 manipulate keywords in order to avoid monitoring. In other words, if the title is love, it is possible to avoid searches such as 'Sara / Rang' or 'Sara'. Accordingly, not only the keywords included in the content to be provided but also related words related to the keywords are extracted and compared with the keyword feature information included in the protected content.

이를 위해서는 먼저 특징정보저장모듈(600)을 통해 상기 보호 대상 콘텐츠의 키워드 특징정보를 추출 및 저장해야 하는데, 이러한 실시예의 경우 특징정보저장모듈(600)의 정보추출부(610)가 상기 보호 대상 콘텐츠의 키워드 특징정보를 추출할 수 있으며, 특징DB(620)가 상기 키워드 특징정보를 저장하여 데이터베이스화할 수 있다. 이 때 키워드 특징정보라 함은 상기 보호 대상 콘텐츠의 제목이나 내용, 줄거리, 시놉시스, 출연진, 감독 등 해당 보호 대상 콘텐츠의 보호콘텐츠정보에 포함된 텍스트 키워드일 수 있다.In order to do this, the keyword feature information of the protection target content is first extracted and stored through the feature information storage module 600. In this embodiment, the information extraction unit 610 of the feature information storage module 600 extracts the protection target content And the feature DB 620 may store the keyword feature information and convert the keyword feature information into a database. In this case, the keyword feature information may be a text keyword included in the protected content information of the protection target content such as the title, content, story, synopsis, cast, supervision of the protection target content.

더불어 콘텐츠저장모듈(200)은 관련텍스트DB(240)를 더 포함할 수 있는데, 관련텍스트DB(240)는 상기 제공 대상 콘텐츠와 관련된 관련텍스트를 수집하여 저장하는 기능을 수행한다. 이 때 관련텍스트라 함은 제공 대상 콘텐츠의 제목, 파일명, 웹페이지의 파일 설명 텍스트 내용, 업로드 날짜 등을 포함할 수 있다. 더불어 관련텍스트는 해당 제목이나 파일명, 웹페이지의 파일 설명 텍스트 내용과 유사한 것으로 판정되는 단어, 문장, 파일명, 제목, 텍스트 내용 등을 웹상에서 검색 및 수집하여 보다 방대한 자료를 수집하도록 한다.In addition, the content storage module 200 may further include an associated text DB 240. The related text DB 240 collects and stores related texts related to the content to be provided. At this time, the related text may include the title, file name of the content to be provided, file description text content of the web page, upload date, and the like. In addition, related texts search for and gather information on words, sentences, file names, titles, and texts that are judged to be similar to the title, file name, and file description text of a web page.

또한 관련텍스트가 저장되는 경우, 해당 관련텍스트로부터 제공 대상 콘텐츠에 대한 관련어 특징정보를 추출하여야 함은 물론인데, 이를 위해 본 발명의 시스템(10)에는 관련어추출모듈(700)이 더 포함될 수 있다. 관련어추출모듈(700)은 복수개의 상기 관련텍스트로부터 관련어 특징정보를 추출하여 관련어DB(760)에 저장하는 기능을 수행한다.In addition, when related text is stored, association feature information for a content to be provided is extracted from the related text. For this purpose, the related module 700 may be further included in the system 10 of the present invention. The related word extraction module 700 extracts related feature information from a plurality of related texts and stores the related feature information in the DB 760. [

따라서 이와 같은 구성을 통해 보호 대상 콘텐츠의 키워드 특징정보 뿐 아니라 업로드된 전체 제공 대상 콘텐츠에 대한 관련어 특징정보가 파악되는데, 이와 같은 경우 유사도판단부(410)는 관련어비교파트(413)를 더 포함하여, 상기 제공 대상 콘텐츠의 상기 관련어 특징정보와 상기 보호 대상 콘텐츠의 키워드 특징정보 사이의 비교 처리를 통해 상기 제공 대상 콘텐츠와 상기 보호 대상 콘텐츠 사이의 유사도를 판단할 수 있게 된다.Accordingly, not only the keyword feature information of the content to be protected but also related feature information of the uploaded contents to be provided can be grasped through such a configuration. In this case, the similarity determination unit 410 further includes a related part 413 , The degree of similarity between the content to be provided and the content to be protected can be determined through a comparison process between the related feature information of the content to be provided and the keyword feature information of the protected content.

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

지금까지 설명한 바와 같이, 본 발명에 따른 저작권 보호를 위한 실시간 콘텐츠 모니터링 시스템의 구성 및 작용을 상기 설명 및 도면에 표현하였지만 이는 예를 들어 설명한 것에 불과하여 본 발명의 사상이 상기 설명 및 도면에 한정되지 않으며, 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 다양한 변화 및 변경이 가능함은 물론이다.As described above, the configuration and operation of the real-time content monitoring system for copyright protection according to the present invention are described in the above description and drawings. However, the present invention is not limited to the above description and drawings And it is to be understood that various changes and modifications may be made without departing from the spirit of the invention.

10 : 시스템 20 : 서비스 제공자
30 : 콘텐츠 제공자 40 : 업로더
50 : 메인서버 100 : 제공자가입모듈
200 : 콘텐츠저장모듈 210 : 보호대상DB
220 : 제공콘텐츠DB 230 : 식별DB
240 : 관련텍스트DB 300 : 제휴콘텐츠추출모듈
310 : 제휴콘텐츠추출부 311 : 식별자비교파트
312 : 식별자기반추출파트 320 : 비제휴콘텐츠추출부
400 : 불법콘텐츠추출모듈 410 : 유사도판단부
411 : 해시값분석파트 412 : 해시값비교파트
413 : 관련어비교파트 420 : 유사도추출부
500 : 통계분석모듈 510 : 제휴빈도산출부
520 : 비제휴추출부 530 : 불법빈도산출부
540 : 자료제공부 600 : 특징정보저장모듈
610 : 정보추출부 620 : 특징DB
700 : 관련어추출모듈
10: System 20: Service Provider
30: Content provider 40: Uploader
50: main server 100: provider subscription module
200: content storage module 210: protected object DB
220: Provided content DB 230: Identification DB
240: Related text DB 300: Affiliate content extraction module
310: Affiliate Content Extraction Unit 311: Identifier Comparison Part
312: Identifier based extraction part 320: Non-affiliated content extraction part
400: Illegal content extraction module 410:
411: Hash Value Analysis Part 412: Hash Value Comparison Part
413: Related word comparison part 420: Similarity extraction part
500: Statistical analysis module 510: Alliance frequency calculation part
520: non-affiliated extraction unit 530: illegal frequency calculation unit
540: Data providing unit 600: Feature information storage module
610: Information extracting unit 620: Feature DB
700: related extraction module

Claims (11)

저작권 보호를 위한 실시간 콘텐츠 모니터링 시스템으로서,
복수의 서비스 제공자로부터 서비스 사이트 주소를 포함하는 제공자정보를 입력받는 제공자가입모듈;
콘텐츠 제공자로부터 보호 대상 콘텐츠의 보호콘텐츠정보를 입력받아 저장하는 보호대상DB와, 상기 서비스 사이트에 업로드된 콘텐츠인 제공 대상 콘텐츠의 제공콘텐츠정보를 저장하는 제공콘텐츠DB 및, 상기 서비스 제공자로부터 상기 제공 대상 콘텐츠 중 제휴 콘텐츠를 식별하기 위한 식별자를 입력받아 저장하는 식별DB를 포함하는 콘텐츠저장모듈;
상기 제공콘텐츠정보와 상기 식별자 사이의 비교 처리를 통해 상기 제공 대상 콘텐츠로부터 상기 제휴 콘텐츠를 추출하는 제휴콘텐츠추출부 및, 상기 제휴 콘텐츠로 추출되지 않은 상기 제공 대상 콘텐츠를 비제휴 콘텐츠로 추출하는 비제휴콘텐츠추출부를 포함하는 제휴콘텐츠추출모듈;
상기 비제휴 콘텐츠의 상기 제공콘텐츠정보와 상기 보호콘텐츠정보 사이의 비교 처리를 통해 상기 비제휴 콘텐츠로부터 불법 콘텐츠를 추출하는 불법콘텐츠추출모듈;
기 설정된 분석기간 동안 상기 서비스 사이트에서 추출된 상기 제휴 콘텐츠의 수인 제휴빈도수를 파악하는 제휴빈도산출부 및, 상기 분석기간 동안 상기 서비스 사이트에서 추출된 상기 비제휴 콘텐츠의 수인 비제휴빈도수를 파악하는 비제휴추출부와, 상기 분석기간 동안 상기 서비스 사이트에서 추출된 상기 불법 콘텐츠의 수인 불법빈도수를 파악하는 불법빈도산출부 및, 상기 분석기간 동안 상기 서비스 사이트에 업로드된 상기 제공 대상 콘텐츠의 개수와 상기 제휴빈도수 및 상기 비제휴빈도수와 추출빈도수를 기반으로 콘텐츠통계를 생성하여 상기 서비스 제공자에게 제공하는 자료제공부를 포함하는 통계분석모듈;을 포함하는 것을 특징으로 하는, 저작권 보호를 위한 실시간 콘텐츠 모니터링 시스템.
A real-time content monitoring system for copyright protection,
A provider subscription module for receiving provider information including a service site address from a plurality of service providers;
A protection target DB for receiving and storing protection content information of a protection target content from a content provider; a provision target content DB for storing provision target content information of a target content, which is a content uploaded to the service site; A content storage module including an identification DB for receiving and storing an identifier for identifying an affiliated content among contents;
An affiliate content extracting unit that extracts the affiliate content from the content to be provided through a comparison process between the provided content information and the identifier, and a non-affiliated content extracting unit that extracts the content to be provided that has not been extracted by the affiliated content, An affiliate content extracting module including a content extracting unit;
An illegal content extraction module that extracts an illegal content from the non-affiliated content through comparison processing between the provided content information of the non-affiliated content and the protected content information;
An association frequency calculating unit for determining a frequency of association, which is the number of the affiliate contents extracted from the service site during a predetermined analysis period; and a ratio calculating unit for calculating a ratio An illegal frequency calculation unit for determining an illegal frequency that is the number of illegal contents extracted from the service site during the analysis period; and an illegal frequency calculating unit for calculating an illegal frequency based on the number of the contents to be provided, And a data providing unit configured to generate content statistics based on the frequency, the frequency of unassociation, and the frequency of extraction and provide the content statistics to the service provider.
삭제delete 제 1항에 있어서,
상기 불법콘텐츠추출모듈은,
상기 비제휴 콘텐츠의 상기 제공콘텐츠정보와 상기 보호콘텐츠정보를 비교 처리하여 상기 제공 대상 콘텐츠와 상기 보호 대상 콘텐츠 사이의 유사도를 판단하는 유사도판단부와,
상기 유사도가 기 설정된 기준값을 초과한 상기 제공 대상 콘텐츠를 불법 콘텐츠로 추출하는 유사도추출부를 더 포함하는 것을 특징으로 하는, 저작권 보호를 위한 실시간 콘텐츠 모니터링 시스템.
The method according to claim 1,
The illegal content extraction module includes:
A degree of similarity determination unit for comparing the provided content information of the non-affiliated content with the protected content information to determine a degree of similarity between the content to be provided and the content to be protected;
Further comprising a similarity extracting unit for extracting the contents to be provided having the similarity exceeding a preset reference value as illegal contents.
제 3항에 있어서,
상기 시스템은,
상기 보호 대상 콘텐츠의 해시값 특징정보를 추출하는 정보추출부 및, 해시값 특징정보를 저장하는 특징DB를 포함하는 특징정보저장모듈;을 더 포함하고,
상기 유사도판단부는,
상기 제공 대상 콘텐츠의 해시값을 파악하는 해시값분석파트 및,
상기 제공 대상 콘텐츠의 해시값을 상기 해시값 특징정보와 비교 처리하여 상기 제공 대상 콘텐츠와 상기 보호 대상 콘텐츠 사이의 유사도를 판단하는 해시값비교파트를 더 포함하는 것을 특징으로 하는, 저작권 보호를 위한 실시간 콘텐츠 모니터링 시스템.
The method of claim 3,
The system comprises:
An information extracting unit extracting the hash value feature information of the protected content, and a feature DB storing the hash value feature information,
Wherein the similarity-
A hash value analysis part for grasping a hash value of the content to be provided,
Further comprising a hash value comparison part for comparing the hash value of the content to be provided with the hash value feature information to determine the degree of similarity between the content to be provided and the protected content. Content monitoring system.
제 3항에 있어서,
상기 콘텐츠저장모듈은,
상기 제공 대상 콘텐츠와 관련된 관련텍스트를 수집하여 저장하는 관련텍스트DB를 더 포함하고,
상기 시스템은,
상기 보호 대상 콘텐츠의 키워드 특징정보를 추출하는 정보추출부 및, 상기 키워드 특징정보를 저장하는 특징DB를 포함하는 특징정보저장모듈; 및
복수개의 상기 관련텍스트로부터 관련어 특징정보를 추출하여 관련어DB에 저장하는 관련어추출모듈;을 더 포함하고,
상기 유사도판단부는,
상기 제공 대상 콘텐츠의 상기 관련어 특징정보와 상기 보호 대상 콘텐츠의 키워드 특징정보 사이의 비교 처리를 통해 상기 제공 대상 콘텐츠와 상기 보호 대상 콘텐츠 사이의 유사도를 판단하는 관련어비교파트를 더 포함하는 것을 특징으로 하는, 저작권 보호를 위한 실시간 콘텐츠 모니터링 시스템.
The method of claim 3,
The content storage module,
And a related text DB for collecting and storing related text related to the contents to be provided,
The system comprises:
An information extraction unit for extracting keyword feature information of the content to be protected, and a feature DB for storing the keyword feature information; And
And a related word extraction module for extracting related feature information from a plurality of related texts and storing related feature information in a DB,
Wherein the similarity-
Further comprising a related part comparison part for determining a degree of similarity between the content to be provided and the content to be protected through comparison processing between the related feature information of the content to be provided and the keyword feature information of the protection target content , Real-time content monitoring system for copyright protection.
삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete
KR1020190028051A 2019-03-12 2019-03-12 A Contents Monitering System For Protection Of Copyright KR101976802B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190028051A KR101976802B1 (en) 2019-03-12 2019-03-12 A Contents Monitering System For Protection Of Copyright

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190028051A KR101976802B1 (en) 2019-03-12 2019-03-12 A Contents Monitering System For Protection Of Copyright

Publications (1)

Publication Number Publication Date
KR101976802B1 true KR101976802B1 (en) 2019-05-09

Family

ID=66545785

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190028051A KR101976802B1 (en) 2019-03-12 2019-03-12 A Contents Monitering System For Protection Of Copyright

Country Status (1)

Country Link
KR (1) KR101976802B1 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101485128B1 (en) * 2013-09-27 2015-01-28 김병호 Method and system for collecting evidence of unlawfulness literary works
KR20150077492A (en) * 2013-12-27 2015-07-08 삼성전자주식회사 System and method for protecting personal contents right using context-based search engine
KR101800641B1 (en) * 2017-04-24 2017-11-23 주식회사 티온미디어 Content right protection system and method thereof

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101485128B1 (en) * 2013-09-27 2015-01-28 김병호 Method and system for collecting evidence of unlawfulness literary works
KR20150077492A (en) * 2013-12-27 2015-07-08 삼성전자주식회사 System and method for protecting personal contents right using context-based search engine
KR101800641B1 (en) * 2017-04-24 2017-11-23 주식회사 티온미디어 Content right protection system and method thereof

Similar Documents

Publication Publication Date Title
US8769296B2 (en) Software signature tracking
US20200226233A1 (en) Distributed ledger-based digital content piracy deterrence
WO2019105189A1 (en) Model training system and method, and storage medium
US20040221118A1 (en) Control of access to data content for read and/or write operations
CN101371490A (en) Methods and apparatus for implementing context-dependent file security
KR101977178B1 (en) Method for file forgery check based on block chain and computer readable recording medium applying the same
KR101000871B1 (en) Apparatus and method for control digital works
US20190018751A1 (en) Digital Asset Tracking System And Method
CN110443050B (en) Method and system for processing counterfeit process in file transparent encryption and decryption system
WO2018167328A1 (en) Data processing apparatus and methods
KR20210065588A (en) Contents registering and billing system and method for digital contents copyright protection
JP6729013B2 (en) Information processing system, information processing apparatus, and program
KR101976802B1 (en) A Contents Monitering System For Protection Of Copyright
KR101027502B1 (en) System and Method for Managing of Contents
US11570192B2 (en) Methods, systems, and devices for detecting over-the-top piracy
KR102141411B1 (en) The content based clean cloud systems and method
US11601403B2 (en) System and method for management of confidential data
JP5630193B2 (en) Operation restriction management program, operation restriction management apparatus, and operation restriction management method
KR100998596B1 (en) Administrative Data Backup System for Distributed Data Sources
KR100462829B1 (en) A method for determining validity of command and a system thereof
CN113660277B (en) Crawler-resisting method based on multiplexing embedded point information and processing terminal
WO2015069134A1 (en) Method for protecting intellectual property in peer-to-peer networks
CN116910788B (en) Searchable encryption management method and device for service data and storage medium
KR100488191B1 (en) Method for manufacturing contents that have function for dealing cracking and method for processing of that contents for dealing cracking
WO2009107049A2 (en) Content identification method

Legal Events

Date Code Title Description
A201 Request for examination
A302 Request for accelerated examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant