KR20040076712A - Digital rights management method using unlawful websites searching system - Google Patents

Digital rights management method using unlawful websites searching system Download PDF

Info

Publication number
KR20040076712A
KR20040076712A KR1020030012047A KR20030012047A KR20040076712A KR 20040076712 A KR20040076712 A KR 20040076712A KR 1020030012047 A KR1020030012047 A KR 1020030012047A KR 20030012047 A KR20030012047 A KR 20030012047A KR 20040076712 A KR20040076712 A KR 20040076712A
Authority
KR
South Korea
Prior art keywords
site
illegal
search
information
management method
Prior art date
Application number
KR1020030012047A
Other languages
Korean (ko)
Inventor
김시우
김덕환
Original Assignee
김시우
김덕환
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 김시우, 김덕환 filed Critical 김시우
Priority to KR1020030012047A priority Critical patent/KR20040076712A/en
Publication of KR20040076712A publication Critical patent/KR20040076712A/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/10Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services
    • G06Q50/184Intellectual property management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Technology Law (AREA)
  • Data Mining & Analysis (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Security & Cryptography (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Operations Research (AREA)
  • Economics (AREA)
  • Storage Device Security (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Multimedia (AREA)

Abstract

PURPOSE: A method for managing CONSTITUTION: The new

Description

디지털 저작권 불법 유통사이트 검색시스템을 이용한 저작권 관리방법 {Digital rights management method using unlawful websites searching system}Copyright management method using digital copyright illegal distribution site search system {Digital rights management method using unlawful websites searching system}

본 발명은 디지털 컨텐츠의 사용이 허가되지 않은 사용자가 불법으로 복제하여 인터넷 및 네트워크를 통해 확산시키는 것을 검색하여 경고 및 계도함으로써 디지털 저작권자의 권리를 보호해 줄 수 있도록 하는 저작권 관리방법에 관한 것으로, 더욱 상세하게는 인터넷상에서의 저작권 자료들의 사용상태를 자동으로 수시파악하여 정확한 저작권료의 징수를 유도하고 불법 유통사이트들이 더이상 불법 유통시키는 행위를 방지할 수 있도록 하는 디지털 저작권 불법 유통사이트 검색시스템을 이용한 저작권 관리방법에 관한 것이다.The present invention relates to a copyright management method that protects the rights of digital copyright holders by searching for, warning, and circumventing illegal copying by users who are not permitted to use digital contents to spread through the Internet and networks. In detail, copyright management using digital copyright illegal distribution site search system that automatically detects the usage status of copyrighted materials on the Internet, induces accurate collection of copyright fees, and prevents illegal distribution sites from illegally distributing them anymore. It is about a method.

오늘날 우리사회는 '지식정보사회'라고 요약할 수 있는데, 이는 컴퓨터의 발달, 정보통신 기술의 발달, 빠른 네트워크의 보급등에 힘입어 무서운 속도로 발전하고 있다. 하지만 제반기술의 발달과 인터넷 사용인구의 급증에 따라 정보화 역기능이 급속히 자라나고 있다. 정보화 역기능은 개인에게 개별적인 피해를 주는 것에서부터 시작하여 민간 및 공공기관, 국가전체에 이르기까지 다양한 유형과 방식으로 피해를 주고 있다. 이러한 피해는 단순히 피해에만 그치는 것이 아니라 앞으로 무한히 발전해 나갈 수 있는 지식정보화 사회의 발전속도를 지연시키고 퇴보시킨다는 점에 있어서, 또한 무한경쟁 시대에 국가경쟁력을 약화시킨다는 점에 있어서 심각한 문제가 아닐 수 없다.Today, our society can be summed up as 'Knowledge Information Society', which is developing at a frightening speed thanks to the development of computers, the development of information and communication technology, and the rapid spread of networks. However, with the development of various technologies and the rapid increase of the Internet population, the dysfunction of information is growing rapidly. Informatization dysfunction has been damaging in a variety of ways and ways, from individual damage to individuals, to private and public institutions, and the entire country. Such damages are not only damages but also serious problems in terms of delaying and regressing the speed of development of the knowledge-information society that can develop indefinitely and weakening national competitiveness in the age of infinite competition.

이러한 정보화의 역기능으로서 저작재산권의 침해가 있다. 저작권은 저작권법에 의하여 저작물의 이용에 관한 배타적인 권리로 보호되고 있다. 따라서 저작권이 있는 저작물을 이용하기 위하여는 저작재산권제한에 관한 규정에 의하여 저작물의 자유이용이 인정되거나, 저작권자에 대한 보상금을 지급 또는 공탁한 경우가 아닌 한 원칙적으로 저작권자의 허락을 요하며, 저작권자의 허락 없이 무단으로 저작물을 이용하는 것은 저작재산권 침해가 된다. 그러함에도 부도덕한 상혼에 의하여 오프라인 뿐만 아니라 온라인상에서도 저작물을 무단이용하는 사례가 많이 있다.There is an infringement of copyrighted property as a dysfunction of such informationization. Copyright is protected by an exclusive right under the copyright law regarding the use of the work. Therefore, in order to use copyrighted works, in principle the permission of the copyright holder is required unless the free use of the work is recognized under the provisions on the restriction of copyright property rights, or if compensation for the copyright holder is paid or deposited. Unauthorized use of a copyrighted work constitutes a copyright infringement. Nevertheless, there are many cases of unauthorized use of copyrighted works online as well as offline due to immoral marriages.

컴퓨터프로그램과 관련된 저작물의 경우 침해여부를 확인하기 위해서는 사업장 또는 사무실에서 사용하고 있는 PC에 등록된 프로그램을 점검용디스켓으로 확인한 후 검색된 프로그램에 대해서 정품확인을 요구한 후 정품을 확인시켜 주지 못하면 불법복제로 인정을 하고 있다. 그러나 수많은 컴퓨터를 대상으로 사용중인 소프트웨어가 정품여부인지를 확인하기 위해서는 엄청난 인력과 시간이 소요되는 문제점이 있다.In the case of works related to computer programs, to check for infringement, check the registered program on the PC used at the workplace or the office with the check disk, and request the authenticity of the searched program and then fail to verify the authenticity. I admit it. However, there is a problem that requires a lot of manpower and time to check whether the software being used for a large number of computers are genuine.

그리하여 효과적인 저작재산권에 대한 보호와 관리를 처리할 수 있는 에이전트 기반의 기술에 대한 관심이 커지고 있으며, 일례로써, DRM(Digital Rights Management; 디지털 저작권 관리)과 같이 다양한 채널을 통해 유통되는 전자 서적, 음악 파일, 영상 정보, 게임, 소프트웨어, 이미지 등의 각종 디지털 컨텐츠를 각종 불법 복제로부터 안전하게 보호하고, 이렇게 보호된 컨텐츠를 사용함으로써 컨텐츠 서비스의 유료화를 가능케 하는 기술 및 서비스의 필요성이 대두되고 있다.Thus, there is a growing interest in agent-based technologies that can handle the protection and management of effective copyright rights. For example, electronic books and music distributed through various channels such as Digital Rights Management (DRM). There is a need for a technology and a service that securely protects various digital contents such as files, video information, games, software, images, etc. from various illegal copies, and enables the payment of contents services by using such protected contents.

본 발명은 상기한 제반 사정을 감안하여 발명한 것으로, 보호하고 싶은 저작권 정보 검색어를 입력하여 해당 검색어와 유사한 단어들을 사용하는 해적 사이트를 자동적으로 검색하여 경고 및 계도함으로써 디지털 저작권을 보호하고, 디지털 컨텐츠를 유료화하는 데 있어 중요한 용도로서, 불법 복제를 방지할 수 있도록 하여 디지털 컨텐츠가 가진 상업적인 가치를 보호할 수 있도록 된 디지털 저작권 불법 유통사이트 검색시스템을 이용한 저작권 관리방법을 제공하고자 함에 목적이 있다.The present invention has been invented in view of the above-described circumstances, and protects digital copyrights by inputting copyright information search terms to be protected, automatically searching for pirate sites using words similar to the search terms, and warning and inheriting them. As an important use in monetization, the purpose of the present invention is to provide a copyright management method using a digital copyright illegal distribution site search system that can prevent illegal copying and protect the commercial value of digital content.

도 1은 본 발명의 바람직한 일실시예에 따른 검색엔진의 구성도,1 is a block diagram of a search engine according to an embodiment of the present invention;

도 2의 (a)는 본 발명에 따른 웹사이트 검색결과 분류별 주제어로 검색된 웹사이트에 대한 저작권정보 정보테이블,Figure 2 (a) is a copyright information information table for a website searched for a keyword by category of website search results according to the present invention,

도 2의 (b)는 본 발명에 따른 웹사이트 검색시 위법사이트를 판별하기 위한 기준자료인 적법사이트에 대한 저작권정보 정보테이블,2 (b) is a copyright information information table for the legitimate site, which is a reference material for determining an illegal site when searching a website according to the present invention;

도 3은 본 발명의 바람직한 일실시예에 따른 위법사이트검색방법을 설명하는 흐름도를 나타낸다.3 is a flowchart illustrating an illegal site search method according to an embodiment of the present invention.

<도면의 주요부분에 대한 부호의 설명><Description of the symbols for the main parts of the drawings>

10 -- 검색엔진, 11 -- 정보수집모듈,10-search engine, 11-information collection module,

12 -- DRM 데이터베이스, 13 -- 인덱서모듈,12-DRM database, 13-indexer module,

14 -- 쿼리웹서버모듈, 15 -- 모니터모듈.14-query web server module, 15-monitor module.

상기한 목적을 달성하기 위한 본 발명은, 디지털 저작권 불법 유통사이트 검색시스템에서 정보수집프로그램을 이용하여 인터넷망에 연결된 웹사이트들을 항해하면서 분류별 주제어로 검색하여 검색어와 일치하는 분류 경로 및 사이트에 대한 신규 저작권정보를 DRM데이터베이스에 저장하는 단계, 상기 신규 저작권정보를 사전에 구축된 적법사이트 목록과 비교하여 저작권침해 혐의가 있는지 여부를 판단하는 단계, 저작권침해 혐의가 있는 사이트로 판단되면 혐의사이트목록으로 분류저장하고 해당 혐의사이트 홈페이지의 소스를 분석하여 위법사이트인지 여부를 판단하는 단계, 위법사이트인 것으로 판단되면 1차 경고 및 계도함과 아울러 위법사이트로 2회 판정되어지는 경우 침해소송대상사이트로 분류하여 운용자에게 통지하는 단계로 이루어져 있다.In order to achieve the above object, the present invention provides a novel search method for classification paths and sites that match the search terms by searching the main keywords by classification while navigating websites connected to the Internet using an information collection program in a digital copyright illegal distribution site search system. Storing copyright information in the DRM database, comparing the new copyright information with a list of previously established legitimate sites, and determining whether there is a suspicion of copyright infringement; Storing and analyzing the source of the alleged site's homepage to determine whether it is an illegal site, and if it is determined to be an illegal site, it is classified as a target of infringement litigation if it is determined to be an illegal site twice. Notifying the operator have.

상기 정보수집프로그램은 메타검색엔진을 이용하는 것을 특징으로 한다.The information collection program is characterized by using a meta search engine.

또한, 상기 DRM데이터베이스에 저장하는 저작권정보는 역색인방법으로 저장하는 것을 특징으로 한다.In addition, the copyright information stored in the DRM database is characterized by storing in the inverse index method.

이하 본 발명의 바람직한 일실시예에 대한 구성 및 작용을 첨부한 예시도면에 의거하여 상세히 설명한다.Hereinafter, the configuration and operation of the preferred embodiment of the present invention will be described in detail with reference to the accompanying drawings.

도 1은 본 발명의 바람직한 일실시예에 따른 검색엔진의 구조를 나타낸다.1 shows the structure of a search engine according to a preferred embodiment of the present invention.

첨부도면에 도시된 바와 같이 저작권 검색엔진에는 인터넷망에 연결된 웹사이트들의 검색결과를 수집하는 정보수집프로그램인 정보수집모듈(11)과 상기 수집 정보를 역색인(Inverted Index) 기법을 사용하여 DRM 데이터베이스(12)에 저장하는 인덱서모듈(13), 각종 질의를 처리하는 쿼리웹서버모듈(14), 상기 질의처리결과를 확인하는 모니터모듈(15)로 이루어져 있다.As shown in the accompanying drawings, the copyright search engine includes an information collection module 11, which is an information collection program for collecting search results of websites connected to the Internet network, and a DRM database using the inverted index technique. An indexer module 13 stored in (12), a query web server module 14 for processing various queries, and a monitor module 15 for checking the query processing results.

상기 정보수집모듈(11)로는, 국내 검색엔진 사이트들의 디렉토리들을 검색하여 저작권 DB에 속해 있는 키워드들이 포함된 사이트들을 추출해내는 정보수집프로그램으로서 예컨대 메타검색엔진인 크롤러가 탑재되어 있다. 상기 메타검색엔진으로는 크롤러 이외에 스파이더 등과 같이 동종기능을 수행하는 기타 검색엔진을 이용할 수도 있는 것으로, 이러한 메타검색엔진은 여러개의 포탈사이트들(예컨대 라이코스, 한미르, 까치네, 네이버, 심마니, 엠파스, 알타비스타 등)과 같은 각 분야의 전문 DB검색서비스업체중 선택된 포탈사이트에 분류된 디렉토리정보(웹상의 사이트가 속한 분류 및 사이트 요약정보)를 분류별 주제어로 검색하고 그 검색결과를재구성해서 제공하는 검색기능을 구비하고 있기 때문에 여러 업체를 일일이 찾아 다니면서 검색하지 않고 한번에 검색결과를 확인할 수 있는 장점이 있다.As the information collecting module 11, a crawler which is, for example, a meta search engine, is installed as an information collecting program that searches directories of domestic search engine sites and extracts sites including keywords belonging to a copyright DB. The meta search engine may use other search engines that perform homogeneous functions, such as spiders, in addition to crawlers, and such meta search engines may include a plurality of portal sites (eg, Lycos, Hanmir, Catchin, Naver, Simmani, Empas, Alta). Search function that searches the directory information (classification and site summary information belonging to the web site belonging to the selected portal site) among specialized DB search service companies in each field such as Vista as a subject by classification and reconstructs the search results. Because it is equipped with the advantage that you can check the search results at once without having to search for several companies one by one.

상기 DRM 데이터베이스(12)에는 분류별 주제어를 바탕으로 검색되는 웹사이트 검색결과에 대한 저작권정보가 저장되며, 이러한 저작권정보의 정보테이블은 도 2의 (a)에 도시된 바와 같이 웹사이트명, 문서명, URL, 저작권내용, 분류 주제어, 포탈사이트명으로 이루어져 있다. 또한, 검색되는 웹사이트들에 대하여 적법 사이트인지 혹은 저작권침해 혐의가 있는 후보사이트인지를 판단하기 위한 기준자료로서의 저작권정보도 저장되어 있으며, 이러한 비교기준자료로서의 저작권정보의 정보테이블은 도 2의 (b)에 도시된 바와 같이 웹사이트명, 문서명, URL, 저작권내용, 분류 주제어로 이루어져 있는데, 이는 계약된 사용자로부터 입력을 받아 저장되는 정보이다.The DRM database 12 stores copyright information on a web site search result searched based on the subject matter of each category. The information table of the copyright information includes a web site name, a document name, a name as shown in FIG. It consists of URL, copyright content, categorized keyword, and portal site name. In addition, copyright information as reference data for determining whether the website is searched for or whether it is a legitimate site or a suspected copyright infringement is stored. The information table of the copyright information as the reference data is shown in FIG. As shown in b), it consists of website name, document name, URL, copyright contents, and classification subject words. This is information stored by receiving input from a contracted user.

다음에는 인덱서모듈(13)이 정보수집모듈(11)의 검색결과를 역색인 기법을 사용하여 DRM 데이터베이스(12)에 저장하는 과정에 대하여 설명한다.Next, a process of the indexer module 13 storing the search results of the information collection module 11 in the DRM database 12 using an inverted index technique will be described.

색인은 단어들의 집합과 문서별 단어 출현 위치 및 빈도, 그 단어를 통해 사상(mapping)되는 유사단어들의 집합으로 구성된다. 예를 들어 "i love you," "god is love," "love is blind," and "blind justice."와 같은 4개의 문장이 있을때 각 단어들은 다음과 같이 역색인된다.The index consists of a set of words, the location and frequency of word occurrences in each document, and a set of similar words that are mapped through the words. For example, if there are four sentences like "i love you," "god is love," "love is blind," and "blind justice."

blind (3,8);(4,0)blind (3,8); (4,0)

god (2,0)god (2,0)

i (1,0)i (1,0)

is (2,4);(3,5)is (2,4); (3,5)

justice (4,6)justice (4,6)

love (1,2);(2,7);(3,0)love (1,2); (2,7); (3,0)

you(1,7)you (1,7)

여기서 blind는 3번째 문장 9번째부터 시작하므로 3,8이고 4번째 문장 처음부터 시작하므로 4.0으로 색인되고, 이하 마찬가지 방법으로 색인되어지게 되며, 이러한 방법을 통해 단어가 어느 문장에 있는지 빈도를 찾을 때 사용한다.Here blind is 3, 8 because it starts from the 3rd sentence, and since it starts from the beginning of the 4th sentence, it is indexed as 4.0, and is indexed in the same way as below. When this method is used to find the frequency in which sentence use.

또한 유사단어들과 관련해서는, 예를 들어 야휴 포탈사이트에서 "C 언어"라는 단어는 알타비스타 포탈사이트에서 "프로그래밍 언어"라는 단어로 사상될 수 있으며, 역색인 목록의 사상관계를 이용하여 사용자 질의를 재구성하여 질의의 리콜(recall)과 정확도(precision)를 향상시킬 수 있다.In addition, with respect to similar words, for example, the word "C language" can be mapped to the word "programming language" in the AltaVista portal site, for example in the Yahual portal site, and the user query is made using the mapping relationship of the index index. By reconstructing, we can improve the recall and precision of the query.

쿼리웹서버모듈(14)은 본 시스템의 운용자가 웹사이트들을 서핑하여 저작권침해 혐의가 있는 웹사이트를 검색하기 위한 주제어 입력, 여러 개의 포탈사이트 중에서 찾고자 하는 포탈사이트들의 선택 혹은 입력, 해당 분야에서 저작권에 대하여 질의하고자 하는 단어들을 입력할 수 있도록 하는 작용을 한다.The query web server module 14 allows the operator of the system to surf websites to input a keyword for searching for allegedly infringing websites, the selection or input of portal sites to be searched among several portal sites, and the copyright in the relevant field. This function allows you to enter the words you want to inquire about.

즉, 쿼리웹서버모듈(14)은 운용자에 의해 저작권에 대해 문의하고 싶은 검색어가 입력되면 역색인 목록을 이용하여 각 포탈사이트별로 질의를 재구성한 후 DRM 데이터베이스(12)에 SQL 질의를 하여 결과를 구하게 된다. 이 과정에서 역색인 리스트에 색인된 단어별 문서 빈도수가 높은 순서로 결과 레코드를 랭킹한다. 이들 중 DRM 데이터베이스(12)의 적합한 사이트 저작권 정보 테이블에 존재하는 레코드는 "적합한 사이트" 태그가 붙여지고 그렇지 못한 레코드들은 위법사이트로 추정되는 후보리스트에 저장되게 된다.That is, the query web server module 14 reconstructs a query for each portal site by using an inverted index list when an operator wants to inquire about copyright by an operator, and then performs an SQL query on the DRM database 12 to generate a result. You will get it. In this process, the result records are ranked in order of the frequency of the documents by word indexed in the inverted index list. Of these, records existing in the appropriate site copyright information table of the DRM database 12 are tagged with "suitable site" and records not otherwise stored in a candidate list presumed to be an illegal site.

모니터모듈(15)은 쿼리웹서버모듈(14)을 통해 구해진 질의 결과중에서 저작권침해 혐의가 있는 사이트로 추정되는 후보리스트들에 대해 실제 위법사이트인지 확인하는 적합성 피드백 과정을 수행한다. 기존의 검색엔진은 이와 같은 후보리스트에 대한 사용자의 적합성 피드백 과정을 포함지 않는다. 본 발명에서는 시스템 운용자가 저작권 정보중 주요 단어들을 다시 입력할 수 있도록 하고, 입력된 단어들이 후보리스트에 속한 문서들에 나타나는지 여부를 검색하도록 되어 있다. 이 과정은 2차 크롤러를 통해 수행되며 검색결과는 후보리스트에 속한 문서들에 검색한 단어들이 발생한 빈도로 나타낸다. 그리고 최종적으로 시스템 운용자가 후보리스트에 속한 문서가 저작권을 침해하였는지 여부를 판정하게 되며, 모니터모듈(15)은 이를 위한 유용한 정보를 제공하게 되는 것이다.The monitor module 15 performs a suitability feedback process for checking whether the actual list of illegal sites is a candidate list suspected of copyright infringement among query results obtained through the query web server module 14. Existing search engines do not include the user's suitability feedback process for such candidate lists. In the present invention, the system operator can re-enter key words of the copyright information, and search whether the entered words appear in documents belonging to the candidate list. This process is performed by the secondary crawler, and the search results are shown as the frequency of occurrence of words searched for documents in the candidate list. Finally, the system operator determines whether the document belonging to the candidate list infringes copyright, and the monitor module 15 provides useful information for this.

도 3은 본 발명의 바람직한 일실시예에 따른 위법사이트검색방법을 설명하는 흐름도를 나타내는 것으로, 이를 실제 검색예인 도 4a 내지 도 4d를 참조로 설명한다.3 is a flowchart illustrating an illegal site search method according to an embodiment of the present invention, which will be described with reference to FIGS. 4A to 4D, which are actual search examples.

먼저, 정보수집모듈(11)인 크롤러를 통해 웹사이트들의 정보를 수집하기 위하여 포탈사이트들로부터 search.txt 파일에 웹사이트를 저장한다. 즉, 찾고 싶은 분야로서, 예를 들어 "음악" "만화"와 같은 주제를 갖고 있는 웹사이트들을 검색어에 입력한다(도 4a 참조).First, in order to collect information of websites through a crawler that is an information collection module 11, websites are stored in a search.txt file from portal sites. In other words, as a field to be searched, for example, websites having a theme such as "music" or "cartoon" are input to a search word (see FIG. 4A).

그러면 도 4b와 같은 화면이 출력된다. 이때 여러 개의 포탈사이트들 중에서 찾고자 하는 포탈사이트들의 선택 체크박스에 체크를 하고 확인버튼인 OK버튼을 누른다.The screen as shown in FIG. 4B is output. At this time, check the selection boxes of portal sites to be searched among multiple portal sites and press the OK button.

그 결과 자동으로 선택된 검색엔진들의 디렉토리를 찾아 관련된 사이트들을 DRM 데이터베이스(12)에 저장하여 메타검색엔진을 만든다.As a result, it automatically finds a directory of selected search engines and stores related sites in the DRM database 12 to create a meta search engine.

이어 도 4c와 같은 검색어 입력창을 통하여 저작권에 대해 문의를 하고 싶은 단어를 입력한다. 여기에 예컨대 CCM이라고 입력하면 도 4d와 같은 CCM에 관련된 사이트들을 리스트하게 된다.Subsequently, a word to be inquired about copyright is input through a search word input window as shown in FIG. 4C. Entering, for example, CCM here will list sites related to the CCM as shown in FIG. 4D.

상기 리스트에 포함되어 있는 사이트들을 이미 사전에 구축해 놓은 적법사이트들과 비교하여 적법사이트에 포함되어 있지 않은 사이트들은 저작권침해 혐의가 있는 사이트로 분류하여 별도 목록을 작성하고, 이들중에서 예컨대 "다운로드" 등과 같이 침해우려가 높은 단어를 포함하고 있는 사이트들을 최종 후보리스트로 분류저장한다.Compare the sites included in the list with the legal sites that have been built in advance, and the sites not included in the legal sites are categorized as allegedly infringing sites, and a separate list is created. Sites containing high-risk words are classified and saved as a final candidate list.

이를 바탕으로 해당 홈페이지의 소스를 분석하여 저작권침해 여부를 판단하여 위법사이트인지 여부를 최종 결정할 수 있도록 한다.Based on this, the source of the homepage is analyzed to determine whether it is copyright infringement and finally determine whether it is an illegal site.

그리하여 위법사이트인 것으로 판정되면 해당 사이트에 경고 및 계도 통지를 한 후, DRM 데이터베이스(12)에 별도 저장하고, 이들에 대해 모니터모듈(15)을 통해 주기적으로 체크하여 저작권침해행위가 계속적으로 이루어지고 있는 지를 집중 체크하며, 향후 재차 위법사이트로서 추출되어지게 되면 침해소송대상사이트로 분류저장하여 운용자로 하여금 소송등을 통해 민형사적인 구제절차를 밟을 수 있도록한다.Therefore, if it is determined that it is an offense site, a warning and genealogy notice is given to the corresponding site, and it is separately stored in the DRM database 12, and periodically checked through the monitor module 15 for copyright infringement. If it is extracted again as an illegal site in the future, it is classified and stored as an infringement litigation site so that the operator can take civil and criminal remedies through litigation.

상기한 바와 같이 본 발명이 상용화되어 인터넷 기업에 적용되면 인넷상의 저작권을 보호할 수 있어서 인터넷 콘텐츠 사업의 부흥을 유도할 수 있고, 각 저작물의 인터넷상의 활용도를 실시간으로 확인할 수 있기 때문에 고객의 저작물 사용 패턴을 수집 분석하여 기업 수익의 극대화로도 연결 시킬 수 있다. 본 발명의 주된 응용 분야로는 영화, 음악, 만화 등의 문화 컨텐츠에 바로 적용할 수 있으며, 또 다른 주요한 기대 효과로서 이 기술의 메타 검색 엔진 기술을 원천 기술로 활용할 수 있는 분야에 적용 가능하다. 즉, 여성 전용의 메타 검색 엔진이나 특정 컨텐츠 중심의 검색 엔진등과 같은 특화된 영역의 메타 검색 엔진으로도 활용 가능하여 폭넓은 분야에서 인터넷 저작물에 대한 보호를 강구할 수 있는 장점이 있다.As described above, when the present invention is commercialized and applied to Internet companies, it is possible to protect copyrights on the Internet, thereby inducing revival of the Internet contents business, and confirming the utilization of each work on the Internet in real time. Collecting and analyzing usage patterns can also lead to maximization of corporate profits. The main application fields of the present invention can be directly applied to cultural contents such as movies, music, and cartoons, and can be applied to fields that can utilize the meta search engine technology of this technology as a source technology as another main expected effect. That is, it can be used as a meta search engine in a specialized area such as a women-only meta search engine or a specific content-oriented search engine, and thus, there is an advantage in that it is possible to seek protection for Internet works in a wide range of fields.

Claims (3)

디지털 저작권 불법 유통사이트 검색시스템에서 정보수집프로그램을 이용하여 인터넷망에 연결된 웹사이트들을 항해하면서 분류별 주제어로 검색하여 검색어와 일치하는 분류 경로 및 사이트에 대한 신규 저작권정보를 DRM데이터베이스에 저장하는 단계, 상기 신규 저작권정보를 사전에 구축된 적법사이트 목록과 비교하여 저작권침해 혐의가 있는지 여부를 판단하는 단계, 저작권침해 혐의가 있는 사이트로 판단되면 혐의사이트목록으로 분류저장하고 해당 혐의사이트 홈페이지의 소스를 분석하여 위법사이트인지 여부를 판단하는 단계, 위법사이트인 것으로 판단되면 1차 경고 및 계도함과 아울러 위법사이트로 2회 판정되어지는 경우 침해소송대상사이트로 분류하여 운용자에게 통지하는 단계로 이루어진 디지털 저작권 불법 유통사이트 검색시스템을 이용한 저작권 관리방법.In the digital copyright illegal distribution site search system, using the information collection program to navigate the websites connected to the Internet network to search by the key words for each category to store new copyright information about the classification path and site matching the search term in the DRM database, Steps of judging whether there is a suspicion of copyright infringement by comparing new copyright information with a list of previously established legal sites, and if it is determined that the site is suspected of copyright infringement, it is classified and stored as a list of suspected sites and analyzed the source of the suspected homepage. Determining whether it is an illegal site; If it is determined to be an illegal site, the first warning and guiding, and if it is determined to be an illegal site twice, classify it as an infringed litigation site and notify the operator of illegal digital rights distribution. When searching the site Copyright management method using the system. 제1항에 있어서, 상기 정보수집프로그램은 메타검색엔진을 이용하는 것을 특징으로 하는 디지털 저작권 불법 유통사이트 검색시스템을 이용한 저작권 관리방법.The copyright management method according to claim 1, wherein the information collection program uses a meta search engine. 제1항 또는 제2항에 있어서, 상기 DRM데이터베이스에 저장하는 저작권정보는 역색인방법으로 저장하는 것을 특징으로 하는 디지털 저작권 불법 유통사이트 검색시스템을 이용한 저작권 관리방법.The copyright management method according to claim 1 or 2, wherein the copyright information stored in the DRM database is stored in an inverted index method.
KR1020030012047A 2003-02-26 2003-02-26 Digital rights management method using unlawful websites searching system KR20040076712A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020030012047A KR20040076712A (en) 2003-02-26 2003-02-26 Digital rights management method using unlawful websites searching system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020030012047A KR20040076712A (en) 2003-02-26 2003-02-26 Digital rights management method using unlawful websites searching system

Publications (1)

Publication Number Publication Date
KR20040076712A true KR20040076712A (en) 2004-09-03

Family

ID=37362804

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020030012047A KR20040076712A (en) 2003-02-26 2003-02-26 Digital rights management method using unlawful websites searching system

Country Status (1)

Country Link
KR (1) KR20040076712A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180055170A (en) 2016-11-16 2018-05-25 (주)아이와즈 Artificial intelligence system for detecting life cycle of osp site using machine learning
KR102594382B1 (en) 2023-06-20 2023-10-26 주식회사 쿵월드 System to detect copyright of contents and prevent illegal use of copyrighted contents based on artificial intelligence

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180055170A (en) 2016-11-16 2018-05-25 (주)아이와즈 Artificial intelligence system for detecting life cycle of osp site using machine learning
KR102594382B1 (en) 2023-06-20 2023-10-26 주식회사 쿵월드 System to detect copyright of contents and prevent illegal use of copyrighted contents based on artificial intelligence

Similar Documents

Publication Publication Date Title
US11023438B2 (en) System and method for exposing internal search indices to internet search engines
US10482134B2 (en) Document management techniques to account for user-specific patterns in document metadata
AU2004258511B2 (en) System and method for electronically managing composite documents
US8644646B2 (en) Automatic identification of digital content related to a block of text, such as a blog entry
US7610382B1 (en) System and method for marking content
US6289341B1 (en) Intelligent agent for identifying intellectual property infringement issues in computer network sites and method of operation thereof
US5991751A (en) System, method, and computer program product for patent-centric and group-oriented data processing
US8800043B2 (en) Pre-emptive pre-indexing of sensitive and vulnerable assets
US20110119293A1 (en) Method And System For Reverse Pattern Recognition Matching
US10983956B1 (en) Third-party indexable text
KR100930077B1 (en) Watermark Tracking System for Digital Rights Management
KR20040076712A (en) Digital rights management method using unlawful websites searching system
US9275195B1 (en) Intermediated rights management
Albertsen The paradigma web harvesting environment
JP5430618B2 (en) Dynamic icon overlay system and method for creating a dynamic overlay
US20070061276A1 (en) Device and method for registering a plurality of types of information
WO2023102044A1 (en) Systems and methods for detecting sources of pirated media in a network
Lawless Against Search Engine Volition
Valerio A Methodology to Retrieve, to Manage, to Classify and to Query Open Source Information
Crowley " Forensic" computer information for those engaged in the preservation of data and recovery of assets
Hester Find It All with SharePoint Enterprise Search
Patel Authors v. Archivers: The Copyright Infringement Battle Over Web Pages
Mandelecha Prototype Digital Forensics Repository
Ranjan A Strategic View towards a Digital Library for Higher Education in India

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application