KR101498658B1 - Method for identificating file based on torrent protocol and file identification apparatus using the same - Google Patents
Method for identificating file based on torrent protocol and file identification apparatus using the same Download PDFInfo
- Publication number
- KR101498658B1 KR101498658B1 KR1020130074405A KR20130074405A KR101498658B1 KR 101498658 B1 KR101498658 B1 KR 101498658B1 KR 1020130074405 A KR1020130074405 A KR 1020130074405A KR 20130074405 A KR20130074405 A KR 20130074405A KR 101498658 B1 KR101498658 B1 KR 101498658B1
- Authority
- KR
- South Korea
- Prior art keywords
- file
- hash value
- original
- torrent
- information
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 24
- 239000012634 fragment Substances 0.000 claims abstract description 77
- 239000000463 material Substances 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 10
- 238000012795 verification Methods 0.000 description 7
- 238000012546 transfer Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 241000218645 Cedrus Species 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/10—Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/13—File access structures, e.g. distributed indices
- G06F16/137—Hash-based
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Technology Law (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Abstract
본 발명은 원본 파일의 미리 설정된 영역에 대하여 해쉬 알고리즘을 이용하여 파일 조각 길이별 해쉬값을 생성하는 해쉬값 생성부, 상기 파일 조각 길이별 해쉬값을 저장하는 저장부 및 토렌토 파일의 파일 조각에 대한 해쉬값과 상기 원본 파일에 대한 파일 조각 길이별 해쉬값을 비교하여, 원본 파일 매칭 정보를 생성하는 파일 조각 비교부를 포함하는 토렌트 프로토콜 기반의 파일 확인 장치를 제공한다.
본 발명에 따르면, 원본 파일에 대한 파일 조각 길이별 각각의 해쉬값이 저장되어 있는 원본 파일 확인 서버를 이용하여 원본 파일을 다운로드 받지 않고서도 토렌트 파일 정보만을 이용하여 토렌트 파일이 가지고 있는 원본 파일 정보를 확인할 수 있음으로 토렌트 프로토콜 기반의 파일 공유 환경에서 저작권 위반 파일과 관계되는 시드 파일을 간편하게 검색한 후 삭제할 수 있음으로 저작권 위반 파일의 불법적인 유통을 획기적으로 단축하거나 과금을 간편하게 할 수 있다. A hash value generator for generating a hash value for each file fragment length using a hash algorithm for a predetermined area of an original file, a storage for storing the hash value for each file fragment length, And a file fragment comparing unit for comparing the hash value with a hash value for each file fragment length of the original file to generate original file matching information.
According to the present invention, the original file information stored in the torrent file is used only by using the torrent file information without downloading the original file using the original file check server in which each hash value of the original file is stored. It is possible to easily search and delete the seed file related to the copyright violation file in the file sharing environment based on the torrent protocol, so that the illegal distribution of the copyright violation file can be greatly shortened or the billing can be simplified.
Description
본 발명은 토렌트 프로토콜 기반의 원본 파일 확인 방법 및 그 방법을 이용한 원본 파일 확인 장치에 관한 것으로서, 더욱 상세하게는 토렌트 프로토콜 기반에서 원본 파일을 다운로드 하지 않고서도 토렌트 파일 정보만으로 원본 파일의 정보를 알 수 있는 토렌트 프로토콜 기반의 원본 파일 확인 방법 및 그 방법을 이용한 원본 파일 확인 장치에 관한 것이다.
The present invention relates to an original file checking method based on a torrent protocol and an original file checking apparatus using the method. More specifically, the present invention relates to an original file checking method using a torrent protocol, A method of identifying an original file based on a torrent protocol, and an apparatus for identifying an original file using the method.
인터넷 기반의 정보통신 기술의 발달과 더불어 컴퓨터를 통한 정보교환은 엄청나게 늘어났으며, 텍스트 또는 작은 용량의 이미지의 전송에서 대용량 파일의 전송이 가능하게 되었다. 즉 초고속 인터넷과 컴퓨터의 보급으로 음악이나, 영화, 드라마와 같은 대용량의 파일을 공유할 수 있는 P2P 또는 웹하드가 등장하게 되었다.
Along with the development of Internet-based information and communication technologies, the exchange of information through computers has increased enormously and it has become possible to transmit large-sized files in transmission of text or small capacity images. In other words, with the spread of high-speed internet and computers, P2P or web hard that can share large files such as music, movie, drama has appeared.
이러한 파일 공유 방법의 P2P 파일 전송 프로토콜로 비트 토렌트(BitTorrent)가 있으며, 상기 비트 토렌트는 P2P 파일 전송 프로토콜을 이용하는 응용 소프트웨어를 총칭하고 있다. 비트 토렌트를 이용하면 파일을 인터넷 상에 분산하여 저장되어 있는 다수의 접속을 통하여 네트워크 망을 통하여 여러 곳에서 동시에 여러 파일 조각을 다운받을 수 있기 때문에 다운로드 속도가 크게 향상되는 효과를 얻을 수 있다.
BitTorrent is a P2P file transfer protocol of the file sharing method, and the bittorrent is collectively referred to as application software using a P2P file transfer protocol. BitTorrent allows users to download multiple file fragments simultaneously from multiple locations over a network through multiple connections stored on the Internet, resulting in a greatly improved download speed.
비트토렌트는 본래 분산 해시 테이블을 활용하여 오픈소스 저작권 하에서 배포하였으며, 이와 호환된 μTorrent 등 각종 클라이언트(client)가 만들어져 널리 이용되고 있다. 이러한 비트토렌트는 크게 클라이언트(client)와 트랙커(Tracker)로 구성이 되며, 클라이언트에서 생성된 .torrent 파일(시드 파일)을 웹페이지, 웹하드 등으로 공유함으로써 서비스가 시작된다. 즉, 공유하려는 파일을 가진 자가 자신의 컴퓨터에 설치된 비트토렌트 클라이언트를 통해 .torrent 파일을 생성하고 이를 공유함으로써 시더(Seeder) 역할을 하게 되며, 이를 다운로드 받은 사람들이 다시 .torrent 파일을 공유함으로써 여러 사람이 하나의 파일을 여러 컴퓨터에서 다운로드 받을 수 있는 형태를 가지게 된다.
BitTorrent is originally distributed under open source copyright by using distributed hash tables, and various clients such as μTorrent compatible are being made and widely used. This bittorrent consists of a client and a tracker. The service is started by sharing the .torrent file (seed file) generated by the client to a web page, a web hard, and the like. In other words, a person who has a file to share with will create a .torrent file through a BitTorrent client installed on his computer, share it, and become a Seeder. By downloading the .torrent file, This single file can be downloaded from multiple computers.
도 1은 종래 토렌트 파일을 공유하는 방법을 설명하기 위한 개략도이다. 1 is a schematic diagram for explaining a method of sharing a conventional torrent file.
도 1에서 보는 바와 같이, 토렌트 파일A_hash A(10), 토렌트 파일B_hash B(20) 및 토렌트 파일C_hash C(30)는 동일한 원본 파일(a 및 b)를 포함하고 있으나 각각의 해쉬값(hash A, hash B, hash C)이 달라 서로 다운로드나 업로드가 불가능하다. 특히 토렌트 파일 B_hash B(20)와 토렌트 파일 C_hash C(30)는 완전하게 동일한 원본 파일(a 및 b)를 가지고 있더라도 조각파일을 크기(size)에 따라 다른 해쉬값을 갖는 다른 토렌트 파일이 생성되어 서로 다운로드나 업로드가 불가능하다.
1, the torrent
따라서 동일한 원본 파일이 그룹형태 또는 조각파일의 크기 등에 따라 토렌트 프로토콜을 이용하여 생성된 토렌트 파일의 해쉬값이 다르더라도 토렌트 파일 정보만으로 원본 파일을 다운로드 할 필요없이 원본 파일의 정보를 확인하여 저작권 위반 또는 음란물에 대한 단속이 가능함과 동시에 원본 파일을 가지고 있는 토렌트 파일들에 대한 정보를 피어에게 제공하여 다운로드의 속도 향상 및 성공 확률을 높임으로써 파일 공유의 효율성을 향상시킬 수 있는 새로운 파일 확인 방법 및 장치가 필요하다.
Therefore, even if the hash value of the torrent file generated using the torrent protocol differs according to the group type, the size of the fragmented file, or the like of the same original file, the information of the original file can be checked without the downloading of the original file using only the torrent file information, A new file identification method and apparatus capable of improving the efficiency of file sharing by increasing the speed of downloading and increasing the probability of success by providing information about the torrent files having the original file to the peer need.
본 발명은 상술한 문제점을 해결하기 위해 안출된 것으로서, 본 발명의 목적은 토렌트 프로토콜 기반에서 원본 파일을 다운로드 하지 않고서도 토렌트 파일 정보만으로 원본 파일의 정보를 알 수 있는 토렌트 프로토콜 기반의 원본 파일 확인 방법 및 그 방법을 이용한 원본 파일 확인 장치를 제공하기 위한 것이다.
SUMMARY OF THE INVENTION The present invention has been made to solve the above-mentioned problems, and an object of the present invention is to provide a torrent protocol based original file verification method capable of knowing information of an original file with only torrent file information without downloading an original file based on a torrent protocol And an original file checking apparatus using the method.
본 발명의 또 다른 목적은, 상기 생성된 원본 파일 매칭 정보를 이용하여 토렌트 프로토콜 기반의 파일 공유 환경에서 간편하게 저작권 위반 파일 및 음란물에 대한 공유를 방지할 수 있는 토렌트 프로토콜 기반의 원본 파일 확인 방법 및 그 방법을 이용한 원본 파일 확인 장치를 제공하기 위한 것이다.
It is still another object of the present invention to provide a method and apparatus for confirming an original file based on a torrent protocol that can easily prevent sharing of copyright violation files and pornographic materials in a file sharing environment based on a torrent protocol using the generated original file matching information, And to provide an apparatus for checking original files using the method.
삭제delete
삭제delete
삭제delete
상기 과제를 해결하기 위해, 본 발명의 일실시예인 토렌트 프로토콜 기반의 파일 확인 장치는 원본 파일의 미리 설정된 영역에 대하여 해쉬 알고리즘을 이용하여 파일 조각 길이별 해쉬값을 생성하는 해쉬값 생성부, 상기 파일 조각 길이별 해쉬값을 저장하는 저장부 및 토렌토 파일의 파일 조각에 대한 해쉬값과 상기 원본 파일에 대한 파일 조각 길이별 해쉬값을 비교하여, 원본 파일 매칭 정보를 생성하는 파일 조각 비교부를 포함할 수 있다.
According to an embodiment of the present invention, a file checking apparatus based on a torrent protocol includes a hash value generator for generating a hash value for each file fragment length using a hash algorithm for a predetermined area of an original file, And a file fragment comparing unit for comparing the hash value of the file fragment of the torrent file with the hash value of the file fragment length of the original file by storing the hash value of each fragment length and generating the original file matching information have.
본 발명의 또 다른 일실시예의 일태양에 의하면, 상기 원본 파일 매칭 정보와 저작권 위반 여부 또는 음란물에 대한 공유 위반 정보를 비교하여 공유 위반 파일 정보를 생성하는 공유 위반 판단부를 더 포함할 수 있다.
According to another embodiment of the present invention, the sharing violation determining unit may further include a sharing violation determining unit for comparing the original file matching information with copyright violation information or sharing violation information about pornographic material to generate sharing violation file information.
상기와 같은 본 발명에 따르면, 원본 파일에 대한 파일 조각 길이별 각각의 해쉬값이 저장되어 있는 원본 파일 확인 서버를 이용하여 원본 파일을 다운로드 받지 않고서도 토렌트 파일 정보만을 이용하여 토렌트 파일이 가지고 있는 원본 파일 정보를 확인할 수 있음으로 토렌트 프로토콜 기반의 파일 공유 환경에서 저작권 위반 파일과 관계되는 시드 파일을 간편하게 검색한 후 삭제함에 따라 저작권 위반 파일의 불법적인 유통을 획기적으로 단축하거나 과금을 간편하게 할 수 있다.
According to the present invention as described above, even if the original file is not downloaded using the original file check server in which each hash value of the original file is stored according to the file fragment length, The file information can be confirmed. Therefore, in the file sharing environment based on the torrent protocol, the seed file related to the copyright violation file can be easily searched and deleted, thereby illegally distributing the copyright violation file can be dramatically shortened or the billing can be simplified.
또한 원본 파일 확인 서버에서 동일한 원본 파일을 포함하는 서로 다른 해쉬값을 갖는 원본 파일 매칭 정보를 피어에게 제공함으로써, 일예로 동일한 해쉬값에 씨더가 없더라도 상기 원본 파일 매칭 정보를 이용하여 다른 해쉬값을 갖는 씨더를 찾아서 전송할 수 있음으로 다운로드 속도 향상 및 성공확률을 향상시켜 파일 공유의 효율성을 높일 수 있다.
In addition, by providing the original file matching information having different hash values including the same original file to the peer in the original file check server, for example, even if there is no seed in the same hash value, another hash value The ability to locate and transfer seeds improves the download speed and improves the chances of success, increasing the efficiency of file sharing.
도 1은 종래 토렌트 파일을 공유하는 방법을 설명하기 위한 개략도이다.
도 2는 본 발명의 일실시예에 따른 토렌트 파일에 대한 원본 파일을 확인하는 방법을 설명하기 위한 블록구성도이다.
도 3은 본 발명의 일실시예에 따른 원본 파일 확인 서버를 설명하기 위한 블록구성도이다.
도 4는 본 발명의 일실시예에 따른 해쉬 코드 생성 알고리즘을 이용하여 원본 파일에 대한 파일 조각별 해쉬값을 생성 저장하는 과정을 설명하기 위한 블록구성도이다.
도 5는 본 발명의 일 실시예에 따른 파일 조각별 해쉬값을 비교하여 원본 파일 매칭 정보를 생성하는 과정을 설명하기 위한 블록구성도이다.
도 6은 본 발명의 일 실시예에 따른 토렌트 프로토콜 기반의 원본 파일 확인 방법을 설명하기 위한 순서도이다. 1 is a schematic diagram for explaining a method of sharing a conventional torrent file.
FIG. 2 is a block diagram illustrating a method for identifying an original file of a torrent file according to an exemplary embodiment of the present invention. Referring to FIG.
3 is a block diagram illustrating an original file verification server according to an embodiment of the present invention.
4 is a block diagram illustrating a process of generating and storing hash values of file fragments of an original file using a hash code generation algorithm according to an embodiment of the present invention.
FIG. 5 is a block diagram illustrating a process of generating original file matching information by comparing hash values of file fragments according to an embodiment of the present invention. Referring to FIG.
FIG. 6 is a flowchart for explaining an original file checking method based on a torrent protocol according to an embodiment of the present invention.
이하의 상세한 설명은 예시에 지나지 않으며, 본 발명의 실시 예를 도시한 것에 불과하다. 또한 본 발명의 원리와 개념은 가장 유용하고, 쉽게 설명할 목적으로 제공된다.The following detailed description is merely an example, and is merely an example of the present invention. Further, the principles and concepts of the present invention are provided for the purpose of being most useful and readily explaining.
따라서, 본 발명의 기본 이해를 위한 필요 이상의 자세한 구조를 제공하고자 하지 않았음은 물론 통상의 지식을 가진 자가 본 발명의 실체에서 실시될 수 있는 여러 가지의 형태들을 도면을 통해 예시한다.
Accordingly, it is not intended to provide a more detailed structure than is necessary for a basic understanding of the present invention, but it should be understood by those skilled in the art that various forms that can be practiced in the present invention are illustrated in the drawings.
본 발명에 사용되는 용어의 정의는 다음과 같다.The definitions of terms used in the present invention are as follows.
먼저 비트토렌트 프로토콜을 이용하기 위해서는 비트토렌트 프로토콜과 호환하는 비트토렌트 클라이언트를 설치해야 하며, 비트토렌트를 이용하여 파일(한개 혹은 파일의 그룹)을 공유하기 위해서는 .torrent(시드) 파일을 생성해야 한다. 상기 .torrent 파일은 공유할 파일 및 트랙커(Tracker, 파일 분산을 조율하는 컴퓨터)에 대한 메타데이터를 가지고 있으며, 피어는 어떤 파일을 받기 위해서는 우선 그 파일을 위한 .torrent 파일을 획득하여야 하며, 그 파일의 조각조각을 받기 위해서는 어떤 피어들에게 접속해야하는지를 알려주는 소정의 트랙커 서버에 접속해야 한다.
To use the bittorrent protocol, a bittorrent client compatible with the bittorrent protocol must be installed. To share a file (one group or a group of files) using a bittorrent, a .torrent (seed) file must be created. The .torrent file has metadata about the files to be shared and the tracker (computer to coordinate the distribution of files). To receive a file, the peer must first obtain a .torrent file for that file, In order to receive a piece of scrap, you need to connect to a specific tracker server that tells you which peers you should connect to.
클라이언트(Client)는 파일을 업로드 하거나 다운로드하는 소프트웨어로, 토렌트 프로토콜에 따라 만들어진 .torrent 파일을 대상으로 사용자가 원하는 콘텐츠가 어느 .torrent 파일에 있는지 검색하고 사용자가 .torrent 파일의 정보을 이용할 수 있도록 보여주는 프로그램으로, .torrent 파일을 생성하는 기능도 제공하며 μtorrent 등 다양한 종류가 배포되고 있다.
A client is a software that uploads or downloads a file. It is a program that displays a .torrent file created according to the torrent protocol, searches the .torrent file for the content that the user wants, and allows the user to use the information in the .torrent file. . It also provides the ability to create .torrent files, and various types such as μtorrent are distributed.
피어(peer)는 상기 클라이언트(Client)가 설치되어 동작하는 컴퓨터로 공유 파일에 접근하여 파일 조각의 일부를 공유중인 모든 사용자로 다운로드 중인 피어들은 랜덤하게 파일 조각을 받아 서로 다른 피어들끼리 받은 조각을 공유하여 공유하고자 하는 원본 파일을 갖는 시더(seeder, 배포자)의 전송부하를 줄일 수 있다.
The peer accesses the shared file with the computer installed with the client, and the peers downloading the file fragments as all the users sharing the fragments receive the fragments of the files at random and receive the fragments received between the different peers It is possible to reduce the transmission load of the seeder (distributor) having the original file to be shared and shared.
.torrent 파일(시드 파일)은 공유하고자 하는 파일(원본 파일)에 대한 정보를 담아 해당 정보에 따라 원본 파일의 위치를 찾고 공유하기 위한 파일로, 메타 데이터,호스트 정보 등이 기록될 수 있으며, 트랙커(Tracker)의 URL 정보를 포함하는 'announce' 섹션, 파일의 이름, 길이, 파일 조각의 길이 및 파일의 무결성을 진단하기 위한 각 조각의 SHA-1 해시코드가 포함되어 있다. 상기 .torrent 파일(시드 파일)은 내용이 담겨있지 않고 단지 콘텐츠의 제목, 크기가 어떻게 분할되어 있는지, 분할된 파일은 어떻게 다시 재결합할 수 있는지 및 재결합된 파일이 원본과 일치하는지에 대한 해쉬값 등을 포함한다. 파일을 다 받은 클라이언트는 시더(seeder)역할을 수행할 수 있어서 파일 공유의 효율을 높일 수 있다. 이하 토렌트 파일(.torrent 파일)과 시드 파일은 같은 의미로서 혼용되어 사용될 수 있다.
The .torrent file (seed file) is a file for storing the information about the file (original file) to be shared and searching for the location of the original file according to the information, and metadata, host information, An 'announce' section including URL information of the tracker, a SHA-1 hash code of each fragment for diagnosing the file name, length, length of the file fragment, and file integrity. The .torrent file (seed file) does not contain any content, only the title of the content, how the size is divided, how the divided files can be reassembled again, and the hash value of whether the reassembled file matches the original . The client receiving the file can act as a seeder to increase the efficiency of file sharing. The following torrent file (.torrent file) and seed file can be used interchangeably.
트랙커(Tracker)란 일종의 서버로 현재 다운로드하고 있는 사람과 업로드하고 있는 사람들의 정보인 SWARM을 통하여 시더(seeder)와 피어(peer)를 모니터링한다. 클라이언트는 트랙커 서버로 자기 정보를 보내고 현재 SWARM 안의 시더와 피어에 관한 정보를 받는다. 트랙커 서버는 데이터 전송에 직접적인 영향이나 관계는 없으나 공유되는 원본파일의 복사본을 가지고 있지 않으며, 현재 비트토렌트는 트랙커 서버 없이도 구현가능하다. 아나운서 서버는 트랙커 서버와 동일한 기능을 수행하며, 네트워크의 연결 형태, 파일 관리 형태 및 공개 여부에 따라 독립 아나운서 서버, 백업 아나운서 서버 및 공개 아나운서 서버로 분류될 수 있다.
Tracker is a kind of server that monitors seeder and peer through SWARM which is information of the person who is currently downloading and the person who is uploading. The client sends its information to the tracker server and receives information about the current cedar and peer in SWARM. The tracker server has no direct effect on the data transfer, but does not have a copy of the original file shared, and the current bittorrent can be implemented without a tracker server. The announcer server performs the same function as the tracker server, and can be classified as an independent announcer server, a backup announcer server, and an open announcer server depending on the connection type of the network, the type of file management, and the disclosure status.
이하 첨부한 도면을 참조하여 본 발명의 바람직한 실시예에 대한 구성 및 작용을 상세히 설명하면 다음과 같다. DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings.
도 2는 본 발명의 일실시예에 따른 토렌트 파일에 대한 원본 파일을 확인하는 방법을 설명하기 위한 블록구성도이다. FIG. 2 is a block diagram illustrating a method for identifying an original file of a torrent file according to an exemplary embodiment of the present invention. Referring to FIG.
도 2에서 보는 바와 같이, 본 발명의 토렌트 프로토콜 기반의 파일 확인 장치(1000)는 파일을 공유하기 위한 클라이언트가 동작하는 피어(300), 시드파일에 대한 시더(seeder) 및 피어(peer)정보를 피어들에게 전송하는 트랙커 서버(200) 및 시드 파일과 연결되어 있는 원본 파일을 확인하여 원본 파일 매칭 정보를 생성하는 원본 파일 확인 서버(100)를 포함한다.
As shown in FIG. 2, the
피어(300)는 어떤 공유 파일을 다운로드하기 위해서는 먼저 공유 파일에 대한 시드(seed) 파일(.torrent 파일)을 시드 파일을 웹상에 올려 공유하는 토렌트 사이트(웹사이트)로부터 획득하여 실행킨다. 계속적으로 피어(300)에 설치되어 있는 클라이언트는 실행된 시드 파일안에 저장되어 있는 공유 파일 정보 및 트랙커 서버에 대한 메타데이터를 이용하여 트랙커 서버에 접속한 후, 공유 파일의 조각조각을 받기 위하여 어떤 피어들에게 접속해야 하는지에 대한 시더(seeder) 및 피어(peer) 정보를 트랙커 서버로부터 수신받는다. 여기서 상기 시더 및 피어 정보는 현재 공유 파일을 다운로드 하고 있는 피어와 업로드 하고 있는 피어에 대한 정보이다. In order to download a certain shared file, the
피어(300)는 트랙커 서버로부터 수신받은 시더 및 피어정보를 이용하여 공유 파일에 대한 조각파일을 다운로드 함과 동시에 자신이 가지고 있는 파일 조각을 업로드함으로써 다수의 피어들이 파일 조각을 다운로드함으로써 SWARM 안에 있는 피어의 숫자는 늘어난다. 이러한 다수의 피어들이 서로 공유 파일의 조각을 공유함으로써 원본 파일을 가지고 있는 시더(seeder)의 전송부하를 줄일 수 있다.
The
상기 트랙커 서버는 파일 분산을 조율하는 컴퓨터일 수 있으며, 파일을 공유하고 있는 다수의 피어(peer)들을 연결시켜주는 기능을 수행한다. 트랙커 서버는 시드 파일마다 고유의 해쉬값을 가지고 있음으로 동일한 해쉬값을 갖는 시드 파일에 접근한 피어들끼리 연결시킬 수 있다.
The tracker server may be a computer that coordinates file distribution, and performs a function of connecting a plurality of peers sharing a file. Since the tracker server has a unique hash value for each seed file, it is possible to connect peers approaching the seed file having the same hash value.
여기서 본 발명의 파일 확인 장치(1000)의 원본 파일 확인 서버(100)는 시드 파일을 이용하여 원본 파일을 다운로드 할 필요없이 시드 파일의 "info" 섹션에 포함되어 있는 파일 조각의 길이, 각 파일 조각의 해쉬값을 이용하여 시드 파일에 연결되어 있는 원본 파일의 존재를 확인함으로써 저작권 위반 파일이나 음란물에 대한 네트워크망을 이용하여 공유되는 것을 방지할 수 있다.
In this case, the source
또한 원본 파일 확인 서버(100)는 동일한 원본 파일을 포함하는 서로 다른 해쉬값을 갖는 다수의 시드 파일에 대하여 원본 파일 매칭 정보를 생성하여 상기 원본 파일 매칭 정보를 트랙커 서버에 전송함으로써 트랙커 서버는 클라이언트로부터 요청되는 시드 파일에 대하여 서로 다른 해쉬값을 갖으나 동일한 원본 파일을 가지고 있는 시더 및 피어에 대한 정보를 전송함에 따라 피어는 다운로드 속도 향상 및 다운로드 성공확률을 향상시켜 파일 공유의 효율성을 높일 수 있다.
In addition, the original
이하 원본 파일 매칭 정보를 생성하여 저작권 위반 파일 또는 음란물에 대한 공유를 원천적으로 방지함과 동시에 파일 공유의 효율성을 향상시킬 수 있는 원본 파일 확인 서버(100)에 대하여 도 3 내지 도 5를 통하여 상세히 설명한다.
Hereinafter, the original
도 3은 본 발명의 일실시예에 따른 원본 파일 확인 서버를 설명하기 위한 블록구성도이고, 도 4는 본 발명의 일실시예에 따른 해쉬 코드 생성 알고리즘을 이용하여 원본 파일에 대한 파일 조각별 해쉬값을 생성 저장하는 과정을 설명하기 위한 블록구성도이고, 도 5는 본 발명의 일 실시예에 따른 파일 조각별 해쉬값을 비교하여 원본 파일 매칭 정보를 생성하는 과정을 설명하기 위한 블록구성도이다.
FIG. 3 is a block diagram illustrating an original file verification server according to an exemplary embodiment of the present invention. FIG. 4 is a block diagram illustrating a hash code for a file fragment of an original file using a hash code generation algorithm according to an exemplary embodiment of the present invention. FIG. 5 is a block diagram for explaining a process of generating original file matching information by comparing hash values of file fragments according to an embodiment of the present invention .
도 3을 참조하면, 원본 파일 확인 서버(100)는 원본 파일에 대한 해쉬값을 생성하는 해쉬값 생성부(110), 상기 생성된 해쉬값을 저장하는 저장부(120), 시드 파일의 파일 조각에 대한 해쉬값과 상기 저장부에 저장된 원본 파일의 파일 조각에 대한 해쉬값을 비교하여 원본 파일 매칭 정보를 생성하는 파일 조각 비교부(130)을 포함할 수 있다.
3, the original
도 4를 참조하면, 해쉬값 생성부(110)는 해쉬 코드 생성 알고리즘(112)을 이용하여 원본 파일에 대한 파일 조각 길이별 해쉬값을 생성하며, 이는 클라이언트에서 최초 토렌트 파일(시드 파일) 생성시 원본 파일의 전체 영역에 대한 파일 조각의 길이에 따른 해쉬값을 생성하여 토렌트 파일의 'info' 섹션에 저장되는 것에 대응된다. 한편 최초 토렌트 파일 생성시 원본 파일에 대한 파일 조각 길이에 대한 해쉬값은 상기 파일 조각의 길이(예를 들어 상기 파일 조각의 길이는 최소 16KByte 부터 32KByte, 64KByte, 등 최대 16MByte)에 따라 서로 다른 해쉬값이 생성된다. Referring to FIG. 4, the hash
따라서 클라이언트에서 생성되는 시드 파일의 조각 파일 길이에 따른 해쉬값이 생성되는 모든 경우를 포함하기 위하여 해쉬값 생성부(110)의 파일 조각 설정부(111)는 원본 파일에 대한 해쉬값 생성시 각각의 파일 조각 길이별(최소 16KByte ~ 최대 16MByte)로 해쉬 코드 알고리즘(112)을 이용하여 해쉬값을 생성한다. 또한 상기 파일 조각 설정부(111)는 원본 파일의 전체 영역에 대하여 파일 조각 길이별로 해쉬값을 생성할 수 있으나, 원본 파일의 특정 영역 즉 전체 파일 중 해쉬값을 생성하고자 하는 미리 설정된 크기로 예를 들어 파일 시작과 마지막의 각 32 MByte 까지의 영역에 대하여만 파일 조각 길이별로 해쉬값을 생성할 수 있다.
Therefore, in order to include all cases where a hash value is generated according to the fragment file length of the seed file generated by the client, the file fragment setter 111 of the
해쉬값 저장부(120)는 상기 해쉬값 생성부(110)로부터 생성된 원본 파일에 대한 파일 조각 길이별로 생성된 해쉬값을 저장할 수 있다. 즉 원본 파일1은 전체 원본 파일 영역 또는 원본 파일의 미리 설정된 영역에 대하여 소정의 파일 조각수를 가지며 파일 조각의 길이가 최소 16KByte인 제1 해쉬값(121a), 소정의 파일 조각수를 가지며 파일 조각의 길이가 32KByte인 제2 해쉬값(121b) 내지 소정의 파일 조각수를 가지며 최대 16MByte인 제 n해쉬값(121n)을 갖도록 파일 조각 길이별로 원본 파일1에 대한 해쉬값(121)은 해쉬값 저장부(120)에 저장된다. The hash
즉 상기 제1 해쉬값(121a), 제2 해쉬값(121b) 내지 n해쉬값(121n) 각각은 원본 파일 크기 또는 미리 설정된 영역의 파일 크기에 대하여 파일 조각의 길이에 따라 적어도 하나 이상의 파일 조각을 가지며, 그 파일 조각별 각각이 다른 해쉬값을 갖을 수 있다.
That is, each of the
또한 원본 파일2에 대한 해쉬값(122)에 대하여도 마찬가지로 파일 조각 길이별로 해쉬값(122a, 122b ~ 122n)이 해쉬값 저장부(120)에 저장되어 원본 파일들에 대한 파일 조각 길이별 각각의 해쉬값이 데이터베이스화되어 관리될 수 있다.
Similarly, the hash values 122a and 122b to 122n are stored in the hash
도 5를 참조하면, 파일 조각 비교부(130)는 원본 파일의 정보를 확인하려고 하는 토렌트 파일의 'piece' 섹션에 있는 파일 조각에 대한 해쉬값과 상기 해쉬값 저장부(120)에 저장되어 있는 원본 파일들에 대한 파일 조각 길이별 해쉬값을 비교하여 매칭되었는지 확인하는 기능을 수행하며, 각각의 파일 조각에 대한 해쉬값이 매칭되었을 경우 해당 토렌트 파일은 매칭된 원본 파일과 연결될 수 있다고 판단하여 원본 파일 매칭 정보를 생성한다. 파일 조각 비교 설정부(131)는 먼저 검색하고자 하는 토렌트 파일의 정보('info' 섹션 등)를 분석하여 검색하고자 하는 파일 조각의 길이를 확인하고, 해쉬값 저장부(120)에 원본 파일의 미리 설정된 영역에 따른 해쉬값이 저장되어 있을 경우, 미리 설정된 영역에 해당하는 토렌트 파일의 파일 조각의 갯수를 설정한다.
5, the file
예를 들어 파일 조각 비교 설정부(131)는 해쉬값 저장부(120)에 원본 파일에 대한 해쉬값 저장 범위인 미리 설정된 영역이 파일 시작부터 32MByte로 설정되었을 경우, 검색하려고 하는 토렌트 파일의 정보를 분석하여 파일 조각 길이가 256KByte이고, 비교 대상 파일 조각의 갯수는 최초 파일 조각부터 128개의 파일 조각들 중 소정의 갯수(50개 내지 100개 이하)로 설정한다. 계속적으로 파일 조각 비교부(130)는 소정의 갯수로 설정된 상기 비교 대상 파일 조각 각각의 해쉬값과 해쉬값 저장부(120)의 검색 범위를 파일 조각의 길이가 256KByte인 해쉬값(121b, 122b 등) 들과 비교하여 동일한지 여부를 판단한다.
For example, when the predetermined area, which is the storage range of the hash value for the original file, is set in the hash
파일 조각 비교부(130)의 검색결과 비교 대상 파일 조각의 해쉬값과 동일한 원본 파일에 대한 해쉬값이 검색되어지는 경우, 검색된 토렌트 파일은 원본 파일에 대한 정보를 가지고 있다고 판단하고 원본 파일 매칭 정보를 생성한다.
When the hash value of the original file that is the same as the hash value of the search result comparison file fragment of the file
다시 도 3을 참고하면, 원본 파일 확인 서버(100)는 토렌트 파일을 통하여 공유되는 원본 파일이 저작권 위반 또는 음란물에 해당하는지 판단하는 공유 위반 판단부(140)를 더 포함할 수 있다. Referring back to FIG. 3, the original
상기 공유 위반 판단부(140)는 상기 생성된 원본 파일 매칭 정보 및 저작권 위반 파일 또는 음란물 위반 파일에 대한 공유 위반 정보를 이용하여 원본 파일이 공유 위반 파일에 해당된다고 판단되는 경우, 상기 원본 파일과 매칭되는 토렌트 파일에 대한 유통을 단속함으로써 원천적으로 공유를 방지할 수 있다.
When the sharing
또한 상기 원본 파일 매칭 정보를 이용하여 저작권에 위반되는 토렌트 파일을 다운로드 받을 때나, 업로드 할때 과금처리를 함으로써 토렌트 프로토콜을 기반으로 하는 파일 공유 시스템 내에서 간편하게 저작권 파일에 대한 관리를 할 수 있다.
Also, the copyright file can be easily managed in the file sharing system based on the torrent protocol by performing a charging process when downloading or uploading a torrent file that is in violation of copyright by using the original file matching information.
또한 상기 원본 파일 매칭 정보가 하나의 원본 파일을 공유하는 다수의 다른 해쉬값을 갖는 토렌트 파일에 대한 정보를 가지고 있을 경우, 상기 원본 파일 매칭 정보를 이용하여 파일 공유를 효율성을 향상시킬 수 있다. 즉 원본 파일 확인 서버에서 생성된 동일한 원본 파일을 포함하는 서로 다른 해쉬값을 갖는 토렌트 파일 정보를 포함하는 원본 파일 매칭 정보를 피어에게 제공함으로써 일예로 동일한 해쉬값에 씨더가 없더라도 상기 원본 파일 매칭 정보를 이용하여 다른 해쉬값을 갖는 씨더를 찾아서 전송할 수 있음으로 다운로드 속도 향상 및 성공확률을 향상시켜 파일 공유의 효율성을 높일 수 있다.
In addition, when the original file matching information includes information on a torrent file having a plurality of different hash values sharing one original file, efficiency of file sharing can be improved by using the original file matching information. In other words, by providing the original file matching information including the torrent file information having the different hash value including the same original file generated by the original file verification server to the peer, even if there is no seeder in the same hash value, It is possible to find and transmit seeds having different hash values, thereby improving the download speed and increasing the probability of success, thereby increasing the efficiency of file sharing.
도 6은 본 발명의 일 실시예에 따른 토렌트 프로토콜 기반의 원본 파일 확인 방법을 설명하기 위한 순서도이다. FIG. 6 is a flowchart for explaining an original file checking method based on a torrent protocol according to an embodiment of the present invention.
도 6에서 보는 바와 같이, 토렌트 프로토콜 기반의 원본 파일 확인 방법은 먼저 해쉬 알고리즘을 이용하여 원본 파일에 대한 파일 조각 길이별 해쉬값을 생성하여 저장한다(S61). 이후 수신받은 토렌트 파일에 대한 정보를 분석하여, 검색하고자 하는 파일 조각의 길이 및 파일 조각의 갯수를 설정한다(S63). 여기서 비교 대상 파일 조각은 해쉬값 저장부에 저장되어 있는 원본 파일의 미리 설정된 영역과 일치되는 범위내에서 설정될 수 있다. 다음으로 검색 하고자 하는 토렌트 파일의 비교 대상 조각 파일의 각각의 해쉬값과 해쉬값 저장부에 저장된 원본 파일에 대한 파일 조각 길이별 해쉬값을 비교하여 일치하는 경우(S65), 상기 토렌트 파일에 대하여 매칭되는 원본 파일 매칭 정보를 생성한다(S67).
As shown in FIG. 6, in the original file checking method based on the torrent protocol, a hash value for each file fragment length of an original file is generated using a hash algorithm and stored (S61). Thereafter, information on the received torrent file is analyzed, and the length of the file fragment to be searched and the number of file fragments to be searched are set (S63). Here, the comparison target file fragment can be set within a range that matches the predetermined area of the original file stored in the hash value storage section. Next, if the hash values of the comparison target fragment files of the torrent file to be searched are compared with the hash values of the original file stored in the hash value storage section according to the file fragment length (S65), the matching is performed for the torrent file (Step S67).
또한 상기 원본 파일 매칭 정보를 이용하여 토렌트 파일을 통하여 공유되는 원본 파일이 저작권 위반 또는 음란물에 해당하는지 판단하는 공유 위반 판단 정보를 생성(S69)하여 저작권 위반 및 음란물과 관련된 공유 위반 파일이 토렌트 프로토콜을 통하여 공유되는 것을 원천적으로 방지할 수 있다.
In addition, sharing violation judgment information for judging whether the original file shared through the torrent file corresponds to a copyright violation or pornographic material is generated using the original file matching information (S69), so that a copyright violation and a sharing violation file related to pornography are transmitted to a torrent protocol It can be prevented from being shared at all.
이상에서는 대표적인 실시 예를 통하여 본 발명에 대하여 상세하게 설명하였으나, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 상술한 실시 예에 대하여 본 발명의 범주에서 벗어나지 않는 한도 내에서 다양한 변형이 가능함을 이해할 것이다.While the present invention has been particularly shown and described with reference to exemplary embodiments thereof, it is to be understood that the invention is not limited to the disclosed embodiments, but, on the contrary, I will understand.
그러므로 본 발명의 권리범위는 설명된 실시 예에 국한되어 정해져서는 안 되며, 후술하는 특허청구범위뿐만 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.Therefore, the scope of the present invention should not be limited to the above-described embodiments, but should be determined by equivalents to the appended claims, as well as the appended claims.
50:네트워크 망 100:원본 파일 확인 서버
110:해쉬값 생성부 111:파일 조각 설정부
112:해쉬 코드 생성 알고리즘 120:해쉬값 저장부
121~12N:해쉬값 130:파일 조각 비교부
131:파일 조각 비교 설정부 140:공유 위반 판단부
200:트랙커 서버 300:피어
1000:파일 확인 장치50: network network 100: original file verification server
110: hash value generation unit 111: file fragment setting unit
112: hash code generation algorithm 120: hash value storage unit
121 to 12N: Hash value 130: File fragment comparison unit
131: file fragment comparison setting unit 140: sharing violation determination unit
200: Tracker server 300: Peer
1000: File Identification Device
Claims (5)
토렌트 파일에 대한 시더 및 피어정보를 피어들에게 전송하는 트랙커 서버 및
토렌트 파일과 연결되어 있는 원본 파일을 확인하여 원본 파일 매칭 정보를 생성하는 원본 파일 확인 서버를 포함하며,
상기 원본 파일 확인 서버는
원본 파일의 미리 설정된 영역에 대하여 해쉬 알고리즘을 이용하여 파일 조각 길이별 해쉬값을 생성하는 해쉬값 생성부,
상기 파일 조각 길이별 해쉬값을 저장하는 저장부 및
토렌트 파일의 파일 조각에 대한 해쉬값과 상기 원본 파일에 대한 파일 조각 길이별 해쉬값을 비교하여, 서로 다른 해쉬값을 가지나 동일한 원본 파일을 공유할 수 있는 토렌트 파일을 갖는 시더 및 피어에 대한 원본 파일 매칭 정보를 생성하는 파일 조각 비교부를 포함하고, 원본 파일 매칭 정보를 트랙커 서버로 전송하여 원본 파일에 대한 다운로드 속도를 향상시킬 수 있는 토렌트 프로토콜 기반의 파일 확인 장치.
The peer on which the client for file sharing operates,
A tracker server for sending seeder and peer information to the peers for the torrent file and
A source file check server for checking the source file associated with the torrent file to generate source file matching information,
The original file check server
A hash value generation unit for generating a hash value for each file fragment length by using a hash algorithm for a predetermined area of the original file,
A storage unit for storing a hash value for each file fragment length;
A hash value of a file fragment of a torrent file and a hash value of a file fragment length of the original file are compared with each other so that a seed file having a torrent file having different hash values but being able to share the same source file, And a file fragment comparing unit for generating matching information, and the original file matching information can be transmitted to the tracker server to improve the download speed of the original file.
상기 원본 파일 매칭 정보와 저작권 위반 여부 또는 음란물에 대한 공유 위반 정보를 비교하여 공유 위반 파일 정보를 생성하는 공유 위반 판단부를 더 포함하는 토렌트 프로토콜 기반의 파일 확인 장치.5. The method of claim 4,
And a sharing violation determining unit for comparing the original file matching information with copyright violation information or sharing violation information about pornographic material to generate sharing violation file information.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020130074405A KR101498658B1 (en) | 2013-06-27 | 2013-06-27 | Method for identificating file based on torrent protocol and file identification apparatus using the same |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020130074405A KR101498658B1 (en) | 2013-06-27 | 2013-06-27 | Method for identificating file based on torrent protocol and file identification apparatus using the same |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20150001343A KR20150001343A (en) | 2015-01-06 |
KR101498658B1 true KR101498658B1 (en) | 2015-03-05 |
Family
ID=52475121
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020130074405A KR101498658B1 (en) | 2013-06-27 | 2013-06-27 | Method for identificating file based on torrent protocol and file identification apparatus using the same |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101498658B1 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102122679B1 (en) * | 2019-03-26 | 2020-06-16 | 하상민 | Method and system for preventing distribution of illegal contents over the internet |
KR102331338B1 (en) * | 2020-07-07 | 2021-11-25 | 주식회사 에이아이스페라 | Apparatus, method and program for providing information related to distribution of illegal contents on peer-to-peer network |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20120049570A (en) * | 2010-11-09 | 2012-05-17 | 한양대학교 산학협력단 | Method and apparatus for detecting smartphone virus using cloud security architecture |
-
2013
- 2013-06-27 KR KR1020130074405A patent/KR101498658B1/en active IP Right Grant
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20120049570A (en) * | 2010-11-09 | 2012-05-17 | 한양대학교 산학협력단 | Method and apparatus for detecting smartphone virus using cloud security architecture |
Also Published As
Publication number | Publication date |
---|---|
KR20150001343A (en) | 2015-01-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9894168B2 (en) | Locality based content distribution | |
EP3108644B1 (en) | Content delivery network architecture with edge proxy | |
US8019882B2 (en) | Content identification for peer-to-peer content retrieval | |
US8560654B2 (en) | Change management | |
US8296283B2 (en) | DHT-based distributed file system for simultaneous use by millions of frequently disconnected, world-wide users | |
US20090006538A1 (en) | Automatic Distributed Downloading | |
US20050091167A1 (en) | Interdiction of unauthorized copying in a decentralized network | |
US20050114709A1 (en) | Demand based method for interdiction of unauthorized copying in a decentralized network | |
WO2006081663A1 (en) | Method, apparatus and system for interfering with distribution of protected content | |
CN102307210A (en) | Data downloading system and data management and downloading method thereof | |
US7877457B2 (en) | Peer to peer gateway | |
JP6785913B2 (en) | Methods and systems to prevent the distribution of illegal content on the Internet | |
CA2727548A1 (en) | System and method for advertising on a peer-to-peer network | |
US20140359066A1 (en) | System, method and device for offline downloading resource and computer storage medium | |
AU2008287031B2 (en) | A method and system for tracking and optimizing advertisements on a decentralized network | |
KR20140143775A (en) | Cache management | |
US20040010495A1 (en) | Method and apparatus for limiting unauthorized copying of copyrighted works over the internet | |
KR101498658B1 (en) | Method for identificating file based on torrent protocol and file identification apparatus using the same | |
KR101475516B1 (en) | Method for sharing file based on torrent protocol and apparatus using the same | |
Chow et al. | BTM-An automated rule-based BT monitoring system for piracy detection | |
WO2022119578A1 (en) | Secured management of data distribution restrictions | |
KR102331338B1 (en) | Apparatus, method and program for providing information related to distribution of illegal contents on peer-to-peer network | |
US20210173878A1 (en) | Systems and methods of incremented aggregated data retrieval | |
Robles et al. | A paradigm solution to P2P security issues | |
Balhara | A Review on Torrent & Torrent Poisoning over Internet. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20180226 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20190425 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20200225 Year of fee payment: 6 |