KR101490660B1 - Archiving device and method for controlling the same - Google Patents
Archiving device and method for controlling the same Download PDFInfo
- Publication number
- KR101490660B1 KR101490660B1 KR20140143645A KR20140143645A KR101490660B1 KR 101490660 B1 KR101490660 B1 KR 101490660B1 KR 20140143645 A KR20140143645 A KR 20140143645A KR 20140143645 A KR20140143645 A KR 20140143645A KR 101490660 B1 KR101490660 B1 KR 101490660B1
- Authority
- KR
- South Korea
- Prior art keywords
- pattern
- storage unit
- electronic file
- string pattern
- electronic files
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/16—File or folder operations, e.g. details of user interfaces specifically adapted to file systems
- G06F16/164—File meta data generation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/17—Details of further file system functions
- G06F16/178—Techniques for file synchronisation in file systems
- G06F16/1794—Details of file format conversion
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
본 발명은 전자파일 보관장치 및 이를 운용하는 방법에 관한 것으로서, 더욱 상세하게는 다양한 형태의 전자파일들을 그 고유의 포맷에 따라 자동으로 분류 및 저장하는 전자파일 보관장치 및 이를 운용하는 방법에 관한 것이다.
BACKGROUND OF THE
정보화 사회로 접어든 이후, 누적되는 자료들을 하드카피 보다는 소프트카피 형태인 전자파일로 보관하고 있다. 과거의 보관된 하드카피 서류까지 스캔하여 소프트카피 형태로 보관하는 것이 지금의 일반적인 서류 보관방식이다. 이러한 전자파일들은 점차 시간이 지나게 되면, 그 용량이 방대해지고 카테고리도 다양해지기 마련이다.After entering the information society, accumulated data are kept in electronic files, which are soft copies rather than hard copies. It is now common practice to keep documents in the form of soft copies by scanning up to past archived hard copy documents. As time goes by, these electronic files become large in capacity and various categories.
이러한, 방대한 용량의 전자파일을 카테고리별로 분류하여 보관하는 방법에 대해 많은 연구가 진행 되고 있다. 현재 기본적인 PC의 사용형태는 전자파일을 이름, 수정날짜, 파일 유형, 파일 크기 등의 특정한 조건에 따라 일정한 순서로 다시 재배열할 수 있다. 즉, 메타데이터(속성정보)의 한계 속에서 전자파일들을 분류할 수 있다.There is a lot of research on how to categorize and store such large-capacity electronic files by category. Currently, the basic usage of PCs can be rearranged in a certain order according to specific conditions such as name, modification date, file type, and file size. That is, electronic files can be classified within the limits of metadata (attribute information).
그러나, 사용자의 오류, 전자파일의 잦은 복사, 온라인 상의 전송, 프로그램 상의 오작동으로 인해 메타데이터가 손상되어 카테고리별로 분류하는 것이 불가능하게 되는 경우가 많고, 특정한 분류 조건의 부가에도 불구하고 부정확하게 분류되는 오류를 범하게 된다.However, due to user errors, frequent copying of electronic files, online transmission, and malfunctioning of programs, metadata is often damaged, making it impossible to classify by category. In spite of the addition of specific classification conditions, I will make an error.
더욱이, 해당 전자파일을 읽을 수 있는 프로그램이 없는 경우, 새롭게 개발된 프로그램에 의해 생성된 신규 전자파일과 같이 메타데이터의 정보 자체를 파악할 수 없거나, 부정확하게 확인되어 카테고리별로 분류되지 않는 신규 전자파일들이 점점 많아지게 되어 방대한 양의 전자파일들을 카테고리별로 분류하여 보관하는 것이 불가능하게 된다.
Further, when there is no program capable of reading the electronic file, information of the metadata itself can not be grasped, such as a new electronic file generated by a newly developed program, or new electronic files that are incorrectly identified and not classified by category It becomes impossible to classify and store a huge amount of electronic files by category.
본 발명은 메타데이터 정보의 한계를 벗어나, 보다 정확하고 신속하게 전자파일의 카테고리를 분류할 수 있는 전자파일 보관장치 및 이를 운용하는 방법을 제공하는 것을 목적으로 한다.It is an object of the present invention to provide an electronic file storage device and a method of operating the electronic file storage device which can classify electronic file categories more accurately and quickly than the limit of metadata information.
또한, 본 발명은 전자파일의 정보가 손상되거나, 신규 프로그램에 의해 생성된 신규 전자파일들을 카테고리별로 분류하여 저장하는 전자파일 보관장치 및 이를 운용하는 방법을 제공하는 것을 목적으로 한다.
It is another object of the present invention to provide an electronic file storage device for storing information of an electronic file and classifying and storing new electronic files generated by a new program by category and a method for operating the electronic file storage device.
본 발명은 상기와 같은 과제를 해결하기 위하여 안출된 것으로서, 본 발명은 전자파일들의 고유한 포맷을 담은 문자열 패턴의 동일성을 판단하여 카테고리별로 분류하는 전자파일 보관장치 및 이를 운용하는 방법을 제공한다.SUMMARY OF THE INVENTION The present invention has been made to solve the above problems, and it is an object of the present invention to provide an electronic file storage device for classifying the string patterns containing unique formats of electronic files by categories and a method for operating the same.
본 발명의 일 실시예에 의한 전자파일 보관 장치는 전자파일들을 저장하되, 상기 전자파일들의 포맷(Format)에 따른 문자열 패턴 형태가 동일한 것들을 하나의 군으로 모아 카테고리별로 분류된 저장부, 상기 저장부가 저장하는 문자열 패턴과 대응하도록, 외부로부터 공급된 신규 전자파일의 포맷을 문자열 패턴으로 변환하는 패턴 변환부 및 상기 패턴 변환부로부터 공급 받은 상기 신규 전자파일의 문자열 패턴과 상기 저장부에 저장된 문자열 패턴의 동일성을 분석하고, 동일한 문자열 패턴의 카테고리를 지정하여 상기 저장부로 송출하는 패턴 분석부를 포함한다.The electronic file archiving apparatus according to an embodiment of the present invention includes a storage unit for storing electronic files and grouping the same types of character string patterns according to the format of the electronic files into one group and classified into categories, A pattern conversion unit for converting the format of a new electronic file supplied from the outside into a character string pattern so as to correspond to a character string pattern to be stored; a character string pattern of the new electronic file supplied from the pattern conversion unit; And a pattern analysis unit for analyzing the identity and designating a category of the same string pattern and sending the same to the storage unit.
상기 저장부는 문자열 패턴이 동일한 전자파일들을 카테고리별로 저장하는 메인 저장부 및 상기 메인 저장부에 저장되지 않은 신규 전자파일들을 저장하는 서브 저장부를 포함하고, 상기 패턴 분석부는 상기 메인 저장부에 저장된 문자열 패턴과 동일하지 않는 문자열 패턴을 가진 신규 전자파일을 서브 저장부로 송출할 수 있다.Wherein the storage unit includes a main storage unit for storing electronic files having the same character string pattern by category and a sub storage unit for storing new electronic files not stored in the main storage unit, A new electronic file having a character string pattern that is not the same as the new electronic file can be sent to the sub storage unit.
상기 서브 저장부는 저장된 문자열 패턴이 일치하는 신규 전자파일들의 수가 기설정된 설정값에 도달한 경우, 상기 신규 전자파일들을 상기 패턴 분석부로 송출할 수 있다. 상기 패턴 분석부는 상기 신규 전자파일들에 신규 카테고리를 지정하여 상기 메인 저장부로 송출할 수 있다.The sub-storage unit may transmit the new electronic files to the pattern analysis unit when the number of new electronic files matching the stored character string pattern reaches a predetermined set value. The pattern analyzer may assign a new category to the new electronic files and send the new electronic files to the main storage unit.
상기 패턴 분석부가 카테고리를 지정하는 방식은 전자파일들의 메타데이터 또는 확장자를 삽입 또는 수정하는 것일 수 있고, 또한, 전자파일들의 문자열 패턴에 식별 문자열 패턴을 삽입하는 것일 수 있다.The manner in which the pattern analysis sub-category is specified may be to insert or modify metadata or extensions of electronic files and may also insert an identification string pattern into a string pattern of electronic files.
본 발명의 일 실시예에 따른 전자파일 보관 방법은 (a) 외부로부터 공급된 상기 전자파일의 포맷(Format)을 문자열 패턴으로 변환하는 단계, (b) 상기 전자파일의 변환된 문자열 패턴을 기 저장된 전자파일들의 문자열 패턴과 동일성을 비교하는 단계, (c) 상기 전자파일의 문자열 패턴과 동일성을 갖는 기 저장된 전자파일의 카테고리를 상기 전자파일에 지정하는 단계 및 (d) 상기 전자파일의 지정된 카테고리와 동일한기존 전자파일과 함께 하나의 군으로 분류되어 메인 저장부에 저장되는 단계를 포함한다.A method for storing electronic files according to an embodiment of the present invention includes the steps of: (a) converting a format of the electronic file supplied from the outside into a character string pattern; (b) (C) designating a category of a previously stored electronic file having the same identity as a character string pattern of the electronic file to the electronic file; and (d) And grouping them into one group together with the same existing electronic files and storing them in the main storage unit.
상기 (b) 단계는 기 저장된 전자파일의 문자열 패턴과 동일하지 않은 문자열 패턴을 가진 전자파일을 신규 전자파일로 지정하여 서브 저장부에 저장하는 단계를 더 포함할 수 있다. 상기 (b) 단계는 상기 서브 저장부에 상기 신규 전자파일이 저장됨에 따라, 동일한 문자열 패턴을 가진 신규 전자파일들의 수가 기설정된 설정값에 도달되었는지 여부를 확인하는 단계를 더 포함할 수 있다.The step (b) may further include designating an electronic file having a string pattern that is not the same as the string pattern of the previously stored electronic file as a new electronic file and storing the electronic file in the sub-storage unit. The step (b) may further include checking whether the number of new electronic files having the same string pattern has reached a predetermined set value as the new electronic file is stored in the sub-storing unit.
상기 (c) 단계는 기설정된 설정값에 도달된 상기 신규 전자파일들에 신규 카테고리를 지정하는 단계를 더 포함할 수 있다. 상기 카테고리를 지정하는 방식은 상기 신규 전자파일들의 메타데이터 또는 확장자를 삽입 또는 수정하는 것일 수 있고, 아울러 상기 신규 전자파일들의 문자열 패턴에 식별 문자열 패턴을 삽입하는 것일 수 있다.
The step (c) may further include the step of assigning a new category to the new electronic files that have reached the predetermined set value. The method of designating the category may include inserting or modifying the metadata or extension of the new electronic files and inserting the identification string pattern into the string pattern of the new electronic files.
본 발명의 전자파일 보관 장치 및 이를 운용하는 방법은 개발자의 의도에 따라 다르게 나타나는 전자파일의 포맷을 문자열 패턴 형식으로 비교하기 때문에 메타데이터에 의존했던 기존 분류와 다르게 정확도가 높다.The electronic file storage device and the method for operating the electronic file storage device of the present invention are highly accurate compared to the existing classification that relies on metadata because the electronic file format that is different according to the developer's intention is compared in a string pattern format.
또한, 신규로 개발된 프로그램에 의해 생성된 전자파일도 빈출 정도를 확인하여 데이터베이스화 하기 때문에 카테고리별 분류 및 저장이 가능하다.In addition, electronic files generated by a newly developed program can be classified and stored for each category because the degree of frequency is checked and converted into a database.
또한, 본 발명의 전자파일 보관 장치 및 이를 운용하는 방법은 사용자 또는 메타데이터가 변형된 전자파일 등도 분류하여 저장할 수 있다. In addition, the electronic file storage device and the method for operating the electronic file storage device of the present invention can classify and store users or electronic files with modified metadata.
또한, 본 발명은 문자열 패턴을 기반으로 메타데이터, 확장자, 식별 문자열 패턴을 삽입/수정하여 카테고리를 지정하므로, 추후 사용자가 찾고자 하는 전자파일을 손쉽게 검색할 수 있다.In addition, the present invention can easily search an electronic file to be searched by a user because a category is designated by inserting / modifying metadata, an extension, and an identification string pattern based on a character string pattern.
도 1은 본 발명의 일 실시예에 따른 전자파일 보관장치의 구성도이다.
도 2는 본 발명의 일 실시예에 따른 패턴 변환부가 전자파일의 포맷을 4비트 단위 16진수 문자열 패턴으로 변환한 형태를 표현한 모식도이다.
도 3은 본 발명의 일 실시예에 따른 패턴 분석부가 문자열 패턴을 비교하는 방식을 도시한 모식도이다.
도 4는 도 3에 도시된 동일한 문자열 패턴을 가진 전자파일들에 패턴 분석부가 식별 문자열 패턴을 삽입하는 과정을 나타내는 모식도이다.
도 5은 본 발명의 일 실시예에 따른 전자파일 보관방법을 나타내는 순서도이다.1 is a configuration diagram of an electronic file storage apparatus according to an embodiment of the present invention.
FIG. 2 is a schematic diagram showing a pattern conversion unit according to an embodiment of the present invention in which a format of an electronic file is converted into a 4-bit hexadecimal string pattern in units of bits.
FIG. 3 is a schematic diagram illustrating a method of comparing pattern analysis substrings according to an exemplary embodiment of the present invention.
FIG. 4 is a schematic diagram illustrating a process of inserting an identification character pattern into an electronic file having the same character string pattern shown in FIG. 3. FIG.
5 is a flowchart illustrating an electronic file archiving method according to an embodiment of the present invention.
후술하는 본 발명에 대한 상세한 설명은, 본 발명이 실시될 수 있는 특정 실시예를 예시로서 도시하는 첨부 도면을 통해 이해될 수 있다. 이러한 실시예는 당업자가 본 발명을 실시할 수 있기에 충분하도록 상세히 설명된다. 본 발명의 다양한 실시예는 서로 다르지만 상호 배타적일 필요는 없음이 이해되어야 한다. 예를 들어, 본 명세서에 기재되어 있는 특정 형태, 구조 및 특성은 본 발명의 기술사상과 범위를 벗어나지 않으면서 일 실시예로부터 다른 실시예로 변경되어 구현될 수 있다. 또한, 각각의 실시예 내의 개별 구성요소의 위치 또는 배치도 본 발명의 기술사상과 범위를 벗어나지 않으면서 변경될 수 있음이 이해되어야 한다. 따라서, 후술하는 상세한 설명은 한정적인 의미로서 행하여지는 것이 아니며, 본 발명의 범위는 특허청구범위에서 청구하는 범위 및 그와 균등한 모든 범위를 포괄하는 것으로 받아들여져야 한다. 도면에서 유사한 참조부호는 여러 측면에 걸쳐서 동일하거나 유사한 구성요소를 나타낸다. The following detailed description of the invention may be understood by reference to the accompanying drawings, which illustrate, by way of illustration, specific embodiments in which the invention may be practiced. These embodiments are described in sufficient detail to enable those skilled in the art to practice the invention. It should be understood that the various embodiments of the present invention are different, but need not be mutually exclusive. For example, the specific forms, structures, and characteristics described herein may be implemented by changing from one embodiment to another without departing from the spirit and scope of the present invention. It should also be understood that the position or arrangement of individual components within each embodiment may be varied without departing from the spirit and scope of the present invention. Therefore, the following detailed description is not intended to be construed in a limiting sense, and the scope of the present invention should be construed as encompassing all of the scope of the claims and equivalents thereof. In the drawings, like reference numbers designate the same or similar components throughout the several views.
이하에서는, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명을 용이하게 실시할 수 있도록 하기 위하여, 본 발명의 여러 바람직한 실시예에 관하여 첨부된 도면을 참조하여 상세히 설명하기로 한다.
Hereinafter, various embodiments of the present invention will be described in detail with reference to the accompanying drawings so that those skilled in the art can easily carry out the present invention.
도 1은 본 발명의 일 실시예에 따른 전자파일 보관장치의 내부 구성도이다.1 is an internal configuration diagram of an electronic file storage apparatus according to an embodiment of the present invention.
도 1을 참고하면, 본 발명의 일 실시예에 따른 전자파일 보관장치(100)는 저장부(110), 패턴 변환부(120), 패턴 분석부(130)를 포함한다. 상기 전자파일 보관장치(100)는 전자파일을 특정 카테고리별 분류, 저장할 수 있는 프로그램을 담은 기록매체를 포함하며, 그 종류는 자기디스크, 마이크로 필름, 광디스크 등과 같은 기록매체를 포함한다. 또한, 이러한 기록매체를 포함하여 이에 의해 운용되는 하드웨어적 구성도 포함한다.Referring to FIG. 1, an electronic
상기 저장부(110)는 전자파일들을 저장하는 것으로서, 전자파일들이 카테고리별로 분류되어 저장된다. 상기 카테고리별 분류는 전자파일들의 그 고유한 포맷(Format)에 따라 나타나는 문자열 패턴이 전자파일들간에 서로 동일한 것들을 하나의 군으로 모은 것을 가리킨다. 상기 전자파일들의 포맷은 전자파일들을 표시, 즉 코딩(coding)한 프로그램 개발자의 의도에 의해 각각 다르게 나타날 수 있다. The
구체적으로, 전자파일들이 담고 있는 문서, 오디오, 이미지, 동영상 등의 종류에 따라 그 포맷이 다를 수 있다. 또한, 같은 종류의 문서 등이라도 개발자에 따라 문자, 항목, 구두부호, 입출력시의 데이터의 배치, 신호처리나 제작 방식, 영상의 배열 형태, 데이터 파일의 행과 열 등의 배열 방식, 저장 섹터(sector), 메타데이터 내용 및 배열 형태에 따라 각기 다르고 다양하게 나타날 수 있다. 이와 같이, 개발자의 의도에 따른 다양한 모든 특성이 전자파일의 포맷에 담겨 있다.Specifically, the formats may be different depending on the types of documents, audio, images, and moving pictures contained in the electronic files. In addition, even for documents of the same kind, it is possible to arrange data such as characters, items, and punctuation marks, arrangement of data at the time of inputting and outputting, signal processing and production method, arrangement of images, arrangement methods of rows and columns of data files, sector, metadata content, and array type. As such, all the various characteristics of the developer's intent are contained in the format of the electronic file.
상기 저장부(110)는 전자파일들과 그 포맷을 문자열 패턴으로 저장한다. 상기 문자열 패턴은 전자파일들의 포맷이 문자열 코드로 변환된 것을 가리킨다. 예를 들면, 상기 문자열 패턴은 전자파일들의 포맷을 4비트 단위 16진수 코드 문자로 표현될 수 있다. 전자파일들의 포맷을 문자열 패턴으로 변환하는 부가적인 예들은 하기에서 기술할 패턴 변환부(120)에서 설명하도록 한다.The
상기 저장부(110)는 메인 저장부(111) 및 서브 저장부(112)를 포함한다. 상기 메인 저장부(111)는 이미 알려진 전자파일들과 그 포맷이 표현된 문자열 패턴을 저장한 데이터베이스(Database)를 포함한다. 전자파일을 보관하고자 하는 사용자가 전자파일들의 포맷을 문자열 패턴으로 미리 변환해 놓은 것을 가리킨다.The
반면, 상기 서브 저장부(112)는 상기 메인 저장부(111)에 저장되지 않은 신규 전자파일들을 저장한다. 즉, 상기 신규 전자파일은 상기 전자파일 보관장치(100)에 보관을 목적으로 처음 입수되어, 상기 메인 저장부(111)에 저장된 전자파일들의 문자열 패턴과 일치하는 부분이 없는 신규 전자파일을 가리킨다. 따라서, 상기 메인 저장부(111)에 저장 및 보관되고 있는 전자파일들은 상기 서브 저장부(112)에 저장된 전자파일들과 서로 동일한 포맷을 갖지 않게 된다.On the other hand, the
한편, 상기 서브 저장부(112)에 다시 상기 신규 전자파일과 동일한 문자열 패턴을 갖는 전자파일이 들어오게 된 경우, 문자열 패턴이 동일한 전자파일들 수가 카운팅될 수 있다. 이는, 누적 카운팅 수가 많은 신규 전자파일들을 헤아려 상기 메인 저장부(111)로 옮길 후보군을 선정하기 위함이다.On the other hand, when an electronic file having the same character string pattern as that of the new electronic file is input to the
상기 서브 저장부(112)는 저장된 문자열 패턴이 일치하는 신규 전자파일들의 수가 기 설정된 설정값에 도달한 경우, 상기 신규 전자파일들을 모두 패턴 분석부(130)로 송출할 수 있다. 상기 기 설정된 설정값은 전자파일 보관장치를 관리하는 사용자에 의해 지정될 수 있는 임의의 값으로써, 메인 저장부(111)에 저장될 수 있는 용량과 문자열 패턴 비교에 필요한 처리시간을 고려하여 산정될 수 있다.The
상기 패턴 변환부(120)는 상기 전자파일 보관장치(100)에 저장을 목적으로 외부로부터 전자파일을 공급 받고, 상기 전자파일의 포맷을 문자열 패턴으로 변환한다. 상기 전자파일의 포맷을 문자열 패턴으로 변환하는 방식은 앞서 설명한 상기 메인 저장부(111)에 저장된 전자파일들의 포맷을 문자열 패턴으로 변환하는 방식과 동일하다. The
도 2는 본 발명의 일 실시예에 따른 패턴 변환부가 전자파일의 포맷을 4비트 단위 16진수 문자열 패턴으로 변환한 형태를 표현한 모식도이다. 도 1의 상기 패턴 변환부(120)에 의해 변환된 문자열 패턴은 해당 전자파일과 함께 상기 패턴 분석부(130)를 통해 상기 메인 저장부(111) 또는 상기 서브 저장부(112)에 전달되어 저장된다.FIG. 2 is a schematic diagram showing a pattern conversion unit according to an embodiment of the present invention in which a format of an electronic file is converted into a 4-bit hexadecimal string pattern in units of bits. The character pattern converted by the
상기 패턴 분석부(130)는 패턴 변환부로부터 공급 받은 전자파일의 문자열 패턴과 상기 메인 저장부(111)에 저장된 전자파일들의 문자열 패턴을 비교한다.The
도 3은 본 발명의 일 실시예에 따른 패턴 분석부가 문자열 패턴을 비교하는 방식을 도시한 모식도이다. 도 1 및 도 3을 참조하면, 상기 패턴 분석부(130)는 상기 패턴 변환부(120)로 공급 받은 문자열 패턴(상부) 전체 중 비교대상 문자열 패턴(F)을 일부 추출할 수 있다. 이때, 비교대상 문자열 패턴(F)을 추출하는 범위는 설정에 따라서 상기 패턴 분석부(130)에 의해 다양하게 변경될 수 있으며, 상호 떨어져 있는 문자열 패턴을 추출할 수 있고, 떨어져 있는 문자열 패턴 간격도 조절할 수 있다. 상기 패턴 변환부(120)의 추출 대상이 되는 전자파일들은 상기 메인 저장부(111)에 저장된 모든 전자파일들을 그 대상으로 한다. 다만, 비교대상 문자열 패턴(F)과 매칭될 수 있는 문자열 패턴(Y)을 신속하게 찾기 위해, 상기 패턴 분석부(130)는 상기 메인 저장부(111)에 저장된 전자파일들 중 사용 빈도수가 높은 전자파일들을 우선 채택하여 해당 전자파일의 문자열 패턴을 추출할 수 있다.FIG. 3 is a schematic diagram illustrating a method of comparing pattern analysis substrings according to an exemplary embodiment of the present invention. Referring to FIGS. 1 and 3, the
아울러, 상기 패턴 분석부(130)는 상기 메인 저장부(111)로부터 저장된 전자파일의 문자열 패턴(하부)을 송부 받아 서로 비교하여 동일성을 판단한다. 도 3의 비교대상 문자열 패턴(F)과 상기 메인 저장부(111)에서 추출한 전자파일의 문자열 패턴(Y) 중 서로 일치하는 부분을 스크리닝 할 수 있다. 다만, 문자열 패턴의 동일성 유무 판단은 사용자의 설정에 따라 다양한 방식으로 이루어질 수 있다. 예를 들면, 도 3에 개시된 바와 달리, 문자열 패턴의 배치상의 열과 행의 위치까지는 동일하지 않아도, 연속 순서만 동일하다면 문자열 패턴이 동일한 것으로 인정될 수 있다. 또는, 열이나 행의 일정간격을 허용한 상태에서 연속 순서가 동일하여도 동일한 것으로 판단할 수 있다.In addition, the
상기 패턴 분석부(130)는 동일한 문자열 패턴을 가진 전자파일들에 동일한 카테고리를 지정하여 상기 메인 저장부(111)로 송출한다. 상기 패턴 분석부(130)가 카테고리를 지정함에 따라, 상기 저장부(111)는 패턴 분석부(130)에 의해 지정된 카테고리별로 분류를 단순하고 빠르게 진행할 수 있게 된다.The
상기 패턴 분석부(130)가 카테고리를 지정하는 방식은 전자파일을 사용자가 쉽게 검색할 수 있도록 전자파일에 표기하는 방식을 포함한다. 예를 들면, 상기 패턴 분석부(130)는 메인 저장부(111)에 저장된 전자파일과 동일한 문자열 패턴을 가진 전자파일들에게 동일한 확장자(예, *.avi)를 부여할 수 있다. 다른 예로는, 메인 저장부에 저장된 메타데이터 정보(파일 형식, 연결 프로그램 정보 등)를 동일한 문자열 패턴을 가진 전자파일들에 삽입 또는 수정하는 방식도 포함한다. 메타데이터 정보를 기준으로 사용자가 전자파일 정보를 쉽게 찾아 볼 수 있도록 검색을 구현한 프로그램들을 이용할 경우, 본 카테고리 지정 방식을 채용하는 것이 바람직하다.The
또 다른 예로서, 상기 패턴 분석부(110)는 메인 저장부(111)에 저장된 전자파일과 동일한 문자열 패턴을 가진 전자파일들에게 식별 문자열 패턴을 삽입할 수 있다. As another example, the
도 4는 도 3에 도시된 동일한 문자열 패턴을 가진 전자파일들에게 패턴 분석부가 식별 문자열 패턴을 삽입하는 과정을 나타내는 모식도이다. 도 1 및 도 4를 참고하면, 동일한 문자열 패턴(F, Y)을 가진 전자파일에게 식별 문자열 패턴(Z)을 삽입할 수 있다. 상기 식별 문자열 패턴(Z)은 동일한 문자열 패턴(F, Y)의 바로 앞부분, 또는 말미에 연결되어 삽입 가능하다. 문자열 패턴 정보를 기준으로 사용자가 전자파일을 쉽게 찾아 볼 수 있도록 검색을 구현한 프로그램을 이용할 경우, 본 카테고리 지정 방식을 채용하는 것이 바람직하다.FIG. 4 is a schematic diagram illustrating a process of inserting an identification character pattern into an electronic file having the same character string pattern shown in FIG. 3. FIG. Referring to FIGS. 1 and 4, an identification string pattern Z can be inserted into an electronic file having the same character pattern (F, Y). The identification string pattern Z can be inserted in the last or last part of the same string pattern F or Y. [ When a program that implements the search so that the user can easily browse the electronic file based on the string pattern information is used, it is preferable to employ this category designation method.
한편, 상기 패턴 변환부(120)로부터 공급 받은 전자파일의 문자열 패턴이 상기 메인 저장부(111)에 저장된 문자열 패턴과 동일한 전자파일인지 확인되지 않는 신규 전자파일인 경우, 상기 패턴 분석부는 상기 전자파일과 해당 문자열 패턴을 서브 저장부(112)로 송출할 수 있다. 신규 전자파일을 상기 메인 저장부(111)에 저장하지 않고 별도로 구성된 상기 서브 저장부(112)에 저장함으로써, 상기 패턴 분석부(130)가 공급되는 전자파일과 비교해야 할 대상 전자파일이 과도하게 늘어나는 것을 방지할 수 있다. In the case where the character pattern of the electronic file supplied from the
여기서, 신규 전자파일은 상기 패턴 분석부(130)의 문자열 패턴 분석 결과가 동일하지 않다는 점에서 ⅰ) 메인 저장부에 저장되지 않은 전자파일(신규로 개발된 프로그램에 의해 생성된 전자파일 포함), ⅱ) 확장자, 메타데이터 정보가 손상된 전자파일 등을 포함한다.In this case, the new electronic file has the following characteristics: i) an electronic file (including an electronic file generated by a newly developed program) that is not stored in the main storage unit, Ii) an extension, an electronic file whose metadata information is damaged, and the like.
상기 서브 저장부(112)에 신규 전자파일들의 누적 카운팅 수가 설정값에 도달된 경우, 상기 서브 저장부(112)는 상기 신규 전자파일들과 해당 문자열 패턴을 상기 패턴 분석부(130)로 송출할 수 있다. 상기 패턴 분석부(130)는 상기 서브 저장부(112)로부터 공급 받은 상기 신규 전자파일들에 동일한 신규 카테고리를 지정할 수 있다. 이 때, 상기 패턴 분석부(130)가 상기 신규 전자파일들에 신규 카테고리를 지정하는 방식은 앞서 설명한 확장자 삽입, 메타데이터 수정/삽입, 식별 문자열 패턴 삽입 방식을 채용할 수 있다.When the accumulated count number of new electronic files reaches the set value in the
상기 패턴 분석부(130)는 신규 카테고리가 지정된 신규 전자파일들과 해당 문자열 패턴을 상기 메인 저장부(111)로 송출할 수 있다. 상기 메인 저장부(111)가 상기 패턴 분석부(130)로부터 송부 받은 신규 전자파일들과 해당 문자열 패턴을 지정된 카테고리별로 저장하게 되면, 신규 전자파일의 등록이 완료된다.
The
이하에서는, 앞서 설명한 전자파일 보관장치를 운용하는 방법에 관하여, 일 예를 들어 시계열적 순서로 실시예를 설명하고자 한다. 따라서, 이하에서 사용하는 용어는 앞서 설명한 전자파일 보관장치에서 사용한 용어와 동일하다면 대응되는 범주로 해석되어야 한다.Hereinafter, an embodiment will be described with respect to a method of operating the above-described electronic file storage apparatus, for example, in a time series sequence. Therefore, the terms used below should be construed as corresponding categories if they are the same as those used in the electronic file storage device described above.
도 5은 본 발명의 일 실시예에 따른 전자파일 보관방법을 나타내는 순서도이다. 도 5를 참조하면, 본 발명의 전자파일 보관 방법은 외부로부터 공급된 상기 전자파일의 포맷(Format)을 문자열 패턴으로 변환하는 (a) 단계, 상기 전자파일의 변환된 문자열 패턴을 기 저장된 전자파일들의 문자열 패턴과 동일성을 비교하는 (b) 단계, 상기 전자파일의 문자열 패턴과 동일성을 갖는 기 저장된 전자파일의 카테고리를 상기 전자파일에 지정하는 (c) 단계 및 상기 전자파일이 지정된 카테고리가 동일한 기존 전자파일과 함께 군으로 분류되어 메인 저장부에 저장되는 (d) 단계를 포함한다. 기 저장된 전자파일의 문자열 패턴과 외부로부터 공급된 전자파일의 문자열 패턴이 동일한 경우, 이상에서 설명한 단계를 포함하여 수행된다.5 is a flowchart illustrating an electronic file archiving method according to an embodiment of the present invention. Referring to FIG. 5, the electronic file archiving method of the present invention includes the steps of (a) converting a format of the electronic file supplied from the outside into a character string pattern, (B) comparing the string pattern of the electronic file with a string pattern of the electronic file; (c) assigning to the electronic file a category of a previously stored electronic file having an identity with the string pattern of the electronic file; and (D) classified into groups together with the electronic file and stored in the main storage unit. And the string pattern of the previously stored electronic file is identical to the string pattern of the electronic file supplied from the outside, the above-described steps are performed.
추가적으로, (b) 단계에서 기 저장된 전자파일의 문자열 패턴과 동일하지 않은 문자열 패턴을 가진 전자파일이 확인 될 경우, 해당하는 전자파일을 신규 전자파일로 지정하고 상기 신규 전자파일은 서브 저장부에 저장된다(b-1).In addition, if an electronic file having a string pattern that is not the same as the string pattern of the electronic file previously stored in step (b) is identified, the corresponding electronic file is designated as a new electronic file and the new electronic file is stored (B-1).
이어서, 상기 서브 저장부에 상기 신규 전자파일이 저장됨에 따라, 동일한 문자열 패턴을 가진 신규 전자파일들의 수가 기설정된 설정값에 도달되었는지 여부를 확인한다(b-2). 누적된 전자파일의 수가 설정값에 도달된 경우, 다시 동일한 문자열 패턴을 가진 전자파일이 외부로부터 유입되는 경우에 대비하여, 메인 저장부에 저장하여 데이터베이스로 구축해 놓는 것이 바람직하다.Next, as the new electronic file is stored in the sub-storage unit, it is determined whether the number of new electronic files having the same character string pattern has reached a preset value (b-2). When the accumulated number of electronic files reaches the set value, it is preferable that the electronic file having the same character string pattern is stored in the main storage unit and constructed as a database in preparation for the case where the electronic file having the same character string is inputted from the outside.
이어서, 기설정된 설정값에 도달된 상기 신규 전자파일들에 신규 카테고리를 지정하고(c), 지정된 카테고리가 동일한 전자파일들이 함께 군으로 분류되어 메인 저장부에 저장된다(d). 여기서, 카테고리를 지정하는 방식은 상기 신규 전자파일들의 메타데이터 또는 확장자를 삽입 또는 수정하는 방식, 상기 신규 전자파일들의 문자열 패턴에 식별 문자열 패턴을 삽입하는 방식을 포함한다.
(C) designating a new category for the new electronic files that have reached the predetermined set value; and (d) storing the electronic files having the same designated category together into a group and being stored in the main storage unit. The method of designating a category includes a method of inserting or modifying metadata or an extension of the new electronic files or a method of inserting an identification string pattern into a string pattern of the new electronic files.
이와 같이, 본 발명의 전자파일 보관 장치 및 이를 운용하는 방법은 개발자의 의도에 따른 다양한 형태의 전자파일의 포맷을 문자열 패턴 형식으로 비교하기 때문에 메타데이터에 의존했던 기존 분류와 다르게 정확도가 높다. 또한, 신규로 개발된 프로그램에 의해 생성된 전자파일들도 빈출 정도를 확인하여 데이터베이스화 하기 때문에 카테고리별로 분류 및 저장이 가능하다.As described above, since the electronic file storage device and the method for operating the electronic file storage device of the present invention compares formats of various types of electronic files according to a developer's intention in a string pattern format, accuracy is high unlike the existing classification that relies on metadata. In addition, electronic files generated by a newly developed program can be classified and stored in categories because they are checked for the degree of frequency and made into a database.
본 발명은 사용자의 오류, 전자파일의 잦은 복사, 온라인 상의 전송, 프로그램 상의 오작동으로 인해 메타데이터가 손상된 전자파일들도 카테고리별로 분류 가능하다.The present invention can also classify electronic files whose metadata has been damaged due to user errors, frequent copying of electronic files, online transmission, and program malfunctions.
또한, 본 발명은 문자열 패턴을 기반으로 메타데이터, 확장자, 식별 문자열 패턴을 삽입/수정하여 카테고리를 지정하므로, 추후 사용자가 찾고자 하는 전자파일을 손쉽게 검색할 수 있다.
In addition, the present invention can easily search an electronic file to be searched by a user because a category is designated by inserting / modifying metadata, an extension, and an identification string pattern based on a character string pattern.
100: 전자파일 보관장치
110: 저장부 111: 메인 저장부
112: 서브 저장부 120: 패턴 변환부
130: 패턴 분석부100: Electronic file storage device
110: storage unit 111: main storage unit
112: Sub-storage unit 120: Pattern conversion unit
130: pattern analysis unit
Claims (12)
상기 저장부가 저장하는 문자열 패턴과 대응하도록, 외부로부터 공급된 신규 전자파일의 포맷을 문자열 패턴으로 변환하는 패턴 변환부; 및
상기 패턴 변환부로부터 공급 받은 신규 전자파일의 문자열 패턴과 상기 저장부에 저장된 문자열 패턴의 동일성을 분석하고, 동일한 문자열 패턴의 카테고리를 지정하여 상기 저장부로 송출하는 패턴 분석부;를 포함하는 전자파일 보관 장치에 있어서,
상기 저장부는 문자열 패턴이 동일한 전자파일들을 카테고리별로 저장하는 메인 저장부 및 상기 메인 저장부에 저장되지 않은 신규 전자파일들을 저장하는 서브 저장부를 포함하고,
상기 패턴 분석부는 상기 메인 저장부에 저장된 문자열 패턴과 동일하지 않는 문자열 패턴을 가진 신규 전자파일을 서브 저장부로 송출하는 것을 특징으로 하는 전자파일 보관 장치.
An electronic file storage unit for grouping items having the same string pattern type according to a format of electronic files into one group and storing the classified categories;
A pattern conversion unit for converting a format of a new electronic file supplied from the outside into a character string pattern so as to correspond to a character string pattern stored by the storage unit; And
And a pattern analysis unit for analyzing the identity of a character string pattern of the new electronic file supplied from the pattern conversion unit and the character string pattern stored in the storage unit and designating a category of the same character string pattern and transmitting the same to the storage unit In the apparatus,
Wherein the storage unit includes a main storage unit for storing electronic files having the same string pattern on a category basis and a sub storage unit for storing new electronic files not stored in the main storage unit,
Wherein the pattern analyzing unit transmits a new electronic file having a character string pattern that is not the same as the character string pattern stored in the main storage unit to the sub storage unit.
상기 서브 저장부는
저장된 문자열 패턴이 일치하는 신규 전자파일들의 수가 기설정된 설정값에 도달된 경우, 신규 전자파일들을 상기 패턴 분석부로 송출하는 것을 특징으로 하는 전자파일 보관장치.
The method according to claim 1,
The sub-
And transmits the new electronic files to the pattern analysis unit when the number of new electronic files whose stored string patterns match reaches a predetermined set value.
상기 패턴 분석부는 상기 신규 전자파일들에 신규 카테고리를 지정하여 상기 메인 저장부로 송출하는 것을 특징으로 하는 전자파일 보관장치.
The method of claim 3,
Wherein the pattern analyzing unit assigns a new category to the new electronic files and sends them to the main storage unit.
상기 패턴 분석부가 카테고리를 지정하는 방식이 전자파일들의 메타데이터 또는 확장자를 삽입 또는 수정하는 것을 특징으로 하는 전자파일 보관장치.
The method according to claim 1 or 4,
Wherein the method of designating the pattern analysis sub-category inserts or modifies metadata or an extension of the electronic files.
상기 패턴 분석부가 카테고리를 지정하는 방식이 전자파일들의 문자열 패턴에 식별 문자열 패턴을 삽입하는 것을 특징으로 하는 전자파일 보관장치.
The method according to claim 1 or 4,
Wherein the method of designating the pattern analysis sub-category inserts an identification string pattern into a string pattern of electronic files.
(a) 외부로부터 공급된 상기 전자파일의 포맷(Format)을 문자열 패턴으로 변환하는 단계;
(b) 상기 전자파일의 변환된 문자열 패턴을 기 저장된 전자파일들의 문자열 패턴과 동일성을 비교하는 단계;
(c) 상기 전자파일의 문자열 패턴과 동일성을 갖는 기 저장된 전자파일의 카테고리를 상기 전자파일에 지정하는 단계; 및
(d) 상기 전자파일이 지정된 카테고리가 동일한 기존 전자파일과 함께 군으로 분류되어 메인 저장부에 저장되는 단계를 포함하는 전자파일 보관방법에 있어서,
상기 (b) 단계는 기 저장된 전자파일의 문자열 패턴과 동일하지 않은 문자열 패턴을 가진 전자파일을 신규 전자파일로 지정하고 서브 저장부에 저장하는 단계를 더 포함하는 것을 특징으로 하는 전자파일 보관방법.
A method for classifying and storing electronic files,
(a) converting a format of the electronic file supplied from the outside into a character string pattern;
(b) comparing the converted string pattern of the electronic file with a string pattern of previously stored electronic files;
(c) assigning to the electronic file a category of a pre-stored electronic file having an identity with a string pattern of the electronic file; And
(d) the electronic file is classified into groups together with existing electronic files having the same category, and stored in the main storage unit,
Wherein the step (b) further comprises the step of designating an electronic file having a character string pattern that is not the same as a character string pattern of the previously stored electronic file as a new electronic file and storing the new electronic file in the sub-storage unit.
상기 (b) 단계는 상기 서브 저장부에 상기 신규 전자파일이 저장됨에 따라, 동일한 문자열 패턴을 가진 신규 전자파일들이 수가 기설정된 설정값에 도달되었는지 여부를 확인하는 단계를 더 포함하는 것을 특징으로 하는 전자파일 보관방법.
8. The method of claim 7,
Wherein the step (b) further comprises confirming whether or not the number of new electronic files having the same string pattern has reached a predetermined set value as the new electronic file is stored in the sub-storage unit How to keep electronic files.
상기 (c)단계는 기설정된 설정값에 도달된 상기 신규 전자파일들에 신규 카테고리를 지정하는 단계를 더 포함하는 것을 특징으로 하는 전자파일 보관방법.
10. The method of claim 9,
Wherein the step (c) further comprises the step of assigning a new category to the new electronic files that have reached the predetermined set value.
카테고리를 지정하는 방식이 상기 신규 전자파일들의 메타데이터 또는 확장자를 삽입 또는 수정하는 것을 특징으로 하는 전자파일 보관방법.
11. The method according to claim 7 or 10,
Wherein a method of specifying a category inserts or modifies metadata or an extension of the new electronic files.
카테고리를 지정하는 방식이 상기 신규 전자파일들의 문자열 패턴에 식별 문자열 패턴을 삽입하는 것을 특징으로 하는 전자파일 보관방법.
11. The method according to claim 7 or 10,
Wherein the method of designating a category inserts an identification string pattern into a string pattern of the new electronic files.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20140143645A KR101490660B1 (en) | 2014-10-22 | 2014-10-22 | Archiving device and method for controlling the same |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20140143645A KR101490660B1 (en) | 2014-10-22 | 2014-10-22 | Archiving device and method for controlling the same |
Publications (1)
Publication Number | Publication Date |
---|---|
KR101490660B1 true KR101490660B1 (en) | 2015-02-05 |
Family
ID=52590410
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR20140143645A KR101490660B1 (en) | 2014-10-22 | 2014-10-22 | Archiving device and method for controlling the same |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101490660B1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112612893A (en) * | 2020-12-29 | 2021-04-06 | 广西安怡臣信息技术有限公司 | Electronic file case generation system |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009289092A (en) | 2008-05-30 | 2009-12-10 | Sony Corp | Information processor, recommendation method, program and recording medium |
KR20120116293A (en) * | 2011-04-12 | 2012-10-22 | (주)나무소프트 | Apparatus and method for managing registration of document file |
KR20130011207A (en) * | 2011-07-21 | 2013-01-30 | (주) 케이씨넷 | Method and system for automatic classification of data |
KR20140039756A (en) * | 2012-09-25 | 2014-04-02 | 에스케이하이닉스 주식회사 | Data storage device and operating method thereof |
-
2014
- 2014-10-22 KR KR20140143645A patent/KR101490660B1/en active IP Right Grant
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009289092A (en) | 2008-05-30 | 2009-12-10 | Sony Corp | Information processor, recommendation method, program and recording medium |
KR20120116293A (en) * | 2011-04-12 | 2012-10-22 | (주)나무소프트 | Apparatus and method for managing registration of document file |
KR20130011207A (en) * | 2011-07-21 | 2013-01-30 | (주) 케이씨넷 | Method and system for automatic classification of data |
KR20140039756A (en) * | 2012-09-25 | 2014-04-02 | 에스케이하이닉스 주식회사 | Data storage device and operating method thereof |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112612893A (en) * | 2020-12-29 | 2021-04-06 | 广西安怡臣信息技术有限公司 | Electronic file case generation system |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103026356B (en) | Semantic content is searched for | |
US9355171B2 (en) | Clustering of near-duplicate documents | |
US20190332606A1 (en) | A system and method for processing big data using electronic document and electronic file-based system that operates on RDBMS | |
US8521759B2 (en) | Text-based fuzzy search | |
US7937652B2 (en) | Document processing device, computer readable recording medium, and computer data signal | |
KR100706389B1 (en) | Image search method and apparatus considering a similarity among the images | |
CN111352898B (en) | Intelligent filing method and system for drug declaration document | |
JP5518301B2 (en) | Information processing device | |
WO2016003904A1 (en) | Computerized systems and methods for converting data for storage in a graph database | |
JP2005532624A (en) | Method and apparatus for classifying data objects in a database | |
CN111353005A (en) | Drug research and development reporting document management method and system | |
JP2023115837A (en) | Patent document creation assisting device, patent document creation assisting method and patent document creation assisting program | |
CN110795397B (en) | Automatic identification method for catalogue and file type of geological data packet | |
KR101234795B1 (en) | Apparatus and method for browsing contents | |
CN111353280A (en) | Method and system for performing hyperlink editing on PDF (Portable document Format) medicine document | |
KR101490660B1 (en) | Archiving device and method for controlling the same | |
CN111190880A (en) | Database detection method and device and computer readable storage medium | |
JP2017195447A (en) | Encoding processing program, encoding processing apparatus, encoding processing method, decryption processing program, decryption processing apparatus and decryption processing method | |
KR102516211B1 (en) | Method and Apparatus for Providing Recommended Playlists | |
CN113254665A (en) | Knowledge graph expansion method and device, electronic equipment and storage medium | |
CN117194322A (en) | File classification management method, system and computing device | |
JP6364387B2 (en) | Feature generation apparatus, method, and program | |
CN116524263A (en) | Semi-automatic labeling method for fine-grained images | |
TW202025073A (en) | Document search device, document search program, and document search method | |
JP5384315B2 (en) | SEARCH DEVICE, METHOD, AND PROGRAM |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20190724 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20200102 Year of fee payment: 6 |
|
R401 | Registration of restoration |