KR100905434B1 - 실시간 색인 정보 추출 기능을 갖는 파일 업로드 방법 및 이를 이용한 웹 스토리지 시스템 - Google Patents

실시간 색인 정보 추출 기능을 갖는 파일 업로드 방법 및 이를 이용한 웹 스토리지 시스템 Download PDF

Info

Publication number
KR100905434B1
KR100905434B1 KR1020080078106A KR20080078106A KR100905434B1 KR 100905434 B1 KR100905434 B1 KR 100905434B1 KR 1020080078106 A KR1020080078106 A KR 1020080078106A KR 20080078106 A KR20080078106 A KR 20080078106A KR 100905434 B1 KR100905434 B1 KR 100905434B1
Authority
KR
South Korea
Prior art keywords
file
information
index
database
index information
Prior art date
Application number
KR1020080078106A
Other languages
English (en)
Inventor
오윤식
Original Assignee
(주)이스트소프트
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)이스트소프트 filed Critical (주)이스트소프트
Priority to KR1020080078106A priority Critical patent/KR100905434B1/ko
Application granted granted Critical
Publication of KR100905434B1 publication Critical patent/KR100905434B1/ko
Priority to JP2009183651A priority patent/JP2010044763A/ja
Priority to US12/538,094 priority patent/US8250060B2/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

실시간 색인 정보 추출 기능을 갖는 파일 업로드(upload) 방법 및 이를 이용한 웹 스토리지(web-storage) 시스템이 제공된다. 본 발명의 일 실시예에 따른 실시간 색인 정보 추출 기능을 갖는 파일 업로드 방법은, 온라인 망을 이용하여 사용자로부터 전송되는 업로드(upload) 대상 파일에 대해 데이터 필터링을 수행하는 데이터 필터링 단계; 상기 데이터 필터링 단계를 통해 필터링된 상기 업로드 대상 파일의 색인(index) 정보로서 텍스트 정보를 추출하되, 상기 업로드 대상 파일이 텍스트 파일이 아니면, 상기 필터링된 업로드 대상 파일로부터 텍스트 정보 추출 및 텍스트 형태로 변환 가능한 특정 정보를 이용하여 텍스트 형태로 변환하는 것 중 어느 하나를 이용하여 색인 정보를 추출하는 색인 정보 추출 단계; 상기 색인 정보 추출 단계를 통해 추출된 텍스트 정보를 이용하여 역파일(inverted file)을 생성하는 역파일 생성 단계; 상기 색인 정보 추출 단계를 통해 추출된 텍스트 정보를 이용하여 색인 데이터베이스를 구성하는 색인 데이터베이스 구성 단계; 및 상기 색인 데이터베이스 구성 단계를 통해 색인 정보가 저장된 상기 업로드 대상 파일의 전송이 완료되면 이를 저장 및 관리하는 파일 저장 및 관리 단계를 포함한다.
이를 이용하면, 파일의 색인 또는 목록을 체계적으로 정리하기 위해 소요되던 별도의 시간적 또는 금전적인 추가적 부담을 최소화 할 수 있게 될 뿐만 아니라, 나아가, 웹 스토리지 시스템에 의해 관리되는 수많은 파일들에 대한 효율적인 색인화 작업이 가능하게 됨으로써, 이를 이용하는 사용자들이 보다 신속하고 용이하게 온라인 상의 파일을 검색할 수 있도록 하는 사용 편의성 향상 등의 효과를 제공할 수 있다.
웹 스토리지 시스템, 파일 업로드, 색인 정보, 목록 정보, 역파일

Description

실시간 색인 정보 추출 기능을 갖는 파일 업로드 방법 및 이를 이용한 웹 스토리지 시스템{File uploading method with function of abstracting index-information in real-time and web-storage system using the same}
본 발명은 파일 업로드 방법 및 이를 이용한 웹 스토리지 시스템에 대한 것으로, 더욱 상세하게는, 실시간 색인 정보 추출 기능을 갖는 파일 업로드 방법 및 이를 이용한 웹 스토리지 시스템에 관한 것이다.
통상 인터넷 등의 온라인 상에서 제공되는 웹 스토리지 서비스의 경우, 서비스 제공자가 웹 스토리지 서버를 운영하고 회원으로 가입한 다수의 사용자는 웹 스토리지 서버 운영자가 배포한 프로그램을 사용하여 웹 스토리지 서버와 교신함으로써 파일의 업로드(upload) 및 다운로드(download) 등의 기능을 수행할 수 있게 된다.
최근 들어, 이와 같은 웹 스토리지 서비스 업체 및 이를 이용하는 사용자가 크게 증가하고 있으며, 이와 비례하여 웹 스토리지 시스템을 통해 관리되는 파일의 종류 및 용량도 크게 증가하고 있는 추세이다. 따라서, 이와 같이 다양한 종류와 큰 용량을 갖는 파일들에 대한 체계적이고 효율적인 관리 방안이 요구되어 왔다.
하지만, 종래에는 업로드가 완료된 파일의 제목 등을 이용한 목록 정보 제공 및 이에 대한 검색 기능 제공 정도의 서비스가 이루어져 왔으며, 보다 정밀한 검색을 위해, 파일에 포함되어 있는 내용으로부터 추출된 색인 정보에 대한 검색 기능 등의 서비스 제공을 위해서는 이를 위한 별도의 작업이 반드시 요구되었다.
다시 말해, 파일이 실제 포함하고 있는 내용 정보를 통한 고급 검색 등의 기능을 제공하기 위해서는, 이미 업로드가 완료된 수많은 파일들로부터 색인어를 추출하고 이를 데이터베이스화 하는 별도의 작업이 추가적으로 이루어져야만 했기 때문에, 이에 소요되는 시간 및 금전적인 부담이 적지 않았다.
또한, 목록 정보를 제공하기 위한 파일의 인덱싱(indexing) 작업은 서버에서 이루어질 수 밖에 없기 때문에, 디스크 부하의 증가와 같은 또 다른 문제점을 유발하게 된다.
한편, 업로드가 완료된 온라인 상의 파일을 사용자가 검색하기 위해 종래에는 온라인 상의 파일을 일일이 내려받은 후 검색할 수밖에 없었으며, 이 경우 검색에 소요되는 시간의 증가나 네트워크 트래픽의 증가 등을 초래하게 됨으로써 사실상 실시간 검색이 불가능 하다는 문제점이 있었다.
이에 따라, 시간적 또는 금전적인 추가적 부담을 최소화 하는 범위 내에서 웹 스토리지 시스템에 의해 관리되는 수많은 파일들의 색인화를 효율적으로 수행하 고, 이를 통해 온라인 상의 파일에 대한 신속하고 용이한 검색 등의 사용자 편의성 향상을 도모하기 위한 새로운 방안이 요구되고 있다.
본 발명이 이루고자 하는 기술적 과제는, 파일의 업로드 과정에서 파일에 대한 색인 및 목록 정리 작업이 동시에 이루어질 수 있도록 함으로써, 웹 스토리지 시스템의 구축 및 이의 관리 효율성, 아울러 사용자의 검색 편의성 등을 크게 향상시킬 수 있도록 하는, 실시간 색인 정보 추출 기능을 갖는 파일 업로드 방법과 이를 이용한 웹 스토리지 시스템을 제공하는 것이다.
본 발명의 기술적 과제들은 이상에서 언급한 기술적 과제로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
상기 과제를 해결하기 위한 본 발명의 일 실시예에 따른 실시간 색인 정보 추출 기능을 갖는 파일 업로드 방법은, 온라인 망을 이용하여 사용자로부터 전송되는 업로드(upload) 대상 파일에 대해 데이터 필터링을 수행하는 데이터 필터링 단계; 상기 데이터 필터링 단계를 통해 필터링된 상기 업로드 대상 파일의 색인(index) 정보로서 텍스트 정보를 추출하되, 상기 업로드 대상 파일이 텍스트 파일이 아니면, 상기 필터링된 업로드 대상 파일로부터 텍스트 정보 추출 및 텍스트 형태로 변환 가능한 특정 정보를 이용하여 텍스트 형태로 변환하는 것 중 어느 하나를 이용하여 색인 정보를 추출하는 색인 정보 추출 단계; 상기 색인 정보 추출 단계를 통해 추출된 텍스트 정보를 이용하여 역파일(inverted file)을 생성하는 역파일 생성 단계; 상기 색인 정보 추출 단계를 통해 추출된 텍스트 정보를 이용하여 색인 데이터베이스를 구성하는 색인 데이터베이스 구성 단계; 및 상기 색인 데이터베이스 구성 단계를 통해 색인 정보가 저장된 상기 업로드 대상 파일의 전송이 완료되면 이를 저장 및 관리하는 파일 저장 및 관리 단계를 포함한다.
본 발명의 다른 실시예에 따른 웹 스토리지 시스템은, 업로드되는 파일이 저장되는 파일 데이터베이스; 상기 파일의 색인 정보로 텍스트 정보가 저장되고, 상기 텍스트 정보에 해당하는 역파일이 저장되는 색인 데이터베이스; 파일 업로드시, 상기 파일을 패킷 단위로 필터링하여 상기 텍스트 정보를 추출하여 저장하고, 상기 텍스트 정보를 이용하여 역파일을 생성하여 저장하는 파일 서버; 및 파일 검색시, 상기 텍스트 정보와 역파일을 이용하여 해당 파일을 검색하는 검색 서버를 포함한다.
삭제
삭제
삭제
삭제
본 발명의 일 실시예에 따른 실시간 색인 정보 추출 기능을 갖는 파일 업로드 방법은, 온라인 망을 이용하여 사용자로부터 전송되는 업로드(upload) 대상 파일에 대해 데이터 필터링을 수행하는 데이터 필터링 단계, 데이터 필터링 단계를 통해 필터링 된 업로드 대상 파일의 정보 가운데 색인(index) 정보를 추출하는 색인 정보 추출 단계, 색인 정보 추출 단계를 통해 추출된 색인 정보를 이용하여 색인 데이터베이스를 구성하는 색인 데이터베이스 구성 단계 및 색인 데이터베이스 구성 단계를 통해 색인 정보가 저장된 업로드 대상 파일의 전송이 완료되면 이를 저장/관리하는 파일 저장/관리 단계를 포함한다.
한편, 본 발명은 상기한 바와 같은 실시간 색인 정보 추출 기능을 갖는 파일 업로드 방법을 이용하여 구성되는 웹 스토리지 시스템을 제공한다.
기타 실시예들의 구체적인 사항들은 상세한 설명 및 도면들에 포함되어 있다.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예를 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예는 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 명세서 전문에 걸쳐 동일 참조 부호는 동일 구성 요소를 지칭한다.
비록 제1, 제2 등이 다양한 소자, 구성요소 또는 섹션들을 서술하기 위해서 이용되나, 이들 소자, 구성요소 또는 섹션들은 이들 용어에 의해 제한되지 않음은 물론이다. 이들 용어들은 단지 하나의 소자, 구성요소 또는 섹션들을 다른 소자, 구성요소 또는 섹션들과 구별하기 위하여 이용하는 것이다. 따라서, 이하에서 언급되는 제1 소자, 제1 구성요소 또는 제1 섹션은 본 발명의 기술적 사상 내에서 제2 소자, 제2 구성요소 또는 제2 섹션일 수도 있음은 물론이다.
본 명세서에서 이용된 용어는 실시예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 명세서에서 이용되는 "포함한다(comprises)" 또는 "포함하는(comprising)"은 언급된 구성요소, 단계, 동작 또는 소자는 하나 이상의 다른 구성요소, 단계, 동작 또는 소자의 존재 또는 추가를 배제하지 않는다. 그리고, "A 또는 B"는 A, B, A 및 B를 의미한다. 또, 이하 명세서 전체에 걸쳐 동일 참조 부호는 동일 구성 요소를 지칭한다.
다른 정의가 없다면, 본 명세서에서 이용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 공통적으로 이해될 수 있는 의미로 이용될 수 있을 것이다. 또 일반적으로 이용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다.
또한, 처리 흐름도 도면들의 각 블록과 흐름도 도면들의 조합들은 컴퓨터 프로그램 인스트럭션들에 의해 수행될 수 있음을 이해할 수 있을 것이다. 이들 컴퓨터 프로그램 인스트럭션들은 범용 컴퓨터, 특수용 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비의 프로세서에 탑재될 수 있으므로, 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비의 프로세서를 통해 수행되는 그 인스트럭션들이 흐름도 블록(들)에서 설명된 기능들을 수행하는 수단을 생성하게 된다. 이들 컴퓨터 프로그램 인스트럭션들은 특정 방식으로 기능을 구현하기 위해 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비를 지향할 수 있는 컴퓨터 이용 가능 또는 컴퓨터 판독 가능 메모리에 저장되는 것도 가능하므로, 그 컴퓨터 이용가능 또는 컴퓨터 판독 가능 메모리에 저장된 인스트럭션들은 흐름도 블록(들)에서 설명된 기능을 수행하는 인스트럭션 수단을 내포하는 제조 품목을 생산하는 것도 가능하다. 컴퓨터 프로그램 인스트럭션들은 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비 상에 탑재되는 것도 가능하므로, 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비 상에서 일련의 동작 단계들이 수행되어 컴퓨터로 실행되는 프로세스를 생성해서 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비를 수행하는 인스트럭션들은 흐름도 블록(들)에서 설명된 기능들을 실행하기 위한 단계들을 제공하는 것도 가능하다.
이하, 첨부된 도면들을 참조하여 본 발명의 일 실시예를 상세히 설명하기로 한다.
도 1a 내지 도 1c는 본 발명의 일 실시예에 따른 실시간 색인 정보 추출 기능을 갖는 파일 업로드 방법을 설명하기 위한 순서도들이다.
참고로, 도면을 통한 본 발명의 실시예를 설명함에 있어 '파일의 전송' 또는 '파일의 업로드'의 용어가 혼용될 수 있으나, 이는 웹 스토리지 등에 대한 파일의 '업로드'를 포함하는 모든 파일의 전송 방식을 의미하는 것으로써, 본 발명의 명세서에 있어 특별한 한정이 없는 한 상기 2개의 용어는 실질적으로 동일한 의미로 사용되는 것으로 한다.
먼저, 도 1a를 참조하여 본 발명의 실시예에 따른 실시간 색인 정보 추출 기능을 갖는 파일 업로드 방법은, 데이터 필터링 단계(S110), 색인 정보 추출 단계(S120), 역파일 생성 단계(S130), 색인 데이터베이스 구성 단계(S140) 및 파일 저장/관리 단계(S150) 등을 포함하여 구성됨을 알 수 있다.
사용자로부터 파일의 전송이 시작되면 서버는 데이터 필터링 단계(S110)를 통해, 전송되는 파일을 일정 단위 데이터 별로 필터링 하게 된다. 여기서, 데이터는 예를 들어, 패킷의 형태로 전송될 수 있다.
즉, 필터링이 이루어지는 데이터의 단위는 매 패킷으로 설정이 이루어질 수도 있으나, 서버 관리자의 설정 등에 따라 다양한 단위를 가질 수 있도록 구성되는 것이 좋다. 또한, 설정된 패킷의 단위는 사용 환경 및 필요 조건 등에 따라 언제라도 변경이 가능하도록 구성되는 것이 바람직할 수 있다.
상기 데이터 필터링 단계(S110)를 통해 파일의 패킷 단위의 필터링이 수행되면 해당 단위 패킷 내의 파일의 정보 가운데 색인 정보를 추출하는 색인 정보 추출 단계(S120)가 이루어진다. 이때, 추출 가능한 색인 정보로는 텍스트(text), 숫자 등이 포함될 수 있으나 본 발명이 반드시 이에 한정되는 것은 아니다.
즉, 사용자의 전송 파일 내부에 포함된 파일 정보 가운데 색인 정보로써의 기능이 가능한 파일을 추출(S120)함으로써, 이를 해당 파일의 검색어 등으로 이용할 수 있도록 하는 것이다. 이 과정에서 파일 정보로부터 색인 정보를 추출하는 방식은, 웹 검색 등의 분야에서 통상적으로 사용되는 다양한 정보 추출 방식 가운데 어떠한 방식이 적용되더라도 무방하다.
이때, 본 발명의 실시예에 따른 실시간 색인 정보 추출 기능을 갖는 파일 업로드 방법은, 상기 데이터 필터링 단계(S110)를 통해 필터링 된 파일이 색인 정보 추출이 용이한 파일(가령, 텍스트 파일 등)이 아닌 경우(S122), 해당 파일 내의 텍스트 정보 등을 추출하거나 텍스트 형태 등으로 변환 가능한 정보를 선택하여 텍스트 형태 등으로 변환(S124)하고, 이렇게 변환된 텍스트 정보 등으로부터 색인 정보를 추출(S126)하는 등의 추가적인 몇 단계를 더 포함할 수 있는데, 이러한 사항은 도 1b를 통해 별도로 나타내었다.
다시 말해, 업로드를 위해 전송되고 있는 파일이 색인 정보 추출이 용이한 파일이 아닌 경우(S122) 해당 파일의 단위 패킷 별 필터링을 통해 파일 내에 포함된 텍스트 정보 등을 추출하거나, 또는, 문자인식 프로그램 등을 이용함으로써 텍스트 정보 형태로 변환 가능한 정보를 추출한 후 이에 대한 적절한 가공을 통해 텍스트 정보로 변환하는 과정(S124) 등에 의해 텍스트 정보를 생성한 다음, 이렇게 생성된 텍스트 정보 가운데 색인 정보로써의 기능이 가능한 정보(텍스트나 숫자 등)를 추출하는 과정(S126)을 수행하게 되는 것이다.
하지만, 이상에서 설명한 바와 같은 색인 정보 추출 과정(S120)은 본 발명의 실시예에 따른 일 예시일 뿐이며, 업로드를 위해 전송 중인 파일에 대한 정보 추출과 이를 통한 색인 정보 추출 등의 과정이 통상의 다양한 방식 가운데 어떠한 방식을 통해서도 이루어질 수 있음은 당업자에 있어 자명할 것이다. 또한, 색인 정보로써 기능 가능한 정보가 반드시 텍스트나 숫자 정보로 한정되지 아니함 역시 당연하나, 설명의 편의를 위해 도 1b 및 이와 관련된 설명에 있어서는 텍스트 등의 정보만을 예로 들어 설명하도록 한다.
다음, 색인 정보 추출 단계(S120)를 통해 파일의 텍스트 정보 가운데 색인 정보로서의 기능이 가능한 정보의 추출이 이루어지면, 역파일(inverted file) 생성 단계(S130)에서는 상기 추출된 색인 정보를 이용하여 해당 파일의 역파일을 구성하게 된다. 역파일이란, 파일이나 데이터베이스 등에서 레코드를 빨리 검색하기 위해 별도로 만든 색인 파일로써, 다중 키 파일(multi key file) 가운데 하나를 의미한 다.
이와 같은 역파일 생성 단계(S130)를 통해, 추출된 색인 정보를 이용한 역파일 생성이 완료되면, 데이터베이스 구성 단계(S140)에서는 이를 이용하여 색인 데이터베이스 등을 구성하게 되며, 이를 통해 최종적으로 업로드가 모두 완료된 파일에 대한 본격적인 저장 및 관리 작업을 수행할 수 있게 된다.
이 과정을 도 1c를 통해 좀 더 상세히 살펴보면 다음과 같다.
추출된 색인 정보를 이용한 역파일 생성이 완료(S130)되면, 생성된 역파일 데이터는 색인 데이터베이스를 통해 저장, 관리(S142)가 이루어지게 된다. 이후, 필터링(S110) 가능한 단위 패킷의 전송이 모두 완료된 것인지 판단하여(S144), 패킷의 전송이 아직 진행중이면 다음 패킷에 대한 필터링(S110)을 수행하도록 하고 단위 패킷에 대한 전송이 모두 완료되었다면 사용자로부터 전송되는 업로드 대상 파일 전체에 대한 전송이 모두 완료된 것인지 판단(S146)하게 된다.
이에 따라, 파일 전체에 대한 전송이 모두 완료된 것으로 판단(S146)되면 해당 파일을 파일 데이터베이스에 저장하고 파일의 목록을 목록 데이터베이스에 저장하여 관리(S148)하게 되며, 만일 파일 전체에 대한 전송이 완료되지 않았다면 다음 단위 패킷에 대한 필터링(S110) 단계를 수행하게 되는 것이다.
즉, 다수의 패킷으로 구성된 업로드 대상 파일의 단위 패킷 별로 색인 정보를 추출(S120)함으로써 색인 데이터베이스를 구성(S142)하고, 해당 파일 전체에 대한 전송이 모두 완료되는 경우 파일 전체를 파일 데이터베이스에 저장함과 동시에 이에 대한 목록 파일을 목록 데이터베이스에 저장(S148)함으로써, 사용자가 파일을 업로드 함과 동시에 파일 데이터베이스, 목록 데이터베이스 및 색인 데이터베이스의 구성이 모두 완료될 수 있게 된다.
지금까지 설명된, 본 발명의 실시예에 따른 실시간 색인 정보 추출 기능을 갖는 파일의 업로드 방법에 따르면, 웹 스토리지 시스템을 이용한 파일의 업로드 과정에 있어 파일에 대한 색인 및 목록 정리 작업이 동시에 이루어질 수 있게 되었다.
이에 따라, 파일의 색인 또는 목록을 체계적으로 정리하기 위해 소요되던 별도의 시간적 또는 금전적인 추가적 부담을 최소화 할 수 있게 되었다는 장점이 있다.
나아가, 웹 스토리지 시스템에 의해 관리되는 수많은 파일들에 대한 효율적인 색인화 작업이 가능하게 됨으로써, 이를 이용하는 사용자들이 온라인 상의 파일들을 보다 신속하고 용이하게 검색할 수 있게 되었다는 등의 사용 편의성 향상과 같은 효과를 제공할 수 있게 되었다는 추가적인 장점도 있다.
이상에서 설명한 본 발명의 실시예에 있어서는 색인 정보 추출 과정이 역파일 생성을 통해 이루어지는 것으로 설명되었으나, 본 발명이 반드시 이에 한정되지 아니함은 당연하며, 본 발명의 색인 정보 추출이 공지된 통상의 어떠한 과정을 통해 이루어지더라도 무방함은 당업자에 있어 자명할 것이다.
도 2는 도 1a 내지 도 1c에 도시된 본 발명의 파일 업로드 방법을 이용한 웹 스토리지 시스템의 구성을 개념적으로 나타낸 설명도이다.
도 2를 참조하면, 본 발명의 실시예에 따른 웹 스토리지 시스템은, 인터넷을 통해 사용자 컴퓨터(210)와 연결된 파일 서버(220), 검색 서버(230) 및 다수의 데이터베이스(240, 250, 260) 등을 포함하여 구성됨을 알 수 있다.
다시 말해, 본 발명의 웹 스토리지 시스템은, 인터넷을 이용해 사용자(210)가 파일 서버(220)에 파일을 업로드 하는 경우, 파일 서버(220)는 해당 파일에 대한 다양한 정보 추출 과정 등을 통해 색인 데이터베이스(260)를 자동으로 구성하며, 상기 파일의 업로드가 모두 완료되면 이를 파일 데이터베이스(240)에 저장 관리함과 동시에, 이에 대한 목록 파일을 별도로 구성된 목록 데이터베이스(250)에 의해 저장 및 관리하도록 구성되는 것이다.
이에 따라, 인터넷을 이용해 파일 서버(220)에 의해 관리되는 다수의 파일 가운데 특정 파일을 검색하고 다운로드 받고자 하는 사용자는, 검색 서버(230)를 통해 색인 데이터베이스(260)의 색인 파일들에 대한 검색을 통해, 실제 파일 정보에 대한 정확하고 용이한 정보 수집이 가능하게 됨으로써, 단순히 목록 데이터베이스(250)만을 이용해 파일을 검색하는 경우에 비해 현저히 향상된 검색 속도 및 검색 품질 등을 제공받을 수 있게 된다.
이때, 업로드 전송중인 파일로부터 색인 정보를 추출하여 데이터베이스화 하 는 과정에 대해서는 앞서 도 1a 내지 도 1c를 통해 상세히 설명하였으므로, 별도의 설명을 부가하지 않기로 한다.
한편, 지금까지 설명된 바와 같은 본 발명의 실시예에 적용되는 업로드 중인 파일에 대한 텍스트 정보 추출과 이를 통한 색인 정보 추출 등이, 가령, 역파일 생성 과정과 같은 단계에 의해 반드시 한정되는 것은 아니고, 통상의 다양한 방식 가운데 어떠한 방식을 통해 이루어지더라도 무방함에 대해서는 전술한 바 있다.
아울러, 본 발명의 명세서에 있어 '파일의 전송' 또는 '파일의 업로드'의 용어가, 동일하게 웹 스토리지 등에 대한 파일의 '업로드'를 포함하는 모든 파일의 전송 방식을 의미하는 것임 또한 전술한 바 있다.
상술한 본 발명의 실시예들은 컴퓨터에서 실행될 수 있는 프로그램으로 작성 가능하고, 컴퓨터로 읽을 수 있는 기록 매체를 이용하여 상기 프로그램을 동작시키는 범용 디지털 컴퓨터에서 구현될 수 있다.
상기 컴퓨터로 읽을 수 있는 기록 매체는 마그네틱 저장 매체(예를 들어, 롬, 플로피 디스크, 하드디스크 등), 광학적 판독 매체(예를 들면, 시디롬, 디브이디 등) 및 캐리어 웨이브(예를 들면, 인터넷을 통한 전송)와 같은 저장 매체를 포함한다.
이상 첨부된 도면을 참조하여 본 발명의 실시예를 설명하였지만, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다.
본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
도 1a 내지 도 1c는 본 발명의 일 실시예에 따른 실시간 색인 정보 추출 기능을 갖는 파일 업로드 방법을 설명하기 위한 순서도들이다.
도 2는 도 1a 내지 도 1c에 도시된 본 발명의 실시간 색인 정보 추출 기능을 갖는 파일 업로드 방법을 이용한 웹 스토리지 시스템의 구성을 개념적으로 나타낸 설명도이다.
<도면의 주요 부분에 관한 부호의 설명>
210: 사용자 220: 파일 서버
230: 검색 서버 240: 파일 DB
250: 목록 DB 260: 색인 DB

Claims (7)

  1. 온라인 망을 이용하여 사용자로부터 전송되는 업로드(upload) 대상 파일에 대해 데이터 필터링을 수행하는 데이터 필터링 단계;
    상기 데이터 필터링 단계를 통해 필터링된 상기 업로드 대상 파일의 색인(index) 정보로서 텍스트 정보를 추출하되, 상기 업로드 대상 파일이 텍스트 파일이 아니면, 상기 필터링된 업로드 대상 파일로부터 텍스트 정보 추출 및 텍스트 형태로 변환 가능한 특정 정보를 이용하여 텍스트 형태로 변환하는 것 중 어느 하나를 이용하여 색인 정보를 추출하는 색인 정보 추출 단계;
    상기 색인 정보 추출 단계를 통해 추출된 텍스트 정보를 이용하여 역파일(inverted file)을 생성하는 역파일 생성 단계;
    상기 색인 정보 추출 단계를 통해 추출된 텍스트 정보를 이용하여 색인 데이터베이스를 구성하는 색인 데이터베이스 구성 단계; 및
    상기 색인 데이터베이스 구성 단계를 통해 색인 정보가 저장된 상기 업로드 대상 파일의 전송이 완료되면 이를 저장 및 관리하는 파일 저장 및 관리 단계를 포함하는 실시간 색인 정보 추출 기능을 갖는 파일 업로드 방법.
  2. 삭제
  3. 삭제
  4. 제 1 항에 있어서,
    상기 색인 데이터베이스 구성 단계를 통해 색인 정보가 저장된 상기 업로드 대상 파일에 대한 전송이 완료되면 목록(list) 파일을 생성하는 목록 파일 생성 단계; 및
    상기 목록 파일 생성 단계를 통해 생성된 목록 파일을 관리하기 위한 별도의 데이터베이스를 구성하는 목록 데이터베이스 구성 단계를 더 포함하는 실시간 색인 정보 추출 기능을 갖는 파일 업로드 방법.
  5. 제 4 항에 있어서,
    상기 색인 정보 추출 단계는 상기 업로드 대상 파일의 단위 패킷에 대해 이루어지되, 상기 업로드 대상 파일에 대한 단위 패킷의 사이즈는 사용자에 의해 설정 또는 변경이 가능한, 실시간 색인 정보 추출 기능을 갖는 파일 업로드 방법.
  6. 업로드되는 파일이 저장되는 파일 데이터베이스;
    상기 파일의 색인 정보로 텍스트 정보가 저장되고, 상기 텍스트 정보에 해당하는 역파일이 저장되는 색인 데이터베이스;
    파일 업로드시, 상기 파일을 패킷 단위로 필터링하여 상기 텍스트 정보를 추출하여 저장하고, 상기 텍스트 정보를 이용하여 역파일을 생성하여 저장하는 파일 서버; 및
    파일 검색시, 상기 텍스트 정보와 역파일을 이용하여 해당 파일을 검색하는 검색 서버를 포함하는 것을 특징으로 하는 웹 스트로지 시스템.
  7. 제 6 항에 있어서,
    상기 업로드되는 파일이 목록화되어 저장 및 관리되는 목록 데이터베이스를 더 포함하는 웹 스토리지 시스템.
KR1020080078106A 2008-08-08 2008-08-08 실시간 색인 정보 추출 기능을 갖는 파일 업로드 방법 및 이를 이용한 웹 스토리지 시스템 KR100905434B1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020080078106A KR100905434B1 (ko) 2008-08-08 2008-08-08 실시간 색인 정보 추출 기능을 갖는 파일 업로드 방법 및 이를 이용한 웹 스토리지 시스템
JP2009183651A JP2010044763A (ja) 2008-08-08 2009-08-06 リアルタイム索引情報抽出機能を有するファイルアップロード方法及びこれを用いたウェブストレージシステム
US12/538,094 US8250060B2 (en) 2008-08-08 2009-08-07 File uploading method with function of abstracting index information in real time and web storage system using the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020080078106A KR100905434B1 (ko) 2008-08-08 2008-08-08 실시간 색인 정보 추출 기능을 갖는 파일 업로드 방법 및 이를 이용한 웹 스토리지 시스템

Publications (1)

Publication Number Publication Date
KR100905434B1 true KR100905434B1 (ko) 2009-07-02

Family

ID=41337142

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080078106A KR100905434B1 (ko) 2008-08-08 2008-08-08 실시간 색인 정보 추출 기능을 갖는 파일 업로드 방법 및 이를 이용한 웹 스토리지 시스템

Country Status (3)

Country Link
US (1) US8250060B2 (ko)
JP (1) JP2010044763A (ko)
KR (1) KR100905434B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101191914B1 (ko) 2010-12-07 2012-10-17 (주)이스트소프트 웹스토리지 서비스를 제공하는 파일관리시스템의 파일 관리방법

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101860621A (zh) * 2010-06-07 2010-10-13 中兴通讯股份有限公司 移动终端文件上传方法和移动终端
US20130013616A1 (en) * 2011-07-08 2013-01-10 Jochen Lothar Leidner Systems and Methods for Natural Language Searching of Structured Data
JP6103037B2 (ja) * 2013-03-15 2017-03-29 日本電気株式会社 計算機システム
CN104978330A (zh) * 2014-04-04 2015-10-14 西南大学 一种数据存储的方法及装置
US11184423B2 (en) * 2018-10-24 2021-11-23 Microsoft Technology Licensing, Llc Offloading upload processing of a file in a distributed system using a key that includes a hash created using attribute(s) of a requestor and/or the file

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000015728A (ko) * 1998-08-31 2000-03-15 윤종용 필터를 사용한 다중 파일을 업로드하는 방법및 시스템
KR20030069635A (ko) * 2002-02-22 2003-08-27 이의범 피투피 방식에 의한 인트라넷 데이터 통합 관리시스템 및그 방법
KR20040017008A (ko) * 2002-08-20 2004-02-26 주식회사 케이랩 검색엔진을 활용한 정보 제공 시스템 및 그 방법
KR20040110957A (ko) * 2003-06-18 2004-12-31 (주)켐파크 피투피(피어 투 피어) 기술을 이용한 웹 컨텐츠를검색하는 방법 및 그 장치

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5968116A (en) * 1996-03-27 1999-10-19 Intel Corporation Method and apparatus for facilitating the management of networked devices
JPH11282880A (ja) * 1998-02-02 1999-10-15 Ricoh Co Ltd 電子化文書検索システムおよび記憶媒体
JP2004193787A (ja) * 2002-12-09 2004-07-08 Matsushita Electric Ind Co Ltd 受信装置、受信システム及び受信方法
CN1292371C (zh) * 2003-04-11 2006-12-27 国际商业机器公司 倒排索引存储方法、倒排索引机制以及在线更新的方法
US7346630B2 (en) * 2003-06-13 2008-03-18 Yahoo! Inc. Method and system for delivery alerts to a user
JP2005115604A (ja) * 2003-10-07 2005-04-28 Canon Inc 情報処理装置、情報処理方法及び記憶媒体
US7756869B2 (en) * 2004-04-30 2010-07-13 The Boeing Company Methods and apparatus for extracting referential keys from a document
JP4347264B2 (ja) * 2005-05-20 2009-10-21 キヤノン株式会社 文書管理システム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000015728A (ko) * 1998-08-31 2000-03-15 윤종용 필터를 사용한 다중 파일을 업로드하는 방법및 시스템
KR20030069635A (ko) * 2002-02-22 2003-08-27 이의범 피투피 방식에 의한 인트라넷 데이터 통합 관리시스템 및그 방법
KR20040017008A (ko) * 2002-08-20 2004-02-26 주식회사 케이랩 검색엔진을 활용한 정보 제공 시스템 및 그 방법
KR20040110957A (ko) * 2003-06-18 2004-12-31 (주)켐파크 피투피(피어 투 피어) 기술을 이용한 웹 컨텐츠를검색하는 방법 및 그 장치

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101191914B1 (ko) 2010-12-07 2012-10-17 (주)이스트소프트 웹스토리지 서비스를 제공하는 파일관리시스템의 파일 관리방법

Also Published As

Publication number Publication date
US20100036821A1 (en) 2010-02-11
JP2010044763A (ja) 2010-02-25
US8250060B2 (en) 2012-08-21

Similar Documents

Publication Publication Date Title
US11972203B1 (en) Using anchors to generate extraction rules
US11423216B2 (en) Providing extraction results for a particular field
US10783318B2 (en) Facilitating modification of an extracted field
Cafarella et al. Data integration for the relational web
KR100905434B1 (ko) 실시간 색인 정보 추출 기능을 갖는 파일 업로드 방법 및 이를 이용한 웹 스토리지 시스템
CN104536904B (zh) 一种数据管理的方法、设备与系统
RU2427896C2 (ru) Аннотирование документов в совместно работающих приложениях данными в разрозненных информационных системах
JP5492187B2 (ja) 編集距離および文書情報を使用する検索結果順位付け
US20070110047A1 (en) Method of collecting and searching for access route of information resource on internet and computer readable medium stored thereon program for implementing the same
CN102930060B (zh) 一种数据库快速索引的方法及装置
CN101452487B (zh) 一种数据加载的方法、系统及数据加载装置
KR20080083488A (ko) 피드 정보를 동기화하는 방법 및 장치
KR101744892B1 (ko) 시계열 계층 인덱싱을 이용한 데이터 검색 시스템 및 데이터 검색 방법
CN106055546A (zh) 基于Lucene的光盘库全文检索系统
CN105468785A (zh) 一种计算机文件管理方法
CN104217011A (zh) HBase二级索引表的查询方法和装置
JP5221664B2 (ja) 情報マップ管理システムおよび情報マップ管理方法
CN106649800A (zh) 一种基于Solr的中文检索方法
CN101963993B (zh) 一种数据库单表记录快速查找的方法
JP2008305352A (ja) 全文検索システム
CN105740997A (zh) 一种控制任务流程的方法、装置及数据库管理系统
JP5416552B2 (ja) ランキング関数生成装置、ランキング関数生成方法、ランキング関数生成プログラム
CN108121807A (zh) Hadoop环境下多维索引结构OBF-Index的实现方法
CN108460067B (zh) 基于数据的瓦片索引结构、索引构建方法和数据检索方法
US20170220644A1 (en) Media discovery across content respository

Legal Events

Date Code Title Description
A201 Request for examination
A302 Request for accelerated examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120611

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20150610

Year of fee payment: 9