KR20080082985A - 데이터 파일 조작 방법 및 장치 - Google Patents

데이터 파일 조작 방법 및 장치 Download PDF

Info

Publication number
KR20080082985A
KR20080082985A KR1020087017094A KR20087017094A KR20080082985A KR 20080082985 A KR20080082985 A KR 20080082985A KR 1020087017094 A KR1020087017094 A KR 1020087017094A KR 20087017094 A KR20087017094 A KR 20087017094A KR 20080082985 A KR20080082985 A KR 20080082985A
Authority
KR
South Korea
Prior art keywords
data
symbols
symbol
encoding
word
Prior art date
Application number
KR1020087017094A
Other languages
English (en)
Inventor
동하이 유
하이롱 유안
Original Assignee
코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 코닌클리케 필립스 일렉트로닉스 엔.브이. filed Critical 코닌클리케 필립스 일렉트로닉스 엔.브이.
Publication of KR20080082985A publication Critical patent/KR20080082985A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

저장 유닛에 저장된 데이터 파일을 인코딩하는 방법에 있어서, 상기 데이터 파일로부터 비-알파벳 데이터(non-alphabetical data)를 추출하는 단계(100)로서, 상기 데이터는 상기 파일과 연관되는, 상기 비-알파벳 데이터 추출 단계; 제1 심볼 세트로부터 수득된 심볼들을 이용하여 상기 데이터를 하나의 워드로 변환하는 단계(101); 인덱스 데이터(320)를 발생하도록 룩업 테이블(look up table)로 상기 워드를 인코딩하는 단계(102)로서, 상기 룩업 테이블은 상기 심볼들을 제2 심볼 세트와 연관시키고, 상기 제2 심볼 세트의 각 심볼은 상기 제1 심볼 세트의 서브세트(subset)와 연관된다.
데이터 파일, 워드, 인덱스 데이터, 인코딩, 심볼 세트

Description

데이터 파일 조작 방법 및 장치{METHOD AND APPARATUS FOR MANIPULATING DATA FILES}
본 발명은 데이터 파일 조작 방법 및 장치, 특히 미디어 파일 조작 방법 및 장치에 관한 것이다.
가전 제품의 가격을 낮추고 향상된 저장 능력과 함께, 소비자는 저장 유닛에 저장된 다수의 파일을 취급한다. 예를 들어, 디지털 엔터테인먼트의 분야에서, 소비자는 다수의 미디어 센터(Media Centers) 상의 미디어 파일, 쥬크박스 또는 MP3 플레이어를 저장할 수 있다. 40GB 내지 100GB 저장 능력은 오늘날 MP3 플레이어 시장에서 흔하고, 사용자들이 하나의 플레이어 내 10,000개 이상의 MP3 음악을 저장하는 것을 가능하게 한다.
로컬 저장 외에도, 커넥티비티(connectivity)의 발달은 소비자에게 거대한 네트워크/원격 저장에 액세스하는 것을 가능하게 한다.
동시에, 미디어 수집은 예를 들어, 중국어 음악, 영어 음악, 프랑스어 음악, 일본어 음악 등 다양한 언어 콘텐츠를 포함한다. 상이한 언어를 각각 취급하는 검색 또는 분류의 공지된 방법은 사용자들이 주어진 미디어 파일을 검색하기 전에 언어 입력 모드(language input mode)를 선택해야만 하는 것을 의미한다.
반면에, CE 디바이스는 전형적으로 원격 제어 또는 기타 제한된 제어 키에 의해 제어된다. 이러한 디바이스들은 종종 연관된 언어를 위한 알파벳의 철자보다 적은 키를 가지는 키보드를 포함한다. 예를 들어, 축소된 키보드를 이용하는 디바이스의 대다수는 터치-톤(Touch-Tone) 전화상에 사용된 셋-넷씩 배열된 키를 사용한다.
큰 미디어 데이터베이스 및 제한된 제어/디스플레이 능력은 미디어 콜렉션을 통해 브라우즈하거나 또는 긴 목록으로부터 특정 미디어를 검색하는데 많은 문제를 야기한다. 이것은 전형적으로 많은 키 프레스가 필요하며 사용자가 찾고 있고 검색을 복잡하게 하는 미디어 이름을 확실하게 하는 것을 요구한다.
축소된 키보드를 사용하여 원하는 텍스트를 입력 및 디스플레이하기 위한 다양한 접근이 개발되어 왔다. 예를 들어, 미국 특허원 US20020126097호는 콘텐츠-관련된 사전을 이용하여 축소된 키보드를 통해 전자 디바이스 내 문자와 숫자를 조합한 데이터를 입력하는 방법 및 장치를 기재한다. 미국 특허번호 US 6307548B1은 축소된 키보드를 명확하게 하는 시스템을 제공한다.
그러나, 상기 언급된 당해 분야는 표적 파일을 검색하는데 언어 모드의 차이점에 관계없이 통합된 입력 방법의 이용에 대한 해결책을 제공하지는 않는다.
본 발명의 목적은 저장 유닛 내 검색을 용이하게 하기 위해 데이터 파일을 인코딩하는 개선된 방법을 제안하는 것이다.
이 목적은 저장 유닛에 저장된 데이터 파일을 인코딩하는 방법에 있어서, 상기 데이터 파일로부터 비-알파벳 데이터(non-alphabetical data)를 추출하는 단계로서, 상기 데이터는 상기 파일과 연관되는, 상기 비-알파벳 데이터 추출 단계; 제1 심볼 세트로부터 수득된 심볼들을 이용하여 상기 데이터를 하나의 워드로 변환하는 단계; 인덱스 데이터를 발생하도록 룩업 테이블(look up table)로 상기 워드를 인코딩하는 단계로서, 상기 룩업 테이블은 상기 심볼들을 제2 심볼 세트와 연관시키고, 상기 제2 심볼 세트의 각 심볼은 상기 제1 심볼 세트의 서브세트(subset)와 연관되는, 상기 인코딩 단계를 포함하는 인코딩 방법으로 달성된다.
이 목적은 또한 저장 유닛에 저장된 데이터 파일을 인코딩하는 장치에 있어서, 상기 데이터 파일로부터 비-알파벳 데이터를 추출하는 추출 수단으로서, 상기 데이터는 상기 데이터 파일과 연관되는, 상기 추출 수단; 제1 심볼 세트로부터 수득된 심볼들을 이용하여 상기 데이터를 하나의 워드로 변환하는 변환 수단; 및 인덱스 데이터를 발생하도록 룩업 테이블로 상기 워드를 인코딩하는 인코딩 수단으로서, 상기 룩업 테이블은 제2 심볼 세트와 상기 심볼들을 연관시키고, 제2 심볼 세트의 각 심볼은 상기 제1 심볼 세트의 서브세트와 연관되는, 상기 인코딩 수단을 포함하는, 인코딩 장치로 달성된다.
본 발명의 다른 목적은 저장 유닛에 저장된 데이터 파일을 검색하는 개선된 방법을 제안하는 것이다.
상기 목적은 저장 유닛에 저장된 데이터 파일을 검색하는(retrieving) 방법에 있어서, 상기 데이터 파일의 각각은 인덱스 데이터와 연관되고, 상기 방법은, 제1 심볼 세트로부터 수득된 심볼들을 이용하여 하나의 워드를 발생하는 단계; 인코딩된 데이터를 발생하도록 룩업 테이블로 상기 워드를 인코딩하는 단계로서, 상기 룩업 테이블은 상기 심볼들을 제2 심볼 세트와 연관시키고, 제2 심볼 세트의 각 심볼은 상기 제1 심볼 세트의 서브 세트와 연관되는, 상기 인코딩 단계; 및 상기 인코딩된 데이터와 매칭하는 인덱스 데이터를 가지는 모든 데이터 파일들을 검색하는 단계를 포함하는, 검색 방법에 의해 달성된다.
이 목적은 또한 저장 유닛에 저장된 데이터 파일을 검색하는 장치에 있어서, 상기 데이터 파일의 각각은 인덱스 데이터와 연관되는, 상기 장치는, 제1 심볼 세트로부터 수득된 심볼들을 이용하여 하나의 워드를 발생하는 발생 수단; 인코딩된 데이터를 발생하도록 룩업 테이블로 상기 워드를 인코딩하는 인코딩 수단으로서, 상기 룩업 테이블은 상기 심볼들을 제2 심볼 세트와 연관시키고, 제2 심볼 세트의 각 심볼은 상기 제1 심볼 세트의 서브세트와 연관되는, 상기 인코딩 수단; 및 상기 인코딩된 데이터와 매칭하는 인덱스 데이터를 가지는 모든 데이터 파일들을 검색하는 검색 수단을 포함하는, 검색 장치로서 달성된다.
따라서, 본 발명은 데이터 파일을 조작하는 언어-독립 방식으로 상이한 언어를 다루는 해결책을 제공하는 한편, 질문 콘텐츠를 확실히 인식하지 않아도 데이터 파일을 검색하는 해결책을 제공한다.
다른 목적 및 본 발명의 추가의 이해를 함께 달성하는 것은 첨부한 도면과 결합된 다음의 설명 및 청구범위와 관련되어 명백해 질 것이다.
본 발명은 첨부한 도면과 관련하여 기재될 것이다.
도 1은 본 발명에 따른 비-알파벳 데이터 파일을 인코딩하는 방법의 순서도.
도 2는 본 발명에 따른 저장 유닛 내 데이터 파일을 검색하는 순서도.
도 3은 본 발명에 따른 데이터 레코드 포맷의 구조를 도시한 도면.
도 4는 본 발명에 따른 방법에서 이용된 룩업 테이블을 도시한 도면.
도 5는 본 발명에 따라 저장 유닛에 저장된 데이터 파일을 인코딩하는 장치를 도시한 도면.
도 6은 본 발명에 따라 저장 유닛에 저장된 데이터 파일을 검색하는 장치를 도시한 도면.
부품을 나타내는 숫자는 동일한 참고에 의해 일치된다.
도 1은 본 발명에 따라 비-알파벳 데이터 파일을 인코딩하는 방법의 순서도를 보여준다.
본 방법은 저장 유닛에 저장된 데이터 파일을 인코딩하는 방법을 제공하고, 상기 방법은 비-알파벳 데이터를 추출하는 단계(100)를 포함하고, 상기 데이터는 상기 파일과 연관된다. 새 데이터 파일이 데이터 파일 저장 유닛에 저장되는 경우, 파일과 연관된 데이터는 단계(100)에서 추출되고, 상기 데이터는 파일의 키워드 또는 파일의 메타데이터, 즉 MP3 파일의 ID3 태그, 또는 그림의 Exif 데이터를 포함할 수 있다. 예를 들어 "
Figure 112008050478422-PCT00001
"의 제목으로 MP3에 저장된 중국 음악에 대응하는 데이터 파일과 함께, 텍스트 워드 "
Figure 112008050478422-PCT00002
"는 단계(100)에 의해 추출된 다.
본 방법은 또한 제1 세트의 심볼로부터 수득된 심볼들을 이용하여 상기 비-알파벳 데이터를 워드로 변환하는 단계(101)를 포함한다. 추출된 데이터는 알파벳 또는 비-알파벳(중국어, 한국어 및 일본어)일 수 있기 때문에, 비-알파벳 데이터는 제1세트의 심볼로부터 수득된 심볼들을 이용하여 단계(101)에서 하나의 워드로 변환되고, 이는 A, B, C, D, E, F...Z의 26 개의 영어 알파벳 문자일 수 있다. 임의의 단순화된 중국어 문자 또는 전통적인 중국어 문자는 "PINYIN" 심볼로 변환될 수 있고, 및 임의의 한국어 문자는 "Jamos" 심볼로 변환될 수 있다. 따라서, 단계(101)에서, 비-알파벳 문자"
Figure 112008050478422-PCT00003
"는 이들의 "PINYIN" 형태인 "zhifeiji"로 변환된다.
본 방법은 또한 인덱스 데이터(320)를 발생하는 룩업 테이블로 상기 워드를 인코딩하는 단계(102)를 포함하고, 상기 룩업 테이블은 제2세트의 심볼을 상기 심볼과 연관시키고, 상기 제2세트의 심볼의 각 심볼은 상기 제1세트의 심볼의 서브세트와 연관된다.
단계(101) 이후에, 비-알파벳 데이터는 하나의 워드로 변환된다. 단계(102)에서 워드는 인덱스 데이터(320)를 발생하는 룩업 테이블로 인코딩된다. 룩업 테이블은 도 4에 도시된다. 상기 예에 따르면, 단계(102)에서, 워드 "zhifeiji"는 도 4에서 도시된 대로, 룩업 테이블에 따라 인코딩된다. 이 테이블을 사용한 경우, 인덱스로 언급되는 인코딩된 데이터는 "72322333"이다.
도 4는 본 발명에 따른 방법에 이용된 룩업 테이블을 나타낸다. 이 테이블에서, 좌 열은 제1세트의 심볼을 나타내고: A, B, C, D, E, F...Z, 및 우 열은 제2세트의 심볼들, 1,2,3,4,5,6,7을 나타낸다. 분명히, 심볼들은 다른 심볼일 수 있다. 예를 들어, 제2세트의 심볼의 각 심볼은 제1세트의 심볼의 서브세트와 연관된다. 심볼 "1"은 A, B, C, D와 연관되며, 심볼 "2"는 E, F, G, H를 나타낸다. 분명히 심볼의 제1세트의 서브세트에 대응하는 서브세트는 다양할 수 있다.
추가로, 본 발명은 데이터 레코드를 발생하는 단계로서(도시되지 않음) 상기 데이터 레코드는 상기 인덱스 데이터(320) 및 파일 포인터를 포함하며, 상기 파일 포인터는 상기 파일과 상기 데이터 레코드를 링크하는, 상기 데이터 레코드 발생 단계 및 데이터베이스 내 상기 데이터 레코드를 저장하는 단계를 포함하는 방법을 제공한다.
도 3은 본 발명에 따른 데이터 레코드 포맷의 구조를 설명한다. 상기 데이터 레코드는 인덱스 데이터(320) 및 파일 포인터(330)를 포함하고, 상기 파일 포인터(330)는 상기 파일과 상기 데이터 레코드를 링크하고, 이후에 데이터 레코드는 데이터베이스 내 저장된다. 포인터(330)는 파일의 저장 위치(주소) 또는 데이터 레코드가 나타내는 파일을 검색할 수 있는 애플리케이션을 통한 플랫폼에 대한 참고자료일 수 있다. 추가의 태그(340)는 파일 콘텐츠 즉, 언어, 카테고리, 개인적 취향의 마크 등을 정교히-분류한 다른 태그이다. 얼마나 많은 태그 및 어떤 종류의 태그가 이용되는지는 임의적이고 애플리케이션에 의존한다. 본 발명은 다른 카테고리, 예를 들어"앨범_명", "아티스트_명"으로 파일을 검색할 수 있다. 각 카테 고리에 대해, 데이터 레코드는 생성되고 데이터베이스에 추가된다. 다른 검색 카테고리를 식별하기 위해, 카테고리 정보는 데이터 레코드 "부가 태그(340)"에 부가될 수 있다. 헤더(header;310)는 미리 규정된 라벨로 새 레코드의 시작을 표시한다.
게다가, 본 발명은 다수의 데이터 레코드를 발생하는 단계(도시되지 않음)를 포함하는 방법을 제공하고, 상기 데이터 레코드의 각각은 상기 인덱스 데이터(320)의 하위문자열(substring)을 포함한다. "ABC DEF GHI"의 제목을 가진 파일과 대응하는 인덱스 데이터(320)"111 122 223"을 가정한다. 인덱스 데이터(320)의 다음 세 개의 하위문자열은 다음으로 생성된다:
111 122 223
122 223
223
따라서, 세 개의 데이터 레코드가 발생된다. 각각은 인덱스 데이터(320)의 하나의 하위문자열을 포함한다. 모든 세 개의 데이터 레코드는 각각 포인터(330)를 사용하여 "ABC DEF GHI"로 제목을 가진 파일에 관한 것이다. 따라서, 이 방법은 또한 하위문자열 인코딩 방법을 제공한다.
반면, 상기 인덱스 데이터(320)가 다수의 심볼 세트를 포함하는 경우, 본 발명은 각 심볼들의 세트의 제1 심볼을 연쇄함으로써 유도된 인덱스 데이터를 발생하는 단계를 포함하는 방법을 제공한다. 상기 예에서, 유도된 인덱스 데이터(112)는 각 세트의 심볼의 제1 심볼(111 122 223)을 연쇄하여 발생된다.
도 2는 본 발명에 따른 저장 유닛 내 데이터 파일을 검색하는 순서도를 보여준다.
본 발명은 저장 유닛에 저장된 데이터 파일을 검색하는 방법을 제공하고, 상기 데이터 파일의 각각은 인덱스 데이터(320)와 연관되며, 상기 방법은 제1세트의 심볼로부터 수득된 심볼들을 이용하여 워드를 발생시키는 단계(200)를 포함한다. 단계(200)에서, 저장 유닛에 저장된 특정 데이터 파일을 검색하도록 하나의 조회가 발생되고, 상기 파일의 각각은 인덱스 데이터(320)와 연관된다. 조회가 비-알파벳인 경우, 26 개의 영어 알파벳 캐릭터 A, B, C, D, E, F...Z일 수 있는 제1세트의 심볼로부터 수득된 심볼들을 이용하여 워드로 미리 변환되어야 한다. 여기서 한 예로, 사용자가 제목이 "
Figure 112008050478422-PCT00004
"인 중국 노래를 찾기를 원하는 경우, PINYIN 형태인 "zhifeiji"를 이용할 수 있다. 대부분의 경우, 사용자는 대개 전체 문자열을 삽입할 필요가 없고, 원하는 데이터 파일을 검색할 때까지 2 내지 5개의 키를 누르는 것이 필요하다.
이 방법은 또한 인코딩된 데이터를 발생하는 룩업 테이블로 상기 워드를 인코딩하는 단계(201)를 포함하고, 상기 룩업 테이블은 제2세트의 심볼을 상기 심볼과 연관시키고, 제2세트의 심볼의 각 심볼은 상기 제1세트의 심볼의 서브세트와 연관된다. 사용자가 워드를 입력하는 경우, 워드는 인코딩된 데이터를 발생시키는 룩업 테이블로 단계(201)에 의해 인코딩된다. 룩업 테이블의 하나의 예가 도 4에 도시된다. 축소된 키보드는 룩업 테이블을 채택할 수 있고, 키보드의 각 키는 문 자의 서브세트와 관련된다.
본 발명은 또한 상기 인코딩된 데이터와 매칭하는 인덱스 데이터(320)를 가지는 모든 데이터 파일을 검색하는 검색 단계(202)를 포함한다.
상기 인덱스 데이터(320)는 상기 인코딩된 데이터와 매칭하는 두 개의 상황이 존재한다. 하나의 상황에서, 상기 검색 단계(202)는 인덱스 데이터(320)와 연관된 데이터 파일을 식별하는 단계(도시되지 않음)를 포함하고, 상기 인덱스 데이터(320)는 상기 인코딩된 데이터를 포함한다. 예를 들어, 사용자가 "111 122 223"인 인덱스 데이터(320)에 대응하는 "ABC DEF GHI"로 명명된 파일을 검색하길 원하는 경우, ABC, DEF 또는 GHI의 어느 하나만을 알 수 있고, 그래서 각각의 대응하는 인코딩된 데이터가 각각 "111" 또는 "122" 또는 "223"인 ABC, 또는 DEF, 또는 GHI를 입력할 수 있다. 검색 알고리즘은 완성된 인덱스 데이터 "111 122 223"을 검색할 것이다. 이것은 상기 인코딩된 데이터 "111" 또는 "122" 또는 "223"을 포함하는 상기 인덱스 데이터 "111 122 223" 을 찾기 때문에, 인덱스 테이터(320)와 연관된 모든 데이터 파일을 식별할 것이고, 상기 인덱스 데이터(320)는 상기 인코딩된 데이터를 포함한다.
다른 상황에서, 상기 검색 단계(202)는 인덱스 데이터(320)와 연관된 데이터 파일을 식별하는 단계(도시되지 않음)를 포함하고, 상기 인덱스 데이터(320)는 다수의 심볼 세트를 포함하며, 검색 단계(202)는 연관된 워드를 발생하는 상기 심볼 세트의 모든 제1 심볼의 연쇄(도시되지 않음); 및 상기 인코딩된 데이터와 함께 상기 연쇄된 워드를 비교하는 단계를 더 포함한다. 상기 예를 따라: 사용자가 파일 을 찾기 위해 제목 "ADG(대응하는 인코딩된 데이터는 "112"임)"의 모든 제1문자를 입력하길 원하고, 검색 알고리즘이 상기 심볼 세트("111 222 333")의 모든 제1 심볼을 연쇄하여, 연쇄된 워드 "112"를 발생하고 및 상기 인코딩된 데이터 "112"와 상기 연쇄된 워드 "112"를 비교한다.
게다가, 본 발명은 상기 워드가 상기 발생 단계에 의해 변경되자마자 상기 인코딩 단계(201) 및 검색 단계(202)를 트리거(trigger)하는 단계(도시되지 않음)를 포함하는 방법을 제공한다. 이것은 본 발명의 다른 관점으로, 사용자가 단일 프레스를 생성하는 경우마다, 상기 워드가 상기 발생 단계에 의해 변경되자마자 상기 인코딩 단계(201) 및 검색 단계(202)를 트리거(trigger)할 것이다.
도 1 및 도 2에서 도시된 본 발명은 저장 유닛에 저장된 데이터 파일을 조작하는 방법으로서, 상기 데이터 파일로부터 비-알파벳 데이터를 추출하는 단계(100); 제1 심볼 세트로부터 수득된 심볼들을 이용하여 상기 데이터를 하나의 워드로 변환하는 단계(101); 인덱스 데이터(320)를 발생하도록 룩업 테이블로 상기 워드를 인코딩하는 단계(102)로서, 상기 룩업 테이블은 상기 심볼들을 제2 심볼 세트와 연관시키고, 제2 심볼 세트의 각 심볼은 상기 제1 심볼 세트의 서브세트(subset)와 연관되는, 상기 인코딩 단계; 제1 심볼 세트로부터 수득된 심볼들을 이용하여 하나의 워드를 발생하는 단계(200); 인코딩된 데이터를 발생하도록 룩업 테이블로 상기 워드를 인코딩하는 단계(201); 및 상기 인코딩된 데이터와 매칭하는 인덱스 데이터(320)를 가지는 모든 데이터 파일들을 검색하는 단계(202)로서, 상기 각각의 데이터 파일들은 상기 인덱스 데이터와 연관되는, 상기 검색 단계를 포함하 는, 데이터 파일 조작 방법을 형성하도록 유리하게 통합될 수 있다.
도 5는 본 발명에 따라 저장 유닛에 저장된 데이터 파일을 인코딩하는 장치를 나타낸다.
저장 유닛에 저장된 파일 인코딩(511)용 장치(520)로서, 상기 파일은 MP3 파일과 같은 미디어 파일일 수 있고, 상기 장치는 상기 파일로부터 비-알파벳 데이터를 추출하는 추출 수단(521); 제1세트의 심볼로부터 수득된 심볼들을 이용하여 상기 비-알파벳 데이터를 하나의 워드로 변환하는 변환 수단(522); 및 인덱스 데이터(320)를 발생하도록 룩업 테이블로 상기 워드를 인코딩하는 인코딩 수단(523)을 포함하고, 상기 룩업 테이블은 제2 심볼 세트를 상기 심볼과 연관시키고, 상기 제2 심볼 세트의 각 심볼은 상기 제1 심볼 세트의 서브세트와 연관된다.
도 6은 본 발명에 따라 저장 유닛에 저장된 데이터 파일을 검색하는 장치를 나타낸다.
저장 유닛에 저장된 데이터 파일을 검색하는 장치(610)에서 상기 파일의 각각은 인덱스 데이터(320)와 연관된다. 상기 장치는 제1 심볼 세트로부터 수득된 심볼들을 이용하여 하나의 워드를 발생하는 발생 수단(611); 인코딩된 데이터를 발생하도록 룩업 테이블로 상기 워드를 인코딩하는 인코딩 수단(612)으로서, 상기 룩업 테이블은 상기 심볼들을 제2 심볼 세트와 연관시키고, 제2 심볼 세트의 각 심볼은 상기 제1 심볼 세트의 서브세트와 연관되는, 상기 인코딩 수단; 및 상기 인코딩된 데이터와 매칭하는 인덱스 데이터(320)를 가지는 모든 데이터 파일들을 검색하는 검색 수단(613)을 포함한다.
도 5 및 도 6에서 도시된 장치는 상기 데이터 파일(511)로부터 비-알파벳 데이터를 추출하는 추출 수단(521); 제1 심볼 세트로부터 수득된 심볼들을 이용하여 상기 데이터를 하나의 워드로 변환하는 변환 수단(522); 인덱스 데이터(320)를 발생하도록 룩업 테이블로 상기 워드를 인코딩하는 인코딩 수단(523)으로서, 상기 룩업 테이블은 제2 심볼 세트와 상기 심볼들을 연관시키고, 제2 심볼 세트의 각 심볼은 상기 제1 심볼 세트의 서브세트와 연관되는, 상기 인코딩 수단; 제1 심볼 세트로부터 수득된 심볼들을 이용하여 워드를 발생하는 발생 수단(611); 인코딩된 데이터를 발생하도록 룩업 테이블로 상기 워드를 인코딩하는 인코딩 수단(612); 및 상기 인코딩된 데이터와 매칭하는 인덱스 데이터(320)를 가지는 모든 데이터 파일들을 검색하는 검색 수단(613)을 포함하고, 저장 유닛에 저장된 데이터 파일을 조작하는 시스템을 형성하도록 유리하게 통합될 수 있다.
상기 본 발명의 양태는 도해되고 비-제한된 것으로 의도된 것을 인지할 것이다. 본 실시예에 대한 다양한 변경이 본 발명의 범위를 벗어나지 않고 당업자에 의해 만들어질 수 있다.

Claims (14)

  1. 저장 유닛에 저장된 데이터 파일을 인코딩하는 방법에 있어서,
    상기 데이터 파일로부터 비-알파벳 데이터(non-alphabetical data)를 추출하는 단계(100)로서, 상기 데이터는 상기 파일과 연관되는, 상기 비-알파벳 데이터 추출 단계;
    제1 심볼 세트로부터 수득된 심볼들을 이용하여 상기 데이터를 하나의 워드로 변환하는 단계(101);
    인덱스 데이터(320)를 발생하도록 룩업 테이블(look up table)로 상기 워드를 인코딩하는 단계(102)로서, 상기 룩업 테이블은 상기 심볼들을 제2 심볼 세트와 연관시키고, 상기 제2 심볼 세트의 각 심볼은 상기 제1 심볼 세트의 서브세트(subset)와 연관되는, 상기 인코딩 단계를 포함하는, 인코딩 방법.
  2. 제1항에 있어서,
    상기 비-알파벳 데이터는 메타데이터(metadata)인, 인코딩 방법.
  3. 제1항 또는 제2항에 있어서,
    데이터 레코드를 발생시키는 단계로서, 상기 데이터 레코드는 상기 인덱스 데이터(320) 및 파일 포인터(330)를 포함하고, 상기 파일 포인터(330)는 상기 데이터 레코드를 상기 파일과 링크하는, 상기 데이터 레코드 발생 단계; 상기 데이터 레코드를 데이터베이스에 저장하는 단계를 더 포함하는, 인코딩 방법.
  4. 제3항에 있어서,
    태그(340)를 상기 데이터 레코드에 부가하는 단계로서, 상기 태그(340)는 상기 파일의 콘덴츠를 분류하는, 상기 태그 부가 단계를 더 포함하는, 인코딩 방법.
  5. 제3항에 있어서,
    다수의 데이터 레코드를 발생하는 단계로서, 각각의 상기 데이터 레코드들은 상기 인덱스 데이터(320)의 하위문자열(substring)을 포함하는, 상기 데이터 레코드 발생 단계를 더 포함하는, 인코딩 방법.
  6. 제1항에 있어서,
    상기 인덱스 데이터(320)는 다수의 심볼 세트를 포함하고, 각 심볼 세트의 각 제1 심볼을 연쇄함으로써 유도된 인덱스 데이터를 발생하는 단계를 더 포함하는, 인코딩 방법.
  7. 저장 유닛에 저장된 데이터 파일을 검색하는(retrieving) 방법에 있어서, 상기 데이터 파일의 각각은 인덱스 데이터(320)와 연관되고, 상기 방법은,
    제1 심볼 세트로부터 수득된 심볼들을 이용하여 하나의 워드를 발생하는 단계(200);
    인코딩된 데이터를 발생하도록 룩업 테이블로 상기 워드를 인코딩하는 단계(201)로서, 상기 룩업 테이블은 상기 심볼들을 제2 심볼 세트와 연관시키고, 제2 심볼 세트의 각 심볼은 상기 제1 심볼 세트의 서브 세트와 연관되는, 상기 인코딩 단계; 및
    상기 인코딩된 데이터와 매칭하는 인덱스 데이터(320)를 가지는 모든 데이터 파일들을 검색하는 단계(202)를 포함하는, 검색 방법.
  8. 제7항에 있어서,
    상기 검색 단계(202)는 인덱스 데이터(320)와 연관된 데이터 파일을 식별하는 단계로서, 상기 인덱스 데이터(320)는 상기 인코딩된 데이터를 포함하는, 상기 데이터 파일 식별 단계를 포함하는, 검색 방법.
  9. 제7항에 있어서,
    상기 검색 단계(202)는 인덱스 데이터(320)와 연관된 데이터 파일을 식별하는 단계로서, 상기 인덱스 데이터(320)는 다수의 심볼 세트를 포함하는, 상기 데이터 파일 식별 단계를 포함하고,
    연쇄된 워드를 발생시키기 위해 상기 심볼 세트의 모든 제1 심볼을 연쇄하는 단계; 및
    상기 인코딩된 데이터와 상기 연쇄된 워드를 비교하는 단계를 더 포함하는, 검색 방법.
  10. 제7항에 있어서,
    상기 워드가 상기 발생 단계에 의해 변환되자마자 상기 인코딩 단계(201) 및 검색 단계(202)를 트리거(trigger)하는 단계를 더 포함하는, 검색 방법.
  11. 저장 유닛에 저장된 데이터 파일을 조작하는(manipulating) 방법에 있어서,
    상기 데이터 파일로부터 비-알파벳 데이터를 추출하는 단계(100)로서, 상기 데이터는 상기 파일과 연관되는, 상기 비-알파벳 데이터 추출 단계;
    제1 심볼 세트로부터 수득된 심볼들을 이용하여 상기 데이터를 하나의 워드로 변환하는 단계(101);
    인덱스 데이터(320)를 발생하도록 룩업 테이블로 상기 워드를 인코딩하는 단계(102)로서, 상기 룩업 테이블은 상기 심볼들을 제2 심볼 세트와 연관시키고, 제2 심볼 세트의 각 심볼은 상기 제1 심볼 세트의 서브세트(subset)와 연관되는, 상기 인코딩 단계;
    제1 심볼 세트로부터 수득된 심볼들을 이용하여 하나의 워드를 발생하는 단계(200);
    인코딩된 데이터를 발생하도록 룩업 테이블로 상기 워드를 인코딩하는 단계(201); 및
    상기 인코딩된 데이터와 매칭하는 인덱스 데이터(320)를 가지는 모든 데이터 파일들을 검색하는 단계(202)로서, 상기 각각의 데이터 파일들은 상기 인덱스 데이 터와 연관되는, 상기 검색 단계를 포함하는, 데이터 파일 조작 방법.
  12. 저장 유닛에 저장된 데이터 파일을 인코딩하는 장치에 있어서,
    상기 데이터 파일(511)로부터 비-알파벳 데이터를 추출하는 추출 수단(521)으로서, 상기 데이터는 상기 데이터 파일(511)과 연관되는, 상기 추출 수단;
    제1 심볼 세트로부터 수득된 심볼들을 이용하여 상기 데이터를 하나의 워드로 변환하는 변환 수단(522); 및
    인덱스 데이터(320)를 발생하도록 룩업 테이블로 상기 워드를 인코딩하는 인코딩 수단(523)으로서, 상기 룩업 테이블은 제2 심볼 세트와 상기 심볼들을 연관시키고, 제2 심볼 세트의 각 심볼은 상기 제1 심볼 세트의 서브세트와 연관되는, 상기 인코딩 수단을 포함하는, 인코딩 장치.
  13. 저장 유닛에 저장된 데이터 파일을 검색하는 장치에 있어서, 상기 데이터 파일의 각각은 인덱스 데이터(320)와 연관되는, 상기 장치는,
    제1 심볼 세트로부터 수득된 심볼들을 이용하여 하나의 워드를 발생하는 발생 수단(611);
    인코딩된 데이터를 발생하도록 룩업 테이블로 상기 워드를 인코딩하는 인코딩 수단(612)으로서, 상기 룩업 테이블은 상기 심볼들을 제2 심볼 세트와 연관시키고, 제2 심볼 세트의 각 심볼은 상기 제1 심볼 세트의 서브세트와 연관되는, 상기 인코딩 수단; 및
    상기 인코딩된 데이터와 매칭하는 인덱스 데이터(320)를 가지는 모든 데이터 파일들을 검색하는 검색 수단(613)을 포함하는, 검색 장치.
  14. 저장 유닛에 저장된 데이터 파일을 조작하는 시스템에 있어서,
    상기 데이터 파일(511)로부터 비-알파벳 데이터를 추출하는 추출 수단(521)으로서, 상기 데이터는 상기 파일과 연관되는, 상기 비-알파벳 데이터 추출 수단;
    제1 심볼 세트로부터 수득된 심볼들을 이용하여 상기 데이터를 하나의 워드로 변환하는 변환 수단(522);
    인덱스 데이터(320)를 발생하도록 룩업 테이블로 상기 워드를 인코딩하는 인코딩 수단(523)으로서, 상기 룩업 테이블은 제2 심볼 세트와 상기 심볼들을 연관시키고, 제2 심볼 세트의 각 심볼은 상기 제1 심볼 세트의 서브세트와 연관되는, 상기 인코딩 수단;
    제1 심볼 세트로부터 수득된 심볼들을 이용하여 워드를 발생하는 발생 수단(611);
    인코딩된 데이터를 발생하도록 룩업 테이블로 상기 워드를 인코딩하는 인코딩 수단(612); 및
    상기 인코딩된 데이터와 매칭하는 인덱스 데이터(320)를 가지는 모든 데이터 파일들을 검색하는 검색 수단(613)을 포함하는, 조작 시스템.
KR1020087017094A 2005-12-14 2006-12-11 데이터 파일 조작 방법 및 장치 KR20080082985A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN200510131476 2005-12-14
CN200510131476.X 2005-12-14

Publications (1)

Publication Number Publication Date
KR20080082985A true KR20080082985A (ko) 2008-09-12

Family

ID=38055655

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020087017094A KR20080082985A (ko) 2005-12-14 2006-12-11 데이터 파일 조작 방법 및 장치

Country Status (6)

Country Link
US (1) US20080319982A1 (ko)
EP (1) EP1964001A2 (ko)
JP (1) JP2009519535A (ko)
KR (1) KR20080082985A (ko)
CN (1) CN101331483A (ko)
WO (1) WO2007069175A2 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9454653B1 (en) * 2014-05-14 2016-09-27 Brian Penny Technologies for enhancing computer security
US10057250B2 (en) 2013-05-14 2018-08-21 Kara Partners Llc Technologies for enhancing computer security
US10594687B2 (en) 2013-05-14 2020-03-17 Kara Partners Llc Technologies for enhancing computer security

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5786776A (en) * 1995-03-13 1998-07-28 Kabushiki Kaisha Toshiba Character input terminal device and recording apparatus
US5953541A (en) * 1997-01-24 1999-09-14 Tegic Communications, Inc. Disambiguating system for disambiguating ambiguous input sequences by displaying objects associated with the generated input sequences in the order of decreasing frequency of use
CA2302595C (en) * 1997-09-25 2002-09-17 Tegic Communications, Inc. Reduced keyboard disambiguating system
US20020126097A1 (en) * 2001-03-07 2002-09-12 Savolainen Sampo Jussi Pellervo Alphanumeric data entry method and apparatus using reduced keyboard and context related dictionaries
US7478081B2 (en) * 2004-11-05 2009-01-13 International Business Machines Corporation Selection of a set of optimal n-grams for indexing string data in a DBMS system under space constraints introduced by the system

Also Published As

Publication number Publication date
CN101331483A (zh) 2008-12-24
JP2009519535A (ja) 2009-05-14
EP1964001A2 (en) 2008-09-03
WO2007069175A2 (en) 2007-06-21
US20080319982A1 (en) 2008-12-25
WO2007069175A3 (en) 2007-10-11

Similar Documents

Publication Publication Date Title
US10277952B2 (en) Method and system for performing searches for television content using reduced text input
US8117026B2 (en) String matching method and system using phonetic symbols and computer-readable recording medium storing computer program for executing the string matching method
JP4977589B2 (ja) 固有表現抽出装置、固有表現抽出方法、及びプログラム
TWI439877B (zh) 一般化之語言非相關索引儲存系統及檢索方法
WO2007004408A1 (ja) 情報処理装置,情報処理方法および情報処理プログラム
CN101770291B (zh) 输入系统语意分析数据散列存储和分析方法
KR101234795B1 (ko) 컨텐츠 브라우징 장치 및 방법
CN114297143A (zh) 一种搜索文件的方法、显示文件的方法、装置及移动终端
CN108345694B (zh) 一种基于主题数据库的文献检索方法及系统
KR20080082985A (ko) 데이터 파일 조작 방법 및 장치
WO2020071252A1 (ja) 文書検索装置、文書検索プログラム、文書検索方法
KR100659370B1 (ko) 시소러스 매칭에 의한 문서 db 형성 방법 및 정보검색방법
JP5988614B2 (ja) 文字入力装置、文字入力方法及び文字入力プログラム
CN111931026A (zh) 一种基于词性扩展的搜索优化方法及系统
CN104516941A (zh) 相关文档检索装置、方法及程序
JP2006126883A (ja) 情報検索装置及び情報検索方法
JP2008176349A (ja) 見出し検索方法、見出し表示装置、見出し検索装置及びミュージックプレイヤー装置
KR20070033657A (ko) 전자사전 검색방법과 장치
JP2000076254A (ja) キーワード抽出装置、このキーワード抽出装置を用いた類似文献検索装置、キーワード抽出方法及び記録媒体
JP3446866B2 (ja) データベース作成装置および方法
JP5370079B2 (ja) 文字列検索装置、プログラム、及び文字列検索方法
JPH08249341A (ja) 文書データベースの文書格納・検索装置
JPH06215038A (ja) データベース検索装置
JP2021125162A (ja) 検索システム、検索結果提示方法、及び検索結果提示プログラム
JPH11306198A (ja) 検索データベース構築方法及び検索データ構築システム並びに記録媒体

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid