KR20060006282A - 휴대용 파일 재생기와 그 재생기에서 파일검색방법 - Google Patents

휴대용 파일 재생기와 그 재생기에서 파일검색방법 Download PDF

Info

Publication number
KR20060006282A
KR20060006282A KR1020040055213A KR20040055213A KR20060006282A KR 20060006282 A KR20060006282 A KR 20060006282A KR 1020040055213 A KR1020040055213 A KR 1020040055213A KR 20040055213 A KR20040055213 A KR 20040055213A KR 20060006282 A KR20060006282 A KR 20060006282A
Authority
KR
South Korea
Prior art keywords
phoneme
file
additional information
voice
user
Prior art date
Application number
KR1020040055213A
Other languages
English (en)
Other versions
KR100707727B1 (ko
Inventor
송오식
Original Assignee
주식회사 현원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 현원 filed Critical 주식회사 현원
Priority to KR1020040055213A priority Critical patent/KR100707727B1/ko
Publication of KR20060006282A publication Critical patent/KR20060006282A/ko
Application granted granted Critical
Publication of KR100707727B1 publication Critical patent/KR100707727B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • G06F16/148File search processing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 휴대용 파일 재생기에 관한 것으로, 특히 음성 인식을 이용하여 파일검색이 가능한 파일 재생기에 관한 것이다. 이러한 휴대용 파일 재생기는 음악, 텍스트, 이미지 파일 등에 대한 부가정보와 그 파일의 저장위치가 매칭되어 있는 인덱스 테이블을 참조하여 파일 재생 출력하되,
음소별 특징 파라미터를 저장하기 위한 음소별 특징 파라미터 저장부와; 사용자 음성을 디지털 데이터로 변환 출력하기 위한 음성 입력부와; 디지털 데이터로 변환된 사용자 음성에서 대표 음소를 추출하고 그와 유사한 특징 파라미터를 가지는 음소를 상기 파라미터 저장부에서 추출하기 위한 음소 추출부와; 추출된 음소를 포함하는 부가정보명을 상기 인덱스 테이블에서 독출하여 표시하는 부가정보 검색 표시 제어부와; 표시된 하나 이상의 부가정보명중 사용자에 의해 선택된 부가정보명에 매칭되어 있는 파일을 독출하여 파일 재생부로 출력하기 위한 파일 독출 제어부;를 포함함을 특징으로 한다.
음악파일, 음소, 음성 인식.

Description

휴대용 파일 재생기와 그 재생기에서 파일검색방법{A PORTABLE FILE PLAYER AND A FILE SEARCH METHOD IN THE PLAYER}
도 1은 본 발명의 일실시예에 따른 음악파일 재생기의 블록구성도.
도 2는 본 발명의 일실시예에 따른 음악파일 검색 흐름도.
도 3은 본 발명의 일실시예에 따라 검색된 음악파일 리스트의 표시 예시도.
본 발명은 파일 재생기에 관한 것으로, 특히 음성 인식을 이용하여 파일검색이 가능한 휴대용 파일 재생기에 관한 것이다.
음성 인식 시스템이란 입력 수단의 하나로서 사용자의 음성을 인식하여 그에 해당하는 작업을 수행하는 시스템이다. 이러한 음성 인식 시스템은 입력된 음성의 특징을 추출하여 반복 훈련에 의해 미리 저장된 기준 음성 모델들과 패턴매칭을 수행하여 음성을 인식한다. 사용자 입장에서 보면 별도의 키 조작 없이 음성 입력만으로 시스템을 편리하게 제어할 수 있기 때문에 휴대폰, 파일 재생기, 자동차, 홈 네트워크 분야에 널리 적용되어지고 있다.
파일 재생기의 일예로서 음성인식 기능이 부가된 음악파일 재생기의 동작을 간단히 예시하면, 우선 사용자가 재생을 희망하는 곡명(혹은 파일명)을 음성 입력하면 음악파일 재생기에서는 입력된 사용자 음성으로부터 특징 파라미터를 추출하고, 그 특징 파라미터와 동일한 파라미터를 가지는 곡명이 있는가를 인덱스 테이블에서 검색하여 해당 곡명을 재생 출력한다.
이러한 방법으로 음성 인식하여 음악파일 재생하는 시스템에서는 입력된 사용자 음성과 동일한 특징 파라미터를 가지는 곡명이 있는가를 검색하기 위해서 전체 곡명의 특징 파라미터를 비교 검색해야 하기 때문에, 저장 곡 수가 많을수록 처리부하가 가중되는 단점이 있다.
또한 일반적인 음악파일 재생기에서는 파일명에서 음성 인식을 위한 특징 파라미터를 추출하여 기준 모델을 구축하는 경우가 일반적이므로, 파일명 이외의 부가정보(예를 들면 가수 이름과 같은)만을 알고 있다고 가정할 경우 그 부가정보를 음성 입력하여 해당 곡을 재생시킬 수는 없다. 따라서 가수 이름과 같은 부가정보를 음성 인식하기 위해서는 별도의 기준 모델을 재 구축해야 하기 때문에 사용상 번거로움을 수반하게 된다.
또한 다양한 형태의 부가정보를 이용하여 각각의 기준 모델을 구축하더라도 입력 음성과 동일한 특징 파라미터를 추출하기 위해 모든 기준 모델을 검색해야 하기 때문에 이 역시 처리부하가 가중되는 단점을 지니게 된다.
이에 본 발명의 목적은 음성 인식을 이용하여 파일검색 수행하되, 부하처리부담을 최소화하면서 신속하게 파일 검색 수행할 수 있는 휴대용 파일 재생기를 제 공함에 있으며,
더 나아가 음성 인식을 위한 최소한의 기준 모델만을 구축하고서도 여러 형태의 파일 부가정보에 대한 음성을 인식하여 파일 검색 수행할 수 있는 휴대용 파일 재생기와 그 재생기에서의 파일검색방법을 제공함에 있다.
상기 목적을 달성하기 위한 본 발명의 실시예에 따른 휴대용 파일 재생기는 파일에 대한 부가정보와 그 파일의 저장위치가 매칭되어 있는 인덱스 테이블을 참조하여 파일 재생 출력하는 파일 재생기로서,
음소별 특징 파라미터를 저장하기 위한 음소별 특징 파라미터 저장부와;
사용자 음성을 디지털 데이터로 변환 출력하기 위한 음성 입력부와;
디지털 데이터로 변환된 사용자 음성에서 추출된 대표 음소와 유사한 특징 파라미터를 가지는 음소를 상기 파라미터 저장부에서 추출하기 위한 음소 추출부와;
추출된 음소를 포함하는 하나 이상의 부가정보명을 상기 인덱스 테이블에서 독출하여 표시하는 부가정보 검색 표시 제어부와;
표시된 하나 이상의 부가정보명중 사용자에 의해 선택된 부가정보명에 매칭되어 있는 파일을 독출하여 파일 재생부로 출력하기 위한 파일 독출 제어부;를 포함함을 특징으로 한다.
더 나아가 상술한 휴대용 파일 재생기의 음소 추출부는 사용자 음성에서 음소를 구분하고 구분된 음소중 초성 자음 음소를 대표 음소로 선택하여 그 특징 파 라미터를 추출하고, 그 추출된 대표 음소의 특징 파라미터와 유사한 특징 파라미터를 가지는 음소를 상기 파라미터 저장부에서 추출함을 특징으로 하며,
상기 부가정보 검색 표시 제어부는 상기 추출된 음소를 첫 음절에 포함하는 부가정보명만을 독출하여 표시함을 특징으로 한다.
상술한 바와 같은 본 발명의 특징에 따르면, 사용자 음성에서 초성 자음 음소를 대표 음소로 추출하고 그 추출된 음소를 첫 음절에 포함하는 부가정보명만을 인덱스 테이블에서 독출 표시하기 때문에, 음성 인식을 통해 파일을 검색하는 부하처리부담을 최소화할 수 있다.
또한 초성 자음 음소들에 대한 기준 모델 구축만으로도 곡명, 가수 이름, 파일명과 같은 여러 형태의 부가정보에 대한 음성을 인식할 수 있는 효과를 가지게 되는 것이다.
이하 본 발명의 바람직한 실시예를 첨부 도면을 참조하여 상세히 설명하기로 한다. 본 발명을 설명함에 있어 관련된 공지 기능 혹은 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그에 대한 상세한 설명은 생략하기로 한다. 참고적으로 하기 설명에서는 음악파일 재생기(MP3)를 일예로 설정하여 휴대용 파일 재생기의 동작을 설명하기로 한다. 음악파일 재생기의 음악파일 재생부, 음악파일 및 부가정보 저장부, 음악파일 독출 제어부 각각은 휴대용 파일 재생기에서 파일 재생부, 파일 및 부가정보 저장부, 파일 독출 제어부에 해당한다.
우선 도 1은 본 발명의 실시예에 따른 음악파일 재생기의 블록구성도를 도시 한 것이며, 도 2는 본 발명의 실시예에 따른 음악파일 검색 흐름도를, 도 3은 본 발명의 실시예에 따라 검색된 음악파일 리스트의 표시 예시도를 각각 도시한 것이다.
도 1을 참조하면, 본 발명의 실시예에 따른 음악파일 재생기는 일반 음악파일 재생기와 같이 음성 입력부(110), 표시부(140), 키 조작부(150) 및 음악파일 재생부(160)를 포함한다.
상기 음성 입력부(110)는 사용자 음성을 디지털 데이터로 변환하여 후술할 제어부(120)로 출력하기 위한 것으로서, 이미 공지된 바와 같이 마이크, 증폭부 및 A/D 컨버터를 포함한다.
표시부(140)는 후술할 제어부(120)에 의해 제어되는 것으로서, 음악파일 재생기의 동작 상태를 표시하여 주는 역할을 수행한다. 일예로 상기 표시부(140)에는 음성 인식에 의해 선택되어진 음악파일들의 부가정보가 도 3에 도시한 바와 같이 리스트 형식으로 표시된다. 참고적으로 상기 음악파일의 부가정보는 음악파일의 곡명일 수 있으며, 음악파일의 파일명일 수도 있으며, 음악파일의 가수이름일 수도 있으며, 이들 모두를 포함하는 것일 수도 있다.
키 조작부(150)는 음악파일 재생기의 동작을 지시하기 위한 다수의 키들을 포함하며, 각 키 누름시 그에 따른 키 데이터를 발생하여 후술할 제어부(120)로 출력하여 준다.
한편 본 발명의 실시예에 따른 음악파일 재생기는 일반 음악파일 재생기와는 달리 음소별 특징 파라미터 저장부(100)를 더 포함한다. 상기 음소별 특징 파라미 터 저장부(100)에는 음소별 특징 파라미터가 저장된다. 음절은 일반적으로 초성과 중성, 초성과 중성 및 종성으로 구분되어지기 때문에 바람직한 실시예로서 상기 음소는 한글 문자의 초성 자음(ㄱ, ㄴ, ㄷ, ㄹ,..,ㅎ)을 가리키는 것으로 정의할 수 있다. 이러한 정의에 따르면, 초성 자음들에 대한 특징 파라미터 값을 실험에 의해 얻어서 이를 음소별 특징 파라미터 저장부(100)에 기록하여 제품 출하함으로서 추후 음성 인식에 이용토록 할 수 있는 것이다. 참고적으로 알파벳 영문자(A,B,C,...), 숫자(1,2,3,..)들 역시 첫 발음 음성에 대해 한글 문자의 초성과 중성으로 구분 가능하다. 따라서 영문자 혹은 숫자의 첫 발음 음성의 초성 자음(ㄱ, ㄴ, ㄷ, ㄹ,..,ㅎ) 음소별로 특징 파라미터를 매칭시키고, 발음상 그 초성 자음 음소("ㄷ")에 해당하는 알파벳 영문자("D")를 매칭시키면 추후 알파벳 영문자 하나의 음성 발음만으로도 그 영문자로 시작하는 파일명을 검색할 수 있다.
한편 본 발명의 실시예에 따른 음악파일 재생기의 동작을 전반적으로 제어하는 제어부(120)는 음성 인식을 통한 파일검색을 위해 크게 세가지의 제어모듈로 구분할 수 있다.
우선 음소 추출부(122)는 음성 입력부(110)를 통해 디지털 데이터로 변환된 사용자 음성에서 대표 음소를 추출하고 그 대표 음소와 유사한 특징 파라미터를 가지는 음소를 상기 음소별 파라미터 저장부(100)에서 추출하여 부가정보 검색 표시 제어부(124)로 건네 주는 역할을 수행한다. 참고적으로 상기 "대표 음소"는 사용자의 첫 발음 음성(예를 들면 "가")에서 구분된 음소("ㄱ", "ㅏ")중 초성 자음 음소("ㄱ")로 설정하는 것으로 한다.
부가정보 검색표시 제어부(124)는 상기 음소 추출부(122)에서 추출된 음소를 포함하는 부가정보명을 인덱스 테이블에서 독출하여 표시부(140)상에 표시하여 주는 역할을 수행한다. 상기 인덱스 테이블은 음악파일에 대한 부가정보와 그 음악파일의 저장위치가 매칭되어 있는 테이블을 지칭하는 것으로, 상기 인덱스 테이블은 다시 곡명 인덱스 테이블, 가수이름 인덱스 테이블, 파일명 인덱스 테이블을 포함한다. 인덱스 테이블이 상기와 같이 다양하게 구비될 경우 검색속도 향상 및 부하처리부담의 경감을 위해서 부가정보 검색 표시 제어부(124)는 사용자에 의해 선택된 테이블만을 검색하는 것이 바람직하다.
또 하나의 제어모듈인 음악파일 독출 제어부(126)는 상기 표시부(140)상에 표시된 부가정보명중 사용자에 의해 선택된 부가정보명에 매칭되어 있는 음악파일을 음악파일 및 부가정보 저장부(130)에서 독출하여 음악파일 재생부(160)로 출력하여 준다.
상기 음악파일 및 부가정보 저장부(130)에는 음악파일, 그 음악파일에 대한 부가정보와 그 음악파일의 저장위치가 매칭되어 있는 인덱스 테이블이 저장된다. 이러한 저장부(130)는 음악파일 재생기의 타입에 따라 하드 디스크 혹은 플래쉬 메모리로 구현 가능한 내장형 메모리일 수 있으며, USB 메모리와 같은 외장형 메모리를 음악파일 저장부로 사용하는 경우의 버퍼일 수도 있다. 중요한 것은 상기 음악파일 독출 제어부(126)가 음악파일 및 상기 인덱스 테이블을 액세스할 수 있어야 한다는 것이다.
도 1에서 미설명 부호 160은 코덱으로 구현 가능한 음악파일 재생부로서 상 기 음악파일 독출 제어부(26)에 의해 독출된 음악파일을 가청음으로 출력하기 위한 재생신호로 처리하여 준다. 이러한 재생신호는 스피커 혹은 이어폰을 통해 가청음으로 출력된다.
이하 상술한 구성을 가지는 음악파일 재생기에서 실행 가능한 음악파일 검색방법을 도 2와 도 3을 참조하여 설명하기로 한다.
우선 음악파일 재생기 사용자가 음악파일 검색을 위해 필요한 단음절("가,나,다,..") 음성을 입력(200단계)하면 그 사용자 음성은 음성 입력부(110)를 통해 디지털 데이터로 변환되어 시스템 제어부(120)로 입력된다.
이와 같이 디지털 데이터로 변환된 사용자 음성이 시스템 제어부(120)로 입력되면, 음소 추출부(122)는 상기 디지털 데이터로 변환된 사용자 음성에서 대표 음소, 보다 구체적으로는 단음절 음성에서 초성 자음 음소의 특징 파라미터를 추출하고, 그 추출된 대표 음소의 특징 파라미터와 유사한 특징 파라미터를 가지는 음소를 상기 파라미터 저장부(100)에서 추출(210단계)하여 부가정보 검색표시 제어부(124)로 인가한다.
그러면 부가정보 검색표시 제어부(124)는 상기 210단계에서 추출된 음소를 포함하는 부가정보명을 상기 저장부(130)에 저장된 인덱스 테이블에서 독출하여 표시부(140)상에 표시(220단계)한다.
예를 들어, 사용자가 입력한 단음절 음성이 "가"라면, 음소 추출부(122)는 "ㄱ"와 "ㅏ"로 음소를 구분하고 그중 초성 자음 "ㄱ"을 대표 음소로 하여 그 특징 파라미터를 추출한다. 이러한 특징 파라미터는 음소별 특징 파라미터 저장부(100) 에 저장되어 있는 음소 "ㄱ"과 가장 유사한 값을 가지게 되므로 음소 추출부(122)는 "ㄱ"을 부가정보 검색표시 제어부(124)에 인가하여 준다. 그러면 부가정보 검색표시 제어부(124)는 추출된 음소 "ㄱ"을 첫 음절에 포함하는 부가정보명을 인덱스 테이블에서 독출하여 이를 표시부(140)상에 표시하여 준다. 상기 부가정보 검색 표시 제어부(124)는 추출된 음소에 해당하는 유니코드(Unicode)의 범위를 알 수 있으므로 그 추출 음소로 시작하는 파일명, 곡명, 가수이름을 해당 인덱스 테이블에서 독출하여 표시할 수 있다. 검색대상인 인덱스 테이블은 사용자에 의해 선택 가능하다.
상기 부가정보 검색표시 제어부(124)에 의해 독출 표시되는 부가정보명의 표시형태를 도 3에 도시하였다. 도 3을 참조해 보면 음소 추출부(122)에 의해 추출된 음소 "ㄱ"을 첫 음절로 가지는 부가정보명들이 표시되어 있다. 이러한 검색 리스트에서 사용자는 자신이 찾고자 하는 음악파일을 쉽게 찾아 재생할 수 있다.
즉, 사용자는 이동키를 조작하여 청취하고자 하는 음악파일로 커서를 이동(240단계)시킨후 선택키를 입력(270단계)함으로서, 사용자에 의해 선택된 음악파일은 음악파일 독출 제어부(126)에 의해 독출되고 이어서 음악파일 재생부(160)에서 재생되어 최종적으로 출력되게 되는 것이다.
만약 260단계에서 검색 표시되는 부가정보명의 수가 많다면, 사용자는 다시 단음절음을 음성 입력할 수 있다. 이러한 음성 입력이 있으면 음소 추출부(122)는 새로이 입력되는 사용자 음성에서 대표 음소의 특징 파라미터를 추출하고, 새로이 추출된 대표 음소의 특징 파라미터와 유사한 특징 파라미터를 가지는 음소를 상기 파라미터 저장부(100)에서 재추출하여 부가정보 검색표시 제어부(124)로 인가한다. 그러면 부가정보 검색표시 제어부(124)는 다시 상기 재추출된 음소를 포함하는 부가정보명만을 현재 표시중인 부가정보명에서 독출하여 표시함으로서, 결과적으로 표시되는 부가정보명의 수를 순차적으로 줄여 나갈 수 있다.
경우에 따라서 상기 재추출된 음소를 두 번째 음절에 포함하는 부가정보명만이 독출 표시되도록 프로그램할 수 있을 것이다. 이는 보다 신속 정확하게 파일검색이 이루어지도록 하기 위함이다. 물론 사용자가 이 사실을 사전에 숙지하고 단음절음을 입력하여야 만족스런 효과를 얻을 수 있다.
이상에서 설명한 바와 같이 본 발명은 사용자가 입력한 단음절 음성에서 초성 자음의 음소를 추출하고 그 추출된 음소를 첫 음절에 포함하는 부가정보명을 인덱스 테이블에서 찾아 표시하여 주기 때문에, 입력 음성의 특징 파라미터를 DB화된 기준 모델의 특징 파라미터 모두와 비교하는 일반 시스템에 비해 부하처리부담을 경감시킬 수 있는 효과가 있게 되는 것이다.
한편 상기 실시예에서는 한국어를 대상으로 하여 음성 인식하는 경우를 설명하였으나, 다국어를 대상으로 하여 음성 인식하는 경우를 고려할 수도 있다. 이러한 경우에는 사용자가 파일 재생기를 통해 음성 인식을 위한 언어를 선택하도록 하는 것이 바람직하다.
이와 같이 음성 인식 모드를 다국어 모드로 선택한 후 사용자가 알파벳 영문자 "D"를 발음하면, 음소 추출부(122)는 "ㄷ"와 "ㅣ"로 음소를 구분하고 그중 초성 자음 "ㄷ"을 대표 음소로 하여 그 특징 파라미터를 추출한다. 이러한 특징 파라미 터는 음소별 특징 파라미터 저장부(100)에 저장되어 있는 음소 "ㄷ"과 가장 유사한 값을 가지게 되므로 음소 추출부(122)는 "ㄷ"에 매칭되어 있는 알파벳 영문자 "D"를 부가정보 검색표시 제어부(124)에 인가하여 준다. 그러면 부가정보 검색표시 제어부(124)는 추출된 음소 "D"를 첫 글자로 하는 부가정보명을 인덱스 테이블에서 독출하여 이를 표시부(140)상에 표시하여 준다.
따라서 사용자는 표시부(140)상에 표시되는 검색 리스트에서 자신이 찾고자 하는 파일명을 쉽게 찾아 재생할 수 있게 되는 것이다.
이러한 예에서 보듯이 본 발명은 한국어만을 검색할 수 있는 것이 아니라, 영어, 일본어와 같은 다국어를 음성 인식하여 파일 검색결과를 표시하여 줄 수 있는 발명이라 할 수 있다.
상술한 바와 같이 본 발명은 사용자가 입력한 음성에서 대표 음소를 추출하고 그 추출된 음소를 포함하는 파일의 부가정보를 리스트화하여 표시하기 때문에, 입력 음성의 특징 파라미터를 DB화된 기준 모델의 특징 파라미터 모두와 비교하는 일반 시스템에 비해 부하처리부담을 경감시킬 수 있는 장점이 있으며, 파일 검색이 신속하게 이루어질 수 있는 장점도 있다.
아울러 본 발명은 발음 음성의 첫 자음 음소에 대한 특징 파라미터 저장만으로도 파일명 인식, 곡명 인식, 가수 이름 인식이 모두 가능한 장점이 있으며,
첫 자음 음소에 대한 특징 파라미터 저장만으로도 파일명 인식, 곡명 인식, 가수 이름 인식이 모두 가능하기 때문에 파일검색용 음성 인식을 위한 기준 모델을 단순화시킬 수 있는 이점이 있다.
또한 본 발명은 음성인식 언어의 구애 없이 모든 나라의 언어를 인식하여 파일 검색할 수 있는 장점이 있다.
한편 본 발명은 도면에 도시된 실시예들을 참고로 설명되었으나 이는 예시적인 것에 불과하며, 당해 기술분야에 통상의 지식을 지닌자라면 이로부터 다양한 변형 및 균등한 타실시예가 가능하다는 점을 이해할 것이다. 예를 들면 본 발명의 실시예에서는 음악파일을 대상으로 하였으나, 별 다른 변형없이 비디오 파일, 텍스트 파일, 그래픽 파일 모두의 파일명 검색에 이용할 수 있음은 자명한 사실이다. 따라서 본 발명의 진정한 기술적 보호범위는 첨부된 특허청구범위에 의해서만 정해져야 할 것이다.

Claims (10)

  1. 파일에 대한 부가정보와 그 파일의 저장위치가 매칭되어 있는 인덱스 테이블을 참조하여 파일 재생 출력하는 휴대용 파일 재생기에 있어서,
    음소별 특징 파라미터를 저장하기 위한 음소별 특징 파라미터 저장부와;
    사용자 음성을 디지털 데이터로 변환 출력하기 위한 음성 입력부와;
    디지털 데이터로 변환된 사용자 음성에서 대표 음소를 추출하고 그와 유사한 특징 파라미터를 가지는 음소를 상기 파라미터 저장부에서 추출하기 위한 음소 추출부와;
    추출된 음소를 포함하는 부가정보명을 상기 인덱스 테이블에서 독출하여 표시하는 부가정보 검색 표시 제어부와;
    표시된 하나 이상의 부가정보명중 사용자에 의해 선택된 부가정보명에 매칭되어 있는 파일을 독출하여 파일 재생부로 출력하기 위한 파일 독출 제어부;를 포함함을 특징으로 하는 휴대용 파일 재생기.
  2. 청구항 1에 있어서, 상기 음소 추출부는;
    상기 사용자 음성에서 음소를 구분하고 구분된 음소중 초성 자음 음소를 대표 음소로 선택하여 그 특징 파라미터를 추출하고, 그 추출된 대표 음소의 특징 파라미터와 유사한 특징 파라미터를 가지는 음소를 상기 파라미터 저장부에서 추출함을 특징으로 하는 휴대용 파일 재생기.
  3. 청구항 1에 있어서, 상기 음소별 특징 파라미터 저장부는;
    적어도 2개국 이상의 언어에 대한 음소별 특징 파라미터값을 저장함을 특징으로 하는 휴대용 파일 재생기.
  4. 청구항 1 또는 청구항 2에 있어서, 상기 부가정보 검색 표시 제어부는,
    상기 추출된 음소를 첫 음절에 포함하는 부가정보명만을 독출하여 표시함을 특징으로 하는 휴대용 파일 재생기.
  5. 청구항 4에 있어서, 상기 부가정보 검색 표시 제어부는,
    n번째 입력된 사용자 음성에서 추출된 대표 음소와 유사한 특징 파라미터를 가지는 음소를 n번째 음절에 포함하는 부가정보명만을 상기 표시된 부가정보명에서 독출하여 표시함을 특징으로 하는 휴대용 파일 재생기.
  6. 청구항 1 또는 청구항 2에 있어서, 상기 인덱스 테이블은 곡명 인덱스 테이블, 가수이름 인덱스 테이블, 파일명 인덱스 테이블을 포함하고, 상기 부가정보 검색 표시 제어부는 상기 인덱스 테이블중 사용자에 의해 선택된 테이블만을 검색함을 특징으로 하는 휴대용 파일 재생기.
  7. 음소별 특징 파라미터가 저장된 음소별 특징 파라미터 저장부를 구비하며 파 일에 대한 부가정보와 그 파일의 저장위치가 매칭되어 있는 인덱스 테이블을 참조하여 파일 재생 출력하는 휴대용 파일 재생기에 있어서,
    입력되는 사용자 음성을 디지털 데이터로 변환하는 단계와;
    디지털 데이터로 변환된 사용자 음성에서 대표 음소의 특징 파라미터를 추출하는 단계와;
    추출된 대표 음소의 특징 파라미터와 유사한 특징 파라미터를 가지는 음소를 상기 파라미터 저장부에서 추출하는 단계와;
    추출된 음소를 포함하는 하나 이상의 부가정보명을 상기 인덱스 테이블에서 독출하여 표시하는 단계;를 포함함을 특징으로 하는 휴대용 파일 재생기에서의 파일검색방법.
  8. 청구항 7에 있어서, 새로이 입력되는 사용자 음성에서 대표 음소의 특징 파라미터를 추출하는 제단계와;
    새로이 추출된 대표 음소의 특징 파라미터와 유사한 특징 파라미터를 가지는 음소를 상기 파라미터 저장부에서 재추출하는 단계와;
    상기 재추출된 음소를 포함하는 부가정보명만을 표시중인 상기 부가정보명에서 독출하여 표시하는 단계;를 더 포함함을 특징으로 하는 휴대용 파일 재생기에서의 파일검색방법.
  9. 청구항 7 또는 청구항 8에 있어서, 상기 대표 음소는 사용자 음성에서 구분 된 음소중 초성 자음 음소임을 특징으로 하는 휴대용 파일 재생기에서의 파일검색방법.
  10. 청구항 8에 있어서, 상기 재추출된 음소가 두 번째 음절에 포함되어 있는 부가정보명만을 독출 표시함을 특징으로 하는 휴대용 파일 재생기에서의 파일검색방법.
KR1020040055213A 2004-07-15 2004-07-15 휴대용 파일 재생기 KR100707727B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020040055213A KR100707727B1 (ko) 2004-07-15 2004-07-15 휴대용 파일 재생기

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020040055213A KR100707727B1 (ko) 2004-07-15 2004-07-15 휴대용 파일 재생기

Publications (2)

Publication Number Publication Date
KR20060006282A true KR20060006282A (ko) 2006-01-19
KR100707727B1 KR100707727B1 (ko) 2007-04-16

Family

ID=37117995

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020040055213A KR100707727B1 (ko) 2004-07-15 2004-07-15 휴대용 파일 재생기

Country Status (1)

Country Link
KR (1) KR100707727B1 (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100735820B1 (ko) * 2006-03-02 2007-07-06 삼성전자주식회사 휴대 단말기에서 음성 인식에 의한 멀티미디어 데이터 검색방법 및 그 장치
KR100760301B1 (ko) 2006-02-23 2007-09-19 삼성전자주식회사 부분 검색어 추출을 통한 미디어 파일 검색 방법 및 장치
WO2008002074A1 (en) * 2006-06-27 2008-01-03 Lg Electronics Inc. Media file searching based on voice recognition
WO2017196092A1 (ko) * 2016-05-11 2017-11-16 주식회사 아이에스시 검사용 소켓 및 도전성 입자

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0886854B1 (en) * 1996-03-11 2007-11-14 Fonix Corporation User independent, real-time speech recognition system and method
KR100353689B1 (ko) * 2000-01-21 2002-09-27 김광원 전화를 이용한 음악정보 검색시스템
KR20040016692A (ko) * 2002-08-19 2004-02-25 (주)디지텍 휴대용 동시 통역 장치 및 그 방법
KR100517951B1 (ko) * 2003-04-25 2005-09-30 최중인 휴대 단말을 이용한 인터넷 디스플레이 서비스 제공 방법및 시스템

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100760301B1 (ko) 2006-02-23 2007-09-19 삼성전자주식회사 부분 검색어 추출을 통한 미디어 파일 검색 방법 및 장치
US8356032B2 (en) 2006-02-23 2013-01-15 Samsung Electronics Co., Ltd. Method, medium, and system retrieving a media file based on extracted partial keyword
KR100735820B1 (ko) * 2006-03-02 2007-07-06 삼성전자주식회사 휴대 단말기에서 음성 인식에 의한 멀티미디어 데이터 검색방법 및 그 장치
WO2008002074A1 (en) * 2006-06-27 2008-01-03 Lg Electronics Inc. Media file searching based on voice recognition
WO2017196092A1 (ko) * 2016-05-11 2017-11-16 주식회사 아이에스시 검사용 소켓 및 도전성 입자

Also Published As

Publication number Publication date
KR100707727B1 (ko) 2007-04-16

Similar Documents

Publication Publication Date Title
US8498866B2 (en) Systems and methods for multiple language document narration
US8346557B2 (en) Systems and methods document narration
US7912716B2 (en) Generating words and names using N-grams of phonemes
KR20080000203A (ko) 음성인식을 이용한 음악 파일 검색 방법
TWI554984B (zh) 電子裝置
JP2014219614A (ja) オーディオ装置、ビデオ装置及びコンピュータプログラム
JP2007206317A (ja) オーサリング方法、オーサリング装置およびプログラム
RU2223554C2 (ru) Устройство распознавания речи
KR101877559B1 (ko) 모바일 단말기를 이용한 언어 자가학습 서비스 제공방법, 이를 실행하는 모바일 단말기 및 이를 실행하기 위한 애플리케이션을 저장하는 기록매체
JP5083155B2 (ja) 辞書機能を備えた電子装置およびプログラム
KR20150088564A (ko) 음성인식에 기반한 애니메이션 재생이 가능한 전자책 단말기 및 그 방법
KR100707727B1 (ko) 휴대용 파일 재생기
JP6641680B2 (ja) 音声出力装置、音声出力プログラムおよび音声出力方法
JP5693834B2 (ja) 音声認識装置及び音声認識方法
JP6365520B2 (ja) 音声出力装置、音声出力方法、およびプログラム
KR102274275B1 (ko) 음성파일이 연동된 텍스트 링크 생성 어플리케이션 및 방법
JP2723214B2 (ja) 音声文書作成装置
EP2058799B1 (en) Method for preparing data for speech recognition and speech recognition system
KR102479023B1 (ko) 외국어 학습 서비스 제공 장치, 방법 및 프로그램
KR101030777B1 (ko) 스크립트 데이터 생성 방법 및 장치
JP4985714B2 (ja) 音声表示出力制御装置、および音声表示出力制御処理プログラム
JP2021043306A (ja) 電子機器、音声再生方法、およびプログラム
KR200305678Y1 (ko) 디지털 학습장치
KR20220050342A (ko) 음성 합성 서비스를 제공하는 장치, 단말기 및 방법
KR100677215B1 (ko) 엠피3 플레이어의 음성 합성/인식 기능을 이용한 파일선택 방법

Legal Events

Date Code Title Description
A201 Request for examination
N231 Notification of change of applicant
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee