KR100707727B1 - A portable file player - Google Patents

A portable file player Download PDF

Info

Publication number
KR100707727B1
KR100707727B1 KR1020040055213A KR20040055213A KR100707727B1 KR 100707727 B1 KR100707727 B1 KR 100707727B1 KR 1020040055213 A KR1020040055213 A KR 1020040055213A KR 20040055213 A KR20040055213 A KR 20040055213A KR 100707727 B1 KR100707727 B1 KR 100707727B1
Authority
KR
South Korea
Prior art keywords
phoneme
file
additional information
user
voice
Prior art date
Application number
KR1020040055213A
Other languages
Korean (ko)
Other versions
KR20060006282A (en
Inventor
송오식
Original Assignee
주식회사 현원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 현원 filed Critical 주식회사 현원
Priority to KR1020040055213A priority Critical patent/KR100707727B1/en
Publication of KR20060006282A publication Critical patent/KR20060006282A/en
Application granted granted Critical
Publication of KR100707727B1 publication Critical patent/KR100707727B1/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • G06F16/148File search processing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination

Abstract

본 발명은 휴대용 파일 재생기에 관한 것으로, 특히 음성 인식을 이용하여 파일검색이 가능한 파일 재생기에 관한 것이다. 이러한 휴대용 파일 재생기는 음악, 텍스트, 이미지 파일 등에 대한 부가정보와 그 파일의 저장위치가 매칭되어 있는 인덱스 테이블을 참조하여 파일 재생 출력하되,The present invention relates to a portable file player, and more particularly, to a file player capable of file searching using speech recognition. The portable file player outputs a file by referring to an index table in which additional information about a music, text, image file, etc., and a storage location of the file are matched.

음소별 특징 파라미터를 저장하기 위한 음소별 특징 파라미터 저장부와; 사용자 음성을 디지털 데이터로 변환 출력하기 위한 음성 입력부와; 디지털 데이터로 변환된 사용자 음성에서 대표 음소를 추출하고 그와 유사한 특징 파라미터를 가지는 음소를 상기 파라미터 저장부에서 추출하기 위한 음소 추출부와; 추출된 음소를 포함하는 부가정보명을 상기 인덱스 테이블에서 독출하여 표시하는 부가정보 검색 표시 제어부와; 표시된 하나 이상의 부가정보명중 사용자에 의해 선택된 부가정보명에 매칭되어 있는 파일을 독출하여 파일 재생부로 출력하기 위한 파일 독출 제어부;를 포함함을 특징으로 한다.A phoneme feature parameter storage unit for storing phoneme feature parameters; A voice input unit for converting and outputting user voice into digital data; A phoneme extraction unit for extracting a representative phoneme from a user's voice converted into digital data and extracting a phoneme having a similar feature parameter from the parameter storage unit; An additional information search display control unit which reads and displays an additional information name including the extracted phoneme from the index table; And a file reading control unit for reading a file matching the additional information name selected by the user from among the displayed one or more additional information names and outputting the file to the file reproducing unit.

음악파일, 음소, 음성 인식.Music files, phonemes and voice recognition.

Description

휴대용 파일 재생기{A PORTABLE FILE PLAYER}Portable file player {A PORTABLE FILE PLAYER}

도 1은 본 발명의 일실시예에 따른 음악파일 재생기의 블록구성도.1 is a block diagram of a music file player according to an embodiment of the present invention;

도 2는 본 발명의 일실시예에 따른 음악파일 검색 흐름도.2 is a flow chart of a music file search according to an embodiment of the present invention;

도 3은 본 발명의 일실시예에 따라 검색된 음악파일 리스트의 표시 예시도.3 is an exemplary view showing a list of music files searched according to an embodiment of the present invention.

본 발명은 파일 재생기에 관한 것으로, 특히 음성 인식을 이용하여 파일검색이 가능한 휴대용 파일 재생기에 관한 것이다.The present invention relates to a file player, and more particularly, to a portable file player capable of searching a file using speech recognition.

음성 인식 시스템이란 입력 수단의 하나로서 사용자의 음성을 인식하여 그에 해당하는 작업을 수행하는 시스템이다. 이러한 음성 인식 시스템은 입력된 음성의 특징을 추출하여 반복 훈련에 의해 미리 저장된 기준 음성 모델들과 패턴매칭을 수행하여 음성을 인식한다. 사용자 입장에서 보면 별도의 키 조작 없이 음성 입력만으로 시스템을 편리하게 제어할 수 있기 때문에 휴대폰, 파일 재생기, 자동차, 홈 네트워크 분야에 널리 적용되어지고 있다.The voice recognition system is a system that recognizes a user's voice and performs a corresponding task as one of input means. The speech recognition system recognizes speech by extracting features of the input speech and performing pattern matching with reference speech models stored in advance by repetitive training. From the user's point of view, it is widely applied to mobile phones, file players, automobiles, and home networks because it can conveniently control the system with only a voice input without a separate key operation.

파일 재생기의 일예로서 음성인식 기능이 부가된 음악파일 재생기의 동작을 간단히 예시하면, 우선 사용자가 재생을 희망하는 곡명(혹은 파일명)을 음성 입력하면 음악파일 재생기에서는 입력된 사용자 음성으로부터 특징 파라미터를 추출하고, 그 특징 파라미터와 동일한 파라미터를 가지는 곡명이 있는가를 인덱스 테이블에서 검색하여 해당 곡명을 재생 출력한다.As an example of a file player, a simple operation of a music file player with a voice recognition function is first performed. When a user inputs a song name (or file name) to be played, the music file player extracts feature parameters from the input user voice. Then, a search is made in the index table to see if there is a song name having the same parameter as the feature parameter, and the song name is reproduced and output.

이러한 방법으로 음성 인식하여 음악파일 재생하는 시스템에서는 입력된 사용자 음성과 동일한 특징 파라미터를 가지는 곡명이 있는가를 검색하기 위해서 전체 곡명의 특징 파라미터를 비교 검색해야 하기 때문에, 저장 곡 수가 많을수록 처리부하가 가중되는 단점이 있다.In this way, the system that recognizes the music file and plays the music file has to compare and search the feature parameters of the entire song names to find out whether there is a song name with the same feature parameters as the input user voice. There is this.

또한 일반적인 음악파일 재생기에서는 파일명에서 음성 인식을 위한 특징 파라미터를 추출하여 기준 모델을 구축하는 경우가 일반적이므로, 파일명 이외의 부가정보(예를 들면 가수 이름과 같은)만을 알고 있다고 가정할 경우 그 부가정보를 음성 입력하여 해당 곡을 재생시킬 수는 없다. 따라서 가수 이름과 같은 부가정보를 음성 인식하기 위해서는 별도의 기준 모델을 재 구축해야 하기 때문에 사용상 번거로움을 수반하게 된다.Also, in general music file players, it is common to construct a reference model by extracting feature parameters for speech recognition from a file name. Therefore, if it is assumed that only information other than the file name (for example, a singer name) is known You cannot play the song by voice input. Therefore, in order to recognize the additional information such as the singer's name, a separate reference model has to be reconstructed, which is cumbersome in use.

또한 다양한 형태의 부가정보를 이용하여 각각의 기준 모델을 구축하더라도 입력 음성과 동일한 특징 파라미터를 추출하기 위해 모든 기준 모델을 검색해야 하기 때문에 이 역시 처리부하가 가중되는 단점을 지니게 된다.In addition, even if each reference model is constructed using various types of additional information, all reference models must be searched to extract the same feature parameters as the input voice, which also has a disadvantage in that the processing load is increased.

이에 본 발명의 목적은 음성 인식을 이용하여 파일검색 수행하되, 부하처리부담을 최소화하면서 신속하게 파일 검색 수행할 수 있는 휴대용 파일 재생기를 제 공함에 있으며,Accordingly, an object of the present invention is to provide a portable file player capable of performing a file search quickly while minimizing a load processing burden by performing a file search using voice recognition.

더 나아가 음성 인식을 위한 최소한의 기준 모델만을 구축하고서도 여러 형태의 파일 부가정보에 대한 음성을 인식하여 파일 검색 수행할 수 있는 휴대용 파일 재생기와 그 재생기에서의 파일검색방법을 제공함에 있다.Furthermore, the present invention provides a portable file player and a file retrieval method in the player capable of retrieving a file by recognizing the voice of various types of file additional information without constructing a minimum reference model for voice recognition.

상기 목적을 달성하기 위한 본 발명의 실시예에 따른 휴대용 파일 재생기는 파일에 대한 부가정보와 그 파일의 저장위치가 매칭되어 있는 인덱스 테이블을 참조하여 파일 재생 출력하는 파일 재생기로서,A portable file player according to an embodiment of the present invention for achieving the above object is a file player for reproducing and outputting a file with reference to an index table in which additional information about a file and a storage location of the file are matched.

음소별 특징 파라미터를 저장하기 위한 음소별 특징 파라미터 저장부와;A phoneme feature parameter storage unit for storing phoneme feature parameters;

사용자 음성을 디지털 데이터로 변환 출력하기 위한 음성 입력부와;A voice input unit for converting and outputting user voice into digital data;

디지털 데이터로 변환된 사용자 음성에서 추출된 대표 음소와 유사한 특징 파라미터를 가지는 음소를 상기 파라미터 저장부에서 추출하기 위한 음소 추출부와;A phoneme extraction unit for extracting a phoneme having a feature parameter similar to a representative phoneme extracted from the user's voice converted into digital data in the parameter storage unit;

추출된 음소를 포함하는 하나 이상의 부가정보명을 상기 인덱스 테이블에서 독출하여 표시하는 부가정보 검색 표시 제어부와;An additional information retrieval display control unit configured to read and display one or more additional information names including the extracted phonemes from the index table;

표시된 하나 이상의 부가정보명중 사용자에 의해 선택된 부가정보명에 매칭되어 있는 파일을 독출하여 파일 재생부로 출력하기 위한 파일 독출 제어부;를 포함함을 특징으로 한다.And a file reading control unit for reading a file matching the additional information name selected by the user from among the displayed one or more additional information names and outputting the file to the file reproducing unit.

더 나아가 상술한 휴대용 파일 재생기의 음소 추출부는 사용자 음성에서 음소를 구분하고 구분된 음소중 초성 자음 음소를 대표 음소로 선택하여 그 특징 파 라미터를 추출하고, 그 추출된 대표 음소의 특징 파라미터와 유사한 특징 파라미터를 가지는 음소를 상기 파라미터 저장부에서 추출함을 특징으로 하며,Furthermore, the phoneme extracting unit of the portable file player described above distinguishes phonemes from the user's voice, selects a consonant consonant phoneme among the divided phonemes as a representative phoneme, extracts its feature parameters, and similarly extracts the feature parameter of the extracted representative phoneme. Characterized in that the phoneme having a feature parameter is extracted from the parameter storage unit,

상기 부가정보 검색 표시 제어부는 상기 추출된 음소를 첫 음절에 포함하는 부가정보명만을 독출하여 표시함을 특징으로 한다.The additional information search display control unit reads and displays only the additional information name including the extracted phoneme in the first syllable.

상술한 바와 같은 본 발명의 특징에 따르면, 사용자 음성에서 초성 자음 음소를 대표 음소로 추출하고 그 추출된 음소를 첫 음절에 포함하는 부가정보명만을 인덱스 테이블에서 독출 표시하기 때문에, 음성 인식을 통해 파일을 검색하는 부하처리부담을 최소화할 수 있다.According to the characteristics of the present invention as described above, since the first consonant phoneme extracted from the user's voice as the representative phoneme and only the additional information name including the extracted phoneme in the first syllable is read and displayed in the index table, Minimize the load handling burden of searching

또한 초성 자음 음소들에 대한 기준 모델 구축만으로도 곡명, 가수 이름, 파일명과 같은 여러 형태의 부가정보에 대한 음성을 인식할 수 있는 효과를 가지게 되는 것이다.In addition, it is possible to recognize voices for various types of additional information such as song names, singer names, and file names only by building a reference model for consonant phonemes.

이하 본 발명의 바람직한 실시예를 첨부 도면을 참조하여 상세히 설명하기로 한다. 본 발명을 설명함에 있어 관련된 공지 기능 혹은 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그에 대한 상세한 설명은 생략하기로 한다. 참고적으로 하기 설명에서는 음악파일 재생기(MP3)를 일예로 설정하여 휴대용 파일 재생기의 동작을 설명하기로 한다. 음악파일 재생기의 음악파일 재생부, 음악파일 및 부가정보 저장부, 음악파일 독출 제어부 각각은 휴대용 파일 재생기에서 파일 재생부, 파일 및 부가정보 저장부, 파일 독출 제어부에 해당한다. Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings. In the following description of the present invention, if it is determined that a detailed description of related known functions or configurations may unnecessarily obscure the subject matter of the present invention, the detailed description thereof will be omitted. For reference, in the following description, the operation of the portable file player will be described by setting the music file player MP3 as an example. The music file reproducing unit, the music file and the additional information storage unit, and the music file reading control unit of the music file player correspond to the file reproducing unit, the file and the additional information storing unit, and the file reading control unit in the portable file player.

우선 도 1은 본 발명의 실시예에 따른 음악파일 재생기의 블록구성도를 도시 한 것이며, 도 2는 본 발명의 실시예에 따른 음악파일 검색 흐름도를, 도 3은 본 발명의 실시예에 따라 검색된 음악파일 리스트의 표시 예시도를 각각 도시한 것이다.First, FIG. 1 shows a block diagram of a music file player according to an embodiment of the present invention, FIG. 2 is a flow chart of a music file search according to an embodiment of the present invention, and FIG. 3 is searched according to an embodiment of the present invention. An example of the display of the music file list is shown respectively.

도 1을 참조하면, 본 발명의 실시예에 따른 음악파일 재생기는 일반 음악파일 재생기와 같이 음성 입력부(110), 표시부(140), 키 조작부(150) 및 음악파일 재생부(160)를 포함한다.Referring to FIG. 1, a music file player according to an exemplary embodiment of the present invention includes a voice input unit 110, a display unit 140, a key manipulation unit 150, and a music file playback unit 160 like a general music file player. .

상기 음성 입력부(110)는 사용자 음성을 디지털 데이터로 변환하여 후술할 제어부(120)로 출력하기 위한 것으로서, 이미 공지된 바와 같이 마이크, 증폭부 및 A/D 컨버터를 포함한다.The voice input unit 110 converts a user's voice into digital data and outputs it to the controller 120 to be described later. The voice input unit 110 includes a microphone, an amplifier, and an A / D converter.

표시부(140)는 후술할 제어부(120)에 의해 제어되는 것으로서, 음악파일 재생기의 동작 상태를 표시하여 주는 역할을 수행한다. 일예로 상기 표시부(140)에는 음성 인식에 의해 선택되어진 음악파일들의 부가정보가 도 3에 도시한 바와 같이 리스트 형식으로 표시된다. 참고적으로 상기 음악파일의 부가정보는 음악파일의 곡명일 수 있으며, 음악파일의 파일명일 수도 있으며, 음악파일의 가수이름일 수도 있으며, 이들 모두를 포함하는 것일 수도 있다.The display unit 140 is controlled by the controller 120 to be described later, and serves to display an operation state of the music file player. For example, the display unit 140 displays additional information of music files selected by voice recognition in a list format as shown in FIG. 3. For reference, the additional information of the music file may be a song name of the music file, a file name of the music file, a singer name of the music file, or may include all of them.

키 조작부(150)는 음악파일 재생기의 동작을 지시하기 위한 다수의 키들을 포함하며, 각 키 누름시 그에 따른 키 데이터를 발생하여 후술할 제어부(120)로 출력하여 준다.The key manipulation unit 150 includes a plurality of keys for instructing the operation of the music file player, and generates key data corresponding to each key press and outputs the generated key data to the controller 120 to be described later.

한편 본 발명의 실시예에 따른 음악파일 재생기는 일반 음악파일 재생기와는 달리 음소별 특징 파라미터 저장부(100)를 더 포함한다. 상기 음소별 특징 파라미 터 저장부(100)에는 음소별 특징 파라미터가 저장된다. 음절은 일반적으로 초성과 중성, 초성과 중성 및 종성으로 구분되어지기 때문에 바람직한 실시예로서 상기 음소는 한글 문자의 초성 자음(ㄱ, ㄴ, ㄷ, ㄹ,..,ㅎ)을 가리키는 것으로 정의할 수 있다. 이러한 정의에 따르면, 초성 자음들에 대한 특징 파라미터 값을 실험에 의해 얻어서 이를 음소별 특징 파라미터 저장부(100)에 기록하여 제품 출하함으로서 추후 음성 인식에 이용토록 할 수 있는 것이다. 참고적으로 알파벳 영문자(A,B,C,...), 숫자(1,2,3,..)들 역시 첫 발음 음성에 대해 한글 문자의 초성과 중성으로 구분 가능하다. 따라서 영문자 혹은 숫자의 첫 발음 음성의 초성 자음(ㄱ, ㄴ, ㄷ, ㄹ,..,ㅎ) 음소별로 특징 파라미터를 매칭시키고, 발음상 그 초성 자음 음소("ㄷ")에 해당하는 알파벳 영문자("D")를 매칭시키면 추후 알파벳 영문자 하나의 음성 발음만으로도 그 영문자로 시작하는 파일명을 검색할 수 있다.Meanwhile, the music file player according to the embodiment of the present invention further includes a feature parameter storage unit 100 for each phoneme unlike the general music file player. The feature parameter for each phoneme is stored in the phoneme feature parameter storage unit 100. Since the syllables are generally divided into a consonant and a neutral, a consonant and a neutral, and a final consonant, the phoneme may be defined as referring to a consonant (a, b, c, d, .., ㅎ) of Korean characters. have. According to this definition, the characteristic parameter values for the initial consonants are obtained by experiments and recorded in the characteristic parameter storage unit 100 for each phoneme to be shipped to the product so that they can be used for speech recognition later. For reference, alphabetic letters (A, B, C, ...) and numbers (1,2,3, ..) can also be distinguished as initial and neutral of Korean characters for the first pronunciation voice. Therefore, the feature parameters are matched by phoneme (a, b, c, d, .., ㅎ) phonemes of the first phonetic sound of English letters or numbers, and alphabetic letters corresponding to the phonetic consonant phoneme ("ㄷ") in pronunciation If "D") is matched, a file name starting with the alphabet letter can be searched for by only one phonetic pronunciation of the alphabet letter in the future.

한편 본 발명의 실시예에 따른 음악파일 재생기의 동작을 전반적으로 제어하는 제어부(120)는 음성 인식을 통한 파일검색을 위해 크게 세가지의 제어모듈로 구분할 수 있다.On the other hand, the control unit 120 for controlling the overall operation of the music file player according to an embodiment of the present invention can be divided into three control modules for the file search through voice recognition.

우선 음소 추출부(122)는 음성 입력부(110)를 통해 디지털 데이터로 변환된 사용자 음성에서 대표 음소를 추출하고 그 대표 음소와 유사한 특징 파라미터를 가지는 음소를 상기 음소별 파라미터 저장부(100)에서 추출하여 부가정보 검색 표시 제어부(124)로 건네 주는 역할을 수행한다. 참고적으로 상기 "대표 음소"는 사용자의 첫 발음 음성(예를 들면 "가")에서 구분된 음소("ㄱ", "ㅏ")중 초성 자음 음소("ㄱ")로 설정하는 것으로 한다.First, the phoneme extractor 122 extracts a representative phoneme from a user's voice converted into digital data through the voice inputter 110, and extracts a phoneme having a feature parameter similar to the representative phoneme from the parameter storage unit 100 for each phoneme. To the additional information retrieval display control unit 124. For reference, the "representative phoneme" is set to a consonant phoneme ("a") among the phonemes ("a" and "ㅏ") classified in the user's first pronunciation voice (eg, "a").

부가정보 검색표시 제어부(124)는 상기 음소 추출부(122)에서 추출된 음소를 포함하는 부가정보명을 인덱스 테이블에서 독출하여 표시부(140)상에 표시하여 주는 역할을 수행한다. 상기 인덱스 테이블은 음악파일에 대한 부가정보와 그 음악파일의 저장위치가 매칭되어 있는 테이블을 지칭하는 것으로, 상기 인덱스 테이블은 다시 곡명 인덱스 테이블, 가수이름 인덱스 테이블, 파일명 인덱스 테이블을 포함한다. 인덱스 테이블이 상기와 같이 다양하게 구비될 경우 검색속도 향상 및 부하처리부담의 경감을 위해서 부가정보 검색 표시 제어부(124)는 사용자에 의해 선택된 테이블만을 검색하는 것이 바람직하다.The additional information search display control unit 124 reads the additional information name including the phoneme extracted by the phoneme extraction unit 122 from the index table and displays the additional information name on the display unit 140. The index table refers to a table in which additional information about a music file and a storage location of the music file are matched. The index table further includes a song name index table, a singer name index table, and a file name index table. When the index table is provided in various ways as described above, the additional information search display control unit 124 may search only the table selected by the user in order to improve the search speed and reduce the load processing burden.

또 하나의 제어모듈인 음악파일 독출 제어부(126)는 상기 표시부(140)상에 표시된 부가정보명중 사용자에 의해 선택된 부가정보명에 매칭되어 있는 음악파일을 음악파일 및 부가정보 저장부(130)에서 독출하여 음악파일 재생부(160)로 출력하여 준다.The music file reading control unit 126, which is another control module, stores the music file matching the additional information name selected by the user among the additional information names displayed on the display unit 140 in the music file and the additional information storage unit 130. Read and output to the music file playback unit 160.

상기 음악파일 및 부가정보 저장부(130)에는 음악파일, 그 음악파일에 대한 부가정보와 그 음악파일의 저장위치가 매칭되어 있는 인덱스 테이블이 저장된다. 이러한 저장부(130)는 음악파일 재생기의 타입에 따라 하드 디스크 혹은 플래쉬 메모리로 구현 가능한 내장형 메모리일 수 있으며, USB 메모리와 같은 외장형 메모리를 음악파일 저장부로 사용하는 경우의 버퍼일 수도 있다. 중요한 것은 상기 음악파일 독출 제어부(126)가 음악파일 및 상기 인덱스 테이블을 액세스할 수 있어야 한다는 것이다.The music file and the additional information storage unit 130 store a music file, an index table in which additional information about the music file matches a storage location of the music file. The storage unit 130 may be an internal memory that can be implemented as a hard disk or a flash memory according to the type of the music file player, or may be a buffer when an external memory such as a USB memory is used as the music file storage unit. Importantly, the music file reading control unit 126 should be able to access the music file and the index table.

도 1에서 미설명 부호 160은 코덱으로 구현 가능한 음악파일 재생부로서 상 기 음악파일 독출 제어부(26)에 의해 독출된 음악파일을 가청음으로 출력하기 위한 재생신호로 처리하여 준다. 이러한 재생신호는 스피커 혹은 이어폰을 통해 가청음으로 출력된다.In FIG. 1, reference numeral 160 denotes a music file reproducing unit which can be implemented as a codec, and processes the music file read by the music file reading control unit 26 as a reproduction signal for outputting an audible sound. The reproduction signal is output as an audible sound through a speaker or earphone.

이하 상술한 구성을 가지는 음악파일 재생기에서 실행 가능한 음악파일 검색방법을 도 2와 도 3을 참조하여 설명하기로 한다.Hereinafter, a method of searching for a music file executable in the music file player having the above-described configuration will be described with reference to FIGS. 2 and 3.

우선 음악파일 재생기 사용자가 음악파일 검색을 위해 필요한 단음절("가,나,다,..") 음성을 입력(200단계)하면 그 사용자 음성은 음성 입력부(110)를 통해 디지털 데이터로 변환되어 시스템 제어부(120)로 입력된다.First, when a user of a music file player inputs a single syllable ("ga, na, da, ..") voice necessary for music file search (step 200), the user voice is converted into digital data through the voice input unit 110 and the system is input. It is input to the control unit 120.

이와 같이 디지털 데이터로 변환된 사용자 음성이 시스템 제어부(120)로 입력되면, 음소 추출부(122)는 상기 디지털 데이터로 변환된 사용자 음성에서 대표 음소, 보다 구체적으로는 단음절 음성에서 초성 자음 음소의 특징 파라미터를 추출하고, 그 추출된 대표 음소의 특징 파라미터와 유사한 특징 파라미터를 가지는 음소를 상기 파라미터 저장부(100)에서 추출(210단계)하여 부가정보 검색표시 제어부(124)로 인가한다.When the user voice converted into digital data is input to the system controller 120, the phoneme extractor 122 may represent a representative phoneme in the user voice converted into digital data, more specifically, a consonant phoneme in a single syllable voice. A parameter is extracted, and a phoneme having a feature parameter similar to that of the extracted representative phoneme is extracted (step 210) from the parameter storage unit 100 and applied to the additional information search display control unit 124.

그러면 부가정보 검색표시 제어부(124)는 상기 210단계에서 추출된 음소를 포함하는 부가정보명을 상기 저장부(130)에 저장된 인덱스 테이블에서 독출하여 표시부(140)상에 표시(220단계)한다.Then, the additional information search display control unit 124 reads the additional information name including the phoneme extracted in step 210 from the index table stored in the storage unit 130 and displays it on the display unit 140 (step 220).

예를 들어, 사용자가 입력한 단음절 음성이 "가"라면, 음소 추출부(122)는 "ㄱ"와 "ㅏ"로 음소를 구분하고 그중 초성 자음 "ㄱ"을 대표 음소로 하여 그 특징 파라미터를 추출한다. 이러한 특징 파라미터는 음소별 특징 파라미터 저장부(100) 에 저장되어 있는 음소 "ㄱ"과 가장 유사한 값을 가지게 되므로 음소 추출부(122)는 "ㄱ"을 부가정보 검색표시 제어부(124)에 인가하여 준다. 그러면 부가정보 검색표시 제어부(124)는 추출된 음소 "ㄱ"을 첫 음절에 포함하는 부가정보명을 인덱스 테이블에서 독출하여 이를 표시부(140)상에 표시하여 준다. 상기 부가정보 검색 표시 제어부(124)는 추출된 음소에 해당하는 유니코드(Unicode)의 범위를 알 수 있으므로 그 추출 음소로 시작하는 파일명, 곡명, 가수이름을 해당 인덱스 테이블에서 독출하여 표시할 수 있다. 검색대상인 인덱스 테이블은 사용자에 의해 선택 가능하다.For example, if the single syllable voice input by the user is "ga", the phoneme extractor 122 divides the phonemes into "a" and "ㅏ", and among them, the feature parameter is set as the representative phoneme of the consonant consonant "a". Extract. Since the feature parameter has a value most similar to the phoneme “a” stored in the feature parameter storage unit 100 for each phoneme, the phoneme extractor 122 applies “a” to the additional information search display control unit 124. give. Then, the additional information search display control unit 124 reads the additional information name including the extracted phoneme "a" in the first syllable from the index table and displays it on the display unit 140. Since the additional information search display control unit 124 knows the range of Unicode corresponding to the extracted phoneme, the additional information search display control unit 124 may read and display a file name, a song name, and a singer name starting with the extracted phoneme from the corresponding index table. . The index table to be searched can be selected by the user.

상기 부가정보 검색표시 제어부(124)에 의해 독출 표시되는 부가정보명의 표시형태를 도 3에 도시하였다. 도 3을 참조해 보면 음소 추출부(122)에 의해 추출된 음소 "ㄱ"을 첫 음절로 가지는 부가정보명들이 표시되어 있다. 이러한 검색 리스트에서 사용자는 자신이 찾고자 하는 음악파일을 쉽게 찾아 재생할 수 있다.3 shows a display form of the additional information name read out and displayed by the additional information search display control unit 124. FIG. Referring to FIG. 3, additional information names having a phoneme “a” extracted by the phoneme extraction unit 122 as the first syllable are displayed. In this search list, the user can easily find and play the music file he / she is looking for.

즉, 사용자는 이동키를 조작하여 청취하고자 하는 음악파일로 커서를 이동(240단계)시킨후 선택키를 입력(270단계)함으로서, 사용자에 의해 선택된 음악파일은 음악파일 독출 제어부(126)에 의해 독출되고 이어서 음악파일 재생부(160)에서 재생되어 최종적으로 출력되게 되는 것이다.That is, the user operates the movement key to move the cursor to the music file to be listened (step 240) and then inputs a selection key (step 270), so that the music file selected by the user is read by the music file reading control unit 126. Subsequently, the music file is reproduced by the music file reproducing unit 160 and finally output.

만약 260단계에서 검색 표시되는 부가정보명의 수가 많다면, 사용자는 다시 단음절음을 음성 입력할 수 있다. 이러한 음성 입력이 있으면 음소 추출부(122)는 새로이 입력되는 사용자 음성에서 대표 음소의 특징 파라미터를 추출하고, 새로이 추출된 대표 음소의 특징 파라미터와 유사한 특징 파라미터를 가지는 음소를 상기 파라미터 저장부(100)에서 재추출하여 부가정보 검색표시 제어부(124)로 인가한다. 그러면 부가정보 검색표시 제어부(124)는 다시 상기 재추출된 음소를 포함하는 부가정보명만을 현재 표시중인 부가정보명에서 독출하여 표시함으로서, 결과적으로 표시되는 부가정보명의 수를 순차적으로 줄여 나갈 수 있다.If the number of additional information names searched and displayed in step 260 is large, the user may again input a single syllable sound. If there is such a voice input, the phoneme extractor 122 extracts a feature parameter of the representative phoneme from the newly input user voice, and stores the phoneme having a feature parameter similar to that of the newly extracted representative phoneme. Re-extract from and apply to the additional information search display control unit 124. Then, the additional information search display control unit 124 reads out and displays only the additional information name including the re-extracted phonemes from the currently displayed additional information name, thereby sequentially reducing the number of additional information names displayed. .

경우에 따라서 상기 재추출된 음소를 두 번째 음절에 포함하는 부가정보명만이 독출 표시되도록 프로그램할 수 있을 것이다. 이는 보다 신속 정확하게 파일검색이 이루어지도록 하기 위함이다. 물론 사용자가 이 사실을 사전에 숙지하고 단음절음을 입력하여야 만족스런 효과를 얻을 수 있다.In some cases, only the additional information name including the re-extracted phoneme in the second syllable may be programmed to be read out. This is to ensure that the file search is performed more quickly and accurately. Of course, the user must know this fact in advance and input a syllable syllable to obtain a satisfactory effect.

이상에서 설명한 바와 같이 본 발명은 사용자가 입력한 단음절 음성에서 초성 자음의 음소를 추출하고 그 추출된 음소를 첫 음절에 포함하는 부가정보명을 인덱스 테이블에서 찾아 표시하여 주기 때문에, 입력 음성의 특징 파라미터를 DB화된 기준 모델의 특징 파라미터 모두와 비교하는 일반 시스템에 비해 부하처리부담을 경감시킬 수 있는 효과가 있게 되는 것이다.As described above, the present invention extracts a phoneme of a consonant consonant from a single syllable speech input by a user and displays and displays an additional information name including the extracted phoneme in the first syllable in an index table. Compared to the general system that compares all the feature parameters of the DB-based reference model, the load handling burden can be reduced.

한편 상기 실시예에서는 한국어를 대상으로 하여 음성 인식하는 경우를 설명하였으나, 다국어를 대상으로 하여 음성 인식하는 경우를 고려할 수도 있다. 이러한 경우에는 사용자가 파일 재생기를 통해 음성 인식을 위한 언어를 선택하도록 하는 것이 바람직하다.Meanwhile, in the above-described embodiment, the case of speech recognition in Korean is described, but the case of speech recognition in multiple languages may be considered. In this case, it is preferable to allow the user to select a language for speech recognition through the file player.

이와 같이 음성 인식 모드를 다국어 모드로 선택한 후 사용자가 알파벳 영문자 "D"를 발음하면, 음소 추출부(122)는 "ㄷ"와 "ㅣ"로 음소를 구분하고 그중 초성 자음 "ㄷ"을 대표 음소로 하여 그 특징 파라미터를 추출한다. 이러한 특징 파라미 터는 음소별 특징 파라미터 저장부(100)에 저장되어 있는 음소 "ㄷ"과 가장 유사한 값을 가지게 되므로 음소 추출부(122)는 "ㄷ"에 매칭되어 있는 알파벳 영문자 "D"를 부가정보 검색표시 제어부(124)에 인가하여 준다. 그러면 부가정보 검색표시 제어부(124)는 추출된 음소 "D"를 첫 글자로 하는 부가정보명을 인덱스 테이블에서 독출하여 이를 표시부(140)상에 표시하여 준다.As such, when the user selects the voice recognition mode as the multilingual mode and the user pronounces the alphabet letter “D”, the phoneme extraction unit 122 classifies the phonemes into “ㄷ” and “ㅣ” and represents the initial consonant “ㄷ”. The feature parameter is extracted. Since the feature parameter has a value most similar to the phoneme “” stored in the feature parameter storage unit 100 for each phoneme, the phoneme extraction unit 122 adds an alphabetic letter “D” matching “”. To the information retrieval display control unit 124. Then, the additional information search display control unit 124 reads the additional information name having the extracted phoneme “D” as the first letter from the index table and displays it on the display unit 140.

따라서 사용자는 표시부(140)상에 표시되는 검색 리스트에서 자신이 찾고자 하는 파일명을 쉽게 찾아 재생할 수 있게 되는 것이다.Therefore, the user can easily find and play the file name he / she wants to find in the search list displayed on the display unit 140.

이러한 예에서 보듯이 본 발명은 한국어만을 검색할 수 있는 것이 아니라, 영어, 일본어와 같은 다국어를 음성 인식하여 파일 검색결과를 표시하여 줄 수 있는 발명이라 할 수 있다.As shown in this example, the present invention is not only able to search Korean, but also an invention capable of displaying a file search result by recognizing a multi-language such as English and Japanese.

상술한 바와 같이 본 발명은 사용자가 입력한 음성에서 대표 음소를 추출하고 그 추출된 음소를 포함하는 파일의 부가정보를 리스트화하여 표시하기 때문에, 입력 음성의 특징 파라미터를 DB화된 기준 모델의 특징 파라미터 모두와 비교하는 일반 시스템에 비해 부하처리부담을 경감시킬 수 있는 장점이 있으며, 파일 검색이 신속하게 이루어질 수 있는 장점도 있다.As described above, since the present invention extracts the representative phonemes from the voice input by the user and lists and displays additional information of the file including the extracted phonemes, the feature parameters of the input voice are characterized by the feature parameters of the DB modeled reference model. It has the advantage of reducing the load processing burden compared to the general system compared to all, and also has the advantage of quick file search.

아울러 본 발명은 발음 음성의 첫 자음 음소에 대한 특징 파라미터 저장만으로도 파일명 인식, 곡명 인식, 가수 이름 인식이 모두 가능한 장점이 있으며,In addition, the present invention has the advantage that the file name recognition, song name recognition, singer name recognition can all be achieved only by storing the feature parameters for the first consonant phoneme of the pronunciation voice,

첫 자음 음소에 대한 특징 파라미터 저장만으로도 파일명 인식, 곡명 인식, 가수 이름 인식이 모두 가능하기 때문에 파일검색용 음성 인식을 위한 기준 모델을 단순화시킬 수 있는 이점이 있다.File name recognition, song name recognition, and singer name recognition are all possible by simply storing the feature parameters for the first consonant phoneme, which has the advantage of simplifying the reference model for speech recognition for file search.

또한 본 발명은 음성인식 언어의 구애 없이 모든 나라의 언어를 인식하여 파일 검색할 수 있는 장점이 있다. In addition, the present invention has the advantage of retrieving files by recognizing the languages of all countries without regard to speech recognition language.

한편 본 발명은 도면에 도시된 실시예들을 참고로 설명되었으나 이는 예시적인 것에 불과하며, 당해 기술분야에 통상의 지식을 지닌자라면 이로부터 다양한 변형 및 균등한 타실시예가 가능하다는 점을 이해할 것이다. 예를 들면 본 발명의 실시예에서는 음악파일을 대상으로 하였으나, 별 다른 변형없이 비디오 파일, 텍스트 파일, 그래픽 파일 모두의 파일명 검색에 이용할 수 있음은 자명한 사실이다. 따라서 본 발명의 진정한 기술적 보호범위는 첨부된 특허청구범위에 의해서만 정해져야 할 것이다.On the other hand, the present invention has been described with reference to the embodiments shown in the drawings, which are merely exemplary, and those skilled in the art will understand that various modifications and equivalent other embodiments are possible therefrom. For example, although the embodiments of the present invention are directed to music files, it is obvious that the video files, text files, and graphic files can be searched for file names without any modification. Therefore, the true technical protection scope of the present invention should be defined only by the appended claims.

Claims (10)

파일에 대한 부가정보와 그 파일의 저장위치가 매칭되어 있는 인덱스 테이블을 참조하여 파일 재생 출력하는 휴대용 파일 재생기에 있어서,In a portable file player for reproducing and outputting a file by referring to an index table in which additional information about a file and a storage location of the file are matched, 음소별 특징 파라미터를 저장하기 위한 음소별 특징 파라미터 저장부와;A phoneme feature parameter storage unit for storing phoneme feature parameters; 사용자 음성을 디지털 데이터로 변환 출력하기 위한 음성 입력부와;A voice input unit for converting and outputting user voice into digital data; 디지털 데이터로 변환된 사용자 음성에서 음소를 구분하고, 구분된 음소중 기설정된 자리의 음소를 대표 음소로 추출한후 그와 유사한 특징 파라미터를 가지는 음소를 상기 파라미터 저장부에서 추출하기 위한 음소 추출부와;A phoneme extracting unit for classifying phonemes from the user's voice converted into digital data, extracting phonemes of predetermined positions from the phonemes as representative phonemes, and extracting phonemes having similar feature parameters from the parameter storage unit; 상기 추출된 음소를 가지는 부가정보명을 상기 인덱스 테이블에서 독출하여 표시하는 부가정보 검색 표시 제어부와;An additional information search display control unit which reads and displays the additional information name having the extracted phoneme from the index table; 표시된 하나 이상의 부가정보명중 사용자에 의해 선택된 부가정보명에 매칭되어 있는 파일을 독출하여 파일 재생부로 출력하기 위한 파일 독출 제어부;를 포함함을 특징으로 하는 휴대용 파일 재생기.And a file reading control unit for reading a file matching the additional information name selected by the user from among the displayed one or more additional information names and outputting the file to the file reproducing unit. 청구항 1에 있어서, 상기 음소 추출부는;The method of claim 1, wherein the phoneme extraction unit; 상기 사용자 음성에서 음소를 구분하고 구분된 음소중 초성 자음 음소를 대표 음소로 선택하여 그 특징 파라미터를 추출하고, 그 추출된 대표 음소의 특징 파라미터와 유사한 특징 파라미터를 가지는 음소를 상기 파라미터 저장부에서 추출함을 특징으로 하는 휴대용 파일 재생기.The phoneme is distinguished from the user's voice, the initial consonant among the divided phonemes is selected as the representative phoneme, and the feature parameter is extracted, and the phoneme having a feature parameter similar to that of the extracted representative phoneme is extracted from the parameter storage unit. Portable file player characterized in that. 청구항 1에 있어서, 상기 음소별 특징 파라미터 저장부는;The apparatus of claim 1, wherein the phoneme feature parameter storage unit; 적어도 2개국 이상의 언어에 대한 음소별 특징 파라미터값을 저장함을 특징으로 하는 휴대용 파일 재생기.A portable file player for storing phoneme-specific parameter values for at least two languages. 청구항 1 또는 청구항 2에 있어서, 상기 부가정보 검색 표시 제어부는,The method according to claim 1 or 2, wherein the additional information search display control unit, 상기 추출된 음소를 첫 음절에 포함하는 부가정보명만을 독출하여 표시함을 특징으로 하는 휴대용 파일 재생기.And read only the additional information name including the extracted phoneme in the first syllable. 청구항 4에 있어서, 상기 부가정보 검색 표시 제어부는,The method according to claim 4, wherein the additional information search display control unit, n번째 입력된 사용자 음성에서 추출된 대표 음소와 유사한 특징 파라미터를 가지는 음소를 n번째 음절에 포함하는 부가정보명만을 상기 표시된 부가정보명에서 독출하여 표시함을 특징으로 하는 휴대용 파일 재생기.and only the additional information name including a phoneme having characteristic parameters similar to the representative phoneme extracted from the nth input user voice in the nth syllable is read and displayed from the displayed additional information name. 청구항 1 또는 청구항 2에 있어서, 상기 인덱스 테이블은 곡명 인덱스 테이블, 가수이름 인덱스 테이블, 파일명 인덱스 테이블을 포함하고, 상기 부가정보 검색 표시 제어부는 상기 인덱스 테이블중 사용자에 의해 선택된 테이블만을 검색함을 특징으로 하는 휴대용 파일 재생기.The method of claim 1 or 2, wherein the index table includes a song name index table, a singer name index table, a file name index table, and the additional information search display control unit searches only the table selected by the user in the index table Portable file player. 삭제delete 삭제delete 삭제delete 삭제delete
KR1020040055213A 2004-07-15 2004-07-15 A portable file player KR100707727B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020040055213A KR100707727B1 (en) 2004-07-15 2004-07-15 A portable file player

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020040055213A KR100707727B1 (en) 2004-07-15 2004-07-15 A portable file player

Publications (2)

Publication Number Publication Date
KR20060006282A KR20060006282A (en) 2006-01-19
KR100707727B1 true KR100707727B1 (en) 2007-04-16

Family

ID=37117995

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020040055213A KR100707727B1 (en) 2004-07-15 2004-07-15 A portable file player

Country Status (1)

Country Link
KR (1) KR100707727B1 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100760301B1 (en) 2006-02-23 2007-09-19 삼성전자주식회사 Method and apparatus for searching media file through extracting partial search word
KR100735820B1 (en) * 2006-03-02 2007-07-06 삼성전자주식회사 Speech recognition method and apparatus for multimedia data retrieval in mobile device
KR20080000203A (en) * 2006-06-27 2008-01-02 엘지전자 주식회사 Method for searching music file using voice recognition
KR101805834B1 (en) * 2016-05-11 2017-12-07 주식회사 아이에스시 Test socket and conductive particle

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19990087730A (en) * 1996-03-11 1999-12-27 코마스 에이. 머독 Real-time speech recognition system for unspecified speakers and method thereof
KR20000018212A (en) * 2000-01-21 2000-04-06 김광원 Music information search system by telephone
KR20040016692A (en) * 2002-08-19 2004-02-25 (주)디지텍 The translator for portability and real time and it's method
KR20040092236A (en) * 2003-04-25 2004-11-03 최중인 Method and system for controlling a internet display using a mobile communication terminal

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19990087730A (en) * 1996-03-11 1999-12-27 코마스 에이. 머독 Real-time speech recognition system for unspecified speakers and method thereof
KR20000018212A (en) * 2000-01-21 2000-04-06 김광원 Music information search system by telephone
KR20040016692A (en) * 2002-08-19 2004-02-25 (주)디지텍 The translator for portability and real time and it's method
KR20040092236A (en) * 2003-04-25 2004-11-03 최중인 Method and system for controlling a internet display using a mobile communication terminal

Also Published As

Publication number Publication date
KR20060006282A (en) 2006-01-19

Similar Documents

Publication Publication Date Title
US7912716B2 (en) Generating words and names using N-grams of phonemes
KR20080000203A (en) Method for searching music file using voice recognition
JP2014219614A (en) Audio device, video device, and computer program
TWI554984B (en) Electronic device
JP2007206317A (en) Authoring method and apparatus, and program
RU2223554C2 (en) Speech recognition device
JP5083155B2 (en) Electronic device and program with dictionary function
KR101877559B1 (en) Method for allowing user self-studying language by using mobile terminal, mobile terminal for executing the said method and record medium for storing application executing the said method
KR20150088564A (en) E-Book Apparatus Capable of Playing Animation on the Basis of Voice Recognition and Method thereof
KR100707727B1 (en) A portable file player
JP6641680B2 (en) Audio output device, audio output program, and audio output method
JP5693834B2 (en) Speech recognition apparatus and speech recognition method
JP6365520B2 (en) Audio output device, audio output method, and program
JP2006189799A (en) Voice inputting method and device for selectable voice pattern
KR101987644B1 (en) System for providing effect based on a reading
KR102274275B1 (en) Application and method for generating text link
JPH11242496A (en) Information reproducing device
JP2723214B2 (en) Voice document creation device
KR102656262B1 (en) Method and apparatus for providing associative chinese learning contents using images
KR102479023B1 (en) Apparatus, method and program for providing foreign language learning service
JPH1011457A (en) Portable retrieval device
JP4985714B2 (en) Voice display output control device and voice display output control processing program
JP2008250066A (en) Speech data processing system, speech data processing method and program
JP2008107641A (en) Voice data retrieving apparatus
EP2058799B1 (en) Method for preparing data for speech recognition and speech recognition system

Legal Events

Date Code Title Description
A201 Request for examination
N231 Notification of change of applicant
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee