KR100707727B1 - A portable file player - Google Patents
A portable file player Download PDFInfo
- Publication number
- KR100707727B1 KR100707727B1 KR1020040055213A KR20040055213A KR100707727B1 KR 100707727 B1 KR100707727 B1 KR 100707727B1 KR 1020040055213 A KR1020040055213 A KR 1020040055213A KR 20040055213 A KR20040055213 A KR 20040055213A KR 100707727 B1 KR100707727 B1 KR 100707727B1
- Authority
- KR
- South Korea
- Prior art keywords
- phoneme
- file
- additional information
- user
- voice
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/14—Details of searching files based on file metadata
- G06F16/148—File search processing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
Abstract
본 발명은 휴대용 파일 재생기에 관한 것으로, 특히 음성 인식을 이용하여 파일검색이 가능한 파일 재생기에 관한 것이다. 이러한 휴대용 파일 재생기는 음악, 텍스트, 이미지 파일 등에 대한 부가정보와 그 파일의 저장위치가 매칭되어 있는 인덱스 테이블을 참조하여 파일 재생 출력하되,The present invention relates to a portable file player, and more particularly, to a file player capable of file searching using speech recognition. The portable file player outputs a file by referring to an index table in which additional information about a music, text, image file, etc., and a storage location of the file are matched.
음소별 특징 파라미터를 저장하기 위한 음소별 특징 파라미터 저장부와; 사용자 음성을 디지털 데이터로 변환 출력하기 위한 음성 입력부와; 디지털 데이터로 변환된 사용자 음성에서 대표 음소를 추출하고 그와 유사한 특징 파라미터를 가지는 음소를 상기 파라미터 저장부에서 추출하기 위한 음소 추출부와; 추출된 음소를 포함하는 부가정보명을 상기 인덱스 테이블에서 독출하여 표시하는 부가정보 검색 표시 제어부와; 표시된 하나 이상의 부가정보명중 사용자에 의해 선택된 부가정보명에 매칭되어 있는 파일을 독출하여 파일 재생부로 출력하기 위한 파일 독출 제어부;를 포함함을 특징으로 한다.A phoneme feature parameter storage unit for storing phoneme feature parameters; A voice input unit for converting and outputting user voice into digital data; A phoneme extraction unit for extracting a representative phoneme from a user's voice converted into digital data and extracting a phoneme having a similar feature parameter from the parameter storage unit; An additional information search display control unit which reads and displays an additional information name including the extracted phoneme from the index table; And a file reading control unit for reading a file matching the additional information name selected by the user from among the displayed one or more additional information names and outputting the file to the file reproducing unit.
음악파일, 음소, 음성 인식.Music files, phonemes and voice recognition.
Description
도 1은 본 발명의 일실시예에 따른 음악파일 재생기의 블록구성도.1 is a block diagram of a music file player according to an embodiment of the present invention;
도 2는 본 발명의 일실시예에 따른 음악파일 검색 흐름도.2 is a flow chart of a music file search according to an embodiment of the present invention;
도 3은 본 발명의 일실시예에 따라 검색된 음악파일 리스트의 표시 예시도.3 is an exemplary view showing a list of music files searched according to an embodiment of the present invention.
본 발명은 파일 재생기에 관한 것으로, 특히 음성 인식을 이용하여 파일검색이 가능한 휴대용 파일 재생기에 관한 것이다.The present invention relates to a file player, and more particularly, to a portable file player capable of searching a file using speech recognition.
음성 인식 시스템이란 입력 수단의 하나로서 사용자의 음성을 인식하여 그에 해당하는 작업을 수행하는 시스템이다. 이러한 음성 인식 시스템은 입력된 음성의 특징을 추출하여 반복 훈련에 의해 미리 저장된 기준 음성 모델들과 패턴매칭을 수행하여 음성을 인식한다. 사용자 입장에서 보면 별도의 키 조작 없이 음성 입력만으로 시스템을 편리하게 제어할 수 있기 때문에 휴대폰, 파일 재생기, 자동차, 홈 네트워크 분야에 널리 적용되어지고 있다.The voice recognition system is a system that recognizes a user's voice and performs a corresponding task as one of input means. The speech recognition system recognizes speech by extracting features of the input speech and performing pattern matching with reference speech models stored in advance by repetitive training. From the user's point of view, it is widely applied to mobile phones, file players, automobiles, and home networks because it can conveniently control the system with only a voice input without a separate key operation.
파일 재생기의 일예로서 음성인식 기능이 부가된 음악파일 재생기의 동작을 간단히 예시하면, 우선 사용자가 재생을 희망하는 곡명(혹은 파일명)을 음성 입력하면 음악파일 재생기에서는 입력된 사용자 음성으로부터 특징 파라미터를 추출하고, 그 특징 파라미터와 동일한 파라미터를 가지는 곡명이 있는가를 인덱스 테이블에서 검색하여 해당 곡명을 재생 출력한다.As an example of a file player, a simple operation of a music file player with a voice recognition function is first performed. When a user inputs a song name (or file name) to be played, the music file player extracts feature parameters from the input user voice. Then, a search is made in the index table to see if there is a song name having the same parameter as the feature parameter, and the song name is reproduced and output.
이러한 방법으로 음성 인식하여 음악파일 재생하는 시스템에서는 입력된 사용자 음성과 동일한 특징 파라미터를 가지는 곡명이 있는가를 검색하기 위해서 전체 곡명의 특징 파라미터를 비교 검색해야 하기 때문에, 저장 곡 수가 많을수록 처리부하가 가중되는 단점이 있다.In this way, the system that recognizes the music file and plays the music file has to compare and search the feature parameters of the entire song names to find out whether there is a song name with the same feature parameters as the input user voice. There is this.
또한 일반적인 음악파일 재생기에서는 파일명에서 음성 인식을 위한 특징 파라미터를 추출하여 기준 모델을 구축하는 경우가 일반적이므로, 파일명 이외의 부가정보(예를 들면 가수 이름과 같은)만을 알고 있다고 가정할 경우 그 부가정보를 음성 입력하여 해당 곡을 재생시킬 수는 없다. 따라서 가수 이름과 같은 부가정보를 음성 인식하기 위해서는 별도의 기준 모델을 재 구축해야 하기 때문에 사용상 번거로움을 수반하게 된다.Also, in general music file players, it is common to construct a reference model by extracting feature parameters for speech recognition from a file name. Therefore, if it is assumed that only information other than the file name (for example, a singer name) is known You cannot play the song by voice input. Therefore, in order to recognize the additional information such as the singer's name, a separate reference model has to be reconstructed, which is cumbersome in use.
또한 다양한 형태의 부가정보를 이용하여 각각의 기준 모델을 구축하더라도 입력 음성과 동일한 특징 파라미터를 추출하기 위해 모든 기준 모델을 검색해야 하기 때문에 이 역시 처리부하가 가중되는 단점을 지니게 된다.In addition, even if each reference model is constructed using various types of additional information, all reference models must be searched to extract the same feature parameters as the input voice, which also has a disadvantage in that the processing load is increased.
이에 본 발명의 목적은 음성 인식을 이용하여 파일검색 수행하되, 부하처리부담을 최소화하면서 신속하게 파일 검색 수행할 수 있는 휴대용 파일 재생기를 제 공함에 있으며,Accordingly, an object of the present invention is to provide a portable file player capable of performing a file search quickly while minimizing a load processing burden by performing a file search using voice recognition.
더 나아가 음성 인식을 위한 최소한의 기준 모델만을 구축하고서도 여러 형태의 파일 부가정보에 대한 음성을 인식하여 파일 검색 수행할 수 있는 휴대용 파일 재생기와 그 재생기에서의 파일검색방법을 제공함에 있다.Furthermore, the present invention provides a portable file player and a file retrieval method in the player capable of retrieving a file by recognizing the voice of various types of file additional information without constructing a minimum reference model for voice recognition.
상기 목적을 달성하기 위한 본 발명의 실시예에 따른 휴대용 파일 재생기는 파일에 대한 부가정보와 그 파일의 저장위치가 매칭되어 있는 인덱스 테이블을 참조하여 파일 재생 출력하는 파일 재생기로서,A portable file player according to an embodiment of the present invention for achieving the above object is a file player for reproducing and outputting a file with reference to an index table in which additional information about a file and a storage location of the file are matched.
음소별 특징 파라미터를 저장하기 위한 음소별 특징 파라미터 저장부와;A phoneme feature parameter storage unit for storing phoneme feature parameters;
사용자 음성을 디지털 데이터로 변환 출력하기 위한 음성 입력부와;A voice input unit for converting and outputting user voice into digital data;
디지털 데이터로 변환된 사용자 음성에서 추출된 대표 음소와 유사한 특징 파라미터를 가지는 음소를 상기 파라미터 저장부에서 추출하기 위한 음소 추출부와;A phoneme extraction unit for extracting a phoneme having a feature parameter similar to a representative phoneme extracted from the user's voice converted into digital data in the parameter storage unit;
추출된 음소를 포함하는 하나 이상의 부가정보명을 상기 인덱스 테이블에서 독출하여 표시하는 부가정보 검색 표시 제어부와;An additional information retrieval display control unit configured to read and display one or more additional information names including the extracted phonemes from the index table;
표시된 하나 이상의 부가정보명중 사용자에 의해 선택된 부가정보명에 매칭되어 있는 파일을 독출하여 파일 재생부로 출력하기 위한 파일 독출 제어부;를 포함함을 특징으로 한다.And a file reading control unit for reading a file matching the additional information name selected by the user from among the displayed one or more additional information names and outputting the file to the file reproducing unit.
더 나아가 상술한 휴대용 파일 재생기의 음소 추출부는 사용자 음성에서 음소를 구분하고 구분된 음소중 초성 자음 음소를 대표 음소로 선택하여 그 특징 파 라미터를 추출하고, 그 추출된 대표 음소의 특징 파라미터와 유사한 특징 파라미터를 가지는 음소를 상기 파라미터 저장부에서 추출함을 특징으로 하며,Furthermore, the phoneme extracting unit of the portable file player described above distinguishes phonemes from the user's voice, selects a consonant consonant phoneme among the divided phonemes as a representative phoneme, extracts its feature parameters, and similarly extracts the feature parameter of the extracted representative phoneme. Characterized in that the phoneme having a feature parameter is extracted from the parameter storage unit,
상기 부가정보 검색 표시 제어부는 상기 추출된 음소를 첫 음절에 포함하는 부가정보명만을 독출하여 표시함을 특징으로 한다.The additional information search display control unit reads and displays only the additional information name including the extracted phoneme in the first syllable.
상술한 바와 같은 본 발명의 특징에 따르면, 사용자 음성에서 초성 자음 음소를 대표 음소로 추출하고 그 추출된 음소를 첫 음절에 포함하는 부가정보명만을 인덱스 테이블에서 독출 표시하기 때문에, 음성 인식을 통해 파일을 검색하는 부하처리부담을 최소화할 수 있다.According to the characteristics of the present invention as described above, since the first consonant phoneme extracted from the user's voice as the representative phoneme and only the additional information name including the extracted phoneme in the first syllable is read and displayed in the index table, Minimize the load handling burden of searching
또한 초성 자음 음소들에 대한 기준 모델 구축만으로도 곡명, 가수 이름, 파일명과 같은 여러 형태의 부가정보에 대한 음성을 인식할 수 있는 효과를 가지게 되는 것이다.In addition, it is possible to recognize voices for various types of additional information such as song names, singer names, and file names only by building a reference model for consonant phonemes.
이하 본 발명의 바람직한 실시예를 첨부 도면을 참조하여 상세히 설명하기로 한다. 본 발명을 설명함에 있어 관련된 공지 기능 혹은 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그에 대한 상세한 설명은 생략하기로 한다. 참고적으로 하기 설명에서는 음악파일 재생기(MP3)를 일예로 설정하여 휴대용 파일 재생기의 동작을 설명하기로 한다. 음악파일 재생기의 음악파일 재생부, 음악파일 및 부가정보 저장부, 음악파일 독출 제어부 각각은 휴대용 파일 재생기에서 파일 재생부, 파일 및 부가정보 저장부, 파일 독출 제어부에 해당한다. Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings. In the following description of the present invention, if it is determined that a detailed description of related known functions or configurations may unnecessarily obscure the subject matter of the present invention, the detailed description thereof will be omitted. For reference, in the following description, the operation of the portable file player will be described by setting the music file player MP3 as an example. The music file reproducing unit, the music file and the additional information storage unit, and the music file reading control unit of the music file player correspond to the file reproducing unit, the file and the additional information storing unit, and the file reading control unit in the portable file player.
우선 도 1은 본 발명의 실시예에 따른 음악파일 재생기의 블록구성도를 도시 한 것이며, 도 2는 본 발명의 실시예에 따른 음악파일 검색 흐름도를, 도 3은 본 발명의 실시예에 따라 검색된 음악파일 리스트의 표시 예시도를 각각 도시한 것이다.First, FIG. 1 shows a block diagram of a music file player according to an embodiment of the present invention, FIG. 2 is a flow chart of a music file search according to an embodiment of the present invention, and FIG. 3 is searched according to an embodiment of the present invention. An example of the display of the music file list is shown respectively.
도 1을 참조하면, 본 발명의 실시예에 따른 음악파일 재생기는 일반 음악파일 재생기와 같이 음성 입력부(110), 표시부(140), 키 조작부(150) 및 음악파일 재생부(160)를 포함한다.Referring to FIG. 1, a music file player according to an exemplary embodiment of the present invention includes a
상기 음성 입력부(110)는 사용자 음성을 디지털 데이터로 변환하여 후술할 제어부(120)로 출력하기 위한 것으로서, 이미 공지된 바와 같이 마이크, 증폭부 및 A/D 컨버터를 포함한다.The
표시부(140)는 후술할 제어부(120)에 의해 제어되는 것으로서, 음악파일 재생기의 동작 상태를 표시하여 주는 역할을 수행한다. 일예로 상기 표시부(140)에는 음성 인식에 의해 선택되어진 음악파일들의 부가정보가 도 3에 도시한 바와 같이 리스트 형식으로 표시된다. 참고적으로 상기 음악파일의 부가정보는 음악파일의 곡명일 수 있으며, 음악파일의 파일명일 수도 있으며, 음악파일의 가수이름일 수도 있으며, 이들 모두를 포함하는 것일 수도 있다.The
키 조작부(150)는 음악파일 재생기의 동작을 지시하기 위한 다수의 키들을 포함하며, 각 키 누름시 그에 따른 키 데이터를 발생하여 후술할 제어부(120)로 출력하여 준다.The
한편 본 발명의 실시예에 따른 음악파일 재생기는 일반 음악파일 재생기와는 달리 음소별 특징 파라미터 저장부(100)를 더 포함한다. 상기 음소별 특징 파라미 터 저장부(100)에는 음소별 특징 파라미터가 저장된다. 음절은 일반적으로 초성과 중성, 초성과 중성 및 종성으로 구분되어지기 때문에 바람직한 실시예로서 상기 음소는 한글 문자의 초성 자음(ㄱ, ㄴ, ㄷ, ㄹ,..,ㅎ)을 가리키는 것으로 정의할 수 있다. 이러한 정의에 따르면, 초성 자음들에 대한 특징 파라미터 값을 실험에 의해 얻어서 이를 음소별 특징 파라미터 저장부(100)에 기록하여 제품 출하함으로서 추후 음성 인식에 이용토록 할 수 있는 것이다. 참고적으로 알파벳 영문자(A,B,C,...), 숫자(1,2,3,..)들 역시 첫 발음 음성에 대해 한글 문자의 초성과 중성으로 구분 가능하다. 따라서 영문자 혹은 숫자의 첫 발음 음성의 초성 자음(ㄱ, ㄴ, ㄷ, ㄹ,..,ㅎ) 음소별로 특징 파라미터를 매칭시키고, 발음상 그 초성 자음 음소("ㄷ")에 해당하는 알파벳 영문자("D")를 매칭시키면 추후 알파벳 영문자 하나의 음성 발음만으로도 그 영문자로 시작하는 파일명을 검색할 수 있다.Meanwhile, the music file player according to the embodiment of the present invention further includes a feature
한편 본 발명의 실시예에 따른 음악파일 재생기의 동작을 전반적으로 제어하는 제어부(120)는 음성 인식을 통한 파일검색을 위해 크게 세가지의 제어모듈로 구분할 수 있다.On the other hand, the
우선 음소 추출부(122)는 음성 입력부(110)를 통해 디지털 데이터로 변환된 사용자 음성에서 대표 음소를 추출하고 그 대표 음소와 유사한 특징 파라미터를 가지는 음소를 상기 음소별 파라미터 저장부(100)에서 추출하여 부가정보 검색 표시 제어부(124)로 건네 주는 역할을 수행한다. 참고적으로 상기 "대표 음소"는 사용자의 첫 발음 음성(예를 들면 "가")에서 구분된 음소("ㄱ", "ㅏ")중 초성 자음 음소("ㄱ")로 설정하는 것으로 한다.First, the
부가정보 검색표시 제어부(124)는 상기 음소 추출부(122)에서 추출된 음소를 포함하는 부가정보명을 인덱스 테이블에서 독출하여 표시부(140)상에 표시하여 주는 역할을 수행한다. 상기 인덱스 테이블은 음악파일에 대한 부가정보와 그 음악파일의 저장위치가 매칭되어 있는 테이블을 지칭하는 것으로, 상기 인덱스 테이블은 다시 곡명 인덱스 테이블, 가수이름 인덱스 테이블, 파일명 인덱스 테이블을 포함한다. 인덱스 테이블이 상기와 같이 다양하게 구비될 경우 검색속도 향상 및 부하처리부담의 경감을 위해서 부가정보 검색 표시 제어부(124)는 사용자에 의해 선택된 테이블만을 검색하는 것이 바람직하다.The additional information search
또 하나의 제어모듈인 음악파일 독출 제어부(126)는 상기 표시부(140)상에 표시된 부가정보명중 사용자에 의해 선택된 부가정보명에 매칭되어 있는 음악파일을 음악파일 및 부가정보 저장부(130)에서 독출하여 음악파일 재생부(160)로 출력하여 준다.The music file
상기 음악파일 및 부가정보 저장부(130)에는 음악파일, 그 음악파일에 대한 부가정보와 그 음악파일의 저장위치가 매칭되어 있는 인덱스 테이블이 저장된다. 이러한 저장부(130)는 음악파일 재생기의 타입에 따라 하드 디스크 혹은 플래쉬 메모리로 구현 가능한 내장형 메모리일 수 있으며, USB 메모리와 같은 외장형 메모리를 음악파일 저장부로 사용하는 경우의 버퍼일 수도 있다. 중요한 것은 상기 음악파일 독출 제어부(126)가 음악파일 및 상기 인덱스 테이블을 액세스할 수 있어야 한다는 것이다.The music file and the additional
도 1에서 미설명 부호 160은 코덱으로 구현 가능한 음악파일 재생부로서 상 기 음악파일 독출 제어부(26)에 의해 독출된 음악파일을 가청음으로 출력하기 위한 재생신호로 처리하여 준다. 이러한 재생신호는 스피커 혹은 이어폰을 통해 가청음으로 출력된다.In FIG. 1,
이하 상술한 구성을 가지는 음악파일 재생기에서 실행 가능한 음악파일 검색방법을 도 2와 도 3을 참조하여 설명하기로 한다.Hereinafter, a method of searching for a music file executable in the music file player having the above-described configuration will be described with reference to FIGS. 2 and 3.
우선 음악파일 재생기 사용자가 음악파일 검색을 위해 필요한 단음절("가,나,다,..") 음성을 입력(200단계)하면 그 사용자 음성은 음성 입력부(110)를 통해 디지털 데이터로 변환되어 시스템 제어부(120)로 입력된다.First, when a user of a music file player inputs a single syllable ("ga, na, da, ..") voice necessary for music file search (step 200), the user voice is converted into digital data through the
이와 같이 디지털 데이터로 변환된 사용자 음성이 시스템 제어부(120)로 입력되면, 음소 추출부(122)는 상기 디지털 데이터로 변환된 사용자 음성에서 대표 음소, 보다 구체적으로는 단음절 음성에서 초성 자음 음소의 특징 파라미터를 추출하고, 그 추출된 대표 음소의 특징 파라미터와 유사한 특징 파라미터를 가지는 음소를 상기 파라미터 저장부(100)에서 추출(210단계)하여 부가정보 검색표시 제어부(124)로 인가한다.When the user voice converted into digital data is input to the
그러면 부가정보 검색표시 제어부(124)는 상기 210단계에서 추출된 음소를 포함하는 부가정보명을 상기 저장부(130)에 저장된 인덱스 테이블에서 독출하여 표시부(140)상에 표시(220단계)한다.Then, the additional information search
예를 들어, 사용자가 입력한 단음절 음성이 "가"라면, 음소 추출부(122)는 "ㄱ"와 "ㅏ"로 음소를 구분하고 그중 초성 자음 "ㄱ"을 대표 음소로 하여 그 특징 파라미터를 추출한다. 이러한 특징 파라미터는 음소별 특징 파라미터 저장부(100) 에 저장되어 있는 음소 "ㄱ"과 가장 유사한 값을 가지게 되므로 음소 추출부(122)는 "ㄱ"을 부가정보 검색표시 제어부(124)에 인가하여 준다. 그러면 부가정보 검색표시 제어부(124)는 추출된 음소 "ㄱ"을 첫 음절에 포함하는 부가정보명을 인덱스 테이블에서 독출하여 이를 표시부(140)상에 표시하여 준다. 상기 부가정보 검색 표시 제어부(124)는 추출된 음소에 해당하는 유니코드(Unicode)의 범위를 알 수 있으므로 그 추출 음소로 시작하는 파일명, 곡명, 가수이름을 해당 인덱스 테이블에서 독출하여 표시할 수 있다. 검색대상인 인덱스 테이블은 사용자에 의해 선택 가능하다.For example, if the single syllable voice input by the user is "ga", the
상기 부가정보 검색표시 제어부(124)에 의해 독출 표시되는 부가정보명의 표시형태를 도 3에 도시하였다. 도 3을 참조해 보면 음소 추출부(122)에 의해 추출된 음소 "ㄱ"을 첫 음절로 가지는 부가정보명들이 표시되어 있다. 이러한 검색 리스트에서 사용자는 자신이 찾고자 하는 음악파일을 쉽게 찾아 재생할 수 있다.3 shows a display form of the additional information name read out and displayed by the additional information search
즉, 사용자는 이동키를 조작하여 청취하고자 하는 음악파일로 커서를 이동(240단계)시킨후 선택키를 입력(270단계)함으로서, 사용자에 의해 선택된 음악파일은 음악파일 독출 제어부(126)에 의해 독출되고 이어서 음악파일 재생부(160)에서 재생되어 최종적으로 출력되게 되는 것이다.That is, the user operates the movement key to move the cursor to the music file to be listened (step 240) and then inputs a selection key (step 270), so that the music file selected by the user is read by the music file
만약 260단계에서 검색 표시되는 부가정보명의 수가 많다면, 사용자는 다시 단음절음을 음성 입력할 수 있다. 이러한 음성 입력이 있으면 음소 추출부(122)는 새로이 입력되는 사용자 음성에서 대표 음소의 특징 파라미터를 추출하고, 새로이 추출된 대표 음소의 특징 파라미터와 유사한 특징 파라미터를 가지는 음소를 상기 파라미터 저장부(100)에서 재추출하여 부가정보 검색표시 제어부(124)로 인가한다. 그러면 부가정보 검색표시 제어부(124)는 다시 상기 재추출된 음소를 포함하는 부가정보명만을 현재 표시중인 부가정보명에서 독출하여 표시함으로서, 결과적으로 표시되는 부가정보명의 수를 순차적으로 줄여 나갈 수 있다.If the number of additional information names searched and displayed in
경우에 따라서 상기 재추출된 음소를 두 번째 음절에 포함하는 부가정보명만이 독출 표시되도록 프로그램할 수 있을 것이다. 이는 보다 신속 정확하게 파일검색이 이루어지도록 하기 위함이다. 물론 사용자가 이 사실을 사전에 숙지하고 단음절음을 입력하여야 만족스런 효과를 얻을 수 있다.In some cases, only the additional information name including the re-extracted phoneme in the second syllable may be programmed to be read out. This is to ensure that the file search is performed more quickly and accurately. Of course, the user must know this fact in advance and input a syllable syllable to obtain a satisfactory effect.
이상에서 설명한 바와 같이 본 발명은 사용자가 입력한 단음절 음성에서 초성 자음의 음소를 추출하고 그 추출된 음소를 첫 음절에 포함하는 부가정보명을 인덱스 테이블에서 찾아 표시하여 주기 때문에, 입력 음성의 특징 파라미터를 DB화된 기준 모델의 특징 파라미터 모두와 비교하는 일반 시스템에 비해 부하처리부담을 경감시킬 수 있는 효과가 있게 되는 것이다.As described above, the present invention extracts a phoneme of a consonant consonant from a single syllable speech input by a user and displays and displays an additional information name including the extracted phoneme in the first syllable in an index table. Compared to the general system that compares all the feature parameters of the DB-based reference model, the load handling burden can be reduced.
한편 상기 실시예에서는 한국어를 대상으로 하여 음성 인식하는 경우를 설명하였으나, 다국어를 대상으로 하여 음성 인식하는 경우를 고려할 수도 있다. 이러한 경우에는 사용자가 파일 재생기를 통해 음성 인식을 위한 언어를 선택하도록 하는 것이 바람직하다.Meanwhile, in the above-described embodiment, the case of speech recognition in Korean is described, but the case of speech recognition in multiple languages may be considered. In this case, it is preferable to allow the user to select a language for speech recognition through the file player.
이와 같이 음성 인식 모드를 다국어 모드로 선택한 후 사용자가 알파벳 영문자 "D"를 발음하면, 음소 추출부(122)는 "ㄷ"와 "ㅣ"로 음소를 구분하고 그중 초성 자음 "ㄷ"을 대표 음소로 하여 그 특징 파라미터를 추출한다. 이러한 특징 파라미 터는 음소별 특징 파라미터 저장부(100)에 저장되어 있는 음소 "ㄷ"과 가장 유사한 값을 가지게 되므로 음소 추출부(122)는 "ㄷ"에 매칭되어 있는 알파벳 영문자 "D"를 부가정보 검색표시 제어부(124)에 인가하여 준다. 그러면 부가정보 검색표시 제어부(124)는 추출된 음소 "D"를 첫 글자로 하는 부가정보명을 인덱스 테이블에서 독출하여 이를 표시부(140)상에 표시하여 준다.As such, when the user selects the voice recognition mode as the multilingual mode and the user pronounces the alphabet letter “D”, the
따라서 사용자는 표시부(140)상에 표시되는 검색 리스트에서 자신이 찾고자 하는 파일명을 쉽게 찾아 재생할 수 있게 되는 것이다.Therefore, the user can easily find and play the file name he / she wants to find in the search list displayed on the
이러한 예에서 보듯이 본 발명은 한국어만을 검색할 수 있는 것이 아니라, 영어, 일본어와 같은 다국어를 음성 인식하여 파일 검색결과를 표시하여 줄 수 있는 발명이라 할 수 있다.As shown in this example, the present invention is not only able to search Korean, but also an invention capable of displaying a file search result by recognizing a multi-language such as English and Japanese.
상술한 바와 같이 본 발명은 사용자가 입력한 음성에서 대표 음소를 추출하고 그 추출된 음소를 포함하는 파일의 부가정보를 리스트화하여 표시하기 때문에, 입력 음성의 특징 파라미터를 DB화된 기준 모델의 특징 파라미터 모두와 비교하는 일반 시스템에 비해 부하처리부담을 경감시킬 수 있는 장점이 있으며, 파일 검색이 신속하게 이루어질 수 있는 장점도 있다.As described above, since the present invention extracts the representative phonemes from the voice input by the user and lists and displays additional information of the file including the extracted phonemes, the feature parameters of the input voice are characterized by the feature parameters of the DB modeled reference model. It has the advantage of reducing the load processing burden compared to the general system compared to all, and also has the advantage of quick file search.
아울러 본 발명은 발음 음성의 첫 자음 음소에 대한 특징 파라미터 저장만으로도 파일명 인식, 곡명 인식, 가수 이름 인식이 모두 가능한 장점이 있으며,In addition, the present invention has the advantage that the file name recognition, song name recognition, singer name recognition can all be achieved only by storing the feature parameters for the first consonant phoneme of the pronunciation voice,
첫 자음 음소에 대한 특징 파라미터 저장만으로도 파일명 인식, 곡명 인식, 가수 이름 인식이 모두 가능하기 때문에 파일검색용 음성 인식을 위한 기준 모델을 단순화시킬 수 있는 이점이 있다.File name recognition, song name recognition, and singer name recognition are all possible by simply storing the feature parameters for the first consonant phoneme, which has the advantage of simplifying the reference model for speech recognition for file search.
또한 본 발명은 음성인식 언어의 구애 없이 모든 나라의 언어를 인식하여 파일 검색할 수 있는 장점이 있다. In addition, the present invention has the advantage of retrieving files by recognizing the languages of all countries without regard to speech recognition language.
한편 본 발명은 도면에 도시된 실시예들을 참고로 설명되었으나 이는 예시적인 것에 불과하며, 당해 기술분야에 통상의 지식을 지닌자라면 이로부터 다양한 변형 및 균등한 타실시예가 가능하다는 점을 이해할 것이다. 예를 들면 본 발명의 실시예에서는 음악파일을 대상으로 하였으나, 별 다른 변형없이 비디오 파일, 텍스트 파일, 그래픽 파일 모두의 파일명 검색에 이용할 수 있음은 자명한 사실이다. 따라서 본 발명의 진정한 기술적 보호범위는 첨부된 특허청구범위에 의해서만 정해져야 할 것이다.On the other hand, the present invention has been described with reference to the embodiments shown in the drawings, which are merely exemplary, and those skilled in the art will understand that various modifications and equivalent other embodiments are possible therefrom. For example, although the embodiments of the present invention are directed to music files, it is obvious that the video files, text files, and graphic files can be searched for file names without any modification. Therefore, the true technical protection scope of the present invention should be defined only by the appended claims.
Claims (10)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020040055213A KR100707727B1 (en) | 2004-07-15 | 2004-07-15 | A portable file player |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020040055213A KR100707727B1 (en) | 2004-07-15 | 2004-07-15 | A portable file player |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20060006282A KR20060006282A (en) | 2006-01-19 |
KR100707727B1 true KR100707727B1 (en) | 2007-04-16 |
Family
ID=37117995
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020040055213A KR100707727B1 (en) | 2004-07-15 | 2004-07-15 | A portable file player |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100707727B1 (en) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100760301B1 (en) | 2006-02-23 | 2007-09-19 | 삼성전자주식회사 | Method and apparatus for searching media file through extracting partial search word |
KR100735820B1 (en) * | 2006-03-02 | 2007-07-06 | 삼성전자주식회사 | Speech recognition method and apparatus for multimedia data retrieval in mobile device |
KR20080000203A (en) * | 2006-06-27 | 2008-01-02 | 엘지전자 주식회사 | Method for searching music file using voice recognition |
KR101805834B1 (en) * | 2016-05-11 | 2017-12-07 | 주식회사 아이에스시 | Test socket and conductive particle |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR19990087730A (en) * | 1996-03-11 | 1999-12-27 | 코마스 에이. 머독 | Real-time speech recognition system for unspecified speakers and method thereof |
KR20000018212A (en) * | 2000-01-21 | 2000-04-06 | 김광원 | Music information search system by telephone |
KR20040016692A (en) * | 2002-08-19 | 2004-02-25 | (주)디지텍 | The translator for portability and real time and it's method |
KR20040092236A (en) * | 2003-04-25 | 2004-11-03 | 최중인 | Method and system for controlling a internet display using a mobile communication terminal |
-
2004
- 2004-07-15 KR KR1020040055213A patent/KR100707727B1/en not_active IP Right Cessation
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR19990087730A (en) * | 1996-03-11 | 1999-12-27 | 코마스 에이. 머독 | Real-time speech recognition system for unspecified speakers and method thereof |
KR20000018212A (en) * | 2000-01-21 | 2000-04-06 | 김광원 | Music information search system by telephone |
KR20040016692A (en) * | 2002-08-19 | 2004-02-25 | (주)디지텍 | The translator for portability and real time and it's method |
KR20040092236A (en) * | 2003-04-25 | 2004-11-03 | 최중인 | Method and system for controlling a internet display using a mobile communication terminal |
Also Published As
Publication number | Publication date |
---|---|
KR20060006282A (en) | 2006-01-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7912716B2 (en) | Generating words and names using N-grams of phonemes | |
KR20080000203A (en) | Method for searching music file using voice recognition | |
JP2014219614A (en) | Audio device, video device, and computer program | |
TWI554984B (en) | Electronic device | |
JP2007206317A (en) | Authoring method and apparatus, and program | |
RU2223554C2 (en) | Speech recognition device | |
JP5083155B2 (en) | Electronic device and program with dictionary function | |
KR101877559B1 (en) | Method for allowing user self-studying language by using mobile terminal, mobile terminal for executing the said method and record medium for storing application executing the said method | |
KR20150088564A (en) | E-Book Apparatus Capable of Playing Animation on the Basis of Voice Recognition and Method thereof | |
KR100707727B1 (en) | A portable file player | |
JP6641680B2 (en) | Audio output device, audio output program, and audio output method | |
JP5693834B2 (en) | Speech recognition apparatus and speech recognition method | |
JP6365520B2 (en) | Audio output device, audio output method, and program | |
JP2006189799A (en) | Voice inputting method and device for selectable voice pattern | |
KR101987644B1 (en) | System for providing effect based on a reading | |
KR102274275B1 (en) | Application and method for generating text link | |
JPH11242496A (en) | Information reproducing device | |
JP2723214B2 (en) | Voice document creation device | |
KR102656262B1 (en) | Method and apparatus for providing associative chinese learning contents using images | |
KR102479023B1 (en) | Apparatus, method and program for providing foreign language learning service | |
JPH1011457A (en) | Portable retrieval device | |
JP4985714B2 (en) | Voice display output control device and voice display output control processing program | |
JP2008250066A (en) | Speech data processing system, speech data processing method and program | |
JP2008107641A (en) | Voice data retrieving apparatus | |
EP2058799B1 (en) | Method for preparing data for speech recognition and speech recognition system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
N231 | Notification of change of applicant | ||
E902 | Notification of reason for refusal | ||
E90F | Notification of reason for final refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
LAPS | Lapse due to unpaid annual fee |