KR20110054218A - Method and apparatus for playing audio file comprising history storage - Google Patents

Method and apparatus for playing audio file comprising history storage Download PDF

Info

Publication number
KR20110054218A
KR20110054218A KR1020090110787A KR20090110787A KR20110054218A KR 20110054218 A KR20110054218 A KR 20110054218A KR 1020090110787 A KR1020090110787 A KR 1020090110787A KR 20090110787 A KR20090110787 A KR 20090110787A KR 20110054218 A KR20110054218 A KR 20110054218A
Authority
KR
South Korea
Prior art keywords
audio file
audio
module
history storage
search list
Prior art date
Application number
KR1020090110787A
Other languages
Korean (ko)
Other versions
KR101576683B1 (en
Inventor
최은호
Original Assignee
현대모비스 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 현대모비스 주식회사 filed Critical 현대모비스 주식회사
Priority to KR1020090110787A priority Critical patent/KR101576683B1/en
Publication of KR20110054218A publication Critical patent/KR20110054218A/en
Application granted granted Critical
Publication of KR101576683B1 publication Critical patent/KR101576683B1/en

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier

Abstract

PURPOSE: An apparatus and method for reproducing an audio file included in a search list based on a history storage module are provided to reproduce an audio file corresponding to a keyword of inputted voice signal. CONSTITUTION: A preprocessing module(102) removes the noise of an input speech signal. A speech recognition module(103) recognizes a keyword from a speech signal. A search module(104) generates a search list of an audio file based on the recognized keyword. A reproducing module(105) reproduces an audio file in the search list.

Description

히스토리 저장모듈을 포함하는 오디오 재생장치 및 재생방법{METHOD AND APPARATUS FOR PLAYING AUDIO FILE COMPRISING HISTORY STORAGE}TECHNICAL AND APPARATUS FOR PLAYING AUDIO FILE COMPRISING HISTORY STORAGE}

본 발명은 음성인식에 관한 것으로, 더욱 상세하게는 재생 중 사용자에 의해 재생 스킵된 오디오파일을 히스토리 저장모듈에 저장하고, 마이크를 통해 입력된 사용자의 음성신호의 키워드에 의해 생성된 검색리스트 중 히스토리 저장모듈에 저장되지 않은 오디오파일을 재생함으로써, 사용자가 원하는 오디오파일을 재생할 수 있는 오디오 재생장치 및 재생방법에 관한 것이다.The present invention relates to voice recognition, and more particularly, to store audio files skipped by a user during playback in a history storage module, and to search history generated by a keyword of a voice signal of a user input through a microphone. An audio reproducing apparatus and a reproducing method capable of reproducing an audio file desired by a user by reproducing an audio file not stored in the storage module.

일반적으로, 음성인식(Speech Recognition)이란 사람이 말하는 음성 언어를 컴퓨터가 해석해 그 내용을 문자 데이터로 전환하는 처리로, 키보드 대신 문자를 입력하는 방식으로 주목을 받고 있다. 이러한 음성인식기술은 오디오 장치, 네비게이션, 휴대폰 등 다양한 분야에서 이용되고 있다.In general, speech recognition is a process in which a computer interprets a speech language spoken by a person and converts its contents into text data, and is drawing attention by inputting text instead of a keyboard. Such voice recognition technology is used in various fields such as audio devices, navigation, mobile phones.

특히 음성인식이 지원되는 차량용 오디오 장치에서 운전자가 원하는 곡을 듣기 위해서는 다음과 같은 방법이 사용된다.In particular, the following method is used to listen to a song desired by the driver in a car audio device supporting voice recognition.

첫째는, 음성인식을 통해 검색된 결과를 화면이나 음성으로 출력하며, 이 중 원하는 곡을 선택한다. 이러한 방식을 "Line Selection"이라고 한다. 하지만, 이러 한 "Line Selection" 방식은 사용자가 화면을 보거나 출력되는 안내음성을 기다려야 하며, 검색한 단어에 대응하는 결과가 여러개가 나왔을 경우 원하는 곡을 선택해야 하는 불편함을 초래한다. 또한 음성으로 리스트(list)를 알려주는 경우, 원하는 곡이 나올때까지 기다려야 하는 제약이 있으며, 화면으로 알려주는 경우 화면 크기의 제약으로 인해 표시될 수 있는 곡이 많지 않다는 문제점이 있다.First, the search results are output to the screen or voice through voice recognition, and the desired song is selected. This method is called "Line Selection". However, this "Line Selection" method requires the user to watch the screen or wait for the guide voice output, and inconvenient to select the desired song when there are several results corresponding to the searched word. In addition, when a list is spoken by voice, there is a constraint of waiting for a desired song, and when it is displayed on a screen, there are not many songs that can be displayed due to the limitation of the screen size.

둘째는, 볼륨 노브(Volume Nobe)를 돌리거나 검색 버튼(Seek)을 연속적으로 눌러서 원하는 곡을 찾는 방식이 있다. 하지만, 이러한 방식은 지정된 곡이 순차적으로 나오기 때문에 원하는 곡을 찾기 위해서는 수많은 반복을 거쳐야 한다는 문제점이 있다.Second, turn the volume knob or press the search button to find the song you want. However, this method has a problem that it must go through a number of iterations to find the desired song because the specified song comes out sequentially.

본 발명은 상기 문제점을 해결하기 위해 안출된 것으로, 본 발명의 목적은, 음성인식기능을 포함하는 오디오 장치에서 마이크를 통해 입력된 음성신호의 키워드에 맞는 사용자가 원하는 오디오파일을 재생할 수 있는 오디오 재생장치 및 재생방법을 제공하는 것을 목적으로 한다.The present invention has been made to solve the above problems, an object of the present invention, audio playback that can play a user's desired audio file that matches the keyword of the voice signal input through the microphone in an audio device including a voice recognition function An object of the present invention is to provide an apparatus and a reproduction method.

상기의 목적을 달성하기 위하여 본 발명에 따른 오디오 재생장치는, 재생 중 사용자에 의해 재생 스킵된 오디오파일을 저장하는 히스토리 저장모듈을 포함하는 오디오 재생장치로서, 마이크를 통해 입력된 음성신호의 노이즈를 제거하는 전처리모듈과, 노이즈가 제거된 음성신호로부터 키워드를 인식하는 음성인식모듈과, 인식된 키워드에 기초하여 오디오파일의 검색리스트를 생성하는 검색모듈과, 생성된 검색리스트 및 히스토리 저장모듈에 기초하여, 검색리스트에 포함된 오디오파일을 재생하는 재생모듈을 포함한다.In order to achieve the above object, an audio reproducing apparatus according to the present invention is an audio reproducing apparatus including a history storage module for storing an audio file skipped by a user during reproducing. Based on a preprocessing module for removing, a speech recognition module for recognizing a keyword from the noise-free speech signal, a search module for generating a search list of audio files based on the recognized keywords, and a generated search list and history storage module. And a reproducing module for reproducing the audio file included in the search list.

또한, 상기 재생모듈은, 오디오파일의 재생 중에 사용자에 의해 재생 스킵된 경우에만, 히스토리 저장모듈에 저장한다.Also, the playback module stores in the history storage module only when playback is skipped by the user during playback of the audio file.

또한, 상기 재생모듈은, 검색리스트에 포함된 오디오파일이 복수 개인 경우, 검색리스트에 포함된 각각의 오디오파일에 대하여 히스토리 저장모듈에 저장된 오디오파일을 순차적으로 비교하고, 비교결과, 검색리스트에 포함된 복수개의 오디오파일 중 최종적으로 동일한 오디오의 다음 오디오파일을 재생한다.In addition, when there are a plurality of audio files included in the search list, the playback module sequentially compares the audio files stored in the history storage module with respect to each audio file included in the search list, and includes them in the comparison result and the search list. The next audio file of the same audio is finally played among the plurality of audio files.

또한, 상기 히스토리 저장모듈에는, 키워드 별로 사용자에 의해 재생 스킵된 오디오파일이 저장된다.In addition, the history storage module stores audio files reproduced and skipped by the user for each keyword.

본 발명의 제2 실시예에 따르면, 오디오 재생방법이 제공되는데, 상기 방법은 재생 중 사용자에 의해 재생 스킵된 오디오파일을 저장하는 히스토리 저장모듈을 포함하는 오디오 재생장치의 오디오 재생방법으로서, (a) 마이크를 통해 입력된 음성신호의 노이즈를 제거하는 단계와, (b) 노이즈가 제거된 음성신호로부터 키워드를 인식하는 단계와, (c) 인식된 키워드에 기초하여 오디오파일의 검색리스트를 생성하는 단계와, (d) 생성된 검색리스트 및 상기 히스토리 저장모듈에 기초하여, 검색리스트에 포함된 오디오파일을 재생하는 단계를 포함한다.According to a second embodiment of the present invention, an audio reproduction method is provided, which method comprises: a audio reproduction method of an audio reproduction apparatus including a history storage module for storing an audio file skipped for reproduction by a user during reproduction; A) removing noise of the voice signal input through the microphone; (b) recognizing a keyword from the noise-removed voice signal; and (c) generating a search list of the audio file based on the recognized keyword. And (d) playing the audio file included in the search list based on the generated search list and the history storage module.

또한, 상기 오디오 재생방법은, (e) 오디오파일의 재생 중에 사용자에 의해 재생 스킵된 경우에만, 히스토리 저장모듈에 저장하는 단계를 더 포함한다.The audio reproducing method may further include (e) storing the data in the history storage module only when reproduction is skipped by the user during reproduction of the audio file.

또한, 상기 (d) 단계는, (d1) 검색리스트에 포함된 오디오파일이 복수 개인 경우, 검색리스트에 포함된 각각의 오디오파일에 대하여 히스토리 저장모듈에 저장된 오디오파일을 순차적으로 비교하는 단계와, (d2) 비교결과, 검색리스트에 포함된 복수개의 오디오파일 중 최종적으로 동일한 오디오의 다음 오디오파일을 재생하는 단계를 포함한다.In addition, the step (d), (d1) when there are a plurality of audio files included in the search list, sequentially comparing the audio files stored in the history storage module for each audio file included in the search list, (d2) as a result of the comparison, playing the next audio file of the same audio finally among the plurality of audio files included in the search list.

또한, 상기 히스토리 저장모듈에는, 키워드 별로 재생스킵된 오디오파일의 이름이 저장된다.In addition, the history storage module stores the name of the audio file skipped for each keyword.

상술한 바와 같이, 본 발명에 따르면, 재생 중 사용자에 의해 재생 스킵된 오디오파일을 히스토리 저장모듈에 저장하고, 마이크를 통해 입력된 사용자의 음성신호의 키워드에 의해 생성된 검색리스트 중 히스토리 저장모듈에 저장되지 않은 오디오파일을 재생함으로써, 사용자가 원하는 오디오파일을 재생할 수 있다.As described above, according to the present invention, the audio file skipped by the user during playback is stored in the history storage module, and stored in the history storage module of the search list generated by the keyword of the voice signal of the user input through the microphone. By playing back the unsaved audio file, the user can play back the desired audio file.

이하에서는 첨부 도면을 참조하여 본 발명에 따른 히스토리 저장모듈을 포함하는 오디오 재생장치 및 재생방법에 대하여 가장 바람직한 실시예를 상세히 설명하기로 한다. 그러나, 본 발명은 이하에서 개시되는 실시예에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예는 본 발명의 개시가 완전하도록 하며 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이다.Hereinafter, with reference to the accompanying drawings will be described in detail the most preferred embodiment of the audio playback device and playback method including a history storage module according to the present invention. However, the present invention is not limited to the embodiments disclosed below, but may be embodied in various different forms, and only the embodiments are intended to complete the disclosure of the present invention and to those skilled in the art. It is provided for complete information.

도 1은 본 발명의 일 실시예에 따른 오디오 재생장치의 구성도로, 오디오 재생장치(100)는 마이크(101), 전처리모듈(102), 음성인식모듈(103), 검색모듈(104), 재생모듈(105), 오디오파일 저장모듈(106) 및 히스토리 저장모듈(107)을 포함할 수 있다.1 is a block diagram of an audio playback apparatus according to an embodiment of the present invention, the audio playback apparatus 100 is a microphone 101, pre-processing module 102, voice recognition module 103, search module 104, playback Module 105, an audio file storage module 106, and a history storage module 107.

현재 음성인식모듈(103)의 정확성은 많이 향상되었으나, 아직은 그 성능이 많이 떨어지는 것이 현실이다. 따라서, 예를 들면 최근 유행하고 있는 "소녀시대" 의 오디오파일을 재생하고자 하는 사용자가 마이크(101)에 "소녀시대"라는 음성신호를 입력한 경우에 오디오파일중 "소녀시대" 뿐 아니라 이와 유사한 명칭을 포함하는 오디오파일도 함께 검색된다. 따라서 검색된 오디오파일을 자동으로 재생하는 경우 사용자가 원하지 않는 오디오파일이 재생될 수가 있다. 따라서, 본 발명에서 는 별도로 히스토리 저장모듈(107)을 두고, 특정 키워드로 검색된 오디오파일이 재생되는 도중에 사용자에 의해 재생스킵되는 오디오파일이 있으면, 이 오디오파일을 히스토리 저장모듈(107)에 저장하여 둔다. 이렇게 함으로써, 추후 동일한 키워드로 음성인식을 하는 경우 원하는 곡만을 재생하여 음성인식의 정확성을 보충할 수 있다.The accuracy of the current speech recognition module 103 has been improved a lot, but the performance is still poor. Thus, for example, when a user who wants to play an audio file of the recently popular "Girls' Generation" inputs a voice signal "Girls' Generation" into the microphone 101, not only the "Girls' Generation" but also similar audio files are similar. Audio files containing names are also searched. Therefore, when the searched audio file is automatically played, an audio file not desired by the user may be played. Therefore, in the present invention, if there is an audio file that has a history storage module 107 separately and skips playback by a user while an audio file retrieved with a specific keyword is played, the audio file is stored in the history storage module 107. Put it. In this way, when speech recognition is performed with the same keyword later, only the desired music can be played to supplement the accuracy of the speech recognition.

이와 같은 기술적 사상을 이용하는 본 발명의 경우 2가지 실시예를 개시하고 있다. 하나는, 마이크(101)를 통해 음성신호를 입력하면, 입력된 음성신호에 포함된 특정 키워드를 포함하는 검색된 오디오파일들 중 히스토리 저장모듈(107)에 저장되지 않은 복수의 오디오파일들 모두를 자동으로 재생하는 것이다. 또 다른 하나는, 마이크(101)를 통해 음성신호를 입력하면, 입력된 음성신호에 포함된 특정 키워드를 포함하는 검색된 오디오파일들 각각을 히스토리 저장모듈(107)과 순차적으로 비교하며, 비교결과, 특정 키워드를 포함하는 검색된 오디오파일들 중 최종적으로 동일한 오디오파일의 다음곡만을 재생하는 것이다. In the case of the present invention using such a technical idea, two embodiments are disclosed. For example, when a voice signal is input through the microphone 101, all of the plurality of audio files not stored in the history storage module 107 among the searched audio files including a specific keyword included in the input voice signal are automatically displayed. To play with. In another one, when a voice signal is input through the microphone 101, each of the searched audio files including a specific keyword included in the input voice signal is sequentially compared with the history storage module 107. Of the searched audio files containing a specific keyword, only the next song of the same audio file is finally played.

이와 같이, 본 발명에서는 특정 키워드를 음성인식시키는 경우 검색된 오디오파일 중 원하지 않는 오디오파일은 히스토리 저장모듈(107)에 사전에 별도로 저장하고, 이후 동일한 키워드로 음성인식을 하는 경우에는 히스토리 저장모듈(107)에 저장되지 않은 오디오파일들 모두 또는 오디오파일을 자동으로 재생함으로써, 원하는 오디오파일만을 재생할 수 있다. 이하 본 발명의 구성요소 및 동작원리를 상세하게 설명하기로 한다.As described above, in the present invention, when a specific keyword is recognized by voice, unwanted audio files among the searched audio files are separately stored in the history storage module 107 in advance, and when the voice is recognized by the same keyword, the history storage module 107 is used. By automatically playing back all audio files or audio files not stored in), only desired audio files can be played. Hereinafter, the components and operation principles of the present invention will be described in detail.

도 1을 참조하면, 전처리모듈(102)은, 마이크(101)를 통해 입력된 음성신호 로부터 소음, 주변의 잡음과 같은 노이즈를 제거하고, 노이즈가 제거된 음성신호를 음성인식모듈(103)로 전달한다.Referring to FIG. 1, the preprocessing module 102 removes noise, such as noise and ambient noise, from the voice signal input through the microphone 101, and transfers the voice signal from which the noise is removed to the voice recognition module 103. To pass.

음성인식모듈(103)은, 전처리모듈(102)로부터 전달받은 노이즈가 제거된 음성신호로부터 키워드를 인식하고, 인식된 키워드를 검색모듈(104)로 전달한다.The speech recognition module 103 recognizes a keyword from the speech signal from which the noise received from the preprocessing module 102 is removed, and transmits the recognized keyword to the search module 104.

검색모듈(104)은, 오디오파일 저장모듈(106)을 참조하는 한편, 음성인식모듈(103)로부터 전달받은 키워드에 기초하여 오디오파일의 검색리스트를 생성한다. 오디오파일의 검색리스트는 키워드를 기초로 검색된 오디오파일의 이름이 순서대로 배열된 오디오파일의 목록이다. 생성된 오디오파일의 검색리스트는 재생모듈(105)로 전달된다. The search module 104 refers to the audio file storage module 106 and generates a search list of the audio file based on the keyword received from the voice recognition module 103. The search list of audio files is a list of audio files in which the names of the searched audio files are arranged in order based on the keyword. The search list of the generated audio file is transmitted to the playback module 105.

마지막으로, 재생모듈(105)은 오디오파일 저장모듈(106) 및 히스토리 저장모듈(107)을 참조하여, 검색모듈(104)로부터 전달받은 검색리스트에 포함된 오디오파일을 재생한다. 이하 좀 더 구체적으로 재생모듈(105)의 기능을 설명하기로 한다.Finally, the playback module 105 refers to the audio file storage module 106 and the history storage module 107 to reproduce the audio file included in the search list received from the search module 104. Hereinafter, the function of the playback module 105 will be described in more detail.

제1 실시예에 따르면, 검색모듈(104)로부터 검색리스트를 전달받은 재생모듈(105)은 검색리스트에 포함된 복수개의 오디오파일들을 위에서부터 아래로 순차적으로 히스토리 저장모듈(107)에 저장된 오디오 파일과 비교하여 동일한 오디오파일이 히스토리 저장모듈(107)에 저장되어 있는지 판단한다. According to the first embodiment, the playback module 105 that receives the search list from the search module 104 sequentially stores the plurality of audio files included in the search list from the top to the bottom in the history storage module 107. In comparison, it is determined whether the same audio file is stored in the history storage module 107.

판단결과, 검색리스트에 포함된 오디오파일들 중 어느 것도 히스토리 저장모듈(107)에 있는 오디오파일과 동일하지 않다면, 재생모듈(105)은 검색리스트에 포함된 오디오파일들 중 첫번째 오디오파일을 자동으로 재생한다. 첫번째 오디오파일이 재생되는 동안 원하는 곡이 아니라고 판단하면, 사용자는 재생스킵버튼(미도시) 를 누르며, 이에 따라 도 1에 도시된 바와 같이 재생스킵신호가 재생모듈(105)로 전달된다. 이후 재생모듈(105)은 첫번째 오디오파일의 이름을 히스토리 저장모듈(107)에 저장한다.If it is determined that none of the audio files included in the search list is the same as the audio file in the history storage module 107, the playback module 105 automatically selects the first audio file among the audio files included in the search list. Play it. If it is determined that the first audio file is not the desired song during playback, the user presses a playback skip button (not shown), so that the playback skip signal is transmitted to the playback module 105 as shown in FIG. The playback module 105 then stores the name of the first audio file in the history storage module 107.

이후, 재생모듈(105)은 검색리스트에 포함된 오디오파일들 중 두번째 오디오파일을 자동으로 재생한다. 재생중인 두번째 오디오파일이 사용자가 원하는 오디오파일이라고 한다면, 재생스킵버튼은 눌려지지 않을 것이며, 따라서 두번째 오디오파일의 이름은 히스토리 저장모듈(107)에 저장되지는 않을 것이다. Thereafter, the playback module 105 automatically plays the second audio file among the audio files included in the search list. If the second audio file being played is the audio file desired by the user, the play skip button will not be pressed, and thus the name of the second audio file will not be stored in the history storage module 107.

이후 사용자가 동일한 키워드를 포함한 음성신호를 마이크(101)를 통해 입력하게 되면, 위에서 설명한 바와 같이 재생모듈(105)은 두번째 오디오파일을 바로 재생할 수 있게 된다. 첫번째 오디오파일은 검색리스트에 포함되어 있더라도 히스토리 저장모듈(107)에 포함되어 있어 재생되지 않으며, 사용자가 원하는 두번째 오디오파일이 바로 재생되기 때문이다. 위에서 설명한 제1 실시예에 따르면, 검색리스트의 세번째 오디오파일 역시 사용자가 원하는 특정 키워드를 포함한 오디오파일인 경우에는 영원히 재생되지 않을 수 있다. 따라서, 이하의 제2 실시예에서는 특정 키워드에 기초하여 검색된 검색리스트에 포함된 복수개의 오디오파일들 중 사용자가 원하는 곡이 여러곡인 경우를 가정하여 설명하기로 한다.After that, when the user inputs a voice signal including the same keyword through the microphone 101, as described above, the playback module 105 can immediately play the second audio file. This is because the first audio file is included in the history storage module 107 even though it is included in the search list, and thus the second audio file is directly played. According to the first embodiment described above, if the third audio file of the search list is also an audio file including a specific keyword desired by the user, it may not be played forever. Therefore, the second embodiment will be described on the assumption that there are several songs desired by the user among the plurality of audio files included in the search list searched based on a specific keyword.

제2 실시예에 따르면, 검색모듈(104)로부터 검색리스트를 전달받은 재생모듈(105)은 검색리스트에 포함된 복수개의 오디오파일들을 위에서부터 아래로 순차적으로 히스토리 저장모듈(107)에 저장된 오디오 파일과 비교하여 동일한 오디오파일이 히스토리 저장모듈(107)에 저장되어 있는지 판단한다. According to the second embodiment, the playback module 105 that receives the search list from the search module 104 sequentially stores the plurality of audio files included in the search list from the top to the bottom in the history storage module 107. In comparison, it is determined whether the same audio file is stored in the history storage module 107.

판단결과, 검색리스트에 포함된 오디오파일들 중 어느 것도 히스토리 저장모듈(107)에 있는 오디오파일과 동일하지 않다면, 재생모듈(105)은 검색리스트에 포함된 오디오파일들 중 첫번째 오디오파일을 자동으로 재생한다. 첫번째 오디오파일이 재생되는 동안 원하는 곡이 아니라고 판단하면, 사용자는 재생스킵버튼(미도시)를 누르며, 이에 따라 도 1에 도시된 바와 같이 재생스킵신호가 재생모듈(105)로 전달된다. 이후 재생모듈(105)은 첫번째 오디오파일의 이름을 히스토리 저장모듈(107)에 저장한다.If it is determined that none of the audio files included in the search list is the same as the audio file in the history storage module 107, the playback module 105 automatically selects the first audio file among the audio files included in the search list. Play it. If it is determined that the first audio file is not the desired song during playback, the user presses a playback skip button (not shown), so that the playback skip signal is transmitted to the playback module 105 as shown in FIG. The playback module 105 then stores the name of the first audio file in the history storage module 107.

이후, 재생모듈(105)은 검색리스트에 포함된 오디오파일들 중 두번째 오디오파일을 자동으로 재생한다. 재생중인 두번째 오디오파일이 사용자가 원하는 오디오파일이라고 한다면, 재생스킵버튼은 눌려지지 않을 것이며, 따라서 두번째 오디오파일의 이름은 히스토리 저장모듈(107)에 저장되지는 않을 것이다.Thereafter, the playback module 105 automatically plays the second audio file among the audio files included in the search list. If the second audio file being played is the audio file desired by the user, the play skip button will not be pressed, and thus the name of the second audio file will not be stored in the history storage module 107.

이후, 재생모듈(105)은 같은 방식으로 검색리스트에 포함된 오디오파일들 중 세번째 오디오파일을 자동으로 재생한다. 세번째 오디오파일 역시 원하던 오디오파일이 아닌 경우는 사용자에 의해 재생스킵될 수 있으며(이에 따라 히스토리 저장모듈(107)에 저장된다) 또는 사용자가 원하던 곡일 경우는 끝까지 재생될 수 있을 것이다(이 경우에는 히스토리 저장모듈(107)에 저장되지 않는다). 이와 같은 방식은 검색리스트에 포함된 오디오파일들 모두에 적용될 수 있다.Thereafter, the playback module 105 automatically plays the third audio file among the audio files included in the search list in the same manner. The third audio file may also be skipped by the user if the audio file is not the desired audio file (thereby being stored in the history storage module 107), or may be played to the end if the user wants the song (in this case, the history). Not stored in the storage module 107). This method can be applied to all audio files included in the search list.

이후, 사용자가 마이크(101)를 통해 특정 키워드를 포함하는 음성신호를 입력하면, 재생모듈(105)은 검색리스트에 포함된 오디오파일들 중 히스토리 저장모듈(107)에 저장되지 않은 오디오파일들만을 선택적으로 재생할 수 있다. Then, when the user inputs a voice signal including a specific keyword through the microphone 101, the playback module 105 only audio files that are not stored in the history storage module 107 of the audio files included in the search list. Can play selectively.

비록 제2 실시예에서는 재생스킵버튼(미도시)에 의해 재생스킵신호만이 재생모듈(105)로 입력되는 것으로 개시하고 있으나, 반드시 이에 한정되는 것은 아니다. 예를 들면, 재생스킵버튼(미도시) 외에 재생허용버튼(미도시)를 추가로 설치하고, 사용자가 원하는 곡이 재생중인 경우 재생허용버튼에 의한 재생허용신호가 재생모듈(105)로 입력되면, 히스토리 저장모듈(107)로는 저장되지 않은 채 현재 재생중인 오디오파일이 재생을 중단하고 다음 오디오파일이 재생될 수 있도록 구성할 수 있다. Although the second embodiment discloses that only the playback skip signal is input to the playback module 105 by the playback skip button (not shown), but is not necessarily limited thereto. For example, if a play allow button (not shown) is additionally installed in addition to the play skip button (not shown), and a play permit signal by the play allow button is input to the play module 105 when a user desired song is being played. In addition, the history storage module 107 may be configured to stop the playback of the currently playing audio file and to play the next audio file without being stored.

또한, 제2 실시예에서는, 검색리스트에 포함된 복수의 오디오파일들이 순차적으로 자동재생되는 것으로 예시하고 있으나, 반드시 이에 한정되지 않는다. 따라서, 예를 들면 특정 키워드를 포함하는 음성신호를 마이크(101)를 통해 입력하면, 검색모듈(104)에서 검색리스트를 생성하여 재생모듈(104)로 전달하고, 재생모듈(104)에서는 별도의 미도시된 액정표시장치를 통해 사용자에게 디스플레이하고, 사용자가 수동으로 원하지 않는 오디오파일을 선택적으로 히스토리 저장모듈(107)로 저장하는 방식도 가능하다.In addition, in the second embodiment, a plurality of audio files included in the search list are exemplarily reproduced automatically, but the present invention is not limited thereto. Thus, for example, when a voice signal including a specific keyword is input through the microphone 101, the search module 104 generates a search list and transmits the search list to the playback module 104, and the playback module 104 separates it. It is also possible to display to the user through the liquid crystal display device not shown, and to selectively store the audio file that the user does not want manually to the history storage module 107.

한편, 오디오파일 저장모듈(106)에는, 다수의 오디오파일(소스파일)이 저장되어 있으며, 저장된 다수의 오디오파일은 재생모듈(105)에 의해 재생된다.On the other hand, a plurality of audio files (source files) are stored in the audio file storage module 106, and the stored plurality of audio files are reproduced by the reproduction module 105.

그리고, 히스토리 저장모듈(107)에는, 키워드 별로 사용자에 의해 재생 스킵된 오디오파일의 이름이 저장된다. The history storage module 107 stores the name of the audio file reproduced and skipped by the user for each keyword.

도 2는 본 발명의 일 실시예에 따른 음성인식방법을 설명하는 흐름도이다.2 is a flowchart illustrating a voice recognition method according to an embodiment of the present invention.

도 2를 참조하면, 단계 200에서, 전처리모듈(102)은, 마이크(101)를 통해 입 력된 음성신호로부터 소음, 주변의 잡음과 같은 노이즈를 제거하고, 노이즈가 제거된 음성신호를 음성인식모듈(103)로 전달한다.Referring to FIG. 2, in step 200, the preprocessing module 102 removes noise, such as noise and ambient noise, from the voice signal input through the microphone 101, and receives the voice signal from which the noise is removed. Forward to 103.

단계 201에서, 음성인식모듈(103)은, 전처리모듈(102)로부터 전달받은 노이즈가 제거된 음성신호로부터 키워드를 인식하고, 인식된 키워드를 검색모듈(104)로 전달한다.In operation 201, the speech recognition module 103 recognizes a keyword from the speech signal from which the noise received from the preprocessing module 102 is removed, and transmits the recognized keyword to the search module 104.

단계 202에서, 검색모듈(104)은, 오디오파일 저장모듈(106)을 참조하는 한편, 음성인식모듈(103)로부터 전달받은 키워드에 기초하여 오디오파일의 검색리스트를 생성한다. 오디오파일의 검색리스트는 키워드를 기초로 검색된 오디오파일의 이름이 순서대로 배열된 오디오파일의 목록이다. 생성된 오디오파일의 검색리스트는 재생모듈(105)로 전달된다. In step 202, the search module 104 refers to the audio file storage module 106 and generates a search list of the audio file based on the keyword received from the voice recognition module 103. The search list of audio files is a list of audio files in which the names of the searched audio files are arranged in order based on the keyword. The search list of the generated audio file is transmitted to the playback module 105.

마지막으로 단계 203에서, 재생모듈(105)은 오디오파일 저장모듈(106) 및 히스토리 저장모듈(107)을 참조하여, 검색모듈(104)로부터 전달받은 검색리스트에 포함된 오디오파일을 재생한다. 검색리스트에 포함된 오디오파일의 재생방법에 대해서는 도 1의 재생모듈(105)과 관련하여 두가지 실시예를 상세하게 설명하였으며, 발명의 간략화를 위해 중복적인 설명은 생략하기로 한다.Finally, in step 203, the playback module 105 refers to the audio file storage module 106 and the history storage module 107 to play the audio file included in the search list received from the search module 104. A method of playing an audio file included in the search list has been described in detail with reference to the playback module 105 of FIG. 1, and a redundant description will be omitted for simplicity of the invention.

이상 도면과 명세서에서 최적 실시예들이 개시되었다. 여기서 특정한 용어들이 사용되었으나, 이는 단지 본 발명을 설명하기 위한 목적에서 사용된 것이지 의미 한정이나 특허청구범위에 기재된 본 발명의 범위를 제한하기 위하여 사용된 것은 아니다. 그러므로 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 특허청구범위의 기술적 사상에 의해 정해져야 할 것이다.The best embodiments have been disclosed in the drawings and specification above. Although specific terms have been used herein, they are used only for the purpose of describing the present invention and are not used to limit the scope of the present invention as defined in the meaning or claims. Therefore, those skilled in the art will understand that various modifications and equivalent other embodiments are possible from this. Therefore, the true technical protection scope of the present invention will be defined by the technical spirit of the appended claims.

도 1은 본 발명의 일 실시예에 따른 오디오 재생장치의 구성도이다.1 is a block diagram of an audio playback apparatus according to an embodiment of the present invention.

도 2는 본 발명의 일 실시예에 따른 오디오 재생방법을 설명하는 흐름도이다.2 is a flowchart illustrating an audio reproduction method according to an embodiment of the present invention.

Claims (8)

재생 중 사용자에 의해 재생 스킵된 오디오파일의 명칭을 저장하는 히스토리 저장모듈을 포함하는 오디오 재생장치로서,An audio playback device comprising a history storage module for storing a name of an audio file skipped by a user during playback. 마이크를 통해 입력된 음성신호의 노이즈를 제거하는 전처리모듈;A preprocessing module for removing noise of a voice signal input through a microphone; 상기 노이즈가 제거된 음성신호로부터 키워드를 인식하는 음성인식모듈;A voice recognition module for recognizing a keyword from the voice signal from which the noise is removed; 상기 인식된 키워드에 기초하여 오디오파일의 검색리스트를 생성하는 검색모듈; 및A search module for generating a search list of audio files based on the recognized keywords; And 상기 생성된 검색리스트 및 상기 히스토리 저장모듈에 기초하여, 상기 검색리스트에 포함된 오디오파일을 재생하는 재생모듈을 포함하는 것을 특징으로 하는 오디오 재생장치.And a playback module for playing back audio files included in the search list based on the generated search list and the history storage module. 제1항에 있어서,The method of claim 1, 상기 재생모듈은,The playback module, 상기 오디오파일의 재생 중에 사용자에 의해 재생 스킵된 경우에만, 상기 히스토리 저장모듈에 저장하는 것을 특징으로 하는 오디오 재생장치.And storing the audio file in the history storage module only when the audio file is skipped by the user during playback of the audio file. 제1항에 있어서,The method of claim 1, 상기 재생모듈은,The playback module, 상기 검색리스트에 포함된 오디오파일이 복수 개인 경우, 상기 검색리스트에 포함된 각각의 오디오파일에 대하여 상기 히스토리 저장모듈에 저장된 오디오파일을 순차적으로 비교하고,When there are a plurality of audio files included in the search list, the audio files stored in the history storage module are sequentially compared with respect to each audio file included in the search list, 상기 비교결과, 상기 검색리스트에 포함된 복수개의 오디오파일 중 최종적으로 동일한 오디오파일의 다음 오디오파일을 재생하는 것을 특징으로 하는 오디오 재생장치.And a result of the comparison, reproducing the next audio file of the last identical audio file among the plurality of audio files included in the search list. 제1항에 있어서, The method of claim 1, 상기 히스토리 저장모듈에는,The history storage module, 키워드 별로 사용자에 의해 재생 스킵된 오디오파일이 저장되는 것을 특징으로 하는 오디오 재생장치.And an audio file skipped by a user for each keyword is stored. 재생 중 사용자에 의해 재생 스킵된 오디오파일을 저장하는 히스토리 저장모듈을 포함하는 오디오 재생장치의 오디오 재생방법으로서, An audio reproducing method of an audio reproducing apparatus including a history storage module for storing an audio file skipped by a user during reproducing, (a) 마이크를 통해 입력된 음성신호의 노이즈를 제거하는 단계;(a) removing noise of a voice signal input through a microphone; (b) 상기 노이즈가 제거된 음성신호로부터 키워드를 인식하는 단계;(b) recognizing a keyword from the speech signal from which the noise is removed; (c) 상기 인식된 키워드에 기초하여 오디오파일의 검색리스트를 생성하는 단계; 및(c) generating a search list of audio files based on the recognized keywords; And (d) 상기 생성된 검색리스트 및 상기 히스토리 저장모듈에 기초하여, 상기 검색리스트에 포함된 오디오파일을 재생하는 단계를 포함하는 것을 특징으로 하는 오디오 재생방법.(d) playing the audio file included in the search list based on the generated search list and the history storage module. 제5항에 있어서,The method of claim 5, 상기 오디오 재생방법은,The audio playback method, (e) 상기 오디오파일의 재생 중에 사용자에 의해 재생 스킵된 경우에만, 상기 히스토리 저장모듈에 저장하는 단계를 더 포함하는 것을 특징으로 하는 오디오 재생방법.and (e) storing in the history storage module only when playback is skipped by the user during playback of the audio file. 제5항에 있어서,The method of claim 5, 상기 (d) 단계는,The step (d) (d1) 상기 검색리스트에 포함된 오디오파일이 복수 개인 경우, 상기 검색리스트에 포함된 각각의 오디오파일에 대하여 상기 히스토리 저장모듈에 저장된 오디오파일을 순차적으로 비교하는 단계; 및(d1) sequentially comparing audio files stored in the history storage module with respect to each audio file included in the search list when there are a plurality of audio files included in the search list; And (d2) 상기 비교결과, 상기 검색리스트에 포함된 복수개의 오디오파일 중 최종적으로 동일한 오디오파일의 다음 오디오파일을 재생하는 단계를 포함하는 것을 특징으로 하는 오디오 재생방법.and (d2) reproducing the next audio file of the finally identical audio file among the plurality of audio files included in the search result as a result of the comparison. 제5항에 있어서, The method of claim 5, 상기 히스토리 저장모듈에는,The history storage module, 키워드 별로 재생스킵된 오디오파일의 이름이 저장되는 것을 특징으로 하는 오디오 재생방법.Audio playback method characterized in that the name of the skipped audio file for each keyword is stored.
KR1020090110787A 2009-11-17 2009-11-17 Method and apparatus for playing audio file comprising history storage KR101576683B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020090110787A KR101576683B1 (en) 2009-11-17 2009-11-17 Method and apparatus for playing audio file comprising history storage

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090110787A KR101576683B1 (en) 2009-11-17 2009-11-17 Method and apparatus for playing audio file comprising history storage

Publications (2)

Publication Number Publication Date
KR20110054218A true KR20110054218A (en) 2011-05-25
KR101576683B1 KR101576683B1 (en) 2015-12-10

Family

ID=44363446

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090110787A KR101576683B1 (en) 2009-11-17 2009-11-17 Method and apparatus for playing audio file comprising history storage

Country Status (1)

Country Link
KR (1) KR101576683B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107665710A (en) * 2016-07-27 2018-02-06 上海博泰悦臻网络技术服务有限公司 Mobile terminal sound data processing method and device

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107665710A (en) * 2016-07-27 2018-02-06 上海博泰悦臻网络技术服务有限公司 Mobile terminal sound data processing method and device
CN107665710B (en) * 2016-07-27 2021-02-09 上海博泰悦臻网络技术服务有限公司 Mobile terminal voice data processing method and device

Also Published As

Publication number Publication date
KR101576683B1 (en) 2015-12-10

Similar Documents

Publication Publication Date Title
US9092435B2 (en) System and method for extraction of meta data from a digital media storage device for media selection in a vehicle
US20090076821A1 (en) Method and apparatus to control operation of a playback device
US8355919B2 (en) Systems and methods for text normalization for text to speech synthesis
US8712776B2 (en) Systems and methods for selective text to speech synthesis
US8583418B2 (en) Systems and methods of detecting language and natural language strings for text to speech synthesis
US8396714B2 (en) Systems and methods for concatenation of words in text to speech synthesis
US7870142B2 (en) Text to grammar enhancements for media files
US9805722B2 (en) Interactive speech recognition system
US8352272B2 (en) Systems and methods for text to speech synthesis
JP6128146B2 (en) Voice search device, voice search method and program
US20100082344A1 (en) Systems and methods for selective rate of speech and speech preferences for text to speech synthesis
CN108885869B (en) Method, computing device, and medium for controlling playback of audio data containing speech
JP2014219614A (en) Audio device, video device, and computer program
US20060206339A1 (en) System and method for voice-enabled media content selection on mobile devices
US11295069B2 (en) Speech to text enhanced media editing
KR20080000203A (en) Method for searching music file using voice recognition
US20090171663A1 (en) Reducing a size of a compiled speech recognition grammar
KR20110053397A (en) Method for searching multimedia file by using search keyword and portable device thereof
EP2507792B1 (en) Vocabulary dictionary recompile for in-vehicle audio system
US20100222905A1 (en) Electronic apparatus with an interactive audio file recording function and method thereof
KR101576683B1 (en) Method and apparatus for playing audio file comprising history storage
US11114079B2 (en) Interactive music audition method, apparatus and terminal
KR20090062548A (en) Method for searching contents and mobile communication terminal using the same
JP2000268545A (en) Voice reproducing device
KR20050106246A (en) Method for searching data in mpeg player

Legal Events

Date Code Title Description
A201 Request for examination
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20181126

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20191125

Year of fee payment: 5