KR101192037B1 - Apparatus and method of language setting for audio information display - Google Patents

Apparatus and method of language setting for audio information display Download PDF

Info

Publication number
KR101192037B1
KR101192037B1 KR1020050095839A KR20050095839A KR101192037B1 KR 101192037 B1 KR101192037 B1 KR 101192037B1 KR 1020050095839 A KR1020050095839 A KR 1020050095839A KR 20050095839 A KR20050095839 A KR 20050095839A KR 101192037 B1 KR101192037 B1 KR 101192037B1
Authority
KR
South Korea
Prior art keywords
language
information
audio file
voice
unit
Prior art date
Application number
KR1020050095839A
Other languages
Korean (ko)
Other versions
KR20070040457A (en
Inventor
이근영
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to KR1020050095839A priority Critical patent/KR101192037B1/en
Publication of KR20070040457A publication Critical patent/KR20070040457A/en
Application granted granted Critical
Publication of KR101192037B1 publication Critical patent/KR101192037B1/en

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/451Execution arrangements for user interfaces
    • G06F9/454Multi-language systems; Localisation; Internationalisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/005Language recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/11Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information not detectable on the record carrier
    • G11B27/13Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information not detectable on the record carrier the information being derived from movement of the record carrier, e.g. using tachometer
    • G11B27/15Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information not detectable on the record carrier the information being derived from movement of the record carrier, e.g. using tachometer using mechanical sensing means

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

본 발명은 오디오 파일의 정보를 표시하는 것에 관한 것으로, 오디오 파일의 정보 표시를 위한 언어설정 장치에 있어서, 입력되는 음성을 인식하여 문자를 판단하는 음성 인식부; 상기 오디오 파일의 재생과, 상기 음성 인식부가 판단한 문자에 따라 오디오 파일 정보 표시를 위한 언어설정을 수행하고, 설정된 언어에 따른 오디오 정보를 표시하는 재생 표시부; 및 상기 음성 인식부가 인식한 언어정보 및 오디오 파일 정보를 각각 저장하는 저장부를 포함하여 구성되고, 이에 따라 오디오 파일의 정보 표시를 위한 언어 설정시에 음성인식을 이용하여 언어설정을 할 수 있도록 하여 편리성을 증대시키고, 설정된 언어정보를 이용하여 각각의 오디오 파일마다 언어변환을 자동으로 적용할 수 있다.The present invention relates to displaying information of an audio file, comprising: a speech recognition unit for recognizing an input voice and determining a character; A reproduction display unit configured to set a language for displaying the audio file information according to the reproduction of the audio file and the character determined by the speech recognition unit, and to display the audio information according to the set language; And a storage unit for storing the language information and the audio file information recognized by the voice recognition unit. Accordingly, the language can be conveniently set by using voice recognition when setting the language for displaying the information of the audio file. It is possible to increase gender and automatically apply language conversion to each audio file using the set language information.

ID3 태그, 음성인식, 언어 ID3 Tag, Speech Recognition, Language

Description

오디오 정보 표시 언어 설정 장치 및 방법{Apparatus and method of language setting for audio information display}Apparatus and method of language setting for audio information display}

도 1은 종래의 ID3v1 태그의 구조를 나타낸 블록도이다.1 is a block diagram showing the structure of a conventional ID3v1 tag.

도 2는 본 발명의 실시 예에 따른 오디오 정보 표시 언어 설정 장치의 구조를 나타낸 블록도이다.2 is a block diagram illustrating a structure of an audio information display language setting apparatus according to an exemplary embodiment of the present invention.

도 3은 본 발명의 실시 예에 따른 음성 인식 방법의 동작 순서도이다.3 is a flowchart illustrating a voice recognition method according to an exemplary embodiment of the present invention.

도 4는 본 발명의 실시 예에 따른 오디오 정보 표시 언어 설정 방법의 동작 순서도이다.4 is a flowchart illustrating a method of setting audio information display language according to an exemplary embodiment of the present invention.

본 발명은 오디오 파일의 정보를 표시하는 언어 설정에 관한 것으로, 특히 오디오 파일의 ID3v1 태그와 같은 정보를 표시하는 언어를 음성인식을 통해 자동으로 설정할 수 있도록 하는 오디오 정보 표시 언어 설정 장치 및 방법에 관한 것이다.The present invention relates to a language setting for displaying information of an audio file, and more particularly, to an audio information display language setting apparatus and method for automatically setting a language for displaying information such as ID3v1 tag of an audio file through voice recognition. will be.

최근 MP3(MPEG-1 audio layer 3) 플레이어의 기능의 다양화로 인해 음성, 라 인 인(Line-in), 라디오 녹음 기능을 제공하는 플레이어가 늘어가는 추세이다.Recently, due to the diversification of the functions of the MPEG-1 audio layer 3 (MP3) player, the number of players providing voice, line-in and radio recording functions is increasing.

MP3 파일은 ID3 태그(Tag)라는 데이터 필드가 추가되는데, 제목, 가수, 앨범 및 제작년도 등과 같은 오디오 파일에 대한 정보가 들어갈 수 있다.The MP3 file has a data field called ID3 Tag, and may include information about an audio file such as title, artist, album, and production year.

도 1은 ID3v1의 태그의 구조를 나타낸 블록도이다.1 is a block diagram showing the structure of a tag of ID3v1.

도 1을 참조하면 ID3v1 태그는 제목(Title), 가수(Artist), 앨범(Album), 년도(Year), 메모(Comment) 등의 정보 필드를 포함하여 구성되며 사용자가 원하는 정보를 입력하기 위해서는 컴퓨터와 같이 태그를 인식할 수 있으며, 인식된 정보는 디스플레이 수단을 통해 표시함으로써 사용자가 현재 플레이되고 있는 오디오 파일에 대한 정보를 확인할 수 있도록 한다.Referring to FIG. 1, the ID3v1 tag includes information fields such as title, artist, album, year, comment, and the like. As described above, the tag can be recognized, and the recognized information is displayed through the display means, so that the user can check the information on the audio file currently being played.

현재 ID3 태그는 첫 번째 버전인 ID3 1.0 태그와 두 번째 태그인 ID3 2.0 태그가 있다.The ID3 tag currently has a first version, ID3 1.0 tag and a second tag, ID3 2.0 tag.

ID3 1.0 태그는 MP3 파일의 시작부분(사운드 데이터의 앞)에 있으므로, 파일 다운로드가 시작됨과 동시에 사용할 수 있고, ID3 2.0 태그는 MP3 파일의 끝 부분(사운드 데이터의 뒤)에 있으므로 전체 MP3 파일이 다운로드 되기 전까지는 사용할 수 없다.Because the ID3 1.0 tag is at the beginning of the MP3 file (before the sound data), it can be used at the beginning of the file download, and the ID3 2.0 tag is at the end of the MP3 file (after the sound data), so the entire MP3 file is downloaded. You can't use it until it's done.

이상과 같이 MP3 파일은 ID3 태그를 이용하여 파일의 정보를 추가할 수 있으므로 사용자가 오디오 파일의 분류나 종류 판단 등을 할 때 용이하다.As described above, the MP3 file can be added to the file information using the ID3 tag, it is easy for the user to determine the classification and type of the audio file.

상기한 오디오 파일의 ID3 태그를 사용자에게 디스플레이하기 위해서는, 저장된 태그 정보와 같은 언어설정이 플레이어에 되어 있어야만 사용자가 정상적인 정보 확인이 가능하다.In order to display the ID3 tag of the audio file to the user, the user can confirm normal information only when the language setting such as stored tag information is set in the player.

즉, 임의의 오디오 파일이 중국의 음악 파일이라고 가정할 때, 해당 파일의 제목, 가수 등의 정보는 중국의 노래 제목, 가수이므로 중국어로 저장하는 것이 일반적일 것이다.That is, assuming that an arbitrary audio file is a Chinese music file, information such as a title and a singer of the file is a Chinese song title and a singer, so it is generally stored in Chinese.

따라서 오디오 플레이어는 중국어 폰트를 이용하여 해당파일 정보를 표시해야만 정확한 중국어 문자로 정보가 표시되고 사용자가 이를 인식할 수 있다.Therefore, the audio player must display the corresponding file information using the Chinese font so that the information is displayed in the correct Chinese characters and can be recognized by the user.

상기한 가정은 하나의 예를 나타낸 것이며, 사용자가 오디오 파일의 ID3 태그를 어떤 언어를 이용하여 저장했느냐에 따라, 오디오 플레이어는 해당 설정 언어와 같은 설정이 되어 있어야만 언어별로 다른 폰트로 인해 정보가 깨지는 문제를 해결할 수 있다.The above assumption is an example, and depending on the language in which the user stores the ID3 tag of the audio file, the audio player has to have the same setting as the corresponding language, and the information is broken due to the different fonts for each language. Can be solved.

그러나 상기한 언어 설정을 위해서, 종래에는 사용자가 다양한 언어로 정보가 저장되는 오디오 파일을 플레이할 때, 각각의 오디오 파일 정보에 맞는 언어를 플레이어 조작을 통해 세팅해야만 정확한 정보를 보는 것이 가능했기 때문에 각각 다른 언어로 정보가 저장된 다수의 오디오 파일을 듣는 경우, 각 파일의 정보가 제대로 디스플레이 되도록 하는데 많은 어려움이 따랐다.However, in order to set the above language, in the past, when a user plays an audio file in which information is stored in various languages, it is possible to view accurate information only by setting a language suitable for each audio file information through a player operation. When listening to a large number of audio files with information stored in different languages, it was difficult to ensure that the information in each file was displayed correctly.

본 발명은 이러한 문제점을 해결하기 위한 것으로, 음성인식을 통해 각각의 오디오 파일의 정보 표시 언어를 설정할 수 있도록 하며, 또한 한번 언어 설정을 한 파일의 경우는 해당 파일과 설정 언어정보를 데이터베이스로 저장할 수 있도록 자동으로 언어 설정이 될 수 있도록 하는 오디오 정보 표시 언어 설정 장치 및 방법을 제공함에 그 목적이 있다.The present invention is to solve this problem, it is possible to set the information display language of each audio file through the voice recognition, and in the case of a file once set the language can store the file and the set language information as a database It is an object of the present invention to provide an audio information display language setting apparatus and method for automatically setting a language.

상기한 바와 같은 목적을 달성하기 위하여 본 발명에 따른 오디오 정보 표시 언어 설정 장치는,In order to achieve the above object, the audio information display language setting apparatus according to the present invention,

오디오 파일의 정보 표시를 위한 언어설정 장치에 있어서, 입력되는 음성을 인식하여 문자를 판단하는 음성 인식부; 상기 오디오 파일의 재생과, 상기 음성 인식부가 판단한 문자에 따라 오디오 파일 정보 표시를 위한 언어설정을 수행하고, 설정된 언어에 따른 오디오 정보를 표시하는 재생 표시부; 및 상기 음성 인식부가 인식한 언어정보 및 오디오 파일 정보를 각각 저장하는 저장부를 포함한다.An apparatus for setting a language for displaying information of an audio file, the apparatus comprising: a voice recognition unit for recognizing an input voice and determining a character; A reproduction display unit configured to set a language for displaying the audio file information according to the reproduction of the audio file and the character determined by the speech recognition unit, and to display the audio information according to the set language; And a storage unit for storing language information and audio file information recognized by the speech recognition unit, respectively.

또한, 본 발명에 따른 오디오 정보 표시 언어 설정 방법은,In addition, the audio information display language setting method according to the present invention,

오디오 파일의 정보 표시를 위한 언어설정 방법에 있어서, (a) 오디오 파일의 정보 표시 언어설정을 위한 음성 입력을 받은 단계; (b) 상기 입력된 음성을 판단하여 설정언어를 선택하는 단계; 및 (c) 상기 선택된 언어로 정보표시 언어를 설정하고, 해당 오디오 파일의 언어설정 정보를 저장하는 단계를 포함한다.A language setting method for displaying information of an audio file, comprising: (a) receiving a voice input for setting an information display language of an audio file; (b) selecting a set language by determining the input voice; And (c) setting an information display language in the selected language and storing language setting information of the corresponding audio file.

언급된 바와 같이 본 발명에 따른 오디오 정보 표시 언어 설정 장치 및 방법은 음성인식을 통해 오디오 정보 표시 언어를 설정하도록 하고, 설정된 오디오 정보 표시 언어정보를 저장하여 다음번 플레이시 적용할 수 있도록 하며, 이하에서는 도면을 참조하여 오디오 정보 표시 언어 설정 장치 및 방법에 대하여 보다 상세히 설명하기로 한다.As mentioned above, the apparatus and method for setting an audio information display language according to the present invention may set the audio information display language through voice recognition, store the set audio information display language information, and apply the next play. An apparatus and method for setting an audio information display language will be described in detail with reference to the accompanying drawings.

다만, 본 발명을 설명함에 있어서 종래에 공지가 되어 알려진 부분에 대해서는 자세한 설명을 생략하기로 한다.However, in the following description of the present invention, a detailed description will be omitted for the known parts.

도 2는 본 발명의 실시 예에 따른 오디오 정보 표시 언어 설정 장치의 구조를 나타낸 블록도이다.2 is a block diagram illustrating a structure of an audio information display language setting apparatus according to an exemplary embodiment of the present invention.

도 2를 참조하면, 음성인식을 통해 오디오 정보 표시 언어 설정이 가능한 장치는, 음성입력을 받기 위한 마이크(210)와, 상기 마이크(210)로 입력받은 음성을 인식하기 위한 음성 인식부(220)와, 오디오 재생 및 상기 음성 인식부(220)가 인식한 언어설정 정보에 따른 표시언어 설정과 디스플레이를 수행하는 재생 표시부(230) 및 재생하기 위한 오디오 데이터와 각각의 오디오 데이터의 오디오 정보를 표시하기 위한 언어정보가 저장되는 저장부(240)를 포함한다.Referring to FIG. 2, a device capable of setting an audio information display language through voice recognition includes a microphone 210 for receiving a voice input and a voice recognition unit 220 for recognizing a voice received through the microphone 210. And a display unit 230 for performing display language setting and display according to language setting information recognized by the audio recognizing unit 220 and the audio reproducing unit, and displaying audio data for reproduction and audio information of each audio data. It includes a storage unit 240 for storing the language information for.

이때, 상기 오디오 파일의 언어설정을 위해 오디오 플레이어의 정보 입력을 위한 키 입력부에 핫키가 설정되거나 정의되어 추가될 수 있으며, 이는 상기 도 2에 나타내지는 않았다.In this case, a hotkey may be set or defined to be added to a key input unit for inputting information of an audio player for language setting of the audio file, which is not shown in FIG. 2.

상기 음성 인식부(220)는 마이크(210)를 통해 입력된 음성을 저장된 음성 특징 모델부(222)의 음성 특징 모델과 비교하여 판단하는 음성 판단부(221)와, 각 음성에 따른 특징 모델이 저장되는 음성 특징 모델부(222)를 포함한다.The voice recognition unit 220 compares the voice input through the microphone 210 with the voice feature model of the stored voice feature model unit 222 and determines the voice determiner 221 and the feature model according to each voice. The voice feature model unit 222 is stored.

그리고 재생 표시부(230)는 오디오 정보 표시를 위한 언어를 설정하는 언어 설정부(231)와, 오디오 데이터의 재생을 수행하는 오디오 재생부(232) 및 상기 언어 설정부(231)가 설정한 언어에 따라 저장부(240)에 저장된 오디오 데이터의 오디오 정보를 디스플레이 하는 화면 표시부(233)를 포함한다.In addition, the playback display unit 230 includes a language setting unit 231 for setting a language for displaying audio information, an audio playback unit 232 for reproducing audio data, and a language set by the language setting unit 231. The display unit 233 displays audio information of the audio data stored in the storage 240.

또한 저장부(230)는 오디오 데이터가 저장되는 오디오 데이터부(242)와, 저장된 오디오 데이터에 대해 설정되는 각각의 언어정보가 저장되는 언어정보 DB(241)를 포함한다.The storage unit 230 also includes an audio data unit 242 in which audio data is stored, and a language information DB 241 in which respective language information set for the stored audio data is stored.

상기 오디오 데이터는 ID3 태그정보를 포함하는 오디오 파일이며, 언어정보 DB(241)에는 오디오 파일의 이름, ID3 태그 정보 및 설정 언어정보 등이 저장되며, 저장된 언어설정 DB(241)의 내용에 의해 오디오 재생이 실행될 때 오디오 재생 순서에 따라 각각의 언어설정 정보를 로딩 하여 적용함으로써 화면표시부(223)에 정확한 ID3 태그의 오디오 정보가 표시될 수 있다.The audio data is an audio file including ID3 tag information, and the language information DB 241 stores the name of the audio file, ID3 tag information, setting language information, and the like. When the reproduction is executed, the audio information of the correct ID3 tag can be displayed on the screen display unit 223 by loading and applying the respective language setting information in the audio reproduction order.

상기한 본 발명의 실시 예에 따른 오디오 정보 표시 언어 설정 장치를 포함하는 오디오 플레이어는 처음 오디오 파일이 오디오 데이터부(242)에 저장된 이후에, 최초 재생을 오디오 재생부(232)가 재생을 하면, 사용자에 의해 언어설정을 위한 핫키가 입력되는 경우 해당 오디오 파일의 재생을 잠시 중지하고, 마이크(210)를 통해 사용자가 입력하고자 하는 언어정보를 입력받는다.In the audio player including the audio information display language setting apparatus according to the embodiment of the present invention, when the audio playback unit 232 plays the first playback after the audio file is first stored in the audio data unit 242, When a hot key for language setting is input by the user, playback of the corresponding audio file is temporarily stopped, and language information desired by the user is input through the microphone 210.

입력된 음성정보를 음성 판단부(221)가 음성특징 모델부(222)를 참고하여 인식하고, 언어설정부(231)가 인식된 언어로 해당 오디오 파일의 정보 표시 언어를 설정한다.The voice determination unit 221 recognizes the input voice information with reference to the voice feature model unit 222, and the language setting unit 231 sets the information display language of the corresponding audio file as the recognized language.

상기 설정된 언어에 의해 해당 오디오 파일의 정보를 화면표시부(233)에 표시되며, 동시에 언어정보 DB(241)에 해당 오디오 파일에 대해 설정된 언어정보가 저장된다.The information of the corresponding audio file is displayed on the screen display unit 233 according to the set language, and at the same time, the language information set for the corresponding audio file is stored in the language information DB 241.

또한, 중지되었던 오디오 재생이 재개된다.In addition, audio playback which has been stopped is resumed.

상기 음성 인식부(220)가 사용자의 언어설정을 위한 음성 인식을 하는 과정은 다음과 같다.The process of the speech recognition unit 220 to perform speech recognition for user's language setting is as follows.

도 3은 본 발명의 실시 예에 따른 음성 인식 방법의 동작 순서도이다.3 is a flowchart illustrating a voice recognition method according to an exemplary embodiment of the present invention.

도 3에 나타난 바와 같이, 언어설정을 위해 사용자가 '한국어'라는 음성을 마이크(210)를 통해 입력하면, 음성 판단부(221)는 '한국어'라는 단어에 대한 특징 벡터를 추출하고(S301), 추출된 특징벡터를 이용하여 '한국어'라는 단어를 음성 특징 모델부(221)에서 찾아낸다(S302).As shown in FIG. 3, when a user inputs a voice of “Korean” through a microphone 210 for language setting, the voice determination unit 221 extracts a feature vector for the word “Korean” (S301). Using the extracted feature vector, the word 'Korean' is found in the speech feature model unit 221 (S302).

상기 음성인식에 있어서 특징 벡터를 추출하고, 미리 음성 특징 모델부(222)에 저장되는 특징 벡터에 대한 단어 정보에서 적합한 단어를 찾아내는 것은 HMM(Hidden Markov Model) 등을 이용한 음성 인식 방법을 이용할 수 있다.Extracting a feature vector in the speech recognition and finding a suitable word from the word information on the feature vector stored in the speech feature model unit 222 may use a speech recognition method using a HID (Hidden Markov Model). .

상기 음성 인식에 의해 '한국어'라는 단어가 인식되면, 이를 언어설정부(231)에 전달하고, 언어설정부(231)는 해당 오디오 파일의 정보 표시 언어를 한국어로 설정한다(S303).When the word 'Korean' is recognized by the voice recognition, the word is transmitted to the language setting unit 231, and the language setting unit 231 sets the information display language of the corresponding audio file to Korean (S303).

또한, 설정과 동시에 음성 판단부(221)는 해당 인식 언어 정보를 언어정보 DB(241)에 전달하여 해당 오디오 파일정보와 함께 저장되도록 한다(S304).In addition, at the same time as the setting, the voice determination unit 221 transmits the corresponding recognition language information to the language information DB 241 to be stored together with the corresponding audio file information (S304).

언어 설정이 완료되면, 오디오 재생이 재개되고 화면표시부(233)는 설정된 언어에 따라 오디오 데이터의 ID3 태그정보를 화면에 표시한다(S305).When the language setting is completed, audio reproduction is resumed and the screen display unit 233 displays the ID3 tag information of the audio data on the screen according to the set language (S305).

이때, 앞서 언급한 바와 같이 인식된 언어정보를 언어정보 DB(241)로 저장하는 것은 이후에 다시 해당 오디오 파일의 재생이 있는 경우 저장된 언어설정 정보를 자동으로 적용하여 정보 표시를 할 수 있도록 하기 위한 것이며, 사용자의 조작에 의해 설정된 언어의 변경은 자유롭게 할 수 있다.In this case, as described above, storing the recognized language information into the language information DB 241 may be configured to automatically display the stored language setting information when the corresponding audio file is played again later. The language set by the user's operation can be freely changed.

도 4는 본 발명의 실시 예에 따른 오디오 정보 표시 언어 설정 방법의 동작 순서도이다.4 is a flowchart illustrating a method of setting audio information display language according to an exemplary embodiment of the present invention.

도 4를 참조하면, 오디오 플레이어의 오디오 파일을 재생하면(S401), 오디오 데이터에 포함된 ID3 태그정보를 표시하기 위해 파일정보를 로딩 한다(S402).Referring to FIG. 4, when an audio file of an audio player is played back (S401), file information is loaded to display ID3 tag information included in the audio data (S402).

이때, 해당 오디오 파일에 대해 이전에 언어설정 과정이 있었는지 여부를 판단하는데(S403), 이는 저장부(240)의 언어정보 DB(241)에 해당 오디오 파일의 정보가 있는지 여부를 판단하여 알 수 있다.In this case, it is determined whether a language setting process has been previously performed on the corresponding audio file (S403), which is determined by determining whether the information of the corresponding audio file is included in the language information DB 241 of the storage unit 240. have.

즉, 언어정보 DB(241)에 해당 오디오 파일의 언어설정 정보가 있다면, 설정 언어로 파일 정보를 화면표시부(233)를 통해 파일정보를 표시한다(S406).That is, if there is language setting information of the audio file in the language information DB 241, the file information is displayed through the screen display unit 233 in the setting language (S406).

그리고 언어정보 DB(241)에 해당 오디오 파일의 언어설정 정보가 없다면, 오디오 플레이어의 기본적으로 설정된 언어로 정보가 표시된다(S404).If there is no language setting information of the audio file in the language information DB 241, the information is displayed in a language basically set in the audio player (S404).

사용자가 오디오 재생 중에 언어설정을 하고자 하면(S405, S407), 미리 설정되는 핫키(미도시)를 입력하여 언어설정 모드를 선택하고(S408), 이에 따라 재생 중이던 오디오는 일시 정지한다(S409).If the user wants to set the language during audio reproduction (S405 and S407), the user selects a language setting mode by inputting a preset hotkey (not shown) (S408). Accordingly, the audio being played is paused (S409).

또한, 언어설정을 위한 음성입력을 받을 준비가 되면, 사용자는 원하는 언어에 해당하는 음성을 입력한다(S410).In addition, when ready to receive a voice input for language setting, the user inputs a voice corresponding to the desired language (S410).

상기 음성입력 준비가 되었음은 화면표시부(233)를 통해 오디오 플레이어가 언어설정을 위한 음성입력이 가능하다는 것을 메시지로 표시하는 등의 방식으로 구현될 수 있다.The preparation for the voice input may be implemented through a screen display unit 233 such that the audio player displays a message indicating that voice input for language setting is possible.

또한 사용자가 입력하는 음성은 '한국어' 또는 '중국어'와 같이 해당 오디오 플레이어가 지원하는 언어의 범위에 속하는 언어설정 언어를 직접 음성으로 마이크 (210)에 입력한다.In addition, the voice input by the user inputs a language setting language belonging to a range of languages supported by the corresponding audio player, such as 'Korean' or 'Chinese', directly into the microphone 210 as a voice.

음성 판단부(221)는 입력된 음성의 특징을 추출하고 이를 음성 특징 모델부(222)와 비교하여 해당하는 언어를 판단하고, 판단된 정보를 언어 설정부(231)에 제공함과 동시에 저장부의 언어정보 DB(241)로 전송한다.The voice determination unit 221 extracts a feature of the input voice and compares it with the voice feature model unit 222 to determine a corresponding language, and provides the determined information to the language setting unit 231 and at the same time the language of the storage unit. The information is sent to the DB 241.

상기 언어 설정부(231)는 수신된 언어정보에 따라 해당 오디오 파일의 정보 표시 언어를 설정하여 적용하고(S411), 설정된 언어에 따라 화면표시부(233)에 오디오 파일의 정보가 표시된다(S412).The language setting unit 231 sets and applies the information display language of the corresponding audio file according to the received language information (S411), and displays information of the audio file on the screen display unit 233 according to the set language (S412). .

그리고 언어정보 DB(241)로 전송된 언어정보는 해당 오디오 파일정보와 함께 저장되어(S413), 이후에 해당 오디오 파일이 재생될 때, 단계 S403을 거쳐 설정 저장된 언어정보를 이용하여 정보를 표시할 수 있도록 한다.The language information transmitted to the language information DB 241 is stored together with the corresponding audio file information (S413), and when the corresponding audio file is reproduced later, the information is displayed using the stored stored language information through step S403. To help.

언어 설정 및 저장이 완료된 이후에는 일시 정지 중이었던 해당 오디오 파일을 다시 재생시킨다.After the language setting and saving is completed, the audio file that was paused is played again.

또한, 한번 설정된 언어정보는 단계 S407 내지 단계 S413에 의해 변경이 가능하다.In addition, once set language information can be changed in step S407 to step S413.

본 발명의 실시 예에 따른 오디오 정보 표시 언어 설정 장치 및 방법은 오디오 파일의 정보를 표시하는데 있어서 언어를 설정할 때 음성인식을 이용하여 언어설정을 할 수 있도록 하여 편리성을 증대시키고, 설정된 언어정보를 이용하여 각각의 오디오 파일마다 언어변환을 자동으로 적용할 수 있도록 하는 특징이 있으며, 본 발명을 올바르게 이해하는 당업자는 본 발명의 사상 범위 내에서 구성 요소의 취사선택에 의해서 또 다른 실시 예를 만들어 내는 것은 쉬운 일이다.An apparatus and method for setting a language of displaying audio information according to an embodiment of the present invention increases the convenience by enabling language setting by using voice recognition when setting a language in displaying information of an audio file, and increases the set language information. There is a feature to automatically apply the language conversion to each audio file by using, and those skilled in the art to correctly understand the present invention to create another embodiment by the selection of components within the scope of the invention It's easy.

상기된 바와 같은 본 발명에 따른 오디오 정보 표시 언어 설정 장치 및 방법은 음성인식을 통해 각각의 오디오 파일의 정보 표시 언어를 설정할 수 있도록 하여 사용자가 정보 표시를 언어에 따라 보다 정확히 될 수 있도록 하며, 한번 언어 설정을 한 파일의 경우는 해당 파일과 설정 언어정보를 데이터베이스로 저장하여 각각의 오디오 파일에 따른 언어설정변환이 자동으로 적용될 수 있도록 하는 효과가 있다.The audio information display language setting apparatus and method according to the present invention as described above enables the user to set the information display language of each audio file through voice recognition so that the information display can be more accurately according to the language. In the case of a file having a language setting, the file and setting language information are stored in a database so that the language setting conversion for each audio file can be automatically applied.

Claims (7)

오디오 파일의 정보 표시를 위한 언어설정 장치에 있어서,In the language setting device for displaying information of an audio file, 외부로부터 입력되는 음성을 인식하고, 상기 인식한 음성에 대응하는 언어 정보를 판단하는 음성 인식부;A voice recognition unit recognizing a voice input from the outside and determining language information corresponding to the recognized voice; 상기 음성 인식부를 통해 판단된 언어 정보를 토대로 상기 오디오 파일의 정보를 표시하기 위한 언어를 설정하는 언어 설정부;A language setting unit for setting a language for displaying the information of the audio file based on the language information determined by the speech recognition unit; 상기 오디오 파일의 재생 및 상기 오디오 파일의 정보 표시를 위한 재생 표시부; 및A reproduction display unit for reproducing the audio file and displaying information of the audio file; And 상기 인식된 언어 정보 및 상기 오디오 파일의 정보 저장하는 저장부를 포함하며,A storage unit for storing the recognized language information and information of the audio file, 상기 언어 설정부는, 상기 언어 정보가 저장된 오디오 파일의 재생이 다시 요청되면, 상기 저장된 언어 정보를 이용하여 자동으로 상기 오디오 파일의 정보 표시를 위한 언어를 설정하는 오디오 정보 표시 언어 설정 장치.And the language setting unit automatically sets a language for displaying the information of the audio file by using the stored language information when the reproduction of the audio file in which the language information is stored is requested again. 제 1항에 있어서,The method of claim 1, 상기 음성 인식부는,The speech recognition unit, 음성 특징 모델을 저장하는 음성 특징 모듈부와,A voice feature module unit for storing a voice feature model, 상기 입력되는 음성의 특징을 추출하고, 상기 추출한 음성의 특징과 상기 저장된 음성 특징 모듈을 비교하여, 상기 입력된 음성의 언어 정보를 판단하는 음성 판단부를 포함하는 오디오 정보 표시 언어 설정 장치.And a voice determination unit configured to extract the feature of the input voice, compare the extracted feature of the voice with the stored voice feature module, and determine language information of the input voice. 제 1항에 있어서,The method of claim 1, 상기 재생 표시부는,The playback display unit, 오디오 파일 재생을 위한 오디오 재생부와,;An audio reproducing unit for reproducing an audio file; 상기 언어 설정부가 설정한 언어에 따라 상기 오디오 파일의 정보를 디스플레이하는 화면표시부를 포함하는 오디오 정보 표시 언어 설정 장치.And a screen display unit for displaying information of the audio file according to a language set by the language setting unit. 제 1항에 있어서,The method of claim 1, 상기 저장부는,The storage unit, 상기 오디오 파일이 저장되는 오디오 데이터부와,An audio data unit storing the audio file; 언어설정이 수행된 오디오 파일의 언어설정 정보를 저장하는 언어정보 데이터베이스부를 포함하며,A language information database unit for storing language setting information of an audio file in which language setting is performed; 상기 언어 설정부는,The language setting unit, 상기 언어정보 데이터 베이스부에 저장된 언어 설정 정보를 이용하여 이전에 언어 설정이 수행된 오디오 파일에 대한 자동 언어 설정을 수행하는 오디오 정보 표시 언어 설정 장치.And an automatic language setting for an audio file for which language setting has been previously performed using language setting information stored in the language information database unit. 오디오 파일의 정보 표시를 위한 언어설정 방법에 있어서,In the language setting method for displaying information of an audio file, 음성 입력을 받는 단계;Receiving a voice input; 상기 입력된 음성을 인식하여, 상기 인식한 음성에 대응하는 언어 정보를 판단하는 단계;Recognizing the input voice to determine language information corresponding to the recognized voice; 상기 판단한 언어 정보를 토대로 상기 오디오 파일의 정보 표시를 위한 언어를 설정하고, 상기 설정된 언어를 토대로 상기 오디오 파일의 정보를 표시하는 단계;Setting a language for displaying information of the audio file based on the determined language information, and displaying information of the audio file based on the set language; 상기 오디오 파일에 대해 설정된 언어 정보를 저장하는 단계; 및Storing language information set for the audio file; And 상기 언어 정보가 저장된 오디오 파일에 대한 재생이 다시 요청되면, 상기 저장된 언어 정보를 토대로 상기 오디오 파일의 언어 정보를 자동으로 설정하는 단계를 포함하는 오디오 정보 표시 언어 설정 방법.And automatically setting language information of the audio file based on the stored language information when the reproduction of the audio file in which the language information is stored is requested again. 제 5항에 있어서,6. The method of claim 5, 상기 음성 입력을 받는 단계는,Receiving the voice input, 상기 오디오 파일의 재생 중에 기설정된 핫 키의 입력에 따라 상기 오디오 파일의 정보 표시를 위한 음성 입력을 받는 단계를 포함하는 오디오 정보 표시 언어 설정 방법.And receiving a voice input for displaying information of the audio file according to an input of a preset hot key while playing the audio file. 삭제delete
KR1020050095839A 2005-10-12 2005-10-12 Apparatus and method of language setting for audio information display KR101192037B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020050095839A KR101192037B1 (en) 2005-10-12 2005-10-12 Apparatus and method of language setting for audio information display

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020050095839A KR101192037B1 (en) 2005-10-12 2005-10-12 Apparatus and method of language setting for audio information display

Publications (2)

Publication Number Publication Date
KR20070040457A KR20070040457A (en) 2007-04-17
KR101192037B1 true KR101192037B1 (en) 2012-10-17

Family

ID=38176159

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020050095839A KR101192037B1 (en) 2005-10-12 2005-10-12 Apparatus and method of language setting for audio information display

Country Status (1)

Country Link
KR (1) KR101192037B1 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001175278A (en) * 1999-12-13 2001-06-29 Sharp Corp Controller having display means
WO2005059770A1 (en) * 2003-12-19 2005-06-30 Nokia Corporation An electronic device equipped with a voice user interface and a method in an electronic device for performing language configurations of a user interface

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001175278A (en) * 1999-12-13 2001-06-29 Sharp Corp Controller having display means
WO2005059770A1 (en) * 2003-12-19 2005-06-30 Nokia Corporation An electronic device equipped with a voice user interface and a method in an electronic device for performing language configurations of a user interface

Also Published As

Publication number Publication date
KR20070040457A (en) 2007-04-17

Similar Documents

Publication Publication Date Title
US20180286459A1 (en) Audio processing
JP6128146B2 (en) Voice search device, voice search method and program
EP2816549B1 (en) User bookmarks by touching the display of a music score while recording ambient audio
TWI554984B (en) Electronic device
CN101467142A (en) System and method for extraction of meta data from a digital media storage device for media selection in a vehicle
CN107103915A (en) A kind of audio data processing method and device
CN103491450A (en) Setting method of playback fragment of media stream and terminal
EP2682931B1 (en) Method and apparatus for recording and playing user voice in mobile terminal
US20150106394A1 (en) Automatically playing audio announcements in music player
JP2010085727A (en) Electronic device having dictionary function, and program
KR20150088564A (en) E-Book Apparatus Capable of Playing Animation on the Basis of Voice Recognition and Method thereof
KR102036721B1 (en) Terminal device for supporting quick search for recorded voice and operating method thereof
US20180122362A1 (en) Virtual reality guide hypnosis speech processing method and apparatus
US20040027372A1 (en) Method and electronic apparatus capable of synchronously playing the related voice and words
JP2001022370A (en) Voice guidance device
KR101192037B1 (en) Apparatus and method of language setting for audio information display
JP2001272990A (en) Interaction recording and editing device
EP1501073A1 (en) Information playback apparatus, information playback method, and computer readable medium therefor
JP2018097239A (en) Voice reproduction device and program
US20140207454A1 (en) Text reproduction device, text reproduction method and computer program product
US20080028917A1 (en) Apparatus for Preparing a Playlist in a Sound Source Data Player and a Method Therefor
KR20010010504A (en) Handling technique of digital audio data synchronized with words or graphic information
US11114079B2 (en) Interactive music audition method, apparatus and terminal
KR100473163B1 (en) A storage medium storing multimedia contents and apparatus and method for reproducing the same
KR20010045631A (en) Intelligent caption data structure and playing method of it

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20150924

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20160923

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20170922

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee