KR101192037B1 - Apparatus and method of language setting for audio information display - Google Patents
Apparatus and method of language setting for audio information display Download PDFInfo
- Publication number
- KR101192037B1 KR101192037B1 KR1020050095839A KR20050095839A KR101192037B1 KR 101192037 B1 KR101192037 B1 KR 101192037B1 KR 1020050095839 A KR1020050095839 A KR 1020050095839A KR 20050095839 A KR20050095839 A KR 20050095839A KR 101192037 B1 KR101192037 B1 KR 101192037B1
- Authority
- KR
- South Korea
- Prior art keywords
- language
- information
- audio file
- voice
- unit
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 21
- 238000003860 storage Methods 0.000 claims abstract description 9
- 238000006243 chemical reaction Methods 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10527—Audio or video recording; Data buffering arrangements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/451—Execution arrangements for user interfaces
- G06F9/454—Multi-language systems; Localisation; Internationalisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/005—Language recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/11—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information not detectable on the record carrier
- G11B27/13—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information not detectable on the record carrier the information being derived from movement of the record carrier, e.g. using tachometer
- G11B27/15—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information not detectable on the record carrier the information being derived from movement of the record carrier, e.g. using tachometer using mechanical sensing means
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
본 발명은 오디오 파일의 정보를 표시하는 것에 관한 것으로, 오디오 파일의 정보 표시를 위한 언어설정 장치에 있어서, 입력되는 음성을 인식하여 문자를 판단하는 음성 인식부; 상기 오디오 파일의 재생과, 상기 음성 인식부가 판단한 문자에 따라 오디오 파일 정보 표시를 위한 언어설정을 수행하고, 설정된 언어에 따른 오디오 정보를 표시하는 재생 표시부; 및 상기 음성 인식부가 인식한 언어정보 및 오디오 파일 정보를 각각 저장하는 저장부를 포함하여 구성되고, 이에 따라 오디오 파일의 정보 표시를 위한 언어 설정시에 음성인식을 이용하여 언어설정을 할 수 있도록 하여 편리성을 증대시키고, 설정된 언어정보를 이용하여 각각의 오디오 파일마다 언어변환을 자동으로 적용할 수 있다.The present invention relates to displaying information of an audio file, comprising: a speech recognition unit for recognizing an input voice and determining a character; A reproduction display unit configured to set a language for displaying the audio file information according to the reproduction of the audio file and the character determined by the speech recognition unit, and to display the audio information according to the set language; And a storage unit for storing the language information and the audio file information recognized by the voice recognition unit. Accordingly, the language can be conveniently set by using voice recognition when setting the language for displaying the information of the audio file. It is possible to increase gender and automatically apply language conversion to each audio file using the set language information.
ID3 태그, 음성인식, 언어 ID3 Tag, Speech Recognition, Language
Description
도 1은 종래의 ID3v1 태그의 구조를 나타낸 블록도이다.1 is a block diagram showing the structure of a conventional ID3v1 tag.
도 2는 본 발명의 실시 예에 따른 오디오 정보 표시 언어 설정 장치의 구조를 나타낸 블록도이다.2 is a block diagram illustrating a structure of an audio information display language setting apparatus according to an exemplary embodiment of the present invention.
도 3은 본 발명의 실시 예에 따른 음성 인식 방법의 동작 순서도이다.3 is a flowchart illustrating a voice recognition method according to an exemplary embodiment of the present invention.
도 4는 본 발명의 실시 예에 따른 오디오 정보 표시 언어 설정 방법의 동작 순서도이다.4 is a flowchart illustrating a method of setting audio information display language according to an exemplary embodiment of the present invention.
본 발명은 오디오 파일의 정보를 표시하는 언어 설정에 관한 것으로, 특히 오디오 파일의 ID3v1 태그와 같은 정보를 표시하는 언어를 음성인식을 통해 자동으로 설정할 수 있도록 하는 오디오 정보 표시 언어 설정 장치 및 방법에 관한 것이다.The present invention relates to a language setting for displaying information of an audio file, and more particularly, to an audio information display language setting apparatus and method for automatically setting a language for displaying information such as ID3v1 tag of an audio file through voice recognition. will be.
최근 MP3(MPEG-1 audio layer 3) 플레이어의 기능의 다양화로 인해 음성, 라 인 인(Line-in), 라디오 녹음 기능을 제공하는 플레이어가 늘어가는 추세이다.Recently, due to the diversification of the functions of the MPEG-1 audio layer 3 (MP3) player, the number of players providing voice, line-in and radio recording functions is increasing.
MP3 파일은 ID3 태그(Tag)라는 데이터 필드가 추가되는데, 제목, 가수, 앨범 및 제작년도 등과 같은 오디오 파일에 대한 정보가 들어갈 수 있다.The MP3 file has a data field called ID3 Tag, and may include information about an audio file such as title, artist, album, and production year.
도 1은 ID3v1의 태그의 구조를 나타낸 블록도이다.1 is a block diagram showing the structure of a tag of ID3v1.
도 1을 참조하면 ID3v1 태그는 제목(Title), 가수(Artist), 앨범(Album), 년도(Year), 메모(Comment) 등의 정보 필드를 포함하여 구성되며 사용자가 원하는 정보를 입력하기 위해서는 컴퓨터와 같이 태그를 인식할 수 있으며, 인식된 정보는 디스플레이 수단을 통해 표시함으로써 사용자가 현재 플레이되고 있는 오디오 파일에 대한 정보를 확인할 수 있도록 한다.Referring to FIG. 1, the ID3v1 tag includes information fields such as title, artist, album, year, comment, and the like. As described above, the tag can be recognized, and the recognized information is displayed through the display means, so that the user can check the information on the audio file currently being played.
현재 ID3 태그는 첫 번째 버전인 ID3 1.0 태그와 두 번째 태그인 ID3 2.0 태그가 있다.The ID3 tag currently has a first version, ID3 1.0 tag and a second tag, ID3 2.0 tag.
ID3 1.0 태그는 MP3 파일의 시작부분(사운드 데이터의 앞)에 있으므로, 파일 다운로드가 시작됨과 동시에 사용할 수 있고, ID3 2.0 태그는 MP3 파일의 끝 부분(사운드 데이터의 뒤)에 있으므로 전체 MP3 파일이 다운로드 되기 전까지는 사용할 수 없다.Because the ID3 1.0 tag is at the beginning of the MP3 file (before the sound data), it can be used at the beginning of the file download, and the ID3 2.0 tag is at the end of the MP3 file (after the sound data), so the entire MP3 file is downloaded. You can't use it until it's done.
이상과 같이 MP3 파일은 ID3 태그를 이용하여 파일의 정보를 추가할 수 있으므로 사용자가 오디오 파일의 분류나 종류 판단 등을 할 때 용이하다.As described above, the MP3 file can be added to the file information using the ID3 tag, it is easy for the user to determine the classification and type of the audio file.
상기한 오디오 파일의 ID3 태그를 사용자에게 디스플레이하기 위해서는, 저장된 태그 정보와 같은 언어설정이 플레이어에 되어 있어야만 사용자가 정상적인 정보 확인이 가능하다.In order to display the ID3 tag of the audio file to the user, the user can confirm normal information only when the language setting such as stored tag information is set in the player.
즉, 임의의 오디오 파일이 중국의 음악 파일이라고 가정할 때, 해당 파일의 제목, 가수 등의 정보는 중국의 노래 제목, 가수이므로 중국어로 저장하는 것이 일반적일 것이다.That is, assuming that an arbitrary audio file is a Chinese music file, information such as a title and a singer of the file is a Chinese song title and a singer, so it is generally stored in Chinese.
따라서 오디오 플레이어는 중국어 폰트를 이용하여 해당파일 정보를 표시해야만 정확한 중국어 문자로 정보가 표시되고 사용자가 이를 인식할 수 있다.Therefore, the audio player must display the corresponding file information using the Chinese font so that the information is displayed in the correct Chinese characters and can be recognized by the user.
상기한 가정은 하나의 예를 나타낸 것이며, 사용자가 오디오 파일의 ID3 태그를 어떤 언어를 이용하여 저장했느냐에 따라, 오디오 플레이어는 해당 설정 언어와 같은 설정이 되어 있어야만 언어별로 다른 폰트로 인해 정보가 깨지는 문제를 해결할 수 있다.The above assumption is an example, and depending on the language in which the user stores the ID3 tag of the audio file, the audio player has to have the same setting as the corresponding language, and the information is broken due to the different fonts for each language. Can be solved.
그러나 상기한 언어 설정을 위해서, 종래에는 사용자가 다양한 언어로 정보가 저장되는 오디오 파일을 플레이할 때, 각각의 오디오 파일 정보에 맞는 언어를 플레이어 조작을 통해 세팅해야만 정확한 정보를 보는 것이 가능했기 때문에 각각 다른 언어로 정보가 저장된 다수의 오디오 파일을 듣는 경우, 각 파일의 정보가 제대로 디스플레이 되도록 하는데 많은 어려움이 따랐다.However, in order to set the above language, in the past, when a user plays an audio file in which information is stored in various languages, it is possible to view accurate information only by setting a language suitable for each audio file information through a player operation. When listening to a large number of audio files with information stored in different languages, it was difficult to ensure that the information in each file was displayed correctly.
본 발명은 이러한 문제점을 해결하기 위한 것으로, 음성인식을 통해 각각의 오디오 파일의 정보 표시 언어를 설정할 수 있도록 하며, 또한 한번 언어 설정을 한 파일의 경우는 해당 파일과 설정 언어정보를 데이터베이스로 저장할 수 있도록 자동으로 언어 설정이 될 수 있도록 하는 오디오 정보 표시 언어 설정 장치 및 방법을 제공함에 그 목적이 있다.The present invention is to solve this problem, it is possible to set the information display language of each audio file through the voice recognition, and in the case of a file once set the language can store the file and the set language information as a database It is an object of the present invention to provide an audio information display language setting apparatus and method for automatically setting a language.
상기한 바와 같은 목적을 달성하기 위하여 본 발명에 따른 오디오 정보 표시 언어 설정 장치는,In order to achieve the above object, the audio information display language setting apparatus according to the present invention,
오디오 파일의 정보 표시를 위한 언어설정 장치에 있어서, 입력되는 음성을 인식하여 문자를 판단하는 음성 인식부; 상기 오디오 파일의 재생과, 상기 음성 인식부가 판단한 문자에 따라 오디오 파일 정보 표시를 위한 언어설정을 수행하고, 설정된 언어에 따른 오디오 정보를 표시하는 재생 표시부; 및 상기 음성 인식부가 인식한 언어정보 및 오디오 파일 정보를 각각 저장하는 저장부를 포함한다.An apparatus for setting a language for displaying information of an audio file, the apparatus comprising: a voice recognition unit for recognizing an input voice and determining a character; A reproduction display unit configured to set a language for displaying the audio file information according to the reproduction of the audio file and the character determined by the speech recognition unit, and to display the audio information according to the set language; And a storage unit for storing language information and audio file information recognized by the speech recognition unit, respectively.
또한, 본 발명에 따른 오디오 정보 표시 언어 설정 방법은,In addition, the audio information display language setting method according to the present invention,
오디오 파일의 정보 표시를 위한 언어설정 방법에 있어서, (a) 오디오 파일의 정보 표시 언어설정을 위한 음성 입력을 받은 단계; (b) 상기 입력된 음성을 판단하여 설정언어를 선택하는 단계; 및 (c) 상기 선택된 언어로 정보표시 언어를 설정하고, 해당 오디오 파일의 언어설정 정보를 저장하는 단계를 포함한다.A language setting method for displaying information of an audio file, comprising: (a) receiving a voice input for setting an information display language of an audio file; (b) selecting a set language by determining the input voice; And (c) setting an information display language in the selected language and storing language setting information of the corresponding audio file.
언급된 바와 같이 본 발명에 따른 오디오 정보 표시 언어 설정 장치 및 방법은 음성인식을 통해 오디오 정보 표시 언어를 설정하도록 하고, 설정된 오디오 정보 표시 언어정보를 저장하여 다음번 플레이시 적용할 수 있도록 하며, 이하에서는 도면을 참조하여 오디오 정보 표시 언어 설정 장치 및 방법에 대하여 보다 상세히 설명하기로 한다.As mentioned above, the apparatus and method for setting an audio information display language according to the present invention may set the audio information display language through voice recognition, store the set audio information display language information, and apply the next play. An apparatus and method for setting an audio information display language will be described in detail with reference to the accompanying drawings.
다만, 본 발명을 설명함에 있어서 종래에 공지가 되어 알려진 부분에 대해서는 자세한 설명을 생략하기로 한다.However, in the following description of the present invention, a detailed description will be omitted for the known parts.
도 2는 본 발명의 실시 예에 따른 오디오 정보 표시 언어 설정 장치의 구조를 나타낸 블록도이다.2 is a block diagram illustrating a structure of an audio information display language setting apparatus according to an exemplary embodiment of the present invention.
도 2를 참조하면, 음성인식을 통해 오디오 정보 표시 언어 설정이 가능한 장치는, 음성입력을 받기 위한 마이크(210)와, 상기 마이크(210)로 입력받은 음성을 인식하기 위한 음성 인식부(220)와, 오디오 재생 및 상기 음성 인식부(220)가 인식한 언어설정 정보에 따른 표시언어 설정과 디스플레이를 수행하는 재생 표시부(230) 및 재생하기 위한 오디오 데이터와 각각의 오디오 데이터의 오디오 정보를 표시하기 위한 언어정보가 저장되는 저장부(240)를 포함한다.Referring to FIG. 2, a device capable of setting an audio information display language through voice recognition includes a
이때, 상기 오디오 파일의 언어설정을 위해 오디오 플레이어의 정보 입력을 위한 키 입력부에 핫키가 설정되거나 정의되어 추가될 수 있으며, 이는 상기 도 2에 나타내지는 않았다.In this case, a hotkey may be set or defined to be added to a key input unit for inputting information of an audio player for language setting of the audio file, which is not shown in FIG. 2.
상기 음성 인식부(220)는 마이크(210)를 통해 입력된 음성을 저장된 음성 특징 모델부(222)의 음성 특징 모델과 비교하여 판단하는 음성 판단부(221)와, 각 음성에 따른 특징 모델이 저장되는 음성 특징 모델부(222)를 포함한다.The
그리고 재생 표시부(230)는 오디오 정보 표시를 위한 언어를 설정하는 언어 설정부(231)와, 오디오 데이터의 재생을 수행하는 오디오 재생부(232) 및 상기 언어 설정부(231)가 설정한 언어에 따라 저장부(240)에 저장된 오디오 데이터의 오디오 정보를 디스플레이 하는 화면 표시부(233)를 포함한다.In addition, the playback display unit 230 includes a
또한 저장부(230)는 오디오 데이터가 저장되는 오디오 데이터부(242)와, 저장된 오디오 데이터에 대해 설정되는 각각의 언어정보가 저장되는 언어정보 DB(241)를 포함한다.The storage unit 230 also includes an
상기 오디오 데이터는 ID3 태그정보를 포함하는 오디오 파일이며, 언어정보 DB(241)에는 오디오 파일의 이름, ID3 태그 정보 및 설정 언어정보 등이 저장되며, 저장된 언어설정 DB(241)의 내용에 의해 오디오 재생이 실행될 때 오디오 재생 순서에 따라 각각의 언어설정 정보를 로딩 하여 적용함으로써 화면표시부(223)에 정확한 ID3 태그의 오디오 정보가 표시될 수 있다.The audio data is an audio file including ID3 tag information, and the
상기한 본 발명의 실시 예에 따른 오디오 정보 표시 언어 설정 장치를 포함하는 오디오 플레이어는 처음 오디오 파일이 오디오 데이터부(242)에 저장된 이후에, 최초 재생을 오디오 재생부(232)가 재생을 하면, 사용자에 의해 언어설정을 위한 핫키가 입력되는 경우 해당 오디오 파일의 재생을 잠시 중지하고, 마이크(210)를 통해 사용자가 입력하고자 하는 언어정보를 입력받는다.In the audio player including the audio information display language setting apparatus according to the embodiment of the present invention, when the
입력된 음성정보를 음성 판단부(221)가 음성특징 모델부(222)를 참고하여 인식하고, 언어설정부(231)가 인식된 언어로 해당 오디오 파일의 정보 표시 언어를 설정한다.The
상기 설정된 언어에 의해 해당 오디오 파일의 정보를 화면표시부(233)에 표시되며, 동시에 언어정보 DB(241)에 해당 오디오 파일에 대해 설정된 언어정보가 저장된다.The information of the corresponding audio file is displayed on the
또한, 중지되었던 오디오 재생이 재개된다.In addition, audio playback which has been stopped is resumed.
상기 음성 인식부(220)가 사용자의 언어설정을 위한 음성 인식을 하는 과정은 다음과 같다.The process of the
도 3은 본 발명의 실시 예에 따른 음성 인식 방법의 동작 순서도이다.3 is a flowchart illustrating a voice recognition method according to an exemplary embodiment of the present invention.
도 3에 나타난 바와 같이, 언어설정을 위해 사용자가 '한국어'라는 음성을 마이크(210)를 통해 입력하면, 음성 판단부(221)는 '한국어'라는 단어에 대한 특징 벡터를 추출하고(S301), 추출된 특징벡터를 이용하여 '한국어'라는 단어를 음성 특징 모델부(221)에서 찾아낸다(S302).As shown in FIG. 3, when a user inputs a voice of “Korean” through a
상기 음성인식에 있어서 특징 벡터를 추출하고, 미리 음성 특징 모델부(222)에 저장되는 특징 벡터에 대한 단어 정보에서 적합한 단어를 찾아내는 것은 HMM(Hidden Markov Model) 등을 이용한 음성 인식 방법을 이용할 수 있다.Extracting a feature vector in the speech recognition and finding a suitable word from the word information on the feature vector stored in the speech
상기 음성 인식에 의해 '한국어'라는 단어가 인식되면, 이를 언어설정부(231)에 전달하고, 언어설정부(231)는 해당 오디오 파일의 정보 표시 언어를 한국어로 설정한다(S303).When the word 'Korean' is recognized by the voice recognition, the word is transmitted to the
또한, 설정과 동시에 음성 판단부(221)는 해당 인식 언어 정보를 언어정보 DB(241)에 전달하여 해당 오디오 파일정보와 함께 저장되도록 한다(S304).In addition, at the same time as the setting, the
언어 설정이 완료되면, 오디오 재생이 재개되고 화면표시부(233)는 설정된 언어에 따라 오디오 데이터의 ID3 태그정보를 화면에 표시한다(S305).When the language setting is completed, audio reproduction is resumed and the
이때, 앞서 언급한 바와 같이 인식된 언어정보를 언어정보 DB(241)로 저장하는 것은 이후에 다시 해당 오디오 파일의 재생이 있는 경우 저장된 언어설정 정보를 자동으로 적용하여 정보 표시를 할 수 있도록 하기 위한 것이며, 사용자의 조작에 의해 설정된 언어의 변경은 자유롭게 할 수 있다.In this case, as described above, storing the recognized language information into the
도 4는 본 발명의 실시 예에 따른 오디오 정보 표시 언어 설정 방법의 동작 순서도이다.4 is a flowchart illustrating a method of setting audio information display language according to an exemplary embodiment of the present invention.
도 4를 참조하면, 오디오 플레이어의 오디오 파일을 재생하면(S401), 오디오 데이터에 포함된 ID3 태그정보를 표시하기 위해 파일정보를 로딩 한다(S402).Referring to FIG. 4, when an audio file of an audio player is played back (S401), file information is loaded to display ID3 tag information included in the audio data (S402).
이때, 해당 오디오 파일에 대해 이전에 언어설정 과정이 있었는지 여부를 판단하는데(S403), 이는 저장부(240)의 언어정보 DB(241)에 해당 오디오 파일의 정보가 있는지 여부를 판단하여 알 수 있다.In this case, it is determined whether a language setting process has been previously performed on the corresponding audio file (S403), which is determined by determining whether the information of the corresponding audio file is included in the
즉, 언어정보 DB(241)에 해당 오디오 파일의 언어설정 정보가 있다면, 설정 언어로 파일 정보를 화면표시부(233)를 통해 파일정보를 표시한다(S406).That is, if there is language setting information of the audio file in the
그리고 언어정보 DB(241)에 해당 오디오 파일의 언어설정 정보가 없다면, 오디오 플레이어의 기본적으로 설정된 언어로 정보가 표시된다(S404).If there is no language setting information of the audio file in the
사용자가 오디오 재생 중에 언어설정을 하고자 하면(S405, S407), 미리 설정되는 핫키(미도시)를 입력하여 언어설정 모드를 선택하고(S408), 이에 따라 재생 중이던 오디오는 일시 정지한다(S409).If the user wants to set the language during audio reproduction (S405 and S407), the user selects a language setting mode by inputting a preset hotkey (not shown) (S408). Accordingly, the audio being played is paused (S409).
또한, 언어설정을 위한 음성입력을 받을 준비가 되면, 사용자는 원하는 언어에 해당하는 음성을 입력한다(S410).In addition, when ready to receive a voice input for language setting, the user inputs a voice corresponding to the desired language (S410).
상기 음성입력 준비가 되었음은 화면표시부(233)를 통해 오디오 플레이어가 언어설정을 위한 음성입력이 가능하다는 것을 메시지로 표시하는 등의 방식으로 구현될 수 있다.The preparation for the voice input may be implemented through a
또한 사용자가 입력하는 음성은 '한국어' 또는 '중국어'와 같이 해당 오디오 플레이어가 지원하는 언어의 범위에 속하는 언어설정 언어를 직접 음성으로 마이크 (210)에 입력한다.In addition, the voice input by the user inputs a language setting language belonging to a range of languages supported by the corresponding audio player, such as 'Korean' or 'Chinese', directly into the
음성 판단부(221)는 입력된 음성의 특징을 추출하고 이를 음성 특징 모델부(222)와 비교하여 해당하는 언어를 판단하고, 판단된 정보를 언어 설정부(231)에 제공함과 동시에 저장부의 언어정보 DB(241)로 전송한다.The
상기 언어 설정부(231)는 수신된 언어정보에 따라 해당 오디오 파일의 정보 표시 언어를 설정하여 적용하고(S411), 설정된 언어에 따라 화면표시부(233)에 오디오 파일의 정보가 표시된다(S412).The
그리고 언어정보 DB(241)로 전송된 언어정보는 해당 오디오 파일정보와 함께 저장되어(S413), 이후에 해당 오디오 파일이 재생될 때, 단계 S403을 거쳐 설정 저장된 언어정보를 이용하여 정보를 표시할 수 있도록 한다.The language information transmitted to the
언어 설정 및 저장이 완료된 이후에는 일시 정지 중이었던 해당 오디오 파일을 다시 재생시킨다.After the language setting and saving is completed, the audio file that was paused is played again.
또한, 한번 설정된 언어정보는 단계 S407 내지 단계 S413에 의해 변경이 가능하다.In addition, once set language information can be changed in step S407 to step S413.
본 발명의 실시 예에 따른 오디오 정보 표시 언어 설정 장치 및 방법은 오디오 파일의 정보를 표시하는데 있어서 언어를 설정할 때 음성인식을 이용하여 언어설정을 할 수 있도록 하여 편리성을 증대시키고, 설정된 언어정보를 이용하여 각각의 오디오 파일마다 언어변환을 자동으로 적용할 수 있도록 하는 특징이 있으며, 본 발명을 올바르게 이해하는 당업자는 본 발명의 사상 범위 내에서 구성 요소의 취사선택에 의해서 또 다른 실시 예를 만들어 내는 것은 쉬운 일이다.An apparatus and method for setting a language of displaying audio information according to an embodiment of the present invention increases the convenience by enabling language setting by using voice recognition when setting a language in displaying information of an audio file, and increases the set language information. There is a feature to automatically apply the language conversion to each audio file by using, and those skilled in the art to correctly understand the present invention to create another embodiment by the selection of components within the scope of the invention It's easy.
상기된 바와 같은 본 발명에 따른 오디오 정보 표시 언어 설정 장치 및 방법은 음성인식을 통해 각각의 오디오 파일의 정보 표시 언어를 설정할 수 있도록 하여 사용자가 정보 표시를 언어에 따라 보다 정확히 될 수 있도록 하며, 한번 언어 설정을 한 파일의 경우는 해당 파일과 설정 언어정보를 데이터베이스로 저장하여 각각의 오디오 파일에 따른 언어설정변환이 자동으로 적용될 수 있도록 하는 효과가 있다.The audio information display language setting apparatus and method according to the present invention as described above enables the user to set the information display language of each audio file through voice recognition so that the information display can be more accurately according to the language. In the case of a file having a language setting, the file and setting language information are stored in a database so that the language setting conversion for each audio file can be automatically applied.
Claims (7)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020050095839A KR101192037B1 (en) | 2005-10-12 | 2005-10-12 | Apparatus and method of language setting for audio information display |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020050095839A KR101192037B1 (en) | 2005-10-12 | 2005-10-12 | Apparatus and method of language setting for audio information display |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20070040457A KR20070040457A (en) | 2007-04-17 |
KR101192037B1 true KR101192037B1 (en) | 2012-10-17 |
Family
ID=38176159
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020050095839A KR101192037B1 (en) | 2005-10-12 | 2005-10-12 | Apparatus and method of language setting for audio information display |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101192037B1 (en) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001175278A (en) * | 1999-12-13 | 2001-06-29 | Sharp Corp | Controller having display means |
WO2005059770A1 (en) * | 2003-12-19 | 2005-06-30 | Nokia Corporation | An electronic device equipped with a voice user interface and a method in an electronic device for performing language configurations of a user interface |
-
2005
- 2005-10-12 KR KR1020050095839A patent/KR101192037B1/en not_active IP Right Cessation
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001175278A (en) * | 1999-12-13 | 2001-06-29 | Sharp Corp | Controller having display means |
WO2005059770A1 (en) * | 2003-12-19 | 2005-06-30 | Nokia Corporation | An electronic device equipped with a voice user interface and a method in an electronic device for performing language configurations of a user interface |
Also Published As
Publication number | Publication date |
---|---|
KR20070040457A (en) | 2007-04-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20180286459A1 (en) | Audio processing | |
JP6128146B2 (en) | Voice search device, voice search method and program | |
EP2816549B1 (en) | User bookmarks by touching the display of a music score while recording ambient audio | |
TWI554984B (en) | Electronic device | |
CN101467142A (en) | System and method for extraction of meta data from a digital media storage device for media selection in a vehicle | |
CN107103915A (en) | A kind of audio data processing method and device | |
CN103491450A (en) | Setting method of playback fragment of media stream and terminal | |
EP2682931B1 (en) | Method and apparatus for recording and playing user voice in mobile terminal | |
US20150106394A1 (en) | Automatically playing audio announcements in music player | |
JP2010085727A (en) | Electronic device having dictionary function, and program | |
KR20150088564A (en) | E-Book Apparatus Capable of Playing Animation on the Basis of Voice Recognition and Method thereof | |
KR102036721B1 (en) | Terminal device for supporting quick search for recorded voice and operating method thereof | |
US20180122362A1 (en) | Virtual reality guide hypnosis speech processing method and apparatus | |
US20040027372A1 (en) | Method and electronic apparatus capable of synchronously playing the related voice and words | |
JP2001022370A (en) | Voice guidance device | |
KR101192037B1 (en) | Apparatus and method of language setting for audio information display | |
JP2001272990A (en) | Interaction recording and editing device | |
EP1501073A1 (en) | Information playback apparatus, information playback method, and computer readable medium therefor | |
JP2018097239A (en) | Voice reproduction device and program | |
US20140207454A1 (en) | Text reproduction device, text reproduction method and computer program product | |
US20080028917A1 (en) | Apparatus for Preparing a Playlist in a Sound Source Data Player and a Method Therefor | |
KR20010010504A (en) | Handling technique of digital audio data synchronized with words or graphic information | |
US11114079B2 (en) | Interactive music audition method, apparatus and terminal | |
KR100473163B1 (en) | A storage medium storing multimedia contents and apparatus and method for reproducing the same | |
KR20010045631A (en) | Intelligent caption data structure and playing method of it |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20150924 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20160923 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20170922 Year of fee payment: 6 |
|
LAPS | Lapse due to unpaid annual fee |