KR20010016404A - Multicodec player having text-to-speech conversion function - Google Patents

Multicodec player having text-to-speech conversion function Download PDF

Info

Publication number
KR20010016404A
KR20010016404A KR1020000074469A KR20000074469A KR20010016404A KR 20010016404 A KR20010016404 A KR 20010016404A KR 1020000074469 A KR1020000074469 A KR 1020000074469A KR 20000074469 A KR20000074469 A KR 20000074469A KR 20010016404 A KR20010016404 A KR 20010016404A
Authority
KR
South Korea
Prior art keywords
music
text
information
player
digital
Prior art date
Application number
KR1020000074469A
Other languages
Korean (ko)
Other versions
KR100379995B1 (en
Inventor
심정철
Original Assignee
심정철
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 심정철 filed Critical 심정철
Priority to KR10-2000-0074469A priority Critical patent/KR100379995B1/en
Publication of KR20010016404A publication Critical patent/KR20010016404A/en
Application granted granted Critical
Publication of KR100379995B1 publication Critical patent/KR100379995B1/en

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • G10L13/10Prosody rules derived from text; Stress or intonation
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10009Improvement or modification of read or write signals
    • G11B20/10037A/D conversion, D/A conversion, sampling, slicing and digital quantisation or adjusting parameters thereof
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion
    • G11B2020/00014Time or data compression or expansion the compressed signal being an audio signal

Abstract

PURPOSE: A multicodec player is provided to reproduce converted speed information with an original music by converting relative text information to a speech. CONSTITUTION: A multicodec player comprises a control unit(109), a memory(102), a codec unit, an A/D converter(104) and a D/A converter(105). A control program is stored in the memory. The control program converts relative text information about music in a digital music file to a speech with a text/speech conversion program. The control program reproduces the speech conversion information of text information when the digital music is reproduced. A user listens to the music with the relative information. Thereby, the user understands the music deeply.

Description

텍스트/음성 변환 기능을 갖는 멀티코덱 플레이어{Multicodec player having text-to-speech conversion function}Multicodec player having text-to-speech conversion function

본 발명은 멀티코덱(multicodec) 플레이어에 관한 것으로서, 더 상세하게는 인터넷을 통해 다운로드 받은 디지털 음악 등을 재생할 경우에 그 음악과 함께 실려 있는 텍스트 정보를 TTS(text-to-speech conversion system)를 이용하여 음성으로 변환하여 그 변환된 음성 정보를 원래의 음악과 함께 재생하여 주는 텍스트/음성 변환 기능을 갖는 멀티코덱 플레이어에 관한 것이다.BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a multicodec player, and more particularly, to a text-to-speech conversion system (TTS) for text information carried with the music when playing digital music downloaded through the Internet. The present invention relates to a multi-codec player having a text / voice conversion function for converting a voice into a voice and reproducing the converted voice information together with the original music.

멀티코덱 플레이어는 오디오 데이터의 압축기술인 AA, MP3, WMA 등의 압축방식의 ELWLWXKF 음악을 재생하는 기기이다. 보통 CD에 있는 음악 파일의 크기는 30~50 MB 정도이지만, 압축 기술을 이용하면 음질을 거의 같은 수준으로 유지하면서도 데이터 용량을 원래의 약 12분의 1 이하로 줄일 수 있다. 이렇게 줄인 파일의 크기는 불과 한곡에 2~5 MB에 불과해 네트웍을 통해 고품질 음악을 쉽게 주고 받을 수 있다.The multicodec player is a device that plays ELWLWXKF music using compression methods such as AA, MP3, and WMA, which are audio data compression technologies. While the size of a music file on a CD is typically 30-50 MB, compression technology can reduce data capacity to about one-twelfth the original, while maintaining sound quality at about the same level. This reduced file size is only 2-5 MB per song, so you can easily send and receive high-quality music over the network.

현재 국내 PC 통신이나 인터넷에서도 여러 가지 압축 방식으로 만들어진 파일을 어렵지 않게 볼 수 있고, 네티즌들에게도 인기 있는 아이템으로 꼽히고 있다. 수십만 곡의 음악 파일을 제공하고 있는 MP3 홈페이지가 세계적으로 인기를 끌고 있는데, 이 파일을 이용할 경우 굳이 음반을 사지 않아도 자신이 원하는 곡만 골라 들을 수 있고 쉽게 다른 PC로 옮겨서 감상할 수 있기 때문이다.Currently, files made by various compression methods can be seen easily in domestic PC communication and the Internet, and are popular among netizens. The MP3 homepage, which offers hundreds of thousands of music files, is gaining popularity around the world because it allows you to listen to only the music you want without having to buy a record and to easily transfer it to another PC.

약 1시간 분량의 음악 CD 전체를 웹을 통해 수분 내에 다운로드할 수 있기 때문에, 디지털 음악이 음반의 배포 및 판매 방법에 있어 일대 변혁을 가져올 것으로 예상된다. 그러나, 세계의 주요 음반사들은 어떤 형태이든 저작권이 보호받을 수 있는 방법이 표준화되기 전까지는 웹을 통한 디지털 음악파일(예컨대, MP3 음악파일) 배포에 주저할 것으로 예상된다. 우리 나라에서는 1997년에 한국음악저작권협회(KOMCA)가 "PC 통신망을 통한 음악 저작물의 이용에 대한 기준"을 제정, 시행에 들어감으로써 MP3를 이용한 PC 통신 유료 서비스 사업이 가능하게 되었다.Because an entire hour's worth of music CDs can be downloaded over the web in minutes, digital music is expected to revolutionize the way the music is distributed and sold. However, the world's major labels are expected to hesitate to distribute digital music files (eg, MP3 music files) over the Web until standardized forms of copyright protection in any form are standardized. In Korea, the Korea Music Copyright Association (KOMCA) enacted and implemented the "Standards for the Use of Music Works over the PC Network" in 1997, enabling the payment of PC communication services using MP3.

디지털 음악은 CD 플레이어와 같은 별도의 하드웨어 없이도 소프트웨어를 통해 PC에서 청취할 수 있으며, 최근에는 PC로부터 MP3 음악을 다운로드(download) 받아 들고 다니며 감상할 수 있는 휴대용 MP3 플레이어도 많이 등장하고 있다. 심지어 휴대폰을 통해서도 MP3 음악을 청취할 수 있도록한 통합 제품도 선을 보이고 있다.Digital music can be listened to on a PC through software without any additional hardware such as a CD player. Recently, portable MP3 players have been introduced to download and carry MP3 music from a PC. There are even integrated products that allow you to listen to MP3 music on your mobile phone.

그런데, 이상과 같은 종래 MP3 플레이어나 멀티코덱 플레이어, 카세트 라디오 등을 통해서는 대부분이 저장(기록) 매체에 저장(기록)되어 있는 음악만이 재생되고, 그 음악과 관련된 정보, 예를 들면 노래 제목, 가수 이름,노래 가사, 혹은 그 노래가 만들어진 배경이나 그 노래가 무엇을 노래하고자 하는 것인지에 관한 간략한 설명과 같은 정보는 디스플레이 장치를 통해서만 표시하고 있다.By the way, through the conventional MP3 players, multi-codec players, cassette radios, and the like, only music that is mostly stored (recorded) on a storage (recording) medium is played, and information related to the music, for example, a song title Information such as a singer's name, song lyrics, or the background in which the song was made or a brief description of what the song is trying to sing is displayed only on the display device.

따라서, 상기 종래 음악 플레이어들을 이용하여 그와 같은 노래 정보를 얻기 위해서는 음악 플레이어에 디스플레이가 가능하도록 하는 특별한 회로 구성이 부가되어야 한다. 또한, 디스플레이가 마련되는 경우에도 표시전용 재생 정보를 저장한 노래만이 디스플레이가 가능하다. 따라서, 사용자(음악 청취자) 입장에서는 음악과 관련된 정보를 얻음에 있어 여러 가지로 제한을 받을 수 밖에 없다.Thus, in order to obtain such song information using the conventional music players, a special circuit configuration must be added to enable display on the music player. In addition, even when a display is provided, only a song storing display-only reproduction information can be displayed. Therefore, the user (music listener) can be limited in various ways to obtain information related to music.

본 발명은 상기의 문제점을 감안하여 창출된 것으로서, 디지털 음악을 재생할 시 그 음악과 관련된 텍스트 정보를 음성으로 변환하여 그 변환된 음성 정보를 원래의 음악과 함께 재생하여 주는 텍스트/음성 변환 기능을 갖는 멀티코덱 플레이어를 제공함에 그 목적이 있다.The present invention has been made in view of the above problems, and has a text / voice conversion function that converts text information related to the music into a voice and reproduces the converted voice information together with the original music when playing digital music. Its purpose is to provide a multicodec player.

본 명세서에 첨부되는 다음의 도면들은 본 발명의 바람직한 실시예를 예시하는 것으로서, 후술하는 발명의 상세한 설명과 함께 본 발명의 기술적 사상의 이해를 돕기 위한 것이다. 따라서, 본 발명은 그와 같은 도면에 개시된 사항에만 한정되어 해석되어서는 안된다.The following drawings are attached to the specification to illustrate preferred embodiments of the present invention, together with a detailed description of the present invention to help understand the spirit of the present invention. Therefore, the present invention should not be construed as limited to the matter disclosed in such drawings.

도 1은 본 발명에 따른 텍스트/음성 변환 기능을 갖는 멀티코덱 플레이어의 내부 시스템 구성을 개략적으로 보여주는 블록구성도.1 is a block diagram schematically showing an internal system configuration of a multicodec player having a text / voice conversion function according to the present invention.

도 2는 본 발명에 따른 텍스트/음성 변환 기능을 갖는 멀티코덱 플레이어에 채용되는 텍스트/음성 변환 시스템의 개략적인 블록 구성도.2 is a schematic block diagram of a text / voice conversion system employed in a multicodec player having a text / voice conversion function according to the present invention.

도 3은 본 발명에 따른 텍스트/음성 변환 기능을 갖는 멀티코덱 플레이어에 의해 디지털 음악 파일을 재생하는 과정을 보여주는 흐름도.3 is a flowchart showing a process of playing a digital music file by a multicodec player having a text / voice conversion function according to the present invention.

〈도면의 주요 부분에 대한 부호의 설명〉<Explanation of symbols for main parts of drawing>

101...인터페이스부 102...메모리101 Interface section 102 Memory

103...코덱부 104...A/D 변환기103 ... Codec 104 ... A / D Converter

105...D/A 변환기 106...키조작부105 ... D / A converter 106 ... Key controls

107...표시부 108...전원공급부107 Display ... 108 Power supply

109...제어부 110...증폭기109 control unit 110 amplifier

201...언어처리부 202...운율처리부201 ... Language processing unit 202 ... Rhyme processing unit

203...신호처리부 204...합성단위 데이터 베이스203 ... Signal Processing Unit ... 204 Synthesis Unit Database

상기의 목적을 달성하기 위하여 본 발명에 따른 텍스트/음성 변환 기능을 갖는 멀티코덱 플레이어는, 제어부, 메모리, 코덱부, 아날로그/디지털 변환기, 디지털/아날로그 변환기를 구비하는 멀티코덱 플레이어에 있어서,In order to achieve the above object, a multicodec player having a text / voice conversion function according to the present invention includes a control unit, a memory, a codec unit, an analog / digital converter, and a digital / analog converter.

상기 메모리에는 디지털 음악 파일에 저장되어 있는 음악과 관련된 텍스트 정보를 텍스트/음성 변환 프로그램을 이용하여 음성으로 변환하여 저장한 후, 디지털 음악 재생시 텍스트 정보의 음성 변환 정보도 함께 재생하도록 하는 제어 프로그램이 저장되어 있는 점에 그 특징이 있다.The memory program includes a control program that converts and stores text information related to music stored in a digital music file into voice using a text / voice conversion program, and also plays back voice conversion information of the text information during digital music playback. The characteristic is that it is stored.

이와 같은 본 발명에 의하면, 디지털 음악을 재생할 시 그 음악과 관련된 텍스트 정보를 텍스트/음성 변환 시스템을 이용하여 음성으로 변환하여 원래의 음악과 함께 재생하여 주므로, 사용자(청취자)는 음악을 감상함과 동시에 음악과 관련된 정보(노래 제목, 가수 이름, 노래 가사, 노래에 관한 간략한 설명 등)를 들을 수 있어, 그 음악에 대한 이해의 폭을 더욱 넓힐 수 있고, 음악 감상에 대한 다른 차원의 묘미를 느낄 수 있다.According to the present invention, when playing digital music, the text information related to the music is converted into a voice using a text / voice conversion system and played together with the original music, so that the user (listener) listens to the music. At the same time, you can listen to music-related information (song titles, singer names, song lyrics, brief descriptions of the song, etc.) to broaden your understanding of the music and feel the other dimension of listening to music. Can be.

이하 첨부된 도면을 참조로 본 발명의 바람직한 실시예를 상세히 설명하기로 한다. 이에 앞서, 본 명세서 및 청구범위에 사용된 용어나 단어는 통상적인 혹은 사전적인 의미로 한정하여 해석되어서는 안된다. 즉, 발명자는 그 자신의 발명을 가장 적합하게 설명하기 위해 용어의 개념을 임의적으로 적절히 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야 한다. 따라서, 본 명세서에 기재된 실시예와 도면에 도시된 구성은 본 발명의 가장 바람직한 일 실시예에 불과한 것으로 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원 시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형예들이 있을 수 있음을 이해하여야 한다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings. Prior to this, terms or words used in the specification and claims should not be construed as being limited to the common or dictionary meaning. That is, the inventor should be interpreted as meanings and concepts corresponding to the technical idea of the present invention on the basis of the principle that the concept of terms can be arbitrarily appropriately defined in order to best describe his invention. Therefore, the embodiments described in the specification and the configuration shown in the drawings are only the most preferred embodiments of the present invention and do not represent all of the technical idea of the present invention, various modifications that can be replaced at the time of the present application It should be understood that there may be equivalents and variations.

도 1은 본 발명에 따른 텍스트/음성 변환 기능을 갖는 멀티코덱 플레이어의 내부 시스템 구성을 개략적으로 보여주는 블록구성도이다.1 is a block diagram schematically illustrating an internal system configuration of a multicodec player having a text / voice conversion function according to the present invention.

도 1을 참조하면, 본 발명에 따른 텍스트/음성 변환 기능을 갖는 멀티코덱 플레이어(100)는 하드웨어 구성상 통상적인 멀티코덱 플레이어의 구성을 갖는다. 즉, 본 발명의 멀티코덱 플레이어(100)는 인터페이스부(101), 메모리(102), 코덱부 (103), 아날로그/디지털 변환부(104), 디지털/아날로그 변환부(105), 키조작부 (106), 표시부(107), 전원공급부(108), 제어부(109)를 포함하여 구성된다.Referring to FIG. 1, the multicodec player 100 having the text / voice conversion function according to the present invention has a configuration of a conventional multicodec player in terms of hardware. That is, the multicodec player 100 of the present invention includes an interface unit 101, a memory 102, a codec unit 103, an analog / digital conversion unit 104, a digital / analog conversion unit 105, a key operation unit ( 106, a display unit 107, a power supply unit 108, and a control unit 109.

인터페이스부(101)는 멀티코덱 플레이어(100)와 외부 컴퓨터(90) 간의 데이터 통신을 가능하게 한다. 이 인터페이스부(101)는 제어신호에 응답하여 컴퓨터 (90)와 제어부(109) 사이의 양방향 데이터 통신을 인터페이싱한다.The interface unit 101 enables data communication between the multicodec player 100 and the external computer 90. The interface unit 101 interfaces the bidirectional data communication between the computer 90 and the control unit 109 in response to the control signal.

메모리(102)에는 컴퓨터(90)로부터 다운로드받은 각종 파일과 코덱부(103)에 의해 엔코딩된 음성 데이터 파일이 저장된다. 특히, 이 메모리(102)에는 텍스트/음성 변환(TTS) 프로그램과, 그 텍스트/음성 변환 프로그램을 이용하여 디지털 음악 파일에 저장되어 있는 텍스트 정보를 음성으로 변환하도록 하는 제어 프로그램이 저장된다.The memory 102 stores various files downloaded from the computer 90 and voice data files encoded by the codec unit 103. In particular, the memory 102 stores a text / voice conversion (TTS) program and a control program for converting text information stored in a digital music file into speech using the text / voice conversion program.

코덱부(103)는 코딩(coding) 기능과 디코딩(decoding) 기능을 갖는다. 메모리(102)에 저장된 디지털 음악 파일을 재생할 때에는, 코덱부(103)는 제어부(109)로부터 제공받은 디지털 음악 파일의 압축을 해제하여 비트 스트림(bit stream) 형태의 오디오 데이터로 디코딩하여 출력한다. 또한, 코덱부(103)는 아날로그/디지털 변환기(104)로부터 디지털 음성 데이터를 전송받은 때에는 PCM(Pulse Coded Modulation) 방식이나 ADPCM(Adaptive Differential Pulse Coded Modulation) 방식으로 상기 디지털 음성 데이터를 엔코딩한다.The codec unit 103 has a coding function and a decoding function. When playing the digital music file stored in the memory 102, the codec unit 103 decompresses the digital music file provided from the control unit 109, decodes the audio data in the form of a bit stream, and outputs the decoded audio data. When the digital voice data is received from the analog / digital converter 104, the codec unit 103 encodes the digital voice data in a PCM (Pulse Coded Modulation) method or an ADPCM (Adaptive Differential Pulse Coded Modulation) method.

아날로그/디지털 변환부(104)는 외부 마이크(113)나 내장형 마이크로폰(112)을 통해 입력된 아날로그 음성 신호를 디지털 음성 데이터로 변환한다.The analog / digital converter 104 converts the analog voice signal input through the external microphone 113 or the built-in microphone 112 into digital voice data.

디지털/아날로그 변환부(105)는 제어부(109)의 제어에 의해 코덱부(103)로부터 제공되는 디코딩된 음성 데이터를 아날로그 음성 신호로 변환한다.The digital / analog converter 105 converts the decoded voice data provided from the codec unit 103 into an analog voice signal under the control of the controller 109.

키조작부(106)는 재생/정지키, 순방향/역방향키, 볼륨 업/다운키, 선택키 등의 기능키와 키홀드 온/오프용 슬라이드 키로 구성된다.The key operation unit 106 is composed of function keys such as a play / stop key, a forward / reverse key, a volume up / down key, a selection key, and a slide key for key hold on / off.

표시부(107)는 아이콘 표시창과 그래픽 도트 표시창을 갖는 액정 표시창 (LCD)과 LCD 드라이버로 구성된다. 아이콘 표시창에는 예를 들면, 배터리 잔량표시, 키홀드 표시, 플레이모드 표시, 장르(Genre) 표시, 볼륨 표시, 메모리 잔량 표시 등의 아이콘을 나타낸다. 그래픽 도트 표시창에는 곡정보, 전화번호 정보, 메모 정보 등이 표시된다. 이들 정보에 관한 데이터는 비트맵 데이터 형식으로 메모리 (102)에 저장되어 있으며, 따라서 특별한 신호 처리과정을 거치지 않고서도 바로 표시창에 비트맵 이미지로 디스플레이된다.The display unit 107 is composed of a liquid crystal display (LCD) having an icon display window and a graphic dot display window, and an LCD driver. In the icon display window, for example, icons such as battery remaining amount display, key hold display, play mode display, genre display, volume display, and memory remaining display are displayed. In the graphic dot display window, song information, telephone number information, memo information, and the like are displayed. Data relating to these information is stored in the memory 102 in the form of bitmap data, and thus is displayed as a bitmap image directly on the display window without any special signal processing.

전원공급부(108)는 하우징 내에 설치되는 건전지(117)나 직류 전원 어댑터잭 (118)을 통하여 외부로부터의 전원을 공급받도록 구성된다. 이 전원공급부(108)는 시스템의 각 구성요소들에 동작 전압(Vcc)을 제공한다.The power supply unit 108 is configured to receive power from the outside through the battery 117 or the DC power adapter jack 118 installed in the housing. This power supply 108 provides an operating voltage Vcc to each component of the system.

제어부(109)는 마이크로 컴퓨터로 구성된다. 마이크로 컴퓨터는 CPU, 시스템 램 및 롬 등을 원 칩상에 포함한다. 제어부(109)는 인터페이스부(101)를 통해 외부의 컴퓨터(90)와 접속되어 컴퓨터(90)로부터 선택된 파일을 전송받아 메모리(102)에 저장한다. 그리고, 코덱부(103)에 의해 엔코딩된 음성 데이터를 PCM이나 ADPCM 파일 형태로 메모리(102)에 저장한다. 또한, 키입력부(106)의 선택신호에 응답하여 메모리(102)에 저장된 디지털 음악 파일이나 음성 데이터 파일을 독출하여 코덱부 (103)에 전달하고, 코덱부(103)와 디지털/아날로그 변환기(105)의 동작을 제어하여 독출된 파일이 오디오 출력신호로 변환되도록 제어한다. 특히, 제어부(109)는 아날로그/디지털 변환기(104)에 인가되는 아날로그 음성 신호가 소정의 주파수로 샘플링되어 디지털 데이터로 변환되도록 제어하고, 샘플링된 디지털 데이터가 코덱부 (103)에 의해 압축되도록 제어하는 한편, PCM 데이터 혹은 ADPCM 데이터 파일로 변환되도록 제어한다. 도 1에서 참조번호 110은 내장형 마이크로폰(112)을 통해 입력되는 음성 신호를 증폭하기 위한 증폭기, 111은 외부의 마이크(113) 등의 접속을 위한 라인 입력잭, 114는 이어폰(116) 연결잭, 115는 외부의 스피커 등의 접속을 위한 라인 출력잭을 각각 나타낸다.The control unit 109 is composed of a microcomputer. The microcomputer includes a CPU, a system RAM, a ROM, and the like on a single chip. The controller 109 is connected to the external computer 90 through the interface unit 101, receives the selected file from the computer 90, and stores the selected file in the memory 102. Then, the voice data encoded by the codec unit 103 is stored in the memory 102 in the form of a PCM or ADPCM file. In addition, the digital music file or the voice data file stored in the memory 102 is read and transmitted to the codec unit 103 in response to the selection signal of the key input unit 106, and the codec unit 103 and the digital / analog converter 105 are read. Control to convert the read file into an audio output signal. In particular, the controller 109 controls the analog voice signal applied to the analog-to-digital converter 104 to be sampled at a predetermined frequency and converted into digital data, and the sampled digital data is controlled to be compressed by the codec unit 103. On the other hand, it controls to be converted into PCM data or ADPCM data file. In FIG. 1, reference numeral 110 denotes an amplifier for amplifying a voice signal input through the built-in microphone 112, 111 is a line input jack for connecting an external microphone 113, etc. 114 is an earphone 116 connecting jack, 115 Indicates a line output jack for connecting an external speaker or the like, respectively.

이상과 같은 구성의 멀티코덱 플레이어(100)와 접속되는 컴퓨터(90)는 외부의 데이터 제공장치의 일 예이다. 외부의 데이터 제공장치로 사용될 수 있는 다른 예로는 최근에 상품화된 바 있는 데이터 자동 판매 시스템(data vending system)을 들 수 있다. 상기 컴퓨터(90)는 예를 들면, 마이크로소프트사의 윈도우즈를 운영체제로 내장하고, 인터넷(80)을 통해 외부 자원과 데이터 통신이 가능하도록 하는 통신 환경이 구비된 개인용 컴퓨터 시스템이 바람직하다. 또한, 컴퓨터(90)에는 멀티코덱 플레이어(100)와 컴퓨터(90) 간에 파일의 통합적 관리 기능을 제공해주는 관리 프로그램이 설치되는 것이 바람직하다. 이 관리 프로그램에 의해, 인터넷(80)을 통하여 컴퓨터(90)에 다운로드된 음악 파일(예컨대, MP3 음악 파일) 또는 컴퓨터 (90)의 하드 디스크에 저장되어 있는 다양한 형태의 파일들이 멀티코덱 플레이어 (100)로 다운로드될 수 있고, 반대로 멀티코덱 플레이어(100)에 저장되어 있는 여러 가지 파일이 컴퓨터(90)로 업로드될 수도 있다.The computer 90 connected to the multicodec player 100 having the above configuration is an example of an external data providing apparatus. Another example that can be used as an external data providing device is a recently marketed data vending system. The computer 90 may be, for example, a personal computer system having a communication environment in which Windows of Microsoft Corporation is installed as an operating system and enabling data communication with external resources through the Internet 80. In addition, the computer 90 is preferably provided with a management program that provides an integrated management function of the file between the multi-codec player 100 and the computer 90. By this management program, music files (eg, MP3 music files) downloaded to the computer 90 via the Internet 80 or various types of files stored in the hard disk of the computer 90 are stored in the multicodec player 100. ), And conversely, various files stored in the multicodec player 100 may be uploaded to the computer 90.

한편, 도 2는 본 발명에 따른 텍스트/음성 변환 기능을 갖는 멀티코덱 플레이어에 채용되는 텍스트/음성 변환 시스템의 개략적인 블록 구성도이다.On the other hand, Figure 2 is a schematic block diagram of a text / voice conversion system employed in a multi-codec player having a text / voice conversion function according to the present invention.

도 2를 참조하면, 텍스트/음성 변환 시스템은 언어처리부(201), 운율처리부 (202), 신호처리부(203) 및 합성단위 데이터 베이스(204)로 구성된다.Referring to FIG. 2, the text / voice conversion system includes a language processor 201, a rhyme processor 202, a signal processor 203, and a synthesis unit database 204.

언어처리부(201)는 텍스트를 음소열로 변환하고, 운율 정보를 추정하여 이를 심볼화한다. 여기서, 운율 정보의 심볼은 구문구조 분석결과를 이용한 구, 절, 경계, 단어 내부의 액센트 위치, 문형 등으로부터 추정된다.The language processor 201 converts the text into a phoneme string, estimates the rhyme information, and symbolizes it. Here, the symbols of the rhyme information are estimated from phrases, clauses, boundaries, accent positions in the words, sentence patterns, etc. using the syntax structure analysis results.

운율처리부(202)는 심볼화된 운율 정보로부터 규칙 및 테이블을 이용하여 운율 제어 파라미터의 값을 계산한다. 운율 제어 파라미터로는 음소의 지속시간, 피치 패턴, 에너지 패턴, 쉼 구간 정보가 있다.The prosody processor 202 calculates the value of the prosody control parameter by using a rule and a table from the symbolized prosody information. Rhyme control parameters include phoneme duration, pitch pattern, energy pattern, and rest period information.

신호처리부(203)는 합성 단위 데이터 베이스(204) 내의 데이터와 운율 제어 파라미터를 이용하여 합성음을 생성한다.The signal processor 203 generates a synthesized sound by using the data in the synthesis unit database 204 and the rhythm control parameter.

합성 단위 데이터 베이스(204)는 음성 합성 알고리즘에 사용되는 데이터 베이스로서 상기 신호처리부(203)로 필요한 데이터를 전송한다.The synthesis unit database 204 transmits necessary data to the signal processor 203 as a database used for a speech synthesis algorithm.

이상과 같은 구성의 텍스트/음성 변환 시스템은 하나의 프로그램으로서 컴퓨터나 음악 재생기기 등에 설치되어 해당 기기의 제어부의 제어명령에 따라 시스템에 입력된 텍스트를 음성으로 변환해주는 역할을 한다.The text / voice conversion system having the above configuration is installed as a program in a computer or a music player, and serves to convert text input into the system according to a control command of a controller of the corresponding device.

그러면, 이상과 같은 구성을 갖는 본 발명에 따른 텍스트/음성 변환 기능을 갖는 멀티코덱 플레이어의 동작에 대해 도 1 내지 도 3을 참조하면서 간략히 설명해 보기로 한다.Next, an operation of the multicodec player having the text / voice conversion function according to the present invention having the above configuration will be briefly described with reference to FIGS. 1 to 3.

본 발명에 따른 텍스트/음성 변환 기능을 갖는 멀티코덱 플레이어에 의해 디지털 음악 파일을 재생하기 위해서는 컴퓨터를 통해 디지털 음악 파일을 다운로드 받은 후, 그 다운로드 받은 음악 파일을 본 발명의 멀티코덱 플레이어로 전송하여 재생하거나, MP3 파일 자판기로부터 MP3 음악 파일을 직접 다운로드 받아 재생하는 방법이 있다. 본 실시예에서는 컴퓨터를 통해 디지털 음악 파일을 다운로드 받아 그것을 본 발명의 플레이어로 전송하여 재생하는 경우를 예로 들어 설명하기로 한다.In order to play a digital music file by a multi-codec player having a text / voice conversion function according to the present invention, after downloading the digital music file through a computer, the downloaded music file is transferred to the multi-codec player of the present invention for playback. Alternatively, there is a method of directly downloading and playing MP3 music files from an MP3 file vending machine. In the present embodiment, a case where a digital music file is downloaded through a computer, transferred to a player of the present invention, and played is described as an example.

도 3은 본 발명에 따른 텍스트/음성 변환 기능을 갖는 멀티코덱 플레이어에 의해 디지털 음악 파일을 재생하는 과정을 보여주는 흐름도이다.3 is a flowchart illustrating a process of playing a digital music file by a multicodec player having a text / voice conversion function according to the present invention.

도 3을 참조하면, 인터넷(80)을 통해 제공되는 디지털 음악을 컴퓨터(90)를 통해 다운로드 받고자 할 경우, 일반적으로 사용자(음악 청취자)는 먼저 컴퓨터 (90)를 통한 인터넷 상의 디지털 음악 제공 사이트에 접속하여 청취를 원하는 음악 파일을 다운로드 받게 된다. 그런 후, 컴퓨터(90)와 멀티코덱 플레이어(100)를 연결하는 전용 프로그램을 이용하여 다운로드받은 디지털 음악 파일을 멀티코덱 플레이어(100)로 전송한다.Referring to FIG. 3, when a user wants to download digital music provided through the Internet 80 through the computer 90, a user (music listener) generally first visits a digital music providing site on the Internet through the computer 90. You will be connected to the music file you want to listen to. Thereafter, the downloaded digital music file is transmitted to the multicodec player 100 using a dedicated program connecting the computer 90 and the multicodec player 100.

이렇게 하여, 컴퓨터(90)로부터 멀티코덱 플레이어(100)로 디지털 음악 파일이 전송되면, 제어부(109)는 그 디지털 음악 파일 내에 음악과 함께 저장되어 있는 텍스트 정보(예를 들면, 노래 제목, 가수 이름, 노래 가사, 노래에 관한 간략한 설명 등)를 디지털 음악 파일로부터 읽어들이게 된다(단계 301). 그런 후, 제어부 (109)는 메모리(102)에 저장되어 있는 텍스트/음성 변환 프로그램을 불러내어 실행시키게 된다. 즉, 텍스트 형태의 노래 정보가 텍스트/음성 변환 프로그램의 실행을 위한 입력 요소로 제공된다. 텍스트 정보가 입력되면, 언어처리부(201)(도 2 참조)는 입력된 텍스트를 음소열로 변환하고, 운율 정보를 추정하여 이를 심볼화한다. 여기서, 운율 정보의 심볼은 구문구조 분석결과를 이용한 구, 절, 경계, 단어 내부의 액센트 위치, 문형 등으로부터 추정된다. 언어처리부(201)에 의해 텍스트가 심볼화되면, 운율처리부(202)는 그 심볼화된 운율 정보로부터 규칙 및 테이블을 이용하여 운율 제어 파라미터의 값을 계산한다. 이때, 운율 제어 파라미터로는 음소의 지속시간, 피치 패턴, 에너지 패턴, 쉼 구간 정보 등이 이용된다. 운율처리부(202)에 의해 운율 제어 파라미터의 값이 계산되면, 신호처리부(203)는 합성 단위 데이터 베이스(204) 내의 데이터와 상기 운율 제어 파라미터를 이용하여 합성음을 생성한다. 즉, 텍스트 정보가 음성 정보로 변환되어 생성되는 것이다(단계 302).In this way, when the digital music file is transmitted from the computer 90 to the multicodec player 100, the control unit 109 controls the text information (for example, the song title, the singer's name) stored with the music in the digital music file. Song lyrics, a brief description of the song, etc.) are read from the digital music file (step 301). Thereafter, the controller 109 retrieves and executes the text / voice conversion program stored in the memory 102. In other words, the song information in the form of text is provided as an input element for executing the text / voice conversion program. When text information is input, the language processing unit 201 (see FIG. 2) converts the input text into a phoneme string, estimates rhyme information, and symbolizes it. Here, the symbols of the rhyme information are estimated from phrases, clauses, boundaries, accent positions in the words, sentence patterns, etc. using the syntax structure analysis results. When the text is symbolized by the language processor 201, the rhyme processor 202 calculates the value of the rhyme control parameter from the symbolized rhyme information using a rule and a table. In this case, as the rhyme control parameter, duration of the phoneme, pitch pattern, energy pattern, and rest period information are used. When the value of the rhyme control parameter is calculated by the rhyme processor 202, the signal processor 203 generates a synthesized sound using the data in the synthesis unit database 204 and the rhyme control parameter. That is, text information is converted into voice information and generated (step 302).

이렇게 하여 음성 정보가 생성되면, 제어부(109)는 그 생성된 음성 정보를 원래 전송받은 디지털 음악 파일과 동일 어드레스로 메모리(102)에 저장한다(단계 303). 이때, 본 발명의 멀티코덱 플레이어의 설계자에 의해 작성된 제어 프로그램에 의해 음성 정보가 먼저 저장되고, 디지털 음악 파일이 나중에 저장된다.When the voice information is generated in this way, the control unit 109 stores the generated voice information in the memory 102 at the same address as the digital music file originally received (step 303). At this time, the voice information is stored first by the control program written by the designer of the multicodec player of the present invention, and the digital music file is stored later.

한편, 이상과 같이 디지털 음악 파일에 함께 저장되어 있는 텍스트 정보를 음성 정보로 생성하는 경우 외에, 임의의 다른 정보를 입력하고자 할 때에는, 사용자가 그 정보를 외부 마이크(113)나 내장형 마이크로폰(112)을 이용하여 음성으로 녹음함으로써 가능해 진다. 외부 마이크(113)나 내장형 마이크로폰(112)을 통해 음성 신호가 입력되면, 그 입력된 음성 신호는 아날로그/디지털 변환기(104)로 전송되고, 아날로그/디지털 변환기(104)는 입력된 아날로그 음성 신호를 소정의 주파수로 샘플링하여 디지털 음성 데이터로 변환하여 출력한다. 디지털 음성 데이터가 코덱부(103)로 전송되면, 코덱부(103)는 그 전송받은 디지털 음성 데이터를 압축하는 한편 PCM 방식이나 ADPCM 방식으로 엔코딩하여 PCM 데이터 혹은 ADPCM 데이터 파일로 변환한다. 그러면, 제어부(109)는 그 변환된 파일을 메모리(102)에 저장한다.On the other hand, when the user wants to input any other information besides generating the text information stored together in the digital music file as voice information as described above, the user sends the information to the external microphone 113 or the built-in microphone 112. It is possible to record by voice using. When a voice signal is input through the external microphone 113 or the built-in microphone 112, the input voice signal is transmitted to the analog / digital converter 104, and the analog / digital converter 104 receives the input analog voice signal. Sampling at a predetermined frequency is converted into digital voice data and output. When the digital voice data is transmitted to the codec unit 103, the codec unit 103 compresses the received digital voice data and encodes the received digital voice data in a PCM method or an ADPCM method to convert the PCM data or the ADPCM data file. Then, the control unit 109 stores the converted file in the memory 102.

한편, 사용자(음악 청취자)가 저장된 디지털 음악 파일을 재생하기 위해 키조작부(106)의 재생키(미도시)를 누르면, 제어부(109)는 그 선택신호에 응답하여 메모리(102)에 저장되어 있는 음성 정보 및 디지털 음악 파일을 독출하여 코덱부 (103)로 전송한다. 그러면, 코덱부(103)는 그 전송받은 음성 정보 및 디지털 음악 파일의 압축을 해제하여 디지털 오디오 데이터로 디코딩하여 출력한다. 그러면, 디지털/아날로그 변환기(105)는 코덱부(103)로부터 제공되는 디코딩된 디지털 오디오 데이터를 아날로그 오디오 신호로 변환하여 출력한다(단계 304). 이로써, 사용자(음악 청취자)는 최종적으로 이어폰(116)이나 라인 출력잭(115)을 통해 연결된 별도의 스피커(미도시)를 통해 디지털 음악을 청취할 수 있게 된다. 이때, 이어폰(116)이나 별도의 스피커를 통해 디지털 음악이 출력될 시, 해당 디지털 음악과 관련된 텍스트 정보의 음성화된 정보도 출력되는데, 음성 정보가 먼저 출력된 후, 디지털 음악이 출력된다. 여기서, 이와 같이 음성 정보가 먼저 출력된 후에 디지털 음악이 출력될 수도 있지만, 본 발명의 멀티코덱 플레이어의 작동을 제어하는 제어 프로그램의 설계자에 의해 제어 프로그램의 설계를 약간 변경함으로써 디지털 음악이 먼저 출력된 후 음성 정보가 나중에 출력되게 할 수도 있고, 디지털 음악이 출력되는 도중에 음성 정보가 출력되게 할 수도 있다.On the other hand, when the user (music listener) presses the play key (not shown) of the key control unit 106 to play the stored digital music file, the control unit 109 is stored in the memory 102 in response to the selection signal. Audio information and digital music files are read out and transmitted to the codec unit 103. Then, the codec unit 103 decompresses the received voice information and the digital music file, decodes the digital audio data, and outputs the decoded audio data. Then, the digital-to-analog converter 105 converts the decoded digital audio data provided from the codec unit 103 into an analog audio signal and outputs it (step 304). As a result, the user (music listener) can finally listen to digital music through a separate speaker (not shown) connected through the earphone 116 or the line output jack 115. At this time, when digital music is output through the earphone 116 or a separate speaker, the voiced information of the text information related to the digital music is also output. The voice information is first output, and then the digital music is output. Here, although the digital music may be output after the audio information is output in this manner, the digital music is first output by slightly changing the design of the control program by the designer of the control program controlling the operation of the multicodec player of the present invention. The voice information may be output later, or the voice information may be output while digital music is output.

이상에 의해 사용자(음악 청취자)는 디지털 음악을 감상하는 한편 그 음악과 관련된 텍스트화된 정보(노래 제목, 가수 이름, 노래 가사, 노래에 관한 간략한 설명 등)를 음성으로 들을 수 있게 되는 것이다.By the above, the user (music listener) can listen to digital music while listening to the textual information related to the music (song title, singer name, song lyrics, brief description of the song, etc.).

이상과 같이, 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 그와 같은 것에 한정되지 않으며, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 본 발명의 기술적 사상과 특허청구범위의 균등범위 내에서 다양한 수정 및 변형이 가능함은 물론이다.As described above, although the present invention has been described by means of a limited embodiment and drawings, the present invention is not limited to the above, and the person of ordinary skill in the art to which the present invention pertains should have Of course, various modifications and variations are possible within the scope of the claims.

이상의 설명에서와 같이 본 발명에 따른 텍스트/음성 변환 기능을 갖는 멀티코덱 플레이어는 디지털 음악을 재생할 시 디지털 음악은 물론 그 음악과 관련된 텍스트 정보를 음성으로 변환하여 재생하여 주므로, 사용자(청취자)는 음악을 감상함과 동시에 음악과 관련된 정보(노래 제목, 가수 이름, 노래 가사, 노래에 관한 간략한 설명 등)를 들을 수 있어, 그 음악에 대한 이해의 폭을 더욱 넓힐 수 있고, 음악 감상에 대한 다른 차원의 묘미를 느낄 수 있다.As described above, the multi-codec player having the text / voice conversion function according to the present invention converts not only the digital music but also text information related to the music to the voice when the digital music is played, so that the user (listener) plays the music. As you listen to music, you can listen to music-related information (song titles, singer names, song lyrics, brief descriptions of the song, etc.), which can help you broaden your understanding of the music and take another dimension to listening to music. I can feel the zest.

Claims (2)

제어부, 메모리, 코덱부, 아날로그/디지털 변환기, 디지털/아날로그 변환기를 구비하는 멀티코덱 플레이어에 있어서,In the multi-codec player having a control unit, a memory, a codec unit, an analog-to-digital converter, and a digital-to-analog converter, 상기 메모리에는 디지털 음악 파일에 저장되어 있는 음악과 관련된 텍스트 정보를 텍스트/음성 변환 프로그램을 이용하여 음성으로 변환하여 저장한 후, 디지털 음악 재생시 텍스트 정보의 음성 변환 정보도 함께 재생하도록 하는 제어 프로그램이 저장되어 있는 것을 특징으로 하는 텍스트/음성 변환 기능을 갖는 멀티코덱 플레이어.The memory program includes a control program that converts and stores text information related to music stored in a digital music file into voice using a text / voice conversion program, and also plays back voice conversion information of the text information during digital music playback. A multicodec player with text to speech conversion, characterized in that it is stored. 제 1항에 있어서,The method of claim 1, 상기 텍스트 정보의 음성 변환 정보는 노래 제목, 가수 이름, 노래 가사, 노래에 관한 간략한 설명 중의 적어도 어느 하나를 포함하는 것을 특징으로 하는 텍스트/음성 변환 기능을 갖는 멀티코덱 플레이어.And the voice conversion information of the text information includes at least one of a song title, a singer's name, song lyrics, and a brief description of the song.
KR10-2000-0074469A 2000-12-08 2000-12-08 Multicodec player having text-to-speech conversion function KR100379995B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR10-2000-0074469A KR100379995B1 (en) 2000-12-08 2000-12-08 Multicodec player having text-to-speech conversion function

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR10-2000-0074469A KR100379995B1 (en) 2000-12-08 2000-12-08 Multicodec player having text-to-speech conversion function

Publications (2)

Publication Number Publication Date
KR20010016404A true KR20010016404A (en) 2001-03-05
KR100379995B1 KR100379995B1 (en) 2003-04-11

Family

ID=19702822

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2000-0074469A KR100379995B1 (en) 2000-12-08 2000-12-08 Multicodec player having text-to-speech conversion function

Country Status (1)

Country Link
KR (1) KR100379995B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100464557B1 (en) * 2002-06-12 2005-01-03 이창원 Wireless device which is able to convert output signal according to the input condition

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100685511B1 (en) * 2005-04-08 2007-02-26 김성규 Voice processing apparatus for sounder

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR0175251B1 (en) * 1992-05-27 1999-04-01 정용문 Automated response system using phoneme conversion method
US5640590A (en) * 1992-11-18 1997-06-17 Canon Information Systems, Inc. Method and apparatus for scripting a text-to-speech-based multimedia presentation
JPH097357A (en) * 1995-06-20 1997-01-10 Matsushita Electric Ind Co Ltd Sound processor for audio recording apparatus
JPH1031492A (en) * 1996-07-15 1998-02-03 Matsushita Electric Ind Co Ltd Audio device
KR100240637B1 (en) * 1997-05-08 2000-01-15 정선종 Syntax for tts input data to synchronize with multimedia
KR100379450B1 (en) * 1998-11-17 2003-05-17 엘지전자 주식회사 Structure for Continuous Speech Reproduction in Speech Synthesis Board and Continuous Speech Reproduction Method Using the Structure
KR100360121B1 (en) * 1999-03-29 2002-11-04 (주) 헤세드테크놀러지 Apparatus for reproducing digital voice
KR20000067015A (en) * 1999-04-22 2000-11-15 윤장진 Communication audio system for vehicles

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100464557B1 (en) * 2002-06-12 2005-01-03 이창원 Wireless device which is able to convert output signal according to the input condition

Also Published As

Publication number Publication date
KR100379995B1 (en) 2003-04-11

Similar Documents

Publication Publication Date Title
JP6645956B2 (en) System and method for portable speech synthesis
US6985913B2 (en) Electronic book data delivery apparatus, electronic book device and recording medium
EP1736961B1 (en) System and method for automatic creation of digitally enhanced ringtones for cellphones
US7928310B2 (en) Systems and methods for portable audio synthesis
US5834670A (en) Karaoke apparatus, speech reproducing apparatus, and recorded medium used therefor
US20140046667A1 (en) System for creating musical content using a client terminal
KR100379995B1 (en) Multicodec player having text-to-speech conversion function
KR100506228B1 (en) Mobile terminal and method for editing and playing music
KR100329589B1 (en) Method and apparatus for playing back of digital audio by syllables
KR100350505B1 (en) Method for editing of music file in portable wireless terminal
JP3934071B2 (en) Karaoke performance device that generates sound effects through the user&#39;s mobile phone
KR100628053B1 (en) Wireless communication terminal with auto-generation of digital music information and method of auto-generation of digital music information using same
KR20040062317A (en) Method for guiding additional information for audio data file
JP2007256815A (en) Voice-reproducing apparatus, voice-reproducing method, and voice reproduction program
KR20040095840A (en) Method and system for providing services of converting a voice source for a ring tone
KR200346787Y1 (en) Control Module of Media Player by Serial Communication
KR20080060457A (en) Portable multimedia terminal for text to speech function
JP2008304670A (en) Electronic sound source device
KR20020074816A (en) Portabl electronic book having multi-function and control method of the same
KR100837542B1 (en) System and method for providing music contents by using the internet
KR100563320B1 (en) Language study apparatus having a unity memory and the controlling method
JP2003122384A (en) Portable terminal device
KR100650938B1 (en) A noraebang system on digital audio devices and controlling method thereof
TW200427297A (en) Speech and music reproduction apparatus
JP2005156946A (en) Music reproducing device, voice reproducing device, method for reproducing music and voice and its program

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
N231 Notification of change of applicant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20080401

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee