KR20030069419A

KR20030069419A - 음악 부분을 자동으로 선별해 저장하는 디지털 음악 재생장치 및 그 방법

Info

Publication number: KR20030069419A
Application number: KR1020020009044A
Authority: KR
Inventors: 안호성
Original assignee: 안호성
Priority date: 2002-02-20
Filing date: 2002-02-20
Publication date: 2003-08-27
Also published as: WO2003071537A1; CN1633690A; KR100472904B1; US20050169114A1; AU2003207069A1; JP2005518560A; EP1476866A1; EP1476866A4

Abstract

본 발명은 수신되는 라디오 방송 컨텐츠 중 음악 부분만을 자동으로 선별해 사용자의 녹음 선택에 따라 그 음악의 처음부터 끝까지 저장하고 이후 재생할 수 있는 음악 부분을 자동으로 선별해 저장하는 디지털 음악 재생 장치 및 그 방법에 관한 것이다.

본 발명은 튜너에서 방송 신호를 음향 출력부로 출력함과 더불어 DSP로 인가하면, DSP는 상기 방송 신호를 디지털 데이터로 변환해 음악 추출부로 인가하고, 음악 추출부는 음악 추출 알고리즘에 따라 상기 디지털 데이터 중에서 음악 데이터만을 추출하며, 마이크로 프로세서는 추출한 상기 음악 데이터의 처음과 끝을 인식하여 음악 데이터 저장부의 임시 영역에 임시로 저장하고 있다가, 현재 출력되는 음악을 저장하는 명령이 입력되면, 상기 음악 데이터 저장부의 임시 영역에서 확정 영역으로 이전하여 저장하고, 그 저장 상태를 확정하여 유지한다.

본 발명에 의하면, 사용자가 청취하는 음악의 녹음 저장을 위해 녹음 버튼을 누르는 동작과 음악이 끝나는 시점에 다시 녹음 버튼을 누르는 번거로움과 녹음을 위한 상당한 주의 집중 동작의 번거로움을 해결할 수 있다.

Description

음악 부분을 자동으로 선별해 저장하는 디지털 음악 재생 장치 및 그 방법{Digital Recorder for Selectively Storing Only a Music Section Out of Radio Broadcasting Contents and Method thereof}

본 발명은 음악 부분을 자동으로 선별해 저장하는 디지털 음악 재생 장치 및 그 방법에 관한 것으로, 더욱 상세하게는 수신되는 라디오 방송 컨텐츠 중 음악 부분만을 자동으로 선별해 사용자의 녹음 선택에 따라 그 음악의 처음부터 끝까지 자동으로 선별해 저장하는 디지털 음악 재생 장치 및 그 방법에 관한 것이다.

최근에 음악을 듣기 좋아하는 사람들 사이에서는 기존의 아날로그 음악 재생기에 비하여 고품질의 음악을 들을 수 있는 디지털 음악 재생기가 많이 사용되고 있다. 디지털 음악 재생기는 디지털 음악 파일을 재생하는 장치로서, 음악의 읽기 및 쓰기가 가능한 비휘발성 디지털 메모리(미디어 카드)를 구비하여 음악 데이터를 저장할 수 있기 때문에 매우 작은 크기로 구현되는 특징이 있다. 이러한 장점으로 인하여 일명 'MP3(MPEG Audio-Layer3) 플레이어'라 불리는 휴대용 디지털 음악 재생기가 급속히 보급되고 있는 추세에 있다. 또한, 최근 MP3 플레이어는 저장된 음악 데이터를 들을 수 있을 뿐만 아니라 실시간으로 FM 라디오 음악 방송을 들을 수 있도록 라디오 기능도 구비하고 있는 것이 일반적이다.

도 1은 종래의 라디오 기능을 구비한 MP3 플레이어의 구성을 나타낸 블럭 구성도이다.

종래 MP3 플레이어(100)는 안테나(110)와, 튜너(120), 음향 출력부(130),DSP(Digital Signal Processor: 140), 외부기기 접속부(150), 컨트롤러(160), 음악 데이터 저장부(170), 표시부(180), 키조작부(190) 등으로 구성된다.

안테나(110)는 공중파 신호를 수신하고, 튜너(120)는 안테나(110)로 수신되는 공중파 신호 중에서 현재 맞추어진 채널에 해당하는 라디오 신호를 수신하여 출력한다. 음향 출력부(130)는 튜너(120)에서 인가되는 아날로그 음향 신호를 필터링하거나 증폭하여 가청음으로 출력한다. DSP(디지털 음향 처리부: 140)는 튜너(120)에서 인가되는 라디오 아날로그 신호를 디지털 데이터로 변환하거나 디지털 음악 데이터를 아날로그 신호로 변환하여 출력한다. 또한, DSP(140)는 인코딩된 음악 데이터를 디코딩하여 아날로그 신호로 변환 출력한다. 외부기기 접속부(150)는 MP3 음악 데이터를 다운로드하기 위해 외부기기(예컨대, 컴퓨터)와 접속한다. 컨트롤러(160)는 MP3 음악 데이터의 저장 및 출력 또는 라디오 방송 신호의 수신 및 출력을 제어한다. 음악 데이터 저장부(170)는 MP3 파일로 압축된 다수의 음악 데이터가 저장되는 플래시 메모리 또는 하드 디스크 형태의 저장매체로서, 예컨대, 64 M 바이트 또는 128 M 바이트의 경우, 대략 16 내지 32 곡의 MP3 음악 파일 데이터를 기록 저장시킬 수 있다. 표시부(180)는 장치의 동작 상태를 표시하며, 키조작부(190)는 라디오 방송 채널을 선택하거나 MP3 음악 파일을 선택하고 출력하는데 필요한 입력 동작을 수행하기 위한 것이다.

즉, 사용자가 상기와 같이 구성된 MP3 플레이어(100)를 조작하여 음악을 듣고자 하는 경우, 라디오 기능을 선택하여 실시간으로 원하는 채널의 라디오 음악 방송을 선택하여 듣는다거나, 음악 데이터 저장부(170)에 저장되어 있는 음악 데이터 중 청취하기 원하는 음악 데이터를 선택하여 청취한다.

특히, 라디오 기능을 선택하여, 예컨대, FM 음악 방송을 청취하는 중 녹음 저장을 수행할 때는 키조작부(190)에 구비된 녹음 버튼(미도시)을 눌러서 현재 듣고 있는 음악의 녹음 동작을 수행한다. 이때, 컨트롤러(160)는 DSP(130)를 제어하여 현재 튜너(120)에서 출력되는 음악 신호를 디지털 데이터로 변환하여 음악 데이터 저장부(170)에 저장한다. 그리고, 사용자는 음악이 끝나는 시점에 다시 녹음 버튼을 누름으로써 녹음을 종료하게 된다. 이를 위해 사용자는 음악의 시작과 끝 부분을 잘 인식하기 위해 상당한 집중을 하여야 한다.

그럼에도 불구하고, 사용자가 라디오 음악 방송을 청취하는 중에 녹음 저장을 수행하는 경우, 음악 방송에서 방송하는 음악에 대해 소개가 있은 후에 음악이 방송되면, 사용자는 녹음할 준비를 하고 있다가 녹음 동작을 수행할 수 있지만, 대부분은 사용자가 그 음악의 처음 부분을 청취한 후 녹음을 해야겠다는 판단을 내려 녹음 동작을 수행하므로, 실시간으로 수신되는 음악은 어느 정도 경과된 후부터 음악 데이터 저장부(170)에 저장된다. 따라서, 사용자가 녹음 저장을 종료한 후 다시 재생하여 청취할 때는 그 음악의 처음 부분이 어느 정도 경과된 부분부터 청취하게 된다. 이에, 종래 MP3 플레이어(100)로 라디오를 청취하여 음악을 저장하고자 하는 경우, 어느 정도 경과한 뒤라도 그 음악의 처음 부분부터 저장하여 다시 재생할 수 있는 기능이 요구되어 왔다.

상기한 요구에 부응하기 위해 본 발명은, 사용자가 수신되는 방송 신호 중음악 부분만을 선별해 수동으로 저장하는 불편함을 해결하기 위해 디지털 음악 재생 장치로 수신되는 라디오 방송 컨텐츠 중 음악 부분만을 자동으로 선별해 언제든지 사용자의 선택에 따라 방송되는 음악의 처음 부분부터 저장하고 이후 재생할 수 있는 음악 부분을 자동으로 선별해 저장하는 디지털 음악 재생 장치 및 그 방법을 제공함에 목적이 있다.

도 1은 종래의 라디오 기능을 구비한 MP3 플레이어의 구성을 나타낸 블럭 구성도,

도 2는 본 발명의 바람직한 실시예에 따라 음악 부분을 선별해 저장하는 디지털 음악 재생 장치의 구성을 나타낸 블럭 구성도,

도 3은 본 발명의 제1 실시예에 따라 인공 신경망으로 이루어진 음악 추출부의 내부 구성을 나타낸 블럭 구성도,

도 4는 본 발명의 제1 실시예에 따라 인공 신경망을 이용해 음악 부분을 자동으로 선별해 저장하는 방법을 나타낸 순서도,

도 5는 본 발명의 제2 실시예에 따라 주파수 분석을 이용한 음악 추출부의 내부 구성을 나타낸 블럭 구성도,

도 6은 묵음(Mute)이 포함된 음악 신호의 구성을 나타낸 도면,

도 7은 본 발명의 제2 실시예에 따라 주파수 분석을 이용해 음악 부분을 자동으로 선별해 저장하는 방법을 나타낸 순서도,

도 8은 본 발명의 제3 실시예에 따라 HMM을 이용한 음악 추출부의 내부 구성을 나타낸 블록 구성도,

도 9는 최대 확률을 가지는 상태들의 순서를 결정하는 비터비 알고리즘의 원리를 나타낸 도면,

도 10은 본 발명의 제3 실시예에 따라 HMM을 이용해 음악 부분을 자동으로 선별해 저장하는 방법을 나타낸 순서도이다.

< 도면의 주요 부분에 대한 부호의 설명 >

100 : MP3 플레이어110 : 안테나

120 : 튜너130 : 음향 출력부

140, 210 : DSP150 : 외부기기 접속부

160 : 컨트롤러170 : 음악 데이터 저장부

180 : 표시부190 : 키조작부

200 : 디지털 음악 재생 장치211 : ADC

212 : DSP 코어213 : DAC

214 : 인코더215 : DSP 프로그램부

216 : 디코더220 : 음악 추출부

232 : 방송키234 : 녹음키

500 : 주파수 분석 이용 음악 추출부510 : 음향 데이터 연산부

520 : 비음악 제거부530 : 음악 시종 판단부

540 : 스펙트럼 분석부800 : HMM 이용 음악 추출부

810 : 음향 입력부820 : MLP(다층 퍼셉트론)

830 : 특징 추출부840 : HMM 선별부

상기한 목적을 달성하기 위해 본 발명은, 방송 신호를 수신하여 선국하는 튜너, 선국된 방송 신호를 가청음으로 출력하는 음향 출력부, 음악 데이터를 임시로 저장하는 임시 저장 영역과 확정하여 저장하는 확정 저장 영역을 구비하는 음악 데이터 저장부, 장치의 동작 상태를 표시하는 표시부를 포함하고, 상기 방송 신호 중 음악 신호만을 추출해 음악 데이터로 저장하는 디지털 음악 녹음 재생 장치로서, 상기 방송 신호를 디지털 데이터로 변환하거나 디지털 데이터를 아날로그 신호로 변환하며, 디지털 데이터를 음악 데이터로 압축하여 인코딩(Encoding)하거나 압축된 디지털 데이터를 디코딩하여 출력하는 신호 처리부, 상기 신호 처리부에서 출력된 상기 디지털 데이터를 음악 추출 알고리즘에 따라 음악 데이터와 비음악 데이터로 분리해 음악 데이터만을 추출하고, 추출한 상기 음악 데이터의 처음과 끝을 인식하는 시종 데이터를 생성해 출력하는 음악 추출부와, 상기 디지털 음악 재생 장치의 동작 모드를 라디오 방송을 수신하는 모드로 전환하는 방송키와 방송되는 음악 신호에 대해 녹음 저장을 실행하도록 하는 녹음키가 구비된 키입력부, 및 상기 신호 처리부를 제어하여 상기 음악 추출부에 의해 추출된 음악 데이터만을 상기 음악 데이터 저장부의 임시 저장 영역에 임시로 저장하고, 상기 녹음키의 입력이 있는 경우 상기 임시 저장 영역에 임시로 저장된 상기 음악 데이터를 상기 확정 저장 영역으로 이전하여 저장하고 그 저장 상태를 확정하여 유지하는 마이크로 프로세서를 포함하는 것을 특징으로 하는 디지털 음악 녹음 재생 장치를 제공한다.

또한, 상기한 목적을 달성하기 위해 본 발명은, 방송 신호를 수신하여 선국하는 튜너, 선국된 방송 신호를 가청음으로 출력하는 음향 출력부, 상기 방송 신호를 디지털 데이터로 변환하거나 디지털 데이터를 아날로그 신호로 변환하며, 디지털 데이터를 음악 데이터로 압축하여 인코딩(Encoding)하거나 압축된 디지털 데이터를 디코딩하여 출력하는 DSP(Digital Signal Processor: 디지털 신호 처리 프로세서), 상기 DSP에서 인가된 디지털 데이터 중 음악 데이터만을 추출하는 음악 추출부, 음악 데이터를 저장하는 음악 데이터 저장부, 장치의 동작 상태를 표시하는 표시부, 및 라디오 방송을 수신하는 모드로 전환하거나 방송되는 음악 신호에 대해 녹음 저장을 실행하도록 하는 명령을 입력하는 키입력부를 구비하는 디지털 음악 재생 장치의 음악 부분 선별 저장 방법으로서, (a) 상기 튜너에서 방송 신호를 음향 출력부로 출력함과 더불어 상기 DSP로 인가하는 단계, (b) 상기 DSP에서 상기 방송 신호를 디지털 데이터로 변환해 상기 음악 추출부로 출력하는 단계, (c) 상기 음악 추출부가 음악 추출 알고리즘에 따라 상기 디지털 데이터 중에서 음악 데이터만을 추출하는 단계, (d) 추출한 상기 음악 데이터의 처음과 끝을 인식하여 상기 음악 데이터 저장부에 임시로 저장하는 단계, (e) 상기 음향 출력부로 현재 출력되는 음악을 저장하는 명령이 상기 키입력부에 의해 입력되었는지를 판단하는 단계,(f) 상기 음악 데이터 저장부에 임시로 저장되어 있는 상기 음악 데이터의 저장 상태를 확정하여 유지하는 단계를 포함하는 것을 특징으로 하는 디지털 음악 재생 장치의 음악 부분 선별 저장 방법을 제공한다.

이하, 첨부한 도면을 참조하여 본 발명에 따른 바람직한 실시예를 상세하게 설명한다.

도 2는 본 발명의 바람직한 실시예에 따라 음악 부분을 선별해 저장하는 디지털 음악 재생 장치의 구성을 나타낸 블럭 구성도이다. 도 2에 도시된 블럭 중 도 1과 동일한 부분에 대해서는 동일한 참조 번호를 붙이고 그 상세한 설명은 이미 설명하였으므로 생략한다.

도 2에 예시한 본 발명에 따른 디지털 음악 재생 장치(200)는 DSP(210), 음악 추출부(220), 키입력부(230), 마이크로 프로세서(240), 프로그램 메모리(250)를 포함한다.

DSP(210)는 아날로그 신호를 디지털 신호로 변환하는 ADC(Analog to Digital Converter: 211)와, DSP(210)의 전반적인 동작을 제어하는 DSP 코어(Core)(212), 디지털 신호를 아날로그 신호로 변환하는 DAC(Digital to Analog Converter: 213), 아날로그 신호를 예컨대, MP3 파일의 데이터로 압축하여 인코딩(Encoding)하는 인코더(214), 마이크로 프로세서(240)의 제어 명령에 따라 튜너(120)에서 인가되는 방송 신호를 디지털 데이터로 변환하거나 인코딩하여 압축하고, 압축된 디지털 데이터를 디코딩하여 출력하는 프로그램이 저장된 DSP 프로그램부(215), 압축된 디지털 데이터를 디코딩하는 디코더(216)를 포함하여 구성된다. 물론, 같은 구성으로DSP(210) 대신에 하드웨어(Hardware) 방식의 신호 처리부로 구성할 수도 있다.

음악 추출부(220)는 DSP(210)에서 인가되는 디지털 신호를 자체 음악 추출 알고리즘에 따라 음악 데이터와 비음악 데이터로 분리해, 비음악 데이터는 제거하고 음악 데이터만을 추출하는 기능을 수행한다. 이러한 기능을 수행하기 위해 음악 추출부(210)는 인공 신경망과 주파수 분석 및 은닉 마르코프 모델(HMM: Hidden Markov Model, 이하 'HMM'이라 칭함) 등 기법을 이용한다.

키입력부(230)는 채널을 선택하는 채널 선택키나 음향 출력의 볼륨을 조절하는 볼륨 조절키를 비롯해 디지털 음악 재생 장치의 동작 모드를 라디오 방송을 수신하는 모드로 전환하는 방송키(232) 및 방송되는 음악 신호에 대해 녹음 저장을 실행하도록 하는 녹음키(234)를 포함한다.

마이크로 프로세서(240)는 디지털 음악 재생 장치의 동작 모드가 방송 수신 모드일 경우, 튜너(120)로 수신되는 방송 신호가 DSP(210)와 음악 추출부(220)에 의해 음악 데이터만 분리되어 음악 데이터 저장부(170)에 임시 저장되는 가운데 키입력부(230)에 구비된 녹음키(234)가 입력될 경우, 현재 출력중이며 내부적으로 임시 저장 중인 음악 데이터의 처음 부분부터 음악 데이터 저장부(170)에 확정 저장하는 과정을 전체적으로 제어한다.

음악 데이터 저장부(170)는 음악 데이터를 임시로 저장하는 임시 저장 영역과 녹음 저장 명령에 따라 확정적으로 저장하는 확정 저장 영역으로 구분되고, 임시 저장 영역에는 한 곡 분량이 데이터가 저장되며, 마이크로 프로세서(240)는 녹음키(234)의 입력이 있는 곡에 대해 임시 저장 영역에 저장된 음악 데이터를 확정저장 영역으로 이전하여 확정 저장한다.

도 3은 본 발명의 제1 실시예에 따라 인공 신경망으로 이루어진 음악 추출부(220)의 내부 구성을 나타낸 블럭 구성도이다.

제1 실시예에 따른 음악 추출부(220)는 '인공 신경망(Artificial Neural Networks)'을 이용해 현재 설정된 채널로 수신되는 방송 신호 중 음악 데이터만을 음악 추출 알고리즘에 따라 추출한다. 인공 신경망을 이용한 음악 추출 알고리즘은 방송 신호 중에 포함되어 있는 다량의 음향 신호를 입력받아 연산을 수행함으로써 입력 데이터의 차원을 감소시켜 음악 신호와 비음악 신호로 분리하고, 비음악 신호는 제거해 음악 신호만이 출력되도록 한다.

본 발명의 제1 실시예에 대한 이해를 돕기 위해 '인공 신경망'에 대해 상세히 설명한다.

'인공 신경망'이란 인간이나 동물의 뇌의 구조를 모방한 계산 모델이다. 이는 뇌의 신경 세포가 서로 복잡하게 연결된 상태에서 상호 작용함으로써, 병렬 분산 방식으로 정보를 처리한다는 점에 착안한 것이다. 즉, 임계값을 가지는 신경 소자(Threshold Logic Unit)들을 사용하여 신경망을 형성한 뒤, 주어진 신경망을 데이터와 같은 환경에 적응시키는 학습 알고리즘을 적용하는 것이다.

이러한 신경망을 형성하는 구조에 따라서 여러 가지 신경망 모델이 존재하게 되는데, 실제적으로 가장 많이 응용되는 모델은 다층 퍼셉트론(Multi-layer Perceptron) 구조이다. 이 구조에서는 신경 소자가 층(Layer)을 형성하며, 이러한 층에는 도 3에 예시된 바와 같이 입력, 출력 이외에도 중간층에 해당하는 은닉 노드(Hidden Unit) 층이 있다. 각 층 내에서는 소자간에 연결선이 존재하지 않고, 인접한 층간에는 각 뉴런이 모든 다른 뉴런과 연결되어 있다. 이때의 방향은 입력 소자에서 출력 소자 방향이며, 이를 순차 방식(Feed-forward)이라고 한다. 또한, 소자간의 연결선에는 가중치(Wmh)가 부여되어서 이전 층의 결과를 다음 층으로 합산하게 되는데, 신경망이 학습하는 대상이 바로 이 가중치이며, 대표적인 가중치 학습 방법으로는 오류 역전파(Error Backpropagation) 방식이 있다. 본 발명에서는 인공 신경망 중 가장 일반적인 형태인 다층 퍼셉트론 구조를 사용하며, 단층 은닉 노드, 순차 방식, 오류 역전파 학습 방법을 사용한다.

본 발명의 제1 실시예에 따라 인공 신경망을 이용한 음악 추출부(220)는 인공 신경망으로써 주파수에 대한 성향을 학습하며, 다층 퍼셉트론 구조의 신경망을 이용한다. 신경망을 학습시킬 때는 많은 매개 변수를 적절히 조정하는 것이 관건인데, 구체적인 매개 변수로는 신경망이 학습을 반복하는 기간(Epoch), 은닉 노드(Hidden Unit) 개수 등이 있다. 이렇게 신경망을 이용하여 방송 신호를 음악 신호와 비음악 신호로 분리한 음악 추출부(220)는 비음악 신호를 제거하고, 음악 신호만을 추출한다.

이어, 상기와 같이 구성된 인공 신경망을 이용해 음악 데이터를 추출하는 디지털 음악 재생 장치의 동작을 도 4에 도시된 순서도를 참조하여 설명한다.

도 4는 본 발명의 제1 실시예에 따른 디지털 음악 재생 장치에서 인공 신경망을 이용해 음악 부분을 자동으로 선별해 저장하는 방법을 나타낸 순서도이다.

먼저, 본 발명에 따른 디지털 음악 재생 장치(200)에 전원이 공급되고, 키입력부(230)의 키입력을 근거로 마이크로 프로세서(240)가 장치 전반을 제어할 수 있는 대기 상태에서(S402), 사용자가 라디오 방송을 청취하기 위해 키입력부(230)에 구비된 방송키(232)를 입력하면(S404), 마이크로 프로세서(240)는 튜너(120)를 제어하여 현재 설정되어 있는 채널로 방송 신호를 수신할 수 있게 하면서, DSP(210)를 제어하여 수신되는 방송 신호를 인코딩하여 디지털 데이터로 변환시킨다. 물론, 사용자는 키입력부(230)에 구비된 채널 선택키를 조작하여 다른 채널로 전환할 수 있다. 마이크로 프로세서(240)는 키입력부(230)에 의해 설정된 채널 선택을 기억하고 있는데, 사용자가 키입력부(230)를 이용하여 채널 선택을 하지 않는 한, 이전에 설정되어 있는 채널로 방송 신호가 수신되도록 튜너(120)를 제어한다. 만약 사용자가 키입력부(230)를 이용하여 다른 채널을 선택하게 되면, 마이크로 프로세서(240)는 사용자가 선택한 다른 채널의 방송 신호가 수신되도록 튜너(120)를 제어한다(S406).

상기 방송 신호는 튜너(120)로 수신되고, 튜너(120)에서는 설정된 채널의 방송 신호를 음향 출력부(130)로 출력함과 더불어 DSP(210)로 출력한다. 음향 출력부(130)는 튜너(120)에서 인가한 아날로그 방송 신호를 가청음으로 출력한다. 한편, DSP(210)에서는 DSP 코어(212)가 튜너(120)에서 인가한 방송 신호를 ADC(211)를 이용하여 디지털 데이터로 변환하고, 인코더(214)를 이용하여 음악 파일의 데이터로 인코딩하여 음악 데이터 저장부(170)의 음악 저장 영역에 임시로 저장한다. 이는 사용자가 현재 방송을 청취하면서 음성이 포함된 음악을 듣고 있지만 디지털 음악 재생 장치(200) 내부에서는 청취하는 방송 신호 중 음악 신호만을 추출하여 임시 저장하고 있다가 녹음 저장 명령시 현재 청취하는 음악을 확정 저장하게 하기 위함이다.

디지털 음악 재생 장치(200)로 수신되는 방송 신호는 음악을 방송하는 음악 구간이나 상품 등을 선전하는 광고 구간, DJ(Disk Jockey)나 출연자의 음성이 나오는 음성 구간 등 다양하다. 이러한 방송 신호는 안테나(110)로 수신되어 튜너(120)로 인가된다. 튜너(120)는 현재 설정된 채널의 방송 신호를 DSP(210)로 출력한다(S408). DSP(210)는 방송 신호를 ADC(211)와 DSP 코어(212), DAC(213)를 경유시켜 음향 출력부(130)로 출력함과 더불어 인코더(214)를 이용하여 음악 신호를 디지털 음악 데이터, 예컨대, MP3 파일의 음악 데이터로 인코딩한 후 음악 추출부(220)로 출력한다(S410).

음악 추출부(220)는 도 3에 도시된 바와 같이 DSP(210)에서 출력된 방송 신호를 입력으로 하여 인공 신경망을 이용하여 미리 정해진 음악 추출 알고리즘에 따라 음악 및 비음악 데이터로 분리하고, 이 중 비음악 데이터를 제거한 음악 데이터만을 음악 데이터 저장부(170)의 음악 데이터 저장 영역에 임시로 저장한다(S412). 즉, 마이크로 프로세서(240)는 DSP(210)를 제어하여 현재 음향 출력부(130)로 출력되고 있는 음악에 대해 항상 음악 데이터 저장부(170)의 음악 저장 영역에 저장하되, 키입력부(230)로부터 녹음 저장 명령이 있으면 음악 데이터 저장 영역에 임시로 저장한 음악 데이터를 소급적으로 저장하여 유지하도록 하는 것이다.

음향 출력부(130)로 음악이 출력되고 있는 가운데, 사용자가 음악을 듣고서 현재 출력되고 있는 음악을 녹음하고자 할 경우, 키입력부(230)에 구비된녹음키(234)를 입력한다. 녹음키(234)가 입력되면(S414), 마이크로 프로세서(240)는 DSP(140)를 제어하여 현재 출력되는 음악 데이터, 즉, 내부적으로 음악 데이터 저장부(170)의 음악 저장 영역에 임시로 저장되는 음악 데이터를 확정 저장 영역으로 이전하여 확정 저장하고 그 저장 상태를 유지한다(S416).

이때, 음악 데이터 저장부(170)의 음악 저장 영역에 임시로 저장되는 음악 데이터는 각 곡마다 수신되는 순서에 따라 순차적으로 저장된다. 만약, 녹음키(234)의 입력이 없는 가운데 음악 추출부(220)에 의해 음악 데이터만이 계속적으로 음악 데이터 저장부(170)에 저장되다가 음악 데이터 저장부(170)의 저장 용량을 초과하는 경우, 즉, 저장되는 용량이 포화 상태를 이룬 상태에서 새로운 음악 데이터가 저장될 경우, DSP(210)는 음악 데이터 저장부(170)에 저장되어 있던 이전 음악 데이터 중 녹음 저장에 관한 명령이 없는 곡의 데이터를 먼저 기록된 순서대로 한곡씩 삭제한 후 새로운 음악 데이터를 저장한다.

한편, 키입력부(230)에 음악 데이터를 삭제하는 기능에 관한 키를 구비하여, 음악 데이터 저장부(170)에 저장된 음악 데이터의 리스트를 표시부(180)로 출력하고, 사용자가 선택하여 삭제키를 조작함으로써 삭제하게 할 수도 있다.

상기 제1 실시예에 의하면, 디지털 음악 재생 장치(200)로 수신되는 방송 신호를 가청음으로 출력할 뿐만 아니라 인공 신경망을 이용해 방송 신호 중 음악 신호만을 선별하여 디지털 음악 데이터로 저장할 수 있다.

도 5는 본 발명의 제2 실시예에 따라 주파수 분석을 이용한 음악 추출부(500)의 내부 구성을 나타낸 블럭 구성도이다.

일반적으로 라디오 방송에서 음향을 출력하는 방식에는 모노(Mono)방식과 스테레오(Stereo) 방식 등이 있다.

모노 방식은 하나의 주파수 채널을 사용하여 음향 신호를 방송하는 것으로서, 음의 발원지에 상관없이 일개 장소에 배치된 음향 취득 수단에 의하여 취득된 음향을 방송하는 것이므로, 오디오 시스템을 통하여 출력되는 음향 신호는 원래의 음향 신호와는 다소 차이가 발생하게 된다. 반면, 스테레오 방식은 복수의 주파수 대역을 사용하여 음향 신호를 방송하는 것으로서, 음의 발원지에 따라 좌측 스테레오 신호와 우측 스테레오 신호로 나누어, 좌측 스테레오 신호와 우측 스테레오 신호를 각각 복수개의 주파수 대역으로 전송되도록 하는 것이므로 상기 모노 방식에 비하여 원음에 더욱 근접한 음향 신호가 출력되는 특징이 있다.

일반적인 라디오 방송에서 방송되는 음을 분류해 보면 대략 4가지 범주로 나뉜다. 즉, 라디오 방송 콘텐츠는 방송 출연자의 음성 구간, 배경 음악과 출연자의 음성이 공존하는 구간, 광고 구간, 음악 구간 등으로 나뉜다. 이중 음성 구간은 대부분 모노(Mono) 신호에 가깝고, 음성 이외의 구간은 대부분 스테레오(Stereo) 신호에 가깝다. 방송 신호에서 스테레오 신호는 그 신호 특성상 좌, 우 채널의 정보가 약간씩 다른데, 이를 이용해 두 채널의 시간에 따른 음성 파형의 위상 값을 비교하여 좌, 우 채널의 값이 같을 때는 모노 신호로 판단하고, 이때 모노 신호인 음성 신호를 제거하면 대부분 스테레오 신호인 음악 신호를 얻을 수 있다.

도 5에 도시된 제2 실시예에 따른 음악 추출부(500)는 방송 신호를 분석하여 모노 신호와 스테레오 신호로 분리하고, 이중 모노 신호를 제거함으로써 스테레오신호를 얻는 것이다. 즉, 모노 신호와 스테레오 신호가 포함된 방송 신호를 시간축 상에 나타내어, 시간축 상에서 방송 신호의 왼편 채널과 오른편 채널의 음량의 차이를 계산하여 "0"에 가까우면 모노 신호로 판단하고, 임의의 임계값 이상이 일정시간 동안 지속될 경우 스테레오 신호로 판단하여, 모노 신호를 제거하고 스테레오 신호만을 출력하는 것이다.

본 발명의 제2 실시예에 따른 주파수 분석을 이용한 디지털 음악 재생 장치의 음악 추출부(500)는 음향 데이터 연산부(510), 비음악 제거부(520), 음악 시종 판단부(530), 스펙트럼 분석부(540) 등을 포함한다.

음향 데이터 연산부(510)는 DSP(210)에서 인가되는 방송 데이터의 좌채널 데이터와 우채널 데이터를 연산하여 그 결과 데이터를 출력한다. 비음악 제거부(520)는 음향 데이터 연산부(510)에서 인가된 결과 데이터가 "0"에 가까운 데이터이면 모노 데이터로 판단하고, 결과 데이터가 임계값 이상의 값으로 일정 시간 동안 지속될 경우 스테레오 데이터로 판단하여, 모노 데이터는 제거하고 스테레오 데이터만 출력한다.

음악 시종 판단부(530)는 비음악 제거부(520)에서 인가된 음악 데이터를 DSP(210)로 출력하면서 그 음악 데이터의 처음과 끝 부분을 식별하여 이를 인식하는 시종 데이터를 생성해 마이크로 프로세서(240)로 전송하며, 이러한 전송을 위해 음악 데이터의 출력과 별도로 출력 포트를 구비한다. 또한, 음악 시종 판단부(530)는, 이전 음악 데이터와 다음 음악 데이터의 겹치는 부분이 존재하거나 두 음악 데이터 사이에 묵음 구간이 없이 연속되어 음악 데이터의 시작과 끝 부분을 식별하지못할 경우에는 스펙트럼 분석부(540)로 그 음악 데이터를 인가한다. 스펙트럼 분석부(540)는 음악 시종 판단부(530)에서 인가된 음악 데이터를 스펙트럼 분석하여 음악의 시작과 끝 신호를 분별해 이를 인식하는 시종 데이터를 생성해 마이크로 프로세서(240)로 전송한다.

음악의 시종 부분을 구별함에 있어서, 본 발명에 따른 디지털 음악 재생 장치(200)는 음악 데이터의 끝 부분에 처리되어 있는 페이드 아웃(Fade-out)을 검출하여 이를 근거로 처음과 끝을 식별한다. 대부분의 음악 방송에서 방송되는 음악의 경우, 음악의 종결부(Ending Portion)는 페이드-아웃 처리되어 있다. 따라서, 본 발명의 제2 실시예에 따른 음악 추출부(500)의 음악 시종 판단부(530)는 음악 데이터의 페이드-아웃 부분을 검출하여 이를 근거로 그 음악의 끝 또는 다음 음악의 처음으로 식별한다.

또한, 음악 방송 신호는 도 6에 도시된 바와 같이 먼저 전송되는 음악 신호(A)와 다음 음악 신호(B) 사이에 묵음(Mute) 신호가 존재하는 경우가 있다. 음악 시종 판단부(530)는 시간에 따라 출력 진행되는 음악 신호에서 묵음이 나타날 경우 그 음악 신호(A)의 끝으로 인식하고, 묵음을 지나서 다음 음악 신호(B)가 이어질 때 그 부분을 다음 음악 신호의 처음으로 인식하여, 이를 근거로 시종 데이터를 생성해 마이크로 프로세서(240)로 출력한다.

일반적으로 주파수 신호는 음성이나 음악 신호가 존재하는 구간에서는 에너지값이 크게 나타난다. 음악 시종 판단부(530)는 이를 이용하여 에너지 변화량을 계산하여 에너지가 낮은 구간을 묵음 구간으로 인식해 음악의 끝점 후보로 간주하며, 이때 에너지값은 비음악 제거부(520)에서 인가되는 음악 데이터를 프레임 단위로 하여 그 위상값을 제곱하고 로그(Log)를 취하여 얻는다.

그리고, 하나의 음악 신호는 클래식의 음악이 아닌 경우 대부분 3 ~ 5분 정도 분량을 갖는다. 묵음으로만 음악의 시점과 종점을 검출할 경우 음악의 중간 묵음 부분을 시점이나 종점으로 인식할 수 있기 때문에 음악 시종 판단부(530)는 음악 검출 구간의 길이가 대략 3 ~ 5분 정도 되는 것을 고려하여 음악 구간을 추출함으로써 그 음악의 처음과 끝을 판단하여 판단 오류를 줄이기도 한다.

이어, 상기와 같이 구성된 주파수 분석을 이용한 음악 추출부(500)가 채용된 디지털 음악 재생 장치의 동작에 대해 도 7의 순서도를 참조하여 상세하게 설명한다.

도 7은 본 발명의 제2 실시예에 따라 디지털 음악 재생 장치에서 주파수 분석을 이용해 음악 부분을 선별해 저장하는 방법을 나타낸 순서도이다.

먼저, 사용자가 방송을 청취하는 기능과 기저장된 음악 데이터를 재생하는 기능을 모두 구비한 디지털 음악 재생 장치(200)를 사용함에 있어, 키입력부(230)에 구비된 방송키(232)를 조작하여 방송 모드를 선택한 경우, 마이크로 프로세서(240)는 튜너(120)를 제어하여 선택된 방송 채널로 방송 신호가 수신되게 한다(S702).

튜너(120)에서는 안테나(110)로 수신된 방송 신호를 음향 출력부(130)로 출력할 뿐만 아니라 DSP(210)로도 인가한다(S704). 이는 사용자에게는 음향 출력부(130)로 출력되는 방송을 청취하게 할 뿐만 아니라 장치 내부적으로는 음악만을 추출해 저장할 준비를 갖추기 위함이라는 것은 이미 전술한 바이다. DSP(210)에서는 방송 신호가 ADC(211)에 의해 디지털 데이터로 변환되고, DSP 코어(212)는 디지털 음악 데이터를 좌채널 데이터와 우채널 데이터로 분리해 음악 추출부(220)로 인가한다. DSP(210)에서 출력된 좌채널과 우채널의 음악 데이터는 음악 추출부(220)의 음향 데이터 연산부(510)로 인가된다(S706). 음향 신호 연산부(510)에서는 DSP(210)에서 인가된 좌채널 데이터와 우채널 데이터를 연산하여 그 결과 데이터를 출력한다(S708). 즉, 좌채널 데이터와 우채널 데이터를 연산하여 '0'에 가까운 데이터를 얻으면 모노 데이터로, 임계값 이상을 일정 시간 동안 유지하면 스테레오 데이터로 인식하는 결과 데이터를 출력한다.

비음악 제거부(520)에서는 음향 데이터 연산부(510)에서 인가한 결과 데이터를 근거로 음성 데이터를 제거하고, 스테레오 데이터에 해당하는 음악 데이터만을 음악 시종 판단부(530)로 출력한다(S710). 음악 시종 판단부(530)에서는 비음악 제거부(520)에서 인가한 음악 데이터의 시작과 끝을 판단하는데, 첫째, 음악 데이터에 처리되어 있는 페이드-아웃을 근거로 시작과 끝을 판단하거나, 둘째, 음악 데이터 중에 존재하는 묵음을 근거로 시작과 끝을 판단하거나, 셋째, 음악 데이터의 대략 재생 시간 3 ~ 5분을 근거로 판단하거나, 넷째, 이전 음악 데이터와 다음 음악 데이터의 중첩되는 부분이 있는 경우, 스펙트럼 분석부(540)로 출력하여 스펙트럼 분석을 이용하여 판단하거나, 다섯째, 음악 데이터를 프레임 단위로 하여 그 위상값을 제곱하고 로그(Log)를 취하여 에너지값을 얻어 이를 근거로 판단하는 과정을 포함하여, 상기 5가지 과정들을 종합하여 음악 데이터의 처음과 끝을 판단한다. 그리고, 상기 음악 데이터의 처음과 끝을 알리는 시종 데이터를 생성해 마이크로 프로세서(240)로 전송한다. 마이크로 프로세서(240)는 시종 데이터를 음악 데이터 저장부(170)의 비음악 저장 영역에 저장해 두게 된다(S712). 물론, 음악 시종 판단부(530)에서는 시종 데이터의 출력뿐만 아니라 음악 데이터를 DSP(210)로 출력함으로써 DSP(210)가 현재 출력되는 음악 데이터를 인코딩하여 음악 데이터 저장부(170)의 임시 저장 영역에 저장되게 한다. 이로써, 사용자가 현재 청취하는 음악의 녹음 저장을 수행할 수 있는 준비를 하게 된다.

사용자가 음악을 듣고 있는 중에 현재 청취하는 음악을 녹음 저장하기 위해 키입력부(230)에 구비된 녹음키(234)를 입력하는 경우(S714), 마이크로 프로세서(240)는 현재 출력되고 있는 음악 데이터의 시종 데이터를 음악 데이터 저장부(170)의 비음악 저장 영역으로부터 읽어와 이를 근거로 음악 데이터 저장부(170)의 임시 저장 영역에 임시로 저장되어 있는 상기 음악 데이터를 그 처음 부분과 종료 부분을 인식하여 확정 저장 영역으로 이전하여 저장하고, 그 음악 데이터의 저장 상태를 확정하고 유지한다(S716).

여기서, 음악 데이터 저장부(170)의 임시 저장 영역은 한 곡의 음악 데이터를 임시로 저장할 수 있는 용량으로서, 현재 DSP(210)로 인가되는 음악 데이터를 임시로 저장하되, 녹음키(234)의 입력이 없고 다음 음악 데이터가 인가되는 경우, 먼저 임시 저장된 음악 데이터를 삭제하고 새로 인가되는 음악 데이터를 임시로 저장한다. 또한, "확정하고 유지한다"는 것은 상기 제1 실시예에서도 설명이 되었듯이 음악 데이터 저장부(170)의 임시 저장 영역에 저장되어 있는 음악 데이터를 확정 저장 영역으로 이전하여 확정 저장함으로써 그 저장 상태를 고정적으로 저장 유지한다는 것을 의미한다. 물론, 고정적으로 저장 유지된 상기 음악 데이터는 사용자가 키입력부(230)를 이용하여 선택적으로 삭제할 수 있다.

그리고, 음악 데이터 저장부(170)의 확정 저장 영역에는 대략 6 곡 이하의 음악 데이터가 저장되므로, 확정 저장된 음악 데이터가 이미 확정 저장 영역을 다 차지하고 있는 상태에서, 임시 저장 영역에 저장되는 음악 데이터에 관한 녹음키(234)의 입력이 있는 경우, 마이크로 프로세서(240)는 표시부(180)로 음악 데이터의 저장 상태가 충만한 상태임을 나타내는, 예컨대, "음악을 더 이상 저장할 수 없습니다. 기저장된 음악을 삭제하고 저장하시겠습니까?"라는 메시지를 출력하고, 키입력부(230)로부터 키입력을 대기한다. 삭제 실행에 관한 키입력이 있으면, 마이크로 프로세서(240)는 음악 데이터 저장부(170)의 확정 저장 영역에 저장되어 있는 음악 데이터의 리스트를 표시부(180)로 출력하고, 제일 상단에 위치한 음악 데이터 리스트에 표시바를 위치시켜 삭제할 수 있도록 한다. 사용자에 의해 삭제에 관한 키입력이 있으면, 표시바가 위치한 음악 데이터를 확정 저장 영역에서 삭제하고 임시 저장 영역에 있는 음악 데이터를 이전하여 확정 저장한다.

상기 단계 S714에서, 사용자가 녹음키(234)를 입력하지 않는 한, 마이크로 프로세서(240)는 단계 S704로 복귀하여 음향 출력부(130)로 방송 신호가 출력되게 할 뿐만 아니라 DSP(210)를 제어하여 음악 추출부(500)에 의해 처음과 끝이 인식되어 추출된 음악 데이터가 음악 데이터 저장부(170)의 임시 저장 영역에 임시로 저장되도록 하는 과정을 계속적으로 반복한다.

즉, 본 발명의 제2 실시예에 의하면, 디지털 음악 재생 장치(200)에 주파수 분석을 이용한 음악 추출부(500)를 구비함으로써, 수신하는 방송 신호 중에서 음악 부분만을 분리하고 주파수 분석을 이용하여 그 출력 음악의 처음 부분과 끝 부분을 인식하여 저장할 수 있게 한다. 따라서, 사용자가 음악을 청취하다가 녹음 동작을 취하였을 때 음악의 처음 부분이 어느 정도 경과되었더라도 그 음악의 처음 부분부터 녹음 저장되며, 이후 녹음 저장된 음악을 재생할 경우, 그 음악의 처음 부분부터 재생하게 된다.

도 8은 본 발명의 제3 실시예에 따른 은닉 마르코프 모델(HMM: Hidden Markov Model)을 이용한 음악 추출부(800)의 내부 구성을 나타낸 블럭 구성도이다.

본 발명의 제3 실시예에서는 음악 추출부(800)로 인가되는 방송 신호 중에 다수개로 섞인 음원들의 혼합 신호를 입력으로 받아들여 상호 독립적인 음원 신호를 복원해 내는 것으로서, 일반적인 사람들의 음성 특징들을 추출할 수 있는 데이터들을 수집한 후에 은닉 마르코프 모델(HMM)을 이용하여 학습을 시켜서 음성 신호를 추출해 제거하는 것이다. 다시 말해, 혼합되어 있는 음향 정보로부터 은닉되어 있는 음성 정보를 얻어낼 수 있도록 하는 모델이 은닉 마르코프 모델이다. 이때 은닉된 음성 정보는 마르코프 프로세스(Markov Process)이다. 그리고, "모델의 상태는 오로지 이전 상태들에만 의존한다."는 가정을 마르코프 가정(Markov Assumption)이라 한다. 마르코프 프로세스는 상태간 전이가 오로지 이전 n개의 상태에 의존하여 이루어지는 프로세스를 말한다. 이때 이 모델을 n차원 모델이라 하는데 n은 다음 상태를 결정하는 데 영향을 미치는 상태의 개수를 나타낸다.

HMM은 음성의 시간적 변화를 모델링하는 천이 확률과 스펙트럼 변화를 모델링하는 출력 확률로 구성된다. 또한, 입력 패턴과 참조 패턴간의 유사도를 이용하기보다는 주어진 모델과의 확률적인 추정값을 사용하여 모델의 유사도를 계산하는데, 입력되는 음성 데이터를 전처리하여 해당 입력에 근사한 출력을 생성하는 은닉 상태 집합의 경로를 찾기 위해 비터비(Viterbi) 알고리즘을 이용한다.

확률 추정 문제의 경우는 은닉 상태(Hidden State)를 고려해야 하기 때문에 확률을 추정하는 문제가 복잡해지며, 최적 상태 순서의 결정 문제는 데이터를 가장 잘 설명하는 상태 순서를 결정하기 위해서 '최적'의 기준을 정하는 것이 필요하다. 상기 매개 변수 추정 문제의 경우는 학습과 관계가 있다. 따라서, 상기 확률 추정 문제의 경우는 전향 알고리즘(Forward Algorithm)과 후향 알고리즘(Backward Algorithm)을 이용하여 해결이 가능하며, 최적 상태 순서의 경로를 결정하는 문제는 일반적으로 동적 프로그래밍 기법의 하나인 비터비(Viterbi) 알고리즘을 이용하여 결정한다. 그리고, 매개 변수의 추정은 BW(Baum-Welch) 알고리즘을 사용하여 수행한다.

본 발명의 제3 실시예에 따른 HMM을 이용한 음악 추출부(800)는 HMM에서 매개 변수 추정을 위한 BW 알고리즘을 이용하여 음향 신호 및 그 음향 신호의 특징을 추출하고, 비터비 알고리즘을 이용하여 음악 신호만을 추출해 내는 것이다.

도 8에 예시된 본 발명의 제3 실시예에 따른 음악 추출부(800)는 음향 입력부(810)와, MLP(다층 퍼셉트론: Multi-Layer Perceptron, 820), 특징 추출부(Feature Extractor, 830), HMM 선별부(HMM Classifier, 840) 등을 포함한다.

음향 입력부(810)는 DSP(210)에서 인가되는 방송 신호 중 다수의 음향 신호가 포함된 오디오 신호를 입력하고, 오디오 신호의 음향 특징(Acoustic Feature)을 추출한다. 예컨대, 영점 교차 정보(Zero-Crossing Information), 에너지(Energy), 피치(Pitch), 스펙트럼 주파수(Spectral Frequencies), 켑스트럴 계수(Cepstral Coefficient) 등을 추출한다. 음향 입력부(810)는 오디오 신호를 프레임(Frame)이라는 시간 단위로 분리한다. 하나의 프레임은 대략 10 ms ~ 30 ms 정도이고, 각 프레임마다 특징(Feature)값은 다르며 시간 순서대로 나열된다. 이러한 프레임에서 추출한 특징(Feature)은 "Xn"으로 표시한다.

MLP(820)는 제1 실시예에서 설명한 신경망 음성 인식에서 사용한 이론을 적용한다. MLP(820)는 음향 입력부(810)로부터 입력으로 받은 Xn 이 음성 인식적으로 어떤 음소인지의 가능성(확률 P)을 나타내는 포스테리어 확률(Posterior Probability)을 구한다. 만약, 현재 입력된 오디오 신호가 음성(Speech) 구간이라면 특정 음소일 확률은 높게 나타날 것이다. MLP(820)의 출력단에는 Xn당 P(q1|Xn) 등의 형태로 k 개 만큼 출력된다. 여기서, q1 ~ qk 는 음소의 개수를 나타내고, Xn은 음향 입력부(810)에서 프레임을 분석해서 얻은 음향 특징을 나타낸다.

특징 추출부(830)는 MLP(820)에서 인가된 포스테리어 확률을 근거로 연산을 실행하여 프레임 안에서 확률값의 분포를 나타내는 단위인 엔트로피(Entropy: Hn)와 프레임 간에 변화에 대한 확률값인 다이너미즘(Dynamism: Dn)을 구하여 HMM 선별부(840)로 출력한다. 오디오 신호가 음성이면, 장치가 이상적일 경우, 엔트로피는 '0'에 가까울 것이며, 프레임 간의 변화가 크므로 다이너미즘은 높게 나타날 것이다. 이와 반대로 비음성, 예컨대, 음악이면 확률값이 넓게 분포하여 높은 엔트로피를 갖게 되고, 시간당 변화량이 작으므로 다이너미즘은 낮게 나타날 것이다.

다음 수학식 1은 엔트로피(Hn)를 구하는 식이며, 수학식 2는 다이너미즘(Dn)을 구하는 식을 나타낸다.

HMM 선별부(840)는 특징 추출부(830)에서 인가된 엔트로피(Hn)와 다이너미즘(Dn)을 근거로 BW 알고리즘과 비터비 알고리즘을 이용하여 음성 클래스(Speech Class)와 음악 클래스(Music Class)를 선별해 낸다. 각 클래스에 존재하는 상태(State)는 모두 동일하지만 여러개가 존재한다. HMM 선별부(840)는 HMM을 학습하게 되는데, 이는 인가된 두 특징 파라미터(Hn, Dn)를 BW 알고리즘을 이용해 각 상태(State)에서 상태(State)로 이전되어 가는 천이 확률을 최적화한다는 것이다. 학습을 시작하기 전 초기치는 임의로 설정한다. HMM 선별부(840)는 실제로 음성과 음악을 분리할 때는 입력으로 받은 특징 파라미터와 학습된 HMM을 가지고 테이블을 만든다. 그리고, 비터비 알고리즘을 이용하여 최종적으로 입력 오디오 신호가 속하는 클래스를 계산하여 음성 클래스인지 음악 클래스인지를 판단하는 것이다.

여기서, HMM 선별부(840)에서 이용하는 BW 알고리즘과 비터비 알고리즘에 대해 좀 더 상세하게 설명한다.

일단, 관측열에 대하여 최대 확률을 가지는 적합한 모델을 선택한 후에는 관측열을 생성하는 모델의 최적 상태 순서를 결정하여야 한다. 일반적으로 모델의 최적 상태를 결정하는 데에는 동적 프로그래밍(Dynamic Programming) 방법 중의 하나인 비터비 알고리즘을 사용한다.

1. 비터비 알고리즘

비터비 알고리즘은 주어진 관측열와 모델를 가지고 관측열를 최대 확률로 생성하는 상태 순서(State Sequence) Q를 결정하는데 사용된다. 관측열와 모델를 기초로 관측열을 생성하는 확률은 P( q1, q2, ... qT |,)이다.

도 9는 최대 확률을 가지는 상태들의 순서를 결정하는 비터비 알고리즘의 원리를 나타낸 도면이다.

즉, 도 9는 시간 t에서부터 시간 t+1로의 상태 천이들 중에서 최대 확률로 상태 천이를 하는 상태들의 순서를 결정해 나가는 단계를 나타낸 것이다. 비터비 알고리즘은 다음과 같은 과정으로 최대 확률을 가지는 상태 경로를 계산한다.

① 초기화(Initialization) :

② 회귀(Recursion) :,

,

③ 종료(Termination) :,

④ 상태 순서 귀로(State Sequence Backtracking) :

, t = T-1 , T-2 , ... , 1

상기 알고리즘에서,는 시간 t에서 상태 i로 전이하는 최적 경로를 유지하는 변수이다.는와 같이 이전 상태(t-1)까지의 최대 확률을 가지는 경로와 시간 t에서의 상태 j로의 전이 행렬을 이용하여 최대 확률을 가지는 상태 경로를 계산한다.

도 9에서,는 상태 j로 끝나는 경로들 중에서 최대 확률을 가지는 경로에 대한 확률값을 표현하고 있는 것으로 다음 수학식 3과 같이 표현된다.

또한, 상기 수학식 3은 귀납에 의하여 다음 수학식 4와 같이 확장될 수 있다.

상기 수학식 4를 이용하면 시간 t 뿐만 아니라 이후의 t+1 에 대해서도 최대 확률을 가지는 상태들의 순서를 구할 수 있다.

2. BW 알고리즘

관측열에 대하여 최대 확률을 가지는 적합한 모델을 선택하고 이 모델의 내부 상태들 중에서 최적의 상태 순서를 정한 후에는, 관찰된 관측열 O에 대하여 P(|)를 최대로 하는 모델= (, A, B )의 매개 변수(Parameter)를 결정하여야 한다. 모델의 매개 변수를 결정하는 문제는 모델의 복잡성 때문에 분석적(Analytic)인 방법으로는 어렵다. 이 때문에 모델 파라미터의 학습에는 Baum-Welch 알고리즘을 사용한다.

BW 알고리즘은 "초기 모델"()을 구성하고, 초기 모델과 관찰열를 기반으로 "새로운 모델"()을 구성한다. 이렇게 하여 새로 구성된 모델과 이전 모델이 관찰열을 생성하는 확률의 차이가 "특정값" 이상이 될 때까지 모델의 매개 변수를 변경하면서 새로운 모델을 생성해 나간다.

또한, BW 알고리즘은 다음 수학식 5와 수학식 6과 같은 두 개의 새로운 변수를 추가적으로 정의해 사용한다.

수학식 5는 시간 t에서 상태 i에 있고, 시간 t+1에서 상태 j에 있을 확률을 나타낸다. 여기서,는 전향 알고리즘의 전향 변수를 나타내고,는 후향 알고리즘의 후향 변수를 나타낸다. 상기 수학식 5를와 같이 하면 관찰열에서 상태 i에서 상태 j로 전이한 횟수의 기대값이 된다.

상기 수학식 6은 시간 t에서 주어진 관찰열을 가지고 상태 i 에 있을 확률을 나타낸다. 여기서, 상기 수학식 6을 이용하면와 같이 합을 취하여 관찰열에서 상태 i가 방문한 횟수에 대한 기대값을 구할 수 있다.

전술한 바와 같은 과정으로 HMM 선별부(840)는 입력된 오디오 신호 중 음악 신호를 선별해 DSP(210)로 출력하게 된다.

이어, 상기와 같이 구성된 음악 추출부(800)를 이용해 음악 신호만을 출력하는 디지털 음악 재생 장치의 동작에 대해 도 10에 도시된 순서도를 참조하여 상세하게 설명한다.

도 10은 본 발명의 제3 실시예에 따른 디지털 음악 재생 장치에서 HMM을 이용해 음악 부분을 선별해 저장하는 방법을 나타낸 순서도이다.

먼저, 방송 신호가 안테나(110)로 수신되어 튜너(120)로 인가되면 튜너(120)에서는 설정된 채널로 방송 신호를 음향 출력부(130)로 출력할 뿐만 아니라 DSP(210)를 경유해 음악 추출부(800)로 출력한다(S1020). 음악 추출부(800)로 입력된 방송 신호는 음향 입력부(810)로 인가되고, 음향 입력부(810)는 오디오 신호를 프레임 시간 단위로 분리해 음향 특징, 예컨대, 영점 교차 정보(Zero-CrossingInformation), 에너지(Energy), 피치(Pitch), 스펙트럼 주파수(Spectral Frequencies), 켑스트럴 계수(Cepstral Coefficient) 등을 추출하여 MLP(820)로 인가한다(S1040).

MLP(820)에서는 음향 입력부(810)로부터 입력으로 받은 음향 특징이 음성 인식적으로 어떤 음소인지의 가능성(확률 P)을 나타내는 포스테리어 확률(Posterior Probability)을 구하여 특징 추출부(830)로 출력한다(S1060). 특징 추출부(830)는 MLP(820)에서 인가된 포스테리어 확률을 근거로 엔트로피(Hn)와 다이너미즘(Dn)을 구한다(S1080). 특징 추출부(830)는 구해진 엔트로피(Hn)와 다이너미즘(Dn)을 HMM 선별부(840)로 출력한다. HMM 선별부(840)에서는 특징 추출부(830)에서 인가된 엔트로피(Hn)와 다이너미즘(Dn)을 근거로 BW 알고리즘과 비터비 알고리즘을 이용하여 음악 데이터만을 선별하고 이를 DSP(210)로 출력한다(S1100).

DSP(210)는 DSP 코어(212)가 인코더(214)를 이용하여 HMM 선별부(840)에서 인가된 음악 데이터를 MP3 파일의 음악 데이터로 인코딩하여 음악 데이터 저장부(170)의 음악 데이터 저장 영역에 임시로 저장한다(S1120). 이때, 음향 출력부(130)로는 현재 수신 저장된 음악 신호가 포함된 방송 신호가 출력되고 있음은 물론이다. 현재 사용자가 청취하고 있는 음악이 음악 데이터 저장부(170)의 임시 저장 영역에 임시로 저장될 때, 그 음악의 처음 부분과 끝 부분을 인식하여 저장함은 앞서 제2 실시예에서 설명한 바와 같이 동일하게 적용된다. 이는 음악 추출부(220, 500, 800)에서 추출한 음악 신호의 처음 부분을 선별하는 기능을 구비하지 않고 마이크로 프로세서(240)가 구비하게 함으로써 구현할 수도 있다.

음향 출력부(130)로 음악 신호가 포함된 방송 신호가 출력되고 있는 가운데, 사용자에 의해 키입력부(230)에 구비된 녹음키(234)가 입력된 경우(S1140), 마이크로 프로세서(240)는 이를 인식하고 DSP(210)를 제어하여 현재 음악 데이터 저장부(170)의 비음악 저장 영역에 저장되어 있는 시종 데이터를 근거로 임시 저장 영역에 임시로 저장되어 있는 상기 음악 데이터의 처음과 끝 부분을 인식하여 그 음악 데이터를 확정 저장 영역으로 이전하여 저장하고, 그 저장 상태를 확정하고 유지한다(S1160). 여기서, "확정하고 유지한다"함은 상기 제2 실시예에서 설명한 바와 같은 의미이다.

물론, 녹음키(234)의 입력이 없는 경우에 마이크로 프로세서(240)는 상기 단계 S1020으로 복귀하여 음향 출력부(130)로 방송 신호가 출력되고, 현재 출력되는 방송 신호 중 음악 신호만이 음악 데이터로 저장되도록 하는 과정을 반복하게 된다. 이후, 사용자는 음악 데이터 저장부(170)에 저장되어 있는 음악 데이터 중에서 자신이 청취하기 원하는 음악을 선택하여 재생할 수 있다.

즉, 본 발명의 제3 실시예에 의하면, 디지털 음악 재생 장치(200)에 HMM을 이용한 음악 추출부(800)를 구비함으로써, 방송 신호 중 음성 신호와 음악 신호를 선별해 음악 신호만을 음악 데이터로 저장할 수 있는 디지털 음악 재생 장치 및 방법을 실현할 수 있게 된다.

본 발명은 전술한 실시예에 한정되지 않고, 본 발명의 기술적 요지를 벗어나지 않는 범위 내에서 다양하게 수정 및 변경 실시할 수 있음은 이 기술 분야에서 통상의 지식을 가진 자라면 누구나 이해할 수 있을 것이다.

즉, 음성 인식(Speech Recognition) 기술에 기반한 독립 성분 분석(ICA: Independent Component Analysis)을 이용한 음악 추출부를 구성할 수 있다. 일반적으로 '음성 인식'은 인간의 음성을 기계(컴퓨터)가 분석해 이를 인식 또는 이해하는 기술을 말하는데, 발음에 따라 입 모양과 혀의 위치 변화로 특정한 주파수를 갖는 인간의 음성을 이용, 발성된 음성을 전기신호로 변환 한 후 음성 신호의 여러가지 특성을 추출해 사람의 발음을 인식하는 기술이다. 따라서, 상기 음성 인식 기술을 적용한 음악 추출부를 이용해 방송 신호에 포함된 음성 신호를 분리해 내어 제거함으로써 음악 신호만을 출력하는 기능을 구비하게 할 수 있다.

또한, 상기 실시예들은 음악 데이터 저장부(170)에 음악 데이터를 임시로 저장하고, 녹음키(234)의 입력이 있는 경우 그 음악 데이터를 확정하여 저장 유지하도록 되어 있으나, 음악 추출부(220)에서 추출된 음악 데이터를 한 곡 또는 그 이상 임시로 저장할 수 있는 임시 메모리를 구비하여, 현재 음향 출력부(130)로 출력되면서 내부적으로는 음악 추출부(220)에 의해 추출되는 음악 데이터를 상기 임시 메모리에 저장되도록 하고, 녹음키(234)의 입력이 있을 경우 상기 임시 메모리에 저장된 음악 데이터를 음악 데이터 저장부(170)로 이전하여 저장하도록 하며, 녹음키(234)의 입력이 없을 경우 상기 임시 메모리에 저장된 음악 데이터를 삭제하여 다음 음악 데이터를 저장하도록 구성하게 할 수 있다.

이상 설명한 바와 같이 본 발명에 의하면, 디지털 음악 재생 장치로 수신되는 방송 신호를 가청음으로 출력할 뿐만 아니라 인공 신경망 또는 주파수 분석 또는 은닉 마르코프 모델을 이용해 방송 신호 중 음악 신호만을 선별하여 디지털 음악 데이터로 저장할 수 있는 장치 및 방법을 실현할 수 있다.

또한, 수신하는 방송 신호 중에서 음악 부분만을 분리하여 그 출력 음악의 처음과 끝 부분을 인식하여 처음 부분부터 저장할 수 있게 함으로써, 사용자가 음악을 청취하다가 녹음 동작을 취하였을 때, 청취하는 음악의 처음 부분이 어느 정도 경과되었더라도 그 음악의 처음 부분부터 녹음 저장할 수 있는 장치 및 방법을 실현할 수 있다.

따라서, 사용자가 청취하는 음악의 녹음 저장을 위해 녹음 버튼을 누르는 동작과 음악이 끝나는 시점에 다시 녹음 버튼을 누르는 번거로움과 녹음을 위한 상당한 주의 집중 동작의 번거로움을 해결할 수 있다.

Claims

방송 신호를 수신하여 선국하는 튜너, 선국된 방송 신호를 가청음으로 출력하는 음향 출력부, 음악 데이터를 임시로 저장하는 임시 저장 영역과 확정하여 저장하는 확정 저장 영역을 구비하는 음악 데이터 저장부, 장치의 동작 상태를 표시하는 표시부를 포함하고, 상기 방송 신호 중 음악 신호만을 추출해 음악 데이터로 저장하는 디지털 음악 녹음 재생 장치로서,

상기 방송 신호를 디지털 데이터로 변환하거나 디지털 데이터를 아날로그 신호로 변환하며, 디지털 데이터를 음악 데이터로 압축하여 인코딩(Encoding)하거나 압축된 디지털 데이터를 디코딩하여 출력하는 신호 처리부,

상기 신호 처리부에서 출력된 상기 디지털 데이터를 음악 추출 알고리즘에 따라 음악 데이터와 비음악 데이터로 분리해 음악 데이터만을 추출하고, 추출한 상기 음악 데이터의 처음과 끝을 인식하는 시종 데이터를 생성해 출력하는 음악 추출부와,

상기 디지털 음악 재생 장치의 동작 모드를 라디오 방송을 수신하는 모드로 전환하는 방송키와 방송되는 음악 신호에 대해 녹음 저장을 실행하도록 하는 녹음키가 구비된 키입력부, 및

상기 신호 처리부를 제어하여 상기 음악 추출부에 의해 추출된 음악 데이터만을 상기 음악 데이터 저장부의 임시 저장 영역에 임시로 저장하고, 상기 녹음키의 입력이 있는 경우 상기 임시 저장 영역에 임시로 저장된 상기 음악 데이터를 상기 확정 저장 영역으로 이전하여 저장하고 그 저장 상태를 확정하여 유지하는 마이크로 프로세서를 포함하는 것을 특징으로 하는 디지털 음악 녹음 재생 장치.
제 1 항에 있어서,

상기 음악 추출부는 인공 신경망(Artificial Neural Network)을 이용해 다수의 입력 데이터를 연산하여 음악 데이터와 비음악 데이터로 분리하고 비음악 데이터는 제거해 음악 데이터만을 출력하는 것을 특징으로 하는 디지털 음악 녹음 재생 장치.
제 1 항에 있어서,

상기 음악 데이터 저장부의 확정 저장 영역에 임시로 저장되는 상기 음악 데이터는 각 곡마다 저장되는 순서에 따라 순차적으로 저장되고, 상기 음악 데이터만이 계속적으로 저장되다가 상기 확정 저장 영역의 저장 용량을 초과하는 경우, 마이크로 프로세서는 상기 음악 데이터 저장부에 저장되어 있던 이전 음악 데이터 중 먼저 기록된 순서대로 한곡씩 삭제한 후 새로운 음악 데이터를 저장하는 것을 특징으로 하는 디지털 음악 녹음 재생 장치.
제 1 항 또는 제 3 항에 있어서,

상기 키입력부에 음악 데이터를 삭제하는 삭제키를 구비하고, 상기 마이크로 프로세서는 상기 음악 데이터 저장부에 저장된 음악 데이터의 리스트를 상기 표시부로 출력하여, 사용자가 삭제하기 원하는 리스트를 선택하게 하고, 삭제에 관한 키입력에 따라 상기 음악 데이터 저장부에 저장된 음악 데이터를 삭제하는 것을 특징으로 하는 디지털 음악 녹음 재생 장치.
제 1 항에 있어서,

상기 신호 처리부는 하드웨어(Hardware) 방식의 신호 처리부 또는 DSP(Digital Signal Processor: 디지털 신호 처리 프로세서)인 것을 특징으로 하는 디지털 음악 녹음 재생 장치.
제 5 항에 있어서,

상기 신호 처리부는 아날로그 신호를 디지털 신호로 변환하는 ADC(Analog to Digital Converter)와, 상기 DSP의 전반적인 동작을 제어하는 DSP 코어(Core), 디지털 데이터를 아날로그 신호로 변환하는 DAC(Digital to Analog Converter), 아날로그 신호를 음악 데이터로 압축하여 인코딩하는 인코더, 상기 마이크로 프로세서의 제어 명령에 따라 상기 튜너에서 인가되는 방송 신호를 디지털 데이터로 변환하거나 인코딩하여 압축하고, 압축된 디지털 데이터를 디코딩하여 출력하는 프로그램이 저장된 DSP 프로그램부, 압축된 디지털 데이터를 디코딩하는 디코더를 포함하는 것을 특징으로 하는 디지털 음악 녹음 재생 장치.
제 1 항에 있어서,

상기 음악 추출부는 주파수 분석을 이용해 상기 신호 처리부에서 인가된 디지털 데이터의 좌채널 데이터와 우채널 데이터를 연산하여 그 결과 데이터를 근거로 모노 데이터와 스테레오 데이터로 분리하고 모노 데이터는 제거해 스테레오 데이터만을 출력하는 것을 특징으로 하는 디지털 음악 녹음 재생 장치.
제 7 항에 있어서,

상기 음악 추출부는 상기 결과 데이터가 '0'에 가까운 데이터이면 모노 데이터로 판단하고, 상기 결과 데이터가 임계값 이상 일정 시간 동안 지속될 경우 스테레오 데이터로 판단하여, 상기 모노 데이터는 제거하고 상기 스테레오 데이터만 출력하는 것을 특징으로 하는 디지털 음악 녹음 재생 장치.
제 7 항에 있어서,

상기 음악 추출부는 상기 신호 처리부에서 인가되는 방송 데이터의 좌채널 데이터와 우채널 데이터를 연산하여 그 결과 데이터를 출력하는 음향 데이터 연산부, 상기 음향 데이터 연산부에서 인가된 결과 데이터가 '0'에 가까운 데이터이면 모노 데이터로 판단하고, 상기 결과 데이터가 임계값 이상 일정 시간 동안 지속될 경우 스테레오 데이터로 판단하여, 상기 모노 데이터는 제거하고 상기 스테레오 데이터만 출력하는 비음악 제거부, 상기 비음악 제거부에서 인가된 상기 음악 데이터를 상기 신호 처리부로 출력하면서 상기 음악 데이터의 처음과 끝 부분을 식별하여 이를 인식하는 시종 데이터를 생성해 상기 마이크로 프로세서로 전송하는 음악 시종 판단부, 상기 음악 시종 판단부에서 인가된 음악 데이터를 스펙트럼 분석하여 음악의 시작과 끝 신호를 분별해 이를 인식하는 시종 데이터를 생성하는 스펙트럼 분석부를 포함하는 것을 특징으로 하는 디지털 음악 녹음 재생 장치.
제 9 항에 있어서,

상기 음악 시종 판단부는 상기 음악 데이터의 종결부(Ending Portion)에 처리되어 있는 페이드 아웃(Fade-out)을 검출하여 이를 근거로 처음과 끝을 식별하는 것을 특징으로 하는 디지털 음악 녹음 재생 장치.
제 9 항에 있어서,

상기 음악 시종 판단부는 이전 음악 데이터와 다음 음악 데이터 사이에 존재하는 묵음(Mute) 데이터를 근거로, 묵음이 나타날 경우 그 음악 데이터의 끝으로 인식하고, 묵음을 지나서 다음 음악 데이터가 이어질 때 그 부분을 다음 음악 데이터의 처음으로 인식하여, 이를 나타내는 시종 데이터를 생성하는 것을 특징으로 하는 디지털 음악 녹음 재생 장치.
제 9 항에 있어서,

상기 음악 시종 판단부는 상기 음악 데이터의 에너지 변화량을 계산하여 에너지가 낮은 구간을 묵음 구간으로 인식해 음악의 끝점 후보로 간주하며, 이때 에너지값은 상기 비음악 제거부에서 인가되는 음악 데이터를 프레임 단위로 하여 그위상값을 제곱하고 로그(Log)를 취하여 얻으며,

음악 검출 구간의 길이를 3 ~ 5분으로 고려하여 음악 구간을 추출함으로써 그 음악의 처음과 끝을 판단하는 것을 특징으로 하는 디지털 음악 녹음 재생 장치.
제 9 항에 있어서,

상기 음악 시종 판단부는 이전 음악 데이터와 다음 음악 데이터의 겹치는 부분이 존재하거나 두 음악 데이터 사이에 묵음 구간이 없이 연속되어 음악 데이터의 시작과 끝 부분을 식별하지 못할 경우에는 상기 스펙트럼 분석부로 상기 음악 데이터를 인가하는 것을 특징으로 하는 디지털 음악 녹음 재생 장치.
제 1 항에 있어서,

상기 음악 추출부는 음성 특징들을 추출할 수 있는 데이터들을 수집한 후에 은닉 마르코프 모델(HMM: Hidden Markov Model)을 이용하여 학습을 시켜서 혼합되어 있는 음향 정보로부터 은닉되어 있는 음성 정보를 추출해 제거하는 것을 특징으로 하는 디지털 음악 녹음 재생 장치.
제 14 항에 있어서,

상기 음악 추출부는 은닉 마르코프 모델에서 매개 변수 추정을 위한 BW 알고리즘을 이용하여 음향 신호 및 그 음향 신호의 특징을 추출하고, 비터비 알고리즘을 이용하여 음악 신호만을 추출해 내는 것을 특징으로 하는 디지털 음악 녹음 재생 장치.
제 14 항에 있어서,

상기 음악 추출부는 상기 튜너에서 인가되는 방송 신호 중 다수의 음향 신호가 포함된 오디오 신호를 입력하여 오디오 신호의 음향 특징(Acoustic Feature)을 추출하는 음향 입력부와, 상기 음향 입력부로부터 입력으로 받은 상기 음향 특징이 음성 인식적으로 어떤 음소인지의 가능성(확률 P)을 나타내는 포스테리어 확률(Posterior Probability)을 구하는 다층 퍼셉트론(Multi-Layer Perceptron), 상기 다층 퍼셉트론에서 인가된 포스테리어 확률을 근거로 연산을 실행하여 프레임 안에서 확률값의 분포를 나타내는 단위인 엔트로피(Entropy: Hn)와 프레임 간에 변화에 대한 확률값인 다이너미즘(Dynamism: Dn)을 구하는 특징 추출부(Feature Extractor), 상기 특징 추출부에서 인가된 엔트로피(Hn)와 다이너미즘(Dn)을 근거로 BW 알고리즘과 비터비 알고리즘을 이용하여 음성 클래스(Speech Class)와 음악 클래스(Music Class)를 선별해 음악 데이터를 출력하는 HMM 선별부를 포함하는 것을 특징으로 하는 디지털 음악 녹음 재생 장치.
제 16 항에 있어서,

상기 음향 특징은 영점 교차 정보(Zero-Crossing Information), 에너지(Energy), 피치(Pitch), 스펙트럼 주파수(Spectral Frequencies), 켑스트럴 계수(Cepstral Coefficient)를 나타내는 것을 특징으로 하는 디지털 음악 녹음 재생 장치.
제 1 항에 있어서,

상기 음악 추출부는 음성 인식(Speech Recognition) 기술에 기반한 독립 성분 분석(ICA: Independent Component Analysis)을 이용하여 방송 신호 중 음성 신호를 분리해 내어 제거함으로써 음악 신호만을 출력하는 것을 특징으로 하는 디지털 음악 녹음 재생 장치.
방송 신호를 수신하여 선국하는 튜너, 선국된 방송 신호를 가청음으로 출력하는 음향 출력부, 상기 방송 신호를 디지털 데이터로 변환하거나 디지털 데이터를 아날로그 신호로 변환하며, 디지털 데이터를 음악 데이터로 압축하여 인코딩(Encoding)하거나 압축된 디지털 데이터를 디코딩하여 출력하는 DSP(Digital Signal Processor: 디지털 신호 처리 프로세서), 상기 DSP에서 인가된 디지털 데이터 중 음악 데이터만을 추출하는 음악 추출부, 음악 데이터를 저장하는 음악 데이터 저장부, 장치의 동작 상태를 표시하는 표시부, 및 라디오 방송을 수신하는 모드로 전환하거나 방송되는 음악 신호에 대해 녹음 저장을 실행하도록 하는 명령을 입력하는 키입력부를 구비하는 디지털 음악 재생 장치의 음악 부분 선별 저장 방법으로서,

(a) 상기 튜너에서 방송 신호를 음향 출력부로 출력함과 더불어 상기 DSP로 인가하는 단계,

(b) 상기 DSP에서 상기 방송 신호를 디지털 데이터로 변환해 상기 음악 추출부로 출력하는 단계,

(c) 상기 음악 추출부가 음악 추출 알고리즘에 따라 상기 디지털 데이터 중에서 음악 데이터만을 추출하는 단계,

(d) 추출한 상기 음악 데이터의 처음과 끝을 인식하여 상기 음악 데이터 저장부에 임시로 저장하는 단계,

(e) 상기 음향 출력부로 현재 출력되는 음악을 저장하는 명령이 상기 키입력부에 의해 입력되었는지를 판단하는 단계,

(f) 상기 음악 데이터 저장부에 임시로 저장되어 있는 상기 음악 데이터의 저장 상태를 확정하여 유지하는 단계

를 포함하는 것을 특징으로 하는 디지털 음악 재생 장치의 음악 부분 선별 저장 방법.
제 19 항에 있어서,

상기 단계 (c)의 상기 음악 추출 알고리즘은,

인공 신경망(Artificial Neural Network)을 이용해 다수의 입력 데이터를 연산하여 음악 데이터와 비음악 데이터로 분리하고 비음악 데이터는 제거해 음악 데이터만을 출력하는 것을 특징으로 하는 디지털 음악 재생 장치의 음악 부분 선별 저장 방법.
제 19 항에 있어서,

상기 단계 (c)의 음악 추출 알고리즘은,

주파수 분석을 이용해 상기 DSP에서 인가된 디지털 데이터의 좌채널 데이터와 우채널 데이터를 연산하여 그 결과 데이터를 근거로 모노 데이터와 스테레오 데이터로 분리하고 모노 데이터는 제거해 스테레오 데이터만을 출력하는 것을 특징으로 하는 디지털 음악 재생 장치의 음악 부분 선별 저장 방법.
제 19 항에 있어서,

상기 단계 (c)의 음악 추출 알고리즘은,

음성 특징들을 추출할 수 있는 데이터들을 수집한 후에 은닉 마르코프 모델(HMM: Hidden Markov Model)을 이용하여 학습을 시켜서 혼합되어 있는 음향 정보로부터 은닉되어 있는 음성 정보를 추출해 제거하는 것을 특징으로 하는 디지털 음악 재생 장치의 음악 부분 선별 저장 방법.
제 19 항에 있어서,

상기 단계 (c)의 음악 추출 알고리즘은,

음성 인식(Speech Recognition) 기술에 기반한 독립 성분 분석(ICA: Independent Component Analysis)을 이용하여 방송 신호 중 음성 신호를 분리해 내어 제거함으로써 음악 신호만을 출력하는 것을 특징으로 하는 디지털 음악 재생 장치의 음악 부분 선별 저장 방법.
제 19 항에 있어서,

상기 단계 (d)에서 상기 음악 데이터 저장부에 임시로 저장되는 상기 음악 데이터는 각 곡마다 저장되는 순서에 따라 순차적으로 저장되고, 상기 음악 데이터만이 계속적으로 저장되다가 상기 음악 데이터 저장부의 저장 용량을 초과하는 경우, 상기 DSP가 상기 음악 데이터 저장부에 저장되어 있던 이전 음악 데이터 중 확정 유지되지 않은 음악 데이터를 먼저 기록된 순서대로 한곡씩 삭제한 후 새로운 음악 데이터를 저장하는 것을 특징으로 하는 디지털 음악 재생 장치의 음악 부분 선별 저장 방법.
제 19 항에 있어서,

상기 단계 (d)에서 이전 음악 데이터와 다음 음악 데이터 사이에 존재하는 묵음(Mute) 데이터를 근거로, 묵음이 나타날 경우 그 음악 데이터의 끝으로 인식하고, 묵음을 지나서 다음 음악 데이터가 이어질 때 그 부분을 다음 음악 데이터의 처음으로 인식하는 것을 특징으로 하는 디지털 음악 재생 장치의 음악 부분 선별 저장 방법.
제 19 항에 있어서,

상기 단계 (d)는 상기 음악 데이터의 종결부(Ending Portion)에 처리되어 있는 페이드 아웃(Fade-out)을 검출하여 이를 근거로 처음과 끝을 식별하는 것을 특징으로 하는 디지털 음악 재생 장치의 음악 부분 선별 저장 방법.
제 19 항에 있어서,

상기 단계 (d)는 상기 음악 데이터의 에너지 변화량을 계산하여 에너지가 낮은 구간을 묵음 구간으로 인식해 음악의 끝점 후보로 간주하며, 이때 에너지값은 상기 비음악 제거부에서 인가되는 음악 데이터를 프레임 단위로 하여 그 위상값을 제곱하고 로그(Log)를 취하여 얻으며,

음악 검출 구간의 길이를 3 ~ 5분으로 고려하여 음악 구간을 추출함으로써 그 음악의 처음과 끝을 판단하는 것을 특징으로 하는 디지털 음악 재생 장치의 음악 부분 선별 저장 방법.
제 21 항에 있어서,

상기 단계 (c)의 음악 추출 알고리즘은,

상기 결과 데이터가 '0'에 가까운 데이터이면 모노 데이터로 판단하고, 상기 결과 데이터가 임계값 이상 일정 시간 동안 지속될 경우 스테레오 데이터로 판단하여, 모노 데이터는 제거하고 스테레오 데이터만 출력하는 것을 특징으로 하는 디지털 음악 재생 장치의 음악 부분 선별 저장 방법.
방송 신호를 수신하여 선국하는 튜너, 상기 방송 신호를 디지털 데이터로 변환하여 음악 데이터로 압축하여 인코딩하는 신호 처리부, 상기 방송 신호에서 음악추출 알고리즘에 따라 음악 부분만을 추출하는 음악 추출부, 추출한 상기 음악 부분 저장하는 메모리를 구비하는 디지털 음악 재생 장치의 음악 부분 선별 방법으로서,

(a) 상기 튜너에서 출력된 상기 방송 신호를 상기 음악 추출부로 인가하는 단계,

(b) 상기 음악 추출부가 음악 추출 알고리즘에 따라 상기 방송 신호 중에서 음악 부분의 처음을 인식하는 단계,

(c) 인식한 상기 음악 데이터를 상기 메모리의 임시 저장 영역에 임시로 저장하는 단계,

(d) 상기 음악 데이터를 저장하는 동안 녹음 저장에 관한 명령이 있는지를 판단하는 단계, 및

(e) 녹음 저장에 관한 명령이 있으면 임시로 저장되어 있는 상기 음악 데이터를 상기 메모리의 확정 저장 영역으로 이전하여 저장하고 그 저장 상태를 확정하여 유지하는 단계

를 포함하는 것을 특징으로 하는 디지털 음악 재생 장치의 음악 부분 선별 방법.
제 29 항에 있어서,

상기 단계 (a)는 상기 튜너에서 출력된 상기 방송 신호를 상기 신호 처리부에서 디지털 데이터로 변환해 상기 음악 추출부로 인가하는 것을 특징으로 하는 디지털 음악 재생 장치의 음악 부분 선별 방법.
제 29 항에 있어서,

상기 단계 (b)의 음악 추출 알고리즘은 주파수 분석을 이용해 상기 신호 처리부에서 인가된 디지털 데이터의 좌채널 데이터와 우채널 데이터를 연산하여 그 결과 데이터를 근거로 모노 데이터와 스테레오 데이터로 분리하고 모노 데이터는 제거해 스테레오 데이터만을 출력하는 것을 특징으로 하는 디지털 음악 재생 장치의 음악 부분 선별 방법.
제 29 항에 있어서,

상기 단계 (b)의 음악 추출 알고리즘은 음성 특징들을 추출할 수 있는 데이터들을 수집한 후에 은닉 마르코프 모델(HMM: Hidden Markov Model)을 이용하여 학습을 시켜서 혼합되어 있는 음향 정보로부터 은닉되어 있는 음성 정보를 추출해 제거하고 음악 데이터만을 추출하는 것을 특징으로 하는 디지털 음악 재생 장치의 음악 부분 선별 방법.
제 29 항에 있어서,

상기 단계 (b)의 음악 추출 알고리즘은 인공 신경망(Artificial Neural Network)을 이용해 다수의 입력 데이터를 연산하여 음악 데이터와 비음악 데이터로 분리하고 비음악 데이터는 제거해 음악 데이터만을 출력하는 것을 특징으로 하는디지털 음악 재생 장치의 음악 부분 선별 방법.
제 29 항에 있어서,

상기 단계 (b)의 음악 추출 알고리즘은 음성 인식(Speech Recognition) 기술에 기반한 독립 성분 분석(ICA: Independent Component Analysis)을 이용하여 방송 데이터 중 음성 데이터를 분리해 내어 제거함으로써 음악 데이터만을 출력하는 것을 특징으로 하는 디지털 음악 재생 장치의 음악 부분 선별 방법.
제 29 항에 있어서,

상기 단계 (e)에서 녹음 저장에 관한 명령이 없으면, 상기 단계 (b)로 복귀하여 다음 음악 부분에 대해 인식하는 것을 특징으로 하는 디지털 음악 재생 장치의 음악 부분 선별 방법.