KR20160112177A - 데이터 은닉을 이용한 오디오 메타데이터 삽입/추출 장치 및 방법 - Google Patents

데이터 은닉을 이용한 오디오 메타데이터 삽입/추출 장치 및 방법 Download PDF

Info

Publication number
KR20160112177A
KR20160112177A KR1020150037392A KR20150037392A KR20160112177A KR 20160112177 A KR20160112177 A KR 20160112177A KR 1020150037392 A KR1020150037392 A KR 1020150037392A KR 20150037392 A KR20150037392 A KR 20150037392A KR 20160112177 A KR20160112177 A KR 20160112177A
Authority
KR
South Korea
Prior art keywords
audio signal
metadata
original audio
digital audio
format
Prior art date
Application number
KR1020150037392A
Other languages
English (en)
Inventor
성종모
박태진
백승권
이용주
이태진
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020150037392A priority Critical patent/KR20160112177A/ko
Publication of KR20160112177A publication Critical patent/KR20160112177A/ko

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/11Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information not detectable on the record carrier
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/036Insert-editing

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

데이터 은닉을 이용한 오디오 메타데이터 삽입/추출 장치 및 방법이 개시된다. 오디오 메타데이터 삽입 방법은 원본 오디오 신호 및 상기 원본 오디오 신호와 관련된 메타데이터를 수신하는 단계, 상기 수신된 메타데이터를 상기 원본 오디오 신호에 은닉된 형태로 삽입하는 단계 및 상기 메타데이터가 은닉된 형태로 삽입된 원본 오디오 신호를 지정된 포맷으로 인코딩하는 단계를 포함할 수 있다.

Description

데이터 은닉을 이용한 오디오 메타데이터 삽입/추출 장치 및 방법{APPARATUS AND METHOD FOR AUDIO METADATA INSERTION/EXTRACTION USING DATA HIDING}
본 발명은 데이터 은닉을 이용한 오디오 메타데이터 삽입/추출 방법 및 장치에 관한 것으로, 보다 구체적으로는 디지털 오디오 신호 자체에 메타데이터를 은닉된 형태로 삽입하거나, 은닉된 형태로 삽입된 메타데이터를 추출하는 방법 및 장치에 관한 것이다.
디지털 오디오 신호는 여러 종류의 포맷으로 저장될 수 있다. 예를 들어, wav, aiff, au, raw 등과 같이 비압축 방식으로 디지털 오디오 신호를 저장하는 포맷이 존재한다. 또한, flac, apple lossless, MPEG lossless 등과 같이 무손실 압축 방식으로 디지털 오디오 신호를 저장하는 포맷과 mp3, aac, wma등과 같이 손실 압축 방식으로 디지털 오디오 신호를 저장하는 포맷이 존재한다.
이때, 디지털 오디오 신호는 소리를 나타내는 실제 오디오 데이터뿐만 아니라, 샘플링 주파수, 채널 수, 비트 해상도 등의 재생에 필요한 정보를 헤더 형태로 저장하고 있다. 또한, 디지털 오디오 신호는 곡 제목, 아티스트 명, 앨범 명, 트랙 번호, 장르 및 DRM(Digital Right Management) 정보와 같이 해당 디지털 오디오 신호에 대한 다양한 정보를 포함하고 있다. 이러한 정보들은 메타데이터라고 불리며, 이러한 메타데이터를 저장하기 위한 포맷은 디지털 오디오 신호의 저장 포맷에 따라 RIFF, ID3 및 XMP(Extensible Metadata Platform) 등의 다양한 방식이 존재한다.
그러나, 이러한 종래의 메타데이터를 저장하기 위한 포맷은 포맷 간의 호환성을 제공하지 않는다. 따라서, 사용자가 특정 디지털 오디오 신호의 저장 포맷을 다른 형식의 포맷으로 변환하거나 재인코딩하는 경우, 기존의 메타데이터는 새로운 포맷에 맞게 재입력되거나 별도의 변환 프로그램을 거쳐야 하는 불편함을 초래하였다. 또한, 사용자가 특정 디지털 오디오 신호를 raw 포맷과 같이 별도의 메타데이터를 저장하기 위한 포맷을 지원하지 않는 디지털 오디오 신호로 포맷을 변환하거나 해당 디지털 오디오 신호를 플레이어를 통해 재생하는 경우, 해당 메타데이터가 사라지는 문제점이 발생하였다.
본 발명은 데이터 은닉을 이용한 오디오 메타데이터 삽입/추출 장치 및 방법에 관한 것으로, 상기의 단점을 극복하기 위하여 디지털 오디오 신호 자체에 메타데이터를 은닉된 형태로 삽입함으로써, 추가적인 메타데이터의 변환 작업 없이 디지털 오디오 신호의 포맷 변환 혹은 재인코딩으로 메타데이터 정보를 유지할 수 있는 오디오 메타데이터 삽입/추출 장치 및 방법을 제공한다.
오디오 메타데이터 삽입 장치가 수행하는 오디오 메타데이터 삽입 방법에 있어서, 오디오 메타데이터 삽입 장치는 원본 오디오 신호 및 상기 원본 오디오 신호와 관련된 메타데이터를 수신하는 단계, 상기 수신된 메타데이터를 상기 원본 오디오 신호에 은닉된 형태로 삽입하는 단계 및 상기 메타데이터가 은닉된 형태로 삽입된 원본 오디오 신호를 지정된 포맷으로 인코딩하는 단계를 포함할 수 있다.
상기 삽입하는 단계는 에코 방식을 이용하여 메타데이터를 원본 오디오 신호에 은닉하여 삽입할 수 있다.
상기 삽입하는 단계는 스펙트럼 확산 방식을 이용하여 메타데이터를 원본 오디오 신호에 은닉하여 삽입할 수 있다.
상기 삽입하는 단계는 위상 변조 방식을 이용하여 메타데이터를 원본 오디오 신호에 은닉하여 삽입할 수 있다.
상기 인코딩하는 단계는 비압축 방식을 이용하여 원본 오디오 신호를 인코딩 할 수 있다.
상기 인코딩하는 단계는 무손실 압축 방식을 이용하여 원본 오디오 신호를 인코딩 할 수 있다.
상기 인코딩하는 단계는 손실 압축 방식을 이용하여 원본 오디오 신호를 인코딩 할 수 있다.
상기 인코딩된 원본 오디오 신호의 포맷을 변환하는 단계를 더 포함할 수 있다.
상기 변환하는 단계는 상기 인코딩된 원본 오디오 신호를 재생하는 단말이 지원하는 포맷으로 변환할 수 있다.
오디오 메타데이터 추출 장치가 수행하는 오디오 메타데이터 추출 방법에 있어서, 오디오 메타데이터 추출 장치는 인코딩된 원본 오디오 신호를 디코딩하는 단계, 상기 디코딩된 원본 오디오 신호를 재생하는 단계 및 상기 디코딩된 원본 오디오 신호에서 메타데이터를 추출하는 단계를 포함하고, 상기 인코딩된 원본 오디오 신호는 상기 메타데이터가 은닉된 형태로 삽입된 오디오 신호일 수 있다.
상기 디코딩하는 단계는 비압축 방식을 이용하여 원본 오디오 신호를 디코딩할 수 있다.
상기 디코딩하는 단계는 무손실 압축 방식을 이용하여 원본 오디오 신호를 디코딩할 수 있다.
상기 디코딩하는 단계는 손실 압축 방식을 이용하여 원본 오디오 신호를 디코딩할 수 있다.
상기 추출하는 단계는 에코 방식을 이용하여 원본 오디오 신호에 은닉된 메타데이터를 추출할 수 있다.
상기 추출하는 단계는 스펙트럼 확산 방식을 이용하여 원본 오디오 신호에 은닉된 메타데이터를 추출할 수 있다.
상기 추출하는 단계는 위상 변조 방식을 이용하여 원본 오디오 신호에 은닉된 메타데이터를 추출할 수 있다.
상기 인코딩된 원본 오디오 신호의 포맷을 변환하는 단계를 더 포함할 수 있다.
상기 변환하는 단계는 상기 인코딩된 원본 오디오 신호를 재생하는 단말이 지원하는 포맷으로 변환할 수 있다.
오디오 메타데이터 삽입 장치는 원본 오디오 신호 및 상기 원본 오디오 신호와 관련된 메타데이터를 수신하는 수신부, 상기 수신된 메타데이터를 상기 원본 오디오 신호에 은닉된 형태로 삽입하는 삽입부, 상기 메타데이터가 은닉된 형태로 삽입된 원본 오디오 신호를 지정된 포맷으로 인코딩하는 인코딩부 및 상기 인코딩된 원본 오디오 신호의 포맷을 변환하는 포맷 변환부를 포함할 수 있다.
오디오 메타데이터 추출 장치는 인코딩된 원본 오디오 신호의 포맷을 변환하는 포맷 변환부, 상기 인코딩된 원본 오디오 신호를 디코딩하는 디코딩부, 상기 디코딩된 원본 오디오 신호를 재생하는 재생부 및 상기 디코딩된 원본 오디오 신호에서 메타데이터를 추출하는 추출부를 포함하고, 상기 인코딩된 원본 오디오 신호는 상기 메타데이터가 은닉된 형태로 삽입될 수 있다.
본 발명의 일실시예에 따르면, 디지털 오디오 신호 자체에 메타데이터를 은닉된 형태로 삽입함으로써, 추가적인 메타데이터의 변환 작업 없이 디지털 오디오 신호의 포맷 변환 혹은 재인코딩으로 메타데이터 정보를 유지할 수 있다.
도 1은 일실시예에 따른 오디오 메타데이터 삽입 장치를 도시화한 것이다.
도 2는 일실시예에 따른 오디오 메타데이터 추출 장치를 도시화한 것이다.
도 3은 일실시예에 따른 오디오 메타데이터 삽입 및 추출 방법을 도시화한 것이다.
도 4는 일실시예에 따른 포맷 변환을 포함한 오디오 메타데이터 삽입 및 추출 방법을 도시화한 것이다.
도 5는 일실시예에 따른 외부 녹음 장치에 의한 메타데이터 추출 방법을 도시화한 것이다.
이하, 본 발명의 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.
도 1은 일실시예에 따른 오디오 메타데이터 삽입 장치를 도시화한 것이다.
오디오 메타데이터 삽입 장치(100)는 수신부(110), 삽입부(120), 인코딩부(130) 및 포맷 변환부(140)로 구성될 수 있다. 수신부(110)는 원본 디지털 오디오 신호와 메타데이터를 수신할 수 있다. 수신부(110)를 통해 수신되는 원본 디지털 오디오 신호는 미리 일정한 포맷으로 저장된 디지털 오디오 파일 및 마이크로폰과 A/D 변환 장치를 통해 입력되는 실시간 디지털 오디오 신호를 포함할 수 있다.
이러한 디지털 오디오 파일들은 실제 오디오 신호뿐만 아니라 재생에 필요한 샘플링 주파수, 채널 수, 비트 해상도 등의 재생에 필요한 정보를 헤더 형태로 저장하고 있다. 또한, 디지털 오디오 파일들은 곡 제목, 아티스트 명, 앨범 명, 트랙 번호, 장르 및 DRM(Digital Right Management) 정보와 같이 해당 디지털 오디오 신호에 대한 부가적인 정보를 포함하고 있다. 이러한 정보들을 메타데이터라고 부를 수 있다. 기존에는 메타데이터 역시 일정한 포맷에 의해 저장되었다. 예를 들어, 메타데이터는 RIFF, ID3 및 XMP(Extensible Metadata Platform) 등의 다양한 방식의 포맷으로 저장될 수 있다. 그러나, 본 발명에서는 메타데이터를 특정한 형식의 포맷으로 저장하지 않고 메타데이터에 포함되는 정보들을 그대로 수신할 수 있다.
삽입부(120)는 원본 디지털 오디오 신호에 메타데이터를 은닉된 형태로 삽입할 수 있다. 기존의 경우 디지털 오디오 신호와 메타데이터들이 하나의 파일 안에서 함께 존재할 수 있도록 컨테이너 포맷 기술을 이용하였다. 기존의 메타데이터는 RIFF, ID3 및 XMP(Extensible Metadata Platform) 등의 다양한 방식의 포맷으로 저장될 수 있다. 이와 같이 다양한 방식의 포맷으로 저장된 메타데이터는 디지털 오디오 신호화 함께 인코딩됨으로써, 해당 디지털 오디오 신호에 대한 정보를 제공할 수 있다.
삽입부(120)는 에코 방식, 스펙트럼 확산 방식 및 위상 변조 방식을 이용하여 원본 디지털 오디오 신호에 메타데이터를 은닉된 형태로 삽입할 수 있다. 이때, 메타데이터가 은닉된 형태로 삽입된 원본 디지털 오디오 신호는 상기 원본 디지털 오디오 신호를 재생하는 재생장치에서 인식되어 재생될 수 있다. 즉, 원본 오디오 신호에 메타데이터를 은닉된 형태로 삽입함으로써 상기 원본 오디오 신호에 변형이 발생할 경우에도, 상기 메타데이터가 은닉된 형태로 삽입된 원본 오디오 신호는 변함없이 재생될 수 있다.
인코딩부(130)는 메타데이터가 은닉된 형태로 삽입된 원본 디지털 오디오 신호를 인코딩할 수 있다. 원본 디지털 오디오 신호는 일정한 포맷으로 인코딩될 수 있다. 예를 들어, 원본 디지털 오디오 신호는 wav, aiff, au, raw 등과 같이 비압축 방식의 포맷으로 인코딩될 수 있다. 또한, flac, apple lossless, MPEG lossless 등과 같이 무손실 압축 방식과 mp3, aac, wma등과 같이 손실 압축 방식의 포맷으로 인코딩될 수 있다.
비압축 방식의 포맷은 표현 그대로 원본 디지털 오디오 신호를 압축하지 않는 것을 의미한다. 그러나 디지털 오디오 신호를 압축하지 않는 경우 디지털 오디오 신호가 가지는 필요 저장 공간이 커짐에 따라 저장 공간을 효율적으로 사용하는 것이 쉽지 않다. 따라서, 더 적은 저장 공간에서 효율적으로 디지털 오디오 신호를 기록하기 위하여 디지털 오디오 신호를 압축할 수 있다.
압축 기술의 종류에 따라 디지털 오디오 신호의 내용을 바꾸지 않고 원래 내용 그대로 디코딩할 수 있는 무손실 압축과 더 높은 압축률을 획득할 수 있지만 디코딩한 디지털 오디오 신호의 일부를 희생시키는 손실 압축이 존재한다. 무손실 압축을 위한 알고리즘의 대표적인 방법으로 반복 길이 부호화, 허프만 부호화 및 산술 부호화 등이 존재한다. 또한, 손실 압축을 위한 알고리즘의 경우, 인간의 감각 기관의 특성을 역이용하여 압축률을 높이므로, 음성, 정지화상, 동영상 등 데이터의 종류에 따라 각각 다른 알고리즘이 사용될 수 있다. 이때, 가장 널리 사용되는 손실 압축 알고리즘에 MPEG 표준 압축 기술이 존재한다.
포맷 변환부(140)는 인코딩된 원본 디지털 오디오 신호를 다른 포맷의 디지털 오디오 신호로 변환할 수 있다. 디지털 오디오 파일을 재생장치에서 실행하더라도 재생장치는 디지털 오디오 파일 내의 디지털 오디오 신호를 인식하지 못할 수 있다. 이는 해당 재생장치가 디코딩 알고리즘, 즉 코덱을 가지고 있지 않기 때문이다. 따라서, 포맷 변환부(140)는 인코딩된 원본 디지털 오디오 신호를 재생장치에서 지원 가능한 포맷의 디지털 오디오 신호로 변환할 수 있다.
도 2는 일실시예에 따른 오디오 메타데이터 추출 장치를 도시화한 것이다.
오디오 메타데이터 추출 장치(200)는 포맷 변환부(210), 디코딩부(220), 재생부(230) 및 추출부(240)으로 구성될 수 있다. 포맷 변환부(210)는 특정 포맷으로 인코딩된 원본 디지털 오디오 신호를 다른 포맷의 디지털 오디오 신호로 변환할 수 있다. 인코딩된 원본 디지털 오디오 신호를 디코딩할 수 있는 디코딩부(220)에서 해당 인코딩된 원본 디지털 오디오 신호에 대한 디코딩 알고리즘, 즉 코덱을 가지고 있지 않은 경우 재생부(230)는 디코딩된 원본 디지털 오디오 신호를 재생할 수 없다. 따라서, 포맷 변환부(210)는 인코딩된 원본 디지털 오디오 신호를 디코딩부(220)에서 디코딩 가능한 포맷 형태의 디지털 오디오 신호로 변환할 필요가 있다.
이때, 인코딩된 원본 디지털 오디오 신호는 메타데이터가 원본 디지털 오디오 신호에 은닉된 형태로 삽입되어 있다. 따라서, 포맷 변환부(210)를 통해 인코딩된 원본 디지털 오디오 신호의 포맷을 변환하더라도 메타데이터는 없어지거나 일부가 손실되지 않을 수 있다.
디코딩부(220)는 인코딩된 원본 디지털 오디오 신호를 디코딩할 수 있다. 이때, 인코딩된 원본 디지털 오디오 신호는 메타데이터가 원본 디지털 오디오 신호에 은닉된 형태로 삽입되어 있다. 인코딩된 원본 디지털 오디오 신호는 wav, aiff, au, raw 등과 같이 비압축 방식의 포맷으로 디코딩될 수 있다. 또한, flac, apple lossless, MPEG lossless 등과 같이 무손실 압축 방식과 mp3, aac, wma등과 같이 손실 압축 방식의 포맷으로 디코딩될 수 있다.
비압축 방식의 포맷은 표현 그대로 디지털 오디오 신호를 압축하지 않는 것을 의미한다. 그러나 디지털 오디오 신호를 압축하지 않는 경우 디지털 오디오 신호가 가지는 필요 저장 공간이 커짐에 따라 저장 공간을 효율적으로 사용하는 것이 쉽지 않다. 따라서, 더 적은 저장 공간에서 효율적으로 디지털 오디오 신호를 기록하기 위하여 디지털 오디오 신호를 압축할 수 있다.
압축 기술의 종류에 따라 디지털 오디오 신호의 내용을 바꾸지 않고 원래 내용 그대로 디코딩할 수 있는 무손실 압축과 더 높은 압축률을 획득할 수 있지만 디코딩한 데이터의 일부를 희생시키는 손실 압축이 존재한다. 무손실 압축을 위한 알고리즘의 대표적인 방법으로 반복 길이 부호화, 허프만 부호화 및 산술 부호화 등이 존재한다. 또한, 손실 압축을 위한 알고리즘의 경우, 인간의 감각 기관의 특성을 역이용하여 압축률을 높이므로, 음성, 정지화상, 동영상 등 데이터의 종류에 따라 각각 다른 알고리즘이 사용될 수 있다. 이때, 가장 널리 사용되는 손실 압축 알고리즘에 MPEG 표준 압축 기술이 존재한다.
재생부(230)는 디코딩된 원본 디지털 오디오 신호를 재생할 수 있다. 재생부(230)는 디코딩된 원본 디지털 오디오 신호에 은닉된 형태로 삽입되어 있는 메타데이터를 이용하여 원본 디지털 오디오 신호를 재생할 수 있다. 메타데이터는 곡 제목, 아티스트 명, 앨범 명, 트랙 번호, 장르 및 DRM(Digital Right Management) 정보와 같이 해당 디지털 오디오 신호에 대한 부가적인 정보뿐 아니라 재생에 필요한 샘플링 주파수, 채널 수, 비트 해상도 등의 재생에 필요한 정보를 헤더 형태로 저장하고 있다. 재생부(230)는 상기 재생에 필요한 정보를 이용하여 디코딩된 원본 디지털 오디오 신호를 재생할 수 있다.
추출부(240)는 원본 디지털 오디오 신호에 은닉된 형태로 삽입되어 있는 메타데이터를 추출할 수 있다. 기존의 경우 디지털 오디오 신호와 다양한 포맷으로 저장된 메타데이터를 함께 인코딩함으로써, 디지털 오디오 파일의 저작, 가공, 유통 및 소비의 단계를 거침에 따라, 메타데이터가 없어지거나 일부가 손실되는 경우가 발생하였다. 그러나, 본 발명에서는 디지털 오디오 신호에 은닉된 형태로 메타데이터를 삽입함으로써, 디지털 오디오 파일의 저작, 가공, 유통 및 소비의 단계를 거치더라도 메타데이터를 유지할 수 있다.
추출부(240)는 에코 방식, 스펙트럼 확산 방식 및 위상 변조 방식을 이용하여 원본 디지털 오디오 신호에 은닉된 형태로 삽입된 메타데이터를 추출할 수 있다. 이때, 은닉된 형태로 삽입된 메타데이터가 추출된 원본 디지털 오디오 신호는 상기 원본 오디오 신호를 재생하는 재생장치에서 인식되어 재생될 수 있다. 즉, 메타데이터가 은닉된 형태로 삽입된 원본 디지털 오디오 신호에서 메타데이터를 추출함으로써 상기 원본 디지털 오디오 신호에 변형이 발생할 경우에도 은닉된 형태로 삽입된 메타데이터가 추출된 원본 디지털 오디오 신호는 변함없이 재생될 수 있다.
도 3은 일실시예에 따른 오디오 메타데이터 삽입 및 추출 방법을 도시화한 것이다.
단계(310)에서, 오디오 메타데이터 삽입 장치(100)의 수신부(110)는 원본 디지털 오디오 신호 및 원본 디지털 오디오 신호와 관련된 메타데이터를 수신할 수 있다. 원본 디지털 오디오 신호는 미리 일정한 포맷으로 저장된 오디오 파일 및 마이크로폰과 A/D 변화 장치를 통해 입력되는 실시간 디지털 오디오 신호를 포함할 수 있다. 메타데이터는 원본 디지털 오디오 신호에 관한 정보로서, 재생에 필요한 샘플링 주파수, 채널 수, 비트 해상도 등의 재생에 필요한 정보를 헤더 형태로 저장될 수 있다. 또한, 메타데이터는 곡 제목, 아티스트 명, 앨범 명, 트랙 번호, 장르 및 DRM(Digital Right Management) 정보와 같이 해당 원본 디지털 오디오 신호에 대한 부가적인 정보를 포함할 수 있다.
단계(320)에서, 오디오 메타데이터 삽입 장치(100)의 삽입부(120)는 원본 디지털 오디오 신호에 메타데이터를 은닉된 형태로 삽입할 수 있다. 기존의 경우 디지털 오디오 파일은 원본 디지털 오디오 신호와 메타데이터가 저장된 파일을 함께 특정 디지털 오디오 포맷으로 인코딩 함으로써 생성되었다. 그러나, 이러한 형태의 디지털 오디오 파일의 경우 기존의 디지털 오디오 포맷에서 다른 디지털 오디오 포맷으로 변환하는 과정에서 메타데이터가 없어지거나 일부가 손실되는 경우가 발생하였다. 이를 방지하기 위하여 본 발명에서는 원본 디지털 오디오 신호에 메타데이터를 은닉된 형태로 삽입함으로써, 디지털 오디오 파일의 포맷을 변환하더라도 메타데이터를 유지할 수 있는 방법을 제공한다.
오디오 메타데이터 삽입 장치(100)는 에코 방식, 스펙트럼 확산 방식 및 위상 변조 방식을 이용하여 원본 디지털 오디오 신호에 메타데이터를 은닉된 형태로 삽입할 수 있다.
단계(330)에서, 오디오 메타데이터 삽입 장치(100)의 인코딩부(130)는 메타데이터가 은닉된 형태로 삽입된 원본 디지털 오디오 신호를 특정 포맷으로 인코딩할 수 있다. 예를 들어, 원본 디지털 오디오 신호는 wav, aiff, au, raw 등과 같이 비압축 방식의 포맷으로 인코딩될 수 있다. 또한, flac, apple lossless, MPEG lossless 등과 같이 무손실 압축 방식과 mp3, aac, wma등과 같이 손실 압축 방식의 포맷으로 인코딩될 수 있다.
단계(340)에서, 오디오 메타데이터 추출 장치(200)의 디코딩부(220)는 인코딩된 원본 디지털 오디오 신호를 디코딩 할 수 있다. 이때, 인코딩된 원본 디지털 오디오 신호는 메타데이터가 원본 디지털 오디오 신호에 은닉된 형태로 삽입되어 있다. 인코딩된 원본 디지털 오디오 신호는 wav, aiff, au, raw 등과 같이 비압축 방식의 포맷으로 디코딩될 수 있다. 또한, flac, apple lossless, MPEG lossless 등과 같이 무손실 압축 방식과 mp3, aac, wma등과 같이 손실 압축 방식의 포맷으로 디코딩될 수 있다.
단계(350)에서, 오디오 메타데이터 추출 장치(200)의 추출부(240)는 디코딩된 원본 디지털 오디오 신호에서 메타데이터를 추출할 수 있다. 이때, 디코딩된 원본 디지털 오디오 신호는 메타데이터가 원본 디지털 오디오 신호에 은닉된 형태로 삽입되어 있다. 기존의 경우, 디지털 오디오 신호와 다양한 포맷으로 저장된 메타데이터를 함께 인코딩함으로써, 디지털 오디오 파일의 저작, 가공, 유통 및 소비의 단계를 거침에 따라, 메타데이터가 없어지거나 일부가 손실되는 경우가 발생하였다. 그러나, 본 발명에서는 디지털 오디오 신호에 은닉된 형태로 메타데이터를 삽입함으로써, 디지털 오디오 파일의 저작, 가공, 유통 및 소비의 단계를 거치더라도 메타데이터를 유지할 수 있다.
이때, 오디오 메타데이터 추출 장치(200)는 에코 방식, 스펙트럼 확산 방식 및 위상 변조 방식을 이용하여 원본 디지털 오디오 신호에 은닉된 형태로 삽입된 메타데이터를 추출할 수 있다.
단계(360)에서, 오디오 메타데이터 추출 장치(200)의 재생부(230)는 디코딩된 원본 디지털 오디오 신호를 재생할 수 있다. 오디오 메타데이터 추출 장치(200)는 디코딩된 원본 디지털 오디오 신호에 은닉된 형태로 삽입되어 있는 메타데이터를 이용하여 디코딩된 원본 디지털 오디오 신호를 재생할 수 있다. 메타데이터는 곡 제목, 아티스트 명, 앨범 명, 트랙 번호, 장르 및 DRM(Digital Right Management) 정보와 같이 해당 디지털 오디오 신호에 대한 부가적인 정보뿐 아니라 재생에 필요한 샘플링 주파수, 채널 수, 비트 해상도 등의 재생에 필요한 정보를 헤더 형태로 저장하고 있다. 오디오 메타데이터 추출 장치(200)는 상기 재생에 필요한 정보를 이용하여 디코딩된 원본 디지털 오디오 신호를 재생할 수 있다.
단계(370)에서, 오디오 메타데이터 추출 장치(200)는 메타데이터 활용 유닛를 이용하여 추출된 메타데이터를 활용할 수 있다. 예를 들어, 오디오 메타데이터 추출 장치(200)는 메타데이터 활용 유닛의 디스플레이를 통해 해당 원본 디지털 오디오 신호의 곡 제목 및 아티스트 명을 사용자에게 제공할 수 있다.
도 4는 일실시예에 따른 포맷 변환을 포함한 오디오 메타데이터 삽입 및 추출 방법을 도시화한 것이다.
단계(410)에서, 오디오 메타데이터 삽입 장치(100)의 수신부(110)는 원본 디지털 오디오 신호 및 원본 디지털 오디오 신호와 관련된 메타데이터를 수신할 수 있다.
단계(420)에서, 오디오 메타데이터 삽입 장치(100)의 삽입부(120)는 원본 디지털 오디오 신호에 메타데이터를 은닉된 형태로 삽입할 수 있다. 이때, 오디오 메타데이터 삽입 장치(100)는 에코 방식, 스펙트럼 확산 방식 및 위상 변조 방식을 이용하여 원본 디지털 오디오 신호에 메타데이터를 은닉된 형태로 삽입할 수 있다.
단계(430)에서, 오디오 메타데이터 삽입 장치(100)의 인코딩부(130)는 메타데이터가 은닉된 형태로 삽입된 원본 디지털 오디오 신호를 특정 포맷으로 인코딩할 수 있다.
단계(440)에서, 오디오 메타데이터 삽입 장치(100)의 포맷 변환부(140)는 인코딩된 원본 디지털 오디오 신호를 다른 포맷의 디지털 오디오 신호로 변환할 수 있다. 디지털 오디오 신호를 재생장치에서 실행하더라도 재생장치는 디지털 오디오 신호를 인식하지 못할 수 있다. 이는 해당 재생장치가 디코딩 알고리즘, 즉 코덱을 가지고 있지 않기 때문이다. 따라서, 포맷 변환부(140)에서 인코딩된 원본 디지털 오디오 신호는 재생장치에서 지원 가능한 포맷의 디지털 오디오 신호로 변환되는 것이 가능하다.
기존의 기술의 경우 디지털 오디오 신호와 다양한 포맷으로 저장된 메타데이터를 함께 인코딩함으로써, 디지털 오디오 파일의 저작, 가공, 유통 및 소비의 단계를 거침에 따라, 메타데이터가 없어지거나 일부가 손실되는 경우가 발생하였다. 특히, RAW 포맷과 같이 메타데이터를 포함하지 않는 포맷의 경우 디지털 오디오 파일의 포맷을 변경하는 경우 메타데이터가 사라지는 문제점이 있었다. 그러나, 본 발명에서는 원본 디지털 오디오 신호에 메타데이터를 은닉한 형태로 삽입함으로써, 디지털 오디오 신호의 포맷을 변경하더라도 메타데이터가 사라지거나 일부가 소실되는 것을 방지할 수 있다.
이러한 포맷 변환부(140)는 오디오 메타데이터 삽입 장치(100)에 포함되거나, 오디오 메타데이터 추출 장치(200)에 포함될 수 있다. 혹은 포맷 변환부(140)가 하나의 장치로써 존재할 수 있다.
단계(450)에서, 오디오 메타데이터 추출 장치(200)의 디코딩부(220)는 인코딩된 원본 디지털 오디오 신호를 디코딩 할 수 있다. 이때, 인코딩된 원본 디지털 오디오 신호는 메타데이터가 원본 디지털 오디오 신호에 은닉된 형태로 삽입되어 있다.
단계(460)에서, 오디오 메타데이터 추출 장치(200)의 추출부(240)는 디코딩된 원본 디지털 오디오 신호에서 메타데이터를 추출할 수 있다. 이때, 디코딩된 원본 디지털 오디오 신호는 메타데이터가 원본 디지털 오디오 신호에 은닉된 형태로 삽입되어 있다.
도 5는 일실시예에 따른 외부 녹음 장치에 의한 메타데이터 추출 방법을 도시화한 것이다.
단계(510)에서, 디지털 오디오 신호를 재생하는 재생장치(미도시)의 디코딩부는 인코딩된 원본 디지털 오디오 신호를 디코딩할 수 있다. 이때, 인코딩된 원본 디지털 오디오 신호는 메타데이터가 원본 디지털 오디오 신호에 은닉된 형태로 삽입되어 있다.
단계(520)에서, 디지털 오디오 신호를 재생하는 재생장치의 재생부는 디코딩된 원본 디지털 오디오 신호를 재생할 수 있다. 재생부(230)는 디코딩된 원본 디지털 오디오 신호에 은닉된 형태로 삽입되어 있는 메타데이터를 이용하여 원본 디지털 오디오 신호를 재생할 수 있다. 메타데이터는 곡 제목, 아티스트 명, 앨범 명, 트랙 번호, 장르 및 DRM(Digital Right Management) 정보와 같이 해당 디지털 오디오 신호에 대한 부가적인 정보뿐 아니라 재생에 필요한 샘플링 주파수, 채널 수, 비트 해상도 등의 재생에 필요한 정보를 헤더 형태로 저장하고 있다. 재생부(230)는 상기 재생에 필요한 정보를 이용하여 디코딩된 원본 디지털 오디오 신호를 재생할 수 있다.
단계(530)에서, 외부 녹음 장치(미도시)는 재생장치를 통해 재생되는 원본 디지털 오디오 신호를 녹음할 수 있다. 이때, 재생되는 원본 디지털 오디오 신호는 메타데이터가 원본 디지털 오디오 신호에 은닉된 형태로 삽입되어 있다.
단계(540)에서, 오디오 메타데이터 추출 장치(100)의 추출부(240)는 외부 녹음 장치를 통해 녹음된 원본 디지털 오디오 신호에서 메타데이터를 추출할 수 있다. 이때, 외부 녹음 장치를 통해 녹음된 원본 디지털 오디오 신호는 메타데이터가 은닉된 형태로 삽입되어 있다.
단계(550)에서, 오디오 메타데이터 추출 장치(200)는 메타데이터 활용 유닛(미도시)를 이용하여 추출된 메타데이터를 활용할 수 있다. 예를 들어, 오디오 메타데이터 추출 장치(200)는 메타데이터 활용 유닛의 디스플레이를 통해 해당 녹음된 원본 디지털 오디오 신호의 가사를 사용자에게 제공할 수 있다.
이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPA(field programmable array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다. 그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.
100 : 오디오 메타데이터 삽입 장치
110 : 수신부
120 : 삽입부
130 : 인코딩부
140 : 포맷 변환부
200 : 오디오 메타데이터 추출 장치
210 : 포맷 변환부
220 : 디코딩부
230 : 재생부
240 : 추출부

Claims (20)

  1. 원본 오디오 신호 및 상기 원본 오디오 신호와 관련된 메타데이터를 수신하는 단계;
    상기 수신된 메타데이터를 상기 원본 오디오 신호에 은닉된 형태로 삽입하는 단계; 및
    상기 메타데이터가 은닉된 형태로 삽입된 원본 오디오 신호를 지정된 포맷으로 인코딩하는 단계
    를 포함하는 오디오 메타데이터 삽입 방법.
  2. 제1항에 있어서,
    상기 삽입하는 단계는,
    에코 방식을 이용하여 메타데이터를 원본 오디오 신호에 은닉하여 삽입하는 오디오 메타데이터 삽입 방법.
  3. 제1항에 있어서,
    상기 삽입하는 단계는,
    스펙트럼 확산 방식을 이용하여 메타데이터를 원본 오디오 신호에 은닉하여 삽입하는 오디오 메타데이터 삽입 방법.
  4. 제1항에 있어서,
    상기 삽입하는 단계는,
    위상 변조 방식을 이용하여 메타데이터를 원본 오디오 신호에 은닉하여 삽입하는 오디오 메타데이터 삽입 방법.
  5. 제1항에 있어서,
    상기 인코딩하는 단계는,
    비압축 방식을 이용하여 원본 오디오 신호를 인코딩하는 메타데이터 삽입 방법.
  6. 제1항에 있어서,
    상기 인코딩하는 단계는,
    무손실 압축 방식을 이용하여 원본 오디오 신호를 인코딩하는 메타데이터 삽입 방법.
  7. 제1항에 있어서,
    상기 인코딩하는 단계는,
    손실 압축 방식을 이용하여 원본 오디오 신호를 인코딩하는 메타데이터 삽입 방법.
  8. 제1항에 있어서,
    상기 인코딩된 원본 오디오 신호의 포맷을 변환하는 단계
    를 더 포함하는 오디오 메타데이터 삽입 방법.
  9. 제8항에 있어서,
    상기 변환하는 단계는,
    상기 인코딩된 원본 오디오 신호를 재생하는 단말이 지원하는 포맷으로 변환하는 오디오 메타데이터 삽입 방법.
  10. 인코딩된 원본 오디오 신호를 디코딩하는 단계;
    상기 디코딩된 원본 오디오 신호를 재생하는 단계; 및
    상기 디코딩된 원본 오디오 신호에서 메타데이터를 추출하는 단계
    를 포함하고,
    상기 인코딩된 원본 오디오 신호는,
    상기 메타데이터가 은닉된 형태로 삽입된 오디오 신호인 오디오 메타데이터 추출 방법.
  11. 제10항에 있어서,
    상기 디코딩하는 단계는,
    비압축 방식을 이용하여 원본 오디오 신호를 디코딩하는 메타데이터 추출 방법.
  12. 제10항에 있어서,
    상기 디코딩하는 단계는,
    무손실 압축 방식을 이용하여 원본 오디오 신호를 디코딩하는 메타데이터 추출 방법.
  13. 제10항에 있어서,
    상기 디코딩하는 단계는,
    손실 압축 방식을 이용하여 원본 오디오 신호를 디코딩하는 메타데이터 추출 방법.
  14. 제10항에 있어서,
    상기 추출하는 단계는,
    에코 방식을 이용하여 원본 오디오 신호에 은닉된 메타데이터를 추출하는 오디오 메타데이터 추출 방법.
  15. 제10항에 있어서,
    상기 추출하는 단계는,
    스펙트럼 확산 방식을 이용하여 원본 오디오 신호에 은닉된 메타데이터를 추출하는 오디오 메타데이터 추출 방법.
  16. 제10항에 있어서,
    상기 추출하는 단계는,
    위상 변조 방식을 이용하여 원본 오디오 신호에 은닉된 메타데이터를 추출하는 오디오 메타데이터 추출 방법.
  17. 제10항에 있어서,
    상기 인코딩된 원본 오디오 신호의 포맷을 변환하는 단계
    를 더 포함하는 오디오 메타데이터 추출 방법.
  18. 제17항에 있어서,
    상기 변환하는 단계는,
    상기 인코딩된 원본 오디오 신호를 재생하는 단말이 지원하는 포맷으로 변환하는 오디오 메타데이터 추출 방법.
  19. 원본 오디오 신호 및 상기 원본 오디오 신호와 관련된 메타데이터를 수신하는 수신부;
    상기 수신된 메타데이터를 상기 원본 오디오 신호에 은닉된 형태로 삽입하는 삽입부;
    상기 메타데이터가 은닉된 형태로 삽입된 원본 오디오 신호를 지정된 포맷으로 인코딩하는 인코딩부; 및
    상기 인코딩된 원본 오디오 신호의 포맷을 변환하는 포맷 변환부
    를 포함하는 오디오 메타데이터 삽입 장치.
  20. 인코딩된 원본 오디오 신호의 포맷을 변환하는 포맷 변환부;
    상기 인코딩된 원본 오디오 신호를 디코딩하는 디코딩부;
    상기 디코딩된 원본 오디오 신호를 재생하는 재생부; 및
    상기 디코딩된 원본 오디오 신호에서 메타데이터를 추출하는 추출부;
    를 포함하고,
    상기 인코딩된 원본 오디오 신호는,
    상기 메타데이터가 은닉된 형태로 삽입된 오디오 신호인 오디오 메타데이터 추출 장치.
KR1020150037392A 2015-03-18 2015-03-18 데이터 은닉을 이용한 오디오 메타데이터 삽입/추출 장치 및 방법 KR20160112177A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020150037392A KR20160112177A (ko) 2015-03-18 2015-03-18 데이터 은닉을 이용한 오디오 메타데이터 삽입/추출 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020150037392A KR20160112177A (ko) 2015-03-18 2015-03-18 데이터 은닉을 이용한 오디오 메타데이터 삽입/추출 장치 및 방법

Publications (1)

Publication Number Publication Date
KR20160112177A true KR20160112177A (ko) 2016-09-28

Family

ID=57101820

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150037392A KR20160112177A (ko) 2015-03-18 2015-03-18 데이터 은닉을 이용한 오디오 메타데이터 삽입/추출 장치 및 방법

Country Status (1)

Country Link
KR (1) KR20160112177A (ko)

Similar Documents

Publication Publication Date Title
US8190441B2 (en) Playback of compressed media files without quantization gaps
US20060059510A1 (en) System and method for embedding scene change information in a video bitstream
JP2005157390A (ja) 付加情報の挿入されたmpeg−4bsacオーディオビットストリームの符号化方法および復号化方法ならびに符号化装置および復号化装置
US20080281602A1 (en) Coding Reverberant Sound Signals
US10511884B2 (en) Method and apparatus for playing multimedia audio-visual presentations
US20060078288A1 (en) System and method for embedding multimedia editing information in a multimedia bitstream
CN104700840B (zh) 用于音频编码/解码/转码的频率域中水印插入
JP2009534696A (ja) 複数のデジタルデータセットを符号化および復号化するための装置および方法
KR20060023976A (ko) 비트-스트림 워터마킹
US7714223B2 (en) Reproduction device, reproduction method and computer usable medium having computer readable reproduction program emodied therein
JP2003006999A (ja) データ記録媒体、データ記録方法及び装置、並びに、データ伝送方法及び装置
US20060198557A1 (en) Fragile audio watermark related to a buried data channel
JP2003007000A (ja) データ記録方法及び装置、データ再生方法及び装置、データ編集方法及び装置
US20080147218A1 (en) Recording/reproduction apparatus
JP4990375B2 (ja) 記録再生装置
KR20160112177A (ko) 데이터 은닉을 이용한 오디오 메타데이터 삽입/추출 장치 및 방법
JP2009004037A (ja) オーディオ符号化装置、及びオーディオ復号化装置
US7738675B2 (en) Decoding apparatus for controlling sequence of operations for a plurality of copyright information detection sections
JP2006153908A (ja) 音声データエンコード装置および音声データデコード装置
US8626494B2 (en) Data compression format
KR102431737B1 (ko) 멀티미디어 데이터에서 하이라이트를 찾는 방법 및 그를 이용한 장치
JP2010123225A (ja) 記録再生装置及び記録再生方法
JP2006079742A (ja) 情報処理装置および方法、並びにプログラム
JP4665550B2 (ja) 再生装置および再生方法
KR100793023B1 (ko) 오디오 음원 표시 방법 및 그 장치