KR20220064817A

KR20220064817A - 오디오 데이터를 워터마킹 처리하는 데이터 처리 장치, 방법 및 컴퓨터 프로그램

Info

Publication number: KR20220064817A
Application number: KR1020200151345A
Authority: KR
Inventors: 차재욱
Original assignee: 주식회사 케이티
Priority date: 2020-11-12
Filing date: 2020-11-12
Publication date: 2022-05-19
Also published as: KR20240081450A

Abstract

오디오 데이터를 워터마킹 처리하는 데이터 처리 장치는 오디오 데이터를 입력받는 입력부, 상기 입력받은 오디오 데이터로부터 주파수 스펙트럼의 봉우리 부분을 포함하는 포먼트(formant) 구간을 추출하는 포먼트 구간 추출부 및 상기 추출한 포먼트 구간의 주파수 대역을 변경하는 필터에 기초하여 워터마킹 처리를 수행하는 워터마킹 처리부를 포함한다.

Description

오디오 데이터를 워터마킹 처리하는 데이터 처리 장치, 방법 및 컴퓨터 프로그램{APPARATUS, METHOD AND COMPUTER PROGRAM FOR EMBEDDING WATERMARK IN AUDIO DATA}

본 발명은 오디오 데이터를 워터마킹 처리하는 데이터 처리 장치, 방법 및 컴퓨터 프로그램에 관한 것이다.

워터마킹이란 오디오, 비디오, 이미지, 그리고 텍스트 등의 콘텐츠에 사람의 육안이나 귀로는 구별하지 못하는 특정한 데이터를 삽입하는 기술이다. 이를 통해 사람의 시청각으로 구별할 수 있는 데이터의 변형을 최소화하면서, 정당한 권리자가 해당 콘텐츠에 대하여 소유권, 저작권 등의 권리를 행사할 수 있도록 한다.

컴퓨터 기술의 발달과 함께, 전자책, 인터넷 신문과 잡지, 비디오, 음악 등 대부분의 콘텐츠가 네트워크 상에서 거래되기 때문에 워터마킹 기술의 중요성이 더욱 높아지고 있다.

워터마킹을 통해 콘텐츠에 원본 여부를 확인할 수 있도록 하는 데이터, 사용자를 식별할 수 있는 데이터 등을 삽입함으로써, 불법 복제를 방지할 수 있을 뿐 아니라, 누구에게 전달된 정보인지를 추적해 복제 경로를 추적하는 데에도 이용될 수 있다.

오디오, 비디오와 같은 콘텐츠에 대한 워터마킹은 특정한 데이터의 비트 패턴을 삽입함으로써 수행된다. 종래의 파일 헤더에 정보를 삽입하는 워터마킹 방식은, 삽입된 정보를 쉽게 삭제할 수 있어 정보의 수정 여부를 확인하는 것은 용이하지만 유출 경로를 추적하기 어렵다는 문제점이 있었다. 또한, 원음의 비가청 주파수에 정보를 삽입하는 방식은, 하드웨어에 대한 의존성이 높아 적용 범위가 제한적이라는 문제점이 있었다.

일본공개특허 제 2002-244692호 (2002.08.30. 공개)

본 발명은 전술한 종래 기술의 문제점을 해결하기 위한 것으로서, 오디오 데이터를 입력받고, 입력받은 오디오 데이터로부터 주파수 스펙트럼의 봉우리 부분을 포함하는 포먼트(formant) 구간을 추출하고, 추출한 포먼트 구간의 주파수 대역을 변경하는 필터에 기초하여 워터마킹 처리를 수행하는 데이터 처리 방법을 제공하고자 한다.

오디오 데이터의 원음 변화를 최소화하면서 유출 경로 추적을 용이하게 하는 워터마킹 처리를 수행하는 방법을 제공하고자 한다.

다만, 본 실시예가 이루고자 하는 기술적 과제는 상기된 바와 같은 기술적 과제들로 한정되지 않으며, 또 다른 기술적 과제들이 존재할 수 있다.

상술한 기술적 과제를 달성하기 위한 수단으로서, 본 발명의 일 실시예는, 오디오 데이터를 처리하는 데이터 처리 장치에 있어서, 오디오 데이터를 입력받는 입력부, 상기 입력받은 오디오 데이터로부터 주파수 스펙트럼의 봉우리 부분을 포함하는 포먼트(formant) 구간을 추출하는 포먼트 구간 추출부 및 상기 추출한 포먼트 구간의 주파수 대역을 변경하는 필터에 기초하여 워터마킹 처리를 수행하는 워터마킹 처리부를 포함할 수 있다.

일 실시예에서, 상기 포먼트 구간 추출부는 FFT(Fast Fourier Transform)를 이용하여 상기 입력받은 오디오 데이터를 주파수 스펙트럼 데이터로 변환할 수 있다.

일 실시예에서, 상기 포먼트 구간 추출부는 상기 변환된 주파수 스펙트럼 데이터로부터 LPC(linear predictive coding)를 통해 기설정된 값 이상의 파워를 갖는 봉우리 구간을 검출할 수 있다.

일 실시예에서, 상기 포먼트 구간 추출부는 상기 봉우리 구간의 시간 정보를 추출하고, 상기 시간 정보가 기설정된 길이 이상인 경우의 상기 봉우리 구간을 상기 포먼트 구간으로서 추출할 수 있다.

일 실시예에서, 상기 추출된 포먼트 구간은 상기 오디오 데이터 중 모음 발성 구간에 해당할 수 있다.

일 실시예에서, 상기 필터는 상기 추출한 포먼트 구간의 제 1 구간의 데이터의 크기를 증폭시키고, 상기 제 1 구간 이후의 제 2 구간의 데이터의 크기를 감소시키는 제 1 필터 및 상기 제 1 구간의 데이터의 크기를 감소시키고, 상기 제 2 구간의 데이터의 크기를 증폭시키는 제 2 필터를 포함할 수 있다.

일 실시예에서, 상기 입력부는 비트 어레이를 포함하는 삽입 데이터를 더 입력받고, 상기 워터마킹 처리부는 상기 삽입 데이터에 기초하여 상기 포먼트 구간에 상기 제 1 필터 또는 상기 제 2 필터를 선택적으로 적용할 수 있다.

일 실시예에서, 상기 워터마킹 처리부는 상기 삽입 데이터의 비트 어레이의 값을 상기 포먼트 구간에 순차적으로 대응시키고, 상기 포먼트 구간이 상기 비트 어레이의 값 중 1에 대응되는 경우 상기 제 1 필터를 적용하고, 상기 포먼트 구간이 상기 비트 어레이의 값 중 0에 대응되는 경우 상기 제 2 필터를 적용할 수 있다.

일 실시예에서, 상기 포먼트 구간에 상기 제 1 필터가 적용될 경우, 상기 포먼트 구간의 주파수가 감소되고, 상기 포먼트 구간에 상기 제 2 필터가 적용될 경우, 상기 포먼트 구간의 주파수가 증가될 수 있다.

본 발명의 다른 실시예는, 오디오 데이터를 처리하는 데이터 처리 방법에 있어서, 오디오 데이터를 입력받는 단계, 상기 입력받은 오디오 데이터로부터 주파수 스펙트럼의 봉우리 부분을 포함하는 포먼트(formant) 구간을 추출하는 단계 및 상기 추출한 포먼트 구간의 주파수 대역을 변경하는 필터에 기초하여 워터마킹 처리를 수행하는 단계를 포함할 수 있다.

본 발명의 또 다른 실시예는, 오디오 데이터를 처리하는 명령어들의 시퀀스를 포함하는 컴퓨터 판독가능 기록매체에 저장된 컴퓨터 프로그램에 있어서, 상기 컴퓨터 프로그램은 컴퓨팅 장치에 의해 실행될 경우, 오디오 데이터를 입력받고, 상기 입력받은 오디오 데이터로부터 주파수 스펙트럼의 봉우리 부분을 포함하는 포먼트(formant) 구간을 추출하고, 상기 추출한 포먼트 구간의 주파수 대역을 변경하는 필터에 기초하여 워터마킹 처리를 수행하도록 하는 명령어들의 시퀀스를 포함할 수 있다.

상술한 과제 해결 수단은 단지 예시적인 것으로서, 본 발명을 제한하려는 의도로 해석되지 않아야 한다. 상술한 예시적인 실시예 외에도, 도면 및 발명의 상세한 설명에 기재된 추가적인 실시예가 존재할 수 있다.

전술한 본 발명의 과제 해결 수단 중 어느 하나에 의하면, 오디오 데이터를 입력받고, 입력받은 오디오 데이터로부터 주파수 스펙트럼의 봉우리 부분을 포함하는 포먼트(formant) 구간을 추출하고, 추출한 포먼트 구간의 주파수 대역을 변경하는 필터에 기초하여 워터마킹 처리를 수행할 수 있다.

또한, 오디오 데이터의 원음 변화를 최소화하면서 유출 경로 추적을 용이하게 하는 워터마킹 처리를 수행하는 방법을 제공할 수 있다.

또한, 워터마킹 처리를 수행하는 시간을 단축할 수 있다.

도 1은 본 발명의 일 실시예에 따른 데이터 처리 장치의 구성도이다.
도 2 및 도 3은 본 발명의 일 실시예에 따라 오디오 데이터로부터 포먼트 구간을 추출하는 방법을 설명하기 위한 예시적인 도면이다.
도 4는 본 발명의 일 실시예에 따라 추출된 포먼트 구간을 예시적으로 도시한 도면이다.
도 5는 본 발명의 일 실시예에 따라 포먼트 구간에 필터를 적용하는 방법을 설명하기 위한 도면이다.
도 6a 및 도 6b는 본 발명의 일 실시예에 따른 필터를 예시적으로 도시한다.
도 7은 본 발명의 다른 실시예에 따른 필터의 예시적인 도면이다.
도 8은 본 발명의 일 실시예에 따라 오디오 데이터에 대해 워터마킹 처리를 수행한 결과를 예시적으로 도시한 도면이다.
도 9는 본 발명의 일 실시예에 따른 데이터 처리 방법의 순서도이다.

아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.

명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미하며, 하나 또는 그 이상의 다른 특징이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.

본 명세서에 있어서 '부(部)'란, 하드웨어에 의해 실현되는 유닛(unit), 소프트웨어에 의해 실현되는 유닛, 양방을 이용하여 실현되는 유닛을 포함한다. 또한, 1 개의 유닛이 2 개 이상의 하드웨어를 이용하여 실현되어도 되고, 2 개 이상의 유닛이 1 개의 하드웨어에 의해 실현되어도 된다. 한편, '~부'는 소프트웨어 또는 하드웨어에 한정되는 의미는 아니며, '~부'는 어드레싱할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다. 따라서, 일 예로서 '~부'는 소프트웨어 구성요소들, 객체지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들 및 변수들을 포함한다. 구성요소들과 '~부'들 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 '~부'들로 결합되거나 추가적인 구성요소들과 '~부'들로 더 분리될 수 있다. 뿐만 아니라, 구성요소들 및 '~부'들은 디바이스 또는 보안 멀티미디어카드 내의 하나 또는 그 이상의 CPU들을 재생시키도록 구현될 수도 있다.

이하에서 언급되는 "네트워크"는 단말들 및 서버들과 같은 각각의 노드 상호 간에 정보 교환이 가능한 연결 구조를 의미하는 것으로, 근거리 통신망(LAN: Local Area Network), 광역 통신망(WAN: Wide Area Network), 인터넷 (WWW: World Wide Web), 유무선 데이터 통신망, 전화망, 유무선 텔레비전 통신망 등을 포함한다. 무선 데이터 통신망의 일례에는 3G, 4G, 5G, 3GPP(3rd Generation Partnership Project), LTE(Long Term Evolution), WIMAX(World Interoperability for Microwave Access), 와이파이(Wi-Fi), 블루투스 통신, 적외선 통신, 초음파 통신, 가시광 통신(VLC: Visible Light Communication), 라이파이(LiFi) 등이 포함되나 이에 한정되지는 않는다.

본 명세서에 있어서 단말 또는 디바이스가 수행하는 것으로 기술된 동작이나 기능 중 일부는 해당 단말 또는 디바이스와 연결된 서버에서 대신 수행될 수도 있다. 이와 마찬가지로, 서버가 수행하는 것으로 기술된 동작이나 기능 중 일부도 해당 서버와 연결된 단말 또는 디바이스에서 수행될 수도 있다.

이하 첨부된 도면을 참고하여 본 발명의 일 실시예를 상세히 설명하기로 한다.

도 1은 본 발명의 일 실시예에 따른 데이터 처리 장치의 구성도이다. 도 1을 참조하면, 데이터 처리 장치(100)는 입력부(110), 포먼트 구간 추출부(120) 및 워터마킹 처리부(130)를 포함할 수 있다.

데이터 처리 장치(100)는 오디오 데이터에 대하여 포먼트 구간의 주파수 대역을 변경하는 필터에 기초하여 워터마킹 처리를 수행할 수 있다. 데이터 처리 장치(100)는 오디오 데이터의 원음 변화를 최소화시키면서 삽입 데이터에 기초한 워터마킹 처리를 수행할 수 있다.

데이터 처리 장치(100)에 의해 워터마킹 처리된 오디오 데이터는 워터마킹을 통해 삽입된 삽입 데이터를 통해 식별될 수 있고, 이를 통해 불법 복제를 방지하고 데이터 유출 경로를 파악하기 위해 이용될 수 있다. 데이터 처리 장치(100)는 메타 데이터를 이용하여 워터마킹 처리에 소요되는 시간을 단축할 수 있다.

입력부(110)는 오디오 데이터를 입력받을 수 있다. 입력부(110)는 예를 들어, 사용자 단말, 외부 서버, 클라우드 또는 외부 장치로부터 오디오 데이터를 입력받을 수 있다.

여기서, 오디오 데이터는 음성 구간 데이터 및 비음성 구간 데이터를 포함할 수 있다. 데이터 처리 장치(100)는 오디오 데이터의 음성 구간 데이터에 대해 선별적으로 워터마킹 처리를 수행함으로써, 비음성 구간 데이터에 대한 영향을 최소화할 수 있다.

또한, 데이터 처리 장치(100)는 음성 구간 데이터 중 모음 발성 구간에 대해 워터마킹 처리를 수행함으로써, 단순한 주파수 필터링이나 일부 구간의 삭제를 통해 워터마킹을 제거하는 것을 방지할 수 있다.

데이터 처리 장치(100)는 잡음 성분을 분리, 감소시키기 위해 오디오 데이터에 대해 프리엠퍼시스(pre-emphasis) 처리 및 정규화(normalization) 처리를 수행할 수 있다. 데이터 처리 장치(100)는 오디오 데이터에 대한 프리엠퍼시스 처리를 통해 신호 대 잡음비(S/N), 주파수 특성, 일그러짐 특성을 개선할 수 있다.

포먼트 구간 추출부(120)는 FFT(Fast Fourier Transform)를 이용하여 입력받은 오디오 데이터를 주파수 스펙트럼 데이터로 변환할 수 있다. 포먼트 구간 추출부(120)는 변환된 주파수 스펙트럼 데이터로부터 LPC(linear predictive coding)를 통해 기설정된 값 이상의 파워를 갖는 봉우리 구간을 검출할 수 있다.

포먼트 구간 추출부(120)는 입력받은 오디오 데이터로부터 포먼트(formant) 구간을 추출할 수 있다. 여기서 포먼트 구간은, 입력받은 오디오 데이터로부터 변환된 주파수 스펙트럼의 봉우리 부분을 포함하는 구간일 수 있다.

도 2는 본 발명의 일 실시예에 따라 오디오 데이터로부터 포먼트 구간을 추출하는 방법을 설명하기 위한 예시적인 도면으로, [a:] 발성 구간의 주파수 스펙트럼을 도시한다.

도 2를 참조하면, 오디오 데이터로부터 변환된 주파수 스펙트럼에 있어서, 파워(에너지)는 주파수에 따라 다른 값을 가진다. 여기서, 주파수 스펙트럼이 봉우리 형태를 갖는 부분을 포먼트라 한다. 도 2에 도시된 주파수 스펙트럼에서는, 주파수가 낮은 순서대로 세 개의 포먼트 F1, F2 및 F3가 형성되어 있다.

포먼트 구간 추출부(120)는 봉우리 구간의 시간 정보를 추출할 수 있다. 포먼트 구간 추출부(120)는 봉우리 구간의 시간 정보가 기설정된 길이 이상인 경우에, 봉우리 구간을 포먼트 구간으로서 추출할 수 있다.

즉, 포먼트 구간은 기설정된 길이 이상의 봉우리 구간에 속하거나 봉우리 구간을 포함하는 포먼트 전후 구간의 데이터를 포함할 수 있다. 예를 들어, 포먼트 구간은 예를 들어, 포먼트의 200 Hz 이전부터 200 Hz 이후까지의 구간을 포함할 수 있다.

포먼트 구간으로 추출하는 기준이 되는 봉우리 구간의 시간 정보는, 워터마킹 처리를 수행하는 필터에 기초하여 결정될 수 있다. 예를 들어, 포먼트 구간 추출부(120)는 복수의 봉우리 구간 중에서 길이가 예를 들어, 25 msec 이상인 봉우리 구간을 포먼트 구간으로 추출할 수 있다.

포먼트 구간 추출부(120)에 의해 추출된 포먼트 구간은 오디오 데이터 중 모음 발성 구간에 해당할 수 있다. 일반적으로, 모음 발성 구간은 자음 발성 구간보다 큰 에너지를 갖는다. 따라서, 주파수 스펙트럼의 포먼트는 음성 데이터 중 자음 발성 구간보다 모음 발성 구간에 있어서 잘 나타나는 특징이 있다.

본 발명에 따른 데이터 처리 장치(100)는 모음 발성 구간에 형성된 포먼트를 이용하여 효율적으로 워터마킹 처리를 수행할 수 있다. 이에 의하여, 단순한 주파수 필터링 또는 일부 구간의 삭제에 의해 워터마킹이 제거되는 것을 방지할 수 있다.

도 3의 (a)는 입력받은 오디오 데이터의 파형의 예시적인 도면이고, 도 3의 (b)는 (a)의 오디오 데이터로부터 변환된 주파수 스펙트럼을 도시한다. 오디오 데이터는 FFT를 이용하여 주파수 스펙트럼으로 변환될 수 있다.

도 3의 (b)의 주파수 스펙트럼에서 적색점은 포먼트를 나타낸다. 여기서 포먼트가 형성된 봉우리 구간의 시간 정보가 기설정된 길이 이상인 경우에 포먼트 구간으로 추출될 수 있다.

워터마킹 처리부(130)는 추출한 포먼트 구간의 주파수 대역을 변경하는 필터에 기초하여 워터마킹 처리를 수행할 수 있다.

추출된 포먼트 구간은 필터에 의해 복수의 프레임 구간으로 분할될 수 있다. 예를 들어, 25 msec 길이의 포먼트 구간은 복수의 5 msec 길이의 프레임 구간으로 분할될 수 있다. 워터마킹 처리부(130)는 시간 영역 윈도우 또는 주파수 영역 윈도우에 기초하여 포먼트 구간의 각 프레임 구간에 대한 필터의 적용 비율을 결정할 수 있다.

도 4는 본 발명의 일 실시예에 따라 추출된 포먼트 구간을 예시적으로 도시한다. 도 4를 참조하면, 포먼트 구간은 복수의 프레임 구간(401 내지 405)을 포함할 수 있다.

예를 들어, 포먼트 구간의 전체 길이는 25 msec이고, 각 프레임 구간(401 내지 405)의 길이는 5 msec일 수 있다. 시간 영역 윈도우에 따라 포먼트 구간에 포함되는 각 프레임 구간(401 내지 405)마다 필터의 적용 비율이 달라질 수 있다.

도 5에는 각 프레임 구간에 대한 필터의 적용 비율에 관한 정보를 포함하는 시간 영역 윈도우가 도시되어 있다. 도 5의 시간 영역 윈도우를 도 4에 도시된 포먼트 구간에 적용하는 경우를 예를 들면, 첫번째 프레임 구간(401) 및 다섯 번째 프레임 구간(405)에는 필터가 0 % 적용되고(즉, 필터가 적용되지 않음), 두번째 프레임 구간(402) 및 네 번째 프레임 구간(404)에는 필터가 50 % 적용되고, 세번째 프레임 구간(403)에는 필터가 100 % 적용된다.

시간 영역의 윈도우가 포함하는 필터의 적용 비율에 관한 정보는, 워터마킹 처리가 수행될 때 해당 구간의 주파수가 변형되는 정도를 의미할 수 있다.

본 발명에 따른 데이터 처리 장치(100)는 시간에 따라 필터가 적용하는 정도를 조절함으로써 오디오 데이터의 원음이 불필요하게 변질되는 것을 방지하고 음성의 자연스러움을 유지하는 효과가 있다.

일 실시예에서, 추출한 포먼트 구간은 제 1 구간 및 제 1 구간 이후의 제 2 구간을 포함할 수 있다. 예를 들어, 제 1 구간은 포먼트 이전의 구간이고, 제 2 구간은 포먼트 이후의 구간일 수 있다.

포먼트 구간의 주파수 대역을 변경하는 필터는, 제 1 필터 및 제 2 필터를 포함할 수 있다.

제 1 필터는 추출한 포먼트 구간의 제 1 구간의 데이터의 크기를 증폭시키고, 제 2 구간의 데이터의 크기를 감소시키는 것일 수 있다. 제 2 필터는 제 1 구간의 데이터의 크기를 감소시키고, 제 2 구간의 데이터의 크기를 증폭시키는 것일 수 있다.

포먼트 구간에 제 1 필터가 적용될 경우, 포먼트 구간의 주파수가 감소되고, 포먼트 구간에 제 2 필터가 적용될 경우, 포먼트 구간의 주파수가 증가될 수 있다.

입력부(110)는 비트 어레이를 포함하는 삽입 데이터를 더 입력받을 수 있다. 비트 어레이는 예를 들어 [01100101??]과 같이, 0 또는 1 값의 순서있는 배열로 구성될 수 있다. 즉, 삽입 데이터는 식별 가능한 데이터의 2진수 값에 기초하여 생성될 수 있다.

여기서, 삽입 데이터는 예를 들어, 사용자 ID, 암호, 이용 시간 정보, 과금 정보, 콘텐츠 이용 정보 등에 기초하여 생성될 수 있다.

워터마킹 처리부(130)는 삽입 데이터에 기초하여 포먼트 구간에 제 1 필터 또는 제 2 필터를 선택적으로 적용할 수 있다.

도 6a 및 도 6b는 본 발명의 일 실시예에 따른 필터를 예시적으로 도시한다. 도 6a에는 제 1 필터의 예로 삽입 데이터의 비트 어레이가 0인 경우와 제 2 필터의 예로 삽입 데이터의 비트 어레이가 1인 경우가 함께 도시되어 있다. 즉, 비트 어레이가 0인 경우, 포먼트 구간에 도 6a에서 파란색으로 표현된 필터가 적용되고, 비트 어레이가 1인 경우, 포먼트 구간에 도 6a에서 주황색으로 표현된 필터가 적용된다.

또한, 도 6b는 시간 영역 윈도우에 따라 필터의 적용 비율이 50 %인 경우의 제 1 필터 및 제 2 필터의 예를 도시한다. 도 6b의 필터는 도 6a에 도시된 필터와 비교하여 50 %의 값을 갖는다. 따라서, 도 6b의 필터를 적용한 경우에 있어서, 도 6a의 필터를 적용한 경우보다 상대적으로 해당 주파수 대역에서 데이터 크기(주파수 신호의 세기)가 변경되는 정도가 작게 나타난다.

이와 같이, 본 발명에 따르면, 원음 변화의 정도 및 워터마킹의 성능을 고려하여 필터의 적용 비율을 조절한다.

워터마킹 처리부(130)는 삽입 데이터의 비트 어레이의 값을 포먼트 구간에 순차적으로 대응시키고, 포먼트 구간이 비트 어레이의 값 중 1에 대응되는 경우 제 1 필터를 적용하고, 포먼트 구간이 비트 어레이의 값 중 0에 대응되는 경우 제 2 필터를 적용할 수 있다.

예를 들어, 삽입 데이터의 비트 어레이가 [101]이고, 제 1 내지 제 3 포먼트 구간이 추출된 경우에, 워터마킹 처리부(130)는 삽입 데이터의 비트 어레이의 값을 포먼트 구간에 순차적으로 대응시킬 수 있다. 예를 들어, 제 1 포먼트 구간에 1 값을 대응시키고, 제 2 포먼트 구간에 0 값을 대응시키고, 제 3 포먼트 구간에 1 값을 대응시킬 수 있다.

이에 따라, 제 1 포먼트 구간에는 제 1 필터를 적용하고, 제 2 포먼트 구간에는 제 2 필터를 적용하고, 제 3 포먼트 구간에는 제 1 필터를 적용할 수 있다. 필터를 적용한 결과. 제 1 및 제 3 포먼트 구간의 주파수는 감소되고, 제 2 포먼트 구간의 주파수를 증가될 것이다.

예를 들어, 워터마킹 처리부(130)는 삽입 데이터의 비트 어레이를 반복하여 포먼트 구간에 순차적으로 대응시킬 수 있다. 예를 들어, 삽입 데이터의 비트 어레이가 [110]이고 제 1 내지 제 9 포먼트 구간이 추출된 경우에, 제 1 내지 제 9 포먼트 구간에 순차적으로 1, 1, 0, 1, 1, 0, 1, 1, 0 값을 대응시킬 수 있다. 삽입 데이터의 비트 어레이를 반복 대응시킴으로써, 정보가 오디오 데이터에 안정적으로 반영될 수 있다.

다른 예를 들어, 삽입 데이터의 비트 어레이가 [110 001 110 010 101]과 같이 보다 많은 정보를 포함하는 경우가 있다. 워터마킹 처리부(130)는 삽입 데이터의 비트 어레이를 복수의 포먼트 구간에 순차적으로 대응시킴으로써, 많은 정보를 오디오 데이터에 반영할 수 있다.

다른 실시예에서 비트 어레이는 2 bit 단위의 정보를 포함할 수 있다. 도 7은 본 발명의 다른 실시예에 따른 필터의 예시적인 도면이다. 도 7에 도시된 필터를 적용함으로써 포먼트 구간의 주파수 변화량을 달리할 수도 있다.

도 8은 본 발명의 일 실시예에 따라 오디오 데이터에 대해 워터마킹 처리를 수행한 결과를 예시적으로 도시한다.

도 8의 (a)에 도시된 원본 데이터의 주파수 스펙트럼은 F1, F2 및 F3의 포먼트를 각각 포함하는 포먼트 구간을 가지고, 삽입 데이터의 비트 어레이는 [101]이라고 가정한다.

포먼트 F1을 포함하는 포먼트 구간에 대응되는 삽입 데이터의 비트 어레이는 1의 값을 가지므로, 이 구간에 대해 제 1 필터가 적용될 수 있다. 마찬가지의 방식으로, 포먼트 F2를 포함하는 포먼트 구간에 대응되는 삽입 데이터의 비트 어레이는 0의 값을 가지므로, 이 구간에 대해 제 2 필터가 적용될 수 있다.

데이터 처리 장치(100)는 각 포먼트 구간에 대해 제 1 필터 또는 제 2 필터를 선택적으로 적용시킴으로써, 워터마킹 처리를 수행할 수 있다. 도 8의 (b)는 도 8의 (a)에 도시된 원본 데이터에 대해 워터마킹 처리를 수행한 결과를 도시한다.

도 8의 (c)에 도시된 바와 같이, 원본 데이터 및 워터마킹 처리를 수행한 후의 주파수 스펙트럼을 비교하면, 각 포먼트 구간의 주파수 대역이 변경되었음을 확인할 수 있다.

도 8의 (c)를 참조하면, 제 1 필터가 적용된 포먼트 F1을 포함하는 포먼트 구간 및 포먼트 F3을 포함하는 포먼트 구간은 주파수 영역에서 좌측으로 이동한 것으로 나타나고, 제 2 필터가 적용된 포먼트 F2를 포함하는 포먼트 구간은 주파수 영역에서 우측으로 이동한 것으로 나타난다. 이는 제 1 필터가 적용된 경우의 포먼트 구간의 주파수는 감소하고, 제 2 필터가 적용된 경우의 포먼트 구간의 주파수는 증가되기 때문이다.

데이터 처리 장치(100)는 메타 데이터를 저장하는 저장부(미도시)를 더 포함할 수 있다. 데이터 처리 장치(100)는 추출한 포먼트 구간에 기초하여 기설정된 형식의 메타 데이터를 생성할 수 있다.

데이터 처리 장치(100)는 메타 데이터를 이용함으로써 동일한 포먼트 구간을 포함하는 오디오 데이터에 대한 워터마킹 처리를 수행하는 시간을 단축할 수 있다.

도 9는 본 발명의 일 실시예에 따른 데이터 처리 방법의 순서도이다. 도 9에 도시된 데이터 처리 장치(100)에서 수행되는 동작을 검출하는 방법(900)은 도 1에 도시된 실시예에 따라 데이터 처리 장치(100)에 의해 시계열적으로 처리되는 단계들을 포함한다. 따라서, 이하 생략된 내용이라고 하더라도 도 1에 도시된 실시예에 따라 데이터 처리 장치(100)에서 수행되는 동작을 검출하는 방법에도 적용된다.

단계 S910에서 데이터 처리 장치(100)는 오디오 데이터를 입력받을 수 있다.

단계 S920에서 데이터 처리 장치(100)는 입력받은 오디오 데이터로부터 주파수 스펙트럼의 봉우리 부분을 포함하는 포먼트(formant) 구간을 추출할 수 있다.

단계 S930에서 데이터 처리 장치(100)는 추출한 포먼트 구간의 주파수 대역을 변경하는 필터에 기초하여 워터마킹 처리를 수행할 수 있다.

상술한 설명에서, 단계 S910 내지 S930은 본 발명의 구현예에 따라서, 추가적인 단계들로 더 분할되거나, 더 적은 단계들로 조합될 수 있다. 또한, 일부 단계는 필요에 따라 생략될 수도 있고, 단계 간의 순서가 전환될 수도 있다.

도 1 내지 도 9를 통해 설명된 데이터 처리 장치에서 데이터를 처리하는 방법은 컴퓨터에 의해 실행되는 매체에 저장된 컴퓨터 프로그램 또는 컴퓨터에 의해 실행 가능한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다.

컴퓨터 판독 가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독가능 매체는 컴퓨터 저장 매체를 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다.

전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.

본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.

100: 데이터 처리 장치
110: 입력부
120: 포먼트 구간 추출부
130: 워터마킹 처리부

Claims

오디오 데이터를 워터마킹 처리하는 데이터 처리 장치에 있어서,
오디오 데이터를 입력받는 입력부;
상기 입력받은 오디오 데이터로부터 주파수 스펙트럼의 봉우리 부분을 포함하는 포먼트(formant) 구간을 추출하는 포먼트 구간 추출부; 및
상기 추출한 포먼트 구간의 주파수 대역을 변경하는 필터에 기초하여 워터마킹 처리를 수행하는 워터마킹 처리부
를 포함하는 것인, 데이터 처리 장치.
제 1 항에 있어서,
상기 포먼트 구간 추출부는 FFT(Fast Fourier Transform)를 이용하여 상기 입력받은 오디오 데이터를 주파수 스펙트럼 데이터로 변환하는 것인, 데이터 처리 장치.
제 2 항에 있어서,
상기 포먼트 구간 추출부는 상기 변환된 주파수 스펙트럼 데이터로부터 LPC(linear predictive coding)를 통해 기설정된 값 이상의 파워를 갖는 봉우리 구간을 검출하는 것인, 데이터 처리 장치.
제 3 항에 있어서,
상기 포먼트 구간 추출부는
상기 봉우리 구간의 시간 정보를 추출하고, 상기 시간 정보가 기설정된 길이 이상인 경우의 상기 봉우리 구간을 상기 포먼트 구간으로서 추출하는 것인, 데이터 처리 장치.
제 1 항에 있어서,
상기 추출된 포먼트 구간은 상기 오디오 데이터 중 모음 발성 구간에 해당하는 것인, 데이터 처리 장치.
제 1 항에 있어서,
상기 필터는 상기 추출한 포먼트 구간의 제 1 구간의 데이터의 크기를 증폭시키고, 상기 제 1 구간 이후의 제 2 구간의 데이터의 크기를 감소시키는 제 1 필터 및 상기 제 1 구간의 데이터의 크기를 감소시키고, 상기 제 2 구간의 데이터의 크기를 증폭시키는 제 2 필터를 포함하는 것인, 데이터 처리 장치.
제 6 항에 있어서,
상기 입력부는 비트 어레이를 포함하는 삽입 데이터를 더 입력받고,
상기 워터마킹 처리부는 상기 삽입 데이터에 기초하여 상기 포먼트 구간에 상기 제 1 필터 또는 상기 제 2 필터를 선택적으로 적용하는 것인, 데이터 처리 장치.
제 7 항에 있어서,
상기 워터마킹 처리부는 상기 삽입 데이터의 비트 어레이의 값을 상기 포먼트 구간에 순차적으로 대응시키고, 상기 포먼트 구간이 상기 비트 어레이의 값 중 1에 대응되는 경우 상기 제 1 필터를 적용하고, 상기 포먼트 구간이 상기 비트 어레이의 값 중 0에 대응되는 경우 상기 제 2 필터를 적용하는 것인, 데이터 처리 장치.
제 6 항에 있어서,
상기 포먼트 구간에 상기 제 1 필터가 적용될 경우, 상기 포먼트 구간의 주파수가 감소되고, 상기 포먼트 구간에 상기 제 2 필터가 적용될 경우, 상기 포먼트 구간의 주파수가 증가되는 것인, 데이터 처리 장치.
데이터 처리 장치에 의해 오디오 데이터를 워터마킹 처리하는 데이터 처리 방법에 있어서,
오디오 데이터를 입력받는 단계;
상기 입력받은 오디오 데이터로부터 주파수 스펙트럼의 봉우리 부분을 포함하는 포먼트(formant) 구간을 추출하는 단계; 및
상기 추출한 포먼트 구간의 주파수 대역을 변경하는 필터에 기초하여 워터마킹 처리를 수행하는 단계
를 포함하는 것인, 데이터 처리 방법.
제 10 항에 있어서,
FFT(Fast Fourier Transform)를 이용하여 상기 입력받은 오디오 데이터를 주파수 스펙트럼 데이터로 변환하는 단계를 더 포함하는 것인, 데이터 처리 방법.
제 11 항에 있어서,
상기 변환된 주파수 스펙트럼 데이터로부터 LPC(linear predictive coding)를 통해 기설정된 값 이상의 파워를 갖는 봉우리 구간을 검출하는 단계를 더 포함하는 것인, 데이터 처리 방법.
제 12 항에 있어서,
상기 포먼트 구간을 추출하는 단계는,
상기 봉우리 구간의 시간 정보를 추출하고, 상기 시간 정보가 기설정된 길이 이상인 경우의 상기 봉우리 구간을 상기 포먼트 구간으로서 추출하는 것인, 데이터 처리 방법.
제 10 항에 있어서,
상기 추출된 포먼트 구간은 상기 오디오 데이터 중 모음 발성 구간에 해당하는 것인, 데이터 처리 방법.
제 10 항에 있어서,
상기 필터는 상기 추출한 포먼트 구간의 제 1 구간의 데이터의 크기를 증폭시키고, 상기 제 1 구간 이후의 제 2 구간의 데이터의 크기를 감소시키는 제 1 필터 및 상기 제 1 구간의 데이터의 크기를 감소시키고, 상기 제 2 구간의 데이터의 크기를 증폭시키는 제 2 필터를 포함하는 것인, 데이터 처리 방법.
제 15 항에 있어서,
비트 어레이를 포함하는 삽입 데이터를 입력받는 단계
를 더 포함하고,
상기 워터마킹 처리를 수행하는 단계는 상기 삽입 데이터에 기초하여 상기 포먼트 구간에 상기 제 1 필터 또는 상기 제 2 필터를 선택적으로 적용하는 단계를 더 포함하는 것인, 데이터 처리 방법.
제 16 항에 있어서,
상기 워터마킹 처리를 수행하는 단계는 상기 삽입 데이터의 비트 어레이의 값을 상기 포먼트 구간에 순차적으로 대응시키고, 상기 포먼트 구간이 상기 비트 어레이의 값 중 1에 대응되는 경우 상기 제 1 필터를 적용하고, 상기 포먼트 구간이 상기 비트 어레이의 값 중 0에 대응되는 경우 상기 제 2 필터를 적용하는 것인, 데이터 처리 방법.
제 15 항에 있어서,
상기 포먼트 구간에 상기 제 1 필터가 적용될 경우, 상기 포먼트 구간의 주파수가 감소되고, 상기 포먼트 구간에 상기 제 2 필터가 적용될 경우, 상기 포먼트 구간의 주파수가 증가되는 것인, 데이터 처리 방법.
오디오 데이터를 워터마킹 처리하는 명령어들의 시퀀스를 포함하는 컴퓨터 판독가능 기록매체에 저장된 컴퓨터 프로그램에 있어서,
상기 컴퓨터 프로그램은 컴퓨팅 장치에 의해 실행될 경우,
오디오 데이터를 입력받고,
상기 입력받은 오디오 데이터로부터 주파수 스펙트럼의 봉우리 부분을 포함하는 포먼트(formant) 구간을 추출하고,
상기 추출한 포먼트 구간의 주파수 대역을 변경하는 필터에 기초하여 워터마킹 처리를 수행하도록 하는 명령어들의 시퀀스를 포함하는 것인, 컴퓨터 판독가능 기록매체에 저장된 컴퓨터 프로그램.