KR20180091319A

KR20180091319A - 사운드 공유 장치 및 방법

Info

Publication number: KR20180091319A
Application number: KR1020170016305A
Authority: KR
Inventors: 김상범; 조상범; 강준호
Original assignee: 삼성에스디에스 주식회사
Priority date: 2017-02-06
Filing date: 2017-02-06
Publication date: 2018-08-16
Also published as: US10165365B2; CN108401126A; US20180227671A1

Abstract

사운드 공유 장치 및 방법이 제공된다. 본 발명의 일 실시예에 따른 사운드 공유 장치는, 로컬 머신(local machine)의 기본 오디오 렌더 드라이버(default audio render driver)를 제1 오디오 렌더 드라이버에서 제2 오디오 렌더 드라이버로 변경하는 변경 모듈; 상기 제2 오디오 렌더 드라이버로 전달되는 오디오 데이터를 캡쳐하는 캡쳐링 모듈; 및 상기 로컬 머신과 네트워크를 통해 연결된 원격 머신(remote machine)으로부터 수신된 제1 음성 데이터 또는 상기 로컬 머신의 마이크를 통해 입력된 제2 음성 데이터를 캡쳐된 상기 오디오 데이터와 믹싱(mixing)하는 믹서를 포함한다.

Description

사운드 공유 장치 및 방법{SOUND SHARING APPARATUS AND METHOD}

본 발명의 실시예들은 웹 컨퍼런싱 등과 같은 서비스를 제공하는 음성 통신 시스템에서 사운드를 공유하는 기술과 관련된다.

웹 컨퍼런싱(web conferencing)은 인터넷을 통해 실시간 미팅, 회의, 프리젠테이션, 교육 등을 주최할 수 있는 온라인 서비스이다. 일반적으로, 이러한 웹 컨퍼런싱에 있어서 음성 콘텐츠, 영상 콘텐츠 등을 공유하는 경우 회의 진행에 있어서 큰 도움이 될 수 있으며, 이로 인해 콘텐츠 공유를 위한 다양한 시도가 이루어지고 있다.

그러나, MPEG-4와 같은 형식으로 미리 준비된 동영상 등을 공유하는 경우, 기존 음성 채널 이외에 스트리밍을 위한 장치 및 스트리밍되는 오디오 데이터를 재생하기 위한 플레이어를 발신자 및 수신자 측에 각각 별도로 구현하여야 하는 번거로움이 있다. 또한, 이 경우 웹 브라우저 등을 통해 이미 스트리밍되고 있는 동영상 등에 대해서는 공유가 불가능한 문제점이 있다.

또한, 콘텐츠 공유를 위한 다른 방안으로서 운영체제에서 오디오 렌더 드라이버로 전달되는 데이터를 캡쳐하여 상대방에게 전달하는 방식이 있으나, 이 경우 캡쳐된 데이터에 상대방으로부터 전달된 음성 데이터까지 포함되어 있어 상대방이 자신이 말한 소리를 그대로 다시 듣게 되는 문제점이 있다. 또한, 이러한 문제점을 해결하기 위해 어쿠스틱 에코 제거기(AEC : Acoustic ECHO Canceller)를 이용하여 캡쳐된 데이터에서 상대방의 음성 데이터를 제거하는 방안이 제안되었으나, 이 경우 공유하고자 하는 사운드(즉, 캡쳐된 데이터)의 왜곡 현상이 발생될 수 있다.

한국공개특허공보 제10-2009-0103953호(2009.10.01)

본 발명의 실시예들은 로컬 머신과 원격 머신이 네트워크를 통하여 연결된 환경에서 사운드를 효율적으로 공유하는 수단을 제공하기 위한 것이다.

본 발명의 예시적인 실시예에 따르면, 로컬 머신(local machine)의 기본 오디오 렌더 드라이버(default audio render driver)를 제1 오디오 렌더 드라이버에서 제2 오디오 렌더 드라이버로 변경하는 변경 모듈; 상기 제2 오디오 렌더 드라이버로 전달되는 오디오 데이터를 캡쳐하는 캡쳐링 모듈; 및 상기 로컬 머신과 네트워크를 통해 연결된 원격 머신(remote machine)으로부터 수신된 제1 음성 데이터 또는 상기 로컬 머신의 마이크를 통해 입력된 제2 음성 데이터를 캡쳐된 상기 오디오 데이터와 믹싱(mixing)하는 믹서를 포함하는, 사운드 공유 장치가 제공된다.

상기 믹서는, 상기 제1 음성 데이터와 상기 오디오 데이터가 믹싱된 믹싱 데이터를 상기 제1 오디오 렌더 드라이버로 출력할 수 있다.

상기 제1 오디오 렌더 드라이버는, 상기 로컬 머신의 스피커를 구동하기 위한 실제 오디오 렌더 드라이버(actual audio render driver)이며, 상기 제2 오디오 렌더 드라이버는, 가상 스피커(virtual speaker)를 구동하기 위한 가상 오디오 렌더 드라이버(virtual audio render driver)일 수 있다.

상기 제2 음성 데이터와 상기 오디오 데이터가 믹싱된 믹싱 데이터가 상기 네트워크를 통해 상기 원격 머신으로 송신될 수 있다.

상기 사운드 공유 장치는, 캡쳐된 상기 오디오 데이터의 샘플링 레이트(sampling rate)를 상기 제1 오디오 렌더 드라이버의 샘플링 레이트 또는 상기 제2 음성 데이터의 샘플링 레이트로 변경하는 리샘플러(resampler)를 더 포함할 수 있다.

본 발명의 다른 예시적인 실시예에 따르면, 상술한 사운드 공유 장치를 포함하는, 단말이 제공된다.

본 발명의 다른 예시적인 실시예에 따르면, 하나 이상의 프로세서들, 및 상기 하나 이상의 프로세서들에 의해 실행되는 하나 이상의 프로그램들을 저장하는 메모리를 구비한 컴퓨팅 장치에서 수행되는 방법으로서, 변경 모듈에서, 로컬 머신(local machine)의 기본 오디오 렌더 드라이버(default audio render driver)를 제1 오디오 렌더 드라이버에서 제2 오디오 렌더 드라이버로 변경하는 단계; 캡쳐링 모듈에서, 상기 제2 오디오 렌더 드라이버로 전달되는 오디오 데이터를 캡쳐하는 단계; 및 믹서에서, 상기 로컬 머신과 네트워크를 통해 연결된 원격 머신(remote machine)으로부터 수신된 제1 음성 데이터 또는 상기 로컬 머신의 마이크를 통해 입력된 제2 음성 데이터를 캡쳐된 상기 오디오 데이터와 믹싱(mixing)하는 단계를 포함하는, 사운드 공유 방법이 제공된다.

상기 사운드 공유 방법은, 상기 믹싱하는 단계 이후, 상기 믹서에서, 상기 제1 음성 데이터와 상기 오디오 데이터가 믹싱된 믹싱 데이터를 상기 제1 오디오 렌더 드라이버로 출력하는 단계를 더 포함할 수 있다.

상기 사운드 공유 방법은, 상기 믹싱하는 단계 이전에, 리샘플러에서, 캡쳐된 상기 오디오 데이터의 샘플링 레이트(sampling rate)를 상기 제1 오디오 렌더 드라이버의 샘플링 레이트 또는 상기 제2 음성 데이터의 샘플링 레이트로 변경하는 단계를 더 포함할 수 있다.

본 발명의 실시예들에 따르면, 가상 오디오 렌더 드라이버를 이용하여 단말 자체에서 발생되는 오디오 데이터와 사운드 공유 장치를 통해 전달되는 음성 데이터를 원천적으로 분리할 수 있으며, 이에 따라 어쿠스틱 에코 및 사운드 왜곡의 발생 없이 사운드를 용이하게 공유할 수 있다. 또한, 이 경우 기존 음성 채널을 통해 사운드 공유가 가능하며, 사운드 공유를 위한 추가적인 채널이 불필요하게 된다. 이에 따라, 사운드 공유를 위한 네트워크 대역폭(network bandwidth)을 절약할 수 있으며 전달되는 패킷 개수를 최소화하여 서버의 부하를 줄일 수 있다.

도 1은 음성 통신 시스템에서 사용되는 루프백 캡쳐 인터페이스(loopback capture interface)를 설명하기 위한 예시도
도 2는 본 발명의 일 실시예에 따른 단말에서 오디오 데이터를 캡쳐하는 과정을 설명하기 위한 예시도
도 3은 본 발명의 일 실시예에 따른 단말에서 캡쳐된 오디오 데이터를 처리하는 과정을 설명하기 위한 예시도
도 4는 본 발명의 일 실시예에 따른 사운드 공유 장치의 상세 구성을 나타낸 블록도
도 5는 본 발명의 일 실시예에 따른 사운드 공유 방법을 설명하기 위한 예시적인 흐름도
도 6은 예시적인 실시예들에서 사용되기에 적합한 컴퓨팅 장치를 포함하는 컴퓨팅 환경을 예시하여 설명하기 위한 블록도

이하, 도면을 참조하여 본 발명의 구체적인 실시형태를 설명하기로 한다. 이하의 상세한 설명은 본 명세서에서 기술된 방법, 장치 및/또는 시스템에 대한 포괄적인 이해를 돕기 위해 제공된다. 그러나 이는 예시에 불과하며 본 발명은 이에 제한되지 않는다.

본 발명의 실시예들을 설명함에 있어서, 본 발명과 관련된 공지기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략하기로 한다. 그리고, 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다. 상세한 설명에서 사용되는 용어는 단지 본 발명의 실시예들을 기술하기 위한 것이며, 결코 제한적이어서는 안 된다. 명확하게 달리 사용되지 않는 한, 단수 형태의 표현은 복수 형태의 의미를 포함한다. 본 설명에서, "포함" 또는 "구비"와 같은 표현은 어떤 특성들, 숫자들, 단계들, 동작들, 요소들, 이들의 일부 또는 조합을 가리키기 위한 것이며, 기술된 것 이외에 하나 또는 그 이상의 다른 특성, 숫자, 단계, 동작, 요소, 이들의 일부 또는 조합의 존재 또는 가능성을 배제하도록 해석되어서는 안 된다.

도 1은 음성 통신 시스템에서 사용되는 루프백 캡쳐 인터페이스(loopback capture interface)를 설명하기 위한 예시도이다. 본 발명의 실시예들에서 음성 통신 시스템은 음성 통화, 다자간 음성 회의 등 네트워크 기반으로 이루어지는 다양한 종류의 오디오 기반 통신 시스템을 통칭하는 의미로 사용된다. 또한, 상기 음성 통신 시스템은 오디오만을 이용한 통신 시스템에 한정되는 것은 아니며, 양자간 화상 통화, 다자간 화상 회의 등 오디오가 통신 수단의 일부로서 포함된 것 또한 포함할 수 있다. 즉, 본 발명의 실시예들은 특정 종류 내지 방식을 가지는 통신 시스템에 한정된 것은 아님에 유의한다.

도 1을 참조하면, 음성 통신의 참가자가 사용하는 로컬 머신(local machine)에는 사운드 재생과 관련된 각종 애플리케이션 또는 하드웨어 장치가 존재할 수 있다. 일 예시로서, 상기 로컬 머신은 사운드 공유 장치(102), 미디어 플레이어(104), 웹 브라우저(106) 등을 구비할 수 있다. 사운드 공유 장치(102)는 다자간 음성 통신을 위한 전용 애플리케이션을 구비하는 하드웨어 장치 또는 상기 애플리케이션을 실행시키기 위한 컴퓨터 판독 가능한 기록매체로서, 원격 머신(remote machine)으로부터 수신된 상대방의 음성 데이터에 대한 재생 요청을 운영체제(108)에 전달할 수 있다. 또한, 미디어 플레이어(104)는 단말 내 제1 오디오 데이터에 대한 재생 요청을 운영체제(108)에 전달할 수 있으며, 웹 브라우저(106)는 온라인 상의 제2 오디오 데이터에 대한 재생 요청을 운영체제(108)에 전달할 수 있다. 상기 제1 오디오 데이터는 예를 들어, 단말에 저장된 음악 파일일 수 있으며, 제2 오디오 데이터는 예를 들어, 온라인 상에서 재생 가능한 사운드 콘텐츠일 수 있다.

운영체제(108)는 상기 음성 데이터, 제1 오디오 데이터 및 제2 오디오 데이터를 믹싱(mixing)하여 기본 오디오 렌더 드라이버(110, Default Audio Render Driver)로 전달하고, 기본 오디오 렌더 드라이버(110)는 상기 음성 데이터, 제1 오디오 데이터 및 제2 오디오 데이터가 믹싱된 믹싱 데이터를 기본 스피커(112)로 전달할 수 있다. 이후, 기본 스피커(112)는 상기 믹싱 데이터를 출력할 수 있다. 여기서, 기본 오디오 렌더 드라이버(110)는 로컬 머신이 상기 로컬 머신 내 하나 이상의 오디오 렌더 드라이버 중 기본적으로 사용하게 설정되어 있는 오디오 렌더 드라이버이며, 기본 스피커(112)는 로컬 머신이 상기 로컬 머신 내 하나 이상의 스피커 중 기본적으로 사용하게 설정되어 있는 스피커를 의미한다.

이때, 운영체제(108)는 루프백 캡쳐 인터페이스(loopback capture interface)를 제공할 수 있다. 애플리케이션 개발자는 운영체제(108)에서 제공되는 루프백 캡쳐 인터페이스를 통해 기본 오디오 렌더 드라이버(110)로 전달되는 사운드를 캡쳐하도록 할 수 있다.

그러나, 상기 루프백 캡쳐 인터페이스를 사용하는 경우 제1 오디오 데이터 및 제2 오디오 데이터뿐 아니라 사운드 공유 장치(102)을 통해 전달된 상대방의 음성 데이터까지 믹싱되어 캡쳐된다. 만약, 이와 같이 캡쳐된 믹싱 데이터를 상대방과 공유하는 경우, 상대방은 자신이 말한 소리를 그대로 다시 듣게 된다. 즉, 이 경우 어쿠스틱 에코(auciustic echo) 현상이 발생하게 된다.

도 2는 본 발명의 일 실시예에 따른 단말(200)(즉, 로컬 머신)에서 오디오 데이터를 캡쳐하는 과정을 설명하기 위한 예시도이다. 도 2에 도시된 바와 같이, 본 발명의 일 실시예에 따른 단말(200)에는 사운드 재생과 관련된 각종 애플리케이션 또는 하드웨어 장치가 존재할 수 있다. 일 예시로서, 상기 단말(200)은 사운드 공유 장치(202), 미디어 플레이어(204), 웹 브라우저(206) 등을 구비할 수 있다. 상술한 바와 같이, 사운드 공유 장치(202)는 다자간 음성 통신을 위한 전용 애플리케이션을 구비하는 하드웨어 장치 또는 상기 애플리케이션을 실행시키기 위한 컴퓨터 판독 가능한 기록매체일 수 있다. 또한, 미디어 플레이어(204) 및 웹 브라우저(206)는 각종 오디오 데이터에 대한 재생 요청을 운영체제(208)에 전달할 수 있다.

또한, 본 발명의 일 실시예에 따른 단말(200)에는 제1 오디오 렌더 드라이버(210) 및 제2 오디오 렌더 드라이버(212)가 설치될 수 있다. 여기서, 제1 오디오 렌더 드라이버(210)는 단말(200)의 스피커(214)(하드웨어 장치)를 구동하기 위한 실제 오디오 렌더 드라이버(actual audio render driver)이며, 제2 오디오 렌더 드라이버(212)는 가상 스피커(virtual speaker)를 구동하기 위한 가상 오디오 렌더 드라이버(virtual audio render driver)일 수 있다. 제2 오디오 렌더 드라이버(212)는 예를 들어, 다자간 음성 통신을 위한 전용 애플리케이션과 함께 서버(미도시)에서 배포되어 상기 단말(200)에 설치될 수 있다. 한편, 제2 오디오 렌더 드라이버(212)의 설치 전에는 제1 오디오 렌더 드라이버(210)가 단말(200)의 기본 오디오 렌더 드라이버(default audio render driver)로 설정되어 있을 수 있다.

사운드 공유 장치(202)는 사운드의 공유시 단말(200) 내 운영체제(208)의 기본 오디오 렌더 드라이버를 제1 오디오 렌더 드라이버(210)에서 제2 오디오 렌더 드라이버(212)로 변경할 수 있다. 일 예시로서, 사운드 공유 장치(202)는 사용자의 요청에 따라 상기 다자간 음성 통신을 위한 전용 애플리케이션을 실행시켜 사운드 공유 서비스를 개시할 수 있으며, 상기 서비스의 개시시 상기 기본 오디오 렌더 드라이버를 제1 오디오 렌더 드라이버(210)에서 제2 오디오 렌더 드라이버(212)로 변경할 수 있다. 이 경우, 사운드 공유 장치(202) 내 애플리케이션을 제외한 나머지 애플리케이션, 예를 들어 미디어 플레이어(204), 웹 브라우저(206) 등은 재생할 오디오 데이터, 예를 들어 제1 오디오 데이터, 제2 오디오 데이터 등을 기본 오디오 렌더 드라이버인 제2 오디오 렌더 드라이버(212)로 전달할 수 있다. 이때, 사운드 공유 장치(202)는 타 단말(미도시), 즉 원격 머신으로부터 수신된 상대방의 음성 데이터를 원래대로 제1 오디오 렌더 드라이버(210)로 출력할 수 있다.

이후, 사운드 공유 장치(202)는 제2 오디오 렌더 드라이버(212)로 전달되는 오디오 데이터를 캡쳐할 수 있다. 일 예시로서, 사운드 공유 장치(202)는 상술한 루프백 캡쳐 인터페이스를 이용하여 제2 오디오 렌더 드라이버(212)로 전달되는 오디오 데이터(예를 들어, 제1 오디오 데이터 및 제2 오디오 데이터)를 캡쳐할 수 있다. 이 경우, 단말(200)에서 발생되는 모든 오디오 데이터는 사운드 공유 장치(202)을 통해 전달되는 음성 데이터와 원천적으로 분리될 수 있다. 따라서, 캡쳐된 오디오 데이터에는 상대방의 음성 데이터가 포함되지 않게 되며, 사운드 공유 장치(202)는 상기 캡쳐된 오디오 데이터를 네트워크를 통해 원격 머신으로 송신할 수 있다. 상기 원격 머신은 상기 네트워크를 통해 단말(200)(즉, 로컬 머신)과 연결될 수 있다. 여기서, 상기 네트워크는 예를 들어, 3G 또는 LTE 네트워크 등의 이동통신망, 유무선 인터넷 망 등 패킷 통신이 가능한 모든 종류의 통신망을 포함할 수 있다.

이와 같이 캡쳐된 오디오 데이터를 상대방과 공유하게 되면 어쿠스틱 에코 현상이 발생하지 않게 된다. 또한, 단말(200)이 마이크(미도시)를 통해 사용자로부터 음성 데이터를 입력 받는 경우, 사운드 공유 장치(202)는 상기 음성 데이터를 캡쳐된 오디오 데이터와 믹싱하여 믹싱 데이터를 생성하고, 상기 믹싱 데이터를 원격 머신으로 송신할 수 있다.

또한, 사운드 공유 장치(202)는 캡쳐된 오디오 데이터를 원격 머신으로부터 수신된 상대방의 음성 데이터와 믹싱하여 제1 오디오 렌더 드라이버(210)로 출력할 수 있다. 상술한 바와 같이, 제2 오디오 렌더 드라이버(212)는 가상 오디오 렌더 드라이버(virtual audio render driver)이므로 실제 스피커(214)와는 연결되지 않는다. 따라서, 사운드 공유 장치(202)는 캡쳐된 오디오 데이터를 원격 머신으로부터 수신된 상대방의 음성 데이터와 믹싱하여 제1 오디오 렌더 드라이버(210)로 출력하고, 제1 오디오 렌더 드라이버(210)는 캡쳐된 오디오 데이터와 상대방의 음성 데이터가 믹싱된 믹싱 데이터를 스피커(214)로 전달할 수 있다. 이후, 스피커(214)는 상기 믹싱 데이터를 출력할 수 있으며, 사용자는 상기 믹싱 데이터를 들을 수 있게 된다.

도 3은 본 발명의 일 실시예에 따른 단말(200)에서 캡쳐된 오디오 데이터를 처리하는 과정을 설명하기 위한 예시도이다. 여기서, 제1 음성 데이터는 로컬 머신과 네트워크를 통해 연결된 원격 머신으로부터 수신된 상대방의 음성 데이터이며, 도 3의 A 부분에 도시된 믹싱 데이터는 로컬 머신의 사용자에게 제공되는 데이터이다. 또한, 제2 음성 데이터는 로컬 머신의 마이크를 통해 입력된 사용자의 음성 데이터이며, 도 3의 B 부분에 도시된 믹싱 데이터는 상대방(즉, 원격 머신의 사용자)에게 제공되는 데이터이다. 이때, 단말(200)에서 발생되는 오디오 데이터는 제2 오디오 렌더 드라이버(212)로 전달되며, 제2 오디오 렌더 드라이버(212)로 전달되는 오디오 데이터는 루프백 캡쳐 인터페이스를 통해 캡쳐된 것으로 가정한다.

도 3의 A 부분을 참조하면, 디코더(222, decoder)는 원격 머신으로부터 수신된 제1 음성 데이터를 디코딩할 수 있다. 또한, 제1 오디오 렌더 드라이버(210)의 샘플링 레이트(sampling rate)와 제2 오디오 렌더 드라이버(212)의 샘플링 레이트가 다를 수 있으므로, 리샘플러(306, resampler)는 캡쳐된 오디오 데이터의 샘플링 레이트를 제1 오디오 렌더 드라이버(210)의 샘플링 레이트로 변경할 수 있다. 이후, 믹서(308)는 디코더(222)를 통과한 제1 음성 데이터와 리샘플러(306)을 통과한 오디오 데이터를 믹싱하여 믹싱 데이터를 생성하고, 상기 믹싱 데이터를 제1 오디오 렌더 드라이버(210)로 출력할 수 있다. 제1 오디오 렌더 드라이버(210)는 상기 믹싱 데이터를 스피커(214)로 전달할 수 있다. 스피커(214)는 상기 믹싱 데이터를 출력할 수 있으며, 사용자는 상기 믹싱 데이터를 들을 수 있게 된다.

또한, 도 3의 B 부분을 참조하면, 마이크(216)는 로컬 머신의 사용자로부터 제2 음성 데이터를 입력 받을 수 있다. 또한, 제2 오디오 렌더 드라이버(212)의 샘플링 레이트와 마이크(216)에서 입력된 제2 음성 데이터의 샘플링 레이트가 다를 수 있으므로, 리샘플러(306)는 캡쳐된 오디오 데이터의 샘플링 레이트를 제2 음성 데이터의 샘플링 레이트로 변경할 수 있다. 이후, 믹서(308)는 마이크(216)로 입력된 제2 음성 데이터와 리샘플러(306)을 통과한 오디오 데이터를 믹싱하여 믹싱 데이터를 생성하고, 상기 믹싱 데이터를 인코더(218, encoder)로 출력할 수 있다. 인코더(218)는 상기 믹싱 데이터를 인코딩하여 패킷타이저(220, packetizer)로 전달할 수 있다. 패킷타이저(220)는 인코딩된 믹싱 데이터를 패킷화할 수 있다. 이후, 각 패킷은 단말(200)(즉, 로컬 머신)과 원격 머신이 연결된 네트워크(예를 들어, 기존 음성 채널)를 통해 원격 머신으로 송신될 수 있다. 여기서, 상기 음성 채널은 제1 음성 데이터가 송신된 음성 채널과 동일한 음성 채널일 수 있다.

도 4는 본 발명의 일 실시예에 따른 사운드 공유 장치(202)의 상세 구성을 나타낸 블록도이다. 도 4에 도시된 바와 같이, 본 발명의 일 실시예에 따른 사운드 공유 장치(202)는 변경 모듈(302), 캡쳐링 모듈(304), 리샘플러(306), 믹서(308) 및 송신 모듈(310)을 포함한다.

변경 모듈(302)은 단말(200)(즉, 로컬 머신)의 기본 오디오 렌더 드라이버를 제1 오디오 렌더 드라이버에서 제2 오디오 렌더 드라이버로 변경한다. 상술한 바와 같이, 제1 오디오 렌더 드라이버(210)는 단말(200)의 스피커(214)를 구동하기 위한 실제 오디오 렌더 드라이버이며, 제2 오디오 렌더 드라이버(212)는 가상 스피커를 구동하기 위한 가상 오디오 렌더 드라이버일 수 있다. 이 경우, 사운드 공유 장치(202)를 통해 전달되는 음성 데이터를 제외한 모든 오디오 데이터는 기본 오디오 렌더 드라이버인 제2 오디오 렌더 드라이버(212)로 전달될 수 있다.

캡쳐링 모듈(304)은 제2 오디오 렌더 드라이버(212)로 전달되는 오디오 데이터를 캡쳐한다. 일 예시로서, 캡쳐링 모듈(304)은 루프백 캡쳐 인터페이스를 이용하여 제2 오디오 렌더 드라이버(212)로 전달되는 오디오 데이터를 캡쳐할 수 있다. 이 경우, 단말(200)에서 발생되는 모든 오디오 데이터는 사운드 공유 장치(202)을 통해 전달되는 음성 데이터와 원천적으로 분리될 수 있다.

리샘플러(306)는 캡쳐된 오디오 데이터의 샘플링 레이트를 조정한다. 일 예시로서, 리샘플러(306)는 캡쳐된 오디오 데이터의 샘플링 레이트를 제1 오디오 렌더 드라이버(210)의 샘플링 레이트로 변경할 수 있다. 다른 예시로서, 리샘플러(306)는 캡쳐된 오디오 데이터의 샘플링 레이트를 제2 음성 데이터의 샘플링 레이트로 변경할 수 있다.

믹서(308)는 캡쳐된 오디오 데이터와 음성 데이터를 믹싱하여 믹싱 데이터를 생성한다. 일 예시로서, 믹서(308)는 원격 머신으로부터 수신된 제1 음성 데이터와 캡쳐된 오디오 데이터를 믹싱하여 믹싱 데이터를 생성하고, 상기 믹싱 데이터를 제1 오디오 렌더 드라이버(210)로 출력할 수 있다. 다른 예시로서, 믹서(308)는 캡쳐된 오디오 데이터와 로컬 머신의 마이크를 통해 입력된 제2 음성 데이터와 캡쳐된 오디오 데이터를 믹싱하여 믹싱 데이터를 생성하고, 상기 믹싱 데이터를 인코더(218)로 출력할 수 있다.

송신 모듈(310)은 인코더(218) 및 패킷타이저(220)를 통과한 믹싱 데이터의 각 패킷을 원격 머신으로 송신한다. 이때, 송신 모듈(310)은 다자간 음성 통신을 위한 전용 애플리케이션을 제공하는 서버를 통해 상기 각 패킷을 원격 머신으로 송신할 수 있다. 여기서, 각 패킷은 단말(200)(즉, 로컬 머신)과 원격 머신이 연결된 네트워크를 통해 원격 머신으로 송신될 수 있다.

도 5는 본 발명의 일 실시예에 따른 사운드 공유 방법을 설명하기 위한 예시적인 흐름도이다. 도시된 흐름도에서는 상기 방법을 복수 개의 단계로 나누어 기재하였으나, 적어도 일부의 단계들은 순서를 바꾸어 수행되거나, 다른 단계와 결합되어 함께 수행되거나, 생략되거나, 세부 단계들로 나뉘어 수행되거나, 또는 도시되지 않은 하나 이상의 단계가 부가되어 수행될 수 있다.

또한, 도면에서 도시하지는 않았으나 사운드 공유 장치(202)는 사용자(예를 들어, 사용자 A)의 요청에 따라 서버에서 제공된 다자간 음성 통신을 위한 전용 애플리케이션을 실행시켜 사운드 공유 서비스를 개시할 수 있으며, 상기 서비스의 개시시 로컬 머신(200)의 기본 오디오 렌더 드라이버를 제1 오디오 렌더 드라이버(210)에서 제2 오디오 렌더 드라이버(212)로 변경할 수 있다. 도 5에서는 로컬 머신(200)의 기본 오디오 렌더 드라이버가 제1 오디오 렌더 드라이버(210)에서 제2 오디오 렌더 드라이버(212)로 이미 변경된 것으로 가정한다. 이하, 본 발명의 일 실시예에 따른 사운드 공유 방법의 상세 흐름은 아래와 같다.

S502 단계에서, 원격 머신(400)의 사운드 공유 장치(402)는 사용자 B로부터 제1 음성 데이터를 입력 받는다.

S504 단계에서, 원격 머신(400)의 사운드 공유 장치(202)는 제1 음성 데이터를 로컬 머신(200)의 사운드 공유 장치(202)로 송신한다. 이때, 원격 머신(400)의 사운드 공유 장치(402)는 서버를 통해 제1 음성 데이터를 로컬 머신(200)의 사운드 공유 장치(202)로 송신할 수 있다.

S506 단계에서, 미디어 플레이어(204)는 오디오 데이터를 기본 오디오 렌더 드라이버인 제2 오디오 렌더 드라이버(212)로 전달한다. 한편, 도 5에서는 설명의 편의상 미디어 플레이어(204)가 오디오 데이터를 발생시키는 것으로 도시하였으나 미디어 플레이어(204)가 아닌 다른 모듈에서 오디오 데이터를 발생시킬 수 있으며, 이 경우에도 상기 S506 단계가 동일하게 수행될 수 있다.

S508 단계에서, 사운드 공유 장치(202)는 제2 오디오 렌더 드라이버(212)로 전달되는 오디오 데이터를 캡쳐한다. 일 예시로서, 사운드 공유 장치(202)는 루프백 캡쳐 인터페이스를 이용하여 제2 오디오 렌더 드라이버(212)로 전달되는 오디오 데이터를 캡쳐할 수 있다.

S510 단계에서, 사운드 공유 장치(202)는 제1 음성 데이터와 캡쳐된 오디오 데이터를 믹싱하여 믹싱 데이터를 생성하고, 상기 믹싱 데이터를 제1 오디오 렌더 드라이버(210)로 출력한다.

S512 단계에서, 제1 오디오 렌더 드라이버(210)는 상기 믹싱 데이터를 스피커(214)로 전달한다.

S514 단계에서, 스피커(214)는 상기 믹싱 데이터를 출력한다. 이에 따라, 사용자 A는 상기 믹싱 데이터를 들을 수 있게 된다.

S516 단계에서, 마이크(216)는 사용자 A로부터 제2 음성 데이터를 입력 받는다.

S518 단계에서, 사운드 공유 장치(202)는 제2 음성 데이터와 캡쳐된 오디오 데이터를 믹싱하여 믹싱 데이터를 생성한다.

S520 단계에서, 사운드 공유 장치(202)는 상기 믹싱 데이터를 원격 머신(400)의 사운드 공유 장치(402)로 송신한다. 이때, 사운드 공유 장치(202)는 서버를 통해 상기 믹싱 데이터를 원격 머신(400)의 사운드 공유 장치(402)로 송신할 수 있다. 또한, 상기 믹싱 데이터는 로컬 머신(200)과 원격 머신(400)이 연결된 네트워크(예를 들어, 기존 음성 채널)를 통해 원격 머신(400)의 사운드 공유 장치(402)로 송신될 수 있다.

S522 단계에서, 원격 머신(400)의 사운드 공유 장치(402)는 상기 믹싱 데이터를 원격 머신(400)의 스피커(미도시)로 전달할 수 있으며, 원격 머신(400)의 스피커는 상기 믹싱 데이터를 출력할 수 있다. 이에 따라, 사용자 B는 상기 믹싱 데이터를 들을 수 있게 된다.

도 6은 예시적인 실시예들에서 사용되기에 적합한 컴퓨팅 장치를 포함하는 컴퓨팅 환경(10)을 예시하여 설명하기 위한 블록도이다. 도시된 실시예에서, 각 컴포넌트들은 이하에 기술된 것 이외에 상이한 기능 및 능력을 가질 수 있고, 이하에 기술되지 않은 것 이외에도 추가적인 컴포넌트를 포함할 수 있다.

도시된 컴퓨팅 환경(10)은 컴퓨팅 장치(12)를 포함한다. 일 실시예에서, 컴퓨팅 장치(12)는 단말(200), 사운드 공유 장치(202), 또는 사운드 공유 장치(202)에 포함되는 하나 이상의 컴포넌트일 수 있다.

컴퓨팅 장치(12)는 적어도 하나의 프로세서(14), 컴퓨터 판독 가능 저장 매체(16) 및 통신 버스(18)를 포함한다. 프로세서(14)는 컴퓨팅 장치(12)로 하여금 앞서 언급된 예시적인 실시예에 따라 동작하도록 할 수 있다. 예컨대, 프로세서(14)는 컴퓨터 판독 가능 저장 매체(16)에 저장된 하나 이상의 프로그램들을 실행할 수 있다. 상기 하나 이상의 프로그램들은 하나 이상의 컴퓨터 실행 가능 명령어를 포함할 수 있으며, 상기 컴퓨터 실행 가능 명령어는 프로세서(14)에 의해 실행되는 경우 컴퓨팅 장치(12)로 하여금 예시적인 실시예에 따른 동작들을 수행하도록 구성될 수 있다.

컴퓨터 판독 가능 저장 매체(16)는 컴퓨터 실행 가능 명령어 내지 프로그램 코드, 프로그램 데이터 및/또는 다른 적합한 형태의 정보를 저장하도록 구성된다. 컴퓨터 판독 가능 저장 매체(16)에 저장된 프로그램(20)은 프로세서(14)에 의해 실행 가능한 명령어의 집합을 포함한다. 일 실시예에서, 컴퓨터 판독 가능 저장 매체(16)는 메모리(랜덤 액세스 메모리와 같은 휘발성 메모리, 비휘발성 메모리, 또는 이들의 적절한 조합), 하나 이상의 자기 디스크 저장 디바이스들, 광학 디스크 저장 디바이스들, 플래시 메모리 디바이스들, 그 밖에 컴퓨팅 장치(12)에 의해 액세스되고 원하는 정보를 저장할 수 있는 다른 형태의 저장 매체, 또는 이들의 적합한 조합일 수 있다.

통신 버스(18)는 프로세서(14), 컴퓨터 판독 가능 저장 매체(16)를 포함하여 컴퓨팅 장치(12)의 다른 다양한 컴포넌트들을 상호 연결한다.

컴퓨팅 장치(12)는 또한 하나 이상의 입출력 장치(24)를 위한 인터페이스를 제공하는 하나 이상의 입출력 인터페이스(22) 및 하나 이상의 네트워크 통신 인터페이스(26)를 포함할 수 있다. 입출력 인터페이스(22) 및 네트워크 통신 인터페이스(26)는 통신 버스(18)에 연결된다. 입출력 장치(24)는 입출력 인터페이스(22)를 통해 컴퓨팅 장치(12)의 다른 컴포넌트들에 연결될 수 있다. 예시적인 입출력 장치(24)는 포인팅 장치(마우스 또는 트랙패드 등), 키보드, 터치 입력 장치(터치패드 또는 터치스크린 등), 음성 또는 소리 입력 장치, 다양한 종류의 센서 장치 및/또는 촬영 장치와 같은 입력 장치, 및/또는 디스플레이 장치, 프린터, 스피커 및/또는 네트워크 카드와 같은 출력 장치를 포함할 수 있다. 예시적인 입출력 장치(24)는 컴퓨팅 장치(12)를 구성하는 일 컴포넌트로서 컴퓨팅 장치(12)의 내부에 포함될 수도 있고, 컴퓨팅 장치(12)와는 구별되는 별개의 장치로 컴퓨팅 장치(102)와 연결될 수도 있다.

이상에서 대표적인 실시예를 통하여 본 발명에 대하여 상세하게 설명하였으나, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 전술한 실시예에 대하여 본 발명의 범주에서 벗어나지 않는 한도 내에서 다양한 변형이 가능함을 이해할 것이다. 그러므로 본 발명의 권리범위는 설명된 실시예에 국한되어 정해져서는 안 되며, 후술하는 특허청구범위뿐만 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.

10 : 컴퓨팅 환경
12 : 컴퓨팅 장치
14 : 프로세서
16 : 컴퓨터 판독 가능 저장 매체
18 : 통신 버스
20 : 프로그램
22 : 입출력 인터페이스
24 : 입출력 장치
26 : 네트워크 통신 인터페이스
102, 202, 402 : 사운드 공유 장치
104, 204 : 미디어 플레이어
106, 206 : 웹 브라우저
108, 208 : 운영체제
110 : 기본 오디오 렌더 드라이버
112 : 기본 스피커
200 : 단말(로컬 머신)
210 : 제1 오디오 렌더 드라이버
212 : 제2 오디오 렌더 드라이버
214 : 스피커
216 : 마이크
218 : 인코더
220 : 패킷타이저
222 : 디코더
302 : 변경 모듈
304 : 캡쳐링 모듈
306 : 리샘플러
308 : 믹서
310 : 송신 모듈
400 : 타 단말(원격 머신)

Claims

로컬 머신(local machine)의 기본 오디오 렌더 드라이버(default audio render driver)를 제1 오디오 렌더 드라이버에서 제2 오디오 렌더 드라이버로 변경하는 변경 모듈;
상기 제2 오디오 렌더 드라이버로 전달되는 오디오 데이터를 캡쳐하는 캡쳐링 모듈; 및
상기 로컬 머신과 네트워크를 통해 연결된 원격 머신(remote machine)으로부터 수신된 제1 음성 데이터 또는 상기 로컬 머신의 마이크를 통해 입력된 제2 음성 데이터를 캡쳐된 상기 오디오 데이터와 믹싱(mixing)하는 믹서를 포함하는, 사운드 공유 장치.
청구항 1에 있어서,
상기 믹서는, 상기 제1 음성 데이터와 상기 오디오 데이터가 믹싱된 믹싱 데이터를 상기 제1 오디오 렌더 드라이버로 출력하는, 사운드 공유 장치.
청구항 1에 있어서,
상기 제1 오디오 렌더 드라이버는, 상기 로컬 머신의 스피커를 구동하기 위한 실제 오디오 렌더 드라이버(actual audio render driver)이며,
상기 제2 오디오 렌더 드라이버는, 가상 스피커(virtual speaker)를 구동하기 위한 가상 오디오 렌더 드라이버(virtual audio render driver)인, 사운드 공유 장치.
청구항 1에 있어서,
상기 제2 음성 데이터와 상기 오디오 데이터가 믹싱된 믹싱 데이터가 상기 네트워크를 통해 상기 원격 머신으로 송신되는, 사운드 공유 장치.
청구항 1에 있어서,
캡쳐된 상기 오디오 데이터의 샘플링 레이트(sampling rate)를 상기 제1 오디오 렌더 드라이버의 샘플링 레이트 또는 상기 제2 음성 데이터의 샘플링 레이트로 변경하는 리샘플러(resampler)를 더 포함하는, 사운드 공유 장치.
청구항 1 내지 5 중 어느 한 항에 기재된 사운드 공유 장치를 포함하는, 단말.
하나 이상의 프로세서들, 및
상기 하나 이상의 프로세서들에 의해 실행되는 하나 이상의 프로그램들을 저장하는 메모리를 구비한 컴퓨팅 장치에서 수행되는 방법으로서,
변경 모듈에서, 로컬 머신(local machine)의 기본 오디오 렌더 드라이버(default audio render driver)를 제1 오디오 렌더 드라이버에서 제2 오디오 렌더 드라이버로 변경하는 단계;
캡쳐링 모듈에서, 상기 제2 오디오 렌더 드라이버로 전달되는 오디오 데이터를 캡쳐하는 단계; 및
믹서에서, 상기 로컬 머신과 네트워크를 통해 연결된 원격 머신(remote machine)으로부터 수신된 제1 음성 데이터 또는 상기 로컬 머신의 마이크를 통해 입력된 제2 음성 데이터를 캡쳐된 상기 오디오 데이터와 믹싱(mixing)하는 단계를 포함하는, 사운드 공유 방법.
청구항 7에 있어서,
상기 믹싱하는 단계 이후,
상기 믹서에서, 상기 제1 음성 데이터와 상기 오디오 데이터가 믹싱된 믹싱 데이터를 상기 제1 오디오 렌더 드라이버로 출력하는 단계를 더 포함하는, 사운드 공유 방법.
청구항 7에 있어서,
상기 제1 오디오 렌더 드라이버는, 상기 로컬 머신의 스피커를 구동하기 위한 실제 오디오 렌더 드라이버(actual audio render driver)이며,
상기 제2 오디오 렌더 드라이버는, 가상 스피커(virtual speaker)를 구동하기 위한 가상 오디오 렌더 드라이버(virtual audio render driver)인, 사운드 공유 방법.
청구항 7에 있어서,
상기 제2 음성 데이터와 상기 오디오 데이터가 믹싱된 믹싱 데이터가 상기 네트워크를 통해 상기 원격 머신으로 송신되는, 사운드 공유 방법.
청구항 7에 있어서,
상기 믹싱하는 단계 이전에,
리샘플러에서, 캡쳐된 상기 오디오 데이터의 샘플링 레이트(sampling rate)를 상기 제1 오디오 렌더 드라이버의 샘플링 레이트 또는 상기 제2 음성 데이터의 샘플링 레이트로 변경하는 단계를 더 포함하는, 사운드 공유 방법.