KR20200054083A - 사운드 생성 방법 및 이를 수행하는 장치들 - Google Patents

사운드 생성 방법 및 이를 수행하는 장치들 Download PDF

Info

Publication number
KR20200054083A
KR20200054083A KR1020190140346A KR20190140346A KR20200054083A KR 20200054083 A KR20200054083 A KR 20200054083A KR 1020190140346 A KR1020190140346 A KR 1020190140346A KR 20190140346 A KR20190140346 A KR 20190140346A KR 20200054083 A KR20200054083 A KR 20200054083A
Authority
KR
South Korea
Prior art keywords
sound
real
sounds
virtual
real object
Prior art date
Application number
KR1020190140346A
Other languages
English (en)
Other versions
KR102379734B1 (ko
Inventor
배영식
Original Assignee
주식회사 후본
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 후본 filed Critical 주식회사 후본
Priority to CN201980073791.1A priority Critical patent/CN113039815B/zh
Priority to PCT/KR2019/015145 priority patent/WO2020096406A1/ko
Priority to US17/292,447 priority patent/US20220021998A1/en
Priority to CN202211375358.3A priority patent/CN115767407A/zh
Publication of KR20200054083A publication Critical patent/KR20200054083A/ko
Priority to KR1020220036120A priority patent/KR20220043088A/ko
Application granted granted Critical
Publication of KR102379734B1 publication Critical patent/KR102379734B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • H04S5/005Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation  of the pseudo five- or more-channel type, e.g. virtual surround
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/13Aspects of volume control, not necessarily automatic, in stereophonic sound systems

Abstract

사운드 생성 방법 및 이를 수행하는 장치들이 개시된다. 일 실시예에 따른 사운드 생성 방법은 실제 공간에서 발생되는 실제 사운드 및 가상 공간에서 발생되는 플레이 사운드를 획득하는 단계와, 상기 실제 사운드 및 상기 플레이 사운드를 조합하여 상기 실제 공간과 상기 가상 공간이 혼합된 혼합 현실에서 발생하는 조합 사운드를 생성하는 단계를 포함한다.

Description

사운드 생성 방법 및 이를 수행하는 장치들{METHOD OF PRODUCING A SOUND AND APPARATUS FOR PERFORMING THE SAME}
아래 실시예들은 사운드 생성 방법 및 이를 수행하는 장치들에 관한 것이다.
최근에는 다양한 3차원 오디오 전용 콘텐츠를 사용자에게 제공할 수 있다. 예를 들어, 최근에는 별도로 녹음된 3차원 사운드를 출력하여 사용자에게 3차원 오디오 전용 콘텐츠를 제공할 수 있다.
3차원 오디오 전용 콘텐츠는 3차원 사운드로 상술한 바와 같이 별도로 녹음된 3차원 사운드를 이용하여 생성된 다양한 콘텐츠일 수 있다. 예를 들어, 최근에는 일반적인 2차원 사운드(또는 음향)에 방향성과 자동화 계산을 수행하여 다양한 3차원 오디오 전용 콘텐츠를 생성하고 있다. 3차원 오디오 전용 콘텐츠는 일반적인 2차원 사운드에 3차원 음향 변환 및 출력 기술이 적용된 사운드 콘텐츠일 수 있다.
3차원 오디오 전용 콘텐츠는 기존의 3차원 사운드 콘텐츠 보다 고몰입과 현실감 재현이 가능한 장점이 있다.
실시예들은 실제 공간에서 발생되는 실제 사운드와 가상 공간에서 발생되는 가상 사운드를 조합하여 실제 공간과 가상 공간이 혼합된 혼합 현실에서 발생하는 조합 사운드를 생성하는 기술을 제공할 수 있다.
일 실시예에 따른 사운드 생성 방법은 실제 공간에서 발생되는 실제 사운드 및 가상 공간에서 발생되는 플레이 사운드를 획득하는 단계와, 상기 실제 사운드 및 상기 플레이 사운드를 조합하여 상기 실제 공간과 상기 가상 공간이 혼합된 혼합 현실에서 발생하는 조합 사운드를 생성하는 단계를 포함할 수 있다.
상기 생성하는 단계는 상기 실제 사운드에 포함된 복수의 실제 객체 사운드들 중에서 적어도 하나의 실제 객체 사운드를 선택하는 단계와, 상기 플레이 사운드에 포함된 복수의 가상 객체 사운드들 중에서 적어도 하나의 가상 객체 사운드를 선택하는 단계와, 상기 적어도 하나의 실제 객체 사운드와 상기 적어도 하나의 가상 객체 사운드를 조합하여 상기 조합 사운드를 생성하는 단계를 포함할 수 있다.
상기 복수의 실제 객체 사운드들은 상기 실제 공간에 위치한 복수의 실제 객체들로부터 발생되는 사운드일 수 있다.
상기 복수의 가상 객체 사운드들은 상기 가상 공간에 위치한 복수의 가상 객체들로부터 발생되는 사운드일 수 있다.
상기 적어도 하나의 실제 객체 사운드를 선택하는 단계는 객체 사운드의 특성에 기초하여 상기 복수의 실제 객체 사운드들을 인식하는 단계와, 실제 사운드 선택 조건에 기초하여 상기 복수의 실제 객체 사운드들 중에서 상기 적어도 하나의 실제 객체 사운드를 선택적으로 추출하는 단계를 포함할 수 있다.
상기 인식하는 단계는 노이즈 필터링 기법에 기초하여 상기 실제 사운드에서 노이즈 사운드를 제거하는 단계와, 상기 객체 사운드의 주파수 및 음량 중에서 적어도 하나에 기초하여 상기 노이즈 사운드가 제거된 실제 사운드에서 상기 복수의 실제 객체 사운드들을 인식하는 단계를 포함할 수 있다.
상기 생성하는 단계는 상기 적어도 하나의 실제 객체 사운드에 대응하는 실제 객체의 위치에 기초하여 상기 적어도 하나의 실제 객체 사운드의 음량을 조절하는 단계와, 음량이 조절된 적어도 하나의 실제 객체 사운드와 상기 적어도 하나의 가상 객체 사운드를 조합하여 상기 조합 사운드를 생성하는 단계를 포함할 수 있다.
상기 조절하는 단계는 상기 적어도 하나의 실제 객체 사운드의 사운드 획득 시간에 기초하여 상기 실제 공간에서 상기 실제 객체의 위치를 결정하는 단계와, 상기 사용자의 위치와 상기 실제 객체의 위치 간의 이격 거리에 기초하여 상기 적어도 하나의 실제 객체 사운드의 음량을 조절하는 단계를 포함할 수 있다.
일 실시예에 따른 장치는 인스트럭션들을 포함하는 메모리와, 상기 인스트럭션들을 실행하기 위한 프로세서를 포함하고, 상기 프로세서는 실제 공간에서 발생되는 실제 사운드 및 가상 공간에서 발생되는 플레이 사운드를 획득하고, 상기 실제 사운드 및 상기 플레이 사운드를 조합하여 상기 실제 공간과 상기 가상 공간이 혼합된 혼합 현실에서 발생하는 조합 사운드를 생성할 수 있다.
상기 프로세서는 상기 실제 사운드에 포함된 복수의 실제 객체 사운드들 중에서 적어도 하나의 실제 객체 사운드를 선택하고, 상기 플레이 사운드에 포함된 복수의 가상 객체 사운드들 중에서 적어도 하나의 가상 객체 사운드를 선택하고, 상기 적어도 하나의 실제 객체 사운드와 상기 적어도 하나의 가상 객체 사운드를 조합하여 상기 조합 사운드를 생성할 수 있다.
상기 복수의 실제 객체 사운드들은 상기 실제 공간에 위치한 복수의 실제 객체들로부터 발생되는 사운드일 수 있다.
상기 복수의 가상 객체 사운드들은 상기 가상 공간에 위치한 복수의 가상 객체들로부터 발생되는 사운드일 수 있다.
상기 프로세서는 객체 사운드의 특성에 기초하여 상기 복수의 실제 객체 사운드들을 인식하고, 실제 사운드 선택 조건에 기초하여 상기 복수의 실제 객체 사운드들 중에서 상기 적어도 하나의 실제 객체 사운드를 선택적으로 추출할 수 있다.
상기 프로세서는 노이즈 필터링 기법에 기초하여 상기 실제 사운드에서 노이즈 사운드를 제거하고, 상기 객체 사운드의 주파수 및 음량 중에서 적어도 하나에 기초하여 상기 노이즈 사운드가 제거된 실제 사운드에서 상기 복수의 실제 객체 사운드들을 인식할 수 있다.
상기 프로세서는 상기 적어도 하나의 실제 객체 사운드에 대응하는 실제 객체의 위치에 기초하여 상기 적어도 하나의 실제 객체 사운드의 음량을 조절하고, 음량이 조절된 적어도 하나의 실제 객체 사운드와 상기 적어도 하나의 가상 객체 사운드를 조합하여 상기 조합 사운드를 생성할 수 있다.
상기 프로세서는 상기 적어도 하나의 실제 객체 사운드의 사운드 획득 시간에 기초하여 상기 실제 공간에서 상기 실제 객체의 위치를 결정하고, 상기 사용자의 위치와 상기 실제 객체의 위치 간의 이격 거리에 기초하여 상기 적어도 하나의 실제 객체 사운드의 음량을 조절할 수 있다.
도 1은 일 실시예에 따른 사운드 생성 시스템의 개략적인 블록도를 나타낸다.
도 2는 도 1에 도시된 사운드 생성 장치의 개략적인 블록도를 나타낸다.
도 3은 도 1에 도시된 사운드 제공 장치를 설명하기 위한 일 예를 나타낸다.
도 4는 도 3에 도시된 제1 제공 장치를 설명하기 위한 일 예를 나타낸다.
도 5는 도 3에 도시된 제2 제공 장치를 설명하기 위한 일 예를 나타낸다.
도 6은 도 1에 도시된 사운드 출력 장치를 설명하기 위한 일 예를 나타내다.
도 7은 도 1에 도시된 사운드 출력 장치를 설명하기 위한 다른 예를 나타낸다.
도 8은 일 실시예에 따른 인이어 타입의 이어폰인 사운드 출력 장치를 설명하기 위한 일 예를 나타낸다.
도 9는 일 실시예에 따른 인이어 타입의 이어폰인 사운드 출력 장치를 설명하기 위한 다른 예를 나타낸다.
도 10은 일 실시예에 따른 조합 사운드를 설명하기 위한 일 예를 나타낸다.
도 11은 도 1에 도시된 사운드 생성 장치의 동작을 설명하기 위한 순서도를 나타낸다.
이하에서, 첨부된 도면을 참조하여 실시예들을 상세하게 설명한다. 그러나, 실시예들에는 다양한 변경이 가해질 수 있어서 특허출원의 권리 범위가 이러한 실시예들에 의해 제한되거나 한정되는 것은 아니다. 실시예들에 대한 모든 변경, 균등물 내지 대체물이 권리 범위에 포함되는 것으로 이해되어야 한다.
실시예에서 사용한 용어는 단지 설명을 목적으로 사용된 것으로, 한정하려는 의도로 해석되어서는 안된다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 명세서 상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
제1 또는 제2등의 용어를 다양한 구성요소들을 설명하는데 사용될 수 있지만, 구성요소들은 용어들에 의해서 한정되어서는 안 된다. 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만, 예를 들어 실시예의 개념에 따른 권리 범위로부터 이탈되지 않은 채, 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소는 제1 구성요소로도 명명될 수 있다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
또한, 첨부 도면을 참조하여 설명함에 있어, 도면 부호에 관계없이 동일한 구성 요소는 동일한 참조부호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다. 실시예를 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 실시예의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.
본 명세서에서의 모듈(module)은 본 명세서에서 설명되는 각 명칭에 따른 기능과 동작을 수행할 수 있는 하드웨어를 의미할 수도 있고, 특정 기능과 동작을 수행할 수 있는 컴퓨터 프로그램 코드를 의미할 수도 있고, 또는 특정 기능과 동작을 수행시킬 수 있는 컴퓨터 프로그램 코드가 탑재된 전자적 기록 매체, 예를 들어 프로세서 또는 마이크로 프로세서를 의미할 수 있다.
다시 말해, 모듈이란 본 발명의 기술적 사상을 수행하기 위한 하드웨어 및/또는 상기 하드웨어를 구동하기 위한 소프트웨어의 기능적 및/또는 구조적 결합을 의미할 수 있다.
이하, 실시예들은 첨부된 도면을 참조하여 상세하게 설명한다. 그러나, 특허출원의 범위가 이러한 실시예들에 의해 제한되거나 한정되는 것은 아니다. 각 도면에 제시된 동일한 참조 부호는 동일한 부재를 나타낸다.
도 1은 일 실시예에 따른 사운드 생성 시스템의 개략적인 블록도를 나타낸다.
사운드 제공 장치(100)는 사용자(또는 청취자)에게 제공할 플레이 사운드(play sound)를 생성한(또는 레코딩한) 후, 플레이 사운드를 사운드 생성 장치(300)에 제공할 수 있다. 플레이 사운드는 3차원 음원 및 3차원 VR(virtual reality) 사운드 콘텐츠 등 다양할 수 있다.
플레이 사운드는 가상 공간에서 발생하는 사운드일 수 있다. 가상 공간은 공간감 및 현장감이 반영된 3차원 사운드를 제공하기 위해 구현된 3차원 가상 공간(또는 3차원 가상 현실)일 수 있다.
사운드 생성 장치(300)는 실제 공간에서 발생되는 실제 사운드와 가상 공간에서 발생되는 가상 사운드를 조합하여 실제 공간과 가상 공간이 혼합된 혼합 현실에서 발생하는 조합 사운드(또는 혼합 사운드, mixed reality sound)를 생성할 수 있다.
이에, 사운드 생성 장치(300)는 실제 공간과 가상 공간이 혼합된 혼합 공간에 사용자가 위치하는 것으로 인식하게 하는 몰입감이 높은 사운드를 제공할 수 있다.
사운드 생성 장치(300)는 실제 사운드 및 가상 사운드를 선택적으로 조합하여 다양한 입체적인 사운드를 제공함으로써, 사용자에게 맞춤화(또는 개인화)된 3차원 사운드를 제공할 수 있다.
사운드 생성 장치(300)는 실제 사운드를 완전히 제거하지 않고 실제 사운드와 플레이 사운드를 혼합하여 제공함으로써, 사용자가 실제 공간에서 발생된 상황을 인지하게 하고, 사용자의 안전을 확보할 수 있다.
사운드 출력 장치(500)는 실제 공간에서 발생되는 실제 사운드(real sound)를 획득할 수 있다. 실제 공간은 조합 사운드를 청취하기 위한 사용자가 위치한 공간일 수 있다.
예를 들어, 사운드 출력 장치(500)는 사용자의 머리를 트레킹하여(또는 헤드 트레킹(head tracking)하여) 사용자의 머리 방향(또는 사용자의 시점, 사용자의 시선)을 감지(또는 센싱, 획득)할 수 있다.
사운드 출력 장치(500)는 사용자의 양쪽 방향에 위치한 사운드 출력 장치(500)의 마이크를 통해서 사용자의 머리 방향에 따른 3차원 실제 사운드를 획득할 수 있다. 양쪽 방향은 사용자의 양 귀에 대응하는 방향으로 오른쪽 귀 방향 및 왼쪽 귀 방향일 수 있다.
사운드 출력 장치(500)는 실제 사운드, 실제 사운드에 대한 사운드 획득 정보 및/또는 사용자의 머리 방향 정보를 사운드 생성 장치(300)에 전송할 수 있다.
사운드 출력 장치(500)는 사운드 생성 장치(300)로부터 전송된 조합 사운드를 수신하여 사용자에게 출력(또는 제공)할 수 있다.
이에, 사용자는 사운드 출력 장치(500)를 통해 실제 공간 및 가상 공간이 혼합된 혼합 현실에서 발생되는 조합 사운드를 청취할 수 있다.
상술한 바와 같이 사운드 생성 장치(300)와 사운드 출력 장치(500)가 독립적으로 구별되게 구성되지만, 이에 한정하는 것은 아니다. 예를 들어, 사운드 생성 장치(300)는 사운드 출력 장치(500)에 포함될 수 있다.
도 2는 도 1에 도시된 사운드 생성 장치의 개략적인 블록도를 나타낸다.
사운드 생성 장치(300)는 통신 모듈(310), 메모리(330) 및 프로세서(350)를 포함할 수 있다.
통신 모듈(310)은 사운드 제공 장치(100)로부터 전송된 플레이 사운드를 수신하여 프로세서(350)에 전송할 수 있다.
통신 모듈(310)은 사운드 출력 장치(100)로부터 전송된 실제 사운드, 실제 사운드에 대한 사운드 획득 시간 정보 및/또는 사용자의 머리 방향에 대한 정보를 수신하여 프로세서(350)에 전송할 수 있다.
통신 모듈(310)은 프로세서(350)로부터 전송된 조합 사운드를 수신하여 사운드 출력 장치(100)에 전송할 수 있다.
메모리(330)는 프로세서(350)에 의해 실행가능한 인스트럭션들(또는 프로그램)을 저장할 수 있다. 예를 들어, 인스트럭션들은 프로세서(350)의 동작 및/또는 프로세서(350)의 각 구성의 동작을 실행하기 위한 인스트럭션들을 포함할 수 있다.
프로세서(350)는 메모리(330)에 저장된 데이터를 처리할 수 있다. 프로세서(350)는 메모리(330)에 저장된 컴퓨터로 읽을 수 있는 코드(예를 들어, 소프트웨어) 및 프로세서(350)에 의해 유발된 인스트럭션(instruction)들을 실행할 수 있다.
프로세서(350)는 목적하는 동작들(desired operations)을 실행시키기 위한 물리적인 구조를 갖는 회로를 가지는 하드웨어로 구현된 데이터 처리 장치일 수 있다. 예를 들어, 목적하는 동작들은 프로그램에 포함된 코드(code) 또는 인스트럭션들(instructions)을 포함할 수 있다.
예를 들어, 하드웨어로 구현된 데이터 처리 장치는 마이크로프로세서(microprocessor), 중앙 처리 장치(central processing unit), 프로세서 코어(processor core), 멀티-코어 프로세서(multi-core processor), 멀티프로세서(multiprocessor), ASIC(Application-Specific Integrated Circuit), FPGA(Field Programmable Gate Array)를 포함할 수 있다.
프로세서(350)는 사운드 생성 장치(300)의 전반적인 동작을 제어할 수 있다. 예를 들어, 프로세서(350)는 사운드 생성 장치(300)의 각 구성(310 및 330)의 동작을 제어할 수 있다.
프로세서(350)는 사운드 출력 장치(500)로부터 전송된 실제 사운드, 실제 사운드에 대한 사운드 획득 시간 정보 및/또는 사용자의 머리 방향에 대한 정보를 획득할 수 있다.
실제 사운드는 복수의 실제 객체 사운드들을 포함할 수 있다. 복수의 실제 객체 사운드들 각각은 실제 공간에 위치한 복수의 실제 객체들 각각으로부터 발생되는 사운드일 수 있다. 실제 객체로부터 발생되는 사운드는 실제 객체에 대응하는 객체 사운드일 수 있다. 실제 객체는 실제 공간에 위치한 인물, 동물, 사물 등 다양할 수 있다. 실제 객체에 대응하는 객체 사운드는 실제 공간에 위치한 인물의 목소리, 동물의 울음 소리 및 발소리, 차량의 경적 소리 등 다양할 수 있다.
실제 사운드에 대한 사운드 획득 시간 정보는 복수의 실제 객체 사운드들 각각의 사운드 획득 시간을 포함할 수 있다. 오른쪽 귀 방향에서 획득된 실제 객체 사운드와 왼쪽 귀 방향에서 획득된 실제 객체 사운드의 사운드 획득 시간은 서로 상이할 수 있다.
프로세서(350)는 사운드 제공 장치(100)로부터 전송된 플레이 사운드를 획득할 수 있다.
플레이 사운드는 복수의 가상 객체 사운드들을 포함할 수 있다. 복수의 가상 객체 사운드들 각각은 가상 공간에 배치된 복수의 가상 객체들 각각으로부터 발생되는 사운드일 수 있다. 가상 객체로부터 발생되는 사운드는 가상 객체에 대응하는 객체 사운드로 이미 레코딩된 및/또는 이미 생성된 객체 사운드(object sound)일 수 있다. 플레이 사운드가 3차원 음원인 경우, 가상 객체는 드럼, 기타, 베이스, 보컬 등 음원을 구성하는 다양한 객체일 수 있다. 플레이 사운드가 3차원 VR 사운드 콘텐츠인 경우, 가상 객체는 3차원 VR 사운드 콘텐츠에 대응하는 3차원 가상 현실에 포함된 인물, 동물, 사물 등 3차원 VR 사운드 콘텐츠를 구성하는 다양한 객체일 수 있다. 플레이 사운드가 3차원 음원인 경우, 가상 객체에 대응하는 객체 사운드는 미리 레코딩된 드럼 소리, 기타 소리, 베이스 소리 및 보컬 소리 등 음원을 구성하는 다양한 소리일 수 있다. 플레이 사운드가 3차원 VR 사운드 콘텐츠인 경우, 가상 객체에 대응하는 객체 사운드는 이미 레코딩된 인물 목소리, 동물의 울음 소리 및 발소리, 차량의 경적 소리 등 3차원 VR 사운드 콘텐츠를 구성하는 다양한 소리일 수 있다.
프로세서(350)는 실제 사운드 및 플레이 사운드를 선택적으로 조합하여 조합 사운드를 생성할 수 있다.
먼저, 프로세서(350)는 실제 사운드에 포함된 복수의 실제 객체 사운드들 중에서 적어도 하나의 실제 객체 사운드를 선택할 수 있다.
예를 들어, 프로세서(350)는 기 저장된 객체 사운드의 특성에 기초하여 실제 사운드에 포함된 복수의 실제 객체 사운드들을 인식할 수 있다. 객체 사운드의 특성은 객체 사운드의 주파수 특성 및 음량 특성일 수 있다.
프로세서(350)는 노이즈 필터링 기법에 기초하여 실제 사운드에서 노이즈 사운드를 제거할 수 있다. 예를 들어, 프로세서(350)는 실제 공간에서 발생되는 노이즈를 분석하여 일반적인 노이즈 사운드에 해당하는 사운드를 제거할 수 있다. 노이즈 사운드는 일반적인 노이즈에 대응하는 사운드일 수 있다. 노이즈 사운드는 일반적인 가청 주파수에 대응하는 사운드 보다 상당히 높은 사운드일 수 있다.
프로세서(350)는 기 저장된 객체 사운드들의 주파수 및/또는 음량에 기초하여 노이즈 사운드가 제거된 실제 사운드에서 복수의 실제 객체 사운드들을 인식할 수 있다. 예를 들어, 프로세서(350)는 노이즈 사운드가 제거된 실제 사운드에서 기 저장된 객체 사운드들의 주파수 및/또는 음량에 대응하는 사운드를 검출하여 검출된 사운드를 복수의 실제 객체 사운드들로 인식할 수 있다.
프로세서(350)는 실제 사운드 선택 조건에 기초하여 복수의 실제 객체 사운드들 중에서 사용자에게 위험한 위험 객체 및/또는 사용자가 관심있는 관심 객체로부터 발생되는 적어도 하나의 실제 객체 사운드를 선택적으로 추출할 수 있다. 실제 사운드 선택 조건은 복수의 실제 객체 사운드들 중에서 위험 객체 및 관심 객체에 대응하는 객체 사운드가 선택되도록 설정될 수 있다. 위험 객체 및 관심 객체는 사용자가 기 설정할 수 있다.
이후에, 프로세서(350)는 플레이 사운드에 포함된 복수의 가상 객체 사운드들 중에서 적어도 하나의 가상 객체 사운드를 선택할 수 있다.
예를 들어, 프로세서(350)는 사용자의 동작에 기초하여 복수의 가상 객체 사운드들 전체를 선택하거나 일부를 선택할 수 있다. 사용자의 동작은 사용자의 머리 회전 수, 머리 회전 속도 등 다양할 수 있다.
사용자의 머리 회전 수가 임계 회전 수 이상 및/또는 사용자의 머리 회전 속도가 임계 회전 속도 이상인 경우, 프로세서(350)는 복수의 가상 객체 사운드들 전체를 선택할 수 있다.
사용자의 머리 회전 수가 임계 회전 수 미만 및/또는 사용자의 머리 회전 속도가 임계 회전 속도 미만인 경우, 프로세서(350)는 복수의 가상 객체 사운드들 중에서 일부를 선택할 수 있다.
상술한 바와 같이 복수의 가상 객체 사운드들 전체 또는 일부를 선택하는 방식이 기재되어 있지만, 이에 한정하는 것은 아니다. 프로세서(350)는 복수의 가상 객체 사운드들 전체 또는 일부를 선택하는 방식을 서로 반대로 적용하여 가상 객체 사운드를 선택할 수 있다. 예를 들어, 프로세서(350)는 머리 회전 수가 임계 회전 수 미만 및/또는 머리 회전 속도가 임계 회전 속도 미만인 경우에 복수의 가상 객체 사운드들 전체를 선택할 수 있다. 프로세서(350)는 머리 회전 수가 임계 회전 수 이상 및/또는 머리 회전 속도가 임계 회전 속도 이상인 경우에 복수의 가상 객체 사운드들 중에서 일부를 선택할 수 있다.
복수의 가상 객체 사운드들 중에서 일부를 선택하는 경우, 프로세서(350)는 사용자의 머리 방향에 기초하여 복수의 가상 객체 사운드들 중에서 사용자의 머리 방향에 위치한 가상 객체에 대응하는 가상 객체 사운드를 선택할 수 있다.
마지막으로, 프로세서(350)는 적어도 하나의 실제 객체 사운드와 적어도 하나의 가상 객체 사운드를 조합하여 조합 사운드를 생성할 수 있다.
예를 들어, 프로세서(350)는 적어도 하나의 실제 객체 사운드에 대응하는 실제 객체의 위치에 기초하여 적어도 하나의 실제 객체 사운드의 음량을 조절할 수 있다.
프로세서(350)는 적어도 하나의 실제 객체 사운드에 대한 사운드 획득 시간에 기초하여 실제 공간에서 적어도 하나의 실제 객체 사운드에 대응하는 실제 객체의 위치를 결정할 수 있다.
프로세서(350)는 사용자의 위치와 실제 객체의 위치 간의 이격 거리에 기초하여 적어도 하나의 실제 객체 사운드의 음량을 조절할 수 있다.
예를 들어, 프로세서(350)는 이격 거리에 대응하는 임계 음량과 적어도 하나의 실제 객체 사운드의 음량에 기초하여 적어도 하나의 실제 객체 사운드의 음량을 조절할 수 있다. 이격 거리에 대응하는 임계 음량은 기 설정될 수 있다. 임계 음량은 사용자와 객체 간의 이격 거리 마다 설정된 음량 범위로, 사용자에게 위험하지 않는 음량 범위일 수 있다.
적어도 하나의 실제 객체 사운드의 음량이 임계 음량 보다 높은 경우, 프로세서(350)는 적어도 하나의 실제 객체 사운드의 음량을 임계 음량 범위 안으로 낮게 조절할 수 있다.
적어도 하나의 실제 객체 사운드의 음량이 임계 음량 보다 낮은 경우, 프로세서(350)는 적어도 하나의 실제 객체 사운드의 음량을 임계 음량 범위 안으로 높게 조절할 수 있다.
프로세서(350)는 음량이 조절된 적어도 하나의 실제 객체 사운드와 적어도 하나의 가상 객체 사운드를 조합하여 조합 사운드를 생성할 수 있다.
이하에서는 설명의 편의를 위해 사운드 생성 장치(300)가 사운드 출력 장치(500) 내에 구현된 것으로 가정하고 설명하도록 한다.
도 3은 도 1에 도시된 사운드 제공 장치를 설명하기 위한 일 예를 나타내고, 도 4는 도 3에 도시된 제1 제공 장치를 설명하기 위한 일 예를 나타내고, 도 5는 도 3에 도시된 제2 제공 장치를 설명하기 위한 일 예를 나타낸다.
사운드 제공 장치(100)는 실감형 3차원 음향 콘텐츠인 플레이 사운드를 생성하여 사용자가 사용하는 사운드 생성 장치(300)에 제공하는 전자 장치로 MP3 플레이어일 수 있다. 플레이 사운드는 3차원 음원, 3차원 음성 및 3차원 VR(virtual reality) 사운드 등 다양할 수 있다.
전자 장치는 PC(personal computer), 데이터 서버, 또는 휴대용 전자 장치 등 다양한 장치일 수 있다. 휴대용 전자 장치는 랩탑(laptop) 컴퓨터, 이동 전화기, 스마트 폰(smart phone), 태블릿(tablet) PC, 모바일 인터넷 디바이스(mobile internet device(MID)), PDA(personal digital assistant), EDA(enterprise digital assistant), 디지털 스틸 카메라(digital still camera), 디지털 비디오 카메라(digital video camera), PMP(portable multimedia player), PND(personal navigation device 또는 portable navigation device), 휴대용 게임 콘솔(handheld game console), e-북(e-book), 스마트 디바이스(smart device)으로 구현될 수 있다. 이때, 스마트 디바이스는 스마트 워치(smart watch) 또는 스마트 밴드(smart band)로 구현될 수 있다.
사운드 제공 장치(100)는 제1 제공 장치(110) 및 제2 제공 장치(130)를 포함한다.
제1 제공 장치(110)는 이미 레코딩된 객체 사운드나 일반적인 2차원 오디오 전용 사운드를 제2 제공 장치(130)에 제공할 수 있다. 예를 들어, 제1 제공 장치(110)는 유선 방식 및/또는 무선 방식으로 객체 사운드나 일반적인 2차원 오디오 전용 사운드를 제2 제공 장치(130)에 제공할 수 있다. 일반적인 2차원 오디오 전용 사운드는 일반적인 모노 또는 스테레오 및 다채널 오디오일 수 있다. 유선 방식은 USB, 디스플레이 port 및 HDMI 등 다양한 유선 방식일 수 있다. 무선 방식은 Wi-Fi, 블루투스 등 다양한 무선 방식일 수 있다.
제2 제공 장치(130)는 객체 사운드를 3차원 가상 공간에 반영하거나 일반적인 2차원 오디오 전용 사운드를 3차원 사운드로 변환하여 플레이 사운드를 생성할 수 있다.
예를 들어, 제2 제공 장치(130)는 바이너럴 레코딩(binaural recoding) 기술 및/또는 바이너럴 이펙트(binalural effect) 기술을 이용하여 플레이 사운드를 생성할 수 있다. 바이너럴 레코딩 기술은 3차원 마이크를 이용하여 3차원 사운드를 레코딩하는 기술일 수 있다. 3차원 마이크는 360도 마이크 및 복수개로 구성된 마이크 등 다양할 수 있다. 바이너럴 이펙트는 인간의 양 귀의 위치에 따른 소리 전달 차이를 통한 소리 방향의 공간 인식 기술에 기초하여 스테레오 스피커를 통해 3차원 사운드를 생성하는 기술일 수 있다.
제2 제공 장치(130)는 compass mems 및 accelator mems의 사운드 정보를 이용하여 3차원 가상 공간에 가상 객체를 배치하여 가상 객체에 대응하는 객체 사운드가 3차원 가상 공간에 반영되게 할 수 있다. 제2 제공 장치(110)는 객체 사운드가 반영된 3차원 가상 공간에서 발생하는 플레이 사운드를 생성할 수 있다.
제2 제공 장치(130)는 일반적인 2차원 오디오 전용 사운드를 3차원 오디오 전용 사운드로 변환하여 3차원 오디오 전용 사운드로 변환된 플레이 사운드를 생성할 수 있다. 예를 들어, 3차원 오디오 전용 사운드로 변환된 플레이 사운드는 비 3차원 사운드(또는 비 3차원 오디오, 비 3차원 음원) 또는 5.1 채널 등의 다채널 사운드(또는 다채널 오디오)를 3차원 사운드(또는 3차원 오디오)로 변환된(또는 전환된) 3차원 콘텐츠일 수 있다. 3차원 콘텐츠는 3차원 5.1 채널, 3차원 10.1 채널 등 다양할 수 있다.
제2 제공 장치(130)는 다양한 방식으로 플레이 사운드를 제공할 수 있다.
예를 들어, 제2 제공 장치(130)는 1:N 방식으로 복수의 사용자들 각각이 사용하는 사운드 출력 장치(500)에 플레이 사운드를 제공할 수 있다. 1:N 방식은 플레이 사운드가 복수의 사용자들에게 제공되게 하는 브로드 캐스트형 방식일 수 있다.
제2 제공 장치(130)는 N:N 방식으로 복수의 사용자들 각각이 사용하는 사운드 출력 장치(500)에 복수의 플레이 사운드들을 선택적으로 제공할 수 있다. N:N 방식은 복수의 플레이 사운드들이 복수의 사용자들에게 선택적으로 제공되게 하는 맞춤형 방식일 수 있다.
제2 제공 장치(130)는 N:1 방식으로 단일의 사용자가 사용하는 사운드 출력 장치(500)에 복수의 플레이 사운드들 모두를 제공할 수 있다. N:1 방식은 복수의 플레이 사운드들이 단일의 사용자에게 제공되는 서비스 집중형 멀티 엑세스 방식일 수 있다.
제2 제공 장치(130)는 상술한 유선 방식 및/또는 무선 방식으로 플레이 사운드를 사운드 출력 장치(500)에 제공할 수 있다.
도 6은 도 1에 도시된 사운드 출력 장치를 설명하기 위한 일 예를 나타내고, 도 7은 도 1에 도시된 사운드 출력 장치를 설명하기 위한 다른 예를 나타낸다.
사운드 출력 장치(500)는 사용자가 플레이 사운드 또는 조합 사운드를 청취하기 위해 사용하는 장치일 수 있다.
사운드 출력 장치(500)는 웨어러블(wearable) 타입, 인이어(in-ear) 타입, 온이어(on-ear) 타입 및 브레인 트렌스(brain trans) 타입으로 구현될 수 있다.
예를 들어, 사운드 출력 장치(500)는 웨어러블 타입, 인이어 타입, 온이어 타입 및 브레인 트렌스 타입으로 구현된 MP3 플레이어일 수 있다. MP3 플레이어는 독립 운영되는 베터리가 내장된 형태로 무선 통신 및 프로세서가 포함될 수 있다. 웨어러블 타입은 사용자가 편리하게 착용하는 제품에 결합된 타입일 수 있다. 웨어러블 타입은 헤어 밴드, 어깨 부착형 장치, 점퍼 및/또는 제킷 및/또는 우주복 등의 상의 부착형 장치, 고글 및 안경 등일 수 있다. 인이어 타입은 이어폰일 수 있다. 온이어 타입은 헤드폰 및 헬멧 등일 수 있다. 브레인 트렌스 타입은 뇌파 전송 장치일 수 있다.
또한, 사운드 출력 장치(500)는 HMD, 스마트 글래스, See-thru 디스플레이 장치, 멀티 모달(예를 들어, 5감 센싱) 등을 활용한 체감형 장치, 골전도 오디오 장치에 구현될 수 있다.
사운드 출력 장치(500)가 인이어 타입, 온이어 타입인 경우, 사운드 출력 장치(500)는 사용자의 귀에 직접적으로 플레이 사운드 또는 조합 사운드를 출력하여 사용자가 직접적으로 청취하게 할 수 있다.
사운드 출력 장치(500)가 웨어러블 타입, 브레인 트렌스 타입인 경우, 사운드 출력 장치(500)는 사용자의 귀의 위치를 감지하여 사용자의 귀에 간접적으로 플레이 사운드 또는 조합 사운드를 출력하여 사용자가 간접적으로 청취하게 할 수 있다.
사운드 출력 장치(500)는 Compass Mems, Gyroscope 및 Accelator Mems 등을 사용하여 사용자의 헤드를 정밀하게 헤드 트래킹함으로써, 실제 공간에서 발생되는 실제 사운드를 3차원으로 획득할 수 있다.
또한, 사운드 출력 장치(500)는 부가 기능으로 에너지 하베스팅(energy harvesting) 기능, 블랙박스(black box) 기능 등 다양한 기능을 제공할 수 있다. 예를 들어, 사운드 출력 장치(500)는 사용자 접촉 부분의 열을 전기 에너지로 전환 또는 주변 RF(radio frequency), 주변 사운드를 전기 에너지로 전환, 청취자의 움직임의 운동 에너지를 전기 에너지로 전환하는 에너지 하베스팅 기능을 갖고 별도의 에너지 공급원 없이 구동 될 수 있다.
사운드 출력 장치(500)에 블랙박스 기능을 제공할 경우, 블랙박스는 실질적인 저장소의 위치를 내부 및/또는 외부에 구현될 수 있다. 블랙박스는 내부 메모리 저장소 및/또는 외부 저장소와 블록체인을 활용한 저장 등 다양한 방법을 통해 데이터를 저장할 수 있다. 외부 저장소는 클라우드 연결과 같은 외부 저장소일 수 있다. 블랙박스는 보안성을 위한 접속자 권한을 PKI와 같은 보안키를 활용할 수 있다.
블랙박스는 카메라 내장형 블랙박스 및/또는 오디오 블랙박스 및/또는 물리적 센서를 기반한 블랙박스 일 수 있다. 오디오 블랙박스는 주변의 소리를 실시간으로 저장 및/또는 구동 중에 송수신 된 오디오 데이터를 저장하고, 저장 시 위치별 소리 판독이 가능할 수 있다. 오디오 블랙박스는 위험 및 위험 이후 분석이 용이한 3D 오디오 저장 및 객체별 위치 정보 저장등을 포함한 오디오 기반 위치 판독을 통한 소리 기반의 블랙박스일 수 있다.
블랙박스는 다양한 기능을 보유한 블랙박스일 수 있다. 블랙박스는 실시간 저장 기능을 갖을 수 있다. 예를 들어, 블랙박스는 실시간 통화, 실시간 스트림, 실시간 주변 녹음 기능을 포함하고, 필요시 재생이 가능한 기능을 포함할 수 있다. 또한, 블랙박스는 실시간 정보를 저장 보관하는 기능을 더 포함할 수 있다.
일 예로, 블랙박스는 주변의 소리인 이벤트를 감지하여 특정 시간을 두고 실시간 저장할 수 있다. 예를 들어, 블랙박스는 통화 대화, 중요 대화, 사고 발생 등을 감지하여 감지 발생 시간 기점 앞뒤 몇분으로 데이터를 저장(또는 기록)할 수 있다. 이때, 블랙박스는 항상 저장하는 방식이 아닌 이벤트에 기반한 저장을 수행할 수 있다.
다른 예로, 블랙박스는 객체의 위치 정보를 저장할 수 있다. 예를 들어, 블랙박스는 특정 공간의 사물이나 소리가 있는 사물, 동물 및/또는 인물을 감지하여 객체로 판독하고, 객체의 위치 정보를 3차원 정보로 저장할 수 있다. 이때, 블랙박스는 감지 발생 시간 기점 앞뒤 몇분 및 특정 시간 등을 반영하여 저장할 수 있다.
다른 예로, 블랙박스는 구동 중에 주고 받는 송수신 통화 내용 또는 재생중인 음원, 스트림 오디오 등 오디오 데이터 및 정보 데이터를 실시간 또는 특정 시간 등을 반영하여 저장할 수 있다.
또 다른 예로, 블랙 박스는 음성 인식 등 소리를 통한 인식을 공간 및 객체 인식을 통해 3D 위치 기반의 객체 인식 판독으로 공간 저장 또는 지시자 제어 등의 인터페이스로도 활용할 수 있다. 한 공간에 어려 사람이 대화를 할 경우, 블랙박스는 누가 사용자인지를 인식하는 사용자 인식이 어렵기에 소리를 기반으로 3D 공간 인식을 수행하고, 지시자를 판별하여 제어 인식을 수행할 수 있다. 이때, 블랙박스는 공간을 실시간 3차원으로 저장하여 객체별 저장에 활용할 수 있다.
이하에서는 설명의 편의를 위해서 사운드 출력 장치(500)를 인이어 타입의 이어폰으로 가정하도록 한다.
도 8은 일 실시예에 따른 인이어 타입의 이어폰인 사운드 출력 장치를 설명하기 위한 일 예를 나타내고, 도 9는 일 실시예에 따른 인이어 타입의 이어폰인 사운드 출력 장치를 설명하기 위한 다른 예를 나타낸다.
사운드 출력 장치(500)는 사용자가 착용하는 복수의 이어폰들(510 및 530)일 수 있다.
제1 이어폰(510)은 사용자의 왼쪽 귀에 착용되는 이어폰으로, 제1 마이크(511), 제1 스피커(513) 및 제1 프로세서(515)를 포함할 수 있다.
제2 이어폰(530)은 사용자의 오른쪽 귀에 착용되는 이어폰으로, 제2 마이크(531), 제2 스피커(533) 및 제2 프로세서(535)를 포함할 수 있다.
제1 이어폰(510) 및 제2 이어폰(530)은 사운드 생성 장치(300)를 포함할 수 있다.
제1 프로세서(515) 및 제2 프로세서(535)는 서로 데이터를 공유할 수 있다.
제1 프로세서(515) 및 제2 프로세서(535)는 제1 마이크(511) 및 제2 마이크(531)를 통해 실제 공간의 노이즈를 필터링하여 실제 사운드를 획득할 수 있다. 예를 들어, 제1 프로세서(515) 및 제2 프로세서(535)는 사용자 주변의 소음 정보를 분석하여 노이즈 캔슬 기능을 통해 노이즈가 제거된 실제 사운드를 획득할 수 있다. 이때, 제1 마이크(511)를 통해 획득된 실제 사운드의 사운드 획득 시간과 제2 마이크(513)를 통해 획득된 실제 사운드의 사운드 획득 시간은 상이할 수 있다.
제1 프로세서(515) 및 제2 프로세서(535)는 제1 마이크(511) 및 제2 마이크(531)를 통해 획득된 실제 사운드의 사운드 획득 시간의 차이에 기초하여 실제 사운드를 실제 공간에 대응하는 3차원 실제 사운드로 인식할 수 있다.
제1 프로세서(515) 및 제2 프로세서(535)는 compass mems를 이용하여 사용자의 머리를 트레킹하여 사용자의 머리 방향을 획득할 수 있다. 이때, 제1 프로세서(515) 및 제2 프로세서(535)는 compass mems 외에도 gyroscope, accelator mems 등을 이용하여 보다 정밀한 헤드 트레킹(head tracking)을 수행할 수 있다.
제1 프로세서(515) 및 제2 프로세서(535)는 실제 사운드, 제1 마이크(511)를 통해 획득된 실제 사운드의 사운드 획득 시간, 제2 마이크(513)를 통해 획득된 실제 사운드의 사운드 획득 시간 및 사용자의 머리 방향에 대한 정보를 사운드 생성 장치(300)에 전송할 수 있다.
제1 프로세서(515) 및 제2 프로세서(535)는 제1 스피커(513) 및 제2 스피커(533)를 통해 플레이 사운드 또는 조합 사운드를 출력할 수 있다.
플레이 사운드를 출력하는 경우, 제1 프로세서(515) 및 제2 프로세서(535)는 사운드 제공 장치(100)인 MP3 플레이어를 통해 플레이 사운드를 획득한 후, 3D audio convert를 통해 3차원 음향 효과가 적용된 플레이 사운드를 출력할 수 있다. 3차원 음향 효과가 적용된 플레이 사운드는 binaural effect와 같은 3차원 오디오 효과가 적용된 사운드일 수 있다. 3차원 오디오 효과가 적용된 사운드는 스피커 개수에 따라 다채널 3D 오디오 효과가 반영된 사운드일 수 있다. 다채널 3D 오디오 효과가 반영된 사운드는 5.1 채널 사운드, 7.1 채널 사운드 및 10.1 채널 사운드 등 다양할 수 있다.
도 8에 도시된 바와 같이 마이크(511 및 531) 및 스피커(531 및 533)가 2개로 도시되어 있지만, 이에 한정하는 것은 아니다. 예를 들어, 마이크는 복수개로 구현되어 실제 사운드를 획득할 수 있다. 스피커는 복수개로 구현되어 플레이 사운드 또는 조합 사운드를 출력할 수 있다.
도 10은 일 실시예에 따른 조합 사운드를 설명하기 위한 일 예를 나타낸다.
조합 사운드는 가상 공간 및 실제 공간이 혼합된 혼합 공간에서 발생하는 3차원 사운드일 수 있다. 가상 공간은 거리 모드, 숲, 여행지, 추억이 있는 공간, 우주 공간 등 다양할 수 있다. 실제 공간은 카페, 레스토랑 등 현재 청취자가 위치한 공간일 수 있다. 혼합 공간은 거리에 위치한 카페, 숲 속에 위치한 레스토랑 등 다양할 수 있다.
구체적으로, 사용자가 카페에 위치하고, 사용자가 우주 공간에서 발생하는 가상 현실 사운드를 청취하는 경우, 혼합 공간은 카페와 우주 공간이 혼합된 공간일 수 있다.
사용자가 레스토랑에 위치하고, 사용자가 하와이에서 발생하는 가상 현실 사운드를 청취하는 경우, 혼합 공간은 레스토랑과 하와이가 혼합된 공간일 수 있다.
가상 공간에서 발생하는 가상 객체 사운드는 가상 공간 내 위치한 가상 객체의 거리(사운드 크기), 위치(사운드 방향) 및 이동(사운드 크기 및 방향의 변화)가 반영된 3차원 사운드일 수 있다.
실제 공간에서 발생하는 실제 객체 사운드는 실제 공간 내 실제 객체의 거리(사운드 크기), 위치(사운드 방향) 및 이동(사운드 크기 및 방향의 변화)가 반영된 3차원 사운드일 수 있다.
도 11은 도 1에 도시된 사운드 생성 장치의 동작을 설명하기 위한 순서도를 나타낸다.
프로세서(350)는 사운드 출력 장치(500)의 제1 마이크(511) 및 제2 마이크(531)를 통해 실제 사운드를 획득할 수 있다(1110).
프로세서(350)는 필터(filter)에 기초하여 실제 사운드에서 복수의 실제 객체 사운드들을 필터링할 수 있다(1120). 필터(filter)는 실시간 필터(real time filter) 등 다양한 방식의 audio filter일 수 있다. 예를 들어, 프로세서(350)는 노이즈 필터링 기법에 기초하여 실제 사운드에서 노이즈 사운드를 제거할 수 있다(1130).
프로세서(350)는 객체 사운드의 주파수 및 음량 중에서 적어도 하나에 기초하여 노이즈가 제거된 실제 사운드에서 객체 사운드의 주파수 및 음량에 대응하는 사운드를 검출할 수 있다(1140).
프로세서(350)는 검출된 사운드를 복수의 실제 객체 사운드들로 인식할 수 있다(1140).
프로세서(350)는 사운드 제공 장치(500)로부터 전송된 플레이 사운드를 획득할 수 있다(1160).
프로세서(350)는 실제 사운드의 복수의 실제 객체 사운드들 중에서 적어도 하나의 실제 객체 사운드와 플레이 사운드의 복수의 가상 객체 사운드들 중에서 적어도 하나의 가상 객체 사운드를 조합하여 조합 사운드를 생성할 수 있다(1170).
프로세서(350)는 사운드 출력 장치(500)의 제1 스피커(513) 및 제2 스피커(533)를 통해 조합 사운드를 사용자에게 제공할 수 있다(1180).
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
이상과 같이 실시예들이 비록 한정된 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기를 기초로 다양한 기술적 수정 및 변형을 적용할 수 있다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 청구범위의 범위에 속한다.

Claims (19)

  1. 실제 공간에서 발생되는 실제 사운드 및 가상 공간에서 발생되는 플레이 사운드를 획득하는 단계; 및
    상기 실제 사운드 및 상기 플레이 사운드를 조합하여 상기 실제 공간과 상기 가상 공간이 혼합된 혼합 현실에서 발생하는 조합 사운드를 생성하는 단계
    를 포함하는 사운드 생성 방법.
  2. 제1항에 있어서,
    상기 생성하는 단계는,
    상기 실제 사운드에 포함된 복수의 실제 객체 사운드들 중에서 적어도 하나의 실제 객체 사운드를 선택하는 단계;
    상기 플레이 사운드에 포함된 복수의 가상 객체 사운드들 중에서 적어도 하나의 가상 객체 사운드를 선택하는 단계; 및
    상기 적어도 하나의 실제 객체 사운드와 상기 적어도 하나의 가상 객체 사운드를 조합하여 상기 조합 사운드를 생성하는 단계
    를 포함하는 사운드 생성 방법.
  3. 제2항에 있어서,
    상기 복수의 실제 객체 사운드들은 상기 실제 공간에 위치한 복수의 실제 객체들로부터 발생되는 사운드인 사운드 생성 방법.
  4. 제2항에 있어서,
    상기 복수의 가상 객체 사운드들은 상기 가상 공간에 위치한 복수의 가상 객체들로부터 발생되는 사운드인 사운드 생성 방법.
  5. 제2항에 있어서,
    상기 적어도 하나의 실제 객체 사운드를 선택하는 단계는,
    객체 사운드의 특성에 기초하여 상기 복수의 실제 객체 사운드들을 인식하는 단계; 및
    실제 사운드 선택 조건에 기초하여 상기 복수의 실제 객체 사운드들 중에서 상기 적어도 하나의 실제 객체 사운드를 선택적으로 추출하는 단계
    를 포함하는 사운드 생성 방법.
  6. 제5항에 있어서,
    상기 인식하는 단계는,
    노이즈 필터링 기법에 기초하여 상기 실제 사운드에서 노이즈 사운드를 제거하는 단계; 및
    상기 객체 사운드의 주파수 및 음량 중에서 적어도 하나에 기초하여 상기 노이즈 사운드가 제거된 실제 사운드에서 상기 복수의 실제 객체 사운드들을 인식하는 단계
    를 포함하는 사운드 생성 방법.
  7. 제2항에 있어서,
    상기 생성하는 단계는,
    상기 적어도 하나의 실제 객체 사운드에 대응하는 실제 객체의 위치에 기초하여 상기 적어도 하나의 실제 객체 사운드의 음량을 조절하는 단계; 및
    음량이 조절된 적어도 하나의 실제 객체 사운드와 상기 적어도 하나의 가상 객체 사운드를 조합하여 상기 조합 사운드를 생성하는 단계
    를 포함하는 사운드 생성 방법.
  8. 제7항에 있어서,
    상기 조절하는 단계는,
    상기 적어도 하나의 실제 객체 사운드의 사운드 획득 시간에 기초하여 상기 실제 공간에서 상기 실제 객체의 위치를 결정하는 단계; 및
    상기 사용자의 위치와 상기 실제 객체의 위치 간의 이격 거리에 기초하여 상기 적어도 하나의 실제 객체 사운드의 음량을 조절하는 단계
    를 포함하는 사운드 생성 방법.
  9. 인스트럭션들을 포함하는 메모리; 및
    상기 인스트럭션들을 실행하기 위한 프로세서
    를 포함하고,
    상기 프로세서는,
    실제 공간에서 발생되는 실제 사운드 및 가상 공간에서 발생되는 플레이 사운드를 획득하고, 상기 실제 사운드 및 상기 플레이 사운드를 조합하여 상기 실제 공간과 상기 가상 공간이 혼합된 혼합 현실에서 발생하는 조합 사운드를 생성하는 장치.
  10. 제9항에 있어서,
    상기 프로세서는,
    상기 실제 사운드에 포함된 복수의 실제 객체 사운드들 중에서 적어도 하나의 실제 객체 사운드를 선택하고, 상기 플레이 사운드에 포함된 복수의 가상 객체 사운드들 중에서 적어도 하나의 가상 객체 사운드를 선택하고, 상기 적어도 하나의 실제 객체 사운드와 상기 적어도 하나의 가상 객체 사운드를 조합하여 상기 조합 사운드를 생성하는 장치.
  11. 제10항에 있어서,
    상기 복수의 실제 객체 사운드들은 상기 실제 공간에 위치한 복수의 실제 객체들로부터 발생되는 사운드인 장치.
  12. 제10항에 있어서,
    상기 복수의 가상 객체 사운드들은 상기 가상 공간에 위치한 복수의 가상 객체들로부터 발생되는 사운드인 장치.
  13. 제10항에 있어서,
    상기 프로세서는,
    객체 사운드의 특성에 기초하여 상기 복수의 실제 객체 사운드들을 인식하고, 실제 사운드 선택 조건에 기초하여 상기 복수의 실제 객체 사운드들 중에서 상기 적어도 하나의 실제 객체 사운드를 선택적으로 추출하는 장치.
  14. 제13항에 있어서,
    상기 프로세서는,
    노이즈 필터링 기법에 기초하여 상기 실제 사운드에서 노이즈 사운드를 제거하고, 상기 객체 사운드의 주파수 및 음량 중에서 적어도 하나에 기초하여 상기 노이즈 사운드가 제거된 실제 사운드에서 상기 복수의 실제 객체 사운드들을 인식하는 장치.
  15. 제10항에 있어서,
    상기 프로세서는,
    상기 적어도 하나의 실제 객체 사운드에 대응하는 실제 객체의 위치에 기초하여 상기 적어도 하나의 실제 객체 사운드의 음량을 조절하고, 음량이 조절된 적어도 하나의 실제 객체 사운드와 상기 적어도 하나의 가상 객체 사운드를 조합하여 상기 조합 사운드를 생성하는 장치.
  16. 제15항에 있어서,
    상기 프로세서는,
    상기 적어도 하나의 실제 객체 사운드의 사운드 획득 시간에 기초하여 상기 실제 공간에서 상기 실제 객체의 위치를 결정하고, 상기 사용자의 위치와 상기 실제 객체의 위치 간의 이격 거리에 기초하여 상기 적어도 하나의 실제 객체 사운드의 음량을 조절하는 장치.
  17. 제9항에 있어서,
    실시간 저장 기능을 갖는 블랙박스
    를 더 포함하는 장치.
  18. 제17항에 있어서,
    상기 블랙박스는,
    실시간 통화, 실시간 스트림, 실시간 주변 녹음 기능을 포함하고, 필요시 재생이 가능한 기능을 포함하는 장치.
  19. 제17항에 있어서,
    상기 블랙박스는,
    실시간 정보를 저장 보관하는 기능을 포함하는 장치.
KR1020190140346A 2018-11-09 2019-11-05 사운드 생성 방법 및 이를 수행하는 장치들 KR102379734B1 (ko)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN201980073791.1A CN113039815B (zh) 2018-11-09 2019-11-08 声音生成方法及执行其的装置
PCT/KR2019/015145 WO2020096406A1 (ko) 2018-11-09 2019-11-08 사운드 생성 방법 및 이를 수행하는 장치들
US17/292,447 US20220021998A1 (en) 2018-11-09 2019-11-08 Method for generating sound and devices for performing same
CN202211375358.3A CN115767407A (zh) 2018-11-09 2019-11-08 声音生成方法及执行其的装置
KR1020220036120A KR20220043088A (ko) 2018-11-09 2022-03-23 사운드 생성 방법 및 이를 수행하는 장치들

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
KR20180136955 2018-11-09
KR1020180136955 2018-11-09
KR20190052338 2019-05-03
KR1020190052338 2019-05-03
KR1020190128553 2019-10-16
KR20190128553 2019-10-16

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020220036120A Division KR20220043088A (ko) 2018-11-09 2022-03-23 사운드 생성 방법 및 이를 수행하는 장치들

Publications (2)

Publication Number Publication Date
KR20200054083A true KR20200054083A (ko) 2020-05-19
KR102379734B1 KR102379734B1 (ko) 2022-03-29

Family

ID=70913420

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020190140346A KR102379734B1 (ko) 2018-11-09 2019-11-05 사운드 생성 방법 및 이를 수행하는 장치들
KR1020220036120A KR20220043088A (ko) 2018-11-09 2022-03-23 사운드 생성 방법 및 이를 수행하는 장치들

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020220036120A KR20220043088A (ko) 2018-11-09 2022-03-23 사운드 생성 방법 및 이를 수행하는 장치들

Country Status (1)

Country Link
KR (2) KR102379734B1 (ko)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19990001945A (ko) * 1997-06-18 1999-01-15 배순훈 녹음기기의 잡음 제거 장치
KR20180106812A (ko) * 2017-03-20 2018-10-01 ㈜라이커스게임 현실 음향을 반영한 증강 현실 3차원 음향 구현 시스템 및 프로그램
KR20180109910A (ko) * 2016-02-04 2018-10-08 매직 립, 인코포레이티드 증강 현실 시스템에서 오디오를 지향시키기 위한 기법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19990001945A (ko) * 1997-06-18 1999-01-15 배순훈 녹음기기의 잡음 제거 장치
KR20180109910A (ko) * 2016-02-04 2018-10-08 매직 립, 인코포레이티드 증강 현실 시스템에서 오디오를 지향시키기 위한 기법
KR20180106812A (ko) * 2017-03-20 2018-10-01 ㈜라이커스게임 현실 음향을 반영한 증강 현실 3차원 음향 구현 시스템 및 프로그램

Also Published As

Publication number Publication date
KR102379734B1 (ko) 2022-03-29
KR20220043088A (ko) 2022-04-05

Similar Documents

Publication Publication Date Title
US20220159403A1 (en) System and method for assisting selective hearing
US10585486B2 (en) Gesture interactive wearable spatial audio system
CN109644314B (zh) 渲染声音程序的方法、音频回放系统和制造制品
CN108141696A (zh) 用于空间音频调节的系统和方法
EP2737727B1 (en) Method and apparatus for processing audio signals
US20200186912A1 (en) Audio headset device
McGill et al. Acoustic transparency and the changing soundscape of auditory mixed reality
US10542368B2 (en) Audio content modification for playback audio
JP6596896B2 (ja) 頭部伝達関数選択装置、頭部伝達関数選択方法、頭部伝達関数選択プログラム、音声再生装置
EP2920979B1 (fr) Acquisition de données sonores spatialisées
US9832587B1 (en) Assisted near-distance communication using binaural cues
CN106302974B (zh) 一种信息处理的方法及电子设备
JP6404709B2 (ja) 音出力装置および音出力装置における音の再生方法
KR102656969B1 (ko) 불일치 오디오 비주얼 캡쳐 시스템
JP2008299135A (ja) 音声合成装置、音声合成方法、および音声合成用プログラム
CN114902330A (zh) 具有深度的空间音频捕获
CN113039815B (zh) 声音生成方法及执行其的装置
US10667073B1 (en) Audio navigation to a point of interest
JP2016067817A (ja) シミュレーションゲームシステム、情報処理方法及びプログラム
KR102379734B1 (ko) 사운드 생성 방법 및 이를 수행하는 장치들
CN115767407A (zh) 声音生成方法及执行其的装置
KR102322120B1 (ko) 사운드 생성 방법 및 이를 수행하는 장치들
WO2024040527A1 (en) Spatial audio using a single audio device
US20230035531A1 (en) Audio event data processing
CN116913328B (zh) 音频处理方法、电子设备及存储介质

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant