KR20230038820A - 볼륨 조절을 위한 방법 및 장치 - Google Patents

볼륨 조절을 위한 방법 및 장치 Download PDF

Info

Publication number
KR20230038820A
KR20230038820A KR1020237008663A KR20237008663A KR20230038820A KR 20230038820 A KR20230038820 A KR 20230038820A KR 1020237008663 A KR1020237008663 A KR 1020237008663A KR 20237008663 A KR20237008663 A KR 20237008663A KR 20230038820 A KR20230038820 A KR 20230038820A
Authority
KR
South Korea
Prior art keywords
audio signal
volume
media
examples
average
Prior art date
Application number
KR1020237008663A
Other languages
English (en)
Other versions
KR102663452B1 (ko
Inventor
로버트 쿠버
제프리 스콧
마커스 케이 크레머
아니쉬 바타카비
Original Assignee
그레이스노트, 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 그레이스노트, 인코포레이티드 filed Critical 그레이스노트, 인코포레이티드
Publication of KR20230038820A publication Critical patent/KR20230038820A/ko
Application granted granted Critical
Publication of KR102663452B1 publication Critical patent/KR102663452B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/3005Automatic control in amplifiers having semiconductor devices in amplifiers suitable for low-frequencies, e.g. audio amplifiers
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03FAMPLIFIERS
    • H03F3/00Amplifiers with only discharge tubes or only semiconductor devices as amplifying elements
    • H03F3/181Low-frequency amplifiers, e.g. audio preamplifiers
    • H03F3/183Low-frequency amplifiers, e.g. audio preamplifiers with semiconductor devices only
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/02Manually-operated control
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/3089Control of digital or coded signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/002Volume compression or expansion in amplifiers in untuned or low-frequency amplifiers, e.g. audio amplifiers
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/007Volume compression or expansion in amplifiers of digital or coded signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/007Protection circuits for transducers
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03FAMPLIFIERS
    • H03F2200/00Indexing scheme relating to amplifiers
    • H03F2200/03Indexing scheme relating to amplifiers the amplifier being designed for audio applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/35Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users
    • H04H60/37Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users for identifying segments of broadcast information, e.g. scenes or extracting programme ID
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/01Aspects of volume control, not necessarily automatic, in sound systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/13Acoustic transducers and sound field adaptation in vehicles

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Power Engineering (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Abstract

볼륨 조절을 위한 장치, 시스템, 제조 물품 및 방법이 본 명세서에 개시된다. 방법의 예시는 오디오 신호에 표현되는 미디어를 식별하는 단계, 오디오 신호의 미디어를 식별하는데 응답하여 미디어와 연관된 메타데이터에 접근하는 단계, 메타데이터에 기반하여, 미디어에 대한 평균 볼륨을 결정하는 단계, 및 평균 게인값에 기반하여 오디오 신호의 출력 볼륨을 조절하는 단계를 포함하고, 평균 게인값은 미디어에 대한 평균 볼륨에 기반하여 결정된다.

Description

볼륨 조절을 위한 방법 및 장치{Methods and Apparatus for Volume Adjustment}
관련 출원(들)
본 특허는 2018년 1월 7일 출원된 "METHODS AND APPARATUS FOR DYNAMIC VOLUME ADJUSTMENT"라는 제목의 미국 가특허 출원 제62/614,439호에 대한 우선권을 주장한다. 미국 가특허 출원 제62/614,439호는 본 명세서에 전체로서 참조로 통합된다.
기술 분야
본 명세서는 일반적으로 볼륨 조절, 특히 볼륨 조절을 위한 방법 및 장치에 관한 것이다.
근년에, 다른 특성의 다수의 미디어가 증가하는 수의 채널을 사용하여 전달되고 있다. 특히, 오디오 미디어가 더 전통적인 채널(예컨대, 라디오)를 사용하여 또는 최근에 개발된 채널을 사용하여, 예컨대 인터넷 연결된 스트리밍 장치를 사용하여 수신될 수 있다. 이들 채널이 개발됨에 따라, 다수의 소스로부터 오디오를 처리 및 출력할 수 있는 시스템도 개발되어 왔다. 예를 들어, 일부 자동차 미디어 시스템은 CD(compact disc), 블루투스 연결장치, USB(universal serial bus) 연결 장치, Wi-Fi 연결 장치, 보조 입력 및 다른 소스로부터 미디어를 전달할 수 있다.
본 발명의 내용 중에 포함되어 있다.
본 발명의 내용 중에 포함되어 있다.
본 발명의 내용 중에 포함되어 있다.
도 1은 볼륨 조절을 위한 본 명세서의 교시에 따라 구성된 시스템의 예시의 개략도이다.
도 2는 도 1의 미디어 유닛의 추가 세부 사항을 도시하는 블록도이다.
도 3은 볼륨 조절을 수행하기 위한 도 1 및 2의 미디어 유닛(106)을 구현하는데 사용될 수 있는 장치 판독 가능한 명령어의 예시를 나타내는 흐름도이다.
도 4는 오디오 신호를 출력하고 오디오 신호의 실시간 볼륨 조절을 제공하기 위한 도 1 및 2의 미디어 유닛(106)을 구현하는데 사용될 수 있는 장치 판독 가능한 명령어의 예시를 나타내는 흐름도이다.
도 5는 소스 간 및 미디어 간에 볼륨을 표준화하기 위해 볼륨 조절을 수행하기 위한 도 1 및 2의 미디어 유닛(106)을 구현하는데 사용될 수 있는 장치 판독 가능한 명령어의 예시를 나타내는 흐름도이다.
도 6은 도 1 및 2의 미디어 유닛(106)의 예시를 구현하기 위해 도 3-5의 명령어를 실행할 수 있는 프로세서 플랫폼의 예시의 개략도이다.
도면은 치수에 맞게 조정되지 않았다. 가능한 경우, 동일 참조 번호는 도면(들) 및 첨부된 설명에 걸쳐 동일 또는 유사한 부분을 참조하는데 사용될 것이다.
종래의 오디오 미디어 구현에서, 다른 미디어와 연관된 오디오 신호는 상이한 볼륨을 가질 수 있다. 예를 들어, 한 CD 상의 미디어는 다른 CD의 미디어와 현저히 다른 볼륨으로 녹음 및/또는 마스터링될 수 있다. 유사하게, 스트리밍 장치로부터 검색된 미디어는 다른 장치에서 검색된 미디어 또는 동일 장치에서 다른 애플리케이션을 통해 검색된 미디어와 현저히 다른 볼륨 레벨을 가질 수 있다. 사용자가 점점 더 다양한 다른 소스로부터 미디어를 청취함에 따라, 소스 간 및 동일 소스의 미디어 간의 볼륨 레벨의 차이가 더 뚜렷해지고, 잠재적으로 청취자를 거슬리게 할 수 있다.
볼륨 규칙화를 위한 일부 종래의 접근법에서, 다이나믹 레인지 컴프레서가 볼륨 임계치를 충족시키기 위해 오디오 신호의 전체 다이나믹 레인지를 압축하는데 사용된다. 일부 종래의 구현에서, 이러한 다이나믹 레인지 압축은 오디오 신호의 볼륨 임계치를 충족시키기 위해 계속해서 오디오 신호의 볼륨을 모니터링 및 조절한다. 이러한 계속적 조절은 오디오 신호의 청취자의 인지에 영향을 주는데, 트랙의 원래의 다이나믹이 현저하게 변경되기 때문이다. 일부 예시에서, 다이나믹 레인지 압축은 현저하게 오디오 신호의 인지 품질을 열화시킨다.
본 명세서에 개시되는 예시적인 방법, 장치, 시스템 및 제조 물품에서, 미디어 메타데이터는 미디어의 단위(예컨대, 노래, 트랙 등)에 대한 평균 오디오 레벨을 결정하는데 사용된다. 평균 오디오 레벨은 원하는 볼륨 레벨(본 명세서에서 타겟 볼륨 레벨로도 지칭됨)을 달성하기 위해 오디오 레벨에 적용하기 위한 적절한 게인 값을 결정하는데 이용된다. 일부 예시에서, 원하는 볼륨 레벨은 최적의 사용자 경험을 가능하게 하기 위해 일정한 평균 볼륨 레벨로 모든 신호가 출력되도록 모든 오디오 신호에 걸쳐 유지된다. 나아가, 일부 예시에서, 볼륨 레벨은 세그먼트의 볼륨 레벨이 볼륨 임계치를 충족하는 평균 볼륨을 가지는지 여부를 결정하기 위해 오디오 신호의 출력 동안 일정 증분으로 모니터링된다. 이러한 예시에서, 볼륨은 세그먼트 동안의 볼륨과 원하는 볼륨 레벨 간의 차이를 고려하기 위해 다시 동적으로 조절될 수 있다. 나아가, 볼륨 레벨이 미디어에 나타나는 볼륨 레벨과 더 이상 동일하지 않도록 변경 또는 조절된 미디어에 대하여, 일정 증분에서의 모니터링은 메타데이터에 기반한 올바르지 않은 게인이 원하는 범위 바깥으로 오디오 신호의 볼륨을 조절하는 것을 막을 것이다.
본 명세서에 개시되는 방법, 장치, 시스템 및 제조 물품의 예시에서, 볼륨 레벨은 볼륨이 안전한 청취 볼륨 범위 내에 유지되는 것을 보장하도록 조절될 수 있다. 예를 들어, 만약 상대적으로 조용한 트랙이 증폭되고, 재생이 이미 아주 높은 볼륨을 가지는 트랙으로 넘어간다면, 볼륨 레벨은 위험한 볼륨 레벨(예컨대, 듣는 사람이나 렌더링 장비를 상대적으로 빠르게 손상시킬 수 있는 볼륨 레벨)에서 새 트랙을 재생하는 것을 피하도록 조절될 필요가 있다. 본 명세서에 개시되는 일부 예시에서, 버퍼(예컨대, 1초 버퍼, 3초 버퍼 등)이 오디오 신호가 소스(예컨대, 디스크, 라디오 방송국, 휴대 전화 등)로부터 입력되는 시간과 출력되는 시간 간의 지연으로 작용하도록 채용되어, 이로써 볼륨 레벨의 빠른 변동을 막고, 버퍼 기간 동안 볼륨 레벨의 분석 및 조절을 가능하게 한다.
본 명세서에 개시되는 기술의 예시에서, 오디오 워터마크는 오디오 신호에 존재하는 메타데이터를 검색하기 위해 미디어를 식별하는데 이용된다. 오디오 워터마크는 텔레비전 방송, 라디오 방송, 광고(텔레비전 및/또는 라디오), 다운로드한 미디어, 스트리밍 미디어, 미리 패키징된 미디어 등과 같은 미디어를 식별하는데 사용되는 기술이다. 기존의 오디오 워터마크 기술은 하나 이상의 오디오 코드(예컨대, 하나 이상의 워터마크), 예컨대 미디어 식별 정보 및/또는 미디어 식별 정보에 매핑되는 식별자를 오디오 및/또는 비디오 컴포넌트에 내장함으로써 미디어를 식별한다. 일부 예시에서, 오디오 또는 비디오 컴포넌트는 워터마크를 숨기기에 충분한 신호 특성을 가지도록 선택된다. 본 명세서에서 사용되는 바와 같이, 용어 "코드" 또는 "워터마크"는 상호 대체 가능하게 사용되고 미디어 식별의 목적 또는 선국과 같은 다른 목적(예컨대, 패킷 식별 헤더)을 위해 미디어(예컨대, 프로그램 또는 광고)의 오디오나 비디오에 삽입 또는 내장될 수 있는 임의의 식별 정보(예컨대, 식별자)를 의미하도록 정의된다. 본 명세서에 사용되는 바와 같이 "미디어"는 오디오 및/또는 시각(정지 또는 움직이는) 컨텐츠 및/또는 광고를 지칭한다. 핑거프린팅된 미디어를 식별하기 위해, 워터마크(들)은 미디어 식별 정보에 매핑된 참조 워터마크의 표에 접근하기 위해 추출 및 사용된다.
본 명세서에 개시되는 기술의 예시에서, 오디오 핑거프린트는 오디오 신호에 존재하는 메타데이터를 검색하기 위해 미디어를 식별하는데 이용된다. 오디오 핑거프린트는 텔레비전 방송, 라디오 방송, 광고(텔레비전 및/또는 라디오), 다운로드한 미디어, 스트리밍 미디어, 미리 패키징된 미디어 등과 같은 미디어를 식별하는데 사용되는 기술이다. 모니터링되는 미디어에 포함 또는 내장된 코드 및/또는 워터마크에 기반한 미디어 모니터링 기술과 달리, 핑거프린트 또는 서명 기반 미디어 모니터링 기술은 일반적으로 미디어의 실질적으로 고유의 프록시를 생성하기 위하여 모니터링 시간 간격 동안 모니터링되는 미디어의 하나 이상의 내재하는 특성을 이용한다. 이러한 프록시는 서명 또는 핑거프린트로 지칭되고, 미디어 신호(들)의 임의의 측면(들)(예컨대, 모니터링되는 미디어 표시를 형성하는 오디오 및/또는 비디오 신호)을 나타내는 임의의 형태(예컨대, 일련의 디지털 값, 파형 등)를 취할 수 있다. 서명은 타이머 간격에 걸쳐 연속으로 수집된 일련의 서명일 수 있다. 좋은 서명은 동일 미디어 표시를 처리할 때 반복될 수 있지만, 다른(예컨대, 상이한) 미디어의 다른(예컨대, 상이한) 표시에 대해 고유하다. 따라서, 용어 "핑거프린트" 및 "서명"은 본 명세서에서 상호 대체 가능하게 사용되고 본 명세서에서 미디어의 하나 이상의 내재된 특성으로부터 생성된 미디어를 식별하기 위한 프록시를 의미하도록 정의된다.
서명 기반 미디어 모니터링은 일반적으로 모니터링되는 미디어 장치에 의해 출력되는 미디어 신호(예컨대, 오디오 신호 및/또는 비디오 신호)를 나타내는 서명(들) 결정(예컨대, 생성 및/또는 수집) 및 알려진(예컨대, 참조) 미디어 소스에 대응하는 하나 이상의 참조 서명과 모니터링되는 신호(들)을 비교하는 것을 수반한다. 다양한 비교 기준, 예컨대 상호 상관값, 해밍 거리 등이 모니터링되는 서명이 특정 참조 서명과 일치하는지 여부를 결정하기 위해 평가될 수 있다. 모니터링되는 서명과 참조 서명 중 하나 간의 일치가 발견되면, 모니터링되는 미디어는 모니터링되는 서명과 일치하는 참조 서명에 의해 표현되는 특정 참조 미디어에 대응하는 것으로 식별될 수 있다. 속성, 예컨대 미디어의 식별자, 표시 시간, 방송 채널 등이 참조 서명에 대해 수집되기 때문에, 이들 속성은 그 모니터링되는 서명이 참조 서명과 일치하는 모니터링되는 미디어와 연관될 수 있다.
본 명세서에 개시되는 기술의 일부 예시에서, 오디오 신호는 텍스트 매칭(예컨대, 아티스트, 앨범, 제목 등에 관련된 텍스트를 이용하여)에 의해 또는 오디오 신호와 연관된 식별자(예컨대, ID3 태그, ISRC 식별자 등에 내장된 카탈로그 식별자)를 사용하여 식별된다. 본 명세서에 개시되는 기술의 예시는 오디오 신호를 식별하기 위해 임의의 오디오 신호 식별 기술을 이용할 수 있다.
본 명세서에 개시되는 기술의 일부 예시에서, 식별 불가능한 오디오 신호, 따라서 메타데이터가 사용 불가능한 오디오 신호는 원하는 볼륨 레벨을 유지하기 위해 동적으로 압축된다. 예를 들어, 광고가 메타데이터가 있는 미디어에 관한 식별 가능한 오디오 신호 간에 재생될 수 있다. 이러한 예시에서, 볼륨 레벨은 식별 가능한 오디오 신호 각각에 대한 평균 볼륨 레벨에 기반하여 조절되고 동적 압축은 볼륨의 급격한 변화를 피하기 위해 사이의 광고의 볼륨 레벨을 조절하는데 사용된다.
본 명세서에 개시되는 예시에서, 볼륨 조절은 차량의 오디오 시스템의 컴포넌트에 의해 또는 차량의 오디오 시스템과 통신하는 컴포넌트에 의해 수행될 수 있다. 일부 예시에서, 동적 볼륨 조절기 또는 동적 볼륨 조절을 할 수 있는 다른 컴포넌트를 포함하는 미디어 유닛은 차량의 헤드 유닛에 포함될 수 있다. 이러한 예시에서, 차량 헤드 유닛은 보조 입력, CD 입력, 라디오 신호 수신기 입력, 스마트 장치로부터의 외부 스트리밍, 블루투스 입력, 네트워크 연결(예컨대, 인터넷으로의 연결) 또는 임의의 다른 소스를 통해 오디오 신호를 수신할 수 있다. 예를 들어, 동적 볼륨 조절은 홈 엔터테인먼트 시스템의 미디어 시스템 상에서 수행될 수 있고, 다수의 소스(예컨대, DVD 플레이어, 셋탑 박스 등)는 소스와 미디어 간의 볼륨 레벨을 표준화 시도하기 위해 동적으로 조절되는 오디오 신호를 통신할 수 있다. 다른 예시에서, 동적 볼륨 조절은 임의의 설정으로 또는 임의의 미디어 장치(들)를 위해 수행될 수 있다.
본 명세서에 개시되는 방법, 장치, 시스템 및 제조 물품의 예시에서, 사용자가 명시한 볼륨 설정은 소스 타입을 식별하는 데이터와 연관되어 저장된다. 예를 들어, 사용자가 모바일 장치를 구동하며 선택한 볼륨 레벨이 저장될 수 있다. 추가적으로 또는 대안적으로, 볼륨 레벨은 특정 입력 소스가 사용 중일 때 사용자 선호 또는 안전 요건을 충족시키기 위해 본 명세서에 개시되는 기술을 이용하여 자동으로 조절될 수 있다. 이러한 일부 볼륨 레벨은 초기 볼륨 레벨을 설정하기 위해 소스 변경이 일어날 때 영향을 줄 수 있다. 예를 들어, 사용자가 오디오 소스를 라디오에서 모바일 장치로 변경하면, 본 명세서에 개시되는 기술의 예시는 초기 볼륨 레벨을 설정하기 위해 모바일 장치를 위한 과거 오디오 설정을 참조한다. 유사하게, 과거 볼륨 설정은 입력 소스에 대한 현재 볼륨 레벨을 과거 레벨과 비교하고 일정하고 안전한 청취자 경험을 보장하기 위해 조절하는데 사용될 수 있다.
도 1은 볼륨 조절을 위한 본 명세서의 교시에 따라 구성된 시스템(100)의 예시의 개략도이다. 시스템(100)의 예시는 오디오 신호를 미디어 유닛(106)으로 전송하는 미디어 장치(102, 104)를 포함한다. 미디어 유닛(106)은 오디오 신호를 처리하고 신호를 오디오 증폭기(108)로 전송하는데, 이어서 제시되는 증폭된 오디오 신호를 출력 장치(110)를 통해 출력한다.
도 1의 도시된 예시의 미디어 장치(102)의 예시는 휴대용 미디어 플레이어(예컨대, MP3 플레이어)다. 미디어 장치(102)의 예시는 미디어에 대응하는 오디오 신호를 저장 또는 수신하고 오디오 신호를 다른 장치로 전송할 수 있다. 도 1의 도시된 예시에서, 미디어 장치(102)는 보조 케이블을 통해 오디오 신호를 미디어 유닛(106)으로 전송한다. 일부 예시에서, 미디어 장치(102)는 임의의 다른 인터페이스를 통해 미디어 유닛(106)으로 오디오 신호를 전송할 수 있다.
도 1의 도시된 예시의 미디어 장치(104)의 예시는 모바일 장치(예컨대, 휴대 전화)다. 미디어 장치(104)의 예시는 미디어에 대응하는 오디오 신호를 저장 또는 수신하고 오디오 신호를 다른 장치로 전송할 수 있다. 도 1의 도시된 예시에서, 미디어 장치(104)는 무선으로 미디어 유닛(106)에 오디오 신호를 전송한다. 일부 예시에서, 미디어 장치(104)는 Wi-Fi, 블루투스 및/또는 임의의 다른 기술을 사용하여 미디어 유닛(106)에 오디오 신호를 전송할 수 있다. 일부 예시에서, 미디어 장치(104)는 장치에서의 제시를 위해 청취자가 미디어를 선택하기 위해 차량의 컴포넌트나 다른 장치와 상호작용할 수 있다. 미디어 장치(102, 104)는 오디오 신호를 저장 및/또는 접근할 수 있는 임의의 장치일 수 있다. 일부 예시에서, 미디어 장치(102, 104)는 차량에 내장될 수 있다(예컨대, CD 플레이어, 라디오 등).
도 1의 도시된 예시의 미디어 유닛(106)의 예시는 오디오 신호를 수신하고 처리할 수 있다. 도 1의 도시된 예시에서, 미디어 유닛(106)의 예시는 미디어 장치(102, 104)로부터 미디어 신호를 수신하고 볼륨 조절을 수행하기 위해 이를 처리한다. 미디어 유닛(106)의 예시는 미디어에 내장되거나 도출된 식별자(예컨대, 핑거프린트, 워터마크, 서명 등)에 기반하여 오디오 신호를 식별할 수 있다. 미디어 유닛(106)의 예시는 추가적으로 오디오 신호와 연관된 미디어에 대응하는 메타데이터에 접근할 수 있다. 일부 예시에서, 메타데이터는 미디어 유닛(106)의 저장 장치에 저장된다. 일부 예시에서, 메타데이터는 다른 장소에서(예컨대, 네트워크를 통해 서버에서) 접근된다. 나아가, 미디어 유닛(106)의 예시는 볼륨 임계치를 충족시키기 위해 오디오 신호의 평균 볼륨을 조절하기 위해 메타데이터에 기반하여 평균 게인값을 결정하고 적용함으로써 동적 볼륨 조절을 수행할 수 있다. 미디어 유닛(106)의 예시는 추가적으로 실시간으로 오디오 세그먼트의 평균 볼륨 레벨을 결정하기 위해 출력 장치(110)에 의해 출력되고 있는 오디오를 모니터링할 수 있다. 오디오 신호가 미디어에 대응하는 것으로 식별되지 않는 경우, 및/또는 볼륨 정보를 포함하는 메타데이터가 오디오 신호에 대해 이용 가능하지 않은 경우, 미디어 유닛(106)의 예시는 원하는 볼륨 레벨을 달성하기 위해 오디오 신호의 압축을 제공하기 위해 다이나믹 레인지 압축을 할 수 있다. 일부 예시에서, 미디어 유닛(106)의 예시는 차량의 다른 장치의 일부로(예컨대, 카 라디오 헤드 유닛) 포함된다. 일부 예시에서, 미디어 유닛(106)의 예시는 소프트웨어로 구현되고 다른 장치의 일부로 포함되고, 직접 연결을 통해(예컨대, 유선 연결) 또는 네트워크를 통해(예컨대, 클라우드에서 사용 가능) 사용 가능하다. 일부 예시에서, 미디어 유닛(106)의 예시는 오디오 증폭기(108) 및 출력 장치(110)와 통합되고 오디오 신호의 처리 후 자체로 오디오 신호를 출력할 수 있다.
도 1의 도시된 예시에서 오디오 증폭기(108)의 예시는 미디어 유닛(106)에 의해 처리된 오디오 신호를 수신하고 출력 장치(110)에 의한 출력을 위해 신호의 적절한 증폭을 수행할 수 있다. 일부 예시에서, 오디오 증폭기(108)는 출력 장치(110)로 통합될 수 있다. 일부 예시에서, 오디오 증폭기(108)는 미디어 유닛(106)으로부터의 증폭 출력값에 기반하여 오디오 신호를 증폭한다. 일부 예시에서, 오디오 증폭기(108)는 청취자(볼륨 선택기를 조절하는 차량 내 승객이나 운전자)로부터의 입력에 기반하여 오디오 신호를 증폭한다.
도 1의 도시된 예시의 오디오 출력 장치(110)의 예시는 스피커이다. 일부 예시에서, 오디오 출력 장치(110)는 다수의 스피커, 헤드폰 또는 청취자에게 오디오 신호를 제시할 수 있는 임의의 다른 장치일 수 있다. 일부 예시에서, 출력 장치(110)는 시각적 요소(비디오)도 출력할 수 있다(예컨대, 스피커가 있는 텔레비전). 이러한 일부 예시에서, 시각적 요소는 미디어를 식별하는데 이용될 수 있다(예컨대, 비디오에 포함된 워터마크에 기반하여, 비디오로부터 도출된 핑거프린트에 기반하여 등). 이러한 일부 예시에서, 볼륨 조절에 추가로 또는 대안적으로, 본 명세서에 서술되는 기술은 비디오에 표현되는 미디어의 식별에 기반하여 비디오의 특성을 조절하기 위해(예컨대, 밝기 조절, 감마 보정 수행, 색 밸런스 보정 수행 등) 구현될 수 있다.
도 1의 시스템(100)의 도시된 예시가 차량의 볼륨 조절 구현과 관련하여 서술되지만, 시스템(100)의 예시에 포함된 장치의 일부 또는 전부는 임의의 환경에서, 임의의 조합으로 구현될 수 있다. 예를 들어, 시스템(100)은 집의 엔터테인먼트 방에 있을 수 있고, 미디어 장치(102, 104)는 게임 콘솔, 가상 현실 장치, 셋탑 박스 또는 미디어를 접근 및/또는 전송할 수 있는 임의의 다른 장치일 수 있다. 추가로, 일부 예시에서, 미디어는 시각적 요소(예컨대, 텔레비전 쇼, 영화 등)도 포함할 수 있다.
미디어 유닛(106)의 구현의 예시의 추가 세부 사항을 제공하는 블록도(200)가 도 2에 도시된다. 미디어 유닛(106)의 예시는 오디오 신호의 볼륨을 원하는 레벨로 동적으로 조절하기 위해 오디오 신호를 수신하고 오디오 신호를 처리할 수 있다. 동적 볼륨 조절 후, 미디어 유닛(106)의 예시는 출력 장치(110)에 의한 출력 전 증폭을 위해 오디오 증폭기(108)로 오디오 신호를 출력한다.
도 2에 도시된 바와 같이, 도시된 미디어 유닛(106)의 예시는 동적 볼륨 조절기(202), 데이터 저장소(204), 메타데이터 데이터베이스(206) 및 다이나믹 레인지 압축기(208)를 포함한다. 동적 볼륨 조절기(202)는 오디오 신호 접근기(210), 오디오 신호 식별기(212), 메타데이터 접근기(214), 볼륨 조절기(216), 실시간 오디오 모니터(218) 및 오디오 신호 출력기(220)를 더 포함한다.
동적 볼륨 조절기(202)의 예시는 오디오 신호를 수신하고 오디오 신호의 동적 볼륨 조절을 수행할 수 있다. 일부 예시에서, 동적 볼륨 조절기(202)의 예시는 동적 볼륨 조절기(202)에 의해 접근되는 오디오 신호를 식별한다. 일부 예시에서, 동적 볼륨 조절기(202)는 처리 동안 신호가 일시적으로 저장될 수 있는 데이터 저장소(204)로부터 오디오 신호에 접근할 수 있다. 일부 예시에서, 동적 볼륨 조절기(202)는 오디오 신호에 대응하는 미디어를 결정하기 위해 오디오 신호에 내장된 식별자를 이용한다. 동적 볼륨 조절기(202)의 예시는 수신한 오디오 신호에 대응하는 미디어를 결정하기 위한 임의의 기술을 사용할 수 있다. 일부 예시에서, 볼륨 조절기(202)는 볼륨 정보에 대응하는 메타데이터(예컨대, 미디어의 단위에 걸친 평균 볼륨, 미디어의 세그먼트 동안의 평균 볼륨 등)를 획득할 수 있다. 일부 예시에서, 볼륨 조절기(202)의 예시는 오디오 신호에 대한 원하는 평균 볼륨을 달성하기 위해 오디오 신호에 적용하기 위한 적절한 평균 게인값을 결정할 수 있다. 일부 예시에서, 볼륨 조절기(202)의 예시는 샘플에 도 1의 도시된 예시의 오디오 증폭기(108)로 오디오 신호를 제시(예컨대, 출력)하고 오디오 샘플이 제시됨에 따라 샘플 상에서 실시간 볼륨 측정을 계속 수집한다. 이러한 예시에서, 볼륨 조절기(202)의 예시는 오디오 신호의 세그먼트(예컨대, 3초 세그먼트)를 위한 평균 볼륨 레벨을 생성하고 세그먼트를 위한 평균 볼륨 레벨이 볼륨 임계치를 충족하는지 여부를 결정한다. 일부 예시에서, 볼륨 조절기(202)의 예시는 원하는 볼륨 레벨과 볼륨 임계치로 미리 설정된다. 볼륨 조절기(202)의 예시는 임계치를 충족하는 평균 볼륨 레벨을 가지지 않는 세그먼트에 응답하여, 제시되는 전체 오디오 신호의 게인을 조절할 수 있다. 일부 예시에서, 볼륨 조절기(202)의 예시는 오디오 신호의 하나 이상의 상이한 세그먼트에서 구현될 수 있는 하나 이상의 게인값을 결정하기 위해 오디오 샘플(예컨대, 현재 볼륨 추정 데이터)에 걸쳐 세그먼트를 위한 평균 볼륨 레벨에 대응하는 메타데이터를 이용할 수 있다. 일부 예시에서, 볼륨 조절기(202)는 전송되는 미디어의 변화가 일어나는지 여부를 결정하기 위하여 오디오 신호의 미디어에 관련된 미디어 식별자(예컨대, 핑거프린트)를 계속 모니터링할 수 있다.
도 2의 도시된 예시의 데이터 저장소(204)의 예시는 오디오 신호 및 미디어 유닛(106)에 의해 이용되는 다른 데이터를 위한 저장 장소이다. 데이터 저장소(204)는 휘발성 메모리(SDRAM(Synchronous Dynamic Random Access Memory), DRAM(Dynamic Random Access Memory), RDRAM(RAMBUS Dynamic Random Access Memory)) 및/또는 비휘발성 메모리(예컨대, 플래시 메모리)에 의해 구현될 수 있다. 데이터 저장소(204)는 추가적으로 또는 대안적으로 하나 이상의 DDR(double data rate) 메모리, 예컨대 DDR, DDR2, DDR3, 모바일 DDR(mDDR) 등에 의해 구현될 수 있다. 데이터 저장소(204)는 추가적으로 또는 대안적으로 하나 이상의 대용량 저장 장치, 예컨대 하드 디스크 드라이브(등), CD 드라이브(들), DVD 드라이브(들) 등에 의해 구현될 수 있다. 도시된 예시에서 데이터 저장소(204)가 단일 데이터베이스로 도시되지만, 데이터 저장소(204)는 임의의 수 및/또는 타입(들)의 데이터베이스에 의해 구현될 수 있다. 나아가, 데이터 저장소(204)에 저장된 데이터는 임의의 데이터 포맷, 예컨대 이진 데이터, 쉼표로 구분된 데이터, 탭으로 구분된 데이터, SQL(structured query language) 구조 등일 수 있다. 일부 예시에서, 데이터 저장소(204)의 예시와 메타데이터 데이터베이스(206)의 예시는 동일 저장 장소일 수 있다. 일부 예시에서, 데이터 저장소(204)는 가상 저장 장소(예컨대, 네트워크를 통해 접근 가능한 서버)일 수 있다.
메타데이터 데이터베이스(206)의 예시는 미디어에 대응하는 메타데이터를 위한 저장 장소이다. 메타데이터 데이터베이스(206)의 예시는 메타데이터 접근기(214)의 예시로 오디오 신호 식별기(212)의 예시에 의해 오디오 신호에서 식별된 미디어에 관한 메타데이터를 제공한다. 일부 예시에서, 메타데이터 데이터베이스(206)에 저장된 메타데이터는 미디어의 단위(예컨대, 트랙, 노래 등)에 대한 평균 볼륨 정보 및/또는 미디어의 단위의 세그먼트(예컨대, 노래에 걸친 3초 간격)에 대한 평균 볼륨 정보와 같은 정보를 포함한다. 메타데이터 데이터베이스(206)의 예시는 휘발성 메모리(SDRAM(Synchronous Dynamic Random Access Memory), DRAM(Dynamic Random Access Memory), RDRAM(RAMBUS Dynamic Random Access Memory)) 및/또는 비휘발성 메모리(예컨대, 플래시 메모리)에 의해 구현될 수 있다. 메타데이터 데이터베이스(206)는 추가적으로 또는 대안적으로 하나 이상의 DDR(double data rate) 메모리, 예컨대 DDR, DDR2, DDR3, 모바일 DDR(mDDR) 등에 의해 구현될 수 있다. 메타데이터 데이터베이스(206)는 추가적으로 또는 대안적으로 하나 이상의 대용량 저장 장치, 예컨대 하드 디스크 드라이브(등), CD 드라이브(들), DVD 드라이브(들) 등에 의해 구현될 수 있다. 도시된 예시에서 메타데이터 데이터베이스(206)가 단일 데이터베이스로 도시되지만, 메타데이터 데이터베이스(206)는 임의의 수 및/또는 타입(들)의 데이터베이스에 의해 구현될 수 있다. 나아가, 메타데이터 데이터베이스(206)에 저장된 데이터는 임의의 데이터 포맷, 예컨대 이진 데이터, 쉼표로 구분된 데이터, 탭으로 구분된 데이터, SQL(structured query language) 구조 등일 수 있다.
도 2의 도시된 예시의 다이나믹 레인지 압축기(208)의 예시는 식별되지 않는 오디오 신호 및/또는 원하는 볼륨 요건을 충족하기 위해 대응하는 메타데이터가 사용 가능하지 않은 오디오 신호의 다이나믹 레인지를 압축 및/또는 확장할 수 있다. 일부 예시에서, 다이나믹 레인지 압축기(208)는 신호가 원하는 볼륨 레벨에 관한 볼륨 임계치를 충족하는 평균 볼륨 레벨을 가지도록 오디오 다이나믹 레인지 압축 및/또는 오디오 다이나믹 레인지 확장을 수행한다. 일부 예시에서, 다이나믹 레인지 압축기는 백그라운드에서 계속 실행되고 볼륨 조절기(216)가 메타데이터의 부재 또는 식별 가능한 미디어의 부재로 인해 오디오 신호의 볼륨을 동적으로 조절하지 못할 때 활성화된다. 다이나믹 레인지 압축기(208)의 예시는 오디오 신호가 원하는 볼륨값에 관한 볼륨 임계치를 충족하지 않는 볼륨 크기를 가질 때 신호가 즉시 압축 또는 확장되도록 압축을 수행한다. 이러한 예시에서, 오디오 신호의 국소적 다이나믹 레인지는 압축이나 확장으로 인해 변경될 수 있다. 일부 예시에서, 다이나믹 레인지 압축기(208)의 예시는 오디오 신호 또는 오디오 신호의 일부를 오디오 신호 또는 오디오 신호의 일부가 압축된 후 실시간 오디오 모니터(218)로 전달한다.
도 2의 도시된 예시의 오디오 신호 접근기(210)의 예시는 처리를 위해 오디오 신호에 접근한다. 일부 예시에서, 오디오 신호 접근기(210)의 예시는 도 1의 도시된 예시의 미디어 장치(102, 104)로부터 신호를 수신한다. 일부 예시에서, 오디오 신호 접근기(210)는 데이터 저장소(204)로부터 오디오 신호를 검색하는데, 처리 전에 들어오는 오디오 신호를 위한 임시 버퍼로 작용할 수 있다. 일부 예시에서, 오디오 신호 접근기(210)는 동적 볼륨 조절기(202)에게 분석 및 볼륨 조절을 위한 시간을 제공하기 위해 오디오 신호가 처음 접근되는 시간과 오디오 신호가 출력되는 시간 간의 지연을 야기하는 버퍼(예컨대, 1초 버퍼)를 구현한다. 버퍼 기간 동안, 오디오 신호는 오디오 신호 식별기(212)에 의해 식별될 수 있고, 메타데이터는 메타데이터 접근기(214)에 의해 오디오 신호에 대해 검색될 수 있고, 볼륨 레벨은 참조 오디오 레벨(예컨대, 메타데이터로부터, 과거 볼륨 설정으로부터 등)과 비교될 수 있고, 오디오 신호의 일부의 볼륨 레벨이 조절될 수 있고, 및/또는 오디오 신호의 전체의 볼륨 레벨이 조절될 수 있다. 볼륨 일관성, 사용자 경험 및/또는 볼륨 레벨 안전성을 향상시키기 위해 임의의 분석 및/또는 볼륨 조절 단계는 버퍼 기간 동안 일어날 수 있다. 오디오 신호 접근기(210)의 예시는 임의의 소스로부터 임의의 포맷의 오디오 신호를 수신할 수 있다. 도시된 예시의 오디오 신호 접근기(210)는 실시간 오디오 모니터(218), 오디오 신호 식별기(212) 및/또는 미디어 유닛(106)의 임의의 다른 컴포넌트에 오디오 신호를 통신한다.
도 2의 도시된 예시의 오디오 신호 식별기(212)의 예시는 오디오 신호 접근기(210)의 예시에 의해 접근되는 오디오 신호에 대응하는 미디어를 식별한다. 일부 예시에서, 오디오 신호 식별기(212)는 오디오 신호의 미디어를 결정하기 위해 알려진 또는 참조 오디오 서명과 오디오 신호에 내장된 미디어 식별자(예컨대, 핑거프린트)의 비교를 수행한다. 오디오 신호 식별기(212)의 예시가 식별을 수행하기 위해 미디어에서 서명을 발견하지 못하는 경우, 오디오 신호 식별기(212)의 예시는 다이나믹 레인지 압축기(208)에 오디오 신호의 동적 압축의 수행을 지시한다. 유사하게, 오디오 신호 식별기(212)의 예시가 서명을 발견하지만 참조와의 매칭에 기반하여 미디어를 결정할 수 없는 경우, 오디오 신호 식별기(212)의 예시는 다이나믹 레인지 압축기(208)에 오디오 신호의 동적 압축의 수행을 지시한다. 일부 예시에서, 오디오 신호 식별기(212)의 예시는 일치하는 참조 서명을 찾을 수 있다. 이러한 예시에서, 오디오 신호 식별기(212)는 미디어에 대응하는 메타데이터에 접근하기 위해 메타데이터 접근기(214)의 예시에 식별 정보를 넘길 수 있다. 일부 예시에서, 오디오 신호 식별기(212)는 일치하는 참조 서명을 찾기 위해 외부 데이터베이스(예컨대, 중앙 시설)와 상호작용할 수 있다. 일부 예시에서, 오디오 신호 식별기(212)는 일치하는 참조 서명을 찾기 위해 내부 데이터베이스(예컨대, 데이터 저장소(204) 및/또는 메타데이터 데이터베이스(206))와 상호작용할 수 있다. 일부 예시에서, 오디오 신호 식별기(212)는 오디오 신호를 식별하기 위해 워터마크를 이용한다. 일부 예시에서, 오디오 신호 식별기(212)는 오디오 신호를 식별하기 위해 다른 식별자(예컨대, ID3 태그에 내장된 카탈로그 식별자, ISRC 식별자 등)를 이용한다. 오디오 신호 식별기(212)는 오디오 신호를 식별하기 위해 임의의 기술을 이용할 수 있다.
도 2의 도시된 예시의 메타데이터 접근기(214)의 예시는 오디오 신호 식별기(212)에 의해 식별된 미디어에 대응하는 메타데이터에 접근할 수 있다. 일부 예시에서, 메타데이터 접근기(214)는 미디어의 단위(예컨대, 트랙)의 평균 볼륨 및 미디어의 단위(예컨대, 트랙)에 걸쳐 현재 볼륨 레벨에 관한 정보를 추출한다. 일부 예시에서, 메타데이터는 메타데이터 데이터베이스(206)로부터 검색될 수 있다. 일부 예시에서, 메타데이터는 외부 위치(예컨대, 중앙 시설의 저장 장소, 네트워크를 통해 접근 가능한 저장 장소 등)에서 검색될 수 있다. 일부 예시에서, 사용 가능한 메타데이터는 동적 볼륨 조절기(202)를 위한 사용 가능한 데이터를 제공하기 위해 메타데이터 접근기(214)에 의해 처리될 수 있다. 일부 예시에서, 볼륨 측정은 기존의 기술 및 표준(예컨대, 본 명세서에 참조로 통합되는 ITU-R 표준 BS.1770-4에 제시되는 오디오 프로그래머 라우드니스를 측정하는 알고리즘)을 사용하여 처리될 수 있다. 예를 들어, 메타데이터는 시간의 매 세그먼트에 볼륨 정보를 포함할 수 있고 메타데이터 접근기(214)는 전체 기간에 대한 평균 볼륨을 결정할 수 있다. 일부 예시에서, 메타데이터 접근기(214)는 동적 볼륨 조정 일부 예시에서, 메타데이터 접근기(214)가 접근한 메타데이터는 미디어의 평균 값과 원하는 볼륨 간의 차이를 나타내는 값을 포함할 수 있는데, 이어서 오디오 신호에 평균 게인을 적용하는데 사용될 수 있다.
도 2의 도시된 예시의 볼륨 조절기(216)의 예시는 오디오 신호의 볼륨 레벨을 조절한다. 일부 예시에서, 볼륨 조절기(216)의 예시는 알려진 볼륨 레벨로부터(예컨대, 메타데이터에 표시된 대로) 원하는 볼륨값으로(예컨대, 미리 설정된 값) 오디오 신호의 볼륨을 변형할 단일 평균 게인값을 결정한다 이러한 예시에서, 볼륨 조절기(216)의 예시는 오디오 신호를 변형하기 위해 전체 오디오 신호에 게인값을 적용한다. 일부 예시에서, 볼륨 조절기(216)의 예시는 추가적으로 또는 대안적으로 실시간 오디오 모니터(218)에서 피드백되는 출력 레벨(예컨대, 볼륨 레벨)과 원하는 볼륨 레벨에 관한 볼륨 임계치를 충족(예컨대, 볼륨 타겟을 충족)하지 않는 오디오 신호의 지정된 세그먼트(예컨대, 샘플 또는 다수의 샘플)에 대한 평균 볼륨 레벨에 응답하여 출력되는 오디오 신호에 실시간으로 게인값을 적용한다. 일부 예시에서, 볼륨 조절기(216)의 예시는 미디어에 대한 메타데이터가 표시한 평균 볼륨 레벨에 기반하여 전체 오디오 신호에 전역 게인값을 적용할 수 있다. 일부 예시에서, 볼륨 조절기(216)의 예시는 메타데이터에 표시된 큰 볼륨 변화에 기반하여 및/또는 임계치가 충족되지 않았다고(예컨대, 타겟 출력 레벨이 달성되지 않음) 표시하는 실시간 오디오 모니터(218)의 예시에 의해 수집된 실시간 데이터에 기반하여 오디오 신호의 다른 세그먼트와 현저히 상이한(예컨대, 낮거나 높은) 볼륨을 가지는 오디오 신호의 영역에 로컬 게인값을 적용할 수 있다. 일부 예시에서, 메타데이터 접근기(214)에 의해 검색된 메타데이터는 원하는 볼륨 레벨을 달성하기 위해 오디오 신호에 적용하기 위해 적절한 게인을 직접 표시하는 데이터를 포함한다. 일부 예시에서, 볼륨 조절기(216)의 예시는 메타데이터 접근기(214)에 의해 접근된 메타데이터에 포함된 계속적 볼륨 스트림을 사용하여 예측적 조절 기능을 가질 수 있다. 일부 예시에서, 볼륨 조절기(216)의 예시는 실시간 오디오 모니터(218) 및 메타데이터 접근기(214)의 예시와 협력하여 이들 변화 전에 오디오 신호의 다이나믹 레인지의 변화를 고려하기 위해 볼륨에 조절할 수 있다. 예를 들어, 메타데이터 접근기(214)에 의해 접근된 메타데이터에 포함된 계속적 볼륨 스트림은 볼륨 조절기(216)가 큰 볼륨 이벤트가 일어나기 전 느리게 이동하는 볼륨 변화를 적용함으로써 보정할 수 있는 큰 볼륨 변화를 표시할 수 있다. 따라서, 메타데이터에 표시된 볼륨 변화 전에, 볼륨 조절기(216)의 예시는 오디오 신호에 게인값을 점진적으로 조절하고 미디어의 볼륨을 결과적으로 조절할 수 있다.
나아가, 실시간 오디오 모니터(218)는 볼륨 임계치가 충족되지 않았음(예컨대, 타겟 볼륨 레벨이 달성되지 않음)을 표시하고 볼륨 조절기(216)에 실시간으로 적용되는 추가 보정 인자를 공급할 수 있다. 일부 예시에서, 오디오의 다이나믹 레인지의 느리고 감지할 수 없는 변이는 다이나믹 레인지 압축기(208)의 예시에 의해 적용되는 압축과 달리, 보정 인자의 적용에 의해 야기될 수 있다.
일부 예시에서, 볼륨 조절기(216)는 새 미디어가 감지될 때 및/또는 새 소스가 감지될 때 단일 볼륨 조절을 만든다. 이러한 접근법은 계속적 볼륨 조절과 비교하면 일부 예시에서 바람직할 수 있는데, 단일 볼륨 조절은 소스 간에 및 미디어 간에 표준화를 위해 이뤄질 수 있고, 이 원하는 볼륨 레벨은 새 소스나 새 미디어가 감지될 때까지 유지될 수 있다(이로써 현저한 볼륨 조절은 회피한다). 이러한 일부 예시에서, 볼륨 조절기(216)는 상이한 미디어 간의 표준화를 가능하게 하기 위해 메타데이터에 표시되는 대로 미디어의 평균 볼륨에 기반한 제1 게인 및 소스 간의 볼륨의 표준화를 가능하게 하기 위해 입력 오디오 신호와 메타데이터에 표시되는 즉각적인 볼륨 조절의 비교에 기반한 제2 게인을 계산한다. 볼륨 조절기(216)는 이 초기의 변경되지 않은 볼륨을 메타데이터 접근기(214)로부터의 메타데이터의 즉각적 볼륨과 비교함으로써 제2 게인을 결정하기 위해 입력 오디오 신호의 변경되지 않은 볼륨을 이용한다. 볼륨 조절기(216)는 제1 및 제2 게인값 모두에 기반하여 적용된 게인값을 계산하고, 이 적용된 게인값에 기반하여 입력 오디오 신호의 볼륨을 조절한다. 이러한 일부 예시에서, 제1 및 제2 게인값은 모두 게인값이 적용되기 전의 볼륨 조절에 기반한다(예컨대, 변경되지 않은 입력 오디오 신호에 기반한다).
일부 예시에서, 볼륨 조절기(216)는 오디오 신호의 부분만을 위해 볼륨 레벨을 조절한다. 예를 들어, 볼륨 조절기(216)는 특정 채널을 위해 볼륨 레벨을 조절할 수 있다(예컨대, 영화의 대화의 인지성을 향상시키기 위해 5.1 믹스의 중앙 채널의 볼륨을 높임).
일부 예시에서, 볼륨 조절기(216)가 설정한 볼륨 레벨은 과거 데이터로 저장된다. 일부 예시에서, 과거 볼륨 레벨은 초기 볼륨 레벨을 설정하기 위해 소스 변경시(예컨대, 라디오에서 보조 입력으로 전이, CD에서 라디오 입력으로 전이 등) 이용된다. 일부 예시에서, 실시간 오디오 모니터(218)는 현재 볼륨 레벨을 소스 및/또는 사용자와 연관된 과거 볼륨 레벨과 비교하고 볼륨 조절기(216)가 이에 따라 볼륨 레벨은 조절하도록(예컨대, 사용자의 과거 선호와 일치하도록 볼륨 레벨을 감소, 안전한 청취 볼륨 범위 내에 유지되도록 볼륨 레벨을 감소 등) 야기한다.
도 2의 도시된 예시의 실시간 오디오 모니터(218)의 예시는 실시간 측정 데이터를 수집하고, 오디오 신호의 샘플을 위한 평균 볼륨 레벨을 생성하고, 오디오 신호의 세그먼트가 원하는 볼륨 레벨에 관한 볼륨 임계치(예컨대, 타겟 볼륨)을 충족하지 않는 평균 볼륨값을 가지는지 여부를 결정한다. 실시간 오디오 모니터(218)의 예시는 오디오 신호 접근기(210)에 의해 접근된 입력 오디오 신호 및 오디오 신호가 볼륨 조절기(216)에 의해 변경된 후 및/또는 오디오 신호가 다이나믹 레인지 압축기(208)에 의해 변경된 후 미디어 유닛(106)의 오디오 출력을 모니터링한다. 일부 예시에서, 실시간 오디오 모니터(218)는 처리된 오디오 신호의 출력 전에 처리된 오디오 신호로부터 직접 볼륨 데이터를 수집할 수 있다. 일부 예시에서, 실시간 오디오 모니터(218)는 별개의 측정 장치 또는 메커니즘(예컨대, 메타데이터 접근기(214)에 의해 접근된 메타데이터로부터의 볼륨 스트림)으로부터 볼륨 데이터를 수집할 수도 있다. 실시간 오디오 모니터(218)의 예시는 오디오 신호의 세그먼트가 원하는 볼륨 레벨에 관한 볼륨 임계치(예컨대, 타겟 볼륨)을 충족하지 않는다고 결정하는데 응답하여, 볼륨 조절기(216)에 데이터를 제공할 수 있다. 볼륨 조절기(216)의 예시는 이어서 오디오 신호가 원하는 볼륨 레벨에 관한 볼륨 임계치를 충족시키도록 오디오 신호를 보정하기 위해 게인값을 로컬로 또는 전역적으로(예컨대, 오디오 신호 전체에 걸쳐) 게인값을 적용한다. 일부 예시에서, 실시간 오디오 모니터(218)의 예시는 실시간 오디오 레벨이 계산되는 샘플 간격 범위(예컨대, 750 밀리초 대 3초)로 미리 구성될 수 있다. 일부 예시에서, 계산된 출력 볼륨 레벨은 오디오 신호의 평균 볼륨 레벨 및 타겟 볼륨 레벨로부터 이 레벨의 차이를 계산하기 위해 샘플링 범위(예컨대, 750 밀리초 대 3초) 내에서 메타데이터 접근기(214)에 의해 접근된 메타데이터로부터 데이터의 스트림과 비교된다. 일부 예시에서, 샘플 크기, 샘플 주파수 및 다른 파라미터(예컨대, 임계치)가 설정 가능할 수 있다.
게인값이 소스 간에 표준화를 위해 계산되는 일부 예시에서, 실시간 오디오 모니터(218)는 변경되지 않은 입력 오디오 신호의 초기 볼륨을 결정하고 게인값이 계산되도록 이 볼륨을 볼륨 조절기(216)에 통신한다. 이러한 일부 예시에서, 실시간 오디오 모니터(218)는 소스 변경이 일어나는지 또는 미디어의 변경이 일어나는지 여부를 결정하고, 이로써 볼륨 조절기(216)가 상이한 미디어 및/또는 상이한 소스 간에 표준화를 위해 새 게인값을 계산할 수 있게 할 수 있다.
일부 예시에서, 실시간 오디오 모니터(218)는 현재 볼륨 레벨을 안전한 볼륨 레벨 범위 및/또는 안전한 볼륨 임계치와 비교한다. 예를 들어, 실시간 오디오 모니터(218)는 볼륨 레벨이 안전한 청취 볼륨 임계치를 초과할 때 볼륨 감소를 야기하도록 구성될 수 있다.
도 2의 도시된 예시의 오디오 신호 출력기(220)의 예시는 제시를 위해 오디오 신호를 출력한다. 일부 예시에서, 오디오 신호 출력기(220)는 도 1의 출력 장치(110)의 요건을 충족하기 위해 오디오 신호의 변환을 수행한다. 일부 예시에서, 오디오 신호가 다이나믹 레인지 압축기(208)에 의해 압축된 후, 동적 볼륨 조절기(202)의 오디오 신호 출력기(220)로 전송된다. 일부 예시에서, 오디오 신호 출력기(220)의 예시는 오디오 신호를 증폭기나 출력 장치로 전송하기 전 오디오 신호가 볼륨 요건을 충족한다는 최종 검증을 가능하게 하기 위해 실시간 오디오 모니터(218)와 직접 통신한다.
도 1의 미디어 유닛(106)를 구현하는 예시적인 방법이 도 2에 도시되지만, 도 2에 도시된 요소, 프로세스 및/또는 장치 중 하나 이상은 조합, 분할, 재배열, 생략, 제거 및/또는 임의의 다른 방식으로 구현될 수 있다. 나아가, 동적 볼륨 조절기(202)의 예시, 데이터 저장소(204)의 예시, 메타데이터 접근기(214)의 예시, 다이나믹 레인지 압축기(208)의 예시, 오디오 신호 접근기(210)의 예시, 오디오 신호 식별기(212)의 예시, 메타데이터 접근기(214)의 예시, 볼륨 조절기(216)의 예시, 실시간 오디오 모니터(218)의 예시, 오디오 신호 출력기(220)의 예시 및/또는 더 일반적으로 도 1의 미디어 유닛(106)의 예시는 하드웨어, 소프트웨어, 펌웨어 및/또는 하드웨어, 소프트웨어 및/또는 펌웨어의 임의의 조합에 의해 구현될 수 있다. 따라서, 예를 동적 볼륨 조절기(202)의 예시, 데이터 저장소(204)의 예시, 메타데이터 접근기(214)의 예시, 다이나믹 레인지 압축기(208)의 예시, 오디오 신호 접근기(210)의 예시, 오디오 신호 식별기(212)의 예시, 메타데이터 접근기(214)의 예시, 볼륨 조절기(216)의 예시, 실시간 오디오 모니터(218)의 예시, 오디오 신호 출력기(220)의 예시 및/또는 더 일반적으로 미디어 유닛(106) 중 임의의 것은 하나 이상의 아날로그 또는 디지털 회로(들), 논리 회로, 프로그래머블 프로세서(들), ASIC(application specific integrated circuit)(들), PLD(programmable logic device)(들) 및/또는 FPLD(field programmable logic device)(들)에 의해 구현될 수 있다. 본 특허의 장치 또는 시스템 청구항 중 임의의 것을 순수하게 소프트웨어 및/또는 펌웨어 구현을 포함하는 것으로 해석할 때, 동적 볼륨 조절기(202)의 예시, 데이터 저장소(204)의 예시, 메타데이터 접근기(214)의 예시, 다이나믹 레인지 압축기(208)의 예시, 오디오 신호 접근기(210)의 예시, 오디오 신호 식별기(212)의 예시, 메타데이터 접근기(214)의 예시, 볼륨 조절기(216)의 예시, 실시간 오디오 모니터(218)의 예시, 오디오 신호 출력기(220)의 예시 및/또는 더 일반적으로 미디어 유닛(106) 중 적어도 하나는 본 명세서에 명시적으로 소프트웨어 및/또는 펌웨어를 포함하는 메모리, DVD(digital versatile disk), CD(compact disk), Blu-ray 디스크 등과 같은 비일시적 컴퓨터 판독 가능한 저장 장치 또는 저장 디스크를 포함하는 것으로 정의된다. 또한, 도 1의 미디어 유닛(106)의 예시는 도 2에 도시된 것에 추가로 또는 대신 하나 이상의 요소, 프로세스 및/또는 장치를 포함할 수 있고 및/또는 도시된 요소, 프로세스 및 장치 중 임의의 것이나 전부 중 하나 이상을 포함할 수 있다.
도 1 및 2의 미디어 유닛(106)을 구현하기 위한 장치 판독 가능한 명령어의 예시를 나타내는 흐름도가 도 3-5에 도시된다. 이 예시에서, 장치 판독 가능한 명령어는 도 6과 관련하여 후술되는 프로세서 플랫폼(600)의 예시에 도시되는 프로세서(612)과 같은 프로세서에 의해 실행되기 위한 프로그램을 포함한다. 프로그램은 CD-ROM, 플로피 디스크, 하드 드라이브, DVD, Blu-ray 디스크 또는 프로세서(612)와 연관된 메모리와 같은 비일시적 컴퓨터 판독 가능한 저장 매체에 저장된 소프트웨어에 내장될 수 있지만, 전체 프로그램이나 그 일부는 대안적으로 프로세서(612)가 아닌 장치에 의해 실행되고 및/또는 펌웨어나 지정된 하드웨어에 내장될 수 있다. 나아가, 도 3-5에 도시된 흐름도와 관련하여 프로그램의 예시가 서술되지만, 미디어 유닛(106)의 예시를 구현하는 많은 다른 방법이 대안적으로 사용될 수 있다. 예를 들어, 블록의 실행 순서는 변경될 수 있고 및/또는 서술된 블록 중 일부는 변경, 제거 또는 조합될 수 있다. 추가적으로 또는 대안적으로, 블록 중 임의의 것 또는 전부는 소프트웨어나 펌웨어 실행 없이 대응하는 동작을 수행하도록 구축된 하나 이상의 하드웨어 회로(예컨대, 개별 및/또는 통합된 아날로그 및/또는 디지털 회로, FPGA(Field Programmable Gate Array), ASIC(Application Specific Integrated circuit), 비교기, 오피 앰프(operational-amplifier; op-amp), 논리 회로 등)에 의해 구현될 수 있다.
상술한 바와 같이, 도 3-5의 프로세스의 예시는 하드 디스크 드라이브, 플래시 메모리, 리드 온리 메모리, CD, DVD, 캐시, 랜덤 액세스 메모리 및/또는 정보가 임의의 기간(예컨대, 확장된 기간 동안, 영구하게, 잠시, 임시 버퍼링을 위해 및/또는 정보의 캐싱을 위해) 동안 저장되는 다른 저장 장치나 저장 디스크와 같은 비일시적 컴퓨터 및/또는 장치 판독 가능한 매체에 저장된 코딩된 명령어(예컨대, 컴퓨터 및/또는 장치 판독 가능한 명령어)를 사용하여 구현될 수 있다. 본 명세서에 사용되는 바와 같이, 용어 비일시적 컴퓨터 판독 가능한 매체는 임의의 타입의 컴퓨터 판독 가능한 저장 장치 및/또는 저장 디스크를 포함하고 신호 전파를 제외하며 전송 매체를 제외하는 것으로 명시적으로 정의된다. "포함하는(including 및 comprising)"(및 그 모든 형태와 시제)은 본 명세서에서 개방적 용어로 사용된다. 따라서, 청구항이 "포함한다(include 또는 comprise)"의 임의의 형태(예컨대, 포함한다(comprises, includes), 포함하는(comprising, including) 등)에 뒤따른 어떠한 것을 나열할 때, 추가 요소, 용어 등이 대응하는 청구항의 범위를 벗어나지 않고 존재할 수 있음을 이해하여야 한다. 본 명세서에 사용되는 바와 같이, 구절 "적어도"가 청구항의 전제부에서 전이부로 사용될 때, 용어 "포함하는(comprising 및 including)"이 개방적인 것과 마찬가지로 개방적이다.
도 1 및 2의 미디어 유닛(106)을 구현하기 위한 것이며 오디오 신호의 볼륨 조절을 수행하기 위해 실행될 수 있는 장치 판독 가능한 명령어의 예시가 도 3에 도시된다. 상기 도면 및 연관된 설명을 참조하여, 장치 판독 가능한 명령어(300)의 예시는 동적 볼륨 조절기(202)의 예시가 오디오 신호를 수신하며 시작한다(블록 (302)). 예를 들어, 오디오 신호 접근기(210)는 임의의 미디어 소스로부터 오디오 신호를 수신할 수 있거나 임의의 위치로부터 오디오 신호에 접근할 수 있다.
블록(304)에서, 동적 볼륨 조절기(202)의 예시는 오디오 신호의 미디어가 식별 가능한지 여부를 결정한다. 예를 들어, 오디오 신호 식별기(212)는 오디오 신호의 미디어가 식별 가능한지 여부를 결정할 수 있다. 일부 예시에서, 오디오 신호 식별기(212)는 참조 식별자와 비교하기 위해 오디오 신호에 내장된 미디어 식별자(예컨대, 워터마크, ID3 태그, ISRC 식별자 등)를 이용한다. 일부 예시에서, 오디오 신호 식별기(212)는 미디어 유닛(106)에 위치하거나 상이한 위치(예컨대, 중앙 시설)에 위치한 참조 데이터베이스와 상호작용할 수 있다. 이러한 예시에서, 오디오 신호 식별기(212)는 참조 데이터베이스에 식별자를 제공할 수 있는데, 일치하는 식별자 검색이 수행될 수 있다. 일부 예시에서, 오디오 신호 식별기(212)는 오디오 신호에 표현되는 미디어가 식별 가능한지 여부를 결정하기 위해 오디오 신호로부터 도출된 핑거프린트를 이용한다. 오디오 신호 식별기(212)는 오디오 신호에 표현되는 미디어가 식별 가능한지 여부를 결정하기 위한 임의의 기술을 이용할 수 있다. 오디오 신호의 미디어가 식별 가능한데 응답하여, 프로세스는 블록(308)으로 이동한다. 반대로, 오디오 신호의 미디어가 식별 가능하지 않은데 응답하여, 프로세스는 블록(306)으로 이동한다.
블록(306)에서, 미디어 유닛(106)의 예시는 원하는 볼륨 레벨에 관하 임계치를 충족시키기 위해 평균 볼륨 레벨을 변경하기 위해 오디오 신호의 범위를 동적으로 압축한다. 일부 예시에서, 다이나믹 레인지 압축기(208)는 식별 가능하지 않은 오디오 신호의 미디어에 응답하여 오디오 신호를 동적으로 압축한다. 일부 예시에서, 다이나믹 레인지 압축기(208)는 볼륨 임계치를 충족하지 않는 영역에서 오디오 신호가 압축되도록 오디오를 증가하여 압축한다. 일부 예시에서 다이나믹 레인지 압축기(208)는 오디오 신호의 평균 볼륨이 원하는 볼륨에 관하 임계치를 충족하도록 전체 오디오 신호를 압축한다.
블록(308)에서, 동적 볼륨 조절기(202)의 예시는 지정된 간격으로 평균 전체 볼륨 및 현재 볼륨을 포함하는 미디어에 대한 메타데이터를 획득한다. 예를 들어, 메타데이터 접근기(214)의 예시는 메타데이터 데이터베이스(206)로부터 오디오 신호 식별기(212)에 의해 식별된 미디어에 대응하는 메타데이터를 검색할 수 있다. 일부 예시에서, 메타데이터 접근기(214)의 예시는 미디어에 대한 평균 전체 볼륨(트랙에 대한 평균 볼륨)뿐만 아니라 현재 볼륨(예컨대, 미디어에 걸친 다수의 볼륨값)을 나타내는 데이터를 지정된 간격(예컨대, 평균 볼륨을 계산할 세그먼트)으로 검색한다. 일부 예시에서, 메타데이터 접근기(214)는 미디어에 대한 평균 볼륨과 원하는 볼륨 간의 차이를 나타내는 값을 포함하는 메타데이터에 접근할 수 있다. 이러한 예시에서, 메타데이터는 원하는 볼륨을 달성하기 위해 오디오 신호에 적용되는 게인값을 더 포함할 수 있다. 일부 예시에서, 메타데이터 접근기(214)는 획득되는 메타데이터에 기반하여 이들 값(예컨대, 평균 볼륨, 현재 볼륨, 게인값 등) 중 임의의 것을 계산할 수 있다. 일부 예시에서, 메타데이터 접근기(214)는 미디어의 세그먼트에 대응하는 평균 볼륨의 평균에 기반하여 미디어에 대한 평균 볼륨을 계산할 수 있다. 예를 들어, 메타데이터 접근기(214)는 미디어에 걸쳐 명시된 증분으로 평균 볼륨 데이터에 대응하는 메타데이터에 접근할 수 있다. 이러한 예시에서, 메타데이터 접근기(214)는 트랙의 모든 세그먼트에 대한 평균 볼륨을 평균함으로써 미디어(예컨대, 트랙)에 대한 평균 볼륨을 계산할 수 있다.
블록(310)에서, 예시적인 동적 볼륨 조절기(202)는 원하는 볼륨 레벨에 관한 임계치를 충족시키기 위해 평균 볼륨을 조절하기 위해 메타데이터에 기반하여 오디오 신호에 평균 게인을 적용한다. 일부 예시에서, 볼륨 조절기(216)의 예시는 원하는 볼륨 레벨에 관한 임계치를 충족시키기 위해 오디오 신호의 평균 볼륨을 조절하기 위해 오디오 신호에 평균 게인을 적용한다. 예를 들어, 볼륨 조절기(216)는 원하는 볼륨 레벨(예컨대, -21 데시벨 LKFS(loudness, K-weighted, relative to full scale)) 및 일부 또는 모든 볼륨 평균이 충족해야 하는 지정된 임계치로 구성될 수 있다. 예를 들어, 임계치는 원하는 볼륨 레벨 또는 볼륨 레벨의 허용 가능한 범위로부터의 편차일 수 있다. 일부 예시에서, 볼륨 조절기(216)는 메타데이터 접근기(214)에 의해 접근된 메타데이터로부터 직접 평균 게인값에 접근한다. 일부 예시에서, 볼륨 조절기(216)는 메타데이터 접근기(214)에 의해 접근된 메타데이터에 기반하여 평균 게인값을 계산한다. 일부 예시에서, 볼륨 조절기(216)는 오디오 신호 전체에 평균 게인을 적용한다. 일부 예시에서, 볼륨 조절기(216)는 미디어의 다른 세그먼트에 다른 게인값을 적용하기 위하여 지정된 간격으로 현재 볼륨에 관한 메타데이터를 이용한다. 볼륨 조절기(216)의 예시는 미디어의 전체 다이나믹에 영향을 주지 않고 볼륨 임계치를 충족시키기 위해 볼륨을 조정하는 방식으로 평균 게인값을 적용한다.
블록(312)에서, 미디어 유닛(106)의 예시는 오디오 신호를 출력한다. 일부 예시에서, 동적 볼륨 조절기(202)의 예시는 오디오 신호를 출력한다. 오디오 신호를 출력하는 자세한 명령어는 도 4에 제공된다.
도 1 및 2의 미디어 유닛(106)을 구현하기 위한, 오디오 신호를 출력하고 오디오 신호의 실시간 볼륨 조절을 제공하는 장치 판독 가능한 명령어의 예시가 도 4에 도시된다. 상기 도면 및 연관된 설명을 참조하여, 장치 판독 가능한 명령어(400)의 예시는 동적 볼륨 조절기(202)가 제시되는 오디오 신호의 샘플을 출력하며 시작한다. 예를 들어, 오디오 신호 출력기(220)는 출력되는 오디오 신호의 샘플을 증폭기 또는 출력 장치로 출력할 수 있다. 본 명세서에서 사용되는 바와 같이, 오디오 신호의 샘플은 제시를 위해 전체 오디오 신호를 출력하는 것과 달리 오디오 신호의 세그먼트를 지칭한다.
블록(404)에서, 동적 볼륨 조절기(202)의 예시는 오디오 샘플이 출력됨에 따라 실시간 볼륨 측정을 수집한다. 예를 들어, 실시간 오디오 모니터(218)는 출력 오디오 신호의 볼륨에 대한 데이터를 수집한다. 일부 예시에서, 데이터 수집은 볼륨 측정이 수집되는 샘플 크기(예컨대, 3초)뿐만 아니라 볼륨 측정 데이터가 수집되는 빈도를 지칭하는 샘플 주파수(예컨대, 매 750 밀리초)를 가질 수 있다. 일부 예시에서, 실시간 오디오 모니터(218)는 오디오 신호 볼륨의 마지막 순간의 보정을 가능하게 하기 위해 오디오 신호의 실제 제시 전에 데이터를 수집한다. 다른 예시에서, 실시간 오디오 모니터(218)는 이후의 제시를 위해 오디오 신호의 보정을 가능하게 하기 위해 오디오 신호가 제시됨에 따라 데이터를 수집한다.
블록(406)에서, 동적 볼륨 조절기(202)의 예시는 재생되는 오디오 신호의 지정된 기간에 대한 평균 볼륨 레벨을 생성한다. 일부 예시에서, 실시간 오디오 모니터(218)의 예시는 재생되는 오디오 신호의 지정된 기간에 대한 평균 볼륨 레벨을 생성한다. 일부 예시에서, 실시간 오디오 모니터(218)의 예시는 출력 오디오 샘플에 관한 평균 볼륨 측정을 생성한다. 일부 예시에서, 지정된 기간은 오디오 신호의 샘플의 동일 기간을 지칭한다. 다른 예시에서, 지정된 기간은 샘플의 기간과 상이할 수 있고 다수의 샘플을 포함할 수 있다(예컨대, 평균 3초의 기간인 반면 샘플은 1초 길이).
블록(408)에서, 동적 볼륨 조절기(202)의 예시는 지정된 기간에 대한 볼륨 측정이 메타데이터에 표시된 바와 같은 지정된 기간에 대한 볼륨 데이터에 대응하는지 여부를 결정한다. 예를 들어, 실시간 오디오 모니터(218)는 생성된 평균 볼륨 레벨을 오디오 신호에 의해 표현되는 미디어에 대응하는 메타데이터와 비교할 수 있다. 실시간 오디오 모니터(218)의 예시는 평균 볼륨 간의 차이를 결정하고 차이가 매칭 임계치를 충족하는지 여부를 결정함으로써 지정된 기간에 대한 볼륨 측정이 메타데이터의 볼륨 데이터에 대응하는지 여부를 결정할 수 있다. 일부 예시에서, 오디오 신호는 식별되지 않을 수 있고, 메타데이터는 비교를 위해 사용 가능하지 않을 수 있어, 볼륨 측정이 메타데이터에 표시된 어떤 볼륨 데이터와도 일치하지 않게 된다. 지정된 기간에 대한 볼륨 측정이 메타데이터에 표시된 바와 같은 지정된 기간에 대안 볼륨 데이터에 대응하지 않는데 응답하여, 프로세스는 블록(410)으로 이동한다. 반대로, 지정된 기간에 대한 볼륨 측정이 메타데이터에 표시된 바와 같은 지정된 기간에 대안 볼륨 데이터에 대응하는데 응답하여, 프로세스는 블록(416)으로 이동한다. 일부 예시에서, 실시간 오디오 모니터(218)의 예시는 추가로 볼륨 변화가 예측되는지 여부를 결정하기 위하여 지정된 기간에 대한 볼륨 측정을 오디오 신호의 다음 세그먼트에 대응하는 메타데이터와 비교할 수 있다. 이러한 예시에서, 실시간 오디오 모니터(218)의 예시는 볼륨의 다음 변화 및/또는 오디오 신호의 다이나믹 레인지를 고려하기 위하여 볼륨을 점진적으로 조절하기 위해 메타데이터에서 볼륨 조절기(216)로 이러한 예측 정보를 제공할 수 있다.
블록(410)에서, 동적 볼륨 조절기(202)의 예시는 지정된 기간에 대한 평균 볼륨 레벨이 원하는 볼륨 레벨에 관한 볼륨 임계치를 충족하는지 여부를 결정한다. 예를 들어, 실시간 오디오 모니터(218)는 지정된 기간에 대한 평균 볼륨 레벨이 원하는 볼륨 레벨에 관한 볼륨 임계치(예컨대, -21 데시벨 LKFS(loudness, K-weighted, relative to full scale))를 충족하는지 여부를 결정할 수 있다. 지정된 기간에 대한 평균 볼륨 레벨이 원하는 볼륨 레벨에 관한 볼륨 임계치를 충족하는데 응답하여, 프로세스는 블록(414)으로 이동한다. 반대로, 지정된 기간에 대한 평균 볼륨이 원하는 볼륨 레벨에 관한 볼륨 임계치를 충족하지 않는데 응답하여, 프로세스는 블록(410)으로 이동한다.
블록(412)에서, 동적 볼륨 조절기(202)의 예시는 평균 측정된 볼륨과 원하는 볼륨 레벨 간의 차이를 결정한다. 예를 들어, 실시간 오디오 모니터(218)는 두 값 간의 차이를 결정하기 위해 지정된 기간에 대한 평균 볼륨 레벨에서 원하는 볼륨 레벨을 뺄 수 있다.
블록(414)에서, 동적 볼륨 조절기(202)의 예시는 차이에 기반하여 오디오 신호를 원하는 볼륨 레벨로 조절하기 위하여 게인값을 적용한다. 예를 들어, 볼륨 조절기(216)는 오디오 신호를 원하는 볼륨 레벨로 조절하기 위하여 평균 측정된 볼륨과 원하는 볼륨 레벨 간의 차이에 기반하여 오디오 신호에 적용하기 위한 게인값을 계산할 수 있다. 일부 예시에서, 볼륨 조절기(216)는 오디오 신호의 나머지에 게인값을 적용할 수 있다. 일부 예시에서, 볼륨 조절기(216)는 오디오 신호가 동일 미디어에 대응하는 한 게인값을 적용할 수 있다. 일부 예시에서, 볼륨 조절기(216)는 오디오 신호의 상이한 세그먼트에서 볼륨 레벨의 차이를 고려하기 위해 게인값을 로컬로 적용할 수 있다.
블록(416)에서, 동적 볼륨 조절기(202)의 예시는 인식 가능한 미디어 제시 또는 인식 가능하지 않은 미디어 제시에 대응하는 현재 오디오 신호가 완전히 출력됐는지 여부를 결정한다. 예를 들어, 오디오 신호 식별기(212)는 오디오 신호의 미디어 식별자의 존재(또는 부재)에 기반하여 인식 가능한 미디어 제시 또는 인식 가능하지 않은 미디어 제시가 완전히 출력됐는지 여부를 결정할 수 있다. 예를 들어, 오디오 신호 식별기(212)는 미디어 식별자에 대해 오디오 신호를 계속하여 모니터링할 수 있다. 오디오 신호 식별기(212)의 예시는 미디어 식별자의 변화 또는 미디어 식별자의 존재의 변화(예컨대, 미디어 식별자를 찾지 못하는 것에서 미디어 식별자를 찾은 것으로 이동)를 미디어 제시 또는 인식 가능하지 않은 미디어 제시에 대응하는 오디오 신호가 완전히 출력됐다는 표시자로 해석할 수 있다. 오디오 신호 식별기(212)의 예시는 사용 가능한 메타데이터에 기반하여 새 게인값이 계산될 것을 필요로 하거나, 미디어가 식별 불가능한 경우 다이나믹 레인지 압축이 수행될 것을 필요로 하는 새 오디오 신호가 존재하는지 여부를 검사하기 위해 이 검증을 수행한다. 인식 가능한 미디어 제시 또는 인식 가능하지 않은 미디어 제시에 대응하는 현재 오디오 신호가 완전히 출력된데 응답하여, 프로세스는 도 3의 명령어로 귀환하고 종료한다. 반대로, 인식 가능한 미디어 제시 또는 인식 가능하지 않은 미디어 제시에 대응하는 현재 오디오 신호가 완전히 출력되지 않은데 응답하여, 프로세스는 블록(402)으로 이동한다.
도 1 및 2의 미디어 유닛(106)을 구현하기 위한 것이며 소스 간 및 미디어 간에 볼륨을 표준화하기 위해 볼륨 조절을 수행하기 위해 실행될 수 있는 장치 판독 가능한 명령어의 예시가 도 5에 도시된다. 상기 도면 및 연관된 설명을 참조하여, 장치 판독 가능한 명령어(500)의 예시는 미디어 유닛(106)의 예시가 오디오 신호에 접근하며 시작한다(블록(502)). 일부 예시에서, 오디오 신호 접근기(210)는 입력 오디오 신호에 접근한다.
블록(504)에서, 미디어 유닛(106)의 예시는 오디오 신호에 전달되는 미디어가 식별 가능한지 여부를 결정한다. 일부 예시에서, 오디오 신호 식별기(212)는 오디오 신호에 의해 전달되는 미디어가 식별 가능한지 여부를 결정한다. 오디오 신호 식별기(212)는 임의의 워터마크, 코드 및/또는 다른 식별자가 오디오 신호에 내장되었는지 여부를 결정할 수 있다. 일부 예시에서, 오디오 신호 식별기(212)는 오디오 신호에 기반하여 서명을 결정하고 서명이 참조 서명이 있는 저장 위치에 표현되는지 여부를 결정한다. 오디오 신호에 전달되는 미디어가 식별 가능한데 응답하여, 프로세스는 블록(508)으로 이동한다. 반대로, 오디오 신호에 전달되는 미디어가 식별 가능하지 않은데 응답하여, 프로세스는 블록(506)으로 이동한다.
블록(506)에서, 미디어 유닛(106)의 예시는 볼륨 임계치를 충족시키기 위해 오디오 신호의 다이나믹 레인지를 압축 또는 확장한다. 일부 예시에서, 다이나믹 레인지 압축기(208)는 볼륨 임계치를 충족시키기 위해 오디오 신호의 다이나믹 레인지를 압축 또는 확장한다. 일부 예시에서, 볼륨 임계치는 오디오 신호의 볼륨이 속해야 하는 범위이다. 일부 예시에서, 볼륨 임계치는 최대 또는 최소 볼륨값이다.
블록(508)에서, 미디어 유닛(106)의 예시는 오디오 신호에 전달되는 미디어를 식별한다. 일부 예시에서, 오디오 신호 식별기(212)는 오디오 신호에 전달되는 미디어를 식별하기 위해 워터마크, 코드, 서명, 핑거프린트 및/또는 임의의 다른 식별 기술을 이용한다.
블록(510)에서, 미디어 유닛(106)의 예시는 미디어의 평균 볼륨 및 미디어에 대한 시간 가변 볼륨 측정을 포함하는 메타데이터를 획득한다. 일부 예시에서, 메타데이터 접근기(214)는 미디어의 평균 볼륨 및 미디어에 대한 시간 가변 볼륨 측정을 포함하는 메타데이터를 획득한다. 미디어에 대한 평균 볼륨은 미디어의 특징적 볼륨이다. 예를 들어, 상이한 노래는 상이한 평균 볼륨값을 가질 수 있다. 따라서 평균 볼륨값은 상이한 미디어(예컨대, 상이한 노래) 간의 볼륨 레벨을 표준화하는 것을 돕기 위해 이용될 수 있다. 미디어에 대한 시간 가변 볼륨 측정은 특정 시간에서 미디어에 대한 즉각적 볼륨 측정을 포함한다. 따라서 시간 가변 측정은 입력 오디오 신호의 즉각적 볼륨을 메타데이터에 표현되는 기대값과 비교하여, 상이한 소스 간의 볼륨 레벨의 표준화를 가능하게 한다.
블록(512)에서, 미디어 유닛(106)의 예시는 상이한 미디어 간의 볼륨을 표준화하기 위해 미디어의 평균 볼륨에 기반하여 제1 게인값을 계산한다. 일부 예시에서, 볼륨 조절기(216)는 상이한 미디어 간의 볼륨을 표준화하기 위해 미디어의 평균 볼륨에 기반하여 제1 게인값을 계산한다. 제1 게인값을 계산하기 위해, 볼륨 조절기(216)는 메타데이터 접근기(214)로부터의 메타데이터 및 실시간 오디오 모니터(218)에 의해 측정된 볼륨에 기반하여 제1 게인값을 계산한다. 제1 게인값은 식별된 미디어의 특정 볼륨을 고려한 게인을 나타낸다. 예를 들어, 상대적으로 조용한 노래는 상대적으로 시끄러운 노래보다 더 큰 양의 게인을 가질 수 있는데, 두 곡을 볼륨 임계치 범위에 가져가기 위함이다.
블록(514)에서, 미디어 유닛(106)의 예시는 소스 간에 표준화하기 위해 오디오 신호의 볼륨과 시간 가변 볼륨 측정의 비교에 기반하여 제2 게인값을 계산한다. 일부 예시에서, 볼륨 조절기(216)는 소스 간에 표준화하기 위해 오디오 신호의 볼륨과 시간 가변 볼륨 측정의 비교에 기반하여 제2 게인값을 계산한다. 예를 들어, 보조 입력을 통해 미디어 유닛(106)에 연결된 미디어 플레이어는 CD와 다른 기본 볼륨을 가질 수 있다. 따라서, 상이한 소스 간의 볼륨을 표준화하기 위해, 입력 볼륨과 메타데이터의 시간 가변 볼륨 측정의 즉각적 비교가 수행되어 소스 특정 볼륨 차이를 상쇄하기 위한 게인을 결정한다. 제1 게인(미디어의 평균 볼륨에 관한 게인)의 적용 전의 입력 신호의 볼륨 레벨은 메타데이터의 미디어에 대한 시간 가변 측정과 비교된다. 일부 예시에서, 시간 가변 볼륨 측정은 메타데이터에 포함되지 않는다. 이러한 일부 예시에서, 제1 게인값은 계산 및 적용될 수 있다. 반대로, 일부 예시에서, 평균 볼륨 측정이 메타데이터에 포함되지 않는다. 이러한 일부 예시에서, 제2 게인값은 계산 및 적용될 수 있다.
블록(516)에서, 미디어 유닛(106)의 예시는 제1 게인값 및 제2 게인값에 기반하여 오디오 신호에 적용하기 위해 적용된 게인값을 계산한다. 일부 예시에서, 볼륨 조절기(216)는 제1 게인값 및 제2 게인값에 기반하여 오디오 신호에 적용하기 위해 적용된 게인값을 계산한다. 일부 예시에서, 적용된 게인값은 제1 게인값에만 또는 제2 게인값에만 기반할 수 있다.
블록(518)에서, 미디어 유닛(106)의 예시는 오디오 신호에 적용된 게인값을 적용한다. 일부 예시에서, 볼륨 조절기(216)는 오디오 신호에 적용된 게인값을 적용할 수 있다.
블록(520)에서, 미디어 유닛(106)의 예시는 미디어의 변화가 감지됐는지 여부를 결정한다. 일부 예시에서, 오디오 신호 식별기(212)는 미디어의 상이한 식별에 기반하여 또는 미디어의 식별의 손실(예컨대, 워터마크 및/또는 다른 식별자가 더 이상 감지되지 않음)에 기반하여 미디어의 변화가 감지됐는지 여부를 결정한다. 미디어의 변화가 감지되는데 응답하여, 프로세스는 블록(508)로 이동한다. 반대로, 미디어의 변화가 감지되지 않는데 응답하여, 프로세스는 블록(522)으로 이동한다.
블록(522)에서, 미디어 유닛(106)의 예시는 소스의 변화가 감지됐는지 여부를 결정한다. 일부 예시에서, 오디오 신호 접근기(210)는 소스의 변화가 감지됐는지 여부를 결정한다. 소스의 변화가 감지되는데 응답하여, 프로세스는 블록(514)으로 이동한다. 반대로, 소스의 변화가 감지되지 않는데 응답하여, 프로세스는 블록(524)으로 이동한다.
블록(524)에서, 미디어 유닛(106)의 예시는 모니터링을 계속할지 여부를 결정한다. 모니터링을 계속하는데 응답하여, 프로세스는 블록(520)으로 이동한다. 반대로, 모니터링을 계속하지 않는데 응답하여, 프로세스는 종료한다.
도 6은 도 1 및 2의 미디어 유닛(106)의 예시를 구현하기 위하여 도 3-5의 명령어를 실행할 수 있는 프로세서 플랫폼(600)의 예시의 블록도이다. 프로세서 플랫폼(600)은 예컨대, 서버, 개인용 컴퓨터, 모바일 장치(예컨대, 휴대 전화, 스마트폰, iPadTM과 같은 태블릿), PDA(personal digital assistant), 인터넷 가전, DVD 플레이어, CD 플레이어, 디지털 비디오 레코더, Blu-ray 플레이어, 게임 콘솔, 개인용 비디오 레코더, 셋탑 박스 또는 임의의 다른 타입의 컴퓨팅 장치일 수 있다.
도시된 예시의 프로세서 플랫폼(600)은 프로세서(612)를 포함한다. 도시된 예시의 프로세서(612)는 하드웨어이다. 예를 들어, 프로세서(612)는 임의의 원하는 패밀리나 제조자의 하나 이상의 집적 회로, 논리 회로, 마이크로프로세서 또는 컨트롤러에 의해 구현될 수 있다. 하드웨어 프로세서는 반도체 기반(예컨대, 실리콘 기반) 장치일 수 있다. 이 예시에서, 프로세서(612)는 동적 볼륨 조절기(202)의 예시, 데이터 저장소(204)의 예시, 메타데이터 접근기(214)의 예시, 다이나믹 레인지 압축기(208)의 예시, 오디오 신호 접근기(210)의 예시, 오디오 신호 식별기(212)의 예시, 메타데이터 접근기(214)의 예시, 볼륨 조절기(216)의 예시, 실시간 오디오 모니터(218)의 예시, 오디오 신호 출력기(220)의 예시 및/또는 더 일반적으로 도 1의 미디어 유닛(106)의 예시를 구현한다. 도시된 예시의 프로세서(612)는 로컬 메모리(613)(예컨대, 캐시)를 포함한다. 도시된 예시의 프로세서(612)는 휘발성 메모리(614) 및 비휘발성 메모리(616)를 포함하는 주 메모리와 버스(618)를 통해 통신한다. 휘발성 메모리(614)는 SDRAM(Synchronous Dynamic Random Access Memory), DRAM(Dynamic Random Access Memory, RDRAM(RAMBUS Dynamic Random Access Memory) 및/또는 임의의 다른 타입의 RAM 장치에 의해 구현될 수 있다. 비휘발성 메모리(616)는 플래시 메모리 및/또는 임의의 다른 소정의 타입의 메모리 장치에 의해 구현될 수 있다. 주 메모리(614, 616)로의 액세스는 메모리 컨트롤러에 의해 제어된다.
도시된 예시의 프로세서 플랫폼(600)은 인터페이스 회로(620)도 포함한다. 인터페이스 회로(620)는 이더넷 인터페이스, USB(universal serial bus) 및/또는 PCI(peripheral component interconnect) 익스프레스 인터페이스와 같은 임의의 타입의 인터페이스 표준에 의해 구현될 수 있다.
도시된 예시에서, 하나 이상의 입력 장치(622)가 인터페이스 회로(620)에 연결된다. 입력 장치(들)(622)는 사용자가 프로세서(612)로 데이터 및/또는 명령을 입력할 수 있게 한다. 입력 장치(들)는 예컨대 오디오 센서, 마이크로폰, 카메라(정적 또는 비디오), 키보드, 버튼, 마우스, 터치스크린, 트랙패드, 트랙볼, 이소포인트 장치 및/또는 음성 인식 시스템에 의해 구현될 수 있다.
하나 이상의 출력 장치(624)도 도시된 예시의 인터페이스 회로(620)에 연결된다. 출력 장치(624)는 예컨대, 디스플레이 장치(예컨대, LED(light emitting diode), OLED(organic light emitting diode), 액정 디스플레이, CRT(cathode ray tube) 디스플레이, 터치스크린, 촉각 출력 디스플레이, 프린터 및/또는 스피커)에 의해 구현될 수 있다. 도시된 예시의 인터페이스 회로(620)는 따라서 일반적으로 그래픽 드라이버 카드, 그래픽 드라이버 칩 및/또는 그래픽 드라이버 프로세서를 포함한다.
도시된 예시의 인터페이스 회로(620)는 외부 장치(예컨대, 임의의 종류의 컴퓨팅 장치)와 네트워크(626)(예컨대, 이더넷 연결, DSL(digital subscriber line), 전화선, 동축 케이블, 휴대 전화 시스템 등)를 통해 데이터의 교환을 가능하게 하기 위해 송신기, 수신기, 송수신기, 모뎀 및/또는 네트워크 인터페이스 카드와 같은 통신 장치도 포함한다.
도시된 예시의 프로세서 플랫폼(600)은 소프트웨어 및/또는 데이터를 저장하기 위한 하나 이상의 대용량 저장 장치(628)도 포함한다. 이러한 대용량 저장 장치(628)의 예시는 플로피 디스크 드라이브, 하드 드라이브 디스크, CD 드라이브, Blu-ray 디스크 드라이브, RAID(redundant array of independent disks) 시스템 및 DVD 드라이브를 포함한다.
도 3-5의 코딩된 명령어(632)는 대용량 저장 장치(628), 휘발성 메모리(614), 비휘발성 메모리(616) 및/또는 CD나 DVD와 같은 탈착식 유형 컴퓨터 판독가능한 저장 매체에 저장될 수 있다.
상기로부터, 상이한 초기 볼륨 특성을 가지는 미디어가 미디어의 원래 다이나믹을 변경하지 않고 대략 동일한 볼륨으로 재생될 수 있도록 미디어의 볼륨을 조절하는 방법, 장치 및 제조 물품의 예시가 개시되었음을 이해할 것이다. 볼륨 균일화의 종래의 구현이 계속 볼륨을 조절하고 결과적으로 오디오 신호의 인지 가능한 변화를 야기하지만, 본 명세서에 개시된 예시는 미디어에 관한 메타데이터에 기반한 평균 게인값에 의한 조절을 사용한 볼륨 균일화를 가능하게 한다. 나아가, 본 명세서에 개시된 예시는 오디오 신호와 적절한 평균 게인이 원래 계산된 대응하는 메타데이터 미디어 간에 차이가 있는 경우 트랙의 볼륨을 조절하기 위한 실시간 모니터링을 위한 기술을 서술한다. 이러한 기술은 사용자에게 인지 불가능하고 다른 또는 유사한 소스의 다른 미디어가 끊김 없는 미디어 제시 경험을 위해 실질적으로 동일한 볼륨으로 재생될 수 있게 하므로 종래의 구현보다 유리하다.
오디오 볼륨을 조절하기 위한 장치의 예시가 개시된다. 장치의 예시는 오디오 신호에 표현되는 미디어를 식별하는 오디오 신호 식별기, 오디오 신호의 미디어를 식별하는데 응답하여 미디어와 연관된 메타데이터에 접근하고, 메타데이터에 기반하여, 미디어에 대한 평균 볼륨을 결정하는 메타데이터 접근기를 포함한다. 장치의 예시는 평균 게인값에 기반하여 오디오 신호의 출력 볼륨을 조절하는 볼륨 조절기를 포함하고, 평균 게인값은 미디어에 대한 평균 볼륨에 기반하여 결정된다.
일부 예시에서, 장치의 예시는 오디오 신호의 샘플의 평균 측정된 볼륨 및 지정된 기간에 대한 원하는 볼륨 레벨 간의 차이를 결정하는 실시간 오디오 모니터를 더 포함하고, 볼륨 조절기는 제2 게인값에 기반하여 오디오 신호의 볼륨을 조절하고, 제2 게인값은 차이에 기반한다.
일부 예시에서, 평균 게인값은 오디오 신호에 적용되는 초기 볼륨 조절이고 제2 게인값은 오디오 신호에 적용되는 후속 볼륨 조절이다.
일부 예시에서, 장치의 예시는 오디오 신호 식별기가 오디오 신호에 표현되는 미디어를 식별하지 못할 때 오디오 신호를 압축하는 다이나믹 레인지 압축기를 더 포함한다.
일부 예시에서, 장치의 예시는 오디오 신호를 버퍼링하는 오디오 신호 접근기를 더 포함하고, 버퍼링은 미디어를 식별하고, 메타데이터에 접근하고, 평균 볼륨을 결정하기 위한 시간을 제공하기 위해 오디오 신호를 출력하는데 있어 지연을 야기한다.
일부 예시에서, 평균 게인값은 안전한 청취 볼륨 범위에 기반하여 결정된다.
일부 예시에서, 평균 게인값은 오디오 신호의 소스 타입에 대한 과거 볼륨 설정에 기반하여 결정된다.
비일시적 컴퓨터 판독 가능한 저장 매체가 본 명세서에 개시된다. 비일시적 컴퓨터 판독 가능한 저장 매체는 컴퓨터 판독 가능한 명령어를 포함하고, 명령어는 실행될 때 프로세서로 하여금 적어도 오디오 신호에 표현되는 미디어를 식별하고, 오디오 신호의 미디어를 식별하는데 응답하여 미디어와 연관된 메타데이터에 접근하고, 메타데이터에 기반하여, 미디어에 대한 평균 볼륨을 결정하고, 평균 게인값에 기반하여 오디오 신호의 출력 볼륨을 조절하도록 야기하고, 평균 게인값은 미디어에 대한 평균 볼륨에 기반하여 결정된다.
일부 예시에서, 컴퓨터 판독 가능한 명령어는 실행될 때 프로세서로 하여금 오디오 신호의 샘플의 평균 측정된 볼륨 및 지정된 기간에 대한 원하는 볼륨 레벨 간의 차이를 결정하고, 제2 게인값에 기반하여 오디오 신호의 볼륨을 조절하도록 더 야기하고, 제2 게인값은 차이에 기반한다.
일부 예시에서, 평균 게인값은 오디오 신호에 적용되는 초기 볼륨 조절이고 제2 게인값은 오디오 신호에 적용되는 후속 볼륨 조절이다.
일부 예시에서, 컴퓨터 판독 가능한 명령어는 실행될 때 프로세서로 하여금 오디오 신호에 표현되는 미디어가 식별되지 않을 때 오디오 신호를 압축하도록 야기한다.
일부 예시에서, 컴퓨터 판독 가능한 명령어는 실행될 때 프로세서로 하여금 오디오 신호를 버퍼링하도록 야기하고, 버퍼링은 미디어를 식별하고, 메타데이터에 접근하고, 평균 볼륨을 결정하기 위한 시간을 제공하기 위해 오디오 신호를 출력하는데 있어 지연을 야기한다.
일부 예시에서, 평균 게인값은 안전한 청취 볼륨 범위에 기반하여 결정된다.
일부 예시에서, 평균 게인값은 오디오 신호의 소스 타입에 대한 과거 볼륨 설정에 기반하여 결정된다.
본 명세서에 개시되는 방법의 예시는 오디오 신호에 표현되는 미디어를 식별하는 단계, 오디오 신호의 미디어를 식별하는데 응답하여 미디어와 연관된 메타데이터에 접근하는 단계, 메타데이터에 기반하여, 미디어에 대한 평균 볼륨을 결정하는 단계, 및 평균 게인값에 기반하여 오디오 신호의 출력 볼륨을 조절하는 단계를 포함하고, 평균 게인값은 미디어에 대한 평균 볼륨에 기반하여 결정된다.
일부 예시에서, 방법은 오디오 신호의 샘플의 평균 측정된 볼륨 및 지정된 기간에 대한 원하는 볼륨 레벨 간의 차이를 결정하는 단계, 및 제2 게인값에 기반하여 오디오 신호의 볼륨을 조절하는 단계를 더 포함하고, 제2 게인값은 차이에 기반한다.
일부 예시에서, 평균 게인값은 오디오 신호에 적용되는 초기 볼륨 조절이고 제2 게인값은 오디오 신호에 적용되는 후속 볼륨 조절이다.
일부 예시에서, 방법은 오디오 신호에 표현되는 미디어가 식별되지 않을 때 오디오 신호를 압축하는 단계를 더 포함한다.
일부 예시에서, 방법은 오디오 신호를 버퍼링하는 단계를 더 포함하고, 버퍼링은 미디어를 식별하고, 메타데이터에 접근하고, 평균 볼륨을 결정하기 위한 시간을 제공하기 위해 오디오 신호를 출력하는데 있어 지연을 야기한다.
일부 예시에서, 평균 게인값은 안전한 청취 볼륨 범위에 기반하여 결정된다.
특정 방법, 장치 및 제조 물품의 예시가 본 명세서에 개시되었지만, 본 특허의 범위는 이에 제한되지 않는다. 반면, 본 특허는 본 특허의 청구범위에 정당하게 속하는 모든 방법, 장치 및 제조 물품을 포함한다.

Claims (20)

  1. 오디오 신호가 장치를 통해 출력됨에 따라 오디오 신호의 볼륨을 모니터링하는 단계;
    오디오 신호의 평균 볼륨을 결정하는 단계;
    오디오 신호의 평균 볼륨이 지정된 기간에 대해 볼륨 임계치를 충족하는지 여부를 결정하는 단계;
    오디오 신호의 평균 볼륨이 지정된 기간에 대해 볼륨 임계치를 충족하지 않는다고 결정하는데 응답하여, 평균 볼륨과 원하는 볼륨 간의 차이를 결정하는 단계; 및
    오디오 신호의 볼륨을 원하는 볼륨으로 조정하기 위하여 오디오 신호에 게인을 적용하는 단계를 포함하고,
    게인은 평균 볼륨과 원하는 볼륨 간의 차이에 기반하여 결정되는 방법.
  2. 청구항 1에 있어서,
    오디오 신호가 장치를 통해 출력되기 전에 오디오 신호에 표현되는 미디어가 식별 불가능할 때 오디오 신호를 압축하는 단계를 더 포함하는 방법.
  3. 청구항 1에 있어서,
    오디오 신호를 출력하는데 지연을 야기하기 위하여 오디오 신호를 버퍼링하는 단계를 더 포함하는 방법.
  4. 청구항 1에 있어서,
    오디오 신호가 장치를 통해 출력되기 전에 오디오 신호의 평균 볼륨을 조정하기 위하여 오디오 신호에 제2 게인을 적용하는 단계를 더 포함하는 방법.
  5. 청구항 4에 있어서,
    제2 게인은 오디오 신호의 평균 볼륨에 기반하여 결정되는 방법.
  6. 청구항 1에 있어서,
    임계 기간에 대해 오디오 신호를 모니터링하는 단계를 더 포함하는 방법.
  7. 청구항 1에 있어서,
    임계 기간에 걸쳐 오디오 신호를 모니터링하는 단계를 더 포함하는 방법.
  8. 프로세서; 및
    프로그램 명령어를 저장한 비일시적 컴퓨터 판독 가능한 저장매체를 포함하는 컴퓨팅 장치로서,
    프로그램 명령어는 프로세서에 의하여 실행될 때:
    오디오 신호가 장치를 통해 출력됨에 따라 오디오 신호의 볼륨을 모니터링하는 단계;
    오디오 신호의 평균 볼륨을 결정하는 단계;
    오디오 신호의 평균 볼륨이 지정된 기간에 대해 볼륨 임계치를 충족하는지 여부를 결정하는 단계;
    오디오 신호의 평균 볼륨이 지정된 기간에 대해 볼륨 임계치를 충족하지 않는다고 결정하는데 응답하여, 평균 볼륨과 원하는 볼륨 간의 차이를 결정하는 단계; 및
    오디오 신호의 볼륨을 원하는 볼륨으로 조정하기 위하여 오디오 신호에 게인을 적용하는 단계를 포함하는 제1 세트의 동작의 수행을 야기하고,
    게인은 평균 볼륨과 원하는 볼륨 간의 차이에 기반하여 결정되는 컴퓨팅 장치.
  9. 청구항 8에 있어서,
    오디오 신호가 장치를 통해 출력되기 전에 오디오 신호에 표현되는 미디어가 식별 불가능할 때 오디오 신호를 압축하는 단계를 더 포함하는 컴퓨팅 장치.
  10. 청구항 8에 있어서,
    오디오 신호를 출력하는데 지연을 야기하기 위하여 오디오 신호를 버퍼링하는 단계를 더 포함하는 컴퓨팅 장치.
  11. 청구항 8에 있어서,
    오디오 신호가 장치를 통해 출력되기 전에 오디오 신호의 평균 볼륨을 조정하기 위하여 오디오 신호에 제2 게인을 적용하는 단계를 더 포함하는 컴퓨팅 장치.
  12. 청구항 11에 있어서,
    제2 게인은 오디오 신호의 평균 볼륨에 기반하여 결정되는 컴퓨팅 장치.
  13. 청구항 8에 있어서,
    임계 기간에 대해 오디오 신호를 모니터링하는 단계를 더 포함하는 컴퓨팅 장치.
  14. 청구항 1에 있어서,
    임계 기간에 걸쳐 오디오 신호를 모니터링하는 단계를 더 포함하는 컴퓨팅 장치.
  15. 프로그램 명령어를 저장한 비일시적 컴퓨터 판독 가능한 저장매체로서,
    프로그램 명령어는 프로세서에 의하여 실행될 때:
    오디오 신호가 장치를 통해 출력됨에 따라 오디오 신호의 볼륨을 모니터링하는 단계;
    오디오 신호의 평균 볼륨을 결정하는 단계;
    오디오 신호의 평균 볼륨이 지정된 기간에 대해 볼륨 임계치를 충족하는지 여부를 결정하는 단계;
    오디오 신호의 평균 볼륨이 지정된 기간에 대해 볼륨 임계치를 충족하지 않는다고 결정하는데 응답하여, 평균 볼륨과 원하는 볼륨 간의 차이를 결정하는 단계; 및
    오디오 신호의 볼륨을 원하는 볼륨으로 조정하기 위하여 오디오 신호에 게인을 적용하는 단계를 포함하는 제1 세트의 동작의 수행을 야기하고,
    게인은 평균 볼륨과 원하는 볼륨 간의 차이에 기반하여 결정되는 비일시적 컴퓨터 판독 가능한 저장매체.
  16. 청구항 15에 있어서,
    오디오 신호가 장치를 통해 출력되기 전에 오디오 신호에 표현되는 미디어가 식별 불가능할 때 오디오 신호를 압축하는 단계를 더 포함하는 비일시적 컴퓨터 판독 가능한 저장매체.
  17. 청구항 15에 있어서,
    오디오 신호를 출력하는데 지연을 야기하기 위하여 오디오 신호를 버퍼링하는 단계를 더 포함하는 비일시적 컴퓨터 판독 가능한 저장매체.
  18. 청구항 15에 있어서,
    오디오 신호가 장치를 통해 출력되기 전에 오디오 신호의 평균 볼륨을 조정하기 위하여 오디오 신호에 제2 게인을 적용하는 단계를 더 포함하는 비일시적 컴퓨터 판독 가능한 저장매체.
  19. 청구항 18에 있어서,
    제2 게인은 오디오 신호의 평균 볼륨에 기반하여 결정되는 비일시적 컴퓨터 판독 가능한 저장매체.
  20. 청구항 15에 있어서,
    임계 기간에 대해 오디오 신호를 모니터링하는 단계를 더 포함하는 비일시적 컴퓨터 판독 가능한 저장매체.

KR1020237008663A 2018-01-07 2019-01-07 볼륨 조절을 위한 방법 및 장치 KR102663452B1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201862614439P 2018-01-07 2018-01-07
US62/614,439 2018-01-07
PCT/US2019/012524 WO2019136371A1 (en) 2018-01-07 2019-01-07 Methods and apparatus for volume adjustment
KR1020207022939A KR102510899B1 (ko) 2018-01-07 2019-01-07 볼륨 조절을 위한 방법 및 장치

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020207022939A Division KR102510899B1 (ko) 2018-01-07 2019-01-07 볼륨 조절을 위한 방법 및 장치

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020247014299A Division KR20240067965A (ko) 2018-01-07 2019-01-07 볼륨 조절을 위한 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20230038820A true KR20230038820A (ko) 2023-03-21
KR102663452B1 KR102663452B1 (ko) 2024-05-08

Family

ID=67139910

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020207022939A KR102510899B1 (ko) 2018-01-07 2019-01-07 볼륨 조절을 위한 방법 및 장치
KR1020237008663A KR102663452B1 (ko) 2018-01-07 2019-01-07 볼륨 조절을 위한 방법 및 장치

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020207022939A KR102510899B1 (ko) 2018-01-07 2019-01-07 볼륨 조절을 위한 방법 및 장치

Country Status (6)

Country Link
US (4) US10778168B2 (ko)
EP (1) EP3735742A4 (ko)
JP (1) JP7071508B2 (ko)
KR (2) KR102510899B1 (ko)
CN (1) CN112020827A (ko)
WO (1) WO2019136371A1 (ko)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014145153A2 (en) * 2013-03-15 2014-09-18 Neeley John Automatic recording and graphing of measurement data
KR102510899B1 (ko) 2018-01-07 2023-03-16 그레이스노트, 인코포레이티드 볼륨 조절을 위한 방법 및 장치
US11347470B2 (en) 2018-11-16 2022-05-31 Roku, Inc. Detection of media playback loudness level and corresponding adjustment to audio during media replacement event
US10797902B2 (en) * 2018-12-19 2020-10-06 At&T Intellectual Property I, L.P. Control of network-connected devices in accordance with group preferences
FR3099606A1 (fr) * 2019-07-31 2021-02-05 Psa Automobiles Sa Procédé de gestion du volume sonore du dispositif d’info-divertissement d’un véhicule
US11044559B2 (en) * 2019-10-08 2021-06-22 Dish Network L.L.C. Systems and methods for facilitating configuration of an audio system
US11380344B2 (en) 2019-12-23 2022-07-05 Motorola Solutions, Inc. Device and method for controlling a speaker according to priority data
CN111163226B (zh) * 2019-12-27 2021-06-08 华为技术有限公司 音量调节方法、设备和系统
CN113345447B (zh) * 2021-08-09 2021-10-29 北京百瑞互联技术有限公司 防止广告干扰的音频编解码方法、系统、发射器及接收器
US11848655B1 (en) * 2021-09-15 2023-12-19 Amazon Technologies, Inc. Multi-channel volume level equalization based on user preferences
CN116546386A (zh) * 2022-01-26 2023-08-04 瑞声光电科技(常州)有限公司 车内自适应音质输出方法、装置、存储介质及车载音响系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050021700A (ko) * 2003-08-25 2005-03-07 엘지전자 주식회사 디지털 오디오 기기에서의 오디오 출력 레벨 조절장치 및방법
KR20110039560A (ko) * 2008-07-29 2011-04-19 엘지전자 주식회사 오디오 신호의 처리 방법 및 장치
KR20150086263A (ko) * 2012-11-19 2015-07-27 하만인터내셔날인더스트리스인코포레이티드 오디오 라우드니스 제어 시스템
JP2016523006A (ja) * 2013-03-26 2016-08-04 ドルビー ラボラトリーズ ライセンシング コーポレイション ボリューム平準化器コントローラおよび制御方法

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0444004A (ja) 1990-06-12 1992-02-13 Asahi Optical Co Ltd 相対する二面が反射面であるポリゴンミラー及びその取付構造
JPH0444004U (ko) * 1990-08-18 1992-04-14
JP2003348682A (ja) 2002-05-24 2003-12-05 Mitsubishi Electric Corp 自動音量調整回路
JP2009021834A (ja) 2007-07-12 2009-01-29 Victor Co Of Japan Ltd 音量調整装置
JP5120288B2 (ja) 2009-02-16 2013-01-16 ソニー株式会社 音量補正装置、音量補正方法、音量補正プログラムおよび電子機器
JP2010258776A (ja) 2009-04-24 2010-11-11 Canon Inc 音声信号処理装置
JP5585401B2 (ja) 2010-11-09 2014-09-10 ソニー株式会社 再生装置、再生方法、提供装置および再生システム
WO2013068637A1 (en) 2011-11-08 2013-05-16 Nokia Corporation A method and an apparatus for automatic volume leveling of audio signals
JP5832925B2 (ja) 2012-02-15 2015-12-16 株式会社タムラ製作所 番組ラウドネス自動管理システム及びその自動管理方法
KR102016901B1 (ko) * 2013-01-21 2019-09-02 돌비 레버러토리즈 라이쎈싱 코오포레이션 상이한 재생 디바이스들에 걸친 라우드니스 및 동적 범위의 최적화
US9559651B2 (en) * 2013-03-29 2017-01-31 Apple Inc. Metadata for loudness and dynamic range control
US9755605B1 (en) * 2013-09-19 2017-09-05 Amazon Technologies, Inc. Volume control
US9301077B2 (en) 2014-01-02 2016-03-29 Harman International Industries, Incorporated Context-based audio tuning
AU2016279775A1 (en) 2015-06-17 2018-01-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Loudness control for user interactivity in audio coding systems
US9859858B2 (en) 2016-01-19 2018-01-02 Apple Inc. Correction of unknown audio content
US10397663B2 (en) 2016-04-08 2019-08-27 Source Digital, Inc. Synchronizing ancillary data to content including audio
KR102510899B1 (ko) 2018-01-07 2023-03-16 그레이스노트, 인코포레이티드 볼륨 조절을 위한 방법 및 장치

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050021700A (ko) * 2003-08-25 2005-03-07 엘지전자 주식회사 디지털 오디오 기기에서의 오디오 출력 레벨 조절장치 및방법
KR20110039560A (ko) * 2008-07-29 2011-04-19 엘지전자 주식회사 오디오 신호의 처리 방법 및 장치
KR20150086263A (ko) * 2012-11-19 2015-07-27 하만인터내셔날인더스트리스인코포레이티드 오디오 라우드니스 제어 시스템
JP2016523006A (ja) * 2013-03-26 2016-08-04 ドルビー ラボラトリーズ ライセンシング コーポレイション ボリューム平準化器コントローラおよび制御方法

Also Published As

Publication number Publication date
CN112020827A (zh) 2020-12-01
US11824507B2 (en) 2023-11-21
EP3735742A4 (en) 2021-09-22
US20200412313A1 (en) 2020-12-31
JP2021510038A (ja) 2021-04-08
US11545949B2 (en) 2023-01-03
KR102663452B1 (ko) 2024-05-08
US20190214954A1 (en) 2019-07-11
KR102510899B1 (ko) 2023-03-16
US20230216461A1 (en) 2023-07-06
WO2019136371A1 (en) 2019-07-11
JP7071508B2 (ja) 2022-05-19
US10778168B2 (en) 2020-09-15
EP3735742A1 (en) 2020-11-11
KR20200108872A (ko) 2020-09-21
US20240039498A1 (en) 2024-02-01

Similar Documents

Publication Publication Date Title
KR102510899B1 (ko) 볼륨 조절을 위한 방법 및 장치
JP7397066B2 (ja) オーディオ分類を介した動的な音量調整のための方法、コンピュータ可読記憶媒体及び装置
US10178492B2 (en) Apparatus, systems and methods for adjusting output audio volume based on user location
US11611800B2 (en) Methods and apparatus for audio equalization
US20210160615A1 (en) Methods and apparatus for audio equalization based on variant selection
US20220200556A1 (en) Methods and apparatus to determine automated gain control parameters for an automated gain control protocol
US11750769B2 (en) Methods and apparatus to perform an automated gain control protocol with an amplifier based on historical data corresponding to contextual data
US11775250B2 (en) Methods and apparatus for dynamic volume adjustment via audio classification
KR20240067965A (ko) 볼륨 조절을 위한 방법 및 장치

Legal Events

Date Code Title Description
A107 Divisional application of patent
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
X091 Application refused [patent]
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant