KR20020073604A - 프라이머리와 세컨더리 오디오 시그널을 조정하기 위한시스템 - Google Patents

프라이머리와 세컨더리 오디오 시그널을 조정하기 위한시스템 Download PDF

Info

Publication number
KR20020073604A
KR20020073604A KR1020027011521A KR20027011521A KR20020073604A KR 20020073604 A KR20020073604 A KR 20020073604A KR 1020027011521 A KR1020027011521 A KR 1020027011521A KR 20027011521 A KR20027011521 A KR 20027011521A KR 20020073604 A KR20020073604 A KR 20020073604A
Authority
KR
South Korea
Prior art keywords
audio
vra
signal
pcpv
scra
Prior art date
Application number
KR1020027011521A
Other languages
English (en)
Other versions
KR100799155B1 (ko
Inventor
보드레이마이클에이
사운더스윌리암알
Original Assignee
히어링 인핸스먼트 컴패니 엘엘씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 히어링 인핸스먼트 컴패니 엘엘씨 filed Critical 히어링 인핸스먼트 컴패니 엘엘씨
Publication of KR20020073604A publication Critical patent/KR20020073604A/ko
Application granted granted Critical
Publication of KR100799155B1 publication Critical patent/KR100799155B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
  • Stereophonic System (AREA)

Abstract

본 발명은 오디오 프로덕션 과정의 다른 부분에서 보이스와 리메이닝 오디오 정보의 삽입을 가능케 하는 것이다. 더욱 상세하게는 본 발명은 VRA-가능한 디지털 마스터링(510)을 위한 특별한 기술을 구체화하고 있고 AC3 압축 포맷보다 크거나 동일한 비교할만하게 유지되는 코덱에 대해 비교할 정도로 적은 오디오 데이터의 손상을 유지시킬 수 있는 오디오 압축 포맷 방법에 의한 VRA의 수용을 가능케 한다. 본 발명은 최종 사용자가 전체 디지털 오디오 시스템의 다수 부분의 새로운 형태의 포커싱에 의해 디지털 오디오 매체 포맷의 플레이백을 보이스-투 리메이닝 오디오(VRA) 조정(535)할 수 있는 것을 가능케 한다. 그러므로 이러한 새로운 기술은 프로그램 중에 오디오 콘텐트의 나머지 부분에 대해 오디오 프로그램의 콘텐트인 음성/대화 부분에 비율을 조절함을 원하는 최종 수요자에게 편의를 제공하기 위한 것이다.

Description

프라이머리와 세컨더리 오디오 시그널을 조정하기 위한 시스템{A system for accommodating primary and secondary audio signal}
최근 광범위하게 보급된 디지털 오디오 파일 보관, 압축, 인코딩, 전송, 디코딩, 그리고 재생의 결합은 디지털 오디오 프로세스의 사실상 모든 스테이지에서 새로운 기회의 가능성으로 인도하고 있다. 보이스-투-리메이닝 오디오(VRA)의 선호 비율이 서로 다른 사람마다 그리고 서로 다른 형태의 미디어 프로그램(스포츠프로그램 vs 음악 등)에 따라 명확히 다르다는 것이 최근에 드러났다. 2000년 1월 브룸의 HEC 테크니컬 리포트 No.1 "프리-레코디드보이스-투-리메이닝 오디오 청취자 선호에 관한 연구"를 보라.
명확하게, VRA는 보컬 볼륨을 리메이닝 오디오 볼륨의 조정을 독립적으로 분리 조정함으로써 오디오 프로그램의 보이스-투-리메이닝 오디오 레이쇼의 개인적인 조정과 관계된다. 독립적으로 사용자-조정된 보이스 오디오 정보는 독립적으로 사용자 조정된 리메이닝 오디오 정보와 결합되고, 토탈 볼륨 조정이 적용될 플레이백 디바이스에 보내진다. 이 테크닉은 각각 개인의 청취 능력이 그들의 시각능력이 명확히 다른것과 같을것이라는 발견에 의해 동기부여 되었고, 그것에 의해 보컬과 백그라운드 컨텐츠의 개인적인 선호로 이어진 것이다. 결론은 오디오 프로그램에서 VRA 기능에 대한 필요성은 각각의 그리고 모든 사람에게 최적의 시각특성을 제공하기 위한 넓은 범위의 규정된 렌즈를 필요로 하는 것과 같은 기본적인 것이다.
발명의 요약
본 발명은 오디오 프로덕션 프로세스의 다른 파트에서 보이스와 리메이닝 오디오 정보를 포함할 수 있다. 특히, 본 발명은 어떤 코덱과 비교해서도 오디오 데이터의 손실이 적게 유지될수 있고, 총 손실이 AC3 압축포맷과 비슷하거나 더 크게 유지되는 그런 종류의 오디오 압축 포맷에 의하여 VRA능력이 있는 디지털 매스터링과 VRA의 조정을 위한 특별한 테크닉을 구체화한다.
본 발명은 디지털 오디오 미디어 포맷의 재생시 전체 디지털 오디오 시스템의 다중 부분의 새로운 구성에 초점을 둠으로써 최종청취자의 보이스-투-리메이닝 오디오(VRA)조정을 용이하게 하고, 그것으로 그 프로그램에서 오디오 프로그램의 주요 보컬/대화 컨텐트와 관계된 오디오 컨텐트의 잔여 부분의 비율을 제어하고자 바라는 오디오 최종-사용자(최종-청취자)에게 유익하도록 새로운 기술이 가능하게 된다. 특별한 발명의 동기인 문제점을 두 가지 상술한다. 첫째, VRA 조정을 가능하게 하는 두가지 시그널의 구조를 위한 오디오 프로그램 프로덕션 경로에서 최고의 위치에 대한 다른 의견이 있을 것이라는 것을 깨닫게 되는 것이다.
둘째, 광학적 오디오 압축 포맷, 오디오 파일 저장 요구, 오디오 방송 전환 비트 레이트, 오디오 스트리밍 비트 레이트, 그리고 최종 청취자에게 최종적으로 전달되는 보컬과 리메이닝 오디오 콘텐츠의 자각된 청취 음질 간의 교환이 있을 것이다. 최종청취자에게 VRA를 제공하는 궁극적인 목적을 위하여 이 두가지 문제점에 대한 다양한 솔루션이 새로운 또는 존재하는 디지털 매스터링, 오디오 압축, 인코딩, 파일 저장, 전송, 그리고 디코딩 테크닉을 포함한 새로운 실시태양을 통한 본 발명에 의해 제안된다.
덧붙여, 본 발명은 오디오 프로그램이 소위 순수 보이스 오디오 컨텐트와 리메이닝 오디오 컨텐트로 제작되어 저장 그리고/또는 전송하기 위하여 쉽게 규격화 되기 위해 다양한 방법으로 적용될 수 있을 것이다. 이런 방법으로, 레코딩 프로세스는 오디오 프로덕션 프로세스의 완전한 구성요소로 고려되고 있다. 새로운 오디오 컨텐트는 명백한 방법으로 최종 청취자에게 전달되고, 오디오 시그널의 디지털 저장 그리고/또는 전송에 사용될 특별한 오디오 압축 알고리즘에 상관없다. 이것은 사실 어느 코덱에서도 보이스와 리메이닝 오디오 정보의 포함을 요구할 것이다. 그러므로, 본 발명은 유일한 디지털 매스터링 프로세스와 많은 상황에서 사용된 손실없는 그리고 최소한으로 손실되는 압축 알고리즘과 호환되는 압축되지 않은 저장 포맷을 규정한다.
본 발명의 실시태양은 VRA 인코딩과 VRA 디코딩을 위한 요구 특성에 중점을 둔다. 오디오 코덱사이의 공통성 때문에, 아래에서 제공하는 모든 서술은 VRA 기능성을 방송 미디어(텔레비전 또는 웹캐스팅과 같은), 스트리밍 오디오, CD 오디오, 또는 DVD 오디오를 위해 동등하게 같다. 본 발명은 오디오 프로그램, 인클루딩 필름, 다큐멘터리, 비디오, 음악, 그리고 스포츠 이벤트의 모든 형태를 위해 의도되었다.
이것과 본 발명의 다른 장점과 특성은 하기에 명백하게 될 것이다, 본 발명의 본질은 발명의 상세한 설명, 부가된 청구항과 첨부된 몇몇 도면에 따르는 참고자료에 의해 명확히 이해될 것이다.
본 출원은 "디지털 오디오 생성 프로세스에서의 주요 컨텐트(순수 음성)와 그 외 컨텐트 리메이닝 오디오 용량을 조절하기 위한 테크닉"이라는 발명의 명칭으로 2000년 3월 2일 출원된 잠정특허출원 60/186,357의 우선권을 주장하는 것이다.
본 발명은 오디오 시그널 프로세싱과 관련하여, 특히, 개인 청취자의 요구부분의 오디오 시그널의 향상에 관한 것이다.
도 1 은 일반적인 디지털 매스터링 스트럭쳐를 나타내는 다이어그램이다.
도 2a는 2채널 VRA기능의 디지털 매스터 오디오 테이프를 위한 프리-믹스 실시태양을 나타내는 다이어그램이다.
도 2b는 2채널 VRA기능의 디지털 매스터 오디오 테이프를 위한 포스트-믹스 실시태양을 나타내는 다이어그램이다.
도 3은 SCRA 다운-믹스 파라미터를 이용한 단일 채널 VRA기능의 디지털 매스터 오디오 테이프를 위한 프리-믹스 실시태양을 나타내는 다이어그램이다.
도 4a∼e는 VRA-기능 디지털 매스터 테이프 또는 파일의 다양한 실시태양을 나타내는 다이어그램이다.
도 5는 VRA 코덱의 예시적인 다이어그램이다.
도 6은 1-채널 VRA-기능의, 압축되지 않은 디지털 매스터를 위한 VRA 코덱의 예시적인 다이어그램이다.
도 7은 2-채널 VRA-기능의 압축되지 않은 디지털 매스터르 위한 VRA 코덱의 예시적인 다이어그램이다.
도 8은 VRA-기능 인코더의 다른 가능한 실시태양을 나타내는 예시적인 다이어그램을 나타낸다.
도 9는 VRA-기능 인코더의 다른 가능한 실시태양을 나타내는 예시적인 다이어그램을 나타낸다.
도 10은 VRA-기능 인코더의 다른 가능한 실시태양을 나타내는 예시적인 다이어그램을 나타낸다.
도 11은 VRA-기능 인코더의 다른 가능한 실시태양을 나타내는 예시적인 다이어그램을 나타낸다.
도 12는 VRA-기능 인코더의 다른 가능한 실시태양을 나타내는 예시적인 다이어그램을 나타낸다.
도 13은 디지털 비트스트림을 수신하고 시그널을 두 개의 오디오 파트로 디코딩하는 VRA포맷 디코더를 나타낸다.
도 14는 본 발명의 예시적인 오디오 시그널 프로세싱 시스템의 다이어그램이다.
VRA 조정은 청취 손실의 다양한 형태를 위한 해결책으로 사용될 수 있다. 청력학 전문가들은 청력이 손상된 청취자가 백그라운드 사운드의 '오염'없이 흥미있는 청각 시그널을 수신할 수 있는 최적의 솔루션을 빨리 찾아낼 것이다. 그러므로, VRA 특성은 청각이 손실된 개인의 생활을 향상시킬 것으로 기대될 수 있다. 그러나, 최근의 조사에서 사실적으로 인구의 모든 세그먼트에서 선호 시그널(예를 들어, 스포츠 아나운서의 음성)과 리메이닝 오디오 시그널(예를 들어, 군중의 백그라운드노이즈)의 최적의 믹스에 중요한 변화가 증명되었다. '청취의 상이점'을 위한 이 필요성의 증명은 전 지구상의 수많은 인류의 상이점과 일관성이 있다.
이 발견은 디지털 오디오의 출현이 고품질 오디오 정보의 많은 양 뿐만아니라 오디오 제어 정보(또는 메타데이터)를 청취자에게 송신하는 것이 가능하게 된 그때 이루어졌다. 불행하게도, 디지털 오디오에서 VRA 특성의 혼합은 어떤 미디어 폼에서도 제공되지 않는다. 이 분야에서의 작업은 ATSC AC3 디지털 오디오 표준의 부가적인 파트로 구성되는 '청취력 손실자 합동 서비스'라고 불리는 의미에 한정되어 왔다. 1995년 ATSC의 리포트인 "A-54: AC3의 사용 가이드"를 보면, 청취력이 손실된 사람이 얼마나 오직 보컬 컨텐트의 특별히 선호되는 시그널의 수신을바라는지 묘사된 짧은 문단을 포함하고 있다. AC3 비트스트림의 부분으로써, 그리고 보컬컨텐트의 혼합 , 조정된 볼륨으로, ATSC-명기된 비트스트림의 부분으로 일반적으로 전환된 다른 오디오 채널(메인 오디오 서비스)와 함께. A-54 문서에서 언급된 AC3오디오 포맷은 '퍼셉츄얼 코딩' 압축 포맷으로 디지털 오디오 전문가들에 의해 주목받는 돌비 랩의 압축알고리즘에 기반을 둔 것으로 잘 알려져 있다. 퍼셉추얼 코딩 알고리즘은 저장된 파일의 저장용량을 감소시키고 HDTV같은 실시간 방송에서 전송되어야할 정보의 양을 감소시키기 위하여 오리지널 오디오 시그널 컨텐트의 몇 퍼센트를 버리도록 설계되었다. 이 버려진 오디오 데이터는 알고리즘이 귀가 들을 수 없는 영역의 데이터만을 제거하도록 시도하기 때문에 청취자에 의해 인식되지 않는 것으로 가정되었다. 불행하게도, 퍼셉추얼 코딩 알고리즘은 그같은 오디오 컨텐트가 버려진 뒤에 유지되는 궁극적인 청취 음질에 관한 오랜 논쟁의 주제가 되어 왔다.
어떤 오디오 프로그램에서도 VRA 기능을 제공하기 위한 기본적인 이유의 하나는 제공되는 보이스와 리메이닝 오디오의 믹스-다운 비율을 이해 또는 즐기도록 강요당하는 최종사용자의 이해와 청취의 즐거움을 향상시키기 위한 것이다. AC3와 같은 매우 로시(lossy)한 압축알고리즘이 사용이 순수한 음성에 제안되었을 때, 음성의 음질은 필연적으로 감소한다. AC3 퍼셉추얼 코딩 알고리즘은 거의 12:1의 압축비로 이루어진다. 이는 오리지널 오디오 컨텐트는 정보의 12 오리지널 비트를 단지 1비트로 유지된다는 것을 의미한다. 이것은 VRA 특성의 포함을 위한 주요목적은 그 같은 로시 압축 알고리즘으로 조합된 오디오 음질에서 상당한 손실의 정도에 의해 논쟁에서 거의 틀림없이 지게 된다는 것을 의미한다
그러므로, 모든 로스리스 또는 상대적인 로스리스, 디지털 오디오 코덱에서 에서 보이스 음질에 관한 최종 결정을 위하여 최종사용자들은 VRA 조정에서 기꺼이 받아들이고자하는 VRA 혼합 테크닉을 위한 압도적인 요구가 있고, 어떤 디지털 오디오 세팅에서도 소비자(최종사용자 같은)에게 VRA 능력의 명백한 분배를 보증하는 실시태양의 논의에 앞서, 명백한 분배는 최종 청취자에게 VRA 능력을 제공하는 행위를, 특별한 오디오 포맷(MP3,DTS,Real Audio 등의)에도 불구하고 최종사용자의 플레이백 기기에 오디오프로그램을 저장/전송하곤 한다.
이 구조는 프로세스가 오디오 프로그램을 생성하는 모든 부분에 의한 아티스틱 메리트의 최소 손실을 보장하기 위해 이것은 필름, 음악 레코딩, 스포츠 프로그램, 라디오 프로그램 또는 다른 오디오 컨텐츠의 배우, 음악가, 스포츠 캐스터, 디렉터 그리고 프로듀서를 포함한다. 가능한 구조를 제공하기 위하여, 이전에 논의된 보이스-투-리메이닝 오디오에 대한 묘사를 정리하고 지지하기 위해서 새로운 용어를 소개하는 것이 유용할 것이다.
본 문서의 나머지에서 사용될 새로운 용어는 "순수 보이스" 와 "리메이닝 오디오"의 이전 의미를 논박하거나 반박하기 위해 의도된 것이 아니다. 대신에, 새로운 의미는 다양한 오디오 프로그램의 프로듀서들이 인코딩, 압축 그리고 디코딩 프로세스를 위해 이 신호들을 적절하게 확인할 수 있는 프레임웍을 용이하게 하기 위해 소개된다. 덧붙여, 이 논의는 프로듀서 또는 세컨더리 컨텐트 제공자들이 "순수 보이스" 시그널과 "리메이닝 오디오 시그널"을 규격대로 가공하는 몇몇 가능성이 뚜렷하게 한다.
순수 보이스/리메이닝 오디오 컨텐트의 실시태양중 하나는 "프라이머리-컨텐트 순수 보이스 오디오"와 "세컨더리 컨텐트 리메이닝 오디오" 컨텐트를 포함하기 위하여 정의된다. 이 두 라벨의 이유는 최종 청취자를 위한 VRA기능의 사용을 의도할 뿐만 아니라 재생시 최종 청취자에 의해 혼합될 두 시그널을 생성할 때 몇몇 예술적인 자유를 유지하기 위해 오디오 프로그램의 창작자를 위한 요청과 관계되어 있다. 첫째로, VRA 기능의 최종사용자의 의도된 사용을 고려한다. 그들은 오디오 프로그램의 필수적인 부분을 조절하여 그들이 그 프로그램을 더욱 즐기거나 이해할 수 있기를 원한다. 몇몇 경우에, 조정은 명백할 것이다. 예를 들어, 스포츠 아나운서의 음성, 또는 심판원의 어나운스먼트는 스포츠 프로그램의 오디오 컨텐트에서 매우 논쟁의 여지가 있는 필수적인 정보이다. 백그라운드 또는 리메이닝 오디오는 현재 이 오디오 컨텐트에서 군중 소음이다. 몇몇 청취자는 게임에 더욱몰입하는 느낌을 위하여 군중 소음을 조절하기 원할것이고, 반면 나머지는 군중들의 노이즈에 의해 불쾌하게 될지 모른다. 그러므로, 프라이머리-컨텐트 순수 보이스 오디오 정보는 아나운서 또는 심판원의 음성과 세컨더리-컨텐트 리메이닝 오디오 시그널은 군중 소음과 동일하다는 서술은 올바른 것으로 보인다.
프라이머리-컨텐트 순수 보이스와 세컨더리-컨텐트 리메이닝 오디오간의 차이점은 수많은 다른 상황을 위해 생성되기 쉽지 않다. 예로써, 필름 사운드트랙에서, 그 필름 내에서 많은 사람들이 같은 시점에 이야기하는 경우들이 있을 것이다. 때때로 이런일이 일어날 경우, 시청자는 음성의 하나만을 듣더라도 플롯의 감상과 완벽한 이해를 할 수 있어 그 장면을 통해 감동 할 수 있을 것이다. 필름의 플롯의 정수를 유지하기 위하여 한꺼번에 음성의 모든 것을 들어야하는 것이 필수적인 다른 장면도 있을 것이다. 후자의 경우에, 모든 음성의 혼합은 시청자가 그 장면에서 필름의 모든 예술적인 면을 감상하기 위하여 프라이머리 컨텐트 순수 보이스 컨텐트로 간주되어야 할 것이다. 그러므로, 프로듀서/아티스트가 프로그램의 그 부분에서 필수적이라는 것을 느낀다면 프라이머리 컨텐트 순수 보이스 시그널이 논-보컬 오디오 사운드로 구성되는 것이 가능할 것이다. 예를 들어, 알람의 사운드가 울리는 것은 왜 배우/여배우가 매우 갑자기 그 지역을 떠나는지 시청자가 이해하기 위하여 필수적일 것이다. 그러므로, 프라이머리 컨텐트 순수 보이스 시그널은 오디오 프로그램의 모든 순간에 보이스 인포메이션으로만 구성되지는 않고, 이 시그널은 다른 소리들의 간결한 세그먼트 역시 포함할 수 있는 것이다.
이것은 "프라이머리 컨텐트 오디오(PCA)"정보라고 불리우는 세 번째 정의의 동기가 된다. 이것은 전송의 목적을 위해서도 중요하다. 일반적인 오디오를 위해 이용된 것보다 더욱 효율적인 압축 알고리즘을 사용하여 스피치-온리 오디오 컨텐트를 압축하는 것이 가능하다는 것이 예술에 숙달된 사람들에 의해 잘 알려져 있다. 이것은 스피치-온리 오디오 컨텐트의 대역폭을 축소시키는 것과 관계가 있다. 그러므로, 프로듀서가 그 시그널이 '프라이머리 컨텐트 순수 보이스(PCPV/PCA)'또는 '프라이머리 컨텐트 오디오(PCA)'중 어느것인지 정의하는 엔코딩프로세스의 효율과 퀄리티에 중요할 것이다. 이것은 엔코더에 오디오 프로그램에 포함된 것과 같은 변화하는 파라미터로 제공될 것이고, 시그널이 PCPV/PCA로 정의되었을 때 스피치-온리 엔코딩을 허용하고, 프로그램이 PCA처럼 신호되었을 그 동안 더욱 일반적인 인코딩 알고리즘으로 스위칭한다.
PCPV/PCA/SCRA 신호 표준화의 또다른 중요한 특성은 프로그램의 다양한 포인트에서 그들 시그널의 일부 또는 모든 것에서의 공간적인 정보를 위한 잠재적인 수요이다. 필름에서 일반적으로 중앙에 위치한 보컬 컨텐트와 비교해서 둘러싸인 위치로부터 오는 청취자의 청취 정보는 거의 모든 장면에서 필수적이다. 그 능력이 제공되지 않는다면 프로그램은 약간의 아티스틱 메리트와 플롯의 감동을 손상할 것이다. 어떤 필수적인 공간 정보의 포함은 시그널의 멀티-채널 재생에 의해 조정될 수 있다. 그러므로, 본 발명은 프라이머리 컨텐트 순수 보이스의 저장, 압축 그리고 다중채널의 디코딩을 위한 수요가 있는 그러한 상황에서 가능한 방법을 서술하고자 할 것이다.
과거 15년 동안의 디지털 오디오 테크노로지의 발전은 "디지털 사운드"의 기초가되는 프로덕션, 인코딩 그리고 디코딩 프로세스에서 많은 방법을 이끌어 왔다. 디지털 오디오 시그널의 다중 채널의 창조, 저장, 프로세싱, 딜리버리와 재생이 수년동안 연습되고 있다는 것을 지적하는 것은 중요하다. 사실, 디지털 오디오에서 최근의 동향은 플레이백 디바이스에 전달될 수 있는 오디오 채널의 수를 증가시키는 방향으로 나아가는 것이다. 예를 들어, 가장 최근에 짜여진 주요 새로운 형식의 하나인 MPEG-4 디지털 오디오 표준(ISO ###)은 인코딩, 비트스트리밍 그리고 디코딩 프로세스에서 디지털 오디오의 64채널까지 적용할 수 있는 능력이 있었다.
디지털 오디오 채널의 수가 많아지는 방향으로 이 이슈에 의해 예상되는 것은 아니다. 본 실시태양의 매우 중요한 구별되는 특성은 청취자의 많은 다수가 새로운 VRA 조정이 제공되기를 원하거나(청취력이 손상되지 않은 청취자) 또는 필요(청취력이 손상된 청취자)하다는 것에 대한 인식이다. 그러므로, 이 인식은 전체적인 디지털 오디오 프로덕션 프로세스를 통한 SCRA 시그널과 PCPV/PCA의 보전을 유지하도록 프로그램되는 새로운 인코딩 테크닉과 디지털 매스터의 포맷이 어떻게 호환가능한 지에 대한 설명의 필요성에 이르게 된다.
이 완전성의 지속은 청취자가 궁극적으로 재생동안 단지 두 시그널-보이스와 리메이닝 오디오-만을 조정할 수 있음으로 인해 유지되는 것은 필수적이다. PCPV/PCA/SCRA 시그널을 구성하는 이 행위는 같은 레벨에서 믹싱되는것처럼 보일가능성이 있다. 그러나, 본 발명은 프로덕션 프로세스를 통해 PCPV/PCA시그널의 유지를 용이하게 하고 그것에 의해 단 하나의 시그널로부터 대화 정보를 이해하기 위한 능력을 청취자에게 제공한다.
다른 동등하게 중요한 관찰은 PCPV/PCA/SCRA 시그널을 얻기위해 요구되는 가능한 테크놀로지는 현재 존재하지 않는 디지털 오디오 프로덕션 프로세스를 통한. 그러므로, 가장 중요한 실시태양의 몇몇은 이 시그널의 완전성 유지의 방법으로 연관되어 아래에서 논의될 것이다. 이것은 특별한 헤더 데이터와 보조 데이터 채널(들)에 의해 달성될 수 있다. ⅰ)"통지한다" 어떤 인코더 인입되는 시그널이 PCPV/PCA/SCRA 정보( 예를들어 VRA가능한)를 포함하고 있는; ⅱ) PCPV/PCA/SCRA 컨텐트가 VRA 기능이 있는 디지털 마스터 테입/파일에서 알려진 방법을 사용하는 디코더에 전달되는 것과 같은 비트스트림을 어떻게 개발하는지 인코더를 지시한다. ⅲ)그리고 재생 디바이스에서 PCPV/PCA/SCRA 시그널을 재생하고/또는 어떻게 구성하는지, 재구성하는지에 대한 정보를 디코더에 제공한다.
본 발명의 실시태양을 상술함에 앞서, 상기에 제공한 새롭게 서술된 용어를 한 VRA 조정의 최초 의향을 명확히 하는 것 역시 유용할 것이다. 본 발명에 의해 제안된 두 개의 유일한 오디오 시그널을 창조하는 솔루션의 하나를 생각하면, 순수 보이스와 리메이닝 오디오 또는 PCPV/PCA/SCRA로 인해 각각 시그널의 볼륨을 독립적으로 조정할 최종사용자에 전달을 용이하게 한다. 그러므로, 본 발명은 새로운프로덕션 프로세스를 정의하고자 하고 그것으로 최종 청취자는 궁극적으로 단지 그 두 시그널의 볼륨조정에 억세스가 가능케 된다.
앞선 예로부터, PCPV/PCA 시그널은 녹화된 정보의 다중 채널(우선, 독점적이지 않다면, 음성 컨텐트 오디오)로부터 오디오 컨텐트와 함께 믹싱되어 구성되는 시간이 있다는 것은 명백하다. 그러나, 마지막 결과는 단지 두 개의 개별적인 시그널-PCPV/PCA 시그널과 SCRA 시그널의 창조라는 것을 리더가 인식하는 것은 매우 중요하다.
본 문서에서 후에 나타나는 실시태양에서처럼, 이 두 시그널이 최종적으로 최종 청취자를 위해 구성될 프로덕션 경로에서 다양한 로케이션이 존재한다. 예를 들어, 프로듀서는 레코딩 프로세스동안 그것들을 결합시켜 첫 번째 마스터링 테이프에 담아두길 원할 것이다.
프로그램에서 서로 다른 가수/배우들로부터 많은 보이스 트랙을 녹음하기 위한 다양한 방법이 있고 포스트-레코딩 믹싱 세션동안 PCPV/PCA 시그널을 생성하기위해 그것을 결합한다. 많은 수의 채널을 갖는 디지털 테이프를 생성할 수 있는 다른 가능성이 존재하며 프로그램의 재생중 어떤 순간에 싱글 PCPV/PCA 또는 SCRA 시그널을 생생하기 위한 채널의 어떤 혼합을 어떻게 다운믹스 할 것인지 디코더에 지시하는 데이터 채널을 따라 전송한다. 본 발명의 방법의 최종-결과는 최종-청취자가 VRA 조정을 할 수 있는 단지 두 개의 시그널을 제공하는 것이다.
그래서, 오디오 프로그램 사운드 엔지니어에 의해 특별한 방법으로 취급되는PCPV/PCA/SCRA 시그널의 수요가 존재한다는 것은 매우 명백하다. 이 시점에, 디지털 매스터링, 인코딩 알고리즘 또는 디코딩 알고리즘을 써서 만드는 산업적으로-증명된 동시에, 완전하게 분리되지 않더라도 VRA조정을 위해 최종-사용자에게 프라이머리 컨텐트(순수 보이스)오디오와 세컨더리 컨텐트 리메이닝 오디오의 명백한 분배를 특히 가능하게 하는 방법이 없다. 다음의 실시태양은 컨텐트 제공자, 세컨터리 제공자, 그리고 최종-사용자가 레코딩과 스피커 재생중 어느 스테이지에서도 유용하게 쓸 수 있는 수많은 오디오 코덱을 위한 VRA 조정의 모든 장점을 가질수 있는 것을 당연하게 하기 위해서 개발되어온 방법을 서술한다. VRA 프로세스를 가능하게 하는 수많은 저장된 폼이 아래에서 역시 서술될 것이다.
최종-청취자에게 VRA 조정을 가능하게 하는 예시적인 실시태양의 서술이 아래에 제시되었다. 이들 실시태양을 더욱 인식하기 위해, 첫 번째 단계는 텔레비전, VCR플레이어, DVD플레이어, CD플레이어 또는 다른 오디오 재생디바이스등의 최종 재생 디바이스에서 PCPV/PCA/SCRA 시그널의 명백한 생략을 나타내기 위한 디지털 오디오 딜리버리의 현존하는 상태를 명확하게 할 것이다. 도식적으로 이것은 도 1에 나타난다. 도면은 오디오 프로그램을 구성해야하는 프로그램 소스 컴포넌트와 함께 시작되는 일반적인 오디오 프로덕션 프로세스를 묘사한다. 이 다양한엘리먼트는 통상적으로 선형적이고 압축되지 않은 오디오 포맷을 사용한 DAT 레코더(115)에 저장된다. 이것은 비압축, 언믹스드, 디지털 매스터로 불리운다.
다음으로, 어느 시점에, 텔레비전 시청자 또는 영화 관객 또는 수많은 다른 오디오 어플리케이션에 전달될 오디오 채널을 생성하기 위한 믹싱과 에디팅 프로세스를 수행하는 믹서/에디터가 존재한다.
예를 들어, 오디오 컨텐트는 좌측과 우측 스테레오 채널 또는 L, R, C, LS를 포함하는 5.1 채널 또는 두 개의 부가된 서라운드 스피커가 더해진 7.1채널로 불리운다. MPEG4같은 최근의 표준은 더 많은 수의 오디오 채널의 용량이 제공되고 있으나 현 시점에 보급된 수단 중에 7.1보다 큰 어플리케이션은 없다. 130과 135의 포맷은 믹스드, 비압축된 디지털매스터(125)로 불리운다.
다음 단계는 오디오가 어느 정도 압축되고 비트스트림 신택싱을 하는 오디오 코덱(150)에서 비압축된 오디오를 재생하는 것이다. 이 점에서, 압축되고, 믹스된 디지털 매스터(145)를 구성하는 것이 가능해질 것이다. 프로덕션 프로세스는 압축되고, 믹스된 디지털 매스터의 복사본을 만들고 도면에서 나타난 다른 두 마스터 테이프 버전과 비교한 카피의 버전을 분배한다. 재생 디바이스는 디코더 세팅에 의하여 5.1, 7.1채널 등의 스테레오로 재생한다.
아래에 제공된 본 발명의 실시태양을 이해하기 위하여, 현재의 관례가 어떤 디지털 마스터링 테이프 구성을 이용해서 PCPV/PCA/SCRA 시그널의 생성 또는 저장을 위한 방법을 제공하지 않는다는 것을 깨닫는 것은 중요하다. 그러므로, 실시태양의 하기 부분은 궁극적인 VRA 목적을 위한 이 시그널의 제작을 수용하는 디지털 마스터를 구성하는 다양한 방법을 나타낸다.
VRA가 가능한 디지털 마스터링 실시태양
오디오 프로그램의 VRA가 가능한 디지털 마스터링 테이프 또는 파일의 다양한 버전을 생성하기 위해 요구되는 가능한 단계가 도 2a와 2b에 나타나있다. "VRA 가능"은 PCPV/PCA와 SCRA 시그널을 명백하게 포함나거나 또는 보조 데이터와 디지털 마스터로부터 복사된 다른 오디오 데이터를 사용함에 의해 디코더 레벨에서 구성될 이 시그널의 하나 또는 양쪽 모두와 같은 충분한 'VRA 보조 데이터'를 포함하는 디지털 마스터 테이프 또는 파일에 연관된다. 도 2a에 따르면, 음악, 필름, 텔레비전 프로그램, 영화 또는 다른 어떤 것이든 모든 오디오프로그램은 모든 형태의 오디오정보를 아날로그 또는 DAT레코더(205)의 트랙으로 저장되거나 스피커로 보내질 실시간 전기적인 시그널(도 2a에서 '라이브'로 표시되는)로 전송하기 위해서 마이크로폰을 이용한다. 프로그램의 아티스트와 프로듀서의 계획에 의해여 그 오디오 정보 역시 프라이머리 컨텐트 오디오 시그널(PCPV/PCA)(21)와 세컨더리 컨텐트 리메이닝 오디오 시그널(SCRA)(214)을 추출하기 위하여 이용될 수 있다.
"파생된 오디오" 라벨은 하드웨어 요소에 대응하는 것으로 아티스틱 프로세스를 의미하고 오디오 트랙(205)의 하나, 둘 또는 그 이상을 이용할수 있다. 도 2a에서 이 두 시그널은 오디오 프로그램을 위한 믹스되지 않고, 압축되지 않은 2채널 VRA가 가능한 디지털 마스터를 생성하기 위하여 입력 노드(217)에서 DAT 레코더로 모든 오디오 소스로부터 개별적으로 사용가능한 트랙 모두와 재결합된다. 입력 노드(217)는 문자그대로 시그널을 더하는 것이 아니라 싱글 디지털 마스터 테이프(215)에 그들을 단순하게 결합하는 것이다. 디지털 마스터(215)는 오히려 선형 PCM포맷 또는 최적 PCM 포맷과 같은 비압축 또는 관련 손실없이 압축된 디지털 오디오 포맷을 이용하여 구성되나, 오리지널 오디오 시그널의 음질을 유지하기 위해 이들 특별한 포맷에 제한되지 않는다. (선형 PCM포맷은 디지털 오디오 파일을 위해 사용된 바압축된 오디오포맷으로 잘 알려져 있다.)
VRA 취지를 위한 디지털 마스터링의 완전한 부분은 레코딩 프로세스, 포함된 채널의 타입, 각각 채널을 위한 라벨, 두 시그널을 위한 공간적인 재생 지시에 관한 명확한 세부사항과 재생 디바이스(225,245)에서 오디오 코덱 과/또는 디코더에 의해 요구되는 다른 필수적인 정보를 정의하는 특별한 보조 데이터와 VRA 가능으로써의 마스터테이프를 확인하는 특별한 '헤더'정보의 창조이다. 헤더정보와 VRA 보조 데이터는 본 실시태양의 도움이 되는 구성이다. '오디오 코덱'이라는 구는 디지털 정보의 압축이 발생하는 엔코딩 프로세스에 의한 것이고, 몇몇 전송방법이비트스트리밍 프로세스를 통해 디코더에 수반되며, 최종 디코딩은 오디오 스피커에 재생을 위한 아날로그폼으로 압축된 시그널을 변환한다. 어떤 실시태양을 위해, VRA헤더와 보조 데이터 정보는 디지털 마스터에서 생성되고 저장되는 것을 방해하는 것으로 압축 인코딩 레벨에서 전달되는 분리된 비트스트림처럼 제공될 수 있다는 것이 가능하다. 보조 데이터와 헤더 정보의 실시태양은 다음 부분에서 더욱 상세하게 논의 될 것이다.
도 2a에서 VRA가 가능한 디지털 마스터의 비압축된 버전이 완료되었을 경우, 마스터 테이프의 디지털 정보는 VRA기능이 있는 플레이어에서 재생되기 전에 오디오 프로그램을 위해 비압축된 디지털방식으로 포맷된 PCPV/PCA/SCRA 시그널을 디코딩할 수 있는 비압축된 오디오 파일 포맷처럼 배분을 위해 복사될수 있다. 예를 들어, 전통적인 CD오디오는 재생을 위해 비압축된 선형 PCM데이터 파일을 이용한다. 이것은 CD플레이어가 오디오 정보가 VRA가 가능한지 또는 아닌지 구분할수 있도록 장치되어야 하고 PCPV/PCA/SCRA 시그널을 수용하도록 장치되어야 한다는 것을 요구한다.
두 번째 대안으로써, 디지털 매스터 파일 컨텐트는 작업량 비율과 저장 요구를 최소화시키기 위해 사용되는 몇몇 오디오 코덱(230)을 이용하여 압축될 수 있다. 오디오 코덱의 인코더 기능의 결과물이 오디오 파일(235)의 압축된 버전이 도 2a에서 나타난것처럼 저장되거나(240) 또는 다중 복사에서 재생되는 중간단계에서 이용될 수 있다는 것을 인식하는 것은 중요하다. 다시, 명백하게, 비-VRA 기능의 디지털 마스터로부터 그와 같은 압축되어 저장된 파일의 현재의 성취는 슈퍼CD 또는 DVD 오디오와 같은 잘 알려진 미디어의 형태에 부합한다는 것을 주지하자.
압축된 VRA기능의 디지털 마스터의 저장된 버전은 CD미디어 또는 DVD오디오 미디어에 역시 존재할수 있다. 그러나, VRA기능의 디지털 마스터의 저장된 버전상의 PCPV/PCA 및/또는 SCRA 채널의 포함은 음성과 리메이닝 오디오 시그널의 더욱 나은 재생을 보증하기 위해서 본 발명에서 서술된 구성을 필요로 한다. 명확하게, 압축되고, VRA기능의, 저장된 파일(240)은 PCPV/PCA/SCRA 오디오 시그널을 디코드하고 VRA 조정을 용이하게하는 명확한 VRA기능의 재생 디바이스에 접근할수 잇게 만들 수 있다.
두 번째 대안은, 코덱의 인코딩 프로세스에 의한 압축 후에, 코덱에 의해 사용된 특별한 압축 알고리즘에 의해 VRA기능의 디지털 오디오 정보를 디코드하기위해 구성된 재생 디바이스에 다양한 방송 수단이 직접적으로 전송된 정보이다. 예를 들어, 전송은 호환되는 VRA인식 디코더가 오디오 정보를 수신하고 VRA조정을 이용할 수 있는 PC 모뎀으로의 ISDN 전송일 수 있다.
도 2b는 VRA 가능을 위해 요구되는 오디오 프로세스의 약간 다른 실시태양이다. 이 구성에서의 차이점은 디지털 마스터가 PCPV/PCA 또는 SCRA시그널(260)을 아직 포함하지 않는다는 것이다. 대신에, 디지털 마스터는 'n'레코드된, 레코딩 산업에서 현재의 일반적인 것과 같은 방법을 통해 변화되지 않은 오디오 트랙으로 구성될 수 있다. 아티스트-프로듀서는 아티스틱 메리트와 오디오 프로그램의 컨텐트에 의해 정의된 믹싱 프로세스를 통해 보통의 디지털 마스터의 다운스트림이 생성된 PCPV/PCA와 SCRA시그널을 추출한다.
이들 시그널을 위한 믹싱의 이행은 다음 섹션에서 논의된 VRA-기능의 인코딩 프로세스를 사용하여 충족될 수 있다. 이 점에서, 디지털 마스터(255)로부터 변경되지 않은 트랙과 VRA기능의 오디오 코덱(265)에 의해 인코드된 PCPV/PCA/SCRA 시그널(260)과 재생 디바이스(280)는 도 2a의 실시태양에서 논의된 것과 비슷한 방법으로 이들 시그널에 억세스할 수 있다. 이 실시태양에서, VRA기능 디지털 마스터의 압축되지 않은 버전은 절대 존재하지 않는다. 이 접근법은 오디오 프로그램의 프로듀서가 세컨더리 프로바이더에게 유니크 PCPV/PCA/SCRA 시그널을 믹싱하고 명기하는 부가적인 업무를 전가하는 것을 원할 때 선호될 수 있다.
세 번째 가능한 실시태양은 디지털 마스터에 저장될 논-PCPV/PCA 채널의 몇몇 조합처럼 SCRA시그널의 컨텐츠를 명기하기 위해 더욱 나을것이라는 지식에 의해 동기부여가 된다. 이것은 도 3에 나타나있다. 이 경우, PCPV/PCA 시그널만이 압축되지 않은 디지털 매스터의 창조에 우선하여 창조되고 다른 오디오 정보와 함께 마스터에 저장된다. 이 실시태양에서, 특별한 VRA-보조 정보(데이터) 역시 디지털 마스터에 저장된 non-PCPV/PCA 오디오 채널의 그러한 조합으로부터 SCRA채널을 어떻게 구성하는가에 대해 열거한 정보가 있는 마스터에 디지털 방식으로 저장될 것이다. 그 정보는 VRA가능 디코더에 전송을 위한 어떤 다운스트림 인코딩 프로세스에 제공될수 있다. VRA 가능 디코더는 보조 데이터에서 열거된 다운믹스 파라미터를 사용하여 실시간으로 SCRA채널의 창조에 원인이 될 것이다.(SCRA 채널 제작법을 열거하기위한 다양한 방법이 존재하고, 이것은 VRA가능 오디오 코덱의 구성의 상술 섹션에서 후에 논의될 것이다.) 도 3의 논의에 포함하기 위하여, 비압축된 디지털 마스터 오디오 컨텐트는 '1채널, VRA가능'디지털 마스터를 창조한다.
더욱 명확함을 위해, 다운믹싱의 행위는 명확하게 새롭지 않고 오디오 엔지니어링에서 매일 사용되는 것이라는 것은 주지되어야한다. 대신에, 본 발명이 여기에서 서술하는 것은
도 3은 VRA기능의 디지털 오디오 마스터 테이프 또는 파일의 실시태양의 다른 시각을 나타낸다. 오디오 데이터가 같은 테이프에서 비디오 데이터와 혼합될수 있고 그러므로, VRA-가능 오디오 마스터 테이프는 오디오-단일 테이프 포맷처럼 필수적으로 구성되지 않아도 된다는 것을 주지하라. 그러므로, 전체 디지털 마스터링 논의는 필름, 프리-레코드된 텔레비전 프로그램, 또는 음악 레코딩을 위해 디지털 마스터에 동등하게 적용되어야 한다.
도 3에 나타난 실시태양은 '포스트-믹스' VRA-가능 디지털 마스터 테이프(315)처럼 관련될 것이다. 이 실시태양에 나타난 바와 같이, PCPV/PCA 시그널은 어떤 수의 오디오 채널(도면에서 아날로그 시그날처럼 고려되는)로부터 오디오 프로그램을 혼합함에 의해 창조되고 SCRA 시그널은 좌측, 우측, 좌측 서라운드, 우측 서라운드, 센터 그리고 저주파수 효과 채널을 위해 창조된 오디오 컨텐트와 나란하게 분리된 채널처럼 시그널이 디지털화되기 전에 '리메이닝 오디오'로 고려되는 몇몇 다른 오디오 컨텐트를 혼합함에 의해 창조된다. 정보의 8 트랙은 디지털 테이프에 비압축된 오디오 포맷(예를 들어, 선형 PCM에 제한되지 않는다.)을 사용하여 저장된다.
도 3에 나타난 또 다른 실시태양은 '프리-믹스' VRA가능 디지털 마스터 테이프처럼 관련된 것이다. 이 구성에서, VRA가능 디지털 마스터의 이용은 디지털 레코딩이 마스터되기 전에 이미 믹스된 PCPV/PCA와 SCRA 시그널만을 요구할 것이다. 나타난 바와 같이, 현재 'n'채널이 존재하고, 'n'은 디지털 마스터에 존재하는 오디오 채널의 독단적으로 큰 숫자에 관계된다. 이 구성은 오디오 프로그램을 위해 스테레오 또는 서라운드 채널 사운드를 창조하기 위하여 사용된 다운믹싱 프로세스의 후에 사용될 디지털 마스터의 그와 같은 형태를 위해 필수적일 것이다. 그러나, 프라이머리 컨텐트 순수 음성과 리메이닝 오디오는 우선 믹스되고 디지털 마스터에서 그 방법으로 저장된다.
도 4a∼e에 나타난 것처럼 VRA-가능 디지털 마스터 테이프(파일)의 수많은 실시태양이 존재한다는 것은 명확하다. VRA-가능 디지털 마스터의 모든 버전은 마스터를 VRA가 가능한 것으로 확인하는 특별한 헤더 파일이 갖추어 질 것이다. 헤더 포맷은 다음 섹션에서 논의된다. 프리-믹스드, 비압축된, n-채널의 VRA 가능 디지털 마스트가 도 4a에 나타나있다. 이 경우에, 디지털 마스터는 프로덕션동안 레코딩된 'n'채널의 오디오로 구성되었다. 이들 n-채널의 몇몇 조합으로부터 PCPV/PCA시그널과 SCRA시그널(도 4b와 4c)의 구성을 명기하는 것이 가능할 것이다.
이것을 달성하기 위하여, VRA-보조 데이터 채널이 프로덕션의 디코딩 종료시에 이들 지시를 제공하는 마스터에 창조되고 저장될 수 있다. 그러므로, 이 디지털 마스터는 '0-채널, 비압축된, 프리-믹스된, VRA-가능한 디지털 마스터'가 됨을 고려될 수 있다. 0-채널이라는 용어는 명백하게 PCPV/PCA 또는 SCRA를 포함하는 마스터에 트랙이 없다는 사실과 관계된다. 여기서 본질적인 포인트는 이들 시그널이 명백하게 저장되지 않았더라도 테이프가 재생 디바이스를 제어하는 최종 청취자에 의해 궁극적인 VRA 조정을 가능하도록 충분한 정보를 지니고 있다는 것이다.
다른 가능한 실시태양의 일반적인 개략도가 도 4A-E에 나타나있다. 가장 분명한 실시태양은 도 4d와 4e에 나타나있다. 디지털 마스터의 이들 버전은 각각 '1-채널, 포스트-믹스드, 비압축된, VRA-가능한 디지털 마스터'(도 4e)와 '2-채널,포스트-믹스드, 비압축된, VRA-가능한 디지털 마스터'(도 4d)로 고려될 수 있다. 포스트-믹스드 버전에서, 우리는 전형적인 스테레오 시그널인 5.1 믹스드 채널 또는 7.1 믹스드 채널, 또는 더 많은 수의 공간적인 채널 또한 PCPV/PCA 시그널 단독(1-채널 버전) 또는 PCPV/PCA 와 SCRA 시그널을 발견할 수 있다. 이 상황에서, 오디오 프로그램 프로그레스같은 두 시그널중 하나의 공간적인 포지셔닝을 제공하기 위해 사용될 특별한 재생 특성에 관해 디코더를 지시하기 위하여 VRA-보조 데이터 채널이 역시 있을수 있다.
도 4d와 4e는 VRA-보조 데이터와 함께, PCPV/PCA 시그널만이 저장된 다른 실시태양이다. 이 경우에, 보조 데이터는 어떻게 SCRA 시그널, PCPV/PCA, SCRA 시그널과 후술할 다른 기능의 재생을 구성할 것인지 규정할 것이다.
이 디지털 마스터링 논의를 마무리하기 위하여, 디지털 오디오에서 숙련된 이것들이 도 2a, 2b, 3과 4a∼e에서 명백하게 나타난 것과 다른 실시태양을 동일시하는 것은 명백하다. 예를 들어, 본 발명에 의해 직접적으로 정의 돈 것처럼 상기한 모든 실시태양의 압축된 버전을 고려하는 것은 간단하다. 중요한 구별점은 모든 VRA-가능한 디지털 마스터 버전은 PCPV/PCA/SCRA 시그널을 위한 재생 테크닉 또는 구성 테크닉과 같은 특성을 정의하는 보조 데이터 시그널을 포함하는 VRA-가능한 마스터를 확인하는 몇 종류의 헤더를 역시 포함한다는 것이다. 그러므로, 도면에서 나타난 디지털 마스터 포맷은 본 발명에 의해 의도되어 가능한 VRA-가능한 디지털 마스터 구성처럼 해석되지 않는다.
지금까지, 상기 서술은 포함된 VRA-가능 프로세스가 디지털 오디오 프로세싱 아트 전체 메리트에 의하여 다음 세 가지 영역에서 향상되었다는 것은 명백하게 되었다.
1) 프라이머리 컨텐트 순수 음성 시그널에 의한 프로세스는 서정적인 의미 또는 프로그램의 플롯의 감상에 손실이 없이 인식도 및/또는 오디오 프로그램의 보컬 컨텐트의 즐거움을 향상시킬 수 있는 시그널을 제공하기 위하여 구성된다.; 상기 프로세스는 또한 아티스틱 메리트 및/또는 오디오 프로그램의 즐거움을 위한 향상된 감흥을 가능하게 하는 세컨더리 컨텐트 리메이닝 오디오 시그널의 구성을 포함한지만 인식도 또는 프로그램의 플롯의 감상 또는 서정적인 의미의 상당한 향상을 제공하지는 않는다.
비압축되거나 손실없이/상대적으로 손실없이 압축된 오디오 포맷팅을 사용한소위 0-채널, 1-채널, 그리고 2-채널 'VRA-가능'라 불리는 디지털 마스터링 테이프의 제작은, 상기 포맷이 VRA-가능 마스터링 및/또는 오디오 음질을 희생시킨 매우 압축된 오디오 포맷(> 8:1)에 기반한 전송의 결과로 디그레이드될 최적의 음성 음질과 최적의 리메이닝 오디오 음질을 유지하기 위하여 적용된다.
프라이머리 컨텐트 순수 보이스와 세컨더리 컨텐트 리메이닝 오디오 채널의 조화는, 많은 수의 손실없고 상대적으로 손실없는 VRA-헤더 및/또는 VRA-보조 데이터는 오디오 코덱 디지털 오디오전송과 기록의 오디오 파일 저장을 생성하기 위해 사용된다.
디지털 마스터링 프로세스가 정의된 지금, 아래에서 서술될 특별한 실시태양은 AC3의 클래스에서 코덱과 관계된 로스에 비교하여 비손실과 상대적으로 비손실되는 것으로 알려진 그런 오디오 코덱 오퍼레이션에서(인코딩/압축과 디코딩을 포함하는) PCPV/PCA와 SCRA시그널의 포함을 가능하게 하는 특성에 초점이 맞추어 질 것이다.
VRA-가능 오디오 프로그램을 위한 디지털 마스터링 특징
최종-청취자에게 VRA 조정 능력을 제공하기 위한 욕구는 아이디얼하게 프로그램의 오디오 컨텐트를 위한 예술적인 목표와 호환된다. 그러므로 본 발명의 한 특성은 두 목표- VRA 능력을 제공하고 아티스트가 오디오 프로그램에 자유롭게 유지하는 것을 허용-가 호환됨에 의해 프로세스를 설명하고자 한다. 아티스틱 메리트의 보유는 프라이머리와 세컨더리 컨텐트를 위한 어느 정도의 계획을 거의 틀림없이 요구할 것이고, 프로그램이 연대순으로 발전하는 것처럼 그같은 오디오 시그널의 다양한 믹싱에 의해 뒤따르게 된다. 커스토마이즈된 프라이머리 컨텐트 순수 음성 채널과 세컨더리 컨텐트 리메이닝 오디오 채널의 특별한 믹싱과 레코딩은 어떤 형태의 오디오 프로그래밍에서도 이전에 없던 새로운 것이다.
그러므로, 본 발명의 이 디지털 마스터링 관점은 디지털 마스터에 PCPV/PCA/SCRA 시그널이 포함된 상황과 관계되고, 특별한 '헤더 파일' 과/또는 VRA-가능 디지털 마스터의 PCPV/PCA 와 SCRA채널 같은 것에 대한 필수적인 정보(위치, 샘플링 레이트, 포맷, 재생 파라미터 등)를 서술하는 '보조 데이터' 컨텐트 의 마스터링을 포함과 유사하게 될 필요성이 있다.
지금까지, 디지털 오디오의 관점은 대개 채널의 증가된 숫자에 의지하는 사운드의 공간적인 포지셔닝의 새로운 경향과 관계되어 왔다. 이 다중-채널, 디지털 오디오를 위한 서라운드 사운드의 이용은 과거의 더욱 전형적인 스테레오 전송과 비교되는 증가된 수의 오디오 채널의 저장과 전송을 이끌어왔다. VRA-가능 오디오 파일과 전송은 PCPV/PCA와 SCRA정보를 위해 요구되는 여분의 채널 때문에 저장과 전송 요청이 더욱 더 많아질 것이다. 혁신적인 VRA-가능 오디오 코덱은 예비 작업량 부담을 최소화하기 위하여 정의될 것이다. 또한, 디지털 마스터에서의 VRA포맷의 존재는 디지털로 레코드된 마스터로부터 분배된 인커밍 비트스트림을 압축/전송/디코드하기 위해 사용된 어떤 오디오 코덱에 의해 VRA-가능 오디오 파일로 '증명된'것이 되기 위해 필요할 것이다. 디지털 마스터가 VRA-가능한 것처럼 플래그되어야 하는 두가지 필수적인 이유가 있다. 첫째로, PCPV/PCA채널이 특별한스피커 위치에서 재생되는 것이 필요할 것이고, 그래서 그 채널은 정확한 시간의/공간적인 재생 프로시저를 설명하는 보조데이터와 시간정렬되어야 할 것이다. 둘째로, 도 3에서 나타난 것처럼 SCRA채널이 디코더에 의해 구성되어야한다는 것이 요구될 것이다. 그 시그널을 생성하기 위한 인스트럭션은 VRA-보조 데이터에 역시 프로그램될 것이다. 우리는 그것이 디코딩 프로세스에 들어가는 것과 같이 VRA-보조 데이터를 조정하기 위한 독창적인 방법이 있을 것이라는 것을 안다. 예를들어, VRA-가능한 오디오 파일을 위한 n-채널 비트스트림에 임베디드된 정보로 소개되거나 또는 별개의 채널처럼 보내질 수 있을 것이다.
오디오 코덱에서 PCPV/PCA 및/또는 SCRA 시그널의 조정
하기 실시태양은 프라이머리 컨텐트 순수 보이스 시그널과 세컨더리 컨텐트 리메이닝 오디오 시그널을 'VRA-가능한' 디지털 마스터 테이프 또는 파일로 이전에 정의된 오디오 정보를 사용하여 최종-청취자에게 도달하는 것을 가능하게 한다. 이전 섹션에서 디지털 마스터링 논의는 비압축된 또는 압축된 오디오 포맷에서 PCPV/PCA 그리고 SCRA 채널의 저장과 디지털 '태깅'을 서술하였다. 마스터에 저장된 오디오의 비압축된 포맷과 상대적으로 손실없는 압축( 압축비 < 8:1)은 오리지널 오디오 시그널의 충실도를 유지하기 위해 필수적이었다, 의문의 여지없이, 오디오 프로덕션 프로세스의 마스터링 끝부분에서. 디지털 오디오 압축이 오디오 데이터의 저장과 압축을 더욱 효율적으로 가능하게 한다는 것은 잘 알려져 있다.오디오 압축 테크닉의 다양한 형태는 인코더와 디코더 복잡성, 압축된 오디오 음질 과 데이터 압축의 다른 결과의 범위를 제시한다. 지금, 본 발명의 이 측면은 세가지 파트와 관계되어 있다: 손실없는 압축과 상대적으로 손실없는 압축 알고리즘에 기초한 인코딩 메소드, VRA-보조 데이터에 의해 공급되는 보조 정보의 이용과 비압축된 VRA-가능한 디지털 마스터에 존재하는 헤더파일('디지털 태깅'이라고 불리는)의 인코딩. ISO MPEG Ⅱ와 MPEG Ⅳ표준은 상대적으로 손실 없는 압축 알고리즘(<8:1)에 의존하고, 그래서 MPEG 오디오 포맷은 VRA-인코더와 VRA-디코더를 포함하는 그런 특징을 나타내기 위해 사용될 것이다. 이 섹션에서 서술된 실시태양이 다른 오디오 포맷에 역시 응용 가능할 것이라는 것은 역시 명백하게 되었다. 전형적인 테크닉은 본 지면에서 먼저 상세하게 서술하였던 PCPV/PCA, SCRA 그리고 VRA 시그널이라고 불리는 것의 존재와 특별한 데이터 핸들링에 의해 정의된 VRA-인코딩 또는 VRA디코딩의 사용을 가르치지 않을 것이라는 것을 여기에서 역시 주지하게 된다.
압축된 VRA-가능한 디지털 오디오를 위한 실시태양은 손실없는 압축의 일반적인 경우를 위해 서술될 것이다. 손실없는 압축이라는 용어는 수신된 압축된 시그널의 디코딩의 경우 어떤 경우에도 데이터의 손실없이 압축된 디지털 오디오 마스터에 존재하는 오리지널 오디오 시그널을 재생성 하는 것이 가능하다는 사실에 관계된다. 전형적인 테크닉은 인커밍 PCM 데이터스트림의 PCPV/PCA 또는 SCRA시그널의 존재뿐만 아니라 보이스-온리 시그널(PCPV/PCA 시그널)의 저-대역폭의 장점을 갖는 오디오 코덱이 존재하는지를 인식하도록 설계된 오디오 코덱의 존재를 포함하지 않는다.
그러므로, 하기 실시태양에서 제공된 설명은 수많은 유니크한 특성을 제공한다. : VRA-가능한 비압축된 디지털 오디오 파일의 자동인식을 통한 코덱의 사용; 스피치 시그널을 위해 특별히 설계된 오디오 압축 알고리즘을 사용하는 PCPV/PCA채널의 독특한 가공, 더욱 일반적인 오디오 압축 알고리즘을 사용하여 압축된 다른 오디오 트랙과 동조화되고 디코더에서 리믹스되고, 손실없는 압축 알고리즘을 사용하는 VRA-가능한 디지털 오디오 정보의 압축, AC3알고르짐보다 디지털 데이터를 더욱 유지하는 로시 압축 알고리즘을 이용하는 VRA-가능한 디지털 오디오 정보의 압구( 여기에서 8:1과 동등한 또는 더 적은 비율의 압축을 의미하기 위해 설명된), 1-채널 VRA-가능한 디지털 마스터의 결과로 SCRA채널을 위한 구성 인스트럭션, 특정 스피커에 PCPV/PCA와 SCRA채널 정보의 할당을 위해 VRA-디코더에 의해 사용되는 재생 로케이션 설명, PCPV/PCA 시그널의 어떤 공간적인 포지셔닝을 위한 방법 과 이미 존재하는 다양한 오디오 코덱에서 PCPV/PCA와 SCRA채널을 통합하는 VRA-가능한 인코더의 명확한 특성을 포함한다.
도 5는 일반적인, 손실없는 압축 알고리즘( 손실없는 압축 알고리즘의 한 예는 메리디안 로스리스 팩킹(MLP)알고리즘이다.)에 기초한 본발명의 이 파트의 키 컨셉트를 나타내는 기본적인 블록 다이어그램을 나타낸다. 이 예에서, 비압축된VRA-가능한 디지털 마스터(510)은 VRA 오디오 코덱(520)에서 입력처럼 사용된다. 여기에서의 차이점은 각각 코덱의 인코딩과 디코딩 엔드(520)에서 VRA-가능 인코더(530)과 VRA-가능한 디코더가 사용되어야 한다는 것이다. VRA-가능한 디코더(535)의 아웃풋, 그러므로 오디오 코덱의 출력은 독립적으로 최종-청취자에 의해 조정될 수 있는 보이스와 리메이닝 오디오가 될 것이다. 다음으로는 오디오 코덱에서 VRA-가능한 요소들이 논의될 것이다.
VRA-가능한 인코더
VRA-가능한 인코더의 개념적인 실시태양은 도 6에 나타나 있다. 이 도면은 1-채널, N-컴프레스드, 프리-믹스드 VRA-가능한 디지털 마스터(610)의 이전 서술에 의한 것이다. 그러나, 서술의 본질은 VRA-가능한 디지털마스터가 오디오 코덱에의 입력에 삽입되는 포맷과 같게 유지될 것이다. 도 6의 다이어그램은 프리-믹스드 PCPV/PCA 시그널이 다른 오디오 정보의 'n-채널'옆에 인코더의 로스리스 압축 알고리즘(630)에 보내지는 것을 나타내기 위해 의도되었다. VRA 보조 데이터(620)에 존재하는 프리-레코디드 정보 역시 인코더에 보내질 것이다. 소프트웨어 인터페이스 역시 프로덕션 프로세스의 믹싱/인코딩/압축 스테이지에서 VRA-보조 데이터의 모든 또는 추가적인 부분을 생성하기 위해 사용될 것이다. 이 특성은 프로듀서가 태스크를 하청할 세컨더리 프로바이더에게 VRA 아서링 테스크를 알리는 것을 허용할 것이다.
마지막으로, 압축된 그리고 가능하게 믹스된 오디오와 보조 데이터는 압축된 포맷에 저장되거나 또는 인코더 프로세스의 파트처럼 생성된 ISO 비트스트림처럼 디코더에 전송된다. 이 스테이지에서 프리믹스 되어야하는 PCPV/PCA시그널과 SCRA시그널은 표준 디지털 오디오의 아트에서 숙련된 어떤 이에 의해 현재 관습적으로된 방법으로 MPEG-기반의 비트스트림의 일부로 만들어진다. 도 7은 도 6으로 나타난것과 비슷한 도면이다.( 특성의 서술은 다시 언급하지 않을 것이다.) 예외는 디지털 마스터가 현재 2-채널 VRA-가능한 포맷이라는 것이다. 코덱에 입력시 SCRA시그널의 존재보다도, 묘사된 특성은 도 6에서 논의된 것과 동일하다.
도 8∼11은 다음의 몇몇 조합에 의존하는 VRA-가능한 인코더를 위한 네 개의 다른 실시태양의 명확한 형상이다 : 일반적인 오디오 시그널의 손실없는 또는 상대적으로 손실없는 압축을 위한 알고리즘, 스피치-온리 압축 알고리즘, VRA 헤더와 보조 데이터 정보의 정확한 프로세싱과 VRA- 가능한 디지털 마스터의 몇몇 폼의 입력. 이 다양한 형태의 다양한 조합은 여기에서 언급하기에 너무 많으나 본 발명에서 개요된 총체적인 VRA-가능한 오디오 프로덕션 프로세스 와 의향은 모두 일관적이다.
도 8에 의하면, 2-채널, 포스트-믹스된, 비압축된, VRA-가능한 디지털 마스터(810)는 VRA-가능한 인코더에의 입력처럼 나타난다. 좌측, 우측, 센터, 좌측서라운드, 우측 서라운드, SCRA 와 PCPV/PCA 시그널은 디지털 마스터의 이 포맷을 위해 이미 믹스되고 그 후 '일반적인' 오디오 코덱의 압축알고리즘(820)에 이해 압축된다. 그 알고리즘(820)은 퍼셉츄얼-기반된 또는 리던던시-기반된 또는 대역폭에 대한 고려없이 압축에 이르게 하는 다른 어떤 테크닉일 것이다.
VRA-보조 데이터는 역시 압축 알고리즘에 의해 작동되고, 표준-기반의 프로시저를 사용하는 ISO 비트스트림에 정렬된다. 예를 들어, MPEG-2 AAC (어드밴스드 오디오 코덱, ISO/IEC 13818-7)은 표준이 지원하는 15개의 임베디드 데이터 스트림의 하나를 통해 VRA-보조 데이터를 분배하기 위해 사용될 것이다. 보조 데이터를 정렬하기위한 다른 방법들이 존재하고 그 방법들은 아트에서 숙련된 사람들에게 잘 알려져 있다. 코덱(800)의 아웃풋은 2-채널 마스터의 압축된 버전을 저장하기 위해 사용될 수 있고 그 마스터는 분배를 위해 복제물을 생성하기 위해 사용될 것이다. 선택적으로, 비트스트림은 PC에서 미디어 플레이어처럼 재생 디바이스에서 디코더에 직접적으로 전송될 수 있다.
도 9에서 의미하는 프로세스는 두 개의 차이점을 제외하고 이전 도 8의 것과 유사하다. 첫째로, PCPV/PCA 시그널은 스피치-온리 코덱(920)으로 압축되나, 다른 오디오 시그널은 일반적인 압축 알고리즘(820)을 사용하여 압축된다. 스피치 코딩은 G.722 코덱 또는 코드 익사이티드 리니어 프레딕티브(CELP) 코덱과 같은 몇몇 알려진 스피치 코덱중 어느 하나를 사용하여 수행될 수 있다. 스피치-온리 코덱(920)을 이용한 PCPV/PCA 시그널의 압축과 일반적인 코덱을 이용한 다른 오디오 시그널의 압축사이의 이 구별은 VRA-가능한 비트스트리밍과 저장 요청을 위해 요구된 대역폭을 감소시키는 데 도움될 것이다.
발표된 VRA-가능한 인코더는 VRA-가능한 오디오 전송을 위한 대역폭 요구를 감소시키는 두-단계의 압축 어프로치뿐만 아니라 누적된 정보(PCPV/PCA, SCRA, VRA-보조 데이터)가 포함되고 그것에 의해 오디오 포맷 VRA-가능한 것을 만드는 이 방법이라는 것을 유념한다. 이 형상의 두 번재 중요한 차이점은 추가적인 'n 오디오 채널'의 존재이다. 이 실시태양은 재생동안 PCPV/PCA 또는 SCRA시그널을 강화할 추가적인 오디오 채널을 위한 필요성이 있는 상황을 수용할 것이다. 이 추가적인 시그널은 일반적인 압축 알고리즘에 의해 압축되고 어떤 특별한 재생 요구는 보조 데이터 스트림에 의해 정의될 것이다.
도 10 및 11은 1-채널, 비압축된, 믹스드, VRA-가능한 디지털 마스터의 압축을 이끄는 두 개의 VRA-가능한 인코더 구성을 나타낸다. 이전처럼, PCPV/PCA시그널(도 10을 보라)을 위한 스피치-온리 코덱을 사용하는 것이 타당할 것이다 또는 도 11에서 나타난 것과 같이 모든 시그널을 위해 일반적인 오디오 압축 알고리즘을 사용하기 위해 인코더가 셋-업 될 수 있다.
도 12는 VRA-가능한 코덱을 위한 그러한 개념의 구조의 두 번째 리프리젠테이션을 나타낸다. 이 리프리젠테이션의 본질은 도 9 및 10의 실시태양과 유사하고 그것에서 PCPV/PCA 시그널에 존재하는 보이스 정보는 스피치-온리 압축 알고리즘을 이용하여 압축되고 SCRA 시그널은 더욱 일반적인, 더 넓은-대역폭, 오디오 압축 알고리즘을 사용하여 압축된다. 도 12에 의하면, 엘리먼트(1210 과 1220)는 압축되기 전에 그리고 전형적인 LPCM 포맷과 유사하게 PCPV/PCA 와 SCRA 시그널(각각)의 디지털 표현이다. 디지털 정보는 역시 표시된 것과 같이 .WAV 파일 또는 비압축된 디지털 오디오 파일의 몇몇 다른 형태처럼 사용가능할 것이라는 것을 주지하라. 두 개의 오디오 스트림은 이 스테이지에서 병렬로 고려되며 이것은 이전 오디오 압축 구조와의 중요한 차이점이다.
대비하여, 전형적인 오디오 압축 프로세스는 압축 알고리즘에 음성과 비-음성 컴포넌트 모두를 갖는 연속적인 싱글-채널 오디오 스트림을 공급하고자 할 것이다. 연속적인 비트스프림이 프라이머릴리 보이스와 프라이머릴리 논-보이스이고, 변화하는 샘플링 속도와 프라이머릴리 보이스와 논-보이스간의 변화하는 연속적인 비트-스트림의 컨텐트처럼 다른 압축 알고리즘을 호출할 때 인식하는 것은 가능하다.
그러므로, 전형적인 테크닉은 도 12의 네 개의 배치된 실시태양과 매우 다르다. 도 12에서, 두 병렬 스트림은 모든 시간에 두 별개의 압축 알고리즘에 공급된다; 압축 유니트(1250과 1260)의 병렬 정렬에 의해 나타난것과 같이. 스피치-온리 압축 유니트(1250)은 그 기술에 숙련된 사람들에게 알려진 어떤 압축 알고리즘을 포함한다. PCPV/PCA 정보는 압축 유니트(1250)의 보이스-온리 압축과 정확히 병렬(PCPV 와 SCRA 사이에 타임-동기화된)인 방법으로 일반적인 오디오 압축 유니트에 입력되는 1220에 존재하는 압축 유니트와 SCRA 시그널에의 입력이다.
오디오는 예를 들어, 주요 모션 픽쳐의 일치하는 비디오와 오디오 컨텐트같은 어떤 관련된 비디오 컨텐트와 타임-동기화된 그리고 비디오-프레임 동기화된 것으로 고려될 수 있다. 압축 유니트(1250과 1260)의 결과물은 1285에 이해 특별한 방법으로 멀티플렉스되어 짜여진 VRA 오디오는 중간 파일처럼 저장되거나 또는 몇몇 디지털 미디어(1295)에 전송될 수 있다. 디멀티플렉싱 프로세스(1290)은 각각의 디컴프레션 유니트(1270과 1280)에 의해 각각 압축해제하기 위해 별개의 PCPV/PCA 정보와 SCRA정보를 푼다. 최종적으로, 디컴프레스된 PCPV 와 SCRA 정보는 만약 원했다면 기록되고 또는 더욱 유사하게 이 스테이지에서, 아래에서 논의되는 것처럼 도 13의 설명과 유사하게 분리된 볼륨 조절을 위해 재생 디바이스에 직접적으로 보내질 것이다.
도 12에서 역시, 실제적으로 어느 다른 존재하는 보이스-온리 또는 일반적인 오디오 압축과 압축해제알고리즘과 호환가능한 VRA 코덱이 생성된다. 우리는 컴프레션 유니트(1250과 1260)이 PCPV와 SCRA시그널의 입력구조와 병렬로 조정된 멀티플렉서의 유니크한 동작때문에 보이스-온리 및 일반적인 오디오 압축의 그들 각각의 클래스에서, 알고리즘을 사용할 수 있다는 것을 강조한다. 게다가, 멀티플렉서(1285) 역시 이들 파트의 안전한 전송을 제공하기 위하여 PCPV/PCA 시그널 과/또는 SCRA시그널을 위해 암호화 유니트 또는 알고리즘을 포함할 것이다. 시그널의 암호화는 그 기술의 전문가들에게 알려진 어떤 테크닉에 의해 수행될 수 있다.
창조, VRA 보조 데이터 채널의 컨텐트와 기능성
보조채널 그 자체는 프라이머리 컨텐트 퓨어 보이스(PCPV)오디오 시그널과 세컨더리 컨텐트 리메이닝 오디오(SCRA)시그널에 관한 다양한 정보로 구성될 것이다. 데이터가 창조될 수 있는 이 구성, 그들의 기능성과 방법이 다음 뷸렛에서 논의된다.
VRA 가능한 프로그램의 존재- 그 헤더파일에 포함되었을 것같은, 이 정보는 온/오프를 지시하는 하나의 비트처럼 표시될 수 있다. 만약 비트가 하나라면, VRA가능한 프로그램은 상기한(PCPV 및 SCRA 오디오 존재) VRA 오디오 포맷을 사용하여 생성된다. 이 비트는 프로덕션 레벨에서 만약 오디오 엔지니어가 VRA프로덕션테크닉을 사용한다면 소프트웨어 또는 하드웨어 스위치에 의해 세트될 것이다. 반면에, 오디오 프로그램은 전형직인 믹싱 프랙티스에 기조한 것으로 고려될 것이다.
PCPV와 SCRA 채널의 수- 이 정보는 각각 채널의 하나이상이 존재한다는 것을 표시하는 플래그에 의해 우선될 수 있다. 만약 그것이 그렇게 표시된다면, 각각의 PCPV와 SCRA 프로그램에 사용가능한 많은 수의 공간적인 채널처럼 더 많은 정보가 제공될 것이다. 여기에서 이 숫자에 세트된 특별히 제한은 없으나 유사하게 재생 하드웨어에 의존할 것이다.(5 스피커= 5 사용가능 채널). 이 숫자들은 디코더가 얼마나 많은 오디오 채널이 디코딩(예를 들어 3PCPV 채널과 5.1 SCRA채널)을 위해 존재할 것인지 알려준다. 오디오 프로덕션 엔지니어는 각각 장면에 주어지는 아티스틱 해설에 기반한 두 오디오 프로그램(PCPV 와 SCRA)의 각각을 디코더가 구성하기 위해 요구되는 채널의 수를 명기할 것이다. 대역폭을 유지하기 위하여, PCPV와 SCRA 채널의 수를 포함하는 디지털 워드는 가능한 오디오 채널의 수가 프로그램 또는 프로그램 사이에서 변화한다면 시간의 함수처럼 바뀔 것이다.
프로덕션 믹스 데이터- 어떻게 PCPV/PCA 와 SCRA 시그널이 구성되었는지에 관한 크기와 공간 정보 모두는 이 데이터 블록의 파트로써 인코드될 수 있다. 디코드된 오디오 프로그램으로 재생되는 경우 결합된 이 정보는 오리지널 프로덕션 믹스를 재생성할 것이다.(본 발명의 궁극적인 목적이 최종-청취자에게 VRA를 조정할수 있도록 허용하기 위한 것이더라도, 사용자에 의해 조정이 적용되기 전에 제공되는 명목상의 재생 지시가 요구될 것이다. 규정된 바와 달리, 최종-사용자에 의한 어떤 조정도 스타팅 포인트처럼 프로덕션 믹스 레벨에서 작동할 것이다.) 계속해서, 예를들어, 만약 두 프로그램의 각각중 하나(하나의 PCPV 채널과 하나의 SCRA채널)가 사용가능한 디코더에 선행 데이터(PCPV와 SCRA채널의 수)가 지시된다면, 프로덕션 믹스 데이터는 두 시그널이 1.0의 PCPV레벨 과 1.2의 SCRA레벨로 중앙스피커에 재생될 것이라는 것을 표시할 것이다.
그러므로, 프로듀서의 오리지널 의향은 실제적인 볼륨 레벨의 사용과 프로덕션 프로세스의 믹싱 스테이지에서 수행되는 밸런스 조정을 통해 실현된다. 선택적으로, 본발명의 결과처럼 지금 최종 청취자는 오리지널 프로덕션 믹스를 무시할수 있는 능력을 받고 그 자신만의 보이스 투 리메이닝 오디오의 믹스를 생성한다. 이 프로덕션 믹스 데이터를 심리스하게 통합하기 위해서( 모든 PCPV와 SCRA채널을 위한 크기 정보뿐만 아니라, 모든채널을 위한 공간적인 정보역시 포함한다 ) 공간적인 포지셔닝 제어와 크기 제어와 시간의 함수처럼 VRA 보조 데이터 채널에 직접적으로 정보를 전송하는 노브 로케이션을 탐지할 소프트웨어 알고리즘을 설계하는 것은 가능하다.
상기 예를 계속하여, 프로듀서는 PCPV와 비교하여 SCRA가 소프트해야하는 프로그램에서 그 시간동안 SCRA오디오를 낮출 것이다. 이 이동과 그후의 새로운 레벨은 알고리즘에 의해 탐지되고 VRA 보조 데이터 파일 포맷에 전송된 데이터 파일에 저장된다. 증폭 프로덕션 믹스 데이터는 사용자가 PCPV 와 SCRA둘 모두를 위해 분리하여 자동적으로 다른 프로그램들 간에 균일성을 설정하는 것을 허용할 것이다. 이것은 커머셜(commercials)와 프로그램 사이의 일정한 SPL에서 보이스 투리메인 뿐만 아니라 리메이닝 오디오(이 정보가 사용가능하지 않다면 음성을 불명료하게 할수 있다.)를 허용한다.
만약 프로듀서가 PCPV와 SCRA 시그널(다중-채널 또는 아닌)을 생성하여 정확한 프로덕션 믹스의 생성과 함께 선형적으로 부가될 때, 디코더 엔드에서 프로덕션 믹스의 재생성을 위해 증폭과 스페이셜 로케이션 정보의 모두를 전달할 필요는 없다. 만약 이 데이터가 VRA 보조 채널에 포함되지 않는다면, 디코더는 자동적으로 프로덕션 믹스를 위한 선형적인 조합을 디폴트 하여, 오리지널 프로그램의 정확한 프로덕션 믹스의 재생의 결과를 가져올 것이다.
PCPV 와 SCRA 특성 메타데이터- 듀얼 프로그램 오디오(PCPV 와 SCRA)와 함께 사용가능한 재생 특성을 더욱 강화시키기위해 사용될수 있는 다양한 메타데이터가 있다. 첫째로, 재생동안 PCPV와 SCRA 시그널 모두의 레벨을 디코더가 조절하기 위하여, 일시적인 존재에서, 레벨 정보는 포함될 것이다. 이것은 단순히 PCPV와 SCRA 시그널 모두의 실제적인 오디오와 타임-싱크로나이즈된 데이터 파일에 그것의 아웃풋을 해석하는 시그널 강도 탐지기를 포함할 것이다. 그 후 디코딩 프로세스는 자동적으로 각각의 시그널의 볼륨 레벨을 제어하기 위해 다른것과 관계하여 이 데이터를 이용할 수 있어 SCRA는 프로그램 트렌지언트의 그러한 타입동안 PCPV를 불명료하게 하지 않는다. PCPV와 SCRA 채널 모두의 다이나믹 레인지 정보는 비슷한 프로세스를 통해 역시 인코드 될 수 있다. 이것은 재생하는 경우, 사용자가 각각의 두 시그널(SCRA와 PCPV)의 다이나믹 레인지를 개별적으로 제어하는 것을 허용할 것이고 그것에 의해 작은 속삭임을 듣기(익스펜션)에 충분하게 크게 하거나 폭음을 방해되지 않도록(컴프레션) 충분히 소프트하게 하는 것을 허용한다. 이것의 키는 두 시그널은 독립적으로 제어될 수 있다는 것이다. 프로그램 프로바이더는 프로덕션 또는 소프트웨어 드리븐 알고리즘동안 보조 데이터 비트스트림의 파트로써 시그널 강도 오버 타임을 결정하고 그 같은 데이터를 자동적으로 생성할 수 있는 이 정보를 입력할 책임이 있을 것이다.
표준 메타데이터(metadata) 비트스트림(bitstream) 내의 VRA 보조 데이터 채널의 포함
상기에 상세하게 논의된 보조 데이터 비트스트림의 컨텐츠(contents)는 통상적인 CODEC 내의 메타데이터의 새로운 부분으로 포함된다. 일반적으로 통상적인 CODEC은 2가지 타입의 정보를 발신한다 : 오디오 및 메타데이터(오디오에 대한 정보). 여기서 논의된 실시태양에서 VRA를 지닌 오디오가 능력(capability)을 제어하는 것을 재생하는데 요구되는 오디오의 포맷(format) 및 메타데이터의 포맷이 상세히 기술된다.
VRA 보조 데이터를 포함시키기 위한 방법은 CODEC 의존적이 될 것이다. 즉, 무수한 CODEC이 존재하고, 따라서 보조 데이터가 특정한 CODEC의 메타데이터부분 내에 포함될 수 있는 무수한 특정한 방법이 있다. 그러나 대부분의 메타데이터 포맷이 부가적인 데이터의 옆에 위치 세트(location set)를 지닐 것이기 때문에 VRA 보조 데이터가 어디에 보관될 지는 일반적이다. 따라서 이는 디코더(decoder)가 "VRA 인식"이어야 하고 오리지날 CODEC의 메타데이터 스트림의 미리결정된 비어있는 위치 내에서 VRA 보조 데이터를 찾아야 한다는 것을 의미한다. 따라서 VRA-헤더(header) 데이터의 또다른 필수적인 특징은 VRA-보조 데이터가 CODEC을 위한 메타데이터 내에 위치하는 방식의 확인(identification)이다.
이러한 연결에서 VRA-가능한 오디오 코드를 위한 메타데이터 내의 유일한 차이점은 VRA 보조 데이터 채널 내에 포함된 정보가 2개의 유일하게 바람직한 별개의 시그널 : PCPV 및 SCRA의 생성에 대해 알려준다는 것을 강조하는 것이 중요하다. 통상의 기술은 돌비 프로-로직(Dolby Pro-Logic) 또는 5.1과 같은 종래의 오디오 포맷에 맞게 하는 전체 오디오 프로그램에 대한 메타데이터(예를 들어 다이나믹 범위 정보)를 생성할 수만 있다. 그러나 VRA-가능 오디오 프로덕션(production)을 가능하게 하기 위해 통상의 메타데이터 구조의 특정한 분야를 이용하는 것이 가능할 것이다. 예를 들어 PCPV 채널 및 SCRA 채널에 대한 다이나믹 범위 정보가 발신된다면 SCRA 다이나믹 범위가 통상의 오디오 포맷과 결합된 다이나믹 범위 세팅(setting)에 대한 메타데이터 파일 내의 동일한 위치 내로 위치함을 나타내는 플래그(flag)를 포함하는 것이 유용할 것이다. 그 후 PCPV에 대한 다이나믹 범위 정보만이 오리지날 메타데이터 채널의 빈 비트(bit) 위치 내로 고정될 필요가 있다.
VRA-가능 오디오 코드에서 이용하기 위한 특정한 압축 알고리즘
작업 처리량 및 보관 요구를 최소화하는 압축 알고리즘의 실행은 디지털 오디오 기술자 및 회사에 의해 널리 실행된다. 먼저 도입된 VRA 실시태양에 있어서, AC3 포맷 보다 손실이 더 적은 압축을 제공하는 압축 알고리즘을 이용하는 것이 필요하다는 것이 이미 논의되어 왔다. 또한 먼저 도입된 실시태양이 돌비 HI 조합 서비스와 현저히 다르다는 것이 논의되어 왔다. 설명은 하기에 제공된다.
돌비 디지털 CODEC으로 특별히 적용된 VRA 프로덕션 기술과 관련된 일반적인 CODEC의 이용
여기에 개시된 초기 실시태양은 어떤 특정한 CODEC의 압축 기술에 독립적이다. 예로서 프로듀서(producer)가 서라운드(surround) 오디오의 2개의 채널, 프론트(front) 오디오의 3개의 채널 및 더 작은 대역폭 서브우퍼(subwoofer) 채널을 포함한 멀티-채널 서라운드 프로그램을 생성시킬 수 있다는 것을 고려하시오. 이는 5.1 서라운드 사운드(sound)로 알려진 오디오 포맷이다. 이러한 프로그램은 돌비 디지털, DTS, MPEG를 포함하는 어떤 CODEC 또는 다른 어떤 코딩(coding)/디코딩(decoding) 스킴(scheme)에 의해서도 인코드될 수 있다. 오디오 포맷 자체는코딩 스킴과 독립적이다. 또한 모노(mono) 채널 프로그램은 이러한 CODEC에 의해 인코딩 및 디코드될 수 있다.
이러한 발명의 초점은 CODEC 자체가 아니라 오디오 포맷이다. 모든 종래의 오디오 포맷은 최종 사용자에게 공간적인 정보 단독만을 제공하는데 한정되었다. 여기서 제안된 오디오 포맷은 공간적인 정보에 더하여 오디오 포맷 내에 컨텐트 정보를 포함시킴으로서 멀티-채널 리메이닝(remaining) 오디오에 대한 멀티-채널 보이스(voice)의 비율, 빈도 컨텐트, 다이나믹 범위, 표준화 등을 조정하는 능력을 이용자에게 제공한다.
돌비 디지털(AC-3) CODEC에 대해 논의한텔레비전 표준에 대한 지침에서 기술된 현존하는 기술에는 2가지이 뚜렷한 차이점이 있다. 표준의 고유한 부분으로서 싱글 채널 보이스가 멀티-채널 리메이닝 오디오와 관련하여 발신되도록 허용된다. 부가적인 실시태양으로서 2개의 채널 보이스 및 2개의 채널 리메이닝 오디오도 또한 허용된다. 실제로 이는 프로듀서에 매우 한정적이고, 싱글 채널에 모든 관련된 보이스를 위치시키는 오리지날 프로그램의 재-프로덕션을 필연적으로 요구한다. 더욱이 보이스는 이러한 실행에서 싱글 채널 상에 뒤로 플레이만 될 수 있다. 대부분의 멀티-채널 프로그램은 두 번째 컨텐트 리메이닝 오디오와 첫 번째 컨텐트 퓨어(pure) 보이스 모두 멀티-채널 프로그램되는 것을 요구한다(중요한 보이스 및 리메이닝 오디오 세그먼트(segment)는 싱글 공간의 위치에 제한되지 않기때문에). 따라서 현존하는 기술의 견지에서 여기 개시된 실시태양은 2개의 현저한 장점을 지님이 명백하다 :
멀티-채널 능력- VRA 오디오 포맷은 멀티-채널 PCPV 및 멀티-채널 SCRA에 있어서 이용자가 원하는 비율을 선택하게 하는 동안에도 프로듀서가 모든 예술적인 라이센스(liscense) 필요(necessary)를 연습하게 하는 것을 허용한다.
CODEC 독립성- VRA 오디오 포맷은 CODEC 특성에 독립적으로 실시하도록 고안되어, 어떤 CODEC으로도 이용될 수 있다.텔레비전 표준에 대한 지침에서 관련된 서비스를 감소시키는 히어링은 돌비 디지털 명세서 내에 레이 아웃된 대로만 작용할 수 있다.
따라서 본 다큐먼트(document) 내에 특정화된 VRA 오디오 포맷은 CODEC으로서 돌비 디지털로 이용될 수 있다. 특정화된 VRA 오디오 포맷은 사용자의 먼트롤(contro)에서의 멀티-채널 PCPV 및 멀티-채널 SCRA의 플레이백(playback)에 대한 필요한 보조 데이터를 포함한다. 이러한 보조 데이터는 압축될 수 있는(또는 그렇지 않은), CODEC 명세서 자체에 따라 AC-3 압축 스킴이 오디오 프로그램 컨텐트에 따라 큰 손실 및 높은 압축 비율을 초래하는 어떤 오디오 CODEC(돌비 디지털을 포함하나 이에 한정적이지는 않음) 및 PCPV 및 SCRA의 오디오 정보의 메타데이터의 부분 내에 포함될 수 있다.
CODEC 독립성의 특징은 소프트웨어 플랫폼(platform)을 가로지를 수 있는 특징의 VRA의 지지에 중요한 것이다. 최종 사용자에게 멀티-채널 세팅 내에 리메이닝 오디오에 대한 보이스를 제어하는 능력을 제공하는 것이 중요하다. AC-3이 이러한 목적을 달성하기 위해 싱글 채널 메카니즘을 포함하는 반면, 다른 CODEC은 그렇지 않다. 본 발명은 작동할 CODEC을 선택할 때 프로듀서로 하여금 플레잉 필드(field)를 고르게 하도록 한다. CODEC은 VRA를 수행하는 능력보다는 압축 및 감압 알고리즘의 수행에 기초하여 선택될 수 있다. 이는 모든 CODEC이 최종 사용자에게 VRA 기능성을 제공하게 한다.
따라서 VRA-가능 CODEC은 실질적으로 어떤 현존하는 오디오 압축 알고리즘과 양립 가능하게 될 수 있다. 따라서 본 발명은 필수적인 VRA 보조 데이터, PCPV/PCA 싱글 및 가능하게는 SCRA 시그널에 기초하여 수많은 VRA-가능 압축 포맷의 생성을 포함한다. 이에 기초하여 하기 디지털 오디오 포맷이 앞서 기술된 실시태양을 이용한 VRA-가능 버전의 생성을 지지할 수 있고, 상기 기술된 VRA 오디오 코드의 일 부분으로서 이용되도록 압축 알고리즘으로서 작용한다는 것이 명백하다 :
-DTS-VRA-가능 압축
-최적화된 PCM VRA-가능 압축
-자오선 비손실 팩킹(Meridian Lossless Packing) VRA-가능 압축
-스피치(speech)-전용 코덱 부속물을 지닌 MP3 압축
-돌비 디지털, AC3 - VRA-가능 압축
-MPEG-2 VRA-가능 압축
-MPEG-4 VRA-가능 압축
VRA-가능 코드에 이용되는 많은 다른 압축 알고리즘이 있고, 이들은 당업자에게 잘 알려져 있다. 이러한 알고리즘에서의 VRA-성능의 설비는 VRA 채널 및 보조 데이터의 특정한 처리가 뒤따르는 인커밍(incoming) VRA 정보의 확인에 기초하여야 할 것이다. 표준화된 비트-스트리밍(bit-streaming) 레벨에서 이를 달성하는 많은 방법이 있을 것이나 이들 방법은 디지털 오디오의 표준에 숙달된 사람에게 수월하다. 이는 여기 개시된 발명의 많은 관점의 하나인 이들 압축 알고리즘 내로의 PCPV/PCA/SCRA 시그널 및 보조 데이터의 포함이다.
VRA-가능 디코더
VRA-오디오 프로덕션 처리의 플레이백 결말에서 VRA-가능 디코더에 요구될 특징을 표현하는 많은 기능적 설명이 있다. 이러한 설명은 하기에 제공된다.
VRA-헤더 인식 : 디코더는 VRA-헤더 데이터에 이용되는 다른 비트 패턴을 인식하도록 장비될 것이다. 헤더의 특정 수치는 어떻게 디코더가 인커밍 VRA-가능비트스트림을 조정할지를 결정할 것이다. 이러한 특징은 당업자에 의해 다양한 방법으로 실행될 수 있다. 예를 들어 비트 마스킹(masking) 기술, 로직(logic) 실시 또는 인커밍 비트스트림의 VRA-유능을 나타내는 다른 방법이 이용하는 것이 가능하다.
모드-스위칭 : 디코더는 멀티-채널 오디오 플레이백(즉, 5.1 오디오 또는 7.1 오디오)을 위한 통상의 디코딩 소프트웨어 또는 PCPV/PCA 및 SCRA 시그널이 포함될 VRA-플레이백 모드와 플레이백 장치에 부착된 스피커로 전송되는 플레이백 시그널 사이를 토글(toggle)하도록 프로그램될 것이다.
시그널 루팅 : 디코더는 PCPV/PCA 및 SCRA 시그널에 대한 적당한 공간-시간적 플레이백 정보를 결정하는 VRA-보조 데이터 내 정보를 이용할 것이다.
역행 호환성(Backwards Compatibility) : 디코더는 비-VRA-가능 오디오 프로그램의 플레이백도 조정할 수 있을 것이다. 이는 앞서 논의된 VRA-헤더 인식 기능의 로직 출력을 이용함으로서 달성될 것이다.
디코딩 및 플레이백 특징에 대한 더욱 상세한 것은 하기에 기술된다.
최종 사용자 제어 및 플레이백 위치에서의 VRA 보조 데이터, PCPV 및 SCRA채널의 최종 기능성
상기에 상세히 기술된 바와 같이 VRA 보조 데이터는 CODEC을 통해 발신되거나 기록되는 PCPV 및 SCRA 채널에 대한 다양한 정보를 포함한다. 보조 데이터 내에서 최종 사용자에게 전송되는 정보에 더하여 별도로 전송되는 PCPV 및 SCRA 채널을 지니는 결과로서 실행될 수 있는 디코더 특정 기능이 일부 있다. 2가지 타입의 기능(보조 데이터 제어 및 PCPV/SCRA 디코더 제어)은 디코더 자체의 실시에 대한 특정한 참조와 함께 하기의 불레트된(bulleted) 아이템 내에서 상세히 설명된다.
VRA 보조 채널 확인- VRA 보조 채널 헤더 파일의 부분으로서 현존할 때 디코더는 특정화된 비트를 폴링(polling)함으로서 VRA 보조 채널의 존재르 인식할 것이다. 비트가 제로(오프(off))이면 디코더는 VRA 보조 데이터가 없고, 따라서 별도의 PCPV 또는 SCRA 채널이 없다고 인식한다. 디코더가 확인 비트가 하나(온(on))이라고 인식하면 최종 사용자가 원할 경우 디코더는 PCPV 및 SCRA 채널을 별도로 디코드 할 수 있고, 데이터를 처음부터 기록하거나 브로드캐스트하는데 이용되는 CODEC에 의해 제공된 설명서(specification)를 확인한다. 확인 비트는 단순하게 디코더가 인커밍 데이터가 VRA 가능이라고 인식하도록 하고(즉, PCPV 및 SCRA 구성요소를 포함함), 어떤 프로그래밍에 대해도 변할 수 있다.
프로덕션/사용자 믹스(mix)- 이러한 특징은 VRA 보조 데이터 채널 자체 내에 포함된 정보 조각보다는 사용자 입력을 나타낸다. 사용자는 프로덕션 믹스 또는 사용자 믹스를 선택하는 선택권을 지닌다. 사용자 믹스가 선택되면 다양한 오디오 제어 기능이 이용될 수 있다(차후에 논의됨). 프로덕션 믹스 세팅은 대부분의 디코더 세팅 상에서 디폴트(default)로 간주되기 쉬울 것이다.
프로덕션 믹스가 선택되면 디코더는 증폭 데이터 및 CODEC 메타데이터 부분 내에 파묻힌 VRA 보조 채널 내에 그들의 특정화된 위치로부터 각각의 PCPV 및 SCRA 채널 상의 공간적 위치 데이터를 수집할 것이다. 이러한 증폭 및 공간적 위치 데이터는 오디오 프로그램을 생성하는(및 인코딩 특징 섹션(section) 내에서 논의된 바와 같이 생성됨) 오디오 프로덕션 기술자의 오리지날 인텐트(intent)를 표현한다. 공간 정보의 각각의 채널 및 각각의 2개의 시그널(PCPV 및 SCRA)에 대하여 증폭 데이터는 멀티플리케이션(multiplication) 실시를 통해 적용된다.
공간 포지셔닝(positioning) 정보가 요구되면(예를 들어 하나의 스피커 위치에서 또다른 위치로 이동할 수 있는 싱글 보이스 트랙(track)이 있으면) 정보는 리포지셔닝(repositioning) 명령으로서 적당한 채널에 적용된다. SCRA에 대한 PCPV의 증폭 및 포지션잉이 시간에 따라 변할 것이기 때문에 디코더는 보조 채널 데이터를 항상 폴(poll)할 것이고, 각각의 PCPV 및 SCRA 시그널에 적용된 세팅 및 결합된 채널을 계속적으로 업데이트(update)할 것이다.
또한 PCPV 및 SCRA 채널이 무겁게 프로듀스(produce)되어 각각의 PCPV 및 SCRA 시그널 내의 각각의 채널의 단순한 첨가가 정확한 프로덕션 믹스를 유발하면 VRA 보조 데이터 채널 내에서의 증폭 또는 공간적 위치 정보를 발신할 필요가 없다는 것이 주지되어야 한다. 이러한 데이터가 존재하지 않는다면 디코더(프로덕션 믹스 모드 내일 경우)는 프로덕션 믹스를 달성하는 선형 결합을 디폴트할 것이다. 이러한 기능의 최종 사용자 제어는 소프트 메뉴(스크린 상에서와 같이)를 통해 조종된 소프트웨어 또는 프로덕션과 사용자 믹스 선택 사이에 위치를 변화시키는 단순한 토글 스위치에 의해 조종된 하드웨어가 될 수 있다.
사용자 레벨/공간적 믹스- 상기에 기술된 사용자 믹스 토글이 선택되면 프로덕션 믹스는 무능력해지고, 최종 사용자는 PCPV 및 SCRA 시그널을 걸쳐 제어를 완료한다. 대부분의 기본적 조정(및 아마도 대부분 유용한)은 PCPV 및 SCRA의 레벨 및 공간적 포지셔닝 및 서로의 관련된 채널 독립성을 제어하는 능력이다.
오디오 포맷에 따라서 각각의 PCPV 및 SCRA 채널은 다수의 공작적으로 의존적인 채널을 포함한다. 공간적 채널은 모두 독립적이고, (VRA 오디오 포맷에서) PCPV 및 SCRA 시그널이 독립적이기 때문에 사용자는 진폭(멀티플리케이션을 통해) 및 각각의 독립적 시그널의 공간적 포지션(재위치화를 통해)을 조정하는 능력이 제공될 것이다. 최종 사용자에게 이러한 기능성을 제공하는 것은 어떤 부가적인 대역폭을 요구하지 않는다 즉 , 어떤 보조 데이터도 필요하지 않다. 진폭 및 공간적 포지셔닝은 디코더 그 자체가 아닌 2개의 시그널(PCPV 및 SCRA) 및 PLAYBACK 하드웨어 또는 소프트웨어(볼륨(volume) 마디 및 포지션 조정) 일부분으로서의 그들의 독립적 채널 상에서 수행된다. 이러한 하드웨어는 싱글 유니트로서 인코더(encoder)와 함께 포함되거나 디코더와는 별도로 부가적인 유니트로서 실시된다.
상기 기술은 이루어질 수 잇는 조정의 가장 일반적인 세트 및 전체 공간적 위치 및 각각의 2개의 시그널(PCPV 및 SCRA) 내에서 각 멀티 채널의 증폭을 제어하고자 하는 최종 사용자를 나타낸다. 그러나 가장 일반적인 조정 능력은 표준 사용자에게 너무 복잡하기 쉽다. VRA 가능 소비자 전자 장치에 대한 통합적 부분으로서 유용하게 될 용이한(사용자 친화적으로) 메카니즘을 통해 리메이닝 오디오에 대한 보이스의 비율의 최종 사용자 조정을 허용하는 것은 또다른 실시태양이 기술되는 이유이다.
도 13은 디지털 비트스트림을 수신하고, 그의 2개의 오디오 부분으로의 시그널을 디코드하는 VRA 포맷 디코더 1310을 나타낸 것이다 : PCPV 1320 및 SCRA 1330 시그널. 전술된 바와 같이 이들 각각의 시그널은 최종 사용자 조정 후 총 프로그램을 형성하도록 함께 첨가된 멀티 채널을 포함한다. 상기 단락에서의 실시태양은 이러한 멀티 채널 각각의 최종 사용자 조정을 논의한다.
또한 도 13에 나타난 실시태양은 모든 PCPV 채널 및 모든 SCRA 채널의 전체 레벨을 제어하여 원하는 VRA 비율의 효과를 나타낼 싱글 조정 메카니즘 1340을 나타낸다. 이는 보이스 및 리메이닝 오디오의 원하는 레벨을 나타내는 2개의 전압을 생성하는 밸런스(balance) 스타일 아날로그 분압기를 처음으로 이용함으로서 디지털 도메인(domain) 내에서 수행된다.
예를 들어 마디(knob)가 시계방향으로 돌아갈 때 좌측 상의 변화가능한 저항기는 공급 전압을 향해 위로 이동하고, 시그널 그라운드(ground)로부터 멀어진다. 이는 와이퍼(wiper) 전압이 증가하게 유발한다. 아날로그에서 디지털로의 변환기 1350은 전압을 판독하고, 이에 디지털 수치를 지정하여 모든 PCPV 시그널(얼마나 많이 디코드되는 것에 관계없이)에 멀티플라이(multiply)된다. 또한 분압기가 반시계 방향으로 이동하면 우측 상에서의 변화가능한 저항기는 와이퍼 상에서 전압을 증가시키는 공급 전압을 향해(및 그라운드로부터 멀리) 이동한다.
이러한 전압은 디지털 수치로 변환되고, 모든 디코드된 리메이닝 오디오(SCRA) 시그널에 멀티플라이된다. 싱글 마디를 이용한 이러한 배열(arrangment)은 사용자로 하여금 보이스 및 리메이닝 오디오의 독립적인 레벨을 단순하고 용이하게 제어하여 원하는 청취 비율을 달성할 수 있게 한다. 멀티플리케이션 후 디코드된 많은 채널 내에서 총 오디오 프로그램을 형성하도록 각각의 PCPV 채널은 각각의 SCRA(중앙이 첨가되고, 좌측이 첨가되는 각각의 방식으로) 내로 첨가된다. 최종적으로 더한 레벨 조정은 조정된 총 프로그램 오디오가 각각의 공간적 채널에 대한 아날로그 변환기 1360을 통한 디지털을 통해 증폭기 및 스피커로 전송되기 전에 싱글 분압기(주요한 볼륨 제어)만을 이용하는 것을 제외하고는 유사한 방식으로 총 오디오 시그널에 적용될 수 있다.
사용자 균등화(equalization) 제어- 최종 사용자에게 PCPV 및 SCRA 시그널 조정을 더욱 제공할 더욱 진보된 특징은 PCPV 및 SCRA 시그널의 주파수 웨이팅(weighting)을 개별적으로 조정할 수 있는 능력이다. 이는 높은 주파수를 약화하는 청취 손상의 특정한 타입의 사람에게 유용하다. PCPV(보이스) 시그널의 단순한 레벨 조정은 귀가 더 낮은 주파수에서 채워지기(saturate) 시작하기 전에 명료도에서의 필요한 증가를 제공하지 않는다. PCPV 시그널의 주파수 의존적 조정(균등화로도 알려짐)을 가능하게 함으로서 증진된 명료도가 프로그래밍의 특정 타입에 대해 달성된다. 더욱이 SCRA 시그널 내의 매우 낮은 주파수 정보(파열과 같은)는 PCPV 채널 내의 스피치 포맷을 가린다. 스피치 명료도를 진보시키는 동안 SCRA 시그널의(PCPV 시그널로부터 독립적임) 주파수 의존적 레벨 제어는 SCRA 채널 내의 중요한 중앙-주파수 오디오 구성요소를 보유한다. 다시, 이는 PCPV 및 SCRA 채널이 VRA 오디오 포맷을 이용하여 인코드되고 디코드되는 한 디코딩 처리로부터 개별적인 하드웨어 내에서 수행될 수 있어서 보조 채널 내로 발신되는 여분의 정보를 요구하지 않는다.
PCPV 및 SCRA 특정 메타데이터- 이중 프로그램 오디오(PCPV 및 SCRA)과 함께 유용한 플레이백 특징을 더욱 강화하는데 이용될 수 있는 인코더 논의에 포함된 다양한 메타데이터가 있다. 상기 논의된 레벨, 공간 및 균등화 조정과는 달리 이들 특징은 인코드된 VRA 보조 데이터가 비트스트림의 부분으로서 메타데이터 내에 존재하기를 요구한다. 이러한 특징은 시그널 레벨, 다이나믹 범위 압축 및 표준화를 포함한다.
인코딩 처리의 부분으로서 발신된 시그널 레벨은 독립적이고 시간의 기능으로서 PCPV 및 SCRA 채널의 레벨에 대한 데이터(디코딩 위치에서)를 제공할 것이다. 그 후 이러한 데이터는 오디오 트랜지언트(transient)의 존재하에서 사용자 선택된 VRA 비율을 유지하기 위해 독립적이고 동시에 PCPV 및 SCRA 채널의 레벨을 제어하는데 이용될 수 있다. 예를 들어 SCRA 채널의 시그널 레벨 데이터는 특정한 세그먼트동안 파열이 PCPV(보이스)를 이길 것이고, 분할에 의해 얼마만큼 인지를 나타낼지를 나타낸다.
따라서 디코딩 처리는 사용자 선택된 VRA 비율을 보유하도록 적당한 양까지 SCRA의 시그널 레벨을 자동적으로 조정하는 플레이백 하드웨어와 함께 정보를 이용할 수 있다. 이는 사용자가 항상 전체 프로그램을 통해 상대적인 레벨을 조정하는 것을 방지한다.
다음으로, 비트스트림 내에 존재하는 다이나믹 범위 정보는 사용자로 하여금 PCPV와 SCRA 시그널 모두에 대한 다른 플레이백 범위를 독립적으로 선택하게 할 것이다. 사용자는 전체 다이나믹 범위의 100%의 기능으로서 원하는 압축 또는 팽창으 선택하고, 이는 그들의 조합 전에 각 시그널에 적용된다.
최종적으로 레벨 정보와 다소 다른 표준화 정보는 프로그램에서 프로그램으로 PCPV와 SCRA 시그널 모두의 RMS 또는 시그널 강도 게이지(guage)를 제공한다. 이러한 데이터는 보조 데이터 헤더 파일의 부분으로서 발신만 되고, 전체 프로그램에 적용될 것이다. 사용자가 선택하면 이러한 정보는 프로그램을 가로질러 SCRA 시그널의 레벨을 표준화할 뿐만 아니라 모든 프로그램을 가로질러 PCPV 시그널을 표준화하는데 이용될 수 있다. 이는 A) 하나의 프로그램으로부터 다음으로 들린 대화(dialog)(PCPV)는 일정한 레벨(SPL)에서 유지될 것이고, B) 하나의 프로그램으로부터 다음으로 들린 파열(explosion)(SCRA)은 일정한 레벨(SPL)에서 유지될 것이다.
VRA 오디오 포맷을 이용하여 인코드 하였을 때 이러한 모든 기능들은 오직 PCPV 및 SCRA 시그널을 위해 가능하다. 만약 그들이 프로덕션 믹스 단독으로만 적용된다면 이와 동일한 효과는 실현되지 않을 것이며 그 이유는 프로덕션 믹스가 PCPV(보이스) 및 SCRA(리메이닝 오디오)를 완벽하게 결합한 것을 포함하고 있고 분리할 수 없기 때문이다.
아키벌(Archival) 실시태양
최종 사용자가 궁극적으로 VRA 조정으로부터 편의성을 제공받기 위한 방법으로 VRA 정보의 저장에 사용될 수 있는 넓은 범위의 아키벌 형상에 관해 설명하기 위해 하기와 같이 실시태양을 표현할 수 있다. 여기에 기록된 모든 아키벌 실시태양의 일반적인 주제는 각각의 것이 PCPV/PCA 시그널 및/또는 SCRA 시그널 및/또는 VRA-헤더 및/또는 VRA-보조 데이터의 저장을 실시하기 위한 것이 아니라 VRA-가능한 아키브 디지털 오디오 매체로 될 수 있게 하기 위해 열거된 매체가 가능한 변형을 허용 할 수 있는 것인 아키브 디지털 오디오 매체의 형식을 표현하는 것이다. 하기한 아키브 매체를 위해 'VRA-가능한 사운드 트랙'의 라벨은 특별한 채널로써 저장된 PCPV/PCA/SCRA 시그널 및/또는 충분한 VRA-보조 데이터를 지니는 사운드 트랙을 언급하는 것이다. 또한 이때 이러한 시그널의 하나 또는 모두는 구축되고 전에 인트로듀스된 VRA 디코더 형상을 이용하여 플레이백 할 수 있다. 또한 VRA-가능한 사운드 트랙의 정의는 본 발명 자체의 것이며 이미 전술한 바와 같이 수행을 위해 요구되는 다양한 하기 실시태양에 의해 표현된다.
- CD 위에 두 개의 별개 트랙에 저장된 PCPV/PCA 및 SCRA 시그널의 LPCM 버전을 지닌 CD. 이러한 실시태양은 스테레오 포지셔닝을 희생할 것이다.
- CD 매체 위에 발견된 종래의 스테레오 시그널과 함께 저장된 PCPV/PCA의 최적 LPCM 버전을 지닌 CD.
- DTS VRA-가능한 사운드 트랙을 지닌 DVD 무비
- LPCM VRA-가능한 사운드 트랙을 지닌 DVD 무비
- MLP VRA-가능한 사운드 트랙을 지닌 DVD 무비
- MPEG-4 VRA-가능한 사운드 트랙을 지닌 DVD 무비
- MPEG-2 VRA-가능한 사운드 트랙을 지닌 DVD 무비
- 돌비 디지털 VRA-가능한 사운드 트랙을 지닌 DVD 무비
- VRA-가능한 포맷을 지닌 DVD 오디오 디스크
- VRA-가능한 포맷을 지닌 수퍼 오디오 CD
VRA-가능한 버전의 생산을 위한 현존의 오디오 마스터 테이프의 리-아서링(Re-Authoring)
중요한 보컬 성분을 지닌 영화 또는 다른 오디오 프로그램에 VRA 조정을 제공하는 또 하나의 장점은 청취자에 의한 스피치 이해력을 증진시키는 것이다. 이것은 청각 손상 개인에게는 확실한 사실이다. 이 때 아날로그 포맷에 대한 디지털 포맷이 존재하는 수천 종의 필름이 있다. 이들 필름 중 아무것도 VRA 가능하도록 제작되지 않은 것은 사실이다. 그러므로 상응하는 VRA-보조 데이터와 함께 PCPV/PCA/SCRA 시그널이 생성되기 위한 아날로그 사운드 트랙인 VRA-가능하지 않은것에 '리-아서링'할 필요성이 생긴다. 이러한 새로운 정보는 상기에 설명한 VRA-가능한 디지털 마스터 포맷의 어느 하나에 저장시킬 수 있다. 본 발명은 청각 장애 커뮤니티에 사용할 수 있는 넓은 범위의 VRA-가능 필름을 제공한다.
비디오-온-디맨드 VRA-가능한 사운드 트랙 아키브 및 데이터 베이스
디지털 오디오와 스트리밍 비디오/오디오의 출현은 '비디오-온-디맨드'라 불리우는 새로운 기회를 가능케 한다. 비디오-온-디맨드(VOD) 시스템은 사용자의 디지털 텔레비전(또는 세트-톱 전환 박스를 지닌 아날로그 텔레비전을 사용한)의 한번 플레이백을 위한 모뎀 또는 ISDN 라인을 통해 선택된 영화 또는 다른 프로그램의 다운로드를 사용자가 가능케 한다. 이 때에, VRA-가능한 사운드 트랙을 지닌 VOD 데이터 베이스인 필름은 없다. VRA 조정 하드웨어가 장래에 소비자 전자 제품에 통합됨에 따라 VOD 사용자는 아마 VRA-가능한 사운드 트랙을 오더 하는 것을 선호할 것이다. 그러므로 이러한 실시태양은 예측되는 요구에 부합하기 위한 것이다. 첫 번째 발명은 VRA-가능한 사운드 트랙을 지닌 필름을 포함하는 VOD 데이터 베이스이다. 이러한 VRA-가능한 비디오는 청각 장애 청취자 또는 VRA 조정을 사용하기를 즐기는 시청자에 의해 다운로드 될 수 있다.
본 발명의 또 다른 관련 측면은 새로운 아키브가 VRA-가능한 사운드 트랙 오디오만으로 구성된 곳에서 상응하는 비디오 정보 없이 새로운 오디오 사운드 트랙의 아키브를 창출하는 것이다. VRA-가능한 영화를 위한 오디오 부분만의 아키브는 VOD 데이터 베이스를 위한 저장 요건 속에 넓은 세이빙을 제공할 것이다. VRA-가능한 사운드 트랙(비디오 없이)은 또 다른 형상과 덧붙여 VRA-가능한 시스템을 가능케 하기 위한 실시태양을 위하여 이미 전술한 것과 동일한 방법으로 창출될 것이다. 이러한 VRA-가능한 사운드 트랙은 만약 VRA-불가능한 사운드 트랙이 타임 마크가 가능하다면, 크로스-상관 시그널 프로세싱 테크닉 및/또는 타임 싱크로나이징 방법을 이용하여 오리지널 활동 영화 또는 프로그램의 오디오 부분에 타임 싱크로나이즈 될 것이다. 이러한 두 가지 방법은 오리지널 필름 위에 위치하고 있는 VRA-가능한 오디오 정보와 VRA-불가능한 오디오 정보간의 상호 관련을 줄 수 있게 한다. 상호 관련이 최적화 된 후에 오리지널 사운드 트랙을 뮤트시키고 VRA-가능한 사운드 트랙을 온시켜 영화를 상영할 수 있다.
MP3 VRA-가능한 뮤직 아키브
MPEG-2 Layer Ⅲ(MP3)의 사용은 인터넷 매체 데이터 백 디바이스를 통한 아키브된 데이터 베이스로부터 음악을 녹음하는데 매우 흔한 방법이 되었다. 이 전의 시스템에서 정의한 VRA-가능한 디지털 오디오 파일은 MP3 포맷에도 물론 적용할 수 있다. 그러므로 본 발명은 청취자에 의해 다운로딩 받기 위한 특별한 데이터 베이스를 포함하는(상업적 또는 또 다른 방법으로) VRA-가능한 MP3 녹음의 창출에 관한 것이다.
도 14에서, 블록 다이아그램의 상부 세그먼트는 프로듀서로부터 사용자에게 오디오 프로그램을 전달하기 위한 기술의 현재 상태를 나타내는 것이다. 프로덕션의 전후에 많은 종류의 오디오 세그먼트가 멀티-트랙 레코드 포맷(1405)속에 엔지니어가 사용할 수 있고, 이 포맷은 가까운 마이크로폰 레코딩, 먼 마이크로폰 사운드, 사운드 이펙트, 라프 트랙 및 전체의 오디오 프로그램을 형성하는 다른 가능한 사운드를 포함하는 것이다. 그리고 사운드 엔지니어는 이들 요소 각각을 첨가하고 효과를 주며 공간에 위치시키거나 존재하는 오디오 포맷(1415)에 일치시키기 위해 사운드 요소를 결합시킨다. 이와 같은 존재하는 오디오 포맷(1415)은 모노, 스테레오, 프로-로직, 5.1, 7.1 또는 엔지니어가 일치하려고 하는 또 다른 오디오 포맷을 일치할 수 있다.
일단 프로그램이 원하는 포맷 속에 생성되면 메타 데이터를 포함하는 코딩 스킴(1420)으로 전달된다. 코딩 스킴의 어떠한 수(number)도 언컴프레스, 로스 없는 컴프레션 또는 로시 컴프레션 기술을 포함하는 이 단계를 포함하여야 한다. 통상적인 코딩 스킴 중 일부는 돌비 디지털, MPEG-2 Layer 3(오디오를 위한), Meridian Lossless Packing 또는 DTS를 포함한다. 이러한 코더의 아웃풋은 플레이백 또는 방송을 위한 방송 또는 녹음의 디지털 비트스트림이다. 디지털 비트스트림의 접수 후에 디코더(1425)는 만약 사용한다면 오디오와 메타 데이터를 생성한다. 코더(1420)와 디코더(1425)의 결합은 종종 코덱(CODEC)(예를 들면 코더-디코더)으로 표시되는 문헌들에 언급된다. 메타 데이터(1430)는 다이나믹 레인지 인포메이션으로써의 형상을 포함하는 오디오 데이터에 관한 데이터로 인식될 수 있고 유용한 별개의 채널의 수 및 오디오 데이터 위에 사용된 컴프레션 형태로도 인식될 수 있다.
도 14의 낮은 부분은 여기에 설명하는 발명을 구체화시킨 것을 나타내는 것이다. 멀티-트랙 레코딩으로부터 시작하여 VRA 생성기술(1435)은 모든 이전의 것들과 확연히 구분되는 새로운 오디오 포맷의 형성을 위해(여기에 개시된 명세서에 일치시키기 위해) 사용한다. VRA 포맷 그 자체는 VRA 오디오 데이터 코드(1445)인 형상으로 나타내진 그 자신의 메타 데이터를 지닌다.
더욱이, 포맷의 선행은 오디오 트랙으로부터 오디오 채널을 발생시키기 위한 공간에 초점을 두는 것으로 이러한 포맷의 초점은 프로덕션 수준의 마스터 오디오 트랙으로부터 콘텐트(CONTENT) 뿐만 아니라 스페이셜(SPATIAL)을 발생시키는데 있는 것이다. 여러 가지 중에서 콘텐트 포션과 플레이백 사이트에 공간적 위치로의 바람직한 프로덕션 믹스(사운드 엔지니어에 의해 조작되는)는 VRA 프로덕션 테크닉을 통해 보조 데이터 스트림의 창출에 의해 보지되고 조정된다. 보조 데이터라는 관점에서 PCPV(primary content pure voice)와 SCRA(secondary content remaining audio)는 어떠한 표준 CODEC 또는 이와 유사한 종래의 기술에 의해 사용된다. CODEC(1450, 1455)은 메타 데이터 속에 포함된 오디오 및/또는 정보의 콘텐트와 포맷에 특별한 영향을 주지 않는다. 다만 그가 수취한 어떤 데이터를 코드화시키고 재생 위치에서 이를 디코드 하는 것이다. 일단 오디오 데이터(PCPV 및 SCRA)와 보조 데이터(CODEC 메타 데이터를 통한)가 수취되고 디코드 되면 최종 사용자는 보조 채널 아이덴티피케이션(1470)과 컨트롤 데이터(1465)(만약 이것이 존재하고 인식된다면)를 조절할 수 있다. 그리고 PCPV와 SCRA 채널은 이들 최종 사용자의 조정(1460)에 의해 컨트롤된다. 만약 오리지널 CODEC에 의해 요구되고 존재한다면 추가적 메타 데이터가 VRA 오디오 포맷의 수행과 이와 관련된 재생에 영향을 주지 않고 플레이백(1480)을 더욱 컨트롤 할 수 있도록 사용될 수 있다.
여러 가지 형태의 실시 태양이 여기에 도시되고 설명되어 있지만 본 발명의 여러 가지 변이와 모디피케이션은 본 발명의 범위와 정신으로부터 첨부된 청구범위에 의해 해석되고 커버될 것이다. 특히 본 발명이 포함하는 것은 다음과 같다.
- PCPV/PCA 시그널과 SCRA 시그널의 형상을 평행하게 입력하는 것을 허용하고, 스피치 온리 압축 알고리즘을 사용하여 PCPV/PCA 시그널을 압축하고, 두 개의 오디오 시그널과 이에 동행된 비디오간에 비디오 프래임의 싱크로나이제이션 오리지널 타임 배열에 손상 없이 일반적인 오디오 압축 알고리즘을 사용하여 SCRA 시그널을 압축시키며, 특정한 압축 알고리즘 및 시그널을 위해 사용되는 신텍스 방법에 의해 한정되는 상응하는 관련 데이터와 함께 두 개의 압축 비트스트림을 멀티플렉스 시키고, 상기 멀티플렉스 비트스트림을 VRA-가능한 파일로 저장하거나 또는PCPV/PCA와 SCRA 시그널을 분리시키는 상응하는 디-멀티플렉서로 전송시키고, 적절한 탈압축(decompression) 알고리즘에 의해 이들을 라우팅 시키고, 저장 매체에 두 개의 시그널을 보내거나 최종 소비자를 위한 VRA 조정이 가능한 플레이백 디바이스 또는 볼륨 컨트롤에 시그널을 보냄을 특징으로 하는 VRA-가능한 코덱
- PCPV/PCA와 SCRA 시그널을 압축시키기 위해 사용되는 일반적 압축 알고리즘과 특별한 보이스-온리 압축과는 서로 독립적임을 특징으로 하는 VRA 코덱
- VRA-가능한 디지털 마스터 또는 VRA-가능한 아키브된 오디오 파일의 데이터 헤더를 인식하고 보이스-온리 압축과 일반적 오디오 압축을 통해 PCPV/PCA 및 SCRA 시그널의 평행적 압축을 자동적으로 수행하는 단계로 된 VRA 인코딩 과정
- 다수의 사용 가능한 '스피치-온리' 압축과 '제너럴 오디오' 압축 알고리즘
- 들어오는 VRA-멀티플렉서 관련 데이터를 인지하고 VRA 비트스트림을 분리된 PCPV와 PCA 시그널로 디멀티플렉스 탈압축시키는 VRA-가능한 디코더
- PCPV/PCA 및 SCRA 시그널이 플레이백 디바이스에 부착된 스피커로 송신된 플레이백 시그널을 포함하는 곳에서 멀티플-채널 플레이백을 위한 종래의 디코딩 소프트웨어와 VRA-플레이백 모드간에 토글(toggle)된 프로그램인 VRA-가능한 디코더
- PCPV/PCA 및 SCRA 시그널을 위해 적절한 스페이시오-템포랄 플레이백 인포메이션을 결정하기 위해 VRA 보조 데이터 정보를 이용하는 VRA-가능한 디코더
- 만약 들어오는 오디오가 VRA-가능한 것 또는 아닌지를 결정하기 위해 확인 비트(온 또는 오프)의 특정화에 의해 VRA 보조 데이터의 존재를 인식하는 VRA-가능한 디코더
- PCPV/PCA 및 SCRA 시그널이 오디오 압축 단계 후에 엔크리프트(encrypt)되고 탈압축 단계 전에 언-엔크리프트되는 곳의 상기와 같은 VRA-가능한 코덱
- VRA 보조 데이터 및 또는 보조 데이터 채널을 이용하는 것으로, 상기 VRA 보조 데이터는 보조 데이터 속에 특정한 비트 패턴을 통해 VRA-가능한 코덱으로 확인될 수 있도록 창출되고, 스페이셜 오디오 플레이백 형상 속에 사용되고 있는 PCPV/PCA 및 SCRA 채널의 수를 확인하며, 상기 오디오 프로그램의 다른 시간에 다른 스페이셜 플레이백을 나타내기 위해 보조 데이터 속에서 로케이션의 변화에 변화할 수 있도록 다수의 채널을 위한 스페이셜 플레이백, VRA 플레이백을 사용하고 최종 청취자에 의해 볼륨을 조절할 수 있도록 하기 위한 프로덕션 믹스 데이터를 확인하고, PCPV/PCA 및 SCRA 특정 메타 데이터를 포함하는 것을 특징으로 하는VRA-가능한 코덱
- 여기서 정의된 VRA 보조 데이터를 위한 목적으로 특정한 손실 없이 다른 코덱 속에서 메타 데이터의 구분으로 삽입된 VRA 보조 데이터
- VRA-가능한 코덱과 함께 사용하는 특정한 압축 알고리즘과 양립할 수 있는 VRA 보조 데이터의 창출
- 다수 채널 및/또는 공간적으로 분포된 PCPV 시그널의 플레이백 및 다수 채널 및/또는 공간적으로 분포된 SCRA 시그널의 플레이백을 가능케 하기 위해 AC3 텔레비전 오디오 포맷과 함께 결합된 VRA 보조 데이터의 이용
- VRA-가능한 사운드 트랙 버전을 창출하기 위한 현존하는 필름, 무비, 텔레비전 사운드 트랙의 오디오 마스터 테이프의 리-아서링
- 사운드 트랙 저장 매체 속에 분리된 오디오 정보로써 위치하는 PCPV 시그널의 VRA-가능 수단
- 사운드 트랙 저장 매체 속에 분리된 오디오 정보로써 위치하는 SCRA 시그널의 VRA-가능 수단
- VRA-가능한 플레이백 디바이스에 의해 계속적인 조정을 위한 프라이머리 콘텐트 퓨어 보이스 트랙을 창출하기 위해서 오리지널 사운드 트랙 오디오 마스터 테이프 위에 존재하는 하나 또는 그 이상의 보컬 트랙의 예술적 결합을 위한 리-아서링 수단
- VRA-가능한 플레이백 디바이스에 의해 계속적인 조정을 위한 세컨더리 콘텐트 리메이닝 오디오 트랙을 창출하기 위해서 오리지널 사운드 트랙 오디오 마스터 테이프 위에 존재하는 하나 또는 그 이상의 논-보컬 트랙의 예술적 결합을 위한 리-아서링 수단
- PCPV와 SCRA 정보를 새로이 창출하고, 아키브 조건 속에 개시한 것과 같은 VRA-가능한 디지털 마스터 오디오 저장 매체를 구축하고 리-아서링 하는 수단
- VRA-가능한 영화, 필름 또는 텔레비전 프로그램을 위성, 인터넷 또는 다른 디지털 전송 수단에 의해 VRA-가능한 플레이백 디바이스에 전송하기 위해서 VRA-가능한 필름 사운드 트랙으로 구성된 디지털 데이터 베이스 또는 아키브 시스템의 창출
- 비디오-온-디맨드 필름, 영화, 웹티비(web-tv), 디지털 텔레비전 또는 다른 프로그램을 지니는 디지털 데이터 베이스
- 이러한 서류에 개시된 수단을 이용하여 상응하는 사운드 트랙이 VRA-가능한 곳에 단일 필름 엔티티로 구성된 디지털 데이터 베이스
- VRA-가능한 사운드 트랙이 오디오 플레이백 시 선택의 사운드 트랙처럼 치환을 위한 오리지널 프로그램 사운드 트랙과 무관하게 전송시킬 수 있게 하기 위하여 적절한 타임-싱크로나이제이션과 비디오-프래임 싱크로나이제이션을 지닌 오직 VRA-가능한 오디오 사운드 트랙만으로 구성된 디지털 데이터 베이스
- 프라이머리 콘텐트 퓨어 보이스 오디오로써 디자인된 보컬 트랙의 블렌드와 세컨더리 콘텐트 리메이닝 오디오로써 디자인된 기구의 블렌드와 함께 창출된 VRA-가능한 뮤직 오디오를 VRA-가능한 뮤직 오디오(예를 들면, WAV, MP3 또 다른것)로 구성된 디지털 데이터 베이스 또는 아키브 시스템의 창출
- 플레이백 시 PCPV 보컬의 용이한 치환을 위해 디지터 파일 또는 타임-싱크로나이즈드 오리지널 뮤직 레코딩, PCPV 오디오 인포메이션만으로 구성된 디지털 데이터 베이스
- 상기 기술한 형태의 어느 것이든지를 그 안에 녹음된 형태로 포함하는 녹음 매체

Claims (28)

  1. 하나 또는 그 이상의 PCPV/PCA 시그널과 하나 또는 그 이상의 SCRA 시그널의 형태를 평행적으로 입력시키는 것을 허용하는 단계 ;
    PCPV 시그널과 SCRA 시그널을 압축하는 단계 ;
    압축된 PCPV/PCA 시그널 및 SCRA 시그널을 특정한 압축 알고리즘으로 정의된 관련 데이터와 함께 멀티플렉스(multiplex)시키고, 이 멀티플렉스된 시그널을 VRA-가능한 파일로 저장하거나 PCPV/PCA 및 SCRA 시그널로 분리하기 위한 디-멀티플레서로 전송시키고, 적절한 탈압착 알고리즘을 그들에게 적용시킨 후, 저장 매체 또는 VRA 볼륨 조절 가능한 아웃풋 디바이스에 시그널을 아웃풋 시키는 단계를 포함함을 특징으로 하는 VRA-가능한 코덱 시스템의 조작 방법
  2. 다수의 오디오 트랙 속에 적어도 하나의 트랙을 준비하고, 저장 매체 위에 저장된 오디오 트랙 다수와 타임-싱크로나이제이션을 지닌 오디오 트랙 다수에 대해 이 하나의 트랙에 프라이머리 콘텐트 퓨어 보이스(PCPV) 오디오를 포함시켜 준비하는 단계 ;
    적어도 하나의 트랙으로부터 PCPV 시그널을 발생시키는 단계 ;
    첫 번째 압축 비율을 사용하여 디지털 압축 포맷을 사용한 PCPV 시그널을 압축시키는 단계 ;
    다수의 오디오 트랙 중에 적어도 다른 하나의 트랙에 세컨더리 콘텐트 리메이닝 오디오(SCRA)를 포함하는 또 다른 트랙을 준비하는 단계 ;
    적어도 하나의 트랙으로부터 SCRA 시그널을 발생시키는 단계 ;
    두 번째 압축 비율을 사용하여 디지털 압축 포맷을 사용한 SCRA 시그널을 압축시키는 단계 ;
    VRA 보조 데이터 채널은 VRA-가능한 것으로서 VRA-가능한 디지털 마스터를 확인하고 PCPV와 SCRA 시그널의 플레이백 파라미터를 확인하는 것을 포함하는 것으로, 보이스-투-리메이닝-오디오(VRA) 보조 데이터 채널을 창출하는 단계 ; 및
    PCPV 시그널, SCRA 시그널 및 VRA 보조 데이터 채널로 VRA-가능한 디지털 마스터 위에 디지털을 저장하는 것으로 이 저장 단계는 타임-싱크로나이제이션을 유지하는 것을 특징으로 하는 단계를 포함하는 오디오 프로덕션 방법
  3. 제 2항에 있어서, 상기 다수의 오디오 트랙은 적어도 하나의 프라이머리 보컬 콘텐트와 백그라운드 콘텐트를 지니는 오디오 프로그램에 관련되어 있음을 특징으로 하는 오디오 프로덕션 방법
  4. 제 3항에 있어서, 상기 PCPV 시그널은 오디오 프로그램의 구성이 PCPV 오디오를 통해 청취자가 청취함에 있어 충분한 일차 음성 콘텐트(primary vocalcontent)를 포함함을 특징으로 하는 오디오 프로덕션 방법
  5. 제 3항에 있어서, 상기 SCRA 시그널은 PCPV 시그널과 함께 SCRA 시그널이 혼합됨으로써 오디오 프로그램의 예술적 가치가 증진될 수 있도록 충분한 백그라운드 콘텐트를 포함함을 특징으로 하는 오디오 프로덕션 방법
  6. 제 2항에 있어서, 상기 PCPV 시그널은 모노 시그널, 스테레오 시그널 및 서라운드 사운드 시그널 중 하나임을 특징으로 하는 오디오 프로덕션 방법
  7. 제 6항에 있어서, 상기 서라운드 사운드 시그널은 5.1 서라운드 사운드 포맷과 7.1 서라운드 사운드 포맷 중의 하나임을 특징으로 하는 오디오 프로덕션 방법
  8. 제 2항에 있어서, 상기 SCRA 시그널은 모노 시그널, 스테레오 시그널 및 서라운드 사운드 시그널 중 하나임을 특징으로 하는 오디오 프로덕션 방법
  9. 제 8항에 있어서, 상기 서라운드 사운드 시그널은 5.1 서라운드 사운드 포맷과 7.1 서라운드 사운드 포맷 중의 하나임을 특징으로 하는 오디오 프로덕션 방법
  10. 제 2항에 있어서, 상기 플레이백 파라미터는 SCRA 시그널이 플레이백 되는 동안에 PCPV 시그널을 실질적으로 없애지 않게 하기 위하여 시그널 각각의 볼륨 레벨의 자동 조절을 가능케 하고 서로 서로에 대해 PCPV 및 SCRA 시그널의 각각을 위한 볼륨 레벨을 포함하는 것을 특징으로 하는 오디오 프로덕션 방법
  11. 제 2항에 있어서, 첫 번째 압축 비율은 실질적으로 12:1보다 적은 비율임을 특징으로 하는 오디오 프로덕션 방법
  12. 제 2항에 있어서, 첫 번째 압축 비율은 실질적으로 8:1보다 적은 비율임을 특징으로 하는 오디오 프로덕션 방법
  13. 제 2항에 있어서, 두 번째 압축 비율은 실질적으로 12:1보다 적은 비율임을 특징으로 하는 오디오 프로덕션 방법
  14. 제 2항에 있어서, 두 번째 압축 비율은 실질적으로 8:1보다 적은 비율임을 특징으로 하는 오디오 프로덕션 방법
  15. 제 2항에 있어서, VRA-가능한 디지털 마스터 위에 시그널을 디지털화하여 저장하기 위한 포맷은 제로-채널 포맷, 원-채널 프리믹스 포맷, 원-채널 포스트믹스 포맷, 투-채널 프리믹스 포맷 및 투-채널 포스트믹스 포맷 중의 하나임을 특징으로 하는 오디오 프로덕션 방법
  16. 제 2항에 있어서, 상기 또 다른 트랙은 뮤직 트랙 및 이펙트 트랙 중 하나임을 특징으로 하는 오디오 프로덕션 방법
  17. 제 2항에 있어서, VRA-가능한 디지털 마스터의 플레이백에 의해 PCPV와 SCRA 시그널 엠플리튜드가 독립적으로 조정 가능함을 더욱 포함함을 특징으로 하는 오디오 프로덕션 방법
  18. 제 17항에 있어서, 조정된 PCPV와 SCRA 시그널의 독립적인 혼합은 일렉트로 어코스틱 디바이스에 의해 커플됨을 특징으로 하고 플레이백을 위해 조정된 PCPV와 SCRA 시그널의 독립적인 혼합을 더욱 포함함을 특징으로 하는 오디오 프로덕션 방법
  19. 제 17항에 있어서, PCPV 시그널, SCRA 시그널 및 VRA 보조 데이터 채널의 플레이백은 동시에 발생함을 특징으로 하는 오디오 프로덕션 방법
  20. 제 2항에 있어서, 다수의 오디오 트랙은 타임-배열과 비디오 시그널과 함께 비디오 프래임 싱크로나이제이션을 더욱 포함함을 특징으로 하는 오디오 프로덕션 방법
  21. 제 20항에 있어서, 상기 저장 단계는 타임-배열의 손상 및 PCPV 시그널과 SCRA 시그널 및 비디오 시그널간의 비디오 프래임 싱크로나이제이션의 손상 없이 발생함을 특징으로 하는 오디오 프로덕션 방법
  22. 제 2항에 있어서, 상기 VRA-가능한 디지털 마스터는 공중파 텔레비전, 웹캐스팅, 스트리밍 오디오, 콤팩트디스크(CD) 오디오, 디지털 비디오 디스크(DVD) 오디오, 모션 픽쳐 오디오 및 비디오 테이프 오디오 중의 하나의 오디오 프로그램을 저장함을 특징으로 하는 오디오 프로덕션 방법
  23. 프라이머리 보컬 콘텐트 오디오 시그널과 백그라운드 보컬 콘텐트 오디오 시그널을 수용할 수 있도록 구성된 평행 입력 컨피그레이션 ;
    프라이머리 보컬 콘텐트 오디오 시그널로부터 첫 번째 압축시킨 오디오 시그널로부터 발생되는 스피치-온리 압축 ;
    백그라운드 콘텐트 오디오 시그널로부터 두 번째 압축시킨 오디오 시그널로부터 발생되는 일반 오디오 압축 ;
    프라이머리 보컬 콘텐트와 백그라운드 콘텐트 오디오 시그널 및 이에 수반되는 비디오간의 타임-배열과 비디오-프래임 싱크로나이제이션의 손상 없이 프라이머리 보컬 콘텐트와 백그라운드 콘텐트 오디오 시그널을 스피치-온리 및 일반 오디오 압축을 통한 압축 ; 및
    첫 번째 및 두 번째 압축 오디오 시그널과 이에 관련된 데이터의 멀티플렉스 비트스트림을 발생하는 것으로, 상기 관련 데이터는 스피치-온리 및 일반 오디오 압축의 정도를 나타내고, 첫 번째 및 두 번째 압축 시그널을 발생시키기 위해 비트스트림 신탱싱(syntaxing)방법을 사용하는 멀티플렉서(multiplexer)로 구성된 프라이머리 보컬 콘텐트와 백그라운드 콘텐트 오디오 시그널 및 이에 수반되는 비디오간의 타임-배열과 비디오-프래임 싱크로나이제이션을 지닌 적어도 프라이머리 보컬 콘텐트 오디오 시그널과 백그라운드 콘텐트 오디오 시그널 및 이에 수반되는 비디오 시그널을 지닌 오디오 프로그램을 코딩 및 디코딩 하기 위한 코덱
  24. 제 23항에 있어서, 첫 번째 및 두 번째 압축된 오디오 시그널로부터 얻어진 멀티플렉스 비트스트림을 디-멀티플렉스 시키는 디-멀티플레서 ; 및
    첫 번째 및 두 번째 압축 오디오 시그널을 첫 번째 및 두 번째 오디오 시그널로 디코드 하기 위한 디코더 등을 더욱 포함함을 특징으로 하는 코덱
  25. 제 24항에 있어서, 첫 번째 및 두 번째 오디오 시그널을 볼륨 컨트롤 및 플레이백 디바이스에 전송시키는 것을 더욱 포함하는 것으로 상기 디바이스는 첫 번 째 및 두 번째 시그널의 볼륨 조절을 독립적으로 할 수 있게 함을 특징으로 하는 코덱
  26. 프라이머리 콘텐트 오디오와 세컨더리 콘텐트 오디오를 분리하여 포함하는콘텍스튜얼(contextual)오디오 인포메이션 부분 ; 및
    청취자가 프라이머리 콘텐트 오디오와 세컨더리 콘텐트 오디오의 분리된 스페이셜 오리엔테이션을 인지할 수 있게 한 스페이셜 오디오 인포메이션을 포함하는 스페이셜 오디오 인포메이션 부분 ; 및
    분리된 프라이머리 콘텐트 오디오와 스페이셜 오리엔테이션을 지닌 세컨더리 콘텐트 오디오의 플레이백과 발생 중의 하나를 가능케 하는 정보를 포함하는 보조 데이터 정보 부분으로 구성된 포맷을 지니는 저장매체
  27. VRA 보조 데이터 채널, VRA-가능 코덱에 의해 창출되고 번역된 딜리니에이션(delineation)의 사용을 통한 오디오 프로그램으로부터 콘텍스튜얼 오디오 프로그램의 딜리니에이션, 오디오 프로그램으로부터 스페이셜 오디오 프로그램의 동시 딜리니에이션을 수용할 수 있는 포맷인 VRA 포맷을 저장하기 위한 보이스-투 리메이닝 오디오(VRA) 오디오 저장매체
  28. 제 27항에 있어서, 상기 오디오 프로그램은 필름 사운드 트랙, DVD 무비 사운드 트랙 및 콤팩트디스크 사운드 트랙 중 하나임을 특징으로 하는 저장매체
KR1020027011521A 2000-03-02 2001-03-02 프라이머리와 세컨더리 오디오 시그널을 조정하기 위한시스템 KR100799155B1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US18635700P 2000-03-02 2000-03-02
US60/186,357 2000-03-02
US09/580,205 2000-05-26
US09/580,205 US6351733B1 (en) 2000-03-02 2000-05-26 Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process

Publications (2)

Publication Number Publication Date
KR20020073604A true KR20020073604A (ko) 2002-09-27
KR100799155B1 KR100799155B1 (ko) 2008-01-29

Family

ID=26882012

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020027011521A KR100799155B1 (ko) 2000-03-02 2001-03-02 프라이머리와 세컨더리 오디오 시그널을 조정하기 위한시스템

Country Status (12)

Country Link
US (2) US6351733B1 (ko)
EP (1) EP1264300A2 (ko)
JP (1) JP2003525466A (ko)
KR (1) KR100799155B1 (ko)
CN (1) CN1211775C (ko)
AU (1) AU2001243395A1 (ko)
BR (1) BR0108904A (ko)
CA (1) CA2401798A1 (ko)
IL (1) IL151546A0 (ko)
MX (1) MXPA02008573A (ko)
RU (1) RU2002126217A (ko)
WO (1) WO2001065888A2 (ko)

Families Citing this family (82)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020002039A1 (en) 1998-06-12 2002-01-03 Safi Qureshey Network-enabled audio device
US7266501B2 (en) * 2000-03-02 2007-09-04 Akiba Electronics Institute Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
WO2001086843A1 (en) * 2000-05-12 2001-11-15 Cohen Marc S Apparatus and method for triggering message insertion during digital music playing
US6782366B1 (en) * 2000-05-15 2004-08-24 Lsi Logic Corporation Method for independent dynamic range control
GB0016695D0 (en) * 2000-07-08 2000-08-23 Radioscape Ltd Digital transactions for the delivery of media files
US7840691B1 (en) 2000-09-07 2010-11-23 Zamora Radio, Llc Personal broadcast server system for providing a customized broadcast
US7848531B1 (en) * 2002-01-09 2010-12-07 Creative Technology Ltd. Method and apparatus for audio loudness and dynamics matching
CA2482336A1 (en) * 2002-02-28 2003-09-12 Nikolay Shkolnik Liquid piston internal combustion power system
US20030182000A1 (en) * 2002-03-22 2003-09-25 Sound Id Alternative sound track for hearing-handicapped users and stressful environments
US7454331B2 (en) * 2002-08-30 2008-11-18 Dolby Laboratories Licensing Corporation Controlling loudness of speech in signals that contain speech and other types of audio material
JP3879922B2 (ja) * 2002-09-12 2007-02-14 ソニー株式会社 信号処理システム、信号処理装置および方法、記録媒体、並びにプログラム
US20060106597A1 (en) * 2002-09-24 2006-05-18 Yaakov Stein System and method for low bit-rate compression of combined speech and music
US20040078104A1 (en) * 2002-10-22 2004-04-22 Hitachi, Ltd. Method and apparatus for an in-vehicle audio system
EP1427252A1 (en) * 2002-12-02 2004-06-09 Deutsche Thomson-Brandt Gmbh Method and apparatus for processing audio signals from a bitstream
US20040204944A1 (en) * 2003-04-14 2004-10-14 Castillo Michael J. System and method for mixing computer generated audio with television programming audio in a media center
US7551745B2 (en) * 2003-04-24 2009-06-23 Dolby Laboratories Licensing Corporation Volume and compression control in movie theaters
US7251337B2 (en) * 2003-04-24 2007-07-31 Dolby Laboratories Licensing Corporation Volume control in movie theaters
BRPI0410740A (pt) * 2003-05-28 2006-06-27 Dolby Lab Licensing Corp método, aparelho e programa de computador para calcular e ajustar o volume percebido de um sinal de áudio
GB2407006A (en) * 2003-10-08 2005-04-13 Sony Uk Ltd Communicating streamed payload data and packet based auxiliary data
US8718298B2 (en) * 2003-12-19 2014-05-06 Lear Corporation NVH dependent parallel compression processing for automotive audio systems
KR100541526B1 (ko) * 2004-01-30 2006-01-10 에스케이 텔레콤주식회사 멀티미디어 데이터의 전송품질 측정방법 및 장치
US8028323B2 (en) 2004-05-05 2011-09-27 Dryden Enterprises, Llc Method and system for employing a first device to direct a networked audio device to obtain a media item
US7624021B2 (en) * 2004-07-02 2009-11-24 Apple Inc. Universal container for audio data
US20060062407A1 (en) * 2004-09-22 2006-03-23 Kahan Joseph M Sound card having feedback calibration loop
US8199933B2 (en) 2004-10-26 2012-06-12 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
MX2007005027A (es) 2004-10-26 2007-06-19 Dolby Lab Licensing Corp Calculo y ajuste de la sonoridad percibida y/o el balance espectral percibido de una senal de audio.
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
US20070016930A1 (en) * 2005-03-08 2007-01-18 Podfitness, Inc. Creation and navigation of media content with chaptering elements
US20060203972A1 (en) * 2005-03-08 2006-09-14 Equity Online Marketing, Inc. Method and system for audio program creation and assembly
US20060218253A1 (en) * 2005-03-08 2006-09-28 Equity On Line Marketing, Inc. Method and system for video program creation and assembly
US7734364B2 (en) * 2005-03-08 2010-06-08 Lolo, Llc Mixing media files
EP1931197B1 (de) * 2005-04-18 2015-04-08 Basf Se Zubereitung, enthaltend wenigstens ein conazolfungizid, ein weiteres fungizig und ein stabilisierendes c0p0lymer
KR100640477B1 (ko) * 2005-06-29 2006-10-30 삼성전자주식회사 디지털 멀티미디어 방송 채널에 따른 오디오 신호 출력방법 및 장치
US7450705B1 (en) 2005-08-31 2008-11-11 At&T Corp. Method to test and compare voice teleconference systems
TWI517562B (zh) * 2006-04-04 2016-01-11 杜比實驗室特許公司 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式
US8504181B2 (en) * 2006-04-04 2013-08-06 Dolby Laboratories Licensing Corporation Audio signal loudness measurement and modification in the MDCT domain
RU2417514C2 (ru) 2006-04-27 2011-04-27 Долби Лэборетериз Лайсенсинг Корпорейшн Регулировка усиления звука с использованием основанного на конкретной громкости обнаружения акустических событий
US20080002839A1 (en) * 2006-06-28 2008-01-03 Microsoft Corporation Smart equalizer
ES2390181T3 (es) * 2006-06-29 2012-11-07 Lg Electronics Inc. Procedimiento y aparato para procesar una señal de audio
AU2007300810B2 (en) 2006-09-29 2010-06-17 Lg Electronics Inc. Methods and apparatuses for encoding and decoding object-based audio signals
MY144271A (en) 2006-10-20 2011-08-29 Dolby Lab Licensing Corp Audio dynamics processing using a reset
US8521314B2 (en) * 2006-11-01 2013-08-27 Dolby Laboratories Licensing Corporation Hierarchical control path with constraints for audio dynamics processing
CA2645863C (en) * 2006-11-24 2013-01-08 Lg Electronics Inc. Method for encoding and decoding object-based audio signal and apparatus thereof
DE602008001787D1 (de) * 2007-02-12 2010-08-26 Dolby Lab Licensing Corp Verbessertes verhältnis von sprachlichen zu nichtsprachlichen audio-inhalten für ältere oder hörgeschädigte zuhörer
US20080201292A1 (en) * 2007-02-20 2008-08-21 Integrated Device Technology, Inc. Method and apparatus for preserving control information embedded in digital data
BRPI0807703B1 (pt) 2007-02-26 2020-09-24 Dolby Laboratories Licensing Corporation Método para aperfeiçoar a fala em áudio de entretenimento e meio de armazenamento não-transitório legível por computador
EP2003860A1 (en) * 2007-06-12 2008-12-17 Alcatel Lucent Configuration of a communication terminal by provisioning of DHCP realm identifier
KR20100024426A (ko) * 2007-06-27 2010-03-05 닛본 덴끼 가부시끼가이샤 신호 분석 장치와, 신호 제어 장치와, 그 시스템, 방법 및 프로그램
CN101790758B (zh) * 2007-07-13 2013-01-09 杜比实验室特许公司 用于控制音频信号的信号处理的设备和方法
US9996612B2 (en) * 2007-08-08 2018-06-12 Sony Corporation System and method for audio identification and metadata retrieval
JP2009076172A (ja) * 2007-09-25 2009-04-09 Hitachi Ltd データ伝送方法、光ディスク記録方法及び光ディスク記録装置
DE102007048973B4 (de) * 2007-10-12 2010-11-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals mit einer Sprachsignalverarbeitung
JP2011504250A (ja) 2007-11-21 2011-02-03 エルジー エレクトロニクス インコーポレイティド 信号処理方法及び装置
US9015147B2 (en) 2007-12-20 2015-04-21 Porto Technology, Llc System and method for generating dynamically filtered content results, including for audio and/or video channels
US8316015B2 (en) 2007-12-21 2012-11-20 Lemi Technology, Llc Tunersphere
US8117193B2 (en) 2007-12-21 2012-02-14 Lemi Technology, Llc Tunersphere
CN102017402B (zh) 2007-12-21 2015-01-07 Dts有限责任公司 用于调节音频信号的感知响度的系统
SG189747A1 (en) 2008-04-18 2013-05-31 Dolby Lab Licensing Corp Method and apparatus for maintaining speech audibility in multi-channel audio with minimal impact on surround experience
KR101381513B1 (ko) 2008-07-14 2014-04-07 광운대학교 산학협력단 음성/음악 통합 신호의 부호화/복호화 장치
EP2154910A1 (en) * 2008-08-13 2010-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for merging spatial audio streams
US8509315B1 (en) * 2008-09-23 2013-08-13 Viasat, Inc. Maintaining synchronization of compressed data and associated metadata
CN101715145B (zh) * 2008-10-06 2012-08-15 辉达公司 利用级联存储器评估处理能力的设备和方法
US8494899B2 (en) 2008-12-02 2013-07-23 Lemi Technology, Llc Dynamic talk radio program scheduling
US8538042B2 (en) * 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
EP2491560B1 (en) * 2009-10-19 2016-12-21 Dolby International AB Metadata time marking information for indicating a section of an audio object
CN102385864B (zh) * 2010-08-31 2013-07-10 Tcl集团股份有限公司 一种音频数据解码方法、装置及音频播放器
CN103443854B (zh) 2011-04-08 2016-06-08 杜比实验室特许公司 用于混合来自两个编码位流的音频节目的元数据的自动配置
US20130054450A1 (en) * 2011-08-31 2013-02-28 Richard Lang Monetization of Atomized Content
US9312829B2 (en) * 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
TWI530941B (zh) * 2013-04-03 2016-04-21 杜比實驗室特許公司 用於基於物件音頻之互動成像的方法與系統
EP3312835B1 (en) 2013-05-24 2020-05-13 Dolby International AB Efficient coding of audio scenes comprising audio objects
US20150006369A1 (en) * 2013-06-27 2015-01-01 Little Engines Group, Inc. Method for internet-based commercial trade in collaboratively created secondary digital media programs
US10141004B2 (en) 2013-08-28 2018-11-27 Dolby Laboratories Licensing Corporation Hybrid waveform-coded and parametric-coded speech enhancement
US10095468B2 (en) 2013-09-12 2018-10-09 Dolby Laboratories Licensing Corporation Dynamic range control for a wide variety of playback environments
KR102170827B1 (ko) * 2013-11-22 2020-10-28 삼성전자주식회사 영상표시장치 및 영상표시장치의 구동방법, 음향출력장치 및 음향출력장치의 구동방법
KR102370031B1 (ko) * 2014-03-18 2022-03-04 코닌클리케 필립스 엔.브이. 시청각 콘텐트 아이템 데이터 스트림들
US9462330B2 (en) 2014-09-04 2016-10-04 Transformative Engineering, Inc. Multimedia audio inserter
CN105723739A (zh) * 2016-01-23 2016-06-29 张阳 一种音箱设备的音量调整方法及系统
WO2017130210A1 (en) * 2016-01-27 2017-08-03 Indian Institute Of Technology Bombay Method and system for rendering audio streams
US10341762B2 (en) 2017-10-11 2019-07-02 Sony Corporation Dynamic generation and distribution of multi-channel audio from the perspective of a specific subject of interest
WO2021086624A1 (en) * 2019-10-29 2021-05-06 Qsinx Management Llc Audio encoding with compressed ambience
CN114222224B (zh) * 2021-10-29 2023-12-26 成都中科信息技术有限公司 一种双通道通信链路的会议讨论系统及工作方法

Family Cites Families (88)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2783677A (en) 1953-06-29 1957-03-05 Ampex Electric Corp Stereophonic sound system and method
US3046337A (en) 1957-08-05 1962-07-24 Hamner Electronics Company Inc Stereophonic sound
US3110769A (en) 1959-01-17 1963-11-12 Telefunken Gmbh Stereo sound control system
GB1522599A (en) 1974-11-16 1978-08-23 Dolby Laboratories Inc Centre channel derivation for stereophonic cinema sound
US4074084A (en) 1975-11-05 1978-02-14 Berg Johannes C M Van Den Method and apparatus for receiving sound intended for stereophonic reproduction
US4150253A (en) 1976-03-15 1979-04-17 Inter-Technology Exchange Ltd. Signal distortion circuit and method of use
US4051331A (en) 1976-03-29 1977-09-27 Brigham Young University Speech coding hearing aid system utilizing formant frequency transformation
US4052559A (en) 1976-12-20 1977-10-04 Rockwell International Corporation Noise filtering device
US4406001A (en) 1980-08-18 1983-09-20 The Variable Speech Control Company ("Vsc") Time compression/expansion with synchronized individual pitch correction of separate components
US4405831A (en) 1980-12-22 1983-09-20 The Regents Of The University Of California Apparatus for selective noise suppression for hearing aids
US4454609A (en) 1981-10-05 1984-06-12 Signatron, Inc. Speech intelligibility enhancement
US4516257A (en) 1982-11-15 1985-05-07 Cbs Inc. Triphonic sound system
US4484345A (en) 1983-02-28 1984-11-20 Stearns William P Prosthetic device for optimizing speech understanding through adjustable frequency spectrum responses
US4622440A (en) 1984-04-11 1986-11-11 In Tech Systems Corp. Differential hearing aid with programmable frequency response
US4776016A (en) 1985-11-21 1988-10-04 Position Orientation Systems, Inc. Voice control system
US4809337A (en) 1986-06-20 1989-02-28 Scholz Research & Development, Inc. Audio noise gate
US5138498A (en) 1986-10-22 1992-08-11 Fuji Photo Film Co., Ltd. Recording and reproduction method for a plurality of sound signals inputted simultaneously
US4816905A (en) 1987-04-30 1989-03-28 Gte Laboratories Incorporated & Gte Service Corporation Telecommunication system with video and audio frames
JPH06101664B2 (ja) 1987-08-20 1994-12-12 パイオニア株式会社 再生波形等化回路
DE3730763A1 (de) 1987-09-12 1989-03-30 Blaupunkt Werke Gmbh Schaltung zur stoergeraeuschkompensation
US4941179A (en) 1988-04-27 1990-07-10 Gn Davavox A/S Method for the regulation of a hearing aid, a hearing aid and the use thereof
JPH02174380A (ja) * 1988-12-27 1990-07-05 Marantz Japan Inc Ld等映像ソフト媒体の多言語化システム
JP3017744B2 (ja) 1989-03-09 2000-03-13 パイオニア株式会社 ボイスチェンジ回路
US5212764A (en) 1989-04-19 1993-05-18 Ricoh Company, Ltd. Noise eliminating apparatus and speech recognition apparatus using the same
US5450146A (en) 1989-05-24 1995-09-12 Digital Theater Systems, L.P. High fidelity reproduction device for cinema sound
US5003605A (en) 1989-08-14 1991-03-26 Cardiodyne, Inc. Electronically augmented stethoscope with timing sound
US5144454A (en) 1989-10-31 1992-09-01 Cury Brian L Method and apparatus for producing customized video recordings
JPH03236691A (ja) * 1990-02-14 1991-10-22 Hitachi Ltd テレビジョン受信機用音声回路
JP2538668Y2 (ja) 1990-03-02 1997-06-18 ブラザー工業株式会社 メッセージ機能付き音楽再生装置
US5216718A (en) 1990-04-26 1993-06-01 Sanyo Electric Co., Ltd. Method and apparatus for processing audio signals
EP0459362B1 (en) 1990-05-28 1997-01-08 Matsushita Electric Industrial Co., Ltd. Voice signal processor
KR950013552B1 (ko) 1990-05-28 1995-11-08 마쯔시다덴기산교 가부시기가이샤 음성신호처리장치
JP3006059B2 (ja) 1990-09-17 2000-02-07 ソニー株式会社 音場拡大装置
US5155510A (en) 1990-11-29 1992-10-13 Digital Theater Systems Corporation Digital sound system for motion pictures with analog sound track emulation
US5146504A (en) 1990-12-07 1992-09-08 Motorola, Inc. Speech selective automatic gain control
US5408686A (en) 1991-02-19 1995-04-18 Mankovitz; Roy J. Apparatus and methods for music and lyrics broadcasting
JP3068226B2 (ja) 1991-02-27 2000-07-24 株式会社リコス バックコーラス合成装置
US5210366A (en) 1991-06-10 1993-05-11 Sykes Jr Richard O Method and device for detecting and separating voices in a complex musical composition
JPH0537478A (ja) 1991-07-31 1993-02-12 Fujitsu Ten Ltd 音場制御装置
JP3131249B2 (ja) * 1991-08-23 2001-01-31 日本放送協会 混合音声信号受信装置
DE69317802T2 (de) 1992-01-21 1998-10-22 Koninkl Philips Electronics Nv Verfahren und Vorrichtung für Tonverbesserung unter Verwendung von Hüllung von multibandpassfiltrierten Signalen in Kammfiltern
US5384599A (en) 1992-02-21 1995-01-24 General Electric Company Television image format conversion system including noise reduction apparatus
US5812688A (en) 1992-04-27 1998-09-22 Gibson; David A. Method and apparatus for using visual images to mix sound
JPH05342762A (ja) 1992-06-12 1993-12-24 Sanyo Electric Co Ltd 音声再生回路
JP2765370B2 (ja) * 1992-06-12 1998-06-11 松下電器産業株式会社 ディスク記録装置及び再生装置
JPH087524B2 (ja) 1992-07-17 1996-01-29 株式会社日本ビデオセンター カラオケ採点表示装置
US5319713A (en) 1992-11-12 1994-06-07 Rocktron Corporation Multi dimensional sound circuit
US5325423A (en) 1992-11-13 1994-06-28 Multimedia Systems Corporation Interactive multimedia communication system
US5341253A (en) 1992-11-28 1994-08-23 Tatung Co. Extended circuit of a HiFi KARAOKE video cassette recorder having a function of simultaneous singing and recording
US5400409A (en) 1992-12-23 1995-03-21 Daimler-Benz Ag Noise-reduction method for noise-affected voice channels
US5572591A (en) 1993-03-09 1996-11-05 Matsushita Electric Industrial Co., Ltd. Sound field controller
US5396560A (en) 1993-03-31 1995-03-07 Trw Inc. Hearing aid incorporating a novelty filter
US5434922A (en) 1993-04-08 1995-07-18 Miller; Thomas E. Method and apparatus for dynamic sound optimization
JP3206619B2 (ja) 1993-04-23 2001-09-10 ヤマハ株式会社 カラオケ装置
US5619383A (en) 1993-05-26 1997-04-08 Gemstar Development Corporation Method and apparatus for reading and writing audio and digital data on a magnetic tape
JP2951502B2 (ja) 1993-05-26 1999-09-20 パイオニア株式会社 カラオケ装置
JP3685812B2 (ja) 1993-06-29 2005-08-24 ソニー株式会社 音声信号送受信装置
US5644677A (en) 1993-09-13 1997-07-01 Motorola, Inc. Signal processing system for performing real-time pitch shifting and method therefor
US5485522A (en) 1993-09-29 1996-01-16 Ericsson Ge Mobile Communications, Inc. System for adaptively reducing noise in speech signals
BE1007617A3 (nl) 1993-10-11 1995-08-22 Philips Electronics Nv Transmissiesysteem met gebruik van verschillende codeerprincipes.
US5469370A (en) 1993-10-29 1995-11-21 Time Warner Entertainment Co., L.P. System and method for controlling play of multiple audio tracks of a software carrier
US5576843A (en) 1993-10-29 1996-11-19 Time Warner Entertainment Co., L.P. System and method for controlling play of multiple dialog audio tracks of a software carrier
US5569038A (en) 1993-11-08 1996-10-29 Tubman; Louis Acoustical prompt recording system and method
US5530760A (en) 1994-04-29 1996-06-25 Audio Products International Corp. Apparatus and method for adjusting levels between channels of a sound system
JP3568584B2 (ja) 1994-06-28 2004-09-22 ローム株式会社 オーディオ装置
US5706145A (en) 1994-08-25 1998-01-06 Hindman; Carl L. Apparatus and methods for audio tape indexing with data signals recorded in the guard band
US5668339A (en) * 1994-10-26 1997-09-16 Daewoo Electronics Co., Ltd. Apparatus for multiplexing an audio signal in a video-song playback system
JP2897659B2 (ja) 1994-10-31 1999-05-31 ヤマハ株式会社 カラオケ装置
US5751903A (en) 1994-12-19 1998-05-12 Hughes Electronics Low rate multi-mode CELP codec that encodes line SPECTRAL frequencies utilizing an offset
JP3239672B2 (ja) 1995-02-15 2001-12-17 ヤマハ株式会社 自動演奏装置
JP3319211B2 (ja) 1995-03-23 2002-08-26 ヤマハ株式会社 音声変換機能付カラオケ装置
KR0155811B1 (ko) 1995-03-28 1998-12-15 김광호 컴팩트 디스크 플레이어 일체형 텔레비젼 수상기
US5902115A (en) * 1995-04-14 1999-05-11 Kabushiki Kaisha Toshiba Recording medium on which attribute information on the playback data is recorded together with the playback data and a system for appropriately reproducing the playback data using the attribute information
US5684714A (en) 1995-05-08 1997-11-04 Kabushiki Kaisha Toshiba Method and system for a user to manually alter the quality of a previously encoded video sequence
KR100188089B1 (ko) 1995-07-10 1999-06-01 김광호 음성 강조 회로
US6118876A (en) * 1995-09-07 2000-09-12 Rep Investment Limited Liability Company Surround sound speaker system for improved spatial effects
US5872851A (en) 1995-09-18 1999-02-16 Harman Motive Incorporated Dynamic stereophonic enchancement signal processing system
US5852800A (en) 1995-10-20 1998-12-22 Liquid Audio, Inc. Method and apparatus for user controlled modulation and mixing of digitally stored compressed data
US5666350A (en) 1996-02-20 1997-09-09 Motorola, Inc. Apparatus and method for coding excitation parameters in a very low bit rate voice messaging system
US5809472A (en) 1996-04-03 1998-09-15 Command Audio Corporation Digital audio data transmission system based on the information content of an audio signal
US5822370A (en) 1996-04-16 1998-10-13 Aura Systems, Inc. Compression/decompression for preservation of high fidelity speech quality at low bandwidth
US5970152A (en) * 1996-04-30 1999-10-19 Srs Labs, Inc. Audio enhancement system for use in a surround sound environment
JPH09322078A (ja) 1996-05-24 1997-12-12 Toko Inc 画像伝送装置
JPH1063470A (ja) * 1996-06-12 1998-03-06 Nintendo Co Ltd 画像表示に連動する音響発生装置
US5912976A (en) 1996-11-07 1999-06-15 Srs Labs, Inc. Multi-channel audio enhancement system for use in recording and playback and methods for providing same
US6078669A (en) * 1997-07-14 2000-06-20 Euphonics, Incorporated Audio spatial localization apparatus and methods
US6067361A (en) * 1997-07-16 2000-05-23 Sony Corporation Method and apparatus for two channels of sound having directional cues
JP3734932B2 (ja) * 1997-07-23 2006-01-11 株式会社ナムコ ゲーム装置及び情報記憶媒体

Also Published As

Publication number Publication date
WO2001065888A3 (en) 2002-02-14
AU2001243395A1 (en) 2001-09-12
WO2001065888A9 (en) 2003-03-06
MXPA02008573A (es) 2003-02-24
CN1427987A (zh) 2003-07-02
JP2003525466A (ja) 2003-08-26
CN1211775C (zh) 2005-07-20
IL151546A0 (en) 2003-04-10
EP1264300A2 (en) 2002-12-11
CA2401798A1 (en) 2001-09-07
RU2002126217A (ru) 2004-04-20
KR100799155B1 (ko) 2008-01-29
US6772127B2 (en) 2004-08-03
WO2001065888A2 (en) 2001-09-07
US20020040295A1 (en) 2002-04-04
US6351733B1 (en) 2002-02-26
BR0108904A (pt) 2004-06-15

Similar Documents

Publication Publication Date Title
KR100799155B1 (ko) 프라이머리와 세컨더리 오디오 시그널을 조정하기 위한시스템
US8108220B2 (en) Techniques for accommodating primary content (pure voice) audio and secondary content remaining audio capability in the digital audio production process
Bleidt et al. Development of the MPEG-H TV audio system for ATSC 3.0
KR102178231B1 (ko) 인코딩된 오디오 메타데이터-기반 등화
TWI549527B (zh) 使用物件式元資料來產生音訊輸出信號之裝置與方法(一)
JP2011150358A (ja) 2つ以上のオーディオ信号の処理方法および装置
KR100802179B1 (ko) 프리셋 오디오 장면을 이용한 객체기반 3차원 오디오서비스 시스템 및 그 방법
JP2009537876A (ja) プリセットオーディオシーンを用いたオブジェクトベースの3次元オーディオサービスシステム及びその方法
Riedmiller et al. Delivering scalable audio experiences using AC-4
KR101114431B1 (ko) 실시간 스트리밍을 위한 오디오 생성장치, 오디오 재생장치 및 그 방법
Grewe et al. MPEG-H Audio System for SBTVD TV 3.0 Call for Proposals
KR100208004B1 (ko) 상하위 채널 오디오를 이용한 입체 음향 재생 장치 및 방법
JP6204684B2 (ja) 音響信号再生装置
Todd Loudness uniformity and dynamic range control for digital multichannel audio broadcasting
Marston et al. Personalized and Immersive Sound Experiences Based on an Interoperable End-to-End Next Generation Audio (NGA) Chain Using the Audio Definition Model (ADM)
Grill et al. Closing the gap between the multi-channel and the stereo audio world: Recent MP3 surround extensions
Lee et al. Personalized audio broadcasting system through the terrestrial-DMB system
Bleidt et al. Meeting the Requirements of Next-Generation Broadcast Television Audio
Series User requirements for audio coding systems for digital broadcasting
Lyman Program Presentation Using ATSC Audio Systems
Grewe et al. STUDIO RECOMMENDATIONS FOR 3D-AUDIO PRODUCTIONS WITH MPEG-H AUDIO

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20111228

Year of fee payment: 5

LAPS Lapse due to unpaid annual fee