KR20060022637A - 재생장치 및 재생방법 - Google Patents
재생장치 및 재생방법 Download PDFInfo
- Publication number
- KR20060022637A KR20060022637A KR1020057014726A KR20057014726A KR20060022637A KR 20060022637 A KR20060022637 A KR 20060022637A KR 1020057014726 A KR1020057014726 A KR 1020057014726A KR 20057014726 A KR20057014726 A KR 20057014726A KR 20060022637 A KR20060022637 A KR 20060022637A
- Authority
- KR
- South Korea
- Prior art keywords
- header
- stream
- data
- frame
- packet
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 50
- 238000005070 sampling Methods 0.000 claims description 16
- 230000001360 synchronised effect Effects 0.000 claims description 14
- 230000000295 complement effect Effects 0.000 claims description 7
- 230000008569 process Effects 0.000 description 16
- 230000008859 change Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 10
- 230000005236 sound signal Effects 0.000 description 9
- 238000001514 detection method Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 101000969688 Homo sapiens Macrophage-expressed gene 1 protein Proteins 0.000 description 1
- 102100021285 Macrophage-expressed gene 1 protein Human genes 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013329 compounding Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
기본 스트림에 동기어나 CRC가 존재하지 않는 오디오 스트림을 복호하는 경우에, 이음의 발생을 방지한다. 현재의 프레임을 복호하는 경우에, 다음의 프레임의 전용 헤더를 해석하고, 다음의 프레임의 전용 헤더가 부정이면 현재의 프레임을 뮤팅한다. 또한, 편집에 의해서 발생한 불연속점에서는, 스트림 해석 수단에 의해서 통지되는 다음의 프레임의 선두 어드레스로부터 복호를 재개한다.
Description
본 발명은, 프레임화된 오디오 신호를 복호하고, 재생하는 오디오 재생장치로서, 특히, 편집이나 통신 오류에 의해서 오디오 신호의 도중에 불연속점이 존재하는 경우나, 속성이 변화하는 경우에 이음(異音)을 발생하지 않는 것을 특징으로 하는 재생장치 및 재생방법에 관한 것이다.
최근, 디지털 부호열로서 부호화된 오디오 부호화 신호를 복호하는 재생장치나 컴퓨터 프로그램으로서 구체화되는 재생방법이 보급되고 있다. 그 많은 경우, MPEG 규격(ISO11172-3, 또는, ISO13818-3)으로 대표되는 바와 같이, 음성 신호는 오디오 부호화 신호로서 프레임화된다. 각각의 프레임에는 신호의 속성 정보를 포함하는 전용 헤더(private header)가 부가된다. 또한, 오디오 부호화 신호에는 오류 검사를 위한 CRC 비트가 부가되어서, 전송로으로부터의 데이터의 결락(缺落)이나 오류를 복호시에 검출할 수 있다.
전송로으로부터의 데이터의 결락이 커서, 데이터 스트림이 불연속하게 된 경우, 오류 정정으로써 회복할 수 없다. 이러한 불연속 개소를 그대로 음성 출력하면 잡음이 섞인다. 이 잡음을 제거하기 위하여, 뮤팅(muting)하는 것이 바람직하다.
종래의 재생장치의 일례가, 예로서, 특허문헌 1(특개2000-259195호 공보)에 기재되어 있다. 이 종래의 재생장치는, 불연속 개소를 검출하는 것이 아니고, 송신측으로부터의 설정 변경, 예로서 샘플링 주파수 변경이 스트림의 도중에 있었던 경우, 이러한 변경을 검출하고, 변경후 일정 기간, 음성 출력을 뮤팅하는 것이다. 이것은, 변경이 있으면 수신 장치는, 변경후의 설정에 자동 조정할 필요가 있고, 자동 조정하는 기간은 잡음이 나오지 않도록, 음성 출력을 뮤팅하는 것이다. 이 종래의 장치는, 정규(正規) 헤더를 검출하여, 헤더 해석 수단에 의해서 해석된 1개 전의 정규 헤더에 기록된 샘플링 주파수와, 현재 복호 처리를 하려고 하는 현재의 정규 헤더에 기록된 샘플링 주파수를 비교하고, 현재의 헤더에 기록된 샘플링 주파수가 변화된 경우에는, 변화된 후의 프레임에 대하여 일정 시간의 뮤팅을 실시하여 이음의 발생을 방지하는 것이다. 예로서, 현재의 헤더에 기록된 샘플링 주파수가 변화된 경우에는, 복호 수단의 후단에 배치되는 DA 컨버터의 설정의 변경이 필요하게 된다. DA 컨버터의 설정의 변경이 실행되고 있는 동안은, 올바른 음성 신호가 생성되지 않으므로, 잡음을 포함하는 음성 신호가 된다. 그래서, DA 컨버터의 설정의 변경이 실행되는 일정 기간 동안, 출력 음성을 뮤트(mute)한다. 따라서, 변경이 기록된 현재의 헤더 이후의 프레임에 대하여 뮤팅이 실행된다.
또한, 헤더의 검출은, 헤더와 동기(同期)되어 설정된 동기어(同期語)를 검출함으로써, 실행된다.
또한, 동기어에 대하여는 특허문헌 2(특개2000-31942호 공보)에 기재되어 있다.
또한, 특허문헌 3(특개평10-209876호 공보)은, 데이터량의 비교에 의해서, 결락 데이터가 있는 개소를 검출하여, 뮤팅 처리를 실행하는 것이 개시되어 있다. 이 특허문헌 3에 기재되어 있는 종래의 비트스트림 재생장치는, MPEG1 또는 MPEG2 오디오 규격으로써 부호화된 오디오 스트림을 복호하는 것으로서, 스트림의 일부가 어떠한 원인에 의해서 결손된 경우에, 복호기의 프레임 버퍼(buffer)의 언더플로(underflow)를 검출하여, 뮤팅을 실행하는 것이다. 즉, 동기어를 검출하여, 정규 헤더를 찾아서, 정규 헤더와 정규 헤더의 사이의 데이터량을 카운터로써 계측한다. 계측한 데이터량 F가, 미리 결정된 데이터량보다도 작은 경우는, 데이터의 결락이 있던 것으로 판단하여 뮤팅 처리를 실행하는 것이다.
(발명이 해결하려고 하는 기술적 과제)
본 출원의 발명에서 취급하는 기본 스트림(elementary stream)에는, 동기어가 존재하지 않고 또한, CRC 등의 오류 검사를 위한 비트가 존재하지 않는다. 이러한 기본 스트림을 취급하는 경우, 어떻게 하여 불연속 개소를 디코딩전에 검출하고, 또한, 어느 타이밍에 뮤팅을 실행할 것인가가, 해결해야 할 과제가 된다.
상기에서 설명한 특허문헌에는, 이하의 문제가 있다.
특허문헌 1, 2는, 우선, 정규 헤더를 검출하여, 정규 헤더의 정보를 해석하므로, 헤더와 헤더와의 사이에 발생하는 불연속 개소를 검출할 수 없다.
특허문헌 3도, 우선, 정규 헤더를 검출하여, 정규 헤더와 다음의 정규 헤더와의 사이의 데이터량을 검출하고 있다. 정규 헤더는, 동기어로써 검출할 수 있지만, 동기어를 포함하지 않는 스트림을 취급하는 본 출원의 발명에서는, 연속하는 2개의 정규 헤더를 검출할 수 없다.
또한, 특허문헌 1에서는, 뮤팅을 실행하는 타이밍은, 변경이 검출된 후의 프레임이다. 따라서, 변경전에 발생한 불연속 개소의 뮤팅을 실행할 수는 없다.
또한, 특허문헌 3에는, 뮤팅을 실행하는 타이밍이 기술되어 있지 않다.
(그 해결 방법)
본 발명에 의한 재생장치는, 1개의 프레임에 오디오 부호화 신호와 상기 오디오 부호화 신호의 속성 정보로 구성되는 전용 헤더를 포함하지만, 동기어를 포함하지 않는 하위 계층(layer)의 제2스트림이, 검출 가능한 헤더 신호를 포함하는 상위 계층의 제1스트림에 포함되는 데이터를 받아서, 상기 오디오 부호화 신호를 복호하여 음성을 출력하는 재생장치로서,
상기 제1스트림을 해석하여, 상기 헤더 신호를 검출하는 동시에, 검출한 헤더 신호를 기준으로, 상기 제2스트림을 해석하여 상기 오디오 부호화 신호와 상기 전용 헤더의 위치 정보를 출력하는 스트림 해석 수단과, 상기 스트림 해석 수단으로부터 출력되는 상기 오디오 부호화 신호와 상기 전용 헤더를 일시 저장하는 디코딩 전의 버퍼 메모리와, 상기 디코딩 전의 버퍼 메모리로부터 입력되는 상기 오디오 부호화 신호를 복호하여 음성을 출력하는 복호 수단과, 제1프레임의 전용 헤더에 포함되는 속성 정보를 해석하여, 전용 헤더에 후속하는 상기 오디오 부호화 신호의 데이터 길이를 나타내는 데이터 길이 정보를 검출하는 제1헤더 해석 수단과, 제1프레임의 전용 헤더의 위치 정보에, 검출된 데이터 길이를 부가하여 취득한 위치의 다음에 있는 소정량의 표적 데이터를 해석하고, 해석한 표적 데이터가, 제2프레임의 전용 헤더에 포함되는 속성 정보인가 아닌가를 판단하는 제2헤더 해석 수단과, 해석한 표적 데이터가, 제2프레임의 전용 헤더에 포함되는 속성 정보가 아닌 것으로 판단한 경우는, 최소한 제1프레임의 오디오 부호화 신호에 대하여 상기 복호 수단으로부터의 음성 출력을 정지하는 제어 수단을 구비한 것을 특징으로 하는 재생장치로 구성된다.
또한, 본 발명에 의한 재생장치에 있어서, 상기 제2헤더 해석 수단은, 상기 표적 데이터의 최소한 일부가, 상기 제1헤더 해석 수단에 의해서 해석된 속성 정보의 최소한 일부와 일치하는가 아닌가를 판단하는 것을 특징으로 하는 구성이라도 좋다.
또한, 본 발명에 의한 재생장치에 있어서, 상기 제2헤더 해석 수단은, 상기 표적 데이터의 최소한 일부가, 미리 저장된 속성 정보 군(群)의 최소한 어느 일부와 일치하는가 아닌가를 판단하는 것을 특징으로 하는 구성이라도 좋다.
또한, 본 발명에 의한 재생장치에 있어서, 상기 속성 정보는, 상기 오디오 부호화 신호의 샘플링 주파수, 채널 정보, 샘플 비트 길이, 오디오 부호화 신호의 데이터 길이의 최소한 하나인 것을 특징으로 하는 구성이라도 좋다.
또한, 본 발명에 의한 재생장치에 있어서, 상기 스트림 해석 수단은, 상기 헤더 신호에 포함되는 상기 프레임의 길이를 나타내는 프레임 길이 데이터를 검출하여, 상기 헤더 신호에 후속하는 1 프레임의 데이터가, 검출한 프레임 길이 데이터와 동등하지 않은 경우는, 상기 프레임을 파기하고, 다음의 프레임의 해석을 실행하는 것을 특징으로 하는 구성이라도 좋다.
또한, 본 발명에 의한 재생장치는, 상기 제1스트림은 복수의 패킷으로 구성되고, 상기 스트림 해석 수단은, 상기 헤더 신호에 포함되는 상기 패킷의 길이를 나타내는 패킷 길이 데이터를 검출하여, 검출한 1 패킷의 길이가, 검출한 패킷 길이 데이터와 동등하지 않은 경우는, 상기 패킷을 파기하고, 다음의 패킷의 해석을 실행하는 것을 특징으로 하는 구성이라도 좋다.
또한, 본 발명에 의한 재생장치에 있어서, 상기 제1스트림에 불연속이 발생한 개소에, 불연속점 명시 패킷이 삽입되는 동시에, 상기 스트림 해석 수단은, 불연속점 명시 패킷을 검출하고, 상기 디코딩 전의 버퍼에 출력한, 불연속점 명시 패킷 전의 데이터량이 미리 정의된 소정의 데이터량 또는 그 정수배(整數倍) 이하인 경우에는, 상기 디코딩 전의 버퍼에 대하여 부족한 만큼의 보완 데이터를 출력하는 것을 특징으로 하는 구성이라도 좋다.
또한, 본 발명에 의한 재생장치에 있어서, 상기 제1스트림에 불연속이 발생한 개소에, 불연속점 명시 패킷이 삽입되는 동시에, 상기 스트림 해석 수단은, 검출한 헤더 신호로부터 불연속 명시 패킷까지를 카운트하는 카운터를 구비하고, 또한 카운트한 점에서의 어드레스를 계산하여 저장하는 어드레스 기억 수단을 구비하며, 상기 제어 수단은, 계산한 어드레스에, 다음의 전용 헤더가 위치하도록 판독 포인터를 이동하는 것을 특징으로 하는 구성이라도 좋다.
또한, 본 발명에 의한 재생장치에 있어서, 상기 디코딩 전의 버퍼 메모리와 복호 수단의 사이에, 지연 수단을 설치한 것을 특징으로 하는 구성이라도 좋다.
또한, 본 발명에 의한 재생방법은, 1개의 프레임에 오디오 부호화 신호와, 상기 오디오 부호화 신호의 속성 정보로 구성되는 전용 헤더를 포함하지만, 동기어를 포함하지 않는 하위 계층의 제2스트림이, 검출 가능한 헤더 신호를 포함하는 상위 계층의 제1스트림에 포함되는 데이터를 받아서, 상기 오디오 부호화 신호를 복호하여 음성을 출력하는 재생방법으로서,
상기 제1스트림을 해석하여, 상기 헤더 신호를 검출하는 동시에, 검출한 헤더 신호를 기준으로, 상기 제2스트림을 해석하여 상기 오디오 부호화 신호와, 상기 전용 헤더의 위치 정보를 출력하는 스트림 해석 단계와, 상기 스트림 해석 단계로부터 출력되는 상기 오디오 부호화 신호와 상기 전용 헤더를 일시 저장하는 단계와, 상기 저장된 오디오 부호화 신호를 복호하여 음성을 출력하는 복호 단계와, 제1프레임의 전용 헤더에 포함되는 속성 정보를 해석하여, 전용 헤더에 후속하는 상기 오디오 부호화 신호의 데이터 길이를 나타내는 데이터 길이 정보를 검출하는 제1헤더 해석 단계와, 제1프레임의 전용 헤더의 위치 정보에, 검출된 데이터 길이를 부가하여 취득한 위치의 다음에 있는 소정량의 표적 데이터를 해석하고, 해석한 표적 데이터가, 제2프레임의 전용 헤더에 포함되는 속성 정보인가 아닌가를 판단하는 제2헤더 해석 단계와, 해석한 표적 데이터가, 제2프레임의 전용 헤더에 포함되는 속성 정보가 아닌 것으로 판단한 경우는, 최소한 제1프레임의 오디오 부호화 신호에 대하여 상기 복호 단계로부터의 음성 출력을 정지하는 제어 단계를 구비한 것을 특징으로 한다.
또한, 본 발명에 의한 재생방법에 있어서, 상기 제2헤더 해석 단계는, 상기 표적 데이터의 최소한 일부가, 상기 제1헤더 해석 수단에 의해서 해석된 속성 정보의 최소한 일부와 일치하는가 아닌가를 판단하는 것을 특징으로 한다.
또한, 본 발명에 의한 재생방법에 있어서, 상기 제2헤더 해석 단계는, 상기 표적 데이터의 최소한 일부가, 미리 저장된 속성 정보 군의 최소한 어느 일부와 일치하는가 아닌가를 판단하는 것을 특징으로 한다.
또한, 본 발명에 의한 재생방법에 있어서, 상기 속성 정보는, 상기 오디오 부호화 신호의 샘플링 주파수, 채널 정보, 샘플 비트 길이, 오디오 부호화 신호의 데이터 길이의 최소한 하나인 것을 특징으로 한다.
또한, 본 발명에 의한 재생방법에 있어서, 상기 스트림 해석 단계는, 상기 헤더 신호에 포함되는 상기 프레임의 길이를 나타내는 프레임 길이 데이터를 검출하여, 상기 헤더 신호에 후속하는 1 프레임의 데이터가, 검출한 프레임 길이 데이터와 동등하지 않은 경우는, 상기 프레임을 파기하고, 다음의 프레임의 해석을 실행하는 것을 특징으로 한다.
또한, 본 발명에 의한 재생방법에 있어서, 상기 제1스트림은, 복수의 패킷으로 구성되고, 상기 스트림 해석 단계는, 상기 헤더 신호에 포함되는 상기 패킷의 길이를 나타내는 패킷 길이 데이터를 검출하여, 검출한 1 패킷의 길이가, 검출한 패킷 길이 데이터와 동등하지 않은 경우는, 상기 패킷을 파기하고, 다음의 패킷의 해석을 실행하는 것을 특징으로 한다.
또한, 본 발명에 의한 재생방법에 있어서, 상기 제1스트림에 불연속이 발생한 개소에, 불연속점 명시 패킷이 삽입되는 동시에, 상기 스트림 해석 단계는, 불연속점 명시 패킷을 검출하고, 상기 저장한 불연속점 명시 패킷 전의 데이터량이, 미리 정의된 소정의 데이터량 또는 그 정수배 이하인 경우에는, 상기 디코딩 전의 버퍼에 대하여 부족한 만큼의 보완 데이터를 출력하는 것을 특징으로 한다.
또한, 본 발명에 의한 재생방법에 있어서, 상기 제1스트림에 불연속이 발생한 개소에, 불연속점 명시 패킷이 삽입되는 동시에, 상기 스트림 해석 단계는, 검출한 헤더 신호로부터 불연속 명시 패킷까지를 카운트하고, 또한 카운트한 점에서의 어드레스를 계산하여 저장하는 어드레스 기억 단계를 구비하며, 상기 제어 단계는, 계산한 어드레스에, 다음의 전용 헤더가 위치하도록 판독 포인터를 이동하는 것을 특징으로 한다.
또한, 본 발명에 의한 재생방법에 있어서, 상기 저장하는 단계와 복호 단계와의 사이에, 오디오 부호화 신호를 지연시키는 지연 단계를 구비한 것을 특징으로 한다.
또한, 본 발명은, 상기 재생방법을, 컴퓨터로써 실행시키기 위한 프로그램이다.
또한, 본 발명은, 상기 재생방법을, 컴퓨터로써 실행시키기 위한 프로그램을 기록한, 컴퓨터 판독 가능한 기록 매체이다.
(종래 기술보다 유리한 효과)
본 발명에 의한 재생장치는, 기본 스트림에 동기어나 CRC 비트가 존재하지 않는 오디오 스트림의 복호시에, 편집에 의한 불연속점이나 전송로의 오류에 의한 데이터의 결락이 있어도, 이음을 발생하지 않고 음성을 출력할 수 있다.
도 1은 본 발명의 제1실시형태에 있어서의 오디오의 재생장치의 구성을 나타내는 블록도.
도 2A는 본 발명의 제1실시형태에 있어서의 오디오의 재생방법을 나타내는 플로차트.
도 2B는 본 발명의 제1실시형태에 있어서의 오디오의 재생방법을 나타내는 플로차트.
도 3은 MPEG 규격에 의한 스트림의 구조를 나타내는 도면.
도 4는 트랜스포트 스트림 패킷 단위로 편집된 스트림의 구조를 나타내는 도면.
도 5A는 본 발명의 제1실시형태에 있어서의 오디오의 재생장치의 구성을 나타내는 블록도.
도 5B는 본 발명의 제1실시형태에 있어서의 오디오의 재생장치의 구성을 나타내는 블록도.
도 6은 본 발명의 제2실시형태에 있어서의 오디오의 재생장치의 구성을 나타내는 블록도.
도 7A는 본 발명의 제2실시형태에 있어서의 오디오의 재생방법을 나타내는 플로차트.
도 7B는 본 발명의 제2실시형태에 있어서의 오디오의 재생방법을 나타내는 플로차트.
도 8은 본 발명의 제3실시형태에 있어서의 오디오의 재생장치의 구성을 나타 내는 블록도.
도 9A는 본 발명의 제3실시형태에 있어서의 오디오의 재생방법을 나타내는 플로차트.
도 9B는 본 발명의 제3실시형태에 있어서의 오디오의 재생방법을 나타내는 플로차트.
본 발명의 제1실시형태에 대하여, 도 1, 도 2A, 도 2B, 도 3, 도 4, 도 5A, 도 5B를 이용하여 설명한다.
도 1은 본 실시형태의 재생장치(101)를 나타내는 블록도이다. 또한, 도 2A, 도 2B는 본 실시형태의 재생방법의 각각의 단계를 나타내는 플로차트이다. 또한, 도 3은 입력되는 스트림의 구조를 나타내는 도면으로서, MPEG 규격에 있어서의 트랜스포트 스트림 및 PES 패킷과, 본 발명에 의해서 이음 발생 방지의 효과가 기대되는 기본 스트림의 구성을 나타낸다. 도 4는 도 3에서 설명하는 트랜스포트 스트림이 트랜스포트 패킷 단위로 편집되어서, 불완전한 PES 패킷을 포함하는 경우를 나타내는 도면이다.
우선, 송신측에서, 트랜스포트 스트림(301)이 생성되는 과정을 간단히 설명한다. 오디오 신호는, 소정의 부호화 기술에 의해서, 오디오 부호화 신호(308)로 변환되고, 소정의 바이트 수마다(960 바이트마다, 또는 1440 바이트마다) 절단되어서, 절단 블록의 선두에 4 바이트의 전용 헤더(307)가 부여된다. 그 오디오 부호화 신호는, 압축 처리되어 있지 않은 PCM 데이터인 것으로 한다. 절단된 오디오 부호 화 신호(308)의 각각은, 약 5 msec의 길이의 오디오 신호를 포함한다. 전용 헤더(307)는, 오디오 부호화 신호(308)의 속성 정보를 포함하고, 또한, 동기어를 포함하지 않는다. 전용 헤더(307)와 그것에 후속하는 오디오 부호화 신호(308)를 합쳐서 오디오의 1 프레임이라고 하고, 이러한 프레임이 연속해서 보내져 오는 스트림을 기본 스트림(306)이라고 부른다. 속성 정보에는, 예로서, 샘플링 주파수, 채널 할당, 샘플의 비트 길이, 오디오 부호화 신호(308)의 데이터 길이의 정보가 포함된다. 이러한 속성 정보는, 속성(샘플링 주파수, 채널 할당 정보, 샘플의 비트 길이, 오디오 부호화 신호(308)의 데이터 길이)이 변경되지 않은 한, 변경되지 않는다. 따라서, 속성 정보가 변경되지 않는 한, n 번째(n은, 정(正)의 정수(整數))의 프레임의 전용 헤더(307)와, (n+1) 번째의 프레임의 전용 헤더(307)는, 동일하다. 통상은, 속성 정보는 거의 변경되지 않는다. 방송 시스템이 변경되는 경우, 또는, 광 디스크에 기록된 음성 트랙이 변경되는 경우, 변경되는 수가 있다. 또한, 속성 정보 중에는, 변경되는 빈도(頻度)가 적은(제로를 포함한다) 것과, 많은 것이 있다. 예로서, 변경되는 경우라도, 미리 결정된 복수의 선택 범위 중의 하나로 변경된다. 예로서, 오디오 부호화 신호(308)의 데이터 길이는, 미리 결정된 선택 범위인, 960 바이트나 1440 바이트의 하나로 변경된다.
이렇게 하여 형성된 기본 스트림(306)은, 1 프레임 단위로 분할할 수 있고, 964 바이트 또는 1444 바이트 길이의 PES 페이로드(305)로서 취급된다. 각각의 PES 페이로드(305)에는 PES 헤더(304)가 부가되어서, 하나의 PES 패킷(303)이 생성된다. PES 패킷(303)은, 소정의 길이마다(예로서 188 바이트 길이마다 또는 184 바이 트 길이 마다) 절단되고, 절단 블록은, 하나의 오디오 트랜스포트 패킷(302)으로서 취급된다. 오디오 트랜스포트 패킷(302)은, 비디오 트랜스포트 패킷 등의 기타 트랜스포트 패킷과 함께 결합되어서, 트랜스포트 스트림(301)이 생성된다. 트랜스포트 스트림(301)은, 송신국으로부터 방송된다. 수신기는, 트랜스포트 스트림(301)을 수신하여, 오디오 재생장치(101)로써 음성의 재생을 실행한다. 수신한 트랜스포트 스트림(301)은, 오디오 재생장치(101)에 직접 보내져도 좋고, 일시적으로 어딘가에 기록하고, 기록된 트랜스포트 스트림(301)을 오디오 재생장치(101)에 보내도록 해도 좋다. 후자의 경우로서, 트랜스포트 스트림의 형식으로 기록 재생장치에 의해서 기록된 음성이, 재생을 위하여 재생장치(101)에 보내져 오는 경우나, 트랜스포트 스트림의 형식으로 디스크(예로서 DVD)에 기록된 상용 콘텐츠가, 재생을 위하여 재생장치(101)에 보내져 오는 경우가 있다.
이상으로부터 명백한 바와 같이, 본 발명에 있어서는, 1개의 프레임에 오디오 부호화 신호와, 오디오 부호화 신호의 속성 정보로 구성되는 전용 헤더를 포함하지만, 동기어를 포함하지 않는 하위 계층의 제2스트림(기본 스트림)이, 검출 가능한 헤더 신호(PES 헤더)를 포함하는 상위 계층의 제1스트림(PES 패킷으로 구성되는 스트림)에 포함되는 구조의 데이터를 처리한다.
수신한 스트림은, 불연속 검출부(100)에서, 스트림 중의 패킷 또는 패킷의 일부에 불연속이 없는가 있는가, 즉 데이터의 일부가 결락되어 있지 않은가의 검출이 실행되고, 불연속이 검출되면, 불연속 명시 패킷(401)이 삽입된다.
오디오 재생장치(101)는, 오디오의 트랜스포트 패킷(302)을 포함하는 트랜스 포트 스트림(301)이 입력되어서, 복호되어, 음성 신호를 출력하는 것이다. 재생장치(101)에 입력된 트랜스포트 스트림(301)은, 스트림 해석 수단(102)에 입력된다(S201). 스트림 해석 수단(102)은 트랜스포트 스트림(301)을 해석하고, 오디오의 트랜스포트 패킷(302)을 추출하여 오디오 PES 패킷(303)을 구성하며, 또한 오디오 PES 패킷(303)을 해석한다(S202).
도 3에 나타내는 바와 같이, 스트림 해석 수단(102)은, 트랜스포트 패킷 중에서, 오디오 트랜스포트 패킷(302)만을 추출하여, PES 패킷(303) 스트림을 형성한다. PES 헤더(304)에는 PES 페이로드(305)의 데이터 길이가 포함되어 있다. 스트림 해석 수단(102)은, PES 헤더(304)가 검출되면, PES 헤더 직후로부터, 즉, PES 페이로드의 선두로부터 카운트를 개시하여, 다음의 패킷(PES 패킷 또는 이후에 설명하는 불연속점 명시 패킷)이 발견되면 카운트를 종료한다. 데이터에 불연속이 없으면, 계수치는, PES 페이로드(305)의 데이터 길이와 동일하다. 계수치를, PES 헤더에 포함되어 있던 데이터 길이와 비교하여, 계수치가 미리 정의된 정규의 값과 일치하는가를 판단한다(S203). 일치하지 않는 경우, 즉 상기 값이 부정(不正)인 경우(S203의 부정)에는 현재 해석하고 있는 PES 패킷을 파기하고, 다음 PES 패킷의 해석을 실행한다. 상기 PES 페이로드의 데이터 길이는, 미리 규격으로써 정의된 몇 종류의 길이의 어느 하나이고, 예로서, 964 바이트, 1444 바이트의 어느 하나이다.
한편, 상기 값이 정규인 경우(S203의 정규)에는, PES 페이로드(305)로부터 전용 헤더(307) 및 오디오 부호화 신호(308)를 추출하여, 디코딩 전의 버퍼 메모리(103)에 저장한다(S204). 여기서 PES 페이로드(305)는 오디오의 기본 스트림(306) 이라고도 부른다. 또한, 전용 헤더(307)는 오디오 부호화 신호(308)의 속성 정보를 포함하고, 또한, 동기어를 갖지 않은 것이다. 전용 헤더(307)의 검출은, 예로서, PES 헤더(304)의 검출로부터, 소정 시간의 지연에 따라서 검출한다. 도 3에 나타내는 예에 있어서는, 전용 헤더(307)는, PES 헤더(304)의 직후에 위치하고 있는 경우를 나타내고 있지만, 전용 헤더(307)는, PES 헤더(304)의 종단으로부터 소정량 이후에 위치하도록 배치하는 것도 가능하다. 이 경우는, EPS 헤더에, 소정량의 정보를 갖도록 하면 좋다.
이상으로부터 명백한 바와 같이, 스트림 해석 수단(102)은, 제1스트림인 PES 패킷을 포함하는 스트림을 해석하고, 헤더 신호 즉 PES 헤더를 검출하는 동시에, 검출한 헤더 신호를 기준으로, 제2스트림인 기본 스트림을 해석하여 상기 오디오 부호화 신호와 상기 전용 헤더의 위치 정보를 출력하는 것을 목적으로 하는 것이다.
여기서, 오디오 재생장치(101)에 입력되는 것은 트랜스포트 스트림(301)인 것으로 했지만, 이것에 한정되는 것은 아니고, 오디오 PES 패킷(303)이 입력되어도 좋다. 그 경우도, 스트림 해석 수단(102)은 기본 스트림(306)인 경우의 전용 헤더(307)와 오디오 부호화 신호(308)를 디코딩 전의 버퍼 메모리(103)에 저장한다. 또한, 도 2A에 있어서는, 흐름을 보기 쉽게 하기 위하여, 트랜스포트 스트림(301)의 해석과 PES 패킷(303)의 해석을 1개의 단계(S202)로 나타내고 있다.
디코딩 전의 버퍼 메모리(103)로부터 출력되는 오디오 부호화 신호(308)는, 제1헤더 해석 수단(105), 제2헤더 해석 수단, 프레임 지연 수단(111)에 입력된다. 프레임 지연 수단(111)은, 전송되어 온 오디오 부호화 신호(308)를 최소한 1 프레임 지연시켜서, 복호 수단(104)에 보낸다.
제1헤더 해석 수단(105)은 디코딩 전의 버퍼 메모리(103)에 저장된 제1프레임의 전용 헤더(307)를 검출하여, 판독하고, 전용 헤더(307)에 포함되는 정보를 해석하여 제어 수단(107)에 출력한다(S205). 전용 헤더(307)의 검출은, 예로서 스트림 해석 수단(102)으로써 검출한 PES 헤더(304)의 타이밍으로부터, 소정 시간후의 타이밍에 실행한다. 전용 헤더(307)에 포함되는 정보는, 오디오 부호화 신호의 속성 정보이고, 예로서, 샘플링 주파수와 채널 할당 정보와 샘플의 비트 길이와 오디오 부호화 신호(308)의 데이터 길이이다. 속성 정보의 일부 또는 전부가, 제어 수단(107)에 출력된다.
제1헤더 해석 수단(105)은, n 번째의 전용 헤더(307)(4 바이트)를 검출하여, 검출한 n 번째의 전용 헤더(307)를 제어 수단(107)에 보낸다. 제어 수단(107)은, n 번째의 전용 헤더(307)의 정보(샘플링 주파수, 채널 할당 정보, 샘플의 비트 길이, 오디오 부호화 신호(308)의 데이터 길이)의 모두 또는 일부를 전용 헤더 메모리(110)에 저장한다. 또한, 제1헤더 해석 수단(105)은, 검출한 n 번째의 전용 헤더(307)의 선두로부터 1 프레임에 상당하는 시간 Tf를 카운트하고, 트리거(trigger) 신호를 제2헤더 해석 수단(106)에 보낸다. 또한, 1개의 프레임 대신에, m개(m은 1보다 큰 정(正)의 정수(整數))의 프레임을 카운트하여 트리거 신호를 출력하도록 해도 좋다. 시간 Tf는, 속성 정보의 하나인 오디오 부호화 신호(308)의 데이터 길이에 전용 헤더 길이(4 바이트)를 가산하면 구하여진다. 여기에서의 카운트는, 전 용 헤더(307)의 종단으로부터 오디오 부호화 신호(308)의 데이터 길이를 카운트해도 좋다.
이상으로부터 명백한 바와 같이, 제1헤더 해석 수단(105)은, 제1프레임의 전용 헤더에 포함되는 속성 정보를 해석하여, 전용 헤더에 후속하는 오디오 부호화 신호의 데이터 길이를 나타내는 데이터 길이 정보를 검출하는 것을 목적으로 하는 것이다.
제2헤더 해석 수단(106)은, 트리거 신호에 응답하여, 디코딩 전의 버퍼 메모리(103)로부터 출력되는 기본 스트림의 일부의 데이터(4 바이트), 즉, 표적 데이터를 판독한다. 오디오 부호화 신호에 불연속이 없으면, 판독한 표적 데이터는, (n+1) 번째의 전용 헤더에 상당한다. n 번째의 프레임 데이터에 불연속이 있으면, 판독한 표적 데이터는, (n+1) 번째의 전용 헤더가 아니므로, (n+1) 번째의 전용 헤더를 올바로 판독할 수 없다.
제2헤더 해석 수단(106)은, 판독한 4 바이트의 표적 데이터와, 전용 헤더 메모리(110)에 저장한 전용 헤더를 비교하여, 동일하면, (n+1) 번째의 전용 헤더가 올바른 위치에 존재하고 있는 것으로 판단한다. 즉, n 번째의 프레임이 과부족 없이 존재하는 것으로 판단한다. 이 판단에 따라서, 제어 수단(107)은, 음성의 디코딩을 실행한다.
그런데, 제2헤더 해석 수단(106)은, 표적 데이터가, 전용 헤더 메모리(110)에 저장한 전용 헤더와 일치하지 않으면, (n+1) 번째의 전용 헤더가 올바른 위치에 존재하지 않는 것으로 판단하여, 이 경우는 오디오 부호화 신호에 불연속이 있어 서, 음성 데이터가 결락되어 있는 것으로 판단된다. 이 경우, 제어 수단(107)은, n 번째의 전용 헤더에 후속하는 오디오 부호화 신호를 뮤팅하기 위하여, 복호 수단(104)에 대하여, 뮤팅 신호를 출력한다. 프레임 지연 수단(111)을 설치하였으므로, 뮤팅 신호가 출력되는 시점은, 복호 수단(104)에 의해서, n 번째의 전용 헤더에 후속하는 오디오 부호화 신호에 대하여, 음성 출력이 실행되기 직전이 된다. 따라서, 복호 수단(104)은, n 번째의 전용 헤더에 후속하는 오디오 부호화 신호를 뮤팅하여, 음성 출력을 정지하도록 지시한다. 뮤팅 신호는, 1 프레임 기간을 뮤팅하는 신호로 되어 있다. 따라서, (n+1) 번째의 전용 헤더에 후속하는 오디오 부호화 신호로부터 음성의 재생 출력을 실행한다.
이상으로부터 명백한 바와 같이, 제2헤더 해석 수단(106)은, 제1프레임의 전용 헤더의 위치 정보에, 검출된 데이터 길이를 부가하여 취득한 위치의 다음에 있는 소정량의 표적 데이터를 해석하고, 해석한 표적 데이터가, 제2프레임의 전용 헤더에 포함되는 속성 정보인가 아닌가를 판단하는 것을 목적으로 한다.
또한, 표적 데이터가, 제2프레임의 전용 헤더에 포함되는 속성 정보인가 아닌가의 판단은, 표적 데이터의 최소한 일부가, 제1헤더 해석 수단(105)에 의해서 해석된 속성 정보의 최소한 일부와 일치하는가 아닌가를 판단하도록 해도 좋다.
여기서, 뮤팅 신호는, 복수 프레임 기간, 예로서, 2 프레임 기간을 뮤팅하는 신호라도 좋다. 2 프레임 기간을 뮤팅하는 신호이면, (n+1) 번째의 전용 헤더에 후속하는 오디오 부호화 신호도 뮤팅하여, 음성 출력을 정지하도록 지시하고, (n+2) 번째의 전용 헤더에 후속하는 오디오 부호화 신호로부터 음성의 재생 출력을 실행 하게 된다. 또한, 전용 헤더 메모리(110)는, 제1헤더 해석 수단(105)에 설치하도록 해도 좋다.
말할 필요도 없이, 제1헤더 해석 수단(105) 대신에, 제어 수단(107)이 어드레스의 산출을 실행해도 좋다.
제2헤더 해석 수단(106)은 제1헤더 해석 수단(105)과 마찬가지로 전용 헤더(307)를 해석하여 그곳에 포함되는 정보를 제어 수단(107)에 출력하는 것이다(S207). 제2헤더 해석 수단(106)이 제1헤더 해석 수단(105)과 상이한 것은, 제1헤더 해석 수단(105)으로부터의 트리거 신호에 의해서, 데이터의 판독이 실행되는 점과, 제1헤더 해석 수단(105)이 해석한 전용 헤더보다도 이후의 시각의 프레임, 예로서, 다음의 프레임의 전용 헤더를 해석하는 점이다. 즉, 이후에 설명하는 복호 수단(104)으로써 복호하는 현재의 프레임의 다음의 프레임의 전용 헤더를 해석한다.
복호 수단(104)은, 디코딩 전의 버퍼 메모리(103)로부터 출력되어서, 일정 시간 지연된 오디오 부호화 신호(308)를 판독하여, 음성을 출력하는 것이다(S209). 복호 수단(104)은 제어 수단(107)에 의해서, 복호의 개시나 정지, 또는, 뮤팅 처리 등 음성의 출력에 관계되는 제어를 받는다.
제어 수단(107)은, 제1헤더 해석 수단(105) 및 제2헤더 해석 수단(106)으로부터, 현재의 프레임 및 다음의 프레임의 전용 헤더에 포함되는 정보를 각각 수신하여, 그 정보를 서로 비교하고(S208), 상이한 것이 있으면 복호 수단(104)에 뮤팅을 지시한다(S210).
또한, 본 실시형태에 있어서의 재생장치 및 재생방법은, 제1프레임의 오디오 신호를 출력한 후, 다음의 프레임의 복호를 실행하기 위하여, 디코딩 전의 버퍼 메모리에 오디오 부호화 신호의 1 프레임보다도 충분히 많은 소정량의 데이터가 축적되어 있는가를 판정하여(S211), 축적되어 있으면 제1헤더 해석 수단(105)에 의한 제1프레임의 속성 정보의 해석(S205) 처리에 복귀하여, 복호를 계속한다. 디코딩 전의 버퍼 메모리에 소정량의 데이터가 축적되어 있지 않은 경우에는, 외부로부터 스트림을 입력하여(S201), 상기한 스트림 해석 수단(102)에 의한 스트림의 해석(S202) 이후의 처리를 실행한다.
그리고, 트랜스포트 스트림(301)이 트랜스포트 패킷 단위로 편집된 경우에 대하여, 도 4를 참조하면서 설명한다. 오디오 재생장치(101)에 입력되는 트랜스포트 스트림의 편집 등에 의해서 불연속이 발생한 경우에는, 불연속 검출부(100)에서, 불연속점이 검출된 개소에 불연속점 명시 패킷(401)이 삽입된다. 스트림 해석 수단(102)은 상기한 바와 같이 입력된 스트림을 해석하여(S202), 오디오의 기본 스트림을 디코딩 전의 버퍼 메모리(103)에 저장한다(S204). 여기서, 불연속점 명시 패킷(401)이 있으면, 스트림으로부터 추출된 오디오 부호화 신호는, 데이터의 후반 부분이 결락된 불완전한 오디오 부호화 신호(403)가 된다. 제1헤더 해석 수단(105)은, 현재의 전용 헤더의 종단 위치의 어드레스에, 제1헤더 해석 수단(105)에 포함되는 본래의 오디오 부호화 신호의 데이터 길이를 가산하여 어드레스 B(407)를 산출한다(S206). 불완전한 오디오 부호화 신호(403)가 존재하므로, 이 어드레스 B는 실제의 다음의 전용 헤더의 어드레스인 어드레스 A(406)보다도 먼저 진행된 점이 된다. 제1헤더 해석 수단(105)은, 어드레스 B의 타이밍에 트리거 신호를 생성한다. 제2헤더 해석 수단(106)은, 트리거 신호에 응답하여 어드레스 B의 시점으로부터 소정량(4 바이트)의 데이터를 판독하고, 다음의 전용 헤더인 것으로 예측하여, 전용 헤더의 해석 처리를 실행한다(S207). 어드레스 B로부터 소정량 저장되어 있는 것은 오디오 부호화 신호의 일부 또는 전용 헤더의 일부와 오디오 부호화 신호의 일부의 데이터이므로, 올바른 해석을 실행할 수 없다. 따라서, 제2헤더 해석 수단(106)의 해석 결과의 정보는, 제1헤더 해석 수단(105)으로써 취득하여, 전용 헤더 메모리(110)에 저장된 속성 정보와 일치하지 않고, 불일치 정보가 생성된다. 오디오 부호화 신호가 PCM 데이터이면, 우연히 제1프레임의 전용 헤더에 일치할 가능성이 있지만, 그 가능성은 극히 낮다.
생성된 불일치 정보에 따라서, 현재의 전용 헤더(404)에 관련되는 현재의 프레임을 복호 수단(104)으로부터 출력하기 전에 뮤팅한다(S210). 이에 따라서, 불완전한 오디오 부호화 신호(403)와, 필요하면 그것에 후속하는 다음의 프레임의 오디오 부호화 신호를 복호 및 출력하지 않고, 이음의 발생을 방지하는 것이 가능하게 된다.
또한, 제어 수단(107)에 의한 다른 판정 방법에 대하여, 도 5A, 도 5B를 이용하여 설명한다. 전용 헤더 메모리(110)는, 검출한 전용 헤더에 포함되는 속성 정보(샘플링 주파수, 채널 할당 정보, 샘플의 비트 길이, 오디오 부호화 신호(308)의 데이터 길이)를 저장하는 것이 아니고, 변형도 포함한 선택 가능한 속성 정보 군의 모두를 미리 저장한다. 즉, 전용 헤더 메모리(110)는, 예로서 다음의 표 1의 정보 를 기록한다.
표 1
a: 샘플링 주파수 | b: 채널 할당 정보 | c: 샘플의 비트 길이 | d: 오디오 부호화 신호의 데이터 길이 |
(a1) 32 ㎑ | (b1): 모노럴 | (c1): 16 | (d1): 960 바이트 |
(a2) 44.1 ㎑ | (b2): 스테레오 | (c2): 20 | (d2): 1440 바이트 |
(a3) 48 ㎑ | (b3): 듀얼 모노럴 | (c3): 24 | (d3): 5760 바이트 |
실제로, 전용 헤더에 포함되어 있는 정보는, a의 열로부터 하나, b의 열로부터 하나, c의 열로부터 하나, d의 열로부터 하나의 정보이며, 예로서, (a2, b1, c1, d2)의 정보를 포함하고 있다.
제어 수단(107)은, 현재의 전용 헤더에서 검출한 속성 정보와, 전용 헤더 메모리(110)에 미리 저장된 속성 정보 군(표 1의 데이터)을 비교하여, 메모리(110)에, 검출한 속성 정보와 일치하는 정보가 포함되어 있는가 아닌가를 판정한다(S507). 즉, 검출한 속성 정보(a2, b1, c1, d2)의 모두가 메모리(110)에 저장된 속성 정보 군에 포함되어 있으면, 모두 정규의 정보인 것으로 판단하는 한편, 검출한 속성 정보(xx, b1, c1, d2)(여기서 xx는 분석 불가능한 정보를 나타낸다)의 어느 하나에, 메모리(110)에 저장된 속성 정보 군에 포함되어 있지 않은 것이 있으면, 전용 헤더는 부정한 정보인 것으로 판단한다.
이어서, 현재의 전용 헤더의 종단으로부터 오디오 부호화 신호(308)의 데이터 길이 다음에 있는 4 바이트의 표적 데이터, 즉, 다음의 전용 헤더가 있어야 할 개소로부터 검출한 속성 정보와, 미리 저장된 속성 정보를 비교하여, 상기와 동일 한 판정을 한다(S508). 2개의 검출한 속성 정보의 모두가, 미리 저장된 속성 정보와 일치하는 정보가 포함되어 있는 경우는 오디오를 재생하는(S509) 한편, 2개의 검출된 속성 정보의 어느 하나에, 미리 저장된 속성 정보와 일치하지 않는 정보가 포함되어 있는 경우에는 복호 수단(104)에 뮤팅을 지시한다(S510). 또한, 도 5A에서는 흐름을 보기 쉽게 하기 위하여, 도 2A를 이용하여 설명한 PES 페이로드 길이가 정규인가 아닌가의 판정 단계(S203)를 생략하고 있지만, 스트림 해석(S502)의 다음에 동일한 판정을 실행해도 좋은 것은 말할 필요도 없다. 또한, 뮤팅을 실행해야 하는가 아닌가는, 다음의 전용 헤더가 올바른 위치에 있는가 아닌가를 판단하면 되므로, 판정 단계(S507)를 생략하고, 다음의 전용 헤더에 대해서만, 속성 정보를 검출하여, 미리 저장된 속성 정보와 일치하는 정보가 포함되어 있는가 아닌가를 판정하도록(S508) 해도 좋다. 현재의 전용 헤더를 검출하여, 해석하는 것은, 다음의 전용 헤더까지 카운트하기 위한 기산점(起算點)과, 다음의 전용 헤더까지의 간격을 얻기 위한 것이다. 또한, 다음의 전용 헤더를 해석하는 것은, 다음의 전용 헤더로서 검출한 데이터가, 정규의 전용 헤더인가 아닌가의 판단을 하기 위한 것이다.
이상으로부터 명백한 바와 같이, 제2헤더 해석 수단은, 표적 데이터가, 제2프레임의 전용 헤더에 포함되는 속성 정보인가 아닌가의 판단을 실행하지만, 이 판단은, 상기 표적 데이터의 최소한 일부가, 미리 저장된 속성 정보 군의 최소한 어느 일부와 일치하는가 아닌가의 판단을 실행하도록 해도 좋다.
표 1에 나타내는 속성 정보 군을 미리 저장해 두면, 속성 정보가 허용된 범위내에서 변경된 경우, 잘못된 속성 정보라는 판단을 방지할 수 있다.
또한, 프레임화된 오디오 스트림의 전용 헤더(307)는 일반적으로 그 후에 후속하는 오디오 부호화 신호(308)의 속성 정보를 포함하므로, 스트림의 최종 프레임에는, 제2헤더 해석 수단으로써 해석해야 할 데이터가 존재하지 않는 경우가 있다.
이러한 경우에는, 스트림 해석 수단(102)이 스트림의 종단에 미리 정의된 특정의 더미(dummy) 데이터, 예로서, 표 1의 대표적인 속성 정보의 조합(a1, b1, c1, d1)을 부가한다. 제어 수단(107)은, 제2헤더 해석 수단(106)으로써 취득한 다음의 프레임의 속성 정보가 모두 상기의 미리 정의된 비트 열에 일치하면 복호 수단(104)에 대하여 뮤팅 지시를 하지 않는 것으로 하면 좋다. 이것은, 입력되는 스트림의 종단에 있어서, 제2헤더 해석 수단(106)이 해석해야 할 어드레스에 데이터가 존재하지 않고, 복호 수단이 디코딩 전의 버퍼 메모리(103)로부터 데이터를 판독할 때에 언더플로(underflow)가 발생한 경우, 제2헤더 해석 수단(106)이 아무런 정보도 취득할 수 없게 되는 것을 회피하는 데에 유효한 제어이다. 즉, 스트림 해석 수단(102)이, 미리 정의된 정규의 속성 정보로 구성되는 전용 헤더를 부가함으로써, 언더플로를 방지하고, 최종 프레임을 복호 처리하여 출력할 수 있게 된다. 미리 정의된 속성 정보는, 예로서, 샘플링 주파수는 48kHz만, 또한, 샘플의 비트 길이는 16 비트, 20 비트 또는 24 비트의 어느 하나, 또한, 채널 할당 정보는 모노럴, 듀얼 모노럴 또는 스테레오의 어느 하나, 또한, 오디오 부호화 신호의 데이터 길이는 960 바이트 또는 1440 바이트의 어느 하나일 수 있고, 또한, 종단에 부가되는 특정한 비트 열은, 이상의 속성 정보를 나타내는 비트 열과 상이한 것을 정의하면 된다. 또한, 종단에 부가하는 특정한 비트 열은, 상기 미리 정의된 정규의 속성 정보 로 구성되어 있어도 좋다.
이상으로부터, 본 실시형태에서는, 제1프레임의 전용 헤더와 제2의 프레임의 전용 헤더의 사이의 데이터인 제1프레임의 오디오 부호화 신호의 일부가 스트림의 전송 오류 등에 의해서 결손되어 있는 경우에도, 제1프레임의 오디오 부호화 신호를 뮤팅함으로써, 이음의 발생을 방지할 수 있게 된다.
이어서, 본 발명의 제2실시형태에 대하여, 도 6 및 도 7A, 도 7B를 이용하여 설명한다.
제2실시형태가 제1실시형태와 상이한 것은, 패킷 길이 카운트 수단(608)을 구비하고 있는 점이다. 패킷 길이 카운트 수단(608)은, 디코딩 전의 버퍼 메모리(103)에 저장하는 데이터량을 연속적으로 카운트하고(S705), 카운트한 PES 페이로드의 데이터량이 제1의 소정의 길이 이하인 경우(S706의 N)에는 스트림 입력(S701)의 단계로 복귀한다. 제2실시형태에서는, 트랜스포트 스트림 TS 및 PES 헤더의 해석(S702) 이후에 불연속점 명시 패킷이 있는가 없는가를 판정한다(S703). 불연속점 명시 패킷이 있는 경우(S703의 Y), 디코딩 전의 버퍼(103)에의 기본 스트림의 저장량이 제2의 소정의 길이의 정수배인가를 판정한다(S707). 정수배가 아닌 경우에는 정수배가 되도록 특정한 길이의 보완 데이터를 디코딩 전의 버퍼에 저장하고(S708), 패킷 길이 카운트 수단을 재설정하고(S716), 스트림 입력 단계(701)로 복귀한다. 불연속점 명시 패킷이 없는 경우(S703의 N), 디코딩 전의 버퍼(103)에의 기본 스트림의 저장이 실행되고(S704), 패킷 길이 카운트 수단(608)은, 저장한 데이터량을 카운트한다(S705).
패킷 길이 카운트 수단(608)은, 스트림 해석 수단(102)이 오디오의 PES 패킷의 헤더(이하, PES 헤더)를 검출하고(S702), 다음 PES 헤더를 검출할 때까지 디코딩 전의 버퍼 메모리(103)에 저장하는 데이터량, 즉, PES 페이로드 길이를 카운트한다(S705).
스트림 해석 수단(102)은, 트랜스포트 스트림 TS 또는 PES 헤더의 해석중에 불연속점 명시 패킷을 검출하고(S703의 Y), 그 시점에 디코딩 전의 버퍼(103)에의 데이터 저장량이 제2의 소정의 길이의 정수배가 되어 있는가 아닌가를 판정한다(S707). 상기 판정(S707)이 정수배가 아닌 경우, 디코딩 전의 버퍼(103)에의 데이터 저장량이 제2의 소정의 길이의 정수배가 되도록 보완 데이터를 디코딩 전의 버퍼에 저장한다(S708). 이어서, 패킷 길이 카운트 수단(608)의 카운터는 재설정되고(S716), 스트림 입력(S701)으로 처리가 복귀된다. 또한, 스트림 입력(S701)으로 처리가 복귀할 때에, 디코딩 전의 버퍼 메모리(103)에서의, 제1헤더 해석 수단(105)의 판독 어드레스를, 상기 보완 데이터를 저장한 어드레스의 다음 어드레스, 즉, 불연속점 명시 패킷후의 데이터의 선두가 저장되는 어드레스로 이동한다.
여기서, 미리 정의된 제1의 소정의 길이는, 예로서, 4 바이트의 제1전용 헤더와, 960 바이트 또는 1440 바이트의 오디오 부호화 신호와, 4 바이트의 제2전용 헤더로써 구성되는 데이터량이고, 즉, 968 바이트 또는 1448 바이트이다.
또한, 제2의 소정의 길이는, 제1헤더 해석 수단(105), 제2헤더 해석 수단(106) 및 복합 수단(104)이 디코딩 전의 버퍼 메모리(103)에 저장되어 있는 데이터를 판독할 때에 액세스할 수 있는 데이터의 최소 단위(통칭: 워드)이고, 예로서 4 바이트이다.
디코딩 전의 버퍼 메모리(103)로부터 출력되는 기본 스트림은, 상기와 마찬가지로 제1헤더 해석 수단(105)에 의해서 해석되어서(S709), 제2헤더의 위치가 산출되고(S710), 제2헤더의 위치에 있는 표적 데이터(제2헤더인 것으로 예측되는 데이터)가 해석된다(S711). 해석된 표적 데이터의 내용이, 제1헤더의 내용과 비교되어서, 일치하는가 아닌가의 판단이 실행된다(S712). 동일하면, 표적 데이터의 내용이, 정규의 제2헤더인 것으로 판단되어서, 오디오 재생이 실행된다(S713). 제2헤더의 내용이 1 개소라도, 제1헤더의 내용과 상이하면, 표적 데이터의 내용은, 정규의 제2헤더가 아닌, 즉, 제2헤더의 위치가, 산출한 위치로부터 벗어난 위치에 있는 것으로 판단되어서, 제1실시형태와 마찬가지로, 제1헤더에 후속하는 오디오 부호화 신호에 대하여 뮤팅 처리를 실행한다(S714). 그 후, 디코딩 전의 버퍼 메모리(103)에 소정량(제1의 소정의 길이 이상)의 데이터가 저장되어 있는가 아닌가가 판단되고(S715), 저장되어 있으면 단계 S709에 복귀하고, 저장되어 있지 않으면 단계 S701에 복귀한다.
단계 S712에서의 판단은, 해석한 표적 데이터의 내용과, 해석된 제1헤더의 내용을 비교하여, 일치하는가 아닌가의 판단을 실행하였지만, 해석한 표적 데이터의 내용과 미리 저장된 표 1의 내용을 비교하도록 해도 좋다.
이에 따라서, 트랜스포트 패킷 단위로 스트림이 편집된 경우에 있어서도, 후반의 데이터가 결락된 PES 페이로드, 즉, 불완전한 오디오의 전용 헤더 및 오디오 부호화 신호가 디코딩되는 일이 없으므로, 편집점(編集点) 전의 불완전한 오디오 부호화 신호 및 그것에 후속하는 데이터가 복호 수단(104)에 입력되어서 이음을 발생하는 것을 방지할 수 있게 된다.
또한, 불완전한 오디오 부호화 신호가 복호 수단(104)에 의해서 복호되지 않는 것이면, 제2헤더 해석 수단(106)에 의한 다음의 프레임의 헤더 해석(S711) 및 제어 수단(107)에서의 다음의 프레임의 속성 정보의 확인(S712)은 본래 필요 없지만, 현실에 있어서는, 스트림 해석 수단(102)과 디코딩 전의 버퍼 메모리(103)의 사이의 데이터 전송에 있어서의 데이터의 결락을 검출하거나, 기타 요인에 의해서 원래 부정한 오디오 부호화 신호가 올바른 패킷 길이로 PES화되어서 입력되는 경우에도 이음 발생을 방지하기 위하여, 제2헤더 해석 수단(106)을 실장(實裝)한다.
또한, 제2실시형태에 있어서의 스트림 해석 수단(102)의 다른 제어로서, 스트림 해석 수단(102)은, 패킷 길이 카운트 수단(608)에 의해서 카운트된 패킷 길이가, 특정한 데이터 길이의 정수배가 되지 않는 경우(S707의 N)에는, 특정한 데이터 길이의 정수배가 되도록 부족한 만큼의 데이터를 부가함으로써(S708) 워드 정렬(word alignment)을 실행하고, 그것을 디코딩 전의 버퍼 메모리(103)에 저장한다. 일반적으로, 복호 수단(104) 및 제1헤더 해석 수단(105) 및 제2헤더 해석 수단(106)이 디코딩 전의 버퍼 메모리(103)로부터 데이터를 판독하는 경우에는, 미리 결정된 워드 단위로 판독하게 된다. 예로서, 4 바이트를 1 워드로 하여 데이터를 판독한다.
트랜스포트 패킷 단위의 편집이 실행된 경우, 일반적으로, 편집점의 어드레스는 4 바이트 단위가 아니고, 편집점 후의 프레임은 그 후 워드 정렬되지 않은 채 로 디코딩 전의 버퍼 메모리에 저장된다. 이 경우, 제1헤더 해석 수단(105) 및 제2헤더 해석 수단(106)이 판독하는 편집점 후의 전용 헤더 근방의 데이터는 1 내지 3 바이트 편이(偏移)되어서, 제어 수단(107)은 올바른 속성 정보를 취득할 수 없게 된다. 왜냐하면, 본 실시형태에서 대상으로 하는 기본 데이터에는 동기어가 존재하지 않으므로, 이 1 내지 3 바이트의 데이터의 편이를 제1헤더 해석 수단(105) 또는 제2헤더 해석 수단(106)이 검출하여 판독 위치를 수정하는 것은 불가능하기 때문이다. 따라서, 스트림 해석 수단(102)이 디코딩 전의 버퍼 메모리(103)에 데이터를 저장할 때에 보완 데이터를 저장함으로써(S708), 편집점 후의 복호 및 음성 출력이 가능하게 된다.
이상의 처리를 정리한 것이 도 7A, 도 7B이고, 우선, PES 패킷 해석중에 불연속점 명시 패킷(401)을 검출한 경우에는, 처리는 PES 패킷 해석 단계(S702)로 복귀한다. 또한, 디코딩 전의 버퍼 메모리에 저장한 PES 패킷의 데이터량이 제1의 소정의 길이, 즉, 기본 스트림(306)의 1 프레임 길이의 정수배에 일치하지 않는 경우(S706의 N)는, 스트림 입력 단계(S701)로 복귀한다. 또한, 디코딩 전의 버퍼에 저장한 데이터량이 제2의 소정의 길이의 정수배에 일치하지 않는 경우(S707의 N)에는, 보완 데이터를 디코딩 전의 버퍼에 저장하여(S708), 디코딩 전의 버퍼에 저장된 데이터에 액세스하기 위한 포인터를 워드 정렬한다.
이상과 같이, 본 발명에 의해서, 스트림의 불연속점을 스트림 해석 수단으로써 검출하여, 이음의 발생을 방지할 수 있게 된다. 또한, 불연속점에서 워드 정렬을 실행함으로써, 불연속점 후의 복호 및 오디오의 재생이 가능하게 된다.
또한, 도 7A에서는 흐름을 보기 쉽게 하기 위하여, 도 2A를 이용하여 설명한 PES 페이로드 길이가 정규인가 아닌가의 판정(S203)을 생략하고 있지만, 스트림 해석(S702)후에 마찬가지의 판정을 실행해도 좋은 것은 말할 필요도 없다.
이어서, 본 발명의 제3실시형태에 대하여, 도 8, 도 9A, 도 9B 및 도 4를 이용하여 설명한다. 제3실시형태에 있어서는, 편집점 후의 음성 출력의 재개를 실현하는 예에 대하여 설명한다.
제3실시형태가 제1실시형태 또는 제2실시형태와 상이한 것은, 스트림 해석 수단(102)이 디코딩 전의 버퍼 메모리(103)에 저장하는 전용 헤더의 어드레스를 기억하는(S904) 어드레스 기억 수단(808)(도 8)을 구비한 점이다.
스트림이 입력되고(S901), 트랜스포트 스트림 TS 및 PES 헤더의 해석이 실행된다(S902). PES 헤더를 해석하고, 다음 PES 헤더의 검출중에, 불연속점 명시 패킷(401)이 있는가 없는가의 판단이 실행된다(S903). 불연속점 명시 패킷(401)이 발견된 경우는 단계 S904로 진행하는 한편, 불연속점 명시 패킷(401)이 발견되지 않고 다음 PES 헤더가 발견된 경우(또는 이전의 PES 헤더로부터 소정량의 카운트가 종료된 경우)는, 단계 S905로 진행한다. 단계 S905에서는 기본 스트림을 디코딩 전의 버퍼 메모리(103)에 저장한다.
여기서 단계 S903, S904에 대하여, 도 4를 이용하여 설명한다. 단계 S903에서, 스트림 해석 수단(102)은, PES 헤더를 검출하고, 해석한다. 스트림 해석 수단(102)에 설치한 카운터는, PES 헤더의 종단으로부터 카운트를 시작하고, 다음의 패킷(데이터에 불연속이 발생된 경우는, 불연속점 명시 패킷, 데이터에 불연속이 발 생하지 않은 경우는 다음 PES 패킷)이 발견될 때까지 카운트한다. PES 헤더를 해석했을 때에, PES 헤더에 후속하는 PES 페이로드의 데이터 길이를 검출하고, 그 데이터 길이를 카운트하도록 해도 좋다. 그리고, 카운트가 종료된 점에서의 어드레스 A를 산출한다. 이 어드레스 A를 어드레스 기억 수단(808)에 저장한다(S904). 즉, 어드레스 기억 수단(808)에는 편집점 후의 선두의 전용 헤더의 선두 어드레스가 저장된다.
디코딩 전의 버퍼 메모리(103)로부터 출력되는 기본 스트림은, 상기와 마찬가지로 제1헤더 해석 수단(105)에 의해서 해석되어서(S906), 제2헤더의 위치가 산출되고(S907), 제2헤더의 위치에 있는 표적 데이터(제2헤더인 것으로 예측되는 데이터)가 해석된다(S908). 해석된 표적 데이터의 내용이, 제1헤더의 내용과 비교되어서, 일치하는가 아닌가의 판단이 실행된다(S909). 동일하면, 표적 데이터의 내용이, 정규의 제2헤더인 것으로 판단되어서, 오디오 재생이 실행된다(S910). 제2헤더의 내용이 1 개소라도, 제1헤더의 내용과 상이하면, 표적 데이터의 내용은, 정규의 제2헤더가 아닌, 즉, 제2헤더의 위치가 산출한 위치로부터 편이된 위치에 있는 것으로 판단되어서, 제1실시형태와 마찬가지로, 제1헤더에 후속하는 오디오 부호화 신호에 대하여 뮤팅 처리를 실행한다(S911). 또한, 상기 어드레스 기억 수단(808)에 저장되어 있는 어드레스 A에, 다음의 전용 헤더(405)의 선두가 위치하도록, 데이터 판독 포인터를 이동하고(S912), 디코딩 처리를 계속한다. 즉, 어드레스 A를 어드레스 기억 수단(808)으로부터 판독하고, 다음 헤더 및 프레임 선두 어드레스에 제1헤더 해석 수단(105) 및 복호 수단(104)의 판독 포인터를 각각 이동시킨다 (S912). 이 데이터 판독 포인터의 이동에 의해서, 다음의 전용 헤더(405)를, 상기한 현재의 전용 헤더(404)로 하고, 그 다음의 전용 헤더를 다음의 전용 헤더로서 처리한다.
그 후, 디코딩 전의 버퍼 메모리(103)에 소정량(제1의 소정의 길이 이상)의 데이터가 저장되어 있는가 아닌가가 판단되어서(S913), 저장되어 있으면 단계 S906에 복귀하고, 저장되어 있지 않으면 단계 S901에 복귀한다.
단계 S909에서의 판단은, 해석한 표적 데이터의 내용과, 해석된 제1헤더의 내용을 비교하여, 일치하는가 아닌가의 판단을 실행하였지만, 해석한 표적 데이터의 내용과 미리 저장된 표 1의 내용을 비교하도록 해도 좋다.
이상으로부터 명백한 바와 같이, 스트림 해석 수단(102)은, 검출한 헤더 신호로부터 불연속 명시 패킷까지를 카운트하는 카운터를 구비하고, 또한 카운트한 점에서의 어드레스 A를 계산하여 저장하는 어드레스 기억 수단(808)이 설치되어 있고, 상기 제어 수단(107)은, 계산한 어드레스 A에, 다음의 전용 헤더가 위치하도록 판독 포인터를 이동시킨다.
또한, 도 9A에서는 흐름을 보기 쉽게 하기 위하여, 도 2A를 이용하여 설명한 PES 페이로드 길이가 정규인가 아닌가의 판정(S203)을 생략하고 있지만, 스트림 해석(S902)후에 마찬가지의 판정을 실행해도 좋은 것은 말할 필요도 없다.
이상으로부터, 본 실시형태에서는, 편집 등에 의해서 발생한 불연속점 후의 음성의 복호 및 출력이 가능하게 된다.
또한, 이상의 실시형태는, 오디오의 재생장치 및 그 처리를 설명하는 단계로 서 설명했지만, 이것들은 컴퓨터의 프로그램의 일부 또는 다른 장치의 일부의 기능이라도 좋은 것은 설명할 필요도 없다.
또한, 컴퓨터의 프로그램에 의해서 실현된 본 발명을 자기 디스크나 CD-ROM 등의 기록 매체에 저장함으로써, 컴퓨터 시스템으로써 용이하게 실시할 수 있게 된다.
본 발명은, 재생장치, 재생방법에 이용 가능하다.
Claims (18)
1개의 프레임에 오디오 부호화 신호와, 상기 오디오 부호화 신호의 속성 정보로 구성되는 전용 헤더를 포함하지만, 동기어를 포함하지 않는 하위 계층의 제2스트림이, 검출 가능한 헤더 신호를 포함하는 상위 계층의 제1스트림에 포함되는 데이터를 받아서, 상기 오디오 부호화 신호를 복호하여 음성을 출력하는 재생장치로서,
상기 제1스트림을 해석하여, 상기 헤더 신호를 검출하는 동시에, 검출한 헤더 신호를 기준으로, 상기 제2스트림을 해석하여 상기 오디오 부호화 신호와 상기 전용 헤더의 위치 정보를 출력하는 스트림 해석 수단과,
상기 스트림 해석 수단으로부터 출력되는 상기 오디오 부호화 신호와 상기 전용 헤더를 일시 저장하는 디코딩 전의 버퍼 메모리와,
상기 디코딩 전의 버퍼 메모리로부터 입력되는 상기 오디오 부호화 신호를 복호하여 음성을 출력하는 복호 수단과,
제1프레임의 전용 헤더에 포함되는 속성 정보를 해석하여, 전용 헤더에 후속하는 상기 오디오 부호화 신호의 데이터 길이를 나타내는 데이터 길이 정보를 검출하는 제1헤더 해석 수단과,
제1프레임의 전용 헤더의 위치 정보에, 검출된 데이터 길이를 부가하여 취득한 위치의 다음에 있는 소정량의 표적 데이터를 해석하고, 해석한 표적 데이터가, 제2프레임의 전용 헤더에 포함되는 속성 정보인가 아닌가를 판단하는 제2헤더 해석 수단과,
해석한 표적 데이터가, 제2프레임의 전용 헤더에 포함되는 속성 정보가 아닌 것으로 판단한 경우는, 최소한 제1프레임의 오디오 부호화 신호에 대하여 상기 복호 수단으로부터의 음성 출력을 정지하는 제어 수단을 구비한 것을 특징으로 하는 재생장치.
제1항에 있어서, 상기 제2헤더 해석 수단은, 상기 표적 데이터의 최소한 일부가, 상기 제1헤더 해석 수단에 의해서 해석된 속성 정보의 최소한 일부와 일치하는가 아닌가를 판단하는 것을 특징으로 하는 재생장치.
제1항에 있어서, 상기 제2헤더 해석 수단은, 상기 표적 데이터의 최소한 일부가, 미리 저장된 속성 정보 군(群)의 최소한 어느 일부와 일치하는가 아닌가를 판단하는 것을 특징으로 하는 재생장치.
제1항에 있어서, 상기 속성 정보는, 상기 오디오 부호화 신호의 샘플링 주파수, 채널 정보, 샘플 비트 길이, 오디오 부호화 신호의 데이터 길이의 최소한 하나인 것을 특징으로 하는 재생장치.
제1항에 있어서, 상기 스트림 해석 수단은, 상기 헤더 신호에 포함되는 상기 프레임의 길이를 나타내는 프레임 길이 데이터를 검출하고, 상기 헤더 신호에 후속 하는 1 프레임의 데이터가, 검출한 프레임 길이 데이터와 동등하지 않은 경우는, 상기 프레임을 파기하고, 다음의 프레임의 해석을 실행하는 것을 특징으로 하는 재생장치.
제1항에 있어서, 상기 제1스트림은 복수의 패킷으로 구성되고, 상기 스트림 해석 수단은, 상기 헤더 신호에 포함되는 상기 패킷의 길이를 나타내는 패킷 길이 데이터를 검출하고, 검출한 1 패킷의 길이가, 검출한 패킷 길이 데이터와 동등하지 않은 경우는, 상기 패킷을 파기하고, 다음의 패킷의 해석을 실행하는 것을 특징으로 하는 재생장치.
제6항에 있어서, 상기 제1스트림에 불연속이 발생한 개소에, 불연속점 명시 패킷이 삽입되는 동시에, 상기 스트림 해석 수단은, 불연속점 명시 패킷을 검출하고, 상기 디코딩 전의 버퍼에 출력한 불연속점 명시 패킷 전의 데이터량이, 미리 정의된 소정의 데이터량 또는 그 정수배 이하인 경우에는, 상기 디코딩 전의 버퍼에 대하여 부족한 만큼의 보완 데이터를 출력하는 것을 특징으로 하는 오디오 재생장치.
제1항에 있어서, 상기 제1스트림에 불연속이 발생한 개소에, 불연속점 명시 패킷이 삽입되는 동시에, 상기 스트림 해석 수단은, 검출한 헤더 신호로부터 불연속 명시 패킷까지를 카운트하는 카운터를 구비하고, 또한 카운트한 점에서의 어드 레스를 계산하여 저장하는 어드레스 기억 수단이 설치되고, 상기 제어 수단은, 계산한 어드레스에, 다음의 전용 헤더가 위치하도록 판독 포인터를 이동시키는 것을 특징으로 하는 재생장치.
제1항에 있어서, 상기 디코딩 전의 버퍼 메모리와 복호 수단의 사이에, 지연 수단을 설치한 것을 특징으로 하는 재생장치.
1개의 프레임에 오디오 부호화 신호와, 상기 오디오 부호화 신호의 속성 정보로 구성되는 전용 헤더를 포함하지만, 동기어를 포함하지 않는 하위 계층의 제2스트림이, 검출 가능한 헤더 신호를 포함하는 상위 계층의 제1스트림에 포함되는 데이터를 받아서, 상기 오디오 부호화 신호를 복호하여 음성을 출력하는 재생방법으로서,
상기 제1스트림을 해석하여, 상기 헤더 신호를 검출하는 동시에, 검출한 헤더 신호를 기준으로, 상기 제2스트림을 해석하여 상기 오디오 부호화 신호와 상기 전용 헤더의 위치 정보를 출력하는 스트림 해석 단계와,
상기 스트림 해석 단계로부터 출력되는 상기 오디오 부호화 신호와 상기 전용 헤더를 일시 저장하는 단계와,
상기 저장된 오디오 부호화 신호를 복호하여 음성을 출력하는 복호 단계와,
제1프레임의 전용 헤더에 포함되는 속성 정보를 해석하여, 전용 헤더에 후속하는 상기 오디오 부호화 신호의 데이터 길이를 나타내는 데이터 길이 정보를 검출 하는 제1헤더 해석 단계와,
제1프레임의 전용 헤더의 위치 정보에, 검출된 데이터 길이를 부가하여 취득한 위치의 다음에 있는 소정량의 표적 데이터를 해석하고, 해석한 표적 데이터가, 제2프레임의 전용 헤더에 포함되는 속성 정보인가 아닌가를 판단하는 제2헤더 해석 단계와,
해석한 표적 데이터가, 제2프레임의 전용 헤더에 포함되는 속성 정보가 아닌 것으로 판단한 경우는, 최소한 제1프레임의 오디오 부호화 신호에 대하여 상기 복호 단계로부터의 음성 출력을 정지하는 제어 단계를 구비한 것을 특징으로 하는 재생방법.
제10항에 있어서, 상기 제2헤더 해석 단계는, 상기 표적 데이터의 최소한 일부가, 상기 제1헤더 해석 수단에 의해서 해석된 속성 정보의 최소한 일부와 일치하는가 아닌가를 판단하는 것을 특징으로 하는 재생방법.
제10항에 있어서, 상기 제2헤더 해석 단계는, 상기 표적 데이터의 최소한 일부가, 미리 저장된 속성 정보 군의 최소한 어느 일부와 일치하는가 아닌가를 판단하는 것을 특징으로 하는 재생방법.
제10항에 있어서, 상기 속성 정보는, 상기 오디오 부호화 신호의 샘플링 주파수, 채널 정보, 샘플 비트 길이, 오디오 부호화 신호의 데이터 길이의 최소한 하 나인 것을 특징으로 하는 재생방법.
제10항에 있어서, 상기 스트림 해석 단계는, 상기 헤더 신호에 포함되는 상기 프레임의 길이를 나타내는 프레임 길이 데이터를 검출하고, 상기 헤더 신호에 후속하는 1 프레임의 데이터가, 검출한 프레임 길이 데이터와 동등하지 않은 경우는, 상기 프레임을 파기하고, 다음의 프레임의 해석을 실행하는 것을 특징으로 하는 재생방법.
제10항에 있어서, 상기 제1스트림은, 복수의 패킷으로 구성되고, 상기 스트림 해석 단계는, 상기 헤더 신호에 포함되는 상기 패킷의 길이를 나타내는 패킷 길이 데이터를 검출하고, 검출한 1 패킷의 길이가, 검출한 패킷 길이 데이터와 동등하지 않은 경우는, 상기 패킷을 파기하고, 다음의 패킷의 해석을 실행하는 것을 특징으로 하는 재생방법.
제15항에 있어서, 상기 제1스트림에 불연속이 발생한 개소에, 불연속점 명시 패킷이 삽입되는 동시에, 상기 스트림 해석 단계는, 불연속점 명시 패킷을 검출하고, 상기 저장한 불연속점 명시 패킷 전의 데이터량이, 미리 정의된 소정의 데이터량 또는 그 정수배 이하인 경우에는, 상기 디코딩 전의 버퍼에 대하여 부족한 만큼의 보완 데이터를 출력하는 것을 특징으로 하는 오디오 재생방법.
제10항에 있어서, 상기 제1스트림에 불연속이 발생한 개소에, 불연속점 명시 패킷이 삽입되는 동시에, 상기 스트림 해석 단계는, 검출한 헤더 신호로부터 불연속 명시 패킷까지를 카운트하고, 또한 카운트한 점에서의 어드레스를 계산하여 저장하는 어드레스 기억 단계가 설치되고, 상기 제어 단계는, 계산한 어드레스에, 다음의 전용 헤더가 위치하도록 판독 포인터를 이동시키는 것을 특징으로 하는 재생방법.
제10항에 있어서, 상기 저장하는 단계와 복호 단계와의 사이에, 오디오 부호화 신호를 지연시키는 지연 단계를 설치한 것을 특징으로 하는 재생방법.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003052837 | 2003-02-28 | ||
JPJP-P-2003-00052837 | 2003-02-28 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20060022637A true KR20060022637A (ko) | 2006-03-10 |
Family
ID=32923416
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020057014726A KR20060022637A (ko) | 2003-02-28 | 2004-02-26 | 재생장치 및 재생방법 |
Country Status (5)
Country | Link |
---|---|
US (2) | US7653538B2 (ko) |
JP (1) | JP4354455B2 (ko) |
KR (1) | KR20060022637A (ko) |
CN (1) | CN100583239C (ko) |
WO (1) | WO2004077406A1 (ko) |
Families Citing this family (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005084459A (ja) * | 2003-09-10 | 2005-03-31 | Alpine Electronics Inc | オーディオ装置およびオーディオ装置における再生方法 |
TWI275273B (en) * | 2004-03-03 | 2007-03-01 | Mediatek Inc | Method and apparatus for extracting payload from a packetized elementary stream packet |
EP1705842B1 (en) * | 2005-03-24 | 2015-10-21 | Fujitsu Mobile Communications Limited | Apparatus for receiving packet stream |
US7818442B2 (en) * | 2005-09-06 | 2010-10-19 | Viewcast.Com, Inc. | Streaming media encoder with front panel control interface |
JP4635801B2 (ja) * | 2005-09-26 | 2011-02-23 | 日本電気株式会社 | 情報処理装置及び情報処理方法 |
US7747798B2 (en) * | 2006-01-31 | 2010-06-29 | Viewcast.Com, Inc. | Portable media encoder |
US20070189411A1 (en) * | 2006-02-14 | 2007-08-16 | Viewcast.Com, Inc. | Audio encoding and transmission method |
US8085718B2 (en) * | 2006-06-29 | 2011-12-27 | St-Ericsson Sa | Partial radio block detection |
TW200820780A (en) * | 2006-10-18 | 2008-05-01 | Realtek Semiconductor Corp | Method of embedding voice data into the transmission data |
EP2134013A4 (en) * | 2007-03-26 | 2011-09-07 | Panasonic Corp | DIGITAL BROADCAST TRANSMITTING APPARATUS, DIGITAL BROADCAST RECEIVING APPARATUS, AND DIGITAL BROADCASTING TRANSMITTING / RECEIVING SYSTEM |
US7778839B2 (en) * | 2007-04-27 | 2010-08-17 | Sony Ericsson Mobile Communications Ab | Method and apparatus for processing encoded audio data |
JP2009005150A (ja) * | 2007-06-22 | 2009-01-08 | Panasonic Corp | Avビットストリーム再生装置 |
JP2009047914A (ja) * | 2007-08-20 | 2009-03-05 | Nec Corp | 音声復号化装置、音声復号化方法、音声復号化プログラムおよびプログラム記録媒体 |
WO2009038070A1 (ja) * | 2007-09-18 | 2009-03-26 | Kowa Company, Ltd. | シリアルデータ通信システム、及びシリアルデータ通信方法 |
JP2009157272A (ja) * | 2007-12-27 | 2009-07-16 | Roland Corp | 音声再生装置 |
JP2009277277A (ja) * | 2008-05-13 | 2009-11-26 | Funai Electric Co Ltd | 音声処理装置 |
CN101964188B (zh) * | 2010-04-09 | 2012-09-05 | 华为技术有限公司 | 语音信号编码、解码方法、装置及编解码系统 |
CN102244825A (zh) * | 2011-06-10 | 2011-11-16 | 中兴通讯股份有限公司 | 一种多媒体流的播放方法及装置 |
TR201802631T4 (tr) * | 2013-01-21 | 2018-03-21 | Dolby Laboratories Licensing Corp | Program Ses Şiddeti ve Sınır Meta Verilere Sahip Sesli Enkoder ve Dekoder |
US9351157B2 (en) * | 2013-10-17 | 2016-05-24 | Motorola Solutions, Inc. | Methods, systems, and devices to reduce audio truncation during transcoding |
JP2015119275A (ja) * | 2013-12-17 | 2015-06-25 | ソニー株式会社 | 通信装置、パケット監視方法及びコンピュータプログラム |
WO2016052191A1 (ja) * | 2014-09-30 | 2016-04-07 | ソニー株式会社 | 送信装置、送信方法、受信装置および受信方法 |
US10332388B1 (en) * | 2014-11-14 | 2019-06-25 | Amazon Technologies, Inc. | System for providing acoustic signals |
US10176815B1 (en) * | 2014-11-14 | 2019-01-08 | Amazon Technologies, Inc. | System for acoustic communication |
US11223857B2 (en) | 2015-06-02 | 2022-01-11 | Sony Corporation | Transmission device, transmission method, media processing device, media processing method, and reception device |
Family Cites Families (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5726989A (en) * | 1995-11-06 | 1998-03-10 | Stellar One Corporation | Method for ensuring synchronization of MPEG-1 data carried in an MPEG-2 transport stream |
US5627936A (en) * | 1995-12-21 | 1997-05-06 | Intel Corporation | Apparatus and method for temporal indexing of multiple audio, video and data streams |
SG71709A1 (en) * | 1996-05-08 | 2000-04-18 | Matsushita Electric Ind Co Ltd | Multiplex transmission method and system and audio jitter absorbing method used therein |
JP3484908B2 (ja) | 1997-01-27 | 2004-01-06 | 三菱電機株式会社 | ビットストリーム再生装置 |
US6026506A (en) * | 1997-09-26 | 2000-02-15 | International Business Machines Corporation | Concealing errors in transport stream data |
US6788710B1 (en) * | 1998-03-19 | 2004-09-07 | Thomson Licensing S.A. | Auxiliary data insertion in a transport datastream |
JP2000031942A (ja) | 1998-07-14 | 2000-01-28 | Mitsubishi Electric Corp | 音響再生装置及び音響再生方法 |
JP3848805B2 (ja) * | 1998-11-04 | 2006-11-22 | 株式会社日立製作所 | 受信装置 |
US6816491B1 (en) * | 1998-11-04 | 2004-11-09 | Hitachi, Ltd. | Multiplexed audio data decoding apparatus and receiver apparatus |
JP3318535B2 (ja) * | 1998-11-26 | 2002-08-26 | パイオニア株式会社 | 情報記録媒体、情報記録装置及び情報再生装置 |
JP2000259195A (ja) * | 1999-01-08 | 2000-09-22 | Matsushita Electric Ind Co Ltd | デコード回路及びそれを用いた再生装置 |
US6631352B1 (en) * | 1999-01-08 | 2003-10-07 | Matushita Electric Industrial Co. Ltd. | Decoding circuit and reproduction apparatus which mutes audio after header parameter changes |
JP4136151B2 (ja) * | 1999-01-22 | 2008-08-20 | キヤノン株式会社 | 符号化装置、方法及びコンピュータ読み取り可能な記憶媒体 |
JP4269409B2 (ja) * | 1999-05-19 | 2009-05-27 | ソニー株式会社 | 受信装置および方法 |
EP1087557A3 (en) * | 1999-09-22 | 2005-01-19 | Matsushita Electric Industrial Co., Ltd. | Apparatus for transmitting digital audio data and receiving apparatus for receiving the digital audio data |
US7236836B1 (en) * | 1999-09-29 | 2007-06-26 | Victor Company Of Japan, Ltd. | System for signal processing and signal transmission |
US6804257B1 (en) * | 1999-11-25 | 2004-10-12 | International Business Machines Corporation | System and method for framing and protecting variable-lenght packet streams |
GB9930787D0 (en) * | 1999-12-30 | 2000-02-16 | Koninkl Philips Electronics Nv | Method and apparatus for convrerting data streams |
US6804266B1 (en) * | 2000-01-24 | 2004-10-12 | Ati Technologies, Inc. | Method and apparatus for handling private data from transport stream packets |
JP3957251B2 (ja) * | 2000-03-02 | 2007-08-15 | パイオニア株式会社 | オーディオ情報再生システム、オーディオ情報再生装置及びオーディオ情報再生方法 |
JP2001344905A (ja) * | 2000-05-26 | 2001-12-14 | Fujitsu Ltd | データ再生装置、その方法及び記録媒体 |
US6931371B2 (en) * | 2000-08-25 | 2005-08-16 | Matsushita Electric Industrial Co., Ltd. | Digital interface device |
US6804655B2 (en) * | 2001-02-06 | 2004-10-12 | Cirrus Logic, Inc. | Systems and methods for transmitting bursty-asnychronous data over a synchronous link |
US7161939B2 (en) * | 2001-06-29 | 2007-01-09 | Ip Unity | Method and system for switching among independent packetized audio streams |
DE60131551T2 (de) * | 2001-12-12 | 2008-10-23 | Alcatel Lucent | Telekommunikationsnetzwerk und entsprechenden Paketkopf |
US7191375B2 (en) * | 2001-12-28 | 2007-03-13 | Intel Corporation | Method and apparatus for signaling an error condition to an agent not expecting a completion |
US7596488B2 (en) * | 2003-09-15 | 2009-09-29 | Microsoft Corporation | System and method for real-time jitter control and packet-loss concealment in an audio signal |
-
2004
- 2004-02-26 JP JP2005502921A patent/JP4354455B2/ja not_active Expired - Fee Related
- 2004-02-26 CN CN200480005519A patent/CN100583239C/zh not_active Expired - Fee Related
- 2004-02-26 KR KR1020057014726A patent/KR20060022637A/ko not_active Application Discontinuation
- 2004-02-26 US US10/544,335 patent/US7653538B2/en not_active Expired - Fee Related
- 2004-02-26 WO PCT/JP2004/002261 patent/WO2004077406A1/ja active Application Filing
-
2009
- 2009-12-08 US US12/633,047 patent/US20100088103A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
US7653538B2 (en) | 2010-01-26 |
JPWO2004077406A1 (ja) | 2006-06-08 |
US20060080094A1 (en) | 2006-04-13 |
CN100583239C (zh) | 2010-01-20 |
WO2004077406A1 (ja) | 2004-09-10 |
US20100088103A1 (en) | 2010-04-08 |
CN1757059A (zh) | 2006-04-05 |
JP4354455B2 (ja) | 2009-10-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4354455B2 (ja) | 再生装置および再生方法 | |
US7274862B2 (en) | Information processing apparatus | |
US6680753B2 (en) | Method and apparatus for skipping and repeating audio frames | |
EP0944086A2 (en) | Data recording method and data recording system | |
KR100904626B1 (ko) | Mp3용 트릭 플레이 | |
JP2003244589A (ja) | 時系列データ記録装置及び時系列データ記録方法 | |
JP3763153B2 (ja) | データ処理装置及びデータ処理方法 | |
KR100490403B1 (ko) | 오디오 스트림의 버퍼링 제어 방법 및 그 장치 | |
US20090207775A1 (en) | Signal processing apparatus | |
JP3558983B2 (ja) | デジタル放送の記録再生装置 | |
US6931371B2 (en) | Digital interface device | |
US7149159B2 (en) | Method and apparatus for editing data streams | |
US20100286989A1 (en) | Recording/reproduction device | |
JP2005151463A (ja) | ストリームデータ受信装置およびストリームデータ受信方法 | |
EP1594131A2 (en) | Reproduction apparatus and reproduction method | |
KR0181082B1 (ko) | 엠펙 시스템의 피티에스 부호화장치 | |
US20020141596A1 (en) | Method of and apparatus for decoding audio data | |
JP3939136B2 (ja) | 音声再生回路、デコード回路、音声再生装置及び音声再生方法 | |
KR0177314B1 (ko) | 엠펙시스템에서의 전송패킷 보호장치 | |
JP2001339688A (ja) | トランスポートストリーム再生装置 | |
KR20000014812A (ko) | Ac-3 비트 스트림에서 보조 데이터 활용방법 | |
JPH09294077A (ja) | 圧縮音声データ処理方法及びデータストリーム再生方法とそれらの装置 | |
JP3165661B2 (ja) | 音声同期再生装置 | |
KR0181083B1 (ko) | 엠펙 시스템의 피시알 부호화장치 | |
JP2023179125A (ja) | デジタル音声信号同期装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |