KR20120069906A - 묵음 구간 정보를 사용한 오디오 신호의 부호화/복호화 장치 및 방법 - Google Patents

묵음 구간 정보를 사용한 오디오 신호의 부호화/복호화 장치 및 방법 Download PDF

Info

Publication number
KR20120069906A
KR20120069906A KR1020100131239A KR20100131239A KR20120069906A KR 20120069906 A KR20120069906 A KR 20120069906A KR 1020100131239 A KR1020100131239 A KR 1020100131239A KR 20100131239 A KR20100131239 A KR 20100131239A KR 20120069906 A KR20120069906 A KR 20120069906A
Authority
KR
South Korea
Prior art keywords
silent
frame
audio
section
audio signal
Prior art date
Application number
KR1020100131239A
Other languages
English (en)
Inventor
이용주
이태진
유재현
서정일
백승권
장인선
김민제
장대영
강경옥
김진웅
안치득
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020100131239A priority Critical patent/KR20120069906A/ko
Publication of KR20120069906A publication Critical patent/KR20120069906A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Telephonic Communication Services (AREA)

Abstract

묵음 구간을 사용하여 오디오 신호를 부호화/복호화하는 방법 및 장치가 개시된다. 부호화 장치는 오디오 신호에서 묵음 구간을 판단하는 묵음 구간 판단부; 상기 묵음 구간이 판단되고 남은 신호를 부호화하여 비 묵음 프레임을 생성하는 오디오 부호화부; 상기 묵음 구간을 기초로 플래그 형식의 묵음 프레임을 생성하는 묵음 프레임 생성부; 및 상기 비 묵음 프레임과 상기 묵음 프레임을 결합하여 오디오 프레임을 생성하는 오디오 프레임 생성부를 포함할 수 있다.

Description

묵음 구간 정보를 사용한 오디오 신호의 부호화/복호화 장치 및 방법{APPARATUS AND METHOD FOR ENCODING/DECODING AUDIO SIGNAL USING MUTE INTERVAL INFORMATION}
본 발명은 오디오 부호화/복호화 장치 및 방법에 관한 것으로, 보다 상세하게는 오디오 신호에서 묵음 구간을 적은 용량으로 부호화하는 장치 및 방법에 관한 것이다.
오디오 신호의 저장 및 전송 효율을 높이기 위하여, 다양한 오디오 압축 부호화 기술들이 개발되었다.
오디오 부호화 기술은 오디오 신호를 프레임 단위로 입력 받아 부호화 하므로 각각의 프레임 별로 비트가 할당된다. 이때, 재생할 소리가 없는 묵음 구간을 부호화 하는 경우에도 해당 구간을 부호화한 프레임에 일정 량의 비트가 할당된다.
즉, 종래의 오디오 부호화 기술은 재생할 소리가 없는 묵음 구간에도 다른 구간처럼 비트를 할당하고 있으므로 오디오 신호를 부호화한 오디오 프레임의 크기가 일정 크기 이상이 되는 한계가 있었다.
따라서, 묵음 구간에 사용되는 비트의 수를 감소 시키는 방법이 요구되고 있다.
본 발명은 묵음 구간의 저 용량 데이터로 부호화 함으로써 부호화된 전체 오디오 프레임의 크기를 감소 시킬 수 있는 장치 및 방법을 제공한다.
본 발명의 일실시예에 따른 부호화 장치는 오디오 신호에서 묵음 구간을 판단하는 묵음 구간 판단부; 상기 묵음 구간이 판단되고 남은 신호를 부호화하여 비 묵음 프레임을 생성하는 오디오 부호화부; 상기 묵음 구간을 기초로 플래그 형식의 묵음 프레임을 생성하는 묵음 프레임 생성부; 및 상기 비 묵음 프레임과 상기 묵음 프레임을 결합하여 오디오 프레임을 생성하는 오디오 프레임 생성부를 포함할 수 있다.
본 발명의 일실시예에 따른 복호화 장치는 수신한 오디오 프레임이 묵음 프레임인지 여부를 판별하는 묵음 프레임 판별부; 상기 오디오 프레임이 묵음 프레임이 아닌 경우, 상기 오디오 프레임을 복호화하여 비 묵음 구간의 오디오 신호를 복원하는 오디오 복호화부; 상기 묵음 프레임을 기초로 묵음 구간의 오디오 신호를 생성하는 묵음 구간 신호 생성부; 및 상기 비 묵음 구간의 오디오 신호와 상기 묵음 구간의 오디오 신호를 결합하여 부호화 되기 전의 오디오 신호를 복원하는 복원부를 포함할 수 있다.
본 발명의 일실시예에 따른 부호화 방법은 오디오 신호에서 묵음 구간을 판단하는 단계; 상기 묵음 구간이 판단되고 남은 신호를 부호화하여 비 묵음 프레임을 생성하는 단계; 상기 묵음 구간을 기초로 플래그 형식의 묵음 프레임을 생성하는 단계; 및 상기 비 묵음 프레임과 상기 묵음 프레임을 결합하여 오디오 프레임을 생성하는 단계를 포함할 수 있다.
본 발명의 일실시예에 따른 복호화 방법은 수신한 오디오 프레임이 묵음 프레임인지 여부를 판별하는 단계; 상기 오디오 프레임이 묵음 프레임이 아닌 경우, 상기 오디오 프레임을 복호화하여 비 묵음 구간의 오디오 신호를 복원하는 단계; 상기 묵음 프레임을 기초로 묵음 구간의 오디오 신호를 생성하는 단계; 및 상기 비 묵음 구간의 오디오 신호와 상기 묵음 구간의 오디오 신호를 결합하여 부호화 되기 전의 오디오 신호를 복원하는 단계를 포함할 수 있다.
본 발명의 일실시예에 의하면, 부호화 과정에서 묵음 구간을 저 용량의 플래그 형식으로 변환함으로써 부호화된 오디오 프레임의 크기를 감소 시킬 수 있다.
또한, 본 발명의 일실시예에 의하면, 복호화 과정에서는 플래그 형식의 오디오 프레임에 해당하는 구간을 묵음 구간으로 처리함으로써 저 용량 오디오 프레임을 원본 오디오 신호를 복원 할 수 있다.
도 1은 본 발명의 일실시예에 따른 부호화 장치를 도시한 블록 다이어그램이다.
도 2는 본 발명의 일실시예에 따른 부호화 장치에 따라 생성된 오디오 프레임의 일례이다.
도 3은 본 발명의 일실시예에 따른 부호화 방법을 도시한 플로우차트이다.
도 4는 본 발명의 일실시예에 따른 복호화 장치를 도시한 블록 다이어그램이다.
도 5는 본 발명의 일실시예에 따른 복호화 장치가 오디오 신호를 복원하는 과정의 일례이다.
도 6은 본 발명의 일실시예에 따른 복호화 방법을 도시한 플로우차트이다.
이하, 본 발명의 실시예를 첨부된 도면을 참조하여 상세하게 설명한다. 본 발명의 일실시예에 따른 부호화 및 복호화 방법은 각각 부호화 장치와 복호화 장치에 의해 수행될 수 있다.
도 1은 본 발명의 일실시예에 따른 부호화 장치를 도시한 블록 다이어그램이다.
도 1을 참고하면, 본 발명의 일실시예에 따른 부호화 장치(100)는 묵음 구간 판단부(110), 오디오 부호화부(120), 묵음 프레임 생성부(130), 및 오디오 프레임 생성부(140)를 포함할 수 있다.
묵음 구간 판단부(110)는 사용자로부터 입력 받는 오디오 신호가 묵음 구간인지 여부를 판단할 수 있다. 구체적으로 묵음 구간 판단부(110)는 실시간으로 사용자로부터 입력 받는 오디오 신호의 구간이 묵음 구간인지 비 묵음 구간인지를 판단할 수 있다.
일례로, 묵음 구간 판단부(110)는 오디오 신호에서 소리가 포함되지 않은 구간을 검색하고, 검색된 구간 중에서 기준 시간보다 긴 구간을 묵음 구간으로 판단할 수 있다. 다른 일례로, 묵음 구간 판단부(110)는 사용자나 다른 장치로부터 오디오 신호의 묵음 구간의 위치 및 길이에 대한 정보를 수신하고, 수신한 묵음 구간의 위치 및 길이에 기초하여 묵음 구간을 판단할 수도 있다.
오디오 부호화부(120)는 오디오 신호에서 묵음 구간이 아닌 비 묵음 구간을 부호화하여 비 묵음 프레임을 생성할 수 있다. 구체적으로, 오디오 부호화부(120)는 mp3, AAC(advanced audio coding), BSAC(Bit Sliced Arithmetic Coding)와 같은 오디오 압축 부호화 방법을 사용하여 비 묵음 구간을 부호화할 수 있다. 이때, 비 묵음 프레임은 소리가 포함된 오디오 프레임이다. 또한, 비 묵음 프레임에는 소리가 포함되지 않은 구간 중 기준 시간보다 짧은 구간이 포함될 수도 있다.
묵음 프레임 생성부(130)는 묵음 구간 판단부(110)가 판단한 묵음 구간을 기초로 플래그 형식의 묵음 프레임을 생성할 수 있다. 구체적으로 묵음 프레임 생성부(130)는 묵음 구간을 부호화한 프레임 대신 묵음 구간임을 알리는 플래그로 구성된 묵음 프레임을 생성할 수 있다.
오디오 프레임 생성부(140)는 오디오 부호화부(120)에서 생성된 비 묵음 프레임과 묵음 프레임 생성부(130)에서 생성된 묵음 프레임을 결합하여 오디오 프레임을 생성할 수 있다. 이때, 오디오 프레임 생성부(140)는 생성한 오디오 프레임을 저장하고, 사용자의 요청에 따라 부호화 장치로 전송할 수 있다. 이때, 오디오 프레임 생성부(140)는 전송 매체에 따라 오디오 프레임을 패킷화하여 전송할 수도 있다. 일례로, 오디오 프레임 생성부(140)는 오디오 프레임의 헤더 또는 특정 위치에 오디오 프레임 중 어떤 프레임이 묵음 구간인지 여부를 플래그 형식으로 저장할 수 있다.
도 2는 본 발명의 일실시예에 따른 부호화 장치에 따라 생성된 오디오 프레임의 일례이다.
도 2에 도시된 바와 같이 묵음 구간(211)과 비 묵음 구간(212)가 혼합된 오디오 신호(210)를 수신한 경우, 종래의 부호화 장치가 부호화한 오디오 프레임(220)은 재생할 소리가 없는 묵음 구간(211)을 부호화한 프레임(221)가 재생할 소리가 포함된 다른 프레임들과 동일하다. 따라서, 프레임(221)은 소리가 없음이라는 정보만 포함한 것에 비하여 데이터 크기가 크다고 할 수 있다.
반면, 본 발명의 일실시예에 따른 부호화 장치(100)가 부호화한 오디오 프레임(230)는 도 2에 도시된 바와 같이 묵음 구간(211)을 부호화한 묵음 프레임(222)의 크기가 다른 프레임보다 적다. 일례로, 부호화 장치(100)가 생성하는 오디오 프레임(230)이 평균 64kbps 로 전송되고, 40frame/sec의 프레임율을 가지는 경우, 오디오 프레임 중 비 묵음 구간을 부호화한 프레임은 수학식 1로 계산된 바와 같이 평균 200byte가 필요하다.
Figure pat00001
반면, 플래그의 용량은 10byte 정도이므로 묵음 프레임 생성부(130)가 생성한 플래그 형식의 묵음 프레임(222)은 종래의 부호화 장치가 부호화한 묵음 구간의 프레임(221)에 비하여 1/20의 크기만을 차지하게 된다.
즉, 본 발명에 따른 부호화 장치(100)가 생성하는 오디오 프레임(230)은 묵음 구간이 길수록 종래의 부호화 장치(100)가 생성하는 오디오 프레임(220)과 비교하여 더 적은 용량으로 동일한 정보를 부호화할 수 있다.
도 3은 본 발명의 일실시예에 따른 부호화 방법을 도시한 플로우차트이다.
단계(S310)에서 묵음 구간 판단부(110)는 사용자로부터 입력 받은 오디오 신호의 각 구간이 묵음 구간인지 여부를 판단할 수 있다. 일례로, 묵음 구간 판단부(110)는 오디오 신호에서 소리가 포함되지 않은 구간을 검색하고, 검색된 구간 중에서 구간의 길이가 기준 시간보다 긴 구간을 묵음 구간으로 판단할 수 있다. 다른 일례로, 묵음 구간 판단부(110)는 사용자나 다른 장치로부터 수신한 묵음 구간의 위치 및 길이에 대한 정보에 기초하여 오디오 신호의 구간 중 어떤 구간이 묵음 구간인지를 확인할 수 있다.
단계(S320)에서 묵음 프레임 생성부(130)는 단계(S320)에서 묵음 구간으로 확인된 구간을 기초로 플래그 형식의 묵음 프레임을 생성할 수 있다. 구체적으로 묵음 프레임 생성부(130)는 묵음 구간을 부호화한 프레임 대신 묵음 구간임을 알리는 플래그로 구성된 묵음 프레임을 생성할 수 있다.
단계(S330)에서 오디오 부호화부(120)는 단계(S320)에서 묵음 구간이 아닌 것으로 판단된 구간인 비 묵음 구간들을 부호화하여 비 묵음 프레임을 생성할 수 있다. 구체적으로, 오디오 부호화부(120)는 mp3, AAC, BSAC와 같은 오디오 압축 부호화 방법을 사용하여 비 묵음 구간들을 부호화할 수 있다.
단계(S340)에서 오디오 프레임 생성부(140)는 단계(S330)에서 생성된 비 묵음 프레임과 단계(S320)에서 생성된 묵음 프레임을 결합하여 오디오 프레임을 생성할 수 있다.
도 4는 본 발명의 일실시예에 따른 복호화 장치를 도시한 블록 다이어그램이다.
도 4를 참고하면, 본 발명의 일실시예에 따른 복호화 장치(400)는 묵음 프레임 판별부(410), 오디오 복호화부(420), 묵음 구간 신호 생성부(430), 및 복원부(440)를 포함할 수 있다.
묵음 프레임 판단부(410)는 부호화 장치(100)로부터 수신한 오디오 프레임이 묵음 프레임인지 여부를 판단할 수 있다. 이때, 묵음 프레임 판단부(410)은 오디오 프레임이 묵음 프레임인 경우, 묵음 구간 신호 생성부(410)로 전송하고, 오디오 프레임이 묵음 프레임이 아닌 경우 오디오 복호화부(420)로 전송할 수 있다. 이때, 오디오 프레임은 묵음 구간을 표시하는 묵음 프레임과 소리가 있는 비 묵음 프레임으로 구성된다. 따라서, 묵음 프레임이 아닌 오디오 프레임은 비 묵음 프레임이다.
오디오 복호화부(420)는 묵음 프레임 판단부(410)가 부호화 장치(100)로부터 수신한 오디오 프레임이 비 묵음 프레임인 경우, 묵음 프레임 판단부(410)로부터 비 묵음 프레임을 수신하고 복호화하여 비 묵음 구간의 오디오 신호를 생성할 수 있다. 구체적으로 오디오 복호화부(420)는 mp3, AAC, BSAC와 같은 오디오 복호화 방법을 사용하여 수신한 비 묵음 프레임으로부터 묵음 구간이 아닌 오디오 신호를 복호화할 수 있다.
묵음 구간 신호 생성부(430)는 묵음 프레임 판단부(410)가 부호화 장치(100)로부터 수신한 오디오 프레임이 묵음 프레임인 경우, 묵음 프레임 판단부(410)로부터 수신한 묵음 프레임을 기초로 묵음 구간의 오디오 신호를 생성할 수 있다. 구체적으로 묵음 구간 생성부(430)는 소리를 재생하지 않는 오디오 신호를 재생할 수 있다.
복원부(440)는 오디오 복호화부(420)가 생성한 비 묵음 구간의 오디오 신호와 묵음 구간 신호 생성부(430)가 생성한 묵음 구간의 오디오 신호를 결합하여 오디오 신호를 복원할 수 있다. 이때, 복원부(440)는 오디오 프레임의 수신 순서에 기초하여 비 묵음 구간의 오디오 신호와 묵음 구간의 오디오 신호를 결합할 수 있다.
도 5는 본 발명의 일실시예에 따른 복호화 장치가 오디오 신호를 복원하는 과정의 일례이다.
본 발명의 일실시예에 따른 복호화 장치(400)의 묵음 프레임 판별부(410)는 도 5에 도시된 바와 같이 묵음 프레임과 비 묵음 프레임으로 구성된 오디오 프레임(510)를 수신할 수 있다.
이때, 묵음 프레임 판별부(410)는 묵음 프레임이 아닌 것으로 판별한 비 묵음 프레임(520)을 오디오 복호화부(420)로 전송하여 묵음 구간이 아닌 오디오 신호(521)를 복호화할 수 있다.
또한, 묵음 프레임 판별부(410)는 판별한 묵음 프레임(530)을 묵음 구간 신호 생성부(430)로 전송하여 묵음 구간의 오디오 신호(531)를 복호화할 수 있다. 이때, 묵음 구간의 오디오 신호(531)는 도 5에 도시된 바와 같이 소리를 재생하지 않도록 하는 오디오 신호일 수 있다.
마지막으로 복원부(440)는 오디오 복호화부(420)로부터 수신한 묵음 구간이 아닌 오디오 신호(521)와 묵음 구간 신호 생성부(430)로부터 수신한 묵음 구간의 오디오 신호(531)를 결합하여 부호화 되기 전의 오디오 신호(540)를 복원할 수 있다.
이때, 복원부(440)는 오디오 프레임(510)의 순서에 기초하여 비 묵음 구간의 오디오 신호(521)와 묵음 구간의 오디오 신호(531)를 결합할 수 있다. 일례로, 묵음 프레임 판별부(410)가 수신한 오디오 프레임(510)은 도 5에 도시된 바와 같이 비 묵음 프레임 다음에 묵음 프레임이 위치하고 있다. 따라서, 복원부(440)가 복원한 오디오 신호(540)도 비 묵음 구간의 오디오 신호(521)의 다음에 묵음 구간의 오디오 신호(531)가 위치하도록 비 묵음 구간의 오디오 신호(521)와 묵음 구간의 오디오 신호(531)를 결합할 수 있다.
도 6은 본 발명의 일실시예에 따른 복호화 방법을 도시한 플로우차트이다.
단계(S610)에서 묵음 프레임 판단부(410)는 부호화 장치(100)로부터 수신한 오디오 프레임이 묵음 프레임인지 여부를 판단할 수 있다. 이때, 묵음 프레임 판단부(410)은 오디오 프레임이 묵음 프레임인 경우, 묵음 구간 신호 생성부(410)로 전송하고, 오디오 프레임이 비 묵음 프레임인 경우 오디오 복호화부(420)로 전송할 수 있다.
단계(S620)에서 묵음 구간 신호 생성부(430)는 단계(S610)에서 수신한 묵음 프레임을 기초로 묵음 구간의 오디오 신호를 생성할 수 있다. 구체적으로 묵음 구간 생성부(430)는 소리를 재생하지 않는 오디오 신호를 재생할 수 있다.
단계(S630)에서 오디오 복호화부(420)는 단계(S610)에서 수신한 비 묵음 프레임을 복호화하여 비 묵음 구간의 오디오 신호를 생성할 수 있다. 구체적으로 오디오 복호화부(420)는 mp3, AAC, BSAC와 같은 오디오 복호화 방법을 사용하여 수신한 비 묵음 프레임으로부터 묵음 구간이 아닌 오디오 신호를 복호화할 수 있다.
단계(S640)에서 복원부(440)는 단계(S630)에서 생성된 비 묵음 구간의 오디오 신호와 단계(S620)에서 생성된 묵음 구간의 오디오 신호를 결합하여 부호화 되기 전의 오디오 신호를 복원할 수 있다. 이때, 복원부(440)는 오디오 프레임의 수신 순서에 기초하여 비 묵음 구간의 오디오 신호와 묵음 구간의 오디오 신호를 결합할 수 있다.
묵음 구간은 복호화를 하더라도 재생되는 오디오 신호가 없다. 따라서, 본 발명은 부호화 과정에서 묵음 구간을 저 용량의 플래그 형식으로 변환함으로써 부호화된 오디오 프레임의 크기를 감소 시킬 수 있다.
또한, 복호화 과정에서는 플래그 형식의 오디오 프레임에 해당하는 구간을 묵음 구간으로 처리함으로써 원본 오디오 신호를 복원 할 수 있다.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.
그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.
110: 묵음 구간 판단부
120: 오디오 부호화부
130: 묵음 프레임 생성부
410: 묵음 프레임 판별부
420: 오디오 복호화부
430: 묵음 구간 신호 생성부

Claims (12)

  1. 오디오 신호가 묵음 구간인지 여부를 판단하는 묵음 구간 판단부;
    상기 오디오 신호가 비 묵음 구간인 경우, 상기 비 묵음 구간을 부호화하여 비 묵음 프레임을 생성하는 오디오 부호화부;
    상기 오디오 신호가 묵음 구간인 경우, 상기 묵음 구간을 기초로 플래그 형식의 묵음 프레임을 생성하는 묵음 프레임 생성부; 및
    상기 비 묵음 프레임과 상기 묵음 프레임을 결합하여 오디오 프레임을 생성하는 오디오 프레임 생성부
    를 포함하는 부호화 장치.
  2. 제1항에 있어서,
    상기 묵음 구간 판단부는,
    상기 오디오 신호에서 소리가 포함되지 않은 구간을 검색하고, 검색된 구간 중에서 구간의 길이가 기준 시간보다 긴 구간을 묵음 구간으로 판단하는 것을 특징으로 하는 부호화 장치.
  3. 제2항에 있어서,
    상기 묵음 구간 판단부는,
    상기 오디오 신호의 묵음 구간의 위치 및 길이에 대한 정보를 수신하고, 수신한 묵음 구간의 위치 및 길이에 기초하여 묵음 구간을 판단하는 것을 특징으로 하는 부호화 장치.
  4. 제2항에 있어서,
    상기 오디오 부호화부는,
    오디오 압축 부호화 방법을 사용하여 상기 묵음 구간이 판단되고 남은 신호를 부호화하는 것을 특징으로 하는 부호화 장치.
  5. 수신한 오디오 프레임이 묵음 프레임인지 여부를 판별하는 묵음 프레임 판별부;
    상기 오디오 프레임이 비 묵음 프레임인 경우, 상기 오디오 프레임을 복호화하여 비 묵음 구간의 오디오 신호를 복원하는 오디오 복호화부;
    상기 오디오 프레임이 묵음 프레임인 경우, 묵음 구간의 오디오 신호를 생성하는 묵음 구간 신호 생성부; 및
    상기 비 묵음 구간의 오디오 신호와 상기 묵음 구간의 오디오 신호를 결합하여 부호화 되기 전의 오디오 신호를 복원하는 복원부
    를 포함하는 복호화 장치.
  6. 제5항에 있어서,
    상기 복원부는,
    상기 오디오 프레임의 수신 순서에 기초하여 상기 비 묵음 구간의 오디오 신호와 상기 묵음 구간의 오디오 신호를 결합하는 것을 특징으로 하는 복호화 장치.
  7. 오디오 신호가 묵음 구간인지 여부를 판단하는 단계;
    상기 오디오 신호가 비 묵음 구간인 경우, 상기 비 묵음 구간을 부호화하여 비 묵음 프레임을 생성하는 단계;
    상기 오디오 신호가 묵음 구간인 경우, 상기 묵음 구간을 기초로 플래그 형식의 묵음 프레임을 생성하는 단계; 및
    상기 비 묵음 프레임과 상기 묵음 프레임을 결합하여 오디오 프레임을 생성하는 단계
    를 포함하는 부호화 방법.
  8. 제7항에 있어서,
    상기 묵음 구간을 판단하는 단계는,
    상기 오디오 신호에서 소리가 포함되지 않은 구간을 검색하고, 검색된 구간 중에서 구간의 길이가 기준 시간보다 긴 구간을 묵음 구간으로 판단하는 것을 특징으로 하는 부호화 방법.
  9. 제8항에 있어서,
    상기 묵음 구간을 판단하는 단계는,
    상기 오디오 신호의 묵음 구간의 위치 및 길이에 대한 정보를 수신하고, 수신한 묵음 구간의 위치 및 길이에 기초하여 묵음 구간을 판단하는 것을 특징으로 하는 부호화 방법.
  10. 제8항에 있어서,
    상기 비 묵음 프레임을 생성하는 단계는,
    오디오 압축 부호화 방법을 사용하여 상기 묵음 구간이 판단되고 남은 신호를 부호화하는 것을 특징으로 하는 부호화 장치.
  11. 수신한 오디오 프레임이 묵음 프레임인지 여부를 판별하는 단계;
    상기 오디오 프레임이 비 묵음 프레임인 경우, 상기 오디오 프레임을 복호화하여 비 묵음 구간의 오디오 신호를 복원하는 단계;
    상기 오디오 프레임이 묵음 프레임인 경우, 상기 묵음 프레임을 기초로 묵음 구간의 오디오 신호를 생성하는 단계; 및
    상기 비 묵음 구간의 오디오 신호와 상기 묵음 구간의 오디오 신호를 결합하여 부호화 되기 전의 오디오 신호를 복원하는 단계
    를 포함하는 복호화 방법.
  12. 제11항에 있어서,
    상기 부호화 되기 전의 오디오 신호를 복원하는 단계는,
    상기 오디오 프레임의 수신 순서에 기초하여 상기 비 묵음 구간의 오디오 신호와 상기 묵음 구간의 오디오 신호를 결합하는 것을 특징으로 하는 복호화 방법.
KR1020100131239A 2010-12-21 2010-12-21 묵음 구간 정보를 사용한 오디오 신호의 부호화/복호화 장치 및 방법 KR20120069906A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020100131239A KR20120069906A (ko) 2010-12-21 2010-12-21 묵음 구간 정보를 사용한 오디오 신호의 부호화/복호화 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020100131239A KR20120069906A (ko) 2010-12-21 2010-12-21 묵음 구간 정보를 사용한 오디오 신호의 부호화/복호화 장치 및 방법

Publications (1)

Publication Number Publication Date
KR20120069906A true KR20120069906A (ko) 2012-06-29

Family

ID=46687883

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100131239A KR20120069906A (ko) 2010-12-21 2010-12-21 묵음 구간 정보를 사용한 오디오 신호의 부호화/복호화 장치 및 방법

Country Status (1)

Country Link
KR (1) KR20120069906A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112002338A (zh) * 2020-09-01 2020-11-27 北京百瑞互联技术有限公司 一种优化音频编码量化次数的方法及系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112002338A (zh) * 2020-09-01 2020-11-27 北京百瑞互联技术有限公司 一种优化音频编码量化次数的方法及系统

Similar Documents

Publication Publication Date Title
US8340973B2 (en) Data embedding device and data extraction device
KR101221918B1 (ko) 신호 처리 방법 및 장치
JP2019215545A (ja) 冗長フレーム情報を通信するシステムおよび方法
KR101548846B1 (ko) 워터마킹된 신호의 적응적 인코딩 및 디코딩을 위한 디바이스
US10636432B2 (en) Method for predicting high frequency band signal, encoding device, and decoding device
RU2007139918A (ru) Кодирование многоканального аудио
JP2009527790A (ja) オーディオ信号の処理方法及び装置
US20080288263A1 (en) Method and Apparatus for Encoding/Decoding
KR102480710B1 (ko) 다중 채널 오디오 신호 처리 방법, 장치 및 시스템
JP2004046179A (ja) 少計算量で高周波数成分を復元するオーディオデコーディング法及び装置
KR101590239B1 (ko) 워터마킹된 신호를 인코딩 및 디코딩하는 디바이스들
JP2012509505A (ja) 信号ソースに関連付けられた少なくとも1つのパラメータを符号化するための装置および方法
JP2013076871A (ja) 音声符号化装置及びプログラム、音声復号装置及びプログラム、並びに、音声符号化システム
JP2004184975A (ja) 少ない計算量で高周波数成分を復元するオーディオデコーディング方法及び装置
WO2023202250A1 (zh) 音频传输方法、装置、终端、存储介质及程序产品
KR20120069906A (ko) 묵음 구간 정보를 사용한 오디오 신호의 부호화/복호화 장치 및 방법
KR20080066537A (ko) 부가정보를 가지는 오디오신호의 부호화/복호화 방법 및장치
TWI330004B (en) Method and apparatus for encoding/ decoding
JP2005532585A (ja) オーディオコーディング
Lin A Synchronization Scheme for Hiding Information in Encoded Bitstream of Inactive Speech Signal.
RU2021109480A (ru) Преобразование звуковых сигналов, захваченных в разных форматах, в уменьшенное количество форматов для упрощения операций кодирования и декодирования
JP2006195066A (ja) 符号化オーディオ信号の再生装置及び再生方法
JP2005345993A (ja) 音響復号装置及び音響復号方法

Legal Events

Date Code Title Description
WITN Withdrawal due to no request for examination