KR100906766B1

KR100906766B1 - 키 재동기 구간의 음성 데이터 예측을 위한 음성 데이터송수신 장치 및 방법

Info

Publication number: KR100906766B1
Application number: KR1020070059545A
Authority: KR
Inventors: 남택준; 안병호; 류석; 이상이
Original assignee: 한국전자통신연구원
Priority date: 2007-06-18
Filing date: 2007-06-18
Publication date: 2009-07-09
Also published as: KR20080111311A; US20080312936A1; DE602008000406D1; ATE452400T1; EP2006838A1; EP2006838B1

Abstract

본 발명은 단방향 무선 통신 환경에서 암호화된 디지털 음성을 전송할 때 키 재동기 과정에서 발생하는 묵음구간에 대응하는 음성 데이터 값을 사인파를 그리는 음성의 특징을 이용하여 예측하는 장치 및 방법에 관한 것으로, 키 재동기 정보의 전송을 위해, 상기 키 재동기 정보와 함께 음성 데이터에 대한 벡터 정보를 삽입하여 키 재동기 프레임을 생성하고, 상기 생성된 키 재동기 프레임을 전송하는 송신부와; 상기 송신부로부터 키 재동기 프레임을 수신하면, 상기 키 재동기 프레임 내에 삽입되어 있는 음성 데이터에 대한 벡터 정보를 추출하여 상기 키 재동기 구간의 음성 데이터 예측을 수행하는 수신부를 포함하여 구성되며, 기 수신된 데이터를 기반으로 기울기의 변화율을 계산하여 원음을 예측함으로써 기존의 방식보다 좀 더 나은 음질 향상 효과를 얻을 수 있다.

단방향 통신, 음성 통신, 암호화, 키 재동기, 늦은 참여, 기울기 변화율

Description

키 재동기 구간의 음성 데이터 예측을 위한 음성 데이터 송수신 장치 및 방법{APPARATUS AND METHOD FOR TRANSMITTING/RECEIVING VOICE CAPABLE OF ESTIMATING VOICE DATA OF RE-SYNCHRONIZATION SECTION}

도 1은 본 발명의 일실시예에 따른 키 재동기 구간의 음성 데이터 예측을 위한 음성 데이터 송수신 장치의 전체 구성도이고,

도 2는 본 발명의 일실시예에 따른 키 재동기 구간의 음성 데이터 예측을 위한 음성 데이터 송신 방법을 설명하는 순서도이고,

도 3은 본 발명의 일실시예에 따른 키 재동기 구간의 음성 데이터 예측을 위한 음성 데이터 수신 방법을 설명하는 순서도이며,

도 4는 도 1에 따른 음성 데이터 송수신 장치에 있어서, 키 재동기 구간의 음성 데이터 값을 계산하는 과정을 개략적으로 도시한 도면으로, 도 4a는 송신부에서 벡터 정보를 계산하여 삽입하는 것을 나타내고, 도 4b는 수신부에서 벡터 정보를 추출하여 키 재동기 구간의 음성 데이터 값을 예측하는 과정을 나타낸다.

<도면의 주요 부분에 대한 부호의 설명>

10 : 송신부 11 : 입력부

12 : 보코더 13 : 프레임 생성부

13a : 벡터 정보 삽입부 14 : 프레임 전송부

20 : 수신부 21 : 프레임 수신부

22 : 프레임 분석부 22a : 음성 데이터 예측부

23 : 보코더 24 : 출력부

본 발명은 단방향 무선 통신 환경에서 암호화된 디지털 음성을 전송할 때 키 재동기 과정에서 발생하는 묵음 구간에 해당하는 음성 데이터를 예측하기 위한 음성 송수신 장치 및 방법에 관한 것으로, 더욱 상세하게는 급격하게 변하지 않는 사인파를 그리는 음성 특징으로부터 추출한 음성 변화 방향에 관한 정보, 즉 벡터 정보를 키 재동기 프레임에 삽입함으로써 키 재동기 과정에서 발생하는 묵음 구간의 음성 데이터를 예측할 수 있는 키 재동기 구간의 음성 데이터 예측을 위한 음성 데이터 송수신 장치 및 방법에 관한 것이다.

종래의 통신에서는 키 재동기 과정에서 키 데이터를 그대로 음성 데이터로 처리하거나 이전 음성 데이터를 재사용하는 방식으로 키 재동기 구간을 처리하였다. 이러한 방식은 원음과 많은 차이가 발생하여 청자로 하여금 키 재동기 구간에서의 음질 손실 현상을 명확히 인식하게 한다.

특히, 단방향 무선 환경에서는 데이터가 한 방향으로만 전송되기 때문에 데 이터의 정상 수신 유무를 확인할 수 없다. 따라서, 이러한 환경에서 암호화된 데이터를 전송할 경우, 수신측에서 초기 키 정보를 수신하지 못하면 그 세션 동안의 모든 데이터가 복호화되지 못한다.

이러한 문제점을 해결하기 위해서, 단방향 무선 환경에서의 암호 통신은 주기적으로 키 정보를 전송하는 키 재동기 방식을 사용한다. 이때, 키 재동기 방식을 사용하면, 암호 통신에서 주고 받는 데이터가 디지털화된 음성일 경우, 재동기 구간만큼 묵음 구간이 발생한다. 이 묵음 구간은 주기적으로 발생하기 때문에 수신측의 통화품질을 저하시킨다.

따라서, 단방향 무선 암호 통신에서 키 재동기 구간의 묵음 구간에서의 음성 데이터 값을 보정할 필요가 있다.

예를들어, 햄(HAM)과 같은 단방향 무선 통신에서 음성 데이터 전송시 발생하는 프레임 분실을 처리하는 방법으로는 스플라이싱(Splicing), 묵음 대체(Silence Substitution), 노이즈 대체(Noise Substitution), 반복(Repetition) 등을 사용할 수 있다.

이 기술들은 단방향 무선통신에서 손실된 음성 프레임의 값을 예측하는 기술들이다. 여기서, 스플라이싱 기법은 인접한 두 프레임을 중첩시켜서 사용하는 방식으로 손실에 의한 공백은 발생하지 않지만 스트림의 타이밍이 붕괴된다. 묵음 대체 기법은 손실된 구간에 묵음을 첨가시키는 것으로 손실 패킷의 크기가 증가할 경우에 성능이 저하된다.

또한, 노이즈 대체 기법은 음성 신호의 누락된 부문에 잡음이 첨가되면 이를 주변의 신호를 이용해서 복원하려는 인간의 음소 복원 능력을 이용하는 것으로, 개인차가 심하다. 반복기법은 반복에 의한 방법으로 분실된 구간에 가장 최근에 수신한 음성 신호를 삽입하는 것으로, 프레임이 길어지면 음이 늘어지는 현상이 발생한다.

이외에 음성 압축 코덱의 상태 정보를 이용해서 분실 구간의 묵음을 복원하는 기술도 존재하지만, 코덱마다 서로 다른 상태 정보를 이용하기 때문에 코덱에 전적으로 의존하며 계산량이 많이 증가하는 단점을 가진다.

따라서, 본 발명은 상기한 종래 기술의 문제점을 해결하기 위해 이루어진 것으로서, 본 발명의 목적은 단방향 무선 통신 환경에서 음성의 변화 방향 정보와 데이터의 기울기 변화율을 이용해서 주기적으로 발생하는 키 재동기 구간에서의 묵음 구간에 해당하는 음성 데이터 값을 예측할 수 있는 장치 및 방법을 제공하는 것이다.

상기와 같은 목적을 이루기 위한 본 발명의 키 재동기 구간의 음성 데이터 예측을 위한 음성 데이터 송수신 장치는, 키 재동기 정보의 전송을 위해, 상기 키 재동기 정보와 함께 음성 데이터에 대한 벡터 정보를 삽입하여 키 재동기 프레임을 생성하고, 상기 생성된 키 재동기 프레임을 전송하는 송신부와; 상기 송신부로부터 키 재동기 프레임을 수신하면, 상기 키 재동기 프레임 내에 삽입되어 있는 음성 데이터에 대한 벡터 정보를 추출하여 상기 키 재동기 구간의 음성 데이터 예측을 수행하는 수신부를 포함하는 것을 특징으로 한다.

상기 송신부는 음성 데이터를 입력받는 입력부와, 상기 입력된 음성 데이터를 부호화하는 보코더와, 상기 부호화된 음성 데이터에 대해 키 재동기 정보의 유무에 따라 키 재동기 프레임 또는 음성 프레임을 생성하고, 상기 키 재동기 프레임 또는 음성 프레임 생성시 상기 음성 데이터에 대한 벡터 정보를 삽입하기 위한 벡터 정보 삽입부를 구비하는 프레임 생성부와, 상기 생성된 프레임들을 상기 수신부로 전송하는 프레임 전송부를 포함하여 구성된다.

상기 수신부는 상기 송신부에서 전송되는 프레임들을 수신하는 프레임 수신부와, 상기 수신한 프레임들의 키 재동기 정보의 유무에 따라 프레임의 종류를 분석하고, 상기 분석결과 키 재동기 프레임이면 상기 벡터 정보를 추출하여 키 재동기 구간의 음성 데이터 값을 예측하기 위한 음성 데이터 예측부를 구비하는 프레임 분석부와, 상기 음성 데이터를 보코딩하여 음성화하는 보코더와, 상기 음성화된 음성을 출력하는 출력부를 포함하여 구성된다.

상기 음성 데이터 예측부는 상기 추출한 벡터 정보와 이전 프레임의 음성 데이터들의 기울기 변화율을 비교함으로써 상기 키 재동기 구간에서의 음성 데이터 값을 구하는데, 여기서 상기 키 재동기 구간에서의 음성 데이터 값은 상기 추출한 음성 데이터의 벡터 정보가 (+)이면 상기 추출한 음성 데이터의 기울기 변화율 선상에서 키 재동기 구간의 음성 데이터 값을 취하며, (-)이면 상기 추출한 음성 데 이터의 기울기 변화율 선과 대칭이 되는 기울기를 구하여 키 재동기 구간의 음성 데이터 값을 취하는 것을 특징으로 한다.

또한, 본 발명의 키 재동기 구간의 음성 데이터 예측을 위한 음성 데이터 송신 방법은, 입력받은 음성 데이터를 부호화하는 단계와; 상기 부호화된 음성 데이터에 대해 키 재동기 정보의 유무에 따라 키 재동기 프레임 또는 음성 프레임을 생성하는 단계를 포함하는데, 상기 프레임 생성시 상기 음성 데이터에 대한 벡터 정보를 삽입하며; 상기 생성된 프레임들을 전송하는 단계를 포함하는 것을 특징으로 한다.

또한, 본 발명의 키 재동기 구간의 음성 데이터 예측을 위한 음성 데이터 수신 방법은, 수신되는 프레임의 헤더를 분석하여 키 재동기 정보를 포함하는지 여부를 판단하는 단계와; 상기 판단결과, 상기 수신되는 프레임이 키 재동기 정보를 포함하면 키 재동기 프레임으로 인식하고, 상기 키 재동기 프레임 내의 음성 데이터에 대한 벡터정보를 추출하여 상기 키 재동기 구간의 음성 데이터를 예측하는 단계와; 상기 음성 데이터를 보코딩하여 음성화하고, 상기 음성화된 음성을 출력하는 단계를 포함하는 것을 특징으로 한다.

상기 음성 데이터에 대한 벡터 정보는 현재 음성 데이터와 이전 음성 데이터의 차를 구해서 얻어지는 음성 변화 방향(+, -) 정보가 된다.

상기 키 재동기 구간의 음성 데이터를 예측하는 단계에서, 상기 추출한 벡터 정보와 이전 프레임의 음성 데이터들의 기울기 변화율을 비교함으로써 상기 키 재동기 구간에서의 음성 데이터 값을 구하는 것을 특징으로 한다.

바람직하게, 상기 키 재동기 구간에서의 음성 데이터 값은 상기 추출한 음성 데이터의 벡터 정보가 (+)이면 상기 추출한 음성 데이터의 기울기 변화율 선상에서 키 재동기 구간의 음성 데이터 값을 취하며, (-)이면 상기 추출한 음성 데이터의 기울기 변화율 선과 대칭이 되는 기울기를 구하여 키 재동기 구간의 음성 데이터 값을 취하는 것을 특징으로 한다.

상기 키 재동기 정보를 포함하는지 여부를 판단하는 단계에서, 상기 수신되는 프레임이 키 재동기 정보를 포함하지 않는 경우에는 음성 프레임으로 인식하고, 상기 음성 데이터를 보코딩한 후, 이전 프레임의 음성 데이터와 현재 프레임의 음성 데이터를 이용하여 기울기 및 기울기 변화율을 계산하여 저장한다.

이하, 본 발명에 따른 키 재동기 구간의 음성 데이터 예측을 위한 음성 데이터 송수신 장치 및 방법에 대하여 첨부된 도면을 참조하여 상세히 설명한다.

도 1은 본 발명의 일실시예에 따른 키 재동기 구간의 음성 데이터 예측을 위한 음성 데이터 송수신 장치의 전체 구성도로서, 크게 송신부(10)와 수신부(20)로 구성된다.

송신부(10)는 키 재동기 정보의 전송을 위해, 상기 키 재동기 정보와 함께 음성 데이터에 대한 벡터 정보를 삽입하여 키 재동기 프레임을 생성하고, 상기 생성된 키 재동기 프레임을 전송한다.

구체적으로, 송신부(10)는 마이크와 같이 음성을 입력받는 입력부(11)와, 입 력된 음성을 보코딩하여 부호화하는 보코더(12)와, 부호화된 음성 데이터에 대해 키 재동기 구간을 판단하여, 즉 키 재동기 정보의 유무에 따라 키 재동기 프레임 및 음성 프레임을 생성하는 프레임 생성부(13)와, 생성된 프레임을 전송하는 프레임 전송부(14)를 포함하여 구성된다.

프레임 생성부(13)는 키 재동기 프레임 또는 음성 프레임 생성시 음성 데이터에 대한 벡터 정보를 삽입하기 위한 벡터 정보 삽입부(13a)를 구비하고 있다. 여기서, 음성 데이터에 대한 벡터 정보는 현재 음성 데이터와 이전 음성 데이터의 차를 구해서 얻어지는 음성 변화 방향(+, -) 정보가 된다.

다시 말해서, 프레임 생성부(13)는 현재 음성 데이터와 바로 이전 음성 데이터와의 차를 구해서 그 결과인 음성 변화 방향(+, -) 정보, 즉 음성 데이터에 대한 벡터 정보를 계속 누적하여 저장한다. 그리고, 프레임 생성부(13)는 키 재동기 정보를 전송하기 위해 키 재동기 정보와 함께 누적된 벡터 정보를 삽입하여 키 재동기 프레임을 생성하며, 또한 음성 프레임을 전송할 때도 누적된 벡터 정보를 삽입하여 전송한다.

요약하면, 프레임 생성부(13)는 음성 데이터의 벡터 정보를 누적하여 저장하고 있다가 음성 프레임을 전송하게 되면, 전송할 음성 데이터에 대해 키 재동기 시점인지를 판단하고, 키 재동기 시점이면 저장된 벡터 정보를 삽입하여 키 재동기 프레임을 구성한다. 만약 전송할 음성 데이터에 대해 키 재동기 시점인지를 판단하여 키 재동기 시점이 아니면, 전송할 음성 데이터에 대해 음성 프레임을 구성하고, 벡터 정보를 삽입한다.

한편, 수신부(20)는 상기 송신부(10)로부터 키 재동기 프레임을 수신하면, 상기 키 재동기 프레임 내에 삽입되어 있는 음성 데이터에 대한 벡터 정보를 추출하여 상기 키 재동기 구간의 음성 데이터 예측을 수행한다.

구체적으로, 수신부(20)는 송신부(10)에서 전송되는 프레임들을 수신하는 프레임 수신부(21), 수신한 프레임의 키 재동기 정보의 유무를 판단하여 프레임의 종류를 분석하고, 상기 분석결과 키 재동기 프레임이면, 벡터 정보를 추출하여 키 재동기 구간의 묵음 구간에 해당하는 음성 데이터 값을 계산하여 예측하는 프레임 분석부(22), 음성 데이터를 보코딩하여 음성화하는 보코더(23), 및 음성화된 음성을 출력하는 출력부(24)를 포함하여 구성된다.

특히, 프레임 분석부(22)는 수신한 프레임들의 키 재동기 정보의 유무에 따라 프레임의 종류를 분석하고, 분석결과 키 재동기 프레임이면 관련 벡터 정보를 추출하여 키 재동기 구간의 음성 데이터 값을 예측하기 위한 음성 데이터 예측부(22a)를 구비하고 있다.

프레임 분석부(22)는 수신한 프레임의 헤더를 분석하여 키 재동기 정보의 유무를 판단한다. 헤더에 키 재동기 정보가 있으면 키 재동기 프레임으로 판단하고, 삽입된 벡터 정보를 추출한다.

이때, 음성 데이터 예측부(22a)는 최근에 수신한 이전 프레임으로부터 음성 데이터들의 기울기를 구하고, 구한 음성데이터들의 기울기와 추출한 음성 데이터의 벡터 정보를 이용하여 키 재동기 구간에서의 음성 데이터 값을 계산한다.

즉, 추출한 음성 데이터의 벡터 정보가 (+)이면 계산되어 있는 기울기의 변 화율을 적용하여 기울기가 감소한 새로운 기울기 선을 계산하고 이 선상에서 음성 데이터 값을 취하고, (-)이면 계산되어 있는 기울기의 변화율을 적용하여 기울기가 증가한 새로운 기울기 선상에서 키 재동기 구간의 음성 데이터 값을 취한다.

도 2는 본 발명의 일실시예에 따른 키 재동기 구간의 음성 데이터 예측을 위한 음성 데이터 송신 방법을 설명하는 순서도이다.

도 2를 참조하면, 먼저 마이크와 같은 입력부(11)를 통해서 입력받은 음성은 보코더(12)에서 보코딩하여 음성 데이터로 부호화된다(S100 및 S110).

다음에, 프레임 생성부(13)가 전송할 음성 데이터의 프레임이 키 재동기 시점인지 판단한다(S120).

판단 결과, 전송할 프레임이 키 재동기 시점이면(Y), 해당하는 현재 프레임의 음성 데이터를 제거하고(S130), 이전 프레임의 음성 데이터를 분석하여(S131) 음성 데이터의 변화 방향(+, -) 정보, 즉 벡터 정보를 추출하여 음성 데이터의 음성의 변화 방향(+, -) 정보로 벡터 정보를 구성한다(S132).

여기서, 음성 데이터의 변화 방향(+, -) 정보, 즉 벡터 정보는 음성 데이터 값이 증가하는 방향일 경우 계속 증가해 나가고, 감소하는 방향일 경우는 계속 감소해 나가는 급격한 변화가 없이 완만하게 변하는 사인파 음성 파형의 특징을 이용한 것으로, 현재 음성 데이터와 바로 이전 음성 데이터의 차를 구해서 그 결과가 (+)이면 증가하는 방향, (-)이면 감소하는 방향으로 정의한다.

다음에, 상기한 벡터 정보는 키 재동기 정보와 함께 음성 데이터를 삭제한 구간에 삽입되어 키 재동기 프레임을 생성하고(S133), 생성된 키 재동기 프레임을 전송한다(S134).

만약 키 재동기 시점이 아니면(N), 음성 데이터를 이용해 음성 프레임을 생성하고(S140), 이전 프레임과 현재 프레임의 음성 데이터를 분석하여(S141) 벡터 정보를 구성하고(S142), 이를 송신측 내부 메모리(미도시)에 저장한다. 그리고 생성된 음성 프레임을 전송한다(S143).

도 3은 본 발명의 일실시예에 따른 키 재동기 구간의 음성 데이터 예측을 위한 음성 데이터 수신 방법을 설명하는 순서도이다.

도 3을 참조하면, 먼저 수신측(20)의 프레임 수신부(21)가 송신측(10)에서 전송되는 프레임을 수신하고(S200), 프레임 분석부(22)가 수신된 프레임의 헤더를 분석하여 프레임의 종류를 파악한다(S210).

분석 결과, 수신한 프레임이 키 재동기 프레임이면(Y), 수신한 프레임으로부터 키 재동기 정보와 음성의 변화 방향(+, -) 에 대한 벡터 정보를 추출한다(S230).

다음에, 추출된 키 재동기 정보를 이용해서 키 재동기를 수행하고(S231), 기 수신된 프레임의 음성 데이터들로부터 추출한 기울기 정보와 벡터 정보를 분석하여 기울기와 벡터 정보에 따른 음성의 변화 방향이 같은 방향인지 판단한다(S232).

판단 결과, 수신측 내부 메모리(미도시)에 저장되어 있는 기 수신된 프레임의 음성 데이터들로부터 추출한 기울기의 변화율과 음성 변화 방향(+, -)이 같은 방향이면(Y), 수신측 내부 메모리(미도시)에 저장되어 있는 기 수신된 프레임의 음성 데이터들로부터 추출한 기울기 선보다 감소한 새로운 기울기 선상에서 묵음 구간의 음성 데이터 값을 추출한다(S233).

만약 그렇지 않으면, 기 수신된 프레임의 음성 데이터들로부터 추출한 기울기 변화율을 이용하여 기울기가 증가한 새로운 기울기 선을 구하고, 구한 선상에서 묵음 구간의 음성 데이터 값을 추출한다(S234).

추출된 묵음 구간의 음성 데이터 값은 보코더(23)에서의 보코딩(S235)을 통해서 음성으로 출력한다(S236).

한편, 분석 결과(S220), 수신한 프레임이 키 재동기 프레임이 아니면(N), 보코딩을 통해서 수신한 음성 데이터를 음성화한다(S240).

다음에, 수신측 내부 메모리(미도시)에 저장되어 있는 이전 프레임의 음성 데이터와 현재 프레임의 음성 데이터를 이용하여 두 점을 잇는 기울기를 구하고(S241), 기존 기울기 값과 현재의 기울기 값을 이용하여 기울기 변화율을 계산하여(S242), 현재 프레임을 다음에 사용하기 위해서 수신측 내부 메모리(미도시)에 저장한다(S243). 그리고, 음성화된 수신 데이터는 실제 음성으로 출력된다(S244).

따라서, 수신측(10)에서는 기 수신된 음성 프레임들의 음성 데이터 값의 변화비율인 기울기와 기울기의 변화율 그리고 추출한 음성 데이터의 음성 변화 방향 정보, 즉 벡터 정보를 이용함으로써 단반향 무선 통신 환경에서 키 재동기 시에 발생하는 묵음 구간의 음성 데이터 값을 원음에 가깝게 예측가능해진다.

도 4는 도 1에 따른 음성 데이터 송수신 장치에 있어서, 키 재동기 구간의 음성 데이터 값을 계산하는 과정을 개략적으로 도시한 도면으로, 도 4a는 송신부에서 벡터 정보를 계산하여 삽입하는 것을 나타내고, 도 4b는 수신부에서 벡터 정보를 추출하여 키 재동기 구간의 음성 데이터 값을 예측하는 과정을 예를 들어 설명하기 위한 예시도이다.

우선, 5번 및 8번이 키 재동기 시점에 해당되는 것으로 가정한다.

송신부(10)에서는 사인파 음성 파형을 부호화하는 과정에서 키 재동기 시점이 되면(S110과 S120), 키 재동기 시점에 해당하는 구간인 5번, 8번의 음성 데이터는 삭제되고, 키 재동기 정보로 치환된다.

5번 음성 데이터는 4번 음성 데이터의 차를 이용해서 구한 음성의 변화 방향(+)과, 키 재동기 정보 X로 치환된다. 마찬가지로, 11번 음성 데이터는 10번 음성 데이터와의 차를 이용해서 구한 음성의 변화 방향(-)과, 키 재동기 정보 Y로 치환된다. 이렇게 재구성된 데이터가 수신부(20)로 전달된다.

이에 대해, 수신부(20)에서는 5번에 해당하는 키 재동기 데이터가 도착하면 2번(L), 3번(M) 음성 데이터를 이용해서 구한 기울기 값(A 선)과 3번(M), 4번(N) 음성 데이터를 이용해서 구한 기울기 값(B 선)을 이용하여 기울기의 감소 비율을 구한 후 이 감소 비율을 이용하여 새로운 값(C 선)을 계산해 낸다. 그리고 이 값(C 선의 기울기)이 수신한 프레임 내의 음성 방향(+) 정보와 동일하므로 C 선상에 위치하는 음성 데이터 값(O)을 추출한다. 이 과정의 한 예는 다음과 같다.

여기서, My, Ly, Ny는 도 4의 M, L, N 점의 y좌표 값이고, Mx, Lx, Nx는 도 4의 M, L, N 점의 x좌표 값이다.

8번에 해당하는 키 재동기 데이터가 도착하면 5번(O), 6번(P) 음성 데이터를 이용해서 구한 기울기 값(C 선)과, 6번(P), 7번(Q) 음성 데이터를 이용해서 구한 기울기 값(D 선)을 이용하여 기울기의 증가 비율을 구한 후 이 증가 비율을 이용하여 새로운 값(E 선)을 계산해 낸다. 그러나 이 값이 수신한 프레임 내의 음성 방향(-) 정보와 반대이므로 대칭이 되는 선 F 선상에서 음성 데이터 값(R)을 추출한다. 이 과정의 한 예는 다음과 같다.

여기서, Py, Oy, Qy는 도 4의 P, O, Q 점의 y좌표 값이고, Px, Ox, Qx는 도 4의 P, O, Q 점의 x좌표 값이다.

구체적으로, 8번 같은 경우는 이전 음성 데이터(C, D 선)로부터 계산된 기울기 값의 비율(+)과 8번의 음성 방향(-) 정보가 다르기 때문에 E선과 대칭이 되는 F선을 계산한 후 이 F 선상에서 음성 데이터 값을 추출한다.

이상에서 몇 가지 실시예를 들어 본 발명을 더욱 상세하게 설명하였으나, 본 발명은 반드시 이러한 실시예로 국한되는 것이 아니고 본 발명의 기술사상을 벗어나지 않는 범위 내에서 다양하게 변형실시될 수 있다.

이상에서와 같이, 본 발명에 따르면 완만한 변화를 보이는 음성 데이터 값의 특징을 이용하여 단방향 무선환경에서 주기적인 키 재동기에 의한 묵음구간의 음성 데이터 값을 유사하게 예측하여 수신단에서의 통화품질을 향상시킬 수 있다.

또한, 본 발명은 음성을 보정하기 위한 추가적인 정보 전송이 많지 않고, 기존 방식에 비해 적은 계산량을 요구하므로 시스템에 추가의 부하를 주지 않는다.

Claims

삭제
삭제
음성 데이터를 입력받는 입력부;

상기 입력된 음성 데이터를 부호화하는 보코더;

상기 부호화된 음성 데이터에 대해 키 재동기 정보가 없을 경우에 현재 프레임과 이전 프레임의 음성 데이터를 분석하여 기울기 및 기울기 변화율 증감 방향을 포함하는 벡터 정보를 삽입하여 음성 프레임을 생성하고, 상기 부호화된 음성 데이터에 대해 키 재동기 정보가 있을 경우에 현재 프레임의 음성 데이터를 제거하고 이전 프레임의 음성 데이터를 분석하여 상기 제거된 음성 데이터 영역에 이전 프레임의 벡터 정보를 삽입하여 키 재동기 프레임을 생성하는 벡터 정보 삽입부를 구비하는 프레임 생성부; 및

상기 생성된 프레임을 수신부로 전송하는 프레임 전송부

를 포함하는 것을 특징으로 하는 키 재동기 구간의 음성 데이터 예측을 위한 음성 데이터 송신 장치.
전송되는 프레임을 수신하는 프레임 수신부;

상기 수신한 프레임에 키 재동기 정보가 없을 경우에 수신한 현재 프레임과 이전 프레임의 음성 데이터를 이용하여 기울기를 구하고, 이미 저장된 이전 기울기 값과의 비교를 통해 기울기 변화율을 계산하여 저장하고, 상기 수신한 프레임에 키 재동기 정보가 있을 경우에 수신한 프레임에 포함된 벡터 정보에서 추출된 기울기와 이전 프레임의 음성 데이터로부터 추출된 기울기를 비교하여 상기 기울기 변화율의 증감 방향과 동일한지 여부를 판단하여 음성 데이터를 구성하는 음성 데이터 예측부를 구비하는 프레임 분석부;

상기 음성 데이터를 보코딩하여 음성화하는 보코더; 및

상기 음성화된 음성을 출력하는 출력부

를 포함하는 것을 특징으로 하는 키 재동기 구간의 음성 데이터 예측을 위한 음성 데이터 수신 장치.
삭제
제4항에 있어서,

상기 기울기 변화율의 증감 방향이 동일할 경우에는 상기 추출한 음성 데이터의 기울기 변화율 선상에서 음성 데이터 값을 취하며, 상기 기울기 변화율의 증감 방향이 다를 경우에는 상기 추출한 음성 데이터의 기울기 변화율 선과 대칭이 되는 기울기를 구하여 음성 데이터 값을 취하는 것을 특징으로 하는 키 재동기 구간의 음성 데이터 예측을 위한 음성 데이터 수신 장치.
입력받은 음성 데이터를 부호화하는 단계;

상기 부호화된 음성 데이터에 대해 키 재동기 정보가 없을 경우에 현재 프레임과 이전 프레임의 음성 데이터를 분석하여 기울기 및 기울기 변화율 증감 방향을 포함하는 벡터 정보를 삽입하여 음성 프레임을 생성하고, 상기 부호화된 음성 데이터에 대해 키 재동기 정보가 있을 경우에 현재 프레임의 음성 데이터를 제거하고 이전 프레임의 음성 데이터를 분석하여 상기 제거된 음성 데이터 영역에 이전 프레임의 벡터 정보를 삽입하여 키 재동기 프레임을 생성하는 단계; 및

상기 생성된 프레임을 전송하는 단계

를 포함하는 것을 특징으로 하는 키 재동기 구간의 음성 데이터 예측을 위한 음성 데이터 송신 방법.
삭제
수신되는 프레임의 헤더를 분석하여 키 재동기 정보를 포함하는지 여부를 판단하는 단계;

상기 수신한 프레임에 키 재동기 정보가 없을 경우에 수신한 현재 프레임과 이전 프레임의 음성 데이터를 이용하여 기울기를 구하고, 이미 저장된 이전 기울기 값과의 비교를 통해 기울기 변화율을 계산하여 저장하고, 상기 수신한 프레임에 키 재동기 정보가 있을 경우에 수신한 프레임에 포함된 벡터 정보에서 추출된 기울기와 이전 프레임의 음성 데이터로부터 추출된 기울기를 비교하여 상기 기울기 변화율의 증감 방향과 동일한지 여부를 판단하여 음성 데이터를 구성하는 단계; 및

상기 음성 데이터를 보코딩하여 음성화하고, 상기 음성화된 음성을 출력하는 단계

를 포함하는 것을 특징으로 하는 키 재동기 구간의 음성 데이터 예측을 위한 음성 데이터 수신 방법.
삭제
삭제
제9항에 있어서,

상기 기울기 변화율의 증감 방향이 동일할 경우에는 상기 추출한 음성 데이터의 기울기 변화율 선상에서 음성 데이터 값을 취하며, 상기 기울기 변화율의 증감 방향이 다를 경우에는 상기 추출한 음성 데이터의 기울기 변화율 선과 대칭이 되는 기울기를 구하여 음성 데이터 값을 취하는 것을 특징으로 하는 키 재동기 구간의 음성 데이터 예측을 위한 음성 데이터 수신 방법.
삭제