KR100906766B1 - 키 재동기 구간의 음성 데이터 예측을 위한 음성 데이터송수신 장치 및 방법 - Google Patents

키 재동기 구간의 음성 데이터 예측을 위한 음성 데이터송수신 장치 및 방법 Download PDF

Info

Publication number
KR100906766B1
KR100906766B1 KR1020070059545A KR20070059545A KR100906766B1 KR 100906766 B1 KR100906766 B1 KR 100906766B1 KR 1020070059545 A KR1020070059545 A KR 1020070059545A KR 20070059545 A KR20070059545 A KR 20070059545A KR 100906766 B1 KR100906766 B1 KR 100906766B1
Authority
KR
South Korea
Prior art keywords
voice data
frame
key resynchronization
data
voice
Prior art date
Application number
KR1020070059545A
Other languages
English (en)
Other versions
KR20080111311A (ko
Inventor
남택준
안병호
류석
이상이
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020070059545A priority Critical patent/KR100906766B1/ko
Priority to AT08102518T priority patent/ATE452400T1/de
Priority to EP08102518A priority patent/EP2006838B1/en
Priority to DE602008000406T priority patent/DE602008000406D1/de
Priority to US12/048,349 priority patent/US20080312936A1/en
Publication of KR20080111311A publication Critical patent/KR20080111311A/ko
Application granted granted Critical
Publication of KR100906766B1 publication Critical patent/KR100906766B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/08Key distribution or management, e.g. generation, sharing or updating, of cryptographic keys or passwords
    • H04L9/0891Revocation or update of secret information, e.g. encryption key update or rekeying
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04KSECRET COMMUNICATION; JAMMING OF COMMUNICATION
    • H04K1/00Secret communication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/12Transmitting and receiving encryption devices synchronised or initially set up in a particular manner
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L2209/00Additional information or applications relating to cryptographic mechanisms or cryptographic arrangements for secret or secure communication H04L9/00
    • H04L2209/80Wireless

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computer Security & Cryptography (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Telephonic Communication Services (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Synchronisation In Digital Transmission Systems (AREA)

Abstract

본 발명은 단방향 무선 통신 환경에서 암호화된 디지털 음성을 전송할 때 키 재동기 과정에서 발생하는 묵음구간에 대응하는 음성 데이터 값을 사인파를 그리는 음성의 특징을 이용하여 예측하는 장치 및 방법에 관한 것으로, 키 재동기 정보의 전송을 위해, 상기 키 재동기 정보와 함께 음성 데이터에 대한 벡터 정보를 삽입하여 키 재동기 프레임을 생성하고, 상기 생성된 키 재동기 프레임을 전송하는 송신부와; 상기 송신부로부터 키 재동기 프레임을 수신하면, 상기 키 재동기 프레임 내에 삽입되어 있는 음성 데이터에 대한 벡터 정보를 추출하여 상기 키 재동기 구간의 음성 데이터 예측을 수행하는 수신부를 포함하여 구성되며, 기 수신된 데이터를 기반으로 기울기의 변화율을 계산하여 원음을 예측함으로써 기존의 방식보다 좀 더 나은 음질 향상 효과를 얻을 수 있다.
단방향 통신, 음성 통신, 암호화, 키 재동기, 늦은 참여, 기울기 변화율

Description

키 재동기 구간의 음성 데이터 예측을 위한 음성 데이터 송수신 장치 및 방법{APPARATUS AND METHOD FOR TRANSMITTING/RECEIVING VOICE CAPABLE OF ESTIMATING VOICE DATA OF RE-SYNCHRONIZATION SECTION}
도 1은 본 발명의 일실시예에 따른 키 재동기 구간의 음성 데이터 예측을 위한 음성 데이터 송수신 장치의 전체 구성도이고,
도 2는 본 발명의 일실시예에 따른 키 재동기 구간의 음성 데이터 예측을 위한 음성 데이터 송신 방법을 설명하는 순서도이고,
도 3은 본 발명의 일실시예에 따른 키 재동기 구간의 음성 데이터 예측을 위한 음성 데이터 수신 방법을 설명하는 순서도이며,
도 4는 도 1에 따른 음성 데이터 송수신 장치에 있어서, 키 재동기 구간의 음성 데이터 값을 계산하는 과정을 개략적으로 도시한 도면으로, 도 4a는 송신부에서 벡터 정보를 계산하여 삽입하는 것을 나타내고, 도 4b는 수신부에서 벡터 정보를 추출하여 키 재동기 구간의 음성 데이터 값을 예측하는 과정을 나타낸다.
<도면의 주요 부분에 대한 부호의 설명>
10 : 송신부 11 : 입력부
12 : 보코더 13 : 프레임 생성부
13a : 벡터 정보 삽입부 14 : 프레임 전송부
20 : 수신부 21 : 프레임 수신부
22 : 프레임 분석부 22a : 음성 데이터 예측부
23 : 보코더 24 : 출력부
본 발명은 단방향 무선 통신 환경에서 암호화된 디지털 음성을 전송할 때 키 재동기 과정에서 발생하는 묵음 구간에 해당하는 음성 데이터를 예측하기 위한 음성 송수신 장치 및 방법에 관한 것으로, 더욱 상세하게는 급격하게 변하지 않는 사인파를 그리는 음성 특징으로부터 추출한 음성 변화 방향에 관한 정보, 즉 벡터 정보를 키 재동기 프레임에 삽입함으로써 키 재동기 과정에서 발생하는 묵음 구간의 음성 데이터를 예측할 수 있는 키 재동기 구간의 음성 데이터 예측을 위한 음성 데이터 송수신 장치 및 방법에 관한 것이다.
종래의 통신에서는 키 재동기 과정에서 키 데이터를 그대로 음성 데이터로 처리하거나 이전 음성 데이터를 재사용하는 방식으로 키 재동기 구간을 처리하였다. 이러한 방식은 원음과 많은 차이가 발생하여 청자로 하여금 키 재동기 구간에서의 음질 손실 현상을 명확히 인식하게 한다.
특히, 단방향 무선 환경에서는 데이터가 한 방향으로만 전송되기 때문에 데 이터의 정상 수신 유무를 확인할 수 없다. 따라서, 이러한 환경에서 암호화된 데이터를 전송할 경우, 수신측에서 초기 키 정보를 수신하지 못하면 그 세션 동안의 모든 데이터가 복호화되지 못한다.
이러한 문제점을 해결하기 위해서, 단방향 무선 환경에서의 암호 통신은 주기적으로 키 정보를 전송하는 키 재동기 방식을 사용한다. 이때, 키 재동기 방식을 사용하면, 암호 통신에서 주고 받는 데이터가 디지털화된 음성일 경우, 재동기 구간만큼 묵음 구간이 발생한다. 이 묵음 구간은 주기적으로 발생하기 때문에 수신측의 통화품질을 저하시킨다.
따라서, 단방향 무선 암호 통신에서 키 재동기 구간의 묵음 구간에서의 음성 데이터 값을 보정할 필요가 있다.
예를들어, 햄(HAM)과 같은 단방향 무선 통신에서 음성 데이터 전송시 발생하는 프레임 분실을 처리하는 방법으로는 스플라이싱(Splicing), 묵음 대체(Silence Substitution), 노이즈 대체(Noise Substitution), 반복(Repetition) 등을 사용할 수 있다.
이 기술들은 단방향 무선통신에서 손실된 음성 프레임의 값을 예측하는 기술들이다. 여기서, 스플라이싱 기법은 인접한 두 프레임을 중첩시켜서 사용하는 방식으로 손실에 의한 공백은 발생하지 않지만 스트림의 타이밍이 붕괴된다. 묵음 대체 기법은 손실된 구간에 묵음을 첨가시키는 것으로 손실 패킷의 크기가 증가할 경우에 성능이 저하된다.
또한, 노이즈 대체 기법은 음성 신호의 누락된 부문에 잡음이 첨가되면 이를 주변의 신호를 이용해서 복원하려는 인간의 음소 복원 능력을 이용하는 것으로, 개인차가 심하다. 반복기법은 반복에 의한 방법으로 분실된 구간에 가장 최근에 수신한 음성 신호를 삽입하는 것으로, 프레임이 길어지면 음이 늘어지는 현상이 발생한다.
이외에 음성 압축 코덱의 상태 정보를 이용해서 분실 구간의 묵음을 복원하는 기술도 존재하지만, 코덱마다 서로 다른 상태 정보를 이용하기 때문에 코덱에 전적으로 의존하며 계산량이 많이 증가하는 단점을 가진다.
따라서, 본 발명은 상기한 종래 기술의 문제점을 해결하기 위해 이루어진 것으로서, 본 발명의 목적은 단방향 무선 통신 환경에서 음성의 변화 방향 정보와 데이터의 기울기 변화율을 이용해서 주기적으로 발생하는 키 재동기 구간에서의 묵음 구간에 해당하는 음성 데이터 값을 예측할 수 있는 장치 및 방법을 제공하는 것이다.
상기와 같은 목적을 이루기 위한 본 발명의 키 재동기 구간의 음성 데이터 예측을 위한 음성 데이터 송수신 장치는, 키 재동기 정보의 전송을 위해, 상기 키 재동기 정보와 함께 음성 데이터에 대한 벡터 정보를 삽입하여 키 재동기 프레임을 생성하고, 상기 생성된 키 재동기 프레임을 전송하는 송신부와; 상기 송신부로부터 키 재동기 프레임을 수신하면, 상기 키 재동기 프레임 내에 삽입되어 있는 음성 데이터에 대한 벡터 정보를 추출하여 상기 키 재동기 구간의 음성 데이터 예측을 수행하는 수신부를 포함하는 것을 특징으로 한다.
상기 송신부는 음성 데이터를 입력받는 입력부와, 상기 입력된 음성 데이터를 부호화하는 보코더와, 상기 부호화된 음성 데이터에 대해 키 재동기 정보의 유무에 따라 키 재동기 프레임 또는 음성 프레임을 생성하고, 상기 키 재동기 프레임 또는 음성 프레임 생성시 상기 음성 데이터에 대한 벡터 정보를 삽입하기 위한 벡터 정보 삽입부를 구비하는 프레임 생성부와, 상기 생성된 프레임들을 상기 수신부로 전송하는 프레임 전송부를 포함하여 구성된다.
상기 수신부는 상기 송신부에서 전송되는 프레임들을 수신하는 프레임 수신부와, 상기 수신한 프레임들의 키 재동기 정보의 유무에 따라 프레임의 종류를 분석하고, 상기 분석결과 키 재동기 프레임이면 상기 벡터 정보를 추출하여 키 재동기 구간의 음성 데이터 값을 예측하기 위한 음성 데이터 예측부를 구비하는 프레임 분석부와, 상기 음성 데이터를 보코딩하여 음성화하는 보코더와, 상기 음성화된 음성을 출력하는 출력부를 포함하여 구성된다.
상기 음성 데이터 예측부는 상기 추출한 벡터 정보와 이전 프레임의 음성 데이터들의 기울기 변화율을 비교함으로써 상기 키 재동기 구간에서의 음성 데이터 값을 구하는데, 여기서 상기 키 재동기 구간에서의 음성 데이터 값은 상기 추출한 음성 데이터의 벡터 정보가 (+)이면 상기 추출한 음성 데이터의 기울기 변화율 선상에서 키 재동기 구간의 음성 데이터 값을 취하며, (-)이면 상기 추출한 음성 데 이터의 기울기 변화율 선과 대칭이 되는 기울기를 구하여 키 재동기 구간의 음성 데이터 값을 취하는 것을 특징으로 한다.
또한, 본 발명의 키 재동기 구간의 음성 데이터 예측을 위한 음성 데이터 송신 방법은, 입력받은 음성 데이터를 부호화하는 단계와; 상기 부호화된 음성 데이터에 대해 키 재동기 정보의 유무에 따라 키 재동기 프레임 또는 음성 프레임을 생성하는 단계를 포함하는데, 상기 프레임 생성시 상기 음성 데이터에 대한 벡터 정보를 삽입하며; 상기 생성된 프레임들을 전송하는 단계를 포함하는 것을 특징으로 한다.
또한, 본 발명의 키 재동기 구간의 음성 데이터 예측을 위한 음성 데이터 수신 방법은, 수신되는 프레임의 헤더를 분석하여 키 재동기 정보를 포함하는지 여부를 판단하는 단계와; 상기 판단결과, 상기 수신되는 프레임이 키 재동기 정보를 포함하면 키 재동기 프레임으로 인식하고, 상기 키 재동기 프레임 내의 음성 데이터에 대한 벡터정보를 추출하여 상기 키 재동기 구간의 음성 데이터를 예측하는 단계와; 상기 음성 데이터를 보코딩하여 음성화하고, 상기 음성화된 음성을 출력하는 단계를 포함하는 것을 특징으로 한다.
상기 음성 데이터에 대한 벡터 정보는 현재 음성 데이터와 이전 음성 데이터의 차를 구해서 얻어지는 음성 변화 방향(+, -) 정보가 된다.
상기 키 재동기 구간의 음성 데이터를 예측하는 단계에서, 상기 추출한 벡터 정보와 이전 프레임의 음성 데이터들의 기울기 변화율을 비교함으로써 상기 키 재동기 구간에서의 음성 데이터 값을 구하는 것을 특징으로 한다.
바람직하게, 상기 키 재동기 구간에서의 음성 데이터 값은 상기 추출한 음성 데이터의 벡터 정보가 (+)이면 상기 추출한 음성 데이터의 기울기 변화율 선상에서 키 재동기 구간의 음성 데이터 값을 취하며, (-)이면 상기 추출한 음성 데이터의 기울기 변화율 선과 대칭이 되는 기울기를 구하여 키 재동기 구간의 음성 데이터 값을 취하는 것을 특징으로 한다.
상기 키 재동기 정보를 포함하는지 여부를 판단하는 단계에서, 상기 수신되는 프레임이 키 재동기 정보를 포함하지 않는 경우에는 음성 프레임으로 인식하고, 상기 음성 데이터를 보코딩한 후, 이전 프레임의 음성 데이터와 현재 프레임의 음성 데이터를 이용하여 기울기 및 기울기 변화율을 계산하여 저장한다.
이하, 본 발명에 따른 키 재동기 구간의 음성 데이터 예측을 위한 음성 데이터 송수신 장치 및 방법에 대하여 첨부된 도면을 참조하여 상세히 설명한다.
도 1은 본 발명의 일실시예에 따른 키 재동기 구간의 음성 데이터 예측을 위한 음성 데이터 송수신 장치의 전체 구성도로서, 크게 송신부(10)와 수신부(20)로 구성된다.
송신부(10)는 키 재동기 정보의 전송을 위해, 상기 키 재동기 정보와 함께 음성 데이터에 대한 벡터 정보를 삽입하여 키 재동기 프레임을 생성하고, 상기 생성된 키 재동기 프레임을 전송한다.
구체적으로, 송신부(10)는 마이크와 같이 음성을 입력받는 입력부(11)와, 입 력된 음성을 보코딩하여 부호화하는 보코더(12)와, 부호화된 음성 데이터에 대해 키 재동기 구간을 판단하여, 즉 키 재동기 정보의 유무에 따라 키 재동기 프레임 및 음성 프레임을 생성하는 프레임 생성부(13)와, 생성된 프레임을 전송하는 프레임 전송부(14)를 포함하여 구성된다.
프레임 생성부(13)는 키 재동기 프레임 또는 음성 프레임 생성시 음성 데이터에 대한 벡터 정보를 삽입하기 위한 벡터 정보 삽입부(13a)를 구비하고 있다. 여기서, 음성 데이터에 대한 벡터 정보는 현재 음성 데이터와 이전 음성 데이터의 차를 구해서 얻어지는 음성 변화 방향(+, -) 정보가 된다.
다시 말해서, 프레임 생성부(13)는 현재 음성 데이터와 바로 이전 음성 데이터와의 차를 구해서 그 결과인 음성 변화 방향(+, -) 정보, 즉 음성 데이터에 대한 벡터 정보를 계속 누적하여 저장한다. 그리고, 프레임 생성부(13)는 키 재동기 정보를 전송하기 위해 키 재동기 정보와 함께 누적된 벡터 정보를 삽입하여 키 재동기 프레임을 생성하며, 또한 음성 프레임을 전송할 때도 누적된 벡터 정보를 삽입하여 전송한다.
요약하면, 프레임 생성부(13)는 음성 데이터의 벡터 정보를 누적하여 저장하고 있다가 음성 프레임을 전송하게 되면, 전송할 음성 데이터에 대해 키 재동기 시점인지를 판단하고, 키 재동기 시점이면 저장된 벡터 정보를 삽입하여 키 재동기 프레임을 구성한다. 만약 전송할 음성 데이터에 대해 키 재동기 시점인지를 판단하여 키 재동기 시점이 아니면, 전송할 음성 데이터에 대해 음성 프레임을 구성하고, 벡터 정보를 삽입한다.
한편, 수신부(20)는 상기 송신부(10)로부터 키 재동기 프레임을 수신하면, 상기 키 재동기 프레임 내에 삽입되어 있는 음성 데이터에 대한 벡터 정보를 추출하여 상기 키 재동기 구간의 음성 데이터 예측을 수행한다.
구체적으로, 수신부(20)는 송신부(10)에서 전송되는 프레임들을 수신하는 프레임 수신부(21), 수신한 프레임의 키 재동기 정보의 유무를 판단하여 프레임의 종류를 분석하고, 상기 분석결과 키 재동기 프레임이면, 벡터 정보를 추출하여 키 재동기 구간의 묵음 구간에 해당하는 음성 데이터 값을 계산하여 예측하는 프레임 분석부(22), 음성 데이터를 보코딩하여 음성화하는 보코더(23), 및 음성화된 음성을 출력하는 출력부(24)를 포함하여 구성된다.
특히, 프레임 분석부(22)는 수신한 프레임들의 키 재동기 정보의 유무에 따라 프레임의 종류를 분석하고, 분석결과 키 재동기 프레임이면 관련 벡터 정보를 추출하여 키 재동기 구간의 음성 데이터 값을 예측하기 위한 음성 데이터 예측부(22a)를 구비하고 있다.
프레임 분석부(22)는 수신한 프레임의 헤더를 분석하여 키 재동기 정보의 유무를 판단한다. 헤더에 키 재동기 정보가 있으면 키 재동기 프레임으로 판단하고, 삽입된 벡터 정보를 추출한다.
이때, 음성 데이터 예측부(22a)는 최근에 수신한 이전 프레임으로부터 음성 데이터들의 기울기를 구하고, 구한 음성데이터들의 기울기와 추출한 음성 데이터의 벡터 정보를 이용하여 키 재동기 구간에서의 음성 데이터 값을 계산한다.
즉, 추출한 음성 데이터의 벡터 정보가 (+)이면 계산되어 있는 기울기의 변 화율을 적용하여 기울기가 감소한 새로운 기울기 선을 계산하고 이 선상에서 음성 데이터 값을 취하고, (-)이면 계산되어 있는 기울기의 변화율을 적용하여 기울기가 증가한 새로운 기울기 선상에서 키 재동기 구간의 음성 데이터 값을 취한다.
도 2는 본 발명의 일실시예에 따른 키 재동기 구간의 음성 데이터 예측을 위한 음성 데이터 송신 방법을 설명하는 순서도이다.
도 2를 참조하면, 먼저 마이크와 같은 입력부(11)를 통해서 입력받은 음성은 보코더(12)에서 보코딩하여 음성 데이터로 부호화된다(S100 및 S110).
다음에, 프레임 생성부(13)가 전송할 음성 데이터의 프레임이 키 재동기 시점인지 판단한다(S120).
판단 결과, 전송할 프레임이 키 재동기 시점이면(Y), 해당하는 현재 프레임의 음성 데이터를 제거하고(S130), 이전 프레임의 음성 데이터를 분석하여(S131) 음성 데이터의 변화 방향(+, -) 정보, 즉 벡터 정보를 추출하여 음성 데이터의 음성의 변화 방향(+, -) 정보로 벡터 정보를 구성한다(S132).
여기서, 음성 데이터의 변화 방향(+, -) 정보, 즉 벡터 정보는 음성 데이터 값이 증가하는 방향일 경우 계속 증가해 나가고, 감소하는 방향일 경우는 계속 감소해 나가는 급격한 변화가 없이 완만하게 변하는 사인파 음성 파형의 특징을 이용한 것으로, 현재 음성 데이터와 바로 이전 음성 데이터의 차를 구해서 그 결과가 (+)이면 증가하는 방향, (-)이면 감소하는 방향으로 정의한다.
다음에, 상기한 벡터 정보는 키 재동기 정보와 함께 음성 데이터를 삭제한 구간에 삽입되어 키 재동기 프레임을 생성하고(S133), 생성된 키 재동기 프레임을 전송한다(S134).
만약 키 재동기 시점이 아니면(N), 음성 데이터를 이용해 음성 프레임을 생성하고(S140), 이전 프레임과 현재 프레임의 음성 데이터를 분석하여(S141) 벡터 정보를 구성하고(S142), 이를 송신측 내부 메모리(미도시)에 저장한다. 그리고 생성된 음성 프레임을 전송한다(S143).
도 3은 본 발명의 일실시예에 따른 키 재동기 구간의 음성 데이터 예측을 위한 음성 데이터 수신 방법을 설명하는 순서도이다.
도 3을 참조하면, 먼저 수신측(20)의 프레임 수신부(21)가 송신측(10)에서 전송되는 프레임을 수신하고(S200), 프레임 분석부(22)가 수신된 프레임의 헤더를 분석하여 프레임의 종류를 파악한다(S210).
분석 결과, 수신한 프레임이 키 재동기 프레임이면(Y), 수신한 프레임으로부터 키 재동기 정보와 음성의 변화 방향(+, -) 에 대한 벡터 정보를 추출한다(S230).
다음에, 추출된 키 재동기 정보를 이용해서 키 재동기를 수행하고(S231), 기 수신된 프레임의 음성 데이터들로부터 추출한 기울기 정보와 벡터 정보를 분석하여 기울기와 벡터 정보에 따른 음성의 변화 방향이 같은 방향인지 판단한다(S232).
판단 결과, 수신측 내부 메모리(미도시)에 저장되어 있는 기 수신된 프레임의 음성 데이터들로부터 추출한 기울기의 변화율과 음성 변화 방향(+, -)이 같은 방향이면(Y), 수신측 내부 메모리(미도시)에 저장되어 있는 기 수신된 프레임의 음성 데이터들로부터 추출한 기울기 선보다 감소한 새로운 기울기 선상에서 묵음 구간의 음성 데이터 값을 추출한다(S233).
만약 그렇지 않으면, 기 수신된 프레임의 음성 데이터들로부터 추출한 기울기 변화율을 이용하여 기울기가 증가한 새로운 기울기 선을 구하고, 구한 선상에서 묵음 구간의 음성 데이터 값을 추출한다(S234).
추출된 묵음 구간의 음성 데이터 값은 보코더(23)에서의 보코딩(S235)을 통해서 음성으로 출력한다(S236).
한편, 분석 결과(S220), 수신한 프레임이 키 재동기 프레임이 아니면(N), 보코딩을 통해서 수신한 음성 데이터를 음성화한다(S240).
다음에, 수신측 내부 메모리(미도시)에 저장되어 있는 이전 프레임의 음성 데이터와 현재 프레임의 음성 데이터를 이용하여 두 점을 잇는 기울기를 구하고(S241), 기존 기울기 값과 현재의 기울기 값을 이용하여 기울기 변화율을 계산하여(S242), 현재 프레임을 다음에 사용하기 위해서 수신측 내부 메모리(미도시)에 저장한다(S243). 그리고, 음성화된 수신 데이터는 실제 음성으로 출력된다(S244).
따라서, 수신측(10)에서는 기 수신된 음성 프레임들의 음성 데이터 값의 변화비율인 기울기와 기울기의 변화율 그리고 추출한 음성 데이터의 음성 변화 방향 정보, 즉 벡터 정보를 이용함으로써 단반향 무선 통신 환경에서 키 재동기 시에 발생하는 묵음 구간의 음성 데이터 값을 원음에 가깝게 예측가능해진다.
도 4는 도 1에 따른 음성 데이터 송수신 장치에 있어서, 키 재동기 구간의 음성 데이터 값을 계산하는 과정을 개략적으로 도시한 도면으로, 도 4a는 송신부에서 벡터 정보를 계산하여 삽입하는 것을 나타내고, 도 4b는 수신부에서 벡터 정보를 추출하여 키 재동기 구간의 음성 데이터 값을 예측하는 과정을 예를 들어 설명하기 위한 예시도이다.
우선, 5번 및 8번이 키 재동기 시점에 해당되는 것으로 가정한다.
송신부(10)에서는 사인파 음성 파형을 부호화하는 과정에서 키 재동기 시점이 되면(S110과 S120), 키 재동기 시점에 해당하는 구간인 5번, 8번의 음성 데이터는 삭제되고, 키 재동기 정보로 치환된다.
5번 음성 데이터는 4번 음성 데이터의 차를 이용해서 구한 음성의 변화 방향(+)과, 키 재동기 정보 X로 치환된다. 마찬가지로, 11번 음성 데이터는 10번 음성 데이터와의 차를 이용해서 구한 음성의 변화 방향(-)과, 키 재동기 정보 Y로 치환된다. 이렇게 재구성된 데이터가 수신부(20)로 전달된다.
이에 대해, 수신부(20)에서는 5번에 해당하는 키 재동기 데이터가 도착하면 2번(L), 3번(M) 음성 데이터를 이용해서 구한 기울기 값(A 선)과 3번(M), 4번(N) 음성 데이터를 이용해서 구한 기울기 값(B 선)을 이용하여 기울기의 감소 비율을 구한 후 이 감소 비율을 이용하여 새로운 값(C 선)을 계산해 낸다. 그리고 이 값(C 선의 기울기)이 수신한 프레임 내의 음성 방향(+) 정보와 동일하므로 C 선상에 위치하는 음성 데이터 값(O)을 추출한다. 이 과정의 한 예는 다음과 같다.
Figure 112007043952239-pat00001
여기서, My, Ly, Ny는 도 4의 M, L, N 점의 y좌표 값이고, Mx, Lx, Nx는 도 4의 M, L, N 점의 x좌표 값이다.
8번에 해당하는 키 재동기 데이터가 도착하면 5번(O), 6번(P) 음성 데이터를 이용해서 구한 기울기 값(C 선)과, 6번(P), 7번(Q) 음성 데이터를 이용해서 구한 기울기 값(D 선)을 이용하여 기울기의 증가 비율을 구한 후 이 증가 비율을 이용하여 새로운 값(E 선)을 계산해 낸다. 그러나 이 값이 수신한 프레임 내의 음성 방향(-) 정보와 반대이므로 대칭이 되는 선 F 선상에서 음성 데이터 값(R)을 추출한다. 이 과정의 한 예는 다음과 같다.
Figure 112007043952239-pat00002
여기서, Py, Oy, Qy는 도 4의 P, O, Q 점의 y좌표 값이고, Px, Ox, Qx는 도 4의 P, O, Q 점의 x좌표 값이다.
구체적으로, 8번 같은 경우는 이전 음성 데이터(C, D 선)로부터 계산된 기울기 값의 비율(+)과 8번의 음성 방향(-) 정보가 다르기 때문에 E선과 대칭이 되는 F선을 계산한 후 이 F 선상에서 음성 데이터 값을 추출한다.
이상에서 몇 가지 실시예를 들어 본 발명을 더욱 상세하게 설명하였으나, 본 발명은 반드시 이러한 실시예로 국한되는 것이 아니고 본 발명의 기술사상을 벗어나지 않는 범위 내에서 다양하게 변형실시될 수 있다.
이상에서와 같이, 본 발명에 따르면 완만한 변화를 보이는 음성 데이터 값의 특징을 이용하여 단방향 무선환경에서 주기적인 키 재동기에 의한 묵음구간의 음성 데이터 값을 유사하게 예측하여 수신단에서의 통화품질을 향상시킬 수 있다.
또한, 본 발명은 음성을 보정하기 위한 추가적인 정보 전송이 많지 않고, 기존 방식에 비해 적은 계산량을 요구하므로 시스템에 추가의 부하를 주지 않는다.

Claims (13)

  1. 삭제
  2. 삭제
  3. 음성 데이터를 입력받는 입력부;
    상기 입력된 음성 데이터를 부호화하는 보코더;
    상기 부호화된 음성 데이터에 대해 키 재동기 정보가 없을 경우에 현재 프레임과 이전 프레임의 음성 데이터를 분석하여 기울기 및 기울기 변화율 증감 방향을 포함하는 벡터 정보를 삽입하여 음성 프레임을 생성하고, 상기 부호화된 음성 데이터에 대해 키 재동기 정보가 있을 경우에 현재 프레임의 음성 데이터를 제거하고 이전 프레임의 음성 데이터를 분석하여 상기 제거된 음성 데이터 영역에 이전 프레임의 벡터 정보를 삽입하여 키 재동기 프레임을 생성하는 벡터 정보 삽입부를 구비하는 프레임 생성부; 및
    상기 생성된 프레임을 수신부로 전송하는 프레임 전송부
    를 포함하는 것을 특징으로 하는 키 재동기 구간의 음성 데이터 예측을 위한 음성 데이터 송신 장치.
  4. 전송되는 프레임을 수신하는 프레임 수신부;
    상기 수신한 프레임에 키 재동기 정보가 없을 경우에 수신한 현재 프레임과 이전 프레임의 음성 데이터를 이용하여 기울기를 구하고, 이미 저장된 이전 기울기 값과의 비교를 통해 기울기 변화율을 계산하여 저장하고, 상기 수신한 프레임에 키 재동기 정보가 있을 경우에 수신한 프레임에 포함된 벡터 정보에서 추출된 기울기와 이전 프레임의 음성 데이터로부터 추출된 기울기를 비교하여 상기 기울기 변화율의 증감 방향과 동일한지 여부를 판단하여 음성 데이터를 구성하는 음성 데이터 예측부를 구비하는 프레임 분석부;
    상기 음성 데이터를 보코딩하여 음성화하는 보코더; 및
    상기 음성화된 음성을 출력하는 출력부
    를 포함하는 것을 특징으로 하는 키 재동기 구간의 음성 데이터 예측을 위한 음성 데이터 수신 장치.
  5. 삭제
  6. 제4항에 있어서,
    상기 기울기 변화율의 증감 방향이 동일할 경우에는 상기 추출한 음성 데이터의 기울기 변화율 선상에서 음성 데이터 값을 취하며, 상기 기울기 변화율의 증감 방향이 다를 경우에는 상기 추출한 음성 데이터의 기울기 변화율 선과 대칭이 되는 기울기를 구하여 음성 데이터 값을 취하는 것을 특징으로 하는 키 재동기 구간의 음성 데이터 예측을 위한 음성 데이터 수신 장치.
  7. 입력받은 음성 데이터를 부호화하는 단계;
    상기 부호화된 음성 데이터에 대해 키 재동기 정보가 없을 경우에 현재 프레임과 이전 프레임의 음성 데이터를 분석하여 기울기 및 기울기 변화율 증감 방향을 포함하는 벡터 정보를 삽입하여 음성 프레임을 생성하고, 상기 부호화된 음성 데이터에 대해 키 재동기 정보가 있을 경우에 현재 프레임의 음성 데이터를 제거하고 이전 프레임의 음성 데이터를 분석하여 상기 제거된 음성 데이터 영역에 이전 프레임의 벡터 정보를 삽입하여 키 재동기 프레임을 생성하는 단계; 및
    상기 생성된 프레임을 전송하는 단계
    를 포함하는 것을 특징으로 하는 키 재동기 구간의 음성 데이터 예측을 위한 음성 데이터 송신 방법.
  8. 삭제
  9. 수신되는 프레임의 헤더를 분석하여 키 재동기 정보를 포함하는지 여부를 판단하는 단계;
    상기 수신한 프레임에 키 재동기 정보가 없을 경우에 수신한 현재 프레임과 이전 프레임의 음성 데이터를 이용하여 기울기를 구하고, 이미 저장된 이전 기울기 값과의 비교를 통해 기울기 변화율을 계산하여 저장하고, 상기 수신한 프레임에 키 재동기 정보가 있을 경우에 수신한 프레임에 포함된 벡터 정보에서 추출된 기울기와 이전 프레임의 음성 데이터로부터 추출된 기울기를 비교하여 상기 기울기 변화율의 증감 방향과 동일한지 여부를 판단하여 음성 데이터를 구성하는 단계; 및
    상기 음성 데이터를 보코딩하여 음성화하고, 상기 음성화된 음성을 출력하는 단계
    를 포함하는 것을 특징으로 하는 키 재동기 구간의 음성 데이터 예측을 위한 음성 데이터 수신 방법.
  10. 삭제
  11. 삭제
  12. 제9항에 있어서,
    상기 기울기 변화율의 증감 방향이 동일할 경우에는 상기 추출한 음성 데이터의 기울기 변화율 선상에서 음성 데이터 값을 취하며, 상기 기울기 변화율의 증감 방향이 다를 경우에는 상기 추출한 음성 데이터의 기울기 변화율 선과 대칭이 되는 기울기를 구하여 음성 데이터 값을 취하는 것을 특징으로 하는 키 재동기 구간의 음성 데이터 예측을 위한 음성 데이터 수신 방법.
  13. 삭제
KR1020070059545A 2007-06-18 2007-06-18 키 재동기 구간의 음성 데이터 예측을 위한 음성 데이터송수신 장치 및 방법 KR100906766B1 (ko)

Priority Applications (5)

Application Number Priority Date Filing Date Title
KR1020070059545A KR100906766B1 (ko) 2007-06-18 2007-06-18 키 재동기 구간의 음성 데이터 예측을 위한 음성 데이터송수신 장치 및 방법
AT08102518T ATE452400T1 (de) 2007-06-18 2008-03-12 Vorrichtung und verfahren zum senden/empfangen von sprachdaten zur schätzung eines sprachdatenwertes entsprechend einem neusynchronisationszeitraum
EP08102518A EP2006838B1 (en) 2007-06-18 2008-03-12 Apparatus and method for transmitting/receiving voice data to estimate a voice data value corresponding to a resynchronization period
DE602008000406T DE602008000406D1 (de) 2007-06-18 2008-03-12 Vorrichtung und Verfahren zum Senden/Empfangen von Sprachdaten zur Schätzung eines Sprachdatenwertes entsprechend einem Neusynchronisationszeitraum
US12/048,349 US20080312936A1 (en) 2007-06-18 2008-03-14 Apparatus and method for transmitting/receiving voice data to estimate voice data value corresponding to resynchronization period

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020070059545A KR100906766B1 (ko) 2007-06-18 2007-06-18 키 재동기 구간의 음성 데이터 예측을 위한 음성 데이터송수신 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20080111311A KR20080111311A (ko) 2008-12-23
KR100906766B1 true KR100906766B1 (ko) 2009-07-09

Family

ID=39406129

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070059545A KR100906766B1 (ko) 2007-06-18 2007-06-18 키 재동기 구간의 음성 데이터 예측을 위한 음성 데이터송수신 장치 및 방법

Country Status (5)

Country Link
US (1) US20080312936A1 (ko)
EP (1) EP2006838B1 (ko)
KR (1) KR100906766B1 (ko)
AT (1) ATE452400T1 (ko)
DE (1) DE602008000406D1 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9576593B2 (en) * 2012-03-15 2017-02-21 Regents Of The University Of Minnesota Automated verbal fluency assessment
KR101383070B1 (ko) * 2012-11-19 2014-04-08 한국전자통신연구원 3g 이동통신망에서의 음성 데이터 보호 장치 및 방법
CN112802485B (zh) * 2021-04-12 2021-07-02 腾讯科技(深圳)有限公司 语音数据处理方法、装置、计算机设备及存储介质
CN117131528B (zh) * 2023-09-04 2024-03-08 苏州派博思生物技术有限公司 Oem信息定制方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1987003127A1 (en) 1985-11-08 1987-05-21 John Marley System and method for sound recognition with feature selection synchronized to voice pitch
KR960706244A (ko) * 1993-11-19 1996-11-08 카.엘러 · 에프.브레데 음성 전송시 음성 부호 및 음성 해독의 방법 및 장치
KR20020063665A (ko) * 2001-01-30 2002-08-05 이태성 피치 단위 데이터 분석을 이용한 음성인식 방법 및 시스템
KR20050005517A (ko) * 2002-05-31 2005-01-13 보이세지 코포레이션 선형 예측 기반 음성 코덱에서 효율적인 프레임 소거 은폐방법 및 장치
US20050157705A1 (en) 2004-01-21 2005-07-21 Stefano Galetto Determination of speech latency across a telecommunication network element

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3585971B2 (ja) * 1994-12-21 2004-11-10 富士通株式会社 音声符号器および復号器の同期装置
FI971959A (fi) * 1997-05-07 1998-11-08 Nokia Telecommunications Oy Menetelmä tahdistumisvirheen poistamiseksi sekä radiojärjestelmä
KR100322015B1 (ko) * 1998-12-23 2002-03-08 윤종용 근거리 통신망에서 프레임 구조 가변방법
GB2364203B (en) * 2000-06-27 2004-03-17 Nokia Mobile Phones Ltd Synchronisation
FR2813722B1 (fr) * 2000-09-05 2003-01-24 France Telecom Procede et dispositif de dissimulation d'erreurs et systeme de transmission comportant un tel dispositif
GB2388739B (en) * 2001-11-03 2004-06-02 Dremedia Ltd Time ordered indexing of an information stream
US7394833B2 (en) * 2003-02-11 2008-07-01 Nokia Corporation Method and apparatus for reducing synchronization delay in packet switched voice terminals using speech decoder modification
EP1898397B1 (en) * 2005-06-29 2009-10-21 Panasonic Corporation Scalable decoder and disappeared data interpolating method
US8620644B2 (en) * 2005-10-26 2013-12-31 Qualcomm Incorporated Encoder-assisted frame loss concealment techniques for audio coding
US7457746B2 (en) * 2006-03-20 2008-11-25 Mindspeed Technologies, Inc. Pitch prediction for packet loss concealment
US9083994B2 (en) * 2006-09-26 2015-07-14 Qualcomm Incorporated Method and system for error robust audio playback time stamp reporting
EP1921608A1 (en) * 2006-11-13 2008-05-14 Electronics And Telecommunications Research Institute Method of inserting vector information for estimating voice data in key re-synchronization period, method of transmitting vector information, and method of estimating voice data in key re-synchronization using vector information
US7912149B2 (en) * 2007-05-03 2011-03-22 General Motors Llc Synchronization and segment type detection method for data transmission via an audio communication system

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1987003127A1 (en) 1985-11-08 1987-05-21 John Marley System and method for sound recognition with feature selection synchronized to voice pitch
KR960706244A (ko) * 1993-11-19 1996-11-08 카.엘러 · 에프.브레데 음성 전송시 음성 부호 및 음성 해독의 방법 및 장치
KR20020063665A (ko) * 2001-01-30 2002-08-05 이태성 피치 단위 데이터 분석을 이용한 음성인식 방법 및 시스템
KR20050005517A (ko) * 2002-05-31 2005-01-13 보이세지 코포레이션 선형 예측 기반 음성 코덱에서 효율적인 프레임 소거 은폐방법 및 장치
US20050157705A1 (en) 2004-01-21 2005-07-21 Stefano Galetto Determination of speech latency across a telecommunication network element

Also Published As

Publication number Publication date
EP2006838B1 (en) 2009-12-16
DE602008000406D1 (de) 2010-01-28
KR20080111311A (ko) 2008-12-23
ATE452400T1 (de) 2010-01-15
US20080312936A1 (en) 2008-12-18
EP2006838A1 (en) 2008-12-24

Similar Documents

Publication Publication Date Title
EP0768770B1 (fr) Procédé et dispositif de création d&#39;un bruit de confort dans un système de transmission numérique de parole
US8320391B2 (en) Acoustic signal packet communication method, transmission method, reception method, and device and program thereof
US11211077B2 (en) Audio coding device, audio coding method, audio coding program, audio decoding device, audio decoding method, and audio decoding program
JP5123516B2 (ja) 復号装置、符号化装置、復号方法及び符号化方法
JP2019066868A (ja) 音声符号化装置および方法
US9123328B2 (en) Apparatus and method for audio frame loss recovery
JP6335190B2 (ja) 低ビットレートで背景ノイズをモデル化するためのコンフォートノイズ付加
JP2707564B2 (ja) 音声符号化方式
US20090043569A1 (en) Pitch prediction for use by a speech decoder to conceal packet loss
KR100906766B1 (ko) 키 재동기 구간의 음성 데이터 예측을 위한 음성 데이터송수신 장치 및 방법
JP4287637B2 (ja) 音声符号化装置、音声符号化方法及びプログラム
KR100792209B1 (ko) 디지털 오디오 패킷 손실을 복구하기 위한 방법 및 장치
KR100902112B1 (ko) 키 재동기 구간의 음성 데이터를 예측하기 위한 벡터 정보삽입 방법, 전송 방법 및 벡터 정보를 이용한 키 재동기구간의 음성 데이터 예측 방법
US20090059964A1 (en) Apparatus and method for synchronizing time information using key re-synchronization frame in encryption communications
JP4564985B2 (ja) キー再同期区間の音声データを見積もるためのベクトル情報の挿入方法、ベクトル情報伝送方法、およびベクトル情報を用いたキー再同期区間の音声データ見積り方法
JP4536621B2 (ja) 復号装置、および復号方法
KR100594599B1 (ko) 수신단 기반의 패킷 손실 복구 장치 및 그 방법
JP2007104167A (ja) 送話状態判定方法
JP6079230B2 (ja) 付加情報挿入装置、付加情報挿入方法、付加情報挿入プログラム、付加情報抽出装置、付加情報抽出方法、及び付加情報抽出プログラム
JP2002099299A (ja) 無音圧縮音声符号化復号化装置
Bhoyar et al. A Study of LPC: Speech Coding Compression Method
JP2005109680A (ja) データ再生装置およびデータ再生方法
JP2011103679A (ja) 送話状態判定方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130628

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20140630

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20150703

Year of fee payment: 7

LAPS Lapse due to unpaid annual fee