KR100532988B1

KR100532988B1 - 핸드 피씨의 음성재생기

Info

Publication number: KR100532988B1
Application number: KR1019980052830A
Authority: KR
Inventors: 여수진
Original assignee: 엘지전자 주식회사
Priority date: 1998-12-03
Filing date: 1998-12-03
Publication date: 2006-02-28
Also published as: KR20000037992A

Abstract

본 발명은 핸드 피씨의 음성재생기에 관한 것으로, 종래 피씨엠 음원 방식을 이용하여 음성을 녹음하는 핸드 피씨에 있어서 음성 메모 파일의 크기를 최소화하기 위하여 압축 알고리즘을 사용함으로써, 압축 능력은 뛰어나지만 알고리즘이 복잡하여 핸드 피씨에 적용시 압축 효율에 비해 메모리의 소모가 심해 음성 녹음 시간이 짧은 문제점이 있었다. 따라서, 본 발명은 상기와 같은 종래의 문제점을 해결하기 위하여 창안한 것으로, 외부 소리를 전기적인 음성신호로 변환하는 입력부와; 음성 신호를 소리로 변환하여 출력하는 출력부와; 상기 입력부의 음성신호를 피씨엠 음원 처리하여 피씨엠 데이터로 변환하여 출력하거나 피씨엠 데이터를 음성신호로 변환하여 상기 출력부로 출력하는 피씨엠 음원부와; 상기 피씨엠 음원부의 피씨엠 데이터를 코드화하여 메모리에 저장하는 엔코딩부와; 상기 메모리에 저장된 코드화된 데이터를 피씨엠 데이터로 디코딩하는 디코딩부로 구성한 장치를 제공하여 음원 모델을 만들기 위해 사용되는 음원 여기 신호의 파형을 성문의 개폐에 따라 분석하는 간단한 음성 압축 알고리즘을 이용하여 음성 메모 파일의 크기를 최소화함으로써, 음질의 저하없이 음성 녹음 시간을 연장시켜 메모리의 활용도를 극대화하는 효과가 있다.

Description

핸드 피씨의 음성재생기

본 발명은 핸드 피씨의 음성재생기에 관한 것으로, 특히 핸드 피씨의 음성 처리에 있어서 음원 모델을 만들기 위해 사용되는 음원 여기 신호의 파형을 성문의 개폐에 따라 분석하는 간단한 음성 압축 알고리즘을 이용하여 음성 메모 파일의 크기를 최소화한 핸드 피씨의 음성재생기에 관한 것이다.

요즘 핸드 피씨(Handheld PC)는 윈도우즈(WINDOWS CE) 운영 시스템에서 동작함에 따라 휴대성과 고품질의 프로그램을 제공하여 그 사용 범위가 넓어지고 있으며, 특히 기본적으로 제공되는 프로그램들중 모빌 보이스(Mobile Voice) 또는 피씨엠(PCM : Pulse Code Modulation)음원 방식으로 음성을 녹음하여 재생하는 음성재생기(Voice Recorder)가 많이 사용되고 있다.

여기서, 상기 모빌 보이스는 파일의 크기가 작아 메모리의 이용도는 높으나 음질이 나빠서 조용한 환경이 아닌 경우에는 거의 사용이 불가능함에 따라 사용자들은 피씨엠 음원 방식을 주로 사용하고 있으나, 상기 피씨엠의 경우 좋은 음질을 제공하는 반면 파일의 크기가 상기 모빌 보이스에 비해 상대적으로 약 50배정도 커서 메모리의 이용도가 떨어진다.

그러므로, 음성 메모 파일의 크기가 큰 피씨엠 음원 방식을 사용하는 경우, 핸드 피씨의 메모리의 한계로 녹음 시간에 제약을 받게 되므로, 이로 인한 상기 음성 메모 파일의 크기를 압축하는 기술이 사용된다.

따라서, 상기 핸드 피씨는 음성의 로우 비트 레이트 코딩(Low Bit Rate Coding)등을 이용한 음성 압축 기술을 사용하여 사용되는 음성 메모 파일의 크기를 줄이고 있다.

또한, 음성을 이용한 인간과 기계 사이의 인터페이스(MMI)가 획기적으로 발전하면서 음성 코딩 기술도 많은 발전을 하고 있다.

상기와 같이 종래 피씨엠 음원 방식을 이용하여 음성을 녹음하는 핸드 피씨에 있어서 음성 메모 파일의 크기를 최소화하기 위하여 압축 알고리즘을 사용함으로써, 압축 능력은 뛰어나지만 알고리즘이 복잡하여 핸드 피씨에 적용시 압축 효율에 비해 메모리의 소모가 심해 음성 녹음 시간이 짧은 문제점이 있었다.

따라서, 본 발명은 상기와 같은 종래의 문제점을 해결하기 위하여 창안한 것으로, 음원 모델을 만들기 위해 사용되는 음원 여기 신호의 파형을 성문의 개폐에 따라 분석하는 간단한 음성 압축 알고리즘을 이용하여 음성 메모 파일의 크기를 최소화한 핸드 피씨의 음성재생기를 제공함에 그 목적이 있다.

상기와 같은 목적을 달성하기 위한 본 발명의 구성은 외부 소리를 전기적인 음성신호로 변환하는 입력부와; 음성 신호를 소리로 변환하여 출력하는 출력부와; 상기 입력부의 음성신호를 피씨엠 음원 처리하여 피씨엠 데이터로 변환하여 출력하거나 피씨엠 데이터를 음성신호로 변환하여 상기 출력부로 출력하는 피씨엠 음원부와; 상기 피씨엠 음원부의 피씨엠 데이터를 코드화하여 메모리에 저장하는 엔코딩부와; 상기 메모리에 저장된 코드화된 데이터를 피씨엠 데이터로 디코딩하는 디코딩부로 구성하여 된 것을 특징으로 한다.

상기 엔코딩부의 구성은 피씨엠 데이터를 입력받아 성문이 닫힌 구간에서 선형 예측 계수를 계산하는 선형 예측 계수부와; 상기 피씨엠 데이터를 상기 선형 예측 계수를 이용하여 역성도 필터링하는 역성도필터와; 상기 역성도필터의 출력데이터를 입력받아 성문이 닫힌 구간을 생략하여 출력하는 데이터 생략부로 구성하여 된 것을 특징으로 한다.

상기 디코딩부의 구성은 성문이 닫힌 구간이 생략된 데이터를 입력받아 이를 보상하여 출력하는 데이터 보상부와; 데이터 보상부의 출력데이터를 선형 예측 계수를 이용하여 성도필터링하여 피씨엠 데이터를 출력하는 성도필터로 구성하여 된 것을 특징으로 한다.

이하, 본 발명에 따른 일실시예에 대한 동작과 작용효과를 첨부한 도면을 참조하여 상세히 설명하면 다음과 같다.

도 1은 본 발명 핸드 피씨의 음성재생기의 구성을 보인 블록도로서, 이에 도시한 바와 같이 외부 소리를 전기적인 음성신호(VS)로 변환하는 입력부(10)와; 음성 신호(VS)를 외부로 출력하는 출력부(20)와; 상기 입력부(10)의 음성신호(VS)를 피씨엠 음원 처리하여 피씨엠 데이터(PCM)로 변환하여 출력하고, 상기 피씨엠 데이터(PCM)를 음성신호(VS)로 변환하여 상기 출력부(20)로 출력하는 피씨엠 음원부(30)와; 상기 피씨엠 음원부(30)의 피씨엠 데이터(PCM)를 코드화하여 메모리(60)에 저장하는 엔코딩부(40)와; 상기 메모리(60)에 저장된 코드화된 데이터(MRS)를 피씨엠 데이터(PCM)로 디코딩하는 디코딩부(50)로 구성한다.

상기 엔코딩부(40)는 도 2에 도시한 바와 같이 피씨엠 데이터(PCM)를 입력받아 성문이 닫힌 구간에서 선형 예측 계수(LPC)를 계산하는 선형 예측 계수부(41)와; 상기 피씨엠 데이터(PCM)를 상기 선형 예측 계수(LPC)를 이용하여 역성도필터링하는 역성도필터(42)와; 상기 역성도필터(42)의 출력데이터(RS)를 입력받아 성문이 닫힌 구간을 생략하여 출력하는 데이터 생략부(43)로 구성한다.

상기 디코딩부(50)는 도 3에 도시한 바와 같이 성문이 닫힌 구간이 생략된 데이터(MRS)를 입력받아 이를 보상하여 출력하는 데이터 보상부(51)와; 데이터 보상부(51)의 출력데이터(RS)를 상기 선형 예측 계수부(41)의 선형 예측 계수(LPC)를 이용하여 성도필터링하여 피씨엠 데이터(PCM)를 출력하는 성도필터(52)로 구성하며, 이와 같이 구성한 본 발명에 따른 동작과정을 첨부한 도 4를 참조하여 상세히 설명한다.

먼저, 외부 소리를 입력부(10)를 통해 전기적인 음성신호(VS)로 변환하여 출력함에 있어서 상기 음성신호(VS)가 구강을 통과하면서 고주파 성분이 감소되므로, 상기 입력부(10)는 상기 음성신호(VS)를 증폭하여 이를 보상을 하여 출력한다.

그리고, 상기 입력부(10)의 음성신호(VS)를 입력받은 피씨엠 음원부(30)는 이를 피씨엠 음원처리하여 피씨엠데이터(PCM)로 변환하여 엔코딩부(40)로 출력하면, 상기 엔코딩부(40)내 선형 예측 계수부(41)는 이를 인가받아 성문이 닫힌 구간에 해밍윈도우(Hamming Window)를 씌우고, 상기 해밍윈도우를 씌운 데이터에서 10차 공분산 연산하여 선형 예측 계수(LPC)를 구한다.

그리고, 상기 선형 예측 계수부(41)의 선형 예측 계수(LPC)를 이용하여 역성도 필터(42)를 구현하면, 상기 역성도 필터(42)는 상기 피씨엠 데이터(PCM)를 입력받아 이를 역성도 필터링하여 출력한다.

여기서, 상기 역성도필터(42)를 통해 출력되는 신호(RS)의 파형은 도 4와 같이 성문의 개폐에 따라 파형의 변화가 다르게 나타나므로, 성문이 닫히려는 구간 (가)는 0보다 작은 값에서 증가를 하고, 성문이 닫힌 구간 (나)에서는 거의 0으로 나타나고, 성문이 열린 구간 (다)에서는 다시 증가했다가 감소하는 모양을 나타낸다.

따라서, 상기 역성도필터(42)의 출력신호(RS)를 입력받은 데이터 생략부(43)는 상기 역성도필터(42)의 출력신호(RS)에서 거의 정보를 가지고 있지 않는 성문이 닫힌 구간(도 4의 구간 (나))을 생략한 후, 선형 예측 계수(LPC)와 닫힌 구간이 생략된 여기신호 및 닫힌 구간의 위치를 메모리(60)에 저장한다.

그러므로, 상기와 같이 음성 메모 파일에 원래의 음성을 그대로 저장하는 것보다 선형 예측 계수(LPC)와 닫힌 구간이 생략된 여기신호, 닫힌 구간의 위치를 저장하면 파일의 크기를 줄일 수 있다.

그 후, 상기 메모리(60)에 저장된 데이터를 출력하고 하는 경우, 상기 메모리(60)에 각 프레임별로 저장된 선형 예측 계수(LPC)와 여기신호, 닫힌 구간의 위치를 입력받은 디코딩부(50)는 데이터 보상부(51)에서 우선 닫힌 구간(도 4의 구간(나))이 생략된 여기 신호에 상기 해당 구간에 0을 삽입하여 생략된 부분을 보상한다.

그리고, 상기 선형 예측 계수(LPC)를 이용하여 성도 필터(52)를 구현하면, 상기 성도필터(52)는 상기 데이터 보상부(51)의 출력신호(RS)를 입력받아 피씨엠 데이터(PCM)로 변환하여 출력한다.

그리고, 상기 디코딩부(50)의 출력신호(PCM)를 입력받은 피씨엠 음원부(30)는 이를 음성신호(VS)로 변환하여 출력하고, 이를 입력받은 출력부(20)는 이를 외부로 출력한다.

상기에서 상세히 설명한 바와 같이, 본 발명은 음원 모델을 만들기 위해 사용되는 음원 여기 신호의 파형을 성문의 개폐에 따라 분석하는 간단한 음성 압축 알고리즘을 이용하여 음성 메모 파일의 크기를 최소화함으로써, 음질의 저하없이 음성 녹음시간을 연장시켜 메모리의 활용도를 극대화하는 효과가 있다.

도 1은 본 발명 핸드 피씨의 음성재생기의 구성을 보인 블록도.

도 2는 도 1에서 엔코딩부의 구성을 보인 블록도.

도 3은 도 1에서 디코딩부의 구성을 보인 블록도.

도 4는 도 2에서 역성도 필터의 출력 파형도.

***도면의 주요 부분에 대한 부호의 설명***

10 : 입력부 20 : 출력부

30 : 피씨엠 음원부 40 : 엔코딩부

41 : 선형 예측 계수부 42 : 역성도필터

43 : 데이터 생략부 50 : 디코딩부

51 : 데이터 보상부 52 : 성도필터

60 : 메모리

Claims

외부 소리를 전기적인 음성신호로 변환하는 입력부와; 음성 신호를 소리로 변환하여 출력하는 출력부와; 상기 입력부의 음성신호를 피씨엠 음원 처리하여 피씨엠 데이터로 변환하여 출력하거나 피씨엠 데이터를 음성신호로 변환하여 상기 출력부로 출력하는 피씨엠 음원부와; 상기 피씨엠 음원부의 피씨엠 데이터를 코드화하여 메모리에 저장하는 엔코딩부와; 상기 메모리에 저장된 코드화된 데이터를 피씨엠 데이터로 디코딩하는 디코딩부로 구성하여 된 것을 특징으로 하는 핸드 피씨의 음성재생기.
제1항에 있어서, 엔코딩부는 피씨엠 데이터를 입력받아 성문이 닫힌 구간에서 선형 예측 계수를 계산하는 선형 예측 계수부와; 상기 피씨엠 데이터를 상기 선형 예측 계수를 이용하여 역성도필터링하는 역성도필터와; 상기 역성도필터의 출력데이터를 입력받아 성문이 닫힌 구간을 생략하여 출력하는 데이터 생략부로 구성하여 된 것을 특징으로 하는 핸드 피씨의 음성재생기.
제1항에 있어서, 상기 디코딩부는 성문이 닫힌 구간이 생략된 데이터를 입력받아 이를 보상하여 출력하는 데이터 보상부와; 데이터 보상부의 출력데이터를 선형 예측 계수를 이용하여 성도필터링하여 피씨엠 데이터를 출력하는 성도필터로 구성하여 된 것을 특징으로 하는 핸드 피씨의 음성재생기.