KR100532988B1 - 핸드 피씨의 음성재생기 - Google Patents

핸드 피씨의 음성재생기 Download PDF

Info

Publication number
KR100532988B1
KR100532988B1 KR1019980052830A KR19980052830A KR100532988B1 KR 100532988 B1 KR100532988 B1 KR 100532988B1 KR 1019980052830 A KR1019980052830 A KR 1019980052830A KR 19980052830 A KR19980052830 A KR 19980052830A KR 100532988 B1 KR100532988 B1 KR 100532988B1
Authority
KR
South Korea
Prior art keywords
data
voice
unit
signal
sound source
Prior art date
Application number
KR1019980052830A
Other languages
English (en)
Other versions
KR20000037992A (ko
Inventor
여수진
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to KR1019980052830A priority Critical patent/KR100532988B1/ko
Publication of KR20000037992A publication Critical patent/KR20000037992A/ko
Application granted granted Critical
Publication of KR100532988B1 publication Critical patent/KR100532988B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/1613Constructional details or arrangements for portable computers
    • G06F1/1633Constructional details or arrangements of portable computers not specific to the type of enclosures covered by groups G06F1/1615 - G06F1/1626
    • G06F1/1684Constructional details or arrangements related to integrated I/O peripherals not covered by groups G06F1/1635 - G06F1/1675
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0018Speech coding using phonetic or linguistical decoding of the source; Reconstruction using text-to-speech synthesis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computer Hardware Design (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 핸드 피씨의 음성재생기에 관한 것으로, 종래 피씨엠 음원 방식을 이용하여 음성을 녹음하는 핸드 피씨에 있어서 음성 메모 파일의 크기를 최소화하기 위하여 압축 알고리즘을 사용함으로써, 압축 능력은 뛰어나지만 알고리즘이 복잡하여 핸드 피씨에 적용시 압축 효율에 비해 메모리의 소모가 심해 음성 녹음 시간이 짧은 문제점이 있었다. 따라서, 본 발명은 상기와 같은 종래의 문제점을 해결하기 위하여 창안한 것으로, 외부 소리를 전기적인 음성신호로 변환하는 입력부와; 음성 신호를 소리로 변환하여 출력하는 출력부와; 상기 입력부의 음성신호를 피씨엠 음원 처리하여 피씨엠 데이터로 변환하여 출력하거나 피씨엠 데이터를 음성신호로 변환하여 상기 출력부로 출력하는 피씨엠 음원부와; 상기 피씨엠 음원부의 피씨엠 데이터를 코드화하여 메모리에 저장하는 엔코딩부와; 상기 메모리에 저장된 코드화된 데이터를 피씨엠 데이터로 디코딩하는 디코딩부로 구성한 장치를 제공하여 음원 모델을 만들기 위해 사용되는 음원 여기 신호의 파형을 성문의 개폐에 따라 분석하는 간단한 음성 압축 알고리즘을 이용하여 음성 메모 파일의 크기를 최소화함으로써, 음질의 저하없이 음성 녹음 시간을 연장시켜 메모리의 활용도를 극대화하는 효과가 있다.

Description

핸드 피씨의 음성재생기
본 발명은 핸드 피씨의 음성재생기에 관한 것으로, 특히 핸드 피씨의 음성 처리에 있어서 음원 모델을 만들기 위해 사용되는 음원 여기 신호의 파형을 성문의 개폐에 따라 분석하는 간단한 음성 압축 알고리즘을 이용하여 음성 메모 파일의 크기를 최소화한 핸드 피씨의 음성재생기에 관한 것이다.
요즘 핸드 피씨(Handheld PC)는 윈도우즈(WINDOWS CE) 운영 시스템에서 동작함에 따라 휴대성과 고품질의 프로그램을 제공하여 그 사용 범위가 넓어지고 있으며, 특히 기본적으로 제공되는 프로그램들중 모빌 보이스(Mobile Voice) 또는 피씨엠(PCM : Pulse Code Modulation)음원 방식으로 음성을 녹음하여 재생하는 음성재생기(Voice Recorder)가 많이 사용되고 있다.
여기서, 상기 모빌 보이스는 파일의 크기가 작아 메모리의 이용도는 높으나 음질이 나빠서 조용한 환경이 아닌 경우에는 거의 사용이 불가능함에 따라 사용자들은 피씨엠 음원 방식을 주로 사용하고 있으나, 상기 피씨엠의 경우 좋은 음질을 제공하는 반면 파일의 크기가 상기 모빌 보이스에 비해 상대적으로 약 50배정도 커서 메모리의 이용도가 떨어진다.
그러므로, 음성 메모 파일의 크기가 큰 피씨엠 음원 방식을 사용하는 경우, 핸드 피씨의 메모리의 한계로 녹음 시간에 제약을 받게 되므로, 이로 인한 상기 음성 메모 파일의 크기를 압축하는 기술이 사용된다.
따라서, 상기 핸드 피씨는 음성의 로우 비트 레이트 코딩(Low Bit Rate Coding)등을 이용한 음성 압축 기술을 사용하여 사용되는 음성 메모 파일의 크기를 줄이고 있다.
또한, 음성을 이용한 인간과 기계 사이의 인터페이스(MMI)가 획기적으로 발전하면서 음성 코딩 기술도 많은 발전을 하고 있다.
상기와 같이 종래 피씨엠 음원 방식을 이용하여 음성을 녹음하는 핸드 피씨에 있어서 음성 메모 파일의 크기를 최소화하기 위하여 압축 알고리즘을 사용함으로써, 압축 능력은 뛰어나지만 알고리즘이 복잡하여 핸드 피씨에 적용시 압축 효율에 비해 메모리의 소모가 심해 음성 녹음 시간이 짧은 문제점이 있었다.
따라서, 본 발명은 상기와 같은 종래의 문제점을 해결하기 위하여 창안한 것으로, 음원 모델을 만들기 위해 사용되는 음원 여기 신호의 파형을 성문의 개폐에 따라 분석하는 간단한 음성 압축 알고리즘을 이용하여 음성 메모 파일의 크기를 최소화한 핸드 피씨의 음성재생기를 제공함에 그 목적이 있다.
상기와 같은 목적을 달성하기 위한 본 발명의 구성은 외부 소리를 전기적인 음성신호로 변환하는 입력부와; 음성 신호를 소리로 변환하여 출력하는 출력부와; 상기 입력부의 음성신호를 피씨엠 음원 처리하여 피씨엠 데이터로 변환하여 출력하거나 피씨엠 데이터를 음성신호로 변환하여 상기 출력부로 출력하는 피씨엠 음원부와; 상기 피씨엠 음원부의 피씨엠 데이터를 코드화하여 메모리에 저장하는 엔코딩부와; 상기 메모리에 저장된 코드화된 데이터를 피씨엠 데이터로 디코딩하는 디코딩부로 구성하여 된 것을 특징으로 한다.
상기 엔코딩부의 구성은 피씨엠 데이터를 입력받아 성문이 닫힌 구간에서 선형 예측 계수를 계산하는 선형 예측 계수부와; 상기 피씨엠 데이터를 상기 선형 예측 계수를 이용하여 역성도 필터링하는 역성도필터와; 상기 역성도필터의 출력데이터를 입력받아 성문이 닫힌 구간을 생략하여 출력하는 데이터 생략부로 구성하여 된 것을 특징으로 한다.
상기 디코딩부의 구성은 성문이 닫힌 구간이 생략된 데이터를 입력받아 이를 보상하여 출력하는 데이터 보상부와; 데이터 보상부의 출력데이터를 선형 예측 계수를 이용하여 성도필터링하여 피씨엠 데이터를 출력하는 성도필터로 구성하여 된 것을 특징으로 한다.
이하, 본 발명에 따른 일실시예에 대한 동작과 작용효과를 첨부한 도면을 참조하여 상세히 설명하면 다음과 같다.
도 1은 본 발명 핸드 피씨의 음성재생기의 구성을 보인 블록도로서, 이에 도시한 바와 같이 외부 소리를 전기적인 음성신호(VS)로 변환하는 입력부(10)와; 음성 신호(VS)를 외부로 출력하는 출력부(20)와; 상기 입력부(10)의 음성신호(VS)를 피씨엠 음원 처리하여 피씨엠 데이터(PCM)로 변환하여 출력하고, 상기 피씨엠 데이터(PCM)를 음성신호(VS)로 변환하여 상기 출력부(20)로 출력하는 피씨엠 음원부(30)와; 상기 피씨엠 음원부(30)의 피씨엠 데이터(PCM)를 코드화하여 메모리(60)에 저장하는 엔코딩부(40)와; 상기 메모리(60)에 저장된 코드화된 데이터(MRS)를 피씨엠 데이터(PCM)로 디코딩하는 디코딩부(50)로 구성한다.
상기 엔코딩부(40)는 도 2에 도시한 바와 같이 피씨엠 데이터(PCM)를 입력받아 성문이 닫힌 구간에서 선형 예측 계수(LPC)를 계산하는 선형 예측 계수부(41)와; 상기 피씨엠 데이터(PCM)를 상기 선형 예측 계수(LPC)를 이용하여 역성도필터링하는 역성도필터(42)와; 상기 역성도필터(42)의 출력데이터(RS)를 입력받아 성문이 닫힌 구간을 생략하여 출력하는 데이터 생략부(43)로 구성한다.
상기 디코딩부(50)는 도 3에 도시한 바와 같이 성문이 닫힌 구간이 생략된 데이터(MRS)를 입력받아 이를 보상하여 출력하는 데이터 보상부(51)와; 데이터 보상부(51)의 출력데이터(RS)를 상기 선형 예측 계수부(41)의 선형 예측 계수(LPC)를 이용하여 성도필터링하여 피씨엠 데이터(PCM)를 출력하는 성도필터(52)로 구성하며, 이와 같이 구성한 본 발명에 따른 동작과정을 첨부한 도 4를 참조하여 상세히 설명한다.
먼저, 외부 소리를 입력부(10)를 통해 전기적인 음성신호(VS)로 변환하여 출력함에 있어서 상기 음성신호(VS)가 구강을 통과하면서 고주파 성분이 감소되므로, 상기 입력부(10)는 상기 음성신호(VS)를 증폭하여 이를 보상을 하여 출력한다.
그리고, 상기 입력부(10)의 음성신호(VS)를 입력받은 피씨엠 음원부(30)는 이를 피씨엠 음원처리하여 피씨엠데이터(PCM)로 변환하여 엔코딩부(40)로 출력하면, 상기 엔코딩부(40)내 선형 예측 계수부(41)는 이를 인가받아 성문이 닫힌 구간에 해밍윈도우(Hamming Window)를 씌우고, 상기 해밍윈도우를 씌운 데이터에서 10차 공분산 연산하여 선형 예측 계수(LPC)를 구한다.
그리고, 상기 선형 예측 계수부(41)의 선형 예측 계수(LPC)를 이용하여 역성도 필터(42)를 구현하면, 상기 역성도 필터(42)는 상기 피씨엠 데이터(PCM)를 입력받아 이를 역성도 필터링하여 출력한다.
여기서, 상기 역성도필터(42)를 통해 출력되는 신호(RS)의 파형은 도 4와 같이 성문의 개폐에 따라 파형의 변화가 다르게 나타나므로, 성문이 닫히려는 구간 (가)는 0보다 작은 값에서 증가를 하고, 성문이 닫힌 구간 (나)에서는 거의 0으로 나타나고, 성문이 열린 구간 (다)에서는 다시 증가했다가 감소하는 모양을 나타낸다.
따라서, 상기 역성도필터(42)의 출력신호(RS)를 입력받은 데이터 생략부(43)는 상기 역성도필터(42)의 출력신호(RS)에서 거의 정보를 가지고 있지 않는 성문이 닫힌 구간(도 4의 구간 (나))을 생략한 후, 선형 예측 계수(LPC)와 닫힌 구간이 생략된 여기신호 및 닫힌 구간의 위치를 메모리(60)에 저장한다.
그러므로, 상기와 같이 음성 메모 파일에 원래의 음성을 그대로 저장하는 것보다 선형 예측 계수(LPC)와 닫힌 구간이 생략된 여기신호, 닫힌 구간의 위치를 저장하면 파일의 크기를 줄일 수 있다.
그 후, 상기 메모리(60)에 저장된 데이터를 출력하고 하는 경우, 상기 메모리(60)에 각 프레임별로 저장된 선형 예측 계수(LPC)와 여기신호, 닫힌 구간의 위치를 입력받은 디코딩부(50)는 데이터 보상부(51)에서 우선 닫힌 구간(도 4의 구간(나))이 생략된 여기 신호에 상기 해당 구간에 0을 삽입하여 생략된 부분을 보상한다.
그리고, 상기 선형 예측 계수(LPC)를 이용하여 성도 필터(52)를 구현하면, 상기 성도필터(52)는 상기 데이터 보상부(51)의 출력신호(RS)를 입력받아 피씨엠 데이터(PCM)로 변환하여 출력한다.
그리고, 상기 디코딩부(50)의 출력신호(PCM)를 입력받은 피씨엠 음원부(30)는 이를 음성신호(VS)로 변환하여 출력하고, 이를 입력받은 출력부(20)는 이를 외부로 출력한다.
상기에서 상세히 설명한 바와 같이, 본 발명은 음원 모델을 만들기 위해 사용되는 음원 여기 신호의 파형을 성문의 개폐에 따라 분석하는 간단한 음성 압축 알고리즘을 이용하여 음성 메모 파일의 크기를 최소화함으로써, 음질의 저하없이 음성 녹음시간을 연장시켜 메모리의 활용도를 극대화하는 효과가 있다.
도 1은 본 발명 핸드 피씨의 음성재생기의 구성을 보인 블록도.
도 2는 도 1에서 엔코딩부의 구성을 보인 블록도.
도 3은 도 1에서 디코딩부의 구성을 보인 블록도.
도 4는 도 2에서 역성도 필터의 출력 파형도.
***도면의 주요 부분에 대한 부호의 설명***
10 : 입력부 20 : 출력부
30 : 피씨엠 음원부 40 : 엔코딩부
41 : 선형 예측 계수부 42 : 역성도필터
43 : 데이터 생략부 50 : 디코딩부
51 : 데이터 보상부 52 : 성도필터
60 : 메모리

Claims (3)

  1. 외부 소리를 전기적인 음성신호로 변환하는 입력부와; 음성 신호를 소리로 변환하여 출력하는 출력부와; 상기 입력부의 음성신호를 피씨엠 음원 처리하여 피씨엠 데이터로 변환하여 출력하거나 피씨엠 데이터를 음성신호로 변환하여 상기 출력부로 출력하는 피씨엠 음원부와; 상기 피씨엠 음원부의 피씨엠 데이터를 코드화하여 메모리에 저장하는 엔코딩부와; 상기 메모리에 저장된 코드화된 데이터를 피씨엠 데이터로 디코딩하는 디코딩부로 구성하여 된 것을 특징으로 하는 핸드 피씨의 음성재생기.
  2. 제1항에 있어서, 엔코딩부는 피씨엠 데이터를 입력받아 성문이 닫힌 구간에서 선형 예측 계수를 계산하는 선형 예측 계수부와; 상기 피씨엠 데이터를 상기 선형 예측 계수를 이용하여 역성도필터링하는 역성도필터와; 상기 역성도필터의 출력데이터를 입력받아 성문이 닫힌 구간을 생략하여 출력하는 데이터 생략부로 구성하여 된 것을 특징으로 하는 핸드 피씨의 음성재생기.
  3. 제1항에 있어서, 상기 디코딩부는 성문이 닫힌 구간이 생략된 데이터를 입력받아 이를 보상하여 출력하는 데이터 보상부와; 데이터 보상부의 출력데이터를 선형 예측 계수를 이용하여 성도필터링하여 피씨엠 데이터를 출력하는 성도필터로 구성하여 된 것을 특징으로 하는 핸드 피씨의 음성재생기.
KR1019980052830A 1998-12-03 1998-12-03 핸드 피씨의 음성재생기 KR100532988B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019980052830A KR100532988B1 (ko) 1998-12-03 1998-12-03 핸드 피씨의 음성재생기

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019980052830A KR100532988B1 (ko) 1998-12-03 1998-12-03 핸드 피씨의 음성재생기

Publications (2)

Publication Number Publication Date
KR20000037992A KR20000037992A (ko) 2000-07-05
KR100532988B1 true KR100532988B1 (ko) 2006-02-28

Family

ID=19561200

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019980052830A KR100532988B1 (ko) 1998-12-03 1998-12-03 핸드 피씨의 음성재생기

Country Status (1)

Country Link
KR (1) KR100532988B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101387912B1 (ko) * 2012-07-29 2014-04-23 대양전자통신 주식회사 음성신호 송수신 방법 및 장치

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4916996A (en) * 1986-04-15 1990-04-17 Yamaha Corp. Musical tone generating apparatus with reduced data storage requirements
KR930010853A (ko) * 1991-11-26 1993-06-23 김범훈 음소(音素)녹음 및 음성재생 방법 및 그 장치
KR930018533A (ko) * 1992-02-25 1993-09-22 강진구 Pcm방식의 데이타압축 및 신장방법
KR960009427A (ko) * 1994-08-18 1996-03-22 배순훈 면적비교법에 의한 음성 압축저장 장치
JPH0964911A (ja) * 1995-08-22 1997-03-07 Alps Electric Co Ltd パケット送受信機および送受信方法
KR19990061574A (ko) * 1997-12-31 1999-07-26 윤종용 다중 펄스 여기 선형 예측 부호화/복호화방법 및 그 장치

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4916996A (en) * 1986-04-15 1990-04-17 Yamaha Corp. Musical tone generating apparatus with reduced data storage requirements
KR930010853A (ko) * 1991-11-26 1993-06-23 김범훈 음소(音素)녹음 및 음성재생 방법 및 그 장치
KR930018533A (ko) * 1992-02-25 1993-09-22 강진구 Pcm방식의 데이타압축 및 신장방법
KR960009427A (ko) * 1994-08-18 1996-03-22 배순훈 면적비교법에 의한 음성 압축저장 장치
JPH0964911A (ja) * 1995-08-22 1997-03-07 Alps Electric Co Ltd パケット送受信機および送受信方法
KR19990061574A (ko) * 1997-12-31 1999-07-26 윤종용 다중 펄스 여기 선형 예측 부호화/복호화방법 및 그 장치

Also Published As

Publication number Publication date
KR20000037992A (ko) 2000-07-05

Similar Documents

Publication Publication Date Title
JP3592473B2 (ja) 周波数領域内のlpc予測による時間領域内での知覚ノイズ整形
TWI476758B (zh) 解碼資料串流之解碼器與方法、將資訊信號編碼成資料串流的編碼器與方法、及關聯之資料串流及電腦程式
US6658383B2 (en) Method for coding speech and music signals
JP4162933B2 (ja) 低ビットレートcelp符号化のための連続タイムワーピングに基づく信号の修正
EP0785541B1 (en) Usage of voice activity detection for efficient coding of speech
Edler et al. Audio coding using a psychoacoustic pre-and post-filter
MX2007011102A (es) Tramas que distorsionan el tiempo dentro del vocoder modificando el residuo.
JPS58102297A (ja) 音声符号化方式
KR101925611B1 (ko) Mdct기반의 코더와 이종의 코더 간 변환에서의 인코딩 장치 및 디코딩 장치
JPH08335100A (ja) ディジタル音声データの記憶および検索方法、ならびにディジタル音声記憶および検索システム
JP2002221994A (ja) 音声信号の符号列のパケット組立方法、装置及びパケット分解方法、装置並びにこれらの方法を実行するプログラム、プログラムを記録する記録媒体
ES2588483T3 (es) Decodificador de audio que comprende un estimador de ruido de fondo
KR100532988B1 (ko) 핸드 피씨의 음성재생기
KR100498177B1 (ko) 신호양자화기
JP3451998B2 (ja) 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体
JPS6238500A (ja) 高能率音声符号化方式とその装置
US20050259822A1 (en) Sinusoidal audio coding
JP4862136B2 (ja) 音声信号処理装置
KR20080092823A (ko) 부호화/복호화 장치 및 방법
JPH05224698A (ja) ピッチサイクル波形を平滑化する方法及び装置
Han et al. Issues of audio quality for video conferencing
KR920009960B1 (ko) 잔여신호 여기식 선형예측 부호화 합성장치
JP2006235322A (ja) 再生装置および再生方法
JPH01261700A (ja) 音声符号化方式
JP2000163097A (ja) 音声変換装置、音声変換方法および音声変換プログラムを記録したコンピュータ読み取り可能な記録媒体

Legal Events

Date Code Title Description
N231 Notification of change of applicant
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee