KR20060087164A - 음성압축변환 제공 방법 - Google Patents

음성압축변환 제공 방법 Download PDF

Info

Publication number
KR20060087164A
KR20060087164A KR1020050008051A KR20050008051A KR20060087164A KR 20060087164 A KR20060087164 A KR 20060087164A KR 1020050008051 A KR1020050008051 A KR 1020050008051A KR 20050008051 A KR20050008051 A KR 20050008051A KR 20060087164 A KR20060087164 A KR 20060087164A
Authority
KR
South Korea
Prior art keywords
voice
user computer
codec
voice data
computer
Prior art date
Application number
KR1020050008051A
Other languages
English (en)
Inventor
이성만
Original Assignee
해븐위즈(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 해븐위즈(주) filed Critical 해븐위즈(주)
Priority to KR1020050008051A priority Critical patent/KR20060087164A/ko
Publication of KR20060087164A publication Critical patent/KR20060087164A/ko

Links

Images

Classifications

    • GPHYSICS
    • G04HOROLOGY
    • G04BMECHANICALLY-DRIVEN CLOCKS OR WATCHES; MECHANICAL PARTS OF CLOCKS OR WATCHES IN GENERAL; TIME PIECES USING THE POSITION OF THE SUN, MOON OR STARS
    • G04B19/00Indicating the time by visual means
    • G04B19/06Dials
    • G04B19/10Ornamental shape of the graduations or the surface of the dial; Attachment of the graduations to the dial
    • GPHYSICS
    • G04HOROLOGY
    • G04BMECHANICALLY-DRIVEN CLOCKS OR WATCHES; MECHANICAL PARTS OF CLOCKS OR WATCHES IN GENERAL; TIME PIECES USING THE POSITION OF THE SUN, MOON OR STARS
    • G04B19/00Indicating the time by visual means
    • G04B19/30Illumination of dials or hands
    • G04B19/32Illumination of dials or hands by luminescent substances
    • GPHYSICS
    • G04HOROLOGY
    • G04BMECHANICALLY-DRIVEN CLOCKS OR WATCHES; MECHANICAL PARTS OF CLOCKS OR WATCHES IN GENERAL; TIME PIECES USING THE POSITION OF THE SUN, MOON OR STARS
    • G04B45/00Time pieces of which the indicating means or cases provoke special effects, e.g. aesthetic effects
    • G04B45/0069Cases and fixed parts with a special shape
    • GPHYSICS
    • G04HOROLOGY
    • G04BMECHANICALLY-DRIVEN CLOCKS OR WATCHES; MECHANICAL PARTS OF CLOCKS OR WATCHES IN GENERAL; TIME PIECES USING THE POSITION OF THE SUN, MOON OR STARS
    • G04B45/00Time pieces of which the indicating means or cases provoke special effects, e.g. aesthetic effects
    • G04B45/0084Pictures or inscriptions on the case or parts thereof, attaching complete pictures

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)

Abstract

본 발명은 음성압축변환 제공 방법에 관한 것으로서, 음성압축변환 제공 방법에 있어서, 사용자 컴퓨터가 기저장된 음성파일을 변환 압축할 경우, (a) 상기 사용자 컴퓨터가 기저장된 음성파일을 음성데이터로서 메모리에 로드하는 단계; (b) 상기 사용자 컴퓨터가 상기 다수의 코덱을 포함하는 코덱모듈을 통해 상기 제 (a) 단계에 의한 음성데이터의 코덱을 식별하는 단계; (c) 상기 사용자 컴퓨터가 상기 제 (b) 단계에 의한 음성데이터의 피치(Pitch)를 추출하고 정규화하는 단계; 및 (d) 상기 사용자 컴퓨터가 상기 코덱모듈을 통해 특정 코덱을 선택하고 이를 이용하여 상기 제 (c) 단계에 의한 음성데이터를 변환 압축하여 음성파일을 생성하는 단계; 를 포함하는 것을 특징으로 한다.
음성변환, 코덱, CODEC, 보이스, DSP, PCM, ADPCM, GSM

Description

음성압축변환 제공 방법 및 이를 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체{METHOD FOR VOICE COMPRESSION-CONVERSION AND COMPUTER READABLE RECORD MEDIUM ON WHICH A PROGRAM THEREFOR IS RECORDED}
도 1 은 본 발명의 일실시예에 따른 음성압축변환 제공 방법이 적용되는 시스템의 개략도.
도 2 는 본 발명의 일실시예에 따른 음성압축변환 제공 방법을 위한 응용프로그램의 사용자 인터페이스를 나타낸 일부 예시도.
도 3 및 도 4 는 본 발명의 일실시예에 따른 음성압축변환 제공 방법의 절차를 나타낸 흐름도.
< 도면의 주요 부분에 대한 부호의 설명 >
100 : 사용자 컴퓨터 101 : 녹음버튼
102 : 일지정지버튼 103 : 정지버튼
104 : 재생버튼 105 : 이전버튼
106 : 다음버튼 107 : 저장버튼
108 : 진행상황 프로그레스 바 109 : 피치상태 바
110 : 파일열기버튼 111 : 재생반복횟수 설정버튼
112 : 마이크음량조절 슬라이더 113 : 볼률조절 슬라이더
200 : 서버 300 : 수신자 이동통신단말기
본 발명은 음성압축변환 제공 방법 및 이를 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것으로서, 더욱 상세하게는, 사용자 컴퓨터의 마이크를 통해 음성신호를 입력받거나 기저장된 음성파일을 로드하여 다양한 코덱을 포함하는 코덱모듈의 선택된 코덱을 통해 이를 압축 변환시킬 수 있는 음성압축변환 제공 방법 및 이를 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것이다.
근래들어 인터넷의 급속한 확산과 함께 멀티미디어의 중요성이 부각되면서 상기 멀티미디어의 정보처리와 이를 이용하는 다양한 응용 서비스가 이루어지고 있다.
상기 멀티미디어의 정보처리는 주로 숫자와 문자를 처리하던 기존의 방식을 벗어나 인간에게 친숙한 시각 및 청각적 방식의 정보처리를 통해 사용자에게 용이성을 제공하고 있다.
상기 응용 서비스의 일예로, 현재 사용되고 있는 문서음성변환시스템(Text to Speech System)(이하, "TTS"라 한다)은, 기계와 인간이 서로 대화할 수 있도록 하기 위한 기초기술로서, 영어, 숫자 및 한글 등의 문장을 자연스러운 인간의 음성으로 변환하여 출력해주는 인간 친화적인 언어변환 시스템이다.
여기서 상기 TTS는 여러 가지 전처리 단계를 포함하는 음성합성 엔진 및 언어별 음성 데이터베이스를 포함하고 있다.
간략하게 상기 음성합성 엔진은, 기저장된 언어별 단어, 음절, 반음절 또는 음소 단위의 음성을 합성하는 방식으로 입력된 문장(텍스트)을 음성데이터로 합성변환하는 것을 의미한다.
참고적으로 상기 음성합성 방법에 관해서는, 크게 '생성원 처리에 의한 음성합성 방법'과 '파형처리에 의한 음성합성 방법'이 있다.
이러한 TTS는 이동통신단말기의 음성메시지 서비스 또는 웹 상에 링크되는 음성파일로 응용되어, 다양한 문자정보를 사용자에게 음성으로 제공한다.
그러나, 상기 TTS를 통한 이동통신단말기의 음성메시지 서비스 또는 웹 페이지 상에 링크되는 음성파일을 제공함에 있어서, 전술한 바와 같은 상기 TTS는 여러 가지 복잡한 전처리 단계 및 음성 데이터베이스를 통해 문장(텍스트)을 음성으로 합성 변환하는 바, 이를 구동하는 응용프로그램의 용량이 커지게 되는 문제점이 있다.
또한, 상기 TTS를 통해 합성 변환된 음성데이터의 용량이 커지는 문제점과, 상기 변환된 음성데이터를 재생할 경우, 현재 음성합성 기술의 한계로 인해 청감상 자연스럽지 못하다는 문제점도 있다.
그리고, 상기 TTS를 통해 합성 변환된 음성데이터는 서버가 제공하는 웹 페이지 상에 링크되어 있을 경우, 클라이언트로 전송되는 음성데이터의 용량이 크기 때문에 전송 트래픽을 가중시키는 문제점도 있다.
본 발명의 목적은, 입력되는 음성신호를 다양한 코덱을 포함하는 코덱모듈을 통해 특정 코덱으로 압축 저장하거나, 기저장된 음성데이터(음성파일)를 상기 코덱모듈을 통해 특정 코덱으로 변환시킴으로써, 상기 음성데이터의 용량을 줄일 수 있는 음성압축변환 제공 방법 및 이를 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공함에 있다.
상기 목적을 달성하기 위한 본 발명은, 음성압축변환 제공 방법에 관한 것으로서, 음성압축변환 제공 방법에 있어서, 사용자 컴퓨터가 기저장된 음성파일을 변환 압축할 경우, (a) 상기 사용자 컴퓨터가 기저장된 음성파일을 음성데이터로서 메모리에 로드하는 단계; (b) 상기 사용자 컴퓨터가 상기 다수의 코덱을 포함하는 코덱모듈을 통해 상기 제 (a) 단계에 의한 음성데이터의 코덱을 식별하는 단계; (c) 상기 사용자 컴퓨터가 상기 제 (b) 단계에 의한 음성데이터의 피치(Pitch)를 추출하고 정규화하는 단계; 및 (d) 상기 사용자 컴퓨터가 상기 코덱모듈을 통해 특정 코덱을 선택하고 이를 이용하여 상기 제 (c) 단계에 의한 음성데이터를 변환 압 축하여 음성파일을 생성하는 단계; 를 포함하는 것을 특징으로 한다.
바람직하게 상기 제 (a) 단계 이전에, 사용자 컴퓨터가 음성을 녹음하여 변환 압축하는 경우, (e) 상기 사용자 컴퓨터가 음성입력장치를 통해 입력 받은 음성데이터를 메모리에 로드하는 단계; (f) 상기 사용자 컴퓨터가 상기 로드한 음성데이터를 정규화하는 단계; (g) 상기 사용자 컴퓨터가 상기 제 (f) 단계에 의한 음성데이터의 피치(Picth)를 추출하는 단계; 및 (h) 상기 사용자 컴퓨터가 다수의 코덱을 포함하는 코덱모듈을 통해 특정 코덱을 선택하고 이를 이용해서 상기 제 (g) 단계에 의한 음성데이터를 변환 압축하여 음성파일을 생성하는 단계; 를 더 포함하는 것을 특징으로 한다.
또한 바람직하게 상기 코덱모듈은, PCM, ADPCM, GSM 및 DSP 방식의 코덱을 포함하는 것을 특징으로 한다.
또한 바람직하게 상기 제 (d) 단계 이후에, 상기 사용자 컴퓨터가 상기 제 (d) 단계에 의해 변환 압축된 음성파일을 서버로 전송하는 단계; 를 더 포함하는 것을 특징으로 한다.
그리고 바람직하게 상기 제 (h) 단계 이후에, 상기 사용자 컴퓨터가 상기 제 (h) 단계에 의해 변환 압축된 음성파일을 서버로 전송하는 단계; 를 더 포함하는 것을 특징으로 한다.
한편, 본 발명은 음성압축변환 제공 방법을 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것으로서, 음성압축변환 제공 방법을 수행하기 위하여, 사용자 컴퓨터가 기저장된 음성파일을 변환 압축할 경우, (A) 상 기 사용자 컴퓨터가 기저장된 음성파일을 음성데이터로서 메모리에 로드하는 기능; (B) 상기 사용자 컴퓨터가 상기 다수의 코덱을 포함하는 코덱모듈을 통해 상기 제 (A) 단계에 의한 음성데이터의 코덱을 식별하는 기능; (C) 상기 사용자 컴퓨터가 상기 제 (B) 단계에 의한 음성데이터의 피치(Pitch)를 추출하고 정규화하는 기능; 및 (D) 상기 사용자 컴퓨터가 상기 코덱모듈을 통해 특정 코덱을 선택하고 이를 이용하여 상기 제 (C) 단계에 의한 음성데이터를 변환 압축하여 음성파일을 생성하는 기능; 을 포함하는 것을 특징으로 한다.
바람직하게 상기 제 (A) 단계 이전에, 사용자 컴퓨터가 음성을 녹음하여 변환 압축하는 경우, (E) 상기 사용자 컴퓨터가 음성입력장치를 통해 입력 받은 음성데이터를 메모리에 로드하는 기능; (F) 상기 사용자 컴퓨터가 상기 로드한 음성데이터를 정규화하는 기능; (G) 상기 사용자 컴퓨터가 상기 제 (F) 단계에 의한 음성데이터의 피치(Picth)를 추출하는 기능; 및 (H) 상기 사용자 컴퓨터가 다수의 코덱을 포함하는 코덱모듈을 통해 특정 코덱을 선택하고 이를 이용해서 상기 제 (F) 단계에 의한 음성데이터를 변환 압축하여 음성파일을 생성하는 기능; 을 더 포함하는 것을 특징으로 한다.
또한 바람직하게 상기 코덱모듈은, PCM, ADPCM, GSM 및 DSP 방식의 코덱을 포함하는 것을 특징으로 한다.
또한 바람직하게 상기 제 (D) 단계 이후에, 상기 사용자 컴퓨터가 상기 제 (D) 단계에 의해 변환 압축된 음성파일을 서버로 전송하는 기능; 을 더 포함하는 것을 특징으로 한다.
그리고 바람직하게 상기 제 (H) 단계 이후에, 상기 사용자 컴퓨터가 상기 제 (H) 단계에 의해 변환 압축된 음성파일을 서버로 전송하는 기능; 을 더 포함하는 것을 특징으로 한다.
이하, 첨부된 도면을 참조하여 본 발명을 상세하게 설명한다.
본 발명을 설명하기에 앞서 본 발명에 관련된 공지 기능 및 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 구체적인 설명을 생략하였음에 유의해야 할 것이다.
본 발명의 일실시예에 따른 음성압축변환 제공 방법이 적용되는 시스템에 관하여 도 1 을 참조하여 설명하면 다음과 같다.
도 1 은 본 발명의 일실시예에 따른 음성압축변환 제공 방법이 적용되는 시스템의 개략도이다.
상기 도 1 에 도시된 바와 같이 음성압축변환 제공 방법이 적용되는 시스템(이하, "시스템"이라 한다)은 사용자 컴퓨터(100), 서버(200) 및 수신자 이동통신단말기(300)를 포함한다.
상기 사용자 컴퓨터(100)는 마이크를 통해 입력 받은 음성데이터 또는 기저장된 음성파일을 특정 코덱으로 압축 변환시키고 이를 저장하는 기능을 수행한다.
여기서 상기 음성데이터 또는 음성파일을 압축 변환시키는 기능은 상기 사용자 컴퓨터(100) 내에서 실행되는 응용프로그램(Application)을 통해 이루어 진다.
더욱 상세하게 상기 사용자 컴퓨터(100)는 변환 압축된 음성데이터 또는 음 성파일을 유무선 정보통신망을 통해 하기의 서버(200)로 전송하는 기능을 수행한다.
본 실시예에서 상기 사용자 컴퓨터(100)는 일반적으로 사용되는 컴퓨터를 의미하며, 상기 컴퓨터를 Pentium 급 이상의 씨피유(CPU), 64Mb 이상의 램, 하드디스크, CD롬, 마우스, 키보드 및 마이크를 포함하는 정보 입력장치, 모니터와 스피커와 프린터와 통신포트를 포함하는 정보출력장치를 포함하고, 윈도우즈 98 이상의 운영체제 및 리눅스 운영체제 등을 포함한 통신 가능한 컴퓨터 장치로서 웹 내용을 디스플레이 할 수 있는 인터넷 브라우저(웹 브라우저)를 구비하고 있고, 데스크 탑 컴퓨터 및 노트북과 같은 개인용 컴퓨터로 설정하겠으나, 본 발명이 상기 사용자 컴퓨터의 사양 및 종류에 한정되는 것은 아니다.
그리고 본 실시예에서 상기 정보통신망은 TCP/IP 프로토콜에 의한 유선 인터넷망과, WAP(Wireless Application Protocol, 무선응용통신규약) 또는 WIPI(Wireless Internet Platform for Interoperability, 무선인터텟 플랫폼 표준규격) 프로토콜에 의한 무선 인터넷망을 포함하는 인터넷망과 유선 및 무선전화망을 포함한다.
또한, 상기 서버(200)는 상기 사용자 컴퓨터(100)로부터 압축 변환된 음성데이터 또는 음성파일을 수신하고 저장하는 기능을 수행한다.
여기서 상기 서버(200)는 상기 수신된 음성데이터 또는 음성파일을 하기의 수신자 이동통신단말기(300)로 전송하는, 즉 ARS(Automatic Response Service) 또는 CTI(Computer and Telephony Integration) 방식의 음성메시지 서비스를 제공하 는 서버로 설정 가능하며, 다양한 컨텐츠를 포함하는 웹 페이지를 제공하는 일반적인 서버로도 설정 가능하다.
부연하여 상기 서버(200)가 웹 페이지를 제공하는 일반적인 서버일 경우, 상기 사용자 컴퓨터(100)로부터 수신 받은 음성데이터 또는 음성파일이 웹 페이지 상에 링크(포함)되며, 정보통신망을 통해 상기 서버(200)에 접속하는 불특정 다수 컴퓨터(클라이언트)의 요청이 있을 경우 상기 링크된 음성데이터 또는 음성파일을 요청한 컴퓨터(클라이언트)로 전송하는 기능을 수행하게 된다.
그리고, 상기 수신자 이동통신단말기(300)는 상기 서버(200)로부터 변환 압축된 음성데이터 또는 음성파일을 수신하는 일반적인 휴대폰의 기능을 수행한다.
본 실시예에서 상기 이동통신단말기(300)는 WAP 또는 WIPI 프로토콜에 의한 무선 인터넷 통신이 가능한 휴대폰으로 설정하겠으나, 본 발명이 이에 한정되는 것은 아니다.
지금까지 상술한 구성을 갖는 본 발명의 일실시예에 따른 음성압축변환 제공 방법이 적용되는 시스템에 대해 설명하였고, 이하, 음성압축변환 제공 방법의 상세한 절차를 도 2 내지 도 4 를 참조하여 설명한다.
도 2 는 본 발명의 일실시예에 따른 음성압축변환 제공 방법을 위한 응용프로그램의 사용자 인터페이스를 나타낸 일부 예시도이며, 도 3 및 도 4 는 본 발명의 일실시예에 따른 음성압축변환 제공 방법의 절차를 나타낸 흐름도이다.
먼저, 사용자의 음성을 녹음하여 변환 압축하는 단계를 상기 도 2 에 도시된 바와 같은 응용프로그램의 기능별 절차에 따라 설명한다.
도 2 에 도시된 바와 같이, 사용자가 녹음버튼(101)을 누르면 상기 사용자 컴퓨터(100)에 정보입력 장치로서 설치된 마이크(MIC)를 통해 사용자의 음성을 녹음한다.
이때 상기 마이크(MIC)는 사운드카드(SoundCard)의 마이크 입력단자에 연결되어 있으며, 상기 응용프로그램은 상기 사운드카드가 동작하는지 체크하고 이상이 없다면 마이크를 통해 입력되는 사용자의 음성을 녹음한다(S100).
바람직하게 상기 사운드카드의 동작에 이상이 감지될 경우, 팝업(PopUp) 방식의 경고 메시지 창을 모니터 화면으로 출력한다.
여기서 상기 녹음되는 음성은 노이즈를 줄이기 위해 높은 샘플링(Sampling)으로 녹음된다.
사용자는 일시정지버튼(102)를 눌러 녹음 절차를 잠시 보류할 수 있으며, 상기 일시정지버튼(102)을 눌러 녹음을 재개 할 수 있다.
녹음 종료를 위해 사용자가 정지버튼(103)을 누르게 되면, 상기 응용프로그램은 상기 녹음된 음성(음성데이터)를 압축한다.
다음으로, 사용자는 상기 도 2 에 도시된 바와 같은 재생버튼(104)을 누름으로써 전술한 절차를 통해 녹음된 음성데이터를 사용자 컴퓨터(100)와 연결된 스피커와 같은 음성출력장치를 통해 재생하여 이를 확인할 수 있다.
이때 상기 음성출력장치를 통해 재생되는 음성은 압축된 음성데이터가 아닌 메모리에 할당된 임시적인 음성데이터이며, 재생 도중 상기 일시정지버튼(102)을 통해 일시적으로 정지 및 정지된 시점부터 다시 재생을 할 수 있다.
또한 이전버튼(105) 및 다음버튼(106)을 통해 음성데이터 재생 시점을 처음 또는 끝으로 옮길 수 있다.
다음으로, 사용자가 상기 압축된 음성데이터를 물리적 공간(하드디스크)에 저장하기 위해 저장버튼(107)을 누르게 되면, 상기 응용프로그램은 상기 음성데이터를 정규화(Normalization)(S110)하고, 그리고 상기 음성데이터의 피치(Pitch)를 추출(S120)하게 되며 다양한 코덱(CODEC)을 포함하는 코덱모듈을 통해 상기 음성데이터를 변환 압축하여 음성파일로 저장하게 된다(S140).
여기서 상기 음성데이터를 정규화하고 그 피치(Pitch)를 추출하는 절차는 다양한 코덱을 통해 상기 음성데이터를 변환 저장하기 위한 전처리 절차이다.
참고적으로 상기 코덱모듈은 국제표준 방식인 PCM, ADPCM, GSM 및 DSP 코덱을 포함하고 있고, 사용자는 상기 응용프로그램이 제공하는 소정 메시지 창을 통해 상기 저장되는 음성파일의 코덱을 설정할 수 있다(S130).
상기 코덱모듈이 포함하는 PCM, ADPCM, GSM 및 DSP 코덱에 대해 간략하게 살펴보면 다음과 같다.
상기 PCM(Pulse Code Modulation) 코덱은 64Kbps의 대역폭을 필요로 하며, ADPCM(Adaptive Differential Pulse Code Modulation) 코덱은 32Kbps의 대역폭을 필요로 하고, 그리고 GSM(Global System for Mobile Communication) 코덱은 13Kbps의 대역폭을 필요로 한다.
이러한 각 코덱들은 압축 저장되는 음성파일의 용도와 음질에 따라 적절히 선택 가능하다.
일예로, 상기 DSP(Digital Siganl Processing) 코덱을 이용하여 용량이 큰 음성데이터를 압축 변환할 경우, 분당 64KB로 호환성을 유지하면서 균일하게 압축 변환이 가능하다.
따라서 이러한 다양한 코덱을 포함하는 코덱모듈을 통해 압축 변환되어 저장된 음성파일은 일반적으로 이용되는 WAVE형식의 음성파일에 비해 그 용량이 작아지기 때문에, 이를 저장하는 물리적인 공간이 작아지게 되며, 전술한 바와 같은 서버(200)로 전송할 경우, 전송 트래픽을 획기적으로 줄일 수 있게 된다.
지금까지 상술한 바와 같은 응용프로그램을 통해 생성된 음성파일은 수신자의 전화번호와 같은 부가정보를 포함하여, 정보통신망을 통해 ARS 또는 CTI와 같은 휴대폰 음성메시지 서비스를 위한 서버(200)로 전송(S150)되고, 이후 상기 서버(200)는 전송받은 부가정보를 기반으로 상기 음성파일을 수신자의 휴대폰으로 전송하게 된다.
이러한 ARS 또는 CTI를 통한 휴대폰 음성메시지 서비스는 공지된 바와 유사하거나 동일하므로 이에 대한 상세한 설명은 생략한다.
한편 상기 음성파일은 다양한 컨텐츠를 포함하는 웹 페이지를 제공하는 서버(200)로 전송되어, 게시판과 같은 곳에 링크될 수 있다.
본 실시예에서 상기 응용프로그램은 상기 사용자 컴퓨터(100)에서 실행되는 것으로 설정하였으나, 상기 서버(200)가 다양한 컨텐츠를 포함하는 웹 페이지를 제공하는 서버일 경우, 상기 응용프로그램은 서버(200) 내에서 실행되는 것으로도 설정이 가능하다.
이는 상기 서버(200)가 웹 페이지 내에 포함되는 멀티미디어 파일, 즉 각종 음성 메시지를 포함하는 음성파일을 생성할 경우에 해당한다.
한편 도 2 에 도시된 바와 같은 진행상황 프로그레스 바(Progress Bar)(108)는, 음성데이터의 재생 또는 녹음 중의 진행상황을 사용자에게 표시하는 기능을 수행하며, 피치상태 바(109)는 음성데이터를 재생 또는 녹음 중 상기 음성데이터의 피치(Pitch) 값을 막대 형태로 그래픽화시켜 사용자에게 표시하는 기능을 수행하고, 마이크음량조절 슬라이더(112)는 마이크를 통해 사용자의 음성을 녹음할 경우 녹음되는 음성의 크기를 조절하는 기능을 수행하며, 볼륨조절 슬라이더(113)는 음성데이터 또는 음성파일을 재생할 시, 스피커를 통해 재생되는 음량을 조절하는 기능을 수행하고, 그리고 재생반복횟수 설정버튼(111)은 음성데이터 또는 음성파일 재생시의 그 반복 횟수를 지정하는 기능을 수행한다.
상술한 바와 같은 음성압축변환 방법 제공을 위한 응용프로그램은 마이크로소프트사가 제공하는 다이렉트엑스(DirectX)가 아닌 로우 레벨(Low Level)의 API(Application Programming Interface)를 통해 음성 압축 및 재생에 관련된 프로그램 코드를 실행하고 있는 바, 그 실행 속도가 보다 빠르고, 응용프로그램 자체의 용량이 작은 장점이 있다.
본 실시예에서 상기 응용프로그램은 로레벨(Low Level)의 API를 이용하는 것으로 설정하였으나, 본 발명이 이에 한정되는 것은 아니다.
지금까지 사용자의 음성을 녹음하여 변환 압축하는 절차를 설명하였고, 이하 기저장된 음성파일을 로드하여 변환 압축하는 절차에 대해 도 4 에 도시된 바와 같은 흐름도를 참조하여 설명한다.
먼저, 사용자가 도 2 에 도시된 바와 같은 파일열기버튼(110)을 누르게 되면, 상기 응용프로그램은 파일열기와 관련된 대화 창을 사용자에게 출력하고, 이를 통해 사용자가 기저장된 음성파일을 선택하게 되면, 상기 선택된 파일을 메모리에 로드시킨다(S200).
다음으로, 상기 응용프로그램은 전술한 바와 같이 PCM, ADPCM, GSM 및 DSP 코덱을 포함하는 코덱모듈을 통해 로드된 음성파일의 코덱을 식별한다(S210).
이와 더불어 상기 응용프로그램은 로드된 음성파일의 피치(Picth)를 추출하고(S220), 상기 음성파일을 정규화시킨다(S230).
여기서 사용자는 전술한 바와 동일하게 상기 응용프로그램이 제공하는 다양한 기능 버튼을 통해 상기 로드된 음성파일을 재생하여 청취할 수 있다.
다음으로, 사용자가 상기 로드된 음성파일을 저장하기 위해 저장버튼(107)을 누르게 되면, 상기 응용프로그램은 상기 제 S130 단계 및 제 S140 단계와 동일한 절차를 수행한다(S240, S250).
이와 같이 상기 제 S240 단계 및 제 S250 단계를 통해 새로 생성된 음성파일을 전술한 바와 같은 제 S150 단계와 동일하게 경우에 따라 서버(200)로 전송한다(S260).
상기 도 4 를 참조하여 상술한 바와 같은 절차를 통해, 호환성을 유지하면서 용이하게 상기 기저장된 음성파일을 선택적인 코덱으로 변환하여 압축할 수 있게 된다.
상술한 바와 같은 본 발명의 기술적 사상은, 각종 웹 페이지에 링크되는 음성파일과, 이동통신단말기(핸드폰, 휴대폰)로의 다양한 음성메시지 서비스를 포함하는 다양한 분야에 적용될 수 있음은 자명하다.
한편, 본 발명은 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다.
상기 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함하며, 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, DVD-ROM, 자기 테이프, 플로피디스크 및 광데이터 저장장치 등을 포함한다.
그리고 상기 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.
이상에서 설명한 본 발명은, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 있어 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하므로 전술한 실시예 및 첨부된 도면에 한정되는 것이 아니다.
상기와 같은 본 발명에 따르면, 사용자의 컴퓨터에 연결된 음성입력장치를 통해 입력되는 음성신호를 다양한 코덱을 포함하는 코덱모듈을 통해 특정 코덱으로 압축 저장하거나, 기저장된 음성데이터(음성파일)를 상기 코덱모듈을 통해 특정 코덱으로 변환시킴으로써 상기 음성데이터의 용량을 줄일 수 있으며, 이에 따라 상기 압축 변환된 음성파일이 정보통신망을 통해 서버로 전송될 경우 전송 트래픽을 줄일 수 있는 효과가 있다.

Claims (10)

  1. 음성압축변환 제공 방법에 있어서,
    사용자 컴퓨터가 기저장된 음성파일을 변환 압축할 경우,
    (a) 상기 사용자 컴퓨터가 기저장된 음성파일을 음성데이터로서 메모리에 로드하는 단계;
    (b) 상기 사용자 컴퓨터가 상기 다수의 코덱을 포함하는 코덱모듈을 통해 상기 제 (a) 단계에 의한 음성데이터의 코덱을 식별하는 단계;
    (c) 상기 사용자 컴퓨터가 상기 제 (b) 단계에 의한 음성데이터의 피치(Pitch)를 추출하고 정규화하는 단계; 및
    (d) 상기 사용자 컴퓨터가 상기 코덱모듈을 통해 특정 코덱을 선택하고 이를 이용하여 상기 제 (c) 단계에 의한 음성데이터를 변환 압축하여 음성파일을 생성하는 단계; 를 포함하는 것을 특징으로 하는 음성압축변환 제공 방법.
  2. 제 1 항에 있어서,
    상기 제 (a) 단계 이전에,
    사용자 컴퓨터가 음성을 녹음하여 변환 압축하는 경우,
    (e) 상기 사용자 컴퓨터가 음성입력장치를 통해 입력 받은 음성데이터를 메모리에 로드하는 단계;
    (f) 상기 사용자 컴퓨터가 상기 로드한 음성데이터를 정규화하는 단계;
    (g) 상기 사용자 컴퓨터가 상기 제 (f) 단계에 의한 음성데이터의 피치(Picth)를 추출하는 단계; 및
    (h) 상기 사용자 컴퓨터가 다수의 코덱을 포함하는 코덱모듈을 통해 특정 코덱을 선택하고 이를 이용해서 상기 제 (g) 단계에 의한 음성데이터를 변환 압축하여 음성파일을 생성하는 단계; 를 더 포함하는 것을 특징으로 하는 음성압축변환 제공 방법.
  3. 제 1 항 또는 제 2 항에 있어서,
    상기 코덱모듈은,
    PCM, ADPCM, GSM 및 DSP 방식의 코덱을 포함하는 것을 특징으로 하는 음성압축변환 제공 방법.
  4. 제 1 항에 있어서,
    상기 제 (d) 단계 이후에,
    상기 사용자 컴퓨터가 상기 제 (d) 단계에 의해 변환 압축된 음성파일을 서버로 전송하는 단계; 를 더 포함하는 것을 특징으로 하는 음성압축변환 제공 방법.
  5. 제 2 항에 있어서,
    상기 제 (h) 단계 이후에,
    상기 사용자 컴퓨터가 상기 제 (h) 단계에 의해 변환 압축된 음성파일을 서버로 전송하는 단계; 를 더 포함하는 것을 특징으로 하는 음성압축변환 제공 방법.
  6. 음성압축변환 제공 방법을 수행하기 위하여,
    사용자 컴퓨터가 기저장된 음성파일을 변환 압축할 경우,
    (A) 상기 사용자 컴퓨터가 기저장된 음성파일을 음성데이터로서 메모리에 로드하는 기능;
    (B) 상기 사용자 컴퓨터가 상기 다수의 코덱을 포함하는 코덱모듈을 통해 상기 제 (A) 단계에 의한 음성데이터의 코덱을 식별하는 기능;
    (C) 상기 사용자 컴퓨터가 상기 제 (B) 단계에 의한 음성데이터의 피치(Pitch)를 추출하고 정규화하는 기능; 및
    (D) 상기 사용자 컴퓨터가 상기 코덱모듈을 통해 특정 코덱을 선택하고 이를 이용하여 상기 제 (C) 단계에 의한 음성데이터를 변환 압축하여 음성파일을 생성하는 기능; 을 포함하는 것을 특징으로 하는 음성압축변환 제공 방법을 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
  7. 제 6 항에 있어서,
    상기 제 (A) 단계 이전에,
    사용자 컴퓨터가 음성을 녹음하여 변환 압축하는 경우,
    (E) 상기 사용자 컴퓨터가 음성입력장치를 통해 입력 받은 음성데이터를 메모리에 로드하는 기능;
    (F) 상기 사용자 컴퓨터가 상기 로드한 음성데이터를 정규화하는 기능;
    (G) 상기 사용자 컴퓨터가 상기 제 (F) 단계에 의한 음성데이터의 피치(Picth)를 추출하는 기능; 및
    (H) 상기 사용자 컴퓨터가 다수의 코덱을 포함하는 코덱모듈을 통해 특정 코덱을 선택하고 이를 이용해서 상기 제 (F) 단계에 의한 음성데이터를 변환 압축하여 음성파일을 생성하는 기능; 을 더 포함하는 것을 특징으로 하는 음성압축변환 제공 방법을 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
  8. 제 6 항 또는 제 7 항에 있어서,
    상기 코덱모듈은,
    PCM, ADPCM, GSM 및 DSP 방식의 코덱을 포함하는 것을 특징으로 하는 음성압축변환 제공 방법을 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
  9. 제 6 항에 있어서,
    상기 제 (D) 단계 이후에,
    상기 사용자 컴퓨터가 상기 제 (D) 단계에 의해 변환 압축된 음성파일을 서버로 전송하는 기능; 을 더 포함하는 것을 특징으로 하는 음성압축변환 제공 방법을 실행하기 위한 프로그램으로 읽을 수 있는 기록매체.
  10. 제 7 항에 있어서,
    상기 제 (H) 단계 이후에,
    상기 사용자 컴퓨터가 상기 제 (H) 단계에 의해 변환 압축된 음성파일을 서버로 전송하는 기능; 을 더 포함하는 것을 특징으로 하는 음성압축변환 제공 방법을 실행하기 위한 프로그램으로 읽을 수 있는 기록매체.
KR1020050008051A 2005-01-28 2005-01-28 음성압축변환 제공 방법 KR20060087164A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020050008051A KR20060087164A (ko) 2005-01-28 2005-01-28 음성압축변환 제공 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020050008051A KR20060087164A (ko) 2005-01-28 2005-01-28 음성압축변환 제공 방법

Publications (1)

Publication Number Publication Date
KR20060087164A true KR20060087164A (ko) 2006-08-02

Family

ID=37176127

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020050008051A KR20060087164A (ko) 2005-01-28 2005-01-28 음성압축변환 제공 방법

Country Status (1)

Country Link
KR (1) KR20060087164A (ko)

Similar Documents

Publication Publication Date Title
US6151576A (en) Mixing digitized speech and text using reliability indices
US7974392B2 (en) System and method for personalized text-to-voice synthesis
KR101149135B1 (ko) 음성 대화형 메시징을 위한 방법 및 장치
US9196241B2 (en) Asynchronous communications using messages recorded on handheld devices
JP5600092B2 (ja) 携帯型デバイス内のテキスト音声処理用システムおよび方法
US9318100B2 (en) Supplementing audio recorded in a media file
US8014499B2 (en) Arrangement in a local computer for sending voice messages to a unified communications system
US20050222843A1 (en) System for permanent alignment of text utterances to their associated audio utterances
JPH08328813A (ja) 改良した声送信方法と装置
CN110149805A (zh) 双向语音翻译系统、双向语音翻译方法和程序
JP2007534278A (ja) ショートメッセージサービスを通じる音声
JP2009265279A (ja) 音声合成装置、音声合成方法、音声合成プログラム、携帯情報端末、および音声合成システム
US20080107045A1 (en) Queuing voip messages
US20130144626A1 (en) Rap music generation
EP1703492A1 (en) System and method for personalised text-to-voice synthesis
WO2020237886A1 (zh) 语音和文字转换传输方法、系统、计算机设备和存储介质
US20080162559A1 (en) Asynchronous communications regarding the subject matter of a media file stored on a handheld recording device
KR100826778B1 (ko) 멀티모달을 위한 브라우저 기반의 무선 단말과, 무선단말을 위한 브라우저 기반의 멀티모달 서버 및 시스템과이의 운용 방법
TWI223231B (en) Digital audio with parameters for real-time time scaling
KR20060087164A (ko) 음성압축변환 제공 방법
CN104078049B (zh) 信号处理设备和信号处理方法
US20030065512A1 (en) Communication device and a method for transmitting and receiving of natural speech
US8219402B2 (en) Asynchronous receipt of information from a user
JP5326539B2 (ja) 留守番電話システム、留守番電話サービスサーバ及び留守番電話サービス方法
JP4551372B2 (ja) コンテンツ記録装置およびコンテンツ記録方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E601 Decision to refuse application
E601 Decision to refuse application