KR100257361B1 - 비대칭 음성 압축 프로세스를 이용한 초저속 비트율 음성 메시지 전달 시스템 - Google Patents

비대칭 음성 압축 프로세스를 이용한 초저속 비트율 음성 메시지 전달 시스템 Download PDF

Info

Publication number
KR100257361B1
KR100257361B1 KR1019970703226A KR19970703226A KR100257361B1 KR 100257361 B1 KR100257361 B1 KR 100257361B1 KR 1019970703226 A KR1019970703226 A KR 1019970703226A KR 19970703226 A KR19970703226 A KR 19970703226A KR 100257361 B1 KR100257361 B1 KR 100257361B1
Authority
KR
South Korea
Prior art keywords
template
speech
dimensional
voice
predetermined
Prior art date
Application number
KR1019970703226A
Other languages
English (en)
Other versions
KR970707528A (ko
Inventor
월터 리 데이비스
지안 휴앙
레온 쟈신스키
Original Assignee
비센트 비.인그라시아
모토로라 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 비센트 비.인그라시아, 모토로라 인코포레이티드 filed Critical 비센트 비.인그라시아
Publication of KR970707528A publication Critical patent/KR970707528A/ko
Application granted granted Critical
Publication of KR100257361B1 publication Critical patent/KR100257361B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B5/00Near-field transmission systems, e.g. inductive or capacitive transmission systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Devices For Executing Special Programs (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Abstract

저속 비트율 음성 전송을 제공하기 위해 음성 메시지를 처리하는 장치는 파라메타 프레임 시퀀스를 포함하는 2차원 파라메타 매트릭스(502)로 정렬된 음성 파라메타를 발생하기 위해 상기 음성 메시지를 처리한다. 2차원 파라메타 매트릭스 (502)는 2차원 변환 매트릭스(502)를 구하기 위해 얻기 위해 선정된 2차원 매트릭스 변환 함수(414)을 이용하여 변환된다. 선정된 템플릿 세트의 템플릿들과 2차원 변환된 매트릭스(506)간의 간격을 나타내는 간격 값들이 그 다음에 도출된다. 도출된 간격 값들은 선정된 템플릿 세트의 템플릿들을 식별하는 인덱스에 의해 식별된다. 도출된 간격 값들은 비교되고, 최단 간격을 갖는 선정된 템플릿 세트의 템플릿에 대응하는 인덱스가 선택된 다음에 전송된다.

Description

[발명의 명칭]
비대칭 음성 압축 프로세스를 이용한 초저속 비트율 음성 메시지 전달 시스템
[기술분야]
본 발명은 일반적으로 통신 시스템에 관한 것으로서, 보다 상세하게는 비대칭 음성 압축 처리(asymmetric voice compression processing)를 제공하는 초저속 데이타 전송율(very low data transmission rate)을 제공하는 압축된 음성 디지탈 통신 시스템에 관한 것이다.
[배경기술]
페이징 시스템(paging system) 등의 통신 시스템은 과거에는 시스템을 수익성있게 운영하기 위하여 메시지의 길이, 사용자의 수, 및 사용자에 대한 편의성을 참작해야만 하였다. 사용자의 수 및 메시지의 길이는 채널의 폭주 상태(overcrowding)를 피하고, 긴 전송 시간 지연을 피하기 위해 제한되었었다. 사용자의 편의성은 채널 용량, 채널상의 사용자의 수, 시스템 특성 및 메시지 전달 유형 등에 의해 직접적으로 영향을 받는다. 페이징 시스템에서는, 소정의 전화 번호를 호출하도록 단순히 사용자에 경보음만을 내는 톤 전용 페이저(tone only pager)가 최고의 채널 용량을 제공하였지만 사용자에게는 어느 정도 불편하였다. 종래의 아날로그 음성 페이저는 사용자가 보다 상세한 메시지를 수신할 수 있게는 하였으나, 주어진 채널상의 사용자의 수를 제한하였다. 실시간 장치인 아날로그 음성 페이저도 사용자에게 수신된 메시지를 저장하고 반복시키는 방법을 제공하지 못하는 단점이 있었다. 숫자 및 문자 디스플레이와 메모리를 갖는 디지탈 페이저의 도입은 종래의 페이저와 관련된 많은 문제점들을 극복하였다. 이들 디지탈 페이저는 페이징 채널의 메시지 처리 용량을 개선시켰고, 사용자에게 차후의 재조사(later review)를 위해 메시지를 저장하는 방법을 제공하고 있다.
숫자 및 문자 숫자 디스플레이를 갖는 디지탈 페이저가 많은 잇점을 제공했기는 하지만, 어떤 사용자들은 여전히 음성 통지(voice announcement)를 갖는 페이저를 선호하였다. 한정된 용량의 디지탈 채널로 이러한 서비스를 제공하려고 많은 디지탈 음성 압축 기술 및 합성 기술들이 시도되었으며, 이들 각각은 그들만의 성공도 있었고 제한도 있었다. 음성 합성기 등의 기술은 숫자 또는 문자 숫자 디스플레이를 발신자 목소리와 똑같지는 않지만 그 목소리는 내는 컴퓨터 발생 음성(computer generated voice)으로 교체하였다. 양방향 무선에 의해 사용되는 표준 디지탈 음성 압축 방법들도 페이징 채널상에서 사용하는데 필요한 압축 정도를 제공하지는 못하였다. 현재의 기술을 사용하여 디지탈적으로 인코드된 음성 메시지는 채널 용량의 많은 부분을 전용하게 됨으로써 시스템을 상용적으로 성공시킬 수는 없다.
따라서, 페이징 시스템에서의 페이징 채널 등의 통신 시스템에서의 채널의 최적으로 이용하기 위하여는, 음성 메시지를 디지탈적으로 인코드하여 그 결과 생기는 데이타를 고도로 압축하여 통신 채널상으로 보내진 정상의 데이타와 용이하게 혼합할 수 있도록 하는 장치가 필요하다. 또한, 음성 메시지를 디지탈적으로 인코드하여 페이저 등의 통신 수신 장치에서의 처리를 최소화하도록 하는 통신 시스템이 필요하게 된다.
[발명의 요약]
본 발명의 제1 실시예에 따르면, 저속 비트율 음성 전송을 제공하기 위해 음성 메시지를 처리하는 방법이 제공된다. 본 방법은 이하의 단계, 즉 음성 파라메타(speech parameter)를 발생하기 위해 음성 메시지를 처리하는 단계, 음성 파라메타를 파라메타 프레임 시퀀스(a sequence of parameter frames)로 이루어지는 2차원 파라메타 매트릭스로 정렬하는 단계, 2차원 변환 매트릭스(transform matrix)를 구하기 위해 선정된 2차원 매트릭스 변환 함수를 사용하여 2차원 파라메타 매트릭스를 변환하는 단계, 선정된 템플릿 세트(a set of predetermined templates)의 템플릿들과 2차원 변환 매트릭스간의 간격을 나타내는 간격 값 세트(a set of distance values)를 도출(derive)하는 단계로서, 도출된 간격값 세트는 선정된 템플릿 세트의 템플릿을 식별하는 인덱스에 의해 식별되는 단계, 도출된 간격 값 세트를 비교하여 그로부터 도출된 간격 값 세트 중 최단 간격을 갖는 선정된 템플릿 세트의 템플릿에 대응하는 인덱스(index)를 선택하는 단계, 및 선택된 최단 간격을 갖는 선정된 템플릿 세트의 템플릿에 대응하는 인덱스를 전송하는 단계를 포함한다.
본 발명의 제1 측면에 따르면, 저속 비트율 음성 전송(low bit rate speech transmission)을 제공하기 위해 음성 메시지(voice message)를 처리하는 비대칭 음성 압축 처리기(asymmetric voice compression processor)가 제공된다. 비대칭 음성 압축 처리기는 입력 음성 처리기, 신호 처리기 및 송신기를 포함한다. 입력 음성 처리기는 디지탈화된 음성 데이타(digitized speech data)를 발생하기 위해 음성 메시지를 처리한다. 신호 처리기는, 디지탈화된 음성 데이타로부터 음성 파라메타를 발생하고, 음성 파라메타를 파라메타 프레임 시퀀스(a sequence of parameter frames)로 이루어지는 2차원 파라메타 매트릭스로 정렬하며, 2차원 변환 매트릭스(transform matrix)를 구하기 위해 선정된 2차원 매트릭스 변환 함수를 사용하여 2차원 파라메타 매트릭스를 변환하고, 선정된 템플릿 세트(a set of predetermined templates)의 템플릿들과 2차원 변환 매트릭스간의 간격을 나타내는 간격 값(distance values)을 도출(derive)하되, 이 간격 값은 선정된 템플릿 세트의 템플릿에 대응하는 인덱스에 의해 식별되며, 도출된 간격 값을 비교하여 그로부터 도출된 간격 값 중 최단 간격을 갖는 선정된 템플릿 세트의 템플릿에 대응하는 인덱스(index)를 선택하도록 프로그램된다. 송신기는 선택된 최단 간격을 갖는 선정된 템플릿 세트의 템플릿에 대응하는 인덱스를 전송한다.
본 발명의 제2 실시예에 따르면, 음성 메시지(voice message)를 제공하기 위해 저속 비트율 음성 전송(low bit rate speech transmission)을 처리하는 방법이 제공된다. 본 방법은 이하의 단계, 즉 선정된 템플릿 세트의 하나 이상의 템플릿에 대응하는 하나 이상의 인덱스를 수신하는 단계, 수신된 하나 이상의 인덱스에 대응하는 하나 이상의 템플릿으로부터 음성 파라메타의 어레이(an array of speech parameters)를 발생하는 단계, 신장된 디지탈 음성 데이타(decompressed digital speech data)를 발생하기 위해 음성 파라메타의 어레이를 처리하는 단계, 및 신장된 디지탈 음성 데이타로부터 음성 메시지를 발생하는 단계를 포함한다.
본 발명의 제2 측면에 따르면, 음성 메시지(voice message)를 제공하기 위해 저속 비트율 음성 전송(low bit rate speech transmission)을 수신하는 통신 장치가 제공된다. 이 통신 장치는, 선정된 템플릿 세트의 하나 이상의 템플릿에 대응하는 하나 이상의 인덱스를 수신하는 수신기, 수신된 하나 이상의 인덱스에 대응하는 하나 이상의 템플릿으로부터 음성 파라메타의 어레이(an array of speech parameters)를 발생하도록 프로그램된 신호 처리기, 음성 파라메타의 어레이를 처리하여 신장된 디지탈 음성 데이타(decompressed digital speech data)를 발생하는 음성 합성기(speech synthesixer), 및 신장된 디지탈 음성 데이타로부터 음성 메시지를 발생하는 변환기(converter)를 구비한다.
본 발명의 제3 실시예에 따르면, 저속 비트율 음성 전송을 제공하기 위해 음성 메시지를 처리하는 방법이 제공된다. 본 방법은, 전체 음성 메시지를 수신하는 단계, 전체 음성 메시지를 처리하여 그로부터 음성 파라메타 매트릭스를 나타내는 선정된 템플릿 시퀀스를 식별하는 인덱스 시퀀스를 도출하는 단계, 및 인덱스 시퀀스를 전송하는 단계를 포함한다.
[도면의 간단한 설명]
제1도는 본 발명에 따른 디지탈 음성 압축 프로세스(digital voice compressi on process)를 이용하는 통신 시스템의 블럭선도.
제2도는 본 발명에 따른 디지탈 음성 압축 프로세스를 이용하는 페이징 단말기(paging terminal) 및 그와 관련된 페이징 송신기(paging transmitter)의 전기 블럭선도.
제3도는 제2도의 페이징 단말기의 동작을 나타내는 플로우챠트.
제4도는 제2도의 페이징 단말기에서 이용되는 디지탈 신호 처리기의 동작을 나타내는 플로우챠트.
제5도는 제4도의 디지탈 신호 처리기에서 이용되는 디지탈 음성 압축 프로세스의 일부를 나타낸 도면.
제6도는 제4도의 디지탈 신호 처리기에서 이용되는 디지탈 음성 압축 프로세스를 상세히 나타낸 도면.
제7도는 제4도의 디지탈 신호 처리기에서 이용되는 또다른 디지탈 음성 압축 프로세스를 상세히 나타낸 도면.
제8도는 제2도의 페이징 단말기에서 이용되는 디지탈 신호 처리기의 전기 블럭선도.
제9도는 본 발명에 따른 압축된 음성 전송 포맷(compressed voice transmission format)을 설명하는 도면.
제10도는 본 발명에 따른 디지탈 음성 압축 프로세스를 이용하는 페이징 수신기(paging receiver)의 전기 블럭선도.
제11도는 제10도의 페이징 수신기에서 사용되는 디지탈 신호 처리기의 전기 블럭선도.
제12도는 제10도의 페이징 수신기의 동작을 나타내는 플로우챠트.
제13도는 제10도의 페이징 수신기에서 이용되는 디지탈 음성 데이타 신장 절차(digital voice data decompression precedure)를 나타내는 플로우챠트.
제14도는 제11도의 디지탈 신호 처리기에서 이용되는 디지탈 음성 신장 프로세스를 상세히 설명한 도면.
제15도는 사전 처리된 코드북을 이용하는 또다른 디지탈 음성 신장 프로세스를 상세히 설명한 도면.
제16도는 세그먼트화된 코드북을 이용하는 또다른 디지탈 음성 신장 프로세스를 상세히 설명한 도면.
[발명의 상세한 설명]
도 1는 본 발명에 따른 비대칭 음성 압축 처리(asymmetric voice compres sion processing)를 사용하는 초저속 비트율 음성 전송(very low bit rate speech transmission)을 이용하는 페이징 시스템(paging system) 등의 통신 시스템의 블럭선도를 나타낸 것이다. 본 발명의 비대칭 음성 압축 처리는 이하에 설명하는 바와 같이 아주 긴 음성 세그먼트(very long segment of speech), 일반적으로는 320 내지 480 밀리초의 음성을 나타내기 위해 32비트 BCH 코드워드를 사용한다. 종래의 전하 기술을 사용할 때는 32비트가 0.5 밀리초 세그먼트의 음성을 나타내었다. 디지탈 음성 압축 프로세스는 페이징 및 아주 긴 음성 세그먼트들에 대해 고도의 계산 집중적인 프로세스(highly computational intensive precess)를 수행하는데 필요한 시간을 제공하는 다른 비실시간(non-real time) 통신 시스템의 비실시간 특성에 적합하다. 비실시간 통신에서는, 전체 음성 메시지를 수신한 다음에 그 메시지를 처리하는데 시간이 충분히 있다. 2분의 지연이 페이징 시스템에서는 쉽게 용인될 수 있지만, 실시간 통신 시스템에서는 2초의 지연도 용납되지 않는다. 디지탈 음성 압축 프로세스의 비대칭 특성이 페이저 등의 휴대용 통신 디바이스에서 수해되는데 필요한 처리를 최소화시킴으로써, 이 프로세스가 페이징 응용 분야 및 다른 유사한 비실시간 음성 통신에 이상적인 것으로 된다. 디지탈 음성 압축 프로세스의 고도의 계산 집중적인 부분은 시스템의 일정 부분에서 수행되고, 그 결과 이하에 설명하는 바와 같이 시스템의 휴대용 부분에서는 그다지 계산을 수행할 필요가 없게 된다.
일례로서, 페이징 시스템을 본 발명을 사용하는데 이용하고 있지만, 그 밖의 비실시간 통신 시스템도 역시 본 발명을 이용할 수 있음은 잘 알 것이다. 페이징 시스템은 각각 서로 다른 서비스를 요구하는 다양한 사용자들에 서비스를 제공하도록 설계되어 있다. 어떤 사용자들은 숫자 메시지 전송 서비스를 요구하고, 다른 사용자들은 문자-숫자 메시지 전송 서비스를 요구하며, 또다른 사용자들은 음성 메시지 전송 서비스를 요구할 수도 있다. 페이징 시스템에서는, 호출자(caller)는 전화기(102)를 거쳐 공중 교환 전화망(public switched telephone network, RSTN)(104)을 통해 페이징 단말기(106)과 통신함으로써 페이지(page)를 발신한다(originate). 페이징 단말기(106)은 호출자에게 수신자의 식별 번호와 보낼 메시지를 입력하도록 요청한다. 페이징 단말기(106)은 요청된 정보를 수신하자마자 페이징 단말기9106)가 메시지를 수신하였음을 가리키는 프롬프트(prompt)를 되보낸다. 페이징 시스템(106)은 메시지를 인코드하여 인코드된 메시지를 전송 큐(transmissiom queue)에 놓는다. 적절한 시기에, 이 메시지는 페이징 송신기(108)에 의해 송신기(108)과 송신 안테나(110)을 사용하여 전송된다. 다중 방송 전송 시스템(simulcast transmission system)에서는 서로 다른 지리적 영역을 맡고 있는 다수의 송신기들이 사용될 수도 있다는 것을 잘 알 것이다.
송신 안테나(110)으로부터 전송된 신호는 수신 안테나(112)에 의해 수신되어 페이징 수신기로서 도 1에 도시된 통신 디바이스(114)에 의해 처리된다. 호출된 사람은 신호음을 듣게 되고(alerted), 메시지는 사용되는 메시지 전송 방식에 따라 디스플레이되거나 또는 말로 알려준다(announciate).
본 발명에 따른 디지탈 음성 압축 프로세스를 이용하는 페이징 단말기(106)과 페이징 송신기(108)의 전기 블럭선도가 도 2에 도시되어 있다. 도 2에 도시된 페이징 단말기(106)은 상용 무선 통신 사업자(Radio Common Carrier, RCC) 시스템에서와 같이 다수의 동시 사용자들에 서비스를 제공하는데 사용되는 타입이다. 페이징 단말기(106)은 제어기(216)에 의해 제어되는 다수의 입력 장치, 신호 처리 장치 및 출력 장치를 이용한다. 제어기(216)과 페이징 단말기(106)을 구성하는 여러가지 장치들간의 통신은 디지탈 제어 버스(210)에 의해 처리된다. 디지탈화된 음성 및 데이타의 통신은 입력 시분할 멀티플렉스드 하이웨이(input time division multiplexed high way, 211) 및 출력 시분할 멀티플렉스드 하이웨이(output time division multiplexed highway, 218)에 의해 처리된다. 디지탈 제어 버스(210), 입력 시분할 멀티플렉스드 하이웨이(212) 및 출력 시분할 멀티플렉스드 하이웨이(218)은 페이징 단말기(106)의 확장에 대비해 확장될 수 있다는 것을 잘 알 것이다.
입력 음성 처리기(input speech processor, 205)는 PSTN(104)와 페이징 단말기(106)간의 인터페이스를 제공한다. PSTN 접속은 도 2에서 디지탈 PSTN 접속(202)로 도시된 복수의 회선당 다중 호출 멀티플렉스드 디지탈 접속(multi-call per line multiplexed digital connections) 또는 복수의 회선당 단일 호출 아날로그 PSTN 접속(single call per line analog PSTN connections, 208)일 수 있다.
각각의 디지탈 PSTN 접속(202)는 디지탈 전화 인터페이스(204)에 의해 서비스된다. 디지탈 전화 인터페이스(204)는 본 발명에 따른 디지탈 음성 압축 프로세스의 동작에 대해 필요한 신호 조건 부여(signal conditioning), 동기화(synchronization), 디멀티플렉싱(de-multiplexing), 시그널링(signaling), 관리(supervision) 및 규제 보호(regulatory protection) 요건들을 제공한다. 디지탈 전화 인터페이스(204)는 또한 입력 시분할 멀티플렉스드 하이웨이(212)로의 억세스를 제공하는데 필요한 시간 슬롯들의 교환 및 시간 슬롯 정렬을 용이하게 하기 위해 디지탈화된 음성 프레임들의 일시적인 저장 장치를 제공할 수 있다. 이하에 설명하는 바와 같이, 서비스 및 관리 응답에 대한 요청은 제어기(216)에 의해 제어된다. 디지탈 전화 인터페이스(204)와 제어기(216)간의 통신은 디지탈 제어 버스(210)상으로 전달된다.
각각의 아날로그 PSTN 접속(208)은 아날로그 전화 인터페이스(206)에 의해 서비스된다. 아날로그 전화 인터페이스(206)은 본 발명에 따른 디지탈 음성 압축 프로세스의 동작에 대해 필요한 신호 조건 부여(signal conditioning), 시그널링(signaling), 관리(supervision), 아날로그-디지탈 및 디지탈-아날로그 변환, 및 규제 보호(regulatory protection) 요건들을 제공한다. 아날로그-디지탈 변환기(207)로부터의 디지탈화된 음성 메시지의 프레임들은 입력 시분할 멀티플렉스드 하이웨이(212)로의 억세스를 제공하는데 필요한 시간 슬롯들의 교환 및 시간 슬롯 정렬을 용이하게 하기 위해 아날로그 전화 인터페이스(206)에 일시적으로 저장된다. 이하에 설명하는 바와 같이, 서비스 및 관리 응답에 대한 요청은 제어기(216)에 의해 제어된다. 아날로그 전화 인터페이스(206)와 제어기(216)간의 통신은 디지탈 제어 버스(210)상으로 전달된다.
수신중의 호출(incoming call)이 검출되면, 서비스 요청이 아날로그 전화 인터페이스(206) 또는 디지탈 전화 인터페이스(204)로부터 제어기(216)로 보내진다. 제어기(216)은 복수의 디지탈 신호 처리기로부터 디지탈 신호 처리기(214)를 선택한다. 제어기(216)은 서비스를 요청하는 아날로그 전화 인터페이스(206) 또는 디지탈 전화 인터페이스(204)를 입력 시분할 멀티플렉스드 하이웨이(212)를 거쳐 선택된 디지탈 신호 처리기(214)에 결합시킨다.
디지탈 신호 처리기(214)는 페이징 프로세스를 완료하는데 요구되는 모든 신호 처리 함수들을 수행하도록 프로그램될 수 있다. 디지탈 신호 처리기(214)에 의해 수행되는 일반적인 신호 처리 함수들로는 본 발명에 따른 디지탈 음성 압축, 듀얼 톤 다중 주파수 디코딩 및 발생(dual tone multi frequency(DTMF) decoding and generation), 모뎀 톤 발생 및 디코딩(modem tone generation and decoding), 및 사전 기록된 음성 프롬프트 발생(prerecorded voice prompt generation) 등이 있다. 디지탈 신호 처리기(214)는 상기한 하나 이상의 함수들을 수행하도록 프로그램될 수 있다. 하나 이상의 타스크(task)를 실행하도록 프로그램된 디지탈 신호 처리기(214)의 경우에, 제어기(216)은 디지탈 신호 처리기(214)가 선택된 때에 수행하는데 필요한 특정 타스크를 할당하거나, 또는 단지 하나의 타스크를 수행하도록 프로그램된 디지탈 신호 처리기(214)의 경우에는, 제어기(216)은 페이징 프로세스에서의 그 다음 단계를 완료하는데 필요한 특정 함수를 수행하도록 프로그램된 디지탈 신호 처리기(214)를 선택한다. 듀얼 톤 다중 주파수(DTMF) 디코딩 및 발생, 모뎀 톤 발생 및 디코딩, 및 사전 기록된 음성 프롬프트 발생을 수행하는 디지탈 신호 처리기(214)의 동작은 기술 분야의 통상의 지식을 가진 자에게는 잘 알려져 있다. 초저속 비트율 비대칭 음성 압축 처리기의 함수를 수행하는 디지탈 신호 처리기(214)의 동작은 이하에 상세히 기술되어 있다.
음성 메시지의 경우에 페이지 요청의 처리는 이하의 방식으로 진행된다. 아날로그 전화 인터페이스(206) 또는 디지탈 전화 인터페이스(204)에 결합된 디지탈 신호 처리기(214)는 그 다음에 발신자에 대해서 음성 메시지를 입력하도록 요청한다. 디지탈 신호 처리기(214)는 이하에 기술하는 프로세스를 사용하여 수신된 음성 메시지를 압축한다. 압축 프로세스에 의해 발생된 압축된 디지탈 음성 메시지는 제어기(216)의 제어하에서 출력 시분할 멀티플렉스드 하이웨이(218)을 거쳐 페이징 프로토콜 인코더(paging protocol encoder, 228)에 결합된다. 페이징 프로토콜 인코더(228)은 이 데이타를 적당한 페이징 프로토콜로 인코드한다. 이하에 상세히 기술되는 이러한 프로토콜의 하나로는 미 우편국 위원회 표준 권고 그룹(Post Office Committee Standard Advisory Group)(POCSAG) 프로토콜이 있다. 또한 다른 시그널링 프로토콜도 이용될 수 있다는 것을 잘 알 것이다. 제어기(216)는 페이징 프로토콜 인코더(228)에 인코드된 데이타를 출력 시분할 멀티플렉스드 하이웨이(218)을 거쳐 데이타 저장 장치(226)에 집중하도록 지시한다. 적절한 시기에, 인코드된 데이타는 제어기(216)의 제어하에서 출력 시분할 멀티플렉스드 하이웨이(218)를 거쳐 송신기 제어 유닛(220)으로 다운로드(download)되고, 페이징 송신기(108) 및 송신 안테나(110)을 사용하여 전송된다.
숫자 메시지 전송의 경우에, 페이지 요청의 처리는 디지탈 신호 처리기(214)에 의해 수행되는 프로세스를 제외하고는 음성 메시지 페이지와 유사한 방식으로 진행된다. 디지탈 신호 처리기(214)는 발신자에게 DTMF 메시지를 입력하도록 요청한다. 디지탈 신호 처리기(214)는 수신된 DTMF 신호를 디코딩하여 디지탈 메시지를 발생한다. 디지탈 신호 처리기(214)에 의해 발생된 메시지는 음성 메시지 전송 경우에 디지탈 신호 처리기(214)에 의해 발생된 디지탈 음성 메시지와 동일한 방식으로 처리된다.
문자-숫자 페이지의 처리는 디지탈 신호 처리기(214)에 의해 수행되는 프로세스를 제외하고는 음성 메시지와 유사한 방식으로 진행된다. 디지탈 신호 처리기(214)는 디코드하여 모뎀 톤을 발생하도록 프로그램되어 있다. 디지탈 신호 처리기(214)는 페이지 엔트리 단말기(Page entry terminal, PET) 프로토콜 등의 표준 사용자 인터페이스 프로토콜 중 하나를 사용하여 발신자와 인터페이스한다. 다른 통신 프로토콜들도 사용될 수 있다는 것은 잘 알 것이다. 디지탈 신호 처리기(214)에 의해 발생된 디지탈 메시지는 음성 메시지 전송 경우에 디지탈 신호 처리기(214)에 의해 발생된 디지탈 음성 메시지와 동일한 방식으로 처리된다.
도 3는 음성 메시지를 처리할 때 도 2에 도시된 페이징 단말기(106)의 동작을 기술한 플로우챠트이다. 플로우챠트(300)로의 2개의 도입점(entry point)이 도시되어 있다. 제1 도입점은 디지탈 PSTN 접속(202)와 관련된 프로세스에 대한 것이고, 제2 도입점은 아날로그 PSTN 접속(208)와 관련된 프로세스에 대한 것이다. 디지탈 PSTN 접속(202)의 경우에, 프로세스는 디지탈 PSTN 회선상으로 요청을 수신하는 단계(302)에서 시작한다. 디지탈 PSTN 접속(202)로부터의 서비스 요청은 착신 데이타 스트림(incoming data stream)내의 비트 패턴으로 표시된다. 디지탈 전화 인터페이스(204)는 서비스 요청을 수신하고 제어기(216)에 요청을 통신한다.
단계(304)에서, 서비스를 요청하는 디지탈 채널로부터 수신된 정보는 디지탈 프레임 디멀티플렉싱에 의해 착신 데이타 스트림과 분리된다. 디지탈 PSTN 접속(202)로부터 수신된 디지탈 신호는 일반적으로 착신 데이타 스트림내로 멀티플렉스된 복수의 디지탈 채널을 포함하고 있다. 서비스를 요청하는 디지탈 채널들은 디멀티플렉스되고, 디지탈화된 음성 데이타는 그 다음에 시간 슬롯 정렬 및 입력 시분할 멀티플렉스드 하이웨이(212)로의 멀티플렉싱을 용이하게 하기 위해 일시적으로 저장된다. 입력 시분할 멀티플렉스드 하이웨이(212)상의 디지탈화된 음성 데이타에 대한 시간 슬롯은 제어기(216)에 의해 할당된다. 역으로 디지탈 PSTN 접속(202)로의 전송을 위해 디지탈 신호 처리기(214)에 의해 발생된 디지탈화된 음성 데이타는 전송을 위해 적당히 포맷되어 발신 데이타 스트림(outgoing data stream)내로 멀티플렉스된다.
마찬가지로, 아날로그 PSTN 접속(208)에서도 프로세스는 아날로그 PSTN 회선으로부터의 요청이 수신되는 단계(306)에서 시작한다. 아날로그 PSTN 접속(208)상에서, 착신 호출(incoming call)은 저주파 AC 신호 또는 DC 시그널링에 의해 신호된다. 아날로그 전화 인터페이스(206)은 요청을 수신하여 그 요청을 제어기(216)에 통신한다.
단계(308)에서, 아날로그 음성 메시지는 디지탈 데이타 스트림으로 변환된다. 그의 총 지속 기간에 걸쳐 수신된 아날로그 신호는 아날로그 음성 메시지라고 한다. 아날로그 신호는 아날로그-디지탈 변환기(207)에 의해 샘플링되어 음성 메시지 샘플을 발생하고, 디지탈화되어 디지탈화된 음성 샘플을 발생한다. 아날로그 신호의 샘플들은 음성 메시지 샘플이라고 한다. 디지탈화된 음성 샘플들은 디지탈화된 음성 데이타라고 한다. 디지탈화된 음성 데이타는 제어기(216)에 의해 할당된 시간 슬롯에서 입력 시분할 멀티플렉스드 하이웨이(212)로 멀티플렉스된다. 역으로, 디지탈 신호 처리기(214)로부터 발신된 입력 시분할 멀티플렉스드 하이웨이(212)상의 어떤 음성 데이타도 아날로그 PSTN 접속(208)로의 전송 이전에 디지탈-아날로그 변환을 겪게 된다.
도 3에 도시한 바와 같이, 아날로그 PSTN 접속(208)과 디지탈 PSTN 접속(202)에 대한 처리 경로는 단계(310)에서 모아져 디지탈 신호 처리기는 착신 호출을 처리하도록 할당된다. 제어기(216)은 디지탈 음성 압축 프로세스를 수행하도록 프로그램된 디지탈 신호 처리기(214)를 선택한다. 할당된 디지탈 신호 처리기(214)는 이전에 할당된 시간 슬롯에서 입력 시분할 멀티플렉스드 하이웨이(212)상의 데이타를 읽는다.
디지탈 신호 처리기(214)에 의해 읽혀진 데이타는 단계(312)에서 처리를 위해 미압축된 음성 데이타로서 저장된다. 저장된 미압축된 음성 데이타는 이하에 상세히 설명하는 바와 같이 단계(314)에서 처리된다. 처리 단계(314)로부터 나온 압출된 음성 데이타는 이하에 설명되는 바와 같이 단계(316)에서 페이징 채널상으로 전송을 위해 적당히 인코드된다. 단계(318)에서, 인코드된 데이타는 차후의 전송을 위해 페이징 큐(paging queue)에 저장된다. 적절한 시기에, 큐잉된 데이타(queued data)는 단계(320)에서 송신기(108)로 보내지고, 단계(322)에서 전송된다.
본 발명의 디지탈 음성 압축 프로세스는 아주 높은 정도의 압축을 구하기 위하여 아주 긴 세그먼트의 음성 데이타를 분석한다. 도 4는 단계(314)를 상세화시킨 것으로서, 디지탈화된 음성 데이타를 처리하는 동안 도 2의 페이징 단말기에서 이용되는 디지탈 신호 처리기의 동작을 나타낸 플로우챠트이다. 이전에 디지탈 신호 처리기(214)에 미압축된 음성 데이타로서 저장된 디지탈화된 음성 데이타(402)는 단계(404)에서 분석되고 이득이 정규화된다. 디지탈 음성 메시지의 진폭은 시스템의 다이나믹 레인지를 완전히 이용하여 외견상의 신호 대 잡음 성능을 향상시키기 위해 음절별로 조정된다.
정규화된 미압축된 음성 데이타는 단계(406)에서 짧은 지속 기간의 음성 세그먼트들을 나타내는 선정된 갯수의 디지탈화된 음성 샘플들로 그룹지어진다. 그룹지어진 음성 샘플들은 짧은 지속 기간의 음성 세그먼트들을 나타내며, 이를 여기에서는 음성 프레임(speech frame)을 발생한다라고 한다. 일반적으로 이 그룹들은 20 내지 30 밀리초의 음성 데이타를 포함한다. 단계(408)에서, 음성 파라메타(speech parameter)를 발생하기 위해 짧은 지속 기간의 음성 세그먼트에 대해 음성 분석이 수행된다. 음성 분석 프로세스는 일반적으로 선형 예측 코드(linear predictive code(LPC)) 프로세스이다. LPC 프로세스는 짧은 지속 기간의 음성 세그먼트들을 분석하여 다수의 파라메타를 산출한다. 많은 다른 음성 분석 프로세스들이 공지되어 있다. 기술 분야의 통상의 지식을 가진 자라면 음성 분석 방법은 설계 중의 시스템의 요건을 가장 잘 충족시킨다는 것을 잘 알 것이다. 여기 기술된 디지탈 음성 압축 프로세스는 양호하게는 13개의 파라메타를 산출한다. 처음 3개의 파라메타는 음성 세그먼트에서의 총 에너지, 특성 피치값(characteristic pitch value) 및 음성 정보(voicing information)를 양자화한다. 나머지 10개의 파라메타는 스펙트럼 파라메타라고 하며, 기본적으로 디지탈 필터의 계수들을 나타낸다. 본 발명의 양호한 실시예에서는, 각각의 파라메타는 8비트 디지탈 워드를 사용하여 양자화되고 있지만, 다른 양자화 레벨도 이용될 수 있음을 잘 알 것이다.
단계(410) 스택에서, 단계(408)에서 산출된 13개의 파라메타는 2차원 파라메타 매트릭스, 즉 파라메타 프레임의 시퀀스(a sequence of parameter frame)로 구성된 파라메타 스택(parameter stack)으로 스택된다. 13개의 파라메타는 이 매트릭스의 한 행을 차지하며, 여기서는 이를 음성 파라메타 프레임(speech parameter frame)이라고 한다. 단계(412)에서, 2차원 음성 데이타 메트릭스의 세그먼트들은 선정된 갯수의파라메타 프레임의 어레이들로 세그먼트화된다. 각 어레이는 일반적으로 8내지 32개의 프레임을 갖는다. 어레이가 커질수록 이하에 기술하는 계산 단계들이 더욱 집중적으로 되는 것을 잘 알게 될 것이다. 디지탈 신호 처리기 기술 및 현재의 페이징 시장과 관련된 경제의 현 상태는 8음성 파라메타 프레임의 어레이가 동적 음성의 기간(periods of dynamic speech)에 대해서는 최적임을 암시한다. 16 또는 그 이상의 음성 파라메타 프레임의 어레이는 덜 동적인 음성(less dynamic speech) 또는 무음 상태(quiet)의 기간에 대해 이용될 수 있지만, 설명의 목적상 8음성 파라메타 프레임의 어레이를 사용한다. 음성 파라메타 프레임의 어레이는 본 명세서의 서두에 언급한 아주 긴 음성 세그먼트를 나타낸다. 아주 긴 음성 세그먼트는 일례로서 8개의 프레임을 포함하며, 각 프레임은 20 내지 30 밀리초의 음성 데이타, 또는 160 내지 240 밀리초의 아날로그 음성 메시지 세그먼트를 포함하고 있다.
단계(414)에서, 선정된 2차원 매트릭스 변환 함수를 사용하는 수학적 변환 프로세스가 각각의 음성 파라메타 프레임의 어레이에 적용된다. 변환 프로세스는 음성 파라메타 프레임의 어레이를 2차원 변환된 어레이로 변환한다. 2차원 변환된 어레이는 중요도 순서로 배열된 파라메타의 어레이이다. 이용된 수학적 프로세스는 양호하게는 2차원 이산 코사인 변환 함수이지만, 변환된 어레이를 생성하기 위해 다른 변환들도 사용될 수 있음을 잘 알 것이다.
단계(416)에서, 2차원 변환된 어레이는 음성 템플릿(voice template)이라고도하는 선정된 템플릿 세트(a set of preditermined templates)와 비교된다. 이 선정된 템플릿 세트는 여기서는 코드 북(code book)이라고 한다. 본 발명의 다른 실시예에서는 코드 북은 2개 이상의 템플릿 세트를 갖는 페이징 응용 분야에 대한 일반적인 코드 북은 일례로 512 내지 1024개의 템플릿을 갖는다. 매트릭스 양자와 함수(matrix quantization function)은 2차원 변화된 어레이를 코드 북내의 각 템플릿과 비교하여 코드 북과 각 템플릿간의 가중 간격(weighted distance)를 산출한다. 이 가중 간격은 또한 간격 값(distance value)이라고도 한다. 2차원 변환된 어레이로의 최단 간격을 갖는 템플릿의 인덱스(420)이 이하에 상세히 설명하게 될 아주 긴 음성 세그먼트(very long segements of speech)를 나타내기 위해 선택된다. 도출된 간격 값은 선정된 템플릿 세트를 식별하는 인덱스에 의해 식별된다.
단계(416)에서 선택된 인덱스(420)은 페이징 채널을 통해 전송하기 위해 선정된 시그널링 프로토콜(signaling protocol)로 인코드된다. 이하에 보다 상세히 설명하게 되는 바와 같이, 2개의 인덱스가 본 발명에서 이용되는 프로토콜의 하나의 코드 워드로 인코드될 수 있다. 단계(408) 내지 단계(416)은 아주 긴 음성 세금먼트들 모두가 인덱스로서 양자화될 때까지 반복된다.
도 5는 도 4의 디지탈 신호 처리기에서 이용되는 디지탈 음성 압축 프로세스를 설명하는 도면이다. 단계(410)에 기술된 2차원 음성 데이타 매트릭스는 2차원 파라메타 매트릭스(502)로서 도시되어 있다. 2차원 파라메타 매트릭스(502)는 단계(408)에서 발생된 각 음성 파라메타 프레임에 대해 하나의 행을 갖는다. 괄호(504)는 음성 파라메타의 어레이를 형성하는 8개의 파라메타 프레임을 둘러싸고 있다. 단계(414)에서 기술된 선정된 2차원 매트릭스 변화 함수는 음성 파라메타의 어레이를 2차원 변환된 어레이(506)으로 변환한다. 2차원 변환된 어레이(506)은 변환된 데이타가 어떻게 중요도 순서로 배열되는지를 설명하기 위해 라벨이 붙여지며, 가장 중요한 데이타가 2차원 변환된 어레이(506)의 좌상단 모서리에 저장되고, 가장 하위의 데이타는 2차원 변환된 어레이(506)의 우하단 모서리에 저장된다.
도 6는 단계(416)에서 매트릭스 양자화를 위해 수행되는 프로세스들을 설명하는 도면이다. 2차원 변환된 어레이(506)는 aij로 표기된 참조 식별자를 갖는 것으로 도시되어 있으며, 여기서 "a"는 2차원 변환된 어레이를 가리키고, 첨자 "i"는 어레이의 행을 가리키며, 첨자"j"는 어레이의 열을 가리킨다. 코드 북(604)는 복수의 페이지 "k"를 갖는 어레이 "b"로 도시되어 있으며, 여기서 페이지는 k=0 부터 k=n까지 번호가 매겨져 있다. 코드 북(604)의 각 페이지는 하나의 음성 템플릿을 나타내는 2차원 어레이이다. 코드 북(604)의 셀들은 b(k)ij로 표시되어 있으며, 여기서 "b(k)"는 코드 북과 페이지를 가리키며, 첨자 "i"는 페이지 b(k)상의 어레이의 행을 가리키며, 첨자 "j"는 페이지 b(k)상의 어레이의 열을 가리킨다.
단계(416)에서 수행되는 간격 산출은 2차원 변환된 어레이(506)내의 해당 셀내의 값으로부터 코드 북(604)에서 각 페이지 b(k)에 대한 템플릿내의 셀에서의 값을 감산하고, 그 결과를 제곱하며, 제곱 결과를 선정된 가중 어레이(606)의 해당 셀내의 가중 값과 곱하는 프로세스이며, 이 프로세스는 3개의 어레이내의 모든 셀에 대해 이 프로세스를 수행하게 될 때까지 반복된다. 2차원 변환된 어레이(506)와 템플릿 페이지 b(k)간의 간격은 이전의 산출의 가중 제곱된 결과들의 합산(sum of the weighted squared result)이다. 이 통계적 간격(statistic distance)는 템플릿의 페이지 번호 b(k) 또는 인덱스에 해당하는 장소 "k"에서 간격 어레이(distance array, 610), d(k)에 저장된다.
상기한 간격 산출은 이하의 식으로 나타낼 수 있다:
@p.21누락
weighting arrays and listening test)를 포함하는 경험적 프로세스에 의해 발생된다.
본 발명의 또다른 실시예가 도 7에 도시되어 있다. 여기에서 2차원 변환된 어레이(506)는 크기가 다른 2개의 세그먼트, 세그먼트Ⅰ(701)과 세그먼트Ⅱ(702)로 세그먼트화되어 있지만, 어떤 조건하에서는 2개의 세그먼트가 동일 크기를 가질 수도 있다는 것을 잘 알 것이다. 세그먼트가 작을수록, 세그먼트 Ⅰ(701)은 상위의 데이타(the more significant data)를 나타내고, 세그먼트가 클수록 세그먼트 Ⅱ(702)는 하위의 데이타(the less significant data)를 나타낸다. 코드 북(604)는 템플릿 세트Ⅰ(703)과 템플릿 세트 Ⅱ(704)로서 식별되는 2개의 해당 세그먼트로 세그먼트화된다. 마찬가지로, 템플릿 세트Ⅱ(704)는 하위의 데이타를 나타내며, 템플릿 세트Ⅰ(703)보다 적은 갯수의 템플릿을 갖는다. 가중 어레이(602)도 마찬가지로 세그먼트 Ⅰ(705)와 세그먼트 Ⅱ(706)으로 세그먼트화된다. 2차원 변환된 어레이(506)의 세그먼트 Ⅰ(701)과 코드 북(604)의 템플릿 세트Ⅰ(703)의 템플릿 모두 사이의 간격은 상기한 바와 같이 가중 어레이 산출(weighted array calculation, 608)및 선정된 가중 어레이(606) 세그먼트 Ⅰ(705)를 사용하여 산출된다. 이 간격은 간격 어레이(710)의 첫번째 열에 저장되어 있다. 마찬가지로, 2차원 변환된 어레이(506)의 세그먼트 Ⅱ(702)와 코드 북(604)의 템플릿 세트Ⅱ(704)의 템플릿 모두 사이의 간격은 상기한 바와 같이 산출되어 간격 어레이(710)의 두번째 열에 저장되어 있다. 모든 간격이 산출되었으면, 간격 어레이(710)의 열 Ⅰ를 탐색하여 2차원 변환된 어레이(506)의 세그먼트 Ⅰ(701)로의 최단 간격을 갖는 코드 북(604)의 템플릿 세트Ⅰ(703)의 템플릿을 나타내는 인덱스를 찾게 된다. 마찬가지로, 간격 어레이(710)의 열 Ⅱ를 탐색하여 2차원 변환된 어레이(506)의 세그먼트 Ⅱ(702)로의 최단 간격을 갖는 코드 북(604)의 템플릿 세트Ⅱ(704)의 템플릿을 나타내는 인덱스를 찾게 된다. 열 Ⅰ와 열Ⅱ로부터의 인덱스는 상기한 바와 같이 아주 긴 음성 세그먼트를 나타내는 코드 워드를 형성하고 인덱스 어레이(712)에 저장된다. 2차원 변환된 어레이(506)의 세그먼트 Ⅱ(702)는 또한 여기에스는 제2의 선정된 템플릿 세트라고도 한다. 2차원 변환된 어레이(506)의 세그먼트화(segementation)는 코드 워드를 길게 하는 반면, 이러한 세그먼트화는 또한 음성 품질을 향상시키고 계산 노력을 감소시킨다. 추가적인 세그먼트화는 음성 품질을 더욱 향상시키며 계산 시간을 더욱 감소시키지만 전송한 데이타가 더 많아지게 된다.
본 발명의 또 다른 실시예에서는, 하나 이상의 코드 북(604)이 서로 다른 화자(speaker)를 더 잘 나타내기 위해 제공될 수 있다. 예를 들면, 한 코드 북으 여성 화자의 음성을 나타내는데 사용될 수 있고, 다른 코드 북은 남성 화자의 음성을 나타내는데 사용될 수 있다. 스페인어, 일본어 등의 언어 구분(language differentiation)을 반영하는 부가적인 코드 북들도 제공될 수 있음을 잘 알 것이다. 다수의 코드 북을 사용하는 경우, 서로 다른 언어들을 구분하기 위해 서로 다른 PSTN전화 가입자 번호(telephone acess number)를 사용할 수 있다. 각각의 고유한 PSTN가입자 번호는 PSTN접속의 그룹과 관련되어 있으며, PSTN접속의 각 그룹은 특정 언어 및 해당 코드 북에 대응한다. 고유한 PSTN가입자 번호를 사용 하지 않을 때는, 사용자를 재촉하여 음성 메시지를 입력하기 이전에 DTMF숫자 등의 선정된 코드를 입력함으로써 정보를 제공하도록 할 수 있으며, 여기서 각각의 DTMF 숫자는 특정 언어 및 해당 코드 북들에 대응한다. 일단 발신자의 언어가 사용된 PSTN 회선 또는 수신된 DTMF숫자에 의해 식별되었으면, 디지탈 신호 처리기(214)는 디지탈 신호 처리기(214)에 저장되어 있는 선정된 언어 세트에 대응하는 선정된 코드 북 세트로부터 선정된 언어에 대응하는 선정된 코드 북을 선택한다. 그 후에 모든 음성 프롬프트는 식별된 언어로 주어질 수 있다. 입력 음성 처리기(input speech processor, 205)는 언어를 식별하는 정보를 수신하고 이 정보를 적절한 디지탈 신호 처리기(214)에 전송한다. 그 대신에 디지탈 신호 처리기(214)는 언어 또는 방언을 결정하기 위해 디지탈 음성 데이타를 분석하여 적절한 코드 북을 선택할 수 있다.
코드 북 식별자(code book identifier)를 사용하여 음성 메시지를 압축하는데 사용되었던 코드 북을 식별하게 된다. 이 코드 북 식별자는 이하에 기술하는 바와 같이 일련의 인덱스들과 함께 인코드되어 통신 장치(114)로 보내진다. 코드 북 식별자를 전달하는 또다른 방법은 코드 북을 식별하는 헤더를 인덱스 데이타를 포함하는 메시지에 부가하는 것이다.
본 발명의 또다른 실시예에서는, 단계(412)에서 음성 파라메타의 어레이로 세그먼트화되는 음성 파라메타의 수는 상기한 바와 같이 고정(fixed)되어 있는 것이 아니라 2차원 파라메타 매트릭스에 대응하는 파라메타 프레임들의 가변 갯수(variable number)를 나타낸다. 상기한 바와 같이, 8 음성 파라메타 프레임의 어레이는 동적인 음성의 기간에 대해서 최적이고, 16이상의 음성 파라메타 프레임의 어레이는 덜 동적인 음성 또는 침묵의 기간에 대해 최적인 것으로 간주된다. 이 실시예에서, 2차원 음성 데이타 매트릭스의 분석이 수행되고 괄호(504)에 의해 둘러싸인 음성 파라메타 어레이를 구성하는 프레임의 수를 결정하는데 사용된다. 적당한 템플릿을 갖는 부가적인 코드 북들이 또다른 갯수의 프레임들이 선택되는 기간 동안에 사용하기 위해 부가될 수 있다. 선택된 프레임들의 수는 통신 장치(114)로 전송되는 데이타와 함께 인코드된다.
도 8는 도 2에 도시한 페이징 단말기(106)에서 이용되는 디지탈 신호 처리기(214)의 전기 블럭선도를 나타낸 것이다. 디지탈 신호 처리와 관련된 계산을 수행하도록 특별히 설계된 몇가지 표준의 상용 디지탈 신호 처리기 IC 중 하나 등의 처리기(804)가 이용된다. 디지탈 신호 처리기 IC는 모토롤라사에 의해 제조된 DSP56100등의 몇가지 제품들이 이용가능하다. 처리기(804)는 처리기 어드레스 및 데이타 버스(808)을 거쳐 ROM(806), RAM(810), 디지탈 입력 포트(812), 디지탈 출력 포트(814) 및 제어 버스 포트(816)에 결합되어 있다. ROM(806)은 사용되는 메시지 전달 및 제어기(216)과의 제어 인터페이스의 타입에 필요한 신호 처리함수를 수행하기 위해 처리기(804)에 의해 사용되는 명령어(instruction)를 저장한다. ROM(806)은 압축된 음성 메시지 전달과 관련된 함수들을 수행하기 위해 사용되는 명령어들을 포함하고 있다. ROM(810)은 데이타 및 프로그램 변수들의 일시적 저장, 간격 어레이(610), 인덱스 어레이(612) 입력 음성 데이타 버퍼 및 출력 음성 데이타 버퍼를 제공한다. 디지탈 입력 포트(812)는 데이타 입력 함수와 데이타 출력 함수의 제어하에서 처리기(804)와 입력 시분할 멀티플렉스드 하이웨이(212)간의 인터페이스를 제공한다. 디지탈 출력 포트는 데이타 출력 함수의 제어하에서 처리기(804)와 출력 시분할 멀티플렉스드 하이웨이(218)간의 인터페이스를 제공한다. 제어버스 포트(816)은 처리기(804)와 디지탈 제어 버스(210)간의 인터페이스를 제공한다. 클럭(802)는 처리기(804)에 대한 타이밍 신호를 발생한다.
ROM(806)은 상기한 바와 같이 일례로서 이하의 것을 포함한다: 제어기 인터 페이스 함수 루틴, 데이타 입력 함수 루틴, 이득 정규화 함수 루틴, 프레이밍 함수 루틴, 단기 예측 함수 루틴, 파라메타 스태킹 함수 루틴, 2차원 세그먼트와 함수 루틴, 2차원 변환 함수 루틴, 매트릭스 양자화 함수 루틴, 데이타 출력 함수 루틴, 하나 이상의 코드 북, 및 매트릭스 가중 어레이 RAM(810)은 프로그램 변수들에 대한 일시적 저장, 입력 음성 버퍼 및 출력 음성 버퍼를 제공한다.
도 9는 상기한 바와 같이 2개의 10비트 인덱스를 인코드하는데 적합한 POCSAG 시그널링 포맷에서 이용되는 일반적인 POCSAG 프레임(900)을 나타낸 것이다. 이하에 나타낸 표Ⅰ은 일례로서 본 발명에 따라 디지탈 압축 음성을 전달하는데 사용되는 각 비트의 할당을 설명하고 있다. 각각의 POCSAG 프레임(900)은 정보, 2개의 10비트 코드워드와 2개의 함수 비트를 전달하는데 사용되는 22비트를 갖는다. 각각의 10비트 코드 워드는 1024개까지의 서로 다른 가능한 코드 북 인덱스 중 하나를 규정할 수 있다. 이하의 표Ⅰ에 나타낸 바와 같이 첫번째 함수 비트는 압축된 음성 세그먼트의 크기를 정의하는데 사용되는 세그먼트 크기 식별자이다. 함수 비트 Ⅰ는 단계(412)에서 8또는 16프레임의 음성 파라메타가 음성 파라메타의 어레이로 세그먼트화되었는지 여부를 가리킨다. 두번째 함수 비트는 음성 메시지를 압축하는데 사용되는 코드 북을 식별하는데 사용되는 코드 북 식별자이다. 나머지 비트들은 기술 분야에 공지된 에러 검출 및 정정을 위한 패리티 비트이다.
본 발명의 잇점은 이하의 예에 의해 나타내어질 수 있다. 초당 1200비트(bps)로 POCSAG프레임(900)에 대한 총 전송 시간은 26.7 밀리초이고, 2400bps로는 이 시간은 13.3ms로 감소된다. 본 발명의 특정 실시예에서는, POCSAG 프레임(900)은 2개의 240ms 음성 세그먼트를 나타내는 인덱스 어레이(612)의 2개의 인덱스를 포함한다. 이와 같이 본 발명의 특정 실시예에 따르면, 480ms의 음성은 13.3ms 만에 전송되며, 시간 압축비는 40대 1이다. 데이타 압축비는 또한 이 예에 대해 산출될 수도 있다. 종래의 전화 기술은 초당 64킬로비트의 레이트로 음성을 인코드한다. 이레이트에서 480ms의 음성은 30,720비트를 필요로 한다. 동일한 480ms의 음성은 32비트를 갖는 본 발명을 사용하여 전송될 수 있으며, 데이타 압축비는 960대 1이 된다. 그 결과의 데이타는 종래의 전화 기술의 비트율에 비해 초저속 비트율 음성 전송에 적당하다. 이전에 기술한 압축 프로세스에서 사용되는 파라메타는 변할 수 있으며 그 결과 압축비도 달라지고 음성 품질도 달라질 수 있다는 것은 잘 알 것이다.
[표 1]
Figure kpo00001
도 10는 페이징 수신기 등의 통신 장치(114)의 전기 블럭선도이다. 송신 안테나(110)으로부터 전송된 신호는 수신 안테나(112)에 의해 수신된다. 수신 안테나(112)는 수신기(1004)에 결합되어 있다. 수신기(1004)는 수신 안테나(112)에 의해 수신된 신호를 처리하여 전송된 인코드된 데이타의 복제물(replica)인 수신기 출력 신호(1016)을 생성한다. 인코드된 데이타는 POCSAG 프로토콜 등의 선정된 시그널링 프로토콜로 인코드된다. 디지탈 신호 처리기(1008)은 수신기 출력 신호(1016)을 처리하여 이하에 기술하는 바와 같이 신장된 디지탈 음성 데이타(1018)을 생성한다. 디지탈-아날로그 변환기는 신장된 디지탈 음성 데이타(1018)를 아날로그 신호로 변환하고, 이 아날로그 신호는 오디오 증폭기(1012)에 의해 증폭되어 스피커(1014)에 의해 출력된다.
디지탈 신호 처리기(1008)은 또한 통신 장치(114)의 여러가지 함수들의 기본적인 제어를 제공한다. 디지탈 신호 처리기(1008)은 제어 버스(1020)을 거쳐 배터리 세이버 스위치(battery saver switch, 1006), 코드 메모리(1022), 사용자 인터페이스(1024), 및 메시지 메모리(1026)에 결합되어 있다. 코드 메모리(1022)는 제어기가 선택적인 호출 특성(selective call feature)을 구현하는데 필요한 고유 식별 정보(unique identification information)또는 어드레스 정보를 저장한다. 사용자 인터페이스(1024)는 사용자에게 메시지의 수신을 표시하는 오디오, 시각 또는 기계적 신호를 제공하며, 또한 디스플레이 및 사용자가 수신기를 제어하기 위한 명령을 입력하기 위한 푸시 버튼도 포함할 수 있다. 메시지 메모리(1026)은 차후의 조사를 위해 메시지를 저장하거나 사용자가 그 메시지를 반복할 수 있도록 하기 위한 장소를 제공한다. 배터리 세이버 스위치(1006)은 시스템이 다른 페이저와 통신 중이거나 또는 전송을 하지 않는 기간 동안에 수신기로의 전력 공급을 선택적으로 디스에이블 시키는 수단을 제공함으로써, 기술 분야의 통상의 지식을 가진 자에게 공지된 방식으로 전력 소모를 저감시키고 배터리 수명을 연장시키게 된다.
도 11는 통신 장치(114)에서 사용되는 디지탈 신호 처리기(1008)의 전기 블럭선도를 나타낸 것이다. 처리기(1004)는 도 8에 도시한 처리기(804)와 유사하다. 그러나, 디지탈 음성 메시지를 신장시킬 때 수행되는 계산량은 압축 프로세스 동안에 행해지는 계산량 훨씬 적고 전력 소모가 휴대용 페이징 수신기에 있어서는 중요하기 때문에, 처리기(1104)는 더 느린 저전력 처리기일 수 있다. 처리기(1004)는 처리기 어드레스 및 데이타 버스(1110)를 거쳐 ROM(1106), RAM(1108), 디지탈 입력 포트(1112), 디지탈 출력 포트(1114), 및 제어 버스 포트(1116)에 결합되어 있다. ROM(1106)은 메시지를 신장시키고 제어 버스 포트(1116)과 인터페이스하는데 필요한 신호 처리 함수를 수행하기 위해 처리기(1104)가 사용하는 명령어를 저장한다. ROM(1106)은 압축된 음성 메시지 전달과 관련된 함수들을 수행하기 위한 명령어를 포함하고 있다. RAM(1108)은 데이타 및 프로그램 변수의 일시적 저장을 제공한다. 디지탈 입력 포트(1112)는 데이타 입력 함수의 제어하에서 처리기(1104)와 수신기(1004)간의 인터페이스를 제공한다. 디지탈 출력 포트(1114)는 출력 제어 함수의 제어하에서 처리기(1104)와 디지탈-아날로그 변환기간의 인터페이스를 제공한다. 제어 버스 포트(1116)은 처리기(1104)와 제어 버스(1020)간의 인터페이스를 제공한다. 클럭(1102)는 처리기(1104)의 타이밍 신호를 발생한다.
ROM(1106)은 일례로서 이하의 것들을 포함하고 있다.: 수신기 제어 함수 루틴 사용자 인터페이스 함수 루틴, 데이타 입력 함수 루틴, POCSAG 디코딩 함수 루틴 코드 메모리 인터페이스 함수 루틴, 어드레스 비교 함수 루틴, 역양자와 함수 루틴, 2차원 역변환 함수 루틴, 메시지 메모리 인터페이스 함수 루틴, 음성 합성기 함수 루틴, 출력 제어 함수 루틴 및 상기한 하나 이상의 코드 북.
도 12는 통신장치(114)의 동작을 설명하는 플로우챠트이다. 단계(1202)에서, 디지탈 신호 처리기(1008)은 수신기(1004)에서 전력을 공급하기 위해 배터리 세이버 스위치(1006)에 명령을 전달한다. 디지탈 신호 처리기(1008)은 페이징 단말기가 POCSAG 프리앰블로 변조된 신호를 전송하고 있는 것을 가리키는 비트 패턴을 위해 수신기 출력 신호를 모니터한다.
단계(1204)에서, POCSAG 프리앰블이 존재하는지에 관한 판정을 한다. 프리앰블이 검출되지 않은 경우, 디지탈 신호 처리기(1008)은 배터리 세이버 스위치(1006)에 선정된 시간 동안 수신기에 전력 공급을 중지하도록 명령을 내린다. 선정된 시간 이후에, 기술 분야에 공지된 바와 같이 단계(1202)에서 프리앰블을 모니터하는 일이 또다시 반복된다. 단계(1206)에서, POCSAG 프리앰블이 검출된 경우, 디지탈 신호 처리기(1008)은 수신기 출력 신호(1016)과 동기하게 된다.
동기가 달성되면, 디지탈 신호 처리기(1008)은 통신장치(114)에 할당된 프레임이 예기될 때까지 수신기로의 전력 공급을 디스에이블하도록 배터리 세이버 스위치(1006)에서 명령을 내릴 수 있다. 할당된 프레임에서, 디지탈 신호 처리기(1008)은 수신기(1004)에 전력을 공급하도록 배터리 세이버 스위치(1006)에 명령을 내린다. 단계(1208)에서, 디지탈 신호 처리기(1008)은 통신 장치(114)에 할당된 어드레스와 일치하는 어드레스에 대해 수신기 출력 신호(1016)을 모니터한다. 일치하지 않은 경우, 디지탈 신호 처리기(1008)은 동기화 코드 워드의 그 다음 전송 또는 그 다음 할당된 프레임때까지 수신기에의 전력공급을 중단하도록 배터리 세이버 스위치(1006)에 명령을 보내고, 그 후에 단계(1202)가 반복된다. 어드레스 일치가 있은 경우, 단계(1210)에서 수신기로의 전력이 유지되고, 데이타가 수신된다.
단계(1212)에서, 재생 음성의 품질을 향상시키기 위해 단계(1210)에서 수신된 데이타에 대해 에러 정정을 수행할 수 있다. POCSAG 프레임(900)에 나타낸 9 패리티 비트는 에러 정정 프로세스에서 사용된다. POCSAG 에러 정정 기술은 기술 분야에 통상의 지식을 가진 자에게는 잘 알려져 있다. 정정된 데이타는 단계(1214)에서 저장된다. 저장된 데이타는 단계(1216)에서 처리된다. 디지탈 음성 데이타의 처리는 이하에 기술하는 신장 프로세스(decompression process)이다.
단계(1218)에서, 디지탈 신호 처리기(1008)은 하나 이상의 인덱스로서 수신된 신장된 음성 데이타를 메시지 메모리(1026)에 저장하고 사용자에 호출음을 내도록 사용자 인터페이스에 명령을 보낸다. 단계(1220)에서, 사용자는 메시지를 재생 출력(play out)하도록 명령을 입력한다. 단계(1222)에서, 디지탈 신호 처리기(1008)은 메시지 메모리에 저장된 신장된 음성 데이타를 디지탈-아날로그 변환기(1010)에 전달함으로서 응답한다. 디지탈-아날로그 변환기(1010)은 신장된 디지탈 음성 데이타(1018)을 아날로그 신호로 변환하고, 이 아날로그 신호는 오디오 증폭기(1012)에 의해 증폭되어 스피커(1014)를 출력된다.
도 13는 디지탈 음성 신장 프로세스의 개요를 나타낸 플로우챠트이다. 단계(1304)에서, 페이징 프로토콜 디코더(paging protocol decoder)는 디지탈 음성 메시지를 나타내는 선정된 탬플릿 세트(a set of predetermined templates)의 하나 이상의 템플릿에 대응하는 일련의 인덱스로 인코드된 데이타를 수신한다. 이 인덱스는 수신된 POCSAG 인코드된 데이타(1302)로 부터 추출된 다음에 저장된다. 단계(1306)에서, 저장된 인덱스는 디지탈 신호 처리기(1008) ROM에 저장된 코드 북에서 대응하는 템플릿을 찾는데 사용된다.
단계(1308)에서 2차원 역변환이 선정된 매트릭스 역변환 함수를 사용하여 수신된 POCSAG 인코드된 데이타로부터 추출된 인덱스에 의해 특정된 코드 북에서의 템플릿에 대해 수행된다. 2차원 역변환은 원래의 음성 파라메타를 나타내는 LPC음성 파라메타의 어레이를 발생한다. 이용된 선정된 2차원 역변환 프로세스는 양호하게는 2차원 역이산 코사인 변환 프로세스이지만, 다른 변환들도 다른 변환들도 LPC 음성 파라메타의 어레이를 생성하는데 사용될 수 있다는 것을 잘 알 것이다. LPC 파라메타는 음성 데이타(1312)를 발생하는데 사용된다. 복구된 메시지 데이타는 디지탈-아날로그 변환을 위해 RAM(1108)에 저장되었다가 사용자가 요청하면 출력된다.
도 14는 도 13에 도시된 음성 신장된 프로세스(voice decompressed process)의 단계를 설명하는 도면이다. 단계(1304)에서 수신되어 저장된 인덱스는 인덱스 어레이(1402)에 저장된다. 인덱스 어레이(1402)내의 각 인덱스는 코드 북(604)내의 페이지를 가리킨다. 코드 북(604)는 압축 프로세스에서 사용되었던 템플릿을 복제하는 선정된 템플릿의 중복 세트로 이루어져 있다. 인덱스 어레이(1402)에 저장된 인덱스는 그들이 수신된 순서대로 한번에 하나씩 선택된다. 선정된 역 매트릭스 함수를 사용하여 2차원 역변환(1308)이 선택된 인덱스에 의해 특정된 코드 북내의 각 페이지에 대해 수행된다. 2차원 역변환(1308)은 음성 파라메타(1408)의 2차원 어레이를 생성한다. 파라메타는 LPC 음성 파라메타이고, 단계(1310)에서 음성 데이타(1312)을 발생하기 위해 음성 데이타 합성기에 의해 사용된다. 선정된 역 매트릭스 함수는 양호하게는 2차원 역이산 코사인 함수이다.
하나 이상의 선정된 언어에 대응하는 하나 이상의 코드 북은 ROM(1106)에 저장될 수 있다. 적절한 코드 북이 수신기 출력 신호(1016)에서 수신된 데이타로 인코드된 식별자에 근거하여 디지탈 신호 처리기(1008)에 의해 선택된다.
도 15에 도시한 본 발명의 또다른 실시예에서는, 수신 프로세스에서 요구되는 디지탈 신호 처리는 코드 북(604)에 저장된 템플릿 사전 처리(pre-processing)함으로써 감소된다. 코드 북(604)내의 템플릿은 근본적으로 템플릿에 행해지는 2차원 역변환으로부터 얻어지는 LPC파라메타의 어레이와 동일 사이즈이다. 이 결과 생기는 LPC파라메타의 어레이가 근본적으로 원래의 템플릿과 동일 사이즈이기 때문에, 템플릿을 포함하는 코드 북(604)는 LPC 파라메타의 어레이를 포함하는 코드 북(604)으로 대체된다. 이와같이 함에 있어서, 2차원 역변환이 전개 동안에 단지 한번만 행해지며, 각 음성 메시지 세그먼트를 처리하는 동안 반복될 필요는 없다. 음성 파라메타(1408)의 2차원 어레이는 코드 북(1504)의 페이지를 카피만 함으로써 생성된다.
도 16는 도 7에 도시한 다른 실시예와 관련된 세그먼트화된 음성 신장된 프로세스(segmented voice decompressed process)의 단계를 설명하는 도면이다. 인덱스 어레이(1602)는 각각의 세그먼트화된 페이지에 대해 저장된 2개의 인덱스를 갖는다. 첫번째 인덱스는 압축 프로세스 동안에 압축된 첫번째 세그먼트에 대응하는 템플릿 세트 Ⅰ(703)의 템플릿을 선택한다. 두번째 인덱스는 압축 프로세스 동안에 압축된 두번째 세그먼트에 대응하는 템플릿 세트Ⅱ(704)의 템플릿을 선택한다. 첫번째 선택된 페이지로부터의 템플릿 세트Ⅰ(703)의 템플릿에 의해 나타내어진 세그먼트 Ⅰ는 두번째 선택된 페이지로부터의 템플릿 세트 Ⅱ(704)의 템플릿에 의해 나타내어진 세그먼트 Ⅱ와 결합되어 세그먼트Ⅰ(1609)와 세그먼트Ⅱ(1608)로 이루어진 2차원 변환된 어레이를 형성한다. 2차원 역변환(1306)이 수행되어 음성 파라메타(1408)의 2차원 어레이를 생성한다.
상기한 바와 같이, 본 발명은 음성 메시지를 디지탈적으로 인코드하여 그 결과 생기는 데이타가 고도로 압축되고 페이징 채널 또는 다른 유사한 통신 채널을 통해 보내온 정상적 데이타와 쉽게 혼합될 수 있도록 되어 있다. 게다가, 음성 메시지는 페이저 또는 유사한 휴대용 장치에서의 처리가 최소화되도록 디지탈적으로 인코드되어 있다. 본 발명의 특정 실시예가 도시되고 기술되어 있지만, 기술 분야의 전문가라면 부가적인 변경 및 개선을 할 수 있다는 것을 잘 알 것이다.

Claims (10)

  1. 저속 비트율 음성 전송(low bit rate speech transmission)을 제공하기 위해 음성 메시지를 처리하는 비대칭 음성 압축 처리기(astmmetric voice compression processor)에 있어서, 디지탈화된 음성 데이타(digitized speech data)를 발생하기 위해 상기 음성 메시지를 처리하는 입력 음성 처리기,상기 디지탈화된 음성 데이타로부터 음성 파라메타를 발생하고, 상기 음성 파라메타를 파라메타 프레임의 시퀀스(a sequence of parameter frames)로 이루어지는 2차원 파라메타 매트릭스로 정렬하며, 2차원 매트릭스(two dimensional transform matrix)를 구하기 위해 선정된 2차원 매트릭스 변환 함수를 사용하여 상기 2차원 파라메타 매트릭스를 변환하고, 선정된 템플릿 세트(a set of predetermined templates)의 템플릿들과 상기 2차원 변환 매트릭스간의 간격을 나타내며, 상기 선정된 템플릿 세트의 템플릿에 대응하는 인덱스에 의해 식별되는 간격 값(distance values)을 도출하며, 상기 도출된 간격 값을 비교하고 상기 도출된 간격 값 중 최단 간격을 갖는 상기 선정된 템플릿 세트의 템플릿에 대응하는 인덱스를 그로부터 선택하도록 프로그램된 신호처리기, 및 상기 선택된 최단 간격을 갖는 상기 선정된 템플릿 세트의 템플릿에 대응하는 상기 인덱스를 전송하는 송신기를 구비하는 비대칭 음성 압축 처리기.
  2. 제1항에 있어서, 상기 선정된 2차원 매트릭스 변환 함수는 2차원 이산 코사인 변환 함수인 비대칭 음성 압축 처리기.
  3. 제1항에 있어서, 전송하기 위해 상기 선택된 최단 간격에 대응하는 상기 인덱스를 선정된 시그널링 프로토콜(signaling protocol)로 인코드하는 인코더를 더 구비하는 비대칭 음성 압축 처리기.
  4. 제1항에 있어서, 상기 신호 처리기는 상기 음성 메시지를 나타내는 음성 파라메타의 2차원 음성 데이타 매트릭스를 발생하도록 더 프로그램되어 있고, 상기 파라메타 프레임의 시퀀스는 상기 2차원 음성 데이타 매트릭스의 일부를 포함하는 비대칭 음성 압축처리기.
  5. 제4항에 있어서, 상기 신호 처리기는 인덱스의 시퀀스를 인덱스어레이에 저장하는 메모리를 더 구비하며, 인덱스는 상기 2차원 음성 데이타 매트릭스의 일부를 가장 잘 나타내는 최단 간격을 갖는 템플릿에 대응하는 비대칭 음성 압축 처리기.
  6. 제1항에 있어서, 상기 신호처리기는,
    Figure kpo00002
    를 이용하여 간격 값을 산출함으로써 상기 간격 값을 도출하되, 여기서, dK는 상기 선정된 템플릿 세트의 템플릿과 상기 2차원 변환 매트릭스에 대한 간격을 나타내고, (aij-b(k)ij)는 상기 선정된 템플릿 세트의 각 템플릿의 대응하는 셀들과 상기 2차원 변환 매트릭스 간의 차이을 나타내며, wij는 선정된 가중 어레이(weighting array)의 대응하는 셀을 나타내는 비대칭 음성 압축 처리기.
  7. 제1항에 있어서, 상기 선정된 템플릿의 세트는 제1의 선정된 템플릿 세트와 적어도 제2의 선정된 템플릿 세트를 포함하며, 상기 신호 처리기는 상기 제1의 선정된 템플릿 세트의 각 템플릿과 상기 2차 원 변환 매트릭스의 제1의 부분간의 간격을 나타내는 제1 간격 값을 도출하되, 상기 제1 간격 값은 상기 제1의 선정된 템플릿 세트의 각 템플릿에 대응하는 제1인덱스에 의해 식별되고, 상기 신호처리기는 상기 적어도 제2의 선정된 템플릿 세트의 각 템플릿과 상기 2차원 변환 매트릭스의 적어도 제2의 부분 간의 간격을 나타내는 적어도 제2 간격 값을 도출하도록 더 프로그램되어 있고, 상기 적어도 제2 간격 값은 상기 적어도 제2의 선정된 템플릿 세트의 각 템플릿에 대응하는 적어도 제2 인덱스에 의해 식별되며, 상기신호처리기는, 상기 제1의 선정된 템플릿 세트에 대해 상기 제1 간격 값의 제1의 세트를 도출하고, 상기 적어도 제2의 선정된 템플릿 세트에 대해 상기 적어도 제2 간격 값의 적어도 제2의 세트를 더 도출함으로써 간격 값 세트를 도출하며, 상기 신호 처리기는, 상기 도출된 제1 간격 값의 상기 제1의 세트를 비교하고 상기 적어도 제1 간격 값의 상기 제1의 세트에 대해 최단 간격을 갖는 제1 간격 값을 그로부터 선택하고, 상기 도출된 적어도 제2 간격 값의 상기 적어도 제2의 세트를 더 비교하고 상기 적어도 제2 간격 값의 상기 적어도 제1의 세트에 대해 최단 간격을 갖은 적어도 제2 간격 값을 그로부터 선택하며, 상기 송신기는 상기 선택된 제1 간격 값에 대응하는 상기 제1 인덱스를 전송하고, 상기 선택된 적어도 제2 간격 값에 대응하는 적어도 제2 인덱스를 더 전송하는 비대칭 음성 압축 처리기.
  8. 제1항에 있어서, 제2의 선정된 템플릿 세트는 상기 제1의 선정된 템플릿 세트보다 적은 수의 템플릿을 포함하는 비대칭 음성 압축 처리기.
  9. 제1항에 있어서, 상기 선정된 템플릿 세트는 코드 북(code-book)을 나타내며, 상기 신호 처리기는 상기 음성 메시지의 특성을 결정하기 위해 발생된 상기 음성 파라메타를 분석하고, 상기 결정된 음성 메시지의 특성에 대응하는 코드 북 세트의 선정된 코드 북을 선택하도록 더 프로그램되어 있고, 상기 송신기는 상기 선택된 선정된 코드 북을 식별하는 코드 북 식별자를 더 전송하는 비대칭 음성 압축 처리기.
  10. 제1항에 있어서, 선정된 템플릿 세트는 코드 북을 나타내고, 상기 입력 음성 처리기는 선정된 언어의 상기 음성 메시지를 수신하고 상기 선정된 언어를 식별하는 정보를 더 수신하며, 상기 신호 처리기는 선정된 언어의 세트에 대응하는 선정된 코드 북의 세트로 부터 상기 선정된 언어에 대응하는 선정된 코드 북을 선택하고, 상기 송신기는 상기 선택된 선정된 코드 북을 식별하는 코드 북 식별자를 전송하는 비대칭 음성 압축 처리기.
KR1019970703226A 1995-09-14 1996-06-28 비대칭 음성 압축 프로세스를 이용한 초저속 비트율 음성 메시지 전달 시스템 KR100257361B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US08/528,455 1995-09-14
US08/528,455 US5781882A (en) 1995-09-14 1995-09-14 Very low bit rate voice messaging system using asymmetric voice compression processing
US8/528455 1995-09-14

Publications (2)

Publication Number Publication Date
KR970707528A KR970707528A (ko) 1997-12-01
KR100257361B1 true KR100257361B1 (ko) 2000-05-15

Family

ID=24105751

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019970703226A KR100257361B1 (ko) 1995-09-14 1996-06-28 비대칭 음성 압축 프로세스를 이용한 초저속 비트율 음성 메시지 전달 시스템

Country Status (9)

Country Link
US (1) US5781882A (ko)
EP (1) EP0792502B1 (ko)
JP (1) JPH10509534A (ko)
KR (1) KR100257361B1 (ko)
CN (1) CN1121682C (ko)
AT (1) ATE222394T1 (ko)
DE (1) DE69622985T2 (ko)
ES (1) ES2183000T3 (ko)
WO (1) WO1997010584A1 (ko)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6137863A (en) * 1996-12-13 2000-10-24 At&T Corp. Statistical database correction of alphanumeric account numbers for speech recognition and touch-tone recognition
US6154579A (en) * 1997-08-11 2000-11-28 At&T Corp. Confusion matrix based method and system for correcting misrecognized words appearing in documents generated by an optical character recognition technique
US6219453B1 (en) 1997-08-11 2001-04-17 At&T Corp. Method and apparatus for performing an automatic correction of misrecognized words produced by an optical character recognition technique by using a Hidden Markov Model based algorithm
US6208965B1 (en) 1997-11-20 2001-03-27 At&T Corp. Method and apparatus for performing a name acquisition based on speech recognition
US6205428B1 (en) * 1997-11-20 2001-03-20 At&T Corp. Confusion set-base method and apparatus for pruning a predetermined arrangement of indexed identifiers
US6223158B1 (en) 1998-02-04 2001-04-24 At&T Corporation Statistical option generator for alpha-numeric pre-database speech recognition correction
US6205261B1 (en) 1998-02-05 2001-03-20 At&T Corp. Confusion set based method and system for correcting misrecognized words appearing in documents generated by an optical character recognition technique
US6400805B1 (en) 1998-06-15 2002-06-04 At&T Corp. Statistical database correction of alphanumeric identifiers for speech recognition and touch-tone recognition
US7937260B1 (en) * 1998-06-15 2011-05-03 At&T Intellectual Property Ii, L.P. Concise dynamic grammars using N-best selection
US7031925B1 (en) 1998-06-15 2006-04-18 At&T Corp. Method and apparatus for creating customer specific dynamic grammars
JP3784583B2 (ja) * 1999-08-13 2006-06-14 沖電気工業株式会社 音声蓄積装置
US7778826B2 (en) * 2005-01-13 2010-08-17 Intel Corporation Beamforming codebook generation system and associated methods
KR101218776B1 (ko) 2006-01-11 2013-01-18 삼성전자주식회사 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2305855A1 (fr) * 1975-03-28 1976-10-22 Westinghouse Electric Corp Transistor mnos a drain-source protege vis-a-vis des radiations
US4479124A (en) * 1979-09-20 1984-10-23 Texas Instruments Incorporated Synthesized voice radio paging system
US4612414A (en) * 1983-08-31 1986-09-16 At&T Information Systems Inc. Secure voice transmission
US4769642A (en) * 1985-12-31 1988-09-06 Motorola, Inc. Paging receiver with LPC speech synthesizer
US4701943A (en) * 1985-12-31 1987-10-20 Motorola, Inc. Paging system using LPC speech encoding with an adaptive bit rate
US4811376A (en) * 1986-11-12 1989-03-07 Motorola, Inc. Paging system using LPC speech encoding with an adaptive bit rate
US4815134A (en) * 1987-09-08 1989-03-21 Texas Instruments Incorporated Very low rate speech encoder and decoder
US4873520A (en) * 1987-11-02 1989-10-10 Motorola, Inc. Paging receiver for storing digitized voice messages
US4885577A (en) * 1988-03-02 1989-12-05 Motorola, Inc. Paging system for providing a data message and a voice message to a unique address of a paging receiver
JPH02287399A (ja) * 1989-04-28 1990-11-27 Fujitsu Ltd ベクトル量子化制御方式
US4975956A (en) * 1989-07-26 1990-12-04 Itt Corporation Low-bit-rate speech coder using LPC data reduction processing
JP3102015B2 (ja) * 1990-05-28 2000-10-23 日本電気株式会社 音声復号化方法
US5371853A (en) * 1991-10-28 1994-12-06 University Of Maryland At College Park Method and system for CELP speech coding and codebook for use therewith
US5495555A (en) * 1992-06-01 1996-02-27 Hughes Aircraft Company High quality low bit rate celp-based speech codec
US5327520A (en) * 1992-06-04 1994-07-05 At&T Bell Laboratories Method of use of voice message coder/decoder
FR2700632B1 (fr) * 1993-01-21 1995-03-24 France Telecom Système de codage-décodage prédictif d'un signal numérique de parole par transformée adaptative à codes imbriqués.

Also Published As

Publication number Publication date
EP0792502A1 (en) 1997-09-03
WO1997010584A1 (en) 1997-03-20
CN1165574A (zh) 1997-11-19
US5781882A (en) 1998-07-14
EP0792502B1 (en) 2002-08-14
ES2183000T3 (es) 2003-03-16
EP0792502A4 (en) 1998-12-23
ATE222394T1 (de) 2002-08-15
DE69622985T2 (de) 2002-11-28
DE69622985D1 (de) 2002-09-19
KR970707528A (ko) 1997-12-01
JPH10509534A (ja) 1998-09-14
CN1121682C (zh) 2003-09-17

Similar Documents

Publication Publication Date Title
US6018706A (en) Pitch determiner for a speech analyzer
KR100257361B1 (ko) 비대칭 음성 압축 프로세스를 이용한 초저속 비트율 음성 메시지 전달 시스템
EP2207335B1 (en) Method and apparatus for storing and forwarding voice signals
EP1089257A2 (en) Header data formatting for a vocoder
US5519779A (en) Method and apparatus for inserting signaling in a communication system
WO1999000791A1 (en) Method and apparatus for improving the voice quality of tandemed vocoders
WO1996027184A1 (en) A communication system and method using a speaker dependent time-scaling technique
EP0676102A1 (en) Apparatus and method for adapting a digital radiotelephone system to increased subscriber traffic
JPH05505928A (ja) 移動無線電話通信システムにおけるトランスコーダおよび改良された陸上システム
EP1089255A2 (en) Method and apparatus for pitch determination of a low bit rate digital voice message
US5666350A (en) Apparatus and method for coding excitation parameters in a very low bit rate voice messaging system
WO1996027249A1 (en) Voice compression in a paging network system
JPH118698A (ja) 電話回線交換網の網伝送容量を高める方法と装置、並びに網付属装置、フレームフォーマットを変更する装置、及び電話回線交換網
US6691081B1 (en) Digital signal processor for processing voice messages
EP0850471B1 (en) Very low bit rate voice messaging system using variable rate backward search interpolation processing
JP2010092059A (ja) 可変率音声符号化に基づいた音声合成装置
US5806038A (en) MBE synthesizer utilizing a nonlinear voicing processor for very low bit rate voice messaging
US6952669B2 (en) Variable rate speech data compression
WO1997013242A1 (en) Trifurcated channel encoding for compressed speech
JPH08289029A (ja) 多地点通信装置
CN115331681A (zh) 一种基于感兴趣区域的音频增强编码传输系统及方法
JP2001007924A (ja) デジタル移動通信方式
JP2000078246A (ja) 無線電話装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20050107

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee