KR970707528A - 비대칭 음성 압축 프로세스를 이용한 초저속 비트율 음성 메시지 전달 시스템(Very Low Bit Rate Voice Messaging System Using Asymmetric Voice Compression Processing) - Google Patents

비대칭 음성 압축 프로세스를 이용한 초저속 비트율 음성 메시지 전달 시스템(Very Low Bit Rate Voice Messaging System Using Asymmetric Voice Compression Processing)

Info

Publication number
KR970707528A
KR970707528A KR1019970703226A KR19970703226A KR970707528A KR 970707528 A KR970707528 A KR 970707528A KR 1019970703226 A KR1019970703226 A KR 1019970703226A KR 19970703226 A KR19970703226 A KR 19970703226A KR 970707528 A KR970707528 A KR 970707528A
Authority
KR
South Korea
Prior art keywords
predetermined
speech
template
voice message
dimensional
Prior art date
Application number
KR1019970703226A
Other languages
English (en)
Other versions
KR100257361B1 (ko
Inventor
월터 리 데이비스
지안-쳉 휴앙
레온 쟈신스키
Original Assignee
존 에이치.무어
모토롤라, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 존 에이치.무어, 모토롤라, 인크. filed Critical 존 에이치.무어
Publication of KR970707528A publication Critical patent/KR970707528A/ko
Application granted granted Critical
Publication of KR100257361B1 publication Critical patent/KR100257361B1/ko

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B5/00Near-field transmission systems, e.g. inductive or capacitive transmission systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Devices For Executing Special Programs (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Abstract

저속 비트율 음성전송을 제공하기 위해 음성 메시지를 처리하는 장치 및 방법은 파라메타 프레임 시퀀스를 포함하는 2차원 파라메타 미트랙스(502)로 정렬된 음성 파라메타를 발생하기 위해 상기 음성 메시지를 처리한다. 2차원 파라메타 매트릭스(502)는 2차원 변환된 어레이(506)를 얻기 위해 선정된 2차원 매트릭스 변환 함수(414)을 이용하여 변환된다. 선정된 템플릿 세트의 템플릿들과 2차원 변환된 어레이(506)간의 간격을 나타내는 간격 값들이 그 다음에 도출된다. 도출된 간격 값들은 선정된 템플릿 세트의 템플릿들을 식별하는 인덱스에 의해 식별된다. 도출된 간격 값들은 비교되고, 최단 간격을 갖는 선정된 템플릿 세트의 템플릿에 대응하는 인덱스가 선택된 다음에 전송된다.

Description

비대칭 음성 압축 프로세스를 이용한 초저속 비트율 음속 메시지 전달 시스템(Very Low Bit Rate Voice Messaging System Using Asymmetric Voice Compression Processing)
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제1도는 본 발명에 따른 디지탈 음성 압축 프로세서(digital voice compression process)를 이용하는 통신시스템의 블럭선도.

Claims (62)

  1. 저속 비트율을 음성 전송(low bit rate speech trasmisson)을 제공하기 위해 음성 메시지(voice message)를 처리하는 방법에 있어서, 음성 파라메타(speech parameter)을 발생하기 위해 상기 음성 메시지를 처리하는 단계;상기 음성 파라메타를 파라메타 프레임 시퀀스(a sequence of parameter frames)로 이루어지는 2차원 파라메타 매트릭스로 정렬하는 단계;2차원 변환 파라메타(trasform matrix)를 구하기 위해 선정된 2차원 메트릭스 변환 함수를 사용하여 상기 2차원 파라메타 매트릭스를 변환하는 단계;선정된 템플릿 세트(a set of predetermined tremplates)의 템플릿들과 상기 2차원 변환 메트릭스간의 간격을 나타내는 간격 값 세트(a set of distance values)를 도출(derive)하는 단계;상기 도출된 간격 값 세스를 비교하여 그로부터 상기 도출된 간격 값 세스중 최단 간격을 갖는 상기 선정된 템플릿 세트의 템플릿에 대응하는 인덱스(index)를 선택하는 단계; 및 선택된 최단 간격을 갖는 상기 선정된 템플릿 세트의 템플릿에 대응하는 상기 인덱스를 전송하는 단계를 포함하되, 상기 도출된 간격값 세트는 상기 선정된 템플릿 세트의 템플릿을 식별하는 인덱스에 의해 식별되는 것을 특징으로 하는 음성 메시지 처리 방법.
  2. 제1항에 있어서, 상기 음성 메시지는 아날로그 음성 메시지이고, 상기 음성메시지 처리단계는, 음성 메시지 샘플들(voice message samples)을 발생하기 위해 상기 음성 메시지를 샘플링하는 단계는; 및 디지탈화된 음성 샘플들(digitized speech samples)을 발생하기 위해 상기 음성 메시지 샘플들을 디지탈화하는 단계를 포함하는 것을 특징으로 하는 음성 메시지 처리 방법.
  3. 제1항에 있어서, 상기 음성 메시지는 디지탈화된 음성 샘플들(digitized speech samples)로 디지탈화되고, 상기 음성 메시지 처리 단계는, 선정된 갯수의 디지탈화된 음성 샘플들을 나타내는 음성 프레임(speech frames)을 발생하는 단계: 및 상기 음성 파라메타를 도출하기 위해 상기 음성 프레임에 대해 음성 분석(speech analysis)을 행하는 단계를 포함하는 것을 특징으로 하는 음성 메시지 처리 방법.
  4. 제1항에 있어서, 상기 선정된 2차원 매트릭스 변환 함수는 2차원 이산 코사인 변환 함수인 것을 특징으로 하는 음성 메시지 처리 방법.
  5. 제1항에 있어서, 전송을 위해 상기 선택된 최단 간격에 대응하는 인덱스를 선정된 시그널링 프로토콜(signaling protocol)로 인코드(encode)하는 단계를 더 포함하는 것을 특징으로 하는 음성 메시지 처리 방법.
  6. 제1항에 있어서, 상기 처리 단계는 상기 음성 메시지를 나타내는 음성 파라메타의 2차원 음성 데이타 매트릭스를 발생하는 단계를 더 포함하며, 상기 파라메타 프레임 시퀀스는 상기 2차원 음성 데이타 매트릭스의 일부분을 포함하는 것을 특징으로 하는 음성 메시지 처리 방법.
  7. 제6항에 있어서, 상기 2차원 음성 데이타 매트릭스의 일부분은 상기 2차원 파라메타 매트릭스에 대응하는 선정된 갯수의 파라메타 프레임들(a predetermined number of parameter frames)을 포함하는 것을 특징으로 하는 음성 메시지 처리 방법.
  8. 제6항에 있어서, 상기 2차원 음성 데이타 매트릭스의 일부분은 상기 2차원 파라메타 매트릭스에 대응하는 가변 갯수의 파라메타 프레임들(a variable number of parameter frames)을 포함하는 것을 특징으로 하는 음성 메시지 처리 방법.
  9. 제6항에 있어서, 상기 방법은, 인덱스 시퀀스(a sequence of indexes)를 인데스 어레이(a index array)에 저장하는 단계를 더 포함하며, 인덱스는 상기 2차원 음성 데이타 매트릭스의 일부분을 가장 잘 나타내는 최단 간격을 갖는 템플릿에 대응하는 것을 특징으로 하는 음성 메시지 처리 방법.
  10. 제9항에 있어서, 전송을 위해 상기 인덱스 어레이를 선정된 시그널링 프로토콜(signaling protocol)로 인코드(encode)하는 단계를 더 포함하는 것을 특징으로 하는 음성 메시지 처리 방법.
  11. 제1항에 있어서, 상기 도출 단계는, 이하의 식를 사용하여 간격 값(distance value)을 산출하는 단계를 포함하되, 여기서, dk는 상기 선정된 템플릿 세트의 템플릿과 상기 2차원 변환 매트릭스에 대한 간격을 나타내고, (ai,j-b(k)i,j)는 선정된 템플릿 세트의 각 템플릿의 대응하는 셀들과 상기 2차원 변환 매트릭스간의 차이를 나타내며, wi,j는 선정된 가중 어레이의 대응하는 셀을 나타내는 것을 특징으로 하는 음성 메시지 처리방법.
  12. 제1항에 있어서, 상기 선정된 템플릿 세트는 제1의 선정된 템플릿 세트와 적어도 제2의 선정된 템플릿 세트를 포함하며, 상기 간격 값 도술 단계는, 상기 제1의 선정된 템플릿 세트의 각 템플릿과 상기 2차원 변환 매트릭스의 제1의 부분간의 간격을 나타내는 제1간격 값을 도출하되, 상기 제1간격 값은 상기 제1의 선정된 템플릿 세트의 각 템플릿에 대응하는 제1인덱스의해 식별되고, 또한 상기 적어도 제2의 선정된 템플릿 세트의 각 템플릿과 상기 2차원 변환 매트릭스의 적어도 제2의 부분간의 간격을 나타내는 적어도 제2간격 값을 도출하되, 상기 적어도 제2간격 값은 상기 적어도 제2의 선정된 템플릿 세트의 각 템플릿에 대응하는 적어도 제2인덱스에 의해 식별되며, 상기 간격 값 세트 도출 단계는, 상기 제1의 선정된 템플릿 세트에 대해 상기 제1간격 값의 제1의 세트를 도출하고, 또한, 상기 적어도 제2의 선정된 템플릿 세트에 대해 상기 적어도 제2간격값의 적어도 제2의 세트를 도출하며, 상기 비교 단계는, 상기 도출된 제1간격 값의 상기 제1세트를 비교하여 그로부터 상기 적어도 제1간격 값의 상기 제1의 세트에 대해 최단 간격을 갖는 제1간격 값을 선택하고, 또한 상기 도출된 적어도 제2간격 값의 상기 적어도 제2의 세트를 비교하여 그로부터 상기 적어도 제2간격값의 상기 적어도 제1의 세트에 대해 최단 간격을 갖는 적어도 제2간격 값을 선택하며, 상기 전송 단계는, 상기 선택된 제1간격 값의 대응하는 상기 1인덱스를 전송하고, 또한 상기 선택된 적어도 제2간격 값에 대응하는 적어도 제2인덱스를 전송하는 것을 특징으로 하는 음성 메시지 처리 방법.
  13. 제1항에 있어서, 제2의 선정된 템플릿 세트는 제1의 선정된 템플릿 세트보다 더 작은 수의 템플릿을 포함하는 것을 특징으로 하는 음성 메시지 처리 방법.
  14. 제1항에 있어서, 상기 선정된 템플릿 세트는 코드 북(code book)을 나타내며, 상기 방법은, 상기 음성 메시지의 특성을 결정하기 위해 발생된 상기 음성 파라메타를 분석하는 단계;상기 결정된 음성 메시지의 특성에 대응하는 코드북 세트의 선정된 코드 북을 선택하는 단계; 및 상기 선택된 선정된 코드 북을 식별하는 코드북 식별자를 추가로 전송하는 단계를 더 포함하는 것을 특징으로 하는 음성 메시지 처리 방법.
  15. 제14항에 있어서, 전송을 위해 상기 인덱스와 상기 선택된 선정된 코드 북을 식별하는 코드 북 식별자를 선정된 시그널링 프로토콜로 인코드하는 단계를 더 포함하는 것을 특징으로 하는 음성 메시지 처리 방법.
  16. 제1항에 있어서, 선정된 템플릿 세트는 코드 북을 나타네고, 상기 방법은, 선정된 언어로 된 상기 음성 메시지를 수신하고 상기 선정된 언어를 식별하는 정보도 추가적으로 수신하는 단계;선정된 언어 세트에 대응하는 선정된 코드 북 세트로부터 상기 선정된 언어에 대응하는 선정된 코드 북을 선택하는 단계; 및 상기 선택된 선정된 코드 북을 식별하는 코드 북 식별자를 추가적으로 전송하는 단계를 더 포함하는 것을 특징으로 하는 음성 메시지 처리 방법.
  17. 제16항에 있어서, 상기 음성 메시지는 전화망(telephone network)을 통해 전달되며, 전화 가입자 번호는 상기 선정된 언어를 식별하는 정보를 제공하는 것을 특징으로 하는 음성 메시지 처리 방법.
  18. 제16항에 있어서, 상기 음성 메시지 전화망(telephone network)을 통해 전달되며, 사용자는 상기 선정된 언어를 식별하는 정보를 제공하는 것을 특징으로 하는 음성 메시지 처리 방법.
  19. 제18항에 있어서, 사용자는 선정된 코드를 입력함으로써 상기 선정된 언어를 식별하는 정보를 제공하는 것을 특징으로 하는 음성 메시지 처리 방법.
  20. 음성 메시지(voice message)를 제공하기 위해 저속 비트율 음성 전송(lowbit rate speech transmisson)를 처리하는 방법에 있어서, 선정된 템플릿 세트의 하나 이상의 템플릿에 대응하는 하나 이상의 인덱스를 수신하는 단계;상기 수신된 하나 이상의 인덱스에 대응하는 상기 하나 이상의 템플릿으로부터 음성 파라메타의 어레이(무 array of speech praameters)를 발생하는 단계;신장된 디지탈 음성 데이타(decompressed digital speech data)를 발생하기 위해 상기 음성 파라메타의 어레이를 처리하는 단계; 및 상기 신장된 디지탈 음성 데이타로부터 음성 메시지를 발생하는 단계를 포함하는 것을 특징으로 하는 저속 비트율 음성 전송 처리 방법.
  21. 제20항에 있어서, 상기 선정된 템플릿 세트를 저장하는 단계를 더 포함하는 것을 특징으로 하는 저속 비트율 음성 전송 처리 방법.
  22. 제21항에 있어서, 상기 저장된 선정된 템플릿 세트를 상기 음성 메시지를 압축하는데 이용된 선정된 템플릿의 중복 세트(a duplicate set of predetermined templates)에 대응하는 것을 특징으로 하는 저속 비트율 음성 전송 처리 방법.
  23. 제21항에 있어서, 상기 저장된 선정된 템플릿 세트는 저장되기 이전에 선정된 메트릭스 역변환 함수를 사용하여 변환되었던 상기 음성 메시지를 압축하는데 이용된 기선정 템플릿의 중복 세트에 대응하는 것을 특징으로 하는 저속 비트율 음성 전송 처리 방법.
  24. 제20항에 있어서, 상기 음성 파라메타의 어레이의 발생 단계는 선정된 매트릭스 역변환 함수를 사용하여 상기 하나 이상의 템플릿을 변환하는 단계를 포함하는 것을 특징으로 하는 저속 비트율 음성 전송 처리 방법.
  25. 제21항에 있어서, 상기 저장된 선정된 템플릿 세트는 선정된 언어에 대응하는 코드 북을 나타내고, 하나 이상의 선정된 언어에 대응하는 하나 이상의 코드 북이 저장되어 있는 것을 특징으로 하는 저속 비트율 음성 전송 처리 방법.
  26. 제25항에 있어서, 상기 저장 단계는 저장되어 있는 하나 이상의 코드 북을 식별하는 코드북 식별자를 추가적으로 저장하는 것을 특징으로 하는 저속 비트율 음성 전송 처리 방법.
  27. 제26항에 있어서, 저장되어 있는 하나 이상의 코드 북을 식별하는 상기 코드북 식별자는 사용자에 의해 제공된 정보에 대응하는 것을 특징으로 하는 저속 비트율 음성 전송 처리 방법.
  28. 제27항에 있어서, 상기 사용자에 의해 제공된 정보는 전화 가입자 번호에 대응하는 것을 특징으로 하는 저속 비트율 음성 전송 처리 방법.
  29. 제23항에 있어서, 상기 선정된 매트릭스 역변환 함수는 2차원 역이산 코사인 함수(inverse two dismensional discrete cosine function)인 것을 특징으로 하는 저속 비트율 음성 전송 처리 방법.
  30. 제26항에 있어서, 선정된 코드 북을 식별하는 상기 하나 이상의 인덱스 및 코드 북 식별자는 수신되어 선정된 시그널링 프로토콜로 인코드되는 것을 특징으로 하는 저속 비트율 음성 전송 처리 방법.
  31. 제30항에 있어서, 상기 음성 파라메타의 어레이는 압축을 위해 음성 파라메타 프레임들로 정렬되고, 상기 음성 파라메타 프레임은 수신되어 상기 선정된 시그널링 크로토콜로 인코드되는 것을 특징으로 하는 저속 비트율 음성 전송 처리 방법.
  32. 저속 비트율 음성 전송(low bit rate speech transmission)을 제공하기 위해 음성 메시지(voice message)를 처리하는 비대칭 음성 압축 처리기(asymmetric voice compression processor)에 있어서, 디지탈화된 음성 데이타(digitized speech data)를 발생하기 위해 상기 음성 메시지를 처리하는 입력 음성 처리기;상기 디지탈화된 음성 데이타로부터 음성 파라메타를 발생하고, 상기 음성 파라메타를 파라메타 프레임 시퀀스(a sequence of parameter frames)로 이루어진는 2차원 파라메타 매트릭스로 정력하며, 2차원 변환 매트릭스(transform matrix)를 구하기 위해 선정된 2차원 매트릭스 변환 함수를 사용하여 상기 2차원 파라메타 매트릭스를 변환하고, 선정된 템플릿 세트(a set of predetermind templates)의 템플릿들과 상기 2차원 변환 매트릭스간의 간격을 나타내는 간격 값(distance values)을 도출(derive)하며, 상기 도출된 간격 값을 비교하여 그로부터 상기 도출된 간격 값 중 최단 간격을 갖는 상기 선정된 템플릿 세트의 템플릿에 대응하는 인덱스(index)를 선택하도록 프로그램된 신호 처리기; 및 상기 선택된 최단 간격을 갖는 상기 선정된 템플릿 세트의 템플릿에 대응하는 상기 인덱스를 전송하는 송신기를 구비하되, 상기 도출된 간격 값은 상기 선정된 템플릿 세트의 템플릿에 대응하는 인덱스에 의해 식별되는 것을 특징으로 하는 비대칭 음성 압축 처리기.
  33. 제32항에 있어서, 상기 음성 메시지는 아날로그 음성 메시지이고, 상기 입력 음성 처리기는, 음성 메시지 샘플들(voice message samples)을 발생하기 위해 상기 음성 메시지를 샘플링하는 샘플러(sampler); 및 디지탈화된 음성 데이타(digitzed speech data)을 발생하기 위해 상기 음성 메시지 샘플들을 디지탈화하는 디지타이저(digitizer)를 구비하는 것을 특징으로 하는 비대칭 음성 압축 처리기.
  34. 제32항에 있어서, 상기 음성 메시지는 디지탈화된 음성 샘플들(digitized speech samples)로 디지탈화되고, 상기 입력 음성 처리기는, 선정된 갯수의 디지탈화된 음성 샘플들을 나타내는 음성 프레임(speech frames)을 발생하는 프레이머(framer); 및 상기 음성 파라메타를 발생하기 위해 사익 음성 프레임에 대해 음성 분석(speech analysis)을 행하는 음성 분석기(speech analyzer)를 구비하는 것을 특징으로 하는 비대칭 음성 압축 처리기.
  35. 제32항에 있어서, 상기 선정된 2차원 매트릭스 변환함수는 2차원 이산 코사인 변환 함수인 것을 특징으로 하는 비대칭 음성 압축 처리기.
  36. 제32항에 있어서, 전송을 위해 상기 선택된 최단 간격에 대응하는 인덱스를 선정된 시그너 링 프로토콜(signaling protocol)로 인코드(encode)하는 인코더(encoder)를 더 구비하는 것을 특징으로 하는 비대칭 음성 압축 처리기.
  37. 제32항에 있어서, 상기 신호 처리기는 상기 음성 메시지를 나타내는 음성 파라메타의 2차원 음성 데이타 매트릭스를 발생하도록 추가적인 프로그램되어 있으며, 상기 파라메타 프레임 시퀀스는 상기 2차원 음성 데이타 매트릭스의일부분을 포함하는 것을 특징으로 하는 비대칭 음성 압축 처리기.
  38. 제37항에 있어서, 상기 2차원 음성 데이타 매트릭스의 일부분은 상기 2차원 파라메타 매트릭스에 대응하는 선정된 갯수의 파라메타 프레임들(a predetermined number of parameter frames)을 포함하는 것을 특징으로 하는 비대칭 음성 압축 처리기.
  39. 제37항에 있어서, 상기 2차원 음성 데이타 매트릭스의 일부분은 상기 2차원 파라메타 매트릭스에 대응하는 가변 갯수의 파라메타 프레임들(a variable number of parameter frames)을 포함하는 것을 특징으로 하는 비대칭 음성 압축 처리기.
  40. 제37항에 있어서, 상기 신호 처리기는 인덱스 시퀀스(a sequence of indexes)를 인덱스 어레이(a index array)에 저장하는 메모리를 더 구비하며, 인덱스는 상기 2차원 음성 데이타 매트릭스의 일부분을 가장 잘 나타내는 최단 간격을 갖는 템플릿에 대응하는 것을 특징으로 하는 비대칭 음성 압축 처리기.
  41. 제40항에 있어서, 전송을 위해 인덱스 어레이를 선정된 시그널링 프로토콜(signaling protocol)로 인코드(encode)하는 인코더(encoder)를 더 구비하는 것을 특징으로 하는 비대칭 음성 압축 처리기.
  42. 제32항에 있어서, 상기 신호 처리기는, 이하의 식을 사용하여 간격 값(distance value)을 산출함으로써 상기 간격 값을 도출하되, 여기서, dk는 상기 선정된 템플릿 세트의 템플릿과 상기 2차원 변환 매트릭스에 대한 간격을 나타내고, (ai, j-b(k)i, j)는 선정된 템플릿 세트의 각 템플릿의 대응하는 셀들과 상기 2차원 변환 매트릭스간의 차이를 나타내며, wi,j는 선정된 가중 어레이(weighting array)의 대응하는 셀을 나타내는 것을 특징으로 하는 비대칭 음성 압축 처리기.
  43. 제32항에 있어서, 상기 선정된 템플릿 세트는 제1의 선정된 템플릿 세트와 적어도 제2의 선정된 템플릿세트를 포함하며, 상기 신호 처리기는 상기 제1의 선정된 템플릿 세트의 각 템플릿과 상기 2차 원 변환 매트릭스의 제1의 부분간의 간격을 나타내는 제1간격 값을 도출하되, 상기 제1간격 값은 상기 제1의 선정된 템플릿세트의 각 템플릿에 대응하는 제1인덱스에 의해 식별되고, 상기 신호 처리기는 상기 적어도 제2의 선정된 템플릿 세트의 각 템플릿과 상기 2차원 변환 매트릭스의 적어도 제2의 부분간의 간격을 나타내는 적어도 제2간격 값을 도출하도록 추가적으로 프로그램되어지되, 상기 적어도 제2간격 값은 상기 적어도 제2의 선정된 템플릿 세트의 각 템플릿에 대응하는 적어도 제2인덱스에 의해 식별되며, 상기 신호 처리기는, 상기 제1의 선정된 템플릿 세트에 대해 상기 제1간격 값의 제1의 세트를 도출하고, 상기 적어도 제2의 선정된 템플릿 세트에 대해 상기 적어도 제2간격 값의 적어도 제2의 세트를 추가적으로 도출함으로써 간격 값 세트를 도출하며, 상기 신호 처리기는, 상기 도출된 제1간격 값의 상기 제1의 세트를 비교하여 그로부터 상기 적어도 제1간격 값의 상기 제1의 세트에 대해 최단 간격을 갖는 제1간격 값을 선택하고, 상기 도출된 적어도 제1간격 값의 상기 적어도 제2의 세트를 추가적으로 비교하여 그로부터 상기 적어도 제2간격 값의 상기 적어도 제1의 세트에 대해 최단 간격을 갖는 적어도 제2간격 값을 선택하며, 상기 송신기는, 상기 선택된 제1간격 값에 대응하는 상기제1인덱스를 전송하고, 상기 선택된 적어도 제2간격 값에 대응하는 적어도 제2인덱스를 추가적으로 전송하는 것을 특징으로 하는 비대칭 음성 압축 처리기.
  44. 제32항에 있어서, 제2의 선정된 템플릿 세트는 제1의 선정된 템플릿 세트보다 더 적은 수의 템플릿을 포함하는 것을 특징으로 하는 비대칭 음성 압축 처리기.
  45. 제32항에 있어서, 상기 선정된 템플릿 세트는 코드 북(code book)을 나타내며, 상기 신호 처리기는 상기 음성 메시지의 특성을 결정하기 위해 발생된 상기 음성 파라메타를 분석하고, 상기 결정된 음성 메시지의 특성에 대응하는 코드 북 세트의 선정된 코드 북을 선택하도록 추가적으로 프로그램되어지고, 상기 송신기는 상기 선택된 선정된 코드 북을 식별하는 코드 북 식별자를 추가적으로 전송하는 것을 특징으로 하는 비대칭 음성 압축 처리기.
  46. 제45항에 있어서, 상기 신호 처리기는 전송을 위해 상기 인덱스와 선택된 선정된 코드 북을 식별하는 코드 북 식별자를 선정된 시그널링 프로토콜로 인코드하는 인코더를 더 구비하는 것을 특징으로 하는 비대칭 음성 압축 처리기.
  47. 제32항에 있어서, 선정된 템플릿 세트는 코드 북을 나타내고, 상기 입력 음성 처리기는 선정된 언어로된 상기 음성 메시지를 수신하고 상기 선정된 언어를 식별하는 정보도 추가적으로 수신하며, 상기 신호 처리기는 선정된 언어 세트에 대응하는 선정된 코드 북 세트로부터 상기 선정된 언어에 대응하는 선정된 코드 북을 선택하고, 상기 송신기는 상기 선택된 선정된 코드북을 식별하는 코드 북 식별자를 추가적으로 전송하는 것을 특징으로 하는 비대칭 음성 압축 처리기.
  48. 제47항에 있어서, 상기 음성 메시지는 전화망(telephone network)을 통해 전달되며, 전화 가입자 번호(telephone access number)는 상기 선정된 언어를 식별하는 정보를 제공하는 것을 특징으로 하는 비대칭 음성 압축 처리기.
  49. 제47항에 있어서, 상기 음성 메시지는 전화망(telepone network)을 통해 전달되며, 사용자는 상기 선정된 언어를 식별하는 정보를 제공하는 것을 특징으로 하는 비대칭 음성 압축 처리기.
  50. 제49항에 있어서, 사용자는 선정된 코드를 입력함으로써 상기 선정된 언어를 식별하는 정보를 제공하는 것을 특징으로 하는 비대칭 음성 압축 처리기.
  51. 음성 메시지(voice message)를 제공하기 위해 저속 비트율 음성 전송(lowbit rate speech transmission)을 수신하는 통신 장치에 있어서, 선정된 템플릿 세트의 하나 이상의 템플릿에 대응하는 하나이상의 인덱스를 수신하는 수신기;상기 수신된 하나 이상의 인덱스에 대응하는 상기 하나 이상의 템플릿으로부터 음성 파라메타의 어레이(무 array of speech parameters)를 발생하도록 프로그램된 신호 처리기;신장된 디지탈 음성 데이타(decompressed digital speech data)를 발생하기 위해 상기 음성 파라메타의 어레이를 처리하는 음성 합성기(speech synthesizer); 및 상기 신장된 디지탈 음성 데이타로부터 음성 메시지를 발생하는 변환기(converter)를 구비하는 것을 특징으로 하는 통신 장치.
  52. 제51항에 있어서, 상기 선정된 템플릿 세트를 저장하는 메모리를 더 구비하는 것을 특징으로 하는 통신 장치.
  53. 제52항에 있어서, 상기 저장된 선정된 템플릿 세트는 상기 음성 메시지를 압축하는 데 이용된 서정된 템플릿의 중복세트(a duplicate set of predetermined templates)에 대응하는 것을 특징으로 하는 통신 장치.
  54. 제52항에 있어서, 상기 메모리에 저장된 선정된 템플릿 세트는 상기 메모리에 저장되기 이전에 선정된 매트릭스 역변환 함수를 사용하여 변환되었던 상기 음성 메시지를 압축하는 데 이용된 기선정 템플릿의 중복 세트에 대응하는 것을 특징으로 하는 통신 장치.
  55. 제51항에 있어서, 상기 신호 처리기는 선정된 매트릭스 역변환 함수를 사용하여 상기 하나 이상의 템플릿을 변환함으로써 상기 음성 파라메타의 어레이의 발생하도록 프로그램되어 있는 것을 특징으로 하는 통신 장치.
  56. 제52항에 있어서, 상기 메모리에 저장된 선정된 템플릿 세트는 선정된 언어에 대응하는 코드북을 나타내고, 상기 메모리는 하나 이상의 선정된 언어에 대응하는 하나 이상의 코드북을 저장하고 있는 것을 특징으로 하는 통신 장치.
  57. 제56항에 있어서, 상기 메모리는 상기 메모리에 저장되어 있는 상기 하나 이상의 코드 북을 식별하는 코드 북 식별자를 추가적으로 저장하는 것을 특징으로 하는 통신 장치.
  58. 제57항에 있어서, 상기 메모리에 저장되어 있는 상기 하나 이상이 코드 북을 식별하는 상기 코드 북 식별자는 사용자에 의해 제공된 정보에 대응하는 것을 특징으로 하는 통신 장치.
  59. 제58항에 있어서, 상기 사용자에 의해 제공된 정보는 전화 가입자 번호에 대응하는 것을 특징으로 하는 통신 장치.
  60. 제54항에 있어서, 상기 선정된 매트릭스 역변환 함수는 2차원 역이산 코사인 함수(inverse two dimensional discrete cosine function)인 것을 특징으로 하는 통신 장치.
  61. 제57항에 있어서,선정된 코드 북을 식별하는 상기 하나 이상의 인덱스와 코드 북 식별자는 전송을 위해 선정된 시그널링 프로토콜로 인코드되며, 상기 통신 장치는 상기 선정된 템플릿 세트의 하나 이상의 템플릿에 대응하는 상기 하나 이상의 인덱스와 선정된코드 북을 식별하는 상기 코드 북 식별자를 전송을 위해 이용된 상기 선정된 시그널링 포로토콜내로부터 디코드하는 디코더를 더 구비하는 것을 특징으로 하는 통신 장치.
  62. 저속 비트율 음성 전송을 제공하기 위해 음성 메시지를 처리하는 방법에 있어서, 전체 음성 메시지를 수신하는 단계;상기 전체 음성 메시지를 처리하여 그로부터 음성 파라메타 매트릭스를 나타내는 선정된 템플릿 시퀀스를 식별하는 인덱스 시퀀스를 도출하는 단계; 및 상기 인덱스 시퀀스를 전송하는 단계를 포함하는 것을 특징으로 하는 음성 메시지 처리 방법.
    ※ 참고사항:최초출원 내용에 의하여 공개하는 것임.
KR1019970703226A 1995-09-14 1996-06-28 비대칭 음성 압축 프로세스를 이용한 초저속 비트율 음성 메시지 전달 시스템 KR100257361B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US08/528,455 1995-09-14
US08/528,455 US5781882A (en) 1995-09-14 1995-09-14 Very low bit rate voice messaging system using asymmetric voice compression processing
US8/528455 1995-09-14

Publications (2)

Publication Number Publication Date
KR970707528A true KR970707528A (ko) 1997-12-01
KR100257361B1 KR100257361B1 (ko) 2000-05-15

Family

ID=24105751

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019970703226A KR100257361B1 (ko) 1995-09-14 1996-06-28 비대칭 음성 압축 프로세스를 이용한 초저속 비트율 음성 메시지 전달 시스템

Country Status (9)

Country Link
US (1) US5781882A (ko)
EP (1) EP0792502B1 (ko)
JP (1) JPH10509534A (ko)
KR (1) KR100257361B1 (ko)
CN (1) CN1121682C (ko)
AT (1) ATE222394T1 (ko)
DE (1) DE69622985T2 (ko)
ES (1) ES2183000T3 (ko)
WO (1) WO1997010584A1 (ko)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6137863A (en) * 1996-12-13 2000-10-24 At&T Corp. Statistical database correction of alphanumeric account numbers for speech recognition and touch-tone recognition
US6154579A (en) * 1997-08-11 2000-11-28 At&T Corp. Confusion matrix based method and system for correcting misrecognized words appearing in documents generated by an optical character recognition technique
US6219453B1 (en) 1997-08-11 2001-04-17 At&T Corp. Method and apparatus for performing an automatic correction of misrecognized words produced by an optical character recognition technique by using a Hidden Markov Model based algorithm
US6208965B1 (en) 1997-11-20 2001-03-27 At&T Corp. Method and apparatus for performing a name acquisition based on speech recognition
US6205428B1 (en) * 1997-11-20 2001-03-20 At&T Corp. Confusion set-base method and apparatus for pruning a predetermined arrangement of indexed identifiers
US6223158B1 (en) 1998-02-04 2001-04-24 At&T Corporation Statistical option generator for alpha-numeric pre-database speech recognition correction
US6205261B1 (en) 1998-02-05 2001-03-20 At&T Corp. Confusion set based method and system for correcting misrecognized words appearing in documents generated by an optical character recognition technique
US6400805B1 (en) 1998-06-15 2002-06-04 At&T Corp. Statistical database correction of alphanumeric identifiers for speech recognition and touch-tone recognition
US7937260B1 (en) * 1998-06-15 2011-05-03 At&T Intellectual Property Ii, L.P. Concise dynamic grammars using N-best selection
US7031925B1 (en) 1998-06-15 2006-04-18 At&T Corp. Method and apparatus for creating customer specific dynamic grammars
JP3784583B2 (ja) * 1999-08-13 2006-06-14 沖電気工業株式会社 音声蓄積装置
US7778826B2 (en) * 2005-01-13 2010-08-17 Intel Corporation Beamforming codebook generation system and associated methods
KR101218776B1 (ko) 2006-01-11 2013-01-18 삼성전자주식회사 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2305855A1 (fr) * 1975-03-28 1976-10-22 Westinghouse Electric Corp Transistor mnos a drain-source protege vis-a-vis des radiations
US4479124A (en) * 1979-09-20 1984-10-23 Texas Instruments Incorporated Synthesized voice radio paging system
US4612414A (en) * 1983-08-31 1986-09-16 At&T Information Systems Inc. Secure voice transmission
US4769642A (en) * 1985-12-31 1988-09-06 Motorola, Inc. Paging receiver with LPC speech synthesizer
US4701943A (en) * 1985-12-31 1987-10-20 Motorola, Inc. Paging system using LPC speech encoding with an adaptive bit rate
US4811376A (en) * 1986-11-12 1989-03-07 Motorola, Inc. Paging system using LPC speech encoding with an adaptive bit rate
US4815134A (en) * 1987-09-08 1989-03-21 Texas Instruments Incorporated Very low rate speech encoder and decoder
US4873520A (en) * 1987-11-02 1989-10-10 Motorola, Inc. Paging receiver for storing digitized voice messages
US4885577A (en) * 1988-03-02 1989-12-05 Motorola, Inc. Paging system for providing a data message and a voice message to a unique address of a paging receiver
JPH02287399A (ja) * 1989-04-28 1990-11-27 Fujitsu Ltd ベクトル量子化制御方式
US4975956A (en) * 1989-07-26 1990-12-04 Itt Corporation Low-bit-rate speech coder using LPC data reduction processing
JP3102015B2 (ja) * 1990-05-28 2000-10-23 日本電気株式会社 音声復号化方法
US5371853A (en) * 1991-10-28 1994-12-06 University Of Maryland At College Park Method and system for CELP speech coding and codebook for use therewith
US5495555A (en) * 1992-06-01 1996-02-27 Hughes Aircraft Company High quality low bit rate celp-based speech codec
US5327520A (en) * 1992-06-04 1994-07-05 At&T Bell Laboratories Method of use of voice message coder/decoder
FR2700632B1 (fr) * 1993-01-21 1995-03-24 France Telecom Système de codage-décodage prédictif d'un signal numérique de parole par transformée adaptative à codes imbriqués.

Also Published As

Publication number Publication date
EP0792502A1 (en) 1997-09-03
WO1997010584A1 (en) 1997-03-20
CN1165574A (zh) 1997-11-19
US5781882A (en) 1998-07-14
KR100257361B1 (ko) 2000-05-15
EP0792502B1 (en) 2002-08-14
ES2183000T3 (es) 2003-03-16
EP0792502A4 (en) 1998-12-23
ATE222394T1 (de) 2002-08-15
DE69622985T2 (de) 2002-11-28
DE69622985D1 (de) 2002-09-19
JPH10509534A (ja) 1998-09-14
CN1121682C (zh) 2003-09-17

Similar Documents

Publication Publication Date Title
US5673362A (en) Speech synthesis system in which a plurality of clients and at least one voice synthesizing server are connected to a local area network
TW318926B (ko)
CN1327405C (zh) 分布式语音识别系统中语音识别的方法和设备
CN1210873C (zh) 实施不同编码法则的发送系统
KR970707528A (ko) 비대칭 음성 압축 프로세스를 이용한 초저속 비트율 음성 메시지 전달 시스템(Very Low Bit Rate Voice Messaging System Using Asymmetric Voice Compression Processing)
US5623575A (en) Excitation synchronous time encoding vocoder and method
CN101421780B (zh) 用于编码和解码时变信号的方法和设备
CN110176256B (zh) 录音文件格式转换方法、装置、计算机设备以及存储介质
JPH0779252B2 (ja) 多要素信号を符号化する方法および装置
JP3446764B2 (ja) 音声合成システム及び音声合成サーバ
CN1739143A (zh) 用于分布式语音识别系统内语音重构的方法和设备
KR960027853A (ko) 통신 설비 장치 및 통신 장치 사용 방법
JPH11259100A (ja) 励起ベクトルの符号化方法
US5448680A (en) Voice communication processing system
CN100585700C (zh) 语音编码装置及其方法
KR100460109B1 (ko) 음성패킷 변환을 위한 lsp 파라미터 변환장치 및 방법
DE69913976T2 (de) Sprachparameter-kompression
JP4359949B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
CN1139057C (zh) 用于传送低比特率语音的语音通信处理器及相关通信设备
CN1964244B (zh) 一种用声码器收发数字信号的方法
Sanchez et al. Low-delay wideband speech coding using a new frequency domain approach
CN109215670B (zh) 音频数据的传输方法、装置、计算机设备和存储介质
US20080208571A1 (en) Maximum-Likelihood Universal Speech Iconic Coding-Decoding System (MUSICS)
Pinagé et al. Waveform speech coding using multiscale recurrent patterns
JP2008256912A (ja) 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20050107

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee