KR970707528A - 비대칭 음성 압축 프로세스를 이용한 초저속 비트율 음성 메시지 전달 시스템(Very Low Bit Rate Voice Messaging System Using Asymmetric Voice Compression Processing) - Google Patents
비대칭 음성 압축 프로세스를 이용한 초저속 비트율 음성 메시지 전달 시스템(Very Low Bit Rate Voice Messaging System Using Asymmetric Voice Compression Processing)Info
- Publication number
- KR970707528A KR970707528A KR1019970703226A KR19970703226A KR970707528A KR 970707528 A KR970707528 A KR 970707528A KR 1019970703226 A KR1019970703226 A KR 1019970703226A KR 19970703226 A KR19970703226 A KR 19970703226A KR 970707528 A KR970707528 A KR 970707528A
- Authority
- KR
- South Korea
- Prior art keywords
- predetermined
- speech
- template
- voice message
- dimensional
- Prior art date
Links
- 238000007906 compression Methods 0.000 title claims description 19
- 230000006835 compression Effects 0.000 title claims 18
- 239000011159 matrix material Substances 0.000 claims abstract 44
- 238000000034 method Methods 0.000 claims abstract 38
- 230000005540 biological transmission Effects 0.000 claims abstract 13
- 230000006870 function Effects 0.000 claims 14
- 230000011664 signaling Effects 0.000 claims 10
- 230000009466 transformation Effects 0.000 claims 7
- 238000004458 analytical method Methods 0.000 claims 2
- 238000003672 processing method Methods 0.000 claims 2
- 238000005070 sampling Methods 0.000 claims 2
- 230000001131 transforming effect Effects 0.000 claims 2
- VVHSWJHVTAZPBN-ROIOMPOHSA-N 2447-92-9 Chemical compound C12([C@@]3([C@H](O)C[C@H]2O[C@@H]2C=C([C@H]4O[C@H]4[C@@]23C)C)C)CO1 VVHSWJHVTAZPBN-ROIOMPOHSA-N 0.000 claims 1
- VVHSWJHVTAZPBN-UHFFFAOYSA-N Crotocol Natural products CC12C3OC3C(C)=CC1OC1CC(O)C2(C)C11CO1 VVHSWJHVTAZPBN-UHFFFAOYSA-N 0.000 claims 1
- 238000009795 derivation Methods 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B5/00—Near-field transmission systems, e.g. inductive or capacitive transmission systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Devices For Executing Special Programs (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
Abstract
저속 비트율 음성전송을 제공하기 위해 음성 메시지를 처리하는 장치 및 방법은 파라메타 프레임 시퀀스를 포함하는 2차원 파라메타 미트랙스(502)로 정렬된 음성 파라메타를 발생하기 위해 상기 음성 메시지를 처리한다. 2차원 파라메타 매트릭스(502)는 2차원 변환된 어레이(506)를 얻기 위해 선정된 2차원 매트릭스 변환 함수(414)을 이용하여 변환된다. 선정된 템플릿 세트의 템플릿들과 2차원 변환된 어레이(506)간의 간격을 나타내는 간격 값들이 그 다음에 도출된다. 도출된 간격 값들은 선정된 템플릿 세트의 템플릿들을 식별하는 인덱스에 의해 식별된다. 도출된 간격 값들은 비교되고, 최단 간격을 갖는 선정된 템플릿 세트의 템플릿에 대응하는 인덱스가 선택된 다음에 전송된다.
Description
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제1도는 본 발명에 따른 디지탈 음성 압축 프로세서(digital voice compression process)를 이용하는 통신시스템의 블럭선도.
Claims (62)
- 저속 비트율을 음성 전송(low bit rate speech trasmisson)을 제공하기 위해 음성 메시지(voice message)를 처리하는 방법에 있어서, 음성 파라메타(speech parameter)을 발생하기 위해 상기 음성 메시지를 처리하는 단계;상기 음성 파라메타를 파라메타 프레임 시퀀스(a sequence of parameter frames)로 이루어지는 2차원 파라메타 매트릭스로 정렬하는 단계;2차원 변환 파라메타(trasform matrix)를 구하기 위해 선정된 2차원 메트릭스 변환 함수를 사용하여 상기 2차원 파라메타 매트릭스를 변환하는 단계;선정된 템플릿 세트(a set of predetermined tremplates)의 템플릿들과 상기 2차원 변환 메트릭스간의 간격을 나타내는 간격 값 세트(a set of distance values)를 도출(derive)하는 단계;상기 도출된 간격 값 세스를 비교하여 그로부터 상기 도출된 간격 값 세스중 최단 간격을 갖는 상기 선정된 템플릿 세트의 템플릿에 대응하는 인덱스(index)를 선택하는 단계; 및 선택된 최단 간격을 갖는 상기 선정된 템플릿 세트의 템플릿에 대응하는 상기 인덱스를 전송하는 단계를 포함하되, 상기 도출된 간격값 세트는 상기 선정된 템플릿 세트의 템플릿을 식별하는 인덱스에 의해 식별되는 것을 특징으로 하는 음성 메시지 처리 방법.
- 제1항에 있어서, 상기 음성 메시지는 아날로그 음성 메시지이고, 상기 음성메시지 처리단계는, 음성 메시지 샘플들(voice message samples)을 발생하기 위해 상기 음성 메시지를 샘플링하는 단계는; 및 디지탈화된 음성 샘플들(digitized speech samples)을 발생하기 위해 상기 음성 메시지 샘플들을 디지탈화하는 단계를 포함하는 것을 특징으로 하는 음성 메시지 처리 방법.
- 제1항에 있어서, 상기 음성 메시지는 디지탈화된 음성 샘플들(digitized speech samples)로 디지탈화되고, 상기 음성 메시지 처리 단계는, 선정된 갯수의 디지탈화된 음성 샘플들을 나타내는 음성 프레임(speech frames)을 발생하는 단계: 및 상기 음성 파라메타를 도출하기 위해 상기 음성 프레임에 대해 음성 분석(speech analysis)을 행하는 단계를 포함하는 것을 특징으로 하는 음성 메시지 처리 방법.
- 제1항에 있어서, 상기 선정된 2차원 매트릭스 변환 함수는 2차원 이산 코사인 변환 함수인 것을 특징으로 하는 음성 메시지 처리 방법.
- 제1항에 있어서, 전송을 위해 상기 선택된 최단 간격에 대응하는 인덱스를 선정된 시그널링 프로토콜(signaling protocol)로 인코드(encode)하는 단계를 더 포함하는 것을 특징으로 하는 음성 메시지 처리 방법.
- 제1항에 있어서, 상기 처리 단계는 상기 음성 메시지를 나타내는 음성 파라메타의 2차원 음성 데이타 매트릭스를 발생하는 단계를 더 포함하며, 상기 파라메타 프레임 시퀀스는 상기 2차원 음성 데이타 매트릭스의 일부분을 포함하는 것을 특징으로 하는 음성 메시지 처리 방법.
- 제6항에 있어서, 상기 2차원 음성 데이타 매트릭스의 일부분은 상기 2차원 파라메타 매트릭스에 대응하는 선정된 갯수의 파라메타 프레임들(a predetermined number of parameter frames)을 포함하는 것을 특징으로 하는 음성 메시지 처리 방법.
- 제6항에 있어서, 상기 2차원 음성 데이타 매트릭스의 일부분은 상기 2차원 파라메타 매트릭스에 대응하는 가변 갯수의 파라메타 프레임들(a variable number of parameter frames)을 포함하는 것을 특징으로 하는 음성 메시지 처리 방법.
- 제6항에 있어서, 상기 방법은, 인덱스 시퀀스(a sequence of indexes)를 인데스 어레이(a index array)에 저장하는 단계를 더 포함하며, 인덱스는 상기 2차원 음성 데이타 매트릭스의 일부분을 가장 잘 나타내는 최단 간격을 갖는 템플릿에 대응하는 것을 특징으로 하는 음성 메시지 처리 방법.
- 제9항에 있어서, 전송을 위해 상기 인덱스 어레이를 선정된 시그널링 프로토콜(signaling protocol)로 인코드(encode)하는 단계를 더 포함하는 것을 특징으로 하는 음성 메시지 처리 방법.
- 제1항에 있어서, 상기 도출 단계는, 이하의 식를 사용하여 간격 값(distance value)을 산출하는 단계를 포함하되, 여기서, dk는 상기 선정된 템플릿 세트의 템플릿과 상기 2차원 변환 매트릭스에 대한 간격을 나타내고, (ai,j-b(k)i,j)는 선정된 템플릿 세트의 각 템플릿의 대응하는 셀들과 상기 2차원 변환 매트릭스간의 차이를 나타내며, wi,j는 선정된 가중 어레이의 대응하는 셀을 나타내는 것을 특징으로 하는 음성 메시지 처리방법.
- 제1항에 있어서, 상기 선정된 템플릿 세트는 제1의 선정된 템플릿 세트와 적어도 제2의 선정된 템플릿 세트를 포함하며, 상기 간격 값 도술 단계는, 상기 제1의 선정된 템플릿 세트의 각 템플릿과 상기 2차원 변환 매트릭스의 제1의 부분간의 간격을 나타내는 제1간격 값을 도출하되, 상기 제1간격 값은 상기 제1의 선정된 템플릿 세트의 각 템플릿에 대응하는 제1인덱스의해 식별되고, 또한 상기 적어도 제2의 선정된 템플릿 세트의 각 템플릿과 상기 2차원 변환 매트릭스의 적어도 제2의 부분간의 간격을 나타내는 적어도 제2간격 값을 도출하되, 상기 적어도 제2간격 값은 상기 적어도 제2의 선정된 템플릿 세트의 각 템플릿에 대응하는 적어도 제2인덱스에 의해 식별되며, 상기 간격 값 세트 도출 단계는, 상기 제1의 선정된 템플릿 세트에 대해 상기 제1간격 값의 제1의 세트를 도출하고, 또한, 상기 적어도 제2의 선정된 템플릿 세트에 대해 상기 적어도 제2간격값의 적어도 제2의 세트를 도출하며, 상기 비교 단계는, 상기 도출된 제1간격 값의 상기 제1세트를 비교하여 그로부터 상기 적어도 제1간격 값의 상기 제1의 세트에 대해 최단 간격을 갖는 제1간격 값을 선택하고, 또한 상기 도출된 적어도 제2간격 값의 상기 적어도 제2의 세트를 비교하여 그로부터 상기 적어도 제2간격값의 상기 적어도 제1의 세트에 대해 최단 간격을 갖는 적어도 제2간격 값을 선택하며, 상기 전송 단계는, 상기 선택된 제1간격 값의 대응하는 상기 1인덱스를 전송하고, 또한 상기 선택된 적어도 제2간격 값에 대응하는 적어도 제2인덱스를 전송하는 것을 특징으로 하는 음성 메시지 처리 방법.
- 제1항에 있어서, 제2의 선정된 템플릿 세트는 제1의 선정된 템플릿 세트보다 더 작은 수의 템플릿을 포함하는 것을 특징으로 하는 음성 메시지 처리 방법.
- 제1항에 있어서, 상기 선정된 템플릿 세트는 코드 북(code book)을 나타내며, 상기 방법은, 상기 음성 메시지의 특성을 결정하기 위해 발생된 상기 음성 파라메타를 분석하는 단계;상기 결정된 음성 메시지의 특성에 대응하는 코드북 세트의 선정된 코드 북을 선택하는 단계; 및 상기 선택된 선정된 코드 북을 식별하는 코드북 식별자를 추가로 전송하는 단계를 더 포함하는 것을 특징으로 하는 음성 메시지 처리 방법.
- 제14항에 있어서, 전송을 위해 상기 인덱스와 상기 선택된 선정된 코드 북을 식별하는 코드 북 식별자를 선정된 시그널링 프로토콜로 인코드하는 단계를 더 포함하는 것을 특징으로 하는 음성 메시지 처리 방법.
- 제1항에 있어서, 선정된 템플릿 세트는 코드 북을 나타네고, 상기 방법은, 선정된 언어로 된 상기 음성 메시지를 수신하고 상기 선정된 언어를 식별하는 정보도 추가적으로 수신하는 단계;선정된 언어 세트에 대응하는 선정된 코드 북 세트로부터 상기 선정된 언어에 대응하는 선정된 코드 북을 선택하는 단계; 및 상기 선택된 선정된 코드 북을 식별하는 코드 북 식별자를 추가적으로 전송하는 단계를 더 포함하는 것을 특징으로 하는 음성 메시지 처리 방법.
- 제16항에 있어서, 상기 음성 메시지는 전화망(telephone network)을 통해 전달되며, 전화 가입자 번호는 상기 선정된 언어를 식별하는 정보를 제공하는 것을 특징으로 하는 음성 메시지 처리 방법.
- 제16항에 있어서, 상기 음성 메시지 전화망(telephone network)을 통해 전달되며, 사용자는 상기 선정된 언어를 식별하는 정보를 제공하는 것을 특징으로 하는 음성 메시지 처리 방법.
- 제18항에 있어서, 사용자는 선정된 코드를 입력함으로써 상기 선정된 언어를 식별하는 정보를 제공하는 것을 특징으로 하는 음성 메시지 처리 방법.
- 음성 메시지(voice message)를 제공하기 위해 저속 비트율 음성 전송(lowbit rate speech transmisson)를 처리하는 방법에 있어서, 선정된 템플릿 세트의 하나 이상의 템플릿에 대응하는 하나 이상의 인덱스를 수신하는 단계;상기 수신된 하나 이상의 인덱스에 대응하는 상기 하나 이상의 템플릿으로부터 음성 파라메타의 어레이(무 array of speech praameters)를 발생하는 단계;신장된 디지탈 음성 데이타(decompressed digital speech data)를 발생하기 위해 상기 음성 파라메타의 어레이를 처리하는 단계; 및 상기 신장된 디지탈 음성 데이타로부터 음성 메시지를 발생하는 단계를 포함하는 것을 특징으로 하는 저속 비트율 음성 전송 처리 방법.
- 제20항에 있어서, 상기 선정된 템플릿 세트를 저장하는 단계를 더 포함하는 것을 특징으로 하는 저속 비트율 음성 전송 처리 방법.
- 제21항에 있어서, 상기 저장된 선정된 템플릿 세트를 상기 음성 메시지를 압축하는데 이용된 선정된 템플릿의 중복 세트(a duplicate set of predetermined templates)에 대응하는 것을 특징으로 하는 저속 비트율 음성 전송 처리 방법.
- 제21항에 있어서, 상기 저장된 선정된 템플릿 세트는 저장되기 이전에 선정된 메트릭스 역변환 함수를 사용하여 변환되었던 상기 음성 메시지를 압축하는데 이용된 기선정 템플릿의 중복 세트에 대응하는 것을 특징으로 하는 저속 비트율 음성 전송 처리 방법.
- 제20항에 있어서, 상기 음성 파라메타의 어레이의 발생 단계는 선정된 매트릭스 역변환 함수를 사용하여 상기 하나 이상의 템플릿을 변환하는 단계를 포함하는 것을 특징으로 하는 저속 비트율 음성 전송 처리 방법.
- 제21항에 있어서, 상기 저장된 선정된 템플릿 세트는 선정된 언어에 대응하는 코드 북을 나타내고, 하나 이상의 선정된 언어에 대응하는 하나 이상의 코드 북이 저장되어 있는 것을 특징으로 하는 저속 비트율 음성 전송 처리 방법.
- 제25항에 있어서, 상기 저장 단계는 저장되어 있는 하나 이상의 코드 북을 식별하는 코드북 식별자를 추가적으로 저장하는 것을 특징으로 하는 저속 비트율 음성 전송 처리 방법.
- 제26항에 있어서, 저장되어 있는 하나 이상의 코드 북을 식별하는 상기 코드북 식별자는 사용자에 의해 제공된 정보에 대응하는 것을 특징으로 하는 저속 비트율 음성 전송 처리 방법.
- 제27항에 있어서, 상기 사용자에 의해 제공된 정보는 전화 가입자 번호에 대응하는 것을 특징으로 하는 저속 비트율 음성 전송 처리 방법.
- 제23항에 있어서, 상기 선정된 매트릭스 역변환 함수는 2차원 역이산 코사인 함수(inverse two dismensional discrete cosine function)인 것을 특징으로 하는 저속 비트율 음성 전송 처리 방법.
- 제26항에 있어서, 선정된 코드 북을 식별하는 상기 하나 이상의 인덱스 및 코드 북 식별자는 수신되어 선정된 시그널링 프로토콜로 인코드되는 것을 특징으로 하는 저속 비트율 음성 전송 처리 방법.
- 제30항에 있어서, 상기 음성 파라메타의 어레이는 압축을 위해 음성 파라메타 프레임들로 정렬되고, 상기 음성 파라메타 프레임은 수신되어 상기 선정된 시그널링 크로토콜로 인코드되는 것을 특징으로 하는 저속 비트율 음성 전송 처리 방법.
- 저속 비트율 음성 전송(low bit rate speech transmission)을 제공하기 위해 음성 메시지(voice message)를 처리하는 비대칭 음성 압축 처리기(asymmetric voice compression processor)에 있어서, 디지탈화된 음성 데이타(digitized speech data)를 발생하기 위해 상기 음성 메시지를 처리하는 입력 음성 처리기;상기 디지탈화된 음성 데이타로부터 음성 파라메타를 발생하고, 상기 음성 파라메타를 파라메타 프레임 시퀀스(a sequence of parameter frames)로 이루어진는 2차원 파라메타 매트릭스로 정력하며, 2차원 변환 매트릭스(transform matrix)를 구하기 위해 선정된 2차원 매트릭스 변환 함수를 사용하여 상기 2차원 파라메타 매트릭스를 변환하고, 선정된 템플릿 세트(a set of predetermind templates)의 템플릿들과 상기 2차원 변환 매트릭스간의 간격을 나타내는 간격 값(distance values)을 도출(derive)하며, 상기 도출된 간격 값을 비교하여 그로부터 상기 도출된 간격 값 중 최단 간격을 갖는 상기 선정된 템플릿 세트의 템플릿에 대응하는 인덱스(index)를 선택하도록 프로그램된 신호 처리기; 및 상기 선택된 최단 간격을 갖는 상기 선정된 템플릿 세트의 템플릿에 대응하는 상기 인덱스를 전송하는 송신기를 구비하되, 상기 도출된 간격 값은 상기 선정된 템플릿 세트의 템플릿에 대응하는 인덱스에 의해 식별되는 것을 특징으로 하는 비대칭 음성 압축 처리기.
- 제32항에 있어서, 상기 음성 메시지는 아날로그 음성 메시지이고, 상기 입력 음성 처리기는, 음성 메시지 샘플들(voice message samples)을 발생하기 위해 상기 음성 메시지를 샘플링하는 샘플러(sampler); 및 디지탈화된 음성 데이타(digitzed speech data)을 발생하기 위해 상기 음성 메시지 샘플들을 디지탈화하는 디지타이저(digitizer)를 구비하는 것을 특징으로 하는 비대칭 음성 압축 처리기.
- 제32항에 있어서, 상기 음성 메시지는 디지탈화된 음성 샘플들(digitized speech samples)로 디지탈화되고, 상기 입력 음성 처리기는, 선정된 갯수의 디지탈화된 음성 샘플들을 나타내는 음성 프레임(speech frames)을 발생하는 프레이머(framer); 및 상기 음성 파라메타를 발생하기 위해 사익 음성 프레임에 대해 음성 분석(speech analysis)을 행하는 음성 분석기(speech analyzer)를 구비하는 것을 특징으로 하는 비대칭 음성 압축 처리기.
- 제32항에 있어서, 상기 선정된 2차원 매트릭스 변환함수는 2차원 이산 코사인 변환 함수인 것을 특징으로 하는 비대칭 음성 압축 처리기.
- 제32항에 있어서, 전송을 위해 상기 선택된 최단 간격에 대응하는 인덱스를 선정된 시그너 링 프로토콜(signaling protocol)로 인코드(encode)하는 인코더(encoder)를 더 구비하는 것을 특징으로 하는 비대칭 음성 압축 처리기.
- 제32항에 있어서, 상기 신호 처리기는 상기 음성 메시지를 나타내는 음성 파라메타의 2차원 음성 데이타 매트릭스를 발생하도록 추가적인 프로그램되어 있으며, 상기 파라메타 프레임 시퀀스는 상기 2차원 음성 데이타 매트릭스의일부분을 포함하는 것을 특징으로 하는 비대칭 음성 압축 처리기.
- 제37항에 있어서, 상기 2차원 음성 데이타 매트릭스의 일부분은 상기 2차원 파라메타 매트릭스에 대응하는 선정된 갯수의 파라메타 프레임들(a predetermined number of parameter frames)을 포함하는 것을 특징으로 하는 비대칭 음성 압축 처리기.
- 제37항에 있어서, 상기 2차원 음성 데이타 매트릭스의 일부분은 상기 2차원 파라메타 매트릭스에 대응하는 가변 갯수의 파라메타 프레임들(a variable number of parameter frames)을 포함하는 것을 특징으로 하는 비대칭 음성 압축 처리기.
- 제37항에 있어서, 상기 신호 처리기는 인덱스 시퀀스(a sequence of indexes)를 인덱스 어레이(a index array)에 저장하는 메모리를 더 구비하며, 인덱스는 상기 2차원 음성 데이타 매트릭스의 일부분을 가장 잘 나타내는 최단 간격을 갖는 템플릿에 대응하는 것을 특징으로 하는 비대칭 음성 압축 처리기.
- 제40항에 있어서, 전송을 위해 인덱스 어레이를 선정된 시그널링 프로토콜(signaling protocol)로 인코드(encode)하는 인코더(encoder)를 더 구비하는 것을 특징으로 하는 비대칭 음성 압축 처리기.
- 제32항에 있어서, 상기 신호 처리기는, 이하의 식을 사용하여 간격 값(distance value)을 산출함으로써 상기 간격 값을 도출하되, 여기서, dk는 상기 선정된 템플릿 세트의 템플릿과 상기 2차원 변환 매트릭스에 대한 간격을 나타내고, (ai, j-b(k)i, j)는 선정된 템플릿 세트의 각 템플릿의 대응하는 셀들과 상기 2차원 변환 매트릭스간의 차이를 나타내며, wi,j는 선정된 가중 어레이(weighting array)의 대응하는 셀을 나타내는 것을 특징으로 하는 비대칭 음성 압축 처리기.
- 제32항에 있어서, 상기 선정된 템플릿 세트는 제1의 선정된 템플릿 세트와 적어도 제2의 선정된 템플릿세트를 포함하며, 상기 신호 처리기는 상기 제1의 선정된 템플릿 세트의 각 템플릿과 상기 2차 원 변환 매트릭스의 제1의 부분간의 간격을 나타내는 제1간격 값을 도출하되, 상기 제1간격 값은 상기 제1의 선정된 템플릿세트의 각 템플릿에 대응하는 제1인덱스에 의해 식별되고, 상기 신호 처리기는 상기 적어도 제2의 선정된 템플릿 세트의 각 템플릿과 상기 2차원 변환 매트릭스의 적어도 제2의 부분간의 간격을 나타내는 적어도 제2간격 값을 도출하도록 추가적으로 프로그램되어지되, 상기 적어도 제2간격 값은 상기 적어도 제2의 선정된 템플릿 세트의 각 템플릿에 대응하는 적어도 제2인덱스에 의해 식별되며, 상기 신호 처리기는, 상기 제1의 선정된 템플릿 세트에 대해 상기 제1간격 값의 제1의 세트를 도출하고, 상기 적어도 제2의 선정된 템플릿 세트에 대해 상기 적어도 제2간격 값의 적어도 제2의 세트를 추가적으로 도출함으로써 간격 값 세트를 도출하며, 상기 신호 처리기는, 상기 도출된 제1간격 값의 상기 제1의 세트를 비교하여 그로부터 상기 적어도 제1간격 값의 상기 제1의 세트에 대해 최단 간격을 갖는 제1간격 값을 선택하고, 상기 도출된 적어도 제1간격 값의 상기 적어도 제2의 세트를 추가적으로 비교하여 그로부터 상기 적어도 제2간격 값의 상기 적어도 제1의 세트에 대해 최단 간격을 갖는 적어도 제2간격 값을 선택하며, 상기 송신기는, 상기 선택된 제1간격 값에 대응하는 상기제1인덱스를 전송하고, 상기 선택된 적어도 제2간격 값에 대응하는 적어도 제2인덱스를 추가적으로 전송하는 것을 특징으로 하는 비대칭 음성 압축 처리기.
- 제32항에 있어서, 제2의 선정된 템플릿 세트는 제1의 선정된 템플릿 세트보다 더 적은 수의 템플릿을 포함하는 것을 특징으로 하는 비대칭 음성 압축 처리기.
- 제32항에 있어서, 상기 선정된 템플릿 세트는 코드 북(code book)을 나타내며, 상기 신호 처리기는 상기 음성 메시지의 특성을 결정하기 위해 발생된 상기 음성 파라메타를 분석하고, 상기 결정된 음성 메시지의 특성에 대응하는 코드 북 세트의 선정된 코드 북을 선택하도록 추가적으로 프로그램되어지고, 상기 송신기는 상기 선택된 선정된 코드 북을 식별하는 코드 북 식별자를 추가적으로 전송하는 것을 특징으로 하는 비대칭 음성 압축 처리기.
- 제45항에 있어서, 상기 신호 처리기는 전송을 위해 상기 인덱스와 선택된 선정된 코드 북을 식별하는 코드 북 식별자를 선정된 시그널링 프로토콜로 인코드하는 인코더를 더 구비하는 것을 특징으로 하는 비대칭 음성 압축 처리기.
- 제32항에 있어서, 선정된 템플릿 세트는 코드 북을 나타내고, 상기 입력 음성 처리기는 선정된 언어로된 상기 음성 메시지를 수신하고 상기 선정된 언어를 식별하는 정보도 추가적으로 수신하며, 상기 신호 처리기는 선정된 언어 세트에 대응하는 선정된 코드 북 세트로부터 상기 선정된 언어에 대응하는 선정된 코드 북을 선택하고, 상기 송신기는 상기 선택된 선정된 코드북을 식별하는 코드 북 식별자를 추가적으로 전송하는 것을 특징으로 하는 비대칭 음성 압축 처리기.
- 제47항에 있어서, 상기 음성 메시지는 전화망(telephone network)을 통해 전달되며, 전화 가입자 번호(telephone access number)는 상기 선정된 언어를 식별하는 정보를 제공하는 것을 특징으로 하는 비대칭 음성 압축 처리기.
- 제47항에 있어서, 상기 음성 메시지는 전화망(telepone network)을 통해 전달되며, 사용자는 상기 선정된 언어를 식별하는 정보를 제공하는 것을 특징으로 하는 비대칭 음성 압축 처리기.
- 제49항에 있어서, 사용자는 선정된 코드를 입력함으로써 상기 선정된 언어를 식별하는 정보를 제공하는 것을 특징으로 하는 비대칭 음성 압축 처리기.
- 음성 메시지(voice message)를 제공하기 위해 저속 비트율 음성 전송(lowbit rate speech transmission)을 수신하는 통신 장치에 있어서, 선정된 템플릿 세트의 하나 이상의 템플릿에 대응하는 하나이상의 인덱스를 수신하는 수신기;상기 수신된 하나 이상의 인덱스에 대응하는 상기 하나 이상의 템플릿으로부터 음성 파라메타의 어레이(무 array of speech parameters)를 발생하도록 프로그램된 신호 처리기;신장된 디지탈 음성 데이타(decompressed digital speech data)를 발생하기 위해 상기 음성 파라메타의 어레이를 처리하는 음성 합성기(speech synthesizer); 및 상기 신장된 디지탈 음성 데이타로부터 음성 메시지를 발생하는 변환기(converter)를 구비하는 것을 특징으로 하는 통신 장치.
- 제51항에 있어서, 상기 선정된 템플릿 세트를 저장하는 메모리를 더 구비하는 것을 특징으로 하는 통신 장치.
- 제52항에 있어서, 상기 저장된 선정된 템플릿 세트는 상기 음성 메시지를 압축하는 데 이용된 서정된 템플릿의 중복세트(a duplicate set of predetermined templates)에 대응하는 것을 특징으로 하는 통신 장치.
- 제52항에 있어서, 상기 메모리에 저장된 선정된 템플릿 세트는 상기 메모리에 저장되기 이전에 선정된 매트릭스 역변환 함수를 사용하여 변환되었던 상기 음성 메시지를 압축하는 데 이용된 기선정 템플릿의 중복 세트에 대응하는 것을 특징으로 하는 통신 장치.
- 제51항에 있어서, 상기 신호 처리기는 선정된 매트릭스 역변환 함수를 사용하여 상기 하나 이상의 템플릿을 변환함으로써 상기 음성 파라메타의 어레이의 발생하도록 프로그램되어 있는 것을 특징으로 하는 통신 장치.
- 제52항에 있어서, 상기 메모리에 저장된 선정된 템플릿 세트는 선정된 언어에 대응하는 코드북을 나타내고, 상기 메모리는 하나 이상의 선정된 언어에 대응하는 하나 이상의 코드북을 저장하고 있는 것을 특징으로 하는 통신 장치.
- 제56항에 있어서, 상기 메모리는 상기 메모리에 저장되어 있는 상기 하나 이상의 코드 북을 식별하는 코드 북 식별자를 추가적으로 저장하는 것을 특징으로 하는 통신 장치.
- 제57항에 있어서, 상기 메모리에 저장되어 있는 상기 하나 이상이 코드 북을 식별하는 상기 코드 북 식별자는 사용자에 의해 제공된 정보에 대응하는 것을 특징으로 하는 통신 장치.
- 제58항에 있어서, 상기 사용자에 의해 제공된 정보는 전화 가입자 번호에 대응하는 것을 특징으로 하는 통신 장치.
- 제54항에 있어서, 상기 선정된 매트릭스 역변환 함수는 2차원 역이산 코사인 함수(inverse two dimensional discrete cosine function)인 것을 특징으로 하는 통신 장치.
- 제57항에 있어서,선정된 코드 북을 식별하는 상기 하나 이상의 인덱스와 코드 북 식별자는 전송을 위해 선정된 시그널링 프로토콜로 인코드되며, 상기 통신 장치는 상기 선정된 템플릿 세트의 하나 이상의 템플릿에 대응하는 상기 하나 이상의 인덱스와 선정된코드 북을 식별하는 상기 코드 북 식별자를 전송을 위해 이용된 상기 선정된 시그널링 포로토콜내로부터 디코드하는 디코더를 더 구비하는 것을 특징으로 하는 통신 장치.
- 저속 비트율 음성 전송을 제공하기 위해 음성 메시지를 처리하는 방법에 있어서, 전체 음성 메시지를 수신하는 단계;상기 전체 음성 메시지를 처리하여 그로부터 음성 파라메타 매트릭스를 나타내는 선정된 템플릿 시퀀스를 식별하는 인덱스 시퀀스를 도출하는 단계; 및 상기 인덱스 시퀀스를 전송하는 단계를 포함하는 것을 특징으로 하는 음성 메시지 처리 방법.※ 참고사항:최초출원 내용에 의하여 공개하는 것임.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US08/528,455 | 1995-09-14 | ||
US08/528,455 US5781882A (en) | 1995-09-14 | 1995-09-14 | Very low bit rate voice messaging system using asymmetric voice compression processing |
US8/528455 | 1995-09-14 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR970707528A true KR970707528A (ko) | 1997-12-01 |
KR100257361B1 KR100257361B1 (ko) | 2000-05-15 |
Family
ID=24105751
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019970703226A KR100257361B1 (ko) | 1995-09-14 | 1996-06-28 | 비대칭 음성 압축 프로세스를 이용한 초저속 비트율 음성 메시지 전달 시스템 |
Country Status (9)
Country | Link |
---|---|
US (1) | US5781882A (ko) |
EP (1) | EP0792502B1 (ko) |
JP (1) | JPH10509534A (ko) |
KR (1) | KR100257361B1 (ko) |
CN (1) | CN1121682C (ko) |
AT (1) | ATE222394T1 (ko) |
DE (1) | DE69622985T2 (ko) |
ES (1) | ES2183000T3 (ko) |
WO (1) | WO1997010584A1 (ko) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6137863A (en) * | 1996-12-13 | 2000-10-24 | At&T Corp. | Statistical database correction of alphanumeric account numbers for speech recognition and touch-tone recognition |
US6154579A (en) * | 1997-08-11 | 2000-11-28 | At&T Corp. | Confusion matrix based method and system for correcting misrecognized words appearing in documents generated by an optical character recognition technique |
US6219453B1 (en) | 1997-08-11 | 2001-04-17 | At&T Corp. | Method and apparatus for performing an automatic correction of misrecognized words produced by an optical character recognition technique by using a Hidden Markov Model based algorithm |
US6208965B1 (en) | 1997-11-20 | 2001-03-27 | At&T Corp. | Method and apparatus for performing a name acquisition based on speech recognition |
US6205428B1 (en) * | 1997-11-20 | 2001-03-20 | At&T Corp. | Confusion set-base method and apparatus for pruning a predetermined arrangement of indexed identifiers |
US6223158B1 (en) | 1998-02-04 | 2001-04-24 | At&T Corporation | Statistical option generator for alpha-numeric pre-database speech recognition correction |
US6205261B1 (en) | 1998-02-05 | 2001-03-20 | At&T Corp. | Confusion set based method and system for correcting misrecognized words appearing in documents generated by an optical character recognition technique |
US6400805B1 (en) | 1998-06-15 | 2002-06-04 | At&T Corp. | Statistical database correction of alphanumeric identifiers for speech recognition and touch-tone recognition |
US7937260B1 (en) * | 1998-06-15 | 2011-05-03 | At&T Intellectual Property Ii, L.P. | Concise dynamic grammars using N-best selection |
US7031925B1 (en) | 1998-06-15 | 2006-04-18 | At&T Corp. | Method and apparatus for creating customer specific dynamic grammars |
JP3784583B2 (ja) * | 1999-08-13 | 2006-06-14 | 沖電気工業株式会社 | 音声蓄積装置 |
US7778826B2 (en) * | 2005-01-13 | 2010-08-17 | Intel Corporation | Beamforming codebook generation system and associated methods |
KR101218776B1 (ko) | 2006-01-11 | 2013-01-18 | 삼성전자주식회사 | 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2305855A1 (fr) * | 1975-03-28 | 1976-10-22 | Westinghouse Electric Corp | Transistor mnos a drain-source protege vis-a-vis des radiations |
US4479124A (en) * | 1979-09-20 | 1984-10-23 | Texas Instruments Incorporated | Synthesized voice radio paging system |
US4612414A (en) * | 1983-08-31 | 1986-09-16 | At&T Information Systems Inc. | Secure voice transmission |
US4769642A (en) * | 1985-12-31 | 1988-09-06 | Motorola, Inc. | Paging receiver with LPC speech synthesizer |
US4701943A (en) * | 1985-12-31 | 1987-10-20 | Motorola, Inc. | Paging system using LPC speech encoding with an adaptive bit rate |
US4811376A (en) * | 1986-11-12 | 1989-03-07 | Motorola, Inc. | Paging system using LPC speech encoding with an adaptive bit rate |
US4815134A (en) * | 1987-09-08 | 1989-03-21 | Texas Instruments Incorporated | Very low rate speech encoder and decoder |
US4873520A (en) * | 1987-11-02 | 1989-10-10 | Motorola, Inc. | Paging receiver for storing digitized voice messages |
US4885577A (en) * | 1988-03-02 | 1989-12-05 | Motorola, Inc. | Paging system for providing a data message and a voice message to a unique address of a paging receiver |
JPH02287399A (ja) * | 1989-04-28 | 1990-11-27 | Fujitsu Ltd | ベクトル量子化制御方式 |
US4975956A (en) * | 1989-07-26 | 1990-12-04 | Itt Corporation | Low-bit-rate speech coder using LPC data reduction processing |
JP3102015B2 (ja) * | 1990-05-28 | 2000-10-23 | 日本電気株式会社 | 音声復号化方法 |
US5371853A (en) * | 1991-10-28 | 1994-12-06 | University Of Maryland At College Park | Method and system for CELP speech coding and codebook for use therewith |
US5495555A (en) * | 1992-06-01 | 1996-02-27 | Hughes Aircraft Company | High quality low bit rate celp-based speech codec |
US5327520A (en) * | 1992-06-04 | 1994-07-05 | At&T Bell Laboratories | Method of use of voice message coder/decoder |
FR2700632B1 (fr) * | 1993-01-21 | 1995-03-24 | France Telecom | Système de codage-décodage prédictif d'un signal numérique de parole par transformée adaptative à codes imbriqués. |
-
1995
- 1995-09-14 US US08/528,455 patent/US5781882A/en not_active Expired - Fee Related
-
1996
- 1996-06-28 CN CN96191077A patent/CN1121682C/zh not_active Expired - Fee Related
- 1996-06-28 KR KR1019970703226A patent/KR100257361B1/ko not_active IP Right Cessation
- 1996-06-28 AT AT96923669T patent/ATE222394T1/de not_active IP Right Cessation
- 1996-06-28 EP EP96923669A patent/EP0792502B1/en not_active Expired - Lifetime
- 1996-06-28 DE DE69622985T patent/DE69622985T2/de not_active Expired - Fee Related
- 1996-06-28 ES ES96923669T patent/ES2183000T3/es not_active Expired - Lifetime
- 1996-06-28 JP JP9511922A patent/JPH10509534A/ja active Pending
- 1996-06-28 WO PCT/US1996/011340 patent/WO1997010584A1/en active IP Right Grant
Also Published As
Publication number | Publication date |
---|---|
EP0792502A1 (en) | 1997-09-03 |
WO1997010584A1 (en) | 1997-03-20 |
CN1165574A (zh) | 1997-11-19 |
US5781882A (en) | 1998-07-14 |
KR100257361B1 (ko) | 2000-05-15 |
EP0792502B1 (en) | 2002-08-14 |
ES2183000T3 (es) | 2003-03-16 |
EP0792502A4 (en) | 1998-12-23 |
ATE222394T1 (de) | 2002-08-15 |
DE69622985T2 (de) | 2002-11-28 |
DE69622985D1 (de) | 2002-09-19 |
JPH10509534A (ja) | 1998-09-14 |
CN1121682C (zh) | 2003-09-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5673362A (en) | Speech synthesis system in which a plurality of clients and at least one voice synthesizing server are connected to a local area network | |
TW318926B (ko) | ||
CN1327405C (zh) | 分布式语音识别系统中语音识别的方法和设备 | |
CN1210873C (zh) | 实施不同编码法则的发送系统 | |
KR970707528A (ko) | 비대칭 음성 압축 프로세스를 이용한 초저속 비트율 음성 메시지 전달 시스템(Very Low Bit Rate Voice Messaging System Using Asymmetric Voice Compression Processing) | |
US5623575A (en) | Excitation synchronous time encoding vocoder and method | |
CN101421780B (zh) | 用于编码和解码时变信号的方法和设备 | |
CN110176256B (zh) | 录音文件格式转换方法、装置、计算机设备以及存储介质 | |
JPH0779252B2 (ja) | 多要素信号を符号化する方法および装置 | |
JP3446764B2 (ja) | 音声合成システム及び音声合成サーバ | |
CN1739143A (zh) | 用于分布式语音识别系统内语音重构的方法和设备 | |
KR960027853A (ko) | 통신 설비 장치 및 통신 장치 사용 방법 | |
JPH11259100A (ja) | 励起ベクトルの符号化方法 | |
US5448680A (en) | Voice communication processing system | |
CN100585700C (zh) | 语音编码装置及其方法 | |
KR100460109B1 (ko) | 음성패킷 변환을 위한 lsp 파라미터 변환장치 및 방법 | |
DE69913976T2 (de) | Sprachparameter-kompression | |
JP4359949B2 (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
CN1139057C (zh) | 用于传送低比特率语音的语音通信处理器及相关通信设备 | |
CN1964244B (zh) | 一种用声码器收发数字信号的方法 | |
Sanchez et al. | Low-delay wideband speech coding using a new frequency domain approach | |
CN109215670B (zh) | 音频数据的传输方法、装置、计算机设备和存储介质 | |
US20080208571A1 (en) | Maximum-Likelihood Universal Speech Iconic Coding-Decoding System (MUSICS) | |
Pinagé et al. | Waveform speech coding using multiscale recurrent patterns | |
JP2008256912A (ja) | 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20050107 Year of fee payment: 6 |
|
LAPS | Lapse due to unpaid annual fee |