CA2219358A1

CA2219358A1 - Quantification de signaux vocaux a l'aide de modeles auditifs humains dans des systemes de codage predictif

Info

Publication number: CA2219358A1
Application number: CA 2219358
Authority: CA
Inventors: Juin-Hwey Chen
Original assignee: Individual
Current assignee: AT&T Corp
Priority date: 1996-02-26
Filing date: 1997-02-26
Publication date: 1997-08-28
Also published as: JPH11504733A; EP0954851A4; EP0954851A1; MX9708203A; WO1997031367A1

Abstract

La présente invention concerne un système de compression de la parole dénommé "Codage Prédictif par Transformée" ou TPC (pour "Transform Predictive Coding") qui permet de coder la parole de la bande des 7 Khz (échantillonnée à 16 Khz) en atteignant un débit binaire de 16 ou 32 k-octets/s, à raison de 1 à 2 bits par échantillon. Pour annuler les redondances, le système utilise un dispositif prédictif à court terme et à long terme. Le résiduel de prédiction subit une transformation et un codage dans le domaine de fréquences représenté dans la figure, et ce, au niveau du processeur de transformée (110) après prise en compte des données du domaine temporel de l'additionneur (60) et l'entrée des paramètres depuis le processeur de réponse d'amplitude à filtre de mise en forme (100), ce qui corrige le spectre en vue de la perception auditive. Le vocodeur TPC n'utilise qu'une quantification en boucle ouverte comme le démontre la présence d'un extracteur/interpolateur de hauteur de son (70), ce qui fait que le vocodeur TPC n'est que faiblement complexe. La parole est de qualité transparente à 32 k-octets/s, de très bonne qualité à 24 k-octets/s, et acceptable à 16 k-octets/s.