WO1997031367A1

WO1997031367A1 - Vocodeur multi-niveau a codage par transformee des signaux predictifs residuels et quantification sur modeles auditifs

Info

Publication number: WO1997031367A1
Application number: PCT/US1997/002898
Authority: WO
Inventors: Juin-Hwey Chen
Original assignee: At & T Corp.
Priority date: 1996-02-26
Filing date: 1997-02-26
Publication date: 1997-08-28
Also published as: EP0954851A1; EP0954851A4; JPH11504733A; MX9708203A; CA2219358A1

Abstract

La présente invention concerne un système de compression de la parole dénommé 'Codage Prédictif par Transformée' ou TPC (pour 'Transform Predictive Coding') qui permet de coder la parole de la bande des 7 Khz (échantillonnée à 16 Khz) en atteignant un débit binaire de 16 ou 32 k-octets/s, à raison de 1 à 2 bits par échantillon. Pour annuler les redondances, le système utilise un dispositif prédictif à court terme et à long terme. Le résiduel de prédiction subit une transformation et un codage dans le domaine de fréquences représenté dans la figure, et ce, au niveau du processeur de transformée (110) après prise en compte des données du domaine temporel de l'additionneur (60) et l'entrée des paramètres depuis le processeur de réponse d'amplitude à filtre de mise en forme (100), ce qui corrige le spectre en vue de la perception auditive. Le vocodeur TPC n'utilise qu'une quantification en boucle ouverte comme le démontre la présence d'un extracteur/interpolateur de hauteur de son (70), ce qui fait que le vocodeur TPC n'est que faiblement complexe. La parole est de qualité transparente à 32 k-octets/s, de très bonne qualité à 24 k-octets/s, et acceptable à 16 k-octets/s.