HK1069472B - Signal modification method for efficient coding of speech signals - Google Patents

Signal modification method for efficient coding of speech signals Download PDF

Info

Publication number
HK1069472B
HK1069472B HK05101816.5A HK05101816A HK1069472B HK 1069472 B HK1069472 B HK 1069472B HK 05101816 A HK05101816 A HK 05101816A HK 1069472 B HK1069472 B HK 1069472B
Authority
HK
Hong Kong
Prior art keywords
signal
speech signal
frame
speech
pitch
Prior art date
Application number
HK05101816.5A
Other languages
German (de)
English (en)
Chinese (zh)
Other versions
HK1069472A1 (en
Inventor
Mikko Tammi
Milan Jelinek
Claude Laflamme
Vesa Ruoppila
Original Assignee
Nokia Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from CA002365203A external-priority patent/CA2365203A1/fr
Application filed by Nokia Corporation filed Critical Nokia Corporation
Publication of HK1069472A1 publication Critical patent/HK1069472A1/en
Publication of HK1069472B publication Critical patent/HK1069472B/en

Links

Claims (23)

  1. Procédé de formation d'un contour de délai caractérisant une prédiction à long terme dans une technique utilisant une modification du signal pour coder numériquement un signal de parole, le procédé comprenant les étapes consistant à :
    diviser le signal de parole en une série de trames successives ;
    localiser une impulsion de ton du signal de parole dans une trame précédente ; et
    localiser une impulsion de ton correspondante du signal de parole dans une trame courante ;
    caractérisé par la formation d'un contour de délai en sélectionnant un paramètre de délai de prédiction à long terme pour la trame courante en itérant en sens inverse une fonction d'une variable de temps temporaire, depuis l'emplacement de l'impulsion de ton du signal de parole dans la trame courante et l'emplacement de l'impulsion de ton correspondante du signal de parole dans la trame précédente.
  2. Procédé tel que revendiqué dans la revendication 1, comprenant l'étape consistant à :
    former le contour de délai comme une fonction de distances d'impulsions de ton successives entre au moins une dernière impulsion de ton de la trame précédente et une dernière impulsion de ton de la trame courante.
  3. Procédé tel que revendiqué dans la revendication 1 ou la revendication 2, comprenant en outre l'étape consistant à :
    intégralement caractériser le contour de délai avec un paramètre de délai de prédiction à long terme de la trame précédente et le paramètre de délai de prédiction à long terme de la trame courante.
  4. Procédé tel que revendiqué dans la revendication 3, dans lequel la formation du contour de délai comprend l'étape consistant à :
    interpoler non linéairement le contour de délai entre le paramètre de délai de prédiction à long terme de la trame précédente et le paramètre de délai de prédiction à long terme de la trame courante.
  5. Procédé tel que revendiqué dans la revendication 3, dans lequel la formation du contour de délai comprend l'étape consistant à :
    déterminer un contour de délai linéaire pièce par pièce entre le paramètre de délai de prédiction à long terme de la trame précédente et le paramètre de délai de prédiction à long terme de la trame courante.
  6. Procédé tel que revendiqué dans l'une quelconque des revendications précédentes, dans lequel la localisation d'une impulsion de ton comprend de dériver un signal résiduel de prédiction linéaire à partir du signal de parole.
  7. Procédé tel que revendiqué dans l'une quelconque des revendications 1 à 5, dans lequel la localisation d'une impulsion de ton comprend de dériver un signal de parole pondéré à partir du signal de parole.
  8. Procédé tel que revendiqué dans l'une quelconque des revendications 1 à 5, dans lequel la localisation d'une impulsion de ton comprend de dériver un signal de parole pondéré synthétisé à partir du signal de parole.
  9. Procédé tel que revendiqué dans l'une quelconque des revendications précédentes, dans lequel l'itération en sens inverse comprend de rechercher une valeur de paramètre de délai de prédiction à long terme dans plusieurs phases et de commencer avec une valeur de paramètre de délai de prédiction à long terme prédite pour la fin de la trame courante, chaque phase successive ayant une résolution accrue et une plage de recherche plus concentrée.
  10. Procédé tel que revendiqué dans la revendication 9, comprenant de prédire la valeur de paramètre de délai de prédiction à long terme comme étant égale à la différence entre la valeur de paramètre de délai de prédiction à long terme à la fin de la trame précédente et deux fois la différence entre les emplacements des impulsions de ton du signal de parole dans la trame précédente et la trame courante divisée par le nombre d'itérations de la fonction.
  11. Procédé tel que revendiqué dans l'une quelconque des revendications précédentes, comprenant de modifier le signal de parole en décalant des segments de cycle de ton un par un pour les ajuster au contour de délai.
  12. Procédé tel que revendiqué dans la revendication 11, comprenant de déterminer un décalage de segment en corrélant un segment dans le domaine de parole pondéré avec un signal cible.
  13. Procédé tel que revendiqué dans la revendication 12, comprenant de composer le signal cible en utilisant le signal de parole pondéré synthétisé de la trame précédente et n'importe quels segments décalés précédents dans la trame courante.
  14. Dispositif (603) pour former un contour de délai caractérisant une prédiction à long terme dans une technique utilisant une modification de signal pour coder numériquement un signal de parole, le dispositif comprenant :
    un diviseur du signal de parole en une série de trames successives ;
    un détecteur d'un emplacement d'une impulsion de ton du signal de parole dans une trame précédente ; et
    un détecteur d'un emplacement d'une impulsion de ton correspondante du signal de parole dans une trame courante,
    caractérisé par un précédent d'un contour de délai pour sélectionner un paramètre de délai de prédiction à long terme pour la trame courante par l'intermédiaire d'une itération en sens inverse d'une fonction d'une variable de temps temporaire, depuis l'emplacement de l'impulsion de ton du signal de parole dans la trame courante et l'emplacement de l'impulsion de ton correspondante du signal de parole dans la trame précédente.
  15. Dispositif tel que revendiqué dans la revendication 14, dans lequel le précédent est :
    un calculateur du paramètre de délai de prédiction à long terme comme une fonction des distances d'impulsions de ton successives entre la dernière impulsion de ton de la trame précédente et la dernière impulsion de ton de la trame courante.
  16. Dispositif tel que revendiqué dans la revendication 14 ou la revendication 15, incorporant en outre :
    une fonction caractérisant intégralement le contour de délai avec un paramètre de délai de prédiction à long terme de la trame précédente et le paramètre de délai de prédiction à long terme de la trame courante.
  17. Dispositif tel que revendiqué dans la revendication 16, dans lequel le précédent est :
    un sélecteur d'un contour de délai interpolé non linéairement entre le paramètre de délai de prédiction à long terme de la trame précédente et le paramètre de délai de prédiction à long terme de la trame courante.
  18. Dispositif tel que revendiqué dans la revendication 16, dans lequel le précédent est :
    un sélecteur d'un contour de délai linéaire pièce par pièce déterminé à partir du paramètre de délai de prédiction à long terme de la trame précédente et du paramètre de délai de prédiction à long terme de la trame courante.
  19. Dispositif tel que revendiqué dans l'une quelconque des revendications 14 à 18, dans lequel le précédent est :
    un chercheur de valeur de paramètre de délai de prédiction à long terme par itération en sens inverse dans plusieurs phases et commençant avec une valeur de paramètre de délai de prédiction à long terme prédite pour la fin de la trame courante, chaque phase successive ayant une résolution accrue et une plage de recherche plus concentrée.
  20. Dispositif tel que revendiqué dans la revendication 19, comprenant un prédicteur de la valeur de paramètre de délai de prédiction à long terme comme étant égale à la différence entre la valeur de paramètre de délai de prédiction à long terme à la fin de la trame précédente et deux fois la différence entre les emplacements des impulsions de ton du signal de parole dans la trame précédente et la trame courante divisée par le nombre d'itérations de la fonction.
  21. Dispositif tel que revendiqué dans l'une quelconque des revendications 14 à 20, comprenant un modificateur du signal de parole en décalant des segments de cycle de ton un par un pour les ajuster au contour de délai.
  22. Dispositif tel que revendiqué dans la revendication 21, comprenant un déterminateur d'un décalage de segment en corrélant un segment dans le domaine de parole pondéré avec un signal cible.
  23. Dispositif tel que revendiqué dans la revendication 22, comprenant un composeur du signal cible utilisant un signal de parole pondéré synthétisé de la trame précédente et n'importe quels segments décalés précédents dans la trame courante.
HK05101816.5A 2001-12-14 2002-12-13 Signal modification method for efficient coding of speech signals HK1069472B (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CA002365203A CA2365203A1 (fr) 2001-12-14 2001-12-14 Methode de modification de signal pour le codage efficace de signaux de la parole
CA2,365,203 2001-12-14
PCT/CA2002/001948 WO2003052744A2 (fr) 2001-12-14 2002-12-13 Procede de modification du signal assurant le codage efficace des signaux de parole

Publications (2)

Publication Number Publication Date
HK1069472A1 HK1069472A1 (en) 2005-05-20
HK1069472B true HK1069472B (en) 2007-09-21

Family

ID=

Similar Documents

Publication Publication Date Title
EP1454315B1 (fr) Procede de modification du signal assurant le codage efficace des signaux de parole
KR100711280B1 (ko) 소스 제어되는 가변 비트율 광대역 음성 부호화 방법 및장치
EP1979895B1 (fr) Procede et dispositif de masquage efficace d'effacement de trames dans des codecs vocaux
JP5412463B2 (ja) 音声信号内の雑音様信号の存在に基づく音声パラメータの平滑化
US8635063B2 (en) Codebook sharing for LSF quantization
EP1141946B1 (fr) Caracteristique d'amelioration codee pour des performances accrues de codage de signaux de communication
US20050177364A1 (en) Methods and devices for source controlled variable bit-rate wideband speech coding
MXPA04011751A (es) Metodo y dispositivo para ocultamiento de borrado adecuado eficiente en codecs de habla de base predictiva lineal.
Jelinek et al. Wideband speech coding advances in VMR-WB standard
HK1069472B (en) Signal modification method for efficient coding of speech signals
CA2469774A1 (fr) Procede de modification du signal assurant le codage efficace des signaux de parole
HK1133730B (en) Signal modification method for efficient coding of speech signals
HK1124157A (en) Method and device for efficient frame erasure concealment in speech codecs