HK1069472B - Signal modification method for efficient coding of speech signals - Google Patents
Signal modification method for efficient coding of speech signals Download PDFInfo
- Publication number
- HK1069472B HK1069472B HK05101816.5A HK05101816A HK1069472B HK 1069472 B HK1069472 B HK 1069472B HK 05101816 A HK05101816 A HK 05101816A HK 1069472 B HK1069472 B HK 1069472B
- Authority
- HK
- Hong Kong
- Prior art keywords
- signal
- speech signal
- frame
- speech
- pitch
- Prior art date
Links
Claims (23)
- Verfahren zum Bilden einer Verzögerungskontur, die eine Langzeitvorhersage in einer Methode charakterisiert, die Signalmodifikation zur digitalen Codierung eines Sprachsignals verwendet, wobei das Verfahren umfasst:Aufteilen des Sprachsignals in eine Reihe aufeinanderfolgender Rahmen;Lokalisieren eines Tonhöhenpulses des Sprachsignals in einem vorhergehenden Rahmen; undLokalisieren eines entsprechenden Tonhöhenpulses des Sprachsignals in einem derzeitigen Rahmen;gekennzeichnet durch das Bilden einer Verzögerungskontur, indem ein Langzeitvorhersage-Verzögerungsparameter für den derzeitigen Rahmen gewählt wird, indem eine Funktion einer temporären Zeitvariable rückwärts iteriert wird, von der Stelle des Tonhöhenpulses des Sprachsignals in dem derzeitigen Rahmen in Richtung der Stelle des entsprechenden Tonhöhenpulses des Sprachsignals im vorhergehenden Rahmen.
- Verfahren nach Anspruch 1, umfassend:Bilden der Verzögerungskontur als eine Funktion von Abständen aufeinanderfolgender Tonhöhenpulse zwischen einem letzten Tonhöhenpuls des vorhergehenden Rahmens und einem letzten Tonhöhenpuls des derzeitigen Rahmens.
- Verfahren nach Anspruch 1 oder 2, weiter umfassend:vollständiges Charakterisieren der Verzögerungskontur mit einem Langzeitvorhersage-Verzögerungsparameter des vorhergehenden Rahmens und dem Langzeitvorhersage-Verzögerungsparameter des derzeitigen Rahmens.
- Verfahren nach Anspruch 3, wobei das Bilden der Verzögerungskontur umfasst:nichtlineares Interpolieren der Verzögerungskontur zwischen dem Langzeitvorhersage-Verzögerungsparameter des vorhergehenden Rahmens und dem Langzeitvorhersage-Verzögerungsparameter des derzeitigen Rahmens.
- Verfahren nach Anspruch 3, wobei das Bilden der Verzögerungskontur umfasst:Bestimmen einer stückweise linearen Verzögerungskontur zwischen dem Langzeitvorhersage-Verzögerungsparameter des vorhergehenden Rahmens und dem Langzeitvorhersage-Verzögerungsparameter des derzeitigen Rahmens.
- Verfahren nach einem der vorhergehenden Ansprüche, wobei das Lokalisieren eines Tonhöhenpulses das Ableiten eines Linear-Vorhersage-Restsignals aus dem Sprachsignal umfasst.
- Verfahren nach einem der Ansprüche 1 bis 5, wobei das Lokalisieren eines Tonhöhenpulses ein Ableiten eines gewichteten Sprachsignals aus dem Sprachsignal umfasst.
- Verfahren nach einem der Ansprüche 1 bis 5, wobei das Lokalisieren eines Tonhöhenpulses ein Ableiten eines synthetisierten gewichteten Sprachsignals aus dem Sprachsignal umfasst.
- Verfahren nach einem der vorhergehenden Ansprüche, wobei die Rückwärts-Iteration ein Suchen nach einem Langzeitvorhersage-Verzögerungsparameterwert in mehreren Phasen und ein Beginnen mit einem Langzeitvorhersage-Verzögerungsparameterwert, der für das Ende des derzeitigen Rahmens vorhergesagt wird, umfasst, wobei jede aufeinander folgende Phase eine gesteigerte Auflösung und einen stärker fokussierten Suchbereich aufweist.
- Verfahren nach Anspruch 9, umfassend ein Vorhersagen des Langzeitvorhersage-Verzögerungsparameterwerts als gleich der Differenz zwischen dem Langzeitvorhersage-Verzögerungsparameterwerte am Ende des vorhergehenden Rahmens und zweimal der Differenz zwischen den Stellen der Tonhöhenpulse des Sprachsignals in dem vorhergehenden und derzeitigen Rahmen, geteilt durch die Anzahl von Iterationen der Funktion.
- Verfahren nach einem der vorhergehenden Ansprüche, umfassend ein Modifizieren des Sprachsignals durch Verschieben von Tonhöhen-Zyklus-Segmenten, eins nach dem anderen, um sie an die Verzögerungskontur anzupassen.
- Verfahren nach Anspruch 11, umfassend ein Bestimmen einer Segmentverschiebung durch Korrelieren eines Segments in der gewichteten Sprachdomäne mit einem Zielsignal.
- Verfahren nach Anspruch 12, umfassend ein Zusammensetzen des Zielsignals unter Verwendung des synthetisierten gewichteten Sprachsignals des vorhergehenden Rahmens und aller vorhergehenden verschobenen Segmente im derzeitigen Rahmen.
- Vorrichtung (603) zum Bilden einer Verzögerungskontur, die eine Langzeitvorhersage charakterisiert, in einer Methode, welche Signalmodifikation zur digitalen Codierung eines Sprachsignals verwendet, wobei die Vorrichtung umfasst:eine Aufteilungseinrichtung für das Sprachsignal in eine Reihe aufeinander folgender Rahmen;einen Detektor für eine Stelle eines Tonhöhenpulses des Sprachsignals in einem vorhergehenden Rahmen; undeinen Detektor für eine Stelle eines entsprechenden Tonhöhenpulses des Sprachsignals in einem derzeitigen Rahmen,gekennzeichnet durch eine Bildungseinrichtung einer Verzögerungskontur zum Wählen eines Langzeitvorhersage-Verzögerungsparameters für den derzeitigen Rahmen durch Rückwärts-Iteration einer Funktion einer temporären Zeitvariablen, von der Stelle des Tonhöhenpulses des Sprachsignals in dem derzeitigen Rahmen in Richtung des entsprechenden Tonhöhenpulses des Sprachsignals in dem vorhergehenden Rahmen.
- Vorrichtung nach Anspruch 14, wobei die Bildungseinrichtung eine Berechnungseinrichtung des Langzeitvorhersage-Verzögerungsparameters als eine Funktion von Abständen aufeinander folgender Tonhöhenpulse zwischen dem letzten Tonhöhenpuls des vorhergehenden Rahmens und dem letzten Tonhöhenpuls des derzeitigen Rahmens ist.
- Vorrichtung nach Anspruch 14 oder 15, weiter einschließend:eine Funktion, die die Verzögerungskontur vollständig mit einem Langzeitvorhersage-Verzögerungsparameter des vorhergehenden Rahmens und dem Langzeitvorhersage-Verzögerungsparameters des derzeitigen Rahmens charakterisiert.
- Vorrichtung nach Anspruch 16, wobei die Bildungseinrichtung ist:eine Auswahleinrichtung einer nichtlinear interpolierten Verzögerungskontur zwischen dem Langzeitvorhersage-Verzögerungsparameter des vorhergehenden Rahmens und dem Langzeitvorhersage-Verzögerungsparameter des derzeitigen Rahmens.
- Vorrichtung nach Anspruch 16, wobei die Bildungseinrichtung ist:eine Auswahleinrichtung einer stückweise linearen Verzögerungskontur, die aus dem Langzeitvorhersage-Verzögerungsparameter des vorhergehenden Rahmens und dem Langzeitvorhersage-Verzögerungsparameter des derzeitigen Rahmens bestimmt wird.
- Vorrichtung nach einem der Ansprüche 14 bis 18, wobei die Bildungseinrichtung eine Sucheinrichtung eines Langzeitvorhersage-Verzögerungsparameterwerts durch Rückwärtsiteration in mehreren Phasen ist, und wobei begonnen wird mit einem Langzeitvorhersage-Verzögerungsparameterwert, der für das Ende des derzeitigen Rahmens vorhergesagt wird, wobei jede aufeinanderfolgende Phase eine gesteigerte Auflösung und einen stärker fokussierten Suchbereich aufweist.
- Vorrichtung nach Anspruch 19, umfassend eine Vorhersageeinrichtung des Langzeitvorhersage-Verzögerungsparameterwerts als gleich der Differenz zwischen dem Langzeitvorhersage-Verzögerungsparameterwert am Ende des vorhergehenden Rahmens und zweimal der Differenz zwischen den Stellen der Tonhöhenpulse des Sprachsignals in dem vorhergehenden und dem derzeitigen Rahmen, geteilt durch die Anzahl von Iterationen der Funktion.
- Vorrichtung nach einem der Ansprüche 14 bis 20, umfassend eine Modifizierungseinrichtung des Sprachsignals durch Verschieben von Tonhöhen-Zyklus-Segmenten, eins nach dem anderen, um sie an die Verzögerungskontur anzupassen.
- Vorrichtung nach Anspruch 21, umfassend eine Bestimmungseinrichtung einer Segmentverschiebung durch Korrelieren eines Segments in der gewichteten Sprachdomäne mit einem Zielsignal.
- Vorrichtung nach Anspruch 22, umfassend eine Zusammensetzungseinrichtung des Zielsignals unter Verwendung eines synthetisierten gewichteten Sprachsignals des vorhergehenden Rahmens und aller vorhergehenden verschobenen Segmente im derzeitigen Rahmen.
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CA002365203A CA2365203A1 (en) | 2001-12-14 | 2001-12-14 | A signal modification method for efficient coding of speech signals |
| CA2,365,203 | 2001-12-14 | ||
| PCT/CA2002/001948 WO2003052744A2 (en) | 2001-12-14 | 2002-12-13 | Signal modification method for efficient coding of speech signals |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| HK1069472A1 HK1069472A1 (en) | 2005-05-20 |
| HK1069472B true HK1069472B (en) | 2007-09-21 |
Family
ID=
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP1454315B1 (de) | Signaländerungsverfahren zur effizienten kodierung von sprachsignalen | |
| KR100711280B1 (ko) | 소스 제어되는 가변 비트율 광대역 음성 부호화 방법 및장치 | |
| EP1979895B1 (de) | Verfahren und einrichtung zum effizienten rahmenlöschungs-verbergen in sprach-codex | |
| JP5412463B2 (ja) | 音声信号内の雑音様信号の存在に基づく音声パラメータの平滑化 | |
| US8635063B2 (en) | Codebook sharing for LSF quantization | |
| EP1141946B1 (de) | Kodierung eines verbesserungsmerkmals zur leistungsverbesserung in der kodierung von kommunikationssignalen | |
| US20050177364A1 (en) | Methods and devices for source controlled variable bit-rate wideband speech coding | |
| MXPA04011751A (es) | Metodo y dispositivo para ocultamiento de borrado adecuado eficiente en codecs de habla de base predictiva lineal. | |
| Jelinek et al. | Wideband speech coding advances in VMR-WB standard | |
| HK1069472B (en) | Signal modification method for efficient coding of speech signals | |
| CA2469774A1 (en) | Signal modification method for efficient coding of speech signals | |
| HK1133730B (en) | Signal modification method for efficient coding of speech signals | |
| HK1124157A (en) | Method and device for efficient frame erasure concealment in speech codecs |