HK1155552B - Audio encoder and decoder for encoding and decoding audio samples - Google Patents
Audio encoder and decoder for encoding and decoding audio samples Download PDFInfo
- Publication number
- HK1155552B HK1155552B HK11109877.6A HK11109877A HK1155552B HK 1155552 B HK1155552 B HK 1155552B HK 11109877 A HK11109877 A HK 11109877A HK 1155552 B HK1155552 B HK 1155552B
- Authority
- HK
- Hong Kong
- Prior art keywords
- window
- domain
- samples
- encoder
- stop
- Prior art date
Links
Claims (6)
- Ein Audiocodierer (100) zum Codieren von Audioabtastwerten, der folgende Merkmale aufweist:einen ersten Zeitbereich-Aliasing-Einführung-Codierer (110) zum Codieren, unter Verwendung von AAC-Codierung, von Audioabtastwerten in einem ersten Codierbereich, wobei der erste Zeitbereich-Aliasing-Einführung-Codierer (110) eine erste Rahmenbildungsregel, ein Startfenster und ein Stoppfenster aufweist, und einen Frequenzbereichtransformierer aufweist zum Transformieren eines ersten Rahmens von nachfolgenden Audioabtastwerten in den Frequenzbereich basierend auf einer modifizierten diskreten Cosinus-Transformation, MDCT, wobei der erste Zeitbereich-Aliasing-Einführung-Codierer (110) konfiguriert ist, um eine MDCT-Größe an die Start- und Stoppfenster anzupassen;einen zweiten Codierer (120) zum Codieren, unter Verwendung von AMR-WB+-Codierung, von Abtastwerten in einem zweiten Codierbereich, wobei der zweite Codierer (120) eine vorbestimmte Rahmengrößenanzahl von Audioabtastwerten und eine Codieraufwärmperiodenanzahl von Audioabtastwerten aufweist, wobei der zweite Codierer (120) eine andere zweite Rahmenbildungsregel aufweist, wobei ein Rahmen des zweiten Codierers (120) eine codierte Darstellung einer Anzahl von zeitlich nachfolgenden Abtastwerten ist, wobei die Anzahl gleich der vorbestimmten Rahmengrößenanzahl von Audioabtastwerten ist; undeine Steuerung (130) zumSchalten von dem ersten Codierer (110) zu dem zweiten Codierer (120) ansprechend auf eine Charakteristik der Audioabtastwerte, und zum, beim Schalten von dem ersten Codierer (110) zu dem zweiten Codierer (120), Modifizieren des Startfensters des ersten Codierers (110) in dem Ausmaß, dassdas Startfenster 2048 Abtastwerte lang ist und bei einer 1024-Punkt-MDCT verwendet wird,das Startfenster sofort mit einem Ansteigende-Flanke-Teil beginnt, der eine erste MDCT-Faltachse in der Mitte desselben aufweist, der sich über ein erstes und zweites Viertel des Startfensters zu einer Mitte des Startfensters erstreckt,ein Umgehungsteil sich von der Mitte zu einem Abfallende-Flanke-Teil erstreckt,der Abfallende-Flanke-Teil, der einen Überblendabschnitt mit einem Sinusfenster bereitstellt, 64 Abtastwerte lang ist und sich zu einer zweiten MDCT-Faltachse zwischen einem dritten und vierten Viertel des Startfensters erstreckt, undein Nullteil sich von der zweiten MDCT-Faltachse zu einem Ende des Startfensters erstreckt, undwobei der linke Teil der Audioabtastwerte in dem zweiten Codierbereich mit einem Überblendsinusfenster der Länge von 64 Abtastwerten gefenstert ist, oderSchalten von dem zweiten Codierer (120) zu dem ersten Codierer (110) ansprechend auf eine andere Charakteristik der Audioabtastwerte und zum, beim Schalten von dem zweiten Codierer (120) zu dem ersten Codierer (110), Modifizieren des Stoppfensters des ersten Codierers (110) in dem Ausmaß, dassdas Stoppfenster 2304 Abtastwerte lang ist und bei einer 1152-Punkt-MDCT verwendet wird,ein Nullteil des Stoppfensters sich über ein erstes Viertel des Stoppfensters erstreckt,ein Ansteigende-Flanke-Teil des Stoppfensters, das ein Sinusfenster mit 64 Abtastwerten Länge ist, in einem zweiten Viertel des Stoppfensters beginnt, so dass ein Überblenden gleich hinter einer ersten MDCT-Faltachse beginnt, die zwischen dem Nullteil und dem Ansteigende-Flanke-Teil positioniert ist,ein Umgehungsteil des Stoppfensters sich von dem Ansteigende-Flanke-Teil zu der Mitte des Stoppfensters erstreckt, undein Abfallende-Flanke-Teil des Stoppfensters sich von der Mitte des Stoppfensters über eine zweite MDCT-Faltachse zwischen einem dritten und einem vierten Viertel des Stoppfensters zu einem Ende des Stoppfensters erstreckt,wobei die zweite Rahmenbildungsregel unmodifiziert bleibt.
- Der Audiocodierer (100) gemäß Anspruch 1, bei dem der erste Zeitbereich-Aliasing-Codierer (110) einen AAC-Codierer aufweist gemäß Generic Coding of Moving Pictures and Associated Audio: Advanced Audio Coding, International Standard 13818-7, ISO/IEC JTC1/SC29/WG11 Moving Pictures Expert Group, 1997.
- Ein Verfahren zum Codieren von Audiorahmen, das folgende Schritte aufweist:Codieren, mit einem ersten Zeitbereich-Aliasing-Einführung-Codierer (110), unter Verwendung von AAC-Codierung, von Audioabtastwerten in einem ersten Codierbereich unter Verwendung einer ersten Rahmenbildungsregel, eines Startfensters und eines Stoppfensters und durch Transformieren eines ersten Rahmens von nachfolgenden Audioabtastwerten in den Frequenzbereich basierend auf einer modifizierten diskreten Cosinus-Transformation, MDCT, wobei der erste Zeitbereich-Aliasing-Einführung-Codierer (110) konfiguriert ist, um eine MDCT-Größe an die Start- und Stoppfenster anzupassen;Codieren, unter Verwendung von AMR-WB+-Codierung, von Audioabtastwerten in einem zweiten Codierbereich unter Verwendung einer vorbestimmten Rahmengrößenanzahl von Audioabtastwerten und einer Codieraufwärmperiodenanzahl von Audioabtastwerten und unter Verwendung einer anderen zweiten Rahmenbildungsregel, wobei der Rahmen des zweiten Codierbereichs eine codierte Darstellung einer Anzahl von zeitlich nachfolgenden Abtastwerten ist, wobei die Anzahl gleich der vorbestimmten Rahmengrößenanzahl von Audioabtastwerten ist; undSchalten von dem ersten Codierbereich (110) zu dem zweiten Codierbereich (120) ansprechend auf eine Charakteristik der Audioabtastwerte, und, beim Schalten von dem ersten zu dem zweiten Codierbereich, Modifizieren des Startfensters des ersten Codierbereichs (110) in dem Ausmaß, dassdas Startfenster 2048 Abtastwerte lang ist und bei einer 1024-Punkte-MDCT verwendet wird,das Startfenster sofort mit einem Ansteigende-Flanke-Teil beginnt, der eine erste MDCT-Faltachse in der Mitte desselben aufweist, der sich über ein erstes und zweites Viertel des Startfensters zu einer Mitte des Startfensters erstreckt,ein Umgehungsteil sich von der Mitte zu einem Abfallende-Flanke-Teil erstreckt,der Abfallende-Flanke-Teil, der einen Überblendabschnitt mit einem Sinusfenster bereitstellt, 64 Abtastwerte lang ist und sich zu einer zweiten MDCT-Faltachse zwischen einem dritten und vierten Viertel des Startfensters erstreckt, undein Nullteil sich von der zweiten MDCT-Faltachse zu einem Ende des Startfensters erstreckt, undwobei der linke Teil der Audioabtastwerte in dem zweiten Codierbereich mit einem Überblendsinusfenster der Länge von 64 Abtastwerten gefenstert ist, oderSchalten von dem zweiten Codierbereich (120) zu dem ersten Codierbereich (110) ansprechend auf eine andere Charakteristik der Audioabtastwerte und zum, beim Schalten von dem zweiten zu dem ersten Codierbereich, Modifizieren des Stoppfensters des ersten Codierbereichs (110) in dem Ausmaß, dassdas Stoppfenster 2304 Abtastwerte lang ist und bei einer 1152-Punkt-MDCT verwendet wird,ein Nullteil des Stoppfensters sich über ein erstes Viertel des Stoppfensters erstreckt,ein Ansteigende-Flanke-Teil des Stoppfensters, das ein Sinusfenster mit 64 Abtastwerten Länge ist, in einem zweiten Viertel des Stoppfensters beginnt, so dass ein Überblenden gleich hinter einer ersten MDCT-Faltachse beginnt, die zwischen dem Nullteil und dem ansteigende-Flanke-Teil positioniert ist,ein Umgehungsteil des Stoppfensters sich von dem Ansteigende-Flanke-Teil zu der Mitte des Stoppfensters erstreckt, undein Abfallende-Flanke-Teil des Stoppfensters sich von der Mitte des Stoppfensters über eine zweite MDCT-Faltachse zwischen einem dritten und einem vierten Viertel des Stoppfensters zu einem Ende des Stoppfensters erstreckt,wobei die zweite Rahmenbildungsregel unmodifiziert bleibt.
- Ein Audiodecodierer (150) zum Decodieren codierter Rahmen von Audioabtastwerten, der folgende Merkmale aufweist:einen ersten Zeitbereich-Aliasing-Einführung-Decodierer (160) zum Decodieren, unter Verwendung von AAC-Decodierung, von Audioabtastwerten in einem ersten Decodierbereich, wobei der erste Zeitbereich-Aliasing-Einführung-Decodierer (160) eine erste Rahmenbildungsregel, ein Startfenster und ein Stoppfenster aufweist, wobei der erste Decodierer (160) einen Zeitbereichtransformierer aufweist zum Transformieren eines ersten Rahmens von decodierten Audioabtastwerten in den Zeitbereich basierend auf einer inversen modifizierten diskreten Cosinus-Transformation, IMDCT, wobei der erste Zeitbereich-Aliasing-Einführung-Decodierer (160) konfiguriert ist, um eine IMDCT-Größe an die Start- und Stoppfenster anzupassen;einen zweiten Decodierer (170) zum Decodieren, unter Verwendung von AMR-WB+-Decodierung, von Audioabtastwerten in einem zweiten Decodierbereich und wobei der zweite Decodierer (170) eine vorbestimmte Rahmengrößenanzahl von Audioabtastwerten und eine Codieraufwärmperiodenanzahl von Audioabtastwerten aufweist, wobei der zweite Decodierer (170) eine andere zweite Rahmenbildungsregel aufweist, wobei ein Rahmen des zweiten Decodierers (170) eine codierte Darstellung einer Anzahl von zeitlich nachfolgenden Audioabtastwerten ist, wobei die Anzahl gleich der vorbestimmten Rahmengrößenanzahl von Audioabtastwerten ist; undeine Steuerung (180) zumSchalten von dem ersten Decodierer zu dem zweiten Decodierer basierend auf einer Anzeige von dem codierten Rahmen von Audioabtastwerten, oder Schalten von dem zweiten Decodierer (170) zu dem ersten Decodierer (160) basierend auf einer Anzeige von dem codierten Rahmen von Audioabtastwerten, und, beim Schalten von dem ersten Decodierer zu dem zweiten Decodierer, Modifizieren des Startfensters des ersten Decodierers in dem Ausmaß, dassdas Startfenster 2048 Abtastwerte lang ist und bei einer 1024-Punkt-IMDCT verwendet wird,das Startfenster sofort mit einem Ansteigende-Flanke-Teil beginnt, der eine erste MDCT-Faltachse in der Mitte desselben aufweist, der sich über ein erstes und zweites Viertel des Startfensters zu einer Mitte des Startfensters erstreckt,ein Umgehungsteil sich von der Mitte zu einem Abfallende-Flanke-Teil erstreckt,der Abfallende-Flanke-Teil, der einen Überblendabschnitt mit einem Sinusfenster bereitstellt, 64 Abtastwerte lang ist und sich zu einer zweiten MDCT-Faltachse zwischen einem dritten und vierten Viertel des Startfensters erstreckt, undein Nullteil sich von der zweiten MDCT-Faltachse zu einem Ende des Startfensters erstreckt, undwobei der linke Teil der Audioabtastwerte in dem zweiten Decodierbereich mit einem Überblendsinusfenster der Länge von 64 Abtastwerten gefenstert ist; oderSchalten von dem zweiten Decodierer zu dem ersten Decodierer ansprechend auf eine andere Charakteristik der Audioabtastwerte und zum, beim Schalten von dem zweiten Decodierer zu dem ersten Decodierer, Modifizieren des Stoppfensters des ersten Decodierers in dem Ausmaß, dassdas Stoppfenster 2304 Abtastwerte lang ist und bei einer 1152-Punkt-IMDCT verwendet wird,ein Nullteil des Stoppfensters sich über ein erstes Viertel des Stoppfensters erstreckt,ein Ansteigende-Flanke-Teil des Stoppfensters, das ein Sinusfenster von 64 Abtastwerten Länge ist, in einem zweiten Viertel des Stoppfensters beginnt, so dass ein Überblenden gleich hinter einer ersten MDCT-Faltachse beginnt, die zwischen dem Nullteil und dem Ansteigende-Flanke-Teil positioniert ist,ein Umgehungsteil des Stoppfensters sich von dem Ansteigende-Flanke-Teil zu der Mitte des Stoppfensters erstreckt, undein Abfallende-Flanke-Teil des Stoppfensters sich von der Mitte des Stoppfensters über eine zweite MDCT-Faltachse zwischen einem dritten und einem vierten Viertel des Stoppfensters zu einem Ende des Stoppfensters erstreckt, undwobei die letzten 64 decodierten Audioabtastwerte in dem ersten Decodierbereich mit einem quadratischen Sinusfenster der Länge von 64 Abtastwerten gefenstert sind,wobei die zweite Rahmenbildungsregel unmodifiziert bleibt.
- Ein Verfahren zum Decodieren codierter Rahmen von Audioabtastwerten, das folgende Schritte aufweist:Decodieren, unter Verwendung von AAC-Decodierung, von Audioabtastwerten in einem ersten Decodierbereich, wobei der erste Decodierbereich Zeitaliasing einführt, eine erste Rahmenbildungsregel, ein Startfenster und ein Stoppfenster aufweist, und Transformieren eines ersten Rahmens von decodierten Audioabtastwerten in den Zeitbereich verwendet, basierend auf einer inversen modifizierten diskreten Cosinus-Transformation, IMDCT, wobei der erste Zeitbereich-Aliasing-Einführung-Decodierer (160) konfiguriert ist, um eine IMDCT-Größe an die Start- und Stoppfenster anzupassen;Decodieren, unter Verwendung von AMR-Wb+-Decodierung, von Audioabtastwerten in einem zweiten Decodierbereich, wobei der zweite Decodierbereich eine vorbestimmte Rahmengrößenanzahl von Audioabtastwerten und eine Codieraufwärmperiodenanzahl von Audioabtastwerten aufweist, wobei der zweite Decodierbereich eine andere zweite Rahmenbildungsregel aufweist, wobei ein Rahmen des zweiten Decodierbereichs eine decodierte Darstellung einer Anzahl von zeitlich nachfolgenden Audioabtastwerten ist, wobei die Anzahl gleich der vorbestimmten Rahmengrößenanzahl von Audioabtastwerten ist; undSchalten von dem ersten Decodierbereich zu dem zweiten Decodierbereich basierend auf einer Anzeige von dem codierten Rahmen von Audioabtastwerten, oder Schalten von dem zweiten Decodierbereich (170) zu dem ersten Decodierbereich (160) basierend auf einer Anzeige von dem codierten Rahmen von Audioabtastwerten, und, beim Schalten von dem ersten Decodierbereich zu dem zweiten Decodierbereich, Modifizieren des Startfensters des ersten Decodierbereichs in dem Ausmaß, dassdas Startfenster 2048 Abtastwerte lang ist und bei einer 1024-Punkt-IMDCT verwendet wird,das Startfenster sofort mit einem Ansteigende-Flanke-Teil beginnt, der eine erste MDCT-Faltachse in der Mitte desselben aufweist, die sich über ein erstes und zweites Viertel des Startfensters zu einer Mitte des Startfensters erstreckt,ein Umgehungsteil sich von der Mitte zu einem Abfallende-Flanke-Teil erstreckt,der Abfallende-Flanke-Teil, der einen Überblendabschnitt mit einem Sinusfenster bereitstellt, 64 Abtastwerte lang ist und sich zu einer zweiten MDCT-Faltachse zwischen einem dritten und vierten Viertel des Startfensters erstreckt, undein Nullteil sich von der zweiten MDCT-Faltachse zu einem Ende des Startfensters erstreckt, undwobei der linke Teil der Audioabtastwerte in dem zweiten Decodierbereich mit einem Überblendsinusfenster der Länge von 64 Abtastwerten gefenstert ist; oderSchalten von dem zweiten Decodierbereich zu dem ersten Decodierbereich ansprechend auf eine andere Charakteristik der Audioabtastwerte, und zum, beim Schalten von dem zweiten Decodierbereich zu dem ersten Decodierbereich, Modifizieren des Stoppfensters des ersten Decodierbereichs in dem Ausmaß, dassdas Stoppfenster 2304 Abtastwerte lang ist und bei einer 1152-Punkt-IMDCT verwendet wird,ein Nullteil des Stoppfensters sich über ein erstes Viertel des Stoppfensters erstreckt,ein Ansteigende-Flanke-Teil des Stoppfensters, das ein Sinusfenster von 64 Abtastwerten Länge ist, in einem zweiten Viertel des Stoppfensters beginnt, so dass ein Überblenden gleich hinter einer ersten MDCT-Faltachse beginnt, die zwischen dem Nullteil und dem Ansteigende-Flanke-Teil positioniert ist,ein Umgehungsteil des Stoppfensters sich von dem Ansteigende-Flanke-Teil zu der Mitte des Stoppfensters erstreckt, undein Abfallende-Flanke-Teil des Stoppfensters sich von der Mitte des Stoppfensters über eine zweite MDCT-Faltachse zwischen einem dritten und einem vierten Viertel des Stoppfensters zu einem Ende des Stoppfensters erstreckt, undwobei die letzten 64 decodierten Audioabtastwerte in dem ersten Decodierbereich mit einem quadratischen Sinusfenster der Länge von 64 Abtastwerten gefenstert sind,wobei die zweite Rahmenbildungsregel unmodifiziert bleibt.
- Ein Computerprogramm mit einem Programmcode, angepasst, um das Verfahren gemäß Anspruch 3 oder 5 durchzuführen, wenn der Programmcode auf einem Computer oder Prozessor läuft.
Applications Claiming Priority (5)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US7985608P | 2008-07-11 | 2008-07-11 | |
| US61/079,856 | 2008-07-11 | ||
| US10382508P | 2008-10-08 | 2008-10-08 | |
| US61/103,825 | 2008-10-08 | ||
| PCT/EP2009/004651 WO2010003563A1 (en) | 2008-07-11 | 2009-06-26 | Audio encoder and decoder for encoding and decoding audio samples |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| HK1155552A1 HK1155552A1 (zh) | 2012-05-18 |
| HK1155552B true HK1155552B (en) | 2016-08-12 |
Family
ID=
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP2311032B1 (de) | Audiocodierer und decodierer zum codieren und decodieren von audioabtastwerten | |
| KR101516468B1 (ko) | 샘플링된 오디오 신호의 프레임들을 인코딩 및 디코딩하기 위한 오디오 인코더 및 디코더 | |
| US8595019B2 (en) | Audio coder/decoder with predictive coding of synthesis filter and critically-sampled time aliasing of prediction domain frames | |
| AU2013200679B2 (en) | Audio encoder and decoder for encoding and decoding audio samples | |
| EP3002751A1 (de) | Audiocodierer und -decodierer zur codierung und decodierung von audioproben | |
| HK1223452B (en) | Audio encoder and decoder for encoding and decoding audio samples | |
| HK1155552B (en) | Audio encoder and decoder for encoding and decoding audio samples | |
| HK1158333B (en) | Audio encoder and decoder for encoding and decoding frames of sampled audio signal | |
| HK1140281A (en) | Audio encoder and decoder for encoding and decoding frames of a sampled audio signal | |
| HK1140281B (en) | Audio encoder and decoder for encoding and decoding frames of a sampled audio signal |