DE102021101707A1 - Verfahren zum Abspielen eines Audiodatenstroms - Google Patents

Verfahren zum Abspielen eines Audiodatenstroms Download PDF

Info

Publication number
DE102021101707A1
DE102021101707A1 DE102021101707.6A DE102021101707A DE102021101707A1 DE 102021101707 A1 DE102021101707 A1 DE 102021101707A1 DE 102021101707 A DE102021101707 A DE 102021101707A DE 102021101707 A1 DE102021101707 A1 DE 102021101707A1
Authority
DE
Germany
Prior art keywords
data stream
audio
audio frames
audio signal
age
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE102021101707.6A
Other languages
English (en)
Inventor
Murat Sari
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Smart Streaming Solutions Voicetra GmbH
Original Assignee
Smart Streaming Solutions Voicetra GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Smart Streaming Solutions Voicetra GmbH filed Critical Smart Streaming Solutions Voicetra GmbH
Priority to DE102021101707.6A priority Critical patent/DE102021101707A1/de
Publication of DE102021101707A1 publication Critical patent/DE102021101707A1/de
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/242Synchronization processes, e.g. processing of PCR [Program Clock References]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/75Media network packet handling
    • H04L65/752Media network packet handling adapting media to network capabilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/75Media network packet handling
    • H04L65/764Media network packet handling at the destination 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/4302Content synchronisation processes, e.g. decoder synchronisation
    • H04N21/4307Synchronising the rendering of multiple content streams or additional data on devices, e.g. synchronisation of audio on a mobile phone with the video output on the TV screen
    • H04N21/43076Synchronising the rendering of multiple content streams or additional data on devices, e.g. synchronisation of audio on a mobile phone with the video output on the TV screen of the same content streams on multiple devices, e.g. when family members are watching the same movie on different devices
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4398Processing of audio elementary streams involving reformatting operations of audio signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04JMULTIPLEX COMMUNICATION
    • H04J3/00Time-division multiplex systems
    • H04J3/02Details
    • H04J3/06Synchronising arrangements
    • H04J3/062Synchronisation of signals having the same nominal but fluctuating bit rates, e.g. using buffers
    • H04J3/0632Synchronisation of packets and cells, e.g. transmission of voice via a packet network, circuit emulation service [CES]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Communication Control (AREA)

Abstract

Die Erfindung betrifft ein Verfahren zum Abspielen eines Audiosignals (6) aus Audioframes, die in zeitlich aufsteigender Reihenfolge von einer Audiodatenquelle (4) mit Zeitstempeln gekennzeichnet in einem Datenstrom (20) empfangen werden, umfassend:
- Wandeln des Datenstromes (20) in einen konvertierten Datenstrom (46), in dem ein von den Zeitstempeln abhängiges Istalter (48) der Audioframes an ein vorgegebenes Sollalter (52) Audioframes angeglichen wird, und
- Wiederherstellen und Abspielen des Audiosignals aus den im konvertierten Datenstrom (46) enthaltenen Audioframes.

Description

  • Die vorliegende Erfindung betrifft ein Verfahren und eine Vorrichtung zum Abspielen eines Audiodatenstroms sowie eine Personenführungsanlage mit der Vorrichtung.
  • Aus der WO 2006/006026 A2 ist ein Verfahren zum Abspielen eines Audiodatenstroms aus einer Vielzahl von in aufsteigender Reihenfolge von einer Audiodatenquelle empfangenen Datenpaketen bekannt. In dem bekannten Verfahren werden dediziert angeforderte Zeitstempel verwendet, um die Abspielgeschwindigkeit des Audiodatenstromes an eine Abspielgeschwindigkeit anzupassen, in der der Audiodatenstrom synchron auf einer Vielzahl von Wiedergabegeräte abgespielt werden kann.
  • Aufgabe der Erfindung ist es, das bekannte Verfahren zu verbessern.
  • Die Aufgabe wird durch die Merkmale der unabhängigen Ansprüche gelöst. Bevorzugte Weiterbildungen sind Gegenstand der abhängigen Ansprüche.
  • Gemäß einem Aspekt der Erfindung, umfasst ein Verfahren zum Abspielen eines Audiosignals aus Audioframes, die in zeitlich aufsteigender Reihenfolge von einer Audiodatenquelle mit Zeitstempeln gekennzeichnet in einem Datenstrom empfangen werden, die Schritte:
    • - Wandeln des Datenstromes in einen konvertierten Datenstrom, in dem ein von den Zeitstempeln abhängiges Istalter der Audioframes an ein vorgegebenes Sollalter Audioframes angeglichen wird, und
    • - Wiederherstellen und Abspielen des Audiosignals aus den im konvertierten Datenstrom enthaltenen Audioframes.
  • Dem angegebenen Verfahren liegt die Überlegung zugrunde, dass das eingangs genannte Verfahren versucht durch eine Kommunikation der einzelnen Geräte untereinander eine Synchronisation der Wiedergabe des Audiodatenstromes herbeizuführen. Allerdings müssen für diese Synchronisation Daten übertragen werden, die die Bandbreite des Übertragungsmediums blockieren. Die Vorgabe eines Sollalters, sei es fest eingestellt durch Vorabmessungen oder durch Schätzungen erlaubt es demgegenüber, die Synchronisation ganz ohne zusätzliche Datenübertragungen herbeizuführen. Die so zusätzlich frei werdende Bandbreite kann nun dazu genutzt werden, die Datenpakete nicht mehr per Broadcast wie im eingangs genannten Verfahren sondern per Unicast zu übertragen, was von einer deutlich größeren Anzahl an Herstellern von vor allem drahtloser Netzwerkhardware unterstützt wird.
  • Durch die Anpassung oder Konvertierung des Istalters der Audioframes an ein Sollalter im Datenstrom wird der Durchsatz der Audioframes und damit die Wiedergabegeschwindigkeit des Audiosignals verändert. Diese Anpassung kann beispielsweise einfach durch Verwerfen von Audioframes oder durch Einbau von Leerläufen erreicht werden, bis das Sollalter erreicht ist. Um allerdings eine möglichst hohe Wiedergabequalität zu gewährleisten, wird vorzugsweise aus den empfangenen Audioframes das Audiosignal wiederhergestellt und der konvertierte Datenstrom anschließen mit einer angepassten Samplerate wiederhergestellt.
  • Grundsätzlich lässt sich die Konvertierung zwischen den Datenströmen beliebig durchführen. Vorzugsweise erfolgt die Konvertierung allerdings in Abhängigkeit einer Regelabweichung zwischen dem Istalter und dem Sollalter. Dies hat den Vorteil, dass sich die Geschwindigkeit zwischen dem Angleichen des Istalters an das Sollalter und so auch die Qualität der Wiedergabe beliebig einstellen lässt.
  • Hierzu sollte die Regelabweichung in besonders bevorzugter Weise nichtlinear, insbesondere kubisch verändert werden. Es hat sich gezeigt, dass der Angleich des Istalters an das Sollalter insbesondere im Falle der Ausregelung von Störgrößen der Eingriff der Regelschleife nicht hörbar ist.
  • In einer besonderen Weiterbildung wird basierend auf der Regelabweichung über einen Proportionalregler eingestellt, der auf die Ausregelung der Störgröße mit ausreichend hoher Geschwindigkeit reagiert.
  • In einer anderen Weiterbildung des angegebenen Verfahrens wird der Datenstrom von der Audiodatenquelle mit einem Anforderungssignal angefordert, so dass sich das angegebene Verfahren in einer reinen Unicast-Übertragung umsetzen lässt.
  • In einer noch anderen Weiterbildung umfasst das angegebene Verfahren den Schritt Schätzen des Sollalters basierend auf einer Historie der Istalter einer vorbestimmten Anzahl in der Vergangenheit liegender Audioframes. Diese Schätzung kann in beliebiger Weise beispielsweise gestützt auf eine Mittelwertbildung, eine Tiefpassfilterung mit anschließender Mittelwertbildung, eine Modellierung des Übertragungskanals oder einer anderen statistischen Herangehensweise erfolgen. Vorteil dieser Schätzung ist, dass hierzu keinerlei Kommunikation der einzelnen Abspielgeräte untereinander notwendig ist.
  • In einer bevorzugten Weiterbildung des angegebenen Verfahrens werden zum Schätzen die Istalter ignoriert, deren Veränderungsrate gegenüber vergangenen Istaltern einen vorbestimmten Wert übersteigt. Dies lässt sich grundsätzlich mit einem Tiefpassfilter erreichen. Auf diese Weise können wirksam temporär zu hohe Ausschläge in der Übertragung der Datenpaketkopien außen vor gelassen werden, die nur temporär sind und bereits wirksam durch an sich bekannte Jitterpuffer abgefangen werden. Durch die Tiefpassfilterung wird wirksam ein durch durch nicht synchrones Abtasten und Wiederherstellen der Audioframes bedingtes Überlaufen der Pufferspeicher wirksam vermieden.
  • Gemäß einem weiteren Aspekt der Erfindung ist eine Steuervorrichtung eingerichtet, um eines der angegebenen Verfahren durchzuführen.
  • In einer Weiterbildung der angegebenen Vorrichtung weist die angegebene Vorrichtung einen Speicher und einen Prozessor auf. Dabei ist das angegebene Verfahren in Form eines Computerprogramms in dem Speicher hinterlegt und der Prozessor zur Ausführung des Verfahrens vorgesehen, wenn das Computerprogramm aus dem Speicher in den Prozessor geladen ist.
  • Gemäß einem weiteren Aspekt der Erfindung umfasst ein Computerprogramm Programmcodemittel, um alle Schritte des angegebenen Verfahrens durchzuführen, wenn das Computerprogramm auf einem elektronischen Gerät oder einer der angegebenen Vorrichtungen ausgeführt wird.
  • Gemäß einem weiteren Aspekt der Erfindung enthält ein Computerprogrammprodukt einen Programmcode, der auf einem computerlesbaren Datenträger gespeichert ist und der, wenn er auf einer Datenverarbeitungseinrichtung ausgeführt wird, das angegebene Verfahren durchführt.
  • Gemäß einem weiteren Aspekt der Erfindung umfasst eine Personenführungsanlage eine Audiodatenquelle zum Aufzeichnen und Wandeln eines Audiosignals aus einem Mikrofon in einen Datenstrom aus Audioframes, und eine Vielzahl von angegebenen Vorrichtungen zum Empfangen je einer Kopie des Datenstrom aus Audioframes und zum Abspielen des aus den Audioframes zusammengesetzten Audiosignals.
  • Die oben beschriebenen Eigenschaften, Merkmale und Vorteile dieser Erfindung sowie die Art und Weise wie diese erreicht werden, werden verständlicher im Zusammenhang mit der folgenden Beschreibung der Ausführungsbeispiele, die im Zusammenhang mit der Zeichnung näher erläutert werden. Es zeigen:
    • 1 eine schematische Darstellung einer Personenführungsanlage,
    • 2 eine Empfangsvorrichtung in der Personenführungsanlage der 1, und
    • 3 ein Diagramm zur Veranschaulichung eines Verhaltens eines Regelkreises in der Empfangsvorrichtung der 2.
  • In den Figuren werden gleiche technische Elemente mit gleichen Bezugszeichen versehen und nur einmal beschrieben. Die Figuren sind rein schematisch und geben vor allem nicht die tatsächlichen geometrischen Verhältnisse wieder.
  • Es wird auf 1 Bezug genommen, die eine schematische Darstellung einer Personenführungsanlage 2 zeigt.
  • Aufgabe der Personenführungsanlage 2 ist es, aus ein Audiosignal 4 aus einer Audiodatenquelle 6 als Audiodatenstrom 8 aufzunehmen und an eine Vielzahl von Vorrichtungen 10, 10', 10" zum Abspielen des Audiodatenstromes 8 auf entsprechenden Abspielgeräten, wie Lautsprechern zu versenden, wobei in 1 die einzelnen Vorrichtungen zur besseren Unterscheidung mit Apostrophen versehen sind.
  • Die Audiodatenquelle 4 kann ein Mikrofon sein, dass als Audiosignal 6 die Sprache eines Touristenführers aufzeichnet, so dass die Personenführungsanlage 2 die aufgezeichnete Sprache Touristenführers in einer Touristengruppe verteilt. Andere Einsatzzwecke der Personenführungsanlage 2 wären beispielsweise auf Kongressen, auf denen die Sprache eines Sprechers aufgezeichnet und an mehrere Zuhörer verteilt wird oder zur Ansagenverteilung, bei der Informationen eines Ansagers auf einer Veranstaltung, in einem Kaufhaus oder dergleichen auf mehrere Lautsprecher verteilt werden soll. Die vorherige Aufzählung sowie der Begriff „Personenführungsanlage‟ sollen nicht um Zweck einschränkend verstanden werden, sondern lediglich die technische Funktion verdeutlichen.
  • Das Audiosignal 6 wird über eine Soundkarte 12 in einem Server 14 aufgenommen, die das Audiosignal 6 in den Audiodatenstrom 8 wandelt. Der Server 14 kann dabei ein beliebiger Standardcomputer mit einem beliebigen Standardbetriebssystem sein. Besondere Leistungsanforderungen sind nicht an den Server 14 gestellt. Ein vergleichsweise leistungsschwacher Rasperry Pi reicht zur Umsetzung des Ausführungsbeispiels bereits aus.
  • Die Soundkarte 12 gibt den Audiodatenstrom 8 in Form von Audioframes an einen Wandler 16 aus, dessen Aufgabe es ist, den Audiodatenstrom 8 für die Übertragung an die einzelnen Vorrichtungen 10, 10', 10" geeignet vorzubereiten. Hierzu puffert der Wandler 16 den Audiodatenstrom 8 und passt bei Bedarf seine Samplerate für die weitere Verarbeitung zur Übertragung an die Vorrichtungen 10, 10', 10" und gibt jedem Audioframe einen Zeitstempel an. Diese Zeitstempel werden an späterer Stelle näher erläutert.
  • Der Server 14 umfasst ferner eine Prozesskette 18, die den neuen Datenstrom 20 aus Audioframes und Zeitstempeln aus dem Wandler 16 abruft und an die Vorrichtungen 10, 10', 10" versendet. Die Prozesskette 18 umfasst einen Lautstärkeregler 22, auch VU-Meter genannt, und einen Pegelbegrenzer 24, auch Brick Wall Limiter genannt, die einen Pegel des in Datenstrom 20 aus Audioframes und Zeitstempeln enthaltenden Audiosignals 6 geeignet aufbereiten. Diese und weitere Elemente, wie beispielsweise Elemente zur Unterdrückung von Hintergrundgeräuschen in Personenführungsanlagen sind an sich bestens bekannt und sollen nachstehend nicht näher erläutert werden.
  • Der Datenstrom 20 aus Audioframes und Zeitstempeln wird abschließend mit einer Übertragungseinheit 26 in der Prozesskette 18 über ein drahtloses Netzwerk 28 an die Vorrichtungen 10, 10', 10" versendet. Hierzu werden aus dem Datenstrom 20 aus Audioframes und Zeitstempeln Datenpakete geformt und encodiert, beispielsweise nach dem offenen Standard RFC 6716 der als sogenanntes OPUS-Datenformat bekannt ist. Jedes encodierte Datenpaket wird dann vervielfacht oder kopiert und mit einem geeigneten Übertragungsprotokoll per Unicast über das drahtlose Netzwerk 28 an die einzelnen Vorrichtungen 10, 10', 10" übertragen. Das Übertragungsprotokoll kann dabei grundsätzlich beliebig gewählt werden. Für eine ressourcenschonende Übertragung eignet sich das User Datagram Protocol, auch unter der Abkürzung UDP bekannt.
  • Durch die Vervielfältigung der encodierten Datenpakete wird an jede Vorrichtung 10, 10', 10" ein eigener Packetdatenstrom 30, 30', 30" über das drahtlose Netzwerk versendet, wobei die Apostrophe in den Bezugszeichen die Zuordnung zu den einzelnen Vorrichtungen 10, 10', 10" erlauben. Die Vorrichtungen 10, 10', 10" dekodieren aus ihrem jeweilig empfangenen Packetdatenstrom 30, 30', 30" da Audiosignal 6 und geben es auf dem jeweiligen Lautsprecher 9 wieder.
  • Weil die Verbindung zwischen jeder Vorrichtung 10, 10', 10" und dem Server 14 als Unicast-Verbindung aufgebaut ist, muss der Server 14 über die Existenz der jeweiligen Vorrichtung 10, 10', 10" informiert sein. Daher senden die einzelnen Vorrichtungen 10, 10', 10" Statusnachrichten, sogenannte Beacons 32, 32', 32" an den Server 14 um diesen über ihre Existenz zu informieren. Auf diese Weise kann der Server jeden Packetdatenstrom 30, 30', 30" an die entsprechende Vorrichtung 10, 10', 10" adressieren, dediziert versenden und so die entsprechende Unicast-Verbindung aufbauen.
  • Ein Beacon-Empfänger 34 in dem Server 14 empfängt die Beacons 32, 32', 32" und informiert einen Clientmanager 36 über die Existenz der einzelnen Vorrichtungen 10. Der Clientmanager 36 kann dann beispielsweise die Netzwerkadressen 38 der Vorrichtungen 10, 10', 10" der Übertragungseinheit 26 zur Verfügung stellen, um die Unicast-Verbindungen zu den Vorrichtungen 10, 10', 10" zu ermöglichen.
  • Es wird auf 2 Bezug genommen, die eine der Vorrichtungen 10, 10', 10" in der Personenführungsanlage 2 der 1 in einer schematischen Darstellung zeigt.
  • Die Vorrichtung 10 empfängt ihren an sie gerichteten Packetdatenstrom 30, decodiert sich in einem Dekoder 40 den Datenstrom 20 aus Audioframes und Zeitstempeln und gibt diesen dekodierten Datenstrom 20 an einen Durchsatzeinsteller 42 aus. Der Durchsatzeinsteller passt über einen bestimmten Zeitraum gesehen den Durchsatz an Datenpaketen aus dem Datenstrom 20 aus Audioframes und Zeitstempeln an, die zur Wiedergabe des Audiosignals 6 berücksichtigt werden. Auf diese Weise lässt sich die Wiedergabe des Audiosignals 6 beschleunigen oder verlangsamen.
  • Beispielsweise kann der Durchsatzeinsteller 42 durch Verwerfen eines Datenpaketes aus dem Datenstrom 20 aus Audioframes und Zeitstempeln die Wiedergabe des Audiosignals 6 beschleunigen. Durch kopieren eines Datenpaketes aus dem Datenstrom 20 kann der Durchsatzeinsteller 42 die Wiedergabe des Audiosignals 6 verlangsamen. Da ein solcher Ansatz allerdings deutlich hörbare Oberschwinungen in das Audiosignal 6 einträgt rekonstruiert der Durchsatzeinsteller 42 das Audiosignal 6 aus dem Datenstrom 20 und tastet es mit einer vorbestimmten Samplerate wieder ab, die geeignet ist, das Audiosignal 6 mit der bestimmten Zielgeschwindigkeit wiederzugeben. Diese Samplerate wird mit einem Stellsignal 44 vorgegeben.
  • Wichtig ist, dass in dem Ausgabedatenstrom 46 mit dem neu abgetasteten Audiosignal auch die Zeitstempel rekonstruiert werden, aus denen sich das Istalter 48 des Audiosignals 6 zu jedem Abtastzeitpunkt ableiten lässt. Diese Bestimmung des Istalters 48 ist in 2 mit einer Istalterbestimmungseinheit 50 angedeutet, die aus dem Ausgabedatenstrom 46 das Audiosignal 6 und sein Istalter 48 heraustrennt.
  • Das Istalter 48 wird in einem Vergleichsglied 51 einem Sollalter 52 gegenübergestellt. Aus dem Ergebnis dieser Gegenüberstellung, einer Regelabweichung 54, wird in einem Regler 56 das Stellsignal 44 zur Vorgabe der Samplerate in dem Durchsatzeinsteller 42 erzeugt. Der Durchsatzeinsteller 42 bildet somit mit der Istalterbestimmungseinheit 50 eine Regelstrecke 58, mit dem Istalter der einzelnen Audioframes des Audiosignals 6 als Regelgröße.
  • Das Sollalter 52 in diesem Regelkreis 60 kann dabei beliebig vorgegeben werden. So kann es beispielsweise gestützt auf Erfahrungswerten fest vorgegeben und in einem Speicher hinterlegt sein. Alternativ lässt sich das Sollalter 52 auch mit Randbedingungen modellieren, die entweder statisch vorgegeben oder dynamisch erfasst werden.
  • In der vorliegenden Ausführung wird das Sollalter 52 mit einer Sollalterbestimmungseinrichtung 62 aus einer Historie 64 des
    Istalters 48 abgeleitet, so dass das Sollalter 52 grundsätzlich dem Istalter 48 folgt. Allerdings lassen sich so aus dem Sollalter 52 temporäre extreme Ausschläge einer Verzögerung der Laufzeit des Datenstromes 20 mit dem Audiosignal 6 ausblenden, die bei der fehlerfreien Wiedergabe des Audiosignales grundsätzlich keine oder nur eine untergeordnete Rolle spielen.
  • Wird beispielsweise der Datenstrom 20 mit dem Audiosignal 6 mit einer geringfügig größeren Frequenz an Audioframes erzeugt als er wiedergegeben wird (hier reichen wenige Hertz Unterschied aus), so läuft ein Pufferspeicher bei der Ausgabe des Audiosignals 6 zwangsläufig über. Solche Pufferspeicher, auch als Jitterpuffer bekannt, sind zum Ausgleich von latzenzbedingten Wiedergabefehlern grundsätzlich bekannt.
  • Allerdings läuft ein solcher Pufferspeicher gerade dann über Kurz oder Lang voll, wenn Audiodatenquelle und Audiodatensenke dauerhaft mit einem, wenn auch kleinen Unterschied in der Samplerate die Audioframes in des Audiosignals 6 erzeugen oder zur Wiedergabe abarbeiten. Die zuvor genannten größeren Ausschläge der Laufzeit des Datenstromes 20 mit dem Audiosignal hingegen werden durch den an sich bekannten Jitterpuffer zuverlässig abgefangen und brauchen technisch nicht weiter berücksichtigt zu werden.
  • Zum Erfassen der Historie 64 des Istalters 48 umfasst die Sollalterbestimmungseinrichtung 62 einen Pufferspeicher 66, in dem eine bestimmte Anzahl vergangener Istalter 48 hinterlegt wird. Die vergangenen Istalter können nun als Historie 64 aus dem Pufferspeicher 66 ausgelesen und zum Sollalter 52 in einem entsprechenden Filter 68 verarbeitet werden. Das Filter 68 kann das Sollater 52 aus der Historie 64 in einer beliebigen Art und Weise bestimmen. So wäre es möglich, das Filter 68 als einfaches FIR-Filter zur Bestimmung beispielsweise eines Mittelwertes aus der Historie 64 aufzubauen. Alternativ könnte das Filter 68 das Sollalter 52 auch mit einem statistischen Ansatz bestimmen. Weiter alternativ könnte das Filter 68 das Sollalter 52 aus der Historie 64 und gegebenenfalls weiteren Randbedingungen erfassen, was sich beispielsweise in einfacher Weise mit einem Kalman-Filter umsetzen lassen könnte, bei dem ein Modell des Übertragungskanals zwischen dem Server 14 und der jeweiligen Vorrichtung 10 berücksichtigt wird. Der Fachmann kann sich das Filter 68 applikationsabhängig und je nach vorhandenen Ressourcen beliebig definieren.
  • Schaltet ein Benutzer die jeweilige Vorrichtung 10, 10', 10" beispielsweise über einen Schalter 70 ein, wird der jeweilige Beacon 32, 32', 32" an den Server 14 versendet, so dass der Server 14 über die Existenz der Vorrichtung 10, 10', 10" informiert wird. Danach beginnt der Server 14 das Audiosignal 6 in dem Datenstrom 20 per beschriebener Unicast-Verbindung an die jeweilige Vorrichtung 10, 10', 10" zu übertragen. Sollte es in einem solchen Fall zu einem dauerhaften Ungleichgewicht zwischen der Erzeugung der Audioframes in dem Datenstrom 20 im Server 14 und bei der Verarbeitung der Audioframes in dem Datenstrom 20 in der jeweiligen Vorrichtung 10, 10', 10" kommen und Pufferspeicher, wie die angesprochen Jitterpuffer drohen überzulaufen, greift der Regelkreis 60 durch eine Anpassung des Durchsatzes der das Audiosignal 6 beschreibenden Audioframes ein und sorgt dafür, dass die auf ein Level gefüllt werden, bei dem sie effizient auf temporäre Störungen reagieren können.
  • Dies ist in 3 anhand eines Diagramms, in dem das Sollalter 52, das Istalter 48 und das Stellsignal 44 qualitativ über die Zeit 72 aufgetragen sind.
  • Aus dem Diagramm ist zu sehen, dass das Istsignal 48 zunächst mit einer schwachen Steigung 74 droht, die Pufferspeicher auf Dauer zu überfüllen. Durch den Eingriff der Sollalterbestimmungseinrichtung 62 wird das Stellsignal 44 kurzfristig erhöht, was zu einer Entleerung der betroffenen Pufferspeicher führt. Die Regelung 68 sorgt dabei dafür, dass die Entleerung nicht abrupt, sonder verzögert über einen für den Hörer nicht wahrnehmbaren Zeitraum erfolgt.
  • Die Veränderung des Stellsignal 44 im Falle eines Regeleingriffes sollte so gewählt sein, dass die Pufferspeicher in einem zeitlich zuverlässigen Rahmen angepasst werden. Hierzu sollte sich das Stellsignal 44 im Falle eines Regeleingriffs nicht zu schnell, aber auch nicht zu langsam verändern.
  • Ein zuverlässig schneller aber für den Hörer kaum wahrnehmbarer Regeleingriff wird erreicht, wenn der Regler 56 als kubischer Proportionalregler ausgebildet ist und so das Stellsignal 44 durch kubieren und gewichten aus der Regeldifferenz 64 gewonnen wird.
  • Vergleichsweise schnelle Veränderungen des Istalters 44, die eine vorbestimmte Anstiegsrate übersteigen, sogenannte Ausreißer 76 werden durch die Schätzung des Sollalters 52 zuverlässig ausgeblendet.
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • WO 2006/006026 A2 [0002]

Claims (10)

  1. Verfahren zum Abspielen eines Audiosignals (6) aus Audioframes, die in zeitlich aufsteigender Reihenfolge von einer Audiodatenquelle (4) mit Zeitstempeln gekennzeichnet in einem Datenstrom (20) empfangen werden, umfassend: - Wandeln des Datenstromes (20) in einen konvertierten Datenstrom (46), in dem ein von den Zeitstempeln abhängiges Istalter (48) der Audioframes an ein vorgegebenes Sollalter (52) Audioframes angeglichen wird, und - Wiederherstellen und Abspielen des Audiosignals aus den im konvertierten Datenstrom (46) enthaltenen Audioframes.
  2. Verfahren nach Anspruch 1, wobei zum Wandeln des Datenstromes (20) in den konvertierten Datenstrom (46) das Audiosignal (6) aus den Audioframes im Datenstrom (20) wiederhergestellt und anschließend mit einer vorbestimmten Samplerate neu abgetastet wird.
  3. Verfahren nach Anspruch 1 oder 2, wobei der konvertierte Datenstrom (46) in Abhängigkeit einer Regelabweichung (54) zwischen dem Istalter (48) und dem Sollalter (52) aus dem Datenstrom (20) erzeugt wird.
  4. Verfahren nach Anspruch 3, wobei die Regelabweichung (54) vor dem Einstellen des Durchsatzes mit einem nichtlinearen Proportionalregler (56), insbesondere mit einem kubischen Proportionalregler (56) verändert wird.
  5. Verfahren nach einem der vorstehenden Ansprüche, umfassend Anfordern des Datenstromes (20) von einem Server (14) mit einem Anforderungssignal (32).
  6. Verfahren nach einem der vorstehenden Ansprüche, umfassend Schätzen des Sollalters (52) basierend auf einer Historie (64) der Istalter (48) einer vorbestimmten Anzahl in der Vergangenheit liegender Audioframes.
  7. Verfahren nach Anspruch 6, wobei zum Schätzen die Istalter (48) ignoriert werden, deren Veränderungsrate gegenüber vergangenen Istaltern (48) einen vorbestimmten Wert übersteigt.
  8. Vorrichtung (10), die eingerichtet ist, ein Verfahren nach eines der vorstehenden Ansprüche durchzuführen.
  9. Computerprogramm umfassend Programmcodemittel, um alle Schritte eines Verfahrens nach einem der Ansprüche 1 bis 7 durchzuführen, wenn das Computerprogramm auf einem elektronischen Gerät oder einer Vorrichtung nach Anspruch 8 ausgeführt wird.
  10. Personenführungsanlage (2) umfassend: - eine Audiodatenquelle (12, 16) zum Aufzeichnen und Wandeln eines Audiosignals (6) aus einem Mikrofon (4) in einen Datenstrom (20) aus Audioframes, und - eine Vielzahl von Vorrichtungen nach Anspruch 8 zum Empfangen je einer Kopie des Datenstrom (20) aus Audioframes und zum Abspielen des aus den Audioframes zusammengesetzten Audiosignals (6).
DE102021101707.6A 2021-01-26 2021-01-26 Verfahren zum Abspielen eines Audiodatenstroms Pending DE102021101707A1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE102021101707.6A DE102021101707A1 (de) 2021-01-26 2021-01-26 Verfahren zum Abspielen eines Audiodatenstroms

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102021101707.6A DE102021101707A1 (de) 2021-01-26 2021-01-26 Verfahren zum Abspielen eines Audiodatenstroms

Publications (1)

Publication Number Publication Date
DE102021101707A1 true DE102021101707A1 (de) 2022-07-28

Family

ID=82320547

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102021101707.6A Pending DE102021101707A1 (de) 2021-01-26 2021-01-26 Verfahren zum Abspielen eines Audiodatenstroms

Country Status (1)

Country Link
DE (1) DE102021101707A1 (de)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006006026A2 (en) 2004-07-01 2006-01-19 Skipjam Corp. Method and system for synchronization of digital media playback
US20080259966A1 (en) 2007-04-19 2008-10-23 Cisco Technology, Inc. Synchronization of one or more source RTP streams at multiple receiver destinations

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006006026A2 (en) 2004-07-01 2006-01-19 Skipjam Corp. Method and system for synchronization of digital media playback
US20080259966A1 (en) 2007-04-19 2008-10-23 Cisco Technology, Inc. Synchronization of one or more source RTP streams at multiple receiver destinations

Similar Documents

Publication Publication Date Title
DE69732388T2 (de) Verfahren und Vorrichtung zur Übertragung von Datenpaketen
DE60034484T2 (de) Verfahren und vorrichtung in einem kommunikationssystem
DE60000319T2 (de) Verfahren und Gerät zum Verringern von Startupverzögerung in datenpaketbasierte Netzströmenanwendungen
DE102010018376A1 (de) Dynamische Pufferung und Synchronisation verwandter Medienströme in Paketnetzwerken
DE60223131T2 (de) Verfahren und vorrichtung zum codieren und decodieren von pauseninformationen
EP0978172B1 (de) Verfahren zum verschleiern von fehlern in einem audiodatenstrom
EP1883273A1 (de) Steuergerät und Verfahren zur drahtlosen Audiosignalübertragung im Rahmen einer Hörgeräteprogrammierung
DE69613611T2 (de) System zur Speicherung von und zum Zugriff auf Sprachinformation
DE102006006802A1 (de) Multiplexvorrichtung sowie Multiplexdaten-Übertragungs- und -Empfangssystem
DE60224005T2 (de) Verfahren und vorrichtung zur verarbeitung von mehreren audiobitströmen
DE102009008092A1 (de) Verfahren und Vorrichtung zum Kompensieren von Abtastratenschwankungen
DE60032571T2 (de) Verfahren und Gerät zur Übertragung von Echtzeitdaten in einem Mehrfachzugangssystem
EP1425885B1 (de) Verfahren und anordnung zur übermittlung von daten aus einem ersten datennetz in ein zweites datennetz
EP2245620B1 (de) Verfahren und mittel zur enkodierung von hintergrundrauschinformationen
DE102010003248B4 (de) Verfahren und Vorrichtung zur Verarbeitung von Daten in einem Netzwerk eines Fahrzeugs
DE102021101707A1 (de) Verfahren zum Abspielen eines Audiodatenstroms
DE60308560T2 (de) System und besprechung zum bereitstellen einer besprechungsfunktion in einer hörhilfe
DE112013001880T5 (de) Vorrichtung und Verfahren zum Verteilen digitaler Daten, Vorrichtung und Verfahren zur Wiedergabe digitaler Daten, synchronisiertes Wiedergabesystem, Programm und Aufzeichnungsmedium
DE60300391T2 (de) Verfahren zur Paketpufferspeicherverwaltung und zugehörige Vorrichtung
DE602004006401T2 (de) Aktualisieren eines verborgenen datenkanals
WO2009052772A2 (de) Verfahren und system zur bandbreite-optimierten übertragung von hdtv-datenströmen über ein ip-basiertes verteilernetz
DE102006021611A1 (de) Mehrere Datenströme einer Multimediadatenverarbeitung
DE102021120204A1 (de) Empfang von Daten
WO2001093490A2 (de) Verfahren zur korrektur von taktabweichungen bei audiodaten
DE60017565T2 (de) Verfahren zur verwaltung der tonsignalkodierung und -wiedergabe in einem asynchronen übertragungssystem

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R016 Response to examination communication