-
GEBIET DER ERFINDUNG
-
Die vorliegende Erfindung bezieht sich allgemein auf den Bereich der Audio-Ausrüstung, und vor allem auf die Verbesserung der Audio-Wahrnehmung von Software-Anwendungen mit 3D-Sound durch Benutzer.
-
HINTERGRUND DER ERFINDUNG
-
Derzeit verwenden Software-Anwendungen, die, wie beispielsweise Computerspiele, ausgiebig Gebrauch von einer 3D-Sound-Stufe machen, eine von einigen allgemeinen Anwendungsprogrammschnittstellen (APIs) wie DirectSound3D® von Microsoft Corporation, oder den offenen Standard OpenAL, um Daten zu übertragen. Die Daten enthalten beispielsweise die Lage des Sounds relativ zum Zuhörer, umfassend die Richtung, die Höhe, die Entfernung, die anfängliche Lautstärke, irgendwelche Verzerrungseffekte, und das tatsächlich hörbare Geräusch selbst. Die Daten werden zur Sound-Software/Hardware übertragen, die für die tatsächliche physikalische Erzeugung des Sounds verantwortlich ist (”Sound Generation Layer” oder ”SGL”). Der SGL enthält das Interface API (beispielsweise DirectSund3D®), den Software-Treiber der Sound-Karte/Sound-Hardware, und die Sounderzeugungs-Hardware.
-
Der SGL führt dann die tatsächliche Erzeugung des physikalischen Sounds basierend auf den von der Software-Anwendung erhaltenen Daten durch. Der SGL kann basierend auf seinen internen Regeln entscheiden, die Lautstärke eines Sounds (zum Beispiel eines Gewehrschusses) zu reduzieren, um zu simulieren, daß der Sound weiter von der Zuhörerposition entfernt entsteht. Alternativ kann der SGL angewiesen werden, den selben Gewehrschuß-Sound abzuspielen, aber simuliert an drei verschiedenen Positionen, und würde daher wählen, welche Lautsprecher (in eventuell variierenden Konfigurationen) in welcher Lautstärke und Balance diese drei Gewehrschüsse abspielen. Abhängig davon, wie erfolgreich der SGL hierbei ist, sollte der Zuhörer glauben, daß es sich um drei verschiedene Schüsse handelt, die an drei verschiedenen Positionen abgegeben wurden, obwohl die selbe identische Sound-Datei abgespielt wird.
-
Bestimmte Computer-Spiele wie erste Personenschießspiele, liefern eine große Auswahl an Audio-Cues, um den Spieler des Spiels mit Informationen wie sich von hinten nähernden feindlichen Schritten, über den Kopf zischenden Raketen, oder einen sich hinter einer Box versteckenden, aber leise seine Waffe nachladenden Feind zu versorgen. All diese Informationen sind besonders in Wettkampfsituationen kritisch, weil die Benutzer nicht individuell einstellen können, wie ihnen diese Information präsentiert wird. Natürlich verbessert eine solche Informationserzeugung im Allgemeinen die Audio-Wahrnehmung dieser oder anderer Audio-Anwendungen durch den Benutzer.
-
Es ist daher wünschenswert, daß dem Benutzer ein eine individuelle Anpassung gestattendes System und Verfahren zur Verfügung stehen. Zwar können Benutzer ihre Lautstärkeregler so einstellen, daß leisere, weiter entfernte Sounds deutlicher gehört werden können, oder die Software-/Hardware-Equalizer-Regler so einstellen, daß Sounds bei bestimmten Frequenzen verstärkt werden, doch ist hiervon nichts besonders zufriedenstellend. Die Einstellung der Lautstärke von leisen Sounds hat auch zur Folge, daß laute Sounds eingestellt werden.
-
US 2005/075882 A1 offenbart ein Anwendungsprogramm, welches einen Leistungsverwalter und einen Audiowiedergabeverwalter zum Herstellen einer Wiedergabe entsprechend einer Audioquelle bereitstellt. Der Leistungsverwalter empfängt Audiodaten von der Audioquelle und instanziiert Audiodatenverarbeitungskomponenten zum Verarbeiten der Audiodaten. Der Audiowiedergabeverwalter empfängt die Audiodaten von dem Leistungsverwalter und instanziiert Audiodatenverarbeitungskomponenten zum weiteren Verarbeiten der Audiodaten, einschließlich einer Synthesizerkomponente, die Audiosoundwellendaten erzeugt, und Audiopuffern, die die Audiosoundwellendaten verarbeiten. Die Audiodatenverarbeitungskomponenten werden instanziiert als Objekte, die eine Schnittstelle haben, die von dem Anwendungsprogramm aufgerufen werden kann. Das Anwendungsprogramm fordert eine Programmreferenz zu einer Schnittstelle einer Audiodatenverarbeitungskomponente in dem Leistungsverwalter oder in dem Audiowiedergabeverwalter an durch Aufrufen einer Schnittstellenmethode des Leistungsverwalters bzw. des Audiowiedergabeverwalters.
-
WO 01/50598 A2 offenbar einen Vorrichtungstreiber für ein Computerbetriebssystem. Das Betriebssystem ist eingerichtet zum Empfangen digitalisierter Audiodaten von einer Medienquelle. Der Gerätetreiber weist einen Abfangkomponententreiber auf, welcher Soundmodifikationsverarbeitung der digitalisierten Daten und/oder Speicherung der digitalisierten Daten initialisieren kann.
-
ZUSAMMENFASSUNG DER ERFINDUNG
-
Eine verbesserte 3D-Sound-Wahrnehmung kann durch mehrere hierin beschriebene Komponenten erreicht werden. Diese werden vorzugsweise durch Veränderungen am SGL im Soundtreiber-Level implementiert, doch ist es auch möglich, sie im Sound-Hardware-Level zu implementieren:
- 1. Es dem Benutzer erlauben, die internen Regeln des SGL zum Rendern von Sounds zu modifizieren (zum Beispiel, wie viel leiser weiter entfernte Sounds abzuspielen sind).
- 2. Es Benutzern erlauben, Sounds zu verstärken, die unter einen voreingestellten oder vom Benutzer eingestellten Lautstärkepegel fallen, während Sounds, die über diesem Pegel sind, unverändert gelassen werden.
- 3. Es Benutzern erlauben, spezifisch bestimmte Sounds (wie, im Fall von Spielen, spielspezifische Sounds wie Gewehrfeuer oder Schritte) oder spezifische Frequenzen von Sounds zu verstärken/abzuschwächen.
- 4. Eine graphische Benutzerschnittstelle vorzusehen, die mit dem SGL kommuniziert, um Jedes und Alles von dem Vorstehenden handzuhaben, so daß ein Laien-Benutzer diese Einstellungen leicht vornehmen kann, ohne die zugrundeliegenden Algorithmen verstehen zu müssen.
-
Gemäß verschiedenen Ausführungsformen kann eine individualisierbare Sounderzeugungs-Layer-Hardware für eine digitale Rechenvorrichtung bereitgestellt werden mit einem Anwendungsprogramm-Interface, einer Sounderzeugungs-Hardware, und einem Software-Treiber für die Sounderzeugungs-Hardware, wobei der Software-Treiber dazu ausgelegt ist, von einem Benutzer individualisiert zu werden, so dass der Software-Treiber bestimmte Sounds identifiziert und diese Sounds selektiv verstärkt.
-
Gemäß verschiedenen Ausführungsformen kann ein Verfahren zur Schaffung einer verbesserten 3D-Audio-Erfahrung für einen Benutzer enthalten ein Vorsehen einer individualisierbaren Sounderzeugungs-Layer-Hardware mit einem Anwendungsprogramm-Interface, einer Sounderzeugungs-Hardware, und einem Software-Treiber für die Sounderzeugungs-Hardware, wobei der Software-Treiber dazu ausgelegt ist, von einem Benutzer individualisiert zu werden, und wobei der Software-Treiber einen Satz von Parametern umfaßt, die von der Sounderzeugungs-Layer-Hardware zum Rendern von Sounds verwendet werden. Das Verfahren kann ferner enthalten ein Individualisieren des Software-Treibers basierend auf einer Eingabe des Benutzers, so dass der Software-Treiber bestimmte Sounds identifiziert und diese Sounds selektiv verstärkt.
-
Mit Hardware und Verfahren gemäß verschiedenen Ausführungsbeispielen kann das Problem einer Verbesserung einer Individualisierung einer Soundausgabe gelöst werden.
-
BESCHREIBUNG DER BEVORZUGTEN AUSFÜHRUNGSBEISPIELE
-
Wie vorstehend zusammengefaßt wurde, schaffen die Ausführungsbeispiele der Erfindung ein System und ein Verfahren zur Erzielung einer verbesserten Wahrnehmung von 3D-Applikationen wie beispielsweise Software durch den Benutzer.
-
Individualisierung des SGL
-
Die Gestattung der Individualisierung der internen Regeln des SGL zum Rendern von Sounds ermöglicht eine viel größere Flexibilität bei der gesamten Benutzerwahrnehmung. Beispielsweise könnte der Benutzer verändern, wie viel leiser weiter entfernte Sounds abzuspielen sind.
-
Typischer Weise wird eine Softwareapplikation wie ein Spiel eine Positionsinformation eines 3D-Sounds an den SGL senden, und es dem SGL erlauben, zu bestimmen, wie der physikalische Sound selbst erzeugt wird. Verschiedene SGLs behandeln diese Information standardmäßig unterschiedlich. Eine unterschiedliche Kombination aus API, Sound-Treiber, und Sound-Hardware kann wett von der Zuhörerposition entfernte Sounds mit völlig verschiedenen Lautstärken abspielen.
-
Wenn beispielsweise bei einer Creative®-Soundcard, auf welcher sowohl DirectSound3D®- und OpenAL-APIs implementiert sind, der SGL mit der DirectSound3D®-API verwendet wird, werden weit entfernte Sounds im Vergleich zur OpenAL-SGL-Implementation leiser oder manchmal überhaupt nicht abgespielt. In diesem Beispiel trifft tatsächlich der DirectSound3D®-SGL die Entscheidung, Sounds abzuschalten, für die willkürlich entschieden wurde, daß sie zu weit entfernt sind, um vom Zuhörer gehört zu werden, entsprechend einem maximal hörbaren Bereich. Der Grund hierfür kann in einer Reduzierung der Anzahl der gleichzeitig abzuspielenden Sounds liegen (aus Gründen der Reduzierung der Last auf die Sound-Hardware oder sonstigen Performance-Gründen), oder im Ziel der Realitätsnähe. In jedem Fall ist diese Grenze willkürlich im Voraus festgelegt und derzeit nicht einstellbar.
-
Eine im Sound-Treiber oder dem Hardware-Level des SGL vorgenommene Änderung erlaubt es dem Benutzer, zu entscheiden, bei welcher Entfernung der maximal hörbare Bereich für verschiedene Lautstärken sein sollte. Wenn die Software-Applikation 3D-Sound-Daten sendet, kann der Benutzer daher einstellen, ob dieser Sound tatsächlich abgespielt wird, und ferner den Umfang des Lautstärkeabfalls basierend auf dieser Entfernung einstellen. Die spezifischen Algorithmen zur Berechnung dieses Abfalls werden basierend auf der Eingabe des Benutzers eingestellt, so daß die verwendeten Werte von den individuellen Vorlieben des Benutzers abhängen, und diese Algorithmen dem Laien-Benutzer nicht offengelegt werden müssen. Dies ist besonders für spielkritische Sounds nützlich, die üblicherweise ziemlich leise sind, wie weit entfernte Schritte oder gedämpfte Gewehrschüsse. Diese Änderung erlaubt es folglich einem Benutzer, anzugeben, daß dann, wenn ein Spiel (durch Liefern von 3D-Daten an das API) vorgibt, daß ein Sound vorhanden sein soll, der Benutzer auf dem Abspielen desselben durch die SGL bestehen kann. In Verbindung mit einem GUI (wie den in 4) beschriebenen, aber nicht notwendigerweise einem solchen) verschafft dies einem Laien-Benutzer eine größere Flexibilität darin, wie er oder sie 3D-Audio-Cues empfängt, und kann einen Wettkampf-Vorteil bieten, bei dem er oder sie im Vergleich zu Gegnern mit nicht einstellbaren Sound-Lösungen mit willkürlich klein gesetzten Sound-Bereichen, in der Lage ist, Sounds aus einem größeren Bereich zu hören; die Einstellbarkeit bietet zusätzlich den Vorteil der Einstellung eines optimalen Bereiches, denn das gleichzeitige Abspielen zu vieler Sounds kann infolge der CPU-Auslastung einen nachteiligen Effekt auf die Performance der Software-Applikation haben. Dieses Verfahren kann mit jedem der hier beschriebenen anderen Verfahren kombiniert werden.
-
Verstärkung von leisen Sounds
-
Der SGL kann auch modifiziert werden, um die Verstärkung von Sounds zu erlauben, die unter einen voreingestellten oder vom Benutzer eingestellten Lautstärkepegel fallen, während Sounds über diesem Pegel unverändert gelassen werden. Dies ist analog zu einem als Normalisierung bekannten Verfahren, das in DVD-Playern verwendet wird und bei welchem leisere Sounds, wie ein Dialog, verstärkt werden, so daß sie hörbar sind, ohne daß der Hörer die Lautstärke auf einen Punkt verändern muß, bei welchem laute Sounds wie eine Explosion zu laut werden (oder die Nachbarn stören).
-
Der erfinderische Schritt besteht hier darin, daß dem Benutzer erlaubt wird, den Umfang der anzuwendenden Verstärkung einzustellen, und an welchem Punkt diese Verstärkung vorgenommen werden sollte. Jeder Sound und alle Sounds, die unter einen voreingestellten oder vom Benutzer eingestellten Lautstärkepegel fallen, werden auf eine andere voreingestellte oder vom Benutzer eingestellte Lautstärke verstärkt (z. B. werden alle Sounds, die unter –90 dB fallen, auf –85 dB verstärkt).
-
Umgebungsgeräusche (wie wehender Wind, Sound-Tracks in Spielen), die typischerweise nicht als 3D-Sounds gehandhabt werden, könnten von dieser selektiven Verstärkung selektiv ausgeschlossen werden (weil diese Sounds keine 3D-Daten enthalten und als traditionelle Soundquellen angesehen werden), wobei der Vorteil hiervon darin besteht, daß Umgebungsgeräusche häufig keine kritische Information enthalten und störend sein könnten, wenn sie verstärkt werden würden (das heißt, die 3D-Schrittgeräusche werden verstärkt, aber das Umgebungsgeräusch des wehenden Windes wird ganz leise gehalten). Dieses Verfahren kann mit jedem der hier beschriebenen anderen Verfahren kombiniert werden.
-
Verstärkung von selektierten Sounds
-
Der SGL kann auch so modifiziert werden, daß er bestimmte Sounds (die tatsächlich Software-Dateien sind) identifizieren kann und es dem Benutzer erlaubt, diese Sounds selektiv zu verstärken, entweder in einem Ausmaß (zum Beispiel Verstärken aller ”Gewehrschuß.wav”-Sounds um das 1,5-fache), oder mit einer gesetzten minimalen Lautstärke wie in 2 beschrieben (zum Beispiel Verstärken aller ”Gewehrschuß.wav”-Sounds auf –85 dB, wenn sie unter –90 dB fallen). Allgemeiner wird der SGL so modifiziert, daß die vorstehend beschriebenen Regeln auf bestimmte Frequenzen oder Frequenzbereiche angewandt werden, wobei der Effekt ähnlich ist, aber eine geringere Granularität aufweist. Der Vorteil hiervon besteht darin, daß, wenn die Software-Applikation entschieden hat, daß ein bestimmter Sound (zum Beispiel ein gedämpfter Pistolenschuß) sehr leise sein sollte, ein Benutzer entscheiden kann, diesen Sound mit viel höherer Lautstärke abzuspielen, was ihm oder ihr in einer Wettkampfsituation einen signifikanten Vorteil gegenüber einem Gegner verschaffen kann.
-
Der erfinderische Schritt besteht sowohl in der Einstellbarkeit durch den Benutzer als auch in der selektiven Verstärkung von spezifischen Sounds (obgleich dies für eine selektive Frequenzverstärkung nicht zutreffend sein muß).
-
Wie bei 2 können wiederum Umgebungsgeräusche selektiv von diesem Verfahren ausgeschlossen werden. Dieses Verfahren kann mit jedem der hier beschriebenen anderen Verfahren kombiniert werden.
-
Graphische Benutzerschnittstelle
-
In einem bevorzugten Ausführungsbeispiel wird das Vorhergehende über eine graphische Benutzerschnittstelle auf Sound-Treiber-Level des SGL eingestellt. Existierende Soundkarten-Treiber haben graphische Benutzerschnittstellen, die graphisch die Lautsprecherpositionen in Bezug zum Hörer darstellen, um die Lautsprecher oder die Positionierung der Lautsprecher zu testen (beispielsweise um zu simulieren, daß ein Lautsprecher näher, weiter entfernt oder in einem unterschiedlichen Winkel von der Hörerposition befindet, wenn es infolge von physikalischen Beschränkungen nicht möglich oder umständlich ist, die tatsächlichen physikalischen Lautsprecherpositionen selbst einzustellen). Diese Implementierung unterscheidet sich von jenen GUIs darin, daß sie, neben anderen Verbesserungen, eine Steuerung des Bereiches in der virtuellen Umgebung enthält, in welchem durch den SGL 3D-Sounds generiert werden. Zusätzlich kann es soundspezifische Auswahlen erlauben.
-
In einem Ausführungsbeispiel enthält die GUI eine radarähnliche Schnittstelle. Der Hörer wird graphisch im Zentrum eines Ringes dargestellt, der entweder durch Ziehen an ihm mit eine Eingabevorrichtung wie einer Maus, mittels eines separaten graphischen Schiebers, durch Eingabe von höheren oder niedrigeren Zahlen, oder andere ähnliche Verfahren wie in 4b graphisch gedehnt oder gestaucht werden kann. Der Ring kann mehrere Dinge repräsentieren:
- i. die Entfernung, bei welcher das willkürliche Abschneiden von leisen Sounds wie in 1 beschrieben stattfindet: Durch Dehnen und Stauchen des Ringes weist der Zuhörer den SGL an, diese Entfernung weiter weg von oder näher an der relativen Position des Zuhörers zu setzen. Dies zeigt graphisch, daß der Hörbereich des Benutzers vergrößert oder verkleinert wird.
- ii. die Lautstärke, bei welcher leise Sounds wie vorstehend beschrieben verstärkt werden sollten: Durch Dehnen und Stauchen des Ringes erhöht oder verringert der Benutzer den Pegel, auf welche Sounds, die unter einen bestimmten Pegel fallen, verstärkt werden. Dies vermittelt auch graphisch, daß der Hörbereich des Benutzers erhöht oder verringert ist.
- iii. Sowohl i und ii als auch alle anderen ähnlichen Implementierungen sind vorhanden, um die Vorstellung der Vergrößerung oder Verkleinerung des Hörbereiches des Benutzers auszudrücken, ähnlich wie derzeitige Video-Treiber es dem Benutzer erlauben, die Entfernung zu spezifizieren, bei welcher Objekte in einer 3D-Umgebung gesehen werden können (ein kleinerer Bereich verbessert die Performance, weil weniger Objekte zu zeichnen sind, ein größerer Bereich verbessert den Umfang dessen, was der Benutzer sehen kann).
-
In einem weiteren Ausführungsbeispiel enthält das GUI eine Zähler-Schnittstelle. In diesem Ausführungsbeispiel enthält das GUI eine Box, in welcher die Entfernung in virtuellen Einheiten von Zahlen (oder ohne Einheiten) beschrieben werden kann anstatt mit einem Ring-Schieber; zum Beispiel die Anzahl von Füßen, die ein Zuhörer hören kann, mit einer ähnlichen Implementierung wie bei (i) oder (ii) oben. Dieser Zähler kann über einen Schieber eingestellt werden, oder durch Eintippen durch den Benutzer, oder irgend ein anderes ähnliches Eingabeverfahren. Es kann beispielsweise mit dem oben beschriebenen Verfahren kombiniert werden, so daß die Zahlen im Zähler nach oben gehen, wenn der Ring größer gemacht wird, und umgekehrt. Dies erlaubt es dem Benutzer, die Zahlen mit dem Hörbereich/der Hörentfernung gedanklich zu korrelieren.
-
Obgleich die vorliegende Erfindung unter Bezugnahme auf ein oder mehrere Ausführungsbeispiele beschrieben wurde, werden Fachleute erkennen, daß hieran viele Änderungen vorgenommen werden können, ohne das Wesen und den Umfang der vorliegenden Erfindung zu verändern. Beispielsweise wurden viele der Vorteile der Erfindung im Zusammenhang mit Spielen erörtert. Andere Anwendungen der Erfindung sind leicht ersichtlich, beispielsweise Simulationen, Filme und andere audiovisuelle Unterhaltungsmedien, Musik und anderes Audio, und dergleichen.