-
Die
Erfindung betrifft ein Verfahren und eine Vorrichtung zur Erzeugung eines
mehrstimmigen Audiosignals aus zumindest einem ersten und zweiten
Audiosignal, bei dem das erste Audiosignal zumindest einen Grundton
mit einer ersten Frequenz und das zweite Audiosignal zumindest einen
Grundton mit einer zweiten Frequenz aufweist.
-
In
der Tontechnik werden häufig
einzelne Audiosignale, beispielsweise eine Gesangsstimme oder ein
durch ein Instrument erzeugtes Tonsignal vervielfältigt, um
ein mehrstimmiges Audiosignal zu bilden, welches klangintensiver
als ein einstimmiges Audiosignal ist. Insbesondere kann hierdurch
beispielsweise einer dünn
klingenden Gesangsstimme ein voluminöser Klang zugeordnet werden. Üblicherweise werden
hierzu zumindest zwei nahezu identische einstimmige Audiosignale
erzeugt, welche sich in ihrer Frequenz bzw. Tonhöhe und ggf. im Tonrhythmus unterscheiden.
Der unterschiedliche Tonryhtmus ergibt sich beispielsweise dadurch,
dass ein Sänger üblicherweise
nicht in der Lage ist, ein exakt identisches Tonsignal zu erzeugen.
-
Zur
Erzeugung eines mehrstimmigen Audiosignals, insbesondere zur Vervielfältigung
von Singstimmen sind diverse Verfahren bekannt. Beispielsweise wird
eine Gesangsstimme mehrmals gesungen und somit mehrere einstimmige
Audiosignale erzeugt, welche in einem Tonstudio auf unterschiedlichen
Spuren einer Tonbandmaschine aufgezeichnet werden. Zur Erzeugung
eines mehrstimmigen Audiosignals werden die unterschiedlichen einstimmigen Audiosignale
gleichzeitig abgespielt und somit ein so genannter „wall of
sound" erzeugt.
Nachteilig ist gemäß diesem
Verfahren eine Erzeugung eines mehrstimmigen Audiosignals in Echtzeit
allerdings nicht möglich,
d. h. für
einen Live-Auftritt
auf einer Bühne nicht
einsetzbar.
-
Ferner
sind Echo- bzw. Delay-Verfahren bekannt, mit deren Hilfe ein Audiosignal,
beispielsweise eine Gesangsstimme zeitlich versetzt ein- oder mehrmals
wiedergegeben wird. Das Verfahren ist mittels technisch einfacher
und somit kostengünstiger
Geräte
(„Band-Echo", „Analog-Delay", „Digital-Delay") realisierbar. Nachteilig
wird jedoch durch das menschliche Gehör wahrgenommen, dass es sich
hierbei lediglich um eine reine Wiederholung des identischen Audiosignal,
d. h. eines Echos handelt.
-
Auch
sind so genannte Chorus-Verfahren bekannt, welche eine Weiterentwicklung
des Echo- bzw. Delay-Verfahrens darstellen. Hierbei wird die statische
Verzögerungsdauer
des Echo- bzw. Delay-Verfahrens mit Hilfe eines Niederfrequenzoszillators
(„low
frequency oszillator” =
LFO) moduliert, so dass zum einen die Verzögerung unterschiedlich klingt,
zum anderen durch die Modulation der Verzögerungsdauer eine leichte tonale
Verstimmung der Audiosignale erzeugt wird. Auch dieses Verfahren
ist seit längerem
bekannt, kann jedoch ein reales zweites Audiosignal keinesfalls
ersetzen, zumal das vom ersten Audiosignal abgeleitete Echo-Audiosignal dem
ursprünglichen
Audiosignal zu ähnlich
ist und weiterhin die Modulation der Verzögerungszeit in Form eines Schwebens
oder Drehens im erzeugten mehrstimmigen Audiosignal erkennbar ist.
-
Auch
werden in der Tontechnik so genannte „Harmonizer" bzw. „Pitchshifter" verwendet, die zur elektronischen
Transposition eines Audiosignals auf eine vorgegebene Tonhöhe vorgesehen
sind, wobei die Verschiebung der Tonhöhe durch ein statisches Frequenzintervall
vorgegeben ist. Unter Transposition wird in der Musik das proportionale
Verschieben der Tonhöhe
eines Tons oder einer zusammenhängenden
Tonfolge um ein bestimmtes, während
des Transponierens gleichbleibendes Intervall verstanden. Die Signalqualität des vom
ursprünglichen
Audiosignal abgeleiteten bzw. transponierten Audiosignal wird zusätzlich mittels
Verstimmungsalgorithmen verbessert. Nachteilig wird jedoch durch
das menschliche Gehör
ein derartig transponiertes Signal als keine weitere unabhängige Gesangsstimme
wahrgenommen.
-
Ferner
sind Audioverarbeitungsgeräte,
so genannte „Vocalisten" bekannt, welche
in der Lage sind, aus einer Gesangstimme einen mehrstimmigen Akkord
zu erzeugen, in dem diese auf verschiedene Töne eines Akkords transponiert
werden. Welcher Akkord erzeugt werden soll, wird entweder direkt
mittels des Vocalisten oder über
eine Midi-Schnittstelleneinheit
vorgegeben. Auf diese Weise ist es möglich, aus einem monophonen
Audiosignal ein polyphones Audiosignal zu erzeugen. Derartige Vocalisten
finden insbesondere in Karaoke-Maschinen Anwendung.
-
Ebenso
sind Auto-Tune-Geräte
bekannt, welche in erster Linie dazu verwendet werden, Audiosignale,
die nicht fehlerhafte Tonhöhen
aufweisen, zu korrigieren, und zwar durch Verschieben der einzelnen
Töne auf
die korrekte Tonhöhe.
Hierbei wird laufend überprüft, ob beispielsweise
ein mittels des Auto-Tune-Gerätes
ein elektronisch erfasster, gesungener Ton mit einem Ton einer vorher
festgelegten Tonleiter übereinstimmt.
Ist dies nicht der Fall, so wird das fehlerbehaftete Audiosignal
entsprechend den statischen Vorgaben der gespeicherten Tonleiter
korrigiert.
-
Darüber hinaus
finden „Voicedoubler" Verwendung, welche
die Tonhöhe
eines Audiosignals derart manipulieren, dass diese beispielsweise
um eine Oktave nach oben oder unten transponiert wird und/oder das
Ansingverhalten und Klangfarbe des ursprünglichen Audiosignals verändert wird.
Durch Kombination des ursprünglichen
Audiosignals und des transponierten Audiosignals entsteht der Eindruck
einer Stimmenverdoppelung.
-
Ausgehend
vom dargelegten Stand der Technik liegt der vorliegenden Erfindung
die Aufgabe zugrunde, ein Verfahren und eine zugehörige Vorrichtung
zur Erzeugung eines mehrstimmigen Audiosignals aus zumindest einem
ersten und zweiten einstimmigen Audiosignal anzugeben, mittels dem
ein naturgetreues mehrstimmiges Audiosignal erzeugt wird. Die Aufgabe
wird ausgehend von den Merkmalen des Oberbegriffes der Patentansprüche 1 und
5 durch dessen jeweils kennzeichnende Merkmale gelöst.
-
Der
wesentliche Aspekt des erfindungsgemäßen Verfahrens ist darin zu
sehen, dass jeweils die erste und zweite Frequenz zumindest der
jeweiligen Grundtöne
des ersten und zweiten einstimmigen Audiosignals kontinuierlich
oder periodisch ermittelt werden und abhängig von der jeweils kontinuierlich oder
periodisch ermittelten ersten und zweiten Frequenz der aktuell vorliegende
Frequenzabstand zwischen dem ersten und zweiten Audiosignal kontinuierlich
oder periodisch bestimmt wird. Anschließend wird durch elektronische
Transponierung des ersten Audiosignals um den jeweils kontinuierlich
oder periodisch ermittelten Frequenzabstand zumindest ein erstes
transponiertes Audiosignal erzeugt wird und zumindest das erste
und zweite Audiosignal und das zumindest erste transponierte Audiosignal
werden zur Erzeugung eines mehrstimmigen Audiosignals elektronisch
miteinander vermischt. Besonders vorteilhaft wird durch das erfindungsgemäße Verfahrens somit
abhängig
von zwei dynamisch erzeugten Audiosignalen, beispielsweise zwei
sich zeitlich verändernde
Gesangsstimmen, zumindest eine weitere Gesangsstimme elektronisch
erzeugt, in dem die erste Gesangsstimme auf die Tonhöhe jeweils
aktuell vorliegende Tonhöhe
der zweiten Gesangsstimme transponiert wird. Somit wird eine dynamische
Transponierung durchgeführt,
und zwar kontinuierlich oder periodisch. Im Gegensatz zum Stand
der Technik werden zumindest zwei zeitgleich erzeugte Audiosignalen
in Echtzeit digital ausgewertet und weiterverarbeitet, dass zu zumindest
einem Audiosignal ein zugehöriges,
die aktuelle Tonhöhe
des weiteren Audiosignals aufweisendes Audiosignals erzeugt wird.
Somit können
aus einem ursprünglich
zweistimmigen Audiosignal ein vierstimmiges Audiosignal oder aus vier
Audiosignalen ein bis zu sechzehnstimmiges Audiosignal gebildet
werden.
-
Weitere
vorteilhafte Ausgestaltungen der Erfindung, insbesondere ein Vorrichtung
zur Erzeugung eines mehrstimmigen Audiosignals sind den weiteren Ansprüchen zu
entnehmen.
-
Im
Folgenden wird die Erfindung an einem Ausführungsbeispiel anhand einer
Figur näher
erläutert.
-
Die
Figur zeigt beispielhaft ein schematisches Blockschaltbild einer
Vorrichtung zur Erzeugung eines mehrstimmigen Audiosignals AM. Beispielhaft
wird in die Figur die Anwendung des erfindungsgemäßen Verfahrens
zur Erzeugung eines mehrstimmigen Audiosignals MAS aus einem ersten bis
vierten einstimmigen Audiosignal AS1 bis AS4, wobei das mehrstimmigen
Audiosignals MAS als Stereo-Ausgangssignal ausgebildet ist. Die
ersten bis vierten einstimmigen Audiosignal AS1 bis AS4 können beispielsweise
durch die mittels eines Mikrophons aufgezeichnete Gesangsstimme
eines Sängers
oder eines Instruments oder ein mittels einem elektronischen Musikinstrument,
beispielsweise einem Keyboard oder einer E-Gitarre erzeugtes elektronisches
Tonsignal gebildet sein.
-
Die
Vorrichtung AM weist beispielhaft eine Eingangsstufe IS, eine Verarbeitungseinheit
PS und eine Ausgangsstufe ES auf, welche seriell zueinander angeordnet
sind.
-
Die
Eingangsstufe IS umfasst im vorliegenden Ausführungsbeispiel eine erste bis
vierte Kanaleingangstufe I1 bis I4, über welche das erste bis vierte
einstimmige Audiosignal AS1 bis AS4 der Vorrichtung AM zugeführt wird.
Die erste bis vierte Kanaleingangstufe I1 bis I4 können beispielsweise
zur Aufnahme von analogen Mikrofon- oder Linesignalen oder digitale
Audiosignalen ausgebildet sein, wobei bei Vorliegen von analogen
Audiosignalen AS1 bis AS4 diese vorzugsweise in der jeweiligen Kanaleingangstufe
I1 bis I4 mittels geeigneter Digitalisierungsmittel in ein digitales
Signal gewandelt werden. Somit liegen an den Ausgängen der
ersten bis vierten Kanaleingangstufe I1 bis I4 jeweils digitale
erste bis vierte einstimmige Audiosignale AS1 bis AS4 vor.
-
In
der Verarbeitungseinheit PS ist beispielsweise jeder der ersten
bis vierten Kanaleingangstufe I1 bis I4 eine erste bis vierte Frequenzmesseinheit FC1
bis FC4 zugeordnet, über
welche zumindest die jeweilige Frequenz F1 bis F4 des aktuellen
Grundtones des ersten bis vierten einstimmigen Audiosignals AS1
bis AS4 ermittelt wird, und zwar dynamisch, d. h. kontinuierlich
oder periodisch. Die erste Frequenzmesseinheit FC1 ist mit dem Ausgang
der ersten Kanaleingangstufe I1, die zweite Frequenzmesseinheit FC2
mit dem Ausgang der zweiten Kanaleingangstufe I2, die dritte Frequenzmesseinheit
FC3 mit dem Ausgang der dritten Kanaleingangstufe I3 und die vierte
Frequenzmesseinheit FC4 mit dem Ausgang der vierten Kanaleingangstufe
I4.
-
Somit
liegen zu vorgegebenen Zeitpunkten sich zeitlich ändernde
Frequenzinformationen in Form der ersten bis vierten Frequenz F1
bis F4 des Grundtones bzgl. des ersten bis vierten einstimmigen Audiosignals
AS1 bis AS4 vor, welche erfindungsgemäß weiterverarbeitet werden.
Ist durch die jeweilige Frequenzmesseinheit FC1 bis FC4 kein aktueller Grundton
ermittelbar, d. h. liegt kein oder ein ungeeignetes Audiosignal
AS1 bis AS4 vor, wird durch die jeweilige Frequenzmesseinheit FC1
bis FC4 anstelle der jeweiligen Frequenz F1 bis F4 des aktuellen Grundtones
ein Fehlercode erzeugt. Der Fehlercode zeigt beispielsweise an,
dass das jeweilige Audiosignal AS1 bis AS4 keinen Grundton aufweist,
beispielsweise aus Zisch- oder Explosivlauten besteht. Ferner sind
jeder der ersten bis vierten Kanaleingangstufe I1 bis I4 jeweils
drei Transponiereinheiten T11–T13, T21–T23, T31–T33, T41–T43 zugeordnet,
mittels denen jeweils das zugehörige
erste bis vierte einstimmige Audiosignal AS1–AS4 in eine andere Tonhöhe verschoben
bzw. transponiert wird, und zwar abhängig von dem jeweils aktuell
ermittelten Frequenzabstand FA zwischen jeweils zwei der ersten
bis vierten Audiosignale AS1–AS4,
d. h. beispielsweise wird das erste Audiosignal AS1 auf die jeweils
ermittelte Tonhöhe
des zweiten bis vierten Audiosignals AS1–AS4 verschoben, und zwar durch
Auswertung des aktuell ermittelten Frequenzabstandes FA zwischen
den beiden Audiosignalen AS1 bis AS4. Somit sind in der Verarbeitungseinheit
PS insgesamt eine erste bis zwölfe
Transponiereinheit T11–T13,
T21–T23, T31–T33, T41–T43 vorgesehen.
-
Das
erste bis vierte Audiosignal AS1 bis AS4 werden somit mittels den
jeweils zugeordneten drei Transponiereinheiten T11–T13, T21–T23, T31–T33, T41–T43 kanalweise
weiterverarbeitet. Hierzu werden den jeweiligen Transponiereinheit
T11–T13, T21–T23, T31–T33, T41–T43 die
erforderlichen Frequenzinformationen der jeweiligen Frequenzmesseinheit
FC1 bis FC4 und jeweils das zu transponierende erste bis vierte
einstimmige Audiosignal AS1–AS4
zugeführt.
-
Gemäß dem vorliegenden
Ausführungsbeispiel
werden der ersten Transponiereinheit T11 die erste und zweite Frequenz
F1, F2 des ersten bzw. zweiten Audiosignals AS1, AS2, der zweiten
Transponiereinheit T12 die erste und dritte Frequenz F1, F3 des
ersten bzw. dritten Audiosignals AS1, AS3 und der dritten Transponiereinheit
T13 die ersten und vierte Frequenz F1, F4 des ersten bzw. vierten
Audiosignals AS1, AS4 zugeführt.
Analog hierzu wird an die vierte Transponiereinheit T21 die erste
und zweite Frequenz F1, F2 des ersten bzw. zweiten Audiosignals
AS1, AS2, an die fünfte
Transponiereinheit T22 die zweite und dritte Frequenz F2, F3 des
zweiten bzw. dritten Audiosignals AS2, AS3 und an die sechste Transponiereinheit
T23 die zweite und vierte Frequenz F2, F4 des zweiten bzw. vierten
Audiosignals AS2, AS4 übertragen.
Ferner wird der siebten Transponiereinheit T31 die erste und dritte
Frequenz F1, F3 des ersten bzw. dritten Audiosignals AS1, AS3, der
achten Transponiereinheit T32 die zweite und dritte Frequenz F2,
F3 des zweiten bzw. dritten Audiosignals AS2, AS3 und der neunten
Transponiereinheit T33 die dritte und vierte Frequenz F3, F4 des dritten
bzw. vierten Audiosignals AS3, AS4 zur Verfügung gestellt. Ebenso wird
an die zehnte Transponiereinheit T41 die erste und vierte Frequenz
F1, F4 des ersten bzw. vierten Audiosignals AS1, AS4, an die elfte
Transponiereinheit T42 die zweite und vierte Frequenz F2, F4 des
zweiten bzw. vierten Audiosignals AS2, AS4 und an die zwölfte Transponiereinheit T43
die dritte und vierte Frequenz F3, F4 des dritten bzw. vierten Audiosignals
AS3, AS4 übertragen.
-
Nach
Vorliegen der genannten Frequenzinformationen wird zusätzlich zum
ersten Audiosignal AS1 ein erstes bis drittes transponiertes erstes
Audiosignal AS1_2, AS1_3, AS1_4 erzeugt, welches von der zugeordneten
ersten bis dritten Transponiereinheit T11–T13 abgegeben wird. Hierzu
wird abhängig von
der jeweils ermittelten ersten und zweiten Frequenz F1, F2 der aktuell
vorliegende Frequenzabstand FA zwischen dem ersten und zweiten Audiosignal
AS1, AS2 kontinuierlich oder periodisch bestimmt und das ersten
Audiosignal AS1 um den jeweils ermittelten Frequenzabstand FA zur
Erzeugung des ersten transponierten Audiosignals AS1_2 verschoben.
Analog hierzu wird aus dem zweiten Audiosignal AS2 ein erstes bis
drittes transponiertes zweites Audiosignal AS2_1, AS2_3, AS2_4,
aus dem dritten Audiosignal AS3 ein erstes bis drittes transponiertes
drittes Audiosignal AS3_1, AS3_2, AS3_4 und aus dem vierten Audiosignal
AS4 ein erstes bis drittes transponiertes viertes Audiosignal AS4_1, AS4_2,
AS4_3 gebildet. Für
den Fall, dass anstelle einer Frequenz ein Fehlercode in zumindest
einer der ersten bis zwölfen
Transponiereinheiten T11–T13, T21–T23, T31–T33, T41–T43 vorliegt,
so wird entweder kein zusätzliches
transponiertes Audiosignal AS1_2, AS1_3, AS1_4, AS2_1, AS2_3, AS2_4, AS3_1,
AS3_2, AS3_4, AS4_1, AS4_2, AS4_3 erzeugt oder das Audiosignal AS1
bis AS4 in Originaltonhöhe
ausgegeben.
-
In
einer bevorzugten Ausführungsform
ist in der Verarbeitungseinheit PS jeder der ersten bis zwölfen Transponiereinheiten
T11–T13,
T21–T23, T31–T33, T41–T43 eine
Regeleinheit V nachgeschaltet, mittels der aus den erzeugten transponierten Audiosignalen
AS1_2, AS1_3, AS1_4, AS2_1, AS2_3, AS2_4, AS3_1, AS3_2, AS3_4, AS4_1, AS4_2,
AS4_3 und ggf. den ersten bis vierten Audiosignalen AS1 – AS4 Stereosignale
gebildet werden. Auch ist über
diese signalindividuell die Lautstärke und/oder das Panorama des
jeweils anliegenden Signals nahezu beliebig einstellbar.
-
Die
derart erzeugten sechzehn Stereosignale werden anschließen in der
Ausgangsstufe ES zu einem mehrstimmigen Audiosignal MAS zusammengefasst
und als digitales Ausgangssignal ausgegeben. Zusätzlich kann das digitale mehrstimmigen
Audiosignal MAS mittels eines in der Ausgangsstufe ES vorgesehen
Digital-Analog-Wandlers in ein analoges mehrstimmigen Audiosignal
gewandelt und ausgegeben werden. Somit liegt am Ausgang der Vorrichtung AM
ein bis zu sechzehnstimmiges Audiosignal MAS vor. So wird beispielsweise
aus einem vierstimmigen Chor ein sechzehnstimmiger Chor, d. h. ein
Chor mit sechzehn Sängern.
-
Natürlich können zusätzlich weitere
transponierte Audiosignale erzeugt werden, indem diese in verschiedene,
weitere Stimmlagen transponiert werden. In einer Ausführungsvariante
werden die transponierten Audiosignale AS1_2, AS1_3, AS1_4, AS2_1,
AS2_3, AS2_4, AS3_1, AS3_2, AS3_4, AS4_1, AS4_2, AS4_3 hierzu um
ein zusätzliches Frequenzintervall,
beispielsweise eine Terz, Sext oder Octave verschoben. Singt nun
beispielsweise ein Sänger
A den Kammerton A (440 Hz), so können der
Sänger
B, C und D zusätzlich
zur Frequenz 440 Hz, auch mit 220 Hz und/oder 880 Hz, d. h. eine
Oktave tiefer oder höher
wiedergegeben werden. Falls die Grundtöne zweier Stimmen so weit auseinander liegen,
dass das klangliche Ergebnis einer entsprechend weiten Transponierung
unnatürlich
klingt, dann kann die Transponierung um das entsprechende Intervall
auch durch eine weitere Transponierung um ein vom ursprünglich ermittelten
Intervall abgeleitetes Intervall ersetzen. Ein auf diese Weise erzeugtes
Signal klingt natürlicher,
da die unvermeidbaren Verfälschungen
durch Transponierung umso auffälliger
werden, je größer das
Intervall ist, um welches transponiert wird. Beispielsweise klingt
eine Transponierung um eine Sext nach oben nicht so natürlich wie
eine Transponierung um eine Terz nach unten. Es entsteht dabei jeweils
der gleiche Ton, jedoch liegt dieser in der zweiten Variante (Terz
tiefer) eine Oktave tiefer als der in der ersten Variante (Sext
darüber).
-
- AM
- Vorrichtung
- IS
- Eingangsstufe
- PS
- Verarbeitungsstufe
- ES
- Ausgangsstufe
- AS1–AS4
- erstes
bis viertes einstimmiges Audiosignal
- MAS
- mehrstimmiges
Ausgangssignal
- FC1–FC4
- erste
bis vierte Frequenzmesseinheit
- T11–T43
- erste
bis zwölfte
Transponiereinheit
- V
- Regeleinheit
- F1–F4
- erstes
bis vierte Frequenz
- FA
- Frequenzabstand
- AS1_2–AS1_4
- erstes
bis drittes transponiertes erstes Audiosignal
- AS2_1–AS2_4
- erstes
bis drittes transponiertes zweites Audiosignal
- AS3_1–AS1_4
- erstes
bis drittes transponiertes drittes Audiosignal
- AS4_1–AS4_3
- erstes
bis drittes transponiertes viertes Audiosignal