-
Hintergrund der Erfindung
-
Gebiet der Erfindung
-
Die
vorliegende Erfindung betrifft eine Vorrichtung zur Bestimmung von
Akkordnamen und ein Programm zur Bestimmung von Akkordnamen.
-
Diskussion des Hintergrunds
-
Eine
Vorrichtung zur Bestimmung von Akkordnamen zur Bestimmung eines
Akkordnamens aus einem musikalischen akustischen Signal (Audiosignal),
in welchem die Klänge
von einer Vielzahl von Musikinstrumenten gemischt sind, wie zum
Beispiel die Audiosignale einer Musik Compact Disc (CD), ist entwickelt
worden.
-
In
dieser Vorrichtung wird eine Bassnote verwendet, um festzustellen,
ob mehrere Akkorde in einem Takt verwendet werden. Genauer gesagt
wird jeder Takt in eine erste Hälfte
und eine zweite Hälfte
unterteilt; eine Bassnote wird in jeder Hälfte bestimmt; und wenn verschiedene
Bassnoten in der ersten Hälfte
und in der zweiten Hälfte
bestimmt werden, wird auch der Akkord sowohl in der ersten Hälfte als
auch in der zweiten Hälfte
bestimmt.
-
Allerdings
führt diese
Methode dazu, dass, wenn verschiedene Akkorde verwendet werden,
aber eine identische Bassnote bestimmt wird, zum Beispiel wenn der
C-Dur Akkord in der ersten Hälfte
des Taktes verwendet wird und der C-moll Akkord in der zweiten Hälfte des
Taktes verwendet wird, weil die Bassnote gleich ist, der Takt nicht
unterteilt wird und der C-Dur Akkord im gesamten Takt bestimmt wird.
-
Außerdem wird
in der oben beschriebenen Vorrichtung die Bassnote in der gesamten
Detektionszone bestimmt. Mit anderen Worten, wenn die Detektionszone
ein Takt ist, wird eine stabile Note im gesamten Takt als Bassnote
bestimmt. Für
Jazz Musik jedoch, bei der sich die Bassnote häufig ändert (die Bassnote ändert sich
in Einheiten von Viertelnoten oder ähnlich), kann die Bassnote
mit dieser Methode nicht korrekt bestimmt werden.
-
Zusammenfassung der Erfindung
-
Die
vorliegende Erfindung wurde gemacht, um die oben genannten Probleme
zu lösen.
Dementsprechend ist es ein Ziel der vorliegenden Erfindung, eine
Vorrichtung zur Bestimmung von Akkordnamen und ein Programm zur
Bestimmung von Akkordnamen bereit zu stellen, die in der Lage sind,
korrekte Akkordnamen zu bestimmen, auch wenn sich der Akkord in
einem Takt ändert,
während
eine identische Bassnote beibehalten wird.
-
Um
das genannte Ziel zu erreichen, stellt die vorliegende Erfindung
als ihren ersten Aspekt eine Vorrichtung zur Bestimmung von Akkordnamen
bereit. Die Vorrichtung zur Bestimmung von Akkordnamen umfasst Eingabemittel
zum Empfang eines akustischen Signals; erste Tonleiter-Noten-Intensität Bestimmungsmittel
zur Anwendung einer schnellen Fourier Transformation (fast Fourier
transformation; FFT) auf das empfangene akustische Signal in vorbestimmten
Rahmenintervallen durch die Verwendung von Parameter, die auf die
Bestimmung des Beats (Taktschlags) angepasst sind, und zum Erhalt
der Intensität
jeder Note einer Tonleiter in jedem Rahmenintervall aus dem erhaltenen
Intensitätsspektrum;
Beatbestimmungsmittel zur Aufsummierung eines inkrementellen Wertes
der Intensität
jeder Note der Tonleiter in den vorbestimmten Rahmenintervallen
für alle
Noten der Tonleiter, um die Summe der inkrementellen Werte der Intensitäten zu erhalten,
die das Ausmaß der Änderung
aller Noten in jedem Rahmenintervall anzeigt, und zur Bestimmung
eines durchschnittlichen Beat Intervalls und der Position jedes
Beats aus der Summe der inkrementellen Werte der Intensitäten; Mittel
zur Bestimmung des Takts zur Berechnung der durchschnittlichen Intensität jeder
Note der Tonleiter für
jeden Beat, zum Aufsummieren eines inkrementellen Wertes der durchschnittlichen
Intensität
jeder Note der Tonleiter für
jeden Beat für
alle Noten der Tonleiter, um einen Wert zu erhalten, der das Ausmaß der Änderung
aller Noten eines jeden Beats anzeigt, und zur Bestimmung eines
Metrums und der Position eines Taktstrichs aus dem Wert, der das
Ausmaß der Änderung
aller Noten eines jeden Beats anzeigt; zweite Tonleiter-Noten-Intensität Bestimmungsmittel
zur Anwendung einer FFT auf das empfangene akustische Signal in vorbestimmten
Rahmenintervallen, die verschieden sind von denjenigen zur Bestimmung
des Beats, durch die Verwendung von Parameter, die auf die Bestimmung
des Akkords angepasst sind, und zum Erhalt der Intensität jeder
Note der Tonleiter in jedem Rahmenintervall aus dem erhaltenen Intensitätsspektrum;
Mittel zur Bestimmung der Bassnoten zur Festsetzung verschiedener
Detektionszonen in jedem Takt und zur Bestimmung einer Bassnote
unter der bestimmten Intensität
jeder Note der Tonleiter in jeder Detektionszone aus der Intensität einer
tiefen Note der Tonleiter in einem Abschnitt, der einem ersten Beat
in jeder der Detektionszonen entspricht; erste Mittel zur Bestimmung
der Taktunterteilung zur Feststellung, ob die Bassnote geändert wird
abhängig
davon, ob die bestimmte Bassnote in jeder der Detektionszonen verschieden
ist, und zur Feststellung, ob es nötig ist, den Takt in eine Vielzahl
von Abschnitten zu unterteilen, abhängig davon, ob die Bassnote
geändert
wird; zweite Mittel zur Bestimmung der Taktunterteilung zur Festsetzung
verschiedener Akkord-Bestimmungszonen im Takt, zur Mittelung der
Intensität
jeder Note der Tonleiter für
jedes Rahmenintervall in jeder der Akkord-Bestimmungszonen in einem Akkord-Bestimmungsbereich,
der als Bereich spezifiziert ist, in dem Akkorde überwiegend
gespielt werden, zur Aufsummierung der gemittelten Intensität jeder
Note der Tonleiter für jede
von 12 Tonlagen-Noten der Tonleiter, zum Teilen der Summe für jede der
12 Tonlagen-Noten durch die Zahl der aufsummierten Intensitäten, um
die durchschnittliche Intensität
jeder der 12 Tonlagen-Noten der Tonleiter zu erhalten, zur Neuanordnung
der Intensitäten
nach absteigender Stärke,
zur Bestimmung, ob ein Akkord geändert
wird, abhängig
davon, ob C Noten oder mehr der M stärksten Noten der Tonleiter,
wobei M drei oder größer als
drei ist, in einer Detektionszone enthalten sind in den N stärksten Noten
der Tonleiter, wobei N drei oder größer als drei ist, in der unmittelbar
davor gelegenen Detektionszone, und zur Bestimmung, ob es notwendig
ist, den Takt in eine Vielzahl von Abschnitten zu unterteilen entsprechend
dem Ausmaß der Änderung
des Akkords; und Mittel zur Bestimmung des Akkordnamens zur Bestimmung,
wenn die ersten Mittel zur Bestimmung der Taktunterteilung und/oder
die zweiten Mittel zur Bestimmung der Taktunterteilung feststellen, dass
es notwendig ist, den Takt in verschiedene Akkord-Bestimmungszonen
zu unterteilen, eines Akkordnamens in jeder der Akkord-Bestimmungszonen
entsprechend der Bassnote und der Intensität jeder Note der Tonleiter
in jeder der Akkord-Bestimmungszonen, und zur Bestimmung, wenn die
ersten Mittel zur Bestimmung der Taktunterteilung und die ersten
und zweiten Mittel zur Bestimmung der Taktunterteilung feststellen,
dass es nicht notwendig ist, den Takt in verschiedene Akkord-Bestimmungszonen
zu unterteilen, eines Akkordnamens in dem Takt entsprechend der
Bassnote und der Intensität
jeder Note der Tonleiter in dem Takt.
-
In
der oben beschriebenen Struktur wird der Takt nicht nur in Abhängigkeit
von der Bassnote unterteilt sondern auch in Abhängigkeit von dem Ausmaß der Änderung
im Akkord. Wenn sich die Bassnote ändert, oder wenn das Ausmaß der Änderung
im Akkord groß ist,
wird der Takt unterteilt und Akkorde werden bestimmt. Die Unterteilung
des Takts ist nicht auf eine Unterteilung in eine erste Hälfte und
in eine zweite Hälfte
begrenzt. Wenn ein Musikstück
einen Vierertakt hat, kann der Takt in vier Abschnitte unterteilt
werden, indem sowohl die erste Hälfte
als auch die zweite Hälfte
in weitere Hälften
unterteilt werden. Abhängig
vom Einzelfall, kann der Takt weiter unterteilt werden. Die Bassnote
wird nicht in der gesamten Detektionszone bestimmt, sondern in einem
Abschnitt, der dem ersten Beat in der Detektionszone entspricht.
Das ist so, weil die Grundtöne
des Akkords in vielen Fällen
am ersten Beat gespielt werden, selbst wenn die Bassnote häufig geändert wird.
-
Die
Bassnote wird auf die gleiche Weise bestimmt wie in der vormals
entwickelten Vorrichtung, die oben beschrieben wurde. Genauer ausgeführt, wird
eine schnelle Fourier Transformation (FFT) auf ein Eingangs-Wellensignal
in vorbestimmten Zeitintervallen (Rahmen) angewandt; die Intensität jeder
Note der Tonleiter in jedem Rahmenintervall wird aus dem erhaltenen
Intensitätsspektrum
erhalten; ein inkrementeller Wert der Intensität jeder Note der Tonleiter
wird für
jedes Rahmenintervall berechnet; der inkrementelle Wert der Intensität jeder
Note der Tonleiter wird für
alle Noten der Tonleiter aufsummiert, um das Ausmaß der Änderung aller
Noten in jedem Rahmenintervall zu erhalten; und Beats (ein durchschnittliches
Beat Intervall und die Position jedes Beats) werden aus dem Ausmaß der Änderung
aller Noten in jedem Rahmenintervall bestimmt. Wenn die Beats bestimmt
sind, wird die durchschnittliche Intensität jeder Note der Tonleiter
für jedes
Beat Intervall berechnet; ein inkrementeller Wert der durchschnittlichen
Intensität
jeder Note der Tonleiter wird für
jeden Beat berechnet; der inkrementelle Wert der durchschnittlichen
Intensität
jeder Note wird für
alle Noten aufsummiert, um das Ausmaß der Änderung aller Noten in jedem
Beat zu erhalten; und ein Metrum und die Position eines Taktstrichs
werden bestimmt aus dem Ausmaß der Änderung
aller Noten in dem Beat. Weil der Takt auf diese Weise bestimmt
wird, wird der Takt in eine erste Hälfte und eine zweite Hälfe aufgeteilt
und die Bassnote wird in jeder der beiden Hälften bestimmt. Unter den oben
erhaltenen Intensitäten
der Noten der Tonleiter in jedem Rahmenintervall werden die Intensitäten der
Noten eines Basisbereichs (zum Beispiel von E1 bis E3) in der Detektionszone
gemittelt und die Note, welche eine hohe mittlere Intensität hat, wird
als Bassnote bestimmt. Als Alternative werden die durchschnittlichen
Intensitäten
von 12 Tonlagen-Noten erhalten und die Tonlagen-Note, welche den
höchsten
Wert hat, wird als die Bassnote bestimmt.
-
In
der vormals entwickelten Vorrichtung, die oben beschrieben wurde,
werden die Intensitäten
in der Detektionszone gemittelt und eine Note, die eine hohe durchschnittliche
Intensität
hat, wird als die Bassnote bestimmt. Gemäß der vorliegenden Erfindung
wird die Bassnote jedoch in einem Abschnitt entsprechend dem ersten
Beat in der Detektionszone bestimmt. Der Grund dafür ist wie
oben beschrieben. Das Bestimmungsverfahren und die Bestimmungsstruktur
sind die gleichen wie in der vormals entwickelten, oben beschriebenen Vorrichtung.
-
Die
Unterteilung des Takts in Abhängigkeit
von dem Ausmaß der Änderung
im Akkord, welche ein Element der vorliegenden Erfindung ist, wird
als Nächstes
beschrieben.
-
Gemäß der vorliegenden
Erfindung wird der Takt nicht nur in Abhängigkeit von der Bassnote sondern auch
in Abhängigkeit
von dem Ausmaß der Änderung
im Akkord untereilt. Das Ausmaß der Änderung
im Akkord wird auf die folgende Weise berechnet. Zuerst wird ein
Bereich zur Bestimmung eines Akkords festgelegt. Der Bereich zur
Bestimmung eines Akkords ist ein Bereich, in dem Akkorde hauptsächlich gespielt
werden, und es wird zum Beispiel angenommen, dass er im Bereich
von C3 bis E6 ist (C4 dient als das Zentrum „do").
-
Die
Intensität
jeder Note der Tonleiter für
jedes Rahmenintervall im Bereich zur Bestimmung eines Akkords wird
in einer Detektionszone, wie zum Beispiel einem halben Takt, gemittelt.
Die gemittelte Intensität
jeder Note der Tonleiter wird für
jede von 12 Tonlagen-Noten (C, Cis, D, Dis, ..., und H) aufsummiert
und die aufsummierte Intensität
wird geteilt durch die Anzahl der aufsummierten Intensitäten, um
die durchschnittliche Intensität
von jeder der 12 Tonlagen-Noten zu erhalten.
-
Die
durchschnittlichen Intensitäten
der 12 Tonlagen-Noten werden in dem Bereich zur Bestimmung eines
Akkords für
die erste Hälfte
und für
die zweite Hälfte
des Takts erhalten und sie werden neu angeordnet nach abnehmender
Stärke.
-
Wie
gezeigt in 15A und 15B wird
bestimmt, ob zum Beispiel die drei Noten (diese Zahl wird „M" genannt) mit der
stärksten
Intensität
in der zweiten Hälfte
enthalten sind in zum Beispiel den drei Noten (diese Zahl wird „N" genannt) mit der
stärksten
Intensität
in der ersten Hälfte.
-
Wenn
die drei Noten (diese Zahl wird „C" genannt) oder mehr enthalten sind (das
heißt,
dass alle drei enthalten sind), wird festgestellt, dass der Akkord
sich zwischen der ersten Hälfte
und der zweiten Hälfte
des Takts nicht verändert,
und die Unterteilung des Takts in Abhängigkeit von dem Ausmaß der Änderung
im Akkord muss nicht durchgeführt
werden.
-
Die
angemessene Festsetzung der Werte von „M", „N" und „C" ändert die Unterteilung des
Takts in Abhängigkeit
von dem Ausmaß der Änderung
im Akkord. Im vorangegangenen Beispiel, in welchem „M", „N" und „C" alle den Wert „3" erhielten, wird
eine Änderung
im Akkord ziemlich streng geprüft.
Wenn zum Beispiel "M" den Wert „3" erhält, „N" den Wert „6" erhält, und „C" den Wert „3" erhält (was
bedeutet, dass festgestellt wird, ob die drei obersten Noten in
der zweiten Hälfte
alle in den sechs obersten Noten in der ersten Hälfte enthalten sind), wird
festgestellt, dass Klangsequenzen, die einander in gewissem Umfang ähneln, einen
identischen Akkord haben.
-
Es
ist beschrieben worden, dass die erste Hälfte und die zweite Hälfte beide
weiter in je zwei Hälften aufgeteilt
werden, um vier Abschnitte im Takt in einem Vierermetrum zu haben.
Eine korrektere Bestimmung, die an tatsächliche normale Musik angepasst
ist, kann durchgeführt werden
indem "M" den Wert "3" erhält "N" den Wert "3" erhält und "C" den Wert "3" erhält wenn
festgestellt wird, ob der Takt in die erste Hälfte und die zweite Hälfte unterteilt
werden soll und indem "M" den Wert "3" erhält "N" den Wert "6" erhält und "C" den Wert "3" erhält wenn
festgestellt wird, ob die erste Hälfte und die zweite Hälfte beide
in zwei weitere Hälften
aufgeteilt werden sollen.
-
Bei
der Ausführung
der vorliegenden Ausführungsform
wird, weil der Takt nicht nur in Abhängigkeit von der Bassnote unterteilt
wird, sondern auch in Abhängigkeit
von dem Ausmaß der Änderung
im Akkord, um den Akkord zu bestimmen, sogar wenn die Bassnote identisch
ist, wenn das Ausmaß der Änderung
im Akkord groß ist,
der Takt unterteilt und die Akkorde werden bestimmt. Mit anderen
Worten, wenn zum Beispiel der Akkord sich im Takt ändert, wobei
eine identische Bassnote beibehalten wird, können die korrekten Akkorde
bestimmt werden. Der Takt kann auf verschiedene Weise aufgeteilt
werden, entsprechend dem Ausmaß der Änderung der
Bassnote und dem Ausmaß der Änderung
im Akkord.
-
Bei
der Ausführung
eines zweiten Aspekts der vorliegenden Erfindung, wird die Struktur
zur Unterteilung des Takts in Abhängigkeit von dem Ausmaß der Änderung
im Akkord im ersten Aspekt der vorliegenden Erfindung geändert.
-
Genauer
gesagt stellt die vorliegende Erfindung als zweiten Aspekt eine
Vorrichtung zur Bestimmung von Akkordnamen bereit, um das bereits
beschriebene Ziel zu erreichen. Die Vorrichtung zur Bestimmung von Akkordnamen
umfasst Eingabemittel zum Empfang eines akustischen Signals; erste
Tonleiter-Noten-Intensität Bestimmungsmittel
zur Anwendung einer schnellen Fourier Transformation (fast Fourier
transformation; FFT) auf das empfangene akustische Signal in vorbestimmten
Rahmenintervallen durch die Verwendung von Parametern, die auf die
Bestimmung des Beats (Taktschlags) angepasst sind, und zum Erhalt
der Intensität
jeder Note einer Tonleiter in jedem Rahmenintervall aus dem erhaltenen
Intensitätsspektrum;
Beatbestimmungsmittel zur Aufsummierung eines inkrementellen Wertes
der Intensität
jeder Note der Tonleiter in den vorbestimmten Rahmenintervallen
für alle
Noten der Tonleiter, um die Summe der inkrementellen Werte der Intensitäten zu erhalten,
die das Ausmaß der Änderung
aller Noten in jedem Rahmenintervall anzeigt, und zur Bestimmung eines
durchschnittlichen Beat Intervalls und der Position jedes Beats
aus der Summe der inkrementellen Werte der Intensitäten; Mittel
zur Bestimmung des Takts zur Berechnung der durchschnittlichen Intensität jeder
Note der Tonleiter für
jeden Beat, zum Aufsummieren eines inkrementellen Wertes der durchschnittlichen
Intensität jeder
Note der Tonleiter für
jeden Beat für
alle Noten der Tonleiter, um einen Wert zu erhalten, der das Ausmaß der Änderung
aller Noten eines jeden Beats anzeigt, und zur Bestimmung eines
Metrums und der Position eines Taktstrichs aus dem Wert, der das Ausmaß der Änderung
aller Noten eines jeden Beats anzeigt; zweite Tonleiter-Noten-Intensität Bestimmungsmittel
zur Anwendung einer FFT auf das empfangene akustische Signal in
vorbestimmten Rahmenintervallen, die verschieden sind von denjenigen
zur Bestimmung des Beats, durch die Verwendung von Parametern, die
auf die Bestimmung des Akkords angepasst sind, und zum Erhalt der
Intensität
jeder Note der Tonleiter in jedem Rahmenintervall aus dem erhaltenen
Intensitätsspektrum;
Mittel zur Bestimmung der Bassnoten zur Festsetzung verschiedener
Detektionszonen in jedem Takt und zur Bestimmung einer Bassnote
unter der bestimmten Intensität
jeder Note der Tonleiter in jeder Detektionszone aus der Intensität einer
tiefen Note der Tonleiter in einem Abschnitt, der einem ersten Beat
in jeder der Detektionszonen entspricht; erste Mittel zur Bestimmung
der Taktunterteilung zur Feststellung, ob die Bassnote geändert wird abhängig davon,
ob die bestimmte Bassnote in jeder der Detektionszonen verschieden
ist, und zur Feststellung, ob es nötig ist, den Takt in eine Vielzahl
von Abschnitten zu unterteilen, abhängig davon, ob die Bassnote geändert wird;
zweite Mittel zur Bestimmung der Taktunterteilung zur Festsetzung
verschiedener Akkord-Bestimmungszonen im Takt, zur Mittelung der
Intensität
jeder Note der Tonleiter für
jedes Rahmenintervall in jeder der Akkord-Bestimmungszonen in einem Akkord-Bestimmungsbereich,
der als Bereich spezifiziert ist, in dem Akkorde überwiegend
gespielt werden, zur Aufsummierung der gemittelten Intensität jeder
Note der Tonleiter für
jede von 12 Tonlagen-Noten der Tonleiter, zum Teilen der Summe für jede der
12 Tonlagen-Noten durch die Zahl der aufsummierten Intensitäten, um
die durchschnittliche Intensität
jeder der 12 Tonlagen-Noten der Tonleiter zu erhalten, zur Normierung
der durchschnittlichen Intensität
jeder der 12 Tonlagen-Noten der Tonleiter in Bezug auf die kleinste
Intensität,
zur Berechnung der Euklidischen Distanz der normierten Intensität jeder der
12 Tonlagen-Noten der Tonleiter, zur Bestimmung, ob ein Akkord geändert wird
abhängig
davon, ob die Euklidische Distanz größer ist als „T" multipliziert mit
dem Durchschnitt der Intensitäten
aller Noten in allen Rahmen, und zur Bestimmung, ob es notwendig
ist, den Takt in eine Vielzahl von Abschnitten zu unterteilen, entsprechend
dem Ausmaß der Änderung
des Akkords; und Mittel zur Bestimmung des Akkordnamens zur Bestimmung,
wenn die ersten Mittel zur Bestimmung der Taktunterteilung und/oder
die zweiten Mittel zur Bestimmung der Taktunterteilung feststellen,
dass es notwendig ist, den Takt in verschiedene Akkord-Bestimmungszonen
zu unterteilen, eines Akkordnamens in jeder der Akkord-Bestimmungszonen
entsprechend der Bassnote und der Intensität jeder Note der Tonleiter
in jeder der Akkord-Bestimmungszonen, und zur Bestimmung, wenn die
ersten Mittel zur Bestimmung der Taktunterteilung und die ersten
und zweiten Mittel zur Bestimmung der Taktunterteilung feststellen,
dass es nicht notwendig ist, den Takt in verschiedene Akkord- Bestimmungszonen
zu unterteilen, eines Akkordnamens in dem Takt entsprechend der
Bassnote und der Intensität
jeder Note der Tonleiter in dem Takt.
-
Die
Ausführung
des zweiten Aspekts der vorliegenden Erfindung unterscheidet sich
von derjenigen des ersten Aspekts dadurch, dass die Euklidische
Distanz der Intensität
jeder Note der Tonleiter berechnet wird, um das Ausmaß der Änderung
im Akkord zu bestimmen, um einen Takt zu unterteilen und um Akkorde zu
bestimmen.
-
Wenn
in diesem Fall jedoch die Euklidische Distanz einfach berechnet
wird, wird sie groß bei
einer plötzlichen
Klangzunahme (am Anfang eines Musikstücks oder Ähnlichem) und bei einer plötzlichen
Abschwächung
des Klangs (am Ende eines Musikstücks oder bei einer Pause),
was zu der Gefahr führt,
den Takt nur wegen Zunahmen des Klangs zu unterteilen, obwohl sich
der Akkord tatsächlich
nicht ändert.
Deshalb wird die Intensität
jeder Note normiert wie gezeigt in 17A bis 17D, bevor die Euklidische Distanz berechnet wird
(die in 17A gezeigten Intensitäten werden
normiert zu denen, die in 17C gezeigt
werden und die in 17B gezeigten Intensitäten werden
normiert zu denen, die in 17D gezeigt
werden). Wenn die Normierung in Bezug auf die kleinste Intensität durchgeführt wird
und nicht in Bezug auf die größte (siehe 17A bis 17D),
wird die Euklidische Distanz bei einer plötzlichen Klangänderung
reduziert und die Gefahr ausgeschlossen, dass der Takt fälschlich
aufgeteilt wird.
-
Die
Euklidische Distanz der Intensität
jeder Note der Tonleiter wird nach der folgenden Formel 16 berechnet. Formel
16
- IntensitätNote1: Feld der durchschnittlichen
Intensität
jeder der 12 Tonlagen-Noten in der Akkord-Bestimmungszone 1 (12
Noten von c bis h)
- IntensitätNote2:
Feld der durchschnittlichen Intensität jeder der 12 Tonlagen-Noten
in der Akkord-Bestimmungszone 2 (12 Noten von c bis h)
-
Wenn
zum Beispiel die Euklidische Distanz größer ist als der Durchschnitt
der Intensitäten
aller Noten in allen Rahmen, wird der Takt untereilt.
-
Genauer
gesagt, wenn die Euklidische Distanz größer ist als „T" multipliziert mit
dem Durchschnitt der Intensitäten
aller Noten in allen Rahmen, ist es notwendig, den Takt zu teilen.
-
Wenn
der Wert „T" verändert wird,
kann der Schwellenwert zur Unterteilung des Takts zu einem gewünschten
Wert geändert
(angepasst) werden.
-
Als
dritte und vierte Aspekte der vorliegenden Erfindung werden Computerprogramme
bereitgestellt, die von einem Computer gelesen und ausgeführt werden,
um zu bewirken, dass der Computer als die Vorrichtung zur Bestimmung
von Akkordnamen gemäß des ersten
und zweiten Aspekts fungiert.
-
Genauer
gesagt werden als Strukturen zur Durchführung der oben beschriebenen
Vorgänge
Computerprogramme offenbart, welche von einem Computer gelesen werden
und von einem Computer ausführbar sind,
um die Verarbeitungsmittel in den Strukturen der Vorrichtungen zur
Bestimmung von Akkordnamen, welche im ersten und zweiten Aspekt
der vorliegenden Erfindung spezifiziert wurden, durch die Benutzung
der Struktur des Computers zu realisieren. Wie später beschrieben
wird, können
diese Strukturen nicht nur durch die Computerprogramme bereitgestellt
werden, sondern auch Aufzeichnungsmedien, die Programme gespeichert
haben, die dieselben Funktionen haben wie die oben beschriebenen
Computerprogramme. Der Computer kann nicht nur ein für allgemeine
Zwecke geeigneter Computer sein, der eine CPU (central processing
unit; Hauptprozessor) hat, sondern er kann auch ein Computer für spezielle
Zwecke sein. Der Computer muss eine CPU haben, sonst aber bestehen
keine speziellen Anforderungen.
-
Wenn
solche Programme zur Ausführung
der oben beschriebenen Verarbeitung vom Computer gelesen werden,
wird die gleiche Verarbeitung ausgeführt wie diejenige, die durch
die Mittel der Vorrichtungen wie spezifiziert im ersten und zweiten
Aspekt der vorliegenden Erfindung erreicht wird.
-
Wenn
vorhandene Hardware verwendet wird, um eines der oben genannten
Computerprogramme auszuführen,
erkennt die vorhandene Hardware leicht die Vorrichtung zur Bestimmung
von Akkordnamen spezifiziert entsprechend dem ersten oder zweiten
Aspekt als neue Anwendung. Außerdem
können
die Programme, wenn die Computerprogramme auf den oben beschriebenen
Speichermedien gespeichert sind, leicht als Softwareprodukte verteilt
oder verkauft werden. Darüber
hinaus können
die Speichermedien, zusätzlich
zur oben beschriebenen Form, interne Speicherbauteile wie z. B.
RAMs oder ROMS oder externe Speicherbauteile wie zum Beispiel Festplatten
sein. Wenn ein solches Programm auf einem Bauteil gespeichert ist,
gehört das
Bauteil zu den Speichermedien, die in der vorliegenden Erfindung
spezifiziert werden.
-
Funktionen,
die einen Teil der Verarbeitung ausführen, die durch die Mittel
wie spezifiziert im später beschriebenen
dritten und vierten Aspekt durchgeführt wird, können durch in den Computer
eingebaute Funktionen ausgeführt
werden (Funktionen, die in den Computer als Hardware integriert
sind, oder Funktionen, die durch ein Betriebssystem ausgeführt werden
oder durch ein anderes Anwendungsprogramm, das auf dem Computer
installiert ist), und die Programme des dritten und vierten Aspekt
können
Befehle zum Aufruf der durch den Computer erreichten Funktionen
oder zur Verbindung mit den durch den Computer erreichten Funktionen
umfassen.
-
Wenn
ein Teil der Mittel wie spezifiziert im dritten und vierten Aspekt
durch einen Teil der eingebauten Funktionen erreicht wird, zum Beispiel
durch das Betriebssystem, wird kein Programm oder Modul direkt gespeichert,
das diese Funktion ausführt.
Wenn allerdings ein Teil der Funktionen des Betriebssystems, die
die Funktion ausführen,
aufgerufen oder eingebunden wird, wird im Wesentlichen dieselbe
Struktur erreicht.
-
Die
Programme selbst können
verwendet werden, können
auf Speichermedien gespeichert werden, um wie später beschrieben verteilt oder
verkauft zu werden, und können
durch Kommunikation übermittelt
werden, um übergeben
zu werden.
-
Die
Ausführung
des dritten Aspekts der vorliegenden Erfindung entspricht derjenigen
des ersten Aspekts.
-
Genauer
gesagt stellt die vorliegende Erfindung zur Erreichung des genannten
Ziels als dritten Aspekt ein Programm zur Bestimmung von Akkordnamen
bereit. Das Programm zur Bestimmung von Akkordnamen wird von einem
Computer gelesen und ausgeführt,
um zu bewirken, dass der Computer fungiert als: Eingabemittel zum
Empfang eines akustischen Signals; erste Tonleiter-Noten-Intensität Bestimmungsmittel
zur Anwendung einer schnellen Fourier Transformation (fast Fourier
transformation; FFT) auf das empfangene akustische Signal in vorbestimmten
Rahmenintervallen durch die Verwendung von Parametern, die auf die
Bestimmung des Beats (Taktschlags) angepasst sind, und zum Erhalt
der Intensität
jeder Note einer Tonleiter in jedem Rahmenintervall aus dem erhaltenen
Intensitätsspektrum;
Beatbestimmungsmittel zur Aufsummierung eines inkrementellen Wertes
der Intensität
jeder Note der Tonleiter in den vorbestimmten Rahmenintervallen
für alle
Noten der Tonleiter, um die Summe der inkrementellen Werte der Intensitäten zu erhalten,
die das Ausmaß der Änderung
aller Noten in jedem Rahmenintervall anzeigt, und zur Bestimmung
eines durchschnittlichen Beat Intervalls und der Position jedes
Beats aus der Summe der inkrementellen Werte der Intensitäten; Mittel
zur Bestimmung des Takts zur Berechnung der durchschnittlichen Intensität jeder
Note der Tonleiter für
jeden Beat, zum Aufsummieren eines inkrementellen Wertes der durchschnittlichen
Intensität
jeder Note der Tonleiter für jeden
Beat für
alle Noten der Tonleiter, um einen Wert zu erhalten, der das Ausmaß der Änderung
aller Noten eines jeden Beats anzeigt, und zur Bestimmung eines
Metrums und der Position eines Taktstrichs aus dem Wert, der das
Ausmaß der Änderung
aller Noten eines jeden Beats anzeigt; zweite Tonleiter-Noten-Intensität Bestimmungsmittel
zur Anwendung einer FFT auf das empfangene akustische Signal in
vorbestimmten Rahmenintervallen, die verschieden sind von denjenigen
zur Bestimmung des Beats, durch die Verwendung von Parametern, die
auf die Bestimmung des Akkords angepasst sind, und zum Erhalt der
Intensität
jeder Note der Tonleiter in jedem Rahmenintervall aus dem erhaltenen
Intensitätsspektrum;
Mittel zur Bestimmung der Bassnoten zur Festsetzung verschiedener
Detektionszonen in jedem Takt und zur Bestimmung einer Bassnote
unter der bestimmten Intensität
jeder Note der Tonleiter in jeder Detektionszone aus der Intensität einer
tiefen Note der Tonleiter in einem Abschnitt, der einem ersten Beat
in jeder der Detektionszonen entspricht; erste Mittel zur Bestimmung
der Taktunterteilung zur Feststellung, ob die Bassnote geändert wird
abhängig
davon, ob die bestimmte Bassnote in jeder der Detektionszonen verschieden
ist, und zur Feststellung, ob es nötig ist, den Takt in eine Vielzahl
von Abschnitten zu unterteilen, abhängig davon, ob die Bassnote
geändert
wird; zweite Mittel zur Bestimmung der Taktunterteilung zur Festsetzung
verschiedener Akkord-Bestimmungszonen im Takt, zur Mittelung der
Intensität
jeder Note der Tonleiter für
jedes Rahmenintervall in jeder der Akkord-Bestimmungszonen in einem Akkord-Bestimmungsbereich,
der als Bereich spezifiziert ist, in dem Akkorde überwiegend
gespielt werden, zur Aufsummierung der gemittelten Intensität jeder
Note der Tonleiter für
jede von 12 Tonlagen-Noten der Tonleiter, zum Teilen der Summe für jede der
12 Tonlagen-Noten durch die Zahl der aufsummierten Intensitäten, um
die durchschnittliche Intensität
jeder der 12 Tonlagen-Noten der Tonleiter zu erhalten, zur Neuanordnung
der Intensitäten
nach absteigender Stärke,
zur Bestimmung, ob ein Akkord geändert wird,
abhängig
davon, ob C Noten oder mehr der M stärksten Noten der Tonleiter,
wobei M drei oder größer als
drei ist, in einer Detektionszone enthalten sind in den N stärksten Noten
der Tonleiter, wobei N drei oder größer als drei ist, in der unmittelbar
davor gelegenen Detektionszone, und zur Bestimmung, ob es notwendig ist,
den Takt in eine Vielzahl von Abschnitten zu unterteilen entsprechend
dem Ausmaß der Änderung
des Akkords; und Mittel zur Bestimmung des Akkordnamens zur Bestimmung,
wenn die ersten Mittel zur Bestimmung der Taktunterteilung und/oder
die zweiten Mittel zur Bestimmung der Taktunterteilung feststellen,
dass es notwendig ist, den Takt in verschiedene Akkord-Bestimmungszonen
zu unterteilen, eines Akkordnamens in jeder der Akkord-Bestimmungszonen
entsprechend der Bassnote und der Intensität jeder Note der Tonleiter
in jeder der Akkord-Bestimmungszonen, und zur Bestimmung, wenn die
ersten Mittel zur Bestimmung der Taktunterteilung und die ersten
und zweiten Mittel zur Bestimmung der Taktunterteilung feststellen,
dass es nicht notwendig ist, den Takt in verschiedene Akkord-Bestimmungszonen
zu unterteilen, eines Akkordnamens in dem Takt entsprechend der
Bassnote und der Intensität
jeder Note der Tonleiter in dem Takt.
-
Die
Ausführung
des vierten Aspekts der vorliegenden Erfindung entspricht derjenigen
des zweiten Aspekts.
-
Genauer
gesagt stellt die vorliegende Erfindung zur Erreichung des genannten
Ziels als vierten Aspekt ein Programm zur Bestimmung von Akkordnamen
bereit. Das Programm zur Bestimmung von Akkordnamen wird von einem
Computer gelesen und ausgeführt,
um zu bewirken, dass der Computer fungiert als: Eingabemittel zum
Empfang eines akustischen Signals; erste Tonleiter-Noten-Intensität Bestimmungsmittel
zur Anwendung einer schnellen Fourier Transformation (fast Fourier
transformation; FFT) auf das empfangene akustische Signal in vorbestimmten
Rahmenintervallen durch die Verwendung von Parametern, die auf die
Bestimmung des Beats (Taktschlags) angepasst sind, und zum Erhalt
der Intensität
jeder Note einer Tonleiter in jedem Rahmenintervall aus dem erhaltenen
Intensitätsspektrum;
Beatbestimmungsmittel zur Aufsummierung eines inkrementellen Wertes
der Intensität
jeder Note der Tonleiter in den vorbestimmten Rahmenintervallen
für alle
Noten der Tonleiter, um die Summe der inkrementellen Werte der Intensitäten zu erhalten,
die das Ausmaß der Änderung
aller Noten in jedem Rahmenintervall anzeigt, und zur Bestimmung
eines durchschnittlichen Beat Intervalls und der Position jedes
Beats aus der Summe der inkrementellen Werte der Intensitäten; Mittel
zur Bestimmung des Takts zur Berechnung der durchschnittlichen Intensität jeder
Note der Tonleiter für
jeden Beat, zum Aufsummieren eines inkrementellen Wertes der durchschnittlichen
Intensität
jeder Note der Tonleiter für jeden
Beat für
alle Noten der Tonleiter, um einen Wert zu erhalten, der das Ausmaß der Änderung
aller Noten eines jeden Beats anzeigt, und zur Bestimmung eines
Metrums und der Position eines Taktstrichs aus dem Wert, der das
Ausmaß der Änderung
aller Noten eines jeden Beats anzeigt; zweite Tonleiter-Noten-Intensität Bestimmungsmittel
zur Anwendung einer FFT auf das empfangene akustische Signal in
vorbestimmten Rahmenintervallen, die verschieden sind von denjenigen
zur Bestimmung des Beats, durch die Verwendung von Parametern, die
auf die Bestimmung des Akkords angepasst sind, und zum Erhalt der
Intensität
jeder Note der Tonleiter in jedem Rahmenintervall aus dem erhaltenen
Intensitätsspektrum;
Mittel zur Bestimmung der Bassnoten zur Festsetzung verschiedener
Detektionszonen in jedem Takt und zur Bestimmung einer Bassnote
unter der bestimmten Intensität
jeder Note der Tonleiter in jeder Detektionszone aus der Intensität einer
tiefen Note der Tonleiter in einem Abschnitt, der einem ersten Beat
in jeder der Detektionszonen entspricht; erste Mittel zur Bestimmung
der Taktunterteilung zur Feststellung, ob die Bassnote geändert wird
abhängig
davon, ob die bestimmte Bassnote in jeder der Detektionszonen verschieden
ist, und zur Feststellung, ob es nötig ist, den Takt in eine Vielzahl
von Abschnitten zu unterteilen, abhängig davon, ob die Bassnote
geändert
wird; zweite Mittel zur Bestimmung der Taktunterteilung zur Festsetzung
verschiedener Akkord-Bestimmungszonen im Takt, zur Mittelung der
Intensität
jeder Note der Tonleiter für
jedes Rahmenintervall in jeder der Akkord-Bestimmungszonen in einem Akkord-Bestimmungsbereich,
der als Bereich spezifiziert ist, in dem Akkorde überwiegend
gespielt werden, zur Aufsummierung der gemittelten Intensität jeder
Note der Tonleiter für
jede von 12 Tonlagen-Noten der Tonleiter, zum Teilen der Summe für jede der
12 Tonlagen-Noten durch die Zahl der aufsummierten Intensitäten, um
die durchschnittliche Intensität
jeder der 12 Tonlagen-Noten der Tonleiter zu erhalten, zur Normierung
der durchschnittlichen Intensität
jeder der 12 Tonlagen-Noten der Tonleiter in Bezug auf die kleinste
Intensität,
zur Berechnung der Euklidischen Distanz der normierten Intensität jeder
der 12 Tonlagen-Noten der Tonleiter, zur Bestimmung, ob ein Akkord
geändert
wird abhängig
davon, ob die Euklidische Distanz größer ist als „T" multipliziert mit
dem Durchschnitt der Intensitäten
aller Noten in allen Rahmen, und zur Bestimmung, ob es notwendig
ist, den Takt in eine Vielzahl von Abschnitten zu unterteilen, entsprechend dem
Ausmaß der Änderung
des Akkords; und Mittel zur Bestimmung des Akkordnamens zur Bestimmung, wenn
die ersten Mittel zur Bestimmung der Taktunterteilung und/oder die
zweiten Mittel zur Bestimmung der Taktunterteilung feststellen,
dass es notwendig ist, den Takt in verschiedene Akkord-Bestimmungszonen
zu unterteilen, eines Akkordnamens in jeder der Akkord-Bestimmungszonen
entsprechend der Bassnote und der Intensität jeder Note der Tonleiter
in jeder der Akkord-Bestimmungszonen, und zur Bestimmung, wenn die
ersten Mittel zur Bestimmung der Taktunterteilung und die ersten
und zweiten Mittel zur Bestimmung der Taktunterteilung feststellen,
dass es nicht notwendig ist, den Takt in verschiedene Akkord-Bestimmungszonen
zu unterteilen, eines Akkordnamens in dem Takt entsprechend der
Bassnote und der Intensität
jeder Note der Tonleiter in dem Takt.
-
Mit
den Vorrichtungen zur Bestimmung von Akkordnamen und den Programmen
zur Bestimmung von Akkordnamen des ersten bis vierten Aspekts der
vorliegenden Erfindung können
korrekte Akkorde bestimmt werden, selbst wenn der Akkord im Takt
geändert
wird und die Bassnote beibehalten wird.
-
Kurze Beschreibung der Zeichnungen
-
1 ist
ein Blockdiagramm einer Vorrichtung zur Tempobestimmung, das früher vorgeschlagen
wurde;
-
2 ist
ein Blockdiagramm einer Sektion zur Bestimmung der Tonleiter-Noten-Intensität in der
Vorrichtung zur Tempobestimmung;
-
3 ist
ein Fließbild,
das einen Verarbeitungsablauf in einer Sektion zur Bestbestimmung
in der Vorrichtung zur Tempobestimmung zeigt;
-
4 ist
ein Diagramm, das die Wellenform eines Teils eines Musikstücks, die
Intensität
jeder Note einer Tonleiter, und die Summe der inkrementellen Werte
der Intensität
der Noten der Tonleiter zeigt;
-
5 ist
eine Ansicht die das Konzept der Autokorrelationsrechnung zeigt;
-
6 ist
eine Ansicht, die eine Methode zur Bestimmung der Position des Anfangsbeats
zeigt;
-
7 ist
eine Ansicht, die eine Methode zur Bestimmung nachfolgender Bestpositionen
zeigt, nachdem die Position des Startbeats bestimmt wurde;
-
8 ist
ein Diagram, das die Verteilung eines Koeffizienten „k" zeigt, welcher sich
in Abhängigkeit des
Wertes von „s" verändert;
-
9 ist
eine Ansicht, die eine Methode zur Bestimmung zweiter und weiterer
Bestpositionen zeigt;
-
10 ist
eine Ansicht, die ein Beispiel eines Befundes der Ergebnisse einer
Bestbestimmung am Bildschirm zeigt;
-
11 ist
eine Ansicht, die ein Beispiel eines Befundes der Ergebnisse einer
Taktbestimmung am Bildschirm zeigt;
-
12 ist
ein Blockdiagramm der Vorrichtung zur Bestimmung von Akkordnamen
entsprechend einer ersten Ausführungsform
der vorliegenden Erfindung;
-
13 ist
ein Diagramm, das die Intensität
jeder Note der Tonleiter in jedem Rahmenintervall im gleichen Teil
wie in 4 zeigt, ausgegeben von einer Sektion zur Bestimmung
von Tonleiter-Noten-Intensität
zur Akkord-Bestimmung;
-
14 ist
ein Diagramm, das ein Beispiel einer Anzeige von Ergebnissen einer
Bassnotenbestimmung zeigt, die von einer Sektion zur Bestimmung
von Bassnoten erhalten wurde;
-
15A und 15B sind
Ansichten, die die Intensität
jeder Note der Tonleiter in einer ersten Hälfte und in einer zweiten Hälfte eines
Taktes zeigen;
-
16 ist
eine Ansicht, die ein Beispiel eines Befundes der Ergebnisse einer
Akkordbestimmung am Bildschirm zeigt (Akkorde in englischer Notation);
und
-
17A bis 17D sind
Ansichten, die im Überblick
eine Methode zur Berechnung der Euklidischen Distanz der Intensität jeder
Note der Tonleiter zeigen, ausgeführt durch eine zweite Sektion
zur Bestimmung der Taktunterteilung.
-
Detaillierte Beschreibung der bevorzugten
Ausführungsformen
-
Ausführungsformen
der vorliegenden Erfindung werden im Folgenden beschrieben, indem
auf die Zeichnungen Bezug genommen wird.
-
1 ist
ein Blockdiagramm einer Vorrichtung zur Tempobestimmung, das früher entwickelt
wurde. Die dargestellte Vorrichtung zur Tempobestimmung enthält eine
Eingabesektion 1 zum Empfangen eines akustischen Signals;
eine Sektion zur Bestimmung der Tonleiter-Noten-Intensität 2 zur
Anwendung einer schnellen Fouriertransformation (FFT) auf das empfangene
akustische Signal in vorbestimmten Zeitintervallen (Rahmen) und
zum Erhalten der Intensität
jeder Note einer Tonleiter in jedem Rahmenintervall aus dem erhaltenen
Intensitätsspektrum;
eine Sektion zur Bestbestimmung 3 zum Aufsummieren eines
inkrementellen Werts der Intensität jeder Note der Tonleiter
in jedem Rahmenintervall für
alle Noten der Tonleiter, um die Summe der inkrementellen Werte
der Intensitäten
zu erhalten, die das Ausmaß der Änderung
aller Noten in jedem Rahmenintervall anzeigt, und zur Bestimmung
eines durchschnittlichen Beat Intervalls und der Position jedes
Beats aus der Summe der inkrementellen Werte der Intensitäten; und
eine Sektion zur Bestimmung des Takts 4 zur Berechnung
der durchschnittlichen Intensität
jeder Note der Tonleiter für
jeden Beat, zum Aufsummieren eines inkrementellen Wertes der durchschnittlichen
Intensität
jeder Note der Tonleiter für
jeden Beat für
alle Noten, um einen Wert zu erhalten, der das Ausmaß der Änderung
aller Noten eines jeden Beats anzeigt, und zur Bestimmung eines
Metrums und der Position eines Taktstrichs aus dem Wert, der das
Ausmaß der Änderung
aller Noten eines jeden Beats anzeigt.
-
Die
Eingabesektion 1 empfangt ein musikalisches akustisches
Signal, von welchem das Tempo bestimmt werden soll. Ein analoges
Signal, das von einem Mikrophon oder von einem anderen Gerät empfangen wird,
kann durch einen A-D Konverter (nicht abgebildet) zu einem digitalen
Signal umgewandelt werden, oder digitalisierte musikalische Daten,
wie zum Beispiel diejenigen einer Musik CD, können direkt als Datei genommen
(gerissen) und geöffnet
werden. Wenn ein digitales Signal, das auf diese Weise empfangen
wird, ein Stereosignal ist, wird es in ein monaurales Signal umgewandelt,
um die weitere Verarbeitung zu vereinfachen.
-
Das
digitale Signal wird in die Sektion zur Bestimmung der Tonleiter-Noten-Intensität 2 eingegeben. Die
Sektion zur Bestimmung der Tonleiter-Noten-Intensität 2 wird
aus Sektionen wie abgebildet in 2 gebildet.
-
Unter
diesen taktet eine Sektion zur Vorverarbeitung einer Wellenform 20 das
akustische Signal, das von der Eingabesektion 1 gesendet
wurde, auf eine Zerlegefrequenz herunter, die der nachfolgenden
Verarbeitung angepasst ist.
-
Die
Rate des Heruntertaktens wird bestimmt durch den Tonumfang der Musikinstrumente,
die zur Bestbestimmung verwendet werden. Insbesondere um die Klänge der
Aufführung
von Rhythmusinstrumenten, die einen großen Tonumfang haben, wie zum
Beispiel Becken und Hi-Hats,
zur Bestbestimmung zu verwenden, ist es notwendig, die Zerlegefrequenz
nach dem Heruntertakten auf eine hohe Frequenz einzustellen. Um hauptsächlich die
Bassnote, die Klänge
von Musikinstrumenten wie zum Beispiel Pauken und kleinen Trommeln
und die Klänge
von Musikinstrumenten, die einen mittleren Tonumfang haben, zur
Bestbestimmung zu verwenden, ist es nicht notwendig, die Zerlegefrequenz
nach dem Heruntertakten auf solch eine hohe Frequenz einzustellen.
-
Wenn
zum Beispiel angenommen wird, dass die höchste zu bestimmende Note A6
ist (C4 dient als das Zentrum „do"), muss die Zerlegefrequenz
nach dem Heruntertakten 3520 Hz oder höher sein, weil die Grundfrequenz
von A6 ungefähr
1760 Hz ist (wenn A4 auf 440 Hz gestimmt wird), und die Nyquist-Frequenz ist
demzufolge 1760 Hz oder höher.
Wenn die ursprüngliche
Zerlegefrequenz 44,1 kHz ist (was für Musik CDs verwendet wird),
muss deshalb die Rate des Heruntertaktens ungefähr ein Zwölftel sein. In diesem Fall
ist die Zerlegefrequenz nach dem Heruntertakten 3675 Hz.
-
Normalerweise
wird bei der Verarbeitung durch Heruntertakten ein Signal durch
einen Tiefpassfilter geschickt, der Komponenten entfernt, die die
Nyquist-Frequenz (1837,5 Hz im vorliegenden Fall), das heißt die Hälfte der
Zerlegefrequenz nach dem Heruntertakten, oder eine höhere Frequenz
haben, und dann werden Daten in dem Signal übersprungen (11 von 12 Momentanwerte
der Wellenform werden im vorliegenden Fall verworfen).
-
Die
Verarbeitung durch Heruntertakten wird auf diese Weise durchgeführt, um
die Zeit zur Berechnung der FFT durch Verminderung der Anzahl der
FFT-Punkte zu vermindern, die benötigt werden, um die gleiche Frequenzauflösung bei
der Berechnung der FFT, die nach der Verarbeitung durch Heruntertakten
durchgeführt werden
soll, zu erhalten.
-
Ein
solches Heruntertakten ist notwendig, wenn eine Klangquelle bereits
mit einer bestimmten Zerlegefrequenz zerlegt wurde, wie dies bei
Musik CDs der Fall ist. Wenn jedoch ein analoges Signal, das von
einem Mikrophon oder einem andern Bauteil in die Eingabesektion 1 eingegeben
wird, durch den A-D Konverter in ein digitales Signal umgewandelt
wird, kann die Sektion zur Vorverarbeitung einer Wellenform 20 ausgelassen
werden, indem die Zerlegefrequenz des A-D Konverters auf die Zerlegefrequenz
nach dem Heruntertakten eingestellt wird.
-
Wenn
das Heruntertakten in der Sektion zur Vorverarbeitung einer Wellenform 20 auf
diese Weise abgeschlossen ist, berechnet eine Sektion zur Berechnung
der FFT 21 die Fouriertransformation des Ausgabesignals
der Sektion zur Vorverarbeitung einer Wellenform 20 in
vorbestimmten Zeitintervallen (Rahmen).
-
Die
FFT-Parameter (Zahl der FFT-Punkte und FFT-Intervallverschiebung)
sollten auf Werte gesetzt werden, die an die Bestbestimmung angepasst
sind. Insbesondere wenn die Zahl der FFT-Punkte erhöht wird, um
die Frequenzauflösung
zu erhöhen,
wird das FFT-Intervall vergrößert und
benötigt
ein längeres
Zeitintervall für
einen FFT-Zyklus, so dass die Zeitauflösung reduziert wird. Diese
Charakteristik der FFT muss berücksichtigt
werden. (Mit anderen Worten ist es für die Bestbestimmung besser,
die Zeitauflösung
zu erhöhen
und die Frequenzauflösung
zu unterdrücken.)
Es gibt eine Methode bei welcher, anstatt eine Wellenform zu benutzen, die
die gleiche Länge
hat wie die Intervalllänge,
Wellenformdaten nur für
einen Teil des Intervalls bestimmt werden und der verbleibende Teil
mit Nullen aufgefüllt
wird, um die Zahl der FFT-Punkte zu erhöhen, ohne die Zeitauflösung zu
unterdrücken.
Allerdings muss die Zahl der Momentanwerte der Wellenform bis zu
einem bestimmten Punkt hoch gesetzt werden, um auch die Intensität einer
tiefen Note korrekt zu bestimmen.
-
Die
oben genannten Punkte sind berücksichtigt
worden. In der Vorrichtung wird die Anzahl der FFT-Punkte auf 512
gesetzt, die FFT-Intervallverschiebung wird auf 32 Momentanwerte
gesetzt (Intervallüberlappung
ist 15/16), und das Auffüllen
mit Nullen wird nicht durchgeführt.
Wenn die Berechnung der FFT mit diesen Einstellungen durchgeführt wird,
ist die Zeitauflösung
ungefähr
8,7 ms, und die Frequenzauflösung
ist ungefähr
7,2 Hz. Eine Zeitauflösung
von 8,7 ms ist ausreichend, weil die Dauer einer Zweiunddreisigstel-Note in
einem Musikstück,
das ein Tempo von 300 Viertelnoten pro Minute hat, 25 ms ist.
-
Die
Berechnung der FFT wird auf diese Weise in jedem Rahmenintervall
durchgeführt;
die Quadrate des Realteils und des Imaginärteils des Ergebnisses der
FFT werden addiert und aus dem Ergebnis wird die Quadratwurzel gezogen,
um das Intensitätsspektrum
zu berechnen; und das Intensitätsspektrum
wird an eine Sektion zur Detektion der Intensität 22 gesandt.
-
Die
Sektion zur Detektion der Intensität 22 berechnet die
Intensität
jeder Note der Tonleiter aus dem Intensitätsspektrum, das in der Sektion
zur Berechnung der FFT 21 berechnet wurde. Die FFT berechnet
nur die Intensität
von Frequenzen, die ganzzahlige Vielfache des Wertes sind, der erhalten
wird, wenn die Zerlegefrequenz durch die Anzahl der FFT-Punkte geteilt
wird. Deshalb wird der folgende Prozess durchgeführt, um die Intensität jeder
Note der Tonleiter aus dem Intensitätsspektrum zu bestimmen. Die
Intensität
des Spektrums, welches die maximale Intensität unter den Intensitätsspektren
hat, die den Frequenzen entsprechen, die in den Bereich von 50 Hundertstel
(100 Hundertstel entsprechen einem Halbton) unterhalb und oberhalb der
Grundfrequenz jeder Note (von C1 bis A6) der Tonleiter fallen, wird
als Intensität
der Note gesetzt.
-
Wenn
die Intensitäten
aller Noten der Tonleiter bestimmt wurden, werden sie in einem Puffer
gespeichert. Die Position zum Lesen der Wellenform wird um ein vorbestimmtes
Zeitintervall weiter geschoben (ein Rahmen, der im obigen Fall 32 Momentanwerten
entspricht), und der Prozess in der Sektion zur Berechnung der FFT 21 und
der Sektion zur Bestimmung der Intensität 22 werden erneut
durchgeführt.
Diese Abfolge von Schritten wird wiederholt bis die Position zum
Lesen der Wellenform das Ende der Wellenform erreicht.
-
Mit
der oben beschriebenen Verarbeitung wird die Intensität jeder
Note der Tonleiter für
jedes vorbestimmte Zeitintervall für das akustische Signal, das
in die Eingabesektion 1 eingegeben wird, im Puffer 23 gespeichert.
-
Als
nächstes
wird die Struktur der Sektion zur Bestbestimmung 3, die
in 1 gezeigt ist, beschrieben. Die Sektion zur Bestbestimmung 3 führt eine
Verarbeitung entsprechend dem in 3 gezeigten
Verfahren durch.
-
Die
Sektion zur Bestbestimmung 3 bestimmt ein durchschnittliches
Bestintervall (das heißt
Tempo) und die Position der Beats basierend auf einer Änderung
der Intensität
jeder Note der Tonleiter für
jedes Rahmenintervall, wobei die Intensität von der Sektion zur Bestimmung
der Tonleiter-Noten-Intensität 2 ausgegeben wird.
Die Sektion zur Bestbestimmung 3 berechnet zuerst, in Schritt
S100, die Summe inkrementeller Werte der Intensitäten der
Noten in der Tonleiter (die Summe der inkrementellen Werte der Intensität von dem
vorangegangenen Rahmen für
alle Noten der Tonleiter; wenn die Intensität von dem vorangegangnen Rahmen reduziert
wird, wird Null addiert).
-
Wenn
die Intensität
der i-ten Note der Tonleiter zur Rahmenzeit „t" Li(t) genannt
wird, ist ein inkrementeller Wert Laddi(t)
der Intensität
der i-ten Note wie in der folgenden Formel 1 gezeigt. Die Summe
der inkrementellen Werte der Intensität aller Noten der Tonleiter
L(t) zur Rahmenzeit „t" kann durch die folgende
Formel 2 berechnet werden, in der T die gesamte Anzahl von Noten
in der Tonleiter anzeigt.
-
-
-
Der
Wert der Summe L(t) zeigt das Ausmaß der Änderung aller Noten in jedem
Rahmenintervall an. Dieser Wert wird plötzlich groß, wenn Noten zu erklingen
beginnen, und wird größer, wenn
die Zahl der Noten, die zur gleichen Zeit zu erklingen beginnen,
größer wird.
Da Noten in vielen Musikstücken
an der Position eines Beats zu erklingen beginnen, ist es sehr wahrscheinlich,
dass die Position, an der dieser Wert groß wird, die Position eines
Beats ist.
-
Als
Beispiel zeigt 4 die Wellenform eines Teils
eines Musikstücks,
die Intensität
jeder Note der Tonleiter und die Summe der inkrementellen Werte
der Intensität
der Noten der Tonleiter. Die obere Zeile zeigt die Wellenform, die
mittlere Zeile zeigt die Intensität jeder Note der Tonleiter
für jedes
Rahmenintervall mit schwarzer und weißer Abstufung (in dieser Abbildung
im Bereich von C1 bis A6, wobei eine tiefere Note an tieferer Stelle
steht und eine höhere
Note an höherer
Stelle steht) und die untere Reihe zeigt die Summe der inkrementellen
Werte der Intensität
der Noten für
jedes Rahmenintervall. Da die Intensität jeder Note der Tonleiter,
die in dieser Abbildung gezeigt wird, von der Sektion zur Bestimmung
der Tonleiter-Noten-Intensität 2 ausgegeben
wird, ist die Frequenzauflösung
ungefähr
7,2 Hz; Die Intensitäten
einiger Noten der Tonleiter (Gis2 und tiefer) können nicht berechnet werden
und werden nicht gezeigt. Obwohl die Intensitäten einiger tiefer Noten nicht
gemessen werden können,
gibt es kein Problem, weil der Zweck ist, Beats zu bestimmen.
-
Wie
gezeigt in der unteren Reihe der Abbildung, hat die Summe der inkrementellen
Werte der Intensität
der Noten der Tonleiter periodische Spitzen. Die Positionen dieser
periodischen Spitzen sind diejenigen der Beats.
-
Um
die Position von Beats zu erhalten, holt die Sektion zur Bestbestimmung 3 zuerst
die Zeitdifferenz zwischen diesen periodischen Spitzen, das heißt das durchschnittliche
Bestintervall, ein. Das durchschnittliche Bestintervall kann aus
der Autokorrelation der Summe der inkrementellen Werte der Intensität der Noten
der Tonleiter erhalten werden (in Schritt S102 in 3).
-
Die
Autokorrelation Φ(τ) der Summe
L(t) der inkrementellen Werte der Intensität der Noten der Tonleiter zur
Rahmenzeit „t" ist durch die folgende
Formel 3 gegeben: Formel
3
in der N die gesamte Anzahl der Rahmen ist und τ eine Zeitverzögerung ist.
-
5 zeigt
das Konzept zur Berechnung der Autokorrelation. Wie in der Abbildung
gezeigt wird, wird der Wert von Φ(τ) groß, wenn
die Zeitverzögerung τ ein ganzzahliges
Vielfaches der Periode der Spitzen von L(t) ist. Deshalb wird das
Tempo des Musikstücks
erhalten, wenn der maximale Wert von Φ(τ) in einem vorgeschriebenen
Bereich von „τ" bestimmt wird.
-
Der
Bereich von „τ", in dem die Autokorrelation
erhalten wird, muss verändert
werden entsprechend einem erwarteten Bereich des Tempos des Musikstücks. Wenn
zum Beispiel die Berechnung in einem Bereich von 30 bis 300 Viertelnoten
pro Minute gemäß Metronombezeichnung
durchgeführt
wird, ist der Bereich, in dem die Autokorrelation berechnet wird,
von 0,2 bis 2 Sekunden. Die Umrechnung von Zeit (Sekunden) in Rahmen
wird durch die folgende Formel 4 wiedergegeben. Formel
4
-
Das
Bestintervall kann auf „τ" gesetzt werden,
wo die Autokorrelation Φ(τ) ein Maximum
im Bereich hat. Da allerdings „τ" nicht notwendigerweise
für alle
Musikstücke
das Bestintervall ist, wenn die Autokorrelation ein Maximum im Bereich
hat, ist es erwünscht,
dass Kandidaten für
das Bestintervall aus Werten von „τ" erhalten werden, für die die Autokorrelation ein
lokales Maximum im Bereich hat (in Schritt S104 in 3),
und dass der Anwender gebeten wird, das Bestintervall aus diesen
mehreren Kandidaten zu bestimmen (in Schritt S106 in 3).
-
Wenn
das Bestintervall auf diese Weise bestimmt wird (das bestimmte Bestintervall
wird "τmax" genannt), wird die
Position des Anfangsbeats zuerst bestimmt.
-
Eine
Methode zur Bestimmung des Anfangsbeats wird mit Bezug auf
6 beschrieben
werden. In
6 zeigt die obere Zeile L(t),
die Summe der inkrementellen Werte der Intensität der Noten der Tonleiter zur Rahmenzeit „t", und die untere
Zeile zeigt M(t), eine Funktion die einen Wert bei ganzzahligen
Vielfachen des bestimmten Bestintervalls „τ
max" hat. Die Funktion
M(t) wird durch die folgende Formel 5 wiedergegeben. Formel
5
-
Die
Kreuzkorrelation von L(t) und M(t) wird berechnet, wobei die Funktion
M(t) in einem Bereich von 0 bis „τmax" – 1 verschoben wird.
-
Die
Kreuzkorrelation r(s) kann aus den Eigenschaften der Funktion M(t)
durch folgende Formel 6 berechnet werden. Formel
6
-
In
diesem Fall muss „n" angemessen festgelegt
werden in entsprechend der Länge
eines oberen klangfreien Teils („n” = 10 in dem in 6 gezeigten
Fall).
-
Die
Kreuzkorrelation r(s) wird in dem Bereich bestimmt, in dem „s" von 0 auf „τmax" – 1 verändert wird. Die Position des
Anfangsbeats ist in dem s-ten Rahmen, wo s zu einem Maximum von
r(s) führt.
-
Wenn
die Position des Anfangsbeats einmal bestimmt ist, werden die nachfolgenden
Bestpositionen eine nach der anderen bestimmt (in Schritt S108 in 3).
-
Eine
Methode dafür
wird mit Bezug auf 7 beschrieben werden. Es wird
angenommen dass die Position des Anfangsbeats an der dreieckigen
Markierung in 7 gefunden wurde. Die zweite
Bestposition wird bestimmt als Position, wo die Kreuzkorrelation
zwischen L(t) und M(t) maximal wird in der Nähe einer vorläufigen Bestposition,
die von der Position des Anfangsbeats um das Bestintervall „τmax" entfernt ist. Mit
anderen Worten, wenn die Position des Anfangsbeats b0 genannt
wird, wird der Wert von „s" erhalten, der zu
einem Maximum von r(s) in der folgenden Formel 7 führt. In
dieser Formel, zeigt „s" eine Verschiebung
von der vorläufigen
Bestposition an und ist eine ganze Zahl in dem Bereich, der in Formel
7 gezeigt wird. „F" ist ein Fluktuationsparameter;
es ist passend, „F" auf ungefähr 0,1 zu
setzen, aber „F" kann auf eine größeren Wert
gesetzt werden für
ein Musikstück,
bei dem die Tempofluktuation groß ist. „n" muss auf ungefähr 5 gesetzt werden.
-
In
der Formel ist „k" ein Koeffizient
der entsprechend dem Wert von „s" verändert wird
und von dem angenommen wird, dass er eine Normalverteilung wie die
in
8 gezeigte hat. Formel
7
-
Wenn
der Wert von „s", der zu einem Maximum
von r(s) führt,
gefunden wurde, wird die zweite Beatposition b1 durch
die folgende Formel 8 berechnet.
-
Formel 8
-
-
Die
dritte Bestposition und weitere Beatpositionen können auf die gleiche Weise
erhalten werden.
-
In
einem Musikstück,
in dem sich das Tempo kaum verändert,
können
Beatpositionen bis zum Ende des Musikstücks auf diese Weise erhalten
werden. In wirklichen Aufführungen
jedoch fluktuiert das Tempo in gewissem Maße in einigen Fallen oder wird
in manchen Teilen langsam.
-
Um
solche Tempofluktuationen zu handhaben, kann die folgende Methode
verwendet werden.
-
Bei
dieser Methode wird die Funktion M(t), die in 7 gezeigt
wird, wie in 9 gezeigt verändert. In 9,
zeigt Zeile 1 die oben beschriebenen Methode an, das heißt,
τ1 = τ2 = τ3 = τ4 = τmax
wobei τ1, τ2, τ3 und τ4 für die zeitlichen
Abstände
zwischen Pulsen vom Anfang an stehen, wie dies in der Abbildung
gezeigt wird. Zeile 2 zeigt, dass die Abstände τ1 bis τ4 in
gleichem Maße
größer oder
kleiner gemacht werden, das heißt,
τ1 = τ2 = τ3 = τ4 = τmax +
s(-τmax × F ≤ s ≤ τmax × F).
-
Mit
dieser Vorgehensweise können
Beatpositionen erhalten werden für
einen Fall, bei dem sich das Tempo plötzlich ändert. Zeile 3 steht für ritardando
(rit.: allmählich
langsamer) oder für
accelerando (accel.: allmählich
schneller) und die Zeitabstände
zwischen Pulsen werden wie folgt berechnet:
τ1 = τmax
τ2 = τmax +
1 × S
τ3 = τmax +
2 × s
τ4= τmax +
4 × s(-τmax × F ≤ s ≤ τmax × F).
-
Die
Koeffizienten, die hier verwendet wurden, 1, 2 und 4 sind nur Beispiele
und können
entsprechend der Größe eines
Tempowechsels verändert
werden. Zeile 4 zeigt, dass die Beatposition, die gerade erhalten werden
soll, auf irgendeine der fünf
Pulspositionen gesetzt wird für
rit. oder accel. wie gezeigt in Zeile 3.
-
Wenn
all diese kombiniert werden und die Kreuzkorrelation zwischen L(t)
und M(t) erhalten wird, können
Beatpositionen aus der maximalen Kreuzkorrelation sogar für ein Musikstück bestimmt
werden, das ein fluktuierendes Tempo hat. Wenn Zeile 2 oder Zeile
3 genutzt wird, muss auch der Wert des Koeffizienten „k", der zur Berechnung
der Korrelation genutzt wird, entsprechend dem Wert von „s" verändert werden.
-
Die
Stärke
der fünf
Pulse wird gegenwärtig
auf den gleichen Wert gesetzt. Die Summe der inkrementellen Werte
der Intensität
der Noten der Tonleiter kann an der Position erhöht werden, an der der Beat
erhalten wird, indem die Stärke
nur des Pulses an der Position des Beats (wie gezeigt durch eine
vorläufige
Beatposition in 9) auf einen größeren Wert
gesetzt wird oder indem die Stärken
auf einen allmählich
kleineren Wert gesetzt werden, wenn die Pulse weiter entfernt von
der Position des Beats lokalisiert werden (wie gezeigt in Zeile
5 in 9).
-
Wenn
die Position eines jeden Beats in der oben beschriebenen Weise bestimmt
wurde, werden die Ergebnisse im Puffer 30 gespeichert.
Zur gleichen Zeit können
die Resultate angezeigt werden, so dass der Anwender sie prüfen kann
und sie korrigieren kann, wenn sie falsch sind.
-
10 zeigt
ein Beispiel eines Befundes der Ergebnisse einer Bestbestimmung
am Bildschirm. Dreieckige Markierungen zeigen die Positionen von
bestimmten Beats.
-
Wenn
ein „Abspielen" Knopf gedrückt wird,
wird das laufende musikalische akustische Signal einer D-A Konvertierung
unterworfen und durch einen Lautsprecher oder Ähnliches wiedergegeben. Die
aktuelle Wiedergabeposition wird durch einen Abspielpositionszeiger,
wie zum Beispiel der vertikalen Linie in der Abbildung, angezeigt
und der Anwender kann auf Fehler bei den Positionen der Bestbestimmung überprüfen, während er
der Musik zuhört.
Wenn darüber
hinaus ein Klang wie der eines Metronoms an den Zeiten der Beatpositionen
zusätzlich
zur Wiedergabe der ursprünglichen
Wellenform wiedergegeben wird, kann die Überprüfung nicht nur visuell sondern
auch akustisch durchgeführt
werden, was die Erkennung von Bestimmungsfehlern erleichtert. Als
Methode zur Wiedergabe des Klangs eines Metronoms kann zum Beispiel
eine MIDI Einheit verwendet werden.
-
Die
Position eines bestimmten Beats wird durch Drücken einer „korrigiere Beat Position" Taste korrigiert.
Wenn diese Taste gedrückt
wird, erscheint ein Fadenkreuz Cursor auf dem Bildschirm. Wenn die
Position des Startbeats fälschlich
bestimmt wurde, werden alle Beatpositionen gelöscht ab einer Position mit
einem bestimmten Abstand (zum Beispiel die Hälfte von τmax)
vor der Position, wo die Maus geklickt wurde, die Position wo die
Maus geklickt wurde, wird als vorläufige Beatposition gesetzt
und nachfolgende Beatpositionen werden erneut bestimmt, wenn der
Cursor zur korrekten Position bewegt wird und die Maus geklickt
wird.
-
Als
Nächstes
werden die Bestimmung eines Metrums und eines Takts beschrieben.
Die Beatpositionen werden durch das oben beschriebene Verfahren
bestimmt. Dann wird das Ausmaß der Änderung
aller Noten für
jeden Beat bestimmt. Das Ausmaß einer
Klangänderung
wird für
jeden Beat aus der Intensität
jeder Note der Tonleiter für
jedes Rahmeninterval berechnet, die von der Sektion zur Bestimmung
der Tonleiter-Noten-Intensität 2 ausgegeben
wird.
-
Wenn
die Rahmennummer des j-ten Beats bj genannt
wird, und die Rahmen der Beats unmittelbar davor und danach bj-1 und bj+i genannt
werden, werden der Durchschnitt der Intensitäten jeder Note der Tonleiter von
den Rahmen bj-1 bis bj-1
und der Durchschnitt der Intensitäten jeder Note der Tonleiter
von den Rahmen bj bis bj+1-1
berechnet, um den inkrementellen Wert zu bestimmen; das Ausmaß der Änderung
jeder Note der Tonleiter wird für
jeden Beat aus dem inkrementellen Wert erhalten; und die Summe der
Ausmaße
der Änderungen
der Noten der Tonleiter, welche gleich dem Ausmaß der Änderung aller Noten für den j-ten
Beat ist, wird berechnet.
-
Mit
anderen Worten, weil der Durchschnitt der Intensitäten der
i-ten Note der Tonleiter für
den j-ten Beat, L
avgi(j), durch die folgende
Formel 9 ausgedrückt
wird, wird das Ausmaß der Änderung
der i-ten Note der Tonleiter für
den j-ten Beat, B
addi(j), durch die folgende
Formel 10 ausgedrückt,
wenn die Intensität
der i-ten Note der Tonleiter zur Rahmenzeit „t" L
i(t) genannt
wird. Formel
9
Formel
10
-
Deshalb
wird das Ausmaß der Änderung
aller Noten für
den j-ten Beat, B(t), durch die folgende Formel 11 ausgedrückt, in
der T die gesamte Anzahl an Noten der Tonleiter ausdrückt. Formel
11
-
In 11 gibt
die untere Zeile das Ausmaß einer
Klangänderung
für jeden
Beat an. Aus diesem Ausmaß einer
Klangänderung
für jeden
Beat werden das Metrum und die Position des ersten Beats erhalten.
-
Das
Metrum wird aus der Autokorrelation des Ausmaßes einer Klangänderung
für jeden
Beat erhalten. Im Allgemeinen wird angenommen, dass Musikstücke eine
Klangänderung
am ersten Beat aufweisen. Deshalb kann das Metrum aus der Autokorrelation
des Ausmaßes
einer Klangänderung
für jeden
Beat erhalten werden. Wenn zum Beispiel die folgende Formel 12 verwendet
wird, wird die Autokorrelation Φ(τ) des Ausmaßes einer
Klangänderung
B(j) für
jeden Beat erhalten, indem die Verzögerung „τ" im Bereich von 2 bis 4 verändert wird,
und die Verzögerung „τ", die zu einem Maximum
der Autokorrelation Φ(τ) führt, als
Anzahl an Beats pro Zeitmaß verwendet
wird: Formel
12
wobei N die gesamte Zahl der Beats anzeigt, die
Autokorrelation Φ(τ) des Ausmaßes einer
Klangänderung B(j)
für jeden
Beat erhalten wird, indem die Verzögerung „τ" im Bereich von 2 bis 4 verändert wird,
und die Verzögerung „τ", die zu einem Maximum
der Autokorrelation Φ(τ) führt, als
Anzahl an Beats pro Zeitmaß verwendet
wird.
-
Als
nächstes
wird der erste Beat erhalten. Die Position, an der das Ausmaß einer
Klangänderung
B(j) für
jeden Beat maximal ist, wird als der erste Beat gesetzt. Wenn, mit
andern Worten, der Wert von „τ", der zu einem Maximum
von Φ(τ) führt, „τ
max" genannt wird, und
der Wert von „k", der zu einem Maximum
von X(k) führt,
das in der folgenden Formel 13 gezeigt wird, „k
max" genannt wird, zeigt
der k
max-te Beat die Position des ersten
Beat, und die Positionen, die angezeigt werden, indem „τ
max" sukzessive zu dem
k
max-ten Beat addiert wird, sind die Positionen
nachfolgender Beats: Formel
13
wobei n
max das maximale „n" ist, vorausgesetzt,
dass τ
max × n
+ k < N.
-
Wenn
das Metrum und die Position des ersten Beats (die Position eines
Taktstrichs) auf die oben beschriebene Weise bestimmt wurden, werden
die Ergebnisse in einem Puffer 40 gespeichert. Zur gleichen
Zeit ist es wünschenswert,
dass die Ergebnisse auf dem Bildschirm angezeigt werden, um es dem
Anwender zu ermöglichen,
sie zu andern. Da diese Methode keine Musikstücke beherrscht, die ein veränderliches
Metrum haben, ist es erforderlich, den Anwender zu fragen, eine
Position festzulegen, an der das Metrum verändert wird.
-
Mit
der genannten Struktur kann aus dem akustischen Signal einer Aufführung eines
Musikstücks durch
Menschen, das ein fluktuierendes Tempo hat, das durchschnittliche
Tempo des gesamten Musikstücks und
die korrekten Positionen der Beats wie auch das Metrum des Musikstücks und
die Position des ersten Beats bestimmt werden.
-
Erste Ausführungsform
-
12 ist
ein Blockdiagramm der Vorrichtung zur Bestimmung von Akkordnamen
gemäß der ersten Ausführungsform
der vorliegenden Erfindung. In der Abbildung sind die Strukturen
einer Sektion zur Bestbestimmung und einer Sektion zur Taktbestimmung
im Wesentlichen dieselben wie oben beschrieben. Da die Strukturen
eines Teils zur Tempobestimmung und eines Teils zur Akkordbestimmung
teilweise verschieden sind von den oben beschriebenen, werden diese
im Folgenden ohne mathematische Formeln beschrieben, wobei einige
Teile bereits oben erwähnt
wurden.
-
Die
Vorrichtung zur Bestimmung von Akkordnamen in der Abbildung umfasst
eine Eingabesektion 1 zum Empfang eines akustischen Signals;
eine Sektion zur Bestimmung der Tonleiter-Noten-Intensität 2 zur Bestbestimmung
zur Anwendung einer FFT auf das empfangene akustische Signal in
vorbestimmten Zeitintervallen (Rahmen) durch die Verwendung von
Parametern, die auf die Bestimmung des Beats angepasst sind, und
zum Erhalt der Intensität
jeder Note einer Tonleiter in jedem Rahmenintervall aus dem erhaltenen
Intensitätsspektrum;
eine Sektion zur Bestbestimmung 3 zur Aufsummierung eines
inkrementellen Wertes der Intensität jeder Note der Tonleiter
in jedem Rahmenintervall für
alle Noten der Tonleiter, um die Summe der inkrementellen Werte
der Intensitäten
zu erhalten, die das Ausmaß der Änderung
aller Noten in jedem Rahmenintervall anzeigt, und zur Bestimmung
eines durchschnittlichen Beat Intervalls und der Position jedes
Beats aus der Summe der inkrementellen Werte der Intensitäten; eine
Sektion zur Bestimmung des Takts 4 zur Berechnung der durchschnittlichen
Intensität
jeder Note der Tonleiter für
jeden Beat, zum Aufsummieren eines inkrementellen Wertes der durchschnittlichen
Intensität
jeder Note der Tonleiter für
jeden Beat für
alle Noten, um einen Wert zu erhalten, der das Ausmaß der Änderung
aller Noten eines jeden Beats anzeigt, und zur Bestimmung eines
Metrums und der Position eines Taktstrichs aus dem Wert, der das
Ausmaß der Änderung
aller Noten eines jeden Beats anzeigt; eine Sektion zur Bestimmung
der Tonleiter-Noten-Intensität 5 zur
Akkordbestimmung zur Anwendung einer FFT auf das empfangene akustische
Signal in vorbestimmten Zeitintervallen (Rahmen), die verschieden
sind von denjenigen zur Bestimmung des Beats, die oben beschrieben
wurden, durch die Verwendung von Parameter, die auf die Bestimmung
des Akkords angepasst sind, und zum Erhalt der Intensität jeder
Note der Tonleiter in jedem Rahmenintervall aus dem erhaltenen Intensitätsspektrum;
eine Sektion zur Bestimmung der Bassnoten 6 zur Festsetzung
verschiedener Detektionszonen in jedem Takt und zur Bestimmung einer
Bassnote unter der bestimmten Intensität jeder Note der Tonleiter
in jeder Detektionszone aus der Intensität einer tiefen Note der Tonleiter
in einem Abschnitt, der einem ersten Beat in jeder der Detektionszonen
entspricht; eine erste Sektion zur Bestimmung der Taktunterteilung 7 zur
Feststellung, ob die Bassnote geändert
wird abhängig
davon, ob die bestimmte Bassnote in jeder der Detektionszonen verschieden
ist, und zur Feststellung, ob es nötig ist, den Takt in eine Vielzahl
von Abschnitten zu unterteilen, abhängig davon, ob die Bassnote
geändert
wird; eine zweite Sektion zur Bestimmung der Taktunterteilung 8 zur
Festsetzung verschiedener Akkord-Bestimmungszonen
im Takt, zur Mittelung der Intensität jeder Note der Tonleiter für jedes
Rahmenintervall in jeder der Akkord-Bestimmungszonen in einem Akkord-Bestimmungsbereich,
der als Bereich spezifiziert ist, in dem Akkorde überwiegend
gespielt werden, zur Aufsummierung der gemittelten Intensität jeder
Note der Tonleiter für
jede von 12 Tonlagen-Noten der Tonleiter, zum Teilen der Summe für jede der
12 Tonlagen-Noten durch die Zahl der aufsummierten Intensitäten, um
die durchschnittliche Intensität
jeder der 12 Tonlagen-Noten
der Tonleiter zu erhalten, zur Neuanordnung der Intensitäten nach
absteigender Stärke,
zur Bestimmung, ob ein Akkord geändert
wird, abhängig
davon, ob C Noten oder mehr der M stärksten Noten der Tonleiter,
wobei M drei oder größer als
drei ist, in einer Detektionszone enthalten sind in den N stärksten Noten
der Tonleiter, wobei N drei oder größer als drei ist, in der unmittelbar
davor gelegenen Detektionszone, und zur Bestimmung, ob es notwendig
ist, den Takt in eine Vielzahl von Abschnitten zu unterteilen entsprechend
dem Ausmaß der Änderung
des Akkords; und eine Sektion zur Bestimmung des Akkordnamens 9 zur
Bestimmung, wenn die erste Sektion zur Bestimmung der Taktunterteilung 7 und/oder
die zweiten Sektion zur Bestimmung der Taktunterteilung 8 feststellen,
dass es notwendig ist, den Takt in verschiedene Akkord-Bestimmungszonen
zu unterteilen, eines Akkordnamens in jeder der Akkord-Bestimmungszonen
entsprechend der Bassnote und der Intensität jeder Note der Tonleiter
in jeder der Akkord-Bestimmungszonen, und zur Bestimmung, wenn die
erste Sektion zur Bestimmung der Taktunterteilung 7 und
die erste und zweite Sektion zur Bestimmung der Taktunterteilung 8 feststellen,
dass es nicht notwendig ist, den Takt in verschiedene Akkord-Bestimmungszonen
zu unterteilen, eines Akkordnamens in dem Takt entsprechend der
Bassnote und der Intensität
jeder Note der Tonleiter in dem Takt.
-
Die
Eingabesektion 1 empfängt
ein musikalisches akustisches Signal, von dem der Akkord bestimmt werden
soll. Da dessen grundlegende Struktur dieselbe ist wie die Struktur
der Eingabesektion 1 der vormals entwickelten Vorrichtung,
wird eine detaillierte Beschreibung davon hier weggelassen. Wenn
der Klang einer Stimme, der normalerweise im Zentrum lokalisiert
ist, die nachfolgende Akkordbestimmung stört, kann die Wellenform des
rechten Kanals von der Wellenform des linken Kanals abgezogen werden,
um den Klang der Stimme zu löschen.
-
Ein
digitales Ausgabesignal der Eingabesektion 1 wird in die
Sektion zur Bestimmung der Tonleiter-Noten-Intensität 2 zur
Beatbestimmung eingegeben und in die Sektion zur Bestimmung der
Tonleiter-Noten-Intensität 5 zur
Akkordbestimmung. Da jede dieser Sektionen zur Bestimmung der Tonleiter-Noten-Intensität von den
Sektionen wie gezeigt in 2 gebildet werden und exakt
die gleiche Struktur haben, kann eine einzige Sektion zur Bestimmung
der Tonleiter-Noten-Intensität
für beide
Zwecke verwendet werden, wobei nur die Parameter geändert werden.
-
Eine
Sektion zur Vorverarbeitung einer Wellenform 20, die als
Komponente davon verwendet wird, hat die gleiche Struktur wie oben
beschrieben und taktet das akustische Signal, das von der Eingabesektion 1 gesendet
wird, auf eine Zerlegefrequenz herunter, die an die nachfolgende
Verarbeitung angepasst ist. Die Zerlegefrequenz nach dem Heruntertakten,
das heißt
die Rate des Heruntertaktens, kann zwischen Bestbestimmung und Akkordbestimmung
geändert
werden oder sie kann gleich sein, um die Zeit zum Heruntertakten
zu sparen.
-
Bei
der Bestbestimmung wird die Rate des Heruntertaktens entsprechend
einem Bereich, der für
die Bestbestimmung genutzt wird, festgelegt. Um die Klänge der
Aufführung
von Rhythmusinstrumenten, die einen großen Tonumfang haben, wie zum
Beispiel Becken und Hi-Hats,
zur Bestbestimmung zu verwenden, ist es notwendig, die Zerlegefrequenz
nach dem Heruntertakten auf eine hohe Frequenz einzustellen. Um
hauptsächlich
die Bassnote, die Klänge
von Musikinstrumenten wie zum Beispiel Pauken und kleinen Trommeln
und die Klänge
von Musikinstrumenten, die einen mittleren Tonumfang haben, zur
Bestbestimmung zu verwenden, kann die gleiche Rate des Heruntertaktens
verwendet werden wie diejenige in der folgenden Akkordbestimmung.
-
Die
Rate des Heruntertaktens, die in der Sektion zur Vorverarbeitung
einer Wellenform zur Akkordbestimmung verwendet wird, wird entsprechend
einem Bereich zur Akkordbestimmung verändert. Der Bereich zur Akkordbestimmung
ist ein Bereich, der in der Sektion zur Bestimmung des Akkordnamens
zur Akkordbestimmung verwendet wird. Wenn zum Beispiel der Bereich
zur Akkordbestimmung der Bereich von C3 bis A6 ist (C4 dient als
das Zentrum muss die Zerlegefrequenz nach dem Heruntertakten 3520
Hz oder höher
sein, weil die Grundfrequenz von A6 ungefähr 1760 Hz ist (wenn A4 auf
440 Hz gestimmt wird), und die Nyquist-Frequenz ist demzufolge 1760
Hz oder höher.
Wenn die ursprüngliche
Zerlegefrequenz 44,1 kHz ist (was für Musik CDs verwendet wird),
muss deshalb die Rate des Heruntertaktens ungefähr ein Zwölftel sein. In diesem Fall
ist die Zerlegefrequenz nach dem Heruntertakten 3675 Hz.
-
Normalerweise
wird bei der Verarbeitung durch Heruntertakten ein Signal durch
einen Tiefpassfilter geschickt, der Komponenten entfernt, die die
Nyquist-Frequenz (1837,5 Hz im vorliegenden Fall), das heißt die Hälfte der
Zerlegefrequenz nach dem Heruntertakten, oder eine höhere Frequenz
haben, und dann werden Daten in dem Signal übersprungen (11 von 12 Momentanwerte
der Wellenform werden im vorliegenden Fall verworfen). Der selbe
Grund ist gegeben wie der oben beschriebene.
-
Wenn
das Heruntertakten in der Sektion zur Vorverarbeitung einer Wellenform 20 auf
diese Weise abgeschlossen ist, berechnet eine Sektion zur Berechnung
der FFT 21 die Fouriertransformation des Ausgabesignals
der Sektion zur Vorverarbeitung einer Wellenform in vorbestimmten
Zeitintervallen.
-
Die
FFT-Parameter (Zahl der FFT-Punkte und FFT-Intervallverschiebung)
werden für
die Beatbestimmung und für
die Akkordbestimmung auf verschiedene Werte gesetzt. Wenn die Zahl
der FFT-Punkte erhöht wird,
um die Frequenzauflösung
zu erhöhen,
wird das FFT-Intervall vergrößert, um
ein längeres
Zeitintervall für
einen FFT-Zyklus zu verwenden, so dass die Zeitauflösung reduziert
wird. Diese Charakteristik der FFT muss berücksichtigt werden. (Mit anderen
Worten ist es für
die Bestbestimmung besser, die Zeitauflösung zu erhöhen und die Frequenzauflösung zu
unterdrücken.)
Es gibt eine Methode bei welcher, anstatt eine Wellenform zu benutzen,
die die gleiche Länge
hat wie die Intervalllänge,
Wellenformdaten nur für
einen Teil des Intervalls bestimmt werden und der verbleibende Teil
mit Nullen aufgefüllt
wird, um die Zahl der FFT-Punkte zu erhöhen, ohne die Zeitauflösung zu
unterdrücken.
Allerdings muss im Fall der vorliegenden Ausführungsform die Zahl der Momentanwerte
der Wellenform bis zu einem bestimmten Punkt hoch gesetzt werden,
um auch die Intensität
einer tiefen Note korrekt zu bestimmen.
-
Die
oben genannten Punkte sind berücksichtigt
worden. Bei der vorliegenden Ausführungsform wird zur Bestbestimmung
die Anzahl der FFT-Punkte auf 512 gesetzt, die Intervallverschiebung
wird auf 32 Momentanwerte gesetzt (Intervallüberlappung ist 15/16), und
das Auffüllen
mit Nullen wird nicht durchgeführt;
und bei der Akkordbestimmung wird die Anzahl der FFT-Punkte auf
8192 gesetzt, die Intervallverschiebung wird auf 128 Momentanwerte
gesetzt (Intervallüberlappung
ist 63/64), und 1024 Momentanwerte der Wellenform werden in einem
FFT-Zyklus verwendet. Wenn die Berechnung der FFT mit diesen Einstellungen
durchgeführt wird,
ist die Zeitauflösung
ungefähr
8,7 ms und die Frequenzauflösung
ist ungefähr
7,2 Hz bei der Bestbestimmung; und die Zeitauflösung ist ungefähr 35 ms
und die Frequenzauflösung
ist ungefähr
0,4 Hz bei der Akkordbestimmung. Da jede Note der Tonleiter, von
der die Intensität
erhalten werden soll, in den Bereich von C1 bis A6 fällt, ist
eine Frequenzauflösung
von ungefähr
0,4 Hz bei der Akkordbestimmung ausreichend, weil der kleinste Frequenzunterschied
in der Grundfrequenz, der zwischen C1 und Cis1 auftritt, ungefähr 1,9 Hz
ist. Eine Zeitauflösung
von 8,7 ms bei der Bestbestimmung ist ausreichend, weil die Dauer
einer Zweiunddreisigstel-Note in einem Musikstück, das ein Tempo von 300 Viertelnoten
pro Minute hat, 25 ms ist.
-
Die
Berechnung der FFT wird auf diese Weise in jedem Rahmenintervall
durchgeführt;
die Quadrate des Realteils und des Imaginärteils des Ergebnisses der
FFT werden addiert und aus dem Ergebnis wird die Quadratwurzel gezogen,
um das Intensitätsspektrum
zu berechnen; und das Intensitätsspektrum
wird an eine Sektion zur Detektion der Intensität 22 gesandt.
-
Die
Sektion zur Detektion der Intensität 22 berechnet die
Intensität
jeder Note der Tonleiter aus dem Intensitätsspektrum, das in der Sektion
zur Berechnung der FFT 21 berechnet wurde. Die FFT berechnet
nur die Intensität
von Frequenzen, die ganzzahlige Vielfache des Wertes sind, der erhalten
wird, wenn die Zerlegefrequenz durch die Anzahl der FFT-Punkte geteilt
wird. Deshalb wird der gleiche Prozess wie oben beschrieben durchgeführt, um
die Intensität
jeder Note der Tonleiter aus dem Intensitätsspektrum zu bestimmen. Insbesondere
wird die Intensität
des Spektrums, welches die maximale Intensität unter den Intensitätsspektren hat,
die den Frequenzen entsprechen, die in den Bereich von 50 Hundertstel
(100 Hundertstel entsprechen einem Halbton) unterhalb und oberhalb
der Grundfrequenz jeder Note (von C1 bis A6) der Tonleiter fallen,
als Intensität
der Note gesetzt.
-
Wenn
die Intensitäten
aller Noten der Tonleiter bestimmt wurden, werden sie in Puffer
gespeichert. Die Position zum Lesen der Wellenform wird um ein vorbestimmtes
Zeitintervall weiter geschoben (ein Rahmen, der im vorhergehenden
Fall 32 Momentanwerten für die Bestbestimmung entspricht
und der 128 Momentanwerten für
die Akkordbestimmung entspricht), und der Prozess in der Sektion
zur Berechnung der FFT 21 und der Sektion zur Bestimmung
der Intensität 22 werden
erneut durchgeführt.
Diese Abfolge von Schritten wird wiederholt bis die Position zum
Lesen der Wellenform das Ende der Wellenform erreicht.
-
Mit
der oben beschriebenen Verarbeitung wird die Intensität jeder
Note der Tonleiter für
jedes Rahmenintervall für
das akustische Signal, das in die Eingabesektion 1 eingegeben
wird, in einem Puffer 23 für die Bestbestimmung beziehungsweise
in einem Puffer 50 für
die Bestbestimmung und die Akkordbestimmung gespeichert.
-
Als
nächstes
werden detaillierte Beschreibungen der Sektion zur Bestbestimmung 3 und
der Sektion zur Taktbestimmung 4 in 12 weggelassen,
weil diese die gleichen Strukturen haben wie die oben beschriebene
Sektion zur Bestbestimmung 3 und wie die oben beschriebene
Sektion zur Taktbestimmung 4.
-
Die
Positionen der Taktstriche (Rahmennummer jedes Takts) werden mit
demselben Verfahren durch die gleichen Strukturen wie oben beschrieben
bestimmt. Dann wird die Bassnote in jedem Takt bestimmt.
-
Die
Bassnote wird aus der Intensität
jeder Note der Tonleiter, die von der Sektion zur Bestimmung der Tonleiter-Noten-Intensität 5 zur
Akkordbestimmung ausgegeben wird, für jedes Rahmenintervall bestimmt.
-
13 zeigt
die Intensität
jeder Note der Tonleiter für
jedes Rahmenintervall für
den gleichen Abschnitt des gleichen Musikstücks wie für den in 4 gezeigten,
welche durch die Sektion zur Bestimmung der Tonleiter-Noten-Intensität 5 zur
Akkordbestimmung ausgegeben werden. Wie in der Abbildung gezeigt
ist, werden die Intensitäten
aller Noten von C1 bis A6 entnommen, weil die Frequenzauflösung in
der Sektion zur Bestimmung der Tonleiter-Noten-Intensität 5 zur Akkordbestimmung
ungefähr
0,4 Hz ist.
-
In
der vormals entwickelten Vorrichtung wird jeder Takt in eine erste
Hälfte
und eine zweite Hälfte
unterteilt, weil es möglich
ist, dass die Bassnote in einer ersten Hälfte und in einer zweiten Hälfte in
einem Takt verschieden ist; eine Bassnote wird in jeder Hälfte bestimmt;
und wenn verschiedene Bassnoten in der ersten Hälfte und in der zweiten Hälfte bestimmt
werden, wird auch der Akkord sowohl in der ersten Hälfte als
auch in der zweiten Hälfte
bestimmt. Allerdings führt
diese Methode dazu, dass, wenn verschiedene Akkorde verwendet werden,
aber eine identische Bassnote bestimmt wird, zum Beispiel wenn der
C-Dur Akkord in der ersten Hälfte
des Taktes verwendet wird und der C-moll Akkord in der zweiten Hälfte des
Taktes verwendet wird, weil die Bassnote gleich ist, der Takt nicht
unterteilt wird und der C-Dur Akkord im gesamten Takt bestimmt wird.
-
Außerdem wird
in der oben beschriebenen Vorrichtung die Bassnote in der gesamten
Detektionszone bestimmt. Mit anderen Worten, wenn die Detektionszone
ein Takt ist, wird eine stabile Note im gesamten Takt als Bassnote
bestimmt. Für
Jazz Musik jedoch, bei der sich die Bassnote häufig ändert (die Bassnote ändert sich
in Einheiten von Viertelnoten oder ähnlich), kann die Bassnote
mit dieser Methode nicht korrekt bestimmt werden.
-
Deshalb
werden in der Struktur der vorliegenden Ausführungsform, wenn die Sektion
zur Bestimmung der Bassnote 6 eine Bassnote bestimmt, verschiedene
Detektionszonen in jedem Takt festgesetzt und die Bassnote wird
in jeder Detektionszone unter der bestimmten Intensität jeder
Note der Tonleiter aus der Intensität einer tiefen Note der Tonleiter
bestimmt, die dem ersten Beat in jeder Detektionszone entspricht.
Das ist so, weil die Grundtöne
des Akkords in vielen Fällen
am ersten Beat gespielt werden, auch wenn sich die Bassnote wie
oben beschrieben häufig ändert.
-
Die
Bassnote wird aus der durchschnittlichen Stärke der Intensitäten der
Noten der Tonleiter in einem Bereich zur Bestimmung der Bassnote
in einem Abschnitt erhalten, der dem ersten Beat in der Detektionszone entspricht.
-
Wenn
die Intensität
der i-ten Note der Tonleiter zur Rahmenzeit „t" L
i(t) genannt
wird, kann die durchschnittliche Intensität L
avgi(f
s,f
e) der i-ten Note
der Tonleiter von Rahmen f
s zu Rahmen f
e durch die folgende Formel 14 berechnet
werden: Formel
14
-
Die
Sektion zur Bestimmung der Bassnote 6 berechnet die durchschnittlichen
Intensitäten
im Bereich zur Bestimmung der Bassnote, zum Beispiel im Bereich
von C2 bis H3, und bestimmt die Note, die die größte durchschnittliche Intensität in der
Tonleiter hat, als Bassnote. Um zu verhindern, dass die Bassnote
in einem Musikstück,
das keinen Klang in dem Bereich zur Bestimmung der Bassnote hat,
oder in einem Teil, der keinen Klang hat, falsch bestimmt wird,
kann ein geeigneter Schwellenwert festgelegt werden, so dass die
Bassnote ignoriert wird, wenn die Intensität der bestimmten Bassnote kleiner
oder gleich dem Schwellenwert ist. Wenn die Bassnote als wichtiger
Faktor in der nachfolgenden Akkordbestimmung betrachtet wird, kann
bestimmt werden, ob die bestimmte Bassnote kontinuierlich eine vorbestimmte
Intensität
oder mehr innerhalb des Bereichs zur Bestimmung der Bassnote für den ersten
Beat beibehält,
um nur eine verlässlichere
Note als Bassnote auszuwählen.
Weiterhin kann, anstatt die Note mit der größten durchschnittlichen Intensität in der
Tonleiter im Bereich zur Bestimmung der Bassnote als Bassnote zu
bestimmen, die Bassnote auf die Weise bestimmt werden, dass die
durchschnittliche Intensität
jeder Note verwendet wird, um die durchschnittliche Intensität für jede der
12 Tonlagen-Namen zu berechnen, wobei der Tonlagen-Name, der die
höchste
durchschnittliche Intensität
hat, als Basis-Tonlagen-Name bestimmt wird, und wobei die Note,
die die höchste
durchschnittliche Intensität
in der Tonleiter unter den Noten hat, die im Bereich zur Bestimmung
der Bassnote enthalten sind, und die den Basis-Tonlagen-Namen hat,
als Bassnote bestimmt wird.
-
Wenn
die Bassnote bestimmt wurde, wird das Ergebnis in einem Puffer 60 gespeichert.
Das Ergebnis der Bestimmung der Bassnote kann auf dem Bildschirm
angezeigt werden, um es dem Anwender zu erlauben, es zu korrigieren,
wenn es falsch ist. Weil sich der Basisbereich, in Abhängigkeit
vom Musikstück, ändern kann, kann
es dem Anwender erlaubt werden, den Bereich zur Bestimmung der Bassnote
zu ändern.
-
14 zeigt
das Beispiel einer Bildschirmansicht des Ergebnisses der Bestimmung
der Bassnote, das von der Sektion zur Bestimmung der Bassnote 6 erhalten
wurde.
-
Als
nächstes
bestimmt die erste Sektion zur Bestimmung der Unterteilung des Takts 7,
ob sich die Bassnote ändert,
je nachdem ob die bestimmte Bassnote in jeder Detektionszone verschieden
ist, und ob es nötig
ist, den Takt in eine Vielzahl von Abschnitten zu unterteilen, je
nachdem ob sich die Bassnote ändert.
Mit anderen Worten, wenn die bestimmte Bassnote in jeder Detektionszone
identisch ist, wird festgestellt, dass es nicht nötig ist,
den Takt zu unterteilen; im Gegensatz dazu wird, wenn die bestimmte
Bassnote in jeder Detektionszone verschieden ist, festgestellt,
dass es nötig
ist, den Takt in eine Vielzahl von Abschnitten zu unterteilen. Im
letzteren Fall, kann wiederum festgestellt werden, ob es nötig ist,
jede Hälfte
der Vielzahl an Abschnitten weiter zu unterteilen.
-
Die
zweite Sektion zur Bestimmung der Taktunterteilung 8 legt
zuerst einen Bereich zur Akkordbestimmung fest. Der Bereich zur
Akkordbestimmung ist ein Bereich, in dem Akkorde vorwiegend gespielt
werden, und es wird zum Beispiel angenommen, dass er im Bereich
von C3 bis E6 liegt (C4 dient als das Zentrum „do").
-
Die
Intensität
jeder Note der Tonleiter für
jedes Rahmenintervall im Bereich zur Akkordbestimmung wird in einer
Detektionszone, wie zum Beispiel einem halben Takt, gemittelt. Die
gemittelte Intensität
jeder Note der Tonleiter wird für
jede von 12 Tonlagen-Noten aufsummiert (C, Cis, D, Dis, ... und
H) und die aufsummierte Intensität
wird durch die Zahl der aufsummierten Intensitäten geteilt, um die durchschnittliche
Intensität
von jeder der 12 Tonlagen-Noten zu erhalten.
-
Die
durchschnittlichen Intensitäten
der 12 Tonlagen-Noten werden in dem Bereich zur Bestimmung eines
Akkords für
die erste Hälfte
und für
die zweite Hälfte
des Takts erhalten und sie werden neu angeordnet nach abnehmender
Stärke.
-
Wie
gezeigt in 15A und 15B wird
bestimmt, ob zum Beispiel die drei Noten (diese Zahl wird „M" genannt) mit der
stärksten
Intensität
in der zweiten Hälfte
enthalten sind in zum Beispiel den drei Noten (diese Zahl wird „N" genannt) mit der
stärksten
Intensität
in der ersten Hälfte
und es wird bestimmt, ob sich der Akkord ändert, je nachdem ob die M
Noten oder mehr enthalten sind. Entsprechend dieser Bestimmung bestimmt
die zweite Sektion zur Bestimmung der Unterteilung des Takts 8 das
Ausmaß der Änderung
im Akkord und bestimmt, entsprechend dem Ergebnis, ob es nötig ist,
den Takt in eine Vielzahl von Abschnitten zu unterteilen.
-
Wenn
die drei Noten (diese Zahl wird „C" genannt) oder mehr enthalten sind (das
heißt,
dass alle drei enthalten sind), bestimmt die zweite Sektion zur
Bestimmung der Unterteilung des Takts 8, dass der Akkord sich
zwischen der ersten Hälfte
und der zweiten Hälfte
des Takts nicht verändert,
und sie bestimmt weiterhin, dass die Unterteilung des Takts in Abhängigkeit
von dem Ausmaß der Änderung
im Akkord nicht durchgeführt werden
muss.
-
Die
Veränderung
der Werte von „M", „N" und „C", die in der zweiten
Sektion zur Bestimmung der Unterteilung des Takts 8 verwendet
werden, ändert
die Unterteilung des Takts in Abhängigkeit von dem Ausmaß der Änderung
im Akkord. Im vorangegangenen Beispiel, in welchem „M", „N" und „C" alle den Wert „3" erhielten, wird
eine Änderung
im Akkord ziemlich streng geprüft.
Wenn zum Beispiel "M" den Wert „3" erhält, „N" den Wert „6" erhält, und „C" den Wert „3" erhält (was
bedeutet, dass festgestellt wird, ob die drei obersten Noten in der
zweiten Hälfte
alle in den sechs obersten Noten in der ersten Hälfte enthalten sind), wird
festgestellt, dass Klangsequenzen, die einander in gewissem Umfang ähneln, einen
identischen Akkord haben.
-
Es
ist beschrieben worden, dass die erste Hälfte und die zweite Hälfte beide
weiter in je zwei Hälften aufgeteilt
werden, um vier Abschnitte im Takt in einem Vierermetrum zu haben.
Eine korrektere Bestimmung, die an tatsächliche normale Musik angepasst
ist, kann durchgeführt
werden indem "M" den Wert "3" erhält "N" den Wert "3" erhält und "C" den Wert "3" erhält wenn
festgestellt wird, ob der Takt in die erste Hälfte und die zweite Hälfte unterteilt
werden soll und indem "M" den Wert "3" erhält "N" den Wert "6" erhält und "C" den Wert "3" erhält wenn
festgestellt wird, ob die erste Hälfte und die zweite Hälfte beide
in zwei weitere Hälften
aufgeteilt werden sollen.
-
Die
Sektion zur Bestimmung des Akkordnamens 9 bestimmt den
Akkordnamen in jeder Akkord-Bestimmungszone entsprechend der Bassnote
und der Intensität
jeder Note der Tonleiter in jeder der Akkord-Bestimmungszonen, wenn
die erste Sektion zur Bestimmung der Unterteilung des Takts 7 und/oder
die zweite Sektion zur Bestimmung der Unterteilung des Takts 8 feststellen,
dass es notwendig ist, den Takt in verschiedene Akkord-Bestimmungszonen
zu unterteilen, oder sie bestimmt den Akkordnamen in dem Takt entsprechend
der Bassnote und der Intensität
jeder Note der Tonleiter in dem Takt, wenn die erste Sektion zur
Bestimmung der Unterteilung des Takts 7 und die zweite
Sektion zur Bestimmung der Unterteilung des Takts 8 feststellen,
dass es nicht notwendig ist, den Takt in verschiedene Akkord-Bestimmungszonen
zu unterteilen.
-
Die
Sektion zur Bestimmung des Akkordnamens 9 bestimmt den
Akkordnamen tatsächlich
auf die folgende Weise. In der vorliegenden Ausführungsform sind die Akkord-Bestimmungszone und
die Zone zur Bestimmung der Bassnote gleich. Die durchschnittliche
Intensität
jeder Note der Tonleiter in einem Bereich zur Akkordbestimmung,
zum Beispiel im Bereich von C3 bis A6, wird in der Akkord-Bestimmungszone
berechnet, die Namen einiger Noten mit der höchsten durchschnittlichen Intensität werden
bestimmt, und Kandidaten für den
Akkordnamen werden ausgewählt
entsprechend der Namen dieser Noten und dem Namen der Bassnote.
-
Weil
eine Note, die eine hohe Intensität hat, nicht notwendigerweise
ein Bestandteil des Akkords ist werden einige Noten, zum Beispiel
fünf Noten,
bestimmt, alle Kombinationen von zumindest zwei dieser Noten werden
gebildet und Kandidaten für
den Akkordnamen werden ausgewählt
entsprechend der Namen der Noten in all den Kombinationen und dem
Namen der Bassnote.
-
Auch
bei der Akkordbestimmung können
Noten ignoriert werden, die durchschnittliche Intensitäten haben,
die nicht höher
als ein Schwellenwert sind. Zusätzlich
kann es dem Anwender erlaubt werden, den Bereich zur Akkordbestimmung
zu ändern.
Außerdem
kann, anstatt Kandidaten für
Akkordkomponenten sequentiell aus der Note, die die höchste durchschnittliche
Intensität
in der Tonleiter im Akkord-Bestimmungsbereich hat, auszuwählen, kann
die durchschnittliche Intensität
jeder Note im Akkord-Bestimmungsbereich verwendet werden, um die
durchschnittliche Intensität
für jeden
von 12 Tonlagen-Namen zu berechnen, um Kandidaten für Akkord-Komponenten
sequentiell aus dem Tonlagen-Namen zu erhalten, der die größte durchschnittliche Intensität hat.
-
Um
Kandidaten für
Akkordnamen zu gewinnen, durchsucht die Sektion zur Bestimmung des
Akkordnamens 9 eine Datenbank für Akkordnamen, die Intervalle
von Akkordtypen (wie zum Beispiel „m" und „M7") und die Basisnoten der Noten von Akkord-Komponenten
gespeichert hat. Insbesondere werden alle Kombinationen von mindestens
zwei der fünf
bestimmten Notennamen erhalten; es wird nacheinander bestimmt, ob
die Intervalle zwischen diesen erhaltenen Noten den Intervallen
zwischen Noten der Akkord-Komponenten entsprechen, die in der Datenbank
für Akkordnamen
gespeichert sind; wenn sie einander entsprechen, wird die Basisnote
aus den Namen der Noten, die zu den Noten der Akkord-Komponenten
gehören,
identifiziert; und ein Akkordsymbol wird dem Namen der Note der
Basisnote zugeordnet, um den Akkordnamen zu bestimmen. Weil eine
Basisnote oder eine fünfte
Note eines Akkords von einem Musikinstrument ausgelassen werden
können,
das den Akkord spielt, werden die entsprechenden Kandidaten für Akkordnamen
erhalten, selbst wenn diese Art von Noten nicht enthalten sind.
Wenn die Bassnote bestimmt wurde, wird der Notenname der Bassnote
zu den Akkordnamen der Kandidaten für den Akkordnamen addiert.
Mit anderen Worten, wenn eine Basisnote eines Akkords und die Bassnote
denselben Notennamen haben, muss nichts getan werden. Wenn sie sich
unterscheiden wird ein Akkordbruchteil verwendet.
-
Wenn
mit der oben beschriebenen Methode zu viele Kandidaten für Akkordnamen
erhalten werden, kann eine Einschränkung entsprechend der Bassnote
vorgenommen werden. Insbesondere wenn die Bassnote bestimmt wurde,
und wenn der Name der Bassnote nicht in den Namen der Basisnoten
irgendeines Kandidaten der Akkordnamen enthalten ist, wird der Kandidat
für den
Akkordnamen gelöscht.
-
Wenn
eine Vielzahl von Kandidaten für
Akkordnamen erhalten wird, berechnet die Sektion zur Bestimmung
des Akkordnamens 9 eine Wahrscheinlichkeit (wie wahrscheinlich
es ist, dass diese vorkommt), um einen Kandidaten für den Akkordnamen
aus der Vielzahl auszuwählen.
-
Die
Wahrscheinlichkeit wird berechnet aus dem Durchschnitt der Stärken der
Intensitäten
aller Noten der Akkord-Komponenten im Bereich zur Akkordbestimmung
und aus der Stärke
der Intensität
der Basisnoten des Akkords im Bereich zur Bestimmung der Bassnote.
Insbesondere wenn der Durchschnitt der durchschnittlichen Intensitäten aller
Komponenten-Noten eines erhaltnen Kandidaten des Akkordnamens in
der Akkord-Bestimmungszone Lavgc genannt
wird und wenn die durchschnittliche Intensität der Basisnoten des Akkords
in der Zone zur Bestimmung der Bassnote Lavgr genannt
wird, wird die Wahrscheinlichkeit als der Durchschnitt dieser beiden
Durchschnittswerte berechnet wie in der folgenden Formel 15 gezeigt
wird. Nach einer anderen Methode kann die Wahrscheinlichkeit als
das Verhältnis
aus der (durchschnittlichen) Intensität des Tons eines Akkords (Noten
der Akkord-Komponenten) zu der (durchschnittlichen) Intensität eines
Nicht-Akkord-Tons (eine andere Note als die Noten der Akkord-Komponente)
im Bereich zur Akkordbestimmung berechnet werden.
-
-
Wenn
eine Mehrzahl von Noten, die den gleichen Tonlagen-Namen haben,
in dem Akkord-Bestimmungsbereich
oder im Bereich zur Bestimmung der Bassnote enthalten ist, wird
die Note unter ihnen, die die größte durchschnittliche
Intensität
hat, im Akkord-Bestimmungsbereich oder im Bereich zur Bestimmung
der Bassnote verwendet. Alternativ dazu kann die durchschnittliche
Intensität
jeder Note der Tonleiter für
die 12 Tonlagen-Namen gemittelt werden, um die durchschnittliche
Intensität
für jeden
der 12 Tonlagen-Namen im Akkord-Bestimmungsbereich und im Bereich
zur Bestimmung der Bassnote zu verwenden.
-
Weiterhin
können
musikalische Kenntnisse in die Berechnung der Wahrscheinlichkeit
einbezogen werden. Zum Beispiel wird die Intensität jeder
Note der Tonleiter in allen Rahmen gemittelt; die gemittelte Intensität jeder
Note der Tonleiter wird für
jeden der 12 Tonlagen-Namen
gemittelt, um die Stärke
von jedem der 12 Tonlagen-Namen zu berechnen, und die Melodie des
Musikstücks
wird aus der Verteilung der Stärke
bestimmt. Der diatonische Akkord der Melodie wird mit einer vorgeschriebenen
Konstante multipliziert, um die Wahrscheinlichkeit zu erhöhen. Oder
die Wahrscheinlichkeit wird entsprechend der Anzahl der Noten außerhalb
der diatonischen Tonleiter der Melodie vermindert für einen
Akkord, der eine Komponenten-Note (Komponenten-Noten) hat, die außerhalb
der Noten der diatonischen Tonleiter der Melodie liegt. Weiterhin
können
Muster üblicher
Akkordfortschreibungen in einer Datenbank gespeichert werden, so
dass die Wahrscheinlichkeit für einen
gefundenen Kandidaten für
einen Akkord, in den üblichen
Muster der Akkordfortschreibung enthalten zu sein im Vergleich mit
der Datenbank, durch Multiplikation mit einer vorgeschriebenen Konstante
erhöht
wird.
-
Der
Name des Akkords, der die größte Wahrscheinlichkeit
aufweist, wird als Akkordname bestimmt. Kandidaten für Akkordnamen
können
zusammen mit ihrer Wahrscheinlichkeit auf dem Bildschirm angezeigt werden,
um es dem Anwender zu erlauben, den Akkordnamen auszuwählen.
-
In
jedem dieser Fälle
wird, wenn die Sektion zur Bestimmung von Akkordnamen 9 den
Akkordnamen bestimmt, das Ergebnis in einem Puffer 90 gespeichert
und auch auf dem Bildschirm angezeigt.
-
16 zeigt
ein Beispiel einer Bildschirmanzeige von Ergebnissen einer Akkordbestimmung,
die mit der Sektion zur Bestimmung von Akkordnamen 9 erhalten
wurden (Akkorde in englischer Notation). Es ist bevorzugt, dass
die bestimmten Akkorde und die Bassnoten durch die Verwendung einer
MIDI-Einheit oder von etwas Ähnlichem
zusätzlich
zur Anzeige der bestimmten Akkorde auf dem Bildschirm auf diese
Weise wiedergegeben werden. Das ist so, weil im Allgemeinen nicht
allein dadurch festgestellt werden kann, ob die angezeigten Akkorde
korrekt sind, indem man die Namen der Akkorde anschaut.
-
Entsprechend
der oben beschriebenen Ausführung
der vorliegenden Ausführungsform,
können
auch andere Personen als Profis, die spezielle musikalische Kenntnisse
haben, Akkordnamen in einem musikalischen akustischen Eingabesignal,
in welchem die Klänge
einer Vielzahl von musikalischen Instrumenten gemischt sind, wie
zum Beispiel in solchen von Musik CDs, aus dem Gesamtklang bestimmen,
ohne jede Einzelheit an musikalischer Noteninformation zu bestimmen.
-
Weiterhin
können,
entsprechend der Ausführung
der vorliegenden Ausführungsform,
Akkorde unterschieden werden, die dieselben Komonenten-Noten haben.
Sogar wenn das Aufführungstempo
fluktuiert, oder sogar für
eine Klangquelle, die eine Aufführung
wiedergibt, deren Tempo absichtlich fluktuiert, können die
Akkordnamen in jedem Takt bestimmt werden.
-
Insbesondere
wird, da der Takt nicht nur entsprechend der Bassnote unterteilt
wird, sondern auch entsprechend dem Ausmaß der Änderung im Akkord, um den Akkord
zu bestimmen, sogar wenn die Bassnote gleich bleibt, wenn das Ausmaß der Änderung
im Akkord groß ist,
bei der Ausführung
der vorliegenden Ausführungsform
der Takt unterteilt und die Akkorde werden bestimmt. Mit anderen
Worten, wenn sich zum Beispiel der Akkord in einem Takt bei Beibehaltung
einer identischen Bassnote ändert,
können
die korrekten Akkorde bestimmt werden. Der Takt kann auf unterschiedliche
Arten unterteilt werden, entsprechend dem Ausmaß an Änderung der Bassnote und dem
Ausmaß der Änderung
des Akkords.
-
Zweite Ausführungsform
-
Eine
zweite Ausführungsform
der vorliegenden Erfindung unterscheidet sich von der ersten Ausführungsform
dadurch, dass die Euklidische Distanz der Intensität jeder
Note der Tonleiter berechnet wird, um das Ausmaß der Änderung im Akkord zu bestimmen,
um einen Takt zu unterteilen und Akkorde zu bestimmen.
-
In
diesem Fall jedoch wird die Euklidische Distanz, wenn sie einfach
berechnet wird, groß bei
einer plötzlichen
Klangzunahme (am Anfang eines Musikstücks oder in ähnlichen
Fallen) und bei einer plötzlichen Klangabnahme
(am Ende eines Musikstücks
oder bei einer Pause), was das Risiko verursacht, den Takt nur gemäß der Zunahmen
des Klangs zu unterteilen, obwohl sich der Akkord tatsächlich nicht ändert. Deshalb
wird die Intensität
jeder Note der Tonleiter normiert wie gezeigt in 17A bis 17D,
bevor die Euklidische Distanz berechnet wird (die in 17A gezeigten Intensitäten werden normiert zu denen,
die in 17C gezeigt werden und die in 17B gezeigten Intensitäten werden normiert zu denen,
die in 17D gezeigt werden). Wenn die
Normierung in Bezug auf die kleinste Intensität durchgeführt wird und nicht in Bezug
auf die größte (siehe 17A bis 17D),
wird die Euklidische Distanz bei einer plötzlichen Klangänderung
reduziert und die Gefahr ausgeschlossen, dass der Takt fälschlich
aufgeteilt wird.
-
Die
Euklidische Distanz der Intensität
jeder Note der Tonleiter wird nach der oben beschriebenen Formel
16 berechnet.
-
Wenn
zum Beispiel die Euklidische Distanz größer ist als der Durchschnitt
der Intensitäten
aller Noten in allen Rahmen, bestimmt die erste Sektion zur Bestimmung
der Unterteilung des Takts 7, dass der Takt untereilt werden
sollte.
-
Genauer
gesagt, wenn die Euklidische Distanz größer ist als „T" multipliziert mit
dem Durchschnitt der Intensitäten
aller Noten in allen Rahmen, ist es notwendig, den Takt zu teilen.
Wenn der Wert „T" verändert wird,
kann der Schwellenwert zur Unterteilung des Takts zu einem gewünschten
Wert geändert
(angepasst) werden.
-
Die
Vorrichtung zur Bestimmung von Akkordnamen und das Programm zur
Bestimmung von Akkordnamen gemäß der vorliegenden
Erfindung sind nicht auf diejenigen beschränkt, die mit Bezugnahme auf
die Zeichnungen oben beschrieben werden, und können auf vielfältige Weise
innerhalb des Gegenstands der vorliegenden Erfindung modifiziert
werden.
-
Die
Vorrichtung zur Bestimmung von Akkordnamen und das Programm zur
Bestimmung von Akkordnamen gemäß der vorliegenden
Erfindung können
auf verschiedenen Gebieten eingesetzt werden, wie zum Beispiel der
Bearbeitung von Videos, um Ereignisse einer Videoaufzeichnung mit
der zeitlichen Abfolge von Beats einer Musikaufzeichnung zu synchronisieren,
wenn ein musikalisches Werbevideo hergestellt wird; der Bearbeitung
von Audioaufzeichnungen, um die Position von Beats durch Beatsuche
zu finden und zum Ausschneiden und Einfügen der Wellenform eines akustischen
Signals eines Musikstücks;
Steuerung der Live-Bühnenaufführung eines
Ereignisses, um Elemente wie zum Beispiel die Farbe, die Helligkeit,
Richtung und Spezialeffekte der Beleuchtung in Synchronisation zur
Aufführung
eines Menschen zu steuern und zur automatischen Steuerung des Zeitpunkts
des Klatschens des Auditoriums und der Erregungsschreie des Auditoriums;
und der mit Musik synchronisierten Computergraphik.
-
Die
gesamte Offenbarung der
japanischen
Patentanmeldung Nr. 2006-216361 , angemeldet am 9. August
2006, einschließlich
Beschreibung, Ansprüche,
Zeichnungen und Zusammenfassung, wird hiermit in die vorliegende
Anmeldung durch Inbezugnahme in ihrer Gesamtheit einbezogen.