DE102016226042A1 - Device, means of transport and method for designing a transition between two audio files - Google Patents

Device, means of transport and method for designing a transition between two audio files Download PDF

Info

Publication number
DE102016226042A1
DE102016226042A1 DE102016226042.1A DE102016226042A DE102016226042A1 DE 102016226042 A1 DE102016226042 A1 DE 102016226042A1 DE 102016226042 A DE102016226042 A DE 102016226042A DE 102016226042 A1 DE102016226042 A1 DE 102016226042A1
Authority
DE
Germany
Prior art keywords
song
transition
audio
songs
segment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE102016226042.1A
Other languages
German (de)
Other versions
DE102016226042B4 (en
Inventor
Alexander Jagaciak
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Volkswagen AG
Original Assignee
Volkswagen AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Volkswagen AG filed Critical Volkswagen AG
Priority to DE102016226042.1A priority Critical patent/DE102016226042B4/en
Publication of DE102016226042A1 publication Critical patent/DE102016226042A1/en
Application granted granted Critical
Publication of DE102016226042B4 publication Critical patent/DE102016226042B4/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/13Acoustic transducers and sound field adaptation in vehicles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/07Synergistic effects of band splitting and sub-band processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)

Abstract

Es werden eine Vorrichtung, ein Fortbewegungsmittel sowie ein Verfahren zur Gestaltung eines Übergangs (11) bei einer Audio-Wiedergabe (9) von einer ersten Audio-Datei (6a) zu einer zweiten Audio-Datei (6b) vorgeschlagen. Das Verfahren umfasst die Schritte:- automatisches Untersuchen der Audiodateien (6a, 6b) hinsichtlich eines jeweils enthaltenen Audio-Materials (8) und/oder- automatisches Untersuchen eines Fahrzeugzustandes und- Gestalten des Übergangs (11) in Abhängigkeit eines Ergebnisses des Untersuchens.A device, a means of locomotion and a method for designing a transition (11) during an audio reproduction (9) from a first audio file (6a) to a second audio file (6b) are proposed. The method comprises the steps of: automatically examining the audio files (6a, 6b) with respect to an audio material (8) contained in each case and / or automatically examining a vehicle condition and designing the transition (11) as a function of a result of the examination.

Description

Die vorliegende Erfindung betrifft eine Vorrichtung, ein Fortbewegungsmittel sowie ein Verfahren zur Gestaltung eines Übergangs bei einer Audio-Wiedergabe von einer ersten Audio-Datei zu einer zweiten Audio-Datei. Insbesondere betrifft die vorliegende Erfindung eine bessere Anpassung von Audio-Übergängen beim Musikgenuss in Fortbewegungsmitteln.The present invention relates to a device, a means of locomotion and a method for designing a transition in an audio reproduction of a first audio file to a second audio file. In particular, the present invention relates to a better adaptation of audio transitions in music enjoyment in means of transportation.

Aus dem Stand der Technik ist Software bekannt, welche zwei Lieder temposynchronisiert mit einem Lautstärke-Crossover oder einem sogenannten „Cut“ ineinander übergehen lässt. Die Überblendung findet allerdings immer in einem vordefinierten Zeitraum statt. Dieser beträgt z. B. 8 Beats. Lediglich der Zeitpunkt 8 Beats vor dem als Ende des Liedes erachteten Zeitpunkt wird als out-point gesetzt. Ebenso verhält es sich mit dem in-point, welcher 8 Beats nach dem als Beginn des Liedes erachteten Zeitpunkt angesetzt wird.Software is known from the prior art, which allows two songs temposynchronisiert with a volume crossover or a so-called "cut" merge into each other. However, the transition always takes place in a predefined period of time. This is z. B. 8 beats. Only the time 8 beats before the time considered as the end of the song is set as out-point. The same applies to the in-point, which is set to 8 beats after the time considered as the beginning of the song.

Eine Software, welche das beschriebene Verfahren implementiert hat, ist z. B. Serato Pyro. In dieser Software ist eine automatische Anordnung einer Menge an Liedern realisiert, welche sich auf Metainformationen wie Geschwindigkeit, Tonhöhe und weitere Parameter zur Ähnlichkeitsbestimmung zweier digitaler Audiosignale stützt. Anhand dieser Parameter werden die Lieder ähnlichkeitsbasiert hintereinander gereiht.A software which has implemented the described method is, for. Serato Pyro. In this software, an automatic arrangement of a lot of songs is realized, which relies on meta information such as speed, pitch, and other parameters for similarity determination of two digital audio signals. Based on these parameters, the songs are ranked consecutively based on similarity.

Aus dem Stand der Technik ist außerdem die Software „Pacemaker“ bekannt, welche ebenfalls synchronisierte Übergänge zwischen zwei Liedern automatisch erstellt. Die Form der Übergänge beschränkt sich auf verschiedene Formen von Lautstärke-Crossover, Übergänge mit geringer Beeinflussung der unterschiedlichen Frequenzbänder durch einen Equalizer, sowie einen Cut und lässt weitere kreative Übergangsformen aus. In der Software werden mehrere potenzielle Übergangszeiträume in Abhängigkeiten der zu überblendenden Lieder bestimmt. Die Auswahl der Übergangszeitpunkte erfolgt ausschließlich unter Berücksichtigung der Maximierung der sogenannten „Übergangsgüte“.The software "Pacemaker" is also known from the prior art, which also automatically creates synchronized transitions between two songs. The shape of the transitions is limited to various forms of volume crossover, transitions with little influence on the different frequency bands by an equalizer, as well as a cut and leaves out further creative transitional forms. The software determines several potential transitional periods depending on the songs being transposed. The selection of the transition times takes place exclusively taking into account the maximization of the so-called "transition quality".

Ausgehend vom vorgenannten Stand der Technik ist es eine Aufgabe der vorliegenden Erfindung, die technischen Möglichkeiten zur akustisch ansprechenden automatischen Gestaltung von Übergängen zwischen zwei Audio-Dateien besser auszuschöpfen.Based on the aforementioned prior art, it is an object of the present invention to better exploit the technical possibilities for acoustically appealing automatic design of transitions between two audio files.

Die vorstehend genannte Aufgabe wird erfindungsgemäß durch ein Verfahren zur Gestaltung eines Übergangs bei einer Audio-Wiedergabe von einer ersten Audio-Datei zu einer zweiten Audio-Datei gelöst. Als „Übergang“ wird im Rahmen der vorliegenden Erfindung eine zeitliche Folge zwischen der Audio-Wiedergabe zweier oder mehrerer Dateien ohne wesentliche Pause verstanden. Der Übergang kann hart („cut“) oder mit einer zeitweisen zeitgleichen Wiedergabe der beiden Audio-Dateien erfolgen. Insbesondere soll der Übergang einen kontinuierlichen Musikgenuss des Anwenders ermöglichen. Als Audio-Dateien können jegliche digitale Dateien verstanden werden, in welchen ein Audiosignal codiert und zur Wiedergabe über ein Audiosystem vorgesehen ist. Die Audio-Datei kann Metadaten und Audio-Material umfassen. Beispiele für Audio-Dateien sind .wav, mp3, .m4a, .aac etc. In einem ersten Schritt werden die erste und die zweite Audio-Datei, optional auch weitere Audio-Dateien, automatisch untersucht. Insbesondere wird eine signalverarbeitungstechnische Untersuchung des in den Audio-Dateien enthaltenen Audio-Materials vorgenommen. Dies kann automatisch erfolgen, sobald für eine bevorstehende Wiedergabe mehrerer Audio-Dateien ein entsprechender Befehl ergangen ist. Bspw. kann der Anwender eine Audio-Wiedergabe gespeicherter Dateien und/oder gespeicherter Wiedergabelisten veranlassen. Die Untersuchung des Audio-Materials kann bspw. eine erweiterte Songanalyse umfassen, wie sie weiter unten im Detail beschrieben wird. Insbesondere wird bei der Untersuchung des Audio-Materials nicht eine Auswertung von Metadaten verstanden, welche üblicherweise in Audio-Dateien enthalten sind und konkrete Angaben zu Erscheinungsjahr, Interpret, Titel, Genre etc. umfassen. Alternativ oder zusätzlich zu den vorgenannten Untersuchungen bezüglich des Audio-Materials kann ein Fahrzeugzustand (auch Fahrzeugbedienzustand, Fahrzeugaufenthaltsort, Verkehrssituation, Fahrzeugbetriebszustand o. Ä.) untersucht werden. Mit anderen Worten wird eine situative Anpassung unter Berücksichtigung eines Fortbewegungsmittels des Anwenders vorgenommen. Hierbei kann z. B. eine Geschwindigkeit, eine Längs-/Querbeschleunigung, ein Aufenthaltsort, ein befahrener Straßentyp, eine sprachliche/landschaftliche Region als Aufenthaltsort des Fortbewegungsmittels ermittelt werden. Die vorgenannten Informationen können verwendet werden, um einzelne oder in einer beliebigen Kombination miteinander in jedem Fall den Übergang bei der Audio-Wiedergabe in Abhängigkeit eines Ergebnisses des Untersuchens zu gestalten. Sowohl die Untersuchung als auch das Gestalten können automatisch angestoßen und/oder durchgeführt werden. Im Ergebnis bietet die vorliegende Erfindung die Möglichkeit, den Musikgenuss einer Vielzahl Musikdateien unterbrechungsfrei und mit einem Höchstmaß an Übergangsgüte zu erleben.The above object is achieved by a method for designing a transition in an audio playback of a first audio file to a second audio file. As a "transition" is understood in the context of the present invention, a time sequence between the audio playback of two or more files without significant break. The transition can be hard ("cut") or with a temporary simultaneous playback of the two audio files. In particular, the transition should allow a continuous enjoyment of the music of the user. Audio files can be understood as any digital files in which an audio signal is encoded and provided for playback via an audio system. The audio file may include metadata and audio material. Examples of audio files are .wav, mp3, .m4a, .aac, etc. In a first step, the first and the second audio file, optionally also other audio files, are automatically examined. In particular, a signal processing examination of the audio material contained in the audio files is made. This can be done automatically as soon as an appropriate command has been issued for an upcoming playback of multiple audio files. For example. For example, the user may initiate audio playback of stored files and / or saved playlists. Examining the audio material may include, for example, advanced song analysis, as described in detail below. In particular, in the investigation of the audio material is not understood an evaluation of metadata, which are usually contained in audio files and include specific information on the year of publication, artist, title, genre, etc. As an alternative or in addition to the aforementioned investigations relating to the audio material, a vehicle state (also vehicle operating state, vehicle residence, traffic situation, vehicle operating state or the like) can be examined. In other words, a situational adaptation is made taking into account a means of locomotion of the user. This z. As a speed, a longitudinal / lateral acceleration, a location, a traveled road type, a linguistic / scenic region are determined as the location of the means of transport. The aforesaid information can be used to individually or in any combination with each other in each case to make the transition in the audio playback in response to a result of the investigation. Both the examination and the design can be triggered and / or performed automatically. As a result, the present invention offers the possibility of experiencing the music enjoyment of a variety of music files seamlessly and with a maximum of transient quality.

Die Unteransprüche zeigen bevorzugte Weiterbildungen der Erfindung.The dependent claims show preferred developments of the invention.

Das Gestalten des Übergangs zwischen der ersten und der zweiten Audio-Datei kann eine zeitliche Zuordnung zwischen der Wiedergabe der ersten Audio-Datei und der zweiten Audio-Datei definieren. Bspw. kann ein Übergangszeitraum ungleich 0 Sekunden zeitgleicher Wiedergabe und/oder eine Synchronisation der Musik-Dateien erfolgen. Zudem können Lautstärke-Charakteristika während des Übergangszeitraums in erfindungsgemäßer Weise zur Gestaltung des Übergangs geprägt werden. Alternativ oder zusätzlich kann eine Reihung der verfügbaren Audio-Dateien als Gestaltung des Übergangs verstanden werden. Mit anderen Worten kann die Reihenfolge der Wiedergabe im Ansprechen auf die o. g. Untersuchungsergebnisse modifiziert werden. Hierbei kann eine zweite Audio-Datei zugunsten einer dritten Audio-Datei zurückgestellt werden oder gänzlich bezüglich einer aktuellen Wiedergabe-Reihenfolge unberücksichtigt bleiben. Das Signal kann auch auf Frequenzebene, durch Effekte wie EQ, Flanger, Phaser etc. verändert werden, welche keine ausschließlich wiedergabelautstärkebezogene Aktion darstellen. Die Übergänge können auf diese Weise situationsbezogen und/oder audiosignalbezogen gestaltet werden und sich insbesondere bei einer Verwendung in einem Fortbewegungsmittel besser in die Gesamtsituation einfügen. Hierdurch wird der Musikgenuss des Anwenders erhöht und akustisch wenig ansprechende Übergänge werden vermieden. Hierdurch kann die Verkehrssicherheit des Fortbewegungsmittels und das Anwendererlebnis verbessert werden. Designing the transition between the first and second audio files may define a temporal association between the playback of the first audio file and the second audio file. For example. For example, a transitional period not equal to 0 seconds of simultaneous playback and / or synchronization of the music files can take place. In addition, volume characteristics during the transitional period can be shaped in accordance with the invention to design the transition. Alternatively or additionally, a ranking of the available audio files can be understood as a design of the transition. In other words, the order of reproduction can be modified in response to the above examination results. In this case, a second audio file can be reset in favor of a third audio file or completely disregarded with respect to a current playback order. The signal can also be changed at the frequency level by effects such as EQ, Flanger, Phaser, etc., which are not an exclusively playback volume related action. The transitions can be designed in this way in a situation-related and / or audiosignal-related manner and fit better into the overall situation, especially when used in a means of transportation. As a result, the enjoyment of the music of the user is increased and acoustically unappealing transitions are avoided. As a result, the traffic safety of the means of transport and the user experience can be improved.

Die Untersuchung der Audio-Dateien kann eine Segmentierung des Audio-Materials umfassen. Insbesondere können die jeweiligen Audio-Dateien vor der Definition des Übergangs in jeweilige Sinneinheiten wie z. B. „Intro“, „Strophe“, „Refrain“, „Outro“ etc. eingeteilt werden. Bei der Gestaltung des Übergangs kann vorgesehen sein, dass der Übergang sich lediglich auf eines der vorgenannten Segmente der ersten Audio-Datei und/oder auf eines der Segmente der nachfolgend wiederzugebenden Audio-Datei bezieht. Insbesondere können die Segmente derart gewählt werden, dass akustisch üblicherweise zueinander passende Segmente für die Gestaltung des Übergangs gewählt werden. Als vorteilhaft hat sich bspw. herausgestellt, lediglich ein Segment während des Übergangs wiederzugeben (zu mixen), in welchem Gesang enthalten ist. Die Segmentierung kann daher insbesondere Kategorien von Gesang enthaltenden und rein instrumentalen Sinneinheiten definieren. Wichtig für die Segmentierung im Sinne der vorliegenden Erfindung ist, dass bestimmte, temporäre Eigenheiten zeitlich zusammenhängender Bereiche des Audio-Materials erhalten bleiben, bis mit dem Ende eines betrachteten Segmentes ein weiteres Segment mit anderen Eigenheiten beginnt. Eine solche Segmentierung ermöglicht eine hohe Übergangsgüte und bestmögliche Audio-Erlebnisse beim Musikgenuss aufeinanderfolgend wiedergegebener Audio-Dateien.Examination of the audio files may involve segmentation of the audio material. In particular, the respective audio files before the definition of the transition into respective units of meaning such. B. "Intro", "stanza", "chorus", "Outro" etc. are divided. In the design of the transition can be provided that the transition refers only to one of the aforementioned segments of the first audio file and / or on one of the segments of the subsequently reproduced audio file. In particular, the segments can be chosen such that acoustically usually matching segments are selected for the design of the transition. For example, it has proved advantageous to reproduce (mix) only one segment during the transition in which vocals are contained. The segmentation can therefore in particular define categories of vocal-containing and purely instrumental units of meaning. It is important for the segmentation in the sense of the present invention that certain temporary properties of temporally contiguous regions of the audio material are retained until, with the end of a considered segment, another segment begins with different properties. Such a segmentation enables a high degree of transient quality and the best possible audio experience when listening to music of consecutively reproduced audio files.

Die Untersuchung der Audio-Dateien kann eine Kategorisierung der Segmente umfassen. Hierbei können vordefinierte Kategorien für die Segmente der potenziell wiederzugebenden Audio-Dateien gefunden werden. Alternativ oder zusätzlich kann eine jeweilige Audio-Datei in so viele Segmente (nicht-vordefinierter Kategorie) zerlegt werden, wie es die Variation der akustischen Eigenheiten der Segmente erfordert. Die Segmente bzw. ihre Kategorien können eine bestimmte Bedeutung bzw. einen bestimmten Charakter musikalischer Art aufweisen, welcher sich zur Bestimmung einer Eignung zur Gestaltung eines Übergangs mit einem weiteren Audio-Datei-Segment eignen (oder nicht). Die erfindungsgemäße Kategorisierung der Segmente kann also eine weitere Verbesserung des Audio-Erlebnisses sowie der Verkehrssicherheit beim Musikgenuss im Fortbewegungsmittel bereitstellen. Hierbei werden nicht die Header bzw. Metadaten ausgelesen und miteinander verglichen, um die Eignung zweier Audio-Dateien zur Gestaltung eines gemeinsamen Übergangs zu ermitteln. Hierdurch sei jedoch nicht ausgeschlossen, dass solche Header/Metadaten zusätzlich für die Gestaltung des Übergangs herangezogen werden können, um die Informationslage zur Gestaltung des Übergangs zu verbessern.The examination of the audio files may include a categorization of the segments. Predefined categories can be found for the segments of the potentially reproduced audio files. Alternatively or additionally, a respective audio file can be broken down into as many segments (non-predefined category) as the variation of the acoustic characteristics of the segments requires. The segments or their categories may have a particular meaning or character of a musical nature, which may (or may not) be suitable for determining suitability to design a transition to another audio file segment. The categorization of the segments according to the invention can therefore provide a further improvement of the audio experience as well as the traffic safety when listening to music in the means of transportation. In this case, the headers or metadata are not read out and compared with one another in order to determine the suitability of two audio files to form a common transition. However, this does not exclude the possibility that such headers / metadata may be used in addition to the design of the transition in order to improve the information situation for the design of the transition.

Die Untersuchung des Fahrzeugzustandes bzw. Fahrzeugbedienzustandes kann die Analyse einer Fahrsituation, einer Verkehrssituation, einer Fahrzeugsituation und insbesondere einer Bediensituation des Fortbewegungsmittels umfassen. Letztere beschreibt den Zustand, der sich durch die Interaktion mit dem Anwender ergibt. Hierbei sei insbesondere eine Interaktion zur Fahrzeugführung (nicht etwa der Bedienung einer Musikwiedergabe-Anlage) verstanden. Die Erfinder haben erkannt, dass insbesondere die Auswertung von Charakteristika des Audio-Materials zur Gestaltung eines Übergangs abhängig von einer Bediensituation des Fortbewegungsmittels sein können. Mit anderen Worten kann eine Bediensituation darüber entscheiden, welche Charakteristika bei der Auswertung von Audio-Material geeignet bzw. mit einer besonders hohen Priorität heranzuziehen sind, wenn die Gestaltung eines Übergangs von einer Audio-Datei zur zweiten Audio-Datei gefragt ist. Bspw. kann bei einer sportlichen Fahrweise die Dynamik eines Übergangs bzw. der Ereignisreichtum im Übergangsbereich eine höhere Rolle spielen, als dies während des Dahingleitens („Reisen“) ist. Entsprechend kann dann ein Anwenderaktivitätslevel („wie aktiv ist der Anwender derzeit?“) in Abhängigkeit eines Ergebnisses der Untersuchung eines Bedienzustandes einer Musikwiedergabesteuerungsfunktion (eines Fortbewegungsmittels oder eines externen Musikwiedergabegerätes (Stand-Alone-Gerät)) ermittelt werden. In entspannten Fahrsituationen können bspw. Intro und Outro zweier Musik-Dateien geeigneter für einen Übergangsbereich sein, während bei dynamischen Fahrsituationen eine Verwendung jeweiliger Refrains für die Gestaltung eines Übergangs geeigneter sind.The investigation of the vehicle state or vehicle operating state can include the analysis of a driving situation, a traffic situation, a vehicle situation and in particular an operating situation of the means of locomotion. The latter describes the condition resulting from the interaction with the user. In this case, an interaction with the vehicle guidance (not the operation of a music reproduction system, for example) should be understood in particular. The inventors have recognized that in particular the evaluation of characteristics of the audio material for the design of a transition can be dependent on an operating situation of the means of transportation. In other words, an operating situation can decide which characteristics are to be used in the evaluation of audio material or with a particularly high priority when the design of a transition from an audio file to the second audio file is required. For example. In a sporty driving style, the dynamics of a transition or the abundance of events in the transition area can play a more important role than during the "traveling". Accordingly, a user activity level ("how active is the user currently?") May then be determined in response to a result of examination of an operation state of a music reproduction control function (a vehicle or a stand-alone device). In relaxed driving situations, for example, intro and outro two music files suitable for a Transition region, while in dynamic driving situations, using respective refractions to design a transition is more appropriate.

Insbesondere wird bevorzugt, das Musikwiedergabeverhalten unterschiedlicher Anwender auszuwerten und zur Gestaltung des Übergangs eines betrachteten Wiedergabesystems zu verwenden. Bspw. kann das Musikkonsumverhalten, das Wiedergabeverhalten, die Wiedergabesteuerung in einem ersten Musikwiedergabesystem ermittelt, in Datenform an einen Server übermittelt und dort ausgewertet bzw. mit weiteren Informationen anderer Musikwiedergabesystemen verarbeitet werden. Es ergibt sich ein selbstlernendes System, welches Erkenntnisse aus den ermittelten Musikwiedergabe-Verhaltensweisen zur Gestaltung des Übergangs in einem weiteren Fortbewegungsmittel verwenden kann. Bspw. kann die Akzeptanz eines Parameters eines Übergangs zwischen zwei Liedern dergestalt ermittelt werden, dass gleichartige Übergänge von verschiedenen Anwendern akzeptiert werden. Die Prozesse des selbstlernenden Systems erzeugen ein persönliches Regelwerk, welches automatisch eine Bewertung potenzieller Übergänge vornimmt und zusätzlich bspw. durch das Anbieten eines Elementes zur Bewertungsabfrage während eines Übergangs erfolgen kann. Mit anderen Worten kann während der Wiedergabe eines erfindungsgemäßen Übergangs eine Ausgabe (z. B. auf einem Bildschirm) erfolgen, durch welche der Anwender eine Bewertung der Übergangsgüte vornehmen kann. Wird ein vergleichbarer Übergang durch verschiedene Anwender als positiv bewertet, kann der Übergang bevorzugt für die Gestaltung von Übergängen in einem erfindungsgemäßen Fortbewegungsmittel verwendet werden. Wird ein Übergang bzw. werden Parameter eines Übergangs überwiegend als negativ bewertet, kann vermieden werden, entsprechende Übergänge/Parameter zukünftig zu verwenden.In particular, it is preferred to evaluate the music playback behavior of different users and to use for the design of the transition of a watched playback system. For example. For example, the music consumption behavior, the reproduction behavior, the reproduction control can be determined in a first music reproduction system, transmitted in data form to a server and evaluated there or processed with further information from other music reproduction systems. This results in a self-learning system, which can use findings from the determined music reproduction behaviors to design the transition in another means of transportation. For example. For example, the acceptance of a parameter of a transition between two songs can be determined such that similar transitions are accepted by different users. The processes of the self-learning system generate a personal set of rules, which automatically carries out an evaluation of potential transitions and, in addition, can, for example, be carried out by offering an element for the evaluation query during a transition. In other words, during playback of a transition according to the invention, an output (eg on a screen) can be output, by means of which the user can carry out an evaluation of the quality of the transition. If a comparable transition by different users is evaluated as positive, the transition can be used preferably for the design of transitions in a means of transport according to the invention. If a transition or parameters of a transition are predominantly evaluated as negative, it is possible to avoid using corresponding transitions / parameters in the future.

Bspw. kann das erfindungsgemäße Verfahren verwendet werden, um in einer Audio-Datei fehlende Metainformationen zu ersetzen bzw. bestehende Metainformationen zu ergänzen. Bspw. können Charakteristika in dem Audio-Material erkannt werden, um ein Genre, eine Epoche, einen Interpreten o. Ä. zu ermitteln. Optional kann eine entsprechende Metainformation (z. B. im Ansprechen auf die Bestätigung durch den Anwender bzw. durch einen Abgleich mit einer in Datenform zugreifbaren Referenz) die in der Datei fehlenden Metainformationen ergänzen. Mit anderen Worten wird schreibend auf die Audio-Datei zugegriffen und anhand des Musikmaterials werden automatisch ermittelte Informationen in den Header der Audio-Datei geschrieben. Insbesondere kann das erfindungsgemäße Verfahren im Ansprechen auf das Erkennen einer fehlenden Metainformation angestoßen werden, um den Metainformationen entsprechende Übergänge zu erzeugen.For example. For example, the method according to the invention can be used to replace missing meta information in an audio file or to supplement existing meta information. For example. For example, characteristics in the audio material may be recognized to be a genre, an epoch, an artist, or the like. to investigate. Optionally, a corresponding meta-information (eg, in response to user confirmation or comparison with a datum-accessible reference) may supplement the meta-information missing in the file. In other words, the audio file is accessed in writing and the music material is used to write automatically determined information into the header of the audio file. In particular, the method according to the invention can be triggered in response to the detection of a missing meta information in order to generate transitions corresponding to the meta information.

Die Untersuchung der Audio-Dateien kann ein Ermitteln und Bewerten einer semantischen Verwandtschaft der Audio-Dateien umfassen. Die semantische Verwandtschaft kann eine semantische Priorisierung (s. weiter unten) verwenden. Die semantische Verwandtschaft kann auf einer semantischen Makrosegmentierung und/oder einer semantischen Mikrosegmentierung (s. jeweils weiter unten) basieren. In Abhängigkeit des Ergebnisses der Bewertung kann die Gestaltung des Übergangs erfolgen und insbesondere eine Reihung der zur Wiedergabe grundsätzlich vorgesehenen Audio-Dateien herangezogen werden.Examination of the audio files may include determining and evaluating a semantic relationship of the audio files. The semantic relationship can use semantic prioritization (see below). The semantic relationship can be based on a semantic macro-segmentation and / or a semantic micro-segmentation (see below). Depending on the result of the evaluation, the design of the transition can take place and, in particular, a sequence of the audio files provided for the purpose of rendering can be used.

Gemäß einem zweiten Aspekt der vorliegenden Erfindung wird eine Vorrichtung zur Gestaltung eines Übergangs bei einer Audio-Wiedergabe von einer ersten Audio-Datei zu einer zweiten Audio-Datei vorgeschlagen. Die Vorrichtung umfasst eine Auswerteeinheit, welche bspw. als elektronisches Steuergerät, Mikrocontroller, programmierbarer Prozessor o. Ä. ausgestaltet sein kann. Eine Ausgabeeinheit ist vorgesehen, die von der Auswerteeinheit erzielten Erkenntnisse zur Gestaltung des Übergangs auszugeben. Insbesondere kann die Ausgabeeinheit einen Endverstärker und/oder einen Lautsprecher umfassen. Die Auswerteeinheit ist eingerichtet, die Audio-Dateien (zwei, drei oder mehr Audio-Dateien) hinsichtlich eines jeweils enthaltenen Audio-Materials automatisch zu untersuchen. Mit anderen Worten erfolgt eine Signalanalyse des Audio-Materials zur Vorbereitung einer Gestaltung des Übergangs. Alternativ oder zusätzlich kann ein Fahrzeugzustand (Fahrzeugbedienzustand, Fahrsituation, Verkehrssituation etc. (s. oben)) automatisch untersucht werden und für die Gestaltung des Übergangs herangezogen werden. In jedem Fall wird anschließend der Übergang in Abhängigkeit eines der oben genannten Ergebnisse oder beider oben genannter Ergebnisse gestaltet. Mit anderen Worten ist die erfindungsgemäße Vorrichtung eingerichtet, die Merkmale, Merkmalskombinationen und die sich aus diesen ergebenden Vorteile des erfindungsgemäßen Verfahrens derart ersichtlich in entsprechender Weise zu erzielen, dass zur Vermeidung von Wiederholungen auf die obigen Ausführungen verwiesen wird.According to a second aspect of the present invention, there is provided an apparatus for designing a transition in audio reproduction from a first audio file to a second audio file. The device comprises an evaluation unit, which, for example, as an electronic control unit, microcontroller, programmable processor o. Ä. can be designed. An output unit is provided to output the information obtained by the evaluation unit about the design of the transition. In particular, the output unit may comprise a power amplifier and / or a loudspeaker. The evaluation unit is set up to automatically examine the audio files (two, three or more audio files) for each audio material contained. In other words, a signal analysis of the audio material is done to prepare a transition design. Alternatively or additionally, a vehicle state (vehicle operating state, driving situation, traffic situation, etc. (see above)) can be automatically investigated and used for the design of the transition. In each case, the transition is then made depending on one of the above results or both of the above results. In other words, the device according to the invention is set up to achieve the features, combinations of features and the resulting advantages of the method according to the invention in a manner that can be seen in a corresponding manner so that reference is made to the above statements to avoid repetition.

Gemäß einem dritten Aspekt der vorliegenden Erfindung wird ein Computerprogrammprodukt vorgeschlagen, welches Instruktionen aufweist, die, wenn sie auf einem programmierbaren Prozessor (z. B. einer Auswerteeinheit einer erfindungsgemäßen Vorrichtung) ausgeführt werden, den Prozessor veranlassen, die Schritte des oben genannten Verfahrens auszuführen. Das Computerprogrammprodukt kann bspw. als CD, DVD, Blu-ray-Disc, Flash-Speicher, ROM/RAM o. Ä. ausgestaltet sein.According to a third aspect of the present invention, a computer program product is proposed which has instructions which, when executed on a programmable processor (eg, an evaluation unit of a device according to the invention), cause the processor to carry out the steps of the above-mentioned method. The computer program product can, for example, as a CD, DVD, Blu-ray Disc, flash memory, ROM / RAM o. Ä. be designed.

Gemäß einem vierten Aspekt der vorliegenden Erfindung wird eine Signalfolge vorgeschlagen, welche Instruktionen repräsentiert, welche, wenn sie auf einem programmierbaren Prozessor (z.B. einer Auswerteeinheit einer erfindungsgemäßen Vorrichtung) ausgeführt werden, den Prozessor veranlassen, die Schritte eines oben genannten Verfahrens auszuführen. Die Signalfolge stellt auch für den Fall die erfindungsgemäße Logik in Datenform unter Schutz, dass die zur Wiedergabe der Instruktionen erforderlichen Speichermittel außerhalb des Geltungsbereiches der beigefügten Ansprüche positioniert sind. According to a fourth aspect of the present invention, a signal sequence is proposed which represents instructions which, when executed on a programmable processor (eg, an evaluation unit of a device according to the invention), cause the processor to perform the steps of a method mentioned above. The signal sequence also protects, in case of the case, the logic according to the invention in data form, in that the memory means required for the reproduction of the instructions are positioned outside the scope of the appended claims.

Gemäß einem fünften Aspekt der vorliegenden Erfindung wird ein Fortbewegungsmittel (z.B. ein Pkw, Transporter, Lkw, Motorrad, Luft- und/oder Wasserfahrzeug) vorgeschlagen, welches eine Vorrichtung gemäß dem zweitgenannten Erfindungsaspekt aufweist. Auch bezüglich des Fortbewegungsmittels ergeben sich daher die Merkmale, Merkmalskombinationen und Vorteile entsprechend den obigen Ausführungen.According to a fifth aspect of the present invention, there is proposed a traveling means (e.g., a car, vans, trucks, motorcycles, air and / or water vehicles) having a device according to the second aspect of the invention. Also with regard to the means of locomotion, therefore, the features, feature combinations and advantages according to the above statements.

Weitere Vorteile, Merkmale und Ausgestaltungen der vorliegenden Erfindung ergeben sich anhand der nachfolgenden Ausführungen in Verbindung mit den beigefügten Zeichnungsfiguren. Es zeigen:

  • 1a eine schematische Darstellung eines Ausführungsbeispiels eines erfindungsgemäßen Fortbewegungsmittels mit einem Ausführungsbeispiel einer erfindungsgemäßen Vorrichtung;
  • 1b eine Detailansicht auf Komponenten eines Ausführungsbeispiels einer erfindungsgemäßen Vorrichtung;
  • 2 ein Blockdiagramm zur Veranschaulichung der Funktionsweise eines erfindungsgemäßen Systems für die Verwendung aggregierter Flottendaten;
  • 3 ein qualitatives Diagramm veranschaulichend eine mögliche Kategorisierung unterschiedlicher Musikstile nach Geschwindigkeit und Melodie;
  • 4 eine schematische Übersicht über Elemente eines Ausführungsbeispiels einer erfindungsgemäßen Vorrichtung;
  • 5 eine schematische Darstellung von Zusammenhängen bei der erfindungsgemäßen Signalverarbeitung;
  • 6 eine schematische Darstellung zur Missionsplanung im Rahmen eines erfindungsgemäßen Verfahrens;
  • 7 eine beispielhafte Übersicht über die Vorgänge und Elemente einer erweiterten Songanalyse;
  • 8 eine Übersicht veranschaulichend Zusammenhänge bei der erfindungsgemäßen Gestaltung von Übergängen; und
  • 9 eine schematische Darstellung einer manuellen Einflussnahme eines Anwenders auf die erfindungsgemäße Signalverarbeitung.
Further advantages, features and embodiments of the present invention will become apparent from the following statements in conjunction with the accompanying drawing figures. Show it:
  • 1a a schematic representation of an embodiment of a means of transport according to the invention with an embodiment of a device according to the invention;
  • 1b a detailed view of components of an embodiment of a device according to the invention;
  • 2 a block diagram illustrating the operation of a system according to the invention for the use of aggregated fleet data;
  • 3 a qualitative diagram illustrating a possible categorization of different music styles by speed and melody;
  • 4 a schematic overview of elements of an embodiment of a device according to the invention;
  • 5 a schematic representation of relationships in the signal processing according to the invention;
  • 6 a schematic representation of the mission planning in the context of a method according to the invention;
  • 7 an exemplary overview of the processes and elements of an extended song analysis;
  • 8th an overview illustrative of relationships in the design of transitions according to the invention; and
  • 9 a schematic representation of a manual influence of a user on the signal processing according to the invention.

Ausführungsformen der Erfindung:

  • 1a zeigt eine schematische Darstellung eines Ausführungsbeispiels eines erfindungsgemäßen Pkws 10 als Fortbewegungsmittel, auf dessen Fahrersitz ein Anwender Platz genommen hat. Der Anwender führt ein Smartphone 20 mit sich, welches Audio-Dateien in einem (nicht dargestellten) Datenspeicher vorhält, welche über Lautsprecher 1 und eine Auswerteeinheit 2 in erfindungsgemäßer Weise gemixt wiedergegeben werden sollen. Ein Touchscreen 3 dient der Entgegennahme von Anwendereingaben. Bspw. kann der Anwender mittels des Touchscreens 3 Bewertungen für wiedergegebene Übergänge abgeben. Zudem kann der Anwender eine Wiedergabe starten, im Ansprechen auf welche das erfindungsgemäße Verfahren ausgeführt wird. Insbesondere kann der Anwender Einfluss auf Parameter, in Betracht zu ziehende Audio-Dateien und Gewichtungen von Parametern für die Gestaltung eines erfindungsgemäßen Übergangs vornehmen.
  • 1b zeigt Komponenten eines Ausführungsbeispiels einer erfindungsgemäßen Vorrichtung. In einem Datenspeicher 5 sind Audio-Dateien 6a, 6b, 6c enthalten, welche von einem Anwender zur Wiedergabe vorgesehen sind. Die Audio-Dateien 6a, 6b, 6c können die gesamte Mediathek des Anwenders oder einen Teil (z. B. eine Wiedergabeliste) darstellen. Die Audio-Dateien 6a, 6b, 6c weisen jeweils einen Header 7 auf, in welchem Metadaten (z. B. Genre, Titel, Interpret, Album, Erscheinungsjahr etc.) enthalten sind. Zusätzlich weisen die Audio-Dateien 6a, 6b, 6c Audio-Material 8 auf, welches die eigentliche Musikwiedergabeinformation enthält. Eine erfindungsgemäße Segmentierung des Audio-Materials 8 hat Segmente vordefinierter Kategorien (Intro 12, Strophe 13, Refrain/Chorus 14 und Outro 15) identifiziert. Dies kann im Ansprechen auf das Starten einer Wiedergabe und/oder beim Anlegen der Dateien im Datenspeicher 5 erfolgen. Erfindungsgemäß werden die Segmente bei der Gestaltung von Übergängen durch ein elektronisches Steuergerät 2 als Auswerteeinheit zur Wiedergabe mittels des Lautsprechers 1 verwendet. Im Ergebnis weist ein Audiosignal 9 einen Schalldruckpegel Lp über der Zeit t auf, welcher in einem Zeitbereich durch die Audio-Datei 6a, in einem Übergangsbereich 11 durch die Audio-Dateien 6a und 6b und in einem dritten Zeitbereich durch die zweite Audio-Datei 6b definiert wird. Der Übergangsbereich 11 ist insbesondere nicht durch eine vordefinierte Zeitdauer, sondern durch eine Dauer zweier solcher Segmente der Musikdateien 6a, 6b definiert, welche sich als für die Gestaltung des Übergangs geeignet herausgestellt haben. Insbesondere kann der Übergangsbereich 11 eine gesamte Dauer eines ausgewählten Segmentes der ersten Audio-Datei 6a, eines ausgewählten Segmentes der zweiten Audio-Datei 6b und/oder eines jeweiligen ausgewählten Segmentes der Audio-Dateien 6a, 6b aufweisen.
  • 2 zeigt eine schematische Darstellung eines Verfahrens zur Aggregation von Flottendaten, mittels welcher anwenderübergreifende Erkenntnisse und Vorlieben zur Gestaltung eines erfindungsgemäßen Übergangs herangezogen werden können. ClientSysteme 18 sammeln das Anwenderverhalten 19 bezüglich einer Vielzahl von Musikplayern, das Fahrverhalten 21 einer Vielzahl von Fahrzeugen umfassend die Musikplayer 19 und zugeordnete umweltbedingte Kontexte 22 für eine Vielzahl von Anwender 27. Die persönlichen Präferenzen 23 der Anwender 27 werden an ein Backend-System 17 in Form eines Servers gesendet. Der Server findet Gemeinsamkeiten in den persönlichen Präferenzen 23 der Anwender 27 und ermittelt allgemeine Präferenzen 25 aus diesen. Schließlich erstellt das Backend-System 17 ein allgemeines Regelwerk 26 zur Gestaltung erfindungsgemäßer ansprechender Übergänge. Diese können einem vorliegend betrachteten Clienten-System 16 eines betrachteten Anwenders zur Verfügung gestellt werden, welcher ebenfalls über ein Benutzungsverhalten 19 des Musikplayers, ein Fahrverhalten 21 und einen umweltbedingten Kontext 22 die Bestimmung eines Übergangs in erfindungsgemäßer Weise optimieren lassen möchte. Die persönlichen Präferenzen 23 münden in einem persönlichen Regelwerk 24. Die persönlichen Präferenzen 23 werden ebenfalls mit den allgemeinen Präferenzen 25 im Backend-System 17 zur Erzeugung des allgemeinen Regelwerkes 26 verwendet. Das allgemeine Regelwerk 26 wird schließlich bei der Erstellung des persönlichen Regelwerkes 24 verwendet.
  • 3 zeigt eine Clusterung bzw. Kategorisierung unterschiedlicher Musikstilrichtungen in einem Diagramm, in welchem auf der Abszisse die Tendenz der Kategorien hinsichtlich eines melodischen Charakters (Melodien enthaltend) und auf dessen Ordinate die Geschwindigkeit (Beats per minute, BPM) aufgetragen sind.
  • 4 zeigt eine alternative Darstellung der Zusammenhänge zwischen einer Vielzahl Clienten-Systeme 18, welche eine Vielzahl Smartphones 20 umfassen, einem Backend-System 17, welches einen Datenspeicher 5 aufweist und zur Erzeugung einer Wiedergabereihung 28 eingerichtet ist, sowie einem betrachteten Clienten-System 16, welches aus einem Pkw 10 und einem informationstechnisch mit dem Pkw 10 gekoppelten Smartphone 20 besteht. Das Smartphone 20 des Clienten-Systems 16 dient als Datenspeicher für Audio-Dateien und weist eine Auswerteeinheit (nicht dargestellt) auf. Sensorisch durch den Pkw 10 ermittelte Fahrzeugsituationen und -zustände werden drahtlos an das Smartphone 20 gesendet, welches die Schritte eines erfindungsgemäßen Verfahrens zur Gestaltung eines Übergangs ausführt.
  • 5 veranschaulicht ein Ausführungsbeispiel von Schritten bei der Übergangsgestaltung in einem Clienten-System mit automatischer DJ-Software. Aus einer Online-Datenbank als Datenspeicher 5, einem persönlichen Regelwerk 24 und einem Benutzungsverhalten 19 wird auf Basis einer Reihung 28 umfassend eine Vielzahl Musiktitel mit Metainformationen eine Missionsplanung 29 erstellt. Die Missionsplanung 29 basiert auf einer erweiterten Songanalyse 37, in welcher ein Audiogramm 30 jeweiliger Audio-Dateien in Segmente aufgeteilt und segmentweise analysiert wurden. Anhand des persönlichen Regelwerkes 24 sowie anhand des Nutzungsverhaltens 19 werden in Abhängigkeit der Audiogramme 32, 33 zweier aufeinanderfolgend wiederzugebender Audio-Dateien Übergangszeitpunkte 31 gefunden. Anschließend werden erneut in Abhängigkeit des persönlichen Regelwerkes 24 und des Nutzungsverhaltens 19 Übergänge 34 konstruiert, wobei - wie im Ausschnitt 35 gezeigt-Höhen, Mitten, Bässe und Verstärkung über der Zeit im Übergangsbereich für die beteiligten Audio-Dateien definiert werden. Anschließend wird bei der Musikwiedergabe der Übergang 36 durchgeführt. Aus den Übergangszeiträumen der Lieder A und B wird ein Audio-Segment „Audio C“ ermittelt. Die Ausgabe des Main-Audio-Buffers lautet: „Wiedergabelied A bis Übergangszeitraum“ - „Audio C“- „Restlied B“.
  • 6 zeigt eine schematische Darstellung eines Ausführungsbeispiels einer Missionsplanung 29 zur Wiedergabe einer Vielzahl Audio-Dateien gemäß einem Ausführungsbeispiel eines erfindungsgemäßen Verfahrens. Mittels einer Online-Datenbank in Form eines Datenspeichers 5, einer grundsätzlichen Songanalyse 38 und einer erweiterten Songanalyse 39 werden Metainformationen 40 generiert, welche in den Musikdateien Song A bis Song H bislang nicht enthalten waren. Durch eine Güteberechnung 41 wird eine Übergangsgüte und eine semantische Güte jeweiliger Übergänge ermittelt und anschließend aufgrund eines Anwenderverhaltens 19 und eines persönlichen Regelwerkes 24 eine Clusterung 42 ausgeführt. Hierbei werden die Audio-Dateien in Lied-Cluster A, B und C kategorisiert, welche sich durch Gemeinsamkeiten hinsichtlich der Metainformationen auszeichnen. Es entsteht ein erstes Cluster 43 und eine Clusterreihenfolge 44. Innerhalb der Lied-Cluster A, B, C werden interne Reihenfolgen 45 der einzelnen Audio-Dateien festgelegt. Hieraus ergibt sich eine Reihung (Englisch: „Queue“) 46, welche durch eine manuelle Modifikation 47 und eine Änderung 48 aufgrund eines Anwenderverhaltens zu einer modifizierten Reihung 28 verarbeitet wird.
  • 7 zeigt eine schematische Darstellung einer erweiterten Songanalyse, in welcher eine Audio-Datei 6a einer Makrosegmentierung 49 unterzogen wird. Die Makrosegmente werden anschließend einer Mikrosegmentierung 50 und einer Genre-Klassifikation 51 unterzogen. Die Chorus-Segmente 52 sind hierbei fett dargestellt. Anschließend erfolgen eine semantische Makrosegmentierung 53, wobei die Genre-Klassifikation 51 Einfluss auf die semantische Mikrosegmentierung 50 nimmt. Durch eine inhaltliche Betrachtung kann eine Segmentinterpretation 52 für die Genre-Klassifikation 51 verwendet werden. Zwei Phasen (Phase 1, Phase 2) werden definiert und Übergangsfaktoren 54 bestimmen anschließend die Audio-Wiedergabe 9.
  • 8 zeigt eine schematische Darstellung des Prozessblocks zur Bestimmung von Übergangszeitpunkten, in welcher die Segmente 58 der Audio-Datei 6a, sowie die Segmente 59 der Audio-Datei 6b vorliegen. In mehreren Prozessschritten wird anhand der Segmentgrenzen die Auswahl an Übergangszeitpunkten für jede Audio-Datei auf die Anzahl 1 eingeschränkt. Übergangszeitpunkte 60 unter Einfluss der Anwenderaktivität (eines Anwenderaktivitätslevels oder einer Anwenderaktivitätskategorie oder einer Anwenderaktivitätsstufe) zeigen für Audio-Datei 6a die potenziellen Übergangszeitpunkte, nach ausschließlichem Einfluss der Anwenderaktivität. Übergangszeitpunkte 61 unter Einfluss des persönlichen Regelwerks zeigt für Audio-Datei 6a die daraus gewählte Menge an Übergangszeitpunkte unter Einfluss des persönlichen Regelwerks, sowie inhaltlichem Parameter. Der final gewählte einzelne Übergangszeitpunkt für Audio-Datei 6a, welcher anhand eines technischen Parameters festgelegt wird, ist im final gewählten Übergangszeitpunkt unter Einfluss technischer Parameter dargestellt. Dieser stellt für einen Übergang aus Audio-Datei 6a in Audio-Datei 6b den Klimax des Übergangszeitraumes dar.
  • 9 zeigt eine schematische Skizze zur Anwenderaktivitätsberechnung, wie sie zur Anwendung in einem erfindungsgemäßen Verfahren verwendet werden kann. Das Benutzungsverhalten 19 eines Musikplayers, das Fahrverhalten 21 eines Fortbewegungsmittels sowie ein umweltbedingter Kontext 22 führen zur Definition einer Position eines Reglers 55 zwischen den Eigenschaften „aktiv“ und „wenig aktiv“. Über eine Anwenderschnittstelle 57 kann der Anwender eine manuelle Einstellung 56 vornehmen und somit Einfluss auf die anwenderaktivitätsbezogene Gestaltung von Übergängen nehmen.
Embodiments of the invention:
  • 1a shows a schematic representation of an embodiment of a car according to the invention 10 as a means of transportation on the driver's seat a user has taken place. The user is holding a smartphone 20 with him, which maintains audio files in a (not shown) data storage, which via speakers 1 and an evaluation unit 2 to be reproduced mixed in accordance with the invention. A touch screen 3 serves the receipt of user input. For example. the user can use the touchscreen 3 Give ratings for rendered transitions. In addition, the user can start a playback in response to which the inventive method is performed. In particular, the user can influence parameters, audio files to be considered and weighting parameters for the design of a transition according to the invention.
  • 1b shows components of an embodiment of a device according to the invention. In a data store 5 are audio files 6a . 6b . 6c contained, which are provided by a user for playback. The audio files 6a . 6b . 6c can represent the user's entire library or a part (such as a playlist). The audio files 6a . 6b . 6c each have a header 7 which contains metadata (eg genre, title, artist, album, year of publication, etc.). In addition, the audio files point 6a , 6b, 6c audio material 8th on which contains the actual music playback information. A segmentation of the audio material according to the invention 8th has segments of predefined categories (Intro 12 , Stanza 13 , Chorus / refrain 14 and outro 15 ) identified. This may be in response to starting a replay and / or creating the files in the data repository 5 respectively. According to the invention, the segments are used in the design of transitions by an electronic control unit 2 as an evaluation unit for playback by means of the loudspeaker 1 used. The result is an audio signal 9 a sound pressure level L p over the time t, which in a time domain through the audio file 6a in a transition area 11 through the audio files 6a and 6b and in a third time range through the second audio file 6b is defined. The transition area 11 is in particular not by a predefined period of time, but by a duration of two such segments of the music files 6a . 6b defined as having been found suitable for the design of the transition. In particular, the transition area 11 a total duration of a selected segment of the first audio file 6a , a selected segment of the second audio file 6b and / or a respective selected segment of the audio files 6a, 6b.
  • 2 shows a schematic representation of a method for aggregation of fleet data, by means of which cross-user insights and preferences for the design of a transition according to the invention can be used. Client systems 18 collect the user behavior 19 regarding a variety of music players, the driving behavior 21 a variety of vehicles including the music players 19 and associated environmental contexts 22 for a variety of users 27 , The personal preferences 23 the user 27 be sent to a backend system 17 sent in the form of a server. The server finds similarities in personal preferences 23 the user 27 and determines general preferences 25 from these. Finally, the backend system creates 17 a general set of rules 26 for the design of appealing transitions according to the invention. These can be a client system considered here 16 of a considered user, which also has a usage behavior 19 of the music player, a driving behavior 21 and an environmental context 22 want to optimize the determination of a transition in accordance with the invention. The personal preferences 23 lead to a personal set of rules 24 , The personal preferences 23 are also using the general preferences 25 in the backend system 17 for the generation of the general rules 26 used. The general rules 26 Finally, when creating the personal rules 24 used.
  • 3 shows a clustering or categorization of different music style directions in a diagram in which the tendency of the categories with respect to a melodic character (containing melodies) is plotted on the abscissa and the velocity (beats per minute, BPM) are plotted on the ordinate.
  • 4 shows an alternative representation of the relationships between a variety of client systems 18 a variety of smartphones 20 include, a backend system 17 which is a data store 5 and for generating a replay 28 is set up, as well as a considered client system 16 , which from a passenger car 10 and an information technology with the car 10 coupled smartphone 20 consists. The smartphone 20 of the client system 16 serves as a data store for audio files and has an evaluation unit (not shown). Sensory by the car 10 Detected vehicle situations and conditions are wirelessly to the smartphone 20 which carries out the steps of a method according to the invention for designing a transition.
  • 5 illustrates an embodiment of steps in transition design in a client system with automatic DJ software. From an online database as a data store 5 , a personal set of rules 24 and a usage behavior 19 is based on a ranking 28 includes a variety of music tracks with meta information mission planning 29 created. The mission planning 29 based on an extended song analysis 37 in which an audiogram 30 audio files were segmented and analyzed segment by segment. Based on the personal rules 24 as well as the usage behavior 19 become dependent on the audiograms 32 . 33 two consecutive audio files to be transited 31 found. Subsequently, again depending on the personal rules 24 and the usage behavior 19 transitions 34 constructed, with - as in the neckline 35 Shown are treble, mids, bass, and gain over time in the transition area for the audio files involved. Then, when the music is playing, the transition 36 carried out. From the transitional periods of the songs A and B, an audio segment "Audio C" is determined. The output of the main audio buffer is: "Play Song A to Transition Period" - "Audio C" - "Remaining Song B".
  • 6 shows a schematic representation of an embodiment of a mission planning 29 for reproducing a plurality of audio files according to an embodiment of a method according to the invention. By means of an online database in the form of a data store 5 , a fundamental song analysis 38 and an extended song analysis 39 become meta-information 40 generated, which were not included in the music files Song A to Song H so far. By a quality calculation 41 a transition quality and a semantic quality of respective transitions are determined and subsequently based on a user behavior 19 and a personal set of rules 24 a clustering 42 executed. Here, the audio files are categorized into song clusters A, B and C, which are characterized by similarities in meta-information. The result is a first cluster 43 and a cluster order 44 , Within the song clusters A, B, C become internal orders 45 of the individual audio files. This results in a ranking (English: "Queue") 46, which by a manual modification 47 and a change 48 due to user behavior to a modified ranking 28 is processed.
  • 7 shows a schematic representation of an extended song analysis in which an audio file 6a a macrosegmentation 49 is subjected. The macro segments are then micro-segmented 50 and a genre classification 51 subjected. The chorus segments 52 are shown in bold here. Subsequently, a semantic macro-segmentation takes place 53 , where the genre classification 51 Influence on semantic microsegmentation 50 takes. By a contentwise consideration, a segment interpretation 52 for the genre classification 51 be used. Two phases (phase 1 , Phase 2 ) are defined and transition factors 54 then determine the audio playback 9 ,
  • 8th shows a schematic representation of the process block for determining transition times, in which the segments 58 the audio file 6a , as well as the segments 59 the audio file 6b available. In several process steps, the selection of transition times for each audio file is based on the segment boundaries on the number 1 limited. Transition times 60 under the influence of the user activity (a user activity level or a user activity category or a user activity level) point for audio file 6a the potential transitional periods, after the sole influence of user activity. Transition times 61 under the influence of personal rules shows for audio file 6a the selected amount of transitional periods under the influence of personal rules and content parameters. The final selected single transition time for audio file 6a , which is determined on the basis of a technical parameter, is shown under the influence of technical parameters in the finally selected transition time. This provides for a transition from audio file 6a in audio file 6b the climax of the transitional period
  • 9 shows a schematic sketch for user activity calculation, as it can be used for application in a method according to the invention. The usage behavior 19 a music player, the driving behavior 21 a means of transport and an environmental context 22 lead to the definition of a position of a controller 55 between the properties "active" and "not very active". Via a user interface 57 the user can do a manual adjustment 56 and thus influence the user-activity-related design of transitions.

In Ergänzung zur vorstehenden Beschreibung werden nachfolgend beispielhaft und ohne einschränkende Intention bezüglich des Erfindungsgedankens weitere mögliche Ausgestaltungen diskutiert, deren Merkmale insbesondere mit den vorstehenden Gegenständen kombiniert werden können.In addition to the above description, further possible embodiments are discussed below by way of example and without any restrictive intention with regard to the inventive concept, the features of which can be combined in particular with the above objects.

Die vorliegende Erfindung betrifft eine neuartige Software, um automatisch die Reihenfolge einer gegebenen Menge an Liedern anzupassen, einen Übergangszeitpunkt, sowie eine Übergangsform zwischen zwei digitalen Liedern auszuwählen und die Lieder mithilfe eines fließenden, harmonischen, synchronisierten und semantisch passenden Übergangs zu überblenden.The present invention relates to novel software for automatically adjusting the order of a given set of songs, selecting a transition time, as well as a transitional shape between two digital songs, and blending the songs using a flowing, harmonic, synchronized, and semantically appropriate transition.

Die genannten Funktionalitäten werden dabei dem echten Auflegeverhalten von zeitgemäßen, menschlichen Radio- oder Club-DJs angepasst, sowie den situationsabhängigen Bedürfnissen des Users, um diesem ein optimales Musikerlebnis zu gewähren. Die Anpassung geschieht zusätzlich zu technischen und semantischen Kriterien anhand der gespeicherten Präferenzen des Users, einer analysierten Useraktivität, sowie analysierten gesellschaftlichen Trends aus aggregierten Flottendaten.These functions are adapted to the real Auflegeverhalten of contemporary, human radio or club DJs, as well as the situation-dependent needs of the user to give him an optimal music experience. The adaptation is done in addition to technical and semantic criteria based on the stored preferences of the user, an analyzed user activity, as well as analyzed social trends from aggregated fleet data.

Die hierbei beschriebene Erfindung bezieht sich auf eine Implementierung innerhalb eines Musikplayers mit Zugriff auf digitale Audio Dateien. Dieser Musikplayer kann innerhalb eines beliebigen technischen Gerätes implementiert sein.The invention described herein relates to an implementation within a music player with access to digital audio files. This music player can be implemented within any technical device.

Die hierbei beschriebene Erfindung bezieht sich auf eine Implementierung im Automobil und der daraus hervorgehenden Vorteile. Dennoch funktioniert die Software außerhalb des Automobils, wobei lediglich die Funktionsweise an einigen Stellen eingeschränkt ist.The invention described herein relates to an implementation in the automobile and the advantages resulting therefrom. Nevertheless, the software works outside of the car, with only the functionality is limited in some places.

Die Anforderungen an das Musikerlebnis sind in der heutigen Zeit immer weiter gestiegen. Dies erkennt man daran, dass heutzutage eine Vielzahl an Services existiert, welche automatisch für den User passende Lieder auswählen. Besonders das Thema DJing ist gegenwärtig immer populärer geworden, was man daran erkennt, das auf Festivals vorwiegend DJs spielen, zeitgemäße Chartproduktionen überwiegend von DJs angefertigt sind und immer mehr Plattformen zum Konsum von sogenannten DJ Mixes existieren. Der Konsum eines Musikerlebnisses, welches von einem menschlichen DJ konstruiert und an die Bedürfnisse des Konsumenten angepasst wird, bevorzugen viele Musikkonsumenten gegenüber dem konventionellen Konsum von Radiostreams oder dem übergangslosen Abspielen einzelner Lieder. Der Musikkonsument bevorzugt es somit ein, von einem persönlichen DJ angefertigtes Musikerlebnis zu konsumieren, in welchem die Bedürfnisse des Users berücksichtigt werden.The demands on the music experience have risen ever more today. This can be recognized by the fact that nowadays there is a multitude of services which are automatically suitable for the user Select songs. DJing in particular has become increasingly popular at the moment, as evidenced by the fact that festivals predominantly play DJs, contemporary chart productions are predominantly made by DJs and more and more platforms for the consumption of so-called DJ mixes exist. The consumption of a music experience, which is constructed by a human DJ and adapted to the needs of the consumer, many music consumers prefer to the conventional consumption of radio streams or the seamless playback of individual songs. The music consumer thus prefers to consume a music experience made by a personal DJ, in which the needs of the user are taken into account.

Die vorliegende Erfindung betrifft eine Software, welche einen persönlichen DJ simuliert. Hierbei werden die Anordnung einer gegebenen Menge an Liedern, die Wahl eines Übergangszeitpunktes, die Wahl einer Übergangsform und die Durchführung dieser angepassten Übergangsform als Überblendung zwischen zwei Liedern als Tätigkeiten eines persönlichen DJs definiert. Diese werden von der Software autonom durchgeführt.The present invention relates to software that simulates a personal DJ. Here, the arrangement of a given set of songs, the selection of a transition time, the choice of a transitional form and the implementation of this adapted transitional form as a transition between two songs are defined as activities of a personal DJs. These are carried out autonomously by the software.

Besonders das frühzeitige Überblenden eines Liedes in ein Folgelied ist heutzutage sehr populär und kann zu einer Erhöhung des Musikerlebnisses führen.Especially the early fading of a song into a follow-up song is very popular nowadays and can lead to an increase of the musical experience.

Die Funktionalität der Auswahl einer Menge von geeigneten Liedern, welche an die Bedürfnisse des Users angepasst sind, existiert bereits und erhöht die Qualität des mit dieser Erfindung geschaffenen Musikerlebnisses.The functionality of selecting a set of suitable songs adapted to the needs of the user already exists and enhances the quality of the music experience created with this invention.

Die Liedstruktur moderner, populärer Unterhaltungsmusik richtet sich immer mehr nach allgemeinen Trends und wird daher innerhalb eines Musikgenres immer standardisierter. Daher ist die technische Möglichkeit gegeben, unter Berücksichtigung der Trends der Liedstruktur des Genres automatisch eine Vielzahl an Liedern in korrekte Segmente zu unterteilen und diese auf die Bedeutung für die Liedstruktur zu untersuchen.The song structure of modern, popular entertainment music is more and more in line with general trends and therefore becomes more and more standardized within a music genre. Therefore, the technical possibility is given, taking into account the trends of the song structure of the genre, automatically subdivide a plurality of songs into correct segments and to examine them for the meaning of the song structure.

Der Aufbau heutiger Lieder ist außerdem aufgrund der klaren Liedstruktur, klaren Rhythmuselemente und einer meist konstant eingehaltenen Geschwindigkeit sehr gut für die Überblendung mittels fließender Übergänge verschiedener, kreativer Übergangsformen geeignet.The structure of today's songs is also due to the clear song structure, clear rhythm elements and a mostly constant speed very well suited for the transition by means of flowing transitions of different, creative transitional forms.

Da die in mobile Endgeräte eingebauten Prozessoren immer schneller und Audio Signal Processing Verfahren immer effizienter werden, ermöglicht dies die Funktionsweise der Software in angemessener Zeit.As the processors built into mobile devices become faster and faster and audio signal processing procedures become more efficient, this allows the software to function in a timely manner.

Der Zugriff auf eine Vielzahl von Musiktiteln wird aufgrund digitaler Audioformate und der Vielzahl an Musikstreaming Services immer einfacher. Aufgrund des einfachen Zugriffs auf eine hohe Menge an Musik, können immer mehr für den User passende Lieder ausgesucht werden, zwischen welchen auch die Übergangsgüte nahezu maximal ist.Access to a variety of music tracks is becoming easier with digital audio formats and a variety of music streaming services. Due to the easy access to a high amount of music, more and more suitable songs for the user can be selected, between which also the transition quality is almost maximum.

Die Technologie die Reihenfolge einer Menge an Liedern anzupassen, um eine Vielzahl von Übergängen mit hoher Übergangsgüte zu erreichen, existiert im Stand der Technik bereits, berücksichtigt allerdings nicht semantische Kriterien, situationsabhängige, persönliche Präferenzen des Users, sowie gesellschaftliche Trends.The technology of adapting the order of a set of songs to achieve a variety of high transient quality transitions already exists in the prior art, but does not take into account semantic criteria, situation-dependent personal preferences of the user, as well as societal trends.

Die Technologie, Lieder korrekt zu segmentieren und fließende, harmonische und synchronisierte Übergänge zu erzeugen, existiert im Stand der Technik bereits. Allerdings erfolgt die Segmentierung bisher weitestgehend ohne semantisch korrekte Bezeichnung der Segmente. Die Wahl eines Übergangszeitpunktes, sowie einer Übergangsform erfolgt bisher ohne Berücksichtigung von semantischen Kriterien oder den situationsabhängigen Präferenzen des Users.The technology of correctly segmenting songs and creating smooth, harmonious and synchronized transitions already exists in the prior art. However, segmentation has so far largely been done without a semantically correct designation of the segments. The choice of a transitional time, as well as a transitional form takes place so far without consideration of semantic criteria or the situation-dependent preferences of the user.

Aus dem Stand der Technik ist bisher Software bekannt, welche zwei Lieder temposynchronisiert mit einem Lautstärke-Crossover oder Cut ineinander übergehen lässt. Die Überblendung findet allerdings immer in einem vordefinierten Zeitraum statt. Dieser beträgt zum Beispiel acht Beats. Lediglich der Zeitpunkt acht Beats vor dem als Ende des Liedes erachteten Zeitpunktes, wird als Out-Point gesetzt, ebenso verhält es sich mit dem In-Point, welcher acht Beats nach dem als Beginn des Liedes erachteten Zeitpunktes angesetzt wird. Eine Software, welche das beschriebene Verfahren implementiert hat, ist Serato Pyro. Hierbei wird das Lied inhaltlich nicht auf semantische Segmente analysiert, wodurch auch keine weiteren potenziellen In Points und Out Points bestimmt werden, an denen ein Übergang zwischen zwei digitalen Liedern erfolgen kann. Die Auswahl der Übergangszeitpunkte und Übergangsformen wird somit nicht verändert.Software is known from the prior art, which allows two songs temposynchronisiert with a volume crossover or cut merge into each other. However, the transition always takes place in a predefined period of time. This is for example eight beats. Only the time eight beats before the end of the song considered time is set as an out point, as it is with the in-point, which is set eight beats after the time considered the beginning of the song. One software that has implemented the described method is Serato Pyro. The content of this song is not analyzed for semantic segments, which means that no further potential In Points and Out Points are determined where a transition between two digital songs can take place. The choice of transitional periods and transitional forms is therefore unchanged.

In der Software Serato Pyro ist eine automatische Anordnung einer Menge an Liedern realisiert, welche sich auf Metainformationen wie Geschwindigkeit, Tonhöhe und weiteren Parametern zur Ähnlichkeitsbestimmung zweier digitaler Audiosignale stützt. Anhand dieser Parameter werden die Lieder mit hoher Ähnlichkeit wahrscheinlicher direkt hintereinander gespielt. Allerdings erfolgt die Anreihung der Lieder nicht angepasst an die situationsabhängigen, persönlichen Bedürfnisse des Users, was einen wesentlichen Unterschied zu der sogenannten Missionsplanung in dieser Erfindung darstellt. In the software Serato Pyro an automatic arrangement of a lot of songs is realized, which is based on meta information such as speed, pitch and other parameters for the similarity determination of two digital audio signals. Using these parameters, the high-similarity songs are more likely to be played directly one after the other. However, the alignment of the songs is not adapted to the situation-dependent, personal needs of the user, which is a significant difference to the so-called mission planning in this invention.

Aus dem Stand der Technik ist außerdem die Software Pacemaker bekannt, welche ebenfalls synchronisierte Übergänge zwischen zwei Liedern automatisch durchführt. Die Form der Übergänge beschränkt sich auf verschiedene Formen von Lautstärke-Crossovern, Übergängen mit geringer Beeinflussung der unterschiedlichen Frequenzbänder durch einen Equalizer, sowie einen Cut und lässt weitere kreative Übergangsformen aus. In der Software werden mehrere potenzielle Übergangszeiträume in Abhängigkeiten der zu überblendenden Lieder bestimmt. Die Auswahl der Übergangszeitpunkte, sowie Übergangsformen erfolgt allerdings nicht unter Berücksichtigung semantischer Kriterien oder situationsabhängiger, persönlicher Bedürfnisse des Users, sondern ausschließlich unter Berücksichtigung der Maximierung der Übergangsgüte.Also known from the prior art is the Pacemaker software which also automatically synchronizes transitions between two songs. The shape of the transitions is limited to various forms of volume crossover, transitions with little influence on the different frequency bands by an equalizer, as well as a cut and leaves further creative transitional forms. The software determines several potential transitional periods depending on the songs being transposed. The selection of transitional periods, as well as transitional forms, however, does not take into account semantic criteria or situation-dependent, personal needs of the user, but only taking into account the maximization of the transitional quality.

Mit dem Begriff „synchronisiert“ ist gemeint, dass zwei digitale Lieder bezüglich ihrer Geschwindigkeit angeglichen werden, und die einzelnen Beats, welche durch die impulsartigen Schläge der Bassdrum im Tieffrequenzbereich gekennzeichnet sind, zeitlich exakt übereinandergesetzt werden. Diese zeitlich exakte Überlagerung der Lieder wird bei dem synchronen Abspielen beider Lieder beibehalten, und kann bei minimaler Veränderung der Geschwindigkeit innerhalb des Liedes, sogar korrigiert werden. Der fachliche Begriff dafür ist das automatische „Beat Matching“. Die beschriebene Technologie ist Stand der Technik und wird für die Erfindung vorausgesetzt.By the term "synchronized" is meant that two digital songs are matched in their speed, and the individual beats, which are characterized by the pulse-like beats of the bass drum in the low-frequency range, are time exactly superimposed. This time-exact overlay of the songs is maintained in the synchronous playback of both songs, and can even be corrected with minimal change in the speed within the song. The technical term for this is the automatic "Beat Matching". The technology described is state of the art and is required for the invention.

Mit dem Begriff „Übergangsgüte“ ist die Qualität des Übergangs gemeint, welche sich mit positiverer Wahrnehmung durch einen menschlichen Hörer erhöht. Der Übergang soll somit als „fließend“ erachtet werden.By the term "transitional quality" is meant the quality of the transition, which increases with more positive perception by a human listener. The transition should therefore be considered as "flowing".

Mit der Anpassung an situationsabhängige Bedürfnisse ist eine Anpassung unter Berücksichtigung folgender Kriterien gemeint:

  • - situationsabhängiges Verhalten des Users (Useraktivität) unter Berücksichtigung:
    • - des Benutzungsverhaltens des Musikplayers,
    • - des Fahrverhaltens sowie
    • - des umweltbedingten Kontextes, und
  • - persönliche Präferenzen des Users (persönliches Regelwerk).
The adaptation to situation-dependent needs means an adjustment taking into account the following criteria:
  • - Situation-dependent behavior of the user (user activity) taking into account:
    • - the usage behavior of the music player,
    • - the driving behavior as well
    • - the environmental context, and
  • - personal preferences of the user (personal rules).

Mit der Anpassung an gesellschaftliche Trends aus aggregierten Flottendaten ist eine Anpassung unter Berücksichtigung folgender Kriterien gemeint:

  • - Allgemeine Präferenzen aller User der Software (allgemeines Regelwerk).
By adapting to social trends from aggregated fleet data, an adjustment is made taking into account the following criteria:
  • - General preferences of all users of the software (general rules).

Mit einem Lied ist ein digitales Audiosignal inklusive Metainformationen bezeichnet.A song is a digital audio signal including meta information.

Eine Queue stellt eine Liste von Liedern dar, in welcher die Abspielreihenfolge der Lieder festgelegt werden kann.A queue represents a list of songs in which the playing order of the songs can be determined.

Die Software kann innerhalb eines Musikplayers implementiert werden. Der Software muss eine Menge an Liedern, welche abgespielt werden sollen, zur Verfügung gestellt werden. Diese werden während der Benutzung der Software in einer Queue gespeichert. Hierbei ist es irrelevant ob die Lieder in die Queue manuell vom User oder von einer externen Software automatisch hinzugefügt werden.The software can be implemented within a music player. The software needs a lot of songs to be played back. These are stored in a queue while using the software. It is irrelevant whether the songs are added to the queue manually by the user or by an external software automatically.

Bei dieser Software wird von einer Implementierung innerhalb eines Musikplayers ausgegangen. Dieser besitzt folgende Funktionalität:

  • - Das Hinzufügen und Löschen von Liedern in einer Queue
  • - Die Abspielreihenfolge der Queue verändern
  • - Das Vor- und Zurückspulens innerhalb von Liedern
  • - Den Wechseln zum in der Queue nächsten Lied oder einem beliebigen Lied
  • - Das Pausieren und erneute Abspielen eines Liedes
This software assumes an implementation within a music player. This has the following functionality:
  • - Adding and deleting songs in a queue
  • - Change the playing order of the queue
  • - Fast-forwarding and rewinding within songs
  • - Changing to the next song in the queue or any song
  • - Pause and replay a song

Auch wenn es für die hier beschriebene Software nicht notwendig ist, wird hier die Implementierung der Software innerhalb eines Musikplayers beschrieben, welcher eine automatische DJ Funktion bietet. Ohne diese Funktionalität würde lediglich die Funktionalität der hier beschriebenen Erfindung eingeschränkt sein. Ein solcher Musikplayer mit automatischer DJ Funktion wird im Folgenden als automatische DJ Software bezeichnet.Although it is not necessary for the software described here, it describes the implementation of the software within a music player which provides an automatic DJ function. Without this functionality, only the functionality of the invention described herein would be limited. Such a music player with automatic DJ function is hereinafter referred to as automatic DJ software.

Die automatische DJ Software bietet dem User außerdem folgende manuelle Eingriffe:

  • - Unterbrechen des automatisch eingeleiteten Überganges durch die Software
  • - Manuelles Einleiten eines automatischen Überganges zwischen dem aktuellen Lied und dem Folgelied in der gegebenen Abspielreihenfolge
  • - Manuelles Einleiten eines Blitzübergangs zwischen dem aktuellen Lied und dem Folgelied in der gegebenen Abspielreihenfolge
  • - Die Möglichkeit den Mix Modus zu verändern
The automatic DJ software also offers the user the following manual intervention:
  • - Interrupt the automatically initiated transition through the software
  • - Manually initiating an automatic transition between the current song and the following song in the given play order
  • - Manually initiating a flash transition between the current song and the following song in the given play order
  • - The possibility to change the mix mode

Die Software kann folgende Funktionalitäten innerhalb des Musikplayers beeinflussen:

  • - Die Anordnung der Lieder in einer gegebenen Queue
  • - Den abgespielten Audiostream
The software can influence the following functions within the music player:
  • - The arrangement of songs in a given queue
  • - The played audio stream

Das Gesamtsystem der automatischen DJ Software besteht aus einer Clientsoftware, welche innerhalb eines Musikplayers implementiert werden kann, sowie einem Backendsystem mit Online Datenbank, auf welches die Gesamtheit aller Clientsysteme Zugriff hat.The overall system of the automatic DJ software consists of a client software that can be implemented within a music player, as well as a backend system with an online database to which the entirety of all client systems has access.

Die Software enthält auf dem Backendsystem ein allgemeines Regelwerk, welches automatisch unter Einfluss von aggregierten Flottendaten sowie manuell unter Einfluss einer Anpassung durch den Provider der Software, modifiziert werden kann. Die Modifizierung erfolgt mit dem Zweck die Funktionalität der Software an gesellschaftlichen Trends des Musikkonsumverhaltens anzupassen. Das allgemeine Regelwerk kann auf die Clientsoftware geladen werden, um das dort vorliegende persönliche Regelwerk zu beeinflussen.The software contains a general set of rules on the backend system, which can be modified automatically under the influence of aggregated fleet data as well as manually under the influence of an adaptation by the provider of the software. The modification is done with the purpose of adapting the functionality of the software to societal trends in music consumption behavior. The general rules can be loaded on the client software to influence the personal rules that exist there.

Die Software kann von verschiedenen Usern verwendet werden, wobei jeder User ein eigenes Userprofil anlegen muss und dieses vor jeder Benutzungseinheit initial auswählen muss. Jedem Userprofil sind persönliche Präferenzen, ein persönliches Regelwerk, sowie gespeicherte Useraktivitätsinformationen zugeordnet.The software can be used by different users, whereby each user must create his own user profile and must first select this before each use unit. Each user profile is assigned personal preferences, a personal set of rules, as well as stored user activity information.

Mit einer Benutzungseinheit ist der Zeitraum der Benutzung der Software von Neustart der Software bis zum Beenden der Software gemeint.A usage unit refers to the period of use of the software from rebooting the software to terminating the software.

Die Software speichert während jeder Benutzungseinheit die Häufigkeit, in der ein Lied durch den User des aktuellen Userprofils abgespielt wird. Dieser Wert wird mit vergangenen Abspielraten summiert. Die Lieder können hinsichtlich der Häufigkeit der allgemeinen Abspielungen sortiert werden. Der Durchschnittswert über die Häufigkeiten der Abspielungen aller Lieder, welche mehr als zwei Mal abgespielt wurden, wird berechnet. Alle Lieder welche eine Häufigkeit der Abspielungen über diesem Wert aufweisen, werden als Lieblingslieder markiert.The software saves the frequency during which each song is played by the user of the current user profile. This value is summed with past play rates. The songs can be sorted in terms of the frequency of the general plays. The average value of the frequencies of the plays of all songs that have been played more than twice is calculated. All songs that have a frequency of plays above this value are marked as favorite songs.

Die Funktionalitäten der Software sind wie folgt gegliedert:

  • - Die dynamische Anordnung der Lieder in einer vorgegebenen Queue (Missionsplanung)
  • - Analyse des Liedes zur Erhebung von Metainformationen, außerhalb der grundsätzlichen Parameter. (Erweiterte Songanalyse)
  • - Bestimmung von potenziellen In-Points und Out-Points innerhalb eines Liedes / Auswahl eines Out-Points im aktuell spielenden Lied, sowie einem In Point in dem nächsten Lied in der Queue. (Übergangszeitpunkt auswählen)
  • - Wahl einer abstrakten Übergangsform / Anpassen der abstrakten Übergangsform an die aktuelle Übergangssituation. (Übergang konstruieren)
  • - Automatische Durchführung des Überganges zwischen zwei Liedern (Übergang Durchführen)
The functionalities of the software are structured as follows:
  • - The dynamic arrangement of songs in a given queue (mission planning)
  • - Analysis of the song for the collection of meta-information, outside the fundamental parameters. (Advanced song analysis)
  • - Determining potential In points and Out points within a song / Selecting an Out point in the currently playing song, as well as an In Point in the next song in the queue. (Select transition date)
  • - Choice of an abstract transitional form / Adjusting the abstract transitional shape to the current transitional situation. (Construct transition)
  • - Automatic execution of the transition between two songs (Transition Perform)

Missionsplanung:Mission Planning:

Die Missionsplanung stellt eine Entscheidungsmaschine dar, welche eine gegebene Menge an Liedern in der Queue in einer neuen Reihenfolge anordnet, welche den situationsabhängigen Bedürfnissen des Users angepasst sind.Mission planning is a decision engine that orders a given set of songs in the queue in a new order that matches the situation-dependent needs of the user.

Sie setzt sich aus sechs Phasen zusammen:

  • - Metainformationen
  • - Güteberechnung
  • - Clustering
  • - Erstes Cluster
  • - Clusterreihenfolge
  • - Interne Reihenfolge
It consists of six phases:
  • - Meta information
  • - Quality calculation
  • - Clustering
  • - First cluster
  • - Cluster order
  • - Internal order

Zusätzlich stellt die Missionsplanung eine Funktion zur Anpassung der Queue bei manueller Modifikation der Queue dar, sowie eine Funktion zur automatischen, dynamischen Anpassung der Queue bei Veränderung der Useraktivität.In addition, mission planning is a function for adjusting the queue during manual modification of the queue, as well as a function for automatic, dynamic adjustment of the queue when user activity changes.

Für die Funktionalität der Software sind grundsätzliche Metainformationen eines Liedes benötigt.For the functionality of the software basic meta-information of a song is needed.

Diese setzten sich für jedes Lied wie folgt zusammen:

  • - Geschwindigkeit
  • - Tonart (nur Grundton und Dur/Moll-Tonalität)
  • - hörbarer Anfangs/Endzeitpunkt
  • - Dauer
  • - Titel
  • - Interpret
  • - Genre
  • - Erscheinungsjahr
  • - Album
  • - Remixartist
  • - Produzent (oder Komponist)
  • - Energie des Liedes
  • - Stimmung des Liedes
These sat down for each song as follows:
  • - speed
  • - key (only root and major / minor tonality)
  • - audible start / end time
  • - Duration
  • - Title
  • - Artist
  • - genre
  • - Publishing year
  • - Album
  • - Remix artist
  • - producer (or composer)
  • - Energy of the song
  • - mood of the song

Diese Parameter werden aus den Metadaten der Audiodatei, aus der Online-Datenbank oder einer grundsätzlichen Songanalyse entnommen. Die Vollständigkeit der letzten sechs Informationen ist nicht optional.These parameters are taken from the metadata of the audio file, from the online database or a basic song analysis. The completeness of the last six pieces of information is not optional.

Falls das Genre innerhalb der Metadaten der Audiodatei, oder der Online Datenbank keinen Eintrag aufweist, kann es mithilfe der Information der erweiterten Songanalyse befüllt werden. Falls das Genre bereits existiert wird die Information der erweiterten Songanalyse in einer neuen Variable Genre 2 zusätzlich abgelegt.If the genre does not have an entry within the metadata of the audio file, or the online database, it can be filled using the advanced song analysis information. If the genre already exists, the advanced song analysis information will be in a new variable genre 2 additionally filed.

Mit einer grundsätzlichen Songanalyse sind Analysen zur Gewinnung folgender Informationen gemeint:

  • - Geschwindigkeit
  • - Tonart (nur Grundton und Dur/Moll-Tonalität)
  • - hörbarer Anfangs/Endzeitpunkt
With a fundamental song analysis analyzes are meant to obtain the following information:
  • - speed
  • - key (only root and major / minor tonality)
  • - audible start / end time

Dies sind Standardtechnologien, welche für diese Erfindung als vorausgesetzt gelten.These are standard technologies that are considered prerequisite for this invention.

Aus dem Stand der Technik sind Verfahren bekannt, welche die Stimmung und die Energie eines Liedes operationalisieren. Diese Parameter können bereits in den Metainformationen jedes Liedes hinterlegt sein oder mithilfe eines eigenen Verfahrens innerhalb der grundsätzlichen Songanalyse bestimmt werden.Methods are known in the art for operationalizing the mood and energy of a song. These parameters may already be stored in the meta-information of each song or determined by a separate method within the basic song analysis.

Metainformationen:meta:

Zu Beginn der Benutzung der Software müssen alle grundsätzlichen Metainformationen der Lieder in der Queue geladen werden. Dafür muss die Gesamtheit aller Lieder in der Queue zunächst einer grundsätzlichen Songanalyse unterzogen werden, falls die Informationen der grundsätzlichen Songanalyse nicht bereits lokal geladen wurden oder in der Datenbank für den entsprechenden Titel hinterlegt sind. Der zu analysierende Titel wird dabei hinsichtlich des Titelnamens, Interpretennamens, sowie der Dauer des Liedes identifiziert. Falls die Informationen in der Online Datenbank innerhalb eines Datensatzes mit gleichem Schlüssel vorhanden sind, werden die Informationen aus der Online Datenbank geladen.At the beginning of using the software, all basic meta-information of the songs must be loaded into the queue. For this, the entirety of all songs in the queue must first be subjected to a fundamental song analysis, if the information of the basic song analysis has not already been loaded locally or is stored in the database for the corresponding title. The title to be analyzed is identified with regard to the title name, artist name and duration of the song. If the information in the online database exists within a record with the same key, the information is loaded from the online database.

Bei Übereinstimmung mit keinem Datensatz in der Datenbank wird die grundsätzliche Songanalyse an dem Titel durchgeführt. Die Informationen aus der grundsätzlichen Songanalyse werden für einen Datensatz mit Titelnamen, Interpretennamen, sowie Dauer des Liedes als Schlüssel, in der Online Datenbank gespeichert.If there is no match in the database, the basic song analysis is performed on the title. The information from the basic song analysis is stored in the online database for a record with title name, artist name, and duration of the song as a key.

Güteberechnung:Grade calculation:

Die Missionsplanung errechnet für die gegebene Queue die allgemeine Güte. Diese setzt sich aus den folgenden Parametern zusammen:

  • - Übergangsgüte
  • - Semantische Güte
The mission planning calculates the general quality for the given queue. This consists of the following parameters:
  • - Transient quality
  • - Semantic goodness

Übergangsgüte:Transition goodness:

Die Übergangsgüte stellt das Maß dar, an welchem die Qualität eines potenziellen Überganges zwischen zwei digitalen Audiosignalen gemessen werden kann. Die Qualität setzt sich aus den Eigenschaften lückenlos, harmonisch und tempoähnlich zusammen. Eine hohe Übergangsgüte stellt einen potenziellen, optimalen Übergang dar und würde dem Zuhörer bei Durchführung eines Überganges zwischen den entsprechenden Liedern ein aufregendes Musikerlebnis bieten.The transient quality is the measure by which the quality of a potential transition between two digital audio signals can be measured. The quality is composed of the properties seamless, harmonious and tempo-like. A high transient quality represents a potential, optimal transition and would provide the listener with an exciting musical experience when making a transition between the songs.

Mit einem lückenlosen Übergang ist ein Übergang gemeint, welcher zwischen zwei unabhängigen digitalen Audiosignalen keinen Zeitraum ohne digitales Audiomaterial enthält.A gapless transition means a transition that does not contain a period of time between two independent digital audio signals without digital audio material.

Mit einem harmonischen Übergang ist ein Übergang gemeint, welcher einen Übergang zwischen zwei unabhängigen digitalen Audiosignalen darstellt, wobei die Harmonien der Lieder passend sind. Damit ist gemeint, dass die Tonart des Liedes hinsichtlich des Quintenzirkels passend ist. Der Übergang hat nur dann höchste Qualitätsgüte hinsichtlich der Harmonie, wenn sich das Folgelied in Bezug auf das aktuell spielende Lied in der gleichen Tonart, der parallelen Moll/Dur Tonart, der nächsthöheren, um eine Quinte verschobenen Tonart im selben Tongeschlecht, oder der nächstniedrigeren, um eine Quinte verschobenen Tonart im selben Tongeschlecht, befindet.By harmonic transition is meant a transition that represents a transition between two independent digital audio signals, with the harmonies of the songs being appropriate. By this it is meant that the key of the song is appropriate with regard to the circle of fifths. The transition only has the highest quality in terms of harmony if the following song in relation to the currently playing song in the same key, the parallel minor / major key, the next higher, shifted by a fifth key in the same tone, or the next lower, by a fifth shifted key in the same Tongeschlecht, is.

Mit einem tempoähnlichen Übergang ist gemeint, dass die beiden Lieder innerhalb des Übergangs von ihrer Geschwindigkeit her angeglichen werden können, ohne das das Lied als zu stark modifiziert wahrgenommen wird. Mit steigender Ähnlichkeit der Geschwindigkeit zwischen den Liedern nimmt auch die Übergangsgüte linear zu. Geschwindigkeitsdifferenz über 20 BPM sind eher ungeeignet für einen Übergang, da die Geschwindigkeit von zwei Liedern um mindestens 10 BPM verändert werden muss, was ein Lied merkbar verändert und ungenießbar macht. Daher führen Geschwindigkeitsdifferenzen, die den Wert von 20 BPM überschreiten, zu einer nicht linearen Senkung der Übergangsgüte. Die Differenz wird immer aus den ursprünglichen Geschwindigkeiten der Lieder in den Metainformationen berechnet und nicht aus der aktuellen Geschwindigkeit des bereits modifizierten Audiosignals. Allerdings bestehen abstrakte Übergangsformen, welche mit einer höheren Geschwindigkeitsdifferenz umgehen können. Sind diese abstrakten Übergangsformen im persönlichen Regelwerk des Users hoch priorisiert, führen Ausnahmeregelungen zur einer veränderten Berechnung der Übergangsgüte zwischen zwei Liedern spezifischer Genres.With a tempo-like transition, it is meant that the two songs within the transition can be matched in their speed without the song being perceived as too much modified. With increasing similarity of the speed between the songs, the quality of transition increases linearly. Speed differences above 20 BPM tend to be inappropriate for a transition, as the speed of two songs must be changed by at least 10 BPM, which makes a song noticeably altered and inedible. Therefore, speed differences exceeding the value of 20 BPM result in a nonlinear reduction in transient performance. The difference is always from the original one Speeds of the songs in the meta-information calculated and not from the current speed of the already modified audio signal. However, there are abstract transitional forms that can handle a higher speed difference. If these abstract transitional forms are highly prioritized in the user's personal rules, exceptions lead to a changed calculation of the transition quality between two songs of specific genres.

Semantische Güte:Semantic quality:

Für die Berechnung der semantischen Güte, werden die grundsätzlichen Metainformationen Genre, Erscheinungsjahr und Produzent betrachtet. Die Parameter Erscheinungsjahr und Produzent sind nicht notwendig, verbessern aber das Musikerlebnis.For the calculation of the semantic quality, the basic meta-information genre, year of publication and producer are considered. The parameters release year and producer are not necessary, but improve the music experience.

Die semantische Güte ist linear abhängig zu der Entfernung zwischen den Genres der Lieder. Die Entfernung zweier Genres entstammt dem persönlichen Regelwerk. Aus einem Graphen würde man die euklidische Distanz eines Vektors zwischen zwei Genres als die Entfernung zweier Genres bestimmen.The semantic quality is linearly dependent on the distance between the genres of the songs. The removal of two genres comes from the personal set of rules. From a graph one would determine the Euclidean distance of a vector between two genres as the distance of two genres.

Die semantische Güte ist außerdem linear abhängig zu der Entfernung zwischen den Erscheinungsjahren der Lieder. Die Entfernung zweier Erscheinungsjahre entstammt ebenfalls dem persönlichen Regelwerk. Die Erscheinungsjahre sind klassifiziert, sodass ein Lied mit dem Erscheinungsjahr 2007 und ein Lied mit dem Erscheinungsjahr 2009 eine Distanz von 0 aufweisen würden. Eine kleinere Entfernung in der Liste bedeutet eine höhere semantische Güte.The semantic quality is also linearly dependent on the distance between the release years of the songs. The removal of two years of publication also comes from the personal rules. The years of publication are classified so that a song with the release year 2007 and a song with the release year 2009 would have a distance of 0. A smaller distance in the list means a higher semantic quality.

Die semantische Güte erhöht sich um einen definierten Faktor für einen potenziellen Übergang zwischen zwei Liedern, welche in ihren Metainformationen eine Übereinstimmung der eingetragenen Produzenten, aber keine Übereinstimmung hinsichtlich der Interpreten aufweisen.The semantic quality increases by a defined factor for a potential transition between two songs, which have in their meta-information a match of the registered producers, but no agreement with regard to the interpreters.

In die Berechnung der semantischen Güte fließen außerdem die Ähnlichkeiten zweier Lieder hinsichtlich ihrer Energie und Stimmung ein.In the calculation of the semantic quality also the similarities of two songs in terms of their energy and mood flow.

Die semantische Güte kann von weiteren Parametern, welche eine Ähnlichkeit zwischen zwei Liedern beschreiben, beeinflusst werden.The semantic quality can be influenced by other parameters that describe a similarity between two songs.

Die Missionsplanung berechnet nun eine allgemeine Güte aus der Übergangsgüte und der semantischen Güte für jedes potenzielle Liedertupel innerhalb der Queue.Mission planning now calculates a general goodness of transient quality and semantic quality for each potential song tuple within the queue.

Clustering:clustering:

Lieder, welche derselben Genreklasse entstammen, werden in Genreclustern gesammelt.Songs from the same genre class are collected in genre clusters.

Die Einteilung der Genres in Genreklassen ist in dem persönlichen Regelwerk gespeichert.The classification of genres in genre classes is stored in the personal rules.

Es werden neue Clustertemplates erstellt, in welche später Lieder eines Genreclusters hinzugefügt werden. Die Größe der Clustertemplates repräsentiert die Anzahl der Lieder, welche später dem Cluster hinzugefügt werden.New cluster templates are created, into which later songs of a genre cluster are added. The size of the cluster templates represents the number of songs that will be added to the cluster later.

Die Größe der Clustertemplates, erfolgt anhand des Parameters der Useraktivität. Ist die Useraktivität hoch, bedeutet dies, dass der User sehr aktiv ist und entsprechend auch ein aufregendes, besonders dynamisches Musikerlebnis fordert. Aus diesem Grund erfolgt ein schnellerer Wechsel zwischen verschiedenen Clustern. Eine niedrigere Useraktivität führt zu einem langsameren Wechsel zwischen Cluster, da vom User ein entspanntes Musikerlebnis gewünscht ist.The size of the cluster templates is based on the parameter of the user activity. If the user activity is high, this means that the user is very active and accordingly demands an exciting, especially dynamic music experience. For this reason, a faster change takes place between different clusters. A lower user activity leads to a slower change between clusters, since the user wants a relaxed music experience.

Die Größe der Clustertemplates wird anhand der Useraktivität nicht absolut festgelegt. Es wird lediglich ein Toleranzraumes festgelegt, in welchem die Größe der Clustertemplates zufällig variiert. Die Erweiterung des Toleranzraumes steigt linear mit Erhöhung der Useraktivität. Der Toleranzraum erweitert sich allerdings ungleichmäßig in Richtung kleinerer Clustergrößen.The size of the cluster templates is not set absolutely based on user activity. Only a tolerance space is defined in which the size of the cluster templates varies randomly. The expansion of the tolerance space increases linearly with an increase in user activity. The tolerance space, however, widens unevenly in the direction of smaller cluster sizes.

Die Befüllung der Clustertemplates mit Liedern aus einem Genrecluster geschieht anhand folgender Kriterien in genannter Priorisierung:

  • - Ähnlichkeit der Genredistanz zwischen zwei Liedern
  • - Ähnlichkeit der allgemeinen Güte zwischen zwei Liedern
  • - Ähnlichkeit der Distanz der Erscheinungsjahre zwischen zwei Liedern
  • - Ähnlichkeit der Stimmung zwischen zwei Liedern
  • - Ähnlichkeit der Energie zwischen zwei Liedern
The filling of the cluster template with songs from a genre cluster is done according to the following criteria in mentioned prioritization:
  • - Similarity of the genredistanz between two songs
  • - Similarity of the general goodness between two songs
  • - Similarity of the distance of the year of publication between two songs
  • - Similarity of mood between two songs
  • - Similarity of energy between two songs

Bsp.: Zwei Lieder mit hoher allgemeiner Güte innerhalb einer Genreklasse werden somit wahrscheinlicher in ein gemeinsames Cluster gefügt, als Lieder mit geringerer allgemeiner Güte. Die befüllten Clustertemplates werden im Folgenden lediglich als Cluster bezeichnet. For example, two songs of high general goodness within a genre class are thus more likely to be put together in a common cluster than songs of lesser general goodness. The filled cluster templates are referred to in the following only as clusters.

Erstes Cluster:First cluster:

Im Folgenden wird geklärt, welches Cluster als zuerst abgespieltes Cluster gewählt wird. Eine geeignete Auswahl des primär zu spielenden Clusters ist besonders wichtig, da an diesem Cluster die Reihenfolge der restlichen Cluster angepasst wird. Es wird das Cluster ausgewählt, welches in Abhängigkeit der Useraktivität als passend erachtet wird. Hierbei wird eine Korrelation mit den folgenden vier Parametern aufgestellt:

  • - Anzahl der Lieblingslieder innerhalb eines Clusters
  • - Durchschnittsgeschwindigkeit der Lieder eines Clusters
  • - Durchschnittliche Stimmung der Lieder eines Clusters
  • - Durchschnittliche Energie der Lieder eines Clusters
In the following, it is clarified which cluster is selected as the first played cluster. An appropriate selection of the cluster to be played primarily is particularly important since the order of the remaining clusters is adapted to this cluster. The cluster is selected, which is considered suitable depending on the user activity. A correlation with the following four parameters is established:
  • - Number of favorite songs within a cluster
  • - Average speed of the songs of a cluster
  • - Average mood of the songs of a cluster
  • - Average energy of the songs of a cluster

Das Cluster mit dem höchsten Wert für einen Parameter erhält den für den jeweiligen Parameter den Funktionswert 1. Alle dazwischen befindlichen Lieder enthalten für den Parameter den Funktionswert 1 P o s i t i o n   i n   S o r t i e r u n g .

Figure DE102016226042A1_0001
The cluster with the highest value for a parameter receives the function value for the respective parameter 1 , All songs in between contain the function value for the parameter 1 P O s i t i O n i n S O r t i e r u n G ,
Figure DE102016226042A1_0001

Die Useraktivität wird ebenfalls auf eine Werteskala zwischen 0 für Minimum und 1 für Maximum abgebildet. Es wird für jeden Parameter die Differenz der Funktionswerte und dem Wert der Useraktivität wird gebildet. Es wird das Cluster ausgewählt, welches als größte Differenz über alle Parameter den niedrigsten Wert verglichen mit anderen Liedern aufweist.User activity is also mapped to a scale of values between 0 for minimum and 1 for maximum. The difference between the function values and the value of the user activity is formed for each parameter. The cluster is selected, which has the largest difference over all parameters with the lowest value compared to other songs.

Clusterreihenfolge:Cluster order:

Bezüglich der Reihenfolge der Cluster gibt es zwei verschiedene Möglichkeiten, welche implementiert werden können.

  • - Priorisierung der Cluster ausschließlich nach Anzahl der Lieblingslieder
  • - Semantische Priorisierung
Regarding the order of the clusters, there are two different ways that can be implemented.
  • - prioritization of the clusters only by number of favorite songs
  • - Semantic Prioritization

Priorisierung der Cluster ausschließlich nach Anzahl der LieblingsliederPrioritization of the clusters exclusively by number of favorite songs

Die Priorisierung der Cluster ausschließlich nach Anzahl der Lieblingslieder erfolgt folgendermaßen. Bei hoher Useraktivität, werden Cluster an eine höhere Position in der Queue platziert, welche eine hohe Anzahl an Lieblingsliedern enthalten. Die Verteilung der Cluster mit Lieblingsliedern stellt eine gaußsche Normalverteilung dar. Der Sigma Wert wird mit höherer Useraktivität niedriger, ist aber über eine untere und obere Grenze eingeschränkt. Dadurch werden gegen Ende immer weniger Lieblingslieder gespielt als am Anfang einer Benutzungseinheit, da die Lieder nach Abspielen aus der Queue entfernt werden. Selbst wenn die Useraktivität zu einem späten Zeitpunkt der Benutzungseinheit sehr hoch wäre, würden weniger Lieblingslieder zum Abspielen zur Verfügung stehen. Dieser Ansatz wird aber dennoch verfolgt, da von der Annahme ausgegangen wird, dass die Anzahl der Lieder in der Queue häufig die Anzahl der tatsächlich gespielten Lieder in einer Benutzungseinheit überschreitet.The prioritization of the clusters exclusively according to the number of favorite songs is as follows. With high user activity, clusters are placed at a higher position in the queue, which contains a high number of favorite songs. The distribution of the clusters with favorite songs represents a Gaussian normal distribution. The sigma value becomes lower with higher user activity, but is limited over a lower and upper limit. As a result, less and less favorite songs are played toward the end than at the beginning of a use unit, since the songs are removed from the queue after playing. Even if the user activity were very high at a late stage of use, fewer favorite songs would be available for playback. However, this approach is followed because it is assumed that the number of songs in the queue often exceeds the number of songs actually played in a session.

Semantische PriorisierungSemantic prioritization

Die semantische Priorisierung funktioniert wie folgt.The semantic prioritization works as follows.

Die Bestimmung des Folgeclusters, wird anhand der Ähnlichkeit des aktuell betrachteten Clusters und des Folgeclusters hinsichtlich folgender Parameter bestimmt:

  • - Entfernung der Genreklassen des Clusters
  • - Anzahl der Lieblingslieder innerhalb des Clusters
  • - Durchschnitt über alle Erscheinungsjahre der Lieder des Clusters
  • - Durchschnittsgeschwindigkeit des Clusters
  • - Durchschnittliche Stimmung des Clusters
  • - Durchschnittliche Energie des Clusters
The determination of the subsequent cluster is determined based on the similarity of the currently considered cluster and the subsequent cluster with regard to the following parameters:
  • - Removal of the genre classes of the cluster
  • - Number of favorite songs within the cluster
  • - Average over all years of publication of the songs of the cluster
  • - Average speed of the cluster
  • - Average mood of the cluster
  • - Average energy of the cluster

Die Auswahl des Folgeclusters stellt eine entscheidende Funktion der Missionsplanung dar, da dadurch, im Gegensatz zur Häufigkeit der Stimmungswechsel innerhalb eines Zeitraumes, die Intensität der Stimmungswechsel festgelegt wird. Eine hohe Unähnlichkeit zwischen Clustern führt zu einem starken Stimmungswechsel. Ein starker Stimmungswechsel zwischen Clustern ist häufig unerwünscht, kann aber auch in bestimmten Situation bevorzugt werden. In dieser Erfindung wird ein geringer Stimmungswechsel zwischen Clustern bevorzugt. Somit würden Cluster mit hoher Ähnlichkeit bezüglich der oben beschriebenen Parameter wahrscheinlicher direkt aufeinanderfolgen.The selection of the follow-up cluster is a crucial function of mission planning, as it sets the intensity of mood changes, as opposed to the frequency of mood changes over a period of time. A high dissimilarity between clusters leads to a strong change of mood. A strong change of mood between clusters is often undesirable, but can also be preferred in certain situations. In this invention, a low change of mood between clusters is preferred. Thus, clusters with high similarity would be more likely to follow one another directly in terms of the parameters described above.

Die Priorisierung der Parameter sowie die Korrelation dazwischen ist frei wählbar oder kann in Abhängigkeit zu der Useraktivität gesetzt werden. Bei hoher Useraktivität könnte zum Beispiel der Parameter der Ähnlichkeit der durchschnittlichen Stimmung der Clusterlieder, zwischen zwei Clustern gegenüber allen anderen Parametern höher gewichtet werden.The prioritization of the parameters as well as the correlation between them is freely selectable or can be set depending on the user activity. For example, with high user activity, the parameter of the similarity of the average mood of the cluster songs between two clusters could be weighted higher than all other parameters.

Interne Reihenfolge:Internal order:

Nach dem die Reihenfolge der Cluster bestimmt wurde, wird die Liedreihenfolge innerhalb der Cluster bestimmt. Dies geschieht anhand von drei Kriterien:

  • - Allgemeine Güte
  • - Harmonieflow
  • - Geschwindigkeitsflow
After the order of the clusters has been determined, the song order within the clusters is determined. This is done on the basis of three criteria:
  • - General quality
  • - Harmonylow
  • - Speed flow

Zunächst werden Anfangs- und Abschlusslied eines jeden Clusters bestimmt. Das beginnende Lied eines Clusters, sowie das abschließende Lied muss besondere Auflagen erfüllen. Das erste Lied eines Clusters muss mit dem abschließenden Lied eines vorangegangenen Clusters eine hohe allgemeine Güte aufweisen und bevorzugt die Missionen des Harmonie- und Geschwindigkeitsflows erfüllen. Das letzte Lied eines Clusters muss mit dem ersten Lied eines nachfolgenden Clusters eine hohe allgemeine Güte aufweisen und bevorzugt die Missionen des Harmonie- und Geschwindigkeitsflows erfüllen.First of all, the start song and final song of each cluster are determined. The beginning song of a cluster, as well as the final song must meet special requirements. The first song of a cluster must have a high general goodness with the final song of a previous cluster and preferably fulfill the missions of harmony and velocity flow. The last song of a cluster must have a high general goodness with the first song of a subsequent cluster and preferably fulfill the missions of harmony and velocity flow.

Entsprechend den gesetzten Liedern wird der Rest des Clusters angepasst. Die allgemeine Güte zwischen den Liedern im Cluster muss dabei vorzugsweise hoch sein, und die Mission des Harmonieflow, und Geschwindigkeitsflow muss verfolgt werden. Da dies mit den gegebenen Liedern der Queue nicht immer möglich ist, muss eine Priorisierung festgelegt werden, welches Kriterium zuerst verletzt werden darf. Die Priorisierung ist wie folgt: Allgemeine Güte, Harmonieflow, Geschwindigkeitsflow. Sprünge in der Harmonie sind somit erlaubt. Sprünge in der Geschwindigkeit sind ebenfalls erlaubt, aber nicht unbedingt hörbar, da die Geschwindigkeiten der Lieder beim Übergang, soweit erlaubt, angeglichen werden.According to the set songs, the rest of the cluster will be adjusted. The overall goodness between the songs in the cluster must preferably be high, and the mission of the Harmonieflow, and Speedflow, must be tracked. Since this is not always possible with the given songs of the queue, a prioritization must be defined, which criterion may be violated first. The prioritization is as follows: General Q, Harmony Low, Velocity Flow. Jumps in harmony are thus allowed. Jumps in speed are also allowed, but not necessarily audible, as the velocities of the songs are adjusted as the transition allows.

Der Harmonieflow bezeichnet die Mission hinsichtlich der Abfolge von Tonartwechseln zwischen den Liedern über die gesamte Queue. Innerhalb der Cluster wird ein Harmonieflow aufgebaut. Der Harmonieflow wird bevorzugt auch über möglichst viele folgende Cluster fortgesetzt. Der Wechsel in die um eine Quinte verschobene, nächsthöhere Tonart führt zu einem energischeren, fröhlicheren Wechsel der Stimmung. Der Wechsel in die um eine Quinte verschobene, nächstgeringere Tonart führt zu einem melancholischen Wechsel der Stimmung. Die Art des Harmonieflows erfolgt in Abhängigkeit der Useraktivität. Bei einer hohen Useraktivität wird der Quintenzirkel entsprechend dem Uhrzeigersinn abgelaufen, sodass man energischere, fröhlichere Wechsel zwischen Liedern erreicht. Die Reihenfolge der Lieder innerhalb jedes Clusters wird nun vorzugsweise so angeordnet, dass die Tonarten der Lieder sich um jeweils maximal eine Quinte entsprechend des Quintenzirkels im Uhrzeigersinn unterscheiden. Für eine niedrige Useraktivität würde entsprechend Gegenteiliges erfolgen. Die Tonarten der Lieder dürfen auch die gleiche Tonart des potenziellen Vorgängerliedes aufweisen, beziehungsweise die parallele Moll/Dur Tonart. Insgesamt wird aber das Ziel verfolgt, über die gesamte Queue regelmäßig erhöhende Quintensprünge entsprechend des Quintenzirkels zu erreichen.The harmony low describes the mission in terms of the sequence of key changes between the songs over the entire queue. Within the clusters, a harmony flow is built up. The harmony flow is preferably continued over as many clusters as possible. The change to the next higher key shifted by a fifth leads to a more energetic, happier change of mood. The change to the next lower key shifted by a fifth leads to a melancholic change of mood. The nature of the harmony flow is dependent on the user activity. With a high level of user activity, the circle of fifths expires clockwise, resulting in more energetic, happier changes between songs. The order of the songs within each cluster is now preferably arranged so that the keys of the songs differ by a maximum of one fifth at a time corresponding to the circle of fifths in the clockwise direction. For a low user activity would be done in accordance with the contrary. The keys of the songs may also have the same key of the potential previous song, or the parallel minor / major key. All in all, however, the goal is to achieve regularly increasing fifths of the fifths over the entire queue in accordance with the circle of fifths.

Der Geschwindigkeitsflow bezeichnet die Mission, hinsichtlich der Abfolge von Geschwindigkeiten zwischen den Liedern über die gesamte Queue hinweg eine Geschwindigkeitsveränderung herbeizuführen. Innerhalb der Cluster wird ein Geschwindigkeitsflow aufgebaut. Dieser kann über beliebig viele Cluster hinweg fortgesetzt oder verändert werden. Mit dem Geschwindigkeitsflow ist gemeint, dass die Geschwindigkeit der Lieder in der Abspielreihenfolge konstant verändert wird. Die Useraktivität stellt den Parameter dar, welcher bestimmt, wie die Geschwindigkeit für diese Benutzungseinheit verändert wird. Bei erhöhter Useraktivität wird die Mission verfolgt die Geschwindigkeit über die Lieder hinweg zu erhöhen. Dies geschieht in dem die Lieder innerhalb des Clusters nach Geschwindigkeit aufsteigend geordnet werden. Für eine niedrige Useraktivität würde entsprechend Gegensätzliches gelten. Die Geschwindigkeit muss im Gegensatz zur harmonischen Mission nicht über Cluster hinweg erfolgen. Dies ist nicht immer möglich, da die Geschwindigkeit von „R&B“ Liedern überwiegend niedriger als die von „House“ Liedern ist.The velocity flow is the mission to change the speed of the songs between the songs across the queue. Within the clusters, a velocity flow is built up. This can be continued or changed across any number of clusters. By the speed flow, it is meant that the speed of the songs in the play order is constantly changed. The user activity represents the parameter which determines how the speed for this use unit is changed. With increased user activity, the mission is to increase the speed across the songs. This is done by arranging the songs within the cluster in ascending order of speed. For a low user activity would apply accordingly contrary. Speed, unlike harmonic mission, does not have to be clustered. This is not always possible because the speed of "R & B" songs is mostly lower than that of "House" songs.

Der Geschwindigkeitsflow kann erreicht werden, auch wenn die Geschwindigkeiten der Lieder innerhalb eines Clusters aufgrund der Priorisierung der Sortierung nach allgemeiner Güte und Harmonie, niedriger priorisiert wird. Dafür werden die Geschwindigkeiten der Lieder mithilfe von Digital Audio Processing Verfahren künstlich erhöht, wobei die Tonhöhe erhalten bleibt. Dieses Verfahren wird als State of the Art gesehen und gilt daher als vorausgesetzt. Die Geschwindigkeiten der Lieder innerhalb eines Clusters werden dennoch während eines Übergangs angeglichen. Allerdings wird die Geschwindigkeit der einzelnen Lieder jeweils künstlich erhört. Somit würde ein Lied A, welches in den Metainformationen den Wert 123 BPM als Geschwindigkeitsparameter aufweist, nach dem Übergang stetig auf 125 BPM angehoben werden. Das Folgelied B, mit einer ursprünglichen Geschwindigkeit von 124 BPM würde während des Übergangs von Lied A temporär auf 125 BPM erhöht werden, um einem synchronisierten Übergang zu unterlaufen. Daraufhin würde das Lied von 125 BPM auf 126 BPM angehoben werden. Somit würde eine stetige Geschwindigkeitserhöhung von 123 BPM (vor Lied A) auf 126 BPM (nach Lied B) erreicht werden, auch wenn die Lieder davon verschiedene, ursprüngliche Geschwindigkeiten aufweisen. Die maximale künstliche Anhebung der Geschwindigkeit eines Liedes ist, mit Ausnahmen, auf + 10 BPM zur ursprünglichen Geschwindigkeit begrenzt. Eine analoge Geschwindigkeitsreduktion zum Beeinflussen des Geschwindigkeitsflows wie hier beschrieben, findet nicht statt.The velocity flow can be achieved even if the velocities of the songs within a cluster are prioritized lower due to the prioritization of the general goodness and harmony sorting. For this, the speeds of the songs are artificially increased using digital audio processing techniques, while maintaining the pitch. This procedure is considered state of the art and is therefore considered to be prerequisite. The velocities of songs within a cluster are still aligned during a transition. However, the speed of each song is artificially heard. Thus, a song A, which in the meta-information has the value 123 BPM as the velocity parameter, would be steadily raised to 125 BPM after the transition. Follow song B, with an original speed of 124 BPM, would be temporarily increased to 125 BPM during Song A transition to undermine a synchronized transition. As a result, the song would be raised from 125 BPM to 126 BPM. Thus, a steady increase in speed from 123 BPM (before song A) to 126 BPM (after song B) would be achieved, even though the songs have different original speeds. The maximum artificial increase in the speed of a song is, with exceptions, limited to + 10 BPM at the original speed. An analogous speed reduction for influencing the velocity flow as described here does not take place.

Diese künstliche Geschwindigkeitserhöhung findet ausschließlich bei sehr hoher Useraktivität statt.This artificial speed increase takes place only with very high user activity.

Die Parameter der allgemeinen Güte, des Harmonieflows und des Geschwindigkeitsflows werden unter Berücksichtigung der Priorisierung optimal in Korrelation gebracht. Daraus ergibt sich die interne Reihenfolge der einzelnen Cluster.The parameters of the general quality, the harmony flow and the velocity flow are optimally correlated taking into account the prioritization. This results in the internal order of the individual clusters.

Die Reihenfolge innerhalb eines Clusters, sowie die Clusterreihenfolge ist nun bekannt. Die Queue wird umsortiert, um die Lieder in dieser Reihenfolge zu enthalten.The order within a cluster, as well as the cluster order is now known. The queue is resorted to contain the songs in that order.

Im Folgenden wird ein Beispiel für die Funktionsweise der Missionsplanung bei geringer Useraktivität gegeben:The following is an example of the operation of mission planning with low user activity:

Die Clustertemplates wären durchschnittlich größer, sodass die Cluster eine größere Anzahl an Liedern beinhalten würden. Die Größe der Clustertemplates würde außerdem gering variieren. Zunächst würden Liedercluster mit durchschnittlich geringerer Geschwindigkeit ausgewählt werden. Der Harmonieflow würde dazu führen, dass die Lieder über die gesamte Queue mit späterer Abspielrangfolge so angeordnet sind, dass optimaler Weise die Tonart des Folgeliedes falls nicht gleich oder parallel, eine Quinte niedriger im gleichen Tongeschlecht ist. Der Geschwindigkeitsflow würde optimaler Weise, dazu führen, dass Lieder mit geringerer Geschwindigkeit zumindest innerhalb eines Clusters weiter hinten in der Queue platziert sind.The cluster templates would be larger on average, so the clusters would contain a larger number of songs. The size of the cluster templates would also vary slightly. Initially, song clusters with a lower average speed would be selected. The harmony low would cause the songs to be arranged over the entire queue with later play order so that, ideally, the key of the follower song is not equal or parallel, one fifth lower in the same tone gender. The velocity flow would optimally result in lower speed songs being placed at least within a cluster farther back in the queue.

Parameter wie die allgemeine Güte zwischen zwei aufeinanderfolgenden Liedern innerhalb eines Cluster, sowie den zwei aufeinanderfolgenden Liedern über die Clustergrenzen hinweg, würden unabhängig von der Useraktivität immer bevorzugt hoch sein.Parameters such as the general good between two consecutive songs within a cluster, as well as the two consecutive songs across the cluster boundaries, would always be preferred, regardless of the user activity.

Modifizieren der QueueModify the queue

Das dynamische Modifizieren der Queue, durch Veränderung der Reihenfolge oder durch Hinzufügen beziehungsweise Löschen von Liedern, schränkt die Funktionalität der Missionsplanung nicht ein. Das hinsichtlich der Position manuell modifizierte Lied innerhalb der Queue, beeinflusst nicht die Position der restlichen Lieder in der Reihenfolge.Dynamically modifying the queue by changing the order or by adding or deleting songs does not limit the mission planning functionality. The manually modified song position within the queue, does not affect the position of the remaining songs in the order.

Es besteht für den User allerdings die Möglichkeit einzelne Lieder oder sogar eine Menge an Liedern, zum Beispiel in Form einer Playlist, unter Berücksichtigung der Missionsplanung zur Queue hinzuzufügen.However, it is possible for the user to add individual songs or even a lot of songs, for example in the form of a playlist, to the queue, taking into account the mission planning.

Dem User werden somit drei Auswahlmöglichkeiten vorgestellt:

  • - Modifizieren der Queue ohne Berücksichtigung der Missionsplanung
  • - Modifizieren der Queue unter Berücksichtigung der Missionsplanung
  • - Anhängen der Lieder an das Ende der Queue unter Berücksichtigung der Missionsplanung
The user is thus presented with three choices:
  • - Modify the queue without consideration of mission planning
  • - Modify the queue taking into account the mission planning
  • - Attach the songs to the end of the queue, taking into account the mission planning

Das Modifizieren der Queue unter Berücksichtigung der Missionsplanung führt dazu, dass die aktuelle Queue bei jeglicher Modifikation der Abspielreihenfolge erneut einer Missionsplanung unterzogen wird.Modifying the queue, taking into account mission planning, causes the current queue to undergo mission planning again whenever the play order is modified.

Mit der aktuellen Queue ist die aktuelle Queue nach manueller Modifizierung, inklusiver der Gesamtheit aller neu hinzugefügten Lieder, gemeint.The current queue refers to the current queue after manual modification, including the totality of all newly added songs.

Das Anhängen der Lieder an das Ende der Queue unter Berücksichtigung der Missionsplanung meint, dass die Reihenfolge der bisherigen Lieder beibehalten wird und die neu hinzugefügten Lieder einer eigenen Missionsplanung unterzogen werden und in dieser Reihenfolge an das Ende der aktuellen Queue gefügt werden. Ausschließlich das letzte Cluster der aktuellen Queue wird automatisch so modifiziert, dass es hinsichtlich der internen Reihenfolge der Lieder an das erste Cluster der neu hinzugefügten Lieder angepasst wird, sodass die Vorgaben an die allgemeine Güte, Harmonieflow und Geschwindigkeitsflow möglichst eingehalten werden.Attaching the songs to the end of the queue, taking into account mission planning, means that the order of previous songs will be preserved, and the newly added songs will undergo their own mission planning and be added to the end of the current queue in that order. Only the last cluster of the current queue is automatically modified to match the songs' internal order to the first cluster of newly added songs, so that the general quality, harmony flow and velocity flow specifications are adhered to as far as possible.

Lieder welche in der Queue hinsichtlich ihrer Abspielreihenfolge einmal manuell modifiziert wurden, werden weiterhin statisch an diese Abspielposition gebunden, sind für die Missionsplanung deaktiviert und werden somit nie von der Missionsplanung beeinflusst. Die restliche Reihenfolge der Queue baut sich so gesehen, um diese Abspielpositionen herum. Das Lied kann durch erneutes Hinzufügen unter Berücksichtigung der Missionsplanung aktiviert werden.Songs that have been manually modified once in the queue in terms of their playing order will continue to be statically bound to this playhead, disabled for mission planning, and thus never influenced by mission planning. The rest of the queue builds up so seen around these play positions. The song can be activated by re-adding in consideration of the mission planning.

Dynamische Anpassung der MissionsplanungDynamic adaptation of mission planning

Die Missionsplanung wird bei jeder neuen Benutzungseinheit initial neu ausgeführt, wobei zunächst der durchschnittliche Wert für die Useraktivität aus vergangenen Benutzungseinheiten verwendet wird.Mission planning is initially re-executed with each new usage unit, initially using the average value for the user activity from past usage units.

Seit der letzten dynamischen Anpassung der Missionsplanung, wird die Useraktivität in einer definierten Samplingrate geladen. Der Durchschnitt x der vergangenen Useraktivitätswerte wird berechnet. Außerdem wird der Durchschnitt y der vergangenen Useraktivitätswerte innerhalb eines definierten Zeitfensters berechnet. Überschreitet die Differenz von x und y einen definierten Schwellenwert, wird dies als massive Veränderung der Useraktivität aufgefasst und die dynamische Anpassung der Missionsplanung wird mit dem aktuellen Useraktivitätswert erneut eingeleitet.Since the last dynamic adaptation of the mission planning, the user activity is loaded in a defined sampling rate. The average x of past user activity values is calculated. In addition, the average y of the past user activity values is calculated within a defined time window. If the difference between x and y exceeds a defined threshold, this is considered a massive change in user activity and the dynamic adjustment of mission planning is re-initiated with the current user activity value.

Das Zeitfenster für die Berechnung der durchschnittlichen vergangenen Useraktivität y, wird mit höherer Useraktivität kürzer.The time window for the calculation of the average past user activity y, becomes shorter with higher user activity.

Die dynamische Anpassung der Missionsplanung in Abhängigkeit der Useraktivität stellt eine Kerninnovation der Erfindung dar. Im Folgenden wird beispielhaft die Kausalität zwischen einem in der Useraktivität wiedergespiegeltem Stimmungswechsel des Users und der Missionsplanung dargestellt. Erhöht sich die Useraktivität deutlich z.B. durch sportliches Fahrverhalten nach einer langen Phase von ruhigem Fahrverhalten, und bleibt über einen bestimmten Zeitraum erhalten, würde die Missionsplanung erneut auf die Queue angewendet werden, wobei das aktuell abgespielte Lied nicht davon beeinflusst wird.The dynamic adaptation of the mission planning as a function of the user activity represents a core innovation of the invention. In the following, the causality between a user's mood change reflected in the user activity and mission planning is illustrated by way of example. If the user activity significantly increases, e.g. due to sporty driving after a long period of quiet driving, and maintained over a period of time, mission planning would be re-applied to the queue, without affecting the currently playing song.

Die Missionsplanung könnte auch kontrovers zu der Useraktivität verwendet werden, um bewusst der Aktivität des Users entgegenzuwirken. Falls die Software innerhalb eines Automobils mit Geschwindigkeitserkennung verwendet implementiert ist, könnte man ein gefährliches Fahrverhalten anhand von sehr hoher Geschwindigkeitsüberschreitungen oder anderen Faktoren identifizieren. Hierbei könnte man die Missionsplanung zu einer Funktionsweise mit einer niedrigen Useraktivität ansteuern. Der Fahrer würde somit sein Fahrverhalten unterbewusst zu einem ruhigeren Fahrverhalten ändern. Da aber immer noch die gleichen Lieder aus der Queue gespielt und die Übergangskonstruktion immer noch die persönlichen Präferenzen, sowie allgemeinen Präferenzen innerhalb seines persönlichen Regelwerks berücksichtigen würde, würde ihm die veränderte Funktionsweise bewusst nicht unbedingt auffallen.The mission planning could also be controversial to the user activity used to deliberately counteract the activity of the user. If the software is implemented inside a car using speed detection, one could identify dangerous driving behavior from very high speeding violations or other factors. Here one could head the mission planning to an operation with a low user activity. The driver would thus subconsciously change his driving behavior to a quieter driving behavior. But still the same songs are played out of the cue and the transitional construction still has the personal preferences, as well would take into account generalized preferences within his personal set of rules, he would not necessarily notice the change in function.

Erweiterte SonganalyseExtended song analysis

Die erweiterte Songanalyse untergliedert sich in zwei Funktionalitäten:

  • - Genrebestimmung
  • - Songsegmentierung
The extended song analysis is divided into two functionalities:
  • - Genre determination
  • - Song segmentation

Die Songsegmentierung beschreibt ein Audio Signal Processing Verfahren, welches Informationen über den strukturellen Aufbau eines Liedes aus den PCM Audiodaten des Liedes extrahiert. Das hier angewendete Verfahren segmentiert das Lied unter Berücksichtigung der Information über das Genre eines Liedes.Song segmentation describes an audio signal processing method that extracts information about the structure of a song from the song's PCM audio data. The method used here segments the song taking into account the information about the genre of a song.

Nach der Songsegmentierung enthält jedes der Segmente Informationen über die semantische Bedeutung des einzelnen Segments. Diese Informationen werden in dieser Erfindung dazu verwendet, potenzielle Übergangszeitpunkte in Liedern zu bestimmen, auszuwählen und eine abstrakte Übergangsform an eine Übergangssituation zu einem der Zeitpunkte abzuleiten und anzupassen.After the song segmentation, each of the segments contains information about the semantic significance of the individual segment. This information is used in this invention to determine potential transition times in songs, to select and to derive and adapt an abstract transitional shape to a transient situation at one of the times.

Das in dieser Erfindung vorgestellte Songsegmentierungsverfahren unterscheidet sich von herkömmlichen Songsegmentierungsverfahren hinsichtlich des verfolgten Ziels und daher in der Vorgehensweise. Während herkömmliche Songsegmentierungsmethoden sich überwiegend auf technische Möglichkeiten stützen, wird hier besonderer Wert auf die Segmentierung hinsichtlich musikalischen Vorwissens gelegt. Der hier vorgestellte Ansatz verknüpft Low Level Technologien mit High Level Wissen über den Aufbau moderner, populärer Lieder. Die korrekte Bestimmung der zeitlichen Grenzen von Segmenten ist für die weitere Verwendung der Resultate entscheidend. In diesem Songsegmentierungsverfahren spielt die Betrachtung des Bassdrumrythmus sowie die gefühlte Lautstärke (RMS) eine besonders große Rolle.The song segmentation method presented in this invention differs from conventional song segmentation methods in terms of the objective pursued and therefore in the approach. While traditional song segmentation methods rely heavily on technical possibilities, special emphasis is placed on segmentation in terms of musical knowledge. The approach presented here combines low level technologies with high level knowledge about building modern, popular songs. The correct determination of the time limits of segments is crucial for the further use of the results. In this song segmentation method, the consideration of the bass drum rhythm as well as the perceived volume (RMS) plays a particularly important role.

Die korrekte semantische Bezeichnung eines Segments hinsichtlich seiner Bedeutung für die Songstruktur wird extrahiert. Eine hohe Korrektheit der Bezeichnung der Segmente verglichen mit einem Groundtruth ist für die Erhöhung der Qualität der Funktionsweise der Software zwar fördernd, jedoch nicht erforderlich. Wenn Segmente falsch bezeichnet werden und der Übergang nicht an dem passenden Segment erfolgt, wird dieser mit hohe Wahrscheinlichkeit eine hohe Übergangsgüte aufweisen, da die zeitlichen Grenzen der Segmente korrekt gesetzt sind und die Lieder in der Missionsplanung so gewählt sind, dass die Übergangsgüte unabhängig vom Übergangszeitpunkt maximiert wird. Ein Übergang zwischen zwei Liedern, welche von der Geschwindigkeit her angeglichen sind und darüber hinaus sogar eine passende Tonart besitzen, wird für den User selten als „sehr unangenehm“ empfunden werden. Das Erfolgen des Übergangs zu einem nicht vorgesehenen Segment verändert allerdings die Erscheinung des Übergangs und fördert daher ein abwechslungsreiches Musikerlebnis.The correct semantic designation of a segment in terms of its meaning for the song structure is extracted. A high degree of correctness of the designation of the segments compared to a ground truth is, although not required, for the increase in the quality of the functioning of the software. If segments are mislabeled and the transition does not occur on the appropriate segment, it is highly likely to have a high transient quality because the time limits of the segments are set correctly and the mission planning songs are chosen such that the transient quality is independent of the transition time is maximized. A transition between two songs, which are adjusted in terms of speed and beyond even have a matching key, will rarely be perceived as "very unpleasant" for the user. Achieving the transition to an unscheduled segment, however, alters the appearance of the transition and therefore promotes a varied musical experience.

Die hier beschriebene Methode zur inhaltlichen Songanalyse ist auf die Songsegmentierung und Interpretation von modernen, populären Liedern, welche eine klar identifizierbare Bassdrumstruktur und einen klar identifizierbaren Rhythmus aufweisen, ausgelegt.The content song analysis method described here is designed for song segmentation and interpretation of modern, popular songs that have a clearly identifiable bass drum structure and a clearly identifiable rhythm.

Die Songsegmentierung eignet sich somit besonders für Lieder, welche einen hohen Tanzbarkeitsfaktor aufweisen.The song segmentation is thus particularly suitable for songs that have a high dance factor.

Die Resultate der Analyse dienen schließlich der Konstruktion eines Überganges zwischen zwei digitalen Liedern als Simulation des Auflegeverhaltens eines menschlichen Club- oder Radio DJs. Da heutzutage die von Club- bzw. Radio DJs gespielte Musik überwiegend modern und populär ist, und das Erzeugnis der DJs oftmals für eine tanzbare Stimmung sorgen soll, ist die Songanalyse ebenfalls an diesem Ziel ausgerichtet.Finally, the results of the analysis serve to construct a transition between two digital songs as a simulation of the hang-up behavior of a human club or radio DJ. Since the music played by club or radio DJs is nowadays mostly modern and popular, and the product of the DJs is often supposed to create a danceable mood, the song analysis is also geared towards this goal.

Das im Folgenden beschriebene Verfahren stützt sich auf bereits bekannten Technologien des Music Information Retrieval und des Audio Signal Processing. Die Verfahren gelten für diese Erfindung als vorausgesetzt und werden daher hier nicht näher diskutiert. Die Implementierung dieser Verfahren ist unabhängig von den hier beschriebenen Funktionalitäten und kann frei modifiziert werden. Das Patent erhebt keinen Anspruch auf die folgenden Technologien:

  • - Berechnung der klanglichen Ähnlichkeit zweier Audio Signale unterschiedlicher Länge
  • - Berechnung der melodischen Ähnlichkeit zweier Audio Signale unterschiedlicher Länge
The method described below is based on already known technologies of music information retrieval and audio signal processing. The methods are considered to be presupposed for this invention and will therefore not be discussed further here. The implementation of these methods is independent of the functionalities described here and can be freely modified. The patent does not claim the following technologies:
  • - Calculation of the phonetic similarity of two audio signals of different lengths
  • - Calculation of the melodic similarity of two audio signals of different lengths

Die im Folgenden beschriebenen Verfahren stellen weitere Music Information Retrieval Verfahren dar, auf welche in dieser Erfindung näher eingegangen wird:

  • - Berechnung der Ähnlichkeit der Rythmusstruktur zweier Audio Signale unterschiedlicher Länge
  • - Erstellen einer Rythm Map
The methods described below represent further music information retrieval methods, which are described in more detail in this invention:
  • Calculation of the similarity of the rhythm structure of two audio signals of different lengths
  • - Creating a rhythm map

Die klangliche Ähnlichkeit zweier Audio Signale unterschiedlicher Länge, beschreibt die Ähnlichkeit anhand der MFCC Vektoren (Mel Frequency Cepstral Coefficients) zweier Audiosignale. Bei Signalen unterschiedlicher Länge werden die Vektoren mithilfe des Dynamic Time Warping Algorithmus angepasst und verglichen. Die Ähnlichkeit der MFCC Vektoren gegebener Audio Signale wird im Folgenden als klangliche Ähnlichkeit zweier Audio Signale bezeichnet und als Skalar dargestellt.The similarity in sound of two audio signals of different lengths describes the similarity based on the MFCC vectors (Mel Frequency Cepstral Coefficients) of two audio signals. For signals of different lengths, the vectors are adjusted and compared using the Dynamic Time Warping algorithm. The similarity of the MFCC vectors of given audio signals is hereafter referred to as aural similarity of two audio signals and represented as a scalar.

Die melodische Ähnlichkeit zweier Audio Signale unterschiedlicher Länge beschreibt die Ähnlichkeit der Chromavektoren einzelner Audio Signale. Die Ähnlichkeit der Chromavektoren gegebener Audio Signale wird im Folgenden als melodische Ähnlichkeit zweier Audio Signale bezeichnet und als Skalar dargestellt.The melodic similarity of two audio signals of different lengths describes the similarity of the chromium vectors of individual audio signals. The similarity of the chromium vectors of given audio signals is referred to below as the melodic similarity of two audio signals and represented as a scalar.

Die Erstellung einer Rythm Map kann mit unterschiedlichen Verfahren realisiert werden. Eine qualitativ befriedigende Methode ist im Folgenden beschrieben. Ein gegebenes Audio Signal wird zunächst normalisiert. Einen höchsten Peak im Tieffrequenzspektrum unter 120 Hz in einem gegebenen Zeitfenster wird als Bassdrumsignal definiert. Falls dieser Wert in einem Zeitfenster definierter Länge einen bestimmten Schwellenwert für eine definierte Zeiteinheit überschreitet, wird dies als Identifikation eines Bassdrumimpulses interpretiert. Im Folgenden wird von einem gleichmäßigen 4/4 Takt über das gesamte Lied ausgegangen, wobei die Geschwindigkeit konstant bleibt. Hierfür wird die Geschwindigkeit des Liedes aus den Metainformationen benötigt. Das Lied wird nun ab dem Auftreten des allerersten Bassdrumimpulses hinsichtlich der Geschwindigkeit gleichmäßig in 16 Zählzeiten pro Takt unterteilt. Bei 120 BPM wären das 480 Zählzeiten in einer Minute in einem Abstand von 0,125 Millisekunden. Beginnend mit dem allerersten Bassdrumimpuls, erhält jeder identifizierte Bassdrumimpuls einen Zeitstempel t, mit der Zeit des höchsten Peaks in einer Frequenz unter 120 Hz innerhalb eines Zeitfensters definierter Länge. Die Bassdrumimpulse werden nun in einer Rythm Map in der Zählzeit eingetragen, welche die geringste Differenz mit dem bestimmten Zeitstempel t aufweist. Die Rythm Map enthält an dieser Zählzeit einen Eintrag mit dem ursprünglichen Zeitstempel t des Bassdrumimpulses im Lied.The creation of a rhythm map can be realized with different methods. A qualitatively satisfactory method is described below. A given audio signal is initially normalized. A highest peak in the low frequency spectrum below 120 Hz in a given time window is defined as the bass drum signal. If this value exceeds a certain threshold for a defined time unit in a time window of defined length, this is interpreted as identification of a bass drum pulse. In the following it is assumed that there is a steady 4/4 beat over the entire song, whereby the speed remains constant. This requires the speed of the song from the meta-information. The song is now evenly divided in terms of speed from the appearance of the very first bass drum impulse into 16 beats per bar. At 120 BPM, that would be 480 beats in one minute at a distance of 0.125 milliseconds. Starting with the very first bass drum pulse, each identified bass drum pulse is given a time stamp t, with the time of the highest peak in a frequency below 120 Hz within a time window of defined length. The bass drum pulses are now entered in a rhythm map in the counting time, which has the smallest difference with the specific time stamp t. The rhythm map contains at this count time an entry with the original timestamp t of the bass drum impulse in the song.

Die erweiterte Songanalyse besteht aus den folgenden Phasen:

  • - Macrosegmentierung
  • - Microsegmentierung
  • - Genreklassifikation
  • - Chorussegmente
  • - Semantische Macrosegmentierung
  • - Semantische Microsegmentierung
  • - Segmentinterpretation
  • - Übergangsfaktoren
The advanced song analysis consists of the following phases:
  • - Macrosegmentation
  • - Microsegmentation
  • - Genre classification
  • - Chorus segments
  • - Semantic Macrosegmentation
  • - Semantic microsegmentation
  • - Segment Interpretation
  • - transition factors

MacrosegmentierungMacro segmentation

Im Folgenden wird ein Verfahren zur Berechnung von Unterschieden der rhythmischen Struktur zweier Audiosegmente beschrieben, was als rhythmische Ähnlichkeit definiert wird. Die Einträge von zwei Segmenten ausgewählter Länge zu ausgewählten Zeitpunkten werden aus der Rythm Map geladen. Eines der Segmente wird als Groundtruth festgelegt. Die Einträge des anderen Bereichs werden an den nächst stehenden Eintrag im Groundtruth verschoben. Die Differenzen werden aufsummiert. Eine Betrachtung der Unterschiede in der Anzahl der Einträge ist hierbei nicht notwendig.The following describes a method for calculating differences in the rhythmic structure of two audio segments, which is defined as rhythmic similarity. The entries of two segments of selected length at selected times are loaded from the rhythm map. One of the segments is set as Groundtruth. The entries of the other area are moved to the next entry in Groundtruth. The differences are summed up. A consideration of the differences in the number of entries is not necessary here.

Der allererste Bassdrumimpuls innerhalb des Liedes wird bestimmt. Darauf aufbauend wird die Rythm Map erstellt.The very first bass drum impulse within the song is determined. Based on this, the rhythm map is created.

Von dem ersten Eintrag der Rythm Map aus werden die Einträge der folgenden vier Takte inklusive dem Eintrag an der aktuellen Zählzeit betrachtet. Die Rythmusstruktur des aktuellen vollen Taktes muss mit den drei darauffolgenden Takten eine rhythmische Ähnlichkeit über einem definierten Schwellenwert haben. Der Schwellenwert ist abhängig vom Genre, da zum Beispiel in Liedern des Genres „House“ weniger rhythmische Differenzen innerhalb eines Segments auftreten als zum Beispiel in einem Lied des Genres „R&B“.From the first entry of the rhythm map, the entries of the following four bars including the entry at the current count time are considered. The rhythm structure of the current full measure must be with the three subsequent bars have a rhythmic similarity above a defined threshold. The threshold depends on the genre, for example, in songs of the genre "House" less rhythmic differences occur within a segment than for example in a song of the genre "R &B".

Ist dies erfüllt und enthält die Rythm Map innerhalb des aktuellen vollen Taktes oder der nächsten drei Takte mindestens einen weiteren Eintrag an einer beliebigen Zählzeit wird ein Microsegment erstellt.If this is fulfilled and the rhythm map contains at least one further entry at any count time within the current full measure or the next three measures, a microsegment is created.

Die linke Grenze des Macrosegments wird mit dem ursprünglichen Zeitstempel t des ersten Bassdrumimpulses im Lied definiert, die rechte Grenze wird als Summe des Zeitstempels t und der Länge von vier Takten definiert.The left boundary of the Macrose segment is defined with the original time stamp t of the first bass drum impulse in the song, the right limit is defined as the sum of the time stamp t and the length of four bars.

Folgend auf die zuletzt betrachtete Zählzeit, werden die nächsten vier Takte evaluiert. Hierbei wird wieder überprüft ob mindestens zwei Einträge innerhalb der Rythm Map auftreten. Ist dies der Fall werden die vier Takte dem vorherigen Macrosegment hinzugefügt. Dies geschieht in dem der Endzeitstempel des Macrosegments um eine Dauer von vier Takten erweitert wird. Dieser Prozess wiederholt sich entlang dem zeitlichen Verlauf des Liedes solange bis innerhalb eines Abschnitts von vier Takten keine zwei Einträge in der Rythm Map eingetragen sind. Dies stellt das Ende dieses Macrosegments dar.Following the last count, the next four bars are evaluated. Here it is again checked whether at least two entries occur within the rhythm map. If so, the four bars are added to the previous Macrose segment. This is done by extending the end time stamp of the Macrose segment by a duration of four bars. This process repeats along the time course of the song until within a section of four bars no two entries are entered in the rhythm map. This represents the end of this Macrosegment.

Der nächste Eintrag an einer Zählzeit in der Rythm Map wird gesucht. Ab diesem Eintrag wird der Prozess fortgeführt. Mit diesem Verfahren wird das gesamte Lied in Macrosegmente oder freie Bereiche eingeteilt. Auch wenn mit diesem Verfahren Lieder in denen eine starke Änderung der Geschwindigkeit auftritt nicht korrekt segmentiert werden können, ist dies, wie in späteren Phasen ersichtlich wird, nicht relevant für die Qualität der Erfindung. Das hängt damit zusammen, dass ausschließlich geschwindigkeitskonstante Lieder korrekt segmentiert werden müssen, da nur diese einer auf der Segmentation basierenden Übergangskonstruktion unterlaufen.The next entry for a beat in the rhythm map is searched. From this entry, the process continues. This procedure divides the entire song into macrose segments or free sections. Although, with this method, songs in which a large change in speed occurs can not be segmented correctly, as will become apparent in later phases, this is not relevant to the quality of the invention. This is due to the fact that only rate-constant songs have to be correctly segmented, since only these subvert a segmentation based transient construction.

Die Wahl von vier Takten als Größe für die Überprüfung eines Bereiches des Liedes hängt damit zusammen, dass in moderner Unterhaltungsmusik die untere Grenze für die Dauer eines Liedabschnitts überwiegend auf vier Takte gesetzt ist.The choice of four bars as a size for the review of an area of the song is related to the fact that in modern light music the lower limit for the duration of a song section is mainly set to four bars.

Der hier beschriebene Ansatz geht davon aus, dass Liedparts mit einem Bassdrumimpuls auf der ersten Zählzeit beginnen, da dies in moderner Musik fast ausschließlich der Fall ist. Ein fehlender Bassdrumimpuls auf der allersten Zählzeit eines Segments, wobei die folgenden Takte einen Bassdrumimpuls auf der ersten Zählzeit enthalten, verändert das Ergebnis jedoch nicht, da dieser Takt aufgrund rhythmischer Unähnlichkeit nicht ins Macrosegment mitaufgenommen werden würde, und somit nicht die falsche Zählzeit als Beginn des Taktes setzten würde. Aufgrund der später erläuterten Segmentlängenvereinheitlichung würde dieser Takt anschließend dennoch aufgenommen werden.The approach described here assumes that song parts begin with a bass drum impulse on the first beat, as this is almost exclusively the case in modern music. A missing bass drum impulse at the earliest beat of a segment, with the following bars containing a bass drum impulse on the first beat, does not change the result, since this bar would not be included in the Macrose segment due to rhythmic dissimilarity and thus not the wrong count time as the beginning of the beat Clock would set. However, due to segment segmentation later explained, this clock would still be captured.

MicrosegmentierungMicro segmentation

Für die Segmentierung in Microsegmente definierter Länge ist vorausgesetzt, dass die Taktanzahl eines Macrosegments ein Vielfaches von 4 ist. Ist diese Eigenschaft nicht gegeben, muss das Macrosegment mit der Segmentlängenvereinheitlichung erweitert oder verkleinert werden.For the segmentation into micro segments of defined length, it is assumed that the number of cycles of a Macrose segment is a multiple of 4. If this property is not met, the segment of macro segmentation must be expanded or contracted.

Das Verfahren der Segmentlängenvereinheitlichung ist im Folgenden beschrieben. Hierzu werden Ähnlichkeiten der Klangfarbe zwischen Takten berücksichtigt. Zunächst wird für beide Segmentenden untersucht, ob eine Erweiterung oder Reduktion der Segmentgrenze erfolgen soll.The method of segment length unification is described below. Similarities of timbre between bars are considered. First of all, it is examined for both segment ends, whether an extension or reduction of the segment boundary should take place.

Dafür wird zunächst eine innere Ähnlichkeit z zwischen zwei inneren Takten berechnet. Die inneren Takte werden von dem Takt tx, 3 Takte links von dem rechtsäußersten Takt t(n-1) des Macrosegments, sowie dem Takt ty, 3 Takte rechts von dem linksäußersten Takt t0 dargestellt. Aus der klanglichen Differenz von tx und ty wird z berechnet.First, an internal similarity z between two internal clocks is calculated. The inner clocks are represented by the clock t x , 3 clocks to the left of the rightmost clock t ( n-1) of the Macrose segment, and the clock t y , 3 clocks to the right of the leftmost clock t 0 . Z is calculated from the tonal difference of t x and t y .

Im Anschluss wird die Ähnlichkeit des äußersten Takts eines Segments mit einem der inneren Takte berechnet. Diese Ähnlichkeit muss einen bestimmten Schwellenwert überschreiten. Der Schwellenwert ist abhängig von z. Bei hoher Ähnlichkeit erfolgt an dieser Grenze eine Erweiterung, sonst eine Reduktion.Next, the similarity of the outermost clock of a segment to one of the inner clocks is calculated. This similarity must exceed a certain threshold. The threshold depends on z. With a high similarity, an extension takes place at this boundary, otherwise a reduction.

Im Anschluss werden die entsprechenden Enden des Segments erweitert oder reduziert. Dazu können maximal drei weitere Takte pro Ende abgegeben oder annektiert werden. Pro Seite wird folgender Prozess durchgeführt. Der zurzeit äußerste Takt ta des Macrosegments an einem der Segmentenden, wird mit dem nächstinneren Takt verglichen. Hierfür wird die klangliche Ähnlichkeit x berechnet. Folgend, wird der Takt ta, mit dem nächstäußeren Takt verglichen. Hierfür wird die klangliche Ähnlichkeit y berechnet.Afterwards, the corresponding ends of the segment are extended or reduced. For this purpose, a maximum of three more bars per end can be given or annexed. The following process is performed per page. The currently outermost clock t a of the Macrose segment at one of the segment ends, is with the next inner clock compared. For this the sound similarity x is calculated. Subsequently, the clock t a , is compared with the next clock. For this the sound similarity y is calculated.

Die Differenz Δd = x - y wird gebildet. Überschreitet dieser Wert einen von z abhängigen Schwellenwert, wird der Takt an das Segmentende angefügt und somit dem Macrosegment annektiert. Wird der Schwellenwert nicht überschritten wird der Takt an den nächstäußersten Takt, welcher keinem Macrosegment angehört, abgegeben.The difference Δd = x - y is formed. If this value exceeds a threshold dependent on z, the clock is appended to the end of the segment and thus annexed to the Macrose segment. If the threshold is not exceeded, the clock is delivered to the next outermost clock, which does not belong to any Macrosegment.

Hat das Segment immer noch keine Länge, welche ein Vielfaches von vier darstellt, wird zunächst der Schwellenwert schrittweise reduziert. Ist der Schwellenwert an einer definierten unteren Grenze angekommen, wobei die Segmentlänge immer noch kein Vielfaches von vier darstellt, werden an beiden Enden gleichmäßig Takte entfernt bzw. reduziert. Bei ungerader Segmentlänge, wird zunächst der Takt an einem der Segmentgrenzen entfernt bzw. reduziert, welcher mit dem entsprechenden Takt ta die höhere klangliche Ähnlichkeit aufweist.If the segment still does not have a length which is a multiple of four, first the threshold value is gradually reduced. If the threshold has arrived at a defined lower limit, the segment length still not being a multiple of four, clocks are equally removed or reduced at both ends. With an odd segment length, the clock is first removed or reduced at one of the segment boundaries, which has the higher acoustic similarity with the corresponding clock t a .

Die Macrosegmente haben nach der Segmentlängenvereinheitlichung eine Taktanzahl, welche ein Vielfaches von vier darstellt. Das Macrosegment wird jetzt ab dem Beginn der ersten Zählzeit gleichmäßig in Microsegmente mit einer Länge von vier Takten aufgeteilt.The Macrose segments have a number of clocks after segment length unification that is a multiple of four. The Macrose segment is now evenly divided into four-bar micro segments from the beginning of the first beat.

GenreklassifikationGenre classification

Die Genreklassifikation wird ausgeführt, unabhängig ob ein Genre aus den Metainformationen extrahiert werden kann oder nicht. Der Genreklassifikator, klassifiziert ein gegebenes Lied zunächst grob in die drei Hauptklassen:

  • - House
  • - RnB
  • - Other
The genre classification is executed, regardless of whether or not a genre can be extracted from the meta-information. The genre classifier, classifies a given song roughly into the three main classes:
  • - House
  • - RnB
  • - Other

Ein Lied wird als House Lied klassifiziert, wenn die Geschwindigkeit des Liedes einen Wert zwischen 105 und 170 BPM darstellt und z.B. 40% der Takte innerhalb der Rythm Map, welche mindestens zwei Einträge innerhalb eines Taktes enthalten, hinsichtlich der rhythmischen Ähnlichkeit mit dem House Pattern (Bassdrum auf jede Viertel Note im Takt) dargestellt eine 90% Übereinstimmung haben. Fällt das Lied nicht unter diese Genreklasse fällt, werden die Microsegmente welche innerhalb der Rythm Map mindestens zwei Einträge enthalten hinsichtlich ihrer rhythmischen Ähnlichkeit mithilfe eines explorativen Clusteringverfahrens geclustert. Enthält das größte Cluster z.B. mindestens 40% aller Microsegmente, wird im Weiteren die Qualität der Bassdrum überprüft. Die Bassdrum Peaks im Lied an den ursprünglichen Zeitstempeln, welche den Einträgen der Beat Map entnommen werden, werden geprüft. Befinden diese sich nach Normalisierung des Liedes im Durchschnitt über einem festen Schwellenwert, wird das Lied als R&B klassifiziert. Ein Lied welches nicht als House oder R&B Lied klassifiziert wurde, wird als Other klassifiziert. Ein zweiter, optionaler Schritt der Genreklassifikation, erfolgt anschließend an die Segmentinterpretation. In dem vorgestellten Verfahren fallen Lieder, welche nicht dem Genre R&B angehören oftmals in diese Genreklasse. Dies ist aber gewollt, da diese Genreklassen vorwiegend für Übergangsauswahl relevant sind. Ein Rock Lied welches als Lied der Klasse R&B klassifiziert wird, kann mit dem gleichen Übergang überblendet werden wie ein tatsächliches R&B Lied. Genauso können R&B Lieder, welche rhythmische Ähnlichkeit mit dem House Pattern haben, ebenfalls mit House affinen Übergängen überblendet werden.A song is classified as a house song if the speed of the song is between 105 and 170 BPM and e.g. 40% of the bars within the rhythm map, which contain at least two entries within a bar, have a 90% match in terms of rhythmic similarity to the house pattern (bass drum on each quarter note in time). If the song does not fall under this genre class, the micro segments containing at least two entries within the rhythm map will be clustered with respect to their rhythmic similarity using an exploratory clustering method. If the largest cluster contains e.g. At least 40% of all micro segments, the quality of the bass drum will be checked. The bass drum peaks in the song at the original timestamps taken from the Beat Map entries are checked. If, after normalization of the song, these are on average above a fixed threshold, the song is classified as R & B. A song that has not been classified as a House or R & B song is classified as Other. A second, optional step of the genre classification, follows the segment interpretation. In the presented method, songs that are not part of the genre R & B often fall into this genre class. However, this is intentional because these genre classes are predominantly relevant for transition selection. A rock song classified as a Class R & B song can be transposed with the same transition as an actual R & B song. Likewise, R & B songs that have rhythmic resemblance to the house pattern can also be blended into house affine transitions.

ChorussegmenteChorus segments

Für jedes vorhandene Microsegment wird nun die melodische und klangliche Ähnlichkeit berechnet und jeweils als Self Similarity Matrix gespeichert. Mit dem Verfahren der Self Similarity Analysis werden alle Microsegmente, hinsichtlich der beiden Ähnlichkeiten geclustert. Hierfür wird ein k-Means Verfahren mit unterschiedlichen Parametern verwendet. Final werden die Cluster aus den Berechnungen mit dem Parameter ausgewählt, bei dem die euklidische Distanz von dem Mittelpunkt des Clusters zu den Elementen am geringsten ausfällt. Die Microsegmente, welche nach dem Clusteringprozess dem Cluster angehören, in welchem die Elemente untereinander die höchste klangliche Ähnlichkeit aufweisen, werden als Chorussegmente markiert. Dieses Verfahren gilt als State Of The Art und wird nicht näher diskutiert. Das Patent erhebt keinen Anspruch auf dieses Verfahren.For each existing micro segment, the melodic and sonic similarity is calculated and stored as a self similarity matrix. With the method of the Self Similarity Analysis, all microsegments are clustered with respect to the two similarities. For this purpose, a k-methods method with different parameters is used. Finally, the clusters are selected from the calculations with the parameter where the Euclidean distance from the center of the cluster to the elements is the least. The microsegments that belong to the cluster after the clustering process, in which the elements have the highest similarity to each other, are marked as chorus segments. This procedure is considered State Of The Art and will not be discussed further. The patent does not claim this procedure.

Diese Vorgehensweise suggeriert, dass der Chorus eines Liedes immer mit einem Bassdrumrythmus unterlegt ist. Da eine hohe Korrektheit der Segmentbezeichnungen nicht erforderlich ist, ist dieser Ansatz annehmbar. This approach suggests that the chorus of a song is always accompanied by a bass drum rhythm. Since a high level of correctness of the segment names is not required, this approach is acceptable.

Semantische MacrosegmentierungSemantic Macrosegmentation

Die Tatsache, dass die Songstruktur jedes Liedes auf den Wechsel von Chorus- und Verseabschnitten heruntergebrochen werden kann, wird bei der Bildung von semantischen Macrosegmenten verwendet. Microsegmente, welche als Chorussegmente markiert sind, werden mit allen direkt angrenzenden Segmenten zu einem Macrosegment verbunden. Die so gebildeten semantischen Macrosegmente werden als Chorussegmente bezeichnet und erhalten eine Id. Zu Bedenken ist allerdings, dass die Grenzen der Microsegmente zur späteren Verwendung weiterhin gespeichert bleiben.The fact that the song structure of each song can be broken down to alternating chorus and verse sections is used in the formation of semantic Macrose segments. Micro segments marked as chorus segments are joined to all macros segments directly adjacent to each segment. The semantic Macrose segments formed in this way are called chorus segments and receive an Id. However, it must be considered that the limits of the microsegments remain stored for later use.

Alle restlichen Microsegmente werden mit den angrenzenden Microsegmenten, welche nicht als Chorussegmente markiert sind, oder mit angrenzenden freien Bereichen ebenfalls zu Macrosegmenten verbunden. Die so gebildeten semantischen Macrosegmente werden als Versesegment bezeichnet und erhalten eine Id.All remaining microsegments are also connected to Macrose segments with the adjacent micro-segments, which are not marked as chorus segments, or with adjacent free areas. The semantic Macrose segments thus formed are called Versesegment and receive an Id.

Zu diesem Zeitpunkt befindet sich jeder Abschnitt des Audiosignals innerhalb eines semantischen Macrosegments.At this time, each section of the audio signal is within a semantic Macrosegment.

Semantische MicrosegmentierungSemantic microsegmentation

Die semantischen Macrosegmente, welche als Chorus- oder Versesegment bezeichnet sind, werden in kleinere semantische Microsegmente segmentiert.The semantic Macrose segments, which are called chorus or versesegment, are segmented into smaller semantic micro segments.

Folgender Ablauf stellt die Segmentierung der semantischen Macrosegmente dar:

  • - Einteilung der Versesegmente in Kick und Non Kick Parts
  • - Einteilung des ersten Macrosegments mit Sprachanteil in Intro und Verse bzw. Chorus Parts
  • - Segmentierung der Kick enthaltenden Macrosegmente in verschiedene Parts
The following is the segmentation of the semantic Macrose segments:
  • - Classification of the verse segments in Kick and Non Kick Parts
  • - Classification of the first Macrosegment with voice part in intro and verses or chorus parts
  • - Segmentation of the kick containing Macrose segments into different parts

Hierfür werden folgende Flags eingeführt, welche erweiterte Informationen über die Segmente enthalten:

  • - Kick Flag
  • - Voice Flag
For this, the following flags are introduced, which contain extended information about the segments:
  • - Kick Flag
  • - Voice flag

Einteilung der Versesegmente in Kick und Non Kick PartsClassification of the verse segments in Kick and Non Kick Parts

Die Versesegmente werden nun in einzelne semantische Microsegmente unterteilt. Alle mehr als vier Takte langen direkt aufeinanderfolgenden Takte, welche einen Eintrag in der Rhythm Map haben, werden jeweils zu einem semantischen Microsegment zusammengefügt. Die Kick Flag wird für diese Microsegment auf 1 gesetzt. Die restlichen zusammenhängenden Bereiche innerhalb des Versesegments, welche keinen Eintrag in der Rythm Map enthalten, werden jeweils zu eigenen semantischen Microsegmenten zusammengefügt, wobei die Kick Flag auf 0 gesetzt wird.The verse segments are now divided into individual semantic micro segments. All more than four bars long directly consecutive bars, which have an entry in the rhythm map, are each joined together to form a semantic microsegment. The kick flag is set to 1 for this microsegment. The remaining contiguous regions within the verse segment, which do not contain an entry in the rhythm map, are each joined together to form their own semantic micro segments, the kick flag being set to 0.

Einteilung des ersten Segments mit Sprachanteil in Intro und Verse PartsClassification of the first segment with speech content in intro and verse parts

Das aller erste Macrosegment im Lied, wird, falls es einen Sprachanteil enthält, entweder in Intro und Verse Microsegmente segmentiert oder in Intro und Chorus Microsegmente. Hierfür können verschiedene Verfahren zur Erkennung von Sprachanteilen in Audio Signalen verwendet werden. In dieser Erfindung werden die Informationen aus einem metadatenbasierten Verfahren extrahiert.The very first Macrose segment in the song, if it contains a portion of speech, is segmented into either Intro and Verse micro segments or into Intro and Chorus micro segments. For this purpose, various methods for recognizing speech components in audio signals can be used. In this invention, the information is extracted from a metadata-based method.

Der Zeitstempel des aller ersten Sprachanteils des Liedes wird innerhalb einer zur Rythm Map analogen Voice Map vermerkt. Allerdings wird der Zeitstempel an einer Zählzeit eingetragen, welche zum aller ersten Eintrag eines Bassdrumimpulses in der Rythm Map in einer Taktanzahl entfernt ist, welche ein Vielfaches von 4 darstellt. Es wird der Takt gewählt, welcher die geringste zeitliche Distanz zum ursprünglichen Zeitstempel des Sprachanteils aufweist.The timestamp of the first voice portion of the song is noted within a rhythm map analogous to the voice map. However, the time stamp is entered at a count time which is removed from the first entry of a bass drum pulse in the rhythm map in a number of cycles which is a multiple of 4. The clock is chosen which has the smallest time interval from the original time stamp of the speech component.

Falls ein mindestens vier Takte langer Zeitraum ohne Eintrag in der Voice Map im dem ersten Macrosegment, welches einen Eintrag in der Voicemap enthält, vorhanden ist, wird dieser Zeitraum als semantisches Microsegment segmentiert und mit dem Label Intro markiert. Der andere Teil des Macrosegments wird als Microsegment abgetrennt und behält seine Bezeichnung. If there is a period of at least four measures without an entry in the voice map in the first Macrose segment containing an entry in the voicemap, this period is segmented as a semantic microsegment and marked with the label Intro. The other part of the Macrose segment is separated as a microsegment and retains its name.

Für alle Microsegmente, welche in der Voicemap einen Eintrag enthalten, wird das Voiceflag auf 1 gesetzt.For all micro segments, which contain an entry in the voicemap, the voiceflag is set to 1.

In der hier vorgestellten Erfindung werden die Informationen zu Sprachanteilen in Liedern mithilfe von Metainformationen zu zeitsynchronisierten Sprachanteilen in Liedern, welche aus einer Datenbank gewonnen werden, extrahiert. Diesbezüglich gibt es Services, die solche Informationen zur Verfügung stellen.In the invention presented here, the information about speech portions in songs is extracted by using meta information about time-synchronized speech portions in songs derived from a database. In this regard, there are services that provide such information.

Die Daten enthalten Informationen über Beginn des Sprachanteil, sowie den gesprochenen/gesungenen textuellen Inhalt.The data contains information about the beginning of the speech portion, as well as the spoken / sung textual content.

Ist für das Lied ein Eintrag bezüglich der Sprachanteile enthalten, werden diese Daten zunächst aufbereitet. Es werden alle Einträge ignoriert, welche ausschließlich eine Konkatenation aus Inhalten wie „Yeah“, „Oh“, „Mhh“ oder der Namen eines der Songinterpreten oder Songproduzenten darstellen.If the song contains an entry concerning the language parts, these data are first processed. All entries are ignored, which are only a concatenation of contents like "Yeah", "Oh", "Mhh" or the name of one of the song interpreters or song producers.

Die zu ignorierenden Textbausteine werden aus einer vorher definierten Liste entnommen, sowie den Metainformationen des Liedes bezüglich des Künstlernamens und des Produzentennamens. Falls eine Übereinstimmung von Liedinhalt und einer beliebigen Konkatenation der Textbausteine auftritt, wird dieser Eintrag ignoriert. Diese Aufbereitung dient als Filterung von zum Rhythmus des Liedes asynchronen Sprachanteilen. Das Auftreten eines solchen Sprachbausteins kennzeichnet demnach kein neues Songsegment.The text blocks to be ignored are taken from a previously defined list, as well as the meta information of the song regarding the artist name and the producer name. If a match of song content and any concatenation of the text modules occurs, this entry is ignored. This processing serves as filtering of asynchronous language portions to the rhythm of the song. The occurrence of such a speech module therefore does not characterize a new song segment.

Segmentierung der Kick enthaltenden Segmente in verschiedene PartsSegmentation of the kick containing segments into different parts

Alle Parts innerhalb der Versesegmente oder Chorussegmente, welche eine Länge von mehr als vier Takten besitzen und einen Kickpart mit einer Dauer von vier Takten besitzen, werden nun weiter segmentiert. Ein Kickpart mit einer Dauer von vier Takten, beschreibt einen vier Takte langen Zeitraum innerhalb eines Segments, welcher in der Rythm Map innerhalb dieses Zeitraumes mindestens zwei Einträge hat.All parts within the verse segments or chorus segments that are more than four bars long and have a kick duration of four bars are now further segmented. A Kickpart with a duration of four bars, describes a four-bar period within a segment, which has at least two entries in the Rythm Map within this period.

Eine technische Ähnlichkeit zwischen zwei Audiosegmenten ergibt sich aus einer Formel hinsichtlich der Ähnlichkeitsfaktoren zweier 4-Takt-Segmente. Die Ähnlichkeitsfaktoren werden aus den folgenden Komponenten berechnet:

  • - Differenz des durchschnittlichen RMS Pegels der Segmente, nach Filterung durch einen Hochpassfilter
  • - Rhythmische Ähnlichkeit der Segmente
  • - Klangliche Ähnlichkeit der Segmente
A technical similarity between two audio segments results from a formula regarding the similarity factors of two 4-stroke segments. The similarity factors are calculated from the following components:
  • - Difference of the average RMS level of the segments, after filtering by a high-pass filter
  • - Rhythmic similarity of the segments
  • - Sound similarity of the segments

Alle Versesegmente werden nun temporär von Beginn des ersten Bassdrumimpulses innerhalb des Segments in gleichmäßige 4-Takt-Segmente unterteilt. Jedes Segment wird nun auf Anomalien der Rhythmusstruktur am Anfang oder Ende des Segments überprüft. Bei Identifikation einer solchen Anomalie wird die technische Ähnlichkeit des aktuellen 4-Takt-Segments sowie des darauffolgenden 4-Takt-Segments berechnet. Unterschreitet die technische Ähnlichkeit einen hoch angesetzten, genreabhängigen Schwellenwert, werden die beiden 4-Takt-Segmente als eigene Segmente aufgeteilt. Andernfalls bleiben die Segmente zusammenhängend.All the verse segments are now temporarily subdivided into equal 4-beat segments from the beginning of the first bass drum pulse within the segment. Each segment is now checked for rhythm structure anomalies at the beginning or end of the segment. Upon identification of such an anomaly, the technical similarity of the current 4-stroke segment and the subsequent 4-stroke segment is calculated. If the technical similarity falls below a high, genreabhängigen threshold, the two 4-stroke segments are divided as separate segments. Otherwise, the segments remain contiguous.

Im Weiteren wird die technische Ähnlichkeit aller 4-Takt-Segmente innerhalb des Macrosegments unabhängig von Anomalien der Rythmusstruktur verglichen. Hierfür wird der genreabhängige Schwellenwert deutlich geringer gesetzt, sodass die Unähnlichkeit zwischen den beiden Segmenten deutlich höher sein muss, um eine Segmentierung einzuleiten. In addition, the technical similarity of all 4-bar segments within the Macrosegments is compared independently of anomalies of the rhythm structure. For this purpose, the genreabhängige threshold is set much lower, so that the dissimilarity between the two segments must be significantly higher to initiate a segmentation.

Unterschreitet die Ähnlichkeit diesen genreabhängige Schwellenwert findet eine Segmentierung der betrachteten 4-Takt-Segmente statt. Andernfalls bleiben die Segmente zusammenhängend.If the similarity of this genreabhängige threshold value is a segmentation of the considered 4-stroke segments instead. Otherwise, the segments remain contiguous.

Direkt aufeinanderfolgende 4-Takt-Segmente, zwischen denen kein ausreichend hoher Unähnlichkeitswert bestimmt wurde, werden, falls beide in zerteilter Segmentform vorliegen, wieder zusammengefasst.Direct consecutive 4-stroke segments, between which a sufficiently high dissimilarity value has not been determined, are combined again, if both are in a segmented, segmented form.

Die Überprüfung auf Anomalien der Rhythmusstruktur erfolgt mithilfe des folgenden Verfahrens. Zwei aufeinanderfolgende 4-Takt-Segmente werden hinsichtlich ihrer Einträge in der Beat Map verglichen. Falls die Einträge in den Beat Maps zweier 4-Takt-Segmente innerhalb von mindestens zwei Takten eine hohe rhythmische Ähnlichkeit über einem Schwellenwert s1 aufweisen, innerhalb der ersten oder letzten ein bis zwei Takte aber eine Ähnlichkeit erreicht wird, welche einen niedrigen Schwellenwert s2 nicht überschreitet oder die Differenz der Anzahl der Einträge einen Schwellenwert s3 überschreitet, wird eine Anomalie festgestellt. Die beiden 4-Takt-Segmente werden also als solche segmentiert. Die genannten Schwellenwerte beschreiben einen universellen Ansatz und können genreabhängig variiert werden. Bei Musik, welche dem Genre „House“ angehört, führt die Identifikation eines fehlenden einzelnen Bassdrumimpulses am Anfang oder Ende eines 4-Takt-Segments bereits zu einer Segmentierung. Check for anomalies of the rhythm structure using the following procedure. Two consecutive 4-stroke segments are compared for their entries in the beat map. If the entries in the beat maps of two 4-stroke segments within at least two bars have a high rhythmic similarity above a threshold s1, within the first or last one to two bars but a similarity is achieved, which does not exceed a low threshold s2 or the difference in the number of entries exceeds a threshold s3, an anomaly is detected. The two 4-stroke segments are thus segmented as such. The mentioned thresholds describe a universal approach and can be varied depending on the genre. For music belonging to the genre "House", the identification of a missing single bass drum pulse at the beginning or end of a 4-bar segment already leads to a segmentation.

Interpretation der SegmenteInterpretation of the segments

Die einzelnen semantischen Microsegmente innerhalb eines Macrosegments werden in zwei Phasen interpretiert:The individual semantic microsegments within a macrosegment are interpreted in two phases:

Phase 1 phase 1

Die Microsegmente innerhalb eines Chorus Macrosegmentes werden final anhand ihrer klanglichen Ähnlichkeit mit allen anderen Microsegmenten innerhalb eines Macro Chorussegments geclustert. Aus diesem Clusteringprozess resultieren neue Cluster cl. Die Elemente der Cluster cl mit den geringsten Differenzen untereinander erhalten die Markierung ,c_[n]', da sie den echten Chorus verkörpern, wobei n für die zeitliche Position im Lied steht. Die restlichen Microsegmente der restlichen Cluster cl erhalten die Markierung ,cx_[n]', wobei n für die zeitliche Position im Lied steht.The microsegments within a Chorus Macrose segment are finally clustered on the basis of their sonic similarity to all other micro segments within a Macro Chorus segment. From this clustering process result new clusters cl. The elements of clusters cl with the smallest differences between each other are given the label, c_ [n] ', since they represent the real chorus, where n stands for the temporal position in the song. The remaining microsections of the remaining clusters cl are given the label, cx_ [n] ', where n stands for the time position in the song.

Das allererste Microsegment wird, falls nicht schon markiert als ,Intro‘ markiert. Das allerletzte Microsegment wird als ,Outro‘ markiert. Die Microsegmente innerhalb der Verse Macrosegmente werden chronologisch mit dem Label ,v_[n]' markiert, wobei n für die zeitliche Position im Lied steht. Das letzte Verse Microsegment, welches vor einem Chorus Macrosegment auftritt und die Kick Flag auf 0 hat, wird als ,Bridge‘ markiert.The very first micro segment is marked, if not already marked as, Intro '. The very last micro segment is marked as 'Outro'. The micro segments within the verses Macrose segments are marked chronologically with the label, v_ [n] ', where n stands for the temporal position in the song. The last verse Microsegment, which occurs before a Chorus Macrosegment and has the Kick Flag at 0, is marked as 'Bridge'.

Phase 2 phase 2

Mit Segmenten sind im Folgenden direkt aufeinanderfolgende 4-Takt-Einheiten gemeint, unabhängig von den Microsegmenten. Es werden die zuerst vorkommenden maximal acht aufeinanderfolgenden Segmente, welche einen Kick Part darstellen und als ,Intro‘ oder ,v_[n]' gekennzeichnet sind, mit den letzten vorkommenden maximal acht aufeinanderfolgenden Segmenten die einen Kick Part darstellen und entweder als ,cx_[n]', ,v', oder ,Outro‘ markiert sind hinsichtlich ihrer technischen Ähnlichkeit verglichen. Zusätzlich muss die Unähnlichkeit zu den ,c_[n]' Segmenten über einem bestimmten Schwellenwert liegen. Falls diese Ähnlichkeit über einem bestimmten Schwellenwert liegt, werden die Segmente zusätzlich als ,Extended_Intro‘ bzw. ,Extended_Outro‘ Part markiert, je nachdem welchem Ende des Liedes sie näher sind. Die Extended_Outro/Extended_Intro Bezeichnung wird an die Microsegment geschrieben, welche die markierten Segmente enthalten.By segments are meant in the following directly consecutive 4-stroke units, regardless of the micro segments. The first occurring maximum of eight consecutive segments representing a kick part and marked as 'Intro' or 'v_ [n]' are represented by the last occurring maximum of eight consecutive segments representing one kick part and either as, cx_ [n ] ',, v', or 'Outro' are compared in terms of their technical similarity. In addition, the dissimilarity to the 'c_ [n]' segments must be above a certain threshold. If this similarity is above a certain threshold, the segments are additionally marked as 'Extended_Intro' or 'Extended_Outro' Part, depending on which end of the song they are closer to. The Extended_Outro / Extended_Intro designation is written to the microsegment containing the marked segments.

Die Grenzen der einzelnen semantischen Microsegmente stellen die potenziellen Übergangszeitpunkte dar.The boundaries of each semantic microsegment represent the potential transition times.

Eine detailliertere Genreklassifikation kann anhand der Informationen aus Phase 2 gewonnen werden. Der Algorithmus der Genreklassifikation kann vom Provider der Software jederzeit verändert werden, um sich aktuellen, gesellschaftlichen Trends anzupassen.A more detailed genre classification can be based on the information from Phase 2 be won. The algorithm of genre classification can be changed by the provider of the software at any time to adapt to current social trends.

Ein Beispiel für eine detailliertere Genreklassifikation ist im Folgenden beschrieben. Ein Lied mit Extended Part kann unter Berücksichtigung der Extended-Intro und Extended_Outro Microsegment in jedem Fall genauer klassifiziert werden. Lieder, welche diese Microsegmente enthalten, werden zunächst als ,Extended Lieder‘ klassifiziert. Nun erfolgt ein Vergleich der durchschnittlichen RMS-Pegel des ,Extended_Intro‘ Microsegments mit dem zuerst auftretenden Chorus Microsegments ,c_0'. Vor der Berechnung der durchschnittlichen RMS Pegel erfolgt eine Normalisierung des Liedes und eine Filterung der Frequenzen durch einen Hochpassfilter. Nun werden die durchschnittlichen RMS-Pegel der mit ,Extended_Intro‘ markierten Microsegmente und der ,c_0' Microsegmente verglichen.An example of a more detailed genre classification is described below. A song with Extended Part can be classified in any case, taking into account the Extended-Intro and Extended_Outro Microsegment. Songs containing these micro segments are initially classified as Extended Songs. Now a comparison of the average RMS levels of the 'Extended_Intro' microsegment with the first occurring Chorus microsegments, c_0 'is made. Before the average RMS level is calculated, the song is normalized and the frequencies are filtered by a high pass filter. Now, the average RMS levels of the 'Extended_Intro' marked micro segments and the 'c_0' micro segments are compared.

Falls RMS(c_0) + Toleranz > RMS(Extended_Intro) → Genre: ,Electro House‘
Sonst Genre: ,commercial Deep House‘, ,Deep House‘, ,Techno‘
If RMS (c_0) + tolerance> RMS (Extended_Intro) → Genre:, Electro House '
Otherwise Genre: 'commercial Deep House', 'Deep House', 'Techno'

Die Anzahl der potenziellen Bassdrumimpulse im Lied wird verglichen mit der tatsächlichen Anzahl der Bassdrumimpulse innerhalb der Rythm Map. ( ( #4 t e l Z ä h l z e i t e n ) ( # B a s s d r u m i m p u l s e ) ) ( #4 t e l Z ä h l z e i t e n ) > 0.4

Figure DE102016226042A1_0002
The number of potential bass drum pulses in the song is compared to the actual number of bass drum pulses within the rhythm map. ( ( # 4 t e l Z ä H l z e i t e n ) - ( # B a s s d r u m i m p u l s e ) ) ( # 4 t e l Z ä H l z e i t e n ) > 0.4
Figure DE102016226042A1_0002

→ Genre: ,commercial Deep House‘
Sonst: ,Deep House‘, Techno‘
→ Genre: 'commercial Deep House'
Otherwise: 'Deep House', Techno '

Nun wird das Verhältnis des durchschnittlichen RMS-Pegels der Frequenzen im Mid und High Frequenzspektrum mit dem durchschnittlichen RMS-Pegel der Frequenzen im Low Frequenzspektrum über das gesamte Lied in ein Verhältnis gesetzt.
Verhältnis > Techno-Schwellenwert → Genre: ,Techno‘
Sonst: Genre: ,Deep House‘
Now the ratio of the average RMS level of the frequencies in the mid and high frequency spectrum is set in relation to the average RMS level of the frequencies in the low frequency spectrum over the entire song.
Relationship> Techno Threshold → Genre: 'Techno'
Otherwise: Genre: 'Deep House'

Berechnen von ÜbergangsfaktorenCalculate transition factors

Die Übergangsfaktoren pro Microsegment beschränken sich hier auf folgende Komponenten sind aber erweiterbar:

  • - Durchschnittlicher RMS Pegel nach RMS-Normalisierung
  • - Durchschnittlicher RMS Pegel pro Frequenzband (Low: 0-250Hz, Mid: 251-5000Hz, High: 5000-20000Hz) nach RMS-Normalisierung
  • - MFCC Vektor
  • - Kick Flag
  • - Voice Flag
The transition factors per micro segment are limited to the following components but are expandable:
  • - Average RMS level after RMS normalization
  • - Average RMS level per frequency band (Low: 0-250Hz, Mid: 251-5000Hz, High: 5000-20000Hz) after RMS normalization
  • - MFCC vector
  • - Kick Flag
  • - Voice flag

Das Ergebnis der erweiterten Songanalyse sind somit die folgenden Komponenten:

  • - Menge an Microsegmenten
    • ◯ Semantische Bezeichnung pro Microsegment
      • ■ Semantische Bezeichnung des übergeordneten Macrosegments {Verse, Chorus}
      • ■ Semantische Bezeichnung des Microsegments {Intro, v_[n], c_[n], c_x[n], Bridge, Outro}
      • ■ Semantische Bezeichnung des interpretierten Microsegments (Intro, Extended Intro, v_[n], c_[n], c_x[n], Extended Outro, Outro)
    • ◯ Grenzen pro Microsegment
      • ■ Linke Grenze Zeitstempel
      • ■ Rechte Grenze Zeitstempel
    • o Übergangsfaktoren pro Microsegment:
      • ■ Durchschnittlicher RMS Pegel nach RMS-Normalisierung
      • ■ Durchschnittlicher RMS Pegel pro Frequenzband (Low: 0-250Hz, Mid: 251-5000Hz, High: 5000-20000Hz) nach RMS-Normalisierung
      • ■ MFCC Vektor
      • ■ Kick Flag
      • ■ Voice Flag
  • - Genreklasse des Liedes: {House, RnB, Other}
The result of the extended song analysis are thus the following components:
  • - amount of micro segments
    • ◯ Semantic designation per microsegment
      • ■ Semantic label of the parent Macrosegment {verses, chorus}
      • ■ Semantic Microsegment Description {Intro, v_ [n], c_ [n], c_x [n], Bridge, Outro}
      • ■ Semantic label of the interpreted microsegment (Intro, Extended Intro, v_ [n], c_ [n], c_x [n], Extended Outro, Outro)
    • ◯ Limits per microsegment
      • ■ Left border timestamp
      • ■ Right border timestamp
    • o Transition factors per microsegment:
      • ■ Average RMS level after RMS normalization
      • ■ Average RMS level per frequency band (Low: 0-250Hz, Mid: 251-5000Hz, High: 5000-20000Hz) after RMS normalization
      • ■ MFCC vector
      • ■ Kick Flag
      • ■ Voice flag
  • - Genre class of the song: {House, RnB, Other}

Für alle weiteren Phasen kann das Resultat einer beliebigen Songanalyse verwendet werden, welches das oben gegebene Format erfüllt.For all other phases, the result of any song analysis can be used, which fulfills the format given above.

Übergangszeitpunkt auswählen Select transition time

Die Funktion zur Auswahl des Übergangszeitpunkts stellt eine Kerninnovation dieser Erfindung dar. Diese richtet sich zusätzlich zu den technischen Parametern auch an semantischen Parametern, an den persönlichen, situationsabhängigen Bedürfnissen des Users.The function for selecting the transition time represents a core innovation of this invention. In addition to the technical parameters, this also depends on semantic parameters, on the personal, situation-dependent needs of the user.

Diese setzten sich wie folgt zusammen:

  • - allgemeine persönliche Präferenzen des Users (gespeicherte Userdaten),
  • - situationsabhängige Präferenzen des Users (Useraktivität) unter Berücksichtigung:
    • - des Benutzungsverhaltens des Musikplayers,
    • - des Fahrverhaltens sowie
    • - des umweltbedingten Kontextes, und
  • - allgemeine gesellschaftliche Trends (aggregierte Flottendaten).
These were composed as follows:
  • - general personal preferences of the user (stored user data),
  • - situation-dependent preferences of the user (user activity) under consideration:
    • - the usage behavior of the music player,
    • - the driving behavior as well
    • - the environmental context, and
  • - general social trends (aggregated fleet data).

Die aus der erweiterten Songanalyse gewonnen Segmente stellen hinsichtlich ihrer Grenzen, die Übergangszeitpunkte für die Übergangskonstruktion dar. Es wird versucht ein Segment x in Lied A und einen Segment y in Lied B so zu wählen, dass die im entsprechenden Regelwerk beschriebene Güte eines Übergangs maximiert wird. Im Folgenden werden die Segmente x und y als ausgewählte Segmentkombination (x, y) bezeichnet. Im Folgenden werden die Faktoren für die Wahl der Segmentkombination genauer erläutert. Diese setzten sich aus den folgenden Parametern zusammen:

  • - Useraktivitätsfaktor
  • - Semantischer Parameter
  • - Inhaltlicher Parameter
  • - Technischer Parameter
The segments obtained from the extended song analysis represent the transitional points in time for the transitional construction. An attempt is made to select a segment x in song A and a segment y in song B in such a way that the quality of a transition described in the corresponding rules is maximized , In the following, the segments x and y are referred to as the selected segment combination (x, y). In the following, the factors for the selection of the segment combination are explained in more detail. These were composed of the following parameters:
  • - User activity factor
  • - Semantic parameter
  • - Content parameter
  • - Technical parameter

UseraktivitätsfaktorUser activity factor

Mit dem Useraktivitätsfaktor ist der Einfluss der Useraktivität auf die Auswahl der Segmentkombination gemeint. Abhängig von der Größe des Useraktivitätsfaktors werden innerhalb des Liedes A frühere Segmente gewählt und in Lied B spätere Segmente. So wird die Dauer des Liedes, sowie die Dauer bis zum Höhepunkt des neuen Liedes verkürzt, was zu einem aufregenderen Musikerlebnis führt. Der Useraktivitätsfaktor bestimmt somit ein Zeitfenster in welchem Segmente ausgewählt werden können.The user activity factor is the influence of user activity on the selection of the segment combination. Depending on the size of the user activity factor, earlier segments are selected within song A and later segments in song B. This shortens the duration of the song, as well as the duration until the climax of the new song, resulting in a more exciting musical experience. The user activity factor thus determines a time window in which segments can be selected.

Semantischer ParameterSemantic parameter

Mit dem semantischen Parameter ist der Einfluss von Segmenteigenschaften hinsichtlich der Liedstruktur gemeint. Diese beeinflussen die semantische Übergangsgüte des Übergangs. Es wird versucht die semantische Übergangsgüte zwischen zwei Segmente zu maximieren, was dazu führt, dass der Übergang vom User als aufregend empfunden wird.The semantic parameter refers to the influence of the segmental properties on the song structure. These influence the semantic transition quality of the transition. An attempt is made to maximize the semantic quality of transition between two segments, which results in the transition being perceived as exciting by the user.

Die Priorisierung der Segmentkombinationen geschieht unter Berücksichtigung des persönlichen Regelwerks. Das Regelwerk ist nach Priorisierung geordnet. In dem persönlichen Regelwerk eines Users können bestimmte Segmentkombination allgemein, ausschließlich für ein Genre oder ausschließlich für ein Lied angegeben sein. Das persönliche Regelwerk ist aus persönlichen Präferenzen, sowie einem allgemeinen Regelwerk fusioniert. In diesem Regelwerk sind Affinitäten zu Segmenten innerhalb der Allgemeinheit an Liedern, sowie spezifischen Genres und Liedern bereits als Regeln mit Prioritätswert formuliert.The prioritization of the segment combinations is done taking into account the personal rules. The rules are ordered by prioritization. In the personal set of rules of a user certain segment combinations can be general, exclusively for one genre or only for one song. The personal rules are fused from personal preferences, as well as a general set of rules. In this framework, affinities to segments within the general public of songs, as well as specific genres and songs are already formulated as rules with priority value.

Im Folgenden ist ein Auszug eines beispielhaften Regelwerks für das Genre House eines Users U1 vorgestellt. Das Regelwerk ist nach Priorität der Regel geordnet:

  • - Ein Chorussegment x endet in einem Versesegment y
  • - Ein Extended_Outro Segment x endet in einem Versesegment y
  • - Ein Extended_Outro Segment x endet in einem Extended Intro Segment y
  • - Ein Chorussegment x vor eine Bridge y endet in einem Versesegment y
  • - Ein Chorussegment x endet in einem Chorussegment y
  • - Ein Versesegment x endet in einem Versesegment y
The following is an excerpt of an exemplary set of rules for the genre House of a user U1 presented. The rules are ordered by priority rule:
  • - A chorus segment x ends in a verse segment y
  • - An Extended_Outro segment x ends in a verse segment y
  • - An Extended_Outro segment x ends in an Extended Intro segment y
  • - A chorus segment x in front of a bridge y ends in a verse segment y
  • - A chorus segment x ends in a chorus segment y
  • - A verse segment x ends in a verse segment y

Zusätzlich zu den durch das Regelwerk angewendeten Regeln wird versucht folgende Vorgaben einzuhalten: In addition to the rules applied by the policy, we try to adhere to the following guidelines:

Die hierbei genannten präferierten Segmente bezeichnen Segmente, zu denen der User oder die Allgemeinheit laut persönlichem Regelwerk eine hohe Affinität aufweist.

  • - Es wird versucht, den Übergangszeitpunkt so zu wählen, dass die Anzahl von präferierten Segmenten in Lied A vor dem Übergangszeitpunkt zu Lied B maximal ist. Es wird außerdem versucht den Übergangszeitpunkt so zu wählen, dass ein präferiertes Segment das letzte Segment x vor dem Übergangszeitpunkt darstellt.
  • - Es wird versucht, den Übergangszeitpunkt so zu wählen, dass die Anzahl von präferierten Segmenten in Lied B nach dem Übergang maximal ist.
  • - Es wird versucht, den Übergangzeitpunkt so zu wählen, dass der Übergang nicht in einem nicht präferierten Segment y in Lied B endet.
The preferred segments mentioned here are segments to which the user or the general public has a high affinity according to personal rules.
  • It is attempted to choose the transition time such that the number of preferred segments in song A is maximum before the transition to song B. It is also attempted to choose the transition time such that a preferred segment represents the last segment x before the transition time.
  • It is attempted to choose the transition time such that the number of preferred segments in song B after the transition is maximum.
  • An attempt is made to choose the transition time such that the transition does not end in a non-preferred segment y in song B.

Inhaltlicher ParameterContent parameter

Mit dem inhaltlichen Parameter ist der Einfluss von technischen Liedparametern gemeint, welche die Übergangsgüte des Übergangs beeinflussen. Es wird versucht die Übergangsgüte zwischen zwei Segmente zu maximieren, was dazu führt, dass der Übergang vom User als fließend empfunden wird. Als technische Liedparameter werden die Segmenteigenschaften verwendet.The content parameter refers to the influence of technical song parameters, which influence the transitional quality of the transition. An attempt is made to maximize the crossover quality between two segments, which results in the user perceiving the transition as fluid. The technical song parameters are the segment properties.

Die Priorisierung der Segmentkombinationen geschieht unter Berücksichtigung der folgenden festgelegten Regeln, welches nur vom Provider der Software geändert werden können:

  • - Falls die Tonarten der beiden Lieder hinsichtlich der in beschriebenen passenden Tonarten nicht übereinstimmen, wird, falls vorhanden, eines der Extended-Intro oder Extended_Outro Segmente eines der Lieder oder bevorzugt beider Lieder als Übergangszeitpunkt gesetzt.
  • - Die Segmentkombination wird so gewählt, dass nicht in den Segmenten beider Lieder ein Sprachanteil vermerkt ist.
  • - Es werden, falls vorhanden, bevorzugt Extended-Intro oder Extended_Outro Segmente als Übergangszeitpunkte verwendet.
  • - Falls ein Extended_Intro oder Extended_Outro Segmente verwendet wird, sollte das Segment des anderen Liedes ein Segment mit Kick Flag auf 1 sein.
  • - Es werden alle Segmentkombinationen priorisiert, welche nicht beide die Kick Flag auf 0 haben.
  • - Bei der Wahl eines Chorussegments als Segment x, wird bevorzugt das letzte Chorussegment, vor Auftreten eines Verses gewählt.
  • - Bei der Wahl eines Versesegments als Segment y, wird bevorzugt das erste Versesegment nach Auftreten des Intros oder nach Auftreten eines Chorussegments gewählt.
  • - Bei der Wahl eines Versesegments als Segment y, wird bevorzugt das erste Versesegment gewählt, welches die Voice Flag auf 1 hat.
The prioritization of the segment combinations takes place taking into account the following defined rules, which can only be changed by the provider of the software:
  • If the keys of the two songs do not match with respect to the corresponding keys described in FIG. 1, one of the Extended Intro or Extended_Outro segments of one of the songs, or preferably both songs, if any, is set as the transition time.
  • - The segment combination is chosen so that not in the segments of both songs a voice component is noted.
  • If present, Extended-Intro or Extended_Outro segments are preferably used as transition times.
  • - If an Extended_Intro or Extended_Outro segments are used, the segment of the other song should be a Segment with Kick Flag at 1.
  • All segment combinations that do not both have the kick flag at 0 are prioritized.
  • - When choosing a chorus segment as segment x, the last chorus segment before the occurrence of a verse is chosen.
  • - When selecting a versesegments as segment y, the first versesegment is preferably chosen after the occurrence of the intro or after the occurrence of a chorus segment.
  • When selecting a verse segment as segment y, the first verse segment is preferably chosen which has the voice flag at 1.

Technischer ParameterTechnical parameter

Mit dem technischen Parameter ist folgendes gemeint:

  • - Es wird eine Segmentkombination bevorzugt, welche hinsichtlich des durchschnittlichen RMS-Pegels am ähnlichsten von allen anderen Kombinationen ist.
  • - Es wird eine Segmentkombination bevorzugt, welche sich hinsichtlich des durchschnittlichen RMS-Pegels im Frequenzband Low am ähnlichsten von allen anderen Kombinationen ist.
  • - Es wird eine Segmentkombination bevorzugt, welche eine hohe klangliche Ähnlichkeit aufweist.
The technical parameter means the following:
  • A segment combination which is most similar in terms of average RMS level to all other combinations is preferred.
  • A segment combination is preferred which, in terms of the average RMS level in the frequency band Low, is most similar to all other combinations.
  • - A segment combination is preferred which has a high similarity in sound.

Die vier Faktoren werden in Korrelation gebracht. Der Useraktivitätsfaktor entscheidet über den ungefähren Zeitraum des Übergangs (innerhalb der ersten 25- 50% von Lied A, 0-25% von Lied B). Der semantische Parameter, beeinflusst die Priorisierung der in diesem Zeitraum möglichen Segmentkombinationen. Der inhaltliche Parameter bestimmt eine Auswahl aus einer Menge an Segmentkombinationen mit höchster Priorität. Die Größe der Menge hängt von den Werten des semantischen Parameters ab. Hierbei werden alle Segmentkombinationen mit Bewertungen über einem von der Useraktivität abhängigen Schwellenwert ausgewählt. Die finale Auswahl einer Segmentkombination wird anhand des technischen Parameters bestimmt. Diese ausgewählte Segmentkombination wird als Übergangszeitraum festgelegt und in der Übergangskonstruktion verwendet. The four factors are correlated. The user activity factor determines the approximate time of the transition (within the first 25-50% of song A, 0-25% of song B). The semantic parameter influences the prioritization of possible segment combinations during this period. The content parameter determines a selection from a set of segment combinations with the highest priority. The size of the set depends on the values of the semantic parameter. This selects all segment combinations with ratings above a user activity threshold. The final selection of a segment combination is determined by the technical parameter. This selected segment combination is defined as a transitional period and used in the transitional design.

Der User kann manuell zu jedem Zeitpunkt einen nächstmöglichen, sauberen Übergang anfordern. Hierfür werden die vier Faktoren Useraktivitätsfaktor, semantische Parameter, inhaltliche Parameter und technische Parameter wie beschrieben in Korrelation gebracht. Allerdings wird hierbei bei dem aktuell gespielten Lied der jetzige Zeitpunkt als frühester Übergangszeitpunkt gesetzt. Der späteste Übergangszeitpunkt resultiert aus der Summe des jetzigen Zeitpunkts und einem von der Useraktivität abhängigen maximalen Warteoffsets. Dieser maximalen Warteoffsets wird mit höherer Useraktivität kürzer. Innerhalb des so bestimmten Zeitraums werden mithilfe des semantischen und inhaltlichen Parameters die möglichen Segmentkombinationen priorisiert und die beste Segmentkombination unter Berücksichtigung des technischen Parameters wird als Übergangszeitpunkt gewählt.The user can manually request a next clean transition at any time. For this purpose, the four factors user activity factor, semantic parameters, content parameters and technical parameters are correlated as described. However, in this case the currently played song is set as the earliest transition time. The latest transition time results from the sum of the current time and a maximum waiting offsets depending on the user activity. This maximum waitoffset becomes shorter with higher user activity. Within the period thus determined, the possible segment combinations are prioritized using the semantic and content-related parameters, and the best segment combination, taking into account the technical parameter, is selected as the transitional time.

Um das Musikerlebnis zu erhöhen, wird für die Auswahl des Übergangszeitraumes eine Zufallsmaschine eingesetzt, welche das Zeitfenster in beiden Liedern, zur möglichen Segmentauswahl, welches durch den Useraktivitätsfaktor bestimmt wird, innerhalb eines Toleranzraumes variieren kann. Der Toleranzraum wird mit steigendem Useraktivitätsfaktor nicht linear in beide Richtungen erweitert.In order to increase the music experience, a random machine is used for the selection of the transition period, which can vary the time window in both songs, for possible segment selection, which is determined by the user activity factor, within a tolerance space. The tolerance space is not extended linearly in both directions with increasing user activity factor.

Übergang konstruierenConstruct transition

Die Phase der Übergangskonstruktion gliedert sich in:

  • - die Auswahl einer abstrakten Übergangsform und
  • - die situationsabhängige Anpassung der abstrakten Übergangsform.
The phase of the transitional construction is divided into:
  • - the selection of an abstract transitional form and
  • - the situation-dependent adaptation of the abstract transitional form.

Die Auswahl einer abstrakten ÜbergangsformThe selection of an abstract transitional form

Die Auswahl einer abstrakten Übergangsform aus einer Menge vordefinierter, abstrakter Übergangsformen erfolgt chronologisch in folgenden Phasen. Jede Phase filtert die aktuelle Auswahl an abstrakten Übergangsformen:

  • - Auswahl in Abhängigkeit des Genres,
  • - Auswahl in Abhängigkeit der Semantik,
  • - Auswahl in Abhängigkeit Useraktivität,
  • - Auswahl in Abhängigkeit persönlicher Präferenzen, Auswahl in Abhängigkeit gesellschaftlicher Trends und
  • - Auswahl in Abhängigkeit der Verwendungen.
The selection of an abstract transitional form from a set of predefined, abstract transitional forms occurs chronologically in the following phases. Each phase filters the current selection of abstract transitional forms:
  • - selection depending on the genre,
  • - selection depending on the semantics,
  • - selection depending on user activity,
  • Selection according to personal preferences, selection depending on social trends and
  • - Selection depending on the uses.

Eine abstrakte Übergangsform beschreibt ein Übergangsverfahren zwischen zwei digitalen Audiosignalen. Eine abstrakte Übergangsform ist innerhalb des persönlichen Regelwerks gespeichert, kann aber modifiziert werden. Dies geschieht vom Provider der Software.An abstract transitional form describes a transitional procedure between two digital audio signals. An abstract transitional form is stored within the personal set of rules, but can be modified. This is done by the provider of the software.

Eine abstrakte Übergangsform besteht aus Metainformationen, sowie inhaltlichen Daten. Die Metainformationen enthalten folgende Informationen:

  • - nichtleeres Tupel von jeweils einer nichtleeren Menge von Genres,
  • - nichtleeres Quadrupel von jeweils einer nichtleeren Menge an Segmenten,
  • - nichtleeres Quadrupel von jeweils einer nichtleeren Menge von erlaubten Kick Flags für die Segmente,
  • - nichtleeres Quadrupel von jeweils einer nichtleeren Menge von erlaubten Voice Flags für die Segmente,
  • - Aktivitätsfaktor,
  • - allgemeiner Popularitätsfaktor,
  • - persönlicher Popularitätsfaktor und
  • - Information über die Anzahl der Verwendungen innerhalb dieser Benutzungseinheit.
An abstract transitional form consists of meta information as well as content data. The meta-information contains the following information:
  • - non-empty tuples of one non-empty set of genres,
  • - empty quadruple of each one non-empty set of segments,
  • nonempty quadruple of each of a nonempty set of allowed kick flags for the segments,
  • non-empty quadruple of each one non-empty set of allowed voice flags for the segments,
  • - Activity factor,
  • - general popularity factor,
  • - personal popularity factor and
  • - Information about the number of uses within this unit of use.

Die Metainformationen:

  • - allgemeinen Popularitätsfaktor und
  • - persönlichen Popularitätsfaktor
für eine abstrakte Übergangsform sind in dem persönlichen Regelwerk definiert und ergeben sich ursprünglich aus den persönlichen Präferenzen, sowie den allgemeinen Präfenzen.The meta-information:
  • - general popularity factor and
  • - personal popularity factor
for an abstract transitional form are defined in the personal set of rules and arise originally from the personal preferences, as well as the general prefaces.

Der Inhalt besteht aus abstrakten Angaben zur Durchführung eines Übergangsverfahren, welche die Modifikation der zur überblendenden Audiosignale relativ beschreiben:

  • - Taktlänge der Übergangsdauer,
  • - relative Position der Klimaxoffsets k1, k2,
  • - abstrakte Funktion des Lautstärkeeffekts,
  • - abstrakte Funktion der EQ-Aktivität pro Band (Low, Mid, High),
  • - abstrakte Funktion der Hoch/Tiefpass-Filteraktivität,
  • - abstrakte Funktion der Aktivität verschiedener Parameter weiterer DJ- Effekte,
  • - (Informationen zur dynamischen Modifikation der Einspielung von Liedern (Loop, Scratch, Cue Effekte)) und
  • - (Information zur Einspielung von Audiosamples: (Klimaxoffset k3, Audiosample Id). Alle Einträge bis auf die letzten beiden müssen ausgefüllt sein.
The content consists of abstract information for the implementation of a transitional procedure, which relatively describes the modification of the fading audio signals:
  • - cycle length of the transition period,
  • relative position of the climatic offsets k 1 , k 2 ,
  • - abstract function of the volume effect,
  • - abstract function of EQ activity per band (Low, Mid, High),
  • - abstract function of high / low pass filter activity,
  • - abstract function of the activity of various parameters of other DJ effects,
  • - (Information on the dynamic modification of the recording of songs (loop, scratch, cue effects)) and
  • - (Information about the recording of audio samples: (Climate offset k3, Audiosample Id) All entries except the last two must be completed.

Die zur Verfügung stehenden Effekte der Audio Signal Processing Verfahren sind unter Berücksichtigung der Effekte, welche menschlichen Club- und Radio DJs zur Verfügung stehen, gewählt. Aus diesem Grund wurde ein 3 Band EQ und ein Hoch/Tiefpass-Filter ähnlichem dem 3 Band EQ und dem Hoch/Tiefpass-Filter auf einem DJ-Mischpult gewählt.The available effects of the audio signal processing methods are chosen taking into account the effects available to human club and radio DJs. For this reason, a 3 band EQ and a high / low pass filter similar to the 3 band EQ and the high / low pass filter on a DJ mixer were chosen.

Mit den oben genannten weiteren DJ-Effekten sind digitale Simulationen von typischen Audioeffekte, welche von DJs mittels analoger oder digitaler Prozessoren oder Software auf Lieder angewendet werden, bezeichnet. Eine Auswahl davon wird hier präsentiert, ist aber erweiterbar:

  • - Phaser
  • - Flanger
  • - Beatcrusher
  • - Gater
The above-mentioned other DJ effects are digital simulations of typical audio effects that DJs apply to songs using analog or digital processors or software. A selection of these is presented here, but is expandable:
  • - Phaser
  • - Flanger
  • - beat crusher
  • - Gater

Einige Beispiel für abstrakte Übergangsformen, welche mithilfe der Ansteuerung verschiedener DJ Effekte realisierbar sind, werden im Folgenden gelistet:

  • - Ineinandermischen zweier Extended Parts in House Liedern
  • - „Wechsel der Bassdrum“ in House Liedern: Anwendung eines Hochpassfilters auf Lied A für einige Takte zum „Muten“ der Bassdrumimpulse in dem Kick Flag 1 Segment von Liedern A, während eines Kick Flag 0 Segments in Lied B, kurz vor Beginn des Kick Flag 1 Segments in Lied B.
  • - beliebig langes Ineinandermischen beliebiger Segmente in Techno Liedern
  • - Anwendung eines halbierenden Loops auf das Segment x in Lied A kurz vor dem Beginn des Segment y in Lied B, welches ein Chorussegment darstellt.
  • - Scratch Effekte auf den ersten Beat eines R&B Liedes
  • - langsame Steigerung der Frequenz eines Hochpassfilters für einen Übergang zwischen House Liedern
  • - ein Takt nach dem letzten Bassdrumimpuls in Liedern des Genres Other, das nächste Lied schnell hereinmischen
  • - Anwendung eines der blitzartigen Übergangsformen für Lieder des Genres Other, welche fast keine Kick Flags auf 1 haben
Some examples of abstract transitional forms, which can be realized by using different DJ effects, are listed below:
  • - Mixing up two Extended Parts in House Songs
  • - "Changing the Bass Drum" in House Songs: Applying a high-pass filter on song A for a few bars to "mute" the bass drum pulses in the kick flag 1 Segment of songs A, during a kick flag 0 segment in song B, just before the kick flag starts 1 Segments in song B.
  • - Any length of mixing of any segments in techno songs
  • Applying a halving loop to segment x in song A just before the beginning of segment y in song B, which is a chorus segment.
  • - Scratch effects on the first beat of an R & B song
  • Slowly increase the frequency of a high pass filter for a transition between house songs
  • - one bar after the last bass drum impulse in songs of the genre Other, quickly mix in the next song
  • - Applying one of the flashy transitional styles for songs of the genre Other, which have almost no kick flags on 1

Die Menge an abstrakten Übergangsformen ist erweiterbar. Der Aufwand zur Definition einer abstrakten Übergangsform ist sehr gering. Denkbar sind hier API Methoden zur Erweiterung der abstrakten Übergangsformen, nicht nur durch den Provider der Software, sondern auch durch musikbegeisterte User oder menschliche Club- oder Radio-DJs.The set of abstract transitional forms is expandable. The effort to define an abstract transitional form is very small. Conceivable here are API methods to extend the abstract transitional forms, not only by the provider of the software, but also by music enthusiastic users or human club or radio DJs.

Mit einer relativen Kurve ist eine Funktion gemeint, welche den relativen zeitlichen Verlauf der Effektivität des jeweiligen Audio Signal Processing Verfahrens darstellt. Die Effektivität wird als Funktion dargestellt. Die Funktionsargumente repräsentieren die Zeitachse und stellen relative Werte von 0 bis 1 dar. Die Funktionswerte stellen den Wert eines Parameters für den jeweiligen Algorithmus innerhalb des Audio Signal Processing Verfahrens, relativ mit Werten von 0 bis 1, dar.By a relative curve is meant a function which represents the relative time course of the effectiveness of the respective audio signal processing method. The effectiveness is shown as a function. The function arguments represent the time axis and represent relative values from 0 to 1. The function values represent the value of a parameter for the respective algorithm within the audio signal processing method, relative to values from 0 to 1.

Auswahl in Abhängigkeit des GenresSelection depending on the genre

Anhand der Genrekombination der zu überblendenden Lieder wird eine Auswahl aus der Menge vordefinierter, abstrakter Übergangsformen gewählt. Hierfür wird das in der erweiterten Songanalyse bestimmte detailliertere Genre verwendet. Die Metainformationen der Übergangsformen werden auf einen Eintrag dieser Genrekombination geprüft und bei Identifikation eines solchen Eintrags ausgewählt hinzugefügt.Based on the genre combination of the songs to be blended, a selection from the set of predefined, abstract transitional forms is chosen. For this purpose, the more detailed genre used in advanced song analysis is used. The meta-information of the transitional forms is checked for an entry of this gene recombination and added upon identification of such an entry.

Für jede Kombination des aus der erweiterten Songanalyse resultierenden Genres der beiden Lieder ist mindestens eine Übergangsform definiert.For each combination of the extended song analysis resulting genre of the two songs at least one transitional form is defined.

Auswahl in Abhängigkeit der SemantikSelection depending on the semantics

Mit dem Begriff Übergangszeitpunkt ist der Zeitstempel genau zwischen k1 und k2 definiert. Mit diesem Begriff können die nächstanliegenden Segmente innerhalb der Lieder um den Übergangszeitpunkt herum indirekt beschrieben werden.With the term transition time, the time stamp is defined exactly between k 1 and k 2 . With this term, the nearest segments within the songs can be indirectly described around the transition time.

Es werden die Übergangsformen ausgewählt, welche in den Metainformationen einen Eintrag bezüglicher der Segmentkombination (x0, x1, y0, y1) aufweisen.

  • - Lied A stellt das auszublendende Lied dar.
  • - Lied B stellt das einzublendende Lied dar.
  • - x0 stellt die Segmentbezeichnung (ohne ID) des Segmentes vor dem Übergangszeitpunkt des Liedes A dar.
  • - x1 stellt die Segmentbezeichnung (ohne ID) des Segmentes nach dem Übergangszeitpunkt des Liedes A dar.
  • - y0 stellt die Segmentbezeichnung (ohne ID) des Segmentes vor dem Übergangszeitpunkt des Liedes B dar.
  • - y1 stellt die Segmentbezeichnung (ohne ID) des Segmentes nach dem Übergangszeitpunkt des Liedes B dar.
The transition forms are selected, which in the meta information have an entry with respect to the segment combination (x0, x1, y0, y1).
  • - Song A represents the song to be hidden.
  • - Song B represents the song to be played.
  • - x0 represents the segment name (without ID) of the segment before the transition time of the song A.
  • x1 represents the segment name (without ID) of the segment after the transition time of the song A.
  • - y0 represents the segment name (without ID) of the segment before the transition time of the song B.
  • y1 represents the segment name (without ID) of the segment after the transition time of the song B.

Zusätzlich wird in den Metainformationen des Übergangs geprüft, ob die Übergänge in den Metainformationen eine Eignung hinsichtlich gesetzter Kick Flag und Voice Flag für die Segmentkombination (x0, x1, y0, y1) aufweisen.In addition, in the meta information of the transition, it is checked whether the transitions in the meta information have a suitability with regard to the set kick flag and voice flag for the segment combination (x0, x1, y0, y1).

Auswahl in Abhängigkeit UseraktivitätSelection depending on user activity

Die gefilterte Menge wird hinsichtlich des Aktivitätsfaktors sortiert. Es wird die Auswahl an Übergangsformen ausgewählt, welche mit dem Useraktivitätsfaktor innerhalb einer festgelegten Toleranz übereinstimmt.The filtered amount is sorted according to the activity factor. The selection of transitional shapes is selected that matches the user activity factor within a specified tolerance.

Auswahl in Abhängigkeit persönlicher Präferenzen Selection depending on personal preferences

Auswahl in Abhängigkeit gesellschaftlicher TrendsSelection depending on social trends

Aus dem persönlichen Popularitätsfaktor, dem allgemeinen Popularitätsfaktor wird eine Popularitätsgüte ,g‘ berechnet. Die gefilterte Menge wird hinsichtlich ihrer Popularitätsgüte sortiert. Eine Menge von Übergangsformen vom obersten Eintrag bis zu einem bestimmten untersten Eintrag wird ausgewählt. Die Größe der Menge steigt mit höherer Useraktivität.From the personal popularity factor, the general popularity factor, a popularity grade 'g' is calculated. The filtered amount is sorted in terms of popularity. A set of transitional forms from the top entry to a particular bottom entry is selected. The size of the crowd increases with higher user activity.

Auswahl in Abhängigkeit der VerwendungenSelection depending on the uses

Final wird die gefilterte Menge an Übergängen hinsichtlich der Anzahl der Verwendung während der aktuellen Benutzungseinheit sortiert und es wird zufällig einer der weniger gespielten Übergangsformen verwendet.Finally, the filtered amount of transitions are sorted in terms of the number of uses during the current usage unit, and one of the less-played transitional forms is randomly used.

Die situationsabhängige Anpassung der abstrakten ÜbergangsformThe situation-dependent adaptation of the abstract transitional form

Die ausgewählte Übergangsform wird an die reale Übergangssituation angepasst, sodass ein Audio Signal Processing Verfahren die beiden zu überblendenden Lieder entsprechend der Parameter einzeln modifizieren und ineinander mischen kann.The selected transitional shape is adapted to the real transient situation, so that an audio signal processing method can individually modify the two to be crossed songs according to the parameters and mix them together.

Die Übergangsdauer beschreibt die Länge zwischen Beginn der Einspielung des Liedes B, sowie Ende der Abspielung des Liedes A in Takten. Außerdem ist die Position des Klimaxoffsets k1 für das Lied A, sowie des Klimaxoffsets k2 für das Lied B innerhalb dieses Taktverlaufes gegeben. Die Einspielung des Liedes B beginnt ab dem Takt t2 innerhalb des Liedes B, welcher die Taktanzahl k2 von der linken Grenze von Segment y1 entfernt ist. Die Einspielung des Liedes B beginnt ab dem Takt t1 innerhalb des Liedes A, welcher die Taktanzahl k1 von der linken Grenze von Segment x1 entfernt ist. Die Modifikation von Lied B beginnt mit dem Einspielen und endet nach der Länge der Übergangsdauer. Daraufhin wird Lied B weitergespielt. Die Modifikation von Lied A beginnt ab dem Takt t1 und wird nach der Taktanzahl der Übergangsdauer beendet. An dieser Stelle wird Lied A gestoppt.The transition period describes the length between the beginning of the recording of the song B, as well as the end of the playback of the song A in bars. In addition, the position of the Klimaxoffsets k 1 for the song A, and the Klimaxoffsets k 2 for the song B is given within this cycle. The recording of the song B begins from the clock t 2 within the song B, which is the clock number k 2 from the left boundary of segment y1 away. The recording of the song B begins from the clock t 1 within the song A, which is the clock number k 1 from the left boundary of segment x1 away. The modification of song B begins with the import and ends after the length of the transition period. Then song B is played further. The modification of Song A starts from the clock t 1 and is terminated after the clock number of the transition period. At this point song A is stopped.

Die Funktion für die Parameter des abstrakten Übergangs muss nun angepasst werden. Die Wertemenge befindet sich zwischen 0 und 1 und repräsentiert die Effektivität des jeweiligen Algorithmus im Audio Signal Processing Verfahren. Die Funktionen der Parameter werden nun an die technischen Parameter der Lieder angepasst. Zum Beispiel wird die Funktion für die Lautstärkekurve hinsichtlich der durchschnittlichen RMS Pegel der Segmente angepasst. Die abstrakte Lautstärkekurve ist an einen bestimmten RMS Pegel für die einzelnen Segmente (x0, x1, y0, y1) referenziert. In Abhängigkeit der berechneten RMS Pegel der Segmente wird die Lautstärkefunktion angepasst. Ebenso verhält es sich mit der Funktion für die Effektivität der jeweiligen Bänder des EQs. Jedes EQ Band ist an eine RMS Pegel referenziert. In Abhängigkeit zu den RMS Pegeln der einzelnen Frequenzbänder der Segmente, wird die Funktion angepasst, um die RMS Pegel Unterschiede zu kompensieren. Bsp.: Ist die Differenz der realen RMS Pegel Unterschiede zwischen Segment x0 und y1 und der referenzierten RMS Pegel Unterschiede sehr hoch und der reale RMS Pegel Unterschied zwischen den beiden Segmenten x0 und y1 ist negativ, würde die Funktion wie folgt beeinflusst werden: Die Lautstärkeanhebung des Liedes B im Segments y1 würde schneller wachsen, um den hörbaren Lautstärkeeinbruch zu kompensieren. Die Kausalität zwischen der Veränderung der Funktionen der Parameter für verschiedene Effekte und den technischen Parametern der abstrakten Übergänge ist innerhalb der Software definiert.The function for the parameters of the abstract transition must now be adjusted. The value set is between 0 and 1 and represents the effectiveness of the respective algorithm in the audio signal processing method. The functions of the parameters are now adapted to the technical parameters of the songs. For example, the volume curve function is adjusted for the average RMS levels of the segments. The abstract volume curve is referenced to a particular RMS level for each segment (x0, x1, y0, y1). Depending on the calculated RMS level of the segments, the volume function is adjusted. The same applies to the function for the effectiveness of the respective bands of the EQ. Each EQ band is referenced to an RMS level. Depending on the RMS levels of the individual frequency bands of the segments, the function is adjusted to compensate for the RMS level differences. Ex .: If the difference of the real RMS level differences between segment x0 and y1 and the referenced RMS level differences is very high and the real RMS level difference between the two segments x0 and y1 is negative, the function would be influenced as follows: The volume increase of song B in segment y1 would grow faster to compensate for the audible drop in volume. The causality between changing the functions of the parameters for different effects and the technical parameters of the abstract transitions is defined within the software.

Übergang durchführenMake transition

Zunächst werden für das aktuelle spielende Lied und das direkt darauffolgende Lied die Daten der erweiterten Songanalyse geladen, falls diese nicht bereits auf dem Client geladen wurden. Sind diese nicht verfügbar werden die beiden Lieder einer erweiterten Songanalyse unterzogen. Die daraus resultierenden Daten werden in die Online Datenbank geladen. Im Anschluss werden für alle weiteren Lieder der Queue die Informationen aus der erweiterten Songanalyse aus der Online Datenbank geladen, falls diese nicht schon auf dem Client verfügbar sind. Daraufhin wird die Missionsplanung durchgeführt. Sind diese Daten der erweiterten Songanalyse nicht für jedes Lied in der Queue verfügbar wird die erweiterte Songanalyse asynchron zu der grundsätzlichen Songanalyse auf allen Liedern in der Queue durchgeführt. Da die erweiterte Songanalyse die Einträge des Genres der Lieder möglicherweise verändert, kann es zu einer erneuten Durchführung der Missionsplanung kommen nach dem eine bestimmte Anzahl an Liedern einer erweiterten Songanalyse unterzogen wurde.First, the advanced song analysis data is loaded for the current playing song and the song immediately after it, if they have not already been loaded on the client. If these are not available, the two songs undergo an extended song analysis. The resulting data is loaded into the online database. Following this, the information from the extended song analysis is loaded from the online database for all other songs of the queue, if they are not already available on the client. Then the mission planning is carried out. If these extended song analysis data are not available for each song in the queue, the advanced song analysis is performed asynchronously to the basic song analysis on all songs in the queue. Because advanced song analysis may change the entries in the genre of songs, it may re-run mission planning after a certain number of songs have undergone an extended song analysis.

Nach Durchführung der Missionsplanung wird der Prozess der Übergangskonstruktion auf alle direkt aufeinanderfolgenden Lieder durchgeführt, für welche bereits Informationen aus der erweiterten Songanalyse geladen sind. After performing mission planning, the transitional construction process is performed on all consecutive songs for which information from the extended song analysis is already loaded.

Es wird davon ausgegangen, dass Lied A aktuell abgespielt wird und aktuell im Audiobuffer liegt. Der Stream des Audiosignals von Lied B wird zunächst normalisiert. Im Anschluss wird das Audiosignals von Lied B hinsichtlich der Geschwindigkeit modifiziert, sodass Lied B ausgehend von der ursprünglichen Geschwindigkeit von B bis zum Beginn des Übergangszeitraums auf eine von der Missionsplanung geforderte Geschwindigkeit v1 angehoben wird. Lied A und Lied B werden innerhalb des Übergangszeitraumes hinsichtlich der Geschwindigkeit so angeglichen, das Lied A und Lied B während des Übergangszeitraums synchronisiert parallel laufen. Lied A und Lied B haben mit Beginn des Übergangszeitraumes die Geschwindigkeit v1 und nach dem Übergangszeitraum eine von der Missionsplanung geforderte Geschwindigkeit v2. Nach Beendigung des Übergangszeitraumes wird Lied B mit der Geschwindigkeit v2 fortgesetzt. Die verwendeten Effekte, welche in den Metainformationen der abstrakten Übergangsform vermerkt sind, werden mittels Audio Signal Processing auf die Lieder A und B angewendet. Die Funktionswerte der Funktionen eines entsprechenden Effektes werden mit einer definierten Samplingrate an die Algorithmen des Audio Signal Processing übergeben, welche die Audio Signale der Lieder in den Übergangszeiträumen jeweils einzeln modifizieren. Ein neues Audiosignal C wird aus der Mischung der modifizierten Liedes A und B erzeugt, an das der Rest des modifizierten Liedes B angehängt wird. In einem definierten Zeitabschnitt vor dem Beginn des Übergangszeitraumes in Lied A wird das Audiosignal C in den Audiobuffer an entsprechende Position geladen. An dieser Position ersetzt das Audiosignal C somit das Audiosignal von Lied A. Das Audiosignal von Lied A wird dennoch bis zu Beendigung des Überganges temporär gespeichert, falls der User den Übergang unterbricht.It is assumed that song A is currently playing and is currently in the audio buffer. The stream of the audio signal of song B is first normalized. Subsequently, the audio signal of song B is modified in speed so that song B is raised from the original speed of B to the beginning of the transitional period to a speed requested by mission planning v1. Song A and song B are made equal in speed during the transitional period so that song A and song B are synchronized in parallel during the transitional period. Song A and Song B have the velocity v1 at the beginning of the transitional period and a velocity v2 required by the mission planning after the transitional period. After the end of the transitional period, song B continues at speed v2. The used effects, which are noted in the meta information of the abstract transitional form, are applied to the songs A and B by means of audio signal processing. The function values of the functions of a corresponding effect are transferred with a defined sampling rate to the algorithms of the audio signal processing, which individually modify the audio signals of the songs during the transitional periods. A new audio signal C is generated from the mixture of the modified songs A and B, to which the rest of the modified song B is added. In a defined period of time before the start of the transitional period in song A, the audio signal C is loaded into the audio buffer at the corresponding position. At this position, the audio signal C thus replaces the audio signal of song A. The audio signal of song A is nevertheless temporarily stored until the transition is over, if the user interrupts the transition.

Der User hat die Möglichkeiten einen Übergang zu unterbrechen. In diesem Fall wird das ursprüngliche Audiosignal von Lied A in den Audiobuffer geladen. Dennoch wird das Lied A mit dem spätmöglichsten Übergang zu Lied B überblendet.The user has the possibilities to interrupt a transition. In this case, the original audio signal from song A is loaded into the audio buffer. Nevertheless, the song A is blended with the latest possible transition to song B.

Der User hat jederzeit die Möglichkeit einen Übergang anzufordern. Er kann zwischen zwei Arten wählen:

  • - Blitzübergang oder
  • - nächstmöglicher, sauberer Übergang.
The user has the possibility to request a transition at any time. He can choose between two types:
  • - Lightning transition or
  • - next possible, clean transition.

BlitzübergangLightning transition

Mit einem Blitzübergang ist ein Übergang gemeint, welcher universell für jedes Lied einsetzbar ist und einen zeitweise schnellen Wechsel zwischen zwei Liedern anfertigt, wobei eine niedrige Übergangsgüte bei dem Übergang akzeptiert wird. Beispiele sind folgende Effekte: Tape Stop, Delay, Filter, nicht-komplexer Lautstärke-Crossover. Dieser Übergang wird bei Anforderung mit dem nächsten Taktbeginn sofort ausgeführt.With a lightning transition is meant a transition, which is universally applicable to any song and makes a temporary quick change between two songs, with a low transition quality is accepted in the transition. Examples include the following effects: tape stop, delay, filter, non-complex volume crossover. This transition will be executed immediately upon request at the next clock start.

Nächstmöglicher, sauberer ÜbergangNext possible, clean transition

Mit dem nächstmöglichen, sauberen Übergang ist der nächste mögliche Übergangszeitpunkt gemeint, welcher ausschließlich nach inhaltlichen und semantischen Kriterien als geeignet gilt.By the next possible, clean transition is meant the next possible transitional time, which is considered suitable only according to content and semantic criteria.

Die vorliegende Erfindung betrifft außerdem eine Software zur automatischen Analyse der Useraktivität beim Benutzen eines Musikplayers, vorzüglich innerhalb eines Automobils. Die Useraktivität kann beispielsweise als Parameter in verschiedenen Phasen eines Musikplayers mit automatischer DJ Funktion verwendet werden. Die Beeinflussung der Funktionsweise der automatischen DJ Funktion anhand der Useraktivität, resultiert in einem erhöhten Musikerlebnis, da es an die situationsabhängigen Bedürfnisse des Users angepasst ist.The present invention also relates to software for automatically analyzing user activity when using a music player, preferably within an automobile. The user activity can be used, for example, as a parameter in different phases of a music player with automatic DJ function. Influencing the functioning of the automatic DJ function based on the user activity results in an increased musical experience, as it is adapted to the situation-dependent needs of the user.

Die hierbei beschriebene Erfindung bezieht sich besonders auf eine Implementierung im Automobil und der daraus hervorgehenden Vorteile.The invention described herein relates particularly to an implementation in the automobile and the advantages resulting therefrom.

Stand der TechnikState of the art

Aus dem Stand der Technik sind bisher keine Technologien bekannt, welche die Useraktivität beim Benutzen eines Musikplayers und der Fahrt in einem Automobil analysieren, um anhand der gewonnen Informationen die Funktionsweise eines Musikplayers mit automatischer DJ Funktion zu beeinflussen oder anderweitig das Musikerlebnis zu verbessern.From the state of the art, no technologies are known which analyze the user activity when using a music player and driving in an automobile to influence the operation of a music player with automatic DJ function based on the information obtained or otherwise improve the music experience.

Eine Queue stellt eine Liste von Liedern dar, in welcher die Abspielreihenfolge der Lieder festgelegt werden kann. A queue represents a list of songs in which the playing order of the songs can be determined.

Diese Software geht von einer Implementierung innerhalb eines Musikplayers aus, welcher folgende Funktionalität besitzt:

  • - das Hinzufügen und Löschen von Liedern in einer Queue,
  • - die Abspielreihenfolge der Queue verändern,
  • - das Vor- und Zurückspulens innerhalb von Liedern,
  • - den Wechseln zum in der Queue nächsten Lied oder einem beliebigen Lied und
  • - das Pausieren und erneute Abspielen eines Liedes.
This software is based on an implementation within a music player that has the following functionality:
  • - adding and deleting songs in a queue,
  • - change the playing order of the queue,
  • - fast forwarding and rewinding within songs,
  • - the change to the next song in the queue or any song and
  • - pausing and playing a song again.

Auch wenn es für die hier beschriebene Software nicht notwendig ist, wird hier die Implementierung der Software innerhalb eines Musikplayers beschrieben, welcher eine automatische DJ Funktion bietet. Ohne diese Funktionalität würde lediglich die Funktionalität der hier beschriebenen Erfindung eingeschränkt sein.Although it is not necessary for the software described here, it describes the implementation of the software within a music player which provides an automatic DJ function. Without this functionality, only the functionality of the invention described herein would be limited.

Ein solcher Musikplayer mit automatischer DJ Funktion wird im Folgenden als automatische DJ Software bezeichnet.Such a music player with automatic DJ function is hereinafter referred to as automatic DJ software.

Die automatische DJ Software bietet dem User außerdem folgende manuelle Eingriffe:

  • - Unterbrechen des automatisch eingeleiteten Überganges durch die Software,
  • - manuelles Einleiten eines automatischen Überganges zwischen dem aktuellen Lied und dem Folgelied in der gegebenen Abspielreihenfolge,
  • - manuelles Einleiten eines Blitzübergangs zwischen dem aktuellen Lied und dem Folgelied in der gegebenen Abspielreihenfolge und
  • - die Möglichkeit den Mix Modus zu verändern.
The automatic DJ software also offers the user the following manual intervention:
  • - interrupting the automatically initiated transition by the software,
  • manually initiating an automatic transition between the current song and the following song in the given play order,
  • - Manual initiation of a flash transition between the current song and the following song in the given play order and
  • - the possibility to change the mix mode.

Die vorliegende Erfindung berechnet mithilfe folgender Parameter:

  • - Benutzungsverhalten des Musikplayers,
  • - Fahrverhalten des Users und
  • - umweltbedingter Kontext
automatisch einen Useraktivitätsfaktor.The present invention calculates using the following parameters:
  • - usage behavior of the music player,
  • - Driving behavior of the user and
  • - environmental context
automatically a user activity factor.

Die berechnete Useraktivität kann beispielsweise die folgenden Funktionalitäten der automatischen DJ Software beeinflussen:

  • - die Auswahl einer Menge an Liedern (nicht in der automatischen DJ Software beschrieben),
  • - die Reihenfolge einer gegebenen Menge an Liedern,
  • - die Wahl eines Übergangszeitpunktes und
  • - die Wahl einer abstrakten Übergangsform.
For example, the calculated user activity may affect the following features of the automatic DJ software:
  • - the selection of a lot of songs (not described in the automatic DJ software),
  • the order of a given amount of songs,
  • - the choice of a transitional period and
  • - the choice of an abstract transitional form.

Die Software benutzt die Informationen über die Segmentstruktur der Lieder aus einer Songsegmentierung, als integrierte Technologie der automatischen DJ Software für einige im Folgenden beschriebenen Analyseschritte. Eine Songsegmentierung gilt somit für diese Erfindung als vorausgesetzt.The software uses information about the segment structure of the songs from a song segmentation as an integrated technology of the automatic DJ software for some of the analysis steps described below. Song segmentation is therefore considered as presupposed for this invention.

Ausführung der Erfindung:Embodiment of the invention:

Die im Folgenden beschriebenen Analyseverfahren können zur Beeinflussung verschiedener Funktionalitäten einer automatischen DJ Software verwendet werden. Ziel ist es, die Funktionalitäten der automatischen DJ Software für die Bedürfnisse des Users dynamisch anzupassen.The analysis methods described below can be used to affect various functionalities of an automatic DJ software. The aim is to dynamically adapt the functionalities of the automatic DJ software to the needs of the user.

Eine hohe Useraktivität beispielsweise führt zu einer als aufregend empfundenen Funktionsweise der automatischen DJ Software. Dies kann die Funktionsweise der automatischen DJ Software unter anderem wie folgt beeinflussen:

  • - häufigerer Wechsel zwischen Liedern verschiedener Genreklassen innerhalb eines Zeitraums,
  • - ausgehende Übergänge zu früheren Zeitpunkten im Lied,
  • - eingehende Übergänge zu späteren Zeitpunkten im Lied und
  • - Häufigeres Auftreten von als aufregend empfundenen Übergängen.
A high level of user activity, for example, leads to an exciting functioning of the automatic DJ software. This may affect the operation of the automatic DJ software, among others, as follows:
  • - more frequent changes between songs of different genre classes within one period,
  • outgoing transitions to earlier times in the song,
  • - detailed transitions to later times in the song and
  • - More frequent occurrences of transitions that are perceived as exciting.

Mit „Useraktivität“ ist folgendes gemeint:By "user activity" is meant the following:

Die berechnete Stimmung eines Users, welche sich zwischen den beiden Polen, aktiv und wenig aktiv, bewegt. Die Stimmung eines Users könnte in noch genauere Stimmungen zerteilt werden. Beispielhafte Stimmungen sind auf dem Circumplex of Model Affect dargestellt. Da diese genauere Klassifizierung der Stimmung für die meisten Phasen der automatischen DJ Software nicht notwendig ist, wird hier lediglich das Verhältnis zwischen den Polen aktiv und wenig aktiv bestimmt. Somit wird auf dem Circumplex of Model Affect lediglich die vertikale Achse der Aktivität verwendet.The calculated mood of a user who moves between the two poles, active and less active. The mood of a user could be divided into even more precise moods. Exemplary moods are shown on the Circumplex of Model Affect. Since this more accurate classification of the tuning is not necessary for most phases of the automatic DJ software, here only the relationship between the poles is determined active and less active. Thus, only the vertical axis of the activity is used on the Circumplex of Model Affect.

Der Useraktivität stellt eine reelle Zahl zwischen 0 und 1 dar.The user activity represents a real number between 0 and 1.

Die aktuelle Useraktivität wird während einer Benutzungseinheit in einer definierten Samplingrate berechnet und bei der nächsten Benutzungseinheit zurückgesetzt und initial neu berechnet.The current user activity is calculated during a use unit in a defined sampling rate and reset at the next use unit and initially recalculated.

In die Berechnung der Useraktivität fließen Veränderungen der Einflussgrößen ein. Die Funktionsweise der automatischen DJ Software ändert sich somit während einer Benutzungseinheit dynamisch, um optimal auf die Bedürfnisse des Users eingestellt zu sein.The calculation of user activity includes changes in the influencing factors. The operation of the automatic DJ software thus changes dynamically during a use unit to be optimally adapted to the needs of the user.

Für jeden User der Software wird auf dem Client ein eigenes Profil erstellt. Für das verwendete Profil, werden für jede Benutzungseinheit alle Informationen, welche den Wert der Useraktivität beeinflussen, in der Samplingrate gespeichert. Außerdem werden aus dem Nutzerprofil alle Informationen geladen, welche in vergangenen Benutzungseinheiten die Useraktivitätsbestimmung beeinflusst haben.For each user of the software, a separate profile is created on the client. For the profile used, for each usage unit, all information that influences the value of the user activity is stored in the sampling rate. In addition, all information which has influenced the user activity determination in past usage units is loaded from the user profile.

Alle Parameter werden in Relation mit dem Mittelwert bisher gespeicherter Informationen des jeweiligen User Profils gestellt. Jeder Parameter wird mit dem Mittelwert aus allen vergangenen Benutzungseinheiten verglichen und der erhöhende beziehungsweise reduzierende Faktor errechnet sich aus der Differenz des Mittelwerts und den aktuellen Werten der Einflussgrößen.All parameters are related to the average of previously stored information of the respective user profile. Each parameter is compared with the mean value from all previous units of use and the increasing or reducing factor is calculated from the difference between the mean value and the current values of the influencing variables.

Beispiel: Weist ein User eine hohe Aktivität hinsichtlich seinem Verhalten Übergänge manuell herbeizuführen auf, da er zum Beispiel 25 von 50 Übergängen in dieser Benutzungseinheit zwischen Liedern manuell herbeigeführt hat, kann dies als hohe Useraktivität in der aktuellen Benutzungseinheit interpretiert werden, wenn der User im Schnitt pro Benutzungseinheit in der Vergangenheit lediglich 2 von 50 Übergängen zwischen Liedern manuell herbeigeführt hat. Genauso würde ein aggressives Beschleunigungsverhalten des Fahrzeuges durch den User erst dann die Useraktivität erhöhend beeinflussen, wenn der Mittelwert des Beschleunigungsverhaltens vergangener Benutzungseinheiten geringer ist.For example, if a user has a high activity regarding his behavior of manually creating transitions, as he has, for example, manually created 25 of 50 transitions between songs in that usage unit, this can be interpreted as high user activity in the current usage unit, if the user is on average per user unit in the past has only caused 2 out of 50 transitions between songs manually. Likewise, an aggressive acceleration behavior of the vehicle by the user would only increase the user activity if the mean value of the acceleration behavior of past usage units is lower.

Die neuen Informationen der Einflussgrößen werden, wie bereits beschrieben, abgespeichert und beeinflussen somit in der nächsten Benutzungseinheit den Mittelwert.The new information of the influencing variables are stored, as already described, and thus influence the mean value in the next use unit.

Mit einer hohen aktuellen Useraktivität ist im Folgenden somit indirekt beschrieben, dass die aktuelle Useraktivität mit dem Mittelwert der gemessenen Useraktivität in vergangenen Benutzungseinheiten relativ gesehen hoch ist.With a high current user activity, it is thus indirectly described below that the current user activity is relatively high with the mean value of the measured user activity in past usage units.

Im Folgenden werden Useraktivität und Useraktivitätsfaktor synonym verwendet.In the following, user activity and user activity factor are used synonymously.

Der manuell konfigurierbare Mix Modus, stellt eine graphische Oberfläche dar, in welcher sich der gewünschte Stil der automatischen DJ Software manuell einstellen lässt. Hierbei wird eine Ratioskala verwendet. Der berechnete Useraktivitätsfaktor ist in dieser Ratioskala abgebildet. Der eine Pol steht für eine minimale Useraktivität der andere Pol steht für eine maximale Useraktivität. Dadurch steht der eine Pol für eine Einstellung der Funktionsweise der DJ Software, welche optimal für eine niedrige Aktivität des Users ist. Der andere Pol repräsentiert eine Einstellung der Funktionsweise der DJ Software, welche optimal für eine hohe Aktivität des Users ist. Der aus der Ratioskala entnommene Wert stellt somit den Parameter zur Beeinflussung der automatischen DJ Software dar.The manually configurable Mix mode, provides a graphical interface in which the desired style of the automatic DJ software can be set manually. Here a Ratioskala is used. The calculated user activity factor is shown in this Ratioscale. One pole stands for a minimal user activity, the other pole stands for a maximum user activity. Thus, the one pole stands for a setting of the functioning of the DJ software, which is optimal for a low activity of the user. The other Pol represents a setting of how the DJ software works, which is optimal for high user activity. The value taken from the ratio scale thus represents the parameter for influencing the automatic DJ software.

Der berechnete Useraktivitätsfaktor kann vom User innerhalb dieser graphischen Oberfläche manuell verändert werden. Dieser Useraktivitätsfaktor wird über die gesamte Benutzungseinheit beibehalten. Bei der nächsten Benutzungseinheit der Software wird der manuell eingestellte Wert wieder zurückgesetzt und der Useraktivitätsfaktor wird von der Software wieder automatisch bestimmt und dynamisch angepasst. Aufgrund der Beeinflussung der Funktionsweise der automatischen DJ Software könnte man die Pole als „Party“ und „Lounge“ Modus bezeichnen. Der „Party“ Modus führt zu einem aufregenden, sehr dynamischen Musikerlebnis, der „Lounge“ Modus zu einem entspannten, gleichmäßigen Musikerlebnis. Entsprechend sind Mischungen zwischen den beiden Polen möglich.The calculated user activity factor can be changed manually by the user within this graphical interface. This user activity factor is maintained throughout the usage unit. The next time the software is used, the manually set value is reset and the user activity factor is automatically re-determined and dynamically adjusted by the software. Due to the way the automatic DJ software works, the poles could be called "party" and "lounge" modes. The "Party" mode leads to an exciting, very dynamic music experience, the "Lounge" mode to a relaxed, even music experience. Accordingly, mixtures between the two poles are possible.

Benutzungsverhalten des MusikplayersUsage behavior of the music player

Das Benutzungsverhalten des Musikplayers beeinflusst den Useraktivitätsfaktor und berechnet sich aus den folgenden Komponenten:

  • - die Aktivität der Modifikation der Queue,
  • - die Art der Auswahl der Lieder,
  • - das manuelle Spulverhalten innerhalb eines Liedes,
  • - die Quantität der manuellen Wechsel des aktuell spielenden Liedes zu einem beliebigen Lied,
  • - die Quantität des manuellen Anforderns eines Übergangs zu dem Folgelied,
  • - der Zeitpunkt des manuellen Anforderns eines Übergangs zum Folgelied und
  • - die Quantität des manuellen Unterbrechens eines Übergangs zu dem Folgelied.
The usage behavior of the music player influences the user activity factor and is calculated from the following components:
  • the activity of the modification of the queue,
  • - the way of choosing songs,
  • - the manual winding behavior within a song,
  • the quantity of manual changes of the currently playing song to any song,
  • the quantity of manually requesting a transition to the following song,
  • the time of manually requesting a transition to the follower song and
  • the quantity of manually interrupting a transition to the following song.

Die Aktivität der Modifikation der Queue.The activity of the modification of the queue.

Wenn die Queue der abzuspielenden Titel oft modifiziert wird, lässt das darauf schließen, dass der User ein hohes Interesse an einem optimalen Musikerlebnis hat. Diese besondere Aktivität des Users fließt als positiver Faktor zur Berechnung der Aktivität des Users ein.If the queue of titles to be played is often modified, this suggests that the user has a high interest in an optimal music experience. This particular activity of the user is used as a positive factor to calculate the activity of the user.

Mit dem Modifizieren der Queue ist das manuelle Hinzufügen oder Löschen eines Titels in der Queue oder das manuelle Verändern der Abspielreihenfolge gemeint.Modifying the queue means manually adding or deleting a title in the queue or manually changing the play order.

Im Folgenden werden Lieder, dessen Abspielreihenfolge in der Queue verändert wurde, oder welche zur Queue manuell vom User hinzugefügt wurden, mit folgendem Term beschrieben: „Lieder, welche hinsichtlich der Queue verändert wurden.“In the following, songs whose play order has been changed in the queue or which have been manually added to the queue by the user are described with the following term: "Songs which have been changed with regard to the queue."

Gelöschte Lieder werden hierbei nicht berücksichtigt. Lieder, welche zur Queue automatisch hinzugefügt wurden und nicht vom User manuell in ihrer Reihenfolge verschoben oder in die Queue hinzugefügt wurden, werden ebenfalls nicht berücksichtigt.Deleted songs are not considered here. Songs added automatically to the queue and not manually moved in order or added to the queue by the user are also disregarded.

Die Art der Auswahl der Lieder.The type of selection of songs.

Die grundsätzlichen Parameter: Geschwindigkeit und Genre der Lieder in der Queue werden betrachtet. Wichtig hierbei ist, dass lediglich die Varianz in Geschwindigkeit und Genre zwischen den Liedern, welche hinsichtlich der Queue verändert wurden, berücksichtigt wird. Zusätzlich wird die Anzahl der Lieblingslieder, innerhalb der Lieder, welche hinsichtlich der Queue verändert wurden, berücksichtigt.The basic parameters: speed and genre of songs in the queue are considered. It is important that only the variance in speed and genre between the songs, which were changed with regard to the queue, is considered. In addition, the number of favorite songs, within the songs, which have been changed with respect to the queue, is taken into account.

Wenn eine hohe Varianz zwischen den Genreklassen und Geschwindigkeiten der Gesamtheit an Liedern welche hinsichtlich der Queue verändert werden vorhanden ist, fließt dies als erhöhender Faktor in die Useraktivität ein. Werden somit in der Queue häufig Lieder mit weitentfernten Genreklassen, und Geschwindigkeitsklassen hinsichtlich der Queue verändert, fließt dies als erhöhender Faktor in die Useraktivität ein.When there is a high variance between the genre classes and velocities of songs that are changed in queue, this is incorporated into the user activity as an increasing factor. Thus, if in the queue often songs with distant genre classes, and speed classes changed with respect to the queue, this flows as an increasing factor in the user activity.

Der Abstand, welcher zur Varianzmessung verwendet wird, wird aus den dargestellten Entfernungen zwischen Genreklassen und Geschwindigkeitsklassen berechnet.The distance used to measure variance is calculated from the distances shown between genre classes and velocity classes.

Wenn eine hohe Varianz zwischen den Genres und Geschwindigkeiten zweier direkt aufeinanderfolgender Lieder, welche hinsichtlich der Queue verändert wurden, vorhanden ist, lässt dies ebenfalls auf eine hohe Aktivität des Users schließen. Verändert der User somit manuell die Queue, sodass oft ein schnelles Lied im Anschluss ein langsames Lied und sogar darauffolgend wieder ein schnelles Lied folgt, fließt dies als erhöhender Faktor in die Useraktivität mit ein. If there is a high variance between the genres and velocities of two directly consecutive songs that have been changed with respect to the queue, this also indicates high user activity. If the user thus manually changes the queue, so that often a fast song is followed by a slow song and even a fast song afterwards, this is included as an increasing factor in the user activity.

Das manuelle Spulverhalten innerhalb eines LiedesThe manual winding behavior within a song

Mit dem Spulverhalten innerhalb eines Liedes ist gemeint, dass der User, während ein Lied gespielt wird, im Lied zurückspult oder vorspult. Dies wird damit begründet, dass dem User der Teil des Liedes besonders gefällt beziehungsweise nicht gefällt, welcher aktuell gespielt wird, und dass der User ein hohes Interesse an seinem Musikerlebnis hat und daher aktiv eingreift. Daher fließt ein solches Verhalten auch als erhöhender Faktor in die Useraktivität ein.Spooling behavior within a song means that the user, while a song is being played, rewinds or rewinds in the song. This is justified by the fact that the user particularly likes the part of the song or does not like it, which is currently being played, and that the user has a high interest in his music experience and therefore actively intervenes. Therefore, such behavior also flows into the user activity as an increasing factor.

Die Quantität der manuellen Wechsel des aktuell spielenden Liedes zu einem beliebigen Lied Eine hohe Quantität von manuellen Wechseln des aktuell abgespielten Liedes zu einem beliebigen Lied fließt als erhöhender Faktor in die Useraktivität ein.The quantity of manual changes of the currently playing song to any song A high quantity of manual changes of the currently playing song to any song flows into the user activity as an increasing factor.

Die Quantität des manuellen Anforderns eines Übergangs zu dem FolgeliedThe quantity of manually requesting a transition to the follower song

Eine hohe Quantität von manuellen angeforderten Übergängen zwischen dem aktuell abgespielten Lied zu dem Folgelied fließt als erhöhender Faktor in die Useraktivität ein.A high quantity of manually requested transitions between the currently playing song and the subsequent song flows into the user activity as an increasing factor.

Der Zeitpunkt des manuellen Anforderns eines Übergangs zum Folgelied.The time of manually requesting a transition to the follower song.

Der Zeitpunkt, des manuellen Anforderns eines automatischen Übergangs zu einem Folgelied spielt folgende Rolle:

  • Das Anfordern eines Übergangs zu früheren Zeitpunkten im Lied als von der automatischen DJ Software vorgeschlagen, erhöht die Useraktivität.
  • Das Anfordern eines Übergangs zu späteren Zeitpunkten im Lied als von der automatischen DJ Software vorgeschlagen, reduziert die Useraktivität.
The timing of manually requesting an automatic transition to a follow-up song plays the following role:
  • Requesting a transition to earlier times in the song as suggested by the automatic DJ software increases user activity.
  • Requesting a transition to later times in the song as suggested by the automatic DJ software reduces user activity.

Die Quantität des manuellen Unterbrechens eines Übergangs zu dem Folgelied Analog zu dem manuellen Anfordern eines Übergangs, kann außerdem die Quantität des manuellen Unterbrechens eines von der automatischen DJ Software ausgeführten Überganges betrachtet werden. Das häufige Unterbrechen von Übergängen deutet daraufhin, dass der User die hohe Aktivität der automatischen DJ Software als zu aktiv erachtet. Dies fließt als reduzierender Faktor in die Useraktivität ein.The Quantity of Manually Pausing a Transition to the Folder Song Analogously to manually requesting a transition, the quantity of manually pausing a transition executed by the automatic DJ software may also be considered. The frequent interruption of transients indicates that the user considers the high activity of the automatic DJ software to be too active. This flows into the user activity as a reducing factor.

Fahrverhalten des UsersDriving behavior of the user

Im Folgenden wird auf die Kausalität zwischen Fahrverhalten und Useraktivität eingegangen, falls die Software innerhalb eines Fahrzeuges implementiert wird. Hierfür ist der Zugriff auf das Bremsverhalten, Beschleunigungsverhalten, Lenkeinschlag und die Geschwindigkeit des entsprechenden Fahrzeuges essentiell. Die Existenz eines Systems zur Bestimmung der erlaubten Höchstgeschwindigkeit in der aktuellen Fahrsituation kann die Analysefunktionalität verbessern, ist aber nicht essentiell.The following section deals with the causality between driving behavior and user activity, if the software is implemented within a vehicle. For this purpose, access to the braking behavior, acceleration behavior, steering angle and the speed of the corresponding vehicle is essential. The existence of a system for determining the maximum permitted speed in the current driving situation can improve the analysis functionality, but is not essential.

Die Analyse des Fahrverhaltens beläuft sich zunächst auf folgende Einflussgrößen, ist aber erweiterbar:

  • - Dynamik im Bremsverhalten,
  • - Dynamik im Beschleunigungsverhalten,
  • - Dynamik in der Querführung des Fahrzeuges und
  • - Geschwindigkeit des Fahrzeuges in Vergleich mit fahrsituationsabhängiger, erlaubter Höchstgeschwindigkeit.
The analysis of the driving behavior initially amounts to the following factors, but is expandable:
  • - dynamics in braking behavior,
  • - dynamics in the acceleration behavior,
  • - Dynamics in the transverse guidance of the vehicle and
  • - Speed of the vehicle in comparison with driving situation-dependent, permitted maximum speed.

Es wird lediglich zwischen den Charakteristiken sportliches und ruhiges Fahrverhalten unterschieden, wobei jegliche Abstufung zwischen beiden Polen möglich ist. Sportliches Verhalten resultiert aus einem aggressivem Bremsverhalten, einem aggressiven Beschleunigungsverhalten, sowie einem starken Lenkeinschlag bei hohen Fahrzeuggeschwindigkeiten. Eine Geschwindigkeitsüberschreitung der erlaubten Höchstgeschwindigkeit erhöht ebenfalls nicht linear die Tendenz zu einem sportlichen Fahrverhalten. Sportliches Fahrverhalten beeinflusst die Useraktivität als erhöhender Faktor. Ruhiges Fahrverhalten beeinflusst die Useraktivität als reduzierender Faktor.It is only distinguished between the characteristics of sporty and quiet driving, with any gradation between the two poles is possible. Sporty behavior results from an aggressive braking behavior, an aggressive acceleration behavior, as well as a strong steering angle at high vehicle speeds. A speed over allowed Top speed also does not increase linear the tendency to a sporty driving behavior. Sporty driving behavior influences the user activity as an increasing factor. Quiet driving affects user activity as a reducing factor.

Umweltbedingter KontextEnvironmental Context

Mit der kontextfreien Useraktivität ist im Folgenden die berechnete Useraktivität vor Einfluss umweltbedingter Faktoren gemeint.The context-free user activity in the following refers to the calculated user activity before the influence of environmental factors.

Mit der kontextbezogenen Useraktivität ist im Folgenden die berechnete Useraktivität nach Einfluss umweltbedingter Faktoren gemeint.The context-related user activity in the following refers to the calculated user activity after the influence of environmental factors.

Mit dem umweltbedingten Kontext sind externe Parameter, bezüglich Wetter, Fahrsituation und Tageszeit gemeint.The environmental context refers to external parameters related to weather, driving situation and time of day.

Die Wettersituation kann über einen externen Dienst mithilfe der GPS Position des Endgeräts ermittelt werden. Hier wird zwischen einfachen Wettersituationen, welche die Stimmung des Users stark beeinflussen, unterschieden z.B. Regen, Nebel, Hagel, Sonne, Bewölkt.The weather situation can be determined via an external service using the GPS position of the terminal. Here, a distinction is made between simple weather situations which strongly influence the mood of the user, e.g. Rain, Mist, Hail, Sun, Cloudy.

Die Fahrsituation kann über das Kartensystem des Autos oder mithilfe der GPS Position des Endgeräts über ein externes Kartensystem ermittelt werden. Der Straßentyp ist hierbei relevant. Es wird unterschieden zwischen: Stadtstraßen, Landstraßen und Autobahn. In einer Implementierung außerhalb des Autos sind noch weitere Klassifizierungen denkbar.The driving situation can be determined via the car's map system or via the terminal's GPS position via an external map system. The road type is relevant here. There is a distinction between: city streets, highways and highway. In an implementation outside the car, further classifications are conceivable.

Die Tageszeit wird mithilfe der Uhrzeit ermittelt. Hierbei kann ganz einfach zwischen morgens, vormittags, nachmittags, abends und nachts unterschieden werden. Es ist auch möglich die Tageszeitengrenzen an die persönlichen Gewohnheiten manuell vom User anzupassen oder diese mittels externer Software automatisch zu erfassen.The time of day is determined by the time of day. Here it is easy to distinguish between morning, morning, afternoon, evening and night. It is also possible to adjust the time limits of the day to the personal habits manually by the user or to capture them automatically using external software.

In dem Userprofil wird für jeden Kontext die Useraktivität gespeichert.In the user profile, the user activity is stored for each context.

Befindet sich der User wieder in einer Situation mit entsprechendem Kontext, wird die durchschnittliche Useraktivität für diesen Kontext aus vergangenen Benutzungseinheiten geladen und wird mit der zurzeit bestimmten kontextfreien Useraktivität in Relation gestellt. Die kontextbezogene Useraktivität, enthält das Produkt aus der kontextfreien Useraktivität und einem Faktor f. Wenn die durchschnittliche Useraktivität für diesen Kontext aus vergangenen Benutzungseinheiten die aktuelle kontextfreie Useraktivität übertrifft, ist der Faktor f > 1. Wenn die durchschnittliche Useraktivität für diesen Kontext aus vergangenen Benutzungseinheiten die zurzeit aktuelle kontextfreie Useraktivität unterschreitet, ist der Faktor 0 < f < 1.If the user is again in a situation with a corresponding context, the average user activity for this context is loaded from past usage units and is related to the currently determined context-free user activity. The contextual user activity contains the product of the context-free user activity and a factor f. If the average user activity for this context from past usage units exceeds the current context-free user activity, the factor f> 1. If the average user activity for this context from past usage units falls short of the current context-free user activity, the factor 0 <f <1.

Zusätzlich wird die Information über die allgemeine Useraktivität für diesen Kontext von dem Backend bezogen und nimmt zusätzlich erhöhenden beziehungsweise reduzierenden Einfluss auf die kontextbezogene Useraktivität, falls die allgemeine Useraktivität für diesen Kontext höher beziehungsweise niedriger ist, als die aktuelle kontextfreie Useraktivität.In addition, the general user activity information for this context is referred to by the backend and additionally adds or reduces the contextual user activity if the general user activity for that context is higher or lower than the current contextless user activity.

Die kontextfreie Useraktivität wird für den aktuellen Kontext für diese Benutzungseinheit gespeichert. Die durchschnittliche Useraktivität für diesen Kontext aus vergangenen Benutzungseinheiten wird zwar zur Beeinflussung des Wertes der aktuellen kontextbezogenen Useraktivität verwendet, allerdings wird nicht die kontextbezogene Useraktivität abgespeichert, um Rückkopplungen zu vermeiden.Context-free user activity is stored for the current context for this usage unit. Although the average user activity for this context from past usage units is used to influence the value of the current contextual user activity, it does not store the contextual user activity to avoid feedback.

Beispiel: Befindet sich der User in einer Situation mit Regen, am Abend und fährt auf einer Landstraße wird die durchschnittliche Useraktivität vergangener Benutzungseinheiten für diesen Kontext geladen. Ist diese höher als die aktuelle kontextfreie Useraktivität, wird der Wert der kontextbezogenen Useraktivität künstlich erhöht.For example, if the user is in a rainy evening, driving in the evening and driving on a country road, the average user activity of past usage units for that context is loaded. If this is higher than the current context-free user activity, the value of the context-related user activity is artificially increased.

Es wird aber nur die aktuelle kontextfreie Useraktivität für diese Benutzungseinheit mit abgespeichert.However, only the current context-free user activity for this usage unit is saved.

Die Useraktivität, welche final die Funktionalitäten der Clientsysteme der automatischen DJ Software beeinflusst, ist die kontextbezogene Useraktivität.The user activity that ultimately affects the functionality of the client systems of the automatic DJ software is the contextual user activity.

Bezugszeichenliste LIST OF REFERENCE NUMBERS

11
Lautsprecherspeaker
22
elektronisches Steuergerätelectronic control unit
33
Touchscreentouchscreen
55
Datenspeicherdata storage
6a, 6b, 6c6a, 6b, 6c
Audio-DateiAudio file
77
Headerheader
88th
Audio-MaterialAudio material
99
Audiosignalaudio signal
1010
Pkwcar
1111
Übergangcrossing
1212
IntroIntro
1313
Stropheverse
1414
Refrain/ChorusChorus / Chorus
1515
OutroOutro
1616
Client-SystemClient system
1717
Backend-SystemBackend system
1818
Client-SystemeClient Systems
1919
Benutzungsverhaltenusing behavior
2020
SmartphoneSmartphone
2121
Fahrverhaltendriving behavior
2222
umweltbedingter Kontextenvironmental context
2323
persönliche Präferenzenpersonal preferences
2424
persönliches Regelwerkpersonal rules
2525
allgemeine Präferenzengeneral preferences
2626
allgemeines Regelwerkgeneral rules
2727
Anwenderuser
2828
Reihungranking
2929
Missionsplanungmission planning
3030
Audiogrammaudiogram
3131
ÜbergangszeitpunkteTransition times
32, 3332, 33
Audiogrammeaudiograms
3434
ÜbergangskonstruktionThe transition structure
3535
Kreiscircle
3636
ÜbergangsdurchführungTransitional implementing
3737
erweiterte Songanalyseadvanced song analysis
3838
grundsätzliche Songanalysebasic song analysis
3939
erweiterte Songanalyseadvanced song analysis
4040
Metainformationenmeta
4141
Güteberechnunggrade calculation
4242
Clusterungclustering
4343
erstes Clusterfirst cluster
4444
ClusterreihenfolgeClustering order
4545
interne Reihenfolgeinternal order
4646
Queuequeue
4747
manuelle Modifikation der Queuemanual modification of the queue
4848
Änderung der AnwenderaktivitätChange of user activity
4949
Makrosegmentierungmacro segmentation
5050
Mikrosegmentierungmicrosegmentation
5151
Genre-KlassifikationGenre classification
5252
Chorus-SegmenteChorus segments
5353
semantische Makrosegmentierungsemantic macrosegmentation
5454
ÜbergangsfaktorenTransfer factors
5555
Reglerregulator
5656
manuelle Einstellungmanual adjustment
5757
Bildschirmdarstellung AnwenderschnittstelleScreen display user interface
58, 5958, 59
Segmentierte Audiogramme mit SegmentbezeichnungenSegmented audiograms with segment names
6060
Übergangszeitpunkte unter Einfluss der AnwenderaktivitätTransition times under the influence of user activity
6161
Übergangszeitpunkte unter Einfluss des persönlichen RegelwerksTransition times under the influence of personal rules
6262
Finaler Übergangszeitpunkt unter Einfluss technischer ParameterFinal transitional time under the influence of technical parameters

Claims (14)

Verfahren zur Gestaltung eines Übergangs (11) bei einer Audio-Wiedergabe (9) von einer ersten Audiodatei (6a) zu einer zweiten Audiodatei (6b) umfassend die Schritte: - automatisches Untersuchen (100) der Audiodateien (6a, 6b) hinsichtlich eines jeweils enthaltenen Audio-Materials (8) und/oder - automatisches Untersuchen (300) eines Fahrzeugzustandes und - Gestalten (400) des Übergangs (11) in Abhängigkeit eines Ergebnisses des Untersuchens.A method of designing a transition (11) in an audio reproduction (9) from a first audio file (6a) to a second audio file (6b), comprising the steps of: - Automatic examination (100) of the audio files (6a, 6b) with respect to an audio material contained in each case (8) and / or - Automatic examination (300) of a vehicle condition and - shapes (400) the transition (11) as a function of a result of the examination. Verfahren nach Anspruch 1, wobei das Gestalten des Übergangs (11) - eine zeitliche Zuordnung zwischen einer Wiedergabe der ersten Audiodatei (6a) und der zweiten Audiodatei (6b) und/oder - eine wiedergabelautstärkebezogene Aktion und/oder - ein Zurückstellen einer Wiedergabe der zweiten Audiodatei (6b) und/oder - eine weitere signalverändernde Maßnahme, insbesondere ein Audioeffekt, definiert.Method according to Claim 1 wherein the shaping of the transition (11) - a temporal association between a reproduction of the first audio file (6a) and the second audio file (6b) and / or - a reproduction volume related action and / or - a resetting of a reproduction of the second audio file (6b) and / or - another signal-changing measure, in particular an audio effect defined. Verfahren nach Anspruch 1 oder 2, wobei das Untersuchen der Audiodateien (6a, 6b) eine Segmentierung umfasst.Method according to Claim 1 or 2 wherein examining the audio files (6a, 6b) comprises segmentation. Verfahren nach Anspruch 3, wobei das Untersuchen der Audiodateien (6a, 6b) eine Kategorisierung der Segmente (12, 13, 14, 15) umfasst.Method according to Claim 3 wherein examining the audio files (6a, 6b) comprises categorizing the segments (12, 13, 14, 15). Verfahren nach einem der vorstehenden Ansprüche, wobei das Gestalten des Übergangs (11) eine Auswahl eines ersten Segmentes (14) innerhalb des Audio-Materials (8) der ersten Audiodatei (6a) und eines korrespondierenden zweiten Segmentes (14) innerhalb des Audio-Materials (8) der zweiten Audiodatei (6b) umfasst. The method of any preceding claim, wherein designing the transition (11) comprises selecting a first segment (14) within the audio material (8) of the first audio file (6a) and a corresponding second segment (14) within the audio material (8) of the second audio file (6b). Verfahren nach einem der vorstehenden Ansprüche, wobei als Fahrzeugzustand oder zusätzlich zum Fahrzeugzustand - eine Fahrsituation und/oder - eine Fahrzeugsituation und/oder - eine Bediensituation eines Fortbewegungsmittels (10) bei der Gestaltung des Übergangs (11) berücksichtigt wird.Method according to one of the preceding claims, wherein as a vehicle condition or in addition to the vehicle condition a driving situation and / or a vehicle situation and / or - An operating situation of a means of transport (10) in the design of the transition (11) is taken into account. Verfahren nach einem der vorstehenden Ansprüche weiter umfassend: - Ermitteln (500) eines Musikwiedergabeverhaltens eines Fortbewegungsmittels (10), und in Abhängigkeit des Musikwiedergabeverhaltens - Gestalten (600) des Übergangs (11) in einem zweiten Fortbewegungsmittel.Method according to one of the preceding claims further comprising: - Determining (500) a music reproduction behavior of a means of locomotion (10), and depending on the music reproduction behavior - Shaping (600) of the transition (11) in a second means of transport. Verfahren nach einem der vorstehenden Ansprüche weiter umfassend: - Ermitteln (200), dass Metainformationen (7) einer Audiodatei (6a, 6b, 6c) nicht verfügbar sind.Method according to one of the preceding claims further comprising: - determining (200) that meta-information (7) of an audio file (6a, 6b, 6c) is not available. Verfahren nach einem der vorstehenden Ansprüche weiter umfassend: - Ermitteln und Bewerten einer semantischen Verwandtschaft und/oder einer semantischen Priorisierung der Audiodateien (6a, 6b) und in Abhängigkeit eines Ergebnisses der Bewertung - Gestalten des Übergangs (11).Method according to one of the preceding claims further comprising: Determining and evaluating a semantic relatedness and / or a semantic prioritization of the audio files (6a, 6b) and depending on a result of the evaluation - design of the transition (11). Vorrichtung zur Gestaltung eines Übergangs (11) bei einer Audio-Wiedergabe von einer ersten Audiodatei (6a) zu einer zweiten Audiodatei (6b) umfassend: - eine Auswerteeinheit (2) und - eine Ausgabeeinheit (1), wobei - die Auswerteeinheit (2) eingerichtet ist, die Audiodateien (6a, 6b) hinsichtlich eines jeweils enthaltenen Audio-Materials (8) automatisch zu untersuchen und/oder - einen Fahrzeugzustand automatisch zu untersuchen und/oder - den Übergang in Abhängigkeit eines Ergebnisses des Untersuchens zu gestalten.Device for designing a transition (11) during audio reproduction from a first audio file (6a) to a second audio file (6b) comprising: an evaluation unit (2) and - An output unit (1), wherein - The evaluation unit (2) is arranged to automatically examine the audio files (6a, 6b) with respect to an audio material contained in each case (8) and / or - to automatically inspect a vehicle condition and / or - to design the transition depending on a result of the investigation. Vorrichtung nach Anspruch 10, welche eingerichtet ist, ein Verfahren nach einem der Ansprüche 1 bis 9 auszuführen.Device after Claim 10 which is set up, a method according to one of Claims 1 to 9 perform. Computerprogrammprodukt aufweisend Instruktionen, welche, wenn Sie auf einem programmierbaren Prozessor ausgeführt werden, den Prozessor veranlassen, die Schritte eines Verfahrens gemäß einem der vorstehenden Ansprüche 1 bis 9 auszuführen.Computer program product comprising instructions which, when executed on a programmable processor, cause the processor to perform the steps of a method according to any one of the above Claims 1 to 9 perform. Signalfolge repräsentierend Instruktionen, welche, wenn Sie auf einem programmierbaren Prozessor ausgeführt werden, den Prozessor veranlassen, die Schritte eines Verfahrens gemäß einem der vorstehenden Ansprüche 1 bis 9 auszuführen.Signal sequence representing instructions which, when executed on a programmable processor, cause the processor to perform the steps of a method according to any one of the above Claims 1 to 9 perform. Fortbewegungsmittel umfassend eine Vorrichtung gemäß einem der Ansprüche 10 oder 11.Means comprising a device according to one of Claims 10 or 11 ,
DE102016226042.1A 2016-12-22 2016-12-22 Device, means of transportation and method for designing a transition between two audio files Active DE102016226042B4 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE102016226042.1A DE102016226042B4 (en) 2016-12-22 2016-12-22 Device, means of transportation and method for designing a transition between two audio files

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102016226042.1A DE102016226042B4 (en) 2016-12-22 2016-12-22 Device, means of transportation and method for designing a transition between two audio files

Publications (2)

Publication Number Publication Date
DE102016226042A1 true DE102016226042A1 (en) 2018-06-28
DE102016226042B4 DE102016226042B4 (en) 2020-02-20

Family

ID=62509903

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102016226042.1A Active DE102016226042B4 (en) 2016-12-22 2016-12-22 Device, means of transportation and method for designing a transition between two audio files

Country Status (1)

Country Link
DE (1) DE102016226042B4 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113539296A (en) * 2021-06-30 2021-10-22 深圳市斯博科技有限公司 Audio climax detection algorithm, storage medium and device based on sound intensity

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130108073A1 (en) * 2010-07-09 2013-05-02 Bang & Olufsen A/S Method and apparatus for providing audio from one or more speakers
US20140096003A1 (en) * 2012-09-28 2014-04-03 Tesla Motors, Inc. Vehicle Audio System Interface

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130108073A1 (en) * 2010-07-09 2013-05-02 Bang & Olufsen A/S Method and apparatus for providing audio from one or more speakers
US20140096003A1 (en) * 2012-09-28 2014-04-03 Tesla Motors, Inc. Vehicle Audio System Interface

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
„Der DJ in der Hosentasche Seratos Musik-Player App Pyro für iOS ist da", www.gearnews.de, iTunes, 12.02.2016. https://www.gearnews.de/der-dj-in-der-hosentasche-seratos-musik-player-app-pyro-fuer-ios-ist-da/ *
„Serato Pyro - automatischer Musik-Mix" im App Store, von Serato, Version 1.3.0, 07.09.2016 https://itunes.apple.com/de/app/serato-pyro-automatischer-musik-mix/id1024770866?mt=8 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113539296A (en) * 2021-06-30 2021-10-22 深圳市斯博科技有限公司 Audio climax detection algorithm, storage medium and device based on sound intensity
CN113539296B (en) * 2021-06-30 2023-12-29 深圳万兴软件有限公司 Audio climax detection algorithm based on sound intensity, storage medium and device

Also Published As

Publication number Publication date
DE102016226042B4 (en) 2020-02-20

Similar Documents

Publication Publication Date Title
DE112016006153T5 (en) CREATING AND DISTRIBUTING PLAY LISTS WITH RELATED MUSIC AND STORIES
EP1407446B1 (en) Method and device for characterising a signal and for producing an indexed signal
DE112007001774B4 (en) Method and system for searching music
EP2099024B1 (en) Method for acoustic object-oriented analysis and note object-oriented processing of polyphonic sound recordings
EP1415297B1 (en) Automatic generation of musical scratching effects
DE102014118075B4 (en) Perception model synchronizing audio and video
WO2003007185A1 (en) Method and device for producing a fingerprint and method and device for identifying an audio signal
WO2002073592A2 (en) Method and device for characterising a signal and method and device for producing an indexed signal
DE60319710T2 (en) Method and apparatus for automatic dissection segmented audio signals
DE102014224120A1 (en) Output audio contributions for a vehicle
DE102016226042B4 (en) Device, means of transportation and method for designing a transition between two audio files
DE102021132695A1 (en) Method and device for lighting control
DE60318450T2 (en) Apparatus and method for segmentation of audio data in meta-patterns
DE102007052334A1 (en) Device for allocation of individually sorted sequence of elements such as articles, persons or data records, has memory device where multiple elements and description record are saved to each element
EP1377924B1 (en) Method and device for extracting a signal identifier, method and device for creating a database from signal identifiers and method and device for referencing a search time signal
WO2009013144A1 (en) Method for determining a similarity, device, and the use thereof
EP1359566A1 (en) Method and apparatus for voice-based use of memory systems, a corresponding computer software and a corresponding computer readable memory medium
EP1709640B1 (en) Method and device for controlling an image sequence run coupled to an audio sequence and corresponding programme
WO2010023231A1 (en) Method for operating an electronic sound generating device and for generating context-dependent musical compositions
EP1788571A1 (en) Audio player with apparatus for setting a personal music profile
DE102013009569B4 (en) Method for operating an infotainment system for obtaining a playlist for an audio reproduction in a motor vehicle, infotainment system and motor vehicle comprising an infotainment system
TW202320551A (en) Music recommendation system and method based on image recognition and situational state
DE102021126741A1 (en) Process for the aggregated output of media content
DE102021110268A1 (en) Method and system for scene-synchronous selection and playback of audio sequences for a motor vehicle
DE102007034030A1 (en) Method of performing an adaptation of descriptors, apparatus and use thereof

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R016 Response to examination communication
R016 Response to examination communication
R018 Grant decision by examination section/examining division
R020 Patent grant now final