DE10041325A1 - Verfahren und Vorrichtung zur Korrelationsanalyse von Datenfolgen - Google Patents
Verfahren und Vorrichtung zur Korrelationsanalyse von DatenfolgenInfo
- Publication number
- DE10041325A1 DE10041325A1 DE10041325A DE10041325A DE10041325A1 DE 10041325 A1 DE10041325 A1 DE 10041325A1 DE 10041325 A DE10041325 A DE 10041325A DE 10041325 A DE10041325 A DE 10041325A DE 10041325 A1 DE10041325 A1 DE 10041325A1
- Authority
- DE
- Germany
- Prior art keywords
- positions
- data
- data sequences
- sequences
- values
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
- G06F16/90344—Query processing by using string matching techniques
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
- Complex Calculations (AREA)
Abstract
Es wird ein Verfahren zur Bearbeitung von Datenfolgen, die jeweils eine Anzahl von Daten in einer vorbestimmten Reihenfolge von Positionen umfassen, beschrieben, das die Schitte aufweist: Ermittlung von Korrelationswerten für alle Paare, Tripel oder n-Tupel von Positionen in einem Satz von Datenfolgen auf der Grundlage eines vorbestimmten Korrelationsmaßes, Ermittlung von Positionsgewichtungen aus den Korrelationswerten für jede Position der Datenfolgen, Erfassung von Gruppen zueinander korrelierter Positionen in den Datenfolgen, deren Positionsgewichtungen ungleich Null sind und von einem vorbestimmten Schwellwert abweichen, und Bereitstellung von abgeleiteten Datenfolgen, die durch Daten an den korrelierten Positionen gebildet werden. Es wird auch eine Korrelatorvorrichtung zur Umsetzung des Verfahrens beschrieben.
Description
Die Erfindung betrifft Verfahren zur Bearbeitung von Datenfol
gen, insbesondere zur Korrelationsanalyse von Datenfolgen, um
Positionen von miteinander korrelierten Daten in verschiedenen
Datenfolgen zu erfassen, wie z. B. Verfahren zur Kompression
von Datenfolgen, zur Identifikation von bedeutungstragenden
Positionen in Datenfolgen und/oder zur Klassifikation von Da
tenfolgen mittels Korrelationsanalysen, Vorrichtungen zur
Durchführung der Verfahren und Anwendungen der Verfahren.
In allen Bereichen von Forschung und Technik fallen Daten an,
die in Form von Symbolen mit technischem Bedeutungsinhalt (z. B.
Alphabete aus Zahlen, Buchstaben, Benennungen von Substan
zen oder Systemzuständen, oder dgl.) Informationen über einen
technischen Aufbau, eine chemische Reaktion, ein biologisches
System, einen physikalischen Zustand oder dgl. gegeben sind.
Die Daten fallen in der Regel in einer bestimmten Reihenfolge
an, die sich beispielsweise aus einer zeitlichen Reihenfolge,
einer geometrischen Anordnung oder auch einem zahlenmäßigen
Systemparameter ergibt. Datenfolgen können eindimensional
(z. B. Zeitreihen von Messwerten, biologische Substanzfrequen
zen) sein. Sie können aber auch mehrdimensional sein: dies ist
offensichtlich bei Grauwertmatrizen in der Bildverarbeitung,
aber auch beispielsweise bei DNA-Sequenzen gegeben. Letztere
werden zu mehrdimensionalen Datenfolgen, wenn man zu jeder
Nukleinsäure ihre Strukturparameter abspeichert. Die zur Ver
fügung stehenden Datenmengen wachsen durch sich erweiternde
Mess- und Speichermöglichkeiten ständig. Beispielsweise liegen
in der Gentechnik umfangreiche biologisch relevante Informationen
in Form von Datenfolgen, z. B. als DNA-Sequenzen, Prote
insequenzen, kodierte Umweltdaten, kodierte Phänotypen, Ban
denmuster einer gelelektrophoretischen Analyse, Haplotypen,
oder Kombinationen aus diesen, vor. Es besteht ein Interesse
an Verfahren, um die anwendungsabhängig wichtigeren von den
weniger wichtigen Daten zu trennen oder die Daten nach vorge
gebenen Gesichtspunkten zu klassifizieren. Dies ist sowohl für
eine effektive Handhabung der Daten in Datenverarbeitungsanla
gen (Speicherbedarf, Rechenzeiten und dgl.) als auch für die
Auswertung der Daten (Mustererkennung, Gewinnung neuer System
parameter oder dgl.) von Bedeutung. Speziell in der Bioinfor
matik sollen in Datenfolgen biologisch bedeutungstragender
Symbole, die relevanten Positionen und/oder Gruppen von Posi
tionen und deren Assoziation zu äußeren Ausprägungen oder Um
weltbedingungen des betrachteten biologischen Systems erkannt
werden. Es besteht ein besonderes Interesse an der Charakteri
sierung des Verhaltens von komplexen Systemen, zu denen mehre
re Datenfolgen, z. B. in Bezug auf innere Systemzustände und
äußere Systembedingungen, vorliegen. Bisher sind keine effek
tiven Verfahren zur Verarbeitung von Datenfolgen komplexer
Systeme, insbesondere zur Erfassung von Korrelationen zwischen
bedeutungstragenden Positionen in den Datenfolgen, verfügbar.
Herkömmliche Verfahren zur Analyse und Klassifizierung von Da
tenfolgen basieren auf einer nur positionsweisen Untersuchung
der Daten und einer darauf additiv aufbauenden Berechnung.
Solche herkömmlichen Techniken sind beispielsweise in von
M. J. Bishop et al. in "DNA and Protein Sequence Analysis" Ox
ford 1997, dargestellt. Sie sind jedoch nicht in der Lage, die
Bedeutung von Positionen in den Datenfolgen zu erkennen, wenn
diese sich erst aus dem Kontext einer oder mehrerer anderer,
unter Umständen in der Datenfolge weit auseinander liegender
Positionen ergibt, und führen deshalb durch die Vernachlässi
gung oder gar Unterschlagung solcher Positionen bei jeder auf
der Unterscheidung wichtiger bzw. unwichtiger Positionen beruhenden
Datenkompression und Klassifikation zu fehlerhaften Er
gebnissen.
Die Aufgabe der Erfindung ist es, verbesserte Verfahren zur
Untersuchung von Datenfolgen anzugeben, die sich insbesondere
dadurch auszeichnen, dass die Daten nicht nur mit hoher Effek
tivität, sondern derart verarbeitet und gegebenenfalls redu
ziert werden können, dass Fehler vermieden werden, die auf ei
ner Nichtberücksichtigung von bestehenden Abhängigkeiten zwi
schen den Positionen in den Datenfolgen beruhen. Das verbes
serte Verfahren soll insbesondere auch eine zuverlässige Klas
sifikation von Daten ermöglichen. Die Aufgabe der Erfindung
ist es auch, Vorrichtungen zur Umsetzung der Verfahren und
neue Anwendungen anzugeben.
Diese Aufgaben werden mit Verfahren, Computerprogrammprodukten
und Vorrichtungen mit den Merkmalen gemäß den Patentansprüchen
1, 14 bzw. 15 gelöst. Vorteilhafte Ausführungsformen und An
wendungen der Erfindung ergeben sich aus den abhängigen An
sprüchen.
Die Grundidee der Erfindung ist es, Zusammenhänge oder Wech
selwirkungen (Interdependenzen) zwischen einzelnen Positionen
verschiedener Datenfolgen durch eine Korrelationsanalyse mit
den folgenden Schritten zu erfassen. Zunächst wird in der Ge
samtheit aller Datenfolgen für alle Paare von Positionen mit
einem vorgegebenem Korrelationsmaß jeweils ein Korrelations
wert ermittelt. Die Datenfolgen können als Vektoren aufgefasst
werden, deren Komponenten durch die Daten gebildet werden. Auf
alle Komponentenpaare wird das Korrelationsmaß zur Ermittlung
des jeweiligen Korrelationswertes angewendet. Um die ermittel
ten Korrelationswerte in Bezug auf ihre Signifikanz beurteilen
zu können, werden zum Vergleich systembezogene Referenzwerte
oder ggf. Simulationskorrelationswerte bzw. aus diesen gewon
nene repräsentative Referenzwerte herangezogen. Die Ermittlung
von Simulationskorrelations- bzw. Referenzwerten erfolgt an
wendungsabhängig ein- oder mehrmalig vor oder nach der Ermitt
lung der paarweisen Korrelationswerte. Durch Vergleich der
Korrelationswerte insbesondere mit den zu den entsprechenden
Positionspaaren gehörenden Referenzwerten kann im Rahmen eines
einfachen Schwellwertverfahrens festgestellt werden, ob der
jeweilige Korrelationswert oder ein davon abgeleiteter Positi
onsgewichtungswert so hoch ist, dass die zugehörigen Daten
bzw. Positionen einer Gruppe von korrelierten Daten bzw. Posi
tionen zugeordnet werden oder nicht. Die genannten Schritte
können analog auch auf Tripel oder höhere n-Tupel von Positio
nen angewendet werden.
Je nach dem Ergebnis des Schwellwertverfahrens wird zu jeder
Datenfolge (mindestens) eine abgeleitete Datenfolge erzeugt,
die durch die korrelierten Positionen der Ausgangsdatenfolgen
gebildet wird. Auf der Basis des Vergleichs der Korrelations
werte mit den Simulationskorrelationswerten oder den repräsen
tativen Referenzwerten können auch differenziertere Klassifi
kationen innerhalb der Gruppen der korrelierten bzw. nicht-
korrelierten Daten vorgenommen werden.
Die Ermittlung und Bewertung paarweiser Korrelationswerte be
sitzt den Vorteil, dass die weitere Verarbeitung der abgelei
teten Datenfolgen sowie die oft zeit- und kostenaufwendige Er
zeugung eventuell weiterer zum betrachteten Datensatz gehören
der Datenfolgen je nach dem interessierenden Gesichtspunkt auf
den relevanten Teil der Datenfolge beschränkt werden kann. Das
erfindungsgemäße Verfahren ergibt eine Datenkompression, die
Speicher- und Rechenzeiten sowie Arbeitszeit und -kosten
spart. Des Weiteren ergibt sich als besonderer Vorteil, dass
zwischen Datenfolgen, die zu einem System gehören, jedoch ganz
verschiedene Datentypen enthalten, Assoziationen zwischen ver
schiedenen Positionen bestimmt werden können. Beispielsweise
können die Datenfolgen jeweils DNA-Sequenzen, relevante Umweltdaten
und auch die zugehörigen Phänotypen in geeignet ko
dierter Form enthalten. Die erfindungsgemäß ermittelten Asso
ziationen liefern Zusammenhänge zwischen Gruppen von DNA-
Positionen, Umwelteinflüssen und Phänotypen und damit wiederum
neue Informationen als Ausgangspunkt für eine Bewertung oder
Veränderung des betrachteten biologischen Systems.
Die genannten Vorteile spielen nicht nur in der Auswertung
biologisch relevanter Daten eine Rolle. Es ergeben sich allge
mein eine Vereinfachung und Beschleunigung von Arbeiten wie z. B.
der Laboranalyse biologischer Sequenzen, der automatisier
ten Bilderkennung oder der Überwachung technischer Anlagen,
und der anwendungsrelevanten Interpretation der Datenfolgen.
In komplexen technischen Anlagen können Korrelationen zwischen
Systemzuständen zuverlässig erfasst und in Bezug auf die Steu
erung von Prozessparametern oder die Abgabe von Warnsignalen
verwendet werden. Bevorzugte Anwendungen der Erfindung ergeben
sich somit neben der Informationsverarbeitung an technischen
Anlagen vor allem in der Molekularbiologie, der Medizin, der
Biologie, der Veterinärmedizin, der Agrarwirtschaft und der
Ökobiologie.
Gegenstand der Erfindung ist auch ein Computerprogrammprodukt,
das zur Kompression von Datenfolgen, Erfassung von Mustern in
Datenfolgen und/oder Erfassung von Klassen in Datenfolgen nach
dem erfindungsgemäßen Verfahren eingerichtet ist.
Gegenstand der Erfindung ist ferner eine Korrelatorvorrichtung
zur Verarbeitung von Datenfolgen nach dem erfindungsgemäßen
Verfahren. Eine Korrelatorvorrichtung umfasst insbesondere ei
ne Speichereinrichtung zur Speicherung der zu bearbeitenden
Datenfolgen, eine Recheneinrichtung zur Ermittlung von Korre
lationswerten, Simulationskorrelationswerten und Referenzwer
ten, und eine Vergleichereinrichtung zur Bewertung der Korrelationswerte
und zur Erfassung der Positionen von korrelierten
bzw. nicht-korrelierten Daten.
Weitere Einzelheiten und Vorteile der Erfindung werden im Fol
genden anhand einer Darstellung des erfindungsgemäßen Grund
konzepts der Korrelationsanalyse, einer Verfahrensdarstellung
und eines Beispiels verdeutlicht. Die Erläuterung bezieht sich
auf die Verarbeitung biologisch relevanter Informationen. Die
Erfindung ist jedoch nicht auf diese Anwendung beschränkt,
sondern auch in allen anderen technischen Gebieten zur Verar
beitung von Datenfolgen anwendbar.
Dem erfindungsgemäßen Verfahren liegen die folgenden Erkennt
nisse der Erfinder zu Grunde. Die einzelnen Positionen der be
trachteten Menge von Datenfolgen sind mehr oder weniger "ver
rauscht". Einige Positionen sind in (nahezu) allen Datenfolgen
identisch besetzt, während andere Positionen hochvariabel
sind. Zum Zwecke der Klassifikation oder Zuordnung unter
schiedlicher Funktionsausprägungen zu den Datenfolgen sind die
konstanten Positionen unbrauchbarer. Es sind vielmehr die va
riablen Positionen, an denen die zu klassifizierenden Daten
folgen nicht übereinstimmen, zu betrachten. Unter Funktions
ausprägung wird hier und im folgenden allgemein ein Zusammen
hang zwischen Datenfolgen und Systembedingungen verstanden,
der in der Regel in der einen oder anderen Richtung kausal in
terpretiert wird. Eine Änderung der Systembedingungen kann ei
ne Änderung der in der Datenfolge festgehaltenen Messwerte
verursachen. Andererseits kann eine Änderung z. B. in einer
Gensequenz zu einer Änderung des Phänotypen führen. Dabei kann
die Funktionsausprägung in geeignet kodierter Form selbst Be
standteil der Datenfolge sein.
Es sind zwei prinzipiell verschiedene Qualitäten der Variabi
lität einer Position in einer Datenfolge unterscheidbar. Ei
nerseits kann eine Position hochvariabel sein, weil eine Ände
rung der Besetzung keine Auswirkung auf die Ausprägung der
Funktion hat. Andererseits kann eine hohe Variabilität gegeben
sein, weil die jeweilige Position mit unterschiedlichen Funk
tionsausprägungen assoziiert ist. Da die Funktionsausprägung
einer Datenfolge durch spezifische Besetzung einer Kombination
mehrerer, im allgemeinen nicht benachbarter Positionen be
stimmt wird, ist davon auszugehen, dass die in Zusammenhang
mit der betrachteten Funktion bedeutungstragenden Positionen
voneinander abhängig besetzt sind und korreliert veränderlich
sind ("synchron rauschen"), während die zufällig rauschenden
Positionen eher unabhängig von jeder anderen Position besetzt
sind.
Die Erfinder haben ferner festgestellt, dass das synchrone
Rauschen der bedeutungstragenden Positionen nicht nur auf Da
tenpaare beschränkt ist, sondern auch größere Gruppen von Da
ten an bestimmten Positionen betreffen. Das erfindungsgemäße
Verfahren ist nun darauf gerichtet, die im Zusammenhang mit
einer betrachteten Funktion stehende Bedeutung der einzelnen
Positionen in einer Menge von Datenfolgen zu quantifizieren
und auf dieser Grundlage die Datenfolgen Kompressions-, Klas
sifizierungs- und/oder Vorhersageprozeduren zu unterziehen.
Datenkompression bedeutet, dass in der weiteren Verarbeitung
der Datenfolgen nur die relevanten Positionen oder Positions
gruppen in Betracht gezogen werden.
Die durch die erfindungsgemäße Korrelationsanalyse gewonnene
Information kann auch unmittelbar zur Klassifikation benutzt
werden. Die Datenfolgen, die an den Positionen einer Gruppe
stark voneinander abhängiger, verrauschter Positionen (zumin
dest nahezu) dieselben Besetzungen besitzen, werden zu einer
Teilklasse zusammengefasst. Von den vielen theoretisch möglichen
Besetzungen an diesen Positionen kommen wegen der gegen
seitigen Abhängigkeiten nur wenige, die jeweilige Teilklasse
charakterisierenden Muster vor.
Besitzt nun die so konstruierte Klassifikation die Eigen
schaft, dass jeweils in einer Teilklasse zusammengefasste Po
sitionsfolgen sich in ihrer Funktionsausprägung nicht oder nur
unwesentlich unterscheiden, so hat man eine Korrelation mit
der betrachteten Funktion gefunden, die im Hinblick auf die
betrachtete Funktion auch Vorhersagen zukünftiger Systemzu
stände möglich macht. Sind zusätzlich zu den ursprünglich be
trachteten Datenfolgen weitere Datenfolgen gegeben und besit
zen diese an den ausgezeichneten Positionskombinationen be
kannte, d. h. im Rahmen der Klassifikation ermittelte Beset
zungen, so können diese Positionskombinationen mit der ent
sprechenden Funktionsausprägung in Beziehung gebracht werden.
Anwendungsabhängig kann vorgesehen sein, dass derartige Vor
hersagen durch zusätzliche Verfahren oder Informationen vali
diert werden.
Die technische Anwendung der erfindungsgemäßen Korrelations
analyse ergibt sich aus der Datenkompression, bei der in Bezug
auf eine bestimmte Funktion die wichtigen Datenpositionen er
kannt und weiter verarbeitet werden, der Mustererkennung bzw.
Klassifikation, bei der Kombinationen von Positionsbesetzungen
an den erkannten wichtigen Positionen ermittelt werden, die
relevante Teilklassen der betrachteten Datenfolgen beschrei
ben, der Assoziation von Mustern in den Positionsfolgen zu
Ausprägungen der betrachteten Funktionen und der Vorhersage
von Funktionsausprägungen in neuen Datenfolgen.
In einem ersten Schritt werden die interessierenden Daten für
die erfindungsgemäße Korrelationsanalyse bereitgestellt, z. B.
auf eine Korrelatorvorrichtung übertragen. Anwendungsabhängig
werden zunächst die Daten gemessen oder erfasst, über eine
Schnittstelle in die Korrelatorvorrichtung eingegeben, zwi
schengespeichert und zu Datenfolgen zusammengestellt. Dieser
Teilschritt ist nicht zwingend notwendig, die Datenfolgen kön
nen bereits bspw. als Messwertfolgen vorliegen. Anschließend
werden die Datenfolgen zur Bildung einer Menge von Folgen, die
einander entsprechende Daten an jeweils derselben Position be
sitzen und die alle die gleiche Länge besitzen, formatiert.
Falls die zunächst bereitgestellten Daten zu Datenfolgen mit
verschiedenen Längen führen, wie dies beispielsweise bei Da
tenfolgen zur Beschreibung eines Phänotyps der Fall sein kann,
entstehen in der entsprechenden Datenfolge Lücken. Zur Forma
tierung werden die Lücken aufgefüllt oder die entsprechenden
Positionen in den übrigen Datenfolgen (z. B. Gensequenzen) ge
strichen. Das Auffüllen erfolgt beispielsweise mit einem ge
sonderten "Lücke"- oder "gap"-Symbol, mit dem an dieser Posi
tion häufigsten Wert oder - bei numerischen Daten - mit einem
Durchschnittswert.
Die Datenfolgen basieren gegebenenfalls auf jeweils verschie
denen Symbolvorräten oder "Alphabeten" und liegen beispiels
weise in gespeicherter Form vor.
Je nach der Aufgabenstellung wird eine problemrelevante Metho
de zur Berechnung der Abhängigkeiten zwischen je zwei Positionen
verschiedener Datenfolgen verwendet. Die paarweisen gegen
seitigen Abhängigkeiten (Korrelationswerte) werden in einem
ersten Teilschritt durch ein Korrelationsmaß entsprechend der
gewählten Methode ermittelt. Im Folgenden werden beispielhaft
zwei Korrelationsmaße, nämlich die Transinformation und die
Vorhersagbarkeit, illustriert. Die Erfindung ist jedoch nicht
auf diese Maße beschränkt, sondern mit allen Methoden umsetz
bar, die allgemein geeignet sind, Assoziationen oder Korrela
tionen zwischen Positionen durch Angabe von quantitativen Kor
relationswerten zu charakterisieren. Verschiedene solche Me
thoden sind an sich bekannt und basieren beispielsweise auf χ2-
Tests oder lehrbuchbekannten Algorithmen.
Die Transinformation ist ein auf der Shannon'schen Entropie
basierendes Korrelationsmaß, das aus der Informationstheorie
zur Charakterisierung der Kombination zweier Signale an sich
bekannt ist (siehe z. B. H. Rohling "Einführung in die Infor
mations- und Codierungstheorie", Stuttgart, 1995). Der Korre
lationswert Transinformation wird wie folgt gebildet. Sind Ai
das Alphabet für die Position i und Aj das Alphabet für die Po
sition j, pi bzw. pj die zugehörigen Häufigkeitsverteilungen
und pij die gemeinsame Häufigkeitsverteilung der beiden Positi
onen, so ist die Transinformation T (ij) der Positionen i und
j gemäß der folgenden Gleichung gegeben.
Die Transinformation T ergibt sich als Summe der Entropien für
die einzelnen Positionen, vermindert um die Entropie des Posi
tionenpaares. Die Transinformation ist in der Informationsthe
orie ein gebräuchliches Maß für die Beschreibung der gegensei
tigen Beeinflussung zweier Signale. Sie ist minimal, wenn betrachtete
Positionen statistisch unabhängig sind, und maximal,
wenn beide Positionen gleichverteilt und sich gegenseitig in
eindeutiger Weise bestimmend sind.
Das Korrelationsmaß Transinformation liefert für jedes Positi
onenpaar eine Zahl, die die Korrelation beschreibt. Aus dem
quantitativen Wert allein ist die Korrelation ohne Zusatzin
formationen nicht bewertbar, da die Größe von T auch von der
Zahl der Symbole in den Datenfolgen abhängt. Je mehr Symbole
die Alphabete umfassen, desto größere T-Werte treten auf. Die
Bewertung erfolgt im dritten Schritt (siehe unten).
Die Vorhersagbarkeit ist ein neu entwickeltes, gerichtetes Maß
für Korrelationen zwischen verschiedenen Positionen, das davon
abhängt, ob bei zwei betrachteten Positionen die eine aus der
anderen ableitbar oder vorhersagbar ist. Der Korrelationswert
Vorhersagbarkeit ist ein quantitatives Maß für die Aussage
"falls an Position i ein a, dann an Position j ein b". Das Maß
Vorhersagbarkeit ergibt sich aus den folgenden Überlegungen.
Für jedes a∈ Ai sei fij(a) ∈Aj der am häufigsten mit einem a an
Position i einhergehende "Buchstabe" an Position j. Falls es
mehrere häufigste Buchstaben gibt, so wird einer von ihnen be
liebig ausgewählt, da das Ergebnis der Ermittlung der Vorher
sagbarkeit nicht von dieser Auswahl unter den häufigsten Buch
staben abhängt. Ist N die Anzahl aller Datenfolgen und nij(a)
die Anzahl derjenigen Datenfolgen unter ihnen, die an Position
i ein a und an Position j ein fij(a) besitzen, so ist die Vor
hersagbarkeit V(i, j) der Position j durch Position i durch die
folgende Gleichung gegeben.
Dabei ist H(j) die Entropie
Die Vorher
sagbarkeit ist die mit der Entropie der vorherzusagenden Posi
tion gewichtete Anteil derjenigen Datenfolgen, bei denen die
Vorhersage der Position j richtig ist, falls man aus der
Kenntnis der Besetzung von Position i auf die jeweils am häu
figsten damit einhergehende Besetzung von Position j schließt.
Schließlich werden in einem weiteren Teilschritt aus den paar
weise für alle Positionen der Datenfolgen ermittelten Korrela
tionswerten Positionsgewichtungen bestimmt. Für jede Position
der Datenfolgen werden alle zugehörigen Korrelationswerte ei
ner Summation (gleichbedeutend einer Mittelwertbildung) oder
einer Maximumsbildung unterzogen, so dass sich jeweils als
quantitativer Parameter die Positionsgewichtung ergibt, die
zusätzlich zu den Korrelationswerten als eine Form der Infor
mationsverdichtung ausgegeben bzw. gespeichert wird. Hierdurch
werden diejenigen Positionen stark gewichtet, die - im Falle
der Summation - im Mittel zu allen anderen Positionen eine
starke Abhängigkeit besitzen bzw. - im Falle der Maximumsbil
dung - zu mindestens einer anderen Position.
Bereits nach diesem Schritt kann anwendungsabhängig eine erste
Reduzierung der Datenfolge durch Streichung aller Positionen
erfolgen, deren Wert der Positionsgewichtung Null beträgt oder
so niedrig ist, dass eine Korrelation mit anderen Positionen
ausscheidet. Hierzu erfolgt beispielsweise ein Vergleich mit
vorbestimmten systembezogenen Referenzwerten.
Die mit dem Korrelationsmaß gelieferten quantitativen Werte
zur Charakterisierung der gegenseitigen Abhängigkeit zwischen
Positionen können in Bezug auf ihre statistische Signifikanz
durch ein Simulationsverfahren bewertet werden. Die Durchfüh
rung des Simulationsverfahrens ist kein zwingendes Merkmal der
Erfindung. Anwendungsabhängig kann darauf verzichtet werden,
falls beispielsweise Zusatzinformationen über das betrachtete
System vorliegen oder wenn die ermittelten Korrelationen ohne
weiteres dahingehend beurteilt werden können, ob sie im System
technisch oder biologisch sinnvoll sind.
Das Simulationsverfahren umfasst die Erzeugung einer großen
Anzahl von randomisierten Referenzdatensätzen (sogenannte
"Shuffles"). Die Referenzdatensätze bestehen jeweils aus der
selben Anzahl an Datenfolgen wie der betrachtete Datensatz,
besitzen alle dieselbe Länge wie die gegebenen Datenfolgen und
gehen auf folgende Weise aus diesen hervor: Stellt man sich
die einzelnen Datenfolgen des gegebenen Datensatzes zeilenwei
se untereinander geschrieben vor, so werden die Daten inner
halb der Spalten, also die jeweils an derselben Position ste
henden Daten untereinander zufällig vertauscht. Derartige po
sitionsinterne Vertauschungen verändern das Rauschen der Posi
tionen nicht, brechen jedoch gegebene Abhängigkeiten auf und
schaffen möglicherweise neue Abhängigkeiten. Für jeden Refe
renzdatensatz wird wie bei Schritt 2 das Korrelationsmaß zur
quantitativen Bewertung gegenseitiger Abhängigkeiten angewen
det. Es ergeben sich eine Vielzahl von Simulationskorrelati
onswerten für alle Paare von Positionen jedes betrachteten
"Shuffles".
Es wird für jeden Referenzdatensatz des Simulationsverfahrens
die jeweils maximale auftretende Abhängigkeit zwischen zwei
Positionen bestimmt. Ferner wird für jeden Referenzdatensatz
die maximale Positionsgewichtung entsprechend dem für den ge
gebenen Datensatz gewählten Verfahren bestimmt. Jeweils Mit
telwert und Varianz dieser beiden Werte, über alle Referenzda
tensätze ermittelt, werden als repräsentative Referenzwerte
für den späteren Vergleich mit den für die betrachteten Datenfolgen
berechneten Korrelationswerten und Positionsgewichtun
gen ausgegeben oder gespeichert.
In einem ersten Teilschritt werden Abhängigkeitsgruppen von
Positionen ermittelt. Hierzu werden die paarweisen Abhängig
keiten der Positionen mit einem vorbestimmten Schwellwert ver
glichen. Der Schwellwert ist beispielsweise (wie bei Entschei
dungen über statistische Signifikanz üblich) die Summe aus
Mittelwert und Varianz der in Schritt 3 bestimmten maximalen
Abhängigkeit in den Referenzdatensätzen. Alternativ kann als
Schwellwert eine anwendungsabhängig eingestellte Größe verwen
det werden, die auf Zusatzinformationen, Erfahrungswerten oder
dgl. basiert. Die Bestimmung von korrelierten Positionen er
folgt vorzugsweise durch Bildung von Abhängigkeitsgruppen der
Positionen nach dem folgenden Schema.
Gruppen von Positionen, deren paarweise Abhängigkeiten vonein
ander sämtlich über dem Schwellwert liegen, werden als soge
nannte Cliquen zusammengefasst. Falls die Mehrzahl der Korre
lationswerte über dem Schwellwert liegen, eine kleine Anzahl
von Positionspaaren jedoch geringere Korrelationswerte erge
ben, so werden die zugehörigen Positionen in Gruppen zusammen
gefasst, die als "Beinahe-Cliquen" bezeichnet werden. Bei der
Definition einer "Beinahe-Clique" kann ein zweiter, niedrige
rer Schwellwert als Mindestgröße für diejenigen Korrelations
werte berücksichtigt werden, die den Schwellwert für eine Cli
que nicht erreichen. Als schwächste Form einer Abhängigkeits
gruppe werden Positionen, die lediglich mittelbar voneinander
stark abhängig sind, als "Komponenten" zusammengefasst. Dabei
ist eine mittelbare Abhängigkeit der Positionen i und q dann
gegeben, wenn es Positionen j, k, . . . q derart gibt, dass die
Positionenpaare (i, j), (j, k), . . ., (p, q) jeweils über dem
Schwellwert liegende Korrelationswerte besitzen. Ein hoher
Korrelationswert für das Positionenpaar (i, q) muss jedoch
nicht notwendigerweise vorliegen.
Zum Zwecke der Verkürzung der Datenfolgen und damit der Daten
kompression können alle außerhalb der Abhängigkeitsgruppen
liegenden Positionen gestrichen (gelöscht) werden. Es bleiben
dann nur die relevanten für die weitere Verarbeitung gewünsch
ten Daten bestehen.
In einem weiteren Teilschritt werden die Abhängigkeitsgruppen
ausgegeben bzw. gespeichert. Den Positionen der Datenfolgen
wird eine Information zugeordnet, wonach sie zu einer der ge
nannten Abhängigkeitsgruppen gehören oder nicht. Es werden ab
geleitete Datenfolgen gebildet, die ausschließlich die korre
lierten Positionen umfassen. Die abgeleiteten Datenfolgen wer
den anwendungsabhängig an eine Schnittstelle zu einem weiteren
Auswertungs- oder Diagnosegerät gegeben, gespeichert, ange
zeigt oder anderweitig dargestellt.
Auf der Grundlage der bei Schritt 4 ermittelten Abhängigkeits
gruppen werden anschließend Teilklassen der gegebenen Menge
von Datenfolgen ermittelt. Die Abhängigkeitsgruppen bilden be
stimmte Muster, d. h. Kombinationen von Positionsbesetzungen.
Die Teilklassen und die sie charakterisierenden Muster inner
halb der Datenfolgen werden ausgegeben bzw. gespeichert.
Im Ergebnis sind die für die weitere Bearbeitung, Anzeige oder
Auswertung relevanten Datenfolgen in ihrer Anzahl durch Aus
wahl jeweils einer repräsentativen Datenfolge je Teilklasse
reduziert worden.
Die Vorhersage umfasst die Bearbeitung einer oder mehrerer
neuer Datenfolgen entsprechend den Schritten 1 bis 5 und den
Vergleich der bei Schritt 5 für die neuen Datenfolgen ermit
telten Muster mit den Mustern der vorher verarbeiteten Daten
folgen. Wenn Übereinstimmungen charakteristischer Muster gege
ben sind, so wird den jeweiligen Positionen der neuen Daten
folgen die entsprechend für die zuerst verarbeiteten Datenfol
gen ermittelte Teilklasse zugeordnet bzw. die entsprechende
Zugehörigkeit zu dieser Teilklasse vorhergesagt.
Das erfindungsgemäße Verfahren wird an einem konstruierten
Beispiel erläutert Es werden 16 Positionsfolgen der Länge 9
betrachtet, die in Position 8 über dem Alphabet "1, 2, 3 . . .", in
Position 9 über dem Alphabet "+, -", sonst über dem Alphabet
"A, C, G, T" gebildet sind. Es handelt sich bspw. um DNA-
Sequenzen der Länge 7 mit einem in der angehängten Position 8
codierten Umwelteinfluss und einem in Position 9 vermerkten
Vorhandensein einer phänotypischen Eigenschaft.
Die paarweisen Abhängigkeiten zwischen den Positionen werden
als Korrelationswert Transinformation berechnet:
Ein Wert der Transinformation von 0 bedeutet stochastische Un
abhängigkeit im üblichen Sinne. Diese liegt insbesondere vor,
wenn eine der betrachteten Positionen konstant ist, wie hier
die Daten in Position 3. Die stärksten Abhängigkeiten in dem
Beispiel bestehen zwischen den Positionen 1 und 4 bzw. zwi
schen den Positionen 2 und 5: Während die Positionen 2 und 5
identisch besetzt sind, also offensichtlich im höchsten Maße
voneinander abhängig sind, so bestimmen sich auch die Positio
nen 1 und 4 gegenseitig eindeutig - ein "G" an Position 1 ist
stets mit einem "A" an Position 4 verbunden, ein "T" mit einem
"T", ein "A" mit "C" und ein "C" mit einem "G".
Anschließend folgt die durch Summenbildung bestimmte Positi
onsgewichtung:
Position | |
Gewicht | |
1 | 4,0406 |
2 | 2,2506 |
3 | 0,0000 |
4 | 4,0406 |
5 | 2,2506 |
6 | 1,5417 |
7 | 3,4334 |
8 | 3,4334 |
9 | 1,4707 |
Die Positionen 1 und 4 sind im Sinne dieser Gewichtung von
größter Bedeutung, da alle anderen Positionen von ihnen durch
schnittlich am stärksten abhängig sind.
Die Überprüfung der statistischen Relevanz mittels Simulation
ergibt: 100 "Shuffles" besitzen durchschnittlich eine maximale
Abhängigkeit zweier Positionen voneinander von 0,5941 bei ei
ner Varianz von 0,0870; für die Positionspaare mit einer stär
keren Abhängigkeit als 0,5941 + 0,0870 = 0,6811 ist die sta
tistische Relevanz gegeben.
Wählt man als Schwellwert 0,5941 + 2.0,0870 = 0,7681, be
trachtet also nur diejenigen Positionspaare mit einer Transin
formation, die um mindestens zwei Varianzen größer als der zu
erwartenden maximalen ist, so findet man zwei Cliquen: die
Gruppe der Positionen 1, 4, 7, 8 (je zwei dieser vier Positionen
besitzen eine über der gewählten Schwelle liegende Transinfor
mation) und die Gruppe der Positionen 2, 5.
An den Positionen 1, 4, 7, 8 kommen folgende Muster innerhalb
der Menge von Positionsfolgen vor:
Dies führt zur Einteilung der Menge in vier Teilklassen:
Teilklasse 1 (Zum Muster "GAA3") : Folgen 1, 6, 8, 9, 14
Teilklasse 2 (Zum Muster "TTA3") : Folgen 2, 12, 15
Teilklasse 3 (Zum Muster "ACG2") : Folgen 3, 4, 10, 16
Teilklasse 4 (Zum Muster "CGT1") : Folgen 5, 7, 11, 13
Teilklasse 1 (Zum Muster "GAA3") : Folgen 1, 6, 8, 9, 14
Teilklasse 2 (Zum Muster "TTA3") : Folgen 2, 12, 15
Teilklasse 3 (Zum Muster "ACG2") : Folgen 3, 4, 10, 16
Teilklasse 4 (Zum Muster "CGT1") : Folgen 5, 7, 11, 13
Hier ist zu bemerken, dass die Klassifizierung nach den an den
Positionen 2, 5 vorkommenden Mustern zu einer anderen Eintei
lung geführt hätte:
Teilklasse 1 (Zum Muster "AA") : Folgen 1, 4, 13
Teilklasse 1 (Zum Muster "CC") : Folgen 2, 5, 14, 16
Teilklasse 1 (Zum Muster "TT") : Folgen 3, 8, 9, 11, 12
Teilklasse 1 (Zum Muster "GG") : Folgen 6, 7, 10, 15
Teilklasse 1 (Zum Muster "AA") : Folgen 1, 4, 13
Teilklasse 1 (Zum Muster "CC") : Folgen 2, 5, 14, 16
Teilklasse 1 (Zum Muster "TT") : Folgen 3, 8, 9, 11, 12
Teilklasse 1 (Zum Muster "GG") : Folgen 6, 7, 10, 15
Wahlweise können zu allen in Schritt 4 gefundenen Positions
gruppen die jeweils implizierte Klassifizierung ausgegeben
werden, um dann unter Ausnutzung zusätzlicher Informationen zu
entscheiden, welche auf das Problem bezogen am geeignetsten
ist. Es ist auch möglich, eine gemeinsame Partitionierung zu
konstruieren - je nach Zielsetzung etwa die gröbste
Partitionierung, die feiner als alle gefundenen ist, oder die
feinste unter den gröberen.
Schließlich wird für die nicht zu den ursprünglichen Positi
onsfolgen gehörende Folge "GGAATTC3" ein "+" für die in Posi
tion 9 codierte Funktion, also das Vorhandensein der betrach
teten phänotypischen Eigenschaft, vorhergesagt, da ihr Muster
"GAA3" an den Positionen 1, 4, 7, 8 mit dem die Teilklasse 1 cha
rakterisierenden Muster übereinstimmt und jede Positionsfolge
aus dieser Teilklasse ein "+" an Position 9 besitzt.
Eine erfindungsgemäße Korrelatorvorrichtung umfasst eine For
matierungseinrichtung zur Bereitstellung einer Vielzahl von
Datenfolgen gleicher Länge, eine Recheneinrichtung zur Bestim
mung der Korrelationswerte zwischen allen Positionspaaren der
Datenfolgen und der daraus abgeleiteten Positionsgewichtungen,
eine Vergleichereinrichtung zum Vergleich der Positionsgewich
tungen mit vorbestimmten Referenzwerten und zur Ermittlung von
korrelierten Positionen, und eine Einrichtung zur Anzeige,
Ausgabe oder Speicherung von abgeleiteten Datenfolgen, die
durch die korrelierten Positionen gebildet werden. Die ver
schiedenen Komponenten der Korrelatorvorrichtung werden vor
zugsweise durch eine Datenverarbeitungsanlage, z. B. einen
Computer, implementiert.
Claims (18)
1. Verfahren zur Bearbeitung von Datenfolgen, die jeweils ei
ne Anzahl von Daten in einer vorbestimmten Reihenfolge von Po
sitionen umfassen, mit den Schritten:
- - Ermittlung von Korrelationswerten für alle Paare, Tripel oder n-Tupel von Positionen in einem Satz von Datenfolgen auf der Grundlage eines vorbestimmten Korrelationsmaßes,
- - Ermittlung von Positionsgewichtungen aus den Korrelations werten für jede Position der Datenfolgen,
- - Erfassung von Gruppen zueinander korrelierter Positionen in den Datenfolgen, deren Positionsgewichtungen ungleich Null sind und von einem vorbestimmten Schwellwert abweichen, und
- - Bereitstellung von abgeleiteten Datenfolgen, die durch Daten an den korrelierten Positionen gebildet werden.
2. Verfahren gemäß Anspruch 1, bei dem die Erfassung der kor
relierten Positionen die folgenden Schritte umfasst:
- - Ermittlung von Simulationskorrelationswerten für alle Paare von Positionen in einer Vielzahl randomisierter Referenzdaten sätze,
- - Ermittlung von repräsentativen Referenzwerten aus den simu lierten Referenzdatensätzen für die Korrelationswerte und Po sitionsgewichtungen,
- - Ermittlung von Schwellwerten aus den Referenzwerten,
- - Zuordnung der Positionen, für die die Positionsgewichtung der zu bearbeitenden Datenfolgen größer oder kleiner als der entsprechende Schwellwert ist, zu einer Gruppe der korrelier ten Positionen oder einer Gruppe von nicht-korrelierten Posi tionen.
3. Verfahren gemäß Anspruch 1 oder 2, bei dem als Korrelati
onswerte Transinformations- oder Vorhersage-Werte ermittelt
werden.
4. Verfahren gemäß Anspruch 2 oder 3, bei dem die repräsenta
tiven Referenzwerte durch Berechnung statistischer Momente
(Erwartungswert, Varianz, höhere Momente) und Kombinationen
aus ihnen oder anderer mathematischer Funktionen aus allen
oder den jeweils maximalen Korrelationswerten und Positionsge
wichtungen über alle Referenzdatensätze ermittelt werden.
5. Verfahren gemäß Anspruch 4, bei dem die Gruppe der korre
lierten Positionen in Untergruppen unterteilt wird, bei denen
alle paarweisen Korrelationen oder die Mehrzahl aller paarwei
sen Korrelationen oder alle paarweisen mittelbaren Korrelatio
nen der Positionen die Schwellwerte überschreiten.
6. Verfahren gemäß einem der vorhergehenden Ansprüche, bei
dem die Datenfolgen und/oder die gemäß einem der vorhergehen
den Ansprüche von ihnen abgeleiteten Datenfolgen einer Klassi
fizierung und/oder einer Mustererkennung unterzogen wird.
7. Verfahren gemäß einem der vorhergehenden Ansprüche, bei
dem die Bereitstellung der Datenfolgen und/oder ihrer Ablei
tungen ein Speichern, Anzeigen oder Senden an eine Schnitt
stelle einer Datenverarbeitungseinrichtung umfasst.
8. Verfahren gemäß einem der vorhergehenden Ansprüche, bei
dem eine Formatierung der zu bearbeitenden Datenfolgen derart
vorgesehen ist, dass in jeder Datenfolge die gleiche Anzahl
von Positionen gegeben ist.
9. Verfahren gemäß einem der vorhergehenden Ansprüche, bei
dem die Datenfolgen über demselben Alphabet oder verschiedenen
Alphabeten gebildet sind.
10. Verfahren gemäß Anspruch 9, bei dem die Alphabete der ein
zelnen Positionen der Datenfolgen biologische Substanzen, Ei
genschaften biologischer Substanzen, Nukleinsäuren, Aminosäu
ren, Strukturparameter, Ausprägungen phänotypischer Merkmale
und/oder Ausprägungen von Umweltmerkmalen kodieren.
11. Verfahren gemäß einem der vorhergehenden Ansprüche, bei
dem die Datenfolgen Gensequenzen, Nukleinsäuresequenzen, Ami
nosäuresquenzen, Bandenmuster gelelektrophoretischer Analysen,
Haplotypen, kodierte Phänotypen, kodierte Umweltdaten oder
Kombinationen aus diesen umfassen.
12. Verfahren gemäß einem der vorhergehenden Ansprüche, bei
dem die Alphabete Gruppen von Systemparametern eines Regelsys
tems, Messwerten und/oder Bildwerten umfassen.
13. Verfahren gemäß einem der vorhergehenden Ansprüche, bei
dem die abgeleiteten Datenfolgen als Eingangsgröße für ein
Vorhersage- oder Diagnoseverfahren bereitgestellt werden.
14. Computerprogrammprodukt, das zur Kompression von Datenfol
gen, Erfassung von Mustern in Datenfolgen und/oder Erfassung
von Klassen in Datenfolgen nach einem Verfahren gemäß einem
der vorhergehenden Ansprüche eingerichtet ist.
15. Korrelatorvorrichtung, die umfasst:
eine Formatierungseinrichtung zur Bereitstellung einer Viel zahl von Datenfolgen gleicher Länge,
eine Speichereinrichtung zur Zwischenspeicherung der zu be arbeitenden Datenfolgen,
eine Recheneinrichtung zur Bestimmung der Korrelationswerte zwischen allen Positionspaaren der Datenfolgen und der daraus abgeleiteten Positionsgewichtungen,
eine Vergleichereinrichtung zum Vergleich der Positionsge wichtungen mit vorbestimmten Schwellwerten und zur Ermittlung von korrelierten Positionen, und
eine Ausgabe- und/oder Speichereinrichtung zur Ausgabe oder Speicherung von abgeleiteten Datenfolgen, die durch die korre lierten Positionen gebildet werden.
eine Formatierungseinrichtung zur Bereitstellung einer Viel zahl von Datenfolgen gleicher Länge,
eine Speichereinrichtung zur Zwischenspeicherung der zu be arbeitenden Datenfolgen,
eine Recheneinrichtung zur Bestimmung der Korrelationswerte zwischen allen Positionspaaren der Datenfolgen und der daraus abgeleiteten Positionsgewichtungen,
eine Vergleichereinrichtung zum Vergleich der Positionsge wichtungen mit vorbestimmten Schwellwerten und zur Ermittlung von korrelierten Positionen, und
eine Ausgabe- und/oder Speichereinrichtung zur Ausgabe oder Speicherung von abgeleiteten Datenfolgen, die durch die korre lierten Positionen gebildet werden.
16. Korrelatorvorrichtung gemäß Anspruch 15, die zur Durchfüh
rung der Schritte eines Verfahrens gemäß einem der Ansprüche 1
bis 14 eingerichtet ist.
17. Korrelatorvorrichtung gemäß Anspruch 15 oder 16, die durch
eine Datenverarbeitungsanlage gebildet wird.
18. Verwendung eines Verfahrens, eines Computerprogrammpro
dukts oder einer Vorrichtung gemäß einem der vorhergehenden
Ansprüche zur Erfassung von Korrelationen zwischen Positionen
in Datenfolgen.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10041325A DE10041325A1 (de) | 2000-08-23 | 2000-08-23 | Verfahren und Vorrichtung zur Korrelationsanalyse von Datenfolgen |
PCT/EP2001/009710 WO2002017127A2 (de) | 2000-08-23 | 2001-08-22 | Verfahren und vorrichtung zur korrelationsanalyse von datenfolgen |
AU2001285898A AU2001285898A1 (en) | 2000-08-23 | 2001-08-22 | Method and device for the correlation analysis of data series |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10041325A DE10041325A1 (de) | 2000-08-23 | 2000-08-23 | Verfahren und Vorrichtung zur Korrelationsanalyse von Datenfolgen |
Publications (1)
Publication Number | Publication Date |
---|---|
DE10041325A1 true DE10041325A1 (de) | 2002-03-21 |
Family
ID=7653482
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE10041325A Withdrawn DE10041325A1 (de) | 2000-08-23 | 2000-08-23 | Verfahren und Vorrichtung zur Korrelationsanalyse von Datenfolgen |
Country Status (3)
Country | Link |
---|---|
AU (1) | AU2001285898A1 (de) |
DE (1) | DE10041325A1 (de) |
WO (1) | WO2002017127A2 (de) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012070042A1 (en) * | 2010-11-26 | 2012-05-31 | Audio Pixels Ltd. | Apparatus and methods for individual addressing and noise reduction in actuator arrays |
US9880533B2 (en) | 2012-05-25 | 2018-01-30 | Audio Pixels Ltd. | System, a method and a computer program product for controlling a group of actuator arrays for producing a physical effect |
US10007244B2 (en) | 2012-05-25 | 2018-06-26 | Audio Pixels Ltd. | System, a method and a computer program product for controlling a set of actuator elements |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2857201B1 (fr) * | 2003-07-03 | 2005-09-23 | Thomson Licensing Sa | Procede pour la constitution de listes de services favoris dans un decodeur |
KR101759042B1 (ko) | 2007-11-21 | 2017-07-17 | 오디오 픽셀즈 리미티드 | 디지털 스피커 장치의 작동 장치 및 작동 시스템 |
CN107533134B (zh) | 2015-04-15 | 2021-04-27 | 音频像素有限公司 | 相机、音频声音系统、检测物体的位置的方法和系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1996012187A1 (en) * | 1994-10-13 | 1996-04-25 | Horus Therapeutics, Inc. | Computer assisted methods for diagnosing diseases |
-
2000
- 2000-08-23 DE DE10041325A patent/DE10041325A1/de not_active Withdrawn
-
2001
- 2001-08-22 AU AU2001285898A patent/AU2001285898A1/en not_active Abandoned
- 2001-08-22 WO PCT/EP2001/009710 patent/WO2002017127A2/de active Application Filing
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012070042A1 (en) * | 2010-11-26 | 2012-05-31 | Audio Pixels Ltd. | Apparatus and methods for individual addressing and noise reduction in actuator arrays |
US9880533B2 (en) | 2012-05-25 | 2018-01-30 | Audio Pixels Ltd. | System, a method and a computer program product for controlling a group of actuator arrays for producing a physical effect |
US10007244B2 (en) | 2012-05-25 | 2018-06-26 | Audio Pixels Ltd. | System, a method and a computer program product for controlling a set of actuator elements |
US10503136B2 (en) | 2012-05-25 | 2019-12-10 | Audio Pixels Ltd. | System, a method and a computer program product for controlling a set of actuator elements |
US10642240B2 (en) | 2012-05-25 | 2020-05-05 | Audio Pixels Ltd. | System, a method and a computer program product for controlling a set of actuator elements |
Also Published As
Publication number | Publication date |
---|---|
WO2002017127A2 (de) | 2002-02-28 |
AU2001285898A1 (en) | 2002-03-04 |
WO2002017127A3 (de) | 2004-01-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE112019007232B4 (de) | Zustandsschätzvorrichtung und zustandsschätzverfahren | |
EP2940924A1 (de) | PUF basierende Ableitung eines gerätespezifischen Wertes | |
EP3267625B1 (de) | Verfahren zur detektion von anomalen zuständen in einem computernetzwerk | |
EP2854045B1 (de) | Verfahren und System zum Bewerten von erhobenen Messwerten eines Systems | |
DE102019114378A1 (de) | Verfahren und system zur vorhersage des systemstatus | |
DE10041325A1 (de) | Verfahren und Vorrichtung zur Korrelationsanalyse von Datenfolgen | |
EP2433185B1 (de) | Vorrichtung und verfahren zum bearbeiten einer prozesssimulationsdatenbasis eines prozesses | |
DE102018220701A1 (de) | Diskretisierung von Zahlenwerten mit adaptiver Genauigkeit | |
DE102021204550A1 (de) | Verfahren zum Erzeugen wenigstens eines Datensatzes zum Trainieren eines Algorithmus maschinellen Lernens | |
EP1273007B1 (de) | Verfahren zur bestimmung eines charakteristischen datensatzes für ein datensignal | |
DE102009018785A1 (de) | Verfahren und Vorrichtungen für eine virtuelle Testzelle | |
DE102022132047A1 (de) | Systeme und verfahren zum detektieren von herstellungsanomalien | |
DE10134926A1 (de) | Vorrichtung und Verfahren zum Erzeugen eines Klassifikators für das automatische Sortieren von Objekten | |
DE69734123T2 (de) | Verfahren zur erzeugung eines klassifikationsmodells | |
DE102020201183A1 (de) | Verfahren und Vorrichtung zur Simulation eines technischen Systems | |
DE102019214546A1 (de) | Computerimplementiertes Verfahren und Vorrichtung zur Optimierung einer Architektur eines künstlichen neuronalen Netzwerks | |
DE102018207933A1 (de) | Verfahren sowie Überprüfungssystem zur Überprüfung einer hergestellten Getriebebaugruppe | |
DE102004018174B4 (de) | Verfahren zur Akquisition von Formen aus Bildern mit Fällen und zum fallbasierten Erkennen von Objekten in digitalen Bildern, Computer-Programm-Produkt und digitales Speichermedium zur Ausführung dieses Verfahrens | |
DE102022200285B3 (de) | Verfahren und Vorrichtung zum Bereitstellen eines datenbasierten Systemmodells und zum Überprüfen eines Trainingszustands des Systemmodells | |
EP3787229A1 (de) | Verfahren und vorrichtung zur automatischen auswahl von analyseketten zur merkmalsextraktion | |
DE102022213062A1 (de) | Verfahren und Vorrichtung zur Bestimmung einer Klassifikation für ein Objekt basierend auf einem Radarspektrum und Radarreflexionen | |
EP3759644B1 (de) | Identifizieren unbesetzter sitzplätze auf basis der detektion einer sich wiederholenden textur | |
DE102022205715A1 (de) | Verfahren zum Bereitstellen von Trainingsdaten und Testdaten zum Trainieren eines Algorithmus des maschinellen Lernens | |
DE102004018171B4 (de) | Verfahren zur Akquisition von Formen aus Bildern luftgetragener Keime und/oder Pollen und zum fallbasierten Erkennen dieser Objekte in digitalen Bildern, Computer-Programm-Produkt und digitales Speichermedium zur Ausführung dieses Verfahrens | |
EP4256475A1 (de) | Vergleichen eines ersten knn mit einem zweiten knn |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8127 | New person/name/address of the applicant |
Owner name: ROOTS, IVAR, PROF.DR.MED., 10117 BERLIN, DE |
|
8139 | Disposal/non-payment of the annual fee |