LU601292B1 - Eine Plattform zur Analyse von Pickleball-Sportdaten - Google Patents

Eine Plattform zur Analyse von Pickleball-Sportdaten

Info

Publication number
LU601292B1
LU601292B1 LU601292A LU601292A LU601292B1 LU 601292 B1 LU601292 B1 LU 601292B1 LU 601292 A LU601292 A LU 601292A LU 601292 A LU601292 A LU 601292A LU 601292 B1 LU601292 B1 LU 601292B1
Authority
LU
Luxembourg
Prior art keywords
ball
data
information
time
pico
Prior art date
Application number
LU601292A
Other languages
English (en)
Inventor
He Yu
Original Assignee
Liaodong Univ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Liaodong Univ filed Critical Liaodong Univ
Priority to LU601292A priority Critical patent/LU601292B1/de
Application granted granted Critical
Publication of LU601292B1 publication Critical patent/LU601292B1/de

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • G06V20/42Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items of sport video content
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/269Analysis of motion using gradient-based methods
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B19/00Teaching not covered by other main groups of this subclass
    • G09B19/003Repetitive work cycles; Sequence of movements
    • G09B19/0038Sports
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10028Range image; Depth image; 3D point clouds
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30221Sports video; Sports image
    • G06T2207/30224Ball; Puck
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30241Trajectory

Landscapes

  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Multimedia (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

Die vorliegende Anwendung bezieht sich auf das technische Gebiet der Pikokugeln und insbesondere auf eine Plattform zur Analyse von Pickleball-Sportdaten, die Folgendes umfasst: ein Datenerfassungsmodul zum Erzeugen von anfänglichen Trajektorieninformationen einer Pikokugel auf der Grundlage von Echtzeitdaten eines Sensors der Pikokugel; wobei die Echtzeitdaten des Sensors der Pikokugel eine Winkelgeschwindigkeit der Inertialmesseinheit IMU der Pikokugel, eine anfängliche Trajektorie eines Videostroms und Radarentfernungsdaten umfassen; ein Datenausrichtungsmodul zum Verwenden eines Zeitstempels der anfänglichen Trajektorieninformation des Pico-Balls als Zeitbasis, zum Ausrichten der Sensor-Echtzeitdaten des Pico-Balls in einer Zeitdimension und zum Erhalten eines synchronisierten Datenstroms; ein dreidimensionales Abbildungsmodul zum Abbilden des synchronisierten Datenstroms in einen dreidimensionalen Raum und zum Erhalten eines dreidimensionalen Voxelfeldes, das räumliche Informationen und die Sensor-Echtzeitdaten umfasst; ein Merkmalsverarbeitungsmodul zum Erzeugen eines kontextuellen Merkmalsvektors, der räumliche und zeitliche Informationen enthält, basierend auf dem dreidimensionalen Voxelfeld und den historischen Trajektorieninformationen des Pico-Balls; ein Analyse- und Vorhersagemodul zum Erzeugen vorhergesagter Trajektorieninformationen des Pico-Balls basierend auf dem kontextuellen Merkmalsvektor.

Description

Eine Plattform zur Analyse von Pickleball-Sportdaten LU601292
Technischer Bereich
Die vorliegende Anwendung bezieht sich auf das technische Gebiet der Petanque-Kugeln und insbesondere auf eine Plattform zur Analyse von Pickleball-Sportdaten.
Technologie im Hintergrund
Bei der Datenanalyse im Pickleball-Sport geht es um die Erfassung, Verarbeitung und
Analyse einer breiten Palette von Daten im Zusammenhang mit dem Pickleball-Sport, um wertvolle Informationen und Erkenntnisse zu gewinnen, die als Entscheidungshilfen und
Optimierungsempfehlungen für Sportler, Trainer, Veranstalter, Zuschauer und andere genutzt werden können.
Die herkömmliche Analyse von Petanque-Daten stützt sich hauptsächlich auf die Daten eines einzigen Sensors, z. B. nur auf die Videoanalyse oder die Daten der inertialen Messeinheit (Inertial
Measurement Unit, IMU).
IMU-Daten sind zwar hochfrequent, können aber unter Driftproblemen leiden, und es ist schwierig, 3D-Bewegungsbahnen vollständig zu erfassen, wenn sie allein verwendet werden, was zu großen Fehlern bei der Bahnvorhersage führt.
Inhalt der Erfindung
Dementsprechend besteht die Notwendigkeit, als Antwort auf das obige technische Problem eine Plattform zur Analyse von Pickleball-Sportdaten bereitzustellen, die in der Lage ist, die
Flugbahn eines Pique-Balls genau zu analysieren.
In einem ersten Aspekt stellt die vorliegende Anwendung eine Plattform zur Analyse von
Pickleball-Sportdaten bereit, wobei die Plattform Folgendes umfasst:
Ein Datenerfassungsmodul zum Erzeugen von anfänglichen Trajektorieninformationen des
Pikoballs auf der Grundlage von Echtzeitsensordaten des Pikoballs; wobei die Echtzeitsensordaten des Pikoballs eine Inertialmesseinheit IMU-Winkelgeschwindigkeit des Pikoballs, eine anfängliche Trajektorie eines Videostroms und Radarentfernungsdaten umfassen;
Ein Datenausrichtungsmodul zum Verwenden eines Zeitstempels der anfänglichen
Trajektorieninformation des Pico-Balls als eine Zeitbasis, Ausrichten der Sensor-Echtzeitdaten des
Pico-Balls in einer Zeitdimension und Erhalten eines synchronisierten Datenstroms;
Ein dreidimensionales Abbildungsmodul zum Abbilden des synchronisierten Datenstroms in einem dreidimensionalen Raum, um ein dreidimensionales Voxelfeld zu erhalten, das räumliche
Informationen und Sensor-Echtzeitdaten enthält;
Ein Merkmalsverarbeitungsmodul zum Erzeugen eines kontextuellen Merkmalsvektors, der räumlich-zeitliche Informationen auf der Grundlage des dreidimensionalen Voxelfeldes und der historischen Trajektorieninformationen des Pico-Balls enthält;
Ein Analyse- und Vorhersagemodul zum Erzeugen vorhergesagter Trajektorieninformationen für den Pikoball auf der Grundlage der kontextbezogenen Merkmalsvektoren.
In einer Ausführungsform dient das Datenerfassungsmodul ferner zum:
Erzeugen von Rohtrajektorieninformationen der Pikokugel, basierend auf Echtzeit-
Sensordaten der Pikokugel, unter Verwendung der Newton-Euler-Gleichungen;
Lösen der Magnus-Kraft- und Widerstandskoeffizienten und der Hertz‘schen Kontakttheorie, dynamisches Optimieren des Schläger-Ball-Kollisionsimpulsmodells unter Verwendung der differenzierbaren hydrodynamischen Gleichungen, um die rohe Flugbahninformation zu optimieren, um die anfängliche Flugbahninformation der Pikokugeln zu erhalten, wobei die anfängliche Flugbahninformation aerodynamische Kompensationsgrößen enthält.
In einer Ausführungsform wird das Datenerfassungsmodul außerdem verwendet, um: LU601292
Die Hertzsche Kontakttheorie wurde zur dynamischen Optimierung des Schläger-Ball-
Kollisionsimpulsmodells verwendet, und die von der IMU erfassten Änderungen der
Schwungwinkelgeschwindigkeit, der Geschwindigkeit nach der Kollision und des Drehwinkels wurden analysiert, um den Kollisionsimpuls zu erhalten;
Die Reibungskoeffizienten werden iterativ auf der Grundlage des Kollisionsimpulses und der
Residuen der multimodalen Daten optimiert, um die aktualisierten Kollisionsimpulsparameter zu erhalten;
Optimierung der ursprünglichen Trajektorieninformation auf der Grundlage der aktualisierten
Kollisionsimpulsparameter.
In einer Ausführungsform enthält der kontextuelle Merkmalsvektor räumliche Informationen, zeitliche Informationen, semantische Informationen und physikalische Informationen;
Die räumlichen Informationen umfassen: dreidimensionale Koordinaten von
Ball/Schläger/Spieler, relative Entfernungen von Ball und Schläger/Spieler, Abmessungen von
Ball/Schläger und Aktivitätsbereich des Spielers,
Zu den zeitlichen Informationen gehören: Geschwindigkeit des Balls/Schlägers/Spielers,
Geschwindigkeit des Balls/Spielers, Beschleunigung des Balls/Spielers, historische Abfolge der
Bewegungsbahnen,
Semantische Informationen wie: Objektkategorie (Ball/Schläger/Spieler/Grenze),
Spieleraktion (Art des Schlags/der Bewegung), Spielphase/Spielstand,
Physikalische Informationen: Richtung/Geschwindigkeit der Ballrotation,
Zeitpunkt/Position/Kraft des Aufpralls,
Zu den Umgebungsinformationen gehören: Art des Spielfelds/Material/Beleuchtung,
Anzahl/Verteilung der Zuschauer/emotionaler Zustand.
In einer Ausführungsform wird das Datenausrichtungsmodul außerdem verwendet, um:
Im Falle der Erkennung einer plötzlichen Änderung der Winkelgeschwindigkeit der IMU im
Moment des Balltreffens: Kombination von optischer Flussinterpolation und Kalman-Filterung, um die Taktdrift zu kompensieren, Verwendung der anfänglichen Flugbahninformationen des
Pucks als Zeitreferenz, Ausrichtung der Sensor-Echtzeitdaten des Pucks in der Zeitdimension und
Gewinnung eines synchronisierten Datenstroms.
In einer Ausführungsform wird das dreidimensionale Abbildungsmodul außerdem verwendet, um:
Mit Hilfe der neuronalen Strahlungsfeldtechnik wird der synchronisierte Datenstrom im 3D-
Raum abgebildet, um ein 3D-Voxelfeld zu erhalten, das räumliche Informationen und Echtzeit-
Sensordaten enthält.
In einer Ausführungsform dient das dreidimensionale Abbildungsmodul ferner dazu:
Wenn ein 3D-Voxelfeld in einer verdeckten Region erkannt wird, wird der
Voxelbewegungstrend in der verdeckten Region auf der Grundlage der Methode des optischen
Flusses vorhergesagt, und zeitliche Konsistenzbeschränkungen werden verwendet, um die
Voxelfeldvariationen in benachbarten Bildern zu glätten.
In einer Ausführungsform wird das Merkmalsverarbeitungsmodul weiterverwendet, um:
Extrahieren von räumlich-zeitlichen Merkmalen des Videos in den historischen
Trajektorieninformationen des 3D-Voxelfeldes und der Pikokugel unter Verwendung eines 3D-
CNN
Kodierung der zeitlichen IMU-Merkmale in den historischen Trajektorieninformationen des
3D-Voxelfeldes und der Pikokugel unter Verwendung eines Transformers; und, LU601292
Kontextuelle Merkmalsvektoren, die räumlich-zeitliche Informationen enthalten, werden durch dynamische Zuweisung modaler Gewichte mittels eines Multiskalen-
Aufmerksamkeitsmechanismus erzeugt.
In einer Ausführungsform wird das Merkmalsverarbeitungsmodul bei der dynamischen
Zuweisung der Modalgewichte über den Multiskalen-Aufmerksamkeitsmechanismus ferner verwendet, um:
Dynamische Anpassung der Gewichte entsprechend der Zuverlässigkeit der verschiedenen
Datenquellen; oder, die
Anpassung der Gewichte nach den Merkmalen des Szenarios; oder, die dynamische Gewichtung nach der Zeit.
In einer Ausführungsform wird das Datenerfassungsmodul ferner verwendet, um:
Automatisches Umschalten auf einen Trajektorienschätzungsmodus der IMU-
Videostromfusion, um anfängliche Trajektorieninformationen des Pico-Balls zu erzeugen, wenn die Radarverdeckungswahrscheinlichkeit als größer als ein Zielschwellenwert erkannt wird.
Die oben beschriebene Plattform zur Analyse von Pickleball-Sportdaten kombiniert in dieser
Anwendung hochfrequente IMU-Winkelgeschwindigkeitsdaten (zur Erfassung feiner
Bewegungen) mit Radarentfernungsmessungen (zur Ermittlung absoluter Entfernungen) und einer anfänglichen Videostream-Trajektorie (zur visuellen Lokalisierung). Durch den
Zeitsynchronisationsmechanismus des Datenausrichtungsmoduls wird der kumulative IMU-
Fehler wirksam kompensiert, und das 3D-Mapping-Modul korrigiert die Verzerrung der IMU-
Lageschätzung in Echtzeit durch die Kreuzvalidierung von Daten aus mehreren Quellen, wodurch die durch Bewegungsunschärfe oder Verdeckung eines einzelnen Sensors verursachte Verzerrung der Flugbahn vermieden wird. Die synchronisierten IMU-, Radar- und Videodaten werden auf das 3D-Voxelfeld abgebildet, um ein einheitliches räumliches und zeitliches Merkmal zu konstruieren, das Geschwindigkeit, Beschleunigung und räumliche Position enthält, die räumliche Begrenzung des 2D-Videostroms durchbricht und die 3D-Trajektorie des Pico-Balls in ihrer Gesamtheit wiederherstellt. Das Voxelfeld unterstützt eine räumliche Auflösung im Millimeterbereich und eine zeitliche Auflösung im Millisekundenbereich, wodurch die subtilen Gestenänderungen (z. B.
Winkel der Schlägerfläche, Rotationsgeschwindigkeit) im Moment des Balltreffens erfasst werden können und hochpräzise Daten für die Flugbahnvorhersage geliefert werden. Das Modul zur
Verarbeitung von Merkmalen fusioniert das aktuelle Voxelfeld und die historischen
Flugbahninformationen durch den Aufmerksamkeitsmechanismus, um die langfristige
Abhängigkeit des Bewegungstrends festzustellen und die kurzfristigen Störgeräusche zu unterdrücken. Das rekurrente neuronale Netzwerk oder das Transformer-Modell, das auf den kontextbezogenen Merkmalsvektoren basiert, ist in der Lage, die komplexen Bewegungsmuster zu erlernen, was das Problem der IMU-Drift und der 3D-Flugbahnerfassung löst und die
Vorhersagegenauigkeit der Flugbahn des Tischtennisballs verbessert.
Beschreibung der beigefügten Zeichnungen
Zur besseren Veranschaulichung der technischen Lösungen in den Ausführungsformen der vorliegenden Anmeldung oder der zugehörigen Technologie werden die begleitenden
Zeichnungen, die bei der Beschreibung der Ausführungsformen der vorliegenden Anmeldung oder der zugehörigen Technologie verwendet werden, im Folgenden kurz beschrieben. Es versteht sich von selbst, dass die begleitenden Zeichnungen in der folgenden Beschreibung nur einige der
Ausführungsformen der vorliegenden Anmeldung darstellen, und für den Fachmann können andere relevante begleitende Zeichnungen auf der Grundlage dieser Zeichnungen ohne kreatiké/601 292
Arbeit erstellt werden.
Bild 1 zeigt eine schematische Darstellung einer Plattform zur Analyse von Pickleball-
Sportdaten in einer Ausführungsform.
Detaillierte Beschreibung
Um den Zweck, die technischen Lösungen und die Vorteile der vorliegenden Anwendung klarer und verständlicher zu machen, wird die vorliegende Anwendung im Folgenden in
Verbindung mit den beigefügten Zeichnungen und Ausführungsformen näher beschrieben. Es versteht sich von selbst, dass die hierin beschriebenen spezifischen Ausführungsformen ausschließlich der Erläuterung der vorliegenden Anwendung dienen und nicht dazu gedacht sind, die vorliegende Anwendung einzuschränken.
In einer beispielhaften Ausführungsform, wie in Bild 1 gezeigt, wird eine Plattform zur
Analyse von Pickleball-Sportdaten bereitgestellt, das Folgende umfasst:
Ein Datenerfassungsmodul 11 zum Erzeugen von anfänglichen Trajektorieninformationen des Pikoballs auf der Grundlage von Echtzeitsensordaten des Pikoballs; die Echtzeitsensordaten des Pikoballs umfassen eine Inertialmesseinheit IMU-Winkelgeschwindigkeit des Pikoballs, eine anfängliche Trajektorie eines Videostroms und Radarentfernungsdaten;
Ein Datenausrichtungsmodul 12 zum Ausrichten der Sensor-Echtzeitdaten des Pico-Balls in einer zeitlichen Dimension unter Verwendung des Zeitstempels der anfänglichen
Trajektorieninformation des Pico-Balls als Zeitbasis, um einen synchronisierten Datenstrom zu erhalten;
Ein dreidimensionales Abbildungsmodul 13 zum Abbilden des synchronisierten Datenstroms in einem dreidimensionalen Raum, um ein dreidimensionales Voxelfeld zu erhalten, das räumliche
Informationen und Sensor-Echtzeitdaten enthält;
Ein Merkmalsverarbeitungsmodul 14 zum Erzeugen eines kontextuellen Merkmalsvektors, der räumlich-zeitliche Informationen enthält, basierend auf dem 3D-Voxelfeld und den historischen Trajektorieninformationen des Pico-Balls;
Das Analyse- und Vorhersagemodul 15 zum Erzeugen vorhergesagter
Flugbahninformationen des Pico-Balls auf der Grundlage der kontextbezogenen
Merkmalsvektoren.
Unter anderem ist die IMU in der Lage, den Bewegungszustand des Pico-Balls in Echtzeit zu erfassen, indem sie die Beschleunigung und die Winkelgeschwindigkeit misst. So kann die IMU beispielsweise Informationen wie die Rotationsgeschwindigkeit und die
Beschleunigungsänderung des Balls erfassen.
Videostreaming: Die Bewegungsbahn des Pikoballs wird von = einer
Hochgeschwindigkeitskamera erfasst, um einen Videostream zu erzeugen. Der Videostream kann intuitive 2D-Flugbahninformationen liefern, und die Positionsinformationen des Balls können durch Bildverarbeitungsalgorithmen extrahiert werden.
Radar-Entfernungsmessung: Das Radar misst die Entfernung zwischen dem Ball und dem
Radar, indem es elektromagnetische Wellen sendet und empfängt. Die Radardaten können genaue
Entfernungsinformationen liefern, um die 3D-Position des Balls zu bestimmen.
Diese drei Datentypen werden kombiniert, um Informationen über die anfängliche Flugbahn eines Pikettballs zu erhalten. Angenommen, ein Hechtball wird geschlagen und die IMU misst die
Winkelgeschwindigkeit des Balls mit 300 Grad pro Sekunde, der Videostream zeigt die anfängliche Position des Balls in der Mitte des Spielfelds und die Radarmessung zeigt, dass die
Entfernung des Balls vom Punkt des Schlags 10 Meter beträgt. Diese Daten werden kombiniet/601292 um Informationen über die anfängliche Flugbahn zu erhalten: Der Ball wird mit einer
Winkelgeschwindigkeit von 300 Grad pro Sekunde aus der Mitte des Spielfelds und einer anfänglichen Entfernung von 10 Metern abgeschlagen. 5 Ferner kann es kleine Unterschiede in den Zeitpunkten geben, zu denen die Daten von verschiedenen Sensoren erfasst werden. So kann eine IMU beispielsweise jede Millisekunde Daten sammeln, während ein Videostream eine Bildrate von 60 Bildern pro Sekunde hat und die
Radarerfassung mit einer Frequenz von 10-mal pro Sekunde erfolgen kann. Das
Datenausrichtungsmodul 12 stellt sicher, dass die Daten zeitlich konsistent sind, indem es die
Zeitstempel aller Sensordaten auf eine gemeinsame Zeitreferenz (z. B. den Zeitstempel der anfänglichen Flugbahninformationen des Tischtennisballs) abstimmt.
Nehmen wir zum Beispiel an, dass die IMU eine Winkelgeschwindigkeit von 300
Grad/Sekunde zum Zeitpunkt 0,001 Sekunden aufzeichnet, der Videostream die Position des Balls zum Zeitpunkt 0,002 Sekunden und das Radar die Entfernung zum Zeitpunkt 0,003 Sekunden.
Durch Abgleich wurden die Zeitstempel aller Daten auf 0,002 Sekunden eingestellt, um einen synchronisierten Datenstrom zu erhalten: Bei 0,002 Sekunden hatte der Ball eine
Winkelgeschwindigkeit von 300 Grad/Sekunde, befand sich in der Mitte des Spielfelds und war 10 Meter vom Aufprallpunkt entfernt.
Ferner werden die Sensordaten im synchronisierten Datenstrom in einem dreidimensionalen
Raum abgebildet, um ein dreidimensionales Voxelfeld zu bilden. Ein Voxel ist die kleinste Einheit im dreidimensionalen Raum, ähnlich wie ein Pixel in einem zweidimensionalen Bild. Durch die
Abbildung der Daten auf das Voxelfeld kônnen die Flugbahn des Pucks und die zugehôrigen Daten visualisiert werden.
So können beispielsweise Informationen wie Flugbahn, Geschwindigkeit, Beschleunigung usw. des Balls auf jedes Voxel im 3D-Raum abgebildet werden, um ein 3D-Datenfeld mit räumlichen und zeitlichen Informationen zu bilden. Angenommen, der Ball wird von der Mitte des
Feldes (mit den Koordinaten (0,0,0)) getroffen und bewegt sich dann mit einer Geschwindigkeit von 10 m/s entlang der x-Achse. In einem 3D-Voxelfeld kann die Flugbahn des Balls als eine
Reihe von Voxelpunkten abgebildet werden, die jeweils die Position, die Geschwindigkeit und den
Zeitstempel des Balls enthalten. Zum Beispiel hat der Ball bei einem Zeitstempel von 0,1
Sekunden eine Position von (1,0,0) und eine Geschwindigkeit von 10 m/s.
Ferner wird auf der Grundlage des 3D-Voxelfeldes und der historischen
Trajektorieninformationen des Pico-Balls ein kontextbezogener Merkmalsvektor extrahiert, der räumlich-zeitliche Informationen enthält. Der Merkmalsvektor kann Informationen wie die
Geschwindigkeit, die Beschleunigung, den Drehwinkel und die Bewegungsrichtung des Balls sowie die Änderung dieser Informationen im Laufe der Zeit enthalten.
So ist es beispielsweise möglich, Merkmale wie die Änderungsrate der Ballgeschwindigkeit,
Spitzen in der Beschleunigung und Änderungen des Drehwinkels zu berechnen, die das Muster und die Regelmäßigkeit der Ballbewegung widerspiegeln. Angenommen, der Ball hat eine
Geschwindigkeit von 10 m/s, eine Beschleunigung von 2 m/s? und einen Drehwinkel von 300
Grad/s bei einem Zeitstempel von 0,1 Sekunden. In Kombination mit den Informationen zur historischen Flugbahn (z. B. hatte der Ball beim letzten Treffer eine Geschwindigkeit von 8 m/s und eine Beschleunigung von 1 m/s?) wird ein kontextbezogener Merkmalsvektor erzeugt: [Anderungsrate der Geschwindigkeit = 2 m/s, Spitzenbeschleunigung = 2 m/s? und Änderung des
Drehwinkels = 200 Grad/s].
Ferner werden die vorhergesagten Flugbahninformationen des Pique-Balls durch eh)601292 maschinelles Lern- oder Deep-Learning-Modell unter Verwendung kontextbezogener
Merkmalsvektoren erzeugt. Das Modell kann die Bewegungsgesetze und -muster des Balls erlernen und die zukünftige Flugbahn auf der Grundlage der aktuellen Merkmale vorhersagen.
Es können zum Beispiel Modelle wie Long Short-Term Memory Networks (LSTM) oder
Convolutional Neural Networks (CNN) verwendet werden, die in der Lage sind, raum-zeitliche
Daten zu verarbeiten und genaue Vorhersagen zu machen. Angenommen, das Modell sagt auf der
Grundlage kontextbezogener Merkmalsvektoren voraus, dass sich der Ball in den nächsten 0,2
Sekunden mit einer allmählich abnehmenden Geschwindigkeit von 8 m/s und einer
Beschleunigung von -1 m/s? weiter in Richtung der x-Achse bewegen wird. Die vorhergesagte
Flugbahn lautet: Zum Zeitpunkt von 0,2 Sekunden befindet sich der Ball bei (1,8,0,0) mit einer
Geschwindigkeit von 8 m/s und einer Beschleunigung von -1 m/s?
In einer beispielhaften Ausführungsform wird das Datenerfassungsmodul 11 außerdem verwendet, um: Rohflugbahninformationen des Pique-Balls auf der Grundlage der Echtzeit-
Sensordaten des Pique-Balls unter Verwendung der Newton-Euler-Gleichungen zu erzeugen;
Lösen der Magnus-Kraft- und Widerstandskoeffizienten und der Hertz'schen Kontakttheorie, dynamisches Optimieren des Schlager-Ball-Kollisionsimpulsmodells unter Verwendung der differenzierbaren Hydrodynamik-Gleichungen, Optimieren der ursprünglichen
Flugbahninformationen und Erhalten der anfänglichen Flugbahninformationen des Pikballs, wobei die anfänglichen Flugbahninformationen aerodynamische Ausgleichsgrößen enthalten.
Optional erzeugt die Newton-Euler-Gleichung die ursprüngliche Flugbahn, einschließlich des folgenden Prozesses:
Die Newton-Euler-Gleichungen beschreiben die translatorische und rotatorische Bewegung des starren Körpers:
F=ma
T=10
Dabei gilt: F: kombinierte äußere Kraft (N); m: Masse des Balls (kg)"a: Beschleunigung des
Massenschwerpunkts (m/s?); T: kombiniertes äußeres Moment (N-m); I: Rotationsträgheit (kg-m?); a: Winkelbeschleunigung (rad/s?)
Eingabe: IMU-Winkelgeschwindigkeit (®), Radar-Anfangsgeschwindigkeit (v0),
Auftreffposition (r0); Ausgabe: ursprüngliche Flugbahn ohne Luftwiderstand (Position r(t),
Geschwindigkeit v(t)).
Ferner kompensieren die hydrodynamischen Differentialgleichungen die Aerodynamik, einschließlich des folgenden Verfahrens:
Berechnung der Magnuskraft (Magnus force) und der Widerstandskraft (Drag force): \ Ë "Dras = 3pCn Au
Dabei gilt: p: Luftdichte (kg/m°), CL: Auftriebsbeiwert (dimensionslos), CD:
Luftwiderstandsbeiwert (dimensionslos), A: Ballquerschnittsfläche (m?), v: Ballgeschwindigkeit (m/s).
Eingabe: ursprüngliche Flugbahngeschwindigkeit v(t), IMU-Winkelgeschwindigkeit œ.
Ausgang: aerodynamisch kompensierte kombinierte Kraft Faero = FMagnus + FDrag.
Ferner optimiert die Hertzsche Kontakttheorie den Kollisionsimpuls, einschließlich des folgenden Prozesses:
Berechnung des Impulses beim Aufprall des Schlägers auf den Ball:
Yr
J = V BTS
Dabei gilt: E: Flastizitätsmodul des Materials (Pa)
R: Kugelradius (m) ô: Kontaktverformung (m) v: Poissonsche Zahl (dimensionslos)
Eingabe: IMU-Schwingwinkelgeschwindigkeit (wswing), Geschwindigkeitsänderung nach dem Aufprall (Av).
Ergebnis: optimierter Kollisionsimpuls Jopt und Reibungskoeffizient u.
Die Fingangsparameter sind beispielsweise: Kugelmasse m=0,05 kg\Kugelradius R=0,03 m\Anfangsgeschwindigkeit v0=20 m/s (horizontale Richtung) \Rotationswinkelgeschwindigkeit ®=1000 rad/s (Aufwärtsrotation)\Luftdichte p=1,2 kg/m*\Auftrebskoeffizient CL=0,2 (Erfahrungswert), Luftwiderstandsbeiwert CD=0,47 (Standardwert für Kugel); Die ursprüngliche
Flugbahn wird wie folgt berechnet:
Zunächst wird die Newton-Euler-Gleichung integriert: © ¥ Fr FEE OD & I Jo wn Ea ki
Forse = 0.5 x 1.2 x Q4TX 7 x 0.03% x 20° = 0,327 N
Widerstände ;
Beschleunigungen a=—0.327/0.05=—6.54 m/s?;
Horizontale Verschiebung (ohne Berücksichtigung der vertikalen Schwerkraft): æft} = agb + Lat? — 208 — 3.274
Als nächstes sind die aerodynamisch kompensierten Flugbahnen wie folgt:
Berechnung der Magnuskraft: Fmagnus = 0,5 X 1,2 X 0,2 x x x 0,032 x 202 = 0,055 N;
Korrigierte Beschleunigung: ; { Fon Sf Fue À” FÉCUE EST FSU YE LL pme ‚2
Étotat = 47 Le : ) + TR Ed {-0.5417 + (1134 = $53m/s
Flugbahn nach Kompensation: x(t) = 20t - 3.315t°
Schließlich wird der Kollisionsimpuls wie folgt optimiert:
Berechnung des Anfangsimpulses:
Je = may = 0.05 x (20 —< 0) = 1 Ns 2. Optimierung des Reibungskoeffizienten: Wenn die tatsächliche Anderung des Drehwinkels nach der Kollision Aomeas=800 rad/s und der vorhergesagte Wert Awpred=900 rad/s ist, wird 601 292 durch Gradientenabstieg angepasst, um den Rest || Awpred-Aomeas|| zu minimieren. 3. In dieser Ausführungsform wird sichergestellt, dass die Flugbahn den Gesetzen der
Starrkôrperbewegung und der Aerodynamik durch die Newton-Euler-Gleichungen und die hydrodynamischen Gleichungen entspricht. Der CL/CD/p wird in Echtzeit optimiert, um sich an unterschiedliche Aufprallstärken, Drehungen und Umgebungsbedingungen anzupassen. 4. 5. In einer beispielhaften Ausführungsform wird das Datenerfassungsmodul 11 auch verwendet, um: das Schläger-Ball-Kollisionsimpulsmodell unter Verwendung der Hertz‘schen
Kontakttheorie dynamisch zu optimieren, de von der IMU erfasste
Schwungwinkelgeschwindigkeit, die Geschwindigkeit nach der Kollision und die Änderung des
Drehwinkels zu analysieren und den Kollisionsimpuls zu erhalten; iterative Optimierung des
Reibungskoeffizienten auf der Grundlage des Kollisionsimpulses und der Residuen der multimodalen Daten, um die aktualisierten Kollisionsimpulsparameter zu erhalten; Optimierung der ursprünglichen Flugbahninformationen auf der Grundlage der aktualisierten
Kollisionsimpulsparameter. 6. Verständlicherweise basiert die Hertzsche Kontakttheorie auf dem folgenden Prozess: 7. Die Formel für die Kontaktkraft: 8 Wenn der Schläger auf den Ball trifft, wird die Kontaktkraft F durch die Kontaktverformung
X . ¥ = SE / Feds a bestimmt: gh Va
FY oa ET BI i {Aquivalenter Flastizitätsmoduf
Da FE Kate ana Erfine re
BY mm BE (Aquivalenter Krümmungsradius) ft TES fs / fa: Elastizitätsmodui von Schläger/Ball y / 1491 Poissonzahl des Schlägers/Bails 4 à / | Ha ; Krimmungsradius von Schläger/Ball
Impulsberechnung: Der Aufprallimpuls J ist das Integral der Kontaktkraft über die
FAY RAS 8 ve Te $572
J mm Je # { i} ai = = x A AO
Aufprallzeit At: a
Der dynamische Optimierungsmechanismus sieht wie folgt aus:
Eingangsdaten: ine {racys}
Von der IMU erfasste Schwenkwinkel-Geschwindigkeit *%8$ * HESS
AUmeas {M/S} 1000129
Geschwindigkeitsänderung nach der Kollision
Anderung des Drehwinkels nach der Kollision Adıneas (rad)
Die Zielfunktion ist: Multimodale Restverlustfunktion: £ = Ay (AUsred — A Urcns 3 + ABA pea T7 AB mens }?
Ne / Ag ©: Gewichtungsfaktor für Geschwindigkeit/Drehwinkel (Standard: 1/0,5);
Optimierungsparameter: Reibungskoeffizient u (beeinflusst den tangentialen Impuls) und äquivalenter Flastizitätsmodul E* (beeinflusst den normalen Impuls).
In einer beispielhaften Ausführungsform enthält der kontextbezogene Merkmalsvektor räumliche Informationen, zeitliche Informationen, semantische Informationen und physische
Informationen; die räumlichen Informationen umfassen: 3D-Koordinaten von
Ball/Schläger/Spieler, relative Entfernungen von Ball/Schläger/Spieler, Abmessungen von
Ball/Schläger und Bewegungsbereich des Spielers, die zeitlichen Informationen umfassen:
Ballgeschwindigkeit/Schlägergeschwindigkeit/Spielerbewegungsgeschwindigkeit,
Ball/Spielerbeschleunigung und historische Bewegungsbahnsequenz, die semantischen
Informationen umfassen: Objektkategorie (Ball/Schläger/Spieler/Grenze), Spieleraktion (Art des
Schlags/Bewegung), Spielphase/Spielstand, physikalische Informationen wie:
Ballrotationsrichtung/-geschwindigkeit, Kollisionszeit/-position/-stärke,
Umgebungsinformationen wie: Platzart/Material/Beleuchtung, Zuschaueranzahl/- verteilung/Emotionszustand.
Verständlicherweise handelt es sich bei den 3D-Koordinaten von Ball/Schläger/Spieler um eine präzise Quantifizierung der genauen Position von Ball, Schläger und Spieler im 3D-Raum.
Jedes Objekt im 3D-Raum hat seine eigenen eindeutigen (x,y,z)-Koordinaten, die seine genaue
Position in der 3D-Szene des Platzes angeben. Die 3D-Koordinaten eines Balls zum Beispiel ändern sich ständig, während er durch die Luft fliegt, und durch kontinuierliche Aufzeichnung dieser Koordinaten kann die Flugbahn des Balls dargestellt werden. Dies ist der Schlüssel zur
Analyse der Flugbahn des Balls, zur Vorhersage, wo er landen wird, und zur Bestimmung, ob sich ein Spieler in der richtigen Position befindet, um den Ball zu empfangen oder zu schlagen.
Relativer Abstand zwischen Ball und Schläger/Spieler: Diese Information beschreibt die räumliche Position des Balls im Verhältnis zum Schläger und des Balls im Verhältnis zum Spieler.
Durch die Berechnung des Abstands zwischen ihnen kann die Nähe des Spielers zum Ball und die relative Position des Schlägers zum Ball visualisiert werden. Wenn sich ein Spieler beispielsweise darauf vorbereitet, den Ball zu schlagen, bestimmt der relative Abstand zwischen dem Ball und dem Schläger das Timing und die Stärke des Schlags. Ist er zu weit entfernt, kann er den Ball möglicherweise nicht rechtzeitig treffen; ist er zu nah dran, hat er möglicherweise keine Zeit, seine
Schlagposition anzupassen.
Ball-/Schlägergröße und Bewegungsspielraum des Spielers: Die Größe des Balls und des
Schlägers sind feste physische Attribute, die jedoch bei der Analyse von Sportszenarien sehr wichtig sind. Die Größe des Balls wirkt sich auf die Stabilität und die Geschwindigkeit seines
Flugs aus, während die Größe des Schlägers die Reichweite des Schlags und die Kraftübertragung des Spielers beeinflusst. Der Bewegungsspielraum eines Spielers hingegen ist der Bereich 44601292
Spielfelds, in dem er sich effektiv bewegen kann, was mit seiner körperlichen Fitness, seinem
Können und seiner taktischen Ausrichtung zusammenhängt. Das Verständnis des
Bewegungsbereichs eines Spielers kann Trainern helfen, eine vernünftige Taktik zu entwickeln und die Leistung eines Spielers in verschiedenen Bereichen zu analysieren.
Ballgeschwindigkeit/Schlägergeschwindigkeit/Spielerbewegungsgeschwindigkeit: Die
Ballgeschwindigkeit ist die Geschwindigkeit des Balls im Flug, die die Stärke und Richtung des
Schlags widerspiegelt. Ein Ball, der mit hoher Geschwindigkeit fliegt, ist in der Regel aggressiver und gibt dem Gegner weniger Zeit zu reagieren. Die Schlägergeschwindigkeit ist die
Geschwindigkeit, mit der der Schläger geschwungen wird. Eine höhere Schlägergeschwindigkeit erhöht die Kraft des Schlags. Die Bewegungsgeschwindigkeit des Spielers spiegelt die
Beweglichkeit des Spielers auf dem Platz wider: Ein schneller Spieler ist in der Lage, rechtzeitig die richtige Position zu erreichen, um den Ball zu schlagen oder zu verteidigen. Diese
Geschwindigkeitsinformationen sind wichtig für die Analyse des Spieltempos, der Reaktionen der
Spieler und der Effizienz der taktischen Ausführung.
Ball-/Spielerbeschleunigung: Die Beschleunigung beschreibt, wie schnell sich die
Geschwindigkeit eines Objekts ändert. Die Beschleunigung des Balls spiegelt die
Kraftveränderung im Moment des Auftreffens des Balls sowie den Einfluss des Luftwiderstands und anderer Faktoren auf die Geschwindigkeit des Balls wider. Die Beschleunigung des Spielers spiegelt die Fähigkeit des Spielers wider, anzulaufen, zu beschleunigen und abzubremsen, was im
Spiel entscheidend ist, um eine vorteilhafte Position einzunehmen und schnell zu reagieren. Wenn ein Spieler beispielsweise den Ball erhält und schnell in die richtige Position beschleunigt, um den
Ball zu schlagen, können das Ausmaß und die Veränderung seiner Beschleunigung die
Explosivkraft und Reaktionsgeschwindigkeit des Spielers widerspiegeln.
Historische Flugbahnsequenz: Dies ist eine Aufzeichnung der Bewegung des Balls und der
Spieler im Laufe der Zeit. Durch die Analyse der historischen Flugbahnsequenz ist es möglich, die
Bewegungsmuster und Gewohnheiten des Balls und der Spieler zu erkennen. Zum Beispiel die
Schlaggewohnheiten eines Spielers in einem bestimmten Bereich, die üblichen Flugbahnen des
Balls usw. Diese Muster können eine Grundlage für die Vorhersage der zukünftigen Flugbahn des
Balls und der Aktionen der Spieler bilden und helfen, die Schwächen der Gegner zu erkennen und entsprechende Taktiken zu formulieren.
Objektkategorien (Ball/Schläger/Spieler/Grenze): Die genaue Identifizierung der
Objektkategorien wie Ball, Schläger, Spieler und Spielfeldbegrenzung ist die Grundlage für das
Verständnis der Spielszenarien. Während des Analyseprozesses ist eine klare Unterscheidung zwischen den verschiedenen Objekten erforderlich, um ihr Verhalten und ihre Beziehungen zueinander zu analysieren. Wenn beispielsweise festgestellt werden soll, ob sich der Ball im Aus befindet, müssen der Ort und die Kategorie des Balls und der Spielfeldbegrenzung genau bestimmt werden.
Bewegung des Spielers (Schlag-/Bewegungstyp): Die Identifizierung des Schlags (z. B.
Vorhand, Rückhand) und der Bewegung (z. B. Laufen, Springen) eines Spielers kann verwendet werden, um das Fähigkeitsniveau und die Spielstrategie des Spielers zu beurteilen. Verschiedene
Schläge haben unterschiedliche Eigenschaften und Wirkungen, wobei Vorhandschläge in der
Regel kraftvoller und Rückhandschläge flexibler sind. Durch die Analyse der Bewegungen der
Spieler ist es möglich, die Defensiv- und Offensivstrategien der Spieler zu verstehen, z. B. die schnellen Bewegungen der Spieler in der Verteidigung und das gezielte Laufen im Angriff.
Spielphasen/Spielstand: Spielphasen (z. B. Aufschlag, Ballwechsel, Tie-Breaks) urkd601292
Spielstand sind wichtige Informationen über das Spiel. Verschiedene Phasen des Matches haben unterschiedliche Regeln und taktische Anforderungen, während der Spielstand die mentalen und taktischen Entscheidungen der Spieler beeinflusst. In einem Tie-Break konnen die Spieler beispielsweise ihre Schlagstrategien sorgfältiger auswählen; bei einem knappen Spielstand können beide Spieler aggressiver angreifen und verteidigen.
Richtung/Geschwindigkeit des Ballspins: Richtung und Geschwindigkeit des Ballspins können sich erheblich auf die Flugbahn und die Sprungkraft des Balls auswirken. Top-Spin führt dazu, dass der Ball im Flug schneller abfällt und von den Gegnern schwerer zu fangen ist, während
Bottom-Spin eine flachere Flugbahn und eine geringere Absprunghöhe bewirkt. Je höher die Spin-
Geschwindigkeit, desto ausgeprägter sind diese Effekte. Die Kenntnis der Spin-Informationen des
Balls kann den Spielern helfen, besser zu antizipieren, wo der Ball landet und wo er abprallen wird, was zu genaueren Schlagentscheidungen führt.
Kollisionszeit/Position/Stärke: Informationen über die Kollision zwischen dem Ball und dem
Schläger, dem Ball und dem Boden sowie dem Ball und den Spielfeldbegrenzungen sind wichtig für die Analyse von Veränderungen der Flugbahn des Balls und der Effektivität des Schlags des
Spielers. Die Kollisionszeit bestimmt die Flugzeit und den Rhythmus des Balls, die
Kollisionsposition beeinflusst die Flugrichtung und die Rückprallrichtung des Balls, und die
Kollisionsstärke steht in Zusammenhang mit der Geschwindigkeit und der Rotation des Balls.
Beim Schlagen des Balls zum Beispiel bestimmen die Stärke und die Position des Aufpralls zwischen Schlager und Ball direkt die Fluggeschwindigkeit und die Richtung des Balls.
Spielfeldtyp/Material/Beleuchtung: Umweltfaktoren wie Spielfeldtyp (Halle, im Freien),
Oberflächenmaterial (Holz, Kunststoff) und Lichtverhältnisse können sich auf die Ballbewegung und die Leistung der Spieler auswirken. Außenplätze können durch Wind, der die Flugbahn des
Balls verändern kann, und durch Sonnenlicht, das die Sicht des Spielers beeinträchtigen kann, gestört werden. Unterschiedliche Bodenbeläge können sich auf die Hohe und die Geschwindigkeit des Ballabsprungs auswirken, wobei Holzbôden einen relativ stabilen Absprung haben und
Kunststoffbôden möglicherweise etwas federnd sind. Auch die Lichtverhältnisse können die visuelle Wahrnehmung der Spieler beeinflussen, und zu viel oder zu wenig Licht kann die Leistung der Spieler beeinträchtigen.
Anzahl/Verteilung/Emotionaler Zustand der Zuschauer: Obwohl die Zuschauer nicht direkt in den Sport involviert sind, können sich ihre Anwesenheit und Reaktion auf die Psyche und
Leistung der Spieler auswirken.
In einer beispielhaften Ausführungsform wird das Datenausrichtungsmodul 12 außerdem verwendet, um: im Falle der Erkennung einer plötzlichen Änderung der Winkelgeschwindigkeit der IMU im Moment des Balltreffens die optische Flussinterpolation mit der Kalman-Filterung zu kombinieren, um die Taktdrift zu kompensieren, und die anfangliche Flugbahninformation des
Pikoballs als Zeitreferenz zu verwenden, um die Echtzeitdaten der Sensoren des Pikoballs in der zeitlichen Dimension abzugleichen und einen synchronisierten Datenstrom zu erhalten.
Optional werden die von der IMU (Inertial Measurement Unit) erfassten
Winkelgeschwindigkeitsdaten kontinuierlich überwacht. Wenn der Schläger mit dem Ball kollidiert, ändert sich die Bewegung des Schlägers plötzlich, was zu einer erheblichen plötzlichen
Anderung der von der IMU erfassten Winkelgeschwindigkeit fithrt. Die Plattform gibt einen
Schwellenwert für die Änderung der Winkelgeschwindigkeit vor, und wenn die Änderung der
Winkelgeschwindigkeit der IMU diesen Schwellenwert überschreitet, wird davon ausgegangen,
dass ein Aufprallereignis festgestellt wurde. Beispielsweise wurde der Schläger ursprünglich nh}}601 292 einer langsamen Geschwindigkeit geschwungen und die Winkelgeschwindigkeit war relativ stabil, aber im Moment des Auftreffens des Balls ändern sich die Geschwindigkeit und die Richtung des
Schlägers drastisch, so dass die Winkelgeschwindigkeit schnell ansteigt oder abnimmt, und sobald diese Änderung den festgelegten Schwellenwert überschreitet, erfasst die Plattform diesen kritischen Moment des Auftreffens des Balls.
Verschiedene Sensoren (z. B. IMUs, Videosensoren, Radargeräte usw.) können aufgrund von
Faktoren wie Hardwareleistung, Betriebsumgebung usw. geringfügige Unterschiede in ihren
Taktraten aufweisen, was zu einer Taktdrift führt. Durch die Taktdrift weichen die von den verschiedenen Sensoren erfassten Daten zeitlich voneinander ab und können nicht genau dem
Bewegungszustand zum gleichen Zeitpunkt entsprechen. Zum Beispiel kann die IMU eine etwas schnellere Uhr haben als der Videosensor, so dass der Zeitstempel der von der IMU aufgezeichneten Daten zum gleichen Zeitpunkt vor dem Zeitstempel des Videosensors liegen kann, was die anschließende Datenfusion und -analyse erschwert.
Der optische Fluss bezieht sich auf die Tendenz von Pixel-Graustufenänderungen, die durch die Bewegung von Objekten in einem Bild verursacht werden. Der Zweck der optischen
Flussinterpolation besteht darin, durch die Analyse der Bewegung von Objekten (z. B. Pikokugeln) in einem Videobild dichtere Zeitreihendaten zu erzeugen. Konkret verarbeitet die Plattform benachbarte Videobilder, um die Bewegungsbahnen des Objekts zwischen den Bildern zu berechnen. Mit diesen Informationen über die Bewegungstrajektorien können
Interpolationsalgorithmen (z. B. lineare Interpolation, Spline-Interpolation usw.) verwendet werden, um mehr Zeitpunkte in das Zeitintervall zwischen benachbarten Videobildern einzufügen und so eine feinere Zeitreihe der Objektbewegung zu erhalten. Die Bildrate des Videosensors beträgt beispielsweise 30 Bilder pro Sekunde, d. h. ein Bild wird alle 1/30 Sekunde aufgenommen, und in dieses 1/30-Sekunden-Intervall können durch optische Flussinterpolation mehr Zeitpunkte eingefügt werden, was zu einer detaillierteren Zeitaufzeichnung der Objektbewegung führt.
Die Kalman-Filterung ist ein optimaler Algorithmus zur Schätzung des Zustands der
Plattform, der hier hauptsächlich zum Ausgleich der Taktdrift verwendet wird. Er erzielt genauere
Zustandsschätzungen durch die kontinuierliche Verschmelzung von vorhergesagten und beobachteten Werten.
Die Vorhersage des gegenwärtigen Zustands basiert auf dem historischen Zustand der
Plattform und dem dynamischen Modell. In einem Szenario mit Taktabweichung sagt die Plattform den Umfang der Taktabweichung zum aktuellen Zeitpunkt auf der Grundlage der vorherigen
Taktabweichung voraus. Wurde beispielsweise zuvor ein gewisser Wachstumstrend bei der
Taktdrift festgestellt, wird die Taktdrift zum aktuellen Zeitpunkt unter Berücksichtigung dieses
Wachstumstrends bei der Vorhersage des aktuellen Zeitpunkts projiziert.
Die mittels optischer Flussinterpolation gewonnenen Zeitreihendaten werden als beobachteter Wert verwendet und mit dem vorhergesagten Wert verglichen, um den Fehler zwischen den beiden zu berechnen. Der vorhergesagte Wert wird dann entsprechend diesem Fehler angepasst, um eine genauere Zustandsschätzung zu erhalten. Zeigt beispielsweise die durch die
Interpolation des optischen Flusses gewonnene Zeitreihe, dass zwischen dem Bewegungszustand des Objekts zu einem bestimmten Zeitpunkt und dem vorhergesagten Zustand eine Differenz besteht, korrigiert die Kalman-Filterung die vorhergesagte Taktdrift entsprechend dieser Differenz, so dass die geschätzte Taktdrift näher an der tatsächlichen Situation liegt.
Der Zeitstempel der anfänglichen Flugbahninformationen des Pico-Balls wird als einheitliche
Zeitbasis verwendet. Die Plattform passt den Zeitstempel der von den einzelnen Sensord 601292 gesammelten Echtzeitdaten entsprechend der durch die Kalman-Filterung erzielten Kompensation der Zeitdrift an. Wenn beispielsweise die Uhr eines Sensors um eine bestimmte Zeitspanne schneller geht als die Referenzzeit, wird der Zeitstempel der Sensordaten von dieser Zeitdrift abgezogen; ist sie langsamer, wird der entsprechende Driftbetrag addiert. Durch solche
Anpassungen können die Daten aller Sensoren zeitlich genau ausgerichtet werden, so dass schließlich ein synchronisierter Datenstrom entsteht. Auf diese Weise kann bei der anschließenden
Datenanalyse und -verarbeitung sichergestellt werden, dass die Daten von verschiedenen Sensoren dem Bewegungszustand zum gleichen Zeitpunkt entsprechen, wodurch die Genauigkeit und
Zuverlässigkeit der Analyse verbessert wird.
In einer beispielhaften Ausführungsform wird das dreidimensionale Abbildungsmodul 13 außerdem verwendet, um den synchronisierten Datenstrom mittels einer neuronalen
Strahlungsfeldtechnik in den 3D-Raum abzubilden, um ein 3D-Voxelfeld zu erhalten, das räumliche Informationen und Echtzeitdaten von den Sensoren enthält.
Optional ist das neuronale Strahlungsfeld eine Methode zur Darstellung einer dreidimensionalen Szene mit einem neuronalen Netz. Die Kernidee besteht darin, jedem Punkt im 3D-Raum (dargestellt durch 3D-Koordinaten) einen entsprechenden Farb- und Dichtewert zuzuordnen. Vereinfacht ausgedrückt, sagt das neuronale Strahlungsfeld für jeden Punkt im 3D-
Raum die Farbe des Punktes sowie die Absorption und Streuung des Lichts an diesem Punkt (ausgedrückt in der Dichte) voraus.
Zum Trainieren des neuronalen Strahlungsfeldmodells wird folgender Prozess verwendet:
Daten-Sampling: Aus dem synchronisierten Datenstrom werden Bilddaten aus verschiedenen
Blickwinkeln und die entsprechenden Kamerapositionsinformationen ausgewählt. Diese
Bilddaten zeigen, wie die Pico-Ball-Bewegungsszene aus verschiedenen Blickwinkeln aussieht, und die Kamerapositionsinformationen geben die Position und Ausrichtung der Kamera im 3D-
Raum an.
Konstruktion eines neuronalen Netzes: Ein mehrschichtiges Perzeptron (MLP) wird als neuronales Strahlungsfeldmodell konstruiert. Die Eingaben für dieses neuronale Netz sind die
Koordinaten eines Punktes im 3D-Raum und die Beobachtungsrichtung, und die Ausgaben sind die Farbe und die Dichte des Punktes.
Modelltraining: Das neuronale Netz wird trainiert, indem die Differenz (Verlustfunktion) zwischen der vorhergesagten Farbe und der tatsächlichen Bildfarbe minimiert wird. Während des
Trainingsprozesses werden die Parameter des neuronalen Netzes kontinuierlich angepasst, damit das Modell die Farben und Dichten der Punkte im 3D-Raum genauer vorhersagen kann.
Ferner werden die Synchronisationsdaten der Kartierung in den 3D-Raum gestreamt.
Punktabfrage im 3D-Raum: Nach Abschluss des Trainings des neuronalen
Strahlungsfeldmodells werden für jedes Voxel (kleine kubische Einheit im 3D-Raum) im 3D-
Raum seine 3D-Koordinaten ermittelt.
Vorhersage von Farbe und Dichte: Geben Sie die 3D-Koordinaten des Voxels und die
Beobachtungsrichtung in das trainierte neuronale Strahlungsfeldmodell ein, und das Modell gibt die Farbe und Dichte des Voxels aus.
Konstruktion des 3D-Voxelfeldes: Auf der Grundlage der Farb- und Dichteinformationen jedes Voxels wird ein 3D-Voxelfeld konstruiert. Dieses 3D-Voxelfeld ist eine diskrete Darstellung der Pico-Ball-Bewegungsszene im 3D-Raum, wobei jedes Voxel Farb- und Dichteinformationen enthält und auch räumliche Informationen aus den Echtzeit-Sensordaten einbezieht.
Bei der Konstruktion des 3D-Voxelfeldes werden die Echtzeitdaten der Sensoren in déi/601292 synchronisierten Datenstrom integriert. So werden beispielsweise die Informationen zur
Ballposition und -geschwindigkeit dem Voxel zugeordnet, in dem sich der Ball im 3D-Voxelfeld befindet, und die Informationen zur Bewegung des Spielers werden dem Voxelbereich zugeordnet, in dem sich der Spieler befindet. Auf diese Weise enthält das 3D-Voxelfeld räumliche
Informationen und Sensor-Echtzeitdaten, die die Tischtennisball-Bewegungsszene umfassender und genauer beschreiben können.
In einer beispielhaften Ausführungsform wird das dreidimensionale Abbildungsmodul 13 außerdem verwendet, um: falls ein 3D-Voxelfeld eines verdeckten Bereichs erkannt wird, den
Voxelbewegungstrend des verdeckten Bereichs auf der Grundlage der optischen Flussmethode vorherzusagen und die Voxelfeldänderungen benachbarter Frames unter Verwendung der zeitlichen Konsistenzbeschränkung zu glätten.
Optional überwacht das dreidimensionale Abbildungsmodul 13 kontinuierlich die erzeugten 3D-Voxelfelder. Das Voxelfeld ist eine diskrete Darstellung des 3D-Raums, so als ob der gesamte
Raum in kleine Quadrate (Voxel) unterteilt wäre, und jedes Voxel hat seine entsprechenden
Attributinformationen. In der realen Tischtennisszene kann es vorkommen, dass der Ball durch einen Spieler, einen Schläger oder andere Objekte verdeckt wird. Das Modul bestimmt, ob eine
Verdeckungsregion vorliegt, indem es die Eigenschaftsänderungen und räumlichen Beziehungen der einzelnen Voxel im Voxelfeld analysiert. Wenn beispielsweise die Voxelinformationen in einem bestimmten Bereich plötzlich abnormal fehlen oder die Kontinuität mit den umliegenden
Voxeln unterbrochen ist, kann dieser Bereich als verdeckt eingestuft werden.
Prinzip der Methode des optischen Flusses: Der optische Fluss beschreibt die Tendenz von
Pixeln, ihren Grauwert zu ändern, die durch die Bewegung von Objekten in einem Bild verursacht wird. In einer Szene mit 3D-Voxelfeldern kann er mit der Bewegungstendenz von Voxeln gleichgesetzt werden. Die Optical-Flow-Methode berechnet die Bewegungsrichtung und - geschwindigkeit jedes Voxels zwischen Einzelbildern durch Analyse der Voxelfeldinformationen benachbarter Einzelbilder. Konkret vergleicht die Plattform die Attribute (z. B. Farbe, Dichte usw.) der Voxel an den entsprechenden Positionen in den Voxelfeldern der beiden benachbarten Frames und leitet aus den Änderungen dieser Attribute die Bewegung des Voxels ab.
Für eine erkannte verdeckte Region kann, da die Voxelinformationen der Region im aktuellen
Bild unvollständig sein können, die Methode des optischen Flusses verwendet werden, um die
Bewegung der Voxel in der verdeckten Region auf der Grundlage des Bewegungstrends der nicht verdeckten Voxel um die verdeckte Region herum vorherzusagen. Wenn sich beispielsweise die
Voxel um den verdeckten Bereich herum alle in eine bestimmte Richtung bewegen, kann davon ausgegangen werden, dass die Voxel innerhalb des verdeckten Bereichs einen ähnlichen
Bewegungstrend aufweisen. Auf diese Weise können die Position und der Zustand der Voxel innerhalb der verdeckten Region in den nachfolgenden Bildern grob geschätzt werden.
Zeitliche Konsistenz bedeutet, dass die Bewegung eines Objekts zwischen benachbarten
Frames kontinuierlich und gleichmäßig sein sollte, ohne plötzliche Sprünge oder drastische
Veränderungen. In einem 3D-Voxelfeld sollte die Bewegung von Voxeln ebenfalls diesem Prinzip folgen.
Mithilfe der zeitlichen Konsistenzbeschränkung passt die Plattform die Änderungen des
Voxelfelds in benachbarten Frames an. Dies geschieht durch Überprüfung und Korrektur dieser
Vorhersagen, nachdem die Bewegungstrends der Voxel in der verdeckten Region auf der
Grundlage der optischen Flussmethode vorhergesagt wurden. Wenn sich herausstellt, dass die vorhergesagte Bewegung eines Voxels zu sehr vom Bewegungszustand benachbarter Voxel ode}/601292 des vorherigen Bildes abweicht, wird sie geglättet. Beispielsweise kann ein gewichteter Mittelwert verwendet werden, um die vorhergesagte Position des Voxels mit den Bewegungstrends der benachbarten Voxel und der Position des vorherigen Bildes zu kombinieren, um eine neue Position zu erhalten, die mit der Zeit besser übereinstimmt. Auf diese Weise kann die Veränderung des
Voxelfeldes zwischen benachbarten Bildern natürlicher und glatter gestaltet werden, so dass
Diskontinuitäten oder abrupte Veränderungen vermieden werden.
In einer beispielhaften Ausführungsform wird das Merkmalsverarbeitungsmodul 14 weiterhin verwendet, um: räumlich-zeitliche Merkmale des Videos in den historischen
Trajektorieninformationen des 3D-Voxelfeldes und der Pikokugel unter Verwendung eines 3D-
CNN zu extrahieren; zeitliche IMU-Merkmale in den historischen Trajektorieninformationen des 3D-Voxelfeldes und der Pikokugel unter Verwendung eines Transformators zu kodieren; sowie die dynamische Zuweisung modaler Gewichte durch einen Multiskalen-
Aufmerksamkeitsmechanismus, um einen kontextuellen Merkmalsvektor zu erzeugen, der die räumlich-zeitliche Information enthält.
Optional wird das 3D-Convolutional Neural Network (3D CNN) auf der Grundlage des traditionellen 2D-Convolutional Neural Network entwickelt, das in der Lage ist, Daten sowohl in räumlicher als auch in zeitlicher Dimension zu verarbeiten. Im traditionellen 2D-CNN führt der
Faltungskern eine gleitende Faltungsoperation nur auf der zweidimensionalen Ebene des Bildes durch, während der Faltungskern des 3D-CNN im dreidimensionalen Raum (Länge, Breite und
Zeit) gleitend sein kann. Die zu verarbeitende Objekte sind hier das 3D-Voxelfeld und die
Videodaten in den historischen Trajektorieninformationen des Pico-Balls. Das 3D-Voxelfeld wird durch Diskretisierung der Darstellung des 3D-Raums gewonnen, und die Videodaten enthalten
Informationen über die kontinuierliche Veränderung der Bewegung des Pikoballs in der Zeit. 3D CNN führt eine Merkmalsextraktion aus den eingegebenen Videodaten durch mehrere
Faltungsschichten, Pooling-Schichten und andere Operationen durch. Der Faltungs-Kernel in der
Faltungsschicht gleitet im 3D-Raum, um lokale Merkmale an verschiedenen Orten und zu verschiedenen Zeitpunkten zu extrahieren. Die Pooling-Schicht wiederum kann eine
Dimensionalitätsreduktion der extrahierten Merkmale durchführen, um die Datenmenge zu verringern und gleichzeitig wichtige Informationen zu erhalten. Nach der mehrschichtigen
Verarbeitung kann der 3D-CNN die räumlich-zeitlichen Merkmale in den Videodaten erlernen, wie z. B. die räumlichen und zeitlichen Muster der Flugbahn des Balls und die
Bewegungsänderungen des Spielers.
Transformer ist ein Deep-Learning-Modell, das auf dem Aufmerksamkeitsmechanismus basiert und besonders für die Verarbeitung von Sequenzdaten geeignet ist. Es ist in der Lage, die
Abhängigkeiten zwischen verschiedenen Elementen in einer Sequenz durch den Mechanismus der
Selbstaufmerksamkeit zu erfassen, und kann parallel berechnet werden, um die
Verarbeitungseffizienz zu verbessern. Hier werden wir die IMU (Inertial Measurement Unit)-
Zeitreihendaten in den historischen Trajektorieninformationen des 3D-Voxelfelds und des Pico-
Balls verarbeiten. Die IMU kann die Beschleunigung, die Winkelgeschwindigkeit und andere
Informationen des Objekts messen, die sich mit der Zeit ändern und eine Zeitreihe bilden.
Das Transformer-Modell nimmt die IMU-Zeitreihendaten als Eingabe und transformiert zunächst jedes Element in der Eingabesequenz in einen Vektor mit fester Dimension, indem es seine Darstellung einbettet. Anschließend kann das Modell durch einen Mechanismus der
Selbstbeobachtung mit mehreren Köpfen die Korrelationsgewichte zwischen jedem Element in der Sequenz und den anderen Elementen berechnen und so die Abhängigkeiten über groß&/601292
Entfernungen in der Sequenz erfassen. Anschließend werden diese gewichteten Merkmale nach
Operationen wie neuronalen Feed-Forward-Netzwerken weiter transformiert und verarbeitet, um schließlich die kodierten IMU-Zeitserienmerkmale zu erhalten.
Der Multiskalen-Attention-Mechanismus ermöglicht es dem Modell, sich auf verschiedene
Teile der Eingabedaten in verschiedenen Maßstäben zu konzentrieren, wodurch eine umfassendere
Erfassung der Datenmerkmale ermöglicht wird. In diesem Szenario gibt es zwei verschiedene
Modalitäten von Daten, die räumlich-zeitlichen Merkmale des Videos und die zeitlichen Merkmale der IMU, die jeweils Informationen über verschiedene Aspekte der Bewegung des Tischtennisballs enthalten.
Der Multi-Skalen-Aufmerksamkeitsmechanismus weist den =… Raum-zeitlichen
Videomerkmalen und den zeitlichen IMU-Merkmalen je nach den Besonderheiten der
Eingabedaten dynamisch unterschiedliche Gewichtungen zu. Beispielsweise können die
Videodaten in manchen Momenten die Position und Bewegungsrichtung des Balls besser widerspiegeln, so dass die Gewichtung der raum-zeitlichen Videomerkmale bei der Erstellung der kontextuellen Merkmalsvektoren relativ größer ist, während die IMU-Daten in anderen Momenten die Stärke und Geschwindigkeit des Schlägerschwungs besser widerspiegeln können, so dass die
Gewichtung der zeitlichen IMU-Merkmale zu dieser Zeit erhöht wird. Durch diese dynamische
Zuweisung von Gewichten kann das Modell die Dateninformationen der verschiedenen Modi besser synthetisieren.
In dieser Ausführungsform werden nach der Zuordnung von Gewichtungen zu den räumlich- zeitlichen Videomerkmalen und den zeitlichen IMU-Merkmalen durch den Multiskalen-
Aufmerksamkeitsmechanismus die beiden Merkmale entsprechend ihrer jeweiligen Gewichtung gewichtet und verschmolzen. Der fusionierte Merkmalsvektor enthält räumliche und zeitliche
Informationen in den Videodaten und zeitliche Informationen in den IMU-Daten und bildet so einen kontextuellen Merkmalsvektor mit räumlich-zeitlichen Informationen. Dieser kontextbezogene Merkmalsvektor kann den Zustand und die Eigenschaften der
Tischtennisballbewegung umfassender und genauer beschreiben und liefert reichhaltigere
Informationen für die anschließende Analyse und Entscheidungsfindung.
In einer beispielhaften Ausführungsform wird das Merkmalsverarbeitungsmodul 14 bei der dynamischen Zuweisung von Modalgewichten über einen Multiskalen-Attention-Mechanismus außerdem verwendet, um: die Gewichte dynamisch auf der Grundlage der Zuverlässigkeit verschiedener Datenquellen anzupassen; oder die Gewichte auf der Grundlage von
Szeneneigenschaften anzupassen; oder die Gewichte dynamisch auf der Grundlage der Zeit zu gewichten.
Es ist verständlich, dass die Zuverlässigkeit der verschiedenen Datenquellen (z. B. Video,
IMU, Radar usw.) in verschiedenen Szenarien unterschiedlich ist. Die Zuverlässigkeit kann durch
Faktoren wie Umgebungsstörungen, Sensorausfälle, Signalverluste usw. beeinträchtigt werden.
Um Daten aus mehreren Quellen effektiver zu fusionieren, muss die Gewichtung jeder Datenquelle bei der Merkmalsfusion entsprechend ihrer Zuverlässigkeit dynamisch angepasst werden.
Datenquellen mit hoher Zuverlässigkeit sollten in der endgültigen Merkmalsdarstellung mehr
Gewicht erhalten, während Datenquellen mit geringer Zuverlässigkeit weniger Gewicht erhalten sollten.
Nehmen wir an, es gibt zwei Datenquellen: Video und IMU. Die Videodatenquelle kann bei guter Beleuchtung und unter ungehinderten Bedingungen genaue visuelle Informationen liefern,
aber ihre Zuverlässigkeit ist geringer, wenn die Beleuchtung unzureichend oder das Ziel verdeckt/601292 ist. Die IMU hingegen kann Echtzeitinformationen über die Beschleunigung und die
Winkelgeschwindigkeit des Objekts liefern, was zuverlässiger ist, wenn der Bewegungszustand stabil ist, aber die Daten können verzerrt werden, wenn sie starken Vibrationen oder
Magnetfeldstorungen ausgesetzt sind.
Bei Videodatenquellen kann die Zuverlässigkeit durch Berechnung der Klarheit des Bildes, der Anzahl der übereinstimmenden Merkmalspunkte und der Stabilität bewertet werden. So kann beispielsweise ein Schwellenwert für die Bildschärfe festgelegt werden, und wenn die Bildschärfe unter dem Schwellenwert liegt, wird die Zuverlässigkeit der Videodatenquelle als vermindert angesehen. Bei IMU-Datenquellen kann die Zuverlässigkeit anhand der Varianz ihrer Messungen beurteilt werden; je größer die Varianz, desto instabiler und weniger zuverlässig sind die Daten.
Nehmen wir an, dass der Zuverlässigkeitswert der Video-Datenquelle 0,8 und der
Zuverlässigkeitswert der IMU-Datenquelle 0,6 ist. Um die normalisierten Gewichte zu erhalten, wird der Zuverlässigkeitswert jeder Datenquelle durch die Summe der Zuverlässigkeitswerte aller
Datenquellen geteilt. Das heißt, die Gewichtung der Video-Datenquelle ist 0,8 — (0,8 + 0,6) = 0,57 und die Gewichtung der IMU-Datenquelle ist: 0,6 + (0,8 + 0,6) = 0,43;
Angenommen, der aus der Videodatenquelle extrahierte Merkmalsvektor ist Fvideo und der aus der IMU-Datenquelle extrahierte Merkmalsvektor ist Fımv, dann ist der fusionierte
Merkmalsvektor Fmerged:
EE
Es ist verständlich, dass verschiedene Szenarien in unterschiedlichem Maße auf verschiedene
Datenquellen angewiesen sind. So kann in einigen Szenarien eine bestimmte Datenquelle kritischere und genauere Informationen liefern, während Informationen aus anderen Datenquellen relativ unbedeutend sein können. Daher muss die Gewichtung der verschiedenen Datenquellen entsprechend den Merkmalen des aktuellen Szenarios angepasst werden, um die Vorteile der einzelnen Datenquellen voll auszuschôpfen.
Betrachten wir zum Beispiel das Szenario einer Pico-Ball-Bewegung, in dem die folgenden unterschiedlichen Szenarien existieren können;
Szenario mit deutlich sichtbarem Ball und gleichmäßiger Bewegung: In diesem Szenario kann die Videodatenquelle reichhaltige visuelle Informationen liefern, wie z. B. die Position, die
Flugbahn und die Lage des Balls, so dass das Gewicht der Videodatenquelle höher sein sollte. Es wird angenommen, dass das Gewicht der Videodatenquelle auf 0,7 und das Gewicht der IMU-
Datenquelle auf 0,3 gesetzt wird.
Szenario mit verdecktem Ball: Wenn der Ball von einem Spieler, einem Schläger oder anderen Objekten verdeckt wird, kann die Videodatenquelle möglicherweise keine genauen
Informationen über die Ballposition erhalten, während die IMU-Datenquelle indirekt auf die
Ballbewegung schließen kann, indem sie den Bewegungsstatus des Schlägers oder des Spielers misst; zu diesem Zeitpunkt sollte das Gewicht der IMU-Datenquelle erhöht werden. Setzen Sie zum Beispiel die Gewichtung der Videodatenquelle auf 0,2 und die Gewichtung der IMU-
Datenquelle auf 0,8.
Szenarien mit schnellen Bewegungen: Wenn sich der Ball schnell bewegt, kann die IMU-
Datenquelle die Beschleunigung und die Winkelgeschwindigkeitsänderungen des Objekts in
Echtzeit erfassen und so dynamische Informationen mit hoher Frequenz liefern, während die
Videodatenquelle aufgrund der begrenzten Bildrate oder Bewegungsunschärfe einige Details verlieren kann. Daher kann das Gewicht der IMU-Datenquelle in Szenarien mit schnellen 601292
Bewegungen angemessen erhöht werden, z. B. 0,3 für die Videodatenquelle und 0,7 für die IMU-
Datenquelle.
Es ist verständlich, dass sich die Bedeutung der verschiedenen Datenquellen zu unterschiedlichen Zeitpunkten ändern kann. So kann beispielsweise in der Anfangsphase eines
Ereignisses eine bestimmte Datenquelle wichtige Informationen schneller erfassen, während in späteren Phasen andere Datenquellen möglicherweise wertvollere Informationen liefern. Daher muss die Gewichtung der verschiedenen Datenquellen im Laufe der Zeit dynamisch angepasst werden.
Nehmen wir den Schlagvorgang beim Tischtennis als Beispiel: Phase vor dem Schlag:
Während sich die Spieler auf den Schlag vorbereiten, können Videodatenquellen dabei helfen, die
Körperhaltung, den Stand und die Ballposition der Spieler zu beobachten, die wichtige
Informationen für die Vorhersage des Schlagvorgangs liefern. Daher kann in dieser Phase das
Gewicht der Videodatenquelle auf 0,6 und das Gewicht der IMU-Datenquelle auf 0,4 gesetzt werden.
Moment des Treffens: Im Moment des Treffens des Balls kann die IMU-Datenquelle die
Beschleunigung und die Winkelgeschwindigkeitsänderung des Schlägers genauer messen, was die
Stärke und Richtung des Treffens des Balls widerspiegelt. Zu diesem Zeitpunkt sollte das Gewicht der IMU-Datenquelle deutlich erhöht werden, z. B. beträgt das Gewicht der Videodatenquelle 0,2 und das Gewicht der IMU-Datenquelle 0,8.
Phase nach dem Schlag: Nach dem Schlag tritt der Ball in den Flugzustand ein, und die
Videodatenquelle kann die Flugbahn des Balls besser verfolgen, während die Rolle der IMU-
Datenquelle relativ geschwächt ist. Daher kann in dieser Phase das Gewicht der Videodatenquelle auf 0,7 wiederhergestellt werden, und das Gewicht der IMU-Datenquelle wird auf 0,3 gesetzt.
In dieser Ausführungsform können die Informationen aus den verschiedenen Datenquellen durch ständiges dynamisches Anpassen der Gewichte entsprechend der Zeit genauer fusioniert werden, um die Genauigkeit und Wirksamkeit der Merkmalsdarstellung zu verbessern.
In einer beispielhaften Ausführungsform wird das Datenerfassungsmodul 11 außerdem verwendet, um: automatisch in einen Trajektorienschätzungsmodus der IMU-Videostromfusion umzuschalten, wenn eine Radarverdeckungswahrscheinlichkeit erkannt wird, die größer als ein
Zielschwellenwert ist, und um anfängliche Trajektorieninformationen des Pico-Balls zu erzeugen.
Optional wird die Wahrscheinlichkeit, dass das Ziel verdeckt ist, dynamisch durch die
Analyse der Qualität des Radarsignals bewertet: Signalstärkeanalyse: Berechnung des
Dämpfungswerts des Radarechosignals, und wenn die Signalstärke einer Reihe von aufeinanderfolgenden Bildern unter einem festgelegten Schwellenwert liegt, wird davon ausgegangen, dass die Möglichkeit einer Verdeckung besteht. Berechnung der Punktwolkendichte:
Zählen der Anzahl der Radarpunktwolken pro Volumeneinheit; wenn die Punktwolkendichte abnimmt und unter dem normalen Bereich liegt, wird dies als Verdeckung gewertet. Modell für maschinelles Lernen: Training von Klassifizierern (z. B. Random Forest), Eingabe von
Radarpunktwolkenmerkmalen (z. B. Verteilungsvarianz, Zeitreihenvariation) und Ausgabe der
Verdeckungswahrscheinlichkeit.
Wenn das Radar beispielsweise eine 60 %ige Abnahme der Punktwolkendichte und eine 5 dB-Abnahme der Signalstärke in drei aufeinanderfolgenden Bildern feststellt, wird die
Verdeckungswahrscheinlichkeit wie folgt berechnet: Konfidenz = (1-(aktuelle
Punktwolkendichte/normale Punktwolkendichte)) x 0,6 + (Signaldämpfung/maximale Dämpfung)
x 0,4 = 0,75 (über der 70 %-Schwelle). LU601292
Der Algorithmus der komplementären Filterung wird verwendet, um zwei Arten von
Sensordaten zu fusionieren: IMU-Daten: Der Bewegungszustand (Position, Geschwindigkeit,
Lage) wird durch Integration von Beschleunigung und Winkelgeschwindigkeit ermittelt, aber es gibt einen kumulativen Fehler. Videodaten: Die Zielposition wird durch die optische Flussmethode oder die Verfolgung von Merkmalspunkten erfasst, die durch die Bildrate begrenzt ist, aber nicht driftet.
Fusionsformel:
Dabei ist @ ein dynamischer Anpassungskoeffizient (0,3-0,7), der je nach Qualität der
Videoverfolgung (z. B. Anzahl der Merkmalspunkte, Trefferquote) adaptiv angepasst wird.
Beispiel: Wenn das Video auf 15 stabile Merkmalspunkte verfolgt wird, wird a auf 0,4 gesetzt:
Fusionsposition = 0,4 x (IMU-Position + 0,1 s integrale Verschiebung) + 0,6 x
Videoerkennungsposition
Bewegungsmodellierung auf der Grundlage der fusionierten Daten: polynomielle Anpassung: dreimalige polynomielle Anpassung der letzten 5 Bilder unter Verwendung der Methode der kleinsten Quadrate zur Vorhersage künftiger Flugbahnen. Physikalische Modellierung:
Kombination aerodynamischer Formeln und Berechnung der Flugbahn auf der Grundlage der von der IMU gemessenen Beschleunigung.
Die Gleichungen für die Flugbahn werden beispielsweise durch Polynom-Anpassung ermittelt: sit} = at bt ot dd
Die Koeffizienten a,b,c,d werden durch die Lösung der verschmolzenen Positionsdaten ermittelt und zur Vorhersage der Ballbahn in den nächsten 0,5 Sekunden verwendet.
Der obige Prozess ist:
Das Radar erkennt mit 75%iger Sicherheit eine Verdeckung;
Das System schaltet automatisch in den IMU-Videofusionsmodus;
Das Fusionsmodul verarbeitet 100 Hz an IMU-Daten und 30 Hz an Videodaten pro Sekunde;
Die fusionierten Positionsdaten werden durch einen komplementären Filteralgorithmus erzeugt;
An den fusionierten Daten wird eine polynomielle Anpassung vorgenommen, um die anfängliche Flugbahn zu erzeugen;
Der Fehler bei der Vorhersage der Flugbahn liegt innerhalb von 0,1 Metern (Labortestdaten).
Die technischen Merkmale der obigen Ausführungsformen können in beliebiger Weise kombiniert werden, und um die Beschreibung kurz zu halten, wurden nicht alle möglichen
Kombinationen der technischen Merkmale der obigen Ausführungsformen beschrieben; solange es Jedoch keinen Widerspruch in der Kombination dieser technischen Merkmale gibt, sollten sie als innerhalb des Anwendungsbereichs der vorliegenden Anmeldung liegend betrachtet werden.
Die oben beschriebenen Ausführungsformen drücken nur einige Ausführungsformen der vorliegenden Anmeldung aus, die in einer spezifischeren und detaillierteren Weise beschrieben werden, sind aber nicht als Einschränkung des Umfangs des Patents der vorliegenden Anmeldung zu verstehen. Es sollte darauf hingewiesen werden, dass für eine Person mit gewöhnlichem
Fachwissen auf dem Gebiet der Technik mehrere Abwandlungen und Verbesserungen vorgenommen werden können, ohne von der Konzeption der vorliegenden Anmeldurkg/601292 abzuweichen, die alle in den Schutzbereich der vorliegenden Anmeldung fallen.
Der Schutzbereich der vorliegenden Anmeldung wird daher durch die beigefügten Ansprüche bestimmt.

Claims (10)

Ansprüche LU601292
1. Eine Plattform zur Analyse von Pickleball-Sportdaten, dadurch gekennzeichnet, dass die Plattform umfasst: Ein Datenerfassungsmodul zum Erzeugen von anfänglichen Trajektorieninformationen eines Pico-Balls auf der Grundlage von Echtzeitsensordaten des Pico-Balls; wobei die Echtzeitsensordaten des Pico-Balls eine Inertialmesseinheit IMU-Winkelgeschwindigkeit des Pico-Balls, eine anfängliche Trajektorie eines Videostroms und Radarentfernungsdaten umfassen; Ein Datenausrichtungsmodul zum Ausrichten der Sensor-Echtzeitdaten des Pico-Balls in einer Zeitdimension, indem der Zeitstempel der anfänglichen Trajektorieninformation des Pico- Balls als eine Zeitbasis genommen wird, um einen synchronisierten Datenstrom zu erhalten; Ein dreidimensionales Abbildungsmodul zum Abbilden des synchronisierten Datenstroms in einem dreidimensionalen Raum, um ein dreidimensionales Voxelfeld zu erhalten, das räumliche Informationen und die Sensor-Echtzeitdaten enthält; Ein Merkmalsverarbeitungsmodul zum Erzeugen eines kontextbezogenen Merkmalsvektors, der räumlich-zeitliche Informationen auf der Grundlage des dreidimensionalen Voxelfeldes und historischer Flugbahninformationen des Pico-Balls enthält; Ein Analyse- und Vorhersagemodul zum Erzeugen vorhergesagter Flugbahninformationen eines Pico-Balls auf der Grundlage des kontextbezogenen Merkmalsvektors.
2. Die Plattform nach Anspruch 1, dadurch gekennzeichnet, dass das Datenerfassungsmodul ferner verwendet wird, um: Erzeugen von Rohdaten über die Flugbahn des Pucks auf der Grundlage von Echtzeitdaten von den Sensoren des Pucks unter Verwendung von Newton-Euler-Gleichungen; Lösen der Magnus-Kraft- und -Widerstandskoeffizienten und der Hertz'schen Kontakttheorie, dynamisches Optimieren des Schläger-Ball-Kollisionsimpulsmodells unter Verwendung der differenzierbaren hydrodynamischen Gleichungen, Optimieren der ursprünglichen Flugbahninformation und Erhalten der anfänglichen Flugbahninformation des Pikoballs, wobei die anfängliche Flugbahninformation aerodynamische Kompensationsgrößen umfasst.
3. Die Plattform nach Anspruch 2, dadurch gekennzeichnet, dass das Datenerfassungsmodul weiterhin verwendet wird, um: Dynamisches Optimieren des Schläger-Ball-Kollisionsimpulsmodells unter Verwendung der Hertz‘schen Kontakttheorie und Analysieren der von der IMU erfassten Schwungwinkelgeschwindigkeit, Nachkollisionsgeschwindigkeit und Drehwinkeländerungen, um den Kollisionsimpuls zu erhalten; Iteratives Optimieren eines Reibungskoeffizienten auf der Grundlage des Kollisionsimpulses und multimodaler Datenreste, um einen aktualisierten Kollisionsimpulsparameter zu erhalten; Optimieren der ursprünglichen Trajektorieninformation gemäß den aktualisierten Kollisionsimpulsparametern.
4. Die Plattform nach Anspruch 1, dadurch gekennzeichnet, dass der kontextuelle Merkmalsvektor räumliche Informationen, zeitliche Informationen, semantische Informationen und physikalische Informationen umfasst; Die räumlichen Informationen umfassen: dreidimensionale Koordinaten von Ball/Schläger/Spieler, relative Entfernungen von Ball und Schläger/Spieler, Abmessungen von Ball/Schläger und Bewegungsbereich des Spielers, Die zeitlichen Informationen umfassen:
Ballgeschwindigkeit/Schlägergeschwindigkeit/Spieler-Bewegungsgeschwindigkeit, Ball/ Spieldr601 292 Beschleunigung, historische Bewegungsbahnsequenz, Semantische Informationen: Objektkategorie (Ball/Schläger/Spieler/Grenze), Spieleraktion (Art des Schlags/Bewegung), Spielphase/Spielstand, Physikalische Informationen, darunter: Richtung/Geschwindigkeit der Ballrotation, Zeitpunkt/Position/Kraft der Kollision, Umgebungsinformationen, darunter: Platzart/Material/Beleuchtung, Anzahl/Verteilung der Zuschauer/emotionaler Zustand.
5. Die Plattform nach Anspruch 1, dadurch gekennzeichnet, dass das Datenausrichtungsmodul ferner verwendet wird, um: Im Falle des Erkennens einer plötzlichen Änderung der Winkelgeschwindigkeit der IMU im Moment des Auftreffens des Balls die optische Flussinterpolation und die Kalman-Filterung zu kombinieren, um die Taktdrift zu kompensieren, die anfängliche Trajektorieninformation des Pico- Balls als Zeitreferenz zu verwenden, die Sensor-Echtzeitdaten des Pico-Balls in einer Zeitdimension auszurichten und einen synchronisierten Datenstrom zu erhalten.
6. Die Plattform nach Anspruch 1, dadurch gekennzeichnet, dass das 3D-Abbildungsmodul weiterhin dazu verwendet wird, um: Abbilden des synchronisierten Datenstroms in einen dreidimensionalen Raum mittels einer neuronalen Strahlungsfeldtechnik, um ein dreidimensionales Voxelfeld zu erhalten, das räumliche Informationen und die Sensor-Echtzeitdaten enthält.
7. Die Plattform nach Anspruch 6, dadurch gekennzeichnet, dass das 3D-Mapping-Modul ferner verwendet wird, um: Im Falle der Erkennung des Vorhandenseins eines dreidimensionalen Voxelfeldes einer verdeckten Region, Vorhersage des Voxelbewegungstrends der verdeckten Region auf der Grundlage des optischen Flussverfahrens und Glättung der Voxelfeldänderungen benachbarter Frames unter Verwendung von Zeitkonsistenzbeschrankungen.
8. Die Plattform nach Anspruch 1, dadurch gekennzeichnet, dass das Merkmalsverarbeitungsmodul ferner dazu dient: Einsatz eines 3D-CNN, um räumlich-zeitliche Merkmale eines Videos in dem 3D-Voxelfeld und historische Flugbahninformationen des Pico-Balls zu extrahieren; Einsatz eines Transformators, um raum-zeitliche IMU-Merkmale in dem 3D-Voxelfeld und historische Flugbahninformationen des Pico-Balls zu kodieren; und, Dynamisches ~~ Zuweisen von Modalgewichten über einen Multiskalen- Aufmerksamkeitsmechanismus, um einen kontextuellen Merkmalsvektor zu erzeugen, der die raumlich-zeitlichen Informationen enthält.
9. Die Plattform nach Anspruch 8, wobei das Merkmalsverarbeitungsmodul bei der dynamischen Zuweisung von Modalgewichten durch einen Multiskalen-Achtungsmechanismus ferner dazu verwendet wird, um: Dynamisches Anpassen der Gewichte entsprechend der Zuverlässigkeit verschiedener Datenquellen, oder, Anpassen der Gewichte entsprechend der Eigenschaften der Szene, oder, dynamisches Gewichten der Gewichte entsprechend der Zeit.
10. Die Plattform nach Anspruch 1, dadurch gekennzeichnet, dass das Datenerfassungsmodul ferner dazu dient: Automatisches Umschalten auf einen Trajektorienschätzungsmodus der IMU- Videostromfusion, um anfängliche Trajektorieninformationen des Pico-Balls zu erzeugen, wenn eine Radarverdeckungswahrscheinlichkeit erkannt wird, die größer als ein Zielschwellenwert js} V601 292
LU601292A 2025-04-23 2025-04-23 Eine Plattform zur Analyse von Pickleball-Sportdaten LU601292B1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
LU601292A LU601292B1 (de) 2025-04-23 2025-04-23 Eine Plattform zur Analyse von Pickleball-Sportdaten

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
LU601292A LU601292B1 (de) 2025-04-23 2025-04-23 Eine Plattform zur Analyse von Pickleball-Sportdaten

Publications (1)

Publication Number Publication Date
LU601292B1 true LU601292B1 (de) 2025-10-23

Family

ID=97406144

Family Applications (1)

Application Number Title Priority Date Filing Date
LU601292A LU601292B1 (de) 2025-04-23 2025-04-23 Eine Plattform zur Analyse von Pickleball-Sportdaten

Country Status (1)

Country Link
LU (1) LU601292B1 (de)

Similar Documents

Publication Publication Date Title
US11755952B2 (en) System and method for predictive sports analytics using body-pose information
EP1864153B1 (de) Objektverfolgungs- und situationsanalysesystem
KR102880729B1 (ko) 다중 카메라 플레이어 추적을 통한 플레이어 궤적 생성
Fujimura et al. Geometric analysis and quantitative evaluation of sport teamwork
CN111444890A (zh) 一种基于机器学习的体育数据分析系统和方法
WO2017103270A1 (de) Verfahren und vorrichtung zur bewegungsanalyse eines sportgeräts
Suda et al. Prediction of volleyball trajectory using skeletal motions of setter player
CN111369629B (zh) 一种基于挥拍击球动作双目视觉感知的回球轨迹预测方法
US11087638B2 (en) System and method for analysing sports performance data
CN115100744A (zh) 一种羽毛球比赛人体姿态估计和球路追踪方法
DE102012022005A1 (de) Verfahren, Vorrichtung und System
US20250029387A1 (en) A System for Tracking, Locating and Calculating the Position of a First Moving Object in Relation to a Second Object
DE112019002043T5 (de) Dynamisches ermitteln einer zone
CN119579637A (zh) 一种匹克球运动轨迹追踪与战术决策辅助系统
EP3834171A1 (de) Spielverfolgung
LU601292B1 (de) Eine Plattform zur Analyse von Pickleball-Sportdaten
DE102012022038A1 (de) Verfahren, Vorrichtung und Programm
WO2020255948A1 (ja) プレイ分析装置、プレイ分析方法、及び、コンピュータプログラム
JP2020188979A (ja) プレイ分析装置、及び、プレイ分析方法
EP0486579B1 (de) Verfahren und vorrichtung zur bestimmung der optimalen wurf-, schuss- bzw. abspieltrainingsgeschwindigkeit bei wurfsportarten bzw. ballspielen
Li et al. Simulation of tennis serve behavior based on video image processing and wireless sensor technology
Yang Analysis of Badminton Motion Trajectory Algorithm Based on Neural Network
Iwashita et al. Evaluating Movement Initiation Timing in Ultimate Frisbee via Temporal Counterfactuals
CN121527685A (zh) 一种基于ai和图像分析的体育赛事训练预测方法和系统
Liu et al. Basketball trajectory tracking based on machine vision image

Legal Events

Date Code Title Description
FG Patent granted

Effective date: 20251023