DE102021207468A1 - Verfahren zur Kodierung einer Abfolge von Videobildern - Google Patents
Verfahren zur Kodierung einer Abfolge von Videobildern Download PDFInfo
- Publication number
- DE102021207468A1 DE102021207468A1 DE102021207468.5A DE102021207468A DE102021207468A1 DE 102021207468 A1 DE102021207468 A1 DE 102021207468A1 DE 102021207468 A DE102021207468 A DE 102021207468A DE 102021207468 A1 DE102021207468 A1 DE 102021207468A1
- Authority
- DE
- Germany
- Prior art keywords
- representation
- video images
- function
- sequence
- long section
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/42—Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/761—Proximity, similarity or dissimilarity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
Abstract
Verfahren (100) zur Kodierung einer vorgegebenen zeitlichen Abfolge x von Videobildern in eine maschinell auswertbare Repräsentation ξ = (ψ, ϕ) aus stationären Merkmalen ψ und nicht stationären Merkmalen ϕ, mit den Schritten:• es wird mindestens eine mit trainierbaren Parametern θ parametrisierte Funktion fθ(x̃) bereitgestellt (110), die Abfolgen x̃ von Videobildern auf Repräsentationen fθ(x̃) = ξ = (ψ, ϕ) abbildet;• aus der Abfolge x von Videobildern werden N aneinander angrenzende, nicht überlappende Kurzausschnittexs(1),…,xs(N)sowie ein Langausschnitt xl, der alle N Kurzausschnittexs(1),…,xs(N)enthält, ausgewählt (120);• mit der parametrisierten Funktion fθwerden eine Repräsentation fθ(xl) = ξl= (ψl, (ϕl) des Langausschnitts xlsowie mehrere Repräsentationenƒθ(xs(i))=ξs(i)=(ψs(i),ϕs(i))der Kurzausschnittexs(i)für i = 1,..., N ermittelt (130);• die parametrisierte Funktion fθwird mit einer vorgegebenen Kostenfunktion L dahingehend bewertet (140), inwieweit die Repräsentation ξl= (ψl, ϕl) des Langausschnitts xlim Hinblick auf mindestens eine vorgegebene Konsistenzbedingung im Einklang mit den Repräsentationenξs(i)=(ψs(i),ϕs(i))der Kurzausschnittexs(i)steht;• die Parameter θ der Funktion fθwerden optimiert (150) mit dem Ziel, dass sich die Bewertung der Kostenfunktion für künftig ermittelte Repräsentationen fθ(xl) = (ξl= (ψ, ϕl) undƒθ(xs(i))=ξs(i)=(ψs(i),ϕs(i))voraussichtlich verbessert;• mit der durch die fertig optimierten Parametern θ* parametrisierten Funktionƒθ∗wird die vorgegebene zeitliche Abfolge x von Videobildern auf die gesuchte Repräsentationƒθ∗(x)=ξ=(ψ,ϕ)abgebildet (160).
Description
- Die vorliegende Erfindung betrifft die Kodierung einer Abfolge von Videobildern in eine Repräsentation, die die nachgeschaltete maschinelle Auswertung erleichtert.
- Stand der Technik
- Beim Führen von Fahrzeugen im Straßenverkehr sind Beobachtungen des Fahrzeugumfelds eine wichtige Informationsquelle. Insbesondere das dynamische Verhalten anderer Verkehrsteilnehmer wird häufig aus einer Sequenz von Videobildern ausgewertet.
- Die
DE 10 2018 209 388 A1 offenbart ein Verfahren, mit dem aus Videobildern eine Region im Umfeld eines Fahrzeugs ermittelt werden kann, in der eine für die Fahrt und/oder Sicherheit dieses Fahrzeugs relevante Situation vorliegt. - Offenbarung der Erfindung
- Im Rahmen der Erfindung wurde ein Verfahren zur Kodierung einer vorgegebenen zeitlichen Abfolge x von Videobildern in eine Repräsentation ξ = (ψ, ϕ) aus stationären Merkmalen ψ und nicht stationären Merkmalen ϕ entwickelt. Eine derartige Repräsentation ist in Bezug auf viele nachgeschaltete Aufgaben maschinell weiter auswertbar. Die Verarbeitung der Abfolge x von Videobildern zu der Repräsentation ξ = (ψ, ϕ) ist somit ein Stück weit analog zur Verarbeitung von kohlenstoffhaltigen und wasserstoffhaltigen Chemierohstoffen zu einem Synthesegas, das wiederum als universeller Grundstoff zur Herstellung einer Vielzahl von Produkten genutzt werden kann.
- Im Rahmen des Verfahrens wird mindestens eine mit trainierbaren Parametern θ parametrisierte Funktion fθ (x̃) bereitgestellt, die Abfolgen x̃ von Videobildern auf Repräsentationen fθ (x̃) = ξ = (ψ, ϕ) abbildet. Diese Parameter θ werden anhand der vorgegebenen zeitlichen Abfolge x von Videobildern selbstüberwacht trainiert. Wenn die Parameter θ auf ihre endgültigen Werte θ* optimiert sind, liegt hiermit auch die Funktion fθ* fest, mit der die vorgegebene zeitliche Abfolge x von Videobildern auf die gesuchte Repräsentation
- Das selbstüberwachte Training beginnt damit, dass aus der Abfolge x von Videobildern N aneinander angrenzende, nicht überlappende Kurzausschnitte
- Die parametrisierte Funktion fθ wird mit einer vorgegebenen Kostenfunktion L dahingehend bewertet, inwieweit die Repräsentation (ξl = (ψl, (ϕl) des Langausschnitts xl im Hinblick auf mindestens eine vorgegebene Konsistenzbedingung im Einklang mit den Repräsentationen
- Der selbstüberwachte Charakter dieser Optimierung liegt darin, dass lediglich die mindestens eine Konsistenzbedingung zwischen der Repräsentation (ξl des Langausschnitts xl einerseits und den Repräsentationen
- Im Folgenden sind einige Beispiele für Konsistenzbedingungen sowie Beiträgen zur Kostenfunktion L, in denen sich diese Konsistenzbedingungen manifestieren können, angegeben. Diese Konsistenzbedingungen enthalten jeweils Ähnlichkeitsvergleiche zwischen Merkmalen des Langausschnitts xl einerseits und Merkmalen der Kurzausschnitte
-
- Hierin ist h eine vorgegebene Transformation, und τ ist ein Temperaturparameter für die Skalierung. Die Transformation h kann insbesondere beispielsweise eine gelernte Transformation sein.
- Die von der Kostenfunktion L gemessene Ähnlichkeit kann hierbei insbesondere jeweils ins Verhältnis zu Ähnlichkeiten gesetzt werden, die ein Vergleich der jeweiligen Merkmale
- Aus einer zufällig generierten Abfolge x̅l von Videobildern erzeugt die parametrisierte Funktion fθ eine Repräsentation ξneg = (ψneg, (ϕneg). Die für eine vorgegebene Menge zufällig generierter Abfolgen x̅l erhaltenen Repräsentationen ξneg lassen sich in einer Menge N zusammenfassen, wobei Nψ die Menge aller stationären Merkmale ψneg und Nϕ die Menge aller nicht stationären Merkmale ϕneg der Repräsentationen ξneg sind.
- In einer besonders vorteilhaften Ausgestaltung beinhaltet die mindestens eine Konsistenzbedingung, dass die stationären Merkmale ψl des Langausschnitts xl ähnlich zu den stationären Merkmalen
- In einer weiteren besonders vorteilhaften Ausgestaltung beinhaltet die mindestens eine Konsistenzbedingung, dass die nicht stationären Merkmale ϕl des Langausschnitts xl ähnlich zu einer mit einer Aggregationsfunktion g gebildeten Aggregation
n ist hn eine gelernte Transformation h, die speziell für die Untersuchung der nicht stationären Merkmale verwendet wird. - Die Aggregationsfunktion g kann insbesondere beispielsweise
- • eine Summierung, und/oder
- • eine lineare Abbildung, und/oder
- • eine Abbildung durch ein mehrschichtiges Perzeptron, MLP, und/oder
- • eine Abbildung durch ein rekurrentes neuronales Netzwerk, RNN, beinhalten.
- In einer weiteren besonders vorteilhaften Ausgestaltung misst die Kostenfunktion L zusätzlich die Ähnlichkeit zwischen der Repräsentation ξl des Langausschnitts xl einerseits und der hierzu korrespondierenden Repräsentation ξ̂l für eine semantisch inhaltsgleiche Abwandlung x̂l des Langausschnitts xl. Dies kann beispielsweise in einem Beitrag
i ist hi eine gelernte Transformation h, die speziell für die den Vergleich mit der semantisch inhaltsgleichen Abwandlung x̂l des Langausschnitts xl verwendet wird. - Die semantisch inhaltsgleiche Abwandlung x̂l kann insbesondere beispielsweise durch
- • Auswahl eines zufälligen Bildausschnitts und Zurückvergrößern auf die Originalgröße, und/oder
- • Spiegelung, und/oder
- • Farbveränderung
- Wie zuvor erläutert, ist die selbstüberwacht gelernte Repräsentation
- In einer weiteren vorteilhaften Ausgestaltung wird anhand der Repräsentation
- In einer weiteren vorteilhaften Ausgestaltung wird aus der Repräsentation
- Das Verfahren kann insbesondere ganz oder teilweise computerimplementiert sein. Daher bezieht sich die Erfindung auch auf ein Computerprogramm mit maschinenlesbaren Anweisungen, die, wenn sie auf einem oder mehreren Computern ausgeführt werden, den oder die Computer dazu veranlassen, das beschriebene Verfahren auszuführen. In diesem Sinne sind auch Steuergeräte für Fahrzeuge und Embedded-Systeme für technische Geräte, die ebenfalls in der Lage sind, maschinenlesbare Anweisungen auszuführen, als Computer anzusehen.
- Ebenso bezieht sich die Erfindung auch auf einen maschinenlesbaren Datenträger und/oder auf ein Downloadprodukt mit dem Computerprogramm. Ein Downloadprodukt ist ein über ein Datennetzwerk übertragbares, d.h. von einem Benutzer des Datennetzwerks downloadbares, digitales Produkt, das beispielsweise in einem Online-Shop zum sofortigen Download feilgeboten werden kann.
- Weiterhin kann ein Computer mit dem Computerprogramm, mit dem maschinenlesbaren Datenträger bzw. mit dem Downloadprodukt ausgerüstet sein.
- Weitere, die Erfindung verbessernde Maßnahmen werden nachstehend gemeinsam mit der Beschreibung der bevorzugten Ausführungsbeispiele der Erfindung anhand von Figuren näher dargestellt.
- Figurenliste
- Es zeigt:
-
1 Ausführungsbeispiel des Verfahrens 100 zur Kodierung einer Abfolge x von Videobildern in eine maschinell auswertbare Repräsentation ξ = (ψ, ϕ); -
2 Veranschaulichung des selbstüberwachten Lernens am Beispiel einer Szene 10 in einem chemischen Labor. -
1 ist ein schematisches Ablaufdiagramm eines Ausführungsbeispiels des Verfahrens 100 zur Kodierung einer Abfolge x von Videobildern in eine maschinell auswertbare Repräsentation ξ = (ψ, ϕ). - In Schritt 110 wird mindestens eine mit trainierbaren Parametern θ parametrisierte Funktion fϕ (x̃) bereitgestellt, die Abfolgen x̃ von Videobildern auf Repräsentationen fϕ (x̃) = ξ = (ψ, ϕ) abbildet.
- In Schritt 120 werden aus der vorgegebenen Abfolge x von Videobildern werden N aneinander angrenzende, nicht überlappende Kurzausschnitte
- In Schritt 130 werden mit der parametrisierten Funktion fθ eine Repräsentation fθ (xl) = (ξl = (ψl, (ϕl) des Langausschnitts xl sowie mehrere Repräsentationen
- In Schritt 140 wird die parametrisierte Funktion fθ mit einer vorgegebenen Kostenfunktion L dahingehend bewertet, inwieweit die Repräsentation ξl = (ψl, ϕl) des Langausschnitts xl im Hinblick auf mindestens eine vorgegebene Konsistenzbedingung im Einklang mit den Repräsentationen
-
- Gemäß Block 142 kann die mindestens eine Konsistenzbedingung beispielsweise beinhalten, dass die nicht stationären Merkmale ϕl des Langausschnitts xl ähnlich zu einer mit einer Aggregationsfunktion g gebildeten Aggregation
- • eine Summierung, und/oder
- • eine lineare Abbildung, und/oder
- • eine Abbildung durch ein mehrschichtiges Perzeptron, MLP, und/oder
- • eine Abbildung durch ein rekurrentes neuronales Netzwerk, RNN,
- Gemäß Block 143 kann die Kostenfunktion L beispielsweise zusätzlich die Ähnlichkeit zwischen der Repräsentation ξl des Langausschnitts xl einerseits und der hierzu korrespondierenden Repräsentation ξl für eine semantisch inhaltsgleiche Abwandlung x̂l des Langausschnitts xl messen. Hierbei kann gemäß Block 143a die semantisch inhaltsgleiche Abwandlung x̂l insbesondere beispielsweise durch
- • Auswahl eines zufälligen Bildausschnitts und Zurückvergrößern auf die Originalgröße, und/oder
- • Spiegelung, und/oder
- • Farbveränderung
- Gemäß Block 144 kann eine durch die Kostenfunktion L gemessene Ähnlichkeit jeweils ins Verhältnis zu Ähnlichkeiten gesetzt werden, die ein Vergleich der jeweiligen Merkmale
- Gemäß Block 145 kann mindestens eine Ähnlichkeit zwischen Merkmalen z1 und z2 mit einer Kosinusähnlichkeit gemessen werden.
-
- In Schritt 160 wird mit der durch die fertig optimierten Parametern θ* parametrisierten Funktion
-
-
-
-
- In Schritt 195 wird ein Fahrzeug 50, ein System 60 für die Qualitätskontrolle von Produkten, und/oder ein System 70 für die Überwachung von Bereichen, mit diesem Ansteuersignal 190a angesteuert.
-
2 verdeutlicht das zuvor beschriebene selbstüberwachte Lernen am Beispiel einer Szene 10 in einem chemischen Labor. -
- Die Szene 10 umfasst das Einfüllen zweier Substanzen 11a, 12a aus Reagenzgläsern 11, 12 in ein Becherglas 13 und die anschließende Reaktion der Substanzen 11a, 12a zu einem Produkt 14. Zu Beginn der Szene 10 wird das Reagenzglas 11 aufgenommen und sein Inhalt 11a in das Becherglas 13 gefüllt. Dann wird das leere Reagenzglas 11 wieder hingestellt. Als Nächstes wird das Reagenzglas 12 aufgenommen und sein Inhalt 12a ebenfalls in das Becherglas 13 gefüllt, wo er sich zunächst oberhalb der dort bereits befindlichen Substanz 11a als separate Schicht lagert. Das leere Reagenzglas 12 wird wieder hingestellt, und die zwei Substanzen 11a und 12a durchmischen sich im Becherglas 13, um zum Produkt 14 zu reagieren.
- Der stationäre Anteil s dieser Szene 10 ist, dass es überhaupt eine Laborszene mit zwei Reagenzgläsern 11 und 12 sowie einem Becherglas 13 gibt. Der nichtstationäre Anteil n besteht darin, dass die Reagenzgläser 11 und 12 aufgenommen, ihr jeweiliger Inhalt 11a bzw. 12a in das Becherglas 13 gefüllt wird und im Becherglas 13 die Reaktion zum Produkt 14 stattfindet.
-
-
- Der Kurzausschnitt
- Das zuvor beschriebene kontrastive Lernen belohnt es, wenn die Aggregation der nicht stationären Anteile n aller Kurzausschnitte
- Ebenso belohnt es das kontrastive Lernen, wenn der stationäre Anteil s, nämlich das grundsätzliche Vorhandensein zweier Reagenzgläser 11, 12, eines Becherglases 13 und einer gewissen Menge Chemikalien 11a, 12a bzw. 14, in allen Kurzausschnitten
- ZITATE ENTHALTEN IN DER BESCHREIBUNG
- Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
- Zitierte Patentliteratur
-
- DE 102018209388 A1 [0003]
Claims (15)
- Verfahren (100) zur Kodierung einer vorgegebenen zeitlichen Abfolge x von Videobildern in eine maschinell auswertbare Repräsentation ξ = (ψ, ϕ) aus stationären Merkmalen ψ und nicht stationären Merkmalen ϕ, mit den Schritten: • es wird mindestens eine mit trainierbaren Parametern θ parametrisierte Funktion fθ (x̃) bereitgestellt (110), die Abfolgen x̃ von Videobildern auf Repräsentationen fθ (x̃) = ξ = (ψ, ϕ) abbildet; • aus der Abfolge x von Videobildern werden N aneinander angrenzende, nicht überlappende Kurzausschnitte
- Verfahren nach
Anspruch 3 , wobei die Aggregationsfunktion g • eine Summierung, und/oder • eine lineare Abbildung, und/oder • eine Abbildung durch ein mehrschichtiges Perzeptron, MLP, und/oder • eine Abbildung durch ein rekurrentes neuronales Netzwerk, RNN, beinhaltet (142a). - Verfahren (100) nach einem der
Ansprüche 1 bis4 , wobei die Kostenfunktion L zusätzlich die Ähnlichkeit zwischen der Repräsentation ξl des Langausschnitts xl einerseits und der hierzu korrespondierenden Repräsentation ξ̂l für eine semantisch inhaltsgleiche Abwandlung x̂l des Langausschnitts xl misst (143). - Verfahren nach
Anspruch 5 , wobei die semantisch inhaltsgleiche Abwandlung x̂l durch • Auswahl eines zufälligen Bildausschnitts und Zurückvergrößern auf die Originalgröße, und/oder • Spiegelung, und/oder • Farbveränderung aus dem Langausschnitt xl erzeugt wird (143a). - Verfahren nach einem der
Ansprüche 2 bis6 , wobei eine durch die Kostenfunktion L gemessene Ähnlichkeit jeweils ins Verhältnis zu Ähnlichkeiten gesetzt wird (144), die ein Vergleich der jeweiligen Merkmale - Verfahren (100) nach einem der
Ansprüche 1 bis11 , wobei • aus der Repräsentation - Computerprogramm, enthaltend maschinenlesbare Anweisungen, die, wenn sie auf einem oder mehreren Computern ausgeführt werden, den oder die Computer dazu veranlassen, das Verfahren (100) nach einem der
Ansprüche 1 bis12 auszuführen. - Maschinenlesbarer Datenträger und/oder Downloadprodukt mit dem Computerprogramm nach
Anspruch 13 . - Ein oder mehrere Computer mit dem Computerprogramm nach
Anspruch 13 , und/oder mit dem maschinenlesbaren Datenträger und/oder Downloadprodukt nachAnspruch 14 .
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102021207468.5A DE102021207468A1 (de) | 2021-07-14 | 2021-07-14 | Verfahren zur Kodierung einer Abfolge von Videobildern |
US17/859,611 US20230036743A1 (en) | 2021-07-14 | 2022-07-07 | Method for coding a sequence of video images |
CN202210820296.6A CN115620027A (zh) | 2021-07-14 | 2022-07-13 | 用于对视频图像序列进行编码的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102021207468.5A DE102021207468A1 (de) | 2021-07-14 | 2021-07-14 | Verfahren zur Kodierung einer Abfolge von Videobildern |
Publications (1)
Publication Number | Publication Date |
---|---|
DE102021207468A1 true DE102021207468A1 (de) | 2023-01-19 |
Family
ID=84546802
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE102021207468.5A Pending DE102021207468A1 (de) | 2021-07-14 | 2021-07-14 | Verfahren zur Kodierung einer Abfolge von Videobildern |
Country Status (3)
Country | Link |
---|---|
US (1) | US20230036743A1 (de) |
CN (1) | CN115620027A (de) |
DE (1) | DE102021207468A1 (de) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102018209388A1 (de) | 2018-06-13 | 2019-12-19 | Robert Bosch Gmbh | Erkennung fahrtrelevanter Situationen auf größere Entfernung |
-
2021
- 2021-07-14 DE DE102021207468.5A patent/DE102021207468A1/de active Pending
-
2022
- 2022-07-07 US US17/859,611 patent/US20230036743A1/en active Pending
- 2022-07-13 CN CN202210820296.6A patent/CN115620027A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102018209388A1 (de) | 2018-06-13 | 2019-12-19 | Robert Bosch Gmbh | Erkennung fahrtrelevanter Situationen auf größere Entfernung |
Non-Patent Citations (3)
Title |
---|
RECASENS, Adrià, et al. Broaden Your Views for Self-Supervised Video Learning. arXiv preprint arXiv:2103.16559v1, 31. Mai 2021 |
WANG, Jinpeng, et al. Enhancing Unsupervised Video Representation Learning by Decoupling the Scene and the Motion. arXiv preprint arXiv:2009.05757v3, 16. Dezember 2020 |
WANG, Jue, et al. Long-short temporal contrastive learning of video transformers. arXiv preprint arXiv:2106.09212v2, 8. Juli 2021 |
Also Published As
Publication number | Publication date |
---|---|
US20230036743A1 (en) | 2023-02-02 |
CN115620027A (zh) | 2023-01-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE102018128289A1 (de) | Verfahren und vorrichtung für eine autonome systemleistung und zur einstufung | |
DE102017218889A1 (de) | Unscharf parametriertes KI-Modul sowie Verfahren zum Betreiben | |
DE102012206037A1 (de) | Lernverfahren zur automatisierten Erkennung von Verkehrszeichen, Verfahren zur Bestimmung eines aktualisierten Parametersatzes für eine Klassifikation von einem Verkehrszeichen und Verkehrszeichenerkennungssystem | |
DE102019204139A1 (de) | Training für künstliche neuronale Netzwerke mit besserer Ausnutzung der Lern-Datensätze | |
DE102018109276A1 (de) | Bildhintergrundsubtraktion für dynamische beleuchtungsszenarios | |
DE102019209644A1 (de) | Verfahren zum Trainieren eines neuronalen Netzes | |
DE102018220941A1 (de) | Auswertung von Messgrößen mit KI-Modulen unter Berücksichtigung von Messunsicherheiten | |
WO2021228894A1 (de) | Bildauswertungsverfahren in der mikroskopie | |
DE102021207468A1 (de) | Verfahren zur Kodierung einer Abfolge von Videobildern | |
DE102019219734A1 (de) | Auswertungssystem für Messdaten aus mehreren Domänen | |
DE69922995T2 (de) | System und verfahren zur datenklassifizierung | |
Schmies et al. | Classification of fracture characteristics and fracture mechanisms using deep learning and topography data | |
DE102021204040A1 (de) | Verfahren, Vorrichtung und Computerprogramm zur Erstellung von Trainingsdaten im Fahrzeug | |
DE102017219269A1 (de) | Klassifizierung mit automatischer Auswahl aussichtsreicher Lerndaten | |
DE102021114287A1 (de) | Mikroskopiesystem und Verfahren zum Erzeugen stilisierter Kontrastbilder | |
EP3435056B1 (de) | Druckinspektionsvorrichtung zur optischen inspektion eines druckbildes eines druckobjekts | |
DE102020129018A1 (de) | Tiefe benutzermodellierung durch verhalten | |
DE102020206990A1 (de) | Vorrichtung zur Verarbeitung von Sensordaten und Trainingsverfahren | |
DE102022201161A1 (de) | Objektklassifizierung mit einem einstufigen metabasierten Objektdetektor unter Verwendung von Klassenprototypen | |
EP2282285A2 (de) | Einrichtung und Verfahren zur Transformation von Objektklassifikations-Ergebnissen | |
DE102021214465A1 (de) | Analyse des Verhaltens von Bildklassifikatoren | |
DE102022111179A1 (de) | Verfahren und vorrichtung zur erzeugung eines auf künstlicher intelligenz beruhenden prädiktors sowie dessen verwendung, und computerprogramm | |
DE102020216054A1 (de) | Ermitteln der Wirkung des Eingabe-Bildes eines Bildklassifikators auf ein durch Faltungsschichten gebildetes Zwischenprodukt | |
DE102022203000A1 (de) | Prüfung synthetischer Messdaten auf Verwendbarkeit als Trainings-Messdaten für einen Klassifikator und/oder Regressor | |
WO2024013158A1 (de) | Objektklassifikation anhand von messdaten aus mehreren perspektiven unter nutzung von pseudo-labels |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R012 | Request for examination validly filed | ||
R079 | Amendment of ipc main class |
Free format text: PREVIOUS MAIN CLASS: G06K0009660000 Ipc: G06V0030194000 |
|
R079 | Amendment of ipc main class |
Free format text: PREVIOUS MAIN CLASS: G06V0030194000 Ipc: G06V0010700000 |
|
R016 | Response to examination communication |