DE112021007596T5 - Video-übertragungssystem, video-übertragungsverfahren und video-empfangseinrichtung - Google Patents

Video-übertragungssystem, video-übertragungsverfahren und video-empfangseinrichtung Download PDF

Info

Publication number
DE112021007596T5
DE112021007596T5 DE112021007596.9T DE112021007596T DE112021007596T5 DE 112021007596 T5 DE112021007596 T5 DE 112021007596T5 DE 112021007596 T DE112021007596 T DE 112021007596T DE 112021007596 T5 DE112021007596 T5 DE 112021007596T5
Authority
DE
Germany
Prior art keywords
video
data
unit
learning model
transmission
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE112021007596.9T
Other languages
English (en)
Inventor
Shotaro Miwa
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of DE112021007596T5 publication Critical patent/DE112021007596T5/de
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/62Extraction of image or video features relating to a temporal dimension, e.g. time-based feature extraction; Pattern tracking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/438Interfacing the downstream path of the transmission network originating from a server, e.g. retrieving encoded video stream packets from an IP network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/4728End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for selecting a Region Of Interest [ROI], e.g. for requesting a higher resolution version of a selected region
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/66Remote control of cameras or camera parts, e.g. by remote control devices
    • H04N23/661Transmitting camera control signals through networks, e.g. control via the Internet
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Closed-Circuit Television Systems (AREA)
  • Image Analysis (AREA)

Abstract

Ein Video-Übertragungssystem (2) ist derart konfiguriert, dass es Folgendes aufweist: eine Videodaten-Erfassungseinheit (11) zum Erfassen von ersten Videodaten, die ein erstes Video angeben, das von einer Kamera (1) aufgenommen wird; eine erste Inferenz-Einheit (12) zum Übergeben der ersten Videodaten, die von der Videodaten-Erfassungseinheit (11) erfasst werden, an ein erstes Lernmodell (13), und zum Erfassen von Zwischendaten, die Daten sind, die von den ersten Videodaten verschieden sind, vom ersten Lernmodell (13); eine Daten-Übertragungseinheit (14) zum Übertragen der Zwischendaten, die von der ersten Inferenz-Einheit (12) erfasst werden; eine Daten-Empfangseinheit (15) zum Empfangen der Zwischendaten, die von der Daten-Übertragungseinheit (14) übertragen werden; und eine zweite Inferenz-Einheit (16) zum Übergeben der Zwischendaten, die von der Daten-Empfangseinheit (15) empfangen werden, an ein zweites Lernmodell (17) und zum Erfassen - aus dem zweiten Lernmodell (17) - von zweiten Videodaten, die ein vorhergesagtes Video eines zweiten Videos angeben, bei dem die Aufnahmezeit der Kamera (1) von derjenigen des ersten Video um die Übertragungszeit der Zwischendaten von der Daten-Übertragungseinheit (14) zur Daten-Empfangseinheit (15) oder mehr vorauseilt.

Description

  • Technisches Gebiet
  • Die vorliegende Erfindung betrifft ein Video-Übertragungssystem, ein Video-Übertragungsverfahren und eine Video-Empfangseinrichtung.
  • Stand der Technik
  • Ein Arbeiter oder dergleichen an einem entfernten Ort kann eine Arbeitsanweisung an einen Ort geben, wo eine bestimmte Arbeit durchgeführt wird. Beispielsweise kann ein Arbeiter oder dergleichen an einem entfernten Ort eine Arbeitsanweisung geben, während er ein Video des Orts betrachtet, das auf einem Monitor angezeigt wird, und die Situation des Orts prüft. Die Arbeitsanweisung weist eine Maschine, wie z. B. einen Roboter, ein Fahrzeug oder eine Kamera, die sich am Ort befinden, für den Betrieb an.
  • Es gibt ein Video-Übertragungssystem, das Videodaten, die ein Video des Orts angeben, an einen entfernten Ort überträgt.
  • Indessen offenbart die Patentliteratur 1 eine Technik zum Verkürzen der Übertragungszeit von Videodaten von dem Zeitpunkt, wenn die Videodaten von einer Übertragungseinheit übertragen bzw. gesendet werden, bis zu dem Zeitpunkt, wenn die Videodaten von einer Empfangseinheit empfangen werden. Die Übertragungseinheit führt eine Kompressionsverarbeitung von den Videodaten durch und überträgt die komprimierten Videodaten an die Empfangseinheit.
  • Literaturverzeichnis
  • Patentliteratur
  • Patentliteratur 1: JP 2019- 29 746 A
  • Zusammenfassung der Erfindung
  • Technisches Problem
  • In einem Video-Übertragungssystem ist es unmöglich, die Übertragungszeit von Videodaten von einem Ort zu einem entfernten Ort zu Null werden zu lassen. Wenn die Übertragungszeit der Videodaten nicht Null ist, tritt eine Verzögerung beim Prüfen der Situation am Ort durch einen Arbeiter oder dergleichen am entfernten Ort auf. Wenn eine Verzögerung beim Prüfen der Situation am Ort auftritt, wird eine Arbeitsanweisung vom Arbeiter oder dergleichen ebenfalls verzögert, und folglich besteht das Problem, dass der Arbeiter oder dergleichen eine nicht geeignete Arbeitsanweisung geben kann.
  • Selbst mit der Technik, die in der Patentliteratur 1 offenbart ist, ist es unmöglich, die Übertragungszeit der Videodaten Null werden zu lassen. Daher kann, selbst wenn die Technologie auf das Video-Übertragungssystem angewendet werden kann, das obige Problem nicht gelöst werden.
  • Die vorliegende Erfindung wurde konzipiert, um die obigen Probleme zu lösen, und es ist Aufgabe der vorliegenden Erfindung, ein Video-Übertragungssystem und ein Video-Übertragungsverfahren anzugeben, die zum Unterstützen eines Arbeiters oder dergleichen an einem entfernten Ort zum Absetzen einer geeigneten Arbeitsanweisung an den Ort imstande sind.
  • Lösung des Problems
  • Ein Video-Übertragungssystem gemäß der vorliegenden Erfindung weist Folgendes auf: eine Videodaten-Erfassungseinheit zum Erfassen von ersten Videodaten, die ein erstes Video angeben, das von einer Kamera aufgenommen wird; eine erste Inferenz-Einheit zum Übergeben der ersten Videodaten, die von der Videodaten-Erfassungseinheit erfasst werden, an ein erstes Lernmodell, und zum Erfassen von Zwischendaten, die Daten sind, die von den ersten Videodaten verschieden sind, vom ersten Lernmodell; eine Daten-Übertragungseinheit zum Übertragen der Zwischendaten, die von der ersten Inferenz-Einheit erfasst werden; eine Daten-Empfangseinheit zum Empfangen der Zwischendaten, die von der Daten-Übertragungseinheit übertragen werden; und eine zweite Inferenz-Einheit zum Übergeben der Zwischendaten, die von der Daten-Empfangseinheit empfangen werden, an ein zweites Lernmodell, und zum Erfassen - aus dem zweiten Lernmodell - von zweiten Videodaten, die ein vorhergesagtes Video eines zweiten Videos angeben, bei dem die Aufnahmezeit der Kamera von derjenigen des ersten Video um die Übertragungszeit der Zwischendaten von der Daten-Übertragungseinheit zur Daten-Empfangseinheit oder mehr vorauseilt.
  • Vorteilhafte Wirkungen der Erfindung
  • Gemäß der vorliegenden Erfindung ist es möglich, einen Arbeiter oder dergleichen an einem entfernten Ort beim Absetzen einer geeigneten Arbeitsanweisung an den Ort zu unterstützen.
  • Kurze Beschreibung der Zeichnungen
    • 1 ist ein Konfigurationsdiagramm, das ein Video-Übertragungssystem 2 gemäß einer ersten Ausführungsform veranschaulicht.
    • 2 ist ein Hardwarekonfigurationsdiagramm, das die Hardware einer Video-Übertragungseinrichtung 3 veranschaulicht, die im Video-Übertragungssystem 2 gemäß der ersten Ausführungsform enthalten ist.
    • 3 ist ein Hardwarekonfigurationsdiagramm, das die Hardware einer Video-Empfangseinrichtung 5 veranschaulicht, die im Video-Übertragungssystem 2 gemäß der ersten Ausführungsform enthalten ist.
    • 4 ist ein erläuterndes Diagramm, das ein Beispiel eines Lernmodells 30 veranschaulicht.
    • 5 ist ein Hardwarekonfigurationsdiagramm eines Computers in einem Fall, in dem die Video-Übertragungseinrichtung 3 oder die Video-Empfangseinrichtung 5 mittels Software, Firmware oder dergleichen implementiert ist.
    • 6 ist ein Ablaufdiagramm, das eine Verarbeitungsprozedur der Video-Übertragungseinrichtung 3 zeigt, die ein Teil eines Video-Übertragungsverfahrens ist.
    • 7 ist ein Ablaufdiagramm, das eine Verarbeitungsprozedur der Video-Empfangseinrichtung 5 zeigt, die ein Teil eines Video-Übertragungsverfahrens ist.
    • 8 ist ein erläuterndes Diagramm, das eine Mehrzahl von Videos zeigt, die zu unterschiedlichen Zeiten von einer Kamera 1 aufgenommen werden.
    • 9 ist ein Konfigurationsdiagramm, das ein Video-Übertragungssystem 2 gemäß einer zweiten Ausführungsform veranschaulicht.
    • 10 ist ein Hardwarekonfigurationsdiagramm, das die Hardware einer Video-Empfangseinrichtung 5 veranschaulicht, die im Video-Übertragungssystem 2 gemäß der zweiten Ausführungsform enthalten ist.
    • 11 ist ein Konfigurationsdiagramm, das ein Video-Übertragungssystem 2 gemäß einer dritten Ausführungsform veranschaulicht.
    • 12 ist ein Hardwarekonfigurationsdiagramm, das die Hardware einer Video-Empfangseinrichtung 5 veranschaulicht, die im Video-Übertragungssystem 2 gemäß der dritten Ausführungsform enthalten ist.
    • 13 ist ein Konfigurationsdiagramm, das ein Video-Übertragungssystem 2 inklusive einer Video-Empfangseinrichtung 5 gemäß einer vierten Ausführungsform veranschaulicht.
    • 14 ist ein Hardwarekonfigurationsdiagramm, das die Hardware einer Video-Übertragungseinrichtung 3 veranschaulicht, die im Video-Übertragungssystem 2 enthalten ist, das in 13 veranschaulicht ist.
    • 15 ist ein Hardwarekonfigurationsdiagramm, das die Hardware der Video-Empfangseinrichtung 5 veranschaulicht, die im Video-Übertragungssystem 2 enthalten ist, das in 13 veranschaulicht ist.
    • 16 ist ein Konfigurationsdiagramm, das ein weiteres Video-Übertragungssystem 2 gemäß der ersten bis vierten Ausführungsformen veranschaulicht.
  • Beschreibung von Ausführungsformen
  • Um die vorliegende Erfindung noch detaillierter zu erläutern, wird ein Weg zum Ausführen der vorliegenden Erfindung unten unter Bezugnahme auf die beigefügten Zeichnungen beschrieben.
  • Erste Ausführungsform
  • 1 ist ein Konfigurationsdiagramm, das ein Video-Übertragungssystem 2 gemäß einer ersten Ausführungsform veranschaulicht.
  • 2 ist ein Hardwarekonfigurationsdiagramm, das die Hardware einer Video-Übertragungseinrichtung 3 veranschaulicht, die im Video-Übertragungssystem 2 gemäß der ersten Ausführungsform enthalten ist.
  • 3 ist ein Hardwarekonfigurationsdiagramm, das die Hardware einer Video-Empfangseinrichtung 5 veranschaulicht, die im Video-Übertragungssystem 2 gemäß der ersten Ausführungsform enthalten ist.
  • Gemäß 1 nimmt eine Kamera 1 ein Subjekt auf. Das Subjekt ist ein Objekt, das von der Kamera 1 aufgenommen wird, und es entspricht einer natürlichen Landschaft, einer Blume, einem Insekt, einem Tier, einer Person, einem Gebäude, einer Straße, einem Automobil, einem Zug, einem Flugzeug oder dergleichen.
  • Die Kamera 1 gibt erste Videodaten, die ein erstes Video angeben, in dem ein Subjekt erscheint, an das Video-Übertragungssystem 2 aus.
  • Das Video-Übertragungssystem 2 weist eine Video-Übertragungseinrichtung 3, einen Übertragungspfad 4 und eine Video-Empfangseinrichtung 5 auf. Die Video-Übertragungseinrichtung 3 befindet sich auf einer Video-Übertragungsseite, und die Video-Empfangseinrichtung 5 befindet sich auf einer Video-Empfangsseite.
  • Die Video-Übertragungseinrichtung 3 weist eine Videodaten-Erfassungseinheit 11, eine erste Inferenz-Einheit 12 und eine Daten-Übertragungseinheit 14 auf.
  • Der Übertragungspfad 4 ist eine drahtgebundene Übertragungsleitung oder eine drahtlose Übertragungsleitung.
  • Das eine Ende des Übertragungspfads 4 ist mit der Video-Übertragungseinrichtung 3 verbunden, und das andere Ende des Übertragungspfads 4 ist mit der Video-Empfangseinrichtung 5 verbunden.
  • Das Video-Übertragungssystem 2, das in 1 veranschaulicht ist, weist den Übertragungspfad 4 auf. Dies ist jedoch bloß ein Beispiel, und der Übertragungspfad 4 kann auch außerhalb des Video-Übertragungssystems 2 vorhanden sein, und das Video-Übertragungssystem 2 kann die Video-Übertragungseinrichtung 3 und die Video-Empfangseinrichtung 5 aufweisen.
  • Die Video-Empfangseinrichtung 5 weist eine Daten-Empfangseinheit 15 und eine zweite Inferenz-Einheit 16 auf.
  • Die Videodaten-Erfassungseinheit 11 wird beispielsweise durch eine Videodaten-Erfassungsschaltung 21 implementiert, die in 2 veranschaulicht ist.
  • Die Videodaten-Erfassungseinheit 11 erfasst die ersten Videodaten, die von der Kamera 1 ausgegeben werden.
  • Die Videodaten-Erfassungseinheit 11 gibt die ersten Videodaten an die erste Inferenz-Einheit 12 aus.
  • Die erste Inferenz-Einheit 12 wird beispielsweise durch eine erste Inferenz-Schaltung 22 implementiert, die in 2 veranschaulicht ist.
  • Die erste Inferenz-Einheit 12 weist ein erstes Lernmodell 13 auf.
  • Die erste Inferenz-Einheit 12 übergibt die ersten Videodaten, die von der Videodaten-Erfassungseinheit 11 erfasst werden, an das erste Lernmodell 13, und sie erfasst Zwischendaten, die Daten sind, die von den ersten Videodaten verschieden sind, aus dem ersten Lernmodell 13. Die Zwischendaten sind Daten in einer mittleren Stufe, bis die ersten Videodaten in zweite Videodaten umgewandelt werden, was später noch beschrieben wird, und zwar in einem Lernmodell 30, das in 4 veranschaulicht ist.
  • Im Video-Übertragungssystem 2, das in 1 veranschaulicht ist, wird angenommen dass die Datenmenge der Zwischendaten kleiner als die Datenmenge der ersten Videodaten ist. Dies ist jedoch bloß ein Beispiel, und die Datenmenge der Zwischendaten ist nicht darauf beschränkt, dass sie kleiner als die Datenmenge der ersten Videodaten ist.
  • Die erste Inferenz-Einheit 12 gibt die Zwischendaten an die Daten-Übertragungseinheit 14 aus.
  • Im Video-Übertragungssystem 2 das in 1 veranschaulicht ist, weist die erste Inferenz-Einheit 12 das erste Lernmodell 13 auf. Dies ist jedoch bloß ein Beispiel, und das erste Lernmodell 13 kann auch außerhalb der ersten Inferenz-Einheit 12 vorgesehen sein.
  • Jedes von dem ersten Lernmodell 13 und einem zweiten Lernmodell 17, das später noch beschrieben wird, ist ein Teil des Lernmodells 30, das in 4 veranschaulicht ist.
  • 4 ist ein erläuterndes Diagramm, das ein Beispiel des Lernmodells 30 veranschaulicht.
  • Das Lernmodell 30 wird beispielsweise durch ein neurales Netzwerk implementiert. Das Lernmodell 30 weist eine Eingabeschicht 31, M Zwischenschichten 32-1 bis 32-M, N Zwischenschichten 33-1 bis 33-N und eine Ausgabeschicht 34 auf. Jede von M und N ist eine Ganzzahl von 2 oder mehr.
  • Das Lernmodell 30, das in 4 veranschaulicht ist, weist die M Zwischenschichten 32-1 bis 32-M auf. Dies ist jedoch bloß ein Beispiel, und das Lernmodell 30 kann auch nur die Zwischenschicht 32-1 unter den M Zwischenschichten 32-1 bis 32-M aufweisen. Außerdem weist das Lernmodell 30, das in 4 veranschaulicht ist, die N Zwischenschichten 33-1 bis 33-N auf. Dies ist jedoch bloß ein Beispiel, und das Lernmodell 30 kann auch nur die Zwischenschicht 33-1 unter den N Zwischenschichten 33-1 bis 33-N aufweisen.
  • Zur Zeit des Lernens werden die ersten Videodaten, die von der Videodaten-Erfassungseinheit 11 erfasst werden, der Eingabeschicht 31 des Lernmodells 30 zur Verfügung gestellt. Außerdem wird als Lehrer-Daten das vorhergesagte Video des zweiten Videos, dessen Fotografierzeit bzw. Aufnahmezeit der Kamera 1 bezogen auf diejenige des ersten Video um die Übertragungszeit der Zwischendaten oder mehr vorauseilt bzw. nach vom verlegt bzw. vorgezogen ist, dem Lernmodell 30 übergeben. Die Übertragungszeit der Zwischendaten ist die Zeit, die benötig wird, damit die Zwischendaten die Daten-Empfangseinheit 15 von der Daten-Übertragungseinheit 14 aus erreichen. In dem Video-Übertragungssystem 2, das in 1 veranschaulicht ist, wird angenommen, dass die Übertragungszeit der Zwischendaten festgelegt ist, und im Video-Übertragungssystem 2 ist die Übertragungszeit der Zwischendaten ein bestehender Wert.
  • Wenn die Verarbeitungszeit von jeder von der Videodaten-Erfassungseinheit 11, der ersten Inferenz-Einheit 12, der Daten-Übertragungseinheit 14, der Daten-Empfangseinheit 15 und der zweiten Inferenz-Einheit 16 eine vernachlässigbar kurze Zeit ist, werden die Videodaten, die das vorhergesagte Video des zweiten Videos angeben, dessen Aufnahmezeit der Kamera 1 bezogen auf diejenige des ersten Videos um die Übertragungszeit der Zwischendaten vorauseilt, dem Lernmodell 30 zur Verfügung gestellt, und zwar als Lehrer-Daten.
  • Wenn andererseits die jeweilige Verarbeitungszeit nicht eine vernachlässigbar kurze Zeit ist, werden die Videodaten, die das vorhergesagte Video des zweiten Videos angeben, dessen Aufnahmezeit der Kamera 1 bezogen auf diejenige des ersten Videos um die Gesamtzeit jeder Verarbeitungszeit und der Übertragungszeit der Zwischendaten vorauseilt, dem Lernmodell 30 zur Verfügung gestellt, und zwar als Lehrer-Daten.
  • Das Lernmodell 30 wird derart gelernt, dass dann, wenn die jeweilige Verarbeitungszeit eine vernachlässigbar kurze Zeit ist, wenn die ersten Videodaten der Eingabeschicht 31 übergeben werden, die zweiten Videodaten, die das vorhergesagte Video des zweiten Videos angeben, dessen Aufnahmezeit bezogen auf diejenige des ersten Videos um die Übertragungszeit der Zwischendaten vorauseilt, aus der Ausgabeschicht 34 ausgegeben werden.
  • Das Lernmodell 30 wird derart gelernt, dass dann, wenn die jeweilige Verarbeitungszeit nicht eine vernachlässigbar kurze Zeit ist, wenn die ersten Videodaten der Eingabeschicht 31 übergeben werden, die zweiten Videodaten, die das vorhergesagte Video des zweiten Videos angeben, dessen Aufnahmezeit bezogen auf diejenige des ersten Videos um die Gesamtzeit der jeweiligen Verarbeitungszeit und der Übertragungszeit der Zwischendaten vorauseilt, aus der Ausgabeschicht 34 ausgegeben werden.
  • Die Eingabeschicht 31 des Lernmodells 30 hat beispielsweise die gleiche Anzahl von Eingangsanschlüssen bzw. Eingangsverbindungen wie die Anzahl von einer Mehrzahl von Pixeln, die das erste Video bilden. Die ersten Videodaten sind Daten, die den Pixelwert der jeweiligen Pixel angeben, und jeder der Pixelwerte wird dem entsprechenden der Eingangsanschlüsse in der Eingabeschicht 31 zur Verfügung gestellt.
  • Die Ausgabeschicht 34 des Lernmodells 30 hat beispielsweise die gleiche Anzahl von Ausgangsanschlüssen bzw. Ausgangsverbindungen wie die Anzahl von einer Mehrzahl von Pixeln, die das vorhergesagte Video des zweiten Videos bilden. Die zweiten Videodaten sind Daten, die den Pixelwert der jeweiligen Pixel angeben, und jeder der Pixelwerte wird aus einem entsprechenden der Ausgangsanschlüsse in der Ausgabeschicht 34 ausgegeben.
  • Das erste Lernmodell 13 weist die Eingabeschicht 31 und die M Zwischenschichten 32-1 bis 32-M auf, die im gelernten Lernmodell 30 enthalten sind.
  • Das zweite Lernmodell 17 weist eine Zwischenschicht 32-M, die N Zwischenschichten 33-1 bis 33-N und die Ausgabeschicht 34 auf, die im gelernten Lernmodell 30 enthalten sind.
  • Es sei angemerkt, dass eine Technik zum Erzeugen des ersten Lernmodells 13 derart, dass es die Eingabeschicht 31 und die M Zwischenschichten 32-1 bis 32-M enthält, und eine Technik zum Erzeugen des zweiten Lernmodells 17 derart, dass es die Zwischenschicht 32-M, die N Zwischenschichten 33-1 bis 33-N und die Ausgabeschicht 34 enthält, bekannte Techniken sind.
  • Die Daten-Übertragungseinheit 14 wird beispielsweise durch eine Daten-Übertragungsschaltung 23 implementiert, die in 2 veranschaulicht ist.
  • Die Daten-Übertragungseinheit 14 überträgt die Zwischendaten, die von der ersten Inferenz-Einheit 12 erfasst werden, an die Daten-Empfangseinheit 15, und zwar über den Übertragungspfad 4.
  • Die Daten-Empfangseinheit 15 wird beispielsweise durch eine Daten-Empfangsschaltung 24 implementiert, die in 3 veranschaulicht ist.
  • Die Daten-Empfangseinheit 15 empfängt die Zwischendaten, die von der Daten-Übertragungseinheit 14 übertragen werden.
  • Die Daten-Empfangseinheit 15 gibt die Zwischendaten an die zweite Inferenz-Einheit 16 aus.
  • Die zweite Inferenz-Einheit 16 wird beispielsweise durch eine zweite Inferenz-Schaltung 25 implementiert, die in 3 veranschaulicht ist.
  • Die zweite Inferenz-Einheit 16 weist das zweite Lernmodell 17 auf.
  • Die zweite Inferenz-Einheit 16 übergibt die Zwischendaten, die von der Daten-Empfangseinheit 15 empfangen werden, an das zweite Lernmodell 17, und sie erfasst - vom zweiten Lernmodell 17 - die zweiten Videodaten, die das vorhergesagte Video des zweiten Videos angeben, dessen Aufnahmezeit der Kamera 1 bezogen auf diejenige des ersten Video um die Übertragungszeit der Zwischendaten oder mehr vorauseilt.
  • In dem Video-Übertragungssystem 2, das in 1 veranschaulicht ist, wird zum Zwecke der Vereinfachung der Erläuterung angenommen, dass die jeweilige der Verarbeitungszeiten in der Videodaten-Erfassungseinheit 11, der ersten Inferenz-Einheit 12, der Daten-Übertragungseinheit 14, der Daten-Empfangseinheit 15 und der zweiten Inferenz-Einheit 16 ignoriert werden kann. In diesem Fall übergibt die zweite Inferenz-Einheit 16 die Zwischendaten, die von der Daten-Empfangseinheit 15 empfangen werden, an das zweite Lernmodell 17, und sie erfasst - vom zweiten Lernmodell 17 - die zweiten Videodaten, die das vorhergesagte Video des zweiten Videos angeben, dessen Aufnahmezeit der Kamera 1 bezogen auf diejenige des ersten Video um die Übertragungszeit der Zwischendaten vorauseilt.
  • In einem Fall, in dem die jeweilige Verarbeitungszeit nicht ignoriert werden kann, übergibt die zweite Inferenz-Einheit 16 die Zwischendaten, die von der Daten-Empfangseinheit 15 empfangen werden, an das zweite Lernmodell 17, und sie erfasst - vom zweiten Lernmodell 17 - die zweiten Videodaten, die das vorhergesagte Video des zweiten Videos angeben, dessen Aufnahmezeit der Kamera 1 von derjenigen des ersten Videos um die Gesamtzeit der jeweiligen Verarbeitungszeit und der Übertragungszeit der Zwischendaten vorauseilt.
  • Die zweite Inferenz-Einheit 16 übergibt die zweiten Videodaten beispielsweise an die Anzeigeeinrichtung 6 oder eine Video-Verarbeitungseinrichtung (nicht dargestellt).
  • Im Video-Übertragungssystem 2, das in 1 veranschaulicht ist, weist die zweite Inferenz-Einheit 16 das zweite Lernmodell 17 auf. Dies ist jedoch bloß ein Beispiel, und das zweite Lernmodell 17 kann auch außerhalb der zweiten Inferenz-Einheit 16 vorgesehen sein.
  • Die Anzeigeeinrichtung 6 veranlasst den Monitor, das vorhergesagte Video des zweiten Videos anzuzeigen, das von den zweiten Videodaten angegeben wird, die aus der zweiten Inferenz-Einheit 16 ausgegeben werden.
  • Die Video-Verarbeitungseinrichtung (nicht dargestellt) analysiert das Subjekt oder dergleichen, das im vorhergesagten Video des zweiten Videos erscheint, auf der Basis der zweiten Videodaten, die aus der zweiten Inferenz-Einheit 16 ausgegeben werden.
  • In 1 wird angenommen, dass jede von der Videodaten-Erfassungseinheit 11, der ersten Inferenz-Einheit 12 und der Daten-Übertragungseinheit 14, die Komponenten der Video-Übertragungseinrichtung 3 sind, durch dedizierte Hardware implementiert werden, wie in 2 veranschaulicht. Das heißt, es wird angenommen, dass die Video-Übertragungseinrichtung 3 von der Videodaten-Erfassungsschaltung 21, der ersten Inferenz-Schaltung 22 und der Daten-Übertragungsschaltung 23 implementiert wird.
  • Außerdem wird in 1 angenommen, dass jede von der Daten-Empfangseinheit 15 und der zweiten Inferenz-Einheit 16, die Komponenten der Video-Empfangseinrichtung 5 sind, durch dedizierte Hardware implementiert ist, wie in 3 veranschaulicht. Das heißt, es wird angenommen, dass die Video-Empfangseinrichtung 5 durch die Daten-Empfangsschaltung 24 und die zweite Inferenz-Einheit 25 implementiert wird.
  • Jede von der Videodaten-Erfassungsschaltung 21, der ersten Inferenz-Schaltung 22, der Daten-Übertragungsschaltung 23, der Daten-Empfangsschaltung 24 und der zweiten Inferenz-Schaltung 25 entspricht beispielsweise einer Einzelschaltung, einer zusammengesetzten Schaltung, einem programmierten Prozessor, einem parallel-programmierten Prozessor, einer anwendungsspezifischen integrierten Schaltung (ASIC), einem feldprogrammierbaren Gate-Array (FPGA) oder einer Kombination davon.
  • Die Komponenten der Video-Übertragungseinrichtung 3 sind nicht auf jene beschränkt, die durch dedizierte Hardware implementiert werden, und die Video-Übertragungseinrichtung 3 kann durch Software, Firmware oder eine Kombination aus Software und Firmware implementiert werden.
  • Außerdem sind die Komponenten der Video-Empfangseinrichtung 5 nicht auf jene beschränkt, die durch dedizierte Hardware implementiert werden, und die Video-Empfangseinrichtung 5 kann durch Software, Firmware oder eine Kombination aus Software und Firmware implementiert werden.
  • Die Software oder Firmware ist in einem Speicher des Computers als ein Programm gespeichert. Computer bedeutet Hardware, die ein Programm ausführt, und entspricht beispielsweise einer zentralen Verarbeitungseinheit (CPU), einer zentralen Verarbeitungseinrichtung, einer Verarbeitungseinrichtung, einer arithmetischen Einrichtung, einem Mikroprozessor, einem Mikrocomputer, einem Prozessor oder einem digitalen Signalprozessor (DSP).
  • 5 ist ein Hardwarekonfigurationsdiagramm eines Computers in einem Fall, in dem die Video-Übertragungseinrichtung 3 oder die Video-Empfangseinrichtung 5 mittels Software, Firmware oder dergleichen implementiert ist.
  • In einem Fall, in dem die Video-Übertragungseinrichtung 3 durch Software, Firmware oder dergleichen implementiert ist, ist ein Programm zum Veranlassen eines Computers, jede der Verarbeitungsprozeduren in der Videodaten-Erfassungseinheit 11, der ersten Inferenz-Einheit 12 und der Daten-Übertragungseinheit 14 auszuführen, in einem Speicher 41 gespeichert. Dann führt ein Prozessor 42 des Computers das Programm aus, das im Speicher 41 gespeichert ist.
  • In einem Fall, in dem die Video-Empfangseinrichtung 5 durch Software, Firmware oder dergleichen implementiert ist, ist ein Programm zum Veranlassen eines Computers, jede der Verarbeitungsprozeduren in der Daten-Empfangseinheit 15 und der zweiten Inferenz-Einheit 16 auszuführen, im Speicher 41 gespeichert. Dann führt ein Prozessor 42 des Computers das Programm aus, das im Speicher 41 gespeichert ist.
  • 2 veranschaulicht ein Beispiel, bei dem jede der Komponenten der Video-Übertragungseinrichtung 3 durch dedizierte Hardware implementiert ist, und 5 veranschaulicht ein Beispiel, bei dem die Video-Übertragungseinrichtung 3 durch Software, Firmware oder dergleichen implementiert ist. Dies sind jedoch bloß Beispiele, und manche Komponenten in der Video-Übertragungseinrichtung 3 können durch dedizierte Hardware implementiert sein, und die übrigen Komponenten können durch Software, Firmware oder dergleichen implementiert sein.
  • 3 veranschaulicht ein Beispiel, bei dem jede der Komponenten der Video-Empfangseinrichtung 5 durch dedizierte Hardware implementiert ist, und 5 veranschaulicht ein Beispiel, bei dem die Video-Empfangseinrichtung 5 durch Software, Firmware oder dergleichen implementiert ist. Dies sind jedoch bloß Beispiele, und manche Komponenten in der Video-Empfangseinrichtung 5 können durch dedizierte Hardware implementiert sein, und die übrigen Komponenten können durch Software, Firmware oder dergleichen implementiert sein.
  • Als Nächstes wird der Betrieb des Video-Übertragungssystems 2 beschrieben, das in 1 veranschaulicht ist.
  • 6 ist ein Ablaufdiagramm, das eine Verarbeitungsprozedur in der Video-Übertragungseinrichtung 3 zeigt, die ein Teil des Video-Übertragungsverfahrens ist.
  • 7 ist ein Ablaufdiagramm, das eine Verarbeitungsprozedur in der Video-Empfangseinrichtung 5 zeigt, die ein Teil des Video-Übertragungsverfahrens ist.
  • In dem Lernmodell 30, das in 4 veranschaulicht ist, werden zur Zeit des Lernens - zusätzlich zu den ersten Videodaten, die von der Videodaten-Erfassungseinheit 11 erfasst werden - Videodaten, die das vorhergesagte Video des zweiten Videos angeben, dessen Aufnahmezeit der Kamera 1 bezogen auf diejenige des ersten Videos um die Übertragungszeit der Zwischendaten vorauseilt, dem Lernmodell 30 als Lehrer-Daten übergeben.
  • Indem eine Bildsequenz für das erste Video, die durch jedes von einer Mehrzahl von Elementen der ersten Videodaten dargestellt wird, und eine Bildsequenz für das vorhergesagte Video verwendet werden, die durch jedes von einer Mehrzahl von Elementen der Lehrer-Daten dargestellt wird, wird dann das Lernmodell 30 derart gelernt, dass ein zukünftiges Video für ein gewisses Video als ein vorhergesagtes Video erhalten wird, wenn das gewisse Video gegeben ist. Das heißt, das Lernmodell 30 wird derart gelernt, dass dann, wenn die ersten Videodaten der Eingabeschicht 31 übergeben werden, die Videodaten, die das vorhergesagte Video des zweiten Videos angeben, dessen Aufnahmezeit der Kamera 1 bezogen auf diejenige des ersten Videos um die Übertragungszeit der Zwischendaten vorauseilt, aus der Ausgabeschicht 34 ausgegeben werden.
  • 8 ist ein erläuterndes Diagramm, das eine Mehrzahl von Videos zeigt, die zu unterschiedlichen Zeiten von der Kamera 1 aufgenommen werden.
  • In 8 sind T0 bis T6 die Video-Aufnahmezeiten. Die Aufnahmezeit T0 ist die älteste Aufnahmezeit unter den Aufnahmezeiten T0 bis T6, und die Aufnahmezeit T6 ist die jüngste Aufnahmezeit unter den Aufnahmezeiten T0 bis T6.
  • Eine Zeitdifferenz ΔT zwischen den einzelnen Aufnahmezeiten T0 bis T6 wird durch die folgende Formel (1) ausgedrückt. Δ T =T 1 T 0 = T 2 T 1 = T 3 T 2 = T 4 T 3 = T 5 T 4 = T 6 T 5
    Figure DE112021007596T5_0001
  • Beispielsweise wird derart gelernt, dass in einem Fall, in dem die Übertragungszeit der Zwischendaten gleich der Zeit 3 × ΔT zwischen der Aufnahmezeit T3 und der Aufnahmezeit T0 ist, wenn die ersten Videodaten, die das erste Video zur Aufnahmezeit T0 angeben, der Eingabeschicht 31 zugeführt werden, die zweiten Videodaten, die das Video zur Aufnahmezeit T3 (= T0 + 3 × ΔT) angeben, aus der Ausgabeschicht 32 als das vorhergesagte Video des zweiten Videos ausgegeben werden. Außerdem wird derart gelernt, dass dann, wenn die ersten Videodaten, die das erste Video zur Aufnahmezeit T1 angeben, der Eingabeschicht 31 zur Verfügung gestellt werden, die zweiten Videodaten, die das Video zur Aufnahmezeit T4 (= T1 + 3 × ΔT) angeben, aus der Ausgabeschicht 34 als das vorhergesagte Video des zweiten Videos ausgegeben werden.
  • Das gelernte Lernmodell 30 weist die Eingabeschicht 31, die M Zwischenschichten 32-1 bis 32-M, die N Zwischenschichten 33-1 bis 33-N und die Ausgabeschicht 34 auf.
  • Jedes von dem ersten Lernmodell 13 und dem zweiten Lernmodell 17 wird erzeugt, indem das gelernte Lernmodell 30 derart geteilt wird, dass jedes von dem ersten Lernmodell 13 und dem zweiten Lernmodell 17 die Zwischenschicht 32-M gemeinsam aufweist.
  • Das heißt, das erste Lernmodell 13 wird derart erzeugt, dass es die Eingabeschicht 31 und die M Zwischenschichten 32-1 bis 32-M aufweist, und das zweite Lernmodell 17 wird derart erzeugt, dass es die Zwischenschicht 32-M, die N Zwischenschichten 33-1 bis 33-N und die Ausgabeschicht 34 aufweist.
  • Die Kamera 1 gibt die ersten Videodaten, die das erste Video angeben, an die Videodaten-Erfassungseinheit 11 des Video-Übertragungssystems 2 aus.
  • Die Videodaten-Erfassungseinheit 11 erfasst die ersten Videodaten, die von der Kamera 1 ausgegeben werden (Schritt ST1 in 6).
  • Die Videodaten-Erfassungseinheit 11 gibt die ersten Videodaten an die erste Inferenz-Einheit 12 aus.
  • Die erste Inferenz-Einheit 12 erfasst die ersten Videodaten von der Videodaten-Erfassungseinheit 11.
  • Die erste Inferenz-Einheit 12 übergibt die ersten Videodaten an das erste Lernmodell 13, und sie erfasst die Zwischendaten, die Daten sind, die von den ersten Videodaten verschieden sind, vom ersten Lernmodell 13 (Schritt ST2 in 6).
  • Das heißt, die erste Inferenz-Einheit 12 übergibt die ersten Videodaten an die Eingabeschicht 31 und erfasst die Zwischendaten von der Zwischenschicht 32-M.
  • Die erste Inferenz-Einheit 12 gibt die Zwischendaten an die Daten-Übertragungseinheit 14 aus.
  • Da ein Programm zum Ausführen der allgemeinen Kompressionsverarbeitung an den Videodaten eine Syntax zum Ausführen einer Verzweigung hat, kann die Verarbeitungszeit der Kompressionsverarbeitung schwanken. Die erste Inferenz-Einheit 12 erfasst die Zwischendaten, indem sie die ersten Videodaten dem ersten Lernmodell 13 zur Verfügung stellt, und sie ist kein Programm, das eine Syntax zum Ausführen einer Verzweigung ausführt. Daher verursacht die Verarbeitungszeit der ersten Inferenz-Einheit 12 keine Schwankung der Verarbeitungszeit wie bei der allgemeinen Kompressionsverarbeitung.
  • Es sei angemerkt, dass im Video-Übertragungssystem 2, das in 1 veranschaulicht ist - wie oben beschrieben - die Verarbeitungszeit der ersten Inferenz-Einheit 12 ignoriert wird, um die Beschreibung zu vereinfachen.
  • Die Daten-Übertragungseinheit 14 erfasst die Zwischendaten von der ersten Inferenz-Einheit 12.
  • Die Daten-Übertragungseinheit 14 überträgt die Zwischendaten an die Daten-Empfangseinheit 15 über den Übertragungspfad 4 (Schritt ST3 in 6).
  • Die Daten-Empfangseinheit 15 empfängt die Zwischendaten, die von der Daten-Übertragungseinheit 14 übertragen werden (Schritt ST11 in 7).
  • Die Daten-Empfangseinheit 15 gibt die Zwischendaten an die zweite Inferenz-Einheit 16 aus.
  • Die zweite Inferenz-Einheit 16 erfasst die Zwischendaten von der Daten-Empfangseinheit 15.
  • Die zweite Inferenz-Einheit 16 übergibt die Zwischendaten an das zweite Lernmodell 17 und erfasst die zweiten Videodaten vom zweiten Lernmodell 17 (Schritt ST12 in 7).
  • Das heißt, die zweite Inferenz-Einheit 16 übergibt die Zwischendaten an die Zwischenschicht 32-M und erfasst die zweiten Videodaten von der Ausgabeschicht 34.
  • Es wird angenommen, dass die Übertragungszeit der Zwischendaten beispielsweise eine Zeit gleich der Zeit 3 × ΔT zwischen der Aufnahmezeit T3 und der Aufnahmezeit T0 ist. In diesem Fall gilt beispielsweise Folgendes: Wenn die ersten Videodaten, die das erste Video zur Aufnahmezeit T0 angeben, der Eingabeschicht 31 des ersten Lernmodells 13 zur Verfügung gestellt werden, werden die zweiten Videodaten, die das Video zur Aufnahmezeit T3 (= T0 + 3 × ΔT) angeben, aus der Ausgabeschicht 34 des zweiten Lernmodells 17 als das vorhergesagte Video des zweiten Videos ausgegeben.
  • In diesem Fall gilt beispielsweise Folgendes: Wenn die ersten Videodaten, die das erste Video zur Aufnahmezeit T2 angeben, der Eingabeschicht 31 des ersten Lernmodells 13, zur Verfügung gestellt werden, werden die zweiten Videodaten, die das Video zur Aufnahmezeit T5 (= T2 + 3 × ΔT) angeben, aus der Ausgabeschicht 34 des zweiten Lernmodells 17, als das vorhergesagte Video des zweiten Videos ausgegeben.
  • Daher ist das Video, das von den zweiten Videodaten angegeben wird, die aus der Ausgabeschicht 34 des zweiten Lernmodells 17 ausgegeben werden, ein vorhergesagtes Video des zweiten Videos, dessen Aufnahmezeit der Kamera 1 bezogen auf diejenige des ersten Videos vorauseilt, d. h. eines Videos, das durch Vorhersagen eines echtzeitaufgenommenen Videos durch die Kamera 1 erhalten wird.
  • Die zweite Inferenz-Einheit 16 übergibt die zweiten Videodaten beispielsweise an die Anzeigeeinrichtung 6 oder die Video-Verarbeitungseinrichtung (nicht dargestellt).
  • Die Anzeigeeinrichtung 6 veranlasst den Monitor, das vorhergesagte Video anzuzeigen, das von den zweiten Videodaten angegeben wird, die aus der zweiten Inferenz-Einheit 16 ausgegeben werden.
  • Ein Arbeiter oder dergleichen an einem entfernten Ort kann die Situation an dem Ort prüfen, indem er das vorhergesagte Video betrachtet, das auf dem Monitor angezeigt wird.
  • Bei der ersten Ausführungsform, die oben beschrieben ist, ist das Video-Übertragungssystem 2 so konfiguriert, dass es Folgendes aufweist: die Videodaten-Erfassungseinheit 11 zum Erfassen der ersten Videodaten, die das erste Video angeben; die erste Inferenz-Einheit 12 zum Übergeben der ersten Videodaten, die von der Videodaten-Erfassungseinheit 11 erfasst werden, an das erste Lernmodell 13, und zum Erfassen von Zwischendaten, die Daten sind, die von den ersten Videodaten aus dem ersten Lernmodell 13 verschieden sind; die Daten-Übertragungseinheit 14 zum Übertragen der Zwischendaten, die von der ersten Inferenz-Einheit 12 erfasst werden; die Daten-Empfangseinheit 15 zum Empfangen der Zwischendaten, die von der Daten-Übertragungseinheit 14 übertragen werden; und die zweite Inferenz-Einheit 16 zum Übergeben der Zwischendaten, die von der Daten-Empfangseinheit 15 empfangen werden, an das zweite Lernmodell 17, und zum Erfassen - vom zweiten Lernmodell 17 - von zweiten Videodaten, die ein vorhergesagtes Video eines zweiten Videos angeben, dessen Aufnahmezeit der Kamera 1 bezogen auf diejenige des ersten Videos um die Übertragungszeit der Zwischendaten von der Daten-Übertragungseinheit 14 zur Daten-Empfangseinheit 15 oder mehr vorauseilt.
  • Daher kann das Video-Übertragungssystem 2 einen Arbeiter oder dergleichen an einem entfernten Ort unterstützen, eine geeignete Arbeitsanweisung an den Ort abzusetzen.
  • In dem Video-Übertragungssystem 2 das in 1 veranschaulicht ist, wird das gelernte Lernmodell 30 durch ein gelerntes neurales Netzwerk implementiert. Das gelernte Lernmodell 30 ist jedoch nicht auf eines beschränkt, das durch ein gelerntes neurales Netzwerk implementiert wird, und es kann beispielsweise durch gelerntes Deep Learning implementiert sein. Daher kann jedes von dem ersten Lernmodell 13 und dem zweiten Lernmodell 17 beispielsweise durch einen Teil eines gelernten Deep Learnings implementiert werden.
  • Zweite Ausführungsform
  • In einer zweiten Ausführungsform wird ein Video-Übertragungssystem 2 beschrieben, das eine Übertragungszeit-Spezifikationseinheit 18 aufweist, die die Übertragungszeit von Zwischendaten von einer Daten-Übertragungseinheit 14 an eine Daten-Empfangseinheit 15 spezifiziert.
  • In dem Video-Übertragungssystem 2, das in 1 veranschaulicht ist, wird angenommen, dass die Übertragungszeit der Zwischendaten festgelegt ist und ein vorhandener Wert ist.
  • In dem Video-Übertragungssystem 2, das in 9 veranschaulicht ist, wird angenommen, dass die Übertragungszeit der Zwischendaten schwankt ist und kein vorhandener Wert ist.
  • 9 ist ein Konfigurationsdiagramm, das das Video-Übertragungssystem 2 gemäß der zweiten Ausführungsform veranschaulicht.
  • 10 ist ein Hardwarekonfigurationsdiagramm, das die Hardware einer Video-Empfangseinrichtung 5 veranschaulicht, die im Video-Übertragungssystem 2 gemäß der zweiten Ausführungsform enthalten ist.
  • In 9 und 10 bezeichnen die gleichen Bezugszeichen wie diejenigen in 1 und 3 die gleichen oder entsprechende Komponenten, und folglich ist deren Beschreibung weggelassen.
  • Die Hardware einer Video-Übertragungseinrichtung 3, die im Video-Übertragungssystem 2 enthalten ist, das in 9 veranschaulicht ist, ist ähnlich der Hardware der Video-Übertragungseinrichtung 3, die im Video-Übertragungssystem 2 enthalten ist, das in 1 veranschaulicht ist. Daher ist ein Hardwarekonfigurationsdiagramm der Video-Übertragungseinrichtung 3, die im Video-Übertragungssystem 2 enthalten ist, das in 9 veranschaulicht ist, 2.
  • Die Übertragungszeit-Spezifikationseinheit 18 wird beispielsweise durch eine Übertragungszeit-Spezifikationsschaltung 26 implementiert, die in 10 gezeigt ist.
  • Die Übertragungszeit-Spezifikationseinheit 18 spezifiziert eine Übertragungszeit Time der Zwischendaten von der Sendezeit der Zwischendaten mittels der Daten-Übertragungseinheit 14 und der Empfangszeit der Zwischendaten mittels der Daten-Empfangseinheit 15.
  • Beispielsweise sind die Video-Übertragungseinrichtung 3 und die Video-Empfangseinrichtung 5 zeitsynchronisiert, ein Zeitstempel, der die Zeit angibt, wenn die ersten Videodaten von der Videodaten-Erfassungseinheit 11 erfasst werden, wird den Zwischendaten hinzugefügt, die von der Daten-Übertragungseinheit 14 übertragen werden. Die Übertragungszeit-Spezifikationseinheit 18 berechnet die Differenz zwischen einer Empfangszeit Tr der Zwischendaten durch die Daten-Empfangseinheit 15 und einer Zeit Ts, die vom Zeitstempel angegeben wird, als die Übertragungszeit Time.
  • Die Übertragungszeit-Spezifikationseinheit 18 gibt die Übertragungszeit Time an die zweite Inferenz-Einheit 19 aus.
  • Die zweite Inferenz-Einheit 19 wird beispielsweise durch die zweite Inferenz-Schaltung 27 implementiert, die in 10 veranschaulicht ist.
  • Die zweite Inferenz-Einheit 19 weist ein zweites Lernmodell 17 auf.
  • Die zweite Inferenz-Einheit 19 erfasst vom zweiten Lernmodell 17 die zweiten Videodaten, die das vorhergesagte Video des zweiten Videos angeben, dessen Aufnahmezeit der Kamera 1 bezogen auf diejenige des ersten Videos um die Übertragungszeit Time, die von der Übertragungszeit-Spezifikationseinheit 18 spezifiziert wird, oder mehr vorauseilt.
  • In dem Video-Übertragungssystem 2, das in 9 veranschaulicht ist, wird zum Zwecke der Vereinfachung der Erläuterung angenommen, dass die jeweilige der Verarbeitungszeiten in der Videodaten-Erfassungseinheit 11, der ersten Inferenz-Einheit 12, der Daten-Übertragungseinheit 14, der Daten-Empfangseinheit 15 und der zweiten Inferenz-Einheit 19 ignoriert werden kann. In diesem Fall übergibt die zweite Inferenz-Einheit 19 die Zwischendaten, die von der Daten-Empfangseinheit 15 empfangen werden, an das zweite Lernmodell 17, und sie erfasst - vom zweiten Lernmodell 17 - die zweiten Videodaten, die das vorhergesagte Video des zweiten Videos angeben, dessen Aufnahmezeit der Kamera 1 bezogen auf diejenige des ersten Videos um die Übertragungszeit Time vorauseilt, die von der Übertragungszeit-Spezifikationseinheit 18 spezifiziert wird.
  • In einem Fall, in dem die jeweilige Verarbeitungszeit nicht ignoriert werden kann, übergibt die zweite Inferenz-Einheit 19 die Zwischendaten, die von der Daten-Empfangseinheit 15 empfangen werden, an das zweite Lernmodell 17, und sie erfasst - vom zweiten Lernmodell 17 - die zweiten Videodaten, die das vorhergesagte Video des zweiten Videos angeben, dessen Aufnahmezeit der Kamera 1 bezogen auf diejenige des ersten Videos um die Gesamtzeit der jeweiligen Verarbeitungszeit und der Übertragungszeit Time der Zwischendaten vorauseilt.
  • Die zweite Inferenz-Einheit 19 übergibt die zweiten Videodaten beispielsweise an eine Anzeigeeinrichtung 6 oder eine Video-Verarbeitungseinrichtung (nicht dargestellt).
  • In 9 wird angenommen, dass jede von der Daten-Empfangseinheit 15, der Übertragungszeit-Spezifikationseinheit 18 und der zweiten Inferenz-Einheit 19, die Komponenten der Video-Empfangseinrichtung 5 sind, durch dedizierte Hardware implementiert sind, wie in 10 veranschaulicht. Das heißt, es wird angenommen, dass die Video-Empfangseinrichtung 5 durch die Daten-Empfangsschaltung 24, die Übertragungszeit-Spezifikationsschaltung 26 und die zweite Inferenz-Einheit 27 implementiert wird.
  • Jede von der Daten-Empfangsschaltung 24, der Übertragungszeit-Spezifikationsschaltung 26 und der zweiten Inferenz-Schaltung 27 entspricht beispielsweise einer Einzelschaltung, einer zusammengesetzten Schaltung, einem programmierten Prozessor, einem parallel-programmierten Prozessor, ASIC, FPGA oder einer Kombination davon.
  • Die Komponenten der Video-Empfangseinrichtung 5 sind nicht auf jene beschränkt, die durch dedizierte Hardware implementiert werden, und die Video-Empfangseinrichtung 5 kann durch Software, Firmware oder eine Kombination aus Software und Firmware implementiert werden.
  • In einem Fall, in dem die Video-Empfangseinrichtung 5 durch Software, Firmware oder dergleichen implementiert ist, ist ein Programm zum Veranlassen eines Computers, jede der Verarbeitungsprozeduren in der Daten-Empfangseinheit 15, der Übertragungszeit-Spezifikationseinheit 18 und der zweiten Inferenz-Einheit 19 auszuführen, im Speicher 41 gespeichert, der in 5 veranschaulicht ist. Dann führt ein Prozessor 42, der in 5 veranschaulicht ist, das Programm aus, das im Speicher 41 gespeichert ist.
  • 10 veranschaulicht ein Beispiel, bei dem jede der Komponenten der Video-Empfangseinrichtung 5 durch dedizierte Hardware implementiert ist, und 5 veranschaulicht ein Beispiel, bei dem die Video-Empfangseinrichtung 5 durch Software, Firmware oder dergleichen implementiert ist. Dies sind jedoch bloß Beispiele, und manche Komponenten in der Video-Empfangseinrichtung 5 können durch dedizierte Hardware implementiert sein, und die übrigen Komponenten können durch Software, Firmware oder dergleichen implementiert sein.
  • Als Nächstes wird der Betrieb des Video-Übertragungssystems 2 beschrieben, das in 9 veranschaulicht ist.
  • In dem Video-Übertragungssystem 2, das in 9 veranschaulicht ist, werden zur Zeit des Lernens zusätzlich zu den ersten Videodaten, die von der Videodaten-Erfassungseinheit 11 erfasst werden, Videodaten, die ein Video angeben, dessen Aufnahmezeit der Kamera 1 bezogen auf diejenige des ersten Videos um eine angenommene maximale Übertragungszeit Timemax vorauseilt, dem Lernmodell 30 als Lehrer-Daten zur Verfügung gestellt. Dann wird das Lernmodell 30 derart gelernt, dass dann, wenn die ersten Videodaten der Eingabeschicht 31 übergeben werden, die zweiten Videodaten, die ein Video angeben, dessen Aufnahmezeit bezogen auf diejenige des ersten Videos um die maximale Übertragungszeit Timemax vorauseilt, aus der Ausgabeschicht 34 ausgegeben werden.
  • Die Video-Übertragungseinrichtung 3, die in 9 veranschaulicht ist, arbeitet ähnlich wie die Video-Übertragungseinrichtung 3, die in 1 veranschaulicht ist.
  • Die Daten-Übertragungseinheit 14 der Video-Übertragungseinrichtung 3, die in 9 veranschaulicht ist, fügt jedoch den Zeitstempel, der die Zeit Ts angibt, zu der die ersten Videodaten von der Videodaten-Erfassungseinheit 11 erfasst werden, den Zwischendaten hinzu, und sie überträgt die Zwischendaten mit dem Zeitstempel an die Video-Empfangseinrichtung 5, und zwar über den Übertragungspfad 4.
  • Die Video-Empfangseinrichtung 5, die in 9 veranschaulicht ist, führt die folgende Vorverarbeitung durch, bevor die zweite Inferenz-Einheit 19 die Verarbeitung zum Erfassen der zweiten Videodaten vom zweiten Lernmodell 17 beginnt und die zweiten Videodaten an die Anzeigeeinrichtung 6 oder dergleichen ausgibt.
  • Nachfolgend wird die Vorverarbeitung durch die Video-Empfangseinrichtung 5 spezifisch beschrieben.
  • Die Daten-Empfangseinheit 15 empfängt die Zwischendaten mit Zeitstempel, die von der Daten-Übertragungseinheit 14 übertragen werden.
  • Die Daten-Empfangseinheit 15 gibt die Zwischendaten an die zweite Inferenz-Einheit 19 aus.
  • Die zweite Inferenz-Einheit 19 erfasst die Zwischendaten von der Daten-Empfangseinheit 15.
  • Die zweite Inferenz-Einheit 19 übergibt die Zwischendaten an das zweite Lernmodell 17, und sie erfasst - vom zweiten Lernmodell 17 - die zweiten Videodaten, die das Video angeben, dessen Aufnahmezeit der Kamera 1 bezogen auf diejenige des ersten Video um die maximale Übertragungszeit Timemax vorauseilt.
  • Die zweite Inferenz-Einheit 19 speichert die erfassten zweiten Videodaten im internen Speicher.
  • Zur Erleichterung der Beschreibung wird hier angenommen, dass die maximale Übertragungszeit Timemax gleich der Zeit 9 × ΔT zwischen der Aufnahmezeit T9 und der Aufnahmezeit T0 ist.
  • In diesem Fall gilt beispielsweise Folgendes: Wenn die Zwischendaten, die sich auf das erste Video zur Aufnahmezeit T0 beziehen, dem zweiten Lernmodell 17 übergeben werden, erfasst die zweite Inferenz-Einheit 19 die zweiten Videodaten, die das Video zur Aufnahmezeit T9 (= T0 + 9 × ΔT) angeben, vom zweiten Lernmodell 17 und speichert die zweiten Videodaten im internen Speicher.
  • Wenn beispielsweise die Zwischendaten, die sich auf das erste Video zur Aufnahmezeit T1 beziehen, dem zweiten Lernmodell 17 übergeben werden, erfasst die zweite Inferenz-Einheit 19 die zweiten Videodaten, die das Video zur Aufnahmezeit T10 (= T1 + 9 × ΔT) angeben, vom zweiten Lernmodell 17 und speichert die zweiten Videodaten im internen Speicher.
  • Wenn beispielsweise die Zwischendaten, die sich auf das erste Video zur Aufnahmezeit T2 beziehen, dem zweiten Lernmodell 17 übergeben werden, erfasst die zweite Inferenz-Einheit 19 die zweiten Videodaten, die das Video zur Aufnahmezeit T11 (= T2 + 9 × ΔT) angeben, vom zweiten Lernmodell 17 und speichert die zweiten Videodaten im internen Speicher.
  • Wenn beispielsweise die Zwischendaten, die sich auf das erste Video zur Aufnahmezeit T8 beziehen, dem zweiten Lernmodell 17 übergeben werden, erfasst die zweite Inferenz-Einheit 19 die zweiten Videodaten, die das Video zur Aufnahmezeit T17 (= T8 + 9 × ΔT) angeben, vom zweiten Lernmodell 17 und speichert die zweiten Videodaten im internen Speicher.
  • Im Ergebnis werden neun Elemente von zweiten Videodaten im internen Speicher der zweiten Inferenz-Einheit 19 gespeichert, und die Vorverarbeitung durch die Video-Empfangseinrichtung 5 endet. Das heißt, die zweiten Videodaten, die jedes von dem Video zur Aufnahmezeit T9, dem Video zur Aufnahmezeit T10, dem Video zur Aufnahmezeit T11, ..., und dem Video zur Aufnahmezeit T17 angeben, werden im internen Speicher gespeichert, und die Vorverarbeitung durch die Video-Empfangseinrichtung 5 endet.
  • Als Nächstes wird die Video-Empfangseinrichtung 5 nach Abschluss der Vorverarbeitung beschrieben.
  • Die Daten-Empfangseinheit 15 empfängt die Zwischendaten mit Zeitstempel, die von der Daten-Übertragungseinheit 14 übertragen werden.
  • Die Daten-Empfangseinheit 15 gibt die Zwischendaten mit Zeitstempel an die zweite Inferenz-Einheit 19 aus.
  • Außerdem gibt die Daten-Empfangseinheit 15 jeden von dem Zeitstempel, der zu den Zwischendaten hinzugefügt ist, und jede Zeitinformation, die die Empfangszeit Tr der Zwischendaten angibt, an die Übertragungszeit-Spezifikationseinheit 18 aus.
  • Die Übertragungszeit-Spezifikationseinheit 18 erfasst jeden von dem Zeitstempel und jeder Zeitinformation, die die Empfangszeit Tr angibt, von der Daten-Empfangseinheit 15.
  • Wie durch die folgende Formel (2) ausgedrückt, berechnet die Übertragungszeit-Spezifikationseinheit 18 die Differenz zwischen der Empfangszeit Tr der Zwischendaten durch die Daten-Empfangseinheit 15 und der Zeit Ts, die durch den Zeitstempel angegeben wird, als die Übertragungszeit Time der Zwischendaten. Time = Tr Ts
    Figure DE112021007596T5_0002
  • Die Übertragungszeit-Spezifikationseinheit 18 gibt die Zeitinformation, die die Übertragungszeit Time angibt, an die zweite Inferenz-Einheit 19 aus.
  • Die zweite Inferenz-Einheit 19 erfasst Zwischendaten mit Zeitstempel von der Daten-Empfangseinheit 15.
  • Außerdem erfasst die zweite Inferenz-Einheit 19 die Zeitinformation, die die Übertragungszeit Time angibt, von der Übertragungszeit-Spezifikationseinheit 18.
  • Die zweite Inferenz-Einheit 19 fügt die Übertragungszeit Time der Zeit Ts hinzu, die von dem Zeitstempel angegeben wird, der den Zwischendaten hinzugefügt ist.
  • Die zweite Inferenz-Einheit 19 erfasst - aus den neun Elementen von zweiten Videodaten, die im internen Speicher gespeichert sind - die zweiten Videodaten, die das Video angeben, dessen Aufnahmezeit der Kamera 1 bezogen auf diejenige des ersten Videos um die Übertragungszeit Time vorauseilt, als das vorhergesagte Video des zweiten Videos.
  • Wenn beispielsweise die Übertragungszeit Time gleich der Zeit ΔT zwischen der Aufnahmezeit T1 und der Aufnahmezeit T0 ist und die Zeit Ts, die vom Zeitstempel angegeben wird, die Aufnahmezeit T9 ist, erfasst die zweite Inferenz-Einheit 19 die zweiten Videodaten, die das Video zur Aufnahmezeit T10 (= T9 + ΔT) angeben, als das vorhergesagte Video des zweiten Videos, und zwar aus den neun Elementen der zweiten Videodaten, die im internen Speicher gespeichert sind.
  • Wenn beispielsweise die Übertragungszeit Time gleich der Zeit 2 × ΔT zwischen der Aufnahmezeit T2 und der Aufnahmezeit T0 ist und die Zeit Ts, die vom Zeitstempel angegeben wird, die Aufnahmezeit T9 ist, erfasst die zweite Inferenz-Einheit 19 die zweiten Videodaten, die das Video zur Aufnahmezeit T11 (= T9 + 2 × ΔT) angeben, als das vorhergesagte Video des zweiten Videos, und zwar aus den neun Elementen der zweiten Videodaten, die im internen Speicher gespeichert sind.
  • Wenn beispielsweise die Übertragungszeit Time gleich der Zeit 3 × ΔT zwischen der Aufnahmezeit T3 und der Aufnahmezeit T0 ist und die Zeit Ts, die vom Zeitstempel angegeben wird, die Aufnahmezeit T9 ist, erfasst die zweite Inferenz-Einheit 19 die zweiten Videodaten, die das Video zur Aufnahmezeit T12 (= T9 + 3 × ΔT) angeben, als das vorhergesagte Video des zweiten Videos, und zwar aus den neun Elementen der zweiten Videodaten, die im internen Speicher gespeichert sind.
  • Die zweite Inferenz-Einheit 19 übergibt die erfassten zweiten Videodaten beispielsweise an die Anzeigeeinrichtung 6 oder die Video-Verarbeitungseinrichtung (nicht dargestellt).
  • Außerdem aktualisiert die zweite Inferenz-Einheit 19 die zweiten Videodaten, die im internen Speicher gespeichert sind.
  • Das heißt, die zweite Inferenz-Einheit 19 übergibt die Zwischendaten, die aus der Daten-Empfangseinheit 15 ausgegeben werden, an das zweite Lernmodell 17, und erfasst - vom zweiten Lernmodell 17 - die zweiten Videodaten, die ein Video angeben, dessen Aufnahmezeit der Kamera 1 bezogen auf diejenige des ersten Videos um die maximale Übertragungszeit Timemax vorauseilt.
  • Wenn beispielsweise die maximale Übertragungszeit Timemax eine Zeit gleich der Zeit 9 × ΔT zwischen der Aufnahmezeit T9 und der Aufnahmezeit T0 ist und die Zeit Ts, die vom Zeitstempel angegeben wird, die Aufnahmezeit T9 ist, erfasst die zweite Inferenz-Einheit 19 - vom zweiten Lernmodell 17 - die zweiten Videodaten, die das Video zur Aufnahmezeit T18 (= T9 + 9 × ΔT) angeben.
  • Die zweite Inferenz-Einheit 19 speichert die zweiten Videodaten, die das Video zur Aufnahmezeit T18 (= T9 + 9 × ΔT) angeben, im internen Speicher.
  • Außerdem verwirft die zweite Inferenz-Einheit 19 die zweiten Videodaten, die das Video mit der ältesten Aufnahmezeit T9 unter den Elementen der zweiten Videodaten angeben, die im internen Speicher gespeichert sind.
  • In der oben beschriebenen zweiten Ausführungsform ist das Video-Übertragungssystem 2 so konfiguriert, dass es die Übertragungszeit-Spezifikationseinheit 18 aufweist, zum Spezifizieren der Übertragungszeit der Zwischendaten aus der Sendezeit der Zwischendaten durch die Daten-Übertragungseinheit 14 und der Empfangszeit der Zwischendaten durch die Daten-Empfangseinheit 15, wobei die zweite Inferenz-Einheit 19 vom zweiten Lernmodell 17 die zweiten Videodaten erfasst, die das vorhergesagte Video des zweiten Videos angeben, dessen Aufnahmezeit der Kamera 1 bezogen auf diejenige des ersten Videos um die Übertragungszeit, die von der Übertragungszeit-Spezifikationseinheit 18 spezifiziert wird, oder mehr vorauseilt. Daher gilt Folgendes: Selbst, wenn die Übertragungszeit der Zwischendaten schwankt, kann das Video-Übertragungssystem 2 einen Arbeiter oder dergleichen an einem entfernten Ort beim Absetzen einer geeigneten Arbeitsanweisung an den Ort unterstützen.
  • Dritte Ausführungsform
  • Bei einer dritten Ausführungsform wird folgende Situation beschrieben: ein Video-Übertragungssystem 2, bei dem eine zweite Inferenz-Einheit 51 Zwischendaten, die von einer Daten-Empfangseinheit empfangen werden, 15 an ein zweites Lernmodell 17-g (g = 1, ..., G) einer Mehrzahl von zweiten Lernmodelle 17-1 bis 17-G übergibt, und zweite Videodaten von dem einen zweiten Lernmodell 17-g erfasst. G ist eine Ganzzahl von 2 oder mehr.
  • 11 ist ein Konfigurationsdiagramm, das das Video-Übertragungssystem 2 gemäß der dritten Ausführungsform veranschaulicht.
  • In 11 bezeichnen die gleichen Bezugszeichen wie diejenigen in 1 und 9 die gleichen oder entsprechende Komponenten, und folglich ist deren Beschreibung weggelassen.
  • 12 ist ein Hardwarekonfigurationsdiagramm, das die Hardware der Video-Empfangseinrichtung 5 veranschaulicht, die im Video-Übertragungssystem 2 gemäß der dritten Ausführungsform enthalten ist.
  • In 12 bezeichnen die gleichen Bezugszeichen wie diejenigen in 3 und 10 die gleichen oder entsprechende Komponenten, und folglich ist deren Beschreibung weggelassen.
  • Die Hardware einer Video-Übertragungseinrichtung 3, die im Video-Übertragungssystem 2 enthalten ist, das in 11 veranschaulicht ist, ist ähnlich der Hardware der Video-Übertragungseinrichtung 3, die im Video-Übertragungssystem 2 enthalten ist, das in 1 veranschaulicht ist, oder der Video-Übertragungseinrichtung 3, die im Video-Übertragungssystem 2 enthalten ist, das in 9 veranschaulicht ist. Daher ist ein Hardwarekonfigurationsdiagramm der Video-Übertragungseinrichtung 3, die im Video-Übertragungssystem 2 enthalten ist, das in 11 veranschaulicht ist, 2.
  • Die zweite Inferenz-Einheit 51 wird beispielsweise durch eine zweite Inferenz-Schaltung 61 implementiert, die in 12 veranschaulicht ist.
  • Die zweite Inferenz-Einheit 51 weist die zweiten Lernmodelle 17-1 bis 17-G auf.
  • Die zweite Inferenz-Einheit 51 übergibt die Zwischendaten, die von der Daten-Empfangseinheit 15 empfangen werden, an das eine zweite Lernmodell 17-g (g = 1, ..., G) der Mehrzahl von zweiten Lernmodelle 17-1 bis 17-G und erfasst die zweiten Videodaten von dem einen zweiten Lernmodell 17-g.
  • Die zweite Inferenz-Einheit 51 übergibt die erfassten zweiten Videodaten beispielsweise an eine Anzeigeeinrichtung 6 oder eine Video-Verarbeitungseinrichtung (nicht dargestellt).
  • In dem Video-Übertragungssystem 2, das in 11 veranschaulicht ist, ist ein Beispiel veranschaulicht, bei dem die zweite Inferenz-Einheit 51 im Video-Übertragungssystem 2 verwendet wird, das in 1 veranschaulicht ist. Dies ist jedoch bloß ein Beispiel, und die zweite Inferenz-Einheit 51 kann auch in dem Video-Übertragungssystem 2 verwendet werden, das in 9 veranschaulicht ist.
  • Die zweite Lernmodell 17-1 ist das gleiche Lernmodell wie das zweite Lernmodell 17, das in 1 veranschaulicht ist.
  • Ähnlich dem zweiten Lernmodell 17-1 weist auch das zweite Lernmodell 17-g (g = 2, ..., G) eine Zwischenschicht 32-M, N Zwischenschichten 33-1 bis 33-N und eine Ausgabeschicht 34 auf.
  • Das zweite Lernmodell 17-g (g = 2, ..., G) unterscheidet sich von dem zweiten Lernmodell 17-1, und es wird erneut gelernt, indem ihm ferner die Zwischendaten, die von der Daten-Empfangseinheit 15 empfangen werden, und Lehrer-Daten übergeben werden.
  • Ein Subjekt, das in einem Video zur Aufnahmezeit Tj erscheint, die von den Lehrer-Daten angegeben wird, die dem zweiten Lernmodell 17-g (g = 2, ..., G) übergeben werden, und ein Subjekt, das in einem Video zur Aufnahmezeit Tj erscheint, die von Lehrer-Daten angegeben werden, die dem Lernmodell 30 übergeben werden, sind das gleiche Subjekt, wobei j = 1, ..., J, und J ist eine Ganzzahl von 2 oder mehr.
  • Das Video, das von den Lehrer-Daten angegeben wird, die dem zweiten Lernmodell 17-g übergeben werden, ist jedoch beispielsweise ein verarbeitetes Video des Videos, das von den Lehrer-Daten angegeben wird, die dem Lernmodell 30 übergeben werden.
  • Beispielsweise wird das Video, das von den Lehrer-Daten angegeben wird, die dem zweiten Lernmodell 17-2 übergeben werden, derart verarbeitet, dass das Video, das von den Lehrer-Daten angegeben wird, die dem Lernmodell 30 übergeben werden, ein Video ist, das zur Tagzeit bzw. tagsüber aufgenommen ist (nachfolgend als „Tagzeit-Video“ bezeichnet).
  • Beispielsweise wird das Video, das von den Lehrer-Daten angegeben wird, die dem zweiten Lernmodell 17-3 übergeben werden, derart verarbeitet, dass das Video, das von den Lehrer-Daten angegeben wird, die dem Lernmodell 30 übergeben werden, ein Video ist, das bei schönem Wetter aufgenommen ist (nachfolgend als „Schönwetter-Video“ bezeichnet).
  • Beispielsweise wird das Video, das von den Lehrer-Daten angegeben wird, die dem zweiten Lernmodell 17-4 übergeben werden, derart verarbeitet, dass das Video, das von den Lehrer-Daten angegeben wird, die dem Lernmodell 30 übergeben werden, ein Video ist, das während der Sommerzeit aufgenommen ist (nachfolgend als „Sommerzeit-Video“ bezeichnet).
  • Das Tagzeit-Video ist im allgemeinen klarer als ein Video, das nachts aufgenommen wird. Das Schönwetter-Video ist im allgemeinen klarer als ein Video, das bei bewölktem Wetter aufgenommen wird, oder ein Video, das bei regnerischem Wetter aufgenommen wird. Das Sommerzeit-Video ist im allgemeinen klarer als ein Video, das während einer Jahreszeit aufgenommen wird, die vom Sommer verschieden ist.
  • In einem Fall, in dem das Video, das von der Kamera 1 aufgenommen wird, ein Video ist, das tagsüber aufgenommen ist, bei schönem Wetter aufgenommen ist und zur Sommerzeit aufgenommen ist, ist das Video, das von der Kamera 1 aufgenommen wird, im allgemeinen klarer als jedes von dem verarbeiteten Tagzeit-Video, dem verarbeiteten Schönwetter-Video und dem verarbeiteten Sommerzeit-Video.
  • In 11 wird angenommen, dass jede von der Daten-Empfangseinheit 15 und der zweiten Inferenz-Einheit 51 die Komponenten der Video-Empfangseinrichtung 5 sind, durch dedizierte Hardware implementiert ist, wie in 12 veranschaulicht. Das heißt, es wird angenommen, dass die Video-Empfangseinrichtung 5 durch die Daten-Empfangsschaltung 24 und die zweite Inferenz-Einheit 61 implementiert wird.
  • Jede von der Daten-Empfangsschaltung 24 und der zweiten Inferenz-Schaltung 61 entspricht beispielsweise einer Einzelschaltung, einer zusammengesetzten Schaltung, einem programmierten Prozessor, einem parallel-programmierten Prozessor, ASIC, FPGA oder einer Kombination davon.
  • Die Komponenten der Video-Empfangseinrichtung 5 sind nicht auf jene beschränkt, die durch dedizierte Hardware implementiert werden, und die Video-Empfangseinrichtung 5 kann durch Software, Firmware oder eine Kombination aus Software und Firmware implementiert werden.
  • In einem Fall, in dem die Video-Empfangseinrichtung 5 durch Software, Firmware oder dergleichen implementiert ist, ist ein Programm zum Veranlassen eines Computers, jede der Verarbeitungsprozeduren in der Daten-Empfangseinheit 15 und der zweiten Inferenz-Einheit 51 auszuführen, im Speicher 41 gespeichert, wie in 5 veranschaulicht. Dann führt ein Prozessor 42, der in 5 veranschaulicht ist, das Programm aus, das im Speicher 41 gespeichert ist.
  • 12 veranschaulicht ein Beispiel, bei dem jede der Komponenten der Video-Empfangseinrichtung 5 durch dedizierte Hardware implementiert ist, und 5 veranschaulicht ein Beispiel, bei dem die Video-Empfangseinrichtung 5 durch Software, Firmware oder dergleichen implementiert ist. Dies sind jedoch bloß Beispiele, und manche Komponenten in der Video-Empfangseinrichtung 5 können durch dedizierte Hardware implementiert sein, und die übrigen Komponenten können durch Software, Firmware oder dergleichen implementiert sein.
  • Als Nächstes wird der Betrieb des Video-Übertragungssystems 2 beschrieben, das in 11 veranschaulicht ist.
  • In dem Video-Übertragungssystem 2, das in 11 veranschaulicht ist, wird ein Beispiel beschrieben, bei dem G = 4 gilt, und zwar zur Erleichterung der Beschreibung. Es besteht jedoch keine Beschränkung auf G = 4, und es kann auch G = 2, G = 3 oder G ≥ 5 gelten.
  • Außerdem wird bei dem Video-Übertragungssystem 2, das in 11 veranschaulicht ist, angenommen, dass die zweiten Lernmodelle 17-1 bis 17-4 Prioritäten aufweisen. Zur Erleichterung der Beschreibung wird hier angenommen, dass das zweite Lernmodell 17-1 die höchste Priorität hat, das zweite Lernmodell 17-2 die zweithöchste Priorität hat, das zweite Lernmodell 17-3 die dritthöchste Priorität hat und das zweite Lernmodell 17-4 die niedrigste Priorität hat.
  • Die Video-Übertragungseinrichtung 3 die in 11 veranschaulicht ist, arbeitet ähnlich wie die Video-Übertragungseinrichtung 3 die in 1 veranschaulicht ist.
  • Die Daten-Empfangseinheit 15 der Video-Empfangseinrichtung 5 empfängt die Zwischendaten, die von der Daten-Übertragungseinheit 14 übertragen werden.
  • Die Daten-Empfangseinheit 15 gibt die Zwischendaten an die zweite Inferenz-Einheit 51 aus.
  • Die zweite Inferenz-Einheit 51 erfasst die Zwischendaten von der Daten-Empfangseinheit 15.
  • Die zweite Inferenz-Einheit 51 übergibt die Zwischendaten an das zweite Lernmodell 17-1, wenn die Empfangszeit Tr der Zwischendaten durch die Daten-Empfangseinheit 15 im Tagzeitraum enthalten ist und das erste Video bei gutem Wetter aufgenommen ist und während der Sommerzeit aufgenommen ist. Dann erfasst die zweite Inferenz-Einheit 51 die zweiten Videodaten, die das vorhergesagte Video des zweiten Videos angeben, vom zweiten Lernmodell 17-1.
  • Eine Information, die angibt, ob oder ob nicht das erste Video ein Video ist, das bei gutem Wetter aufgenommen ist, kann von außerhalb des Video-Übertragungssystems 2 vorgegeben werden oder kann den Zwischendaten hinzugefügt werden. Eine Information, die angibt, ob oder ob nicht das erste Video ein Video ist, das während der Sommerzeit aufgenommen ist, kann von außerhalb des Video-Übertragungssystems 2 vorgegeben werden oder kann den Zwischendaten hinzugefügt werden. Außerdem kann die Information, die angibt, ob oder ob nicht das Video ein Video ist, das in der Sommerzeit aufgenommen ist, ebenfalls von einem Kalender erhalten werden, der in der Video-Empfangseinrichtung 5 enthalten ist.
  • Wenn die Empfangszeit Tr der Zwischendaten durch die Daten-Empfangseinheit 15 im Nachtzeitraum enthalten ist, übergibt die zweite Inferenz-Einheit 51 die Zwischendaten an das zweite Lernmodell 17-2 und erfasst die zweiten Videodaten, die das Tagzeit-Video angeben, als das vorhergesagte Video des zweiten Videos aus dem zweiten Lernmodell 17-2.
  • Die zweite Inferenz-Einheit 51 übergibt die Zwischendaten an das zweite Lernmodell 17-3, wenn die Empfangszeit Tr der Zwischendaten durch die Daten-Empfangseinheit 15 im Tagzeitraum enthalten sind und das erste Video ein Video ist, das bei bewölktem Wetter aufgenommen ist, oder ein Video ist, das bei regnerischem Wetter aufgenommen ist. Dann erfasst die zweite Inferenz-Einheit 51 vom zweiten Lernmodell 17-3 die zweiten Videodaten, die das Schönwetter-Video angeben, als das vorhergesagte Video des zweiten Videos.
  • Die zweite Inferenz-Einheit 51 übergibt die Zwischendaten an das zweite Lernmodell 17-4, wenn die Empfangszeit Tr der Zwischendaten durch die Daten-Empfangseinheit 15 im Tagzeitraum enthalten ist und das erste Video bei gutem Wetter aufgenommen ist und während einer Jahreszeit aufgenommen ist, die von der Sommerzeit verschieden ist. Dann erfasst die zweite Inferenz-Einheit 51 die zweiten Videodaten, die das Sommerzeit-Video angeben, als das vorhergesagte Video des zweiten Videos vom zweiten Lernmodell 17-4.
  • Die zweite Inferenz-Einheit 51 übergibt die erfassten zweiten Videodaten beispielsweise an die Anzeigeeinrichtung 6 oder die Video-Verarbeitungseinrichtung (nicht dargestellt).
  • In der oben beschriebenen dritten Ausführungsform ist das Video-Übertragungssystem 2, das in 11 veranschaulicht ist, so konfiguriert, dass es die zweiten Lernmodelle 17-1 bis 17-G gibt, die Elemente der zweiten Videodaten, die aus den zweiten Lernmodellen 17-1 bis 17-G ausgegeben werden, die vorhergesagten Videos zueinander verschiedener zweiter Videos angeben und die zweite Inferenz-Einheit 51 die Zwischendaten, die von der Daten-Empfangseinheit 15 empfangen werden, an ein zweites Lernmodell 17-g der zweiten Lernmodelle 17-1 bis 17-G übergibt und die zweiten Videodaten von dem einen zweiten Lernmodell 17-g erfasst.
  • Daher kann - ähnlich dem Video-Übertragungssystem 2, das in 1 veranschaulicht ist - das Video-Übertragungssystem 2. das in 11 veranschaulicht ist, einen Arbeiter oder dergleichen an einem entfernten Ort dabei unterstützen, eine geeignete Arbeitsanweisung an den Ort abzusetzen, und kann ein klareres Video oder dergleichen selbst dann erfassen, wenn sich die Aufnahmeumgebung der Kamera 1 ändert.
  • In dem Video-Übertragungssystem 2, das in 11 veranschaulicht ist, übergibt die zweite Inferenz-Einheit 51 die Zwischendaten, die von der Daten-Empfangseinheit 15 empfangen werden, irgendeinem der zweiten Lernmodelle 17-1 bis 17-G, und zwar auf der Basis der Empfangszeit Tr der Zwischendaten und dergleichen. Dies ist jedoch bloß ein Beispiel, und die zweite Inferenz-Einheit 51 kann auch ein Steuersignal erfassen, das das eine zweite Lernmodell, dem die Zwischendaten übergeben werden sollen, aus den zweiten Lernmodelle 17-1 bis 17-G angibt, und zwar von außerhalb des Video-Übertragungssystems 2, und sie kann die Zwischendaten dem zweiten Lernmodell übergeben, das vom Steuersignal angegeben wird.
  • Vierte Ausführungsform
  • Bei einer vierten Ausführungsform wird eine Video-Empfangseinrichtung 5 beschrieben, bei der eine Inferenz-Einheit 73 ein Lernmodell 30 aufweist.
  • 13 ist ein Konfigurationsdiagramm, das ein Video-Übertragungssystem 2 inklusive der Video-Empfangseinrichtung 5 gemäß der vierten Ausführungsform veranschaulicht.
  • 14 ist ein Hardwarekonfigurationsdiagramm, das die Hardware einer Video-Übertragungseinrichtung 3 veranschaulicht, die im Video-Übertragungssystem 2 enthalten ist, das in 13 veranschaulicht ist.
  • 15 ist ein Hardwarekonfigurationsdiagramm, das die Hardware der Video-Empfangseinrichtung 5 veranschaulicht, die im Video-Übertragungssystem 2 enthalten ist, das in 13 veranschaulicht ist.
  • In 13, 14 und 15 bezeichnen die gleichen Bezugszeichen wie diejenigen in 1, 2 und 3 die gleichen oder entsprechende Komponenten, und folglich ist deren Beschreibung weggelassen.
  • Die Video-Übertragungseinrichtung 3 weist eine Videodaten-Erfassungseinheit 11 und eine Daten-Übertragungseinheit 71 auf.
  • Die Video-Empfangseinrichtung 5 weist eine Daten-Empfangseinheit 72 und eine Inferenz-Einheit 73 auf.
  • Die Daten-Übertragungseinheit 71 wird beispielsweise durch eine Daten-Übertragungsschaltung 81 implementiert, die in 14 veranschaulicht ist.
  • Die Daten-Übertragungseinheit 71 überträgt erste Videodaten, die von der Videodaten-Erfassungseinheit 11 erfasst werden, an die Daten-Empfangseinheit 72 über den Übertragungspfad 4.
  • Die Daten-Empfangseinheit 72 wird beispielsweise durch eine Daten-Empfangsschaltung 82 implementiert, die in 15 veranschaulicht ist.
  • Die Daten-Empfangseinheit 72 empfängt die ersten Videodaten, die von der Daten-Übertragungseinheit 71 übertragen werden.
  • Die Daten-Empfangseinheit 72 gibt die ersten Videodaten an die Inferenz-Einheit 73 aus.
  • Die Inferenz-Einheit 73 wird beispielsweise durch eine Inferenz-Schaltung 83 implementiert, die in 15 veranschaulicht ist.
  • Die Inferenz-Einheit 73 weist das Lernmodell 30 auf, das in 4 veranschaulicht ist.
  • Die Inferenz-Einheit 73 übergibt die ersten Videodaten, die von der Daten-Empfangseinheit 72 empfangen werden, dem Lernmodell 30 und erfasst - vom Lernmodell 30 - zweite Videodaten, die das vorhergesagte Video des zweiten Videos angeben, dessen Aufnahmezeit der Kamera 1 bezogen auf diejenige des ersten Videos um die Übertragungszeit der ersten Videodaten von der Daten-Übertragungseinheit 71 der Video-Übertragungseinrichtung 3 zur Daten-Empfangseinheit 72 oder mehr vorauseilt. In dem Video-Übertragungssystem 2 das in 13, veranschaulicht ist, wird angenommen, dass die Übertragungszeit der ersten Videodaten festgelegt ist, und im Video-Übertragungssystem 2 ist die Übertragungszeit der ersten Videodaten ein bestehender Wert.
  • In dem Video-Übertragungssystem 2 das in 13 veranschaulicht ist, wird zum Zwecke der Vereinfachung der Erläuterung angenommen, dass die jeweilige der Verarbeitungszeiten in der Videodaten-Erfassungseinheit 11, der Daten-Übertragungseinheit 71, der Daten-Empfangseinheit 72 und der Inferenz-Einheit 73 ignoriert werden können. In diesem Fall übergibt die Inferenz-Einheit 73 die ersten Videodaten, die von der Daten-Empfangseinheit 72 empfangen werden, dem Lernmodell 30 und erfasst - vom Lernmodell 30 - die zweiten Videodaten, die das vorhergesagte Video des zweiten Videos angeben, dessen Aufnahmezeit der Kamera 1 bezogen auf diejenige des ersten Videos um die Übertragungszeit der ersten Videodaten vorauseilt.
  • In einem Fall, in dem die jeweilige Verarbeitungszeit nicht ignoriert werden kann, übergibt die Inferenz-Einheit 73 die ersten Videodaten, die von der Daten-Empfangseinheit 72 empfangen werden, dem Lernmodell 30 und erfasst - vom Lernmodell 30 - die zweiten Videodaten, die das vorhergesagte Video des zweiten Videos angeben, dessen Aufnahmezeit der Kamera 1 bezogen auf diejenige des ersten Videos um die Gesamtzeit der jeweiligen Verarbeitungszeit und der Übertragungszeit der ersten Videodaten vorauseilt.
  • Die Inferenz-Einheit 73 übergibt die zweiten Videodaten beispielsweise an eine Anzeigeeinrichtung 6 oder eine Video-Verarbeitungseinrichtung (nicht dargestellt).
  • Im Video-Übertragungssystem 2, das in 13 veranschaulicht ist, weist die Inferenz-Einheit 73 das Lernmodell 30 auf. Dies ist jedoch bloß ein Beispiel, und das Lernmodell 30 kann auch außerhalb der Inferenz-Einheit 73 angeordnet sein.
  • In dem Video-Übertragungssystem 2, das in 13 veranschaulicht ist, ist ein Beispiel veranschaulicht, in dem die Daten-Übertragungseinheit 71, die Daten-Empfangseinheit 72 und die Inferenz-Einheit 73 im Video-Übertragungssystem 2 verwendet werden, das in 1 veranschaulicht ist. Dies ist jedoch bloß ein Beispiel, und die Daten-Übertragungseinheit 71, die Daten-Empfangseinheit 72 und die Inferenz-Einheit 73 können auch in dem Video-Übertragungssystem 2 verwendet werden, das in 9 veranschaulicht ist, oder dem Video-Übertragungssystem 2, das in 11 veranschaulicht ist.
  • In 13, wird angenommen, dass jede von der Videodaten-Erfassungseinheit 11 und der Daten-Übertragungseinheit 71, die Komponenten der Video-Übertragungseinrichtung 3 sind, durch dedizierte Hardware implementiert werden, wie in 14 veranschaulicht. Das heißt, es wird angenommen, dass die Video-Übertragungseinrichtung 3 von der Videodaten-Erfassungsschaltung 21 und der Daten-Übertragungsschaltung 81 implementiert wird.
  • Außerdem wird in 13 angenommen, dass jede von der Daten-Empfangseinheit 72 und der Inferenz-Einheit 73, die Komponenten der Video-Empfangseinrichtung 5 sind, durch dedizierte Hardware implementiert ist, wie in 15 veranschaulicht. Das heißt, es wird angenommen, dass die Video-Empfangseinrichtung 5 durch die Daten-Empfangsschaltung 82 und die Inferenz-Einheit 83 implementiert wird.
  • Jede von der Videodaten-Erfassungsschaltung 21, der Daten-Übertragungsschaltung 81, der Daten-Empfangsschaltung 82 und der Inferenz-Schaltung 83 entspricht beispielsweise einer Einzelschaltung, einer zusammengesetzten Schaltung, einem programmierten Prozessor, einem parallel-programmierten Prozessor, ASIC, FPGA oder einer Kombination davon.
  • Die Komponenten der Video-Übertragungseinrichtung 3 sind nicht auf jene beschränkt, die durch dedizierte Hardware implementiert werden, und die Video-Übertragungseinrichtung 3 kann durch Software, Firmware oder eine Kombination aus Software und Firmware implementiert werden.
  • Außerdem sind die Komponenten der Video-Empfangseinrichtung 5 nicht auf jene beschränkt, die durch dedizierte Hardware implementiert werden, und die Video-Empfangseinrichtung 5 kann durch Software, Firmware oder eine Kombination aus Software und Firmware implementiert werden.
  • In einem Fall, in dem die Video-Übertragungseinrichtung 3 durch Software, Firmware oder dergleichen implementiert ist, ist ein Programm zum Veranlassen eines Computers, jede der Verarbeitungsprozeduren in der Videodaten-Erfassungseinheit 11 und der Daten-Übertragungseinheit 71 auszuführen, in einem Speicher 41 gespeichert, wie in 5 veranschaulicht. Dann führt ein Prozessor 42, der in 5 veranschaulicht ist, das Programm aus, das im Speicher 41 gespeichert ist.
  • In einem Fall, in dem die Video-Empfangseinrichtung 5 durch Software, Firmware oder dergleichen implementiert ist, ist ein Programm zum Veranlassen eines Computers, jede der Verarbeitungsprozeduren in der Daten-Empfangseinheit 72 und der Inferenz-Einheit 73 auszuführen, im Speicher 41 gespeichert, wie in 5 veranschaulicht. Dann führt ein Prozessor 42, der in 5 veranschaulicht ist, das Programm aus, das im Speicher 41 gespeichert ist.
  • 14 veranschaulicht ein Beispiel, bei dem jede der Komponenten der Video-Übertragungseinrichtung 3 durch dedizierte Hardware implementiert ist, und 5 veranschaulicht ein Beispiel, bei dem die Video-Übertragungseinrichtung 3 durch Software, Firmware oder dergleichen implementiert ist. Dies sind jedoch bloß Beispiele, und manche Komponenten in der Video-Übertragungseinrichtung 3 können durch dedizierte Hardware implementiert sein, und die übrigen Komponenten können durch Software, Firmware oder dergleichen implementiert sein.
  • 15 veranschaulicht ein Beispiel, bei dem jede der Komponenten der Video-Empfangseinrichtung 5 durch dedizierte Hardware implementiert ist, und 5 veranschaulicht ein Beispiel, bei dem die Video-Empfangseinrichtung 5 durch Software, Firmware oder dergleichen implementiert ist. Dies sind jedoch bloß Beispiele, und manche Komponenten in der Video-Empfangseinrichtung 5 können durch dedizierte Hardware implementiert sein, und die übrigen Komponenten können durch Software, Firmware oder dergleichen implementiert sein.
  • Als Nächstes wird der Betrieb des Video-Übertragungssystems 2 beschrieben, das in 13 veranschaulicht ist.
  • Die Kamera 1 gibt erste Videodaten, die das erste Video angeben, an die Videodaten-Erfassungseinheit 11 des Video-Übertragungssystems 2 aus.
  • Die Videodaten-Erfassungseinheit 11 erfasst die ersten Videodaten, die von der Kamera 1 ausgegeben werden.
  • Die Videodaten-Erfassungseinheit 11 gibt die ersten Videodaten an die Daten-Übertragungseinheit 71 aus.
  • Die Daten-Übertragungseinheit 71 erfasst die ersten Videodaten von der Videodaten-Erfassungseinheit 11.
  • Die Daten-Übertragungseinheit 71 überträgt die ersten Videodaten an die Daten-Empfangseinheit 72 über den Übertragungspfad 4.
  • Die Daten-Empfangseinheit 72 empfängt die ersten Videodaten, die von der Daten-Übertragungseinheit 71 übertragen werden.
  • Die Daten-Empfangseinheit 72 gibt die ersten Videodaten an die Inferenz-Einheit 73 aus.
  • Die Inferenz-Einheit 73 erfasst die ersten Videodaten von der Daten-Empfangseinheit 72.
  • Die Inferenz-Einheit 73 übergibt die ersten Videodaten an das Lernmodell 30 und erfasst - vom Lernmodell 30 - die zweiten Videodaten, die das vorhergesagte Video des zweiten Videos angeben, dessen Aufnahmezeit der Kamera 1 bezogen auf diejenige des ersten Videos um die Übertragungszeit der ersten Videodaten vorauseilt.
  • Das heißt, die Inferenz-Einheit 73 übergibt die ersten Videodaten an die Eingabeschicht 31 und erfasst die zweiten Videodaten von der Ausgabeschicht 34.
  • Es wird angenommen, dass die Übertragungszeit der ersten Videodaten im Übertragungspfad 4 beispielsweise einer Zeit gleich der Zeit 3 × ΔT zwischen der Aufnahmezeit T3 und der Aufnahmezeit T0 ist. In diesem Fall gilt beispielsweise Folgendes: Wenn die ersten Videodaten, die das erste Video zur Aufnahmezeit T0 angeben, der Eingabeschicht 31 des Lernmodells 30, zur Verfügung gestellt werden, werden die zweiten Videodaten, die das Video zur Aufnahmezeit T3 (= T0 + 3 × ΔT) angeben, aus der Ausgabeschicht 34 des Lernmodells 30 als das vorhergesagte Video des zweiten Videos ausgegeben.
  • Wenn beispielsweise die ersten Videodaten, die das erste Video zur Aufnahmezeit T2 angeben, der Eingabeschicht 31 des Lernmodells 30 zur Verfügung gestellt werden, werden die zweiten Videodaten, die das Video zur Aufnahmezeit T5 (= T2 + 3 × ΔT) angeben, aus der Ausgabeschicht 34 des Lernmodells 30 als das vorhergesagte Video des zweiten Videos ausgegeben.
  • Die Inferenz-Einheit 73 übergibt die zweiten Videodaten beispielsweise an die Anzeigeeinrichtung 6 oder die Video-Verarbeitungseinrichtung (nicht dargestellt).
  • In der oben beschriebenen vierten Ausführungsform ist die Video-Empfangseinrichtung 5 so konfiguriert, dass sie Folgendes aufweist: die Daten-Empfangseinheit 72 zum Empfangen der ersten Videodaten, die das erste Video angeben, die von der Video-Übertragungseinrichtung 3 übertragen werden; und die Inferenz-Einheit 73 zum Übergeben der ersten Videodaten, die von der Daten-Empfangseinheit 72 empfangen werden, an das Lernmodell 30 und zum Erfassen - vom Lernmodell 30 - der zweiten Videodaten, die das vorhergesagte Video des zweiten Videos angeben, dessen Aufnahmezeit der Kamera 1 bezogen auf diejenige des ersten Video um die Übertragungszeit der ersten Videodaten oder mehr vorauseilt. Daher kann die Video-Empfangseinrichtung 5 einen Arbeiter oder dergleichen an einem entfernten Ort unterstützen, eine geeignete Arbeitsanweisung an den Ort abzusetzen.
  • Bei der ersten bis vierten Ausführungsformen überträgt die Video-Übertragungseinrichtung 3 die Zwischendaten oder die ersten Videodaten an die Video-Empfangseinrichtung 5. Zusätzlich zur Übertragung der Zwischendaten oder der ersten Videodaten an die Video-Empfangseinrichtung 5 mittels der Video-Übertragungseinrichtung 3, wie in 16 veranschaulicht, kann die Video-Empfangseinrichtung 5 auch ein Betriebssignal für eine Maschine 93, die sich an dem Ort befindet, an die Video-Übertragungseinrichtung 3 übertragen.
  • 16 ist ein Konfigurationsdiagramm, das ein weiteres Video-Übertragungssystem 2 gemäß der ersten bis vierten Ausführungsformen veranschaulicht.
  • Eine Betriebssignal-Übertragungseinheit 91 erfasst ein Betriebssignal von einer Fernbedienung 90, die es einem Arbeiter oder dergleichen an einem entfernten Ort ermöglicht, die Maschine 93 fernzubedienen. In einem Fall, in dem die Maschine 93 beispielsweise eine Kamera ist, ist ein Signal, das einen Befehl zum Ändern der Richtung der Kamera aufweist, als das Betriebssignal denkbar. In einem Fall, in dem die Maschine 93 beispielsweise ein Roboter ist, ist ein Signal, das einen Befehl zum Bewegen einer Hand des Roboters aufweist, als das Betriebssignal denkbar.
  • Die Betriebssignal-Übertragungseinheit 91 überträgt das erfasste Betriebssignal an eine Betriebssignal-Empfangseinheit 92 über den Übertragungspfad 4.
  • Die Betriebssignal-Empfangseinheit 92 empfängt das Betriebssignal, das von der Betriebssignal-Übertragungseinheit 91 übertragen wird, und gibt das Betriebssignal an die Maschine 93 aus.
  • Die Maschine 93 ist eine Maschine, die sich an dem Ort befindet. Als Maschine 93 ist beispielsweise ein Roboter, ein Fahrzeug oder eine Kamera denkbar.
  • Die Maschine 93 arbeitet gemäß dem Betriebssignal, das von der Betriebssignal-Empfangseinheit 92 ausgegeben wird.
  • In dem Video-Übertragungssystem 2, das in 16 veranschaulicht ist, werden die Betriebssignal-Übertragungseinheit 91 und die Betriebssignal-Empfangseinheit 92 in dem Video-Übertragungssystem 2 verwendet, das in 9 veranschaulicht ist. Dies ist jedoch bloß ein Beispiel, und die Betriebssignal-Übertragungseinheit 91 und die Betriebssignal-Empfangseinheit 92 können auch in dem Video-Übertragungssystem 2 verwendet werden, das in 1, 11 oder 13 veranschaulicht ist.
  • Es sei angemerkt, dass es in der vorliegenden Erfindung möglich ist, jede der Ausführungsformen frei zu kombinieren, jede Komponente jeder der Ausführungsformen zu modifizieren oder irgendeine Komponente in jeder der Ausführungsformen wegzulassen.
  • Gewerbliche Anwendbarkeit
  • Die vorliegende Erfindung ist für ein Video-Übertragungssystem, ein Video-Übertragungsverfahren und eine Video-Empfangseinrichtung geeignet.
  • Bezugszeichenliste
  • 1
    Kamera
    2
    Video-Übertragungssystem
    3
    Video-Übertragungseinrichtung
    4
    Übertragungspfad
    5
    Video-Empfangseinrichtung
    6
    Anzeigeeinrichtung
    11
    Videodaten-Erfassungseinheit
    12
    erste Inferenz-Einheit
    13
    erstes Lernmodell
    14
    Daten-Übertragungseinheit
    15
    Daten-Empfangseinheit
    16
    zweite Inferenz-Einheit
    17
    zweites Lernmodell
    17-1 bis 17-G
    zweites Lernmodell
    18
    Übertragungszeit-Spezifikationseinheit
    19
    zweite Inferenz-Einheit
    21
    Videodaten-Erfassungsschaltung
    22
    erste Inferenz-Schaltung
    23
    Daten-Übertragungsschaltung
    24
    Daten-Empfangsschaltung
    25
    zweite Inferenz-Schaltung
    26
    Übertragungszeit-Spezifikationsschaltung
    27
    zweite Inferenz-Schaltung
    30
    Lernmodell
    31
    Eingabeschicht
    32-1 bis 32-M
    Zwischenschicht
    33-1 bis 33-N
    Zwischenschicht
    34
    Ausgabeschicht
    41
    Speicher
    42
    Prozessor
    51
    zweite Inferenz-Einheit
    61
    zweite Inferenz-Schaltung
    71
    Daten-Übertragungseinheit
    72
    Daten-Empfangseinheit
    73
    Inferenz-Einheit
    81
    Daten-Übertragungsschaltung
    82
    Daten-Empfangsschaltung
    83
    Inferenz-Schaltung
    90
    Fernbedienung
    91
    Betriebssignal-Übertragungseinheit
    92
    Betriebssignal-Empfangseinheit
    93
    Maschine
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • JP 201929746 A [0005]

Claims (5)

  1. Video-Übertragungssystem, das Folgendes aufweist: - eine Videodaten-Erfassungseinheit zum Erfassen von ersten Videodaten, die ein erstes Video angeben, das von einer Kamera aufgenommen wird; - eine erste Inferenz-Einheit zum Übergeben der ersten Videodaten, die von der Videodaten-Erfassungseinheit erfasst werden, an ein erstes Lernmodell, und zum Erfassen von Zwischendaten, die Daten sind, die von den ersten Videodaten verschieden sind, vom ersten Lernmodell; - eine Daten-Übertragungseinheit zum Übertragen der Zwischendaten, die von der ersten Inferenz-Einheit erfasst werden; - eine Daten-Empfangseinheit zum Empfangen der Zwischendaten, die von der Daten-Übertragungseinheit übertragen werden; und - eine zweite Inferenz-Einheit zum Übergeben der Zwischendaten, die von der Daten-Empfangseinheit empfangen werden, an ein zweites Lernmodell, und zum Erfassen - aus dem zweiten Lernmodell - von zweiten Videodaten, die ein vorhergesagtes Video eines zweiten Videos angeben, bei dem die Aufnahmezeit der Kamera von derjenigen des ersten Videos um die Übertragungszeit der Zwischendaten von der Daten-Übertragungseinheit zur Daten-Empfangseinheit oder mehr vorauseilt.
  2. Video-Übertragungssystem nach Anspruch 1, das ferner eine Übertragungszeit-Spezifikationseinheit zum Spezifizieren der Übertragungszeit der Zwischendaten aufweist, und zwar aus der Sendezeit der Zwischendaten mittels der Daten-Übertragungseinheit und der Empfangszeit der Zwischendaten mittels der Daten-Empfangseinheit, wobei die zweite Inferenz-Einheit zweite Videodaten von dem zweiten Lernmodell rfasst, wobei die zweiten Videodaten ein vorhergesagtes Video eines zweiten Videos angeben, dessen Aufnahmezeit der Kamera bezogen auf diejenige des ersten Videos um die Übertragungszeit, die von der Übertragungszeit-Spezifikationseinheit spezifiziert wird, oder mehr vorauseilt.
  3. Video-Übertragungssystem nach Anspruch 1, wobei es eine Mehrzahl von zweiten Lernmodellen gibt, Elemente der zweiten Videodaten, die von der Mehrzahl von zweiten Lernmodellen ausgegeben werden, vorhergesagte Videos von unterschiedlichen zweiten Videos angeben, und die zweite Inferenz-Einheit die Zwischendaten, die von der Daten-Empfangseinheit empfangen werden, an eines der Mehrzahl von zweiten Lernmodelle übergibt und zweite Videodaten von dem einen der zweiten Lernmodelle erfasst.
  4. Video-Übertragungsverfahren, das Folgendes aufweist: - Erfassen, mittels einer Videodaten-Erfassungseinheit, von ersten Videodaten, die ein erstes Video angeben, das von einer Kamera fotografiert wird; - Übergeben - mittels einer ersten Inferenz-Einheit - der ersten Videodaten, die von der Videodaten-Erfassungseinheit erfasst werden, an ein erstes Lernmodell und Erfassen von Zwischendaten, die Daten sind, die von den ersten Videodaten verschieden sind, vom ersten Lernmodell; - Übertragen - mittels einer Daten-Übertragungseinheit - der Zwischendaten, die von der ersten Inferenz-Einheit erfasst werden; - Empfangen - mittels einer Daten-Empfangseinheit - der Zwischendaten, die von der Daten-Übertragungseinheit übertragen werden; und - Übergeben - mittels einer zweiten Inferenz-Einheit - der Zwischendaten, die von der Daten-Empfangseinheit empfangen werden, an ein zweites Lernmodell und Erfassen - aus dem zweiten Lernmodell - von zweiten Videodaten, die ein vorhergesagtes Video eines zweiten Videos angeben, dessen Aufnahmezeit der Kamera bezogen auf diejenige vom ersten Video um eine Übertragungszeit der Zwischendaten von der Daten-Übertragungseinheit an die Daten-Empfangseinheit oder mehr vorauseilt.
  5. Video-Empfangseinrichtung, die Folgendes aufweist: - eine Daten-Empfangseinheit zum Empfangen von ersten Videodaten, die von einer Video-Übertragungseinrichtung übertragen werden und ein erstes Video angeben, das von einer Kamera aufgenommen wird; und - eine Inferenz-Einheit zum Übergeben der ersten Videodaten, die von der Daten-Empfangseinheit empfangen werden, an ein Lernmodell und zum Erfassen - aus dem Lernmodell - von zweiten Videodaten, die ein vorhergesagtes Video eines zweiten Videos angeben, dessen Aufnahmezeit der Kamera bezogen auf diejenige des ersten Video um eine Übertragungszeit der ersten Videodaten von der Video-Übertragungseinrichtung an die Daten-Empfangseinheit oder mehr vorauseilt.
DE112021007596.9T 2021-04-28 2021-04-28 Video-übertragungssystem, video-übertragungsverfahren und video-empfangseinrichtung Pending DE112021007596T5 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2021/016888 WO2022230081A1 (ja) 2021-04-28 2021-04-28 映像伝送システム、映像伝送方法及び映像受信装置

Publications (1)

Publication Number Publication Date
DE112021007596T5 true DE112021007596T5 (de) 2024-04-11

Family

ID=83847886

Family Applications (1)

Application Number Title Priority Date Filing Date
DE112021007596.9T Pending DE112021007596T5 (de) 2021-04-28 2021-04-28 Video-übertragungssystem, video-übertragungsverfahren und video-empfangseinrichtung

Country Status (5)

Country Link
US (1) US20240121508A1 (de)
JP (1) JPWO2022230081A1 (de)
CN (1) CN117178547A (de)
DE (1) DE112021007596T5 (de)
WO (1) WO2022230081A1 (de)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019029746A (ja) 2017-07-27 2019-02-21 住友電気工業株式会社 映像伝送システム、映像送信装置、映像受信装置、コンピュータプログラム、映像配信方法、映像送信方法および映像受信方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016118897A1 (en) * 2015-01-22 2016-07-28 Kubicam Inc. Video transmission based on independently encoded background updates
JP2017118364A (ja) * 2015-12-24 2017-06-29 日本電信電話株式会社 コミュニケーションシステム、コミュニケーション装置およびコミュニケーションプログラム
JP2020005201A (ja) * 2018-06-29 2020-01-09 日本放送協会 送信装置及び受信装置
JP7339786B2 (ja) * 2019-06-24 2023-09-06 キヤノン株式会社 情報処理装置、システム、情報処理装置の制御方法、及び、プログラム
US20220279254A1 (en) * 2019-07-17 2022-09-01 Koninklijke Kpn N.V. Facilitating Video Streaming and Processing By Edge Computing

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019029746A (ja) 2017-07-27 2019-02-21 住友電気工業株式会社 映像伝送システム、映像送信装置、映像受信装置、コンピュータプログラム、映像配信方法、映像送信方法および映像受信方法

Also Published As

Publication number Publication date
US20240121508A1 (en) 2024-04-11
WO2022230081A1 (ja) 2022-11-03
JPWO2022230081A1 (de) 2022-11-03
CN117178547A (zh) 2023-12-05

Similar Documents

Publication Publication Date Title
DE102016223422B4 (de) Verfahren zur automatischen Ermittlung extrinsischer Parameter einer Kamera eines Fahrzeugs
DE102018102688A1 (de) Bildverarbeitungsvorrichtung, Bildverarbeitungsprogramm und Bildverarbeitungssystem
DE112017007028T5 (de) Positionskontrollvorrichtung und Positionskontrollverfahren
DE102018113992A1 (de) Verfahren und Gerät zum Erfassen einer Fahrspur
DE102007048608A1 (de) Testeinrichtung, Anzeigevorrichtung und Verfahren zum Überprüfen einer Gültigkeit von Anzeigesignalen
DE112018000107T5 (de) Fahrzeugkamerakalibrierungsvorrichtung und -Verfahren
DE102006023611A1 (de) Verfahren und Vorrichtung zur pixelsynchronen Bildauswertung eines kamerabasierten Systems
DE102018203841A1 (de) System und verfahren zur fernbedienung eines bewegungskörpers
DE112010004271T5 (de) Bildaufnahmevorrichtung, anpassungseinrichtung und optisches achsen-anpasssystem für bildaufnahmevorrichtung
DE112018001594T5 (de) Betriebsinformationsübertragungseinrichtung, bauausführungsverwaltungssystem, betriebsinformationsübertragungsverfahren und programm
DE10317390A1 (de) Datenübertragungseinrichtung und elektronische Steuereinheit
DE102017123842A1 (de) Fahrspurerfassungsverfahren
DE102017219282A1 (de) Verfahren und Vorrichtung zum automatischen Erzeugen eines künstlichen neuronalen Netzes
DE102019209644A1 (de) Verfahren zum Trainieren eines neuronalen Netzes
WO2021058066A1 (de) Verarbeitung verlustbehaftet komprimierten adas-sensordaten für fahrerassistenzsysteme
DE102013109302B4 (de) Parametereinstellverfahren eines Reifenüberwachungsgeräts
DE102014209170A1 (de) Verfahren zum bereitstellen eines visuellen bilds einer verkehrsbedingung
DE112021007596T5 (de) Video-übertragungssystem, video-übertragungsverfahren und video-empfangseinrichtung
DE112014003067T5 (de) Speicherprogrammierbare Steuerung
WO2021094036A1 (de) Gemeinsames trainieren von neuronalen netzwerken zur datenreduktion und zur objekterkennung von bilddaten
DE112020007472T5 (de) Lernnutzungssystem, nutzungsvorrichtung, lernvorrichtung, programm und lernnutzungsverfahren
DE102018129906A1 (de) Kontrollsystem und Kontrollverfahren für einen Cursor
DE102014219428A1 (de) Selbstkalibrierung eines Stereokamerasystems im Auto
DE102018212652A1 (de) Deckenkartenerstellungsverfahren, deckenkartenerstellungsvorrichtung und deckenkartenerstellungsprogramm
DE102021110287A1 (de) Verfahren und System zum automatisierten Kalibrieren von Sensoren

Legal Events

Date Code Title Description
R012 Request for examination validly filed