WO2020005114A1 - Television camera and method for forming a panoramic video image and recognizing objects therein - Google Patents

Television camera and method for forming a panoramic video image and recognizing objects therein Download PDF

Info

Publication number
WO2020005114A1
WO2020005114A1 PCT/RU2019/050070 RU2019050070W WO2020005114A1 WO 2020005114 A1 WO2020005114 A1 WO 2020005114A1 RU 2019050070 W RU2019050070 W RU 2019050070W WO 2020005114 A1 WO2020005114 A1 WO 2020005114A1
Authority
WO
WIPO (PCT)
Prior art keywords
block
unit
pan
metadata
video
Prior art date
Application number
PCT/RU2019/050070
Other languages
French (fr)
Russian (ru)
Inventor
Ярослав Ярославович ПЕТРИЧКОВИЧ
Станислав Юрьевич МИЛЛЕР
Владимир Владимирович САМОЙЛОВ
Original Assignee
Акционерное общество Научно-производственный центр "Электронные вычислительно-информационные системы"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Акционерное общество Научно-производственный центр "Электронные вычислительно-информационные системы" filed Critical Акционерное общество Научно-производственный центр "Электронные вычислительно-информационные системы"
Publication of WO2020005114A1 publication Critical patent/WO2020005114A1/en

Links

Classifications

    • GPHYSICS
    • G03PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
    • G03BAPPARATUS OR ARRANGEMENTS FOR TAKING PHOTOGRAPHS OR FOR PROJECTING OR VIEWING THEM; APPARATUS OR ARRANGEMENTS EMPLOYING ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ACCESSORIES THEREFOR
    • G03B37/00Panoramic or wide-screen photography; Photographing extended surfaces, e.g. for surveying; Photographing internal surfaces, e.g. of pipe
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/66Remote control of cameras or camera parts, e.g. by remote control devices
    • H04N23/661Transmitting camera control signals through networks, e.g. control via the Internet
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/40Circuit details for pick-up tubes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/61Control of cameras or camera modules based on recognised objects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/695Control of camera direction for changing a field of view, e.g. pan, tilt or based on tracking of objects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/698Control of cameras or camera modules for achieving an enlarged field of view, e.g. panoramic image capture

Definitions

  • the invention relates to the field of video surveillance and object recognition, namely to television cameras and methods for forming a panoramic video image and object recognition on it, and can be used in video surveillance systems.
  • the panoramic video image is formed using an external computer that forms a single panoramic video stream from several video streams from stationary television cameras.
  • a rotary camera described in patent CN106331653, in which the formation of a panoramic video image is carried out when the camera moves along a predetermined route with stops at predetermined points. At these points on the route, frames of the video stream are captured. In an external computer, a panoramic image is formed from the captured frames. On the next pass along a predetermined route, the image is updated. Thus, a panoramic video stream with a low frame rate is formed in an external computer. The frame rate of the final video stream is determined by the speed capabilities of the PTZ camera and the computing capabilities of an external computer. For a wide range of tasks for the organization of video surveillance at stationary objects, such a frame rate is enough.
  • This camera is selected as a prototype of the claimed invention.
  • the disadvantages of analog cameras and the prototype of the invention are the required high power of external computers, as well as the high quality and bandwidth of the data channel from the camera to an external computer, which complicates the design and, accordingly, increases the cost of the entire system.
  • the technical result of the claimed invention is the creation of a television camera and a method for forming a panoramic video image and object recognition on it with a simpler and cheaper design, through the use of a calculator integrated in the camera, which controls the movement of the pan-tilt platform, with a television camera installed on it, along a given route , while forming a single panoramic video image, and also identifies and recognizes objects on each frame of the video image.
  • the technical result achieved is achieved by creating a television camera for forming a panoramic video image and object recognition on it, containing an inclined-swivel platform on which a video sensor 1 is installed, the output of which is connected to the input of the image recognition unit 2 and to the input of the service information overlay unit 5, the output of which is connected with a video codec 9, the first and second outputs of which are connected respectively with the fourth input of the panoramic image forming unit 10 and with the first input of the pho block 12 the formation of video streams, the second input of which is connected to the first output of the panoramic image forming unit 10, and the output of the image recognition unit 2 is connected to the first input of the decision and metadata generating unit 6, the output of which is connected to the first input of the panoramic image forming unit 10, the second output of which is connected with the input of the block for generating alarms 13, the first, second, third, fourth and fifth outputs of the control unit 7 of the pan-tilt platform are connected respectively to the power transformer 4, in steps motors 3 of the pan-tilt platform, with the
  • the video sensor 1 is configured to form the main video stream and transmit it to block 5 overlay service information and
  • - block 2 recognition of images which is configured to frame-by-frame detection of objects in the image, determining the type and coordinates relative to the frame of the detected objects and transmitting them to
  • overlay service information which is configured to overlay frames on detected objects and other visual information about the object on the video frames from the input stream, while forming the output video stream and transmitting it to
  • a video codec 9 which is configured to compress a video stream, while generating a plurality of compressed video streams with different resolutions, in accordance with a given mode of operation of the camera, and transmitting the compressed video streams to the video stream forming unit 12 and
  • a panoramic image forming unit 10 which is configured to receive a compressed video stream, a metadata stream synchronized with them, information about the current position (coordinates) of the pan-tilt platform from the pan-tilt-platform control unit 7, and of the previous frame from the frame accumulation unit 11, and based on the obtained data with the possibility of gluing a panoramic image, eliminating duplication of metadata from neighboring frames and generating a command to control the pan-tilt platform to move along a given path, and transmit the panoramic image to block 12 the formation of video streams and in block 11 accumulation of frames, and thinned stream of metadata in block 13 of the formation of alarms and block 15 communications,
  • the block 13 generating alarms is configured to generate alarm messages based on the metadata received in it and predefined alarm lines and zones, and transmitting alarm messages to the communication unit 15,
  • control unit 7 of the pan-tilt platform is configured to receive information from the motion and stop sensor 8 and the command to control the pan-tilt platform and with the possibility of generating control signals of the stepper motors 3 of the pan-tilt platform, as well as zoom control signals 4, while transmitting information about the current position (coordinates) of the pan-tilt platform and zoom in block 6 decision and metadata generation, in block 10 of the panoramic image and in block 15 communications,
  • - ONVIF support unit 14 is configured to allow the camera to communicate through the communication unit 15 with external objects in accordance with the ONVIF standard
  • - WEB interface 16 is configured to transmit external camera control commands
  • - communication unit 15 is configured to connect and interact with external objects.
  • the alarm generation unit 13 is configured to generate alarm messages selected from a set of alarm messages: the object has crossed the line; the object appeared in the zone; the object disappeared in the zone; the object entered the zone; the object has left the zone; The object has been in the zone for too long.
  • the technical result achieved is also achieved by creating a method for forming a panoramic video image and object recognition on it, in which
  • - decision making and metadata generation unit 6 by which the data received from the image recognition unit 2 is analyzed, and a decision is made whether to allocate or ignore an object, and if a decision is made to select an object, metadata is generated in the coordinates of the panoramic image based on the information about the current position (coordinates) of the pan-tilt platform received from the pan-tilt platform control unit 7, and the metadata stream is transmitted to the panoramic image generating unit 10 and in
  • a panoramic image forming unit 10 with the help of which compressed video streams, a metadata stream synchronized with them, information about the current position (coordinates) of the pan-and-tilt platform from the pan-and-tilt platform control unit 7, and the previous frame from the frame accumulating unit 11 are received, and Based on the received data, a panoramic image is “glued together”, metadata duplication from neighboring frames is eliminated, and the pan-tilt platform control commands are formed for its movement along a given th path, and transmit the panorama image in block 12 of the formation of video streams and in block 11 of the accumulation of frames, and the thinned stream of metadata in block 13 of the formation of alarms and block 15 communications,
  • alarm messages are generated based on the metadata received in it and predefined alarm lines and zones, and the alarm messages are transmitted to the communication unit 15,
  • control unit 7 of the pan-tilt platform receive information from the motion sensor 8 and stop and control commands of the pan-tilt platform and generate control signals of stepper motors 3 of the pan-tilt platform, as well as control signals of zoom 4, while transmitting information about the current the position (coordinates) of the pan-tilt platform and the zoom to decision making and metadata generating unit 6, to panoramic image forming unit 10 and to communication unit 15,
  • block ONVIF support 14 provide the interaction of the camera through block 15 communications with external objects in accordance with the ONVIF standard
  • alarm messages are generated that are selected from the set of alarm messages: the object has crossed the line; the object appeared in the zone; the object disappeared in the zone; the object entered the zone; the object has left the zone; The object has been in the zone for too long.
  • FIG. 1 General functional diagram of a television camera for forming a panoramic video image and object recognition on it, made according to the invention.
  • the panoramic image forming unit 10 controls the movement of the pan-tilt platform to ensure its non-stop movement along a predetermined route.
  • Each frame of the generated video stream is transmitted to the image recognition unit 2, in which the detection and recognition of all objects falling into the frame are carried out.
  • the thus obtained stream of metadata about the detected objects is transmitted to the panoramic image forming unit 10.
  • the location from the pan-tilt platform embeds the received video frame at the appropriate place in the panoramic image
  • the coordinates of the recognized objects are converted from the coordinates within the frame to the coordinates within the general panorama.
  • the panoramic image thus formed together with the flow of metadata about the recognized objects, is transmitted as one of the output video streams generated by the camera.
  • the image recognition unit 2 operates on a single frame, which allows the detection of objects in the image obtained from a moving camera.
  • the type and coordinates 19 relative to the frame of the detected objects are transmitted to the block 6 of decision making and the formation of metadata.
  • a decision is made on the selection or ignoring the object. If a decision is made to allocate an object, based on information about the current position (coordinates) of the pan-tilt platform received from the pan-tilt platform control unit 7, metadata is generated in the coordinates of the panoramic image.
  • the thus formed metadata stream 26 is supplied to the panoramic image forming unit 10 for embedding the metadata in the panoramic image.
  • a similar stream of metadata 22 is passed to the block 5 overlay overhead information.
  • overlay service information based on the received metadata 22, overlay frames on the detected objects and other visual information about the object on the video frames from the input main video stream 18, while forming the output video stream 25.
  • the input video stream 25 is compressed and one or more video streams 33 are formed with different resolutions, in accordance with the specified operating mode of the camera.
  • the compressed video streams 33 thus obtained are transmitted via the video codec 9 to the input of the video stream generating unit 12 (RTSP streaming) and to the input of the panoramic image forming unit 10.
  • the compressed video streams 29, the metadata stream 26 synchronized with it, information 28 about the current position (coordinates) of the pan-and-tilt platform and the previous frame 31 from the frame accumulating unit 11 are input to the panoramic image forming unit 10. Based on these data, in the panoramic image forming unit 11, the panoramic image is “glued”, metadata duplication from neighboring frames is eliminated, and the pan-tilt platform control commands 27 are formed for it movement along a given trajectory.
  • the resulting panoramic image 34 is transmitted to the block 12 of the formation of video streams (RTSP streaming), the same frame of the panoramic image 30 is transmitted to the block 11 frame accumulation.
  • the thinned stream of metadata 35, 36 is transmitted to the alarm generation unit 13 and the communication unit 15.
  • accumulation of frames buffer the frames, for the subsequent formation of a single panoramic image frame.
  • compressed video streams 33 and 34 are prepared for broadcast to the consumer in the form of video streams 37 in the RTSP format (real time streaming protocol).
  • Video streams 37 may be several, with different resolutions.
  • Ready-made video streams of the RTPS 37 format are transmitted to the communication unit 15.
  • the following types of alarm messages are generated on the basis of the metadata 35 and predefined alarm lines / zones received in it:
  • the thus generated alarm message flow 38 is transmitted to the communication unit 15.
  • the input control unit 7 of the pan-tilt platform receives information 24 from the motion and stop sensor 8 and the command 27 to move the pan-tilt platform. Based on this information, in the control unit 7 of the pan-tilt platform, the control signals 20 for stepper motors 3 of the pan-tilt platform and signals 21 for controlling the zoom 4 are generated, and the information 23, 28 and 32 of the current the position of the pan-tilt platform and zoom.
  • ONVIF Open Network Video Interface Forum - an international industry organization that is engaged in the development of standardized protocols for the interaction of various equipment and software included in the security systems
  • Using block 15 communications provide connection and interaction 43 with external, relative to the camera, objects 17.
  • the claimed invention is a fully autonomous system implemented in the form of a camera mounted on a controlled pan-tilt platform, without using external computers to control the movement of the pan-tilt platform along a predetermined route, to identify and recognize objects on each frame of the video stream and to form a single panoramic frame in the process of movement of the inclined-rotary platform along the route.
  • Such a solution can drastically reduce the requirements for computing power of computing devices and systems that control video surveillance systems or increase the number of simultaneously involved television cameras.
  • the use of the claimed invention can reduce the requirements for quality and bandwidth of the data channel from the camera to the control computing device.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Closed-Circuit Television Systems (AREA)
  • Studio Devices (AREA)

Abstract

The invention relates to the field of video surveillance and objects recognition. The technical result of the claimed invention is to create a TV camera and a method to form panoramic video image and recognize objects in this video image with simpler and cost-effective design through the use of a built-in camera computer, that controls the designated route movements of a tilt-turn platform on which the camera is installed; at the same time the camera computer forms an integrated panoramic video image, and also identifies and recognizes objects in each frame of the video image.

Description

ТЕЛЕКАМЕРА И СПОСОБ ДЛЯ ФОРМИРОВАНИЯ ПАНОРАМНОГО ВИДЕОИЗОБРАЖЕНИЯ И РАСПОЗНАВАНИЯ ОБЬЕКТОВ НА НЕМ  CAMERA AND METHOD FOR FORMING A PANORAMIC VIDEO IMAGE AND RECOGNITION OF OBJECTS ON IT
Область техники Technical field
Изобретение относятся к области видеонаблюдения и распознавания объектов, а именно к телекамерам и способам для формирования панорамного видеоизображения и распознавания объектов на нем, и может применяться в системах видеонаблюдения.  The invention relates to the field of video surveillance and object recognition, namely to television cameras and methods for forming a panoramic video image and object recognition on it, and can be used in video surveillance systems.
Уровень техники State of the art
В настоящее время в телекамерах применяют насколько основных способов формирования панорамного видеоизображения.  Currently, in television cameras they use as far as the main methods of forming a panoramic video image.
В многообъективных телекамерах (US2018095275) формирование панорамного видеоизображения осуществляют из нескольких видеопотоков как внутри телекамеры, за счет использования вычислительных ресурсов встроенного в камеру вычислителя, так и с помощью внешнего вычислителя.  In multi-objective cameras (US2018095275), the formation of a panoramic video image is carried out from several video streams both inside the camera, by using the computing resources of the computer integrated in the camera, and using an external computer.
В наборе стационарных широкоугольных телекамер с перекрывающейся областью обзора (CN205750270 (U)) формирование панорамного видеоизображения осуществляют с помощью внешнего вычислителя, который формирует единый панорамный видеопоток из нескольких видеопотоков со стационарных телекамер.  In a set of stationary wide-angle cameras with an overlapping field of view (CN205750270 (U)), the panoramic video image is formed using an external computer that forms a single panoramic video stream from several video streams from stationary television cameras.
Наиболее близкой к заявленному изобретению является поворотная телекамера, описанная в патенте CN106331653, в которой формирование панорамного видеоизображения осуществляют при движении камеры по заранее заданному маршруту с остановками, в заранее определенных точках. В этих точках маршрута производят захват кадров видеопотока. Во внешнем вычислителе из захваченных кадров формируют панорамное изображение. На следующем проходе по заранее заданному маршруту осуществляют обновление изображения. Таким образом, во внешнем вычислителе формируют панорамный видеопоток с низкой частотой кадров. Частота кадров итогового видеопотока определяется скоростными возможностями поворотной телекамеры и вычислительными возможностями внешнего вычислителя. Для большого круга задач по организации видеонаблюдения на стационарных объектах такой частоты кадров достаточно. Данная телекамера выбрана в качестве прототипа заявленного изобретения. Недостатками телекамер аналогов и прототипа изобретения является требуемая высокая мощность внешних вычислителей, а так же высокое качество и пропускная способность канала передачи данных от телекамеры до внешнего вычислителя, что усложняет конструкцию и, соответственно, удорожает всю систему. Closest to the claimed invention is a rotary camera described in patent CN106331653, in which the formation of a panoramic video image is carried out when the camera moves along a predetermined route with stops at predetermined points. At these points on the route, frames of the video stream are captured. In an external computer, a panoramic image is formed from the captured frames. On the next pass along a predetermined route, the image is updated. Thus, a panoramic video stream with a low frame rate is formed in an external computer. The frame rate of the final video stream is determined by the speed capabilities of the PTZ camera and the computing capabilities of an external computer. For a wide range of tasks for the organization of video surveillance at stationary objects, such a frame rate is enough. This camera is selected as a prototype of the claimed invention. The disadvantages of analog cameras and the prototype of the invention are the required high power of external computers, as well as the high quality and bandwidth of the data channel from the camera to an external computer, which complicates the design and, accordingly, increases the cost of the entire system.
Раскрытие изобретения Disclosure of invention
Техническим результатом заявленного изобретения является создание телекамеры и способа для формирования панорамного видеоизображения и распознавания объектов на нем с более простой и дешевой конструкцией, за счет использования встроенного в камеру вычислителя, который управляет движением наклонно-поворотной платформы, с установленной на ней телекамерой, по заданному маршруту, при этом формирует единое панорамное видеоизображение, а также выявляет и распознает объекты на каждом кадре видеоизображения.  The technical result of the claimed invention is the creation of a television camera and a method for forming a panoramic video image and object recognition on it with a simpler and cheaper design, through the use of a calculator integrated in the camera, which controls the movement of the pan-tilt platform, with a television camera installed on it, along a given route , while forming a single panoramic video image, and also identifies and recognizes objects on each frame of the video image.
Поставленный технический результат достигнут путем создания телекамеры для формирования панорамного видеоизображения и распознавания объектов на нем, содержащей наклонно-поворотную платформу, на которой установлены видеосенсор 1, выход которого соединен с входом блока 2 распознавания изображений и с входом блока 5 наложения служебной информации, выход которого соединен с видеокодеком 9, первый и второй выходы которого соединены соответственно с четвертым входом блока 10 формирования панорамного изображения и с первым входом блока 12 формирования видеопотоков, второй вход которого соединен с первым выходом блока 10 формирования панорамного изображения, а выход блока 2 распознавания изображений соединен с первым входом блока 6 принятия решения и формирования метаданных, выход которого соединен с первым входом блока 10 формирования панорамного изображения, второй выход которого соединен с входом блока 13 формирования тревог, первый, второй, третий, четвертый и пятый выходы блока 7 управления наклонно- поворотной платформой соединены соответственно с трансфакатором 4, с шаговыми двигателями 3 наклонно-поворотной платформы, с вторым входом блока 6 принятия решения и формирования метаданных, с вторым входом блока 10 формирования панорамного изображения и с первым входом блока 15 коммуникаций, второй, третий, четвертый, пятый и шестой входы которого соединены соответственно с третьим выходом блока 10 формирования панорамного изображения, с выходом блока 13 формирования тревог, с выходом блока 12 формирования видеопотоков, с выходом блока 14 поддержки ONVIF и с выходом WEB интерфейса 16, вход которого соединен с первым выходом блока 15 коммуникаций, второй вход которого соединен с выходом блока 14 поддержки ONVIF, а третий и четвертый выходы блока 10 формирования панорамного изображения соединены соответственно с первым входом блока 7 управления опорно-поворотной платформой и с входом блока 11 накопления кадров, выход которого соединен с четвертым входом блока 10 формирования панорамного изображения, причем The technical result achieved is achieved by creating a television camera for forming a panoramic video image and object recognition on it, containing an inclined-swivel platform on which a video sensor 1 is installed, the output of which is connected to the input of the image recognition unit 2 and to the input of the service information overlay unit 5, the output of which is connected with a video codec 9, the first and second outputs of which are connected respectively with the fourth input of the panoramic image forming unit 10 and with the first input of the pho block 12 the formation of video streams, the second input of which is connected to the first output of the panoramic image forming unit 10, and the output of the image recognition unit 2 is connected to the first input of the decision and metadata generating unit 6, the output of which is connected to the first input of the panoramic image forming unit 10, the second output of which is connected with the input of the block for generating alarms 13, the first, second, third, fourth and fifth outputs of the control unit 7 of the pan-tilt platform are connected respectively to the power transformer 4, in steps motors 3 of the pan-tilt platform, with the second input of the decision making and metadata generating unit 6, with the second input of the panoramic image forming unit 10 and with the first input of the communication unit 15, the second, third, fourth, fifth and sixth inputs of which are connected respectively to the third the output of the panoramic image forming unit 10, with the output the alarm generation unit 13, with the output of the video stream generation unit 12, with the output of the ONVIF support unit 14 and with the output of the WEB interface 16, the input of which is connected to the first output of the communication unit 15, the second input of which is connected to the output of the ONVIF support unit 14, and the third and fourth the outputs of the panoramic image forming unit 10 are connected respectively to the first input of the rotary support control unit 7 and to the input of the frame accumulating unit 11, the output of which is connected to the fourth input of the panoramic image forming unit 10 Ia, wherein
- видеосенсор 1 выполнен с возможностью формирования основного видеопотока и передачи его в блок 5 наложения служебной информации и в  - the video sensor 1 is configured to form the main video stream and transmit it to block 5 overlay service information and
- блок 2 распознавания изображений, который выполнен с возможностью покадрового обнаружения объектов на изображении, определения типа и координат относительно кадра обнаруженных объектов и передачи их в  - block 2 recognition of images, which is configured to frame-by-frame detection of objects in the image, determining the type and coordinates relative to the frame of the detected objects and transmitting them to
- блок 6 принятия решения и формирования метаданных, который выполнен с возможностью анализа данных, полученных от блока 2 распознавания изображений, при этом принятия решения о выделении или игнорировании объекта, причем в случае принятия решения о выделении объекта, с возможностью формирования метаданных в координатах панорамного изображения на основании информации о текущем положении (координатах) наклонно-поворотной платформы, полученной от блока 7 управления наклонно-поворотной платформой, и с возможностью передачи потока метаданных в блок 10 формирования панорамного изображения и в  - block 6 decision making and the formation of metadata, which is configured to analyze data received from block 2 image recognition, while deciding on the allocation or ignoring of the object, and in the case of a decision on the selection of the object, with the possibility of forming metadata in the coordinates of the panoramic image based on information about the current position (coordinates) of the pan-tilt platform received from the pan-tilt platform control unit 7, and with the possibility of transmitting the metadan stream s in block 10 forming the panoramic image, and
- блок 5 наложения служебной информации, который выполнен с возможностью наложения рамок на обнаруженные объекты и другой визуальной информации об объекте на видеокадры из входного потока, при этом формирования выходного видеопотока и передачи его в  - block 5 overlay service information, which is configured to overlay frames on detected objects and other visual information about the object on the video frames from the input stream, while forming the output video stream and transmitting it to
- видеокодек 9, который выполнен с возможностью сжатия видеопотока, при этом формирования множества сжатых видеопотоков с различными разрешениями, в соответствии с заданным режимом работы телекамеры, и передачи сжатых видеопотоков в блок 12 формирования видеопотоков и в  - a video codec 9, which is configured to compress a video stream, while generating a plurality of compressed video streams with different resolutions, in accordance with a given mode of operation of the camera, and transmitting the compressed video streams to the video stream forming unit 12 and
- блок 10 формирования панорамного изображения, который выполнен с возможностью получения сжатого видеопотока, синхронизированного с ними потока метаданных, информации о текущем положении (координатах) наклонно- поворотной платформы от блока 7 управления наклонно-поворотной платформой и предшествующего кадра от блока 11 накопления кадров, и на основе полученных данных с возможностью осуществления «склейки» панорамного изображения, устранения дублирования метаданных от соседних кадров и формирования команды управления наклонно-поворотной платформой для ее движения по заданной траектории, и передачи панорамного изображения в блок 12 формирования видеопотоков и в блок 11 накопления кадров, а прореженного потока метаданных в блок 13 формирования тревог и блок 15 коммуникаций, - a panoramic image forming unit 10, which is configured to receive a compressed video stream, a metadata stream synchronized with them, information about the current position (coordinates) of the pan-tilt platform from the pan-tilt-platform control unit 7, and of the previous frame from the frame accumulation unit 11, and based on the obtained data with the possibility of gluing a panoramic image, eliminating duplication of metadata from neighboring frames and generating a command to control the pan-tilt platform to move along a given path, and transmit the panoramic image to block 12 the formation of video streams and in block 11 accumulation of frames, and thinned stream of metadata in block 13 of the formation of alarms and block 15 communications,
- блок 11 накопления кадров выполнен с возможностью буферизации кадров, - block 11 accumulation of frames made with the possibility of buffering frames,
- блок 12 формирования видеопотоков выполнен с возможностью подготовки сжатых видеопотоков к трансляции потребителю, при этом преобразования их в видеопотоки формата RTSP и передачи в блок 15 коммуникаций, - block 12 the formation of video streams is made with the possibility of preparing compressed video streams for broadcast to the consumer, while converting them into video streams of the RTSP format and transmitting to block 15 communications,
- блок 13 формирования тревог выполнен с возможностью формирования сообщений о тревоге, на основе поступающих в него метаданных и заранее заданных тревожных линий и зон, и передачи сообщений о тревоге в блок 15 коммуникаций, - the block 13 generating alarms is configured to generate alarm messages based on the metadata received in it and predefined alarm lines and zones, and transmitting alarm messages to the communication unit 15,
- блок 7 управления наклонно-поворотной платформой выполнен с возможностью получения информации с датчика 8 движения и остановки и команды управления наклонно-поворотной платформой и с возможностью формирования сигналов управления шаговыми двигателями 3 наклонно-поворотной платформы, а также сигналов управления трансфокатором 4, при этом передачи информации о текущем положении (координатах) наклонно-поворотной платформы и трансфокатора в блок 6 принятия решения и формирования метаданных, в блок 10 формирования панорамного изображения и в блок 15 коммуникаций, - the control unit 7 of the pan-tilt platform is configured to receive information from the motion and stop sensor 8 and the command to control the pan-tilt platform and with the possibility of generating control signals of the stepper motors 3 of the pan-tilt platform, as well as zoom control signals 4, while transmitting information about the current position (coordinates) of the pan-tilt platform and zoom in block 6 decision and metadata generation, in block 10 of the panoramic image and in block 15 communications,
- блок 14 поддержки ONVIF выполнен с возможностью обеспечения взаимодействия телекамеры через блок 15 коммуникаций с внешними объектами в соответствии со стандартом ONVIF,  - ONVIF support unit 14 is configured to allow the camera to communicate through the communication unit 15 with external objects in accordance with the ONVIF standard,
- WEB интерфейс 16 выполнен с возможностью передачи внешних команд управления телекамерой,  - WEB interface 16 is configured to transmit external camera control commands,
- блок 15 коммуникаций выполнен с возможностью соединения и взаимодействия с внешними объектами.  - communication unit 15 is configured to connect and interact with external objects.
В предпочтительном варианте осуществления телекамеры блок 13 формирования тревог выполнен с возможностью формирования сообщений о тревоге, выбранных из набора сообщений о тревоге: объект пересек линию; объект появился в зоне; объект пропал в зоне; объект зашел в зону; объект вышел из зоны; объект слишком долго находится в зоне. In a preferred embodiment of the camera, the alarm generation unit 13 is configured to generate alarm messages selected from a set of alarm messages: the object has crossed the line; the object appeared in the zone; the object disappeared in the zone; the object entered the zone; the object has left the zone; The object has been in the zone for too long.
Поставленный технический результат достигнут также путем создания способа для формирования панорамного видеоизображения и распознавания объектов на нем, в котором  The technical result achieved is also achieved by creating a method for forming a panoramic video image and object recognition on it, in which
- с помощью видеосенсора 1 формируют основной видеопоток и передают его в блок 5 наложения служебной информации и в  - using the video sensor 1 form the main video stream and transmit it to the block 5 overlay service information and
- блок 2 распознавания, с помощью которого покадрового обнаруживают объекты на изображении, определяют типа и координаты относительно кадра обнаруженных объектов и передают их в  - recognition unit 2, with which frame-by-frame detect objects in the image, determine the type and coordinates relative to the frame of the detected objects and transmit them to
- блок 6 принятия решения и формирования метаданных, с помощью которого анализируют данные, полученные от блока 2 распознавания изображений, при этом принимают решение о выделении или игнорировании объекта, причем в случае принятия решения о выделении объекта, формируют метаданные в координатах панорамного изображения на основании информации о текущем положении (координатах) наклонно-поворотной платформы, полученной от блока 7 управления наклонно-поворотной платформой, и передают поток метаданных в блок 10 формирования панорамного изображения и в  - decision making and metadata generation unit 6, by which the data received from the image recognition unit 2 is analyzed, and a decision is made whether to allocate or ignore an object, and if a decision is made to select an object, metadata is generated in the coordinates of the panoramic image based on the information about the current position (coordinates) of the pan-tilt platform received from the pan-tilt platform control unit 7, and the metadata stream is transmitted to the panoramic image generating unit 10 and in
- блок 5 наложения служебной информации, с помощью которого накладывают рамки на обнаруженные объекты и другую визуальную информацию об объекте на видеокадры из входного потока, при этом формируют выходной видеопоток и передают его в  - block 5 overlay service information with which to impose frames on the detected objects and other visual information about the object on the video frames from the input stream, while forming the output video stream and transmit it to
- видеокодек 9, с помощью которого сжимают видеопоток, при этом формируют сжатые видеопотоки с различными разрешениями, в соответствии с заданным режимом работы телекамеры, и передают сжатые видеопотоки в блок 12 формирования видеопотоков и в  - video codec 9, with the help of which the video stream is compressed, while compressed video streams with different resolutions are formed, in accordance with the specified camera operating mode, and the compressed video streams are transmitted to the video stream generation unit 12 and to
- блок 10 формирования панорамного изображения, с помощью которого получают сжатые видеопотоки, синхронизированный с ними поток метаданных, информацию о текущем положении (координатах) наклонно-поворотной платформы от блока 7 управления наклонно-поворотной платформой и предшествующий кадр от блока 11 накопления кадров, и на основе полученных данных осуществляют «склейку» панорамного изображения, устраняют дублирование метаданных от соседних кадров и формируют команды управления наклонно-поворотной платформой для ее движения по заданной траектории, и передают панорамное изображение в блок 12 формирования видеопотоков и в блок 11 накопления кадров, а прореженный поток метаданных в блок 13 формирования тревог и блок 15 коммуникаций, - a panoramic image forming unit 10, with the help of which compressed video streams, a metadata stream synchronized with them, information about the current position (coordinates) of the pan-and-tilt platform from the pan-and-tilt platform control unit 7, and the previous frame from the frame accumulating unit 11 are received, and Based on the received data, a panoramic image is “glued together”, metadata duplication from neighboring frames is eliminated, and the pan-tilt platform control commands are formed for its movement along a given th path, and transmit the panorama image in block 12 of the formation of video streams and in block 11 of the accumulation of frames, and the thinned stream of metadata in block 13 of the formation of alarms and block 15 communications,
- с помощью блока 11 накопления кадров буферизируют кадры,  - using block 11 accumulation frames buffer frames,
- с помощью блока 12 формирования видеопотоков подготавливают сжатые видеопотоки к трансляции потребителю, при этом преобразовывают их в видеопотоки формата RTSP и передают в блок 15 коммуникаций,  - using block 12 of the formation of video streams prepare compressed video streams for broadcast to the consumer, while converting them into video streams of the RTSP format and transmit to block 15 communications,
- с помощью блока 13 формирования тревог формируют сообщения о тревоге, на основе поступающих в него метаданных и заранее заданных тревожных линий и зон, и передают сообщения о тревоге в блок 15 коммуникаций,  - using the block 13 for generating alarms, alarm messages are generated based on the metadata received in it and predefined alarm lines and zones, and the alarm messages are transmitted to the communication unit 15,
- с помощью блока 7 управления наклонно-поворотной платформой получают информацию с датчика 8 движения и остановки и команды управления наклонно- поворотной платформой и формируют сигналы управления шаговыми двигателями 3 наклонно-поворотной платформы, а также сигналы управления трансфокатором 4, при этом передают информацию о текущем положении (координатах) наклонно- поворотной платформы и трансфокатора в блок 6 принятия решения и формирования метаданных, в блок 10 формирования панорамного изображения и в блок 15 коммуникаций,  - using the control unit 7 of the pan-tilt platform receive information from the motion sensor 8 and stop and control commands of the pan-tilt platform and generate control signals of stepper motors 3 of the pan-tilt platform, as well as control signals of zoom 4, while transmitting information about the current the position (coordinates) of the pan-tilt platform and the zoom to decision making and metadata generating unit 6, to panoramic image forming unit 10 and to communication unit 15,
- с помощью блока 14 поддержки ONVIF обеспечивают взаимодействие телекамеры через блок 15 коммуникаций с внешними объектами в соответствии со стандартом ONVIF,  - using block ONVIF support 14 provide the interaction of the camera through block 15 communications with external objects in accordance with the ONVIF standard,
- с помощью WEB интерфейса 16 передают внешние команды управления телекамерой,  - using the WEB interface 16 transmit external camera control commands,
- с помощью блока 15 коммуникаций осуществляют соединение и взаимодействие с внешними объектами.  - using the block 15 communications carry out the connection and interaction with external objects.
В предпочтительном варианте осуществления способа с помощью блока 13 формирования тревог формируют сообщения о тревоге, выбранные из набора сообщений о тревоге: объект пересек линию; объект появился в зоне; объект пропал в зоне; объект зашел в зону; объект вышел из зоны; объект слишком долго находится в зоне.  In a preferred embodiment of the method, using the alarm generation unit 13, alarm messages are generated that are selected from the set of alarm messages: the object has crossed the line; the object appeared in the zone; the object disappeared in the zone; the object entered the zone; the object has left the zone; The object has been in the zone for too long.
Краткое описание чертежей Brief Description of the Drawings
Для лучшего понимания заявленного изобретения далее приводится его подробное описание с соответствующими графическими материалами. Фиг. 1. Общая функциональная схема телекамеры для формирования панорамного видеоизображения и распознавания объектов на нем, выполненная согласно изобретению. For a better understanding of the claimed invention the following is a detailed description with the corresponding graphic materials. FIG. 1. General functional diagram of a television camera for forming a panoramic video image and object recognition on it, made according to the invention.
Элементы:  Items:
1 - видеосенсор;  1 - video sensor;
2 - блок распознавания изображений;  2 - image recognition unit;
3 - шаговые двигатели наклонно-поворотной платформы;  3 - stepper motors of an inclined rotary platform;
4 - трансфокатор;  4 - zoom;
5 - блок наложения служебной информации;  5 - block overlay service information;
6 - блок принятия решения и формирования метаданных;  6 - block decision making and the formation of metadata;
7 - блок управления наклонно-поворотной платформой;  7 - control unit pan-tilt platform;
8 - датчик движения и остановки;  8 - motion and stop sensor;
9 - видеокодек;  9 - video codec;
10 - блок формирования панорамного изображения;  10 - block forming a panoramic image;
11 - блок накопления кадров;  11 - block accumulation of frames;
12 - блок формирования видеопотоков;  12 - block for the formation of video streams;
13 - блок формирования тревог;  13 - block forming alarms;
14 - блок поддержки ONVIF;  14 - ONVIF support unit;
15 - блок коммуникаций;  15 - communication unit;
16 - WEB интерфейс;  16 - WEB interface;
17 - внешние объекты;  17 - external objects;
18 - основной видеопоток;  18 - the main video stream;
19 - координаты, относительно кадра, и тип обнаруженных объектов;  19 - coordinates, relative to the frame, and the type of detected objects;
20 - сигналы управления шаговыми двигателями;  20 - control signals of stepper motors;
21 - сигналы управления трансфокатором;  21 - zoom control signals;
22 - метаданные;  22 - metadata;
23 - информация о текущем положении (координатах) наклонно-поворотной платформы;  23 - information about the current position (coordinates) of the pan-tilt platform;
24 - информация с датчика движения и остановки;  24 - information from the motion sensor and stop;
25 - выходной видеопоток;  25 - output video stream;
26 - метаданные объектов;  26 - metadata of objects;
27 - команды управления наклонно-поворотной платформой;  27 - command control pan-tilt platform;
28 - текущее положение (координаты) наклонно-поворотной платформы; 29 - сжатые видеопотоки; 28 - the current position (coordinates) of the pan-tilt platform; 29 - compressed video streams;
30 - панорамный кадр;  30 - panoramic frame;
31 - предшествующий кадр;  31 - previous frame;
32 - текущее положение (координаты) наклонно-поворотной платформы; 32 - the current position (coordinates) of the pan-tilt platform;
33 - сжатые видеопотоки; 33 - compressed video streams;
34 - панорамное изображение;  34 is a panoramic image;
35, 36 - метаданные;  35, 36 - metadata;
37 - видеопотоки формата RTPS;  37 - video streams format RTPS;
38 - сообщения о тревоге;  38 - alarm messages;
39 - 43 - данные блока коммуникации.  39 - 43 - data block communication.
Рассмотрим кратко функционирование заявленной телекамеры для формирования панорамного видеоизображения (Фиг. 1). Блок 10 формирования панорамного изображения управляет движением наклонно-поворотной платформы для обеспечения ее безостановочного движения по заранее заданному маршруту. Остальные элементы телекамеры, расположенные на наклонно-поворотной платформе, непрерывно формируют видеопоток. Каждый кадр сформированного видеопотока передают в блок 2 распознавания изображения, в котором осуществляют обнаружение и распознавание всех объектов, попавших в кадр. Полученный таким образом поток метаданных об обнаруженных объектах (тип объекта, его координаты в рамках кадра, время обнаружения) передают в блок 10 формирования панорамного изображения.  Consider briefly the functioning of the claimed camera for the formation of a panoramic video image (Fig. 1). The panoramic image forming unit 10 controls the movement of the pan-tilt platform to ensure its non-stop movement along a predetermined route. The remaining elements of the camera, located on an inclined-rotary platform, continuously form a video stream. Each frame of the generated video stream is transmitted to the image recognition unit 2, in which the detection and recognition of all objects falling into the frame are carried out. The thus obtained stream of metadata about the detected objects (type of object, its coordinates within the frame, detection time) is transmitted to the panoramic image forming unit 10.
В блоке 10 формирования панорамного изображения на основе данных местоположение от наклонно-поворотной платформы встраивают полученный видеокадр в соответствующее место на панорамном изображении, координаты распознанных объектов пересчитывают из координат в рамках кадра в координаты в рамках общей панорамы.  In the block 10 for forming a panoramic image based on the data, the location from the pan-tilt platform embeds the received video frame at the appropriate place in the panoramic image, the coordinates of the recognized objects are converted from the coordinates within the frame to the coordinates within the general panorama.
Сформированное таким образом панорамное изображение вместе с потоком метаданных о распознанных объектах передают как один из формируемых телекамерой выходных видеопотоков.  The panoramic image thus formed, together with the flow of metadata about the recognized objects, is transmitted as one of the output video streams generated by the camera.
Осуществление изобретения The implementation of the invention
Рассмотрим более подробно функционирование заявленной телекамеры для формирования панорамного видеоизображения (Фиг. 1).  Consider in more detail the functioning of the claimed camera for the formation of a panoramic video image (Fig. 1).
С помощью видеосенсора 1 (фиг. 1) формируют основной видеопоток 18, который поступает напрямую в блок 2 распознавания изображений и в блок 5 наложения служебной информации. Using the video sensor 1 (Fig. 1) form the main video stream 18, which goes directly to block 2 image recognition and block 5 overlay service information.
Блок 2 распознавания изображений работает по одному кадру, что позволяет проводить обнаружение объектов на изображении, полученном с движущейся телекамеры. Тип и координаты 19 относительно кадра обнаруженных объектов передают в блок 6 принятия решения и формирования метаданных.  The image recognition unit 2 operates on a single frame, which allows the detection of objects in the image obtained from a moving camera. The type and coordinates 19 relative to the frame of the detected objects are transmitted to the block 6 of decision making and the formation of metadata.
В блоке 6 принятия решения и формирования метаданных, на основе полученных от блока 2 распознавания изображений оценок соответствия объекта, принимают решение о выделении или игнорировании объекта. В случае принятия решения о выделении объекта, на основании информации о текущем положении (координатах) наклонно-поворотной платформы, полученной от блока 7 управления наклонно-поворотной платформой, формируют метаданные в координатах панорамного изображения. Сформированный таким образом поток метаданных 26 подают в блок 10 формирования панорамного изображения для встраивания метаданных в панорамное изображение. Аналогичный поток метаданных 22 передают в блок 5 наложения служебной информации.  In block 6, the decision and the formation of metadata, based on the assessments of conformity of the object received from block 2 recognition of the image, a decision is made on the selection or ignoring the object. If a decision is made to allocate an object, based on information about the current position (coordinates) of the pan-tilt platform received from the pan-tilt platform control unit 7, metadata is generated in the coordinates of the panoramic image. The thus formed metadata stream 26 is supplied to the panoramic image forming unit 10 for embedding the metadata in the panoramic image. A similar stream of metadata 22 is passed to the block 5 overlay overhead information.
В блоке 5 наложения служебной информации, на основе полученных метаданных 22 осуществляют наложение рамок на обнаруженные объекты и другой визуальной информации об объекте на видеокадры из входного основного видеопотока 18, при этом формируют выходной видеопоток 25.  In the block 5 overlay service information, based on the received metadata 22, overlay frames on the detected objects and other visual information about the object on the video frames from the input main video stream 18, while forming the output video stream 25.
С помощью видеокодека 9 сжимают входной видеопоток 25 и формируют один или нескольких видеопотоков 33 с различными разрешениями, в соответствии с заданным режимом работы телекамеры. Полученные таким образом, сжатые видеопотоки 33 с помощью видеокодека 9 передают на вход блока 12 формирования видеопотоков (RTSP streaming) и на вход блока 10 формирования панорамного изображения.  Using the video codec 9, the input video stream 25 is compressed and one or more video streams 33 are formed with different resolutions, in accordance with the specified operating mode of the camera. The compressed video streams 33 thus obtained are transmitted via the video codec 9 to the input of the video stream generating unit 12 (RTSP streaming) and to the input of the panoramic image forming unit 10.
На вход блока 10 формирования панорамного изображения поступают сжатые видеопотоки 29, синхронизированный с ним поток метаданных 26, информация 28 о текущем положении (координатах) наклонно-поворотной платформы и предшествующий кадр 31 от блока 11 накопления кадров. На основе этих данных в блоке 11 формирования панорамного изображения осуществляют «склейку» панорамного изображения, устраняют дублирование метаданных от соседних кадров и формируют команды 27 управления наклонно-поворотной платформой для ее движения по заданной траектории. Полученное панорамное изображение 34 передают в блок 12 формирования видеопотоков (RTSP streaming), это же кадр панорамного изображения 30 передают в блок 11 накопления кадров. Прореженный поток метаданных 35, 36 передают в блок 13 формирования тревог и блок 15 коммуникаций. The compressed video streams 29, the metadata stream 26 synchronized with it, information 28 about the current position (coordinates) of the pan-and-tilt platform and the previous frame 31 from the frame accumulating unit 11 are input to the panoramic image forming unit 10. Based on these data, in the panoramic image forming unit 11, the panoramic image is “glued”, metadata duplication from neighboring frames is eliminated, and the pan-tilt platform control commands 27 are formed for it movement along a given trajectory. The resulting panoramic image 34 is transmitted to the block 12 of the formation of video streams (RTSP streaming), the same frame of the panoramic image 30 is transmitted to the block 11 frame accumulation. The thinned stream of metadata 35, 36 is transmitted to the alarm generation unit 13 and the communication unit 15.
В блоке 11 накопления кадров осуществляют буферизацию кадров, для последующего формирования единого панорамного кадра изображения.  In block 11 accumulation of frames buffer the frames, for the subsequent formation of a single panoramic image frame.
В блоке 12 формирования видеопотоков (RTSP streaming) подготавливают сжатые видеопотоки 33 и 34 к трансляции потребителю в виде видеопотоков 37 формата RTSP (real time streaming protocol - потоковый протокол реального времени). Видеопотоков 37 может быть несколько, с различными разрешениями. Готовые видеопотоки формата RTPS 37 передают в блок 15 коммуникаций.  In block 12 of the formation of video streams (RTSP streaming), compressed video streams 33 and 34 are prepared for broadcast to the consumer in the form of video streams 37 in the RTSP format (real time streaming protocol). Video streams 37 may be several, with different resolutions. Ready-made video streams of the RTPS 37 format are transmitted to the communication unit 15.
В блоке 13 формирования тревог на основе поступающих в него метаданных 35 и заранее заданных тревожных линий/зон формируют следующие виды сообщений о тревоге:  In the block 13 for generating alarms, the following types of alarm messages are generated on the basis of the metadata 35 and predefined alarm lines / zones received in it:
- объект пересек линию;  - the object crossed the line;
- объект появился в зоне;  - the object appeared in the zone;
- объект пропал в зоне;  - the object disappeared in the zone;
- объект зашел в зону;  - the object entered the zone;
- объект вышел из зоны;  - the object has left the zone;
- объект слишком долго находится в зоне.  - The object has been in the zone for too long.
Сформированный таким образом поток сообщений 38 о тревоге передают в блок 15 коммуникаций.  The thus generated alarm message flow 38 is transmitted to the communication unit 15.
Блок 7 управления наклонно-поворотной платформой на вход получает информацию 24 с датчика 8 движения и остановки и команды 27 на перемещение наклонно-поворотной платформы. На основе этой информации в блоке 7 управления наклонно-поворотной платформой формируют сигналы 20 управления шаговыми двигателями 3 наклонно-поворотной платформы и сигналы 21 управления трансфокатором 4, при этом на выходы блока 7 управления наклонно-поворотной платформой поступает информация 23, 28 и 32 о текущем положении наклонно- поворотной платформы и трансфокатора.  The input control unit 7 of the pan-tilt platform receives information 24 from the motion and stop sensor 8 and the command 27 to move the pan-tilt platform. Based on this information, in the control unit 7 of the pan-tilt platform, the control signals 20 for stepper motors 3 of the pan-tilt platform and signals 21 for controlling the zoom 4 are generated, and the information 23, 28 and 32 of the current the position of the pan-tilt platform and zoom.
С помощью блока 14 поддержки ONVIF (Open Network Video Interface Forum - отраслевая международная организация, которая занимается разработкой стандартизованных протоколов для взаимодействия различного оборудования и программных средств, входящих в состав систем безопасности) обеспечивают взаимодействие 39, 41 через блок 15 коммуникаций 15 с внешними объектами 17 в соответствии со стандартом ONVIF. With the help of block 14 support ONVIF (Open Network Video Interface Forum - an international industry organization that is engaged in the development of standardized protocols for the interaction of various equipment and software included in the security systems) provide interaction 39, 41 through block 15 communications 15 with external objects 17 in accordance with the ONVIF standard.
С помощью WEB интерфейса 16 передают внешние команды 40, 42 управления телекамерой.  Using the WEB interface 16 transmit external commands 40, 42 control the camera.
С помощью блока 15 коммуникаций обеспечивают соединение и взаимодействие 43 с внешними, по отношению к телекамере, объектами 17.  Using block 15 communications provide connection and interaction 43 with external, relative to the camera, objects 17.
Заявленное изобретение представляет собой полностью автономную систему, реализованную в виде телекамеры установленной на управляемой наклонно- поворотной платформе, без использования внешних вычислителей для управления движением наклонно-поворотной платформы по предварительно заданному маршруту, выявления и распознавания объектов на каждом кадре видеопотока и формирования единого панорамного кадра в процессе движения наклонно- поворотной платформы по маршруту. Такое решение позволяет резко снизить требования к вычислительной мощности управляющих системами видеонаблюдения вычислительных устройств и систем или увеличить число одновременно задействованных телекамер. Кроме того, использование заявленного изобретения позволяет снизить требования к качеству и пропускной способности канала передачи данных от телекамеры до управляющего вычислительного устройства.  The claimed invention is a fully autonomous system implemented in the form of a camera mounted on a controlled pan-tilt platform, without using external computers to control the movement of the pan-tilt platform along a predetermined route, to identify and recognize objects on each frame of the video stream and to form a single panoramic frame in the process of movement of the inclined-rotary platform along the route. Such a solution can drastically reduce the requirements for computing power of computing devices and systems that control video surveillance systems or increase the number of simultaneously involved television cameras. In addition, the use of the claimed invention can reduce the requirements for quality and bandwidth of the data channel from the camera to the control computing device.
Хотя описанный выше вариант выполнения изобретения был изложен с целью иллюстрации заявленного изобретения, специалистам ясно, что возможны разные модификации, добавления и замены, не выходящие из объема и смысла заявленного изобретения, раскрытого в прилагаемой формуле изобретения.  Although the embodiment described above has been set forth to illustrate the claimed invention, it is clear to those skilled in the art that various modifications, additions and substitutions are possible without departing from the scope and meaning of the claimed invention disclosed in the attached claims.

Claims

ФОРМУЛА ИЗОБРЕТЕНИЯ CLAIM
1. Телекамера для формирования панорамного видеоизображения и распознавания объектов на нем, содержащая наклонно-поворотную платформу, на которой установлены видеосенсор 1, выход которого соединен с входом блока 2 распознавания изображений и с входом блока 5 наложения служебной информации, выход которого соединен с видеокодеком 9, первый и второй выходы которого соединены соответственно с четвертым входом блока 10 формирования панорамного изображения и с первым входом блока 12 формирования видеопотоков, второй вход которого соединен с первым выходом блока 10 формирования панорамного изображения, а выход блока 2 распознавания изображений соединен с первым входом блока 6 принятия решения и формирования метаданных, выход которого соединен с первым входом блока 10 формирования панорамного изображения, второй выход которого соединен с входом блока 13 формирования тревог, первый, второй, третий, четвертый и пятый выходы блока 7 управления наклонно-поворотной платформой соединены соответственно с трансфакатором 4, с шаговыми двигателями 3 наклонно-поворотной платформы, с вторым входом блока 6 принятия решения и формирования метаданных, с вторым входом блока 10 формирования панорамного изображения и с первым входом блока 15 коммуникаций, второй, третий, четвертый, пятый и шестой входы которого соединены соответственно с третьим выходом блока 10 формирования панорамного изображения, с выходом блока 13 формирования тревог, с выходом блока 12 формирования видеопотоков, с выходом блока 14 поддержки ONVIF и с выходом WEB интерфейса 16, вход которого соединен с первым выходом блока 15 коммуникаций, второй вход которого соединен с выходом блока 14 поддержки ONVIF, а третий и четвертый выходы блока 10 формирования панорамного изображения соединены соответственно с первым входом блока 7 управления опорно-поворотной платформой и с входом блока 11 накопления кадров, выход которого соединен с четвертым входом блока 10 формирования панорамного изображения, причем  1. A television camera for forming a panoramic video image and object recognition on it, comprising an inclined-swivel platform on which a video sensor 1 is installed, the output of which is connected to the input of the image recognition unit 2 and to the input of the service information overlay unit 5, the output of which is connected to the video codec 9, the first and second outputs of which are connected respectively to the fourth input of the panoramic image forming unit 10 and to the first input of the video stream forming unit 12, the second input of which is connected to the output of the panoramic image forming unit 10, and the output of the image recognition unit 2 is connected to the first input of the decision and metadata generating unit 6, the output of which is connected to the first input of the panoramic image forming unit 10, the second output of which is connected to the input of the alarm generating unit 13, the first , the second, third, fourth and fifth outputs of the inclined-rotary platform control unit 7 are connected respectively to the power transformer 4, to the stepper motors 3 of the inclined-rotary platform, with the second the ode of decision making and metadata generation unit 6, with the second input of the panoramic image forming unit 10 and with the first input of the communication unit 15, the second, third, fourth, fifth and sixth inputs of which are connected respectively to the third output of the panoramic image forming unit 10, with the output of the unit 13 for generating alarms, with the output of block 12 for generating video streams, with the output of block 14 supporting ONVIF and with the output of WEB interface 16, the input of which is connected to the first output of block 15 of communications, the second input of which is connected to Odom support block 14 ONVIF, and the third and fourth forming unit 10 outputs the panoramic image are respectively connected to the first input of the control unit 7, supporting-turntable and accumulation input of the frame 11, whose output is connected to a fourth input of block 10 forming the panoramic image, and
- видеосенсор 1 выполнен с возможностью формирования основного видеопотока и передачи его в блок 5 наложения служебной информации и в - the video sensor 1 is configured to form the main video stream and transmit it to block 5 overlay service information and
- блок 2 распознавания изображений, который выполнен с возможностью покадрового обнаружения объектов на изображении, определения типа и координат относительно кадра обнаруженных объектов и передачи их в - block 2 image recognition, which is made with the possibility frame-by-frame detection of objects in the image, determining the type and coordinates relative to the frame of detected objects and transferring them to
- блок 6 принятия решения и формирования метаданных, который выполнен с возможностью анализа данных, полученных от блока 2 распознавания изображений, при этом принятия решения о выделении или игнорировании объекта, причем в случае принятия решения о выделении объекта, с возможностью формирования метаданных в координатах панорамного изображения на основании информации о текущем положении (координатах) наклонно-поворотной платформы, полученной от блока 7 управления наклонно- поворотной платформой, и с возможностью передачи потока метаданных в блок - block 6 decision making and the formation of metadata, which is configured to analyze data received from block 2 image recognition, while deciding on the allocation or ignoring of the object, and in the case of a decision on the selection of the object, with the possibility of forming metadata in the coordinates of the panoramic image based on the information about the current position (coordinates) of the pan-tilt platform received from the pan-tilt platform control unit 7, and with the possibility of transmitting the metadata stream ny in the block
10 формирования панорамного изображения и в 10 forming a panoramic image and in
- блок 5 наложения служебной информации, который выполнен с возможностью наложения рамок на обнаруженные объекты и другой визуальной информации об объекте на видеокадры из входного потока, при этом формирования выходного видеопотока и передачи его в  - block 5 overlay service information, which is configured to overlay frames on detected objects and other visual information about the object on the video frames from the input stream, while forming the output video stream and transmitting it to
- видеокодек 9, который выполнен с возможностью сжатия видеопотока, при этом формирования множества сжатых видеопотоков с различными разрешениями, в соответствии с заданным режимом работы телекамеры, и передачи сжатых видеопотоков в блок 12 формирования видеопотоков и в - блок 10 формирования панорамного изображения, который выполнен с возможностью получения сжатого видеопотока, синхронизированного с ними потока метаданных, информации о текущем положении (координатах) наклонно-поворотной платформы от блока 7 управления наклонно-поворотной платформой и предшествующего кадра от блока 11 накопления кадров, и на основе полученных данных с возможностью осуществления «склейки» панорамного изображения, устранения дублирования метаданных от соседних кадров и формирования команды управления наклонно-поворотной платформой для ее движения по заданной траектории, и передачи панорамного изображения в блок 12 формирования видеопотоков и в блок 11 накопления кадров, а прореженного потока метаданных в блок 13 формирования тревог и блок 15 коммуникаций,  - a video codec 9, which is configured to compress a video stream, while generating a plurality of compressed video streams with different resolutions, in accordance with a predetermined camera operating mode, and transmitting the compressed video streams to a video stream generating unit 12 and to - a panoramic image generating unit 10, which is configured to the possibility of obtaining a compressed video stream, a metadata stream synchronized with them, information about the current position (coordinates) of the pan-tilt platform from the pan-tilt-turn control unit 7 and the previous frame from the frame accumulation unit 11, and based on the data obtained with the possibility of gluing a panoramic image, eliminating duplication of metadata from neighboring frames and generating a command to control the pan-tilt platform to move along a given path, and transmit a panoramic image to the block 12 for generating video streams and to the block 11 for accumulating frames, and the thinned stream of metadata to the block 13 for generating alarms and the block 15 for communications,
- блок 11 накопления кадров выполнен с возможностью буферизации кадров, - block 11 accumulation of frames made with the possibility of buffering frames,
- блок 12 формирования видеопотоков выполнен с возможностью подготовки сжатых видеопотоков к трансляции потребителю, при этом преобразования их в видеопотоки формата RTSP и передачи в блок 15 коммуникаций, - block 12 the formation of video streams made with the possibility of preparation compressed video streams to broadcast to the consumer, while converting them into video streams of the RTSP format and transmitting them to the communication unit 15,
- блок 13 формирования тревог выполнен с возможностью формирования сообщений о тревоге, на основе поступающих в него метаданных и заранее заданных тревожных линий и зон, и передачи сообщений о тревоге в блок 15 коммуникаций,  - the block 13 generating alarms is configured to generate alarm messages based on the metadata received in it and predefined alarm lines and zones, and transmitting alarm messages to the communication unit 15,
блок 7 управления наклонно-поворотной платформой выполнен с возможностью получения информации с датчика 8 движения и остановки и команды управления наклонно-поворотной платформой и с возможностью формирования сигналов управления шаговыми двигателями 3 наклонно- поворотной платформы, а также сигналов управления трансфокатором 4, при этом передачи информации о текущем положении (координатах) наклонно- поворотной платформы и трансфокатора в блок 6 принятия решения и формирования метаданных, в блок 10 формирования панорамного изображения и в блок 15 коммуникаций,  the control unit 7 of the pan-tilt platform is configured to receive information from the motion and stop sensor 8 and the command to control the pan-tilt platform and with the possibility of generating control signals of the stepper motors 3 of the pan-tilt platform, as well as control signals of the zoom 4, while transmitting information about the current position (coordinates) of the pan-tilt platform and zoom into decision making and metadata generating unit 6, into panoramic image generating unit 10 and in block 15 communications,
- блок 14 поддержки ONVIF выполнен с возможностью обеспечения взаимодействия телекамеры через блок 15 коммуникаций с внешними объектами в соответствии со стандартом ONVIF,  - ONVIF support unit 14 is configured to allow the camera to communicate through the communication unit 15 with external objects in accordance with the ONVIF standard,
- WEB интерфейс 16 выполнен с возможностью передачи внешних команд управления телекамерой,  - WEB interface 16 is configured to transmit external camera control commands,
блок 15 коммуникаций выполнен с возможностью соединения и взаимодействия с внешними объектами.  communication unit 15 is configured to connect and interact with external objects.
2. Телекамера по п. 1, о т л и ч а ю щ а я с я тем, что блок 13 формирования тревог выполнен с возможностью формирования сообщений о тревоге, выбранных из набора сообщений о тревоге: объект пересек линию; объект появился в зоне; объект пропал в зоне; объект зашел в зону; объект вышел из зоны; объект слишком долго находится в зоне.  2. The camera according to claim 1, with the exception that the alarm generation unit 13 is configured to generate alarm messages selected from a set of alarm messages: the object has crossed the line; the object appeared in the zone; the object disappeared in the zone; the object entered the zone; the object has left the zone; The object has been in the zone for too long.
3. Способ для формирования панорамного видеоизображения и распознавания объектов на нем, в котором  3. A method for forming a panoramic video image and recognition of objects on it, in which
- с помощью видеосенсора 1 формируют основной видеопоток и передают его в блок 5 наложения служебной информации и в  - using the video sensor 1 form the main video stream and transmit it to the block 5 overlay service information and
- блок 2 распознавания, с помощью которого покадрового обнаруживают объекты на изображении, определяют типа и координаты относительно кадра обнаруженных объектов и передают их в - recognition unit 2, with which frame-by-frame detect objects in the image, determine the type and coordinates relative to the frame detected objects and pass them to
- блок 6 принятия решения и формирования метаданных, с помощью которого анализируют данные, полученные от блока 2 распознавания изображений, при этом принимают решение о выделении или игнорировании объекта, причем в случае принятия решения о выделении объекта, формируют метаданные в координатах панорамного изображения на основании информации о текущем положении (координатах) наклонно-поворотной платформы, полученной от блока 7 управления наклонно-поворотной платформой, и передают поток метаданных в блок 10 формирования панорамного изображения и в  - decision making and metadata generation unit 6, by which the data received from the image recognition unit 2 is analyzed, and a decision is made whether to allocate or ignore an object, and if a decision is made to select an object, metadata is generated in the coordinates of the panoramic image based on the information about the current position (coordinates) of the pan-tilt platform received from the pan-tilt platform control unit 7, and the metadata stream is transmitted to the panoramic image generating unit 10 and in
- блок 5 наложения служебной информации, с помощью которого накладывают рамки на обнаруженные объекты и другую визуальную информацию об объекте на видеокадры из входного потока, при этом формируют выходной видеопоток и передают его в  - block 5 overlay service information with which to impose frames on the detected objects and other visual information about the object on the video frames from the input stream, while forming the output video stream and transmit it to
- видеокодек 9, с помощью которого сжимают видеопоток, при этом формируют сжатые видеопотоки с различными разрешениями, в соответствии с заданным режимом работы телекамеры, и передают сжатые видеопотоки в блок 12 формирования видеопотоков и в  - video codec 9, with the help of which the video stream is compressed, while compressed video streams with different resolutions are formed, in accordance with the specified camera operating mode, and the compressed video streams are transmitted to the video stream generation unit 12 and to
- блок 10 формирования панорамного изображения, с помощью которого получают сжатые видеопотоки, синхронизированный с ними поток метаданных, информацию о текущем положении (координатах) наклонно-поворотной платформы от блока 7 управления наклонно-поворотной платформой и предшествующий кадр от блока 11 накопления кадров, и на основе полученных данных осуществляют «склейку» панорамного изображения, устраняют дублирование метаданных от соседних кадров и формируют команды управления наклонно-поворотной платформой для ее движения по заданной траектории, и передают панорамное изображение в блок 12 формирования видеопотоков и в блок 11 накопления кадров, а прореженный поток метаданных в блок 13 формирования тревог и блок 15 коммуникаций,  - a panoramic image forming unit 10, with the help of which compressed video streams, a metadata stream synchronized with them, information about the current position (coordinates) of the pan-and-tilt platform from the pan-and-tilt platform control unit 7, and a previous frame from the frame accumulation unit 11 are received, and Based on the data obtained, a panoramic image is “glued together”, metadata duplication from neighboring frames is eliminated, and the pan-tilt platform control commands are formed for its movement along a given th path, and transmitting the panorama image generating portion 12 streams and accumulating frame portion 11 and a thinned stream metadata generation unit 13 and alarm unit 15 communications,
- с помощью блока 11 накопления кадров буферизируют кадры,  - using block 11 accumulation frames buffer frames,
- с помощью блока 12 формирования видеопотоков подготавливают сжатые видеопотоки к трансляции потребителю, при этом преобразовывают их в видеопотоки формата RTSP и передают в блок 15 коммуникаций,  - using block 12 of the formation of video streams prepare compressed video streams for broadcast to the consumer, while converting them into video streams of the RTSP format and transmit to block 15 communications,
- с помощью блока 13 формирования тревог формируют сообщения о тревоге, на основе поступающих в него метаданных и заранее заданных тревожных линий и зон, и передают сообщения о тревоге в блок 15 коммуникаций, - using the block 13 of the formation of alarms generate alarm messages, on based on the metadata received in it and predefined alarm lines and zones, and transmit alarm messages to the communication unit 15,
- с помощью блока 7 управления наклонно-поворотной платформой получают информацию с датчика 8 движения и остановки и команды управления наклонно-поворотной платформой и формируют сигналы управления шаговыми двигателями 3 наклонно-поворотной платформы, а также сигналы управления трансфокатором 4, при этом передают информацию о текущем положении (координатах) наклонно-поворотной платформы и трансфокатора в блок 6 принятия решения и формирования метаданных, в блок 10 формирования панорамного изображения и в блок 15 коммуникаций,  - using the control unit 7 of the pan-tilt platform receive information from the motion sensor 8 and stop and control commands of the pan-tilt platform and generate control signals of stepper motors 3 of the pan-tilt platform, as well as control signals of zoom 4, while transmitting information about the current the position (coordinates) of the pan-tilt platform and the zoom in block 6 decision making and the formation of metadata, in block 10 of the formation of panoramic images and in block 15 of communications,
- с помощью блока 14 поддержки ONVIF обеспечивают взаимодействие телекамеры через блок 15 коммуникаций с внешними объектами в соответствии со стандартом ONVIF,  - using block ONVIF support 14 provide the interaction of the camera through block 15 communications with external objects in accordance with the ONVIF standard,
- с помощью WEB интерфейса 16 передают внешние команды управления телекамерой,  - using the WEB interface 16 transmit external camera control commands,
с помощью блока 15 коммуникаций осуществляют соединение и взаимодействие с внешними объектами.  using block 15 communications carry out the connection and interaction with external objects.
4. Способ по п. 3, о т л и ч а ю щ и й с я тем, что с помощью блока 13 формирования тревог формируют сообщения о тревоге, выбранные из набора сообщений о тревоге: объект пересек линию; объект появился в зоне; объект пропал в зоне; объект зашел в зону; объект вышел из зоны; объект слишком долго находится в зоне.  4. The method according to p. 3, with the fact that using the block 13 generating alarms generate alarm messages selected from a set of alarm messages: the object crossed the line; the object appeared in the zone; the object disappeared in the zone; the object entered the zone; the object has left the zone; The object has been in the zone for too long.
PCT/RU2019/050070 2018-05-29 2019-05-29 Television camera and method for forming a panoramic video image and recognizing objects therein WO2020005114A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
RU2018119699A RU2686154C1 (en) 2018-05-29 2018-05-29 Television camera and method of generating panoramic image and recognition of objects on it
RU2018119699 2018-05-29

Publications (1)

Publication Number Publication Date
WO2020005114A1 true WO2020005114A1 (en) 2020-01-02

Family

ID=66314769

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/RU2019/050070 WO2020005114A1 (en) 2018-05-29 2019-05-29 Television camera and method for forming a panoramic video image and recognizing objects therein

Country Status (2)

Country Link
RU (1) RU2686154C1 (en)
WO (1) WO2020005114A1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2585370B (en) 2019-07-02 2022-02-23 Parsempo Ltd Digital display set-up

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020054211A1 (en) * 2000-11-06 2002-05-09 Edelson Steven D. Surveillance video camera enhancement system
US20050100087A1 (en) * 2002-08-28 2005-05-12 Hiroyuki Hasegawa Monitoring system and method, program, and recording medium
US20080036877A1 (en) * 2006-08-09 2008-02-14 Matsushita Electric Industrial Co., Ltd. Network camera and control method thereof

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8872940B2 (en) * 2008-03-03 2014-10-28 Videoiq, Inc. Content aware storage of video data
JP4623199B2 (en) * 2008-10-27 2011-02-02 ソニー株式会社 Image processing apparatus, image processing method, and program
US9900505B2 (en) * 2014-07-23 2018-02-20 Disney Enterprises, Inc. Panoramic video from unstructured camera arrays with globally consistent parallax removal
US10275928B2 (en) * 2016-04-05 2019-04-30 Qualcomm Incorporated Dual fisheye image stitching for spherical image content

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020054211A1 (en) * 2000-11-06 2002-05-09 Edelson Steven D. Surveillance video camera enhancement system
US20050100087A1 (en) * 2002-08-28 2005-05-12 Hiroyuki Hasegawa Monitoring system and method, program, and recording medium
US20080036877A1 (en) * 2006-08-09 2008-02-14 Matsushita Electric Industrial Co., Ltd. Network camera and control method thereof

Also Published As

Publication number Publication date
RU2686154C1 (en) 2019-04-24

Similar Documents

Publication Publication Date Title
US10911694B2 (en) System and method for creating metadata model to improve multi-camera production
US10791229B2 (en) Peripheral bus video communication using internet protocol
US8160129B2 (en) Image pickup apparatus and image distributing method
KR101120131B1 (en) Intelligent Panorama Camera, Circuit and Method for Controlling thereof, and Video Monitoring System
CN102801963B (en) Electronic PTZ method and device based on high-definition digital camera monitoring
JP5835932B2 (en) Image processing apparatus and control method thereof
JP2005012415A (en) System and server for monitored video image monitoring and monitored video image generating method
JP6280011B2 (en) Image transmission / reception system and method for performing data reduction processing based on region request
US20180213185A1 (en) Method and system for monitoring a scene based on a panoramic view
KR20110044101A (en) Watching apparatus using dual camera
WO2020005114A1 (en) Television camera and method for forming a panoramic video image and recognizing objects therein
US9071731B2 (en) Image display device for reducing processing load of image display
JP5520146B2 (en) Video receiving apparatus and control method thereof
RU182656U1 (en) CAMERA FOR FORMING A PANORAMIC VIDEO IMAGE AND RECOGNITION OF OBJECTS ON IT
CN110570614B (en) Video monitoring system and intelligent camera
US20220294971A1 (en) Collaborative object detection
Hofer et al. Comparison of Analyze-Then-Compress Methods in Edge-Assisted Visual SLAM
Zafar et al. Smart phone interface for robust control of mobile robots
US11997428B2 (en) Control system and method
KR100869150B1 (en) Netwok video server system
RU2682315C1 (en) Method of tv camera installed on a tilt-turning platform
CN114830674A (en) Transmitting apparatus and receiving apparatus
CN109660595B (en) Remote operation method and device for real-time street view
KR20110133160A (en) Monitoring and security system based realtime multi-channel video
KR102192240B1 (en) Communication system for remote place by using 5G network

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19758522

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

32PN Ep: public notification in the ep bulletin as address of the adressee cannot be established

Free format text: NOTING OF LOSS OF RIGHTS PURSUANT TO RULE 112(1) EPC (EPO FORM 1205A DATED 19.04.2021)

122 Ep: pct application non-entry in european phase

Ref document number: 19758522

Country of ref document: EP

Kind code of ref document: A1