WO2024080543A1 - 비디오 서머리를 생성하는 전자 장치 및 그 동작 방법 - Google Patents

비디오 서머리를 생성하는 전자 장치 및 그 동작 방법 Download PDF

Info

Publication number
WO2024080543A1
WO2024080543A1 PCT/KR2023/012659 KR2023012659W WO2024080543A1 WO 2024080543 A1 WO2024080543 A1 WO 2024080543A1 KR 2023012659 W KR2023012659 W KR 2023012659W WO 2024080543 A1 WO2024080543 A1 WO 2024080543A1
Authority
WO
WIPO (PCT)
Prior art keywords
video
electronic device
event
file
metadata
Prior art date
Application number
PCT/KR2023/012659
Other languages
English (en)
French (fr)
Inventor
김진수
김도완
엄수용
이요섭
바르단 레디 카발리비슈누
이주봉
심강석
이주하
김석현
박준형
송가진
이선기
Original Assignee
삼성전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020220167650A external-priority patent/KR20240050223A/ko
Application filed by 삼성전자 주식회사 filed Critical 삼성전자 주식회사
Publication of WO2024080543A1 publication Critical patent/WO2024080543A1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/8547Content authoring involving timestamps for synchronizing content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/8549Creating video summaries, e.g. movie trailer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/765Interface circuits between an apparatus for recording and another apparatus
    • H04N5/77Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • H04N5/92Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback

Definitions

  • Embodiments of the present disclosure relate to an electronic device that generates a video summary and a method of operating the same.
  • IoT Internet of Things
  • IoT technology can provide intelligent Internet technology services that create new value in human life by collecting and analyzing data generated from devices.
  • IoT technology can be applied to fields such as smart homes, smart buildings, smart cities, smart cars, and smart home appliances.
  • Home network technology can provide various services to users at home through a home network.
  • a user can access IoT devices that make up a home network using a personal electronic device (e.g., a smart phone). Users can access various services through IoT devices.
  • a personal electronic device e.g., a smart phone.
  • Embodiments of the present disclosure may store audio and/or video data acquired through at least one camera.
  • Embodiments of the present disclosure may generate event metadata related to audio and/or video data acquired through at least one camera.
  • Embodiments of the present disclosure may generate a video summary related to audio and/or video data acquired through at least one camera.
  • An electronic device includes a communication circuit for communicating with a server and at least one external camera, and operatively coupled with the communication circuit and configured to perform video data processing between the server and the at least one external camera. It may include at least one processor.
  • the at least one processor may be configured to receive video data from at least one camera.
  • the at least one processor may be configured to generate event metadata indicating an event detected in the video data based on the video data.
  • the at least one processor may be configured to generate video clip files including at least one video frame related to the event among the video data.
  • the at least one processor may be configured to store the event metadata and the video clip files.
  • a method of operating an electronic device configured to perform video data processing between a server and at least one external camera may include receiving video data from at least one camera.
  • the method may include generating event metadata indicating an event detected in the video data based on the video data.
  • the method may include generating a video clip file including at least one video frame related to the event among the video data.
  • the method may include storing the event metadata and the video clip file.
  • An electronic device may include a communication circuit and at least one processor operatively connected to the communication circuit.
  • the at least one processor may be configured to transmit a summary request signal including an event type and/or period to an external electronic device. After transmitting the summary request signal, the at least one processor receives a video summary file corresponding to the event type and/or the period from the external electronic device and a summary related to the original video of each video frame included in the video summary file. Can be configured to receive metadata.
  • the at least one processor may be configured to play the video summary file.
  • the at least one processor may be configured to receive a user input for selecting a first video frame while playing the video summary file.
  • the at least one processor may be configured to transmit an original request signal requesting an original video clip file including the first video frame to the external electronic device in response to the user input.
  • the at least one processor may be configured to receive the original video clip file including the first video frame from the external electronic device.
  • a method of operating an electronic device may include transmitting a summary request signal including an event type and/or period to an external electronic device.
  • the method includes sending a video summary file corresponding to the event type and/or the period and summary metadata related to the original video of each video frame included in the video summary file from the external electronic device after transmitting the summary request signal. It may include a receiving operation.
  • the method may include playing the video summary file.
  • the method may include receiving a user input to select a first video frame while playing the video summary file.
  • the method may include transmitting an original request signal requesting an original video clip file including the first video frame to the external electronic device in response to the user input.
  • the method may include receiving the original video clip file including the first video frame from the external electronic device.
  • a system for processing video data includes a server, at least one camera, an edge device configured to perform video data processing between the server and the at least one camera, and the server and/or the edge device. It may include a user device capable of communicating with.
  • the edge device may be configured to receive the video data from the at least one camera.
  • the edge device may be configured to generate event metadata indicating events detected in the video data based on the video data.
  • the edge device may be configured to generate video clip files including at least one video frame related to the event among the video data.
  • the edge device may be configured to store the event metadata and the video clip files.
  • the edge device may be configured to transmit at least one video clip file selected from among the video clip files to the user device in response to a request from the user device.
  • a non-transitory computer-readable storage medium storing one or more programs, wherein when the one or more programs are executed by at least one processor of the electronic device, the electronic device; Receive video data from at least one camera, generate event metadata indicating an event detected in the video data based on the video data, and include at least one video frame related to the event among the video data. Generate a clip file, store the event metadata and the video clip file, receive a summary request signal indicating an event type and/or period from an external electronic device, and determine the event type and/or duration based on the summary request signal.
  • search for first event metadata indicating a first event corresponding to the period search for first event metadata indicating a first event corresponding to the period, and, based on the first event metadata, select the first event from among the first video clip files stored in association with the first event metadata.
  • extracting a corresponding at least one first video frame generating a video summary file including the extracted at least one first video frame, generating summary metadata indicating the first video clip file, and It may include instructions for transmitting a video summary file to the external electronic device.
  • a non-transitory computer-readable storage medium storing one or more programs, wherein when the one or more programs are executed by at least one processor of the electronic device, the electronic device;
  • a summary request signal including an event type and/or period is transmitted to an external electronic device, and after transmitting the summary request signal, a video summary file and the video corresponding to the event type and/or period are received from the external electronic device.
  • Receive summary metadata associated with the original video of each video frame included in the summary file play the video summary file, and receive a user input for selecting a first video frame while playing the video summary file,
  • an original request signal requesting an original video clip file including the first video frame is transmitted to the external electronic device, and the original video clip file including the first video frame is sent to the external electronic device. It may include commands configuring to receive from.
  • FIG 1 shows an internet of things (IoT) system according to one embodiment.
  • IoT internet of things
  • Figure 2 is a block diagram of an electronic device in a network environment according to various embodiments.
  • Figure 3 shows the structure of a network system including a camera according to an embodiment.
  • FIG. 4A is a block diagram showing the configuration of an electronic device according to an embodiment.
  • FIG. 4B is a diagram for explaining the software configuration of an electronic device according to an embodiment.
  • Figure 5 is a flowchart illustrating an operation of providing an event-based video summary according to an embodiment.
  • Figure 6 is a flowchart illustrating an operation of providing an original video according to an event-based video summary according to an embodiment.
  • Figure 7 is a diagram for explaining pairing between a camera and an electronic device according to an embodiment.
  • Figures 8a and 8b show signal flow diagrams for explaining registration and video analysis of an electronic device according to an embodiment.
  • Figure 9 is a diagram for explaining video analysis and event detection according to an embodiment.
  • Figure 10 shows a signal flow diagram to explain the creation of event metadata according to an embodiment.
  • Figure 11 is a diagram for explaining an event-based video summary according to an embodiment.
  • Figure 12 is a diagram for explaining a video summary file according to one embodiment.
  • Figure 13 is a signal flow diagram for explaining event-based summary video generation according to an embodiment.
  • Figure 14 is a diagram for explaining the use of a video summary according to an embodiment.
  • Figure 15 is a signal flow diagram for explaining provision of a video summary according to an embodiment.
  • Figure 16 is a signal flow diagram illustrating the provision of a video summary through video summary information according to an embodiment.
  • FIGS. 17A, 17B, 17C, and 17D are diagrams illustrating a user interface that provides an event-based video summary according to an embodiment.
  • FIG. 18 is a flowchart illustrating an operation of generating an event-based video summary according to an embodiment.
  • Figure 19 is a flowchart for explaining an operation of generating event metadata according to an embodiment.
  • FIG. 1 shows an Internet of things (IoT) system 100 according to one embodiment. Meanwhile, at least some of the components in FIG. 1 may be omitted, and may be implemented to include additional components not shown.
  • IoT Internet of things
  • the IoT system 100 includes a plurality of electronic devices connectable to the data network 116 or 146.
  • the IoT system 100 includes a first IoT server 110, a first node 120, a voice assistance server 130, a second IoT server 140, and a second node. 150, or may include at least one of the devices 121, 122, 123, 124, 125, 136, 137, 151, 152, and 153.
  • the first IoT server 110 may include at least one of a communication interface 111, a processor 112, or a storage unit 113.
  • the second IoT server 140 may include at least one of a communication interface 141, a processor 142, or a storage unit 143.
  • “IoT server” in this document refers to a relay device (e.g., first node 120 or second node (120), for example, based on a data network (e.g., data network 116 or data network 146).
  • a data network e.g., data network 116 or data network 146.
  • One or more devices e.g., devices 121, 122, 123, 124, 125, 151, 152, 153) can be remotely controlled and/or monitored via 150) or directly without a relay device.
  • Device herein refers to a sensor, appliance, office electronic device, or It is a device for performing processes, and there are no restrictions on its type.
  • a device that receives a control command and performs an operation corresponding to the control command may be named a “target device.”
  • the IoT server may be called a central server in that it selects a target device among a plurality of devices and provides control commands.
  • the first IoT server 110 may communicate with the devices 121, 122, and 123 through the data network 116.
  • Data network 116 may refer to a network for long-distance communication, such as the Internet or a computer network (e.g., LAN or WAN), or may include a cellular network.
  • the first IoT server 110 may be connected to the data network 116 through the communication interface 111.
  • the communication interface 111 may include a communication device (or communication module) to support communication of the data network 116, and may be integrated into one component (e.g., a single chip), or may be integrated into a plurality of separate components. It can be implemented with components (e.g., multiple chips).
  • the first IoT server 110 may communicate with the devices 121, 122, and 123 through the first node 120.
  • the first node 120 may receive data from the first IoT server 110 through the data network 116 and transmit the received data to at least some of the devices 121, 122, and 123.
  • the first node 120 may receive data from at least some of the devices 121, 122, and 123, and transmit the received data to the first IoT server 110 through the data network 116.
  • the first node 120 may function as a bridge between the data network 116 and the devices 121, 122, and 123. Meanwhile, in FIG. 1, it is shown as if there is only one first node 120, but this is simply an example and there is no limit to the number.
  • a “node” in this document may be an edge computing system, or may be a hub device.
  • the first node 120 supports wired and/or wireless communication of the data network 116, and may also support wired and/or wireless communication with the devices 121, 122, and 123.
  • the first node 120 uses a short-range communication network such as at least one of Bluetooth, Wi-Fi, Wi-Fi direct, Z-wave, Zig-bee, INSETEON, X10, or IrDA (infrared data association). It can be connected to devices 121, 122, and 123 through, but there is no limitation on the type of communication.
  • the first node 120 may be placed (or located) within an environment such as, for example, a home, an office, a factory, a building, an off-site location, or other types of premises. Accordingly, the devices 121, 122, and 123 can be monitored and/or controlled by the service provided by the first IoT server 110, and the devices 121, 122, and 123 have a direct connection to the first IoT server 110. It may not be required to have the capability of complete network communication (e.g., Internet communication) for Devices 121, 122, and 123 are shown as being implemented as electronic devices in a home environment, such as light switches, proximity sensors, temperature sensors, etc., but are illustrative and not limiting.
  • complete network communication e.g., Internet communication
  • the first IoT server 110 may support direct communication with the devices 124 and 125.
  • direct communication may mean communication that does not go through a relay device such as the first node 120, for example, communication through a cellular communication network and/or a data network.
  • the first IoT server 110 may transmit a control command to at least some of the devices 121, 122, 123, 124, and 125.
  • control command may mean data that causes a controllable device to perform a specific operation, and the specific operation is an operation performed by the device, such as outputting information, sensing information, reporting information, It may include management of information (e.g. deletion or creation), and there is no limit to the type.
  • the processor 112 generates a control command from an external source (e.g., the voice assistant server 130, the second IoT server 140, the external system 160, or at least some of the devices 121, 122, 123, 124, and 125).
  • control command may be generated based on the obtained information.
  • the processor 112 may generate a control command based on the monitoring results of at least some of the devices 121, 122, 123, 124, and 125 satisfying specified conditions.
  • the processor 112 may control the communication interface 111 to transmit control commands to the target device.
  • the processor 112 is a central processing unit (CPU), a digital signal processor (DSP), an application processor (AP), or a communication processor (CP). It may be implemented as a combination of one or more of a general-purpose processor such as a general-purpose processor, a graphical processing unit (GPU), a graphics-specific processor such as a vision processing unit (VPU), or an artificial intelligence-specific processor such as a neural processing unit (NPU).
  • a general-purpose processor such as a general-purpose processor, a graphical processing unit (GPU), a graphics-specific processor such as a vision processing unit (VPU), or an artificial intelligence-specific processor such as a neural processing unit (NPU).
  • the above-described processing unit is merely exemplary, and the processor 112 is, for example, an operation means capable of executing instructions stored in the memory 113 based on information stored in the database 115 and outputting the executed result.
  • the processor 112 may configure a web-based interface based on the API 114 or expose resources managed by the first IoT server 110 to the outside. .
  • the web-based interface may support communication between the first IoT server 110 and an external web service, for example.
  • the processor 112 may, for example, allow the external system 160 to control and/or access the devices 121, 122, and 123.
  • External system 160 may be, for example, an independent system that is not related to or part of system 100.
  • External system 160 may be, for example, an external server or a website. However, security is required for access to the devices 121, 122, and 123 from the external system 160 or the resources of the first IoT server 110.
  • the processor 112 and the automation application may expose an API endpoint (eg, a universal resource locator (URL)) based on the API 114 to the outside.
  • the first IoT server 110 may transmit a control command to the target device among the devices 121, 122, and 123.
  • the description of the communication interface 141, the processor 142, the API 144 of the storage unit 143, and the database 145 of the second IoT server 140 are described in detail in the communication of the first IoT server 110. It may be substantially the same as the description of the interface 111, the processor 112, the API 114 of the storage unit 113, and the database 115.
  • the description of the second node 150 may be substantially the same as the description of the first node 120.
  • the second IoT server 140 may transmit a control command to a target device among the devices 151, 152, and 153.
  • the first IoT server 110 and the second IoT server 140 may be operated by the same service provider in one embodiment, but may be operated by different service providers in another embodiment.
  • the voice assistant server 130 may transmit and receive data with the first IoT server 110 through the data network 116.
  • the voice assistant server 130 may include at least one of a communication interface 131, a processor 132, and a storage unit 133.
  • the communication interface 131 may communicate with the smart phone 136 or the AI speaker 137 through a data network (not shown) and/or a cellular network (not shown).
  • the smart phone 136 or the AI speaker 137 may include a microphone, acquire a user voice, convert it into a voice signal, and transmit the voice signal to the voice assistant server 130.
  • the processor 132 may receive a voice signal from the smart phone 136 or the AI speaker 137 through the communication interface 131.
  • the processor 132 may process the received voice signal based on the stored model 134.
  • the processor 132 may generate (or confirm) a control command using the processing result based on information stored in the database 135.
  • the storage units 113, 133, and 143 include flash memory type, hard disk type, multimedia card micro type, and card type memory (e.g. SD or It may include at least one type of non-transitory storage medium among memory, magnetic memory, magnetic disk, or optical disk, and there is no limitation on the type.
  • At least one device (eg, device 124) communicating with the first IoT server 110 may be an electronic device (eg, electronic device 201 of FIG. 2) in a network environment.
  • FIG. 2 is a block diagram of an electronic device 201 in a network environment 200 according to various embodiments.
  • the electronic device 201 communicates with the electronic device 202 through the first network 298 (e.g., a short-range wireless communication network) or through the second network 299. It is possible to communicate with at least one of the electronic device 204 or the server 208 through (e.g., a long-distance wireless communication network). According to one embodiment, the electronic device 201 may communicate with the electronic device 204 through the server 208.
  • the first network 298 e.g., a short-range wireless communication network
  • the server 208 e.g., a long-distance wireless communication network
  • the electronic device 201 includes a processor 220, a memory 230, an input module 250, an audio output module 255, a display module 260, an audio module 270, and a sensor module ( 276), interface 277, connection terminal 278, haptic module 279, camera module 280, power management module 288, battery 289, communication module 290, subscriber identification module 296 , or may include an antenna module 297.
  • at least one of these components eg, the connection terminal 278) may be omitted, or one or more other components may be added to the electronic device 201.
  • some of these components e.g., sensor module 276, camera module 280, or antenna module 297) are integrated into one component (e.g., display module 260). It can be.
  • Processor 220 executes software (e.g., program 240) to operate at least one other component (e.g., hardware or software component) of electronic device 201 connected to processor 220. It can be controlled and various data processing or operations can be performed. According to one embodiment, as at least part of the data processing or computation, the processor 220 stores instructions or data received from another component (e.g., the sensor module 276 or the communication module 290) in the volatile memory 232. The commands or data stored in the volatile memory 232 can be processed, and the resulting data can be stored in the non-volatile memory 234.
  • software e.g., program 240
  • the processor 220 stores instructions or data received from another component (e.g., the sensor module 276 or the communication module 290) in the volatile memory 232.
  • the commands or data stored in the volatile memory 232 can be processed, and the resulting data can be stored in the non-volatile memory 234.
  • the processor 220 includes a main processor 221 (e.g., a central processing unit or an application processor) or an auxiliary processor 223 that can operate independently or together (e.g., a graphics processing unit, a neural network processing unit ( It may include a neural processing unit (NPU), an image signal processor, a sensor hub processor, or a communication processor).
  • a main processor 221 e.g., a central processing unit or an application processor
  • auxiliary processor 223 e.g., a graphics processing unit, a neural network processing unit ( It may include a neural processing unit (NPU), an image signal processor, a sensor hub processor, or a communication processor.
  • the electronic device 201 includes a main processor 221 and a auxiliary processor 223, the auxiliary processor 223 may be set to use lower power than the main processor 221 or be specialized for a designated function. You can.
  • the auxiliary processor 223 may be implemented separately from the main processor 221 or as part of it.
  • the auxiliary processor 223 may, for example, act on behalf of the main processor 221 while the main processor 221 is in an inactive (e.g., sleep) state, or while the main processor 221 is in an active (e.g., application execution) state. ), together with the main processor 221, at least one of the components of the electronic device 201 (e.g., the display module 260, the sensor module 276, or the communication module 290) At least some of the functions or states related to can be controlled.
  • coprocessor 223 e.g., image signal processor or communication processor
  • may be implemented as part of another functionally related component e.g., camera module 280 or communication module 290. there is.
  • the auxiliary processor 223 may include a hardware structure specialized for processing artificial intelligence models.
  • Artificial intelligence models can be created through machine learning. For example, such learning may be performed in the electronic device 201 itself on which the artificial intelligence model is performed, or may be performed through a separate server (e.g., server 208).
  • Learning algorithms may include, for example, supervised learning, unsupervised learning, semi-supervised learning, or reinforcement learning, but It is not limited.
  • An artificial intelligence model may include multiple artificial neural network layers.
  • Artificial neural networks include deep neural network (DNN), convolutional neural network (CNN), recurrent neural network (RNN), restricted boltzmann machine (RBM), belief deep network (DBN), bidirectional recurrent deep neural network (BRDNN), It may be one of deep Q-networks or a combination of two or more of the above, but is not limited to the examples described above.
  • artificial intelligence models may additionally or alternatively include software structures.
  • the memory 230 may store various data used by at least one component (eg, the processor 220 or the sensor module 276) of the electronic device 201. Data may include, for example, input data or output data for software (e.g., program 240) and instructions related thereto.
  • Memory 230 may include volatile memory 232 or non-volatile memory 234.
  • the program 240 may be stored as software in the memory 230 and may include, for example, an operating system 242, middleware 244, or applications 246.
  • the input module 250 may receive commands or data to be used in a component of the electronic device 201 (e.g., the processor 220) from outside the electronic device 201 (e.g., a user).
  • the input module 250 may include, for example, a microphone, mouse, keyboard, keys (eg, buttons), or digital pen (eg, stylus pen).
  • the sound output module 255 may output sound signals to the outside of the electronic device 201.
  • the sound output module 255 may include, for example, a speaker or receiver. Speakers can be used for general purposes such as multimedia playback or recording playback.
  • the receiver can be used to receive incoming calls. According to one embodiment, the receiver may be implemented separately from the speaker or as part of it.
  • the display module 260 can visually provide information to the outside of the electronic device 201 (eg, a user).
  • the display module 260 may include, for example, a display, a hologram device, or a projector, and a control circuit for controlling the device.
  • the display module 260 may include a touch sensor configured to detect a touch, or a pressure sensor configured to measure the intensity of force generated by the touch.
  • the audio module 270 can convert sound into an electrical signal or, conversely, convert an electrical signal into sound. According to one embodiment, the audio module 270 acquires sound through the input module 250, the sound output module 255, or an external electronic device (e.g., directly or wirelessly connected to the electronic device 201). Sound may be output through an electronic device 202 (e.g., speaker or headphone).
  • an electronic device 202 e.g., speaker or headphone
  • the sensor module 276 detects the operating state (e.g., power or temperature) of the electronic device 201 or the external environmental state (e.g., user state) and generates an electrical signal or data value corresponding to the detected state. can do.
  • the sensor module 276 includes, for example, a gesture sensor, a gyro sensor, an air pressure sensor, a magnetic sensor, an acceleration sensor, a grip sensor, a proximity sensor, a color sensor, an IR (infrared) sensor, a biometric sensor, It may include a temperature sensor, humidity sensor, or light sensor.
  • the interface 277 may support one or more designated protocols that can be used to directly or wirelessly connect the electronic device 201 to an external electronic device (e.g., the electronic device 202).
  • the interface 277 may include, for example, a high definition multimedia interface (HDMI), a universal serial bus (USB) interface, an SD card interface, or an audio interface.
  • HDMI high definition multimedia interface
  • USB universal serial bus
  • SD card interface Secure Digital Card interface
  • audio interface audio interface
  • the connection terminal 278 may include a connector through which the electronic device 201 can be physically connected to an external electronic device (eg, the electronic device 202).
  • the connection terminal 278 may include, for example, an HDMI connector, a USB connector, an SD card connector, or an audio connector (eg, a headphone connector).
  • the haptic module 279 can convert electrical signals into mechanical stimulation (e.g., vibration or movement) or electrical stimulation that the user can perceive through tactile or kinesthetic senses.
  • the haptic module 279 may include, for example, a motor, a piezoelectric element, or an electrical stimulation device.
  • the camera module 280 can capture still images and moving images.
  • the camera module 280 may include one or more lenses, image sensors, image signal processors, or flashes.
  • the power management module 288 can manage power supplied to the electronic device 201.
  • the power management module 288 may be implemented as at least a part of, for example, a power management integrated circuit (PMIC).
  • PMIC power management integrated circuit
  • Battery 289 may supply power to at least one component of electronic device 201.
  • the battery 289 may include, for example, a non-rechargeable primary battery, a rechargeable secondary battery, or a fuel cell.
  • Communication module 290 is configured to provide a direct (e.g., wired) communication channel or wireless communication channel between the electronic device 201 and an external electronic device (e.g., electronic device 202, electronic device 204, or server 208). It can support establishment and communication through established communication channels. Communication module 290 operates independently of processor 220 (e.g., an application processor) and may include one or more communication processors that support direct (e.g., wired) communication or wireless communication.
  • processor 220 e.g., an application processor
  • the communication module 290 is a wireless communication module 292 (e.g., a cellular communication module, a short-range wireless communication module, or a global navigation satellite system (GNSS) communication module) or a wired communication module 294 (e.g., : LAN (local area network) communication module, or power line communication module) may be included.
  • a wireless communication module 292 e.g., a cellular communication module, a short-range wireless communication module, or a global navigation satellite system (GNSS) communication module
  • GNSS global navigation satellite system
  • a wired communication module 294 e.g., : LAN (local area network) communication module, or power line communication module
  • the corresponding communication module is a first network 298 (e.g., a short-range communication network such as Bluetooth, wireless fidelity (WiFi) direct, or infrared data association (IrDA)) or a second network 299 (e.g., legacy It may communicate with an external electronic device 204 through a telecommunication network such as a cellular network, a 5G network, a next-generation communication network, the Internet, or a computer network (e.g., LAN or WAN).
  • a telecommunication network such as a cellular network, a 5G network, a next-generation communication network, the Internet, or a computer network (e.g., LAN or WAN).
  • a telecommunication network such as a cellular network, a 5G network, a next-generation communication network, the Internet, or a computer network (e.g., LAN or WAN).
  • a telecommunication network such as a cellular network, a 5G network, a next-generation communication network
  • the wireless communication module 292 uses subscriber information (e.g., International Mobile Subscriber Identifier (IMSI)) stored in the subscriber identification module 296 within a communication network such as the first network 298 or the second network 299.
  • subscriber information e.g., International Mobile Subscriber Identifier (IMSI)
  • IMSI International Mobile Subscriber Identifier
  • the wireless communication module 292 may support 5G networks after 4G networks and next-generation communication technologies, for example, NR access technology (new radio access technology).
  • NR access technology provides high-speed transmission of high-capacity data (eMBB (enhanced mobile broadband)), minimization of terminal power and access to multiple terminals (mMTC (massive machine type communications)), or high reliability and low latency (URLLC (ultra-reliable and low latency). -latency communications)) can be supported.
  • the wireless communication module 292 may support high frequency bands (e.g., mmWave bands), for example, to achieve high data rates.
  • the wireless communication module 292 uses various technologies to secure performance in high frequency bands, for example, beamforming, massive array multiple-input and multiple-output (MIMO), and full-dimensional multiplexing. It can support technologies such as input/output (FD-MIMO: full dimensional MIMO), array antenna, analog beam-forming, or large scale antenna.
  • the wireless communication module 292 may support various requirements specified in the electronic device 201, an external electronic device (e.g., electronic device 204), or a network system (e.g., second network 299).
  • the wireless communication module 292 supports peak data rate (e.g., 20 Gbps or more) for realizing eMBB, loss coverage (e.g., 164 dB or less) for realizing mmTC, or U-plane latency (e.g., 164 dB or less) for realizing URLLC.
  • peak data rate e.g., 20 Gbps or more
  • loss coverage e.g., 164 dB or less
  • U-plane latency e.g., 164 dB or less
  • the antenna module 297 may transmit or receive signals or power to or from the outside (e.g., an external electronic device).
  • the antenna module 297 may include an antenna including a radiator made of a conductor or a conductive pattern formed on a substrate (eg, PCB).
  • the antenna module 297 may include a plurality of antennas (eg, an array antenna). In this case, at least one antenna suitable for a communication method used in a communication network such as the first network 298 or the second network 299 is, for example, connected to the plurality of antennas by the communication module 290. can be selected. Signals or power may be transmitted or received between the communication module 290 and an external electronic device through the at least one selected antenna.
  • other components eg, radio frequency integrated circuit (RFIC) may be additionally formed as part of the antenna module 297.
  • RFIC radio frequency integrated circuit
  • the antenna module 297 may form a mmWave antenna module.
  • a mmWave antenna module includes a printed circuit board, an RFIC disposed on or adjacent to a first side (e.g., bottom side) of the printed circuit board and capable of supporting a designated high frequency band (e.g., mmWave band), And a plurality of antennas (e.g., array antennas) disposed on or adjacent to the second side (e.g., top or side) of the printed circuit board and capable of transmitting or receiving signals in the designated high frequency band. can do.
  • a mmWave antenna module includes a printed circuit board, an RFIC disposed on or adjacent to a first side (e.g., bottom side) of the printed circuit board and capable of supporting a designated high frequency band (e.g., mmWave band), And a plurality of antennas (e.g., array antennas) disposed on or adjacent to the second side (e.g., top or side) of the
  • peripheral devices e.g., bus, general purpose input and output (GPIO), serial peripheral interface (SPI), or mobile industry processor interface (MIPI)
  • signal e.g. commands or data
  • commands or data may be transmitted or received between the electronic device 201 and the external electronic device 204 through the server 208 connected to the second network 299.
  • Each of the external electronic devices 202 or 204 may be of the same or different type as the electronic device 201.
  • all or part of the operations performed in the electronic device 201 may be executed in one or more of the external electronic devices 202, 204, or 208.
  • the electronic device 201 may perform the function or service instead of executing the function or service on its own.
  • one or more external electronic devices may be requested to perform at least part of the function or service.
  • One or more external electronic devices that have received the request may execute at least part of the requested function or service, or an additional function or service related to the request, and transmit the result of the execution to the electronic device 201.
  • the electronic device 201 may process the result as is or additionally and provide it as at least part of a response to the request.
  • cloud computing distributed computing, mobile edge computing (MEC), or client-server computing technology can be used.
  • the electronic device 201 may provide an ultra-low latency service using, for example, distributed computing or mobile edge computing.
  • the external electronic device 204 may include an Internet of Things (IoT) device.
  • Server 208 may be an intelligent server using machine learning and/or neural networks.
  • the external electronic device 204 or server 208 may be included in the second network 299.
  • the electronic device 201 may be applied to intelligent services (e.g., smart home, smart city, smart car, or healthcare) based on 5G communication technology and IoT-related technology.
  • the external electronic device 204 may include at least one of the devices 121, 122, 123, 151, 152, and 153 of FIG. 1.
  • Figure 3 shows the structure of a network system including an external camera according to an embodiment.
  • the network system 300 may include a server 310, at least one camera 320, an electronic device 330, and a user device 340.
  • network system 300 may include a home network or a network installed in a limited area (eg, a building or geographic area).
  • the server 310 may include a cloud server that manages the network system 300.
  • the server 310 may manage at least one IoT device (e.g., at least one camera 320) onboarded to the network system 300, and data collected from the at least one camera 320 (e.g., For example, video data) can be stored, and at least one camera 320 can be controlled.
  • IoT device e.g., at least one camera 320
  • data collected from the at least one camera 320 e.g., For example, video data
  • At least one camera 320 may include an external camera device installed in a home network or limited area. In one embodiment, at least one camera 320 may include one or more IoT cameras 320a and 320b. At least one camera 320 may have limited performance and/or hardware specifications and may be configured to provide only basic solutions such as motion detection and/or sound detection.
  • the electronic device 330 records data (e.g., video data or event data) recorded by IoT devices (e.g., at least one camera 320) within the network system 300, for example, in real time. It can be collected and stored at regular intervals or at relatively short intervals.
  • the electronic device 330 may be coupled with at least one IoT camera (e.g., camera 320), and video data generated by the camera 320 may be transmitted between the camera 320 and the server 310.
  • It may include an edge device configured to process.
  • the edge device may include at least one of a TV, hub, tablet, home appliance, smartphone, personal computer (PC), tablet, laptop, or notebook computer.
  • the electronic device 330 may be located close to at least one camera 320, and may be located using wired communication or short-range wireless communication technology (e.g., Bluetooth, Bluetooth low energy (BLE), Wi-Fi). , or Wi-Fi direct) may be configured to communicate with at least one camera 320.
  • the electronic device 330 may provide storage for video data recorded by at least one camera 320 and/or provide additional solutions for the video data (e.g., video analytics and /or event detection) may be provided.
  • electronic device 330 may be registered (e.g., onboarded) with server 310 and configured to communicate with server 310 over a data communication network (e.g., the Internet).
  • the user device 340 transmits a request signal from the user to the electronic device 330 and/or the server 310, or sends desired data (e.g., video data) to the electronic device 330 and/or the server 310. It can be received from the server 310.
  • user device 340 may include a smartphone, personal computer (PC), tablet, laptop, or notebook computer.
  • the user device 340 may include the electronic device 201 of FIG. 1 .
  • user device 340 uses wired or short-range wireless communication technology (e.g., at least one of Bluetooth, Bluetooth low energy (BLE), Wi-Fi, or Wi-Fi direct) to communicate electronically. Can be configured to communicate with device 330. In one embodiment, user device 340 may be configured to communicate with electronic device 330 over a data communication network (e.g., the Internet). In one embodiment, user device 340 may be configured to communicate with server 310 over a data communications network (e.g., the Internet).
  • wired or short-range wireless communication technology e.g., at least one of Bluetooth, Bluetooth low energy (BLE), Wi-Fi, or Wi-Fi direct
  • BLE Bluetooth low energy
  • Wi-Fi Wireless Fidelity
  • Wi-Fi Wireless Fidelity
  • the IoT camera 320a or 320b detects the motion for a specified period of time due to limited storage capacity. You can create a video clip file of (for example, 10 seconds). Additionally, the IoT camera 320a or 320b may incur a cloud cost for uploading the video clip file to the server 310. The server 310 may store the video clip file for a specified period of time (eg, 1 day or 30 days) and delete it thereafter.
  • a specified period of time eg, 1 day or 30 days
  • the server 310 may manage a clip list containing video clip files collected from each IoT camera (e.g., IoT camera 320a and IoT camera 320b) in recording order, and may manage a clip list from the user.
  • the clip list may be transmitted to the user device 340 in response to a request (eg, a request signal from the user device 340).
  • the user may have to play and watch multiple video clip files one by one to find the desired scene among the vast amount of video clip files generated by each IoT camera (e.g., IoT camera 320a or IoT camera 320b). there is.
  • Embodiments of the present disclosure can solve the limited performance, hardware restrictions, and cloud restrictions of the camera 320 through interworking between the camera 320 and the electronic device 330 registered in the server 310.
  • FIG. 4A is a block diagram showing the configuration of an electronic device 330 according to an embodiment.
  • the electronic device 330 includes at least one or more antennas 402, a communication circuit 404, a processor 406, a memory 408, an interface 410, or a display 412. It can contain one.
  • the electronic device 330 may communicate with at least one camera 320, server 310, and/or user device 340 through communication circuitry 404.
  • the communication circuit 404 may use a short-range wireless communication technology (e.g., at least one of Bluetooth, Bluetooth low energy (BLE), Wi-Fi, or Wi-Fi direct), or a long-range wireless communication technology (e.g., For example, it may be configured to support at least one of a cellular network, the Internet, or a computer network.
  • communication circuitry 404 may use one or more antennas 402 to transmit and receive signals to and from at least one camera 320, server 310, and/or user device 340. .
  • communication circuitry 404 may include at least one communication circuit, wherein the at least one communication circuit may be configured to transmit or receive signals based on, for example, at least one communication technology.
  • the electronic device 330 does not include separate communication circuits based on each of the one or more communication protocols, but includes a communication circuit 404 that supports at least two of the one or more communication protocols. can do.
  • the electronic device 330 includes an interface 410 that provides a wired and/or wireless interface for communicating with components external to the network (e.g., at least one camera 320). can do.
  • the electronic device 330 includes a processor 406, which may be implemented with one or two or more single core processors or one or two or more multi-core processors, and instructions for operations of the processor 406 ( It may include a memory 408 that stores instructions.
  • the processor 406 generates video clip files of various playback lengths based on video data received from the camera 320, and provides video analysis requiring high-performance processing on behalf of the camera 320 based on each video clip file. And, metadata representing the results of video analysis can be recorded in the memory 408 along with the corresponding video clip file.
  • the processor 406 performs various analysis solutions that are difficult to support in the camera 320 (e.g., human detection, pet detection, face recognition, baby crying). At least one of baby crying, dog barking, or window breaking) can be provided, and the results obtained through video analysis can be stored as event metadata.
  • various analysis solutions that are difficult to support in the camera 320 (e.g., human detection, pet detection, face recognition, baby crying). At least one of baby crying, dog barking, or window breaking) can be provided, and the results obtained through video analysis can be stored as event metadata.
  • the processor 406 may generate an event-based video summary file based on the video clip files and event metadata, and, upon user request, extract the user's desired original video clip file from the video summary file (e.g. For example, it can provide an experience in quickly finding video clip files).
  • memory 408 may store code and/or data to provide solutions related to video analytics.
  • memory 408 stores at least one of video data (e.g., at least one video clip file), event metadata, video summary file, or summary metadata received from at least one camera 320. You can save it.
  • FIG. 4B is a diagram for explaining the software configuration of an electronic device according to an embodiment.
  • the electronic device 330 (e.g., processor 406) includes a ring buffer 414, an analysis module 416, and a clip generator 418. , a video summary generator 420, or a control module 422. At least one of the above components may be implemented as a software module executed by the processor 406. In one embodiment, ring buffer 414 may be included in processor 406 or in memory 408.
  • control module 422 may be responsible for communication with an external electronic device (eg, at least one of the camera 320, the server 310, or the user device 340).
  • the control module 422 may include an operating system (OS) of the electronic device 330.
  • OS operating system
  • control module 422 establishes a secure connection (e.g., a transport layer security (TLS) link) with camera 320 and connects camera 320 via a secure streaming channel on the secure connection.
  • TLS transport layer security
  • Receive data frames e.g., video frames
  • Control module 422 may transmit the data frames to analysis module 416.
  • control module 422 may receive a summary request signal including an event type and/or period from server 310 or user device 340 via a data communication network (e.g., the Internet). The control module 422 may transmit the summary request signal to the video summary generator 420.
  • a data communication network e.g., the Internet
  • the ring buffer 414 may store video data (e.g., real-time video frames) received from at least one camera 320 in the order in which they are received.
  • Analysis module 416 may include one or more analysis solutions.
  • the analysis module 416 can analyze the video frames stored in the ring buffer 414 by the analysis solutions, and events according to each analysis solution (e.g., human detection, life detection, pet detection, facial recognition, Sound detection (e.g. a baby crying, a dog barking, a cat crying or a siren), a window being broken) can be detected.
  • the analysis module 416 may generate event metadata indicating the detected event according to the analysis result.
  • the clip generator 418 generates a video that includes one or more video frames according to a format and/or size that is pre-specified based on the analysis results by the analysis module 416 or specified by the analysis module 416.
  • one video clip file may contain one or more events.
  • one video clip file may be identified by a unique clip ID and may be associated with one event metadata.
  • event metadata may include at least one of a clip ID, event type, or timestamp.
  • the event type may indicate any one of human body detection, pet detection, facial recognition, baby crying, dog barking, or window breakage.
  • the video summary generator 420 may generate a video summary file based on video clip files and corresponding event metadata for a pre-specified time and/or a time set by the user.
  • the video summary generator 420 selects one or more video frames containing an event corresponding to a user-specified event type and/or period from the video clip files, and generates a video summary file containing the selected one or more video frames. can do.
  • Video summary generator 420 may generate summary metadata indicating original video clip files (eg, video clip files) associated with the video summary file.
  • the summary metadata may include at least one of a clip ID or a timestamp.
  • Figure 5 is a flowchart illustrating an operation of providing an event-based video summary according to an embodiment.
  • at least one of the operations described below may be omitted, modified, or the order may be changed.
  • At least one of the operations described below may be executed by the processor 406 of the electronic device 330.
  • the electronic device 330 may establish a secure connection with the camera 320.
  • electronic device 330 e.g., processor 406 may be connected to camera 320 using Bluetooth, BLE, or Wi-Fi.
  • electronic device 330 receives video data (e.g., one or more video frames or video clips) including audio and/or video from camera 320 over the secure connection. ) can be received.
  • video data e.g., one or more video frames or video clips
  • the electronic device 330 may analyze the video data and detect at least one event according to at least one specified solution (eg, solution for each event type).
  • the electronic device 330 may generate a video clip file of a specified length (eg, fixed length or variable length) including the video data.
  • a specified length eg, fixed length or variable length
  • the electronic device 330 may generate event metadata indicating at least one event detected in video data included in the video clip file.
  • one video clip file may be associated with at least one event metadata.
  • the event metadata includes a clip identifier (ID) that identifies a corresponding video clip file, an event type that indicates an event included in the video clip file, or an event type in which the event is detected within the video clip file. It may contain at least one of a timestamp indicating a time location.
  • the electronic device 330 eg, the processor 406) may store the video clip file and the corresponding event metadata in the memory 408.
  • electronic device 330 e.g., processor 406) may transmit the video clip file and corresponding event metadata to server 310 at designated, requested, or periodic times. .
  • the electronic device 330 may determine whether a summary request signal is received from an external electronic device (e.g., server 310 or user device 340). If the summary request signal is received (if 'Yes' in operation 530), the electronic device 330 (eg, processor 406) may proceed to operation 535.
  • the summary request signal may include at least one event type and/or period specified by the user. If the summary request signal is not received (if 'No' in operation 530), the electronic device 330 (eg, processor 406) may return to operation 510 or end the operations.
  • the electronic device 330 selects at least one video summary file and summary metadata from the event metadata and video clip files stored in the memory 408 based on the summary request signal.
  • the summary request signal may indicate one or more event types
  • the electronic device 330 e.g., processor 406 may generate one or more video summary files corresponding to each of the one or more event types.
  • the electronic device 330 (e.g., the processor 406) stores video clip files containing one or more events having the event type of the summary request signal based on event metadata stored in the memory 408. You can search for clip IDs and timestamps.
  • the electronic device 330 (e.g., the processor 406) may extract video frames corresponding to the timestamps from video clip files stored in the memory 408.
  • the electronic device 330 (e.g., processor 406) may generate a video summary file including the extracted video frames.
  • the electronic device 330 (eg, processor 406) may generate summary metadata corresponding to the video summary file.
  • the summary metadata may include one or more clip IDs that indicate original video clip files (eg, video clip files) of video frames included in the video summary file.
  • the summary metadata may include a timestamp indicating the time position of video frames corresponding to each clip ID within the video summary file.
  • the electronic device 330 may transmit the video summary file and summary metadata to an external electronic device (eg, server 310 or user device 340).
  • electronic device 330 e.g., processor 406 transmits the video summary file to an external electronic device (e.g., server 310 or user device 340) and, upon further request, Summary metadata can be transmitted selectively.
  • Figure 6 is a flowchart illustrating an operation of providing an original video according to an event-based video summary according to an embodiment.
  • at least one of the operations described below may be omitted, modified, or the order may be changed.
  • At least one of the operations described below may be executed by the processor 406 of the electronic device 330.
  • the electronic device 330 receives at least one event type and/or from an external electronic device (e.g., server 310 or user device 340). Alternatively, a summary request signal including at least one period may be received. In one embodiment, the electronic device 330 (e.g., processor 406) may receive information about at least one event type and/or at least one period directly from the user instead of receiving a summary request signal. .
  • the electronic device 330 may search event metadata stored in the memory 408 to discover an event corresponding to the event type and/or at least one period.
  • the electronic device 330 e.g., the processor 406 determines at least one clip ID corresponding to the at least one event type and/or at least one period from the event metadata stored in the memory 408. And at least one timestamp can be obtained.
  • the electronic device 330 may generate a video summary file containing video data (e.g., video frames) corresponding to the discovered event.
  • the electronic device 330 e.g., processor 406 searches for a video clip file corresponding to the obtained clip ID among video clip files stored in the memory 408, and searches for the video clip file corresponding to the obtained clip ID.
  • Video frames corresponding to the obtained timestamp can be extracted.
  • Electronic device 330 e.g., processor 406) may generate a video summary file containing the extracted video frames.
  • the electronic device 330 may generate summary metadata corresponding to the video summary file.
  • the summary metadata may include one or more clip IDs indicating original video clip files of video frames included in the video summary file.
  • the summary metadata may include a timestamp indicating the time position of video frames corresponding to each clip ID within the video summary file.
  • the electronic device 330 may transmit the video summary file and the summary metadata to an external electronic device (e.g., server 310 or user device 340).
  • an external electronic device e.g., server 310 or user device 340.
  • the electronic device 330 sends an origin clip request signal requesting an original video from an external electronic device (e.g., server 310 or user device 340). ) can be determined whether it is received. If the original request signal is received (yes in operation 630), the electronic device 330 (eg, processor 406) may proceed to operation 635.
  • the original request signal may include at least one clip ID obtained by an external electronic device from the video summary file and the summary metadata. If the original request signal is not received (in the case of 'No' in operation 630), the electronic device 330 (eg, processor 406) may wait in operation 630 or end the operations.
  • the electronic device 330 acquires at least one video clip file corresponding to at least one clip ID in the original request signal from among the video clip files stored in the memory 408. can do.
  • the electronic device 330 may transmit the at least one video clip file to an external electronic device.
  • An external electronic device may play the at least one video clip file through a display (eg, display module 260).
  • Figure 7 is a diagram for explaining pairing between a camera and an electronic device according to an embodiment.
  • the camera 320 may be registered (eg, onboarded) to the server 310 with a designated user account.
  • the camera 320 may be registered with the server 310 directly or through the user device 340.
  • the electronic device 330 may be registered (eg, onboarded) to the server 310 with the user account.
  • the electronic device 330 may be registered with the server 310 to operate as an edge device for any camera (eg, camera 320).
  • the electronic device 330 may be registered with the server 310 directly or through the user device 340.
  • the server 310 may receive a pairing request signal requesting pairing of the camera 320 and the electronic device 330 from the user device 340.
  • the server 310 may register the electronic device 330 in association with the camera 320 in response to the pairing request signal.
  • the electronic device 330 may receive information identifying the camera 320 to be paired (eg, IoT camera ID) from the server 310.
  • information identifying the camera 320 to be paired eg, IoT camera ID
  • the electronic device 330 may transmit a pairing request signal (eg, “IoT camera pairing request”) requesting pairing with the camera 320 to the server 310.
  • a pairing request signal eg, “IoT camera pairing request”
  • the server 310 confirms that the camera 320 and the electronic device 330 are registered in the same user account and sends a pairing request signal (e.g., requesting the camera 320 to pair with the electronic device 330).
  • a pairing request signal e.g., requesting the camera 320 to pair with the electronic device 330.
  • the pairing request signal may include certificate data (eg, “edge certificate”) for use in connecting with the electronic device 330.
  • the server 310 may transmit a pairing request signal including certificate data to be used to connect to the camera 320 to the electronic device 330.
  • the electronic device 330 may establish a secure channel with the camera 320.
  • the electronic device 330 and the camera 320 can authenticate each other using certificate data provided from the server 310.
  • the electronic device 330 may establish the secure channel using a designated streaming support protocol (eg, Real Time Streaming Protocol (RTSPS) or Web Real-Time Communication (WebRTC)).
  • RTSPS Real Time Streaming Protocol
  • WebRTC Web Real-Time Communication
  • the electronic device 330 receives video data (e.g., video frames and/or audio frames) including audio and/or video (AV) from the camera 320 through the secure channel. ) can be received (e.g., in real time).
  • video data e.g., video frames and/or audio frames
  • AV audio and/or video
  • the electronic device 330 may store the video data in a ring buffer (eg, ring buffer 414) in the order in which it is received.
  • a ring buffer eg, ring buffer 414.
  • the electronic device 330 may sequentially analyze the video data.
  • the electronic device 330 may perform pre-processing and post-processing of the video data according to the format and/or size required by each analysis solution.
  • the electronic device 330 may process video frames with a single thread or multi-thread between analysis solutions depending on the requirements between the solutions.
  • the electronic device 330 may transmit an event update indicating a result of analyzing the video data to the server 310.
  • the electronic device 330 may report information indicating the detected event (eg, event type and timestamp) to the server 310.
  • FIGS. 8A and 8B show signal flow diagrams for explaining registration and video analysis of an electronic device according to an embodiment. Depending on the embodiments, at least one of the operations described below may be omitted, modified, or the order may be changed.
  • operation 800 represents a connection procedure between the electronic device 330 and the camera 320 (e.g., an IoT camera), and includes operations 802, 804, 806, 808, 810, 812, 814, 816, and 818. , 820, or 822.
  • the camera 320 e.g., an IoT camera
  • the camera 320 may be registered (e.g., onboarded) to the server 310 with a designated user account.
  • the camera 320 may be registered with the server 310 directly or through the user device 340.
  • the electronic device 330 may be registered (eg, onboarded) to the server 310 with the user account. In one embodiment, the electronic device 330 may be registered with the server 310 directly or through the user device 340.
  • the camera 320 and the electronic device 330 are IoT devices belonging to the user account and are managed by the server 310 and can be controlled to operate within the permissions of the user account.
  • the server 310 may notify the user device 340 of a registered device (eg, camera 320 and/or electronic device 330).
  • a registered device eg, camera 320 and/or electronic device 330.
  • the user device 340 may request pairing of the camera 320 and the electronic device 330 from the server 310.
  • the server 310 may determine pairing of the camera 320 and the electronic device 330 automatically according to a designated algorithm or upon a request from the user device 340.
  • the server 310 may check the validity of the camera 320 and the electronic device 330 for which pairing has been requested. In one embodiment, the server 310 may confirm that the camera 320 and the electronic device 330 are registered for the same user account.
  • the server 310 may transmit a camera ID indicating the camera 320 to be paired to the electronic device 330.
  • the electronic device 330 may identify the camera 320 and transmit a pairing request signal requesting pairing with the camera 320 to the server 310.
  • electronic device 330 may identify that camera 320 is connected to the same network (e.g., a Wi-Fi network of the same access point (AP)) as electronic device 330.
  • the pairing request signal may include an endpoint representing the electronic device 330 and certificate data of the electronic device 330.
  • the endpoint may include an address (eg, MAC address and/or IP address) of the electronic device 330.
  • the server 310 may transmit a pairing request signal to the electronic device 330 to request pairing with the camera 320.
  • the pairing request signal may be transmitted based on the endpoint.
  • the pairing request signal may include certificate data (eg, “IoT camera certificate”) and/or a token for use in connecting to the camera 320.
  • the token may be used by the electronic device 330 to report analysis results on behalf of the camera 320.
  • the server 310 sends a pairing request signal including an endpoint (e.g., “Edge's end point”) and certificate data (e.g., “Edge certificate”) of the electronic device 330 to the camera 320. Can be transmitted.
  • the endpoint may include the address of the electronic device 330.
  • the electronic device 330 and the camera 320 may establish a secure connection (eg, TLS link).
  • the camera 320 can identify the electronic device 330 using the endpoint.
  • electronic device 330 uses the certificate data received in operation 816 to connect camera 320 while establishing a secure streaming channel (e.g., a secure channel using RTSPS or WebRTC) over the secure connection. It can be authenticated.
  • the camera 320 may authenticate the electronic device 330 using certificate data received in operation 818 while establishing the secure streaming channel through the secure connection.
  • camera 320 begins transmitting video data (e.g., one or more video frames) including audio and/or video to electronic device 330 (e.g., in real time) over the secure connection. You can.
  • video data e.g., one or more video frames
  • electronic device 330 e.g., in real time
  • operation 830 represents a video analysis procedure by the electronic device 330 and may include at least one of operations 832, 834, 836, or 838.
  • the electronic device 330 may receive video data (for example, an audio frame, a video frame, or an AV frame) including audio and/or video from the camera 320 through the secure connection.
  • the video data may be stored in the ring buffer 414 of the electronic device 330.
  • the electronic device 330 may analyze the video data.
  • the electronic device 330 may analyze each video frame (eg, an audio frame, a video frame, or an AV frame) of the video data using one or more analysis solutions.
  • the electronic device 330 may analyze each video frame using one or more analysis solutions sequentially or in parallel.
  • the analysis result may include at least one event (eg, at least one of person detection, life detection, pet detection, facial recognition, baby crying, dog barking, or window breakage).
  • the electronic device 330 may transmit an event update indicating analysis results by each analysis solution to the server 310.
  • the electronic device 330 may transmit the event update to the server 310 using the token received in operation 816.
  • the server 310 may update the clip list based on the event update.
  • the clip list may include at least one of the clip ID, camera ID, creation time, length, or event type of each video clip file generated in the electronic device 330.
  • the server 310 may notify the user device 340 of the occurrence of an event. In one embodiment, the server 310 may transmit the clip list to the user device 340. In one embodiment, operations 836 and 838 may be performed at least one of a designated time point, a required time point, or a periodic time point, or may be omitted.
  • Figure 9 is a diagram for explaining video analysis and event detection according to an embodiment.
  • the electronic device 330 may receive video data (eg, video frames) including audio and/or video from the camera 320.
  • video data eg, video frames
  • audio and/or video from the camera 320.
  • the electronic device 330 may sequentially store the video data in the ring buffer 414.
  • the electronic device 330 may analyze each video frame of the video data using the analysis module 416 and generate event metadata 914 indicating the event detected as a result of the analysis.
  • the electronic device 330 may report an event update indicating the analysis result to the server 310.
  • the server 310 may store (eg, update) the event detected according to the analysis results and provide it to the user device 340 upon request.
  • the electronic device 330 may receive a clip creation request requesting the creation of video clip files from the server 310. In one embodiment, operations 908 and 910 may be omitted, and the electronic device 330 may decide to generate video clip files automatically according to a designated algorithm or upon a user's request.
  • the electronic device 330 may use the clip generator 418 to generate a video clip file 916 including at least one video frame among the video data.
  • video clip file 916 may contain video frames of a specified length (e.g., 10 seconds, or a period of time specified by the user or server 310).
  • the video clip file 916 and the event metadata 914 may be stored in memory 408 in association with each other.
  • the electronic device 330 may create and store a clip list for one or more video clip files.
  • the clip list may include, for each video clip file, at least one of a clip ID, creation time, thumbnail image, recording method (for example, direct recording or manual recording), or length.
  • the electronic device 330 may provide a clip list upon request from an external electronic device (eg, the server 310 or the user device 340). Server 310 or user device 340 may display the clip list.
  • Figure 10 shows a signal flow diagram to explain the creation of event metadata according to an embodiment. Depending on the embodiments, at least one of the operations described below may be omitted, modified, or the order may be changed.
  • the electronic device 330 may store video data received from the camera 320 in the ring buffer 414.
  • the electronic device 330 may read the video data from the ring buffer 414, and analyze the video data in operation 1010 to generate event metadata. there is.
  • the electronic device 330 may read the video data from the ring buffer 414, and in operation 1008, extract a specified length (e.g., fixed length) from the video data. Alternatively, you can create a video clip file of variable length.
  • the electronic device 330 may create a video clip file according to automatic recording according to automation rules registered by the user or manual recording according to the user's request. In one embodiment, the electronic device 330 may receive prior information from the server 310 or the user device 340 indicating an event type (eg, human body detection) to start automatic recording. In one embodiment, the electronic device 330 may start generating a video clip file based on the video frames stored in the ring buffer 414 when a human body detection event occurs according to the automation rule. In one embodiment, the electronic device 330 may continue adding subsequent video frames to the video clip file until the event (or any event) no longer occurs. The maximum recording time for one video clip file can be specified by the user or predetermined. The electronic device 330 may generate a video clip file including video frames in which a human body detection event occurs within the maximum recording time.
  • an event type eg, human body detection
  • the electronic device 330 may generate event metadata for at least one event detected while generating the video clip file.
  • the event metadata may include at least one of a clip ID, event type, or timestamp that identifies the video clip file.
  • the electronic device 330 may transmit the event metadata to the clip generator 418.
  • the electronic device 330 may store the video clip file and the event metadata in the memory 408.
  • Figure 11 is a diagram for explaining an event-based video summary according to an embodiment.
  • the user device 340 may transmit a summary request signal including an event type and/or period to the server 310.
  • the user device 340 may specify the event type based on an event update detected and reported by the electronic device 330 from the server 310 (eg, the event update in operation 908).
  • the server 310 may transmit a summary request signal including the event type and/or period to the electronic device 330.
  • electronic device 330 may read out pairs of event metadata and video clip files 1106a, 1106b, and 1106c stored in memory 408.
  • video summary file and summary metadata may be created based on the pairs 1106a, 1106b, and 1106c of the event metadata and video clip files.
  • the electronic device 330 creates a video summary based on pairs (1106a, 1106b, 1106c) of event metadata corresponding to video clip files generated during the period indicated by the summary request signal or a pre-designated period. You can create files.
  • the electronic device 330 identifies a timestamp of a video clip file including an event of the event type indicated by the summary request signal or a pre-designated event type, based on the event metadata of the video clip files generated during the period.
  • the video frames indicated by the timestamp can be extracted and arranged in chronological order.
  • the electronic device 330 may generate a video summary file by concatenating the extracted video frames.
  • the video summary file may include only video frames in which an event of an event type specified by the user occurred.
  • the electronic device 330 may generate summary metadata including the clip ID and/or camera ID of the original video clip file used for each timestamp of the video summary file.
  • summary metadata could be structured as follows:
  • the electronic device 330 may transmit the video summary file and summary metadata to the server 310.
  • the server 310 may transmit the video summary file and summary metadata to the user device 340.
  • the user device 340 can play the video summary file, and upon a user's request, retrieve the clip ID of the original video clip file corresponding to the specified video frame in the video summary file from summary metadata. there is.
  • the user device 340 may obtain the original video clip file from the electronic device 330 using the clip ID.
  • the electronic device 330 may be connected to one or more cameras (eg, IoT camera 320a and IoT camera 320b) through respective pipelines (eg, nodes).
  • the IoT camera 320a and the IoT camera 320b may transmit their video data to the electronic device 330 through respective pipelines (eg, nodes).
  • the electronic device 330 may individually perform video analysis and clip creation for each pipeline.
  • the electronic device 330 may individually create and manage video clip files and event metadata of one or more connected cameras.
  • the electronic device 330 may generate a multi-camera-based video summary file based on video clip files and event metadata generated based on video data from one or more cameras.
  • Figure 12 is a diagram for explaining a video summary file according to one embodiment.
  • the electronic device 330 may generate a clip list 1202 for a plurality of video clip files.
  • the clip list 1202 may include at least one of a clip ID, creation time, thumbnail image, recording method (for example, direct recording or manual recording), or length for each video clip file.
  • the clip list 1202 may store a plurality of video clip files in the order in which they are created. For example, the most recently created video clip files may be located at the top.
  • the electronic device 330 may generate event metadata 1206a, 1206b, 1206c, and 1206d corresponding to the video clip files 1204a, 1204b, 1204c, and 1204d.
  • electronic device 330 upon receiving a summary request signal including an event type (e.g., “pet detected”) and/or duration, electronic device 330 (e.g., video summary generator 420) generates video clip files.
  • Video frames at time positions where events of the event type were detected can be extracted from (1204a, 1204b, 1204c, 1204d), and a video summary file 1208 can be generated by concatenating the video frames in chronological order.
  • the video summary file 1208 includes the 3rd video frame (“D: 00:00:02”) of the fourth video clip file 1204d recorded first, and the 4th video frame of the third video clip file 1204c.
  • the first video frame (“C: 00:00:03”), the first video frame (“B: 00:00:00”) of the second video frame 1204b, and the second video frame of the first video frame 1204a.
  • A: 00:00:01" can be included in that order.
  • electronic device 330 may also generate summary metadata 1210 for the video summary file 1208.
  • Summary metadata 1210 may include a clip ID indicating the original video clip files of each video frame included in the video summary file 1208 and a timestamp of each video frame. The timestamp may indicate the time location within the video summary file 1208 of each video frame.
  • Figure 13 is a signal flow diagram for explaining event-based summary video generation according to an embodiment. Depending on the embodiments, at least one of the operations described below may be omitted, modified, or the order may be changed.
  • the user device 340 sends a summary request signal including an event type (e.g., a first event type) and/or a period (e.g., a first period) to the server 310. Can be transmitted.
  • the summary request signal may be transmitted to request creation of a video summary file.
  • the electronic device 330 may receive the summary request signal from the server 310.
  • electronic device 330 may receive the summary request signal directly from user device 340 (e.g., via a wired, near-field communication network, or Internet) rather than through server 310. there is.
  • electronic device 330 may receive information about the event type and/or duration directly from the user (e.g., via a user interface) rather than through user device 340 or server 310. can be input.
  • the electronic device 330 (e.g., control module 422) generates the summary request signal or the first event type and/or the first period obtained from the summary request signal to the video summary generator 420. It can be entered as .
  • the electronic device 330 may request a first event metadata set corresponding to the first period from the memory 408.
  • the electronic device 330 may receive a first event metadata set corresponding to the first period from the memory 408.
  • the first event metadata set may include a plurality of first event metadata for a plurality of first video clip files corresponding to the period.
  • the electronic device 330 may check events having the first event type from the plurality of first event metadata of the received first event metadata set. .
  • the electronic device 330 may request second video clip files including the events among the plurality of first video clip files from the memory 408.
  • the electronic device 330 may receive second video clip files including the events from the memory 408.
  • the electronic device 330 extracts one or more video frames including the events from the second video clip files and creates a video summary file including the extracted video frames. can be created.
  • the electronic device 330 determines the clip ID of the original video clip file (e.g., one of the second video clip files) of each video frame included in the video summary file. Summary metadata containing can be created.
  • the electronic device 330 may store the video summary file and/or summary metadata in the memory 408.
  • the electronic device 330 may play the video summary file through the display 412 in response to a summary playback request from the user.
  • the electronic device 330 may not generate the video summary file, and may select and play at least some video frames of the original video clip file based on the summary metadata in response to a playback request from the user. there is.
  • the electronic device 330 may transmit the video summary file and/or summary metadata to the server 310.
  • the server 310 may transmit the video summary file and/or summary metadata to the user device 340. In one embodiment, at least one of operation 1322 or operation 1324 may be omitted.
  • electronic device 330 may transmit the video summary file and/or summary metadata directly to user device 340 (e.g., via a local area network or the Internet) rather than through server 310. can be transmitted.
  • summary metadata may be transferred in operations 1322 and 1324, after which the electronic device 330 and the user device 340 establish a secure connection for transmission of the video summary file and communicate via the secure connection. The video summary file can be transmitted.
  • Figure 14 is a diagram for explaining the use of a video summary according to an embodiment.
  • user device 340 may receive a video summary file (e.g., video summary file 1208) from electronic device 330 via server 310 or directly. ) can be played through a display (for example, the display module 260).
  • a video summary file e.g., video summary file 1208
  • server 310 e.g., the display module 260
  • a user input for selecting a specific scene may be received from the user.
  • a user may select (e.g., touch) a designated button (e.g., a jump button) on a particular scene to request the original video for that scene. .
  • the user device 340 may receive the third video clip file 1204c from the electronic device 330 and play the received third video clip file.
  • user device 340 may not store summary metadata, including information identifying the video summary file 1208 (e.g., a summary clip ID) in response to the user input and of the specific scene.
  • a timestamp (for example, timestamp 00:00:01) may be transmitted to the electronic device 330.
  • the electronic device 330 may search summary metadata 1210 corresponding to the video summary file 1208 based on the timestamp of the specific scene and obtain a clip ID corresponding to the timestamp.
  • the electronic device 330 may transmit the original video corresponding to the clip ID to the user device 340.
  • Figure 15 is a signal flow diagram for explaining provision of a video summary according to an embodiment. According to embodiments, at least one of the operations described below may be omitted, modified, or changed in order.
  • the user device 340 may transmit a request signal to the server 310 to request a video summary file.
  • the user device 340 may request the video summary file based on summary metadata received from the electronic device 330 through the server 310 or directly.
  • the electronic device 330 may receive the request signal from the server 310. Although not shown, in one embodiment, electronic device 330 may receive the request signal directly from user device 340 (e.g., via a wired, near-field communication network, or Internet) rather than through server 310. .
  • the electronic device 330 may establish a secure connection (eg, TLS link) with the user device 340.
  • a secure connection eg, TLS link
  • the electronic device 330 may transmit the requested video summary file to the user device 340 through a secure streaming channel on the secure connection.
  • the user device 340 may play the video summary file.
  • the user device 340 receives a user input (e.g., touching a jump button) requesting to play the original video in a specific scene (e.g., at least one video frame) while playing the video summary file. can do.
  • a user input e.g., touching a jump button
  • a specific scene e.g., at least one video frame
  • the user device 340 may obtain a clip ID corresponding to the timestamp of the specific scene from summary metadata.
  • the user device 340 may transmit an original request signal including the clip ID to the electronic device 330.
  • the original request signal may be transmitted to the electronic device 330 through the server 310, or may be transmitted directly to the electronic device 330 through a secure connection in operation 1506.
  • the electronic device 330 may read the video clip file with the clip ID from the memory 408 and transmit it to the user device 340.
  • the video clip file may be transmitted over the secure connection in operation 1506, or over a newly established secure connection.
  • the user device 340 may play the video clip file.
  • Figure 16 is a signal flow diagram illustrating the provision of a video summary through video summary information according to an embodiment. According to embodiments, at least one of the operations described below may be omitted, modified, or changed in order.
  • the user device 340 may request a clip list and/or event metadata from the server 310.
  • the server 310 may transmit a clip list and/or event metadata to the user device 340.
  • user device 340 may display the clip list and receive user input requesting a video summary based on the clip list.
  • the user device 340 may transmit a summary request signal to the server 310 to request a video summary.
  • the server 310 may transmit a connection request including client information (eg, certificate data of the user device 340) to the electronic device 330.
  • client information eg, certificate data of the user device 340
  • the electronic device 330 may establish a secure streaming channel on a secure connection with the user device 340 based on the connection request.
  • the electronic device 330 may transmit the requested video summary file and/or summary metadata to the user device 340 through the secure streaming channel.
  • user device 340 may play the video summary file.
  • the user device 340 may receive a user input (e.g., touch a jump button) requesting playback of the original video in a specific scene (e.g., video frame) while playing the video summary file. .
  • a user input e.g., touch a jump button
  • a specific scene e.g., video frame
  • Operation 1620 or operation 1630 may be performed alternatively in response to the user input.
  • Operation 1620 may include at least one of operation 1622, operation 1624, operation 1626, or operation 1628.
  • Operation 1630 may include at least one of operation 1632, operation 1634, operation 1636, or operation 1638.
  • the user device 340 may obtain a clip ID corresponding to the timestamp of the specific scene from summary metadata (eg, summary metadata received in operation 1612).
  • the user device 340 may transmit a first original request signal including the clip ID to the electronic device 330.
  • the first original request signal may be transmitted to the electronic device 330 through the server 310 or directly to the electronic device 330 through a secure connection in operation 1610.
  • the electronic device 330 may read a video clip file having the clip ID from the memory 408 and transmit the video clip file to the user device 340 in response to the first original request signal.
  • the video clip file may be transmitted over the secure connection in operation 1610, or may be transmitted over a newly established secure connection.
  • the user device 340 may play the video clip file.
  • the user device 340 may not have summary metadata, and sends a second original request signal including information indicating the video summary file (e.g., summary clip ID) and a timestamp of the specific scene. can be transmitted to the electronic device 330.
  • the second original request signal may be transmitted to the electronic device 330 through the server 310, or may be directly transmitted to the electronic device 330 through a secure connection in operation 1610.
  • the electronic device 330 may search summary metadata corresponding to the video summary file based on the second original request signal, and select a clip ID corresponding to the timestamp of the specific scene from the summary metadata. can be obtained.
  • the electronic device 330 may read the video clip file having the clip ID from the memory 408 and transmit the video clip file to the user device 340.
  • the video clip file may be transmitted over the secure connection in operation 1610, or may be transmitted over a newly established secure connection.
  • user device 340 may play the video clip file.
  • FIGS. 17A, 17B, 17C, and 17D are diagrams illustrating a user interface that provides an event-based video summary according to an embodiment.
  • the user device 340 may display a summary request screen 1700 to request a video summary.
  • the summary request screen 1700 may include a first item 1702 for inputting an event type and/or a second item 1704 for inputting a period.
  • the first item 1702 may include “Dog detect” and/or “Cat detect” for detecting a designated pet.
  • the first item 1702 may include “Jane detect” and/or “Cabin detect” to detect a designated person.
  • the user device 340 sends a summary request signal (e.g., a summary request signal of operation 1302) including the event type and/or period input through the summary request screen 1700 through the server 310 or directly. It can be transmitted to the electronic device 330.
  • a summary request signal e.g., a summary request signal of operation 1302
  • the user device 340 may display the first video summary screen 1706.
  • the first video summary screen 1706 includes information (e.g., "Pet detect Video summary") of the first video summary file including video frames in which events of "Pet detect” were detected, and the first video summary file and It may include information about the associated original video (e.g., at least one of a thumbnail image, thumbnail video, or camera ID(s)).
  • the user device 340 may display a second video summary screen 1708.
  • the second video summary screen 1708 includes information of a second video summary file (e.g., “Cat detect Video summary”) including video frames in which “Cat detect” events were detected, and the second video summary file. It may include information about the associated original video (e.g., at least one of a thumbnail image, thumbnail video, or camera ID(s)).
  • the user device 340 may display the third video summary screen 1710.
  • the third video summary screen 1710 includes information of a third video summary file including video frames in which events of “Pet detect” and “Jane detect” were detected (e.g., “Pet & Jane detect Video summary”) It may include information on the original video (eg, at least one of a thumbnail image, thumbnail video, or camera ID(s)) related to the third video summary file.
  • FIG. 18 is a flowchart illustrating an operation of generating an event-based video summary according to an embodiment.
  • at least one of the operations described below may be omitted, modified, or the order may be changed.
  • at least one of the operations described later will be described as being executed by the processor 406 of the electronic device 330.
  • at least one of the operations described later will be performed by the processor 406 of the electronic device 340.
  • it may be executed by the processor 220 of FIG. 2).
  • the electronic device 330 may select a video file.
  • the electronic device 330 eg, processor 406 may read out a video file stored in memory 408.
  • the electronic device 330 may receive a summary request signal for the selected video file or at least one arbitrary video file.
  • the electronic device 330 may receive the summary request signal from the user through a user interface.
  • the summary request signal may include information about at least one event type and/or period to be detected.
  • the summary request signal may not include information about the event type and/or period, and the electronic device 330 (e.g., processor 406) may detect a detectable event in response to the summary request signal. You can decide to detect all types.
  • the electronic device 330 may receive the summary request signal after or before the video file is selected.
  • the electronic device 330 analyzes the video file and provides at least one solution specified by the summary request signal according to at least one solution (e.g., solution for each event type) specified. At least one event corresponding to the event type can be detected, and at least one video frame including the detected event from the video file can be identified. In one embodiment, the electronic device 330 (e.g., processor 406) analyzes at least one video file including the selected video file after receiving the summary request signal, and selects a video file from the at least one video file. At least one video frame containing the event can be extracted. In one embodiment, the electronic device 330 (e.g., processor 406) analyzes at least one video file corresponding to a period specified by the summary request signal and includes the event from the at least one video file. At least one video frame can be extracted.
  • a solution e.g., solution for each event type
  • the electronic device 330 may generate a video summary file including the extracted at least one video frame.
  • the summary request signal may indicate one or more event types, and the electronic device 330 (e.g., processor 406) may generate one or more video summary files corresponding to each of the one or more event types. Alternatively, you can create a single video summary file corresponding to one or more event types.
  • the electronic device 330 may check whether a user input requesting playback of the video summary file is received. If the user input is received (if 'Yes' in operation 1825), in operation 1830, the electronic device 330 (e.g., processor 406) displays the video summary file in response to the user input (412). You can play it through . If the user input is not received (in case of 'No' in operation 1825), the electronic device 330 (eg, processor 406) may end the procedure.
  • Figure 19 is a flowchart for explaining an operation for generating event metadata according to an embodiment.
  • at least one of the operations described below may be omitted, modified, or the order may be changed.
  • at least one of the operations described later will be described as being executed by the processor 406 of the electronic device 330.
  • at least one of the operations described later will be performed by the processor 406 of the electronic device 340.
  • it may be executed by the processor 220 of FIG. 2).
  • the electronic device 330 may select a video file.
  • the electronic device 330 eg, processor 406 may read out a video file stored in memory 408.
  • the electronic device 330 may receive a summary request signal for the selected video file or at least one arbitrary video file.
  • the electronic device 330 may receive the summary request signal from the user through a user interface.
  • the summary request signal may include information about at least one event type and/or period to be detected.
  • the summary request signal may not include information about the event type and/or period, and the electronic device 330 (e.g., processor 406) may detect a detectable event in response to the summary request signal. You can decide to detect all types.
  • the electronic device 330 may receive the summary request signal after or before the video file is selected.
  • the electronic device 330 analyzes the video file and provides at least one solution specified by the summary request signal according to at least one solution (e.g., solution for each event type) specified. At least one event corresponding to the event type can be detected, and at least one video frame including the detected event from the video file can be identified. In one embodiment, the electronic device 330 (e.g., processor 406) analyzes at least one video file including the selected video file after receiving the summary request signal, and selects a video file from the at least one video file. The temporal location of at least one video frame containing the event may be identified. In one embodiment, the electronic device 330 (e.g., processor 406) analyzes at least one video file corresponding to a period specified by the summary request signal and includes the event from the at least one video file. The temporal location of at least one video frame may be identified.
  • the electronic device 330 may generate event metadata including time positions of the extracted at least one video frame.
  • the summary request signal may indicate one or more event types, and the electronic device 330 (e.g., processor 406) may provide one or more event metadata corresponding to each of the one or more event types.
  • one event metadata corresponding to one or more event types can be created.
  • the event metadata may include a clip identifier (ID) identifying the video file, an event type indicating an event included in the video file, or a time location at which the event was detected within the video file. It can contain at least one of the timestamps.
  • ID clip identifier
  • the electronic device 330 may determine whether a user input requesting event playback is received.
  • the user input may include a specified event type and/or period. If the user input is received (if 'Yes' in operation 1925), in operation 1930, the electronic device 330 (e.g., processor 406) generates an event corresponding to the event type and/or period specified by the user input.
  • the event metadata may be identified and at least one timestamp included in the event metadata may be identified. If the user input is not received (no in operation 1925), tram device 330 (e.g., processor 406) may terminate the procedure.
  • the electronic device 330 may play at least one video frame corresponding to the identified at least one timestamp among the selected video files through the display 412.
  • the electronic device 330 e.g., the processor 406 transmits a video that includes at least one video frame corresponding to the identified at least one timestamp based on a user input requesting playback of the event. You can temporarily create a summary file and play the video summary file.
  • Embodiments of the present disclosure can set the event type and period to be viewed in summary through the user device.
  • Embodiments of the present disclosure can display a video summary file including video summarized according to an event type set by the user through a user device, and information on the related original video can be displayed together during playback of the video summary file. .
  • Embodiments of the present disclosure may combine a camera and an edge device to overcome structural limitations of a camera in a network system such as a home network.
  • Embodiments of the present disclosure may analyze video data collected from a camera in a network system, generate event metadata and video clip files, and provide an event-based video summary experience.
  • a user can be provided with a video summary related to a desired event and can quickly find a video clip file containing a desired scene.
  • the electronic device 330 may include a communication circuit 404 and at least one processor 406 operatively connected to the communication circuit.
  • the at least one processor may be configured to receive video data from at least one external camera 320.
  • the at least one processor may be configured to generate event metadata indicating an event detected in the video data based on the video data.
  • the at least one processor may be configured to generate a video clip file including at least one video frame related to the event among the video data.
  • the at least one processor may be configured to store the event metadata and the video clip file.
  • the at least one processor may be configured to receive a summary request signal indicating the event type and/or period from the external electronic device 340.
  • the at least one processor may be configured to retrieve first event metadata indicating a first event corresponding to the event type and/or the period based on the summary request signal.
  • the at least one processor may be configured to extract at least one first video frame corresponding to the first event from a first video clip file stored in association with the first event metadata based on the first event metadata. You can.
  • the at least one processor may be configured to generate a video summary file including the extracted at least one first video frame.
  • the at least one processor may be configured to generate summary metadata indicating the first video clip file.
  • the at least one processor may be configured to transmit the video summary file to the external electronic device.
  • the summary metadata may include at least one of a clip ID identifying the first video clip file, or a timestamp indicating the temporal location of the at least one first video frame.
  • the event metadata may include at least one of a clip ID identifying the video clip file, an event type of the detected event, or a timestamp of the detected event.
  • the at least one processor may be configured to transmit an event update indicating the detected event to a server through the communication circuit.
  • the at least one processor receives an original request signal including a clip ID from the external electronic device after transmitting the video summary file and the summary metadata to the external electronic device, and transmits the video summary file and the summary metadata to the external electronic device. It may be configured to transmit a corresponding second video clip file to the external electronic device.
  • the at least one processor transmits the video summary file and the summary metadata to the external electronic device and then sends an original request including a summary clip ID and timestamp of the video summary file from the external electronic device. It may be configured to receive a signal, identify a third video clip file corresponding to the timestamp based on the summary metadata, and transmit the third video clip file to the external electronic device.
  • the electronic device 340 may include a communication circuit 290 and at least one processor 220 operatively connected to the communication circuit.
  • the at least one processor may be configured to transmit a summary request signal including an event type and/or period to the external electronic device 330. After transmitting the summary request signal, the at least one processor receives a video summary file corresponding to the event type and/or the period from the external electronic device 330 and the original video of each video frame included in the video summary file. Can be configured to receive summary metadata related to.
  • the at least one processor may be configured to play the video summary file.
  • the at least one processor may be configured to receive a user input for selecting a first video frame while playing the video summary file.
  • the at least one processor may be configured to transmit an original request signal requesting an original video clip file including the first video frame to the external electronic device 330 in response to the user input.
  • the at least one processor may be configured to receive the original video clip file including the first video frame from the external electronic device.
  • the at least one processor obtains a clip ID of the original video clip file including the specified video frame from the summary metadata in response to the user input, and sends the clip ID to the original request signal. It may be configured to transmit including.
  • the at least one processor may be configured to transmit a summary clip ID of the video summary file and a timestamp of the designated video frame in the original request signal in response to the user input.
  • a method of operating the electronic device 330 may include an operation 510 of receiving video data from at least one external camera 320.
  • the method may include an operation 525 of generating event metadata representing events detected in the video data based on the video data.
  • the method may include an operation 520 of generating a video clip file including at least one video frame related to the event among the video data.
  • the method may include storing the event metadata and the video clip file.
  • the method may include an operation 605 of receiving a summary request signal indicating the event type and/or period from the external electronic device 340.
  • the method may include an operation 610 of retrieving first event metadata indicating a first event corresponding to the event type and/or the period based on the summary request signal.
  • the method may include extracting at least one first video frame corresponding to the first event from a first video clip file stored in association with the first event metadata based on the first event metadata. there is.
  • the method may include an operation 615 of generating a video summary file including the extracted at least one first video frame.
  • the method may include an operation 620 of generating summary metadata indicating the first video clip file.
  • the method may include an operation 625 of transmitting the video summary file to the external electronic device.
  • the summary metadata may include at least one of a clip ID identifying the first video clip file, or a timestamp indicating the temporal location of the at least one first video frame.
  • the event metadata may include at least one of a clip ID identifying the video clip file, an event type of the detected event, or a timestamp of the detected event.
  • the method may include transmitting an event update indicating the detected event to a server.
  • the method includes an operation 630 of receiving an original request signal including a clip ID from the external electronic device after transmitting the video summary file and the summary metadata to the external electronic device, and the clip ID It may include an operation 640 of transmitting a second video clip file corresponding to to the external electronic device.
  • the method transmits the video summary file and the summary metadata to the external electronic device and then receives an original request signal including a summary clip ID and timestamp of the video summary file from the external electronic device.
  • a method of operating the electronic device 340 may include transmitting a summary request signal including an event type and/or period to the external electronic device 330.
  • the method includes sending a video summary file corresponding to the event type and/or the period from the external electronic device 330 after transmitting the summary request signal, and a summary related to the original video of each video frame included in the video summary file. May include an operation to receive metadata.
  • the method may include playing the video summary file.
  • the method may include receiving a user input to select a first video frame while playing the video summary file.
  • the method may include transmitting an original request signal requesting an original video clip file including the first video frame to the external electronic device 330 in response to the user input.
  • the method may include receiving the original video clip file including the first video frame from the external electronic device.
  • the method includes obtaining a clip ID of the original video clip file including the specified video frame from the summary metadata in response to the user input, and including the clip ID in the original request signal. It may include actions to be performed.
  • the method may include an operation of including a summary clip ID of the video summary file and a timestamp of the designated video frame in the original request signal in response to the user input.
  • a system 300 for processing video data includes a server 310, at least one camera 320, and an edge device configured to perform video data processing between the server and the at least one camera. 330), and a user device 340 capable of communicating with the server 310 and/or the edge device 330.
  • the edge device may be configured to receive the video data from the at least one camera.
  • the edge device may be configured to generate event metadata indicating events detected in the video data based on the video data.
  • the edge device may be configured to generate video clip files including at least one video frame related to the event among the video data.
  • the edge device may be configured to store the event metadata and the video clip files.
  • the edge device may be configured to transmit at least one video clip file selected from among the video clip files to the user device in response to a request from the user device.
  • the edge device receives a summary request signal indicating an event type and/or period from the user device, and sends a first event corresponding to the event type and/or period based on the summary request signal.
  • the summary metadata may include at least one of a clip ID identifying the first video clip file, or a timestamp indicating the temporal location of the at least one first video frame.
  • the event metadata may include at least one of a clip ID identifying the video clip file, an event type of the detected event, or a timestamp of the detected event.
  • the edge device may be configured to transmit an event update indicating the detected event to a server through the communication circuit.
  • the edge device receives a first original request signal including a clip ID from the user device after transmitting the video summary file and the summary metadata to the user device, and receives the first original request signal In response to may be configured to transmit a second video clip file corresponding to the clip ID to the user device.
  • the edge device transmits the video summary file and the summary metadata to the external electronic device and then requests a second original including a summary clip ID and timestamp of the video summary file from the external electronic device.
  • Receive a signal identify a third video clip file corresponding to the summary metadata and the timestamp in response to the second original signal, and transmit the third video clip file to the external electronic device.
  • Electronic devices may be of various types.
  • Electronic devices may include, for example, portable communication devices (e.g., smartphones), computer devices, portable multimedia devices, portable medical devices, cameras, wearable devices, or home appliances.
  • Electronic devices according to embodiments of this document are not limited to the above-described devices.
  • first, second, or first or second may be used simply to distinguish one component from another, and to refer to those components in other respects (e.g., importance or order) is not limited.
  • One (e.g., first) component is said to be “coupled” or “connected” to another (e.g., second) component, with or without the terms “functionally” or “communicatively.” Where mentioned, it means that any of the components can be connected to the other components directly (e.g. wired), wirelessly, or through a third component.
  • module used in various embodiments of this document may include a unit implemented in hardware, software, or firmware, and is interchangeable with terms such as logic, logic block, component, or circuit, for example. It can be used as A module may be an integrated part or a minimum unit of the parts or a part thereof that performs one or more functions. For example, according to one embodiment, the module may be implemented in the form of an application-specific integrated circuit (ASIC).
  • ASIC application-specific integrated circuit
  • Various embodiments of the present document are one or more instructions stored in a storage medium (e.g., built-in memory 236 or external memory 238) that can be read by a machine (e.g., electronic device 201). It may be implemented as software (e.g., program 240) including these.
  • a processor e.g., processor 220 of a device (e.g., electronic device 201) may call at least one command among one or more commands stored from a storage medium and execute it. This allows the device to be operated to perform at least one function according to the at least one instruction called.
  • the one or more instructions may include code generated by a compiler or code that can be executed by an interpreter.
  • a storage medium that can be read by a device may be provided in the form of a non-transitory storage medium.
  • 'non-transitory' only means that the storage medium is a tangible device and does not contain signals (e.g. electromagnetic waves). This term refers to cases where data is stored semi-permanently in the storage medium. There is no distinction between temporary storage cases.
  • Computer program products are commodities and can be traded between sellers and buyers.
  • the computer program product may be distributed in the form of a machine-readable storage medium (e.g. compact disc read only memory (CD-ROM)) or via an application store (e.g. Play Store TM ) or on two user devices (e.g. It can be distributed (e.g. downloaded or uploaded) directly between smart phones) or online.
  • a machine-readable storage medium e.g. compact disc read only memory (CD-ROM)
  • an application store e.g. Play Store TM
  • two user devices e.g. It can be distributed (e.g. downloaded or uploaded) directly between smart phones) or online.
  • at least a portion of the computer program product may be at least temporarily stored or temporarily created in a machine-readable storage medium, such as the memory of a manufacturer's server, an application store's server, or a relay server.
  • each component (e.g., module or program) of the above-described components may include a single or plural entity, and some of the plurality of entities may be separately placed in other components. there is.
  • one or more of the components or operations described above may be omitted, or one or more other components or operations may be added.
  • multiple components eg, modules or programs
  • the integrated component may perform one or more functions of each component of the plurality of components identically or similarly to those performed by the corresponding component of the plurality of components prior to the integration. .
  • operations performed by a module, program, or other component may be executed sequentially, in parallel, iteratively, or heuristically, or one or more of the operations may be executed in a different order, or omitted. Alternatively, one or more other operations may be added.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Databases & Information Systems (AREA)
  • Studio Devices (AREA)

Abstract

통신 회로 및 상기 통신 회로와 작동적으로 연결된 적어도 하나의 프로세서를 포함하는 전자 장치를 개시한다. 적어도 하나의 프로세서는 외부 카메라로부터 비디오 데이터를 수신하고, 상기 비디오 데이터에 기반하여 상기 비디오 데이터에서 검출된 이벤트를 나타내는 이벤트 메타데이터를 생성하고, 상기 비디오 데이터 중 상기 이벤트와 관련된 적어도 하나의 비디오 프레임을 포함하는 비디오 클립 파일들을 생성하고, 상기 이벤트 메타데이터 및 상기 비디오 클립 파일들을 저장하고, 이벤트 타입 및/또는 기간을 나타내는 서머리 요청 신호를 수신하고, 상기 이벤트 타입 및/또는 상기 기간에 대응하는 비디오 프레임들을 포함하는 비디오 서머리 파일을 생성하도록 구성될 수 있다. 이 외에, 다양한 효과들이 제공될 수 있다.

Description

비디오 서머리를 생성하는 전자 장치 및 그 동작 방법
본 개시의 실시예들은 비디오 서머리를 생성하는 전자 장치 및 그 동작 방법에 관한 것이다.
사용자 단말, 예를 들어, 스마트폰과 같은 전자 장치를 통해 제공되는 다양한 서비스 및 부가 기능들이 점차 증가하고 있다. 이러한 전자 장치의 효용 가치를 높이고, 다양한 사용자들의 욕구를 만족시키기 위해서 통신 서비스 제공자 또는 전자 장치 제조사들은 다양한 기능들을 제공하는 전자 장치를 경쟁적으로 개발하고 있다. 이에 따라, 전자 장치를 통해서 제공되는 다양한 기능들도 점점 고도화 되고 있다.
무선 통신 기술이 발전함에 따라 인공지능(artificial intelligence: AI)을 이용한 장치들이 널리 도입되고 있다. 예를 들어, 사물인터넷(internet of things: IoT) 기술이 적용되어 네트워크에 연결되는 가전 제품은 인공 지능을 이용할 수 있다. IoT 기술은 장치들에서 생성되는 데이터를 수집 및 분석하여 인간의 삶에 새로운 가치를 창출하는 지능형 인터넷 기술 서비스를 제공할 수 있다. 기존 인터넷 기술과 다양한 산업의 융합 및 결합을 통해 IoT 기술은 스마트 홈, 스마트 빌딩, 스마트 시티, 스마트 카, 및 스마트 가전과 같은 분야들에 적용될 수 있다.
한편, 가정에는 사용자의 편의를 위한 다양한 가전 제품이 구비되어 있으며, IoT 기술을 활용하여 가전 제품의 조작이나 제어를 보다 편리하게 하기 위한 서비스들이 제안되고 있다. 홈 네트워크 기술은 홈 네트워크를 통한 다양한 서비스들을 가정 내의 사용자들에게 제공할 수 있다. 예를 들면, 사용자는 개인용 전자 장치(예: 스마트 폰)를 이용하여 홈 네트워크를 구성하는 IoT 장치들에 접근할 수 있다. 사용자는 IoT 장치들을 통해 다양한 서비스를 인용할 수 있다.
상술한 정보는 본 개시에 대한 이해를 돕기 위한 목적으로 하는 배경 기술(related art)로 제공될 수 있다. 상술한 내용 중 어느 것도 본 개시와 관련된 종래 기술(prior art)로서 적용될 수 있는지에 대하여 어떠한 주장이나 결정이 제기되지 않는다.
본 개시의 실시예들은 적어도 하나의 카메라를 통해 획득한 오디오 및/또는 비디오 데이터를 저장할 수 있다.
본 개시의 실시예들은 적어도 하나의 카메라를 통해 획득한 오디오 및/또는 비디오 데이터와 관련된 이벤트 메타데이터를 생성할 수 있다.
본 개시의 실시예들은 적어도 하나의 카메라를 통해 획득한 오디오 및/또는 비디오 데이터와 관련된 비디오 서머리를 생성할 수 있다.
본 문서에서 이루고자 하는 기술적 과제는 이상에서 언급한 기술적 과제로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 본 문서에 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
일 실시예에 따른 전자 장치는 서버 및 적어도 하나의 외부 카메라와 통신하는 통신 회로, 및 상기 통신 회로와 작동적으로 결합되고 상기 서버와 상기 적어도 하나의 외부 카메라 사이에서 비디오 데이터 처리를 수행하도록 구성되는 적어도 하나의 프로세서를 포함할 수 있다. 상기 적어도 하나의 프로세서는 적어도 하나의 카메라로부터 비디오 데이터를 수신하도록 구성될 수 있다. 상기 적어도 하나의 프로세서는 상기 비디오 데이터에 기반하여 상기 비디오 데이터에서 검출된 이벤트를 나타내는 이벤트 메타데이터를 생성하도록 구성될 수 있다. 상기 적어도 하나의 프로세서는 상기 비디오 데이터 중 상기 이벤트와 관련된 적어도 하나의 비디오 프레임을 포함하는 비디오 클립 파일들을 생성하도록 구성될 수 있다. 상기 적어도 하나의 프로세서는 상기 이벤트 메타데이터 및 상기 비디오 클립 파일들을 저장하도록 구성될 수 있다.
일 실시예에 따른 서버와 적어도 하나의 외부 카메라 사이에서 비디오 데이터 처리를 수행하도록 구성되는 전자 장치의 동작 방법은, 적어도 하나의 카메라로부터 비디오 데이터를 수신하는 동작을 포함할 수 있다. 상기 방법은 상기 비디오 데이터에 기반하여 상기 비디오 데이터에서 검출된 이벤트를 나타내는 이벤트 메타데이터를 생성하는 동작을 포함할 수 있다. 상기 방법은 상기 비디오 데이터 중 상기 이벤트와 관련된 적어도 하나의 비디오 프레임을 포함하는 비디오 클립 파일을 생성하는 동작을 포함할 수 있다. 상기 방법은 상기 이벤트 메타데이터 및 상기 비디오 클립 파일을 저장하는 동작을 포함할 수 있다.
일 실시예에 따른 전자 장치는 통신 회로 및 상기 통신 회로와 작동적으로 연결되는 적어도 하나의 프로세서를 포함할 수 있다. 상기 적어도 하나의 프로세서는, 이벤트 타입 및/또는 기간을 포함하는 서머리 요청 신호를 외부 전자 장치로 전송하도록 구성될 수 있다. 상기 적어도 하나의 프로세서는 상기 서머리 요청 신호를 전송한 이후 상기 외부 전자 장치로부터 상기 이벤트 타입 및/또는 상기 기간에 대응하는 비디오 서머리 파일 및 상기 비디오 서머리 파일에 포함된 각 비디오 프레임의 원본 비디오와 관련된 서머리 메타데이터를 수신하도록 구성될 수 있다. 상기 적어도 하나의 프로세서는 상기 비디오 서머리 파일을 재생하도록 구성될 수 있다. 상기 적어도 하나의 프로세서는 상기 비디오 서머리 파일을 재생하는 도중 제1 비디오 프레임을 선택하는 사용자 입력을 수신하도록 구성될 수 있다. 상기 적어도 하나의 프로세서는 상기 사용자 입력에 응답하여 상기 제1 비디오 프레임을 포함하는 원본 비디오 클립 파일을 요청하는 원본 요청 신호를 상기 외부 전자 장치로 전송하도록 구성될 수 있다. 상기 적어도 하나의 프로세서는 상기 제1 비디오 프레임을 포함하는 상기 원본 비디오 클립 파일을 상기 외부 전자 장치로부터 수신하도록 구성될 수 있다.
일 실시예에 따른 전자 장치의 동작 방법은, 이벤트 타입 및/또는 기간을 포함하는 서머리 요청 신호를 외부 전자 장치로 전송하는 동작을 포함할 수 있다. 상기 방법은 상기 서머리 요청 신호를 전송한 이후 상기 외부 전자 장치로부터 상기 이벤트 타입 및/또는 상기 기간에 대응하는 비디오 서머리 파일 및 상기 비디오 서머리 파일에 포함된 각 비디오 프레임의 원본 비디오와 관련된 서머리 메타데이터를 수신하는 동작을 포함할 수 있다. 상기 방법은 상기 비디오 서머리 파일을 재생하는 동작을 포함할 수 있다. 상기 방법은 상기 비디오 서머리 파일을 재생하는 도중 제1 비디오 프레임을 선택하는 사용자 입력을 수신하는 동작을 포함할 수 있다. 상기 방법은 상기 사용자 입력에 응답하여 상기 제1 비디오 프레임을 포함하는 원본 비디오 클립 파일을 요청하는 원본 요청 신호를 상기 외부 전자 장치로 전송하는 동작을 포함할 수 있다. 상기 방법은 상기 제1 비디오 프레임을 포함하는 상기 원본 비디오 클립 파일을 상기 외부 전자 장치로부터 수신하는 동작을 포함할 수 있다.
일 실시예에 따른 비디오 데이터를 처리하는 시스템은, 서버, 적어도 하나의 카메라, 상기 서버와 상기 적어도 하나의 카메라 사이에서 비디오 데이터 처리를 수행하도록 구성되는 에지 장치, 및 상기 서버 및/또는 상기 에지 장치와 통신 가능한 사용자 장치를 포함할 수 있다. 상기 에지 장치는 상기 적어도 하나의 카메라로부터 상기 비디오 데이터를 수신하도록 구성될 수 있다. 상기 에지 장치는 상기 비디오 데이터에 기반하여 상기 비디오 데이터에서 검출된 이벤트를 나타내는 이벤트 메타데이터를 생성하도록 구성될 수 있다. 상기 에지 장치는 상기 비디오 데이터 중 상기 이벤트와 관련된 적어도 하나의 비디오 프레임을 포함하는 비디오 클립 파일들을 생성하도록 구성될 수 있다. 상기 에지 장치는 상기 이벤트 메타데이터 및 상기 비디오 클립 파일들을 저장하도록 구성될 수 있다. 상기 에지 장치는 상기 사용자 장치의 요청에 응답하여 상기 비디오 클립 파일들 중 선택된 적어도 하나의 비디오 클립 파일을 상기 사용자 장치로 전송하도록 구성될 수 있다.
일 실시예에 따른 하나 이상의 프로그램을 저장하는 비일시적 컴퓨터 판독 가능 저장 매체에 있어서, 상기 하나 이상의 프로그램은 전자 장치의 적어도 하나의 프로세서에 의해 실행될 때 상기 전자 장치가; 적어도 하나의 카메라로부터 비디오 데이터를 수신하고, 상기 비디오 데이터에 기반하여 상기 비디오 데이터에서 검출된 이벤트를 나타내는 이벤트 메타데이터를 생성하고, 상기 비디오 데이터 중 상기 이벤트와 관련된 적어도 하나의 비디오 프레임을 포함하는 비디오 클립 파일을 생성하고, 상기 이벤트 메타데이터 및 상기 비디오 클립 파일을 저장하고, 외부 전자 장치로부터 이벤트 타입 및/또는 기간을 나타내는 서머리 요청 신호를 수신하고, 상기 서머리 요청 신호에 근거하여 상기 이벤트 타입 및/또는 상기 기간에 대응하는 제1 이벤트를 나타내는 제1 이벤트 메타데이터를 검색하고, 상기 제1 이벤트 메타데이터에 근거하여 상기 제1 이벤트 메타데이터와 연관되어 저장된 제1 비디오 클립 파일 중 상기 제1 이벤트에 대응하는 적어도 하나의 제1 비디오 프레임을 추출하고, 상기 추출된 적어도 하나의 제1 비디오 프레임을 포함하는 비디오 서머리 파일을 생성하고, 상기 제1 비디오 클립 파일을 지시하는 서머리 메타데이터를 생성하고, 상기 비디오 서머리 파일을 상기 외부 전자 장치로 전송하도록 구성하는 명령어들을 포함할 수 있다.
일 실시예에 따른 하나 이상의 프로그램을 저장하는 비일시적 컴퓨터 판독 가능 저장 매체에 있어서, 상기 하나 이상의 프로그램은 전자 장치의 적어도 하나의 프로세서에 의해 실행될 때 상기 전자 장치가; 이벤트 타입 및/또는 기간을 포함하는 서머리 요청 신호를 외부 전자 장치로 전송하고, 상기 서머리 요청 신호를 전송한 이후 상기 외부 전자 장치로부터 상기 이벤트 타입 및/또는 상기 기간에 대응하는 비디오 서머리 파일 및 상기 비디오 서머리 파일에 포함된 각 비디오 프레임의 원본 비디오와 관련된 서머리 메타데이터를 수신하고, 상기 비디오 서머리 파일을 재생하고, 상기 비디오 서머리 파일을 재생하는 도중 제1 비디오 프레임을 선택하는 사용자 입력을 수신하고, 상기 사용자 입력에 응답하여 상기 제1 비디오 프레임을 포함하는 원본 비디오 클립 파일을 요청하는 원본 요청 신호를 상기 외부 전자 장치로 전송하고, 상기 제1 비디오 프레임을 포함하는 상기 원본 비디오 클립 파일을 상기 외부 전자 장치로부터 수신하도록 구성하는 명령어들을 포함할 수 있다.
도 1은 일 실시예에 따른 IoT(internet of things) 시스템을 도시한다.
도 2는 다양한 실시예들에 따른 네트워크 환경 내의 전자 장치의 블록도이다.
도 3은 일 실시예에 따른 카메라를 포함하는 네트워크 시스템의 구조를 도시한 것이다.
도 4a는 일 실시예에 따른 전자 장치의 구성을 나타낸 블록도이다.
도 4b는 일 실시예에 따른 전자 장치의 소프트웨어 구성을 설명하기 위한 도면이다.
도 5는 일 실시예에 따라 이벤트 기반의 비디오 서머리를 제공하는 동작을 나타낸 흐름도이다.
도 6은 일 실시예에 따라 이벤트 기반의 비디오 서머리에 따른 원본 비디오를 제공하는 동작을 나타낸 흐름도이다.
도 7은 일 실시예에 따른 카메라와 전자 장치의 페어링을 설명하기 위한 도면이다.
도 8a 및 도 8b는 일 실시예에 따른 전자 장치의 등록 및 비디오 분석을 설명하기 위한 신호 흐름도를 나타낸 것이다.
도 9는 일 실시예에 따른 비디오 분석 및 이벤트 검출을 설명하기 위한 도면이다.
도 10은 일 실시예에 따른 이벤트 메타데이터의 생성을 설명하기 위한 신호 흐름도를 나타낸 것이다.
도 11은 일 실시예에 따른 이벤트 기반의 비디오 서머리를 설명하기 위한 도면이다.
도 12는 일 실시예에 따른 비디오 서머리 파일을 설명하기 위한 도면이다.
도 13은 일 실시예에 따른 이벤트 기반의 서머리 비디오 생성을 설명하기 위한 신호 흐름도이다.
도 14는 일 실시예에 따른 비디오 서머리의 활용을 설명하기 위한 도면이다.
도 15는 일 실시예에 따른 비디오 서머리의 제공을 설명하기 위한 신호 흐름도이다.
도 16은 일 실시예에 따른 비디오 서머리 정보를 통한 비디오 서머리의 제공을 설명하기 위한 신호 흐름도이다.
도 17a, 도 17b, 도 17c 및 도 17d는 일 실시예에 따라 이벤트 기반의 비디오 서머리를 제공하는 사용자 인터페이스를 나타낸 도면이다.
도 18은 일 실시예에 따라 이벤트 기반의 비디오 서머리를 생성하는 동작을 설명하기 위한 흐름도이다.
도 19는 일 실시예에 따라 이벤트 메타데이터를 생성하는 동작을 설명하기 위한 흐름도이다.
도 1은 일 실시예에 따른 IoT(internet of things) 시스템(100)을 도시한다. 한편, 도 1의 구성 요소 중 적어도 일부는 생략될 수도 있으며, 도시되지 않은 구성 요소가 더 포함되도록 구현될 수도 있다.
도 1을 참조하면, 일 실시예에 따른 IoT 시스템(100)은, 데이터 네트워크(116 또는 146)에 연결 가능한 복수의 전자 장치들을 포함한다. 예를 들어, IoT 시스템(100)은 제 1 IoT 서버(110), 제 1 노드(node)(120), 보이스 어시스턴트(voice assistance) 서버(130), 제 2 IoT 서버(140), 제 2 노드(150), 또는 디바이스들(121,122,123,124,125,136,137,151,152,153) 중 적어도 하나를 포함할 수 있다.
일 실시예에 따라서, 제 1 IoT 서버(110)는, 통신 인터페이스(111), 프로세서(112), 또는 저장부(113) 중 적어도 하나를 포함할 수 있다. 제 2 IoT 서버(140)는, 통신 인터페이스(141), 프로세서(142), 또는 저장부(143) 중 적어도 하나를 포함할 수 있다. 본 문서에서의 "IoT 서버"는, 예를 들어 데이터 네트워크(예: 데이터 네트워크(116) 또는 데이터 네트워크(146))에 기반하여, 중계 디바이스(예: 제 1 노드(120) 또는 제 2 노드(150))를 통하거나, 또는 중계 디바이스 없이 직접적으로(directly), 하나 또는 그 이상의 디바이스들(예: 디바이스들(121,122,123,124,125,151,152,153))을 원격으로 제어 및/또는 모니터링할 수 있다. 여기에서의 "디바이스"는, 예를 들어 가택, 사무실, 공장, 빌딩, 외부 지점, 또는 다른 타입의 부지들과 같은 로컬 환경 내에 배치되는(또는, 위치하는) 센서, 가전, 사무용 전자 디바이스, 또는 공정 수행을 위한 디바이스로, 그 종류에는 제한이 없다. 제어 명령을 수신하여 제어 명령에 대응하는 동작을 수행하는 디바이스를 "타겟 디바이스"로 명명할 수 있다. IoT 서버는, 복수의 디바이스들 중 타겟 디바이스를 선택하고 제어 명령을 제공하는 점에서, 중앙 서버(central server)로 명명될 수도 있다.
일 실시예에 따라서, 제 1 IoT 서버(110)는, 데이터 네트워크(116)를 통하여 디바이스들(121,122,123)과 통신을 수행할 수 있다. 데이터 네트워크(116)는, 예를 들어 인터넷, 또는 컴퓨터 네트워크(예: LAN 또는 WAN)와 같은 원거리 통신을 위한 네트워크를 의미할 수 있으며, 또는 셀룰러 네트워크를 포함할 수도 있다.
일 실시예에 따라서, 제 1 IoT 서버(110)는, 통신 인터페이스(111)를 통하여 데이터 네트워크(116)에 연결될 수 있다. 통신 인터페이스(111)는, 데이터 네트워크(116)의 통신을 지원하기 위한 통신 디바이스(또는, 통신 모듈)를 포함할 수 있으며, 하나의 구성 요소(예: 단일 칩)로 통합되거나, 또는 별도의 복수의 구성 요소들(예: 복수 칩들)로 구현될 수 있다. 제 1 IoT 서버(110)는, 제 1 노드(120)를 통하여 디바이스들(121,122,123)와 통신을 수행할 수 있다. 제 1 노드(120)는, 제 1 IoT 서버(110)로부터의 데이터를 데이터 네트워크(116)를 통하여 수신하고, 수신한 데이터를 디바이스들(121,122,123) 중 적어도 일부로 송신할 수 있다. 또는, 제 1 노드(120)는, 디바이스들(121,122,123) 중 적어도 일부로부터 데이터를 수신하고, 수신한 데이터를 데이터 네트워크(116)를 통하여 제 1 IoT 서버(110)로 송신할 수 있다. 제 1 노드(120)는, 데이터 네트워크(116) 및 디바이스들(121,122,123) 사이의 브릿지(bridge)로서 기능할 수 있다. 한편, 도 1에서는 제 1 노드(120)가 하나인 것과 같이 도시되어 있지만 이는 단순히 예시적인 것으로, 그 숫자에는 제한이 없다.
본 문서에서의 "노드"는, 엣지 컴퓨팅 시스템(edge computing system)일 수 있거나, 또는 허브(hub) 디바이스일 수 있다. 일 실시예에 따라서, 제 1 노드(120)는, 데이터 네트워크(116)의 유선 및/또는 무선의 통신을 지원하며, 아울러 디바이스들(121,122,123)과의 유선 및/또는 무선의 통신을 지원할 수 있다. 예를 들어, 제 1 노드(120)는, 블루투스, Wi-Fi, Wi-Fi direct, Z-wave, Zig-bee, INSETEON, X10 또는 IrDA(infrared data association) 중 적어도 하나와 같은 근거리 통신 네트워크를 통하여 디바이스들(121,122,123)과 연결될 수 있으나, 통신 종류에는 제한이 없다. 제 1 노드(120)는, 예를 들어 가택, 사무실, 공장, 빌딩, 외부 지점, 또는 다른 타입의 부지들과 같은 환경 내에 배치(또는, 위치)될 수 있다. 이에 따라, 디바이스들(121,122,123)은, 제 1 IoT 서버(110)에 의하여 제공되는 서비스에 의하여 모니터링 및/또는 제어될 수 있으며, 디바이스들(121,122,123)은 제 1 IoT 서버(110)로의 직접 연결을 위한 완전한 네트워크 통신(예: 인터넷 통신)의 캐퍼빌리티(capability)를 갖출 것이 요구되지 않을 수 있다. 디바이스들(121,122,123)은, 예를 들어 전등 스위치, 근접 센서, 온도 센서 등으로 가택 환경 내의 전자 장치로 구현된 것과 같이 도시되었지만, 이는 예시적인 것으로 제한은 없다.
일 실시예에 따라서, 제 1 IoT 서버(110)는, 디바이스들(124,125)과의 직접 통신(direct communication)을 지원할 수도 있다. 여기에서, "직접 통신"은, 예를 들어 제 1 노드(120)와 같은 중계 디바이스를 통하지 않은 통신으로, 예를 들어 셀룰러 통신 네트워크 및/또는 데이터 네트워크를 통한 통신을 의미할 수 있다.
일 실시예에 따라서, 제 1 IoT 서버(110)는, 디바이스들(121,122,123,124,125) 중 적어도 일부로 제어 명령을 송신할 수 있다. 여기에서, "제어 명령"은, 제어 가능한 디바이스가 특정 동작을 수행하도록 야기하는 데이터를 의미할 수 있으며, 특정 동작은 디바이스에 의하여 수행되는 동작으로, 정보의 출력, 정보의 센싱, 정보의 보고, 정보의 관리(예: 삭제, 또는 생성)를 포함할 수 있으며, 그 종류에는 제한이 없다. 예를 들어, 프로세서(112)는, 외부(예: 보이스 어시스턴트 서버(130), 제 2 IoT 서버(140), 외부 시스템(160), 또는 디바이스들(121,122,123,124,125) 중 적어도 일부)로부터 제어 명령을 생성하기 위한 정보(또는, 요청)를 획득하고, 획득한 정보에 기반하여 제어 명령을 생성할 수 있다. 또는, 프로세서(112)는, 디바이스들(121,122,123,124,125) 중 적어도 일부의 모니터링 결과가 지정된 조건을 만족함에 기반하여 제어 명령을 생성할 수 있다. 프로세서(112)는, 제어 명령을, 타겟 디바이스로 송신하도록 통신 인터페이스(111)를 제어할 수 있다.
일 실시예에 따라서, 프로세서(112)( 또는 프로세서(132), 프로세서(142))는, CPU(central processing unit), DSP(digital signal processor), AP(application processor), 또는 CP(communication processor)와 같은 범용 프로세서, GPU(graphical processing unit), VPU(vision processing Unit)와 같은 그래픽 전용 프로세서 또는 NPU(neural processing unit)와 같은 인공 지능 전용 프로세서 중 하나 이상의 조합으로 구현될 수 있다. 상술한 처리 유닛은 단순히 예시적인 것으로, 프로세서(112)는, 예를 들어 데이터베이스(115)에 저장된 정보에 기반하여 메모리(113)에 저장된 인스트럭션을 실행하여, 실행된 결과를 출력할 수 있는 연산 수단이라면 제한이 없음을 당업자는 이해할 것이다.
일 실시예에 따라서, 프로세서(112)는, API(114)에 기반하여 웹-기반 인터페이스를 구성하거나, 또는 제 1 IoT 서버(110)에 의하여 관리되는 리소스(resource)를 외부에 노출시킬 수 있다. 웹-기반 인터페이스는, 예를 들어 제 1 IoT 서버(110) 및 외부 웹 서비스 사이의 통신을 지원할 수 있다. 프로세서(112)는, 예를 들어 외부 시스템(160)으로 하여금 디바이스들(121,122,123)의 제어 및/또는 억세스를 허용할 수도 있다. 외부 시스템(160)은, 예를 들어 시스템(100)과 연관이 없거나, 또는 일부가 아닌 독립적인 시스템일 수 있다. 외부 시스템(160)은, 예를 들어 외부 서버이거나, 또는 웹 사이트일 수 있다. 하지만, 외부 시스템(160)으로부터의 디바이스들(121,122,123), 또는 제 1 IoT 서버(110)의 리소스로의 억세스에 대한 보안이 요구된다. 일 실시예에 따라서, 프로세서(112)는, 자동화 어플리케이션은 API(114)에 기반한 API 엔드 포인트(예: URL(universal resource locator))을 외부에 노출할 수 있다. 상술한 바에 따라서, 제 1 IoT 서버(110)는, 제어 명령을 디바이스들(121,122,123) 중 타겟 디바이스에게 전달할 수 있다. 한편, 제 2 IoT 서버(140)의 통신 인터페이스(141), 프로세서(142), 저장부(143)의 API(144), 데이터베이스(145)에 대한 설명은, 제 1 IoT 서버(110)의 통신 인터페이스(111), 프로세서(112), 저장부(113)의 API(114), 데이터베이스(115)에 대한 설명과 실질적으로 동일할 수 있다. 아울러, 제 2 노드(150)에 대한 설명은, 제 1 노드(120)에 대한 설명과 실질적으로 동일할 수 있다. 제 2 IoT 서버(140)는, 제어 명령을 디바이스들(151,152,153) 중 타겟 디바이스에게 전달할 수 있다. 제 1 IoT 서버(110) 및 제 2 IoT 서버(140)는, 하나의 실시예에서는 동일한 서비스 제공자에 의하여 운영될 수 있으나, 다른 실시예에서는 상이한 서비스 제공자들에 의하여 각각 운영될 수도 있다.
일 실시예에 따라서, 보이스 어시스턴트 서버(130)는, 데이터 네트워크(116)를 통하여 제 1 IoT 서버(110)와 데이터를 송수신할 수 있다. 일 실시예에 따른 보이스 어시스턴트 서버(130)는, 통신 인터페이스(131), 프로세서(132), 또는 저장부(133) 중 적어도 하나를 포함할 수 있다. 통신 인터페이스(131)는, 데이터 네트워크(미도시) 및/또는 셀룰러 네트워크(미도시)를 통하여 스마트 폰(136) 또는 AI 스피커(137)와 통신을 수행할 수 있다. 스마트 폰(136) 또는 AI 스피커(137)는 마이크를 포함할 수 있으며, 사용자 음성(user voice)을 획득하여 음성 신호로 변환하여, 음성 신호를 보이스 어시스턴트 서버(130)로 송신할 수 있다. 프로세서(132)는, 통신 인터페이스(131)를 통하여 스마트 폰(136) 또는 AI 스피커(137)로부터 음성 신호를 수신할 수 있다. 프로세서(132)는, 수신한 음성 신호를 저장된 모델(134)에 기반하여 처리할 수 있다. 프로세서(132)는, 데이터베이스(135)에 저장된 정보에 기반하여, 처리 결과를 이용하여 제어 명령을 생성(또는, 확인)할 수 있다. 일 실시예에 따라서, 저장부(113,133,143)는, 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램(RAM, random access memory) SRAM(static random access memory), 롬(ROM, read-only memory), EEPROM(electrically erasable programmable read-only memory), PROM(programmable read-only memory), 자기 메모리, 자기 디스크, 또는 광디스크 중 적어도 하나의 타입의 비 일시적(non-transitory) 저장매체를 포함할 수 있으며, 그 종류에는 제한이 없다.
일 실시예에서 제1 IoT 서버(110)와 통신하는 적어도 하나의 디바이스(예를 들어 디바이스(124))는 네트워크 환경 내의 전자 장치(일 예로서 도 2의 전자 장치(201))일 수 있다.
도 2는 다양한 실시예들에 따른 네트워크 환경(200) 내의 전자 장치(201)의 블록도이다.
도 2를 참조하면, 네트워크 환경(200)에서 전자 장치(201)는 제 1 네트워크(298)(예: 근거리 무선 통신 네트워크)를 통하여 전자 장치(202)와 통신하거나, 또는 제 2 네트워크(299)(예: 원거리 무선 통신 네트워크)를 통하여 전자 장치(204) 또는 서버(208) 중 적어도 하나와 통신할 수 있다. 일 실시예에 따르면, 전자 장치(201)는 서버(208)를 통하여 전자 장치(204)와 통신할 수 있다. 일 실시예에 따르면, 전자 장치(201)는 프로세서(220), 메모리(230), 입력 모듈(250), 음향 출력 모듈(255), 디스플레이 모듈(260), 오디오 모듈(270), 센서 모듈(276), 인터페이스(277), 연결 단자(278), 햅틱 모듈(279), 카메라 모듈(280), 전력 관리 모듈(288), 배터리(289), 통신 모듈(290), 가입자 식별 모듈(296), 또는 안테나 모듈(297)을 포함할 수 있다. 어떤 실시예에서는, 전자 장치(201)에는, 이 구성요소들 중 적어도 하나(예: 연결 단자(278))가 생략되거나, 하나 이상의 다른 구성요소가 추가될 수 있다. 어떤 실시예에서는, 이 구성요소들 중 일부들(예: 센서 모듈(276), 카메라 모듈(280), 또는 안테나 모듈(297))은 하나의 구성요소(예: 디스플레이 모듈(260))로 통합될 수 있다.
프로세서(220)는, 예를 들면, 소프트웨어(예: 프로그램(240))를 실행하여 프로세서(220)에 연결된 전자 장치(201)의 적어도 하나의 다른 구성요소(예: 하드웨어 또는 소프트웨어 구성요소)를 제어할 수 있고, 다양한 데이터 처리 또는 연산을 수행할 수 있다. 일실시예에 따르면, 데이터 처리 또는 연산의 적어도 일부로서, 프로세서(220)는 다른 구성요소(예: 센서 모듈(276) 또는 통신 모듈(290))로부터 수신된 명령 또는 데이터를 휘발성 메모리(232)에 저장하고, 휘발성 메모리(232)에 저장된 명령 또는 데이터를 처리하고, 결과 데이터를 비휘발성 메모리(234)에 저장할 수 있다. 일실시예에 따르면, 프로세서(220)는 메인 프로세서(221)(예: 중앙 처리 장치 또는 어플리케이션 프로세서) 또는 이와는 독립적으로 또는 함께 운영 가능한 보조 프로세서(223)(예: 그래픽 처리 장치, 신경망 처리 장치(NPU: neural processing unit), 이미지 시그널 프로세서, 센서 허브 프로세서, 또는 커뮤니케이션 프로세서)를 포함할 수 있다. 예를 들어, 전자 장치(201)가 메인 프로세서(221) 및 보조 프로세서(223)를 포함하는 경우, 보조 프로세서(223)는 메인 프로세서(221)보다 저전력을 사용하거나, 지정된 기능에 특화되도록 설정될 수 있다. 보조 프로세서(223)는 메인 프로세서(221)와 별개로, 또는 그 일부로서 구현될 수 있다.
보조 프로세서(223)는, 예를 들면, 메인 프로세서(221)가 인액티브(예: 슬립) 상태에 있는 동안 메인 프로세서(221)를 대신하여, 또는 메인 프로세서(221)가 액티브(예: 어플리케이션 실행) 상태에 있는 동안 메인 프로세서(221)와 함께, 전자 장치(201)의 구성요소들 중 적어도 하나의 구성요소(예: 디스플레이 모듈(260), 센서 모듈(276), 또는 통신 모듈(290))와 관련된 기능 또는 상태들의 적어도 일부를 제어할 수 있다. 일실시예에 따르면, 보조 프로세서(223)(예: 이미지 시그널 프로세서 또는 커뮤니케이션 프로세서)는 기능적으로 관련 있는 다른 구성요소(예: 카메라 모듈(280) 또는 통신 모듈(290))의 일부로서 구현될 수 있다. 일실시예에 따르면, 보조 프로세서(223)(예: 신경망 처리 장치)는 인공지능 모델의 처리에 특화된 하드웨어 구조를 포함할 수 있다. 인공지능 모델은 기계 학습을 통해 생성될 수 있다. 이러한 학습은, 예를 들어, 인공지능 모델이 수행되는 전자 장치(201) 자체에서 수행될 수 있고, 별도의 서버(예: 서버(208))를 통해 수행될 수도 있다. 학습 알고리즘은, 예를 들어, 지도형 학습(supervised learning), 비지도형 학습(unsupervised learning), 준지도형 학습(semi-supervised learning) 또는 강화 학습(reinforcement learning)을 포함할 수 있으나, 전술한 예에 한정되지 않는다. 인공지능 모델은, 복수의 인공 신경망 레이어들을 포함할 수 있다. 인공 신경망은 심층 신경망(DNN: deep neural network), CNN(convolutional neural network), RNN(recurrent neural network), RBM(restricted boltzmann machine), DBN(deep belief network), BRDNN(bidirectional recurrent deep neural network), 심층 Q-네트워크(deep Q-networks) 또는 상기 중 둘 이상의 조합 중 하나일 수 있으나, 전술한 예에 한정되지 않는다. 인공지능 모델은 하드웨어 구조 이외에, 추가적으로 또는 대체적으로, 소프트웨어 구조를 포함할 수 있다.
메모리(230)는, 전자 장치(201)의 적어도 하나의 구성요소(예: 프로세서(220) 또는 센서 모듈(276))에 의해 사용되는 다양한 데이터를 저장할 수 있다. 데이터는, 예를 들어, 소프트웨어(예: 프로그램(240)) 및, 이와 관련된 명령에 대한 입력 데이터 또는 출력 데이터를 포함할 수 있다. 메모리(230)는, 휘발성 메모리(232) 또는 비휘발성 메모리(234)를 포함할 수 있다.
프로그램(240)은 메모리(230)에 소프트웨어로서 저장될 수 있으며, 예를 들면, 운영 체제(242), 미들 웨어(244) 또는 어플리케이션(246)을 포함할 수 있다.
입력 모듈(250)은, 전자 장치(201)의 구성요소(예: 프로세서(220))에 사용될 명령 또는 데이터를 전자 장치(201)의 외부(예: 사용자)로부터 수신할 수 있다. 입력 모듈(250)은, 예를 들면, 마이크, 마우스, 키보드, 키(예: 버튼), 또는 디지털 펜(예: 스타일러스 펜)을 포함할 수 있다.
음향 출력 모듈(255)은 음향 신호를 전자 장치(201)의 외부로 출력할 수 있다. 음향 출력 모듈(255)은, 예를 들면, 스피커 또는 리시버를 포함할 수 있다. 스피커는 멀티미디어 재생 또는 녹음 재생과 같이 일반적인 용도로 사용될 수 있다. 리시버는 착신 전화를 수신하기 위해 사용될 수 있다. 일실시예에 따르면, 리시버는 스피커와 별개로, 또는 그 일부로서 구현될 수 있다.
디스플레이 모듈(260)은 전자 장치(201)의 외부(예: 사용자)로 정보를 시각적으로 제공할 수 있다. 디스플레이 모듈(260)은, 예를 들면, 디스플레이, 홀로그램 장치, 또는 프로젝터 및 해당 장치를 제어하기 위한 제어 회로를 포함할 수 있다. 일실시예에 따르면, 디스플레이 모듈(260)은 터치를 감지하도록 설정된 터치 센서, 또는 상기 터치에 의해 발생되는 힘의 세기를 측정하도록 설정된 압력 센서를 포함할 수 있다.
오디오 모듈(270)은 소리를 전기 신호로 변환시키거나, 반대로 전기 신호를 소리로 변환시킬 수 있다. 일실시예에 따르면, 오디오 모듈(270)은, 입력 모듈(250)을 통해 소리를 획득하거나, 음향 출력 모듈(255), 또는 전자 장치(201)와 직접 또는 무선으로 연결된 외부 전자 장치(예: 전자 장치(202))(예: 스피커 또는 헤드폰)를 통해 소리를 출력할 수 있다.
센서 모듈(276)은 전자 장치(201)의 작동 상태(예: 전력 또는 온도), 또는 외부의 환경 상태(예: 사용자 상태)를 감지하고, 감지된 상태에 대응하는 전기 신호 또는 데이터 값을 생성할 수 있다. 일실시예에 따르면, 센서 모듈(276)은, 예를 들면, 제스처 센서, 자이로 센서, 기압 센서, 마그네틱 센서, 가속도 센서, 그립 센서, 근접 센서, 컬러 센서, IR(infrared) 센서, 생체 센서, 온도 센서, 습도 센서, 또는 조도 센서를 포함할 수 있다.
인터페이스(277)는 전자 장치(201)가 외부 전자 장치(예: 전자 장치(202))와 직접 또는 무선으로 연결되기 위해 사용될 수 있는 하나 이상의 지정된 프로토콜들을 지원할 수 있다. 일실시예에 따르면, 인터페이스(277)는, 예를 들면, HDMI(high definition multimedia interface), USB(universal serial bus) 인터페이스, SD카드 인터페이스, 또는 오디오 인터페이스를 포함할 수 있다.
연결 단자(278)는, 그를 통해서 전자 장치(201)가 외부 전자 장치(예: 전자 장치(202))와 물리적으로 연결될 수 있는 커넥터를 포함할 수 있다. 일실시예에 따르면, 연결 단자(278)는, 예를 들면, HDMI 커넥터, USB 커넥터, SD 카드 커넥터, 또는 오디오 커넥터(예: 헤드폰 커넥터)를 포함할 수 있다.
햅틱 모듈(279)은 전기적 신호를 사용자가 촉각 또는 운동 감각을 통해서 인지할 수 있는 기계적인 자극(예: 진동 또는 움직임) 또는 전기적인 자극으로 변환할 수 있다. 일실시예에 따르면, 햅틱 모듈(279)은, 예를 들면, 모터, 압전 소자, 또는 전기 자극 장치를 포함할 수 있다.
카메라 모듈(280)은 정지 영상 및 동영상을 촬영할 수 있다. 일실시예에 따르면, 카메라 모듈(280)은 하나 이상의 렌즈들, 이미지 센서들, 이미지 시그널 프로세서들, 또는 플래시들을 포함할 수 있다.
전력 관리 모듈(288)은 전자 장치(201)에 공급되는 전력을 관리할 수 있다. 일실시예에 따르면, 전력 관리 모듈(288)은, 예를 들면, PMIC(power management integrated circuit)의 적어도 일부로서 구현될 수 있다.
배터리(289)는 전자 장치(201)의 적어도 하나의 구성요소에 전력을 공급할 수 있다. 일실시예에 따르면, 배터리(289)는, 예를 들면, 재충전 불가능한 1차 전지, 재충전 가능한 2차 전지 또는 연료 전지를 포함할 수 있다.
통신 모듈(290)은 전자 장치(201)와 외부 전자 장치(예: 전자 장치(202), 전자 장치(204), 또는 서버(208)) 간의 직접(예: 유선) 통신 채널 또는 무선 통신 채널의 수립, 및 수립된 통신 채널을 통한 통신 수행을 지원할 수 있다. 통신 모듈(290)은 프로세서(220)(예: 어플리케이션 프로세서)와 독립적으로 운영되고, 직접(예: 유선) 통신 또는 무선 통신을 지원하는 하나 이상의 커뮤니케이션 프로세서를 포함할 수 있다. 일실시예에 따르면, 통신 모듈(290)은 무선 통신 모듈(292)(예: 셀룰러 통신 모듈, 근거리 무선 통신 모듈, 또는 GNSS(global navigation satellite system) 통신 모듈) 또는 유선 통신 모듈(294)(예: LAN(local area network) 통신 모듈, 또는 전력선 통신 모듈)을 포함할 수 있다. 이들 통신 모듈 중 해당하는 통신 모듈은 제 1 네트워크(298)(예: 블루투스, WiFi(wireless fidelity) direct 또는 IrDA(infrared data association)와 같은 근거리 통신 네트워크) 또는 제 2 네트워크(299)(예: 레거시 셀룰러 네트워크, 5G 네트워크, 차세대 통신 네트워크, 인터넷, 또는 컴퓨터 네트워크(예: LAN 또는 WAN)와 같은 원거리 통신 네트워크)를 통하여 외부의 전자 장치(204)와 통신할 수 있다. 이런 여러 종류의 통신 모듈들은 하나의 구성요소(예: 단일 칩)로 통합되거나, 또는 서로 별도의 복수의 구성요소들(예: 복수 칩들)로 구현될 수 있다. 무선 통신 모듈(292)은 가입자 식별 모듈(296)에 저장된 가입자 정보(예: 국제 모바일 가입자 식별자(IMSI))를 이용하여 제 1 네트워크(298) 또는 제 2 네트워크(299)와 같은 통신 네트워크 내에서 전자 장치(201)를 확인 또는 인증할 수 있다.
무선 통신 모듈(292)은 4G 네트워크 이후의 5G 네트워크 및 차세대 통신 기술, 예를 들어, NR 접속 기술(new radio access technology)을 지원할 수 있다. NR 접속 기술은 고용량 데이터의 고속 전송(eMBB(enhanced mobile broadband)), 단말 전력 최소화와 다수 단말의 접속(mMTC(massive machine type communications)), 또는 고신뢰도와 저지연(URLLC(ultra-reliable and low-latency communications))을 지원할 수 있다. 무선 통신 모듈(292)은, 예를 들어, 높은 데이터 전송률 달성을 위해, 고주파 대역(예: mmWave 대역)을 지원할 수 있다. 무선 통신 모듈(292)은 고주파 대역에서의 성능 확보를 위한 다양한 기술들, 예를 들어, 빔포밍(beamforming), 거대 배열 다중 입출력(massive MIMO(multiple-input and multiple-output)), 전차원 다중입출력(FD-MIMO: full dimensional MIMO), 어레이 안테나(array antenna), 아날로그 빔형성(analog beam-forming), 또는 대규모 안테나(large scale antenna)와 같은 기술들을 지원할 수 있다. 무선 통신 모듈(292)은 전자 장치(201), 외부 전자 장치(예: 전자 장치(204)) 또는 네트워크 시스템(예: 제 2 네트워크(299))에 규정되는 다양한 요구사항을 지원할 수 있다. 일실시예에 따르면, 무선 통신 모듈(292)은 eMBB 실현을 위한 Peak data rate(예: 20Gbps 이상), mMTC 실현을 위한 손실 Coverage(예: 164dB 이하), 또는 URLLC 실현을 위한 U-plane latency(예: 다운링크(DL) 및 업링크(UL) 각각 0.5ms 이하, 또는 라운드 트립 1ms 이하)를 지원할 수 있다.
안테나 모듈(297)은 신호 또는 전력을 외부(예: 외부의 전자 장치)로 송신하거나 외부로부터 수신할 수 있다. 일실시예에 따르면, 안테나 모듈(297)은 서브스트레이트(예: PCB) 위에 형성된 도전체 또는 도전성 패턴으로 이루어진 방사체를 포함하는 안테나를 포함할 수 있다. 일실시예에 따르면, 안테나 모듈(297)은 복수의 안테나들(예: 어레이 안테나)을 포함할 수 있다. 이런 경우, 제 1 네트워크(298) 또는 제 2 네트워크(299)와 같은 통신 네트워크에서 사용되는 통신 방식에 적합한 적어도 하나의 안테나가, 예를 들면, 통신 모듈(290)에 의하여 상기 복수의 안테나들로부터 선택될 수 있다. 신호 또는 전력은 상기 선택된 적어도 하나의 안테나를 통하여 통신 모듈(290)과 외부의 전자 장치 간에 송신되거나 수신될 수 있다. 어떤 실시예에 따르면, 방사체 이외에 다른 부품(예: RFIC(radio frequency integrated circuit))이 추가로 안테나 모듈(297)의 일부로 형성될 수 있다.
다양한 실시예에 따르면, 안테나 모듈(297)은 mmWave 안테나 모듈을 형성할 수 있다. 일실시예에 따르면, mmWave 안테나 모듈은 인쇄 회로 기판, 상기 인쇄 회로 기판의 제 1 면(예: 아래 면)에 또는 그에 인접하여 배치되고 지정된 고주파 대역(예: mmWave 대역)을 지원할 수 있는 RFIC, 및 상기 인쇄 회로 기판의 제 2 면(예: 윗 면 또는 측 면)에 또는 그에 인접하여 배치되고 상기 지정된 고주파 대역의 신호를 송신 또는 수신할 수 있는 복수의 안테나들(예: 어레이 안테나)을 포함할 수 있다.
상기 구성요소들 중 적어도 일부는 주변 기기들간 통신 방식(예: 버스, GPIO(general purpose input and output), SPI(serial peripheral interface), 또는 MIPI(mobile industry processor interface))을 통해 서로 연결되고 신호(예: 명령 또는 데이터)를 상호간에 교환할 수 있다.
일 실시예에 따르면, 명령 또는 데이터는 제 2 네트워크(299)에 연결된 서버(208)를 통해서 전자 장치(201)와 외부의 전자 장치(204)간에 송신 또는 수신될 수 있다. 외부의 전자 장치(202, 또는 204) 각각은 전자 장치(201)와 동일한 또는 다른 종류의 장치일 수 있다. 일 실시예에 따르면, 전자 장치(201)에서 실행되는 동작들의 전부 또는 일부는 외부의 전자 장치들(202, 204, 또는 208) 중 하나 이상의 외부의 전자 장치들에서 실행될 수 있다. 예를 들면, 전자 장치(201)가 어떤 기능이나 서비스를 자동으로, 또는 사용자 또는 다른 장치로부터의 요청에 반응하여 수행해야 할 경우에, 전자 장치(201)는 기능 또는 서비스를 자체적으로 실행시키는 대신에 또는 추가적으로, 하나 이상의 외부의 전자 장치들에게 그 기능 또는 그 서비스의 적어도 일부를 수행하라고 요청할 수 있다. 상기 요청을 수신한 하나 이상의 외부의 전자 장치들은 요청된 기능 또는 서비스의 적어도 일부, 또는 상기 요청과 관련된 추가 기능 또는 서비스를 실행하고, 그 실행의 결과를 전자 장치(201)로 전달할 수 있다. 전자 장치(201)는 상기 결과를, 그대로 또는 추가적으로 처리하여, 상기 요청에 대한 응답의 적어도 일부로서 제공할 수 있다. 이를 위하여, 예를 들면, 클라우드 컴퓨팅, 분산 컴퓨팅, 모바일 에지 컴퓨팅(MEC: mobile edge computing), 또는 클라이언트-서버 컴퓨팅 기술이 이용될 수 있다. 전자 장치(201)는, 예를 들어, 분산 컴퓨팅 또는 모바일 에지 컴퓨팅을 이용하여 초저지연 서비스를 제공할 수 있다. 다른 실시예에 있어서, 외부의 전자 장치(204)는 IoT(internet of things) 기기를 포함할 수 있다. 서버(208)는 기계 학습 및/또는 신경망을 이용한 지능형 서버일 수 있다. 일실시예에 따르면, 외부의 전자 장치(204) 또는 서버(208)는 제 2 네트워크(299) 내에 포함될 수 있다. 전자 장치(201)는 5G 통신 기술 및 IoT 관련 기술을 기반으로 지능형 서비스(예: 스마트 홈, 스마트 시티, 스마트 카, 또는 헬스 케어)에 적용될 수 있다.
일 실시예에서 외부의 전자 장치(204)는 도 1의 디바이스들(121,122,123,151,152,153) 중 적어도 하나를 포함할 수 있다.
도 3은 일 실시예에 따른 외부 카메라를 포함하는 네트워크 시스템의 구조를 도시한 것이다.
도 3을 참조하면, 네트워크 시스템(300)은 서버(310), 적어도 하나의 카메라(320), 전자 장치(330), 및 사용자 장치(340)를 포함할 수 있다.
일 실시예에서 네트워크 시스템(300)은 홈 네트워크 또는 제한된 영역(예를 들어 건물 또는 지리적 영역)에 설치되는 네트워크를 포함할 수 있다. 서버(310)는 네트워크 시스템(300)을 관리하는 클라우드 서버를 포함할 수 있다. 서버(310)는 네트워크 시스템(300)에 온보딩된 적어도 하나의 IoT 장치(예를 들어 적어도 하나의 카메라(320))를 관리할 수 있고, 적어도 하나의 카메라(320)로부터 수집된 데이터(예를 들어 비디오 데이터)를 저장할 수 있고, 적어도 하나의 카메라(320)를 제어할 수 있다.
일 실시예에서 적어도 하나의 카메라(320)는 홈 네트워크 또는 제한된 영역에 설치되는 외부 카메라 장치를 포함할 수 있다. 일 실시예에서 적어도 하나의 카메라(320)는 하나 또는 그 이상의 IoT 카메라들(320a, 320b)을 포함할 수 있다. 적어도 하나의 카메라(320)는 제한된 성능 및/또는 하드웨어 스펙을 가질 수 있으며 모션 검출 및/또는 사운드 검출과 같은 기본적인 솔루션만을 제공하도록 구성될 수 있다.
일 실시예에서 전자 장치(330)는 네트워크 시스템(300) 내의 IoT 장치들(예를 들어 적어도 하나의 카메라(320))가 녹화한 데이터(예를 들어 비디오 데이터 또는 이벤트 데이터)를 예를 들어 실시간으로 또는 비교적 짧은 주기로 수집하고 저장할 수 있다. 일 실시예에서 전자 장치(330)는 적어도 하나의 IoT 카메라(예를 들어 카메라(320))와 결합될 수 있고, 카메라(320)와 서버(310) 사이에서 카메라(320)에서 생성된 비디오 데이터를 처리하도록 구성되는 에지 장치(edge device)를 포함할 수 있다. 일 실시예에서 에지 장치는 TV, 허브, 태블릿, 가전기기, 스마트폰, 개인 컴퓨터(PC), 태블릿, 랩탑, 또는 노트북 컴퓨터 중 적어도 하나를 포함될 수 있다.
일 실시예에서 전자 장치(330)는 적어도 하나의 카메라(320)와 가깝게 위치할 수 있고, 유선 통신 또는 근거리 무선 통신 기술(예를 들어 블루투스, 저전력 블루투스(bluetooth low energy: BLE), Wi-Fi, 또는 Wi-Fi direct 중 적어도 하나)을 사용하여 적어도 하나의 카메라(320)와 통신하도록 구성될 수 있다. 일 실시예에서 전자 장치(330)는 적어도 하나의 카메라(320)에 의해 녹화된 비디오 데이터를 위한 저장공간을 제공할 수 있고, 및/또는 상기 비디오 데이터를 위한 추가적인 솔루션(예를 들어 비디오 분석 및/또는 이벤트 검출)을 제공할 수 있다. 일 실시예에서 전자 장치(330)는 서버(310)에 등록(예를 들어 온보딩)될 수 있고, 데이터 통신 네트워크(예를 들어 인터넷)를 통해 서버(310)와 통신하도록 구성될 수 있다.
일 실시예에서 사용자 장치(340)는 사용자로부터의 요청 신호를 전자 장치(330) 및/또는 서버(310)로 전송하거나, 원하는 데이터(예를 들어 비디오 데이터)를 전자 장치(330) 및/또는 서버(310)로부터 수신할 수 있다. 일 실시예에서 사용자 장치(340)는 스마트폰, 개인 컴퓨터(personal computer: PC), 태블릿, 랩탑, 또는 노트북 컴퓨터를 포함할 수 있다. 일 실시예에서 사용자 장치(340)는 도 1의 전자 장치(201)를 포함할 수 있다.
일 실시예에서 사용자 장치(340)는 유선 통신 또는 근거리 무선 통신 기술(예를 들어 블루투스, 저전력 블루투스(bluetooth low energy: BLE), Wi-Fi, 또는 Wi-Fi direct 중 적어도 하나)을 사용하여 전자 장치(330)와 통신하도록 구성될 수 있다. 일 실시예에서 사용자 장치(340)는 데이터 통신 네트워크(예를 들어 인터넷)를 통해 전자 장치(330)와 통신하도록 구성될 수 있다. 일 실시예에서 사용자 장치(340)는 데이터 통신 네트워크(예를 들어 인터넷)를 통해 서버(310)와 통신하도록 구성될 수 있다.
사용자가 설치한 IoT 카메라(예를 들어 IoT 카메라(320a 또는 320b))에서 모션 검출이 발생하였을 때, IoT 카메라(320a 또는 320b)는 제한된 저장용량으로 인하여 상기 모션 검출에 근거하여 지정된 기간(duration)(예를 들어 10초)의 비디오 클립 파일을 생성할 수 있다. 또한 IoT 카메라(320a 또는 320b)는 상기 비디오 클립 파일을 서버(310)로 업로드하는 클라우드 비용(cloud cost)을 발생시킬 수 있다. 서버(310)는 상기 비디오 클립 파일을 지정된 기간(예를 들어 1일 또는 30일) 동안 저장하고 그 이후에는 삭제할 수 있다.
서버(310)는 각 IoT 카메라(예를 들어 IoT 카메라(320a) 및 IoT 카메라(320b))로부터 수집된 비디오 클립 파일들을 녹화 순서대로 포함하는 클립 리스트(clip list)를 관리할 수 있고, 사용자로부터의 요청(예를 들어 사용자 장치(340)로부터의 요청 신호)에 응답하여 상기 클립 리스트를 사용자 장치(340)에게 전송할 수 있다. 사용자는 각 IoT 카메라(예를 들어 IoT 카메라(320a) 또는 IoT 카메라(320b))에서 생성된 방대한 양의 비디오 클립 파일들 중 원하는 장면을 찾기 위해 다수의 비디오 클립 파일들을 일일이 재생하며 시청하여야 할 수 있다.
본 개시의 실시예들은 서버(310)에 등록된 카메라(320)와 전자 장치(330)의 연동을 통해 카메라(320)가 가지는 제한된 성능, 하드웨어 제약 및 클라우드 제약을 해소시킬 수 있다.
도 4a는 일 실시예에 따른 전자 장치(330)의 구성을 나타낸 블록도이다.
도 4a를 참조하면, 전자 장치(330)는 하나 또는 그 이상의 안테나들(402), 통신 회로(404), 프로세서(406), 메모리(408), 인터페이스(410), 또는 디스플레이(412) 중 적어도 하나를 포함할 수 있다.
일 실시예에서 전자 장치(330)는 통신 회로(404)를 통해 적어도 하나의 카메라(320), 서버(310) 및/또는 사용자 장치(340)와 통신할 수 있다. 일 실시예에서 통신 회로(404)는 근거리 무선 통신 기술(예를 들어 블루투스, 저전력 블루투스(bluetooth low energy: BLE), Wi-Fi, 또는 Wi-Fi direct 중 적어도 하나), 또는 원거리 무선 통신 기술(예를 들어 셀룰러 네트워크, 인터넷, 또는 컴퓨터 네트워크 중 적어도 하나)을 지원하도록 구성될 수 있다. 일 실시예에서 통신 회로(404)는 하나 또는 두 개 이상의 안테나들(402)을 사용하여 적어도 하나의 카메라(320), 서버(310) 및/또는 사용자 장치(340)와 신호들을 송수신할 수 있다.
일 실시예에 따르면, 통신 회로(404)는 적어도 하나의 통신 회로를 포함할 수 있으며, 적어도 하나의 통신 회로는 예를 들어 적어도 하나의 통신 기술에 기반하는 신호들을 송신하거나 수신하도록 구성될 수 있다. 일 실시예에 따르면, 전자 장치(330)는 하나 이상의 통신 프로토콜들 각각에 기반하는 별도의 통신 회로들을 포함하지 않고, 하나 이상의 통신 프로토콜들 중 적어도 2개 이상을 지원하는 통신 회로(404)를 포함할 수 있다.
일 실시예에서 전자 장치(330)는 네트워크 외부의 구성 요소들(components)(예를 들어 적어도 하나의 카메라(320))과 통신하기 위한 유선 및/또는 무선 인터페이스를 제공하는 인터페이스(410)를 포함할 수 있다.
일 실시예에서 전자 장치(330)는 하나 또는 두 개 이상의 단일 코어 프로세서들 또는 하나 또는 두 개 이상의 다중 코어 프로세서들로 구현될 수 있는 프로세서(406)와, 프로세서(406)의 동작들을 위한 인스트럭션(instruction)들을 저장하는 메모리(408)를 포함할 수 있다. 프로세서(406)는 카메라(320)로부터 수신된 비디오 데이터를 기반으로 다양한 재생 길이의 비디오 클립 파일들을 생성하고, 각 비디오 클립 파일들을 기반으로 카메라(320)를 대신하여 고성능 처리가 필요한 비디오 분석을 제공하며, 비디오 분석의 결과를 나타내는 메타 데이터를 해당 비디오 클립 파일과 함께 메모리(408)에 기록할 수 있다.
일 실시예에서 프로세서(406)는 카메라(320)에서 지원하기 어려운 다양한 분석 솔루션들(예를 들어 인체 검출(human detection), 애완동물 검출(pet detection), 안면 인식(face recognition), 아기 울음(baby crying), 개 짖음(dog barking), 또는 윈도우 파손(window breaking) 중 적어도 하나)을 제공할 수 있고, 비디오 분석을 통해 획득한 결과를 이벤트 메타데이터로 저장할 수 있다.
일 실시예에서 프로세서(406)는 비디오 클립 파일들과 이벤트 메타데이터를 기반으로 이벤트 기반의 비디오 서머리 파일을 생성할 수 있고, 사용자의 요청에 따라 비디오 서머리 파일로부터 사용자가 원하는 원본 비디오 클립 파일(예를 들어 비디오 클립 파일)을 빠르게 찾을 수 있는 경험을 제공할 수 있다.
일 실시예에 따르면, 메모리(408)는 비디오 분석과 관련된 솔루션들을 제공하기 위한 코드 및/또는 데이터를 저장할 수 있다. 일 실시예에 따르면, 메모리(408)는 적어도 하나의 카메라(320)로부터 수신된 비디오 데이터(예를 적어도 하나의 비디오 클립 파일), 이벤트 메타데이터, 비디오 서머리 파일, 또는 서머리 메타데이터 중 적어도 하나를 저장할 수 있다.
도 4b는 일 실시예에 따른 전자 장치의 소프트웨어 구성을 설명하기 위한 도면이다.
도 4b를 참조하면, 전자 장치(330)(예를 들어 프로세서(406))는 링 버퍼(ring buffer)(414), 분석 모듈(analysis module)(416), 클립 생성기(clip generator)(418), 비디오 서머리 생성기(video summary generator)(420), 또는 제어 모듈(control module)(422) 중 적어도 하나를 포함할 수 있다. 상기한 구성요소들 중 적어도 하나는 프로세서(406)에 의해 실행되는 소프트웨어 모듈로 구현될 수 있다. 일 실시예에서 링 버퍼(414)는 프로세서(406)에 포함되거나 또는 메모리(408)에 포함될 수 있다.
일 실시예에서 제어 모듈(422)은 외부 전자 장치(예를 들어 카메라(320), 서버(310), 또는 사용자 장치(340) 중 적어도 하나)와의 통신을 담당할 수 있다. 일 실시예에서 제어 모듈(422)은 전자 장치(330)의 운영 시스템(operating system: OS)을 포함할 수 있다. 일 실시예에서 제어 모듈(422)은 카메라(320)와 보안 연결(예를 들어 TLS(transport layer security) 링크)을 수립하고 상기 보안 연결 상의 보안 스트리밍 채널(secure streaming channel)을 통해 카메라(320)로부터 오디오 및/또는 비디오를 포함하는 데이터 프레임들(예를 들어 비디오 프레임들)을 수신하고 상기 데이터 프레임들을 링 버퍼(414)에 저장할 수 있다. 제어 모듈(422)은 상기 데이터 프레임들을 분석 모듈(416)로 전달할 수 있다. 일 실시예에서 제어 모듈(422)은 데이터 통신 네트워크(예를 들어 인터넷)를 통해 서버(310) 또는 사용자 장치(340)로부터 이벤트 타입 및/또는 기간을 포함하는 서머리 요청 신호를 수신할 수 있다. 제어 모듈(422)은 상기 서머리 요청 신호를 비디오 서머리 생성기(420)로 전달할 수 있다.
일 실시예에서 링 버퍼(414)는 적어도 하나의 카메라(320)로부터 수신된 비디오 데이터(예를 들어 실시간 비디오 프레임들)를 수신된 순서대로 저장할 수 있다. 분석 모듈(416)은 하나 이상의 분석 솔루션들을 포함할 수 있다. 분석 모듈(416)은 링 버퍼(414)에 저장된 비디오 프레임들을 상기 분석 솔루션들에 의해 분석할 수 있고, 각 분석 솔루션에 따른 이벤트(예를 들어 인간 검출, 생명체 검출, 애완동물 검출, 안면 인식, 사운드 검출(예를 들어 아기 울음, 개 짖음, 고양이 울음 또는 사이렌), 윈도우 파손)를 검출할 수 있다. 분석 모듈(416)은 상기 분석 결과에 따라 상기 검출된 이벤트를 나타내는 이벤트 메타데이터를 생성할 수 있다.
일 실시예에서 클립 생성기(418)는 분석 모듈(416)에 의한 분석 결과를 기반으로 미리 지정되거나 또는 분석 모듈(416)에 의해 지정되는 포맷 및/또는 크기에 따라 하나 이상의 비디오 프레임들을 포함하는 비디오 클립 파일을 생성할 수 있다. 일 실시예에서 하나의 비디오 클립 파일은 하나 또는 그 이상의 이벤트를 포함할 수 있다. 일 실시예에서 하나의 비디오 클립 파일은 고유한 클립 ID에 의해 식별될 수 있고, 하나의 이벤트 메타데이터와 연관될 수 있다. 일 실시예에서 이벤트 메타데이터는 클립 ID, 이벤트 타입, 또는 타임스탬프 중 적어도 하나를 포함할 수 있다. 일 실시예에서 상기 이벤트 타입은 인체 검출, 애완동물 검출, 안면 인식, 아기 울음, 개 짖음, 또는 윈도우 파손 중 어느 하나를 지시할 수 있다.
일 실시예에서 비디오 서머리 생성기(420)는 미리 지정된 시간 및/또는 사용자가 설정한 시간 동안의 비디오 클립 파일들과 해당하는 이벤트 메타데이터를 기반으로 비디오 서머리 파일을 생성할 수 있다. 비디오 서머리 생성기(420)는 비디오 클립 파일들로부터 사용자가 지정한 이벤트 타입 및/또는 기간에 대응하는 이벤트를 포함하는 하나 이상의 비디오 프레임들을 선택하고, 상기 선택한 하나 이상의 비디오 프레임들을 포함하는 비디오 서머리 파일을 생성할 수 있다. 비디오 서머리 생성기(420)는 상기 비디오 서머리 파일과 관련되는 원본 비디오 클립 파일들(예를 들어 비디오 클립 파일들)을 나타내는 서머리 메타데이터를 생성할 수 있다. 상기 서머리 메타데이터는 클립 ID, 또는 타임스탬프 중 적어도 하나를 포함할 수 있다.
도 5는 일 실시예에 따라 이벤트 기반의 비디오 서머리를 제공하는 동작을 나타낸 흐름도이다. 실시예들에 따라 후술되는 동작들 중 적어도 하나는 생략되거나 변형되거나 순서 변경될 수 있다. 후술되는 동작들 중 적어도 하나는 전자 장치(330)의 프로세서(406)에 의해 실행될 수 있다.
도 5를 참조하면, 동작 505에서 전자 장치(330)(예를 들어 프로세서(406))는 카메라(320)와 보안 연결을 수립할 수 있다. 일 실시예에서 전자 장치(330)(예를 들어 프로세서(406))는 블루투스, BLE 또는 Wi-Fi를 사용하여 카메라(320)와 연결될 수 있다.
동작 510에서 전자 장치(330)(예를 들어 프로세서(406))는 상기 보안 연결을 통해 카메라(320)로부터 오디오 및/또는 비디오를 포함하는 비디오 데이터(예를 들어 하나 이상의 비디오 프레임들 또는 비디오 클립)를 수신할 수 있다.
동작 515에서 전자 장치(330)(예를 들어 프로세서(406))는 상기 비디오 데이터를 분석하여 지정된 적어도 하나의 솔루션(예를 들어 이벤트 타입별 솔루션)에 따라 적어도 하나의 이벤트를 검출할 수 있다.
동작 520에서 전자 장치(330)(예를 들어 프로세서(406))는 상기 비디오 데이터를 포함하는 지정된 길이(예를 들어 고정된 길이, 또는 가변 길이)의 비디오 클립 파일을 생성할 수 있다.
동작 525에서 전자 장치(330)(예를 들어 프로세서(406))는 상기 비디오 클립 파일에 포함되는 비디오 데이터에서 검출된 적어도 하나의 이벤트를 나타내는 이벤트 메타데이터를 생성할 수 있다. 일 실시예에서 하나의 비디오 클립 파일은 적어도 하나의 이벤트 메타데이터와 연관될 수 있다. 일 실시예에서 상기 이벤트 메타데이터는 대응하는 비디오 클립 파일을 식별하는 클립 식별자(identifier: ID), 상기 비디오 클립 파일에 포함된 이벤트를 나타내는 이벤트 타입, 또는 상기 비디오 클립 파일 내에서 상기 이벤트가 검출된 시간 위치를 나타내는 타임스탬프 중 적어도 하나를 포함할 수 있다. 일 실시예에서 전자 장치(330)(예를 들어 프로세서(406))는 상기 비디오 클립 파일 및 그에 대응하는 이벤트 메타데이터를 메모리(408)에 저장할 수 있다. 일 실시예에서 전자 장치(330)(예를 들어 프로세서(406))는 상기 비디오 클립 파일 및 그에 대응하는 이벤트 메타데이터를 지정된 시점, 요구된 시점 또는 주기적인 시점에서 서버(310)로 전송할 수 있다.
동작 530에서 전자 장치(330)(예를 들어 프로세서(406))는 외부 전자 장치(예를 들어 서버(310) 또는 사용자 장치(340))로부터 서머리 요청 신호가 수신되는지 판단할 수 있다. 서머리 요청 신호가 수신되는 경우(동작 530에서 '예'인 경우) 전자 장치(330)(예를 들어 프로세서(406))는 동작 535로 진행할 수 있다. 상기 서머리 요청 신호는 사용자가 지정하는 적어도 하나의 이벤트 타입 및/또는 기간을 포함할 수 있다. 서머리 요청 신호가 수신되지 않는 경우(동작 530에서 '아니오'인 경우) 전자 장치(330)(예를 들어 프로세서(406))는 동작 510으로 복귀하거나 동작들을 종료할 수 있다.
동작 535에서 전자 장치(330)(예를 들어 프로세서(406))는 상기 서머리 요청 신호를 기반으로 메모리(408)에 저장된 이벤트 메타데이터 및 비디오 클립 파일들로부터 적어도 하나의 비디오 서머리 파일 및 서머리 메타데이터를 생성할 수 있다. 일 실시예에서 상기 서머리 요청 신호는 하나 이상의 이벤트 타입들을 지시할 수 있고, 전자 장치(330)(예를 들어 프로세서(406))는 상기 하나 이상의 이벤트 타입들에 각각 대응하는 하나 이상의 비디오 서머리 파일들을 생성하거나, 또는 하나 이상의 이벤트 타입들에 대응하는 하나의 비디오 서머리 파일을 생성할 수 있다.
일 실시예에서 전자 장치(330)(예를 들어 프로세서(406))는 메모리(408)에 저장된 이벤트 메타데이터를 기반으로 상기 서머리 요청 신호의 이벤트 타입을 가지는 하나 이상의 이벤트들을 포함하는 비디오 클립 파일들의 클립 ID들과 타임스탬프들을 검색할 수 있다. 일 실시예에서 전자 장치(330)(예를 들어 프로세서(406))는 메모리(408)에 저장된 비디오 클립 파일들로부터 상기 타임스탬프들에 대응하는 비디오 프레임들을 추출할 수 있다. 일 실시예에서 전자 장치(330)(예를 들어 프로세서(406))는 상기 추출된 비디오 프레임들을 포함하는 비디오 서머리 파일을 생성할 수 있다. 일 실시예에서 전자 장치(330)(예를 들어 프로세서(406))는 상기 비디오 서머리 파일에 대응하는 서머리 메타데이터를 생성할 수 있다. 상기 서머리 메타데이터는 상기 비디오 서머리 파일에 포함된 비디오 프레임들의 원본 비디오 클립 파일들(예를 들어 비디오 클립 파일들)을 지시하는 하나 이상의 클립 ID들을 포함할 수 있다. 상기 서머리 메타데이터는 상기 비디오 서머리 파일 내에서 각 클립 ID에 대응하는 비디오 프레임들의 시간 위치를 지시하는 타임스탬프를 포함할 수 있다.
동작 540에서 전자 장치(330)(예를 들어 프로세서(406))는 상기 비디오 서머리 파일 및 서머리 메타데이터를 외부 전자 장치(예를 들어 서버(310) 또는 사용자 장치(340))로 전송할 수 있다. 일 실시예에서 전자 장치(330)(예를 들어 프로세서(406))는 상기 비디오 서머리 파일을 외부 전자 장치(예를 들어 서버(310) 또는 사용자 장치(340))로 전송하고, 추가 요청에 따라 서머리 메타데이터를 선택적으로 전송할 수 있다.
도 6은 일 실시예에 따라 이벤트 기반의 비디오 서머리에 따른 원본 비디오를 제공하는 동작을 나타낸 흐름도이다. 실시예들에 따라 후술되는 동작들 중 적어도 하나는 생략되거나 변형되거나 순서 변경될 수 있다. 후술되는 동작들 중 적어도 하나는 전자 장치(330)의 프로세서(406)에 의해 실행될 수 있다.
도 6을 참조하면, 동작 605에서 전자 장치(330)(예를 들어 프로세서(406))는 외부 전자 장치(예를 들어 서버(310) 또는 사용자 장치(340))로부터 적어도 하나의 이벤트 타입 및/또는 적어도 하나의 기간을 포함하는 서머리 요청 신호를 수신할 수 있다. 일 실시예에서 전자 장치(330)(예를 들어 프로세서(406))는 서머리 요청 신호를 수신하는 대신, 적어도 하나의 이벤트 타입 및/또는 적어도 하나의 기간에 대한 정보를 사용자로부터 직접 입력받을 수 있다.
동작 610에서 전자 장치(330)(예를 들어 프로세서(406))는 메모리(408)에 저장된 이벤트 메타데이터를 검색하여 상기 이벤트 타입 및/또는 적어도 하나의 기간에 대응하는 이벤트를 발견할 수 있다. 일 실시예에서 전자 장치(330)(예를 들어 프로세서(406))는 메모리(408)에 저장된 이벤트 메타데이터로부터 상기 적어도 하나의 이벤트 타입 및/또는 적어도 하나의 기간에 대응하는 적어도 하나의 클립 ID 및 적어도 하나의 타임스탬프를 획득할 수 있다.
동작 615에서 전자 장치(330)(예를 들어 프로세서(406))는 상기 발견된 이벤트에 대응하는 비디오 데이터(예를 들어 비디오 프레임들)를 포함하는 비디오 서머리 파일을 생성할 수 있다. 일 실시예에서 전자 장치(330)(예를 들어 프로세서(406))는 메모리(408)에 저장된 비디오 클립 파일들 중 상기 획득한 클립 ID에 대응하는 비디오 클립 파일을 검색하고, 상기 검색된 비디오 클립 파일 중 상기 획득한 타임스탬프에 대응하는 비디오 프레임들을 추출할 수 있다. 전자 장치(330)(예를 들어 프로세서(406))는 상기 추출된 비디오 프레임들을 포함하는 비디오 서머리 파일을 생성할 수 있다.
동작 620에서 전자 장치(330)(예를 들어 프로세서(406))는 상기 비디오 서머리 파일에 대응하는 서머리 메타데이터를 생성할 수 있다. 상기 서머리 메타데이터는 상기 비디오 서머리 파일에 포함된 비디오 프레임들의 원본 비디오 클립 파일들을 지시하는 하나 이상의 클립 ID들을 포함할 수 있다. 상기 서머리 메타데이터는 상기 비디오 서머리 파일 내에서 각 클립 ID에 대응하는 비디오 프레임들의 시간 위치를 지시하는 타임스탬프를 포함할 수 있다.
동작 625에서 전자 장치(330)(예를 들어 프로세서(406))는 상기 비디오 서머리 파일 및 상기 서머리 메타데이터를 외부 전자 장치(예를 들어 서버(310) 또는 사용자 장치(340))로 전송할 수 있다.
동작 630에서 전자 장치(330)(예를 들어 프로세서(406))는 외부 전자 장치(예를 들어 서버(310) 또는 사용자 장치(340))로부터 원본 비디오를 요청하는 원본 요청 신호(origin clip request signal)가 수신되는지를 판단할 수 있다. 원본 요청 신호가 수신되는 경우(동작 630에서 '예'인 경우) 전자 장치(330)(예를 들어 프로세서(406))는 동작 635로 진행할 수 있다. 상기 원본 요청 신호는 외부 전자 장치가 상기 비디오 서머리 파일 및 상기 서머리 메타데이터로부터 획득한 적어도 하나의 클립 ID를 포함할 수 있다. 원본 요청 신호가 수신되지 않는 경우(동작 630에서 '아니오'인 경우) 전자 장치(330)(예를 들어 프로세서(406))는 동작 630에서 대기하거나 동작들을 종료할 수 있다.
동작 635에서 전자 장치(330)(예를 들어 프로세서(406))는 메모리(408)에 저장된 비디오 클립 파일들 중 상기 원본 요청 신호 내의 적어도 하나의 클립 ID에 대응하는 적어도 하나의 비디오 클립 파일을 획득할 수 있다.
동작 640에서 전자 장치(330)(예를 들어 프로세서(406))는 상기 적어도 하나의 비디오 클립 파일을 외부 전자 장치로 전송할 수 있다. 외부 전자 장치는 상기 적어도 하나의 비디오 클립 파일을 디스플레이(예를 들어 디스플레이 모듈(260))를 통해 재생할 수 있다.
도 7은 일 실시예에 따른 카메라와 전자 장치의 페어링을 설명하기 위한 도면이다.
도 7을 참조하면, 동작 702에서 카메라(320)는 지정된 사용자 계정으로 서버(310)에 등록(예를 들어 온보딩)될 수 있다. 일 실시예에서 카메라(320)는 직접 서버(310)에 등록되거나 또는 사용자 장치(340)를 통해 서버(310)에 등록될 수 있다.
동작 704에서 전자 장치(330)는 상기 사용자 계정으로 서버(310)에 등록(예를 들어 온보딩)될 수 있다. 일 실시예에서 전자 장치(330)는 임의의 카메라(예를 들어 카메라(320))의 에지 장치로서 동작하도록 서버(310)에 등록될 수 있다. 일 실시예에서 전자 장치(330)는 직접 서버(310)에 등록되거나 또는 사용자 장치(340)를 통해 서버(310)에 등록될 수 있다.
동작 706에서 서버(310)는 사용자 장치(340)로부터 카메라(320)와 전자 장치(330)의 페어링을 요청하는 페어링 요청 신호를 수신할 수 있다. 서버(310)는 상기 페어링 요청 신호에 응답하여 전자 장치(330)를 카메라(320)와 연관하여 등록할 수 있다.
동작 708에서 전자 장치(330)는 페어링될 카메라(320)를 식별하는 정보(예를 들어 IoT 카메라 ID)를 서버(310)로부터 수신할 수 있다.
동작 710에서 전자 장치(330)는 카메라(320)와의 페어링을 요청하는 페어링 요청 신호(예를 들어 "IoT 카메라 페어링 요청")를 서버(310)로 전송할 수 있다.
동작 712에서 서버(310)는 카메라(320)와 전자 장치(330)가 상기 동일한 사용자 계정에 등록되었음을 확인하고 카메라(320)에 전자 장치(330)와의 페어링을 요청하는 페어링 요청 신호(예를 들어 "에지 장치 페어링 요청")를 전송할 수 있다. 일 실시예에서 상기 페어링 요청 신호는 전자 장치(330)와 연결되는데 사용하기 위한 인증서(certificate) 데이터(예를 들어 "에지 인증서")를 포함할 수 있다. 도시하지 않을 것이지만 서버(310)는 전자 장치(330)에게, 카메라(320)와 연결되는데 사용하기 위한 인증서 데이터를 포함하는 페어링 요청 신호를 전송할 수 있다.
동작 714에서 전자 장치(330)는 카메라(320)와 보안 채널을 수립할 수 있다. 상기 보안 채널을 수립하는 절차에서 전자 장치(330)와 카메라(320)는 서버(310)로부터 제공받은 인증서 데이터를 이용하여 서로를 인증할 수 있다. 일 실시예에서 전자 장치(330)는 지정된 스트리밍 지원 프로토콜(예를 들어 RTSPS(Real Time Streaming Protocol) 또는 WebRTC(Web Real-Time Communication))을 사용하여 상기 보안 채널을 수립할 수 있다.
동작 716에서 전자 장치(330)는 상기 보안 채널을 통해 카메라(320)로부터 오디오 및/또는 비디오(audio and/or video: AV)를 포함하는 비디오 데이터(예를 들어 비디오 프레임들 및/또는 오디오 프레임들)를 (예를 들어 실시간으로) 수신할 수 있다.
동작 718에서 전자 장치(330)는 상기 비디오 데이터를 수신되는 순서대로 링 버퍼(예를 들어 링 버퍼(414))에 저장할 수 있다.
동작 720에서 전자 장치(330)(예를 들어, 분석 모듈(416))는 상기 비디오 데이터를 순서대로 분석할 수 있다. 일 실시예에서 전자 장치(330)는 각각의 분석 솔루션이 요구하는 포맷 및/또는 크기에 따라 상기 비디오 데이터의 프리-프로세싱 및 포스트-프로세싱을 수행할 수 있다. 일 실시예에서 전자 장치(330)는 분석 솔루션 간 요구사항에 따라 솔루션들 간 단일 쓰레드(one thread) 또는 다중 쓰레드(multi-thread)로 비디오 프레임들을 처리할 수 있다.
동작 722에서 전자 장치(330)는 상기 비디오 데이터를 분석한 결과를 나타내는 이벤트 업데이트를 서버(310)에게 전송할 수 있다. 일 실시예에서 전자 장치(330)는 상기 비디오 데이터를 분석한 결과 이벤트가 검출된 경우 상기 검출된 이벤트를 나타내는 정보(예를 들어 이벤트 타입 및 타임스탬프)를 서버(310)로 보고할 수 있다.
도 8a 및 도 8b는 일 실시예에 따른 전자 장치의 등록 및 비디오 분석을 설명하기 위한 신호 흐름도(sequence diagram)를 나타낸 것이다. 실시예들에 따라 후술되는 동작들 중 적어도 하나는 생략되거나 변형되거나 순서 변경될 수 있다.
도 8a를 참조하면, 동작 800은 전자 장치(330)와 카메라(320)(예를 들어 IoT 카메라)의 연결 절차를 나타내며, 동작 802, 804, 806, 808, 810, 812, 814, 816, 818, 820, 또는 822 중 적어도 하나를 포함할 수 있다.
동작 802에서 카메라(320)는 지정된 사용자 계정으로 서버(310)에 등록(예를 들어 온보딩)될 수 있다. 일 실시예에서 카메라(320)는 직접 서버(310)에 등록되거나 또는 사용자 장치(340)를 통해 서버(310)에 등록될 수 있다.
동작 804에서 전자 장치(330)는 상기 사용자 계정으로 서버(310)에 등록(예를 들어 온보딩)될 수 있다. 일 실시예에서 전자 장치(330)는 직접 서버(310)에 등록되거나 또는 사용자 장치(340)를 통해 서버(310)에 등록될 수 있다. 카메라(320) 및 전자 장치(330)는 상기 사용자 계정에 속한 IoT 장치들로서 서버(310)에 의해 관리되며, 상기 사용자 계정의 권한 내에서 동작하도록 제어될 수 있다.
동작 806에서 서버(310)는 사용자 장치(340)에게 등록된 장치(예를 들어 카메라(320) 및/또는 전자 장치(330))를 통지(notify)할 수 있다.
동작 808에서 사용자 장치(340)는 카메라(320)와 전자 장치(330)의 페어링을 서버(310)에게 요청할 수 있다. 일 실시예에서 서버(310)는 지정된 알고리즘에 따라 자동으로, 또는 사용자 장치(340)의 요청에 따라 카메라(320)와 전자 장치(330)의 페어링을 결정할 수 있다.
동작 810에서 서버(310)는 페어링이 요청된 카메라(320) 및 전자 장치(330)의 유효성을 확인할 수 있다. 일 실시예에서 서버(310)는 카메라(320) 및 전자 장치(330)가 동일 사용자 계정에 대해 등록되어 있음을 확인할 수 있다.
동작 812에서 서버(310)는 전자 장치(330)에게 페어링될 카메라(320)를 지시하는 카메라 ID를 전송할 수 있다.
동작 814에서 전자 장치(330)는 카메라(320)를 식별하고 카메라(320)와의 페어링을 요청하는 페어링 요청 신호를 서버(310)로 전송할 수 있다. 일 실시예에서 전자 장치(330)는 카메라(320)가 전자 장치(330)와 동일한 네트워크(예를 들어 동일 액세스 포인트(access point: AP)의 Wi-Fi 네트워크)에 연결되어 있음을 식별할 수 있다. 일 실시예에서 상기 페어링 요청 신호는 전자 장치(330)를 나타내는 엔드포인트와 전자 장치(330)의 인증서 데이터를 포함할 수 있다. 일 실시예에서 상기 엔드포인트는 전자 장치(330)의 주소(예를 들어 MAC 주소 및/또는 IP 주소)를 포함할 수 있다.
동작 816에서 서버(310)는 전자 장치(330)에게 카메라(320)와의 페어링을 요청하는 페어링 요청 신호를 전송할 수 있다. 일 실시예에서 상기 페어링 요청 신호는 상기 엔드포인트를 기반으로 전송될 수 있다. 일 실시예에서 상기 페어링 요청 신호는 카메라(320)와 연결되는데 사용하기 위한 인증서 데이터(예를 들어 "IoT camera certificate") 및/또는 토큰을 포함할 수 있다. 일 실시예에서 상기 토큰은 전자 장치(330)가 카메라(320)를 대신하여 분석 결과를 보고하는데 사용될 수 있다.
동작 818에서 서버(310)는 카메라(320)에 전자 장치(330)의 엔드포인트(예를 들어 "Edge's end point") 및 인증서 데이터(예를 들어 "Edge certificate")를 포함하는 페어링 요청 신호를 전송할 수 있다. 일 실시예에서 상기 엔드포인트는 전자 장치(330)의 주소를 포함할 수 있다.
동작 820에서 전자 장치(330) 및 카메라(320)는 보안 연결(예를 들어 TLS 링크)을 수립할 수 있다. 일 실시예에서 카메라(320)는 상기 엔드포인트를 이용하여 전자 장치(330)를 식별할 수 있다. 일 실시예에서 전자 장치(330)는 상기 보안 연결을 통해 보안 스트리밍 채널(예를 들어 RTSPS 또는 WebRTC을 사용하는 보안 채널)을 수립하는 동안 동작 816에서 수신한 인증서 데이터를 사용하여 카메라(320)를 인증할 수 있다. 일 실시예에서 카메라(320)는 상기 보안 연결을 통해 상기 보안 스트리밍 채널을 수립하는 동안 동작 818에서 수신한 인증서 데이터를 사용하여 전자 장치(330)를 인증할 수 있다.
동작 822에서 카메라(320)는 상기 보안 연결을 통해 오디오 및/또는 비디오를 포함하는 비디오 데이터(예를 들어 하나 이상의 비디오 프레임들)를 (예를 들어 실시간으로) 전자 장치(330)에게 전송하기 시작할 수 있다.
도 8b를 참조하면, 동작 830은 전자 장치(330)에 의한 비디오 분석 절차를 나타내며, 동작 832, 834, 836, 또는 838 중 적어도 하나를 포함할 수 있다.
동작 832에서 전자 장치(330)는 상기 보안 연결을 통해 카메라(320)로부터 오디오 및/또는 비디오를 포함하는 비디오 데이터(예를 들어 오디오 프레임, 비디오 프레임, 또는 AV 프레임)를 수신할 수 있다. 상기 비디오 데이터는 전자 장치(330)의 링 버퍼(414)에 저장될 수 있다.
동작 834에서 전자 장치(330)는 상기 비디오 데이터를 분석할 수 있다. 일 실시예에서 전자 장치(330)는 하나 이상의 분석 솔루션들을 사용하여 상기 비디오 데이터의 각 비디오 프레임(예를 들어 오디오 프레임, 비디오 프레임, 또는 AV 프레임)을 분석할 수 있다. 일 실시예에서 전자 장치(330)는 하나 이상의 분석 솔루션들을 순차적으로 또는 병렬적으로 사용하여 각 비디오 프레임을 분석할 수 있다. 일 실시예에서 상기 분석 결과는 적어도 하나의 이벤트(예를 들어 사람 검출, 생명체 검출, 애완동물 검출, 안면 인식, 아기 울음, 개 짖음, 또는 윈도우 파손 중 적어도 하나)를 포함할 수 있다.
동작 836에서 전자 장치(330)는 각 분석 솔루션에 의한 분석 결과를 나타내는 이벤트 업데이트를 서버(310)에게 전송할 수 있다. 일 실시예에서 전자 장치(330)는 동작 816에서 수신한 토큰을 사용하여 상기 이벤트 업데이트를 서버(310)로 전송할 수 있다. 일 실시예에서 서버(310)는 상기 이벤트 업데이트를 기반으로 클립 리스트를 업데이트할 수 있다. 일 실시예에서 상기 클립 리스트는 전자 장치(330)에서 생성된 각 비디오 클립 파일의 클립 ID, 카메라 ID, 생성된 시간, 길이, 또는 이벤트 타입 중 적어도 하나를 포함할 수 있다.
동작 838에서 서버(310)는 이벤트의 발생을 사용자 장치(340)에게 통지할 수 있다. 일 실시예에서 서버(310)는 상기 클립 리스트를 사용자 장치(340)에게 전송할 수 있다. 일 실시예에서 동작 836 및 동작 838은 지정된 시점, 요구된 시점, 또는 주기적인 시점 중 적어도 하나에서 수행되거나, 또는 생략될 수 있다.
도 9는 일 실시예에 따른 비디오 분석 및 이벤트 검출을 설명하기 위한 도면이다.
도 9를 참조하면, 동작 902에서 전자 장치(330)는 카메라(320)로부터 오디오 및/또는 비디오를 포함하는 비디오 데이터(예를 들어 비디오 프레임들)를 수신할 수 있다.
동작 904에서 전자 장치(330)는 상기 비디오 데이터를 링 버퍼(414)에 순차적으로 저장할 수 있다.
동작 906에서 전자 장치(330)는 분석 모듈(416)을 사용하여 상기 비디오 데이터의 각 비디오 프레임을 분석할 수 있고, 상기 분석 결과 검출된 이벤트를 나타내는 이벤트 메타데이터(914)를 생성할 수 있다.
동작 908에서 전자 장치(330)는 상기 분석 결과를 나타내는 이벤트 업데이트를 서버(310)로 보고할 수 있다. 서버(310)는 상기 분석 결과에 따라 검출된 이벤트를 저장(예를 들어 업데이트)할 수 있고, 요청에 따라 사용자 장치(340)에게 제공할 수 있다.
동작 910에서 전자 장치(330)는 서버(310)로부터 비디오 클립 파일들의 생성을 요청하는 클립 생성 요청을 수신할 수 있다. 일 실시예에서 동작 908 및 동작 910은 생략될 수 있고, 전자 장치(330)는 지정된 알고리즘에 따라 자동으로, 또는 사용자의 요청에 따라 비디오 클립 파일들을 생성하도록 결정할 수 있다.
동작 912에서 전자 장치(330)는 클립 생성기(418)를 사용하여 상기 비디오 데이터 중 적어도 하나의 비디오 프레임을 포함하는 비디오 클립 파일(916)을 생성할 수 있다. 일 실시예에서 비디오 클립 파일(916)은 지정된 길이(예를 들어 10초, 또는 사용자 또는 서버(310)가 지정한 기간)의 비디오 프레임들을 포함할 수 있다.
동작 918에서, 비디오 클립 파일(916)과 이벤트 메타데이터(914)는 상호간 연관되어 메모리(408)에 저장될 수 있다.
일 실시예에서 전자 장치(330)는 하나 이상의 비디오 클립 파일들에 대한 클립 리스트를 생성하고 저장할 수 있다. 클립 리스트는 각 비디오 클립 파일에 대해, 클립 ID, 생성 시점, 썸네일 이미지, 녹화 방식(예를 들어 직접 녹화 또는 수동 녹화), 또는 길이 중 적어도 하나를 포함할 수 있다. 일 실시예에서 전자 장치(330)는 외부 전자 장치(예를 들어 서버(310) 또는 사용자 장치(340))의 요청에 따라 클립 리스트를 제공할 수 있다. 서버(310) 또는 사용자 장치(340)는 상기 클립 리스트를 디스플레이할 수 있다.
도 10은 일 실시예에 따른 이벤트 메타데이터의 생성을 설명하기 위한 신호 흐름도를 나타낸 것이다. 실시예들에 따라 후술되는 동작들 중 적어도 하나는 생략되거나 변형되거나 순서 변경될 수 있다.
도 10을 참조하면, 동작 1002에서 전자 장치(330)는 카메라(320)로부터 수신한 비디오 데이터를 링 버퍼(414)에 저장할 수 있다.
동작 1004에서 전자 장치(330)(예를 들어 분석 모듈(416))는 링 버퍼(414)로부터 상기 비디오 데이터를 읽어낼 수 있고, 동작 1010에서 상기 비디오 데이터를 분석하여 이벤트 메타데이터를 생성할 수 있다.
동작 1006에서 전자 장치(330)(예를 들어 클립 생성기(418))는 링 버퍼(414)로부터 상기 비디오 데이터를 읽어낼 수 있고, 동작 1008에서 상기 비디오 데이터로부터 지정된 길이(예를 들어 고정된 길이 또는 가변 길이)의 비디오 클립 파일을 생성할 수 있다.
일 실시예에서 전자 장치(330)는 사용자가 등록한 자동화 규칙에 따른 자동 녹화 또는 사용자의 요청에 따른 수동 녹화에 따라 비디오 클립 파일을 생성할 수 있다. 일 실시예에서 전자 장치(330)는 서버(310) 또는 사용자 장치(340)로부터 자동 녹화를 시작할 이벤트 타입(예를 들어 인체 검출)을 지시하는 사전 정보를 수신할 수 있다. 일 실시예에서 전자 장치(330)는 상기 자동화 규칙에 따라 인체 검출의 이벤트가 발생하였을 때 링 버퍼(414)에 저장된 비디오 프레임들을 기반으로 비디오 클립 파일을 생성하기 시작할 수 있다. 일 실시예에서 전자 장치(330)는 상기 이벤트(또는 임의의 이벤트)가 더 이상 발생하지 않을 때까지 계속하여 상기 비디오 클립 파일에 이후의 비디오 프레임들을 추가할 수 있다. 하나의 비디오 클립 파일에 대한 최대 녹화 시간은 사용자에 의해 지정되거나 또는 미리 정해질 수 있다. 전자 장치(330)는 최대 녹화 시간 내에서 인체 검출의 이벤트가 발생한 비디오 프레임들을 포함하는 비디오 클립 파일을 생성할 수 있다.
일 실시예에서 전자 장치(330)는 상기 비디오 클립 파일을 생성하는 동안 검출되는 적어도 하나의 이벤트에 대한 이벤트 메타데이터를 생성할 수 있다. 상기 이벤트 메타데이터는 상기 비디오 클립 파일을 식별하는 클립 ID, 이벤트 타입, 또는 타임스탬프 중 적어도 하나를 포함할 수 있다.
동작 1012에서 전자 장치(330)(예를 들어 분석 모듈(416))는 상기 이벤트 메타데이터를 클립 생성기(418)로 전송할 수 있다.
동작 1014에서 전자 장치(330)(예를 들어 클립 생성기(418))는 상기 비디오 클립 파일 및 상기 이벤트 메타데이터를 메모리(408))에 저장할 수 있다.
도 11은 일 실시예에 따른 이벤트 기반의 비디오 서머리를 설명하기 위한 도면이다.
도 11을 참조하면, 동작 1102에서 사용자 장치(340)는 서버(310)에게 이벤트 타입 및/또는 기간을 포함하는 서머리 요청 신호를 전송할 수 있다. 일 실시예에서 사용자 장치(340)는 서버(310)로부터 전자 장치(330)가 검출하고 보고한 이벤트 업데이트(예를 들어 동작 908의 이벤트 업데이트)를 기반으로 상기 이벤트 타입을 지정할 수 있다.
동작 1104에서 서버(310)는 상기 이벤트 타입 및/또는 기간을 포함하는 서머리 요청 신호를 전자 장치(330)에게 전달할 수 있다.
동작 1106에서 전자 장치(330)(예를 들어 비디오 서머리 생성기(420))는 메모리(408)에 저장된 이벤트 메타데이터와 비디오 클립 파일의 쌍들(1106a, 1106b, 1106c)을 독출(read out)할 수 있고, 동작 1108에서 상기 이벤트 메타데이터와 비디오 클립 파일의 쌍들(1106a, 1106b, 1106c)을 기반으로 비디오 서머리 파일 및 서머리 메타데이터를 생성할 수 있다.
일 실시예에서 전자 장치(330)는 상기 서머리 요청 신호에 의해 지시된 기간 또는 미리 지정된 기간 동안 생성된 비디오 클립 파일들과 대응하는 이벤트 메타데이터의 쌍들(1106a, 1106b, 1106c)을 기반으로 비디오 서머리 파일을 생성할 수 있다. 전자 장치(330)는 상기 기간 동안 생성된 비디오 클립 파일들의 이벤트 메타데이터를 근거로, 상기 서머리 요청 신호에 의해 지시된 이벤트 타입 또는 미리 지정된 이벤트 타입의 이벤트를 포함하는 비디오 클립 파일의 타임스탬프를 식별할 수 있고, 상기 타임스탬프가 지시하는 비디오 프레임들을 추출하여 시간 순서대로 정렬할 수 있다. 전자 장치(330)는 상기 추출된 비디오 프레임들을 연결하여 비디오 서머리 파일을 생성할 수 있다.
일 실시예에서 비디오 서머리 파일은 사용자에 의해 지정된 이벤트 타입의 이벤트가 발생한 비디오 프레임들만을 포함할 수 있다. 일 실시예에서 전자 장치(330)는 비디오 서머리 파일을 생성하면서, 비디오 서머리 파일의 타임스탬프마다 사용된 원본 비디오 클립 파일의 클립 ID 및/또는 카메라 ID를 포함하는 서머리 메타데이터를 생성할 수 있다.
예를 들어 서머리 메타데이터는 다음과 같이 구성될 수 있다.
서머리 메타데이터 1 {
타임스탬프 00:00:00 ~ 00:00:05,
카메라 ID AAA,
클립 ID ccc}
서머리 메타데이터 2 {
타임스탬프 00:00:05 ~ 00:00:08,
카메라 ID AAA,
클립 ID ddd}
동작 1110에서 전자 장치(330)는 상기 비디오 서머리 파일 및 서머리 메타데이터를 서버(310)로 전송할 수 있다.
동작 1112에서 서버(310)는 상기 비디오 서머리 파일 및 서머리 메타데이터를 사용자 장치(340)로 전송할 수 있다.
일 실시예에서 사용자 장치(340)는 상기 비디오 서머리 파일을 재생할 수 있고, 사용자의 요청에 따라 상기 비디오 서머리 파일 중 지정된 비디오 프레임에 대응하는 원본 비디오 클립 파일의 클립 ID를 서머리 메타데이터로부터 검색할 수 있다. 사용자 장치(340)는 상기 클립 ID를 이용하여 원본 비디오 클립 파일을 전자 장치(330)로부터 획득할 수 있다.
일 실시예에서 전자 장치(330)는 하나 이상의 카메라들(예를 들어 IoT 카메라(320a) 및 IoT 카메라(320b))와 각각의 파이프라인들(예를 들어 노드들)을 통해 연결될 수 있다. IoT 카메라(320a) 및 IoT 카메라(320b)는 전자 장치(330)에게 각각의 파이프라인들(예를 들어 노드들)을 통해 자신의 비디오 데이터를 전송할 수 있다. 전자 장치(330)는 각 파이프라인 별로 비디오 분석 및 클립 생성을 개별적으로 수행할 수 있다. 전자 장치(330)는 연결된 하나 이상의 카메라들의 비디오 클립 파일들과 이벤트 메타데이터를 개별적으로 생성하고 관리할 수 있다. 전자 장치(330)는 하나 이상의 카메라들로부터의 비디오 데이터를 기반으로 생성된 비디오 클립 파일들과 이벤트 메타데이터를 기반으로 멀티 카메라 기반의 비디오 서머리 파일을 생성할 수 있다.
도 12는 일 실시예에 따른 비디오 서머리 파일을 설명하기 위한 도면이다.
도 12를 참조하면, 전자 장치(330)는 복수의 비디오 클립 파일들에 대한 클립 리스트(1202)를 생성할 수 있다. 일 실시예에서 클립 리스트(1202)는 각 비디오 클립 파일에 대해, 클립 ID, 생성 시점, 썸네일 이미지, 녹화 방식(예를 들어 직접 녹화 또는 수동 녹화), 또는 길이 중 적어도 하나를 포함할 수 있다. 일 실시예에서 클립 리스트(1202)는 복수의 비디오 클립 파일들을 생성된 순서대로 저장할 수 있다. 예를 들어 가장 최근에 생성된 비디오 클립 파일은 가장 위에 위치할 수 있다. 예를 들어 클립 리스트(1202)는 클립 ID=A의 제1 비디오 클립 파일(1204a), 클립 ID=B의 제2 비디오 클립 파일(1204b), 클립 ID=C의 제3 비디오 클립 파일(1204c), 및 클립 ID=D의 제4 비디오 클립 파일(1204d)을 포함할 수 있다.
일 실시예에서 전자 장치(330)는 비디오 클립 파일들(1204a, 1204b, 1204c, 1204d)에 대응하는 이벤트 메타데이터(1206a, 1206b, 1206c, 1206d)를 생성할 수 있다. 제1 이벤트 메타데이터(1206a)는 제1 비디오 클립 파일(1204a)에 대한 클립 ID=A, 제1 비디오 클립 파일(1204a) 중 제1 이벤트가 검출된 시간 위치(예를 들어 비디오 프레임의 위치)를 나타내는 타임스탬프(예를 들어 00:00:01), 및 상기 제1 이벤트의 이벤트 타입(예를 들어 "pet detected")을 포함할 수 있다. 제2 이벤트 메타데이터(1206b)는 제2 비디오 클립 파일(1204b)에 대한 클립 ID=B, 제2 비디오 클립 파일(1204b) 중 제2 이벤트가 검출된 시간 위치를 나타내는 타임스탬프(예를 들어 00:00:00), 및 상기 제2 이벤트의 이벤트 타입(예를 들어 "pet detected")을 포함할 수 있다. 제3 이벤트 메타데이터(1206c)는 제3 비디오 클립 파일(1204c)에 대한 클립 ID=C, 제3 비디오 클립 파일(1204c) 중 제3 이벤트가 검출된 시간 위치를 나타내는 타임스탬프(예를 들어 00:00:03), 및 상기 제3 이벤트의 이벤트 타입(예를 들어 "pet detected")을 포함할 수 있다. 제4 이벤트 메타데이터(1206d)는 제4 비디오 클립 파일(1204d)에 대한 클립 ID=D, 제4 비디오 클립 파일(1204d) 중 제4 이벤트가 검출된 시간 위치를 나타내는 타임스탬프(예를 들어 00:00:02), 및 상기 제4 이벤트의 이벤트 타입(예를 들어 "pet detected")을 포함할 수 있다.
일 실시예에서 이벤트 타입(예를 들어 "pet detected") 및/또는 기간을 포함하는 서머리 요청 신호가 수신되면, 전자 장치(330)(예를 들어 비디오 서머리 생성기(420))는 비디오 클립 파일들(1204a, 1204b, 1204c, 1204d)로부터 상기 이벤트 타입의 이벤트들이 검출된 시간 위치들의 비디오 프레임들을 추출할 수 있고, 상기 비디오 프레임들을 시간 순서대로 연결하여 비디오 서머리 파일(1208)을 생성할 수 있다. 일 실시예에서 비디오 서머리 파일(1208)은 가장 먼저 녹화된 제4 비디오 클립 파일(1204d)의 3번째 비디오 프레임("D: 00:00:02"), 제3 비디오 클립 파일(1204c)의 4번째 비디오 프레임("C: 00:00:03"), 제2 비디오 프레임(1204b)의 첫번째 비디오 프레임("B: 00:00:00"), 및 제1 비디오 프레임(1204a)의 두번째 비디오 프레임("A: 00:00:01")을 순서대로 포함할 수 있다.
일 실시예에서 전자 장치(330)(예를 들어 비디오 서머리 생성기(420))는 또한 상기 비디오 서머리 파일(1208)에 대한 서머리 메타데이터(1210)를 생성할 수 있다. 서머리 메타데이터(1210)는 비디오 서머리 파일(1208)에 포함된 각 비디오 프레임의 원본 비디오 클립 파일들을 나타내는 클립 ID 및 각 비디오 프레임의 타임스탬프를 포함할 수 있다. 상기 타임스탬프는 각 비디오 프레임의 비디오 서머리 파일(1208) 내 시간 위치를 나타낼 수 있다. 일 실시예에서 서머리 메타데이터(1210)는 클립 ID=D 00:00:00, 클립 ID=C 00:00:01, 클립 ID=B 00:00:02, 및 클립 ID=A 00:00:03을 포함할 수 있다.
도 13은 일 실시예에 따른 이벤트 기반의 서머리 비디오 생성을 설명하기 위한 신호 흐름도이다. 실시예들에 따라 후술되는 동작들 중 적어도 하나는 생략되거나 변형되거나 순서 변경될 수 있다.
도 13을 참조하면, 동작 1302에서 사용자 장치(340)는 서버(310)에게 이벤트 타입(예를 들어 제1 이벤트 타입) 및/또는 기간(예를 들어 제1 기간)을 포함하는 서머리 요청 신호를 전송할 수 있다. 상기 서머리 요청 신호는 비디오 서머리 파일을 생성하도록 요청하기 위해 전송될 수 있다.
동작 1304에서 전자 장치(330)(예를 들어 제어 모듈(422))는 서버(310)로부터 상기 서머리 요청 신호를 수신할 수 있다. 도시하지 않을 것이지만 일 실시예에서 전자 장치(330)는 서버(310)를 통하지 않고 사용자 장치(340)로부터 직접(예를 들어 유선, 근거리 통신 네트워크 또는 인터넷을 통해) 상기 서머리 요청 신호를 수신할 수 있다. 도시하지 않을 것이지만 일 실시예에서 전자 장치(330)는 사용자 장치(340) 또는 서버(310)를 통하지 않고, 사용자로부터 직접(예를 들어 사용자 인터페이스를 통해) 상기 이벤트 타입 및/또는 기간에 대한 정보를 입력받을 수 있다.
동작 1306에서 전자 장치(330)(예를 들어 제어 모듈(422))는 상기 서머리 요청 신호 또는 상기 서머리 요청 신호로부터 획득한 상기 제1 이벤트 타입 및/또는 상기 제1 기간을 비디오 서머리 생성기(420)로 입력할 수 있다.
동작 1308에서 전자 장치(330)(예를 들어 비디오 서머리 생성기(420))는 메모리(408)에 상기 제1 기간에 대응하는 제1 이벤트 메타데이터 세트를 요청할 수 있다.
동작 1310에서 전자 장치(330)(예를 들어 비디오 서머리 생성기(420))는 메모리(408)로부터 상기 제1 기간에 대응하는 제1 이벤트 메타데이터 세트를 수신할 수 있다. 상기 제1 이벤트 메타데이터 세트는 상기 기간에 대응하는 복수의 제1 비디오 클립 파일들에 대한 복수의 제1 이벤트 메타데이터를 포함할 수 있다.
동작 1312에서 전자 장치(330)(예를 들어 비디오 서머리 생성기(420))는 상기 수신한 제1 이벤트 메타데이터 세트의 복수의 제1 이벤트 메타데이터로부터 상기 제1 이벤트 타입을 가지는 이벤트들을 확인할 수 있다.
동작 1314에서 전자 장치(330)(예를 들어 비디오 서머리 생성기(420))는 상기 복수의 제1 비디오 클립 파일들 중 상기 이벤트들을 포함하는 제2 비디오 클립 파일들을 메모리(408)에게 요청할 수 있다.
동작 1316에서 전자 장치(330)(예를 들어 비디오 서머리 생성기(420))는 상기 이벤트들을 포함하는 제2 비디오 클립 파일들을 메모리(408)로부터 수신할 수 있다.
동작 1318에서 전자 장치(330)(예를 들어 비디오 서머리 생성기(420))는 상기 제2 비디오 클립 파일들 중 상기 이벤트들을 포함하는 하나 이상의 비디오 프레임들을 추출하고 상기 추출한 비디오 프레임들을 포함하는 비디오 서머리 파일을 생성할 수 있다. 또한 전자 장치(330)(예를 들어 비디오 서머리 생성기(420))는 상기 비디오 서머리 파일에 포함된 각 비디오 프레임의 원본 비디오 클립 파일(예를 들어 제2 비디오 클립 파일들 중 어느 하나)의 클립 ID를 포함하는 서머리 메타데이터를 생성할 수 있다.
동작 1320에서 전자 장치(330)(예를 들어 비디오 서머리 생성기(420))는 상기 비디오 서머리 파일 및/또는 서머리 메타데이터를 메모리(408)에 저장할 수 있다. 일 실시예에서 전자 장치(330)는 사용자로부터의 서머리 재생 요청에 응답하여 상기 비디오 서머리 파일을 디스플레이(412)를 통해 재생할 수 있다. 일 실시예에서 전자 장치(330)는 상기 비디오 서머리 파일을 생성하지 않을 수 있고, 사용자로부터의 재생 요청에 응답하여 상기 서머리 메타데이터를 기반으로 원본 비디오 클립 파일의 적어도 일부 비디오 프레임들을 선택하여 재생할 수 있다.
동작 1322에서 전자 장치(330)(예를 들어 비디오 서머리 생성기(420))는 상기 비디오 서머리 파일 및/또는 서머리 메타데이터를 서버(310)로 전송할 수 있다.
동작 1324에서 서버(310)는 상기 비디오 서머리 파일 및/또는 서머리 메타데이터를 사용자 장치(340)로 전송할 수 있다. 일 실시예에서 동작 1322 또는 동작 1324 중 적어도 하나는 생략될 수 있다. 도시하지 않을 것이지만 일 실시예에서 전자 장치(330)는 서버(310)를 통하지 않고 사용자 장치(340)에게 직접(예를 들어 근거리 통신 네트워크 또는 인터넷을 통해) 상기 비디오 서머리 파일 및/또는 서머리 메타데이터를 전송할 수 있다. 일 실시예에 따르면 동작 1322 및 동작 1324에서 서머리 메타데이터가 전달될 수 있고, 이후 전자 장치(330)와 사용자 장치(340)는 비디오 서머리 파일의 전송을 위해 보안 연결을 수립하고 상기 보안 연결을 통해 상기 비디오 서머리 파일을 전송할 수 있다.
도 14는 일 실시예에 따른 비디오 서머리의 활용을 설명하기 위한 도면이다.
도 14를 참조하면, 사용자 장치(340)는 서버(310)를 통해 또는 직접 전자 장치(330)로부터 비디오 서머리 파일(예를 들어 비디오 서머리 파일(1208) 수신할 수 있고, 상기 비디오 서머리 파일(1208)을 디스플레이(예를 들어 디스플레이 모듈(260))를 통해 재생할 수 있다.
동작 1402에서 상기 비디오 서머리 파일(1208)을 재생하는 도중 사용자로부터 특정 장면(예를 들어 적어도 하나의 비디오 프레임)을 선택하는 사용자 입력이 수신될 수 있다. 일 실시예에서 사용자는 비디오 서머리 파일(1208)을 시청하는 도중 특정 장면에 대한 원본 비디오를 요청하기 위해 상기 특정 장면에서 지정된 버튼(예를 들어 점프 버튼)을 선택(예를 들어 터치)할 수 있다.
동작 1404에서, 사용자 장치(340)는 상기 사용자 입력에 응답하여 상기 비디오 서머리 파일(1208)에 대응하는 서머리 메타데이터(예를 들어 서머리 메타데이터(1210))로부터 상기 특정 장면의 타임스탬프(예를 들어 타임스탬프 00:00:01)에 대응하는 클립 ID(예를 들어 클립 ID=C)를 획득할 수 있다. 사용자 장치(340)는 상기 클립 ID를 이용하여 전자 장치(330)에게 원본 비디오(예를 들어 클립 ID=C를 가지는 제3 비디오 클립 파일(1204c))을 요청할 수 있다.
동작 1406에서 사용자 장치(340)는 전자 장치(330)로부터 상기 제3 비디오 클립 파일(1204c)을 수신하고, 상기 수신된 제3 비디오 클립 파일을 재생할 수 있다.
일 실시예에서 사용자 장치(340)는 서머리 메타데이터를 저장하지 않을 수 있으며, 상기 사용자 입력에 응답하여 상기 비디오 서머리 파일(1208)을 식별하는 정보(예를 들어 서머리 클립 ID) 및 상기 특정 장면의 타임스탬프(예를 들어 타임스탬프 00:00:01)를 전자 장치(330)에게 전송할 수 있다. 전자 장치(330)는 상기 특정 장면의 타임스탬프에 근거하여 상기 비디오 서머리 파일(1208)에 대응하는 서머리 메타데이터(1210)를 검색하고, 상기 타임스탬프에 대응하는 클립 ID를 획득할 수 있다. 전자 장치(330)는 상기 클립 ID에 대응하는 원본 비디오를 사용자 장치(340)로 전송할 수 있다.
도 15는 일 실시예에 따른 비디오 서머리의 제공을 설명하기 위한 신호 흐름도이다. 실시예들에 따르면 후술되는 동작들 중 적어도 하나는 생략되거나 변형되거나 순서 변경될 수 있다.
도 15를 참조하면, 동작 1502에서 사용자 장치(340)는 서버(310)에게 비디오 서머리 파일을 요청하기 위한 요청 신호를 전송할 수 있다. 일 실시예에서 사용자 장치(340)는 서버(310)를 통해 또는 직접 전자 장치(330)로부터 수신한 서머리 메타 데이터를 기반으로 상기 비디오 서머리 파일을 요청할 수 있다.
동작 1504에서 전자 장치(330)는 서버(310)로부터 상기 요청 신호를 수신할 수 있다. 도시하지 않을 것이지만 일 실시예에서 전자 장치(330)는 서버(310)를 통하지 않고 사용자 장치(340)로부터 직접(예를 들어 유선, 근거리 통신 네트워크 또는 인터넷을 통해) 상기 요청 신호를 수신할 수 있다.
동작 1506에서 전자 장치(330)는 사용자 장치(340)와 보안 연결(예를 들어 TLS 링크)을 수립할 수 있다.
동작 1508에서 전자 장치(330)는 상기 요청된 비디오 서머리 파일을 상기 보안 연결 상의 보안 스트리밍 채널을 통해 사용자 장치(340)에게 전송할 수 있다.
동작 1510에서 사용자 장치(340)는 상기 비디오 서머리 파일을 재생할 수 있다.
동작 1512에서 사용자 장치(340)는 상기 비디오 서머리 파일을 재생하는 도중 특정 장면(예를 들어 적어도 하나의 비디오 프레임)에서 원본 비디오를 재생하기를 요청하는 사용자 입력(예를 들어 점프 버튼 터치)을 수신할 수 있다.
동작 1514에서 사용자 장치(340)는 서머리 메타데이터로부터 상기 특정 장면의 타임스탬프에 대응하는 클립 ID를 획득할 수 있다.
동작 1516에서 사용자 장치(340)는 상기 클립 ID를 포함하는 원본 요청 신호를 전자 장치(330)로 전송할 수 있다. 일 실시예에서 상기 원본 요청 신호는 서버(310)를 통해 전자 장치(330)로 전송되거나, 또는 동작 1506의 보안 연결을 통해 전자 장치(330)로 직접 전송될 수 있다.
동작 1518에서 전자 장치(330)는 상기 클립 ID를 가지는 비디오 클립 파일을 메모리(408)로부터 독출하여 사용자 장치(340)로 전송할 수 있다. 상기 비디오 클립 파일은 동작 1506의 보안 연결을 통해 전송되거나, 또는 새로 수립한 보안 연결을 통해 전송될 수 있다.
동작 1520에서 사용자 장치(340)는 상기 비디오 클립 파일을 재생할 수 있다.
도 16은 일 실시예에 따른 비디오 서머리 정보를 통한 비디오 서머리의 제공을 설명하기 위한 신호 흐름도이다. 실시예들에 따르면 후술되는 동작들 중 적어도 하나는 생략되거나 변형되거나 순서 변경될 수 있다.
도 16을 참조하면, 동작 1602에서 사용자 장치(340)는 서버(310)에게 클립 리스트 및/또는 이벤트 메타데이터를 요청할 수 있다.
동작 1604에서 서버(310)는 사용자 장치(340)에게 클립 리스트 및/또는 이벤트 메타데이터를 전송할 수 있다. 일 실시예에서 사용자 장치(340)는 상기 클립 리스트를 디스플레이할 수 있고, 상기 클립 리스트에 기반하여 비디오 서머리를 요청하는 사용자 입력을 수신할 수 있다.
동작 1606에서 사용자 장치(340)는 비디오 서머리를 요청하기 위한 서머리 요청 신호를 서버(310)로 전송할 수 있다.
동작 1608에서 서버(310)는 클라이언트 정보(예를 들어 사용자 장치(340)의 인증서 데이터)를 포함하는 연결 요청을 전자 장치(330)로 전송할 수 있다.
동작 1610에서 전자 장치(330)는 상기 연결 요청을 기반으로 사용자 장치(340)와 보안 연결 상의 보안 스트리밍 채널을 수립할 수 있다.
동작 1612에서 전자 장치(330)는 상기 요청된 비디오 서머리 파일 및/또는 서머리 메타데이터를 상기 보안 스트리밍 채널을 통해 사용자 장치(340)에게 전송할 수 있다.
동작 1614에서 사용자 장치(340)는 상기 비디오 서머리 파일을 재생할 수 있다.
동작 1616에서 사용자 장치(340)는 상기 비디오 서머리 파일을 재생하는 도중 특정 장면(예를 들어 비디오 프레임)에서 원본 비디오로 재생하기를 요청하는 사용자 입력(예를 들어 점프 버튼 터치)을 수신할 수 있다.
동작 1620 또는 동작 1630은 상기 사용자 입력에 응답하여 선택적으로(alternatively) 수행될 수 있다. 동작 1620은 동작 1622, 동작 1624, 동작 1626 또는 동작 1628 중 적어도 하나를 포함할 수 있다. 동작 1630은 동작 1632, 동작 1634, 동작 1636 또는 동작 1638 중 적어도 하나를 포함할 수 있다.
동작 1622에서 사용자 장치(340)는 서머리 메타데이터(예를 들어 동작 1612에서 수신한 서머리 메타데이터)로부터 상기 특정 장면의 타임스탬프에 대응하는 클립 ID를 획득할 수 있다.
동작 1624에서 사용자 장치(340)는 상기 클립 ID를 포함하는 제1 원본 요청 신호를 전자 장치(330)로 전송할 수 있다. 일 실시예에서 상기 제1 원본 요청 신호는 서버(310)를 통해 전자 장치(330)로 전송되거나, 또는 동작 1610의 보안 연결을 통해 전자 장치(330)로 직접 전송될 수 있다.
동작 1626에서 전자 장치(330)는 상기 제1 원본 요청 신호에 응답하여 상기 클립 ID를 가지는 비디오 클립 파일을 메모리(408)로부터 독출하고 상기 비디오 클립 파일을 사용자 장치(340)로 전송할 수 있다. 상기 비디오 클립 파일은 동작 1610의 보안 연결을 통해 전송되거나, 또는 새로 수립한 보안 연결을 통해 전송될 수 있다.
동작 1628에서 사용자 장치(340)는 상기 비디오 클립 파일을 재생할 수 있다.
동작 1632에서 사용자 장치(340)는 서머리 메타데이터를 가지고 있지 않을 수 있으며, 상기 비디오 서머리 파일을 지시하는 정보(예를 들어 서머리 클립 ID)와 상기 특정 장면의 타임스탬프를 포함하는 제2 원본 요청 신호를 전자 장치(330)로 전송할 수 있다. 일 실시예에서 상기 제2 원본 요청 신호는 서버(310)를 통해 전자 장치(330)로 전송되거나, 또는 동작 1610의 보안 연결을 통해 전자 장치(330)로 직접 전송될 수 있다.
동작 1634에서 전자 장치(330)는 상기 제2 원본 요청 신호에 근거하여 상기 비디오 서머리 파일에 대응하는 서머리 메타데이터를 검색할 수 있고, 상기 서머리 메타데이터로부터 상기 특정 장면의 타임스탬프에 대응하는 클립 ID를 획득할 수 있다.
동작 1636에서 전자 장치(330)는 상기 클립 ID를 가지는 비디오 클립 파일을 메모리(408)로부터 독출하고 상기 비디오 클립 파일을 사용자 장치(340)로 전송할 수 있다. 상기 비디오 클립 파일은 동작 1610의 보안 연결을 통해 전송되거나, 또는 새로 수립한 보안 연결을 통해 전송될 수 있다.
동작 1638에서 사용자 장치(340)는 상기 비디오 클립 파일을 재생할 수 있다.
도 17a, 도 17b, 도 17c 및 도 17d는 일 실시예에 따라 이벤트 기반의 비디오 서머리를 제공하는 사용자 인터페이스를 나타낸 도면이다.
도 17a를 참조하면, 사용자 장치(340)는 비디오 서머리를 요청하기 위한 서머리 요청 화면(1700)을 디스플레이할 수 있다. 일 실시예에서 상기 서머리 요청 화면(1700)은 이벤트 타입을 입력하는 제1 항목(1702) 및/또는 기간을 입력하는 제2 항목(1704)을 포함할 수 있다. 일 실시예에서 상기 제1 항목(1702)은 지정된 애완동물을 검출하는 "Dog detect" 및/또는 "Cat detect"을 포함할 수 있다. 일 실시예에서 상기 제1 항목(1702)은 지정된 사람을 검출하는 "Jane detect" 및/또는 "Cabin detect"을 포함할 수 있다. 사용자 장치(340)는 상기 서머리 요청 화면(1700)을 통해 입력된 이벤트 타입 및/또는 기간을 포함하는 서머리 요청 신호(예를 들어 동작 1302)의 서머리 요청 신호)를 서버(310)를 통해 또는 직접 전자 장치(330)로 전송할 수 있다.
도 17b를 참조하면, 제1 항목(1702)을 통해 "Pet detect"가 지정된 경우 사용자 장치(340)는 제1 비디오 서머리 화면(1706)을 디스플레이할 수 있다. 상기 제1 비디오 서머리 화면(1706)은 "Pet detect"의 이벤트들이 검출된 비디오 프레임들을 포함하는 제1 비디오 서머리 파일의 정보(예를 들어 "Pet detect Video summary")와 상기 제1 비디오 서머리 파일과 관련된 원본 비디오의 정보(예를 들어 썸네일 이미지, 썸네일 비디오, 또는 카메라 ID(들) 중 적어도 하나)를 포함할 수 있다.
도 17c를 참조하면, 제1 항목(1702)을 통해 "Cat detect"가 지정된 경우 사용자 장치(340)는 제2 비디오 서머리 화면(1708)을 디스플레이할 수 있다. 상기 제2 비디오 서머리 화면(1708)은 "Cat detect"의 이벤트들이 검출된 비디오 프레임들을 포함하는 제2 비디오 서머리 파일의 정보(예를 들어 "Cat detect Video summary")와 상기 제2 비디오 서머리 파일과 관련된 원본 비디오의 정보(예를 들어 썸네일 이미지, 썸네일 비디오, 또는 카메라 ID(들) 중 적어도 하나)를 포함할 수 있다.
도 17d를 참조하면, 제1 항목(1702)을 통해 "Pet detect" 및 "Jane detect"가 지정된 경우 사용자 장치(340)는 제3 비디오 서머리 화면(1710)을 디스플레이할 수 있다. 상기 제3 비디오 서머리 화면(1710)은 "Pet detect" 및 "Jane detect"의 이벤트들이 검출된 비디오 프레임들을 포함하는 제3 비디오 서머리 파일의 정보(예를 들어 "Pet & Jane detect Video summary")와 상기 제3 비디오 서머리 파일과 관련된 원본 비디오의 정보(예를 들어 썸네일 이미지, 썸네일 비디오, 또는 카메라 ID(들) 중 적어도 하나)를 포함할 수 있다.
도 18은 일 실시예에 따라 이벤트 기반의 비디오 서머리를 생성하는 동작을 설명하기 위한 흐름도이다. 실시예들에 따라 후술되는 동작들 중 적어도 하나는 생략되거나 변형되거나 순서 변경될 수 있다. 하기에서는 후술되는 동작들 중 적어도 하나가 전자 장치(330)의 프로세서(406)에 의해 실행되는 것으로 설명할 것이나, 다른 실시예에 따르면 후술되는 동작들 중 적어도 하나는 전자 장치(340)의 프로세서(예를 들어 도 2의 프로세서(220))에 의해 실행될 수 있다.
도 18을 참조하면, 동작 1805에서 전자 장치(330)(예를 들어 프로세서(406))는 비디오 파일을 선택할 수 있다. 일 실시예에서 전자 장치(330)(예를 들어 프로세서(406))는 메모리(408)에 저장된 비디오 파일을 독출(read out)할 수 있다.
동작 1810에서 전자 장치(330)(예를 들어 프로세서(406))는 상기 선택된 비디오 파일 또는 적어도 하나의 임의의 비디오 파일에 대한 서머리 요청 신호를 수신할 수 있다. 일 실시예에서 전자 장치(330)(예를 들어 프로세서(406))는 상기 서머리 요청 신호를 사용자 인터페이스를 통해 사용자로부터 수신할 수 있다. 일 실시예에서 상기 서머리 요청 신호는 검출하고자 하는 적어도 하나의 이벤트 타입 및/또는 기간에 대한 정보를 포함할 수 있다. 일 실시예에서 상기 서머리 요청 신호는 이벤트 타입 및/또는 기간에 대한 정보를 포함하지 않을 수 있고, 전자 장치(330)(예를 들어 프로세서(406))는 상기 서머리 요청 신호에 응답하여 검출 가능한 이벤트 타입들을 모두 검출하도록 결정할 수 있다. 일 실시예에서 전자 장치(330)(예를 들어 프로세서(406))는 상기 비디오 파일이 선택된 이후 혹은 선택되기 이전에 상기 서머리 요청 신호를 수신할 수 있다.
동작 1815에서 전자 장치(330)(예를 들어 프로세서(406))는 상기 비디오 파일을 분석하여 지정된 적어도 하나의 솔루션(예를 들어 이벤트 타입별 솔루션)에 따라 상기 서머리 요청 신호에 의해 지정된 적어도 하나의 이벤트 타입에 대응하는 적어도 하나의 이벤트를 검출하고, 상기 비디오 파일 중 상기 검출된 이벤트를 포함하는 적어도 하나의 비디오 프레임을 식별할 수 있다. 일 실시예에서 전자 장치(330)(예를 들어 프로세서(406))는 상기 서머리 요청 신호를 수신한 이후 상기 선택된 비디오 파일을 포함하는 적어도 하나의 비디오 파일을 분석하고, 상기 적어도 하나의 비디오 파일로부터 상기 이벤트를 포함하는 적어도 하나의 비디오 프레임을 추출할 수 있다. 일 실시예에서 전자 장치(330)(예를 들어 프로세서(406))는 상기 서머리 요청 신호에 의해 지정된 기간에 대응하는 적어도 하나의 비디오 파일을 분석하고, 상기 적어도 하나의 비디오 파일로부터 상기 이벤트를 포함하는 적어도 하나의 비디오 프레임을 추출할 수 있다.
동작 1820에서 전자 장치(330)(예를 들어 프로세서(406))는 상기 추출된 적어도 하나의 비디오 프레임을 포함하는 비디오 서머리 파일을 생성할 수 있다. 일 실시예에서 상기 서머리 요청 신호는 하나 이상의 이벤트 타입들을 지시할 수 있고, 전자 장치(330)(예를 들어 프로세서(406))는 상기 하나 이상의 이벤트 타입들에 각각 대응하는 하나 이상의 비디오 서머리 파일들을 생성하거나, 또는 하나 이상의 이벤트 타입들에 대응하는 하나의 비디오 서머리 파일을 생성할 수 있다.
동작 1825에서 전자 장치(330)(예를 들어 프로세서(406))는 상기 비디오 서머리 파일의 재생을 요청하는 사용자 입력이 수신되는지 확인할 수 있다. 상기 사용자 입력이 수신되는 경우(동작 1825에서 '예'인 경우) 동작 1830에서 전자 장치(330)(예를 들어 프로세서(406))는 상기 사용자 입력에 응답하여 상기 비디오 서머리 파일을 디스플레이(412)를 통해 재생할 수 있다. 상기 사용자 입력이 수신되지 않는 경우(동작 1825에서 '아니오'인 경우) 전자 장치(330)(예를 들어 프로세서(406))는 절차를 종료할 수 있다.
도 19는 일 실시예에 따라 이벤트 메타데이터를 생성하는 동작을 설명하기 위한 흐름도이다. 실시예들에 따라 후술되는 동작들 중 적어도 하나는 생략되거나 변형되거나 순서 변경될 수 있다. 하기에서는 후술되는 동작들 중 적어도 하나가 전자 장치(330)의 프로세서(406)에 의해 실행되는 것으로 설명할 것이나, 다른 실시예에 따르면 후술되는 동작들 중 적어도 하나는 전자 장치(340)의 프로세서(예를 들어 도 2의 프로세서(220))에 의해 실행될 수 있다.
도 19를 참조하면, 동작 1905에서 전자 장치(330)(예를 들어 프로세서(406))는 비디오 파일을 선택할 수 있다. 일 실시예에서 전자 장치(330)(예를 들어 프로세서(406))는 메모리(408)에 저장된 비디오 파일을 독출(read out)할 수 있다.
동작 1910에서 전자 장치(330)(예를 들어 프로세서(406))는 상기 선택된 비디오 파일 또는 적어도 하나의 임의의 비디오 파일에 대한 서머리 요청 신호를 수신할 수 있다. 일 실시예에서 전자 장치(330)(예를 들어 프로세서(406))는 상기 서머리 요청 신호를 사용자 인터페이스를 통해 사용자로부터 수신할 수 있다. 일 실시예에서 상기 서머리 요청 신호는 검출하고자 하는 적어도 하나의 이벤트 타입 및/또는 기간에 대한 정보를 포함할 수 있다. 일 실시예에서 상기 서머리 요청 신호는 이벤트 타입 및/또는 기간에 대한 정보를 포함하지 않을 수 있고, 전자 장치(330)(예를 들어 프로세서(406))는 상기 서머리 요청 신호에 응답하여 검출 가능한 이벤트 타입들을 모두 검출하도록 결정할 수 있다. 일 실시예에서 전자 장치(330)(예를 들어 프로세서(406))는 상기 비디오 파일이 선택된 이후 혹은 선택되기 이전에 상기 서머리 요청 신호를 수신할 수 있다.
동작 1915에서 전자 장치(330)(예를 들어 프로세서(406))는 상기 비디오 파일을 분석하여 지정된 적어도 하나의 솔루션(예를 들어 이벤트 타입별 솔루션)에 따라 상기 서머리 요청 신호에 의해 지정된 적어도 하나의 이벤트 타입에 대응하는 적어도 하나의 이벤트를 검출하고, 상기 비디오 파일 중 상기 검출된 이벤트를 포함하는 적어도 하나의 비디오 프레임을 식별할 수 있다. 일 실시예에서 전자 장치(330)(예를 들어 프로세서(406))는 상기 서머리 요청 신호를 수신한 이후 상기 선택된 비디오 파일을 포함하는 적어도 하나의 비디오 파일을 분석하고, 상기 적어도 하나의 비디오 파일로부터 상기 이벤트를 포함하는 적어도 하나의 비디오 프레임의 시간 위치를 식별할 수 있다. 일 실시예에서 전자 장치(330)(예를 들어 프로세서(406))는 상기 서머리 요청 신호에 의해 지정된 기간에 대응하는 적어도 하나의 비디오 파일을 분석하고, 상기 적어도 하나의 비디오 파일로부터 상기 이벤트를 포함하는 적어도 하나의 비디오 프레임의 시간 위치를 식별할 수 있다.
동작 1920에서 전자 장치(330)(예를 들어 프로세서(406))는 상기 추출된 적어도 하나의 비디오 프레임의 시간 위치들을 포함하는 이벤트 메타데이터를 생성할 수 있다. 일 실시예에서 상기 서머리 요청 신호는 하나 이상의 이벤트 타입들을 지시할 수 있고, 전자 장치(330)(예를 들어 프로세서(406))는 상기 하나 이상의 이벤트 타입들에 각각 대응하는 하나 이상의 이벤트 메타데이터를 생성하거나, 또는 하나 이상의 이벤트 타입들에 대응하는 하나의 이벤트 메타데이터를 생성할 수 있다. 일 실시예에서 상기 이벤트 메타데이터는 상기 비디오 파일을 식별하는 클립 식별자(identifier: ID), 상기 비디오 파일에 포함된 이벤트를 나타내는 이벤트 타입, 또는 상기 비디오 파일 내에서 상기 이벤트가 검출된 시간 위치를 나타내는 타임스탬프 중 적어도 하나를 포함할 수 있다.
동작 1925에서 전자 장치(330)(예를 들어 프로세서(406))는 이벤트 재생을 요청하는 사용자 입력이 수신되는지 판단할 수 있다. 일 실시예에서 상기 사용자 입력은 지정된 이벤트 타입 및/또는 기간을 포함할 수 있다. 상기 사용자 입력이 수신되는 경우(동작 1925에서 '예'인 경우) 동작 1930에서 전자 장치(330)(예를 들어 프로세서(406))는 상기 사용자 입력이 지정하는 이벤트 타입 및/또는 기간에 대응하는 상기 이벤트 메타데이터를 식별하고 상기 이벤트 메타데이터에 포함된 적어도 하나의 타임스탬프를 식별할 수 있다. 상기 사용자 입력이 수신되지 않는 경우(동작 1925에서 '아니오'인 경우) 전차 장치(330)(예를 들어 프로세서(406)는 절차를 종료할 수 있다.
동작 1935에서 전자 장치(330)(예를 들어 프로세서(406))는 상기 선택된 비디오 파일 중 상기 식별된 적어도 하나의 타임스탬프에 대응하는 적어도 하나의 비디오 프레임을 디스플레이(412)를 통해 재생할 수 있다. 일 실시예에서 전자 장치(330)(예를 들어 프로세서(406))는 상기 이벤트 재생을 요청하는 사용자 입력에 근거하여 상기 식별된 적어도 하나의 타임스탬프에 대응하는 적어도 하나의 비디오 프레임을 포함하는 비디오 서머리 파일을 일시적으로 생성하고 상기 비디오 서머리 파일을 재생할 수 있다.
본 개시의 실시예들은 사용자 장치를 통해 요약하여 시청하고자 하는 이벤트 타입 및 기간을 설정할 수 있다.
본 개시의 실시예들은 사용자가 설정한 이벤트 타입에 따라 요약된 비디오를 포함하는 비디오 서머리 파일을 사용자 장치를 통해 디스플레이할 수 있으며, 비디오 서머리 파일의 재생 중에 관련된 원본 비디오의 정보를 함께 디스플레이할 수 있다.
본 개시의 실시예들은 홈 네트워크와 같은 네트워크 시스템에서 카메라가 가지는 구조적 한계를 극복하기 위해 카메라와 에지 장치를 결합할 수 있다.
본 개시의 실시예들은 네트워크 시스템에서 카메라로부터 수집된 비디오 데이터를 분석하여 이벤트 메타데이터 및 비디오 클립 파일을 생성하고, 이벤트 기반의 비디오 서머리 경험을 제공할 수 있다.
본 개시의 실시예들에 따르면 사용자는 원하는 이벤트와 관련된 비디오 서머리를 제공받을 수 있고 원하는 장면을 포함하는 비디오 클립 파일을 신속하게 찾아낼 수 있다.
본 개시에서 얻을 수 있는 효과는 이상에서 언급한 효과들로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 아래의 기재로부터 본 개시가 속하는 기술 분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
일 실시예들에 따른 전자 장치(330)는 통신 회로(404) 및 상기 통신 회로와 작동적으로 연결된 적어도 하나의 프로세서(406)를 포함할 수 있다. 상기 적어도 하나의 프로세서는 적어도 하나의 외부 카메라(320)로부터 비디오 데이터를 수신하도록 구성될 수 있다. 상기 적어도 하나의 프로세서는 상기 비디오 데이터에 기반하여 상기 비디오 데이터에서 검출된 이벤트를 나타내는 이벤트 메타데이터를 생성하도록 구성될 수 있다. 상기 적어도 하나의 프로세서는 상기 비디오 데이터 중 상기 이벤트와 관련된 적어도 하나의 비디오 프레임을 포함하는 비디오 클립 파일을 생성하도록 구성될 수 있다. 상기 적어도 하나의 프로세서는 상기 이벤트 메타데이터 및 상기 비디오 클립 파일을 저장하도록 구성될 수 있다.
일 실시예에서 상기 적어도 하나의 프로세서는 외부 전자 장치(340)로부터 이벤트 타입 및/또는 기간을 나타내는 서머리 요청 신호를 수신하도록 구성될 수 있다. 상기 적어도 하나의 프로세서는 상기 서머리 요청 신호에 근거하여 상기 이벤트 타입 및/또는 상기 기간에 대응하는 제1 이벤트를 나타내는 제1 이벤트 메타데이터를 검색하도록 구성될 수 있다. 상기 적어도 하나의 프로세서는 상기 제1 이벤트 메타데이터에 근거하여 상기 제1 이벤트 메타데이터와 연관되어 저장된 제1 비디오 클립 파일 중 상기 제1 이벤트에 대응하는 적어도 하나의 제1 비디오 프레임을 추출하도록 구성될 수 있다. 상기 적어도 하나의 프로세서는 상기 추출된 적어도 하나의 제1 비디오 프레임을 포함하는 비디오 서머리 파일을 생성하도록 구성될 수 있다. 상기 적어도 하나의 프로세서는 상기 제1 비디오 클립 파일을 지시하는 서머리 메타데이터를 생성하도록 구성될 수 있다. 상기 적어도 하나의 프로세서는 상기 비디오 서머리 파일을 상기 외부 전자 장치로 전송하도록 구성될 수 있다.
일 실시예에서 상기 서머리 메타데이터는, 상기 제1 비디오 클립 파일을 식별하는 클립 ID, 또는 상기 적어도 하나의 제1 비디오 프레임의 시간 위치를 지시하는 타임스탬프 중 적어도 하나를 포함할 수 있다.
일 실시예에서 상기 이벤트 메타데이터는, 상기 비디오 클립 파일을 식별하는 클립 ID, 상기 검출된 이벤트의 이벤트 타입, 또는 상기 검출된 이벤트의 타임스탬프 중 적어도 하나를 포함할 수 있다.
일 실시예에서 상기 적어도 하나의 프로세서는, 상기 검출된 이벤트를 나타내는 이벤트 업데이트를 상기 통신 회로를 통해 서버로 전송하도록 구성될 수 있다.
일 실시예에서 상기 적어도 하나의 프로세서는, 상기 비디오 서머리 파일 및 상기 서머리 메타데이터를 상기 외부 전자 장치로 전송한 이후 상기 외부 전자 장치로부터 클립 ID를 포함하는 원본 요청 신호를 수신하고, 상기 클립 ID에 대응하는 제2 비디오 클립 파일을 상기 외부 전자 장치로 전송하도록 구성될 수 있다.
일 실시예에서 상기 적어도 하나의 프로세서는, 상기 비디오 서머리 파일 및 상기 서머리 메타데이터를 상기 외부 전자 장치로 전송한 이후 상기 외부 전자 장치로부터 상기 비디오 서머리 파일의 서머리 클립 ID와 타임스탬프를 포함하는 원본 요청 신호를 수신하고, 상기 서머리 메타데이터에 기반하여 상기 타임스탬프에 대응하는 제3 비디오 클립 파일을 식별하고, 상기 제3 비디오 클립 파일을 상기 외부 전자 장치로 전송하도록 구성될 수 있다.
일 실시예에 따른 전자 장치(340)는 통신 회로(290) 및 상기 통신 회로와 작동적으로 연결되는 적어도 하나의 프로세서(220)를 포함할 수 있다. 상기 적어도 하나의 프로세서는, 이벤트 타입 및/또는 기간을 포함하는 서머리 요청 신호를 외부 전자 장치(330)로 전송하도록 구성될 수 있다. 상기 적어도 하나의 프로세서는 상기 서머리 요청 신호를 전송한 이후 상기 외부 전자 장치(330)로부터 상기 이벤트 타입 및/또는 상기 기간에 대응하는 비디오 서머리 파일 및 상기 비디오 서머리 파일에 포함된 각 비디오 프레임의 원본 비디오와 관련된 서머리 메타데이터를 수신하도록 구성될 수 있다. 상기 적어도 하나의 프로세서는 상기 비디오 서머리 파일을 재생하도록 구성될 수 있다. 상기 적어도 하나의 프로세서는 상기 비디오 서머리 파일을 재생하는 도중 제1 비디오 프레임을 선택하는 사용자 입력을 수신하도록 구성될 수 있다. 상기 적어도 하나의 프로세서는 상기 사용자 입력에 응답하여 상기 제1 비디오 프레임을 포함하는 원본 비디오 클립 파일을 요청하는 원본 요청 신호를 상기 외부 전자 장치(330)로 전송하도록 구성될 수 있다. 상기 적어도 하나의 프로세서는 상기 제1 비디오 프레임을 포함하는 상기 원본 비디오 클립 파일을 상기 외부 전자 장치로부터 수신하도록 구성될 수 있다.
일 실시예에서 상기 적어도 하나의 프로세서는, 상기 사용자 입력에 응답하여 상기 서머리 메타데이터로부터 상기 지정된 비디오 프레임을 포함하는 상기 원본 비디오 클립 파일의 클립 ID를 획득하고, 상기 원본 요청 신호에 상기 클립 ID를 포함하여 전송하도록 구성될 수 있다.
일 실시예에서 상기 적어도 하나의 프로세서는, 상기 사용자 입력에 응답하여 상기 비디오 서머리 파일의 서머리 클립 ID와 상기 지정된 비디오 프레임의 타임스탬프를 상기 원본 요청 신호에 포함하여 전송하도록 구성될 수 있다.
일 실시예에 따른 전자 장치(330)의 동작 방법은, 적어도 하나의 외부 카메라(320)로부터 비디오 데이터를 수신하는 동작(510)을 포함할 수 있다. 상기 방법은 상기 비디오 데이터에 기반하여 상기 비디오 데이터에서 검출된 이벤트를 나타내는 이벤트 메타데이터를 생성하는 동작(525)을 포함할 수 있다. 상기 방법은 상기 비디오 데이터 중 상기 이벤트와 관련된 적어도 하나의 비디오 프레임을 포함하는 비디오 클립 파일을 생성하는 동작(520)을 포함할 수 있다. 상기 방법은 상기 이벤트 메타데이터 및 상기 비디오 클립 파일을 저장하는 동작을 포함할 수 있다.
일 실시예에서 상기 방법은 외부 전자 장치(340)로부터 이벤트 타입 및/또는 기간을 나타내는 서머리 요청 신호를 수신하는 동작(605)을 포함할 수 있다. 상기 방법은 상기 서머리 요청 신호에 근거하여 상기 이벤트 타입 및/또는 상기 기간에 대응하는 제1 이벤트를 나타내는 제1 이벤트 메타데이터를 검색하는 동작(610)을 포함할 수 있다. 상기 방법은 상기 제1 이벤트 메타데이터에 근거하여 상기 제1 이벤트 메타데이터와 연관되어 저장된 제1 비디오 클립 파일 중 상기 제1 이벤트에 대응하는 적어도 하나의 제1 비디오 프레임을 추출하는 동작을 포함할 수 있다. 상기 방법은 상기 추출된 적어도 하나의 제1 비디오 프레임을 포함하는 비디오 서머리 파일을 생성하는 동작(615)을 포함할 수 있다. 상기 방법은 상기 제1 비디오 클립 파일을 지시하는 서머리 메타데이터를 생성하는 동작(620)을 포함할 수 있다. 상기 방법은 상기 비디오 서머리 파일을 상기 외부 전자 장치로 전송하는 동작(625)을 포함할 수 있다.
일 실시예에서 상기 서머리 메타데이터는, 상기 제1 비디오 클립 파일을 식별하는 클립 ID, 또는 상기 적어도 하나의 제1 비디오 프레임의 시간 위치를 지시하는 타임스탬프 중 적어도 하나를 포함할 수 있다.
일 실시예에서 상기 이벤트 메타데이터는, 상기 비디오 클립 파일을 식별하는 클립 ID, 상기 검출된 이벤트의 이벤트 타입, 또는 상기 검출된 이벤트의 타임스탬프 중 적어도 하나를 포함할 수 있다.
일 실시예에서 상기 방법은 상기 검출된 이벤트를 나타내는 이벤트 업데이트를 서버로 전송하는 동작을 포함할 수 있다.
일 실시예에서 상기 방법은 상기 비디오 서머리 파일 및 상기 서머리 메타데이터를 상기 외부 전자 장치로 전송한 이후 상기 외부 전자 장치로부터 클립 ID를 포함하는 원본 요청 신호를 수신하는 동작(630)과, 상기 클립 ID에 대응하는 제2 비디오 클립 파일을 상기 외부 전자 장치로 전송하는 동작(640)을 포함할 수 있다.
일 실시예에서 상기 방법은, 상기 비디오 서머리 파일 및 상기 서머리 메타데이터를 상기 외부 전자 장치로 전송한 이후 상기 외부 전자 장치로부터 상기 비디오 서머리 파일의 서머리 클립 ID와 타임스탬프를 포함하는 원본 요청 신호를 수신하는 동작(630)과, 상기 서머리 메타데이터에 기반하여 상기 타임스탬프에 대응하는 제3 비디오 클립 파일을 식별하는 동작(635)과, 상기 제3 비디오 클립 파일을 상기 외부 전자 장치로 전송하는 동작(640)을 포함할 수 있다.
일 실시예에 따른 전자 장치(340)의 동작 방법은, 이벤트 타입 및/또는 기간을 포함하는 서머리 요청 신호를 외부 전자 장치(330)로 전송하는 동작을 포함할 수 있다. 상기 방법은 상기 서머리 요청 신호를 전송한 이후 상기 외부 전자 장치(330)로부터 상기 이벤트 타입 및/또는 상기 기간에 대응하는 비디오 서머리 파일 및 상기 비디오 서머리 파일에 포함된 각 비디오 프레임의 원본 비디오와 관련된 서머리 메타데이터를 수신하는 동작을 포함할 수 있다. 상기 방법은 상기 비디오 서머리 파일을 재생하는 동작을 포함할 수 있다. 상기 방법은 상기 비디오 서머리 파일을 재생하는 도중 제1 비디오 프레임을 선택하는 사용자 입력을 수신하는 동작을 포함할 수 있다. 상기 방법은 상기 사용자 입력에 응답하여 상기 제1 비디오 프레임을 포함하는 원본 비디오 클립 파일을 요청하는 원본 요청 신호를 상기 외부 전자 장치(330)로 전송하는 동작을 포함할 수 있다. 상기 방법은 상기 제1 비디오 프레임을 포함하는 상기 원본 비디오 클립 파일을 상기 외부 전자 장치로부터 수신하는 동작을 포함할 수 있다.
일 실시예에서 상기 방법은, 상기 사용자 입력에 응답하여 상기 서머리 메타데이터로부터 상기 지정된 비디오 프레임을 포함하는 상기 원본 비디오 클립 파일의 클립 ID를 획득하는 동작과, 상기 원본 요청 신호에 상기 클립 ID를 포함시키는 동작을 포함할 수 있다.
일 실시예에서 상기 방법은, 상기 사용자 입력에 응답하여 상기 비디오 서머리 파일의 서머리 클립 ID와 상기 지정된 비디오 프레임의 타임스탬프를 상기 원본 요청 신호에 포함시키는 동작을 포함할 수 있다.
일 실시예에 따른 비디오 데이터를 처리하는 시스템(300)은, 서버(310), 적어도 하나의 카메라(320), 상기 서버와 상기 적어도 하나의 카메라 사이에서 비디오 데이터 처리를 수행하도록 구성되는 에지 장치(330), 및 상기 서버(310) 및/또는 상기 에지 장치(330)와 통신 가능한 사용자 장치(340)를 포함할 수 있다. 상기 에지 장치는 상기 적어도 하나의 카메라로부터 상기 비디오 데이터를 수신하도록 구성될 수 있다. 상기 에지 장치는 상기 비디오 데이터에 기반하여 상기 비디오 데이터에서 검출된 이벤트를 나타내는 이벤트 메타데이터를 생성하도록 구성될 수 있다. 상기 에지 장치는 상기 비디오 데이터 중 상기 이벤트와 관련된 적어도 하나의 비디오 프레임을 포함하는 비디오 클립 파일들을 생성하도록 구성될 수 있다. 상기 에지 장치는 상기 이벤트 메타데이터 및 상기 비디오 클립 파일들을 저장하도록 구성될 수 있다. 상기 에지 장치는 상기 사용자 장치의 요청에 응답하여 상기 비디오 클립 파일들 중 선택된 적어도 하나의 비디오 클립 파일을 상기 사용자 장치로 전송하도록 구성될 수 있다.
일 실시예에서 상기 에지 장치는, 상기 사용자 장치로부터 이벤트 타입 및/또는 기간을 나타내는 서머리 요청 신호를 수신하고, 상기 서머리 요청 신호에 근거하여 상기 이벤트 타입 및/또는 상기 기간에 대응하는 제1 이벤트를 나타내는 제1 이벤트 메타데이터를 검색하고, 상기 제1 이벤트 메타데이터에 근거하여, 상기 제1 이벤트 메타데이터와 연관되어 저장된 제1 비디오 클립 파일 중 상기 제1 이벤트에 대응하는 적어도 하나의 제1 비디오 프레임을 추출하고, 상기 추출된 적어도 하나의 제1 비디오 프레임을 포함하는 비디오 서머리 파일을 생성하고, 상기 제1 비디오 클립 파일을 지시하는 서머리 메타데이터를 생성하고, 상기 비디오 서머리 파일을 상기 사용자 장치로 전송하도록 구성될 수 있다.
일 실시예에서 상기 서머리 메타데이터는, 상기 제1 비디오 클립 파일을 식별하는 클립 ID, 또는 상기 적어도 하나의 제1 비디오 프레임의 시간 위치를 지시하는 타임스탬프 중 적어도 하나를 포함할 수 있다.
일 실시예에서 상기 이벤트 메타데이터는, 상기 비디오 클립 파일을 식별하는 클립 ID, 상기 검출된 이벤트의 이벤트 타입, 또는 상기 검출된 이벤트의 타임스탬프 중 적어도 하나를 포함할 수 있다.
일 실시예에서 상기 에지 장치는, 상기 검출된 이벤트를 나타내는 이벤트 업데이트를 상기 통신 회로를 통해 서버로 전송하도록 구성될 수 있다.
일 실시예에서 상기 에지 장치는, 상기 비디오 서머리 파일 및 상기 서머리 메타데이터를 상기 사용자 장치로 전송한 이후 상기 사용자 장치로부터 클립 ID를 포함하는 제1 원본 요청 신호를 수신하고, 상기 제1 원본 요청 신호에 응답하여 상기 클립 ID에 대응하는 제2 비디오 클립 파일을 상기 사용자 장치로 전송하도록 구성될 수 있다.
일 실시예에서 상기 에지 장치는, 상기 비디오 서머리 파일 및 상기 서머리 메타데이터를 상기 외부 전자 장치로 전송한 이후 상기 외부 전자 장치로부터 상기 비디오 서머리 파일의 서머리 클립 ID와 타임스탬프를 포함하는 제2 원본 요청 신호를 수신하고, 상기 제2 원본 신호에 응답하여 상기 서머리 메타데이터와 상기 타임스탬프에 대응하는 제3 비디오 클립 파일을 식별하고, 상기 제3 비디오 클립 파일을 상기 외부 전자 장치로 전송하도록 구성될 수 있다.
본 문서에 개시된 다양한 실시예들에 따른 전자 장치는 다양한 형태의 장치가 될 수 있다. 전자 장치는, 예를 들면, 휴대용 통신 장치(예: 스마트폰), 컴퓨터 장치, 휴대용 멀티미디어 장치, 휴대용 의료 기기, 카메라, 웨어러블 장치, 또는 가전 장치를 포함할 수 있다. 본 문서의 실시예에 따른 전자 장치는 전술한 기기들에 한정되지 않는다.
본 문서의 다양한 실시예들 및 이에 사용된 용어들은 본 문서에 기재된 기술적 특징들을 특정한 실시예들로 한정하려는 것이 아니며, 해당 실시예의 다양한 변경, 균등물, 또는 대체물을 포함하는 것으로 이해되어야 한다. 도면의 설명과 관련하여, 유사한 또는 관련된 구성요소에 대해서는 유사한 참조 부호가 사용될 수 있다. 아이템에 대응하는 명사의 단수 형은 관련된 문맥상 명백하게 다르게 지시하지 않는 한, 상기 아이템 한 개 또는 복수 개를 포함할 수 있다. 본 문서에서, "A 또는 B", "A 및 B 중 적어도 하나", "A 또는 B 중 적어도 하나", "A, B 또는 C", "A, B 및 C 중 적어도 하나", 및 "A, B, 또는 C 중 적어도 하나"와 같은 문구들 각각은 그 문구들 중 해당하는 문구에 함께 나열된 항목들 중 어느 하나, 또는 그들의 모든 가능한 조합을 포함할 수 있다. "제 1", "제 2", 또는 "첫째" 또는 "둘째"와 같은 용어들은 단순히 해당 구성요소를 다른 해당 구성요소와 구분하기 위해 사용될 수 있으며, 해당 구성요소들을 다른 측면(예: 중요성 또는 순서)에서 한정하지 않는다. 어떤(예: 제 1) 구성요소가 다른(예: 제 2) 구성요소에, "기능적으로" 또는 "통신적으로"라는 용어와 함께 또는 이런 용어 없이, "커플드" 또는 "커넥티드"라고 언급된 경우, 그것은 상기 어떤 구성요소가 상기 다른 구성요소에 직접적으로(예: 유선으로), 무선으로, 또는 제 3 구성요소를 통하여 연결될 수 있다는 것을 의미한다.
본 문서의 다양한 실시예들에서 사용된 용어 "모듈"은 하드웨어, 소프트웨어 또는 펌웨어로 구현된 유닛을 포함할 수 있으며, 예를 들면, 로직, 논리 블록, 부품, 또는 회로와 같은 용어와 상호 호환적으로 사용될 수 있다. 모듈은, 일체로 구성된 부품 또는 하나 또는 그 이상의 기능을 수행하는, 상기 부품의 최소 단위 또는 그 일부가 될 수 있다. 예를 들면, 일 실시예에 따르면, 모듈은 ASIC(application-specific integrated circuit)의 형태로 구현될 수 있다.
본 문서의 다양한 실시예들은 기기(machine)(예: 전자 장치(201)) 의해 읽을 수 있는 저장 매체(storage medium)(예: 내장 메모리(236) 또는 외장 메모리(238))에 저장된 하나 이상의 명령어들을 포함하는 소프트웨어(예: 프로그램(240))로서 구현될 수 있다. 예를 들면, 기기(예: 전자 장치(201))의 프로세서(예: 프로세서(220))는, 저장 매체로부터 저장된 하나 이상의 명령어들 중 적어도 하나의 명령을 호출하고, 그것을 실행할 수 있다. 이것은 기기가 상기 호출된 적어도 하나의 명령어에 따라 적어도 하나의 기능을 수행하도록 운영되는 것을 가능하게 한다. 상기 하나 이상의 명령어들은 컴파일러에 의해 생성된 코드 또는 인터프리터에 의해 실행될 수 있는 코드를 포함할 수 있다. 기기로 읽을 수 있는 저장 매체는, 비일시적(non-transitory) 저장 매체의 형태로 제공될 수 있다. 여기서, '비일시적'은 저장 매체가 실재(tangible)하는 장치이고, 신호(signal)(예: 전자기파)를 포함하지 않는다는 것을 의미할 뿐이며, 이 용어는 데이터가 저장 매체에 반영구적으로 저장되는 경우와 임시적으로 저장되는 경우를 구분하지 않는다.
일 실시예에 따르면, 본 문서에 개시된 다양한 실시예들에 따른 방법은 컴퓨터 프로그램 제품(computer program product)에 포함되어 제공될 수 있다. 컴퓨터 프로그램 제품은 상품으로서 판매자 및 구매자 간에 거래될 수 있다. 컴퓨터 프로그램 제품은 기기로 읽을 수 있는 저장 매체(예: compact disc read only memory(CD-ROM))의 형태로 배포되거나, 또는 어플리케이션 스토어(예: 플레이 스토어TM)를 통해 또는 두 개의 사용자 장치들(예: 스마트 폰들) 간에 직접, 온라인으로 배포(예: 다운로드 또는 업로드)될 수 있다. 온라인 배포의 경우에, 컴퓨터 프로그램 제품의 적어도 일부는 제조사의 서버, 어플리케이션 스토어의 서버, 또는 중계 서버의 메모리와 같은 기기로 읽을 수 있는 저장 매체에 적어도 일시 저장되거나, 임시적으로 생성될 수 있다.
다양한 실시예들에 따르면, 상기 기술한 구성요소들의 각각의 구성요소(예: 모듈 또는 프로그램)는 단수 또는 복수의 개체를 포함할 수 있으며, 복수의 개체 중 일부는 다른 구성요소에 분리 배치될 수도 있다. 다양한 실시예들에 따르면, 전술한 해당 구성요소들 중 하나 이상의 구성요소들 또는 동작들이 생략되거나, 또는 하나 이상의 다른 구성요소들 또는 동작들이 추가될 수 있다. 대체적으로 또는 추가적으로, 복수의 구성요소들(예: 모듈 또는 프로그램)은 하나의 구성요소로 통합될 수 있다. 이런 경우, 통합된 구성요소는 상기 복수의 구성요소들 각각의 구성요소의 하나 이상의 기능들을 상기 통합 이전에 상기 복수의 구성요소들 중 해당 구성요소에 의해 수행되는 것과 동일 또는 유사하게 수행할 수 있다. 다양한 실시예들에 따르면, 모듈, 프로그램 또는 다른 구성요소에 의해 수행되는 동작들은 순차적으로, 병렬적으로, 반복적으로, 또는 휴리스틱하게 실행되거나, 상기 동작들 중 하나 이상이 다른 순서로 실행되거나, 생략되거나, 또는 하나 이상의 다른 동작들이 추가될 수 있다.

Claims (15)

  1. 전자 장치(330)에 있어서,
    서버(310) 및 적어도 하나의 외부 카메라(320)와 통신하는 통신 회로(404); 및
    상기 통신 회로와 작동적으로 결합되고 상기 서버(310)와 상기 적어도 하나의 외부 카메라(320) 사이에서 비디오 데이터 처리를 수행하도록 구성되는 적어도 하나의 프로세서(406)를 포함하고, 상기 적어도 하나의 프로세서는,
    상기 적어도 하나의 외부 카메라(320)로부터 비디오 데이터를 수신하고,
    상기 비디오 데이터에 기반하여 상기 비디오 데이터에서 검출된 이벤트를 나타내는 이벤트 메타데이터를 생성하고,
    상기 비디오 데이터 중 상기 이벤트와 관련된 적어도 하나의 비디오 프레임을 포함하는 비디오 클립 파일들을 생성하고,
    상기 이벤트 메타데이터 및 상기 비디오 클립 파일들을 저장하도록 구성되는 전자 장치.
  2. 제 1 항에 있어서, 상기 적어도 하나의 프로세서는,
    외부 전자 장치(340)로부터 이벤트 타입 및/또는 기간을 나타내는 서머리 요청 신호를 수신하고,
    상기 서머리 요청 신호에 근거하여 상기 이벤트 타입 및/또는 상기 기간에 대응하는 제1 이벤트를 나타내는 제1 이벤트 메타데이터를 검색하고,
    상기 제1 이벤트 메타데이터에 근거하여, 상기 제1 이벤트 메타데이터와 연관되어 저장된 제1 비디오 클립 파일 중 상기 제1 이벤트에 대응하는 적어도 하나의 제1 비디오 프레임을 추출하고,
    상기 추출된 적어도 하나의 제1 비디오 프레임을 포함하는 비디오 서머리 파일을 생성하고,
    상기 제1 비디오 클립 파일을 지시하는 서머리 메타데이터를 생성하고,
    상기 비디오 서머리 파일을 상기 외부 전자 장치로 전송하도록 구성되는 전자 장치.
  3. 제 2 항에 있어서, 상기 서머리 메타데이터는,
    상기 제1 비디오 클립 파일을 식별하는 클립 ID, 또는 상기 적어도 하나의 제1 비디오 프레임의 시간 위치를 지시하는 타임스탬프 중 적어도 하나를 포함하는 전자 장치.
  4. 제 1 항 내지 제 3 항에 있어서, 상기 이벤트 메타데이터는,
    상기 비디오 클립 파일을 식별하는 클립 ID, 상기 검출된 이벤트의 이벤트 타입, 또는 상기 검출된 이벤트의 타임스탬프 중 적어도 하나를 포함하는 전자 장치.
  5. 제 1 항 내지 제 4 항 중 어느 한 항에 있어서, 상기 적어도 하나의 프로세서는,
    상기 검출된 이벤트를 나타내는 이벤트 업데이트를 상기 통신 회로를 통해 상기 서버로 전송하도록 구성되는 전자 장치.
  6. 제 2 항 내지 제 5 항 중 어느 한 항에 있어서, 상기 적어도 하나의 프로세서는,
    상기 비디오 서머리 파일 및 상기 서머리 메타데이터를 상기 외부 전자 장치로 전송한 이후 상기 외부 전자 장치로부터 클립 ID를 포함하는 원본 요청 신호를 수신하고,
    상기 클립 ID에 대응하는 제2 비디오 클립 파일을 상기 외부 전자 장치로 전송하도록 구성되는 전자 장치.
  7. 제 2 항 내지 제 5 항 중 어느 한 항에 있어서, 상기 적어도 하나의 프로세서는,
    상기 비디오 서머리 파일 및 상기 서머리 메타데이터를 상기 외부 전자 장치로 전송한 이후 상기 외부 전자 장치로부터 상기 비디오 서머리 파일의 서머리 클립 ID와 타임스탬프를 포함하는 원본 요청 신호를 수신하고,
    상기 서머리 메타데이터에 기반하여 상기 타임스탬프에 대응하는 제3 비디오 클립 파일을 식별하고,
    상기 제3 비디오 클립 파일을 상기 외부 전자 장치로 전송하도록 구성되는 전자 장치.
  8. 서버(310)와 적어도 하나의 외부 카메라(320) 사이에서 비디오 데이터 처리를 수행하도록 구성되는 전자 장치(330)의 동작 방법에 있어서,
    적어도 하나의 외부 카메라(320)로부터 비디오 데이터를 수신하는 동작(510)과,
    상기 비디오 데이터에 기반하여 상기 비디오 데이터에서 검출된 이벤트를 나타내는 이벤트 메타데이터를 생성하는 동작(525)과,
    상기 비디오 데이터 중 상기 이벤트와 관련된 적어도 하나의 비디오 프레임을 포함하는 비디오 클립 파일들을 생성하는 동작(520)과,
    상기 이벤트 메타데이터 및 상기 비디오 클립 파일들을 저장하는 동작을 포함하는 방법.
  9. 제 8 항에 있어서,
    외부 전자 장치(340)로부터 이벤트 타입 및/또는 기간을 나타내는 서머리 요청 신호를 수신하는 동작(605)과,
    상기 서머리 요청 신호에 근거하여 상기 이벤트 타입 및/또는 상기 기간에 대응하는 제1 이벤트를 나타내는 제1 이벤트 메타데이터를 검색하는 동작(610)과,
    상기 제1 이벤트 메타데이터에 근거하여 상기 제1 이벤트 메타데이터와 연관되어 저장된 제1 비디오 클립 파일 중 상기 제1 이벤트에 대응하는 적어도 하나의 제1 비디오 프레임을 추출하는 동작과,
    상기 추출된 적어도 하나의 제1 비디오 프레임을 포함하는 비디오 서머리 파일을 생성하는 동작(615)과,
    상기 제1 비디오 클립 파일을 지시하는 서머리 메타데이터를 생성하는 동작(620)과,
    상기 비디오 서머리 파일을 상기 외부 전자 장치로 전송하는 동작(625)을 더 포함하는 방법.
  10. 제 9 항에 있어서, 상기 서머리 메타데이터는,
    상기 제1 이벤트에 대응하는 상기 비디오 클립 파일을 식별하는 클립 ID, 또는 상기 비디오 클립 파일로부터 추출된 상기 적어도 하나의 비디오 프레임의 시간 위치를 지시하는 타임스탬프 중 적어도 하나를 포함하고,
    상기 이벤트 메타데이터는,
    상기 비디오 클립 파일을 식별하는 클립 ID, 상기 검출된 이벤트의 이벤트 타입, 또는 상기 검출된 이벤트의 타임스탬프 중 적어도 하나를 포함하는 방법.
  11. 제 9 항 또는 제 10 항에 있어서,
    상기 비디오 서머리 파일 및 상기 서머리 메타데이터를 상기 외부 전자 장치로 전송한 이후 상기 외부 전자 장치로부터 클립 ID를 포함하는 원본 요청 신호를 수신하는 동작(630)과,
    상기 클립 ID에 대응하는 제1 비디오 클립 파일을 상기 외부 전자 장치로 전송하는 동작(640)을 더 포함하는 방법.
  12. 제 9 항 내지 제 11 항 중 어느 한 항에 있어서,
    상기 비디오 서머리 파일 및 상기 서머리 메타데이터를 상기 외부 전자 장치로 전송한 이후 상기 외부 전자 장치로부터 상기 비디오 서머리 파일의 서머리 클립 ID와 타임스탬프를 포함하는 원본 요청 신호를 수신하는 동작(630)과,
    상기 서머리 메타데이터에 기반하여 상기 타임스탬프에 대응하는 제1 비디오 클립 파일을 식별하는 동작(635)과,
    상기 제1 비디오 클립 파일을 상기 외부 전자 장치로 전송하는 동작(640)을 포함하는 방법.
  13. 비디오 데이터를 처리하는 시스템(300)에 있어서,
    서버(310);
    적어도 하나의 카메라(320);
    상기 서버와 상기 적어도 하나의 카메라 사이에서 비디오 데이터 처리를 수행하도록 구성되는 에지 장치(330); 및
    상기 서버(310) 및/또는 상기 에지 장치(330)와 통신 가능한 사용자 장치(340)를 포함하고,
    상기 에지 장치는,
    상기 적어도 하나의 카메라로부터 상기 비디오 데이터를 수신하고,
    상기 비디오 데이터에 기반하여 상기 비디오 데이터에서 검출된 이벤트를 나타내는 이벤트 메타데이터를 생성하고,
    상기 비디오 데이터 중 상기 이벤트와 관련된 적어도 하나의 비디오 프레임을 포함하는 비디오 클립 파일들을 생성하고,
    상기 이벤트 메타데이터 및 상기 비디오 클립 파일들을 저장하고,
    상기 사용자 장치의 요청에 응답하여 상기 비디오 클립 파일들 중 선택된 적어도 하나의 비디오 클립 파일을 상기 사용자 장치로 전송하도록 구성되는 시스템.
  14. 제 13 항에 있어서, 상기 에지 장치는,
    상기 사용자 장치로부터 이벤트 타입 및/또는 기간을 나타내는 서머리 요청 신호를 수신하고,
    상기 서머리 요청 신호에 근거하여 상기 이벤트 타입 및/또는 상기 기간에 대응하는 제1 이벤트를 나타내는 제1 이벤트 메타데이터를 검색하고,
    상기 제1 이벤트 메타데이터에 근거하여, 상기 제1 이벤트 메타데이터와 연관되어 저장된 제1 비디오 클립 파일 중 상기 제1 이벤트에 대응하는 적어도 하나의 제1 비디오 프레임을 추출하고,
    상기 추출된 적어도 하나의 제1 비디오 프레임을 포함하는 비디오 서머리 파일을 생성하고,
    상기 제1 비디오 클립 파일을 지시하는 서머리 메타데이터를 생성하고,
    상기 비디오 서머리 파일을 상기 사용자 장치로 전송하도록 구성되는 시스템.
  15. 제 14 항에 있어서, 상기 서머리 메타데이터는, 상기 제1 비디오 클립 파일을 식별하는 클립 ID, 또는 상기 적어도 하나의 제1 비디오 프레임의 시간 위치를 지시하는 타임스탬프 중 적어도 하나를 포함하고,
    상기 이벤트 메타데이터는, 상기 비디오 클립 파일을 식별하는 클립 ID, 상기 검출된 이벤트의 이벤트 타입, 또는 상기 검출된 이벤트의 타임스탬프 중 적어도 하나를 포함하는 시스템.
PCT/KR2023/012659 2022-10-11 2023-08-25 비디오 서머리를 생성하는 전자 장치 및 그 동작 방법 WO2024080543A1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR10-2022-0130070 2022-10-11
KR20220130070 2022-10-11
KR1020220167650A KR20240050223A (ko) 2022-10-11 2022-12-05 비디오 서머리를 생성하는 전자 장치 및 그 동작 방법
KR10-2022-0167650 2022-12-05

Publications (1)

Publication Number Publication Date
WO2024080543A1 true WO2024080543A1 (ko) 2024-04-18

Family

ID=90669358

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2023/012659 WO2024080543A1 (ko) 2022-10-11 2023-08-25 비디오 서머리를 생성하는 전자 장치 및 그 동작 방법

Country Status (1)

Country Link
WO (1) WO2024080543A1 (ko)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180089977A (ko) * 2017-02-02 2018-08-10 한국전자통신연구원 영상 이벤트 단위 세그멘테이션 시스템 및 그 방법
KR20200099427A (ko) * 2019-02-14 2020-08-24 네이버 주식회사 인공지능을 이용한 문맥 파악 기반의 동영상 편집 방법 및 시스템
KR102336480B1 (ko) * 2021-03-04 2021-12-07 주식회사 스누아이랩 자동 세그먼트 분류를 위한 영상처리장치 및 그 장치의 구동방법
JP2022508551A (ja) * 2018-10-01 2022-01-19 デジタル バリアーズ サービシーズ リミテッド ビデオ監視及びオブジェクト認識
KR20220102522A (ko) * 2021-01-13 2022-07-20 삼성전자주식회사 요약 영상 생성 방법 및 그 전자 장치

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180089977A (ko) * 2017-02-02 2018-08-10 한국전자통신연구원 영상 이벤트 단위 세그멘테이션 시스템 및 그 방법
JP2022508551A (ja) * 2018-10-01 2022-01-19 デジタル バリアーズ サービシーズ リミテッド ビデオ監視及びオブジェクト認識
KR20200099427A (ko) * 2019-02-14 2020-08-24 네이버 주식회사 인공지능을 이용한 문맥 파악 기반의 동영상 편집 방법 및 시스템
KR20220102522A (ko) * 2021-01-13 2022-07-20 삼성전자주식회사 요약 영상 생성 방법 및 그 전자 장치
KR102336480B1 (ko) * 2021-03-04 2021-12-07 주식회사 스누아이랩 자동 세그먼트 분류를 위한 영상처리장치 및 그 장치의 구동방법

Similar Documents

Publication Publication Date Title
WO2020027498A1 (en) Electronic device and method for determining electronic device to perform speech recognition
WO2019172671A1 (en) Display device and control method thereof
WO2019039868A1 (en) ELECTRONIC DISPLAY DEVICE FOR APPLICATION AND METHOD FOR OPERATING THE SAME
WO2022019681A1 (ko) 엣지 컴퓨팅 시스템 및 연결 기기 추천 방법
WO2019017665A1 (en) ELECTRONIC APPARATUS FOR PROCESSING A USER STATEMENT FOR CONTROLLING AN EXTERNAL ELECTRONIC APPARATUS AND METHOD FOR CONTROLLING THE APPARATUS
WO2022019682A1 (ko) 엣지 컴퓨팅 시스템 및 방법
WO2018092975A1 (ko) 디스플레이 장치 및 그의 동작 방법
WO2024080543A1 (ko) 비디오 서머리를 생성하는 전자 장치 및 그 동작 방법
WO2022060046A1 (ko) 엣지 컴퓨팅 시스템 및 엣지 컴퓨팅 장치의 핸드오버 방법
WO2022124846A1 (ko) Iot 환경의 허브 장치 및 로컬 네트워크 기반 이벤트 처리 방법
WO2022124493A1 (ko) 전자 장치 및 전자 장치에서 기억 서비스를 제공하는 방법
WO2022025463A1 (ko) 외부 장치들이 출력하는 컨텐츠의 출력 시점을 동기화하는 전자 장치 및 전자 장치의 동작 방법
WO2021210795A1 (ko) 전자 장치들의 무선 연결 방법 및 장치
WO2017094991A1 (en) Electronic device, companion device, and method of operating the electronic device
WO2019124775A1 (ko) 전자 장치 및 전자 장치에서 방송 콘텐트와 관련된 서비스 정보 제공 방법
WO2020054942A1 (ko) 액세서리를 이용하여 인증을 수행하는 전자 장치 및 전자 장치의 동작 방법
WO2024085592A1 (ko) 전자 장치 및 전자 장치의 음성 어시스턴트 서비스 제공 방법
WO2024029715A1 (ko) 알림을 제공하기 위한 방법 및 이를 지원하는 전자 장치
WO2023249206A1 (ko) 스케줄 관리를 위한 소프트웨어 어플리케이션에 관한 동작을 수행하기 위한 전자 장치 및 방법
WO2023239043A1 (ko) 객체를 검출하기 위한 방법 및 이를 지원하는 전자 장치
WO2024080702A1 (ko) 외부 장치와 화면을 공유하는 전자 장치 및 이의 제어 방법
WO2024122951A1 (ko) 화면 및 화면 캡처 시점의 상황을 공유하는 전자 장치, 동작 방법, 및 저장 매체
WO2024034787A1 (ko) 피제어 장치를 관리하는 전자 장치 및 그 동작 방법
WO2024112157A1 (ko) 공동 편집 명령어를 처리하는 전자 장치 및 그 방법
WO2022119058A1 (ko) 어플리케이션 실행 프로세서 및 이를 포함하는 전자 장치

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 23877473

Country of ref document: EP

Kind code of ref document: A1