KR102594030B1 - 비디오 이미지 전송 방법, 장치, 인터랙티브 지능형 태블릿 및 저장 매체 - Google Patents
비디오 이미지 전송 방법, 장치, 인터랙티브 지능형 태블릿 및 저장 매체 Download PDFInfo
- Publication number
- KR102594030B1 KR102594030B1 KR1020217021786A KR20217021786A KR102594030B1 KR 102594030 B1 KR102594030 B1 KR 102594030B1 KR 1020217021786 A KR1020217021786 A KR 1020217021786A KR 20217021786 A KR20217021786 A KR 20217021786A KR 102594030 B1 KR102594030 B1 KR 102594030B1
- Authority
- KR
- South Korea
- Prior art keywords
- image
- video
- semantic information
- communication terminal
- reconstructed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005540 biological transmission Effects 0.000 title claims abstract description 176
- 238000000034 method Methods 0.000 title claims abstract description 84
- 230000002452 interceptive effect Effects 0.000 title claims abstract description 37
- 238000004891 communication Methods 0.000 claims abstract description 319
- 239000013598 vector Substances 0.000 claims description 24
- 238000004590 computer program Methods 0.000 claims description 16
- 230000001815 facial effect Effects 0.000 claims description 16
- 238000000605 extraction Methods 0.000 claims description 14
- 230000008921 facial expression Effects 0.000 claims description 13
- 239000000284 extract Substances 0.000 claims description 10
- 238000013527 convolutional neural network Methods 0.000 claims description 9
- 230000006399 behavior Effects 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 6
- 238000003384 imaging method Methods 0.000 claims 2
- 230000006835 compression Effects 0.000 description 12
- 238000007906 compression Methods 0.000 description 12
- 238000005516 engineering process Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000033001 locomotion Effects 0.000 description 5
- 238000012805 post-processing Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/15—Conference systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/141—Systems for two-way working between two video terminals, e.g. videophone
- H04N7/147—Communication arrangements, e.g. identifying the communication as a video-communication, intermediate storage of the signals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/251—Fusion techniques of input or preprocessed data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/107—Static hand or arm
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/174—Facial expression recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/39—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability involving multiple description coding [MDC], i.e. with separate layers being structured as independently decodable descriptions of input picture data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/4402—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/478—Supplemental services, e.g. displaying phone caller identification, shopping application
- H04N21/4788—Supplemental services, e.g. displaying phone caller identification, shopping application communicating with other users, e.g. chatting
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/141—Systems for two-way working between two video terminals, e.g. videophone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/15—Conference systems
- H04N7/155—Conference systems involving storage of or access to video conference sessions
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Human Computer Interaction (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Mathematical Physics (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Television Signal Processing For Recording (AREA)
Abstract
Description
도 2는 일 실시예에 따른 비디오 이미지 전송 방법의 예시적 흐름도이다.
도 3은 다른 실시예에 따른 비디오 이미지 전송 방법의 예시적 흐름도이다.
도 4는 일 실시예에 따른 인코더 및 디코더를 구축하는 모델 모식도이다
도 5는 일 실시예에 따른 이미지 송신단에 기반한 비디오 이미지 전송 방법의 예시적 흐름도이다.
도 6은 일 실시예에 따른 이미지 수신단에 기반한 비디오 이미지 전송 방법의 예시적 흐름도이다.
도 7은 일 실시예에 따른 비디오 이미지 전송 장치의 예시적 구조도이다.
도 8은 다른 실시예에 따른 비디오 이미지 전송 장치의 예시적 구조도이다.
도 9는 일 실시예에서 인터랙티브 지능형 태블릿의 내부 구조도이다.
Claims (46)
- 비디오 이미지 전송 방법으로서,
회의 환경에서, 제1 비디오 통신 단말에 의해 촬영된 비디오 이미지를 획득하는 단계;
상기 비디오 이미지로부터의 제1 참조 이미지를 N 프레임 간격마다 설정된 이미지 전송 모드를 사용하여 제2 비디오 통신 단말에 송신하는 단계 -상기 제1 참조 이미지는 상기 제1 비디오 통신 단말에 의해 촬영된 비디오 이미지임 -;
트레이닝된 인코더를 통해 상기 비디오 이미지의 의미 정보를 추출하는 단계 - 상기 의미 정보는 설정 객체의 의미 정보이며, 상기 의미 정보는 회의에 참여하는 인물의 얼굴 표정 특징 정보, 몸체 행동 특징 정보를 포함할 수 있고, 상기 의미 정보의 데이터 양은 상기 비디오 이미지의 전체 데이터 양보다 작음 -; 및
상기 의미 정보를 상기 제2 비디오 통신 단말에 송신하는 단계
를 포함하고,
상기 제1 참조 이미지와 상기 의미 정보는 상기 제2 비디오 통신 단말이 설정 객체의 재구성 서브 이미지를 재구성하도록 하고, 상기 설정 객체의 재구성 서브 이미지를 상기 제1 참조 이미지와 융합하여 상기 제1 비디오 통신 단말의 비디오 이미지의 재구성 이미지를 획득하도록 하되,
상기 설정된 이미지 전송 모드에서 전송된 상기 제1 참조 이미지의 데이터 양은 상기 의미 정보의 데이터 양보다 크고, N은 1보다 큰 것인, 비디오 이미지 전송 방법. - 제1항에 있어서,
상기 인코더는 이미지 의미 정보를 인식하도록 설정되는, 비디오 이미지 전송 방법. - 제2항에 있어서,
상기 인코더의 입력은 이미지이고, 출력은 입력 이미지에 대응되는 저차원 벡터이며, 입력 이미지의 의미 정보로 사용되는, 비디오 이미지 전송 방법. - 제3항에 있어서,
상기 인코더는 콘볼루션 신경망인, 비디오 이미지 전송 방법. - 삭제
- 제1항에 있어서,
상기 비디오 이미지 중 설정 객체의 의미 정보를 추출하는 단계는,
상기 비디오 이미지의 설정 객체를 인식하여, 상기 설정 객체의 서브 이미지를 획득하는 단계;
상기 설정 객체의 서브 이미지를 트레이닝된 인코더에 입력하는 단계; 및
상기 인코더의 출력을 획득하여, 상기 비디오 이미지 중 상기 설정 객체의 의미 정보를 획득하는 단계를 포함하는, 비디오 이미지 전송 방법. - 제6항에 있어서,
상기 설정 객체는 얼굴 또는 몸체를 포함하는, 비디오 이미지 전송 방법. - 제7항에 있어서,
상기 설정 객체가 얼굴이면, 상기 비디오 이미지 중 설정 객체의 의미 정보를 추출하는 상기 단계는,
상기 비디오 이미지의 얼굴 영역을 인식하여, 얼굴 서브 이미지를 획득하는 단계;
상기 얼굴 서브 이미지를 트레이닝된 인코더에 입력하는 단계; 및
상기 인코더의 출력을 획득하여, 상기 비디오 이미지의 얼굴 의미 정보를 획득하는 단계를 포함하는, 비디오 이미지 전송 방법. - 제7항에 있어서,
상기 설정 객체가 몸체이면, 상기 비디오 이미지 중 설정 객체의 의미 정보를 추출하는 상기 단계는,
상기 비디오 이미지의 몸체 영역을 인식하여, 몸체 서브 이미지를 획득하는 단계;
상기 몸체 서브 이미지를 트레이닝된 인코더에 입력하는 단계; 및
상기 인코더의 출력을 획득하여, 상기 비디오 이미지의 몸체 의미 정보를 획득하는 단계를 포함하는, 비디오 이미지 전송 방법. - 삭제
- 제6항 내지 제9항 중 어느 한 항에 있어서,
상기 제1 참조 이미지는 상기 제1 비디오 통신 단말에 의해 촬영된 비디오 이미지에 속하고; 상기 제1 참조 이미지는 상기 제2 비디오 통신 단말이 상기 의미 정보 및 상기 제1 참조 이미지에 따라 상기 비디오 이미지의 재구성 이미지를 재구성하도록 하기 위한 것인, 비디오 이미지 전송 방법. - 제11항에 있어서,
상기 제1 참조 이미지는 상기 제2 비디오 통신 단말이 수신된 의미 정보에 따라 상기 설정 객체의 재구성 서브 이미지를 획득하고, 상기 재구성 서브 이미지를 상기 제1 참조 이미지와 융합하여, 상기 비디오 이미지의 재구성 이미지를 획득하도록 하기 위한 것인, 비디오 이미지 전송 방법.
- 삭제
- 제12항에 있어서,
상기 방법은,
상기 비디오 이미지 중 설정 객체의 위치 정보를 획득하는 단계; 및
상기 제2 비디오 통신 단말에 상기 위치 정보를 송신하는 단계를 더 포함하되, 상기 위치 정보는 상기 제2 비디오 통신 단말이 상기 위치 정보에 따라 상기 설정 객체의 재구성 서브 이미지를 상기 제1 참조 이미지와 융합하여, 상기 비디오 이미지의 재구성 이미지를 획득하도록 하기 위한 것인, 비디오 이미지 전송 방법. - 제6항 내지 제9항 중 어느 한 항에 있어서,
제2 참조 이미지를 설정된 이미지 전송 모드를 사용하여 상기 제2 비디오 통신 단말에 송신하는 단계를 더 포함하되; 상기 설정된 이미지 전송 모드에서 전송된 상기 제2 참조 이미지의 데이터 양은 상기 의미 정보의 데이터 양보다 크고;
상기 제2 참조 이미지는 상기 설정 객체의 이미지, 상기 제1 비디오 통신 단말의 환경 이미지 중 적어도 하나이며; 상기 제2 참조 이미지는 상기 제2 비디오 통신 단말이 상기 의미 정보 및 상기 제2 참조 이미지에 따라 상기 비디오 이미지의 재구성 이미지를 재구성하도록 하기 위한 것인, 비디오 이미지 전송 방법. - 비디오 이미지 전송 방법으로서,
비디오 이미지의 의미 정보를 수신하되, 상기 비디오 이미지는 회의 환경에서 제1 비디오 통신 단말에 의해 촬영된 비디오 이미지인 단계 - 상기 의미 정보는 설정 객체의 의미 정보이며, 상기 의미 정보는 회의에 참여하는 인물의 얼굴 표정 특징 정보, 몸체 행동 특징 정보를 포함할 수 있고, 상기 의미 정보의 데이터 양은 상기 비디오 이미지의 전체 데이터 양보다 작음 -;
상기 의미 정보 및 트레이닝된 디코더에 따라 이미지를 재구성하여, 상기 비디오 이미지의 재구성 이미지를 획득하는 단계; 및
상기 재구성 이미지를 제2 비디오 통신 단말의 디스플레이 스크린을 통해 디스플레이하는 단계를 포함하되,
상기 의미 정보 및 트레이닝된 디코더에 따라 이미지를 재구성하여, 상기 비디오 이미지의 재구성 이미지를 획득하는 단계는,
N 프레임 간격마다 설정된 이미지 전송 모드를 통해 수신된 제1 참조 이미지를 획득하는 단계 - 상기 제1 참조 이미지는 상기 제1 비디오 통신 단말에 의해 송신되고 이에 의해 촬영된 비디오 이미지임 -; 및
상기 제1 참조 이미지와 상기 의미 정보에 따라 설정 객체의 재구성 서브 이미지를 재구성하고, 상기 설정 객체의 재구성 서브 이미지를 상기 제1 참조 이미지와 융합하여 상기 제1 비디오 통신 단말의 비디오 이미지의 재구성 이미지를 획득하는 단계를 포함하되,
상기 설정된 이미지 전송 모드를 통해 수신된 상기 제1 참조 이미지의 데이터 양은 상기 의미 정보의 데이터 양보다 크고, N은 1보다 큰 것인, 비디오 이미지 전송 방법.
- 삭제
- 제16항에 있어서,
상기 디코더의 입력은 이미지 의미 정보이고, 출력은 입력 의미 정보를 기반으로 재구성된 이미지인, 비디오 이미지 전송 방법. - 제18항에 있어서,
상기 디코더는 콘볼루션 신경망인, 비디오 이미지 전송 방법. - 삭제
- 제16항에 있어서,
상기 설정 객체는 얼굴 또는 몸체를 포함하는, 비디오 이미지 전송 방법. - 제21항에 있어서,
상기 의미 정보 및 트레이닝된 디코더에 따라 이미지를 재구성하여, 상기 비디오 이미지의 재구성 이미지를 획득하는 단계는,
상기 의미 정보 및 상기 제1 참조 이미지에 따라 이미지를 재구성하여, 상기 비디오 이미지의 재구성 이미지를 획득하는 단계를 더 포함하는, 비디오 이미지 전송 방법. - 제22항에 있어서,
N 프레임 간격마다 설정된 이미지 전송 모드를 통해 상기 제1 비디오 통신 단말로부터의 제1 참조 이미지를 수신하는 단계를 더 포함하되; N은 1보다 큰, 비디오 이미지 전송 방법. - 삭제
- 삭제
- 제23항에 있어서,
상기 의미 정보가 얼굴 의미 정보이면, 상기 디코더의 출력을 획득하여, 얼굴의 재구성 서브 이미지를 획득하고;
상기 의미 정보가 몸체 의미 정보이면, 상기 디코더의 출력을 획득하여, 몸체의 재구성 서브 이미지를 획득하는, 비디오 이미지 전송 방법. - 제23항에 있어서,
상기 제1 비디오 통신 단말에 의해 송신된 위치 정보를 수신하는 단계를 더 포함하되, 상기 위치 정보는 상기 비디오 이미지 중 상기 설정 객체의 위치 정보이고;
상기 설정 객체의 재구성 서브 이미지를 상기 제1 참조 이미지와 융합하여, 상기 비디오 이미지의 재구성 이미지를 획득하는 상기 단계는,
상기 위치 정보에 따라 상기 설정 객체의 재구성 서브 이미지를 상기 제1 참조 이미지와 융합하여, 상기 비디오 이미지의 재구성 이미지를 획득하는 단계를 포함하는, 비디오 이미지 전송 방법. - 제27항에 있어서,
상기 제1 비디오 통신 단말에 의해 송신된 위치 정보를 수신하는 상기 단계는,
상기 제1 비디오 통신 단말에 의해 송신된 제1 위치 정보를 수신하되, 상기 제1 위치 정보는 상기 비디오 이미지 중 얼굴 영역의 위치 정보인 단계; 및
상기 제1 비디오 통신 단말에 의해 송신된 제2 위치 정보를 수신하되, 상기 제2 위치 정보는 상기 비디오 이미지 중 몸체 영역의 위치 정보인 단계를 포함하는, 비디오 이미지 전송 방법. - 제27항에 있어서,
상기 위치 정보에 따라 상기 설정 객체의 재구성 서브 이미지를 상기 제1 참조 이미지와 융합하는 단계 이전에,
상기 설정 객체의 재구성 서브 이미지에 대해 에지 페더링 처리를 수행하는 단계를 더 포함하는, 비디오 이미지 전송 방법. - 제21항 내지 제23항 및 제26항 내지 제29항 중 어느 한 항에 있어서,
상기 의미 정보 및 트레이닝된 디코더에 따라 이미지를 재구성하여, 상기 비디오 이미지의 재구성 이미지를 획득하는 단계는,
설정된 이미지 전송 모드를 통해 수신된 제2 참조 이미지를 획득하되, 상기 제2 참조 이미지는 설정 객체의 이미지, 상기 제1 비디오 통신 단말의 환경 이미지 중 적어도 하나이고, 설정된 이미지 전송 모드를 통해 수신된 상기 제2 참조 이미지의 데이터 양은 상기 의미 정보의 데이터 양보다 큰 단계; 및
상기 의미 정보 및 상기 제2 참조 이미지에 따라 이미지를 재구성하여, 상기 비디오 이미지의 재구성 이미지를 획득하는 단계를 포함하는, 비디오 이미지 전송 방법. - 비디오 이미지 전송 방법으로서,
회의 환경에서, 제1 비디오 통신 단말이 촬영된 비디오 이미지를 획득하고, 상기 비디오 이미지의 의미 정보를 획득하여, 상기 의미 정보를 제2 비디오 통신 단말에 송신하고, 상기 비디오 이미지로부터의 제1 참조 이미지를 N 프레임 간격마다 설정된 이미지 전송 모드를 사용하여 상기 제2 비디오 통신 단말에 송신하는 단계 - 상기 제1 참조 이미지는 상기 제1 비디오 통신 단말에 의해 촬영된 비디오 이미지이고 상기 의미 정보는 설정 객체의 의미 정보이며, 상기 의미 정보는 회의에 참여하는 인물의 얼굴 표정 특징 정보, 몸체 행동 특징 정보를 포함할 수 있고, 상기 의미 정보의 데이터 양은 상기 비디오 이미지의 전체 데이터 양보다 작음 -; 및
상기 제2 비디오 통신 단말이 상기 의미 정보 및 상기 제1 참조 이미지를 수신하고, 상기 의미 정보 및 트레이닝된 디코더에 따라 이미지를 재구성하여, 상기 비디오 이미지의 재구성 이미지를 획득하여, 상기 재구성 이미지를 제2 비디오 통신 단말의 디스플레이 스크린을 통해 디스플레이하는 단계를 포함하고,
상기 제1 참조 이미지와 상기 의미 정보는 상기 제2 비디오 통신 단말이 설정 객체의 재구성 서브 이미지를 재구성하도록 하고, 상기 설정 객체의 재구성 서브 이미지를 상기 제1 참조 이미지와 융합하여 상기 제1 비디오 통신 단말의 비디오 이미지의 재구성 이미지를 획득하도록 하되, 상기 설정된 이미지 전송 모드에서 전송된 상기 제1 참조 이미지의 데이터 양은 상기 의미 정보의 데이터 양보다 크고, N은 1보다 큰, 비디오 이미지 전송 방법. - 비디오 이미지 전송 장치로서,
회의 환경에서, 제1 비디오 통신 단말에 의해 촬영된 비디오 이미지를 획득하도록 설치되는 이미지 획득 모듈;
상기 비디오 이미지로부터의 제1 참조 이미지를 N 프레임 간격마다 설정된 이미지 전송 모드를 사용하여 제2 비디오 통신 단말에 송신하도록 설치되는 제1 참조 이미지 송신 모듈 - 상기 제1 참조 이미지는 상기 제1 비디오 통신 단말에 의해 촬영된 비디오 이미지임 -;
트레이닝된 인코더를 통해 상기 비디오 이미지의 의미 정보를 추출하도록 설치되는 정보 추출 모듈 - 상기 의미 정보는 설정 객체의 의미 정보이며, 상기 의미 정보는 회의에 참여하는 인물의 얼굴 표정 특징 정보, 몸체 행동 특징 정보를 포함할 수 있고, 상기 의미 정보의 데이터 양은 상기 비디오 이미지의 전체 데이터 양보다 작음 -; 및
상기 의미 정보를 상기 제2 비디오 통신 단말에 송신하도록 설치되는 송신 모듈을 포함하되,
상기 설정된 이미지 전송 모드에서 전송된 상기 제1 참조 이미지의 데이터 양은 상기 의미 정보의 데이터 양보다 크고, N은 1보다 크며, 상기 제1 참조 이미지와 상기 의미 정보는 상기 제2 비디오 통신 단말이 설정 객체의 재구성 서브 이미지를 재구성하도록 하고, 상기 설정 객체의 재구성 서브 이미지를 상기 제1 참조 이미지와 융합하여 상기 제1 비디오 통신 단말의 비디오 이미지의 재구성 이미지를 획득하도록 하는, 비디오 이미지 전송 장치. - 제32항에 있어서,
상기 인코더는 이미지 의미 정보를 인식하도록 설정되는, 비디오 이미지 전송 장치. - 제33항에 있어서,
상기 인코더의 입력은 이미지이고, 출력은 입력 이미지에 대응되는 저차원 벡터이며, 입력 이미지의 의미 정보로 사용되는, 비디오 이미지 전송 장치. - 삭제
- 제33항에 있어서,
상기 제1 참조 이미지는 상기 제1 비디오 통신 단말에 의해 촬영된 비디오 이미지에 속하고; 상기 제1 참조 이미지는 상기 제2 비디오 통신 단말이 상기 의미 정보 및 상기 제1 참조 이미지에 따라 상기 비디오 이미지의 재구성 이미지를 재구성하도록 하기 위한 것인, 비디오 이미지 전송 장치. - 제33항에 있어서,
제2 참조 이미지를 설정된 이미지 전송 모드를 사용하여 상기 제2 비디오 통신 단말에 송신하도록 설치되는 제2 참조 이미지 송신 모듈을 더 포함하되; 상기 설정된 이미지 전송 모드에서 전송된 상기 제2 참조 이미지의 데이터 양은 상기 의미 정보의 데이터 양보다 크고;
상기 제2 참조 이미지는 상기 설정 객체의 이미지, 상기 제1 비디오 통신 단말의 환경 이미지 중 적어도 하나이며; 상기 제2 참조 이미지는 상기 제2 비디오 통신 단말이 상기 의미 정보 및 상기 제2 참조 이미지에 따라 상기 비디오 이미지의 재구성 이미지를 재구성하도록 하기 위한 것인, 비디오 이미지 전송 장치. - 비디오 이미지 전송 장치로서,
비디오 이미지의 의미 정보를 수신하도록 설치되되, 상기 비디오 이미지는 회의 환경에서 제1 비디오 통신 단말에 의해 촬영된 비디오 이미지인 정보 수신 모듈 - 상기 의미 정보는 설정 객체의 의미 정보이며, 상기 의미 정보는 회의에 참여하는 인물의 얼굴 표정 특징 정보, 몸체 행동 특징 정보를 포함할 수 있고, 상기 의미 정보의 데이터 양은 상기 비디오 이미지의 전체 데이터 양보다 작음 -;
상기 의미 정보 및 트레이닝된 디코더에 따라 이미지를 재구성하여, 상기 비디오 이미지의 재구성 이미지를 획득하도록 설치되는 이미지 재구성 모듈; 및
상기 재구성 이미지를 제2 비디오 통신 단말의 디스플레이 스크린을 통해 디스플레이하도록 설치되는 이미지 디스플레이 모듈을 포함하되,
상기 이미지 재구성 모듈은,
N 프레임 간격마다 설정된 이미지 전송 모드를 통해 수신된 제1 참조 이미지를 획득하도록 설치되되, 상기 제1 참조 이미지는 상기 제1 비디오 통신 단말에 의해 송신되고 이에 의해 촬영된 비디오 이미지이고 - 상기 제1 참조 이미지와 상기 의미 정보는 상기 제2 비디오 통신 단말이 설정 객체의 재구성 서브 이미지를 재구성하도록 하고, 상기 설정 객체의 재구성 서브 이미지를 상기 제1 참조 이미지와 융합하여 상기 제1 비디오 통신 단말의 비디오 이미지의 재구성 이미지를 획득하도록 함 -; 설정된 이미지 전송 모드를 통해 수신된 상기 제1 참조 이미지의 데이터 양은 상기 의미 정보의 데이터 양보다 크며, N은 1보다 큰 제1 참조 이미지 획득 서브 모듈을 포함하는, 비디오 이미지 전송 장치.
- 삭제
- 삭제
- 제38항에 있어서,
상기 이미지 재구성 모듈은,
상기 의미 정보 및 상기 제1 참조 이미지에 따라 이미지를 재구성하여, 상기 비디오 이미지의 재구성 이미지를 획득하도록 설치되는 제1 이미지 재구성 서브 모듈을 더 포함하는, 비디오 이미지 전송 장치. - 제41항에 있어서,
상기 제1 비디오 통신 단말로부터의 제1 참조 이미지를 N 프레임 간격마다 설정된 이미지 전송 모드를 통해 수신하도록 설치되는 제1 참조 이미지 수신 서브 모듈을 더 포함하되; N은 1보다 큰, 비디오 이미지 전송 장치. - 제38항에 있어서,
상기 이미지 재구성 모듈은,
설정된 이미지 전송 모드를 통해 수신된 제2 참조 이미지를 획득하도록 설치되되, 상기 제2 참조 이미지는 설정 객체의 이미지, 상기 제1 비디오 통신 단말의 환경 이미지 중 적어도 하나이고, 설정된 이미지 전송 모드를 통해 수신된 상기 제2 참조 이미지의 데이터 양은 N 프레임 간격마다 설정된 이미지 전송 모드를 통해 상기 의미 정보의 데이터 양보다 큰 제2 참조 이미지 획득 서브 모듈; 및
상기 의미 정보 및 상기 제2 참조 이미지에 따라 이미지를 재구성하여, 상기 비디오 이미지의 재구성 이미지를 획득하도록 설치되는 제2 이미지 재구성 서브 모듈을 포함하는, 비디오 이미지 전송 장치. - 비디오 이미지 전송 시스템으로서,
제1 비디오 통신 단말 및 제2 비디오 통신 단말을 포함하고; 상기 제1 비디오 통신 단말과 제2 비디오 통신 단말 사이는 비디오 통신 연결되며;
상기 제1 비디오 통신 단말은, 회의 환경에서 촬영된 비디오 이미지를 획득하고, 상기 비디오 이미지의 의미 정보를 획득하여, 상기 의미 정보를 제2 비디오 통신 단말에 송신하고, 상기 비디오 이미지로부터의 제1 참조 이미지를 N 프레임 간격마다 설정된 이미지 전송 모드를 사용하여 상기 제2 비디오 통신 단말에 송신하도록 설치되고 - 상기 제1 참조 이미지는 상기 제1 비디오 통신 단말에 의해 촬영된 비디오 이미지이고 상기 의미 정보는 설정 객체의 의미 정보이며, 상기 의미 정보는 회의에 참여하는 인물의 얼굴 표정 특징 정보, 몸체 행동 특징 정보를 포함할 수 있고, 상기 의미 정보의 데이터 양은 상기 비디오 이미지의 전체 데이터 양보다 작음 -;
상기 제2 비디오 통신 단말은, 상기 의미 정보와 상기 제1 참조 이미지를 수신하며, 상기 의미 정보 및 미리 트레이닝된 디코더에 따라 이미지를 재구성하여, 상기 비디오 이미지의 재구성 이미지를 획득하고 - 상기 제1 참조 이미지와 상기 의미 정보는 상기 제2 비디오 통신 단말이 설정 객체의 재구성 서브 이미지를 재구성하도록 하고, 상기 설정 객체의 재구성 서브 이미지를 상기 제1 참조 이미지와 융합하여 상기 제1 비디오 통신 단말의 비디오 이미지의 재구성 이미지를 획득하도록 함 -,
상기 재구성 이미지를 제2 비디오 통신 단말의 디스플레이 스크린을 통해 디스플레이하도록 설치되되,
상기 설정된 이미지 전송 모드에서 전송된 상기 제1 참조 이미지의 데이터 양은 상기 의미 정보의 데이터 양보다 크고, N은 1보다 큰, 비디오 이미지 전송 시스템. - 인터랙티브 지능형 태블릿으로서,
촬영 장치, 디스플레이 스크린, 메모리 및 프로세서를 포함하고, 상기 메모리에는 컴퓨터 프로그램이 저장되며,
상기 인터랙티브 지능형 태블릿은 회의 환경에서 상기 촬영 장치를 통해 비디오 이미지를 촬영하고;
상기 프로세서는 상기 프로그램을 실행할 경우, 상기 촬영 장치에 의해 촬영된 비디오 이미지의 의미 정보를 추출하여, 다른 인터랙티브 지능형 태블릿에 상기 의미 정보를 송신하고, 상기 비디오 이미지로부터의 제1 참조 이미지를 N 프레임 간격마다 설정된 이미지 전송 모드를 사용하여 상기 다른 인터랙티브 지능형 태블릿에 송신하도록 설치되며 - 상기 제1 참조 이미지는 상기 인터랙티브 지능형 태블릿에 의해 촬영된 비디오 이미지이고 상기 의미 정보는 설정 객체의 의미 정보이며, 상기 의미 정보는 회의에 참여하는 인물의 얼굴 표정 특징 정보, 몸체 행동 특징 정보를 포함할 수 있고, 상기 의미 정보의 데이터 양은 상기 비디오 이미지의 전체 데이터 양보다 작음 -;
상기 프로세서는 상기 프로그램을 실행할 경우, 또한 다른 인터랙티브 지능형 태블릿에 의해 송신된 비디오 이미지의 의미 정보와 제1 참조 이미지를 수신하고, 상기 의미 정보 및 트레이닝된 디코더에 따라 이미지를 재구성하여, 다른 인터랙티브 지능형 태블릿에 의해 송신된 비디오 이미지의 재구성 이미지를 획득하고 - 상기 제1 참조 이미지와 상기 의미 정보는 상기 다른 인터랙티브 지능형 태블릿이 설정 객체의 재구성 서브 이미지를 재구성하도록 하고, 상기 설정 객체의 재구성 서브 이미지를 상기 제1 참조 이미지와 융합하여 상기 인터랙티브 지능형 태블릿의 비디오 이미지의 재구성 이미지가 획득하도록 함 -,
상기 재구성 이미지를 상기 디스플레이 스크린을 통해 디스플레이하도록 설치되되,
상기 설정된 이미지 전송 모드에서 전송된 상기 제1 참조 이미지의 데이터 양은 상기 의미 정보의 데이터 양보다 크고, N은 1보다 큰, 인터랙티브 지능형 태블릿. - 컴퓨터 판독 가능 저장 매체로서,
컴퓨터 프로그램을 저장하되, 상기 프로그램은 프로세서에 의해 실행될 경우 제1항 내지 제4항, 제6항 내지 제9항, 제16항, 제18항 내지 제19항, 제21항 내지 제 23항, 및 제26항 내지 제29항 중 어느 한 항에 따른 방법을 구현하는, 컴퓨터 판독 가능 저장 매체.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910063004.7 | 2019-01-23 | ||
CN201910063004.7A CN109831638B (zh) | 2019-01-23 | 2019-01-23 | 视频图像传输方法、装置、交互智能平板和存储介质 |
PCT/CN2019/127770 WO2020151443A1 (zh) | 2019-01-23 | 2019-12-24 | 视频图像传输方法、装置、交互智能平板和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20210100707A KR20210100707A (ko) | 2021-08-17 |
KR102594030B1 true KR102594030B1 (ko) | 2023-10-24 |
Family
ID=66861896
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217021786A Active KR102594030B1 (ko) | 2019-01-23 | 2019-12-24 | 비디오 이미지 전송 방법, 장치, 인터랙티브 지능형 태블릿 및 저장 매체 |
Country Status (7)
Country | Link |
---|---|
US (1) | US12309526B2 (ko) |
EP (1) | EP3902247A4 (ko) |
JP (1) | JP7250937B2 (ko) |
KR (1) | KR102594030B1 (ko) |
CN (1) | CN109831638B (ko) |
AU (1) | AU2019424397B2 (ko) |
WO (1) | WO2020151443A1 (ko) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109831638B (zh) | 2019-01-23 | 2021-01-08 | 广州视源电子科技股份有限公司 | 视频图像传输方法、装置、交互智能平板和存储介质 |
CN110312139A (zh) * | 2019-06-18 | 2019-10-08 | 深圳前海达闼云端智能科技有限公司 | 图像传输的方法和装置、存储介质 |
CN112905132B (zh) * | 2019-11-19 | 2023-07-18 | 华为技术有限公司 | 投屏方法及设备 |
CN111246176A (zh) * | 2020-01-20 | 2020-06-05 | 北京中科晶上科技股份有限公司 | 一种节带化视频传输方法 |
WO2021237464A1 (zh) * | 2020-05-26 | 2021-12-02 | 华为技术有限公司 | 视频图像处理方法及装置 |
CN114868380B (zh) | 2020-11-23 | 2025-06-10 | 京东方科技集团股份有限公司 | 一种虚拟名片的发送方法、装置、系统及可读存储介质 |
US11659193B2 (en) * | 2021-01-06 | 2023-05-23 | Tencent America LLC | Framework for video conferencing based on face restoration |
CN114283091B (zh) * | 2021-12-27 | 2022-08-09 | 国网黑龙江省电力有限公司伊春供电公司 | 基于视频融合的电力设备图像恢复系统 |
CN114401406A (zh) * | 2022-01-25 | 2022-04-26 | 阿里巴巴(中国)有限公司 | 一种面部视频编码方法、解码方法及装置 |
CN114422795A (zh) * | 2022-01-25 | 2022-04-29 | 阿里巴巴(中国)有限公司 | 一种面部视频编码方法、解码方法及装置 |
EP4507310A1 (en) * | 2022-04-05 | 2025-02-12 | Panasonic Intellectual Property Corporation of America | Decoding device, encoding device, decoding method, and encoding method |
KR102573201B1 (ko) * | 2022-08-19 | 2023-09-01 | (주)에이아이매틱스 | 이미지 재건 기술 기반 영상 통신 비용 절감 시스템 및 방법 |
CN115883018A (zh) * | 2022-11-03 | 2023-03-31 | 北京邮电大学 | 语义通信系统 |
CN116132693A (zh) * | 2023-02-07 | 2023-05-16 | 深圳市网联安瑞网络科技有限公司 | 一种视频会议图像传输编码方法、系统及应用 |
CN116847091B (zh) * | 2023-07-18 | 2024-04-26 | 华院计算技术(上海)股份有限公司 | 图像编码方法、系统、设备及介质 |
CN116634178B (zh) * | 2023-07-26 | 2023-10-31 | 清华大学 | 一种极低码率的安防场景监控视频编解码方法及系统 |
CN117292245B (zh) * | 2023-08-02 | 2024-11-26 | 清华大学 | 面向人脸语义编解码的人脸图像的质量评估方法和系统 |
WO2023230638A2 (en) * | 2023-09-06 | 2023-11-30 | Futurewei Technologies, Inc. | Reduced-latency communication using behavior prediction |
CN118368035B (zh) * | 2024-06-20 | 2024-09-27 | 鹏城实验室 | 语义通信方法、装置、设备及存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018201198A (ja) * | 2017-05-26 | 2018-12-20 | Line株式会社 | 映像圧縮方法、映像復元方法及びコンピュータプログラム |
Family Cites Families (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0832947A (ja) * | 1994-07-11 | 1996-02-02 | Hitachi Ltd | 画像通信装置 |
JPH0998416A (ja) * | 1995-09-29 | 1997-04-08 | Denso Corp | 画像信号の符号化装置および画像の認識装置 |
US20040194123A1 (en) * | 2003-03-28 | 2004-09-30 | Eastman Kodak Company | Method for adapting digital cinema content to audience metrics |
CN101141608B (zh) | 2007-09-28 | 2011-05-11 | 腾讯科技(深圳)有限公司 | 一种视频即时通讯系统及方法 |
US8686960B2 (en) | 2010-04-23 | 2014-04-01 | Lester F. Ludwig | Piecewise-linear and piecewise-affine transformations for high dimensional touchpad (HDTP) output decoupling and corrections |
KR20120044732A (ko) * | 2010-10-28 | 2012-05-08 | 지미디어(주) | 벡터그래픽 이미지 파일의 전송 방법 및 시스템 |
KR20130022434A (ko) | 2011-08-22 | 2013-03-07 | (주)아이디피쉬 | 통신단말장치의 감정 컨텐츠 서비스 장치 및 방법, 이를 위한 감정 인지 장치 및 방법, 이를 이용한 감정 컨텐츠를 생성하고 정합하는 장치 및 방법 |
CN102271241A (zh) * | 2011-09-02 | 2011-12-07 | 北京邮电大学 | 一种基于面部表情/动作识别的图像通信方法及系统 |
CN103369289B (zh) | 2012-03-29 | 2016-05-04 | 深圳市腾讯计算机系统有限公司 | 一种视频模拟形象的通信方法和装置 |
KR101347840B1 (ko) * | 2012-03-29 | 2014-01-09 | 한국과학기술원 | 신체 제스처 인식 방법 및 장치 |
US9813666B2 (en) * | 2012-05-29 | 2017-11-07 | Qualcomm Incorporated | Video transmission and reconstruction |
CN103517072B (zh) * | 2012-06-18 | 2017-11-03 | 联想(北京)有限公司 | 视频通信方法和设备 |
US9124765B2 (en) * | 2012-12-27 | 2015-09-01 | Futurewei Technologies, Inc. | Method and apparatus for performing a video conference |
CN103647922A (zh) | 2013-12-20 | 2014-03-19 | 百度在线网络技术(北京)有限公司 | 虚拟视频通话方法和终端 |
US9906691B2 (en) * | 2015-03-25 | 2018-02-27 | Tripurari Singh | Methods and system for sparse blue sampling |
CN106210612A (zh) * | 2015-04-30 | 2016-12-07 | 杭州海康威视数字技术股份有限公司 | 视频编码方法、解码方法及其装置 |
CN105120195B (zh) | 2015-09-18 | 2019-04-26 | 谷鸿林 | 内容录制、再现系统和方法 |
CN106559636A (zh) * | 2015-09-25 | 2017-04-05 | 中兴通讯股份有限公司 | 一种视频通信方法、装置及系统 |
US10225511B1 (en) | 2015-12-30 | 2019-03-05 | Google Llc | Low power framework for controlling image sensor mode in a mobile image capture device |
WO2018061173A1 (ja) * | 2016-09-30 | 2018-04-05 | 株式会社オプティム | Tv会議システム、tv会議方法、およびプログラム |
US10929681B2 (en) * | 2016-11-03 | 2021-02-23 | Nec Corporation | Surveillance system using adaptive spatiotemporal convolution feature representation with dynamic abstraction for video to language translation |
CN106454277B (zh) * | 2016-11-30 | 2019-09-27 | 杭州联络互动信息科技股份有限公司 | 一种用于视频监控的图像分析方法以及装置 |
CN106878268A (zh) * | 2016-12-28 | 2017-06-20 | 杰创智能科技股份有限公司 | 低带宽高质量传输监控图像的方法及系统 |
US10986356B2 (en) * | 2017-07-06 | 2021-04-20 | Samsung Electronics Co., Ltd. | Method for encoding/decoding image and device therefor |
CN107977634A (zh) | 2017-12-06 | 2018-05-01 | 北京飞搜科技有限公司 | 一种针对视频的表情识别方法、装置及设备 |
CN108449569B (zh) * | 2018-03-13 | 2019-04-05 | 重庆虚拟实境科技有限公司 | 虚拟会议方法、系统、装置、计算机装置及存储介质 |
CN109831638B (zh) | 2019-01-23 | 2021-01-08 | 广州视源电子科技股份有限公司 | 视频图像传输方法、装置、交互智能平板和存储介质 |
-
2019
- 2019-01-23 CN CN201910063004.7A patent/CN109831638B/zh active Active
- 2019-12-24 KR KR1020217021786A patent/KR102594030B1/ko active Active
- 2019-12-24 US US17/417,550 patent/US12309526B2/en active Active
- 2019-12-24 WO PCT/CN2019/127770 patent/WO2020151443A1/zh active IP Right Grant
- 2019-12-24 EP EP19911814.2A patent/EP3902247A4/en active Pending
- 2019-12-24 AU AU2019424397A patent/AU2019424397B2/en active Active
- 2019-12-24 JP JP2021542217A patent/JP7250937B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018201198A (ja) * | 2017-05-26 | 2018-12-20 | Line株式会社 | 映像圧縮方法、映像復元方法及びコンピュータプログラム |
Also Published As
Publication number | Publication date |
---|---|
WO2020151443A1 (zh) | 2020-07-30 |
AU2019424397A9 (en) | 2023-04-27 |
JP2022517841A (ja) | 2022-03-10 |
KR20210100707A (ko) | 2021-08-17 |
AU2019424397A1 (en) | 2021-09-09 |
CN109831638B (zh) | 2021-01-08 |
EP3902247A4 (en) | 2022-05-18 |
JP7250937B2 (ja) | 2023-04-03 |
AU2019424397B2 (en) | 2023-04-27 |
US12309526B2 (en) | 2025-05-20 |
EP3902247A1 (en) | 2021-10-27 |
US20220051024A1 (en) | 2022-02-17 |
CN109831638A (zh) | 2019-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102594030B1 (ko) | 비디오 이미지 전송 방법, 장치, 인터랙티브 지능형 태블릿 및 저장 매체 | |
US9030486B2 (en) | System and method for low bandwidth image transmission | |
Liu et al. | Multiple hypotheses Bayesian frame rate up-conversion by adaptive fusion of motion-compensated interpolations | |
WO2024078243A1 (zh) | 视频生成模型的训练方法、装置、存储介质及计算机设备 | |
CN111402399A (zh) | 人脸驱动和直播方法、装置、电子设备及存储介质 | |
CN103597468A (zh) | 用于视频通信系统中改进的交互式内容共享的系统和方法 | |
CN112788235B (zh) | 图像处理方法、装置、终端设备及计算机可读取存储介质 | |
CN117253486A (zh) | 一种基于深度学习的实时多语言处理的直播方法及系统 | |
CN105578110B (zh) | 一种视频通话方法 | |
CN106791574A (zh) | 视频标注方法、装置及视频会议系统 | |
US11877084B2 (en) | Video conference user interface layout based on face detection | |
WO2025007761A1 (zh) | 一种提供数字人的方法、系统及计算设备集群 | |
Sun et al. | Video Conference System in Mixed Reality Using a Hololens. | |
KR20170127354A (ko) | 페이셜 모션 캡쳐를 이용한 얼굴 변환 화상 대화 장치 및 방법 | |
CN110413109A (zh) | 虚拟内容的生成方法、装置、系统、电子设备及存储介质 | |
US20240331296A1 (en) | Using simple masks for online expression | |
CN114915852A (zh) | 视频通话交互方法、装置、计算机设备和存储介质 | |
CN114640882A (zh) | 视频处理方法、装置、电子设备及计算机可读存储介质 | |
CN115695889B (zh) | 显示设备及悬浮窗显示方法 | |
CN118474323B (zh) | 三维图像、三维视频、单眼视图以及训练数据集生成方法、设备、存储介质及程序产品 | |
CN118138708A (zh) | 会议实时交互视频生成方法、装置和会议系统 | |
Brick et al. | High-Presence, Low-Bandwidth Video-conferencing with a Single Camera | |
Brick et al. | High-presence, low-bandwidth, apparent 3D video-conferencing with a single camera | |
CN117676071A (zh) | 音视频增强方法、装置、计算机设备和存储介质 | |
HK40074373A (en) | Method and apparatus for video call interaction, computer device, and storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0105 | International application |
Patent event date: 20210712 Patent event code: PA01051R01D Comment text: International Patent Application |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20220623 Patent event code: PE09021S01D |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20221227 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20230725 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20231020 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20231020 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration |