CN105794197A - 能够生成全景文件的便携式设备 - Google Patents

能够生成全景文件的便携式设备 Download PDF

Info

Publication number
CN105794197A
CN105794197A CN201580002784.4A CN201580002784A CN105794197A CN 105794197 A CN105794197 A CN 105794197A CN 201580002784 A CN201580002784 A CN 201580002784A CN 105794197 A CN105794197 A CN 105794197A
Authority
CN
China
Prior art keywords
panorama
portable set
image
video
panoramic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201580002784.4A
Other languages
English (en)
Inventor
刘子明
曾奎彰
朱启诚
王智鸣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MediaTek Inc
Original Assignee
MediaTek Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by MediaTek Inc filed Critical MediaTek Inc
Publication of CN105794197A publication Critical patent/CN105794197A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4038Image mosaicing, e.g. composing plane images from plane sub-images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/016Input arrangements with force or tactile feedback as computer generated output to the user
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0488Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/166Detection; Localisation; Normalisation using acquisition arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/45Cameras or camera modules comprising electronic image sensors; Control thereof for generating image signals from two or more image sensors being of different type or operating in different modes, e.g. with a CMOS sensor for moving images in combination with a charge-coupled device [CCD] for still images
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/62Control of parameters via user interfaces
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/63Control of cameras or camera modules by using electronic viewfinders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/698Control of cameras or camera modules for achieving an enlarged field of view, e.g. panoramic image capture
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/70Circuitry for compensating brightness variation in the scene
    • H04N23/73Circuitry for compensating brightness variation in the scene by influencing the exposure time
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/80Camera processing pipelines; Components thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/90Arrangement of cameras or camera modules, e.g. multiple cameras in TV studios or sports stadiums
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/04Synchronising
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • H04N5/2624Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects for obtaining an image which is composed of whole input images, e.g. splitscreen
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/01Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level
    • H04N7/0127Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level by changing the field or frame frequency of the incoming video signal, e.g. frame rate converter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone
    • H04N7/147Communication arrangements, e.g. identifying the communication as a video-communication, intermediate storage of the signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/18Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
    • H04N7/188Capturing isolated or intermittent images triggered by the occurrence of a predetermined event, e.g. an object reaching a predetermined position

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Studio Devices (AREA)
  • Stereoscopic And Panoramic Photography (AREA)

Abstract

一种能够生成全景图、全景视频和/或全景音频的便携式设备。所述便携式设备包括多个传感器和输入装置,所述多个传感器具有重叠的感测区域,所述输入装置接收触发信号,所述触发信号触发所述多个传感器来感测数据,以生成全景照片/视频/音频文件。

Description

能够生成全景文件的便携式设备
相关申请的交叉引用
本申请要求2014年7月28日递交的申请号为62/029,657的美国临时案的优先权,在此合并参考该申请案的申请标的。
技术领域
本发明涉及一种能够生成全景照片/视频/音频文件的便携式设备。
背景技术
传统上,全景照片是由智能手机的单一摄像头(例如,后置摄像头)拍摄的多幅照片来产生的。它可能需要较长的时间来由单一摄像头捕捉所有的照片,这是非常不方便。
因此需要一种便携式设备,可以方便地生成全景照片、全景视频、或全景音频文件。
发明内容
根据本发明的一实施例的一种便携式设备,包括具有重叠感测区域(overlappingsensingareas)的多个传感器和接收触发信号的输入装置,该触发信号触发该多个传感器以感测数据,以产生全景文件。该全景文件可以是全景照片/视频/音频文件。
在一实施例中,该便携式设备还包括全景图像处理器,该多个传感器包括用于捕捉多个图像的多个图像传感器。全景图像处理器处理(如,图像标准化)该多个图像,以形成全景图。
该便携式设备还可以包括运动传感模块,在拍摄图像时,该运动传感模块收集有关该便携式设备的运动信息。全景图像处理器可以处理图像,以形成基于运动信息的全景图。
在一实施例中,该多个图像传感器连续捕捉图像以记录视频,该视频被全景图像处理器处理以生成全景视频。
在一实施例中,该多个传感器还包括多个麦克风。该多个麦克风录制声音(sounds),用于产生全景音频,全景音频随全景视窗(panoramicviewwindow)而变化。可根据用于同步视频和音频的时间戳将声音封包(pack)到全景视频中。
下面的实施例中参考附图给出了详细的说明。
附图说明
通过阅读随后的详细描述与附图,可以更充分地理解本发明,其中:
图1为能够构建全景照片/视频/音频文件的便携式设备100的框图。
图2为便携式设备100周围的720°视场/声场(720°fieldofview/sound)。
图3为720°全景图的扩展视图。
图4A-4F为根据本发明一实施例的用于产生全景照片/视频/音频文件的便携式设备中的传感器的布置的示意图。
图5为本发明一实施例的智能手机上的左侧、右侧、底部和顶部的摄像头/麦克风如何在智能手机周围覆盖360°的感测区域的示意图。
图6为根据本发明另一实施例的如何在智能手机周围覆盖360°的感测区域的示意图。
图7A、7B和7C为关于便携式设备的姿势信息,偏航(yaw)、俯仰(pitch)和横滚(roll),可用于处理由摄像头/麦克风捕捉的信号。
图8为通过不同摄像机拍摄的图像的纹理编码的流程图。
图9A为大图像900被步骤804中的大图像纹理编码进行处理的示意图,以及图9B为由不同的摄像机捕捉的图像被步骤806中的单个摄像机的纹理编码分别处理的示意图。
图10A列出了图9A中的组合图像的有效载荷字节的示例格式,以及图10B列出了图9B中单独的图像的有效载荷字节的示例格式。
图11为根据本发明一实施例的解封包和解码处理的流程图。
图12为根据本发明一实施例的全景数据流的数据结构的示意图。
图13显示不同的用户可以使用他们的智能手机在建筑不同的地方拍摄全景照片的示意图。
图14为全景图像处理器106的操作流程图。
图15为讨论步骤1406的图像对准、图像组合和图像提取的实施例。
图16A、图16B、和图16C分别显示了球形浏览模式、圆柱形浏览模式和立方体(cubic)浏览模式。
图17为根据触摸屏上的用户触摸改变全景视窗的实施例。
图18显示了在本发明根据由图像传感器IS1-ISN或超声波传感器来捕捉的用户生成的手势改变全景视窗的实施例。
图19显示了根据由图像传感器IS1-ISN捕捉的眼球运动(另一种用户生成的动作)改变全景视窗的实施例。
图20显示了根据由运动传感模块110检测到的便携式设备100的运动(例如,空间移位)改变全景视窗的实施例
图21显示了便携式设备100具有内置的姿势控制系统130,姿势控制系统130作为远程控制以检测用户生成的手势以及通过无线通信(如Wi-Fi或蓝牙)或电缆连接(如USB)将手势指令传递至显示装置2100(如电视、电脑或任何其他类型的显示装置)。
图22显示了具有在视频会议中追踪用户的脸的视频会议系统132的便携式设备100的实施例。
图23为全景音频处理器136操作的流程图。
图24为根据本发明一实施例的具有全景视窗View_W的720°全景图以及移动全景视窗View_W以形成显示图像,全景音频随着全景视窗而改变。
图25为描述如何根据头相关传输函数生成立体声的流程图。
图26为根据用于同步音频和视频的时间戳2600将由麦克风M1-MM记录的声音封包至全景视频的示意图。
图27为解复用包含视频和音频数据的比特流以及根据时间戳分别解码和显示的示意图。
具体实施方式
下面的描述为实施本发明的示范性实施例。以下实施例仅用来说明本发明的一般原理,并非用来限制本发明的范围。本发明的范围应以权利要求书所界定的为准。
图1为能够构建全景照片/视频/音频文件的便携式设备100的框图。根据全景照片、全景视频或全景音频文件建立的全景图,可以提供超过180度的视场(FOV)/声场(FOS)。
便携式设备100包括:多个图像传感器(如摄像机)IS1、IS2…ISN,多个麦克风M1、M2…MM,以及显示单元104中的至少一个或其组合。当用户操作触发功能(例如,对显示在触摸屏上的快门/触发图标的单一触摸,或对快门/触发按钮的单一的按压)以生成全景照片/视频/音频文件时,图像传感器IS1-ISN可被触发以捕捉图像或录制视频,或麦克风M1-MM可被触发以记录声音。在一些实施例中,当用户操作触发功能以生成全景照片/视频/音频文件时,图像传感器IS1-ISN和麦克风M1-MM可被同时触发。图像传感器IS1-ISN有重叠的视场(overlappingfieldsofview)。例如,至少一对相邻的图像传感器对应于重叠的感测区域。麦克风M1-MM具有重叠的声场(overlappingfieldsofsound)。例如,至少一对相邻的麦克风对应重叠的感测区域。
在一实施例中,为生成全景照片/视频文件,全景图像处理器106耦接到图像传感器IS1-ISN的图像信号处理器108,以处理N个图像以形成全景图。在一些实施例中,全景图像处理器106可以进一步标准化该N个图像以形成全景图。例如,自适应全景图像处理器106可以标准化该N个图像的配置,以使该N个图像的配置(例如,镜头设置、感光度(ISO)设置、图像分辨率、与该N个图像相关的任何其他设置,或上述设置的组合)相同或相似,然后,基于标准化的N个图像以形成全景图。图14为全景图像处理器106(但不限于此)执行的生成全景照片/视频文件的操作流程图,显示了标准化图像的例子,包括标准化的镜头差异或图像差异(感光度差异、摄像机分辨率差异等)。运动传感模块110可以耦接到全景图像处理器106。当图像被捕捉时,运动传感模块110可以收集有关便携式设备100的运动信息,例如,便携式设备100的姿势或移动。全景图像处理器106在处理该N个图像的过程中,会参考运动信息。全景图像处理器106可以通过个便携式设备100的显示处理器116耦接到图像编码器112和视频编码器114。当图像传感器IS1-ISN只进行了一次拍摄(onephotoshoot)时,全景照片的文件是由图像编码器112来产生的。当图像传感器IS1-ISN正在录制视频时,一系列的全景图可以被视频编码器114编码以作为全景视频文件。被便携式设备100的定位模块118检测到的便携式设备100的位置或高度信息,可被封包至全景照片/视频文件中,这样,根据便携式设备100的位置或高度信息,全景照片/视频文件可被集成到由相邻的便携式设备所产生的另一全景照片/视频文件中。因此,可以形成具有更广的视场的全景照片/视频。
该便携式设备100可以进一步包括全景显示处理器120。全景显示处理器120可提供全景图(或全景视频)至驱动集成电路122,这样驱动集成电路122可驱动显示单元104显示全景图(或全景视频)。
在一些实施例中,在显示单元104上显示的全景图或者全景视频可以从存储设备获得,而不是从图像传感器IS1-ISN直接传送。从存储设备得到的全景图和全景视频可以分别通过图像解码器124和视频解码器126进行解码,然后通过显示处理器116,全景显示处理器120被操作以提供全景图或全景视频,使得驱动集成电路122驱动显示单元104来显示全景图或全景视频。全景图或全景视频的全景视窗(panoramicviewwindow)可以通过用户控制器128来调整。
此外,便携式设备100可以进一步包括手势控制系统130或使用全景照片拍摄技术的视频会议系统132。手势控制系统130从所捕捉的全景视频中提取用户生成的手势,并根据用户生成的手势控制目标设备。视频会议系统132从全景视频中提取用户的脸的图像,以将全景视窗聚焦到用户的脸上。
在一实施例中,为生成全景音频文件,由麦克风M1-MM采集的多个声音信号被便携式设备100的音频编解码器134编码,并作为单独的文件存储到存储设备中。当生成随全景视窗而改变的全景音频时,单独的声音文件可被音频编解码器134读取和解码。便携式设备100包括全景音频处理器136,根据依赖于全景视窗的可变加权因子,通过全景音频处理器136总结出(summedup)单独的声音文件,从而全景音频可由便携式设备100的扬声器138生成。
图2为便携式设备100周围的720°的视场/声场的一实施例。720°的视场/声场可通过至少一个平面来定义(例如,平面1、平面2、平面3或其他平面,或它们的组合)。在本实施例中,720°的场可参照2个360°的场,其中每一个360°的场对应于一个平面。图像传感器IS1-ISN或麦克风M1-MM可设置在便携式设备100上并对应于至少一个平面。
图3为720°全景图720_panorama的扩展视图的示意图。如图所示,720°全景图720_panoramais从多个图像形成。在显示单元104上显示的显示图像,可以通过移动720°全景图720_panorama上的全景视窗View_w来确定。例如,利用全景视窗View_w,可以选择720°全景图720_panorama的区域,使得将被显示在显示单元104上的显示图像可根据选定的区域来生成。根据全景视窗View_w的位置,可分别产生左声道音频Audio_l和右声道音频Audio_r,这样一来,全景音频的左声道音频Audio_l和右声道音频Audio_r的内容可随着全景视窗View_w的运动而变化。
图4A-4F为根据本发明一实施例的用于产生全景照片/视频/音频文件的便携式设备中的传感器的布置的示意图。在该实施例中,传感器(例如,图像传感器IS1、IS2…ISN或麦克风M1、M2…MM)可设置在便携式设备的不同的侧面。参考图4A,从便携式设备的左视图(由箭头Left_View表示)可以看出,便携式设备的左侧可具有左摄像头L_C或左麦克风L_M。参考图4B,从便携式设备的右视图(由箭头Right_View表示)可以看出,便携式设备右侧可具有右摄像头Right_C或右麦克风Right_M。参考图4C,从便携式设备的俯视图(由箭头Top_View表示)可以看出,便携式设备的顶部可具有顶部摄像头T_C或顶部麦克风T_M。参考图4D,从便携式设备的仰视图(由箭头Bottom_View表示)可以看出,便携式设备的底部可具有底部摄像头B_C或底部麦克风B_M。参考图4E,从便携式设备的正视图,便携式设备的正面可具有前置摄像头F_C或前置麦克风F_M。参考图4F,从便携式设备的后视图,便携式设备的后面可具有后置摄像头Rear_C或后置麦克风Rear_M。根据图4A-图4F的传感器布置,便携式设备能够在便携式设备周围的720°视场/声场中生成全景照片/视频/音频文件。便携式设备的某些侧面或所有这六个侧面的摄像头可具有不同的配置(non-identicalconfigurations),例如,不同的ISO值、不同的像素分辨率、不同的像素类型、不同的帧率或其组合。由于不同的配置,图1中的全景图像处理器106可以进一步执行一些调整(如,依据不同硬件配置进行对应的标准化)。在另一实施例中,可在便携式设备的六个侧面中的一部分或全部中设置闪光模块。多个闪光模块可具有不同的光强度。此外,声音文件的采样率也可以是不同的,图1的全景音频处理器136可以进一步调整(如标准化)采样率。
在一些其他实施例中,安装在便携式设备100上的摄像头/麦克风的布置的形式可以为覆盖全景视场/声场,而不限于720°。摄像头/麦克风的布置需被精心设计,不应被限制为本实施例所示的方式。
图5为便携式设备上的左侧、右侧、底部和顶部的摄像头/麦克风如何在便携式设备周围覆盖360°的感测区域(sensingarea)的一实施例。如图所示,顶部的摄像头/麦克风和左侧的摄像头/麦克风具有重叠的感测区域A1,左侧的摄像头/麦克风和底部的摄像头/麦克风具有重叠的感测区域A2,底部的摄像头/麦克风和右侧的摄像头/麦克风具有重叠的感测区域A3,以及右侧的摄像头/麦克风和顶部的摄像头/麦克风具有重叠的感测区域A4。在圆以外是360°的有效感测区域。
图6为根据本发明另一实施例的如何在便携式设备周围覆盖360°的感测区域的示意图。在便携式设备的正面,可能具有两个摄像头/麦克风,而不是只有一个单一的摄像头/麦克风。因此,正面的视场可以有效地扩展。同样地,在便携式设备的后面可具有两个摄像头/麦克风,以及后面的视场可以有效地扩展。
图7A、7B和7C为关于便携式设备的姿势信息,偏航(yaw)、俯仰(pitch)和横滚(roll),可用于处理由摄像头/麦克风捕捉的信号。例如,全景图像处理器106可以根据姿势信息来进行图像处理,以保证将形成全景图的图像对准(align)到相同的参考(例如,右边缘面向东,底部边缘均对准水平面,或在被对准后面向同一个方向)。可为图像对准而旋转捕捉的图像(例如,捕捉的图像可被旋转,以使形成全景图的所有图像的右边缘都朝东,或使形成全景图的所有图像的底部边缘对准水平面)。即使在图像传感器IS1-ISN的捕捉期间便携式设备100有移动,通过这样的图像处理,全景图或全景视频的图像质量可能不会受到影响。加速度传感器(Gsensor)、磁性传感器(MagneticSensor)、陀螺仪或任何其他能够感测姿势信息的传感器,可以感测到姿势信息(包括偏航、俯仰或横滚)。图1中的运动传感模块110可以包括加速度传感器、磁性传感器、陀螺仪、任何其他能够感测姿势信息的传感器、或其组合。
图8为通过不同摄像机拍摄的图像的纹理编码的流程图。当在步骤802中检查到,全景图像处理器106正处理由不同的摄像机(IS1-ISN)捕捉的图像以形成组合图像(combinedimage),由不同的摄像机(IS1-ISN)捕捉的图像被作为单一的大图像(singlelargeimage)进行处理,以及在步骤804中执行大图像纹理编码(large-imagetexturecoding)。当在步骤802中检查到,由不同的摄像机(IS1-ISN)捕捉的图像形成的组合图像被(例如,全景图像处理器106)提供时,由不同的摄像机(IS1-ISN)捕捉的图像被逐一进行处理。在步骤806中,每次对一个图像执行纹理编码。图9A为大图像900(或称为组合图像)被步骤804中的大图像纹理编码进行处理的示意图。与图9A相比较,图9B为由不同的摄像机捕捉的单独的图像(separateimages)被步骤806中的单个摄像机的纹理编码分别处理的实施例。
在一些示例性实施例中,在步骤806中,不同的编码器用于不同的摄像机使用。在一些实施例中,JPEG、GIF、PNG等可用于图像的纹理编码,以及MPEG-1、MPEG-2、MPEG-4、WMV、AVS、H.261、H.263、H.264、H.265、VP6、VP8和VP9等的静态轮廓(stillprofile)可用于视频的纹理编码。
封包子系统(packingsub-system)可用于封包产生的全景数据。封包子系统将来自不同传感器的子数据流(sub-streams)多路复用(multiplex)为一个。在发送端,一些有用的信息可被封包成数据流,例如,摄像机/传感器的总数、麦克风的总数、图像/视频的分辨率、或其组合。在一个实施例中,使用H.264的补充增强信息(supplementalenhancementinformation,SEI)。未注册SEI消息语法的用户数据显示出用户数据的有效载荷字节(payloadbytes)。图10A列出了图9A中的组合图像的有效载荷字节的示例格式。图10B列出了图9B中单独的图像的有效载荷字节的示例格式,在有效载荷之前,包括摄像机的总数和麦克风的总数,以及根据摄像机ID和麦克风ID将单独的图像数据和音频数据封包数据流中。通用唯一标识符(universaluniqueidentifier)可被进一步编码到有效载荷字节的开始处。在一些其他实施例中,上述格式可以不同,不应该被限制在本发明所揭露的实施例中。
在一些示范性实施例中,解封包和解码可以是上述封包和编码过程的反向函数。图11为根据本发明一实施例的解封包和解码处理的流程图。当接收到全景数据流时,在步骤1102中检查分辨率模式。当分辨率模式显示在全景数据流中包含组合传感数据(如图9A所示的组合图像)时,执行步骤1104以解封包数据流,以及其中包含的视频或音频在步骤1106和步骤1108中分别被解码。当分辨率模式显示在全景数据流包含单独的传感数据(如图9B所示的单独的图像),执行步骤1110以分别得到摄像机的数量、麦克风的数量或其他信息,根据在步骤1110中所获得的信息,对单独的视频或单独的音频执行步骤1112的解封包、步骤1114的视频解码、步骤1116的音频解码。
图12为根据本发明一实施例的全景数据流的数据结构的示意图。来自运动传感模块110或定位模块118的传感器数据,例如,方向传感器数据、位置传感器数据、微压力传感器数据(pressuremicrosensordata)或任何其他运动传感器相关的数据,可被附加或插入到全景数据流的图像数据中。图13显示了几个相邻的便携式设备被用来在几个地方拍摄全景照片的场景。全景照片可发送到云数据库,并可根据来自运动传感模块110或定位模块118的传感器数据组合在一起。因此,在某些实施例中,可以建立这些便携式设备周围的现实世界的真实的三维模块。三维模块可以进一步包含每个元素(例如,每个像素或三维模块中的任何其他元素)的纬度、经度、高度和颜色的信息。
图14为根据本发明一实施例的全景图像处理器106(不限于此)执行的用于生成全景照片/视频文件的操作的流程图。步骤1402可使图像传感器IS1-ISN的镜头之间的差异相关。在某些实施例中,可建立镜头相关的映射表。在步骤S1404,执行图像校正处理,以校正由图像传感器IS1-ISN捕捉的照片/视频由于图像传感器IS1-ISN之间的不同配置而产生的影响。这些配置可包括:ISO值、分辨率、帧速率、可能会影响到由图像传感器IS1-ISN捕捉的照片/视频的其他配置、或它们的组合。在一示例性实施例中,使用1200万(12M)像素的前置摄像头和800万(8M)像素的后置摄像头,在步骤1404中,由前置摄像头拍摄的图像的分辨率从1200万像素被缩小到800万像素。在一个示例性实施例中,前置摄像头的ISO设置为1200以及后置摄像头的ISO设置为100,在步骤1404中,由前置摄像头拍摄的图像可以从ISO(如,ISO1200)混合到低ISO(如,ISO100)。在步骤S1406中,可执行图像对准、图像合成和图像提取,以对准不同图像的方向、将多个图像组合成单一图像、以及提取全景图。图像对准处理(eimagealignmentprocess)几何对准在不同的条件下(例如,不同的视角、不同的深度、不同的捕捉时间、不同的传感器、任何其他条件或其组合)捕捉的两个图像。图像对准处理的算法可包括:特征检测(如,检测的边缘、轮廓线、角(corner)、或任何其他类型的特征);特征匹配(例如,建立两个图像的对应关系);以及基于特征对应的图像对准。在步骤1408中,图像旋转处理可以根据来自运动传感模块110的运动传感器数据旋转全景图。在一些示例性实施例中,图像旋转过程还可以旋转全景图用以对象跟踪(objecttracking)。
图15为讨论步骤1406的图像对准、图像组合和图像提取的实施例。两个不同的摄像机捕捉的图像1502和图像1504具有重叠区域1506。在步骤1406的图像对准、图像组合和图像提取后,生成全景图1508。
在一些示例性实施例中,在提取图像特征点(imagefeaturepoints)后,可以根据所提取的特征点执行图像变形处理(imagewarpingprocess)。此外,可执行图像内插以得到更大的全景图。
在下面的段落中讨论的全景照片/视频/音频的显示。
图16A、图16B、和图16C分别显示了球形浏览模式、圆柱形浏览模式和立方体(cubic)浏览模式。全景体验可以提供上述任何浏览模式。
在图16A的球形浏览模式中,假定视角周围的环境在一系列图像中被拍摄,该一系列图像覆盖住所有的360度空间,根据球形上的所选区域可产生将被显示在显示单元104上的显示图像。
在图16B的圆柱形浏览模式中,假定摄像机位于典型的位置,其中视轴(opticaxis)与z轴对准以及y轴为垂直的。拍摄照片时,光线穿过镜头,落在摄像机的图像平面(imageplane)上。图片(picture)被投影到图像平面上。根据圆柱形上的选定区域可产生将被显示在显示单元104上的显示图像。
在图16C的立方体浏览模式中,假定视角周围的环境在一系列图像中被拍摄,该一系列图像穿过表面从三个轴向(x,y和z)投影。多边形基于其法线方向(normaldirection)收到特定投影。根据立方体上的选定区域可产生将被显示在显示单元104上的显示图像。
当驱动显示单元104用于全景显示时,全景显示处理器120可以根据全景视窗的改变来改变显示单元104上的显示图像。
图17显示了根据用户的触摸,在便携式设备100的触摸屏上从位置P1移动到位置P2,改变全景视窗(从View_w_P1到View_w_P2)的实施例。换句话说,用户可以滑动便携式设备100的触摸屏来调整显示在显示单元104上的全景视窗。图18显示了在本发明根据用户生成的手势,从位置P1移至P2,改变全景视窗(从View_w_P1到View_w_P2)的实施例。在一实施例中,上述用户生成的手势可以由图像传感器IS1-ISN或超声波传感器来检测。图19显示了根据眼球运动(从位置P1到位置P2,另一种用户生成的动作)改变全景视窗(从View_w_P1到View_w_P2)的实施例,所述眼球运动可以由图像传感器IS1-ISN来捕捉。图20显示了根据便携式设备100的运动(例如,从位置P1到位置P2的空间移位或倾斜)改变全景视窗(从View_w_P1到View_w_P2)的实施例,便携式设备100的运动可以通过运动传感模块110来检测。
全景显示处理器120可驱动显示单元104在单一视角(singleview)或多视角(multipleviews)中显示全景文件。例如,在多视角模式中,可以有几个全景视窗来选择全景文件的若干区域,以使对应于这些选定区域的图像可以显示在显示单元104上。
图21显示了便携式设备100具有内置的姿势控制系统130,姿势控制系统130作为远程控制以检测用户生成的手势以及通过无线通信(如Wi-Fi或蓝牙)或电缆连接(如USB)将手势指令传递至显示设备2100(如电视、电脑或任何其他类型的显示装置)。由于便携式设备100的全景照片拍摄能力,用户可以通过在任何地方的便携式设备100控制目标设备(如显示设备2100)。在另一个示例性实施例中,便携式设备100本身可以是用户手势控制的目标设备。在一个示例性实施例中,该目标设备上的光标根据便携式设备100检测到的用户生成的手势移动。
图22显示了具有在视频会议中追踪用户的脸的视频会议系统132的便携式设备100的实施例。由于全景照片拍摄能力,即使用户在会议室里走动,用户的脸部也可以被便携式设备100正确地捕捉。在一些实施例中,该便携式设备100可以捕捉包含人脸或某些选定的在固定位置上的物体的全景照片/视频。
图23为根据本发明一实施例的全景音频处理器136(不限于此)执行的用于生成全景音频文件的操作的流程图。在步骤2302中,当便携式设备100已被切换到全景模式时,在步骤2304中,决定显示位置(如全景视窗)。在步骤2306中,不同的麦克风(如M1-MM)感测的声音信号被混合在一起,以形成对应于显示位置的全景音频。在步骤2308中,扬声器138制造混合声音。在一些示范性实施例中,有多个扬声器用于播放多声道音频。每个扬声器发出的声音因显示位置而异。
图24为根据本发明一实施例的720°全景图720_panorama以及移动全景视窗View_W以形成显示图像。720°全景图720_panorama是通过组合分别由便携式设备100的左摄像头(如图4A的摄像头)、前置摄像头(如图4E的摄像头)和底部的摄像头(如图4D的摄像头)所捕捉的图像而形成的。根据全景视窗,设置左麦克风(如图4A的麦克风)贡献的音频对应的因子Aleft、前面的麦克风(如图4E的麦克风)贡献的音频对应的因子Afront和底部的麦克风(如图4D的麦克风)贡献的音频对应的因子Abottom。在一些实施例中,该因子Aleft、Afront和Abottom可分别根据全景视窗View_W内对应的区域来确定。例如,如果全景视窗View_W内对应于因子Aleft的区域最大,因子Aleft、Afront和Abottom中的最大权重值可被分配到的因子Aleft。由单一扬声器138播放的全景音频可以是Sp,如下:
Sp=(Sleft*Aleft+Sfront*Afrontt+Sbottom*Abottom)/(Aleft+Afrontt+Abottom);
Sleft是由左麦克风先前记录的声音,Sfront是由前面的麦克风先前记录的声音以及Sbottom是由底部的麦克风先前记录的声音。在一些实施例中,可进一步处理全景音频Sp以产生多声道扬声器信号,给多声道扬声器播放。
在另一个实施例中,为了模仿立体音频(stereoaudio),头相关传递函数(head-relatedtransferfunction,HRTF)被用来模拟从不同方向的双声道声音,但不限于,双耳式耳机。头相关传输函数可以是预定义的函数或是在线训练的。图25为描述如何根据头相关传输函数生成立体声的流程图。在步骤2502中,便携式设备100切换到全景模式,在步骤2504中,不同的麦克风M1-MM记录来自不同方向的声音。在步骤2506中,根据预先定义的函数集建立头相关传递函数。在步骤2508中,基于头相关传递函数,对记录的声音进行插值。在步骤2510,在步骤2508中产生的用于提供全景体验的声音信号输出至立体声扬声器以发出相应的声音。
图26为根据用于同步音频和视频的时间戳2600将由麦克风M1-MM记录的声音封包至全景视频的示意图。
图27为解复用包含视频和音频数据的比特流以及根据时间戳分别解码和显示的示意图。在图27中,当全景视频随着便携式设备100的运动而改变时,进一步引入依赖传感器控制2704的音频和视频同步控制2702,以保持音频和视频之间的同步。传感器控制2704是基于由运动传感模块110检测的信息。
本发明虽以较佳实施例揭露如上,然其本非用以限制本发明的范围。本领域的技术人员,在不脱离本发明之精神和范围内,当可作出各种替换或改变。因此,本发明的范围应以权利要求书及其均等范围所界定为限。

Claims (20)

1.一种便携式设备,其特征在于,包括:
具有重叠感测区域的多个传感器;以及
输入装置,接收触发信号,所述触发信号触发所述多个传感器来感测数据,以生成全景文件。
2.如权利要求1所述的便携式设备,其特征在于,还包括:
全景图像处理器,
其中,所述多个传感器包括用于捕捉多个图像的多个图像传感器,所述多个图像传感器具有重叠的视场;以及所述全景图像处理器处理所述多个图像以形成全景图。
3.如权利要求2所述的便携式设备,其特征在于,还包括:
运动传感模块,当所述多个图像被捕捉时,采集所述便携式设备的运动信息,
其中所述全景图像处理器处理所述多个图像,以形成基于所述运动信息的所述全景图。
4.如权利要求2所述的便携式设备,其特征在于,还包括:
定位模块,当所述多个图像被捕捉时,检测所述便携式设备的位置或高度信息,根据所述便携式设备的所述位置或高度信息,所述全景图被集成到由相邻的便携式设备产生的另一个全景图中。
5.如权利要求2所述的便携式设备,其特征在于,
所述图像传感器连续捕捉图像,以记录将被所述全景图像处理器处理的视频,用以生成全景视频。
6.如权利要求5所述的便携式设备,其特征在于,
所述多个传感器还包括具有重叠的声场的多个麦克风;以及
所述麦克风记录声音,用于产生随着全景视窗而改变的全景音频。
7.如权利要求6所述的便携式设备,其特征在于,
根据用于同步视频和音频的时间戳将所述声音封包至所述全景视频中。
8.如权利要求6所述的便携式设备,其特征在于,还包括:
扬声器;以及
全景音频处理器,根据所述全景视窗驱动所述扬声器以输出所述声音。
9.如权利要求8所述的便携式设备,其特征在于,
当驱动所述扬声器播放全景音频时,所述全景音频处理器通过依赖于所述全景视窗的可变加权因子来加权多个声音文件。
10.如权利要求5所述的便携式设备,其特征在于,还包括:
视频会议系统,从所述全景视频中提取用户的脸的图像,以将全景视窗聚焦到所述用户的脸上。
11.如权利要求5所述的便携式设备,其特征在于,还包括:
手势控制系统,从所述全景视频中提取手势以控制目标设备。
12.如权利要求5所述的便携式设备,其特征在于,所述全景图像处理器调整所述多个图像传感器的帧速率。
13.如权利要求2所述的便携式设备,其特征在于,还包括:
全景显示处理器和显示单元;
其中,所述全景显示处理器提供所述显示单元显示的所述全景图。
14.如权利要求13所述的便携式设备,其特征在于,
当所述显示单元被驱动为全景显示时,所述全景显示处理器根据全景视窗的改变来改变所述显示单元上的显示图像。
15.如权利要求14所述的便携式设备,其特征在于,
所述显示单元为触摸屏,以及根据所述触摸屏上的触摸操作改变所述全景视窗。
16.如权利要求14所述的便携式设备,其特征在于,
根据所述多个图像传感器中的至少一个捕捉的手势来改变所述全景视窗。
17.如权利要求14所述的便携式设备,其特征在于,还包括:
超声波传感器;
其中,根据所述超声波传感器检测到的手势来改变所述全景视窗。
18.如权利要求14所述的便携式设备,其特征在于,还包括:
运动传感模块;
其中,根据所述运动传感模块检测到的所述便携式设备的运动来改变所述全景视窗。
19.如权利要求2所述的便携式设备,其特征在于,
所述全景图像处理器执行图像传感器之间的镜头相关、处理所述多个图像的感光度值或分辨率、对准所述多个图像、或组合所述多个图像,以提取所述全景图。
20.如权利要求2所述的便携式设备,其特征在于,所述全景图依据由所述多个图像形成的单帧来个别编码。
CN201580002784.4A 2014-07-28 2015-07-28 能够生成全景文件的便携式设备 Pending CN105794197A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201462029657P 2014-07-28 2014-07-28
US62/029,657 2014-07-28
PCT/CN2015/085298 WO2016015624A1 (en) 2014-07-28 2015-07-28 Portable device capable of generating panoramic file

Publications (1)

Publication Number Publication Date
CN105794197A true CN105794197A (zh) 2016-07-20

Family

ID=55216770

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201580002784.4A Pending CN105794197A (zh) 2014-07-28 2015-07-28 能够生成全景文件的便携式设备
CN201580002783.XA Pending CN105814880A (zh) 2014-07-28 2015-07-28 具有自适应全景图像处理器的便携式设备

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201580002783.XA Pending CN105814880A (zh) 2014-07-28 2015-07-28 具有自适应全景图像处理器的便携式设备

Country Status (3)

Country Link
US (2) US10419668B2 (zh)
CN (2) CN105794197A (zh)
WO (2) WO2016015624A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106162206A (zh) * 2016-08-03 2016-11-23 北京疯景科技有限公司 全景录制、播放方法及装置
CN106296819A (zh) * 2016-08-12 2017-01-04 北京航空航天大学 一种基于智能机顶盒的全景视频播放器
CN107846534A (zh) * 2017-09-18 2018-03-27 努比亚技术有限公司 一种摄像头和拍照方法
CN112422808A (zh) * 2019-08-23 2021-02-26 阿里巴巴集团控股有限公司 照片的获取、媒体对象的处理方法及装置

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10924668B2 (en) 2011-09-19 2021-02-16 Epilog Imaging Systems Method and apparatus for obtaining enhanced resolution images
US10419668B2 (en) * 2014-07-28 2019-09-17 Mediatek Inc. Portable device with adaptive panoramic image processor
EP3340649B1 (en) * 2015-08-21 2020-04-29 Sony Corporation Projection system and apparatus unit
KR102576908B1 (ko) * 2016-02-16 2023-09-12 삼성전자주식회사 동적 파노라마 기능을 제공하는 방법 및 장치
CN106060652A (zh) * 2016-06-08 2016-10-26 北京中星微电子有限公司 一种视频码流中全景信息的标识方法和标识装置
EP3494692A1 (en) * 2016-08-04 2019-06-12 Epilog Imaging Systems Method and apparatus for obtaining enhanced resolution images
US10999602B2 (en) 2016-12-23 2021-05-04 Apple Inc. Sphere projected motion estimation/compensation and mode decision
CN106791437B (zh) * 2017-01-20 2020-02-14 维沃移动通信有限公司 一种全景图像拍摄方法及移动终端
US11259046B2 (en) 2017-02-15 2022-02-22 Apple Inc. Processing of equirectangular object data to compensate for distortion by spherical projections
US10924747B2 (en) 2017-02-27 2021-02-16 Apple Inc. Video coding techniques for multi-view video
TWI679875B (zh) * 2017-05-25 2019-12-11 鈺立微電子股份有限公司 用於產生360度深度圖的影像裝置
US11093752B2 (en) 2017-06-02 2021-08-17 Apple Inc. Object tracking in multi-view video
US10754242B2 (en) 2017-06-30 2020-08-25 Apple Inc. Adaptive resolution and projection format in multi-direction video
US20190005709A1 (en) * 2017-06-30 2019-01-03 Apple Inc. Techniques for Correction of Visual Artifacts in Multi-View Images
US10872581B2 (en) * 2017-07-27 2020-12-22 Apple Inc. Electronic devices with orientation compensation
US10599205B2 (en) * 2017-09-18 2020-03-24 Verizon Patent And Licensing Inc. Methods and systems for managing machine learning involving mobile devices
US10459622B1 (en) * 2017-11-02 2019-10-29 Gopro, Inc. Systems and methods for interacting with video content
CN108881731B (zh) * 2018-08-06 2021-07-02 Oppo广东移动通信有限公司 全景拍摄方法、装置和成像设备
US11032590B2 (en) 2018-08-31 2021-06-08 At&T Intellectual Property I, L.P. Methods, devices, and systems for providing panoramic video content to a mobile device from an edge server
CN109089083A (zh) * 2018-09-01 2018-12-25 哈尔滨工程大学 一种基于有限带宽的全景数据多模式处理方法
CN113365013A (zh) * 2020-03-06 2021-09-07 华为技术有限公司 一种音频处理方法及设备
CN113365012A (zh) * 2020-03-06 2021-09-07 华为技术有限公司 一种音频处理方法及设备
US11249637B1 (en) * 2020-03-11 2022-02-15 Meta Platforms, Inc. User interface information enhancement based on user distance
US12069121B1 (en) * 2021-12-21 2024-08-20 Ringcentral, Inc. Adaptive video quality for large-scale video conferencing

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101146231A (zh) * 2007-07-03 2008-03-19 浙江大学 根据多视角视频流生成全景视频的方法
CN101771830A (zh) * 2008-12-30 2010-07-07 华为终端有限公司 立体全景视频流生成方法、设备及视频会议方法和设备
CN101902571A (zh) * 2009-05-27 2010-12-01 索尼公司 图像拍摄装置、电子设备、全景图像记录方法及程序
CN102263926A (zh) * 2010-05-31 2011-11-30 鸿富锦精密工业(深圳)有限公司 电子设备及其图像处理方法
WO2013162585A1 (en) * 2012-04-26 2013-10-31 Intel Corporation Multiple lenses in a mobile device
CN103873764A (zh) * 2012-12-11 2014-06-18 索尼公司 信息处理装置、信息处理方法及程序
CN102216959B (zh) * 2008-11-19 2015-08-12 苹果公司 用于操纵全景的技术

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6639596B1 (en) * 1999-09-20 2003-10-28 Microsoft Corporation Stereo reconstruction from multiperspective panoramas
US7010158B2 (en) * 2001-11-13 2006-03-07 Eastman Kodak Company Method and apparatus for three-dimensional scene modeling and reconstruction
JP2007292828A (ja) * 2006-04-21 2007-11-08 Sony Corp 光量調整装置及び撮像装置
CN101378559A (zh) 2007-08-30 2009-03-04 联想移动通信科技有限公司 采用摄像头组合全景拍的手机
US20090290033A1 (en) * 2007-11-16 2009-11-26 Tenebraex Corporation Systems and methods of creating a virtual window
CN101252687B (zh) * 2008-03-20 2010-06-02 上海交通大学 实现多通道联合的感兴趣区域视频编码及传输的方法
US8355042B2 (en) * 2008-10-16 2013-01-15 Spatial Cam Llc Controller in a camera for creating a panoramic image
CN102124320A (zh) * 2008-06-18 2011-07-13 苏尔吉克斯有限公司 用于将多个图像拼接成全景图像的方法和系统
CN101487838B (zh) 2008-12-11 2012-12-05 东华大学 一种异形纤维的尺度形状特征的提取方法
WO2010075726A1 (zh) * 2008-12-30 2010-07-08 华为终端有限公司 立体全景视频流生成方法、设备及视频会议方法和设备
US20100265313A1 (en) * 2009-04-17 2010-10-21 Sony Corporation In-camera generation of high quality composite panoramic images
KR20110052124A (ko) * 2009-11-12 2011-05-18 삼성전자주식회사 파노라마 이미지 생성 및 조회 방법과 이를 이용한 휴대 단말기
CN101872113B (zh) 2010-06-07 2014-03-19 中兴通讯股份有限公司 一种全景照片的拍摄方法及设备
CN102521814B (zh) * 2011-10-20 2014-09-10 华南理工大学 基于多聚焦融合和图像拼接的无线传感网络图像融合方法
KR101389841B1 (ko) * 2012-05-16 2014-04-29 주식회사바텍 파노라마 영상 데이터 제공 방법 및 장치
US9583133B2 (en) * 2012-06-11 2017-02-28 Sony Corporation Image generation device and image generation method for multiplexing captured images to generate an image stream
US10021295B1 (en) * 2013-06-03 2018-07-10 Amazon Technologies, Inc. Visual cues for managing image capture
FR3006841B1 (fr) * 2013-06-07 2015-07-03 Kolor Fusion de plusieurs flux video
US20150085184A1 (en) * 2013-09-25 2015-03-26 Joel Vidal Smartphone and tablet having a side-panel camera
US9432720B2 (en) * 2013-12-09 2016-08-30 Empire Technology Development Llc Localized audio source extraction from video recordings
JP2015194587A (ja) * 2014-03-31 2015-11-05 ソニー株式会社 画像データ処理装置、画像データ処理方法、画像歪み対応処理装置、画像歪み対応処理方法
US10419668B2 (en) * 2014-07-28 2019-09-17 Mediatek Inc. Portable device with adaptive panoramic image processor
SE538494C2 (sv) * 2014-11-07 2016-08-02 BAE Systems Hägglunds AB Omvärldsuppfattningssystem och förfarande för omvärldsuppfattning i stridsfordon
US20170150212A1 (en) * 2015-11-23 2017-05-25 Le Holdings (Beijing) Co., Ltd. Method and electronic device for adjusting video

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101146231A (zh) * 2007-07-03 2008-03-19 浙江大学 根据多视角视频流生成全景视频的方法
CN102216959B (zh) * 2008-11-19 2015-08-12 苹果公司 用于操纵全景的技术
CN101771830A (zh) * 2008-12-30 2010-07-07 华为终端有限公司 立体全景视频流生成方法、设备及视频会议方法和设备
CN101902571A (zh) * 2009-05-27 2010-12-01 索尼公司 图像拍摄装置、电子设备、全景图像记录方法及程序
CN102263926A (zh) * 2010-05-31 2011-11-30 鸿富锦精密工业(深圳)有限公司 电子设备及其图像处理方法
WO2013162585A1 (en) * 2012-04-26 2013-10-31 Intel Corporation Multiple lenses in a mobile device
TW201405234A (zh) * 2012-04-26 2014-02-01 Intel Corp 行動裝置內的多個透鏡
CN103873764A (zh) * 2012-12-11 2014-06-18 索尼公司 信息处理装置、信息处理方法及程序

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106162206A (zh) * 2016-08-03 2016-11-23 北京疯景科技有限公司 全景录制、播放方法及装置
CN106296819A (zh) * 2016-08-12 2017-01-04 北京航空航天大学 一种基于智能机顶盒的全景视频播放器
CN107846534A (zh) * 2017-09-18 2018-03-27 努比亚技术有限公司 一种摄像头和拍照方法
CN112422808A (zh) * 2019-08-23 2021-02-26 阿里巴巴集团控股有限公司 照片的获取、媒体对象的处理方法及装置

Also Published As

Publication number Publication date
WO2016015624A1 (en) 2016-02-04
CN105814880A (zh) 2016-07-27
WO2016015623A1 (en) 2016-02-04
US20170272698A1 (en) 2017-09-21
US10187569B2 (en) 2019-01-22
US10419668B2 (en) 2019-09-17
US20170272649A1 (en) 2017-09-21

Similar Documents

Publication Publication Date Title
CN105794197A (zh) 能够生成全景文件的便携式设备
US11259009B2 (en) Modular configurable camera system
US11688034B2 (en) Virtual lens simulation for video and photo cropping
US10659683B2 (en) Rolling shutter synchronization
JPWO2017200049A1 (ja) 撮像装置およびその設定画面
US20050185047A1 (en) Method and apparatus for providing a combined image
CN107507243A (zh) 一种摄像机参数调整方法、导播摄像机及系统
US20110157394A1 (en) Image processing apparatus, image processing method and program
JP5347802B2 (ja) 構図制御装置、撮像システム、構図制御方法、プログラム
WO2021147921A1 (zh) 图像处理方法、电子设备及计算机可读存储介质
US10165186B1 (en) Motion estimation based video stabilization for panoramic video from multi-camera capture device
TW201734948A (zh) 用於在廣角圖像系統中生成相關的音頻和視覺信號的方法、系統及設備
JP2018033107A (ja) 動画の配信装置及び配信方法
JP7393245B2 (ja) 撮像装置及びその制御方法、プログラム、記憶媒体
JP5098917B2 (ja) 構図判定装置、構図判定方法、プログラム
KR102559619B1 (ko) 자동 촬영을 위한 서버, 시스템 및 전자 장치를 이용한 자동 촬영 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20160720

WD01 Invention patent application deemed withdrawn after publication