WO2016184193A1 - 媒体文件生成方法和装置 - Google Patents

媒体文件生成方法和装置 Download PDF

Info

Publication number
WO2016184193A1
WO2016184193A1 PCT/CN2016/073957 CN2016073957W WO2016184193A1 WO 2016184193 A1 WO2016184193 A1 WO 2016184193A1 CN 2016073957 W CN2016073957 W CN 2016073957W WO 2016184193 A1 WO2016184193 A1 WO 2016184193A1
Authority
WO
WIPO (PCT)
Prior art keywords
image
audio
preset
media file
file
Prior art date
Application number
PCT/CN2016/073957
Other languages
English (en)
French (fr)
Inventor
庞宁
Original Assignee
中兴通讯股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 中兴通讯股份有限公司 filed Critical 中兴通讯股份有限公司
Publication of WO2016184193A1 publication Critical patent/WO2016184193A1/zh

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/80Camera processing pipelines; Components thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/432Query formulation
    • G06F16/433Query formulation using audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/432Query formulation
    • G06F16/434Query formulation using image data, e.g. images, photos, pictures taken by a user
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/44Browsing; Visualisation therefor
    • G06F16/447Temporal browsing, e.g. timeline

Definitions

  • the preset audio is acquired in the shooting mode; the image is captured at the time point on the time axis of the preset audio; and the mapping relationship between the captured image and the time point on the time axis of the preset audio is established.
  • FIG. 4 is a block diagram 2 of an optional structure of a media file generating apparatus according to an embodiment of the present invention.
  • FIG. 6 is a block diagram 4 of an optional structure of a media file generating apparatus according to an embodiment of the present invention.
  • FIG. 11 is a schematic diagram of a 3D photo browsing method in accordance with an alternative embodiment of the present invention.
  • FIG. 1 is a flowchart of a method for generating a media file according to an embodiment of the present invention. As shown in FIG. 1, the process includes the following steps:
  • Step S104 capturing an image at a time point on a time axis of the preset audio
  • Step S106 establishing a mapping relationship between the captured image and a time point on a time axis of the preset audio
  • a control for instructing to generate a media file may be displayed in the photographing mode, and an instruction for triggering the generation of the media file by the user by triggering the control is received, and the generated media is used according to the instruction.
  • the command of the file captures an image at a point in time on the time axis of the preset audio.
  • the media file may be viewed, and according to the preset carried by the media file.
  • the mapping of the preset identifier indication is performed, and the corresponding image is displayed at a corresponding time point of playing the preset audio. For example, determining whether the read file is a media file carrying the preset identifier, and determining that the file is When the media file carrying the preset identifier is carried, the preset audio is played, and when the time point on the time axis of the preset audio is played, the corresponding image is displayed according to the mapping relationship; and the read file is also determined. In the case of carrying a media file with a preset identifier, the user is prompted to select whether to play the preset audio.
  • the image taken above may be a three-dimensional image.
  • a media file generating device is further provided, which is used to implement the foregoing embodiments and preferred embodiments, and is not described again.
  • the term “module” may implement a combination of software and/or hardware of a predetermined function.
  • the apparatus described in the following embodiments is preferably implemented in software, hardware, or a combination of software and hardware, is also possible and contemplated.
  • the apparatus includes: an obtaining module 22, a shooting module 24, an establishing module 26, and a generating module 28, wherein the acquiring module 22 is configured.
  • FIG. 3 is a block diagram of an optional structure of a media file generating apparatus according to an embodiment of the present invention.
  • the obtaining module 22 includes: a reading unit 32 and a clipping unit 34, wherein the reading unit 32. Set to read an audio file indicated by the storage path according to a storage path input by the user; the editing unit 34 is coupled to the reading unit 32 and configured to edit the audio file to obtain preset audio.
  • FIG. 4 is a block diagram of an optional structure of a media file generating apparatus according to an embodiment of the present invention.
  • the shooting module 24 includes: a first receiving unit 42 and a shooting unit 44, wherein the first The receiving unit 42 is configured to receive an instruction for instructing to generate a media file; the photographing unit 44 is coupled to the first receiving unit 42 and configured to time on a time axis of the preset audio according to an instruction for instructing generation of the media file Take a picture at the point.
  • each of the above modules may be implemented by software or hardware.
  • the foregoing may be implemented by, but not limited to, the foregoing modules are all located in the same processor; or, the modules are located in multiple In the processor.
  • Embodiments of the present invention also provide a software for performing the technical solutions described in the above embodiments and preferred embodiments.
  • Step S102 in the shooting mode, acquiring preset audio
  • Step S104 capturing an image at a time point on a time axis of the preset audio
  • Step S108 Generate a media file carrying an image and a preset identifier, where the preset identifier is used to indicate that the image has a mapping relationship with the preset audio.
  • a captured image as a three-dimensional image (ie, a 3D photo) as an example. It should be noted that the captured image may also be a two-dimensional image, which is not limited in this embodiment.
  • a photographing mode is further provided, and the main interface of the photographing mode may include: Add options for recording and adding music.
  • Step 14 When the add recording function is turned on, when the 3D photo is taken, the recording start and end switches appear on the interface, and the audio information is recorded while the 3D photo is taken, and the photo and the audio information are mapped (corresponding to the above a mapping relationship), binding save;
  • Step 16 When the add music function is enabled, select the music to be added (equivalent to the above preset audio), and take a 3D photo, or select a corresponding 3D photo, and select one or more photos, and simultaneously take the photo Establish a mapping relationship with music information, and save the binding.
  • the method for viewing an image includes the following steps:
  • Step 22 for the 3D photo without identification, directly through the 3D display screen
  • Step 24 for the photo with the logo, if the user does not want to listen to the audio information (equivalent to the above-mentioned preset audio), and directly click on the audio to view the 3D photo directly;
  • Step 26 For the identified 3D photo, if the user wants to listen to the audio information, click the icon to open, if it is the recorded audio information, the 3D picture is viewed while the recording information is played; if it is a music file, the music is played simultaneously. Display photo information and automatically display multiple or one.
  • the optional embodiment of the present invention mainly implements a 3D photographing method with an audio function by using a left and right camera unit, an audio receiving unit, a 3D imaging unit, an image audio processing unit, a storage unit, a display unit, an audio playing unit, and the like, and changes the current media.
  • a single form and scattered content will bring a better user experience to users.
  • FIG. 7 is a structural block diagram of a media file generating apparatus according to an alternative embodiment of the present invention. As shown in FIG. 7, the apparatus includes:
  • the audio receiving unit 704 is configured to add audio information
  • the 3D imaging unit 706 is coupled to the left and right imaging unit 702, and is configured to process the photos taken by the left and right cameras to obtain a 3D image;
  • the image audio processing unit 708 is coupled to the audio receiving unit 704 and the 3D imaging unit 706, and is configured to establish a corresponding mapping relationship between the 3D photo and the audio;
  • a storage unit 710 coupled to the image audio processing unit 708, configured to store the bound 3D photo and audio information
  • the display unit 712 is coupled to the storage unit 710 and configured to display a 3D image
  • An audio playback unit 714 coupled to the storage unit 710, configured to play an audio file
  • FIG. 8 is a schematic diagram of a 3D photographing method according to an alternative embodiment of the present invention. As shown in FIG. 8, the method includes the following steps:
  • Step S802 entering a 3D photographing mode, if there is no need to add an audio file, directly performing shooting of the 3D photo;
  • FIG. 9 is a first schematic diagram of a method for generating a media file according to an alternative embodiment of the present invention. As shown in FIG. 9, the method includes the following steps:
  • Step S904 determining whether to add audio information
  • Step S906 if no audio information is added, directly take a 3D photo and save it;
  • Step S908 if adding audio information, determining whether to add a music file
  • step S910 if no music file is added, the recording information is added, the recording is started, the photographing is started, the recording of the set length is ended, or the recording can be manually ended;
  • step S912 if a music file is added, the music to be added is selected, and after the selection, the music can be fast-forwarded, rewinded, and the like;
  • step S914 starting the photographing at the added music point, multiple photos can be continuously taken, and the end of the music is ended when the photographing ends.
  • An optional embodiment of the present invention provides a method for generating a media file in combination with a method for generating a 3D photo.
  • a photo of the left and right views can be obtained by the left and right cameras, and the two views are processed to obtain a 3D image and an audio file
  • FIG. 10 is a media file generating method according to an alternative embodiment of the present invention. Schematic 2, as shown in FIG. 10, the method includes the following steps:
  • Step S1002 taking a photo of the left view through the left camera
  • Step S1004 taking a right view photo through the right camera
  • Step S1006 using the binocular stereo vision algorithm, using the acquired left and right views, calculating and obtaining the three-dimensional depth information to generate a 3D photo, the file is stored in the form of multi-dimensional coding, and the audio information is inserted into the code as one dimension;
  • step S1008 the data of the 3D photo and the encoding of the audio data are multi-dimensionally integrated, and one dimension is added to the multi-dimensional data matrix of the original 3D photo to store the audio information, and the entire data is uniformly stored and read.
  • the related information is processed, the mapping relationship between the 3D photo and the audio is established, and the photo information and the audio information are bound by the corresponding mapping table, and are uniformly stored in the storage unit.
  • An optional embodiment of the present invention further provides a browsing method for a 3D photo, wherein the 3D photo in this embodiment refers to a media file generated according to an embodiment of the present invention.
  • 11 is a schematic diagram of a 3D photo browsing method according to an alternative embodiment of the present invention. As shown in FIG. 11, the method includes the following steps:
  • Step S1102 open the gallery to view the 3D photo
  • Step S1104 determining whether the audio information is included in the 3D photo, the photo containing the audio information has a logo bit identifier in the storage, and the special thumbnail icon is also displayed on the thumbnail display interface of the photo;
  • Step S1108 determining whether the audio file is recorded information or music information, and the two different audio information are distinguished by the identifier when storing;
  • Step S1110 if it is recording information, the user can play through the play switch on the interface. If the play switch is turned on, the recorded audio information is played while the 3D photo is displayed, and the audio is automatically switched to the next group after the audio playback is completed, or Users can also manually switch to the next group;
  • step S1112 if the audio file is music information, the user can also play through the play switch on the interface. After the switch is turned on, the one or more 3D photos that are bound are displayed while playing the music, and the music is automatically switched after the music is played. Go to the next group, or the user can manually switch to the next group.
  • a file generation mode is newly added, which can firstly capture, store, and display photos (eg, 3D photos), and can add audio information to the photos.
  • photos eg, 3D photos
  • the audio information added for the photo can include both recording and music, and has different operations and processing processes for different forms, with better scalability and ease of use.
  • the corresponding mapping relationship between photo and audio information is established, and the binding processing, storage and display are performed, so that a group of media information has higher integrity; and when the audio and photo are bound, the limitation is not limited to one photo, but also It is a plurality of photos, which form a set of content for the bound information, and has a richer form in the display and playback; finally, the detailed information such as the classification and duration of the audio file is analyzed and processed, so that the whole process is more complete and comprehensive. .
  • modules or steps of the present invention described above can be implemented by a general-purpose computing device that can be centralized on a single computing device or distributed across a network of multiple computing devices. Alternatively, they may be implemented by program code executable by the computing device such that they may be stored in the storage device by the computing device and, in some cases, may be different from the order herein. Perform the steps shown or described, or make them into individual integrated circuit modules, or make multiple of them. A single integrated circuit module is implemented. Thus, the invention is not limited to any specific combination of hardware and software.
  • the preset audio is acquired in the shooting mode; the image is captured at the time point on the time axis of the preset audio; and the mapping relationship between the captured image and the time point on the time axis of the preset audio is established.

Abstract

本发明提供了一种媒体文件生成方法和装置。其中,该方法包括:在拍摄模式下,获取预设音频;在预设音频的时间轴上的时间点上拍摄图像;建立拍摄的图像与预设音频的时间轴上的时间点的映射关系;生成携带有图像和预设标识的媒体文件,其中,预设标识用于指示图像与预设音频存在映射关系。通过本发明,解决了相关技术中拍照和添加音频文件在时间上相互隔离导致的用户体验差的问题,实现了拍照和添加音频文件在时间上的同步,提升了用户体验。

Description

媒体文件生成方法和装置 技术领域
本发明涉及通信领域,具体而言,涉及一种媒体文件生成方法和装置。
背景技术
目前的拍摄技术中,在拍照时只能生成图像文件,不能在拍照过程中对图像文件添加音频记录,而只能在拍照完成之后,通过后期的编辑软件对照片添加文字、音频等信息。这种照片生成过程和音频信息添加过程在时间上相互隔离的情况,导致用户在后期为照片添加音频信息时,已然没有了拍摄照片时的感觉和兴致,使得拍照的过程缺少了趣味性。
针对相关技术中拍照和添加音频文件在时间上相互隔离导致的用户体验差的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种媒体文件生成方法和装置,以至少解决相关技术中拍照和添加音频文件在时间上相互隔离导致的用户体验差的问题。
根据本发明实施例的一个方面,提供了一种媒体文件生成方法,包括:在拍摄模式下,获取预设音频;在所述预设音频的时间轴上的时间点上拍摄图像;建立拍摄的所述图像与所述预设音频的所述时间轴上的所述时间点的映射关系;生成携带有所述图像和预设标识的媒体文件,其中,所述预设标识用于指示所述图像与所述预设音频存在所述映射关系。
可选地,获取所述预设音频包括:根据用户输入的存储路径,读取所述存储路径指示的音频文件;剪辑所述音频文件,得到所述预设音频。
可选地,拍摄所述图像包括:接收用于指示生成所述媒体文件的指令;根据用于指示生成所述媒体文件的指令,在所述预设音频的所述时间轴上的所述时间点上拍摄所述图像。
可选地,生成携带有所述图像和所述预设标识的所述媒体文件包括:接收编辑指令,其中,所述编辑指令用于调整所述图像与所述预设音频的所述时间轴上所述时间点的对应关系,并更新所述映射关系;生成携带有所述图像和所述预设标识的所述媒体文件,其中,所述预设标识用于指示所述图像与所述预设音频存在更新后的所述映射关系。
可选地,生成携带有所述图像和所述预设标识的所述媒体文件还包括:生成所述媒体文件,其中,所述媒体文件为携带有所述图像、所述预设音频、所述映射关系和所述预设标识的一个媒体文件。
可选地,在生成携带有所述图像和所述预设标识的所述媒体文件之后,所述方法还包 括:读取文件,并判断所述文件是否为携带有所述预设标识的所述媒体文件;在判断到所述文件为携带有所述预设标识的所述媒体文件的情况下,播放所述预设音频,并在播放到所述预设音频的所述时间轴上的所述时间点时,根据所述映射关系显示对应的图像。
可选地,所述图像包括三维图像。
根据本发明实施例的另一个方面,还提供了一种媒体文件生成装置,包括:获取模块,设置为在拍摄模式下,获取预设音频;拍摄模块,设置为在所述预设音频的时间轴上的时间点上拍摄图像;建立模块,设置为建立拍摄的所述图像与所述预设音频的所述时间轴上的所述时间点的映射关系;生成模块,设置为生成携带有所述图像和预设标识的媒体文件,其中,所述预设标识用于指示所述图像与所述预设音频存在所述映射关系。
可选地,所述获取模块包括:读取单元,设置为根据用户输入的存储路径,读取所述存储路径指示的音频文件;剪辑单元,设置为剪辑所述音频文件,得到所述预设音频。
可选地,所述拍摄模块包括:第一接收单元,设置为接收用于指示生成所述媒体文件的指令;拍摄单元,设置为根据用于指示生成所述媒体文件的指令,在所述预设音频的所述时间轴上的所述时间点上拍摄所述图像。
可选地,所述生成模块包括:第二接收单元,设置为接收编辑指令,其中,所述编辑指令用于调整所述图像与所述预设音频的所述时间轴上所述时间点的对应关系,并更新所述映射关系;生成单元,设置为生成携带有所述图像和所述预设标识的所述媒体文件,其中,所述预设标识用于指示所述图像与所述预设音频存在更新后的所述映射关系。
可选地,所述生成模块还设置为;生成所述媒体文件,其中,所述媒体文件为携带有所述图像、所述预设音频、所述映射关系和所述预设标识的一个媒体文件。
可选地,所述装置还包括:第一处理模块,设置为读取文件,并判断所述文件是否为携带有所述预设标识的所述媒体文件;第二处理模块,设置为在判断到所述文件为携带有所述预设标识的所述媒体文件的情况下,播放所述预设音频,并在播放到所述预设音频的所述时间轴上的所述时间点时,根据所述映射关系显示对应的图像。
通过本发明实施例,采用在拍摄模式下,获取预设音频;在预设音频的时间轴上的时间点上拍摄图像;建立拍摄的图像与预设音频的时间轴上的时间点的映射关系;生成携带有图像和预设标识的媒体文件,其中,预设标识用于指示图像与预设音频存在映射关系的方式,解决了相关技术中拍照和添加音频文件在时间上相互隔离导致的用户体验差的问题,实现了拍照和添加音频文件在时间上的同步,提升了用户体验。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的媒体文件生成方法的流程图;
图2是根据本发明实施例的媒体文件生成装置的结构框图;
图3是根据本发明实施例的媒体文件生成装置的可选结构框图一;
图4是根据本发明实施例的媒体文件生成装置的可选结构框图二;
图5是根据本发明实施例的媒体文件生成装置的可选结构框图三;
图6是根据本发明实施例的媒体文件生成装置的可选结构框图四;
图7是根据本发明可选实施例的媒体文件生成装置的结构框图;
图8是根据本发明可选实施例的3D拍照方法的示意图;
图9是根据本发明可选实施例的媒体文件生成方法的示意图一;
图10是根据本发明可选实施例的媒体文件生成方法的示意图二;
图11是根据本发明可选实施例的3D照片浏览方法的示意图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
在本实施例中提供了一种媒体文件生成方法,图1是根据本发明实施例的媒体文件生成方法的流程图,如图1所示,该流程包括如下步骤:
步骤S102,在拍摄模式下,获取预设音频;
步骤S104,在预设音频的时间轴上的时间点上拍摄图像;
步骤S106,建立拍摄的图像与预设音频的时间轴上的时间点的映射关系;
步骤S108,生成携带有图像和预设标识的媒体文件,其中,预设标识用于指示图像与预设音频存在映射关系。
通过上述步骤,在拍照模式下,获取到用户选择的预设音频,在播放预设音频的同时拍摄图像,获取拍摄的图像在音频中的对应关系,建立预设音频时间轴上的时间点与图像的映射关系,再生成携带有图像和用于指示图像与预设音频间存在映射关系的标识的媒体文件。可见,采用上述步骤,解决了相关技术中拍照和添加音频文件在时间上相互隔离导致的用户体验差的问题,实现了拍照和添加音频文件在时间上的同步,提升了用户体验。
需要说明的是,在本发明的实施例及可选实施例中,媒体文件是指存储了媒体形式的文件,可以是存储了一种媒体形式的文件,例如,图像文件、音频文件,也可以是存储了多种媒体形式的文件,例如,视频文件、多媒体文件(图像、音频同时存储的文件)。
可选地,上述方法可以应用于用户设备,例如,手机,平板电脑,相机设备,以及可以进行图像拍摄的设备等。
可选地,在上述步骤S102中,预设音频可以通过编辑导入的音频文件获得,可以根据用户输入的存储路径,读取存储路径下的音频文件,再对音频文件进行剪辑,得到预设音频,例如,在拍摄模式下,提示用户可以选择音频文件的存储路径,根据用户选择的存储路径获取音频文件,再为用户提供对音频文件的编辑选项,比如,可以通过对音频的开始标记和结束标记的移动对音频文件进行截取,并且在截取后,也可以为用户提供试听和进行再次编辑,根据用户的编辑对音频文件进行剪辑,得到预设音频。可见,通过上述步骤,可以使用户根据喜好对音频文件进行编辑以获取预设音频,提高了用户体验度,同时解决了相关技术中拍照和添加音频文件在时间上相互隔离导致的用户体验差的问题,实现了拍照和添加音频文件在时间上的同步,提升了用户体验。
可选地,在上述步骤S104中,可以在拍照模式下显示用于指示生成媒体文件的控件,接收到用户通过触发上述控件发出的用于指示生成媒体文件的指令,并根据用于指示生成媒体文件的指令,在预设音频的时间轴上的时间点上拍摄图像。可见,通过上述步骤可以为用户提供是否生成媒体文件的选择,在用户选择生成媒体文件的情况下,在预设音频的时间轴上的时间点上拍摄图像,否则,直接进行拍摄,提高了用户的体验度。
可选地,在上述步骤S108中,用户可以对建立的拍摄的图像与预设音频的时间轴上的时间点的映射关系进行编辑,在接收到用于调整图像与预设音频的时间轴上时间点的对应关系,并更新映射关系的编辑指令后,生成携带有图像和用于指示图像与预设音频存在更新后的映射关系的预设标识的媒体文件,例如,为用户提供对映射关系进行编辑的控件,比如,用户可以在预设音频的时间轴上拖动拍摄的图像至其他时间点,接收到用户操作的编辑指令后,将根据拍摄的图像与预设音频的时间轴上时间点的新的对应关系更新映射关系,并生成携带有拍摄的图像以及用于指示图像与音频间存在更新后的映射关系的预设标识的媒体文件。可见,通过上述步骤,用户可以对图像与音频的映射关系进行编辑,根据喜好在预设音频时间轴上的特定的时间点上显示特定的图像,提高了用户的体验度。
可选地,在上述步骤S108中,生成的媒体文件可以是同时携带有图像、预设音频、映射关系和预设标识的一个媒体文件,例如,在媒体文件的第一区域存储拍摄的图像,在媒体文件的第二区域存储预设音频,在媒体文件的第三区域存储映射关系,在媒体文件的第四区域存储用于指示图像与预设音频存在映射关系的预设标识。可见,通关上述步骤,可以将图像、预设音频、映射关系、预设标识整合在一个媒体文件中,避免了由于分别存储图像与音频可能导致的调用错误,同时提高了资源的聚合度,使用户能够得到更高的体验度。
可选地,在上述步骤S108之后,可以对媒体文件进行查看,并根据媒体文件携带的预设 标识读取预设标识指示的映射关系,在播放预设音频的相应时间点上显示对应的图像,例如,判断读取到的文件是否为携带有预设标识的媒体文件,在判断到文件为携带有预设标识的媒体文件的情况下,播放预设音频,并在播放到预设音频的时间轴上的时间点时,根据映射关系显示对应的图像;还可以在判断到读取的文件为携带有预设标识的媒体文件的情况下,提示用户是否选择播放预设音频,在用户选择播放预设音频时,在播放到预设音频的时间轴上的时间点时,根据映射关系显示对应的图像,在用户选择不播放预设音频时,直接显示图像。可见,通过上述步骤,使用户可以在收听预设音频的同时浏览图像,同时为用户提供了是否播放预设音频的选择,提高了用户体验度。
可选地,上述拍摄的图像可以是三维图像。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例的方法。
在本实施例中还提供了一种媒体文件生成装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图2是根据本发明实施例的媒体文件生成装置的结构框图,如图2所示,该装置包括:获取模块22、拍摄模块24、建立模块26和生成模块28,其中,获取模块22,设置为在拍摄模式下,获取预设音频;拍摄模块24,设置为在预设音频的时间轴上的时间点上拍摄图像;建立模块26,耦合至拍摄模块24,设置为建立拍摄的图像与预设音频的时间轴上的时间点的映射关系;生成模块28,耦合至建立模块26,设置为生成携带有图像和预设标识的媒体文件,其中,预设标识用于指示图像与预设音频存在映射关系。
图3是根据本发明实施例的媒体文件生成装置的可选结构框图一,如图3所示,可选地,上述获取模块22包括:读取单元32和剪辑单元34,其中,读取单元32,设置为根据用户输入的存储路径,读取存储路径指示的音频文件;剪辑单元34,耦合至读取单元32,设置为剪辑音频文件,得到预设音频。
图4是根据本发明实施例的媒体文件生成装置的可选结构框图二,如图4所示,可选地,上述拍摄模块24包括:第一接收单元42和拍摄单元44,其中,第一接收单元42,设置为接收用于指示生成媒体文件的指令;拍摄单元44,耦合至第一接收单元42,设置为根据用于指示生成媒体文件的指令,在预设音频的时间轴上的时间点上拍摄图像。
图5是根据本发明实施例的媒体文件生成装置的可选结构框图三,如图5所示,可选地,上述生成模块28包括:第二接收单元52和生成单元54,其中,第二接收单元52,设置 为接收编辑指令,其中,编辑指令用于调整图像与预设音频的时间轴上时间点的对应关系,并更新映射关系;生成单元54,耦合至第二接收单元52,设置为生成携带有图像和预设标识的媒体文件,其中,预设标识用于指示图像与预设音频存在更新后的映射关系。
可选地,上述生成模块28还设置为生成媒体文件,其中,媒体文件为携带有图像、预设音频、映射关系和预设标识的一个媒体文件。
图6是根据本发明实施例的媒体文件生成装置的可选结构框图四,如图6所示,可选地,上述装置还包括:第一处理模块62和第二处理模块64,其中,第一处理模块62,耦合至生成模块28,设置为读取文件,并判断文件是否为携带有预设标识的媒体文件;第二处理模块64,耦合至第一处理模块62,设置为在判断到文件为携带有预设标识的媒体文件的情况下,播放预设音频,并在播放到预设音频的时间轴上的时间点时,根据映射关系显示对应的图像。
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述模块分别位于多个处理器中。
本发明的实施例还提供了一种软件,该软件用于执行上述实施例及优选实施方式中描述的技术方案。
本发明的实施例还提供了一种存储介质。在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的程序代码:
步骤S102,在拍摄模式下,获取预设音频;
步骤S104,在预设音频的时间轴上的时间点上拍摄图像;
步骤S106,建立拍摄的图像与预设音频的时间轴上的时间点的映射关系;
步骤S108,生成携带有图像和预设标识的媒体文件,其中,预设标识用于指示图像与预设音频存在映射关系。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
为了使本发明实施例的描述更加清楚,下面结合可选实施例进行描述和说明。
本发明可选实施例以拍摄图像为三维图像(即3D照片)为例进行描述。需要说明的是,拍摄的图像也可以是二维图像,在本实施例中对此并不作限制。
本发明可选实施例提供的文件生成装置包括:左右摄像单元、音频接收单元、3D成像单元、图像音频处理单元、存储单元、显示单元、音频播放单元等部分。
另外,在文件生成装置中,还提供了一种拍照模式,该拍照模式的主界面上可以包括: 添加录音、添加音乐的功能选项。
本发明可选实施例提供的媒体文件生成方法包括如下步骤:
步骤12,当不开启两个选项的时候,拍摄照片时直接通过左右摄像头生成3D照片;
步骤14,当开启添加录音功能时,拍摄3D照片的同时,界面出现录音的开始和结束开关,在拍摄3D照片的同时,录制音频信息,并将照片和音频信息进行映射对应(相当于上述第一映射关系),绑定保存;
步骤16,当开启添加音乐功能时,选择需要添加的音乐(相当于上述预设音频),并进行3D照片的拍摄,或者选择对应的3D照片,可以选择一张或者多张照片,同时将照片和音乐信息建立映射关系,绑定保存。
通过3D显示屏查看照片时,对于有音频和音乐信息的照片,通过特定的图标(相当于上述预设标识)进行标识。本发明可选实施例提供的查看图像的方法包括如下步骤:
步骤22,对于没有标识的3D照片,直接通过3D显示屏幕查看;
步骤24,对于有标识的照片,如果用户不想收听音频信息(相当于上述预设音频),不点击打开音频,直接进行3D照片的查看;
步骤26,对于有标识的3D照片,如果用户想收听音频信息,点击图标打开,如果是录制的音频信息,则查看3D图片的同时,播放录音信息;如果是音乐文件,则播放音乐的同时,显示照片信息,自动显示多张或者一张。
下面结合附图对本发明可选实施例进行说明。
本发明可选实施例主要是通过左右摄像单元、音频接收单元、3D成像单元、图像音频处理单元、存储单元、显示单元、音频播放单元等实现一种具有音频功能的3D拍照方法,改变目前媒体形式单一、内容零散的情况,为用户带来更好的用户体验。
本发明可选实施例提供了一种媒体文件生成装置,图7是根据本发明可选实施例的媒体文件生成装置的结构框图,如图7所示,该装置包括:
左右摄像单元702,设置为拍摄左右摄像头的照片;
音频接收单元704,设置为添加音频信息;
3D成像单元706,耦合至左右摄像单元702,设置为将左右摄像头拍摄的照片进行处理,得到3D图像;
图像音频处理单元708,耦合至音频接收单元704和3D成像单元706,设置为将3D照片和音频建立对应映射关系;
存储单元710,耦合至图像音频处理单元708,设置为存储绑定的3D照片和音频信息;
显示单元712,耦合至存储单元710,设置为显示3D图像;
音频播放单元714,耦合至存储单元710,设置为播放音频文件;
本发明可选实施例提供了一种基于上述的媒体文件生成方法的3D拍照方法。图8是根据本发明可选实施例的3D拍照方法的示意图,如图8所示,该方法包括以下步骤:
步骤S802,进入3D拍照模式,如果不需要添加音频文件,直接进行3D照片的拍摄;
步骤S804,如果要添加录音信息,则打开添加录音选项,在拍摄3D照片的同时,开始录制音频时,音频接收单元启用,录制相关的音频信息,录制完成可以手动结束,或者达到特定的时长自动结束录音;
步骤S806,如果要添加音乐信息,则打开添加音乐选项,选择需要添加的音乐,然后可以拍摄一张或者多张3D照片,或者从已有的图库中选择一张或者多张3D照片。
本发明可选实施例提供了一种媒体文件生成方法。图9是根据本发明可选实施例的媒体文件生成方法的示意图一,如图9所示,该方法包括以下步骤:
步骤S902,打开相机,进入3D拍照模式;
步骤S904,判断是否添加音频信息;
步骤S906,若不添加音频信息,则直接拍摄3D照片并进行保存;
步骤S908,若添加音频信息,判断是否添加音乐文件;
步骤S910,若不添加音乐文件,则添加录音信息,启动录音,开始拍照,达到设置的时长录音结束,或者可以手动结束录音;
步骤S912,若添加音乐文件,选择要添加的音乐,选择后可以对音乐进行快进、后退等试听操作;
步骤S914,在添加的音乐点开始拍照,可以连续拍摄多张照片,拍照结束时截取音乐结束。
本发明可选实施例结合3D照片的生成方法,提供了一种媒体文件生成方法。在生成3D照片时,可以通过左右摄像头得到了左右两张视图的照片,并且对两张视图进行处理,得到3D图像和音频文件,图10是根据本发明可选实施例的媒体文件生成方法的示意图二,如图10所示,该方法包括以下步骤:
步骤S1002,通过左摄像头拍摄左视图照片;
步骤S1004,通过右摄像头拍摄右视图照片;
步骤S1006,通过双目立体视觉算法,利用获取的左右视图,计算获得三维的深度信息生成3D照片,文件以多维编码的形式存储,同时将音频信息作为多一个维度插入编码;
步骤S1008,将3D照片的数据和音频数据的编码进行多维整合,在原来3D照片的多维数据矩阵中增加一维用来存储音频信息,对整个数据进行统一存储和读取。
获得3D照片和添加音频文件完成后,对相关的信息进行处理,建立3D照片和音频的映射关系,通过对应的映射表格将照片信息和音频信息绑定起来,进行统一存储到存储单元内。
本发明可选实施例中还提供了一种3D照片的浏览方法,其中,本实施例中的3D照片是指根据本发明实施例生成的媒体文件。图11是根据本发明可选实施例的3D照片浏览方法的示意图,如图11所示,该方法包括以下步骤:
步骤S1102,打开图库,查看3D照片;
步骤S1104,判断3D照片中是否包含音频信息,包含音频信息的照片在存储中会有一个标志位标识,在照片的缩略显示界面也有特殊的图标标识;
步骤S1106,通过3D显示单元,显示3D照片进行查看;
步骤S1108,判断音频文件是录音信息还是音乐信息,两种不同的音频信息在存储时通过标识加以区别;
步骤S1110,如果是录音信息,用户可以通过界面上的播放开关进行播放,如果打开播放开关,则在显示3D照片的同时,播放录制的音频信息,音频播放完成后自动切换到下一组,或者用户也可以手动切换到下一组;
步骤S1112,如果音频文件是音乐信息,用户同样可以通过界面上的播放开关进行播放,打开开关后,在播放音乐的同时,显示绑定的一张或者多张3D照片,音乐播放完成后自动切换到下一组,或者用户也可以通过手动切换到下一组。
综上所述,通过本发明的上述实施例和可选实施例,新增了一种文件生成模式,首先能够实现照片(例如3D照片)的拍摄、存储和显示,并且可以为照片添加音频信息,使得媒体资料的信息更加丰富逼真;其次为照片添加的音频信息,可以包括录音和音乐两种形式,并且对于不同的形式具有不同的操作和处理流程,具有更好的扩展性和易用性;此外建立照片和音频信息的对应映射关系,进行绑定处理、存储和显示,使得一组媒体信息具有更高的完整性;并且音频和照片绑定时,不止局限为一张照片,还可以是多张照片,对于绑定的信息形成一组内容,在显示播放时具有更加丰富的形式;最后对于增加音频文件的分类、时长等细节信息进行了分析和处理,使得整个过程更加完整和全面。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成 单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
工业实用性
通过本发明实施例,采用在拍摄模式下,获取预设音频;在预设音频的时间轴上的时间点上拍摄图像;建立拍摄的图像与预设音频的时间轴上的时间点的映射关系;生成携带有图像和预设标识的媒体文件,其中,预设标识用于指示图像与预设音频存在映射关系的方式,解决了相关技术中拍照和添加音频文件在时间上相互隔离导致的用户体验差的问题,实现了拍照和添加音频文件在时间上的同步,提升了用户体验。

Claims (13)

  1. 一种媒体文件生成方法,包括:
    在拍摄模式下,获取预设音频;
    在所述预设音频的时间轴上的时间点上拍摄图像;
    建立拍摄的所述图像与所述预设音频的所述时间轴上的所述时间点的映射关系;
    生成携带有所述图像和预设标识的媒体文件,其中,所述预设标识用于指示所述图像与所述预设音频存在所述映射关系。
  2. 根据权利要求1所述的方法,其中,获取所述预设音频包括:
    根据用户输入的存储路径,读取所述存储路径指示的音频文件;
    剪辑所述音频文件,得到所述预设音频。
  3. 根据权利要求1所述的方法,其中,拍摄所述图像包括:
    接收用于指示生成所述媒体文件的指令;
    根据用于指示生成所述媒体文件的指令,在所述预设音频的所述时间轴上的所述时间点上拍摄所述图像。
  4. 根据权利要求1所述的方法,其中,生成携带有所述图像和所述预设标识的所述媒体文件包括:
    接收编辑指令,其中,所述编辑指令用于调整所述图像与所述预设音频的所述时间轴上所述时间点的对应关系,并更新所述映射关系;
    生成携带有所述图像和所述预设标识的所述媒体文件,其中,所述预设标识用于指示所述图像与所述预设音频存在更新后的所述映射关系。
  5. 根据权利要求1所述的方法,其中,生成携带有所述图像和所述预设标识的所述媒体文件还包括:
    生成所述媒体文件,其中,所述媒体文件为携带有所述图像、所述预设音频、所述映射关系和所述预设标识的一个媒体文件。
  6. 根据权利要求1至5中任一项所述的方法,其中,在生成携带有所述图像和所述预设标识的所述媒体文件之后,所述方法还包括:
    读取文件,并判断所述文件是否为携带有所述预设标识的所述媒体文件;
    在判断到所述文件为携带有所述预设标识的所述媒体文件的情况下,播放所述预设音频,并在播放到所述预设音频的所述时间轴上的所述时间点时,根据所述映射关系显示对应的图像。
  7. 根据权利要求1至5中任一项所述的方法,其中,所述图像包括三维图像。
  8. 一种媒体文件生成装置,包括:
    获取模块,设置为在拍摄模式下,获取预设音频;
    拍摄模块,设置为在所述预设音频的时间轴上的时间点上拍摄图像;
    建立模块,设置为建立拍摄的所述图像与所述预设音频的所述时间轴上的所述时间点的映射关系;
    生成模块,设置为生成携带有所述图像和预设标识的媒体文件,其中,所述预设标识用于指示所述图像与所述预设音频存在所述映射关系。
  9. 根据权利要求8所述的装置,其中,所述获取模块包括:
    读取单元,设置为根据用户输入的存储路径,读取所述存储路径指示的音频文件;
    剪辑单元,设置为剪辑所述音频文件,得到所述预设音频。
  10. 根据权利要求8所述的装置,其中,所述拍摄模块包括:
    第一接收单元,设置为接收用于指示生成所述媒体文件的指令;
    拍摄单元,设置为根据用于指示生成所述媒体文件的指令,在所述预设音频的所述时间轴上的所述时间点上拍摄所述图像。
  11. 根据权利要求8所述的装置,其中,所述生成模块包括:
    第二接收单元,设置为接收编辑指令,其中,所述编辑指令用于调整所述图像与所述预设音频的所述时间轴上所述时间点的对应关系,并更新所述映射关系;
    生成单元,设置为生成携带有所述图像和所述预设标识的所述媒体文件,其中,所述预设标识用于指示所述图像与所述预设音频存在更新后的所述映射关系。
  12. 根据权利要求8所述的装置,其中,所述生成模块还设置为:
    生成所述媒体文件,其中,所述媒体文件为携带有所述图像、所述预设音频、所述映射关系和所述预设标识的一个媒体文件。
  13. 根据权利要求8至12中任一项所述的装置,其中,所述装置还包括:
    第一处理模块,设置为读取文件,并判断所述文件是否为携带有所述预设标识的所述媒体文件;
    第二处理模块,设置为在判断到所述文件为携带有所述预设标识的所述媒体文件的情况下,播放所述预设音频,并在播放到所述预设音频的所述时间轴上的所述时间点时,根据所述映射关系显示对应的图像。
PCT/CN2016/073957 2015-10-22 2016-02-17 媒体文件生成方法和装置 WO2016184193A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201510691023.6 2015-10-22
CN201510691023.6A CN106610982A (zh) 2015-10-22 2015-10-22 媒体文件生成方法和装置

Publications (1)

Publication Number Publication Date
WO2016184193A1 true WO2016184193A1 (zh) 2016-11-24

Family

ID=57319303

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2016/073957 WO2016184193A1 (zh) 2015-10-22 2016-02-17 媒体文件生成方法和装置

Country Status (2)

Country Link
CN (1) CN106610982A (zh)
WO (1) WO2016184193A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112422808B (zh) * 2019-08-23 2023-05-19 阿里巴巴集团控股有限公司 照片的获取、媒体对象的处理方法及装置、电子设备
CN111935395A (zh) * 2020-06-29 2020-11-13 联想(北京)有限公司 一种视频文件生成方法及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103973955A (zh) * 2013-01-28 2014-08-06 联想(北京)有限公司 一种信息处理方法及电子设备
CN104052935A (zh) * 2014-06-18 2014-09-17 广东欧珀移动通信有限公司 一种视频编辑方法及装置
WO2014181969A1 (ko) * 2013-05-07 2014-11-13 Seok Cheol 멀티 트랙 미디어 파일이 기록된 기록 매체, 멀티 트랙 미디어 파일 편집 방법, 및 멀티 트랙 미디어 파일 편집 장치
CN104683677A (zh) * 2013-11-26 2015-06-03 深圳富泰宏精密工业有限公司 为照片增加语音描述的系统及方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060037788A (ko) * 2004-10-28 2006-05-03 엘지전자 주식회사 이동 통신 단말기의 동영상 촬영 장치와 방법
KR20140114238A (ko) * 2013-03-18 2014-09-26 삼성전자주식회사 오디오와 결합된 이미지 표시 방법
US9141682B1 (en) * 2013-03-25 2015-09-22 Amazon Technologies, Inc. Resolving conflicts within saved state data
CN103702180B (zh) * 2014-01-14 2017-06-20 北京奇艺世纪科技有限公司 媒体文件播放方法及装置
CN104253943B (zh) * 2014-09-04 2018-06-22 广东欧珀移动通信有限公司 使用移动终端的视频拍摄方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103973955A (zh) * 2013-01-28 2014-08-06 联想(北京)有限公司 一种信息处理方法及电子设备
WO2014181969A1 (ko) * 2013-05-07 2014-11-13 Seok Cheol 멀티 트랙 미디어 파일이 기록된 기록 매체, 멀티 트랙 미디어 파일 편집 방법, 및 멀티 트랙 미디어 파일 편집 장치
CN104683677A (zh) * 2013-11-26 2015-06-03 深圳富泰宏精密工业有限公司 为照片增加语音描述的系统及方法
CN104052935A (zh) * 2014-06-18 2014-09-17 广东欧珀移动通信有限公司 一种视频编辑方法及装置

Also Published As

Publication number Publication date
CN106610982A (zh) 2017-05-03

Similar Documents

Publication Publication Date Title
US10939069B2 (en) Video recording method, electronic device and storage medium
US11049522B2 (en) Digital media editing
CN108989691B (zh) 视频拍摄方法、装置、电子设备及计算机可读存储介质
US10360945B2 (en) User interface for editing digital media objects
US20170024110A1 (en) Video editing on mobile platform
US10090018B2 (en) Method and device for generating video slides
JP5903187B1 (ja) 映像コンテンツ自動生成システム
CN110494833B (zh) 一种多媒体编辑方法及智能终端
WO2020107297A1 (zh) 视频剪辑控制方法、终端设备和系统
WO2018076174A1 (zh) 一种多媒体编辑方法、装置及智能终端
KR102078136B1 (ko) 오디오 데이터를 가지는 이미지를 촬영하기 위한 장치 및 방법
CN103428555A (zh) 一种多媒体文件的合成方法、系统及应用方法
RU2694802C2 (ru) Создание электронных изображений, редактирование изображений и упрощенное устройство редактирования аудио/видео, способ кинопроизводства, начинающийся с неподвижных изображений и звуковых дорожек
JP2012105012A (ja) 動画再生装置、動画再生方法、コンピュータプログラム、記憶媒体
WO2017000751A1 (zh) 节目录制方法及装置、机顶盒
US10972811B2 (en) Image processing device and image processing method
WO2016184193A1 (zh) 媒体文件生成方法和装置
JP2015198391A (ja) 撮像装置、撮像装置の制御方法、およびプログラム
KR20170012109A (ko) 동화상 재생 프로그램, 장치, 및 방법
US11551724B2 (en) System and method for performance-based instant assembling of video clips
CN108882004B (zh) 视频录制方法、装置、设备及存储介质
KR100652763B1 (ko) 이동 단말의 동영상 파일 편집 방법 및 장치
JP2018074337A (ja) 動画処理装置、動画処理方法およびプログラム
CN106233390B (zh) 一种具备增强功能的图像顺序展示方法及其装置
JP6610030B2 (ja) 映像処理装置および映像処理方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 16795680

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 16795680

Country of ref document: EP

Kind code of ref document: A1