CN111596841B

CN111596841B - 图像显示方法及电子设备

Info

Publication number: CN111596841B
Application number: CN202010349055.9A
Authority: CN
Inventors: 彭业
Original assignee: Vivo Mobile Communication Co Ltd
Current assignee: Vivo Mobile Communication Co Ltd
Priority date: 2020-04-28
Filing date: 2020-04-28
Publication date: 2021-09-07
Anticipated expiration: 2040-04-28
Also published as: CN111596841A

Abstract

本发明实施例公开了一种图像显示方法及电子设备，该方法包括：在播放第一音频文件的情况下，在所述第一音频文件的第一播放界面上显示预设特征信息；接收对所述预设特征信息的第一输入；响应于所述第一输入，根据与所述第一输入关联的目标人物特征信息，合成目标发音对象的目标图像，所述目标发音对象为所述第一音频文件的发音者；显示所述目标图像。利用本发明实施例能够合成用户自定义的目标发音对象的目标图像，并显示目标图像，该目标图像反映了用户在听第一音频文件时自身的感受，提升了用户的使用体验。

Description

图像显示方法及电子设备

技术领域

本发明实施例涉及电子设备领域，尤其涉及一种图像显示方法及电子设备。

背景技术

目前，用户可以通过应用程序收听音频文件(比如音乐或评书文件等)，满足用户娱乐或学习的需求。

但是，在电子设备播放音频文件时，电子设备向用户显示的信息是预先设置好的，这些信息不能由用户自定义设置，无法反映用户自身的感受，导致用户体验不好。

发明内容

本发明实施例提供一种图像显示方法及电子设备，以解决在播放音频文件时电子设备向用户显示的信息无法自定义设置的问题。

为了解决上述技术问题，本发明是这样实现的：

第一方面，本发明实施例提供了一种图像显示方法，应用于电子设备，该方法包括：

在播放第一音频文件的情况下，在所述第一音频文件的第一播放界面上显示预设特征信息；

接收对所述预设特征信息的第一输入；

响应于所述第一输入，根据与所述第一输入关联的目标人物特征信息，合成目标发音对象的目标图像，所述目标发音对象为所述第一音频文件的发音者；

显示所述目标图像。

第二方面，本发明实施例提供了一种电子设备，包括：

第一显示模块，用于在播放第一音频文件的情况下，在所述第一音频文件的第一播放界面上显示预设特征信息；

第一输入接收模块，用于接收对所述预设特征信息的第一输入；

第一输入响应模块，用于响应于所述第一输入，根据与所述第一输入关联的目标人物特征信息，合成目标发音对象的目标图像，所述目标发音对象为所述第一音频文件的发音者；

第二显示模块，用于显示所述目标图像。

第三方面，本发明实施例提供了一种电子设备，包括处理器、存储器及存储在存储器上并可在处理器上运行的计算机程序，计算机程序被处理器执行时实现上述的图像显示方法的步骤。

第四方面，本发明实施例提供了一种计算机可读存储介质，计算机可读存储介质上存储计算机程序，计算机程序被处理器执行时实现上述的图像显示方法的步骤。

在本发明实施例中，在播放第一音频文件的情况下，电子设备在第一音频文件的第一播放界面上显示预设特征信息。用户可以基于预设特征信息输入目标人物特征信息。然后，电子设备根据目标人物特征信息合成目标图像。因此，用户在听第一音频文件时，可以根据第一音频文件的目标发音对象的声音，自定义目标发音对象的外貌，电子设备合成用户自定义的目标发音对象的目标图像。然后显示目标图像，该目标图像反映了用户在听第一音频文件时自身的感受，提升了用户的使用体验。

附图说明

图1为本发明实施例提供的一个图像显示方法的流程示意图；

图2为本发明实施例提供的一个显示有预设特征信息的第一播放界面的示意图；

图3为本发明实施例提供的另一个显示有预设特征信息的第一播放界面的示意图；

图4为本发明实施例提供的一个目标图像的示意图；

图5为本发明实施例提供的另一个目标图像的示意图；

图6为本发明实施例提供的显示目标图像的界面示意图；

图7为本发明实施例提供的又一个显示有预设特征信息的第一播放界面的示意图；

图8为本发明实施例提供的另一个图像显示方法的流程示意图；

图9为本发明实施例提供的显示音乐歌词的界面示意图；

图10为本发明实施例提供的一个电子设备的结构示意图；

图11示出了本发明提供的一个实施例的电子设备的硬件结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

下面首先说明本发明实施例中涉及到的专业术语：

弹幕：中文流行词语，指的是在网络上观看视频时弹出的评论性字幕。

音调：物体振动得快，发出的音调就高，振动得慢，发出的音调就低。物理学中用每秒振动的次数——频率来描述物体运动的快慢。频率决定声音的音调。

响度：声音有音调的不同也有强弱的不同。如用力击鼓比轻轻击鼓的声音大。物理学上，声音的强弱叫做响度。物理学中用振幅来描述物体振动得幅度。振幅越大，产生声音的响度越大。

音色：频率的高低决定声音的音调，振幅的大小影响声音的响度。但是不同物体发出的声音即便音调和响度都相同，我们还是能够分辨出它们的不同，原因使声音还有一个很重要的特性音色。不同发声体的材料，结构不同，发出声音的音色就不同。

图1为本发明实施例提供的一个图像显示方法的流程示意图。图像显示方法应用于电子设备，如图1所示，图像显示方法包括：

S101，在播放第一音频文件的情况下，在第一音频文件的第一播放界面上显示预设特征信息。

其中，第一音频文件包括音乐文件、评书文件、读书文件、语音文件和演讲音频文件中的至少一项。

可选地，在第一播放界面上显示预设特征信息具体包括：根据第一音频文件的类型，在第一音频文件的第一播放界面上显示与第一音频文件的类型对应的预设特征信息。

比如，在第一音频文件为动漫类型的音频文件的情况下，在第一播放界面上显示动漫风格的身体部位图像。在第一音频文件为日系类型的音频文件的情况下，在第一播放界面上显示日系风格的身体部位图像。

可选地，在第一播放界面上显示预设特征信息具体包括：在第一音频文件中有背景音乐的情况下，根据第一音频文件中背景音乐的弹奏方式，在第一音频文件的第一播放界面上显示与弹奏方式对应的预设特征信息。

比如，在第一音频文件中的背景音乐是采用二胡弹奏的情况下，在第一播放界面上显示至少一个二胡图像。在第一音频文件中的背景音乐是采用吉他弹奏的情况下，在第一播放界面上显示至少一个吉他图像。

S102，接收对预设特征信息的第一输入。

其中，预设特征信息可以以文字或图片的形式显示在第一播放界面上。

比如，参考图2，在第一播放界面上显示的预设特征信息可以为不同样式的面部部位图像。用户可以在在第一播放界面上选择目标面部部位图像(即目标人物特征信息)。

再比如，参考图3，在第一播放界面上显示的预设特征信息可以为用于指示用户输入目标面部部位特征信息的信息。用户可以基于该信息，输入目标面部部位特征信息。其中，用户输入的目标发型特征信息包括棕色、披肩长发；用户输入的目标眼睛特征信息包括大眼睛、双眼皮；用户输入的目标鼻子特征信息包括挺直、秀美的小鼻子；用户输入的目标嘴巴特征信息包括樱桃小嘴；用户输入的其他部位特征信息包括金丝、复古和圆框的眼镜。

S103，响应于第一输入，根据与第一输入关联的目标人物特征信息，合成目标发音对象的目标图像，目标发音对象为第一音频文件的发音者。

其中，如果用户在图2所示的第一播放界面上选择目标面部部位图像，那么电子设备根据用户选择的目标面部部位图像合成目标发音对象的目标图像。

如果用户在图3所示的第一播放界面上输入目标面部部位特征信息，那么电子设备根据用户输入的目标面部部位特征信息，在图像库中查找与该目标面部部位特征信息匹配的面部部位图像，将匹配的面部部位图像合成目标发音对象的目标图像。

在图2或图3中的第一播放界面上显示的预设特征信息为面部部位信息。当然，本发明实施例中的预设特征信息并不限于面部部位信息，还可以包括身高信息、胖瘦信息和外部装饰信息(比如眼镜、服饰、围巾和帽子等)中的至少一项。因此，目标图像并不限于面部图像，还可以是个体图像。比如，在用户听卡通类型的第一音频文件的情况下，合成的目标图像为如图4所示的人脸图像或者如图5所示的人体图像。再比如，在用户听古风类型的第一音频文件的情况下，合成的目标图像为古装大侠的人体图像。

另外，目标发音对象可以为人物或动物。比如，假设目标发音对象为动物，第一音频文件为鹦鹉学习人说话的音频文件或者小鸟叽叽喳喳的叫声。

可选地，在合成目标图像之后，可以切换目标图像中的身体部位状态，从而将目标图像更改成动态的目标图像。

可选地，在合成目标图像之后，可以在目标图像中添加表情和/或情绪等效果。

S104，显示目标图像。

其中，可以在第一音频文件的第一播放界面上显示目标图像。

另外，还可以在除第一音频文件之外的其他音频文件的播放界面上显示目标图像。其中，在音频文件的播放界面上显示的目标图像可以包括目标发音对象的目标图像和其他发音对象的目标图像。比如，如图6所示，在音频文件的播放界面上显示所有已合成的目标图像。

在本发明的一个或多个实施例中，预设特征信息包括身体部位特征信息。第一播放界面包括多个显示区域，一个显示区域用于显示同一身体部位的多个不同的身体部位特征信息；

接收对预设特征信息的第一输入，包括：

分别接收在每个显示区域中选择目标人物特征信息的第一输入。

比如，如图7所示，第一播放界面包括发型显示区域、眼睛显示区域、鼻子显示区域和嘴巴显示区域。在发型显示区域显示不同样式的发型，在眼睛显示区域显示不同样式的眼睛，在鼻子显示区域显示不同样式的鼻子，在嘴巴显示区域显示不同样式的嘴巴。用户可以在每个显示区域选择自己自定义的目标发音对象的人脸部位。

在本发明实施例中，同一身体部位的多个不同的身体部位特征信息显示在同一个显示区域，方便用户选择目标人物特征信息。

在本发明的一个或多个实施例中，同一身体部位的多个不同的身体部位特征信息以循环滚动方式显示在一个显示区域。

或者，同一身体部位的多个不同的身体部位特征信息依次按照预定排列顺序和预定移动方向在一个显示区域内移动显示。比如，同一身体部位的多个不同的身体部位特征信息类似于弹幕显示的显示方式，从左到右滑动显示。

在上述两种身体部位特征信息的显示方式中，一个显示区域在同一时刻显示至少一个不同的身体部位特征信息。如果用户在一个显示区域内选择目标人物特征信息，该目标人物特征信息在显示区域内处于选中状态，该显示区域内的身体部位特征信息暂停循环滚动显示或者移动显示。如果用户在一个显示区域内进行上下滑动，那么该显示区域内的身体部位特征信息继续以循环滚动方式或者移动显示方式进行显示。

在本发明实施例中，身体部位特征信息继续以循环滚动方式或者移动显示方式进行显示，由此，可以在有限尺寸的显示区域内显示更多的身体部位特征信息，从而为用户提供了更多的选择空间。而且方便用户选择目标人物特征信息。

下面通过图8进一步地说明本发明实施例。图8为本发明实施例提供的另一个图像显示方法的流程示意图。图像显示方法应用于电子设备，如图8所示，图像显示方法包括：

S201，在启动音乐应用程序的情况下，在音乐主界面上显示显示音乐列表。

其中，音乐主界面上显示的音乐内容为音乐高潮部分片段或其他的片段。

S202，接收在音乐列表中选择第一音乐的输入，响应于该输入，播放选择的第一音乐，并且在第一音乐的第一播放界面上显示第一音乐的歌词。

比如，如图9所示，在第一播放界面上显示第一音乐的歌词。另外，在第一播放界面上还显示目标控件(即图9中的表情弹幕开关)。

S203，接收针对第一播放界面上的目标控件的输入，响应于该输入，在第一播放界面上显示预设特征信息。

其中，在接收针对第一播放界面上的目标控件的输入之后，隐藏第一播放界面上显示的歌词，并显示预设特征信息。

S204，接收对第一播放界面上显示的预设特征信息的第一输入。

S205，响应于第一输入，根据与第一输入关联的目标人物特征信息，合成目标发音对象的目标图像，目标发音对象为第一音频文件的发音者。

S206，显示目标图像。

本发明实施例中的S204-S206与图1实施例中的S102-S104类似，在此不再重复赘述。

在本发明的一个或多个实施例中，合成目标发音对象的目标图像之后，图像显示方法还包括：

在播放第二音频文件，且在第二音频文件的第二播放界面上显示目标图像的情况下，接收对目标图像的第二输入；

响应于第二输入，按照目标发音对象的发音方式播放第二音频文件。

比如，第一音频文件是张三唱的歌曲A，在电子设备播放第一音频文件的期间，合成张三的目标图像。在此之后，电子设备播放李四唱的歌曲B(第二音频文件)，在歌曲B的播放界面上显示已合成的目标图像。如果用户点击了目标图像，那么，此时电子设备按照张三的声音和唱歌风格播放歌曲B。

再比如，第一音频文件是录取的一位妈妈读童话故事的音频文件。在电子设备播放第一音频文件的期间，合成妈妈的目标图像。在此之后，电子设备播放其他人的第二音频文件，在第二音频文件的播放界面上显示妈妈的目标图像。如果孩子点击了该目标图像，那么，此时电子设备按照妈妈的声音播放第二音频文件。

在本发明实施例中，用户可以通过目标图像切换第二音频文件播放时的发音方式，丰富了第二音频文件播放时的声音。并且，第二音频文件可以按照用户理想的声音进行播放，提升了用户的使用体验。

在本发明的一个或多个实施例中，根据针对预设特征信息输入的目标人物特征信息，合成目标发音对象的目标图像之后，图像显示方法还包括：

识别第一音频文件中的声音特征信息；

根据声音特征信息，生成目标发音对象的目标语音库；

建立目标图像与目标语音库之间的关联关系。

其中，第一音频文件中的声音特征信息包括目标发音对象的音调、响度和音色中的至少一项。根据声音特征信息，利用深度学习模型学习目标发音对象的发音方式，并生成目标发音对象的目标语音库。该目标语音库中包括模拟目标发音对象进行发音的多条语音，比如目标语音库中包括模拟目标发音对象进行发音的成千上万条语音。

在本发明实施例中，通过建立目标图像与目标语音库之间的关联关系，那么可以根据目标语音库模拟目标发音对象的声音，从而实现了按照目标发音对象的发音方式播放第二音频文件。

在播放第三音频文件，且在第三音频文件的第三播放界面上显示目标图像的情况下，接收对目标图像的第三输入；

将播放的音频文件从第三音频文件切换到第一音频文件。

比如，在电子设备播放第三音频文件期间，在第三音频文件的第三显示界面上悬浮显示目标图像。如果用户点击该目标图像，则电子设备切换到第一音频文件进行播放。

本发明实施例中，在播放第三音频文件的期间，显示目标图像。电子设备根据用户可以对目标图像进行的操作，将播放的音频文件从第三音频文件切换到第一音频文件。从而方便用户利用目标图像进行音频文件的切换播放。

建立目标图像与第一音频文件之间的关联关系；

将相同的多个目标图像分别关联的多个音频文件分到同一目标类别。多个音频文件包括第一音频文件。

可选地，将相同的多个目标图像分别关联的多个音频文件分到同一目标类别之后，图像显示方法还包括：在第四播放界面上显示目标图像的情况下，接收对目标图像的第四输入；响应于第四输入，按照目标类别的多个音频文件的预定顺序，依次播放多个音频文件。

比如，电子设备播放音频文件M的期间，合成如图5所示的目标图像。在此之后，电子设备播放音频文件N的期间，也合成如图5所示的目标图像。那么将音频文件M和音频文件N分到同一目标类别。

在播放音频文件P的期间，在音频文件P的播放界面上显示如图5所示的目标图像。如果用户点击该目标图像，那么依次播放音频文件M和音频文件N。

在本发明实施例中，根据音频文件的目标图像自动对音频文件进行分类，避免了用户手动对音频文件进行分类。

与本发明实施例的图像显示方法相应地，本发明实施例提供一种电子设备。如图10所示，电子设备包括：

第一显示模块301，用于在播放第一音频文件的情况下，在第一音频文件的第一播放界面上显示预设特征信息；

第一输入接收模块302，用于接收对预设特征信息的第一输入；

第一输入响应模块303，用于响应于第一输入，根据与第一输入关联的目标人物特征信息，合成目标发音对象的目标图像，目标发音对象为第一音频文件的发音者；

第二显示模块304，用于显示目标图像。

在本发明的一个或多个实施例中，电子设备还包括：

第二输入接收模块，用于在播放第二音频文件，且在第二音频文件的第二播放界面上显示目标图像的情况下，接收对目标图像的第二输入；

第二输入响应模块，用于响应于第二输入，按照目标发音对象的发音方式，播放第二音频文件。

在本发明的一个或多个实施例中，电子设备还包括：

特征信息识别模块，用于识别第一音频文件中的声音特征信息；

语音库生成模块，用于根据声音特征信息，生成目标发音对象的目标语音库；

第一关系建立模块，用于建立目标图像与目标语音库之间的关联关系；

第二输入响应模块包括：

文件播放模块，用于根据与目标图像关联的目标语音库，按照目标发音对象的发音方式播放第二音频文件。

在本发明的一个或多个实施例中，电子设备还包括：

第三输入接收模块，用于在播放第三音频文件，且在第三音频文件的第三播放界面上显示目标图像的情况下，接收对目标图像的第三输入；

第三输入响应模块，用于响应于第三输入，将播放的音频文件从第三音频文件切换到第一音频文件。

在本发明的一个或多个实施例中，电子设备还包括：

第二关系建立模块，用于建立目标图像与第一音频文件之间的关联关系；

分类模块，用于将相同的多个目标图像分别关联的多个音频文件分到同一目标类别。

在本发明的一个或多个实施例中，预设特征信息包括身体部位特征信息，第一播放界面包括多个显示区域，一个显示区域用于显示同一身体部位的多个不同的身体部位特征信息；

第一输入接收模块302，具体用于分别接收在每个显示区域中选择目标人物特征信息的第一输入。

在本发明的一个或多个实施例中，同一身体部位的多个不同的身体部位特征信息以循环滚动方式显示在一个显示区域；或者，同一身体部位的多个不同的身体部位特征信息依次按照预定排列顺序和预定移动方向在一个显示区域内移动显示。

图11示出了本发明提供的一个实施例的电子设备的硬件结构示意图，该电子设备400包括但不限于：射频单元401、网络模块402、音频输出单元403、输入单元404、传感器405、显示单元406、用户输入单元407、接口单元408、存储器409、处理器410、以及电源411等部件。本领域技术人员可以理解，图11中示出的电子设备结构并不构成对电子设备的限定，电子设备可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。在本发明实施例中，电子设备包括但不限于手机、平板电脑、笔记本电脑、掌上电脑、车载终端、可穿戴设备、以及计步器等。

其中，显示单元406，用于在音频输出单元403播放第一音频文件的情况下，在第一音频文件的第一播放界面上显示预设特征信息；

用户输入单元407，用于接收对预设特征信息的第一输入；

处理器410，用于响应于第一输入，根据与第一输入关联的目标人物特征信息，合成目标发音对象的目标图像，目标发音对象为第一音频文件的发音者；

显示单元406，还用于显示目标图像。

应理解的是，本发明实施例中，射频单元401可用于收发信息或通话过程中，信号的接收和发送，具体的，将来自基站的下行数据接收后，给处理器410处理；另外，将上行的数据发送给基站。通常，射频单元401包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外，射频单元401还可以通过无线通信系统与网络和其他设备通信。

电子设备通过网络模块402为用户提供了无线的宽带互联网访问，如帮助用户收发电子邮件、浏览网页和访问流式媒体等。

音频输出单元403可以将射频单元401或网络模块402接收的或者在存储器409中存储的音频数据转换成音频信号并且输出为声音。而且，音频输出单元403还可以提供与电子设备400执行的特定功能相关的音频输出(例如，呼叫信号接收声音、消息接收声音等等)。音频输出单元403包括扬声器、蜂鸣器以及受话器等。

输入单元404用于接收音频或视频信号。输入单元404可以包括图形处理器(Graphics Processing Unit，GPU)4041和麦克风4042，图形处理器4041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元406上。经图形处理器4041处理后的图像帧可以存储在存储器409(或其它存储介质)中或者经由射频单元401或网络模块402进行发送。麦克风4042可以接收声音，并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元401发送到移动通信基站的格式输出。

电子设备400还包括至少一种传感器405，比如光传感器、运动传感器以及其他传感器。具体地，光传感器包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示面板4061的亮度，接近传感器可在电子设备400移动到耳边时，关闭显示面板4061和/或背光。作为运动传感器的一种，加速计传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别电子设备姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；传感器405还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等，在此不再赘述。

显示单元406用于显示由用户输入的信息或提供给用户的信息。显示单元406可包括显示面板4061，可以采用液晶显示器(Liquid Crystal Display，LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板4061。

用户输入单元407可用于接收输入的数字或字符信息，以及产生与电子设备的用户设置以及功能控制有关的键信号输入。具体地，用户输入单元407包括触控面板4071以及其他输入设备4072。触控面板4071，也称为触摸屏，可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板4071上或在触控面板4071附近的操作)。触控面板4071可包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再送给处理器410，接收处理器410发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板4071。除了触控面板4071，用户输入单元407还可以包括其他输入设备4072。具体地，其他输入设备4072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆，在此不再赘述。

进一步的，触控面板4071可覆盖在显示面板4061上，当触控面板4071检测到在其上或附近的触摸操作后，传送给处理器410以确定触摸事件的类型，随后处理器410根据触摸事件的类型在显示面板4061上提供相应的视觉输出。虽然在图11中，触控面板4071与显示面板4061是作为两个独立的部件来实现电子设备的输入和输出功能，但是在某些实施例中，可以将触控面板4071与显示面板4061集成而实现电子设备的输入和输出功能，具体此处不做限定。

接口单元408为外部装置与电子设备400连接的接口。例如，外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元408可以用于接收来自外部装置的输入(例如，数据信息、电力等等)并且将接收到的输入传输到电子设备400内的一个或多个元件或者可以用于在电子设备400和外部装置之间传输数据。

存储器409可用于存储软件程序以及各种数据。存储器409可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器409可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

处理器410是电子设备的控制中心，利用各种接口和线路连接整个电子设备的各个部分，通过运行或执行存储在存储器409内的软件程序和/或模块，以及调用存储在存储器409内的数据，执行电子设备的各种功能和处理数据，从而对电子设备进行整体监控。处理器410可包括一个或多个处理单元；优选的，处理器410可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器410中。

电子设备400还可以包括给各个部件供电的电源411(比如电池)，优选的，电源411可以通过电源管理系统与处理器410逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

另外，电子设备400包括一些未示出的功能模块，在此不再赘述。

本发明实施例还提供一种电子设备，包括处理器，存储器，存储在存储器上并可在所述处理器上运行的计算机程序，该计算机程序被处理器执行时实现上述图像显示方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

本发明实施例还提供一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现上述图像显示方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。其中，所述的计算机可读存储介质，如只读存储器(Read-Only Memory，简称ROM)、随机存取存储器(Random Access Memory，简称RAM)、磁碟或者光盘等。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

上面结合附图对本发明的实施例进行了描述，但是本发明并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本发明的启示下，在不脱离本发明宗旨和权利要求所保护的范围情况下，还可做出很多形式，均属于本发明的保护之内。

Claims

1.一种图像显示方法，应用于电子设备，其特征在于，所述方法包括：

在播放第一音频文件的情况下，在所述第一音频文件的第一播放界面上显示至少两个预设特征信息，所述预设特征信息与所述第一音频文件的类型对应；

接收对所述至少两个预设特征信息的第一输入；

响应于所述第一输入，根据与所述第一输入关联的至少两个目标人物特征信息，合成目标发音对象的目标图像，所述目标发音对象为所述第一音频文件的发音者；

显示所述目标图像。

2.根据权利要求1所述的方法，其特征在于，所述根据与所述第一输入关联的至少两个目标人物特征信息，合成目标发音对象的目标图像之后，所述方法还包括：

在播放第二音频文件，且在所述第二音频文件的第二播放界面上显示所述目标图像的情况下，接收对所述目标图像的第二输入；

响应于所述第二输入，按照所述目标发音对象的发音方式，播放所述第二音频文件。

3.根据权利要求2所述的方法，其特征在于，所述根据与所述第一输入关联的至少两个目标人物特征信息，合成目标发音对象的目标图像之后，所述方法还包括：

识别所述第一音频文件中的声音特征信息；

根据所述声音特征信息，生成所述目标发音对象的目标语音库；

建立所述目标图像与所述目标语音库之间的关联关系；

所述按照所述目标发音对象的发音方式播放所述第二音频文件，包括：

根据与所述目标图像关联的所述目标语音库，按照所述目标发音对象的发音方式播放所述第二音频文件。

4.根据权利要求1所述的方法，其特征在于，所述根据与所述第一输入关联的至少两个目标人物特征信息，合成目标发音对象的目标图像之后，所述方法还包括：

在播放第三音频文件，且在所述第三音频文件的第三播放界面上显示所述目标图像的情况下，接收对所述目标图像的第三输入；

响应于所述第三输入，将播放的音频文件从所述第三音频文件切换到所述第一音频文件。

5.根据权利要求1至4任意一项所述的方法，其特征在于，所述预设特征信息包括身体部位特征信息，所述第一播放界面包括多个显示区域，一个所述显示区域用于显示同一身体部位的多个不同的身体部位特征信息；

所述接收对所述至少两个预设特征信息的第一输入，包括：

分别接收在每个所述显示区域中选择所述目标人物特征信息的第一输入。

6.一种电子设备，其特征在于，包括：

第一显示模块，用于在播放第一音频文件的情况下，在所述第一音频文件的第一播放界面上显示至少两个预设特征信息，所述预设特征信息与所述第一音频文件的类型对应；

第一输入接收模块，用于接收对所述至少两个预设特征信息的第一输入；

第一输入响应模块，用于响应于所述第一输入，根据与所述第一输入关联的至少两个目标人物特征信息，合成目标发音对象的目标图像，所述目标发音对象为所述第一音频文件的发音者；

第二显示模块，用于显示所述目标图像。

7.根据权利要求6所述的电子设备，其特征在于，还包括：

第二输入接收模块，用于在播放第二音频文件，且在所述第二音频文件的第二播放界面上显示所述目标图像的情况下，接收对所述目标图像的第二输入；

第二输入响应模块，用于响应于所述第二输入，按照所述目标发音对象的发音方式，播放所述第二音频文件。

8.根据权利要求7所述的电子设备，其特征在于，还包括：

特征信息识别模块，用于识别所述第一音频文件中的声音特征信息；

语音库生成模块，用于根据所述声音特征信息，生成所述目标发音对象的目标语音库；

第一关系建立模块，用于建立所述目标图像与所述目标语音库之间的关联关系；

所述第二输入响应模块包括：

文件播放模块，用于根据与所述目标图像关联的所述目标语音库，按照所述目标发音对象的发音方式播放所述第二音频文件。

9.根据权利要求6所述的电子设备，其特征在于，还包括：

第三输入接收模块，用于在播放第三音频文件，且在所述第三音频文件的第三播放界面上显示所述目标图像的情况下，接收对所述目标图像的第三输入；

第三输入响应模块，用于响应于所述第三输入，将播放的音频文件从所述第三音频文件切换到所述第一音频文件。

10.根据权利要求6至9任意一项所述的电子设备，其特征在于，所述预设特征信息包括身体部位特征信息，所述第一播放界面包括多个显示区域，一个所述显示区域用于显示同一身体部位的多个不同的身体部位特征信息；

所述第一输入接收模块，具体用于分别接收在每个所述显示区域中选择所述目标人物特征信息的第一输入。