CN114512132A

CN114512132A - 内容显示方法、装置以及电子设备

Info

Publication number: CN114512132A
Application number: CN202210102181.3A
Authority: CN
Inventors: 李泽帅
Original assignee: Guangdong Oppo Mobile Telecommunications Corp Ltd
Current assignee: Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date: 2022-01-27
Filing date: 2022-01-27
Publication date: 2022-05-17

Abstract

本申请实施例公开了一种内容显示方法、装置以及电子设备。方法包括：响应于录音文本显示操作，获取目标录音对应的录音文本信息，录音文本信息包括基于目标录音得到的多个文本段落以及每个文本段落对应的发言对象名称，目标录音为录音文本显示操作所触发进行录音文本信息显示的录音；获取目标录音对应的标记，标记为在目标录音的录制过程或者播放过程中生成；在显示界面中对录音文本信息进行显示，并在显示界面中对标记对应的文本进行标识。从而通过上述方式使得录音文本的显示内容更为多样化，也提升了用户体验。

Description

内容显示方法、装置以及电子设备

技术领域

本申请涉及录音技术领域，更具体地，涉及一种内容显示方法、装置以及电子设备。

背景技术

通常在电子设备中都配置有录音应用程序，以便电子设备的用户可以使用该录音应用程序来进行音频录制并进行保存。在一些情况下，为了便于用户查看录音的内容，可以将录制的音频转换为对应的录音文本进行显示。

发明内容

鉴于上述问题，本申请提出了一种内容显示方法、装置以及电子设备，以改善上述问题。

第一方面，本申请提供了一种内容显示方法，应用于电子设备，所述方法包括：响应于录音文本显示操作，获取目标录音对应的录音文本信息，所述录音文本信息包括基于所述目标录音得到的多个文本段落以及每个所述文本段落对应的发言对象名称，所述目标录音为所述录音文本显示操作所触发进行录音文本信息显示的录音；获取所述目标录音对应的标记，所述标记为在所述目标录音的录制过程或者播放过程中生成；在显示界面中对所述录音文本信息进行显示，并在所述显示界面中对所述标记对应的文本进行标识。

第二方面，本申请提供了一种内容显示装置，运行于电子设备，所述装置包括：录音文本获取单元，用于响应于录音文本显示操作，获取目标录音对应的录音文本信息，所述录音文本信息包括基于所述目标录音得到的多个文本段落以及每个所述文本段落对应的发言对象名称，所述目标录音为所述录音文本显示操作所触发进行录音文本信息显示的录音；标记获取单元，用于获取所述目标录音对应的标记，所述标记为在所述目标录音的录制过程或者播放过程中生成；录音文本显示单元，用于在显示界面中对所述录音文本信息进行显示，并在所述显示界面中对所述标记对应的文本进行标识。

第三方面，本申请提供了一种电子设备，包括一个或多个处理器以及存储器；一个或多个程序，其中所述一个或多个程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行，所述一个或多个程序配置用于执行上述的方法。

第四方面，本申请提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有程序代码，其中，在所述程序代码运行时执行上述的方法。

本申请提供的一种内容显示方法、装置以及电子设备，在响应于录音文本显示操作后，会先获取目标录音对应的录音文本信息。其中，录音文本信息包括基于所述目标录音得到的多个文本段落以及每个所述文本段落对应的发言对象名称，所述目标录音为所述录音文本显示操作所触发进行录音文本信息显示的录音。然后，在显示界面中对所述录音文本信息进行显示，并在显示界面中对标记对应的文本进行标识。从而通过上述方式使得可以对录音内容所包括的不同说话人(发言对象)以及不同说话人所说的内容(文本段落)进行区分，进而在显示对录音内容进行转换得到的文本时，不仅可以显示所转换得到的文本内容还可以显示文本内容对应的说话人(发言对象名称)，并且在显示界面中对在录音过程中或者录音播放过程中所生成标记对应的文本进行标识以便用户可以便利的查看所标记的内容，从而使得录音文本的显示内容更为多样化，也提升了用户体验。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出了一种录音转换场景的示意图；

图2示出了本申请一实施例提出的一种内容显示方法的流程图；

图3示出了本申请实施例中的播放录音的界面的示意图；

图4示出了本申请实施例中的生成对应标记的示意图；

图5示出了本申请实施例中在锁屏界面显示录音播放控制界面的示意图；

图6示出了本申请实施例中一种显示界面的示意图；

图7示出了本申请实施例中的在显示界面中隐藏发言对象名称的示意图；

图8示出了本申请实施例中的对标记对应的文本进行标识示意图；

图9示出了本申请另一实施例提出的一种内容显示方法的流程图；

图10示出了本申请实施例中一种对象名称编辑界面的示意图；

图11示出了本申请实施例中另一种对象名称编辑界面的示意图；

图12示出了本申请实施例中再一种对象名称编辑界面的示意图；

图13示出了本申实施例中进行文本段落合并的示意图；

图14示出了本申请又一实施例提出的一种内容显示方法的流程图；

图15示出了本申请实施例中的在显示界面中显示头像的示意图；

图16示出了本申请再一实施例提出的一种内容显示方法的流程图；

图17示出了本申请实施例中的显示有待选择的发言对象的示意图；

图18示出了本申请实施例中多个组件之间的交互方式的示意图；

图19示出了本申请再一实施例提出的一种内容显示方法的流程图；

图20示出了本申请实施例提出的一种内容显示装置的结构框图；

图21示出了本申请实施例提出的另一种内容显示装置的结构框图；

图22示出了本申请另一实施例提出的一种内容显示装置的结构框图；

图23示出了本申请实施例中用于保存或者携带实现根据本申请实施例的内容显示方法的电子设备的结构框图。

图24示出了本申请实施例中用于保存或者携带实现根据本申请实施例的内容显示方法的程序代码的存储单元。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

在电子设备中都配置有录音应用程序，以便电子设备的用户可以使用该录音应用程序来进行音频录制并进行保存。在一些情况下，为了便于用户查看录音的内容，可以将录制的音频转换为对应的录音文本进行显示。

但是，发明人在研究中发现，相关的对录音文本进行显示的过程中还存在显示方式较为单一，用户体验有待提升的问题。

因此，发明人提出了本申请中的一种内容显示方法、装置以及电子设备，在响应于录音文本显示操作后，会先获取目标录音对应的录音文本信息。其中，录音文本信息包括基于所述目标录音得到的多个文本段落以及每个所述文本段落对应的发言对象名称，所述目标录音为所述录音文本显示操作所触发进行录音文本信息显示的录音。然后，在显示界面中对所述录音文本信息进行显示，并在显示界面中对标记对应的文本进行标识。从而通过上述方式使得可以对录音内容所包括的不同说话人(发言对象)以及不同说话人所说的内容(文本段落)进行区分，进而在显示对录音内容进行转换得到的文本时，不仅可以显示所转换得到的文本内容还可以显示文本内容对应的说话人(发言对象名称)，并且在显示界面中对在录音过程中或者录音播放过程中所生成标记对应的文本进行标识以便用户可以便利的查看所标记的内容，从而使得录音文本的显示内容更为多样化，也提升了用户体验。

下面先对本申请实施例涉及的场景进行介绍。

在本申请实施例中涉及录音转换场景以及录音文本显示场景。

其中，如图1所示，在录音转换场景中包括有电子设备、业务服务器、存储服务器以及转写服务器。电子设备用于进行录音的采集并得到采集的音频(音频文件)。业务服务器则用于协调存储服务器以及转写服务器进行工作。存储服务器用于对电子设备上传的音频文件进行存储。转写服务器用于对音频文件进行转写操作以得到对应的文本内容，以及该文本内容对应的发言对象名称。其中，在本申请实施例中，转写可以理解为将音频转换为对应的文本，并且在该转换过程中同步检测音频的说话人。在一种方式中，电子设备中的录音客户端可以在通过录音得到音频文件后将音频文件上传到业务服务器中，然后业务服务器再将接收到的音频文件上传到存储服务器进行存储。电子设备还可以通过业务服务器建立转写任务，业务服务器可以响应于电子设备建立的转写任务，为转写服务器建立对应的转写任务。转写服务器可以响应于所建立的转写任务从存储服务器中获取音频文件，然后基于从存储服务器中获取的音频文件进行转写，并对转写结果进行存储。电子设备可以向业务服务器获取转写结果，对应的，业务服务器则会向转写服务器获取转写结果，然后将转写结果发送到电子设备。

在录音文本显示场景中，电子设备则可以对转写结果中的所转写得到的内容进行显示。作为一种方式，转写结果中包括基于电子设备上传的音频文件转写得到的多个文本段落以及每个所述文本段落对应的发言对象名称。

下面将结合附图具体描述本申请的各实施例。

请参阅图2，本申请实施例提供的一种内容显示方法，应用于电子设备，所述方法包括：

S110：响应于录音文本显示操作，获取目标录音对应的录音文本信息，所述录音文本信息包括基于所述目标录音得到的多个文本段落以及每个所述文本段落对应的发言对象名称，所述目标录音为所述录音文本显示操作所触发进行录音文本信息显示的录音。

在本申请实施例中，录音文本显示操作为用于触发对音频对应的录音文本信息进行显示的操作。该录音文本显示操作所作用的音频则可以理解为本申请实施例中的目标音频。在本申请实施例中，可以在多种场景下触发显示录音的录音文本信息，对应的，不同的场景下的录音文本显示操作可以有所不同。

作为一种方式，可以在播放录音的过程中触发显示目标录音对应的录音文本信息。在这种方式下，目标录音可以理解为正在进行播放的录音，那么该录音文本显示操作则可以理解为触发显示正在播放的录音对应的录音文本信息。示例性的，如图3所示，电子设备正在进行录音的播放。在该界面的顶部显示有名称为音频和名称为文本的选择控件，在图3所示的状态下，因为名称为音频的选择控件处于选中状态，那么图3中则显示的录音播放界面。若检测到有触控该名称为文本的选项控件的操作，则将该触控该名称为文本的选项控件的操作作为录音文本显示操作。

作为另外一种方式，可以在录音列表界面中触发录音文本显示操作。在该录音列表中可以显示有多个录音名称，其中，一个录音名称对应一段录音。若检测到作用于录音名称的触控操作，则可以显示被触控的录音名称对应的隐藏操作区域，在该隐藏操作区域中显示有录音播放控件以及文本显示控件。若检测到有作用于该录音播放控件的触控操作，则可以开始进行录音播放。若检测到有作用于该文本显示控件的触控操作，则会将该作用于该文本显示控件的触控操作作为录音文本显示操作。

需要说明的是，在本申请实施例中，在电子设备完成录音得到音频文件后，可以由电子设备在本地对该音频文件进行转写操作以得到对应的录音文本信息。再者，电子设备也可以将音频文件上传给服务器，由服务器来对该音频文件进行转写操作以得到对应的录音文本信息。并且，在本申请实施例中，在对音频文件进行转写的过程中，不仅仅会识别音频文件中音频对应的文本，还会对音频文件中音频对应的说话人是否改变进行识别，从而给不同的说话人分配不同的发言对象名称。

其中，在本申请实施例中，可以对说话人的具体身份是谁进行识别，例如，通过声纹匹配的方式进行具体身份的识别。也可以不用对具体身份进行识别，而仅获取到说话人是否改变。

可选的，在对音频文件进行转写的过程中，可以基于说话人对转写得到的文本进行段落划分，进而得到多个文本段落。其中，在获取到音频文件中的音频内容对应的说话人改变时，则会重新单独生成一个文本段落。例如，若音频文件中的音频包括为“今天天气不错，我们去吃火锅吧。好的呀”，在对该音频进行转写的过程中，若获取到从“好”开始是另外的说话人的发言，那么则会将前面的“今天天气不错，我们去吃火锅吧”生成一个文本段落，并将“好的呀”单独生成另外一个文本段落。

再者，在本申请实施例中，除了可以基于说话人的改变而单独生成一个文本段落外，还可以根据音频中的内容的间隔来单独生成一个段落。在一些情况下，同一个说话人的发言内容可能会比较长。并且，在发言过程中可能会有一些停顿，那么在转写过程中，若检测到有停顿，则可以将该停顿之后的内容转写到一个新的文本段落。其中，该停顿对应的时长可以由开发人员配置，也可以由电子设备的用户配置。例如，该停顿对应的时长可以为2秒钟，也可以为3秒钟等。

需要说明的是，在转写得到多个文本段落以及每个文本段落对应的发言对象名称后，可以基于每个文本段落以及每个文本段落对应的发言名称对象生成对应的指定格式数据。对应的，在该指定格式数据中可以包括有文本段落中的文本内容、该文本内容对应的播放时间戳以及该文本段落对应的发言对象名称。其中，文本内容对应的播放时间戳表征了文本内容中每个字符对应的播放时刻。示例性的，所生成的指定格式数据可以为：

/10.00/13.00/我爱学习/10.00 10.47 11.00 11.66/我爱学习/1/说话人1/

其中，排在最前面的“10.00”表征文本内容在音频文件中的开始时刻，“13.00”表征文本内容在音频文件中的结束时刻。“我爱学习”则表征文本内容本身。“10.00 10.4711.00 11.66”则依次表征“我爱学习”中每个字符的播放时刻。最后的“说话人1”则表征的是发言对应名称。

需要说明的是，电子设备在获取得到录音生成的音频后，可以先对音频进行转写得到多个指定格式数据，然后对该指定格式数据进行存储。对应的，

在获取录音文本信息的过程中，作为一种方式可以包括：读取预先存储的多个指定格式数据，多个指定格式数据根据目标录音生成，每个所述指定格式数据包括一个文本段落中的文本内容、所述文本内容对应的播放时间戳以及所述文本段落对应的发言对象名称；对所述多个指定格式数据进行识别得到录音文本信息。其中，对指定格式数据的识别可以理解为从指定格式数据中提取出对应的文本内容作为一个文本段落，以及提取出每个文本内容对应的播放时间戳以及提取出发言对象名称。

其中，若转写操作是由电子设备在本地完成，电子设备则可以在完成转写后将得到的多个指定格式数据存储在本地。若转写操作是由服务器来完成，电子设备则可以获取服务器返回的多个指定格式数据后再存储在本地。其中，在由服务器进行转写的这种方式中，服务器可以基于指定协议对多个指定格式数据进行处理，以得到适配该指定协议的数据，然后通过通信通道将适配该指定协议的数据传输给电子设备。电子设备在接收到适配该指定协议的数据后，可以基于该指定协议对该适配该指定协议的数据进行解析，以得到多个指定格式数据。

需要说明的是，在音频对应的录音文本信息可以预先由电子设备或者服务器根据音频得到并由电子设备进行存储的情况下。在本申请实施例中，电子设备获取目标录音对应的录音文本信息可以理解为电子设备读取预先存储的目标录音对应的录音文本信息。

S120：获取所述目标录音对应的标记，所述标记为在所述目标录音的录制过程或者播放过程中生成。

在本申请实施例中，标记可以理解为对录音内容进行的一种标注。其中，对于所标记的录音内容可以理解为用户认为需要进行关注的内容。在本申请实施例中，可以在录音的采集过程中或者对已经采集的录音进行播放过程中，生成标记。

作为一种方式，响应于录音文本显示操作获取目标录音对应的录音文本信息包括：在录音播放过程中，响应于录音文本显示操作，获取目标录音对应的录音文本信息。在这种方式下方法还可以包括：响应于标记操作生成标记，标记的名称与所述标记操作产生时刻所播放内容对应。并且，在本申请实施例中，在检测到有标记生成后，则会对所生成的标记进行存储。

示例性的，如图4所示，在播放录音的过程中，可以通过界面中的名称为标记的控件来触发标记操作以生成对应的标记。其中，作为一种方式，所生成的标记的名称可以为标记对应的标记顺序。例如，如图4所示中的标记2则可以理解为第二个生成的标记的标记名称。对应的，图4所示中的标记5则可以理解为第五个生成的标记的标记名称。再者，作为另外一种方式，标记的名称与标记操作产生时刻所播放内容对应。其中，名称与所播放内容对应可以理解为标记的名称对应的标记操作产生时刻所播放内容相同。例如，若检测到有标记操作产生时，正在播放的内容为“火锅”，那么该标记的名称可以为火锅。

再者，在标记生成的过程中还会对应存储所生成标记对应的标记时间。其中，若标记是在录音的采集过程中生成，那么标记对应的标记时间可为从采集录音开始时刻到标记生成时刻之间的时长。例如，若是从录音开始时刻后的第2分钟的时候生成的标记所对应的标记时间则为第2分钟。再者，若标记是在录音的播放过程中生成，那么标记对应的标记时间可为从录音开始播放的时刻到标记生成时刻之间的时长。例如，若是从录音开始播放时刻后的第1分45秒的时候生成的标记所对应的标记时间则为第1分45秒。

可选的，在本申请实施例的方法中还可以包括：若所述电子设备进入到锁屏状态并显示锁屏界面，在所述锁屏界面中显示录音播放控制界面，录音播放控制界面中包括有用于生成标记的标记控件以及录音播放控制控件。示例性的，如图5所示，在5所示的锁屏界面中。显示有录音播放控制界面30，在该录音播放控制界面30中包括有用于生成标记的标记控件31以及音播放控制控件32。

S130：在显示界面中对所述录音文本信息进行显示，并在所述显示界面中对所述标记对应的文本进行标识。

作为一种方式，每个文本段落对应有播放时间，所述播放时间与文本段落对应的音频内容的录制时间对应，所述在显示界面中对所述录音文本信息进行显示。可选的，还可以在显示界面中显示每个所述发言对象名称对应的身份标记，其中，所述身份标记用于对所述发言对象名称进行标识，且不同的发言对象名称所对应的身份标记不同。作为一种方式，可以在所述显示界面中基于每个多个文本段落对应的播放时间的先后顺序，对多个文本段落进行显示，并显示每个所述发言对象名称对应的身份标记，其中，所述身份标记用于对所述发言对象名称进行标识，且不同的发言对象名称所对应的身份标记不同。例如，每个文本段落对应的播放时间可以为文本段落中第一个字符开始播放的时刻。示例性的，如图6所示的显示界面，在图6所示的界面中，每个虚线框所示的内容为一个文本段落。其中，显示界面中还对应显示有每个文本段落对应的发言对象名称(例如，图6中的讲话人1、讲话人2以及讲话人3)以及播放时间。

其中，在本申请实施例中，身份标记可以理解为用于使对应的发言对象名称能够更好的区别于其他发言名称对象的标记。该标记可以包括颜色标记以及符号标记。在身份标记为颜色标记的情况下，不同发言对象名称所对应的颜色标记不同。例如，若录音文本信息中的文本段落对应的发言对象名称包括讲话人1、讲话人2以及讲话人3，那么该讲话人1对应的颜色标记可以为红色，讲话人2对应的颜色标记可以为黄色，讲话人3对应的颜色标记可以为橙色。

再者，在本申请实施例中，在显示界面中还可以配置有发言对象名称管理控件，该发言对象名称管理控件用于触发发言对象名称的显示和隐藏。其中，在显示界面中如图4所示显示有发言对象名称的情况下，若检测到有作用于该发言对象名称管理控件(例如，图6和图7中名称为讲话人的控件)的触控操作，则可以对每个文本段落对应的发言对象名称进行隐藏，进而电子设备可以显示如图7中所示的显示界面。对应的，在如图7中所示的方式对显示界面进行显示的情况下，若检测到有作用于该发言对象名称管理控件的触控操作，则可以恢复对每个文本段落对应的发言对象名称进行显示，例如，恢复到如图6中所示的状态。

在本申请实施例中，在显示界面中对所述标记对应的文本进行标识，包括：获取所述标记的标记时间；将每个所述文本段落中文本对应的播放时间与所述所标记时间进行匹配；将对应的播放时间与所述所标记时间匹配的文本作为所述标记对应的文本，对所述标记对应的文本进行标识。

作为一种方式，在生成标记的过程中，对于所生成的标记有对应的生成时间。并且，对于多个文本段落中，每个文本段落中的每个字符都对应有播放时间戳。那么电子设备可以将标记的生成时间与每个文本段落中的每个字符都对应的播放时间戳进行匹配，以便在对应的播放时间戳与标记的生成时间匹配的字符处进行标识。

作为另外一种方式，获取所述目标录音对应的标记的名称；将所述每个所述文本段落中文本对与所述所标记的名称进行匹配；将与所述所标记的名称匹配的文本作为所述标记对应的文本，对所述标记对应的文本进行标识。

需要说明的是，在基于标记对文本段落的文本进行标识过程中有可以有多种标识方式的情况下，可以由用户来选择具体采用哪种标识方式。对应的，电子设备可以获取用户确定的标识方式，若所述标识方式表征基于名称进行标识，执行所述获取所述目标录音对应的标记的名称，若所述标识方式表征基于时间进行标识，将每个所述文本段落中，对应的播放时间与标记的标记时间匹配的文本作为所述标记对应的文本，对所述标记对应的文本进行标识。

示例性的，如图8所示，其中文本段落中所对应的旗子图标则为文本段落中对应于标记的标识。例如，在其中的“我们去吃火锅”中的“吃”旁边对应显示有标识，则是因为在该音频的录制过程中，在录制到“吃”的时候用户触发了标记操作。对应的，在其中的“我也去”中的“也”旁边对应显示有标识，则是因为在该音频的录制过程中，在录制到“也”的时候用户触发了标记操作。需要说明的是，对标记对应的文本进行标识时，除了可以采用图8中所示的旗子进行标识外，还可以由其他的标识方式。例如，可以改变标记所对应文本在显示界面中的颜色，或者背景颜色等。

本实施例提供的一种内容显示方法，在响应于录音文本显示操作后，会先获取目标录音对应的录音文本信息。其中，录音文本信息包括基于所述目标录音得到的多个文本段落以及每个所述文本段落对应的发言对象名称，所述目标录音为所述录音文本显示操作所触发进行录音文本信息显示的录音。然后，在显示界面中对所述录音文本信息进行显示，并在显示界面中对标记对应的文本进行标识。从而通过上述方式使得可以对录音内容所包括的不同说话人(发言对象)以及不同说话人所说的内容(文本段落)进行区分，进而在显示对录音内容进行转换得到的文本时，不仅可以显示所转换得到的文本内容还可以显示文本内容对应的说话人(发言对象名称)，并且在显示界面中对在录音过程中或者录音播放过程中所生成标记对应的文本进行标识以便用户可以便利的查看所标记的内容，从而使得录音文本的显示内容更为多样化，也提升了用户体验。

请参阅图9，本申请实施例提供的一种内容显示方法，应用于电子设备，所述方法包括：

S210：响应于录音文本显示操作，获取目标录音对应的录音文本信息，所述录音文本信息包括基于所述目标录音得到的多个文本段落以及每个所述文本段落对应的发言对象名称，所述目标录音为所述录音文本显示操作所触发进行录音文本信息显示的录音。

S220：获取所述目标录音对应的标记，所述标记为在所述目标录音的录制过程或者播放过程中生成。

S230：在显示界面中对所述录音文本信息进行显示，并在所述显示界面中对所述标记对应的文本进行标识。

S240：响应作用于发言对象名称的触控操作，显示对象名称编辑界面。

S250：获取在所述对象名称编辑界面输入的文本作为新的对象名称。

S260：响应于名称更新操作，将所述显示界面中的目标段落对应的发言对象名称更新为所述新的对象名称，所述目标段落为所述触控操作所作用的发言对象名称对应的文本段落。

作为一种方式，在对象名称编辑界面中可以显示有文本输入区域、取消控件以及确定控件。其中，该文本输入区域用于用户输入新的对象名称，该取消控件用于触发关闭该对象名称编辑界面，该确定控件用于触发名称更新操作。例如，若检测到有作用于确定控件的触控操作，则将该作用于确定控件的触控操作确定为名称更新操作。可选的，在响应于名称更新操作后，可以先检测文本输入区域中是否有输入的内容，若文本输入区域中有输入的内容，则将输入的内容作为新的对象名称，若文本输入区域中没有输入的内容，则显示提示用户在该文本输入区域中进行内容输入的提示信息。示例性的，如图10所示，图10中示出了一种对象名称编辑界面10。在该对象名称编辑界面10中设置有文本输入区域11，取消控件以及确定控件。在该文本输入区域11中显示有内容为“请输入讲话人名称”的提示消息。

作为一种方式，在对象名称编辑界面中设置有统一编辑选择控件。对应的，响应于名称更新操作，将所述显示界面中的目标段落对应的发言对象名称更新为所述新的对象名称包括：响应于名称更新操作，获取所述统一编辑选择控件的状态；若所述统一编辑选择控件处于选中状态，将所述显示界面中的目标段落对应的发言对象名称更新为所述新的对象名称；若所述统一编辑选择控件处于未选中状态，将所述显示界面中所述触控操作所作用处对应的文本段落对应的发言对象名称更新为所述新的对象名称。

示例性的，如图11所示，在图11所示的对象名称编辑界面10中设置有统一编辑选择控件12。在该统一编辑选择控件12的旁边显示有提示信息，且该提示信息与用户的触控操作所作用的发言对象名称有关。例如，若用户所触控的发言对象名称为“讲话人1”，那么则提示信息的内容为“修改全部讲话人1”。

作为一种方式，如图12所示，在对象名称编辑界面10中还可以显示多个待选的对象名称。例如，图12中虚线框中的内容则为待选的对象名称。若用户从待选的对象名称选中某一个对象名称后，在文本输入区域中可以自动显示该选中的对象名称。

作为一种方式，所述多个文本段落各自对应有转换顺序，且该转换顺序表征对应的文本段落从所述目标录音中转换出的顺序。需要说明的是，在对目标录音进行文本转换以得到对应文本的过程中，会按照目标录音内容的采集顺序进行转换。那么目标录音中越先被采集的内容则会越先进行文本转换。对应的，转换顺序越靠前的文本内容，在目标录音的播放过程中，对应的播放时间也会越靠前。在这种方式中，响应于名称更新操作，将所述显示界面中的目标段落对应的发言对象名称更新为所述新的对象名称之后还可以包括：将对应的转换顺序相邻且对应的发言对象名称相同的文本段落合并为一个文本段落进行显示，且合并后的文本段落对应的发言对象名称为进行合并的文本段落所对应的相同发言对象名称。

示例性的，如图13所示，在图13左侧图像中所示的显示界面中，显示有讲话人1、讲话人2以及讲话人3各自对应的文本段落。若用户将讲话人2修改为讲话人3，那么则会如图13右侧图像中所示，将原本讲话人2(当前修改为讲话人3)和原本讲话人3(当前依然是讲话人3)对应的文本段落进行合并。

本实施例提供的一种内容显示方法，从而通过上述方式使得可以对录音内容所包括的不同说话人(发言对象)以及不同说话人所说的内容(文本段落)进行区分，进而在显示对录音内容进行转换得到的文本时，不仅可以显示所转换得到的文本内容还可以显示文本内容对应的说话人(发言对象名称)以及每个发言对象名称对应的身份标记，从而使得录音文本的显示内容更为多样化，也提升了用户体验。并且，在本实施例中，用户还可以通过触控发言对象名称来触发显示对象名称编辑界面，并通过该对象名称编辑界面来输入新的对象名称，从而也使得用户可以手动的对通过服务器所识别出的发言对象名称进行修改，以便可以进一步保证录音文本信息中内容的准确性。

请参阅图14，本申请实施例提供的一种内容显示方法，应用于电子设备，所述方法包括：

S310：响应于录音文本显示操作，获取目标录音对应的录音文本信息，所述录音文本信息包括基于所述目标录音得到的多个文本段落以及每个所述文本段落对应的发言对象名称，所述目标录音为所述录音文本显示操作所触发进行录音文本信息显示的录音。

S320：获取所述目标录音对应的标记，所述标记为在所述目标录音的录制过程或者播放过程中生成。

S330：在显示界面中对所述录音文本信息进行显示，并在所述显示界面中对所述标记对应的文本进行标识。

S340：响应作用于所述身份标记的触控操作，显示图片选择界面。

S350：获取从所述图片选择界面中选中的图片作为目标图片。

S360：将所述目标图片作为所述触控操作作用的发言对象名称的头像，并在所述显示界面中将所述头像与所述触控操作作用的发言对象名称相邻排布。

示例性的，如图15所示，在发言对象名称旁边设置的图像则为对应的头像。

本实施例提供的一种内容显示方法，从而通过上述方式使得可以对录音内容所包括的不同说话人(发言对象)以及不同说话人所说的内容(文本段落)进行区分，进而在显示对录音内容进行转换得到的文本时，不仅可以显示所转换得到的文本内容还可以显示文本内容对应的说话人(发言对象名称)以及每个发言对象名称对应的身份标记，从而使得录音文本的显示内容更为多样化，也提升了用户体验。并且，在本实施例中，用户可以通过触控身份标记来实现为发言对象名称配置对应的头像，或者进行头像的编辑，从而进一步的提升了内容显示的多样化程度。

请参阅图16，本申请实施例提供的一种内容显示方法，应用于电子设备，所述方法包括：

S410：响应于录音文本显示操作，获取目标录音对应的录音文本信息，所述录音文本信息包括基于所述目标录音得到的多个文本段落以及每个所述文本段落对应的发言对象名称，所述目标录音为所述录音文本显示操作所触发进行录音文本信息显示的录音。

S420：获取所述目标录音对应的标记，所述标记为在所述目标录音的录制过程或者播放过程中生成。

S430：在显示界面中对所述录音文本信息进行显示，并在所述显示界面中对所述标记对应的文本进行标识。

S440：响应于文本段落选择操作，显示文本段落选择界面。

S450：获取通过所述文本段落选择界面确定的选中段落。

作为一种方式，所述文本段落选择界面中显示有待选择的发言对象名称，所述获取通过所述文本段落选择界面确定的选中段落，包括：获取从所述待选择的发言对象名称中选中的发言对象名称；将所述选中的发言对象名称对应的文本段落作为选中段落。

例如，如图17所示，在文本段落选择界面20中显示有待选择的发言对象名称。在用户完成在待选择的发言对象名称中进行选中后，通过作用于其中名称为完成的控件，则会触发将所选中的发言对象名称对应的文本段落作为选中段落，并同步触发后续的S450。

可选的，其中的待选择的发言对象名称可以包括历史重命名的发言对象名称，从而通过这种方式使得便于用户可以更为快速的进行对发言对象名称进行编辑，也更为直观的了解到之前已经使用过哪些名称。

S460：在所述显示界面中隐藏所述选中段落以外的文本段落。

本实施例提供的一种内容显示方法，从而通过上述方式使得可以对录音内容所包括的不同说话人(发言对象)以及不同说话人所说的内容(文本段落)进行区分，进而在显示对录音内容进行转换得到的文本时，不仅可以显示所转换得到的文本内容还可以显示文本内容对应的说话人(发言对象名称)以及每个发言对象名称对应的身份标记，从而使得录音文本的显示内容更为多样化，也提升了用户体验。并且，在本实施例中，用户还可以通过文本段落选择界面进行文本段落的筛选，从而使得可以在用于显示录音文本信息的显示界面中仅显示用户所期望看到的文本段落。

如图18所示，在本申请实施例中，界面组件、服务组件与通知组件之间可通过广播的方式进行交互。在本申请实施例中，在录音界面和录音播放界面可以设置有通知组件，并为该通知组件与按钮的点击操作(pendingIntent)对应。例如，可以将通知组件与标记控件的点击操作(pendingIntent)对应，在这种情况下，若检测到该标识控件被点击，则会触发通知组件发送标记事件广播。

再者，在录音界面和录音播放界面可以设置有广播的监听，并根据预先定义的方式处理标记事件广播以及状态改变事件对应的广播。该状态改变事件可以包括有暂停播放录音事件、继续播放录音事件、暂停录制音频事件以及继续录制音频事件。

请参阅图19，本申请实施例提供的一种内容处理方法，应用于服务器，所述方法包括：

S610：接收电子设备发送的录音。

S620：基于所述录音得到对应的录音文本信息，所述录音文本信息包括根据所述录音所识别出的多个段落以及每个所述文本段落对应的发言对象名称。

S630：将所述录音文本信息发送给所述电子设备，以用于所述电子设备进行显示。

其中，在本实施例中服务器基于所述录音得到对应的录音文本信息，可以理解为服务器对接收到的录音(音频文件)进行转写以得到多个段落以及每个所述文本段落对应的发言对象名称。

本实施例提供的一种内容处理方法，从而通过上述方式使得可以对录音内容所包括的不同说话人(发言对象)以及不同说话人所说的内容(文本段落)进行区分，进而在显示对录音内容进行转换得到的文本时，不仅可以显示所转换得到的文本内容还可以显示文本内容对应的说话人(发言对象名称)以及每个发言对象名称对应的身份标记，从而使得录音文本的显示内容更为多样化，也提升了用户体验。

需要说明的是，在本申请实施例中，可以是在播放录音的过程中触发的录音文本显示操作。在这种情况下，在显示录音文本信息的显示界面中还可以对当前正在被播放的文本段落进行标识。例如，对于正在被播放的文本段落可以通过显示底色进行标识。并且，在显示界面中无法一次性将录音文本信息所包括的文本段落全部进行显示的情况下，电子设备可以在显示界面中动态加载显示当前正在被播放但是还未被显示到显示界面中的文本段落，以及该文本段落对应的发言对象名称，以及该发言名称对象对应的身份标记。

再者，在检测到有作用于显示界面的滑动操作后，界面可以跟随滑动操作进行显示的内容的切换，以便用户可以查找自己想查看的段落。可选的，在检测到滑动操作结束后的指定时长内没有作用于屏幕的触控操作，且显示界面中当前未显示正在播放的文本段落的情况下，电子设备可以触发显示界面进行自动滚动，以便在显示界面中显示当前正在播放的文本段落，并继续跟随录音的播放进度显示当前正在播放的文本段落。

请参阅图20，本申请实施例提供的一种内容显示装置700，运行于电子设备，所述装置700包括：

录音文本获取单元710，用于响应于录音文本显示操作，获取目标录音对应的录音文本信息，所述录音文本信息包括基于所述目标录音得到的多个文本段落以及每个所述文本段落对应的发言对象名称，所述目标录音为所述录音文本显示操作所触发进行录音文本信息显示的录音。

作为一种方式，录音文本获取单元710，具体用于读取预先存储的多个指定格式数据，所述多个指定格式数据为服务器根据目标录音生成，每个所述指定格式数据包括一个文本段落中的文本内容、所述文本内容对应的播放时间戳以及所述文本段落对应的发言对象名称；对所述多个指定格式数据进行识别得到录音文本信息。

录音文本显示单元720，用于在显示界面中对所述录音文本信息进行显示，并显示每个所述发言对象名称对应的身份标记，其中，所述身份标记用于对所述发言对象名称进行标识，且不同的发言对象名称所对应的身份标记不同。

作为一种方式，录音文本显示单元720，还用于响应作用于发言对象名称的触控操作，显示对象名称编辑界面；获取在所述对象名称编辑界面输入的文本作为新的对象名称；响应于名称更新操作，将所述显示界面中的目标段落对应的发言对象名称更新为所述新的对象名称，所述目标段落为所述触控操作所作用的发言对象名称对应的文本段落。

可选的，所述对象名称编辑界面中设置有统一编辑选择控件。录音文本显示单元720，还具体用于响应于名称更新操作，获取所述统一编辑选择控件的状态；若所述统一编辑选择控件处于选中状态，将所述显示界面中的目标段落对应的发言对象名称更新为所述新的对象名称；若所述统一编辑选择控件处于未选中状态，将所述显示界面中所述触控操作所作用处对应的文本段落对应的发言对象名称更新为所述新的对象名称。

作为一种方式，录音文本显示单元720，还用于将对应的转换顺序相邻且对应的发言对象名称相同的文本段落合并为一个文本段落进行显示，且合并后的文本段落对应的发言对象名称为进行合并的文本段落所对应的相同发言对象名称。

作为一种方式，录音文本显示单元720，还用于响应作用于所述身份标记的触控操作，显示图片选择界面；获取从所述图片选择界面中选中的图片作为目标图片；将所述目标图片作为所述触控操作作用的发言对象名称的头像，并在所述显示界面中将所述头像与所述触控操作作用的发言对象名称相邻排布。

作为一种方式，录音文本显示单元720，还用于响应于文本段落选择操作，显示文本段落选择界面；获取通过所述文本段落选择界面确定的选中段落；

在所述显示界面中隐藏所述选中段落以外的文本段落。可选的，录音文本显示单元720，还具体用于获取从所述待选择的发言对象名称中选中的发言对象名称；将所述选中的发言对象名称对应的文本段落作为选中段落。

作为一种方式，录音文本显示单元720，具体用于在显示界面中对所述录音文本信息进行显示，并显示每个所述发言对象名称对应的身份标记，其中，所述身份标记用于对所述发言对象名称进行标识，且不同的发言对象名称所对应的身份标记不同；获取所述录音在录制过程或者播放过程中所生成的标记；在所述显示界面中对所述标记对应的文本进行标识。

作为一种方式，录音文本获取单元710，具体用于在录音播放过程中，响应于录音文本显示操作，获取目标录音对应的录音文本信息。如图21所示，装置700还包括，标记单元730，用于响应于标记操作，生成标记，所述标记的名称与所述标记操作产生时刻所播放内容对应。

标记单元730，还用于若所述电子设备进入到锁屏状态并显示锁屏界面，在所述锁屏界面中显示录音播放控制界面，所述录音播放控制界面中包括有用于生成标记的标记控件以及录音播放控制控件。

作为一种方式，每个文本段落对应有播放时间。录音文本显示单元720，具体用于在所述显示界面中基于每个多个文本段落对应的播放时间的先后顺序，对多个文本段落进行显示，并显示每个所述发言对象名称对应的身份标记，其中，所述身份标记用于对所述发言对象名称进行标识，且不同的发言对象名称所对应的身份标记不同。

请参阅图22，本申请实施例提供的一种内容处理装置800，运行于服务器，所述装置包括：音频接收单元810，用于接收电子设备发送的录音；音频识别单元820，用于基于所述录音得到对应的录音文本信息，所述录音文本信息包括根据所述录音所识别出的多个段落以及每个所述文本段落对应的发言对象名称；数据传输单元830，用于将所述录音文本信息发送给所述电子设备，以用于所述电子设备进行显示。

需要说明的是，本申请中装置实施例与前述方法实施例是相互对应的，装置实施例中具体的原理可以参见前述方法实施例中的内容，此处不再赘述。

请参阅图23，基于上述的内容显示方法、装置，本申请实施例还提供的另一种可以执行前述内容显示方法的电子设备1000。电子设备1000包括相互耦合的一个或多个(图中仅示出一个)处理器102、存储器104、无线通信器件106、传感器模块108以及图像采集器件110。其中，该存储器104中存储有可以执行前述实施例中内容的程序，而处理器102可以执行该存储器104中存储的程序。

其中，处理器102可以包括一个或者多个处理核。处理器102利用各种接口和线路连接整个电子设备1000内的各个部分，通过运行或执行存储在存储器104内的指令、程序、代码集或指令集，以及调用存储在存储器104内的数据，执行电子设备1000的各种功能和处理数据。可选地，处理器102可以采用数字信号处理(Digital Signal Processing，DSP)、现场可编程门阵列(Field－Programmable Gate Array，FPGA)、可编程逻辑阵列(Programmable Logic Array，PLA)中的至少一种硬件形式来实现。处理器102可集成中央处理器(Central Processing Unit，CPU)、图像处理器(Graphics Processing Unit，GPU)和调制解调器等中的一种或几种的组合。其中，CPU主要处理操作系统、用户界面和应用程序等；GPU用于负责显示内容的渲染和绘制；调制解调器用于处理无线通信。可以理解的是，上述调制解调器也可以不集成到处理器102中，单独通过一块通信芯片进行实现。

存储器104可以包括随机存储器(Random Access Memory，RAM)，也可以包括只读存储器(Read-Only Memory)。存储器104可用于存储指令、程序、代码、代码集或指令集。存储器104可包括存储程序区和存储数据区，其中，存储程序区可存储用于实现操作系统的指令、用于实现至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现下述各个方法实施例的指令等。

所述无线通信器件106用于实现电子设备1000与其他设备之间的信息交互，例如，传输设备控制指令、操纵请求指令以及状态信息获取指令等。而当电子设备1000具体为不同的设备时，其对应的无线通信器件106可能会有不同。可选的，无线通信器件106可以基于蓝牙通信方式与其他设备之间进行信息交互。例如，该其他设备可以为TWS耳机，电子设备可以向TWS耳机发送音频采集指令，对应的，TWS耳机可以将采集的音频数据传输给无线通信器件106。

传感器模块108可以包括至少一种传感器。具体地，传感器模块108可包括但并不限于：光传感器、运动传感器、压力传感器、红外热传感器、距离传感器、加速度传感器、以及其他传感器。

其中，压力传感器可以检测由按压在电子设备1000产生的压力的传感器。即，压力传感器检测由用户和电子设备之间的接触或按压产生的压力，例如由用户的耳朵与移动终端之间的接触或按压产生的压力。因此，压力传感器可以用来确定在用户与电子设备1000之间是否发生了接触或者按压，以及压力的大小。

其中，加速度传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别电子设备1000姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等。另外，电子设备1000还可配置陀螺仪、气压计、湿度计、温度计等其他传感器，在此不再赘述。

图像采集器件110，用于进行音频信号采集。可选的，图像采集器件110包括有多个音频采集器件。该音频采集器件可以为麦克风。

作为一种方式，电子设备1000的网络模块为射频模块，该射频模块用于接收以及发送电磁波，实现电磁波与电信号的相互转换，从而与通讯网络或者其他设备进行通讯。所述射频模块可包括各种现有的用于执行这些功能的电路元件，例如，天线、射频收发器、数字信号处理器、加密/解密芯片、用户身份模块(SIM)卡、存储器等等。例如，该射频模块可以通过发送或者接收的电磁波与外部设备进行信息交互，进而接收外部设备所发送的音频信号。

再者，电子设备1000还可以包括有图像采集器件以进行图像采集。例如，可以通过该图像采集器件拍摄视频、静态图片或者动态图片。

请参考图24，其示出了本申请实施例提供的一种计算机可读存储介质的结构框图。该计算机可读存储介质900中存储有程序代码，所述程序代码可被处理器调用执行上述方法实施例中所描述的方法。

计算机可读存储介质900可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。可选地，计算机可读存储介质900包括非易失性计算机可读介质(non-transitory computer-readable storage medium)。计算机可读存储介质900具有执行上述方法中的任何方法步骤的程序代码910的存储空间。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。程序代码910可以例如以适当形式进行压缩。

综上所述，本申请提供的一种内容显示方法、装置以及电子设备，在响应于录音文本显示操作后，会先获取目标录音对应的录音文本信息。其中，录音文本信息包括基于所述目标录音得到的多个文本段落以及每个所述文本段落对应的发言对象名称，所述目标录音为所述录音文本显示操作所触发进行录音文本信息显示的录音。然后，在显示界面中对所述录音文本信息进行显示，并在显示界面中对标记对应的文本进行标识。从而通过上述方式使得可以对录音内容所包括的不同说话人(发言对象)以及不同说话人所说的内容(文本段落)进行区分，进而在显示对录音内容进行转换得到的文本时，不仅可以显示所转换得到的文本内容还可以显示文本内容对应的说话人(发言对象名称)，并且在显示界面中对在录音过程中或者录音播放过程中所生成标记对应的文本进行标识以便用户可以便利的查看所标记的内容，从而使得录音文本的显示内容更为多样化，也提升了用户体验。

从而通过上述方式使得在图像采集器件实际开始采集视频数据的时间，与外部音频采集设备实际开始采集音频数据的时间不相同，而造成所采集到的音频数据中的第一帧音频数据的时间戳与所采集到的视频数据中的第一帧视频数据的时间戳不相同的情况下，可以通获取目标时间段来对采集的音频数据和视频数据进行对齐处理，以便使得在对视频数据和音频数据进行编码的过程中，采集的音频数据中的第一帧音频数据可以对应到视频数据中实际与该第一帧音频数据同步被采集的视频帧(目标帧)，进而使得编码后的视频数据和编码后的音频数据在播放的过程中，可以更为同步的进行播放。

最后应说明的是：以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不驱使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

1.一种内容显示方法，其特征在于，应用于电子设备，所述方法包括：

响应于录音文本显示操作，获取目标录音对应的录音文本信息，所述录音文本信息包括基于所述目标录音得到的多个文本段落以及每个所述文本段落对应的发言对象名称，所述目标录音为所述录音文本显示操作所触发进行录音文本信息显示的录音；

获取所述目标录音对应的标记，所述标记为在所述目标录音的录制过程或者播放过程中生成；

在显示界面中对所述录音文本信息进行显示，并在所述显示界面中对所述标记对应的文本进行标识。

2.根据权利要求1所述的方法，其特征在于，所述在所述显示界面中对所述标记对应的文本进行标识，包括：

获取所述标记的标记时间；

将每个所述文本段落中文本对应的播放时间与所述所标记时间进行匹配；

将对应的播放时间与所述所标记时间匹配的文本作为所述标记对应的文本，对所述标记对应的文本进行标识。

3.根据权利要求1所述的方法，其特征在于，所述响应于录音文本显示操作，获取目标录音对应的录音文本信息，包括：

在录音播放过程中，响应于录音文本显示操作，获取目标录音对应的录音文本信息；

所述方法还包括：

响应于标记操作生成标记，所述标记的名称与所述标记操作产生时刻所播放内容对应。

4.根据权利要求3所述的方法，其特征在于，所述在所述显示界面中对所述标记对应的文本进行标识，包括：

获取所述目标录音对应的标记的名称；

将所述每个所述文本段落中文本对与所述所标记的名称进行匹配；

将与所述所标记的名称匹配的文本作为所述标记对应的文本，对所述标记对应的文本进行标识。

5.根据权利要求4所述的方法，其特征在于，所述获取所述目标录音对应的标记的名称之前还包括：

获取用户确定的标识方式；

若所述标识方式表征基于名称进行标识，执行所述获取所述目标录音对应的标记的名称；

若所述标识方式表征基于时间进行标识，将每个所述文本段落中，对应的播放时间与标记的标记时间匹配的文本作为所述标记对应的文本，对所述标记对应的文本进行标识。

6.根据权利要求3所述的方法，其特征在于，所述在显示界面中对所述录音文本信息进行显示，并在所述显示界面中对所述标记对应的文本进行标识之后还包括：

若所述电子设备进入到锁屏状态并显示锁屏界面，在所述锁屏界面中显示录音播放控制界面，所述录音播放控制界面中包括有用于生成标记的标记控件以及录音播放控制控件。

7.根据权利要求1所述的方法，其特征在于，所述对所述录音文本信息进行显示，并显示每个所述发言对象名称对应的身份标记之后还包括：

响应作用于发言对象名称的触控操作，显示对象名称编辑界面；

获取在所述对象名称编辑界面输入的文本作为新的对象名称；

响应于名称更新操作，将所述显示界面中的目标段落对应的发言对象名称更新为所述新的对象名称，所述目标段落为所述触控操作所作用的发言对象名称对应的文本段落。

8.根据权利要求7所述的方法，其特征在于，所述对象名称编辑界面中设置有统一编辑选择控件，所述响应于名称更新操作，将所述显示界面中的目标段落对应的发言对象名称更新为所述新的对象名称包括：

响应于名称更新操作，获取所述统一编辑选择控件的状态；

若所述统一编辑选择控件处于选中状态，将所述显示界面中的目标段落对应的发言对象名称更新为所述新的对象名称；

若所述统一编辑选择控件处于未选中状态，将所述显示界面中所述触控操作所作用处对应的文本段落对应的发言对象名称更新为所述新的对象名称。

9.根据权利要求7所述的方法，其特征在于，所述多个文本段落各自对应有转换顺序，所述转换顺序表征对应的文本段落从所述目标录音中转换出的顺序；所述响应于名称更新操作，将所述显示界面中的目标段落对应的发言对象名称更新为所述新的对象名称之后还包括：

将对应的转换顺序相邻且对应的发言对象名称相同的文本段落合并为一个文本段落进行显示，且合并后的文本段落对应的发言对象名称为进行合并的文本段落所对应的相同发言对象名称。

10.根据权利要求1所述的方法，其特征在于，所述响应于录音文本显示操作，获取目标录音对应的录音文本信息之前还包括：

对所述目标录音进行文本转换，其中，在所述文本转换中若检测到发言对象改变则单独生成一个对应于改变后的发言对象的文本段落，以转换得到多个文本段落；

为每个文本段落设置对应的发言对象名称，且不同的文本文本段落对应的发言对象名称不同；

基于所述转换得到多个文本段落以及每个文本段落对应的发言对象名称，得到录音文本信息。

11.根据权利要求1所述的方法，其特征在于，所述对所述录音文本信息进行显示，并显示每个所述发言对象名称对应的身份标记之后还包括：

响应作用于所述身份标记的触控操作，显示图片选择界面；

获取从所述图片选择界面中选中的图片作为目标图片；

将所述目标图片作为所述触控操作作用的发言对象名称的头像，并在所述显示界面中将所述头像与所述触控操作作用的发言对象名称相邻排布。

12.根据权利要求1所述的方法，其特征在于，所述在显示界面中对所述录音文本信息进行显示，并显示每个所述发言对象名称对应的身份标记之后还包括：

响应于文本段落选择操作，显示文本段落选择界面；

获取通过所述文本段落选择界面确定的选中段落；

在所述显示界面中隐藏所述选中段落以外的文本段落。

13.根据权利要求12所述的方法，其特征在于，所述文本段落选择界面中显示有待选择的发言对象名称，所述获取通过所述文本段落选择界面确定的选中段落，包括：

获取从所述待选择的发言对象名称中选中的发言对象名称；

将所述选中的发言对象名称对应的文本段落作为选中段落。

14.根据权利要求1所述的方法，其特征在于，获取目标录音对应的录音文本信息，包括：

读取预先存储的多个指定格式数据，所述多个指定格式数据为服务器根据目标录音生成，每个所述指定格式数据包括一个文本段落中的文本内容、所述文本内容对应的播放时间戳以及所述文本段落对应的发言对象名称；

对所述多个指定格式数据进行识别得到录音文本信息。

15.一种内容显示装置，其特征在于，运行于电子设备，所述装置包括：

录音文本获取单元，用于响应于录音文本显示操作，获取目标录音对应的录音文本信息，所述录音文本信息包括基于所述目标录音得到的多个文本段落以及每个所述文本段落对应的发言对象名称，所述目标录音为所述录音文本显示操作所触发进行录音文本信息显示的录音；

标记获取单元，用于获取所述目标录音对应的标记，所述标记为在所述目标录音的录制过程或者播放过程中生成；

录音文本显示单元，用于在显示界面中对所述录音文本信息进行显示，并在所述显示界面中对所述标记对应的文本进行标识。

16.一种电子设备，其特征在于，包括一个或多个处理器以及存储器；

一个或多个程序，其中所述一个或多个程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行，所述一个或多个程序配置用于执行权利要求1-14任一所述的方法。

17.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有程序代码，其中，在所述程序代码运行时执行权利要求1-14任一所述的方法。