CN111800543A

CN111800543A - 音频文件的处理方法、终端设备及存储介质

Info

Publication number: CN111800543A
Application number: CN202010625563.5A
Authority: CN
Inventors: 陈海军
Original assignee: Shenzhen Microphone Holdings Co Ltd
Current assignee: Shenzhen Microphone Holdings Co Ltd; Shenzhen Transsion Holdings Co Ltd
Priority date: 2020-06-30
Filing date: 2020-06-30
Publication date: 2020-10-20

Abstract

本发明公开了一种音频文件的处理方法，包括以下步骤：展示一音频文件处理控制界面，以通过所述音频文件处理控制界面获取音频文件；所述音频文件显示于一文本类应用；于所述文本类应用中，根据所述音频文件生成目标语言对应的文本文件。本发明还公开了一种终端设备及计算机可读存储介质，达成了减小通过音频文件保存或者传递信息时的局限性的效果。

Description

音频文件的处理方法、终端设备及存储介质

技术领域

本发明涉及数据处理技术领域，尤其涉及音频文件的处理方法、终端设备及计算机可读存储介质。

背景技术

随着科学技术的发展，手机、平板电脑等移动终端已成为人们日常生活及工作中不可或缺的一部分。并且现有的移动终端一般设置有麦克风，使得移动终端可以实现录音功能。

但是在现有的移动终端中，只能将录音文件作为音频文件保存在移动终端中，导致用户需要获取录音文件对应的信息时，需要播放音频文件。但是，在音频文件播放时，若用户需要根据当前播放的音频文件获取对应的信息，需要具备识别当前播放的音频文件对应的语言的能力。导致在通过音频文件保存或者传递信息时，受到用户语言能力水平的限制。这样存在通过音频文件保存或者传递信息时局限性较大的缺陷。

上述内容仅用于辅助理解本发明的技术方案，并不代表承认上述内容是现有技术。

发明内容

本发明的主要目的在于提供一种音频文件的处理方法、终端设备及计算机可读存储介质，旨在达成减小通过音频文件保存或者传递信息时的局限性的效果。

为实现上述目的，本发明提供一种音频文件的处理方法，所述音频文件的处理方法包括以下步骤：

展示一音频文件处理控制界面，以通过所述音频文件处理控制界面获取音频文件；

所述音频文件显示于一文本类应用；

于所述文本类应用中，根据所述音频文件生成目标语言对应的文本文件。

可选地，于所述文本类应用保存原始音频文件和所述目标语言对应的文本文件；或者于所述文本类应用保存所述原始音频文件、原始音频文件语言对应的文本文件和所述目标语言对应的文本文件。

可选地，目标语言对应的文本文件以音频文件形式显示。

可选地，所述目标语言对应的文本文件和音频文件，或者原始音频文件和原始音频文件语音对应的文本文件，同时显示。

可选地，以音频文件形式显示的目标语言对应的文本文件，可导入至原始应用进行播放。

可选地，选择一不同语言的app，以音频文件形式显示所述目标语言对应的文本文件，所述目标语言与所述app对应的语言相同。

可选地，所述根据所述音频文件生成目标语言对应的文本文件的步骤之前，还包括如下至少一种：

获取终端设备的终端参数；

根据所述终端参数确定所述目标语言。

可选地，所述根据所述音频文件生成目标语言对应的文本文件的步骤包括：

对所述音频文件进行语音识别，并根据语音识别结果生成所述音频文件对应的第一文本文件；

在所述第一文本文件对应的语音与所述目标语言不同时，将所述第一文本文件翻译为所述目标语言对应的第二文本文件。

可选地，根据所述音频文件的播放进度确定所述展示界面中展示的所述文本文件的突出显示的内容。

可选地，根据音频播放的内容，同步显示目标语言对应的文本文件。

可选地，已经播放的音频对应的目标语言对应的文本文件可继续显示或不显示。

此外，为实现上述目的，本发明还提供一种终端设备，所述终端设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的终端设备的控制程序，所述终端设备的控制程序被所述处理器执行时实现如上所述的音频文件的处理方法的步骤。

此外，为实现上述目的，本发明还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有终端设备的控制程序，所述终端设备的控制程序被处理器执行时实现如上所述的音频文件的处理方法的步骤。

本发明实施例提出的一种音频文件的处理方法、终端设备及计算机可读存储介质，先展示一音频文件处理控制界面，以通过所述音频文件处理控制界面获取音频文件，然后将音频文件显示于一文本类应用，并于所述文本类应用中，根据所述音频文件生成目标语言对应的文本文件。其中，目标语音可以由用户自定义设置，由于可以将音频文件转换成目标语言对应的文本文件，从而避免了在通过音频文件保存或者传递信息时，受到用户语言能力水平的限制的缺陷，这样达成了减小通过音频文件保存或者传递信息时的局限性的效果。

附图说明

图1是本发明实施例方案涉及的硬件运行环境的终端结构示意图；

图2为本发明音频文件的处理方法一实施例的流程示意图；

图3为本发明实施例涉及的目标语音选择界面示意图；

图4为本发明实施例涉及的文本显示界面示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

所述音频文件显示于一文本类应用；

可选地，目标语言对应的文本文件以音频文件形式显示。

获取终端设备的终端参数；

根据所述终端参数确定所述目标语言。

如图1所示，图1是本发明实施例方案涉及的硬件运行环境的终端结构示意图。

本发明实施例终端可以是智能手机或者平板电脑等终端设备。

如图1所示，该终端可以包括：处理器1001，例如CPU，网络接口1004，用户接口1003，存储器1005，通信总线1002。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard)、鼠标等，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器，也可以是稳定的存储器(non-volatile memory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解，图1中示出的终端结构并不构成对终端的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图1所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及终端设备的控制程序。

在图1所示的终端中，网络接口1004主要用于连接后台服务器，与后台服务器进行数据通信；处理器1001可以用于调用存储器1005中存储的终端设备的控制程序，并执行以下操作：

所述音频文件显示于一文本类应用；

进一步地，处理器1001可以调用存储器1005中存储的终端设备的控制程序，还执行以下操作：

获取终端设备的终端参数；

根据所述终端参数确定所述目标语言。

参照图2，在本发明音频文件的处理方法的一实施例中，所述音频文件的处理方法包括以下步骤：

步骤S10、展示一音频文件处理控制界面，以通过所述音频文件处理控制界面获取音频文件；

步骤S20、所述音频文件显示于一文本类应用；

步骤S30、于所述文本类应用中，根据所述音频文件生成目标语言对应的文本文件。

执行不实施例记载的音频文件处理方法的终端可以是智能手机、平板电脑、录音设备和/或PC机等电子终端。所述终端包括用于存储录音文件的存储介质和用于控制终端实现各个不同功能的主控芯片。

在本实施例中，终端可以显示一音频文件处理控制界面，使得用户可以通过上述音频文件处理控制界面设置的控制按钮，选择或者添加待处理的音频文件。或者，上述终端也可以根据接收到的预设的控制手势，执行选择获取添加待处理的音频文件的动作。

具体地，音频文件处理控制界面可以显示一音频文件列表，使得用户可以在音频文件列表中选择待处理的音频文件。或者也可以在音频文件处理控制界面中显示一音频文件添加按钮，使得在该音频文件添加按钮被触发时，终端可以跳转显示音频文件选择界面。例如，在该音频文件添加按钮被触发时，可跳转显示终端的文件存储列表，以从文件存储列表中选择音频文件。或者也可以显示应用选择列表，进而在应用选择列表的中的一应用被选中时，进一步显示该应用管理的音频文件，以供用户选择。

可以理解的是，本实施例提出的以列表形式显示音频文件仅为本发明音频文件处理方法的一种可选的音频选择方式，并不代表仅通过该方式显示音频文件，或者仅通过该方式获取音频文件。

进一步地，当获取到所述音频文件后，可以将所述音频文件显示于一文本类应用中，例如，所述文本类应用可以是终端中设置的记事本应用。即可以在文本类应用中显示该音频文件的文件名和文件类型等信息。可以理解的是，所述文本类应用可以分类显示或者以列表的形式同时显示多个音频文件或者，显示多个音频文件类别。

当所述音频类文件显示于所述文本类应用中之后，用户可以通过点击或者长按等方式选中一展示于文本类应用中的音频文件。或者，也可以通过点击或者长按选中一音频文件后，展示一响应的功能选择界面。

进一步地，终端可以直接根据选中的音频文件生成目标语言对应的文本文件，或者，在功能选择界面中的显示目标语言对应的文本文件对应的功能被选中时，显示该音频文件对应的文本文件。其中，所述目标语音可以由系统自动确定，也可以由用户选定。当需要用户选定目标语音是，在所述音频文件被选中或者显示文本文件的功能被触发时，输出以语言选中界面，以使用户可以通过上述语言选择界面选定目标语言。

示例性地，当用户通过音频文件处理控制界面获取到一通话录音时，可以将通话录音显示至记事本中，并对所述记事本进行语音识别，进而根据语音识别结果生成通话录音对应的文本文件，然后将文本文件的文本内容显示在记事本的文本显示区域。

参照图3，在录音记事本中，显示已保存的录音文件的文件名，例如，“张三_2020年5月26日”、“李四_2020年5月27日”和“王五_2020年6月12日”。并且，还可以在显示文件名时，同时显示该文件的关联性，例如，“张三_2020年5月26日”来自微信，则显示“微信”字样，以标识录音文件“张三_2020年5月26日”来源于微信。同样分别对应显示“李四_2020年5月27日”和“王五_2020年6月12日”的关联性QQ和电话。当接收到用户对录音文件李四的长按操作时，悬浮显示一目标语言选择界面。使得用户可以选择目标语音。例如，可以在该目标语言选择界面中显示“English”、“日本語”、“Deutsch”和

等可选目标语言。然后当用户选定目标语言后，可以跳转至播放页面播放该录音文件，并在播放页面以目标语言显示该音频文件对应的文本文件。

参照图4，在播放页面中，可以显示播放按钮、停止按钮和倍速选择按钮，还可以显示有播放进度显示控件。还可以在播放页面中，显示目标语音对应的文本。例如，当音频文件“张三_2020年5月26日”的对应的原始语言为中文，目标语言为英文时，可以以中文播放该音频文件，并在播放界面中，以英文显示该音频文件对应的文本内容。可选地，当然，也可以同时显示中文及英文文本。还可以将已播放的音频段对应的中文文本和为播放的音频段对应的中文文本区别显示，例如，加粗显示已播放的音频段对应的中文文本。可以理解的是，在根据音频文件生成文本文件时，可以先将音频文件转换成原始音频文件语言对应的文本文件，然后再将所述原始音频文件语言对应的文本文件翻译为目标语言对应的文本文件。可以理解的是，当原始音频文件语言与目标语言相同时，则无需翻译。

可选地，所述文本类应用可以于所述文本类应用保存原始音频文件和目标语言对应的文本文件；或者于所述文本类应用保存原始音频文件、原始音频文件语言对应的文本文件和目标语言对应的文本文件。

在本实施例公开的技术方案中，先展示一音频文件处理控制界面，以通过所述音频文件处理控制界面获取音频文件，然后将音频文件显示于一文本类应用，并于所述文本类应用中，根据所述音频文件生成目标语言对应的文本文件。其中，目标语音可以由用户自定义设置，由于可以将音频文件转换成目标语言对应的文本文件，从而避免了在通过音频文件保存或者传递信息时，受到用户语言能力水平的限制的缺陷，这样达成了减小通过音频文件保存或者传递信息时的局限性的效果。

可选地，基于上述实施例，在第一实施方式中，在上述文本类应用中，所述目标语言对应的文本文件以音频文件形式显示。所述文本文件与音频对应设置，即文本文件中的内容与音频文件的播放进度关联。使得用户选定文本文件的文件内容的一具体部分，终端可以对应播放旋转的文本内容相对应的音频文件的一段音频。

具体地，在根据音频文件生成目标语音对应的文本文件时，可以在语音识别过程中，实时获取音频文件的进度数据。将所述进度数据与相应文本内容关联。例如，当一音频第17秒至19秒对应的音频的内容为“这个世界充满爱”，目标语言为英文时，该音频文件的该段音频对应的文本文件中，与该段音频对应的文本内容为“The world is full oflove”。然后将“The world is full of love”与该音频文件的进度数据“17s-19s”关联保存。这样使得当用户在文本文件中选中“The world is full of love”时，可以播放该音频文件的第17s-19s。可以理解的是，本实施方式并不用于限定如何将文本内容与音频播放进度相关联，本实施方式仅提供一种可选实施方案。

可选地，基于上述实施例，在第二实施方案中，所述目标语言对应的文本文件和音频文件，或者原始音频文件和原始音频文件语音对应的文本文件，同时显示。

具体地，终端通过音频文件处理控制界面获取的音频文件可以作为原始音频，终端可以基于原始音频，生成原始音频语音对应的第一文本文件。也可以基于原始音频生成目标语音对应的第二音频文件，还可以基于原始音频生成目标语音对应的目标语音对应的音频文件。并将所述原始音频、第一文本文件、第二文本文件和目标语音对应的音频文件保存至上述文本类应用中。

文本类应用在进行文件展示时，可以在同一界面中展示原始音频和第一文本文件，也可以同时展示原始音频、第一文本文件和第二文本文件，也可以同时展示目标语音对应的音频文件和第二文本文件。本实施例并不限定不同类型文件的同时展示的组合方式。具体组合方式可以由用户自定义设置。

可选地，在本实施方式中，展示音频文件时，可以在音频文件展示区域设置一播放状态控制按钮，和/或播放进度指示件，使得用户可以通过播放装置控制按钮控制音频文件的播放状态，其中，所述播放状态包括播放和暂停。和/或通过播发进度指示件调节音频文件的播放进度和/或获悉音频文件的播放进度。

此外，还可以在音频文件的展示界面中，设置一倍速播放按钮，使得可以通过倍速播放按钮调节音频的播放速度。

可选地，在播放音频文件的同时，显示对应的文本文件时，可以根据播放进度突出显示文本文件中的文本内容。例如，音频文件的当前播放进度之前的音频内容对应的文本内容显示为红色，之后的音频内容对应的文本内容显示为绿色。或者，也可以不显示音频文件的当前播放进度之前的音频内容对应的文本内容。

可选地，基于上述实施例，在第三实施方式中，以音频文件形式显示的目标语言对应的文本文件，可导入至原始应用进行播放。

具体地，用户可以通过预设手势或者预设预显示界面中的控制控件触发音频文件调用的功能。当音频文件调用功能被触发时，任一应用均可以调用所述文本文件。并去，当一应用调用该文本文件后，可以在该应用中通过选定文本文件，或者触发语音播放功能的方式，播发该文本文件对应的音频文件。

示例性地，在产生一文本文件后，长按所述文本文件对应的显示区域，终端显示可选功能选择列表，该可选功能选择列表中包括将所述文本内容设置为备忘录。进而可以将所述文本内容保存至备忘录中。当用户打开备忘录时，可以在备忘录的显示界面中，查看所述文本文件。并基于所述备忘录中显示的所述文本文件，触发对应音频文件的播放动作。

可选地，基于上述实施例，在第四实施方式中，可以选择一不同语言的app，以音频文件形式显示所述目标语言对应的文本文件，所述目标语言与所述app对应的语言相同。

具体地，在本实施例中，目标语言可以根据选择的app的语音确定。例如，设置为与该app的语言相同。

可选地，所述目标语言也可以由系统自动确定。

具体地，可以获取终端设备的终端参数，然后根据所述终端参数确定所述目标语言。

示例性地，终端的系统可以获取自身定位信息，然后根据定位信息确定终端的当前所在区域。并获取当前所在区域的常用语言作为目标语言。或者终端可以获取系统语言，然后将系统语言作为所述目标语音。终端还可以获取用户的历史浏览习惯，然后确定用户的常用语言。并将所述常用语言设置为目标语言。

此外，本发明实施例还提出一种终端设备，所述终端设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的终端设备的控制程序，所述终端设备的控制程序被所述处理器执行时实现如上各个实施例所述的音频文件的处理方法的步骤。

此外，本发明实施例还提出一种计算机可读存储介质，所述计算机可读存储介质上存储有终端设备的控制程序，所述终端设备的控制程序被处理器执行时实现如上各个实施例所述的音频文件的处理方法的步骤。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体，意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是智能手机、平板电脑或者PC机等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种音频文件的处理方法，其特征在于，所述音频文件的处理方法包括以下步骤：

所述音频文件显示于一文本类应用；

2.如权利要求1所述的音频文件的处理方法，其特征在于，于所述文本类应用保存原始音频文件和所述目标语言对应的文本文件；或者于所述文本类应用保存所述原始音频文件、原始音频文件语言对应的文本文件和所述目标语言对应的文本文件。

3.如权利要求1所述的音频文件的处理方法，其特征在于，目标语言对应的文本文件以音频文件形式显示。

4.如权利要求3所述的音频文件的处理方法，其特征在于，所述目标语言对应的文本文件和音频文件，或者原始音频文件和原始音频文件语音对应的文本文件，同时显示。

5.如权利要求3所述的音频文件的处理方法，其特征在于，以音频文件形式显示的目标语言对应的文本文件，可导入至原始应用进行播放。

6.如权利要求3所述的音频文件的处理方法，其特征在于，选择一不同语言的app，以音频文件形式显示所述目标语言对应的文本文件，所述目标语言与所述app对应的语言相同。

7.如权利要求1所述的音频文件的处理方法，其特征在于，所述根据所述音频文件生成目标语言对应的文本文件的步骤之前，还包括如下至少一种：

获取终端设备的终端参数；

根据所述终端参数确定所述目标语言。

8.如权利要求1所述的音频文件的处理方法，其特征在于，所述根据所述音频文件生成目标语言对应的文本文件的步骤包括：

9.如权利要求1所述的音频文件的处理方法，其特征在于，根据所述音频文件的播放进度确定所述展示界面中展示的所述文本文件的突出显示的内容。

10.如权利要求9所述的音频文件的处理方法，其特征在于，根据音频播放的内容，同步显示目标语言对应的文本文件。

11.如权利要求10所述的音频文件的处理方法，其特征在于，已经播放的音频对应的目标语言对应的文本文件可继续显示或不显示。

12.一种终端设备，其特征在于，所述终端设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的终端设备的控制程序，所述终端设备的控制程序被所述处理器执行时实现如权利要求1至11至中任一项所述的音频文件的处理方法的步骤。

13.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有终端设备的控制程序，所述终端设备的控制程序被处理器执行时实现如权利要求1至11中任一项所述的音频文件的处理方法的步骤。