CN110955402B

CN110955402B - 基于网页的录音方法、装置、设备及存储介质

Info

Publication number: CN110955402B
Application number: CN201910968783.5A
Authority: CN
Inventors: 成飞龙
Original assignee: Ping An Bank Co Ltd
Current assignee: Ping An Bank Co Ltd
Priority date: 2019-10-12
Filing date: 2019-10-12
Publication date: 2023-01-20
Anticipated expiration: 2039-10-12
Also published as: CN110955402A

Abstract

本发明提供一种基于网页的录音方法、装置、设备及存储介质，即通过在接收到网页录音指令时，通过前端网页中的媒体输入接口调用终端麦克风，并通过所述终端麦克风获取待录入的音频源数据；通过音频接口创建音频处理实例，基于所述音频处理实例存储所述音频源数据，并通过所述音频处理实例将所述音频源数据转码为标准MP3格式；将标准MP3格式的音频源数据推送至所述前端网页，以便用户在所述前端网页中进行所述音频源数据的下载播放。本发明基于音频接口创建音频处理实例，用于存储及转码所述音频源数据，便于在前端网页中播放该音频源数据，简化了音频源数据的录入播放组件，提升了用户体验。

Description

基于网页的录音方法、装置、设备及存储介质

技术领域

本发明涉及数据处理技术领域，尤其涉及一种基于网页的录音方法、装置、设备及计算机可读存储介质。

背景技术

随着语音交互方式的日益普及，网页Web录音功能的需求开始变得迫在眉睫。在传统Web技术环境下，前端需要基于Flash的方式来间接实现Web录音等功能。但是Flash在Web当中使用不方便，不仅需要下载浏览器组件支持，而且难以维护。因此，如何解决现有录音方法需要下载浏览器组件支持以及难以维护的技术问题，成为了目前亟待解决的技术问题。

发明内容

本发明的主要目的在于提供一种基于网页的录音方法、装置、设备及计算机可读存储介质，旨在解决现有录音方法需要下载浏览器组件支持以及难以维护的技术问题。

为实现上述目的，本发明提供一种基于网页的录音方法，所述基于网页的录音方法应用于所述基于网页的录音方法包括以下步骤：

在接收到网页录音指令时，通过前端网页中的媒体输入接口调用终端麦克风，并通过所述终端麦克风获取待录入的音频源数据；

通过音频接口创建音频处理实例，基于所述音频处理实例存储所述音频源数据，并通过所述音频处理实例将所述音频源数据转码为标准MP3格式；

将标准MP3格式的音频源数据推送至所述前端网页，以便用户在所述前端网页中进行所述音频源数据的下载播放。

可选地，所述通过音频接口创建音频处理实例，基于所述音频处理实例存储所述音频源数据，并通过所述音频处理实例将所述音频源数据转码为标准MP3格式的步骤具体包括：

通过所述音频接口创建音频处理实例，启用所述音频处理实例中的第一进程存储基于所述终端麦克风录入的音频源数据；

启用所述音频处理实例中的第二进程获取所述第一进程中的音频源数据，并将所述音频源数据转码为所述标准MP3格式。

可选地，所述启用所述音频处理实例中的第二进程获取所述第一进程中的音频源数据，并将所述音频源数据转码为所述标准MP3格式的步骤具体包括：

启用所述音频处理实例中的第二进程获取所述第一进程中的音频源数据，并通过LAME库将所述音频源数据转码为标准MP3格式。

可选地，所述在接收到网页录音指令时，通过前端网页中的媒体输入接口调用终端麦克风，并通过所述终端麦克风获取待录入的音频源数据的步骤具体包括：

在接收到网页录音指令时，获取所述前端网页的目标环境类型，并根据所述目标环境类型确定对应类型的媒体输入接口；

通过所述对应类型的媒体输入接口调用所述终端麦克风，并通过所述终端麦克风获取待录入的音频源数据。

在接收到网页录音指令时，生成并显示获取所述终端麦克风录入权限的授权提醒消息；

判断是否接收到用户基于所述授权提醒消息触发的授权指令；

在接收到所述授权指令时，通过所述前端网页中的媒体输入接口调用所述终端麦克风，以获取待录入的音频源数据，并通过所述终端麦克风获取待录入的音频源数据。

可选地，所述判断是否接收到用户基于所述授权提醒消息触发的授权指令的步骤之后，还包括：

在接收到用户基于所述授权提醒消息触发的拒绝指令时，生成前端网页不具有麦克风的获取权限的录音失败提醒消息，并显示所述录音失败提醒消息以及所述终端麦克风录入权限的授权入口，以便用户基于所述授权入口进行再次授权。

可选地，所述将标准MP3格式的音频源数据推送至所述前端网页，以便用户在所述前端网页中进行所述音频源数据的下载播放的步骤之后，还包括：

将所述标准MP3格式的音频源数据转换为二进制大对象类型Blob类型，并将Blob类型的MP3格式的音频源数据推送至所述前端网页，以便用户基于所述前端网页中的Audio标签下载播放所述音频源数据。

此外，为实现上述目的，本发明还提供一种基于网页的录音装置，所述基于网页的录音装置包括：

音频录入模块，用于在接收到网页录音指令时，通过前端网页中的媒体输入接口调用终端麦克风，并通过所述终端麦克风获取待录入的音频源数据；

音频转码模块，用于通过音频接口创建音频处理实例，基于所述音频处理实例存储所述音频源数据，并通过所述音频处理实例将所述音频源数据转码为标准MP3格式；

音频推送模块，用于将标准MP3格式的音频源数据推送至所述前端网页，以便用户在所述前端网页中进行所述音频源数据的下载播放。

此外，为实现上述目的，本发明还提供一种基于网页的录音设备，所述基于网页的录音设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的基于网页的录音程序，其中所述基于网页的录音程序被所述处理器执行时，实现如上述的基于网页的录音方法的步骤。

此外，为实现上述目的，本发明还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有基于网页的录音程序，其中所述基于网页的录音程序被处理器执行时，实现如上述的基于网页的录音方法的步骤。

本发明提供一种基于网页的录音方法，所述基于网页的录音方法通过在接收到网页录音指令时，通过前端网页中的媒体输入接口调用终端麦克风，并通过所述终端麦克风获取待录入的音频源数据；通过音频接口创建音频处理实例，基于所述音频处理实例存储所述音频源数据，并通过所述音频处理实例将所述音频源数据转码为标准MP3格式；将标准MP3格式的音频源数据推送至所述前端网页，以便用户在所述前端网页中进行所述音频源数据的下载播放。通过上述方式，本发明通过媒体输入接口调用麦克风以获取待录入的音频源数据，然后基于音频接口创建音频处理实例，用于存储及转码所述音频源数据，便于在前端网页中播放该音频源数据，简化了音频源数据的录入播放组件，提升了用户体验，解决了现有录音方法需要下载浏览器组件支持以及难以维护的技术问题。

附图说明

图1为本发明实施例方案中涉及的基于网页的录音设备的硬件结构示意图；

图2为本发明基于网页的录音方法第一实施例的流程示意图；

图3为本发明基于网页的录音方法第二实施例的流程示意图；

图4为本发明基于网页的录音方法第三实施例的流程示意图；

图5为本发明基于网页的录音装置第一实施例的功能模块示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

本发明实施例涉及的基于网页的录音方法主要应用于基于网页的录音设备，该基于网页的录音设备可以是PC、便携计算机、移动终端等具有显示和处理功能的设备。

参照图1，图1为本发明实施例方案中涉及的基于网页的录音设备的硬件结构示意图。本发明实施例中，基于网页的录音设备可以包括处理器1001(例如CPU)，通信总线1002，用户接口1003，网络接口1004，存储器1005。其中，通信总线1002用于实现这些组件之间的连接通信；用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard)；网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)；存储器1005可以是高速RAM存储器，也可以是稳定的存储器(non-volatile memory)，例如磁盘存储器，存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解，图1中示出的硬件结构并不构成对基于网页的录音设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

继续参照图1，图1中作为一种计算机可读存储介质的存储器1005可以包括操作系统、网络通信模块以及基于网页的录音程序。

在图1中，网络通信模块主要用于连接服务器，与服务器进行数据通信；而处理器1001可以调用存储器1005中存储的基于网页的录音程序，并执行本发明实施例提供的基于网页的录音方法。

本发明实施例提供了一种基于网页的录音方法。

参照图2，图2为本发明基于网页的录音方法第一实施例的流程示意图。

本实施例中，所述基于网页的录音方法包括以下步骤：

步骤S10，在接收到网页录音指令时，通过前端网页中的媒体输入接口调用终端麦克风，并通过所述终端麦克风获取待录入的音频源数据；

随着语音交互方式的日益普及，网页Web录音功能的需求开始变得迫在眉睫。在传统Web技术环境下，前端需要基于Flash的方式来间接实现Web录音等功能。但是Flash在Web当中使用不方便，不仅需要下载浏览器组件支持，而且难以维护。本实施例中为了解决上述问题，通过媒体输入接口调用麦克风以获取待录入的音频源数据，然后基于音频接口创建音频处理实例，用于存储及转码所述音频源数据，便于在前端网页中播放该音频源数据，简化了音频源数据的录入播放组件。具体地，在接收到用户基于网页中的录音按钮触发的网页录音指令时，启用所述前端网页中的媒体输入接口，即媒体接口函数mediaDevices API中的getUserMedia方法，调起当前终端的终端麦克风，以通过所述终端麦克风接收用户输入的音频源数据。其中，mediaDevices API需要在https环境下才能正常运行，其他环境下也可以使用其他函数接口。

进一步地，所述步骤S10具体包括：

本实施例中，根据浏览器安全策略，首先需要经过用户授权，即生成是否授权的提醒消息，在得到用户操作触发的授权指令之后，通过媒体接口函数mediaDevices API中的getUserMedia方法尝试调起用户的麦克风功能。具体地，在接收到网页录音指令时，生成并显示获取所述终端麦克风录入权限的授权提醒消息；用户可基于所述授权提醒消息对所述前端网页进行麦克风录入权限的授权。用户同意授权，即在接收到所述授权指令时，通过所述前端网页中的媒体输入接口调用所述终端麦克风，以获取待录入的音频源数据，并通过所述终端麦克风获取待录入的音频源数据。用户不同意授权，即在接收到用户基于所述授权提醒消息触发的拒绝指令时，生成前端网页不具有麦克风的获取权限的录音失败提醒消息，并显示所述录音失败提醒消息以及所述终端麦克风录入权限的授权入口，以便用户基于所述授权入口进行再次授权。用户可基于所述授权入口快捷对所述前端网页进行麦克风权限的授权。

步骤S20，通过音频接口创建音频处理实例，基于所述音频处理实例存储所述音频源数据，并通过所述音频处理实例将所述音频源数据转码为标准MP3格式；

本实施例中，在成功调用用户麦克风权限之后，通过AudioContext方法创建音频处理实例，该音频处理实例可以在录音时实时处理录入的音频源。在接收到麦克风录入的音频源之后，需要将该录入的音频源进行编码转码。通过Web Worker API创建Worker实例，即建立前端新的独立进程用以在录音过程中实现一边实时录音的同时，一边在新进程中将录入的音频源进行转码。由此在不阻塞主进程(录入音频)的情况下，实现录音与转码同步进行，提升录音效率。并在转码录音的同时，通过AudioContext的实例实时监听录音过程，然后将转码后的录音源数据buffer推送至Worker实例的分支进程中。由于我们想产出最终在H5中普及可用的音频格式，因此将录音源数据buffer的录音文件转码成mp3格式。通过在Worker实例的分支进程中引入LAME库，由此支持mp3的转码工作，在分支进程当中接收到主进程postMessage过来的buffer录音源数据时进行实时转码。其中，最终生成的音频质量为：采样频率默认为44100Hz是标准MP3采样率，比特率默认为128kbps是标准MP3质量。

步骤S30，将标准MP3格式的音频源数据推送至所述前端网页，以便用户在所述前端网页中进行所述音频源数据的下载播放。。

本实施例中，最终在录音完成时，将音频mp3以Blob的格式推送给前端，此格式可以直接在前端利用audio标签放在src中使用，进行播放等后续操作，也可以download直接下载到本地。

本实施例提供一种基于网页的录音方法，所述基于网页的录音方法通过在接收到网页录音指令时，通过前端网页中的媒体输入接口调用终端麦克风，并通过所述终端麦克风获取待录入的音频源数据；通过音频接口创建音频处理实例，基于所述音频处理实例存储所述音频源数据，并通过所述音频处理实例将所述音频源数据转码为标准MP3格式；将标准MP3格式的音频源数据推送至所述前端网页，以便用户在所述前端网页中进行所述音频源数据的下载播放。通过上述方式，本发明通过媒体输入接口调用麦克风以获取待录入的音频源数据，然后基于音频接口创建音频处理实例，用于存储及转码所述音频源数据，便于在前端网页中播放该音频源数据，简化了音频源数据的录入播放组件，提升了用户体验，解决了现有录音方法需要下载浏览器组件支持以及难以维护的技术问题。

参照图3，图3为本发明基于网页的录音方法第二实施例的流程示意图。

基于上述图2所示实施例，本实施例中，所述步骤S20具体包括：

步骤S21，通过所述音频接口创建音频处理实例，启用所述音频处理实例中的第一进程存储基于所述终端麦克风录入的音频源数据；

步骤S22，启用所述音频处理实例中的第二进程获取所述第一进程中的音频源数据，并将所述音频源数据转码为所述标准MP3格式。

其中，所述步骤S22具体包括：

本实施例中，为了提高所述音频处理实例的处理效率，通过两个进程分别存储所述音频源数据和转码所述音频源数据。具体地，通过Web Worker API创建Worker实例，即建立前端新的独立进程用以在录音过程中实现一边实时录音的同时，一边在新进程中将录入的音频源进行转码。由此在不阻塞主进程(录入音频)的情况下，实现录音与转码同步进行，提升录音效率。为了最终在H5中普及可用的音频格式，将录音源数据buffer的录音文件转码成mp3格式。通过在Worker实例的分支进程中引入LAME库，由此支持mp3的转码工作，在分支进程当中接收到主进程postMessage过来的buffer录音源数据时进行实时转码，即将音频源数据转码为标准MP3格式。

本实施例提供一种基于网页的录音方法，本发明通过媒体输入接口调用麦克风以获取待录入的音频源数据，然后基于音频接口创建音频处理实例，用于存储及转码所述音频源数据，便于在前端网页中播放该音频源数据，简化了音频源数据的录入播放组件，提升了用户体验，解决了现有录音方法需要下载浏览器组件支持以及难以维护的技术问题。并进一步为了提高所述音频处理实例的处理效率，通过两个进程分别存储所述音频源数据和转码所述音频源数据。

参照图4，图4为本发明基于网页的录音方法第三实施例的流程示意图。

基于上述图2所示实施例，本实施例中，所述步骤S10具体包括：

步骤S11，在接收到网页录音指令时，获取所述前端网页的目标环境类型，并根据所述目标环境类型确定对应类型的媒体输入接口；

步骤S12，通过所述对应类型的媒体输入接口调用所述终端麦克风，并通过所述终端麦克风获取待录入的音频源数据。

本实施例中，由于媒体输入接口在某些环境下才能正常运行，因此需要预先确定前端网页的目标环境类型，然后调起对应的媒体输入接口，具体地，mediaDevices API需要在https环境下才能正常运行，在接收到网页录音指令时，获取所述前端网页的目标环境类型，若判定所述目标环境类型为https环境，则将mediaDevices API确定为对应类型的媒体输入接口。然后通过所述对应类型的媒体输入接口，即通过媒体接口函数mediaDevicesAPI中的getUserMedia方法尝试调起用户的麦克风功能，然后通过所述终端麦克风获取待录入的音频源数据。

进一步地，所述步骤S30之后，还包括：

将所述标准MP3格式的音频源数据转换为Blob类型，并将Blob类型的MP3格式的音频源数据推送至所述前端网页，以便用户基于所述前端网页中的Audio标签下载播放所述音频源数据。

本实施例中，将mp3格式的音频源数据转换为二进制大对象类型Blob类型格式，然后以Blob的类型格式推送给前端。其中，Blob类型用来存储二进制文件的字段类型，如一个声音文件。Blob格式的可以直接在前端利用audio标签放在src中使用，进行播放等后续操作，也可以download直接下载到本地。

本实施例提供一种基于网页的录音方法，本发明通过媒体输入接口调用麦克风以获取待录入的音频源数据，然后基于音频接口创建音频处理实例，用于存储及转码所述音频源数据，便于在前端网页中播放该音频源数据，简化了音频源数据的录入播放组件，提升了用户体验，解决了现有录音方法需要下载浏览器组件支持以及难以维护的技术问题。并将所述音频源数据转换为可直接播放或直接下载的音频格式，进一步提升用户体验。

此外，本发明实施例还提供一种基于网页的录音装置。

参照图5，图5为本发明基于网页的录音装置第一实施例的功能模块示意图。

本实施例中，所述基于网页的录音装置包括：

音频录入模块10，用于在接收到网页录音指令时，通过前端网页中的媒体输入接口调用终端麦克风，并通过所述终端麦克风获取待录入的音频源数据；

音频转码模块20，用于通过音频接口创建音频处理实例，基于所述音频处理实例存储所述音频源数据，并通过所述音频处理实例将所述音频源数据转码为标准MP3格式；

音频推送模块30，用于将标准MP3格式的音频源数据推送至所述前端网页，以便用户在所述前端网页中进行所述音频源数据的下载播放。

进一步地，所述音频转码模块20具体包括：

音频存储单元，用于通过所述音频接口创建音频处理实例，启用所述音频处理实例中的第一进程存储基于所述终端麦克风录入的音频源数据；

音频转码单元，用于启用所述音频处理实例中的第二进程获取所述第一进程中的音频源数据，并将所述音频源数据转码为所述标准MP3格式。

进一步地，所述音频转码单元还用于：

进一步地，所述音频录入模块10具体包括：

接口确认单元，用于在接收到网页录音指令时，获取所述前端网页的目标环境类型，并根据所述目标环境类型确定对应类型的媒体输入接口；

音频录入单元，用于通过所述对应类型的媒体输入接口调用所述终端麦克风，并通过所述终端麦克风获取待录入的音频源数据。

进一步地，所述音频录入模块10还用于：

进一步地，所述基于网页的录音装置还包括：

音频类型转换模块，用于将所述标准MP3格式的音频源数据转换为Blob类型，并将Blob类型的MP3格式的音频源数据推送至所述前端网页，以便用户基于所述前端网页中的Audio标签下载播放所述音频源数据。

其中，上述基于网页的录音装置中各个模块与上述基于网页的录音方法实施例中各步骤相对应，其功能和实现过程在此处不再一一赘述。

此外，本发明实施例还提供一种计算机可读存储介质。

本发明计算机可读存储介质上存储有基于网页的录音程序，其中所述基于网页的录音程序被处理器执行时，实现如上述的基于网页的录音方法的步骤。

其中，基于网页的录音程序被执行时所实现的方法可参照本发明基于网页的录音方法的各个实施例，此处不再赘述。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种基于网页的录音方法，其特征在于，所述基于网页的录音方法包括以下步骤：

将标准MP3格式的音频源数据推送至所述前端网页，以便用户在所述前端网页中进行所述音频源数据的下载播放；

所述通过音频接口创建音频处理实例，基于所述音频处理实例存储所述音频源数据，并通过所述音频处理实例将所述音频源数据转码为标准MP3格式的步骤具体包括：

基于所述音频接口，通过AudioContext方式创建音频处理实例，启用所述音频处理实例中的第一进程存储基于所述终端麦克风录入的音频源数据；

启用所述音频处理实例中的第二进程获取所述第一进程中的音频源数据；

通过Web Worker API创建Worker实例，并通过Worker实例将所述音频源数据实时转码得到录音源数据buffer；

通过所述Worker实例的分支进程中的LAME库将所述录音源数据buffer实时转码为标准MP3格式；

所述在接收到网页录音指令时，通过前端网页中的媒体输入接口调用终端麦克风，并通过所述终端麦克风获取待录入的音频源数据的步骤具体包括：

在接收到网页录音指令时，获取所述前端网页的目标环境类型；

在所述目标环境类型为https环境时，将所述前端网页中的媒体输入接口确定为mediaDevices API；

通过所述mediaDevices API中的getUserMedia调用所述终端麦克风，并通过所述终端麦克风获取待录入的音频源数据。

2.如权利要求1所述的基于网页的录音方法，其特征在于，所述在接收到网页录音指令时，通过前端网页中的媒体输入接口调用终端麦克风，并通过所述终端麦克风获取待录入的音频源数据的步骤具体包括：

3.如权利要求2所述的基于网页的录音方法，其特征在于，所述判断是否接收到用户基于所述授权提醒消息触发的授权指令的步骤之后，还包括：

4.如权利要求1至3任意一项所述的基于网页的录音方法，其特征在于，所述将标准MP3格式的音频源数据推送至所述前端网页，以便用户在所述前端网页中进行所述音频源数据的下载播放的步骤之后，还包括：

5.一种基于网页的录音装置，其特征在于，所述基于网页的录音装置包括：

音频推送模块，用于将标准MP3格式的音频源数据推送至所述前端网页，以便用户在所述前端网页中进行所述音频源数据的下载播放；

所述音频转码模块，包括：

存储单元，用于基于所述音频接口，通过AudioContext方式创建音频处理实例，启用所述音频处理实例中的第一进程存储基于所述终端麦克风录入的音频源数据；

获取单元，用于启用所述音频处理实例中的第二进程获取所述第一进程中的音频源数据；

第一转码单元，用于通过Web Worker API创建Worker实例，并通过Worker实例将所述音频源数据实时转码得到录音源数据buffer；

第一转码单元，用于通过所述Worker实例的分支进程中的LAME库将所述录音源数据buffer实时转码为标准MP3格式；

所述音频录入模块，用于：

在所述目标环境类型为https环境时，将mediaDevices API确定为对应类型的媒体输入接口；

通过所述mediaDevices API中的getUserMedia调起所述终端麦克风，并通过所述终端麦克风获取待录入的音频源数据。

6.一种基于网页的录音设备，其特征在于，所述基于网页的录音设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的基于网页的录音程序，其中所述基于网页的录音程序被所述处理器执行时，实现如权利要求1至4中任一项所述的基于网页的录音方法的步骤。

7.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有基于网页的录音程序，其中所述基于网页的录音程序被处理器执行时，实现如权利要求1至4中任一项所述的基于网页的录音方法的步骤。