CN109189364A

CN109189364A - 一种多信道语音采集系统及方法

Info

Publication number: CN109189364A
Application number: CN201810896691.6A
Authority: CN
Inventors: 刘翔鹏; 肖龙源; 李稀敏; 蔡振华; 刘晓葳; 谭玉坤
Original assignee: Xiamen Kuaishangtong Technology Corp ltd
Current assignee: Xiamen Kuaishangtong Technology Corp ltd
Priority date: 2018-08-08
Filing date: 2018-08-08
Publication date: 2019-01-11
Anticipated expiration: 2038-08-08
Also published as: CN109189364B

Abstract

本发明公开了一种多信道语音采集系统及方法，其包括两个以上的用户端，所述用户端与服务端采用B/S架构部署，服务端为用户端提供登录界面，所述两个以上的用户端通过所述登录界面登录服务端；所述两个以上的用户端的其中之一创建录音任务；所述两个以上的用户端根据所述录音任务进入同一语音录制房间；控制所述两个以上的用户端执行语音录制；从而使得多个用户端同时进行语音录制，实现多信道语音采集；并且，本发明直接多个信道一起录制，不需要模拟信道，所以没有后处理，成本较低，并且方便简洁。

Description

一种多信道语音采集系统及方法

技术领域

本发明涉及通信技术领域，特别是一种多信道语音采集方法及对应的方法。

背景技术

语音识别属于人工智能和机器学习任务的一种应用，其中，机器学习任务一般分为训练和预测两个过程：训练过程对已知样本进行总结归纳，形成模型；预测过程则利用该模型对未知样本进行预测。那么预测的结果将取决于模型的完善性和准确性。

在语音通信过程中，语音信号在采集、编码、解码和信道传输的过程中会产生一定的损失，使语音信号发生畸变，而不同采集装置和不同的编解码方法对语音的畸变程度不一样。

但是，现有语音数据采集系统为单信道采集，或者是PC端录音或者是手机端录音。由于这种通信信道和通信工具的任意变化引起的语音信号的不同畸变，导致了语音识别处理中训练数据和测试数据的信道不匹配，严重影响了连续语音识别、声纹识别、语种识别和语音情感识别等语音识别技术的应用效果。

因此，在语音识别技术领域，如何改善识别系统在不同信道环境下的识别稳定性，提高系统的鲁棒性和普适性已经成为当前语音识别系统中亟待解决的实际问题。

发明内容

本发明为解决上述问题，提供了一种多信道语音采集系统及方法，一次语音录音采集可覆盖多信道同时采集，极大的提高了语音识别系统在不同信道环境下的识别稳定性。

为实现上述目的，本发明采用的技术方案为：

一种多信道语音采集系统，其包括：

登录验证模块，用于连接两个以上的用户端，所述用户端与服务端采用B/S架构部署，服务端为用户端提供登录界面；

录音任务创建模块，其通过所述两个以上的用户端的其中之一创建录音任务；

多信道互连模块，使得所述两个以上的用户端根据所述录音任务进入同一语音录制房间；

多信道录音模块，用于控制所述两个以上的用户端执行语音录制。

优选的，所述服务端设置于虚拟机上。

优选的，所述用户端包括电脑PC端、安卓移动端、ios移动端，通过在所述电脑PC端上创建录音任务，所述安卓移动端和所述ios移动端根据所述录音任务与所述电脑PC端进入同一语音录制房间。

进一步的，所述电脑PC端根据所述录音任务生成二维码，所述安卓移动端和所述ios移动端通过扫描所述二维码与所述电脑PC端进入同一语音录制房间。

优选的，所述多信道互连模块中，进一步在所述语音录制房间显示各个用户端的连接状态。

优选的，所述多信道录音模块中，通过websocket技术由所述两个以上的用户端的其中之一同时统一控制所有的所述两个以上的用户端进行语音录制。

进一步的，所述多信道录音模块中，通过websocket技术由所述电脑PC端同时统一控制所述的电脑PC端、安卓移动端及ios移动端进行语音录制。

对应的，本发明还提供一种多信道语音采集方法，其包括两个以上的用户端，所述用户端与服务端采用B/S架构部署，服务端为用户端提供登录界面，所述方法包括以下步骤：

a.所述两个以上的用户端通过所述登录界面登录服务端；

b.所述两个以上的用户端的其中之一创建录音任务；

c.所述两个以上的用户端根据所述录音任务进入同一语音录制房间；

d.控制所述两个以上的用户端执行语音录制。

本发明的有益效果是：

(1)本发明的用户端与服务端采用B/S架构部署，通过其中之一的用户端创建录音任务，其余的用户端根据所述录音任务加入同一个语音录制房间，从而使得多个用户端同时进行语音录制，实现多信道语音采集；

(2)本发明直接多个信道一起录制，不需要模拟信道，所以没有后处理，成本较低，并且方便简洁；

(3)本发明的多信道语音采集主要是通过电脑PC端、安卓移动端、ios移动端的三信道同时采集的方法，通用性较强，适用范围较广；

(4)本发明通过在电脑PC端生成二维码，安卓移动端和ios移动端通过扫描所述二维码与所述电脑PC端进入同一语音录制房间，操作方便快捷。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本发明的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1为本发明一种多信道语音采集系统的二维码生成界面示意图；

图2为本发明一种多信道语音采集系统的录制房间的界面示意图；

图3为本发明一种多信道语音采集系统的连接状态的界面示意图。

具体实施方式

为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚、明白，以下结合附图及实施例对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

本发明的一种多信道语音采集系统，其包括：

本实施例中，所述服务端设置于虚拟机上。所述的登录验证模块中，所述B/S结构(Browser/Server，浏览器/服务器模式)，是WEB兴起后的一种网络结构模式，WEB浏览器是用户端最主要的应用软件，这种模式统一了用户端，将系统功能实现的核心部分集中到服务器上，简化了系统的开发、维护和使用。客户机上只要安装一个浏览器，如NetscapeNavigator或Internet Explorer，服务器安装SQL Server、Oracle、MYSQL等数据库。浏览器通过Web Server同数据库进行数据交互，用户端通过浏览器登录服务端提供的登录界面。

所述录音任务创建模块中，所述用户端包括电脑PC端、安卓移动端、ios移动端，并且，所述电脑PC端、安卓移动端及ios移动端分别安装有web浏览器；通过在所述电脑PC端上创建录音任务，所述安卓移动端和所述ios移动端根据所述录音任务与所述电脑PC端进入同一语音录制房间。本实施例中，所述电脑PC端根据所述录音任务生成二维码(如图1所示)，所述安卓移动端和所述ios移动端通过扫描所述二维码与所述电脑PC端进入同一语音录制房间(如图2所示)。

所述多信道互连模块中，所述两个以上的用户端根据所述录音任务进入同一语音录制房间，并进一步在所述语音录制房间显示各个用户端的连接状态。例如，所述电脑PC端上创建录音任务，自动默认为所述电脑PC端为在线状态，所述安卓移动端和所述ios移动端此时为离线状态；所述安卓移动端和所述ios移动端通过扫描所述二维码后，连接状态由离线状态切换为在线状态。各个用户端全部为在线状态后，即可启动语音录制(如图3所示)。另外，还可设置录音的音量等参数。

所述多信道录音模块中，通过websocket技术由所述两个以上的用户端的其中之一同时统一控制所有的所述两个以上的用户端进行语音录制。本实施例中，所述多信道录音模块通过websocket技术由所述电脑PC端同时统一控制所述的电脑PC端、安卓移动端及ios移动端进行语音录制。其中，所述websocket技术是用于在Web浏览器和服务器之间进行任意的双向数据传输的一种技术。WebSocket协议基于TCP协议实现，包含初始的握手过程，以及后续的多次数据帧双向传输过程。其目的是在WebSocket应用和WebSocket服务器进行频繁双向通信时，可以使服务器避免打开多个HTTP连接进行工作来节约资源，提高了工作效率和资源利用率。

如图2所示，本发明还提供一种多信道语音采集方法，其包括两个以上的用户端，所述用户端与服务端采用B/S架构部署，服务端为用户端提供登录界面，所述方法包括以下步骤：

a.所述两个以上的用户端通过所述登录界面登录服务端；

b.所述两个以上的用户端的其中之一创建录音任务；

d.控制所述两个以上的用户端执行语音录制。

需要说明的是，本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。对于方法实施例而言，由于其与系统实施例基本相似，所以描述的比较简单，相关之处参见系统实施例的部分说明即可。

并且，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。另外，本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

上述说明示出并描述了本发明的优选实施例，应当理解本发明并非局限于本文所披露的形式，不应看作是对其他实施例的排除，而可用于各种其他组合、修改和环境，并能够在本文发明构想范围内，通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围，则都应在本发明所附权利要求的保护范围内。

Claims

1.一种多信道语音采集系统，其特征在于，包括：

2.根据权利要求1所述的一种多信道语音采集系统，其特征在于：所述服务端设置于虚拟机上。

3.根据权利要求1所述的一种多信道语音采集系统，其特征在于：所述用户端包括电脑PC端、安卓移动端、ios移动端，通过在所述电脑PC端上创建录音任务，所述安卓移动端和所述ios移动端根据所述录音任务与所述电脑PC端进入同一语音录制房间。

4.根据权利要求3所述的一种多信道语音采集系统，其特征在于：所述电脑PC端根据所述录音任务生成二维码，所述安卓移动端和所述ios移动端通过扫描所述二维码与所述电脑PC端进入同一语音录制房间。

5.根据权利要求1所述的一种多信道语音采集系统，其特征在于：所述多信道互连模块中，进一步在所述语音录制房间显示各个用户端的连接状态。

6.根据权利要求3所述的一种多信道语音采集系统，其特征在于：所述多信道录音模块中，通过websocket技术由所述两个以上的用户端的其中之一同时统一控制所有的所述两个以上的用户端进行语音录制。

7.根据权利要求6所述的一种多信道语音采集系统，其特征在于：所述多信道录音模块中，通过websocket技术由所述电脑PC端同时统一控制所述的电脑PC端、安卓移动端及ios移动端进行语音录制。

8.一种多信道语音采集方法，其特征在于，包括两个以上的用户端，所述用户端与服务端采用B/S架构部署，服务端为用户端提供登录界面，所述方法包括以下步骤：

a.所述两个以上的用户端通过所述登录界面登录服务端；

b.所述两个以上的用户端的其中之一创建录音任务；

d.控制所述两个以上的用户端执行语音录制。