CN109189364A - 一种多信道语音采集系统及方法 - Google Patents

一种多信道语音采集系统及方法 Download PDF

Info

Publication number
CN109189364A
CN109189364A CN201810896691.6A CN201810896691A CN109189364A CN 109189364 A CN109189364 A CN 109189364A CN 201810896691 A CN201810896691 A CN 201810896691A CN 109189364 A CN109189364 A CN 109189364A
Authority
CN
China
Prior art keywords
user terminals
recording
mobile terminal
multi channel
speech acquisition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810896691.6A
Other languages
English (en)
Other versions
CN109189364B (zh
Inventor
刘翔鹏
肖龙源
李稀敏
蔡振华
刘晓葳
谭玉坤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen Kuaishangtong Technology Corp ltd
Original Assignee
Xiamen Kuaishangtong Technology Corp ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen Kuaishangtong Technology Corp ltd filed Critical Xiamen Kuaishangtong Technology Corp ltd
Priority to CN201810896691.6A priority Critical patent/CN109189364B/zh
Publication of CN109189364A publication Critical patent/CN109189364A/zh
Application granted granted Critical
Publication of CN109189364B publication Critical patent/CN109189364B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种多信道语音采集系统及方法,其包括两个以上的用户端,所述用户端与服务端采用B/S架构部署,服务端为用户端提供登录界面,所述两个以上的用户端通过所述登录界面登录服务端;所述两个以上的用户端的其中之一创建录音任务;所述两个以上的用户端根据所述录音任务进入同一语音录制房间;控制所述两个以上的用户端执行语音录制;从而使得多个用户端同时进行语音录制,实现多信道语音采集;并且,本发明直接多个信道一起录制,不需要模拟信道,所以没有后处理,成本较低,并且方便简洁。

Description

一种多信道语音采集系统及方法
技术领域
本发明涉及通信技术领域,特别是一种多信道语音采集方法及对应的方法。
背景技术
语音识别属于人工智能和机器学习任务的一种应用,其中,机器学习任务一般分为训练和预测两个过程:训练过程对已知样本进行总结归纳,形成模型;预测过程则利用该模型对未知样本进行预测。那么预测的结果将取决于模型的完善性和准确性。
在语音通信过程中,语音信号在采集、编码、解码和信道传输的过程中会产生一定的损失,使语音信号发生畸变,而不同采集装置和不同的编解码方法对语音的畸变程度不一样。
但是,现有语音数据采集系统为单信道采集,或者是PC端录音或者是手机端录音。由于这种通信信道和通信工具的任意变化引起的语音信号的不同畸变,导致了语音识别处理中训练数据和测试数据的信道不匹配,严重影响了连续语音识别、声纹识别、语种识别和语音情感识别等语音识别技术的应用效果。
因此,在语音识别技术领域,如何改善识别系统在不同信道环境下的识别稳定性,提高系统的鲁棒性和普适性已经成为当前语音识别系统中亟待解决的实际问题。
发明内容
本发明为解决上述问题,提供了一种多信道语音采集系统及方法,一次语音录音采集可覆盖多信道同时采集,极大的提高了语音识别系统在不同信道环境下的识别稳定性。
为实现上述目的,本发明采用的技术方案为:
一种多信道语音采集系统,其包括:
登录验证模块,用于连接两个以上的用户端,所述用户端与服务端采用B/S架构部署,服务端为用户端提供登录界面;
录音任务创建模块,其通过所述两个以上的用户端的其中之一创建录音任务;
多信道互连模块,使得所述两个以上的用户端根据所述录音任务进入同一语音录制房间;
多信道录音模块,用于控制所述两个以上的用户端执行语音录制。
优选的,所述服务端设置于虚拟机上。
优选的,所述用户端包括电脑PC端、安卓移动端、ios移动端,通过在所述电脑PC端上创建录音任务,所述安卓移动端和所述ios移动端根据所述录音任务与所述电脑PC端进入同一语音录制房间。
进一步的,所述电脑PC端根据所述录音任务生成二维码,所述安卓移动端和所述ios移动端通过扫描所述二维码与所述电脑PC端进入同一语音录制房间。
优选的,所述多信道互连模块中,进一步在所述语音录制房间显示各个用户端的连接状态。
优选的,所述多信道录音模块中,通过websocket技术由所述两个以上的用户端的其中之一同时统一控制所有的所述两个以上的用户端进行语音录制。
进一步的,所述多信道录音模块中,通过websocket技术由所述电脑PC端同时统一控制所述的电脑PC端、安卓移动端及ios移动端进行语音录制。
对应的,本发明还提供一种多信道语音采集方法,其包括两个以上的用户端,所述用户端与服务端采用B/S架构部署,服务端为用户端提供登录界面,所述方法包括以下步骤:
a.所述两个以上的用户端通过所述登录界面登录服务端;
b.所述两个以上的用户端的其中之一创建录音任务;
c.所述两个以上的用户端根据所述录音任务进入同一语音录制房间;
d.控制所述两个以上的用户端执行语音录制。
本发明的有益效果是:
(1)本发明的用户端与服务端采用B/S架构部署,通过其中之一的用户端创建录音任务,其余的用户端根据所述录音任务加入同一个语音录制房间,从而使得多个用户端同时进行语音录制,实现多信道语音采集;
(2)本发明直接多个信道一起录制,不需要模拟信道,所以没有后处理,成本较低,并且方便简洁;
(3)本发明的多信道语音采集主要是通过电脑PC端、安卓移动端、ios移动端的三信道同时采集的方法,通用性较强,适用范围较广;
(4)本发明通过在电脑PC端生成二维码,安卓移动端和ios移动端通过扫描所述二维码与所述电脑PC端进入同一语音录制房间,操作方便快捷。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明一种多信道语音采集系统的二维码生成界面示意图;
图2为本发明一种多信道语音采集系统的录制房间的界面示意图;
图3为本发明一种多信道语音采集系统的连接状态的界面示意图。
具体实施方式
为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚、明白,以下结合附图及实施例对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
本发明的一种多信道语音采集系统,其包括:
登录验证模块,用于连接两个以上的用户端,所述用户端与服务端采用B/S架构部署,服务端为用户端提供登录界面;
录音任务创建模块,其通过所述两个以上的用户端的其中之一创建录音任务;
多信道互连模块,使得所述两个以上的用户端根据所述录音任务进入同一语音录制房间;
多信道录音模块,用于控制所述两个以上的用户端执行语音录制。
本实施例中,所述服务端设置于虚拟机上。所述的登录验证模块中,所述B/S结构(Browser/Server,浏览器/服务器模式),是WEB兴起后的一种网络结构模式,WEB浏览器是用户端最主要的应用软件,这种模式统一了用户端,将系统功能实现的核心部分集中到服务器上,简化了系统的开发、维护和使用。客户机上只要安装一个浏览器,如NetscapeNavigator或Internet Explorer,服务器安装SQL Server、Oracle、MYSQL等数据库。浏览器通过Web Server同数据库进行数据交互,用户端通过浏览器登录服务端提供的登录界面。
所述录音任务创建模块中,所述用户端包括电脑PC端、安卓移动端、ios移动端,并且,所述电脑PC端、安卓移动端及ios移动端分别安装有web浏览器;通过在所述电脑PC端上创建录音任务,所述安卓移动端和所述ios移动端根据所述录音任务与所述电脑PC端进入同一语音录制房间。本实施例中,所述电脑PC端根据所述录音任务生成二维码(如图1所示),所述安卓移动端和所述ios移动端通过扫描所述二维码与所述电脑PC端进入同一语音录制房间(如图2所示)。
所述多信道互连模块中,所述两个以上的用户端根据所述录音任务进入同一语音录制房间,并进一步在所述语音录制房间显示各个用户端的连接状态。例如,所述电脑PC端上创建录音任务,自动默认为所述电脑PC端为在线状态,所述安卓移动端和所述ios移动端此时为离线状态;所述安卓移动端和所述ios移动端通过扫描所述二维码后,连接状态由离线状态切换为在线状态。各个用户端全部为在线状态后,即可启动语音录制(如图3所示)。另外,还可设置录音的音量等参数。
所述多信道录音模块中,通过websocket技术由所述两个以上的用户端的其中之一同时统一控制所有的所述两个以上的用户端进行语音录制。本实施例中,所述多信道录音模块通过websocket技术由所述电脑PC端同时统一控制所述的电脑PC端、安卓移动端及ios移动端进行语音录制。其中,所述websocket技术是用于在Web浏览器和服务器之间进行任意的双向数据传输的一种技术。WebSocket协议基于TCP协议实现,包含初始的握手过程,以及后续的多次数据帧双向传输过程。其目的是在WebSocket应用和WebSocket服务器进行频繁双向通信时,可以使服务器避免打开多个HTTP连接进行工作来节约资源,提高了工作效率和资源利用率。
如图2所示,本发明还提供一种多信道语音采集方法,其包括两个以上的用户端,所述用户端与服务端采用B/S架构部署,服务端为用户端提供登录界面,所述方法包括以下步骤:
a.所述两个以上的用户端通过所述登录界面登录服务端;
b.所述两个以上的用户端的其中之一创建录音任务;
c.所述两个以上的用户端根据所述录音任务进入同一语音录制房间;
d.控制所述两个以上的用户端执行语音录制。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于方法实施例而言,由于其与系统实施例基本相似,所以描述的比较简单,相关之处参见系统实施例的部分说明即可。
并且,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。另外,本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
上述说明示出并描述了本发明的优选实施例,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。

Claims (8)

1.一种多信道语音采集系统,其特征在于,包括:
登录验证模块,用于连接两个以上的用户端,所述用户端与服务端采用B/S架构部署,服务端为用户端提供登录界面;
录音任务创建模块,其通过所述两个以上的用户端的其中之一创建录音任务;
多信道互连模块,使得所述两个以上的用户端根据所述录音任务进入同一语音录制房间;
多信道录音模块,用于控制所述两个以上的用户端执行语音录制。
2.根据权利要求1所述的一种多信道语音采集系统,其特征在于:所述服务端设置于虚拟机上。
3.根据权利要求1所述的一种多信道语音采集系统,其特征在于:所述用户端包括电脑PC端、安卓移动端、ios移动端,通过在所述电脑PC端上创建录音任务,所述安卓移动端和所述ios移动端根据所述录音任务与所述电脑PC端进入同一语音录制房间。
4.根据权利要求3所述的一种多信道语音采集系统,其特征在于:所述电脑PC端根据所述录音任务生成二维码,所述安卓移动端和所述ios移动端通过扫描所述二维码与所述电脑PC端进入同一语音录制房间。
5.根据权利要求1所述的一种多信道语音采集系统,其特征在于:所述多信道互连模块中,进一步在所述语音录制房间显示各个用户端的连接状态。
6.根据权利要求3所述的一种多信道语音采集系统,其特征在于:所述多信道录音模块中,通过websocket技术由所述两个以上的用户端的其中之一同时统一控制所有的所述两个以上的用户端进行语音录制。
7.根据权利要求6所述的一种多信道语音采集系统,其特征在于:所述多信道录音模块中,通过websocket技术由所述电脑PC端同时统一控制所述的电脑PC端、安卓移动端及ios移动端进行语音录制。
8.一种多信道语音采集方法,其特征在于,包括两个以上的用户端,所述用户端与服务端采用B/S架构部署,服务端为用户端提供登录界面,所述方法包括以下步骤:
a.所述两个以上的用户端通过所述登录界面登录服务端;
b.所述两个以上的用户端的其中之一创建录音任务;
c.所述两个以上的用户端根据所述录音任务进入同一语音录制房间;
d.控制所述两个以上的用户端执行语音录制。
CN201810896691.6A 2018-08-08 2018-08-08 一种多信道语音采集系统及方法 Active CN109189364B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810896691.6A CN109189364B (zh) 2018-08-08 2018-08-08 一种多信道语音采集系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810896691.6A CN109189364B (zh) 2018-08-08 2018-08-08 一种多信道语音采集系统及方法

Publications (2)

Publication Number Publication Date
CN109189364A true CN109189364A (zh) 2019-01-11
CN109189364B CN109189364B (zh) 2021-10-22

Family

ID=64920564

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810896691.6A Active CN109189364B (zh) 2018-08-08 2018-08-08 一种多信道语音采集系统及方法

Country Status (1)

Country Link
CN (1) CN109189364B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101169684A (zh) * 2007-11-27 2008-04-30 合肥讯飞数码科技有限公司 一种远距离多通道人机交互装置及其交互方法
US20110294547A1 (en) * 2008-11-11 2011-12-01 Netqin Mobile (Beijing) Technology Co., Ltd. Method and system for interactive operation between mobile phone and pc based on a middleware
CN103730112A (zh) * 2013-12-25 2014-04-16 安徽讯飞智元信息科技有限公司 语音多信道模拟与采集方法
CN105429851A (zh) * 2015-11-10 2016-03-23 河海大学 一种基于即时通信的多人协同录音系统及识别方法
CN105511612A (zh) * 2015-12-02 2016-04-20 上海航空电器有限公司 一种基于语音/手势的多通道融合方法
US20160140960A1 (en) * 2014-11-14 2016-05-19 Samsung Electronics Co., Ltd. Voice recognition system, server, display apparatus and control methods thereof
CN106126186A (zh) * 2016-08-29 2016-11-16 北京声智科技有限公司 一种多通道音频信号并行采集装置
US20160373553A1 (en) * 2001-06-27 2016-12-22 Skky, Llc Mobile dialogue system and mobile content delivery solutions
CN107026829A (zh) * 2016-02-02 2017-08-08 深圳岂凡技术开发有限公司 一种跨终端进行语音录入的交互系统及方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160373553A1 (en) * 2001-06-27 2016-12-22 Skky, Llc Mobile dialogue system and mobile content delivery solutions
CN101169684A (zh) * 2007-11-27 2008-04-30 合肥讯飞数码科技有限公司 一种远距离多通道人机交互装置及其交互方法
US20110294547A1 (en) * 2008-11-11 2011-12-01 Netqin Mobile (Beijing) Technology Co., Ltd. Method and system for interactive operation between mobile phone and pc based on a middleware
CN103730112A (zh) * 2013-12-25 2014-04-16 安徽讯飞智元信息科技有限公司 语音多信道模拟与采集方法
US20160140960A1 (en) * 2014-11-14 2016-05-19 Samsung Electronics Co., Ltd. Voice recognition system, server, display apparatus and control methods thereof
CN105429851A (zh) * 2015-11-10 2016-03-23 河海大学 一种基于即时通信的多人协同录音系统及识别方法
CN105511612A (zh) * 2015-12-02 2016-04-20 上海航空电器有限公司 一种基于语音/手势的多通道融合方法
CN107026829A (zh) * 2016-02-02 2017-08-08 深圳岂凡技术开发有限公司 一种跨终端进行语音录入的交互系统及方法
CN106126186A (zh) * 2016-08-29 2016-11-16 北京声智科技有限公司 一种多通道音频信号并行采集装置

Also Published As

Publication number Publication date
CN109189364B (zh) 2021-10-22

Similar Documents

Publication Publication Date Title
CN109034720A (zh) 一种适用于电力调度业务管理的移动办公平台及装置
EP3669355A1 (en) Voice-activated selective memory for voice-capturing devices
CN109754804A (zh) 一种语音控制方法、装置、存储介质及智能家居系统
CN104952117B (zh) 一种考勤管理方法
CN109919340A (zh) 一种智能实验管理系统及管理方法
CN108073798B (zh) 执行系统运行的框架
CN106911523A (zh) 移动互联网用户通过lte上网问题定位的方法和系统
CN108683704A (zh) 一种Socket网络通信测试方法及其系统、存储介质
CN106528272B (zh) 一种数据处理装置、方法及终端
CN109344071A (zh) 自动生成LoadRunner性能测试脚本的方法
CN110019462A (zh) 电力科研生产数据分析方法、装置、系统及存储介质
CN109213919A (zh) 一种基于互联网的信息技术咨询服务系统
CN109729067A (zh) 语音打卡方法、装置、设备和计算机存储介质
CN110458528A (zh) 一种基于cmdb运维管理的全业务配置管理平台
CN102025555B (zh) Ip多媒体子系统性能测试的方法
CN109189364A (zh) 一种多信道语音采集系统及方法
CN109063050A (zh) 一种数据库日志分析预警方法与装置
CN112131544A (zh) 一种跳板机用户管理的shell脚本方法
CN108092786B (zh) 无纸化会议管理方法及系统
CN101159638A (zh) 工作流智能支撑系统
CN109600278A (zh) 一种数据通信方法、装置、设备及介质
CN110087232A (zh) 一种基于智能设备的呼叫处理方法、装置及服务器
CN103823749A (zh) 一种第三方软件测试环境快速构建方法
CN109960660A (zh) 一种基于Ansible的电网业务入网安全测评方法
CN111401832A (zh) 一种基于区块链的智慧校园管理平台

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant