CN109040407A - 基于移动终端的语音采集方法及装置 - Google Patents

基于移动终端的语音采集方法及装置 Download PDF

Info

Publication number
CN109040407A
CN109040407A CN201810779683.3A CN201810779683A CN109040407A CN 109040407 A CN109040407 A CN 109040407A CN 201810779683 A CN201810779683 A CN 201810779683A CN 109040407 A CN109040407 A CN 109040407A
Authority
CN
China
Prior art keywords
user
recording
file
receiving
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810779683.3A
Other languages
English (en)
Inventor
赵悦
裴欢欢
杨建龙
徐晓娜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Minzu University of China
Original Assignee
Minzu University of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Minzu University of China filed Critical Minzu University of China
Priority to CN201810779683.3A priority Critical patent/CN109040407A/zh
Publication of CN109040407A publication Critical patent/CN109040407A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/60Substation equipment, e.g. for use by subscribers including speech amplifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/162Interface to dedicated audio devices, e.g. audio drivers, interface to CODECs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请公开了一种基于移动终端的语音采集方法及装置。该方法包括:接收用户的文件选择指令,向用户展示对应的第一文字信息;接收用户的录音操作指令,生成录音文件并执行对应的文件处理操作;采用接收用户的文件选择指令,向用户展示对应的第一文字信息的方式,通过接收用户的录音操作指令,生成录音文件并执行对应的文件处理操作,达到了准确、高效采集语音的目的,进而解决了相关技术中语音采集效率低下的问题。

Description

基于移动终端的语音采集方法及装置
技术领域
本申请涉及语音采集领域,具体而言,涉及一种基于移动终端的语音采集方法及装置。
背景技术
语音信号的分析与处理作为一个重要的研究领域,随着通信技术的发展,语音采集和分析仪器的数字化、智能化、小型化和多功能化的发展越来越快,其分析速度也有了大幅度的提高。
发明人发现,现在市场上的语音采集系统多有价格昂贵的硬件实现,如录音笔等设备,其操作复杂,且仅能用于特定的测量分析项目,并且在用于语音识别和合成系统的训练数据采集时,不能方便的显示文字系统,容易造成语音和文本混乱。
因此,急需一种基于移动终端的语音采集方法及装置,以解决相关技术中语音采集效率低下的问题。
发明内容
本申请的主要目的在于提供一种基于移动终端的语音采集方法及装置,以解决相关技术中语音采集效率低下的问题。
为了实现上述目的,根据本申请的一个方面,提供了一种基于移动终端的语音采集方法。
根据本申请的基于移动终端的语音采集方法包括:接收用户的文件选择指令,向用户展示对应的第一文字信息;接收用户的录音操作指令,生成录音文件并执行对应的文件处理操作。
进一步的,所述接收用户的文件选择指令,向用户展示对应的第一文字信息之前包括:接收服务器发送来的标题信息并展示。
进一步的,所述接收用户的录音操作指令,生成录音文件并执行对应的文件处理操作包括:接收用户的开始录音指令,调用麦克风单元开始录音。
进一步的,所述接收用户的录音操作指令,生成录音文件并执行对应的文件处理操作包括:接收用户的停止录音指令,生成录音文件并保存到本地和上传至服务器。
进一步的,所述接收用户的录音操作指令,生成录音文件并执行对应的文件处理操作包括:接收用户的播放录音指令,调用外放单元并播放所述录音文件;接收用户的删除录音指令,删除用户保存在本地的语音文件。
为了实现上述目的,根据本申请的另一方面,提供了一种基于移动终端的语音采集装置。
根据本申请的基于移动终端的语音采集装置包括:展示单元,用于接收用户的文件选择指令,向用户展示对应的第一文字信息;录制单元,用于接收用户的录音操作指令,生成录音文件并执行对应的文件处理操作。
进一步的,所述展示单元包括:标题信息获取模块,用于接收服务器发送来的标题信息并展示。
进一步的,所述录制单元包括:开始录音模块,用于接收用户的开始录音指令,调用麦克风单元开始录音。
进一步的,所述录制单元还包括:停止录音模块,用于接收用户的停止录音指令,生成录音文件并上传至服务器。
进一步的,所述录制单元还包括:播放录音模块,用于接收用户的播放录音指令,调用外放单元并播放所述录音文件;删除录音模块,用于删除用户保存在本地的语音文件。
在本申请实施例中,采用接收用户的文件选择指令,向用户展示对应的第一文字信息的方式,通过接收用户的录音操作指令,生成录音文件并执行对应的文件处理操作,达到了准确、高效采集语音的目的,进而解决了相关技术中语音采集效率低下的问题。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请第一实施例的采集方法示意图;
图2是根据本申请第一实施例的采集装置示意图;
图3是根据本申请所述展示单元的结构示意图;以及
图4是根据本申请所述录制单元的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本申请中,术语“上”、“下”、“左”、“右”、“前”、“后”、“顶”、“底”、“内”、“外”、“中”、“竖直”、“水平”、“横向”、“纵向”等指示的方位或位置关系为基于附图所示的方位或位置关系。这些术语主要是为了更好地描述本发明及其实施例,并非用于限定所指示的装置、元件或组成部分必须具有特定方位,或以特定方位进行构造和操作。
并且,上述部分术语除了可以用于表示方位或位置关系以外,还可能用于表示其他含义,例如术语“上”在某些情况下也可能用于表示某种依附关系或连接关系。对于本领域普通技术人员而言,可以根据具体情况理解这些术语在本发明中的具体含义。
此外,术语“安装”、“设置”、“设有”、“连接”、“相连”、“套接”应做广义理解。例如,可以是固定连接,可拆卸连接,或整体式构造;可以是机械连接,或电连接;可以是直接相连,或者是通过中间媒介间接相连,又或者是两个装置、元件或组成部分之间内部的连通。对于本领域普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
如图1所示,该方法包括如下的步骤S101至步骤S102:
步骤S101,接收用户的文件选择指令,向用户展示对应的第一文字信息;
优选的,在本申请的实施例中,采用App Inventor软件开发制作一款基于Android操作系统的用于采集语音数据的录音App,基于此App用于采集大量语音语料数据,尤其是少数民族语音数据,并建立少数民族语料数据库,用于其他研究项目。
优选的,所述App有两个核心功能:用户注册登录和语音录制;具体的,在用户注册登录页面又可以分为注册功能和登录功能,其中,新用户可以申请用户名和密码,老用户可以直接进行登录;
优选的,在语音录制页面中,所述App可以通过连接后台服务器,接收所述服务器发送来的文字信息,所述文字信息包括但不限于:标题信息、编号以及少数民族用语的文字内容信息。
步骤S102,接收用户的录音操作指令,生成录音文件并执行对应的文件处理操作。
优选的,所述App将标题信息以列表形式进行展示,所述用户点击列表中的某一项,即进入语音录制页面,所述语音录制页面设置有开始录音、停止录音、播放录音、删除录音、查看上一条以及查看下一条,在本申请的其他实施例中,所述语音录制页面也可以设置有其他能够进行语音操作的功能选项。
从以上的描述中,可以看出,本发明实现了如下技术效果:
在本申请实施例中,采用接收用户的文件选择指令,向用户展示对应的第一文字信息的方式,通过接收用户的录音操作指令,生成录音文件并执行对应的文件处理操作,达到了准确、高效采集语音的目的,进而解决了相关技术中语音采集效率低下的问题。
根据本申请实施例,作为本实施例中的优选,所述接收用户的文件选择指令,向用户展示对应的第一文字信息之前包括:接收服务器发送来的标题信息并展示。
优选的,所述App可以通过连接后台服务器,接收所述服务器发送来的文字信息,所述文字信息包括但不限于:标题信息、编号以及少数民族用语的文字内容信息。
根据本申请实施例,作为本实施例中的优选,所述接收用户的录音操作指令,生成录音文件并执行对应的文件处理操作包括:接收用户的开始录音指令,调用麦克风单元开始录音。
优选的,用户点击所述语音录制页面的开始录音按钮,系统调用移动终端的麦克风单元开始进行语音录制。
根据本申请实施例,作为本实施例中的优选,所述接收用户的录音操作指令,生成录音文件并执行对应的文件处理操作包括:接收用户的停止录音指令,生成录音文件并上传至服务器。
优选的,用户点击所述语音录制页面的停止录音按钮,系统停止录制,并生成录音音频文件,所述系统可以自动将所述音频文件保存到移动终端本地或上传到后台服务器中间进行保存。
根据本申请实施例,作为本实施例中的优选,所述接收用户的录音操作指令,生成录音文件并执行对应的文件处理操作包括:接收用户的播放录音指令,调用外放单元并播放所述录音文件;接收用户的删除录音指令,删除用户保存在本地的语音文件。
优选的,用户点击所述语音录制页面的删除录音按钮,系统将删除保存在所述移动终端本地的录音音频文件,并向后台服务器发送删除请求信号,删除存储于数据库中的该条音频数据。
优选的,用户点击所述语音录制页面的停止录音按钮,系统停止录制,并生成录音音频文件。
在本申请的其他实施例中,所述用户还可以通过点击删除录音按钮,删除保存在本地的录音音频文件;所述用户还可以通过点击上一条按钮,查看列表中上一条数据;所述用户还可以通过点击下一条按钮,查看列表中下一条数据。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
根据本发明实施例,还提供了一种用于实施上述语音采集方法的装置,如图2所示,该装置包括:展示单元10,用于接收用户的文件选择指令,向用户展示对应的第一文字信息;录制单元20,用于接收用户的录音操作指令,生成录音文件并执行对应的文件处理操作。
根据本申请实施例所述的展示单元10用于接收用户的文件选择指令,向用户展示对应的第一文字信息,优选的,在本申请的实施例中,采用App Inventor软件开发制作一款基于Android操作系统的用于采集语音数据的录音 App,基于此App用于采集大量语音语料数据,尤其是少数民族语音数据,并建立少数民族语料数据库,用于其他研究项目。
根据本申请实施例所述的录制单元20用于接收用户的录音操作指令,生成录音文件并执行对应的文件处理操作,优选的,所述App将标题信息以列表形式进行展示,所述用户点击列表中的某一项,即进入语音录制页面,所述语音录制页面设置有开始录音、停止录音、播放录音、删除录音、查看上一条以及查看下一条,在本申请的其他实施例中,所述语音录制页面也可以设置有其他能够进行语音操作的功能选项。
根据本申请实施例,作为本实施例中的优选,如图3所示,所述展示单元 10包括:标题信息获取模块11,用于接收服务器发送来的标题信息并展示。
根据本申请实施例所述的标题信息获取模块11用于接收服务器发送来的标题信息并展示,优选的,所述App可以通过连接后台服务器,接收所述服务器发送来的文字信息,所述文字信息包括但不限于:标题信息、编号以及少数民族用语的文字内容信息。
根据本申请实施例,作为本实施例中的优选,如图4所示,所述录制单元 20包括:开始录音模块21,用于接收用户的开始录音指令,调用麦克风单元开始录音;停止录音模块22,用于接收用户的停止录音指令,生成录音文件并上传至服务器;播放录音模块23,用于接收用户的播放录音指令,调用外放单元并播放所述录音文件;删除录音模块24,接收用户的删除录音指令,删除用户保存在本地的语音文件。
根据本申请实施例所述的开始录音模块21用于接收用户的开始录音指令,调用麦克风单元开始录音,优选的,用户点击所述语音录制页面的开始录音按钮,系统调用移动终端的麦克风单元开始进行语音录制。
根据本申请实施例所述的停止录音模块22用于接收用户的停止录音指令,生成录音文件并上传至服务器,优选的,用户点击所述语音录制页面的停止录音按钮,系统停止录制,并生成录音音频文件,所述系统可以自动将所述音频文件保存到移动终端本地或上传到后台服务器中间进行保存。
根据本申请实施例所述的播放录音模块23用于接收用户的播放录音指令,调用外放单元并播放所述录音文件,优选的,用户点击所述语音录制页面的停止录音按钮,系统停止录制,并生成录音音频文件。
根据本申请实施例所述的删除录音模块24接收用户的删除录音指令,删除用户保存在本地的语音文件,优选的,用户点击所述语音录制页面的删除录音按钮,系统将删除保存在所述移动终端本地的录音音频文件,并向后台服务器发送删除请求信号,删除存储于数据库中的该条音频数据。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种基于移动终端的语音采集方法,其特征在于,该方法包括:
接收用户的文件选择指令,向用户展示对应的第一文字信息;
接收用户的录音操作指令,生成录音文件并执行对应的文件处理操作。
2.根据权利要求1所述的语音采集方法,其特征在于,所述接收用户的文件选择指令,向用户展示对应的第一文字信息之前包括:
接收服务器发送来的标题信息并展示。
3.根据权利要求1所述的语音采集方法,其特征在于,所述接收用户的录音操作指令,生成录音文件并执行对应的文件处理操作包括:
接收用户的开始录音指令,调用麦克风单元开始录音。
4.根据权利要求3所述的语音采集方法,其特征在于,所述接收用户的录音操作指令,生成录音文件并执行对应的文件处理操作包括:
接收用户的停止录音指令,生成录音文件并保存到本地和上传至服务器。
5.根据权利要求4所述的语音采集方法,其特征在于,所述接收用户的录音操作指令,生成录音文件并执行对应的文件处理操作包括:
接收用户的播放录音指令,调用外放单元并播放所述录音文件;
接收用户的删除录音指令,删除用户保存在本地的语音文件。
6.一种基于移动终端的语音采集装置,其特征在于,包括:
展示单元,用于接收用户的文件选择指令,向用户展示对应的第一文字信息;
录制单元,用于接收用户的录音操作指令,生成录音文件并执行对应的文件处理操作。
7.根据权利要求6所述的语音采集装置,其特征在于,所述展示单元包括:
标题信息获取模块,用于接收服务器发送来的标题信息并展示。
8.根据权利要求6所述的语音采集装置,其特征在于,所述录制单元包括:
开始录音模块,用于接收用户的开始录音指令,调用麦克风单元开始录音。
9.根据权利要求6所述的语音采集装置,其特征在于,所述录制单元还包括:
停止录音模块,用于接收用户的停止录音指令,生成录音文件并上传至服务器。
10.根据权利要求6所述的语音采集装置,其特征在于,所述录制单元还包括:
播放录音模块,用于接收用户的播放录音指令,调用外放单元并播放所述录音文件;
删除录音模块,用于删除用户保存在本地的语音文件。
CN201810779683.3A 2018-07-16 2018-07-16 基于移动终端的语音采集方法及装置 Pending CN109040407A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810779683.3A CN109040407A (zh) 2018-07-16 2018-07-16 基于移动终端的语音采集方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810779683.3A CN109040407A (zh) 2018-07-16 2018-07-16 基于移动终端的语音采集方法及装置

Publications (1)

Publication Number Publication Date
CN109040407A true CN109040407A (zh) 2018-12-18

Family

ID=64643221

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810779683.3A Pending CN109040407A (zh) 2018-07-16 2018-07-16 基于移动终端的语音采集方法及装置

Country Status (1)

Country Link
CN (1) CN109040407A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110473525A (zh) * 2019-09-16 2019-11-19 百度在线网络技术(北京)有限公司 获取语音训练样本的方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150078555A1 (en) * 2012-07-18 2015-03-19 Huawei Technologies Co., Ltd. Portable electronic device with directional microphones for stereo recording
CN105868400A (zh) * 2016-04-19 2016-08-17 乐视控股(北京)有限公司 录音信息处理方法及装置
CN107888772A (zh) * 2017-11-08 2018-04-06 广东欧珀移动通信有限公司 一种确定配置信息的方法、装置及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150078555A1 (en) * 2012-07-18 2015-03-19 Huawei Technologies Co., Ltd. Portable electronic device with directional microphones for stereo recording
CN105868400A (zh) * 2016-04-19 2016-08-17 乐视控股(北京)有限公司 录音信息处理方法及装置
CN107888772A (zh) * 2017-11-08 2018-04-06 广东欧珀移动通信有限公司 一种确定配置信息的方法、装置及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110473525A (zh) * 2019-09-16 2019-11-19 百度在线网络技术(北京)有限公司 获取语音训练样本的方法和装置
CN110473525B (zh) * 2019-09-16 2022-04-05 百度在线网络技术(北京)有限公司 获取语音训练样本的方法和装置

Similar Documents

Publication Publication Date Title
CN102782751B (zh) 社会网络中的数字媒体语音标签
CN104104768A (zh) 通过使用呼叫方电话号码来提供附加信息的装置和方法
CN103327181B (zh) 可提高用户获知语音信息效率的语音聊天方法
CN104994401A (zh) 弹幕处理方法、装置及系统
CN104010267A (zh) 支持基于翻译的通信服务方法和系统和支持该服务的终端
CN102572372A (zh) 会议纪要的提取方法和装置
CN106303557A (zh) 网络直播的直播内容展示方法和装置
CN109274831A (zh) 一种语音通话方法、装置、设备及可读存储介质
CN110321474A (zh) 基于搜索词的推荐方法、装置、终端设备及存储介质
CN104035995A (zh) 群标签生成方法及装置
CN104539793A (zh) 一种终端
CN102664008B (zh) 一种用以传输数据的方法、终端及系统
CN104144108A (zh) 一种消息响应方法、装置及系统
CN107659850A (zh) 媒体信息处理方法和装置
CN108460120A (zh) 数据保存方法、装置、终端设备及存储介质
CN110708431A (zh) 一种通话管理方法、通信终端及存储介质
CN106940997A (zh) 一种向语音识别系统发送语音信号的方法和装置
CN108320761B (zh) 音频录制方法、智能录音设备及计算机可读存储介质
CN110945467B (zh) 一种免打扰方法和终端
US20220391058A1 (en) Interaction information processing method and apparatus, electronic device and storage medium
CN104202458A (zh) 一种自动保存联系人信息的方法和智能终端
CN109040407A (zh) 基于移动终端的语音采集方法及装置
CN107483993B (zh) 电视的语音输入方法、电视和计算机可读存储介质
CN106503933A (zh) 一种获取和呈现信息的方法及终端
JP2008113331A (ja) 電話システム、電話機、サーバ装置およびプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination