CN107331394B - 基于移动互联网与手机app的语音资料采集系统 - Google Patents

基于移动互联网与手机app的语音资料采集系统 Download PDF

Info

Publication number
CN107331394B
CN107331394B CN201710383546.3A CN201710383546A CN107331394B CN 107331394 B CN107331394 B CN 107331394B CN 201710383546 A CN201710383546 A CN 201710383546A CN 107331394 B CN107331394 B CN 107331394B
Authority
CN
China
Prior art keywords
recording
phone app
mobile phone
file
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201710383546.3A
Other languages
English (en)
Other versions
CN107331394A (zh
Inventor
张彦军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jinan University
Original Assignee
Jinan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jinan University filed Critical Jinan University
Priority to CN201710383546.3A priority Critical patent/CN107331394B/zh
Publication of CN107331394A publication Critical patent/CN107331394A/zh
Application granted granted Critical
Publication of CN107331394B publication Critical patent/CN107331394B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/08Network architectures or network communication protocols for network security for authentication of entities
    • H04L63/0815Network architectures or network communication protocols for network security for authentication of entities providing single-sign-on or federations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/06Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/64Automatic arrangements for answering calls; Automatic arrangements for recording messages for absent subscribers; Arrangements for recording conversations
    • H04M1/65Recording arrangements for recording a message from the calling party
    • H04M1/6505Recording arrangements for recording a message from the calling party storing speech in digital form
    • H04M1/651Recording arrangements for recording a message from the calling party storing speech in digital form with speech synthesis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/64Automatic arrangements for answering calls; Automatic arrangements for recording messages for absent subscribers; Arrangements for recording conversations
    • H04M1/65Recording arrangements for recording a message from the calling party
    • H04M1/656Recording arrangements for recording a message from the calling party for recording conversations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • H04M1/72433User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for voice messaging, e.g. dictaphones

Abstract

本发明公开了一种基于移动互联网与手机APP的语音资料采集系统,其中,该系统包括:手机APP录音设备和网络录音平台,二者之间通过网络连接;其中,网络录音平台包括:存储单元、语音识别单元、检测单元;存储单元用于存储所述的手机APP录音设备发送来的录音文件;语音识别单元用于将录音文件转换为文本文件;检测单元用于检测文本文件中文字覆盖目标词汇大纲的范围,并将该检测结果反馈回所述的手机APP录音设备。本发明通过搭建的录音平台,将会便利普通的录音采集过程,提高工作效率,缩短语音语料库的建设周期;同时,本发明还提高了针对目标词汇大纲进行语音资料采集的便捷性和语音资料选择的自由性。

Description

基于移动互联网与手机APP的语音资料采集系统
技术领域
本发明涉及语音采集技术领域,具体涉及一种基于移动互联网与手机APP的语音资料采集系统。
背景技术
目前有进行语音识别的手机APP软件、计算机语音资料文件共享系统和计算机分词软件技术等,甚至是语音识别系统平台。这些技术和方案都解决了相近领域的技术问题,例如,传统的语音资料库,在录音室通过预先设计好的朗读材料完成录音后,录音资料以一定索引的方式存储进语料库软件平台,但这些方式都不能实现文本内容选择的自由性和用户录音的便捷性。
目前,在录音平台技术方面,采用的技术方式主要有两种,一种是传统的录音组织者设计各种句子和短文,录音者只需按照设计好的脚本进行录音即可;另一种是录音者自己随机的进行录音后,将录音提交到录音平台,录音组织者对该录音进行试听并根据词汇大纲的范围反馈回用户并提出进一步的录音要求。
关于组织性的录音平台,组织者需事先根据目标词汇大纲设计录音脚本,录音者只需按照脚本的要求进行朗读即可完成录音。虽然组织性的录音执行进度快、效率高,但是由于录音的组织和录音任务的执行都要严格按照脚本,录音过程难免机械且不便。
关于用户自由发挥的录音方式,虽然对于录音用户可以不受脚本约束进行自由发挥,但录音组织者需要对录音进行试听,对某些重复覆盖词汇的录音材料进行删除后,反馈录音覆盖目标词汇大纲的范围给用户,但此方法难免会出错,同时耗费人力物力,而且用户不能获得及时反馈。
由于信息化和网络化的大力推广,在智能手机上安装APP录音软件即可完成录音操作。当把录音文件上传到网络平台后,由模式程序自动进行匹配检测,并将结果反馈回用户将会很方便、高效。因此,若能实现录音过程自动化及录音内容的组织自由化,将很大程度上促进语言应用方面科学技术的发展。
发明内容
本发明的目的是为了解决现有技术中的上述缺陷,提供一种基于移动互联网与手机APP的语音资料采集系统及其方法。
根据公开的实施例,本发明的第一方面公开了一种基于移动互联网与手机APP的语音资料采集系统,其特征在于,所述的语音资料采集系统包括:手机APP录音设备和网络录音平台,其中,所述的手机APP录音设备和所述的网络录音平台之间通过网络连接;
所述的网络录音平台包括:存储单元、语音识别单元、检测单元;
所述的存储单元用于存储所述的手机APP录音设备发送来的录音文件;
所述的语音识别单元用于将录音文件转换为文本文件;
所述的检测单元用于检测文本文件中文字覆盖目标词汇大纲的范围,并将该检测结果反馈回所述的手机APP录音设备。
进一步地,所述的手机APP录音设备还包括登录单元,所述的登录单元用于设置用户名和密码进行登录操作。
进一步地,所述的录音文件按照一定的索引格式存储在所述的存储单元中。
进一步地,所述的网络为移动互联网,包括移动通信网络和WiFi网络。
进一步地,所述的手机APP录音设备支持录音文件在线或者下载试听。
根据公开的实施例,本发明的第二方面公开了一种基于移动互联网与手机APP的语音资料采集方法,所述语音资料采集方法包括下列步骤:
通过登录单元登录手机APP录音设备进行录音;
将录音文件由移动互联网上传到网络录音平台;
存储单元将录音文件进行索引存储;
语音识别单元将录音文件进行文字识别后转换为文本文件;
检测单元检测文本文件中文字覆盖目标词汇大纲的范围,并将该检测结果通过移动互联网反馈回手机APP录音设备;
根据反馈结果进行接下来的录音操作,直至提交的录音文件完全覆盖目标词汇大纲才标志录音任务完成。
本发明相对于现有技术具有如下的优点及效果:
本发明借助移动互联网平台,通过登录手机APP录音设备,将采集的语音资料上传到网络录音平台后,通过模式识别模块将语音转换为文本,并将其包含的词汇与目标词汇大纲进行比对,得出覆盖范围,最后将该范围反馈回录音用户,用户按照此范围的提示继续进行录音,直至其提供的录音资料覆盖整个目标词汇大纲,该发明提高了针对目标词汇大纲进行语音资料采集的便捷性和语音资料选择的自由性。
本发明通过搭建的录音平台,将会便利普通的录音采集过程,提高工作效率,缩短语音语料库的建设周期。
附图说明
图1是本发明公开的一种基于移动互联网与手机APP的语音资料采集系统的结构框图;
图2是本发明公开的一种基于移动互联网与手机APP的语音资料采集方法的流程步骤图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
如图1所示,本实施例公开了一种基于移动互联网与手机APP的语音资料采集系统,该系统包括:手机APP录音设备和网络录音平台,其中,所述的手机APP录音设备和所述的网络录音平台之间通过网络连接。
在本实施例的语音资料采集系统中,所述的网络为移动互联网,包括移动通信网络和WiFi网络。
在本实施例的语音资料采集系统中,所述的手机APP录音设备用于用户的语音录制。
手机APP录音设备指在各厂家生产的移动终端上安装用户录音工具软件,移动终端上操作系统可包括ios系统或android系统。
在本实施例的语音资料采集系统中,所述的网络录音平台包括:存储单元、语音识别单元、检测单元;
所述的存储单元用于存储所述的手机APP录音设备发送来的录音文件;其中,所述的录音文件按照一定的索引格式存储在所述的存储单元中。
所述的语音识别单元用于将录音文件转换为文本文件。该语音识别单元由特定模型和调适技术训练,对语音具有很高识别度,可从一段语音中自动识别出文字,将录音文件转换为文本文件。
所述的检测单元用于检测文本文件中文字覆盖目标词汇大纲的范围,并将该检测结果反馈回所述的手机APP录音设备,用户根据反馈结果进行接下来的录音操作。
在本实施例的语音资料采集系统中,所述的手机APP录音设备还包括登录单元,所述的登录单元用于设置用户名和密码进行登录操作。用户在手机上安装APP录音软件,可采用手机号码注册并登录操作,同时可以设置用户名和密码进行登录操作,用户可在安装了该录音APP软件的不同手机上进行登录操作。
在本实施例的语音资料采集系统中,所述的手机APP录音设备支持录音资料在线或者下载试听,用户在手机APP上登录后,可以下载用户以前的录音文件进行试听。
实施例二
如图2所示,本实施例公开了一种基于移动互联网与手机APP的语音资料采集方法,该方法包括下列步骤:
通过登录单元登录手机APP录音设备进行录音;
将录音文件由移动互联网上传到网络录音平台;
存储单元将录音文件进行索引存储;
语音识别单元将录音文件进行文字识别后转换为文本文件;
检测单元检测文本文件中文字覆盖目标词汇大纲的范围,并将该检测结果通过移动互联网反馈回手机APP录音设备;
根据反馈结果进行接下来的录音操作,直至提交的录音文件完全覆盖目标词汇大纲才标志录音任务完成。
综上所述,上述实施例公开的一种基于移动互联网与手机APP的语音资料采集系统及其方法,首先对于语音质量要求不是很高的语音资料采集,可以脱离开传统的录音室,用户自由组织录音内容,直接使用手机APP录音设备进行录音,并上传到网络录音平台的方式来解决,然后网络录音平台通过语音识别单元将录音文件转换为文本文件,判断文本文件包含的词汇覆盖目标词汇大纲的范围并将该范围反馈给录音用户,提示其按照指引继续录音,直至用户提交的语音资料完全覆盖目标词汇大纲才标志录音任务完成。该方式有效的改善录音方式,方便了录音工作的组织和管理。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (4)

1.一种基于移动互联网与手机APP的语音资料采集系统,其特征在于,所述的语音资料采集系统包括:手机APP录音设备和网络录音平台,其中,所述的手机APP录音设备和所述的网络录音平台之间通过网络连接;
所述的网络录音平台包括:存储单元、语音识别单元、检测单元;
所述的存储单元用于存储所述的手机APP录音设备发送来的录音文件;
所述的语音识别单元用于将录音文件转换为文本文件;
所述的检测单元用于检测文本文件中文字覆盖目标词汇大纲的范围,并将该检测结果反馈回所述的手机APP录音设备;
其中,基于所述的语音资料采集系统的语音资料采集方法包括下列步骤:
通过登录单元登录手机APP录音设备进行录音;
将录音文件由移动互联网上传到网络录音平台;
存储单元将录音文件进行索引存储;
语音识别单元将录音文件进行文字识别后转换为文本文件;
检测单元检测文本文件中文字覆盖目标词汇大纲的范围,并将检测结果通过移动互联网反馈回手机APP录音设备;
根据反馈结果进行接下来的录音操作,直至提交的录音文件完全覆盖目标词汇大纲才标志录音任务完成。
2.根据权利要求1所述的基于移动互联网与手机APP的语音资料采集系统,其特征在于,
所述的手机APP录音设备还包括登录单元,所述的登录单元用于设置用户名和密码进行登录操作。
3.根据权利要求1所述的基于移动互联网与手机APP的语音资料采集系统,其特征在于,
所述的网络为移动互联网,包括移动通信网络和WiFi网络。
4.根据权利要求1所述的基于移动互联网与手机APP的语音资料采集系统,其特征在于,
所述的手机APP录音设备支持录音文件在线或者下载试听。
CN201710383546.3A 2017-05-26 2017-05-26 基于移动互联网与手机app的语音资料采集系统 Expired - Fee Related CN107331394B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710383546.3A CN107331394B (zh) 2017-05-26 2017-05-26 基于移动互联网与手机app的语音资料采集系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710383546.3A CN107331394B (zh) 2017-05-26 2017-05-26 基于移动互联网与手机app的语音资料采集系统

Publications (2)

Publication Number Publication Date
CN107331394A CN107331394A (zh) 2017-11-07
CN107331394B true CN107331394B (zh) 2020-11-13

Family

ID=60193744

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710383546.3A Expired - Fee Related CN107331394B (zh) 2017-05-26 2017-05-26 基于移动互联网与手机app的语音资料采集系统

Country Status (1)

Country Link
CN (1) CN107331394B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1815522A (zh) * 2006-02-28 2006-08-09 安徽中科大讯飞信息科技有限公司 运用计算机进行普通话水平测试和指导学习的方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100365800B1 (ko) * 2000-06-09 2002-12-26 삼성전자 주식회사 아날로그모드에서 음성기능이 가능한 이중모드 무선이동 통신기기
CN101232531A (zh) * 2008-02-04 2008-07-30 中兴通讯股份有限公司 一种记录装置及其记录方法
CN103297582B (zh) * 2012-02-24 2018-10-12 联想(北京)有限公司 一种对语音通信内容进行处理的方法及电子设备
KR101977072B1 (ko) * 2012-05-07 2019-05-10 엘지전자 주식회사 음성 파일과 관련된 텍스트의 표시 방법 및 이를 구현한 전자기기
CN103391347B (zh) * 2012-05-10 2018-06-08 中兴通讯股份有限公司 一种自动录音的方法及装置
CN104158945A (zh) * 2013-05-13 2014-11-19 中兴通讯股份有限公司 通话信息获取方法、装置及系统
CN104184870A (zh) * 2014-07-29 2014-12-03 小米科技有限责任公司 通话记录标记方法、装置及电子设备
CN104702791A (zh) * 2015-03-13 2015-06-10 安徽声讯信息技术有限公司 长时间录音并同步转写文字的智能手机及其信息处理方法
CN106686191A (zh) * 2015-11-06 2017-05-17 北京奇虎科技有限公司 一种自适应识别骚扰电话的处理方法及系统
CN106407426A (zh) * 2016-09-27 2017-02-15 宇龙计算机通信科技(深圳)有限公司 一种搜索关键词记录的覆盖方法、系统及终端
CN106657544A (zh) * 2016-10-24 2017-05-10 广东欧珀移动通信有限公司 一种来电录音的方法及终端设备
CN106791006A (zh) * 2016-11-28 2017-05-31 南京九致信息科技有限公司 通话记录内容存储方法与装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1815522A (zh) * 2006-02-28 2006-08-09 安徽中科大讯飞信息科技有限公司 运用计算机进行普通话水平测试和指导学习的方法

Also Published As

Publication number Publication date
CN107331394A (zh) 2017-11-07

Similar Documents

Publication Publication Date Title
CN104604274B (zh) 利用语音在用户设备之间连接服务的方法和装置
CN103137129B (zh) 语音识别方法及电子装置
CN109697979B (zh) 语音助手技能添加方法、装置、存储介质及服务器
CN102984666B (zh) 一种通话过程中的通讯录语音信息处理方法及系统
CN103442130A (zh) 语音操控方法、移动终端装置及语音操控系统
CN103916513A (zh) 在通信终端记录通话信息的方法和设备
US8332225B2 (en) Techniques to create a custom voice font
CN110244941B (zh) 任务开发方法、装置、电子设备及计算机可读存储介质
CN109272995A (zh) 语音识别方法、装置及电子设备
US20080189354A1 (en) Method and apparatus for automated user review of media content in a mobile communication device
CN104468941A (zh) 信息显示方法和装置
CN111144128A (zh) 语义解析方法和装置
CN110287364B (zh) 语音搜索方法、系统、设备及计算机可读存储介质
JP2006525018A5 (zh)
CN103116483A (zh) 一种调用微博的方法、装置及终端
CN111490927A (zh) 一种显示消息的方法、装置及设备
CN108305618A (zh) 语音获取及搜索方法、智能笔、搜索终端及存储介质
CN113378579A (zh) 一种语音录入结构化数据的方法、系统及电子设备
CN102043624A (zh) 中间件通讯接口自动编程方法及装置
CN101116074A (zh) 电子设备的通用解析器
CN106528715B (zh) 一种音频内容校核方法及装置
CN101727199A (zh) 一种输入方法和输入装置
CN103106214A (zh) 一种候选词组输出方法和电子设备
CN107331394B (zh) 基于移动互联网与手机app的语音资料采集系统
CN101615084A (zh) 汉字输入方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20201113