CN102750126B - 语音输入方法及终端 - Google Patents

语音输入方法及终端 Download PDF

Info

Publication number
CN102750126B
CN102750126B CN201210215646.2A CN201210215646A CN102750126B CN 102750126 B CN102750126 B CN 102750126B CN 201210215646 A CN201210215646 A CN 201210215646A CN 102750126 B CN102750126 B CN 102750126B
Authority
CN
China
Prior art keywords
phonetic entry
processing module
entry processing
digital signal
terminal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210215646.2A
Other languages
English (en)
Other versions
CN102750126A (zh
Inventor
王云华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen TCL New Technology Co Ltd
Original Assignee
Shenzhen TCL New Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen TCL New Technology Co Ltd filed Critical Shenzhen TCL New Technology Co Ltd
Priority to CN201210215646.2A priority Critical patent/CN102750126B/zh
Publication of CN102750126A publication Critical patent/CN102750126A/zh
Application granted granted Critical
Publication of CN102750126B publication Critical patent/CN102750126B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Machine Translation (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开一种语音输入方法及终端,其方法包括:采集用户输入的语音模拟信号,并将语音模拟信号转换为数字信号;基于数字信号,以预定的时间间隔在预设的第一语音输入处理模块和第二语音输入处理模块之间进行信号存储和输出的交替切换,控制语音输入。本发明通过将用户的语音输入内容由模拟信号转换为数字信号,定时协调切换控制选择预设的第一语音输入处理模块和第二语音输入处理模块,对输入内容进行交替存储和输出,从而实现对语音输入的控制,有效的防止了语音输入溢出的问题,避免输入语句丢失,同时提高了语音输入的效率,改善了用户在终端上进行语音输入交互的体验效果,使终端更具有人性化设计特点。<!--1-->

Description

语音输入方法及终端
技术领域
本发明涉及语音输入技术领域,尤其涉及一种防止语音输入溢出的语音输入方法及终端。
背景技术
随着数字化技术的发展,越来越多的消费类电子设备应用于人们的生活,例如手机、数字电视机以及Pad(平板电脑)等,用户通过这些设备可以方便地实现各种娱乐以及办公功能,包括发邮件和写微博等。其中,无论哪一种功能,用户都需要进行各种输入交互的操作。
目前,随着3G技术的发展,大屏幕手机和语音电视逐渐发展为主流,无论键盘输入还是手写输入,在一定程度上均存在各种限制。由此,语音输入法逐渐受到用户的青睐。
但是,现有的语音输入技术中,对于简短的语句输入的识别较为正常,但是,如果用户语音输入内容时间稍微长一点,此时,语音输入法输入的内容则会出现输入溢出。而语音输入法输入溢出不仅造成用户语音输入的语句丢失,而且还大大影响用户语音输入的体验效果和效率。
发明内容
本发明的主要目的在于提供一种语音输入方法及终端,旨在避免语音输入溢出造成输入语句丢失的问题,提高语音输入文字的效率。
为了达到上述目的,本发明提出一种语音输入方法,包括以下步骤:
采集用户输入的语音模拟信号,并将所述语音模拟信号转换为数字信号;
基于所述数字信号,以预定的时间间隔在预设的第一语音输入处理模块和第二语音输入处理模块之间进行信号存储和输出的交替切换,控制语音输入。
优选地,所述将语音模拟信号转换为数字信号的步骤之后还包括:
对所述数字信号进行去噪处理。
优选地,所述基于数字信号,以预定的时间间隔在预设的第一语音输入处理模块和第二语音输入处理模块之间进行信号存储和输出的交替切换,控制语音输入的步骤包括:
以预定的时间间隔进行循环判断,判断当前是选择第一语音输入处理模块还是选择第二语音输入处理模块输入数据;
若当前选择第一语音输入处理模块输入数据,则从所述数字信号中获取待输入的语音数据,由所述第一语音输入处理模块输入至第一存储区的上半部分;
判断当前是否选择第二语音输入处理模块输出数据;若否,则结束语音输入流程;若是,则
由所述第二语音输入处理模块从第二存储区的下半部分获取语音数据输出;
对输出的语音数据进行识别转换后,以文本信息显示在终端上。
优选地,所述以预定的时间间隔判断当前是选择第一语音输入处理模块还是选择第二语音输入处理模块输入数据的步骤之后还包括:
若当前选择第二语音输入处理模块输入数据,则从所述数字信号中获取待输入的语音数据,由所述第二语音输入处理模块输入至所述第二存储区的下半部分;
判断当前是否选择第一语音输入处理模块输出数据;若否,则结束语音输入流程;若是,则
由所述第一语音输入处理模块从所述第一存储区的上半部分获取语音数据输出。
优选地,所述对输出的语音数据进行识别转换后,以文本信息显示在终端上的步骤包括:
对输出的语音数据进行识别,将其转换为文本信息;
将所述文本信息显示在终端预定的文本显示框。
本发明还提出一种语音输入终端,包括:
采集模块,用于采集用户输入的语音模拟信号,并将所述语音模拟信号转换为数字信号;
控制模块,用于基于所述数字信号,以预定的时间间隔在预设的第一语音输入处理模块和第二语音输入处理模块之间进行信号存储和输出的交替切换,控制语音输入。
优选地,该终端还包括:
噪声处理模块,用于对所述数字信号进行去噪处理。
优选地,所述控制模块包括:
第一判断操作单元,用于以预定的时间间隔进行循环判断,判断当前是选择第一语音输入处理模块还是选择第二语音输入处理模块输入数据;若当前选择第一语音输入处理模块输入数据,则从所述数字信号中获取待输入的语音数据,由所述第一语音输入处理模块输入至第一存储区的上半部分;以及进一步判断当前是否选择第二语音输入处理模块输出数据;若否,则结束语音输入流程;若是,则由所述第二语音输入处理模块从第二存储区的下半部分获取语音数据输出;
输出显示单元,用于对输出的语音数据进行识别转换后,以文本信息显示在终端上。
优选地,所述控制模块还包括:
第二判断操作单元,用于在当前选择第二语音输入处理模块输入数据时,从所述数字信号中获取待输入的语音数据,由所述第二语音输入处理模块输入至所述第二存储区的下半部分;以及进一步判断当前是否选择第一语音输入处理模块输出数据;若否,则结束语音输入流程;若是,则由所述第一语音输入处理模块从所述第一存储区的上半部分获取语音数据输出
优选地,所述输出显示单元包括:
识别转换子单元,用于对输出的语音数据进行识别,将其转换为文本信息;
显示子单元,用于将所述文本信息显示在终端预定的文本显示框。
本发明提出的一种语音输入方法及终端,通过将用户的语音输入内容由模拟信号转换为数字信号,定时协调切换控制选择预设的第一语音输入处理模块和第二语音输入处理模块,对输入内容进行交替存储和输出,从而实现对语音输入的控制,有效的防止了语音输入溢出的问题,避免输入语句丢失,同时提高了语音输入的效率,改善了用户在终端上进行语音输入交互的体验效果,使终端更具有人性化设计特点。
附图说明
图1是本发明语音输入方法第一实施例的流程示意图;
图2是本发明语音输入方法第一实施例中基于数字信号,以预定的时间间隔在预设的第一语音输入处理模块和第二语音输入处理模块之间进行信号存储和输出的交替切换,控制语音输入的流程示意图;
图3是本发明语音输入方法第二实施例的流程示意图;
图4是本发明语音输入终端第一实施例的结构示意图;
图5是本发明语音输入终端第一实施例中控制模块的结构示意图;
图6是本发明语音输入终端第一实施例中输出显示单元的结构示意图;
图7是本发明语音输入终端第二实施例的结构示意图;
图8是本发明语音输入终端第二实施例的一种实例框架示意图。
为了使本发明的技术方案更加清楚、明了,下面将结合附图作进一步详述。
具体实施方式
本发明实施例的解决方案主要是:将用户的语音输入内容由模拟信号转换为数字信号,定时协调切换控制选择预设的第一语音输入处理模块和第二语音输入处理模块,对输入内容进行交替存储和输出,以实现语音输入的有效控制,防止语音输入溢出,避免输入语句丢失,改善用户输入体验。
参照图1,图1是本发明语音输入方法第一实施例的流程示意图。如图1所示,本发明第一实施例提出一种语音输入方法,包括:
步骤S101,采集用户输入的语音模拟信号,并将所述语音模拟信号转换为数字信号;
用户可以通过麦克风等语音输入设备将语音信号传输至接收语音的终端。该接收语音的终端可以为电视机、电脑、手机等具有语音输入功能的电子设备。
终端接收到用户输入的语音信号后,将此模拟的语音信号转为数字信号。
步骤S102,基于所述数字信号,以预定的时间间隔在预设的第一语音输入处理模块和第二语音输入处理模块之间进行信号存储和输出的交替切换,控制语音输入。
由于现有技术中对用户输入的时间较短的语音内容识别较好,而若用户输入时间较长的语句,则容易造成语音输入溢出,丢失一部分语句,影响了用户的体验效果。
本实施例为了防止用户输入的语音信号溢出,在接收语音的终端预先设置有第一语音输入处理模块和第二语音输入处理模块,同时还设置有时间定时器,并在终端存储区域内设定对应存储第一语音输入处理模块输入的语音数据的第一存储区,以及对应存储第二语音输入处理模块输入的语音数据的第二存储区。上述第一存储区和第二存储区均包括上半部分存储区和下半部分存储区。通过时间定时器以预定的时间间隔报时,交替启动第一语音输入处理模块和第二语音输入处理模块,用来将用户输入并经转换后的数字信号对应存储在终端存储区域的第一存储区的上半部分和第二存储区的下半部分,或者对应存储在终端存储区域的第一存储区的下半部分和第二存储区的上半部分,同时,对第一语音输入处理模块和第二语音输入处理模块进行协调切换,交替输出第一存储区的上半部分和第二存储区的下半部分相应的语音数字信号,或者,交替输出第一存储区的下半部分和第二存储区的上半部分相应的语音数字信号,由设置在终端内的语音识别显示模块对第一语音输入处理模块和第二语音输入处理模块交替输出的语音信号进行识别后转换为文本信息,显示在终端显示屏预定的文本显示框。
上述预定的时间间隔可以根据实际需要进行设定,为了防止时间间隔过大造成语音数据的输入溢出,该时间间隔可以设置稍小一些。
由此,通过两个语音输入处理模块对语音数据在终端存储区内不同区域的交替存储与交替输出,极大的缓解了终端对接收的语音数据的存储与输出压力,有效的防止了语音输入的溢出问题,避免了用户输入的语句丢失,提高了语音输入的效率,同时改善了用户在终端上进行语音输入交互的体验效果。
具体地,如图2所示,上述步骤S102基于数字信号,以预定的时间间隔在预设的第一语音输入处理模块和第二语音输入处理模块之间进行信号存储和输出的交替切换,控制语音输入的步骤包括:
步骤S1021,以预定的时间间隔进行循环判断,判断当前是选择第一语音输入处理模块还是选择第二语音输入处理模块输入数据;若当前选择第一语音输入处理模块输入数据,则进入步骤S1022;若当前选择第二语音输入处理模块输入数据,则进入步骤S1026;
步骤S1022,从所述数字信号中获取待输入的语音数据,由所述第一语音输入处理模块输入至第一存储区的上半部分;进入步骤S1023;
步骤S1023,判断当前是否选择第二语音输入处理模块输出数据;若否,则结束语音输入流程;若是,则进入步骤S1024;
步骤S1024,由所述第二语音输入处理模块从第二存储区的下半部分获取语音数据输出;进入步骤S1025;
步骤S1025,对输出的语音数据进行识别转换后,以文本信息显示在终端上。
步骤S1026,从所述数字信号中获取待输入的语音数据,由所述第二语音输入处理模块输入至所述第二存储区的下半部分;
步骤S1027,判断当前是否选择第一语音输入处理模块输出数据;若否,则结束语音输入流程;若是,则进入步骤S1028;
步骤S1028,由所述第一语音输入处理模块从第一存储区的上半部分获取语音数据输出;进入步骤S1025。
同理,对应地,根据定时器以预定时间间隔报时,交替启动第一语音输入处理模块和第二语音输入处理模块,将用户输入并经转换后的数字信号对应存储在终端存储区域的第一存储区的下半部分和第二存储区的上半部分,同时,对第一语音输入处理模块和第二语音输入处理模块进行协调切换,交替输出第一存储区的下半部分和第二存储区的上半部分相应的语音数字信号,由设置在终端内的语音识别显示模块对第一语音输入处理模块和第二语音输入处理模块交替输出的语音信号进行识别后转换为文本信息,显示在终端显示屏预定的文本显示框。其基本原理请参照上述步骤S1021至步骤S1028,在此不再赘述。
本实施例中对时间定时器、第一语音输入处理模块和第一语音输入处理模块以及其他相关功能模块的控制可以采用终端中的CPU处理模块来完成,各功能模块通过与CPU处理模块的交互,来实现语音信号的防溢出输入。
如图3所示,本发明第二实施例提出一种语音输入方法,在上述第一实施例的基础上,除了包括上述第一实施例中的步骤S101和步骤S102之外,在上述步骤S101将模拟信号转换为数字信号的步骤之后还包括:
步骤S103,对所述数字信号进行去噪处理。
本实施例与上述第一实施例的区别在于,本实施例在将用户输入的语音信号转换为数字信号后,还对该数字信号进行去噪处理,即将数字信号中不需要的噪音去除,比如将数字信号中许多不同频率和强度的声波或者其他杂乱无章、组合而成的信号去除掉。此外,由于人的发声频率带宽为20-20k,还需要将在上述范围之外的信号去除。
经过去噪处理,可提高接收语音的终端所接收的语音信号的清晰度,更有利于终端对语音信号的识别和文本转换。
本实施例通过将用户的语音输入内容由模拟信号转换为数字信号,去除噪声干扰,并定时协调切换控制选择预设的第一语音输入处理模块和第二语音输入处理模块,对输入内容进行交替存储和输出,从而实现对语音输入的控制,有效的防止了语音输入溢出的问题,避免输入语句丢失,同时提高了语音输入的效率,改善了用户在终端上进行语音输入交互的体验效果,使终端更具有人性化设计特点。
如图4所示,本发明第一实施例提出一种语音输入终端,包括:采集模块401以及控制模块402,控制模块402连接有第一语音输入处理模块403和第二语音输入处理模块404,其中:
采集模块401,用于采集用户输入的语音模拟信号,并将所述语音模拟信号转换为数字信号;
控制模块402,用于基于所述数字信号,以预定的时间间隔在预设的第一语音输入处理模块和第二语音输入处理模块之间进行信号存储和输出的交替切换,控制语音输入。
本实施例终端可以为电视机、电脑、手机等具有语音输入功能的电子设备。
首先,终端的采集模块401通过麦克风等语音输入设备接收用户输入的语音信号,将此模拟的语音信号转为数字信号。
由于现有技术中对用户输入的时间较短的语音内容识别较好,而若用户输入时间较长的语句,则容易造成语音输入溢出,丢失一部分语句,影响了用户的体验效果。
本实施例为了防止用户输入的语音信号溢出,在终端内预先设置有第一语音输入处理模块403和第二语音输入处理模块404,同时还设置有时间定时器,并在终端存储区域内设定对应存储第一语音输入处理模块403输入的语音数据的第一存储区,以及对应存储第二语音输入处理模块404输入的语音数据的第二存储区。上述第一存储区和第二存储区均包括上半部分存储区和下半部分存储区。上述第一语音输入处理模块403、第二语音输入处理模块404以及定时器均由控制模块402控制,通过时间定时器以预定的时间间隔报时,交替启动第一语音输入处理模块403和第二语音输入处理模块404,用来将用户输入并经转换后的数字信号对应存储在终端存储区域的第一存储区的上半部分和第二存储区的下半部分,或者对应存储在终端存储区域的第一存储区的下半部分和第二存储区的上半部分,,同时,对第一语音输入处理模块403和第二语音输入处理模块404进行协调切换,交替输出第一存储区的上半部分和第二存储区的下半部分相应的语音数字信号,或者,交替输出第一存储区的下半部分和第二存储区的上半部分相应的语音数字信号,由控制模块402对第一语音输入处理模块403和第二语音输入处理模块404交替输出的语音信号进行识别后转换为文本信息,显示在终端显示屏预定的文本显示框。
上述预定的时间间隔可以根据实际需要进行设定,为了防止时间间隔过大造成语音数据的输入溢出,该时间间隔可以设置稍小一些。
由此,通过两个语音输入处理模块对语音数据在终端存储区内不同区域的交替存储与交替输出,极大的缓解了终端对接收的语音数据的存储与输出压力,有效的防止了语音输入的溢出问题,避免了用户输入的语句丢失,提高了语音输入的效率,同时改善了用户在终端上进行语音输入交互的体验效果。
具体实施过程中,如图5所示,所述控制模块402包括:第一判断操作单元4021、第二判断操作单元4023以及输出显示单元4022,其中:
第一判断操作单元4021用于以预定的时间间隔进行循环判断,判断当前是选择第一语音输入处理模块403还是选择第二语音输入处理模块404输入数据;若当前选择第一语音输入处理模块403输入数据,则从所述数字信号中获取待输入的语音数据,由所述第一语音输入处理模块403输入至第一存储区的上半部分;以及进一步判断当前是否选择第二语音输入处理模块404输出数据;若否,则结束语音输入流程;若是,则由所述第二语音输入处理模块404从第二存储区的下半部分获取语音数据输出;
输出显示单元4022用于对所述判断操作单元4021输出的语音数据进行识别转换后,以文本信息显示在终端上。
所述第二判断操作单元4023用于在当前选择第二语音输入处理模块404输入数据时,从所述数字信号中获取待输入的语音数据,由所述第二语音输入处理模块404输入至所述第二存储区的下半部分;以及进一步判断当前是否选择第一语音输入处理模块403输出数据;若否,则结束语音输入流程;若是,则由所述第一语音输入处理模块403从所述第一存储区的上半部分获取语音数据输出;由所述输出显示单元4022对输出的语音数据进行识别转换后,以文本信息显示在终端上。
同理,对应地,根据定时器以预定时间间隔报时,交替启动第一语音输入处理模块403和第二语音输入处理模块404,将用户输入并经转换后的数字信号对应存储在终端存储区域的第一存储区的下半部分和第二存储区的上半部分,同时,对第一语音输入处理模块403和第二语音输入处理模块404进行协调切换,交替输出第一存储区的下半部分和第二存储区的上半部分相应的语音数字信号,由设置在终端内的语音识别显示模块对第一语音输入处理模块403和第二语音输入处理模块404交替输出的语音信号进行识别后转换为文本信息,显示在终端显示屏预定的文本显示框。其基本原理请参照上述过程,在此不再赘述。
如图6所示,所述输出显示单元4022具体可以包括:识别转换子单元40221以及显示子单元40222,其中:
识别转换子单元40221,用于对输出的语音数据进行识别,将其转换为文本信息;
显示子单元40222,用于将所述文本信息显示在终端预定的文本显示框。
本实施例中对时间定时器、第一语音输入处理模块403和第一语音输入处理模块403以及其他相关功能模块进行控制的控制模块402可以采用终端中的CPU处理模块来完成,各功能模块通过与CPU处理模块的交互,来实现语音信号的防溢出输入。
如图7所示,本发明第二实施例还提出一种语音输入终端,在上述第一实施例的基础上,除了包括采集模块401以及控制模块402,控制模块402连接有第一语音输入处理模块403和第二语音输入处理模块404,还包括:
噪声处理模块405,连接在采集模块401与控制模块402之间,用于对所述数字信号进行去噪处理。
本实施例与上述第一实施例的区别在于,本实施例在将用户输入的语音信号转换为数字信号后,还通过噪声处理模块405对该数字信号进行去噪处理,即将数字信号中不需要的噪音去除,比如将数字信号中许多不同频率和强度的声波或者其他杂乱无章、组合而成的信号去除掉。此外,由于人的发声频率带宽为20-20k,还需要将在上述范围之外的信号去除。
经过去噪处理,可提高接收语音的终端所接收的语音信号的清晰度,更有利于终端对语音信号的识别和文本转换。
以下以具体实例对本实施例方案进行详细阐述:
如图8所示,图8是本发明语音输入终端第二实施例的一种实例框架示意图。本实例设定接收语音的终端内设有:语音采集模块1、CPU处理模块2、噪声处理模块3、第一语音输入处理模块4、第二语音输入处理模块5、时间定时器6以及语音识别显示模块7,其中:
CPU处理模块2开启时间定时器6,时间定时器6以预定的时间间隔通知CPU处理模块2当前的时间,根据第一语音输入处理模块4、第二语音输入处理模块5的语音数据的输入与输出时间点,交替启动第一语音输入处理模块4、第二语音输入处理模块5,在第一语音输入处理模块4、第二语音输入处理模块5之间协调切换控制,将语音信号对应存储在终端的不同存储区域,并根据相应的时间间隔,控制第一语音输入处理模块4、第二语音输入处理模块5将终端对应的存储区域中的语音数据输出至语音识别显示模块7,并显示对应的文本信息,由此实现语音信号的防溢出输入,其具体过程描述如下:
首先,接收语音的终端通过语音采集模块1采集用户输入的语音信号,并将该语音信号由模拟信号转换为数字信号,之后由噪声处理模块3对该数字信号进行去噪处理。
经过上述处理后,CPU处理模块2根据时间定时器6的报时,得知第一语音输入处理模块4、第二语音输入处理模块5进行语音数据输入存储和输出的时间点,在第一语音输入处理模块4与第二语音输入处理模块5之间进行切换控制。
CPU处理模块2根据判断得到的切换结果,通知第一语音输入处理模块4与第二语音输入处理模块5进行相应的动作。
具体地,对于第一语音输入处理模块4,CPU处理模块2首先判断当前时间是否为该第一语音输入处理模块4输入语音存储的时间,若是,CPU处理模块2则控制第一语音输入处理模块4从上述语音数字信号中获取相应的一部分语音数据存储至预先设定的存储区域的第一存储区的上半部分;如果当前时间不是该第一语音输入处理模块4输入语音存储的时间,CPU处理模块2会判断当前时间是否为第二语音输入处理模块5输出语音数据的时间,若是,CPU处理模块2则控制第二语音输入处理模块5,从预先设定的存储区域的第二存储区的下半部分中获取相应的语音数据输出至语音识别显示模块7进行显示;若当前时间不是该第二语音输入处理模块5输出语音数据的时间,则结束语音输入流程。
同理,对于第二语音输入处理模块5,CPU处理模块2首先判断当前时间是否为该第二语音输入处理模块5输入语音存储的时间,若是,CPU处理模块2则控制第二语音输入处理模块5从上述语音数字信号中获取相应的一部分语音数据存储至预先设定的存储区域的第二存储区的下半部分;如果当前时间不是该第二语音输入处理模块5输入语音存储的时间,CPU处理模块2会判断当前时间是否为第一语音输入处理模块4输出语音数据的时间,若是,CPU处理模块2则控制第一语音输入处理模块4,从预先设定的存储区域的第一存储区的上半部分中获取相应的语音数据输出至语音识别显示模块7进行显示;若当前时间不是该第一语音输入处理模块4输出语音数据的时间,则结束语音输入流程。
同理,对应地,CPU处理模块2根据时间定时器6以预定时间间隔报时,交替启动第一语音输入处理模块4和第二语音输入处理模块5,将用户输入并经转换后的数字信号对应存储在终端存储区域的第一存储区的下半部分和第二存储区的上半部分,同时,对第一语音输入处理模块4和第二语音输入处理模块5进行协调切换,交替输出第一存储区的下半部分和第二存储区的上半部分相应的语音数字信号,由设置在终端内的语音识别显示模块7对第一语音输入处理模块4和第二语音输入处理模块5交替输出的语音信号进行识别后转换为文本信息,显示在终端显示屏预定的文本显示框。其基本原理请参照上述过程,在此不再赘述。
上述语音识别显示模块7对语音数据进行识别的方式,可以采用互联网云端识别,并将识别结果传回至本地;或者通过本地进行语音识别,将语音信号转变为相应的用户语音输入的文本信息,最终显示在终端预定的文本显示框中。
本实例中语音采集模块1、噪声处理模块3、第一语音输入处理模块4、第二语音输入处理模块5以及时间定时器6分别对应上述实施例中的采集模块401、噪声处理模块405、第一语音输入处理模块403、第二语音输入处理模块404以及时间定时器,本实例中的CPU处理模块2和语音识别显示模块7构成上述实施例中的控制模块402。
本实施例通过将用户的语音输入内容由模拟信号转换为数字信号,去除噪声干扰,并定时协调切换控制选择预设的第一语音输入处理模块403和第二语音输入处理模块404,对输入内容进行交替存储和输出,从而实现对语音输入的控制,有效的防止了语音输入溢出的问题,避免输入语句丢失,同时提高了语音输入的效率,改善了用户在终端上进行语音输入交互的体验效果,使终端更具有人性化设计特点。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (8)

1.一种语音输入方法,其特征在于,包括以下步骤:
采集用户输入的语音模拟信号,并将所述语音模拟信号转换为数字信号;
基于所述数字信号,以预定的时间间隔在预设的第一语音输入处理模块和第二语音输入处理模块之间进行信号存储和输出的交替切换,控制语音输入,具体包括:以预定的时间间隔进行循环判断,判断当前是选择第一语音输入处理模块还是选择第二语音输入处理模块输入数据;
若当前选择第一语音输入处理模块输入数据,则从所述数字信号中获取待输入的语音数据,由所述第一语音输入处理模块输入至第一存储区的上半部分;
判断当前是否选择第二语音输入处理模块输出数据;若否,则结束语音输入流程;若是,则
由所述第二语音输入处理模块从第二存储区的下半部分获取语音数据输出;
对输出的语音数据进行识别转换后,以文本信息显示在终端上。
2.根据权利要求1所述的方法,其特征在于,所述将语音模拟信号转换为数字信号的步骤之后还包括:
对所述数字信号进行去噪处理。
3.根据权利要求1所述的方法,其特征在于,所述以预定的时间间隔判断当前是选择第一语音输入处理模块还是选择第二语音输入处理模块输入数据的步骤之后还包括:
若当前选择第二语音输入处理模块输入数据,则从所述数字信号中获取待输入的语音数据,由所述第二语音输入处理模块输入至所述第二存储区的下半部分;
判断当前是否选择第一语音输入处理模块输出数据;若否,则结束语音输入流程;若是,则
由所述第一语音输入处理模块从所述第一存储区的上半部分获取语音数据输出。
4.根据权利要求1或3所述的方法,其特征在于,所述对输出的语音数据进行识别转换后,以文本信息显示在终端上的步骤包括:
对输出的语音数据进行识别,将其转换为文本信息;
将所述文本信息显示在终端预定的文本显示框。
5.一种语音输入终端,其特征在于,包括:
采集模块,用于采集用户输入的语音模拟信号,并将所述语音模拟信号转换为数字信号;
控制模块,用于基于所述数字信号,以预定的时间间隔在预设的第一语音输入处理模块和第二语音输入处理模块之间进行信号存储和输出的交替切换,控制语音输入;所述控制模块包括:
第一判断操作单元,用于以预定的时间间隔进行循环判断,判断当前是选择第一语音输入处理模块还是选择第二语音输入处理模块输入数据;若当前选择第一语音输入处理模块输入数据,则从所述数字信号中获取待输入的语音数据,由所述第一语音输入处理模块输入至第一存储区的上半部分;以及进一步判断当前是否选择第二语音输入处理模块输出数据;若否,则结束语音输入流程;若是,则由所述第二语音输入处理模块从第二存储区的下半部分获取语音数据输出;
输出显示单元,用于对输出的语音数据进行识别转换后,以文本信息显示在终端上。
6.根据权利要求5所述的终端,其特征在于,还包括:
噪声处理模块,用于对所述数字信号进行去噪处理。
7.根据权利要求5所述的终端,其特征在于,所述控制模块还包括:
第二判断操作单元,用于在当前选择第二语音输入处理模块输入数据时,从所述数字信号中获取待输入的语音数据,由所述第二语音输入处理模块输入至所述第二存储区的下半部分;以及进一步判断当前是否选择第一语音输入处理模块输出数据;若否,则结束语音输入流程;若是,则由所述第一语音输入处理模块从所述第一存储区的上半部分获取语音数据输出。
8.根据权利要求5或7所述的终端,其特征在于,所述输出显示单元包括:
识别转换子单元,用于对输出的语音数据进行识别,将其转换为文本信息;
显示子单元,用于将所述文本信息显示在终端预定的文本显示框。
CN201210215646.2A 2012-06-27 2012-06-27 语音输入方法及终端 Active CN102750126B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210215646.2A CN102750126B (zh) 2012-06-27 2012-06-27 语音输入方法及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210215646.2A CN102750126B (zh) 2012-06-27 2012-06-27 语音输入方法及终端

Publications (2)

Publication Number Publication Date
CN102750126A CN102750126A (zh) 2012-10-24
CN102750126B true CN102750126B (zh) 2016-02-03

Family

ID=47030350

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210215646.2A Active CN102750126B (zh) 2012-06-27 2012-06-27 语音输入方法及终端

Country Status (1)

Country Link
CN (1) CN102750126B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9697831B2 (en) * 2013-06-26 2017-07-04 Cirrus Logic, Inc. Speech recognition
CN105791931A (zh) * 2016-02-26 2016-07-20 深圳Tcl数字技术有限公司 智能电视及其语音控制方法
CN110706705A (zh) * 2019-10-22 2020-01-17 青岛海信移动通信技术股份有限公司 一种语音控制方法、终端及计算机存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1292523A (zh) * 1999-10-06 2001-04-25 微软公司 背景声频恢复系统
CN1696891A (zh) * 2004-05-11 2005-11-16 北京中星微电子有限公司 一种音频捕获中的无缝平滑方法
CN1877538A (zh) * 2006-07-04 2006-12-13 华为技术有限公司 一种数字处理芯片
CN101114446A (zh) * 2007-04-19 2008-01-30 北京中星微电子有限公司 一种嵌入式平台语音合成系统及其方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030004729A1 (en) * 2001-06-28 2003-01-02 Allen Karl H. Handheld device with enhanced speech capability

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1292523A (zh) * 1999-10-06 2001-04-25 微软公司 背景声频恢复系统
CN1696891A (zh) * 2004-05-11 2005-11-16 北京中星微电子有限公司 一种音频捕获中的无缝平滑方法
CN1877538A (zh) * 2006-07-04 2006-12-13 华为技术有限公司 一种数字处理芯片
CN101114446A (zh) * 2007-04-19 2008-01-30 北京中星微电子有限公司 一种嵌入式平台语音合成系统及其方法

Also Published As

Publication number Publication date
CN102750126A (zh) 2012-10-24

Similar Documents

Publication Publication Date Title
US11295760B2 (en) Method, apparatus, system and storage medium for implementing a far-field speech function
CN111223497B (zh) 一种终端的就近唤醒方法、装置、计算设备及存储介质
CN107256707B (zh) 一种语音识别方法、系统及终端设备
CN109543200A (zh) 一种文本翻译方法及装置
CN110942763B (zh) 语音识别方法及装置
CN104123114A (zh) 一种进行语音播放的方法和装置
WO2020057624A1 (zh) 语音识别的方法和装置
CN111667843B (zh) 终端设备的语音唤醒方法、系统、电子设备、存储介质
CN107240396B (zh) 说话人自适应方法、装置、设备及存储介质
CN106155640A (zh) 一种音量显示方法及装置
CN111435592A (zh) 一种语音识别方法、装置及终端设备
CN102750126B (zh) 语音输入方法及终端
CN110322880A (zh) 车载终端设备以及唤醒其多个语音交互程序的方法
CN207603881U (zh) 一种智能语音无线音箱
CN109712623A (zh) 语音控制方法、装置及计算机可读存储介质
CN104252287A (zh) 一种交互装置和基于交互装置的提高表达能力的方法
CN106896933A (zh) 将语音输入转换成文本输入的方法、装置和语音输入设备
CN103095927A (zh) 基于移动通讯终端及眼镜的显示及语音输出方法及系统
CN102680838A (zh) 基于双树复小波变换的电能质量监测识别方法及系统
JP2019525233A (ja) 音声認識方法及び装置
CN112447168A (zh) 语音识别系统、方法、音箱、显示设备和交互平台
CN110364176A (zh) 语音信号处理方法及装置
CN106486119A (zh) 一种识别语音信息的方法和装置
CN102376304B (zh) 文本朗读系统及其文本朗读方法
CN104679733A (zh) 一种语音对话翻译方法、装置及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant