CN105760084A - 语音输入的控制方法和装置 - Google Patents

语音输入的控制方法和装置 Download PDF

Info

Publication number
CN105760084A
CN105760084A CN201610050038.9A CN201610050038A CN105760084A CN 105760084 A CN105760084 A CN 105760084A CN 201610050038 A CN201610050038 A CN 201610050038A CN 105760084 A CN105760084 A CN 105760084A
Authority
CN
China
Prior art keywords
function key
phonetic
user
phonetic function
terminal unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610050038.9A
Other languages
English (en)
Other versions
CN105760084B (zh
Inventor
李适
魏利开
白晶亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201610050038.9A priority Critical patent/CN105760084B/zh
Publication of CN105760084A publication Critical patent/CN105760084A/zh
Application granted granted Critical
Publication of CN105760084B publication Critical patent/CN105760084B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/0485Scrolling or panning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0488Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Input From Keyboards Or The Like (AREA)
  • Telephone Function (AREA)

Abstract

本发明提出一种语音输入的控制方法和装置,其中,该语音输入的控制方法,包括以下步骤:检测用户对终端设备的操作;当检测到所述用户对所述终端设备中语音功能键的启动需求时,启动语音输入功能,并开始采集声音数据。本发明的语音输入的控制方法,能够有效降低因语音功能键尚未准备就绪而导致的漏掉用户输入的语音内容的可能,提高语音识别率。

Description

语音输入的控制方法和装置
技术领域
本发明涉及语音输入技术领域,特别涉及一种语音输入的控制方法和装置。
背景技术
随着语音识别技术的发展,通过语音交互方式控制各种设备已经被广泛使用。由于用户一般在触发语音功能键后就做语音输入,但是录音设备的质量和性能参差不齐,录音设备的启动有快有慢,因此,传统的语音交互方式中,存在用户已经开始说话,但是录音设备并未准备就绪的问题,由此会造成漏掉部分录音,降低语音识别率,影响最终识别结果。
发明内容
本发明旨在至少在一定程度上解决上述技术问题。
为此,本发明的第一个目的在于提出一种语音输入的控制方法,能够有效降低因语音功能键尚未准备就绪而导致的漏掉用户输入的语音内容的可能。
本发明的第二个目的在于提出一种语音输入的控制装置。
为达上述目的,根据本发明第一方面实施例提出了一种语音输入的控制方法,包括以下步骤:检测用户对终端设备的操作;当检测到所述用户对所述终端设备中语音功能键的启动需求时,启动语音输入功能,并开始采集声音数据。
本发明实施例的语音输入的控制方法,通过检测用户对终端设备的操作,并在检测到用户对终端设备中的语音功能键的启动需求时,启动语音输入功能,并开始采集声音数据。由此,实现了在用户启动语音功能键之前根据对语音功能键的启动需求启动语音输入功能,从而当语音功能键启动能,语音输入功能已经准备就绪,能够有效降低因语音功能键尚未准备就绪而导致的漏掉用户输入的语音内容的可能,提高语音识别率。
本发明第二方面实施例提出了一种语音输入的控制装置,包括:检测模块,用于检测用户对终端设备的操作;启动模块,用于当检测到所述用户对所述终端设备中语音功能键的启动需求时,启动语音输入功能,并开始采集声音数据。
本发明实施例的语音输入的控制装置,通过检测用户对终端设备的操作,并在检测到用户对终端设备中的语音功能键的启动需求时,启动语音输入功能,并开始采集声音数据。由此,实现了在用户启动语音功能键之前根据对语音功能键的启动需求启动语音输入功能,从而当语音功能键启动能,语音输入功能已经准备就绪,能够有效降低因语音功能键尚未准备就绪而导致的漏掉用户输入的语音内容的可能,提高语音识别率。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1为根据本发明一个实施例的语音输入的控制方法的流程图;
图2为根据本发明另一个实施例的语音输入的控制方法的流程图;
图3为根据本发明另一个实施例的语音输入的控制方法的流程图;
图4a-图4d为根据本发明一个实施例的语音交互界面示意图;
图5为根据本发明一个实施例的语音输入的控制装置的结构示意图;
图6为根据本发明一个实施例的语音输入的控制装置的结构示意图;
图7为根据本发明一个实施例的语音输入的控制装置的结构示意图;。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
下面参考附图描述根据本发明实施例的语音输入的控制方法和装置。
为了解决语音交互中出现漏掉部分录音的情况,本发明提出了一种语音输入的控制方法,包括以下步骤:检测用户对终端设备的操作;当检测到用户对终端设备中语音功能键的启动需求时,启动语音输入功能,并开始采集声音数据。
图1为根据本发明一个实施例的语音输入的控制方法的流程图。
如图1所示,根据本发明实施例的语音输入的控制方法,包括以下步骤。
S101,检测用户对终端设备的操作。
具体地,本发明实施例提供的语音输入的控制方法可应用于具有语音输入功能的终端设备中。一般情况下,终端设备通过人机语音交互接口实现语音输入功能,具体的语音输入接口可以为麦克风等设备。
需要说明的是,终端设备可以通过能够访问人机语音交互接口的应用来为用户提供语音输入服务。例如:能够访问人机语音交互接口的应用可以是具有语音输入功能的导航应用、搜索引擎等,本实施例对此不作限制。
能够访问人机语音交互接口的应用可提供语音功能键,当用户需要进行语音输入时,用户可通过启动语音功能按键访问人机语音交互接口,以启动语音输入功能。
其中,语音功能键可以是虚拟键或者实体键,语音功能键可被设置为不同的按键形式,以通过不同的触发方式启动。在用户成功启动语音功能按键之前,可根据用户对终端设备的操作确定用户是否有对语音功能按键的启动需求。不同形式的语音功能按键,对应的启动需求的用户操作不同。具体表示用户的语音功能键的启动需求的操作可根据不同的语音功能按键的形式进行设置。举例来说,可包括:
如果语音功能键为滑动按键,则当检测到用户触碰语音功能键时,确定检测到用户对终端设备中语音功能键的启动需求。
如果语音功能键为按压键,则当检测到用户触碰语音功能键时,确定检测到用户对终端设备中语音功能键的启动需求。
如果语音功能键为电容感应按键,当检测到电容感应按键感应到的电容大于第一电容且小于第二电容时,确定检测到用户对终端设备中语音功能键的启动需求。具体地,电容感应按键可为触摸按键,当用户的手指或者去其他感应对象与触摸按键的距离越近时,电容感应按键感应到的电容越大。当电容感应按键感应到的电容大于第二电容时,则语音功能键被启动。而当电容感应按键感应到的电容大于第一电容且小于第二电容表示,用户对语音功能键有启动需求,且尚未启动语音功能键。
S102,当检测到用户对终端设备中语音功能键的启动需求时,启动语音输入功能,并开始采集声音数据。
具体地,当检测到用户对终端设备中语音功能键的启动需求时,可通过访问人机语音交互接口启动语音输入功能,开始采集声音数据。
进而,可在用户对语音功能键具有启动需求时启动语音输入功能。一般来说,用户启动语音功能按键后就开始输入语音,而本申请的实施例可在用户对语音功能键具有启动需求时启动语音输入功能。也就是说,当用户准备启动语音功能键但语音功能键尚未启动完成之前,充分利用这段时间启动语音输入功能,从而当用户启动语音功能键时,语音输入功能已经准备就绪,能够降低因语音功能键尚未准备就绪而导致的漏掉用户输入的语音内容的可能。
本发明实施例的语音输入的控制方法,通过检测用户对终端设备的操作,并在检测到用户对终端设备中的语音功能键的启动需求时,启动语音输入功能,并开始采集声音数据。由此,实现了在用户启动语音功能键之前根据对语音功能键的启动需求启动语音输入功能,从而当语音功能键启动能,语音输入功能已经准备就绪,能够有效降低因语音功能键尚未准备就绪而导致的漏掉用户输入的语音内容的可能,提高语音识别率。
图2为根据本发明另一个实施例的语音输入的控制方法的流程图。
如图2所示,根据本发明实施例的语音输入的控制方法包括步骤S201-S202。步骤S201-S202与图1所示的语音输入的控制方法中相同。进一步地,在步骤S202之后,还可包括以下步骤S203。
S203,当检测到用户启动语音功能键时,提示用户输入语音。
具体地,不同形式的语音功能按键,启动语音功能键的操作不同。具体启动语音功能键操作可根据不同的语音功能按键的形式进行设置。举例来说,可包括:
如果语音功能键为滑动按键,则当检测到用户对滑动按键进行了预设滑动操作时,确定检测到用户启动语音功能键;
如果语音功能键为按压键,则当检测到用户对按压键的施加的压力满足预设条件时,确定检测到用户启动语音功能键;
如果语音功能键为电容感应按键,则当检测到电容感应按键感应到的电容大于第二电容时,确定检测到用户启动语音功能键。
进而,可在检测到用户启动语音功能键时,提示用户输入语音。例如,在语音交互界面显示“语音录入中”等,以提醒用户已经开始语音录入。而实际上,语音输入功能已经准备就绪。
本发明实施例的语音输入的控制方法,可在检测到用户启动语音功能键时,提示用户输入语音。由此,实现了在用户启动语音功能键之前根据对语音功能键的启动需求启动语音输入功能,从而当语音功能键启动能,语音输入功能已经准备就绪,能够有效降低因语音功能键尚未准备就绪而导致的漏掉用户输入的语音内容的可能,提高语音识别率。
在本发明的一个实施例中,在用户启动语音功能键之后,可采集用户输入的语音数据。当用户停止输入语音数据时,可对采集到的声音数据进行语音识别,并根据识别结果对终端设备进行控制。由于语音输入功能的启动时间早于用户实际输入语音时间,因此,终端设备采集到的声音数据中还包括在用户实际输入语音之前录入的一部分背景音。为了能够更加准确地识别出用户输入的语音,本发明的实施例可在语音录入时对背景音进行标识。具体地,图3为根据本发明另一个实施例的语音输入的控制方法的流程图。
如图3所示,根据本发明实施例的语音输入的控制方法,包括以下步骤。
S301,检测用户对终端设备的操作。
S302,当检测到用户对终端设备中语音功能键的启动需求时,记录检测到用户对终端设备中语音功能键的启动需求时的第一时间,并启动语音输入功能,并开始采集声音数据。
S303,当检测到用户启动语音功能键时,记录检测到用户启动语音功能键时的第二时间,并提示用户输入语音。
S304,采集用户输入的语音数据。
S305,当用户停止输入语音数据时,根据第一时间和第二时间确定采集到的声音数据中的背景音片段。
用户在启动语音功能键之后,才会进行语音输入。因此,可将记录的第一时间与第二时间之间所录入的声音数据作为背景音片段。
S306,在采集到的声音数据中剔除背景音片段,并对其余声音片段进行语音识别。
S307,根据识别结果对终端设备进行控制。
本发明实施例的语音输入的控制方法,通过记录检测到用户对终端设备中语音功能键的启动需求时的第一时间,以及检测到用户启动语音功能键时的第二时间,并将终端设备采集到的声音数据中第一时间与第二时间之间的声音数据作为背景音片段剔除,以及对其余声音片段进行语音识别。能够对提前启动语音输入功能而录入多余的背景音进行剔除,从而不会因提起启动语音输入功能而增加语音识别负担,能够提高语音识别效率。
下面结合图4a-图4d对本发明实施例的语音输入的控制方法进行说明。在本实施例中以移动终端为例进行说明。
首先,如图4a所示,语音功能键A位于移动终端中交互区域(交互区域为移动终端屏幕区域)的左下角。
当检测到用户触碰到语音功能键A时,可确定检测到用户对移动终端中语音功能键A的启动需求。此时,可后台访问人机交互接口,以启动语音输入功能,开始采集声音数据。此外,如图4b所示,可显示语音功能键A的预设滑动轨迹,以提示用户通过对语音功能键A进行滑动操作启动语音功能按键。
当用户根据该提示向右拖动语音功能键A至交互区域的右下角,并松手时,可如图4c所示,示意用户可输入语音。此时,语音输入功能已经完成启动,并准备就绪,可采集用户输入的语音,而不会因尚未就绪而漏掉部分语音内容。
当检测到用户输入语音结束时,可开始对采集到的声音数据进行语音识别,并显示如图4d所示的界面,以对用户进行提示。
由此可见,本发明实施例的语音输入的控制方法,实现了在用户启动语音功能键之前根据对语音功能键的启动需求启动语音输入功能,从而当语音功能键启动能,语音输入功能已经准备就绪,能够有效降低因语音功能键尚未准备就绪而导致的漏掉用户输入的语音内容的可能,提高语音识别率。
为了实现上述实施例,本发明还提出一种语音输入的控制装置。
一种语音输入的控制装置,包括:检测模块,用于检测用户对终端设备的操作;启动模块,用于当检测到用户对终端设备中语音功能键的启动需求时,启动语音输入功能,并开始采集声音数据。
图5为根据本发明一个实施例的语音输入的控制装置的结构示意图。
如图5所示,根据本发明实施例的语音输入的控制装置,包括:检测模块10和启动模块20。
具体地,检测模块10用于检测用户对终端设备的操作。
其中,语音功能键可以是虚拟键或者实体键,语音功能键可被设置为不同的按键形式,以通过不同的触发方式启动。在用户成功启动语音功能按键之前,可根据用户对终端设备的操作确定用户是否有对语音功能按键的启动需求。不同形式的语音功能按键,对应的启动需求的用户操作不同。具体表示用户的语音功能键的启动需求的操作可根据不同的语音功能按键的形式进行设置。举例来说,可包括:
如果语音功能键为滑动按键,则当检测到用户触碰语音功能键时,确定检测到用户对终端设备中语音功能键的启动需求。
如果语音功能键为按压键,则当检测到用户触碰语音功能键时,确定检测到用户对终端设备中语音功能键的启动需求。
如果语音功能键为电容感应按键,当检测到电容感应按键感应到的电容大于第一电容且小于第二电容时,确定检测到用户对终端设备中语音功能键的启动需求。
启动模块20用于当检测到用户对终端设备中语音功能键的启动需求时,启动语音输入功能,并开始采集声音数据。
需要说明的是,前述对语音识别方法实施例的解释说明也适用于该实施例的语音识别装置,此处不再赘述。
本发明实施例的语音输入的控制装置,通过检测用户对终端设备的操作,并在检测到用户对终端设备中的语音功能键的启动需求时,启动语音输入功能,并开始采集声音数据。由此,实现了在用户启动语音功能键之前根据对语音功能键的启动需求启动语音输入功能,从而当语音功能键启动能,语音输入功能已经准备就绪,能够有效降低因语音功能键尚未准备就绪而导致的漏掉用户输入的语音内容的可能,提高语音识别率。
图6为根据本发明另一个实施例的语音输入的控制装置的结构示意图。
如图6所示,根据本发明实施例的语音输入的控制装置,包括:检测模块10、启动模块20和提示模块30。
具体地,提示模块30用于当检测到用户启动语音功能键时,提示用户输入语音。
其中,如果语音功能键为滑动按键,则当检测到用户对滑动按键进行了预设滑动操作时,确定检测到用户启动语音功能键;
如果语音功能键为按压键,则当检测到用户对按压键的施加的压力满足预设条件时,确定检测到用户启动语音功能键;
如果语音功能键为电容感应按键,则当检测到电容感应按键感应到的电容大于第二电容时,确定检测到用户启动语音功能键。
需要说明的是,前述对语音识别方法实施例的解释说明也适用于该实施例的语音识别装置,此处不再赘述。
本发明实施例的语音输入的控制装置,可在检测到用户启动语音功能键时,提示用户输入语音。由此,实现了在用户启动语音功能键之前根据对语音功能键的启动需求启动语音输入功能,从而当语音功能键启动能,语音输入功能已经准备就绪,能够有效降低因语音功能键尚未准备就绪而导致的漏掉用户输入的语音内容的可能,提高语音识别率。
图7为根据本发明另一个实施例的语音输入的控制装置的结构示意图。
如图7所示,根据本发明实施例的语音输入的控制装置,包括:检测模块10、启动模块20、提示模块30、采集模块40、识别模块50和记录模块60。
具体地,采集模块40用于采集用户输入的语音数据。
识别模块50用于当用户停止输入语音数据时,对采集到的声音数据进行语音识别,并根据识别结果对终端设备进行控制。
记录模块60用于记录检测到用户对终端设备中语音功能键的启动需求时的第一时间,以及记录检测到用户启动语音功能键时的第二时间。
在本发明的一个实施例中,识别模块50可具体用于:根据第一时间和第二时间确定采集到的声音数据中的背景音片段;在采集到的声音数据中剔除背景音片段,并对其余声音片段进行语音识别。
需要说明的是,前述对语音识别方法实施例的解释说明也适用于该实施例的语音识别装置,此处不再赘述。
本发明实施例的语音输入的控制装置,通过记录检测到用户对终端设备中语音功能键的启动需求时的第一时间,以及检测到用户启动语音功能键时的第二时间,并将终端设备采集到的声音数据中第一时间与第二时间之间的声音数据作为背景音片段剔除,以及对其余声音片段进行语音识别。能够对提前启动语音输入功能而录入多余的背景音进行剔除,从而不会因提起启动语音输入功能而增加语音识别负担,能够提高语音识别效率。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (14)

1.一种语音输入的控制方法,其特征在于,包括以下步骤:
检测用户对终端设备的操作;
当检测到所述用户对所述终端设备中语音功能键的启动需求时,启动语音输入功能,并开始采集声音数据。
2.如权利要求1所述的语音输入的控制方法,其特征在于,所述语音功能键为滑动按键或按压键,其中,
当检测到所述用户触碰所述语音功能键时,确定检测到所述用户对所述终端设备中语音功能键的启动需求。
3.如权利要求1所述的语音输入的控制方法,其特征在于,所述语音功能键为电容感应按键,其中,
当检测到所述电容感应按键感应到的电容大于第一电容且小于第二电容时,确定检测到所述用户对所述终端设备中语音功能键的启动需求。
4.如权利要求1所述的语音输入的控制方法,其特征在于,还包括:
当检测到所述用户启动所述语音功能键时,提示所述用户输入语音。
5.如权利要求4所述的语音输入的控制方法,其特征在于,其中,
如果所述语音功能键为滑动按键,则当检测到所述用户对所述滑动按键进行了预设滑动操作时,确定检测到所述用户启动所述语音功能键;
如果所述语音功能键为按压键,则当检测到所述用户对所述按压键的施加的压力满足预设条件时,确定检测到所述用户启动所述语音功能键;
如果所述语音功能键为电容感应按键,则当检测到所述电容感应按键感应到的电容大于第二电容时,确定检测到所述用户启动所述语音功能键。
6.如权利要求1-5任一项所述的语音输入的控制方法,其特征在于,还包括:
采集用户输入的语音数据;
当用户停止输入语音数据时,对采集到的声音数据进行语音识别,并根据识别结果对所述终端设备进行控制。
7.如权利要求6所述的语音输入的控制方法,其特征在于,还包括:
记录检测到所述用户对所述终端设备中语音功能键的启动需求时的第一时间;
记录检测到所述用户启动所述语音功能键时的第二时间;
所述对所述终端设备接收到的声音进行语音识别具体包括:
根据所述第一时间和所述第二时间确定所述采集到的声音数据中的背景音片段;
在所述采集到的声音数据中剔除所述背景音片段,并对其余声音片段进行语音识别。
8.一种语音输入的控制装置,其特征在于,包括:
检测模块,用于检测用户对终端设备的操作;
启动模块,用于当检测到所述用户对所述终端设备中语音功能键的启动需求时,启动语音输入功能,并开始采集声音数据。
9.如权利要求8所述的语音输入的控制装置,其特征在于,所述语音功能键为滑动按键或按压键,其中,
当检测到所述用户触碰所述语音功能键时,确定检测到所述用户对所述终端设备中语音功能键的启动需求。
10.如权利要求8所述的语音输入的控制装置,其特征在于,所述语音功能键为电容感应按键,其中,
当检测到所述电容感应按键感应到的电容大于第一电容且小于第二电容时,确定检测到所述用户对所述终端设备中语音功能键的启动需求。
11.如权利要求8所述的语音输入的控制装置,其特征在于,还包括:
提示模块,用于当检测到所述用户启动所述语音功能键时,提示所述用户输入语音。
12.如权利要求11所述的语音输入的控制装置,其特征在于,其中,
如果所述语音功能键为滑动按键,则当检测到所述用户对所述滑动按键进行了预设滑动操作时,确定检测到所述用户启动所述语音功能键;
如果所述语音功能键为按压键,则当检测到所述用户对所述按压键的施加的压力满足预设条件时,确定检测到所述用户启动所述语音功能键;
如果所述语音功能键为电容感应按键,则当检测到所述电容感应按键感应到的电容大于第二电容时,确定检测到所述用户启动所述语音功能键。
13.如权利要求8-12任一项所述的语音输入的控制装置,其特征在于,还包括:
采集模块,用于采集用户输入的语音数据;
识别模块,用于当用户停止输入语音数据时,对采集到的声音数据进行语音识别,并根据识别结果对所述终端设备进行控制。
14.如权利要求13所述的语音输入的控制装置,其特征在于,还包括:
记录模块,用于记录检测到所述用户对所述终端设备中语音功能键的启动需求时的第一时间,以及记录检测到所述用户启动所述语音功能键时的第二时间;
所述识别模块具体用于:
根据所述第一时间和所述第二时间确定所述采集到的声音数据中的背景音片段;
在所述采集到的声音数据中剔除所述背景音片段,并对其余声音片段进行语音识别。
CN201610050038.9A 2016-01-25 2016-01-25 语音输入的控制方法和装置 Active CN105760084B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610050038.9A CN105760084B (zh) 2016-01-25 2016-01-25 语音输入的控制方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610050038.9A CN105760084B (zh) 2016-01-25 2016-01-25 语音输入的控制方法和装置

Publications (2)

Publication Number Publication Date
CN105760084A true CN105760084A (zh) 2016-07-13
CN105760084B CN105760084B (zh) 2019-01-25

Family

ID=56342496

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610050038.9A Active CN105760084B (zh) 2016-01-25 2016-01-25 语音输入的控制方法和装置

Country Status (1)

Country Link
CN (1) CN105760084B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106531168A (zh) * 2016-11-18 2017-03-22 北京云知声信息技术有限公司 一种语音识别方法及装置
CN106531167A (zh) * 2016-11-18 2017-03-22 北京云知声信息技术有限公司 一种语音信息的处理方法及装置
CN108931033A (zh) * 2018-08-01 2018-12-04 宁波奥克斯电气股份有限公司 一种线控器控制方法、装置及线控器
CN111899732A (zh) * 2020-06-17 2020-11-06 北京百度网讯科技有限公司 语音输入方法、装置及电子设备
CN112199033A (zh) * 2020-09-30 2021-01-08 北京搜狗科技发展有限公司 一种语音输入方法、装置和电子设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1917588A (zh) * 2005-08-17 2007-02-21 智辉研发股份有限公司 检测新闻主播的影音特征以将电视新闻分段
CN101345790A (zh) * 2007-07-09 2009-01-14 上海基信通讯技术有限公司 在手机上对音频文件进行编辑的方法
CN101739459A (zh) * 2009-12-21 2010-06-16 中兴通讯股份有限公司 一种移动终端的词库添加方法和移动终端
CN103294366A (zh) * 2012-02-27 2013-09-11 联想(北京)有限公司 一种屏幕解锁方法和电子设备
CN103577144A (zh) * 2012-07-23 2014-02-12 上海博泰悦臻电子设备制造有限公司 车载设备的语音输入方法及其语音输入系统
US20140244272A1 (en) * 2013-02-27 2014-08-28 Lenovo (Beijing) Limited Control method and electronic device

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1917588A (zh) * 2005-08-17 2007-02-21 智辉研发股份有限公司 检测新闻主播的影音特征以将电视新闻分段
CN101345790A (zh) * 2007-07-09 2009-01-14 上海基信通讯技术有限公司 在手机上对音频文件进行编辑的方法
CN101739459A (zh) * 2009-12-21 2010-06-16 中兴通讯股份有限公司 一种移动终端的词库添加方法和移动终端
CN103294366A (zh) * 2012-02-27 2013-09-11 联想(北京)有限公司 一种屏幕解锁方法和电子设备
CN103577144A (zh) * 2012-07-23 2014-02-12 上海博泰悦臻电子设备制造有限公司 车载设备的语音输入方法及其语音输入系统
US20140244272A1 (en) * 2013-02-27 2014-08-28 Lenovo (Beijing) Limited Control method and electronic device

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106531168A (zh) * 2016-11-18 2017-03-22 北京云知声信息技术有限公司 一种语音识别方法及装置
CN106531167A (zh) * 2016-11-18 2017-03-22 北京云知声信息技术有限公司 一种语音信息的处理方法及装置
CN106531167B (zh) * 2016-11-18 2019-12-10 北京云知声信息技术有限公司 一种语音信息的处理方法及装置
CN106531168B (zh) * 2016-11-18 2020-04-28 北京云知声信息技术有限公司 一种语音识别方法及装置
CN108931033A (zh) * 2018-08-01 2018-12-04 宁波奥克斯电气股份有限公司 一种线控器控制方法、装置及线控器
CN111899732A (zh) * 2020-06-17 2020-11-06 北京百度网讯科技有限公司 语音输入方法、装置及电子设备
CN112199033A (zh) * 2020-09-30 2021-01-08 北京搜狗科技发展有限公司 一种语音输入方法、装置和电子设备
CN112199033B (zh) * 2020-09-30 2023-06-20 北京搜狗科技发展有限公司 一种语音输入方法、装置和电子设备

Also Published As

Publication number Publication date
CN105760084B (zh) 2019-01-25

Similar Documents

Publication Publication Date Title
US11556241B2 (en) Apparatus and method of copying and pasting content in a computing device
CN105760084A (zh) 语音输入的控制方法和装置
EP2615607B1 (en) Method and apparatus for executing a user function using voice recognition
CN103123568B (zh) 输入精度的改进
US9898111B2 (en) Touch sensitive device and method of touch-based manipulation for contents
EP3693837A1 (en) Method and apparatus for processing multiple inputs
CN104679137A (zh) 电子设备,电子设备的外壳和电子设备中执行功能的方法
CN104049745A (zh) 输入控制方法和支持该输入控制方法的电子装置
CN108595646B (zh) 在线文档的评论方法和装置
CN103106024A (zh) 触摸屏终端中的文本输入方法及其装置
CN103098007A (zh) 用于在移动设备的屏幕上选择区域的方法和装置
CN107102759A (zh) 电子装置及其方法
JP2013229020A (ja) タッチ検出方法およびタッチ制御装置
US10739907B2 (en) Electronic apparatus and operating method of the same
US10606475B2 (en) Character recognition method, apparatus and device
CN103336687B (zh) 一种应用界面的切换方法及终端
CN105468282A (zh) 一种图标编辑的启动方法及终端设备
CN105446489B (zh) 语音双模控制方法、装置及用户终端
US10770077B2 (en) Electronic device and method
CN107797750A (zh) 一种屏幕内容识别处理方法、装置、终端和介质
CN106293426A (zh) 基于移动终端浏览器的截屏方法和装置
WO2015148000A1 (en) Handling-noise based gesture control for electronic devices
CN106228047A (zh) 一种应用程序图标处理方法及终端设备
CN105100875A (zh) 一种多媒体信息录制的控制方法及装置
CN106843559B (zh) 用户指令识别及处理方法、装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant