CN103531201A - 终端语音命名唤醒方法和系统 - Google Patents

终端语音命名唤醒方法和系统 Download PDF

Info

Publication number
CN103531201A
CN103531201A CN201310455796.5A CN201310455796A CN103531201A CN 103531201 A CN103531201 A CN 103531201A CN 201310455796 A CN201310455796 A CN 201310455796A CN 103531201 A CN103531201 A CN 103531201A
Authority
CN
China
Prior art keywords
terminal
voice
name
acoustic characteristic
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310455796.5A
Other languages
English (en)
Other versions
CN103531201B (zh
Inventor
张毅军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI CLOUD VISION NETWORKS TECHNOLOGY Co Ltd
Original Assignee
SHANGHAI CLOUD VISION NETWORKS TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI CLOUD VISION NETWORKS TECHNOLOGY Co Ltd filed Critical SHANGHAI CLOUD VISION NETWORKS TECHNOLOGY Co Ltd
Priority to CN201310455796.5A priority Critical patent/CN103531201B/zh
Publication of CN103531201A publication Critical patent/CN103531201A/zh
Application granted granted Critical
Publication of CN103531201B publication Critical patent/CN103531201B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种终端语音命名唤醒方法和系统,使得语音操控模式更为方便和成熟,提升了用户体验。其技术方案为:在预处理过程中,采集用户对终端进行命名的语音数据,对语音数据进行语音识别,记录用户为终端进行命名的名称,同时提取并记录用户的声波特征;终端接收周围的语音数据,将语音数据进行语音识别和声波特征的提取,然后与预存的声波特征和对应的终端名称进行比对;若提取到的声波特征和预存的声波特征相同且识别出的文字和预存的该声波所对应的终端名称一致,则唤醒终端,以进入语音操控模式;终端在语音操控模式下根据用户的语音指令操控系统。

Description

终端语音命名唤醒方法和系统
技术领域
本发明涉及对终端进行语音操控的技术,尤其涉及通过语音就能使终端进入到语音操控模式的方法和系统。
背景技术
移动互联网技术和三网融合技术,使得业务及内容大爆发,这些业务和内容展现在最终用户手中后,用户的操控便利性是一个很大的难题。遥控器、鼠标、手指滑动、重力感应等操控手段层出不穷,但相对最自然的操控,还是语音控制。
目前,由于语音识别技术和语义分解技术的不断成熟,利用语音进行操控的方式在各种终端中也不断出现。在当前使用的语音操控技术中,都需要按一个语音录入键,或打开终端上的一个语音助手类的应用后,才能进行语音控制。且语音控制过程中,用户退出语音控制应用或者松开语音键后,才可停止控制,这些动作与自然语境中的行为习惯有一些差别。
发明内容
本发明的目的在于解决上述问题,提供了一种终端语音命名唤醒方法和系统,使得语音操控模式更为方便和成熟,提升了用户体验。
本发明的技术方案为:本发明揭示了一种终端语音命名唤醒方法,包括:
在预处理过程中,采集用户对终端进行命名的语音数据,对语音数据进行语音识别,记录用户为终端进行命名的名称,同时提取并记录用户的声波特征;
终端接收周围的语音数据,将语音数据进行语音识别和声波特征的提取,然后与预存的声波特征和对应的终端名称进行比对;
若提取到的声波特征和预存的声波特征相同且识别出的文字和预存的该声波所对应的终端名称一致,则唤醒终端,以进入语音操控模式;
终端在语音操控模式下根据用户的语音指令操控系统。
根据本发明的终端语音命名唤醒方法的一实施例,终端为多个用户提供终端命名。
根据本发明的终端语音命名唤醒方法的一实施例,在预处理过程中,终端接收用户对用户自身的称呼并记录在系统中。
根据本发明的终端语音命名唤醒方法的一实施例,在预处理过程中预存语音操控模式的退出指令,在语音操控模式下接收到对应的退出指令时结束语音操控模式。
本发明还揭示了一种终端语音命名唤醒系统,包括:
语音识别装置,对语音数据进行识别,并将其转换成文字;
声波特征提取装置,对语音数据进行声波波形特征的提取;
命名存储装置,连接语音识别装置和声波特征提取装置,保存用户对终端的命名及其对应的声波特征;
唤醒装置,接收周围的语音数据,将语音数据通过语音识别装置进行语音识别,通过声波特征提取装置进行声波特征的提取,然后与预存在命名存储装置中的声波特征和对应的终端名称进行比对,若提取到的声波特征和预存的声波特征相同且识别出的文字和预存的该声波所对应的终端名称一致,则唤醒终端以进入语音操控模式;
语音操控装置,连接唤醒装置,在终端的语音操控模式下,根据用户的语音指令操控系统。
根据本发明的终端语音命名唤醒系统的一实施例,系统还包括:
语音合成装置,通过机器合成的语音和用户进行互动。
根据本发明的终端语音命名唤醒系统的一实施例,命名存储装置分别保存多个用户的对终端的命名及其对应的声波特征。
根据本发明的终端语音命名唤醒系统的一实施例,命名存储装置还保存用户对其自身的称呼。
根据本发明的终端语音命名唤醒系统的一实施例,系统还包括:
模式退出装置,在语音操控模式下接收到对应的退出指令时结束语音操控模式。
本发明对比现有技术有如下的有益效果:本发明利用语音命名终端,终端可监听此名字,在名字符合的情况下唤醒主系统,并进行余下的其他操作。相对于传统的方案具有如下的优点:符合自然语境,用户按照最自然的方式去操控数码终端;将平时的语音和语音操控分开,平时数码终端不响应用户的语言,也不响应周围环境的语音;用户不需要点按特定的键,或者打开语音应用,即可使用语音操控,使用的舒适度增加;用户可在一定的范围内以非接触的方式控制,在紧急情况下,例如用户摔倒的情况下,也可打开终端,进行一些紧急处置。
附图说明
图1示出了本发明的终端语音命名唤醒方法的较佳实施例的流程图。
图2示出了本发明的终端语音命名唤醒系统的较佳实施例的结构图。
具体实施方式
下面结合附图和实施例对本发明作进一步的描述。
图1示出了本发明的终端语音命名唤醒方法的较佳实施例的流程,请参见图1,本实施例的方法的实施步骤详述如下。
步骤S10:在预处理过程中,采集用户对终端进行命名的语音数据,对语音数据进行语音识别,记录用户为终端进行命名的名称,同时提取并记录用户的声波特征。
终端可以为多个用户提供终端命名,亦即,可以存储多个用户对终端的命名及其对应的声波特征。
此外,终端也可以接收用户对其自身的称呼并存储在系统中。
举例来说,用户购置数码终端后,在设置菜单中选择“语音命名”选项。用户选择“语音命名”后,终端语音提示“请给终端命名”。用户用语音说出名字,比如“明明”,终端记录后,回播请用户确认。用户确认后,软件记录下命名者起的名字,并记录其命名的文字和声波特征,作为触发的关键因素。终端可询问终端如何称呼用户,比如“明明该如何称呼您?”,用户可说“张阿姨”,终端由此记住用户。终端可以记住多个用户的语音特征。
步骤S11:终端接收周围的语音数据,将语音数据进行语音识别和声波特征的提取,然后与预存的声波特征和对应的终端名称进行比对。
步骤S12:若提取到的声波特征和预存的声波特征相同且识别出的文字和预存的该声波所对应的终端名称一致,则唤醒终端,以进入语音操控模式。只有这些经过预处理过程的用户才可以唤醒终端,其他人即便以终端名字呼唤,终端可不响应。在正确识别之后,可以以语音方式再次确认,如“张阿姨,是叫明明打开电视,收看中央一台吗?”,在用户回答“是”或“确认”等肯定语句后实施控制。
步骤S13:终端在语音操控模式下根据用户的语音指令操控系统。
在语音操控模式下,当接收到用户发出的退出指令时结束语音操控模式,在退出模式后用户发出的语音操控指令将不被执行,而退出指令可以在预处理过程中被设置。
在终端的名字确认后,系统被唤醒,之后进入语音识别和操控状态,此状态下,默认的语音输入都是与操控相关,直至用户明显结束,如用户说:“明明,去休息吧”,软件在回答完“再见,张阿姨”,之后,退出语音操控模式。
上述的以终端名字为例的唤醒法只是一种语音唤醒模式,对其他的语音唤醒模式,如,点按特定的语音键,以及进入语音助手应用等方式进行唤醒,并不存在排斥过程,是可以共存的。
图2示出了本发明的终端语音命名唤醒系统的较佳实施例的结构。请参见图2,本实施例的终端语音命名唤醒系统包括:语音识别装置1、声波特征提取装置2、命名存储装置3、唤醒装置4、语音操控装置5、语音合成装置6、模式退出装置7。
语音识别装置1对语音数据进行识别,并将其转换成文字。声波特征提取装置2对语音数据进行声波波形特征的提取。命名存储装置3连接语音识别装置1和声波特征提取装置2,保存用户对终端的命名及其对应的声波特征。命名存储装置3分别保存多个用户的对终端的命名及其对应的声波特征。命名存储装置3还可以保存用户对其自身的称呼。
唤醒装置4接收周围的语音数据,将语音数据通过语音识别装1置进行语音识别,通过声波特征提取装置2进行声波特征的提取,然后与预存在命名存储装置3中的声波特征和对应的终端名称进行比对,若提取到的声波特征和预存的声波特征相同且识别出的文字和预存的该声波所对应的终端名称一致,则唤醒终端以进入语音操控模式。
语音操控装置5连接唤醒装置4,在终端的语音操控模式下,根据用户的语音指令操控系统。
语音合成装置6通过机器合成的语音和用户进行互动。
模式退出装置7在语音操控模式下接收到对应的退出指令时结束语音操控模式。
上述实施例是提供给本领域普通技术人员来实现和使用本发明的,本领域普通技术人员可在不脱离本发明的发明思想的情况下,对上述实施例做出种种修改或变化,因而本发明的保护范围并不被上述实施例所限,而应该是符合权利要求书所提到的创新性特征的最大范围。

Claims (9)

1.一种终端语音命名唤醒方法,包括:
在预处理过程中,采集用户对终端进行命名的语音数据,对语音数据进行语音识别,记录用户为终端进行命名的名称,同时提取并记录用户的声波特征;
终端接收周围的语音数据,将语音数据进行语音识别和声波特征的提取,然后与预存的声波特征和对应的终端名称进行比对;
若提取到的声波特征和预存的声波特征相同且识别出的文字和预存的该声波所对应的终端名称一致,则唤醒终端,以进入语音操控模式;
终端在语音操控模式下根据用户的语音指令操控系统。
2.根据权利要求1所述的终端语音命名唤醒方法,其特征在于,终端为多个用户提供终端命名。
3.根据权利要求1所述的终端语音命名唤醒方法,其特征在于,在预处理过程中,终端接收用户对用户自身的称呼并记录在系统中。
4.根据权利要求1所述的终端语音命名唤醒方法,其特征在于,在预处理过程中预存语音操控模式的退出指令,在语音操控模式下接收到对应的退出指令时结束语音操控模式。
5.一种终端语音命名唤醒系统,包括:
语音识别装置,对语音数据进行识别,并将其转换成文字;
声波特征提取装置,对语音数据进行声波波形特征的提取;
命名存储装置,连接语音识别装置和声波特征提取装置,保存用户对终端的命名及其对应的声波特征;
唤醒装置,接收周围的语音数据,将语音数据通过语音识别装置进行语音识别,通过声波特征提取装置进行声波特征的提取,然后与预存在命名存储装置中的声波特征和对应的终端名称进行比对,若提取到的声波特征和预存的声波特征相同且识别出的文字和预存的该声波所对应的终端名称一致,则唤醒终端以进入语音操控模式;
语音操控装置,连接唤醒装置,在终端的语音操控模式下,根据用户的语音指令操控系统。
6.根据权利要求5所述的终端语音命名唤醒系统,其特征在于,系统还包括:
语音合成装置,通过机器合成的语音和用户进行互动。
7.根据权利要求5所述的终端语音命名唤醒系统,其特征在于,命名存储装置分别保存多个用户的对终端的命名及其对应的声波特征。
8.根据权利要求5所述的终端语音命名唤醒系统,其特征在于,命名存储装置还保存用户对其自身的称呼。
9.根据权利要求5所述的终端语音命名唤醒系统,其特征在于,系统还包括:
模式退出装置,在语音操控模式下接收到对应的退出指令时结束语音操控模式。
CN201310455796.5A 2013-09-29 2013-09-29 终端语音命名唤醒方法和系统 Active CN103531201B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310455796.5A CN103531201B (zh) 2013-09-29 2013-09-29 终端语音命名唤醒方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310455796.5A CN103531201B (zh) 2013-09-29 2013-09-29 终端语音命名唤醒方法和系统

Publications (2)

Publication Number Publication Date
CN103531201A true CN103531201A (zh) 2014-01-22
CN103531201B CN103531201B (zh) 2016-04-06

Family

ID=49933154

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310455796.5A Active CN103531201B (zh) 2013-09-29 2013-09-29 终端语音命名唤醒方法和系统

Country Status (1)

Country Link
CN (1) CN103531201B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104253902A (zh) * 2014-07-21 2014-12-31 宋婉毓 与智能语音设备进行语音交互的方法
CN104656897A (zh) * 2015-02-11 2015-05-27 夏大庆 昵称唤醒技术
WO2015154412A1 (zh) * 2014-09-05 2015-10-15 中兴通讯股份有限公司 唤醒语音控制系统的方法、装置及终端
CN105280180A (zh) * 2014-06-11 2016-01-27 中兴通讯股份有限公司 一种终端控制方法、装置、语音控制装置及终端
CN105915988A (zh) * 2016-04-19 2016-08-31 乐视控股(北京)有限公司 进入特定电视桌面的电视机开启方法及其电视机
CN105957526A (zh) * 2016-04-29 2016-09-21 福建海媚数码科技有限公司 一种语音唤醒系统及唤醒方法
CN109376669A (zh) * 2018-10-30 2019-02-22 南昌努比亚技术有限公司 智能助手的控制方法、移动终端及计算机可读存储介质
CN110576434A (zh) * 2018-06-08 2019-12-17 香港商女娲创造股份有限公司 机器人唤醒系统和初始化系统及其方法
CN111240222A (zh) * 2020-01-23 2020-06-05 珠海荣邦电子科技有限公司 一种智能家居控制系统、方法及装置
CN112466304A (zh) * 2020-12-03 2021-03-09 北京百度网讯科技有限公司 离线语音交互方法、装置、系统、设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1346566A (zh) * 1999-02-08 2002-04-24 高通股份有限公司 用于电话手机的语音识别用户接口
CN1783782A (zh) * 2004-12-03 2006-06-07 微软公司 通过将说话者验证和反向调整测试相结合的用户认证
CN101772015A (zh) * 2008-12-29 2010-07-07 卢中江 移动终端语音密码开机的方法
CN103197571A (zh) * 2013-03-15 2013-07-10 张春鹏 一种控制方法及装置、系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1346566A (zh) * 1999-02-08 2002-04-24 高通股份有限公司 用于电话手机的语音识别用户接口
CN1783782A (zh) * 2004-12-03 2006-06-07 微软公司 通过将说话者验证和反向调整测试相结合的用户认证
CN101772015A (zh) * 2008-12-29 2010-07-07 卢中江 移动终端语音密码开机的方法
CN103197571A (zh) * 2013-03-15 2013-07-10 张春鹏 一种控制方法及装置、系统

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105280180A (zh) * 2014-06-11 2016-01-27 中兴通讯股份有限公司 一种终端控制方法、装置、语音控制装置及终端
CN104253902A (zh) * 2014-07-21 2014-12-31 宋婉毓 与智能语音设备进行语音交互的方法
WO2015154412A1 (zh) * 2014-09-05 2015-10-15 中兴通讯股份有限公司 唤醒语音控制系统的方法、装置及终端
CN104656897A (zh) * 2015-02-11 2015-05-27 夏大庆 昵称唤醒技术
CN105915988A (zh) * 2016-04-19 2016-08-31 乐视控股(北京)有限公司 进入特定电视桌面的电视机开启方法及其电视机
CN105957526A (zh) * 2016-04-29 2016-09-21 福建海媚数码科技有限公司 一种语音唤醒系统及唤醒方法
CN110576434A (zh) * 2018-06-08 2019-12-17 香港商女娲创造股份有限公司 机器人唤醒系统和初始化系统及其方法
CN109376669A (zh) * 2018-10-30 2019-02-22 南昌努比亚技术有限公司 智能助手的控制方法、移动终端及计算机可读存储介质
CN111240222A (zh) * 2020-01-23 2020-06-05 珠海荣邦电子科技有限公司 一种智能家居控制系统、方法及装置
CN112466304A (zh) * 2020-12-03 2021-03-09 北京百度网讯科技有限公司 离线语音交互方法、装置、系统、设备和存储介质
CN112466304B (zh) * 2020-12-03 2023-09-08 北京百度网讯科技有限公司 离线语音交互方法、装置、系统、设备和存储介质

Also Published As

Publication number Publication date
CN103531201B (zh) 2016-04-06

Similar Documents

Publication Publication Date Title
CN103531201A (zh) 终端语音命名唤醒方法和系统
CN107147618B (zh) 一种用户注册方法、装置及电子设备
CN107767863B (zh) 语音唤醒方法、系统及智能终端
CN102568478B (zh) 一种基于语音识别的视频播放控制方法和系统
CN109326289A (zh) 免唤醒语音交互方法、装置、设备及存储介质
CN106406867B (zh) 一种基于android系统的读屏方法及装置
CN103729193A (zh) 一种人机交互方法及装置
CN109246473B (zh) 基于声纹识别的个性化视频弹幕的语音交互方法及终端系统
CN105320726A (zh) 降低对手动开始/结束点和触发短语的需求
CN104144239B (zh) 一种语音辅助通讯方法和装置
CN107293300A (zh) 语音识别方法及装置、计算机装置及可读存储介质
CN111223490A (zh) 声纹唤醒方法及装置、设备、存储介质
US11062708B2 (en) Method and apparatus for dialoguing based on a mood of a user
CN106384591A (zh) 一种与语音助手应用交互的方法和装置
CN107506166A (zh) 信息提示方法及装置、计算机装置及可读存储介质
CN109979474B (zh) 语音设备及其用户语速修正方法、装置和存储介质
CN106055260B (zh) 一种安全键盘的读屏方法及装置
CN110503968A (zh) 一种音频处理方法、装置、设备及可读存储介质
CN109346057A (zh) 一种智能儿童玩具的语音处理系统
CN103491406A (zh) 一种基于语音识别的android智能电视系统
US20210225363A1 (en) Information processing device and information processing method
CN111081260A (zh) 一种唤醒词声纹的识别方法及系统
CN113033245A (zh) 一种功能调节方法、装置、存储介质及电子设备
CN112700767B (zh) 人机对话打断方法及装置
CN110660393B (zh) 语音交互方法、装置、设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C53 Correction of patent of invention or patent application
CB02 Change of applicant information

Address after: 201800 Shanghai city Jiading District town of Jiading Bole Road No. 70 building 2008 room 10

Applicant after: Shanghai Cloud Vision Networks Technology Co.,Ltd.

Address before: 201103, 9 building, Hechuan building, No. 2016, Xuhui District, Shanghai, Yishan Road

Applicant before: Cloud Vision Networks Technology Co.,Ltd.

COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 201103 XUHUI, SHANGHAI TO: 201800 JIADING, SHANGHAI

C14 Grant of patent or utility model
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Terminal voice naming wake-up method and system

Effective date of registration: 20231008

Granted publication date: 20160406

Pledgee: Industrial Bank Co.,Ltd. Shanghai Jinqiao Branch

Pledgor: Shanghai Cloud Vision Networks Technology Co.,Ltd.

Registration number: Y2023310000626

PE01 Entry into force of the registration of the contract for pledge of patent right