CN106875950A - 语音指令管理的方法及其系统 - Google Patents

语音指令管理的方法及其系统 Download PDF

Info

Publication number
CN106875950A
CN106875950A CN201611267507.9A CN201611267507A CN106875950A CN 106875950 A CN106875950 A CN 106875950A CN 201611267507 A CN201611267507 A CN 201611267507A CN 106875950 A CN106875950 A CN 106875950A
Authority
CN
China
Prior art keywords
phonetic order
module
phonetic
instruction
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611267507.9A
Other languages
English (en)
Inventor
徐伟智
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Tinno Wireless Technology Co Ltd
Original Assignee
Shenzhen Tinno Wireless Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Tinno Wireless Technology Co Ltd filed Critical Shenzhen Tinno Wireless Technology Co Ltd
Priority to CN201611267507.9A priority Critical patent/CN106875950A/zh
Publication of CN106875950A publication Critical patent/CN106875950A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/02Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/38Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
    • H04B1/3827Portable transceivers
    • H04B1/385Transceivers carried on the body, e.g. in helmets

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明是一种语音指令管理的方法及其系统,其特征在于,包括如下步骤:通过一语音接收模块接收一语音指令,通过一语音特征相似度判断模块,比对所述语音指令与一预输入语音样本的一特征参数是否相符;若相符,则通过一语音辨识模块,比对所述语音指令与一预输入指令样本,判断出对应所述语音指令的一目标指令;以及通过一指令执行模块执行对应所述语音指令的所述目标指令。

Description

语音指令管理的方法及其系统
技术领域
本发明是有关于一种语音控制的电子装置,更具体地描述是一种用以协助一用户透过自身穿戴的一语音接收模块,或是利用内建于所述电子装置上的所述语音接收模块,利用一语音频号指令的方式触发所述电子装置的功能。使所述用户运用所述电子装置进行操作时,能以所述语音频号指令的方式进行控制,不须再经由点击功能键,又或是以其它电子控制开关装置的方式。
背景技术
就现有技术而言,用户操作电子装置时往往是利用点击触控屏幕操作,上述操作情境用户皆须用手进行操作,然而在特定的应用状况下用户不方便用手来进行操控,强迫用户用手操控的状况下,用户体验不佳,,如此一来既不实用又降低用户体验,使得产品的实用性不高,进而降低产品竞争力。目前的解决方案,语音指令的输入是最方便的。若能以语音指令的输入取代繁琐的触控点选屏幕,并配合语音问答导引的操作方式,相信对不习惯使用手机输入界面的人会是一大福音。
目前语音识别技术已经非常成熟,商品化产品已陆续出现,可以应用在读写机、语音查询、声控家电...等等。也有应用在人与机器沟通的界面上。手机上也有类似的语音人机界面应用程序,但实际启动语音指令功能时,因其设定的辨识条件是声音的强度与持续长度到达一个门坎就启动辨识功能。如此一来,往往会因背景的语音杂音(如电视、收音机或旁人说话声...等)而产生误动作,从而令使用者感到困扰,因而放弃使用。
发明内容
针对现有技术中存在的上述弊端,本发明即是为解决此一问题,本发明于系统在接收到语音讯号时,先启动声纹辨识程序,声纹符合用户所预存的才启动语音指令辨识。这样可以达到减少误动作的机会。
本发明的目的及解决其技术问题是采用以下技术方案来实现的。
依据本发明提出的语音指令管理的方法,其特征在于,包括如下步骤:通过一语音接收模块接收一语音指令,通过一语音特征相似度判断模块,比对所述语音指令与一预输入语音样本的一特征参数是否相符;当判定所述语音指令与所述预输入语音样本的一特征参数相符时,则通过一语音辨识模块,比对所述语音指令与一预输入指令样本,判断出对应所述语音指令的一目标指令;以及通过一指令执行模块执行对应所述语音指令的所述目标指令。
在本发明的一实施例中,所述语音指令管理的方法,其特征在于,更包括:通过所述语音特征相似度判断模块,比对所述音指令与所述预输入语音样本的所述特征参数,发现结果为不相符;以及通过一提示模块,提示所述语音指令与所述预输入语音样本的所述特征参数不相符。
在本发明的一实施例中,所述语音指令管理的方法,其特征在于,更包括:通过所述语音辨识模块,比对所述语音指令与所述预输入指令样本,无法判断出对应所述语音指令的所述指令时;以及通过一语音助理模块,进行问答引导。
在本发明的一实施例中,所述语音指令管理的方法,其特征在于,更包括:通过无线传输的方式连接所述语音接收模块与所述语音特征相似度判断模块。
在本发明的一实施例中,所述语音指令管理的方法,其特征在于,更包括:利用一蓝牙耳麦、一智能型手表、一智能眼镜或一具有语音接收功能的穿戴型装置作为所述语音接收模块。
本发明的目的及解决其技术问题还可采用以下技术措施进一步实现。
依据本发明提出的语音指令管理的系统,其特征在于,一语音接收模块,用以接收一语音指令,一语音特征相似度判断模块,比对所述语音指令与一预输入语音样本的一特征参数是否相符,一语音辨识模块,比对所述语音指令与一预输入指令样本,判断出对应所述语音指令的一目标指令;以及一指令执行模块,执行对应所述语音指令的所述目标指令。
在本发明的一实施例中,所述语音指令管理的系统,其特征在于,所述语音特征相似度判断模块,比对所述音指令与所述预输入语音样本的所述特征参数,并发现结果为不相符时,通过一提示模块,提示所述语音指令与所述预输入语音样本的所述特征参数不相符。
在本发明的一实施例中,所述语音指令管理的系统,其特征在于,所述语音辨识模块,比对所述语音指令与所述预输入指令样本,无法判断出对应所述语音指令的所述指令时,通过一语音助理模块,进行问答引导。
在本发明的一实施例中,所述语音指令管理的系统,其特征在于,所述语音接收模块利用无线传输的方式与所述语音特征相似度判断模块连接。
在本发明的一实施例中,所述语音指令管理的系统,其特征在于,所述语音接收模块为一蓝牙耳麦、一智能型手表、一智能眼镜或一具有语音接收功能的穿戴型装置。
本发明在于系统在接收语音指令的同时,先行启动声纹辨识程序,以确认接收到之语音为用户本人的声纹,若是才续行语音指令辨识功能,并于辨识后执行命令,以达到减少误动作的机会,进一步提高语音指令辨识成功率。
附图说明
图1是本发明语音指令管理的系统架构示意图。
图2是本发明语音指令管理的方法流程示意图。
图3至7是本发明一实施例的语音指令管理的系统流程示意图。
具体实施方式
为更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的语音指令管理的控制方法及设备其具体实施方式、结构、特征及其功效,详细说明如后。
下面结合附图详细说明本发明的具体实施例。
请参照图1,是本发明的语音指令管理的系统架构示意图,在图1中,所述语音指令管理的系统1包括:
一语音接收模块110,用以接收一语音指令;
一语音特征相似度判断模块120,比对所述语音指令与一预输入语音样本的一特征参数是否相符;
一语音辨识模块130,比对所述语音指令与一预输入指令样本,判断出对应所述语音指令的一指令;以及
一指令执行模块140,执行对应所述语音指令的所述目标指令。
在本实施例中,更包括:所述语音特征相似度判断模块120,比对所述音指令与所述预输入语音样本的所述特征参数,并发现结果为不相符时,通过一提示模块,提示所述语音指令与所述预输入语音样本的所述特征参数不相符。
在本实施例中,更包括:所述语音辨识模块130,比对所述语音指令与所述预输入指令样本,无法判断出对应所述语音指令的所述指令时,通过一语音助理模块,进行问答引导。
在本实施例中,更包括:所述语音接收模块110,利用无线传输的方式与所述语音特征相似度判断模块120连接。
在本实施例中,更包括:所述语音接收模块110为一蓝牙耳麦、一智能型手表、一智能眼镜或一具有语音接收功能的穿戴型装置。
请参照图2,是本发明的语音指令管理的方法流程示意图。
步骤S210:通过一语音接收模块接收一语音指令。
步骤S220:通过一语音特征相似度判断模块,比对所述语音指令与一预输入语音样本的一特征参数是否相符。
步骤S230:当判定所述语音指令与所述预输入语音样本的一特征参数相符时,则通过一语音辨识模块,比对所述语音指令与一预输入指令样本,判断出对应所述语音指令的一目标指令。
在本实施例中所述语音辨识模块利用一语音识别达成判断出对应所述语音指令的一指令的功效
在本实施例中所述语音识别最主要的目的是计算机听懂人类说话的声音,进而命令计算机执行相对应的工作。当声音藉由模拟到数字的转换装置输入计算机内部,并以数值方式储存后,语音识别程序便开始已事先储存好的声音样本与输入的测试声音样本进行比对工作。比对完成后,就可以知道用户刚刚发出的声音代表何意,进而命令计算机做事。
在本实施例中采用的语音识别可有以下几种方式:
一、按照辨识字汇的多寡:少量字汇(数百字)、中量字汇(数千字)、大量字汇(数万字)。
二、按照使用对象:特定对象(Speaker Dependent)、不特定对象(SpeakerIndependent)。
三、按照使用方式:不连续语音识别、连续语音识别。
在本实施例中所述应用程序更包含大词汇量语音识别系统,所述大词汇量语音识别系统采用统计模式识别技术。
典型的基于统计模式识别方法的语音识别系统由以下几个基本模块所构成:
一、信号处理及特征提取模块
二、声学模型
三、发音词典
四、语言模型
五、译码器
所述信号处理及特征提取模块的主要任务是从输入信号中提取特征,供声学模型处理。同时,它一般也包括了一些信号处理技术,以尽可能降低环境噪声、说话人等因素对特征造成的影响。
所述声学模型采用基于一阶隐马尔科夫模型进行建模。
所述发音词典包含系统所能处理的词汇集及其发音。
所述发音词典实际提供了声学模型建模单元与语言模型建模单元间的映像。
所述语言模型对系统所针对的语言进行建模。理论上,包括正则语言,上下文无关文法在内的各种语言模型都可以作为语言模型,本发明利用是基于统计的N元文法及其变体。
所述译码器是语音识别系统的核心之一,其任务是对输入的信号,根据声学、语言模型及词典,寻找能够以最大机率输出该信号的词串。
步骤S240:通过一指令执行模块执行对应所述语音指令的所述目标指令。
图3至7是本发明一实施例的语音指令管理流程示意图。
在图3中,一用户发出『拨电话给爸爸』的语音指令301至手机302。
在图4中,所要表现的是,手机通过一语音接收模块接收一语音指令,通过一语音特征相似度判断模块,比对所述语音指令与一预输入语音样本的一特征参数是否相符;当判定所述语音指令301为本人发出时,则通过一语音辨识模块,比对所述语音指令与一预输入指令样本,判断出对应所述语音指令的一目标指令,通过一指令执行模块执行对应所述语音指令的所述目标指令,拨电话给爸爸。
在图5中,一用户发出『现在打电话回家』的语音指令501至手机502。
在图6中,手机通过一语音接收模块接收一语音指令;通过一语音特征相似度判断模块,比对所述语音指令与一预输入语音样本的一特征参数是否相符;当判定所述语音指令02为本人发出时,则通过一语音辨识模块,比对所述语音指令与一预输入指令样本,无法判断出对应所述语音指令的一指令,并显示无法完全辨识语音指令的讯息。
在图7中,利用语音指令中的关键词『打电话』与『家』作为组合,询问用户是否要打电话回家。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容作出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。

Claims (10)

1.一种语音指令管理的方法,其特征在于,包括如下步骤:
通过一语音接收模块接收一语音指令;
通过一语音特征相似度判断模块,比对所述语音指令与一预输入语音样本的一特征参数是否相符;
当判定所述语音指令与所述预输入语音样本的一特征参数相符时,则通过一语音辨识模块,比对所述语音指令与一预输入指令样本,判断出对应所述语音指令的一目标指令;以及
通过一指令执行模块执行对应所述语音指令的所述目标指令。
2.根据权利要求1所述语音指令管理的方法,其特征在于,更包括:
通过所述语音特征相似度判断模块,比对所述音指令与所述预输入语音样本的所述特征参数,发现结果为不相符;以及
通过一提示模块,提示所述语音指令与所述预输入语音样本的所述特征参数不相符。
3.根据权利要求1所述语音指令管理的方法,其特征在于,更包括:
通过所述语音辨识模块,比对所述语音指令与所述预输入指令样本,当无法判断出对应所述语音指令的所述目标指令时;以及
通过一语音助理模块,进行问答引导。
4.根据权利要求1所述语音指令管理的方法,其特征在于,更包括:
通过无线传输的方式连接所述语音接收模块与所述语音特征相似度判断模块。
5.根据权利要求1所述语音指令管理的方法,其特征在于,更包括:
利用一蓝牙耳麦、一智能型手表、一智能眼镜或一具有语音接收功能的穿戴型装置作为所述语音接收模块。
6.一种语音指令管理的系统,其特征在于,所述语音指令管理的系统包括:
一语音接收模块,用以接收一语音指令;
一语音特征相似度判断模块,比对所述语音指令与一预输入语音样本的一特征参数是否相符;
一语音辨识模块,比对所述语音指令与一预输入指令样本,判断出对应所述语音指令的一目标指令;以及
一指令执行模块,执行对应所述语音指令的所述目标指令。
7.根据权利要求6所述语音指令管理的系统,其特征在于,所述语音特征相似度判断模块,比对所述音指令与所述预输入语音样本的所述特征参数,并发现结果为不相符时,通过一提示模块,提示所述语音指令与所述预输入语音样本的所述特征参数不相符。
8.根据权利要求6所述语音指令管理的系统,其特征在于,所述语音辨识模块,比对所述语音指令与所述预输入指令样本,无法判断出对应所述语音指令的所述指令时,通过一语音助理模块,进行问答引导。
9.根据权利要求6所述语音指令管理的系统,其特征在于,所述语音接收模块利用无线传输的方式与所述语音特征相似度判断模块连接。
10.根据权利要求6所述语音指令管理的系统,其特征在于,所述语音接收模块为一蓝牙耳麦、一智能型手表、一智能眼镜或一具有语音接收功能的穿戴型装置。
CN201611267507.9A 2016-12-31 2016-12-31 语音指令管理的方法及其系统 Pending CN106875950A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611267507.9A CN106875950A (zh) 2016-12-31 2016-12-31 语音指令管理的方法及其系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611267507.9A CN106875950A (zh) 2016-12-31 2016-12-31 语音指令管理的方法及其系统

Publications (1)

Publication Number Publication Date
CN106875950A true CN106875950A (zh) 2017-06-20

Family

ID=59165457

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611267507.9A Pending CN106875950A (zh) 2016-12-31 2016-12-31 语音指令管理的方法及其系统

Country Status (1)

Country Link
CN (1) CN106875950A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110473540A (zh) * 2019-08-29 2019-11-19 京东方科技集团股份有限公司 语音交互方法及系统、终端设备、计算机设备及介质
CN110827647A (zh) * 2019-11-06 2020-02-21 上海国景模型设计有限公司 一种沙盘控制方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1641563A (zh) * 2004-01-09 2005-07-20 顺德市顺达电脑厂有限公司 电脑装置的语音快捷控制装置及方法
CN102063901A (zh) * 2010-12-02 2011-05-18 深圳市凯立德欣软件技术有限公司 位置服务设备的语音识别方法及位置服务设备
CN202818560U (zh) * 2012-09-29 2013-03-20 上海斐讯数据通信技术有限公司 蓝牙耳机、移动终端及语音控制系统
CN104992709A (zh) * 2015-06-25 2015-10-21 广州视源电子科技股份有限公司 一种语音指令的执行方法及语音识别设备
CN105895096A (zh) * 2016-03-30 2016-08-24 乐视控股(北京)有限公司 一种身份识别与语音交互操作的方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1641563A (zh) * 2004-01-09 2005-07-20 顺德市顺达电脑厂有限公司 电脑装置的语音快捷控制装置及方法
CN102063901A (zh) * 2010-12-02 2011-05-18 深圳市凯立德欣软件技术有限公司 位置服务设备的语音识别方法及位置服务设备
CN202818560U (zh) * 2012-09-29 2013-03-20 上海斐讯数据通信技术有限公司 蓝牙耳机、移动终端及语音控制系统
CN104992709A (zh) * 2015-06-25 2015-10-21 广州视源电子科技股份有限公司 一种语音指令的执行方法及语音识别设备
CN105895096A (zh) * 2016-03-30 2016-08-24 乐视控股(北京)有限公司 一种身份识别与语音交互操作的方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110473540A (zh) * 2019-08-29 2019-11-19 京东方科技集团股份有限公司 语音交互方法及系统、终端设备、计算机设备及介质
CN110827647A (zh) * 2019-11-06 2020-02-21 上海国景模型设计有限公司 一种沙盘控制方法及装置

Similar Documents

Publication Publication Date Title
CN101576901B (zh) 搜索请求的产生方法
CN107274897A (zh) 语音操控方法与移动终端装置
CN107919138B (zh) 一种语音中的情绪处理方法及移动终端
US20130297318A1 (en) Speech recognition systems and methods
US20020091522A1 (en) System and method for hybrid voice recognition
CN107613132A (zh) 语音接听方法与移动终端装置
CN107655154A (zh) 终端控制方法、空调器及计算机可读存储介质
CN103903613A (zh) 一种信息处理方法及电子设备
US8126715B2 (en) Facilitating multimodal interaction with grammar-based speech applications
CN110992955A (zh) 一种智能设备的语音操作方法、装置、设备及存储介质
CN104301522A (zh) 通讯中的信息输入方法及通讯终端
CN107204190A (zh) 误识别订正方法、误识别订正装置以及误识别订正程序
CN112562670A (zh) 语音智能识别方法、语音智能识别装置及智能设备
KR20050122604A (ko) 휴대단말기에서 음성인식구동 방법
CN106875950A (zh) 语音指令管理的方法及其系统
KR20210042520A (ko) 전자 장치 및 이의 제어 방법
US9730073B1 (en) Network credential provisioning using audible commands
CN110839169B (zh) 一种智能设备遥控装置及基于其的控制方法
CN111128127A (zh) 一种语音识别处理方法及装置
TW200945320A (en) Voice input system and voice input method
KR20170051994A (ko) 음성인식 디바이스 및 이의 동작 방법
AU5894499A (en) A method and a system for voice dialling
CN105426154A (zh) 一种语音输入控制的方法、装置及终端
CN108694939B (zh) 语音搜索优化方法、装置和系统
KR20050033248A (ko) 음성인식 기능을 가진 이동 통신 단말기, 및 이를 위한음소 모델링 방법 및 음성 인식 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170620

RJ01 Rejection of invention patent application after publication