CN117953875A - 一种基于语义理解的离线语音命令词存储方法 - Google Patents

一种基于语义理解的离线语音命令词存储方法 Download PDF

Info

Publication number
CN117953875A
CN117953875A CN202410355955.2A CN202410355955A CN117953875A CN 117953875 A CN117953875 A CN 117953875A CN 202410355955 A CN202410355955 A CN 202410355955A CN 117953875 A CN117953875 A CN 117953875A
Authority
CN
China
Prior art keywords
word
words
text
command
function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202410355955.2A
Other languages
English (en)
Other versions
CN117953875B (zh
Inventor
陈思应
何云鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chipintelli Technology Co Ltd
Original Assignee
Chipintelli Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chipintelli Technology Co Ltd filed Critical Chipintelli Technology Co Ltd
Priority to CN202410355955.2A priority Critical patent/CN117953875B/zh
Priority claimed from CN202410355955.2A external-priority patent/CN117953875B/zh
Publication of CN117953875A publication Critical patent/CN117953875A/zh
Application granted granted Critical
Publication of CN117953875B publication Critical patent/CN117953875B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Machine Translation (AREA)

Abstract

一种基于语义理解的离线语音命令词存储方法,属于语音识别技术领域,包括如下步骤。步骤1:对命令词库中的每一命令词,设置最小功能词文本和最小功能词对应的语义标签,标记命令词的类型;步骤2:对每一最小功能词文本,罗列全部功能泛化词;步骤3:对每一个最小功能词文本,利用步骤2定义的规则罗列出全部功能泛化词与该最小功能词文本对应存储,步骤4:语音设备识别出功能泛化词,执行最小功能词文本对应的语音命令。本发明所述提升基于语义理解的离线语音命令词存储方法,采用规则对命令词进行枚举,实现所有命令词对应唯一的文本,利用组合方式降低了命令词存储空间和对应文本的存储空间,从而降低了语音设备端侧的存储空间要求。

Description

一种基于语义理解的离线语音命令词存储方法
技术领域
本发明属于语音识别技术领域,具体涉及一种基于语义理解的离线语音命令词存储方法。
背景技术
基于语音识别设备本地离线命令词的语音识别,因受本地资源的限制,通常仅支持1000条以下命令词的识别,而在做语言模型时,语音的输入和文本的输出是一一对应的,如表1:
表1 现有技术命令词输入输出表
语义标签 输入 输出 命令词类型
1 智能管家 智能管家 唤醒词
2 打开风扇 打开风扇 命令词
2 开启风扇 开启风扇 命令词
3 关闭风扇 关闭风扇 命令词
3 关掉风扇 关掉风扇 命令词
随着识别算法的迭代更新,基于语义理解的离线识别模型可支持的词条更多,通常比离线命令词模型多出数量级,可以轻松识别数万或数十万的命令词,离线识别模型增加命令词识别的好处在于:对同一个语义的命令词,可以做更多的说法;如,“打开风扇”有如下多种说法:打开风扇、开启风扇、启动风扇、开下风扇、请打开风扇、请开启风扇、请启动风扇、请开下风扇、帮我打开风扇、帮我开启风扇、帮我启动风扇、帮我开下风扇等。但同时也引入了新的问题:可识别命令词的增加,对应命令词的输出也会增加,从而使内存的消耗增加,一定程度上又影响了命令词的持续增加。
发明内容
针对上述现有技术存在的缺陷,本发明公开了一种基于语义理解的离线语音命令词存储方法。
本发明所述基于语义理解的离线语音命令词存储方法,包括如下步骤:
步骤1:对命令词库中的每一命令词,设置最小功能词文本和最小功能词文本对应的语义标签,标记命令词的类型;命令词的类型包括唤醒词和常规命令词;
步骤2:对每一最小功能词文本,根据预设的罗列规则罗列全部功能泛化词,
功能泛化词,是表达形式与最小功能词文本可能不同,但含义完全相同的词;
每个功能泛化词,划分为一个或多个分词的组合形式;
罗列规则包括:
规则1:对唤醒词,设置唯一的与最小功能词文本完全相同的功能泛化词;
规则2:设置组合符号,表示一个完整的分词组合,组合符号内可定义有输出分词,以输出分词作为最小功能词的部分文本输出,一般选择第一个分词;
规则3:设置“或”符号,表示可替换词,在分词组合内部使用时表示相互可替换的分词;
规则4:设置前后缀符号,表示可忽略的分词;
步骤3:对每一个最小功能词文本,利用步骤2定义的规则罗列出全部功能泛化词与该最小功能词文本对应存储。
步骤4:语音设备在听到用户发出的语音命令时,识别出语音命令文本后,与功能泛化词比对,完全相同的则找到对应的最小功能词文本,执行该最小功能词文本对应的语音命令。
优选的,所述步骤1中,命令词的类型还包括负性词;
所述步骤2中,设置规则5:对于负性词,设置负性词定义符号。
优选的,所述步骤2中,设置规则6:设置特别定义符号,定义特殊功能泛化词。
优选的,所述设置组合符号为“[]”,“或”符号为“/”,前后缀符号为“<>”。
优选的,所述步骤3中,单独利用或符号罗列出功能泛化词。
本发明所述提升基于语义理解的离线语音命令词存储方法,采用规则对命令词进行枚举,根据不同的句型或局式对输出进行归一,实现所有命令词对应唯一的文本,利用组合方式降低了命令词存储空间和对应文本的存储空间,从而降低了语音设备端侧的存储空间要求。
附图说明
图1所示为本发明所述命令词存储方法的一个具体实施流程示意图;
图2所示为本发明所述命令词存储表的一个具体实施方式示意图。
具体实施方式
为更加直观清楚地描述本发明技术方案具体细节,下面将结合具体实施例和示例附图进行详细说明。
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明具体实施方式及相应的附图对本发明技术方案进行清楚、完整地阐述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
为了用较少的基础词汇枚举出更多的泛化命令词以及减少命令词的输出,通过规则制定,使用时需根据不同的句型或句式按规则进行枚举,本发明公开了一种基于语义理解的离线语音命令词存储方法,如图1所示,包括以下步骤:
步骤1:设置命令词库,对命令词库中的每个命令词,设置最小功能词文本和最小功能词对应的语义标签,标记命令词的类型;
其中最小功能词文本为表示同一含义的一类命令词对应的语音文本,该语音文本既表示了命令词具体的执行命令,通常也作为识别后语音设备的输出语音文本;语音标签为最小功能词唯一的序号,通常以数字表示;
命令词的类型通常包括唤醒词和常规命令词。
命令词类型也可以针对设备设置部分负性词,所谓负性词是针对某个语音设备其实没有意义,但容易被误识别的词,例如对一台语音风扇,可以设置“打开电视”、“看电影”为负性词,该负性词对语音风扇而言没有意义,但容易被误识别成“打开风扇”等命令词。
步骤2:对每一最小功能词文本,罗列全部功能泛化词,所谓功能泛化词,是表达形式与最小功能词文本可能不同,但含义完全相同的词,例如最小功能词为“打开风扇”,对应的功能泛化词可能包括“开机”、“开启风扇”、“启动电风扇”、“请帮我打开电扇”等。
每个功能泛化词,可以划分为一个或多个分词的组合形式,划分方法根据语音规则和语言习惯,例如可按照“动词+名词”的形式划分,或“动词+名词+动词”形式划分;
罗列规则包括:
规则1:对唤醒词,设置唯一的与最小功能词文本完全相同的功能泛化词;
唤醒词用于启动语音设备的语音功能,一般为拟人类称呼,不设置唤醒词,符合通常使用习惯。
规则2:设置组合符号,表示一个完整的分词组合,组合符号内可定义有输出分词,以输出分词作为最小功能词的部分文本输出,一般选择第一个分词;
规则3:设置“或”符号,表示可替换词,在分词组合内部使用时表示相互可替换的分词;
规则4:设置前后缀符号,表示可忽略的分词;
例如设置组合符号为“[]”,“或”符号为“/”,前后缀符号为“<>”;
采用上述符号形式后,对于用在语音风扇上的一个最小功能词文本“定时两小时”,一个典型的功能泛化词罗列形式为:
[定时][二小时/两小时][关闭/关机/关风扇/关电扇/关闭风扇/后关机/后关闭]
其中,第一个组合符号“[]”内只有一个分词“定时”,第二个组合符号"[]"内有两个以“或”符号“/”分隔开的分词“二小时”和“两小时”和一个“或”符号“/”,“二小时”和“两小时”二者含义完全相同并可以互相替换,第三个组合符号“[]”内有七个以六个“或”符号“/”分隔开的分词“关闭”、“关机”、“关风扇”、“关电扇”、“关闭风扇”、“后关机”、“后关闭”,这七个分词含义完全相同且可以互相替换,
通过上述符号形式,采用[定时][二小时/两小时][关闭/关机/关风扇/关电扇/关闭风扇/后关机/后关闭]的表达方式,实际囊括了“定时两小时”、“定时二小时关闭”、“定时两小时关风扇”等1*2*7=14种表达形式。
考虑部分用户表达增加前后缀后,上述功能泛化词罗列形式可变为:
<请/帮我/请帮我> [定时][二小时/两小时][关闭/关机/关风扇/关电扇/关闭风扇/后关机/后关闭] <吧/好吧>,即可以对应“请定时两小时吧”、“帮我定时两小时好吧”等额外的共计3*1*2*7*2=84种表达形式。
同时,考虑部分表达简洁的客户的功能泛化词罗列形式为:
[定时][二小时/两小时],即包括了“定时二小时”和“定时两小时”两种表达形式。
以上所有的功能泛化词形式,均对应同一个最小功能词文本即“定时两小时”。
对于存在负性词的情况下,设置规则5:对于负性词,设置负性词定义符号“#”,
例如对一个语音风扇的一个负性词类型的最小功能词文本“打开电视”,可采用下列形式对该负性词的最小功能词文本进行功能泛化词罗列:
<把/请把/帮我把>[电视/电视机][打开#/开启#/启动#/开下#];
在最后一个分词的后方,全部增加了负性词定义符号“#”,表示这种罗列形式对应的命令词全部为负性词;
对于负性词,语音识别的典型处理方式为正确的识别,识别出是定义的负性词后不执行命令并设置统一的语音回复如“命令错误”。
一个优选实施方式中,对于少数常用、简短或容易被误识别的功能泛化词,设置规则6;
规则6:设置特别定义符号,定义特殊功能泛化词;
由于命令词越短,越容易被误识别,因此在最小功能词文本中通常不使用这种表达形式,但许多用户习惯使用,需要将这些简短的功能泛化词额外标记以提高识别正确率,这些简短的功能泛化词通常只包括1个分词。
例如对于几乎所有语音设备都可以使用的命令词“开机”和“关机”,使用时非常容易造成误识别造成多个语音设备同时动作,对这类功能泛化词需要采用特殊识别方式以提高识别率并打开正确的语音设备,本发明不讨论如何识别这类命令词执行正确命令,而只是对这类易误识别的功能泛化词进行标记。
例如,可采用“!”作为特殊功能泛化词标记,语音设备识别出用户发出的功能泛化词后,发现该功能泛化词具有特殊功能泛化词标记,则采取对应的处理措施。
又一个具体实施方式中,对于部分最小功能词文本,其不同的功能泛化词不能归纳于类似之前的分词组合形式时,可以单独采用“或”符号;
例如对于最小功能词文本“调大音量”,对应的功能泛化词可采用以下罗列形式:大声点/大点声/调大音量/大声说话/把音量调大/帮我把音量调大;
其中“大声点”和“大点声”,虽然在中文语言表达习惯中含义完全相同,但难以采用组合符号的形式表达,同样,“大声点”和“把音量调大”也是类似,难以归类成分词组合形式,此时只有单独采用或符号逐个罗列表达。
步骤3:对每一个最小功能词文本,利用步骤2定义的规则罗列出全部功能泛化词与该最小功能词文本对应存储;
以表格形式对各个最小功能词,功能泛化词和,语义标签和命令词类型表现的一个具体形式如图2所示的命令词存储表。
步骤4:语音设备在听到用户发出的语音命令时,识别出语音命令文本后,与功能泛化词比对,完全相同的则找到对应的最小功能词文本,执行该最小功能词文本对应的语音命令,例如用户发出语音命令:请打开电风扇。根据如图2所示的命令词存储表,该功能泛化词对应的最小功能词文本为“打开风扇”,则执行对应的语音命令,并可以播报语音“打开风扇”或识别出的功能泛化词“请打开电风扇”。
本发明所述基于语义理解的离线语音命令词存储方法,采用规则对命令词进行枚举,根据不同的句型或局式对输出进行归一,实现所有命令词对应唯一的文本,利用组合方式降低了命令词存储空间和对应文本的存储空间,从而降低了语音设备端侧的存储空间要求。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
前文所述的为本发明的各个优选实施例,各个优选实施例中的优选实施方式如果不是明显自相矛盾或以某一优选实施方式为前提,各个优选实施方式都可以任意叠加组合使用,所述实施例以及实施例中的具体参数仅是为了清楚表述发明人的发明验证过程,并非用以限制本发明的专利保护范围,本发明的专利保护范围仍然以其权利要求书为准,凡是运用本发明的说明书及附图内容所作的等同结构变化,同理均应包含在本发明的保护范围内。

Claims (5)

1.一种基于语义理解的离线语音命令词存储方法,其特征在于,包括如下步骤:
步骤1:对命令词库中的每一命令词,设置最小功能词文本和最小功能词文本对应的语义标签,标记命令词的类型;命令词的类型包括唤醒词和常规命令词;
步骤2:对每一最小功能词文本,根据预设的罗列规则罗列全部功能泛化词,
功能泛化词,是表达形式与最小功能词文本可能不同,但含义完全相同的词;
每个功能泛化词,划分为一个或多个分词的组合形式;
罗列规则包括:
规则1:对唤醒词,设置唯一的与最小功能词文本完全相同的功能泛化词;
规则2:设置组合符号,表示一个完整的分词组合,组合符号内可定义有输出分词,以输出分词作为最小功能词的部分文本输出,一般选择第一个分词;
规则3:设置“或”符号,表示可替换词,在分词组合内部使用时表示相互可替换的分词;
规则4:设置前后缀符号,表示可忽略的分词;
步骤3:对每一个最小功能词文本,利用步骤2定义的规则罗列出全部功能泛化词与该最小功能词文本对应存储;
步骤4:语音设备在听到用户发出的语音命令时,识别出语音命令文本后,与功能泛化词比对,完全相同的则找到对应的最小功能词文本,执行该最小功能词文本对应的语音命令。
2.如权利要求1所述的离线语音命令词存储方法,其特征在于,所述步骤1中,命令词的类型还包括负性词;所述步骤2中,设置规则5:对于负性词,设置负性词定义符号。
3.如权利要求1所述的离线语音命令词存储方法,其特征在于,所述步骤2中,设置规则6:设置特别定义符号,定义特殊功能泛化词。
4.如权利要求1所述的离线语音命令词存储方法,其特征在于,所述设置组合符号为“[]”,“或”符号为“/”,前后缀符号为“<>”。
5.如权利要求4所述的离线语音命令词存储方法,其特征在于,所述步骤3中,单独利用或符号罗列出功能泛化词。
CN202410355955.2A 2024-03-27 一种基于语义理解的离线语音命令词存储方法 Active CN117953875B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410355955.2A CN117953875B (zh) 2024-03-27 一种基于语义理解的离线语音命令词存储方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410355955.2A CN117953875B (zh) 2024-03-27 一种基于语义理解的离线语音命令词存储方法

Publications (2)

Publication Number Publication Date
CN117953875A true CN117953875A (zh) 2024-04-30
CN117953875B CN117953875B (zh) 2024-06-28

Family

ID=

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0765006A (ja) * 1993-08-24 1995-03-10 Nippon Telegr & Teleph Corp <Ntt> 自然言語処理用語彙辞書記述方式
JP2007212660A (ja) * 2006-02-08 2007-08-23 Toyota Central Res & Dev Lab Inc 音声認識用辞書生成装置
US20080275694A1 (en) * 2007-05-04 2008-11-06 Expert System S.P.A. Method and system for automatically extracting relations between concepts included in text
WO2009152732A1 (zh) * 2008-06-19 2009-12-23 Xu Wenhe 一种供机器语言翻译的通用数码语义库
CN103823799A (zh) * 2012-11-16 2014-05-28 镇江诺尼基智能技术有限公司 新一代行业知识全文检索方法
CN103942347A (zh) * 2014-05-19 2014-07-23 焦点科技股份有限公司 一种基于多维度综合词库的分词方法
CN104317846A (zh) * 2014-10-13 2015-01-28 安徽华贞信息科技有限公司 一种语义分析与标注方法及系统
CN106055540A (zh) * 2016-06-01 2016-10-26 比美特医护在线(北京)科技有限公司 一种数据处理方法及装置
CN106156304A (zh) * 2016-07-01 2016-11-23 中国南方电网有限责任公司 一种用于电力系统的数据检索和排序方法
CN108595696A (zh) * 2018-05-09 2018-09-28 长沙学院 一种基于云平台的人机交互智能问答方法和系统
CN109935230A (zh) * 2019-04-01 2019-06-25 北京宇航系统工程研究所 一种基于语音驱动的测发口令监测系统和方法
CN110162780A (zh) * 2019-04-08 2019-08-23 深圳市金微蓝技术有限公司 用户意图的识别方法和装置
CN110276079A (zh) * 2019-06-27 2019-09-24 谷晓佳 一种词库建立方法、信息检索方法及对应的系统
CN111104803A (zh) * 2019-12-31 2020-05-05 科大讯飞股份有限公司 语义理解处理方法、装置、设备及可读存储介质

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0765006A (ja) * 1993-08-24 1995-03-10 Nippon Telegr & Teleph Corp <Ntt> 自然言語処理用語彙辞書記述方式
JP2007212660A (ja) * 2006-02-08 2007-08-23 Toyota Central Res & Dev Lab Inc 音声認識用辞書生成装置
US20080275694A1 (en) * 2007-05-04 2008-11-06 Expert System S.P.A. Method and system for automatically extracting relations between concepts included in text
WO2009152732A1 (zh) * 2008-06-19 2009-12-23 Xu Wenhe 一种供机器语言翻译的通用数码语义库
CN103823799A (zh) * 2012-11-16 2014-05-28 镇江诺尼基智能技术有限公司 新一代行业知识全文检索方法
CN103942347A (zh) * 2014-05-19 2014-07-23 焦点科技股份有限公司 一种基于多维度综合词库的分词方法
CN104317846A (zh) * 2014-10-13 2015-01-28 安徽华贞信息科技有限公司 一种语义分析与标注方法及系统
CN106055540A (zh) * 2016-06-01 2016-10-26 比美特医护在线(北京)科技有限公司 一种数据处理方法及装置
CN106156304A (zh) * 2016-07-01 2016-11-23 中国南方电网有限责任公司 一种用于电力系统的数据检索和排序方法
CN108595696A (zh) * 2018-05-09 2018-09-28 长沙学院 一种基于云平台的人机交互智能问答方法和系统
CN109935230A (zh) * 2019-04-01 2019-06-25 北京宇航系统工程研究所 一种基于语音驱动的测发口令监测系统和方法
CN110162780A (zh) * 2019-04-08 2019-08-23 深圳市金微蓝技术有限公司 用户意图的识别方法和装置
CN110276079A (zh) * 2019-06-27 2019-09-24 谷晓佳 一种词库建立方法、信息检索方法及对应的系统
CN111104803A (zh) * 2019-12-31 2020-05-05 科大讯飞股份有限公司 语义理解处理方法、装置、设备及可读存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JOHNSON, DR: "AUTOMATIC SPEECH SEMANTIC RECOGNITION AND VERIFICATION IN AIR TRAFFIC CONTROL", 《 2013 IEEE/AIAA 32ND DIGITAL AVIONICS SYSTEMS CONFERENCE》, 10 October 2013 (2013-10-10) *
刘改: "基于语用的智能语音空调命令词研究", 《中国优秀硕士学位论文全文数据库(哲学与人文科学)》, 15 April 2018 (2018-04-15) *

Similar Documents

Publication Publication Date Title
CN108847241B (zh) 将会议语音识别为文本的方法、电子设备及存储介质
CN107291783B (zh) 一种语义匹配方法及智能设备
CN102682763B (zh) 修正语音输入文本中命名实体词汇的方法、装置及终端
CN110110041A (zh) 错词纠正方法、装置、计算机装置及存储介质
CN111310470B (zh) 一种融合字词特征的中文命名实体识别方法
WO2021179701A1 (zh) 多语种语音识别方法、装置及电子设备
CN112016319B (zh) 预训练模型获取、疾病实体标注方法、装置及存储介质
CN112992125B (zh) 一种语音识别方法、装置、电子设备、可读存储介质
CN111143571B (zh) 实体标注模型的训练方法、实体标注方法以及装置
CN111192570A (zh) 语言模型训练方法、系统、移动终端及存储介质
JP6988924B2 (ja) 質問群抽出方法、質問群抽出装置および質問群抽出プログラム
CN111160026B (zh) 一种模型训练方法、装置、实现文本处理的方法及装置
CN110826301B (zh) 标点符号添加方法、系统、移动终端及存储介质
CN111916063A (zh) 基于bpe编码的序列化方法、训练方法、系统及存储介质
CN113935331A (zh) 异常语义截断检测方法、装置、设备及介质
CN117953875B (zh) 一种基于语义理解的离线语音命令词存储方法
CN117953875A (zh) 一种基于语义理解的离线语音命令词存储方法
CN111710328A (zh) 语音识别模型的训练样本选取方法、装置及介质
CN109002454B (zh) 一种确定目标单词的拼读分区的方法和电子设备
CN113553833B (zh) 文本纠错的方法、装置及电子设备
CN114330375A (zh) 一种基于固定范式的术语翻译方法及系统
CN109325225B (zh) 一种通用的基于关联的词性标注方法
CN113515586A (zh) 数据处理方法及装置
CN111859906A (zh) 一种商用对话系统中训练文本语料泛化的方法
CN114398876B (zh) 一种基于有限状态转换器的文本纠错方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant