CN112735441A - 智能生态语音识别系统 - Google Patents

智能生态语音识别系统 Download PDF

Info

Publication number
CN112735441A
CN112735441A CN202011415696.6A CN202011415696A CN112735441A CN 112735441 A CN112735441 A CN 112735441A CN 202011415696 A CN202011415696 A CN 202011415696A CN 112735441 A CN112735441 A CN 112735441A
Authority
CN
China
Prior art keywords
word
unit
voice
recognition system
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011415696.6A
Other languages
English (en)
Inventor
白保成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Hozon New Energy Automobile Co Ltd
Original Assignee
Zhejiang Hozon New Energy Automobile Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Hozon New Energy Automobile Co Ltd filed Critical Zhejiang Hozon New Energy Automobile Co Ltd
Priority to CN202011415696.6A priority Critical patent/CN112735441A/zh
Publication of CN112735441A publication Critical patent/CN112735441A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • G10L17/24Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

智能生态语音识别系统,包括:创建单元,用于根据常规日常生活用语形成预存的唤醒词查找树;接收单元,用于接收语音字符串;分解单元,用于将相邻语音字符进行分解,并记录;唤醒单元,用于判断所述分解后的语音字符串是否存在预存的唤醒词;执行单元,根据唤醒词执行相对应的功能,并执行分解后剩余的语音字符所对应的功能或人物;与现有技术相比,通过预先设置唤醒词查找树,当接收到语音字符串时对语音字符串进行分解,并根据实际情况对车载模块进行唤醒和执行,且接收单元实时处于后台工作状态,及时待命,具有更好的用户体验,同时本申请的唤醒功能与执行功能同步工作,减少了语音识别指令工作的步骤。

Description

智能生态语音识别系统
技术领域
本发明属于语音识别技术领域,尤其是一种智能生态语音识别系统。
背景技术
语音识别是一门交叉学科。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来10年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。语音识别听写机在一些领域的应用被美国新闻界评为1997年计算机发展十件大事之一。很多专家都认为语音识别技术是2000年至2010年间信息技术领域十大重要的科技发展技术之一。语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。
在目前的新能源汽车中,语音识别功能在智能化交互方面的体验不太好,主要存在以下问题点:
1、命令词模糊识别程度太低,说法稍微不一样就不能识别;如语音输入“打开车窗”可以执行打开天窗的动作,但语音输入“请帮我打开天窗”就不能识别,智能化程度太低;
2、无法根据语境实现多次交互的场景,唤醒后执行一个命令后,必须输入唤醒词,才能继续执行下一个命令。
发明内容
本发明是为了克服上述现有技术中的缺陷,提供一种用户体验好,行驶安全,节约时间的智能生态语音识别系统。
为了达到以上目的,本发明所采用的技术方案是:智能生态语音识别系统,包括:
创建单元,用于根据常规日常生活用语形成预存的唤醒词查找树;
接收单元,用于接收语音字符串;
分解单元,用于将相邻语音字符进行分解,并记录;
唤醒单元,用于判断所述分解后的语音字符串是否存在预存的唤醒词;
执行单元,根据唤醒词执行相对应的功能,并执行分解后剩余的语音字符所对应的功能或人物;
提示单元,用于将所需执行的操作进行语音播放。
作为本发明的一种优选方案,所述唤醒词查找树包括一类单词查找树和至少一个二类单词查找树,一类单词查找树优先级大于二类单词查找树。
作为本发明的一种优选方案,所述一类单词查找树对应车载功能,二类单词查找树为储存的人物或地点或时间。
作为本发明的一种优选方案,所述唤醒词满足一类单词查找树时才传送至二类单词查找树中。
作为本发明的一种优选方案,所述分解单元在获取语音字符串后,创建至少一个语音字符词。
作为本发明的一种优选方案,所述分解单元包括选择模块和划分模块,选择模块用于选择最接近语音字符词作为最优语音字符词,划分模块用于最优语音字符词的划分顺序将语音字符串划分为至少一个语音字符词。
作为本发明的一种优选方案,所述划分后的至少一个语音字符词依次传送至唤醒单元上。
作为本发明的一种优选方案,所述接收单元还创建至少一个与语音字符串相对应的混淆音字符串。
作为本发明的一种优选方案,所述分解单元根据分解后的语音字符词创建至少一个与分解后的语音字符词相对应的混淆音字符串。
作为本发明的一种优选方案,所述接收单元与后台服务系统相连。
本发明的有益效果是,与现有技术相比:通过预先设置唤醒词查找树,当接收到语音字符串时对语音字符串进行分解,并根据实际情况对车载模块进行唤醒和执行,且接收单元实时处于后台工作状态,及时待命,具有更好的用户体验,同时本申请的唤醒功能与执行功能同步工作,减少了语音识别指令工作的步骤。
附图说明
图1是本发明的流程图。
具体实施方式
下面结合附图对本发明实施例作详细说明。
如图1所示,智能生态语音识别系统,包括:
创建单元,用于根据常规日常生活用语形成预存的唤醒词查找树;
接收单元,用于接收语音字符串;
分解单元,用于将相邻语音字符进行分解,并记录;
唤醒单元,用于判断所述分解后的语音字符串是否存在预存的唤醒词;
执行单元,根据唤醒词执行相对应的功能,并执行分解后剩余的语音字符所对应的功能或人物;
提示单元,用于将所需执行的操作进行语音播放。
创建单元通过预先设置的存储模块进行设置,唤醒词查找树根据日常生活用语可分为功能性单词、名词、人物名称、地点等,功能性单词和名词根据车载模块进行设置,一个车载模块对应至少一个功能性单词和名词。
创建单元形成一个数据库,且创建单元内包含有多个语音字符串,不同的语音字符串对应不同的车载模块,每个语音字符串至少对应连接一个车载模块,创建单元与接收单元、分解单元和唤醒单元电性连接,唤醒单元将分解后的语音字符串与创建单元所形成的数据库中的语音字符串对比,当具有一样的语音字符串时,激活语音字符串相对应的车载模块。
接收单元用于接收语音字符串,并将语音字符串转换成对应的文字字符串,且接收单元还创建至少一个与语音字符串相对应的混淆音字符串,混淆音字符串中根据拼音的变化量和常用语对不同的混淆音字符串优先级进行排序,拼音的变化量最少且常用语的为默认混淆音字符串,同时使用者也可手动或语音对混淆音字符串进行选择或操作。
执行单元对应所有的车载模块,执行单元将语音字符串传动之对应的车载模块,驱动对应的车载模块工作。
唤醒词查找树包括一类单词查找树和至少一个二类单词查找树,一类单词查找树优先级大于二类单词查找树,至少一个二类单词查找树并列设置,且二类单词查找树可根据不同种类划分为人物或地点或时间等类别。
一类单词查找树对应车载功能,二类单词查找树为储存的人物或地点或时间,唤醒词满足一类单词查找树时才传送至二类单词查找树中,当分解单元分解后的单词在一类单词查找树找不到对应项时,系统结束,当分解单元分解后的单词在一类单词查找树找得到对应项时,将分解后剩下的单词传送至二类单词查找树中进行查找。
分解单元在获取语音字符串后,创建至少一个语音字符词,分解单元包括选择模块和划分模块,选择模块用于选择最接近语音字符词作为最优语音字符词,划分模块用于最优语音字符词的划分顺序将语音字符串划分为至少一个语音字符词,划分后的至少一个语音字符词依次传送至唤醒单元上,
分解单元根据分解后的语音字符词创建至少一个与分解后的语音字符词相对应的混淆音字符串。
通过创建基于混淆音字符串,可以提高语音识别效率和丰富的语音识别结果,具体地,以汉语发音为例,当语音设备获取用户的语音指令为“zhang”,会生成“zhang”的全部混淆音字符串,例如“zang”、“zhan”和“zan”等,对“zang”、“zhan”和“zan”进行字符划分后,生成包括“zang”、“zhan”和“zan”的单词查找树,并将单词查找树的生成结果提示给用户,这种识别方式降低了对用户的发音准确度和语速的要求,提升了用户的使用体验。
接收单元与后台服务系统相连,接收单元始终处于后台工作状态。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现;因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.智能生态语音识别系统,其特征在于,包括:
创建单元,用于根据常规日常生活用语形成预存的唤醒词查找树;
接收单元,用于接收语音字符串;
分解单元,用于将相邻语音字符进行分解,并记录;
唤醒单元,用于判断所述分解后的语音字符串是否存在预存的唤醒词;
执行单元,根据唤醒词执行相对应的功能,并执行分解后剩余的语音字符所对应的功能或人物;
提示单元,用于将所需执行的操作进行语音播放。
2.根据权利要求1所述的智能生态语音识别系统,其特征在于,所述唤醒词查找树包括一类单词查找树和至少一个二类单词查找树,一类单词查找树优先级大于二类单词查找树。
3.根据权利要求2所述的智能生态语音识别系统,其特征在于,所述一类单词查找树对应车载功能,二类单词查找树为储存的人物或地点或时间。
4.根据权利要求2所述的智能生态语音识别系统,其特征在于,所述唤醒词满足一类单词查找树时才传送至二类单词查找树中。
5.根据权利要求1所述的智能生态语音识别系统,其特征在于,所述分解单元在获取语音字符串后,创建至少一个语音字符词。
6.根据权利要求5所述的智能生态语音识别系统,其特征在于,所述分解单元包括选择模块和划分模块,选择模块用于选择最接近语音字符词作为最优语音字符词,划分模块用于最优语音字符词的划分顺序将语音字符串划分为至少一个语音字符词。
7.根据权利要求6所述的智能生态语音识别系统,其特征在于,所述划分后的至少一个语音字符词依次传送至唤醒单元上。
8.根据权利要求1所述的智能生态语音识别系统,其特征在于,所述接收单元还创建至少一个与语音字符串相对应的混淆音字符串。
9.根据权利要求5所述的智能生态语音识别系统,其特征在于,所述分解单元根据分解后的语音字符词创建至少一个与分解后的语音字符词相对应的混淆音字符串。
10.根据权利要求1所述的智能生态语音识别系统,其特征在于,所述接收单元与后台服务系统相连。
CN202011415696.6A 2020-12-07 2020-12-07 智能生态语音识别系统 Pending CN112735441A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011415696.6A CN112735441A (zh) 2020-12-07 2020-12-07 智能生态语音识别系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011415696.6A CN112735441A (zh) 2020-12-07 2020-12-07 智能生态语音识别系统

Publications (1)

Publication Number Publication Date
CN112735441A true CN112735441A (zh) 2021-04-30

Family

ID=75598259

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011415696.6A Pending CN112735441A (zh) 2020-12-07 2020-12-07 智能生态语音识别系统

Country Status (1)

Country Link
CN (1) CN112735441A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104485107A (zh) * 2014-12-08 2015-04-01 畅捷通信息技术股份有限公司 名称的语音识别方法、语音识别系统和语音识别设备
CN104538030A (zh) * 2014-12-11 2015-04-22 科大讯飞股份有限公司 一种可以通过语音控制家电的控制系统与方法
CN105654943A (zh) * 2015-10-26 2016-06-08 乐视致新电子科技(天津)有限公司 一种语音唤醒方法、装置及系统
CN106847285A (zh) * 2017-03-31 2017-06-13 上海思依暄机器人科技股份有限公司 一种机器人及其语音识别方法
CN111798850A (zh) * 2020-08-05 2020-10-20 深圳市北科瑞声科技股份有限公司 用语音操作设备的方法和系统及服务器

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104485107A (zh) * 2014-12-08 2015-04-01 畅捷通信息技术股份有限公司 名称的语音识别方法、语音识别系统和语音识别设备
CN104538030A (zh) * 2014-12-11 2015-04-22 科大讯飞股份有限公司 一种可以通过语音控制家电的控制系统与方法
CN105654943A (zh) * 2015-10-26 2016-06-08 乐视致新电子科技(天津)有限公司 一种语音唤醒方法、装置及系统
CN106847285A (zh) * 2017-03-31 2017-06-13 上海思依暄机器人科技股份有限公司 一种机器人及其语音识别方法
CN111798850A (zh) * 2020-08-05 2020-10-20 深圳市北科瑞声科技股份有限公司 用语音操作设备的方法和系统及服务器

Similar Documents

Publication Publication Date Title
CN101069230B (zh) 预测通信系统中使用的文本信息的音调模式信息
US6463413B1 (en) Speech recognition training for small hardware devices
US8510103B2 (en) System and method for voice recognition
CN100403828C (zh) 一种便携式数字移动通讯设备及其语音控制方法和系统
US6839670B1 (en) Process for automatic control of one or more devices by voice commands or by real-time voice dialog and apparatus for carrying out this process
Gupta et al. The AT&T spoken language understanding system
US7620548B2 (en) Method and system for automatic detecting morphemes in a task classification system using lattices
US20020198715A1 (en) Artificial language generation
US20040230432A1 (en) Systems and methods for classifying audio into broad phoneme classes
JPH0394299A (ja) 音声認識方法と音声認識装置訓練方法
WO1994016434A1 (en) Recursive finite state grammar
CN1346486A (zh) 用于语音启动装置的讲话用户接口
KR20090000442A (ko) 범용 대화서비스 장치 및 그 방법
CN112131359A (zh) 一种基于图形化编排智能策略的意图识别方法及电子设备
US20210210073A1 (en) Artificial intelligence device for providing speech recognition function and method of operating artificial intelligence device
CN1901041A (zh) 语音字典形成方法、语音识别系统及其方法
US20020198712A1 (en) Artificial language generation and evaluation
CN112735441A (zh) 智能生态语音识别系统
US20040143436A1 (en) Apparatus and method of processing natural language speech data
CN115132195B (zh) 语音唤醒方法、装置、设备、存储介质及程序产品
CN107450499A (zh) 一种智能家居控制系统
CN112150103B (zh) 一种日程设置方法、装置和存储介质
US11227578B2 (en) Speech synthesizer using artificial intelligence, method of operating speech synthesizer and computer-readable recording medium
CN113992468A (zh) 一种智能家居语音控制方法
CN1828723B (zh) 分散式语言处理系统及其所使用的输出中介信息的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 314500 988 Tong Tong Road, Wu Tong Street, Tongxiang, Jiaxing, Zhejiang

Applicant after: Hezhong New Energy Vehicle Co.,Ltd.

Address before: 314500 988 Tong Tong Road, Wu Tong Street, Tongxiang, Jiaxing, Zhejiang

Applicant before: HOZON NEW ENERGY AUTOMOBILE Co.,Ltd.

Address after: 314500 988 Tong Tong Road, Wu Tong Street, Tongxiang, Jiaxing, Zhejiang

Applicant after: United New Energy Automobile Co.,Ltd.

Address before: 314500 988 Tong Tong Road, Wu Tong Street, Tongxiang, Jiaxing, Zhejiang

Applicant before: Hezhong New Energy Vehicle Co.,Ltd.

CB02 Change of applicant information
RJ01 Rejection of invention patent application after publication

Application publication date: 20210430

RJ01 Rejection of invention patent application after publication