CN108922535A - 用于接收机的语音交互系统及交互方法 - Google Patents

用于接收机的语音交互系统及交互方法 Download PDF

Info

Publication number
CN108922535A
CN108922535A CN201810964190.7A CN201810964190A CN108922535A CN 108922535 A CN108922535 A CN 108922535A CN 201810964190 A CN201810964190 A CN 201810964190A CN 108922535 A CN108922535 A CN 108922535A
Authority
CN
China
Prior art keywords
voice
module
receiver
feature
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810964190.7A
Other languages
English (en)
Inventor
武维乐
梅松强
李早玲
曹雪美
张伦宁
彭德鑫
梁霄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI SHUANGWEI NAVIGATION TECHNOLOGY CO.,LTD.
Original Assignee
Shanghai Huace Navigation Technology Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Huace Navigation Technology Ltd filed Critical Shanghai Huace Navigation Technology Ltd
Priority to CN201810964190.7A priority Critical patent/CN108922535A/zh
Publication of CN108922535A publication Critical patent/CN108922535A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明提供了用于接收机的语音交互系统,包括语音识别模块、语音输入模块、扬声器和处理器,所述语音输入模块用于对语音的输入,所述语音识别模块用于对输入的语音进行识别,所述处理器用于对识别后的语音信息进行处理,通过扬声器对处理的信息进行语音输出,解决了接收机领域现有人机交互方式中使用体验不尽如人意的地方,提升接收机使用用户用户体验。在不需要手动干预的情况下,通过语音交互方式的方式进行接收机相关参数配置及输出定位及测量信息。

Description

用于接收机的语音交互系统及交互方法
技术领域
本发明涉及接收机领域,具体涉及到用于接收机的语音交互系统及交互方法。
背景技术
现阶段,在接收机领域人机交互方式的方式为:按键及液晶屏、网页及手薄等交互方式。上述的按键及液晶屏、网页及手薄的人机交互方式相对而言较为专业,需要一定的学习成本。同时按键及液晶屏显示的信息有限,网页及手薄的交互方式需要一定的外围设备及学习成本,需要一定的培训及学习。
发明内容
为了解决上述不足的缺陷,本发明提供了用于接收机的语音交互系统及交互方法,解决了接收机领域现有人机交互方式中使用体验不尽如人意的地方,提升接收机使用用户用户体验。在不需要手动干预的情况下,通过语音交互方式的方式进行接收机相关参数配置及输出定位及测量信息。在接收机领域使用语音交互实现技术及方案,跟进智能家居及消费类电子产品领域已经应用成熟的语音识别技术,提升接收机核心竞争力。
本发明提供了用于接收机的语音交互系统,包括语音识别模块、语音输入模块、扬声器和处理器,所述语音输入模块用于对语音的输入,所述语音识别模块用于对输入的语音进行识别,所述处理器用于对识别后的语音信息进行处理,通过扬声器对处理的信息进行语音输出。
上述的语音交互系统,其中,所述语音识别模块包括预处理模块、特征提取模块、学习训练模块、参考模型库和模式匹配模块,所述预处理模块用于对接收的语音进行预处理,所述特征提取模块用于对预处理的语音进行特征提取,所述学习训练模块用于对提取的特征进行学习并将结果存入到参考模型库,所述模式匹配模块用于将特征提取模块中的特征与参考模型库中的特征进行比对并将比对的结果进行输出。
上述的语音交互系统,其中,所述处理器接收所述比对的结果进行接收机相关参数配置、输出定位及测量信息。
上述的语音交互系统,其中,参考模型库为经过预处理和体征提取后得到特征参数,通过特征参数建模,进而建立训练语音的参考模型库。
上述的语音交互系统,其中,所述模式匹配模块为通过识别阶段将输入语音的特征矢量参数和参数模型库进行相似度量,然后把相似度最高的输入特征矢量作为结果输出。
本发明还提供了用于接收机的语音交互方法,包括以下步骤:
步骤(1):基于语音输入模块对语音进行输入;
步骤(2):基于语音识别模块对输入的语音进行识别;
步骤(3):通过处理器对识别后的语音信息进行处理,然后通过扬声器对处理的信息进行语音输出。
上述的语音交互方法,其中,所述步骤(2)具体包括:
步骤(2.1):基于预处理模块用于对接收的语音进行预处理;
步骤(2.2):基于特征提取模块对预处理的语音进行特征提取;
步骤(2.3):基于学习训练模块对提取的特征进行学习并将结果存入到参考模型库,以及通过模式匹配模块将特征提取模块中的特征与参考模型库中的特征进行比对并将比对的结果进行输出。
本发明具有以下有益效果:1、解决了接收机领域现有人机交互方式中使用体验不尽如人意的地方,提升接收机使用用户用户体验。在不需要手动干预的情况下,通过语音交互方式的方式进行接收机相关参数配置及输出定位及测量信息。2、在接收机领域使用语音交互实现技术及方案,跟进智能家居及消费类电子产品领域已经应用成熟的语音识别技术,提升接收机核心竞争力。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明及其特征、外形和优点将会变得更明显。在全部附图中相同的标记指示相同的部分。并未刻意按照比例绘制附图,重点在于示出本发明的主旨。
图1为本发明提供的模块框图。
图2为本发明提供的语音识别原理框图。
图3为本发明提供的语音识别流程图。
具体实施方式
在下文的描述中,给出了大量具体的细节以便提供对本发明更为彻底的理解。然而,对于本领域技术人员而言显而易见的是,本发明可以无需一个或多个这些细节而得以实施。在其他的例子中,为了避免与本发明发生混淆,对于本领域公知的一些技术特征未进行描述。
为了彻底理解本发明,将在下列的描述中提出详细的步骤以及详细的结构,以便阐释本发明的技术方案。本发明的较佳实施例详细描述如下,然而除了这些详细描述外,本发明还可以具有其他实施方式。
参照图1-图3所示,本发明提供用于接收机的语音交互系统,包括语音识别模块、语音输入模块、扬声器和处理器,其中语音输入模块用于对语音的输入,语音识别模块用于对输入的语音进行识别,处理器用于对识别后的语音信息进行处理,通过扬声器对处理的信息进行语音输出。在本发明中,根据语音识别芯片与处理器之间的接口,开发接口驱动;本发明用于接收机的语音交互软件设计及整体语音交互体验,可以提升接收机使用用户语音交互体验,解决了接收机领域现有人机交互方式中使用体验不尽如人意的地方,提升接收机使用用户用户体验。在不需要手动干预的情况下,通过语音交互方式的方式进行接收机相关参数配置及输出定位及测量信息。在接收机领域使用语音交互实现技术及方案,跟进智能家居及消费类电子产品领域已经应用成熟的语音识别技术,提升接收机核心竞争力。
本发明一优选而非限制的实施例中,参照图2所示,语音识别模块包括预处理模块、特征提取模块、学习训练模块、参考模型库和模式匹配模块,所述预处理模块用于对接收的语音进行预处理,所述特征提取模块用于对预处理的语音进行特征提取,所述学习训练模块用于对提取的特征进行学习并将结果存入到参考模型库,所述模式匹配模块用于将特征提取模块中的特征与参考模型库中的特征进行比对并将比对的结果进行输出,也就是说语音识别训练及学习训练,通过软件开发人员及用户输入接收机相关的训练语音,经过预处理和体征提取后得到特征参数,最后通过特征参数建模,进而建立训练语音的参考模型库。而识别阶段是将输入语音的特征矢量参数和参数模型库进行相似度量,然后把相似度最高的输入特征矢量作为结果输出,从而达到语音识别的目的。本发明使用最新智能家居及消费类电子产品领域应用成熟的语音识别方案及实现方式,能够在接收机领域跟进最新的语音识别技术,能够有效提升接收机核心竞争力及扩大市场使用范围,以及接收机使用语音识别技术能够有效提高接收机用户使用体验。
本发明一优选而非限制的实施例中,处理器接收所述比对的结果进行接收机相关参数配置、输出定位及测量信息,在不需要手动干预的情况下,通过语音交互方式的方式进行接收机相关参数配置及输出定位及测量信息。
本发明一优选而非限制的实施例中,参考模型库为经过预处理和体征提取后得到特征参数,通过特征参数建模,进而建立训练语音的参考模型库。
本发明一优选而非限制的实施例中,模式匹配模块为通过识别阶段将输入语音的特征矢量参数和参数模型库进行相似度量,然后把相似度最高的输入特征矢量作为结果输出。
本发明的另一面,用于接收机的语音交互方法,包括以下步骤:
步骤(1):基于语音输入模块对语音进行输入;
步骤(2):基于语音识别模块对输入的语音进行识别,其中具体包括步骤(2.1):基于预处理模块用于对接收的语音进行预处理;
步骤(2.2):基于特征提取模块对预处理的语音进行特征提取;
步骤(2.3):基于学习训练模块对提取的特征进行学习并将结果存入到参考模型库,以及通过模式匹配模块将特征提取模块中的特征与参考模型库中的特征进行比对并将比对的结果进行输出;
步骤(3):通过处理器对识别后的语音信息进行处理,然后通过扬声器对处理的信息进行语音输出。
以上对本发明的较佳实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,其中未尽详细描述的设备和结构应该理解为用本领域中的普通方式予以实施;任何熟悉本领域的技术人员,在不脱离本发明技术方案范围情况下,都可利用上述揭示的方法和技术内容对本发明技术方案做出许多可能的变动和修饰,或修改为等同变化的等效实施例,这并不影响本发明的实质内容。因此,凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所做的任何简单修改、等同变化及修饰,均仍属于本发明技术方案保护的范围内。

Claims (7)

1.用于接收机的语音交互系统,其特征在于,包括语音识别模块、语音输入模块、扬声器和处理器,所述语音输入模块用于对语音的输入,所述语音识别模块用于对输入的语音进行识别,所述处理器用于对识别后的语音信息进行处理,通过扬声器对处理的信息进行语音输出。
2.如权利要求1所述的用于接收机的语音交互系统,其特征在于,所述语音识别模块包括预处理模块、特征提取模块、学习训练模块、参考模型库和模式匹配模块,所述预处理模块用于对接收的语音进行预处理,所述特征提取模块用于对预处理的语音进行特征提取,所述学习训练模块用于对提取的特征进行学习并将结果存入到参考模型库,所述模式匹配模块用于将特征提取模块中的特征与参考模型库中的特征进行比对并将比对的结果进行输出。
3.如权利要求2所述的用于接收机的语音交互系统,其特征在于,所述处理器接收所述比对的结果进行接收机相关参数配置、输出定位及测量信息。
4.如权利要求3所述的用于接收机的语音交互系统,其特征在于,参考模型库为经过预处理和体征提取后得到特征参数,通过特征参数建模,进而建立训练语音的参考模型库。
5.如权利要求4所述的用于接收机的语音交互系统,其特征在于,所述模式匹配模块为通过识别阶段将输入语音的特征矢量参数和参数模型库进行相似度量,然后把相似度最高的输入特征矢量作为结果输出。
6.用于接收机的语音交互方法,其特征在于,包括以下步骤:
步骤(1):基于语音输入模块对语音进行输入;
步骤(2):基于语音识别模块对输入的语音进行识别;
步骤(3):通过处理器对识别后的语音信息进行处理,然后通过扬声器对处理的信息进行语音输出。
7.如权利要求6所述的用于接收机的语音交互方法,其特征在于,所述步骤(2)具体包括:
步骤(2.1):基于预处理模块用于对接收的语音进行预处理;
步骤(2.2):基于特征提取模块对预处理的语音进行特征提取;
步骤(2.3):基于学习训练模块对提取的特征进行学习并将结果存入到参考模型库,以及通过模式匹配模块将特征提取模块中的特征与参考模型库中的特征进行比对并将比对的结果进行输出。
CN201810964190.7A 2018-08-23 2018-08-23 用于接收机的语音交互系统及交互方法 Pending CN108922535A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810964190.7A CN108922535A (zh) 2018-08-23 2018-08-23 用于接收机的语音交互系统及交互方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810964190.7A CN108922535A (zh) 2018-08-23 2018-08-23 用于接收机的语音交互系统及交互方法

Publications (1)

Publication Number Publication Date
CN108922535A true CN108922535A (zh) 2018-11-30

Family

ID=64406464

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810964190.7A Pending CN108922535A (zh) 2018-08-23 2018-08-23 用于接收机的语音交互系统及交互方法

Country Status (1)

Country Link
CN (1) CN108922535A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117219046A (zh) * 2023-10-24 2023-12-12 广东广信通信服务有限公司 一种交互语音情感控制方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101059561A (zh) * 2006-04-17 2007-10-24 陈修志 声控全球定位系统用户终端
CN102543073A (zh) * 2010-12-10 2012-07-04 上海上大海润信息系统有限公司 一种沪语语音识别信息处理方法
CN102768780A (zh) * 2012-06-29 2012-11-07 深圳光启创新技术有限公司 基于语音控制的光子门禁系统
CN204334637U (zh) * 2015-01-19 2015-05-13 惠州市顺天电子科技有限公司 一种自动应答天气播报系统
CN104952446A (zh) * 2014-03-28 2015-09-30 苏州美谷视典软件科技有限公司 基于语音交互的数字楼盘展示系统
CN105223965A (zh) * 2015-11-05 2016-01-06 北京精航科技有限公司 无人机声控系统
CN106448654A (zh) * 2016-09-30 2017-02-22 安徽省云逸智能科技有限公司 一种机器人语音识别系统及其工作方法
CN108198545A (zh) * 2017-12-19 2018-06-22 安徽建筑大学 一种基于小波变换的语音识别方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101059561A (zh) * 2006-04-17 2007-10-24 陈修志 声控全球定位系统用户终端
CN102543073A (zh) * 2010-12-10 2012-07-04 上海上大海润信息系统有限公司 一种沪语语音识别信息处理方法
CN102768780A (zh) * 2012-06-29 2012-11-07 深圳光启创新技术有限公司 基于语音控制的光子门禁系统
CN104952446A (zh) * 2014-03-28 2015-09-30 苏州美谷视典软件科技有限公司 基于语音交互的数字楼盘展示系统
CN204334637U (zh) * 2015-01-19 2015-05-13 惠州市顺天电子科技有限公司 一种自动应答天气播报系统
CN105223965A (zh) * 2015-11-05 2016-01-06 北京精航科技有限公司 无人机声控系统
CN106448654A (zh) * 2016-09-30 2017-02-22 安徽省云逸智能科技有限公司 一种机器人语音识别系统及其工作方法
CN108198545A (zh) * 2017-12-19 2018-06-22 安徽建筑大学 一种基于小波变换的语音识别方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117219046A (zh) * 2023-10-24 2023-12-12 广东广信通信服务有限公司 一种交互语音情感控制方法及系统

Similar Documents

Publication Publication Date Title
CN107492379B (zh) 一种声纹创建与注册方法及装置
CN110096570A (zh) 一种应用于智能客服机器人的意图识别方法及装置
CN107463331A (zh) 手势轨迹模拟方法、装置及电子设备
CN111552833A (zh) 智能双录方法、装置及存储介质
CN110148399A (zh) 一种智能设备的控制方法、装置、设备及介质
CN107103903A (zh) 基于人工智能的声学模型训练方法、装置及存储介质
CN109887525A (zh) 智能客服方法、装置及计算机可读存储介质
CN107591155A (zh) 语音识别方法及装置、终端及计算机可读存储介质
CN110148400A (zh) 发音类型的识别方法、模型的训练方法、装置及设备
CN110457677B (zh) 实体关系识别方法及装置、存储介质、计算机设备
CN109194689B (zh) 异常行为识别方法、装置、服务器及存储介质
CN107301170A (zh) 基于人工智能的切分语句的方法和装置
CN107452369A (zh) 语音合成模型生成方法和装置
CN106921749A (zh) 用于推送信息的方法和装置
CN112233698A (zh) 人物情绪识别方法、装置、终端设备及存储介质
WO2022174605A1 (zh) 一种手势识别方法、手势识别装置及智能设备
CN109034069A (zh) 用于生成信息的方法和装置
CN109326162A (zh) 一种口语练习自动评测方法及装置
CN112397057B (zh) 基于生成对抗网络的语音处理方法、装置、设备及介质
CN108509416A (zh) 句意识别方法及装置、设备和存储介质
CN107526724A (zh) 用于标注语料的方法及装置
CN110222331A (zh) 谎言识别方法及装置、存储介质、计算机设备
CN109545226A (zh) 一种语音识别方法、设备及计算机可读存储介质
CN112036304A (zh) 医疗票据版面识别的方法、装置及计算机设备
CN108922535A (zh) 用于接收机的语音交互系统及交互方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20220315

Address after: 201702 room 104, building 1, No. 599, Gaojing Road, Xujing Town, Qingpu District, Shanghai

Applicant after: SHANGHAI SHUANGWEI NAVIGATION TECHNOLOGY CO.,LTD.

Address before: 201702 Block C, 599 Gaojing Road, Xujing Town, Qingpu District, Shanghai

Applicant before: SHANGHAI HUACE NAVIGATION TECHNOLOGY Ltd.

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20181130