CN102255905A - 三网融合智能装置 - Google Patents
三网融合智能装置 Download PDFInfo
- Publication number
- CN102255905A CN102255905A CN2011101909696A CN201110190969A CN102255905A CN 102255905 A CN102255905 A CN 102255905A CN 2011101909696 A CN2011101909696 A CN 2011101909696A CN 201110190969 A CN201110190969 A CN 201110190969A CN 102255905 A CN102255905 A CN 102255905A
- Authority
- CN
- China
- Prior art keywords
- circuit
- voice
- processing circuit
- speech
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Telephonic Communication Services (AREA)
Abstract
本发明公开了一种三网融合智能装置,包括电视网数据处理电路、互联网数据处理电路、电信网数据处理电路、中央处理电路和信号输出电路,所述中央处理电路电性连接所述信号输出电路,其还包括:语音接收电路,用于收集用户的语音数据;语音识别电路,用于对所述语音数据进行语音识别以产生语音识别结果并将所述语音识别结果发送给所述中央处理电路;所述中央处理电路电性连接所述语音识别电路,所述语音识别电路电性连接所述语音接收电路。本发明的三网融合智能装置能让人们通过语音控制来实现上网、看电视、发信息等功能,为人们提供了更加便利的服务和更加智能的体验。
Description
技术领域
本发明涉及三网融合装置,特别地涉及一种三网融合智能装置,包括电视网数据处理电路、互联网数据处理电路、电信网数据处理电路、中央处理电路和信号输出电路。
背景技术
三网融合中的三网是指互联网、电信网和电视网。三网融合与人们的生活密切相关,其将会极大地改善人们的生活。
为了适应人们日益增长的需求,需要智能的三网融合装置,例如,能让人们通过语音控制来实现上网、看电视、发信息等功能的三网融合装置,为人们提供更加便利的服务和更加智能的体验。
发明内容
本发明的目的是提供一种三网融合智能装置,其能让人们通过语音控制来实现上网、看电视、发信息等功能。
本发明解决上述技术问题所采用的技术方案是:构造一种三网融合智能装置,包括电视网数据处理电路、互联网数据处理电路、电信网数据处理电路、中央处理电路和信号输出电路,所述中央处理电路电性连接所述信号输出电路,其还包括:语音接收电路,用于收集用户的语音数据;语音识别电路,用于对所述语音数据进行语音识别以产生语音识别结果并将所述语音识别结果发送给所述中央处理电路;所述中央处理电路电性连接所述语音识别电路,所述语音识别电路电性连接所述语音接收电路。
在本发明所述的三网融合智能装置中,所述语音识别电路具体包括识别电路和语音数据库,所述识别电路电性连接所述语音接收电路和所述中央处理电路,所述语音数据库与所述识别电路电性连接。
上述三网融合智能装置中,所述语音数据库为第一语音数据库。
上述三网融合智能装置中,所述语音数据库包括第二语音数据库和第三语音数据库,所述第二语音数据库和第三语音数据库均与上述识别电路电性连接。
上述三网融合智能装置中,所述第二语音数据库存储了第二语音特征数据,所述第三语音数据库存储了第三语音特征数据。
上述三网融合智能装置中,所述第二语音特征数据包括第二杂音特征、第二口音特征、第二语速特征中的一种,所述第三语音特征数据包括第三杂音特征、第三口音特征、第三语速特征中的一种。
上述三网融合智能装置中,所述语音识别电路还包括加权平均电路,所述加权平均电路用于将所述第二语音识别结果和所述第三语音识别结果映射到数轴上,并对所述第二语音识别结果和所述第三语音识别结果在所述数轴上的映射值进行加权平均运算,以及对加权运算的结果进行反映射,得出加权平均语音识别结果,向所述中央处理电路输出所述加权平均语音识别结果。
上述三网融合智能装置中,所述映射和反映射对应的是将字符值映射为该字符预定义在数轴上的值的函数以及所述函数的反函数,所述函数的是通过将读音相近的字词与数轴上连续的数值建立映射来建立的。
在本发明所述的三网融合智能装置中,还包括:网络选择电路,用于根据所述语音识别结果从所述电视网数据处理电路、所述互联网数据处理电路和所述电信网数据处理电路中选择一个并为所选择的电路与所述中央处理电路建立通信连接,所述网络选择电路电性连接所述电视网数据处理电路、所述互联网数据处理电路、所述电信网数据处理电路和所述中央处理电路。
本发明的有益效果是能让人们通过语音控制来实现上网、看电视、发信息等功能,为人们提供了更加便利的服务和更加智能的体验。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1是本发明的三网融合智能装置的第一个实施例的框图;
图2是图1中语音识别电路的第一个实施例的框图;
图3是图1中语音识别电路的第二个实施例的框图;
图4是本发明的三网融合智能装置的第二个实施例的框图。
具体实施方式
参考图1,图1是本发明的三网融合智能装置的第一个实施例的框图。本发明的三网融合智能装置包括电视网数据处理电路101、互联网数据处理电路102、电信网数据处理电路103、中央处理电路105、信号输出电路104、语音识别电路106和语音接收电路107。电视网数据处理电路101、互联网数据处理电路102和电信网数据处理电路103分别接入到电视网、互联网和电信网中。中央处理电路105与信号输出电路104和语音识别电路106电性连接。语音接收电路107与语音识别电路106电性连接。语音接收电路107用于收集用户的语音数据,即接收用户的语音并生成语音数据或者接收其它设备通过有线或无线的方式发送的用户的语音数据。语音接收电路107将该语音数据发送给语音识别电路106。语音识别电路106用于对该语音数据进行识别以得出语音识别结果,并将该语音识别结果发送给中央处理电路。
参考图2,图2为图1中语音识别电路的第一个实施例的框图。语音识别电路106包括识别电路201和第一语音数据库202。第一语音数据库202与识别电路201电性连接,第一语音数据库202存储了第一语音特征数据。识别电路201电性连接语音接收电路107和中央处理电路105。识别电路201从语音接收电路107接收语音数据,提取该语音数据的语音特征,以及从第一语音数据库202中读取第一语音特征数据并将该第一语音特征数据和该语音数据的语音特征进行比对,生成第一语音识别结果,该第一语音识别结果由识别电路201发送给中央处理电路105。中央处理电路105根据该第一语音识别结果执行相应的程序。
参考图3,图3为图1中语音识别电路的第二个实施例的框图。语音识别电路106包括加权平均电路301、识别电路201、第二语音数据库302和第三语音数据库303。识别电路201与第二语音数据库302、第三语音数据库303和加权平均电路电性连接,此外,识别电路201还与语音接收电路107电性连接,加权平均电路301与中央处理电路105电性连接。第二语音数据库302和第三语音数据库303存储了不同类型的语音特征数据。例如,第二语音数据库302存储了从第二杂音环境中提取出的第二语音特征数据,该第二杂音环境的杂音分贝取值范围为0分贝-30分贝,该第二语音特征数据包含该第二杂音环境的第二杂音特征,第三语音数据库303存储了从第三杂音环境中提取出的第三语音特征数据,该第三杂音环境的杂音分贝取值范围为31分贝-60分贝,该第三语音特征数据包含该第三杂音环境的第三杂音特征。或者,第二语音数据库302存储了从具有第二口音的语音数据中提取出的第二语音特征数据,该第二语音特征数据包含第二口音特征,第三语音数据库303存储了从具有第三口音的语音数据中提取出的第三语音特征数据,该第三语音特征数据包含第三口音特征。或者,第二语音数据库302存储了从具有第二语速的语音数据中提取出的第二语音特征数据,该第二语音特征数据包含第二语速特征,第三语音数据库303存储了从具有第三语速的语音数据中提取出的第三语音特征数据,该第三语音特征数据包含第三语速特征。或者,第二语音数据库302存储了包含了第二杂音特征的第二语音特征数据,第三语音数据库303存储了包含第三口音的第三语音特征数据。或者,第二语音数据库302存储了包含了第二杂音特征的第二语音特征数据,第三语音数据库303存储了包含第三语速的第三语音特征数据。依此类推,即,第二语音特征数据包括第二杂音特征、第二口音特征、第二语速特征等中的一种,所述第三语音特征数据包括第三杂音特征、第三口音特征、第三语速特征等中的一种。识别电路201从语音接收电路107接收语音数据并提取该语音数据的语音特征,同时分别从第二语音数据库302和第三语音数据库303中分别读取第二语音特征数据和第三语音特征数据,将该语音数据的语音特征分别与第二语音特征数据和第三语音特征数据进行比对,得出两种语音识别结果,记为第二语音识别结果和第三语音识别结果。该第二语音识别结果和第三语音识别结果将被发送到加权平均电路中,加权平均电路将第二语音识别结果和第三语音识别结果映射到一个数轴上。加权平均电路301根据第二语音数据库302和第三语音特征数据库303中的第二语音特征数据和第三语音特征数据的类型预先存储第二权值和第三权值,该第二权值和第三权值分别是根据第二语音数据库302和第三语音数据库303识别结果的匹配度(准确率)来定义的。该第二语音识别结果和第三语音识别结果在数轴上的映射值将被加权平均电路301根据加权平均算法进行加权平均运算,得出运算结果,然后再进行反映射,得出加权平均语音识别结果,该加权平均语音识别结果将被发送到中央处理电路105中。上述映射和反映射对应的是将字符值映射为该字符预定义在数轴上的值的函数以及该函数的反函数。该函数的是通过将读音相近的字词与数轴上连续的数值建立一一对应关系这样一个方式来建立的,该反函数通过推导即可得出。中央处理电路105对该加权平均语音识别结果进行相应的处理。
经过测试,采用两个具有不同语音特征类型的语音数据库(第二语音数据库和第三语音数据库,第二语音数据库包含具有第二杂音特征的第二语音特征数据,第三语音数据库包含具有第三口音特征的第三语音特征数据)来进行语音识别并加权平均所得到的加权平均语音识别结果的匹配度(准确率)比只用一个语音数据库(第一语音数据库)进行语音识别所得到的语音识别结果的匹配度(准确率)提高9%-18%;采用三个具有不同语音特征类型的语音数据库(第二语音数据库、第三语音数据库和第四语音数据库(图中未示出),第二语音数据库包含具有第二杂音特征的第二语音特征数据,第三语音数据库包含具有第三口音特征的第三语音特征数据,第四语音数据库包含具有第四语速特征的第四语音特征数据)来进行语音识别并加权平均所得到的加权平均语音识别结果的匹配度(准确率)比只用一个语音数据库(第一语音数据库)进行语音识别所得到的语音识别结果的匹配度(准确率)提高15%-26%。当然,如果采用更多的具有不同语音特征类型的语音数据库,然后根据这些语音特征数据库中存储的语音特征数局进行语音识别,再对语音识别结果进行加权平均,那么语音识别效果会更加理想。
参考图4,图4为本发明的三网融合智能装置的第二个实施例的框图。本实施例是对本发明的三网融合智能装置的第一个实施例作出的一种优化。本实施例的三网融合智能装置还包括网络选择电路401,该网络选择电路401与电视网数据处理电路101、互联网数据处理电路102、电信网数据处理电路103以及中央处理电路105电性连接。网络选择电路401用于根据语音识别电路106的语音识别结果从电视网数据处理电路101、互联网数据处理电路102和电信网数据处理电路103中选择一个,并为所选择的电路和中央处理电路105建立通信连接。
以上描述了本发明的一些实施例,对本领域的普通技术人员来说,在不脱离本发明原理和精神的前提下,可以对本发明做出一些修改或变换,对本发明的一些修改或变换均落在本发明的保护范围之内。
Claims (9)
1.一种三网融合智能装置,包括电视网数据处理电路、互联网数据处理电路、电信网数据处理电路、中央处理电路和信号输出电路,所述中央处理电路电性连接所述信号输出电路,其特征在于,包括:
语音接收电路,用于收集用户的语音数据;
语音识别电路,用于对所述语音数据进行语音识别以产生语音识别结果并将所述语音识别结果发送给所述中央处理电路;
所述中央处理电路电性连接所述语音识别电路,所述语音识别电路电性连接所述语音接收电路。
2.根据权利要求1所述的三网融合智能装置,其特征在于,所述语音识别电路具体包括识别电路和语音数据库,所述识别电路电性连接所述语音接收电路和所述中央处理电路,所述语音数据库与所述识别电路电性连接。
3.根据权利要求2所述的三网融合智能装置,其特征在于,所述语音数据库为第一语音数据库。
4.根据权利要求2所述的三网融合智能装置,其特征在于,所述语音数据库包括第二语音数据库和第三语音数据库,所述第二语音数据库和第三语音数据库均与上述识别电路电性连接。
5.根据权利要求4所述的三网融合智能装置,其特征在于,所述第二语音数据库存储了第二语音特征数据,所述第三语音数据库存储了第三语音特征数据。
6.根据权利要求5所述的三网融合智能装置,其特征在于,所述第二语音特征数据包括第二杂音特征、第二口音特征、第二语速特征中的一种,所述第三语音特征数据包括第三杂音特征、第三口音特征、第三语速特征中的一种。
7.根据权利要求6所述的三网融合智能装置,其特征在于,所述语音识别电路还包括加权平均电路,所述加权平均电路用于将所述第二语音识别结果和所述第三语音识别结果映射到数轴上,并对所述第二语音识别结果和所述第三语音识别结果在所述数轴上的映射值进行加权平均运算,以及对加权运算的结果进行反映射,得出加权平均语音识别结果,向所述中央处理电路输出所述加权平均语音识别结果。
8.根据权利要求7所述的三网融合智能装置,其特征在于,所述映射和反映射对应的是将字符值映射为该字符预定义在数轴上的值的函数以及所述函数的反函数,所述函数的是通过将读音相近的字词与数轴上连续的数值建立映射来建立的。
9.根据权利要求1所述的三网融合智能装置,其特征在于,还包括:
网络选择电路,用于根据所述语音识别结果从所述电视网数据处理电路、所述互联网数据处理电路和所述电信网数据处理电路中选择一个并为所选择的电路与所述中央处理电路建立通信连接,所述网络选择电路电性连接所述电视网数据处理电路、所述互联网数据处理电路、所述电信网数据处理电路和所述中央处理电路。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110190969.6A CN102255905B (zh) | 2011-07-08 | 2011-07-08 | 三网融合智能装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110190969.6A CN102255905B (zh) | 2011-07-08 | 2011-07-08 | 三网融合智能装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102255905A true CN102255905A (zh) | 2011-11-23 |
CN102255905B CN102255905B (zh) | 2014-03-26 |
Family
ID=44982901
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110190969.6A Expired - Fee Related CN102255905B (zh) | 2011-07-08 | 2011-07-08 | 三网融合智能装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102255905B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101345819A (zh) * | 2008-08-19 | 2009-01-14 | 中山大学 | 一种用于机顶盒的语音控制系统 |
CN201509246U (zh) * | 2009-09-29 | 2010-06-16 | 惠州市九联科技有限公司 | 一种基于dvb的语音选台装置 |
CN101969526A (zh) * | 2010-10-22 | 2011-02-09 | 深圳市阿尔斯电信技术有限公司 | 三网融合电视机顶盒 |
CN102082973A (zh) * | 2010-12-31 | 2011-06-01 | 青岛海信宽带多媒体技术有限公司 | 一种网络电视语音留言实现方法及系统 |
-
2011
- 2011-07-08 CN CN201110190969.6A patent/CN102255905B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101345819A (zh) * | 2008-08-19 | 2009-01-14 | 中山大学 | 一种用于机顶盒的语音控制系统 |
CN201509246U (zh) * | 2009-09-29 | 2010-06-16 | 惠州市九联科技有限公司 | 一种基于dvb的语音选台装置 |
CN101969526A (zh) * | 2010-10-22 | 2011-02-09 | 深圳市阿尔斯电信技术有限公司 | 三网融合电视机顶盒 |
CN102082973A (zh) * | 2010-12-31 | 2011-06-01 | 青岛海信宽带多媒体技术有限公司 | 一种网络电视语音留言实现方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN102255905B (zh) | 2014-03-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111309883B (zh) | 基于人工智能的人机对话方法、模型训练方法及装置 | |
US11153430B2 (en) | Information presentation method and device | |
CN104980337B (zh) | 一种音频处理的性能提升方法及装置 | |
CN104714981B (zh) | 语音消息搜索方法、装置及系统 | |
US20120215539A1 (en) | Hybridized client-server speech recognition | |
CN102708865A (zh) | 语音识别方法、装置及系统 | |
CN111429895A (zh) | 多轮交互的语义理解方法、装置及计算机存储介质 | |
CN104766608A (zh) | 一种语音控制方法及装置 | |
CN104601538A (zh) | 服务器、发话控制方法、发话装置以及发话系统 | |
CN111629224B (zh) | 直播信息处理方法及装置、计算机存储介质、电子设备 | |
CN106205622A (zh) | 信息处理方法及电子设备 | |
CN107682752A (zh) | 视频画面显示的方法、装置、系统、终端设备及存储介质 | |
CN104883299A (zh) | 路由器配置方法、系统及路由器 | |
CN103546623A (zh) | 用于发送语音信息及其文本描述信息的方法、装置与设备 | |
CN114357278B (zh) | 一种话题推荐方法、装置及设备 | |
CN105045882B (zh) | 一种热词处理方法及装置 | |
CN106356056B (zh) | 语音识别方法和装置 | |
CN108538290A (zh) | 一种基于音频信号检测的智能家居控制方法 | |
CN112202974B (zh) | 自动判断电话接听状态的方法、装置以及系统 | |
CN102255905B (zh) | 三网融合智能装置 | |
CN103474063B (zh) | 语音辨识系统以及方法 | |
CN106856597A (zh) | 终端的提醒方法、装置及终端 | |
CN108182942A (zh) | 一种支持不同虚拟角色交互的方法和装置 | |
CN109791476A (zh) | 通信装置 | |
CN113901316A (zh) | 一种信息推送方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20140326 Termination date: 20180708 |