CN102255905B

CN102255905B - 三网融合智能装置

Info

Publication number: CN102255905B
Application number: CN201110190969.6A
Authority: CN
Inventors: 童南方; 吴伟林; 何志军
Original assignee: WONHE TECHNOLOGY (SHENZHEN) Co Ltd
Current assignee: WONHE TECHNOLOGY (SHENZHEN) Co Ltd
Priority date: 2011-07-08
Filing date: 2011-07-08
Publication date: 2014-03-26
Anticipated expiration: 2031-07-08
Also published as: CN102255905A

Abstract

本发明公开了一种三网融合智能装置，包括电视网数据处理电路、互联网数据处理电路、电信网数据处理电路、中央处理电路和信号输出电路，所述中央处理电路电性连接所述信号输出电路，其还包括：语音接收电路，用于收集用户的语音数据；语音识别电路，用于对所述语音数据进行语音识别以产生语音识别结果并将所述语音识别结果发送给所述中央处理电路；所述中央处理电路电性连接所述语音识别电路，所述语音识别电路电性连接所述语音接收电路。本发明的三网融合智能装置能让人们通过语音控制来实现上网、看电视、发信息等功能，为人们提供了更加便利的服务和更加智能的体验。

Description

三网融合智能装置

技术领域

本发明涉及三网融合装置，特别地涉及一种三网融合智能装置，包括电视网数据处理电路、互联网数据处理电路、电信网数据处理电路、中央处理电路和信号输出电路。

背景技术

三网融合中的三网是指互联网、电信网和电视网。三网融合与人们的生活密切相关，其将会极大地改善人们的生活。

为了适应人们日益增长的需求，需要智能的三网融合装置，例如，能让人们通过语音控制来实现上网、看电视、发信息等功能的三网融合装置，为人们提供更加便利的服务和更加智能的体验。

发明内容

本发明的目的是提供一种三网融合智能装置，其能让人们通过语音控制来实现上网、看电视、发信息等功能。

本发明解决上述技术问题所采用的技术方案是：构造一种三网融合智能装置，包括电视网数据处理电路、互联网数据处理电路、电信网数据处理电路、中央处理电路和信号输出电路，所述中央处理电路电性连接所述信号输出电路，其还包括：语音接收电路，用于收集用户的语音数据；语音识别电路，用于对所述语音数据进行语音识别以产生语音识别结果并将所述语音识别结果发送给所述中央处理电路；所述中央处理电路电性连接所述语音识别电路，所述语音识别电路电性连接所述语音接收电路。

在本发明所述的三网融合智能装置中，所述语音识别电路具体包括识别电路和语音数据库，所述识别电路电性连接所述语音接收电路和所述中央处理电路，所述语音数据库与所述识别电路电性连接。

上述三网融合智能装置中，所述语音数据库为第一语音数据库。

上述三网融合智能装置中，所述语音数据库包括第二语音数据库和第三语音数据库，所述第二语音数据库和第三语音数据库均与上述识别电路电性连接。

上述三网融合智能装置中，所述第二语音数据库存储了第二语音特征数据，所述第三语音数据库存储了第三语音特征数据。

上述三网融合智能装置中，所述第二语音特征数据包括第二杂音特征、第二口音特征、第二语速特征中的一种，所述第三语音特征数据包括第三杂音特征、第三口音特征、第三语速特征中的一种。

上述三网融合智能装置中，所述语音识别电路还包括加权平均电路，所述加权平均电路用于将所述第二语音识别结果和所述第三语音识别结果映射到数轴上，并对所述第二语音识别结果和所述第三语音识别结果在所述数轴上的映射值进行加权平均运算，以及对加权运算的结果进行反映射，得出加权平均语音识别结果，向所述中央处理电路输出所述加权平均语音识别结果。

上述三网融合智能装置中，所述映射和反映射对应的是将字符值映射为该字符预定义在数轴上的值的函数以及所述函数的反函数，所述函数的是通过将读音相近的字词与数轴上连续的数值建立映射来建立的。

在本发明所述的三网融合智能装置中，还包括：网络选择电路，用于根据所述语音识别结果从所述电视网数据处理电路、所述互联网数据处理电路和所述电信网数据处理电路中选择一个并为所选择的电路与所述中央处理电路建立通信连接，所述网络选择电路电性连接所述电视网数据处理电路、所述互联网数据处理电路、所述电信网数据处理电路和所述中央处理电路。

本发明的有益效果是能让人们通过语音控制来实现上网、看电视、发信息等功能，为人们提供了更加便利的服务和更加智能的体验。

附图说明

下面将结合附图及实施例对本发明作进一步说明，附图中：

图1是本发明的三网融合智能装置的第一个实施例的框图；

图2是图1中语音识别电路的第一个实施例的框图；

图3是图1中语音识别电路的第二个实施例的框图；

图4是本发明的三网融合智能装置的第二个实施例的框图。

具体实施方式

参考图1，图1是本发明的三网融合智能装置的第一个实施例的框图。本发明的三网融合智能装置包括电视网数据处理电路101、互联网数据处理电路102、电信网数据处理电路103、中央处理电路105、信号输出电路104、语音识别电路106和语音接收电路107。电视网数据处理电路101、互联网数据处理电路102和电信网数据处理电路103分别接入到电视网、互联网和电信网中。中央处理电路105与信号输出电路104和语音识别电路106电性连接。语音接收电路107与语音识别电路106电性连接。语音接收电路107用于收集用户的语音数据，即接收用户的语音并生成语音数据或者接收其它设备通过有线或无线的方式发送的用户的语音数据。语音接收电路107将该语音数据发送给语音识别电路106。语音识别电路106用于对该语音数据进行识别以得出语音识别结果，并将该语音识别结果发送给中央处理电路。

参考图2，图2为图1中语音识别电路的第一个实施例的框图。语音识别电路106包括识别电路201和第一语音数据库202。第一语音数据库202与识别电路201电性连接，第一语音数据库202存储了第一语音特征数据。识别电路201电性连接语音接收电路107和中央处理电路105。识别电路201从语音接收电路107接收语音数据，提取该语音数据的语音特征，以及从第一语音数据库202中读取第一语音特征数据并将该第一语音特征数据和该语音数据的语音特征进行比对，生成第一语音识别结果，该第一语音识别结果由识别电路201发送给中央处理电路105。中央处理电路105根据该第一语音识别结果执行相应的程序。

参考图3，图3为图1中语音识别电路的第二个实施例的框图。语音识别电路106包括加权平均电路301、识别电路201、第二语音数据库302和第三语音数据库303。识别电路201与第二语音数据库302、第三语音数据库303和加权平均电路电性连接，此外，识别电路201还与语音接收电路107电性连接，加权平均电路301与中央处理电路105电性连接。第二语音数据库302和第三语音数据库303存储了不同类型的语音特征数据。例如，第二语音数据库302存储了从第二杂音环境中提取出的第二语音特征数据，该第二杂音环境的杂音分贝取值范围为0分贝-30分贝，该第二语音特征数据包含该第二杂音环境的第二杂音特征，第三语音数据库303存储了从第三杂音环境中提取出的第三语音特征数据，该第三杂音环境的杂音分贝取值范围为31分贝-60分贝，该第三语音特征数据包含该第三杂音环境的第三杂音特征。或者，第二语音数据库302存储了从具有第二口音的语音数据中提取出的第二语音特征数据，该第二语音特征数据包含第二口音特征，第三语音数据库303存储了从具有第三口音的语音数据中提取出的第三语音特征数据，该第三语音特征数据包含第三口音特征。或者，第二语音数据库302存储了从具有第二语速的语音数据中提取出的第二语音特征数据，该第二语音特征数据包含第二语速特征，第三语音数据库303存储了从具有第三语速的语音数据中提取出的第三语音特征数据，该第三语音特征数据包含第三语速特征。或者，第二语音数据库302存储了包含了第二杂音特征的第二语音特征数据，第三语音数据库303存储了包含第三口音的第三语音特征数据。或者，第二语音数据库302存储了包含了第二杂音特征的第二语音特征数据，第三语音数据库303存储了包含第三语速的第三语音特征数据。依此类推，即，第二语音特征数据包括第二杂音特征、第二口音特征、第二语速特征等中的一种，所述第三语音特征数据包括第三杂音特征、第三口音特征、第三语速特征等中的一种。识别电路201从语音接收电路107接收语音数据并提取该语音数据的语音特征，同时分别从第二语音数据库302和第三语音数据库303中分别读取第二语音特征数据和第三语音特征数据，将该语音数据的语音特征分别与第二语音特征数据和第三语音特征数据进行比对，得出两种语音识别结果，记为第二语音识别结果和第三语音识别结果。该第二语音识别结果和第三语音识别结果将被发送到加权平均电路中，加权平均电路将第二语音识别结果和第三语音识别结果映射到一个数轴上。加权平均电路301根据第二语音数据库302和第三语音特征数据库303中的第二语音特征数据和第三语音特征数据的类型预先存储第二权值和第三权值，该第二权值和第三权值分别是根据第二语音数据库302和第三语音数据库303识别结果的匹配度(准确率)来定义的。该第二语音识别结果和第三语音识别结果在数轴上的映射值将被加权平均电路301根据加权平均算法进行加权平均运算，得出运算结果，然后再进行反映射，得出加权平均语音识别结果，该加权平均语音识别结果将被发送到中央处理电路105中。上述映射和反映射对应的是将字符值映射为该字符预定义在数轴上的值的函数以及该函数的反函数。该函数的是通过将读音相近的字词与数轴上连续的数值建立一一对应关系这样一个方式来建立的，该反函数通过推导即可得出。中央处理电路105对该加权平均语音识别结果进行相应的处理。

经过测试，采用两个具有不同语音特征类型的语音数据库(第二语音数据库和第三语音数据库，第二语音数据库包含具有第二杂音特征的第二语音特征数据，第三语音数据库包含具有第三口音特征的第三语音特征数据)来进行语音识别并加权平均所得到的加权平均语音识别结果的匹配度(准确率)比只用一个语音数据库(第一语音数据库)进行语音识别所得到的语音识别结果的匹配度(准确率)提高9％-18％；采用三个具有不同语音特征类型的语音数据库(第二语音数据库、第三语音数据库和第四语音数据库(图中未示出)，第二语音数据库包含具有第二杂音特征的第二语音特征数据，第三语音数据库包含具有第三口音特征的第三语音特征数据，第四语音数据库包含具有第四语速特征的第四语音特征数据)来进行语音识别并加权平均所得到的加权平均语音识别结果的匹配度(准确率)比只用一个语音数据库(第一语音数据库)进行语音识别所得到的语音识别结果的匹配度(准确率)提高15％-26％。当然，如果采用更多的具有不同语音特征类型的语音数据库，然后根据这些语音特征数据库中存储的语音特征数局进行语音识别，再对语音识别结果进行加权平均，那么语音识别效果会更加理想。

参考图4，图4为本发明的三网融合智能装置的第二个实施例的框图。本实施例是对本发明的三网融合智能装置的第一个实施例作出的一种优化。本实施例的三网融合智能装置还包括网络选择电路401，该网络选择电路401与电视网数据处理电路101、互联网数据处理电路102、电信网数据处理电路103以及中央处理电路105电性连接。网络选择电路401用于根据语音识别电路106的语音识别结果从电视网数据处理电路101、互联网数据处理电路102和电信网数据处理电路103中选择一个，并为所选择的电路和中央处理电路105建立通信连接。

以上描述了本发明的一些实施例，对本领域的普通技术人员来说，在不脱离本发明原理和精神的前提下，可以对本发明做出一些修改或变换，对本发明的一些修改或变换均落在本发明的保护范围之内。

Claims

1.一种三网融合智能装置，包括电视网数据处理电路、互联网数据处理电路、电信网数据处理电路、中央处理电路和信号输出电路，所述中央处理电路电性连接所述信号输出电路，其特征在于，包括：

语音接收电路，用于收集用户的语音数据；

语音识别电路，用于对所述语音数据进行语音识别以产生语音识别结果并将所述语音识别结果发送给所述中央处理电路；

网络选择电路，用于根据所述语音识别结果从所述电视网数据处理电路、所述互联网数据处理电路和所述电信网数据处理电路中选择一个并为所选择的电路与所述中央处理电路建立通信连接，所述网络选择电路电性连接所述电视网数据处理电路、所述互联网数据处理电路、所述电信网数据处理电路和所述中央处理电路；

所述中央处理电路电性连接所述语音识别电路，所述语音识别电路电性连接所述语音接收电路；

所述三网融合智能装置用于通过语音控制来实现上网、看电视或发信息的功能；

所述语音识别电路具体包括识别电路和语音数据库，所述识别电路电性连接所述语音接收电路和所述中央处理电路，所述语音数据库与所述识别电路电性连接；

所述语音数据库包括第二语音数据库和第三语音数据库，所述第二语音数据库和第三语音数据库均与上述识别电路电性连接；

所述第二语音数据库用于存储第二语音特征数据，所述第三语音数据库用于存储第三语音特征数据；

所述第二语音特征数据包括第二杂音环境的第二杂音特征、第二口音特征、第二语速特征中的一种，所述第三语音特征数据包括第三杂音环境的第三杂音特征、第三口音特征、第三语速特征中的一种；所述第二杂音环境的杂音分贝取值范围为0分贝至30分贝，所述第三杂音环境的杂音分贝取值范围为31分贝至60分贝；

所述识别电路还用于接收所述语音接收电路的语音数据，提取所述语音数据中的语音特征，同时分别从所述第二语音数据库和所述第三语音数据库中分别读取第二语音特征数据和第三语音特征数据，将提取的语音特征分别与所述第二语音特征数据和所述第三语音特征数据进行比对，得到第二语音识别结果和第三语音识别结果；

所述语音识别电路还包括加权平均电路，所述加权平均电路用于根据所述第二语音数据库中的第二语音特征数据的类型以及所述第三语音数据库中的第三语音特征数据的类型预先存储第二权值和第三权值，所述第二权值和所述第三权值由所述第二语音数据库和所述第三语音数据库的识别结果的匹配度定义；

所述加权平均电路还用于将所述第二语音识别结果和所述第三语音识别结果映射到数轴上，并对所述第二语音识别结果和所述第三语音识别结果在所述数轴上的映射值进行加权平均运算，以及对加权运算的结果进行反映射，得出加权平均语音识别结果，向所述中央处理电路输出所述加权平均语音识别结果。

2.根据权利要求1所述的三网融合智能装置，其特征在于，所述映射和反映射对应的是将字符值映射为该字符预定义在数轴上的值的函数以及所述函数的反函数，所述函数的是通过将读音相近的字词与数轴上连续的数值建立映射来建立的。