CN101576901B

CN101576901B - 搜索请求的产生方法

Info

Publication number: CN101576901B
Application number: CN2009100401858A
Authority: CN
Inventors: 刘致远
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Shenzhen Tencent Computer Systems Co Ltd
Priority date: 2009-06-11
Filing date: 2009-06-11
Publication date: 2011-07-06
Anticipated expiration: 2029-06-11
Also published as: CN101576901A

Abstract

一种搜索请求的产生方法，包括以下步骤：接收语音输入信号；对所述语音输入信号进行波形识别，获得语音拼音；根据所述语音拼音生成输入词；判断所述输入词中是否包含搜索命令及搜索关键词；如果所述输入词中包含搜索命令及搜索关键词，则以所述搜索关键词发送搜索请求。上述搜索请求的产生方法中，通过语音识别，可以迅速方便的输入需要搜索的关键词及下达搜索的命令。此外，还提供了一种搜索系统。此外，还有提供了一种便于使用搜索功能的移动通信设备。

Description

搜索请求的产生方法

【技术领域】

本发明涉及一种搜索请求的产生方法及移动通信设备。

【背景技术】

计算机网络技术的发展极大的提高了人们获取信息的便利性。计算机网络中存储了海量的信息，为了便于人们查找到自己所需的信息，搜索引擎被广泛使用。人们通过输入关键词，即可找到包含该关键词的网页。

传统的搜索请求是通过键盘输入关键词，然后用鼠标点击搜索按钮产生搜索请求发送到搜索引擎服务器。搜索引擎服务器获得搜索结果将搜索结果返回到发出搜索请求的请求端。然而，上述搜索请求的产生方法对于不方便使用键盘的人(例如残疾人)来说，将带来使用上的障碍；特别是在移动通信设备中，由于移动通信设备体积较小，通常不具备全尺寸的键盘，导致输入关键词不方便，从而限制了搜索功能在移动通信设备上的应用。

【发明内容】

基于此，有必要提供一种提高便利性的搜索请求的产生方法。

一种搜索请求的产生方法，包括以下步骤：

接收语音输入信号；

对所述语音输入信号进行波形识别，获得语音中单个的字对应的语音拼音及该单个的字对应的语音拼音正确的概率；

根据所述单个的字对应的语音拼音正确的概率进行组合，再将拼音组合后对应的概率最高的词作为输入词，显示所述输入词，并判断是否接收到切换所述输入词的命令的步骤，如果接收到切换命令，则将输入词切换为拼音组合后对应的概率次高的词；

判断所述输入词中是否包含搜索命令及搜索关键词；

如果所述输入词中包含搜索命令及搜索关键词，则以所述搜索关键词发送搜索请求；

所述判断所述输入词中是否包含搜索命令及搜索关键词的步骤具体包括如下步骤：步骤S202，判断输入词是否为命令，如果不是命令，则执行步骤S204；如果是命令，则执行步骤S206；

步骤S204，将所述输入词作为文本，然后返回接收语音输入信号的步骤；

步骤S206，如果是命令，则判断是否为新搜索命令，如果是新搜索命令，则进入步骤S208；如果不是新搜索命令，则进入步骤S210；

步骤S208，开启搜索页面，然后返回接收语音输入信号的步骤；

步骤S210，判断是否为搜索命令，如果不是搜索命令，则进入步骤S212；如果是搜索命令，则进入步骤S214；

步骤S212，执行其他命令；

步骤S214，判断是否已经有文本输入，如果没有文本输入，则进入步骤S216；如果已经有文本输入，则进入步骤S218；

步骤S216，提示未输入关键词；

步骤S218，以所述文本作为所述搜索关键词。

优选地，所述单个的字对应的语音拼音的数量为两个以上。

上述搜索请求的产生方法中，通过语音识别，可以迅速方便的输入需要搜索的关键词及下达搜索的命令。

【附图说明】

图1为搜索请求的产生方法的流程图；

图2为搜索请求的产生方法的详细流程图；

图3为移动通信设备的模块图；

图4为波形识别模块的示意图；

图5为动态搜索模块的示意图。

【具体实施方式】

如图1所示，其为搜索请求的产生方法的流程图。首先，步骤S110，接收语音输入信号。例如，通过麦克风采集语音获得模拟信号，将该模拟信号进行模拟/数字转换后即可获得该语音输入信号。

步骤S120，对所述语音输入信号进行波形识别，获得语音拼音。根据输入信号的波形特征，将该波形特征与预先存储的特征进行对比，确定该波形对应拼音。在实际的波形识别过程中，因为发音不标准、环境噪音、波形识别模块的识别能力等问题，并不能保证识别获得的语音拼音绝对正确，因此，对于语音中单个的字，根据识别比较的结果可以输出多个拼音及各个拼音正确的概率。例如，用户发出的语音为“sou”，则波形识别获得的语音拼音可能为“sou”的概率为80％，可能为“shou”的概率为15％，可能为“su”的概率为5％。当然，在发音标准、环境噪音又较小的情况下，单个的字对应的语音拼音的数量也可能只有一个，此时，该语音拼音正确的概率为100％。

步骤S130，根据所述语音拼音生成输入词。输入词是指用户发出的语音所代表的词，输入词可以包括一个或两个以上单个的字，输入词可以是命令，也可以是搜索的关键词。输入词为根据单个的字对应的语音拼音正确的概率进行组合，将正确的概率较高的拼音组合在一起，再将该拼音组合对应的概率最高的词作为输入词。比如，用户发出的语音为“sou suo dian shi”，由步骤S120获得的语音中各个字拼音正确的概率为：

[sou 80％，shou 15％，su 5％]；

[suo 70％，shuo 20％，shu 5％，su 5％]；

[dian 95％，tian 5％]；

[shi 90％，si 5％，chi 5％]。

将上述拼音中正确的概率较高的拼音组合在一起，获得的拼音组合即为“sousuo dian shi”，再将该拼音组合“sou suo dian shi”对应的概率最高的词“搜索电视”作为输入词。当然，需要预先存储拼音与词的对应关系及该拼音组合对应的各输入词的概率。通过比较获得语音中各个字拼音正确的概率，再组合出可能性最大拼音组合得到输入词，可以大幅度提高语音输入的正确性。

步骤S140，判断输入词中是否包含搜索命令及搜索关键词。根据步骤S130中获得的输入词，判断输入词中是否包含搜索命令及搜索关键词。

步骤S150，如果输入词中包含搜索命令及搜索关键词，则以所述搜索关键词发送搜索请求。例如，如上所述，获得“搜索电视”的输入词后，其中包含“搜索”，可以将其视为搜索命令，而将“电视”视为搜索关键词。

通过语音识别，可以迅速方便的输入需要搜索的关键词及下达搜索的命令。

在上述实施方式中，以用户连续说出搜索命令和搜索关键词进行了说明。在用户未连续说出搜索命令和搜索关键词的情况下，步骤S140的详细步骤如图2所示：

步骤S202，判断输入词是否为命令。如果不是命令，则执行步骤S204；如果是命令，则执行步骤S206。

步骤S204，将所述输入词作为文本，然后返回步骤S110。

步骤S206，如果是命令，则判断是否为新搜索命令。例如，经语音识别获得的输入词为“新搜索”时，则判断为新搜索命令。如果是新搜索命令，则进入步骤S208；如果不是新搜索命令，则进入步骤S210。

步骤S208，开启搜索页面，然后返回步骤S110。

步骤S210，判断是否为搜索命令。如果不是搜索命令，则进入步骤S212；如果是搜索命令，则进入步骤S214。

步骤S212，执行其他命令。其他的命令可以是“写短信”或者“打开记事本”等。如果输入词与这些命令匹配，则可以打开短信编辑界面或者启动记事本软件等。

步骤S214，判断是否已经有文本输入。如果没有文本输入，则进入步骤S216；如果已经有文本输入，则进入步骤S218。

步骤S216，提示未输入关键词。可以在显示屏幕上显示一个提示信息框，说明尚未输入关键词。

步骤S218，以所述文本作为所述搜索关键词。

用户未连续说出搜索命令和搜索关键词的情况举例说明如下：接收到用户“新搜索”的输入词，经步骤S202判断为命令，经步骤S206判断为新搜索命令，从而执行步骤S208，开启搜索页面。然后接收到用户“电视”的输入词，经步骤S202判断为不是命令，从而执行步骤S204，将“电视”作为文本输入。接着接收到用户“搜索”的输入词，经步骤S202判断为命令，经步骤S206判断为不是新搜索命令，再经步骤S210判断为搜索命令，进入步骤S214判断是否已经有文本输入，由于在步骤S204中已经将“电视”作为文本输入，因此进入步骤S218，以所述文本作为所述搜索关键词。最终在步骤S150，以所述搜索关键词“电视”发送搜索请求。

进一步地，步骤S130中，根据所述语音拼音生成输入词的步骤中，还可以包括显示所述输入词，并判断是否接收到切换所述输入词的命令的步骤，如果接收到切换命令，则将输入词切换为拼音组合对应的概率次高的词。例如，在显示“电视”作为输入的文本后，用户认为与所要搜索的关键词不同，则用户可以发出切换的语音命令或者通过按键产生切换的命令，在收到切换命令后，则将输入词切换为拼音组合“dian shi”对应的概率次高的词，例如“电势”，此时可以将“电势”作为新的输入的文本，待接收到用户搜索的命令后以“电势”作为搜索关键字发送搜索请求。在语音识别错误或者用户的目的是需要搜索不常用的词(这些词的概率通常较低)时，通过切换的功能，用户即可快速获得其所需要搜索的关键词。

如图3所示，移动通信设备包括输入模块、波形识别模块、动态搜索模块及无线通讯模块。

输入模块用于响应用户发出的语音，产生语音输入信号。输入模块可以包括麦克风、模拟/数字转换单元等。通过麦克风采集语音获得模拟信号，将该模拟信号经模拟/数字转换单元进行模拟/数字转换后即可获得该语音输入信号。

波形识别模块与所述输入模块相连，对所述语音输入信号进行波形识别，获得语音拼音。如图4所示，波形识别模块包括对比单元和特征存储单元，根据输入信号的波形特征，对比单元将该波形特征与预先存储在特征存储单元中的特征进行对比，确定该波形对应的拼音。在实际的波形识别过程中，因为发音不标准、环境噪音、波形识别模块的识别能力等问题，并不能保证识别获得的语音拼音绝对正确，因此，对于语音中单个的字，对比单元将所述语音输入信号与所述特征存储单元中存储的语音特征信息进行对比获得与所述输入词中的字对应的语音拼音正确的概率。例如，用户发出的语音为“sou”，则波形识别获得的语音拼音可能为“sou”的概率为80％，可能为“shou”的概率为15％，可能为“su”的概率为5％。当然，在发音标准、环境噪音又较小的情况下，单个的字对应的语音拼音的数量也可能只有一个，此时，该语音拼音正确的概率为100％。

动态搜索模块与所述波形识别模块相连，根据所述语音拼音生成输入词并判断所述输入词中是否包含搜索命令及搜索关键词，如果所述输入词中包含搜索命令及搜索关键词，则以所述搜索关键词产生搜索请求。动态搜索模块包括组合单元和词库单元，组合单元根据单个的字对应的语音拼音正确的概率进行组合，再根据所述词库单元中的拼音组合对应的各词的概率，将所述输入词确定为所述拼音组合对应的概率最高的词。比如，用户发出的语音为“sou suo dianshi”，由波形识别模块获得的语音中各个字拼音正确的概率为：

[sou 80％，shou 15％，su 5％]；

[suo 70％，shuo 20％，shu 5％，su 5％]；

[dian 95％，tian 5％]；

[shi 90％，si 5％，chi 5％]。

组合单元将上述拼音中正确的概率较高的拼音组合在一起，获得的拼音组合即为“sou suo dian shi”，再将该拼音组合“sou suo dian shi”在词库单元中对应的概率最高的词“搜索电视”作为输入词。

无线通讯模块与所述动态搜索模块相连，将所述搜索请求以无线信号发出。无线信号可以是基于电信通信网络的无线信号，例如GPRS(General Packet Radio Service，通用分组无线服务技术)、HSDPA(High Speed Downlink Packet Access，高速下行分组接入技术)等，也可以是符合蓝牙、802.11b/g等规范的无线信号。

动态搜索模块判断所述输入词中是否包含搜索命令及搜索关键词的过程可以分为两种情况：

在用户连续说出搜索命令和搜索关键词的情况下：例如，用户连续说出“sou suo dian shi”，则根据得到的输入词“搜索电视”可以判断为包含搜索命令“搜索”及搜索关键词“电视”，即可由动态搜索模块产生搜索请求。

在用户未连续说出搜索命令和搜索关键词的情况下，动态搜索模块的工作过程为：判断输入词是否为命令；如果不是命令，则将所述输入词作为文本；如果是命令，则判断是否为新搜索命令；如果是新搜索命令，则开启搜索页面；如果不是新搜索命令，则判断是否为搜索命令；如果是搜索命令，则判断是否已经有文本输入；如果已经有文本输入，则以所述文本作为所述搜索关键词。

以上所述实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以所附权利要求为准。

Claims

1.一种搜索请求的产生方法，其特征在于，包括以下步骤：

接收语音输入信号；

判断所述输入词中是否包含搜索命令及搜索关键词；

步骤S212，执行其他命令；

步骤S216，提示未输入关键词；

步骤S218，以所述文本作为所述搜索关键词。

2.根据权利要求1所述的搜索请求的产生方法，其特征在于，所述单个的字对应的语音拼音的数量为两个以上。