CN101576901B - 搜索请求的产生方法 - Google Patents

搜索请求的产生方法 Download PDF

Info

Publication number
CN101576901B
CN101576901B CN2009100401858A CN200910040185A CN101576901B CN 101576901 B CN101576901 B CN 101576901B CN 2009100401858 A CN2009100401858 A CN 2009100401858A CN 200910040185 A CN200910040185 A CN 200910040185A CN 101576901 B CN101576901 B CN 101576901B
Authority
CN
China
Prior art keywords
search
voice
speech
order
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2009100401858A
Other languages
English (en)
Other versions
CN101576901A (zh
Inventor
刘致远
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Tencent Computer Systems Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN2009100401858A priority Critical patent/CN101576901B/zh
Publication of CN101576901A publication Critical patent/CN101576901A/zh
Application granted granted Critical
Publication of CN101576901B publication Critical patent/CN101576901B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)

Abstract

一种搜索请求的产生方法,包括以下步骤:接收语音输入信号;对所述语音输入信号进行波形识别,获得语音拼音;根据所述语音拼音生成输入词;判断所述输入词中是否包含搜索命令及搜索关键词;如果所述输入词中包含搜索命令及搜索关键词,则以所述搜索关键词发送搜索请求。上述搜索请求的产生方法中,通过语音识别,可以迅速方便的输入需要搜索的关键词及下达搜索的命令。此外,还提供了一种搜索系统。此外,还有提供了一种便于使用搜索功能的移动通信设备。

Description

搜索请求的产生方法
【技术领域】
本发明涉及一种搜索请求的产生方法及移动通信设备。
【背景技术】
计算机网络技术的发展极大的提高了人们获取信息的便利性。计算机网络中存储了海量的信息,为了便于人们查找到自己所需的信息,搜索引擎被广泛使用。人们通过输入关键词,即可找到包含该关键词的网页。
传统的搜索请求是通过键盘输入关键词,然后用鼠标点击搜索按钮产生搜索请求发送到搜索引擎服务器。搜索引擎服务器获得搜索结果将搜索结果返回到发出搜索请求的请求端。然而,上述搜索请求的产生方法对于不方便使用键盘的人(例如残疾人)来说,将带来使用上的障碍;特别是在移动通信设备中,由于移动通信设备体积较小,通常不具备全尺寸的键盘,导致输入关键词不方便,从而限制了搜索功能在移动通信设备上的应用。
【发明内容】
基于此,有必要提供一种提高便利性的搜索请求的产生方法。
一种搜索请求的产生方法,包括以下步骤:
接收语音输入信号;
对所述语音输入信号进行波形识别,获得语音中单个的字对应的语音拼音及该单个的字对应的语音拼音正确的概率;
根据所述单个的字对应的语音拼音正确的概率进行组合,再将拼音组合后对应的概率最高的词作为输入词,显示所述输入词,并判断是否接收到切换所述输入词的命令的步骤,如果接收到切换命令,则将输入词切换为拼音组合后对应的概率次高的词;
判断所述输入词中是否包含搜索命令及搜索关键词;
如果所述输入词中包含搜索命令及搜索关键词,则以所述搜索关键词发送搜索请求;
所述判断所述输入词中是否包含搜索命令及搜索关键词的步骤具体包括如下步骤:步骤S202,判断输入词是否为命令,如果不是命令,则执行步骤S204;如果是命令,则执行步骤S206;
步骤S204,将所述输入词作为文本,然后返回接收语音输入信号的步骤;
步骤S206,如果是命令,则判断是否为新搜索命令,如果是新搜索命令,则进入步骤S208;如果不是新搜索命令,则进入步骤S210;
步骤S208,开启搜索页面,然后返回接收语音输入信号的步骤;
步骤S210,判断是否为搜索命令,如果不是搜索命令,则进入步骤S212;如果是搜索命令,则进入步骤S214;
步骤S212,执行其他命令;
步骤S214,判断是否已经有文本输入,如果没有文本输入,则进入步骤S216;如果已经有文本输入,则进入步骤S218;
步骤S216,提示未输入关键词;
步骤S218,以所述文本作为所述搜索关键词。
优选地,所述单个的字对应的语音拼音的数量为两个以上。
上述搜索请求的产生方法中,通过语音识别,可以迅速方便的输入需要搜索的关键词及下达搜索的命令。
【附图说明】
图1为搜索请求的产生方法的流程图;
图2为搜索请求的产生方法的详细流程图;
图3为移动通信设备的模块图;
图4为波形识别模块的示意图;
图5为动态搜索模块的示意图。
【具体实施方式】
如图1所示,其为搜索请求的产生方法的流程图。首先,步骤S110,接收语音输入信号。例如,通过麦克风采集语音获得模拟信号,将该模拟信号进行模拟/数字转换后即可获得该语音输入信号。
步骤S120,对所述语音输入信号进行波形识别,获得语音拼音。根据输入信号的波形特征,将该波形特征与预先存储的特征进行对比,确定该波形对应拼音。在实际的波形识别过程中,因为发音不标准、环境噪音、波形识别模块的识别能力等问题,并不能保证识别获得的语音拼音绝对正确,因此,对于语音中单个的字,根据识别比较的结果可以输出多个拼音及各个拼音正确的概率。例如,用户发出的语音为“sou”,则波形识别获得的语音拼音可能为“sou”的概率为80%,可能为“shou”的概率为15%,可能为“su”的概率为5%。当然,在发音标准、环境噪音又较小的情况下,单个的字对应的语音拼音的数量也可能只有一个,此时,该语音拼音正确的概率为100%。
步骤S130,根据所述语音拼音生成输入词。输入词是指用户发出的语音所代表的词,输入词可以包括一个或两个以上单个的字,输入词可以是命令,也可以是搜索的关键词。输入词为根据单个的字对应的语音拼音正确的概率进行组合,将正确的概率较高的拼音组合在一起,再将该拼音组合对应的概率最高的词作为输入词。比如,用户发出的语音为“sou suo dian shi”,由步骤S120获得的语音中各个字拼音正确的概率为:
[sou 80%,shou 15%,su 5%];
[suo 70%,shuo 20%,shu 5%,su 5%];
[dian 95%,tian 5%];
[shi 90%,si 5%,chi 5%]。
将上述拼音中正确的概率较高的拼音组合在一起,获得的拼音组合即为“sousuo dian shi”,再将该拼音组合“sou suo dian shi”对应的概率最高的词“搜索电视”作为输入词。当然,需要预先存储拼音与词的对应关系及该拼音组合对应的各输入词的概率。通过比较获得语音中各个字拼音正确的概率,再组合出可能性最大拼音组合得到输入词,可以大幅度提高语音输入的正确性。
步骤S140,判断输入词中是否包含搜索命令及搜索关键词。根据步骤S130中获得的输入词,判断输入词中是否包含搜索命令及搜索关键词。
步骤S150,如果输入词中包含搜索命令及搜索关键词,则以所述搜索关键词发送搜索请求。例如,如上所述,获得“搜索电视”的输入词后,其中包含“搜索”,可以将其视为搜索命令,而将“电视”视为搜索关键词。
通过语音识别,可以迅速方便的输入需要搜索的关键词及下达搜索的命令。
在上述实施方式中,以用户连续说出搜索命令和搜索关键词进行了说明。在用户未连续说出搜索命令和搜索关键词的情况下,步骤S140的详细步骤如图2所示:
步骤S202,判断输入词是否为命令。如果不是命令,则执行步骤S204;如果是命令,则执行步骤S206。
步骤S204,将所述输入词作为文本,然后返回步骤S110。
步骤S206,如果是命令,则判断是否为新搜索命令。例如,经语音识别获得的输入词为“新搜索”时,则判断为新搜索命令。如果是新搜索命令,则进入步骤S208;如果不是新搜索命令,则进入步骤S210。
步骤S208,开启搜索页面,然后返回步骤S110。
步骤S210,判断是否为搜索命令。如果不是搜索命令,则进入步骤S212;如果是搜索命令,则进入步骤S214。
步骤S212,执行其他命令。其他的命令可以是“写短信”或者“打开记事本”等。如果输入词与这些命令匹配,则可以打开短信编辑界面或者启动记事本软件等。
步骤S214,判断是否已经有文本输入。如果没有文本输入,则进入步骤S216;如果已经有文本输入,则进入步骤S218。
步骤S216,提示未输入关键词。可以在显示屏幕上显示一个提示信息框,说明尚未输入关键词。
步骤S218,以所述文本作为所述搜索关键词。
用户未连续说出搜索命令和搜索关键词的情况举例说明如下:接收到用户“新搜索”的输入词,经步骤S202判断为命令,经步骤S206判断为新搜索命令,从而执行步骤S208,开启搜索页面。然后接收到用户“电视”的输入词,经步骤S202判断为不是命令,从而执行步骤S204,将“电视”作为文本输入。接着接收到用户“搜索”的输入词,经步骤S202判断为命令,经步骤S206判断为不是新搜索命令,再经步骤S210判断为搜索命令,进入步骤S214判断是否已经有文本输入,由于在步骤S204中已经将“电视”作为文本输入,因此进入步骤S218,以所述文本作为所述搜索关键词。最终在步骤S150,以所述搜索关键词“电视”发送搜索请求。
进一步地,步骤S130中,根据所述语音拼音生成输入词的步骤中,还可以包括显示所述输入词,并判断是否接收到切换所述输入词的命令的步骤,如果接收到切换命令,则将输入词切换为拼音组合对应的概率次高的词。例如,在显示“电视”作为输入的文本后,用户认为与所要搜索的关键词不同,则用户可以发出切换的语音命令或者通过按键产生切换的命令,在收到切换命令后,则将输入词切换为拼音组合“dian shi”对应的概率次高的词,例如“电势”,此时可以将“电势”作为新的输入的文本,待接收到用户搜索的命令后以“电势”作为搜索关键字发送搜索请求。在语音识别错误或者用户的目的是需要搜索不常用的词(这些词的概率通常较低)时,通过切换的功能,用户即可快速获得其所需要搜索的关键词。
如图3所示,移动通信设备包括输入模块、波形识别模块、动态搜索模块及无线通讯模块。
输入模块用于响应用户发出的语音,产生语音输入信号。输入模块可以包括麦克风、模拟/数字转换单元等。通过麦克风采集语音获得模拟信号,将该模拟信号经模拟/数字转换单元进行模拟/数字转换后即可获得该语音输入信号。
波形识别模块与所述输入模块相连,对所述语音输入信号进行波形识别,获得语音拼音。如图4所示,波形识别模块包括对比单元和特征存储单元,根据输入信号的波形特征,对比单元将该波形特征与预先存储在特征存储单元中的特征进行对比,确定该波形对应的拼音。在实际的波形识别过程中,因为发音不标准、环境噪音、波形识别模块的识别能力等问题,并不能保证识别获得的语音拼音绝对正确,因此,对于语音中单个的字,对比单元将所述语音输入信号与所述特征存储单元中存储的语音特征信息进行对比获得与所述输入词中的字对应的语音拼音正确的概率。例如,用户发出的语音为“sou”,则波形识别获得的语音拼音可能为“sou”的概率为80%,可能为“shou”的概率为15%,可能为“su”的概率为5%。当然,在发音标准、环境噪音又较小的情况下,单个的字对应的语音拼音的数量也可能只有一个,此时,该语音拼音正确的概率为100%。
动态搜索模块与所述波形识别模块相连,根据所述语音拼音生成输入词并判断所述输入词中是否包含搜索命令及搜索关键词,如果所述输入词中包含搜索命令及搜索关键词,则以所述搜索关键词产生搜索请求。动态搜索模块包括组合单元和词库单元,组合单元根据单个的字对应的语音拼音正确的概率进行组合,再根据所述词库单元中的拼音组合对应的各词的概率,将所述输入词确定为所述拼音组合对应的概率最高的词。比如,用户发出的语音为“sou suo dianshi”,由波形识别模块获得的语音中各个字拼音正确的概率为:
[sou 80%,shou 15%,su 5%];
[suo 70%,shuo 20%,shu 5%,su 5%];
[dian 95%,tian 5%];
[shi 90%,si 5%,chi 5%]。
组合单元将上述拼音中正确的概率较高的拼音组合在一起,获得的拼音组合即为“sou suo dian shi”,再将该拼音组合“sou suo dian shi”在词库单元中对应的概率最高的词“搜索电视”作为输入词。
无线通讯模块与所述动态搜索模块相连,将所述搜索请求以无线信号发出。无线信号可以是基于电信通信网络的无线信号,例如GPRS(General Packet Radio Service,通用分组无线服务技术)、HSDPA(High Speed Downlink Packet Access,高速下行分组接入技术)等,也可以是符合蓝牙、802.11b/g等规范的无线信号。
动态搜索模块判断所述输入词中是否包含搜索命令及搜索关键词的过程可以分为两种情况:
在用户连续说出搜索命令和搜索关键词的情况下:例如,用户连续说出“sou suo dian shi”,则根据得到的输入词“搜索电视”可以判断为包含搜索命令“搜索”及搜索关键词“电视”,即可由动态搜索模块产生搜索请求。
在用户未连续说出搜索命令和搜索关键词的情况下,动态搜索模块的工作过程为:判断输入词是否为命令;如果不是命令,则将所述输入词作为文本;如果是命令,则判断是否为新搜索命令;如果是新搜索命令,则开启搜索页面;如果不是新搜索命令,则判断是否为搜索命令;如果是搜索命令,则判断是否已经有文本输入;如果已经有文本输入,则以所述文本作为所述搜索关键词。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (2)

1.一种搜索请求的产生方法,其特征在于,包括以下步骤:
接收语音输入信号;
对所述语音输入信号进行波形识别,获得语音中单个的字对应的语音拼音及该单个的字对应的语音拼音正确的概率;
根据所述单个的字对应的语音拼音正确的概率进行组合,再将拼音组合后对应的概率最高的词作为输入词,显示所述输入词,并判断是否接收到切换所述输入词的命令的步骤,如果接收到切换命令,则将输入词切换为拼音组合后对应的概率次高的词;
判断所述输入词中是否包含搜索命令及搜索关键词;
如果所述输入词中包含搜索命令及搜索关键词,则以所述搜索关键词发送搜索请求;
所述判断所述输入词中是否包含搜索命令及搜索关键词的步骤具体包括如下步骤:步骤S202,判断输入词是否为命令,如果不是命令,则执行步骤S204;如果是命令,则执行步骤S206;
步骤S204,将所述输入词作为文本,然后返回接收语音输入信号的步骤;
步骤S206,如果是命令,则判断是否为新搜索命令,如果是新搜索命令,则进入步骤S208;如果不是新搜索命令,则进入步骤S210;
步骤S208,开启搜索页面,然后返回接收语音输入信号的步骤;
步骤S210,判断是否为搜索命令,如果不是搜索命令,则进入步骤S212;如果是搜索命令,则进入步骤S214;
步骤S212,执行其他命令;
步骤S214,判断是否已经有文本输入,如果没有文本输入,则进入步骤S216;如果已经有文本输入,则进入步骤S218;
步骤S216,提示未输入关键词;
步骤S218,以所述文本作为所述搜索关键词。
2.根据权利要求1所述的搜索请求的产生方法,其特征在于,所述单个的字对应的语音拼音的数量为两个以上。
CN2009100401858A 2009-06-11 2009-06-11 搜索请求的产生方法 Active CN101576901B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2009100401858A CN101576901B (zh) 2009-06-11 2009-06-11 搜索请求的产生方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009100401858A CN101576901B (zh) 2009-06-11 2009-06-11 搜索请求的产生方法

Publications (2)

Publication Number Publication Date
CN101576901A CN101576901A (zh) 2009-11-11
CN101576901B true CN101576901B (zh) 2011-07-06

Family

ID=41271834

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009100401858A Active CN101576901B (zh) 2009-06-11 2009-06-11 搜索请求的产生方法

Country Status (1)

Country Link
CN (1) CN101576901B (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102609190A (zh) * 2012-01-16 2012-07-25 优视科技有限公司 浏览操作方法、浏览操作装置、浏览器以及移动终端
CN103218373B (zh) * 2012-01-20 2018-02-06 深圳市世纪光速信息技术有限公司 一种相关搜索系统、方法及装置
CN103246648B (zh) * 2012-02-01 2016-04-20 腾讯科技(深圳)有限公司 语音输入控制方法及装置
CN102780653B (zh) * 2012-08-09 2016-03-09 上海量明科技发展有限公司 即时通信中快捷通信的方法、客户端及系统
CN103631800A (zh) * 2012-08-23 2014-03-12 腾讯科技(深圳)有限公司 信息处理方法及装置
CN102968493A (zh) * 2012-11-27 2013-03-13 上海量明科技发展有限公司 通过输入法工具执行语音搜索的方法、客户端及系统
CN104238991B (zh) * 2013-06-21 2018-05-25 腾讯科技(深圳)有限公司 语音输入匹配方法及装置
CN105489220B (zh) * 2015-11-26 2020-06-19 北京小米移动软件有限公司 语音识别方法及装置
CN107025046A (zh) * 2016-01-29 2017-08-08 阿里巴巴集团控股有限公司 终端应用语音操作方法及系统
CN108615526B (zh) 2018-05-08 2020-07-07 腾讯科技(深圳)有限公司 语音信号中关键词的检测方法、装置、终端及存储介质
CN110737817A (zh) * 2018-07-02 2020-01-31 中兴通讯股份有限公司 浏览器的信息处理方法、装置、智能设备及存储介质
CN109712613B (zh) * 2018-12-27 2021-04-20 北京百佑科技有限公司 语义分析库更新方法、装置及电子设备
JP7388006B2 (ja) * 2019-06-03 2023-11-29 コニカミノルタ株式会社 画像処理装置及びプログラム
CN112735412B (zh) * 2020-12-25 2022-11-22 北京博瑞彤芸科技股份有限公司 一种根据语音指令搜索信息的方法和系统

Also Published As

Publication number Publication date
CN101576901A (zh) 2009-11-11

Similar Documents

Publication Publication Date Title
CN101576901B (zh) 搜索请求的产生方法
CN1333385C (zh) 用于通信系统的语音浏览器启用器
US9479911B2 (en) Method and system for supporting a translation-based communication service and terminal supporting the service
CN106409283B (zh) 基于音频的人机混合交互系统及方法
AU2013270485B2 (en) Input processing method and apparatus
CN104202455A (zh) 智能语音拨号的方法及装置
CN101681365A (zh) 用于分布式语音搜索的方法和装置
KR20140112360A (ko) 음성 인식의 단어 통합 시스템 및 단어군 추가 방법
CN102196207A (zh) 语音控制电视机的方法、装置和系统
CN105551488A (zh) 语音控制方法及系统
KR20090085673A (ko) 음성 인식을 이용한 콘텐츠 선택
CN103219005A (zh) 一种语音识别方法及装置
CN103491411A (zh) 基于语言推荐频道的方法及其装置
WO2020038145A1 (zh) 一种业务数据处理方法、装置以及相关设备
US8798237B2 (en) Voice dialing method and apparatus for mobile phone
CN102202082A (zh) 车载通信系统及方法
CN110992955A (zh) 一种智能设备的语音操作方法、装置、设备及存储介质
KR101170612B1 (ko) 사용자 영상을 이용한 음성인식 시스템 및 방법
JP2002540731A (ja) 携帯電話機による使用のための数字列を生成するシステムおよび方法
CN103187060A (zh) 车载语音处理装置
CN108806688A (zh) 智能电视的语音控制方法、智能电视、系统及存储介质
CN103187061A (zh) 车内语音对话系统
US20160125878A1 (en) Vehicle and head unit having voice recognition function, and method for voice recognizing thereof
CN103151044A (zh) 基于语音识别的语言转换方法及系统
JP2010026686A (ja) 統合的インタフェースを有する対話型コミュニケーション端末及びそれを用いたコミュニケーションシステム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20151230

Address after: The South Road in Guangdong province Shenzhen city Fiyta building 518000 floor 5-10 Nanshan District high tech Zone

Patentee after: Shenzhen Tencent Computer System Co., Ltd.

Address before: Shenzhen Futian District City, Guangdong province 518044 Zhenxing Road, SEG Science Park 2 East Room 403

Patentee before: Tencent Technology (Shenzhen) Co., Ltd.