CN109326284B - 语音搜索的方法、装置和存储介质 - Google Patents
语音搜索的方法、装置和存储介质 Download PDFInfo
- Publication number
- CN109326284B CN109326284B CN201810966049.0A CN201810966049A CN109326284B CN 109326284 B CN109326284 B CN 109326284B CN 201810966049 A CN201810966049 A CN 201810966049A CN 109326284 B CN109326284 B CN 109326284B
- Authority
- CN
- China
- Prior art keywords
- keyword
- user
- pinyin
- voice
- pronunciation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 58
- 238000004422 calculation algorithm Methods 0.000 claims description 23
- 238000012790 confirmation Methods 0.000 claims description 9
- 238000001514 detection method Methods 0.000 claims description 9
- 238000005516 engineering process Methods 0.000 abstract description 5
- 238000012937 correction Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012905 input function Methods 0.000 description 2
- 241001672694 Citrus reticulata Species 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种语音搜索的方法、装置和存储介质。包括如下步骤:获取外界的语音信息,并将所述语音信息转换为文本信息;提取所述文本信息中的第一关键词,并在预设音近关键词库中检测是否存在与所述第一关键词发音相近的第二关键词;若检测到存在与所述第一关键词发音相近的第二关键词,则显示所述第一关键词和所述第二关键词,以供用户选择;接收用户根据所述显示的第一关键词和所述显示的第二关键词输入的选择指令,并根据所述选择指令进行语音搜索。本发明提供了一种语音搜索的方法,旨在解决现有的语音搜索技术中无法准确识别发音接近的关键词,从而造成搜索结果存在偏差的问题。
Description
技术领域
本发明涉及语音搜索技术领域,尤其涉及一种语音搜索的方法、装置和存储介质。
背景技术
随着语音识别技术的发展,语音搜索已逐步应用于各种终端设备中。目前的语音搜索产品,主要的实现方法是通过语音识别技术将音频信号转换成文字信息,再通过识别文字信息中的关键词,进行搜索,并将搜索结果以语音、网页、文字等形式展现给用户。
但是,在将语音信息转换文字信息的过程中,如果有多个关键词发音比较接近,转换得到的文字有可能不是用户想要的,易造成搜索的结果发生错误。当存在发音比较接近的关键词时,如何确定用户真正想搜索的关键词,从而避免搜索结果的偏差,是目前本行业待以解决的技术难题。
发明内容
本发明的主要目的在于提供一种语音搜索的方法、装置和存储介质。旨在解决现有的语音搜索技术中无法准确识别发音接近的关键词,从而造成搜索结果存在偏差的问题。
为实现上述目的,本发明提供一种语音搜索的方法,包括如下步骤:
获取外界的语音信息,并将所述语音信息转换为文本信息;
提取所述文本信息中的第一关键词,并在预设音近关键词库中检测是否存在与所述第一关键词发音相近的第二关键词;
若检测到存在与所述第一关键词发音相近的第二关键词,则显示所述第一关键词和所述第二关键词,以供用户选择;
接收用户根据所述显示的第一关键词和所述显示的第二关键词输入的选择指令,并根据所述选择指令进行语音搜索。
可选地,所述若检测到存在与所述第一关键词发音相近的第二关键词,则显示所述第一关键词和所述第二关键词,以供用户选择的步骤包括:
若检测到存在与所述第一关键词发音相近的第二关键词,则向用户提示对应的提示信息;
当接收到用户根据所述提示信息输入的确认指令时,显示所述第一关键词和所述第二关键词。
可选地,所述若检测到存在与所述第一关键词发音相近的第二关键词,则向用户提示对应的提示信息的步骤之后包括:
当接收到用户根据所述提示信息输入的否认指令时,则根据所述文本信息中的第一关键词,进行语音搜索。
可选地,所述获取外界的语音信息,并将所述语音信息转换为文本信息的步骤之前包括:
将预先设置的关键词库中的关键词进行拼音标识,生成对应的拼音;
根据预先设置的分类标准,对所述拼音进行分类;
根据第一算法对所述拼音再次进行分类,生成分类结果;
根据所述分类结果,得到音近关键词库。
可选地,所述根据预先设置的分类标准,对所述拼音进行分类的步骤包括:
根据预先设置的分类标准,根据拼音的声母对拼音进行分类;
根据拼音的韵母对所述拼音再次进行分类。
可选地,所述接收用户根据所述显示的第一关键词和所述显示的第二关键词输入的选择指令的步骤包括:
将所述第一关键词和所述第二关键词添加对应的序号;
输出所述添加对应序号后的第一关键词和第二关键词;
接收用户根据所述添加序号后的第一关键词和所述添加序号后的第二关键词所输入的选择指令。
可选地,所述在预设音近关键词库中检测是否存在与所述第一关键词发音相近的第二关键词的步骤包括:
将第一关键词进行拼音标识,生成对应的第一关键词拼音;
将所述第一关键词拼音输入到预设音近关键词库中进行检测,检测是否存在对应的第二关键词。
可选地,所述第一算法包括哈希map算法。
此外,为实现上述目的,本发明还提供一种语音搜索装置,所述语音搜索装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的语音搜索程序,所述语音搜索程序被所述处理器执行时实现如上所述的语音搜索方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有语音搜索程序,所述语音搜索程序被处理器执行时实现如上所述的语音搜索方法的步骤。
本发明提供了一种语音搜索的方法、装置和存储介质,包括如下步骤:获取外界的语音信息,并将所述语音信息转换为文本信息;提取所述文本信息中的第一关键词,并在预设音近关键词库中检测是否存在与所述第一关键词发音相近的第二关键词;若检测到存在与所述第一关键词发音相近的第二关键词,则显示所述第一关键词和所述第二关键词,以供用户选择;接收用户根据所述显示的第一关键词和所述显示的第二关键词输入的选择指令,并根据所述选择指令进行语音搜索。通过上述方式,本发明先是检测转换后的文字信息中的关键词是否存在对应的发音接近的关键词,通过这一检测操作判断是否进行关键词纠错,避免做无用功,从而提高用户体验;收到用户反馈的确认指令后,显示第一关键词和第二关键词,将对应的发音接近的关键词反馈给用户,有利于用户对关键词进行精准的选择,进而确定用户真正想搜索的关键词;最后根据用户输入的选择指令,进行语音搜索,根据选择指令,将关键词替换为用户选择的关键词并进行搜索,由于关键词的选择符合用户的要求,从而保证了搜索结果的准确性,避免了搜索结果的偏差。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的装置结构示意图;
图2为本发明语音搜索方法一实施例的流程示意图;
图3为本发明实施例所述显示所述第一关键词和所述第二关键词,以供用户选择的步骤细化流程示意图;
图4为本发明语音搜索方法又一实施例的流程示意图;
图5为本发明语音搜索方法再一实施例的流程示意图;
图6为本发明实施例所述根据预先设置的分类标准,对所述拼音进行分类的步骤细化流程示意图;
图7为本发明实施例所述接收用户根据所述显示的第一关键词和第二关键词输入的选择指令的步骤细化流程示意图;
图8为本发明实施例所述检测是否存在与所述第一关键词发音相近的第二关键词的步骤细化流程示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境的终端结构示意图。
本发明实施例终端可以是电脑,也可以是智能手机、平板电脑、便携计算机等具有显示功能和输入功能的可移动式终端设备。
如图1所示,该终端可以包括:处理器1001,例如CPU,通信总线1002,用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选的用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,终端还可以包括摄像头、WiFi模块等等,在此不再赘述。
本领域技术人员可以理解,图1中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
在图1所示的终端中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要包括输入单元比如键盘,键盘包括无线键盘和有线键盘,用于连接客户端,与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的语音搜索程序,并执行以下操作:
获取外界的语音信息,并将所述语音信息转换为文本信息;
提取所述文本信息中的第一关键词,并在预设音近关键词库中检测是否存在与所述第一关键词发音相近的第二关键词;
若检测到存在与所述第一关键词发音相近的第二关键词,则显示所述第一关键词和所述第二关键词,以供用户选择;
接收用户根据所述显示的第一关键词和所述显示的第二关键词输入的选择指令,并根据所述选择指令进行语音搜索。
进一步地,处理器1001可以调用存储器1005中存储的语音搜索程序,还执行以下操作:
所述若检测到存在与所述第一关键词发音相近的第二关键词,则显示所述第一关键词和所述第二关键词,以供用户选择的步骤包括:
若检测到存在与所述第一关键词发音相近的第二关键词,则向用户提示对应的提示信息;
当接收到用户根据所述提示信息输入的确认指令时,显示所述第一关键词和所述第二关键词。
进一步地,处理器1001可以调用存储器1005中存储的语音搜索程序,还执行以下操作:
所述若检测到存在与所述第一关键词发音相近的第二关键词,则向用户提示对应的提示信息的步骤之后包括:
当接收到用户根据所述提示信息输入的否认指令时,则根据所述文本信息中的第一关键词,进行语音搜索。
进一步地,处理器1001可以调用存储器1005中存储的语音搜索程序,还执行以下操作:
所述获取外界的语音信息,并将所述语音信息转换为文本信息的步骤之前包括:
将预先设置的关键词库中的关键词进行拼音标识,生成对应的拼音;
根据预先设置的分类标准,对所述拼音进行分类;
根据第一算法对所述拼音再次进行分类,生成分类结果;
根据所述分类结果,得到音近关键词库。
进一步地,处理器1001可以调用存储器1005中存储的语音搜索程序,还执行以下操作:
所述根据预先设置的分类标准,对所述拼音进行分类的步骤包括:
根据预先设置的分类标准,根据拼音的声母对拼音进行分类;
根据拼音的韵母对所述拼音再次进行分类。
进一步地,处理器1001可以调用存储器1005中存储的语音搜索程序,还执行以下操作:
所述接收用户根据所述显示的第一关键词和所述显示的第二关键词输入的选择指令的步骤包括:
将所述第一关键词和所述第二关键词添加对应的序号;
输出所述添加对应序号后的第一关键词和第二关键词;
接收用户根据所述添加序号后的第一关键词和所述添加序号后的第二关键词所输入的选择指令。
进一步地,处理器1001可以调用存储器1005中存储的语音搜索程序,还执行以下操作:
所述在预设音近关键词库中检测是否存在与所述第一关键词发音相近的第二关键词的步骤包括:
将第一关键词进行拼音标识,生成对应的第一关键词拼音;
将所述第一关键词拼音输入到预设音近关键词库中进行检测,检测是否存在对应的第二关键词。
本发明语音搜索装置的具体实施例与下述语音搜索方法各实施例基本相同,在此不作赘述。
请参阅图2,图2为本发明语音搜索方法一实施例的流程示意图,本实施例提供的语音搜索方法包括如下步骤:
步骤S10,获取外界的语音信息,并将所述语音信息转换为文本信息;
在本发明实施例中,以该语音搜索方法在手机上的APP(计算机应用程序)应用为例,应当理解的是,本发明公开的语音搜索方法可以应用在电脑、智能手机、平板电脑、便携计算机等具有显示功能和输入功能的可移动式终端设备上。
先将用户输入的用于搜索的语音信息转换为文本信息。例如,如果用户需要查找地点“旺旺医院”的位置,可以在手机的麦克风或其他语音识别模块上输入“旺旺医院”的语音信息,然后应用程序可以将上述语音信息识别为文本信息。应当理解的是,本发明涉及的语音搜索范围不限于查询地点,也包括查询公交线路,查询周边美食等其他范围。
步骤S20,提取所述文本信息中的第一关键词,并在预设音近关键词库中检测是否存在与所述第一关键词发音相近的第二关键词;
将语音信息转换为文本信息后,提取文本信息中的第一关键词。第一关键词是在语音信息转换为文本信息中提取出来的关键词。第二关键词是指在音近关键词库中提取出来的与第一关键词发音接近的关键词,应当理解的是,由于一个词语可以有多个发音接近的词语,所以与第一关键词对应的第二关键词可以包括有多个词语。关键词是指能够反映文本语料主题的词语或短语,关键词提取是指,从词语中抽取代表性词作为该文本的关键词。在本发明实施例中,预先设置有连接连接互联网的关键词库,保证关键词库的更新频率,达到丰富语音搜索范围的目的。将文本信息输入至预先设置的关键词库中进行检索,将在关键词库中检索到的文本信息中对应的词语提取出来作为文本信息的关键词。例如文本信息为“搜索电影爵迹”,将文本信息输入至预先设置的关键词库中进行检索,提取的关键词为“爵迹”。
提取出文本信息中的关键词后,在音近关键词库中检测是否存在与第一关键词发音相近的第二关键词。本发明实施例中预先设置有音近关键词库。将关键词库中的关键词根据发音进行分类,将发音比较接近关键词分为一类,归为一组,根据分类结果,得到了多个分类后的关键词。通过检测文本信息中的关键词是否存在对应的发音接近的关键词,判断是否进行关键词纠错,避免做无用功,从而提高用户体验。
步骤S30,若检测到存在与所述第一关键词发音相近的第二关键词,则显示所述第一关键词和所述第二关键词,以供用户选择;
若在音近关键词库中检测到与第一关键词发音相近的第二关键词,则显示第一关键词和第二关键词。应当理解的是,由于一个词语可能存在多个发音接近的其他词语,因此与第一关键词对应的第二关键词不止一个,可以是多个与第一关键词发音接近的词语。应用程序在手机屏幕特定位置输出包含第一关键词和第二关键词的的文本信息。通过这种方式,有利于用户对关键词进行精准的选择,进而确定用户真正想搜索的关键词
步骤S40,接收用户根据所述显示的第一关键词和所述显示的第二关键词输入的选择指令,并根据所述选择指令进行语音搜索;
选择指令,即用户发出的选择搜索关键词的指令,该指令用户可以以语音的方式发出,也可以以其他方式发出。用户获取到应用程序显示的第一关键词和第二关键词后,向应用程序发送选择指令,应用程序随即根据选择指令进行语音搜索,输出搜索结果。通过这种方式,将关键词替换为用户选择的关键词并进行搜索,由于关键词的选择符合用户的要求,从而保证了搜索结果的准确性,避免了搜索结果存在偏差的问题。
例如,用户接收到应用程序显示的“1爵迹,2绝技,3绝迹”文本信息后,可以在手机的麦克风或其他语音识别模块上输入“第一个”的语音信息,当然,也可以是的其他反馈方式,例如在手机屏幕对应位置输入“第一个”的文字信息,应用程序随即将关键词替换为“爵迹”,并连接互联网进行搜索,输出搜索结果。
本实施例中的语音搜索的方法包括如下步骤:获取外界的语音信息,并将所述语音信息转换为文本信息;提取所述文本信息中的第一关键词,并在预设音近关键词库中检测是否存在与所述第一关键词发音相近的第二关键词;若检测到存在与所述第一关键词发音相近的第二关键词,则显示所述第一关键词和所述第二关键词,以供用户选择;接收用户根据所述显示的第一关键词和所述显示的第二关键词输入的选择指令,并根据所述选择指令进行语音搜索。通过上述方式,本发明先是检测转换后的文字信息中的关键词是否存在对应的发音接近的关键词,通过这一检测操作判断是否进行关键词纠错,避免做无用功,从而提高用户体验;收到用户反馈的确认指令后,显示第一关键词和第二关键词,将对应的发音接近的关键词反馈给用户,有利于用户对关键词进行精准的选择,进而确定用户真正想搜索的关键词;最后根据用户输入的选择指令,进行语音搜索,根据选择指令,将关键词替换为用户选择的关键词并进行搜索,由于关键词的选择符合用户的要求,从而保证了搜索结果的准确性,避免了搜索结果的偏差。
进一步的,参照图3,图3为本发明实施例所述显示所述第一关键词和所述第二关键词,以供用户选择的步骤细化流程示意图,上述若检测到存在与所述第一关键词发音相近的第二关键词,则显示所述第一关键词和所述第二关键词,以供用户选择的步骤包括:
步骤S31,若检测到存在与所述第一关键词发音相近的第二关键词,则向用户提示对应的提示信息;
步骤S32,当接收到用户根据所述提示信息输入的确认指令时,显示所述第一关键词和所述第二关键词。
本实施例中,通过向用户提示对应的提示信息询问用户是否进行纠正关键词操作,该提示信息可以以语音的方式发出,也可以以其他方式发出。例如手机喇叭发出“音近关键词较多,是否进行纠正”的语音信息,当然,也可以是起到提示作用的其他反馈方式,例如在显示屏上显示“音近关键词较多,是否进行纠正”的文本信息,本实施例在此不做限定。若用于语音搜索的第一关键词存在对应的第二关键词,则应用程序根据第一关键词输出搜索结果的同时,向用户反馈对应的提示信息,询问用户是否进行关键词纠正,通过这种方式,把握用户的需求,提高用户的满意度。
确认指令,即用户发出的进行关键词纠正的指令,该指令用户可以以语音的方式发出,也可以以其他方式发出。例如用户接收到手机发出的“关键词模糊,是否进行纠正”的语音信息后,可以在手机的麦克风或其他语音识别模块上输入“是”的语音信息,当然,也可以是的其他反馈方式,例如在手机屏幕对应位置输入“是”的文字信息,起相同作用。
当应用程序获取确认指令后,显示第一关键词和第二关键词,例如应用程序获取用户发出的“是”的语音指令后,输出与关键词对应的“1爵迹,2绝技,3绝迹”的文本信息。通过这种方式,有利于用户对关键词进行精准的选择,进而确定用户真正想搜索的关键词。
进一步的,参照图4,图4为本发明语音搜索方法又一实施例的流程示意图,上述步骤S31若检测到存在与所述第一关键词发音相近的第二关键词,则向用户提示对应的提示信息之后包括:
步骤S33,当接收到用户根据所述提示信息输入的否认指令时,则根据所述文本信息中的第一关键词,进行语音搜索。
否认指令,即用户发出的不进行关键词纠正的指令,该指令用户可以以语音的方式发出,也可以以其他方式发出。例如用户接收到手机发出的“关键词模糊,是否进行纠正”的语音信息后,可以在手机的麦克风或其他语音识别模块上输入“否”的语音信息,当然,也可以是的其他反馈方式,例如在手机屏幕对应位置输入“否”的文字信息,起相同作用。
应用程序获取到否认指令后,连接互联网对从文本信息中提取出来的第一关键词进行搜索,并输出搜索结果。通过这种方式,避免做无用功,确定用户真正想搜索的关键词,进而保证搜索结果的准确性。
进一步的,参照图5,图5为本发明语音搜索方法再一实施例的流程示意图,上述步骤S10获取外界的语音信息,并将所述语音信息转换为文本信息之前包括:
步骤S50,将预先设置的关键词库中的关键词进行拼音标识,生成对应的拼音;
步骤S60,根据预先设置的分类标准,对所述拼音进行分类;
步骤S70,根据第一算法对所述拼音再次进行分类,生成分类结果;
步骤S80,根据所述分类结果,得到音近关键词库。
得到预先设置的关键词库中各个关键词的拼音,例如关键词为“爵迹”,得到关键词的拼音为“jueji”。此为现有技术,不再过多阐述。
本发明实施例中根据方言习惯等建立分类标准,并预先设置在应用程序中。另外,用户也可以根据自己的需求建立分类标准。得到关键词的拼音后,应用程序使用预先设置的分类标准对拼音进行分类。例如将含有“ing”和“in”的拼音分为一类,将含有“fu”和“hu”的拼音分为一类。
对关键词音标进行第一次分类后,本发明使用第一算法对关键词音标进一步分类。第一算法包括哈希map算法,哈希map算法是Java收集框架的重要成员,也是Map族中最为常用的一种。简单地说哈希map算法是基于哈希表中Map接口的实现,其中,哈希就是把任意长度的输入通过哈希算法,变换成固定长度的输出,该输出就是哈希值。本实施例中,使用哈希map算法先计算得到各个拼音的哈希值,再将得到的数值较为接近的哈希值存入对应的Map数组中,这样就得到了多个Map数组,由于较为接近的拼音其哈希值也较为接近,而较为接近的哈希值存储在同一Map数组,此时遍历所有的Map数组,实现对关键词拼音的分类。简单来说就是,第一算法通过计算所有关键词的拼音的哈希值,根据哈希值的大小对拼音进行分类,从而实现对关键词的分类。
应用程序使用分类标准和哈希map算法对关键词进行分类,通过这种双重分类的方式,保障音近关键词库中关键词分类的准确,帮助用户纠正因为发音比较接近而错误识别的关键词。
进一步的,参照图6,图6为本发明实施例所述根据预先设置的分类标准,对所述拼音进行分类的步骤细化流程示意图,上述根据预先设置的分类标准,对所述拼音进行分类的步骤包括:
步骤S61,根据预先设置的分类标准,根据拼音的声母对拼音进行分类;
步骤S62,根据拼音的韵母对所述拼音再次进行分类。
本发明实施例中,根据预先设置的分类标准先根据声母的相似性对所有关键词的拼音进行分类。声母是汉语音节开头的辅音,普通话有21个辅音声母,不同的声母是由不同的发音部位和发音方法决定的。因此可以将声母发音较为接近的拼音分为一类。例如将含有“sh”和“s”的拼音分为一类。
其后,根据韵母的相似性对所有关键词的拼音再次进行分类。韵母是指中国汉语音韵学术语,汉语字音中声母、字调以外的部分。因此可以将韵母发音较为接近的拼音分为一类。例如将含有“in”和“ing”的拼音分为一类。
通过上述方式对拼音进行分类,进而实现对第二关键词的分类,保障音近关键词库中关键词分类的准确性。
进一步的,参照图7,图7为本发明实施例所述接收用户根据所述显示的第一关键词和第二关键词输入的选择指令的步骤细化流程示意图,上述接收用户根据所述显示的第一关键词和所述显示的第二关键词输入的选择指令的步骤包括:
步骤S41,将所述第一关键词和所述第二关键词添加对应的序号;
步骤S42,输出所述添加对应序号后的第一关键词和第二关键词;
步骤S43,接收用户根据所述添加序号后的第一关键词和所述添加序号后的第二关键词所输入的选择指令。
在本发明实施例中,当应用程序检测到存在与第一关键词发音相近的关键词后,将第一关键词和第二关键词添加对应的序号。例如,关键词“爵迹”对应的音近关键词库中的发音接近的关键词为“绝技”以及“绝迹”,则分别对三个关键词作序号标识,得到“1爵迹”、“2绝技”以及“3绝迹”。
将第一关键词和第二关键词添加对应的序号后,输出序号标识后的第一关键词和第二关键词。以本发明在手机端的应用为例,可以是在手机显示屏上显示“1爵迹、2绝技、3绝迹,请选择搜索关键词”的文本信息。通过这种方式,帮助用户准确辨别发音接近的关键词,进而避免搜索结果存在偏差的问题。
进一步的,参照图8,图8为本发明实施例所述检测是否存在与所述第一关键词发音相近的第二关键词的步骤细化流程示意图,上述在预设音近关键词库中检测是否存在与所述第一关键词发音相近的第二关键词的步骤包括:
步骤S21,将第一关键词进行拼音标识,生成对应的第一关键词拼音;
步骤S22,将所述第一关键词拼音输入到预设音近关键词库中进行检测,检测是否存在对应的第二关键词。
得到文本信息中第一关键词的拼音,例如关键词为“爵迹”,得到关键词的拼音为“jueji”。此为现有技术,不再过多阐述。
将第一关键词拼音输入到预设音近关键词库中进行检测,关键词库中的关键词根据发音进行分类,将发音比较接近关键词分为一类,归为一组,根据分类结果,得到了多个分类后的关键词。通过对文本信息中的第一关键词进行拼音标识,将得到的第一关键词拼音输入到预设音近关键词库中进行检测,检测是否存在拼音接近且在音近关键词库中归为一类的第二关键词。从而判断是否进行关键词纠错,避免做无用功。
进一步的,所述第一算法包括哈希map算法。
第一算法包括哈希map算法,哈希map算法是Java收集框架的重要成员,也是Map族中最为常用的一种。简单地说哈希map算法是基于哈希表中Map接口的实现,其中,哈希就是把任意长度的输入通过哈希算法,变换成固定长度的输出,该输出就是哈希值。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有语音搜索程序,所述语音搜索程序被处理器执行时实现如下操作:
获取外界的语音信息,并将所述语音信息转换为文本信息;
提取所述文本信息中的第一关键词,并在预设音近关键词库中检测是否存在与所述第一关键词发音相近的第二关键词;
若检测到存在与所述第一关键词发音相近的第二关键词,则显示所述第一关键词和所述第二关键词,以供用户选择;
接收用户根据所述显示的第一关键词和所述显示的第二关键词输入的选择指令,并根据所述选择指令进行语音搜索。
进一步地,所述语音搜索程序被处理器执行时还实现如下操作:
所述若检测到存在与所述第一关键词发音相近的第二关键词,则显示所述第一关键词和所述第二关键词,以供用户选择的步骤包括:
若检测到存在与所述第一关键词发音相近的第二关键词,则向用户提示对应的提示信息;
当接收到用户根据所述提示信息输入的确认指令时,显示所述第一关键词和所述第二关键词。
进一步地,所述语音搜索程序被处理器执行时还实现如下操作:
所述若检测到存在与所述第一关键词发音相近的第二关键词,则向用户提示对应的提示信息的步骤之后包括:
当接收到用户根据所述提示信息输入的否认指令时,则根据所述文本信息中的第一关键词,进行语音搜索。
进一步地,所述语音搜索程序被处理器执行时还实现如下操作:
所述获取外界的语音信息,并将所述语音信息转换为文本信息的步骤之前包括:
将预先设置的关键词库中的关键词进行拼音标识,生成对应的拼音;
根据预先设置的分类标准,对所述拼音进行分类;
根据第一算法对所述拼音再次进行分类,生成分类结果;
根据所述分类结果,得到音近关键词库。
进一步地,所述语音搜索程序被处理器执行时还实现如下操作:
所述根据预先设置的分类标准,对所述拼音进行分类的步骤包括:
根据预先设置的分类标准,根据拼音的声母对拼音进行分类;
根据拼音的韵母对所述拼音再次进行分类。
进一步地,所述语音搜索程序被处理器执行时还实现如下操作:
所述接收用户根据所述显示的第一关键词和所述显示的第二关键词输入的选择指令的步骤包括:
将所述第一关键词和所述第二关键词添加对应的序号;
输出所述添加对应序号后的第一关键词和第二关键词;
接收用户根据所述添加序号后的第一关键词和所述添加序号后的第二关键词所输入的选择指令。
进一步地,所述语音搜索程序被处理器执行时还实现如下操作:
所述在预设音近关键词库中检测是否存在与所述第一关键词发音相近的第二关键词的步骤包括:
将第一关键词进行拼音标识,生成对应的第一关键词拼音;
将所述第一关键词拼音输入到预设音近关键词库中进行检测,检测是否存在对应的第二关键词。
本发明计算机可读存储介质的具体实施例与上述语音搜索方法各实施例基本相同,在此不作赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (8)
1.一种语音搜索的方法,其特征在于,包括以下步骤:
将预先设置的关键词库中的关键词进行拼音标识,生成对应的拼音;
根据预先设置的分类标准,根据拼音的声母对拼音进行分类;
根据拼音的韵母对所述拼音再次进行分类;
根据第一算法对所述拼音再次进行分类,生成分类结果;
根据所述分类结果,得到音近关键词库;
获取外界的语音信息,并将所述语音信息转换为文本信息;
提取所述文本信息中的第一关键词,并在预设音近关键词库中检测是否存在与所述第一关键词发音相近的第二关键词;
若检测到存在与所述第一关键词发音相近的第二关键词,则显示所述第一关键词和所述第二关键词,以供用户选择;
接收用户根据所述显示的第一关键词和所述显示的第二关键词输入的选择指令,并根据所述选择指令进行语音搜索。
2.如权利要求1所述的语音搜索的方法,其特征在于,所述若检测到存在与所述第一关键词发音相近的第二关键词,则显示所述第一关键词和所述第二关键词,以供用户选择的步骤包括:
若检测到存在与所述第一关键词发音相近的第二关键词,则向用户提示对应的提示信息;
当接收到用户根据所述提示信息输入的确认指令时,显示所述第一关键词和所述第二关键词。
3.如权利要求2所述的语音搜索的方法,其特征在于,所述若检测到存在与所述第一关键词发音相近的第二关键词,则向用户提示对应的提示信息的步骤之后包括:
当接收到用户根据所述提示信息输入的否认指令时,则根据所述文本信息中的第一关键词,进行语音搜索。
4.如权利要求1所述的语音搜索的方法,其特征在于,所述接收用户根据所述显示的第一关键词和所述显示的第二关键词输入的选择指令的步骤包括:
将所述第一关键词和所述第二关键词添加对应的序号;
输出所述添加对应序号后的第一关键词和第二关键词;
接收用户根据所述添加序号后的第一关键词和所述添加序号后的第二关键词所输入的选择指令。
5.如权利要求1所述的语音搜索的方法,其特征在于,所述在预设音近关键词库中检测是否存在与所述第一关键词发音相近的第二关键词的步骤包括:
将第一关键词进行拼音标识,生成对应的第一关键词拼音;
将所述第一关键词拼音输入到预设音近关键词库中进行检测,检测是否存在对应的第二关键词。
6.如权利要求1所述的语音搜索的方法,其特征在于,所述第一算法包括哈希map算法。
7.一种语音搜索装置,其特征在于,所述语音搜索装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的语音搜索程序,所述语音搜索程序被所述处理器执行时实现如权利要求1至6中任意一项所述的语音搜索方法的步骤。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有语音搜索程序,所述语音搜索程序处理被处理器执行时实现如权利要求1至6中任意一项所述的语音搜索方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810966049.0A CN109326284B (zh) | 2018-08-22 | 2018-08-22 | 语音搜索的方法、装置和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810966049.0A CN109326284B (zh) | 2018-08-22 | 2018-08-22 | 语音搜索的方法、装置和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109326284A CN109326284A (zh) | 2019-02-12 |
CN109326284B true CN109326284B (zh) | 2022-06-10 |
Family
ID=65263292
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810966049.0A Active CN109326284B (zh) | 2018-08-22 | 2018-08-22 | 语音搜索的方法、装置和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109326284B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110188233B (zh) * | 2019-05-27 | 2023-11-14 | 努比亚技术有限公司 | 语音在线搜索处理的方法、可穿戴设备及存储介质 |
CN111028834B (zh) * | 2019-10-30 | 2023-01-20 | 蚂蚁财富(上海)金融信息服务有限公司 | 语音信息提醒方法、装置、服务器和语音信息提醒设备 |
CN113763944B (zh) * | 2020-09-29 | 2024-06-04 | 浙江思考者科技有限公司 | 基于拟真人逻辑知识库的ai视频云交互系统 |
CN112257415A (zh) * | 2020-09-29 | 2021-01-22 | 当趣网络科技(杭州)有限公司 | 语音搜索词库的方法、系统、电子装置和存储介质 |
CN112434148A (zh) * | 2020-12-04 | 2021-03-02 | 房桂丽 | 一种基于人工智能的智能机器人应答方法和装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101388012A (zh) * | 2007-09-13 | 2009-03-18 | 阿里巴巴集团控股有限公司 | 带有易混淆音识别的拼音检查系统和方法 |
CN104216906A (zh) * | 2013-05-31 | 2014-12-17 | 大陆汽车投资(上海)有限公司 | 语音搜索方法和设备 |
CN107220343A (zh) * | 2017-05-26 | 2017-09-29 | 福州大学 | 基于局部敏感哈希的中文多关键词模糊排序密文搜索方法 |
CN108021554A (zh) * | 2017-11-14 | 2018-05-11 | 无锡小天鹅股份有限公司 | 语音识别方法、装置以及洗衣机 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3519910B2 (ja) * | 1996-09-30 | 2004-04-19 | 富士通株式会社 | 名称検索装置及びプログラム記憶媒体 |
-
2018
- 2018-08-22 CN CN201810966049.0A patent/CN109326284B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101388012A (zh) * | 2007-09-13 | 2009-03-18 | 阿里巴巴集团控股有限公司 | 带有易混淆音识别的拼音检查系统和方法 |
CN104216906A (zh) * | 2013-05-31 | 2014-12-17 | 大陆汽车投资(上海)有限公司 | 语音搜索方法和设备 |
CN107220343A (zh) * | 2017-05-26 | 2017-09-29 | 福州大学 | 基于局部敏感哈希的中文多关键词模糊排序密文搜索方法 |
CN108021554A (zh) * | 2017-11-14 | 2018-05-11 | 无锡小天鹅股份有限公司 | 语音识别方法、装置以及洗衣机 |
Also Published As
Publication number | Publication date |
---|---|
CN109326284A (zh) | 2019-02-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109326284B (zh) | 语音搜索的方法、装置和存储介质 | |
CN106098060B (zh) | 语音的纠错处理方法和装置、用于语音的纠错处理的装置 | |
JP3962763B2 (ja) | 対話支援装置 | |
CN105592343B (zh) | 针对问题和回答的显示装置和方法 | |
KR102191425B1 (ko) | 인터랙티브 캐릭터 기반 외국어 학습 장치 및 방법 | |
JP6618223B2 (ja) | 音声処理方法及び装置 | |
US9484034B2 (en) | Voice conversation support apparatus, voice conversation support method, and computer readable medium | |
US10586528B2 (en) | Domain-specific speech recognizers in a digital medium environment | |
US20150179173A1 (en) | Communication support apparatus, communication support method, and computer program product | |
WO2014190732A1 (en) | Method and apparatus for building a language model | |
JP5824829B2 (ja) | 音声認識装置、音声認識方法及び音声認識プログラム | |
CN110827803A (zh) | 方言发音词典的构建方法、装置、设备及可读存储介质 | |
CN111949255A (zh) | 基于语音的脚本编写方法、装置、设备及存储介质 | |
TW201337911A (zh) | 電子裝置以及語音識別方法 | |
CA3115974C (en) | Presentation assistance device for calling attention to words that are forbidden to speak | |
US9773038B2 (en) | Apparatus and method for starting up software | |
JP2018063271A (ja) | 音声対話装置、音声対話システム、および、音声対話装置の制御方法 | |
JP2012168349A (ja) | 音声認識システムおよびこれを用いた検索システム | |
JP2015087544A (ja) | 音声認識装置及び音声認識プログラム | |
JP2013050742A (ja) | 音声認識装置および音声認識方法 | |
US20200243092A1 (en) | Information processing device, information processing system, and computer program product | |
JP2012003090A (ja) | 音声認識装置および音声認識方法 | |
CN110827815B (zh) | 一种语音识别方法、终端、系统以及计算机存储介质 | |
CN112272847B (zh) | 错误转换词典制作系统及语音识别系统 | |
CN110010131B (zh) | 一种语音信息处理的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |