CN105279227B - 同音词的语音搜索处理方法及装置 - Google Patents

同音词的语音搜索处理方法及装置 Download PDF

Info

Publication number
CN105279227B
CN105279227B CN201510580634.3A CN201510580634A CN105279227B CN 105279227 B CN105279227 B CN 105279227B CN 201510580634 A CN201510580634 A CN 201510580634A CN 105279227 B CN105279227 B CN 105279227B
Authority
CN
China
Prior art keywords
search
homophones
user
homophone
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510580634.3A
Other languages
English (en)
Other versions
CN105279227A (zh
Inventor
李裕东
颜振祥
赵程亮
郎文静
陈凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201510580634.3A priority Critical patent/CN105279227B/zh
Publication of CN105279227A publication Critical patent/CN105279227A/zh
Application granted granted Critical
Publication of CN105279227B publication Critical patent/CN105279227B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Abstract

本申请提出一种同音词的语音搜索处理方法和装置,其中,该方法包括:接收用户输入的语音信息,检索与所述语音信息对应的多个同音词;根据预设的搜索特征信息库,获取每个同音词与用户搜索需求的相似度,其中,所述搜索特征信息库包括:至少一个搜索特征,以及对应的数学模型;根据所述相似度和预设的相似度计算策略,确定与所述用户搜索需求对应的搜索词,以便根据所述搜索词进行信息检索。实现了根据用户自身的搜索需求进行智能识别,满足用户的个性化需求节约了处理资源,减少了用户的搜索时间,提高了处理效率和用户体验度。

Description

同音词的语音搜索处理方法及装置
技术领域
本申请涉及搜索信息处理技术领域,尤其涉及一种同音词的语音搜索处理方法及装置。
背景技术
随着语音识别技术的发展,语音识别技术的应用领域越来越广,使用语音进行搜索的用户也越来越多。然而,在语音搜索的场景下,经常会出现多个同音词。对于不同用户在不同的搜索场景下,同一个发音对应的搜索词可能是不同的。
现有的语音搜索应用中,若根据用户输入的语音信息,获知对应多个同音词,则根据当前的搜索热度列表,从多个同音词中识别出最热门的同音词作为用户的搜索词,并直接对该搜索词进行检索。
由此可见,针对同音词的语音搜索,现有技术只是根据其他用户搜索记录从多个同音词中识别最热门的词进行检索,并不能根据用户自身的搜索需求进行智能识别,不能满足用户的个性化需求,造成大量的无效搜索,浪费了处理资源,降低了处理效率。
发明内容
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本申请的第一个目的在于提出一种同音词的语音搜索处理方法,该方法实现了根据用户自身的搜索需求进行智能识别,满足用户的个性化需求节约了处理资源,减少了用户的搜索时间,提高了处理效率和用户体验度。
本申请的第二个目的在于提出一种同音词的语音搜索处理装置。
为达上述目的,本申请第一方面实施例提出了一种同音词的语音搜索处理方法,包括:接收用户输入的语音信息,检索与所述语音信息对应的多个同音词;根据预设的搜索特征信息库,获取每个同音词与用户搜索需求的相似度,其中,所述搜索特征信息库包括:至少一个搜索特征,以及对应的数学模型;根据所述相似度和预设的相似度计算策略,确定与所述用户搜索需求对应的搜索词,以便根据所述搜索词进行信息检索。
本申请实施例的同音词的语音搜索处理方法,首先接收用户输入的语音信息,检索与所述语音信息对应的多个同音词,然后根据预设的搜索特征信息库,获取每个同音词与用户搜索需求的相似度,其中,所述搜索特征信息库包括:至少一个搜索特征,以及对应的数学模型;最后根据所述相似度和预设的相似度计算策略,确定与所述用户搜索需求对应的搜索词,以便根据所述搜索词进行信息检索。由此,实现了根据用户自身的搜索需求进行智能识别,满足用户的个性化需求节约了处理资源,减少了用户的搜索时间,提高了处理效率和用户体验度。
为达上述目的,本申请第二方面实施例提出了一种同音词的语音搜索处理装置,包括:检索模块,用于接收用户输入的语音信息,检索与所述语音信息对应的多个同音词;获取模块,用于根据预设的搜索特征信息库,获取每个同音词与用户搜索需求的相似度,其中,所述搜索特征信息库包括:至少一个搜索特征,以及对应的数学模型;确定模块,用于根据所述相似度和预设的相似度计算策略,确定与所述用户搜索需求对应的搜索词,以便根据所述搜索词进行信息检索。
本申请实施例的同音词的语音搜索处理装置,通过检索模块接收用户输入的语音信息,检索与所述语音信息对应的多个同音词;通过获取模块根据预设的搜索特征信息库,获取每个同音词与用户搜索需求的相似度,其中,所述搜索特征信息库包括:至少一个搜索特征,以及对应的数学模型;通过确定模块根据所述相似度和预设的相似度计算策略,确定与所述用户搜索需求对应的搜索词,以便根据所述搜索词进行信息检索。由此,实现了根据用户自身的搜索需求进行智能识别,满足用户的个性化需求节约了处理资源,减少了用户的搜索时间,提高了处理效率和用户体验度。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1是本申请一个实施例的同音词的语音搜索处理方法的流程图;
图2是本申请另一个实施例的同音词的语音搜索处理方法的流程图;
图3是本申请一个实施例的同音词的语音搜索处理装置的结构示意图;
图4是本申请另一个实施例的同音词的语音搜索处理装置的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
下面参考附图描述本申请实施例的同音词的语音搜索处理方法及装置。
图1是本申请一个实施例的同音词的语音搜索处理方法的流程图。
如图1所示,该同音词的语音搜索处理方法包括:
步骤101,接收用户输入的语音信息,检索与所述语音信息对应的多个同音词。
本发明实施例提供的同音词的语音搜索处理方法应用于具有人机语音交互接口的终端设备中,终端设备上安装有能够访问人机语音交互接口的应用来为用户提供语音搜索服务,该应用可以根据实际需要进行选择,本实施例对此不作限制。
用户需要进行语音搜索服务时,向人机语音交互接口输入语音信息,当接收到用户输入的语音信息时,检索与该语音信息对应的多个同音词,具体的检索方式有很多,可以根据实际应用需要进行选择,举例说明如下:
方式一,采用倒排索引方式检索同音词,包括:
识别所述语音信息的音节,所述音节包括:发音音节和/或模糊音节;
查询预设的倒排索引获取与所述音节对应的多个同音词。
具体地,识别用户输入的语音信息的音节,其中,本实施例中涉及的音节包括:发音音节和/或模糊音节,音节是用听觉可以区分清楚的语音基本单位,音节之间具有明显可感知的界限。在汉语中一般一个汉字的读音即为一个音节,音节包括声母、韵母和音调。需要注意的是,在某些方言中,有很多音节与普通话不同,专门为对某些音节容易混淆的用户设计模糊音节。例如:声母模糊音zh和z,ch和c,sh和s;以及韵母模糊音ang和an,eng和en,iang和ian等。
识别出用户输入的语音信息的音节之后,查询预设的倒排索引获取与音节对应的多个同音词。其中,预设的倒排索引是基于语音音节建立的,倒排索引指的是用“单词-文档矩阵”表示的一种具体存储形式,通过倒排索引可以根据单词快速获取包含这个单词的文档列表。倒排索引主要由两个部分组成:“单词词典”和“倒排文件”,由于搜索引擎的通常索引单位是单词,因此,通过查询倒排索引的单词词典,可以获取与音节对应的多个同音词。
方式二,采用预设的语音模型检索同音词,具体包括:
预先存储有语音数据库,语音数据库中包括大量的词组语音模型,每个词组语音模型对应了所有发该语音的词汇列表。
将用户输入的语音信息进行词组划分,将各个词组的语音信息与预先存储的词组语音模型进行匹配,若匹配结果一致,则将与所述词组语音模型对应的词汇列表中的所有词作为与用户输入的语音信息对应的同音词。
步骤102,根据预设的搜索特征信息库,获取每个同音词与用户搜索需求的相似度,其中,所述搜索特征信息库包括:至少一个搜索特征,以及对应的数学模型。
在获取与用户输入的语音信息对应的多个同音词之后,根据预设的搜索特征信息库,获取每个同音词与用户搜索需求的相似度。其中,搜索特征信息库中包括:至少一个搜索特征,以及对应的数学模型。
需要说明的是,搜索特征的类型可以根据实际应用需要进行设置,具体内容包括:搜索频次、搜索结果、搜索词发音、搜索上文,以及搜索偏好。采用搜索特征信息库中与每个搜索特征对应的数学模型,对每个同音词的搜索特征进行分析处理,进而根据所有数学模型的处理结果,确定每个同音词与用户搜索需求的相似度。
其中,与每个搜索特征对应的数学模型视具体的搜索特征类型而设置,举例说明如下:当搜索特征类型为搜索上文时,与该搜索特征对应的数学模型为概率潜语义分析模型PLSA,用于分析每个同音词与搜索上文的语义相关性;当搜索特征类型为搜索词发音时,与该搜索特征对应的数学模型为频谱分析仪,用于分析每个同音词的标准发音的频谱与用户输入的语音信息的频谱的相似性。
步骤103,根据所述相似度和预设的相似度计算策略,确定与所述用户搜索需求对应的搜索词,以便根据所述搜索词进行信息检索。
在获取每个同音词与用户搜索需求的相似度之后,根据预设的相似度计算策略对每个同音词的相似度进行分析处理。其中,预设的相似度计算策略的具体内容可以根据实际应用需要进行设置和调整,对每个同音词的相似度的分析处理根据相似度计算策略进行,从而确定与用户搜索需求对应的搜索词。本实施例对相似度计算策略的具体内容不作限制,举例说明如下:
若相似度计算策略是根据相似度由高到低顺次筛选,则处理过程具体为:获取每个同音词与用户搜索需求的相似度之后,比较各个相似度的大小,根据与最大相似度对应的同音词确定用户的搜索词,若与最大相似度对应的同音词唯一,则将该同音词直接确定为搜索词,若与最大相似度对应的同音词不唯一,则将这些词显示给用户,供用户选择确定搜索词。
在根据相似度和预设的相似度计算策略,确定与用户搜索需求对应的搜索词之后,就根据该搜索词进行信息检索,并将检索结果返回给用户。由此可见,本实施例提供的同音词的语音搜索处理方法,当用户输入的语音为多音词时,并不是根据其他用户的搜索热度确定最热门的词为搜索词,而是获取与用户自身搜索需求最匹配的词为搜索词进行检索,例如:当用户输入的语音发音是“zhangxin”,根据上述分析能够识别出用户想要找的是“演员张鑫”,而不是热度最高的“企业家张欣”。
本实施例的同音词的语音搜索处理方法,首先接收用户输入的语音信息,检索与所述语音信息对应的多个同音词,然后根据预设的搜索特征信息库,获取每个同音词与用户搜索需求的相似度,其中,所述搜索特征信息库包括:至少一个搜索特征,以及对应的数学模型;最后根据所述相似度和预设的相似度计算策略,确定与所述用户搜索需求对应的搜索词,以便根据所述搜索词进行信息检索。由此,实现了根据用户自身的搜索需求进行智能识别,满足用户的个性化需求节约了处理资源,减少了用户的搜索时间,提高了处理效率和用户体验度。
图2是本申请另一个实施例的同音词的语音搜索处理方法的流程图。
如图2所示,可以包括以下步骤:
步骤201,接收用户输入的语音信息,检索与所述语音信息对应的多个同音词。
步骤201的具体实施过程参见步骤101,此处不再赘述。
步骤202,采用与每个搜索特征对应的数学模型,处理与所述搜索特征相关的输入信息,获取与所述搜索特征对应的特征值。
具体地,搜索特征的类型可以根据实际应用需要进行设置,本实施例中具体内容包括:搜索频次、搜索结果、搜索词发音、搜索上文,以及搜索偏好。采用与每个搜索特征对应的数学模型,处理与搜索特征相关的输入信息,获取与搜索特征对应的特征值。分别进行具体说明:
1)搜索频次:与该搜索频次对应的数学模型的输入信息为:预设历史时间段内的搜索日志和待处理的同音词,数学模型根据待处理的同音词在预设的历史时间段内的搜索次数获取对应的搜索频次,将获取的搜索频次与预设的门限值相比获取与该搜索频次对应的第一特征值。
2)搜索结果:与该搜索结果对应的数学模型的输入信息为:预设历史时间段内的用户日志和待处理的同音词,数学模型根据待处理的同音词在被搜索时,根据用户日志记录的用户针对搜索结果的有效点击操作获取搜索质量,将获取的搜索质量与预设的门限值相比获取与该搜索结果对应的第二特征值。
3)搜索词发音:与该搜索词发音对应的数学模型的输入信息为:倒排索引和待处理的同音词,数学模型根据倒排索引的单词词典生成同音词相似度列表,排序越靠前相似度越高,将发音相似度作为第三特征值。
4)搜索上文:与该搜索上文对应的数学模型的输入信息为:输入语音信息之前搜索的N个信息和待处理的同音词,数学模型分别获取待处理的同音词与N个信息的语义相关性,进而获取与该搜索上文对应的第四特征值。
5)搜索偏好:与该搜索偏好对应的数学模型的输入信息为:预设历史时间段内的用户浏览日志和待处理的同音词,数学模型根据用户浏览日志获取用户偏好特征的关键词,并获取待处理的同音词与用户偏好特征的关键词的语义相关性,进而获取与该搜索偏好对应的第五特征值。
步骤203,根据获取的所有特征值,生成每个同音词与用户搜索需求的相似度。
在获取与每个搜索特征对应的特征值之后,根据获取的所有特征值,生成每个同音词与用户搜索需求的相似度,具体的处理方式很多,举例说明:可以仅仅是对所有特征值的求和,获取每个同音词与用户搜索需求的相似度,也可以根据每个搜索特征类型占用户搜索需求的权重进行线性加权处理,获取每个同音词与用户搜索需求的相似度。
步骤204,根据所述相似度筛选满足预设阈值信息的备选同音词。
生成每个同音词与用户搜索需求的相似度之后,将每个相似度与预设的阈值信息进行比较,从所有同音词中筛选满足预设阈值信息的备选同音词。比如:阈值信息为相似度大于等于70%的为备选同音词,则将相似度低于70%的同音词滤掉,剩余的为备选同音词。若备选同音词为一个,则确定其为与用户搜索需求匹配的搜索词,本实施例针对备选同音词为多个的场景进行处理。
步骤205,根据与所述备选同音词对应的相似度,筛选满足预设方差信息的推荐同音词。
筛选出备选同音词之后,根据与每个备选同音词对应的相似度获取每两个备选同音词的方差,将每两个备选同音词的方差与预设的方差信息进行比较,从所有备选同音词中筛选满足方差信息的推荐同音词。
步骤206,根据所述推荐同音词确定与所述用户搜索需求对应的搜索词,以便根据所述搜索词进行信息检索。
从多个备选同音词中筛选出满足预设方差信息的推荐同音词之后,判断推荐同音词的数量是否唯一,以确定与用户搜索需求对应的搜索词。
具体地,若判断获知推荐同音词唯一,则确定搜索词为推荐同音词;若判断获知所述推荐同音词不唯一,则根据知识图谱,对每一个推荐同音词做实体关联,获取对应的实体标注信息和配图,生成与推荐同音词对应的推荐列表发送给所述用户,并根据用户的反馈信息确定搜索词。然后根据搜索词进行信息检索,并将检索结果返回给用户。
本实施例的同音词的语音搜索处理方法,首先接收用户输入的语音信息,检索与所述语音信息对应的多个同音词,然后采用与每个搜索特征对应的数学模型,处理与所述搜索特征相关的输入信息,获取与所述搜索特征对应的特征值,根据获取的所有特征值,生成每个同音词与用户搜索需求的相似度,然后根据所述相似度筛选满足预设阈值信息的备选同音词,根据与所述备选同音词对应的相似度,筛选满足预设方差信息的推荐同音词,最后根据所述推荐同音词确定与所述用户搜索需求对应的搜索词,以便根据所述搜索词进行信息检索。由此,实现了根据用户自身的搜索需求进行智能识别,满足用户的个性化需求节约了处理资源,减少了用户的搜索时间,提高了处理效率和用户体验度。
为了实现上述实施例,本申请还提出一种同音词的语音搜索处理装置。
图3是本申请一个实施例的同音词的语音搜索处理装置的结构示意图。
如图3所示,该同音词的语音搜索处理装置包括:
检索模块11,用于接收用户输入的语音信息,检索与所述语音信息对应的多个同音词;
获取模块12,用于根据预设的搜索特征信息库,获取每个同音词与用户搜索需求的相似度,其中,所述搜索特征信息库包括:至少一个搜索特征,以及对应的数学模型;
其中,所述搜索特征包括:搜索频次、搜索结果、搜索词发音、搜索上文,以及搜索偏好;
确定模块13,用于根据所述相似度和预设的相似度计算策略,确定与所述用户搜索需求对应的搜索词,以便根据所述搜索词进行信息检索。
需要说明的是,前述对同音词的语音搜索处理方法实施例的解释说明也适用于该实施例的同音词的语音搜索处理装置,此处不再赘述。
本申请实施例的同音词的语音搜索处理装置,首先接收用户输入的语音信息,检索与所述语音信息对应的多个同音词,然后根据预设的搜索特征信息库,获取每个同音词与用户搜索需求的相似度,其中,所述搜索特征信息库包括:至少一个搜索特征,以及对应的数学模型;最后根据所述相似度和预设的相似度计算策略,确定与所述用户搜索需求对应的搜索词,以便根据所述搜索词进行信息检索。由此,实现了根据用户自身的搜索需求进行智能识别,满足用户的个性化需求节约了处理资源,减少了用户的搜索时间,提高了处理效率和用户体验度。
图4是本申请另一个实施例的同音词的语音搜索处理装置的结构示意图,如图4所示,基于图3所示实施例,
所述检索模块11包括:
识别单元111,用于识别所述语音信息的音节,所述音节包括:发音音节和/或模糊音节;
查询单元112,用于查询预设的倒排索引获取与所述音节对应的多个同音词。
进一步地,获取模块12,包括:
处理单元121,用于采用与每个搜索特征对应的数学模型,处理与所述搜索特征相关的输入信息,获取与所述搜索特征对应的特征值;
生成单元122,用于根据获取的所有特征值,生成每个同音词与用户搜索需求的相似度。
进一步地,确定模块13,包括:
第一选取单元131,用于根据所述相似度筛选满足预设阈值信息的备选同音词;
第二选取单元132,用于根据与所述备选同音词对应的相似度,筛选满足预设方差信息的推荐同音词;
获取单元133,用于根据所述推荐同音词确定与所述用户搜索需求对应的搜索词。
其中,所述获取单元133,具体用于:
判断所述推荐同音词的数量是否唯一;
若判断获知所述推荐同音词唯一,则确定所述搜索词为所述推荐同音词;
若判断获知所述推荐同音词不唯一,则根据知识图谱生成与所述推荐同音词对应的推荐列表发送给所述用户,并根据所述用户的反馈信息确定所述搜索词。
需要说明的是,前述对同音词的语音搜索处理方法实施例的解释说明也适用于该实施例的同音词的语音搜索处理装置,此处不再赘述。
本申请实施例的同音词的语音搜索处理装置,首先接收用户输入的语音信息,检索与所述语音信息对应的多个同音词,然后采用与每个搜索特征对应的数学模型,处理与所述搜索特征相关的输入信息,获取与所述搜索特征对应的特征值,根据获取的所有特征值,生成每个同音词与用户搜索需求的相似度,然后根据所述相似度筛选满足预设阈值信息的备选同音词,根据与所述备选同音词对应的相似度,筛选满足预设方差信息的推荐同音词,最后根据所述推荐同音词确定与所述用户搜索需求对应的搜索词,以便根据所述搜索词进行信息检索。由此,实现了根据用户自身的搜索需求进行智能识别,满足用户的个性化需求节约了处理资源,减少了用户的搜索时间,提高了处理效率和用户体验度。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (8)

1.一种同音词的语音搜索处理方法,其特征在于,包括以下步骤:
接收用户输入的语音信息;
检索与所述语音信息对应的多个同音词;
根据预设的搜索特征信息库,获取每个同音词与用户搜索需求的相似度,其中,所述搜索特征信息库包括:多个搜索特征以及对应的数学模型,其中,所述多个搜索特征均和所述用户相关,包括搜索频次、搜索结果、搜索词发音、搜索上文,以及搜索偏好;
根据所述相似度筛选满足预设阈值信息的备选同音词;
根据与所述备选同音词对应的相似度,筛选满足预设方差信息的推荐同音词;
判断所述推荐同音词的数量是否唯一;
若判断获知所述推荐同音词不唯一,则根据知识图谱对每一个推荐同音词做实体关联,获取对应的实体标注信息和配图生成,生成与所述推荐同音词对应的推荐列表发送给所述用户,并根据所述用户的反馈信息确定所述搜索词,以便根据所述搜索词进行信息检索。
2.如权利要求1所述的同音词的语音搜索处理方法,其特征在于,所述检索与所述语音信息对应的多个同音词,包括:
识别所述语音信息的音节,所述音节包括:发音音节和/或模糊音节;
查询预设的倒排索引获取与所述音节对应的多个同音词。
3.如权利要求1所述的同音词的语音搜索处理方法,其特征在于,所述根据预设的搜索特征信息库,获取每个同音词与用户搜索需求的相似度,包括:
采用与每个搜索特征对应的数学模型,处理与所述搜索特征相关的输入信息,获取与所述搜索特征对应的特征值;
根据获取的所有特征值,生成每个同音词与用户搜索需求的相似度。
4.如权利要求1所述的方法,其特征在于,在所述判断所述推荐同音词的数量是否唯一之后,还包括:
若判断获知所述推荐同音词唯一,则确定所述搜索词为所述推荐同音词。
5.一种同音词的语音搜索处理装置,其特征在于,包括:
检索模块,用于接收用户输入的语音信息,检索与所述语音信息对应的多个同音词;
获取模块,用于根据预设的搜索特征信息库,获取每个同音词与用户搜索需求的相似度,其中,所述搜索特征信息库包括:多个搜索特征,以及对应的数学模型,其中,所述多个搜索特征均和所述用户相关,包括搜索频次、搜索结果、搜索词发音、搜索上文,以及搜索偏好;
确定模块,用于根据所述相似度筛选满足预设阈值信息的备选同音词,根据与所述备选同音词对应的相似度,筛选满足预设方差信息的推荐同音词,判断所述推荐同音词的数量是否唯一,若判断获知所述推荐同音词不唯一,则根据知识图谱对每一个推荐同音词做实体关联,获取对应的实体标注信息和配图生成,生成与所述推荐同音词对应的推荐列表发送给所述用户,并根据所述用户的反馈信息确定所述搜索词,以便根据所述搜索词进行信息检索。
6.如权利要求5所述的同音词的语音搜索处理装置,其特征在于,所述检索模块包括:
识别单元,用于识别所述语音信息的音节,所述音节包括:发音音节和/或模糊音节;
查询单元,用于查询预设的倒排索引获取与所述音节对应的多个同音词。
7.如权利要求5所述的同音词的语音搜索处理装置,其特征在于,所述获取模块,包括:
处理单元,用于采用与每个搜索特征对应的数学模型,处理与所述搜索特征相关的输入信息,获取与所述搜索特征对应的特征值;
生成单元,用于根据获取的所有特征值,生成每个同音词与用户搜索需求的相似度。
8.如权利要求5所述的同音词的语音搜索处理装置,其特征在于,所述确定模块,还用于:
若判断获知所述推荐同音词唯一,则确定所述搜索词为所述推荐同音词。
CN201510580634.3A 2015-09-11 2015-09-11 同音词的语音搜索处理方法及装置 Active CN105279227B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510580634.3A CN105279227B (zh) 2015-09-11 2015-09-11 同音词的语音搜索处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510580634.3A CN105279227B (zh) 2015-09-11 2015-09-11 同音词的语音搜索处理方法及装置

Publications (2)

Publication Number Publication Date
CN105279227A CN105279227A (zh) 2016-01-27
CN105279227B true CN105279227B (zh) 2020-07-28

Family

ID=55148241

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510580634.3A Active CN105279227B (zh) 2015-09-11 2015-09-11 同音词的语音搜索处理方法及装置

Country Status (1)

Country Link
CN (1) CN105279227B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106205613B (zh) * 2016-07-22 2019-09-06 广州市迈图信息科技有限公司 一种导航语音识别方法及系统
CN106653006B (zh) * 2016-11-17 2019-11-08 百度在线网络技术(北京)有限公司 基于语音交互的搜索方法和装置
CN108132952B (zh) * 2016-12-01 2022-03-15 百度在线网络技术(北京)有限公司 一种基于语音识别的主动型搜索方法和装置
CN109213777A (zh) * 2017-06-29 2019-01-15 杭州九阳小家电有限公司 一种基于语音的食谱处理方法及系统
CN109599097B (zh) * 2017-09-30 2022-10-18 北京国双科技有限公司 一种同音词定位的方法及装置
CN111161706A (zh) * 2018-10-22 2020-05-15 阿里巴巴集团控股有限公司 交互方法、装置、设备和系统
CN109524008A (zh) * 2018-11-16 2019-03-26 广东小天才科技有限公司 一种语音识别方法、装置及设备
CN110660384B (zh) * 2019-10-14 2022-03-22 内蒙古工业大学 一种基于端到端的蒙古语异形同音词声学建模方法
CN111125310A (zh) * 2019-12-24 2020-05-08 北京百度网讯科技有限公司 语音查询方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102609455A (zh) * 2012-01-12 2012-07-25 北京中科大洋科技发展股份有限公司 一种实现汉语同音字检索的方法
CN104239459A (zh) * 2014-09-02 2014-12-24 百度在线网络技术(北京)有限公司 语音搜索方法、装置和系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08263472A (ja) * 1995-03-28 1996-10-11 Toshiba Corp 文章検索方法及び装置
GB0709574D0 (en) * 2007-05-18 2007-06-27 Aurix Ltd Speech Screening
CN101697109A (zh) * 2009-10-26 2010-04-21 北京搜狗科技发展有限公司 一种获取输入法候选项的方法及系统
CN102385619A (zh) * 2011-10-19 2012-03-21 百度在线网络技术(北京)有限公司 一种根据语音输入信息提供访问建议的方法与设备
CN104216906A (zh) * 2013-05-31 2014-12-17 大陆汽车投资(上海)有限公司 语音搜索方法和设备
CN104731918A (zh) * 2015-03-25 2015-06-24 百度在线网络技术(北京)有限公司 一种语音搜索方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102609455A (zh) * 2012-01-12 2012-07-25 北京中科大洋科技发展股份有限公司 一种实现汉语同音字检索的方法
CN104239459A (zh) * 2014-09-02 2014-12-24 百度在线网络技术(北京)有限公司 语音搜索方法、装置和系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
A chunk-based phonetic score for mobile voice search;Rohit Prabhavalkar等;《2012 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)》;20120831;全文 *
基于多词汇树的对话语音识别搜索策略;付跃文等;《软件时空》;20070424;第23卷(第9期);全文 *

Also Published As

Publication number Publication date
CN105279227A (zh) 2016-01-27

Similar Documents

Publication Publication Date Title
CN105279227B (zh) 同音词的语音搜索处理方法及装置
CN108829893B (zh) 确定视频标签的方法、装置、存储介质和终端设备
KR100682897B1 (ko) 사전 업데이트 방법 및 그 장치
US9330661B2 (en) Accuracy improvement of spoken queries transcription using co-occurrence information
CN108153800B (zh) 信息处理方法、信息处理装置以及记录介质
US8321414B2 (en) Hybrid audio-visual categorization system and method
EP1349145B1 (en) System and method for providing information using spoken dialogue interface
CA2638558C (en) Topic word generation method and system
CN109726274B (zh) 问题生成方法、装置及存储介质
US11481417B2 (en) Generation and utilization of vector indexes for data processing systems and methods
JP7162648B2 (ja) マルチメディア会話からの意図発見のためのシステムおよび方法
US11468238B2 (en) Data processing systems and methods
JP2009537901A (ja) 検索による注釈付与
CN110415679B (zh) 语音纠错方法、装置、设备和存储介质
US20150293927A1 (en) Searching method and search engine
CN111090771B (zh) 歌曲搜索方法、装置及计算机存储介质
CN108121455B (zh) 识别纠正方法及装置
CN110287364B (zh) 语音搜索方法、系统、设备及计算机可读存储介质
US20210133264A1 (en) Data Processing Systems and Methods
CN108710653B (zh) 一种绘本朗读点播方法、装置及系统
WO2020233381A1 (zh) 基于语音识别的服务请求方法、装置及计算机设备
KR102285232B1 (ko) 형태소 기반 ai 챗봇 및 그의 문장의도 결정 방법
CN114550718A (zh) 热词语音识别方法、装置、设备与计算机可读存储介质
CN108899016B (zh) 一种语音文本规整方法、装置、设备及可读存储介质
CN106570116B (zh) 基于人工智能的搜索结果的聚合方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant