CN111209367A - 信息查找方法、信息查找装置、电子设备及存储介质 - Google Patents
信息查找方法、信息查找装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN111209367A CN111209367A CN201911219350.6A CN201911219350A CN111209367A CN 111209367 A CN111209367 A CN 111209367A CN 201911219350 A CN201911219350 A CN 201911219350A CN 111209367 A CN111209367 A CN 111209367A
- Authority
- CN
- China
- Prior art keywords
- processed
- voice
- information
- text
- corpus
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3343—Query execution using phonetics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3334—Selection or weighting of terms from queries, including natural language queries
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/14—Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
- G10L15/142—Hidden Markov Models [HMMs]
- G10L15/144—Training of HMMs
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/16—Speech classification or search using artificial neural networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
Abstract
本公开提供了一种信息查找方法、信息查找装置、电子设备及计算机可读存储介质,属于计算机技术领域。该方法包括:在信息查找界面提供语音输入控件,通过所述语音输入控件获取用户输入的待处理语音;将所述待处理语音转换为对应的待处理文本;从预先配置的语料库中查找与所述待处理文本相似的语料关键词;获取与所述待处理文本相似的语料关键词所对应的信息,作为所述待处理语音所查找的目标信息。本公开可以高效、准确的进行信息查找。
Description
技术领域
本公开涉及计算机技术领域,尤其涉及一种信息查找方法、信息查找装置、电子设备及计算机可读存储介质。
背景技术
随着信息时代的来临,各个企业内部积累了大量的数据信息,为了进行有效决策,经常会需要在大量的信息库中进行查找和翻阅。
现有的信息查找方法,通常是通过在特定的搜索界面,手动输入文本指令信息,系统根据该文本指令信息进行查找并返回查找到的内容。然而,这种信息查找方式其过程较为复杂,当文本指令信息较为复杂、冗长时,用户在输入时可能会出现输错、漏输的情况,难以保证输入信息的准确性,进而直接影响查找结果;另外,手动输入文本指令信息的方式,根据不同长度的文本指令信息,其花费的输入时间也有所不同,当文本指令信息较长时,势必会增加信息输入的时间,影响信息查找的效率。因此,如何采取高效、准确的方法进行信息查找是现有技术亟待解决的问题。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开提供了一种信息查找方法、信息查找装置、电子设备及计算机可读存储介质,进而至少在一定程度上克服现有的信息查找方法效率低且不够准确的问题。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开的一个方面,提供一种信息查找方法,包括:在信息查找界面提供语音输入控件,通过所述语音输入控件获取用户输入的待处理语音;将所述待处理语音转换为对应的待处理文本;从预先配置的语料库中查找与所述待处理文本相似的语料关键词;获取与所述待处理文本相似的语料关键词所对应的信息,作为所述待处理语音所查找的目标信息。
在本公开的一种示例性实施例中,在将所述待处理语音转换为对应的待处理文本之前,所述方法还包括:检测所述待处理语音是否为有效语音;如果所述待处理语音为有效语音,则执行将所述待处理语音转换为对应的待处理文本的步骤;如果所述待处理语音为无效语音,则呈现提示信息。
在本公开的一种示例性实施例中,所述检测所述待处理语音是否为有效语音,包括以下任意一条或多条:检测所述待处理语音的长度是否在预设范围内;检测所述待处理语音的声纹特征是否满足预设条件;检测所述待处理语音中是否包含预设语音。
在本公开的一种示例性实施例中,所述将所述待处理语音转换为对应的待处理文本,包括:对所述待处理语音进行预处理;根据预处理后的所述待处理语音提取特征信息;将所述特征信息输入预先训练的语义识别模型,以输出对应的待处理文本。
在本公开的一种示例性实施例中,所述预处理包括以下任意一种或多种:去除噪声、声道转换、预加重、语音增强、去除空白。
在本公开的一种示例性实施例中,在将所述待处理语音转换为对应的待处理文本后,所述方法还包括:在所述信息查找界面显示所述待处理文本;响应于对所述待处理文本的修改操作,根据所述修改操作修改所述待处理文本。
在本公开的一种示例性实施例中,所述语料库通过以下方式建立:获取多个报表;提取每个所述报表的名称,以每个所述报表的名称为一组语料关键词,以及提取每个所述报表的指标,以每个所述报表的指标为一组语料关键词,建立所述语料库;所述目标信息为所述多个报表中的目标报表。
在本公开的一种示例性实施例中,所述从预先配置的语料库中查找与所述待处理文本相似的语料关键词,包括:提取所述待处理文本中的关键词,以生成所述待处理文本的关键词集;计算所述关键词集与所述语料库中每组语料关键词的相似度;分别获取与所述关键词集的相似度高于预设阈值的报表的名称和报表的指标,以作为与所述关键词集相似的语料关键词。
在本公开的一种示例性实施例中,如果存在多个与所述关键词集的相似度高于预设阈值的报表的名称或报表的指标,则获取其中与所述关键词集的相似度最高的N个报表的名称以及N个报表的指标,N为预设的正整数;在确定所述目标信息后,所述方法还包括:根据所述相似度的计算结果,将所述目标报表按照所述相似度的大小进行顺序排序,并显示于所述信息查找界面。
根据本公开的一个方面,提供一种信息查找装置,包括:语音获取模块,用于在信息查找界面提供语音输入控件,通过所述语音输入控件获取用户输入的待处理语音;文本转换模块,用于将所述待处理语音转换为对应的待处理文本;关键词查找模块,用于从预先配置的语料库中查找与所述待处理文本相似的语料关键词;信息查找模块,用于获取与所述待处理文本相似的语料关键词所对应的信息,作为所述待处理语音所查找的目标信息。
在本公开的一种示例性实施例中,信息查找装置还包括:语音检测单元,用于在将所述待处理语音转换为对应的待处理文本之前,检测所述待处理语音是否为有效语音;检测判断单元,用于如果所述待处理语音为有效语音,则执行将所述待处理语音转换为对应的待处理文本的步骤;以及如果所述待处理语音为无效语音,则呈现提示信息。
在本公开的一种示例性实施例中,所述检测所述待处理语音是否为有效语音,包括以下任意一条或多条:检测所述待处理语音的长度是否在预设范围内;检测所述待处理语音的声纹特征是否满足预设条件;检测所述待处理语音中是否包含预设语音。
在本公开的一种示例性实施例中,文本转换模块包括:预处理单元,用于对所述待处理语音进行预处理;特征提取单元,用于根据预处理后的所述待处理语音提取特征信息;特征识别单元,用于将所述特征信息输入预先训练的语义识别模型,以输出对应的待处理文本。
在本公开的一种示例性实施例中,所述预处理包括以下任意一种或多种:去除噪声、声道转换、预加重、语音增强、去除空白。
在本公开的一种示例性实施例中,信息查找装置还包括:文本显示单元,用于在将所述待处理语音转换为对应的待处理文本后,在所述信息查找界面显示所述待处理文本;文本修改单元,用于响应于对所述待处理文本的修改操作,根据所述修改操作修改所述待处理文本。
在本公开的一种示例性实施例中,所述语料库通过以下方式建立:获取多个报表;提取每个所述报表的名称,以每个所述报表的名称为一组语料关键词,以及提取每个所述报表的指标,以每个所述报表的指标为一组语料关键词,建立所述语料库;所述目标信息为所述多个报表中的目标报表。
在本公开的一种示例性实施例中,关键词查找模块包括:关键词提取单元,用于提取所述待处理文本中的关键词,以生成所述待处理文本的关键词集;相似度计算单元,用于计算所述关键词集与所述语料库中每组语料关键词的相似度;语料关键词确定单元,用于分别获取与所述关键词集的相似度高于预设阈值的报表的名称和报表的指标,以作为与所述关键词集相似的语料关键词。
在本公开的一种示例性实施例中,如果存在多个与所述关键词集的相似度高于预设阈值的报表的名称或报表的指标,则获取其中与所述关键词集的相似度最高的N个报表的名称以及N个报表的指标,N为预设的正整数;信息查找装置还包括:显示模块,用于在确定所述目标信息后,根据所述相似度的计算结果,将所述目标报表按照所述相似度的大小进行顺序排序,并显示于所述信息查找界面。
根据本公开的一个方面,提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述的方法。
根据本公开的一个方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的方法。
本公开的示例性实施例具有以下有益效果:
信息查找界面提供语音输入控件,通过语音输入控件获取用户输入的待处理语音,将待处理语音转换为对应的待处理文本,从预先配置的语料库中查找与待处理文本相似的语料关键词,获取与待处理文本相似的语料关键词所对应的信息,作为待处理语音所查找的目标信息。一方面,能够使用户脱离对手动输入设备的依赖,仅通过语音即可进行信息查找,特别是的,在智能化的语音报表查找的应用场景中,用户通过语音命令即可以远程获取数据库中所需的报表及相关信息,节省了大量时间,提高了信息查找的效率;另一方面,本示例性实施例通过结合各个应用场景的差异性和多样性,预先配置关于信息的语料库,并基于语料关键词与其对应信息的关系,通过语料关键词进行信息查找,能够更为准确的确定用户需要查找的信息,提高了信息查找的准确性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示意性示出本示例性实施例中一种信息查找方法的流程图;
图2示意性示出本示例性实施例中一种对待处理语音进行处理的流程图;
图3示意性示出本示例性实施例中一种信息查找方法的子流程图;
图4示意性示出本示例性实施例中语料库建立的流程图;
图5示意性示出本示例性实施例中另一种信息查找方法的流程图;
图6示意性示出本示例性实施例中再一种信息查找方法的流程图;
图7示意性示出本示例性实施例中一种信息查找装置的结构框图;
图8示意性示出本示例性实施例中一种用于实现上述方法的电子设备;
图9示意性示出本示例性实施例中一种用于实现上述方法的计算机可读存储介质。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。
本公开的示例性实施例首先提供了一种信息查找方法,其中,信息可以是企业内部的表报信息或者员工基本信息等。本实施例方法的应用场景可以是:企业中,员工查找业务报表时,输入包含报表名称的语音,即可以查找到对应的报表内容;社交平台中,用户查找其他用户信息时,通过输入包含其他用户昵称或ID(Identify,账号)的标识的语音,即可以查找其他用户的具体信息等。
下面结合附图1对本示例性实施例做进一步说明,如图1所示,信息查找方法可以包括以下步骤S110~S140:
步骤S110,在信息查找界面提供语音输入控件,通过语音输入控件获取用户输入的待处理语音。
其中,信息查找界面是指用于呈现信息查找功能的页面,例如搜索引擎网站、App(Application,应用程序)或网页中含有搜索对话框的界面等。语音输入控件是指用于触发接收用户输入语音的控件,通常,其可以以文本选项或图标按钮的形式进行展示。待处理语音是指需要进行处理的,以实现信息查找的语音,其中,可以包括关于被查找的信息的语音指令,例如“查找1月份的财务报表”,“查找上个月xx的销售明细”等;也可以仅包括被查找的信息的语音关键词,例如“财务报表”,“业务销售报表”等。在本示例性实施例中,用户可以通过语音输入控件输入语音信息,具体的,用户可以通过点击或长按语音输入控件,激活语音接收状态录入待处理语音,使得服务器获取待处理语音,从而根据待处理语音进行信息查找。
步骤S120,将待处理语音转换为对应的待处理文本。
在本示例性实施例中,为了便于获取的待处理语音的准确性,进一步提高信息查找的有效性,可以将待处理语音转换为对应的待处理文本,并将其显示于信息查找界面,使用户可以检验录入的语音是否与其希望录入的语音一致。另外,考虑到待处理语音中可能会包含很多无用的信息,例如空白语音、或噪声比较大的语音等。在将待处理语音转换为对应的待处理文本时,为了能够有效捕获有效信息,减少服务器对无效信息的处理,提高了信息查找的效率。本示例性实施例还可以对待处理语音进行预处理,并将预处理后的待处理语音转换为仅包含有效信息的待处理文本,使信息查找过程更具针对性。将待处理文本转换为待处理语音可以采用模式匹配法,在训练阶段,将收集到的用户语音词汇的特征矢量作为模板存入模板库,在识别阶段,将输入的待处理语音的特征矢量依次与模板库中的每个模板进行比较,以输出语音识别的结果;也可以利用语音文本转换工具实现转换等,本公开对此不做具体限定。
步骤S130,从预先配置的语料库中查找与待处理文本相似的语料关键词。
考虑到各个企业内部其业务产品的多样化,以及产品间业务的差异化、共现性,各产品、各渠道、各事业部以及各个业务环节等方面的不同业务环节中会贯穿部分相似的属性信息。为了更好的将他们之间的关联度进行良好呈现,本示例性实施例可以将全部或部分信息的关键属性信息存入一特定语料库中,建立信息与关键属性信息之间的关系知识图谱。其中,关键属性信息可以视为语料关键词,例如报表信息的名称或指标等。在配置完成语料库之后,本示例性实施例可以根据待处理文本中包括的全部或部分信息,与语料关键词进行相似度计算,以确定哪一语料关键词与待处理文本较为相似,进一步可以确定该语料关键词所对应的信息。其中,计算确定待处理文本与语料关键词是否相似,可以通过多种方式,例如将待处理文本与语料关键词进行向量化处理,并通过余弦相似度计算其相似度大小;也可以直接计算待处理文本与语料关键词的错字比例,通过计算结果确定两者之间的相似度等等,本领域技术人员可以想到的其他用于确定待处理文本与预料关键词之间相似度的方式,也应当包含在本公开的保护范围内。
步骤S140,获取与待处理文本相似的语料关键词所对应的信息,作为待处理语音所查找的目标信息。
其中,目标信息即根据待处理语音查找得到的信息,例如最终需要查找的报表信息或某用户信息等。在本示例性实施例中,可以根据语料关键词确定对应的目标信息,例如语料关键词为“费用清单报表”的报表名称,则根据该报表名称,可以获取对应的费用清单报表等等。在本示例性实施例中,目标信息可以是多个信息中的某一条信息,例如相似度最高的语料关键词对应的信息,也可以是预设数量的信息,例如相似度排序前十位的语料关键词对应的信息等,目标信息的数量可以根据需要进行自定义设备,本公开对此不做具体限定。
基于上述说明,在本示例性实施例中,在信息查找界面提供语音输入控件,通过语音输入控件获取用户输入的待处理语音,将待处理语音转换为对应的待处理文本,从预先配置的语料库中查找与待处理文本相似的语料关键词,获取与待处理文本相似的语料关键词所对应的信息,作为待处理语音所查找的目标信息。一方面,能够使用户脱离对手动输入设备的依赖,仅通过语音即可进行信息查找,特别是的,在智能化的语音报表查找的应用场景中,用户通过语音命令即可以远程获取数据库中所需的报表及相关信息,节省了大量时间,提高了信息查找的效率;另一方面,本示例性实施例通过结合各个应用场景的差异性和多样性,预先配置关于信息的语料库,并基于语料关键词与其对应信息的关系,通过语料关键词进行信息查找,能够更为准确的确定用户需要查找的信息,提高了信息查找的准确性。
在一示例性实施例中,在将待处理语音转换为对应的待处理文本之前,信息查找方法还包括以下步骤:
检测待处理语音是否为有效语音;
如果待处理语音为有效语音,则执行将待处理语音转换为对应的待处理文本的步骤;
如果待处理语音为无效语音,则呈现提示信息。
由于获取的待处理语音可能不完全都需要进行处理,例如用户误触而录入的语音,或者空白语音等。因此,为了避免对非必要的语音进行处理,提高信息的查找效率,本示例性实施例在前端设置有语音接收器,通过语音接收器接收待处理语音之后,在将其转换为待处理文本之前,可以设置检测机制,以判断待处理语音是否为有效语音,即对获取的待处理语音进行规范化约定或判断,使待处理语音仅包含与信息相关的内容,不支持聊天功能等,以此对无效语音进行过滤。例如设置有效语音为与信息相关的中文语音,则待处理语音为非中文或者是与信息不相关的内容时,即可以判断其为无效语音,并呈现提示信息。其中,提示信息可以是用以提示用户输入有误或需要重新输入语音信息的内容等,提示信息的显示形式本公开对此不做具体限定。
在一示例性实施例中,检测待处理语音是否为有效语音,包括以下任意一条或多条:
(1)检测待处理语音的长度是否在预设范围内;
(2)检测待处理语音的声纹特征是否满足预设条件;
(3)检测待处理语音中是否包含预设语音。
在本示例性实施例中,可以设置上述3条中的一条或多条检测标准,以过滤无效语音。其中,考虑到过短的待处理语音可能是由误输入造成的,导致无意义的验证,影响服务器的工作效率,可以设置一个待处理语音的预设范围,以滤除上述情况,该预设范围可以是时长范围,也可以是文件大小范围等。例如将预设范围设置为大于两秒,不足两秒的待处理语音将被服务器自动过滤;又例如将预设范围设置为大于5KB,则小于5KB的待处理语音也将自动被服务器过滤等。本示例性实施例还可以根据待处理语音的声纹特征进行过滤,将符合预设条件的声纹特征确定为待处理语音,例如预设条件可以是,通过声纹匹配的方式确定获取的待处理语音中含有特定的声纹信息,从而确定待处理语音中包含特定的信息关键词等。预设语音可以是指与语料库中的信息相关的语音,即可以认为预设语音为与语料库中的信息相关的语音,可以是预先录入的语料库中所有信息的语音,例如信息名称或信息属性等。通过匹配,可以确定待处理语音中是否包含预设语音,如果待处理语音中不包含预设语音,可以认为获取的待处理语音与信息无关,进而无需对其进行处理。
在一示例性实施例中,步骤S120可以包括以下步骤:
对待处理语音进行预处理;
根据预处理后的待处理语音提取特征信息;
将特征信息输入预先训练的语义识别模型,以输出对应的待处理文本。
考虑到服务器获取的待处理语音可能包含了其他噪声等影响因素,对待处理语音的处理和识别造成一定的障碍,例如个体发音差异导致的同一语义下不同的语音处理结果,或环境嘈杂导致获取的语音不清晰等等。基于此,在将待处理语音转换为待处理文本时,可以对待处理语音进行预处理。预处理可以包括对待处理语音进行采样、克服混叠滤波、去除部分由个体发音的差异和环境引起的噪声影响,此外,还会考虑到语音识别基本单元的选取和端点检测问题。具体的,可以通过反复训练的方式,从原始的待处理语音中去除冗余信息,保留关键信息,再按照一定规则对语音进行整理。
进一步的,服务器根据预处理后的待处理语音,提取能够反映待处理语音中的关键信息和表达的语言含义特征信息,其可以是待处理语音中的最小单元识别字词。需要说明的是,考虑到语音信号的可阅读性、编码以及认知的特点,即语音信号中的语言信息编码是按照幅度谱的时间变化来进行的;语音是可以阅读的,也就是说声学信号可以在不考虑说话人说话传达的信息内容的前提下用多个具有区别性的、离散的符号来表示;以及语音的交互是一个认知过程,不能与语法、语义和用语规范等方面分裂开来。因此,在特征信息的提取和识别时,可以提取影响语音识别的关键信息和表达语言含义的特征信息,采用最小单元识别字词,紧扣特征信息,并且按照不同语言的各自语法,依照先后次序识别字词,将前后语境的意思当作辅助识别和分析条件,必要时,按照语义的分析结果,为关键信息划分段落,并将提取出的字词连接起来,根据语句意思调整句子的构成,最后结合语义,仔细分析上下文的相互联系,对当前正在处理的待处理语音进行适当修正。
实际应用时,可能会出现获取的待处理语音不清晰或不完整等情况,进而对信息查找造成影响。因此,本示例性实施例可以通过建立语义理解的规则库,训练机器学习模型,预测待处理语音的语义,以对待处理语音进行修正和完成,转化为对应的文本,例如待处理语音包含的文本信息可能为“健康诉清单”,则通过机器学习模型的分析与处理,对其进行完善可以得到“健康投诉清单”等等。具体可以通过HMM(Hidden Markov Model,隐马尔可夫)模型、RNN(Recurrent Neural Network,循环神经网络)模型以及Viterbi-Beam(维特比)等算法对语音进行训练,通过识别待处理语音中的关键信息,预测出其中最想表达的意思。此外,还可以采用其他多种机器学习模型或算法对待处理语音进行处理,本公开对此不做具体限定。
图2示出了本示例性实施例中一种待处理语音处理方法的流程图,具体可以包括以下步骤:
步骤S210,通过语音输入控件获取用户输入的待处理语音;
步骤S220,对待处理语音进行噪声抑制处理;
步骤S230,提取待处理语音中的特征信息,并进行特征补充;
步骤S240,进行声纹匹配。
其中,在步骤S240中,进行声纹匹配,具体的,可以执行步骤S241,通过语言模型对文本数据进行处理,以及步骤S242,通过声纹模型对语音噪声数据进行处理等方式。在进行声纹匹配后,可以将待处理语音转换为对应的待处理文本,并计算其与语料关键词的相似度,进一步查找相似的语料关键词所对应的目标信息。
在一示例性实施例中,预处理包括以下任意一种或多种:去除噪声、声道转换、预加重、语音增强、去除空白。
其中,声道转换处理是指如果所要提取的待处理语音的语音特征不区分声道,则可以将多声道的待处理语音转换为单声道;预加重处理可以是保留待处理语音一定频率范围内的语音信号,有利于服务器对待处理语音信息的分析;语音增强处理可以是从待处理语音中滤除噪音,以提取纯净的语音信号;去除空白处理是指去除待处理语音中无实际信号的片段,例如用户在输入待处理语音的过程中被打断或思考的情况下,待处理语音可能存在噪声或其他空白的无效语音片段,去除空白处理也可以减小待处理语音的时长与文件大小,降低服务器的处理量。当外界噪声过大时,例如用户在人流量较多或受其他音响设备影响的情况下,对待处理语音进行处理之前,还可以通过语音活动检测来判断待处理语音中是否存在可以处理的语音信息,如果不存在则无需对其进行待处理文本的转换。此外,本领域技术人员容易想到的其他预处理方式也应当包含在本公开的保护范围内。
在一示例性实施例中,在上述步骤S120之后,信息查找方法还可以包括以下步骤:
在信息查找界面显示待处理文本;
响应于对待处理文本的修改操作,根据修改操作修改待处理文本。
待处理语音在转换为对应的待处理文本时,由于待处理语音的多样性,可能会出现转换不准确的情况,因此,本示例性实施例可以设置修改机制,在生成待处理文本后,将其呈现在信息查找界面内,以使用户根据呈现的内容,确定其是否为需要查找的信息。如果转换过程出现问题,还可以通过用户进行修正,修改操作可以是对待处理文本进行整体修改,也可以是根据需要进行针对性的局部修改,系统根据用户的修改操作可以调整待处理文本,以完善其准确性。本示例性实施例可以在使用语音识别进行信息查找的基础上,再次复查其查找信息的准确性,相比原始的键盘输入所有的内容更能节省时间,同时也可以提高识别的准确率和有效性。
图3示出了本示例性实施例中一种信息查找方法的子流程图,具体包括以下步骤:
步骤S310,获取用户输入的待处理语音;
步骤S320,对待处理语音进行预处理
步骤S330,根据预处理后的待处理语音提取特征信息;
步骤S340,将特征信息输入机器学习模型进行处理,得到待处理文本的输出结果;
步骤S350,将待处理文本显示于信息查找界面;
步骤S360,检测是否接收到待处理文本的修改操作;
步骤S370,如果接收到修改操作,则根据修改操作修改待处理文本;
步骤S380,显示修改后的待处理文本,并根据待处理文本在预先配置的语料库中进行查找。
需要说明的是,在步骤S350中,将待处理文本显示于信息查找界面后,用户发现信息有误,除了可以执行步骤S370,接收用户的修改操作,对待处理文本进行修改,还可以执行步骤S310,重新获取用户输入的待处理语音。
在一示例性实施例中,如图4所示,语料库通过以下方式建立:
步骤S410,获取多个报表;
步骤S420,提取每个报表的名称,以每个报表的名称为一组语料关键词,以及提取每个报表的指标,以每个报表的指标为一组语料关键词,建立语料库;
目标信息为多个报表中的目标报表。
在本示例性实施例中,目标信息可以是目标报表,例如BI(BusinessIntelligence,商业智能)报表,用户可以通过本示例性实施例,根据输入的待处理语音从BI报表系统中筛选出最想看到的报表,有利于提高业务及运营同事的工作效率,节省大量时间。通常每一个报表都具有其对应的报表名称,特别的,某些报表名称还可能表示同一报表,例如“大健康理赔清单”、“大健康”、“理赔清单”,这三个报表名称表示同一报表。因此,本示例性实施例可以将表示同一报表的名称作为一组语料关键词。另外,不同类型的报表之间,根据其报表类型,所包含的指标可能也有所不同,因此,还可以通过指标来确定所要查找的目标报表,在将指标作为语料关键词时,同理,可以将表示相同含义的指标作为一组语料关键词,以此建立语料库。
在一示例性实施例中,上述步骤S130可以包括以下步骤:
提取待处理文本中的关键词,以生成待处理文本的关键词集;
计算关键词集与语料库中每组语料关键词的相似度;
分别获取与关键词集的相似度高于预设阈值的报表的名称和报表的指标,以作为与关键词集相似的语料关键词。
在本示例性实施例中,可以通过提取待处理文本中的关键词,建立关键词集,例如待处理文本为“查询1月份的大健康投诉清单”,可以提取报表名称“大健康投诉清单”、如果待处理文本中包含指标信息,则可以提取报表指标等,基于此,建立关键词集。进一步计算关键词集与语料库中每组语料关键词的相似度,为了便于计算,本示例性实施例可以将关键词集中的各关键词,与每组语料关键词进行向量化处理,然后计算向量之间的相似度。其中,相似度可以通过多种方法确定,例如通过计算欧几里得距离、曼哈顿距离、明可夫斯基距离或余弦相似度等方法,距离或角度越小,则说明相似度越高。以余弦相似度为例,可以通过以下公式计算其相似度大小:
其中,A为关键词集中的关键词向量,B为语料库中的语料关键词的向量。
在一示例性实施例中,如果存在多个与关键词集的相似度高于预设阈值的报表的名称或报表的指标,则获取其中与关键词集的相似度最高的N个报表的名称以及N个报表的指标,N为预设的正整数;
在确定目标信息后,信息查找方法还可以包括:
根据相似度的计算结果,将目标报表按照相似度的大小进行顺序排序,并显示于信息查找界面。
其中,预设阈值是指,用于确定查找到的信息是否能够显示与信息查找界面的条件,当报表的名臣或报表的指标与关键词集的相似度高于预设阈值,则确定其可以显示与信息查找界面。另外,还可以根据相似度大小,对查找到的报表进行排序,根据排序结果确定将N个报表进行显示,例如将相似度排序前十位的报表显示于信息查找界面等等。本示例性实施例可以在根据输入的待处理语音查找到与其相关的多个报表,使用户在浏览其查找的报表的同时,还能看到其他相关的报表,一方面保证信息查找的准确性,另一方面,为用户提供了更多的信息展示空间,有利于用户根据查找到的信息进行决策。
图5示出了本示例性实施例中一种信息查找方法的子流程图,具体可以包括以下步骤:
步骤S510,识别待处理文本,并提取待处理文本中的关键词;
步骤S520,根据提取的关键词,生成待处理文本的关键词集;
步骤S530,对关键词集中的关键词进行向量化处理;
步骤S540,判断关键词集中的关键词是否匹配到关于报表的名称和报表的指标的语料关键词;
步骤S550,如果匹配到报表的名称,则计算关键词集与报表的名称的相似度,以确定目标报表;
步骤S560,如果匹配到报表的指标,则计算关键词集与报表的指标的相似度,以确定目标报表;
步骤S570,对查找到的目标报表,根据计算的相似度结果进行顺序排序;
步骤S580,根据相似度的排序结果,确定最终显示于信息查找界面的目标报表。
在本示例性实施例中,还可以通过采用TF-IDF(term frequency–inversedocument frequency,词频-逆文本频率指数)算法,确定待处理文本中的关键词,由于TF-IDF算法可以评估字词对于词集或语料库中的其中词语的重要程度,因此,可以在关键词集中有效确定需要进行相似度计算的关键词。
图6示出了本示例性实施例中另一种信息查找方法的流程图,具体可以包括:
步骤S610,在信息查找界面提供语音输入控件,通过语音输入控件获取用户输入的待处理语音;
步骤S620,检测待处理语音是否为有效语音;
步骤S630,如果待处理语音为有效语音,则将待处理语音转换为对应的待处理文本;
如果待处理语音为无效语音,则执行步骤S610,重新获取用户输入的待处理语音;
步骤S640,将转换的待处理文本显示于信息查找界面,并检测待处理文本是否接收到修改操作;
步骤S641,如果待处理文本接收到修改操作,则根据修改操作修改待处理文本;
步骤S650,显示修改后的待处理文本,并提取待处理文本中的关键词,以生成待处理文本的关键词集;
步骤S660,计算关键词集与语料库中每组语料关键词的相似度;其中,可以通过步骤S661建立上述语料库,具体可以通过图4的步骤进行;
步骤S670,分别获取与关键词集的相似度高于预设阈值的报表的名称和报表的指标,以作为与关键词集相似的语料关键词;
步骤S680,获取与待处理文本相似的语料关键词所对应的信息,作为待处理语音所查找的目标信息;
步骤S690,根据相似度的计算结果,将目标报表按照相似度的大小进行顺序排序,并将排序前N的目标报表显示于信息查找界面。
本公开的示例性实施例还提供了一种信息查找装置。参照图7,该装置700可以包括:语音获取模块710,用于在信息查找界面提供语音输入控件,通过语音输入控件获取用户输入的待处理语音;文本转换模块720,用于将待处理语音转换为对应的待处理文本;关键词查找模块730,用于从预先配置的语料库中查找与待处理文本相似的语料关键词;信息查找模块740,用于获取与待处理文本相似的语料关键词所对应的信息,作为待处理语音所查找的目标信息。
在一示例性实施例中,信息查找装置还可以包括:语音检测单元,用于在将待处理语音转换为对应的待处理文本之前,检测待处理语音是否为有效语音;检测判断单元,用于如果待处理语音为有效语音,则执行将待处理语音转换为对应的待处理文本的步骤;以及如果待处理语音为无效语音,则呈现提示信息。
在一示例性实施例中,检测待处理语音是否为有效语音,可以包括以下任意一条或多条:检测待处理语音的长度是否在预设范围内;检测待处理语音的声纹特征是否满足预设条件;检测待处理语音中是否包含预设语音。
在一示例性实施例中,文本转换模块可以包括:预处理单元,用于对待处理语音进行预处理;特征提取单元,用于根据预处理后的待处理语音提取特征信息;特征识别单元,用于将特征信息输入预先训练的语义识别模型,以输出对应的待处理文本。
在一示例性实施例中,预处理可以包括以下任意一种或多种:去除噪声、声道转换、预加重、语音增强、去除空白。
在一示例性实施例中,信息查找装置还可以包括:文本显示单元,用于在将待处理语音转换为对应的待处理文本后,在信息查找界面显示待处理文本;文本修改单元,用于响应于对待处理文本的修改操作,根据修改操作修改待处理文本。
在一示例性实施例中,语料库可以通过以下方式建立:获取多个报表;提取每个报表的名称,以每个报表的名称为一组语料关键词,以及提取每个报表的指标,以每个报表的指标为一组语料关键词,建立语料库;目标信息为多个报表中的目标报表。
在一示例性实施例中,关键词查找模块可以包括:关键词提取单元,用于提取待处理文本中的关键词,以生成待处理文本的关键词集;相似度计算单元,用于计算关键词集与语料库中每组语料关键词的相似度;语料关键词确定单元,用于分别获取与关键词集的相似度高于预设阈值的报表的名称和报表的指标,以作为与关键词集相似的语料关键词。
在一示例性实施例中,如果存在多个与关键词集的相似度高于预设阈值的报表的名称或报表的指标,则获取其中与关键词集的相似度最高的N个报表的名称以及N个报表的指标,N为预设的正整数;信息查找装置还可以包括:显示模块,用于在确定目标信息后,根据相似度的计算结果,将目标报表按照相似度的大小进行顺序排序,并显示于信息查找界面。
上述装置中各模块/单元的具体细节在方法部分的实施例中已经详细说明,未披露的细节内容可以参见方法部分的实施例内容,因此此处不再赘述。
本公开的示例性实施例还提供了一种能够实现上述方法的电子设备。
所属技术领域的技术人员能够理解,本公开的各个方面可以实现为系统、方法或程序产品。因此,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为―电路”、―模块”或―系统”。
下面参照图8来描述根据本公开的这种示例性实施例的电子设备800。图8显示的电子设备800仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图8所示,电子设备800以通用计算设备的形式表现。电子设备800的组件可以包括但不限于:上述至少一个处理单元810、上述至少一个存储单元820、连接不同系统组件(包括存储单元820和处理单元810)的总线830、显示单元840。
其中,存储单元存储有程序代码,程序代码可以被处理单元810执行,使得处理单元810执行本说明书上述―示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。例如,处理单元810可以执行图1所示的步骤S110~S140,也可以执行图2~图6所示的步骤。
存储单元820可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)821和/或高速缓存存储单元822,还可以进一步包括只读存储单元(ROM)823。
存储单元820还可以包括具有一组(至少一个)程序模块825的程序/实用工具824,这样的程序模块825包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线830可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备800也可以与一个或多个外部设备1000(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备800交互的设备通信,和/或与使得该电子设备800能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口850进行。并且,电子设备800还可以通过网络适配器860与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器860通过总线830与电子设备800的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备800使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开示例性实施例的方法。
本公开的示例性实施例还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中,本公开的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上运行时,程序代码用于使终端设备执行本说明书上述―示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。
参考图9所示,描述了根据本公开的示例性实施例的用于实现上述方法的程序产品900,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本公开的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如―C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
此外,上述附图仅是根据本公开示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的示例性实施例,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其他实施例。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限。
Claims (10)
1.一种信息查找方法,其特征在于,包括:
在信息查找界面提供语音输入控件,通过所述语音输入控件获取用户输入的待处理语音;
将所述待处理语音转换为对应的待处理文本;
从预先配置的语料库中查找与所述待处理文本相似的语料关键词;
获取与所述待处理文本相似的语料关键词所对应的信息,作为所述待处理语音所查找的目标信息。
2.根据权利要求1所述的方法,其特征在于,在将所述待处理语音转换为对应的待处理文本之前,所述方法还包括:
检测所述待处理语音是否为有效语音;
如果所述待处理语音为有效语音,则执行将所述待处理语音转换为对应的待处理文本的步骤;
如果所述待处理语音为无效语音,则呈现提示信息。
3.根据权利要求2所述的方法,其特征在于,所述检测所述待处理语音是否为有效语音,包括以下任意一条或多条:
检测所述待处理语音的长度是否在预设范围内;
检测所述待处理语音的声纹特征是否满足预设条件;
检测所述待处理语音中是否包含预设语音。
4.根据权利要求1所述的方法,其特征在于,所述将所述待处理语音转换为对应的待处理文本,包括:
对所述待处理语音进行预处理;
根据预处理后的所述待处理语音提取特征信息;
将所述特征信息输入预先训练的语义识别模型,以输出对应的待处理文本。
5.根据权利要求1所述的方法,其特征在于,所述语料库通过以下方式建立:
获取多个报表;
提取每个所述报表的名称,以每个所述报表的名称为一组语料关键词,以及提取每个所述报表的指标,以每个所述报表的指标为一组语料关键词,建立所述语料库;
所述目标信息为所述多个报表中的目标报表。
6.根据权利要求5所述的方法,其特征在于,所述从预先配置的语料库中查找与所述待处理文本相似的语料关键词,包括:
提取所述待处理文本中的关键词,以生成所述待处理文本的关键词集;
计算所述关键词集与所述语料库中每组语料关键词的相似度;
分别获取与所述关键词集的相似度高于预设阈值的报表的名称和报表的指标,以作为与所述关键词集相似的语料关键词。
7.根据权利要求6所述的方法,其特征在于,如果存在多个与所述关键词集的相似度高于预设阈值的报表的名称或报表的指标,则获取其中与所述关键词集的相似度最高的N个报表的名称以及N个报表的指标,N为预设的正整数;
在确定所述目标信息后,所述方法还包括:
根据所述相似度的计算结果,将所述目标报表按照所述相似度的大小进行顺序排序,并显示于所述信息查找界面。
8.一种信息查找装置,其特征在于,包括:
语音获取模块,用于在信息查找界面提供语音输入控件,通过所述语音输入控件获取用户输入的待处理语音;
文本转换模块,用于将所述待处理语音转换为对应的待处理文本;
关键词查找模块,用于从预先配置的语料库中查找与所述待处理文本相似的语料关键词;
信息查找模块,用于获取与所述待处理文本相似的语料关键词所对应的信息,作为所述待处理语音所查找的目标信息。
9.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911219350.6A CN111209367A (zh) | 2019-12-03 | 2019-12-03 | 信息查找方法、信息查找装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911219350.6A CN111209367A (zh) | 2019-12-03 | 2019-12-03 | 信息查找方法、信息查找装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111209367A true CN111209367A (zh) | 2020-05-29 |
Family
ID=70787984
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911219350.6A Pending CN111209367A (zh) | 2019-12-03 | 2019-12-03 | 信息查找方法、信息查找装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111209367A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112100357A (zh) * | 2020-09-24 | 2020-12-18 | 腾讯科技(深圳)有限公司 | 引导语的生成方法及装置、电子设备、计算机存储介质 |
CN112328738A (zh) * | 2020-10-10 | 2021-02-05 | 中国农业银行股份有限公司河北省分行 | 语音检索方法、终端设备及可读存储介质 |
CN113051380A (zh) * | 2021-03-23 | 2021-06-29 | 北京百度网讯科技有限公司 | 信息生成方法、装置、电子设备和存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109147793A (zh) * | 2018-08-17 | 2019-01-04 | 南京星邺汇捷网络科技有限公司 | 语音数据的处理方法、装置及系统 |
CN109920414A (zh) * | 2019-01-17 | 2019-06-21 | 平安城市建设科技(深圳)有限公司 | 人机问答方法、装置、设备和存储介质 |
CN110347784A (zh) * | 2019-05-23 | 2019-10-18 | 深圳壹账通智能科技有限公司 | 报表查询方法、装置、存储介质及电子设备 |
-
2019
- 2019-12-03 CN CN201911219350.6A patent/CN111209367A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109147793A (zh) * | 2018-08-17 | 2019-01-04 | 南京星邺汇捷网络科技有限公司 | 语音数据的处理方法、装置及系统 |
CN109920414A (zh) * | 2019-01-17 | 2019-06-21 | 平安城市建设科技(深圳)有限公司 | 人机问答方法、装置、设备和存储介质 |
CN110347784A (zh) * | 2019-05-23 | 2019-10-18 | 深圳壹账通智能科技有限公司 | 报表查询方法、装置、存储介质及电子设备 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112100357A (zh) * | 2020-09-24 | 2020-12-18 | 腾讯科技(深圳)有限公司 | 引导语的生成方法及装置、电子设备、计算机存储介质 |
CN112328738A (zh) * | 2020-10-10 | 2021-02-05 | 中国农业银行股份有限公司河北省分行 | 语音检索方法、终端设备及可读存储介质 |
CN113051380A (zh) * | 2021-03-23 | 2021-06-29 | 北京百度网讯科技有限公司 | 信息生成方法、装置、电子设备和存储介质 |
CN113051380B (zh) * | 2021-03-23 | 2023-07-25 | 北京百度网讯科技有限公司 | 信息生成方法、装置、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10192545B2 (en) | Language modeling based on spoken and unspeakable corpuses | |
CN110096570B (zh) | 一种应用于智能客服机器人的意图识别方法及装置 | |
CN108428446B (zh) | 语音识别方法和装置 | |
CN109493850B (zh) | 成长型对话装置 | |
US9330661B2 (en) | Accuracy improvement of spoken queries transcription using co-occurrence information | |
US20190163691A1 (en) | Intent Based Dynamic Generation of Personalized Content from Dynamic Sources | |
CN105931644B (zh) | 一种语音识别方法及移动终端 | |
US6681206B1 (en) | Method for generating morphemes | |
EP1617409B1 (en) | Multimodal method to provide input to a computing device | |
US20130185059A1 (en) | Method and System for Automatically Detecting Morphemes in a Task Classification System Using Lattices | |
WO2020216064A1 (zh) | 语音情感识别方法、语义识别方法、问答方法、计算机设备及计算机可读存储介质 | |
CN111428010B (zh) | 人机智能问答的方法和装置 | |
CN110597952A (zh) | 信息处理方法、服务器及计算机存储介质 | |
JPWO2005122144A1 (ja) | 音声認識装置、音声認識方法、及びプログラム | |
CN111209367A (zh) | 信息查找方法、信息查找装置、电子设备及存储介质 | |
CN108305618B (zh) | 语音获取及搜索方法、智能笔、搜索终端及存储介质 | |
US20200219487A1 (en) | Information processing apparatus and information processing method | |
US11526512B1 (en) | Rewriting queries | |
CN114840671A (zh) | 对话生成方法、模型的训练方法、装置、设备及介质 | |
CN112818109B (zh) | 邮件的智能回复方法、介质、装置和计算设备 | |
CN110223134B (zh) | 基于语音识别的产品推荐方法及相关设备 | |
CN114416943B (zh) | 对话模型的训练方法、装置、电子设备及存储介质 | |
CN112765974B (zh) | 一种业务辅助方法、电子设备及可读存储介质 | |
KR20210153165A (ko) | 음성 인식 기능을 제공하는 인공 지능 기기, 인공 지능 기기의 동작 방법 | |
CN112669842A (zh) | 人机对话控制方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |