CN110459224A - 语音识别结果处理方法、装置、计算机设备及存储介质 - Google Patents

语音识别结果处理方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN110459224A
CN110459224A CN201910700309.4A CN201910700309A CN110459224A CN 110459224 A CN110459224 A CN 110459224A CN 201910700309 A CN201910700309 A CN 201910700309A CN 110459224 A CN110459224 A CN 110459224A
Authority
CN
China
Prior art keywords
noise
speech recognition
recognition result
content
template
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910700309.4A
Other languages
English (en)
Other versions
CN110459224B (zh
Inventor
赵媛媛
刘瑛
付志宏
赖佳伟
邓卓彬
孙珂
李婷婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201910700309.4A priority Critical patent/CN110459224B/zh
Publication of CN110459224A publication Critical patent/CN110459224A/zh
Application granted granted Critical
Publication of CN110459224B publication Critical patent/CN110459224B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了语音识别结果处理方法、装置、计算机设备及存储介质,其中方法可包括:获取第一语音识别结果;若确定第一语音识别结果中包含噪音,则对第一语音识别结果进行去噪处理,得到第二语音识别结果;基于第二语音识别结果进行语义解析。应用本发明所述方案,可提升语义解析的效率及准确性等。

Description

语音识别结果处理方法、装置、计算机设备及存储介质
【技术领域】
本发明涉及计算机应用技术,特别涉及语音识别结果处理方法、装置、计算机设备及存储介质。
【背景技术】
语音交互过程中,用户可能会主动产生一些噪音,如“嗯”、“哼”、“啊”、“稍等”、“等一下”等,这些噪音在语音收音及识别的过程中无法避免,但是却会对语义理解产生了很大的干扰,致使很多语音识别结果不能顺利地进行语义解析,从而降低了语义解析效率及语义解析的准确性等。
【发明内容】
有鉴于此,本发明提供了语音识别结果处理方法、装置、计算机设备及存储介质。
具体技术方案如下:
一种语音识别结果处理方法,包括:
获取第一语音识别结果;
若确定所述第一语音识别结果中包含噪音,则对所述第一语音识别结果进行去噪处理,得到第二语音识别结果;
基于所述第二语音识别结果进行语义解析。
根据本发明一优选实施例,确定所述第一语音识别结果中包含噪音包括:
通过将所述第一语音识别结果与预先生成的噪音模板和噪音词典进行匹配,确定出所述第一语音识别结果中是否包含噪音。
根据本发明一优选实施例,所述通过将所述第一语音识别结果与预先生成的噪音模板和噪音词典进行匹配,确定出所述第一语音识别结果中是否包含噪音包括:
确定所述第一语音识别结果的组成结构是否与任一噪音模板相匹配,若是,则根据所述相匹配的噪音模板确定出所述第一语音识别结果中的疑似噪音内容,若所述疑似噪音内容记载在所述噪音词典中,则将所述疑似噪音内容确定为噪音。
根据本发明一优选实施例,所述噪音模板由两类内容组合而成,其中,第一类内容为噪音通配符表示,第二类内容为2-9位数字表示,所述第一类内容和所述第二类内容的数量分别为至少一个;
所述根据所述相匹配的噪音模板确定出所述第一语音识别结果中的疑似噪音内容包括:将所述第一语音识别结果中与所述相匹配的噪音模板中的噪音通配符表示对应的内容作为所述疑似噪音内容。
根据本发明一优选实施例,该方法进一步包括:标注出所述第一语音识别结果中的噪音;
所述对所述第一语音识别结果进行去噪处理包括:将标注为噪音的内容从所述第一语音识别结果中去除,得到所述第二语音识别结果。
根据本发明一优选实施例,该方法进一步包括:对所述第一语音识别结果进行预处理;
所述将所述第一语音识别结果与预先生成的噪音模板和噪音词典进行匹配包括:将预处理后的第一语音识别结果与所述噪音模板和噪音词典进行匹配。
根据本发明一优选实施例,所述对所述第一语音识别结果进行预处理包括:将所述第一语音识别结果中的中文数字表述转换为对应的阿拉伯数字。
一种语音识别结果处理装置,包括:获取单元、去噪单元以及解析单元;
所述获取单元,用于获取第一语音识别结果;
所述去噪单元,用于当确定所述第一语音识别结果中包含噪音时,对所述第一语音识别结果进行去噪处理,得到第二语音识别结果;
所述解析单元,用于基于所述第二语音识别结果进行语义解析。
根据本发明一优选实施例,所述去噪单元通过将所述第一语音识别结果与预先生成的噪音模板和噪音词典进行匹配,确定出所述第一语音识别结果中是否包含噪音。
根据本发明一优选实施例,所述去噪单元确定所述第一语音识别结果的组成结构是否与任一噪音模板相匹配,若是,则根据所述相匹配的噪音模板确定出所述第一语音识别结果中的疑似噪音内容,若所述疑似噪音内容记载在所述噪音词典中,则将所述疑似噪音内容确定为噪音。
根据本发明一优选实施例,所述噪音模板由两类内容组合而成,其中,第一类内容为噪音通配符表示,第二类内容为2-9位数字表示,所述第一类内容和所述第二类内容的数量分别为至少一个;
所述去噪单元将所述第一语音识别结果中与所述相匹配的噪音模板中的噪音通配符表示对应的内容作为所述疑似噪音内容。
根据本发明一优选实施例,所述去噪单元进一步用于,标注出所述第一语音识别结果中的噪音,将标注为噪音的内容从所述第一语音识别结果中去除,得到所述第二语音识别结果。
根据本发明一优选实施例,所述去噪单元进一步用于,对所述第一语音识别结果进行预处理,将预处理后的第一语音识别结果与所述噪音模板和噪音词典进行匹配。
根据本发明一优选实施例,所述去噪单元将所述第一语音识别结果中的中文数字表述转换为对应的阿拉伯数字,实现所述预处理。
一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现如以上所述的方法。
一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如以上所述的方法。
基于上述介绍可以看出,采用本发明所述方案,可在语音识别之后,语义解析之前,增加一个去噪机制,即去除语音识别结果中包含的噪音,从而提升了语义解析的效率及准确性等。
【附图说明】
图1为本发明所述语音识别结果处理方法第一实施例的流程图。
图2为本发明所述语音识别结果处理方法第二实施例的流程图。
图3为本发明所述语音识别结果处理装置实施例的组成结构示意图。
图4示出了适于用来实现本发明实施方式的示例性计算机系统/服务器12的框图。
【具体实施方式】
为了使本发明的技术方案更加清楚、明白,以下参照附图并举实施例,对本发明所述方案进行进一步说明。
显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
另外,应理解,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
图1为本发明所述语音识别结果处理方法第一实施例的流程图。如图1所示,包括以下具体实现方式。
在101中,获取第一语音识别结果。
在102中,若确定第一语音识别结果中包含噪音,则对第一语音识别结果进行去噪处理,得到第二语音识别结果。
在103中,基于第二语音识别结果进行语义解析。
语音交互过程中,可对用户每次输入的语音进行语音识别,从而可得到文本形式的语音识别结果,为与后续所述的去噪后的语音识别结果进行区分,可将语音识别得到的语音识别结果称为第一语音识别结果。
对于第一语音识别结果,可确定其中是否包含噪音,若是,可对第一语音识别结果进行去噪处理,从而得到第二语音识别结果,进而可基于第二语音识别结果进行语义解析,若否,可直接基于第一语音识别结果进行语义解析。
优选地,可通过将第一语音识别结果与预先生成的噪音模板和噪音词典进行匹配,确定出第一语音识别结果中是否包含噪音。
具体地,可确定第一语音识别结果的组成结构是否与任一噪音模板相匹配,若是,可根据相匹配的噪音模板确定出第一语音识别结果中的疑似噪音内容,若疑似噪音内容记载在噪音词典中,则可将疑似噪音内容确定为噪音。
可根据实际经验等,预先生成各种噪音模板及噪音词典。
本实施例所述方案可适用于各种场景,尤其可适用于电话号码、身份证号码或订单号码等的去噪场景。
比如,用户在订餐时,为了方便确认信息,智能客服通常会询问用户的电话号码,用户在提供电话号码的过程中则可能会产生噪音:
智能客服:麻烦提供一下您的电话号码;
用户:138嗯1072尾号2236;
……。
上述用户的回答中的“嗯”、“尾号”等即为噪音。
对于用户的回答,语义解析模型通常不会把“138嗯1072尾号2236”识别为电话号码,因为通常意义上的模型训练语料不会覆盖类似的语料,因此就会导致语义解析错误或无法进行语义解析等。
针对上述场景,可预先生成各种噪音模板,噪音模板可由两类内容组合而成,其中,第一类内容可为噪音通配符表示,第二类内容可为2-9位数字表示,第一类内容和第二类内容的数量可分别为至少一个。
比如,不同的噪音模板可分别如下所示:
噪音模板1:[2-9位数字][噪音通配符][2-9位数字][噪音通配符][2-9位数字];
噪音模板2:[噪音通配符][2-9位数字][噪音通配符][2-9位数字];
噪音模板3:[2-9位数字][噪音通配符][2-9位数字];
……;
优选地,噪音模板需要尽可能地覆盖实际应用中各种可能的情况。
噪音词典中可包含“嗯”、“尾号”、“等一下”、“我想一下”等各种噪音词汇,同样地,噪音词典需要尽可能地覆盖实际应用中各种可能的情况。
假设第一语音识别结果为“138嗯1072尾号2236”,可确定第一语音识别结果的组成结构是否与任一噪音模板相匹配,假设与上述噪音模板1相匹配,那么可进一步根据噪音模板1确定出第一语音识别结果中的疑似噪音内容,如可将第一语音识别结果中与相匹配的噪音模板中的噪音通配符表示对应的内容作为疑似噪音内容,即可将“138嗯1072尾号2236”中与噪音模板1中的噪音通配符表示对应的内容作为疑似噪音内容,从而可得到疑似噪音内容“嗯”和“尾号”,之后,可确定疑似噪音内容“嗯”和“尾号”是否记载在噪音词典中,若是,则可将“嗯”和“尾号”确定为噪音,即可确定第一语音识别结果中包含噪音。若第一语音识别结果与任一噪音模板均不匹配,或者,与某一噪音模板相匹配,但其中的疑似噪音内容部分或全部未记载在噪音词典中,那么则可确定第一语音识别结果中不包含噪音。
若按照上述方式确定出第一语音识别结果中包含噪音,可进一步标注出第一语音识别结果中的噪音,具体标注方式不限。
这样,在对第一语音识别结果进行去噪处理时,可将标注为噪音的内容从第一语音识别结果中去除,从而得到第二语音识别结果。比如,可将第一语音识别结果“138嗯1072尾号2236”中标注为噪音的内容“嗯”和“尾号”从第一语音识别结果中去除,从而得到第二语音识别结果“13810722236”。
优选地,本实施例中,在获取到第一语音识别结果之后,还可对第一语音识别结果进行预处理,进而可将预处理后的第一语音识别结果与噪音模板和噪音词典进行匹配等。
对第一语音识别结果进行预处理可包括:将第一语音识别结果中的中文数字表述转换为对应的阿拉伯数字。
仍以“138嗯1072尾号2236”为例,其对应的第一语音识别结果的形式通常为“一三八嗯一零七二尾号二二三六”,为方便与后续的噪音模板进行匹配,可首先将其中的中文数字表述转换为对应的阿拉伯数字,即将“一”转换为“1”,将“三”转换为“3”等,从而可得到“138嗯1072尾号2236”形式的第一语音识别结果。若第一语音识别结果中包含“等一下”等表述,也会将其中的“一”转换为“1”。
所述预处理具体包括哪些操作可根据实际需要而定,比如,除进行上述将“将第一语音识别结果中的中文数字表述转换为对应的阿拉伯数字”的操作外,还可进行切词及合并等操作。切词可采用现有的切词方式,合并可以是指对于相邻的两个阿拉伯数字,若被切分到两个不同的词中,可将其进行合并,比如,“138”被切分为了“13”和“8”,那么可合并为“138”。通过切词和合并等操作,可将“138嗯1072尾号2236”处理为“138嗯1072尾号2236”,从而可更好地与噪音模板及噪音词典进行匹配等。
针对得到的第二语音识别结果,可按照现有方式对其进行语义解析。
仍以用户订餐时的语音交互过程为例:
智能客服:麻烦提供一下您的电话号码;
用户:138嗯1072尾号2236;
智能客服:好的,和您再确认一下,您的电话号码为13810722236;
用户:是的;
……。
基于上述介绍,图2为本发明所述语音识别结果处理方法第二实施例的流程图。如图2所示,包括以下具体实现方式。
在201中,获取第一语音识别结果。
可按照现有方式对用户输入的语音进行语音识别,从而得到第一语音识别结果。
在202中,对第一语音识别结果进行预处理。
如可将第一语音识别结果中的中文数字表述转换为对应的阿拉伯数字等。
在203中,将预处理后的第一语音识别结果与噪音模板和噪音词典进行匹配,确定出第一语音识别结果中是否包含噪音,若是,则执行204,否则,执行207。
可确定预处理后的第一语音识别结果的组成结构是否与任一噪音模板相匹配,若是,可根据相匹配的噪音模板确定出预处理后的第一语音识别结果中的疑似噪音内容,若疑似噪音内容记载在噪音词典中,则可将疑似噪音内容确定为噪音。
其中,噪音模板可由两类内容组合而成,其中,第一类内容可为噪音通配符表示,第二类内容可为2-9位数字表示,第一类内容和第二类内容的数量可分别为至少一个。可将第一语音识别结果中与相匹配的噪音模板中的噪音通配符表示对应的内容作为疑似噪音内容。
在204中,标注出第一语音识别结果中的噪音。
具体标注方式不限。
在205中,将标注为噪音的内容从第一语音识别结果中去除,得到第二语音识别结果。
在206中,基于第二语音识别结果进行语义解析,之后结束流程。
在207中,基于第一语音识别结果进行语义解析,之后结束流程。
需要说明的是,对于前述的各方法实施例,为了简单描述,将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
总之,采用本发明方法实施例所述方案,可在语音识别之后,语义解析之前,增加一个去噪机制,即去除语音识别结果中包含的噪音,从而提升了语义解析的效率及准确性等。
以上是关于方法实施例的介绍,以下通过装置实施例,对本发明所述方案进行进一步说明。
图3为本发明所述语音识别结果处理装置实施例的组成结构示意图。如图3所示,包括:获取单元301、去噪单元302以及解析单元303。
获取单元301,用于获取第一语音识别结果。
去噪单元302,用于当确定第一语音识别结果中包含噪音时,对第一语音识别结果进行去噪处理,得到第二语音识别结果。
解析单元303,用于基于第二语音识别结果进行语义解析。
语音交互过程中,可对用户每次输入的语音进行语音识别,从而可得到文本形式的语音识别结果,为与后续所述的去噪后的语音识别结果进行区分,可将语音识别得到的语音识别结果称为第一语音识别结果。
对于获取单元301获取到的第一语音识别结果,去噪单元302可确定其中是否包含噪音,若是,可对第一语音识别结果进行去噪处理,从而得到第二语音识别结果,进而可由解析单元303基于第二语音识别结果进行语义解析,若否,可直接由解析单元303基于第一语音识别结果进行语义解析。
优选地,去噪单元302可通过将第一语音识别结果与预先生成的噪音模板和噪音词典进行匹配,确定出第一语音识别结果中是否包含噪音。
具体地,去噪单元302可确定第一语音识别结果的组成结构是否与任一噪音模板相匹配,若是,可根据相匹配的噪音模板确定出第一语音识别结果中的疑似噪音内容,若疑似噪音内容记载在噪音词典中,则可将疑似噪音内容确定为噪音。
其中,噪音模板可由两类内容组合而成,其中,第一类内容可为噪音通配符表示,第二类内容可为2-9位数字表示,第一类内容和第二类内容的数量可分别为至少一个。如某个噪音模板可为:[2-9位数字][噪音通配符][2-9位数字][噪音通配符][2-9位数字]。相应地,去噪单元302可将第一语音识别结果中与相匹配的噪音模板中的噪音通配符表示对应的内容作为疑似噪音内容。
去噪单元302可进一步标注出第一语音识别结果中的噪音,从而可将标注为噪音的内容从第一语音识别结果中去除,得到第二语音识别结果。
优选地,在获取到第一语音识别结果之后,去噪单元302还可对第一语音识别结果进行预处理,进而可将预处理后的第一语音识别结果与噪音模板和噪音词典进行匹配等。
对第一语音识别结果进行预处理可包括:将第一语音识别结果中的中文数字表述转换为对应的阿拉伯数字。
所述预处理具体包括哪些操作可根据实际需要而定,不限于以上所示。比如,除进行上述将“将第一语音识别结果中的中文数字表述转换为对应的阿拉伯数字”的操作外,还可进行切词及合并等操作,以方便与噪音模板及噪音词典进行匹配等。
针对得到的第二语音识别结果,解析单元303可按照现有方式对其进行语义解析。
图3所示装置实施例的具体工作流程请参照前述方法实施例中的相关说明,不再赘述。
总之,采用本发明装置实施例所述方案,可在语音识别之后,语义解析之前,增加一个去噪机制,即去除语音识别结果中包含的噪音,从而提升了语义解析的效率及准确性等。
图4示出了适于用来实现本发明实施方式的示例性计算机系统/服务器12的框图。图4显示的计算机系统/服务器12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图4所示,计算机系统/服务器12以通用计算设备的形式表现。计算机系统/服务器12的组件可以包括但不限于:一个或者多个处理器(处理单元)16,存储器28,连接不同系统组件(包括存储器28和处理器16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
计算机系统/服务器12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机系统/服务器12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。计算机系统/服务器12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图4未显示,通常称为“硬盘驱动器”)。尽管图4中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
计算机系统/服务器12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机系统/服务器12交互的设备通信,和/或与使得该计算机系统/服务器12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算机系统/服务器12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图4所示,网络适配器20通过总线18与计算机系统/服务器12的其它模块通信。应当明白,尽管图中未示出,可以结合计算机系统/服务器12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理器16通过运行存储在存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现图1或图2所示实施例中的方法。
本发明同时公开了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时将实现如图1或图2所示实施例中的方法。
可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法等,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (16)

1.一种语音识别结果处理方法,其特征在于,包括:
获取第一语音识别结果;
若确定所述第一语音识别结果中包含噪音,则对所述第一语音识别结果进行去噪处理,得到第二语音识别结果;
基于所述第二语音识别结果进行语义解析。
2.根据权利要求1所述的方法,其特征在于,
确定所述第一语音识别结果中包含噪音包括:
通过将所述第一语音识别结果与预先生成的噪音模板和噪音词典进行匹配,确定出所述第一语音识别结果中是否包含噪音。
3.根据权利要求2所述的方法,其特征在于,
所述通过将所述第一语音识别结果与预先生成的噪音模板和噪音词典进行匹配,确定出所述第一语音识别结果中是否包含噪音包括:
确定所述第一语音识别结果的组成结构是否与任一噪音模板相匹配,若是,则根据所述相匹配的噪音模板确定出所述第一语音识别结果中的疑似噪音内容,若所述疑似噪音内容记载在所述噪音词典中,则将所述疑似噪音内容确定为噪音。
4.根据权利要求3所述的方法,其特征在于,
所述噪音模板由两类内容组合而成,其中,第一类内容为噪音通配符表示,第二类内容为2-9位数字表示,所述第一类内容和所述第二类内容的数量分别为至少一个;
所述根据所述相匹配的噪音模板确定出所述第一语音识别结果中的疑似噪音内容包括:将所述第一语音识别结果中与所述相匹配的噪音模板中的噪音通配符表示对应的内容作为所述疑似噪音内容。
5.根据权利要求3所述的方法,其特征在于,
该方法进一步包括:标注出所述第一语音识别结果中的噪音;
所述对所述第一语音识别结果进行去噪处理包括:将标注为噪音的内容从所述第一语音识别结果中去除,得到所述第二语音识别结果。
6.根据权利要求4所述的方法,其特征在于,
该方法进一步包括:对所述第一语音识别结果进行预处理;
所述将所述第一语音识别结果与预先生成的噪音模板和噪音词典进行匹配包括:将预处理后的第一语音识别结果与所述噪音模板和噪音词典进行匹配。
7.根据权利要求6所述的方法,其特征在于,
所述对所述第一语音识别结果进行预处理包括:将所述第一语音识别结果中的中文数字表述转换为对应的阿拉伯数字。
8.一种语音识别结果处理装置,其特征在于,包括:获取单元、去噪单元以及解析单元;
所述获取单元,用于获取第一语音识别结果;
所述去噪单元,用于当确定所述第一语音识别结果中包含噪音时,对所述第一语音识别结果进行去噪处理,得到第二语音识别结果;
所述解析单元,用于基于所述第二语音识别结果进行语义解析。
9.根据权利要求8所述的装置,其特征在于,
所述去噪单元通过将所述第一语音识别结果与预先生成的噪音模板和噪音词典进行匹配,确定出所述第一语音识别结果中是否包含噪音。
10.根据权利要求9所述的装置,其特征在于,
所述去噪单元确定所述第一语音识别结果的组成结构是否与任一噪音模板相匹配,若是,则根据所述相匹配的噪音模板确定出所述第一语音识别结果中的疑似噪音内容,若所述疑似噪音内容记载在所述噪音词典中,则将所述疑似噪音内容确定为噪音。
11.根据权利要求10所述的装置,其特征在于,
所述噪音模板由两类内容组合而成,其中,第一类内容为噪音通配符表示,第二类内容为2-9位数字表示,所述第一类内容和所述第二类内容的数量分别为至少一个;
所述去噪单元将所述第一语音识别结果中与所述相匹配的噪音模板中的噪音通配符表示对应的内容作为所述疑似噪音内容。
12.根据权利要求10所述的装置,其特征在于,
所述去噪单元进一步用于,标注出所述第一语音识别结果中的噪音,将标注为噪音的内容从所述第一语音识别结果中去除,得到所述第二语音识别结果。
13.根据权利要求11所述的装置,其特征在于,
所述去噪单元进一步用于,对所述第一语音识别结果进行预处理,将预处理后的第一语音识别结果与所述噪音模板和噪音词典进行匹配。
14.根据权利要求13所述的装置,其特征在于,
所述去噪单元将所述第一语音识别结果中的中文数字表述转换为对应的阿拉伯数字,实现所述预处理。
15.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1~7中任一项所述的方法。
16.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1~7中任一项所述的方法。
CN201910700309.4A 2019-07-31 2019-07-31 语音识别结果处理方法、装置、计算机设备及存储介质 Active CN110459224B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910700309.4A CN110459224B (zh) 2019-07-31 2019-07-31 语音识别结果处理方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910700309.4A CN110459224B (zh) 2019-07-31 2019-07-31 语音识别结果处理方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN110459224A true CN110459224A (zh) 2019-11-15
CN110459224B CN110459224B (zh) 2022-02-25

Family

ID=68484175

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910700309.4A Active CN110459224B (zh) 2019-07-31 2019-07-31 语音识别结果处理方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN110459224B (zh)

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104575501A (zh) * 2015-01-19 2015-04-29 北京云知声信息技术有限公司 一种收音机语音操控指令解析方法及系统
CN105702252A (zh) * 2016-03-31 2016-06-22 海信集团有限公司 一种语音识别方法及装置
CN105869643A (zh) * 2016-06-06 2016-08-17 青岛海信移动通信技术股份有限公司 基于语音的终端控制方法及语音控制装置
WO2018135743A1 (ko) * 2017-01-17 2018-07-26 삼성전자주식회사 발화 완료 감지 방법 및 이를 구현한 전자 장치
CN108847241A (zh) * 2018-06-07 2018-11-20 平安科技(深圳)有限公司 将会议语音识别为文本的方法、电子设备及存储介质
CN108962228A (zh) * 2018-07-16 2018-12-07 北京百度网讯科技有限公司 模型训练方法和装置
CN109147767A (zh) * 2018-08-16 2019-01-04 平安科技(深圳)有限公司 语音中的数字识别方法、装置、计算机设备及存储介质
CN109410920A (zh) * 2018-10-15 2019-03-01 百度在线网络技术(北京)有限公司 用于获取信息的方法及装置
CN109559748A (zh) * 2018-12-21 2019-04-02 出门问问信息科技有限公司 一种语义识别方法、装置、智能设备及存储介质
CN109564758A (zh) * 2016-07-27 2019-04-02 三星电子株式会社 电子设备及其语音识别方法
CN109634935A (zh) * 2018-11-07 2019-04-16 重庆海特科技发展有限公司 语音处理方法、存储介质和装置
CN109708256A (zh) * 2018-12-06 2019-05-03 珠海格力电器股份有限公司 一种语音确定方法、装置、存储介质及空调
CN109727598A (zh) * 2018-12-28 2019-05-07 浙江省公众信息产业有限公司 大噪音语境下的意图识别方法
CN109816508A (zh) * 2018-12-14 2019-05-28 深圳壹账通智能科技有限公司 基于大数据的用户身份认证方法、装置、计算机设备

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104575501A (zh) * 2015-01-19 2015-04-29 北京云知声信息技术有限公司 一种收音机语音操控指令解析方法及系统
CN105702252A (zh) * 2016-03-31 2016-06-22 海信集团有限公司 一种语音识别方法及装置
CN105869643A (zh) * 2016-06-06 2016-08-17 青岛海信移动通信技术股份有限公司 基于语音的终端控制方法及语音控制装置
CN109564758A (zh) * 2016-07-27 2019-04-02 三星电子株式会社 电子设备及其语音识别方法
WO2018135743A1 (ko) * 2017-01-17 2018-07-26 삼성전자주식회사 발화 완료 감지 방법 및 이를 구현한 전자 장치
CN108847241A (zh) * 2018-06-07 2018-11-20 平安科技(深圳)有限公司 将会议语音识别为文本的方法、电子设备及存储介质
CN108962228A (zh) * 2018-07-16 2018-12-07 北京百度网讯科技有限公司 模型训练方法和装置
CN109147767A (zh) * 2018-08-16 2019-01-04 平安科技(深圳)有限公司 语音中的数字识别方法、装置、计算机设备及存储介质
CN109410920A (zh) * 2018-10-15 2019-03-01 百度在线网络技术(北京)有限公司 用于获取信息的方法及装置
CN109634935A (zh) * 2018-11-07 2019-04-16 重庆海特科技发展有限公司 语音处理方法、存储介质和装置
CN109708256A (zh) * 2018-12-06 2019-05-03 珠海格力电器股份有限公司 一种语音确定方法、装置、存储介质及空调
CN109816508A (zh) * 2018-12-14 2019-05-28 深圳壹账通智能科技有限公司 基于大数据的用户身份认证方法、装置、计算机设备
CN109559748A (zh) * 2018-12-21 2019-04-02 出门问问信息科技有限公司 一种语义识别方法、装置、智能设备及存储介质
CN109727598A (zh) * 2018-12-28 2019-05-07 浙江省公众信息产业有限公司 大噪音语境下的意图识别方法

Also Published As

Publication number Publication date
CN110459224B (zh) 2022-02-25

Similar Documents

Publication Publication Date Title
CN109817213B (zh) 用于自适应语种进行语音识别的方法、装置及设备
CN107492379B (zh) 一种声纹创建与注册方法及装置
CN107481720B (zh) 一种显式声纹识别方法及装置
EP0621531B1 (en) Interactive computer system recognizing spoken commands
US20180366107A1 (en) Method and device for training acoustic model, computer device and storage medium
CN109637519A (zh) 语音交互实现方法、装置、计算机设备及存储介质
CN109036396A (zh) 一种第三方应用的交互方法及系统
CN109686383B (zh) 一种语音分析方法、装置及存储介质
CN110069608A (zh) 一种语音交互的方法、装置、设备和计算机存储介质
CN108363556A (zh) 一种基于语音与增强现实环境交互的方法和系统
US20240021202A1 (en) Method and apparatus for recognizing voice, electronic device and medium
CN107507615A (zh) 界面智能交互控制方法、装置、系统及存储介质
CN109599095A (zh) 一种语音数据的标注方法、装置、设备和计算机存储介质
CN108962227A (zh) 语音起点和终点检测方法、装置、计算机设备及存储介质
CN110232340A (zh) 建立视频分类模型以及视频分类的方法、装置
CN109785829B (zh) 一种基于语音控制的客服辅助方法和系统
US20110069822A1 (en) Automatic creation of complex conversational natural language call routing system for call centers
CN109215646A (zh) 语音交互处理方法、装置、计算机设备及存储介质
CN110704618B (zh) 确定对话数据对应的标准问题的方法及装置
CN109446907A (zh) 一种视频聊天的方法、装置、设备和计算机存储介质
CN114038457B (zh) 用于语音唤醒的方法、电子设备、存储介质和程序
CN112261456A (zh) 一种语音弹幕的显示方法、装置、设备及存储介质
CN109346074A (zh) 一种语音处理方法及系统
CN113158656B (zh) 讽刺内容识别方法、装置、电子设备以及存储介质
CN109815481A (zh) 对文本进行事件抽取的方法、装置、设备和计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant