CN111768781A - 语音打断的处理方法和装置 - Google Patents

语音打断的处理方法和装置 Download PDF

Info

Publication number
CN111768781A
CN111768781A CN202010605308.4A CN202010605308A CN111768781A CN 111768781 A CN111768781 A CN 111768781A CN 202010605308 A CN202010605308 A CN 202010605308A CN 111768781 A CN111768781 A CN 111768781A
Authority
CN
China
Prior art keywords
voice
interrupted
preset
speech
score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010605308.4A
Other languages
English (en)
Other versions
CN111768781B (zh
Inventor
左充
李健
武卫东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sinovoice Technology Co Ltd
Original Assignee
Beijing Sinovoice Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sinovoice Technology Co Ltd filed Critical Beijing Sinovoice Technology Co Ltd
Priority to CN202010605308.4A priority Critical patent/CN111768781B/zh
Publication of CN111768781A publication Critical patent/CN111768781A/zh
Application granted granted Critical
Publication of CN111768781B publication Critical patent/CN111768781B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L15/222Barge in, i.e. overridable guidance for interrupting prompts
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/32Multiple recognisers used in sequence or in parallel; Score combination systems therefor, e.g. voting systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种语音打断的处理方法和装置。其中,该方法包括:获取在预定长度范围内的待打断的语音;将待打断的语音与知识库中的语音进行匹配,得到匹配结果;确定匹配结果的分值;在匹配结果的分值大于或者等于预设分值的情况下,对待打断的语音进行打断。本发明解决了相关技术中对于中等长度的文本的处理存在打断效果差,以及人工准备训练语料的人力成本高的技术问题。

Description

语音打断的处理方法和装置
技术领域
本发明涉及语音处理技术领域,具体而言,涉及一种语音打断的处理方法和装置。
背景技术
目前智能客服领域常用语音信息进行打断,这种方式由于不考虑语义信息,一般效果比较差,且容易受到一些场景背景噪音的干扰。一些智能客服系统采用语义打断的方式判断打断,在文本超长时直接打断,在文本较短时,使用白名单词表进行针对性打断,对于正常长度的文本采用文本分类的方式实现。目前语义打断主要问题出在对于中等长度的文本的处理,由于每个项目实际情况不同,文本分类模型都需要针对性训练,且在数据不足时,打断效果很差。对于正常长度的文本采用文本分类的方式实现,即将正常长度的需要进行打断的文本与不进行语义打断的文本进行训练,训练二分类模型。对于用户新输入的文本,将通过模型判断文本的类别。目前传统智能客服中涉及的通过分类进行语义打断任务主要问题出在对于中等长度的文本的处理,由于每个项目实际情况不同,文本分类模型都需要针对性训练,且在数据不足时,打断效果很差,而且人工准备训练语料的人力成本高。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种语音打断的处理方法和装置,以至少解决相关技术中对于中等长度的文本的处理存在打断效果差,以及人工准备训练语料的人力成本高的技术问题。
根据本发明实施例的一个方面,提供了一种语音打断的处理方法,包括:获取在预定长度范围内的待打断的语音;将所述待打断的语音与知识库中的语音进行匹配,得到匹配结果;确定所述匹配结果的分值;在所述匹配结果的分值大于或者等于预设分值的情况下,对所述待打断的语音进行打断。
可选地,获取在预定长度范围内的待打断的语音包括:对待打断的语音进行语义打断判断;依据所述语义打断判断,确定所述待打断的语音中打断语句的字数;依据所述打断语句的字数,确定在预定长度范围内的所述待打断的语音。
可选地,依据所述打断语句的字数,确定在预定长度范围内的所述待打断的语音,还包括:在所述打断语句的字数小于或者等于第一预定长度的情况下,则对所述待打断的语音进行词表判断;在所述打断语句的字数大于或者等于第二预定长度的情况下,则对所述待打断的语音进行打断;其中,所述第一预定长度小于所述第二预定长度。
可选地,对所述待打断的语音进行词表判断包括:将所述待打断的语音与预设的词表进行匹配;在所述待打断的语音匹配到所述预设的词表中的词语的情况下,对所述待打断的语音进行打断。
可选地,在对待打断的语音进行语义打断判断之前,所述方法还包括:对待打断的语音进行语音打断判断。
可选地,对待打断的语音进行语音打断判断包括:获取所述待打断的语音的语音参数,其中,所述语音参数包括以下至少之一:音量、时长、情感;判断所述待打断的语音的语音参数是否符合预设的语音参数;在所述待打断的语音的语音参数符合所述预设的语音参数的情况下,对所述待打断的语音进行打断;在所述待打断的语音的语音参数不符合所述预设的语音参数的情况下,对所述待打断的语音进行语义打断判断。
可选地,在所述匹配结果的分值大于或者等于预设分值的情况下,对所述待打断的语音进行打断之后,所述方法还包括:对所述待打断的语音中的问题进行答复。
根据本发明实施例的另一方面,还提供了一种语音打断的处理装置,包括:获取模块,用于获取在预定长度范围内的待打断的语音;匹配模块,用于将所述待打断的语音与知识库中的语音进行匹配,得到匹配结果;确定模块,用于确定所述匹配结果的分值;打断模块,用于在所述匹配结果的分值大于或者等于预设分值的情况下,对所述待打断的语音进行打断。
根据本发明实施例的另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行上述中任意一项所述的语音打断的处理方法。
根据本发明实施例的另一方面,还提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述中任意一项所述的语音打断的处理方法。
在本发明实施例中,采用获取在预定长度范围内的待打断的语音;将所述待打断的语音与知识库中的语音进行匹配,得到匹配结果;确定所述匹配结果的分值;在所述匹配结果的分值大于或者等于预设分值的情况下,对所述待打断的语音进行打断的方式,通过将在预定长度范围内的待打断的语音与知识库中的语音进行匹配,对其匹配结果进行评分,并依据评分的分值对待打断的语音进行打断,达到了在保证打断效果的同时,减小人工标注的工作量的目的,从而实现了提高人机交互的效果体验的技术效果,进而解决了相关技术中对于中等长度的文本的处理存在打断效果差,以及人工准备训练语料的人力成本高的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的语音打断的处理方法的流程图;
图2是根据本发明可选实施例的语音打断的处理方法的流程图;
图3是根据本发明实施例的语音打断的处理装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例1
根据本发明实施例,提供了一种语音打断的处理方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的语音打断的处理方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,获取在预定长度范围内的待打断的语音;
步骤S104,将待打断的语音与知识库中的语音进行匹配,得到匹配结果;
步骤S106,确定匹配结果的分值;
步骤S108,在匹配结果的分值大于或者等于预设分值的情况下,对待打断的语音进行打断。
需要说明的是,上述预设分值可以根据应用场景的需要而设定,例如,该预设分值可以是60分、80等。
通过上述步骤,可以实现采用获取在预定长度范围内的待打断的语音;将待打断的语音与知识库中的语音进行匹配,得到匹配结果;确定匹配结果的分值;在匹配结果的分值大于或者等于预设分值的情况下,对待打断的语音进行打断的方式,通过将在预定长度范围内的待打断的语音与知识库中的语音进行匹配,对其匹配结果进行评分,并依据评分的分值对待打断的语音进行打断,达到了在保证打断效果的同时,减小人工标注的工作量的目的,从而实现了提高人机交互的效果体验的技术效果,进而解决了相关技术中对于中等长度的文本的处理存在打断效果差,以及人工准备训练语料的人力成本高的技术问题。
可选地,获取在预定长度范围内的待打断的语音包括:对待打断的语音进行语义打断判断;依据语义打断判断,确定待打断的语音中打断语句的字数;依据打断语句的字数,确定在预定长度范围内的待打断的语音。
作为一种可选的实施例,通过对待打断的语音进行语义打断判断,进一步确定待打断的语音中打断语句的字数,并根据打断语句的字数,进而确定在预定长度范围内的待打断的语音。其中,在预定长度范围内的待打断的语音为在问答打断判断识别范围内的语音。
可选地,依据打断语句的字数,确定在预定长度范围内的待打断的语音,还包括:在打断语句的字数小于或者等于第一预定长度的情况下,则对待打断的语音进行词表判断;在打断语句的字数大于或者等于第二预定长度的情况下,则对待打断的语音进行打断;其中,第一预定长度小于第二预定长度。
作为一种可选的实施例,可以根据待打断的语音中打断语句的字数,确定在预定长度范围内的待打断的语音,进而对预定长度范围内的待打断的语音进行问答打断判断;其中,上述问答打断判断包括:获取在预定长度范围内的待打断的语音;将待打断的语音与知识库中的语音进行匹配,得到匹配结果;确定匹配结果的分值;在匹配结果的分值大于或者等于预设分值的情况下,对待打断的语音进行打断。另外,还可以根据待打断的语音中打断语句的字数,确定对待打断的语音进行词表判断或者对待打断的语音进行打断。具体地,如果在打断语句的字数小于或者等于第一预定长度的情况下,则对待打断的语音进行词表判断;如果在打断语句的字数大于或者等于第二预定长度的情况下,则对待打断的语音进行打断。
需要说明的是,上述预定长度至少包括第一预定长度和第二预定长度,其中,第一预定长度小于第二预定长度。可选地,上述预定长度范围可以由第一预定长度和第二预定长度来确定。
可选地,对待打断的语音进行词表判断包括:将待打断的语音与预设的词表进行匹配;在待打断的语音匹配到预设的词表中的词语的情况下,对待打断的语音进行打断。
作为一种可选的实施例,可以将待打断的语音与预设的词表进行匹配,并基于匹配结果确定是否对待打断的语音进行打断。具体地,如果在待打断的语音匹配到预设的词表中的词语的情况下,则对待打断的语音进行打断;如果在待打断的语音匹配不到预设的词表中的词语的情况下,则对待打断的语音不进行打断。需要说明的是,上述预设的词表可以存储在云端或者是客户端。
可选地,在对待打断的语音进行语义打断判断之前,上述方法还包括:对待打断的语音进行语音打断判断。
作为一种可选的实施例,可以在对待打断的语音进行语义打断判断之前,先对待打断的语音进行语音打断判断。可选地,先对待打断的语音进行语音打断判断可以对音量过大、时长过长、情绪激动等语音进行打断,而对音量稳定、时长较短且情绪稳定的语音进行语义打断判断。通过上述方式,可以进一步提升语音打断效果,从而提高人机交互的效果体验。
可选地,对待打断的语音进行语音打断判断包括:获取待打断的语音的语音参数,其中,语音参数包括以下至少之一:音量、时长、情感;判断待打断的语音的语音参数是否符合预设的语音参数;在待打断的语音的语音参数符合预设的语音参数的情况下,对待打断的语音进行打断;在待打断的语音的语音参数不符合预设的语音参数的情况下,对待打断的语音进行语义打断判断。
作为一种可选的实施例,在对待打断的语音进行语音打断判断过程中,可以通过判断待打断的语音的语音参数是否符合预设的语音参数,进而确定对待打断的语音进行打断还是对待打断的语音进行语义打断判断。其中,上述语音参数包括但不限于音量、时长、情感。需要说明的是,上述情感是通过情绪稳定或者是情绪激动来反映。
可选地,在匹配结果的分值大于或者等于预设分值的情况下,对待打断的语音进行打断之后,上述方法还包括:对待打断的语音中的问题进行答复。
在具体实施过程中,在对待打断的语音进行打断之后,对待打断的语音中的问题进行答复,可以准确回答客户新的意图,提升智能客服的服务质量。
下面对本发明一种可选的实施方式进行详细说明。
作为一种可选的实施方式,在处理超长和超短文本时采用语义打断的处理方式。在处理正常长度文本时,将语义打断的文本直接送入智能客服系统的知识库,并设置匹配阈值,如匹配结果打分高于阈值,则视为用户提出了一个有意义的问题,而进行打断,并对于客户提出的问题进行回答。若匹配结果得分小于匹配阈值,则视为客户未提出新的问题,而继续进行播报。这种设计下,语义打断所需资源与智能客服的问答系统所需资源共享,不需要额外加工训练。通过使用已加工的知识库作为资源,语料覆盖项目中特定领域知识,效果优于传统的通过文本分类进行打断任务的方式。通过上述方法,可以在保证打断效果的同时,减小人工标注的工作量,从而提高人机交互的效果体验。
图2是根据本发明可选实施例的语音打断的处理方法的流程图,如图2所示,展示了新型智能客服打断设计的处理方法,具体实施步骤如下:
步骤1、获取客户待打断的语音输入。
步骤2、通过语音打断模块,针对音量、时长、情感等语音方面指标对于输入的语音进行检测,若高于预设的阈值则需要进行打断;若语音打断低于预设阈值,则需要通过语义打断模块判断。
步骤3、语义打断模块需要先对于打断语句的字数进行判断,若字数过多,则需要直接打断。
步骤4、打断语句字数过少时,则与预设的词表进行匹配,若包括词表中词语则进行打断
步骤5、若打断字数正常时,将语句输入进智能客服的语义模型中进行处理,若返回答案高于阈值,则进行打断,并回答客户新的意图;若返回答案低于阈值,则进行打断。
以银行使用的智能客服系统为例,例如,客户问到信用卡办理条件时,机器人预设答案为“首先,信用卡申请人的年龄需要在18-60周岁之间,并且是我国有完全民事行为能力的合法公民;其次,信用卡申请人的信用情况要良好,不得有严重的逾期还款记录;最后,信用卡申请人要有稳定的经济收入”。由于回答较长,客户可能听完第一句就已经解决了疑问,于是在中途又问了一个新的问题。
若客户提问较长,例如“那我给我儿子办卡,他12岁能办么”,这句话字数较多,超过最大字数阈值,需要打断,并回答新的问题。若字数较短,比如客户说“等一下”,“等等”等有明确打断意思的词语,则可以加入白名单中,若不在白名单中的词语,比如“嗯”,则可以不做打断。
在实际交互过程中大部分是正常长度的文本(字数大于预设的最小字数阈值,小于最大字数阈值)。这种情况不能简单的通过词表和长度来判断,比如输入“信用卡怎么办理”,需要打断;若输入“办理真方便”则不需打断。这种正常长度的文本可通过智能客服语义匹配模块进行判断。
实施例2
根据本发明实施例的另外一个方面,还提供了一种语音打断的处理装置,图3是根据本发明实施例的语音打断的处理装置的示意图,如图3所示,该语音打断的处理装置包括:获取模块32、匹配模块34、确定模块36以及打断模块38。下面对该语音打断的处理装置进行详细说明。
获取模块32,用于获取在预定长度范围内的待打断的语音;匹配模块34,连接至上述获取模块32,用于将待打断的语音与知识库中的语音进行匹配,得到匹配结果;确定模块36,连接至上述匹配模块34,用于确定匹配结果的分值;打断模块38,连接至上述确定模块36,用于在匹配结果的分值大于或者等于预设分值的情况下,对待打断的语音进行打断。
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,例如,对于后者,可以通过以下方式实现:上述各个模块可以位于同一处理器中;或者,上述各个模块以任意组合的方式位于不同的处理器中。
此处需要说明的是,上述获取模块32、匹配模块34、确定模块36以及打断模块38对应于实施例1中的步骤S102至S108,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以在诸如一组计算机可执行指令的计算机系统中执行。
由上可知,在本申请上述实施例中,采用获取模块32获取在预定长度范围内的待打断的语音;匹配模块34将待打断的语音与知识库中的语音进行匹配,得到匹配结果;确定模块36确定匹配结果的分值;打断模块38在匹配结果的分值大于或者等于预设分值的情况下,对待打断的语音进行打断的方式,通过将在预定长度范围内的待打断的语音与知识库中的语音进行匹配,对其匹配结果进行评分,并依据评分的分值对待打断的语音进行打断,达到了在保证打断效果的同时,减小人工标注的工作量的目的,从而实现了提高人机交互的效果体验的技术效果,进而解决了相关技术中对于中等长度的文本的处理存在打断效果差,以及人工准备训练语料的人力成本高的技术问题。
可选地,上述获取模块包括:第一处理单元,用于对待打断的语音进行语义打断判断;第一确定单元,用于依据语义打断判断,确定待打断的语音中打断语句的字数;第二确定单元,用于依据打断语句的字数,确定在预定长度范围内的待打断的语音。
可选地,上述第二确定单元还包括:第一处理子单元,用于在打断语句的字数小于或者等于第一预定长度的情况下,则对待打断的语音进行词表判断;第二处理子单元,用于在打断语句的字数大于或者等于第二预定长度的情况下,则对待打断的语音进行打断;其中,第一预定长度小于第二预定长度。
可选地,上述第一处理子单元包括:匹配子单元,用于将待打断的语音与预设的词表进行匹配;打断子单元,用于在待打断的语音匹配到预设的词表中的词语的情况下,对待打断的语音进行打断。
可选地,在对待打断的语音进行语义打断判断之前,上述装置还包括:处理模块,用于对待打断的语音进行语音打断判断。
可选地,上述处理模块包括:获取单元,用于获取待打断的语音的语音参数,其中,语音参数包括以下至少之一:音量、时长、情感;判断单元,用于判断待打断的语音的语音参数是否符合预设的语音参数;第二处理单元,用于在待打断的语音的语音参数符合预设的语音参数的情况下,对待打断的语音进行打断;第三处理单元,用于在待打断的语音的语音参数不符合预设的语音参数的情况下,对待打断的语音进行语义打断判断。
可选地,在匹配结果的分值大于或者等于预设分值的情况下,对待打断的语音进行打断之后,上述装置还包括:答复模块,用于对待打断的语音中的问题进行答复。
实施例3
根据本发明实施例的另一方面,还提供了一种计算机可读存储介质,该计算机可读存储介质包括存储的程序,其中,在程序运行时控制计算机可读存储介质所在设备执行上述中任意一项的语音打断的处理方法。
可选地,在本实施例中,上述计算机可读存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中,上述计算机可读存储介质包括存储的程序。
可选地,在程序运行时控制计算机可读存储介质所在设备执行以下功能:获取在预定长度范围内的待打断的语音;将待打断的语音与知识库中的语音进行匹配,得到匹配结果;确定匹配结果的分值;在匹配结果的分值大于或者等于预设分值的情况下,对待打断的语音进行打断。
实施例4
根据本发明实施例的另一方面,还提供了一种处理器,该处理器用于运行程序,其中,程序运行时执行上述中任意一项的语音打断的处理方法。
本申请实施例提供了一种设备,该设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:获取在预定长度范围内的待打断的语音;将待打断的语音与知识库中的语音进行匹配,得到匹配结果;确定匹配结果的分值;在匹配结果的分值大于或者等于预设分值的情况下,对待打断的语音进行打断。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:获取在预定长度范围内的待打断的语音;将待打断的语音与知识库中的语音进行匹配,得到匹配结果;确定匹配结果的分值;在匹配结果的分值大于或者等于预设分值的情况下,对待打断的语音进行打断。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种语音打断的处理方法,其特征在于,包括:
获取在预定长度范围内的待打断的语音;
将所述待打断的语音与知识库中的语音进行匹配,得到匹配结果;
确定所述匹配结果的分值;
在所述匹配结果的分值大于或者等于预设分值的情况下,对所述待打断的语音进行打断。
2.根据权利要求1所述的方法,其特征在于,获取在预定长度范围内的待打断的语音包括:
对待打断的语音进行语义打断判断;
依据所述语义打断判断,确定所述待打断的语音中打断语句的字数;
依据所述打断语句的字数,确定在预定长度范围内的所述待打断的语音。
3.根据权利要求2所述的方法,其特征在于,依据所述打断语句的字数,确定在预定长度范围内的所述待打断的语音,还包括:
在所述打断语句的字数小于或者等于第一预定长度的情况下,则对所述待打断的语音进行词表判断;
在所述打断语句的字数大于或者等于第二预定长度的情况下,则对所述待打断的语音进行打断;
其中,所述第一预定长度小于所述第二预定长度。
4.根据权利要求3所述的方法,其特征在于,对所述待打断的语音进行词表判断包括:
将所述待打断的语音与预设的词表进行匹配;
在所述待打断的语音匹配到所述预设的词表中的词语的情况下,对所述待打断的语音进行打断。
5.根据权利要求2所述的方法,其特征在于,在对待打断的语音进行语义打断判断之前,所述方法还包括:
对待打断的语音进行语音打断判断。
6.根据权利要求5所述的方法,其特征在于,对待打断的语音进行语音打断判断包括:
获取所述待打断的语音的语音参数,其中,所述语音参数包括以下至少之一:音量、时长、情感;
判断所述待打断的语音的语音参数是否符合预设的语音参数;
在所述待打断的语音的语音参数符合所述预设的语音参数的情况下,对所述待打断的语音进行打断;
在所述待打断的语音的语音参数不符合所述预设的语音参数的情况下,对所述待打断的语音进行语义打断判断。
7.根据权利要求1至6中任一项所述的方法,其特征在于,在所述匹配结果的分值大于或者等于预设分值的情况下,对所述待打断的语音进行打断之后,所述方法还包括:
对所述待打断的语音中的问题进行答复。
8.一种语音打断的处理装置,其特征在于,包括:
获取模块,用于获取在预定长度范围内的待打断的语音;
匹配模块,用于将所述待打断的语音与知识库中的语音进行匹配,得到匹配结果;
确定模块,用于确定所述匹配结果的分值;
打断模块,用于在所述匹配结果的分值大于或者等于预设分值的情况下,对所述待打断的语音进行打断。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行权利要求1至7中任意一项所述的语音打断的处理方法。
10.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至7中任意一项所述的语音打断的处理方法。
CN202010605308.4A 2020-06-29 2020-06-29 语音打断的处理方法和装置 Active CN111768781B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010605308.4A CN111768781B (zh) 2020-06-29 2020-06-29 语音打断的处理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010605308.4A CN111768781B (zh) 2020-06-29 2020-06-29 语音打断的处理方法和装置

Publications (2)

Publication Number Publication Date
CN111768781A true CN111768781A (zh) 2020-10-13
CN111768781B CN111768781B (zh) 2023-07-04

Family

ID=72724443

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010605308.4A Active CN111768781B (zh) 2020-06-29 2020-06-29 语音打断的处理方法和装置

Country Status (1)

Country Link
CN (1) CN111768781B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111970409A (zh) * 2020-10-21 2020-11-20 深圳追一科技有限公司 基于人机交互的语音处理方法、装置、设备和存储介质
CN113160817A (zh) * 2021-04-22 2021-07-23 平安科技(深圳)有限公司 基于意图识别的语音交互方法及系统
CN113345437A (zh) * 2021-08-06 2021-09-03 百融云创科技股份有限公司 语音打断方法及装置
CN113488024A (zh) * 2021-05-31 2021-10-08 杭州摸象大数据科技有限公司 一种基于语义识别的电话打断识别方法和系统
CN114238565A (zh) * 2021-12-09 2022-03-25 零犀(北京)科技有限公司 一种人机对话中智能打断的对话交互决策方法和装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070203698A1 (en) * 2005-01-10 2007-08-30 Daniel Mapes-Riordan Method and apparatus for speech disruption
CN102374864A (zh) * 2010-08-13 2012-03-14 国基电子(上海)有限公司 语音导航设备及语音导航方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070203698A1 (en) * 2005-01-10 2007-08-30 Daniel Mapes-Riordan Method and apparatus for speech disruption
CN102374864A (zh) * 2010-08-13 2012-03-14 国基电子(上海)有限公司 语音导航设备及语音导航方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111970409A (zh) * 2020-10-21 2020-11-20 深圳追一科技有限公司 基于人机交互的语音处理方法、装置、设备和存储介质
CN113160817A (zh) * 2021-04-22 2021-07-23 平安科技(深圳)有限公司 基于意图识别的语音交互方法及系统
CN113488024A (zh) * 2021-05-31 2021-10-08 杭州摸象大数据科技有限公司 一种基于语义识别的电话打断识别方法和系统
CN113345437A (zh) * 2021-08-06 2021-09-03 百融云创科技股份有限公司 语音打断方法及装置
CN113345437B (zh) * 2021-08-06 2021-10-29 百融云创科技股份有限公司 语音打断方法及装置
CN114238565A (zh) * 2021-12-09 2022-03-25 零犀(北京)科技有限公司 一种人机对话中智能打断的对话交互决策方法和装置

Also Published As

Publication number Publication date
CN111768781B (zh) 2023-07-04

Similar Documents

Publication Publication Date Title
CN111768781A (zh) 语音打断的处理方法和装置
CN112365894B (zh) 基于ai的复合语音交互方法、装置及计算机设备
CN103853703B (zh) 一种信息处理方法及电子设备
CN108682420B (zh) 一种音视频通话方言识别方法及终端设备
CN110597952A (zh) 信息处理方法、服务器及计算机存储介质
CN110890088B (zh) 语音信息反馈方法、装置、计算机设备和存储介质
CN110287318B (zh) 业务操作的检测方法及装置、存储介质、电子装置
CN109949830B (zh) 用户意图识别方法及设备
CN111078856A (zh) 一种群聊对话处理方法、装置及电子设备
CN114757176A (zh) 一种获取目标意图识别模型的方法以及意图识别方法
CN110704590A (zh) 扩充训练样本的方法和装置
CN112151034B (zh) 设备的语音控制方法、装置、电子设备及存储介质
CN112242135A (zh) 一种语音数据的处理方法及智能客服装置
CN109508367A (zh) 自动提取问答语料的方法、在线智能客服系统及电子设备
CN110362826A (zh) 基于人工智能的期刊投稿方法、设备及可读存储介质
CN110209768B (zh) 自动问答的问题处理方法和装置
CN110047473B (zh) 一种人机协作交互方法及系统
CN111339282A (zh) 智能在线应答方法及智能客服系统
CN107632813A (zh) 一种关闭闹钟功能的方法及装置
CN113572903A (zh) 呼叫中心人机耦合协同方法、装置、设备和存储介质
CN117556057A (zh) 知识问答方法、向量数据库构建方法及装置
CN114202363B (zh) 基于人工智能的话术调用方法、装置、计算机设备及介质
US20190179902A1 (en) Systems and methods for task automation using natural language processing
CN115114404A (zh) 智能客服的问答方法、装置、电子设备及计算机存储介质
CN111177347A (zh) 一种识别人机对话中坏例的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant