CN109285549A - 语音处理方法及装置 - Google Patents

语音处理方法及装置 Download PDF

Info

Publication number
CN109285549A
CN109285549A CN201710597965.7A CN201710597965A CN109285549A CN 109285549 A CN109285549 A CN 109285549A CN 201710597965 A CN201710597965 A CN 201710597965A CN 109285549 A CN109285549 A CN 109285549A
Authority
CN
China
Prior art keywords
user
voice messaging
voice
input
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710597965.7A
Other languages
English (en)
Inventor
谷贺
李欣睿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Didi Infinity Technology and Development Co Ltd
Original Assignee
Beijing Didi Infinity Technology and Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Didi Infinity Technology and Development Co Ltd filed Critical Beijing Didi Infinity Technology and Development Co Ltd
Priority to CN201710597965.7A priority Critical patent/CN109285549A/zh
Publication of CN109285549A publication Critical patent/CN109285549A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • H04M3/4936Speech interaction details
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/527Centralised call answering arrangements not requiring operator intervention

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明实施例提供一种语音处理方法及装置。该方法包括:获取用户在语音客服图标上触发的语音输入请求,接收用户输入的语音信息并对语音信息进行识别,根据语音信息,输出与语音信息对应的响应信息,实现了用户可以直接在语音客服图标上触发语音输入请求,接着输入语音信息,就可以获取到终端设备输出的与语音信息对应的响应信息,不需要再拨打客服电话,可以快捷地获取到客服服务,提高了沟通效率,从而,提高了用户体验。

Description

语音处理方法及装置
技术领域
本发明涉及计算机技术,尤其涉及一种语音处理方法及装置。
背景技术
随着通信技术和计算机技术的不断发展,越来越多的用户通过在出行平台预约网约车出行。用户在打开安装于终端设备上出行平台后,在出行平台的界面上输入出行信息,以便预定到对应的网约车进行出行。
目前,在司机端用户或者乘客端用户需要联系客服时,通常会直接拨打客服电话,通过人工服务解决。但是,这增加了客服部门的压力,在海量的用户都拨打客服电话时,客服部门无法同时满足用户的需求。因此,用户需要等待人工接听电话,进行沟通。这导致了沟通效率较低,用户体验不高。
发明内容
为解决现有技术中存在的问题,本发明提供一种语音处理方法及装置,以提高沟通效率,从而,提高用户体验。
第一方面,本发明实施例提供一种语音处理方法,包括:
获取用户在语音客服图标上触发的语音输入请求;
接收所述用户输入的语音信息并对所述语音信息进行识别;
根据所述语音信息,输出与所述语音信息对应的响应信息。
如上所示的方法中,在所述获取用户在语音客服图标上触发的语音输入请求之前,所述方法还包括:
显示引导信息;其中,所述引导信息用于引导所述用户触发所述语音客服图标。
如上所示的方法中,在所述接收所述用户输入的语音信息之后,所述方法还包括:
根据所述用户的实时音量,显示与所述实时音量对应的音量提示信息;其中,所述实时音量为在所述用户输入语音信息的过程中,根据预设的频率获取的所述用户的音量。
如上所示的方法中,在所述接收所述用户输入的语音信息之后,所述方法还包括:
根据所述语音信息的识别进度,显示与所述识别进度对应的第一进度条,所述第一进度条为预设长度的第一显示条中高亮显示的部分,所述识别进度用于指示所述语音信息的识别进度。
如上所示的方法中,在所述接收所述用户输入的语音信息之后,所述方法还包括:
根据所述语音信息的输入进度,显示与所述输入进度对应的第二进度条,所述第二进度条为预设长度的第二显示条中高亮显示的部分,所述第二进度条的长度大于所述第一进度条的长度,所述输入进度用于指示所述用户输入所述语音信息的进度,所述输入进度与所述用户输入所述语音信息的时间正相关。
如上所示的方法中,所述向所述用户发送与所述语音信息对应的响应信息之前,所述方法还包括:
向服务器发送包括所述语音信息的响应请求信息;
接收所述服务器根据所述响应请求信息确定的与所述语音信息对应的响应信息。
如上所示的方法中,所述与所述语音信息对应的响应信息包括以下信息的至少一种:
与所述语音信息对应的问题详情信息;
常见问题信息;
根据所述用户的历史操作及所述用户的属性信息确定的预测问题信息。
如上所示的方法中,所述输出与所述语音信息对应的响应信息之后,所述方法还包括:
接收所述用户根据所述响应信息触发的评价请求;
接收所述用户输入的评价信息;
向服务器发送所述评价信息。
第二方面,本发明实施例还提供一种语音处理装置,包括:
获取模块,用于获取用户在语音客服图标上触发的语音输入请求;
第一接收模块,用于接收所述用户输入的语音信息并对所述语音信息进行识别;
输出模块,用于根据所述语音信息,输出与所述语音信息对应的响应信息。
如上所示的装置中,所述装置还包括:
第一显示模块,用于显示引导信息;其中,所述引导信息用于引导所述用户触发所述语音客服图标。
如上所示的装置中,所述装置还包括:
第二显示模块,用于根据所述用户的实时音量,显示与所述实时音量对应的音量提示信息;其中,所述实时音量为在所述用户输入语音信息的过程中,根据预设的频率获取的所述用户的音量。
如上所示的装置中,所述装置还包括:
第三显示模块,用于根据所述语音信息的识别进度,显示与所述识别进度对应的第一进度条,所述第一进度条为预设长度的第一显示条中高亮显示的部分,所述识别进度用于指示所述语音信息的识别进度。
如上所示的装置中,所述装置还包括:
第四显示模块,用于根据所述语音信息的输入进度,显示与所述输入进度对应的第二进度条,所述第二进度条为预设长度的第二显示条中高亮显示的部分,所述第二进度条的长度大于所述第一进度条的长度,所述输入进度用于指示所述用户输入所述语音信息的进度,所述输入进度与所述用户输入所述语音信息的时间正相关。
如上所示的装置中,所述装置还包括:
第一发送模块,用于向服务器发送包括所述语音信息的响应请求信息;
第二接收模块,用于接收所述服务器根据所述响应请求信息确定的与所述语音信息对应的响应信息。
如上所示的装置中,所述与所述语音信息对应的响应信息包括以下信息的至少一种:
与所述语音信息对应的问题详情信息;
常见问题信息;
根据所述用户的历史操作及所述用户的属性信息确定的预测问题信息。
如上所示的装置中,所述第一接收模块还用于接收所述用户根据所述响应信息触发的评价请求;
所述第一接收模块还用于接收所述用户输入的评价信息;
所述装置还包括:
第二发送模块,用于向服务器发送所述评价信息。
本发明实施例提供的语音处理方法及装置,通过获取用户在语音客服图标上触发的语音输入请求,接收用户输入的语音信息并对语音信息进行识别,根据语音信息,输出与语音信息对应的响应信息,实现了用户可以直接在语音客服图标上触发语音输入请求,接着输入语音信息,就可以获取到终端设备输出的与语音信息对应的响应信息,不需要再拨打客服电话,可以快捷地获取到客服服务,提高了沟通效率,从而,提高了用户体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的语音处理方法的应用场景的示意图;
图2为本发明实施例提供的语音处理方法实施例的流程示意图;
图3A为图2所示实施例中一种用户界面的示意图;
图3B为图2所示实施例中另一种用户界面的示意图;
图3C为图2所示实施例中又一种用户界面的示意图;
图3D为图2所示实施例中再一种用户界面的示意图;
图3E为图2所示实施例中另一种用户界面的示意图;
图3F为图2所示实施例中另一种用户界面的示意图;
图3G为图2所示实施例中另一种用户界面的示意图;
图4为本发明实施例提供的语音处理装置实施例的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”及“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
图1为本发明实施例提供的语音处理方法的应用场景的示意图。如图1所示,本发明实施例提供的语音处理方法可以应用于终端设备11与服务器12进行交互,以获取客服服务的过程中。本发明实施例提供的语音处理方法,通过获取用户在语音客服图标上触发的语音输入请求,接收用户输入的语音信息并对语音信息进行识别,根据语音信息,输出与语音信息对应的响应信息,实现了用户可以直接在语音客服图标上触发语音输入请求,接着输入语音信息,就可以获取到终端设备输出的与语音信息对应的响应信息,不需要再拨打客服电话,可以快捷地获取到客服服务,提高了沟通效率,从而,提高了用户体验。
图2为本发明实施例提供的语音处理方法实施例的流程示意图。如图2所示,本发明实施例提供的语音处理方法包括如下步骤:
S201:获取用户在语音客服图标上触发的语音输入请求。
具体地,本发明实施例提供的语音处理方法的执行主体可以是终端设备。本发明实施例中的终端设备可以是手持设备、车载设备、可穿戴设备、计算设备,以及各种形式的用户设备(User Equipment,UE),移动台(Mobile Station,MS)及终端(terminal)等。
本发明实施例提供的语音处理方法可以应用于运输服务、出行服务或者网上购物服务等业务场景中,用户需要联系客服的情境中。示例性地,本发明实施例提供的语音处理方法可以由安装有出行平台的终端设备执行,可以具体应用于出行服务中,则用户可以是司机端用户,或者乘客端用户。本发明实施例中的出行平台指的是可以实现预约网约车功能的应用程序(Application,APP)。
本发明实施例中的语音客服图标可以显示在用户界面中。这里的用户界面可以是用户通过客服入口进入的用户界面,也可以是服务运行的主界面。语音客服图标可以是耳麦的图标、麦克风的图标、机器人的图标以及图形与文字结合的图标等用于表明语音客服入口的图标。图3A为图2所示实施例中一种用户界面的示意图。如图3A所示,用户界面301上的语音客服图标302为机器人图标。用户界面301为用户通过客服入口进入的用户界面。
用户可以通过触摸操作在语音客服图标上触发语音输入请求。这里的触摸操作可以是点击、长按、重压以及双击等。
可选的,为了进一步引导用户在语音客服图标上触发语音输入请求,本发明实施例提供的语音处理方法还可以在S201之前显示引导信息。该引导信息用于引导用户触发语音客服图标。引导信息可以以文字、图形、颜色、亮度或者动效等方式示出。引导信息可以显示在语音客服图标上,也可以显示在语音客服图标的周围。例如,引导信息可以是显示在语音客服图标上突出显示的颜色,或者,可以是显示在语音客服图标上动效。这里的动效可以是语音客服图标晃动、改变大小或者改变颜色等以醒目方式引导用户触发语音客服图标。图3B为图2所示实施例中另一种用户界面的示意图。如图3B所示,用户界面303上的引导信息304为语音客服图标302下方的文字。
S202:接收用户输入的语音信息并对语音信息进行识别。
具体地,终端设备在获取到用户触发的语音输入请求之后,即可以接收用户输入的语音信息,并对语音信息进行识别。
一种实现方式中,可以是终端设备在接收到用户输入的语音信息后,对语音信息进行识别。另一种实现方式中,可以是终端设备在接收到用户输入的语音信息后,将语音信息发送给服务器,由服务器进行识别。这里的识别指的是语音识别,即,将语音信息识别为文字信息的过程。
可选的,终端设备还可以在获取到用户触发的语音输入请求之后,在检测到麦克风没有打开时,打开麦克风,以实现接收用户输入的语音信息。
需要说明的是,当S201中用户触发语音输入请求的操作为点击操作时,则在执行完S201之后,终端设备执行S202,即,用户在点击了语音客服图标后,输入语音信息。用户可以再次点击语音客服图标表明输入结束;用户也可以在预设时长内不再输入语音信息以表明输入结束,则终端设备在预设时长内没有接收到语音信息时,确定输入结束。当S201中用户触发语音输入请求的操作为长按操作时,则在执行S201的同时,执行S202,即,用户在按住语音客服图标的同时,输入语音信息。用户可以结束长按以表明输入结束,则终端设备在检测不到语音输入请求时,确定输入结束。图3C为图2所示实施例中又一种用户界面的示意图。如图3C所示,用户界面306中,用户通过长按操作触发语音输入请求,用户在长按语音客服图标的同时,输入语音信息。
一种实现方式中,为了进一步提高用户体验,本发明实施例提供的语音处理方法可以在接收用户输入的语音信息之后,根据用户的实时音量,显示与实时音量对应的音量提示信息。其中,实时音量为在用户输入语音信息的过程中,根据预设的频率获取的用户的音量。即,终端设备可以在用户输入语音信息时,以预设的频率获取用户的实时音量,具体可以是通过麦克风获取用户的音量,并显示与实时音量对应的音量提示信息。
可选的,音量提示信息可以是声波形状或者喇叭形状等。当音量提示信息为声波形状时,声波的长度可以正相关于用户的音量。即,声波的长度越长,表明用户的音量越大。当音量提示信息为喇叭形状时,喇叭口的面积可以正相关于用户的音量。即,喇叭口的面积越大,表明用户的音量越大。在用户输入语音信息的过程中,根据实时音量的不同,音量提示信息动态地变化。
可选的,音量提示信息还是预设长度的声波形状中高亮显示的一段声波的长度,并且,该高亮显示的声波的长度正相关于用户的音量。预设长度的声波形状的长度正相关于终端设备能感知到的最大音量。
更具体地,可以是以语音客服图标作为中心对称点,在语音客服图标的周围对称地显示多个相同的声波。图3D为图2所示实施例中再一种用户界面的示意图。如图3D所示,在用户界面307中,在语音客服图标302的左右两侧,对称地显示两个声波308。
通过显示与实时音量对应的音量提示信息,可以使用户直观地感受到输入的音量,便于用户调整音量,进一步提高了用户体验。
另一种实现方式中,本发明实施例提供的语音处理方法可以在接收用户输入的语音信息之后,除了显示用户的音量之外,还可以根据语音信息的识别进度,显示与识别进度对应的第一进度条。其中,第一进度条为预设长度的第一显示条中高亮显示的部分。识别进度用于指示语音信息的识别进度。识别过程可以是终端设备执行的,也可以是服务器执行的。当识别过程为服务器执行时,在用户输入语音信息的过程中,终端设备可以和服务器进行交互,以实现终端设备确定出语音信息的识别进度,并显示与识别进度对应的第一进度条。第一显示条可以是弧形,则第一进度条也为弧形。第一进度条的长度正相关于语音信息的识别进度。高亮显示意为第一进度条的颜色和/或亮度与第一显示条中的其他部分不同,以将第一进度条与第一显示条中的其他部分作一区分。
再一种实现方式中,本发明实施例提供的语音处理方法可以在接收用户输入的语音信息之后,除了显示用户的音量,还可以根据语音信息的输入进度,显示与输入进度对应的第二进度条。第二进度条为预设长度的第二显示条中高亮显示的部分,第二进度条的长度大于第一进度条的长度。输入进度用于指示用户输入语音信息的进度。终端设备可以根据语音信息输入的时间确定语音信息的输入进度。可选的,输入进度与用户输入语音信息的时间正相关,则第二显示条的长度用于指示用户能输入语音信息的最大时长。第二显示条可以是弧形,则第二进度条也为弧形。第二进度条的长度正相关于语音信息的输入进度。高亮显示意为第二进度条的颜色和/或亮度与第二显示条中的其他部分不同,以将第二进度条与第二显示条中的其他部分作一区分。请继续参照图3D,在用户界面307中,在语音客服图标302的上方显示有第二显示条309和第二进度条310。该用户界面307中,第二进度条310与第二显示条309中其他部分的颜色不同。通过显示第二进度条,可以使用户直观地感受到语音输入的进度,从而,使用户根据输入的进度调整语句,以实现在终端设备能接收到的语音信息的最长输入时长内完成语音信息的输入。
又一种实现方式中,本发明实施例提供的语音处理方法可以在接收用户输入的语音信息之后,同时显示用户的音量、输入进度和识别进度。图3E为图2所示实施例中另一种用户界面的示意图。如图3E所示,在用户界面311中,在语音客服图标302的下方显示有第一显示条312和第一进度条313,在语音客服图标302的上方显示有第二显示条309和第二进度条310,在语音客服图标302的左右两侧对称地显示声波308。
可以理解的是,因为识别语音信息需要花费时间,因此,输入进度应该大于识别进度,即,第二进度条的长度大于第一进度条的长度。通过同时显示第一进度条和第二进度条,可以使用户在观察到第一进度条和第二进度条的长度差距较大时,放慢语速,以使语音信息可以被准确识别。
S203:根据语音信息,输出与语音信息对应的响应信息。
具体地,终端设备在接收到语音信息后,可以根据语音信息,输出与语音信息对应的响应信息。响应信息包括以下信息的至少一种:与语音信息对应的问题详情信息;常见问题信息;根据用户的历史操作及用户的属性信息确定的预测问题信息。终端设备输出与语音信息对应的响应信息的方式可以是在用户界面上以文本信息的形式显示响应信息。
终端设备可以从服务器中获取与语音信息对应的响应信息,具体过程为:向服务器发送包括语音信息的响应请求信息,接收服务器根据响应请求信息确定的与语音信息对应的响应信息。
服务器从终端设备接收到语音信息后,先进行语音识别,将语音信息识别为文字信息,之后,对文字信息进行语义分析。
服务器中存储有常见问题及答案数据库。常见问题可以根据所有用户的历史输入进行确定。如果服务器经过语义分析,确定用户输入的语音信息命中了某个问题,则响应信息为与语音信息对应的问题详情信息。问题详情信息中包括问题以及答案等信息。服务器将问题详情信息发送给终端设备,终端设备以文字方式进行显示。如果服务器经过语义分析,确定用户输入的语音信息没有命中问题,则服务器可以将常见问题信息发送给终端设备,终端设备以文字方式进行显示。与此同时,服务器还可以根据预先确定的问题预测模型,确定预测问题信息。问题预测模型为根据用户的历史操作以及用户的属性信息确定的模型。用户的属性信息可以是用户的年龄以及性别等个人信息。图3F为图2所示实施例中另一种用户界面的示意图。如图3F所示,用户界面314示出了响应信息为与语音信息对应的问题详情信息。用户界面315示出了响应信息为常见问题信息和预测问题信息,其中的“猜你想问”即为预测问题信息。
为了获取用户对响应信息的评价,可以在S203之后,接收用户根据响应信息触发的评价请求,接收用户输入的评价信息,向服务器发送评价信息。用户可以通过点击输出响应信息的页面中的评价按钮触发评价请求,之后,输入评价信息,评价信息可以是有帮助或者没帮助。终端设备将评价信息发送给服务器以使服务器根据评价信息调整发送响应信息的策略。需要说明的是,用户触发评价请求和输入的评价信息的操作可以是同一个操作。图3G为图2所示实施例中另一种用户界面的示意图。如图3G所示,用户界面316示出了用户通过点击评价按钮,之后选择有帮助还是没有帮助。用户界面317示出了用户直接点击响应界面上的有帮助对应的图标或者没有帮助对应的图标。通过接收用户的评价信息,可以使服务器根据评价信息调整响应信息的匹配策略,以使响应信息对用户有帮助,从而,进一步提高用户体验。
以下举例说明本发明实施例的应用场景:司机吴师傅是新的快车车主,因为年纪大,视力不太好,不方便打字搜索问题。在看到了语音客服图标后,吴师傅点击说话,例如“9点钟接单,乘客遗失物品在车上,想要联系该乘客”。终端设备将该与语音信息发送给服务器。服务器判断该语音信息命中问题“乘客遗失物品”,则服务器向终端设备发送该问题详情信息。该详情信息可以是提示吴师傅:“如果您想联系遗落物品的乘客请拨1健,客服将自动为您拨打该乘客电话”,更加高效便捷地解决司机与乘客的问题,也能增加在线客服的使用率,减少人工客服的使用率。
本发明实施例提供的语音处理方法,通过获取用户在语音客服图标上触发的语音输入请求,接收用户输入的语音信息并对语音信息进行识别,根据语音信息,输出与语音信息对应的响应信息,实现了用户可以直接在语音客服图标上触发语音输入请求,接着输入语音信息,就可以获取到终端设备输出的与语音信息对应的响应信息,不需要再拨打客服电话,可以快捷地获取到客服服务,提高了沟通效率,从而,提高了用户体验。
图4为本发明实施例提供的语音处理装置实施例的流程示意图。如图4所示,本发明实施例提供的语音处理装置包括如下模块:获取模块41、第一接收模块42及输出模块43。
获取模块41,用于获取用户在语音客服图标上触发的语音输入请求。
第一接收模块42,用于接收用户输入的语音信息并对语音信息进行识别。
输出模块43,用于根据语音信息,输出与语音信息对应的响应信息。
可选的,本发明实施例提供的语音处理装置还包括:第一显示模块,用于显示引导信息。其中,引导信息用于引导用户触发语音客服图标。
一种实现方式中,本发明实施例提供的语音处理装置还包括:第二显示模块,用于根据用户的实时音量,显示与实时音量对应的音量提示信息。其中,实时音量为在用户输入语音信息的过程中,根据预设的频率获取的用户的音量。
另一种实现方式中,本发明实施例提供的语音处理装置还包括:第三显示模块,用于根据语音信息的识别进度,显示与识别进度对应的第一进度条。第一进度条为预设长度的第一显示条中高亮显示的部分,识别进度用于指示语音信息的识别进度。
再一种实现方式中,本发明实施例提供的语音处理装置还包括:第四显示模块,用于根据语音信息的输入进度,显示与输入进度对应的第二进度条。第二进度条为预设长度的第二显示条中高亮显示的部分,第二进度条的长度大于第一进度条的长度,输入进度用于指示用户输入语音信息的进度,输入进度与用户输入语音信息的时间正相关。
需要说明的是,本发明实施例提供的语音处理装置除了包括获取模块41、第一接收模块42及输出模块43之外,还可以包括第一显示模块、第二显示模块、第三显示模块以及第四显示模块中的任一个或多个。
可选的,本发明实施例提供的语音处理装置还包括:第一发送模块,用于向服务器发送包括语音信息的响应请求信息;第二接收模块,用于接收服务器根据响应请求信息确定的与语音信息对应的响应信息。其中,与语音信息对应的响应信息包括以下信息的至少一种:与语音信息对应的问题详情信息、常见问题信息、根据用户的历史操作及用户的属性信息确定的预测问题信息。
一种实现方式中,第一接收模块42还用于接收用户根据响应信息触发的评价请求,第一接收模块42还用于接收用户输入的评价信息。相应地,本发明实施例提供的语音处理装置还包括第二发送模块,用于向服务器发送评价信息。
本发明实施例提供的语音处理装置具体可用于执行图2所示实施例中的语音处理方法,其实现过程和技术原理类似,此处不再赘述。
本发明实施例提供的语音处理装置,通过设置获取模块,用于获取用户在语音客服图标上触发的语音输入请求,第一接收模块,用于接收用户输入的语音信息并对语音信息进行识别,输出模块,用于根据语音信息,输出与语音信息对应的响应信息,实现了用户可以直接在语音客服图标上触发语音输入请求,接着输入语音信息,就可以获取到终端设备输出的与语音信息对应的响应信息,不需要再拨打客服电话,可以快捷地获取到客服服务,提高了沟通效率,从而,提高了用户体验。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (16)

1.一种语音处理方法,其特征在于,包括:
获取用户在语音客服图标上触发的语音输入请求;
接收所述用户输入的语音信息并对所述语音信息进行识别;
根据所述语音信息,输出与所述语音信息对应的响应信息。
2.根据权利要求1所述的方法,其特征在于,在所述获取用户在语音客服图标上触发的语音输入请求之前,所述方法还包括:
显示引导信息;其中,所述引导信息用于引导所述用户触发所述语音客服图标。
3.根据权利要求1或2所述的方法,其特征在于,在所述接收所述用户输入的语音信息之后,所述方法还包括:
根据所述用户的实时音量,显示与所述实时音量对应的音量提示信息;其中,所述实时音量为在所述用户输入语音信息的过程中,根据预设的频率获取的所述用户的音量。
4.根据权利要求1或2所述的方法,其特征在于,在所述接收所述用户输入的语音信息之后,所述方法还包括:
根据所述语音信息的识别进度,显示与所述识别进度对应的第一进度条,所述第一进度条为预设长度的第一显示条中高亮显示的部分,所述识别进度用于指示所述语音信息的识别进度。
5.根据权利要求4所述的方法,其特征在于,在所述接收所述用户输入的语音信息之后,所述方法还包括:
根据所述语音信息的输入进度,显示与所述输入进度对应的第二进度条,所述第二进度条为预设长度的第二显示条中高亮显示的部分,所述第二进度条的长度大于所述第一进度条的长度,所述输入进度用于指示所述用户输入所述语音信息的进度,所述输入进度与所述用户输入所述语音信息的时间正相关。
6.根据权利要求1或2所述的方法,其特征在于,所述输出与所述语音信息对应的响应信息之前,所述方法还包括:
向服务器发送包括所述语音信息的响应请求信息;
接收所述服务器根据所述响应请求信息确定的与所述语音信息对应的响应信息。
7.根据权利要求1或2所述的方法,其特征在于,所述与所述语音信息对应的响应信息包括以下信息的至少一种:
与所述语音信息对应的问题详情信息;
常见问题信息;
根据所述用户的历史操作及所述用户的属性信息确定的预测问题信息。
8.根据权利要求7所述的方法,其特征在于,所述输出与所述语音信息对应的响应信息之后,所述方法还包括:
接收所述用户根据所述响应信息触发的评价请求;
接收所述用户输入的评价信息;
向服务器发送所述评价信息。
9.一种语音处理装置,其特征在于,包括:
获取模块,用于获取用户在语音客服图标上触发的语音输入请求;
第一接收模块,用于接收所述用户输入的语音信息并对所述语音信息进行识别;
输出模块,用于根据所述语音信息,输出与所述语音信息对应的响应信息。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括:
第一显示模块,用于显示引导信息;其中,所述引导信息用于引导所述用户触发所述语音客服图标。
11.根据权利要求9或10所述的装置,其特征在于,所述装置还包括:
第二显示模块,用于根据所述用户的实时音量,显示与所述实时音量对应的音量提示信息;其中,所述实时音量为在所述用户输入语音信息的过程中,根据预设的频率获取的所述用户的音量。
12.根据权利要求9或10所述的装置,其特征在于,所述装置还包括:
第三显示模块,用于根据所述语音信息的识别进度,显示与所述识别进度对应的第一进度条,所述第一进度条为预设长度的第一显示条中高亮显示的部分,所述识别进度用于指示所述语音信息的识别进度。
13.根据权利要求12所述的装置,其特征在于,所述装置还包括:
第四显示模块,用于根据所述语音信息的输入进度,显示与所述输入进度对应的第二进度条,所述第二进度条为预设长度的第二显示条中高亮显示的部分,所述第二进度条的长度大于所述第一进度条的长度,所述输入进度用于指示所述用户输入所述语音信息的进度,所述输入进度与所述用户输入所述语音信息的时间正相关。
14.根据权利要求9或10所述的装置法,其特征在于,所述装置还包括:
第一发送模块,用于向服务器发送包括所述语音信息的响应请求信息;
第二接收模块,用于接收所述服务器根据所述响应请求信息确定的与所述语音信息对应的响应信息。
15.根据权利要求9或10所述的装置,其特征在于,所述与所述语音信息对应的响应信息包括以下信息的至少一种:
与所述语音信息对应的问题详情信息;
常见问题信息;
根据所述用户的历史操作及所述用户的属性信息确定的预测问题信息。
16.根据权利要求15所述的装置,其特征在于,
所述第一接收模块还用于接收所述用户根据所述响应信息触发的评价请求;
所述第一接收模块还用于接收所述用户输入的评价信息;
所述装置还包括:
第二发送模块,用于向服务器发送所述评价信息。
CN201710597965.7A 2017-07-20 2017-07-20 语音处理方法及装置 Pending CN109285549A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710597965.7A CN109285549A (zh) 2017-07-20 2017-07-20 语音处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710597965.7A CN109285549A (zh) 2017-07-20 2017-07-20 语音处理方法及装置

Publications (1)

Publication Number Publication Date
CN109285549A true CN109285549A (zh) 2019-01-29

Family

ID=65185034

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710597965.7A Pending CN109285549A (zh) 2017-07-20 2017-07-20 语音处理方法及装置

Country Status (1)

Country Link
CN (1) CN109285549A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110767222A (zh) * 2019-06-19 2020-02-07 北京嘀嘀无限科技发展有限公司 一种接单方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7292986B1 (en) * 1999-10-20 2007-11-06 Microsoft Corporation Method and apparatus for displaying speech recognition progress
CN102520788A (zh) * 2011-11-16 2012-06-27 歌尔声学股份有限公司 一种语音识别控制方法
US20140267022A1 (en) * 2013-03-14 2014-09-18 Samsung Electronics Co ., Ltd. Input control method and electronic device supporting the same
CN104135564A (zh) * 2014-07-14 2014-11-05 掌赢信息科技(上海)有限公司 即时通讯程序的多模式输入切换方法、显示界面及其装置
CN105117195A (zh) * 2015-09-09 2015-12-02 百度在线网络技术(北京)有限公司 语音输入的引导方法和装置
CN106648535A (zh) * 2016-12-28 2017-05-10 广州虎牙信息科技有限公司 直播客户端语音输入方法及终端设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7292986B1 (en) * 1999-10-20 2007-11-06 Microsoft Corporation Method and apparatus for displaying speech recognition progress
CN102520788A (zh) * 2011-11-16 2012-06-27 歌尔声学股份有限公司 一种语音识别控制方法
US20140267022A1 (en) * 2013-03-14 2014-09-18 Samsung Electronics Co ., Ltd. Input control method and electronic device supporting the same
CN104135564A (zh) * 2014-07-14 2014-11-05 掌赢信息科技(上海)有限公司 即时通讯程序的多模式输入切换方法、显示界面及其装置
CN105117195A (zh) * 2015-09-09 2015-12-02 百度在线网络技术(北京)有限公司 语音输入的引导方法和装置
CN106648535A (zh) * 2016-12-28 2017-05-10 广州虎牙信息科技有限公司 直播客户端语音输入方法及终端设备

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110767222A (zh) * 2019-06-19 2020-02-07 北京嘀嘀无限科技发展有限公司 一种接单方法及装置
CN110767222B (zh) * 2019-06-19 2021-03-09 北京嘀嘀无限科技发展有限公司 一种接单方法及装置
CN113012696A (zh) * 2019-06-19 2021-06-22 北京嘀嘀无限科技发展有限公司 一种接单方法及设备、介质、程序产品

Similar Documents

Publication Publication Date Title
US11810562B2 (en) Reducing the need for manual start/end-pointing and trigger phrases
US10748534B2 (en) Personality-based chatbot and methods including non-text input
EP3511887A1 (en) Automated chat assistant for providing interactive data using npl - natural language processing - system and method
US20180262834A1 (en) Terminal and vehicle control method of mobile terminal using machine learning
CN109243432A (zh) 话音处理方法以及支持该话音处理方法的电子设备
CN106558310A (zh) 虚拟现实语音控制方法及装置
KR20190031167A (ko) 전자 장치 및 이의 제어 방법
CN110462647B (zh) 电子设备及执行电子设备的功能的方法
CN105988581A (zh) 一种语音输入方法及装置
CN110473537A (zh) 语音技能的控制方法、装置、设备及存储介质
CN117061487A (zh) 语音响应系统的图形用户界面
CN111144906A (zh) 一种数据处理方法、装置及电子设备
CN113835570A (zh) 车辆中显示屏的控制方法、装置、设备、存储介质及程序
CN109285549A (zh) 语音处理方法及装置
CN107622300A (zh) 多模态虚拟机器人的认知决策方法和系统
CN103646644A (zh) 一种获取语音识别业务信息认可度的方法和装置
CN109522543B (zh) 一种信息处理方法及终端设备
CN112651526A (zh) 预约目标业务的方法、装置、设备以及存储介质
CN112632241A (zh) 智能会话的方法、装置、设备和计算机可读介质
CN110019692A (zh) 搜索处理方法及装置
CN109726277B (zh) 一种数据处理方法及装置
CN111782061B (zh) 用于推荐智能手表的输入方式的方法和装置
CN112840307B (zh) 语句处理方法及相关装置
CN117238287A (zh) 一种语音数据处理方法及装置
CN116938856A (zh) 消息处理方法、装置、设备、存储介质及程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190129

RJ01 Rejection of invention patent application after publication