具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
随着社会的发展,我国劳动密集型和服务型企业蓬勃发展,对于这些企业中以沟通为主要应用场景的岗位(例如客服、催收、电销等),需要员工熟练掌握基本话术以为客户提供良好的服务。为了缩短培训周期,同时方便企业掌握员工的培训情况,目前部分企业采用线上培训系统对新员工进行系统培训。
情景对练作为线上培训系统重要的组成部分,可以模拟实际工作中会遇到的对话内容用于对员工进行训练。但现有的情景对练方式是固定的,客户问一句,员工答一句,员工回答完毕之后客户再问下一句。员工按这种方式进行训练时对话真实感不够,从而会导致训练效果不佳。
因此,为了克服上述缺陷,本申请的发明人提出了一种情景对练方法、装置、电子设备和存储介质,涉及互联网领域。该情景对练方法包括:确定本轮对话是否为预设打断位置;若为预设打断位置,则实时采集员工的对话音频作为已采集音频,并对已采集音频进行检测;根据已采集音频的检测结果确定本轮对话是否满足预设打断条件;若满足预设打断条件,则停止采集本轮对话中员工后续的对话音频,并开启下一轮对话。由此,可以在员工当前已采集音频满足预设打断条件时,停止继续采集员工后续的音频以达到打断员工继续作答的效果。增加了员工训练过程中的真实性和紧张感,可以有效提高员工的心理素质和训练效果。
下面将结合具体实施例对其进行介绍。
请参阅图1,图1示出了本申请实施例提供的一种情景对练方法,应用于客户端,具体可以是线上培训系统的员工客户端。具体地,该方法可以包括步骤110至步骤140。
在步骤110中,确定本轮对话是否为预设打断位置。
在本申请实施例中,若情景对话模块中某轮对话需要判断已采集音频是否满足预设打断条件,则该轮对话为预设打断位置;一个情景对话模块中可以包括一轮或多轮对话,一个情景对话模块中也可以包括一个或多个预设打断位置,即一个情景对话模块中可以包括一轮或多轮对话需要判断已采集音频是否满足预设打断条件。
其中,情景对练模块中与员工进行对话的为虚拟客户,虚拟客户和员工之间一问一答即视为一轮对话;一轮对话中若虚拟客户为提问方,则员工是回答方,若员工为提问方,则虚拟客户为回答方。其中,员工是指使用线上培训系统的客户端以练习话术的新入职员工。
在本申请实施例中,已采集音频是指每轮对话中实时采集到的员工的对话音频;由于在情景对话模块中员工可以是提问方,也可以是回答方,因此员工的对话音频可以包括提问音频和回答音频。需要说明的是,情景对练模块可以是线上培训系统中用于员工进行情景对话的模块,该模块可以是专门的练习模块,也可以是考核中包括的考核子模块,为了方便进行解释说明,本申请中所说的情景对练模块为练习模块。
作为一种实施方式,可以是在进行本轮对话前,确定本轮对话是否为预设打断位置。其中,这里所说的本轮对话前是指无论提问方是虚拟客户还是员工,均在进行本轮对话前确定本轮对话是否为预设打断位置。也就是说,在结束一轮对话之后开启新一轮对话之前,需要先确定即将开启的对话是否为预设打断位置。
作为另一种实施方式,也可以是在采集员工的对话音频前,确定本轮对话是否为预设打断位置。具体地,若员工是提问方,则在进行本轮对话前确定本轮对话是否为预设打断位置;若员工为回答方,则在本轮对话中虚拟客户提问结束后确定本轮对话是否为预设打断位置。
在一些实施方式中,预设打断位置可以存在第一预设标识,即若本轮对话存在第一预设标识,则可以确定本轮对话为预设打断位置。
在一些实施方式中,每个情景对练模块中的虚拟客户可以根据员工的用户画像确定。例如:若员工的用户画像为温柔型,则可以为其匹配声音和语气较凶的虚拟客户。
在步骤120中,若为预设打断位置,则实时采集员工的对话音频作为已采集音频,并对已采集音频进行检测。
在本申请实施例中,若检测确定本轮对话为预设打断位置,则实时采集本轮对话中员工的对话音频作为已采集音频,然后对实时得到的已采集音频进行检测。也就是说,实时采集员工的对话音频,并实时对采集得到的音频进行检测。其中,当本轮对话为预设打断位置时,可以是对实时采集到的已采集音频中的预设信息进行检测,预设信息可以例如是语义、关键词等信息中的任一种。具体如何检测将在下文进行介绍,在此不再进行赘述。
作为一种实施方式,若确定本轮对话不为预设打断位置,则采集员工在本轮对话中的全部对话音频作为待检测音频,并检测待检测音频与本轮对话中员工的标准话术之间的内容相似度,即检测待检测音频和标准话术对应的文本的相似度;之后根据检测结果对本轮对话中员工的待检测音频进行打分,确定员工对本轮对话中知识点的掌握情况。
在一些实施方式中,客户端可以通过音频采集模块采集员工的对话音频,音频采集模块可以例如是麦克风、麦克风阵列等。
在步骤130中,根据已采集音频的检测结果确定本轮对话是否满足预设打断条件。
在本申请实施例中,在本轮对话为预设打断位置的情况下,对实时采集到的已采集音频中的预设信息进行检测,从而可以根据检测结果确定本轮对话是否满足预设打断条件。也就是说,即使本轮对话为预设打断位置,也不一定满足预设打断条件。
在步骤140中,若满足预设打断条件,则停止采集本轮对话中员工后续的对话音频,并开启下一轮对话。
在本申请实施例中,当实时采集到的已采集音频的实时检测结果满足预设打断条件后,客户端停止采集本轮对话中员工后续的对话音频,即不再通过音频采集模块采集员工后续的对话音频,并开启下一轮对话。通过在员工说话中途进行打断,可以模拟真实对话中客户因为不耐烦或者其他原因员工说话的场景,能增加员工对话过程中的紧张感,并且可以通过这种方式可以锻炼员工的心理素质。
作为一种实施方式,若直到员工在本轮对话中说完全部对话音频后已采集音频仍不满足预设打断条件,则正常检测员工在本轮对话中的对话音频。具体地,若直到员工在本轮对话中说完全部对话音频得到待检测音频后,已采集音频仍不满足预设打断条件,则检测本轮对话中员工的待检测音频与标准话术之间的内容相似度。
进一步地,当本轮对话不为预设打断位置或者为预设打断位置但不满足预设打断条件时,还可以同时检测待检测音频和标准话术之间的内容相似度和语义相似度,并根据内容相似度和语义相似度综合进行打分。具体地,内容相似度对应的权重为第一权重,语义相似度对应的权重为第二权重,则在确定内容相似度和语义相似度后,可以根据内容相似度、第一权重、语义相似度和第二权重确定本轮对话中员工的待检测音频的分值。其中,可以通过预先训练好的模型确定内容相似度和语义相似度。
示例性的,本轮对话为100分制,第一权重为0.4,第二权重为0.6,检测确定内容相似度为92%,语义相似度为98%,则待检测音频的分值=(0.4×92%+0.6×98%)×100%=95.6。
在一些实施方式中,该实时采集员工的对话音频作为已采集音频,并对已采集音频进行检测之前,还可以包括:
(1)根据本轮对话中员工对应的标准话术的标准对话时长确定预设采集时长;
该实时采集员工的对话音频作为已采集音频,并对已采集音频进行检测的步骤,可以包括:
(2)在本轮对话中实时采集员工的预设采集时长的对话音频作为已采集音频,并实时对已采集音频进行语义识别得到第一语义;
该根据已采集音频的检测结果确定本轮对话是否满足预设打断条件的步骤,可以包括:
(3)若第一语义和标准话术中前预设采集时长的话术对应的第二语义之间的语义相似度低于第一阈值,则确定本轮对话满足预设打断条件。
在本实施例中,标准对话时长是指以预设的标准语速说完标准话术所需时长;第一语义为时长为预设采集时长的已采集音频对应的语义;第二语义为标准话术中前预设采集时长的话术对应的语义。
具体地,确定本轮对话中员工对应的标准话术的标准对话时长,然后按预设规则确定预设采集时长;然后在本轮对话中实时采集员工预设采集时长的对话音频,并将其作为已采集音频;对实时采集得到的已采集音频进行实时的语义识别,以确定当前的已采集音频对应的第一语义;之后确定标准话术中前预设采集时长的话术对应的第二语义,并确定第一语义和第二语义之间的语义相似度;若语义相似度低于第一阈值,则确定本轮对话满足预设打断条件,从而停止采集本轮对话中员工后续的对话音频。其中,预设采集时长小于或等于标准话术时长。
作为一种实施方式,预设规则可以是根据标准话术时长和预设百分比确定预设采集时长。例如,标准话术时长为30s(秒),预设百分比为50%,则预设采集时长为15s.
需要说明的,预设采集时长的标准话术对应的第二语义是指标准话术中前预设采集时长的话术对应的语义。因此,第一语义和预设采集时长的标准话术对应的第二语义之间的语义相似度是指,当前已采集到的预设采集时长的已采集音频对应的第一语义和标准话术中前预设采集时长的话术的第二语义之间的语义相似度。例如:预设采集时长为15s,则确定15s的已采集音频对应的第一语义和标准话术中前15s对应的第二语义之间语义相似度。
可以理解的,若确定预设采集时长的已采集音频对应的第一语义和标准话术前预设采集时长的话术对应第二语义之间的语义相似度低于第一阈值,则可以认为员工在本轮对话中在预设采集时长内的对话内容与标准答案中前预设采集时长的内容相差很大,进而可以认为员工对本轮对话中的知识点掌握得很差,因此可以直接打断员工继续说话,将员工本轮对话的分值赋0,并进入下一轮对话。
在一些实施方式中,该对已采集音频进行检测的步骤,可以包括:
(1.1)对已采集音频进行语义识别得到第三语义;
该根据已采集音频的检测结果确定本轮对话是否满足预设打断条件的步骤,可以包括:
(1.2)确定第三语义与本轮对话中员工对应的标准话术的第四语义之间的语义相似度;
(1.3)若语义相似度超过第二阈值,则确定本轮对话满足预设打断条件。
在本申请实施例中,第三语义为实时采集到的已采集音频对应的语义;第四语义为整个标准话术对应的语义。
具体地,若确定本轮对话为预设打断位置,则实时采集员工的对话音频得到已采集音频,然后对已采集音频进行实时的语义识别得到第三语义;确定已采集音频对应的第三语义和本轮对话中员工对应的标准话术对应的第四语义之间的语义相似度。若确定第三语义和第四语义相似度超过第二阈值,则可以认为员工对本轮对话对应的知识点掌握得很好,从而确定本轮对话满足预设打断条件,客户端停止采集本轮对话中员工后续所说内容,并将员工本轮对话的分值赋满分。
作为一种实施方式,每个情景对练模块中员工每轮对话的标准话术对应的语义可以实时进行识别。作为另一种实施方式,每个情景对练模块中员工每轮对话的标准话术对应的语义可以预先保存在服务器中。客户端和服务器之间可以通过网络连接,网络通常为因特网、但也可以是任何网络,包括但不限于局域网(Local Area Network,LAN)、城域网(Metropolitan Area Network,MAN)、广域网(Wide Area Network,WAN)、移动、有线或者无线网络、专用网络或者虚拟专用网络的任何组合。此外,客户端和服务器之间还可以通过特定的通信协议进行通信传输,通信协议包括但不限于BLE(Bluetooth low energy,低功耗蓝牙)协议、WLAN(Wireless Local Area Network,无线局域网)协议、蓝牙协议、ZigBee(紫峰)协议或者Wi-Fi(Wireless Fidelity,无线保真)协议等。
在一些实施方式中,该对已采集音频进行检测的步骤,可以包括:
(2.1)对已采集音频进行关键词检测,获取已采集音频中包含的目标关键词;
该根据已采集音频的检测结果确定本轮对话是否满足预设打断条件的步骤,可以包括:
(2.2)确定已采集音频中包含的目标关键词,在本轮对话中员工对应的标准话术包含的目标关键词中的数量占比;
(2.3)若数量占比超过第三阈值,则确定本轮对话满足预设打断条件。
在本申请实施例中,目标关键词是指本轮对话中标准话术中预设的作为得分点的关键词。
具体地,若确定本轮对话为预设打断位置,则实时采集员工的对话音频得到已采集音频,然后对已采集音频进行关键词检测,获取已采集音频中包含的目标关键词;确定本轮对话中员工对应的标准话术中包含的目标关键词,然后确定已采集音频包含的目标关键词在标准话术包含的目标关键词中的数量占比。若数量占比超过第三阈值,则可以认为员工对本轮对话对应的知识点掌握得很好,从而确定本轮对话满足预设打断条件,客户端停止采集本轮对话中员工后续所说内容,并将员工本轮对话的分值赋满分。也就是说,若已采集音频包含的目标关键词的个数与标准话术包含的目标关键词的个数之间的比值超过第三阈值,则确定本轮对话满足预设打断条件。
在一些实施方式中,每个情景对练模块中每轮对话的员工的标准话术包括的目标关键词,可以预先保存在服务器中。
本申请实施例提供的情景对练方法,确定本轮对话是否为预设打断位置;若为预设打断位置,则实时采集员工的对话音频作为已采集音频,并对已采集音频进行检测;根据已采集音频的检测结果确定本轮对话是否满足预设打断条件;若满足预设打断条件,则停止采集本轮对话中员工后续的对话音频,并开启下一轮对话。由此,可以在员工当前已采集音频满足预设打断条件时,停止继续采集员工后续的音频以达到打断员工继续作答的效果。增加了员工训练过程中的真实性和紧张感,可以有效提高员工的心理素质和训练效果。
请参阅图2,图2示出了本申请实施例提供的另一种情景对练方法,应用于客户端。具体地,该方法可以包括步骤210至步骤280。
在步骤210中,确定当前情景对练模块是否为可打断模式。
在本申请实施例中,每个情景对练模块中至少包括一轮对话;可打断模式是指情景对练模块中存在对话为预设打断位置。具体地,在员工确定需要开启当前情景对练模块进行训练后,客户端确定当前情景对练模块是否为可打断模式。其中,可以通过确定当前情景对练模块是否存在第二预设标识确定是否为可打断模式,若当前情景对练模块存在第二预设标识,则确定当前情景对练模块为可打断模式。
在步骤220中,若是,则从当前情景对练模块中确定预设打断位置。
在本申请实施例中,若确定当前情景对练模块为可打断模式,则从当前情景对练模块中随机确定预设打断位置。例如:当前情景对练模块中一共包括5轮对话,若当前情景对练模块为可打断模式,则从5轮对话中随机确定预设打断位置。
在一些实施方式中,客户端可以根据当前已完成的情景对练模块的平均评分确定预设打断次数,然后在确定预设打断次数后,可以根据预设打断次数从当前情景对练模块中随机确定预设打断位置。具体地,在根据当前已完成的情景对练模块的总分值确定预设打断次数后,从当前情景对练模块中随机确定预设打断次数个预设打断位置。其中,预设打断次数小于或等于线上培训系统中对话轮数最少的情景对练模块的总对话轮数具体预设打断次数的上限可以根据实际需要进行设置。例如:情景对练模块中包括5轮对话,预设打断次数为3,则从5轮对话中随机确定3个预设打断位置。
作为一种实施方式,每个情景对练模块的评分根据该模块的难度和员工的综合得分确定。也就是说,同样的综合得分,难度不同该模块的评分不一样。具体的评分确定标准可以根据实际需要进行确定,本申请实施例对此不限制。
在一些实施方式中,可以根据。但由于一个情景对练模块中出现较多的具体可以是根据当前已完成的情景对练模块的平均评分所对应的等级确定预设打断次数。例如:8≤平均评分<8.5,对应的预设打断次数为1;8.5≤平均评分<9.7,对应的预设打断次数为2;9.7≤平均评分≤10,对应的预设打断次数为3。
进一步地,在确定预设打断次数的上限后,可以根据当前员工的平均评分排名确定不同预设打断次数对应的平均评分区间。例如:平均评分排名20%~10%对应的平均评分区间所对应的预设打断次数为1;平均评分排名10%~3%对应的平均评分区间所对应的预设打断次数为2;平均评分排名前3%对应的平均评分区间所对应的预设打断次数为3。
在步骤230中,确定本轮对话是否为预设打断位置。
在步骤240中,若为预设打断位置,则实时采集员工的对话音频作为已采集音频,并对已采集音频进行检测。
在步骤250中,根据已采集音频的检测结果确定本轮对话是否满足预设打断条件。
在步骤260中,若满足预设打断条件,则停止采集本轮对话中员工后续的对话音频,并开启下一轮对话。
在本申请实施例中,步骤230至步骤260的具体描述可以参阅上述步骤110至步骤140的详细记载,在此不再进行赘述。
在步骤270中,在完成当前情景对练模块后,确定已完成的情景对练模块的总得分。
在本申请实施例中,在完成当前情景对练模块后,可以根据当前情景对练模块中每轮对话的得分确定当前情景对练模块的综合得分;然后根据当前情景对练模块和之前已完成的情景对练模块的综合得分,可以确定该员工当前已完成的情景对练模块的总得分。
在步骤280中,根据总分值确定是否将下一个待练习的情景对练模块设为可打断模式。
在本申请实施例中,在确定当前已完成的情景对练模块的总得分后,可以根据总分值确定是否将员工待练习的下一个情景对练模块设为可打断模式。例如:当已完成的情景对练模块的总得分超过指定分值后,将员工下一个待练习的情景对练模块设为可打断模式;指定分值为100分、200分、300分……等。
在本申请实施例中,当员工当前已完成的情景对练模块的总得分到达一定等级后,可以认为员工对话术的掌握能力到达了一定的程度,因此可以适当提高下一个待练习的情景对练模块的难度,也就是本申请实施例中所说的设为可打断模式。
需要说明的是,本申请实施例中线上培训系统包含的情景对练模块为按照难度依次解锁的,即员工必须完成前置情景对练模块,才可以解锁后续情景对练模块。上述所说的下一个待练习的情景对练模块即为下一个待解锁的情景对练模块。当确定将下一待练习的情景对练模块设为可打断模式后,员工再次练习之前已完成即已解锁的情景对练模块,不会影响下一个待解锁的情景对练模块仍为可打断模式。
本申请实施例提供的情景对练方法中,确定当前情景对练模块是否为可打断模式;其中,每个情景对练模块中至少包括一轮对话;若是,则从当前情景对练模块中确定预设打断位置;确定本轮对话是否为预设打断位置;若为预设打断位置,则实时采集员工的对话音频作为已采集音频,并对已采集音频进行检测;根据已采集音频的检测结果确定本轮对话是否满足预设打断条件;若满足预设打断条件,则停止采集本轮对话中员工后续的对话音频,并开启下一轮对话;在完成当前情景对练模块后,确定已完成的情景对练模块的总得分;根据总分值确定是否将下一个待练习的情景对练模块设为可打断模式。由此,可以根据员工当前对话术的掌握情况确定是否将下一个待练习的情景对练模块设为可打断模式;同时可以在员工当前已采集音频满足预设打断条件时,停止继续采集员工后续的音频以达到打断员工继续作答的效果。增加了员工训练过程中的真实性和紧张感,可以有效提高员工的心理素质和训练效果。
请参阅图3,图3示出了本申请实施例提供的一种情景对练装置300的结构框图。该情景对练装置300包括第一确定模块310、检测模块320、第二确定模块330、打断模块340。
第一确定模块310,用于确定本轮对话是否为预设打断位置;
检测模块320,用于若为预设打断位置,则实时采集员工的对话音频作为已采集音频,并对已采集音频进行检测;
第二确定模块330,用于根据已采集音频的检测结果确定本轮对话是否满足预设打断条件;
打断模块340,用于若满足预设打断条件,则停止采集本轮对话中员工后续的对话音频,并开启下一轮对话。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述装置和模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,模块相互之间的耦合可以是电性,机械或其它形式的耦合。另外,在本申请各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
请参阅图4,图4示出了本申请实施例提供的一种电子设备400的结构框图。该电子设备400可以是PC电脑、移动终端等能够运行应用程序的电子设备。本申请中的电子设备400可以包括一个或多个如下部件:处理器410、存储器420以及一个或多个应用程序,其中一个或多个应用程序可以被存储在存储器420中并被配置为由一个或多个处理器410执行,一个或多个程序配置用于执行如前述方法实施例所描述的方法。
处理器410可以包括一个或者多个处理核。处理器410利用各种接口和线路连接整个电子设备400内的各个部分,通过运行或执行存储在存储器420内的指令、程序、代码集或指令集,以及调用存储在存储器420内的数据,执行电子设备400的各种功能和处理数据。可选地,处理器410可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programmable LogicArray,PLA)中的至少一种硬件形式来实现。处理器410可集成中央处理器(CentralProcessing Unit,CPU)、图像处理器(Graphics Processing Unit,GPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责显示内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器410中,单独通过一块通信芯片进行实现。
存储器420可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-Only Memory)。存储器420可用于存储指令、程序、代码、代码集或指令集。存储器420可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于实现至少一个功能的指令(比如语音采集功能、语义识别功能等)、用于实现下述各个方法实施例的指令等。存储数据区还可以存储电子设备400在使用中所创建的数据(比如标准话术据、第一语义、第二语义、目标关键词等)。
请参阅图5,图5示出了本申请实施例提供的一种计算机可读取存储介质的结构框图。该计算机可读取存储介质500中存储有程序代码,所述程序代码可被处理器调用执行上述方法实施例中所描述的情景对练方法。
计算机可读取存储介质500可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。可选地,计算机可读取存储介质500包括非易失性计算机可读介质(non-transitory computer-readable storage medium)。计算机可读取存储介质500具有执行上述方法中的任何方法步骤的程序代码510的存储空间。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。程序代码510可以例如以适当形式进行压缩。
本申请实施例还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读取存储介质中。计算机设备的处理器从计算机可读取存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各种可选实施方式中描述的情景对练方法。
本申请的情景对练方法、装置和存储介质,涉及互联网技术领域。该情景对练方法包括:确定本轮对话是否为预设打断位置;若为预设打断位置,则实时采集员工的对话音频作为已采集音频,并对已采集音频进行检测;根据已采集音频的检测结果确定本轮对话是否满足预设打断条件;若满足预设打断条件,则停止采集本轮对话中员工后续的对话音频,并开启下一轮对话。由此,可以在员工当前已采集音频满足预设打断条件时,停止继续采集员工后续的音频以达到打断员工继续作答的效果。增加了员工训练过程中的真实性和紧张感,可以有效提高员工的心理素质和训练效果。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不驱使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。