CN112417123A - 基于人工智能的客户应答识别方法及其相关设备 - Google Patents

基于人工智能的客户应答识别方法及其相关设备 Download PDF

Info

Publication number
CN112417123A
CN112417123A CN202011314165.8A CN202011314165A CN112417123A CN 112417123 A CN112417123 A CN 112417123A CN 202011314165 A CN202011314165 A CN 202011314165A CN 112417123 A CN112417123 A CN 112417123A
Authority
CN
China
Prior art keywords
response data
client
customer
customer response
segmented
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011314165.8A
Other languages
English (en)
Inventor
张永秋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Puhui Enterprise Management Co Ltd
Original Assignee
Ping An Puhui Enterprise Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Puhui Enterprise Management Co Ltd filed Critical Ping An Puhui Enterprise Management Co Ltd
Priority to CN202011314165.8A priority Critical patent/CN112417123A/zh
Publication of CN112417123A publication Critical patent/CN112417123A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3343Query execution using phonetics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0281Customer communication at a business location, e.g. providing product or service information, consulting

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Finance (AREA)
  • Mathematical Physics (AREA)
  • Strategic Management (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Acoustics & Sound (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Human Computer Interaction (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Machine Translation (AREA)

Abstract

本申请实施例属于人工智能领域,应用于智慧政务和/或智慧医疗领域中,涉及一种基于人工智能的客户应答识别方法及其相关设备,包括将接收的第一客户应答数据输入至预先训练的语义识别模型中,获得第一识别结果;当第一识别结果为无效回答,且基于预设的分段判断策略确定第一客户应答数据属于分段应答时,缓存第一客户应答数据;组合第一客户应答数据和接收到的第二客户应答数据,生成完整客户应答数据,并将完整客户应答数据输入至语义识别模型中,获得第二识别结果;当所述第二识别结果为有效回答时,输出所述第二识别结果。其中,语义识别模型可存储于区块链中。本申请支持长应达的场景或者本身语速较慢的人群,提升人机对话体验。

Description

基于人工智能的客户应答识别方法及其相关设备
技术领域
本申请涉及人工智能技术领域,尤其涉及基于人工智能的客户应答识别方法及其相关设备。
背景技术
随着计算机技术的不断变革和发展,人工智能逐渐应用于各行各业中,深入人们的生活,而人机对话更是人工智能的重要研究领域。目前,在人机对话过程中,通常是通过将客户的语音应答转换为应答文字,将应答文字输入到人机对话系统中进行识别。
但是,由于不同的人们之间的语言表达能力、语速、语言习惯等各不相同,以及部分长应答场景需要较长的应答时间,经常会出现一句完整的话未结束,就将语音转化成文字进行识别的情况。由于传统的人机对话系统是针对单一回答进行识别,所以不完整的应答往往被当成无效回答。而后续客户应答又因为不完整而被识别成无效回答。导致人机对话系统的容错率低,人机对话的流畅性差,影响客户的体验。
发明内容
本申请实施例的目的在于提出一种基于人工智能的客户应答识别方法及其相关设备,支持长应达的场景或者本身语速较慢的人群,提升人机对话体验。
为了解决上述技术问题,本申请实施例提供一种基于人工智能的客户应答识别方法,采用了如下所述的技术方案:
接收对话场景中的第一客户应答数据,并将所述第一客户应答数据输入至预先训练的语义识别模型中,获得第一识别结果,并识别所述第一识别结果是否为无效回答;
当所述语义识别模型输出的第一识别结果为无效回答时,基于预设的分段判断策略确定所述第一客户应答数据是否属于分段应答;
当所述第一客户应答数据属于分段应答时,缓存所述第一客户应答数据;
在接收到对话场景中的第二客户应答数据时,组合所述第一客户应答数据和所述第二客户应答数据,生成完整客户应答数据,并将所述完整客户应答数据输入至所述语义识别模型中,获得第二识别结果;
识别所述第二识别结果是否为有效回答,当所述第二识别结果为有效回答时,输出所述第二识别结果。
进一步的,所述基于预设的分段判断策略确定所述第一客户应答数据是否属于分段应答包括:
识别对话场景中的对话次数和所述语义识别模型输出的识别结果为无效回答的次数;
基于所述对话次数和所述无效回答的次数计算中断概率,当所述中断概率大于预设的中断阈值时,所述第一客户应答数据属于所述分段应答。
进一步的,所述基于所述对话次数和所述无效回答的次数计算中断概率包括:
所述中断概率的特征描述为:
P=D×(N/A)/T,
其中,P为所述中断概率,D为预设的系统因子,N为所述无效回答的次数,A为所述对话次数,T为预先计算的客户语速。
进一步的,所述基于预设的分段判断策略确定所述第一客户应答数据是否属于分段应答包括:
确定接收到对话场景中的第一客户应答数据的第一时间点,并确定预先发出的问询数据的第二时间点,其中,所述问询数据与所述第一客户应答数据具有一一对应关系;
计算所述第一时间点与所述第二时间点之间的时间间隔;
识别所述客户语音应答的数据量;
确定所述时间间隔是否超过预设的时长阈值,并确定所述客户语音应答的文字数量是否小于预设的数量阈值;
当所述时间间隔超过所述时长阈值,且所述第一客户应答数据的文字数量小于所述数量阈值时,基于所述第一客户应答数据计算客户语速;
确定所述客户语速是否小于预设的语速阈值;
当所述客户语速小于预设的语速阈值时,确定所述第一客户应答数据属于所述分段应答。
进一步的,所述基于所述第一客户应答数据计算客户语速包括:
所述客户语速的特征描述为:
T=D/t,
其中,T为所述客户语速,D为所述第一客户应答数据的文字数量,t为所述时间间隔。
进一步的,所述第一客户应答数据携带有话题属性,所述基于预设的分段判断策略确定所述第一客户应答数据是否属于分段应答包括:
获取所述第一客户应答数据携带的话题属性;
将所述话题属性与预设的话题属性表进行比对;
当所述话题属性表中包含有所述话题属性时,确定所述客户应答数据属于分段应答。
进一步的,在所述将所述完整客户应答数据输入至所述语义识别模型中,获得第二识别结果之后,还包括:
当所述第二识别结果为无效回答时,基于所述分段判断策略识别所述第二客户应答数据是否属于分段应答;
当所述第二客户应答数据属于分段应答时,缓存所述第二客户应答数据;
在接收到对话场景中的第三客户应答数据时,组合所述第一客户应答数据、所述第二客户应答数据和所述第三客户应答数据,生成组合客户应答数据,并将所述组合客户应答数据输入至所述语义识别模型中,直至达到预设的循环次数或者所述语义识别模型输出的识别结果为有效回答。
为了解决上述技术问题,本申请实施例还提供一种基于人工智能的客户应答识别装置,采用了如下所述的技术方案:
一种基于人工智能的客户应答识别装置,包括:
接收模块,用于接收对话场景中的第一客户应答数据,并将所述第一客户应答数据输入至预先训练的语义识别模型中,获得第一识别结果,并识别所述第一识别结果是否为无效回答;
识别模块,用于当所述语义识别模型输出的第一识别结果为无效回答时,基于预设的分段判断策略确定所述第一客户应答数据是否属于分段应答;
缓存模块,用于当所述第一客户应答数据属于分段应答时,缓存所述第一客户应答数据;
组合模块,用于在接收到对话场景中的第二客户应答数据时,组合所述第一客户应答数据和所述第二客户应答数据,生成完整客户应答数据,并将所述完整客户应答数据输入至所述语义识别模型中,获得第二识别结果;
输出模块,用于识别所述第二识别结果是否为有效回答,当所述第二识别结果为有效回答时,输出所述第二识别结果。
为了解决上述技术问题,本申请实施例还提供一种计算机设备,采用了如下所述的技术方案:
一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述处理器执行所述计算机可读指令时实现上述的基于人工智能的客户应答识别方法。
为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,采用了如下所述的技术方案:
一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现上述的基于人工智能的客户应答识别方法。
与现有技术相比,本申请实施例主要有以下有益效果:
本申请通过语义识别模型确定第一客户应答数据是否有效,并在第一客户应答数据无效,且通过分段判断策略确定属于分段应答时,对第一客户应答数据进行缓存。等待接收到第二客户应答数据时,将两者进行组合,作为完整客户应答数据进行识别。实现了支持接收分段输入,并将多段的客户应答数据整合成为一个完整的回答,以支持长应达的场景或者本身语速较慢的人群,有效减少输出结果为无效回答的机率,提升人机对话体验。
附图说明
为了更清楚地说明本申请中的方案,下面将对本申请实施例描述中所需要使用的附图作一个简单介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请可以应用于其中的示例性系统架构图;
图2是根据本申请的基于人工智能的客户应答识别方法的一个实施例的流程图;
图3是根据本申请的基于人工智能的客户应答识别装置的一个实施例的结构示意图;
图4是根据本申请的计算机设备的一个实施例的结构示意图。
附图标记:200、计算机设备;201、存储器;202、处理器;203、网络接口;300、基于人工智能的客户应答识别装置;301、接收模块;302、识别模块;303、缓存模块;304、组合模块;305、输出模块。
具体实施方式
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
为了使本技术领域的人员更好地理解本申请方案,下面将结合附图,对本申请实施例中的技术方案进行清楚、完整地描述。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture ExpertsGroup Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving PictureExperts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的页面提供支持的后台服务器。
需要说明的是,本申请实施例所提供的基于人工智能的客户应答识别方法一般由服务器/终端设备执行,相应地,基于人工智能的客户应答识别装置一般设置于服务器/终端设备中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,示出了根据本申请的基于人工智能的客户应答识别方法的一个实施例的流程图。所述的基于人工智能的客户应答识别方法,包括以下步骤:
S1:接收对话场景中的第一客户应答数据,并将所述第一客户应答数据输入至预先训练的语义识别模型中,获得第一识别结果,识别所述第一识别结果是否为无效回答。
在本实施例中,第一客户应答数据为文本数据。前端预先通过预设的麦克风采集的第一客户语音数据,并将第一客户语音数据转换为第一客户应答数据,传输给服务器。服务器基于接收到的第一客户应答数据进行后续处理。本申请可以基于自然语言处理(NLP)模型建立语义识别模型,通过预先标注为有效回答或无效回答的样本语料,来训练通过自然语言处理(NLP)模型建立的语义识别模型,获得本申请中的预先训练的语义识别模型。将所述第一客户应答数据输入预先训练的语义识别模型后,该语义识别模型会直接输出有效回答或者无效回答,作为第一识别结果。例如,第一客户应答数据为中国银行,将中国银行输入至预先训练的语义识别模型中,获得的第一识别结果为无效回答。通过语义识别模型对第一客户应答数据进行识别,有效提升识别的效率和准确率。
在本实施例中,基于人工智能的客户应答识别方法运行于其上的电子设备(例如图1所示的服务器/终端设备)可以通过有线连接方式或者无线连接方式接收对话场景中的第一客户应答数据。需要指出的是,上述无线连接方式可以包括但不限于3G/4G连接、WiFi连接、蓝牙连接、WiMAX连接、Zigbee连接、UWB(ultra wideband)连接、以及其他现在已知或将来开发的无线连接方式。
S2:当所述语义识别模型输出的第一识别结果为无效回答时,基于预设的分段判断策略确定所述第一客户应答数据是否属于分段应答。
在本实施例中,当语义识别模型输出的第一识别结果为有效回答时,直接输出第一识别结果,无需进行后续步骤,本申请主要在于第一识别结果为无效回答时,所采取的策略。当接收到第一段客户应答识别为无效回答时,触发分段判断策略。根据预先定义的分段判断策略,确定第一客户应答数据是否属于分段应答,进而实现判断客户回答过程中是否出现中断。
具体的,在步骤S2中,即所述基于预设的分段判断策略确定所述第一客户应答数据是否属于分段应答包括:
识别对话场景中的对话次数和所述语义识别模型输出的识别结果为无效回答的次数;
基于所述对话次数和所述无效回答的次数计算中断概率,当所述中断概率大于预设的中断阈值时,所述第一客户应答数据属于所述分段应答。
在本实施例中,基于所述对话次数和所述无效回答的次数计算中断概率,当中断概率大于预设的中断阈值时,说明在客户回答的过程中,多次出现客户还没有完全说完就进行识别的情况,从而导致中断概率较高。通过中断概率的判断能够快速确定第一客户应答数据是否属于所述分段应答,从而便于计算机进行后续进程。
其中,所述基于所述对话次数和所述无效回答的次数计算中断概率包括:
所述中断概率的特征描述为:
P=D×(N/A)/T,
其中,P为中断概率,D为预设的系统因子,N为所述无效回答的次数,A为所述对话次数,T为预先计算的客户语速。
在本实施例中,可以根据一定条件计算中断的概率。以无效回答次数和语速计算中断概率。上述公式中,P为判断发生中断的概率,D为系统因子,N为无效回答的次数,A为对话次数,即人机对话总轮次,T为客户语速。计算后概率P若达到指定阀值,则确定第一客户应答数据属于所述分段应答。
此外,作为本申请的另一实施例,在步骤S2中,即所述基于预设的分段判断策略确定所述第一客户应答数据是否属于分段应答包括:
确定接收到对话场景中的第一客户应答数据的第一时间点,并确定预先发出问询数据的第二时间点,其中,所述问询数据与所述第一客户应答数据具有一一对应关系;
计算所述第一时间点与所述第二时间点之间的时间间隔;
识别所述客户语音应答的数据量;
确定所述时间间隔是否超过预设的时长阈值,并确定所述客户语音应答的文字数量是否小于预设的数量阈值;
当所述时间间隔超过所述时长阈值,且所述第一客户应答数据的文字数量小于所述数量阈值时,基于所述第一客户应答数据计算客户语速;
确定所述客户语速是否小于预设的语速阈值;
当所述客户语速小于预设的语速阈值时,确定所述第一客户应答数据属于所述分段应答。
在本实施例中,先判断问询数据与第一客户应答数据之间的时间差是否超过预设的时长阈值,并判断第一客户应答数据的文字数量是否小于预设的数量阈值,当两者均为是时,触发客户语速计算策略,通过计算客户语速来判断客户的语速是否小于预设的语速阈值,当判断结果为是时,则确定是由于客户语速较慢而导致语义识别模型输出的识别结果为无效回答,第一客户应答数据属于分段应答。通过判断客户语速的方式充分的考虑了语速较慢的人群,有利于提升客户体验度。
其中,所述基于所述第一客户应答数据计算客户语速包括:
所述客户语速的特征描述为:
T=D/t,
其中,D为所述第一客户应答数据的文字数量,t为所述时间间隔。
在本实施例中,可以根据计算机接收语音的时间较长而识别文字较少,来判断客户语速较慢。在上述客户语速计算公式中,T为客户语速,D为第一客户应答数据的文字数量,t为时间间隔,即该轮客户回答的时长。当语速小于一定阀值,并且为无效回答时,认为客户应答出现中断。通过该计算公式,计算机能够快速简便的计算出客户语速。
本申请还可以,所述第一客户应答数据携带有话题属性,在步骤S2中,即所述基于预设的分段判断策略确定所述第一客户应答数据是否属于分段应答包括:
获取所述第一客户应答数据携带的话题属性;
将所述话题属性与预设的话题属性表进行比对;
当所述话题属性表中包含有所述话题属性时,确定所述客户应答数据属于分段应答。
在本实施例中,当所述话题属性表中未包含有所述话题属性时,确定所述客户应答数据不属于分段应答。根据话题属性确定是否可能存在长应达的情况,例如:话题属性为地址话题或者电话号码话题,则第一客户应答数据属于分段应答。通过预设的话题属性表与第一客户应答数据携带有话题属性进行对比,则可以确定话题属性是否属于长应达的话题。当所述话题属性表中包含有所述话题属性时,则确定该话题属性属于长应达的话题,进一步确定对应的第一客户应答数据属于分段应答,此时,可以基于预设的分段标识对第一客户应答数据进行标注,便于计算机的后续识别,其中,分段标识包括1和0,1表示需要分段,0表示不需要分段。其中,第一客户应答数据携带的话题属性来自于,前端预先识别的计算机对客户进行的问询的问题或第一客户应答数据。例如,在对话场景中,当计算机对客户进行地址问询的时候,则该第一客户应答数据携带的话题属性为地址话题。
需要说明的是:在实际应用过程中可以根据需要选择上述任意分段判断策略,适用即可。同时,本申请的分段判断策略包括但不限于以上几种方式。
S3:当所述第一客户应答数据属于分段应答时,缓存所述第一客户应答数据。
在本实施例中,当通过分段判断策略确定第一客户应答不属于分段应答时,分段标识为0,直接作为无效回答进行处理,直接输出第一识别结果,即无效回答。如果第一客户应答数据属于分段应答,则将分段标识设置为1。这时机器回答可以以静默回答,或者过渡性回答的形式回应客户,使人机对话显得比较自然。当第一客户应答数据属于分段应答时,将第一客户应答数据存放在预设的分段缓存区中。便于在后续接收到对话场景中的第二客户应答数据时,可以直接从缓存中获取第一客户应答数据,有效提升计算机的处理速度。
S4:在接收到对话场景中的第二客户应答数据时,组合所述第一客户应答数据和所述第二客户应答数据,生成完整客户应答数据,并将所述完整客户应答数据输入至所述语义识别模型中,获得第二识别结果。
在本实施例中,当第一客户应答数据属于分段应答,且在接收到第二客户应答数据时,组合第一客户应答数据和所述第二客户应答数据,生成完整客户应答数据。其中,第一客户应答数据指客户回答的上一句,第二客户应答数据指客户回答的下一句。例如,第一客户应答数据为中国银行,第二客户应答数据为深圳支行,将第一客户应答数据和第二客户应答数据组合为中国银行深圳支行,并输入至预先训练的语义识别模型中,获得第二识别结果。本申请中的组合所述第一客户应答数据和所述第二客户应答数据指将第一客户应答数据和第二客户应答数据根据接收的时间前后顺序,进行前后的字段拼接,获得完整客户应答数据。通过组合第一客户应答数据和第二客户应答数据,实现了能够获得客户的完整表达,避免客户一句话没有说完即进行识别的情况。
当然本申请也可以直接将第二客户应答数据输入至语义识别模型中,获得应答结果。比较第二识别结果和应答结果,来确定输出的内容。例如,第二识别结果为无效识别,而应答结果为有效识别,则输出应答结果。第二识别结果为有效识别,而应答结果为无效识别,则输出第二识别结果。两者均为无效识别,则继续执行本申请下述的第二识别结果为无效识别。两者均为有效识别,则可以同时输出第二识别结果和应答结果。
S5:识别所述第二识别结果是否为有效回答,当所述第二识别结果为有效回答时,输出所述第二识别结果。
在本实施例中,判断语义识别模型输出的第二识别结果是否为有效回答,当第二识别结果为有效回答时,输出第二识别结果,有效减少无效回答的几率。使得计算机在确定当前回答为有效回答后,进行下一步的提问。避免语义识别模型不断的输出无效回答,而导致计算机一直卡在当前的问询中。
在本实施例的一些可选的实现方式中,在步骤S4之后,即在所述将所述完整客户应答数据输入至所述语义识别模型中,获得第二识别结果之后,还包括:
当所述第二识别结果为无效回答时,基于预设的分段判断策略识别所述第二客户应答数据是否属于分段应答;
当所述第二客户应答数据属于分段应答时,缓存所述第二客户应答数据;
在接收到对话场景中的第三客户应答数据时,组合所述第一客户应答数据、所述第二客户应答数据和所述第三客户应答数据,生成组合客户应答数据,并将所述组合客户应答数据输入至所述语义识别模型中,直至达到预设的循环次数或者所述语义识别模型输出的识别结果为有效回答。
在本实施例中,循环进行分段和组合,如果组合后的识别结果仍然是无效回答,再次进入步骤S2进行触发分段的处理。本申请在第二识别结果为无效回答时,循环执行步骤S2至步骤S5,直至达到预设的循环次数或者语义识别模型输出的识别结果为有效回答。通过循环执行充分考虑了客户多次回答卡顿、语速较慢的情况,提升人机对话体验。
本申请通过语义识别模型确定第一客户应答数据是否有效,并在第一客户应答数据无效,且通过分段判断策略确定属于分段应答时,对第一客户应答数据进行缓存。等待接收到第二客户应答数据时,将两者进行组合,作为完整客户应答数据进行识别。实现了支持接收分段输入,并将多段的客户应答数据整合成为一个完整的回答,以支持长应达的场景或者本身语速较慢的人群,有效减少出现无效回答的机率,提升人机对话体验。
需要强调的是,为进一步保证上述语义识别模型的私密和安全性,上述语义识别模型还可以存储于一区块链的节点中。
本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
本申请可应用于智慧政务和/或智慧医疗领域中,从而推动智慧城市的建设。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机可读指令来指令相关的硬件来完成,该计算机可读指令可存储于一计算机可读取存储介质中,该计算机可读指令在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等非易失性存储介质,或随机存储记忆体(Random Access Memory,RAM)等。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
进一步参考图3,作为对上述图2所示方法的实现,本申请提供了一种基于人工智能的客户应答识别装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图3所示,本实施例所述的基于人工智能的客户应答识别装置300包括:接收模块301、识别模块302、缓存模块303、组合模块304以及输出模块305。其中:接收模块301,用于接收对话场景中的第一客户应答数据,并将所述第一客户应答数据输入至预先训练的语义识别模型中,获得第一识别结果,识别所述第一识别结果是否为无效回答;识别模块302,用于当所述语义识别模型输出的第一识别结果为无效回答时,基于预设的分段判断策略确定所述第一客户应答数据是否属于分段应答;缓存模块303,用于当所述第一客户应答数据属于分段应答时,缓存所述第一客户应答数据;组合模块304,用于在接收到对话场景中的第二客户应答数据时,组合所述第一客户应答数据和所述第二客户应答数据,生成完整客户应答数据,并将所述完整客户应答数据输入至所述语义识别模型中,获得第二识别结果;输出模块305,用于识别所述第二识别结果是否为有效回答,当所述第二识别结果为有效回答时,输出所述第二识别结果。
在本实施例中,本申请通过语义识别模型确定第一客户应答数据是否有效,并在第一客户应答数据无效,且通过分段判断策略确定属于分段应答时,对第一客户应答数据进行缓存。等待接收到第二客户应答数据时,将两者进行组合,作为完整客户应答数据进行识别。实现了支持接收分段输入,并将多段的客户应答数据整合成为一个完整的回答,以支持长应达的场景或者本身语速较慢的人群,有效减少出现无效回答的机率,提升人机对话体验。
所述识别模块302包括次数子模块和概率子模块。其中,次数子模块用于识别对话场景中的对话次数和所述语义识别模型输出的识别结果为无效回答的次数;概率子模块用于基于所述对话次数和所述无效回答的次数计算中断概率,当所述中断概率大于预设的中断阈值时,所述第一客户应答数据属于所述分段应答。
在本实施例的一些可选的实现方式中,上述概率子模块进一步用于:所述中断概率的特征描述为:
P=D×(N/A)/T,
其中,D为预设的系统因子,N为所述无效回答的次数,A为所述对话次数,T为预先计算的客户语速。
所述识别模块302还包括第一确定子模块、第一计算子模块、识别子模块、第一判断子模块、第二计算子模块、第二判断子模块和第二确定子模块。其中,第一确定子模块用于确定接收到对话场景中的第一客户应答数据的第一时间点,并确定预先发出问询数据的第二时间点,其中,所述问询数据与所述第一客户应答数据具有一一对应关系;第一计算子模块用于计算所述第一时间点与所述第二时间点之间的时间间隔;识别子模块用于识别所述客户语音应答的数据量;第一判断子模块用于确定所述时间间隔是否超过预设的时长阈值,并确定所述客户语音应答的文字数量是否小于预设的数量阈值;第二计算子模块用于当所述时间间隔超过所述时长阈值,且所述第一客户应答数据的文字数量小于所述数量阈值时,基于所述第一客户应答数据计算客户语速;第二判断子模块用于确定所述客户语速是否小于预设的语速阈值;第二确定子模块用于当所述客户语速小于预设的语速阈值时,确定所述第一客户应答数据属于所述分段应答。
在本实施例的一些可选的实现方式中,上述第二计算子模块进一步用于:所述客户语速的特征描述为:
T=D/t,
其中,D为所述第一客户应答数据的文字数量,t为所述时间间隔。
所述第一客户应答数据携带有话题属性,所述识别模块302还包括获取子模块、比对子模块和包含子模块。获取子模块用于获取所述第一客户应答数据携带的话题属性;比对子模块用于将所述话题属性与预设的话题属性表进行比对;包含子模块用于当所述话题属性表中包含有所述话题属性时,确定所述客户应答数据属于分段应答。
在本实施例的一些可选的实现方式中,上述装置300还包括:分段模块、属于模块和输入模块。其中,分段模块,用于当所述第二识别结果为无效回答时,基于预设的分段判断策略识别所述第二客户应答数据是否属于分段应答;属于模块,用于当所述第二客户应答数据属于分段应答时,缓存所述第二客户应答数据;输入模块,用于在接收到对话场景中的第三客户应答数据时,组合所述第一客户应答数据、所述第二客户应答数据和所述第三客户应答数据,生成组合客户应答数据,并将所述组合客户应答数据输入至所述语义识别模型中,直至达到预设的循环次数或者所述语义识别模型输出的识别结果为有效回答。
本申请通过语义识别模型确定第一客户应答数据是否有效,并在第一客户应答数据无效,且通过分段判断策略确定属于分段应答时,对第一客户应答数据进行缓存。等待接收到第二客户应答数据时,将两者进行组合,作为完整客户应答数据进行识别。实现了支持接收分段输入,并将多段的客户应答数据整合成为一个完整的回答,以支持长应达的场景或者本身语速较慢的人群,有效减少出现无效回答的机率,提升人机对话体验。
为解决上述技术问题,本申请实施例还提供计算机设备。具体请参阅图4,图4为本实施例计算机设备基本结构框图。
所述计算机设备200包括通过系统总线相互通信连接存储器201、处理器202、网络接口203。需要指出的是,图中仅示出了具有组件201-203的计算机设备200,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
所述存储器201至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器201可以是所述计算机设备200的内部存储单元,例如该计算机设备200的硬盘或内存。在另一些实施例中,所述存储器201也可以是所述计算机设备200的外部存储设备,例如该计算机设备200上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,所述存储器201还可以既包括所述计算机设备200的内部存储单元也包括其外部存储设备。本实施例中,所述存储器201通常用于存储安装于所述计算机设备200的操作系统和各类应用软件,例如基于人工智能的客户应答识别方法的计算机可读指令等。此外,所述存储器201还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器202在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器202通常用于控制所述计算机设备200的总体操作。本实施例中,所述处理器202用于运行所述存储器201中存储的计算机可读指令或者处理数据,例如运行所述基于人工智能的客户应答识别方法的计算机可读指令。
所述网络接口203可包括无线网络接口或有线网络接口,该网络接口203通常用于在所述计算机设备200与其他电子设备之间建立通信连接。
在本实施例中,实现了支持接收分段输入,并将多段的客户应答数据整合成为一个完整的回答,以支持长应达的场景或者本身语速较慢的人群,提升人机对话体验。
本申请还提供了另一种实施方式,即提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,所述计算机可读指令可被至少一个处理器执行,以使所述至少一个处理器执行如上述的基于人工智能的客户应答识别方法。
在本实施例中,实现了支持接收分段输入,并将多段的客户应答数据整合成为一个完整的回答,以支持长应达的场景或者本身语速较慢的人群,提升人机对话体验。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
显然,以上所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例,附图中给出了本申请的较佳实施例,但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现,相反地,提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本申请专利保护范围之内。

Claims (10)

1.一种基于人工智能的客户应答识别方法,其特征在于,包括下述步骤:
接收对话场景中的第一客户应答数据,并将所述第一客户应答数据输入至预先训练的语义识别模型中,获得第一识别结果,并识别所述第一识别结果是否为无效回答;
当所述语义识别模型输出的第一识别结果为无效回答时,基于预设的分段判断策略确定所述第一客户应答数据是否属于分段应答;
当所述第一客户应答数据属于分段应答时,缓存所述第一客户应答数据;
在接收到对话场景中的第二客户应答数据时,组合所述第一客户应答数据和所述第二客户应答数据,生成完整客户应答数据,并将所述完整客户应答数据输入至所述语义识别模型中,获得第二识别结果;
识别所述第二识别结果是否为有效回答,当所述第二识别结果为有效回答时,输出所述第二识别结果。
2.根据权利要求1所述的基于人工智能的客户应答识别方法,其特征在于,所述基于预设的分段判断策略确定所述第一客户应答数据是否属于分段应答包括:
识别对话场景中的对话次数和所述语义识别模型输出的识别结果为无效回答的次数;
基于所述对话次数和所述无效回答的次数计算中断概率,当所述中断概率大于预设的中断阈值时,所述第一客户应答数据属于所述分段应答。
3.根据权利要求2所述的基于人工智能的客户应答识别方法,其特征在于,所述基于所述对话次数和所述无效回答的次数计算中断概率包括:
所述中断概率的特征描述为:
P=D×(N/A)/T,
其中,P为所述中断概率,D为预设的系统因子,N为所述无效回答的次数,A为所述对话次数,T为预先计算的客户语速。
4.根据权利要求1所述的基于人工智能的客户应答识别方法,其特征在于,所述基于预设的分段判断策略确定所述第一客户应答数据是否属于分段应答包括:
确定接收到对话场景中的第一客户应答数据的第一时间点,并确定预先发出的问询数据的第二时间点,其中,所述问询数据与所述第一客户应答数据具有一一对应关系;
计算所述第一时间点与所述第二时间点之间的时间间隔;
识别所述客户语音应答的数据量;
确定所述时间间隔是否超过预设的时长阈值,并确定所述客户语音应答的文字数量是否小于预设的数量阈值;
当所述时间间隔超过所述时长阈值,且所述第一客户应答数据的文字数量小于所述数量阈值时,基于所述第一客户应答数据计算客户语速;
确定所述客户语速是否小于预设的语速阈值;
当所述客户语速小于预设的语速阈值时,确定所述第一客户应答数据属于所述分段应答。
5.根据权利要求4所述的基于人工智能的客户应答识别方法,其特征在于,所述基于所述第一客户应答数据计算客户语速包括:
所述客户语速的特征描述为:
T=D/t,
其中,T为所述客户语速,D为所述第一客户应答数据的文字数量,t为所述时间间隔。
6.根据权利要求1所述的基于人工智能的客户应答识别方法,其特征在于,所述第一客户应答数据携带有话题属性,所述基于预设的分段判断策略确定所述第一客户应答数据是否属于分段应答包括:
获取所述第一客户应答数据携带的话题属性;
将所述话题属性与预设的话题属性表进行比对;
当所述话题属性表中包含有所述话题属性时,确定所述客户应答数据属于分段应答。
7.根据权利要求1所述的基于人工智能的客户应答识别方法,其特征在于,在所述将所述完整客户应答数据输入至所述语义识别模型中,获得第二识别结果之后,还包括:
当所述第二识别结果为无效回答时,基于所述分段判断策略识别所述第二客户应答数据是否属于分段应答;
当所述第二客户应答数据属于分段应答时,缓存所述第二客户应答数据;
在接收到对话场景中的第三客户应答数据时,组合所述第一客户应答数据、所述第二客户应答数据和所述第三客户应答数据,生成组合客户应答数据,并将所述组合客户应答数据输入至所述语义识别模型中,直至达到预设的循环次数或者所述语义识别模型输出的识别结果为有效回答。
8.一种基于人工智能的客户应答识别装置,其特征在于,包括:
接收模块,用于接收对话场景中的第一客户应答数据,并将所述第一客户应答数据输入至预先训练的语义识别模型中,获得第一识别结果,并识别所述第一识别结果是否为无效回答;
识别模块,用于当所述语义识别模型输出的第一识别结果为无效回答时,基于预设的分段判断策略确定所述第一客户应答数据是否属于分段应答;
缓存模块,用于当所述第一客户应答数据属于分段应答时,缓存所述第一客户应答数据;
组合模块,用于在接收到对话场景中的第二客户应答数据时,组合所述第一客户应答数据和所述第二客户应答数据,生成完整客户应答数据,并将所述完整客户应答数据输入至所述语义识别模型中,获得第二识别结果;
输出模块,用于识别所述第二识别结果是否为有效回答,当所述第二识别结果为有效回答时,输出所述第二识别结果。
9.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述处理器执行所述计算机可读指令时实现如权利要求1至7中任一项所述的基于人工智能的客户应答识别方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如权利要求1至7中任一项所述的基于人工智能的客户应答识别方法。
CN202011314165.8A 2020-11-20 2020-11-20 基于人工智能的客户应答识别方法及其相关设备 Pending CN112417123A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011314165.8A CN112417123A (zh) 2020-11-20 2020-11-20 基于人工智能的客户应答识别方法及其相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011314165.8A CN112417123A (zh) 2020-11-20 2020-11-20 基于人工智能的客户应答识别方法及其相关设备

Publications (1)

Publication Number Publication Date
CN112417123A true CN112417123A (zh) 2021-02-26

Family

ID=74777806

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011314165.8A Pending CN112417123A (zh) 2020-11-20 2020-11-20 基于人工智能的客户应答识别方法及其相关设备

Country Status (1)

Country Link
CN (1) CN112417123A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113539295A (zh) * 2021-06-10 2021-10-22 联想(北京)有限公司 一种语音处理方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006003743A (ja) * 2004-06-18 2006-01-05 Nippon Telegr & Teleph Corp <Ntt> 音声対話方法及び装置
CN107958001A (zh) * 2016-10-14 2018-04-24 阿里巴巴集团控股有限公司 一种智能问答的实现方法及装置
CN110472022A (zh) * 2019-06-25 2019-11-19 南京邮电大学 基于深度学习的对话方法及装置、存储介质和终端
CN111026886A (zh) * 2019-12-26 2020-04-17 成都航天科工大数据研究院有限公司 一种针对专业场景的多轮对话处理方法
CN111105782A (zh) * 2019-11-27 2020-05-05 深圳追一科技有限公司 会话交互处理方法、装置、计算机设备和存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006003743A (ja) * 2004-06-18 2006-01-05 Nippon Telegr & Teleph Corp <Ntt> 音声対話方法及び装置
CN107958001A (zh) * 2016-10-14 2018-04-24 阿里巴巴集团控股有限公司 一种智能问答的实现方法及装置
CN110472022A (zh) * 2019-06-25 2019-11-19 南京邮电大学 基于深度学习的对话方法及装置、存储介质和终端
CN111105782A (zh) * 2019-11-27 2020-05-05 深圳追一科技有限公司 会话交互处理方法、装置、计算机设备和存储介质
CN111026886A (zh) * 2019-12-26 2020-04-17 成都航天科工大数据研究院有限公司 一种针对专业场景的多轮对话处理方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113539295A (zh) * 2021-06-10 2021-10-22 联想(北京)有限公司 一种语音处理方法及装置
CN113539295B (zh) * 2021-06-10 2024-04-23 联想(北京)有限公司 一种语音处理方法及装置

Similar Documents

Publication Publication Date Title
WO2022142014A1 (zh) 基于多模态信息融合的文本分类方法、及其相关设备
US11164573B2 (en) Method and apparatus for controlling page
CN111276123B (zh) 一种语音播报留言的方法、装置、计算机设备及存储介质
WO2022116487A1 (zh) 基于生成对抗网络的语音处理方法、装置、设备及介质
US20230084055A1 (en) Method for generating federated learning model
WO2022142031A1 (zh) 无效通话判断方法、装置、计算机设备及存储介质
CN112653798A (zh) 智能客服语音应答方法、装置、计算机设备及存储介质
CN112631910A (zh) 前端测试方法、装置、计算机设备及存储介质
CN112632244A (zh) 一种人机通话的优化方法、装置、计算机设备及存储介质
CN112836521A (zh) 问答匹配方法、装置、计算机设备及存储介质
CN110837546A (zh) 基于人工智能的藏头对联生成方法、装置、设备及介质
CN113314150A (zh) 基于语音数据的情绪识别方法、装置及存储介质
CN112669876A (zh) 情绪识别方法、装置、计算机设备及存储介质
CN115438149A (zh) 一种端到端模型训练方法、装置、计算机设备及存储介质
CN114817478A (zh) 基于文本的问答方法、装置、计算机设备及存储介质
CN112995414B (zh) 基于语音通话的行为质检方法、装置、设备及存储介质
CN112417123A (zh) 基于人工智能的客户应答识别方法及其相关设备
US11366973B2 (en) Method and apparatus for determining a topic
CN112669850A (zh) 语音质量检测方法、装置、计算机设备及存储介质
CN114637831A (zh) 基于语义分析的数据查询方法及其相关设备
CN112306560B (zh) 用于唤醒电子设备的方法和装置
WO2021169356A1 (zh) 语音文件修复方法、装置、计算机设备及存储介质
CN113065354A (zh) 语料中地理位置的识别方法及其相关设备
CN111835861A (zh) 考试系统数据处理方法、装置、计算机设备及存储介质
CN110992067B (zh) 消息推送方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination