CN114005439A - 确定话术的方法、装置以及存储介质 - Google Patents

确定话术的方法、装置以及存储介质 Download PDF

Info

Publication number
CN114005439A
CN114005439A CN202010732572.4A CN202010732572A CN114005439A CN 114005439 A CN114005439 A CN 114005439A CN 202010732572 A CN202010732572 A CN 202010732572A CN 114005439 A CN114005439 A CN 114005439A
Authority
CN
China
Prior art keywords
user
node
information
interactive
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010732572.4A
Other languages
English (en)
Inventor
罗欢
关力
蒋宁
权圣
王洪斌
吴海英
陈实
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Finite Element Technology Co Ltd
Original Assignee
Beijing Finite Element Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Finite Element Technology Co Ltd filed Critical Beijing Finite Element Technology Co Ltd
Priority to CN202010732572.4A priority Critical patent/CN114005439A/zh
Publication of CN114005439A publication Critical patent/CN114005439A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/12Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Signal Processing (AREA)
  • Machine Translation (AREA)

Abstract

本申请公开了一种确定话术的方法、装置以及存储介质,其中该方法包括:在与用户进行交互过程中,确定用户在当前交互节点的用户画像;获取从交互开始至当前交互节点产生的交互过程信息,其中交互过程信息用于描述交互过程中至少一个交互节点采用的节点话术、用户针对节点话术的回答信息以及节点话术与回答信息的顺序关系;以及利用预先训练的模型对用户画像和交互过程信息进行计算,确定在当前交互节点针对用户进行交互的目标话术,其中模型是基于用户画像和交互过程信息以及对应的话术转化结果训练的。

Description

确定话术的方法、装置以及存储介质
技术领域
本申请涉及智能交互技术领域,特别是涉及一种确定话术的方法、装置以及存储介质。
背景技术
由于人工智能技术发展,现在已近出现许多通过机器人与人进行语音交流系统,特别是语音客服,智能电销,智能催收,智能音箱等语音交互场景应用非常广泛。当机器人能够与人语音交流后,需要不断优化机器人话术以提升交流后效果。现有技术中的话术选择方式主要是针对用户的每一句回答选择话术,而没有考虑到在整个交互过程中的全部问答信息(即从交互开始到当前时间的全部交互内容),因此最终确定的话术的精准性还有待提高。
针对上述的现有技术中存在的在交互过程中确定话术的方法缺乏对从交互开始到当前所产生的全部交互内容进行参考,因此影响话术的精准性的技术问题,目前尚未提出有效的解决方案。
发明内容
本公开的实施例提供了一种确定话术的方法、装置以及存储介质,以至少解决现有技术中存在的在交互过程中确定话术的方法缺乏对从交互开始到当前所产生的全部交互内容进行参考,因此影响话术的精准性的技术问题。
根据本公开实施例的一个方面,提供了一种确定话术的方法,包括:在与用户进行交互过程中,确定用户在当前交互节点的用户画像;获取从交互开始至当前交互节点产生的交互过程信息,其中交互过程信息用于描述交互过程中至少一个交互节点采用的节点话术、用户针对节点话术的回答信息以及节点话术与回答信息的顺序关系;以及利用预先训练的模型对用户画像和交互过程信息进行计算,确定在当前交互节点针对用户进行交互的目标话术,其中模型是基于用户画像和交互过程信息以及对应的话术转化结果训练的。
根据本公开实施例的另一个方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时由处理器执行以上任意一项所述的方法。
根据本公开实施例的另一个方面,还提供了一种确定话术的装置,包括:画像确定模块,用于在与用户进行交互过程中,确定用户在当前交互节点的用户画像;数据获取模块,用于获取从交互开始至当前交互节点产生的交互过程信息,其中交互过程信息用于描述交互过程中至少一个交互节点采用的节点话术、用户针对节点话术的回答信息以及节点话术与回答信息的顺序关系;以及话术确定模块,用于利用预先训练的模型对用户画像和交互过程信息进行计算,确定在当前交互节点针对用户进行交互的目标话术,其中模型是基于用户画像和交互过程信息以及对应的话术转化结果训练的。
根据本公开实施例的另一个方面,还提供了一种确定话术的装置,包括:处理器;以及存储器,与处理器连接,用于为处理器提供处理以下处理步骤的指令:在与用户进行交互过程中,确定用户在当前交互节点的用户画像;获取从交互开始至当前交互节点产生的交互过程信息,其中交互过程信息用于描述交互过程中至少一个交互节点采用的节点话术、用户针对节点话术的回答信息以及节点话术与回答信息的顺序关系;以及利用预先训练的模型对用户画像和交互过程信息进行计算,确定在当前交互节点针对用户进行交互的目标话术,其中模型是基于用户画像和交互过程信息以及对应的话术转化结果训练的。
在本公开实施例中,首先确定当前交互节点的用户画像以及交互过程信息,然后利用模型根据用户画像和交互过程信息对当前交互节点采用的话术进行预测。从而,与现有技术相比,本方案在确定话术的过程中可以结合实时的用户画像信息和交互过程信息(问答信息),因此最终确定的目标话术能够更加贴近用户的需求,更加的精准,并且能为用户提供优质的体验。进而解决了现有技术中存在的在交互过程中确定话术的方法缺乏对从交互开始到当前所产生的全部交互内容进行参考,因此影响话术的精准性的技术问题。
附图说明
此处所说明的附图用来提供对本公开的进一步理解,构成本申请的一部分,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。在附图中:
图1是用于实现根据本公开实施例1所述的方法的计算设备的硬件结构框图;
图2是根据本公开实施例1的第一个方面所述的确定话术的方法的流程示意图;
图3是根据本公开实施例1所述的交互节点的示意图;
图4是根据本公开实施例1所述的模型训练以及预测的示意图;
图5是根据本公开实施例2所述的确定话术的装置的示意图;以及
图6是根据本公开实施例3所述的确定话术的装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本公开的技术方案,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本公开一部分的实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本公开保护的范围。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例1
根据本实施例,还提供了一种确定话术的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本实施例所提供的方法实施例可以在服务器或者类似的计算设备中执行。图1示出了一种用于实现确定话术的方法的计算设备的硬件结构框图。如图1所示,计算设备可以包括一个或多个处理器(处理器可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器、以及用于通信功能的传输装置。除此以外,还可以包括:显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为I/O接口的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算设备还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
应当注意到的是上述一个或多个处理器和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到计算设备中的其他元件中的任意一个内。如本公开实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。
存储器可用于存储应用软件的软件程序以及模块,如本公开实施例中的确定话术的方法对应的程序指令/数据存储装置,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的应用程序的确定话术的方法。存储器可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至计算设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算设备的通信供应商提供的无线网络。在一个实例中,传输装置包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
显示器可以例如触摸屏式的液晶显示器(LCD),该液晶显示器可使得用户能够与计算设备的用户界面进行交互。
此处需要说明的是,在一些可选实施例中,上述图1所示的计算设备可以包括硬件元件(包括电路)、软件元件(包括存储在计算机可读介质上的计算机代码)、或硬件元件和软件元件两者的结合。应当指出的是,图1仅为特定具体实例的一个实例,并且旨在示出可存在于上述计算设备中的部件的类型。
在上述运行环境下,根据本实施例的第一个方面,提供了一种确定话术的方法,该方法例如可以应用到智能机器人交互系统的服务器,该交互系统的机器人例如可以处理电话回访、营销、投诉、咨询等交互过程。图2示出了该方法的流程示意图,参考图2所示,该方法包括:
S202:在与用户进行交互过程中,确定用户在当前交互节点的用户画像;
S204:获取从交互开始至当前交互节点产生的交互过程信息,其中交互过程信息用于描述交互过程中至少一个交互节点采用的节点话术、用户针对节点话术的回答信息以及节点话术与回答信息的顺序关系;以及
S206:利用预先训练的模型对用户画像和交互过程信息进行计算,确定在当前交互节点针对用户进行交互的目标话术,其中模型是基于用户画像和交互过程信息以及对应的话术转化结果训练的。
正如背景技术中所述的,由于人工智能技术发展,现在已近出现许多通过机器人与人进行语音交流系统,特别是语音客服,智能电销,智能催收,智能音箱等语音交互场景应用非常广泛。当机器人能够与人语音交流后,需要不断优化机器人话术以提升交流后效果。现有技术中的话术选择方式主要是针对用户的每一句回答选择话术,而没有考虑到在整个交互过程中的全部问答信息(即从交互开始到当前时间的全部交互内容),因此最终确定的话术的精准性还有待提高。
针对背景技术中存在的技术问题,本实施例技术方案在步骤S202中,在利用机器人与用户进行交互过程中,系统服务器首先确定用户在当前交互节点的用户画像。其中,在交互过程中可以包括多个交互节点。在一个具体实例中,参考图3所示,包括开场白交互节点、引导方式交互节点、额度话术交互节点、营销卖点交互节点等,每个交互节点包括多个节点话术,例如:开场白节点包括姓核身(核实姓名身份)话术、自我介绍话术。其中,当前交互节点为交互过程中当前时间的交互节点,例如:在与用户交互过程中已经完成开场白和引导方式的交互过程,即将开始额度话术交互节点的交互,则当前交互节点对应于额度话术交互节点。服务器需要确定当前交互节点的用户画像,即当前交互节点之前的用户行为或特征。在一个具体实例中以电话催收为例,用户画像例如但不限于包括用户的性别、年龄、历史购买记录统计特征、登录访问行为记录、贷款记录等。
进一步地,在步骤S204中,服务器获取从交互开始至当前交互节点产生的交互过程信息,其中交互过程信息用于描述交互过程中至少一个交互节点采用的节点话术、用户针对节点话术的回答信息以及节点话术与回答信息的顺序关系。即,服务器获取从交互开始到当前交互节点机器人与用户的通话记录。在一个具体实例中,在开场白交互节点的节点话术为“自我介绍”,然后用户针对该“自我介绍”话术可以做出相应的回答信息,其中该回答信息可以是表明用户的意图的意图信息(例如:肯定在用户感兴趣的情况下可以是肯定意图,或者在用户不感兴趣的情况下可以是其他意图),此外用户的回答信息还可以是具体的文本信息(例如:具体的回答话语,然后转化为对应的文本)。然后服务器会针对用户的回答信息可以在引导方式交互节点选择合适的节点话术进行引导,例如在引导方式节点采用的话术为“回访引导”,则“自我介绍”、回答信息以及“回访引导”构成该交互过程信息,并且对应的顺序为:自我介绍—回答信息—回访引导。此外,在选择交互节点的过程中可以根据用户的回答信息进行选择,最终根据机器人的节点话术以及用户的回答信息按顺序排序,构成交互过程信息。
最终,在步骤S206中,服务器利用预先训练的模型对用户画像和交互过程信息进行计算,确定在当前交互节点针对用户进行交互的目标话术,即确定额度话术交互节点(当前交互节点)采用的目标话术。其中模型是基于用户画像和交互过程信息以及对应的话术转化结果训练的。具体地,在模型训练过程中参考图4所示,首先获取每一个预测话术的拨打记录(历史拨打记录)包括机器人问题,用户回答,条件判断等信息。进一步地,获取每一个拨打记录对应时间点(当前交互节点)的用户画像信息(性别年龄、历史购买记录统计特征、登录访问行为记录、贷款记录)。然后根据用户画像信息和拨打记录以及该预测话术的转化结果(是否转化成功),对模型进行训练。此外,模型的建模方法例如但不限于是逻辑回归,树类型模型,深度学习等建模方法。在模型训练完成之后,可以利用该模型根据用户画像和交互过程信息对话术进行预测,得到目标话术。
从而通过这种方式,服务器首先确定当前交互节点的用户画像以及交互过程信息,然后利用模型根据用户画像和交互过程信息对当前交互节点采用的话术进行预测。从而,与现有技术相比,本方案在确定话术的过程中可以结合实时的用户画像信息和交互过程信息(问答信息),因此最终确定的目标话术能够更加贴近用户的需求,更加的精准,并且能为用户提供优质的体验。进而解决了现有技术中存在的在交互过程中确定话术的方法缺乏对从交互开始到当前所产生的全部交互内容进行参考,因此影响话术的精准性的技术问题。
可选地,利用预先训练的模型对用户画像和交互过程信息进行计算,确定在当前交互节点针对用户进行交互的目标话术,包括:确定与用户画像对应的第一特征信息,确定与交互过程信息对应的第二特征信息;以及利用预先训练的模型对第一特征信息和第二特征信息进行计算,确定在当前交互节点针对用户进行交互的目标话术。
具体地,在利用预先训练的模型对用户画像和交互过程信息进行计算,确定在当前交互节点针对用户进行交互的目标话术的操作中,服务器首先确定与用户画像对应的第一特征信息和与交互过程信息对应的第二特征信息,即对用户画像和交互过程信息进行特征表示,其表示的方式例如可以采用现有技术中的特征表示方法。其中,在用户画像为离散的情况下例如可以采用Embedding编码(也可以使用Onehot)确定该第一特征信息,在用户画像为连续特征的情况下直接使用。对于交互过程信息例如也可以采用Embedding编码(也可以使用Onehot)进行处理,然后将每个交互记录(节点话术以及用户的回答信息)对应的Embedding编码组成序列数组(对应于第二特征信息)。进一步地,服务器利用预先训练的模型对第一特征信息和第二特征信息进行计算,确定在当前交互节点针对用户进行交互的目标话术。其中,在该模型训练过程中,确定拨打记录和用户画像之后,还对获取的数据(用户画像和拨打记录)进行特征处理,形成模型可用训练数据,然后利用特征数据训练模型。
可选地,回答信息对应于用户的意图信息,获取从交互开始至当前交互节点产生的交互过程信息之后,还包括:利用预设的标识对交互过程信息中的节点话术和意图信息进行表示,确定与交互过程信息对应的交互信息序列,并且确定与交互过程信息对应的第二特征信息,包括:确定与交互信息序列对应的第二特征信息。
具体地,用户的回答信息对应于用户的意图信息,意图信息例如包括肯定意图和其他意图,在获取从交互开始至当前交互节点产生的交互过程信息之后,服务器还利用预设的标识对交互过程信息中的节点话术和意图信息进行表示,确定与交互过程信息对应的交互信息序列。参考图3所示,在一个具体实例中,例如节点话术采用的标识可以用SXY表示,其中X表示交互节点序号,例如:开场白、引导方式以及额度话术的顺序依次是1、2、3。Y代表每个交互节点中节点话术序号,例如:开场白交互节点中“姓核身”话术和“自我介绍”话术顺序依次是1和2,则开场白交互节点中“姓核身”节点话术对应的标识为S11、“自我介绍”话术对应的标识为S12;同理,引导方式交互节点中“礼貌引导”话术对应的标识为S21,“直接营销”话术对应的标识为S22、“回访引导”话术对应的标识为S23等。意图信息例如可以用IXY进行表示,肯定意图对应的标识为I11、其他意图对应的标识为I12。此外,还可以包括条件判断标识JXY,满足条件(还款时间10天内)对应的标识例如可以是J11,不满足条件(还款时间为其他时间)为J21。通过利用预设的标识对交互过程信息中的节点话术和意图信息进行表示,可以得到对应的交互信息序列,例如交互信息序列的形式可以是:S11->S21(表示的交互过程为先进行姓核身,然后进行礼貌引导),S12->S22->J12->S41(自我介绍-直接营销-用户不满足条件-正向利益告知)。并且,在确定与交互过程信息对应的第二特征信息的操作中,服务器确定与交互信息序列对应的第二特征信息。即:将交互信息序列转化为对应的第二特征信息。此外,在模型训练过程中,根据该第二特征信息进行训练。从而,在确定特征的过程中可以引入用户的意图,因此可以使结果更加贴近用户。此外,还可以将交互过程的文本信息先转化为对应的标识,然后根据标识生成对应的第二特征信息,从而可以方便特征信息的生成。此外,利用标识对节点进行表示,统一了机器人问题,用户回答,条件判断等信息表达方式,方便后续处理。
可选地,回答信息对应于用户的回答文本,获取从交互开始至当前交互节点产生的交互过程信息之后,还包括:利用预设的标识对交互过程信息中的节点话术进行表示,生成与回答文本对应的句向量;以及根据句向量和经过标识表示的节点话术确定与交互过程信息对应的交互信息序列,并且确定与交互过程信息对应的第二特征信息,包括:确定与交互信息序列对应的第二特征信息。
具体地,回答信息还可以对应用户的回答文本,即用户具体的交互内容。在获取从交互开始至当前交互节点产生的交互过程信息之后,服务器还可以利用预设的标识对交互过程信息中的节点话术进行表示,即上述的利用SXY标识对节点话术进行表示,并且生成与回答文本对应的句向量,其中生成句向量的方式例如可以采用现有技术中的方式,例如BERT模型生成,还可以采用其他模型生成,此处不做具体限定。在将节点话术进行标识表示以及将回答文本转化为对应的句向量之后,根据句向量和经过标识表示的节点话术确定与交互过程信息对应的交互信息序列,例如:将标识和句向量按照顺序进行连接。然后,在确定与交互过程信息对应的第二特征信息的操作中,服务器确定与交互信息序列对应的第二特征信息。此外,在模型训练过程中,根据该第二特征信息进行训练。从而,在生成特征信息的过程中可以直接引入用户的回答信息的句向量,因此可以更加贴近用户的需求,并且可以方便特征信息的生成。此外,利用标识对节点进行表示,统一了机器人问题,用户回答,条件判断等信息表达方式,方便后续处理。
可选地,利用预先训练的模型对第一特征信息和第二特征信息进行计算,确定在当前交互节点针对用户进行交互的目标话术,包括:利用预先训练的模型对第一特征信息和第二特征信息进行计算,确定当前交互节点的多个话术对应的概率值;以及根据概率值,从多个话术中确定在当前交互节点针对用户进行交互的目标话术。
具体地,在利用预先训练的模型对第一特征信息和第二特征信息进行计算,确定在当前交互节点针对用户进行交互的目标话术的操作中,服务器首先利用预先训练的模型对第一特征信息和第二特征信息进行计算,确定当前交互节点的多个话术对应的概率值。例如:当前交互节点为额度话术交互节点,额度话术交互节点包括“额度询问1”和“额度询问2”两个节点话术,在经过模型计算之后可以得出两个话术对应的概率值,然后根据该概率值,从多个话术中确定在当前交互节点针对用户进行交互的目标话术。例如:选择概率值大的作为该目标话术。通过概率值可以清楚快速地确定该目标话术。
可选地,所述方法还包括根据以下操作训练模型:获取用户的拨打记录以及用户的用户画像;确定与拨打记录对应的拨打记录特征信息和与用户画像对应的用户特征信息;以及根据拨打记录特征信息和用户特征信息以及拨打记录的转化结果训练模型。
具体地,参考图4所示,在训练模型的过程中,首先获取每一个预测话术的拨打记录(历史拨打记录)和用户画像信息(性别年龄、历史购买记录统计特征、登录访问行为记录、贷款记录)。然后,将用户画像信息和拨打记录进行特征表示。进一步地,根据用户画像信息特征和拨打记录特征以及该预测话术的转化结果(是否转化成功),对模型进行训练。在模型训练完成之后,可以利用该模型根据用户画像和交互过程信息对话术进行预测,得到目标话术。
此外,需要补充说明的是,参考图4所示的模型训练以及模型预测的示意图,
模型训练包括以下步骤:
1.获取每一个预测话术的拨打记录,除了拨打的属性信息(拨打时间、拨打时长、什么任务、什么活动、什么机器人)外,还需要对话访问的路径信息(对应于拨打记录),拨打记录包括机器人问题,用户回答,条件判断等信息。
2.获取每一个拨打记录对应时间点的用户画像信息(性别年龄、历史购买记录统计特征、登录访问行为记录、贷款记录)。
3.对获取的数据进行特征处理,形成模型可用训练数据,其中对拨打记录进行标识,形成对话访问节点路径序列(对应于上述的交互信息序列)。
4.使用用户画像实时特征和用户对话访问路径信息特征的模型进行训练并发布预测服务。
模型预测包括以下步骤:
1.获取当前对话的上文信息(对应于交互过程信息),包括机器人问题,用户回答,条件判断等信息,形成对话访问节点路径序列(利用标识进行表示,生成交互信息序列)。
2.获取当前用户实时的画像信息,并保存特征,方便下次训练使用。
3.对获取的数据进行特征处理,形成模型可用训练数据。
4.使用用户画像实时特征和用户对话上文信息+各个待预测话术进行预测(模型预测),选择转化率最高的待预测话术进行推荐。
在一个具体实例中,参考图3所示,交互节点包括开场白,引导方式,额度话术,营销卖点4个交互节点,每个交互节点包括多个节点话术(后续节点省略)。此外,还包括条件判断、意图判断等会导致走不同后续话术的判断节点。其中,节点话术用SXY标识进行表示,意图用IXY标识进行表示,判断条件用JXY标识进行表示,表1示出了标识表示后的交互信息序列、用户画像以及是否转化的用于模型训练的拨打记录表,表1如下所示:
表1
拨打记录 用户特征(用户画像) 交互信息序列 是否转化标识
用户1 …… S11->S21 1
用户2 …… S12->S22->J12->S41 0
用户3 …… S11->S23->S31->I12->S42 1
参考表1所示,训练过程如下:
1.获取所有拨打记录,得到拨打记录、转化标识、交互信息序列。
2.获取每一个拨打记录对应时间点的用户画像信息形成用户特征xxx(用户画像)。
3.用户画像特征中离散特征使用Embedding编码(也可以使用Onehot),连续特征直接使用,对于交互信息序列,每一个节点使用Embedding编码(也可以使用Onehot),然后所有节点形成一个Embedding编码的序列数组。(对数据进行特征表示)
4.对于上述数据进行训练是否转化的模型,并发布预测服务,其中用户特征使用常规DNN(也可以是DeepFM等其它模型)建模,(根据用户特征预测)对于节点流程使用Attention(也可以是RNN等序模型)建模,然后对各个部分进行组合(可以并联)建模。(根据用户画像特征和拨打记录特征以及最终的转化结果建模的过程)。
模型预测如下:
1.获取当前对话的上文信息(交互过程信息),加上每一个待预测交互节点形成节点流程信息。
2.获取当前交互节点用户实时的画像信息,形成用户特征xxx信息,并保存特征,方便下次训练使用。
3.对获取的数据进行特征处理,形成模型可用训练数据,处理方式同训练阶段。
4.使用用户画像实时特征和用户交互过程信息特征进行预测各个待预测节点话术转化率,使用转化率最高的节点话术作为目标话术使用。
本方案具有以下优点:
使用拨打实时特征,解决之前只使用离线特征,可能在预测时特征已近出现变化的问题。
引入用户对话节点信息后,每一个话术推荐都能利用对话上文信息,结合机器人在当前会话中之前的话术,用户之前的回答进行推荐,所以每一个话术预测都是当前最优组合预测,解决了之前方案【开场白】和【引导方式】独立预测无相关的问题,比如【开场白S11】和【引导方式S21】独立预测时最好,但是【开场白S11】与【引导方式S22】组合优于【开场白S11】与【引导方式S21】这种情况无法推荐,降低模型效果。
本方案考虑了机器人的全局信息,让一个模型学习所有话术组合效果差异,让模型直接学出效果最优的组合,达到机器人效果最优。本方案产生如下收益:
对于离线训练,使用实时用户特征可以得到更准确的用户信息来提高模型预测能力,比如在电销,用户今天是否登陆过APP等容易变化信息。
引入用户对话节点信息,会增加更多对话信息,并且可以解决话术组合最优推荐问题,比如【引导方式S2X】的最优,参考【开场白】和不参考结果可能不一样,利用所有分支节点作为对话状态节点,统一了机器人问题,用户回答,条件判断等信息表达方式,方便后续处理。
此外,本方案使用用户会话实时信息解决用户信息预测时的可能变化的问题。无论使用逻辑回归,树类型模型,深度学习等任何模型,还是在特征做各种变化(比如特征交叉,特征映射),增加特征信息,只要样本构建方式如本方案所示,都只算是本方案建模方式的一种算法应用,。
用户画像特征指能与用户关联的所有特征,包括但不限于用户属性,用户行为,用户历史拨打信息等。
对于话术预测时多个话术使用并行方式计算,还是使用矩阵方式计算,都只是本专利的一种加速预测的实现方式。
本方案适用于所有智能语音话术预测场景,包括但不限于智能外呼,呼入,语音催收,回访,电销等,也适用于文本多轮对话话术预测场景。
此外,参考图1所示,根据本实施例的第二个方面,提供了一种存储介质。所述存储介质包括存储的程序,其中,在所述程序运行时由处理器执行以上任意一项所述的方法。
从而根据本实施例,首先确定当前交互节点的用户画像以及交互过程信息,然后利用模型根据用户画像和交互过程信息对当前交互节点采用的话术进行预测。从而,与现有技术相比,本方案在确定话术的过程中可以结合实时的用户画像信息和交互过程信息(问答信息),因此最终确定的目标话术能够更加贴近用户的需求,更加的精准,并且能为用户提供优质的体验。进而解决了现有技术中存在的在交互过程中确定话术的方法缺乏对从交互开始到当前所产生的全部交互内容进行参考,因此影响话术的精准性的技术问题。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
实施例2
图5示出了根据本实施例所述的确定话术的装置500,该装置500与根据实施例1的第一个方面所述的方法相对应。参考图5所示,该装置500包括:画像确定模块510,用于在与用户进行交互过程中,确定用户在当前交互节点的用户画像;数据获取模块520,用于获取从交互开始至当前交互节点产生的交互过程信息,其中交互过程信息用于描述交互过程中至少一个交互节点采用的节点话术、用户针对节点话术的回答信息以及节点话术与回答信息的顺序关系;以及话术确定模块530,用于利用预先训练的模型对用户画像和交互过程信息进行计算,确定在当前交互节点针对用户进行交互的目标话术,其中模型是基于用户画像和交互过程信息以及对应的话术转化结果训练的。
可选地,话术确定模块530,包括:特征确定子模块,用于确定与用户画像对应的第一特征信息,确定与交互过程信息对应的第二特征信息;以及话术确定子模块,用于利用预先训练的模型对第一特征信息和第二特征信息进行计算,确定在当前交互节点针对用户进行交互的目标话术。
可选地,回答信息对应于用户的意图信息,装置还包括:第一转化模块,用于在获取从交互开始至当前交互节点产生的交互过程信息之后,利用预设的标识对交互过程信息中的节点话术和意图信息进行表示,确定与交互过程信息对应的交互信息序列,并且特征确定子模块,包括:第一特征确定单元,用于确定与交互信息序列对应的第二特征信息。
可选地,回答信息对应于用户的回答文本,装置还包括:第二转化模块,用于在获取从交互开始至当前交互节点产生的交互过程信息之后,利用预设的标识对交互过程信息中的节点话术进行表示,生成与回答文本对应的句向量;以及序列确定模块,用于根据句向量和经过标识表示的节点话术确定与交互过程信息对应的交互信息序列,并且特征确定子模块,包括:第二特征确定单元,用于确定与交互信息序列对应的第二特征信息。
可选地,话术确定子模块,包括:计算单元,用于利用预先训练的模型对第一特征信息和第二特征信息进行计算,确定当前交互节点的多个话术对应的概率值;以及确定单元,用于根据概率值,从多个话术中确定在当前交互节点针对用户进行交互的目标话术。
可选地,装置500还包括,模型训练模块,用于根据以下操作训练模型:获取用户的拨打记录以及用户的用户画像;确定与拨打记录对应的拨打记录特征信息和与用户画像对应的用户特征信息;以及根据拨打记录特征信息和用户特征信息以及拨打记录的转化结果训练模型。
从而根据本实施例,首先确定当前交互节点的用户画像以及交互过程信息,然后利用模型根据用户画像和交互过程信息对当前交互节点采用的话术进行预测。从而,与现有技术相比,本方案在确定话术的过程中可以结合实时的用户画像信息和交互过程信息(问答信息),因此最终确定的目标话术能够更加贴近用户的需求,更加的精准,并且能为用户提供优质的体验。进而解决了现有技术中存在的在交互过程中确定话术的方法缺乏对从交互开始到当前所产生的全部交互内容进行参考,因此影响话术的精准性的技术问题。
实施例3
图6示出了根据本实施例所述的确定话术的装置600,该装置600与根据实施例1的第一个方面所述的方法相对应。参考图6所示,该装置600包括:处理器610;以及存储器620,与处理器610连接,用于为处理器610提供处理以下处理步骤的指令:在与用户进行交互过程中,确定用户在当前交互节点的用户画像;获取从交互开始至当前交互节点产生的交互过程信息,其中交互过程信息用于描述交互过程中至少一个交互节点采用的节点话术、用户针对节点话术的回答信息以及节点话术与回答信息的顺序关系;以及利用预先训练的模型对用户画像和交互过程信息进行计算,确定在当前交互节点针对用户进行交互的目标话术,其中模型是基于用户画像和交互过程信息以及对应的话术转化结果训练的。
可选地,利用预先训练的模型对用户画像和交互过程信息进行计算,确定在当前交互节点针对用户进行交互的目标话术,包括:确定与用户画像对应的第一特征信息,确定与交互过程信息对应的第二特征信息;以及利用预先训练的模型对第一特征信息和第二特征信息进行计算,确定在当前交互节点针对用户进行交互的目标话术。
可选地,回答信息对应于用户的意图信息,获取从交互开始至当前交互节点产生的交互过程信息之后,还包括:利用预设的标识对交互过程信息中的节点话术和意图信息进行表示,确定与交互过程信息对应的交互信息序列,并且确定与交互过程信息对应的第二特征信息,包括:确定与交互信息序列对应的第二特征信息。
可选地,回答信息对应于用户的回答文本,获取从交互开始至当前交互节点产生的交互过程信息之后,还包括:利用预设的标识对交互过程信息中的节点话术进行表示,生成与回答文本对应的句向量;以及根据句向量和经过标识表示的节点话术确定与交互过程信息对应的交互信息序列,并且确定与交互过程信息对应的第二特征信息,包括:确定与交互信息序列对应的第二特征信息。
可选地,利用预先训练的模型对第一特征信息和第二特征信息进行计算,确定在当前交互节点针对用户进行交互的目标话术,包括:利用预先训练的模型对第一特征信息和第二特征信息进行计算,确定当前交互节点的多个话术对应的概率值;以及根据概率值,从多个话术中确定在当前交互节点针对用户进行交互的目标话术。
可选地,所述存储器620还用于为处理器610提供处理以下训练模型的指令:获取用户的拨打记录以及用户的用户画像;确定与拨打记录对应的拨打记录特征信息和与用户画像对应的用户特征信息;以及根据拨打记录特征信息和用户特征信息以及拨打记录的转化结果训练模型。
从而根据本实施例,首先确定当前交互节点的用户画像以及交互过程信息,然后利用模型根据用户画像和交互过程信息对当前交互节点采用的话术进行预测。从而,与现有技术相比,本方案在确定话术的过程中可以结合实时的用户画像信息和交互过程信息(问答信息),因此最终确定的目标话术能够更加贴近用户的需求,更加的精准,并且能为用户提供优质的体验。进而解决了现有技术中存在的在交互过程中确定话术的方法缺乏对从交互开始到当前所产生的全部交互内容进行参考,因此影响话术的精准性的技术问题。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种确定话术的方法,其特征在于,包括:
在与用户进行交互过程中,确定所述用户在当前交互节点的用户画像;
获取从交互开始至所述当前交互节点产生的交互过程信息,其中所述交互过程信息用于描述交互过程中至少一个交互节点采用的节点话术、所述用户针对所述节点话术的回答信息以及所述节点话术与所述回答信息的顺序关系;以及
利用预先训练的模型对所述用户画像和所述交互过程信息进行计算,确定在所述当前交互节点针对所述用户进行交互的目标话术,其中所述模型是基于用户画像和交互过程信息以及对应的话术转化结果训练的。
2.根据权利要求1所述的方法,其特征在于,利用预先训练的模型对所述用户画像和所述交互过程信息进行计算,确定在所述当前交互节点针对所述用户进行交互的目标话术,包括:
确定与所述用户画像对应的第一特征信息,确定与所述交互过程信息对应的第二特征信息;以及
利用预先训练的模型对所述第一特征信息和所述第二特征信息进行计算,确定在所述当前交互节点针对所述用户进行交互的目标话术。
3.根据权利要求2所述的方法,其特征在于,所述回答信息对应于所述用户的意图信息,获取从交互开始至所述当前交互节点产生的交互过程信息之后,还包括:利用预设的标识对所述交互过程信息中的所述节点话术和所述意图信息进行表示,确定与所述交互过程信息对应的交互信息序列,并且
确定与所述交互过程信息对应的第二特征信息,包括:确定与所述交互信息序列对应的所述第二特征信息。
4.根据权利要求2所述的方法,其特征在于,所述回答信息对应于所述用户的回答文本,获取从交互开始至所述当前交互节点产生的交互过程信息之后,还包括:
利用预设的标识对所述交互过程信息中的所述节点话术进行表示,生成与所述回答文本对应的句向量;以及
根据所述句向量和经过标识表示的所述节点话术确定与所述交互过程信息对应的交互信息序列,并且
确定与所述交互过程信息对应的第二特征信息,包括:确定与所述交互信息序列对应的所述第二特征信息。
5.根据权利要求2所述的方法,其特征在于,利用预先训练的模型对所述第一特征信息和所述第二特征信息进行计算,确定在所述当前交互节点针对所述用户进行交互的目标话术,包括:
利用预先训练的模型对所述第一特征信息和所述第二特征信息进行计算,确定所述当前交互节点的多个话术对应的概率值;以及
根据所述概率值,从所述多个话术中确定在所述当前交互节点针对所述用户进行交互的目标话术。
6.根据权利要求1所述的方法,其特征在于,还包括根据以下操作训练所述模型:
获取用户的拨打记录以及所述用户的用户画像;
确定与所述拨打记录对应的拨打记录特征信息和与所述用户画像对应的用户特征信息;以及
根据所述拨打记录特征信息和所述用户特征信息以及所述拨打记录的转化结果训练所述模型。
7.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时由处理器执行权利要求1至6中任意一项所述的方法。
8.一种确定话术的装置,其特征在于,包括:
画像确定模块,用于在与用户进行交互过程中,确定所述用户在当前交互节点的用户画像;
数据获取模块,用于获取从交互开始至所述当前交互节点产生的交互过程信息,其中所述交互过程信息用于描述交互过程中至少一个交互节点采用的节点话术、所述用户针对所述节点话术的回答信息以及所述节点话术与所述回答信息的顺序关系;以及
话术确定模块,用于利用预先训练的模型对所述用户画像和所述交互过程信息进行计算,确定在所述当前交互节点针对所述用户进行交互的目标话术,其中所述模型是基于用户画像和交互过程信息以及对应的话术转化结果训练的。
9.根据权利要求8所述的装置,其特征在于,所述话术确定模块,包括:
特征确定子模块,用于确定与所述用户画像对应的第一特征信息,确定与所述交互过程信息对应的第二特征信息;以及
话术确定子模块,用于利用预先训练的模型对所述第一特征信息和所述第二特征信息进行计算,确定在所述当前交互节点针对所述用户进行交互的目标话术。
10.一种确定话术的装置,其特征在于,包括:
处理器;以及
存储器,与所述处理器连接,用于为所述处理器提供处理以下处理步骤的指令:
在与用户进行交互过程中,确定所述用户在当前交互节点的用户画像;
获取从交互开始至所述当前交互节点产生的交互过程信息,其中所述交互过程信息用于描述交互过程中至少一个交互节点采用的节点话术、所述用户针对所述节点话术的回答信息以及所述节点话术与所述回答信息的顺序关系;以及
利用预先训练的模型对所述用户画像和所述交互过程信息进行计算,确定在所述当前交互节点针对所述用户进行交互的目标话术,其中所述模型是基于用户画像和交互过程信息以及对应的话术转化结果训练的。
CN202010732572.4A 2020-07-27 2020-07-27 确定话术的方法、装置以及存储介质 Pending CN114005439A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010732572.4A CN114005439A (zh) 2020-07-27 2020-07-27 确定话术的方法、装置以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010732572.4A CN114005439A (zh) 2020-07-27 2020-07-27 确定话术的方法、装置以及存储介质

Publications (1)

Publication Number Publication Date
CN114005439A true CN114005439A (zh) 2022-02-01

Family

ID=79920245

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010732572.4A Pending CN114005439A (zh) 2020-07-27 2020-07-27 确定话术的方法、装置以及存储介质

Country Status (1)

Country Link
CN (1) CN114005439A (zh)

Similar Documents

Publication Publication Date Title
JP7288446B2 (ja) ヒューマンマシン対話方法および電子デバイス
CN110138982B (zh) 基于人工智能的服务实现
CN111523305A (zh) 文本的纠错方法、装置和系统
CN108897896B (zh) 基于强化学习的关键词抽取方法
CN109543005A (zh) 客服机器人对话状态识别方法及装置、设备、存储介质
CN113312468B (zh) 基于对话模式的话术推荐方法、装置、设备及介质
US11995523B2 (en) Systems and methods for determining training parameters for dialog generation
KR20190117840A (ko) 대화 이해 ai 시스템에 의한 고객 상담의 제공 중에 사람 상담 직원으로 하여금 해당 고객을 위한 이후 상담을 진행하도록 전환하는 방법 및 컴퓨터 판독가능 기록 매체
CN110534104A (zh) 智能对话系统的语音匹配方法、电子装置、计算机设备
CN116049360A (zh) 基于客户画像的智能语音对话场景话术干预方法及系统
CN112182186A (zh) 智能客服的运行方法、装置以及系统
CN110489519B (zh) 基于会话预测模型的会话方法及相关产品
CN111914077A (zh) 定制化话术推荐方法、装置、计算机设备及存储介质
CN116432665B (zh) 对话模型构建方法、文本生成方法、装置、系统及设备
CN115658875B (zh) 基于聊天服务的数据处理方法及相关产品
CN114023309A (zh) 语音识别系统、相关方法、装置及设备
CN114490994B (zh) 对话管理方法及装置
CN114005439A (zh) 确定话术的方法、装置以及存储介质
CN111556096B (zh) 信息推送方法、装置、介质及电子设备
CN114510556A (zh) 确定话术的方法、装置以及存储介质
CN114077656A (zh) 确定最优话术序列的方法、装置及存储介质
CN113539275A (zh) 确定话术的方法、装置以及存储介质
CN111968632A (zh) 通话语音获取方法、装置、计算机设备和存储介质
CN115129847B (zh) 智能回答方法及装置
CN113392951A (zh) 话术预测的方法、装置以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination