CN116860932A - 基于人工智能的话术推荐方法、装置、设备及介质 - Google Patents

基于人工智能的话术推荐方法、装置、设备及介质 Download PDF

Info

Publication number
CN116860932A
CN116860932A CN202310799197.9A CN202310799197A CN116860932A CN 116860932 A CN116860932 A CN 116860932A CN 202310799197 A CN202310799197 A CN 202310799197A CN 116860932 A CN116860932 A CN 116860932A
Authority
CN
China
Prior art keywords
information
dialogue
data
candidate
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310799197.9A
Other languages
English (en)
Inventor
刘卓
赵越
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202310799197.9A priority Critical patent/CN116860932A/zh
Publication of CN116860932A publication Critical patent/CN116860932A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Machine Translation (AREA)

Abstract

本发明实施例涉及金融领域及智慧医疗技术领域,公开了一种基于人工智能的话术推荐方法、装置、设备及介质,方法包括:获取待推荐文本,并获取与待推荐文本对应的对话信息,对话信息包括对话角色信息、对话轮次信息和对话内容信息;将对话信息进行同纬度嵌入表示,得到第一数据;基于对话角色信息获取对话角色的属性信息,并将属性信息输入神经网络,得到第二数据;将第一数据和第二数据进行合并,得到第三数据,并将第三数据和待排序的候补话术集输入预设语言模型,以计算待推荐文本与候补话术集中每个候补话术的相似度;根据相似度对候补话术集中的所有候补话术进行排序,得到目标候补话术集,并根据目标候补话术集完成话术推荐。

Description

基于人工智能的话术推荐方法、装置、设备及介质
技术领域
本发明涉及基于人工智能、金融领域及智慧医疗技术领域,尤其涉及一种基于人工智能的话术推荐方法、装置、设备及介质。
背景技术
金融领域的线上咨询是一个客户服务对话过程,智慧医疗领域的线上问诊本质也是一个客户服务对话过程,其中,线上问诊的医生扮演服务提供方,患者是被服务的客户,线上咨询的工作人员扮演服务提供方,问询者是被服务的客户,目前的客户服务领域,人们越来越依赖于自动化的话术推荐过程来提供高效、个性化的交流体验。
然而,现有的话术推荐过程在候选话术的排序和推荐方面存在一些明显的缺陷,首先,目前的话术推荐过程往往只能基于单轮对话进行推断,而无法全面考虑上下文和多轮对话中的信息。这导致了候选话术的排序不够准确和连贯,无法适应复杂的对话场景。其次,现有的话术推荐过程在候选话术的排序过程中缺乏个性化和用户导向的考虑。它们通常基于固定的规则或简单的统计方法,无法真正理解用户的意图和上下文,从而无法提供高度个性化和定制化的回复建议。此外,现有的话术推荐过程在面对复杂的问题或对话场景时往往表现出局限性,缺乏灵活性和适应性,无法处理语义上的多义性、语境的变化以及隐含信息的理解,导致话术推荐的质量不尽如人意。
发明内容
有鉴于此,本发明提供了一种基于人工智能的话术推荐方法、装置、设备及介质,用于解决现有技术中话术推荐过程基于单轮对话进行推断,缺乏灵活性和适应性,导致话术推荐的质量不佳的问题。
为达上述之一或部分或全部目的或是其他目的,本发明提出一种基于人工智能的话术推荐方法,包括:获取待推荐文本,并获取与所述待推荐文本对应的对话信息,所述对话信息包括对话角色信息、对话轮次信息和对话内容信息;
将所述对话信息进行同纬度嵌入表示,得到第一数据;
基于所述对话角色信息获取对话角色的属性信息,并将所述属性信息输入神经网络,得到第二数据,所述属性信息为结构化信息;
将所述第一数据和所述第二数据进行合并,得到第三数据,并将所述第三数据和待排序的候补话术集输入预设语言模型,以计算所述待推荐文本与所述候补话术集中每个候补话术的相似度;
根据所述相似度的由大到小顺序对候补话术集中的所有候补话术进行排序,得到目标候补话术集,并根据所述目标候补话术集完成话术推荐。
另一方面,本申请提供了一种基于人工智能的话术推荐装置,所述装置包括:
数据采集模块,用于获取待推荐文本,并获取与所述待推荐文本对应的对话信息,所述对话信息包括对话角色信息、对话轮次信息和对话内容信息;
嵌入模块,用于将所述对话信息进行同纬度嵌入表示,得到第一数据;
转换模块,用于基于所述对话角色信息获取对话角色的属性信息,并将所述属性信息输入神经网络,得到第二数据,所述属性信息为结构化信息;
合并模块,用于将所述第一数据和所述第二数据进行合并,得到第三数据,并将所述第三数据和待排序的候补话术集输入预设语言模型,以计算所述待推荐文本与所述候补话术集中每个候补话术的相似度;
推荐模块,用于根据所述相似度的由大到小顺序对候补话术集中的所有候补话术进行排序,得到目标候补话术集,并根据所述目标候补话术集完成话术推荐。
另一方面,本申请提供了一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过所述总线通信,所述机器可读指令被所述处理器执行时执行:获取待推荐文本,并获取与所述待推荐文本对应的对话信息,所述对话信息包括对话角色信息、对话轮次信息和对话内容信息;将所述对话信息进行同纬度嵌入表示,得到第一数据;基于所述对话角色信息获取对话角色的属性信息,并将所述属性信息输入神经网络,得到第二数据,所述属性信息为结构化信息;将所述第一数据和所述第二数据进行合并,得到第三数据,并将所述第三数据和待排序的候补话术集输入预设语言模型,以计算所述待推荐文本与所述候补话术集中每个候补话术的相似度;根据所述相似度的由大到小顺序对候补话术集中的所有候补话术进行排序,得到目标候补话术集,并根据所述目标候补话术集完成话术推荐。
另一方面,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行:获取待推荐文本,并获取与所述待推荐文本对应的对话信息,所述对话信息包括对话角色信息、对话轮次信息和对话内容信息;将所述对话信息进行同纬度嵌入表示,得到第一数据;基于所述对话角色信息获取对话角色的属性信息,并将所述属性信息输入神经网络,得到第二数据,所述属性信息为结构化信息;将所述第一数据和所述第二数据进行合并,得到第三数据,并将所述第三数据和待排序的候补话术集输入预设语言模型,以计算所述待推荐文本与所述候补话术集中每个候补话术的相似度;根据所述相似度的由大到小顺序对候补话术集中的所有候补话术进行排序,得到目标候补话术集,并根据所述目标候补话术集完成话术推荐。
实施本发明实施例,将具有如下有益效果:
通过获取待推荐文本,并获取与所述待推荐文本对应的对话信息,所述对话信息包括对话角色信息、对话轮次信息和对话内容信息;将所述对话信息进行同纬度嵌入表示,得到第一数据;基于所述对话角色信息获取对话角色的属性信息,并将所述属性信息输入神经网络,得到第二数据,所述属性信息为结构化信息;将所述第一数据和所述第二数据进行合并,得到第三数据,并将所述第三数据和待排序的候补话术集输入预设语言模型,以计算所述待推荐文本与所述候补话术集中每个候补话术的相似度;根据所述相似度的由大到小顺序对候补话术集中的所有候补话术进行排序,得到目标候补话术集,并根据所述目标候补话术集完成话术推荐。利用了问诊中的结构化信息,例如,科室、医生ID、患者的年龄、性别、诊断等结构化信息,将结构化信息作为特征输入,为本次话术推荐提供更个性化的话术排序。全面考虑上下文和多轮对话中的信息,即,前文内容、说话者角色、说话轮次,能够提供高度个性化和定制化的话术推荐。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
其中:
图1是本申请实施例提供的一种基于人工智能的话术推荐方法的应用场景图;
图2是本申请实施例提供的一种基于人工智能的话术推荐方法的流程图;
图3是本申请实施例提供的一种基于人工智能的话术推荐装置的结构示意图;
图4是本发明一实施例中计算机设备的一结构示意图;
图5是本发明一实施例中计算机设备的另一结构示意图。
图6是本申请实施例提供的一种电子设备的结构示意图;
图7是本申请实施例提供的一种存储介质的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的基于人工智能的话术推荐方法,可应用在如图1的应用环境中,其中,客户端通过网络与服务端进行通信。服务端可以获取待推荐文本,并获取与所述待推荐文本对应的对话信息,所述对话信息包括对话角色信息、对话轮次信息和对话内容信息;将所述对话信息进行同纬度嵌入表示,得到第一数据;基于所述对话角色信息获取对话角色的属性信息,并将所述属性信息输入神经网络,得到第二数据,所述属性信息为结构化信息;将所述第一数据和所述第二数据进行合并,得到第三数据,并将所述第三数据和待排序的候补话术集输入预设语言模型,以计算所述待推荐文本与所述候补话术集中每个候补话术的相似度;根据所述相似度的由大到小顺序对候补话术集中的所有候补话术进行排序,得到目标候补话术集,并根据所述目标候补话术集完成话术推荐。在本发明中,利用了问诊中的结构化信息,例如,科室、医生ID、患者的年龄、性别、诊断等结构化信息,将结构化信息作为特征输入,为本次话术推荐提供更个性化的话术排序。全面考虑上下文和多轮对话中的信息,即,前文内容、说话者角色、说话轮次,能够提供高度个性化和定制化的话术推荐。其中,客户端可以但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务端可以用独立的服务器或者是多个服务器组成的服务器集群来实现。下面通过具体的实施例对本发明进行详细的描述。
为减轻服务端的计算压力,本发明实施例提供的基于人工智能的话术推荐方法,也可在应用在图1中的客户端,即,获取待推荐文本,并获取与所述待推荐文本对应的对话信息,所述对话信息包括对话角色信息、对话轮次信息和对话内容信息;将所述对话信息进行同纬度嵌入表示,得到第一数据;基于所述对话角色信息获取对话角色的属性信息,并将所述属性信息输入神经网络,得到第二数据,所述属性信息为结构化信息;将所述第一数据和所述第二数据进行合并,得到第三数据,并将所述第三数据和待排序的候补话术集输入预设语言模型,以计算所述待推荐文本与所述候补话术集中每个候补话术的相似度;根据所述相似度的由大到小顺序对候补话术集中的所有候补话术进行排序,得到目标候补话术集,并根据所述目标候补话术集完成话术推荐。
在医疗领域,将多句前文内容、说话者角色(医生或者患者)、说话轮次在相同维度上进行嵌入表示后,融合在一起,得到第一数据,结合了科室、医生身份标识号(ID)、患者的年龄、性别、诊断等结构化信息,将结构化信息编码后,输入多层神经网络,得到第二数据,将第一数据和第二数据融合,得到第三数据,进而根据预设语言模型完成对候补话术集中各个候补话术的排序,进而为医生进行话术推荐。
如图2所示,本申请实施例提供了一种基于人工智能的话术推荐方法,包括:
S101、获取待推荐文本,并获取与所述待推荐文本对应的对话信息,所述对话信息包括对话角色信息、对话轮次信息和对话内容信息;
本申请实施例提供的话术推荐方法,可应用于各种场景下的话术推荐装置或话术推荐引擎中,话术推荐的过程通常通过服务端来实现,进行话术推荐的服务端可以实时与用户的客户端进行数据传输。比如,当服务端接收到客户端的话术推荐请求信息后,根据话术推荐请求信息获取待推荐文本,并获取与所述待推荐文本对应的对话信息,所述对话信息包括对话角色信息、对话轮次信息和对话内容信息。
示例性的,在医疗领域,以线上问诊过程中的话术推荐为例,医生被咨询时,输入了半个句子,则将医生输入的文本作为待推荐文本,获取输入的文本所在的完整对话场景,进而在完整对话场景中提取对话信息,所述对话信息包括对话角色信息、对话轮次信息和对话内容信息。
其中,在线上问诊过程中对话角色信息包括医生和患者,将医生和患者的一次问答过程视为一个对话轮次,例如,患者询问“感冒吃什么药”,医生回答“病毒性感冒吃抗病毒的药物”,进而视为医生和患者进行了一个轮次的对话,对话内容信息为文本信息,即,医生和患者在问答过程中的文本信息。
S102、将所述对话信息进行同纬度嵌入表示,得到第一数据;
示例性的,所述对话信息中的对话角色信息、对话轮次信息和对话内容信息处于不同维度,将所述对话信息中的对话角色信息、对话轮次信息和对话内容信息进行维度转换,使得对话角色信息、对话轮次信息和对话内容信息处于同一维度后,将对话角色信息、对话轮次信息和对话内容信息进行嵌入表示转换,其中,维度转换的过程,是把对话轮次信息、角色信息、文本信息都输入BERT模型之前将这三种信息对话轮次信息、角色信息、文本信息都转化为词(也就是标记token)的过程,把转化后的对话轮次信息、转化后的角色信息、转化后的文本信息都输入BERT模型得到每个token的嵌入表示,每个token的嵌入表示的维数是一样的;更具体的,轮次信息用[next]表示,角色信息是用[speaker1][speaker2]两个token分别表示,文本信息就是正常的中文文本标记。
嵌入表示学习的方法为将语义表示映射至低维的连续空间内的转换方法,嵌入表示为映射后的能够表示语义的向量。
S103、基于所述对话角色信息获取对话角色的属性信息,并将所述属性信息输入神经网络,得到第二数据,所述属性信息为结构化信息;
示例性的,基于所述对话角色信息获取对话角色的属性信息(结构化信息),在医疗领域,属性信息例如科室、医生ID、患者的年龄、性别、诊断等信息,结构化信息是指信息经过分析后可分解成多个互相关联的组成部分,各组成部分间有明确的层次结构的信息,将结构化信息输入神经网络,提取到结构化信息中的特征,将特征作为第二数据。
S104、将所述第一数据和所述第二数据进行合并,得到第三数据,并将所述第三数据和待排序的候补话术集输入预设语言模型,以计算所述待推荐文本与所述候补话术集中每个候补话术的相似度;
示例性的,所述第一数据通过为不同的自然语言处理任务提供支持的语言模型(BERT模型)得到,将所述第一数据和所述第二数据进行合并的步骤为将神经网络输出的结构化信息(第二数据)表示与BERT模型输出的对话文本表示(第一数据)进行合并。
S105、根据所述相似度的由大到小顺序对候补话术集中的所有候补话术进行排序,得到目标候补话术集,并根据所述目标候补话术集完成话术推荐。
示例性的,对候补话术集中的所有候补话术进行排序,按序完成话术推荐。
本发明实施例利用了问诊中的结构化信息,例如,科室、医生ID、患者的年龄、性别、诊断等结构化信息,将结构化信息作为特征输入,为本次话术推荐提供更个性化的话术排序。全面考虑上下文和多轮对话中的信息,即,前文内容、说话者角色、说话轮次,能够提供高度个性化和定制化的话术推荐。
在一种可能的实施方式中,所述获取与所述待推荐文本对应的对话信息,所述对话信息包括对话角色信息、对话轮次信息和对话内容信息的步骤,包括:
获取与所述待推荐文本对应的对话请求信息,所述对话请求信息包括发送所述对话请求信息的第一账号信息和所述对话请求信息针对的第二账号信息;
基于所述第一账号信息和所述第二账号信息确定与所述第一账号信息对应的第一角色和与所述第二账号信息对应的第二角色,得到所述对话角色信息;
按所述对话角色信息记录所述第二账号信息响应所述对话请求信息后的对话内容,得到对话内容信息,并根据所述对话内容信息确定对话轮次信息;
根据所述对话角色信息、所述对话轮次信息和所述对话内容信息生成对话信息。
示例性的,在线上问诊的场景中,发起与所述待推荐文本对应的对话请求信息的账号往往为患者的个人账号,而所述对话请求信息针对的为医生的工作账号,所述对话请求信息包括发送所述对话请求信息的第一账号(个人账号)信息和所述对话请求信息针对的第二账号(工作账号)信息,进而根据实际场景,确定与所述第一账号信息对应的第一角色和与所述第二账号信息对应的第二角色,得到所述对话角色信息。
示例性的,响应所述对话请求信息可以理解为,患者申请对话,即,发起好友添加请求,医生响应所述对话请求信息,即,通过患者添加好友的请求,而医生通过患者添加好友的请求后,医生与患者则可以进行对话,进而按所述对话角色信息记录所述第二账号信息响应所述对话请求信息后的对话内容,得到对话内容信息,获取患者的文本和医生的文本。
示例性的,在根据所述对话内容信息确定对话轮次信息时,可以以患者的文本为基础,即,患者发出文本,视为一次对话轮次的开始,患者再次发出文本,视为当前对话轮次的结束。
通过记录所述第二账号信息响应所述对话请求信息后的对话内容,保证对话内容为患者与医生产生的,避免其他人员发送给医生的文本被记录,即,避免记录与话术推荐无关的文本,减少资源占用,也减少无关文本对话术推荐过程的影响。
在一种可能的实施方式中,所述获取待推荐文本的步骤,包括:
获取目标设备上已完成输入但未发送的输入数据,识别所述输入数据中的最后一个字符,并判断所述输入数据中的最后一个字符是否为预设目标字符;
若所述输入数据中的最后一个字符为预设目标字符,则将所述输入数据作为所述待推荐文本;
若所述输入数据中的最后一个字符不为预设目标字符,则继续所述获取目标设备上已完成输入但未发送的输入数据的步骤。
示例性的,获取医生工作用的电脑上已完成输入但未发送的输入数据,例如半个句子,为“当前情况,”,则识别所述输入数据中的最后一个字符,并判断所述输入数据中的最后一个字符是否为预设目标字符,本发明实施例所述方案用于根据医生输入的前半句文本,为医生推荐后半句文本,以组成完整句子,因此,预设目标字符设置为“,”,而“当前情况,”中的最后一个字符为“,”,将“当前情况,”作为所述待推荐文本。
为保证话术推荐的准确性与合理性,需要获取更多的限定条件以限定话术推荐的范围,而将整句话中的前半句作为限定条件,能够更准确地选择待推荐话术,与不存在限定条件相比,大大减少了待推荐话术的范围。
在一种可能的实施方式中,所述将所述对话信息进行同纬度嵌入表示,得到第一数据的步骤,包括:
分别将所述对话角色信息、所述对话轮次信息和所述对话内容信息进行同纬度嵌入表示,得到与所述对话角色信息对应的第一嵌入表示、与所述对话轮次信息对应的第二嵌入表示和与所述对话内容信息对应的第三嵌入表示;
对所述第一嵌入表示、所述第二嵌入表示和所述第三嵌入表示按权重进行融合,得到第一数据。
示例性的,将所述对话角色信息、所述对话轮次信息和所述对话内容信息输入BERT模型,BERT模型完成对所述对话角色信息、所述对话轮次信息和所述对话内容信息转化,对所述第一嵌入表示、所述第二嵌入表示和所述第三嵌入表示按权重进行融合时,根据不同场景下所述对话角色信息、所述对话轮次信息和所述对话内容信息对话术推荐的影响程度设置权重,例如,在线上诊断场景下,对话角色信息对话术推荐的影响程度高于所述对话轮次信息对话术推荐的影响程度,但低于所述对话内容信息对话术推荐的影响程度,因此,对话角色信息的权重高于所述对话轮次信息的权重,但低于所述对话内容信息的权重。
通过设置不同权重使得融合得到的第一数据更合理,更科学。
在一种可能的实施方式中,所述将所述第一数据和所述第二数据进行合并,得到第三数据的步骤,包括:
通过在所述对话内容信息的文本数据之前设置标记的方式将所述第二数据嵌入到所述对话内容信息的文本数据中,以实现所述第一数据和所述第二数据的合并,得到第三数据。
示例性的,使用在文本之前增加标记的方法将结构化的信息嵌入到文本中,对每个科室、每个医生ID、每个性别、每个疾病,以及年龄,将所述第二数据嵌入到所述对话内容信息的文本数据中:
E=concatenate(edep,edoc,egen,edis,eage,es1,es2,…,esn)
其中eX代表标记X的嵌入表示,X为科室(dep)、医生ID(doc)、性别(gen)、疾病(dis)、年龄(age),esi,i=1,2,…,n代表文本部分每个词的嵌入表示,E代表第三数据,concatenate()为连接函数。
在一种可能的实施方式中,在所述将所述第三数据和待排序的候补话术集输入预设语言模型的步骤之前,还包括:
获取与所述待推荐文本对应的历史对话数据和针对所述历史对话数据的标注信息;
基于所述标注信息在所述历史对话数据中选择与所述待推荐文本不匹配的第一话术和与所述待推荐文本匹配的第二话术;
基于所述第一话术与所述待推荐文本构建负样本,基于所述第二话术与所述待推荐文本构建正样本;
将所述负样本、所述正样本和所述第三数据以三元组的形式输入初始模型,得到所述预设语言模型,所述初始模型为能够为不同的自然语言处理任务提供支持的语言模型。
示例性的,正样本是指与医生输入的前半句话相关联的正确的后半句话,而负样本是指与医生输入的前半句话不相关或不正确的后半句话。利用已有的对话历史和标注数据,匹配医生输入的前半句话与正确的后半句话,形成正样本对。同时,通过对话历史和其他候选话术进行随机组合,构建负样本对。通过BERT模型对正负样本进行嵌入表示为正样本epos,负样本eneg后,计算正负样本的余弦相似度作为相似性度量指标:
Lsim=cos_similarity(epos,eneg)
其中,cos_similarity()为余弦相似度计算函数。
然后,将对比三元组损失函数与余弦相似度相加的函数作为损失函数对初始模型进行优化,得到所述预设语言模型,使正样本对的相似性高于负样本对的相似性。具体而言,损失函数为:
Ltri=max(0,sigmoid(f(epos)-sigmoid(f(eneg)+margin)
L=Ltri+Lsim
Lsim为余弦相似度,Ltri()为三元组损失函数,margin为第三数据,sigmoid()为S型生长曲线,max()为最大值函数,用于保证对比三元组损失函数的值大于或等于0。
示例性的,对比学习是在训练的过程中采用的一种训练手段,常规的训练是一条数据中只有输入(第三数据)和标签(一条候补话术,如果有多条待排序的候补话术集合,会构造成多条数据),每条数据主要学习候选话术和前文对话的关系,而对比学习训练时候需要输入三元组,分别是输入(第三数据),正标签(真正的话术),负标签(和真正的样本语义有明显区别的话术),每条数据除了学习候选话术和全文的关系外,还要学习正标签和负标签的关系,保证正标签的得分高于负标签。
在一种可能的实施方式中,所述根据所述目标候补话术集完成话术推荐的步骤,包括:
对所述目标候补话术集中预设数目的相似度最大的候补话术进行推送;
获取用户反馈信息,所述反馈信息为针对预设数目的相似度最大的候补话术的确认信息或者针对预设数目的相似度最大的候补话术的否认信息;
若所述反馈信息为针对预设数目的相似度最大的候补话术的否认信息,则将已推送的预设数目的候补话术在所述目标候补话术集中剔除,得到备选候补话术集,在所述备选候补话术集中选择所述预设数目的相似度最大的备选候补话术进行推送,直至获取的用户反馈信息为针对预设数目的备选候补话术的确认信息。
示例性的,由于不同场景下,不同时间阶段,同一待待推荐文本对应的最优话术也可能不同,因此在将由推荐的话术组成的句子发送出去前,或者,根据推荐的话术组成句子前,由医生等服务提供者对推荐的话术进行验证,即,选择最符合实际场景的话术,保证线上对话的质量。
在一种可能的实施方式中,如图3所示,本申请提供了一种基于人工智能的话术推荐装置,所述装置包括:
数据采集模块201,用于获取待推荐文本,并获取与所述待推荐文本对应的对话信息,所述对话信息包括对话角色信息、对话轮次信息和对话内容信息;
嵌入模块202,用于将所述对话信息进行同纬度嵌入表示,得到第一数据;
转换模块203,用于基于所述对话角色信息获取对话角色的属性信息,并将所述属性信息输入神经网络,得到第二数据,所述属性信息为结构化信息;
合并模块204,用于将所述第一数据和所述第二数据进行合并,得到第三数据,并将所述第三数据和待排序的候补话术集输入预设语言模型,以计算所述待推荐文本与所述候补话术集中每个候补话术的相似度;
推荐模块205,用于根据所述相似度的由大到小顺序对候补话术集中的所有候补话术进行排序,得到目标候补话术集,并根据所述目标候补话术集完成话术推荐。
在一种可能的实施方式中,数据采集模块201,用于:
获取与所述待推荐文本对应的对话请求信息,所述对话请求信息包括发送所述对话请求信息的第一账号信息和所述对话请求信息针对的第二账号信息;
基于所述第一账号信息和所述第二账号信息确定与所述第一账号信息对应的第一角色和与所述第二账号信息对应的第二角色,得到所述对话角色信息;
按所述对话角色信息记录所述第二账号信息响应所述对话请求信息后的对话内容,得到对话内容信息,并根据所述对话内容信息确定对话轮次信息;
根据所述对话角色信息、所述对话轮次信息和所述对话内容信息生成对话信息。
在一种可能的实施方式中,数据采集模块201,用于:
获取目标设备上已完成输入但未发送的输入数据,识别所述输入数据中的最后一个字符,并判断所述输入数据中的最后一个字符是否为预设目标字符;
若所述输入数据中的最后一个字符为预设目标字符,则将所述输入数据作为所述待推荐文本;
若所述输入数据中的最后一个字符不为预设目标字符,则继续所述获取目标设备上已完成输入但未发送的输入数据的步骤。
在一种可能的实施方式中,嵌入模块202,用于:
分别将所述对话角色信息、所述对话轮次信息和所述对话内容信息进行同纬度嵌入表示,得到与所述对话角色信息对应的第一嵌入表示、与所述对话轮次信息对应的第二嵌入表示和与所述对话内容信息对应的第三嵌入表示;
对所述第一嵌入表示、所述第二嵌入表示和所述第三嵌入表示按权重进行融合,得到第一数据。
在一种可能的实施方式中,合并模块204,用于:
通过在所述对话内容信息的文本数据之前设置标记的方式将所述第二数据嵌入到所述对话内容信息的文本数据中,以实现所述第一数据和所述第二数据的合并,得到第三数据。
在一种可能的实施方式中,合并模块204,用于:
获取与所述待推荐文本对应的历史对话数据和针对所述历史对话数据的标注信息;
基于所述标注信息在所述历史对话数据中选择与所述待推荐文本不匹配的第一话术和与所述待推荐文本匹配的第二话术;
基于所述第一话术与所述待推荐文本构建负样本,基于所述第二话术与所述待推荐文本构建正样本;
将所述负样本、所述正样本和所述第三数据以三元组的形式输入初始模型,得到所述预设语言模型,所述初始模型为能够为不同的自然语言处理任务提供支持的语言模型。
在一种可能的实施方式中,合并模块204,用于:
对所述目标候补话术集中预设数目的相似度最大的候补话术进行推送;
获取用户反馈信息,所述反馈信息为针对预设数目的相似度最大的候补话术的确认信息或者针对预设数目的相似度最大的候补话术的否认信息;
若所述反馈信息为针对预设数目的相似度最大的候补话术的否认信息,则将已推送的预设数目的候补话术在所述目标候补话术集中剔除,得到备选候补话术集,在所述备选候补话术集中选择所述预设数目的相似度最大的备选候补话术进行推送,直至获取的用户反馈信息为针对预设数目的备选候补话术的确认信息。
本发明提供了一种话术推荐装置,利用了问诊中的结构化信息,例如,科室、医生ID、患者的年龄、性别、诊断等结构化信息,将结构化信息作为特征输入,为本次话术推荐提供更个性化的话术排序。全面考虑上下文和多轮对话中的信息,即,前文内容、说话者角色、说话轮次,能够提供高度个性化和定制化的话术推荐。
关于话术推荐装置的具体限定可以参见上文中对于话术推荐方法的限定,在此不再赘述。上述话术推荐装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务端,其内部结构图可以如图4所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性和/或易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的客户端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于人工智能的话术推荐方法服务端侧的功能或步骤。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是客户端,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部服务器通过网络连接通信。该计算机程序被处理器执行时以实现一种基于人工智能的话术推荐方法客户端侧的功能或步骤。
在一种可能的实施方式中,如图6所示,本申请实施例提供了一种电子设备300,包括:包括存储器310、处理器320及存储在存储器310上并可在处理器320上运行的计算机程序311,处理器320执行计算机程序311时,实现:获取待推荐文本,并获取与所述待推荐文本对应的对话信息,所述对话信息包括对话角色信息、对话轮次信息和对话内容信息;将所述对话信息进行同纬度嵌入表示,得到第一数据;基于所述对话角色信息获取对话角色的属性信息,并将所述属性信息输入神经网络,得到第二数据,所述属性信息为结构化信息;将所述第一数据和所述第二数据进行合并,得到第三数据,并将所述第三数据和待排序的候补话术集输入预设语言模型,以计算所述待推荐文本与所述候补话术集中每个候补话术的相似度;根据所述相似度的由大到小顺序对候补话术集中的所有候补话术进行排序,得到目标候补话术集,并根据所述目标候补话术集完成话术推荐。
利用了问诊中的结构化信息,例如,科室、医生ID、患者的年龄、性别、诊断等结构化信息,将结构化信息作为特征输入,为本次话术推荐提供更个性化的话术排序。全面考虑上下文和多轮对话中的信息,即,前文内容、说话者角色、说话轮次,能够提供高度个性化和定制化的话术推荐。
在一种可能的实施方式中,如图7所示,本申请实施例提供了一种计算机可读存储介质400,其上存储有计算机程序411,该计算机程序411被处理器执行时实现:获取待推荐文本,并获取与所述待推荐文本对应的对话信息,所述对话信息包括对话角色信息、对话轮次信息和对话内容信息;将所述对话信息进行同纬度嵌入表示,得到第一数据;基于所述对话角色信息获取对话角色的属性信息,并将所述属性信息输入神经网络,得到第二数据,所述属性信息为结构化信息;将所述第一数据和所述第二数据进行合并,得到第三数据,并将所述第三数据和待排序的候补话术集输入预设语言模型,以计算所述待推荐文本与所述候补话术集中每个候补话术的相似度;根据所述相似度的由大到小顺序对候补话术集中的所有候补话术进行排序,得到目标候补话术集,并根据所述目标候补话术集完成话术推荐。
利用了问诊中的结构化信息,例如,科室、医生ID、患者的年龄、性别、诊断等结构化信息,将结构化信息作为特征输入,为本次话术推荐提供更个性化的话术排序。全面考虑上下文和多轮对话中的信息,即,前文内容、说话者角色、说话轮次,能够提供高度个性化和定制化的话术推荐。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于:电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言,诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
本领域普通技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个计算装置上,或者分布在多个计算装置所组成的网络上,可选地,他们可以用计算机装置可执行的程序代码来实现,从而可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件的结合。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里上述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (10)

1.一种基于人工智能的话术推荐方法,其特征在于,包括:
获取待推荐文本,并获取与所述待推荐文本对应的对话信息,所述对话信息包括对话角色信息、对话轮次信息和对话内容信息;
将所述对话信息进行同纬度嵌入表示,得到第一数据;
基于所述对话角色信息获取对话角色的属性信息,并将所述属性信息输入神经网络,得到第二数据,所述属性信息为结构化信息;
将所述第一数据和所述第二数据进行合并,得到第三数据,并将所述第三数据和待排序的候补话术集输入预设语言模型,以计算所述待推荐文本与所述候补话术集中每个候补话术的相似度;
根据所述相似度的由大到小顺序对候补话术集中的所有候补话术进行排序,得到目标候补话术集,并根据所述目标候补话术集完成话术推荐。
2.如权利要求1所述的基于人工智能的话术推荐方法,其特征在于,所述获取与所述待推荐文本对应的对话信息,所述对话信息包括对话角色信息、对话轮次信息和对话内容信息的步骤,包括:
获取与所述待推荐文本对应的对话请求信息,所述对话请求信息包括发送所述对话请求信息的第一账号信息和所述对话请求信息针对的第二账号信息;
基于所述第一账号信息和所述第二账号信息确定与所述第一账号信息对应的第一角色和与所述第二账号信息对应的第二角色,得到所述对话角色信息;
按所述对话角色信息记录所述第二账号信息响应所述对话请求信息后的对话内容,得到对话内容信息,并根据所述对话内容信息确定对话轮次信息;
根据所述对话角色信息、所述对话轮次信息和所述对话内容信息生成对话信息。
3.如权利要求2所述的基于人工智能的话术推荐方法,其特征在于,所述获取待推荐文本的步骤,包括:
获取目标设备上已完成输入但未发送的输入数据,识别所述输入数据中的最后一个字符,并判断所述输入数据中的最后一个字符是否为预设目标字符;
若所述输入数据中的最后一个字符为预设目标字符,则将所述输入数据作为所述待推荐文本;
若所述输入数据中的最后一个字符不为预设目标字符,则继续所述获取目标设备上已完成输入但未发送的输入数据的步骤。
4.如权利要求1所述的基于人工智能的话术推荐方法,其特征在于,所述将所述对话信息进行同纬度嵌入表示,得到第一数据的步骤,包括:
分别将所述对话角色信息、所述对话轮次信息和所述对话内容信息进行同纬度嵌入表示,得到与所述对话角色信息对应的第一嵌入表示、与所述对话轮次信息对应的第二嵌入表示和与所述对话内容信息对应的第三嵌入表示;
对所述第一嵌入表示、所述第二嵌入表示和所述第三嵌入表示按权重进行融合,得到第一数据。
5.如权利要求1所述的基于人工智能的话术推荐方法,其特征在于,所述将所述第一数据和所述第二数据进行合并,得到第三数据的步骤,包括:
通过在所述对话内容信息的文本数据之前设置标记的方式将所述第二数据嵌入到所述对话内容信息的文本数据中,以实现所述第一数据和所述第二数据的合并,得到第三数据。
6.如权利要求1所述的基于人工智能的话术推荐方法,其特征在于,在所述将所述第三数据和待排序的候补话术集输入预设语言模型的步骤之前,还包括:
获取与所述待推荐文本对应的历史对话数据和针对所述历史对话数据的标注信息;
基于所述标注信息在所述历史对话数据中选择与所述待推荐文本不匹配的第一话术和与所述待推荐文本匹配的第二话术;
基于所述第一话术与所述待推荐文本构建负样本,基于所述第二话术与所述待推荐文本构建正样本;
将所述负样本、所述正样本和所述第三数据以三元组的形式输入初始模型,得到所述预设语言模型,所述初始模型为能够为不同的自然语言处理任务提供支持的语言模型。
7.如权利要求1所述的基于人工智能的话术推荐方法,其特征在于,所述根据所述目标候补话术集完成话术推荐的步骤,包括:
对所述目标候补话术集中预设数目的相似度最大的候补话术进行推送;
获取用户反馈信息,所述反馈信息为针对预设数目的相似度最大的候补话术的确认信息或者针对预设数目的相似度最大的候补话术的否认信息;
若所述反馈信息为针对预设数目的相似度最大的候补话术的否认信息,则将已推送的预设数目的候补话术在所述目标候补话术集中剔除,得到备选候补话术集,在所述备选候补话术集中选择所述预设数目的相似度最大的备选候补话术进行推送,直至获取的用户反馈信息为针对预设数目的备选候补话术的确认信息。
8.一种基于人工智能的话术推荐装置,其特征在于,所述装置包括:
数据采集模块,用于获取待推荐文本,并获取与所述待推荐文本对应的对话信息,所述对话信息包括对话角色信息、对话轮次信息和对话内容信息;
嵌入模块,用于将所述对话信息进行同纬度嵌入表示,得到第一数据;
转换模块,用于基于所述对话角色信息获取对话角色的属性信息,并将所述属性信息输入神经网络,得到第二数据,所述属性信息为结构化信息;
合并模块,用于将所述第一数据和所述第二数据进行合并,得到第三数据,并将所述第三数据和待排序的候补话术集输入预设语言模型,以计算所述待推荐文本与所述候补话术集中每个候补话术的相似度;
推荐模块,用于根据所述相似度的由大到小顺序对候补话术集中的所有候补话术进行排序,得到目标候补话术集,并根据所述目标候补话术集完成话术推荐。
9.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过所述总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至7中任一项所述的基于人工智能的话术推荐方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至7中任一项所述的基于人工智能的话术推荐方法的步骤。
CN202310799197.9A 2023-06-30 2023-06-30 基于人工智能的话术推荐方法、装置、设备及介质 Pending CN116860932A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310799197.9A CN116860932A (zh) 2023-06-30 2023-06-30 基于人工智能的话术推荐方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310799197.9A CN116860932A (zh) 2023-06-30 2023-06-30 基于人工智能的话术推荐方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN116860932A true CN116860932A (zh) 2023-10-10

Family

ID=88220978

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310799197.9A Pending CN116860932A (zh) 2023-06-30 2023-06-30 基于人工智能的话术推荐方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN116860932A (zh)

Similar Documents

Publication Publication Date Title
CN112131366B (zh) 训练文本分类模型及文本分类的方法、装置及存储介质
CN112069302B (zh) 会话意图识别模型的训练方法、会话意图识别方法及装置
CN112084789B (zh) 文本处理方法、装置、设备及存储介质
US20220138432A1 (en) Relying on discourse analysis to answer complex questions by neural machine reading comprehension
US10431338B2 (en) System and method for weighting manageable patient attributes during criteria evaluations for treatment
US20200279147A1 (en) Method and apparatus for intelligently recommending object
US20180314955A1 (en) Utilizing artificial intelligence for data extraction
WO2020073533A1 (zh) 自动问答方法及装置
US11645561B2 (en) Question answering system influenced by user behavior and text metadata generation
WO2023178971A1 (zh) 就医的互联网挂号方法、装置、设备及存储介质
WO2022227203A1 (zh) 基于对话表征的分诊方法、装置、设备及存储介质
CN110266900A (zh) 客户意图的识别方法、装置及客服系统
CN116894498A (zh) 网络模型的训练方法、策略识别方法、装置以及设备
CN113160914A (zh) 在线问诊方法、装置、电子设备及存储介质
US11967416B2 (en) Image analysis and insight generation
CN116992879A (zh) 基于人工智能的实体识别方法、装置、设备及介质
CN116956934A (zh) 任务处理方法、装置、设备及存储介质
CN116561271A (zh) 问答处理方法及装置
CN115905497A (zh) 确定答复语句的方法、装置、电子设备和存储介质
CN116860932A (zh) 基于人工智能的话术推荐方法、装置、设备及介质
Qin Research on the application of intelligent speech recognition technology in medical big data fog computing system
CN115393849A (zh) 一种数据处理方法、装置、电子设备及存储介质
CN111414609B (zh) 一种对象验证方法和装置
CN114090789A (zh) 基于知识图谱的中医养生智能多轮交互系统
CN113836273A (zh) 基于复杂语境的法律咨询方法及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination