CN117407501A - 对话数据生成方法、模型训练方法及相关装置 - Google Patents

对话数据生成方法、模型训练方法及相关装置 Download PDF

Info

Publication number
CN117407501A
CN117407501A CN202311378502.3A CN202311378502A CN117407501A CN 117407501 A CN117407501 A CN 117407501A CN 202311378502 A CN202311378502 A CN 202311378502A CN 117407501 A CN117407501 A CN 117407501A
Authority
CN
China
Prior art keywords
dialogue
task
attribute information
data
label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311378502.3A
Other languages
English (en)
Inventor
丁亮
沙晶
盛志超
王士进
刘聪
胡国平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
iFlytek Co Ltd
Original Assignee
iFlytek Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by iFlytek Co Ltd filed Critical iFlytek Co Ltd
Priority to CN202311378502.3A priority Critical patent/CN117407501A/zh
Publication of CN117407501A publication Critical patent/CN117407501A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • G06N3/0455Auto-encoder networks; Encoder-decoder networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/041Abduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供了一种对话数据生成方法、模型训练方法及相关装置,该方法包括:获取对话属性信息,所述对话属性信息至少包括对话角色、对话场景、对话流程阶段和对话目标;根据所述对话属性信息,生成任务指令;将所述任务指令输入预训练的大语言模型,以使所述大语言模型按照所述任务指令生成对话数据。根据本申请的技术方案,不仅能够实现对话数据自动生成,提高对话数据生成效率,满足对对话数据的数据量需求,还可以保证生成的对话数据的质量,且能够适应多领域、多场景的对话数据生成,灵活性高。

Description

对话数据生成方法、模型训练方法及相关装置
技术领域
本申请涉及人工智能技术领域,尤其涉及一种对话数据生成方法、模型训练方法及相关装置。
背景技术
对话数据生成是人工智能在人机交互场景下的一种常见任务。对于人机交互模型或人机交互机器人来说,其需要非常大量的对话数据进行对话训练,才能具备完善的对话能力,从而应对各种可能的对话场景。因此对于人机交互模型或人机交互机器人来说,大量的对话数据必不可少的。
而随着人们对人机交互模型或人机交互机器人性能的不断追求,从真实生活场景获取的对话数据量已经不能满足训练需求,而且在一些非公开领域,比如在心理咨询领域,对话数据具有一定的保密性,通常无法获取。因此,急需一种能够更快、更多地获取对话数据的技术方案。
发明内容
有鉴于此,本申请实施例致力于提供一种对话数据生成方法、模型训练方法及相关装置,能够实现对话数据自动生成,不仅提高了对话数据生成效率,满足对对话数据的数据量需求,还可以保证生成的对话数据的质量,且能够适应多领域、多场景的对话数据生成,灵活性高。
根据本申请实施例的第一方面,提供了一种对话数据生成方法,包括:
获取对话属性信息,所述对话属性信息至少包括对话角色、对话场景、对话流程阶段和对话目标,所述对话流程阶段包括实现所述对话目标所需经历的各个对话阶段;
根据所述对话属性信息,生成任务指令,所述任务指令用于指示接收该任务指令的对象生成符合所述对话属性信息的对话数据;
将所述任务指令输入预训练的大语言模型,以使所述大语言模型按照所述任务指令生成对话数据。
可选的,所述对话属性信息还包括各个对话流程阶段应用的沟通技巧,所述沟通技巧包括开放式提问、封闭式提问、情感反应、倾听、共情、指导中的至少一项。
可选的,所述对话属性信息还包括对话要求信息,所述对话要求信息包括对话语气要求、对话态度要求、隐私保护要求、对话长度要求中的至少一项。
可选的,所述根据所述对话属性信息,生成任务指令,包括:
根据所述对话属性信息,确定对话数据生成任务,所述对话数据生成任务包括生成符合所述对话属性信息的对话文本的任务;
至少根据所述对话数据生成任务,生成至少包含所述对话数据生成任务的任务指令。
可选的,在根据所述对话属性信息,生成任务指令的过程中,还包括:
根据所述对话属性信息,确定标签输出任务,所述标签输出任务包括按照设定格式在对话数据的设定位置输出设定标签的信息的任务,所述设定标签包括对话流程阶段标签、沟通技巧标签、沟通话题标签、用户画像标签中的至少一项;
至少根据所述对话数据生成任务,生成至少包含所述对话数据生成任务的任务指令,包括:
根据所述对话数据生成任务和所述标签输出任务,生成包含所述对话数据生成任务和所述标签输出任务的任务指令。
可选的,所述对话场景包括心理咨询对话场景;
所述对话流程阶段,包括进入与定向阶段、问题和个人探索阶段、目标与方案探讨阶段、行动转变阶段、评估与结束阶段。
可选的,所述根据所述对话属性信息,生成任务指令,包括:
根据所述对话属性信息,确定对话数据生成任务和标签输出任务;
其中,所述对话数据生成任务包括生成符合所述对话属性信息的对话文本的任务;所述标签输出任务包括第一标签输出任务和第二标签输出任务中的至少一项,所述第一标签输出任务用于在每一对话流程阶段的起始位置输出对话流程阶段标签,所述第二标签输出任务用于按照设定格式在对话数据的设定位置输出设定标签,所述设定标签包括沟通技巧标签、沟通话题标签、用户画像标签中的至少一项;
至少根据所述对话数据生成任务和所述标签输出任务,生成至少包含所述对话数据生成任务和所述标签输出任务的任务指令。
可选的,所述对话角色包括用户角色和心理咨询师角色;
在所述标签输出任务包括所述第二标签输出任务的情况下,所述第二标签输出任务用于按照设定格式、在输出所述心理咨询师的对话文本之前,输出设定标签。
可选的,所述至少根据所述对话数据生成任务和所述标签输出任务,生成至少包含所述对话数据生成任务和所述标签输出任务的任务指令,包括:
生成与所述对话数据生成任务和所述标签输出任务中的至少一项对应的任务执行示例;
生成包括所述对话数据生成任务、所述标签输出任务以及所述任务执行示例的任务指令。
根据本申请实施例的第二方面,提供了一种模型训练方法,包括;
获取对话数据,并利用所述对话数据构建对话训练样本数据,其中,所述对话数据通过如本申请实施例的第一方面中任意一项所述的对话数据生成方法而生成;
利用所述对话训练样本数据,对预先构建的对话模型进行对话训练;所述对话模型用于根据用户对话内容,生成用于响应所述用户对话内容的对话数据。
根据本申请实施例的第三方面,提供了一种对话数据生成方法,包括:
获取用户对话内容;
将所述用户对话内容输入预先训练的对话模型,得到与所述用户对话内容对应的对话数据;
其中,所述对话模型基于对话训练样本数据进行对话训练得到,所述对话训练样本数据通过如本申请实施例的第一方面中任意一项所述的对话数据生成方法生成的对话数据而构建得到。
根据本申请实施例的第四方面,提供了一种对话数据生成装置,包括:
信息获取单元,用于获取对话属性信息,所述对话属性信息至少包括对话角色、对话场景、对话流程阶段和对话目标,所述对话流程阶段包括实现所述对话目标所经历的各个对话阶段;
指令生成单元,用于根据所述对话属性信息,生成任务指令,所述任务指令用于指示接收该任务指令的对象生成符合所述对话属性信息的对话数据;
数据生成单元,用于将所述任务指令输入预训练的大语言模型,以使所述大语言模型按照所述任务指令生成对话数据。
根据本申请实施例的第五方面,提供了一种电子设备,包括存储器和处理器;
所述存储器与所述处理器连接,用于存储程序;
所述处理器用于通过运行所述存储器中的程序,实现如本申请实施例的第一方面、第二方面、第三方面中任意一项所述的方法。
根据本申请实施例的第六方面,提供了所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时,实现如本申请实施例的第一方面、第二方面、第三方面中任意一项所述的方法。
本申请提出的对话数据生成方法能够基于需要的对话数据的对话属性信息,生成用于指示生成符合该对话属性信息的对话数据的任务指令,然后将该任务指令输入预训练的大语言模型,借助预训练大语言模型的自然语言处理能力来自动生成对话数据。该方法借助大语言模型实现了对话数据自动生成,因此提高了对话数据生成效率,能够满足对对话数据的数据量需求。
并且,本申请在任务指令中嵌入了对话角色、对话场景、对话流程阶段和对话目标等丰富的对话属性信息,然后触发大语言模型生成符合这些对话属性信息的对话数据,从而能够保证生成的对话数据的质量。
对于任意领域、任意场景的对话数据,均可以通过修改对话属性信息来触发大语言模型生成符合相应领域或相应场景的对话数据,其对话数据生成效率和灵活性更高。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例提供的第一种对话数据生成方法的流程示意图。
图2为本申请实施例提供的第二种对话数据生成方法的流程示意图。
图3为本申请实施例提供的一种模型训练方法的流程示意图。
图4为本申请实施例提供的第三种对话数据生成方法的流程示意图。
图5为本申请实施例提供的第一种对话数据生成装置的流程示意图。
图6为本申请实施例提供的一种模型训练装置的流程示意图。
图7为本申请实施例提供的第二种对话数据生成装置的流程示意图。
图8为本申请实施例提供的一种电子设备的流程示意图。
具体实施方式
本申请实施例技术方案适用于应用在各种需要生成对话数据的场景中,例如,心理咨询对话模拟场景、客户服务对话模拟场景、营销对话模拟场景等。采用本申请实施例提供的技术方案,能够提高对话数据生成效率,满足对对话数据的数据量需求。
本申请实施例提供的技术方案可示例性地应用于处理器、电子设备、服务器(包括云服务器)等硬件设备,或包装成软件程序被运行,当硬件设备执行本申请实施例技术方案的处理过程,或上述软件程序被运行时,可以实现目标任务的自动拆分和自动调用任务所需的应用程序接口,完成目标任务的目的。本申请实施例只对本申请技术方案的具体处理过程进行示例性介绍,并不对本申请技术方案的具体实现形式进行限定,任意的可以执行本申请技术方案处理过程的技术实现形式,都可以被本申请实施例所采用。
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在介绍本申请方案之前,首先对相关技术进行介绍:
对话数据生成是人工智能在人机交互场景下的一种常见任务。对于人机交互模型或人机交互机器人来说,其需要非常大量的对话数据进行对话训练,才能具备完善的对话能力,从而应对各种可能的对话场景。因此对于人机交互模型或人机交互机器人来说,大量的对话数据必不可少的。
而随着人们对人机交互模型或人机交互机器人性能的不断追求,从真实生活场景获取的对话数据量已经不能满足训练需求,而且在一些非公开领域,比如在心理咨询领域,对话数据具有一定的保密性,通常无法获取。因此,急需一种能够更快、更多地获取对话数据的技术方案。
现有技术中,通常通过人机对话的方式伪造对话数据,即通过用户扮演既定角色与大模型进行既定话题的对话来获取对话数据。通过人机对话的方式伪造对话数据虽然能够获取非公开领域的对话数据,且相较真实生活场景而言能够获取更多的对话数据量,但是由于进行对话模拟的用户大多缺乏模拟经验以及对话模拟所涉及领域的相关知识,所以实际人机伪造数据过程缓慢,且生成的对话数据的可用性不高。因此在实际应用中,通过人机对话的方式伪造对话数据的方法,不仅伪造过程缓慢,且对话数据质量不可控,对话数据可用性较低。实际经验表明一人一天最多完成8通对话,且对话数据可用率不足10%,这意味着该方法不但需要大量人力支撑,而且对话数据生成效果不佳,质量不可控。
有鉴于此,本申请实施例致力于提供一种对话数据生成方法、模型训练方法及相关装置,能够实现对话数据自动生成,不仅提高了对话数据生成效率,满足对对话数据的数据量需求,还可以保证生成的对话数据的质量,且能够适应多领域、多场景的对话数据生成,灵活性高,在以下实施例中逐一进行详细说明。
示例性方法
图1为本申请实施例提供的第一种对话数据生成方法的流程图。如图1所示,本实施例提供的对话数据生成方法包括步骤S101-S103:
S101、获取对话属性信息,所述对话属性信息至少包括对话角色、对话场景、对话流程阶段和对话目标,所述对话流程阶段包括实现所述对话目标所需经历的各个对话阶段。
对话属性信息可以理解为目标对话所具有的特定属性信息。
目标对话可以理解为希望大语言模型生成的对话。
对话属性信息可以帮助大语言模型理解目标对话的需求和性质,从而生成可用性更高的对话数据。
对话属性信息至少包括对话角色、对话场景、对话流程阶段和对话目标。
其中,对话角色可以理解为参与对话的人类对象或非人类对象在对话中扮演的角色,例如用户角色、心理咨询师角色、顾客角色、服务员角色、智能助理角色、系统角色等。
所述对话场景可以理解为对话发生时所处的环境和背景,描述了对话所处的具体情境,包括地点、时间、社会背景、事件等因素。例如,对话场景为在医院的诊室内,一位医生询问病人的病史和症状,然后给出诊断和治疗建议。例如,对话场景为在某发布会上,一位记者对一位企业家进行采访,询问他对当前经济形势的看法和对未来发展的规划。
所述对话目标可以理解为对话参与者希望通过对话所达到的目的,包括获取信息、解决问题、提供建议、达成协议等。例如,上述的“在某发布会上,一位记者对一位企业家进行采访,询问他对当前经济形势的看法和对未来发展的规划”对话场景下产生的对话,对话目标可以是获取被采访者的观点、经历和看法,传达信息并增进公众对特定问题的了解。
所述对话流程阶段可以理解为对话过程中,对话参与者需要遵循的一系列步骤和阶段。对话流程阶段包括实现对话目标所需要经历的各个对话阶段。例如,某一个对话的对话流程阶段包括:开场、问题陈述、建立目标、探讨解决方案、总结反馈。
可选的,获取对话属性信息包括:响应于用户输入对话属性信息的操作,获取对话属性信息,即用户直接输入对话属性信息。
可选的,获取对话属性信息包括:响应于用户的文本输入操作或语音输入操作或文本语音组合输入操作,对输入的文本或语音进行分析,根据用户输入的文本和/或语音,确定对话属性信息。其中,用户输入的文本和/或语音包括表征对话属性信息的内容。例如,在用户输入包括表征对话属性信息的内容的文本后,使用自然语言处理(NLP)技术对输入文本进行分析,确定对话属性信息。
可选的,获取对话属性信息包括:通过访问存储有对话属性信息的数据源,调用对话属性信息。其中,数据源可以是数据库、知识图谱或其他存储对话属性信息的存储空间。
S102、根据所述对话属性信息,生成任务指令,所述任务指令用于指示接收该任务指令的对象生成符合所述对话属性信息的对话数据。
任务指令可以是一句话、一个问题或者一系列指令的组合,本申请对任务指令的具体内容和格式不做限定。任务指令中包括能够表征对话属性信息的内容,能够用于指示接收该任务指令的对象生成符合对话属性信息的对话数据。
可选的,生成的任务指令符合预设的任务指令格式。任务指令格式用于规定任务指令的结构和表示方法,预先设置并存储在控制器或服务器侧,在需要时可直接调取使用。任务指令格式根据实际应用场景和需求确定,本申请对此不做限定。
可选的,为了接收任务执行的对象能够正确理解和执行该任务指令,任务指令应采用执行主体能够识别的任务指令格式。在接收任务指令的对象为预训练的大语言模型时,任务指令格式应为该大语言模型能够识别的任务指令格式。优选的,任务指令格式应与该大语言模型进行预训练的训练样本中任务指令的指令格式保持一致。
作为一种可选的实现方式,按照预设的任务指令格式,对每一个对话属性信息进行组合,得到任务指令。例如,任务指令为{"对话角色","对话场景","对话流程阶段","对话目标"},在获取到对话属性信息后,将获取到的对话属性信息按照任务指令格式要求的格式进行组合,得到任务指令。
作为一种可选的实现方式,根据对话属性信息之间的逻辑关系和约束,生成任务指令。可选的,在获取到对话属性信息后,首先分析对话属性信息之间的逻辑关系和约束,或者调用预设的逻辑关系和约束,然后根据对话属性信息之间的逻辑关系和约束,生成符合任务指令格式的任务指令。例如,任务指令为“请你扮演一位语气亲切、表达自然、善于共情的心理咨询师,严格遵循下述定义的心理咨询流程和原则,与用户进行咨询谈话及建立交流关系,确定咨询目标和咨询方案,帮助用户明确问题,尽可能达到陪伴用户和解决其心理问题的目标,请遵循以下心理咨询流程…”。
作为一种可选的实现方式,使用机器学习技术,利用模型的处理构思,将对话属性信息转化为可执行的任务指令。可选的,预先训练有任务指令生成模型,训练完成后的任务指令生成模型具有根据输入的对话属性信息生成任务指令并输出的能力。在获取到对话属性信息后,将获取到的对话属性信息输入预训练的任务指令生成模型,任务指令生成模型输出任务指令。
S103、将所述任务指令输入预训练的大语言模型,以使所述大语言模型按照所述任务指令生成对话数据。
大语言模型(Large language model,LLM)是指基于Transformer结构的生成式深度神经网络模型,具有强大的自然语言处理能力以及多轮对话能力。需要说明的是,可以采用任意类型的大语言模型,本申请对此不作限定。
作为一种可选的实现方式,所述预训练的大语言模型可以是现有技术中任意类型的大语言模型。
作为一种可选的实现方式,所述预训练的大语言模型可以是利用多组任务指令-对话数据组成的数据集作为训练样本,对现有技术中的任意一种大语言模型进行训练后得到的微调后的大语言模型。
所述预训练的大预言模型具有执行输入的任务指令,生成对话数据并输出对话数据的能力,即能够执行任务指令对应的对话数据生成任务,生成符合对话属性信息的对话数据并输出对话数据。
具体的,在生成任务指令之后,将生成的任务指令输入预训练的大语言模型,大语言模型执行该任务指令,即执行该任务指令对应的对话数据生成任务,大语言模型输出对话数据。
本申请提出的对话数据生成方法能够基于需要的对话数据的对话属性信息,生成用于指示生成符合该对话属性信息的对话数据的任务指令,然后将该任务指令输入预训练的大语言模型,借助预训练大语言模型的自然语言处理能力来自动生成对话数据。该方法借助大语言模型实现了对话数据自动生成,因此提高了对话数据生成效率,能够满足对对话数据的数据量需求。
并且,本申请在任务指令中嵌入了对话角色、对话场景、对话流程阶段和对话目标等丰富的对话属性信息,然后触发大语言模型生成符合这些对话属性信息的对话数据,从而能够保证生成的对话数据的质量。
对于任意领域、任意场景的对话数据,均可以通过修改对话属性信息来触发大语言模型生成符合相应领域或相应场景的对话数据,其对话数据生成效率和灵活性更高。
作为一种可选的实现方式,对话属性信息还可以包括各个对话流程阶段应用的沟通技巧,所述沟通技巧包括开放式提问、封闭式提问、情感反应、倾听、共情、指导中的至少一项。
沟通技巧可以理解为对话过程中,对话参与者在交流使用的方法和策略,使用合适的沟通技巧,可以促进有效的沟通和交流。
开放式提问,是一种提问方式,这种提问方式鼓励被提问者进行详细的回答,而不仅仅是简单的“是”或“否”回答,可以帮助提问者深入了解对方的观点和想法。开放式提问通常以“什么”“为什么”“如何”等词语开头,例如,“你对此有什么看法?”。
封闭式提问,是一种提问方式,对于该提问方式,被提问者通常回答为简短的“是”或“否”,或者仅提供简短的答案,适用于获取明确的信息或确认对方的观点。封闭式提问通常以“是否”“是不是”等词语开头,例如,“你是否喜欢这个产品?”“你喜欢上学吗?”“你现在有点紧张,对吗?”。
情感反应,可以理解为对话中表达和回应情感,涉及到对他人的情感作出积极的回应,以建立情感连接和增强沟通的亲密度。情感反应可以包括积极肯定、理解和共鸣、负面情绪回应等。
积极肯定,可以理解为当对方表达观点、分享经历或提出问题时,给予积极的肯定和赞赏。例如,“很好”“你做得很棒”或者提供具体的赞扬和认可。
理解和共鸣,可以理解为当对方表达感受和经历时,表达对对方感受和经历的理解和共鸣。通过表达共鸣,可以让对方感到被理解和支持。
负面情绪回应,可以理解为当对方表达负面情绪时,表达关心和理解,并提供支持和安慰,尊重对方的情感,并尽可能提供支持和帮助。
倾听,可以理解为专注地聆听对方说话,对于对方的讲述能够持续关注,投入其中并给予恰当的反应,展示出对其观点和感受的兴趣和尊重。积极的倾听可以促进有效的对话和相互理解,有助于建立信任关系,并让对方感到被尊重和被理解。
共情,可以理解为理解与掌握对方的经验和感受的基础上,给与对方适当的反馈,让对方感受到自己被了解和接纳。通过共情,可以更好地理解对方的观点和立场,以便更好地回应对方的需求和问题,并且有助于建立亲密关系和增进彼此之间的信任。例如,当对方正在为考试而担心时,可以说:“我明白你的压力和紧张感。考试确实是一项挑战,但你已经做好了准备,一定能够应对。”例如,如果咨询者表达他们对未来的担忧,心理咨询师可以用共情技术来反应,“听起来,你现在真的被未来的不确定性困扰了”。
可选的,表达共情的方式要自然且多样化,说话的风格要实现类人化,表达自然,口吻温和,态度中立,不可以说教、指责、嘲笑或者反问。
可选的,在心理咨询对话场景中,要体现不加评判的接纳与共情,但是不要过于频繁的共情,需要站在咨询者角度,在回复时经常生动地认可和安慰我或做情绪的总结。例如,“你很在乎父母的感受,真的很好;而且你是一个很合格的朋友,担心自己的负面情绪会打扰到他们。”。
指导,可以理解为在对话中为对方提供建议、意见。作为指导者,可以分享自己的知识、经验和见解,以帮助对方做出明智的决策和行动。这种技巧可以帮助对方解决问题、作出决策或达到目标。
作为一种可选的实现方式,对话属性信息还可以包括对话要求信息,所述对话要求信息包括对话语气要求、对话态度要求、隐私保护要求、对话长度要求中的至少一项。
其中,对话要求信息,可以理解为在对话中需要遵守的特定要求或限制。
对话语气要求,可以理解为在对话中需要遵循的特定语气或口吻。例如,对话可能要求使用友好和尊重的语气,避免使用冒犯性或攻击性的言辞。
对话态度要求,可以理解为在对话中需要采用的特定态度或情绪。例如,对话可能要求保持冷静和理性,避免过度情绪化或争吵。
隐私保护要求,可以理解为对话中需要尊重他人隐私和保密性的要求。例如,在对话中不透露个人敏感信息或私人事务、避免在公共场合讨论私密话题等。例如,在心理咨询对话场景中,要保证咨询者隐私的安全和关键信息的保密性,不能有咨询者姓名、电话号码、微信号、QQ号、邮箱等敏感信息的出现或询问;针对咨询者提及的隐私信息需要进行转换,如姓名“张三”转为“小张”,各种数字最后三位用“XXX”表示。
对话长度要求,可以理解为对话篇幅、对话时长或者每轮对话字数的限制。例如,每轮回复的内容不要超过50字,与建议相关的回复不超过100字等。
对话要求信息有助于指导对话参与者在沟通过程中的行为和表达方式。遵守对话要求可以帮助确保对话的有效性、尊重他人,并维护良好的沟通氛围。
作为一种可选的实现方式,“根据所述对话属性信息,生成任务指令”,包括步骤A1-A2:
A1、根据所述对话属性信息,确定对话数据生成任务。
对话数据可以理解为与对话相关的数据,因对话数据生成任务的执行对象为大语言模型,大语言模型生成的对话以文本形式表示,对话数据可以理解为对话文本。
对话数据生成任务可以理解成为实现对话目标而执行的一系列的对话数据生成操作的集合。而根据前述内容可知,对话属性信息可以理解为希望大语言模型生成的目标对话所具有的特定属性信息,提供了关于对话角色、对话情境、对话目标、对话流程阶段等信息,对这些信息进行分析,即可确定对话数据生成任务。因对话数据生成任务是根据对话属性信息确定的,那么对话数据生成任务应包括符合对话属性信息的对话数据的任务,即对话数据生成任务包括生成符合对话属性信息的对话文本的任务。
具体的,在获取到对话属性信息后,对获取到的对话属性信息进行分析,确定希望大语言模型生成对话文本的对话数据生成任务,且确定的对话数据生成任务包括希望大语言模型生成符合对话属性信息的对话文本的任务。
A2、至少根据所述对话数据生成任务,生成至少包含所述对话数据生成任务的任务指令。
根据前述内容可知,任务指令是一句话、一个问题或者一系列指令的组合,用于指示接收该任务指令的对象生成符合对话属性信息的对话数据,为了接收任务执行的对象能够正确理解和执行该任务指令,任务指令应采用执行主体能够识别的任务指令格式。
可选的,对对话数据生成任务中的关键信息进行提取,并将提取的信息按照预设的任务指令格式进行组合,生成至少包含对话数据生成任务的任务指令。如此设置,可以简化对话数据生成任务的描述和传递过程,减少误解和歧义。
作为一种可选的实现方式,在步骤A2前,“根据所述对话属性信息,生成任务指令”还包括步骤A3:
A3、根据所述对话属性信息,确定标签输出任务。
所述标签输出任务包括按照设定格式在对话数据的设定位置输出设定标签的信息的任务,所述设定标签包括对话流程阶段标签、沟通技巧标签、沟通话题标签、用户画像标签中的至少一项。
一个完整的对话过程包括至少一个对话阶段,在检测到对话数据中的对话阶段后,对对话中的每一个对话阶段进行标注,得到对话流程阶段标签。可选的,标注信息包括对话阶段名称等信息。
在对话过程中,对话参与者会选择性的使用沟通技巧,在检测到对话数据中存在沟通技巧后,对每一个沟通技巧进行标注,得到沟通技巧标签。可选的,标注信息包括沟通技巧名称、沟通技巧内容等信息。
一段对话应包括至少一个沟通话题,在确定对话数据所包含的沟通话题后,对每一个沟通话题进行标注,得到沟通话题标签。可选的,标注信息包括沟通话题名称。
用户画像可以理解为对话参与者的全面描述,例如对话参与者的外貌特征、性格特点、兴趣爱好、背景经历等信息。一段对话应包括至少两个对话参与者,对对话数据进行分析,可以确定每一个对话参与者的用户画像,对每一个参与者的用户画像进行标注,得到用户画像标签。可选的,标注信息包括根据对话数据能够确定的对话参与者的全部描述信息。
预先为每一种设定标签设置该在对话数据中的输出位置,形成输出位置规则,在对对话数据进行分析,确定对话数据需要标注的设定标签后,调用输出位置规则,即可确定每一个设定标签在对话数据中的输出位置,该输出位置即为对话数据的设定位置。例如,流程阶段标签对应的输出位置为每一个流程阶段开始前的位置。
预先为每一种设定标签设置输出格式,形成输出格式规则,在对对话数据进行分析,确定对话数据需要标注的设定标签后,调用输出格式规则,即可确定每一个设定标签对应的输出格式,该输出格式即为设定格式。可选的,可以利用JSON(JavaScript ObjectNotation)格式对输出格式进行规定。例如,{"用户画像":["","",...]}、{"沟通技巧":["","",...]}、{"用户画像":["基本信息-性别-男","基本信息-情感阶段-恋爱初期"]}、["开放式提问","具体化"]等,本申请对此不作限定。
示例性的,在心理咨询对话场景中,沟通技巧标签具体分为:{开放式提问;封闭式提问;情感反应;倾听;共情;指导}(此处沟通技巧实质化需要根据不同大语言模型的需求定制)。
示例性的,在心理咨询对话场景中,用户画像标签具体分为:{基本信息-性别-{男,女},基本信息-主要抚养人-{父母,祖父母,其他亲戚},环境特征-家庭-教养方式-{权威型,专制型,溺爱型,放任型},环境特征-家庭-家庭结构-{核心家庭(和父母生活),主干家庭(和祖父母、父母共同生活),重组家庭(和继父/继母生活),单亲家庭,离异家庭,隔代养育家庭,和其他亲戚生活},环境特征-家庭-家庭排行-{独生子女,老大,老二},环境特征-家庭-家庭职业(主要抚养人职业)-{医生/教师,研究员,普通企业员工,农民},环境特征-家庭-家庭经济情况-{一般,中等,宽裕},环境特征-学校-学习成绩-{优秀,良好,中等,较差},环境特征-学校-学校类型-{重点公立,普通公立,私立学校},心理特征-气质-{多血质:外向,情绪稳定,胆汁质:外向,情绪不稳定,粘液质:内向,情绪稳定,抑郁质:内向,情绪不稳定},心理特征-人格特质-{感觉寻求},心理特征-行为方式-人际交往方式-{主动,被动}…}(具体用户画像其他特征需要根据不同大语言模型需求定制)。
可选的,设定标签还可以包括问题类别标签。所述问题类别标签可以理解为对对话参与者面对的问题进行批注后所得到的标签。可选的,该问题类别可以是心理咨询场景中咨询者所面临的心理问题。
可选的,确定对话涉及的问题的方式可以是结合上下文及产生的用户画像标签在给定问题范围内对问题进行分类。
设置问题类别标签,可以帮助确立用户具体问题,协助后续的沟通技巧以及协助确定相关回复内容,如果大语言模型结合相应的知识图谱,那此处的问题类别标签将用于知识检索或者资源检索。
示例性的,在心理咨询对话场景中,问题类别标签可以包括:{学习焦虑;考试焦虑;社交焦虑;广泛性焦虑;错失恐惧:害怕错过他人动态;学业嫉妒;…}(具体问题类别需要根据不同心理大模型需求定制)。
在“根据所述对话属性信息,生成任务指令”还包括步骤A3的情况下,步骤A2“至少根据所述对话数据生成任务,生成至少包含所述对话数据生成任务的任务指令”包括:
根据所述对话数据生成任务和所述标签输出任务,生成包含所述对话数据生成任务和所述标签输出任务的任务指令。
可选的,分别对对话数据生成任务以及标签输出任务中的关键信息进行提取,并将提取的信息按照预设的任务指令格式进行组合,生成至少包含对话数据生成任务和标签输出任务的任务指令。该任务指令能够指示接收该任务指令的对象执行对话数据生成任务以及标签输出任务。
本实现方式能够生成包含所述对话数据生成任务和所述标签输出任务的任务指令,使得执行该任务指令的大语言模型能够按照设定格式在对话数据的设定位置输出设定标签的信息,在后续的数据分析或模型训练中,这些设定标签的信息可以提供有价值的信息,帮助更好地理解对话内容和特征。
接下来,将以对话场景为心理咨询对话场景为例对本申请实施例的对话数据生成方法进行示例性的介绍。
图2为本申请实施例提供的第二种对话数据生成方法,该方法适用于心理咨询对话场景。如图2所示,本实施例提供的对话数据生成方法包括步骤S201-S203:
S201、获取对话属性信息,所述对话属性信息至少包括对话角色、对话场景、对话流程阶段和对话目标,所述对话流程阶段包括实现所述对话目标所需经历的各个对话阶段。
在本实施例中,对话场景为心理咨询场景。示例性的,对话角色包括用户角色(咨询者)和心理咨询师(咨询师)角色。示例性的,对话目标为建立良好的咨询关系,收集信息和了解情况,确定咨询目标和咨询方案,尽可能达到陪伴用户和解决其心理问题的目标。
作为一种可选的实现方式,对话流程阶段包括进入与定向阶段、问题和个人探索阶段、目标与方案探讨阶段、行动转变阶段、评估与结束阶段。
其中,第一阶段,进入与定向阶段:建立用户与心理咨询师之间初步的咨询关系,初步了解用户情况以界定用户问题。可选的,在该阶段可以使用“具体化”“开放式提问”“情感反应”等沟通技巧。
第二阶段,问题和个人探索阶段:心理咨询师协助用户进行自我探索,达到对用户的深入了解,进一步界定和理解用户的问题。在该阶段,心理咨询师需要体现对用户问题的理解与分析,对用户阐述的问题重新进行言语组织并和用户确认;对问题发生的原因和细节进行追问,直至问题显得比较明确和清晰,避免直接下结论。可选的,在该阶段可以使用“封闭式提问”“倾听”“共情”等沟通技巧。
第三阶段,目标与方案探讨阶段:以用户为主导,心理咨询师引导激发用户改变的动机,处理好用户的期望和目标的关系,并提出明确的建议和手段。在该阶段,“咨询师”需要引导用户主动改变的意识,帮助他寻找过去的成功经验,看到自己的优势,启发他自己找到解决问题的路径,而不直接给出建议。可选的,在该阶段可以使用“开放式提问”“肯定性技术”“正常化”等沟通技巧。
第四阶段,行动转变阶段:心理咨询师引导用户的认知和行为改变,引导用户产生具体的行动和转变。可选的,在该阶段可以使用“情感反应”“指导”“提供信息”等沟通技巧。
第五阶段,评估与结束阶段:心理咨询师评估用户收获和对建议的接纳程度,进行结束和告别,并决定是否需要进一步的帮助,如果咨询者已经达到了目标,或者已经能够独立地处理问题,那么就可以结束治疗了。可选的,在该阶段可以使用“肯定性技术”等沟通技巧。
本实现方式通过具象化及实质化心理咨询专家的咨询经验,为心理咨询场景下的心理咨询对话设置了专属的对话流程阶段,将心理咨询对话约束到五大对话流程阶段,并在每个对话流程阶段搭配相应沟通技巧的选择及经验的应用,从而让大语言模型能够被极大约束来制造对话的整体节奏,达到咨询过程目标一致性及技巧使用合理性。
步骤S201的其他具体内容,请参考前述实施例中步骤S101的描述,在此不做赘述。
S202、根据所述对话属性信息,确定对话数据生成任务和标签输出任务。
其中,所述对话数据生成任务包括生成符合所述对话属性信息的对话文本的任务;所述标签输出任务包括第一标签输出任务和第二标签输出任务中的至少一项,所述第一标签输出任务用于在每一对话流程阶段的起始位置输出对话流程阶段标签,所述第二标签输出任务用于按照设定格式在对话数据的设定位置输出设定标签,所述设定标签包括沟通技巧标签、沟通话题标签、用户画像标签中的至少一项。
在该实现方式中,在步骤A1和步骤A3的基础上,进一步限定了对对话流程标签进行输出时,对话流程标签所处的对话数据的设定位置为每一对话流程阶段的起始位置。
步骤S202的其他具体内容,请参考前述实施例中步骤A1和A3的描述,在此不做赘述。
作为一种可选的实现方式,所述对话角色包括用户角色和心理咨询师角色;
在所述标签输出任务包括所述第二标签输出任务的情况下,所述第二标签输出任务用于按照设定格式、在输出所述心理咨询师的对话文本之前,输出设定标签。
该实现方式进一步限定了,在对话角色包括用户角色和心理咨询师角色的情况下,对沟通技巧标签和/或沟通话题标签和/或用户画像标签进行输出时,设定标签所处的对话数据的设定位置为输出心理咨询师的对话文本之前,通过将设定标签设置在输出心理咨询师的对话文本之前,使得在生成心理咨询师的对话文本时,设定标签的信息能够对心理咨询师对话文本的生成提供帮助,使得大语言模型的回复更加人性化,实现了大语言模型的个性化回复。例如,输出的用户画像标签中涉及到“基本信息-兴趣-打篮球”,那如果当时正在谈及考前焦虑事情时,后续指导建议就可以是“那我们约上朋友一起打篮球吧,这样可以放松考前紧张的心情”。
S203、至少根据所述对话数据生成任务和所述标签输出任务,生成至少包含所述对话数据生成任务和所述标签输出任务的任务指令。
步骤S203的具体内容与前述实施例中“根据所述对话属性信息,生成任务指令”还包括步骤A3的情况下,步骤A2的内容对应,请参考前述实施例中步骤A2的描述,在此不做赘述。
作为一种可选的实现方式,步骤S203包括步骤B1-B2:
B1、生成与所述对话数据生成任务和所述标签输出任务中的至少一项对应的任务执行示例。
所述任务执行示例可以理解为用于展示如何执行对话数据生成任务和/或标签输出任务的示例。任务执行示例可以引导大语言模型按照任务执行示例执行对话数据生成任务和标签输出任务。
例如,与执行对话数据生成任务对应的任务执行示例:如果咨询者在表达他们对未来的担忧,心理咨询师可以用共情的沟通技巧来反应,生成“听起来,你现在真的被未来的不确定性困扰了”。例如,与执行标签输出任务对应的任务执行示例:咨询者说“喜欢个女孩子,但是不熟,前几天表白了,搞得对方也很意外,现在对方态度也很模糊。现在场面很尴尬,我该怎么办?爱情是什么?”,在生成心理咨询师对话文本前,输出用户画像标签“{"用户画像":["基本信息-性别-男","基本信息-情感阶段-恋爱初期"]}”。
B2、生成包括所述对话数据生成任务、所述标签输出任务以及所述任务执行示例的任务指令。
可选的,分别对对话数据生成任务以及标签输出任务中的关键信息进行提取,并将提取的信息以及任务执行示例按照预设的任务指令格式进行组合,生成包含对话数据生成任务、标签输出任务以及任务执行示例的任务指令。该任务指令能够指示接收该任务指令的对象参考任务执行示例执行对话数据生成任务和/或标签输出任务。
本实现方式通过设置与对话数据生成任务和标签输出任务中的至少一项对应的任务执行示例,并生成包括对话数据生成任务、标签输出任务以及任务执行示例的任务指令,使得接收任务指令的对象参考任务执行示例执行对话数据生成任务和/或标签输出任务,使得接收任务指令的对象,即大语言模型能够更好理解及准确应用对话数据生成任务和/或标签输出任务。
S204、将所述任务指令输入预训练的大语言模型,以使所述大语言模型按照所述任务指令生成对话数据。
步骤S204的具体内容与前述实施例中步骤S103的内容对应,请参考前述实施例中步骤S103的描述,在此不做赘述。
示例性的,在对话角色包括用户角色和心理咨询师角色,对话场景为心理咨询对话场景,对话流程阶段包括进入与定向阶段、问题和个人探索阶段、目标与方案探讨阶段、行动转变阶段、评估与结束阶段,对话目标为建立良好的咨询关系,收集信息和了解情况,确定咨询目标和咨询方案,尽可能达到陪伴用户和解决其心理问题的目标时,通过执行本实施例提供的对话数据生成方法,大语言模型生成的对话数据案例效果如下所示:
【进入与定向阶段】
【第1轮】用户:喜欢个女孩子,但是不熟,前几天表白了,搞得对方也很意外,现在对方态度也很模糊。现在场面很尴尬,我该怎么办?爱情是什么?
【沟通技巧】:["开放式提问","具体化"]
【问题类别】:表白被拒
【用户画像】:{"用户画像":["基本信息-性别-男",”基本信息-情感阶段-恋爱初期”]}
【第1轮】心理咨询师:这是个复杂而又让人着迷的话题呢。让我们先从你的情况开始吧。你可以告诉我,第一次遇见这个女孩子是什么时候?你喜欢她的原因有哪些?
【问题-个人探索阶段】
【第2轮】用户:我们是同一个社团的,半年前认识的。她很聪明,有才气,笑起来很好看。再加上我之前没有谈过恋爱,所以对爱情很好奇,加上些许期待。这就是我喜欢她的原因吧。
【第2轮】心理咨询师:原来你们是同一个社团的朋友,这样的认识方式很自然呢。你说她聪明、有才气且笑容甜美,这些优点确实让人难以忘怀。对爱情的好奇和期待是很正常的。在表白之前,你有尝试和她增加交流和接触吗?
【第3轮】用户:和她聊天过几次,但大多数时间还是群里活动的时候见面。一直觉得时间稍微有点紧迫,就直接表白了。现在回想起来,我好像真的有点冲动。
【第3轮】心理咨询师:确实,彼此的交流和接触很重要,可以让你了解她更多,增进彼此的感情。我们不能回去改变已发生的事情,但我们可以从中学习和成长。你觉得如果时间可以倒流,你会如何调整你的行动呢?
【目标与方案探讨阶段】
【第4轮】用户:如果时光倒流,我想我会先花更多时间和她沟通,了解她的兴趣、爱好以及对人生的看法。等彼此熟悉了,有了更深入的了解,再考虑表白。
【第4轮】心理咨询师:这是一个非常好的想法,对一个人的了解是建立感情的基础,逐步增加交流和了解是很有帮助的。现在虽然情况有些尴尬,你可以考虑如何回到与她正常交往的状态,让她更多地了解到你的真实面貌,有时候友谊也是一种宝贵的关系。你现在觉得有什么可以做来缓解尴尬的场面?
【行动-转变阶段】
【第5轮】用户:嗯,谢谢你的建议。我觉得可以适当地寻找一些与她共同关心的话题,像社团的活动或者学校的事情,然后就像和普通朋友一样跟她聊聊天。这样或许能让她觉得跟我相处没有那么尴尬。
【第5轮】心理咨询师:不错!寻找共同关心的话题,像普通朋友一样交流,可以有效地缓解尴尬的场面。还能让你们逐渐恢复正常的交往,建立起更好的关系。在这个过程中,保持自信和积极的心态也很重要哦。你觉得你准备好面对这一阶段的挑战了吗?
【评估与结束阶段】
【第6轮】用户:是的,我已经做好了面对挑战的准备。我会试着放轻松,用一颗平常心去面对她,同时保持自信和积极的心态。虽然表白失败了,但也许我们还可以成为朋友,慢慢地进一步了解彼此。
【沟通技巧】:["开放式提问","导向","共情","澄清"]【第6轮】心理咨询师:非常棒!有这样的想法和决心,你一定能够更好地处理这一情况。记住,每一次经历都是一个宝贵的学习过程。祝你一切顺利!
本申请实施例还提供了一种模型训练方法,图3为本申请实施例提供的一种模型训练方法的流程图。如图3所示,本实施例提供的模型训练方法包括步骤S301-S302:
S301、获取对话数据,并利用所述对话数据构建对话训练样本数据,其中,所述对话数据通过如上述的对话数据生成方法而生成。
S302、利用所述对话训练样本数据,对预先构建的对话模型进行对话训练;所述对话模型用于根据用户对话内容,生成用于响应所述用户对话内容的对话数据。
示例性的,预先构建的对话模型可基于多种深度学习的神经网络结构实现,例如CNN(Convolutional Neural Networks)网络结构、RNN(Recurrent Neural Networks)网络结构、CRNN(Convolutional Recurrent Neural Network)网络结构等,本申请对此不做限定。
具体的,本申请实施例中预先构建有对话模型。利用对话训练样本数据对构建好的对话模型进行对话训练,得到训练完成的对话模型。所述对话训练以使得对话模型能够正确生成对话数据为目标,训练完成的对话模型,能够根据输入的用户对话内容,正确生成用于响应用户对话内容的对话数据。
由于对话模型是基于通用领域或特定领域的对话训练样本数据训练得到的,这样训练完成的对话模型不仅能够实现通用领域的人机对话,还能够实现特定领域的人机对话。
在本申请的技术方案中,由于采用了上述对话数据生成方法生成的通用领域或特定领域的对话训练样本数据对预先构建的对话模型进行训练,使得训练好的对话模型能够实现通用领域或特定领域的人机对话,灵活性更高。
本申请实施例还提供了另一种对话数据生成方法,该方法用于在与用户进行交互时响应用户对话内容而生成对话数据。图4为本申请实施例提供的第三种对话数据生成方法的流程图。如图4所示,本实施例提供的对话数据生成方法包括步骤S401-S402:
S401、获取用户对话内容。
S402、将所述用户对话内容输入预先训练的对话模型,得到与所述用户对话内容对应的对话数据;其中,所述对话模型基于对话训练样本数据进行对话训练得到,所述对话训练样本数据通过如上述的对话数据生成方法生成的对话数据而构建得到
在本申请的技术方案中,由于采用对话模型基于上述对话数据生成方法生成的通用领域或特定领域的对话训练样本数据进行对话训练得到,所以训练好的对话模型能够实现通用领域或特定领域的人机对话,灵活性更高。
示例性装置
与上述的对话数据生成方法对应的,本申请实施例还提供了一种对话数据生成装置。图5是本申请实施例提供的第一种对话数据生成装置的结构示意图,如图5所示,本申请实施例提供的对话数据生成装置包括:
信息获取单元501,用于获取对话属性信息,所述对话属性信息至少包括对话角色、对话场景、对话流程阶段和对话目标,所述对话流程阶段包括实现所述对话目标所经历的各个对话阶段;
指令生成单元502,用于根据所述对话属性信息,生成任务指令,所述任务指令用于指示接收该任务指令的对象生成符合所述对话属性信息的对话数据;
数据生成单元503,用于将所述任务指令输入预训练的大语言模型,以使所述大语言模型按照所述任务指令生成对话数据。
本申请提出的对话数据生成装置能够基于需要的对话数据的对话属性信息,生成用于指示生成符合该对话属性信息的对话数据的任务指令,然后将该任务指令输入预训练的大语言模型,借助预训练大语言模型的自然语言处理能力来自动生成对话数据。该装置借助大语言模型实现了对话数据自动生成,因此提高了对话数据生成效率,能够满足对对话数据的数据量需求。
并且,本申请在任务指令中嵌入了对话角色、对话场景、对话流程阶段和对话目标等丰富的对话属性信息,然后触发大语言模型生成符合这些对话属性信息的对话数据,从而能够保证生成的对话数据的质量。
对于任意领域、任意场景的对话数据,均可以通过修改对话属性信息来触发大语言模型生成符合相应领域或相应场景的对话数据,其对话数据生成效率和灵活性更高。
可选的,所述对话属性信息还包括各个对话流程阶段应用的沟通技巧,所述沟通技巧包括开放式提问、封闭式提问、情感反应、倾听、共情、指导中的至少一项。
可选的,所述对话属性信息还包括对话要求信息,所述对话要求信息包括对话语气要求、对话态度要求、隐私保护要求、对话长度要求中的至少一项。
可选的,指令生成单元502,具体可以用于:
根据所述对话属性信息,确定对话数据生成任务,所述对话数据生成任务包括生成符合所述对话属性信息的对话文本的任务;
至少根据所述对话数据生成任务,生成至少包含所述对话数据生成任务的任务指令。
可选的,指令生成单元502,具体可以用于:
根据所述对话属性信息,确定标签输出任务,所述标签输出任务包括按照设定格式在对话数据的设定位置输出设定标签的信息的任务,所述设定标签包括对话流程阶段标签、沟通技巧标签、沟通话题标签、用户画像标签中的至少一项;
可选的,指令生成单元502,具体可以用于:
根据所述对话数据生成任务和所述标签输出任务,生成包含所述对话数据生成任务和所述标签输出任务的任务指令。
可选的,所述对话场景包括心理咨询对话场景;
所述对话流程阶段,包括进入与定向阶段、问题和个人探索阶段、目标与方案探讨阶段、行动转变阶段、评估与结束阶段。
可选的,指令生成单元502,具体可以用于:
根据所述对话属性信息,确定对话数据生成任务和标签输出任务;
其中,所述对话数据生成任务包括生成符合所述对话属性信息的对话文本的任务;所述标签输出任务包括第一标签输出任务和第二标签输出任务中的至少一项,所述第一标签输出任务用于在每一对话流程阶段的起始位置输出对话流程阶段标签,所述第二标签输出任务用于按照设定格式在对话数据的设定位置输出设定标签,所述设定标签包括沟通技巧标签、沟通话题标签、用户画像标签中的至少一项;
至少根据所述对话数据生成任务和所述标签输出任务,生成至少包含所述对话数据生成任务和所述标签输出任务的任务指令。
可选的,所述对话角色包括用户角色和心理咨询师角色;
在所述标签输出任务包括所述第二标签输出任务的情况下,所述第二标签输出任务用于按照设定格式、在输出所述心理咨询师的对话文本之前,输出设定标签。
可选的,指令生成单元502,具体可以用于:
生成与所述对话数据生成任务和所述标签输出任务中的至少一项对应的任务执行示例;
生成包括所述对话数据生成任务、所述标签输出任务以及所述任务执行示例的任务指令。
本实施例提供的对话数据生成装置,与本申请上述实施例所提供的对话数据生成方法属于同一申请构思,可执行本申请上述任意实施例所提供的对话数据生成方法,具备执行对话数据生成方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本申请上述实施例提供的对话数据生成方法的具体处理内容,此处不再加以赘述。
以上的信息获取单元501、指令生成单元502和数据生成单元503所实现的功能可以分别由相同或不同的处理器实现,本申请实施例不作限定。
与上述的模型训练方法对应的,本申请实施例还提供了一种模型训练装置。图6是本申请实施例提供的一种模型训练装置的结构示意图,如图6所示,本申请实施例提供的模型训练装置包括:
样本获取单元601,用于获取对话数据,并利用所述对话数据构建对话训练样本数据,其中,所述对话数据通过如前述实施例提供的任一项对话数据生成方法而生成;
模型训练单元602,用于利用所述对话训练样本数据,对预先构建的对话模型进行对话训练;所述对话模型用于根据用户对话内容,生成用于响应所述用户对话内容的对话数据。
本实施例提供的模型训练装置,与本申请上述实施例所提供的模型训练方法属于同一申请构思,可执行本申请上述任意实施例所提供的模型训练方法,具备执行模型训练方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本申请上述实施例提供的模型训练方法的具体处理内容,此处不再加以赘述。
以上的样本获取单元601和模型训练单元602所实现的功能可以分别由相同或不同的处理器实现,本申请实施例不作限定。
本申请实施例还提供了另一种对话数据生成装置。图7是本申请实施例提供的第二种对话数据生成装置的结构示意图,如图7所示,本申请实施例提供的第一种对话数据生成装置包括:
用户对话获取单元701,用于获取用户对话内容;
对话数据生成单元702,用于将所述用户对话内容输入预先训练的对话模型,得到与所述用户对话内容对应的对话数据;其中,所述对话模型基于对话训练样本数据进行对话训练得到,所述对话训练样本数据通过如前述实施例提供的任一项对话数据生成方法生成的对话数据而构建得到。
本实施例提供的装置,与上述实施例所提供的用于在与用户进行交互时响应用户对话内容而生成对话数据的对话数据生成方法属于同一申请构思,可执行本申请上述任意实施例所提供的用于在与用户进行交互时响应用户对话内容而生成对话数据的对话数据生成方法,具备执行该对话数据生成方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本申请上述实施例提供的用于在与用户进行交互时响应用户对话内容而生成对话数据的对话数据生成方法的具体处理内容,此处不再加以赘述。
以上的用户对话获取单元701和对话数据生成单元702所实现的功能可以分别由相同或不同的处理器实现,本申请实施例不作限定。
应理解以上装置中的单元可以以处理器调用软件的形式实现。例如该装置包括处理器,处理器与存储器连接,存储器中存储有指令,处理器调用存储器中存储的指令,以实现以上任一种方法或实现该装置各单元的功能,其中处理器可以为通用处理器,例如CPU或微处理器等,存储器可以为装置内的存储器或装置外的存储器。或者,装置中的单元可以以硬件电路的形式实现,可以通过对硬件电路的设计,实现部分或全部单元的功能,该硬件电路可以理解为一个或多个处理器;例如,在一种实现中,该硬件电路为ASIC,通过对电路内元件逻辑关系的设计,实现以上部分或全部单元的功能;再如,在另一种实现中,该硬件电路可以通过PLD实现,以FPGA为例,其可以包括大量逻辑门电路,通过配置文件来配置逻辑门电路之间的连接关系,从而实现以上部分或全部单元的功能。以上装置的所有单元可以全部通过处理器调用软件的形式实现,或全部通过硬件电路的形式实现,或部分通过处理器调用软件的形式实现,剩余部分通过硬件电路的形式实现。
在本申请实施例中,处理器是一种具有信号的处理能力的电路,在一种实现中,处理器可以是具有指令读取与运行能力的电路,例如CPU、微处理器、GPU或DSP等;在另一种实现中,处理器可以通过硬件电路的逻辑关系实现一定功能,该硬件电路的逻辑关系是固定的或可以重构的,例如处理器为ASIC或PLD实现的硬件电路,例如FPGA等。在可重构的硬件电路中,处理器加载配置文档,实现硬件电路配置的过程,可以理解为处理器加载指令,以实现以上部分或全部单元的功能的过程。此外,还可以是针对人工智能设计的硬件电路,其可以理解为一种ASIC,例如NPU、TPU、DPU等。
可见,以上装置中的各单元可以是被配置成实施以上方法的一个或多个处理器(或处理电路),例如:CPU、GPU、NPU、TPU、DPU、微处理器、DSP、ASIC、FPGA,或这些处理器形式中至少两种的组合。
此外,以上装置中的各单元可以全部或部分可以集成在一起,或者可以独立实现。在一种实现中,这些单元集成在一起,以SOC的形式实现。该SOC中可以包括至少一个处理器,用于实现以上任一种方法或实现该装置各单元的功能,该至少一个处理器的种类可以不同,例如包括CPU和FPGA,CPU和人工智能处理器,CPU和GPU等。
示例性电子设备
本申请另一实施例还提出一种电子设备,参见图8所示,该设备包括:
存储器200和处理器210;
其中,所述存储器200与所述处理器210连接,用于存储程序;
所述处理器210,用于通过运行所述存储器200中存储的程序,实现上述任一实施例公开的对话数据生成方法或模型训练方法。
具体的,上述电子设备还可以包括:总线、通信接口220、输入设备230和输出设备240。
处理器210、存储器200、通信接口220、输入设备230和输出设备240通过总线相互连接。其中:
总线可包括一通路,在计算机系统各个部件之间传送信息。
处理器210可以是通用处理器,例如通用中央处理器(CPU)、微处理器等,也可以是特定应用集成电路(application-specific integrated circuit,ASIC),或一个或多个用于控制本发明方案程序执行的集成电路。还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
处理器210可包括主处理器,还可包括基带芯片、调制解调器等。
存储器200中保存有执行本发明技术方案的程序,还可以保存有操作系统和其他关键业务。具体地,程序可以包括程序代码,程序代码包括计算机操作指令。更具体的,存储器200可以包括只读存储器(read-only memory,ROM)、可存储静态信息和指令的其他类型的静态存储设备、随机存取存储器(random access memory,RAM)、可存储信息和指令的其他类型的动态存储设备、磁盘存储器、flash等等。
输入设备230可包括接收用户输入的数据和信息的装置,例如键盘、鼠标、摄像头、扫描仪、光笔、语音输入装置、触摸屏、计步器或重力感应器等。
输出设备240可包括允许输出信息给用户的装置,例如显示屏、打印机、扬声器等。
通信接口220可包括使用任何收发器一类的装置,以便与其他设备或通信网络通信,如以太网,无线接入网(RAN),无线局域网(WLAN)等。
处理器210执行存储器200中所存放的程序,以及调用其他设备,可用于实现本申请上述实施例所提供的任意一种对话数据生成方法或模型训练方法的各个步骤。
本申请实施例还提出一种芯片,该芯片包括处理器和数据接口,所述处理器通过所述数据接口读取并运行存储器上存储的程序,以执行上述任意实施例所介绍的对话数据生成方法或模型训练方法,具体处理过程及其有益效果可参见上述的对话数据生成方法或模型训练方法的实施例介绍。
示例性计算机程序产品和存储介质
除了上述方法和设备以外,本申请的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述任意实施例中描述的根据本申请各种实施例的对话数据生成方法或模型训练方法中的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行,或者完全在远程计算设备或服务器上执行。
此外,本申请的实施例还可以是存储介质,其上存储有计算机程序,计算机程序被处理器执行本说明书上述任意实施例中描述的根据本申请各种实施例的对话数据生成方法或模型训练方法的步骤。
对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本申请各实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减,各实施例中记载的技术特征可以进行替换或者组合。
本申请各实施例中装置及终端中的模块和子模块可以根据实际需要进行合并、划分和删减。
本申请所提供的几个实施例中,应该理解到,所揭露的终端,装置和方法,可以通过其它的方式实现。例如,以上所描述的终端实施例仅仅是示意性的,例如,模块或子模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个子模块或模块可以结合或者可以集成到另一个模块,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的模块或子模块可以是或者也可以不是物理上分开的,作为模块或子模块的部件可以是或者也可以不是物理模块或子模块,即可以位于一个地方,或者也可以分布到多个网络模块或子模块上。可以根据实际的需要选择其中的部分或者全部模块或子模块来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能模块或子模块可以集成在一个处理模块中,也可以是各个模块或子模块单独物理存在,也可以两个或两个以上模块或子模块集成在一个模块中。上述集成的模块或子模块既可以采用硬件的形式实现,也可以采用软件功能模块或子模块的形式实现。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件单元,或者二者的结合来实施。软件单元可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM或技术领域内所公知的任意其它形式的存储介质中。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (14)

1.一种对话数据生成方法,其特征在于,包括:
获取对话属性信息,所述对话属性信息至少包括对话角色、对话场景、对话流程阶段和对话目标,所述对话流程阶段包括实现所述对话目标所需经历的各个对话阶段;
根据所述对话属性信息,生成任务指令,所述任务指令用于指示接收该任务指令的对象生成符合所述对话属性信息的对话数据;
将所述任务指令输入预训练的大语言模型,以使所述大语言模型按照所述任务指令生成对话数据。
2.根据权利要求1所述的方法,其特征在于,所述对话属性信息还包括各个对话流程阶段应用的沟通技巧,所述沟通技巧包括开放式提问、封闭式提问、情感反应、倾听、共情、指导中的至少一项。
3.根据权利要求1所述的方法,其特征在于,所述对话属性信息还包括对话要求信息,所述对话要求信息包括对话语气要求、对话态度要求、隐私保护要求、对话长度要求中的至少一项。
4.根据权利要求1至3中任意一项所述的方法,其特征在于,所述根据所述对话属性信息,生成任务指令,包括:
根据所述对话属性信息,确定对话数据生成任务,所述对话数据生成任务包括生成符合所述对话属性信息的对话文本的任务;
至少根据所述对话数据生成任务,生成至少包含所述对话数据生成任务的任务指令。
5.根据权利要求4所述的方法,其特征在于,在根据所述对话属性信息,生成任务指令的过程中,还包括:
根据所述对话属性信息,确定标签输出任务,所述标签输出任务包括按照设定格式在对话数据的设定位置输出设定标签的信息的任务,所述设定标签包括对话流程阶段标签、沟通技巧标签、沟通话题标签、用户画像标签中的至少一项;
至少根据所述对话数据生成任务,生成至少包含所述对话数据生成任务的任务指令,包括:
根据所述对话数据生成任务和所述标签输出任务,生成包含所述对话数据生成任务和所述标签输出任务的任务指令。
6.根据权利要求1至3中任意一项所述的方法,其特征在于,所述对话场景包括心理咨询对话场景;
所述对话流程阶段,包括进入与定向阶段、问题和个人探索阶段、目标与方案探讨阶段、行动转变阶段、评估与结束阶段。
7.根据权利要求6所述的方法,其特征在于,所述根据所述对话属性信息,生成任务指令,包括:
根据所述对话属性信息,确定对话数据生成任务和标签输出任务;
其中,所述对话数据生成任务包括生成符合所述对话属性信息的对话文本的任务;所述标签输出任务包括第一标签输出任务和第二标签输出任务中的至少一项,所述第一标签输出任务用于在每一对话流程阶段的起始位置输出对话流程阶段标签,所述第二标签输出任务用于按照设定格式在对话数据的设定位置输出设定标签,所述设定标签包括沟通技巧标签、沟通话题标签、用户画像标签中的至少一项;
至少根据所述对话数据生成任务和所述标签输出任务,生成至少包含所述对话数据生成任务和所述标签输出任务的任务指令。
8.根据权利要求7所述的方法,其特征在于,所述对话角色包括用户角色和心理咨询师角色;
在所述标签输出任务包括所述第二标签输出任务的情况下,所述第二标签输出任务用于按照设定格式、在输出所述心理咨询师的对话文本之前,输出设定标签。
9.根据权利要求7所述的方法,其特征在于,所述至少根据所述对话数据生成任务和所述标签输出任务,生成至少包含所述对话数据生成任务和所述标签输出任务的任务指令,包括:
生成与所述对话数据生成任务和所述标签输出任务中的至少一项对应的任务执行示例;
生成包括所述对话数据生成任务、所述标签输出任务以及所述任务执行示例的任务指令。
10.一种模型训练方法,其特征在于,包括;
获取对话数据,并利用所述对话数据构建对话训练样本数据,其中,所述对话数据通过如权利要求1至9中任意一项所述的对话数据生成方法而生成;
利用所述对话训练样本数据,对预先构建的对话模型进行对话训练;所述对话模型用于根据用户对话内容,生成用于响应所述用户对话内容的对话数据。
11.一种对话数据生成方法,其特征在于,包括:
获取用户对话内容;
将所述用户对话内容输入预先训练的对话模型,得到与所述用户对话内容对应的对话数据;
其中,所述对话模型基于对话训练样本数据进行对话训练得到,所述对话训练样本数据通过如权利要求1至9中任意一项所述的对话数据生成方法生成的对话数据而构建得到。
12.一种对话数据生成装置,其特征在于,包括:
信息获取单元,用于获取对话属性信息,所述对话属性信息至少包括对话角色、对话场景、对话流程阶段和对话目标,所述对话流程阶段包括实现所述对话目标所经历的各个对话阶段;
指令生成单元,用于根据所述对话属性信息,生成任务指令,所述任务指令用于指示接收该任务指令的对象生成符合所述对话属性信息的对话数据;
数据生成单元,用于将所述任务指令输入预训练的大语言模型,以使所述大语言模型按照所述任务指令生成对话数据。
13.一种电子设备,其特征在于,包括存储器和处理器;
所述存储器与所述处理器连接,用于存储程序;
所述处理器用于通过运行所述存储器中的程序,实现如权利要求1至11中任意一项所述的方法。
14.一种存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时,实现如权利要求1至11中任意一项所述的方法。
CN202311378502.3A 2023-10-23 2023-10-23 对话数据生成方法、模型训练方法及相关装置 Pending CN117407501A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311378502.3A CN117407501A (zh) 2023-10-23 2023-10-23 对话数据生成方法、模型训练方法及相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311378502.3A CN117407501A (zh) 2023-10-23 2023-10-23 对话数据生成方法、模型训练方法及相关装置

Publications (1)

Publication Number Publication Date
CN117407501A true CN117407501A (zh) 2024-01-16

Family

ID=89495799

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311378502.3A Pending CN117407501A (zh) 2023-10-23 2023-10-23 对话数据生成方法、模型训练方法及相关装置

Country Status (1)

Country Link
CN (1) CN117407501A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118569390A (zh) * 2024-08-01 2024-08-30 上海法忞銮智能科技有限公司 场景化的aigc内容生成方法、系统和存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118569390A (zh) * 2024-08-01 2024-08-30 上海法忞銮智能科技有限公司 场景化的aigc内容生成方法、系统和存储介质

Similar Documents

Publication Publication Date Title
Mahat-Shamir et al. Designing in-depth semi-structured interviews for revealing meaning reconstruction after loss
Hussain et al. Extending a conventional chatbot knowledge base to external knowledge source and introducing user based sessions for diabetes education
Ahmad et al. Robot’s adaptive emotional feedback sustains children’s social engagement and promotes their vocabulary learning: a long-term child–robot interaction study
Braithwaite et al. Centered but not caught in the middle: Stepchildren's perceptions of dialectical contradictions in the communication of co-parents
Denecke et al. Self-anamnesis with a conversational user interface: concept and usability study
Xu Language teacher emotion in relationships: A multiple case study
Manara et al. In search of salience: phenomenological analysis of moral distress
Demirci User experience over time with conversational agents: Case study of Woebot on supporting subjective well-being
CN117407501A (zh) 对话数据生成方法、模型训练方法及相关装置
Sass-Lehrer et al. Families: Partnerships in practice
Jaysane‐Darr Enabling and disabling emotional diversity: Negotiating autism spectrum disorder in therapeutic encounters
Veldmeijer et al. Design for mental health: can design promote human-centred diagnostics?
Kim et al. Care guide system for caregivers of people with dementia
Sophia et al. A survey on chatbot implementation in health care using NLTK
Caldwell Marin et al. Designing a cyber-physical robotic platform to assist speech-language pathologists
Das Pratibhā, intuition, and practical knowledge
Engelbrecht Introduction to social work
Stankova et al. Educational computer games and social skills training
Gopaldas et al. Service conversation: advisory, relational and transformative approaches
Wren Researching the moral dimension of first-person narratives
McMahon-Morin et al. Tracking changes in conversation during and after communication partner training: an exploratory study
Strandbech Humanoid robots for health and welfare: on humanoid robots as a welfare technology used in interaction with persons with dementia
Winkler Conception and Realization of a Chatbot-System to support Psychological and Medical Procedures
Høiland " Hi, can I help?" An exploratory study of designing a chatbot to complement school nurses in supporting youths' mental health
Giddy Traditional African Philosophy of Mind and World: Facilitating a Dialogue

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination