CN116483981A - 对话生成方法、装置、设备及存储介质 - Google Patents
对话生成方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN116483981A CN116483981A CN202310714635.7A CN202310714635A CN116483981A CN 116483981 A CN116483981 A CN 116483981A CN 202310714635 A CN202310714635 A CN 202310714635A CN 116483981 A CN116483981 A CN 116483981A
- Authority
- CN
- China
- Prior art keywords
- dialogue
- data
- results
- module
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 238000003860 storage Methods 0.000 title claims abstract description 14
- 238000012545 processing Methods 0.000 claims abstract description 35
- 230000007246 mechanism Effects 0.000 claims description 9
- 230000008451 emotion Effects 0.000 description 22
- 238000004590 computer program Methods 0.000 description 10
- 238000012549 training Methods 0.000 description 9
- 230000036651 mood Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 206010010144 Completed suicide Diseases 0.000 description 5
- 238000001514 detection method Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000005520 cutting process Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 206010020751 Hypersensitivity Diseases 0.000 description 1
- 208000026935 allergic disease Diseases 0.000 description 1
- 230000007815 allergy Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008909 emotion recognition Effects 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000003340 mental effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 239000004984 smart glass Substances 0.000 description 1
- 125000001544 thienyl group Chemical group 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Machine Translation (AREA)
Abstract
本说明书实施例提供对话生成方法、装置、设备及存储介质,该方法包括:获取初始数据,对初始数据进行识别确定文本数据,基于预设处理规则对文本数据进行处理,确定文本意图数据,基于至少两个对话识别模块针对文本意图数据生成至少两个对话结果,基于至少两个对话结果进行打分,得到至少两个对话结果对应的评分,基于至少两个对话结果对应的评分确定目标对话结果。通过获取初始数据,对初始数据进行识别确定文本数据,基于预设处理规则对文本数据进行处理,确定文本意图数据,基于至少两个对话识别模块针对文本意图数据生成至少两个对话结果,基于至少两个对话结果对应的评分确定目标对话结果。实现对不良倾向的判定,从而进行相应的对话操作。
Description
技术领域
本说明书实施例涉及人工智能技术领域,特别涉及对话生成方法。
背景技术
数字化解决方案平台服务大量的心理患者人群,这类人群,如果有24小时的心理陪伴数字人,将有可能疏导情绪,调节心理,避免自残自杀的发生。
目前,大量情感疏导还依赖人工热线电话等。在数字人领域,智能聊天机器人在智能客服、个人助理等无情感场景中,已经有比较好的应用,能够进行简单的业务处理和客户支持。但是在精神心理这个特殊领域,如何构建一个有专业的心理咨询师技能和特定的人格伦理支持能力的机器人,将极大推动陪伴数字人的应用推广,解放心理咨询师的工作压力。现有机器人技术一般基于FAQ知识库或者ES关键词匹配等技术,要用于心理陪伴,尚有如下缺点:没有对自残自杀等不良倾向的识别和预警能力,没有情绪对话支持能力。
发明内容
有鉴于此,本说明书实施例提供了对话生成方法。本说明书一个或者多个实施例同时涉及对话生成装置,一种计算设备,一种计算机可读存储介质以及一种计算机程序,以解决现有技术中存在的技术缺陷。
根据本说明书实施例的第一方面,提供了一种对话生成方法,包括:
获取初始数据,对初始数据进行识别确定文本数据;
基于预设处理规则对文本数据进行处理,确定文本意图数据;
基于至少两个对话识别模块针对文本意图数据生成至少两个对话结果;
基于至少两个对话结果进行打分,得到至少两个对话结果对应的评分;
基于至少两个对话结果对应的评分确定目标对话结果。
在一种可能的实现方式中,获取初始数据,对初始数据进行识别确定文本数据,包括:
确定初始数据的类型信息,并根据类型信息确定目标识别方式;
基于目标识别方式,对初始数据进行识别确定文本数据。
在一种可能的实现方式中,确定初始数据的类型信息,并根据类型信息确定目标识别方式,包括:
根据类型信息确定初始数据的类型,在初始数据的类型为图片数据的情况下,确定目标识别方式为图像识别方式;
在初始数据的类型为音频数据的情况下,确定后目标识别方式为语音识别方式。
在一种可能的实现方式中,基于预设处理规则对文本数据进行处理,确定文本意图数据,包括:
基于文本数据确定人物标识信息,并基于人物标识信息调取人物历史数据;
基于人物历史数据和注意力机制确定文本意图数据。
在一种可能的实现方式中,对话识别模块包括:风险预警模块、对话规则引擎模块、搜索引擎模块、知识图谱模块和心理咨询师对话模型模块;
相应的,基于至少两个对话识别模块针对文本意图数据生成至少两个对话结果,包括:
将文本意图数据输入风险预警模块、对话规则引擎模块、搜索引擎模块、知识图谱模块和心理咨询师对话模型模块,得到对应的对话结果。
在一种可能的实现方式中,基于至少两个对话结果进行打分,得到至少两个对话结果对应的评分,包括:
基于文本意图数据对至少两个对话结果进行打分,得到至少两个对话结果对应的评分。
在一种可能的实现方式中,基于至少两个对话结果对应的评分确定目标对话结果,包括:
在风险预警模块的对话结果为第一警报的情况下,将第一警报作为目标对话结果;
在风险预警模块的对话结果不为第一警报的情况下,获取对话规则引擎模块、搜索引擎模块、知识图谱模块和心理咨询师对话模型模块对应的对话结果的评分;
将对话结果的评分进行排序,得到排序结果;
基于排序结果从对话结果中确定目标对话结果。
根据本说明书实施例的第二方面,提供了一种对话生成装置,包括:
数据获取模块,被配置为获取初始数据,对初始数据进行识别确定文本数据;
意图识别模块,被配置为基于预设处理规则对文本数据进行处理,确定文本意图数据;
结果生成模块,被配置为基于至少两个对话识别模块针对文本意图数据生成至少两个对话结果;
结果打分模块,被配置为基于至少两个对话结果进行打分,得到至少两个对话结果对应的评分;
对话确定模块,被配置为基于至少两个对话结果对应的评分确定目标对话结果。
根据本说明书实施例的第三方面,提供了一种计算设备,包括:
存储器和处理器;
存储器用于存储计算机可执行指令,处理器用于执行计算机可执行指令,该计算机可执行指令被处理器执行时实现上述对话生成方法的步骤。
根据本说明书实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现上述对话生成方法的步骤。
根据本说明书实施例的第五方面,提供了一种计算机程序,其中,当计算机程序在计算机中执行时,令计算机执行上述对话生成方法的步骤。
本说明书实施例提供对话生成方法、装置、设备及存储介质,其中对话生成方法包括:获取初始数据,对初始数据进行识别确定文本数据,基于预设处理规则对文本数据进行处理,确定文本意图数据,基于至少两个对话识别模块针对文本意图数据生成至少两个对话结果,基于至少两个对话结果进行打分,得到至少两个对话结果对应的评分,基于至少两个对话结果对应的评分确定目标对话结果。通过获取初始数据,对初始数据进行识别确定文本数据,基于预设处理规则对文本数据进行处理,确定文本意图数据,基于至少两个对话识别模块针对文本意图数据生成至少两个对话结果,基于至少两个对话结果对应的评分确定目标对话结果。实现对不良倾向的判定,从而进行相应的对话操作。
附图说明
图1是本说明书一个实施例提供的一种对话生成方法的场景示意图;
图2是本说明书一个实施例提供的一种对话生成方法的流程图;
图3是本说明书一个实施例提供的一种对话生成方法的处理过程示意图;
图4是本说明书一个实施例提供的一种对话生成装置的结构示意图;
图5是本说明书一个实施例提供的一种计算设备的结构框图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
在本说明书中,提供了对话生成方法,本说明书同时涉及对话生成装置,一种计算设备,以及一种计算机可读存储介质,在下面的实施例中逐一进行详细说明。
参见图1,图1示出了根据本说明书一个实施例提供的一种对话生成方法的场景示意图。
在图1的应用场景中,计算设备101可以获取初始数据102。然后,计算设备101可以对初始数据102进行识别确定文本数据103。之后,计算设备101可以基于预设处理规则对文本数据103进行处理,确定文本意图数据104。并基于至少两个对话识别模块针对文本意图数据104生成至少两个对话结果105。最后,基于至少两个对话结果105进行打分,得到至少两个对话结果105对应的评分106,以及基于至少两个对话结果105对应的评分106确定目标对话结果,如附图标记107所示。
需要说明的是,上述计算设备101可以是硬件,也可以是软件。当计算设备101为硬件时,可以实现成多个服务器或终端设备组成的分布式集群,也可以实现成单个服务器或单个终端设备。当计算设备101体现为软件时,可以安装在上述所列举的硬件设备中。其可以实现成例如用来提供分布式服务的多个软件或软件模块,也可以实现成单个软件或软件模块。在此不做具体限定。
参见图2,图2示出了根据本说明书一个实施例提供的一种对话生成方法的流程图,具体包括以下步骤。
步骤201:获取初始数据,对初始数据进行识别确定文本数据。
具体的,初始数据可以为文本、图片、语音等数据。
在一种可能的实现方式中,获取初始数据,对初始数据进行识别确定文本数据,包括:确定初始数据的类型信息,并根据类型信息确定目标识别方式,基于目标识别方式,对初始数据进行识别确定文本数据。
在实际应用中,参见图3,可以通过信息输入模块依据初始数据的格式确定初始数据的类型,再通过图像识别、语音ASR自动识别,将初始数据变换成文本内容输入。
在一种可能的实现方式中,确定初始数据的类型信息,并根据类型信息确定目标识别方式,包括:根据类型信息确定初始数据的类型,在初始数据的类型为图片数据的情况下,确定目标识别方式为图像识别方式,在初始数据的类型为音频数据的情况下,确定后目标识别方式为语音识别方式。
例如,确定初始数据的类型信息为jpg格式,则根据类型信息确定目标识别方式为图片识别,若初始数据的类型信息为MP3格式,则根据类型信息确定目标识别方式为语音识别。
步骤202:基于预设处理规则对文本数据进行处理,确定文本意图数据。
在一种可能的实现方式中,基于预设处理规则对文本数据进行处理,确定文本意图数据,包括:基于文本数据确定人物标识信息,并基于人物标识信息调取人物历史数据,基于人物历史数据和注意力机制确定文本意图数据。
其中,参见图3预设规则可以包括上下文预处理模块、电子病历模块、对话历史模块和情绪分类与检测模块对应的预设规则。其中,上下文预处理模块:此部分包含电子病历模块、对话历史模块、情绪分类与检测模块三个子模块。电子病历模块:好心情用户特有的,一般会包含患者基本信息如姓名、性别、年龄、身高体重、既往史、现病史、过敏史等及其主诉信息。也会包含历次在好心情平台的就诊记录、医生对其的诊断、用药等信息。对话历史模块:记录历次对话详细信息,上下文聊天记录维护和日志备份。对后续进行模型训练优化提供大量丰富真实的语料。情绪分类与检测模块:基于注意力机制细粒度情绪分类模型,实现了32类的情绪分类。
具体的,注意力机制是将Source中的构成元素想象成是有一系列的<key,value>数据对构成,此时对于Target中的某个元素Query,通过计算Query和各个Key的相似性或者相关性,得到每个Key对应Value的权重系数,然后对Value进行加权求和,即得到了最终的Attention的数值。所以本质上Attention机制是对Source中元素的Value值进行加权求和,而Query和Key用来计算对应Value的权重系数,可将注意力机制改写为如下公式:
例如,输入的文本为:“我很想哭”,则识别该文本的情绪分类为:“低落”。
步骤203:基于至少两个对话识别模块针对文本意图数据生成至少两个对话结果。
其中,对话结果可以为对文本生成的回复。例如,文本为:“你好”,生成的对话结果为:“你好”。
在一种可能的实现方式中,对话识别模块包括:风险预警模块、对话规则引擎模块、搜索引擎模块、知识图谱模块和心理咨询师对话模型模块,相应的,基于至少两个对话识别模块针对文本意图数据生成至少两个对话结果,包括:将文本意图数据输入风险预警模块、对话规则引擎模块、搜索引擎模块、知识图谱模块和心理咨询师对话模型模块,得到对应的对话结果。
具体的,风险预警模块:依据好心情平台的患者聊天危机预警模块,和树洞救援团长期监控微博自杀干预机器人监控经验,定义了11级别的自残自杀风险等级,5级别以上就会进入监控平台,7级以上触发电话报警机制。
对话规则引擎:常见问候语引擎,人物基本信息引擎,黑名单信息引擎,后期会叠加好心情量表问答体系。
搜索引擎模块:用户输入通过模型获得句向量标识与ES数据库(ElasticSearch)库中的预置问题计算余弦相似度获得前五的回复候选集,通过结合用户电子病历的标签映射,来对预置回复进行重排序和改写最终获取答案。
知识图谱模块:此模块主要包括药品知识图谱、疾病知识图谱、抑郁症指南知识图谱三个图谱模块,通过识别用户查询知识图谱意向,查询相对应的知识图谱信息进行返回。
心理咨询师对话模型模块:本模块基于BERT模型进行训练,分为pre-training阶段和fine-tuning阶段两阶段。在pre-training阶段,把ES库、知识图谱等各模块的无标签基础问答数据灌入模型进行训练,并且把好心情平台上产生的图文、电话、视频订单记录进行处理,以便加入训练集。对文本聊天记录进行对话问答切割;对电话订单音频进行语音转文字,并对话问答切割;对视频订单,提取音频信息进行转文字,对话问答切割,并且对好心情这部分数据,进行用户画像、咨询师画像标签标注,以便下一阶段训练。在fine-tuning阶段,给BERT模型添加输出层,使用预训练的参数对模型进行初始化,然后利用好心情有标签的数据集上对模型的参数进行微调,并且这个过程中,专门提取女咨询师的对话内容进行训练。
例如,输入的文本为:“我很想哭”,则识别该文本的情绪分类为:“低落”,将“我很想哭”分别输入风险预警模块、对话规则引擎模块、搜索引擎模块、知识图谱模块和心理咨询师对话模型模块,可以得到风险预警模块、对话规则引擎模块、搜索引擎模块、知识图谱模块和心理咨询师对话模型模块对应的对话结果。
步骤204:基于至少两个对话结果进行打分,得到至少两个对话结果对应的评分。
在一种可能的实现方式中,基于至少两个对话结果进行打分,得到至少两个对话结果对应的评分,包括:基于文本意图数据对至少两个对话结果进行打分,得到至少两个对话结果对应的评分。
在实际应用中,可以使用情绪对话策略打分重排模块对风险预警模块、对话规则引擎模块、搜索引擎模块、知识图谱模块和心理咨询师对话模型模块对应的对话结果进行打分。其中,情绪对话策略打分重排模块的情绪对话策略基于助人技术理论,提供“探索-安抚-行动”三阶段情绪支持,结合情绪检测模块的32种情绪识别,对上面各模块的答案输出进行打分重排序。
步骤205:基于至少两个对话结果对应的评分确定目标对话结果。
例如,输入的文本为:“我很想哭”,则识别该文本的情绪分类为:“低落”,将“我很想哭”分别输入风险预警模块、对话规则引擎模块、搜索引擎模块、知识图谱模块和心理咨询师对话模型模块,可以得到风险预警模块、对话规则引擎模块、搜索引擎模块、知识图谱模块和心理咨询师对话模型模块对应的对话结果。对风险预警模块、对话规则引擎模块、搜索引擎模块、知识图谱模块和心理咨询师对话模型模块对应的对话结果进行打分得到80、20、70、50、90。则选择得分最高的90分作为目标对话结果。
需要说明的是,还可以加入其他的评分规则,多种评分规则共同进行。
在一种可能的实现方式中,基于至少两个对话结果对应的评分确定目标对话结果,包括:在风险预警模块的对话结果为第一警报的情况下,将第一警报作为目标对话结果,在风险预警模块的对话结果不为第一警报的情况下,获取对话规则引擎模块、搜索引擎模块、知识图谱模块和心理咨询师对话模型模块对应的对话结果的评分,将对话结果的评分进行排序,得到排序结果,基于排序结果从对话结果中确定目标对话结果。
例如,输入的文本为:“我很想哭”,则识别该文本的情绪分类为:“低落”,将“我很想哭”分别输入风险预警模块、对话规则引擎模块、搜索引擎模块、知识图谱模块和心理咨询师对话模型模块,可以得到风险预警模块、对话规则引擎模块、搜索引擎模块、知识图谱模块和心理咨询师对话模型模块对应的对话结果。对风险预警模块、对话规则引擎模块、搜索引擎模块、知识图谱模块和心理咨询师对话模型模块对应的对话结果进行打分得到70、20、70、50、90。因为存在规则:风险预警模块的评分大于70则优先将风险预警模块的对话结果确定为目标对话结果,则将风险预警模块的对话结果确定为目标对话结果。
进一步的,在确定目标对话结果之后,还可以通过情绪对话修辞与回复输出模块:针对选出的目标对话结果,添加相应的语气词、昵称等信息,如“哦”、“哇”、“吗”、“嗯嗯”、“心心”、“老大”等信息,保持情感语气。
本说明书实施例提供对话生成方法、装置、设备及存储介质,其中对话生成方法包括:获取初始数据,对初始数据进行识别确定文本数据,基于预设处理规则对文本数据进行处理,确定文本意图数据,基于至少两个对话识别模块针对文本意图数据生成至少两个对话结果,基于至少两个对话结果进行打分,得到至少两个对话结果对应的评分,基于至少两个对话结果对应的评分确定目标对话结果。通过获取初始数据,对初始数据进行识别确定文本数据,基于预设处理规则对文本数据进行处理,确定文本意图数据,基于至少两个对话识别模块针对文本意图数据生成至少两个对话结果,基于至少两个对话结果对应的评分确定目标对话结果。针对传统机器人没有咨询师人格特点,无法识别和预警自残自杀等风险,没有情绪对话支持能力,本发明通过好心情平台大量的咨询个案及咨询师专业经验,和丰富的危机干预经验,不对训练优化完善技术方案,结合患者电子病历信息,以及基于情绪对话模型生成对话能力,达到了很好的情感陪伴效果。
与上述方法实施例相对应,本说明书还提供了对话生成装置实施例,图4示出了本说明书一个实施例提供的一种对话生成装置的结构示意图。如图4所示,该装置包括:
数据获取模块401,被配置为获取初始数据,对初始数据进行识别确定文本数据;
意图识别模块402,被配置为基于预设处理规则对文本数据进行处理,确定文本意图数据;
结果生成模块403,被配置为基于至少两个对话识别模块针对文本意图数据生成至少两个对话结果;
结果打分模块404,被配置为基于至少两个对话结果进行打分,得到至少两个对话结果对应的评分;
对话确定模块405,被配置为基于至少两个对话结果对应的评分确定目标对话结果。
在一种可能的实现方式中,数据获取模块401,还被配置为:
确定初始数据的类型信息,并根据类型信息确定目标识别方式;
基于目标识别方式,对初始数据进行识别确定文本数据。
在一种可能的实现方式中,数据获取模块401,还被配置为:
根据类型信息确定初始数据的类型,在初始数据的类型为图片数据的情况下,确定目标识别方式为图像识别方式;
在初始数据的类型为音频数据的情况下,确定后目标识别方式为语音识别方式。
在一种可能的实现方式中,意图识别模块402,还被配置为:
基于文本数据确定人物标识信息,并基于人物标识信息调取人物历史数据;
基于人物历史数据和注意力机制确定文本意图数据。
在一种可能的实现方式中,结果生成模块403,还被配置为:
对话识别模块包括:风险预警模块、对话规则引擎模块、搜索引擎模块、知识图谱模块和心理咨询师对话模型模块;
相应的,基于至少两个对话识别模块针对文本意图数据生成至少两个对话结果,包括:
将文本意图数据输入风险预警模块、对话规则引擎模块、搜索引擎模块、知识图谱模块和心理咨询师对话模型模块,得到对应的对话结果。
在一种可能的实现方式中,结果打分模块404,还被配置为:
基于文本意图数据对至少两个对话结果进行打分,得到至少两个对话结果对应的评分。
在一种可能的实现方式中,对话确定模块405,还被配置为:
在风险预警模块的对话结果为第一警报的情况下,将第一警报作为目标对话结果;
在风险预警模块的对话结果不为第一警报的情况下,获取对话规则引擎模块、搜索引擎模块、知识图谱模块和心理咨询师对话模型模块对应的对话结果的评分;
将对话结果的评分进行排序,得到排序结果;
基于排序结果从对话结果中确定目标对话结果。
本说明书实施例提供对话生成方法、装置、设备及存储介质,其中对话生成装置包括:获取初始数据,对初始数据进行识别确定文本数据,基于预设处理规则对文本数据进行处理,确定文本意图数据,基于至少两个对话识别模块针对文本意图数据生成至少两个对话结果,基于至少两个对话结果进行打分,得到至少两个对话结果对应的评分,基于至少两个对话结果对应的评分确定目标对话结果。通过获取初始数据,对初始数据进行识别确定文本数据,基于预设处理规则对文本数据进行处理,确定文本意图数据,基于至少两个对话识别模块针对文本意图数据生成至少两个对话结果,基于至少两个对话结果对应的评分确定目标对话结果。实现对不良倾向的判定,从而进行相应的对话操作。
上述为本实施例的一种对话生成装置的示意性方案。需要说明的是,该对话生成装置的技术方案与上述的对话生成方法的技术方案属于同一构思,对话生成装置的技术方案未详细描述的细节内容,均可以参见上述对话生成方法的技术方案的描述。
图5示出了根据本说明书一个实施例提供的一种计算设备500的结构框图。该计算设备500的部件包括但不限于存储器510和处理器520。处理器520与存储器510通过总线530相连接,数据库550用于保存数据。
计算设备500还包括接入设备540,接入设备540使得计算设备500能够经由一个或多个网络560通信。这些网络的示例包括公用交换电话网(PSTN,Public SwitchedTelephone Network)、局域网(LAN,Local Area Network)、广域网(WAN,Wide AreaNetwork)、个域网(PAN,Personal Area Network)或诸如因特网的通信网络的组合。接入设备540可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC,networkinterface controller))中的一个或多个,诸如IEEE802.11无线局域网(WLAN,WirelessLocal Area Network)无线接口、全球微波互联接入(Wi-MAX,WorldwideInteroperability for Microwave Access)接口、以太网接口、通用串行总线(USB,Universal Serial Bus)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC,Near FieldCommunication)。
在本说明书的一个实施例中,计算设备500的上述部件以及图5中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图5所示的计算设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
计算设备500可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或个人计算机(PC,Personal Computer)的静止计算设备。计算设备500还可以是移动式或静止式的服务器。
其中,处理器520用于执行如下计算机可执行指令,该计算机可执行指令被处理器执行时实现上述对话生成方法的步骤。上述为本实施例的一种计算设备的示意性方案。需要说明的是,该计算设备的技术方案与上述的对话生成方法的技术方案属于同一构思,计算设备的技术方案未详细描述的细节内容,均可以参见上述对话生成方法的技术方案的描述。
本说明书一实施例还提供一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现上述对话生成方法的步骤。
上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的对话生成方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述对话生成方法的技术方案的描述。
本说明书一实施例还提供一种计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行上述对话生成方法的步骤。
上述为本实施例的一种计算机程序的示意性方案。需要说明的是,该计算机程序的技术方案与上述的对话生成方法的技术方案属于同一构思,计算机程序的技术方案未详细描述的细节内容,均可以参见上述对话生成方法的技术方案的描述。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本说明书实施例并不受所描述的动作顺序的限制,因为依据本说明书实施例,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本说明书实施例所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上公开的本说明书优选实施例只是用于帮助阐述本说明书。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书实施例的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本说明书实施例的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本说明书。本说明书仅受权利要求书及其全部范围和等效物的限制。
Claims (10)
1.一种对话生成方法,其特征在于,包括:
获取初始数据,对所述初始数据进行识别确定文本数据;
基于预设处理规则对所述文本数据进行处理,确定文本意图数据;
基于至少两个对话识别模块针对所述文本意图数据生成至少两个对话结果;
基于所述至少两个对话结果进行打分,得到所述至少两个对话结果对应的评分;
基于所述至少两个对话结果对应的评分确定目标对话结果。
2.根据权利要求1所述的方法,其特征在于,所述获取初始数据,对所述初始数据进行识别确定文本数据,包括:
确定所述初始数据的类型信息,并根据所述类型信息确定目标识别方式;
基于所述目标识别方式,对所述初始数据进行识别确定文本数据。
3.根据权利要求2所述的方法,其特征在于,所述确定所述初始数据的类型信息,并根据所述类型信息确定目标识别方式,包括:
根据所述类型信息确定所述初始数据的类型,在所述初始数据的类型为图片数据的情况下,确定所述目标识别方式为图像识别方式;
在所述初始数据的类型为音频数据的情况下,确定后所述目标识别方式为语音识别方式。
4.根据权利要求1所述的方法,其特征在于,所述基于预设处理规则对所述文本数据进行处理,确定文本意图数据,包括:
基于所述文本数据确定人物标识信息,并基于所述人物标识信息调取人物历史数据;
基于所述人物历史数据和注意力机制确定文本意图数据。
5.根据权利要求1所述的方法,其特征在于,所述对话识别模块包括:风险预警模块、对话规则引擎模块、搜索引擎模块、知识图谱模块和心理咨询师对话模型模块;
相应的,所述基于至少两个对话识别模块针对所述文本意图数据生成至少两个对话结果,包括:
将所述文本意图数据输入所述风险预警模块、对话规则引擎模块、搜索引擎模块、知识图谱模块和心理咨询师对话模型模块,得到对应的对话结果。
6.根据权利要求1所述的方法,其特征在于,所述基于所述至少两个对话结果进行打分,得到所述至少两个对话结果对应的评分,包括:
基于所述文本意图数据对所述至少两个对话结果进行打分,得到所述至少两个对话结果对应的评分。
7.根据权利要求5所述的方法,其特征在于,所述基于所述至少两个对话结果对应的评分确定目标对话结果,包括:
在所述风险预警模块的对话结果为第一警报的情况下,将所述第一警报作为所述目标对话结果;
在所述风险预警模块的对话结果不为第一警报的情况下,获取所述对话规则引擎模块、所述搜索引擎模块、所述知识图谱模块和所述心理咨询师对话模型模块对应的对话结果的评分;
将所述对话结果的评分进行排序,得到排序结果;
基于所述排序结果从所述对话结果中确定目标对话结果。
8.一种对话生成装置,其特征在于,包括:
模块,被配置为获取初始数据,对所述初始数据进行识别确定文本数据;
基于预设处理规则对所述文本数据进行处理,确定文本意图数据;
基于至少两个对话识别模块针对所述文本意图数据生成至少两个对话结果;
基于所述至少两个对话结果进行打分,得到所述至少两个对话结果对应的评分;
基于所述至少两个对话结果对应的评分确定目标对话结果。
9.一种计算设备,其特征在于,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现权利要求1至7任意一项所述对话生成方法的步骤。
10.一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现权利要求1至7任意一项所述对话生成方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310714635.7A CN116483981A (zh) | 2023-06-16 | 2023-06-16 | 对话生成方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310714635.7A CN116483981A (zh) | 2023-06-16 | 2023-06-16 | 对话生成方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116483981A true CN116483981A (zh) | 2023-07-25 |
Family
ID=87219807
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310714635.7A Pending CN116483981A (zh) | 2023-06-16 | 2023-06-16 | 对话生成方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116483981A (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110334201A (zh) * | 2019-07-18 | 2019-10-15 | 中国工商银行股份有限公司 | 一种意图识别方法、装置及系统 |
CN113468306A (zh) * | 2021-06-30 | 2021-10-01 | 西安乾阳电子科技有限公司 | 语音对话方法、装置、电子设备及存储介质 |
CN113742463A (zh) * | 2021-07-27 | 2021-12-03 | 上海携旅信息技术有限公司 | 旅游场景下的对话预测方法、装置、电子设备、存储介质 |
CN113806499A (zh) * | 2020-12-30 | 2021-12-17 | 京东科技控股股份有限公司 | 电话作业的培训方法、装置、电子设备和存储介质 |
CN114356860A (zh) * | 2022-01-06 | 2022-04-15 | 支付宝(杭州)信息技术有限公司 | 对话生成方法及装置 |
CN114416934A (zh) * | 2021-12-24 | 2022-04-29 | 北京百度网讯科技有限公司 | 多模态的对话生成模型的训练方法、装置及电子设备 |
CN114999610A (zh) * | 2022-03-31 | 2022-09-02 | 华东师范大学 | 基于深度学习的情绪感知与支持的对话系统构建方法 |
US20220383854A1 (en) * | 2020-07-31 | 2022-12-01 | Wiz Holdings Pte. Ltd. | Intent recognition method and intent recognition system having self learning capability |
-
2023
- 2023-06-16 CN CN202310714635.7A patent/CN116483981A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110334201A (zh) * | 2019-07-18 | 2019-10-15 | 中国工商银行股份有限公司 | 一种意图识别方法、装置及系统 |
US20220383854A1 (en) * | 2020-07-31 | 2022-12-01 | Wiz Holdings Pte. Ltd. | Intent recognition method and intent recognition system having self learning capability |
CN113806499A (zh) * | 2020-12-30 | 2021-12-17 | 京东科技控股股份有限公司 | 电话作业的培训方法、装置、电子设备和存储介质 |
CN113468306A (zh) * | 2021-06-30 | 2021-10-01 | 西安乾阳电子科技有限公司 | 语音对话方法、装置、电子设备及存储介质 |
CN113742463A (zh) * | 2021-07-27 | 2021-12-03 | 上海携旅信息技术有限公司 | 旅游场景下的对话预测方法、装置、电子设备、存储介质 |
CN114416934A (zh) * | 2021-12-24 | 2022-04-29 | 北京百度网讯科技有限公司 | 多模态的对话生成模型的训练方法、装置及电子设备 |
CN114356860A (zh) * | 2022-01-06 | 2022-04-15 | 支付宝(杭州)信息技术有限公司 | 对话生成方法及装置 |
CN114999610A (zh) * | 2022-03-31 | 2022-09-02 | 华东师范大学 | 基于深度学习的情绪感知与支持的对话系统构建方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109829039B (zh) | 智能聊天方法、装置、计算机设备及存储介质 | |
US9635178B2 (en) | Coordinating voice calls between representatives and customers to influence an outcome of the call | |
CN109857848A (zh) | 交互内容生成方法、装置、计算机设备及存储介质 | |
CN110046230B (zh) | 生成推荐话术集合的方法、推荐话术的方法和装置 | |
US20190171928A1 (en) | Dynamically managing artificial neural networks | |
CN110347802B (zh) | 一种文本分析方法及装置 | |
CN113610231B (zh) | 语言模型训练方法及装置和词组推荐方法及装置 | |
CN110476169A (zh) | 在会话中提供情感关怀 | |
CN110472008B (zh) | 智能交互方法以及装置 | |
CN109871440B (zh) | 基于语义分析的智能提示方法、装置及设备 | |
CN116882372A (zh) | 文本生成方法、装置、电子设备以及存储介质 | |
CN112115248B (zh) | 一种从对话语料中抽取对话策略结构的方法及系统 | |
CN113076423A (zh) | 数据处理方法及装置、数据查询方法及装置 | |
CN110717021A (zh) | 人工智能面试中获取输入文本和相关装置 | |
CN112837772A (zh) | 一种预问诊病历生成方法及装置 | |
CN115083434A (zh) | 一种情绪识别方法、装置、计算机设备及存储介质 | |
CN112287082A (zh) | 结合rpa与ai的数据的处理方法、装置、设备及存储介质 | |
CN112364622A (zh) | 对话文本分析方法、装置、电子装置及存储介质 | |
CN112632248A (zh) | 问答方法、装置、计算机设备和存储介质 | |
CN112685551B (zh) | 语料库构建方法、聊天机器人会话方法及相关装置 | |
CN112233648B (zh) | 结合rpa及ai的数据的处理方法、装置、设备及存储介质 | |
CN112860995B (zh) | 交互方法、装置、客户端、服务器以及存储介质 | |
CN110197196B (zh) | 问题处理方法、装置、电子设备以及存储介质 | |
CN114491010A (zh) | 信息抽取模型的训练方法及装置 | |
CN116483981A (zh) | 对话生成方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20240105 Address after: Room 1502, 13th Floor, No. 52 North Fourth Ring West Road, Haidian District, Beijing, 102200 Applicant after: Good Feeling Health Industry Group Co.,Ltd. Address before: Room 1101-2, Building 1, Yard 22, Longshui Road, Changping District, Beijing 102200 Applicant before: Beijing Haoxin Internet Hospital Co.,Ltd. |