CN114239605A - 辅助沟通内容生成方法、装置、设备及存储介质 - Google Patents
辅助沟通内容生成方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN114239605A CN114239605A CN202111562615.XA CN202111562615A CN114239605A CN 114239605 A CN114239605 A CN 114239605A CN 202111562615 A CN202111562615 A CN 202111562615A CN 114239605 A CN114239605 A CN 114239605A
- Authority
- CN
- China
- Prior art keywords
- auxiliary communication
- attribute
- target communication
- communication object
- communication
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Machine Translation (AREA)
Abstract
本发明涉及人工智能领域,公开了一种辅助沟通内容生成方法、装置、设备及存储介质。该方法包括:获取目标沟通对象的属性信息;根据属性信息,采用预置分类算法计算目标沟通对象对应的属性分值,并根据属性分值,设置目标沟通对象对应性格标签;获取目标沟通对象对应的对话文本;通过预置神经网络模型,提取对话文本的上下文特征,并根据上下文特征,识别目标沟通对象对应的对话意图;从预置数据库中检索对话意图对应的辅助沟通语料,并根据性格标签,对辅助沟通语料进行表达风格转换,得到辅助沟通内容。本发明实现了辅助沟通推送,提升了针对不同对象的沟通效率和沟通针对性。
Description
技术领域
本发明涉及人工智能领域,尤其涉及一种辅助沟通内容生成方法、装置、设备及存储介质。
背景技术
随着线上沟通软件的普及,线上沟通成为了当前人际交往的一个主流,而在线上交流的意图识别和针对性表达中,比如在家庭中由于教育、生活方式、生活阅历的不同导致子女与父母在思想方法、价值观念、生活态度、兴趣爱好方面存在的心理距离,在对家庭事务的处理中存在一定的差异,未能及时理解对方表达的含义。即当前线上沟通缺少一种针对辅助识别沟通意图并进行辅助沟通的方法。
发明内容
本发明的主要目的在于解决当前线上沟通缺少一种辅助识别对象沟通意图并进行辅助沟通的方法的技术问题。
本发明第一方面提供了一种辅助沟通内容生成方法,包括:获取目标沟通对象的属性信息;根据属性信息,采用预置分类算法计算目标沟通对象对应的属性分值,并根据属性分值,设置目标沟通对象对应性格标签;获取目标沟通对象对应的对话文本;通过预置神经网络模型,提取对话文本的上下文特征,并根据上下文特征,识别目标沟通对象对应的对话意图;从预置数据库中检索对话意图对应的辅助沟通语料,并根据性格标签,对辅助沟通语料进行表达风格转换,得到辅助沟通内容。
可选的,在本发明第一方面的第一种实现方式中,根据属性信息,采用预置分类算法计算目标沟通对象对应的属性分值包括:提取属性信息中的多个属性字段,并识别各属性字段之间的关联关系;根据关联关系,采用各属性字段构建关联网络结构,并遍历关联网络结构,得到分支遍历结果;采用分支遍历结构,计算各属性字段的关联权重,并根据各关联权重计算目标沟通对象对应的属性分值。
可选的,在本发明第一方面的第二种实现方式中,在根据关联关系,采用各属性字段构建关联网络结构之后,还包括:将关联网络分割为多个初始局部结构,并分别计算各初始局部结构对应的第一节点得分;根据第一节点得分,依次判断各初始局部结构是否为最优局部结构;若不为最优局部结构,则按照预置规则对对应的初始局部结构进行修改,并计算修改后对应的初始局部结构的第二节点得分;若第二节点得分大于第一节点得分,则将对应的初始局部结构的相邻结构作为备选局部结构;计算备选局部结构的第三节点得分,并将第三节点得分相对于第一节点得分增加幅度最大的备选局部结构作为最优局部结构;基于各最优局部结构,更新关联网络结构。
可选的,在本发明第一方面的第三种实现方式中,通过预置神经网络模型,提取对话文本的上下文特征包括:通过预置神经网络,对对话文本进行划分,得到多个单字和词语,并依次将各单字和各词语转换为顺序排列的分布式向量;在顺序排列的分布式向量中嵌入对应的顺序编码,并基于预置多头注意力机制,计算嵌入顺序编码的各分布式向量之间对应的注意力信息;根据注意力信息,采用各分布式向量构建注意力向量矩阵,得到对话文本的上下文特征。
可选的,在本发明第一方面的第四种实现方式中,根据上下文特征,识别目标沟通对象对应的对话意图包括:将各分布式向量作为对话节点,并根据上下文特征,对各对话节点进行两两连接,得到全连接图;通过神经网络模型,对全连接图进行调整,得到对话节点关系图;根据对话节点关系图,确定目标沟通对象对应的对话意图。
可选的,在本发明第一方面的第五种实现方式中,根据性格标签,对辅助沟通语料进行表达风格转换,得到辅助沟通内容包括:解析性格标签,得到沟通事实标签和沟通模型标签;根据沟通事实标签和沟通模型标签,从预置表达风格库中选取与辅助沟通语料相对应的表达风格;根据表达风格,对辅助沟通语料进行单字和/或词语的替换,得到辅助沟通内容。
本发明第二方面提供了一种辅助沟通内容生成装置,包括:获取模块,用于获取目标沟通对象的属性信息;设置模块,用于根据属性信息,采用预置分类算法计算目标沟通对象对应的属性分值,并根据属性分值,设置目标沟通对象对应性格标签;获取模块还用于获取目标沟通对象对应的对话文本;识别模块,用于通过预置神经网络模型,提取对话文本的上下文特征,并根据上下文特征,识别目标沟通对象对应的对话意图;转换模块,用于从预置数据库中检索对话意图对应的辅助沟通语料,并根据性格标签,对辅助沟通语料进行表达风格转换,得到辅助沟通内容。
可选的,在本发明第二方面的第一种实现方式中,设置模块包括:提取单元,用于提取属性信息中的多个属性字段,并识别各属性字段之间的关联关系;构建单元,用于根据关联关系,采用各属性字段构建关联网络结构,并遍历关联网络结构,得到分支遍历结果;计算单元,用于采用分支遍历结构,计算各属性字段的关联权重,并根据各关联权重计算目标沟通对象对应的属性分值。
可选的,在本发明第二方面的第二种实现方式中,设置模块还包括:分割单元,用于将关联网络分割为多个初始局部结构,并分别计算各初始局部结构对应的第一节点得分;判别单元,用于根据第一节点得分,依次判断各初始局部结构是否为最优局部结构;若不为最优局部结构,则按照预置规则对对应的初始局部结构进行修改,并计算修改后对应的初始局部结构的第二节点得分;若第二节点得分大于第一节点得分,则将对应的初始局部结构的相邻结构作为备选局部结构;更新单元,用于计算备选局部结构的第三节点得分,并将第三节点得分相对于第一节点得分增加幅度最大的备选局部结构作为最优局部结构;基于各最优局部结构,更新关联网络结构。
可选的,在本发明第二方面的第三种实现方式中,识别模块包括:划分单元,用于通过预置神经网络,对对话文本进行划分,得到多个单字和词语,并依次将各单字和各词语转换为顺序排列的分布式向量;嵌入单元,用于在顺序排列的分布式向量中嵌入对应的顺序编码,并基于预置多头注意力机制,计算嵌入顺序编码的各分布式向量之间对应的注意力信息;构建单元,用于根据注意力信息,采用各分布式向量构建注意力向量矩阵,得到对话文本的上下文特征。
可选的,在本发明第二方面的第四种实现方式中,识别模块还包括:连接单元,用于将各分布式向量作为对话节点,并根据上下文特征,对各对话节点进行两两连接,得到全连接图;调整单元,用于通过神经网络模型,对全连接图进行调整,得到对话节点关系图;确定单元,用于根据对话节点关系图,确定目标沟通对象对应的对话意图。
可选的,在本发明第二方面的第五种实现方式中,转换模块包括:解析单元,用于解析性格标签,得到沟通事实标签和沟通模型标签;选取单元,用于根据沟通事实标签和沟通模型标签,从预置表达风格库中选取与辅助沟通语料相对应的表达风格;替换单元,用于根据表达风格,对辅助沟通语料进行单字和/或词语的替换,得到辅助沟通内容。
本发明第三方面提供了一种辅助沟通内容生成设备,包括:存储器和至少一个处理器,存储器中存储有指令;至少一个处理器调用存储器中的指令,以使得辅助沟通内容生成设备执行上述的辅助沟通内容生成方法。
本发明的第四方面提供了一种计算机可读存储介质,计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的辅助沟通内容生成方法。
本发明提供的技术方案中,通过获取目标沟通对象的属性信息,来对目标沟通对象进行属性分值计算以设置其性格标签,再获取该目标沟通对象的对话文本,来提取其中的上下文特征,以识别目标沟通对象的对话意图,最后在数据库中检索该对话意图的辅助沟通语料,同时结合性格标签,来对检索到的辅助沟通语料进行表达风格转换,使得对不同类型沟通对象比如父母、同事、领导等进行语境的匹配,实现对目标沟通对象的辅助沟通,提升沟通过程中的真实意图识别。
附图说明
图1为本发明实施例中辅助沟通内容生成方法的第一个实施例示意图;
图2为本发明实施例中辅助沟通内容生成方法的第二个实施例示意图;
图3为本发明实施例中辅助沟通内容生成方法的第三个实施例示意图;
图4为本发明实施例中辅助沟通内容生成装置的一个实施例示意图;
图5为本发明实施例中辅助沟通内容生成装置的另一个实施例示意图;
图6为本发明实施例中辅助沟通内容生成设备的一个实施例示意图。
具体实施方式
本发明实施例提供了一种辅助沟通内容生成方法、装置、设备及存储介质,获取目标沟通对象的属性信息;根据属性信息,采用预置分类算法计算目标沟通对象对应的属性分值,并根据属性分值,设置目标沟通对象对应性格标签;获取目标沟通对象对应的对话文本;通过预置神经网络模型,提取对话文本的上下文特征,并根据上下文特征,识别目标沟通对象对应的对话意图;从预置数据库中检索对话意图对应的辅助沟通语料,并根据性格标签,对辅助沟通语料进行表达风格转换,得到辅助沟通内容。本发明实现了辅助沟通推送,提升了针对不同对象的沟通效率和沟通针对性。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明实施例中辅助沟通内容生成方法的第一个实施例包括:
101、获取目标沟通对象的属性信息;
可以理解的是,本发明的执行主体可以为辅助沟通内容生成装置,还可以是终端或者服务器,具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。
本实施例中,目标沟通对象指的是用户沟通的对象,其属性信息包括年龄、教育程度、兴趣爱好、工作、生活城市、饮食习惯等。此处,用户在登录辅助沟通系统时,新增好友并且设置每个好友的年龄、教育程度、兴趣爱好、工作、生活城市、饮食习惯等详细信息,组成属性信息,在与目标沟通对象进行沟通时,则获取该属性信息。
102、根据属性信息,采用预置分类算法计算目标沟通对象对应的属性分值,并根据属性分值,设置目标沟通对象对应性格标签;
本实施例中,针对当前与用户聊天的目标沟通对象,获取得到该目标沟通对象设置好的属性信息后,利用分类算法,比如KNN(K-Nearest Neighbor,K最邻近)、贝叶斯算法等机器学习算法对该目标沟通对象进行分类并打上不同性格标签。
比如,将客户的各项属性转为设置好的分值,统计得到的总分值作为属性分值,再经过特定的用户模型计算给客户进行评分打上不同的性格标签,包括谦逊、果断、平衡、开朗等。其中,在分类算法的持续训练过程中,可以使用CNN(Convolutional NeuralNetworks,卷积神经网络)进行不断的自动优化计算因子,在长期累积的应用中不断的优化算法,也可以人工干预调整系数进行优化。
103、获取目标沟通对象对应的对话文本;
本实施例中,在用户与目标沟通对象的沟通过程中,自动生成对话文本,比如在用户与父母沟通的对话文本,父母表达自己胃口不好、胃部有问题,针对每句话自动生成对话文本。
104、通过预置神经网络模型,提取对话文本的上下文特征,并根据上下文特征,识别目标沟通对象对应的对话意图;
本实施例中,在目标沟通对象比如家庭成员的沟通过程中,可以使用NLP(NaturalLanguage Processing,自然语言处理)、RNN(Recurrent Neural Network,循环神经网络)算法之类的神经网络模型,结合上下文中的语言场景(即上下文特征),在某些关键词语出现的时候及时识别用户对目标沟通对象的对话意图并提供建议,比如子女在与父母的沟通中含蓄的表达出胃口不好,结合之前父母提出的胃部问题,则可以确定父母胃部健康是目标沟通对应的对话意图,则及时在子女客户端提示关注父母胃部,如果子女在与父母的沟通中多次表达出希望对方可以多阅读养生健康类咨询后,则自动推送更多养生健康咨询给到子女客户端,以供辅助子女与父母的沟通。
105、从预置数据库中检索对话意图对应的辅助沟通语料,并根据性格标签,对辅助沟通语料进行表达风格转换,得到辅助沟通内容。
本实施例中,针对目标沟通对象的对话意图来检索对应的辅助沟通语料进行推送,其中,为了更贴近用户与目标沟通对象之间的沟通关系,还针对性格标签来对检索到的辅助沟通语料进行表发风格的转换。
本实施例中,在识别得到目标沟通对象的对话意图以及性格标签后,可以针对用户发送的内容进行推送。
本发明实施例中,通过获取目标沟通对象的属性信息,来对目标沟通对象进行属性分值计算以设置其性格标签,再获取该目标沟通对象的对话文本,来提取其中的上下文特征,以识别目标沟通对象的对话意图,最后在数据库中检索该对话意图的辅助沟通语料,同时结合性格标签,来对检索到的辅助沟通语料进行表达风格转换,使得对不同类型沟通对象比如父母、同事、领导等进行语境的匹配,实现对目标沟通对象的辅助沟通,提升沟通过程中的真实意图识别。
请参阅图2,本发明实施例中辅助沟通内容生成方法的第二个实施例包括:
201、获取目标沟通对象的属性信息;
202、提取属性信息中的多个属性字段,并识别各属性字段之间的关联关系;
203、根据关联关系,采用各属性字段构建关联网络结构,并遍历关联网络结构,得到分支遍历结果;
204、采用分支遍历结构,计算各属性字段的关联权重,并根据各关联权重计算目标沟通对象对应的属性分值;
本实施例中,可以采用贝叶斯的分类算法进行计算目标沟通对象的属性分值,关联网络结构可以为贝叶斯网络结构,其结构具有多个节点,以属性字段表示,对应于各属性字段之间的依赖或相关关系。其中,贝叶斯网络结构中不同属性字段以边连接,包括有向边和无向边,而有向边表示单向的依赖,无向边表示相关依赖关系,且结构学习过程中通过给定一个贝叶斯网络和每个属性字段的静态切片样本,寻找出最优的网络结构,从而用贝叶斯网络结构上的条件独立性来解释节点间的因果关系。
在一个具体例子中,采用Greedy Search寻找最优解,避免陷入局部最优。
具体如下所示:
2.4)将关联网络分割为多个初始局部结构,并分别计算各初始局部结构对应的第一节点得分;
2.5)根据第一节点得分,依次判断各初始局部结构是否为最优局部结构;
2.6)若不为最优局部结构,则按照预置规则对对应的初始局部结构进行修改,并计算修改后对应的初始局部结构的第二节点得分;
2.7)若第二节点得分大于第一节点得分,则将对应的初始局部结构的相邻结构作为备选局部结构;
2.8)并计算备选局部结构的第三节点得分,并将第三节点得分相对于第一节点得分增加幅度最大的备选局部结构作为最优局部结构;
2.9)基于各最优局部结构,更新关联网络结构。
205、根据属性分值,设置目标沟通对象对应性格标签,并获取目标沟通对象对应的对话文本;
206、通过预置神经网络,对对话文本进行划分,得到多个单字和词语,并依次将各单字和各词语转换为顺序排列的分布式向量;
207、在顺序排列的分布式向量中嵌入对应的顺序编码,并基于预置多头注意力机制,计算嵌入顺序编码的各分布式向量之间对应的注意力信息;
208、根据注意力信息,采用各分布式向量构建注意力向量矩阵,得到对话文本的上下文特征,并根据上下文特征,识别目标沟通对象对应的对话意图;
本实施例中,预置神经网络可以包括输入层、上下文自注意力层、隐变量层、嵌入层和解码层:
首先在输入层中将对话文本划分为多个单字和词语,比如“我今天胃口不太好,肚子不太舒服”,划分为“我”、“今天”、“胃口”、“不太好”、“肚子”、“不太”、舒服”;按照不同单字或者词语对对话文本的重要性程度转换成分布式向量,以权重比例表示,比如对于常规的词“我”、“今天”权重比例较低,“不太好”、“不太”、舒服”稍高,“胃口”、“肚子”权重较高,得到对应的分布式向量。
然后在嵌入层中嵌入对应的顺序编码,比如“i++”、one-hot编码、GRU编码器等,其中,采用GRU编码器隐藏层维度可以为512,将顺序排列的分布式向量:L0,L1,……,Ln经过嵌入层的编码处理后,得到由顺序编码和分布式向量组成的Ki=LRNN(Li,Hi),Hi为编码层给定的隐藏状态;
接着,采用上下文自注意力层,针对嵌入顺序编码的分布式变量,在多头注意力机制中感知每个单字和词语的先后顺序,计算各分布式向量之间的注意力信息,以注意力值Rn,具体计算公式如下所示:
Headn=Attention(QWn Q,KWn K,VWn V);
Multi-head-Attention(Q,K,V)=Con-cat(head1,...,headn)·WO;
xn=Cn+PEn,i∈[0,n);
On=MultiheadAttention(x,x,x);
其中,Wn表示第n个单字或者词语的查询Q、键K和值V矩阵的权重矩阵,Cn表示分布式向量,PEn表示第一顺序编码,headn表示多头注意力机制中,第n个头的输出。
209、从预置数据库中检索对话意图对应的辅助沟通语料,并根据性格标签,对辅助沟通语料进行表达风格转换,得到辅助沟通内容。
本发明实施例中,通过目标沟通对象设置的属性信息,来构建各个属性字段的关联网络结构,以用于计算各个属性字段之间的关联权重并确定目标沟通对象的属性分值,同时通过节点得分来对关联网络结构进行更新,准确衡量目标沟通对象的性格,并设置对应的性格标签,有利于后续生成对应表达风格的辅助沟通内容。
请参阅图3,本发明实施例中辅助沟通内容生成方法的第三个实施例包括:
301、获取目标沟通对象的属性信息;
302、根据属性信息,采用预置分类算法计算目标沟通对象对应的属性分值,并根据属性分值,设置目标沟通对象对应性格标签;
303、获取目标沟通对象对应的对话文本,并通过预置神经网络模型,提取对话文本的上下文特征;
304、将各分布式向量作为对话节点,并根据上下文特征,对各对话节点进行两两连接,得到全连接图;
本实施例中,在提取得到上下文特征后,将各个上下文特征作为对话节点,并初始化为全连接图,即对各个对话节点进行两两连接。将全连接图输入至训练好的神经网络模型后,即可输出对话节点关系图;通过神经网络模型对全连接图中的各对话节点对应的上下文信息以及各对话节点之间的连接关系进行调整,即可得到对话节点关系图;对话节点关系图中相连接的两个节点所对应的单字或词语具有上下文关联关系。其中,神经网络模型可以是一种图注意力网络模型。
305、通过神经网络模型,对全连接图进行调整,得到对话节点关系图;
另外,为了避免全连接图中各对话节点之间的连接过于稠密,影响各个对话节点之间特征的传播,可以利用稀疏邻接矩阵的更新方式,对全连接图进行调整,即可得到对话节点关系图,比如可以在更新过程中动态地删除一些连接边,以确保每个对话节点只连接到密切相关的其他对话节点。在调整过程中,根据注意力系数仅保留前j个邻居节点的连接边。j值的选取公式如下:J=(m/2)+1,其中,m表示第m个节点的索引号,[]表示取整函数。
具体的,可以通过稀疏GAT来对全连接图进行更新,具体如下所示:
其中,Nm表示第m个节点的前j个相邻对话节点,γlk和Wlk分别是第l层的参数向量和矩阵,φ和Φ分别是LeakyReLU和ELU激活函数,mb表示注意力头的数目,表示xl m是第l层中第m个注意力头计算的归一化系数。
306、根据对话节点关系图,确定目标沟通对象对应的对话意图;
本实施例中,可以根据得到的对话节点关系图,来确定用户与目标沟通对象在本次对话中的对话意图。具体可以对对话节点关系图中各对话节点对应的向量表示进行融合,得到用于表征目标沟通对象的对话意图的向量表示。
307、从预置数据库中检索对话意图对应的辅助沟通语料,并解析性格标签,得到沟通事实标签和沟通模型标签;
本实施例中,预先设置多个原始的性格标签,然后针对不同目标沟通对象识别到的性格标签在原始的性格标签中进行选择,即可得到对应的沟通事实标签和沟通模型标签。其中,原始的性格标签可以包括:性别、年龄、地域、兴趣特征(兴趣偏好、系统使用习惯等)、社会特征(婚姻家庭、社交关系等);沟通事实标签可以通过文本挖掘算法和统计分析算法,从中抽取并构建得到;沟通模型标签可以通过基于建立的用户事实标签,以统计分析算法和/或语义分析算法训练得到沟通模型标签。
308、根据沟通事实标签和沟通模型标签,从预置表达风格库中选取与辅助沟通语料相对应的表达风格;
本实施例中,表达风格库可以通过爬虫工具获取网络中与不同风格的沟通相关的用户数据作为训练样本,例如微博、豆瓣、百度贴吧等数据,按照不同的用户年龄、性别、身份(比如父亲、母亲、领导、同事、兄弟姐妹等)进行划分;将训练样本输入预设的表达风格模型进行训练,得到不同的表达风格模型。其中,不同表达风格模型对应有不同类型的表达风格。根据沟通事实标签和沟通模型标签作为索引在表达风格库中进行查找,即可查找到对应的表达风格。
309、根据表达风格,对辅助沟通语料进行单字和/或词语的替换,得到辅助沟通内容。
本实施例中,不同的单字和词语用在相同的表达意义上,具有不同的风格和语气,此处根据用户与目标沟通对象的关系,来选取不同的用词来表达相同的意思,比如上司对下属,用语采用严肃严谨的表达风格,晚辈对长辈,则用于采用谦卑有礼的表达风格。
本发明实施例中,通过人工智能中的多头注意力机制,来提取对话文本的上下文特征,然后以对话节点对应的全连接图来识别目标沟通对象的对话意图,最终结合性格标签,对对话意图筛选到的辅助沟通语料进行表达单字和/或词语的替换,得到适用于目标沟通对象的辅助沟通内容。
上面对本发明实施例中辅助沟通内容生成方法进行了描述,下面对本发明实施例中辅助沟通内容生成装置进行描述,请参阅图4,本发明实施例中辅助沟通内容生成装置一个实施例包括:
获取模块401,用于获取目标沟通对象的属性信息;
设置模块402,用于根据属性信息,采用预置分类算法计算目标沟通对象对应的属性分值,并根据属性分值,设置目标沟通对象对应性格标签;
获取模块401还用于获取目标沟通对象对应的对话文本;
识别模块403,用于通过预置神经网络模型,提取对话文本的上下文特征,并根据上下文特征,识别目标沟通对象对应的对话意图;
转换模块404,用于从预置数据库中检索对话意图对应的辅助沟通语料,并根据性格标签,对辅助沟通语料进行表达风格转换,得到辅助沟通内容。
本发明实施例中,通过获取目标沟通对象的属性信息,来对目标沟通对象进行属性分值计算以设置其性格标签,再获取该目标沟通对象的对话文本,来提取其中的上下文特征,以识别目标沟通对象的对话意图,最后在数据库中检索该对话意图的辅助沟通语料,同时结合性格标签,来对检索到的辅助沟通语料进行表达风格转换,使得对不同类型沟通对象比如父母、同事、领导等进行语境的匹配,实现对目标沟通对象的辅助沟通,提升沟通过程中的真实意图识别。
请参阅图5,本发明实施例中辅助沟通内容生成装置的另一个实施例包括:
获取模块401,用于获取目标沟通对象的属性信息;
设置模块402,用于根据属性信息,采用预置分类算法计算目标沟通对象对应的属性分值,并根据属性分值,设置目标沟通对象对应性格标签;
获取模块401还用于获取目标沟通对象对应的对话文本;
识别模块403,用于通过预置神经网络模型,提取对话文本的上下文特征,并根据上下文特征,识别目标沟通对象对应的对话意图;
转换模块404,用于从预置数据库中检索对话意图对应的辅助沟通语料,并根据性格标签,对辅助沟通语料进行表达风格转换,得到辅助沟通内容。
具体的,设置模块402包括:
提取单元4021,用于提取属性信息中的多个属性字段,并识别各属性字段之间的关联关系;
构建单元4022,用于根据关联关系,采用各属性字段构建关联网络结构,并遍历关联网络结构,得到分支遍历结果;
计算单元4023,用于采用分支遍历结构,计算各属性字段的关联权重,并根据各关联权重计算目标沟通对象对应的属性分值。
具体的,设置模块402还包括:
分割单元4024,用于将关联网络分割为多个初始局部结构,并分别计算各初始局部结构对应的第一节点得分;
判别单元4025,用于根据第一节点得分,依次判断各初始局部结构是否为最优局部结构;若不为最优局部结构,则按照预置规则对对应的初始局部结构进行修改,并计算修改后对应的初始局部结构的第二节点得分;若第二节点得分大于第一节点得分,则将对应的初始局部结构的相邻结构作为备选局部结构;
更新单元4026,用于计算备选局部结构的第三节点得分,并将第三节点得分相对于第一节点得分增加幅度最大的备选局部结构作为最优局部结构;基于各最优局部结构,更新关联网络结构。
具体的,识别模块403包括:
划分单元4031,用于通过预置神经网络,对对话文本进行划分,得到多个单字和词语,并依次将各单字和各词语转换为顺序排列的分布式向量;
嵌入单元4032,用于在顺序排列的分布式向量中嵌入对应的顺序编码,并基于预置多头注意力机制,计算嵌入顺序编码的各分布式向量之间对应的注意力信息;
构建单元4033,用于根据注意力信息,采用各分布式向量构建注意力向量矩阵,得到对话文本的上下文特征。
具体的,识别模块403还包括:
连接单元4034,用于将各分布式向量作为对话节点,并根据上下文特征,对各对话节点进行两两连接,得到全连接图;
调整单元4035,用于通过神经网络模型,对全连接图进行调整,得到对话节点关系图;
确定单元4036,用于根据对话节点关系图,确定目标沟通对象对应的对话意图。
具体的,转换模块404包括:
解析单元4041,用于解析性格标签,得到沟通事实标签和沟通模型标签;
选取单元4042,用于根据沟通事实标签和沟通模型标签,从预置表达风格库中选取与辅助沟通语料相对应的表达风格;
替换单元4043,用于根据表达风格,对辅助沟通语料进行单字和/或词语的替换,得到辅助沟通内容。
本发明实施例中,通过目标沟通对象设置的属性信息,来构建各个属性字段的关联网络结构,以用于计算各个属性字段之间的关联权重并确定目标沟通对象的属性分值,同时通过节点得分来对关联网络结构进行更新,准确衡量目标沟通对象的性格,并设置对应的性格标签,有利于后续生成对应表达风格的辅助沟通内容;另外,通过人工智能中的多头注意力机制,来提取对话文本的上下文特征,然后以对话节点对应的全连接图来识别目标沟通对象的对话意图,最终结合性格标签,对对话意图筛选到的辅助沟通语料进行表达单字和/或词语的替换,得到适用于目标沟通对象的辅助沟通内容。
上面图4和图5从模块化功能实体的角度对本发明实施例中的辅助沟通内容生成装置进行详细描述,下面从硬件处理的角度对本发明实施例中辅助沟通内容生成设备进行详细描述。
图6是本发明实施例提供的一种辅助沟通内容生成设备的结构示意图,该辅助沟通内容生成设备600可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)610(例如,一个或一个以上处理器)和存储器620,一个或一个以上存储应用程序633或数据632的存储介质630(例如一个或一个以上海量存储设备)。其中,存储器620和存储介质630可以是短暂存储或持久存储。存储在存储介质630的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对辅助沟通内容生成设备600中的一系列指令操作。更进一步地,处理器610可以设置为与存储介质630通信,在辅助沟通内容生成设备600上执行存储介质630中的一系列指令操作。
辅助沟通内容生成设备600还可以包括一个或一个以上电源640,一个或一个以上有线或无线网络接口650,一个或一个以上输入输出接口660,和/或,一个或一个以上操作系统631,例如Windows Serve,Mac OS X,Unix,Linux,FreeBSD等等。本领域技术人员可以理解,图6示出的辅助沟通内容生成设备结构并不构成对辅助沟通内容生成设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
本发明还提供一种辅助沟通内容生成设备,计算机设备包括存储器和处理器,存储器中存储有计算机可读指令,计算机可读指令被处理器执行时,使得处理器执行上述各实施例中的辅助沟通内容生成方法的步骤。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,计算机可读存储介质中存储有指令,当指令在计算机上运行时,使得计算机执行辅助沟通内容生成方法的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种辅助沟通内容生成方法,其特征在于,所述辅助沟通内容生成方法包括:
获取目标沟通对象的属性信息;
根据所述属性信息,采用预置分类算法计算所述目标沟通对象对应的属性分值,并根据所述属性分值,设置所述目标沟通对象对应性格标签;
获取所述目标沟通对象对应的对话文本;
通过预置神经网络模型,提取所述对话文本的上下文特征,并根据所述上下文特征,识别所述目标沟通对象对应的对话意图;
从预置数据库中检索所述对话意图对应的辅助沟通语料,并根据所述性格标签,对所述辅助沟通语料进行表达风格转换,得到辅助沟通内容。
2.根据权利要求1所述的辅助沟通内容生成方法,其特征在于,所述根据所述属性信息,采用预置分类算法计算所述目标沟通对象对应的属性分值包括:
提取所述属性信息中的多个属性字段,并识别各所述属性字段之间的关联关系;
根据所述关联关系,采用各所述属性字段构建关联网络结构,并遍历所述关联网络结构,得到分支遍历结果;
采用所述分支遍历结构,计算各所述属性字段的关联权重,并根据各所述关联权重计算所述目标沟通对象对应的属性分值。
3.根据权利要求2所述的辅助沟通内容生成方法,其特征在于,在所述根据所述关联关系,采用各所述属性字段构建关联网络结构之后,还包括:
将所述关联网络分割为多个初始局部结构,并分别计算各所述初始局部结构对应的第一节点得分;
根据所述第一节点得分,依次判断各所述初始局部结构是否为最优局部结构;
若不为最优局部结构,则按照预置规则对对应的初始局部结构进行修改,并计算修改后对应的初始局部结构的第二节点得分;
若所述第二节点得分大于所述第一节点得分,则将对应的初始局部结构的相邻结构作为备选局部结构;
计算所述备选局部结构的第三节点得分,并将所述第三节点得分相对于所述第一节点得分增加幅度最大的备选局部结构作为最优局部结构;
基于各所述最优局部结构,更新关联网络结构。
4.根据权利要求1所述的辅助沟通内容生成方法,其特征在于,所述通过预置神经网络模型,提取所述对话文本的上下文特征包括:
通过预置神经网络,对所述对话文本进行划分,得到多个单字和词语,并依次将各所述单字和各所述词语转换为顺序排列的分布式向量;
在顺序排列的分布式向量中嵌入对应的顺序编码,并基于预置多头注意力机制,计算嵌入顺序编码的各所述分布式向量之间对应的注意力信息;
根据所述注意力信息,采用各所述分布式向量构建注意力向量矩阵,得到所述对话文本的上下文特征。
5.根据权利要求4所述的辅助沟通内容生成方法,其特征在于,所述根据所述上下文特征,识别所述目标沟通对象对应的对话意图包括:
将各所述分布式向量作为对话节点,并根据所述上下文特征,对各所述对话节点进行两两连接,得到全连接图;
通过所述神经网络模型,对所述全连接图进行调整,得到对话节点关系图;
根据所述对话节点关系图,确定所述目标沟通对象对应的对话意图。
6.根据权利要求1-5中任一项所述的辅助沟通内容生成方法,其特征在于,所述根据所述性格标签,对所述辅助沟通语料进行表达风格转换,得到辅助沟通内容包括:
解析所述性格标签,得到沟通事实标签和沟通模型标签;
根据所述沟通事实标签和所述沟通模型标签,从预置表达风格库中选取与所述辅助沟通语料相对应的表达风格;
根据所述表达风格,对所述辅助沟通语料进行单字和/或词语的替换,得到辅助沟通内容。
7.一种辅助沟通内容生成装置,其特征在于,所述辅助沟通内容生成装置包括:
获取模块,用于获取目标沟通对象的属性信息;
设置模块,用于根据所述属性信息,采用预置分类算法计算所述目标沟通对象对应的属性分值,并根据所述属性分值,设置所述目标沟通对象对应性格标签;
所述获取模块还用于获取所述目标沟通对象对应的对话文本;
识别模块,用于通过预置神经网络模型,提取所述对话文本的上下文特征,并根据所述上下文特征,识别所述目标沟通对象对应的对话意图;
转换模块,用于从预置数据库中检索所述对话意图对应的辅助沟通语料,并根据所述性格标签,对所述辅助沟通语料进行表达风格转换,得到辅助沟通内容。
8.根据权利要求7所述的辅助沟通内容生成装置,其特征在于,所述设置模块包括:
提取单元,用于提取所述属性信息中的多个属性字段,并识别各所述属性字段之间的关联关系;
构建单元,用于根据所述关联关系,采用各所述属性字段构建关联网络结构,并遍历所述关联网络结构,得到分支遍历结果;
计算单元,用于采用所述分支遍历结构,计算各所述属性字段的关联权重,并根据各所述关联权重计算所述目标沟通对象对应的属性分值。
9.一种辅助沟通内容生成设备,其特征在于,所述辅助沟通内容生成设备包括:存储器和至少一个处理器,所述存储器中存储有指令;
所述至少一个处理器调用所述存储器中的所述指令,以使得所述辅助沟通内容生成设备执行如权利要求1-6中任意一项所述的辅助沟通内容生成方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,其特征在于,所述指令被处理器执行时实现如权利要求1-6中任意一项所述辅助沟通内容生成方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111562615.XA CN114239605A (zh) | 2021-12-20 | 2021-12-20 | 辅助沟通内容生成方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111562615.XA CN114239605A (zh) | 2021-12-20 | 2021-12-20 | 辅助沟通内容生成方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114239605A true CN114239605A (zh) | 2022-03-25 |
Family
ID=80759345
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111562615.XA Pending CN114239605A (zh) | 2021-12-20 | 2021-12-20 | 辅助沟通内容生成方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114239605A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115952272A (zh) * | 2023-03-10 | 2023-04-11 | 杭州心识宇宙科技有限公司 | 一种生成对话信息的方法、装置、设备及可读存储介质 |
-
2021
- 2021-12-20 CN CN202111562615.XA patent/CN114239605A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115952272A (zh) * | 2023-03-10 | 2023-04-11 | 杭州心识宇宙科技有限公司 | 一种生成对话信息的方法、装置、设备及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111753060B (zh) | 信息检索方法、装置、设备及计算机可读存储介质 | |
CN109635291B (zh) | 一种基于协同训练的融合评分信息和物品内容的推荐方法 | |
CN112069408B (zh) | 一种融合关系抽取的推荐系统及方法 | |
CN109918489A (zh) | 一种多策略融合的知识问答方法和系统 | |
CN108229582A (zh) | 一种面向医学领域的多任务命名实体识别对抗训练方法 | |
CN113297369B (zh) | 基于知识图谱子图检索的智能问答系统 | |
CN113435211B (zh) | 一种结合外部知识的文本隐式情感分析方法 | |
CN111914556A (zh) | 基于情感语义转移图谱的情感引导方法及系统 | |
CN114579705B (zh) | 一种面向可持续发展教育的学习辅助方法及系统 | |
CN114238653B (zh) | 一种编程教育知识图谱构建、补全与智能问答的方法 | |
CN115599899B (zh) | 基于飞行器知识图谱的智能问答方法、系统、设备及介质 | |
CN113254675B (zh) | 基于自适应少样本关系抽取的知识图谱构建方法 | |
CN114756681B (zh) | 一种基于多注意力融合的评教文本细粒度建议挖掘方法 | |
CN110717090A (zh) | 一种旅游景点网络口碑评价方法、系统及电子设备 | |
CN111507093A (zh) | 一种基于相似字典的文本攻击方法、装置及存储介质 | |
CN113987167A (zh) | 基于依赖感知图卷积网络的方面级情感分类方法及系统 | |
CN114329181A (zh) | 一种题目推荐方法、装置及电子设备 | |
CN112183106A (zh) | 一种基于音素联想及深度学习的语义理解方法及装置 | |
CN111666374A (zh) | 一种在深度语言模型中融入额外知识信息的方法 | |
CN114239605A (zh) | 辅助沟通内容生成方法、装置、设备及存储介质 | |
CN117828024A (zh) | 一种插件检索方法、装置、存储介质及设备 | |
Korade et al. | Strengthening Sentence Similarity Identification Through OpenAI Embeddings and Deep Learning. | |
CN113535928A (zh) | 基于注意力机制下长短期记忆网络的服务发现方法及系统 | |
CN116757195B (zh) | 一种基于提示学习的隐性情感识别方法 | |
CN112182439A (zh) | 一种基于自注意力网络的搜索结果多样化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |