CN114970544A - 信息处理方法、装置、存储介质及服务器 - Google Patents
信息处理方法、装置、存储介质及服务器 Download PDFInfo
- Publication number
- CN114970544A CN114970544A CN202210562713.1A CN202210562713A CN114970544A CN 114970544 A CN114970544 A CN 114970544A CN 202210562713 A CN202210562713 A CN 202210562713A CN 114970544 A CN114970544 A CN 114970544A
- Authority
- CN
- China
- Prior art keywords
- labels
- label
- feedback data
- information processing
- relationship
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Abstract
本申请实施例公开了一种信息处理方法、装置、存储介质及服务器。该方法包括:通过训练好的神经网络模型对电子设备上传的反馈数据进行标签预测,输出多个标签。随后基于该多个标签在目标标签体系中的层级关系进行标签合并处理,得到目标标签,并向电子设备返回该目标标签以在客户端展示供用户查看。本方案在各项不同任务中学习不同样本之间潜含的语意信息与关联关系,提升了多级标签预测效果和模型预测结果的准确性。
Description
技术领域
本申请涉电子计算机技术领域,尤其涉及一种信息处理方法、装置、存储介质及服务器。
背景技术
标签挖掘是一项基础技术。该技术可以将非结构化的文本抽象成高层次的标签,从而让机器更好地理解文本,继而赋能核心业务。按照标签是否已提前定义好,可以将标签挖掘任务分为两类:固定标签挖掘以及自定义标签挖掘。对于前者,标签已经提前设定好,其重点是如何更好地学习文本和标签之间的映射关系。而对于后者,还得根据具体的需求确定标签、构建合适的数据集、处理噪声等。
相关技术中,利用深度模型预测任务标签,存在对文本语义理解不充分,预测结果不准确的技术缺陷。
发明内容
本申请实施例提供一种信息处理方法、装置、存储介质及服务器,可提高模型预测结果的准确性。
第一方面,本申请实施例提供一种信息处理方法,应用于服务器,包括:
获取电子设备发送的反馈数据;
基于训练好的神经网络模型对所述反馈数据进行标签预测,输出多个标签;
根据所述多个标签在目标标签体系中的层级关系进行标签合并处理,得到目标标签;
向所述电子设备发送所述目标标签。
第二方面,本申请实施例提供了一种信息处理装置,应用于服务器,包括:
第一获取单元,用于获取电子设备发送的反馈数据;
预测单元,用于基于训练好的神经网络模型对所述反馈数据进行标签预测,输出多个标签;
处理单元,用于根据所述多个标签在目标标签体系中的层级关系进行标签合并处理,得到目标标签;
第一发送单元,用于向所述电子设备发送所述目标标签。
在一实施方式中,所述预测单元用于:
基于训练好的神经网络模型对所述反馈数据进行语义分析,得到语义分析结果;
根据所述语义分析结果从所述目标标签体系中匹配对应的标签。
在一实施方式中,所述预测单元进一步用于:
将所述反馈数据的数据类型转成文本类型,得到文本数据;
对所述文本数据进行向量化表征,得到第一表征向量;
基于训练好的神经网络模型对所述第一表征向量进行处理,得到第二表征向量;
根据所述第二表征向量确定所述语义分析结果。
在一实施方式中,所述信息处理装置还包括:
第二获取单元,用于在获取电子设备发送的反馈数据之前,获取多个样本反馈数据;
分类单元,用于从多个不同分类维度对所述多个样本反馈数据进行内容分类,得到分类结果;
生成单元,用于根据所述分类结果和所述分类维度的属性,生成多个分类标签;
第一构建单元,用于根据所述分类标签、及所述分类维度之间的关系,构建所述目标标签体系
在一实施方式中,所述信息处理装置还包括:
第三获取单元,用于在获取电子设备发送的反馈数据之前,获取多个样本反馈数据、及所述样本反馈数据在多个不同分类维度上的样本标签,其中,所述多个不同分类维度至少包括:数据有效性、反馈问题点和处理问题的业务部门;
第二构建单元,用于根据所述样本反馈数据及其对应的样本标签,构建训练样本;
训练单元,用于基于所述训练样本对预设神经网络模型进行训练,得到训练好的神经网络模型。
在一实施方式中,所述层级关系包括:等级关系、互斥关系和/或合并关系;所述处理单元具体用于:
根据所述多个标签在目标标签体系中的等级关系、互斥关系和/或合并关系进行标签合并处理。
在一实施方式中,所述处理单元进一步用于:
当两个标签之间的关系为合并关系时,同时保留两个标签;
当两个标签之间的关系为互斥关系时,根据两个标签之间的等级关系保留其中一个标签。
第三方面,本申请实施例还提供了一种计算机可读存储介质,所述存储介质中存储有多条指令,所述指令适于由处理器加载以执行上述的信息处理方法。
第四方面,本申请实施例还提供了一种电子设备,包括处理器及存储器,所述处理器与所述存储器电性连接,所述存储器用于存储指令和数据,处理器用于执行上述的信息处理方法。
本申请实施例,通过训练好的神经网络模型对电子设备上传的反馈数据进行标签预测,输出多个标签。随后基于该多个标签在目标标签体系中的层级关系进行标签合并处理,得到目标标签,并向电子设备返回该目标标签以在客户端展示供用户查看。本方案在各项不同任务中学习不同样本之间潜含的语意信息与关联关系,提升了多级标签预测效果;通过条件规则判断综合标签结果,实现不同学习样本之间的数据、特征共享,充分理解语义,提升了预测结果的准确性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的信息处理方法的流程示意图。
图2是本申请实施例提供的应用场景系统架构示意图。
图3是本申请实施例提供的多级标签预测模型构建方法的流程示意图。
图4是本申请实施例提供的用户反馈标签体系示意图。
图5是本申请实施例提供的信息处理装置的一结构示意图。
图6是本申请实施例提供的电子设备的一结构示意图。
图7是本申请实施例提供的电子设备的另一结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供一种信息处理方法、装置、存储介质及服务器,针对分别预测单任务标签并通过条件规则判断综合标签结果的方案存在的,诸如数据割裂、特征缺乏共享、语义理解不充分、预测结果不准确等技术缺陷,提供了一种解决方式,通过使用统一特征提取器,在各项不同任务中学习不同样本之间潜含的语意信息与关联关系,提升多级标签预测效果。
在一实施例中,提供一种信息处理方法,应用服务器中。参考图1,该信息处理方法的具体流程可以如下:
101、获取电子设备发送的反馈数据。
其中,电子设备可以是于智能手机、平板电脑、笔记本电脑等智能终端。该电子设备可为用户提供反馈数据输入接口,该反馈数据输入接口可以应用程序、小程序或网页等中的一个功能模块的形式呈现。例如,应用程序为货运打车软件,则该反馈数据输入接口可以为集成在该货运打车软件中为用户提供问题反馈渠道的功能模块。
在本实施例中,反馈数据可为用户通过上述输入接口针对相关服务(如货运打车服务、商品买卖服务等)发表的意见或问题反馈等。
具体的,电子设备与服务器之间建立有无线通信链路,电子设备可通过建立的无线通信链路向服务器上传用户输入的反馈数据,服务器可接收来自多个不同电子设备的反馈数据。
102、基于训练好的神经网络模型对反馈数据进行标签预测,输出多个标签。
在本申请实施例中,需要预先构建用于标签预测的神经网络模型,并对其进行模型训练使其契合本方案的实际使用需求。也即,在获取电子设备发送的反馈数据之前,还包括以下操作:
获取多个样本反馈数据、及所述样本反馈数据在多个不同分类维度上的样本标签,其中,所述多个不同分类维度至少包括:数据有效性、反馈问题点和处理问题的业务部门;
根据样本反馈数据及其对应的样本标签,构建训练样本;
基于训练样本对预设神经网络模型进行训练,得到训练好的神经网络模型。
具体的,数据有效性标签,用于判断反馈数据是否有效,在后续标签整理的步骤中起到至关重要的作用。业务部门标签,用于判定本条反馈数据需要由哪一个业务部门去具体完成处理。反馈问题点标签,用于判定一条反馈数据对应多个用户反馈问题点,即表现为一对多的对应关系。用户在反馈中涉及到的问题点往往没有明确的数量限制,所以本申请方案适用于构建多标签的关联关系。
在本申请实施例中,需要构建反馈数据与数据有效性之间对应关系为第一样本,构建用户的反馈数据与处理问题的处理部门之间对应关系为第二样本,以及构建反馈数据与反馈问题点之间对应关系为第三样本。同时将第一样本、第二样本、第三样本作为训练样本,对预设神经网络模型进行训练,将反馈数据作为模型输入,通过调整预设神经网络模型的模型参数,使模型输出结果符合预期(即预测的标签与真实标签一致),以得到训练好的神经网络模型。
在一实施方式中,基于训练好的神经网络模型对所述反馈数据进行标签预测,输出多个标签,可以包括以下流程:
基于训练好的神经网络模型对所述反馈数据进行语义分析,得到语义分析结果;
根据语义分析结果从目标标签体系中匹配对应的标签。
实际应用中,在进行文本向量化表征操作之前,可以对该反馈数据进行预处理,包括但不限于删除无意义词汇、修改错别字、将表情符号替换为文本等。也即,在一实施方式中,在基于训练好的标签预测模型对所述反馈数据进行语义分析,得到语义分析结果时,具体可以包括以下操作:
将反馈数据的数据类型转成文本类型,得到对应的文本数据;
对文本数据进行向量化表征,得到第一表征向量;
基于训练好的神经网络模型对第一表征向量进行处理,得到第二表征向量;
根据第二表征向量确定语义分析结果。
具体的,当数据类型为非文本类型(如图像类、音频类、视频类等)时,需要将反馈数据转换为文本类型的数据。当反馈数据的数据类型为文本类型时,无需转换数据类型。
由于文本本身是一个蕴含多种信息的高维特征,因此需要将文本转换为计算机可识别的数学表征形式,让计算机设备能够识别处理。所使用的向量化的方法可以采用模型中的embedding层(直译嵌入层)来实现。
在本申请中,若要得到效果较好的模型或者提升标签预测速度,则需选用浮点计算能力较强的服务器设备。若要提升云服务器同时计算的数量,需要服务器有较大的缓存;若要提升服务器同时处理的预测数量,则可以提升服务器处理器的核心数量或者将多个服务器组成服务器集群。
103、根据多个标签在目标标签体系中的层级关系进行标签合并处理,得到目标标签。
在本申请实施例中,需要预先构建目标标签体系。也即,在获取电子设备发送的反馈数据之前,还可包括以下操作:
获取多个样本反馈数据;
从多个不同分类维度对多个样本反馈数据进行内容分类,得到分类结果;
根据分类结果和所述分类维度的属性,生成多个分类标签;
根据分类标签、及分类维度之间的关系,构建目标标签体系。
在一实施方式中,层级关系包括:等级关系、互斥关系和/或合并关系,具体可以根据多个标签在目标标签体系中的等级关系、互斥关系和/或合并关系进行标签合并处理。
在一实施方式中,当两个标签之间的关系为合并关系时,同时保留两个标签;当两个标签之间的关系为互斥关系时,根据两个标签之间的等级关系保留其中一个标签。
需要说明的是,在本申请的实施例,用户数据有效性标签,在于其他标签合并过程可以认定为:有效反馈的其他标签生效,无效反馈的其他标签无效。
104、向电子设备发送目标标签。
具体的,将合并整理得到的目标标签存储,并通过通信设备返回给对应的电子设备。电子设备在接收到服务器返回的目标标签后,将会在相应界面上展示该目标标签给用户查看,以供用户通过返回的目标标签及时寻求到解决途径,提升问题处理效率。
由上可知,本实施例提供的信息处理方法,通过获取待预测产品在当前时间周期内的多条媒体评论信息,提取每一媒体评论信息的嵌入特征作为目标预测模型的输入,获取其隐层表征特征。利用稀疏注意力机制对该隐层表征特征进行稀疏处理,并基于处理后的隐层表征特征确定待预测产品在下一时间周期的目标销量。本方案在预测模型中融合了稀疏注意力机制,实现了媒体评论信息流数据中冗余节点的自适应识别、筛选,使得预测模型更加高效地聚焦于有效媒体评论信息,降低冗余、无效评论对模预测型的影响,提升了模型预测效果。
在本申请又一实施例中,还提供一种用于构建多级标签预测模型的系统架构。参考图2,该系统架构可以包括:电子设备、通信设备、以及云服务器设备。通信设备服务用于联通云服务器与终端设备,提供数据交互链路;该通信设备可以通过但不限于以下设备实现:无线网络(WiFi/4G/5G)、有线网络、卫星通讯等。
具体的,用户可使用电子设备通过通信设备与云服务器完成数据发送与接收的交互操作。云服务器和电子设备中可运行软件程序实现数据发送、数据接收、数据处理、数据展示、模型构建、模型预测等任务。
电子设备包括但不限于电脑、手机、平板等智能终端设备,可以通过通信设备接收来自云服务器设备的数据。本实施例中,云服务器泛指服务器设施,可以是单个独立服务器或服务器集群,可通过在服务器中运行相应程序实现模型构建和部署。
云服务器通过系统软件与应用软件提供基础服务能力,在此基础上,云服务器提供了标签体系构建与标签预测的能力。以构建用户反馈多级标签体系为例,云服务器可实现如下功能:首先,电子设备将用户反馈的数据通过通信设备传输给云服务器,然后使用人工初始化或者历史数据构建用户反馈有效性标签体系,用户反馈处理部门标签体系,用户反馈问题点标签体系,同时训练模型。获取到模型之后,以模型为核心,构建标签预测推理服务。推理服务主要完成接收来自电子设备的数据,完成标签预测,并将预测结果通过通信设备返回电子设备,展示给用户。
云服务器想要得到效果较好的模型,或者想要提升推理预测速度,一般云服务器选用浮点计算能力较强的设备。如果想要提升云服务器同时计算的数量,需要云服务器有较大的缓存;如果想要提升云服务器同时处理的预测数量,可以提升云服务器处理器的核心数量或者将多个云服务器组成集群。
参考图3,本申请实施例提供的一种用于构建多级标签预测模型的方法,包括以下步骤:
(一)、用户通过电子设备上传反馈信息;本步骤主要侧重于对于用户反馈数据信息处理和提取。
数据清洗纠正;包括但不限于,删除以一些无意义词汇,修改一些错别字,将表情符号替换为文本等。
文本向量化表示;文本本身是一个蕴含多种信息的高维特征,需要将文本转换为计算机可识别的数学表征形式,让计算机设备能够识别处理。所使用的向量化的方法可以用embedding层(直译嵌入层)来实现。
(二)、根据用户上传的反馈数据构建诸多标签体系。
具体的,依据用户反馈数据构建或者推测用户反馈对应的标签,可以同时进行多个标签的构建或者预测,不限制标签种类的数量。本实施例中,云服务器在利用神经网络模型进行标签预测时,可基于encoder编码层对用户反馈数据进行向量化表征,将文本向量输入到不同的decoder解码层进行解码计算,输出不同标签。
本方案中,需要预先构建用户反馈标签体系。具体如下:
(1)根据用户上传的反馈信息与反馈有效性的关联关系,构建用户反馈有效性指标体系。以下给出用户反馈与反馈有效性类别之间对应关系,可用于提取到第一样本的数据,请参见下表1:
表1
用户反馈 | 是否有效 |
我今天遇到叫的车,司机不熟悉路况,都开错了路,来来回回绕了好久 | 有效 |
今天搬家结束吃了一份云吞,感觉味道不错 | 无效 |
表1展示了部分用户反馈与反馈有效性之间的关联关系,其为用户反馈多级标签的第一级标签,用于判断用户反馈数据是否有效。
(2)根据用户上传的反馈信息与反馈处理部门关联关系,构建用户反馈处理部门指标体系。本步骤旨在构建用户反馈处理部门的第二样本。用户反馈信息将交由不同的处理部门进行处理。参考表2,表2展示了用户反馈信息与反馈处理部门之间的关系。
表2
表2记录了部门用户反馈与处理部门之间的关联关系,根据用户反馈信息,判定本条用户反馈需要由哪一个部门去具体完成处理。将上述关联关系标签话表示,进一步得到用户反馈处理部门的标签体系。
(3)根据用户上传的反馈信息与反馈问题点关联关系,构建用户反馈问题点指标体系。本步骤旨在构建用户反馈问题点的第三样本。用户反馈信息会关注不同问题。参考表3,表3展示了用户反馈信息与反馈问题点之间的关系。
表3
区别于步骤(1)和(2)的用户反馈对应一个标签,本标签体系中一段用户反馈对应多个用户反馈问题点,即表现为一对多的对应关系。用户在反馈中涉及到的问题点往往没有明确的数量限制,所以本申请适用于构建多标签的关联关系。
需要说明的是,本实施例中不限制标签体系数量,也不限制标签之间等级关系,可以统一在本层中实现所有标签的构建或者推理预测。例如,可以在构建标签体系时增加用户反馈责任认定标签体系等。
(三)实现标签体系之间等级、合并、互斥关系的处理,将用户反馈的所有标签进行合并。
参考图4所示的用户反馈标签体系,对于每一句用户反馈进行预测,得到来自于不同层级的标签。假设,某反馈同时得到“无效反馈”和“司机服务”标签。根据上图4所示,可知“无效反馈”与“司机服务”标签互斥,同时“无效反馈”在标签体系中的优先级要高于“司机服务”,则最终合并为一个标签“无效反馈”。
在本申请实施例中,用户反馈有效性标签在于其他标签合并过程可以认定为:有效反馈的其他标签生效、无效反馈的其他标签无效。根据用户反馈标签之间的层级和逻辑关系,将用户反馈标签进行整理,为最终传输作准备。
(四)、将合并后的标签存储,并通过通信设备返回给电子设备,电子设备进而展示给用户。
本申请实施例提供的构建多级标签模型的方法,首先根据用户反馈与反馈有效性类别之间对应关系的第一样本,建立用户反馈有效性标签体系;然后根据用户反馈与反馈处理部门之间对应关系的第二样本,建立用户反馈处理部门标签体系;进一步,根据用户反馈与反馈问题点之间对应关系的第三样本,建立用户反馈问题点标签体系;最后,根据用户反馈有效性体系、用户反馈处理部门标签体系、用户反馈问题点标签体系,构建标签预测模型。
本申请实施例提供了一种多任务学习预测多级标签的方案,同时将第一样本、第二样本、第三样本作为训练样本,使用统一特征提取器,在各项不同任务中学习不同样本之间潜含的语意信息与关联关系,可以提升多级标签预测效果;通过条件规则判断综合标签结果,解决了相关技术中存在的数据割裂、特征缺乏共享、语义理解不充分、预测结果不准确等技术缺陷。
在本申请又一实施例中,还提供一种信息处理装置。该信息处理装置可以软件或硬件的形式集成在服务器中。如图5所示,该信息处理装置300可以包括:第一获取单元301、预测单元302、处理单元303和第一发送单元304,其中:
第一获取单元301,用于获取电子设备发送的反馈数据;
预测单元302,用于基于训练好的神经网络模型对所述反馈数据进行标签预测,输出多个标签;
处理单元303,用于根据所述多个标签在目标标签体系中的层级关系进行标签合并处理,得到目标标签;
第一发送单元304,用于向所述电子设备发送所述目标标签。
在一实施方式中,所述预测单元302可以用于:
基于训练好的神经网络模型对所述反馈数据进行语义分析,得到语义分析结果;
根据所述语义分析结果从所述目标标签体系中匹配对应的标签。
在一实施方式中,所述预测单元302可进一步用于:
将所述反馈数据的数据类型转成文本类型,得到文本数据;
对所述文本数据进行向量化表征,得到第一表征向量;
基于训练好的神经网络模型对所述第一表征向量进行处理,得到第二表征向量;
根据所述第二表征向量确定所述语义分析结果。
在一实施方式中,所述信息处理装置400还包括:
第二获取单元,用于在获取电子设备发送的反馈数据之前,获取多个样本反馈数据;
分类单元,用于从多个不同分类维度对所述多个样本反馈数据进行内容分类,得到分类结果;
生成单元,用于根据所述分类结果和所述分类维度的属性,生成多个分类标签;
第一构建单元,用于根据所述分类标签、及所述分类维度之间的关系,构建所述目标标签体系
在一实施方式中,所述信息处理装置400还可以包括:
第三获取单元,用于在获取电子设备发送的反馈数据之前,获取多个样本反馈数据、及所述样本反馈数据在多个不同分类维度上的样本标签,其中,所述多个不同分类维度至少包括:数据有效性、反馈问题点和处理问题的业务部门;
第二构建单元,用于根据所述样本反馈数据及其对应的样本标签,构建训练样本;
训练单元,用于基于所述训练样本对预设神经网络模型进行训练,得到训练好的神经网络模型。
在一实施方式中,所述层级关系包括:等级关系、互斥关系和/或合并关系;所述处理单元303具体可以用于:
根据所述多个标签在目标标签体系中的等级关系、互斥关系和/或合并关系进行标签合并处理。
在一实施方式中,所述处理单元303进一步可以用于:
当两个标签之间的关系为合并关系时,同时保留两个标签;
当两个标签之间的关系为互斥关系时,根据两个标签之间的等级关系保留其中一个标签。
由上可知,本申请实施例提供的信息处理装置,通过训练好的神经网络模型对电子设备上传的反馈数据进行标签预测,输出多个标签。随后基于该多个标签在目标标签体系中的层级关系进行标签合并处理,得到目标标签,并向电子设备返回该目标标签以在客户端展示供用户查看。本方案在各项不同任务中学习不同样本之间潜含的语意信息与关联关系,提升了多级标签预测效果;通过条件规则判断综合标签结果,实现不同学习样本之间的数据、特征共享,充分理解语义,提升了预测结果的准确性。
在本申请又一实施例中还提供一种服务器。如图6所示,服务器400包括处理器401和存储器402。其中,处理器401与存储器402电性连接。
处理器401是服务器400的控制中心,利用各种接口和线路连接整个服务器的各个部分,通过运行或加载存储在存储器402内的应用,以及调用存储在存储器402内的数据,执行服务器的各种功能和处理数据,从而对服务器进行整体监控。
在本实施例中,服务器400中的处理器401会按照如下的步骤,将一个或一个以上的应用的进程对应的指令加载到存储器402中,并由处理器401来运行存储在存储器402中的应用,从而实现各种功能:
获取电子设备发送的反馈数据;
基于训练好的神经网络模型对所述反馈数据进行标签预测,输出多个标签;
根据所述多个标签在目标标签体系中的层级关系进行标签合并处理,得到目标标签;
向所述电子设备发送所述目标标签。
在一实施方式中,在基于训练好的神经网络模型对所述反馈数据进行标签预测,输出多个标签时,处理器401可以执行以下操作:
基于训练好的神经网络模型对所述反馈数据进行语义分析,得到语义分析结果;
根据所述语义分析结果从所述目标标签体系中匹配对应的标签。
在一实施方式中,在基于训练好的标签预测模型对所述反馈数据进行语义分析,得到语义分析结果时,处理器401可以执行以下操作:
将所述反馈数据的数据类型转成文本类型,得到文本数据;
对所述文本数据进行向量化表征,得到第一表征向量;
基于训练好的神经网络模型对所述第一表征向量进行处理,得到第二表征向量;
根据所述第二表征向量确定所述语义分析结果。
在一实施方式中,在获取电子设备发送的反馈数据之前,处理器401还可以执行以下操作:
获取多个样本反馈数据;
从多个不同分类维度对所述多个样本反馈数据进行内容分类,得到分类结果;
根据所述分类结果和所述分类维度的属性,生成多个分类标签;
根据所述分类标签、及所述分类维度之间的关系,构建所述目标标签体系。
在一实施方式中,在获取电子设备发送的反馈数据之前,处理器401还可以执行以下操作:
获取多个样本反馈数据、及所述样本反馈数据在多个不同分类维度上的样本标签,其中,所述多个不同分类维度至少包括:数据有效性、反馈问题点和处理问题的业务部门;
根据所述样本反馈数据及其对应的样本标签,构建训练样本;
基于所述训练样本对预设神经网络模型进行训练,得到训练好的神经网络模型。
在一实施方式中,所述层级关系包括:等级关系、互斥关系和/或合并关系。在根据所述多个标签在目标标签体系中的层级关系进行标签合并处理时,处理器401可以执行以下操作:
根据所述多个标签在目标标签体系中的等级关系、互斥关系和/或合并关系进行标签合并处理。
在一实施方式中,在根据所述多个标签在目标标签体系中的等级关系、互斥关系和/或合并关系进行标签合并处理时,处理器401具体可以执行以下操作:
当两个标签之间的关系为合并关系时,同时保留两个标签;
当两个标签之间的关系为互斥关系时,根据两个标签之间的等级关系保留其中一个标签。
存储器402可用于存储应用和数据。存储器402存储的应用中包含有可在处理器中执行的指令。应用可以组成各种功能模块。处理器401通过运行存储在存储器402的应用,从而执行各种功能应用以及信息处理。
在一些实施例中,如图7所示,服务器400还包括:显示屏403、控制电路404、射频电路405、输入单元406以及电源407。其中,处理器401分别与显示屏403、控制电路404、射频电路405、输入单元406以及电源407电性连接。
显示屏403可用于显示由用户输入的信息或提供给用户的信息以服务器的各种图形用户接口,这些图形用户接口可以由图像、文本、图标、视频和其任意组合来构成。
控制电路404与显示屏403电性连接,用于控制显示屏403显示信息。
射频电路405用于收发射频信号,以通过无线通信与电子设备或其他服务器构建无线通讯,与电子设备或其他服务器之间收发信号。
输入单元406可用于接收输入的数字、字符信息或用户特征信息(例如指纹),以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。其中,输入单元406可以包括指纹识别模组。
电源407用于给服务器400的各个部件供电。在一些实施例中,电源407可以通过电源管理系统与处理器401逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
尽管图7中未示出,服务器400还可以包括扬声器、蓝牙模块、摄像头等,在此不再赘述。
由上可知,本申请实施例提供的服务器,通过训练好的神经网络模型对电子设备上传的反馈数据进行标签预测,输出多个标签。随后基于该多个标签在目标标签体系中的层级关系进行标签合并处理,得到目标标签,并向电子设备返回该目标标签以在客户端展示供用户查看。本方案在各项不同任务中学习不同样本之间潜含的语意信息与关联关系,提升了多级标签预测效果;通过条件规则判断综合标签结果,实现不同学习样本之间的数据、特征共享,充分理解语义,提升了预测结果的准确性。
在一些实施例中,还提供了一种计算机可读存储介质,该存储介质中存储有多条指令,该指令适于由处理器加载以执行上述任一信息处理方法。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,RandomAccess Memory)、磁盘或光盘等。
以上对本申请实施例所提供的信息处理方法、装置、存储介质及服务器进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种信息处理方法,应用于服务器,其特征在于,包括:
获取电子设备发送的反馈数据;
基于训练好的神经网络模型对所述反馈数据进行标签预测,输出多个标签;
根据所述多个标签在目标标签体系中的层级关系进行标签合并处理,得到目标标签;
向所述电子设备发送所述目标标签。
2.根据权利要求1所述的信息处理方法,其特征在于,所述基于训练好的神经网络模型对所述反馈数据进行标签预测,输出多个标签,包括:
基于训练好的神经网络模型对所述反馈数据进行语义分析,得到语义分析结果;
根据所述语义分析结果从所述目标标签体系中匹配对应的标签。
3.根据权利要求2所述的信息处理方法,其特征在于,所述基于训练好的标签预测模型对所述反馈数据进行语义分析,得到语义分析结果,包括
将所述反馈数据的数据类型转成文本类型,得到对应的文本数据;
对所述文本数据进行向量化表征,得到第一表征向量;
基于训练好的神经网络模型对所述第一表征向量进行处理,得到第二表征向量;
根据所述第二表征向量确定所述语义分析结果。
4.根据权利要求1所述的信息处理方法,其特征在于,在获取电子设备发送的反馈数据之前,还包括:
获取多个样本反馈数据;
从多个不同分类维度对所述多个样本反馈数据进行内容分类,得到分类结果;
根据所述分类结果和所述分类维度的属性,生成多个分类标签;
根据所述分类标签、及所述分类维度之间的关系,构建所述目标标签体系。
5.根据权利要求1所述的信息处理方法,其特征在于,在获取电子设备发送的反馈数据之前,还包括:
获取多个样本反馈数据、及所述样本反馈数据在多个不同分类维度上的样本标签,其中,所述多个不同分类维度至少包括:数据有效性、反馈问题点和处理问题的业务部门;
根据所述样本反馈数据及其对应的样本标签,构建训练样本;
基于所述训练样本对预设神经网络模型进行训练,得到训练好的神经网络模型。
6.根据权利要求1-5任一项所述的信息处理方法,其特征在于,所述层级关系包括:等级关系、互斥关系和/或合并关系;
所述根据所述多个标签在目标标签体系中的层级关系进行标签合并处理,包括:
根据所述多个标签在目标标签体系中的等级关系、互斥关系和/或合并关系进行标签合并处理。
7.根据权利要求6所述的信息处理方法,其特征在于,所述根据所述多个标签在目标标签体系中的等级关系、互斥关系和/或合并关系进行标签合并处理,包括:
当两个标签之间的关系为合并关系时,同时保留两个标签;
当两个标签之间的关系为互斥关系时,根据两个标签之间的等级关系保留其中一个标签。
8.一种信息处理装置,应用于服务器,其特征在于,包括:
第一获取单元,用于获取电子设备发送的反馈数据;
预测单元,用于基于训练好的神经网络模型对所述反馈数据进行标签预测,输出多个标签;
处理单元,用于根据所述多个标签在目标标签体系中的层级关系进行标签合并处理,得到目标标签;
第一发送单元,用于向所述电子设备发送所述目标标签。
9.一种计算机可读存储介质,其特征在于,所述存储介质中存储有多条指令,所述指令适于由处理器加载以执行权利要求1-7任一项所述的信息处理方法。
10.一种服务器,其特征在于,包括处理器及存储器,所述处理器与所述存储器电性连接,所述存储器用于存储指令和数据;所述处理器用于执行权利要求1-7任一项所述的信息处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210562713.1A CN114970544A (zh) | 2022-05-23 | 2022-05-23 | 信息处理方法、装置、存储介质及服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210562713.1A CN114970544A (zh) | 2022-05-23 | 2022-05-23 | 信息处理方法、装置、存储介质及服务器 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114970544A true CN114970544A (zh) | 2022-08-30 |
Family
ID=82985972
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210562713.1A Pending CN114970544A (zh) | 2022-05-23 | 2022-05-23 | 信息处理方法、装置、存储介质及服务器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114970544A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115983609A (zh) * | 2023-03-17 | 2023-04-18 | 中关村科学城城市大脑股份有限公司 | 工单处理方法、装置、电子设备和计算机可读介质 |
-
2022
- 2022-05-23 CN CN202210562713.1A patent/CN114970544A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115983609A (zh) * | 2023-03-17 | 2023-04-18 | 中关村科学城城市大脑股份有限公司 | 工单处理方法、装置、电子设备和计算机可读介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3985578A1 (en) | Method and system for automatically training machine learning model | |
CN111444428B (zh) | 基于人工智能的信息推荐方法、装置、电子设备及存储介质 | |
CN110909165B (zh) | 数据处理方法、装置、介质及电子设备 | |
CN112632385A (zh) | 课程推荐方法、装置、计算机设备及介质 | |
US20230102337A1 (en) | Method and apparatus for training recommendation model, computer device, and storage medium | |
CN109034203B (zh) | 表情推荐模型的训练、表情推荐方法、装置、设备及介质 | |
CN111897934B (zh) | 问答对生成方法及装置 | |
CN112463968B (zh) | 文本分类方法、装置和电子设备 | |
CN113590928A (zh) | 内容推荐方法、装置及计算机可读存储介质 | |
CN110598070A (zh) | 应用类型识别方法及装置、服务器及存储介质 | |
CN113435182A (zh) | 自然语言处理中分类标注的冲突检测方法、装置和设备 | |
CN117216535A (zh) | 推荐文本生成模型的训练方法、装置、设备及介质 | |
CN114970544A (zh) | 信息处理方法、装置、存储介质及服务器 | |
CN113032676B (zh) | 基于微反馈的推荐方法和系统 | |
CN112905787B (zh) | 文本信息处理方法、短信处理方法、电子设备及可读介质 | |
CN115345669A (zh) | 文案生成方法、装置、存储介质及计算机设备 | |
CN113869068A (zh) | 场景服务推荐方法、装置、设备及存储介质 | |
CN112446738A (zh) | 广告数据处理方法、装置、介质以及电子设备 | |
Zhu | Analysis of the Influence of Multimedia Information Fusion on the Psychological Emotion of Financial Investment Customers under the Background of e-Commerce | |
CN113837216B (zh) | 数据分类方法、训练方法、装置、介质及电子设备 | |
CN116992031B (zh) | 数据处理方法、装置、电子设备、存储介质及程序产品 | |
US11907508B1 (en) | Content analytics as part of content creation | |
US11947916B1 (en) | Dynamic topic definition generator | |
Ng | Predicting energy consumption pattern based on top trending videos YouTube 2021 using machine learning techniques | |
CN116383478A (zh) | 事务推荐方法、装置、设备以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |