CN111797857A - 数据处理方法、装置、存储介质及电子设备 - Google Patents

数据处理方法、装置、存储介质及电子设备 Download PDF

Info

Publication number
CN111797857A
CN111797857A CN201910282134.XA CN201910282134A CN111797857A CN 111797857 A CN111797857 A CN 111797857A CN 201910282134 A CN201910282134 A CN 201910282134A CN 111797857 A CN111797857 A CN 111797857A
Authority
CN
China
Prior art keywords
data
information
learning model
reinforcement learning
operation information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910282134.XA
Other languages
English (en)
Inventor
陈仲铭
何明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Oppo Mobile Telecommunications Corp Ltd
Original Assignee
Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Oppo Mobile Telecommunications Corp Ltd filed Critical Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority to CN201910282134.XA priority Critical patent/CN111797857A/zh
Publication of CN111797857A publication Critical patent/CN111797857A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Abstract

本申请公开了一种数据处理方法、装置、存储介质及电子设备,所述方法包括:获取电子设备在预设时间段内的运行信息,并提取运行信息的特征信息,将特征信息发送至服务器以使服务器建立以用户情感阈值作为经验轨迹的经验池,根据预设算法对运行信息进行特征建模,得到强化学习模型,其中,强化学习模型以情感阈值作为优化目标,通过强化学习模型对经验池中的数据进行学习,以确定当前用户的情感阈值。本申请可以利用电子设备和云端结合的方法对情感阈值进行优化,从而提升情感阈值计算的准确性。

Description

数据处理方法、装置、存储介质及电子设备
技术领域
本申请属于人工智能技术领域,尤其涉及一种数据处理方法、装置、存储介质及电子设备。
背景技术
随着电子技术的发展,诸如智能手机等电子设备的智能化程度越来越高。电子设备可以通过各种各样的算法模型来进行数据处理,从而为用户提供各种功能。例如,电子设备可以根据算法模型对用户的行为特征进行学习,从而为用户提供个性化的服务。
现有技术当中,人工智能设备判断用户情感的方式是将获取到的用于监测用户生理信息的传感器参数与预设的情感阈值比较。例如,若获取到的传感器参数大于该情感阈值,则可以确定该用户的情感状态发生改变;若获取到的传感器参数不大于该情感阈值,则可以确定该用户的情感状态未发生改变。上述技术方案中的情感阈值是预设在该人工智能设备中的。不同的用户的情感阈值可能是不同的,同样的用户在不同场景中的情感阈值也可能是不同的。因此,如何确定情感阈值以适用于不同的用户是一个亟待解决的问题。
发明内容
本申请提供一种数据处理方法、装置、存储介质及电子设备,可以提升情感阈值计算的准确性。
第一方面,本申请实施例提供一种数据处理方法,包括:
获取电子设备在预设时间段内的运行信息,并提取所述运行信息的特征信息;
将所述特征信息发送至服务器以使所述服务器建立以用户情感阈值作为经验轨迹的经验池;
根据预设算法对所述运行信息进行特征建模,得到强化学习模型,其中,所述强化学习模型以情感阈值作为优化目标;
通过所述强化学习模型对所述经验池中的数据进行学习,以确定当前用户的情感阈值。
第二方面,本申请实施例提供一种数据处理装置,包括:获取模块、发送模块、建模模块以及确定模块;
所述获取模块,用于获取电子设备在预设时间段内的运行信息,并提取所述运行信息的特征信息;
所述发送模块,用于将所述特征信息发送至服务器以使所述服务器建立以用户情感阈值作为经验轨迹的经验池;
所述建模模块,用于根据预设算法对所述运行信息进行特征建模,得到强化学习模型,其中,所述强化学习模型以情感阈值作为优化目标;
所述确定模块,用于通过所述强化学习模型对所述经验池中的数据进行学习,以确定当前用户的情感阈值。
第三方面,本申请实施例提供一种存储介质,其上存储有计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行上述的数据处理方法。
第四方面,本申请实施例提供一种电子设备,包括处理器和存储器,所述存储器存储有多条指令,所述处理器加载所述存储器中的指令用于执行以下步骤:
获取电子设备在预设时间段内的运行信息,并提取所述运行信息的特征信息;
将所述特征信息发送至服务器以使所述服务器建立以用户情感阈值作为经验轨迹的经验池;
根据预设算法对所述运行信息进行特征建模,得到强化学习模型,其中,所述强化学习模型以情感阈值作为优化目标;
通过所述强化学习模型对所述经验池中的数据进行学习,以确定当前用户的情感阈值。
本申请实施例提供的数据处理方法可以获取电子设备在预设时间段内的运行信息,并提取运行信息的特征信息,将特征信息发送至服务器以使服务器建立以用户情感阈值作为经验轨迹的经验池,根据预设算法对运行信息进行特征建模,得到强化学习模型,其中,强化学习模型以情感阈值作为优化目标,通过强化学习模型对经验池中的数据进行学习,以确定当前用户的情感阈值。本申请可以利用电子设备和云端结合的方法对情感阈值进行优化,从而提升情感阈值计算的准确性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的数据处理方法的应用场景示意图。
图2为本申请实施例提供的数据处理方法的一种流程示意图。
图3为本申请实施例提供的数据处理方法的另一流程示意图。
图4为本申请实施例提供的数据处理装置的一种结构示意图。
图5为本申请实施例提供的数据处理装置的另一结构示意图。
图6为本申请实施例提供的电子设备的结构示意图。
图7为本申请实施例提供的电子设备的另一结构示意图。
具体实施方式
请参照图式,其中相同的组件符号代表相同的组件,本申请的原理是以实施在一适当的运算环境中来举例说明。以下的说明是基于所例示的本申请具体实施例,其不应被视为限制本申请未在此详述的其它具体实施例。
在以下的说明中,本申请的具体实施例将参考由一部或多部计算机所执行的步骤及符号来说明,除非另有述明。因此,这些步骤及操作将有数次提到由计算机执行,本文所指的计算机执行包括了由代表了以一结构化型式中的数据的电子信号的计算机处理单元的操作。此操作转换该数据或将其维持在该计算机的内存系统中的位置处,其可重新配置或另外以本领域测试人员所熟知的方式来改变该计算机的运作。该数据所维持的数据结构为该内存的实体位置,其具有由该数据格式所定义的特定特性。但是,本申请原理以上述文字来说明,其并不代表为一种限制,本领域测试人员将可了解到以下所述的多种步骤及操作亦可实施在硬件当中。
本申请中的术语“第一”、“第二”和“第三”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或模块的过程、方法、系统、产品或设备没有限定于已列出的步骤或模块,而是某些实施例还包括没有列出的步骤或模块,或某些实施例还包括对于这些过程、方法、产品或设备固有的其它步骤或模块。
参考图1,图1为本申请实施例提供的数据处理方法的应用场景示意图。所述数据处理方法应用于电子设备。所述电子设备中设置有全景感知架构。所述全景感知架构为电子设备中用于实现所述数据处理方法的硬件和软件的集成。
其中,全景感知架构包括信息感知层、数据处理层、特征抽取层、情景建模层以及智能服务层。
信息感知层用于获取电子设备自身的信息或者外部环境中的信息。所述信息感知层可以包括多个传感器。例如,所述信息感知层包括距离传感器、磁场传感器、光线传感器、加速度传感器、指纹传感器、霍尔传感器、位置传感器、陀螺仪、惯性传感器、姿态感应器、气压计、心率传感器等多个传感器。
其中,距离传感器可以用于检测电子设备与外部物体之间的距离。磁场传感器可以用于检测电子设备所处环境的磁场信息。光线传感器可以用于检测电子设备所处环境的光线信息。加速度传感器可以用于检测电子设备的加速度数据。指纹传感器可以用于采集用户的指纹信息。霍尔传感器是根据霍尔效应制作的一种磁场传感器,可以用于实现电子设备的自动控制。位置传感器可以用于检测电子设备当前所处的地理位置。陀螺仪可以用于检测电子设备在各个方向上的角速度。惯性传感器可以用于检测电子设备的运动数据。姿态感应器可以用于感应电子设备的姿态信息。气压计可以用于检测电子设备所处环境的气压。心率传感器可以用于检测用户的心率信息。
数据处理层用于对信息感知层获取到的数据进行处理。例如,数据处理层可以对信息感知层获取到的数据进行数据清理、数据集成、数据变换、数据归约等处理。
其中,数据清理是指对信息感知层获取到的大量数据进行清理,以剔除无效数据和重复数据。数据集成是指将信息感知层获取到的多个单维度数据集成到一个更高或者更抽象的维度,以对多个单维度的数据进行综合处理。数据变换是指对信息感知层获取到的数据进行数据类型的转换或者格式的转换等,以使变换后的数据满足处理的需求。数据归约是指在尽可能保持数据原貌的前提下,最大限度的精简数据量。
特征抽取层用于对数据处理层处理后的数据进行特征抽取,以提取所述数据中包括的特征。提取到的特征可以反映出电子设备自身的状态或者用户的状态或者电子设备所处环境的环境状态等。
其中,特征抽取层可以通过过滤法、包装法、集成法等方法来提取特征或者对提取到的特征进行处理。
过滤法是指对提取到的特征进行过滤,以删除冗余的特征数据。包装法用于对提取到的特征进行筛选。集成法是指将多种特征提取方法集成到一起,以构建一种更加高效、更加准确的特征提取方法,用于提取特征。
情景建模层用于根据特征抽取层提取到的特征来构建模型,所得到的模型可以用于表示电子设备的状态或者用户的状态或者环境状态等。例如,情景建模层可以根据特征抽取层提取到的特征来构建关键值模型、模式标识模型、图模型、实体联系模型、面向对象模型等。
智能服务层用于根据情景建模层所构建的模型为用户提供智能化的服务。例如,智能服务层可以为用户提供基础应用服务,可以为电子设备进行系统智能优化,还可以为用户提供个性化智能服务。
此外,全景感知架构中还可以包括多种算法,每一种算法都可以用于对数据进行分析处理,所述多种算法可以构成算法库。例如,所述算法库中可以包括马尔科夫算法、隐含狄里克雷分布算法、贝叶斯分类算法、支持向量机、深度确定性策略算法、条件随机场、残差网络、长短期记忆网络、卷积神经网络、循环神经网络等算法。
本申请实施例提供一种数据处理方法,该数据处理方法的执行主体可以是本申请实施例提供的数据处理装置,或者集成了该数据处理装置的电子设备,其中该数据处理装置可以采用硬件或者软件的方式实现。
本申请实施例将从数据处理装置的角度进行描述,该数据处理装置具体可以集成在电子设备中。该数据处理方法包括:获取电子设备在预设时间段内的运行信息,并提取所述运行信息的特征信息;
将所述特征信息发送至服务器以使所述服务器建立以用户情感阈值作为经验轨迹的经验池;
根据预设算法对所述运行信息进行特征建模,得到强化学习模型,其中,所述强化学习模型以情感阈值作为优化目标;
通过所述强化学习模型对所述经验池中的数据进行学习,以确定当前用户的情感阈值。
请参阅图2,图2为本申请实施例提供的数据处理方法的流程示意图。本申请实施例提供的数据处理方法应用于电子设备,具体流程可以如下:
步骤101,获取电子设备在预设时间段内的运行信息,并提取运行信息的特征信息。
在一实施例中,电子设备包括全景感知收集模块,该模块用于检测与手机电子设备在预设时间段内的运行信息,其中,上述运行信息可以包括当前用户在预设时间段内使用电子设备的设备运行信息、传感器信息以及用户使用设备状态信息等等。具体而言,该全景感知收集模块主要用于收集智能电子设备上的系统运行态数据信息和该电子设备的硬件信息,并由其构成的时间序列数据。
需要说明的是,对于系统运行状态数据和硬件数据信息其数据回传频率是不一致的,因此全景感知收集模块需要对数据进行同步。具体而言,由于运行信息包含多种类型的信息,比如电子设备在预设时间段内的运行状态信息和硬件参数信息,因此可以按照其构成的时间序列数据对上述不同类型的运行信息进行数据同步,也即在获取电子设备在预设时间段内的运行信息之后,所述方法还包括:
分别获取所述运行状态信息和硬件参数信息的时间序列数据;
根据所述时间序列数据对所述运行状态信息和硬件参数信息进行数据同步。
在一些实施例中,可以使用时间戳同步方法进行数据同步。比如,在得到电子设备在预设时间段内的运行状态信息和硬件参数信息的基础上,分别获取运行状态信息和硬件参数信息所对应的时间戳,然后进行匹配对齐,以使得运行状态信息和硬件参数信息的时间戳同步。进一步的,在数据同步之后,对全景序列信息进行特征提取,以得到其数据的主成分。
步骤102,将特征信息发送至服务器以使服务器建立以用户情感阈值作为经验轨迹的经验池。
在一实施例中,对步骤101得到的全景序列信息对应的主成分上传到云服务器上,具体可以通过TCP(传输控制协议)或IP(网际协议)协议进行上传。其中,互联网协议是一个网络通信模型,以及一整个网络传输协议家族,为互联网的基础通信架构,通称为TCP/IP协议族,TCP/IP提供点对点的链接机制,将数据应该如何封装、定址、传输、路由以及在目的地如何接收,都加以标准化。它将软件通信过程抽象化为四个抽象层,采取协议堆栈的方式,分别实现出不同通信协议。协议族下的各种协议,依其功能不同,被分别归属到这四个层次结构之中,常被视为是简化的七层OSI模型。在上传云服务器时,其文件传输协议可以使用XML、protobuf、JSON等格式,网络传输协议使用TCP/IP是为了避免数据在传输过程丢失。
在一实施例中,云服务器接收多个用户的电子设备所上传的运行信息所对应的特征信息,由于不同用户使用电子设备的习惯均不相同,因此云端服务器可以对第一用户、第二用户等不同用户在不同时间相同的情感作为一个经验轨迹,并存放在经验池中。具体的存储方式为:
A={(tstart1,tend1,Uj=1),(tstart2,tend2,Uj=2),(tstart…,tend…,Uj=1),(tstartn,tendn,Uj=1)}
其中Uj表示地j个用户,A表示情感状态的序列。为了产生大量得到经验轨迹,对于某个确定性的情感状态A以时间序列进行排列,即从tstart1到tend1为一天的时间间隔,其中时间内数据(tstart…,tend…)互斥。
步骤103,根据预设算法对运行信息进行特征建模,得到强化学习模型,其中,强化学习模型以情感阈值作为优化目标。
在一实施例中,上述预设算法可以为DDPG(深度确定性策略算法),对用户数据进行强化学习建模,以情感阈值作为用户当前的优化目标。其中,DDPG是将深度学习神经网络融合进DPG(确定性策略算法)的策略学习方法,该算法可用于解决连续动作空间上的DRL问题。相对于DPG的核心改进是采用卷积神经网络作为策略函数μ和Q函数的函数近似,即策略网络和Q网络,然后使用深度学习的方法来训练上述神经网络。由于DDPG使用了Nature DQN的思想,加入了经验池、随机抽样和目标网络,real Q值使用两个target网络共同计算。
步骤104,通过强化学习模型对经验池中的数据进行学习,以确定当前用户的情感阈值。
进一步的,DDPG的核心思想包括经验回放(Experience Replay)方法,加入经验回收的动机是:深度神经网络作为有监督学习模型,要求数据满足独立同分布,但Q Learning算法得到的样本前后是有关系的。为了打破数据之间的关联性,经验回收方法通过存储-采样的方法将这个关联性打破了。主要作用是克服经验数据的相关性(correlated data)和非平稳分布(non-stationary distribution)问题。它的做法是从以往的状态转移(经验)中随机采样进行训练。优点是数据利用率高和连续样本的相关性会使参数更新的方差(variance)比较大,该机制可减少这种相关性。
在本申请实施例中,通过对经验池进行经验回放技术,使用DDPG算法,对用户数据进行强化学习建模,以情感阈值作为用户当前的优化目标。并以反馈给用户的信号与用户的查看作为反馈(即奖励函数reward)。通过反复迭代训练对经验次的数据进行学习,从而周期性地确定用户情感阈值。
由上可知,本申请实施例提供的数据处理方法可以获取电子设备在预设时间段内的运行信息,并提取运行信息的特征信息,将特征信息发送至服务器以使服务器建立以用户情感阈值作为经验轨迹的经验池,根据预设算法对运行信息进行特征建模,得到强化学习模型,其中,强化学习模型以情感阈值作为优化目标,通过强化学习模型对经验池中的数据进行学习,以确定当前用户的情感阈值。本申请可以利用电子设备和云端结合的方法对情感阈值进行优化,从而提升情感阈值计算的准确性。
下面将在上述实施例描述的方法基础上,对本申请的清理方法做进一步介绍。参阅图3,图3为本申请实施例提供的数据处理方法的另一流程示意图,该数据处理方法包括:
步骤201,获取电子设备在预设时间段内的运行信息。
在一实施例中,运行信息包括电子设备在预设时间段内的运行状态信息和硬件参数信息。进一步的,电子设备包括全景感知收集模块,该模块用于检测与手机电子设备在预设时间段内的运行信息,具体而言,该全景感知收集模块主要用于收集智能电子设备上的系统运行态数据信息和该电子设备的硬件信息,并由其构成的时间序列数据。其中,上述时间序列数据用于对运行状态信息和硬件参数信息进行数据同步,比如可以使用时间戳同步方法进行数据同步。
步骤202,获取运行信息的数据类型。
步骤203,根据数据类型对运行信息进行特征提取,以得到运行信息当中多种数据所分别对应的特征信息。
在一实施例当中,由于上述电子设备的运行信息包括运行状态信息和硬件参数信息等不同类型的数据,因此根据数据类型对运行信息进行特征提取,具体的,不同的数据可以使用不同的特征提取方法提取其数据的主成分。
步骤204,将特征信息发送至服务器以使服务器建立以用户情感阈值作为经验轨迹的经验池。
在一实施例中,对步骤203得到的全景序列信息对应的主成分上传到云服务器上,具体可以通过TCP(传输控制协议)或IP(网际协议)协议进行上传。在上传云服务器时,其文件传输协议可以使用XML、protobuf、JSON等格式,网络传输协议使用TCP/IP是为了避免数据在传输过程丢失。
在一实施例中,云服务器接收多个用户的电子设备所上传的运行信息所对应的特征信息,由于不同用户使用电子设备的习惯均不相同,因此云端服务器可以对第一用户、第二用户等不同用户在不同时间相同的情感作为一个经验轨迹。
步骤205,根据预设算法对运行信息进行特征建模,得到强化学习模型,其中,强化学习模型以情感阈值作为优化目标。
在一实施例中,上述预设算法可以为DDPG(深度确定性策略算法),对用户数据进行强化学习建模,以情感阈值作为用户当前的优化目标。
步骤206,对经验池进行经验回收,以更新强化学习模型中的参数。
步骤207,通过对强化学习模型反复迭代训练以确定当前用户的情感阈值。
在本申请实施例中,通过对经验池进行经验回放技术,使用DDPG算法,对用户数据进行强化学习建模,以情感阈值作为用户当前的优化目标。并以反馈给用户的信号与用户的查看作为反馈(即奖励函数reward)。通过反复迭代训练对经验次的数据进行学习,从而周期性地确定用户情感阈值。
由上可知,本申请实施例提供的数据处理方法可以获取电子设备在预设时间段内的运行信息,获取运行信息的数据类型,根据数据类型对运行信息进行特征提取,以得到运行信息当中多种数据所分别对应的特征信息,将特征信息发送至服务器以使服务器建立以用户情感阈值作为经验轨迹的经验池,根据预设算法对运行信息进行特征建模,得到强化学习模型,其中,强化学习模型以情感阈值作为优化目标,对经验池进行经验回收,以更新强化学习模型中的参数,通过对强化学习模型反复迭代训练以确定当前用户的情感阈值。本实施例提供的数据处理方法可以利用电子设备和云端结合,对情感阈值进行优化,从而提升情感阈值计算的准确性。
本申请实施例还提供一种预设算法,比如为深度确定性策略算法,用于在获取电子设备在预设时间段内的运行信息,并将提取的特征信息发送至服务器以使所述服务器建立以用户情感阈值作为经验轨迹的经验池后,根据该深度确定性策略算法对所述运行信息进行特征建模,得到强化学习模型,其中,所述强化学习模型以情感阈值作为优化目标,以使电子设备通过所述强化学习模型对所述经验池中的数据进行学习,以确定当前用户的情感阈值。
请参阅图4,图4为本申请实施例提供的数据处理装置的一种结构示意图。其中该数据处理装置30包括获取模块301、发送模块302、建模模块303以及确定模块304;
所述获取模块301,用于获取电子设备在预设时间段内的运行信息,并提取所述运行信息的特征信息。
在一实施例中,所述运行信息包括所述电子设备在预设时间段内的运行状态信息和硬件参数信息。对于系统运行状态数据和硬件数据信息其数据回传频率是不一致的,因此获取模块301需要对数据进行同步。具体而言,由于运行信息包含多种类型的信息,比如电子设备在预设时间段内的运行状态信息和硬件参数信息,因此可以按照其构成的时间序列数据对上述不同类型的运行信息进行数据同步。同步完成后再进行特征提取,以得到其数据的主成分。
所述发送模块302,用于将所述特征信息发送至服务器以使所述服务器建立以用户情感阈值作为经验轨迹的经验池。
在一实施例中,对步骤101得到的全景序列信息对应的主成分上传到云服务器上,具体可以通过TCP(传输控制协议)或IP(网际协议)协议进行上传。以使云服务器对第一用户、第二用户等不同用户在不同时间相同的情感作为一个经验轨迹,并存放在经验池中。
所述建模模块303,用于根据预设算法对所述运行信息进行特征建模,得到强化学习模型,其中,所述强化学习模型以情感阈值作为优化目标。
在一实施例中,上述预设算法可以为DDPG(深度确定性策略算法),对用户数据进行强化学习建模,以情感阈值作为用户当前的优化目标。
所述确定模块304,用于通过所述强化学习模型对所述经验池中的数据进行学习,以确定当前用户的情感阈值。
在本申请实施例中,通过对经验池进行经验回放技术,使用DDPG算法,对用户数据进行强化学习建模,以情感阈值作为用户当前的优化目标。并以反馈给用户的信号与用户的查看作为反馈(即奖励函数reward)。通过反复迭代训练对经验次的数据进行学习,从而周期性地确定用户情感阈值。
在一实施例中,请参阅图5,图5为本申请实施例提供的数据处理装置的另一种结构示意图,其中,所述获取模块301可以包括:获取子模块3011和同步子模块3012;
所述获取子模块3011,用于在获取电子设备在预设时间段内的运行信息之后,分别获取所述运行状态信息和硬件参数信息的时间序列数据;
所述同步子模块3012,用于根据所述时间序列数据对所述运行状态信息和硬件参数信息进行数据同步。
在一实施例中,所述确定模块304可以包括:更新子模块3041和确定子模块3042;
所述更新子模块3041,用于对所述经验池进行经验回收,以更新所述强化学习模型中的参数;
所述确定子模块3042,用于通过对所述强化学习模型反复迭代训练以确定当前用户的情感阈值。
由上述可知,本申请实施例的数据处理装置可以获取电子设备在预设时间段内的运行信息,并提取运行信息的特征信息,将特征信息发送至服务器以使服务器建立以用户情感阈值作为经验轨迹的经验池,根据预设算法对运行信息进行特征建模,得到强化学习模型,其中,强化学习模型以情感阈值作为优化目标,通过强化学习模型对经验池中的数据进行学习,以确定当前用户的情感阈值。本申请可以利用电子设备和云端结合的方法对情感阈值进行优化,从而提升情感阈值计算的准确性。
本申请实施例中,数据处理装置与上文实施例中的数据处理方法属于同一构思,在数据处理装置上可以运行数据处理方法实施例中提供的任一方法,其具体实现过程详见数据处理方法的实施例,此处不再赘述。
本文所使用的术语“模块”可看作为在该运算系统上执行的软件对象。本文所述的不同组件、模块、引擎及服务可看作为在该运算系统上的实施对象。而本文所述的装置及方法可以以软件的方式进行实施,当然也可在硬件上进行实施,均在本申请保护范围之内。
本申请实施例还提供一种存储介质,其上存储有计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行上述的数据处理方法。
本申请实施例还提供一种电子设备,如平板电脑、手机等。电子设备中的处理器会按照如下的步骤,将一个或一个以上的应用程序的进程对应的指令加载到存储器中,并由处理器来运行存储在存储器中的应用程序,从而实现各种功能:
获取电子设备在预设时间段内的运行信息,并提取所述运行信息的特征信息;
将所述特征信息发送至服务器以使所述服务器建立以用户情感阈值作为经验轨迹的经验池;
根据预设算法对所述运行信息进行特征建模,得到强化学习模型,其中,所述强化学习模型以情感阈值作为优化目标;
通过所述强化学习模型对所述经验池中的数据进行学习,以确定当前用户的情感阈值。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
请参阅图6,电子设备400包括处理器401以及存储器402。其中,处理器401与存储器402电性连接。
处理器400是电子设备400的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或加载存储在存储器402内的计算机程序,以及调用存储在存储器402内的数据,执行电子设备400的各种功能并处理数据,从而对电子设备400进行整体监控。
存储器402可用于存储软件程序以及模块,处理器401通过运行存储在存储器402的计算机程序以及模块,从而执行各种功能应用以及数据处理。存储器402可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的计算机程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备的使用所创建的数据等。此外,存储器402可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器402还可以包括存储器控制器,以提供处理器401对存储器402的访问。
在本申请实施例中,电子设备400中的处理器401会按照如下的步骤,将一个或一个以上的计算机程序的进程对应的指令加载到存储器402中,并由处理器401运行存储在存储器402中的计算机程序,从而实现各种功能,如下:
获取电子设备在预设时间段内的运行信息,并提取所述运行信息的特征信息;
将所述特征信息发送至服务器以使所述服务器建立以用户情感阈值作为经验轨迹的经验池;
根据预设算法对所述运行信息进行特征建模,得到强化学习模型,其中,所述强化学习模型以情感阈值作为优化目标;
通过所述强化学习模型对所述经验池中的数据进行学习,以确定当前用户的情感阈值。
请一并参阅图7,在一些实施方式中,电子设备400还可以包括:显示器403、射频电路404、音频电路405以及电源406。其中,其中,显示器403、射频电路404、音频电路405以及电源406分别与处理器401电性连接。
显示器403可以用于显示由用户输入的信息或提供给用户的信息以及各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示器403可以包括显示面板,在一些实施方式中,可以采用液晶显示器(Liquid Crystal Display,LCD)、或者有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板。
射频电路404可以用于收发射频信号,以通过无线通信与网络设备或其他电子设备建立无线通讯,与网络设备或其他电子设备之间收发信号。
音频电路405可以用于通过扬声器、传声器提供用户与电子设备之间的音频接口。
电源406可以用于给电子设备400的各个部件供电。在一些实施例中,电源406可以通过电源管理系统与处理器401逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
尽管图7中未示出,电子设备400还可以包括摄像头、蓝牙模块等,在此不再赘述。
在本申请实施例中,存储介质可以是磁碟、光盘、只读存储器(Read Only Memory,ROM)、或者随机存取记忆体(Random Access Memory,RAM)等。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
需要说明的是,对本申请实施例的数据处理方法而言,本领域普通测试人员可以理解实现本申请实施例数据处理方法的全部或部分流程,是可以通过计算机程序来控制相关的硬件来完成,计算机程序可存储于一计算机可读取存储介质中,如存储在电子设备的存储器中,并被该电子设备内的至少一个处理器执行,在执行过程中可包括如数据处理方法的实施例的流程。其中,的存储介质可为磁碟、光盘、只读存储器、随机存取记忆体等。
对本申请实施例的数据处理装置而言,其各功能模块可以集成在一个处理芯片中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中,存储介质譬如为只读存储器,磁盘或光盘等。
以上对本申请实施例所提供的一种数据处理方法、装置、存储介质及电子设备进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种数据处理方法,其特征在于,所述方法包括以下步骤:
获取电子设备在预设时间段内的运行信息,并提取所述运行信息的特征信息;
将所述特征信息发送至服务器以使所述服务器建立以用户情感阈值作为经验轨迹的经验池;
根据预设算法对所述运行信息进行特征建模,得到强化学习模型,其中,所述强化学习模型以情感阈值作为优化目标;
通过所述强化学习模型对所述经验池中的数据进行学习,以确定当前用户的情感阈值。
2.根据权利要求1所述的数据处理方法,其特征在于,所述运行信息包括所述电子设备在预设时间段内的运行状态信息和硬件参数信息;
在获取电子设备在预设时间段内的运行信息之后,所述方法还包括:
分别获取所述运行状态信息和硬件参数信息的时间序列数据;
根据所述时间序列数据对所述运行状态信息和硬件参数信息进行数据同步。
3.根据权利要求2所述的数据处理方法,其特征在于,提取所述运行信息的特征信息,包括:
获取所述运行信息的数据类型;
根据所述数据类型对所述运行信息进行特征提取,以得到所述运行信息当中多种数据所分别对应的特征信息。
4.根据权利要求1所述的数据处理方法,其特征在于,通过所述强化学习模型对所述经验池中的数据进行学习,以确定当前用户的情感阈值,包括:
对所述经验池进行经验回收,以更新所述强化学习模型中的参数;
通过对所述强化学习模型反复迭代训练以确定当前用户的情感阈值。
5.根据权利要求1所述的数据处理方法,其特征在于,所述预设算法为深度确定性策略算法。
6.一种数据处理装置,其特征在于,所述装置包括:获取模块、发送模块、建模模块以及确定模块;
所述获取模块,用于获取电子设备在预设时间段内的运行信息,并提取所述运行信息的特征信息;
所述发送模块,用于将所述特征信息发送至服务器以使所述服务器建立以用户情感阈值作为经验轨迹的经验池;
所述建模模块,用于根据预设算法对所述运行信息进行特征建模,得到强化学习模型,其中,所述强化学习模型以情感阈值作为优化目标;
所述确定模块,用于通过所述强化学习模型对所述经验池中的数据进行学习,以确定当前用户的情感阈值。
7.根据权利要求6所述的数据处理装置,其特征在于,所述运行信息包括所述电子设备在预设时间段内的运行状态信息和硬件参数信息;
所述获取模块包括:获取子模块和同步子模块;
所述获取子模块,用于在获取电子设备在预设时间段内的运行信息之后,分别获取所述运行状态信息和硬件参数信息的时间序列数据;
所述同步子模块,用于根据所述时间序列数据对所述运行状态信息和硬件参数信息进行数据同步。
8.根据权利要求6所述的数据处理装置,其特征在于,所述确定模块包括:更新子模块和确定子模块;
所述更新子模块,用于对所述经验池进行经验回收,以更新所述强化学习模型中的参数;
所述确定子模块,用于通过对所述强化学习模型反复迭代训练以确定当前用户的情感阈值。
9.一种存储介质,其上存储有计算机程序,其特征在于,当所述计算机程序在计算机上运行时,使得所述计算机执行如权利要求1至5任一项所述的数据处理方法。
10.一种电子设备,包括处理器和存储器,所述存储器存储有多条指令,其特征在于,所述处理器加载所述存储器中的指令用于执行以下步骤:
获取电子设备在预设时间段内的运行信息,并提取所述运行信息的特征信息;
将所述特征信息发送至服务器以使所述服务器建立以用户情感阈值作为经验轨迹的经验池;
根据预设算法对所述运行信息进行特征建模,得到强化学习模型,其中,所述强化学习模型以情感阈值作为优化目标;
通过所述强化学习模型对所述经验池中的数据进行学习,以确定当前用户的情感阈值。
CN201910282134.XA 2019-04-09 2019-04-09 数据处理方法、装置、存储介质及电子设备 Pending CN111797857A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910282134.XA CN111797857A (zh) 2019-04-09 2019-04-09 数据处理方法、装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910282134.XA CN111797857A (zh) 2019-04-09 2019-04-09 数据处理方法、装置、存储介质及电子设备

Publications (1)

Publication Number Publication Date
CN111797857A true CN111797857A (zh) 2020-10-20

Family

ID=72805676

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910282134.XA Pending CN111797857A (zh) 2019-04-09 2019-04-09 数据处理方法、装置、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN111797857A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113190542A (zh) * 2021-05-19 2021-07-30 西安图迹信息科技有限公司 一种电网用大数据清洗去噪方法、系统和计算机存储介质
CN115638833A (zh) * 2022-12-23 2023-01-24 保定网城软件股份有限公司 一种监控数据处理方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1514399A (zh) * 2002-11-25 2004-07-21 ��˹���´﹫˾ 用于健康监视和个人安全的成像方法和系统
US20070150099A1 (en) * 2005-12-09 2007-06-28 Seung Ik Lee Robot for generating multiple emotions and method of generating multiple emotions in robot
CN107194151A (zh) * 2017-04-20 2017-09-22 华为技术有限公司 确定情感阈值的方法和人工智能设备
CN107507629A (zh) * 2017-08-16 2017-12-22 重庆科技学院 热触觉音乐感知系统及其控制方法
CN109559530A (zh) * 2019-01-07 2019-04-02 大连理工大学 一种基于q值迁移深度强化学习的多交叉口信号灯协同控制方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1514399A (zh) * 2002-11-25 2004-07-21 ��˹���´﹫˾ 用于健康监视和个人安全的成像方法和系统
US20070150099A1 (en) * 2005-12-09 2007-06-28 Seung Ik Lee Robot for generating multiple emotions and method of generating multiple emotions in robot
CN107194151A (zh) * 2017-04-20 2017-09-22 华为技术有限公司 确定情感阈值的方法和人工智能设备
CN107507629A (zh) * 2017-08-16 2017-12-22 重庆科技学院 热触觉音乐感知系统及其控制方法
CN109559530A (zh) * 2019-01-07 2019-04-02 大连理工大学 一种基于q值迁移深度强化学习的多交叉口信号灯协同控制方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113190542A (zh) * 2021-05-19 2021-07-30 西安图迹信息科技有限公司 一种电网用大数据清洗去噪方法、系统和计算机存储介质
CN113190542B (zh) * 2021-05-19 2023-02-24 西安图迹信息科技有限公司 一种电网用大数据清洗去噪方法、系统和计算机存储介质
CN115638833A (zh) * 2022-12-23 2023-01-24 保定网城软件股份有限公司 一种监控数据处理方法及系统

Similar Documents

Publication Publication Date Title
CN111800331A (zh) 通知消息的推送方法、装置、存储介质及电子设备
CN111797288A (zh) 数据筛选方法、装置、存储介质及电子设备
CN110798718A (zh) 一种视频推荐方法以及装置
CN112990390A (zh) 一种图像识别模型的训练方法、图像识别的方法及装置
CN111797302A (zh) 模型处理方法、装置、存储介质及电子设备
CN111797870A (zh) 算法模型的优化方法、装置、存储介质及电子设备
CN111797851A (zh) 特征提取方法、装置、存储介质及电子设备
CN111798259A (zh) 应用推荐方法、装置、存储介质及电子设备
CN111797857A (zh) 数据处理方法、装置、存储介质及电子设备
CN111800445B (zh) 消息推送方法、装置、存储介质及电子设备
CN110544287A (zh) 一种配图处理方法及电子设备
CN111797079A (zh) 数据处理方法、装置、存储介质及电子设备
CN111796979B (zh) 数据采集策略的确定方法、装置、存储介质及电子设备
CN111797986A (zh) 数据处理方法、装置、存储介质及电子设备
CN111414496B (zh) 基于人工智能的多媒体文件的检测方法和装置
CN111796663B (zh) 场景识别模型更新方法、装置、存储介质及电子设备
CN113936240A (zh) 确定样本图像的方法、装置、设备及存储介质
CN111796314A (zh) 信息处理方法、装置、存储介质及电子设备
CN112270238A (zh) 一种视频内容识别方法和相关装置
CN111797655A (zh) 用户活动识别方法、装置、存储介质及电子设备
CN111797391A (zh) 高风险进程的处理方法、装置、存储介质及电子设备
CN107766892B (zh) 应用程序管控方法、装置、存储介质及终端设备
CN111797863A (zh) 模型训练方法、数据处理方法、装置、存储介质及设备
CN111800287B (zh) 数据处理方法、装置、存储介质及电子设备
CN111797869A (zh) 模型训练方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination