CN111797871A - 信息处理方法、装置、存储介质及电子设备 - Google Patents

信息处理方法、装置、存储介质及电子设备 Download PDF

Info

Publication number
CN111797871A
CN111797871A CN201910282434.8A CN201910282434A CN111797871A CN 111797871 A CN111797871 A CN 111797871A CN 201910282434 A CN201910282434 A CN 201910282434A CN 111797871 A CN111797871 A CN 111797871A
Authority
CN
China
Prior art keywords
information
user
similarity
target
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910282434.8A
Other languages
English (en)
Inventor
何明
陈仲铭
黄粟
刘耀勇
陈岩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Oppo Mobile Telecommunications Corp Ltd
Original Assignee
Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Oppo Mobile Telecommunications Corp Ltd filed Critical Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority to CN201910282434.8A priority Critical patent/CN111797871A/zh
Publication of CN111797871A publication Critical patent/CN111797871A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Databases & Information Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例提供一种信息处理方法、装置、存储介质及电子设备。获取第一用户的第一信息;当所述第一信息的信息量小于预设信息量时,获取第二用户的第二信息,所述第二用户与所述第一用户的相似度大于预设相似度,所述第二信息与所述第一信息的类型相同,所述第二信息用于对所述第一信息的信息量进行补充;基于所述第一信息和所述第二信息确定目标信息;对所述目标信息进行分类处理。信息处理方法根据用户自身信息量不足时基于云端和本地协同的方式对用户信息进行补充、更新,以对更新后的信息进行分类,以提高信息分类的精度。

Description

信息处理方法、装置、存储介质及电子设备
技术领域
本申请涉及电子技术领域,尤其涉及一种信息处理方法、装置、存储介质及电子设备。
背景技术
随着电子技术的发展,诸如智能手机等电子设备的智能化程度越来越高。电子设备可以对其数据信息进行分类处理,便于用户获取所需的数据。
发明内容
本申请实施例提供一种信息处理方法、装置、存储介质及电子设备,可以提升用户信息分类的准确性。
第一方面,本申请实施例提供一种信息处理方法,其包括:
获取第一用户的第一信息;
当所述第一信息的信息量小于预设信息量时,获取第二用户的第二信息,所述第二用户与所述第一用户的相似度大于预设相似度,所述第二信息与所述第一信息的类型相同;
基于所述第一信息和所述第二信息确定目标信息;
对所述目标信息进行分类处理。
第二方面,本申请实施例提供一种信息处理装置,其包括:
第一获取模块,用于获取第一用户的第一信息;
第二获取模块,用于获取第二用户的第二信息,所述第二用户与所述第一用户的相似度大于预设相似度,所述第二信息与所述第一信息的类型相同;
确定模块,用于基于所述第一信息和所述第二信息确定目标信息;
分类模块,用于对所述目标信息进行分类处理。
第三方面,本申请实施例提供一种存储介质,所述存储介质中存储有计算机程序,当所述计算机程序由处理器加载时实现如上所述方法。
第四方面,本申请实施例提供一种电子设备,其包括处理器和存储器,所述存储器中存储有计算机程序,所述处理器通过调用所述存储器中存储的所述计算机程序执行以实现如上所述方法。
本申请实施例电子设备可以调用其他用户的信息作为第一用户中信息的补充,可以提升第一用户信息分类的准确度。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
为了更完整地理解本申请及其有益效果,下面将结合附图来进行以下说明,其中在下面的描述中相同的附图标号表示相同部分。
图1为本申请实施例提供的全景感知框架的示意图。
图2为本申请实施例提供的信息处理方法的第一种流程示意图。
图3为本申请实施例提供的信息处理方法的第二种流程示意图。
图4为本申请实施例提供的信息处理方法中获取第二用户的第二信息的流程示意图。
图5为本申请实施例提供的信息处理方法中对目标信息进行分类处理的流程示意图。
图6为本申请实施例提供的信息处理方法的场景示意图。
图7为本申请实施例提供的信息处理装置的结构示意图。
图8为本申请实施例提供的电子设备的第一种结构示意图。
图9为本申请实施例提供的电子设备的第二种结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本申请的保护范围。
参考图1,图1为本申请实施例提供的全景感知框架的示意图。该全景感知架构可设置于电子设备。电子设备可为计算设备诸如膝上型计算机、包含嵌入式计算机的计算机监视器、平板电脑、蜂窝电话、媒体播放器、或其他手持式或便携式电子设备、较小的设备(诸如腕表设备、挂式设备、耳机或听筒设备、被嵌入在眼镜中的设备或者佩戴在用户的头部上的其他设备,或其他可佩戴式或微型设备)、电视机、不包含嵌入式计算机的计算机显示器、游戏设备、导航设备、嵌入式系统(诸如其中具有显示器的电子设备被安装在信息亭或汽车中的系统)、实现这些设备中的两个或更多个设备的功能的设备、或其他电子设备。在一些配置中,电子设备是便携式设备,诸如蜂窝电话、媒体播放器、平板电脑、或者其他便携式计算设备。如果需要,其他配置可用于电子设备。
其中,该全景感知架构可为电子设备中用于实现各种功能的硬件和软件的集成。全景感知架构包括信息感知层、数据处理层、特征抽取层、情景建模层以及智能服务层。
信息感知层用于获取电子设备自身的信息或者外部环境中的信息。所述信息感知层可以包括多个传感器。例如,所述信息感知层包括距离传感器、磁场传感器、光线传感器、加速度传感器、指纹传感器、霍尔传感器、位置传感器、陀螺仪、惯性传感器、姿态感应器、气压计、心率传感器等多个传感器。
其中,距离传感器可以用于检测电子设备与外部物体之间的距离。磁场传感器可以用于检测电子设备所处环境的磁场信息。光线传感器可以用于检测电子设备所处环境的光线信息。加速度传感器可以用于检测电子设备的加速度数据。指纹传感器可以用于采集用户的指纹信息。霍尔传感器是根据霍尔效应制作的一种磁场传感器,可以用于实现电子设备的自动控制。位置传感器可以用于检测电子设备当前所处的地理位置。陀螺仪可以用于检测电子设备在各个方向上的角速度。惯性传感器可以用于检测电子设备的运动数据。姿态感应器可以用于感应电子设备的姿态信息。气压计可以用于检测电子设备所处环境的气压。心率传感器可以用于检测用户的心率信息。
数据处理层用于对信息感知层获取到的数据进行处理。例如,数据处理层可以对信息感知层获取到的数据进行数据清理、数据集成、数据变换、数据归约等处理。
其中,数据清理是指对信息感知层获取到的大量数据进行清理,以剔除无效数据和重复数据。数据集成是指将信息感知层获取到的多个单维度数据集成到一个更高或者更抽象的维度,以对多个单维度的数据进行综合处理。数据变换是指对信息感知层获取到的数据进行数据类型的转换或者格式的转换等,以使变换后的数据满足处理的需求。数据归约是指在尽可能保持数据原貌的前提下,最大限度的精简数据量。
特征抽取层用于对数据处理层处理后的数据进行特征抽取,以提取所述数据中包括的特征。提取到的特征可以反映出电子设备自身的状态或者用户的状态或者电子设备所处环境的环境状态等。
其中,特征抽取层可以通过过滤法、包装法、集成法等方法来提取特征或者对提取到的特征进行处理。
过滤法是指对提取到的特征进行过滤,以删除冗余的特征数据。包装法用于对提取到的特征进行筛选。集成法是指将多种特征提取方法集成到一起,以构建一种更加高效、更加准确的特征提取方法,用于提取特征。
情景建模层用于根据特征抽取层提取到的特征来构建模型,所得到的模型可以用于表示电子设备的状态或者用户的状态或者环境状态等。例如,情景建模层可以根据特征抽取层提取到的特征来构建关键值模型、模式标识模型、图模型、实体联系模型、面向对象模型等。
智能服务层用于根据情景建模层所构建的模型为用户提供智能化的服务。例如,智能服务层可以为用户提供基础应用服务,可以为电子设备进行系统智能优化,还可以为用户提供个性化智能服务。
此外,全景感知架构中还可以包括多种算法,每一种算法都可以用于对数据进行分析处理,所述多种算法可以构成算法库。例如,所述算法库中可以包括马尔科夫算法、隐含狄里克雷分布算法、贝叶斯分类算法、支持向量机、K均值聚类算法、K近邻算法、条件随机场、残差网络、长短期记忆网络、卷积神经网络、循环神经网络等算法。
本申请实施例提供一种信息处理方法,其包括:获取第一用户的第一信息;当所述第一信息的信息量小于预设信息量时,获取第二用户的第二信息,所述第二用户与所述第一用户的相似度大于预设相似度,所述第二信息与所述第一信息的类型相同,所述第二信息用于对所述第一信息的信息量进行补充;基于所述第一信息和所述第二信息确定目标信息;对所述目标信息进行分类处理。本申请实施例电子设备可以调用其他用户的信息作为第一用户中信息的补充,可以提升第一用户信息分类的准确度。
参考图2,图2为本申请实施例提供的信息处理方法的第一种流程示意图。所述信息处理方法包括以下步骤:
101,获取第一用户的第一信息。
其中,第一用户可为单独的用户,诸如张三。一般而言,一个电子设备诸如智能手机对应有一个用户,该用户可为电子设备的使用者。可以通过用户标识等方式确定用户,用户标识诸如为用户使用的电话号码、各种应用的名称等。例如:一电子设备的使用者为第一用户。
可以理解的是,第一用户所使用的电子设备可直接获取到第一用户的各种信息,诸如电子设备可通过其上的第一获取模块获取到第一用户的短信息。
第一用户的信息可包括各种类型的信息,诸如文本类信息、即时通讯类信息或其他类型信息。其中,文本类信息可包括短信息、邮件等信息。本申请实施例可将第一信息确定为文本类信息,即第一信息可包括短信息、邮件等信息,诸如第一信息以短信息为例。
其中,第一信息可以为零个,也可以为一个,也可以为多个。可以理解的是,不同用户的第一信息一般是不同的,且同一用户不同时间段的第一信息也可能是不同的。不同用户的第一信息的信息量一般是不同的,且同一用户不同时间段的第一信息的信息量也可能是不同的。
电子设备获取到第一用户的第一信息可以进行存储,电子设备也可以将其获取到的第一用户的第一信息发送至对应的服务器,或者说服务器可以从电子设备获取到第一用户的第一信息。
102,当所述第一信息的信息量小于预设信息量时,获取第二用户的第二信息,所述第二用户与所述第一用户的相似度大于预设相似度,所述第二信息与所述第一信息的类型相同,所述第二信息用于对所述第一信息的信息量进行补充。
其中,第二用户为不同于第一用户的用户,诸如第二用户为李四、陈五等。第二用户可以为多个,每一个第二用户可以具有相应的第二信息。其中,第二信息的类型与第一信息的类型相同,诸如第二信息为文本类信息,即第二信息可包括短信息、邮件等信息。第二信息可用于对第一信息的信息进行补充。
其中,每个信息都具有对应的信息量,可以通过信息熵计算方法计算得到。诸如通过信息熵计算方法计算第一信息得到与其对应的信息量。可以将计算得到的第一信息的信息量与预设信息量进行比对分析。当第一信息的信息量小于预设信息量时,服务器可以获取第二用户的第二信息,以通过第二信息对第一信息的信息量进行补充。其中,预设信息量可以预先存储于在服务器。
服务器获取到第二用户的第二信息,可以对第二用户的第二信息进行存储。服务器可以将其获取到的第二用户的第二信息发送给电子设备,或者说电子设备可以从服务器获取第二用户的第二信息。
103,基于所述第一信息和所述第二信息确定目标信息。
示例性的,服务器从电子设备获取到第一用户的第一信息以及通过大数据获取到第二用户的第二信息后,服务器可以将第一信息和第二信息确定为目标信息,服务器可以通过该目标信息对第一用户的第一信息进行更新,即第一用户信息更新后形成目标信息。从而实现采用相似度大于预设相似度的第二用户的第二信息对第一用户的第一信息的补充。
示例性的,电子设备获取到第一用户的第一信息以及从服务器获取到第二用户的第二信息后,电子设备可将第一信息和第二信息确定为目标信息,电子设备可以通过该目标信息对第一用户的第一信息进行更新,即第一用户信息更新后形成目标信息。从而实现采用相似度大于预设相似度的第二用户的第二信息对第一用户的第一信息的补充。
104,对所述目标信息进行分类处理。
示例性的,服务器对第一用户的信息更新后得到目标信息,服务器可针对目标信息进行分类处理。诸如服务器将目标信息分成营销类信息、感情类信息、办公类信息等。服务器对目标信息分类完成后,服务器可将分类完成后的数据发送给电子设备,或者说电子设备可从服务器获取到分类完成后的数据。
示例性的,电子设备对第一用户的信息更新后得到目标信息,电子设备可针对目标信息进行分类处理。诸如电子设备将目标信息分成营销类信息、感情类信息、办公类信息等。以便用户查看、管理等。
本申请实施例在第一用户的第一信息的信息量不满足条件时,或者说第一信息的信息量不足以对信息进行分类时,可以通过协同过滤的方式计算得到与第一用户相似的第二用户,并将相似用户的第二信息添加到第一用户的数据中,以形成目标信息,以扩充第一用户的信息量,使得能够对第一用户的信息进行分类处理,以提升用户信息分类的准确性。其中,相似用户即为上述第二用户,其与第一用户的相似度大于预设相似度。
参考图3,图3为本申请实施例提供的信息处理方法的第二种流程示意图。所述信息处理方法包括以下步骤:
201,获取第一用户的第一信息。具体请参阅步骤101,在此不再赘述。
202,采用信息熵计算方法计算所述第一信息的信息量。
示例性的,采用信息熵计算方法对第一信息进行计算以得到第一信息的信息量。需要说明的是,计算第一信息的信息量的方式并不限于此,还可以采用其他方式。可在电子设备端计算第一信息的信息量,也可以在服务器端计算第一信息的信息量。
203,判断所述第一信息的信息量是否大于预设信息量。
预设信息量可存储于电子设备的存储器中,预设信息量也可以存储于服务器的数据库中。
当第一用户的第一信息的信息量达到一定信息量时,诸如第一用户的第一信息的信息量大于或等于预设信息量。用户可能不便于从第一信息中查找其中某一个或其中几个信息。为此,可以采用分类的方式将第一用户的第一信息进行分类处理,以便于用户根据不同的类别进行查找,进而用于第一用户能够快速查找其所需的信息。
当第一用户的第一信息的信息量未能够达到一定信息量时,诸如第一用户的第一信息的第一信息量小于预设信息量时。如果直接对该第一用户的第一信息进行分类处理,则分类的准确性可能不足,影响第一用户快速找到其所需信息的精度。为此,本申请实施例可获取其他用户的信息对第一用户的第一信息进行补充。
示例性的,电子设备可通过其上的第一获取模块获取到第一用户的第一信息,电子设备可基于预设信息量和计算得到的信息量通过电子设备上的第一判断模块对预设信息量和计算得到的信息量进行判断。即将第一信息的信息量和预设信息量进行比较,进而判断第一信息的信息量与预设信息量之间的大小关系。若电子设备的第一判断模块判断出第一信息的信息量小于预设信息量时,则可以确定第一用户的第一信息的信息量不足以对第一信息进行分类。若电子设备的第一判断模块判断出第一信息的信息不小于预设信息量时,则可以确定第一用户的第一信息的信息量足够进行分类处理。
需要说明的是,对第一用户的信息和预设信息量进行比较判断过程并不限于电子设备,诸如服务器具有第二判断模块,可通过服务器的第二判断模块对第一信息的信息和预设信息量进行比较判断,以得到比较结果。
因此,本申请实施例可以通过电子设备获取到与第一用户的相似度大于预设相似度的第二用户,进而可以获取到第二用户的第二信息。由于第二用户为第一用户的相似用户,且第二信息的类型与第一信息的类型相同,进而可以将第二信息作为第一信息的补充,以对第一用户的信息进行更新得到目标信息。从而增加第一用户中信息的信息量,便于分类,以提升分类的准确性。
示例性的,服务器可以通过大数据获取到多个用户,并通过协同过滤的方式从多个用户中挑选出与第一用户相似的第二用户。需要说明的是,服务器也可以将其获取到的多个用户发送给电子设备,电子设备端通过协同过滤的方式挑选出第二用户。
请参阅图4,图4为本申请实施例提供的信息处理方法中获取第二用户的第二信息的流程示意图。所述获取第二用户的第二信息包括以下步骤:
2051,获取第三用户的第三信息,所述第三用户为多个用户,所述第三信息与所述第一信息的类型相同。
第三信息的类型与第一信息的类型相同,第三信息可以为文本类信息,诸如短信息。第三用户可以为多个用户,第三用户的个数大于第二用户的个数。每一个第三用户具有第三信息。
示例性的,服务器可通过大数据获取第三用户及第三信息。服务器可以将其获取到的第三用户及第三信息进行存储或处理,服务器也可以将其获取到的第三用户及第三信息发送至电子设备。即电子设备可从服务器获取到第三用户及第三信息。
2052,基于所述第一信息和所述第三信息获取每一个所述第三用户与所述第一用户之间的相似度。
服务器可以通过协同过滤的方式获取每一个第三用户与第一用户之间的相似度。需要说明的是,电子设备也可以通过协同过滤的方式获取每一个第三用户与第一用户之间的相似度。需要说明的是,也可以通过其他方式获取每一个第三用户与第一用户之间的相似度。诸如,服务器基于第一信息和第三信息逐个依次判断每一个所述第三用户与所述第一用户之间的相似度是否大于预设相似度。
2053,根据所述相似度从所述第三用户中确定出相似度大于预设相似度的一个或多个第二用户。
可以理解的,本申请实施例服务器可获取每一个第三用户与第一用户之间的相似度,服务器可通过其上的第三判断模块对每一个相似度与预设相似度进行比较、判断,以得到比较结果。若所述相似度大于所述预设相似度,则服务器存储所述相似度对应的第三用户。若所述相似度不大于所述预设相似度,则服务器丢弃所述相似度对应的第三用户。并将已存储的所有第三用户确定为第二用户。需要说明的是,电子设备也可以通过其上的第四判断模块对相似度与预设相似度进行比较和判断,以得到比较结果。
2054,从所述第二用户中获取第二信息。
服务器或电子设备可以从第二用户的大量信息中抽取出与第一信息类型相同的第二信息。从而本申请实施例通过大数据对用户的筛选以获取到相似用户,再从相似用户中抽取出同类信息,从而就可以大大提高第二信息和第一信息的相似度。
204,若所述第一信息的信息量不小于所述预设信息量,则将所述第一信息确定为目标信息。
可以理解的是,第一信息的信息量不小于预设信息量,则第一信息的信息量足够进行分类处理。因此,当服务器或电子设备判断出第一信息的信息量不小于预设信息量,则可以直接将第一信息确定为目标信息,无需再额外耗费资源对第一用户的信息进行补充。
205、若所述第一信息的信息量小于预设信息量,获取第二用户的第二信息,所述第二用户与所述第一用户的相似度大于预设相似度,所述第二信息与所述第一信息的类型相同,所述第二信息用于对所述第一信息的信息量进行补充。
可以理解的是,第一信息的信息量小于预设信息量,则第一信息的信息量不足以对信息进行分类,可以通过获取相似用户的信息对第一用户的信息进行补充,以使得第一用户的信息补充后更新得到的目标信息的信息量足够对信息进行分类。从而就可以实现在提升第一用户信息分类的准确度的情况下,具有较强的自适应能力。
示例性的,第二用户的数量与第一信息的信息量成反比。或者说相似用户的数据与第一信息的信息量成反比。即第一信息的信息量越多,可挑选出来的相似用户越少;第一信息的信息量越少,可挑选出来的相似用户越多。
206,基于所述第一信息和所述第二信息确定目标信息;
服务器或电子设备可将第二信息补充到第一用户的信息中,或者说可以将第一信息和第二信息进行融合以得到目标信息,该目标信息为第一用户的信息更新后所形成的信息。即目标信息为第一用户更新后的信息。
207,对所述目标信息进行分类处理。
可以理解的是,当第一信息的信息量不小于预设信息量时,电子设备或服务器可直接将第一信息确定为目标信息,并对目标信息进行分类处理。或者说电子设备或服务器可直接对第一信息进行分类处理。而当第一信息的信息量小于预设信息量时,电子设备或服务器可通过协同过滤的方式获取到第二用户的第二信息,并将其作为第一用户的信息的补充,以得到更新后的目标信息。服务器或电子设备可以对更新后的目标信息进行分离处理。
请参阅图5,图5为本申请实施例提供的信息处理方法中对目标信息进行分类处理的流程示意图。所述对目标信息进行分类处理包括以下步骤:
2071,从所述目标信息中抽取语义特征向量。
服务器或电子设备可以从目标信息中抽取语义特征向量。诸如服务器或电子设备利用递归神经网络模型从目标信息中抽取语义特征向量。即将目标信息输入到递归神经网络模型中以得到语义特征向量。可以理解的是,目标信息通常为文本信息,其并不便于进行直接分类计算等。为此,本申请实施例将目标信息通过递归神经网络模型转化为数字,进而便于进行分类、计算等各种运算。
需要说明的是,抽取语义特征向量的方式并不限于此,诸如采用词向量进行语义特征向量提取等。
2072,基于所述语义特征向量,对所述目标信息进行分类处理。
服务器或电子设备获取到语义特征向量后,可以采用支持向量机(SupportVector Machine,SVM)对目标信息进行分类处理。即通过支持向量机分类方法对目标信息进行分类。诸如将语义特征向量输入到支持向量机中,以得到分类后的类别,诸如营销类信息、感情类信息、办公类信息等。
需要说明的是,对目标信息进行分类的方式并不限于此,诸如采用邻近算法(k-NearestNeighbor,kNN)对目标信息进行分类处理。
可以理解的是,电子设备对目标信息分类处理后,其方便用户使用。服务器对目标信息处理后,可以将其分类处理后的结果发送给电子设备,或者说电子设备可以从服务器获取分类结果。
因此,本技术方案通过联合云端和本地的其他用户信息协同地进行用户的信息归类,实现了一种精度更高、鲁棒性更强的信息归类方法(即信息处理方法),显著提升了用户的使用体验。此外,在保证归类准确度的基础之上,有效地降低了电子设备的资源消耗,很好地平衡了准确性和资源利用率。
为了进一步详细说明本申请,下面举例说明。
请参阅图6,图6为本申请实施例提供的信息处理方法的场景示意图。该场景可包括电子设备10和服务器20,电子设备10诸如智能手机等,服务器20诸如云端等。
电子设备10可收集第一用户的各种信息,并可以从第一用户的各种信息中提取出文本类信息。
电子设备10可将其得到的信息进行脱敏处理,诸如对相关短信息发送方号码进行哈希(Hash)处理。其可防止用户的隐私信息外露。电子设备10对其得到的信息脱敏处理可得到第一信息。其中,第一信息可参阅以上内容,在此不再赘述。
电子设备10可以将该第一信息上传至服务器20。或者说服务器20从电子设备10获取该第一信息。服务器20可以采用关系型数据库管理系统(MySQL)构建云端第一用户信息数据库。该数据库可存储第一用户的第一信息。
服务器20可采用信息熵计算方法对第一用户的第一信息进行计算,以得到第一信息的信息量。
根据需求确定预设信息量,或者说信息量阈值。
服务器20将第一信息的信息量和预设信息量进行比较、判断,以得到比较结果。
当第一信息的信息量小于预设信息量时,则服务器20基于大数据通过协同过滤的方式挑选出相似用户,或者说挑选出相似度大于预设相似度的用户。并基于相似用户,从相似用户中挑选出同类信息,以将挑选出的同类信息和存储于数据库中的第一信息进行融合,并将其确定为目标信息。目标信息用来对存储于数据库中的第一信息进行更新,数据库更新后其存储的信息为目标信息,该目标信息作为第一用户的信息,其实现对第一用户的信息的扩充。
示例性的,服务器20通过协同过滤的方法,计算第一用户与其他用户的相似度,并根据计算得到的相似度,可选择相似度比较接近的n个用户作为相似用户。需要说明的是,n值可以基于信息量自动设定。具体而言,当第一用户的信息量较小时,可设定大的n值;当第一用户的信息量较大时,可设定小一些的n值。其中,n可以为大于零的自然数。
由此,本申请实施例在确保数据量足够的情况下,还可以节省资源的占用。
服务器20将挑选出来的相似用户中挑选出同类信息,或者说服务器20从相似用户中抽取相似信息,并将同类信息添加到数据库中,以对第一用户的信息进行更新,形成目标信息。从而完成第一用户的信息的填充。为第一用户数据量较少时,难以对信息进行准确分类。通过扩充第一用户的数据,可以有效的提升信息分类的准确度。
当第一信息的信息量大于预设信息量时,服务器20直接将第一信息作为目标信息。即服务器20并不对第一用户的信息进行更新。
服务器20基于第一用户的信息,采用递归神经网络模型,学习文本信息的语义特征向量。递归神经网络模型能够处理大规模的文本数据,尤为重要的是,递归神经网络模型相较于其他的方法能够提取出表征能力更强、更为精确的语义特征向量。通过输入文本信息,可输出语义特征向量。语义特征向量是对针对某一句或者某一段话的数字特征向量,也可以说是解释。因文本信息不能直接放到递归神经网络模型或其他模型中进行分类等计算,本申请实施例将其转化为数字之后可以进行运算,以便于分类。
服务器20基于信息语义特征向量,采用支持向量机分类方法,对第一用户的目标信息进行分类。通过输入语义特征向量,可输出目标信息的具体类别,比如营销类信息、感情类信息、办公类信息等。
服务器20将获得的分类结果返回到电子设备10,对第一用户的信息进行分类,即实现了第一用户的信息的准确分类。
由此,本申请实施例构建的多用户信息协同的信息归类方案,通过自动决定是否调用其他用户的信息帮助第一用户训练,既降低了资源消耗,又提升了第一用户信息分类的准确度,具有较强的自适应能力;通过云端和设备联动的计算方式,在保证分类精度的前提下,显著降低了终端的资源消耗。在第一用户数据量不足以支撑信息准确分类时,通过协同学习的方法自动挑选第一用户的相似用户数据,极大地提升了第一用户的信息分类准确度,避免了冷启动等情况,保证了新用户或者信息数据量不足用户的使用体验。通过递归神经网络模型,准确提取了文本信息的语义特征,保证了最终信息分类的准确度。
在本申请实施例中,可以通过信息感知层获取用户的各种信息,诸如获取第一用户的信息。可以通过数据处理层对获取到的信息进行处理,诸如脱敏处理以得到第一信息。可以通过特征抽取层对处理后的信息进行特征提取以得到第一信息。还可以通过特征抽取层对于第一信息相类似的其它信息中抽取而得到相似信息。可以通过情景建模层对特征抽取层所得到的特征来构件模型诸如分类模型,进而可根据分类模型诸如支持向量机分类模型对第一用户的第一信息进行分类处理,以达到准确分类的目的。从而可以通过智能服务层为用户提供个性化智能分类。
请参阅图7,图7为本申请实施例提供的信息处理装置的结构示意图。信息处理装置100包括:第一获取模块110、第二获取模块120、确定模块130和分类模块140。
第一获取模块110,用于获取第一用户的第一信息。
其中,第一用户可参阅以上内容,在此不再赘述。其中,第一用户的第一信息可参阅以上内容,在此不再赘述。
第一获取模块110可集成在电子设备内,诸如第一获取模块110集成在电子设备的主板上。第一获取模块110可获取到第一用户的各种信息,其可以从第一用户的各种信息中提取出文本类信息。第一获取模块110所获取到的第一信息可直接存储在电子设备中,也可以发送给服务器。
需要说明的是,第一获取模块110也可以集成在服务器端,服务器可通过第一获取模块110从第一用户获取第一信息。
第二获取模块120,用于当所述第一信息的信息量小于预设信息量时,获取第二用户的第二信息,所述第二用户与所述第一用户的相似度大于预设相似度,所述第二信息与所述第一信息的类型相同,所述第二信息用于对所述第一信息的信息量进行补充。
其中,第二用户及其第二信息可参阅以上内容,在此不再赘述。
第二获取模块120可集成在电子设备内,诸如第二获取模块120集成在电子设备的主板上。第二获取模块120可从服务器端获取到第二用户及第二信息。
需要说明的是,第二获取模块120也可以集成在服务器上,服务器可基于大数据获取第二用户及第二信息。服务器可将获取到的数据发送给电子设备。
确定模块130,用于基于所述第一信息和所述第二信息确定目标信息。
确定模块130,还用于当所述第一信息的信息量不小于所述预设信息量时,将所述第一信息确定为目标信息;
确定模块130可集成在电子设备内,诸如第二获取模块120集成在电子设备的主板上。需要说明的是,确定模块130也可以集成在服务器上。确定模块130可包括比较器,可通过比较器对第一信息的信息量和预设信息量进行比较判断,以得到比较结果,并可根据比较结果确定出目标信息。
分类模块140,用于对所述目标信息进行分类处理。分类模块140可集成在电子设备内,诸如分类模块140集成在电子设备的主板上。需要说明的是,分类模块140也可以集成在服务器上。分类模块140可将目标信息分成营销类信息、感情类信息、办公类信息等。以便用户查看、管理等。
本申请实施例在第一用户的第一信息的信息量不满足条件时,或者说第一信息的信息量不足以对信息进行分类时,可以通过协同过滤的方式计算得到与第一用户相似的第二用户,并将相似用户的第二信息添加到第一用户的数据中,以形成目标信息,以扩充第一用户的信息量,使得能够对第一用户的信息进行分类处理,以提升用户信息分类的准确性。
参考图8,图8为本申请实施例提供的电子设备的第一种结构示意图。其中,电子设备10包括处理器11和存储器12。所述处理器11与存储器12电性连接。
处理器11是电子设备10的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或调用存储在存储器12内的计算机程序,以及调用存储在存储器12内的数据,执行电子设备的各种功能和处理数据,从而对电子设备进行整体监控。
在本实施例中,电子设备10中的处理器11会按照如下的步骤,将一个或一个以上的计算机程序的进程对应的指令加载到存储器12中,并由处理器11来运行存储在存储器12中的计算机程序,从而实现各种功能:
获取第一用户的第一信息;
当所述第一信息的信息量小于预设信息量时,获取第二用户的第二信息,所述第二用户与所述第一用户的相似度大于预设相似度,所述第二信息与所述第一信息的类型相同,所述第二信息用于对所述第一信息的信息量进行补充;
基于所述第一信息和所述第二信息确定目标信息;
对所述目标信息进行分类处理。
在一些实施例中,所述获取第一用户的第一信息之后,所述处理器11还用于执行:
当所述第一信息的信息量不小于所述预设信息量时,将所述第一信息确定为目标信息;
对所述目标信息进行分类处理。
在一些实施例中,所述获取第二用户的第二信息时,所述处理器11还用于执行以下步骤:
获取第三用户的第三信息,所述第三用户为多个用户,所述第三信息与所述第一信息的类型相同;
基于所述第一信息和所述第三信息获取每一个所述第三用户与所述第一用户之间的相似度;
根据所述相似度从所述第三用户中确定出相似度大于预设相似度的一个或多个第二用户;
从所述第二用户中获取第二信息。
在一些实施例中,所述基于所述第一信息和所述第三信息获取每一个所述第三用户与所述第一用户的相似度时,所述处理器11还用于执行以下步骤:
基于所述第一信息和所述第三信息,通过协同过滤的方式获取每一个所述第三用户与所述第一用户之间的相似度。
在一些实施例中,所述基于所述第一信息和所述第三信息获取每一个所述第三用户与所述第一用户的相似度之后,所述处理器11还用于执行以下步骤:
依次判断每一个相似度是否大于预设相似度;
若所述相似度大于所述预设相似度,则存储所述相似度对应的第三用户;
若所述相似度不大于所述预设相似度,则丢弃所述相似度对应的第三用户;
将已存储的第三用户确定为第二用户。
在一些实施例中,当所述第二用户为多个时,所述第二用户的数量与所述第一信息的信息量成反比。
在一些实施例中,对所述目标信息进行分类处理时,所述处理器11还用于执行以下步骤:
基于递归神经网络模型从所述目标信息中抽取语义特征向量;
基于所述语义特征向量对所述目标信息进行分类处理。
存储器12可用于存储计算机程序和数据。存储器12存储的计算机程序中包含有可在处理器中执行的指令。计算机程序可以组成各种功能模块。处理器11通过调用存储在存储器12的计算机程序,从而执行各种功能应用以及数据处理。
在一些实施例中,参考图9,图9为本申请实施例提供的电子设备的第二种结构示意图。
其中,电子设备10还包括:显示屏13、控制电路14、输入单元15、传感器16以及电源17。其中,处理器11分别与显示屏13、控制电路14、输入单元15、传感器16以及电源17电性连接。
显示屏13可用于显示由用户输入的信息或提供给用户的信息以及电子设备的各种图形用户接口,这些图形用户接口可以由图像、文本、图标、视频和其任意组合来构成。
控制电路14与显示屏13电性连接,用于控制显示屏13显示信息。
输入单元15可用于接收输入的数字、字符信息或用户特征信息(例如指纹),以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。其中,输入单元15可以包括指纹识别模组。
传感器16用于采集电子设备自身的信息或者用户的信息或者外部环境信息。例如,传感器16可以包括距离传感器、磁场传感器、光线传感器、加速度传感器、指纹传感器、霍尔传感器、位置传感器、陀螺仪、惯性传感器、姿态感应器、气压计、心率传感器等多个传感器。
电源17用于给电子设备10的各个部件供电。在一些实施例中,电源17可以通过电源管理系统与处理器301逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
尽管图9中未示出,电子设备10还可以包括摄像头、蓝牙模块等,在此不再赘述。
本申请实施例还提供一种存储介质,所述存储介质中存储有计算机程序,当所述计算机程序在计算机上运行时,所述计算机执行上述任一实施例所述的信息处理方法。
例如,在一些实施例中,当所述计算机程序在计算机上运行时,所述计算机执行以下步骤:
获取第一用户的第一信息;
当所述第一信息的信息量小于预设信息量时,获取第二用户的第二信息,所述第二用户与所述第一用户的相似度大于预设相似度,所述第二信息与所述第一信息的类型相同,所述第二信息用于对所述第一信息的信息量进行补充;
基于所述第一信息和所述第二信息确定目标信息;
对所述目标信息进行分类处理。
需要说明的是,本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过计算机程序来指令相关的硬件来完成,所述计算机程序可以存储于计算机可读存储介质中,所述存储介质可以包括但不限于:只读存储器(ROM,Read OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁盘或光盘等。
以上对本申请实施例所提供的信息处理方法、装置、存储介质及电子设备进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (13)

1.一种信息处理方法,其特征在于,所述方法包括:
获取第一用户的第一信息;
当所述第一信息的信息量小于预设信息量时,获取第二用户的第二信息,所述第二用户与所述第一用户的相似度大于预设相似度,所述第二信息与所述第一信息的类型相同,所述第二信息用于对所述第一信息的信息量进行补充;
基于所述第一信息和所述第二信息确定目标信息;
对所述目标信息进行分类处理。
2.根据权利要求1所述的信息处理方法,其特征在于,所述获取第一用户的第一信息之后,所述方法还包括:
当所述第一信息的信息量不小于所述预设信息量时,将所述第一信息确定为目标信息;
对所述目标信息进行分类处理。
3.根据权利要求1或2所述的信息处理方法,其特征在于,所述获取第二用户的第二信息,包括:
获取第三用户的第三信息,所述第三用户为多个用户,所述第三信息与所述第一信息的类型相同;
基于所述第一信息和所述第三信息获取每一个所述第三用户与所述第一用户之间的相似度;
根据所述相似度从所述第三用户中确定出相似度大于预设相似度的一个或多个第二用户;
从所述第二用户中获取第二信息。
4.根据权利要求3所述的信息处理方法,其特征在于,所述基于所述第一信息和所述第三信息获取每一个所述第三用户与所述第一用户的相似度,包括:
基于所述第一信息和所述第三信息,通过协同过滤的方式获取每一个所述第三用户与所述第一用户之间的相似度。
5.根据权利要求3所述的信息处理方法,其特征在于,所述基于所述第一信息和所述第三信息获取每一个所述第三用户与所述第一用户的相似度之后,所述方法还包括:
依次判断每一个相似度是否大于预设相似度;
若所述相似度大于所述预设相似度,则存储所述相似度对应的第三用户;
若所述相似度不大于所述预设相似度,则丢弃所述相似度对应的第三用户;
所述根据所述相似度从所述第三用户中确定出相似度大于预设相似度的一个或多个第二用户,包括:
将已存储的第三用户确定为第二用户。
6.根据权利要求3所述的信息处理方法,其特征在于,当所述第二用户为多个时,所述第二用户的数量与所述第一信息的信息量成反比。
7.根据权利要求1或2所述的信息处理方法,其特征在于,所述对所述目标信息进行分类处理,包括:
从所述目标信息中抽取语义特征向量;
基于所述语义特征向量对所述目标信息进行分类处理。
8.根据权利要求7所述的信息处理方法,其特征在于,所述从所述目标信息中抽取语义特征向量,包括:
基于递归神经网络模型从所述目标信息中抽取语义特征向量。
9.根据权利要求7所述的信息处理方法,其特征在于,所述基于所述语义特征向量对所述目标信息进行分类处理,包括:
基于所述语义特征向量,采用支持向量机对所述目标信息进行分类处理。
10.根据权利要求1或2所述的信息处理方法,其特征在于,所述获取第一用户的第一信息之后,所述方法还包括:
采用信息熵计算方法计算所述第一信息的信息量;
判断所述信息量是否大于预设信息量。
11.一种信息处理装置,其特征在于,所述装置包括:
第一获取模块,用于获取第一用户的第一信息;
第二获取模块,用于获取第二用户的第二信息,所述第二用户与所述第一用户的相似度大于预设相似度,所述第二信息与所述第一信息的类型相同,所述第二信息用于对所述第一信息的信息量进行补充;
确定模块,用于基于所述第一信息和所述第二信息确定目标信息;
分类模块,用于对所述目标信息进行分类处理。
12.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,当所述计算机程序由处理器加载时实现如权利要求1至10任一项所述的方法。
13.一种电子设备,其特征在于,包括处理器和存储器,所述存储器中存储有计算机程序,所述处理器通过调用所述存储器中存储的所述计算机程序执行以实现如权利要求1至10任一项所述的方法。
CN201910282434.8A 2019-04-09 2019-04-09 信息处理方法、装置、存储介质及电子设备 Pending CN111797871A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910282434.8A CN111797871A (zh) 2019-04-09 2019-04-09 信息处理方法、装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910282434.8A CN111797871A (zh) 2019-04-09 2019-04-09 信息处理方法、装置、存储介质及电子设备

Publications (1)

Publication Number Publication Date
CN111797871A true CN111797871A (zh) 2020-10-20

Family

ID=72805738

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910282434.8A Pending CN111797871A (zh) 2019-04-09 2019-04-09 信息处理方法、装置、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN111797871A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012248017A (ja) * 2011-05-27 2012-12-13 Nippon Telegr & Teleph Corp <Ntt> 行動モデル学習装置、方法、及びプログラム
CN104765873A (zh) * 2015-04-24 2015-07-08 百度在线网络技术(北京)有限公司 用户相似度确定方法和装置
CN107066449A (zh) * 2017-05-09 2017-08-18 北京京东尚科信息技术有限公司 信息推送方法和装置
CN107657007A (zh) * 2017-09-22 2018-02-02 广东欧珀移动通信有限公司 信息推送方法、装置、终端、可读存储介质及系统
CN107688984A (zh) * 2017-07-27 2018-02-13 上海壹账通金融科技有限公司 产品信息推送方法、装置、存储介质和计算机设备
CN109472024A (zh) * 2018-10-25 2019-03-15 安徽工业大学 一种基于双向循环注意力神经网络的文本分类方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012248017A (ja) * 2011-05-27 2012-12-13 Nippon Telegr & Teleph Corp <Ntt> 行動モデル学習装置、方法、及びプログラム
CN104765873A (zh) * 2015-04-24 2015-07-08 百度在线网络技术(北京)有限公司 用户相似度确定方法和装置
CN107066449A (zh) * 2017-05-09 2017-08-18 北京京东尚科信息技术有限公司 信息推送方法和装置
CN107688984A (zh) * 2017-07-27 2018-02-13 上海壹账通金融科技有限公司 产品信息推送方法、装置、存储介质和计算机设备
CN107657007A (zh) * 2017-09-22 2018-02-02 广东欧珀移动通信有限公司 信息推送方法、装置、终端、可读存储介质及系统
CN109472024A (zh) * 2018-10-25 2019-03-15 安徽工业大学 一种基于双向循环注意力神经网络的文本分类方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
吕苗: "《基于情境的商品个性化推荐方法研究》", vol. 1, 30 June 2018, 东北大学出版社, pages: 27 *

Similar Documents

Publication Publication Date Title
CN111476306B (zh) 基于人工智能的物体检测方法、装置、设备及存储介质
CN111797288B (zh) 数据筛选方法、装置、存储介质及电子设备
CN111914113A (zh) 一种图像检索的方法以及相关装置
CN111800445B (zh) 消息推送方法、装置、存储介质及电子设备
CN111930964B (zh) 内容处理方法、装置、设备及存储介质
CN111339737B (zh) 实体链接方法、装置、设备及存储介质
CN111797861A (zh) 信息处理方法、装置、存储介质及电子设备
CN111738365B (zh) 图像分类模型训练方法、装置、计算机设备及存储介质
CN111797851A (zh) 特征提取方法、装置、存储介质及电子设备
CN111797854A (zh) 场景模型建立方法、装置、存储介质及电子设备
CN111797148A (zh) 数据处理方法、装置、存储介质及电子设备
CN111798019B (zh) 意图预测方法、装置、存储介质及电子设备
CN111796926A (zh) 指令执行方法、装置、存储介质及电子设备
CN111797849A (zh) 用户活动识别方法、装置、存储介质及电子设备
CN111796925A (zh) 算法模型的筛选方法、装置、存储介质和电子设备
CN111797873A (zh) 场景识别方法、装置、存储介质及电子设备
CN111816211B (zh) 情绪识别方法、装置、存储介质及电子设备
CN111797303A (zh) 信息处理方法、装置、存储介质及电子设备
CN111797874A (zh) 行为预测方法、装置、存储介质及电子设备
CN111796663B (zh) 场景识别模型更新方法、装置、存储介质及电子设备
CN111797871A (zh) 信息处理方法、装置、存储介质及电子设备
CN111797660A (zh) 图像贴标方法、装置、存储介质及电子设备
CN111797863A (zh) 模型训练方法、数据处理方法、装置、存储介质及设备
CN111797869A (zh) 模型训练方法、装置、存储介质及电子设备
CN111797391A (zh) 高风险进程的处理方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination