CN112506063B - 数据分析方法、系统、电子设备和存储介质 - Google Patents
数据分析方法、系统、电子设备和存储介质 Download PDFInfo
- Publication number
- CN112506063B CN112506063B CN202011345200.2A CN202011345200A CN112506063B CN 112506063 B CN112506063 B CN 112506063B CN 202011345200 A CN202011345200 A CN 202011345200A CN 112506063 B CN112506063 B CN 112506063B
- Authority
- CN
- China
- Prior art keywords
- user
- family
- data
- equipment
- home
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 70
- 238000007405 data analysis Methods 0.000 title claims abstract description 38
- 230000006399 behavior Effects 0.000 claims abstract description 24
- 238000007781 pre-processing Methods 0.000 claims abstract description 17
- 238000004458 analytical method Methods 0.000 claims description 9
- 238000004422 calculation algorithm Methods 0.000 claims description 9
- 238000007418 data mining Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 5
- 238000007635 classification algorithm Methods 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 4
- 238000005065 mining Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 abstract description 15
- 238000004364 calculation method Methods 0.000 description 8
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B15/00—Systems controlled by a computer
- G05B15/02—Systems controlled by a computer electric
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B19/00—Programme-control systems
- G05B19/02—Programme-control systems electric
- G05B19/418—Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM]
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/20—Pc systems
- G05B2219/26—Pc applications
- G05B2219/2642—Domotique, domestic, home control, automation, smart house
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Manufacturing & Machinery (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例涉及智慧家庭技术领域,特别涉及一种数据分析方法、系统、电子设备和存储介质。数据分析方法包括获取并保存设备数据和用户话单数据;对所述设备数据和所述用户话单数据进行预处理;根据预处理后的设备数据和预处理后的用户话单数据,获取用户、设备和家庭之间的关联关系;根据所述用户、设备和家庭之间的关联关系获取家庭成员的行为偏好模型,并将所述行为偏好模型发送给家庭中的设备,供在无需所述家庭成员操作的情况下为所述家庭成员提供服务。应用智慧家庭提供智能化服务的过程中,达到根据数据分析得到的用户需求和用户行为预测更加精准的目的。
Description
技术领域
本发明实施例涉及智慧家庭技术领域,特别涉及一种数据分析方法、系统、电子设备和存储介质。
背景技术
随着智能家电、智慧安防等智慧家庭产品的日益成熟,智慧家庭的控制方法正在由技术导向转化为需求导向。以需求为导向对智慧家庭进行控制所采用的方法是:首先获取智慧家庭的数据,然后对获取的数据进行统计分析,得到用户画像和设备画像,接着根据用户画像和设备画像预测用户和设备的行为,最后根据预测结果对智慧家庭中的设备进行控制。
然而,由于统计分析得到的用户画像和设备画像比较粗略,不能对用户进行准确的行为预测,从而导致根据行为预测进行的智慧家庭控制不能准确迎合用户的需求。
发明内容
本发明实施方式的目的在于提供一种数据分析方法、系统、电子设备和存储介质,使得根据数据分析得到的用户需求和用户行为预测更加精准。
为解决上述技术问题,本发明的实施方式提供了一种数据分析方法,包括以下步骤:获取并保存设备数据和用户话单数据;对所述设备数据和所述用户话单数据进行预处理;根据预处理后的设备数据和预处理后的用户话单数据,获取用户、设备和家庭之间的关联关系;根据所述用户、设备和家庭之间的关联关系获取家庭成员的行为偏好模型,并将所述行为偏好模型发送给家庭中的设备,供在无需所述家庭成员操作的情况下为所述家庭成员提供服务。
本发明的实施方式还提供了一种数据分析系统,包括:存储模块,用于获取并保存设备数据和用户话单数据;预处理模块,用于对所述设备数据和所述用户话单数据进行预处理;分析模块,用于根据预处理后的设备数据和预处理后的用户话单数据,获取用户、设备和家庭之间的关联关系;根据所述用户、设备和家庭之间的关联关系获取家庭成员的行为偏好模型;发送模块,用于将所述行为偏好模型发送给家庭中的设备,供在无需所述家庭成员操作的情况下为所述家庭成员提供服务。
本发明的实施方式还提供了一种电子设备,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行以上所述的智慧家庭的控制方法。
本发明的实施方式还提供了一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现以上所述的智慧家庭的控制方法。
本发明实施方式相对于现有技术而言,获取并保存设备数据和用户话单数据后,对设备数据和用户话单数据进行预处理,然后根据预处理后的设备数据和预处理后的用户话单数据,获取用户、设备和家庭之间的关联关系,挖掘了用户、设备和家庭的关联关系,获得用户、家庭和设备的不易发现的潜在关系,使得预测的用户需求更加精准。将所述行为偏好模型发送给家庭中的设备,供在无需所述家庭成员操作的情况下为所述家庭成员提供服务,使得设备提供智能化的、精准的服务。
另外,本发明的实施方式提供的数据分析方法,所述对所述设备数据和所述用户话单数据进行预处理,包括:根据预先设置的计算框架对所述设备数据和所述用户话单数据进行计算,获取不同框架的计算结果;对所述不同框架的计算结果进行加权平均,获取特征数据。对计算框架输出的计算结果进行加权平均,减小了结果的误差,使得特征数据更加准确。
另外,本发明的实施方式提供的数据分析方法,所述根据所述预处理后的用户话单数据获取家庭和用户之间的关联关系、家庭画像,包括:对所述预处理后的用户话单数据进行分类,将具有相同特征的数据划分为一类;对划分后的用户话单数据进行数据挖掘,获取所述划分后的用户话单数据的关联规则;根据所述关联规则获取家庭和用户之间的关联关系;根据所述家庭和用户之间的关联关系构建家庭单元的拓扑结构;根据所述家庭单元的结构对属于同一家庭单元中的用户的话单数据进行数据挖掘,获取所述家庭画像。引入家庭的概念,使得数据分析的结果不仅体现单个用户的需求还能够体现位于受家庭影响的用户的需求,进一步提高数据分析的精确度。
另外,本发明的实施方式提供的数据分析方法,所述根据所述家庭和用户之间的关联关系构建家庭单元的拓扑结构,包括:从不在家庭单元中的用户中选取两个用户,根据所述家庭和用户之间的关联关系判断所述两个用户是否属于一个家庭;若所述两个用户属于一个家庭,根据所述两个用户构成家庭单元的拓扑结构;根据所述家庭和用户的关联关系判断不在家庭单元中的用户是否属于所述初始的家庭单元;若所述不在家庭单元中的用户属于所述初始的家庭单元,将所述不在家庭单元中的用户增加到所述家庭单元的拓扑结构。采用递推的方式构建家庭单元,将复杂、庞大的分析过程简化为简单过程的多次重复,减少分析计算过程中的消耗。
另外,本发明的实施方式提供的数据分析方法,所述对所述设备画像进行分类,包括:若分类的类别是预先设定的,采用分类算法对所述设备画像进行分类;若分类的类别不是预先设定的,采用聚类算法对所述设备画像进行聚类并根据聚类的结果对所述设备画像进行分类。根据实际情况调整分类的方法,能够灵活地适应不同的情况,从而提高分类的效果。
附图说明
一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定,附图中具有相同参考数字标号的元件表示为类似的元件,除非有特别申明,附图中的图不构成比例限制。
图1是本发明的第一实施方式提供的数据分析方法的流程图;
图2是本发明的第二实施方式提供的数据分析方法的流程图;
图3是本发明的第三实施方式提供的数据分析方法的流程图;
图4是图3所示的本发明的第三实施方式提供的数据分析方法中步骤306的流程图;
图5是本发明的第四实施方式提供的数据分析方法的流程图;
图6是本发明的第五实施方式提供的数据分析系统的结构示意图;
图7是本发明的第六实施方式提供的电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本发明各实施方式中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。
以下各个实施例的划分是为了描述方便,不应对本发明的具体实现方式构成任何限定,各个实施例在不矛盾的前提下可以相互结合相互引用。
本发明的第一实施方式涉及一种数据分析方法。具体流程如图1所示。
步骤101,获取并保存设备数据和用户话单数据。
在本实施方式中,设备数据可以包括:设备状态、厂商信息、设备操作等;用户话单数据可以包括产品订购,账单话单,位置信息等数据。当然,以上仅为具体的举例说明,在实际的使用过程中设备数据、用户话单数据还可以包括其他数据,此处不做一一赘述。
在本实施方式中,为了更加适应大数据处理、流式文件访问和降低费用,可以将设备数据和用户话单数据保存在分布式存储文件系统中。
步骤102,对设备数据和用户话单数据进行预处理。
在本实施方式中,预处理可以是对相同时期的数据进行分类处理,例如将用户话单数据划分为多个维度,更具体地说可以划分为身份信息、位置信息、通信关系、付费关系、订购关系、终端使用信息6个维度。预处理还可以是针对实时数据将不同时期的数据进行增量处理,保证数据的实时性,避免数据变化而分析结果变化滞后过多导致的预测错误。
步骤103,根据预处理后的设备数据和预处理后的用户话单数据,获取用户、设备和家庭之间的关联关系。
在本实施方式中,预处理后的设备数据可以包括使用时间、下线时间、使用时长、操作指令、警告通知、状态数据等设备使用特征数据;预处理后的用户话单数据可以包括用户身份、用户位置等用户话单特征数据。当然,以上仅为具体的举例说明,在实际的使用过程中预处理后的设备数据、预处理后的用户话单数据还可以包括其他数据,此处不做一一赘述。
在本实施方式中,用户和设备之间的关联关系可以是由APP或者网关的用户信息直接建立。
步骤104,根据用户、设备和家庭之间的关联关系获取家庭成员的行为偏好模型,并将行为偏好模型发送给家庭中的设备,供在无需家庭成员操作的情况下为家庭成员提供服务。
在本实施方式中,行为偏好模型可以是发送给家庭设备,供家庭设备经过分析之后得到家庭成员的行为预测,从而提供有针对性、准确、高效和个性化的服务。还可以发送给平台或者运营商,进一步利用数据分析的结果,让平台或者运营商能够进行个性化推荐,提高服务质量和服务推荐的效率。
本发明实施方式相对于现有技术而言,获取并保存设备数据和用户话单数据后,对设备数据和用户话单数据进行预处理,然后根据预处理后的设备数据和预处理后的用户话单数据,获取用户、设备和家庭之间的关联关系,挖掘了用户、设备和家庭的关联关系,获得用户、家庭和设备的不易发现的潜在关系,使得预测的用户需求更加精准。将所述行为偏好模型发送给家庭中的设备,供在无需所述家庭成员操作的情况下为所述家庭成员提供服务,使得设备提供智能化的、精准的服务。
本发明的第二实施方式涉及一种数据分析方法,该方法与第一实施方式提供的数据分析方法基本相同,其区别在于,如图2所示,步骤102包括:
步骤201,根据预先设置的计算框架设备数据和用户话单数据进行计算,获取不同框架的输出数据。
在本实施方式中,计算框架可以是Spark、Flink、Storm等。当然,以上仅为具体的举例说明,在实际的使用过程中计算框架还可以包括其他框架,此处不做一一赘述。
步骤202,对不同框架的输出数据进行加权平均。
在本实施方式中,不对使用的权重进行限制,可以根据实际情况进行调整。
本发明实施方式相对于现有技术而言,在实现第一实施方式带来的有益效果基础上,对计算框架的输出数据进行加权平均,减小了数据预处理的误差,使得处理后的用户话单数据和处理后的设备数据更加准确。
本发明的第三实施方式涉及一种数据分析方法,该方法与第一实施方式提供的数据分析方法基本相同,其区别在于,如图3所示,步骤103包括:
步骤301,根据预处理后的设备数据获取设备画像。
步骤302,根据预处理后的用户话单数据获取用户画像、用户和设备之间的关联关系。
步骤303,对预处理后的用户话单数据进行分类,将具有相同特征的数据划分为一类。
在本实施方式中,通过分类算法或者聚类算法对已经划分维度后的某一维度的数据分别进行分类,但是不对分类方法进行具体限定,分类方法可以是任意一种能够对具有相同特征的数据进行划分的方法。
在本实施方式中相同特征可以是相同的童话对象、相同的用户位置等。当然,以上仅为具体的举例说明,在实际的使用过程中相同特征还可以包括其他特征,此处不做一一赘述。
步骤304,对划分后的用户话单数据挖掘关系规则,获取划分后的用户话单数据的关联规则。
在本实施方式中,挖掘关系规则采用的方法可以是Apriori算法、FP-growth算法等。当然,以上仅为具体的举例说明,在实际的使用过程中挖掘关系规则采用的方法还可以包括其他方法,此处不做一一赘述。
步骤305,根据关联规则获取家庭和用户之间的关联关系。
具体地说,多个用户的位置信息、通话对象相似或者总是存在较强的关联,认为这些用户属于同一个家庭;某个用户与已经确定的家庭中的用户的其他用户在终端使用、使用时间以及使用的频率等存在较强的关联,认为用户属于这个家庭等。当然,以上仅为具体的举例说明,在实际的使用过程中判断方法还可以包括其他方法,此处不做一一赘述。
步骤306,根据家庭和用户之间的关联关系构建家庭单元的拓扑结构。
具体地,如图4所示,步骤306可以包括:
步骤401,从不在家庭单元的拓扑结构中的用户中选取两个用户,根据家庭和用户之间的关联关系判断两个用户是否属于一个家庭。
步骤402,若两个用户属于一个家庭,根据两个用户构成初始家庭单元的拓扑结构。
步骤403,根据家庭和用户的关联关系判断不在家庭单元中的用户是否属于初始的家庭单元。
步骤404,若不在家庭单元的拓扑结构中的用户属于初始的家庭单元,将不在家庭单元中的用户增加到所述家庭单元的拓扑结构。
具体地说,首先判断某两个人是否为一个家庭,再判断某个人是否属于这个家庭。根据家庭特点可知,家庭中的某个成员不会只与家庭中的一员存在关系,因此家庭单元的拓扑结构必须形成一个闭环的状态,判断某个人是否属于某个家庭时,此人必须与家庭中的某两个人存在家庭关系,且取家庭成员较多的家庭作为该成员的家庭。
步骤307,根据家庭单元的结构对属于同一家庭单元中的用户的话单数据和设备数据进行数据挖掘,获取家庭画像。
在本实施方式中,家庭画像可以是青年家庭标签(无孩子、无老人)、儿童标签、老人标签、运动标签、教育标签等。当然,以上仅为具体的举例说明,在实际的使用过程中家庭画像还可以包括其他标签,此处不做一一赘述。
步骤308,根据家庭画像、用户画像、设备画像和家庭和用户之间的关联关系获取家庭和设备之间的关联关系。
在本实施方式中,通过家庭和用户之间的关联关系便可以确定某个群体中的用户是否属于一个家庭。当一个家庭确定了以后,可通过用户和设备之间的关联关系确定该家庭都具备哪些设备,基于此便可以分析家庭中每个人与设备之间的关联。
本发明实施方式相对于现有技术而言,在实现第一实施方式带来的有益效果基础上,引入家庭的概念,获取家庭画像,使得数据分析的结果不仅体现单个用户的需求还能够体现位于受家庭影响的用户的需求,进一步提高数据分析的精确度。同时采用递推的方式构建家庭单元,将复杂、庞大的分析过程简化为简单过程的多次重复,减少分析计算过程中的消耗。
本发明的第四实施方式涉及一种数据分析方法,该方法与第一实施方式提供的数据分析方法基本相同,其区别在于,如图5所示,步骤103包括:
步骤501,根据预处理后的设备数据获取设备画像。
步骤502,根据预处理后的用户话单数据获取用户画像、用户和设备之间的关联关系、家庭和用户之间的关联关系、家庭画像。
步骤503,对设备画像进行分类,获取设备的使用习惯特征。
在本实施方式中,分类的类别可以是:使用时间段、浏览内容、使用频率等。当然,以上仅为具体的举例说明,在实际的使用过程中分类的类别还可以包括其他内容,此处不做一一赘述。
在本实施方式中,使用习惯特征可以是:电视机通常在下午五点浏览美食节目、空调通常在中午十二点到下午两点使用等。
在本实施方法中,步骤503在不同情况下会采用不同的分类方法。
一种是,若分类的类别是预先设定的,采用分类算法对设备画像进行分类。
另一种是,若分类的类别不是预先设定的,采用聚类算法对设备画像进行聚类并根据聚类的结果对设备画像进行分类。
当然,以上两种情况仅为具体的举例说明,在实际的使用过程中,步骤503还可能有其他情形并选择相应的分类方法,此处不做一一赘述。
步骤504,根据家庭和用户之间的关联关系、用户画像获取家庭中每个用户的画像。
步骤505,根据家庭画像对家庭中每个用户的画像和设备的使用习惯特征进行关联。
步骤506,根据关联的结果获取家庭和设备之间的关联关系。
具体地,以电视机的例子,家庭中具有儿童标签的个人便可以认为其通常在下午六点的时候在电视机上浏览儿童节目等,从而得到家庭中每个人对应的设备使用习惯,更进一步地得出家庭与设备的关系。
本发明实施方式相对于现有技术而言,在实现第一实施方式带来的有益效果基础上,采用聚类算法对所述设备画像进行聚类并根据聚类的结果对所述设备画像进行分类。根据实际情况调整分类的方法,能够灵活地适应不同的情况,从而提高关联关系的结果。
上面各种方法的步骤划分,只是为了描述清楚,实现时可以合并为一个步骤或者对某些步骤进行拆分,分解为多个步骤,只要包括相同的逻辑关系,都在本专利的保护范围内;对算法中或者流程中添加无关紧要的修改或者引入无关紧要的设计,但不改变其算法和流程的核心设计都在该专利的保护范围内。
本发明第五实施方式涉及一种数据分析系统,如图6所示,包括:
存储模块601,用于获取并保存设备数据和用户话单数据;
预处理模块602,用于对设备数据和用户话单数据进行预处理;
分析模块603,用于根据预处理后的设备数据和预处理后的用户话单数据,获取用户、设备和家庭之间的关联关系;根据用户、设备和家庭之间的关联关系获取家庭成员的行为偏好模型;
发送模块604,用于将行为偏好模型发送给家庭中的设备,供在无需家庭成员操作的情况下为家庭成员提供服务。
不难发现,本实施方式为与第一实施方式相对应的系统实施例,本实施方式可与第一实施方式互相配合实施。第一实施方式中提到的相关技术细节在本实施方式中依然有效,为了减少重复,这里不再赘述。相应地,本实施方式中提到的相关技术细节也可应用在第一实施方式中。
值得一提的是,本实施方式中所涉及到的各模块均为逻辑模块,在实际应用中,一个逻辑单元可以是一个物理单元,也可以是一个物理单元的一部分,还可以以多个物理单元的组合实现。此外,为了突出本发明的创新部分,本实施方式中并没有将与解决本发明所提出的技术问题关系不太密切的单元引入,但这并不表明本实施方式中不存在其它的单元。
本发明第六实施方式涉及一种电子设备,如图7所示,包括:
至少一个处理器701;以及,
与所述至少一个处理器701通信连接的存储器702;其中,
所述存储器702存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器701执行,以使所述至少一个处理器701能够执行本发明第一至第三实施方式所述的数据分析方法。
其中,存储器和处理器采用总线方式连接,总线可以包括任意数量的互联的总线和桥,总线将一个或多个处理器和存储器的各种电路链接在一起。总线还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口在总线和收发机之间提供接口。收发机可以是一个元件,也可以是多个元件,比如多个接收器和发送器,提供用于在传输介质上与各种其他装置通信的单元。经处理器处理的数据通过天线在无线介质上进行传输,进一步,天线还接收数据并将数据传送给处理器。
处理器负责管理总线和通常的处理,还可以提供各种功能,包括定时,外围接口,电压调节、电源管理以及其他控制功能。而存储器可以被用于存储处理器在执行操作时所使用的数据。
本领域技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域的普通技术人员可以理解,上述各实施方式是实现本发明的具体实施例,而在实际应用中,可以在形式上和细节上对其作各种改变,而不偏离本发明的精神和范围。
Claims (7)
1.一种数据分析方法,其特征在于,包括:
获取并保存设备数据和用户话单数据;
对所述设备数据和所述用户话单数据进行预处理;
根据预处理后的设备数据和预处理后的用户话单数据,获取用户、设备和家庭之间的关联关系,具体包括:根据所述预处理后的设备数据获取设备画像;根据所述预处理后的用户话单数据获取用户画像、用户和设备之间的关联关系、家庭和用户之间的关联关系、家庭画像;根据所述家庭画像、所述用户画像、所述设备画像和所述家庭和用户之间的关联关系获取家庭和设备之间的关联关系;其中,对所述预处理后的用户话单数据进行分类,将具有相同特征的数据划分为一类;对划分后的用户话单数据挖掘关系规则,获取所述划分后的用户话单数据的关联规则;根据所述关联规则获取家庭和用户之间的关联关系;从不在家庭单元的拓扑结构中的用户中选取两个用户,根据所述家庭和用户之间的关联关系判断所述两个用户是否属于一个家庭;若所述两个用户属于一个家庭,根据所述两个用户构成初始家庭单元的拓扑结构;根据所述家庭和用户的关联关系判断不在家庭单元中的用户是否属于所述初始的家庭单元;若所述不在家庭单元的拓扑结构的用户属于所述初始的家庭单元,将所述不在家庭单元中的用户增加到所述家庭单元的拓扑结构;根据所述家庭单元的结构对属于同一家庭单元中的用户的话单数据和设备数据进行数据挖掘,获取所述家庭画像;
根据所述用户、设备和家庭之间的关联关系获取家庭成员的行为偏好模型,并将所述行为偏好模型发送给家庭中的设备,供在无需所述家庭成员操作的情况下为所述家庭成员提供服务。
2.根据权利要求1所述的方法,其特征在于,所述对所述设备数据和所述用户话单数据进行预处理,包括:
根据预先设置的计算框架对所述设备数据和所述用户话单数据进行处理,获取不同框架的输出数据;
对所述不同框架的输出数据进行加权平均。
3.根据权利要求1所述的方法,其特征在于,所述根据所述家庭画像、所述用户画像、所述设备画像和所述家庭和用户之间的关联关系获取家庭和设备之间的关联关系,包括:
对所述设备画像进行分类,获取设备的使用习惯特征;
根据所述家庭和用户之间的关联关系、所述用户画像获取家庭中每个用户的画像;
根据所述家庭画像对所述家庭中每个用户的画像和所述设备的使用习惯特征进行关联;
根据关联的结果获取所述家庭和设备之间的关联关系。
4.根据权利要求3所述的方法,其特征在于,所述对所述设备画像进行分类,包括:
若分类的类别是预先设定的,采用分类算法对所述设备画像进行分类;
若所述分类的类别不是预先设定的,采用聚类算法对所述设备画像进行聚类并根据聚类的结果对所述设备画像进行分类。
5.一种数据分析系统,其特征在于,包括:
存储模块,用于获取并保存设备数据和用户话单数据;
预处理模块,用于对所述设备数据和所述用户话单数据进行预处理;
分析模块,用于根据预处理后的设备数据和预处理后的用户话单数据,获取用户、设备和家庭之间的关联关系;根据所述用户、设备和家庭之间的关联关系获取家庭成员的行为偏好模型,具体包括:根据所述预处理后的设备数据获取设备画像;根据所述预处理后的用户话单数据获取用户画像、用户和设备之间的关联关系、家庭和用户之间的关联关系、家庭画像;根据所述家庭画像、所述用户画像、所述设备画像和所述家庭和用户之间的关联关系获取家庭和设备之间的关联关系;其中,对所述预处理后的用户话单数据进行分类,将具有相同特征的数据划分为一类;对划分后的用户话单数据挖掘关系规则,获取所述划分后的用户话单数据的关联规则;根据所述关联规则获取家庭和用户之间的关联关系;从不在家庭单元的拓扑结构中的用户中选取两个用户,根据所述家庭和用户之间的关联关系判断所述两个用户是否属于一个家庭;若所述两个用户属于一个家庭,根据所述两个用户构成初始家庭单元的拓扑结构;根据所述家庭和用户的关联关系判断不在家庭单元中的用户是否属于所述初始的家庭单元;若所述不在家庭单元的拓扑结构的用户属于所述初始的家庭单元,将所述不在家庭单元中的用户增加到所述家庭单元的拓扑结构;根据所述家庭单元的结构对属于同一家庭单元中的用户的话单数据和设备数据进行数据挖掘,获取所述家庭画像;
发送模块,用于将所述行为偏好模型发送给家庭中的设备,供在无需所述家庭成员操作的情况下为所述家庭成员提供服务。
6.一种终端/电子设备/服务器,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1-4任一所述的数据分析方法。
7.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至4中任一项所述的数据分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011345200.2A CN112506063B (zh) | 2020-11-25 | 2020-11-25 | 数据分析方法、系统、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011345200.2A CN112506063B (zh) | 2020-11-25 | 2020-11-25 | 数据分析方法、系统、电子设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112506063A CN112506063A (zh) | 2021-03-16 |
CN112506063B true CN112506063B (zh) | 2024-05-07 |
Family
ID=74967439
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011345200.2A Active CN112506063B (zh) | 2020-11-25 | 2020-11-25 | 数据分析方法、系统、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112506063B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115617745B (zh) * | 2022-10-13 | 2023-08-01 | 自然资源部国土卫星遥感应用中心 | 一种卫星图像数据存储介质的管理方法、管理装置及介质 |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103514240A (zh) * | 2012-11-29 | 2014-01-15 | Tcl集团股份有限公司 | 一种基于遥控器的家庭成员关系挖掘方法及系统 |
CN106228371A (zh) * | 2016-07-18 | 2016-12-14 | 南京坦道信息科技有限公司 | 一种基于交往频度和交往指数的超大规模用户的社交网络分析及家庭关系识别算法 |
CN106383450A (zh) * | 2016-11-10 | 2017-02-08 | 北京工商大学 | 一种基于大数据的智能家居用户行为分析系统及方法 |
CN107578272A (zh) * | 2017-08-10 | 2018-01-12 | 上海斐讯数据通信技术有限公司 | 一种为家庭成员画像的方法及装置 |
CN107741958A (zh) * | 2017-09-20 | 2018-02-27 | 上海斐讯数据通信技术有限公司 | 一种数据处理方法及系统 |
CN107862053A (zh) * | 2017-11-08 | 2018-03-30 | 北京奇虎科技有限公司 | 基于用户关系的用户画像构造方法、装置及计算设备 |
CN109636481A (zh) * | 2018-12-19 | 2019-04-16 | 未来电视有限公司 | 面向家庭用户的用户画像构建方法及装置 |
CN208797968U (zh) * | 2018-06-21 | 2019-04-26 | 深圳和而泰数据资源与云技术有限公司 | 智能家电设备用户画像系统 |
CN109784393A (zh) * | 2019-01-07 | 2019-05-21 | 闽江学院 | 一种基于电信大数据的家庭成员识别聚类方法 |
CN110337059A (zh) * | 2018-03-30 | 2019-10-15 | 中国联合网络通信集团有限公司 | 一种用户家庭关系的分析算法、服务器及网络系统 |
CN111131493A (zh) * | 2019-12-31 | 2020-05-08 | 中国移动通信集团江苏有限公司 | 一种数据获取、用户画像生成方法、装置 |
CN111246525A (zh) * | 2020-01-09 | 2020-06-05 | 中移(杭州)信息技术有限公司 | 家庭无线漫游方法和系统、云端设备和组网设备 |
CN111277610A (zh) * | 2020-02-24 | 2020-06-12 | 中移(杭州)信息技术有限公司 | 网关控制系统、方法、智能设备、智能设备服务器 |
CN111787371A (zh) * | 2020-09-04 | 2020-10-16 | 北京悠易网际科技发展有限公司 | 一种构建家庭画像的方法和装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10073428B2 (en) * | 2015-12-31 | 2018-09-11 | Echostar Technologies International Corporation | Methods and systems for control of home automation activity based on user characteristics |
US11307538B2 (en) * | 2017-02-10 | 2022-04-19 | Johnson Controls Technology Company | Web services platform with cloud-eased feedback control |
US20180336488A1 (en) * | 2017-05-17 | 2018-11-22 | Microsoft Technology Licensing, Llc | Machine Learning Based Family Relationship Inference |
-
2020
- 2020-11-25 CN CN202011345200.2A patent/CN112506063B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103514240A (zh) * | 2012-11-29 | 2014-01-15 | Tcl集团股份有限公司 | 一种基于遥控器的家庭成员关系挖掘方法及系统 |
CN106228371A (zh) * | 2016-07-18 | 2016-12-14 | 南京坦道信息科技有限公司 | 一种基于交往频度和交往指数的超大规模用户的社交网络分析及家庭关系识别算法 |
CN106383450A (zh) * | 2016-11-10 | 2017-02-08 | 北京工商大学 | 一种基于大数据的智能家居用户行为分析系统及方法 |
CN107578272A (zh) * | 2017-08-10 | 2018-01-12 | 上海斐讯数据通信技术有限公司 | 一种为家庭成员画像的方法及装置 |
CN107741958A (zh) * | 2017-09-20 | 2018-02-27 | 上海斐讯数据通信技术有限公司 | 一种数据处理方法及系统 |
CN107862053A (zh) * | 2017-11-08 | 2018-03-30 | 北京奇虎科技有限公司 | 基于用户关系的用户画像构造方法、装置及计算设备 |
CN110337059A (zh) * | 2018-03-30 | 2019-10-15 | 中国联合网络通信集团有限公司 | 一种用户家庭关系的分析算法、服务器及网络系统 |
CN208797968U (zh) * | 2018-06-21 | 2019-04-26 | 深圳和而泰数据资源与云技术有限公司 | 智能家电设备用户画像系统 |
CN109636481A (zh) * | 2018-12-19 | 2019-04-16 | 未来电视有限公司 | 面向家庭用户的用户画像构建方法及装置 |
CN109784393A (zh) * | 2019-01-07 | 2019-05-21 | 闽江学院 | 一种基于电信大数据的家庭成员识别聚类方法 |
CN111131493A (zh) * | 2019-12-31 | 2020-05-08 | 中国移动通信集团江苏有限公司 | 一种数据获取、用户画像生成方法、装置 |
CN111246525A (zh) * | 2020-01-09 | 2020-06-05 | 中移(杭州)信息技术有限公司 | 家庭无线漫游方法和系统、云端设备和组网设备 |
CN111277610A (zh) * | 2020-02-24 | 2020-06-12 | 中移(杭州)信息技术有限公司 | 网关控制系统、方法、智能设备、智能设备服务器 |
CN111787371A (zh) * | 2020-09-04 | 2020-10-16 | 北京悠易网际科技发展有限公司 | 一种构建家庭画像的方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN112506063A (zh) | 2021-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210326729A1 (en) | Recommendation Model Training Method and Related Apparatus | |
WO2023061087A1 (zh) | 信息推荐方法、装置、电子设备、计算机可读存储介质及计算机程序产品 | |
CN106228386A (zh) | 一种信息推送方法及装置 | |
CN107305611B (zh) | 恶意账号对应的模型建立方法和装置、恶意账号识别的方法和装置 | |
JP2007502484A (ja) | 不活性顧客を予測するための方法およびシステム | |
CN110020022B (zh) | 数据处理方法、装置、设备及可读存储介质 | |
CN108805596A (zh) | 商品定价信息处理方法、装置、电子设备及存储介质 | |
CN115994226B (zh) | 基于联邦学习的聚类模型训练系统及方法 | |
CN113313280B (zh) | 云平台的巡检方法、电子设备及非易失性存储介质 | |
CN112506063B (zh) | 数据分析方法、系统、电子设备和存储介质 | |
CN113568899A (zh) | 基于大数据的数据优化方法及云服务器 | |
CN112116025A (zh) | 用户分类模型的训练方法、装置、电子设备及存储介质 | |
CN115935185A (zh) | 一种推荐模型的训练方法及装置 | |
CN111680645B (zh) | 一种垃圾分类处理方法及装置 | |
CN117197722A (zh) | 基于移动互联网视频的用户感知与分析系统 | |
CN112116024B (zh) | 用户分类模型的方法、装置、电子设备和存储介质 | |
CN114611015A (zh) | 交互信息处理方法、装置和云服务器 | |
CN114358692A (zh) | 配送时长调整方法、装置及电子设备 | |
CN113554288A (zh) | 一种通用数据质量评估方法及装置 | |
CN109902831B (zh) | 业务决策处理方法以及装置 | |
KR20220116719A (ko) | 모바일 메신저에 게시된 상품판매정보를 수집하여 제공하기 위한 장치 및 이를 위한 방법 | |
CN116993396B (zh) | 基于车辆用户标签的风险预警方法、计算机设备 | |
CN111047360B (zh) | 一种基于视觉画像的数据处理方法及系统 | |
CN110704726B (zh) | 基于神经网络的数据推送方法、及其相关设备 | |
CN109344166B (zh) | 数据库的监控方法、计算机可读存储介质和终端设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |