CN115952781A - 一种数据分析方法、装置、电子设备及存储介质 - Google Patents

一种数据分析方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN115952781A
CN115952781A CN202211521037.XA CN202211521037A CN115952781A CN 115952781 A CN115952781 A CN 115952781A CN 202211521037 A CN202211521037 A CN 202211521037A CN 115952781 A CN115952781 A CN 115952781A
Authority
CN
China
Prior art keywords
decision
target
data
curve
numerical data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211521037.XA
Other languages
English (en)
Inventor
毛轶嘉
王玉兵
彭亮
熊炜林
孟波
王俊
金磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Telecom Corp Ltd
Original Assignee
China Telecom Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Telecom Corp Ltd filed Critical China Telecom Corp Ltd
Priority to CN202211521037.XA priority Critical patent/CN115952781A/zh
Publication of CN115952781A publication Critical patent/CN115952781A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种数据分析方法、装置、电子设备及存储介质,通过获取针对多个用户的文本数据和数值数据;通过对文本数据进行解耦,生成文本数值数据;确定预设决策类型,根据文本数值数据和数值数据计算出针对预设决策类型的决策系数;预设决策类型具有对应的多个决策方案;通过决策系数从多个决策方案中确定出目标决策方案,从而实现增强了酒店经营决策分析过程中的个性化,更高效地利用了文本数据资源,进一步提高了酒店经营数据分析结果的准确性。

Description

一种数据分析方法、装置、电子设备及存储介质
技术领域
本发明涉及一种数据分析技术领域,特别是涉及一种数据分析方法、一种数据分析装置、一种电子设备以及一种计算机可读存储介质。
背景技术
酒店经营决策分析是对整个酒店战略性的经营活动进行的决策分析,现有的酒店行业经营决策分析通常是基于外部数据,如机票预订数量、机票价格和周边同类酒店房价等外部数据进行,并未将酒店会员的文本类信息变量纳入分析,分析结果的针对性和全面性不足,同时,在提供分析决策结果后,缺乏对效应和效益的检视以及通过检视再对决策进行优化的有效手段,限制了酒店行业或客户在进行酒店经营决策分析过程中的个性化与自优化的发展。
所以,如何针对酒店经营进行决策分析并做出评估及优化,以提高酒店经营决策分析的准确性和科学性是本领域技术人员需要攻克的技术问题。
发明内容
本发明实施例是提供一种数据分析方法、装置、电子设备以及计算机可读存储介质,以解决如何对酒店经营数据进行分析决策的问题。
本发明实施例公开了一种数据分析方法,可以包括:
获取针对多个用户的文本数据和数值数据;
通过对所述文本数据进行解耦,生成文本数值数据;
确定预设决策类型,根据所述文本数值数据和所述数值数据计算出针对所述预设决策类型的决策系数;所述预设决策类型具有对应的多个决策方案;
通过所述决策系数从多个所述决策方案中确定出目标决策方案。
可选地,所述文本数据和所述数值数据分别具有对应的时间戳和数据类型;多个所述用户具有一一对应的用户标识,所述根据所述文本数值数据和所述数值数据计算出针对所述预设决策类型的决策系数的步骤可以包括:
将所述文本数值数据和所述数值数据基于对应的时间戳和数据类型进行耦合,生成针对多个所述用户的数组矩阵;
根据所述预设决策类型从所述数组矩阵中确定出与所述预设决策类型具有关联关系的目标文本数值数据和目标数值数据;所述目标文本数值数据和所述目标数值数据分别具有对应的目标时间戳和目标数据类型;
通过所述目标时间戳、所述目标文本数值数据和所述目标数值数据生成第一曲线;所述第一曲线用于表达在预设时序下,与不同目标数据类型对应的目标文本数值数据和目标数值数据的变化;
通过所述目标时间戳、所述用户标识、所述目标文本数值数据和所述目标数值数据生成第二曲线;所述第二曲线用于表达在预设时序下,不同用户标识对应的相同目标数据类型下的目标文本数值数据和目标数值数据的变化;
通过所述第一曲线和所述第二曲线计算出针对所述预设决策类型的决策系数。
可选地,所述通过所述第一曲线和所述第二曲线计算出针对所述预设决策类型的决策系数的步骤可以包括:
根据第一曲线计算所述目标文本数值数据和所述目标数值数据对应不同时间戳的变量频次,根据第一预设规则基于所述变量频次生成常数数值;
基于所述用户标识确定所述第二曲线中的曲线数目;
确定针对所述第二曲线的曲线交点,并根据第二预设规则从所述曲线交点中确定出目标交点数量;
基于所述目标交点数量和所述曲线数目进行计算,生成动态系数;
通过所述动态系数和所述常数数值生成针对所述预设决策类型的决策系数。
可选地,所述通过所述决策系数从多个所述决策方案中确定出目标决策方案的步骤可以包括:
通过多个所述决策系数和所述目标时间戳生成第三曲线;所述第三曲线用于表达在预设时序下多个所述决策方案所对应的决策系数的变化;
根据所述第三曲线确定目标时间数据,根据所述目标时间数据确定对应的目标决策系数;
将与所述目标决策系数对应的决策方案作为目标决策方案。
可选地,还可以包括:
按照第一预设时间周期针对所述目标决策系数计算第一偏离幅度数值;
若所述第一偏离幅度数值小于最低阈值,则判定所述目标决策方案有效;
若所述第一偏离幅度数值大于或等于最低阈值且小于或等于最高阈值,则按照第二预设时间周期针对所述目标决策系数计算第二偏离幅度数值;
若所述第一偏离幅度数值大于最高阈值,则判定所述目标决策方案无效。
本发明实施例还公开了一种数据分析装置,可以包括:
数据获取模块,用于获取针对多个用户的文本数据和数值数据;
文本数值数据生成模块,用于通过对所述文本数据进行解耦,生成文本数值数据;
决策系数计算模块,用于确定预设决策类型,根据所述文本数值数据和所述数值数据计算出针对所述预设决策类型的决策系数;所述预设决策类型具有对应的多个决策方案;
目标决策方案确定模块,用于通过所述决策系数从多个所述决策方案中确定出目标决策方案。
可选地,所述文本数据和所述数值数据分别具有对应的时间戳和数据类型;多个所述用户具有一一对应的用户标识,所述决策系数计算模块可以包括:
数组矩阵生成子模块,用于将所述文本数值数据和所述数值数据基于对应的时间戳和数据类型进行耦合,生成针对多个所述用户的数组矩阵;
关联关系确定子模块,用于根据所述预设决策类型从所述数组矩阵中确定出与所述预设决策类型具有关联关系的目标文本数值数据和目标数值数据;所述目标文本数值数据和所述目标数值数据分别具有对应的目标时间戳和目标数据类型;
第一曲线生成子模块,用于通过所述目标时间戳、所述目标文本数值数据和所述目标数值数据生成第一曲线;所述第一曲线用于表达在预设时序下,与不同目标数据类型对应的目标文本数值数据和目标数值数据的变化;
第二曲线生成子模块,用于通过所述目标时间戳、所述用户标识、所述目标文本数值数据和所述目标数值数据生成第二曲线;所述第二曲线用于表达在预设时序下,不同用户标识对应的相同目标数据类型下的目标文本数值数据和目标数值数据的变化;
决策系数计算子模块,用于通过所述第一曲线和所述第二曲线计算出针对所述预设决策类型的决策系数。
可选地,所述决策系数计算子模块可以包括:
常数数值生成单元,用于根据第一曲线计算所述目标文本数值数据和所述目标数值数据对应不同时间戳的变量频次,根据第一预设规则基于所述变量频次生成常数数值;
曲线数目确定单元,用于基于所述用户标识确定所述第二曲线中的曲线数目;
曲线交点确定单元,用于确定针对所述第二曲线的曲线交点,并根据第二预设规则从所述曲线交点中确定出目标交点数量;
动态系数生成单元,用于基于所述目标交点数量和所述曲线数目进行计算,生成动态系数;
决策系数生成单元,用于通过所述动态系数和所述常数数值生成针对所述预设决策类型的决策系数。
可选地,所述目标决策方案确定模块可以包括:
第三曲线生成子模块,用于通过多个所述决策系数和所述目标时间戳生成第三曲线;所述第三曲线用于表达在预设时序下多个所述决策方案所对应的决策系数的变化;
目标决策系数确定子模块,用于根据所述第三曲线确定目标时间数据,根据所述目标时间数据确定对应的目标决策系数;
目标决策方案确定子模块,用于将与所述目标决策系数对应的决策方案作为目标决策方案。
可选地,还可以包括:
第一偏离幅度数值计算子模块,用于按照第一预设时间周期针对所述目标决策系数计算第一偏离幅度数值;
有效判定子模块,用于若所述第一偏离幅度数值小于最低阈值,则判定所述目标决策方案有效;
第二偏离幅度数值计算子模块,用于若所述第一偏离幅度数值大于或等于最低阈值且小于或等于最高阈值,则按照第二预设时间周期针对所述目标决策系数计算第二偏离幅度数值;
无效判定子模块,用于若所述第一偏离幅度数值大于最高阈值,则判定所述目标决策方案无效。
本发明实施例还公开了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,所述处理器、所述通信接口以及所述存储器通过所述通信总线完成相互间的通信;
所述存储器,用于存放计算机程序;
所述处理器,用于执行存储器上所存放的程序时,实现如本发明实施例所述的方法。
本发明实施例还公开了一种计算机可读存储介质,其上存储有指令,当由一个或多个处理器执行时,使得所述处理器执行如本发明实施例所述的方法。
本发明实施例包括以下优点:
本发明实施例,通过获取针对多个用户的文本数据和数值数据;通过对文本数据进行解耦,生成文本数值数据;确定预设决策类型,根据文本数值数据和数值数据计算出针对预设决策类型的决策系数;预设决策类型具有对应的多个决策方案;通过决策系数从多个决策方案中确定出目标决策方案,从而实现增强了酒店经营决策分析过程中的个性化,更高效地利用了文本数据资源,进一步提高了酒店经营数据分析结果的准确性。
附图说明
图1是本发明实施例中提供的一种数据分析方法的步骤流程图;
图2是本发明实施例中提供的一种针对第一曲线的结构示意图;
图3是本发明实施例中提供的一种针对第二曲线的结构示意图;
图4是本发明实施例中提供的一种针对第三曲线的结构示意图;
图5是本发明实施例中提供的另一种数据分析方法的步骤流程图;
图6是本发明实施例中提供的一种数据分析装置的结构框图;
图7是本发明各实施例中提供的一种电子设备的硬件结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
随着酒店行业数字化发展,各个大中型酒店及连锁酒店为了经营发展建立专属会员体系,并通过互联网线上营销、线下活动推广等方式,不断发展会员体量,积累了大量的会员信息。酒店目前常将会员作为锚定的高质量消费人群作为营销分析对象,并为会员提供独享、便捷的住店数字化体验。面对海量的十万级、百万级会员数据,和几何倍级的不同类信息,酒店将通过何种分析方法作为不同经营决策方向的参考,越来越成为酒店行业经营管理的重点。而目前酒店行业经营决策数据分析主要存在以下缺陷:在分析的数据类型方面,现有经营决策数据分析主要是通过数值类数据,如同类产品价格、同类产品数量、实际销售额和各类行业经营指标等数据进行,并未将会员文本类信息,如住址、岗位、就职情况以及家庭成员等变量信息纳入分析,一方面浪费了宝贵的信息资源,另一方面使得分析结果欠缺严谨性;在分析方法方面,现有经营决策数据分析主要以实际经营均值、阈值偏离等泛值与经营或行业指数进行匹配比较得出评分,由于经营或行业指数是基于整个行业生成的综合指数,因此在现有经营决策数据分析方法下针对经营个体的决策方案评分则缺乏针对性和准确性;此外,由于现有经营决策数据分析的前述缺陷,也使得对最终决策的实际执行结果进行复盘难度增大,不易进行有效的校验优化。本发明的实施例提供一种数据分析方法、装置、电子设备及存储介质,结合用户文本数据和数值数据对酒店经营决策进行数据分析,从而增强酒店经营决策数据分析过程中的个性化与自优化,更高效地利用数据资源,提升数据分析方法的科学性与严谨性,进一步地提高了数据分析结果的准确性。
参照图1,示出了本发明实施例中提供的一种数据分析方法的步骤流程图,具体可以包括如下步骤:
步骤101,获取针对多个用户的文本数据和数值数据;
步骤102,通过对所述文本数据进行解耦,生成文本数值数据;
步骤103,确定预设决策类型,根据所述文本数值数据和所述数值数据计算出针对所述预设决策类型的决策系数;所述预设决策类型具有对应的多个决策方案;
步骤104,通过所述决策系数从多个所述决策方案中确定出目标决策方案。
在实际应用中,为了提升数据分析的时效性和针对性,可以在被用户授权且符合相关法律法规的情况下从用户所在的会员系统中抽取用户的文本数据和数值数据,例如,酒店的会员系统中的会员信息,会员每次在酒店进行消费和变更个人信息后,系统中的会员信息随之更新,在不同时间阶段、不同外在环境以及自身情况发生变化时,会员对酒店提供的产品需求也会产生改变。
在具体实现中,本发明实施例可以获取多个用户的文本数据和数值数据,示例性地,文本数据可以是酒店会员的就业情况、岗位、行业、职位、性别、家庭住址、籍贯、民族、家庭结构、消费评价和行程轨迹等通过文字展现的数据,数值数据可以是酒店会员的收入区间、年龄、消费金额、消费时间、消费数量等通过数值展现的数据。
当然,上述例子仅作为示例,本领域技术人员可以采用其他类型数据作为文本数据或数值数据,对此,本发明实施例不作限制。
在实际应用中,文本数据是基于文字组合,数值数据是基于数字组合,以汉字为例,现有汉字数量大约十万个,远远多于阿拉伯数字“0”-“9”的个数,并且每一个汉字都有至少一种字义,相互组合之后产生词义,因此,处理文本数据的难度和工作量是远高于处理数值数据的,同时,由于文字语言的特性,不同的汉字字符组合还可能代表相同的含义,如用户的居住地由“北京市”变为“广州市”,和由“北京”变为“广州”的逻辑含义相同,但文本数据则不同,在数据分析中,若将每一组文字组合作为一个有效的文本数据,势必会造成巨大的运算负担,所以如何降低文本与逻辑的耦合度,提高文本数据的可使用性则尤为重要,在本申请的实施例中可以通过解耦的方式将文本数据之间的文本内容和逻辑内容分离,将文本数据解耦生成文本数值数据,便于后续的数据处理并降低运算负担。
在具体实现中,本发明实施例可以通过对文本数据进行解耦,生成文本数值数据,例如,当获取用户的文本数据为酒店会员张三的“常住城市”,可以将张三自2010年1月1日办理会员建立会员信息起至当前时间止的“常住城市”文本数据全部取出,将文本数据变化通过变量进行解耦标记并计次,并以计次数据作为文本数值数据,示例性地,当张三在会员系统中登记的“常住城市”由“北京”变为“广州”,则将张三的“常住城市”文本数据解耦由“0”变更为“1”,若再次变化,则记为“α”,其中“α=变次”,即,若张三的常住城市由北京变为广州后,再次变更到上海,则“α=2”。
当然,上述例子仅作为示例,本领域技术人员可以采用其他规则对文本数据进行解耦以生成文本数值数据,对此本发明实施例不作限制。
在具体实现中,本发明实施例可以确定预设决策类型,根据文本数值数据和数值数据计算出针对预设决策类型的决策系数;预设决策类型具有对应的多个决策方案,并通过决策系数从多个决策方案中确定出目标决策方案,例如,确定酒店的决策类型为“房型推荐”,其中“房型推荐”具有对应的多个决策方案,分别可以是“推荐经济单人房”、“推荐经济双人房”和“推荐商务套房”,根据会员“张三”文本数值数据“婚姻状况_α=1”及数值数据“年龄:25_收入:8000”,计算出针对会员“张三”关于“房型推荐”类型下“推荐经济单人房”的决策系数为9,对应“推荐经济双人房”的决策系数为10,对应“推荐商务套房”的决策系数为8,然后按照决策系数进行由大到小排序,排首位的作为目标决策方案,即针对会员“张三”采用“推荐经济双人房”作为目标决策方案。
本发明实施例,通过获取针对多个用户的文本数据和数值数据;通过对文本数据进行解耦,生成文本数值数据;确定预设决策类型,根据文本数值数据和数值数据计算出针对预设决策类型的决策系数;预设决策类型具有对应的多个决策方案;通过决策系数从多个决策方案中确定出目标决策方案。从而实现增强了酒店经营决策分析过程中的个性化,更高效地利用了文本数据资源,进一步提高了酒店经营数据分析结果的准确性。
在上述实施例的基础上,提出了上述实施例的变型实施例,在此需要说明的是,为了使描述简要,在变型实施例中仅描述与上述实施例的不同之处。
在本发明的一个可选地实施例中,所述文本数据和所述数值数据分别具有对应的时间戳和数据类型;多个所述用户具有一一对应的用户标识,所述根据所述文本数值数据和所述数值数据计算出针对所述预设决策类型的决策系数的步骤包括:
将所述文本数值数据和所述数值数据基于对应的时间戳和数据类型进行耦合,生成针对多个所述用户的数组矩阵;
根据所述预设决策类型从所述数组矩阵中确定出与所述预设决策类型具有关联关系的目标文本数值数据和目标数值数据;所述目标文本数值数据和所述目标数值数据分别具有对应的目标时间戳和目标数据类型;
通过所述目标时间戳、所述目标文本数值数据和所述目标数值数据生成第一曲线;所述第一曲线用于表达在预设时序下,与不同目标数据类型对应的目标文本数值数据和目标数值数据的变化;
通过所述目标时间戳、所述用户标识、所述目标文本数值数据和所述目标数值数据生成第二曲线;所述第二曲线用于表达在预设时序下,不同用户标识对应的相同目标数据类型下的目标文本数值数据和目标数值数据的变化;
通过所述第一曲线和所述第二曲线计算出针对所述预设决策类型的决策系数。
在具体实现中,本发明实施例中的文本数据和数值数据分别具有对应的时间戳和数据类型;多个用户具有一一对应的用户标识。
在实际应用中,为了提升数据的时效性和动态关联,可以利用即时时间作为时间信息,在本发明的一个可选地实施例中文本数据和数值数据分别具有对应的时间戳,可以将文本数据和数值数据创建时的时间信息作为时间戳,该时间戳可以表达文本数据和数值数据被用户创建时的时间,该时间戳可以为包含毫秒值的毫秒级时间戳或者包含日期的时间戳等等,即,可以用微秒数值、毫秒数值、厘秒数值、分秒数值、秒数值、分数值、小时数值、天数值、周数值、月数值、年数值等等单位时间数值表达,此外,为了提升分析过程中的个性化,可以针对不同的用户赋予一一对应的用户标识,如用户姓名。
当然,时间戳也可以是其他任意时间信息,例如可以按照一定周期针对多个用户的文本数据和数值数据进行获取,而获取时间则为文本数据和数值数据的时间戳,用户标识也可以是其他具有唯一性的用户信息,如身份证号或会员号等其他可以与用户一一对应的标识,对此,本发明实施例不作限制。
作为本发明实施例的一个具体示例,针对多个用户的数值数据可以如表1所示。
表1:
用户标识 时间戳 类型a 类型c ……
张三 20220101 数值a1 数值a1 ……
张三 20220102 数值a2 数值a2 ……
李四 20220103 数值a3 数值a3 ……
李四 …… …… …… ……
针对多个用户的文本数值数据可以如表2所示。
表2:
用户标识 时间戳 类型b 类型d ……
张三 20220101 变次b1 变次d1 ……
张三 20220102 变次b2 变次d2 ……
李四 20220103 变次b3 变次d3 ……
李四 …… …… …… ……
在实际应用中,为了增强不同数据之间的增力,将数据进行交互以协同完成数据处理任务,可以采用数据耦合方式对多个数据进行耦合处理,并且,为了便于数据应用于不同的决策类型,可以根据数据形成矩阵,方便对数据的抽取和筛选,增强多组数据针对不同决策类型需求的转换能力,减少重复的运算工作。
在具体实现中,本发明实施例可以将文本数值数据和数值数据基于对应的时间戳和数据类型进行耦合,生成针对多个用户的数组矩阵;示例性地,针对表1中的用户数值数据和表2中的用户文本数值数据进行耦合,得到针对多个用户的数组矩阵如下:
Figure BDA0003973859930000111
在具体实现中,本发明实施例可以根据预设决策类型从数组矩阵中确定出与预设决策类型具有关联关系的目标文本数值数据和目标数值数据;目标文本数值数据和目标数值数据分别具有对应的目标时间戳和目标数据类型;示例性地,当预设决策类型为“决策类型A”时,若与“决策类型A”具有关联关系的数据需具备“变次”和“数值”属性,则可以确定出与“决策类型A”具有关联关系的目标文本数值数据为“变次bn、变次dn……”,与“决策类型A”具有关联关系的目标数值数据为“数值an、数值cn……”,其中,目标文本数值数据具有对应的目标时间戳“20220101、20220102、20220103……”,具有对应的目标数据类型为“类型b、类型d……”,目标数值数据具有对应的目标时间戳“20220101、20220102、20220103……”,具有对应的目标数据类型为“类型a、类型c……”。
当然,上述例子仅作为示例,本领域技术人员可以采用其他关联关系确定出与预设决策类型具有关联关系的目标文本数值数据和目标数值数据,对此,本发明实施例不作限制。
在具体实现中,本发明实施例可以通过目标时间戳、目标文本数值数据和目标数值数据生成第一曲线;第一曲线用于表达在预设时序下,与不同目标数据类型对应的目标文本数值数据和目标数值数据的变化;
示例性地,参考图2,图2是本发明实施例中提供的一种针对第一曲线的结构示意图,当对应目标数据类型“类型1”、“类型2”、“类型3”和“类型4”,目标时间戳为“顺序时序中的时间单位”,目标文本数值数据和目标数值数据分别为“类型1数值、类型2数值……”和“类型3数值、类型4数值……”时,根据顺序时序可以生成第一曲线为图2所示,第一曲线用于表达在顺序时序中的时间单位下,与“类型1”、“类型2”、“类型3”和“类型4”对应的“类型1数值、类型2数值……”和“类型3数值、类型4数值……”的变化。
在实际应用中,基于时序对数据进行分析有利于得出关于数据持续、长期的变化趋势,并观察出不同数据类型的数据随着时间发生的变化以及相互之间的作用和关联,并且,根据预设时序的不同及时间戳的不同,可以改变时间的尺度,进而根据实际的决策需求同时对不同的数据类型做出更具有针对性和预见性的分析。
在具体实现中,本发明实施例可以通过目标时间戳、用户标识、目标文本数值数据和目标数值数据生成第二曲线;第二曲线用于表达在预设时序下,不同用户标识对应的相同目标数据类型下的目标文本数值数据和目标数值数据的变化;
示例性地,参考图3,图3是本发明实施例中提供的一种针对第二曲线的结构示意图;当对应相同目标数据类型的目标时间戳为“顺序时序中的时间单位”、用户标识为“会员1”、“会员2”、“会员3”和“会员4”,目标文本数值数据和目标数值数据为“会员1数值、会员2数值、会员型3数值、会员4数值……”时,根据顺序时序可以生成第二曲线为图3所示,第二曲线用于表达在顺序时序下,“会员1”、“会员2”、“会员3”和“会员4”对应的相同目标数据类型下的“会员1数值、会员2数值、会员型3数值、会员4数值……”的变化。
在实际应用中,基于时序对数据进行分析有利于得出关于数据持续、长期的变化趋势,并观察出相同数据类型下的不同用户数据随着时间发生的变化以及相互之间的作用和关联,并且,根据预设时序的不同及时间戳的不同,可以改变时间的尺度,进而根据实际的决策需求同时对相同的数据类型做出更具有针对性和预见性的分析。
在具体实现中,本发明实施例可以通过第一曲线和第二曲线计算出针对预设决策类型的决策系数。示例性地,当预设决策类型为“决策类型A”时,根据图2和图3中的第一曲线和第二曲线,按照预设算法计算出针对“决策类型A”的决策系数Σ。
本发明实施例通过将所述文本数值数据和所述数值数据基于对应的时间戳和数据类型进行耦合,生成针对多个所述用户的数组矩阵;根据所述预设决策类型从所述数组矩阵中确定出与所述预设决策类型具有关联关系的目标文本数值数据和目标数值数据;所述目标文本数值数据和所述目标数值数据分别具有对应的目标时间戳和目标数据类型;通过所述目标时间戳、所述目标文本数值数据和所述目标数值数据生成第一曲线;所述第一曲线用于表达在预设时序下,与不同目标数据类型对应的目标文本数值数据和目标数值数据的变化;通过所述目标时间戳、所述用户标识、所述目标文本数值数据和所述目标数值数据生成第二曲线;所述第二曲线用于表达在预设时序下,不同用户标识对应的相同目标数据类型下的目标文本数值数据和目标数值数据的变化;通过所述第一曲线和所述第二曲线计算出针对所述预设决策类型的决策系数。从而提升数据的时效性和动态关联,增强多组数据针对不同决策类型需求的转换能力,减少重复的运算工作,实现了根据实际的决策需求对数据做出更具有针对性和准确性的分析。
在本发明的一个可选地实施例中,所述通过所述第一曲线和所述第二曲线计算出针对所述预设决策类型的决策系数的步骤包括:
根据第一曲线计算所述目标文本数值数据和所述目标数值数据对应不同时间戳的变量频次,根据第一预设规则基于所述变量频次生成常数数值;
基于所述用户标识确定所述第二曲线中的曲线数目;
确定针对所述第二曲线的曲线交点,并根据第二预设规则从所述曲线交点中确定出目标交点数量;
基于所述目标交点数量和所述曲线数目进行计算,生成动态系数;
通过所述动态系数和所述常数数值生成针对所述预设决策类型的决策系数。
在具体实现中,本发明实施例可以根据第一曲线计算目标文本数值数据和目标数值数据对应不同时间戳的变量频次,根据第一预设规则基于变量频次生成常数数值;示例性地,参考图2中第一曲线,已知目标文本数值数据和目标数值数据分别为、“类型1数值、类型2数值……”和“类型3数值、类型4数值……”,时间戳为“顺序时序中的时间单位”,计算出“类型1数值、类型2数值……”和“类型3数值、类型4数值……”对应不同时间戳的变量频次M,当第一预设规则为“变量频次低于20%时,确定对应的目标数值数据和/或目标文本数值数据为常数”,生成对应目标文本数值数据和目标数值数据分别为“类型1数值、类型2数值……”和“类型3数值、类型4数值……”的常数N,其中,常数可以是表示数量的数值,也可以是表示变次的数值,如“薪资=2000”和/或“常住地址变更=2”等。
当然,上述例子仅作为示例,本领域技术人员可以采用其他规则基于变量频次生成常数数值,对此,本发明实施例不作限制。
在具体实现中,本发明实施例可以基于用户标识确定第二曲线中的曲线数目;确定针对第二曲线的曲线交点,并根据第二预设规则从曲线交点中确定出目标交点数量;基于目标交点数量和曲线数目进行计算,生成动态系数;预设决策类型具有对应的多个决策方案;通过动态系数和常数数值生成针对多个决策方案的决策系数。
示例性地,参考图3中第二曲线,其中用户标识为“会员1、会员2、会员3……会员n”,根据用户标识和曲线一一对应关系,确定第二曲线中的曲线数目为“曲线数目=n”,根据第二曲线所示,确定第二曲线上的曲线交点数量为s,按照第二预设规则“交点量高于70%为取值区间”,确定出目标交点数量为s*,确定出区间曲线数目为“区间曲线数目=n*”按照动态系数β=(高位值*交次+低位值*交次)/总交次*区间曲线总数,可以计算出动态系数β。当然,上述例子仅作为示例,本领域技术人员可以采用其他规则基于目标交点数量和曲线数目生成动态系数,对此,本发明实施例不作限制。此外,参考图2中第一曲线,若已知目标文本数值数据和目标数值数据分别为、“类型1数值、类型2数值……”和“类型3数值、类型4数值……”,时间戳为“顺序时序中的时间单位”,计算出“类型1数值、类型2数值……”和“类型3数值、类型4数值……”对应不同时间戳的变量频次M,当第一预设规则为“变量频次低于20%时,确定对应的目标数值数据和/或目标文本数值数据为常数”,生成对应目标文本数值数据和目标数值数据分别为“类型1数值、类型2数值……”和“类型3数值、类型4数值……”的常数。当预设决策类型为“决策类型A”时,“决策类型A”可以对应多个决策方案“决策方案1、决策方案2、决策方案3、决策方案4……决策方案n”,针对“决策方案1、决策方案2、决策方案3、决策方案4……决策方案n”基于上述动态系数β和常数,其中,常数可以是表示数量的数值,也可以是表示变次的数值,如“薪资=2000”和/或“常住地址变更=2”,在此本发明不作限制,按照如下算式进行计算最终得到针对多个决策方案的决策系数“决策系数1、决策系数2、决策系数3、决策系数4……决策系数n”,其中,“类别”对应不同目标文本数值数据和目标数值数据所对应的目标数据类型:
决策系数Σ=类别*常数□动态系数β
本发明实施例通过根据第一曲线计算所述目标文本数值数据和所述目标数值数据对应不同时间戳的变量频次,根据第一预设规则基于所述变量频次生成常数数值;基于所述用户标识确定所述第二曲线中的曲线数目;确定针对所述第二曲线的曲线交点,并根据第二预设规则从所述曲线交点中确定出目标交点数量;基于所述目标交点数量和所述曲线数目进行计算,生成动态系数;通过所述动态系数和所述常数数值生成针对所述预设决策类型的决策系数,从而基于常数、动态系数和决策系数,实现了将不同的类型数据关联分析,并得出动态值,令数据可以在指定周期内具有更高的准确度。
在本发明的一个可选地实施例中,所述通过所述决策系数从多个所述决策方案中确定出目标决策方案的步骤包括:
通过多个所述决策系数和所述目标时间戳生成第三曲线;所述第三曲线用于表达在预设时序下多个所述决策方案所对应的决策系数的变化;
根据所述第三曲线确定目标时间数据,根据所述目标时间数据确定对应的目标决策系数;
将与所述目标决策系数对应的决策方案作为目标决策方案。
参考图4,图4是本发明实施例中提供的一种针对第三曲线的结构示意图。
在具体实现中,本发明实施例可以通过多个决策系数和目标时间戳生成第三曲线;第三曲线用于表达在预设时序下多个决策方案所对应的决策系数的变化;示例性地,参考图3中第二曲线,其中用户标识为“会员1、会员2、会员3……会员n”,根据用户标识和曲线一一对应关系,确定第二曲线中的曲线数目为“曲线数目=n”,根据第二曲线所示,确定第二曲线上的曲线交点数量为s,按照第二预设规则“交点量高于70%为取值区间”,确定出目标交点数量为s*,确定出区间曲线数目为“区间曲线数目=n*”按照动态系数β=(高位值*交次+低位值*交次)/总交次*区间曲线总数,可以计算出动态系数β。当然,上述例子仅作为示例,本领域技术人员可以采用其他规则基于目标交点数量和曲线数目生成动态系数,对此,本发明实施例不作限制。此外,参考图2中第一曲线,若已知目标文本数值数据和目标数值数据分别为、“类型1数值、类型2数值……类型n数值”和“类型3数值、类型4数值……类型n数值”,时间戳为“顺序时序中的时间单位”,计算出“类型1数值、类型2数值……类型n数值”和“类型3数值、类型4数值……类型n数值”对应不同时间戳的变量频次M,当第一预设规则为“变量频次低于20%时,确定对应的目标数值数据和/或目标文本数值数据为常数”,生成对应目标文本数值数据和目标数值数据分别为“类型1数值、类型2数值……类型n数值”和“类型3数值、类型4数值……类型n数值”的常数。当预设决策类型为“决策类型A”时,“决策类型A”可以对应多个决策方案“决策方案1、决策方案2、决策方案3、决策方案4……决策方案n”,针对“决策方案1、决策方案2、决策方案3、决策方案4……决策方案n”基于上述动态系数β和常数,其中,常数可以是表示数量的数值,也可以是表示变次的数值,如“薪资=2000”和/或“常住地址变更=2”,在此本发明不作限制,按照如下算式进行计算,其中,“类别”对应不同目标文本数值数据和目标数值数据所对应的目标数据类型:
决策系数Σ=类别*常数∧动态系数β
最终得到针对多个决策方案的决策系数“决策系数1数值、决策系数2数值、决策系数3数值、决策系数4数值……”,当目标时间戳为“顺序时序中的时间单位”时,将目标时间戳设为第三曲线的X轴,将决策系数Σ=(类别1*常数∧动态系数β)+(类别2*常数∧动态系数β)+......设为第三曲线的Y轴,得到第三曲线。第三曲线用于表达在顺序时序中的时间单位下“决策方案1、决策方案2、决策方案3、决策方案4……决策方案n”所对应的决策系数的变化。
在具体实现中,本发明实施例可以根据第三曲线确定目标时间数据,根据目标时间数据确定对应的目标决策系数;示例性地,参考图4所示,选取X轴上的“决策时间点”作为目标时间数据,根据“决策时间点”确定对应在Y轴上的决策系数n数值,分别得到“决策系数1数值”所对应的“目标决策系数1”、“决策系数2数值”所对应的“目标决策系数2”、“决策系数3数值”所对应的“目标决策系数3”、“决策系数4数值”所对应的“目标决策系数4”……“决策系数n数值”所对应的“目标决策系数n”。
在具体实现中,本发明实施例可以将与目标决策系数对应的决策方案作为目标决策方案,示例性地,当得出与“决策方案1、决策方案2、决策方案3、决策方案4……决策方案n”所对应的决策系数后,根据“决策时间点”确定对应在Y轴上的决策系数n数值,分别得到“决策系数1数值”所对应的“目标决策系数1”、“决策系数2数值”所对应的“目标决策系数2”、“决策系数3数值”所对应的“目标决策系数3”、“决策系数4数值”所对应的“目标决策系数4”……“决策系数n数值”所对应的“目标决策系数n”,通过对“目标决策系数1-n”进行降序排序,可以确定对应的“决策系数1-n数值”排序,从而进一步确定与“决策系数1-n数值”对应的“决策方案1-n”,的排序,抽取前四位,并按照从高到低依次确定决策优先级为“决策方案3>决策方案2>决策方案1>决策方案4”,选取决策优先级最高的决策方案作为目标决策方案。
当然,上述例子仅作为示例,本领域技术人员可以采用其他规则通过目标决策系数确定对应决策方案从而选出目标决策方案,对此,本发明实施例不作限制。
本发明实施例通过多个决策系数和目标时间戳生成第三曲线;第三曲线用于表达在预设时序下多个决策方案所对应的决策系数的变化;根据第三曲线确定目标时间数据,根据所述目标时间数据确定对应的目标决策系数;将与目标决策系数对应的决策方案作为目标决策方案。从而加强了不同用户以及不同类别的数据之间的动态关联,通过决策系数使得决策方案可以进行时间和价值纬度的排序和选取,进一步地增加了数据分析的灵活性,基于时间戳赋予数据的动态性和连续性,可以为数据分析结果的针对性和准确性提供有效支持。
在本发明的一个可选地实施例中,可以按照第一预设时间周期针对所述目标决策系数计算第一偏离幅度数值;
若所述第一偏离幅度数值小于最低阈值,则判定所述目标决策方案有效;
若所述第一偏离幅度数值大于或等于最低阈值且小于或等于最高阈值,则按照第二预设时间周期针对所述目标决策系数计算第二偏离幅度数值;
若所述第一偏离幅度数值大于最高阈值,则判定所述目标决策方案无效。
在实际应用中,由于目前的数据分析手段无法将文本类信息纳入分析数据范围和/或分析数据关联关系不具备时间上的动态性和连续性,分析决策后,缺乏决策后评估效应、效益的检视,以及检视后对分析方法、决策链映射关系的反视检查和优化创造的依据不足,因此通过将不同类别、形式的信息经过运算转化为系数,并对此系数做出评估,则可以有效降低决策分析后复盘的难度,同时也可提供更为准确的参考依据。
在具体实现中,本发明实施例可以按照第一预设时间周期针对目标决策系数计算第一偏离幅度数值,若第一偏离幅度数值小于最低阈值,则判定目标决策方案有效;若第一偏离幅度数值大于或等于最低阈值且小于或等于最高阈值,则按照第二预设时间周期针对目标决策系数计算第二偏离幅度数值;若第一偏离幅度数值大于最高阈值,则判定目标决策方案无效。示例性地,当得出与“决策方案1、决策方案2、决策方案3、决策方案4……决策方案n”所对应的决策系数后,根据“决策时间点”确定对应在Y轴上的决策系数n数值,分别得到“决策系数1数值”所对应的“目标决策系数1”、“决策系数2数值”所对应的“目标决策系数2”、“决策系数3数值”所对应的“目标决策系数3”、“决策系数4数值”所对应的“目标决策系数4”……“决策系数n数值”所对应的“目标决策系数n”,通过对“目标决策系数1-n”进行降序排序,可以确定对应的“决策系数1-n数值”排序,从而进一步确定与“决策系数1-n数值”对应的“决策方案1-n”,的排序,抽取前四位,并按照从高到低依次确定决策优先级为“决策方案3>决策方案2>决策方案1>决策方案4”,选取决策优先级最高的四个决策方案作为目标决策方案,在依据决策方案1-4进行方案实施后,可按照第一预设时间周期为“3-6个月”对“目标决策系数1-4”计算第一偏离幅度数值,例如,3-6个月后,“目标决策系数1、2”由1000变为1300,“目标决策系数3”由1000变为1500,“目标决策系数4”由1000变为1800,将目标决策系数1-n的增长率作为第一偏离幅度数值,则目标决策系数1和目标决策系数2的第一偏离幅度数值为“30%”,目标决策系数3的第一偏离幅度数值为“50%”,目标决策系数4的第一偏离幅度数值为“80%”若最低阈值为40%,最高阈值为70%,则可知“目标决策系数1、2”的第一偏离幅度数值小于最低阈值50%,判定“目标决策系数1、2”对应的目标决策方案1、2有效,“目标决策系数3”的偏离幅度数值高于最低阈值50%但不超过最高阈值70%,则按照第二预设时间周期为“6-12个月”针对目标决策系数3进行计算,获取届时的增长率作为第二偏离幅度数值;“目标决策系数4”的第一偏离幅度数值大于最高阈值70%,则判定目标决策系数4对应的目标决策方案4无效,可以对决策方案重新进行数据源、分析方法、决策方法、执行结果等维度的综合重评估校准。
在具体实现中,本发明实施例的最低阈值和最高阈值可以通过预设生成。
本发明实施例通过按照第一预设时间周期针对目标决策系数计算第一偏离幅度数值,若第一偏离幅度数值小于最低阈值,则判定目标决策方案有效;若第一偏离幅度数值大于或等于最低阈值且小于或等于最高阈值,则按照第二预设时间周期针对目标决策系数计算第二偏离幅度数值;若第一偏离幅度数值大于最高阈值,则判定目标决策方案无效。从而实现了通过决策后的二阶段检视进行推演复盘,对分析方法和决策链进行检视评估及优化。
为使本领域技术人员更好地理解本发明实施例,以下用一完整事例对本发明实施例进行说明。
随着酒店行业数字化发展,各个大中型酒店及连锁酒店为了经营发展建立专属本酒管集团的会员体系,并通过互联网线上营销、线下活动推广等方式,不断发展会员体量,积累了大量的会员信息。酒店目前常将会员作为锚定的高质量消费人群作为营销分析对象,并为会员提供独享、便捷的住店数字化体验。面对海量的十万级、百万级会员数据,和几何倍级的不同类信息,酒店将通过何种分析方法作为不同决策方向的参考,越来越成为酒店行业经营管理的重点。
目前常用分析方法主要的缺陷问题为:
(1)数据源类型主要取数值类数据(如同类产品价格、同类产品数量、实际销售额、各类行业经营指标等)为主,未将一些会员文本类信息(如住址、岗位、就职行业、家庭成员等)变量信息纳入分析;
(2)分析方法主要以实际经营均值、阈值偏离等泛值与经营或行业指数进行匹配比较,通过偏离度、数量级等方法进行对比评分提供;
(3)提供分析决策后,缺乏决策后评估效应、效益的检视,以及检视后对分析方法、决策链映射关系的反视检查和优化创造的问题,限制了酒店行业或客户在使用过程中的个性化和自优化发展;
本发明实施例通过将酒店会员系统中的数据(如会员本人基本信息、家庭信息、工作信息、酒店消费信息)会随着会员每次在酒店的消费以及自身变化而更新,特别是会员在不同时间阶段或环境、自身情况的变化,对酒店提供的产品及需求都会发生变化。酒店为了满足大部分(70%-80%)会员对酒店的需求(服务、产品、环境风格、位置、价格等),需要通过动态分析会员数据进行经营决策,辅助酒店在不同时间阶段达到经营趋势的期望目标。并且能够通过复盘检视,校验分析方法及决策效果。
参考图5,图5是本发明实施例中提供的另一种数据分析方法的步骤流程图。示例性地,本发明实施例可以通过完整的分析推演、决策关联、决策、复盘评估、优化的体系过程进行数据分析,步骤如下:
一、分析方法
(1)信息解耦及耦合:通过基于酒店会员个人(性别、年龄、民族、籍贯、行程轨迹)、家庭(结构、人数、住址)、单位(行业、岗位、职位、收入区间)、行为趋势(消费类型、金额、时间、数量、评价)信息,通过将会员信息建立时间起至分析时间止的数据全部取出,以信息矩阵的方式全景罗列,将文本类变化通过变量进行解耦标记并计次,如会员住址发生变化则从“0”改为“1”,再次变化则改为“α”,“α=变次”。数字类变化进行变量罗列标识。从而实现会员信息数组矩阵的耦合形成,如下所示:
Figure BDA0003973859930000211
(2)数据变量多轨迹曲线描绘及取值:根据耦合后形成的数组矩阵,进行二维平面曲线描绘,X轴为时间轴,Y轴为变量轴。从单人曲线图中(参考图2)进行常数及系数取值,如变量频次低于20%取常变量为常数,类型系数根据多人描绘图(参考图3)的交点及交点量高于70%为取值区间,根据取值区间推演类型动态系数β=(高位值*交次+低位值*交次)/总交次*区间曲线总数;
二、决策方法
(1)决策类型与基础类型的关联:根据决策类型不同,关联与其匹配的基础类型。(如对酒店改造风格进行决策,则取会员性别、年龄、形成轨迹、家庭人数、职位、收入、消费类型、金额、评价等作为关联;通过此法进行酒店行业不同的经营决策方向;
(2)分析数据与决策过程的关联:通过分析过程,可以获取到类型数值,通过类型数值变量频次低于20%取出类型常数,通过类型系数多人描绘的交点及交点量高于70%为取值区间推演取出类型动态系数β。通过此三类数值,结合决策类型与基础类型的关联取值情况进行下一步评级推演。
(3)评级推演及决策:根据不同经营决策方向关联的数据类型、常数、动态系数进行轨迹曲线描绘(参考图4),横轴为时间变量,纵轴为决策系数Σ,Σ=(类别1*常数∧动态系数β)+(类别2*常数∧动态系数β)+......,从而形成多决策类型二维曲线图,从而推演出某时间节点或时间区间内决策方向的决策系数值,根据决策值可进行时间、价值维度的排序。
(4)决策复盘及校准:如根据决策排序进行实施后,可通过3-6个月,6-12个月二阶进行决策后经营趋势复盘,将3-6个月的会员信息数据按分析决策方法进行推演。如分析结果类型动态数据偏离幅度在15%内为有效决策,15%-30%内为进入6-12个月二阶评估决策,超过30%为偏离决策,则需重新进行数据源、分析方法、决策方法、执行结果等维度的综合重评估校准。
例如,对某品牌酒店20条会员数据作为酒店改造楼层房型配置决策为例:
1.获取会员全景数据并进行会员信息解耦及耦合;
1.1通过信息解耦及数组矩阵耦合,获取的个人会员信息数组(20组)矩阵如表3所示:
表3:
Figure BDA0003973859930000231
2.个人及全量数据变量多轨迹曲线描绘及取值;
2.1将个人数组矩阵变量在二维象限中进行描绘,根据获取相关类型数据取值,交点及交点量高于70%为取值区间,根据取值区间推演类型动态系数β。其中β=(高位值*交次+低位值*交次)/总交次*区间曲线总数。
2.2通过步骤2.1得出动态系数β如表4所示:
表4:
Figure BDA0003973859930000232
Figure BDA0003973859930000241
3.决策类型与基础类型的关联推演;
3.1房型楼层决策与上述9项基础动态系数参与关联并用决策系数Σ=(类别1*常数□动态系数β)+(类别2*常数□动态系数β)+......公式进行推演,通过方法得出决策系数,如表5所示:
表5:
Figure BDA0003973859930000242
3.2将得到结果进行二维象限图曲线描绘,以交点区间进行上、下限定位形成决策结果,输出决策系数值最优的楼层对应最优房型决策,如表6所示:
表6:
Figure BDA0003973859930000243
Figure BDA0003973859930000251
本发明实施例,以实现对会员数据进行全量数值化,建立个人信息数值化矩阵,并将数值反映到二维象限中进行该会员、类型数据的交点及阈值区间定位,从而得出动态系数并进行决策系数的生成,提供该时间节点检视决策建议排序。并可通过决策后复盘二阶检视法进行推演复盘,对分析方法和决策链进行检视评估及优化,通过将会员系统信息解耦及耦合,实现会员信息以信息数值矩阵的方式全景罗列参与分析,并且信息数值矩阵通过二维象限分析法,将会员系统中历史真实的海量(十万、百万级)信息以数值曲线参与图形分析;推演分析过程中的文本类变次“α”,类型动态系数“β”,决策系数“Σ”、取(阈)值区间均为根据实际数据推演得出的动态值,在特定决策周期内具备一定参考价值;此外通过决策后的复盘及二阶检视法,为后续分析方法、决策链的优化提供参考依据,通过信息数组矩阵、类型数据常变量等算法,实现酒店经营动态分析及决策,同时通过复盘推演进行方法及决策效果的检视、校正,可提高动态分析决策数据的准确性、科学性。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
参照图6,示出了本发明实施例中提供的一种数据分析装置的结构框图,具体可以包括如下模块:
数据获取模块601,用于获取针对多个用户的文本数据和数值数据;
文本数值数据生成模块602,用于通过对所述文本数据进行解耦,生成文本数值数据;
决策系数计算模块603,用于确定预设决策类型,根据所述文本数值数据和所述数值数据计算出针对所述预设决策类型的决策系数;所述预设决策类型具有对应的多个决策方案;
目标决策方案确定模块604,用于通过所述决策系数从多个所述决策方案中确定出目标决策方案。
可选地,所述文本数据和所述数值数据分别具有对应的时间戳和数据类型;多个所述用户具有一一对应的用户标识,所述决策系数计算模块可以包括:
数组矩阵生成子模块,用于将所述文本数值数据和所述数值数据基于对应的时间戳和数据类型进行耦合,生成针对多个所述用户的数组矩阵;
关联关系确定子模块,用于根据所述预设决策类型从所述数组矩阵中确定出与所述预设决策类型具有关联关系的目标文本数值数据和目标数值数据;所述目标文本数值数据和所述目标数值数据分别具有对应的目标时间戳和目标数据类型;
第一曲线生成子模块,用于通过所述目标时间戳、所述目标文本数值数据和所述目标数值数据生成第一曲线;所述第一曲线用于表达在预设时序下,与不同目标数据类型对应的目标文本数值数据和目标数值数据的变化;
第二曲线生成子模块,用于通过所述目标时间戳、所述用户标识、所述目标文本数值数据和所述目标数值数据生成第二曲线;所述第二曲线用于表达在预设时序下,不同用户标识对应的相同目标数据类型下的目标文本数值数据和目标数值数据的变化;
决策系数计算子模块,用于通过所述第一曲线和所述第二曲线计算出针对所述预设决策类型的决策系数。
可选地,所述决策系数计算子模块可以包括:
常数数值生成单元,用于根据第一曲线计算所述目标文本数值数据和所述目标数值数据对应不同时间戳的变量频次,根据第一预设规则基于所述变量频次生成常数数值;
曲线数目确定单元,用于基于所述用户标识确定所述第二曲线中的曲线数目;
曲线交点确定单元,用于确定针对所述第二曲线的曲线交点,并根据第二预设规则从所述曲线交点中确定出目标交点数量;
动态系数生成单元,用于基于所述目标交点数量和所述曲线数目进行计算,生成动态系数;
决策系数生成单元,用于通过所述动态系数和所述常数数值生成针对所述预设决策类型的决策系数。
可选地,所述目标决策方案确定模块可以包括:
第三曲线生成子模块,用于通过多个所述决策系数和所述目标时间戳生成第三曲线;所述第三曲线用于表达在预设时序下多个所述决策方案所对应的决策系数的变化;
目标决策系数确定子模块,用于根据所述第三曲线确定目标时间数据,根据所述目标时间数据确定对应的目标决策系数;
目标决策方案确定子模块,用于将与所述目标决策系数对应的决策方案作为目标决策方案。
可选地,还可以包括:
第一偏离幅度数值计算子模块,用于按照第一预设时间周期针对所述目标决策系数计算第一偏离幅度数值;
有效判定子模块,用于若所述第一偏离幅度数值小于最低阈值,则判定所述目标决策方案有效;
第二偏离幅度数值计算子模块,用于若所述第一偏离幅度数值大于或等于最低阈值且小于或等于最高阈值,则按照第二预设时间周期针对所述目标决策系数计算第二偏离幅度数值;
无效判定子模块,用于若所述第一偏离幅度数值大于最高阈值,则判定所述目标决策方案无效。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
另外,本发明实施例还提供了一种电子设备,包括:处理器,存储器,存储在存储器上并可在处理器上运行的计算机程序,该计算机程序被处理器执行时实现上述数据分析方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述数据分析方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。
图7为实现本发明各个实施例的一种电子设备的硬件结构示意图。
该电子设备700包括但不限于:射频单元701、网络模块702、音频输出单元703、输入单元704、传感器705、显示单元706、用户输入单元707、接口单元708、存储器709、处理器710、以及电源711等部件。本领域技术人员可以理解,图7中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。在本发明实施例中,电子设备包括但不限于手机、平板电脑、笔记本电脑、掌上电脑、车载终端、可穿戴设备、以及计步器等。
应理解的是,本发明实施例中,射频单元701可用于收发信息或通话过程中,信号的接收和发送,具体的,将来自基站的下行数据接收后,给处理器710处理;另外,将上行的数据发送给基站。通常,射频单元701包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元701还可以通过无线通信系统与网络和其他设备通信。
电子设备通过网络模块702为用户提供了无线的宽带互联网访问,如帮助用户收发电子邮件、浏览网页和访问流式媒体等。
音频输出单元703可以将射频单元701或网络模块702接收的或者在存储器709中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元703还可以提供与电子设备700执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元703包括扬声器、蜂鸣器以及受话器等。
输入单元704用于接收音频或视频信号。输入单元704可以包括图形处理器(Graphics Processing Unit,GPU)7041和麦克风7042,图形处理器7041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元706上。经图形处理器7041处理后的图像帧可以存储在存储器709(或其它存储介质)中或者经由射频单元701或网络模块702进行发送。麦克风7042可以接收声音,并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元701发送到移动通信基站的格式输出。
电子设备700还包括至少一种传感器705,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板7061的亮度,接近传感器可在电子设备700移动到耳边时,关闭显示面板7061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别电子设备姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;传感器705还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等,在此不再赘述。
显示单元706用于显示由用户输入的信息或提供给用户的信息。显示单元706可包括显示面板7061,可以采用液晶显示器(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板7061。
用户输入单元707可用于接收输入的数字或字符信息,以及产生与电子设备的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元707包括触控面板7071以及其他输入设备7072。触控面板7071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板7071上或在触控面板7071附近的操作)。触控面板7071可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器710,接收处理器710发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板7071。除了触控面板7071,用户输入单元707还可以包括其他输入设备7072。具体地,其他输入设备7072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
进一步的,触控面板7071可覆盖在显示面板7061上,当触控面板7071检测到在其上或附近的触摸操作后,传送给处理器710以确定触摸事件的类型,随后处理器710根据触摸事件的类型在显示面板7061上提供相应的视觉输出。虽然在图7中,触控面板7071与显示面板7061是作为两个独立的部件来实现电子设备的输入和输出功能,但是在某些实施例中,可以将触控面板7071与显示面板7061集成而实现电子设备的输入和输出功能,具体此处不做限定。
接口单元708为外部装置与电子设备700连接的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元708可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到电子设备700内的一个或多个元件或者可以用于在电子设备700和外部装置之间传输数据。
存储器709可用于存储软件程序以及各种数据。存储器709可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器709可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器710是电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器709内的软件程序和/或模块,以及调用存储在存储器709内的数据,执行电子设备的各种功能和处理数据,从而对电子设备进行整体监控。处理器710可包括一个或多个处理单元;优选的,处理器710可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器710中。
电子设备700还可以包括给各个部件供电的电源711(比如电池),优选的,电源711可以通过电源管理系统与处理器710逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
另外,电子设备700包括一些未示出的功能模块,在此不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。
本领域普通技术人员可以意识到,结合本发明实施例中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (12)

1.一种数据分析方法,其特征在于,包括:
获取针对多个用户的文本数据和数值数据;
通过对所述文本数据进行解耦,生成文本数值数据;
确定预设决策类型,根据所述文本数值数据和所述数值数据计算出针对所述预设决策类型的决策系数;所述预设决策类型具有对应的多个决策方案;
通过所述决策系数从多个所述决策方案中确定出目标决策方案。
2.根据权利要求1所述的方法,其特征在于,所述文本数据和所述数值数据分别具有对应的时间戳和数据类型;多个所述用户具有一一对应的用户标识,所述根据所述文本数值数据和所述数值数据计算出针对所述预设决策类型的决策系数的步骤包括:
将所述文本数值数据和所述数值数据基于对应的时间戳和数据类型进行耦合,生成针对多个所述用户的数组矩阵;
根据所述预设决策类型从所述数组矩阵中确定出与所述预设决策类型具有关联关系的目标文本数值数据和目标数值数据;所述目标文本数值数据和所述目标数值数据分别具有对应的目标时间戳和目标数据类型;
通过所述目标时间戳、所述目标文本数值数据和所述目标数值数据生成第一曲线;所述第一曲线用于表达在预设时序下,与不同目标数据类型对应的目标文本数值数据和目标数值数据的变化;
通过所述目标时间戳、所述用户标识、所述目标文本数值数据和所述目标数值数据生成第二曲线;所述第二曲线用于表达在预设时序下,不同用户标识对应的相同目标数据类型下的目标文本数值数据和目标数值数据的变化;
通过所述第一曲线和所述第二曲线计算出针对所述预设决策类型的决策系数。
3.根据权利要求2所述的方法,其特征在于,所述通过所述第一曲线和所述第二曲线计算出针对所述预设决策类型的决策系数的步骤包括:
根据第一曲线计算所述目标文本数值数据和所述目标数值数据对应不同时间戳的变量频次,根据第一预设规则基于所述变量频次生成常数数值;
基于所述用户标识确定所述第二曲线中的曲线数目;
确定针对所述第二曲线的曲线交点,并根据第二预设规则从所述曲线交点中确定出目标交点数量;
基于所述目标交点数量和所述曲线数目进行计算,生成动态系数;
通过所述动态系数和所述常数数值生成针对所述预设决策类型的决策系数。
4.根据权利要求1或2或3所述的方法,其特征在于,所述通过所述决策系数从多个所述决策方案中确定出目标决策方案的步骤包括:
通过多个所述决策系数和所述目标时间戳生成第三曲线;所述第三曲线用于表达在预设时序下多个所述决策方案所对应的决策系数的变化;
根据所述第三曲线确定目标时间数据,根据所述目标时间数据确定对应的目标决策系数;
将与所述目标决策系数对应的决策方案作为目标决策方案。
5.根据权利要求4所述的方法,其特征在于,还包括:
按照第一预设时间周期针对所述目标决策系数计算第一偏离幅度数值;
若所述第一偏离幅度数值小于最低阈值,则判定所述目标决策方案有效;
若所述第一偏离幅度数值大于或等于最低阈值且小于或等于最高阈值,则按照第二预设时间周期针对所述目标决策系数计算第二偏离幅度数值;
若所述第一偏离幅度数值大于最高阈值,则判定所述目标决策方案无效。
6.一种数据分析装置,其特征在于,包括:
数据获取模块,用于获取针对多个用户的文本数据和数值数据;
文本数值数据生成模块,用于通过对所述文本数据进行解耦,生成文本数值数据;
决策系数计算模块,用于确定预设决策类型,根据所述文本数值数据和所述数值数据计算出针对所述预设决策类型的决策系数;所述预设决策类型具有对应的多个决策方案;
目标决策方案确定模块,用于通过所述决策系数从多个所述决策方案中确定出目标决策方案。
7.根据权利要求6所述的装置,其特征在于,所述文本数据和所述数值数据分别具有对应的时间戳和数据类型;多个所述用户具有一一对应的用户标识,所述决策系数计算模块包括:
数组矩阵生成子模块,用于将所述文本数值数据和所述数值数据基于对应的时间戳和数据类型进行耦合,生成针对多个所述用户的数组矩阵;
关联关系确定子模块,用于根据所述预设决策类型从所述数组矩阵中确定出与所述预设决策类型具有关联关系的目标文本数值数据和目标数值数据;所述目标文本数值数据和所述目标数值数据分别具有对应的目标时间戳和目标数据类型;
第一曲线生成子模块,用于通过所述目标时间戳、所述目标文本数值数据和所述目标数值数据生成第一曲线;所述第一曲线用于表达在预设时序下,与不同目标数据类型对应的目标文本数值数据和目标数值数据的变化;
第二曲线生成子模块,用于通过所述目标时间戳、所述用户标识、所述目标文本数值数据和所述目标数值数据生成第二曲线;所述第二曲线用于表达在预设时序下,不同用户标识对应的相同目标数据类型下的目标文本数值数据和目标数值数据的变化;
决策系数计算子模块,用于通过所述第一曲线和所述第二曲线计算出针对所述预设决策类型的决策系数。
8.根据权利要求7所述的装置,其特征在于,所述决策系数计算子模块包括:
常数数值生成单元,用于根据第一曲线计算所述目标文本数值数据和所述目标数值数据对应不同时间戳的变量频次,根据第一预设规则基于所述变量频次生成常数数值;
曲线数目确定单元,用于基于所述用户标识确定所述第二曲线中的曲线数目;
曲线交点确定单元,用于确定针对所述第二曲线的曲线交点,并根据第二预设规则从所述曲线交点中确定出目标交点数量;
动态系数生成单元,用于基于所述目标交点数量和所述曲线数目进行计算,生成动态系数;
决策系数生成单元,用于通过所述动态系数和所述常数数值生成针对所述预设决策类型的决策系数。
9.根据权利要求6或7或8所述的装置,其特征在于,所述目标决策方案确定模块包括:
第三曲线生成子模块,用于通过多个所述决策系数和所述目标时间戳生成第三曲线;所述第三曲线用于表达在预设时序下多个所述决策方案所对应的决策系数的变化;
目标决策系数确定子模块,用于根据所述第三曲线确定目标时间数据,根据所述目标时间数据确定对应的目标决策系数;
目标决策方案确定子模块,用于将与所述目标决策系数对应的决策方案作为目标决策方案。
10.根据权利要求9所述的装置,其特征在于,还包括:
第一偏离幅度数值计算子模块,用于按照第一预设时间周期针对所述目标决策系数计算第一偏离幅度数值;
有效判定子模块,用于若所述第一偏离幅度数值小于最低阈值,则判定所述目标决策方案有效;
第二偏离幅度数值计算子模块,用于若所述第一偏离幅度数值大于或等于最低阈值且小于或等于最高阈值,则按照第二预设时间周期针对所述目标决策系数计算第二偏离幅度数值;
无效判定子模块,用于若所述第一偏离幅度数值大于最高阈值,则判定所述目标决策方案无效。
11.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,所述处理器、所述通信接口以及所述存储器通过所述通信总线完成相互间的通信;
所述存储器,用于存放计算机程序;
所述处理器,用于执行存储器上所存放的程序时,实现如权利要求1-5任一项所述的方法。
12.一种计算机可读存储介质,其上存储有指令,当由一个或多个处理器执行时,使得所述处理器执行如权利要求1-5任一项所述的方法。
CN202211521037.XA 2022-11-30 2022-11-30 一种数据分析方法、装置、电子设备及存储介质 Pending CN115952781A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211521037.XA CN115952781A (zh) 2022-11-30 2022-11-30 一种数据分析方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211521037.XA CN115952781A (zh) 2022-11-30 2022-11-30 一种数据分析方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN115952781A true CN115952781A (zh) 2023-04-11

Family

ID=87296246

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211521037.XA Pending CN115952781A (zh) 2022-11-30 2022-11-30 一种数据分析方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN115952781A (zh)

Similar Documents

Publication Publication Date Title
CN103631835B (zh) 兴趣点信息地图呈现系统及其方法
CN111143697B (zh) 一种内容推荐的方法以及相关装置
WO2018120425A1 (zh) 个人财产状态评估方法、装置、设备和存储介质
CN111353299B (zh) 基于人工智能的对话场景确定方法和相关装置
CN110069715A (zh) 一种信息推荐模型训练的方法、信息推荐的方法及装置
CN110956505B (zh) 一种广告库存的预估方法以及相关装置
CN111125523A (zh) 搜索方法、装置、终端设备及存储介质
CN113918580A (zh) 应用于大数据的用户画像关系网络更新方法及服务器
CN111767982A (zh) 用户转换预测模型的训练方法、装置、存储介质以及电子设备
CN115271931A (zh) 一种信用卡产品的推荐方法、装置、电子设备和介质
CN116070114A (zh) 数据集的构建方法、装置、电子设备及存储介质
CN111090877A (zh) 数据生成、获取方法及对应的装置、存储介质
CN116307394A (zh) 产品用户体验评分方法、装置、介质及设备
CN114817742B (zh) 基于知识蒸馏的推荐模型配置方法、装置、设备、介质
CN115952781A (zh) 一种数据分析方法、装置、电子设备及存储介质
CN111080305A (zh) 一种风险识别方法、装置及电子设备
CN112329462B (zh) 一种数据排序方法、装置、电子设备及存储介质
CN113688120A (zh) 数据仓库的质量检测方法、装置和电子设备
CN113535990A (zh) 确定多媒体内容的方法、装置、存储介质和电子设备
Giurgola et al. Mapping urban socioeconomic inequalities in developing countries through Facebook advertising data
CN113128809A (zh) 一种机房评估方法、装置及电子设备
CN111914113B (zh) 一种图像检索的方法以及相关装置
CN111464641B (zh) 消息推送优化方法、设备及可读存储介质
CN112862289B (zh) 一种临床研究从业者的信息匹配方法和装置
CN109168154B (zh) 一种用户行为信息收集方法、装置及移动终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination