一种基于用户画像专用于电力设备台账数据推荐的方法
技术领域
本发明涉及电气设备技术信息领域,具体涉及一种基于用户画像专用于电力设备台账数据推荐的方法。
背景技术
电力设备台账数据在电力生产中有着极其重要的工程意义,电力设备相关的控制数据、业务数据、资金数据均以电力设备台账数据为核心进行汇聚,是各电力设备全生命周期内各项业务的纽带。提高电力设备台账数据的搜索效率,对于提高电力设备各业务效率有着重要的意义。
目前尚无专用于电力设备台账数据的搜索推荐方法。电力设备台账数据较为专业,使用电力设备台账数据的用户也为电力专业的用户,传统电商或操作系统的用户画像构建方法和用户画像不能适用于电力设备台账数据的搜索推荐。
电力设备台账数据字段较多,传统搜索方法中仅对单个字段进行搜索,将使得前端设计变得复杂,给用户带来较大不变,不能适用于当前电力业务场景。本发明提出将多个功能位置类型、品类、型号等关键字段组成电力设备台账数据的长名称,通过对该长名称进行搜索,解决了这一问题。
电力设备台账数据由于专业性较强,自然语言的同义词难以适用,需围绕台账数据制定同义词库。本专利从电力专业应用和电力专业用户角度,围绕电力设备台账数据,结合电力生产实践梳理形成了同义词库,保证了搜索的全面性,让搜索变得更智能简单。
本专利还提供电力设备台账数据的用户信息字段,用户任务中、收藏中、进入详情页等用户行为的量化方法及编码技术,为实时用户画像中间数据表的形成和电力设备台账数据搜索提供有效解决方法。
发明内容
本发明提供一种基于用户画像专用于电力设备台账数据推荐的方法,可根据用户的操作行为和电力设备台账的用户信息勾勒用户画像,并结合用户画像为电力设备台账数据搜索提供优化推荐方法。从电力专业应用和电力专业用户角度提供专用于电力设备台账数据的同义词库。提供电力设备台账数据的用户信息字段,用户任务中、收藏中、进入详情页等用户行为的量化方法及编码技术,为实时用户画像中间数据表的形成和电力设备台账数据搜索提供有效解决方法。
一种基于用户画像专用于电力设备台账数据推荐的方法包括以下步骤:
(1.1)对电力设备台账数据的用户信息字段进行编码,初始化形成实时用户画像中间数据表的排序码1字段;
(1.2)制定电力设备台账数据的关键词库、同义词库、电力设备台账数据的长名称,并对关键词库进行编码;
(1.3)获取用户行为并编码,将编码存于实时用户画像中间数据表排序码2字段。
(1.4)根据电力设备台账数据的名称长度,获得排序码3;
(1.5)获得用户搜索词,用户启动检索操作后,将用户搜索词放到同义词库和关键词库进行查询匹配,若查询到同义词或关键词,则将搜索词、同义词和关键词带出到电力设备台账数据库中,对电力设备台账数据的长名称字段执行查询,获得查询结果;若没有查询到同义词或关键词,则将直接对电力设备台账数据的长名称字段执行查询,获得查询结果。
(1.6)根据查询结果的数据ID到实时用户画像中间数据表中获得各排序码,对排序码进行降序排序推出搜索结果。
上述方法中,步骤(1.1)所述电力设备台账数据的用户信息包括以下字段:
(2.1)设备主人;
(2.2)使用人;
(2.3)管理责任人;
(2.4)运维单位;
(2.5)运维部门;
(2.6)归口管理部门;
(2.7)使用部门;
(2.8)检修单位;
(2.9)检修部门。
上述方法中,步骤(1.1)所述实时用户画像中间数据表包括以下字段:
(3.1)主键ID;
(3.2)台账数据ID;
(3.3)厂站ID;
(3.4)部门ID;
(3.5)用户ID;
(3.6)排序码1;
(3.7)排序码2;
(3.8)排序码3;
(3.9)操作时刻;
(3.10)排序码版本号;
(3.11)标签位。
上述方法中,步骤(1.1)所述,根据台账数据的用户信息字段进行编码由以下步骤获得:
(4.1)遍历各台账数据,根据台账数据的信息字段,由高位到低位根据二进制的方法依次根据用户ID和用户的部门ID进行取值,若用户ID与该台账数据的用户信息字段匹配则置1,不匹配置0,若用户部门ID与该台账数据的用户信息字段匹配则置1,不匹配置0;
(4.2)该台账数据的用户信息字段高位到低位字段的排序为设备主人、使用人、管理责任人、运维单位、运维部门、归口管理部门、使用部门、检修单位、检修部门。
上述方法中,步骤(1.2)所述电力设备台账数据包含有台账数据ID、电力设备台账数据的长名称、电力设备台账数据的名称、功能位置类型、品类等字段;电力设备台账数据的关键词库由以下步骤获得:
(5.1)对所有电力设备台账数据的功能位置类型字段和品类字段进行人工切词,获得切词集合Q;
(5.2)对切词集合Q取唯一,即获得台账数据的关键词库。
上述方法中,步骤(1.2)所述台账数据同义词库为根据生产经验,总结的不同文字表达同一电力专业含义的词库,如下表所示。
不同文字表达同一电力专业含义的词库
上述方法中,步骤(1.2)所述电力设备台账数据的长名称由电力设备台账数据的名称、厂站、电压等级、功能位置类别、功能位置类型、品类、型号组成,所述功能位置是电力设备的功能位置,所述品类和型号是电力设备的品类和型号。
上述方法中,步骤(1.3)所述通过获取用户在前端操作网页过程中网页控件发生的传址和传值事件记录获取用户行为,将编码存于实时用户画像中间数据表,由以下步骤获得:
(8.1)根据用户任务中、收藏中、进入详情页进行编码,任务中为03,收藏为02,曾点击01,缺省为00。
(8.2)将该编码存到实时用户画像中间数据表的排序码2字段中;
(8.3)按“年份月份日期时分秒毫秒”的格式记录操作时刻并存于实时用户画像中间数据表的操作时刻字段。
上述方法中,步骤(1.4)所述根据电力设备台账数据的名称长度,获得排序码3由103减去电力设备台账数据名称长度获得。
上述方法中,步骤(1.5)所述对电力设备台账数据的长名称字段执行查询,当查询的关键词有多个时,根据与关键词匹配情况形成查询结果集合,按以下优先级进行对各集合进行排序:关键词全匹配、关键词部分匹配、关键词不匹配。
与现有技术相比,本发明填补了工程界的空白,具有以下优点和技术效果:
(1)本发明提供了根据电力设备台账数据的用户信息字段,根据用户任务中、收藏中的台账数据,以及用户点击进入台账数据详情页等用户行为的量化及编码技术,将根据用户行为勾勒用户画像,根据用户画像进行搜索推荐的问题转化为中间表构建和排序码的实时降序问题,使得基于用户画像专用于电力设备台账数据搜索的推荐方法可以通过计算机自动实现。
(2)本发明解决了电力设备台账数据字段众多,搜索设计复杂的难题,给出关键的字段,并组合形成电力设备台账数据的长名称,大大简化了前端的专业设计;并从电力专业应用和电力专业用户角度,围绕电力设备台账数据,结合电力生产实践梳理提供了同义词库,保证了搜索的全面性和专业性。
(3)本发明通过标准化方法提供了计算机基于用户画像专用于电力设备台账数据搜索的推荐方法,通过本专利实现了以电力设备台账数据为业务核心的专业推荐,使得专业用户在与系统交互过程中,随着用户使用频次的增加,画像越完备,专业系统自趋智能,提高电力设备台账数据的搜索效率,提高电力设备各业务效率。
附图说明
图1为本实例中一种基于用户画像专用于电力设备台账数据推荐的方法的流程图。
具体实施方式
以下结合附图和实例对本发明的具体实施作进一步说明,但本发明的实施和保护不限于此。需指出的是,以下若有未特别详细说明之过程,均是本领域技术人员可参照现有技术实现或理解的。
以下对某公司台账数据为例进行说明。
结合图1流程,一种基于用户画像专用于电力设备台账数据推荐的方法包括以下步骤:
(1.1)对电力设备台账数据的用户信息字段进行编码,初始化形成实时用户画像中间数据表的排序码1字段。
电力设备台账数据的用户信息字段如下表1和表2所示。
表1电力用户的信息字段
用户ID |
用户名称 |
部门 |
单位 |
4678 |
张某三 |
运行中心 |
XX发电公司 |
7674 |
王某五 |
电气检修部 |
修试分公司 |
8788 |
李某四 |
生产技术部 |
XX发电公司 |
表2电力设备台账数据中的用户信息字段
初始化形成实时用户画像中间数据表的排序码1如下表3所示。主键ID为随机生成的不重复的编号,厂站ID“0201”和“0202”分别指代不同厂站,如广东蓄能发电有限公司和惠州蓄能发电有限公司。部门ID中“09”和“08”分别指代不同的部门。其中“09”表示运行中心,“08”表示维护中心。根据二进制的方法依次根据用户ID和用户的部门ID进行取值。表3实时用户画像中间数据表的排序码1
(1.2)制定电力设备台账数据的关键词库、同义词库、电力设备台账数据的长名称,并对关键词库进行编码。
电力设备台账数据如下表3所示。电力设备台账数据的长名称作为其中一个字段。
表3电力设备台账数据
对所有电力设备台账数据的功能位置类型字段和品类字段进行人工切词,获得切词集合Q;对切词集合Q取唯一,即获得台账数据的关键词库,并编码获得表4。
表4电力设备台账数据的关键词库
关键词ID |
关键词 |
编码 |
Dd3343 |
发电机 |
|
Sdf333 |
保护 |
|
7667fg |
笔记本电脑 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(1.3)获取用户行为并编码,将编码存于实时用户画像中间数据表排序码2字段。
根据用户任务中、收藏中、进入详情页进行编码,任务中为03,收藏为02,曾点击01,缺省为00。获取用户行为并编码,存到实时用户画像中间数据表的排序码2字段中,如表5所示。
表5实时用户画像中间数据表的排序码2
(1.4)根据电力设备台账数据的名称长度,获得排序码3。
根据电力设备台账数据的名称长度,获得排序码3由103减去电力设备台账数据名称长度获得表6。
表6实时用户画像中间数据表的排序码3
/>
(1.5)获得用户搜索词,用户启动检索操作后,将用户搜索词放到同义词库和关键词库进行查询匹配,若查询到同义词或关键词,则将搜索词、同义词和关键词带出到电力设备台账数据库中,对电力设备台账数据的长名称字段执行查询,获得查询结果;若没有查询到同义词或关键词,则将直接对电力设备台账数据的长名称字段执行查询,获得查询结果。
用户输入搜索词“发电机”,启动检索操作,将用户搜索词放到同义词库和关键词库进行查询匹配,若查询到同义词“水轮发电机”、关键词“发电机”。
则将同义词和关键词带出到电力设备台账数据库中,对电力设备台账数据的长名称字段执行查询,获得查询结果如表7所示。
表7查询结果
(1.6)根据查询结果的数据ID到实时用户画像中间数据表中获得各排序码,按照“张某三”用户对排序码进行降序排序推出搜索结果,如表8所示。
表8推荐结果
序号 |
台账数据ID |
排序码 |
1 |
f91e13e |
11011010003990 |
2 |
a44e145 |
11010001102985 |
|
|
|
结论:
可见,本发明提供一种基于用户画像专用于电力设备台账数据推荐的方法,解决了电力设备台账数据字段众多,搜索设计复杂的难题,从电力专业应用和电力专业用户角度,围绕电力设备台账数据,结合电力生产实践梳理提供了同义词库,保证了搜索的全面性和专业性。提供了电力设备台账数据的用户信息字段,根据用户任务中、收藏中的台账数据,以及用户点击进入台账数据详情页等用户行为的量化及编码技术。本发明用自动检测和控制的方式实现自趋智能,实现了以电力设备台账数据为业务核心的专业推荐,使得专业用户在与系统交互过程中,随着用户使用频次的增加,画像越完备,专业系统自趋智能,提高电力设备台账数据的搜索效率,提高电力设备各业务效率。