CN117131274A - 基于场景化知识图谱的推荐方法、系统及存储介质 - Google Patents
基于场景化知识图谱的推荐方法、系统及存储介质 Download PDFInfo
- Publication number
- CN117131274A CN117131274A CN202311119680.4A CN202311119680A CN117131274A CN 117131274 A CN117131274 A CN 117131274A CN 202311119680 A CN202311119680 A CN 202311119680A CN 117131274 A CN117131274 A CN 117131274A
- Authority
- CN
- China
- Prior art keywords
- recommendation
- recommendation model
- edge side
- data
- knowledge graph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000003860 storage Methods 0.000 title claims abstract description 22
- 238000012545 processing Methods 0.000 claims abstract description 53
- 238000012549 training Methods 0.000 claims abstract description 49
- 238000000586 desensitisation Methods 0.000 claims abstract description 43
- 230000008569 process Effects 0.000 claims abstract description 10
- 230000006399 behavior Effects 0.000 claims description 71
- 238000004590 computer program Methods 0.000 claims description 17
- 238000000605 extraction Methods 0.000 claims description 7
- 238000013138 pruning Methods 0.000 claims description 4
- 230000000694 effects Effects 0.000 abstract description 6
- 230000006978 adaptation Effects 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 9
- 230000004044 response Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013501 data transformation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 238000004821 distillation Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000013140 knowledge distillation Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/43—Querying
- G06F16/435—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
- G06F21/6254—Protecting personal data, e.g. for financial or medical purposes by anonymising data, e.g. decorrelating personal data from the owner's identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/042—Knowledge-based neural networks; Logical representations of neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0495—Quantised networks; Sparse networks; Compressed networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/096—Transfer learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/098—Distributed learning, e.g. federated learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/12—Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/2866—Architectures; Arrangements
- H04L67/30—Profiles
- H04L67/306—User profiles
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Business, Economics & Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioethics (AREA)
- Medical Informatics (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Computer Hardware Design (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Computer Security & Cryptography (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例公开了一种基于场景化知识图谱的推荐方法、系统及存储介质。该方法属于物联网技术领域,其包括:边缘侧采集用户的行为数据,并对行为数据进行处理得到脱敏样例数据和特征向量数据;云平台接收边缘侧上发的脱敏样例数据和特征向量数据,并根据脱敏样例数据和特征向量数据确定应用场景;云平台根据应用场景确定场景化知识图谱及初始推荐模型,并将场景化知识图谱和初始推荐模型进行联合训练得到目标推荐模型,将目标推荐模型进行轻量化处理得到轻量级推荐模型;边缘侧接收云平台下发的轻量级推荐模型,并将行为数据输入轻量级推荐模型以生成推荐结果。本申请实施例可提高边缘侧的场景化适应能力和推荐效果。
Description
技术领域
本发明涉及物联网技术领域,尤其涉及一种基于场景化知识图谱的推荐方法、系统及存储介质。
背景技术
知识图谱是一种表示“实体”间“关系”的语义网络图,是复杂关联关系的最有效表达方式。其中的“实体”具有可区别性、且独立存在的某种事物,例如,一个人或一种商品;而“关系”描述了实体之间的各种复杂的联系。在知识图谱中最简单的元素是三元组,分三元组为头实体、尾实体和关系。
推荐系统在信息爆炸的互联网时代,推荐系统可以理解用户的个性化偏好和需求,帮助用户筛选出自己感兴趣的产品和服务,现有的推荐系统存在着数据稀疏以及冷启动等问题,容易造成模型过拟合问题。
传统的云计算是集中式大数据处理,边缘计算则可以理解为边缘式大数据处理。相较于云计算,边缘计算不用将数据传到遥远的云端(云平台),在边缘侧就能对数据进行分析、计算与处理,针对具体的场景生成需要的结果。但边缘侧因受限于硬件资源,大规模训练模型很难实现,且应用行业企业的数据安全问题,即具体场景,所需数据在企业侧,不能开放给边缘侧进行模型生成及训练,因此,边缘计算只能对较为简单的应用场景进行智能分析与处理,针对复杂场景,适应能力不强,推荐效果较差。
发明内容
本发明实施例提供了一种基于场景化知识图谱的推荐方法、系统及存储介质,旨在提高边缘侧场景化适应能力及推荐效果。
第一方面,本发明实施例提供了一种基于场景化知识图谱的推荐方法,包括:
边缘侧采集用户的行为数据,并对所述行为数据进行处理得到脱敏样例数据和特征向量数据;
云平台接收所述边缘侧上发的所述脱敏样例数据和所述特征向量数据,并根据所述脱敏样例数据和所述特征向量数据确定应用场景;
所述云平台根据所述应用场景确定具体场景化知识图谱及初始推荐模型,并将所述场景化知识图谱和所述初始推荐模型进行联合训练得到目标推荐模型,将所述目标推荐模型进行轻量化处理得到轻量级推荐模型;
所述边缘侧接收所述云平台下发的所述轻量级推荐模型,并将所述行为数据输入所述轻量级推荐模型以生成推荐结果。
第二方面,本发明实施例还提供了一种基于场景化知识图谱的推荐系统,其包括:配置于边缘侧中的采集处理单元及生成单元,配置于云平台中的接收确定单元及训练处理单元,其中,
所述采集处理单元用于边缘侧采集用户的行为数据,并对所述行为数据进行处理得到脱敏样例数据和特征向量数据;
所述接收确定单元用于云平台接收所述边缘侧上发的所述脱敏样例数据和所述特征向量数据,并根据所述脱敏样例数据和所述特征向量数据确定应用场景;
所述训练处理单元用于所述云平台根据所述应用场景确定具体场景化知识图谱及初始推荐模型,并将所述场景化知识图谱和所述初始推荐模型进行联合训练得到目标推荐模型,将所述目标推荐模型进行轻量化处理得到轻量级推荐模型;
所述生成单元用于所述边缘侧接收所述云平台下发的所述轻量级推荐模型,并将所述行为数据输入所述轻量级推荐模型以生成推荐结果。
第三方面,本发明实施例还提供了一种基于场景化知识图谱的推荐系统,其包括边缘侧和云平台,所述边缘侧和云平台均包括存储器及处理器,所述存储器上存储有计算机程序,所述边缘侧和云平台的所述处理器执行所述计算机程序时实现上述方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序当被处理器执行时可实现上述方法。
本发明实施例提供了一种基于场景化知识图谱的推荐方法、系统及存储介质。其中,所述方法包括:边缘侧采集用户的行为数据,并对所述行为数据进行处理得到脱敏样例数据和特征向量数据;云平台接收所述边缘侧上发的所述脱敏样例数据和所述特征向量数据,并根据所述脱敏样例数据和所述特征向量数据确定应用场景;所述云平台根据所述应用场景确定具体场景化知识图谱及初始推荐模型,并将所述场景化知识图谱和所述初始推荐模型进行联合训练得到目标推荐模型,将所述目标推荐模型进行轻量化处理得到轻量级推荐模型;所述边缘侧接收所述云平台下发的所述轻量级推荐模型,并将所述行为数据输入所述轻量级推荐模型以生成推荐结果。本发明实施例的技术方案中在云平台对场景化知识图谱和初始推荐模型进行联合训练得到目标推荐模型,边缘侧接收云平台下发的对目标推荐模型进行轻量化处理得到轻量级推荐模型,根据轻量级推荐模型对行为数据进行验证以生成推荐结果,将模型训练放在云平台而不是放在边缘侧,可提高推荐模型训练的速度,且因模型训练过程中结合场景化知识图谱及对模型进行了轻量化处理,因此可提高边缘侧的场景化适应能力,进而还可提高边缘侧的推荐效果。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种基于场景化知识图谱的推荐系统的架构图;
图2是本发明实施例提供的云平台和边缘侧网关及算力模块的架构图;
图3是本发明实施例提供的一种基于场景化知识图谱的推荐方法的流程示意图;
图4为本发明实施例提供的一种基于场景化知识图谱的推荐系统的示意性框图;
图5为本发明实施例提供的一种计算机设备的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
请参阅图1,图1是本发明实施例提供的基于场景化知识图谱的推荐系统的架构图。该基于场景化知识图谱的推荐系统包括边缘侧和云平台,其中,所述边缘侧包括边缘侧网关和边缘侧算力模块。可理解地,如图1所示,行业用户为模块A,边缘侧网关及算力模块为模块B,云平台为模块C,行业用户与边缘侧网关通信,主要向上传输采集的用户行为数据,并下发轻量级推荐模型生成的推荐结果;边缘侧网关与云平台通信,以上发用户的脱敏样例数据和特征向量数据;云平台和边缘侧网关通信,以下发轻量级推荐模型。
请参阅图2,图2是本发明实施例提供的云平台和边缘侧网关及算力模块的架构图。如图2所示,云平台包括场景化数据库、特征数据库、场景化知识图谱库、基础推荐模型库、模型训练引擎、联合学习推荐模型库、对应的轻量级推荐模型库、信息下发与接受模块、网络服务,其中,场景化数据库和特征数据库用于场景化判别,场景化数据库还用于存储边缘侧上发的脱敏样例数据,特征数据库用于存储边缘侧上发的特征向量数据;场景化知识图谱库中包括金融、电商(新零售)、智能制造、智慧城市等知识图谱库,而基础推荐模型库包括与应用场景相对应的基础推荐模型;网络服务用于连接如物联网以进行相互通信;联合学习推荐模型库:用于存储场景化知识图谱库与基础推荐系统联合学习生成的模型;轻量级推荐模型库:用于存储通过剪枝、量化、网络结构优化、知识蒸馏以及模型蒸馏生成的轻量级推荐模型;模型训练引擎:将场景化知识图谱库与基础推荐系统进行联合学习训练,生成性能更高的推荐模型,并生成对应的轻量级推荐模型,下发至各边缘侧。边缘侧网关及算力模块包括数据存储、脱敏、预处理,特征提取模块、基础推荐模型训练引擎、轻量级推荐模型验证、评估引擎、网络服务、信息上发与接收模块,其中,轻量级推荐模型验证、评估引擎,用于测试验证得到推荐结果,并向用户进行展示。
图3是本发明实施例提供的一种基于场景化知识图谱的推荐方法的流程示意图。本发明实施例的基于场景化知识图谱的推荐方法可应用于基于场景化知识图谱的推荐系统中,例如可通过配置于基于场景化知识图谱的推荐系统上的软件程序来实现该基于场景化知识图谱的推荐方法,以提高边缘侧的场景化适应能力和推荐效果。如图3所示,该方法包括以下步骤S100-S130。
S100、边缘侧采集用户的行为数据,并对所述行为数据进行处理得到脱敏样例数据和特征向量数据。
本发明实施例中,所述边缘侧采集用户的主动行为数据和被动行为数据,并对所述主动行为数据和所述被动行为数据进行格式调整,具体地,是将所述主动行为数据和所述被动行为数据调整为所述边缘侧支持的数据格式;所述边缘侧对格式调整后的所述主动行为数据和所述被动行为数据进行脱敏处理得到所述脱敏样例数据;所述边缘侧对格式调整后的所述主动行为数据和所述被动行为数据进行预处理得到主动处理行为数据和被动处理行为数据,并对所述主动处理行为数据和所述被动处理行为数据进行特征提取得到所述特征向量数据。需要说明的是,在本实施例中,所述预处理包括数据清洗、数据集成、数据变换以及数据规约等处理方式;特征提取为常用的特征提取算法,例如主成分分析方法。
S110、云平台接收所述边缘侧上发的所述脱敏样例数据和所述特征向量数据,并根据所述脱敏样例数据和所述特征向量数据确定应用场景。
本发明实施例中,所述云平台接收所述边缘侧上发的所述脱敏样例数据和所述特征向量数据,并将所述脱敏样例数据和所述特征向量数据分别保存至场景化数据库和特征数据库;所述云平台将所述脱敏样例数据和所述特征向量数据与场景化知识图谱进行匹配以确定所述应用场景,例如确定的应用场景是智慧城市还是金融的场景。
S120、所述云平台根据所述应用场景确定具体场景化知识图谱及初始推荐模型,并将所述场景化知识图谱和所述初始推荐模型进行联合训练得到目标推荐模型,将所述目标推荐模型进行轻量化处理得到轻量级推荐模型。
本发明实施例中,所述云平台将所述应用场景与场景化知识图谱和基础推荐模型库进行匹配以确定具体场景化知识图谱和初始推荐模型;所述云平台将所述具体场景化知识图谱和所述初始推荐模型进行联合训练得到目标推荐模型,具体地,所述云平台获取所述具体场景化知识图谱中的各种应用场景数据,并将各种应用场景数据输入至所述初始推荐模型进行迭代训练;若满足预设训练结束条件,则将所述初始推荐模型作为所述目标推荐模型,其中,所述预设训练结束条件为迭代训练次数到达预设迭代训练次数;所述云平台对所述目标推荐模型进行剪枝、量化、网络结构优化、知识蒸馏以及模型蒸馏得到轻量级推荐模型。需要说明的是,在本实施例中,之所以要对目标推荐模型进行轻量化处理是为了提高模型性能以及模型在边缘侧应用的能力。还需要说明的是,在本实施例中,基础推荐模型库中存储有多种应用场景下用户行为推荐系统,推荐系统可以理解用户的个性化偏好和需求,帮助用户筛选出自己感兴趣的产品和服务;所述目标推荐模型为如RippleNet等框架的模型,所述云平台还会将所述目标推荐模型保存在联合学习推荐模型库中,以及将所述轻量级推荐模型保存在轻量级推荐模型库中,上述将所述场景化知识图谱和所述初始推荐模型进行联合训练是通过模型训练引擎实现的。
S130、所述边缘侧接收所述云平台下发的所述轻量级推荐模型,并将所述行为数据输入所述轻量级推荐模型以生成推荐结果。
本发明实施例中,所述边缘侧接收所述云平台下发的所述轻量级推荐模型,并将所述行为数据输入所述轻量级推荐模型以得到推荐得分;所述边缘侧将所述推荐得分进行排序以生成推荐结果,具体地,是将所述推荐得分按照从高到低或从低到高的顺序进行排序,在本实施例,优选按照从高到低的顺序进行排序。需要说明的是,在本实施例中,所述边缘侧得到所述推荐结果之后,还会将所述推荐结果进行展示,以方便用户进行查看,展示方式依据系统性能决定,例如语音播报、文本、图像或视频展示等方式;若接收到重新推荐指令,表明用户对推荐结果并不满意,则执行所述将所述行为数据输入所述轻量级推荐模型以得到推荐得分的步骤,以重新生成推荐结果。可理解地,若未接收到重新推荐指令,表明用户对推荐结果满意,云平台下发的轻量级推荐模型推荐效果较好。
需要说明的是,在本实施例中,通过云平台下发轻量级推荐模型,可以在边缘侧实现对模型进行训练测试、验证评估,计算量小,能够解决边缘侧计算资源不足,基础算力无法进行大规模模型训练的问题,同时提高边缘侧场景化适应能力;同时,用户侧数据存储在边缘侧,可以保证数据安全,适合边缘侧场景需求,符合行业和企业客户应用需求;云平台可以实现场景化高性能推荐模型训练,有助于挖掘知识图谱信息,辅助提高推荐系统的性能。
为方便理解,现举例如下:在智慧医疗场景中,庞大的医疗数据库,需要实现智能化管理与应用,可以利用医疗数据库生成医疗领域的知识图谱,建立基于医疗知识图谱的云就诊平台,供患者访问使用,患者如有身体不适,可先访问云就诊平台,平台结合患者过往病史以及不适症状,利用本实施例中的基于场景化知识图谱的推荐方法对患者的问题进行智能分析,并生成推荐治疗方案供患者参考,从而缓解医疗资源压力。在智慧金融场景中,知识图谱可以为金融行业的风险评估、预测、反欺诈、精准营销、智能搜索等提供技术支撑。可以利用本实施例提出的基于场景化知识图谱的推荐的方法实现精准营销。
图4是本发明实施例提供的一种基于场景化知识图谱的推荐系统200的示意性框图。如图4所示,对应于以上应用于所述边缘侧和云平台的基于场景化知识图谱的推荐方法,该基于场景化知识图谱的推荐系统200包括用于执行上述基于场景化知识图谱的推荐方法的单元。具体地,请参阅图4,该基于场景化知识图谱的推荐系统200包括配置于边缘侧中的采集处理单元101及生成单元102,配置于云平台中的接收确定单元201以及训练处理单元202。
其中,所述采集处理单元101用于边缘侧采集用户的行为数据,并对所述行为数据进行处理得到脱敏样例数据和特征向量数据;所述接收确定单元201用于云平台接收所述边缘侧上发的所述脱敏样例数据和所述特征向量数据,并根据所述脱敏样例数据和所述特征向量数据确定应用场景;所述训练处理单元202用于所述云平台根据所述应用场景确定具体场景化知识图谱及初始推荐模型,并将所述场景化知识图谱和所述初始推荐模型进行联合训练得到目标推荐模型,将所述目标推荐模型进行轻量化处理得到轻量级推荐模型;所述生成单元102用于所述边缘侧接收所述云平台下发的所述轻量级推荐模型,并将所述行为数据输入所述轻量级推荐模型以生成推荐结果。
在某些实施例,例如本实施例中,所述采集处理单元101包括采集调整单元、脱敏处理单元以及处理提取单元。
其中,所述采集调整单元用于所述边缘侧采集用户的主动行为数据和被动行为数据,并对所述主动行为数据和所述被动行为数据进行格式调整;所述脱敏处理单元用于所述边缘侧对格式调整后的所述主动行为数据和所述被动行为数据进行脱敏处理得到所述脱敏样例数据;所述处理提取单元用于所述边缘侧对格式调整后的所述主动行为数据和所述被动行为数据进行预处理得到主动处理行为数据和被动处理行为数据,并对所述主动处理行为数据和所述被动处理行为数据进行特征提取得到所述特征向量数据。
在某些实施例,例如本实施例中,所述接收确定单元201包括接收保存单元及第一匹配确定单元。
其中,所述接收保存单元用于所述云平台接收所述边缘侧上发的所述脱敏样例数据和所述特征向量数据,并将所述脱敏样例数据和所述特征向量数据分别保存至场景化数据库和特征数据库;所述第一匹配单元用于所述云平台将所述脱敏样例数据和所述特征向量数据与场景化知识图谱进行匹配以确定所述应用场景。
在某些实施例,例如本实施例中,所述训练处理单元202包括第二匹配确定单元、训练单元以及轻量处理单元。
其中,所述第二匹配确定单元用于所述云平台将所述应用场景与场景化知识图谱和基础推荐模型库进行匹配以确定具体场景化知识图谱和初始推荐模型;所述训练单元用于所述云平台将所述具体场景化知识图谱和所述初始推荐模型进行联合训练得到目标推荐模型;所述轻量处理单元用于所述云平台对所述目标推荐模型进行剪枝、量化、网络结构优化、知识蒸馏以及模型蒸馏得到轻量级推荐模型。
在某些实施例,例如本实施例中,所述训练单元包括获取训练单元及作为单元。
其中,所述获取训练单元用于所述云平台获取所述具体场景化知识图谱中的各种应用场景数据,并将各种应用场景数据输入至所述初始推荐模型进行迭代训练;所述作为单元用于若满足预设训练结束条件,则将所述初始推荐模型作为所述目标推荐模型。
在某些实施例,例如本实施例中,所述生成单元102包括下发输入单元及排序生成单元。
其中,所述下发输入单元用于所述边缘侧接收所述云平台下发的所述轻量级推荐模型,并将所述行为数据输入所述轻量级推荐模型以得到推荐得分;所述排序生成单元用于所述边缘侧将所述推荐得分进行排序以生成推荐结果。
在某些实施例,例如本实施例中,所述基于场景化知识图谱的推荐系统200还包括配置于边缘侧的展示单元及执行单元。
其中,所述展示单元用于所述边缘侧将所述推荐结果进行展示;所述执行单元用于若接收到重新推荐指令,则执行所述将所述行为数据输入所述轻量级推荐模型以得到推荐得分的步骤。
需要说明的是,所属领域的技术人员可以清楚地了解到,上述基于场景化知识图谱的推荐系统200和各单元的具体实现过程,可以参考前述方法实施例中的相应描述,为了描述的方便和简洁,在此不再赘述。
上述基于场景化知识图谱的推荐系统可以实现为一种计算机程序的形式,该计算机程序可以在如图5所示的计算机设备上运行。
请参阅图5,图5是本申请实施例提供的一种计算机设备的示意性框图。该计算机设备900为搭建有基于场景化知识图谱的推荐系统的设备。
参阅图5,该计算机设备900包括通过系统总线901连接的处理器902、存储器和接口907,其中,存储器可以包括存储介质903和内存储器904。
该存储介质903可存储操作系统9031和计算机程序9032。该计算机程序9032被执行时,可使得处理器902执行一种基于场景化知识图谱的推荐方法。
该处理器902用于提供计算和控制能力,以支撑整个计算机设备900的运行。
该内存储器904为存储介质903中的计算机程序9032的运行提供环境,该计算机程序9032被处理器902执行时,可使得处理器902执行一种基于场景化知识图谱的推荐方法。
该接口905用于与其它设备进行通信。本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备900的限定,具体的计算机设备900可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述边缘侧和云平台各自的所述处理器902用于运行存储在存储器中的计算机程序9032,以实现上述基于场景化知识图谱的推荐方法的任意实施例。
应当理解,在本申请实施例中,处理器902可以是中央处理单元(CentralProcessing Unit,CPU),该处理器902还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(终端lication Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本领域普通技术人员可以理解的是实现上述实施例的方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成。该计算机程序可存储于一存储介质中,该存储介质为计算机可读存储介质。该计算机程序被该无线通信系统中的至少一个处理器执行,以实现上述方法的实施例的流程步骤。
因此,本发明还提供一种存储介质。该存储介质可以为计算机可读存储介质。该存储介质存储有计算机程序。该计算机程序被处理器执行时使处理器执行上述基于场景化知识图谱的推荐方法的任意实施例。
所述存储介质可以是U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的计算机可读存储介质。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、无线通信软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的。例如,各个单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。本发明实施例系统中的单元可以根据实际需要进行合并、划分和删减。另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。
该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该无线通信软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人无线通信,终端,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其他实施例的相关描述。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,尚且本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种基于场景化知识图谱的推荐方法,其特征在于,包括:
边缘侧采集用户的行为数据,并对所述行为数据进行处理得到脱敏样例数据和特征向量数据;
云平台接收所述边缘侧上发的所述脱敏样例数据和所述特征向量数据,并根据所述脱敏样例数据和所述特征向量数据确定应用场景;
所述云平台根据所述应用场景确定具体场景化知识图谱及初始推荐模型,并将所述场景化知识图谱和所述初始推荐模型进行联合训练得到目标推荐模型,将所述目标推荐模型进行轻量化处理得到轻量级推荐模型;
所述边缘侧接收所述云平台下发的所述轻量级推荐模型,并将所述行为数据输入所述轻量级推荐模型以生成推荐结果。
2.根据权利要求1所述的基于场景化知识图谱的推荐方法,其特征在于,所述边缘侧采集用户的行为数据,并对所述行为数据进行处理得到脱敏样例数据和特征向量数据,包括:
所述边缘侧采集用户的主动行为数据和被动行为数据,并对所述主动行为数据和所述被动行为数据进行格式调整;
所述边缘侧对格式调整后的所述主动行为数据和所述被动行为数据进行脱敏处理得到所述脱敏样例数据;
所述边缘侧对格式调整后的所述主动行为数据和所述被动行为数据进行预处理得到主动处理行为数据和被动处理行为数据,并对所述主动处理行为数据和所述被动处理行为数据进行特征提取得到所述特征向量数据。
3.根据权利要求1所述的基于场景化知识图谱的推荐方法,其特征在于,所述云平台接收所述边缘侧上发的所述脱敏样例数据和所述特征向量数据,并根据所述脱敏样例数据和所述特征向量数据确定应用场景,包括:
所述云平台接收所述边缘侧上发的所述脱敏样例数据和所述特征向量数据,并将所述脱敏样例数据和所述特征向量数据分别保存至场景化数据库和特征数据库;
所述云平台将所述脱敏样例数据和所述特征向量数据与场景化知识图谱进行匹配以确定所述应用场景。
4.根据权利要求1所述的基于场景化知识图谱的推荐方法,其特征在于,所述云平台根据所述应用场景确定具体场景化知识图谱及初始推荐模型,并将所述场景化知识图谱和所述初始推荐模型进行联合训练得到目标推荐模型,将所述目标推荐模型进行轻量化处理得到轻量级推荐模型,包括:
所述云平台将所述场景化知识图谱和基础推荐模型库进行匹配以确定具体场景化知识图谱和初始推荐模型;
所述云平台将所述具体场景化知识图谱和所述初始推荐模型进行联合训练得到目标推荐模型;
所述云平台对所述目标推荐模型进行剪枝、量化、网络结构优化、知识蒸馏以及模型蒸馏得到轻量级推荐模型。
5.根据权利要求4所述的基于场景化知识图谱的推荐方法,其特征在于,所述云平台将所述具体场景化知识图谱和所述初始推荐模型进行联合训练得到目标推荐模型,包括:
所述云平台获取所述具体场景化知识图谱中的各种应用场景数据,并将各种应用场景数据输入至所述初始推荐模型进行迭代训练;
若满足预设训练结束条件,则将所述初始推荐模型作为所述目标推荐模型。
6.根据权利要求1所述的基于场景化知识图谱的推荐方法,其特征在于,所述边缘侧接收所述云平台下发的所述轻量级推荐模型,并将所述行为数据输入所述轻量级推荐模型以生成推荐结果,包括:
所述边缘侧接收所述云平台下发的所述轻量级推荐模型,并将所述行为数据输入所述轻量级推荐模型以得到推荐得分;
所述边缘侧将所述推荐得分进行排序以生成推荐结果。
7.根据权利要求6所述的基于场景化知识图谱的推荐方法,其特征在于,所述方法还包括:
所述边缘侧将所述推荐结果进行展示;
若接收到重新推荐指令,则执行所述将所述行为数据输入所述轻量级推荐模型以得到推荐得分的步骤。
8.一种基于场景化知识图谱的推荐系统,其特征在于,包括:配置于边缘侧中的采集处理单元及生成单元,配置于云平台中的接收确定单元及训练处理单元,其中,
所述采集处理单元用于边缘侧采集用户的行为数据,并对所述行为数据进行处理得到脱敏样例数据和特征向量数据;
所述接收确定单元用于云平台接收所述边缘侧上发的所述脱敏样例数据和所述特征向量数据,并根据所述脱敏样例数据和所述特征向量数据确定应用场景;
所述训练处理单元用于所述云平台根据所述应用场景确定具体场景化知识图谱及初始推荐模型,并将所述场景化知识图谱和所述初始推荐模型进行联合训练得到目标推荐模型,将所述目标推荐模型进行轻量化处理得到轻量级推荐模型;
所述生成单元用于所述边缘侧接收所述云平台下发的所述轻量级推荐模型,并将所述行为数据输入所述轻量级推荐模型以生成推荐结果。
9.一种基于场景化知识图谱的推荐系统,其特征在于,包括边缘侧和云平台,所述边缘侧和云平台均包括存储器及处理器,所述存储器上存储有计算机程序,所述边缘侧和云平台的所述处理器执行所述计算机程序时实现如权利要求1-7中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序当被处理器执行时可实现如权利要求1-7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311119680.4A CN117131274A (zh) | 2023-08-31 | 2023-08-31 | 基于场景化知识图谱的推荐方法、系统及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311119680.4A CN117131274A (zh) | 2023-08-31 | 2023-08-31 | 基于场景化知识图谱的推荐方法、系统及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117131274A true CN117131274A (zh) | 2023-11-28 |
Family
ID=88852521
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311119680.4A Pending CN117131274A (zh) | 2023-08-31 | 2023-08-31 | 基于场景化知识图谱的推荐方法、系统及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117131274A (zh) |
-
2023
- 2023-08-31 CN CN202311119680.4A patent/CN117131274A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220198289A1 (en) | Recommendation model training method, selection probability prediction method, and apparatus | |
JP4947477B1 (ja) | レコメンド装置、レコメンド方法およびレコメンドプログラム | |
WO2021155691A1 (zh) | 用户画像生成方法、装置、存储介质及设备 | |
EP2778985A1 (en) | Search result ranking by department | |
US20220222688A1 (en) | Methodology of analyzing consumer intent from user interaction with digital environments | |
WO2024041483A1 (zh) | 一种推荐方法及相关装置 | |
WO2023284516A1 (zh) | 基于知识图谱的信息推荐方法、装置、设备、介质及产品 | |
WO2023050143A1 (zh) | 一种推荐模型训练方法及装置 | |
WO2020065611A1 (en) | Recommendation method and system and method and system for improving a machine learning system | |
CN114783580B (zh) | 一种医疗数据质量评估方法及系统 | |
CN111787042B (zh) | 用于推送信息的方法和装置 | |
CN113704623A (zh) | 一种数据推荐方法、装置、设备及存储介质 | |
CN116805002A (zh) | 问答方法、问答装置、设备及存储介质 | |
CN111666513A (zh) | 页面处理方法、装置、电子设备及可读存储介质 | |
WO2024012360A1 (zh) | 一种数据处理方法及相关装置 | |
CN112348615A (zh) | 用于审核信息的方法和装置 | |
CN113850653B (zh) | 一种基于卷积神经网络的产品推荐方法及相关设备 | |
CN117131274A (zh) | 基于场景化知识图谱的推荐方法、系统及存储介质 | |
CN110069691A (zh) | 用于处理点击行为数据的方法和装置 | |
KR102347187B1 (ko) | Ai 마케팅 솔루션을 위해 특정 사이트에 대한 정보를 분석하는 전자 장치 및 그 동작 방법 | |
CN115048487A (zh) | 基于人工智能的舆情分析方法、装置、计算机设备及介质 | |
US20140324524A1 (en) | Evolving a capped customer linkage model using genetic models | |
CN111930604B (zh) | 联机交易性能分析方法及装置、电子设备和可读存储介质 | |
CN114840759A (zh) | 一种推荐方法、装置及计算机可读存储介质 | |
CN113449212A (zh) | 针对搜索结果的质量评估、优化方法和装置、设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |