CN115203532A - 一种项目推荐方法、装置、电子设备及存储介质 - Google Patents
一种项目推荐方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN115203532A CN115203532A CN202210638800.0A CN202210638800A CN115203532A CN 115203532 A CN115203532 A CN 115203532A CN 202210638800 A CN202210638800 A CN 202210638800A CN 115203532 A CN115203532 A CN 115203532A
- Authority
- CN
- China
- Prior art keywords
- entity
- project
- user
- item
- investor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/06—Asset management; Financial planning or analysis
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Human Resources & Organizations (AREA)
- Operations Research (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种项目推荐方法、装置、电子设备及存储介质,属于智能推荐技术领域。该方法包括:获取投资者对应的工作机构的特征向量,将工作机构的特征向量确定为目标向量,其中,工作机构的特征向量用于表征工作机构的投资偏好信息;获取各个候选项目的特征向量,其中,对于每个候选项目,候选项目的特征向量用于表征候选项目的项目信息;基于各个候选项目的特征向量与目标向量,确定每个候选项目与投资者的匹配分数;基于各个候选项目与投资者的匹配分数,从各个候选项目中确定投资者对应的推荐项目。本发明利用投资者对应的工作机构的投资偏好信息,对投资者进行项目推荐,能够有效提高对缺少用户相关信息的投资者的项目推荐效果。
Description
技术领域
本发明涉及智能推荐技术领域,尤其涉及到一种项目推荐方法、装置、电子设备及存储介质。
背景技术
随着互联网和大数据的兴起,出现了很多投融资平台,投融资平台的推荐系统会对平台内的项目信息进行处理,从而为投资人提供项目的推荐服务。
在相关技术中,推荐系统通常根据投资人的输入内容和浏览记录等个人行为轨迹为投资人推荐项目,或者让投资人提供轮次偏好、地区偏好、行业偏好等个人偏好信息,并将这些偏好信息与平台内的项目信息进行匹配,以推荐投资人可能感兴趣的项目。
但投融资平台新认证的投资者用户往往没有个人行为记录,而且许多投资人处于各方面考虑,也不会向投融资平台提供个人偏好信息,导致推荐系统对投资人的项目推荐效果不佳。
发明内容
为了解决现有的项目推荐系统在缺少投资者用户的个人偏好信息和个人行为记录的情况下,存在对投资人的项目推荐效果不佳的缺陷,本发明提供了一种项目推荐方法、装置、电子设备及存储介质。
第一方面,为了解决上述技术问题,本发明提供了一种项目推荐方法,包括:
S1,获取投资者对应的工作机构的特征向量,将工作机构的特征向量确定为目标向量,其中,工作机构的特征向量用于表征工作机构的投资偏好信息;
S2,获取各个候选项目的特征向量,其中,对于每个候选项目,候选项目的特征向量用于表征候选项目的项目信息;
S3,基于各个候选项目的特征向量与目标向量,确定每个候选项目与投资者的匹配分数;
S4,基于各个候选项目与投资者的匹配分数,从各个候选项目中确定投资者对应的推荐项目。
本发明的有益效果是:利用投资者对应的工作机构的投资偏好信息,对投资者进行项目推荐,能够有效提高对缺少用户相关信息的投资者的项目推荐效果。
进一步,上述获取投资者对应的工作机构的特征向量,将工作机构的特征向量确定为目标向量,包括:
判断是否获取到投资者的用户相关信息,若获取到用户相关信息,则根据用户相关信息,确定投资者的特征向量,并将投资者的特征向量确定为目标向量;若没有获取到用户相关信息,则获取工作机构的特征向量,将工作机构的特征向量确定为目标向量;
其中,投资者的特征向量用于表征投资者的投资偏好信息,用户相关信息包含个人行为记录和个人偏好信息中的至少一项。
采用上述改进方案的有益效果是:利用投资者或投资者对应机构的投资偏好信息,能够对投资者实现合理的项目推荐,且用户相关信息可由投资者选择提供,能够极大地提升用户体验。
进一步,上述S1至上述S3,以及根据用户相关信息,确定投资者的特征向量是通过训练完成的项目推荐模型得到的;
其中,上述项目推荐模型是通过以下方式训练得到的:
通过预先建立的知识图谱,确定训练样本集,训练样本集中包括每个机构头实体对应的项目实体正样本和项目实体负样本、以及每个用户头实体对应的项目实体正样本和项目实体负样本;
其中,知识图谱中存储有各个机构头实体、每个机构头实体对应的项目实体、各个用户头实体以及每个用户头实体对应的项目实体,每个机构头实体对应的项目实体包括第一项目实体正样本和第一项目实体负样本,每个用户头实体对应的项目实体包括第二项目实体正样本和第二项目实体负样本;
对于训练样本集中的每个机构头实体和每个用户头实体,将机构头实体和用户头实体分别输入至初始的项目推荐模型,得到第一项目实体正样本对应的第一匹配分数、第一项目实体负样本对应的第二匹配分数、第二项目实体正样本对应的第三匹配分数、以及第二项目实体负样本对应的第四匹配分数;
基于各个机构头实体对应的第一匹配分数和各个机构头实体对应的第二匹配分数,确定机构的协同过滤损失,并基于各个用户头实体对应的第三匹配分数和各个用户头实体对应的第四匹配分数,确定用户的协同过滤损失;
基于各个机构的协同过滤损失和各个用户的协同过滤损失确定模型损失值,基于模型损失值对初始的项目推荐模型进行迭代训练,将训练结束时的初始的项目推荐模型确定为项目推荐模型。
采用上述改进方案的有益效果是:基于各个正负样本计算的协同过滤损失确定模型损失值,利用该模型损失值对模型进行迭代训练,使得训练完成的模型能够对基于用户头实体和基于机构头实体的两种推荐方式均具有较好的推荐效果。
进一步,上述知识图谱通过以下方式建立:
获取多个机构中每个机构的机构相关信息和多个用户中每个用户的用户相关信息,其中,机构相关信息包含机构的历史投资项目信息,每个机构相关信息包括第一项目标识,每个用户相关信息包括第二项目标识;
将各个机构各自确定为机构头实体,将各个用户各自确定为用户头实体;
根据各个第一项目标识和各个第二项目标识,从各个机构相关信息和各个用户相关信息中获取多个项目,将各个项目各自确定为项目头实体;
基于设置的机构头实体的对应关系、用户头实体的对应关系和项目头实体的对应关系,从机构相关信息和用户相关信息中获取机构头实体、机构头实体对应的尾实体、用户头实体、用户头实体对应的尾实体、项目头实体和项目头实体对应的尾实体,其中,对应关系用于表征头实体与尾实体之间的语义关系,机构头实体对应的尾实体用于表征机构头实体的投资偏好信息,用户头实体对应的尾实体用于表征用户头实体的投资偏好信息,项目头实体对应的尾实体用于表征项目头实体的项目信息;
基于各个机构头实体、各个用户头实体、各个项目头实体、各个尾实体和各个对应关系,建立知识图谱。
采用上述改进方案的有益效果是:利用知识图谱能够将机构相关信息和用户相关信息中的各个实体,基于设置的对应关系进行关联存储,使得模型可基于该知识图谱确定投资者或其对应工作机构对应的投资偏好信息,进而基于该偏好信息实现对各个项目的匹配分数的计算。
进一步,上述机构头实体的对应关系包含机构投资项目、机构偏好轮次、机构偏好地区和机构偏好行业标签中的至少一项,用户头实体的对应关系包含用户浏览项目记录、用户搜索行业标签记录、用户偏好轮次、用户偏好行业和用户偏好地区中的至少一项,项目头实体的对应关系包含项目投资方、项目最新轮次、项目所在地区和项目所在行业中的至少一项。
采用上述改进方案的有益效果是:利用设置的各个对应关系,能较好地提取到用于表示投资偏好信息或项目信息的实体。
进一步,上述获取投资者对应的工作机构的特征向量,将工作机构的特征向量确定为目标向量,包括:
从预先建立的知识图谱中获取工作机构对应的多个目标尾实体,其中,目标尾实体用于表征工作机构的投资偏好信息;
对目标尾实体进行特征提取,得到目标尾实体的初始嵌入向量,其中,目标尾实体的初始嵌入向量用于表征目标尾实体的语义信息;
基于注意力机制,对各个目标尾实体的初始嵌入向量进行加权求和,得到工作机构的特征向量,将工作机构的特征向量确定为目标向量。
采用上述改进方案的有益效果是:利用注意力机制对各个初始嵌入向量设置权重,使得各个初始嵌入向量对应的投资偏好信息对匹配分数计算的影响程度不同,进而提高项目的推荐效果。
进一步,上述基于各个候选项目的特征向量与目标向量,确定每个候选项目与投资者的匹配分数,包括:
对于每个候选项目,计算候选项目的特征向量与目标向量之间的内积,得到候选项目与投资者的匹配分数。
采用上述改进方案的有益效果是:利用向量的内积计算得到的匹配分数,能够较好地描述候选项目与投资者之间的匹配程度。
第二方面,本发明提供了一种项目推荐装置,包括:
获取模块,用于获取投资者对应的工作机构的特征向量,将工作机构的特征向量确定为目标向量,其中,工作机构的特征向量用于表征工作机构的投资偏好信息;
第一处理模块,用于获取各个候选项目的特征向量,其中,对于每个候选项目,候选项目的特征向量用于表征候选项目的项目信息;
第二处理模块,用于基于各个候选项目的特征向量与目标向量,确定每个候选项目与投资者的匹配分数;
推荐模块,用于基于各个候选项目与投资者的匹配分数,从各个候选项目中确定投资者对应的推荐项目。
第三方面,本发明提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当指令在终端设备上运行时,使得终端设备执行如第一方面的项目推荐方法的全部或部分步骤。
第四方面,本发明提供了一种电子设备,包括存储器、处理器及存储在存储器上并在处理器上运行的程序,处理器执行程序时实现如第一方面的项目推荐方法的全部或部分步骤。
附图说明
图1为本发明实施例提供的一种项目推荐方法的流程示意图;
图2为本发明实施例提供的一种项目推荐装置的结构示意图;
图3为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下列实施例是对本发明的进一步解释和补充,对本发明不构成任何限制。
以下结合附图描述本发明实施例的一种项目推荐方法。
参照图1所示,本发明提供了一种项目推荐方法,包括如下步骤S1至步骤S4,其中:
在步骤S1中,获取投资者对应的工作机构的特征向量,将工作机构的特征向量确定为目标向量,其中,工作机构的特征向量用于表征工作机构的投资偏好信息。
需要说明的是,上述投资者对应的工作机构可以是投资者就职的投资机构,也可以指为投资者提供投资项目的投资机构,如投资者A常通过投资机构B进行项目投资,即投资者A进行投资的项目主要由投资机构B提供,则该投资机构B为投资者A对应的工作机构。
工作机构对项目的投资偏好将影响投资者个人对项目的投资偏好。因此,基于工作机构的投资偏好信息对投资者进行项目推荐,可以解决推荐系统的冷启动的问题,从而对缺少个人行为记录的新注册用户、以及不愿意提供个人行为记录或个人偏好信息的用户,仍可以实现合理的项目推荐,从而提高项目推荐效果。
在该实施例中,机构的投资偏好信息可包括机构投资的历史项目、机构偏好投资的轮次、机构偏好投资的地区、机构偏好投资的行业等多个维度的信息,利用特征向量对该多个维度的投资偏好信息进行表示,便于后续对该投资偏好信息的进一步处理,对于机构的投资偏好信息可通过对机构所公开的过往投资记录等机构信息进行数据分析得到。
作为一种可能的实施方式,从机构信息中提取项目描述文本,该项目描述文本包含机构的历史投资项目以及该历史投资项目对应的项目信息,建立基于BERT架构的序列标注模型,从项目描述文本中提取机构的投资偏好信息。
示例性地,机构的投资偏好信息包括机构偏好投资的行业标签,利用行业标签可细化对机构偏好投资的行业的分类。如对同样偏好新能源汽车行业的两个机构,基于BERT架构的序列标注模型,对两个机构的项目描述文本分别进行行业标签的提取,可以得到汽车制造和汽车研发设计两种行业标签,这两种行业标签表示了其中一个机构更偏好对汽车制造领域的项目进行投资,而另一个机构会更偏好对汽车研发设计领域的项目进行投资,基于该行业标签匹配推荐项目,可提高项目的推荐效果。
可选的,在一个实施例中,获取投资者对应的工作机构的特征向量,将工作机构的特征向量确定为目标向量,包括:
判断是否获取到投资者的用户相关信息,若获取到用户相关信息,则根据用户相关信息,确定投资者的特征向量,并将投资者的特征向量确定为目标向量;若没有获取到用户相关信息,则获取工作机构的特征向量,将工作机构的特征向量确定为目标向量;
其中,投资者的特征向量用于表征投资者的投资偏好信息,用户相关信息包含个人行为记录和个人偏好信息中的至少一项。
在该实施例中,对于平台中完善了用户相关信息的用户,基于用户相关信息进行项目推荐,对于未完善用户相关信息的用户,如平台新注册用户,基于用户对应机构的机构相关信息进行项目推荐,从而解决了推荐方法中的冷启动问题。
可选的,在一个实施例中,获取投资者对应的工作机构的特征向量,将工作机构的特征向量确定为目标向量的实现过程包括:
从预先建立的知识图谱中获取工作机构对应的多个目标尾实体,其中,目标尾实体用于表征工作机构的投资偏好信息;
对目标尾实体进行特征提取,得到目标尾实体的初始嵌入向量,其中,目标尾实体的初始嵌入向量用于表征目标尾实体的语义信息;
基于注意力机制,对各个目标尾实体的初始嵌入向量进行加权求和,得到工作机构的特征向量,将工作机构的特征向量确定为目标向量。
可以理解的是,计算机在存储知识图谱中各节点(实体)和边(实体之间的对应关系)的时候,是用类似1、2、3这样的整数ID去存储各个节点和边,这些整数ID是离散的且缺少语义信息,因此,需要将知识图谱中存储的这些离散的整数ID映射到稠密的向量空间来表示,也即是将这些节点和边转换为包含语义信息的向量。
示例性地,对于“工作机构A的偏好城市为城市B”这一文本信息,可以抽取出语义信息“工作机构A”、语义信息“城市B”、以及语义关系“机构的偏好城市”,将该文本信息中的语义信息和语义关系存入知识图谱,可对应得到整数ID为1和3的两个节点(1为头实体,对应“工作机构A”;3为尾实体,对应“城市B”),以及整数ID为2的边(2为对应关系,对应“机构的偏好城市”),在对知识图谱中的节点和边进行数据分析时,需要将各整数ID进行向量转换以恢复语义信息。
例如,将整数ID为3的节点转换为包含“城市B”的语义信息的向量,或者,将ID为3的节点在整数ID为2的边所表示的语义空间中进行向量转换,从而将整数ID为3的节点转换为包含“偏好城市为城市B”的语义信息的向量,该包含了“城市B”等语义信息的向量即为尾实体3的嵌入向量。在实际应用时,对图谱中各节点和边的嵌入向量的可基于翻译机制求取。
在该实施例中,不同目标尾实体的初始嵌入向量表示了投资偏好信息中不同维度的信息,如各个目标尾实体中的初始嵌入向量可分别表示项目标识、轮次、地区和行业标签等。在实际应用时,投资偏好信息中不同维度的信息将对项目与投资者的匹配度产生不同程度影响。因此,通过引入注意力机制对各个投资偏好信息中不同维度的信息的重要性进行学习,通过对各个目标尾实体设置权值并进行加权和计算,以表示出现实中不同维度的信息对项目与投资者的匹配度具有不同的影响程度的特性,从而提高项目的推荐效果。
在步骤S2中,获取各个候选项目的特征向量,其中,对于每个候选项目,候选项目的特征向量用于表征候选项目的项目信息。
在该实施例中,候选项目的特征向量可用于表征候选项目的投资机构、最新轮次、所在地区和所在行业等项目信息。
在步骤S3中,基于各个候选项目的特征向量与目标向量,确定每个候选项目与投资者的匹配分数。
在该实施例中,可通过计算单个候选项目的特征向量与目标向量之间的相似度,得到该候选项目与投资者的匹配分数,匹配分数用于表示候选项目与投资者的匹配程度。
可选的,在一个实施例中,上述S1至S3的处理过程,以及根据用户相关信息,确定投资者的特征向量是通过训练完成的项目推荐模型得到的;
其中,项目推荐模型是通过以下方式训练得到的:
通过预先建立的知识图谱,确定训练样本集,训练样本集中包括每个机构头实体对应的项目实体正样本和项目实体负样本、以及每个用户头实体对应的项目实体正样本和项目实体负样本;
其中,知识图谱中存储有各个机构头实体、每个机构头实体对应的项目实体、各个用户头实体以及每个用户头实体对应的项目实体,每个机构头实体对应的项目实体包括第一项目实体正样本和第一项目实体负样本,每个用户头实体对应的项目实体包括第二项目实体正样本和第二项目实体负样本;
对于训练样本集中的每个机构头实体和每个用户头实体,将机构头实体和用户头实体分别输入至初始的项目推荐模型,得到第一项目实体正样本对应的第一匹配分数、第一项目实体负样本对应的第二匹配分数、第二项目实体正样本对应的第三匹配分数、以及第二项目实体负样本对应的第四匹配分数;
基于各个机构头实体对应的第一匹配分数和各个机构头实体对应的第二匹配分数,确定机构的协同过滤损失,并基于各个用户头实体对应的第三匹配分数和各个用户头实体对应的第四匹配分数,确定用户的协同过滤损失;
基于各个机构的协同过滤损失和各个用户的协同过滤损失确定模型损失值,基于模型损失值对初始的项目推荐模型进行迭代训练,将训练结束时的初始的项目推荐模型确定为项目推荐模型。
在该实施例中,可以将投资者不感兴趣的项目对应的项目实体标记为项目实体负样本,将投资者感兴趣的项目对应的项目实体标记为项目实体正样本。例如,对于投资者A,将其不感兴趣的项目B对应的项目实体作为项目实体负样本B1,将其感兴趣的项目C对应的项目实体作为项目实体正样本C1。
对于该投资者A对应的工作机构对应的机构头实体B,该机构头实体B对应的第一项目实体正样本为项目实体正样本C1,该机构头实体B对应的第一项目实体负样本为项目实体负样本B1。
对于投资者A对应的用户用户头实体A1,用户头实体A1对应的第二项目实体正样本和第二项目实体负样本可同样对应设置为项目实体正样本C1和项目实体负样本B1,也可基于该投资者A其它感兴趣的项目和其它不感兴趣的项目进行设置,即使机构头实体B和用户头实体A1所对应的项目实体不同。
上述对项目实体正样本和项目实体负样本的设置方式也可根据实际需要进行选择或调整,在此不作限制。
利用协同损失函数表示模型对项目实体正样本预测的匹配分数与模型对项目实体负样本预测的匹配分数之间的差异,从而通过迭代训练以使正负样本的匹配分数之间的差异增大。再基于机构和用户的协同损失函数构造模型损失值,以使训练完成的模型对基于用户的特征向量和基于机构的特征向量的两种项目推荐方式均具有较好地推荐效果。
示例性地,上述用户的协同过滤损失表示如下:
其中,LCF-U表示用户的协同过滤损失,M表示训练样本集,u表示训练样本集中的任意一个用户头实体,i表示该用户头实体对应的第二项目实体正样本,j表示该用户头实体对应的第二项目实体负样本,表示第二项目实体正样本对应的第三匹配分数,表示表示第二项目实体负样本对应的第四匹配分数,σ(·)表示激活函数。
上述机构的协同过滤损失表示如下:
其中,LCF-O表示机构的协同过滤损失,M表示训练样本集,o表示训练样本集中的任意一个机构头实体,i表示该机构头实体对应的第一项目实体正样本,j表示该机构头实体对应的第一项目实体负样本,表示第一项目实体正样本对应的第一匹配分数,表示表示第一项目实体负样本对应的第二匹配分数,σ(·)表示激活函数。
上述模型损失值表示如下:
LCF=0.65*LCF-U+0.35*LCF-O
其中,LCF-O表示模型损失值,LCF-U表示用户的协同过滤损失,LCF-O表示机构的协同过滤损失。0.65和0.35分别为用户的协同过滤损失和机构的协同过滤损失的权重,通过权重表征用户的协同过滤损失和机构的协同过滤损失的重要程度。这两个权重值也可以取其他值,0.65和0.35仅是示例。
可以理解的是,通过调整加权(权重)和中两个协同过滤损失的权重,可以使训练完成的模型对基于用户的匹配分数预测或对基于机构的匹配分数预测具有更好的预测精度。
作为一种可能的实施方式,该项目推荐模型包括嵌入层、注意力传播层和预测层,其中:
在模型的初始训练阶段,可以用TransR模型学习来对嵌入层进行初始化,即利用TransR模型对知识图谱进行学习,得到该知识图谱中的各个节点和各条边的图嵌入,将该图嵌入作为嵌入层输出的初始嵌入向量,从而生成一张头实体的整数ID与其对应的尾实体的初始嵌入向量的查找表。嵌入层可以基于该查找表对输入的头实体的整数ID输出其对应的各个尾实体的初始嵌入向量,并在迭代训练及后续的模型更新中对该查找表进行更改。
作为一种可能的实施方式,在对模型的迭代训练中,在前3次迭代中不更新嵌入层的参数,其它层的参数正常迭代更新,在3次迭代更新之后,再对模型中的所有参数进行迭代更新,以便更好地利用TransR学到的图嵌入。
注意力传播层基于注意力机制建立,用于对嵌入层输出的初始嵌入向量设置权重值并进行加权和计算。例如,对于某机构A其在图谱中的ID为0(机构头实体),其在知识图谱中具有ID为1、2和3的三个尾实体,利用嵌入层找到该机构头实体对应的三个尾实体,并输出这三个尾实体对应的包含项目为A的语义信息的初始嵌入向量、包含轮次为B的语义信息的初始嵌入向量、以及包含地区为C的语义信息的初始嵌入向量,注意力传播层对嵌入层输出的这三个初始嵌入向量设置权重值,并基于该权重值对这三个初始嵌入向量进行权重和计算,从而输出该机构头实体的特征向量。
预测层用于计算各个项目的特征向量与注意力传播层输出的头实体的特征向量之间的相似度,基于该相似度输出各个项目与投资者的匹配分数。其中,该各个项目的特征向量可使用该项目推荐模型中的嵌入层和注意力传播层计算得到,并存储在数据库中以便预测层进行获取。
作为一种可能的实施方式,在每次模型的迭代中,可将模型的参数及模型损失值输入到Adam优化器,利用Adam优化器输出的模型参数对模型进行更新,在对模型进行20次迭代更新后,得到训练完成的项目推荐模型。
可选的,在一个实施例中,知识图谱通过以下方式建立:
获取多个机构中每个机构的机构相关信息和多个用户中每个用户的用户相关信息,其中,机构相关信息包含机构的历史投资项目信息,每个机构相关信息包括第一项目标识,每个用户相关信息包括第二项目标识;
将各个机构各自确定为机构头实体,将各个用户各自确定为用户头实体;
根据各个第一项目标识和各个第二项目标识,从各个机构相关信息和各个用户相关信息中获取多个项目,将各个项目各自确定为项目头实体;
基于设置的机构头实体的对应关系、用户头实体的对应关系和项目头实体的对应关系,从机构相关信息和用户相关信息中获取机构头实体、机构头实体对应的尾实体、用户头实体、用户头实体对应的尾实体、项目头实体和项目头实体对应的尾实体,其中,对应关系用于表征头实体与尾实体之间的语义关系,机构头实体对应的尾实体用于表征机构头实体的投资偏好信息,用户头实体对应的尾实体用于表征用户头实体的投资偏好信息,项目头实体对应的尾实体用于表征项目头实体的项目信息;
基于各个机构头实体、各个用户头实体、各个项目头实体、各个尾实体和各个对应关系,建立知识图谱。
在该实施例中,对于机构相关信息和用户相关信息所包含的各个机构、用户和项目,采用通过分析上下文等方式,找到相关信息中与机构、用户和项目具有语义关系的实体。例如,对于项目A,基于项目投资方的语义关系,找到投资机构B,表示项目A的项目投资方为投资机构B,并基于<项目A(头实体),项目投资方(对应关系),投资机构B(尾实体)>的三元组形式建立知识图谱,其中,头实体、对应关系和尾实体均以整数ID的形式存储于知识图谱中。
可选的,机构头实体的对应关系包含机构投资项目、机构偏好轮次、机构偏好地区和机构偏好行业标签中的至少一项,用户头实体的对应关系包含用户浏览项目记录、用户搜索行业标签记录、用户偏好轮次、用户偏好行业和用户偏好地区中的至少一项,项目头实体的对应关系包含项目投资方、项目最新轮次、项目所在地区和项目所在行业中的至少一项。
可以理解的是,在知识图谱中,每个头实体可以具有多个对应关系,每个对应关系指向至少一个尾实体。
将机构A作为机构头实体,其具有机构投资项目的对应关系时,该机构头实体对应的尾实体为机构A的投资项目;其具有机构偏好轮次的对应关系时,该机构头实体对应的尾实体为机构A的偏好轮次;其具有机构偏好地区的对应关系时,该机构头实体对应的尾实体为机构A的偏好地区;其具有机构偏好行业标签时,该机构头实体对应的尾实体为机构A的偏好行业标签。
类似地,通过对机构头实体、用户头实体和项目头实体设置合理的对应关系,使得头实体对应的各个尾实体可以多维度的表示该头实体的特征信息,例如,通过对机构头实体设置机构投资项目、机构偏好轮次、机构偏好地区和机构偏好行业标签的对应关系,得到的该机构头实体的尾实体可以表示机构的投资偏好信息。
可选的,在一个实施例中,基于各个候选项目的特征向量与目标向量,确定每个候选项目与投资者的匹配分数,包括:
对于每个候选项目,计算候选项目的特征向量与目标向量之间的内积,得到候选项目与投资者的匹配分数。
在步骤S4中,基于各个候选项目与投资者的匹配分数,从各个候选项目中确定投资者对应的推荐项目。
在该实施例中,各个候选项目与投资者的匹配分数按照数值从高往低进行排序,选取匹配分数最高的k个候选项目作为当前投资者的推荐项目,,其中,k可根据业务需要自由设定。
上述实施例提供的项目推荐方法,利用投资者对应的工作机构的投资偏好信息,对投资者进行项目推荐,能够有效提高对缺少用户相关信息的投资者的项目推荐效果。
在上述各实施例中,虽然对步骤进行了编号,如S1、S2等,但只是本申请给出的具体实施例,本领域的技术人员可根据实际情况调整S1、S2等的执行顺序,此也在本发明的保护范围内,可以理解,在一些实施例中,可以包含如上述各实施方式中的部分或全部。
如图2所示,本发明实施例提供的一种项目推荐装置,包括:
获取模块20,用于获取投资者对应的工作机构的特征向量,将工作机构的特征向量确定为目标向量,其中,工作机构的特征向量用于表征工作机构的投资偏好信息;
第一处理模块30,用于获取各个候选项目的特征向量,其中,对于每个候选项目,候选项目的特征向量用于表征候选项目的项目信息;
第二处理模块40,用于基于各个候选项目的特征向量与目标向量,确定每个候选项目与投资者的匹配分数;
推荐模块50,用于基于各个候选项目与投资者的匹配分数,从各个候选项目中确定投资者对应的推荐项目。
可选的,获取模块20,还用于判断是否获取到投资者的用户相关信息,若获取到用户相关信息,则根据用户相关信息,确定投资者的特征向量,并将投资者的特征向量确定为目标向量;若没有获取到用户相关信息,则获取工作机构的特征向量,将工作机构的特征向量确定为目标向量;其中,投资者的特征向量用于表征投资者的投资偏好信息,用户相关信息包含个人行为记录和个人偏好信息中的至少一项。
可选的,推荐模块50,还用于通过预先建立的知识图谱,确定训练样本集,训练样本集中包括每个机构头实体对应的项目实体正样本和项目实体负样本、以及每个用户头实体对应的项目实体正样本和项目实体负样本;其中,知识图谱中存储有各个机构头实体、每个机构头实体对应的项目实体、各个用户头实体以及每个用户头实体对应的项目实体,每个机构头实体对应的项目实体包括第一项目实体正样本和第一项目实体负样本,每个用户头实体对应的项目实体包括第二项目实体正样本和第二项目实体负样本;对于训练样本集中的每个机构头实体和每个用户头实体,将机构头实体和用户头实体分别输入至初始的项目推荐模型,得到第一项目实体正样本对应的第一匹配分数、第一项目实体负样本对应的第二匹配分数、第二项目实体正样本对应的第三匹配分数、以及第二项目实体负样本对应的第四匹配分数;基于各个机构头实体对应的第一匹配分数和各个机构头实体对应的第二匹配分数,确定机构的协同过滤损失,并基于各个用户头实体对应的第三匹配分数和各个用户头实体对应的第四匹配分数,确定用户的协同过滤损失;基于各个机构的协同过滤损失和各个用户的协同过滤损失确定模型损失值,基于模型损失值对初始的项目推荐模型进行迭代训练,将训练结束时的初始的项目推荐模型确定为项目推荐模型。
可选的,推荐模块50,还用于获取多个机构中每个机构的机构相关信息和多个用户中每个用户的用户相关信息,其中,机构相关信息包含机构的历史投资项目信息,每个机构相关信息包括第一项目标识,每个用户相关信息包括第二项目标识;将各个机构各自确定为机构头实体,将各个用户各自确定为用户头实体;根据各个第一项目标识和各个第二项目标识,从各个机构相关信息和各个用户相关信息中获取多个项目,将各个项目各自确定为项目头实体;基于设置的机构头实体的对应关系、用户头实体的对应关系和项目头实体的对应关系,从机构相关信息和用户相关信息中获取机构头实体、机构头实体对应的尾实体、用户头实体、用户头实体对应的尾实体、项目头实体和项目头实体对应的尾实体,其中,对应关系用于表征头实体与尾实体之间的语义关系,机构头实体对应的尾实体用于表征机构头实体的投资偏好信息,用户头实体对应的尾实体用于表征用户头实体的投资偏好信息,项目头实体对应的尾实体用于表征项目头实体的项目信息;基于各个机构头实体、各个用户头实体、各个项目头实体、各个尾实体和各个对应关系,建立知识图谱。
可选的,获取模块20,还用于从预先建立的知识图谱中获取工作机构对应的多个目标尾实体,其中,目标尾实体用于表征工作机构的投资偏好信息;对目标尾实体进行特征提取,得到目标尾实体的初始嵌入向量,其中,目标尾实体的初始嵌入向量用于表征目标尾实体的语义信息;基于注意力机制,对各个目标尾实体的初始嵌入向量进行加权求和,得到工作机构的特征向量,将工作机构的特征向量确定为目标向量。
可选的,推荐模块50,具体用于对于每个候选项目,计算候选项目的特征向量与目标向量之间的内积,得到候选项目与投资者的匹配分数。
本发明实施例提供的一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当指令在终端设备上运行时,使得终端设备执行上述任一实施例的项目推荐方法的步骤。
如图3所示,本发明实施例提供的一种电子设备500,包括存储器510、处理器520及存储在存储器510上并在处理器520上运行的程序530,处理器520执行程序530时实现上述任一实施例的项目推荐方法的步骤。
其中,电子设备500可以选用电脑、手机等,相对应地,其程序530为电脑软件或手机App等,且上述关于本发明的一种电子设备500中的各参数和步骤,可参考上文中项目推荐方法的实施例中的各参数和步骤,在此不做赘述。
所属技术领域的技术人员知道,本发明可以实现为系统、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:可以是完全的硬件、也可以是完全的软件(包括固件、驻留软件、微代码等),还可以是硬件和软件结合的形式,本文一般称为“电路”、“模块”或“系统”。此外,在一些实施例中,本发明还可以实现为在一个或多个计算机可读介质中的计算机程序产品的形式,该计算机可读介质中包含计算机可读的程序代码。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (10)
1.一种项目推荐方法,其特征在于,包括:
S1,获取投资者对应的工作机构的特征向量,将所述工作机构的特征向量确定为目标向量,其中,所述工作机构的特征向量用于表征所述工作机构的投资偏好信息;
S2,获取各个候选项目的特征向量,其中,对于每个所述候选项目,所述候选项目的特征向量用于表征所述候选项目的项目信息;
S3,基于各个所述候选项目的特征向量与所述目标向量,确定每个所述候选项目与所述投资者的匹配分数;
S4,基于各个所述候选项目与所述投资者的匹配分数,从各个所述候选项目中确定所述投资者对应的推荐项目。
2.根据权利要求1所述的方法,其特征在于,所述获取投资者对应的工作机构的特征向量,将所述工作机构的特征向量确定为目标向量,包括:
判断是否获取到所述投资者的用户相关信息,若获取到所述用户相关信息,则根据所述用户相关信息,确定所述投资者的特征向量,并将所述投资者的特征向量确定为所述目标向量;若没有获取到所述用户相关信息,则获取所述工作机构的特征向量,将所述工作机构的特征向量确定为所述目标向量;
其中,所述投资者的特征向量用于表征投资者的投资偏好信息,所述用户相关信息包含个人行为记录和个人偏好信息中的至少一项。
3.根据权利要求2所述的方法,其特征在于,所述S1至所述S3,以及所述根据所述用户相关信息,确定所述投资者的特征向量是通过训练完成的项目推荐模型得到的;
其中,所述项目推荐模型是通过以下方式训练得到的:
通过预先建立的知识图谱,确定训练样本集,所述训练样本集中包括每个机构头实体对应的项目实体正样本和项目实体负样本、以及每个所述用户头实体对应的项目实体正样本和项目实体负样本;
其中,所述知识图谱中存储有各个所述机构头实体、每个所述机构头实体对应的项目实体、各个所述用户头实体以及每个所述用户头实体对应的项目实体,每个所述机构头实体对应的项目实体包括第一项目实体正样本和第一项目实体负样本,每个所述用户头实体对应的项目实体包括第二项目实体正样本和第二项目实体负样本;
对于所述训练样本集中的每个所述机构头实体和每个所述用户头实体,将所述机构头实体和所述用户头实体分别输入至初始的项目推荐模型,得到所述第一项目实体正样本对应的第一匹配分数、所述第一项目实体负样本对应的第二匹配分数、所述第二项目实体正样本对应的第三匹配分数、以及所述第二项目实体负样本对应的第四匹配分数;
基于各个所述机构头实体对应的第一匹配分数和各个所述机构头实体对应的第二匹配分数,确定机构的协同过滤损失,并基于各个所述用户头实体对应的第三匹配分数和各个所述用户头实体对应的第四匹配分数,确定用户的协同过滤损失;
基于各个所述机构的协同过滤损失和各个所述用户的协同过滤损失确定模型损失值,基于所述模型损失值对初始的所述项目推荐模型进行迭代训练,将训练结束时的初始的所述项目推荐模型确定为所述项目推荐模型。
4.根据权利要求3所述的方法,其特征在于,所述知识图谱通过以下方式建立:
获取多个机构中每个所述机构的机构相关信息和多个用户中每个所述用户的用户相关信息,其中,所述机构相关信息包含机构的历史投资项目信息,每个所述机构相关信息包括第一项目标识,每个所述用户相关信息包括第二项目标识;
将各个所述机构各自确定为机构头实体,将各个所述用户各自确定为用户头实体;
根据各个所述第一项目标识和各个所述第二项目标识,从各个所述机构相关信息和各个所述用户相关信息中获取多个项目,将各个所述项目各自确定为项目头实体;
基于设置的机构头实体的对应关系、用户头实体的对应关系和项目头实体的对应关系,从所述机构相关信息和所述用户相关信息中获取机构头实体、所述机构头实体对应的尾实体、用户头实体、所述用户头实体对应的尾实体、项目头实体和所述项目头实体对应的尾实体,其中,所述对应关系用于表征头实体与尾实体之间的语义关系,所述机构头实体对应的尾实体用于表征所述机构头实体的投资偏好信息,所述用户头实体对应的尾实体用于表征所述用户头实体的投资偏好信息,所述项目头实体对应的尾实体用于表征所述项目头实体的项目信息;
基于各个所述机构头实体、各个所述用户头实体、各个所述项目头实体、各个所述尾实体和各个所述对应关系,建立所述知识图谱。
5.根据权利要求4所述的方法,其特征在于,所述机构头实体的对应关系包含机构投资项目、机构偏好轮次、机构偏好地区和机构偏好行业标签中的至少一项,所述用户头实体的对应关系包含用户浏览项目记录、用户搜索行业标签记录、用户偏好轮次、用户偏好行业和用户偏好地区中的至少一项,所述项目头实体的对应关系包含项目投资方、项目最新轮次、项目所在地区和项目所在行业中的至少一项。
6.根据权利要求1所述的方法,其特征在于,所述获取投资者对应的工作机构的特征向量,将所述工作机构的特征向量确定为目标向量,包括:
从预先建立的知识图谱中获取所述工作机构对应的多个目标尾实体,其中,所述目标尾实体用于表征所述工作机构的投资偏好信息;
对所述目标尾实体进行特征提取,得到所述目标尾实体的初始嵌入向量,其中,所述目标尾实体的初始嵌入向量用于表征所述目标尾实体的语义信息;
基于注意力机制,对各个所述目标尾实体的初始嵌入向量进行加权求和,得到所述工作机构的特征向量,将所述工作机构的特征向量确定为所述目标向量。
7.根据权利要求1至6中任一项所述的方法,其特征在于,所述基于各个所述候选项目的特征向量与所述目标向量,确定每个所述候选项目与所述投资者的匹配分数,包括:
对于每个所述候选项目,计算所述候选项目的特征向量与所述目标向量之间的内积,得到所述候选项目与所述投资者的匹配分数。
8.一种项目推荐装置,其特征在于,包括:
获取模块,用于获取投资者对应的工作机构的特征向量,将所述工作机构的特征向量确定为目标向量,其中,所述工作机构的特征向量用于表征所述工作机构的投资偏好信息;
第一处理模块,用于获取各个候选项目的特征向量,其中,对于每个所述候选项目,所述候选项目的特征向量用于表征所述候选项目的项目信息;
第二处理模块,用于基于各个所述候选项目的特征向量与所述目标向量,确定每个所述候选项目与所述投资者的匹配分数;
推荐模块,用于基于各个所述候选项目与所述投资者的匹配分数,从各个所述候选项目中确定所述投资者对应的推荐项目。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行如权利要求1至7中任一项所述的项目推荐方法的步骤。
10.一种电子设备,包括存储器、处理器及存储在所述存储器上并在所述处理器上运行的程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7中任一项所述的项目推荐方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210638800.0A CN115203532A (zh) | 2022-06-07 | 2022-06-07 | 一种项目推荐方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210638800.0A CN115203532A (zh) | 2022-06-07 | 2022-06-07 | 一种项目推荐方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115203532A true CN115203532A (zh) | 2022-10-18 |
Family
ID=83577151
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210638800.0A Pending CN115203532A (zh) | 2022-06-07 | 2022-06-07 | 一种项目推荐方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115203532A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116108169A (zh) * | 2022-12-12 | 2023-05-12 | 长三角信息智能创新研究院 | 一种基于知识图谱的热线工单智能分派方法 |
-
2022
- 2022-06-07 CN CN202210638800.0A patent/CN115203532A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116108169A (zh) * | 2022-12-12 | 2023-05-12 | 长三角信息智能创新研究院 | 一种基于知识图谱的热线工单智能分派方法 |
CN116108169B (zh) * | 2022-12-12 | 2024-02-20 | 长三角信息智能创新研究院 | 一种基于知识图谱的热线工单智能分派方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111753060B (zh) | 信息检索方法、装置、设备及计算机可读存储介质 | |
CN108829822B (zh) | 媒体内容的推荐方法和装置、存储介质、电子装置 | |
CN111061946B (zh) | 场景化内容推荐方法、装置、电子设备及存储介质 | |
CN106599037B (zh) | 一种基于标签语义规范化推荐方法 | |
CN111061962A (zh) | 一种基于用户评分分析的推荐方法 | |
CN107291840B (zh) | 一种用户属性预测模型构建方法和装置 | |
CN108846097B (zh) | 用户的兴趣标签表示方法、文章推荐方法、及装置、设备 | |
CN111159485A (zh) | 尾实体链接方法、装置、服务器及存储介质 | |
CN110321437B (zh) | 一种语料数据处理方法、装置、电子设备及介质 | |
CN112256866A (zh) | 一种基于深度学习的文本细粒度情感分析方法 | |
CN111523055A (zh) | 一种基于农产品特征属性评论倾向的协同推荐方法及系统 | |
CN111460145A (zh) | 一种学习资源推荐方法、设备及存储介质 | |
CN111859967A (zh) | 实体识别方法、装置,电子设备 | |
CN117076693A (zh) | 一种数字人教师多模态大语言模型预训练学科语料库的构建方法 | |
CN115203532A (zh) | 一种项目推荐方法、装置、电子设备及存储介质 | |
CN112148994B (zh) | 信息推送效果评估方法、装置、电子设备及存储介质 | |
CN114328800A (zh) | 文本处理方法、装置、电子设备和计算机可读存储介质 | |
CN110516236B (zh) | 一种社交短文本细粒度情感采集方法 | |
CN116777692A (zh) | 基于数据分析的在线学习方法、装置、设备及存储介质 | |
CN116306923A (zh) | 一种基于知识图谱的评价权重计算方法 | |
CN116151235A (zh) | 文章生成方法、文章生成模型训练方法及相关设备 | |
CN113704422A (zh) | 一种文本推荐方法、装置、计算机设备和存储介质 | |
CN113779248A (zh) | 数据分类模型训练方法、数据处理方法及存储介质 | |
CN114328894A (zh) | 文档处理方法、装置、电子设备及介质 | |
CN113535928A (zh) | 基于注意力机制下长短期记忆网络的服务发现方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |