CN112905895A - 相似项目推荐方法、装置、设备及介质 - Google Patents

相似项目推荐方法、装置、设备及介质 Download PDF

Info

Publication number
CN112905895A
CN112905895A CN202110336543.0A CN202110336543A CN112905895A CN 112905895 A CN112905895 A CN 112905895A CN 202110336543 A CN202110336543 A CN 202110336543A CN 112905895 A CN112905895 A CN 112905895A
Authority
CN
China
Prior art keywords
space vector
analyzed
item
similarity
basic information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110336543.0A
Other languages
English (en)
Other versions
CN112905895B (zh
Inventor
沈吉明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An International Smart City Technology Co Ltd
Original Assignee
Ping An International Smart City Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An International Smart City Technology Co Ltd filed Critical Ping An International Smart City Technology Co Ltd
Priority to CN202110336543.0A priority Critical patent/CN112905895B/zh
Publication of CN112905895A publication Critical patent/CN112905895A/zh
Application granted granted Critical
Publication of CN112905895B publication Critical patent/CN112905895B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Economics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及人工智能技术领域,揭示了一种相似项目推荐方法、装置、设备及介质,其中方法包括:基于目标参考指标集合,根据待推荐的项目基本信息和目标标准项目基本信息得到待推荐的项目空间向量以及根据待分析项目基本信息集合和目标标准项目基本信息得到待分析的空间向量集合;根据待推荐的项目空间向量和待分析的空间向量集合得到平行空间向量集合和非平行空间向量集合;采用余弦相似度算法根据非平行空间向量集合和待推荐的项目空间向量得到第一待分析相似度;根据平行空间向量集合和待推荐的项目空间向量进行欧氏距离计算和数据转换得到第二待分析相似度;根据相似度得到项目推荐结果。避免了基于国标行业划分采用同类型的项目进行推荐。

Description

相似项目推荐方法、装置、设备及介质
技术领域
本申请涉及到人工智能技术领域,特别是涉及到一种相似项目推荐方法、装置、设备及介质。
背景技术
政府发改等主管部门在固定资产投资决策过程中,很大程度上取决于对同类历史项目批复信息的参照,通过对比参照相似度高的项目的属性、批复文件等获得决策依据。目前同地区的历史项目、建设中、新建中、报建中的项目的数量已经达到数万甚至数十万,并且项目一般按照项目建议书、可行性研究报告、初步设计及概算、项目调概及可研修编等分阶段申报审批,目前业内基于国标行业划分采用同类型的项目进行推荐,想从海量项目中查找到相似项目,需要查找比较长时间,而且仅通过项目类型进行筛选,导致得到的推荐结果准确度比较低的问题。
发明内容
本申请的主要目的为提供一种相似项目推荐方法、装置、设备及介质,旨在解决现有技术基于国标行业划分采用同类型的项目进行推荐,想从海量项目中查找到相似项目,存在查找比较耗时、准确度比较低的技术问题。
为了实现上述发明目的,本申请提出一种相似项目推荐方法,所述方法包括:
获取相似项目推荐请求,所述相似项目推荐请求携带有待推荐的项目基本信息;
根据所述待推荐的项目基本信息,确定目标参考指标集合和目标标准项目基本信息;
根据所述目标参考指标集合、所述待推荐的项目基本信息和所述目标标准项目基本信息进行空间向量生成,得到待推荐的项目空间向量;
获取待分析项目基本信息集合,分别根据所述目标参考指标集合、所述待分析项目基本信息集合中每个项目基本信息和所述目标标准项目基本信息进行空间向量生成,得到待分析的空间向量集合;
根据所述待推荐的项目空间向量,分别对所述待分析的空间向量集合中每个空间向量进行空间向量的平行判断,得到所述待分析的空间向量集合对应的平行空间向量集合和非平行空间向量集合;
采用余弦相似度算法,分别对所述非平行空间向量集合中每个空间向量和所述待推荐的项目空间向量进行相似度计算,得到所述非平行空间向量集合中各个空间向量各自对应的第一待分析相似度;
分别对所述平行空间向量集合中每个空间向量和所述待推荐的项目空间向量进行欧氏距离计算和数据转换,得到所述平行空间向量集合中各个空间向量各自对应的第二待分析相似度;
根据所述第一待分析相似度和所述第二待分析相似度进行相似度对比和相似项目推荐,得到项目推荐结果。
进一步的,所述根据所述目标参考指标集合、所述待推荐的项目基本信息和所述目标标准项目基本信息进行空间向量生成,得到待推荐的项目空间向量的步骤,包括:
从所述目标参考指标集合中获取一个参考指标作为第一待分析的参考指标;
根据所述第一待分析的参考指标,从所述待推荐的项目基本信息中获取数据,得到待分析的待推荐属性数据;
根据所述第一待分析的参考指标,从所述目标标准项目基本信息中获取数据,得到待分析的标准属性数据;
基于所述第一待分析的参考指标对应的判断标准,将所述待分析的待推荐属性数据和所述待分析的标准属性数据进行对比,得到第一待分析的对比结果;
重复执行所述从所述目标参考指标集合中获取一个参考指标作为第一待分析的参考指标的步骤,直至完成所述目标参考指标集合中所有参考指标的获取;
根据所有所述第一待分析的对比结果进行空间向量生成,得到所述待推荐的项目空间向量。
进一步的,所述分别根据所述目标参考指标集合、所述待分析项目基本信息集合中每个项目基本信息和所述目标标准项目基本信息进行空间向量生成,得到待分析的空间向量集合的步骤,包括:
从所述待分析项目基本信息集合中获取一个项目基本信息作为待分析的历史项目基本信息;
从所述目标参考指标集合中获取一个参考指标作为第二待分析的参考指标;
根据所述第二待分析的参考指标,从所述待分析的历史项目基本信息中获取数据,得到待分析的历史属性数据;
根据所述第二待分析的参考指标,从所述目标标准项目基本信息中获取数据,得到待处理的标准属性数据;
基于所述第二待分析的参考指标对应的判断标准,将所述待分析的历史属性数据和所述待处理的标准属性数据进行对比,得到第二待分析的对比结果;
重复执行所述从所述目标参考指标集合中获取一个参考指标作为第二待分析的参考指标的步骤,直至完成所述目标参考指标集合中所有参考指标的获取;
根据所有所述第二待分析的对比结果进行空间向量生成,得到所述待分析的历史项目基本信息对应的历史项目空间向量;
重复执行所述从所述待分析项目基本信息集合中获取一个项目基本信息作为待分析的历史项目基本信息的步骤,直至确定所述待分析项目基本信息集合中各个项目基本信息各自对应的所述历史项目空间向量;
根据所有所述历史项目空间向量,得到所述待分析的空间向量集合。
进一步的,所述根据所述待推荐的项目空间向量,分别对所述待分析的空间向量集合中每个空间向量进行空间向量的平行判断,得到所述待分析的空间向量集合对应的平行空间向量集合和非平行空间向量集合的步骤,包括:
从所述待分析的空间向量集合中获取一个空间向量作为待判断的空间向量;
基于同一个三维坐标系,将所述待推荐的项目空间向量和所述待判断的空间向量进行平行判断,得到平行判断结果;
当所述平行判断结果为平行时,将所述待判断的空间向量作为平行空间向量;
当所述平行判断结果为不平行时,将所述待判断的空间向量作为非平行空间向量;
重复执行所述从所述待分析的空间向量集合中获取一个空间向量作为待判断的空间向量的步骤,直至完成所述待分析的空间向量集合中所有空间向量的获取;
根据所有所述平行空间向量,确定所述待分析的空间向量集合对应的平行空间向量集合;
根据所有所述非平行空间向量,确定所述待分析的空间向量集合对应的非平行空间向量集合。
进一步的,所述采用余弦相似度算法,分别对所述非平行空间向量集合中每个空间向量和所述待推荐的项目空间向量进行相似度计算,得到所述非平行空间向量集合中各个空间向量各自对应的第一待分析相似度的步骤,包括:
从所述非平行空间向量集合中获取一个空间向量作为待计算的非平行空间向量;
采用余弦相似度算法,对所述待计算的非平行空间向量和所述待推荐的项目空间向量进行相似度计算,得到所述待计算的非平行空间向量对应的所述第一待分析相似度;
重复执行所述从所述非平行空间向量集合中获取一个空间向量作为待计算的非平行空间向量的步骤,直至确定所述非平行空间向量集合中各个空间向量各自对应的所述第一待分析相似度。
进一步的,所述分别对所述平行空间向量集合中每个空间向量和所述待推荐的项目空间向量进行欧氏距离计算和数据转换,得到所述平行空间向量集合中各个空间向量各自对应的第二待分析相似度的步骤,包括:
从所述平行空间向量集合中获取空间向量作为待计算的平行空间向量;
对所述待计算的平行空间向量和所述待推荐的项目空间向量进行欧氏距离计算,得到待处理的欧氏距离;
根据所述待处理的欧氏距离进行数据转换,得到所述待计算的平行空间向量对应的所述第二待分析相似度;
重复执行所述从所述平行空间向量集合中获取空间向量作为待计算的平行空间向量的步骤,直至确定所述平行空间向量集合中各个空间向量各自对应的所述第二待分析相似度;
其中,所述待计算的平行空间向量对应的所述第二待分析相似度的计算公式WML为:
Figure BDA0002997921040000051
dML为所述待处理的欧氏距离。
进一步的,所述根据所述第一待分析相似度和所述第二待分析相似度进行相似度对比和相似项目推荐,得到项目推荐结果的步骤,包括:
获取相似度阈值;
从所有所述第一待分析相似度和所有所述第二待分析相似度中查找大于所述相似度阈值的待分析相似度,得到相似度查找结果;
当所述相似度查找结果为找出至少一个所述待分析相似度大于所述相似度阈值时,根据大于所述相似度阈值的所有所述待分析相似度确定所述项目推荐结果;
当所述相似度查找结果为找不到一个所述待分析相似度大于所述相似度阈值时,获取参考指标调整规则,基于所述参考指标调整规则,根据所述待推荐的项目基本信息,确定所述目标参考指标集合和所述目标标准项目基本信息,重复执行所述根据所述目标参考指标集合、所述待推荐的项目基本信息和所述目标标准项目基本信息进行空间向量生成,得到待推荐的项目空间向量的步骤,直至所述相似度查找结果为找出至少一个所述待分析相似度大于所述相似度阈值。
本申请还提出了一种相似项目推荐装置,所述装置包括:
请求获取模块,用于获取相似项目推荐请求,所述相似项目推荐请求携带有待推荐的项目基本信息;
参考指标和标准项目基本信息确定模块,用于根据所述待推荐的项目基本信息,确定目标参考指标集合和目标标准项目基本信息;
待推荐的项目空间向量确定模块,用于根据所述目标参考指标集合、所述待推荐的项目基本信息和所述目标标准项目基本信息进行空间向量生成,得到待推荐的项目空间向量;
待分析的空间向量集合确定模块,用于获取待分析项目基本信息集合,分别根据所述目标参考指标集合、所述待分析项目基本信息集合中每个项目基本信息和所述目标标准项目基本信息进行空间向量生成,得到待分析的空间向量集合;
空间向量的平行判断模块,用于根据所述待推荐的项目空间向量,分别对所述待分析的空间向量集合中每个空间向量进行空间向量的平行判断,得到所述待分析的空间向量集合对应的平行空间向量集合和非平行空间向量集合;
第一相似度计算模块,用于采用余弦相似度算法,分别对所述非平行空间向量集合中每个空间向量和所述待推荐的项目空间向量进行相似度计算,得到所述非平行空间向量集合中各个空间向量各自对应的第一待分析相似度;
第二相似度计算模块,用于分别对所述平行空间向量集合中每个空间向量和所述待推荐的项目空间向量进行欧氏距离计算和数据转换,得到所述平行空间向量集合中各个空间向量各自对应的第二待分析相似度;
相似项目推荐模块,用于根据所述第一待分析相似度和所述第二待分析相似度进行相似度对比和相似项目推荐,得到项目推荐结果。
本申请还提出了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
本申请还提出了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任一项的方法的步骤。
本申请的相似项目推荐方法、装置、设备及介质,通过首先基于目标参考指标集合,根据目标参考指标集合、待推荐的项目基本信息和目标标准项目基本信息进行空间向量生成,得到待推荐的项目空间向量,基于目标参考指标集合,分别根据目标参考指标集合、待分析项目基本信息集合中每个项目基本信息和目标标准项目基本信息进行空间向量生成,得到待分析的空间向量集合,其次根据待推荐的项目空间向量,分别对待分析的空间向量集合中每个空间向量进行空间向量的平行判断,得到待分析的空间向量集合对应的平行空间向量集合和非平行空间向量集合,然后采用余弦相似度算法,分别对非平行空间向量集合中每个空间向量和待推荐的项目空间向量进行相似度计算,得到非平行空间向量集合中各个空间向量各自对应的第一待分析相似度,分别对平行空间向量集合中每个空间向量和待推荐的项目空间向量进行欧氏距离计算和数据转换,得到平行空间向量集合中各个空间向量各自对应的第二待分析相似度,最后根据第一待分析相似度和第二待分析相似度进行相似度对比和相似项目推荐,得到项目推荐结果,从而避免了基于国标行业划分采用同类型的项目进行推荐,通过采用多个参考指标进行多维度相似度评估,提高了相似项目推荐的准确性;而且通过先判断平行再采用不同的方法计算相似度,从而避免了采用余弦相似度算法在平行的空间向量计算相似度的缺陷,进一步提高了相似项目推荐的准确性。
附图说明
图1为本申请一实施例的相似项目推荐方法的流程示意图;
图2为本申请一实施例的相似项目推荐装置的结构示意框图;
图3为本申请一实施例的计算机设备的结构示意框图。
本申请目的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
为了解决现有技术基于国标行业划分采用同类型的项目进行推荐,想从海量项目中查找到相似项目,存在查找比较耗时、准确度比较低的技术问题,本申请提出了一种相似项目推荐方法,所述方法应用于人工智能技术领域。所述相似项目推荐方法通过先将待推荐的项目基本信息与标准项目基本信息进行对比和空间向量生成得到待推荐的项目空间向量,将每个待查找的项目基本信息与标准项目基本信息进行对比和空间向量生成得到待分析的空间向量集合,其次判断待分析的空间向量集合与待推荐的项目空间向量是否平行,不平行时采用余弦相似度算法确定相似度,平行时采用欧氏距离计算和数据转换确定相似度,根据确定的相似度进行相似项目推荐,从而避免了基于国标行业划分采用同类型的项目进行推荐,通过采用多个参考指标进行多维度相似度评估,提高了相似项目推荐的准确性;而且通过先判断平行再采用不同的方法计算相似度,从而避免了采用余弦相似度算法在平行的空间向量计算相似度的缺陷,进一步提高了相似项目推荐的准确性。
参照图1,本申请实施例中提供一种相似项目推荐方法,所述方法包括:
S1:获取相似项目推荐请求,所述相似项目推荐请求携带有待推荐的项目基本信息;
S2:根据所述待推荐的项目基本信息,确定目标参考指标集合和目标标准项目基本信息;
S3:根据所述目标参考指标集合、所述待推荐的项目基本信息和所述目标标准项目基本信息进行空间向量生成,得到待推荐的项目空间向量;
S4:获取待分析项目基本信息集合,分别根据所述目标参考指标集合、所述待分析项目基本信息集合中每个项目基本信息和所述目标标准项目基本信息进行空间向量生成,得到待分析的空间向量集合;
S5:根据所述待推荐的项目空间向量,分别对所述待分析的空间向量集合中每个空间向量进行空间向量的平行判断,得到所述待分析的空间向量集合对应的平行空间向量集合和非平行空间向量集合;
S6:采用余弦相似度算法,分别对所述非平行空间向量集合中每个空间向量和所述待推荐的项目空间向量进行相似度计算,得到所述非平行空间向量集合中各个空间向量各自对应的第一待分析相似度;
S7:分别对所述平行空间向量集合中每个空间向量和所述待推荐的项目空间向量进行欧氏距离计算和数据转换,得到所述平行空间向量集合中各个空间向量各自对应的第二待分析相似度;
S8:根据所述第一待分析相似度和所述第二待分析相似度进行相似度对比和相似项目推荐,得到项目推荐结果。
本实施例通过首先基于目标参考指标集合,根据目标参考指标集合、待推荐的项目基本信息和目标标准项目基本信息进行空间向量生成,得到待推荐的项目空间向量,基于目标参考指标集合,分别根据目标参考指标集合、待分析项目基本信息集合中每个项目基本信息和目标标准项目基本信息进行空间向量生成,得到待分析的空间向量集合,其次根据待推荐的项目空间向量,分别对待分析的空间向量集合中每个空间向量进行空间向量的平行判断,得到待分析的空间向量集合对应的平行空间向量集合和非平行空间向量集合,然后采用余弦相似度算法,分别对非平行空间向量集合中每个空间向量和待推荐的项目空间向量进行相似度计算,得到非平行空间向量集合中各个空间向量各自对应的第一待分析相似度,分别对平行空间向量集合中每个空间向量和待推荐的项目空间向量进行欧氏距离计算和数据转换,得到平行空间向量集合中各个空间向量各自对应的第二待分析相似度,最后根据第一待分析相似度和第二待分析相似度进行相似度对比和相似项目推荐,得到项目推荐结果,从而避免了基于国标行业划分采用同类型的项目进行推荐,通过采用多个参考指标进行多维度相似度评估,提高了相似项目推荐的准确性;而且通过先判断平行再采用不同的方法计算相似度,从而避免了采用余弦相似度算法在平行的空间向量计算相似度的缺陷,进一步提高了相似项目推荐的准确性。
对于S1,可以获取用户输入的相似项目推荐请求,也可以是第三方应用系统发送的相似项目推荐请求。
相似项目推荐请求,也就是进行相似项目推荐的请求。
待推荐的项目基本信息,是相似项目推荐请求需要推荐相似项目的项目基本信息。待推荐的项目基本信息包括但不限于:申报年份、行业类型、项目类型、单位造价、项目阶段。
对于S2,将所述待推荐的项目基本信息在参考指标集合库中进行查找,将在参考指标集合库中查找到的参考指标集合作为目标参考指标集合,将在参考指标集合库中查找到的标准项目基本信息作为目标标准项目基本信息。
目标标准项目基本信息包括但不限于:申报年份、行业类型、项目类型、单位造价、项目阶段。
目标参考指标集合中包括:参考指标、判断标准。比如,目标参考指标集合包括:申报年份、行业类型、项目类型、单位造价、项目阶段总共5个参考指标,参考指标申报年份对应的判断标准是时间间隔小于2年,参考指标行业类型对应的判断标准是相同,参考指标项目类型对应的判断标准是相同,参考指标单位造价对应的判断标准是波动范围小于20%,参考指标项目阶段对应的判断标准是相同,在此举例不做具体限定。
对于S3,分别针对所述目标参考指标集合中每个参考指标,将所述待推荐的项目基本信息和所述目标标准项目基本信息进行对比,得到所述目标参考指标集合中各个参考指标各自对应的对比结果;根据所述目标参考指标集合中各个参考指标各自对应的对比结果进行空间向量生成,将生成的空间向量作为所述待推荐的项目基本信息对应的待推荐的项目空间向量。
对于S4,可以从数据库中获取待分析项目基本信息集合,可以获取用户输入的待分析项目基本信息集合,还可以是第三方应用系统发送的待分析项目基本信息集合。其中,待分析项目基本信息集合,也就是历史项目基本信息的集合。需要从历史项目基本信息集合中查找待推荐的项目基本信息的相似项目,作为待推荐的项目基本信息的对比参照。
其中,分别针对所述目标参考指标集合中每个参考指标,分别针对所述待分析项目基本信息集合中每个项目基本信息和所述目标标准项目基本信息进行对比,得到所述待分析项目基本信息集合中各个项目基本信息各自对应的各个参考指标各自对应的对比结果;将所述待分析项目基本信息集合中同一个项目基本信息对应的所有参考指标各自对应的对比结果进行空间向量生成,将生成的每个空间向量作为一个待分析的空间向量,将所有待分析的空间向量作为待分析的空间向量集合。也就是说,所述待分析项目基本信息集合中每个项目基本信息对应一个待分析的空间向量。
对于S5,在同一个三维坐标系下,分别判断所述待分析的空间向量集合中每个空间向量与所述待推荐的项目空间向量是否平行,将所述待分析的空间向量集合中的所有与所述待推荐的项目空间向量平行的空间向量作为所述待分析的空间向量集合对应的平行空间向量集合,将所述待分析的空间向量集合中的所有与所述待推荐的项目空间向量非平行的空间向量作为所述待分析的空间向量集合对应的非平行空间向量集合。也就是说,平行空间向量集合和非平行空间向量集合中的空间向量都来自所述待分析的空间向量集合。
对于S6,采用余弦相似度算法,分别对所述非平行空间向量集合中每个空间向量和所述待推荐的项目空间向量进行相似度计算,将计算得到的每个结果作为一个第一待分析相似度。
对于S7,分别对所述平行空间向量集合中每个空间向量和所述待推荐的项目空间向量进行欧氏距离计算,得到所述平行空间向量集合中各个空间向量各自对应的待处理的欧氏距离;对每个所述待处理的欧氏距离进行数据转换,得到所述平行空间向量集合中各个空间向量各自对应的所述第二待分析相似度。从而避免了采用余弦相似度算法在平行的空间向量计算相似度的缺陷,进一步提高了相似项目推荐的准确性。
对于S8,获取相似度阈值;将所有所述第一待分析相似度和所有所述第二待分析相似度作为一个相似度集合;从相似度集合中找出大于相似度阈值的相似度,将找出的所有相似度各自对应的项目基本信息(也就是待分析项目基本信息集合中的项目基本信息)作为项目推荐结果。也就是说,项目推荐结果中可以包括待分析项目基本信息集合中的0个项目基本信息,也可以包括待分析项目基本信息集合中的1个项目基本信息,还可以包括待分析项目基本信息集合中的多个项目基本信息。
可以从数据库中获取相似度阈值,可以获取用户输入的相似度阈值,还可以是第三方应用系统发送的相似度阈值,还可以将相似度阈值写入实现本申请的程序文件中。其中,相似度阈值是个具体数值。
项目推荐结果也就是从待分析项目基本信息集合中找出的与所述待推荐的项目基本信息相似的项目的项目基本信息。
在一个实施例中,上述根据所述目标参考指标集合、所述待推荐的项目基本信息和所述目标标准项目基本信息进行空间向量生成,得到待推荐的项目空间向量的步骤,包括:
S31:从所述目标参考指标集合中获取一个参考指标作为第一待分析的参考指标;
S32:根据所述第一待分析的参考指标,从所述待推荐的项目基本信息中获取数据,得到待分析的待推荐属性数据;
S33:根据所述第一待分析的参考指标,从所述目标标准项目基本信息中获取数据,得到待分析的标准属性数据;
S34:基于所述第一待分析的参考指标对应的判断标准,将所述待分析的待推荐属性数据和所述待分析的标准属性数据进行对比,得到第一待分析的对比结果;
S35:重复执行所述从所述目标参考指标集合中获取一个参考指标作为第一待分析的参考指标的步骤,直至完成所述目标参考指标集合中所有参考指标的获取;
S36:根据所有所述第一待分析的对比结果进行空间向量生成,得到所述待推荐的项目空间向量。
本实施例实现了根据所述目标参考指标集合、所述待推荐的项目基本信息和所述目标标准项目基本信息进行空间向量生成,通过目标参考指标集合和目标标准项目基本信息有利于统一对比的标准,从而有利于提高相似项目推荐的准确性。
对于S31,依次从所述目标参考指标集合中获取一个参考指标,将获取的参考指标作为第一待分析的参考指标。
对于S32,将所述第一待分析的参考指标在所述待推荐的项目基本信息中查找,将查找到的参考指标对应的值作为待分析的待推荐属性数据。
对于S33,将所述第一待分析的参考指标在所述目标标准项目基本信息中查找,将查找到的参考指标对应的值作为待分析的标准属性数据。
对于S34,基于所述第一待分析的参考指标对应的判断标准,将所述待分析的待推荐属性数据和所述待分析的标准属性数据进行对比,将对比结果作为第一待分析的对比结果。
比如,第一待分析的参考指标是单位造价,单位造价对应的判断标准是波动范围小于20%,将100%减去20%得到参考比例的下限(也就是80%),将100%加上20%得到参考比例的上限(也就是120%),将所述待分析的待推荐属性数据除以所述待分析的标准属性数据进行相除,得到实际比例,当实际比例小于参考比例的上限(也就是120%)并且大于参考比例的下限(也就是80%)时确定第一待分析的对比结果为1,当实际比例大于或等于参考比例的上限(也就是120%),或者,小于或等于参考比例的下限(也就是80%)时确定第一待分析的对比结果为0,在此举例不做具体限定。
又比如,第一待分析的参考指标是行业类型,行业类型对应的判断标准是相同,当所述待分析的待推荐属性数据和所述待分析的标准属性数据相同时确定第一待分析的对比结果为1,当所述待分析的待推荐属性数据和所述待分析的标准属性数据不相同时确定第一待分析的对比结果为0,在此举例不做具体限定。
对于S35,重复执行步骤S31至步骤S35,直至完成所述目标参考指标集合中所有参考指标的获取。
对于S36,获取预设参考指标排列顺序,基于所述预设参考指标排列顺序,根据所有所述第一待分析的对比结果进行空间向量生成,得到所述待推荐的项目空间向量。
可以从数据库中获取预设参考指标排列顺序,可以获取用户输入的预设参考指标排列顺序,还可以是第三方应用系统发送的预设参考指标排列顺序,还可以将预设参考指标排列顺序写入实现本申请的程序文件中。
比如,申报年份、行业类型、项目类型、单位造价、项目阶段对应的第一待分析的对比结果分别为1、0、1、0、0,预设参考指标排列顺序为申报年份、行业类型、项目类型、单位造价、项目阶段,则基于所述预设参考指标排列顺序,根据所有所述第一待分析的对比结果进行空间向量生成得到[1 0 10 0],也就是说,待推荐的项目空间向量为[1 0 1 0 0],在此举例不做具体限定。
在一个实施例中,上述分别根据所述目标参考指标集合、所述待分析项目基本信息集合中每个项目基本信息和所述目标标准项目基本信息进行空间向量生成,得到待分析的空间向量集合的步骤,包括:
S41:从所述待分析项目基本信息集合中获取一个项目基本信息作为待分析的历史项目基本信息;
S42:从所述目标参考指标集合中获取一个参考指标作为第二待分析的参考指标;
S43:根据所述第二待分析的参考指标,从所述待分析的历史项目基本信息中获取数据,得到待分析的历史属性数据;
S44:根据所述第二待分析的参考指标,从所述目标标准项目基本信息中获取数据,得到待处理的标准属性数据;
S45:基于所述第二待分析的参考指标对应的判断标准,将所述待分析的历史属性数据和所述待处理的标准属性数据进行对比,得到第二待分析的对比结果;
S46:重复执行所述从所述目标参考指标集合中获取一个参考指标作为第二待分析的参考指标的步骤,直至完成所述目标参考指标集合中所有参考指标的获取;
S47:根据所有所述第二待分析的对比结果进行空间向量生成,得到所述待分析的历史项目基本信息对应的历史项目空间向量;
S48:重复执行所述从所述待分析项目基本信息集合中获取一个项目基本信息作为待分析的历史项目基本信息的步骤,直至确定所述待分析项目基本信息集合中各个项目基本信息各自对应的所述历史项目空间向量;
S49:根据所有所述历史项目空间向量,得到所述待分析的空间向量集合。
本实施例分别根据所述目标参考指标集合、所述待分析项目基本信息集合中每个项目基本信息和所述目标标准项目基本信息进行空间向量生成,通过目标参考指标集合和目标标准项目基本信息有利于统一对比的标准,从而有利于提高相似项目推荐的准确性。
对于S41,依次从所述待分析项目基本信息集合中获取一个项目基本信息,将获取的项目基本信息作为待分析的历史项目基本信息。
对于S42,依次从所述目标参考指标集合中获取一个参考指标,将获取的参考指标作为第二待分析的参考指标。
对于S43,将所述第二待分析的参考指标在所述待分析的历史项目基本信息中查找,将查找到的参考指标对应的值作为待分析的历史属性数据。
对于S44,将所述第二待分析的参考指标在所述目标标准项目基本信息中查找,将查找到的参考指标对应的值作为待处理的标准属性数据。
对于S45,基于所述第二待分析的参考指标对应的判断标准,将所述待分析的历史属性数据和所述待处理的标准属性数据进行对比,将对比结果作为第二待分析的对比结果。
对于S46,重复执行步骤对于S42至步骤S46,直至完成所述目标参考指标集合中所有参考指标的获取。
对于S47,获取预设参考指标排列顺序,基于所述预设参考指标排列顺序,根据所有所述第二待分析的对比结果进行空间向量生成,将生成的空间向量作为所述待分析的历史项目基本信息对应的历史项目空间向量。
对于S48,重复执行步骤对于S41至步骤S48,直至确定所述待分析项目基本信息集合中各个项目基本信息各自对应的所述历史项目空间向量。
对于S49,将所有所述历史项目空间向量作为所述待分析的空间向量集合。
在一个实施例中,上述根据所述待推荐的项目空间向量,分别对所述待分析的空间向量集合中每个空间向量进行空间向量的平行判断,得到所述待分析的空间向量集合对应的平行空间向量集合和非平行空间向量集合的步骤,包括:
S51:从所述待分析的空间向量集合中获取一个空间向量作为待判断的空间向量;
S52:基于同一个三维坐标系,将所述待推荐的项目空间向量和所述待判断的空间向量进行平行判断,得到平行判断结果;
S53:当所述平行判断结果为平行时,将所述待判断的空间向量作为平行空间向量;
S54:当所述平行判断结果为不平行时,将所述待判断的空间向量作为非平行空间向量;
S55:重复执行所述从所述待分析的空间向量集合中获取一个空间向量作为待判断的空间向量的步骤,直至完成所述待分析的空间向量集合中所有空间向量的获取;
S56:根据所有所述平行空间向量,确定所述待分析的空间向量集合对应的平行空间向量集合;
S57:根据所有所述非平行空间向量,确定所述待分析的空间向量集合对应的非平行空间向量集合。
本实施例实现了根据空间向量的平行判断,将所述待分析的空间向量集合中的空间向量划分为平行空间向量集合和非平行空间向量集合,为后续针对平行空间向量集合和非平行空间向量集合采用不同的相似度计算方法提供了基础。
对于S51,依次从所述待分析的空间向量集合中获取一个空间向量,将获取的空间向量作为待判断的空间向量。
对于S52,在同一个三维坐标系下,将所述待推荐的项目空间向量和所述待判断的空间向量进行平行判断,当所述待推荐的项目空间向量和所述待判断的空间向量平行时确定平行判断结果为平行,当所述待推荐的项目空间向量和所述待判断的空间向量不平行时确定平行判断结果为不平行。
对于S55,重复执行步骤S51至步骤S55,直至完成所述待分析的空间向量集合中所有空间向量的获取。
对于S56,将所有所述平行空间向量作为所述待分析的空间向量集合对应的平行空间向量集合。
对于S57,将所有所述非平行空间向量作为所述待分析的空间向量集合对应的非平行空间向量集合。
在一个实施例中,上述采用余弦相似度算法,分别对所述非平行空间向量集合中每个空间向量和所述待推荐的项目空间向量进行相似度计算,得到所述非平行空间向量集合中各个空间向量各自对应的第一待分析相似度的步骤,包括:
S61:从所述非平行空间向量集合中获取一个空间向量作为待计算的非平行空间向量;
S62:采用余弦相似度算法,对所述待计算的非平行空间向量和所述待推荐的项目空间向量进行相似度计算,得到所述待计算的非平行空间向量对应的所述第一待分析相似度;
S63:重复执行所述从所述非平行空间向量集合中获取一个空间向量作为待计算的非平行空间向量的步骤,直至确定所述非平行空间向量集合中各个空间向量各自对应的所述第一待分析相似度。
本实施例采用余弦相似度算法,分别对所述非平行空间向量集合中每个空间向量和所述待推荐的项目空间向量进行相似度计算,从而实现了空间向量的相似度对比。
对于S61,依次从所述非平行空间向量集合中获取一个空间向量,将获取的空间向量作为待计算的非平行空间向量。
对于S62,采用余弦相似度算法,对所述待计算的非平行空间向量和所述待推荐的项目空间向量进行相似度计算,将计算得到的余弦相似度作为所述待计算的非平行空间向量对应的所述第一待分析相似度。
所述待计算的非平行空间向量对应的所述第一待分析相似度的计算公式WMN如下:
Figure BDA0002997921040000171
其中,M为所述待推荐的项目空间向量,N为所述待计算的非平行空间向量,k为所述目标参考指标集合中参考指标的数量。
比如,所述待推荐的项目空间向量为[1 0 1 1 0],所述待计算的非平行空间向量为[0 0 1 1 0],则第一待分析相似度的计算结果为
Figure BDA0002997921040000172
在此举例不做具体限定。
对于S63,重复执行步骤S61至步骤S63,直至确定所述非平行空间向量集合中各个空间向量各自对应的所述第一待分析相似度。
在一个实施例中,上述分别对所述平行空间向量集合中每个空间向量和所述待推荐的项目空间向量进行欧氏距离计算和数据转换,得到所述平行空间向量集合中各个空间向量各自对应的第二待分析相似度的步骤,包括:
S71:从所述平行空间向量集合中获取空间向量作为待计算的平行空间向量;
S72:对所述待计算的平行空间向量和所述待推荐的项目空间向量进行欧氏距离计算,得到待处理的欧氏距离;
S73:根据所述待处理的欧氏距离进行数据转换,得到所述待计算的平行空间向量对应的所述第二待分析相似度;
S74:重复执行所述从所述平行空间向量集合中获取空间向量作为待计算的平行空间向量的步骤,直至确定所述平行空间向量集合中各个空间向量各自对应的所述第二待分析相似度;
其中,所述待计算的平行空间向量对应的所述第二待分析相似度的计算公式WML为:
Figure BDA0002997921040000173
dML为所述待处理的欧氏距离。
本实施例分别对所述平行空间向量集合中每个空间向量和所述待推荐的项目空间向量进行欧氏距离计算和数据转换,从而避免了采用余弦相似度算法在平行的空间向量计算相似度的缺陷,进一步提高了相似项目推荐的准确性。
对于S71,依次从所述平行空间向量集合中获取空间向量,将获取的空间向量作为待计算的平行空间向量。
对于S72,对所述待计算的平行空间向量和所述待推荐的项目空间向量进行欧氏距离计算,将计算得到的欧氏距离作为待处理的欧氏距离。
所述待处理的欧氏距离的计算公式dML为:
Figure BDA0002997921040000181
其中,M为所述待推荐的项目空间向量,N为所述待计算的平行空间向量,k为所述目标参考指标集合中参考指标的数量。
比如:所述待推荐的项目空间向量为[1 0 1 1 0],所述待计算的平行空间向量为[0 1 1 1 0],则所述待处理的欧氏距离的计算公式dML为:
Figure BDA0002997921040000182
对于S73,对所述待处理的欧氏距离进行数据转换,将转换得到的数据作为所述待计算的平行空间向量对应的所述第一待分析相似度。
对于S74,重复执行步骤S71至步骤S74,直至确定所述平行空间向量集合中各个空间向量各自对应的所述第一待分析相似度。
在一个实施例中,上述根据所述第一待分析相似度和所述第二待分析相似度进行相似度对比和相似项目推荐,得到项目推荐结果的步骤,包括:
S81:获取相似度阈值;
S82:从所有所述第一待分析相似度和所有所述第二待分析相似度中查找大于所述相似度阈值的待分析相似度,得到相似度查找结果;
S83:当所述相似度查找结果为找出至少一个所述待分析相似度大于所述相似度阈值时,根据大于所述相似度阈值的所有所述待分析相似度确定所述项目推荐结果;
S84:当所述相似度查找结果为找不到一个所述待分析相似度大于所述相似度阈值时,获取参考指标调整规则,基于所述参考指标调整规则,根据所述待推荐的项目基本信息,确定所述目标参考指标集合和所述目标标准项目基本信息,重复执行所述根据所述目标参考指标集合、所述待推荐的项目基本信息和所述目标标准项目基本信息进行空间向量生成,得到待推荐的项目空间向量的步骤,直至所述相似度查找结果为找出至少一个所述待分析相似度大于所述相似度阈值。
本实施例实现了在找到至少一个所述待分析相似度大于所述相似度阈值时根据大于所述相似度阈值的所有所述待分析相似度确定所述项目推荐结果,在找不到一个所述待分析相似度大于所述相似度阈值时获取参考指标调整规则,根据参考指标调整规则重新进行相似项目查找,从而实现了自动化进行迭代,提高了相似项目的推荐效率。
对于S83,当所述相似度查找结果为找出至少一个所述待分析相似度大于所述相似度阈值时,意味着有所述待分析相似度满足要求,此时可以将大于所述相似度阈值的所有所述待分析相似度各自对应的项目基本信息(也就是待分析项目基本信息集合中的项目基本信息)作为项目推荐结果。
可选的,所述当所述相似度查找结果为找出至少一个所述待分析相似度大于所述相似度阈值时,根据大于所述相似度阈值的所有所述待分析相似度确定所述项目推荐结果的步骤,包括:
当所述相似度查找结果为找出至少一个所述待分析相似度大于所述相似度阈值时,根据大于所述相似度阈值的所有所述待分析相似度,确定待判断的相似项目集合;获取预设相似项目数量;当所述待判断的相似项目集合中项目的数量小于或等于所述预设相似项目数量时,将所述待判断的相似项目集合作为所述项目推荐结果;当所述待判断的相似项目集合中项目的数量大于所述预设相似项目数量时,获取参考指标去噪规则,基于所述参考指标去噪规则,根据所述待推荐的项目基本信息,确定目标参考指标集合和目标标准项目基本信息,将所述待判断的相似项目集合作为所述待分析项目基本信息集合,重复执行所述根据所述目标参考指标集合、所述待推荐的项目基本信息和所述目标标准项目基本信息进行空间向量生成,得到待推荐的项目空间向量的步骤,直至所述待判断的相似项目集合中项目的数量小于或等于所述预设相似项目数量。从而实现了在找出的符合要求的相似项目大于所述预设相似项目数量时,再根据参考指标去噪规则进行去噪,有利于进一步提高确定的项目推荐结果的准确度。
参考指标去噪规则包括但不限于:参考指标单位造价对应的判断标准从波动范围小于20%调整为波动范围小于15%。
所述根据大于所述相似度阈值的所有所述待分析相似度,确定待判断的相似项目集合的步骤,也就是,将大于所述相似度阈值的所有所述待分析相似度各自对应的项目基本信息(也就是待分析项目基本信息集合中的项目基本信息)作为待判断的相似项目集合。
对于S84,当所述相似度查找结果为找不到一个所述待分析相似度大于所述相似度阈值时,意味着没有所述待分析相似度满足要求,此时可以获取参考指标调整规则,基于所述参考指标调整规则,根据所述待推荐的项目基本信息,重新确定所述目标参考指标集合和所述目标标准项目基本信息,然后重复执行步骤S3至步骤S84,直至所述相似度查找结果为找出至少一个所述待分析相似度大于所述相似度阈值。
其中,可以从数据库中获取参考指标调整规则,可以获取用户输入的参考指标调整规则,还可以是第三方应用系统发送的参考指标调整规则,还可以将参考指标调整规则写入实现本申请的程序文件中。
参考指标调整规则包括但不限于:减少参考指标、调整参考指标的判断标准。
参照图2,本申请还提出了一种相似项目推荐装置,所述装置包括:
请求获取模块100,用于获取相似项目推荐请求,所述相似项目推荐请求携带有待推荐的项目基本信息;
参考指标和标准项目基本信息确定模块200,用于根据所述待推荐的项目基本信息,确定目标参考指标集合和目标标准项目基本信息;
待推荐的项目空间向量确定模块300,用于根据所述目标参考指标集合、所述待推荐的项目基本信息和所述目标标准项目基本信息进行空间向量生成,得到待推荐的项目空间向量;
待分析的空间向量集合确定模块400,用于获取待分析项目基本信息集合,分别根据所述目标参考指标集合、所述待分析项目基本信息集合中每个项目基本信息和所述目标标准项目基本信息进行空间向量生成,得到待分析的空间向量集合;
空间向量的平行判断模块500,用于根据所述待推荐的项目空间向量,分别对所述待分析的空间向量集合中每个空间向量进行空间向量的平行判断,得到所述待分析的空间向量集合对应的平行空间向量集合和非平行空间向量集合;
第一相似度计算模块600,用于采用余弦相似度算法,分别对所述非平行空间向量集合中每个空间向量和所述待推荐的项目空间向量进行相似度计算,得到所述非平行空间向量集合中各个空间向量各自对应的第一待分析相似度;
第二相似度计算模块700,用于分别对所述平行空间向量集合中每个空间向量和所述待推荐的项目空间向量进行欧氏距离计算和数据转换,得到所述平行空间向量集合中各个空间向量各自对应的第二待分析相似度;
相似项目推荐模块800,用于根据所述第一待分析相似度和所述第二待分析相似度进行相似度对比和相似项目推荐,得到项目推荐结果。
本实施例通过首先基于目标参考指标集合,根据目标参考指标集合、待推荐的项目基本信息和目标标准项目基本信息进行空间向量生成,得到待推荐的项目空间向量,基于目标参考指标集合,分别根据目标参考指标集合、待分析项目基本信息集合中每个项目基本信息和目标标准项目基本信息进行空间向量生成,得到待分析的空间向量集合,其次根据待推荐的项目空间向量,分别对待分析的空间向量集合中每个空间向量进行空间向量的平行判断,得到待分析的空间向量集合对应的平行空间向量集合和非平行空间向量集合,然后采用余弦相似度算法,分别对非平行空间向量集合中每个空间向量和待推荐的项目空间向量进行相似度计算,得到非平行空间向量集合中各个空间向量各自对应的第一待分析相似度,分别对平行空间向量集合中每个空间向量和待推荐的项目空间向量进行欧氏距离计算和数据转换,得到平行空间向量集合中各个空间向量各自对应的第二待分析相似度,最后根据第一待分析相似度和第二待分析相似度进行相似度对比和相似项目推荐,得到项目推荐结果,从而避免了基于国标行业划分采用同类型的项目进行推荐,通过采用多个参考指标进行多维度相似度评估,提高了相似项目推荐的准确性;而且通过先判断平行再采用不同的方法计算相似度,从而避免了采用余弦相似度算法在平行的空间向量计算相似度的缺陷,进一步提高了相似项目推荐的准确性。
参照图3,本申请实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于储存相似项目推荐方法等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种相似项目推荐方法。所述相似项目推荐方法,包括:获取相似项目推荐请求,所述相似项目推荐请求携带有待推荐的项目基本信息;根据所述待推荐的项目基本信息,确定目标参考指标集合和目标标准项目基本信息;根据所述目标参考指标集合、所述待推荐的项目基本信息和所述目标标准项目基本信息进行空间向量生成,得到待推荐的项目空间向量;获取待分析项目基本信息集合,分别根据所述目标参考指标集合、所述待分析项目基本信息集合中每个项目基本信息和所述目标标准项目基本信息进行空间向量生成,得到待分析的空间向量集合;根据所述待推荐的项目空间向量,分别对所述待分析的空间向量集合中每个空间向量进行空间向量的平行判断,得到所述待分析的空间向量集合对应的平行空间向量集合和非平行空间向量集合;采用余弦相似度算法,分别对所述非平行空间向量集合中每个空间向量和所述待推荐的项目空间向量进行相似度计算,得到所述非平行空间向量集合中各个空间向量各自对应的第一待分析相似度;分别对所述平行空间向量集合中每个空间向量和所述待推荐的项目空间向量进行欧氏距离计算和数据转换,得到所述平行空间向量集合中各个空间向量各自对应的第二待分析相似度;根据所述第一待分析相似度和所述第二待分析相似度进行相似度对比和相似项目推荐,得到项目推荐结果。
本实施例通过首先基于目标参考指标集合,根据目标参考指标集合、待推荐的项目基本信息和目标标准项目基本信息进行空间向量生成,得到待推荐的项目空间向量,基于目标参考指标集合,分别根据目标参考指标集合、待分析项目基本信息集合中每个项目基本信息和目标标准项目基本信息进行空间向量生成,得到待分析的空间向量集合,其次根据待推荐的项目空间向量,分别对待分析的空间向量集合中每个空间向量进行空间向量的平行判断,得到待分析的空间向量集合对应的平行空间向量集合和非平行空间向量集合,然后采用余弦相似度算法,分别对非平行空间向量集合中每个空间向量和待推荐的项目空间向量进行相似度计算,得到非平行空间向量集合中各个空间向量各自对应的第一待分析相似度,分别对平行空间向量集合中每个空间向量和待推荐的项目空间向量进行欧氏距离计算和数据转换,得到平行空间向量集合中各个空间向量各自对应的第二待分析相似度,最后根据第一待分析相似度和第二待分析相似度进行相似度对比和相似项目推荐,得到项目推荐结果,从而避免了基于国标行业划分采用同类型的项目进行推荐,通过采用多个参考指标进行多维度相似度评估,提高了相似项目推荐的准确性;而且通过先判断平行再采用不同的方法计算相似度,从而避免了采用余弦相似度算法在平行的空间向量计算相似度的缺陷,进一步提高了相似项目推荐的准确性。
本申请一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现一种相似项目推荐方法,包括步骤:获取相似项目推荐请求,所述相似项目推荐请求携带有待推荐的项目基本信息;根据所述待推荐的项目基本信息,确定目标参考指标集合和目标标准项目基本信息;根据所述目标参考指标集合、所述待推荐的项目基本信息和所述目标标准项目基本信息进行空间向量生成,得到待推荐的项目空间向量;获取待分析项目基本信息集合,分别根据所述目标参考指标集合、所述待分析项目基本信息集合中每个项目基本信息和所述目标标准项目基本信息进行空间向量生成,得到待分析的空间向量集合;根据所述待推荐的项目空间向量,分别对所述待分析的空间向量集合中每个空间向量进行空间向量的平行判断,得到所述待分析的空间向量集合对应的平行空间向量集合和非平行空间向量集合;采用余弦相似度算法,分别对所述非平行空间向量集合中每个空间向量和所述待推荐的项目空间向量进行相似度计算,得到所述非平行空间向量集合中各个空间向量各自对应的第一待分析相似度;分别对所述平行空间向量集合中每个空间向量和所述待推荐的项目空间向量进行欧氏距离计算和数据转换,得到所述平行空间向量集合中各个空间向量各自对应的第二待分析相似度;根据所述第一待分析相似度和所述第二待分析相似度进行相似度对比和相似项目推荐,得到项目推荐结果。
上述执行的相似项目推荐方法,通过首先基于目标参考指标集合,根据目标参考指标集合、待推荐的项目基本信息和目标标准项目基本信息进行空间向量生成,得到待推荐的项目空间向量,基于目标参考指标集合,分别根据目标参考指标集合、待分析项目基本信息集合中每个项目基本信息和目标标准项目基本信息进行空间向量生成,得到待分析的空间向量集合,其次根据待推荐的项目空间向量,分别对待分析的空间向量集合中每个空间向量进行空间向量的平行判断,得到待分析的空间向量集合对应的平行空间向量集合和非平行空间向量集合,然后采用余弦相似度算法,分别对非平行空间向量集合中每个空间向量和待推荐的项目空间向量进行相似度计算,得到非平行空间向量集合中各个空间向量各自对应的第一待分析相似度,分别对平行空间向量集合中每个空间向量和待推荐的项目空间向量进行欧氏距离计算和数据转换,得到平行空间向量集合中各个空间向量各自对应的第二待分析相似度,最后根据第一待分析相似度和第二待分析相似度进行相似度对比和相似项目推荐,得到项目推荐结果,从而避免了基于国标行业划分采用同类型的项目进行推荐,通过采用多个参考指标进行多维度相似度评估,提高了相似项目推荐的准确性;而且通过先判断平行再采用不同的方法计算相似度,从而避免了采用余弦相似度算法在平行的空间向量计算相似度的缺陷,进一步提高了相似项目推荐的准确性。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (10)

1.一种相似项目推荐方法,其特征在于,所述方法包括:
获取相似项目推荐请求,所述相似项目推荐请求携带有待推荐的项目基本信息;
根据所述待推荐的项目基本信息,确定目标参考指标集合和目标标准项目基本信息;
根据所述目标参考指标集合、所述待推荐的项目基本信息和所述目标标准项目基本信息进行空间向量生成,得到待推荐的项目空间向量;
获取待分析项目基本信息集合,分别根据所述目标参考指标集合、所述待分析项目基本信息集合中每个项目基本信息和所述目标标准项目基本信息进行空间向量生成,得到待分析的空间向量集合;
根据所述待推荐的项目空间向量,分别对所述待分析的空间向量集合中每个空间向量进行空间向量的平行判断,得到所述待分析的空间向量集合对应的平行空间向量集合和非平行空间向量集合;
采用余弦相似度算法,分别对所述非平行空间向量集合中每个空间向量和所述待推荐的项目空间向量进行相似度计算,得到所述非平行空间向量集合中各个空间向量各自对应的第一待分析相似度;
分别对所述平行空间向量集合中每个空间向量和所述待推荐的项目空间向量进行欧氏距离计算和数据转换,得到所述平行空间向量集合中各个空间向量各自对应的第二待分析相似度;
根据所述第一待分析相似度和所述第二待分析相似度进行相似度对比和相似项目推荐,得到项目推荐结果。
2.根据权利要求1所述的相似项目推荐方法,其特征在于,所述根据所述目标参考指标集合、所述待推荐的项目基本信息和所述目标标准项目基本信息进行空间向量生成,得到待推荐的项目空间向量的步骤,包括:
从所述目标参考指标集合中获取一个参考指标作为第一待分析的参考指标;
根据所述第一待分析的参考指标,从所述待推荐的项目基本信息中获取数据,得到待分析的待推荐属性数据;
根据所述第一待分析的参考指标,从所述目标标准项目基本信息中获取数据,得到待分析的标准属性数据;
基于所述第一待分析的参考指标对应的判断标准,将所述待分析的待推荐属性数据和所述待分析的标准属性数据进行对比,得到第一待分析的对比结果;
重复执行所述从所述目标参考指标集合中获取一个参考指标作为第一待分析的参考指标的步骤,直至完成所述目标参考指标集合中所有参考指标的获取;
根据所有所述第一待分析的对比结果进行空间向量生成,得到所述待推荐的项目空间向量。
3.根据权利要求1所述的相似项目推荐方法,其特征在于,所述分别根据所述目标参考指标集合、所述待分析项目基本信息集合中每个项目基本信息和所述目标标准项目基本信息进行空间向量生成,得到待分析的空间向量集合的步骤,包括:
从所述待分析项目基本信息集合中获取一个项目基本信息作为待分析的历史项目基本信息;
从所述目标参考指标集合中获取一个参考指标作为第二待分析的参考指标;
根据所述第二待分析的参考指标,从所述待分析的历史项目基本信息中获取数据,得到待分析的历史属性数据;
根据所述第二待分析的参考指标,从所述目标标准项目基本信息中获取数据,得到待处理的标准属性数据;
基于所述第二待分析的参考指标对应的判断标准,将所述待分析的历史属性数据和所述待处理的标准属性数据进行对比,得到第二待分析的对比结果;
重复执行所述从所述目标参考指标集合中获取一个参考指标作为第二待分析的参考指标的步骤,直至完成所述目标参考指标集合中所有参考指标的获取;
根据所有所述第二待分析的对比结果进行空间向量生成,得到所述待分析的历史项目基本信息对应的历史项目空间向量;
重复执行所述从所述待分析项目基本信息集合中获取一个项目基本信息作为待分析的历史项目基本信息的步骤,直至确定所述待分析项目基本信息集合中各个项目基本信息各自对应的所述历史项目空间向量;
根据所有所述历史项目空间向量,得到所述待分析的空间向量集合。
4.根据权利要求1所述的相似项目推荐方法,其特征在于,所述根据所述待推荐的项目空间向量,分别对所述待分析的空间向量集合中每个空间向量进行空间向量的平行判断,得到所述待分析的空间向量集合对应的平行空间向量集合和非平行空间向量集合的步骤,包括:
从所述待分析的空间向量集合中获取一个空间向量作为待判断的空间向量;
基于同一个三维坐标系,将所述待推荐的项目空间向量和所述待判断的空间向量进行平行判断,得到平行判断结果;
当所述平行判断结果为平行时,将所述待判断的空间向量作为平行空间向量;
当所述平行判断结果为不平行时,将所述待判断的空间向量作为非平行空间向量;
重复执行所述从所述待分析的空间向量集合中获取一个空间向量作为待判断的空间向量的步骤,直至完成所述待分析的空间向量集合中所有空间向量的获取;
根据所有所述平行空间向量,确定所述待分析的空间向量集合对应的平行空间向量集合;
根据所有所述非平行空间向量,确定所述待分析的空间向量集合对应的非平行空间向量集合。
5.根据权利要求1所述的相似项目推荐方法,其特征在于,所述采用余弦相似度算法,分别对所述非平行空间向量集合中每个空间向量和所述待推荐的项目空间向量进行相似度计算,得到所述非平行空间向量集合中各个空间向量各自对应的第一待分析相似度的步骤,包括:
从所述非平行空间向量集合中获取一个空间向量作为待计算的非平行空间向量;
采用余弦相似度算法,对所述待计算的非平行空间向量和所述待推荐的项目空间向量进行相似度计算,得到所述待计算的非平行空间向量对应的所述第一待分析相似度;
重复执行所述从所述非平行空间向量集合中获取一个空间向量作为待计算的非平行空间向量的步骤,直至确定所述非平行空间向量集合中各个空间向量各自对应的所述第一待分析相似度。
6.根据权利要求1所述的相似项目推荐方法,其特征在于,所述分别对所述平行空间向量集合中每个空间向量和所述待推荐的项目空间向量进行欧氏距离计算和数据转换,得到所述平行空间向量集合中各个空间向量各自对应的第二待分析相似度的步骤,包括:
从所述平行空间向量集合中获取空间向量作为待计算的平行空间向量;
对所述待计算的平行空间向量和所述待推荐的项目空间向量进行欧氏距离计算,得到待处理的欧氏距离;
根据所述待处理的欧氏距离进行数据转换,得到所述待计算的平行空间向量对应的所述第二待分析相似度;
重复执行所述从所述平行空间向量集合中获取空间向量作为待计算的平行空间向量的步骤,直至确定所述平行空间向量集合中各个空间向量各自对应的所述第二待分析相似度;
其中,所述待计算的平行空间向量对应的所述第二待分析相似度的计算公式WML为:
Figure FDA0002997921030000041
dML为所述待处理的欧氏距离。
7.根据权利要求1所述的相似项目推荐方法,其特征在于,所述根据所述第一待分析相似度和所述第二待分析相似度进行相似度对比和相似项目推荐,得到项目推荐结果的步骤,包括:
获取相似度阈值;
从所有所述第一待分析相似度和所有所述第二待分析相似度中查找大于所述相似度阈值的待分析相似度,得到相似度查找结果;
当所述相似度查找结果为找出至少一个所述待分析相似度大于所述相似度阈值时,根据大于所述相似度阈值的所有所述待分析相似度确定所述项目推荐结果;
当所述相似度查找结果为找不到一个所述待分析相似度大于所述相似度阈值时,获取参考指标调整规则,基于所述参考指标调整规则,根据所述待推荐的项目基本信息,确定所述目标参考指标集合和所述目标标准项目基本信息,重复执行所述根据所述目标参考指标集合、所述待推荐的项目基本信息和所述目标标准项目基本信息进行空间向量生成,得到待推荐的项目空间向量的步骤,直至所述相似度查找结果为找出至少一个所述待分析相似度大于所述相似度阈值。
8.一种相似项目推荐装置,其特征在于,所述装置包括:
请求获取模块,用于获取相似项目推荐请求,所述相似项目推荐请求携带有待推荐的项目基本信息;
参考指标和标准项目基本信息确定模块,用于根据所述待推荐的项目基本信息,确定目标参考指标集合和目标标准项目基本信息;
待推荐的项目空间向量确定模块,用于根据所述目标参考指标集合、所述待推荐的项目基本信息和所述目标标准项目基本信息进行空间向量生成,得到待推荐的项目空间向量;
待分析的空间向量集合确定模块,用于获取待分析项目基本信息集合,分别根据所述目标参考指标集合、所述待分析项目基本信息集合中每个项目基本信息和所述目标标准项目基本信息进行空间向量生成,得到待分析的空间向量集合;
空间向量的平行判断模块,用于根据所述待推荐的项目空间向量,分别对所述待分析的空间向量集合中每个空间向量进行空间向量的平行判断,得到所述待分析的空间向量集合对应的平行空间向量集合和非平行空间向量集合;
第一相似度计算模块,用于采用余弦相似度算法,分别对所述非平行空间向量集合中每个空间向量和所述待推荐的项目空间向量进行相似度计算,得到所述非平行空间向量集合中各个空间向量各自对应的第一待分析相似度;
第二相似度计算模块,用于分别对所述平行空间向量集合中每个空间向量和所述待推荐的项目空间向量进行欧氏距离计算和数据转换,得到所述平行空间向量集合中各个空间向量各自对应的第二待分析相似度;
相似项目推荐模块,用于根据所述第一待分析相似度和所述第二待分析相似度进行相似度对比和相似项目推荐,得到项目推荐结果。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN202110336543.0A 2021-03-29 2021-03-29 相似项目推荐方法、装置、设备及介质 Active CN112905895B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110336543.0A CN112905895B (zh) 2021-03-29 2021-03-29 相似项目推荐方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110336543.0A CN112905895B (zh) 2021-03-29 2021-03-29 相似项目推荐方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN112905895A true CN112905895A (zh) 2021-06-04
CN112905895B CN112905895B (zh) 2022-08-26

Family

ID=76109481

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110336543.0A Active CN112905895B (zh) 2021-03-29 2021-03-29 相似项目推荐方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN112905895B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180165769A1 (en) * 2016-01-07 2018-06-14 Ping An Technology (Shenzhen) Co., Ltd. System, device, method, and readable storage medium for issuing auto insurance investigation task
CN109062994A (zh) * 2018-07-04 2018-12-21 平安科技(深圳)有限公司 推荐方法、装置、计算机设备和存储介质
CN110188283A (zh) * 2019-06-05 2019-08-30 中国人民解放军国防科技大学 一种基于联合神经网络协同过滤的信息推荐方法及其系统
WO2020094060A1 (zh) * 2018-11-09 2020-05-14 华为技术有限公司 推荐方法及装置
CN111723285A (zh) * 2020-05-14 2020-09-29 天津大学 一种基于评分的深度谱卷积协同过滤推荐方法
CN112232611A (zh) * 2020-12-18 2021-01-15 北京几原科技有限责任公司 一种生成学生个性化学习方案的方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180165769A1 (en) * 2016-01-07 2018-06-14 Ping An Technology (Shenzhen) Co., Ltd. System, device, method, and readable storage medium for issuing auto insurance investigation task
CN109062994A (zh) * 2018-07-04 2018-12-21 平安科技(深圳)有限公司 推荐方法、装置、计算机设备和存储介质
WO2020094060A1 (zh) * 2018-11-09 2020-05-14 华为技术有限公司 推荐方法及装置
CN110188283A (zh) * 2019-06-05 2019-08-30 中国人民解放军国防科技大学 一种基于联合神经网络协同过滤的信息推荐方法及其系统
CN111723285A (zh) * 2020-05-14 2020-09-29 天津大学 一种基于评分的深度谱卷积协同过滤推荐方法
CN112232611A (zh) * 2020-12-18 2021-01-15 北京几原科技有限责任公司 一种生成学生个性化学习方案的方法及系统

Also Published As

Publication number Publication date
CN112905895B (zh) 2022-08-26

Similar Documents

Publication Publication Date Title
CN112347340B (zh) 信息搜索方法、装置和计算机设备
CN111199016A (zh) 一种基于DTW的改进K-means的日负荷曲线聚类方法
CN111079429B (zh) 基于意图识别模型的实体消歧方法、装置和计算机设备
CN112148892B (zh) 动态知识图谱的知识补全方法、装置和计算机设备
CN111432003B (zh) 应用于云计算的数据推送方法、装置、电子设备及系统
CN114419501A (zh) 视频推荐方法、装置、计算机设备及存储介质
CN113642652A (zh) 生成融合模型的方法、装置和设备
CN114416984A (zh) 基于人工智能的文本分类方法、装置、设备及存储介质
CN111832631A (zh) 特征识别方法、装置、计算机设备和存储介质
Wijuniamurti et al. Agglomerative Nesting (AGNES) Method and Divisive Analysis (DIANA) Method For Hierarchical Clustering On Some Distance Measurement Concepts
CN114398059A (zh) 参数的更新方法、装置、设备以及存储介质
CN114743067A (zh) 训练数据的增强方法、装置、计算机设备及存储介质
CN112699195B (zh) 地理空间数据处理方法、装置、计算机设备及存储介质
CN112905895B (zh) 相似项目推荐方法、装置、设备及介质
CN112365354A (zh) 资源匹配方法、装置和计算机设备
CN109728958B (zh) 一种网络节点信任预测方法、装置、设备及介质
CN112559671B (zh) 基于es的文本搜索引擎的构建方法、装置、设备及介质
CN114861818A (zh) 基于人工智能的主数据匹配方法、装置、设备及存储介质
CN112364620B (zh) 文本相似度的判断方法、装置以及计算机设备
CN113641879B (zh) 适用于并行链路的控制对象识别方法、装置、设备及介质
CN113837319A (zh) 基于聚类的客户分类方法、装置、设备及存储介质
CN114925785A (zh) 基于主动学习Kriging模型的需求样本的优化方法
CN114756666A (zh) 基于人工智能的跨模态检索方法、装置、设备及存储介质
CN113657496A (zh) 基于相似度匹配模型的信息匹配方法、装置、设备及介质
CN113986245A (zh) 基于halo平台的目标代码生成方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant