CN114138755B - 一种基于人工智能的针对供方协同的物料档案检索方法 - Google Patents

一种基于人工智能的针对供方协同的物料档案检索方法 Download PDF

Info

Publication number
CN114138755B
CN114138755B CN202210115303.2A CN202210115303A CN114138755B CN 114138755 B CN114138755 B CN 114138755B CN 202210115303 A CN202210115303 A CN 202210115303A CN 114138755 B CN114138755 B CN 114138755B
Authority
CN
China
Prior art keywords
library
label
materials
updating
historical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210115303.2A
Other languages
English (en)
Other versions
CN114138755A (zh
Inventor
孙智凯
游杰勇
高鹏
刘建军
王欢欢
刘伟昆
李炳坤
王春光
程晓宁
熊俊杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Construction Fifth Engineering Bureau Co Ltd
Original Assignee
China Construction Fifth Engineering Bureau Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Construction Fifth Engineering Bureau Co Ltd filed Critical China Construction Fifth Engineering Bureau Co Ltd
Priority to CN202210115303.2A priority Critical patent/CN114138755B/zh
Publication of CN114138755A publication Critical patent/CN114138755A/zh
Application granted granted Critical
Publication of CN114138755B publication Critical patent/CN114138755B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2379Updates performed during online database operations; commit processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0605Supply or demand aggregation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation
    • G06Q30/0625Directed, with specific intent or strategy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/01Automatic library building

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Fuzzy Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及人工智能技术领域,具体涉及一种基于人工智能的针对供方协同的物料档案检索方法。该方法首先获取用户输入的需求标签向量。根据需求标签量从物料库中获取部分物料构建直接检索库和预加载库。扩增物料库中各物料的初始标签向量,由扩增前后物料的被选择次数占比更新初始标签向量。获取每次初始标签更新前后各物料的物料被选次数序列和标签相似度序列,由物料被选次数序列和标签相似度序列得到每个物料的稳定性。根据稳定性对预加载库进行首次更新,由首次更新后的预加载库中各物料的被选择次数二次更新预加载库,根据二次更新后的预加载库进行检索。本发明通过不断更新直接检索库和预加载库,使用户在进行检索时更顺利的选取需要的物料。

Description

一种基于人工智能的针对供方协同的物料档案检索方法
技术领域
本发明涉及人工智能技术领域,具体涉及一种基于人工智能的针对供方协同的物料档案检索方法。
背景技术
大型企业中有很多供应物料的供应商,简称供方,供方较多时,相互之间的协同关系显得尤为重要,很多企业会建立协同平台或协同软件。协同平台或协同软件里面涉及大量的物料数据管理。现有物料数据管理系统主要以物料数据的存储为重点,将物料数据集中存储在平台物料数据库,用于线上查询。但随着时间的推移,所存储的物料数据的数据量越来越庞大,物料的关键词标签也越来越多,公司在进行物料选择的时候经常会因为物料数据的信息量过于庞大而难以顺利寻找到自己需要的物料。
目前,传统的检索查询方式通常仅考虑用户和系统的简单交互式搜索。由于物料数据库通常要支持不同的公司使用,其中存储的物料数据数量也较多,且同一物料在不同的公司的标签也有所不同,简单交互式搜索会导致各公司在选择物料档案时有很大不便,且加载效率也相对较慢,难以迅速找到公司需要的物料。
发明内容
为了解决上述技术问题,本发明的目的在于提供一种基于人工智能的针对供方协同的物料档案检索方法,所采用的技术方案具体如下:
获取用户输入的需求标签向量;
根据所述需求标签向量从物料库的历史物料库中选取相关的多个历史物料,构建直接检索库;所述物料库包括所述历史物料库和非历史物料库;从非历史物料库中选取与所述直接检索库中历史物料相关的多个非历史物料,构建预加载库;
扩增所述物料库中物料的初始标签向量,由扩增前后物料的被选择次数占比计算更新权重系数,根据所述更新权重系数更新初始标签向量;根据更新后的初始标签向量对直接检索库进行更新;
获取所述物料每次更新初始标签向量后的第一被选次数,构建物料被选次数序列;获取每次初始标签向量更新前后两个初始标签向量的相似度,构建标签相似度序列;由所述物料被选次数序列的方差和所述标签相似度序列的均值得到每个物料对应的稳定性;多个物料对应的所述稳定性作为更新条件首次更新预加载库,获取首次更新后预加载库中各非历史物料的第二被选次数,根据所述第二被选次数计算二次更新系数,二次更新预加载库;根据更新后的直接检索库和预加载库进行检索。
优选的,所述物料的初始标签向量的获取方法,包括:
获取物料库中各物料的物料标签库,所述物料标签库包括物料标签向量和对应的标签权重向量;所述标签权重向量由物料标签向量中各标签元素在检索平台被检索的次数构建;所述物料在不同的检索平台具有不同的标签;
获取当前检索平台的各物料的历史标签构建历史标签库;根据所述历史标签库得到每个物料对应的匹配向量;
所述匹配向量和所述标签权重向量的相同位置处的元素的乘积作为初始权重向量;根据所述初始权重向量从物料标签向量中选取部分标签向量作为初始标签向量。
优选的,所述根据所述需求标签向量从物料库的历史物料库中选取相关的多个历史物料,构建直接检索库,包括:
计算所述历史物料库中各历史物料的初始标签向量和所述需求标签向量的相似度作为第二匹配程度;
对所述第二匹配程度进行排序,选取最大的前k个第二匹配程度对应的历史物料,并按照所述第二匹配程度的大小顺序对k个历史物料进行排序,构建所述直接检索库。
优选的,所述根据所述需求标签向量从物料库的历史物料库中选取相关的多个历史物料,构建直接检索库之前,还包括:
计算所述需求标签向量和物料库中多个物料的初始标签向量的相似度作为第一匹配程度;
按照所述第一匹配程度的大小顺序对所述物料库中的多个物料进行排序,构建所述系统库。
优选的,所述从非历史物料库中选取与所述直接检索库中历史物料相关的多个非历史物料,构建预加载库,包括:
计算所述非历史物料库中各非历史物料的初始标签向量和所述直接检索库中各历史物料的初始标签向量的相似度作为相关度;
对所述相关度进行排序,选取最大的前k个相关度对应的非历史物料,并按照所述相关度的大小顺序对k个非历史物料进行排序,构建所述预加载库。
优选的,所述由扩增前后物料的被选择次数占比计算更新权重系数,包括:
获取扩增前物料的被选择次数占比和扩增后物料的被选择次数占比;
所述更新权重系数的计算公式为:
Figure DEST_PATH_IMAGE001
其中,
Figure 17244DEST_PATH_IMAGE002
为所述更新权重系数;
Figure DEST_PATH_IMAGE003
为所述扩增后物料的被选择次数占比;
Figure 414727DEST_PATH_IMAGE004
为所述扩增前物料的被选择次数占比。
优选的,所述根据所述更新权重系数更新初始标签向量,包括:
获取扩增后的初始标签向量中的扩增物料标签向量以及扩增物料标签向量的所述标签权重向量;
扩增物料标签向量中各标签元素对应的标签权重和所述更新权重系数相乘,得到多个权重调整系数;多个所述权重调整系数和未扩增前的初始标签向量中各标签元素对应的初始权重排序得到第二权重序列,根据所述第二权重序列从所述扩增物料标签向量和所述初始标签向量中选取部分标签向量作为更新后的初始标签向量。
优选的,所述由所述物料被选次数序列的方差和所述标签相似度序列的均值得到每个物料对应的稳定性,包括:
所述稳定性的计算公式为:
Figure DEST_PATH_IMAGE005
其中,
Figure 189654DEST_PATH_IMAGE006
为所述稳定性;
Figure DEST_PATH_IMAGE007
为所述物料被选次数序列的方差;
Figure 127523DEST_PATH_IMAGE008
为所述标签相似度序列的均值;
Figure DEST_PATH_IMAGE009
为方差权重系数;
Figure 438549DEST_PATH_IMAGE010
为均值权重系数。
优选的,所述多个物料对应的所述稳定性作为更新条件首次更新预加载库,包括:
利用归一化后的所述稳定性和所述相关度的乘积对各所述历史物料的相关度进行更新;
根据更新后的相关度首次更新预加载库。
优选的,所述根据所述第二被选次数计算二次更新系数,二次更新预加载库,包括:
获取首次更新后预加载库中所有物料的第二被选次数之和;
所述第二被选次数之和与所述预加载库中物料的数量之比为更新调节系数;
所述二次更新系数的计算公式为:
Figure DEST_PATH_IMAGE011
其中,
Figure 272513DEST_PATH_IMAGE012
为所述二次更新系数;
Figure DEST_PATH_IMAGE013
为所述第二被选次数;
Figure DEST_PATH_IMAGE015
为所述更新调节系数。
本发明实施例至少具有如下有益效果:
本发明实施例利用人工智能技术。首先获取用户输入的需求标签向量。根据需求标签量从物料库中获取相关的历史物料和非历史物料构建直接检索库和预加载库;直接检索库为对检索平台的历史物料进行了选取和排序,直接检索库首先作为待选取对象;预加载库为与直接检索库相似度最大的库,当用户在直接检索库中没有选中适配的物料时,预加载库内的物料作为第二批出现的物料,构建直接检索库和预加载库有利于用户更容易的找到适配的物料。扩增物料库中各物料对应的初始标签向量,由扩增前后物料的被选择次数占比更新初始标签向量;根据实时检索情况不断的更新物料对应的初始标签向量,同样使用户更易检索到与需求标签向量相关的物料。获取每次初始标签更新前后各物料对应的物料被选次数序列和标签相似度序列,根据物料被选次数序列和标签相似度序列得到每个物料的初始标签序列的稳定性。根据稳定性对预加载库进行首次更新,根据首次更新后的预加载库中各物料的被选择次数二次更新预加载库,根据二次更新后的预加载库进行检索。通过获取扩增前后的物料被选择次数对初始标签向量进行更新,同时对直接检索库、预加载库和系统库进行更新,使得不断更新的库更能满足检索平台的检索需求。使用不同的检索平台时能够对应的获取与各检索平台的检索需求更接近的物料,使用户在通过检索平台进行检索时更顺利的选取物料。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明一个实施例所提供的一种基于人工智能的针对供方协同的物料档案检索方法的方法流程图;
图2为本发明一个实施例所提供的一种直接检索库、预加载库和系统库的构建方法的方法流程图;
图3为本发明一个实施例所提供的一种获取初始标签向量的方法流程图;
图4为本发明一个实施例所提供的一种更新初始标签向量的方法流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种基于人工智能的针对供方协同的物料档案检索方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构、或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
本发明实施例提供了一种基于人工智能的针对供方协同的物料档案检索方法的具体实施方法,该方法适用于物料档案检索场景。基于人工智能的针对供方协同的物料档案检索方法主要用于大型企业的供方协同平台,供方协同平台可接受外部订单等消息,也可以通过建立供方门户支持供方用户自主管理。供方协同平台的物料档案可支持不同公司进行应用,用户自己可以定义物料分类,自主选择物料,同时也可以对物料进行检索。一个物料库由多个检索平台共用。其中,物料库中包含有多个物料,每个物料有对应的物料标签向量,该物料标签向量内为所有检索平台的对应的标签。基于各检索平台,对应的物料库中的每个物料有对应的初始标签向量,该初始标签向量仅供对应的检索平台适用,而不是对所有的检索平台都适用。为了解决一次交互式检索使得用户难以找到需要的物料的问题,本发明实施例为每个检索平台均构建了适配的直接检索库、预加载库和系统库,并不断的根据检索信息和物料选取信息更新三个库,每个检索平台对应的三个库均不相同。通过获取扩增前后的物料被选择次数对初始标签向量进行更新,同时对直接检索库、预加载库和系统库进行更新,使得不断更新的库更能满足检索平台的检索需求。使用不同的检索平台时能够对应的获取与各检索平台的检索需求更接近的物料,使用户在通过检索平台进行检索时更顺利的选取物料。
下面结合附图具体的说明本发明所提供的一种基于人工智能的针对供方协同的物料档案检索方法的具体方案。
请参阅图1,其示出了本发明一个实施例提供的一种基于人工智能的针对供方协同的物料档案检索方法的步骤流程图,该方法包括以下步骤:
步骤S100,获取用户输入的需求标签向量。
用户在搜索框输入需求标签,该需求标签转换为对应的需求标签向量。如用户在搜索框输入的需求标签为:{金属,60kg,银色};且金属对应的需求标签为55,60kg对应的需求标签为23,银色对应的需求标签为79,则该需求标签{金属,60kg,银色}所对应的需求标签向量为{55,23,79}。
步骤S200,根据需求标签向量从物料库的历史物料库中选取相关的多个历史物料,构建直接检索库;物料库包括历史物料库和非历史物料库;从非历史物料库中选取与直接检索库中历史物料相关的多个非历史物料,构建预加载库。
物料库被多个检索平台共用,各检索平台可以从物料库中选取自己需要的物料,物料库中包含多个检索平台所需要的物料信息。
获取物料库中各物料的物料标签库,物料标签库包括物料标签向量和标签权重向量。物料库中各物料的物料标签向量包含各物料对应的所有标签,如:物料名称、质量、种类、型号等属性信息。
标签权重向量由物料标签向量中各标签元素在多个检索平台被检索的次数构建;如物料a的物料标签向量为(a1,a2,a3,……,a9),其中标签元素a1在多个检索平台中共被检索了3次,则标签元素a1对应的标签权重为3;标签元素a2在多个检索平台中共被检索了4次,则标签元素a2对应的标签权重为4;标签元素a3在多个检索平台中共被检索了8次,则标签元素a3对应的标签权重为8;……标签元素a9在多个检索平台中共被检索了5次,则标签元素a9对应的标签权重为5;则该物料a的物料标签向量对应的标签权重向量为(3,4,8,……,5)。
由于物料库是作为多个检索平台的共用库,物料库中所存储的物料数量会过于庞大,且各物料所对应的物料标签数量也会很庞大。若各用户直接在物料库中根据物料标签进行物料搜索,难以顺利检索到自己需要的物料。
故本发明实施例进一步限定各检索平台对应的物料的初始标签向量,该初始标签向量中的元素属于物料的物料标签向量中的一部分;每个检索平台的各物料均有各自对应的初始标签向量,即进一步将物料的物料标签向量缩小的每个检索平台均有各自的初始标签向量,使得用户通过不同的检索平台更容易检索到自己所需要的物料。如公司b对应一个检索平台B,公司c对应一个检索平台C,检索平台B和检索平台C共用一个物料库,公司b或公司c中的员工作为用户直接从物料库中检索物料,由于物料库中物料数据过多导致难以检索到适合的物料;若公司b中的员工作为用户通过检索平台B进行物料检索,由于检索平台B是适配于公司b的检索平台,所以公司b中的员工更易通过检索平台B检索到适合的物料。
每个物料在不同的检索平台具有不同的标签。每个检索平台有各自对应的直接检索库、预加载库和系统库。
请参阅图2,直接检索库、预加载库和系统库的构建方法,具体的:
步骤S210,获取初始标签向量。
请参阅图3,获取初始标签向量的步骤,具体的:
步骤S211,获取当前检索平台的各物料的历史标签构建历史标签库。
该历史标签库中标签的获取方法为:检索平台曾经用标签d检索物料,并且选用了由标签d检索到的物料v,则标签d则属于物料v的历史标签,也属于历史标签库中的标签。所有物料所对应的历史标签构成历史标签库。
步骤S212,根据历史标签库得到每个物料对应的匹配向量。
匹配向量的获取方法为:匹配向量中属于历史标签库中的标签元素的相应位置处的值置为
Figure 65895DEST_PATH_IMAGE016
,不属于历史标签库中的标签元素的相应位置处的值置为
Figure DEST_PATH_IMAGE017
,在本发明实施例中
Figure 761449DEST_PATH_IMAGE016
的取值为5,
Figure 848354DEST_PATH_IMAGE017
的取值为1,在其他实施例中实施者可根据实际情况调整该取值。
每个物料在不同的检索平台具有不同的匹配向量。
步骤S213,匹配向量和标签权重向量的相同位置处的元素的乘积作为初始权重向量;根据初始权重向量从物料标签向量中选取部分标签向量作为初始标签向量。
将匹配向量和标签权重向量的相同位置处的乘积作为初始权重向量;对多个初始权重向量从大到小进行排序得到初始权重序列,从物料标签向量中选取初始权重序列中前f个元素对应的部分标签向量作为初始标签向量。在本发明实施例中f为10。
步骤S220,根据需求标签向量从物料库中选取相关的多个物料,构建系统库。
系统库中包含物料库中的所有物料。需要说明的是,不同的检索平台对应的系统库中各物料的排列顺序不同。
计算用户输入的需求标签向量和物料库中多个物料对应的初始标签向量的相似度作为第一匹配程度。
按照第一匹配程度的大小顺序对物料库中的多个物料进行排序得到第一检索序列,该第一检索序列中的物料构成系统库。
且将属于预加载库和直接检索库中的物料从系统库中筛除,即在后续不断更新预加载库和直接检索库的同时系统库相应的进行更新。预加载库、直接检索库和系统库中物料的数量等于物料库中的总数量。
步骤S230,根据需求标签向量从物料库的历史物料库中选取相关的多个历史物料,构建直接检索库。
物料库包括历史物料库和非历史物料库。该历史物料库指的是检索平台曾经选中的物料;非历史物料指的是检索平台从未选过的物料。
计算历史物料库中各历史物料的初始标签向量和需求标签向量的相似度作为第二匹配程度。
对第二匹配程度按照从大到小的顺序进行排序,选取最大的前k个第二匹配程度对应的历史物料,并按照第二匹配程度的大小顺序对选取出来的k个历史物料进行排序得到第二检索序列,该第二检索序列中的物料构成直接检索库。在本发明实施例中,k的取值为20。
步骤S240,从非历史物料库中选取与直接检索库中历史物料相关的多个非历史物料,构建预加载库。
计算非历史物料库中各非历史物料的初始标签向量和直接检索库中各历史物料的初始标签向量的相似度作为相关度。
对相关度按照从大到小的顺序进行排序,选取最大的前k个相关度对应的历史物料,并按照相关度的大小顺序对选取出来的k个非历史物料进行排序得到第三检索序列,该第三检索序列中的物料构成预加载库。
本发明实施例想要实现用户在输入需求标签并生成对应的需求标签向量进行检索时,首先出现的是该检索平台的历史物料库中的与需求标签向量相关的历史物料,即直接检索库中的历史物料,并按照第二检索序列中物料的先后顺序出现,因为对于一个用户来说选择自己曾经选择过的物料的概率更大。排在直接检索库之后的是该检索平台的非历史物料库中与需求标签向量相关的非历史物料,即预加载库中的非历史物料,该非历史物料为与直接检索库中的历史物料相关的非历史物料,其被选择的概率相对更大一些,该预加载库中的非历史物料按照第三检索序列中物料的先后顺序出现。在直接检索库和预加载库之后的是系统库,系统库中的物料则不再分历史物料和非历史物料,系统库中的多个物料按照第一检索序列中物料的先后顺序出现。
步骤S300,扩增物料库中物料的初始标签向量,由扩增前后物料的被选择次数占比计算更新权重系数,根据更新权重系数更新初始标签向量;根据更新后的初始标签向量对直接检索库进行更新。
请参阅图4,更新初始标签向量的步骤,具体的:
步骤S310,扩增物料库中物料的初始标签向量。
将步骤S200得到的各物料的初始标签向量进行扩增。即将各物料的初始标签库元素个数从
Figure 322061DEST_PATH_IMAGE018
调整为
Figure DEST_PATH_IMAGE019
,如在步骤S213中本发明实施例是从物料标签向量中选取在初始权重序列中前10个元素所对应的标签向量作为初始标签向量,则扩增时从物料标签向量中选取在初始权重序列中前15个元素所对应的标签向量作为扩增后的初始标签向量。
步骤S320,由扩增前后物料的被选择次数占比计算更新权重系数。
统计固定时间段内物料的被选择次数,在本发明实施例中设置固定时间段为一个月。
获取固定时间段内扩增前物料的被选择次数占比和扩增后物料的被选择次数占比。该被选择次数占比即为物料的被选择次数和物料库中所有物料被选择次数之比。
根据扩增前后物料的被选择次数占比计算更新权重系数,再根据更新权重系数更新初始标签向量。用扩增前后物料的被选择次数占比来更新初始标签向量,是根据标签向量的扩增以及标签向量变化前后物料的被选择次数,来反映扩增的标签对物料被选择概率的影响程度,如果扩增了标签之后,该物料的被选择次数发生了显著的提高则说明使用扩增之后的扩增物料标签也更易于用户检索到自己需要的物料。
更新权重系数
Figure 822312DEST_PATH_IMAGE002
的计算公式为:
Figure 46793DEST_PATH_IMAGE001
其中,
Figure 50521DEST_PATH_IMAGE003
为扩增后物料的被选择次数占比;
Figure 695129DEST_PATH_IMAGE004
为扩增前物料的被选择次数占比。
根据固定时间段内的物料被选择信息重新构建权重向量,对于新加入的扩增的标签进行权重调整。
步骤S330,根据更新权重系数更新初始标签向量。
获取扩增后的初始标签向量中的扩增物料标签向量以及各扩增物料标签向量的标签权重向量。扩增后的初始标签向量中最后面的5个标签向量即为扩增物料标签向量。在步骤S200中已经详细描述了标签向量中各标签元素的标签权重的获取方法,获取扩增物料标签向量中每个标签元素的标签权重。
扩增物料标签向量中各标签元素对应的标签权重和更新权重系数相乘,得到多个权重调整系数。
多个权重调整系数和未扩增前的初始标签向量中各标签元素对应的初始权重从大到小排序得到第二权重序列。
根据第二权重序列从扩增物料标签向量和初始标签向量中选取第二权重序列中前f个元素对应的部分标签向量作为更新后的初始标签向量。
在更新初始标签向量之后,相应的直接检索库也随之进行更新,更新过程和步骤S200中构建直接检索库时的过程相同,而预加载库根据后续的步骤S400进行更新。
步骤S400,获取物料每次更新初始标签向量后的第一被选次数,构建物料被选次数序列;获取每次初始标签向量更新前后两个初始标签向量的相似度,构建标签相似度序列;由物料被选次数序列的方差和标签相似度序列的均值得到每个物料对应的稳定性;多个物料对应的稳定性作为更新条件首次更新预加载库,获取首次更新后预加载库中各非历史物料的第二被选次数,根据第二被选次数计算二次更新系数,二次更新预加载库;根据更新后的直接检索库和预加载库进行检索。
每隔固定时间段均根据步骤S300中更新初始标签库的方法对初始标签库进行更新,获取每次更新前后的两个初始标签向量,并获取每次初始标签库更新前后固定时间段内物料库中物料的第一被选次数。
根据每次初始标签库更新前后第一被选次数,构建物料被选次数序列。每个物料对应的物料被选次数序列不同。
获取每次初始标签向量更新前后两个初始标签向量的相似度,构建标签相似度序列,每个物料对应的标签相似度序列不同。在本发明实施例中计算两个初始标签向量的相似度为计算两个初始标签向量的余弦相似度。
由物料被选次数序列的方差和标签相似度序列的均值得到每个物料对应的稳定性。因为通过初始标签序列更新前后的物料被选次数和每次更新之后初始标签的相似度可以反映出检索平台构建的库的稳定性。
稳定性
Figure 151518DEST_PATH_IMAGE006
的计算公式为:
Figure 657717DEST_PATH_IMAGE005
其中,
Figure 47110DEST_PATH_IMAGE007
为物料被选次数序列的方差;
Figure 862619DEST_PATH_IMAGE008
为标签相似度序列的均值;
Figure 55572DEST_PATH_IMAGE009
为方差权重系数;
Figure 614729DEST_PATH_IMAGE010
为均值权重系数。在本发明实施例中方差权重系数为1,均方差权重系数为1,在其他实施例中实施者可根据实际情况调整该取值。
一个物料对应一个稳定性,每个物料对应的均稳定性不同。
在获取物料库中每个物料对应的稳定性之后,根据稳定性和获取预加载库时得到的相关度对预加载库进行更新。对预加载库进行更新的目的时为了通过相关物料信息推荐的方法帮助用户提高检索效率,也避免了无效的检索。
对预加载库进行首次更新的步骤,具体的:利用对归一化后的稳定性和各历史物料的相关度的乘积对各历史物料的相关度进行更新,根据更新后的相关度首次更新预加载库。也即将该首次更新后的相关度从大到小进行排序,选取最大的前k个相关度对应的非历史物料,并按照更新后相关度的大小顺序对k个非历史物料进行排序,首次更新预加载库。
根据首次更新预加载库中预加载库中各非历史物料的被选次数二次更新预加载库。
二次更新预加载库的步骤,具体的:
获取首次更新后预加载库中各非历史物料在固定时间段内的被选次数为第二被选次数,并获取首次更新后预加载库中所有非历史物料的第二被选次数之和。
第二被选次数之和与预加载库中物料的数量之比为更新调节系数。
根据第二被选次数之和与更新调节系数计算二次更新系数。
该二次更新系数
Figure 327470DEST_PATH_IMAGE012
的计算公式为:
Figure 48302DEST_PATH_IMAGE011
其中,
Figure 230015DEST_PATH_IMAGE013
为第二被选次数;
Figure 327284DEST_PATH_IMAGE015
为更新调节系数。
将相关度再次更新为二次更新系数,根据二次更新后的相关度更新预加载库。
根据二次更新后的预加载库进行物料检索。
综上所述,本发明实施例利用人工智能技术。首先获取用户输入的需求标签向量。根据需求标签量从物料库中获取相关的历史物料和非历史物料构建直接检索库和预加载库。扩增物料库中各物料对应的初始标签向量。由扩增前后物料的被选择次数占比更新初始标签向量。获取每次初始标签更新前后各物料对应的物料被选次数序列和标签相似度序列,根据物料被选次数序列和标签相似度序列得到每个物料的初始标签序列的稳定性。根据稳定性对预加载库进行首次更新,根据首次更新后的预加载库中各物料的被选择次数二次更新预加载库,根据二次更新后的预加载库进行检索。通过获取扩增前后的物料被选择次数对初始标签向量进行更新,同时对直接检索库、预加载库和系统库进行更新,使得不断更新的库更能满足检索平台的检索需求。使用不同的检索平台时能够对应的获取与各检索平台的检索需求更接近的物料,使用户在通过检索平台进行检索时更顺利的选取物料。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于人工智能的针对供方协同的物料档案检索方法,其特征在于,该方法包括以下步骤:
获取用户输入的需求标签向量;
根据所述需求标签向量从物料库的历史物料库中选取相关的多个历史物料,构建直接检索库;所述物料库包括所述历史物料库和非历史物料库;从非历史物料库中选取与所述直接检索库中历史物料相关的多个非历史物料,构建预加载库;
扩增所述物料库中物料的初始标签向量,由扩增前后物料的被选择次数占比计算更新权重系数,根据所述更新权重系数更新初始标签向量;根据更新后的初始标签向量对直接检索库进行更新;
获取所述物料每次更新初始标签向量后的第一被选次数,构建物料被选次数序列;获取每次初始标签向量更新前后两个初始标签向量的相似度,构建标签相似度序列;由所述物料被选次数序列的方差和所述标签相似度序列的均值得到每个物料对应的稳定性;多个物料对应的所述稳定性作为更新条件首次更新预加载库,获取首次更新后预加载库中各非历史物料的第二被选次数,根据所述第二被选次数计算二次更新系数,二次更新预加载库;根据更新后的直接检索库和预加载库进行检索。
2.根据权利要求1所述的一种基于人工智能的针对供方协同的物料档案检索方法,其特征在于,所述物料的初始标签向量的获取方法,包括:
获取物料库中各物料的物料标签库,所述物料标签库包括物料标签向量和对应的标签权重向量;所述标签权重向量由物料标签向量中各标签元素在检索平台被检索的次数构建;所述物料在不同的检索平台具有不同的标签;
获取当前检索平台的各物料的历史标签构建历史标签库;根据所述历史标签库得到每个物料对应的匹配向量;
所述匹配向量和所述标签权重向量的相同位置处的元素的乘积作为初始权重向量;根据所述初始权重向量从物料标签向量中选取部分标签向量作为初始标签向量。
3.根据权利要求1所述的一种基于人工智能的针对供方协同的物料档案检索方法,其特征在于,所述根据所述需求标签向量从物料库的历史物料库中选取相关的多个历史物料,构建直接检索库,包括:
计算所述历史物料库中各历史物料的初始标签向量和所述需求标签向量的相似度作为第二匹配程度;
对所述第二匹配程度进行排序,选取最大的前k个第二匹配程度对应的历史物料,并按照所述第二匹配程度的大小顺序对k个历史物料进行排序,构建所述直接检索库。
4.根据权利要求1所述的一种基于人工智能的针对供方协同的物料档案检索方法,其特征在于,所述根据所述需求标签向量从物料库的历史物料库中选取相关的多个历史物料,构建直接检索库之前,还包括:
计算所述需求标签向量和物料库中多个物料的初始标签向量的相似度作为第一匹配程度;
按照所述第一匹配程度的大小顺序对所述物料库中的多个物料进行排序,构建系统库。
5.根据权利要求1所述的一种基于人工智能的针对供方协同的物料档案检索方法,其特征在于,所述从非历史物料库中选取与所述直接检索库中历史物料相关的多个非历史物料,构建预加载库,包括:
计算所述非历史物料库中各非历史物料的初始标签向量和所述直接检索库中各历史物料的初始标签向量的相似度作为相关度;
对所述相关度进行排序,选取最大的前k个相关度对应的非历史物料,并按照所述相关度的大小顺序对k个非历史物料进行排序,构建所述预加载库。
6.根据权利要求1所述的一种基于人工智能的针对供方协同的物料档案检索方法,其特征在于,所述由扩增前后物料的被选择次数占比计算更新权重系数,包括:
获取扩增前物料的被选择次数占比和扩增后物料的被选择次数占比;
所述更新权重系数的计算公式为:
Figure DEST_PATH_IMAGE002
其中,
Figure DEST_PATH_IMAGE004
为所述更新权重系数;
Figure DEST_PATH_IMAGE006
为所述扩增后物料的被选择次数占比;
Figure DEST_PATH_IMAGE008
为所述扩增前物料的被选择次数占比。
7.根据权利要求2所述的一种基于人工智能的针对供方协同的物料档案检索方法,其特征在于,所述根据所述更新权重系数更新初始标签向量,包括:
获取扩增后的初始标签向量中的扩增物料标签向量以及扩增物料标签向量的所述标签权重向量;
扩增物料标签向量中各标签元素对应的标签权重和所述更新权重系数相乘,得到多个权重调整系数;多个所述权重调整系数和未扩增前的初始标签向量中各标签元素对应的初始权重排序得到第二权重序列,根据所述第二权重序列从所述扩增物料标签向量和所述初始标签向量中选取部分标签向量作为更新后的初始标签向量。
8.根据权利要求1所述的一种基于人工智能的针对供方协同的物料档案检索方法,其特征在于,所述由所述物料被选次数序列的方差和所述标签相似度序列的均值得到每个物料对应的稳定性,包括:
所述稳定性的计算公式为:
Figure DEST_PATH_IMAGE010
其中,
Figure DEST_PATH_IMAGE012
为所述稳定性;
Figure DEST_PATH_IMAGE014
为所述物料被选次数序列的方差;
Figure DEST_PATH_IMAGE016
为所述标签相似度序列的均值;
Figure DEST_PATH_IMAGE018
为方差权重系数;
Figure DEST_PATH_IMAGE020
为均值权重系数。
9.根据权利要求5所述的一种基于人工智能的针对供方协同的物料档案检索方法,其特征在于,所述多个物料对应的所述稳定性作为更新条件首次更新预加载库,包括:
利用归一化后的所述稳定性和所述相关度的乘积对各所述历史物料的相关度进行更新;
根据更新后的相关度首次更新预加载库。
10.根据权利要求1所述的一种基于人工智能的针对供方协同的物料档案检索方法,其特征在于,所述根据所述第二被选次数计算二次更新系数,二次更新预加载库,包括:
获取首次更新后预加载库中所有物料的第二被选次数之和;
所述第二被选次数之和与所述预加载库中物料的数量之比为更新调节系数;
所述二次更新系数的计算公式为:
Figure DEST_PATH_IMAGE022
其中,
Figure DEST_PATH_IMAGE024
为所述二次更新系数;
Figure DEST_PATH_IMAGE026
为所述第二被选次数;
Figure DEST_PATH_IMAGE028
为所述更新调节系数。
CN202210115303.2A 2022-02-07 2022-02-07 一种基于人工智能的针对供方协同的物料档案检索方法 Active CN114138755B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210115303.2A CN114138755B (zh) 2022-02-07 2022-02-07 一种基于人工智能的针对供方协同的物料档案检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210115303.2A CN114138755B (zh) 2022-02-07 2022-02-07 一种基于人工智能的针对供方协同的物料档案检索方法

Publications (2)

Publication Number Publication Date
CN114138755A CN114138755A (zh) 2022-03-04
CN114138755B true CN114138755B (zh) 2022-04-08

Family

ID=80381897

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210115303.2A Active CN114138755B (zh) 2022-02-07 2022-02-07 一种基于人工智能的针对供方协同的物料档案检索方法

Country Status (1)

Country Link
CN (1) CN114138755B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106599278A (zh) * 2016-12-23 2017-04-26 北京奇虎科技有限公司 应用搜索意图的识别方法及装置
KR101841522B1 (ko) * 2016-11-07 2018-03-23 오드컨셉 주식회사 쇼핑 정보를 제공하는 방법, 장치 및 컴퓨터 프로그램
CN109376309A (zh) * 2018-12-28 2019-02-22 北京百度网讯科技有限公司 基于语义标签的文档推荐方法和装置
CN109829052A (zh) * 2019-02-19 2019-05-31 田中瑶 一种基于人机交互的开放式对话方法和系统
CN112163136A (zh) * 2020-10-09 2021-01-01 北京中航科电测控技术股份有限公司 一种基于rfid识别技术的文件识别方法
CN112765385A (zh) * 2020-06-14 2021-05-07 黄雨勤 基于大数据和互联网的信息管理方法及系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11429405B2 (en) * 2017-11-28 2022-08-30 Intuit, Inc. Method and apparatus for providing personalized self-help experience
US20210089539A1 (en) * 2019-09-20 2021-03-25 Pinterest, Inc. Associating user-provided content items to interest nodes
US11386463B2 (en) * 2019-12-17 2022-07-12 At&T Intellectual Property I, L.P. Method and apparatus for labeling data

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101841522B1 (ko) * 2016-11-07 2018-03-23 오드컨셉 주식회사 쇼핑 정보를 제공하는 방법, 장치 및 컴퓨터 프로그램
CN106599278A (zh) * 2016-12-23 2017-04-26 北京奇虎科技有限公司 应用搜索意图的识别方法及装置
CN109376309A (zh) * 2018-12-28 2019-02-22 北京百度网讯科技有限公司 基于语义标签的文档推荐方法和装置
CN109829052A (zh) * 2019-02-19 2019-05-31 田中瑶 一种基于人机交互的开放式对话方法和系统
CN112765385A (zh) * 2020-06-14 2021-05-07 黄雨勤 基于大数据和互联网的信息管理方法及系统
CN112163136A (zh) * 2020-10-09 2021-01-01 北京中航科电测控技术股份有限公司 一种基于rfid识别技术的文件识别方法

Also Published As

Publication number Publication date
CN114138755A (zh) 2022-03-04

Similar Documents

Publication Publication Date Title
CN108241745B (zh) 样本集的处理方法及装置、样本的查询方法及装置
US6754675B2 (en) Image retrieval system
US7672930B2 (en) System and methods for facilitating a linear grid database with data organization by dimension
CN1841379B (zh) 将文件系统模型映射到数据库对象
US20160292591A1 (en) Streamlined analytic model training and scoring system
CN112822526A (zh) 视频推荐方法、服务器和可读存储介质
CN106997390B (zh) 一种设备配件或零部件商品交易信息搜索方法
CN114140171B (zh) 一种应用于推荐系统的鲁棒无偏的负采样方法
CN114691828B (zh) 数据处理方法、装置、设备以及介质
CN109635069B (zh) 一种基于信息熵的地理空间数据自组织方法
CN113918573A (zh) 数据处理方法及装置
CN114138755B (zh) 一种基于人工智能的针对供方协同的物料档案检索方法
CN109740623B (zh) 一种演员筛选的方法及装置
US20230359928A1 (en) Transfer learning using decision tree based machine learning models
CN114996215A (zh) 文件搜索方法、装置、设备及存储介质
US20080275855A1 (en) Advanced scrolling for relational database applications
Fushimi et al. Accelerating Greedy K-Medoids Clustering Algorithm with Distance by Pivot Generation
JP2001092841A (ja) クラスター分析処理方法およびクラスター分析プログラムを記録した記録媒体
EP1160690A1 (en) Method of indexing and similarity search in a feature vector space
CN113343684A (zh) 核心产品词识别方法、装置、计算机设备及存储介质
CN111400274A (zh) 一种web应用的审批流程状态字段设计方法
KR102545575B1 (ko) 고객군별 특성에 따른 이중화 서비스 플로우를 적용한 플랫폼을 통한 ai모델 자동추천 구독 서비스 방법 및 서버
US11775513B2 (en) Database management for sound-based identifiers
CN113821722B (zh) 数据处理方法、推荐方法、装置、电子设备以及介质
CN115393024A (zh) 产品数据推送方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant