CN114971767A - 信息处理方法、装置、电子设备及存储介质 - Google Patents
信息处理方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN114971767A CN114971767A CN202210394214.6A CN202210394214A CN114971767A CN 114971767 A CN114971767 A CN 114971767A CN 202210394214 A CN202210394214 A CN 202210394214A CN 114971767 A CN114971767 A CN 114971767A
- Authority
- CN
- China
- Prior art keywords
- purchasing
- entity
- information
- attribute
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0605—Supply or demand aggregation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Accounting & Taxation (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Finance (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Animal Behavior & Ethology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本公开提供了一种信息处理方法、装置、电子设备及存储介质。该方法包括:获取采购需求信息和采购物品知识图谱;对所述采购需求信息进行实体抽取,获得采购需求实体;从所述采购物品知识图谱中查询获得多个物品的属性实体;对所述采购需求实体和所述多个物品的属性实体进行匹配,以获得所述采购需求信息对应的目标物品列表。该方法可以自动、准确地获得采购需求信息对应的目标物品列表,提高采购需求和目标物品匹配的准确性,从而提高采购效率。
Description
技术领域
本公开涉及信息处理技术领域,尤其涉及一种信息处理方法、装置、电子设备及存储介质。
背景技术
在电商化采购场景下,企业进行物资采购时,采购人员需要从海量商品中选择符合企业的采购需求的商品。
相关技术中,采购人员根据自己掌握的经验设定筛选条件,从海量的商品池中查找出商品,这种方法存在主观因素,采购准确性较低;且需要耗费大量人力,采购效率较低。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种信息处理方法、装置、电子设备及存储介质,该方法可以自动、准确地获得采购需求信息对应的目标物品列表,提高采购需求和目标物品匹配的准确性,从而提高采购效率。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
本公开实施例提供一种信息处理方法,包括:获取采购需求信息和采购物品知识图谱;对所述采购需求信息进行实体抽取,获得采购需求实体;从所述采购物品知识图谱中查询获得多个物品的属性实体;对所述采购需求实体和所述多个物品的属性实体进行匹配,以获得所述采购需求信息对应的目标物品列表。
在本公开一些示例性实施例中,对所述采购需求信息进行实体抽取,获得采购需求实体,包括:通过序列标注模型将所述采购需求信息进行标注,获得所述采购需求信息的标签序列;根据所述标签序列中的标签,从所述采购需求信息中抽取获得所述采购需求实体。
在本公开一些示例性实施例中,所述方法还包括:获取采购方的用户行为数据;通过上下文关系分析所述用户行为数据获得所述采购方的采购背景信息;根据所述采购背景信息对所述采购需求实体进行补偿,以更新所述采购需求实体。
在本公开一些示例性实施例中,对所述采购需求实体和所述多个物品的属性实体进行匹配,以获得所述采购需求信息对应的目标物品列表,包括:确定所述采购需求实体和所述多个物品的属性实体的文本相似度;根据所述文本相似度,从所述属性实体中确定与所述采购需求实体匹配的目标属性实体;根据所述目标属性实体确定至少一个目标物品,以组成所述目标物品列表。
在本公开一些示例性实施例中,根据所述目标属性实体确定至少一个目标物品,以组成所述目标物品列表,包括:确定各个目标物品和所述采购需求信息的匹配度;获取各个目标物品的价格属性信息和舆情属性信息;根据各个目标物品和所述采购需求信息的匹配度、价格属性信息和舆情属性信息,从所述至少一个目标物品中确定目标推送物品,以组成所述目标物品列表。
在本公开一些示例性实施例中,所述方法还包括:获取原始数据,所述原始数据包括物品数据、供应方数据和网络舆情数据;分别对所述物品数据、所述供应方数据和所述网络舆情数据进行实体抽取,获得物品属性实体、供应方属性实体和网络舆情实体;根据所述物品属性实体、所述供应方属性实体和所述网络舆情实体构建所述采购物品知识图谱。
在本公开一些示例性实施例中,所述方法还包括:获得采购方从所述目标物品列表中选择的选中物品;根据所述选中物品和所述采购需求实体构建三元组关系,并存储至所述采购物品知识图谱。
本公开实施例提供一种信息处理装置,包括:获取模块,用于获取采购需求信息和采购物品知识图谱;获得模块,用于对所述采购需求信息进行实体抽取,获得采购需求实体;查询模块,用于从所述采购物品知识图谱中查询获得多个物品的属性实体;匹配模块,用于对所述采购需求实体和所述多个物品的属性实体进行匹配,以获得所述采购需求信息对应的目标物品列表。
本公开实施例提供一种电子设备,包括:至少一个处理器;存储装置,用于存储至少一个程序,当所述至少一个程序被所述至少一个处理器执行时,使得所述至少一个处理器实现如上述任一种信息处理方法。
本公开实施例提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上述任一种信息处理方法。
本公开一些实施例提供的信息处理方法,对采购需求信息进行实体抽取获得采购需求实体,从采购物品知识图谱中查询获得多个物品的属性实体,通过对采购需求实体和物品的属性实体进行匹配,可以自动、准确地获得采购需求信息对应的目标物品列表,提高采购需求和目标物品匹配的准确性,从而提高采购效率。此外,该方法可以节省人工查询、搜索、匹配等工作量,节省采购方的操作步骤和采购时间,从而提升用户体验。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了可以应用本公开实施例的信息处理方法的示例性系统架构的示意图。
图2是根据一示例性实施方式示出的一种信息处理方法的流程图。
图3是根据一示例示出的一种采购需求信息及将采购需求信息抽取为采购需求实体的示意图。
图4是根据一示例示出的一种采购需求实体和商品的属性实体进行匹配的示意图。
图5是根据一示例示出的一种需求匹配度打分模型的示意图。
图6是根据一示例性实施方式示出的另一种信息处理方法的流程图。
图7是根据一示例示出的构建采购物品知识图谱的示意图。
图8是根据一示例示出的信息处理系统的示意图。
图9是根据一示例性实施方式示出的一种信息处理装置的框图。
图10根据一示例性实施方式示出的一种电子设备的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。
此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
在本公开中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接或可以互相通讯;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本公开中的具体含义。
此外,在本公开的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。
图1示出了可以应用本公开实施例的信息处理方法的示例性系统架构的示意图。
如图1所示,该系统架构可以包括服务器101、网络102和终端设备103。网络102用以在终端设备103和服务器101之间提供通信链路的介质。网络102可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
服务器101可以是提供各种服务的服务器,例如对用户利用终端设备103所进行操作的装置提供支持的后台管理服务器。后台管理服务器可以对接收到的请求等数据进行分析等处理,并将处理结果反馈给终端设备103。
本公开实施例中,服务器101可以:获取采购需求信息和采购物品知识图谱;对所述采购需求信息进行实体抽取,获得采购需求实体;从所述采购物品知识图谱中查询获得多个物品的属性实体;对所述采购需求实体和所述多个物品的属性实体进行匹配,以获得所述采购需求信息对应的目标物品列表。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的,服务器101可以是一个实体的服务器,还可以为多个服务器组成的服务器集群,还可以是云端服务器,根据实际需要,可以具有任意数目的终端设备、网络和服务器。
下面,将结合附图及实施例对本公开示例实施例中的信息处理方法的各个步骤进行更详细的说明。
图2是根据一示例性实施方式示出的一种信息处理方法的流程图。本公开实施例提供的方法可以由如图1所示的服务器101中执行,但本公开并不限定于此。
如图2所示,本公开实施例提供的信息处理方法可以包括以下步骤。
在步骤S202中,获取采购需求信息和采购物品知识图谱。
本公开实施例中,采购需求信息可以是企业的采购人员在采购过程中提出的采购需求相关的信息,采购需求信息可以包括但不限于物品名称、规格要求、购买数量、用途、供应商要求和其他要求。
图3是根据一示例示出的一种采购需求信息及将采购需求信息抽取为采购需求实体的示意图。
参考图3,例如,采购需求信息301包括:购买商品、规格要求、购买数量、用途、供应商要求和其他要求,其中,购买商品为“某品牌变频空调”,规格要求为“材质:不锈钢;工作电压:220V;开锁方式:指纹开锁;指纹容量:20枚;待机功耗:30uA;重量:140g±2g;工作温度:-10℃-+60℃;储存温度:-10℃-+6℃;匹数:3P”,购买数量为80个,用途为会议室,供应商要求为“无供货风险,无经营风险”;其他要求为“最好是知名品牌、市场热卖商品”。
本公开实施例中,采购物品知识图谱可以是根据物品数据、供应方数据和网络舆情数据等预先构建的,其可以包括各个采购物品的属性实体。
本公开实施例中,企业的采购人员可以输入批量的采购需求信息,服务器可以对采购需求信息进行解析,其中,对采购需求信息可以包括对采购需求信息进行实体抽取和补偿。
在步骤S204中,对采购需求信息进行实体抽取,获得采购需求实体。
本公开实施例中,采购需求实体是用于表征采购需求的实体名词,例如,采购需求实体可以包括:空调、不锈钢、140g等。
本公开实施例中,对采购需求信息进行实体抽取,可以获得一个或多个采购需求实体。
例如,继续参考图3,对采购需求信息301进行实体抽取,可以获得采购需求实体302(也可称为采购需求实体序列),其包括:空调、材质、不锈钢、工作电压、220、开锁方式、指纹开锁、指纹容量、20、重量、140g、匹数、3、无风险、热卖等。
在示例性实施例中,对采购需求信息进行实体抽取,获得采购需求实体,可以包括:通过序列标注模型将采购需求信息进行标注,获得采购需求信息的标签序列;根据标签序列中的标签,从采购需求信息中抽取获得采购需求实体。
本公开实施例中,可以通过序列标注模型对采购需求信息中的每个元素打上标签,以获取采购需求信息的标签序列;根据标签序列中的各标签的含义,从采购需求信息中抽取得到采购需求实体。
例如,采购需求信息为“某品牌变频空调”,通过序列标注模型对该采购需求信息中的每个元素打上标签,标签序列为“BIEBEBE”,每个标签都有对应的含义,例如B代表该元素为实体的首字,I代表该元素为实体的中间字,E代表该元素为实体的尾字;根据该标签序列可以从采购需求信息“某品牌变频空调”抽取获得实体“某品牌”、“变频”和“空调”。
在示例性实施例中,该方法还可以包括:获取采购方的用户行为数据;通过上下文关系分析用户行为数据获得采购方的采购背景信息;根据采购背景信息对采购需求实体进行补偿,以更新采购需求实体。
本公开实施例中,采购方的用户行为数据可以包括但不限于搜索数据、配送数据、点击数据、收藏数据、加入购物车数据等,采购背景信息可以是用于表征采购方的潜在需求的信息。
需要说明的是,本公开实施例中所涉及的个人信息数据均已通过用户自愿授权,个人信息的获取、存储、处理和传输等均符合相关法律法规和公序良俗的要求。
本公开实施例中,可以使用补偿机制,即通过上下文关系对用户行为数据进行分析,获得采购方的采购背景信息,然后可以直接将采购背景信息作为新的采购需求实体,或者,对采购背景信息进行实体抽取后作为新的采购需求实体,以加入到采购需求实体序列中;具体地,可以基于用户行为数据(搜索、配送地址、点击、收藏、加入购物车等)对采购方的采购需求的潜在动机进行补偿。
例如,采购方的采购需求信息中包括“购买某某空调”,则对该采购需求信息进行实体抽取,得到采购需求实体:“空调”、“某某”;进而可以得到该采购方的表面需求为:购买空调、品牌为某某;该采购方的用户行为数据中包括搜索了“办公室装修”,通过上下文关系分析可以获得该采购方可能是做办公室装修;该采购方的用户行为数据中包括搜索了“常用配送地点:西藏”,通过上下文关系分析可以获得该采购方的潜在需求是高原、高海拔;可以将分析获得的“办公室装修”、“高原”、“高海拔”作为新的采购需求实体。
本公开实施例中,通过上述补偿机制可以全面解析和补充采购方的采购需求,获得更全面的采购方的采购需求的画像。
在步骤S206中,从采购物品知识图谱中查询获得多个物品的属性实体。
本公开实施例中,采购物品知识图谱可以包括多个物品的属性实体、各个属性实体之间的关系、以及各个属性实体与其他实体(例如供应商、采购方、舆情实体等)之间的关系;物品的属性实体是用于描述采购物品的属性信息,例如可以包括物品名称、型号、规格参数、品牌信息等。
本公开实施例中,可以从预先构建的采购物品知识图谱中查询获得各个物品的属性实体。
具体地,可以通过图谱查询方法,查询采购物品知识图谱中的物品(例如商品)、场景、舆情、供应商等实体和关系数据。
图4是根据一示例示出的一种采购需求实体和商品的属性实体进行匹配的示意图。
例如,参考图4,采购需求信息解析模块401可以对采购方提出的采购需求信息进行解析,可以获得商品需求的实体名称序列(包括多个采购需求实体),还可以获得场景需求的实体名称序列、舆情的实体名词序列、用户行为的实体名称序列和供应商偏好的实体名称序列;从采购物品知识图谱402中可以获得商品的属性实体,还可以获得商品的场景实体关系、商品的舆情实体关系、商品的用户实体关系、以及商品的供应商实体关系等。
本公开实施例中,可以基于采购物品知识图谱的知识数据,通过图谱对齐模型,实现采购需求实体名词序列(也可称为采购需求画像)到采购物品知识图谱中的实体名词的对齐,以便于后续对采购需求实体和多个物品的属性实体进行匹配。
在步骤S208中,对采购需求实体和多个物品的属性实体进行匹配,以获得采购需求信息对应的目标物品列表。
本公开实施例中,可以通过各个采购需求实体和各个物品的属性实体的文本相似度对采购需求实体与物品的属性实体进行匹配,根据匹配数量的多少,确定采购需求信息对应的目标物品列表,其中,目标物品列表中包含的目标物品的数量可以根据需求设置,本公开对此不做限制。
在示例性实施例中,对采购需求实体和多个物品的属性实体进行匹配,以获得采购需求信息对应的目标物品列表,可以包括:确定采购需求实体和多个物品的属性实体的文本相似度;根据文本相似度,从属性实体中确定与采购需求实体匹配的目标属性实体;根据目标属性实体确定至少一个目标物品,以组成目标物品列表。
本公开实施例中,可以通过NLP(Natural Language Processing,自然语言处理)确定采购需求实体和多个物品的属性实体的文本相似度,例如可以通过word2vec词向量训练计算文本相似度的方法判断两个实体是否相同或相似。
其中,word2vec是一群用来产生词向量的相关模型,这些模型为浅而双层的神经网络,用来训练以重新建构语言学之词文本,可以将单词转换成向量的形式,可以把对文本内容的处理简化为向量空间中的向量运算,计算出向量空间上的相似度来表示文本语义上的相似度。word2vec为计算向量词提供了一种有效的连续词袋(bag-of-words)和跳字模型(skip-gram)架构实现。
本公开实施例中,在计算出采购需求实体和各个物品的属性实体的文本相似度之后,可以将文本相似度大于相似度阈值的属性实体确定为与采购需求实体匹配的目标属性实体,然后将目标属性实体对应的物品确定为目标物品,将目标物品组成目标物品列表,以用于推荐给采购方。
例如,参考图4,通过NLP语义对比计算相似度后,确定出采购需求实体“EXTRA容积”和商品的属性实体“EXTRA容积”相似、采购需求实体“颜色”和商品的属性实体“色彩”相似、采购需求实体“黑色”和商品的属性实体“黑”相似,则可以将属性实体“EXTRA容积”、“色彩”和“黑”对应的商品作为目标商品,也可以根据各个商品匹配的实体数量确定目标商品,例如可以将实体数量匹配最多的TOP50个商品作为目标商品。
在示例性实施例中,根据目标属性实体确定至少一个目标物品,以组成目标物品列表,可以包括:确定各个目标物品和采购需求信息的匹配度;获取各个目标物品的价格属性信息和舆情属性信息;根据各个目标物品和采购需求信息的匹配度、价格属性信息和舆情属性信息,从至少一个目标物品中确定目标推送物品,以组成目标物品列表。
本公开实施例中,在确定目标物品之后,可以根据各个目标物品和采购需求信息的匹配度、价格属性信息和舆情属性信息对各个目标物品进行打分,根据各个目标物品的得分情况,从目标物品中选出目标推送物品组成目标物品列表,以推送给采购方。
具体地,根据上述步骤得出了目标物品(例如TOP50的目标物品),对这些目标物品排序打分,在排序打分时可以使用3套模型:需求匹配度打分模型、价格打分模型和风险打分模型。
图5是根据一示例示出的一种需求匹配度打分模型的示意图。
例如,参考图5,需求匹配度打分模型主要考虑采购需求和目标物品之间的匹配关系,根据采购需求和目标物品之间的匹配关系为每个目标物品打一个分值;分值的计算可用通过采购需求和目标物品之间的相似度打分。例如可以对采购需求和所匹配的每个目标物品的所有文本信息进行抽取,根据词性算法抽取出名词,再将采购需求的所有名词和目标物品的所有名词转化成词向量,其中词向量的作用是将自然语言中的词映射为固定维度的空间向量,实现自然语言的标准化量化;例如可以通过word2vec词向量进行文本相似度分析,通过词向量的数学量化表示,对采购需求的名词和目标物品的名词进行两两对比,如果两个名词相同则得分为1;如果不完全相同,则根据词向量的空间距离,可分别打0-1之间的分值;最后算出所有名词的得分的平均分,则作为该采购需求与每个目标物品的匹配度得分;以此类推,计算采购需求与每个目标物品的相似度打分。
例如,采购需求A和目标商品B、目标商品C、以及目标商品D的需求匹配度得分如表1所示,对采购需求A进行名词抽取得到名词a1、a2、a3,对目标商品B进行名词抽取得到名词b1、b2、b3,对目标商品C进行名词抽取得到名词c1、c2、c3,对目标商品D进行名词抽取得到名词d1、d2、d3;分别计算每个采购需求的名词(即a1、a2、a3)和每个目标商品的名词(以目标商品B为例,目标商品的名词为b1、b2、b3)之间的相似度得分,例如a1和b1的相似度得分为1、a2和b2的相似度得分为1、a3和b3的相似度得分为1,然后将名词的相似度得分的平均分作为该目标商品的需求匹配度得分。
表1
其中,价格打分模型可以将目标商品的价格求平均价,根据各个目标商品的价格与平均价的偏差进行打分,低于平均价的打正分,高于平均价的打负分,以获得每个目标商品的价格得分。
其中,风险打分模型主要考虑舆情风险,舆情风险可以分为正向信息和负面信息,例如有负面舆情信息的打-1分,无负面舆情信息的打1分。
在分别通过需求匹配度打分模型、价格打分模型和风险打分模型进行打分之后,可以将上述3个模型得到的分数相加再求平均,得出一个综合评分,根据综合评分确定目标推送物品(例如取综合评分较高的10个目标物品)组成目标物品列表,以推送给采购方。
本公开实施例提供的信息处理方法,根据各个目标物品和采购需求信息的匹配度、价格属性信息和舆情属性信息,从至少一个目标物品中确定目标推送物品,以组成目标物品列表,实现了推荐结果的再次优化,从而使得推荐的物品更准确。
在示例性实施例中,该方法还可以包括:获得采购方从目标物品列表中选择的选中物品;根据选中物品和采购需求实体构建三元组关系,并存储至采购物品知识图谱。
本公开实施例中,选中物品可以是采购方从目标物品列表中选择采购、浏览详情或者加入购物车的物品。
本公开实施例中,在确定了选中物品后,可以建立选中物品和采购需求实体之间的关系,并存储至采购物品知识图谱中。
具体地,每次采购方选品的结果都可以作为一个关系存储在知识图谱中,比如,采购需求为维修打印机的场景中,采购方选择了3个商品(商品A、商品B、商品C),则这3个商品和维修打印机场景都可以作为新的实体和关系(以三元组形式)存储到知识图谱数据中,新的三元组数据可以为:
【维修】-【打印机】-【商品A】
【维修】-【打印机】-【商品B】
【维修】-【打印机】-【商品C】
在进行存储之前,人工可以对如上三元组数据进行标注和编辑。
本公开实施例中,根据采购方从目标物品列表中选择的选中物品和采购需求实体构建三元组关系,并存储至采购物品知识图谱,可以作为下次选品的推荐依据之一,从而实现对选品经验的沉淀,为后续选品提供依据,使得选品越来越准确。
本公开实施例提供的信息处理方法,对采购需求信息进行实体抽取获得采购需求实体,从采购物品知识图谱中查询获得多个物品的属性实体,通过对采购需求实体和物品的属性实体进行匹配,可以自动、准确地获得采购需求信息对应的目标物品列表,提高采购需求和目标物品匹配的准确性,从而提高采购效率。此外,该方法可以节省人工查询、搜索、匹配等工作量,节省采购方的操作步骤和采购时间,从而提升用户体验。
图6是根据一示例性实施方式示出的另一种信息处理方法的流程图。如图6所示,与上述实施例的不同之处在于,本公开实施例提供的方法还可以包括以下步骤。
在步骤S602中,获取原始数据,原始数据包括物品数据、供应方数据和网络舆情数据。
本公开实施例中,可以获取原始数据以构建采购物品知识图谱,其中,原始数据可以包括但不限于物品数据(例如商品数据)、供应方数据和网络舆情数据,上述数据都可以通过互联网渠道采集。
图7是根据一示例示出的构建采购物品知识图谱的示意图。
例如,参考图7,原始数据可以包括商品数据、供应商数据、订单数据和互联网舆情数据,其中,商品数据可以包括商品标题、属性、详情等,供应商数据可以包括供应商名词、资质等,订单数据可以包括采购人、金额、数量、用途等,互联网舆情数据可以包括网络热评、工商信用、网络负面、新闻关键词等。
在步骤S604中,分别对物品数据、供应方数据和网络舆情数据进行实体抽取,获得物品属性实体、供应方属性实体和网络舆情实体。
其中,供应方属性实体是用于表征供应方的属性的名词,例如:某科创公司;网络舆情实体是用于表征物品的网络舆情相关信息的名词,例如:热卖、拍照神器。
本公开实施例中,可以通过知识图谱的实体抽取技术搭建选品所依赖的采购知识体系,具体地,通过知识图谱的实体抽取技术从物品数据中抽取类目、商品、属性、品牌、评价、价格等数据名词,组成采购物品知识图谱的物品属性实体,使用同样的方法从供应方数据和网络舆情数据中抽取实体名词,获得供应方属性实体和网络舆情实体。
在对网络舆情数据进行抽取时,可以通过从三方征信公司的企业工商信用数据接口以及互联网舆情采集相关关键词的形式,获得相应的舆情关键词,并把关键词以标签形式存储。
本公开实施例中,可以通过正则、语义模型的方式进行实体抽取,但本公开并不限定于此。
在步骤S606中,根据物品属性实体、供应方属性实体和网络舆情实体构建采购物品知识图谱。
本公开实施例中,可以通过物品数据、订单数据等自带的关系,挖掘物品属性实体、供应方属性实体和网络舆情实体之间的关系,构建知识图谱三元组并存储,其中,三元组是知识图谱中知识表示的基本单位,三元组可以用来表示实体与实体之间的关系,或者实体的某个属性值是什么,从内容上看,三元组的结构可以为“资源-属性-属性值”。
例如,参考图7,从原始数据中抽取实体获得商品名词、从原始数据中抽取属性获得属性名词、以及从原始数据中抽取属性值获得属性值,可以对上述商品名词、属性名词和属性值进行人工标注和编辑,以知识图谱三元组的形式进行存储,三元组例如可以包括:某耀v5-品牌-某牌、某耀v5-型号-v5、某耀v5-内存-256G、某耀v5-摄像头-5000万、某耀v5-供应商-某科创公司、某耀v5-场景-办公、某耀v5-舆情标签-拍照神器。
本公开实施例提供的信息处理方法,基于物品数据、供应方数据和网络舆情数据从多个维度构建了以采购物品为核心的采购物品知识图谱,为后续采购过程提供知识型数据查询依据,从而提高采购效率。
图8是根据一示例示出的信息处理系统的示意图。
参考图8,该系统可以包括知识图谱构建模块801、采购需求解析模块802、商品推荐引擎模块803、商品推荐度打分模块804和选品经验沉淀模块805。其中,知识图谱构建模块801用于对商品数据、供应商数据、历史交易数据和外部舆情数据进行抽取,以构建知识图谱;采购需求解析模块802用于接收批量采购需求,对采购需求进行解析,具体可以包括对采购需求抽取实体和使用补偿机制对采购需求进行补偿;商品推荐引擎模块803用于使用实体对齐的方法从知识图谱中查询找到最合适的匹配商品,并去除不符合要求的商品;商品推荐度打分模块804用于使用需求匹配度打分模型、价格打分模型和风险打分模型对商品进行打分,以获得批量选品结果;选品经验沉淀模块805用于经验沉淀、数据回流,即可以根据采购方选择的商品构建新的三元组关系,并进行人工标注,以对知识图谱进行编辑。
需要注意的是,上述附图仅是根据本公开示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
下述为本公开装置实施例,可以用于执行本公开方法实施例。对于本公开装置实施例中未披露的细节,请参照本公开方法实施例。
图9是根据一示例性实施方式示出的一种信息处理装置的框图。
如图9所示,信息处理装置900可以包括:获取模块902、获得模块904、查询模块906和匹配模块908。
其中,获取模块902用于获取采购需求信息和采购物品知识图谱;获得模块904用于对所述采购需求信息进行实体抽取,获得采购需求实体;查询模块906用于从所述采购物品知识图谱中查询获得多个物品的属性实体;匹配模块908用于对所述采购需求实体和所述多个物品的属性实体进行匹配,以获得所述采购需求信息对应的目标物品列表。
在本公开一些示例性实施例中,获得模块904还用于通过序列标注模型将所述采购需求信息进行标注,获得所述采购需求信息的标签序列;根据所述标签序列中的标签,从所述采购需求信息中抽取获得所述采购需求实体。
在本公开一些示例性实施例中,所述装置900还包括:数据获取模块,用于获取采购方的用户行为数据;信息获得模块,用于通过上下文关系分析所述用户行为数据获得所述采购方的采购背景信息;补偿模块,用于根据所述采购背景信息对所述采购需求实体进行补偿,以更新所述采购需求实体。
在本公开一些示例性实施例中,匹配模块908还用于确定所述采购需求实体和所述多个物品的属性实体的文本相似度;根据所述文本相似度,从所述属性实体中确定与所述采购需求实体匹配的目标属性实体;根据所述目标属性实体确定至少一个目标物品,以组成所述目标物品列表。
在本公开一些示例性实施例中,匹配模块908还用于确定各个目标物品和所述采购需求信息的匹配度;获取各个目标物品的价格属性信息和舆情属性信息;根据各个目标物品和所述采购需求信息的匹配度、价格属性信息和舆情属性信息,从所述至少一个目标物品中确定目标推送物品,以组成所述目标物品列表。
在本公开一些示例性实施例中,所述装置900还包括:数据获取模块,用于获取原始数据,所述原始数据包括物品数据、供应方数据和网络舆情数据;实体抽取模块,用于分别对所述物品数据、所述供应方数据和所述网络舆情数据进行实体抽取,获得物品属性实体、供应方属性实体和网络舆情实体;图谱构建模块,用于根据所述物品属性实体、所述供应方属性实体和所述网络舆情实体构建所述采购物品知识图谱。
在本公开一些示例性实施例中,所述装置900还包括:物品获得模块,用于获得采购方从所述目标物品列表中选择的选中物品;关系构建模块,用于根据所述选中物品和所述采购需求实体构建三元组关系,并存储至所述采购物品知识图谱。
需要注意的是,上述附图中所示的框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
图10是根据一示例性实施方式示出的一种电子设备的结构示意图。需要说明的是,图10示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图10所示,电子设备1000包括中央处理单元(CPU)1001,其可以根据存储在只读存储器(ROM)1002中的程序或者从存储部分1008加载到随机访问存储器(RAM)1003中的程序而执行各种适当的动作和处理。在RAM 1003中,还存储有系统1000操作所需的各种程序和数据。CPU 1001、ROM 1002以及RAM 1003通过总线1004彼此相连。输入/输出(I/O)接口1005也连接至总线1004。
以下部件连接至I/O接口1005:包括键盘、鼠标等的输入部分1006;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分1007;包括硬盘等的存储部分1008;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分1009。通信部分1009经由诸如因特网的网络执行通信处理。驱动器1010也根据需要连接至I/O接口1005。可拆卸介质1011,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1010上,以便于从其上读出的计算机程序根据需要被安装入存储部分1008。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分1009从网络上被下载和安装,和/或从可拆卸介质1011被安装。在该计算机程序被中央处理单元(CPU)1001执行时,执行本公开的系统中限定的上述功能。
需要说明的是,本公开所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括发送单元、获取单元、确定单元和第一处理单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,发送单元还可以被描述为“向所连接的服务端发送图片获取请求的单元”。
作为另一方面,本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现如上述实施例中所述的方法。例如,所述的电子设备可以实现如图2所示的各个步骤。
根据本公开的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述实施例的各种可选实现方式中提供的方法。
需要理解的是,在本公开附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具有任何限制含义。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (10)
1.一种信息处理方法,其特征在于,包括:
获取采购需求信息和采购物品知识图谱;
对所述采购需求信息进行实体抽取,获得采购需求实体;
从所述采购物品知识图谱中查询获得多个物品的属性实体;
对所述采购需求实体和所述多个物品的属性实体进行匹配,以获得所述采购需求信息对应的目标物品列表。
2.根据权利要求1所述的方法,其特征在于,对所述采购需求信息进行实体抽取,获得采购需求实体,包括:
通过序列标注模型将所述采购需求信息进行标注,获得所述采购需求信息的标签序列;
根据所述标签序列中的标签,从所述采购需求信息中抽取获得所述采购需求实体。
3.根据权利要求2所述的方法,其特征在于,还包括:
获取采购方的用户行为数据;
通过上下文关系分析所述用户行为数据获得所述采购方的采购背景信息;
根据所述采购背景信息对所述采购需求实体进行补偿,以更新所述采购需求实体。
4.根据权利要求1所述的方法,其特征在于,对所述采购需求实体和所述多个物品的属性实体进行匹配,以获得所述采购需求信息对应的目标物品列表,包括:
确定所述采购需求实体和所述多个物品的属性实体的文本相似度;
根据所述文本相似度,从所述属性实体中确定与所述采购需求实体匹配的目标属性实体;
根据所述目标属性实体确定至少一个目标物品,以组成所述目标物品列表。
5.根据权利要求4所述的方法,其特征在于,根据所述目标属性实体确定至少一个目标物品,以组成所述目标物品列表,包括:
确定各个目标物品和所述采购需求信息的匹配度;
获取各个目标物品的价格属性信息和舆情属性信息;
根据各个目标物品和所述采购需求信息的匹配度、价格属性信息和舆情属性信息,从所述至少一个目标物品中确定目标推送物品,以组成所述目标物品列表。
6.根据权利要求1所述的方法,其特征在于,还包括:
获取原始数据,所述原始数据包括物品数据、供应方数据和网络舆情数据;
分别对所述物品数据、所述供应方数据和所述网络舆情数据进行实体抽取,获得物品属性实体、供应方属性实体和网络舆情实体;
根据所述物品属性实体、所述供应方属性实体和所述网络舆情实体构建所述采购物品知识图谱。
7.根据权利要求6所述的方法,其特征在于,还包括:
获得采购方从所述目标物品列表中选择的选中物品;
根据所述选中物品和所述采购需求实体构建三元组关系,并存储至所述采购物品知识图谱。
8.一种信息处理装置,其特征在于,包括:
获取模块,用于获取采购需求信息和采购物品知识图谱;
获得模块,用于对所述采购需求信息进行实体抽取,获得采购需求实体;
查询模块,用于从所述采购物品知识图谱中查询获得多个物品的属性实体;
匹配模块,用于对所述采购需求实体和所述多个物品的属性实体进行匹配,以获得所述采购需求信息对应的目标物品列表。
9.一种电子设备,其特征在于,包括:
至少一个处理器;
存储装置,用于存储至少一个程序,当所述至少一个程序被所述至少一个处理器执行时,使得所述至少一个处理器实现如权利要求1至7中任一项所述的信息处理方法。
10.一种计算机可读存储介质,其上存储有计算机可执行指令,其特征在于,所述可执行指令被处理器执行时实现如权利要求1至7中任一项所述的信息处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210394214.6A CN114971767A (zh) | 2022-04-14 | 2022-04-14 | 信息处理方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210394214.6A CN114971767A (zh) | 2022-04-14 | 2022-04-14 | 信息处理方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114971767A true CN114971767A (zh) | 2022-08-30 |
Family
ID=82976581
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210394214.6A Pending CN114971767A (zh) | 2022-04-14 | 2022-04-14 | 信息处理方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114971767A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117094826A (zh) * | 2023-09-27 | 2023-11-21 | 之江实验室 | 数据交易的匹配方法、装置、电子装置和存储介质 |
-
2022
- 2022-04-14 CN CN202210394214.6A patent/CN114971767A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117094826A (zh) * | 2023-09-27 | 2023-11-21 | 之江实验室 | 数据交易的匹配方法、装置、电子装置和存储介质 |
CN117094826B (zh) * | 2023-09-27 | 2024-04-09 | 之江实验室 | 数据交易的匹配方法、装置、电子装置和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114266443A (zh) | 数据评估方法和装置、电子设备、存储介质 | |
CN116894711A (zh) | 商品推荐理由生成方法及其装置、电子设备 | |
CN113781149A (zh) | 信息推荐方法、装置、计算机可读存储介质及电子设备 | |
CN111782850A (zh) | 一种基于手绘图的物品搜索方法和装置 | |
CN114971767A (zh) | 信息处理方法、装置、电子设备及存储介质 | |
CN112749323A (zh) | 一种构建用户画像的方法和装置 | |
CN113450172B (zh) | 一种商品推荐方法和装置 | |
CN113781171A (zh) | 信息推送方法、装置、设备及存储介质 | |
CN112860878A (zh) | 业务数据推荐方法、存储介质及设备 | |
CN111754300A (zh) | 一种商品推荐方法、装置、设备和存储介质 | |
CN116703515A (zh) | 基于人工智能的推荐方法、装置、计算机设备及存储介质 | |
CN115905472A (zh) | 商机业务处理方法、装置、服务器及计算机可读存储介质 | |
CN115841365A (zh) | 基于自然语言处理的选型及报价方法、系统、设备及介质 | |
CN115759014A (zh) | 一种动态智能化分析方法、系统及电子设备 | |
CN114996579A (zh) | 信息推送方法、装置、电子设备和计算机可读介质 | |
CN113327145B (zh) | 一种物品推荐方法和装置 | |
CN113626703A (zh) | 基于加权投票式的电商平台用户推荐方法 | |
Zou et al. | Automatic product copywriting for e‐commerce | |
CN113988995A (zh) | 一种适用于化塑行业的产品营销系统 | |
CN114881722A (zh) | 基于热点的旅游产品匹配方法、系统、设备及存储介质 | |
KR20220118703A (ko) | 머신러닝 기반 온라인 쇼핑 리뷰 감정 예측 시스템 및 방법 | |
CN114429384A (zh) | 基于电商平台的产品智能推荐方法及系统 | |
CN113421106A (zh) | 商品数据的处理方法、装置及电子设备 | |
CN113449175A (zh) | 热点数据的推荐方法和装置 | |
CN113127597A (zh) | 搜索信息的处理方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |